论文阅读 KEMI

Title: Knowledge-enhanced Mixed-initiative Dialogue System for Emotional Support Conversations

论文速览

Abstract

  • 混和主动性:按照说话者角色和主动类型分为四类
  • 提出四个情绪支持指标
  • 提出一种用于 ESC 的知识增强混合主动框架 (KEMI)

Introduction

  • ESC系统
    • 在适当的时候发起讨论,目的是提出建议,并解决问题
  • 相关工作
    • CIS(conversational information-seeking)可以主动发起对话,澄清交互并探索更多的信息
    • 情感推理用来生成共情反应
    • identifying the dialogue acts of the utterances
    • ESC 系统预测下一个对话策略
  • ESC问题的三个挑战
    • 系统应该在对话过程中何时采取主动?
    • 系统发起子对话需要什么样的信息?
    • 系统如何促进混合主动交互?
  • 解决方法
    • 策略预测:确定下一回合混合主动策略
    • 知识选择:收集下一回合的必要知识
    • 响应生成:在适当的混合主动策略和知识下产生情感支持响应
  • 提出的新东西
    • 混合主动性特征
      • EAFR模式:话语注释为不同类型的说话者角色和主动类型
      • Expression, Action, Reflection, Feedback
    • 情感支持指标
      • Proactivity, Information, Repetition, Relaxation
    • KEMI
      • 使用生成的常识知识作为查询图来扩展用户话语,在知识图谱上执行子图检索
      • 响应生成模块以序列到序列的方式,对策略预测和响应生成进行【多任务学习】,以生成具有外部知识的混合主动响应
  • 主要贡献
    • EAFR 注释模式和四种情感支持指标
    • 使用用常识知识扩展的查询图,通过子图检索从心理健康知识图谱中检索外部知识
  • ESC
    • 检测用户情绪
    • 将情感信号放入Respond中
    • 情绪感知反应,情感风格转移
    • 共情对话系统
      • 情感推理技巧
      • 利用外部知识来提高情绪推理的建模能力:知识图、常识性模型、特定领域知识、常识性知识
  • 混合主动对话

Preliminary Analysis

  • EAFR
    • 四种注释方法:按照角色和主动类型区分
    • 四种评价指标:【待看】
  • 混合主动性分析
  • 混和主动性的挑战
    • 系统何时采取主动?
    • 系统发起子对话时,需要什么信息?
      • 情感识别:识别用户情感状态
      • 因果识别:导致情感状态的压力源
      • 认知识别:解决问题的过程
    • 根据历史对话,系统自发判断响应的主动或被动
  • 问题定义
    • 给定历史对话C和用户情况s,产生相应r
      • 策略预测y,细粒度主动性
      • 知识选择k
      • 使用y和k生成混合主动相应r

Method

  • 知识获取
    • 检索心理健康知识图谱HEAL,弥补常识性知识的不足
      • COMET常识性知识扩展查询:Cp = COMET(p, ut)
      • 构造查询图:û = {ut, {Cp}}
        • expectation:ut
        • affective:[xReact]
        • stressor:[xIntent]
        • responses:[xWant] [xNeed] [xEffect]
      • 子图检索
        • 相似度计算:sentence-BERT
        • 针对每个 ût 中的抽象描述,获取与其最相似的top-K个HEAL中的实体,基于HEAL中的边缘连接,构成候选子图
        • 针对每个 E 中的类型节点,按照子图中的每个节点相似度得分之和排序子图,选择top-N作为检索到的知识K
  • 混合主动响应生成
    • 使用基于上下文的编码器,编码上下文对话C和知识K
    • X:[CLS][know.]<know.>;Y:[strategy]y[response]r
    • 优化损失函数,最大化负对数似然函数L

Experiment

  • 实验基础
    • 数据集:ESConv、MI
    • 评估参数:流利度Perplexity (PPL)、内容保留度BLEU-n (B-n)、内容保留度ROUGE-L (R-L)
  • 总体表现
    • BlenderBot优于Transformer
    • GLHG、MISI有效地利用了常识性知识
    • 基于策略的联合学习可以提高性能
    • KEMI明显优于其他方法:HEAL知识相比常识性知识更有效地支持了预测策略,减轻了对预训练大模型的依赖
  • 人工评价
    • 从流畅度、辨识度、舒适度、建议有效性、总体回应五个方面与BlenderBot-joint、MISC进行对比,MISC完胜
  • 消融实验
    • HEAL可以有效提升策略预测准确度
    • 舍弃COMET,可以提高ppl准确度,因为常识性知识不是自然语句;但会降低内容保留度,因为简洁的常识性知识更为精确
    • 认知识别是最有效的
    • 对比Oracle,还有很大的提升空间
  • 混和主动性分析
    • 情感支持指标分析
      • KEMI有效的平衡了主动性和非主动性回复
      • KEMI回复的信息更加丰富
      • KEMI容易生成重复性回复
      • KEMI有效地帮助用户解决情绪问题
    • 会话进度
      • 相比BlenderBot和MISC,KEMI在对话过程中,主动性和非主动性的分布更加平衡
      • KEMI在对话中后期更能主动相应并缓解用户负面情绪
  • 案例分析

Conclusions

  • 首次提出ESC中混和主动性的特点,并阐述其重要性
  • KEMI框架
    • 通过查询扩展和子图检索,从大规模心理健康图谱中检索实际病例知识
    • 通过检索到的知识,进行策略预测和响应生成的多任务学习
  • 结合实际案例和分析指标,结果证明KEMI优于现有方法,并在混合主动交互方面具有优势

Limitations

  • 评价指标有待改进
  • 没有考虑不同知识检索方法的不同
  • 从复杂的KG图中检索知识的方法有待提高
  • 某些应用的知识图难以获取
  • 知识库的建立需要具有专业知识的人员

Appendix

  • 混和主动性
    • 对话主动性分析
      • 主动性分析模型:在ESConv数据集增加混合主动的类型属性,把历史对话和当前话语作为二元输入,判断主动性。微调RoBERTTalarge,分别训练两个模型,判断用户和系统的主动性
      • 情绪强度预测模型:根据用户话语预测负面情绪强度
      • 用户模拟并注释四种评价指标 :【待看】
    • 对话流分析
      • ESC在对话中充当主动角色;ED在对话中充当被动角色
    • 对话过程
      • 研究内容:主动性和情绪强度变化的关系
      • 结论
        • 交互时间很重要
        • 情绪缓解后才更有利于解决问题
    • ES指标
  • COMET
    • 常识性关系
  • HEAL
    • 情绪压力和安慰回应之间的知识图谱
    • 表现了对话双方的情绪动态,确定缓解情绪的方法

解决了什么问题

  • 常识性知识是相当抽象的,没有详细的信息,因此它对ESC系统产生有意义和信息丰富的响应的帮助不大。在这项工作中,我们采用生成式常识模型进行查询扩展,从外部知识图中检索实际案例知识。

怎么解决的 / 该方法的优势

  1. 常识知识生成器 COMET:
  2. 常识性知识获取 HEAL:

有什么创新点

  1. 提出ESC知识增强混合主动框架
    1. 人类和系统都可以主动引导交互方向
    2. 通过子图检索从心理健康知识图谱中检索外部知识
  2. 新的分析方法

保留评估 和 混合主动性分析 方面均有效优于现有方法

  1. 按照说话者角色和主动类型将话语注释为不同类型
    1. Expression:用户主动
    2. Action:系统主动
    3. Feedback:用户非主动
    4. Reflection:系统非主动
  2. 提出四个情感支持指标来衡量ESC中主动性和非主动性交互的特征
    1. Proactivity:系统主动的对话占系统对话的比例
    2. Information:系统首次提出的频繁词占比
    3. Repetition:系统重复用户提出的术语的频次占比
    4. Relaxation:情绪强度的改善

实验结果好在哪里,怎么证明的

相关工作分析

可以提升的地方