论文阅读 KEMI
Title: Knowledge-enhanced Mixed-initiative Dialogue System for Emotional Support Conversations
论文速览
Abstract
- 混和主动性:按照说话者角色和主动类型分为四类
- 提出四个情绪支持指标
- 提出一种用于 ESC 的知识增强混合主动框架 (KEMI)
Introduction
- ESC系统
- 在适当的时候发起讨论,目的是提出建议,并解决问题
- 相关工作
- CIS(conversational information-seeking)可以主动发起对话,澄清交互并探索更多的信息
- 情感推理用来生成共情反应
- identifying the dialogue acts of the utterances
- ESC 系统预测下一个对话策略
- ESC问题的三个挑战
- 系统应该在对话过程中何时采取主动?
- 系统发起子对话需要什么样的信息?
- 系统如何促进混合主动交互?
- 解决方法
- 策略预测:确定下一回合混合主动策略
- 知识选择:收集下一回合的必要知识
- 响应生成:在适当的混合主动策略和知识下产生情感支持响应
- 提出的新东西
- 混合主动性特征
- EAFR模式:话语注释为不同类型的说话者角色和主动类型
- Expression, Action, Reflection, Feedback
- 情感支持指标
- Proactivity, Information, Repetition, Relaxation
- KEMI
- 使用生成的常识知识作为查询图来扩展用户话语,在知识图谱上执行子图检索
- 响应生成模块以序列到序列的方式,对策略预测和响应生成进行【多任务学习】,以生成具有外部知识的混合主动响应
- 混合主动性特征
- 主要贡献
- EAFR 注释模式和四种情感支持指标
- 使用用常识知识扩展的查询图,通过子图检索从心理健康知识图谱中检索外部知识
Related Works
- ESC
- 检测用户情绪
- 将情感信号放入Respond中
- 情绪感知反应,情感风格转移
- 共情对话系统
- 情感推理技巧
- 利用外部知识来提高情绪推理的建模能力:知识图、常识性模型、特定领域知识、常识性知识
- 混合主动对话
Preliminary Analysis
- EAFR
- 四种注释方法:按照角色和主动类型区分
- 四种评价指标:【待看】
- 混合主动性分析
- 混和主动性的挑战
- 系统何时采取主动?
- 系统发起子对话时,需要什么信息?
- 情感识别:识别用户情感状态
- 因果识别:导致情感状态的压力源
- 认知识别:解决问题的过程
- 根据历史对话,系统自发判断响应的主动或被动
- 问题定义
- 给定历史对话C和用户情况s,产生相应r
- 策略预测y,细粒度主动性
- 知识选择k
- 使用y和k生成混合主动相应r
- 给定历史对话C和用户情况s,产生相应r
Method
- 知识获取
- 检索心理健康知识图谱HEAL,弥补常识性知识的不足
- COMET常识性知识扩展查询:Cp = COMET(p, ut)
- 构造查询图:û = {ut, {Cp}}
- expectation:ut
- affective:[xReact]
- stressor:[xIntent]
- responses:[xWant] [xNeed] [xEffect]
- 子图检索
- 相似度计算:sentence-BERT
- 针对每个 ût 中的抽象描述,获取与其最相似的top-K个HEAL中的实体,基于HEAL中的边缘连接,构成候选子图
- 针对每个 E 中的类型节点,按照子图中的每个节点相似度得分之和排序子图,选择top-N作为检索到的知识K
- 检索心理健康知识图谱HEAL,弥补常识性知识的不足
- 混合主动响应生成
- 使用基于上下文的编码器,编码上下文对话C和知识K
- X:[CLS]
[know.]<know.>;Y:[strategy]y[response]r - 优化损失函数,最大化负对数似然函数L
Experiment
- 实验基础
- 数据集:ESConv、MI
- 评估参数:流利度Perplexity (PPL)、内容保留度BLEU-n (B-n)、内容保留度ROUGE-L (R-L)
- 总体表现
- BlenderBot优于Transformer
- GLHG、MISI有效地利用了常识性知识
- 基于策略的联合学习可以提高性能
- KEMI明显优于其他方法:HEAL知识相比常识性知识更有效地支持了预测策略,减轻了对预训练大模型的依赖
- 人工评价
- 从流畅度、辨识度、舒适度、建议有效性、总体回应五个方面与BlenderBot-joint、MISC进行对比,MISC完胜
- 消融实验
- HEAL可以有效提升策略预测准确度
- 舍弃COMET,可以提高ppl准确度,因为常识性知识不是自然语句;但会降低内容保留度,因为简洁的常识性知识更为精确
- 认知识别是最有效的
- 对比Oracle,还有很大的提升空间
- 混和主动性分析
- 情感支持指标分析
- KEMI有效的平衡了主动性和非主动性回复
- KEMI回复的信息更加丰富
- KEMI容易生成重复性回复
- KEMI有效地帮助用户解决情绪问题
- 会话进度
- 相比BlenderBot和MISC,KEMI在对话过程中,主动性和非主动性的分布更加平衡
- KEMI在对话中后期更能主动相应并缓解用户负面情绪
- 情感支持指标分析
- 案例分析
Conclusions
- 首次提出ESC中混和主动性的特点,并阐述其重要性
- KEMI框架
- 通过查询扩展和子图检索,从大规模心理健康图谱中检索实际病例知识
- 通过检索到的知识,进行策略预测和响应生成的多任务学习
- 结合实际案例和分析指标,结果证明KEMI优于现有方法,并在混合主动交互方面具有优势
Limitations
- 评价指标有待改进
- 没有考虑不同知识检索方法的不同
- 从复杂的KG图中检索知识的方法有待提高
- 某些应用的知识图难以获取
- 知识库的建立需要具有专业知识的人员
Appendix
- 混和主动性
- 对话主动性分析
- 主动性分析模型:在ESConv数据集增加混合主动的类型属性,把历史对话和当前话语作为二元输入,判断主动性。微调RoBERTTalarge,分别训练两个模型,判断用户和系统的主动性
- 情绪强度预测模型:根据用户话语预测负面情绪强度
- 用户模拟并注释四种评价指标 :【待看】
- 对话流分析
- ESC在对话中充当主动角色;ED在对话中充当被动角色
- 对话过程
- 研究内容:主动性和情绪强度变化的关系
- 结论
- 交互时间很重要
- 情绪缓解后才更有利于解决问题
- ES指标
- 对话主动性分析
- COMET
- 常识性关系
- HEAL
- 情绪压力和安慰回应之间的知识图谱
- 表现了对话双方的情绪动态,确定缓解情绪的方法
解决了什么问题
- 常识性知识是相当抽象的,没有详细的信息,因此它对ESC系统产生有意义和信息丰富的响应的帮助不大。在这项工作中,我们采用生成式常识模型进行查询扩展,从外部知识图中检索实际案例知识。
怎么解决的 / 该方法的优势
- 常识知识生成器 COMET:
- 常识性知识获取 HEAL:
有什么创新点
- 提出ESC知识增强混合主动框架
- 人类和系统都可以主动引导交互方向
- 通过子图检索从心理健康知识图谱中检索外部知识
- 新的分析方法
保留评估 和 混合主动性分析 方面均有效优于现有方法
- 按照说话者角色和主动类型将话语注释为不同类型
- Expression:用户主动
- Action:系统主动
- Feedback:用户非主动
- Reflection:系统非主动
- 提出四个情感支持指标来衡量ESC中主动性和非主动性交互的特征
- Proactivity:系统主动的对话占系统对话的比例
- Information:系统首次提出的频繁词占比
- Repetition:系统重复用户提出的术语的频次占比
- Relaxation:情绪强度的改善