论文阅读 KEMI

发表于 2023-09-29 更新于 2024-09-17 分类于读论文

Title: Knowledge-enhanced Mixed-initiative Dialogue System for Emotional Support Conversations

论文速览

Abstract

混和主动性：按照说话者角色和主动类型分为四类
提出四个情绪支持指标
提出一种用于 ESC 的知识增强混合主动框架 (KEMI)

Introduction

ESC系统
- 在适当的时候发起讨论，目的是提出建议，并解决问题
相关工作
- CIS(conversational information-seeking)可以主动发起对话，澄清交互并探索更多的信息
- 情感推理用来生成共情反应
- identifying the dialogue acts of the utterances
- ESC 系统预测下一个对话策略
ESC问题的三个挑战
- 系统应该在对话过程中何时采取主动？
- 系统发起子对话需要什么样的信息？
- 系统如何促进混合主动交互？
解决方法
- 策略预测：确定下一回合混合主动策略
- 知识选择：收集下一回合的必要知识
- 响应生成：在适当的混合主动策略和知识下产生情感支持响应
提出的新东西
- 混合主动性特征
  - EAFR模式：话语注释为不同类型的说话者角色和主动类型
  - Expression, Action, Reflection, Feedback
- 情感支持指标
  - Proactivity, Information, Repetition, Relaxation
- KEMI
  - 使用生成的常识知识作为查询图来扩展用户话语，在知识图谱上执行子图检索
  - 响应生成模块以序列到序列的方式，对策略预测和响应生成进行【多任务学习】，以生成具有外部知识的混合主动响应
主要贡献
- EAFR 注释模式和四种情感支持指标
- 使用用常识知识扩展的查询图，通过子图检索从心理健康知识图谱中检索外部知识

ESC
- 检测用户情绪
- 将情感信号放入Respond中
- 情绪感知反应，情感风格转移
- 共情对话系统
  - 情感推理技巧
  - 利用外部知识来提高情绪推理的建模能力：知识图、常识性模型、特定领域知识、常识性知识
混合主动对话

Preliminary Analysis

EAFR
- 四种注释方法：按照角色和主动类型区分
- 四种评价指标：【待看】
混合主动性分析
混和主动性的挑战
- 系统何时采取主动？
- 系统发起子对话时，需要什么信息？
  - 情感识别：识别用户情感状态
  - 因果识别：导致情感状态的压力源
  - 认知识别：解决问题的过程
- 根据历史对话，系统自发判断响应的主动或被动
问题定义
- 给定历史对话C和用户情况s，产生相应r
  - 策略预测y，细粒度主动性
  - 知识选择k
  - 使用y和k生成混合主动相应r

Method

知识获取
- 检索心理健康知识图谱HEAL，弥补常识性知识的不足
  - COMET常识性知识扩展查询：Cp = COMET(p, ut)
  - 构造查询图：û = {ut, {Cp}}
    - expectation：ut
    - affective：[xReact]
    - stressor：[xIntent]
    - responses：[xWant] [xNeed] [xEffect]
  - 子图检索
    - 相似度计算：sentence-BERT
    - 针对每个 ût 中的抽象描述，获取与其最相似的top-K个HEAL中的实体，基于HEAL中的边缘连接，构成候选子图
    - 针对每个 E 中的类型节点，按照子图中的每个节点相似度得分之和排序子图，选择top-N作为检索到的知识K
混合主动响应生成
- 使用基于上下文的编码器，编码上下文对话C和知识K
- X：[CLS][know.]<know.>；Y：[strategy]y[response]r
- 优化损失函数，最大化负对数似然函数L

Experiment

实验基础
- 数据集：ESConv、MI
- 评估参数：流利度Perplexity (PPL)、内容保留度BLEU-n (B-n)、内容保留度ROUGE-L (R-L)
总体表现
- BlenderBot优于Transformer
- GLHG、MISI有效地利用了常识性知识
- 基于策略的联合学习可以提高性能
- KEMI明显优于其他方法：HEAL知识相比常识性知识更有效地支持了预测策略，减轻了对预训练大模型的依赖
人工评价
- 从流畅度、辨识度、舒适度、建议有效性、总体回应五个方面与BlenderBot-joint、MISC进行对比，MISC完胜
消融实验
- HEAL可以有效提升策略预测准确度
- 舍弃COMET，可以提高ppl准确度，因为常识性知识不是自然语句；但会降低内容保留度，因为简洁的常识性知识更为精确
- 认知识别是最有效的
- 对比Oracle，还有很大的提升空间
混和主动性分析
- 情感支持指标分析
  - KEMI有效的平衡了主动性和非主动性回复
  - KEMI回复的信息更加丰富
  - KEMI容易生成重复性回复
  - KEMI有效地帮助用户解决情绪问题
- 会话进度
  - 相比BlenderBot和MISC，KEMI在对话过程中，主动性和非主动性的分布更加平衡
  - KEMI在对话中后期更能主动相应并缓解用户负面情绪
案例分析

Conclusions

首次提出ESC中混和主动性的特点，并阐述其重要性
KEMI框架
- 通过查询扩展和子图检索，从大规模心理健康图谱中检索实际病例知识
- 通过检索到的知识，进行策略预测和响应生成的多任务学习
结合实际案例和分析指标，结果证明KEMI优于现有方法，并在混合主动交互方面具有优势

Limitations

评价指标有待改进
没有考虑不同知识检索方法的不同
从复杂的KG图中检索知识的方法有待提高
某些应用的知识图难以获取
知识库的建立需要具有专业知识的人员

Appendix

混和主动性
- 对话主动性分析
  - 主动性分析模型：在ESConv数据集增加混合主动的类型属性，把历史对话和当前话语作为二元输入，判断主动性。微调RoBERTTalarge，分别训练两个模型，判断用户和系统的主动性
  - 情绪强度预测模型：根据用户话语预测负面情绪强度
  - 用户模拟并注释四种评价指标：【待看】
- 对话流分析
  - ESC在对话中充当主动角色；ED在对话中充当被动角色
- 对话过程
  - 研究内容：主动性和情绪强度变化的关系
  - 结论
    - 交互时间很重要
    - 情绪缓解后才更有利于解决问题
- ES指标
COMET
- 常识性关系
HEAL
- 情绪压力和安慰回应之间的知识图谱
- 表现了对话双方的情绪动态，确定缓解情绪的方法

解决了什么问题

常识性知识是相当抽象的，没有详细的信息，因此它对ESC系统产生有意义和信息丰富的响应的帮助不大。在这项工作中，我们采用生成式常识模型进行查询扩展，从外部知识图中检索实际案例知识。

怎么解决的 / 该方法的优势

常识知识生成器 COMET：
常识性知识获取 HEAL：

有什么创新点

提出ESC知识增强混合主动框架
1. 人类和系统都可以主动引导交互方向
2. 通过子图检索从心理健康知识图谱中检索外部知识
新的分析方法

保留评估和混合主动性分析方面均有效优于现有方法

按照说话者角色和主动类型将话语注释为不同类型
1. Expression：用户主动
2. Action：系统主动
3. Feedback：用户非主动
4. Reflection：系统非主动
提出四个情感支持指标来衡量ESC中主动性和非主动性交互的特征
1. Proactivity：系统主动的对话占系统对话的比例
2. Information：系统首次提出的频繁词占比
3. Repetition：系统重复用户提出的术语的频次占比
4. Relaxation：情绪强度的改善

论文阅读 KEMI

论文速览

Abstract

Introduction

Preliminary Analysis

Method

Experiment

Conclusions

Limitations

Appendix

解决了什么问题

怎么解决的 / 该方法的优势

有什么创新点

实验结果好在哪里，怎么证明的

相关工作分析

可以提升的地方

论文速览

Abstract

Introduction

Related Works

Preliminary Analysis

Method

Experiment

Conclusions

Limitations

Appendix

解决了什么问题

怎么解决的 / 该方法的优势

有什么创新点

实验结果好在哪里，怎么证明的

相关工作分析

可以提升的地方