论文阅读 Control Globally, Understand Locally

《Control Globally, Understand Locally. A Global-to-Local Hierarchical Graph Network for Emotional Support Conversation.》

创新点:

  • 在 Encoder 和 Decoder 之间加了一层 GCNConv 和 RGCNConv

论文速览

Abstract

  • 目前研究的缺陷

    • 关注序列上下文信息,忽略了全局原因和局部心理意图与其的层次关系
  • 本文

    • 提出了一个全局到局部的层次图网络来捕获多源信息(全局原因、局部意图和对话历史)并建模它们之间的层次关系,该网络由一个多源编码器、一个层次图推理器和一个全局引导解码器组成
    • 设计了一个新的训练目标来监测全局的语义信息 ## Introduction
  • 探索求助者情绪问题的原因:全局地控制情感支持对话的整个流程

  • 了解求助者的心理意图:帮助系统局部了解求助者当前时的心理状态

  • 本文目标

    • 捕获全局原因和局部心理意图
    • 建模全局与局部之间的关系
  • 解决方法【全局到局部层次图网络GLHG】

    • 多源编码器:COMET提取局部心理意图
    • 层次图推理机:全局原因(对话级)、局部心理意图(句子级)和对话历史之间的层次关系进行建模
    • 解码器中设计了一个新的训练目标来监控全局原因的语义信息 ## Related Work
  • 图建模对话

    • GCN 利用自我和对话者间依赖性来模拟会话上下文
    • EGAE 使用图网络捕获面向任务对话中的对话模式
  • 常识性知识

    • 与本人有关的心理状态:xReact、xIntent ## Approach
  • 问题定义

  • 多源编码器

    • BlenderBot Encoder + Max-pooling
    • 上下文 + 全局原因 + 局部原因
  • 分层图推理机

    • GAT 图注意力网络:其他邻域信息的特征传播到当前节点,具有确定节点之间重要性和相关性的优点
    • 注意力函数(2017出版)
    • 注意力机制
    • 注意力机制
  • Global-guide 解码器

    • 响应生成,v表示图神经网络得到的全局变量
    • 监督全局语义信息:预测问题类型
  • 联合训练

    • 对数似然损失+交叉熵损失
    • Experiments

  • 指标:plexity (PPL), BLEU-n (B-n), ROUGE-L (R-L), Distinct-1(D-1), and Distinct-2 (D-2)

  • 由于有了意图特征,提出建议更具体有效 ## Conclusion

  • 全局到局部的层次图网络(Global-to-Local Hierarchical Graph network, GLHG)来捕获多源信息并从全局到局部的角度建模层次关系

  • 新的训练目标“预测Seeker遇到问题的类型” # 关注的问题 / 本文的优势

解决方法 / 创新点

  • 多源编码器利用情境信息并将心理意图与COMET结合,捕获全局原因和局部意图
  • 分层图推理机在全局原因、局部心理意图和对话历史之间进行交互,建模不同层次的关系(hierarchical graph reasoner) # 实验结论

有待提升的部分