Paper Analysis|基于E-CNN的情绪归因

Abstract:情绪归因的意义在于抽取出出发情绪产生的原因信息,从而有助于针对性对策。看了篇paper,本文介绍下里面提出的基于E-CNN神经网络的情绪原因识别方法:通过词向量、卷积、池化等操作充分融合句子的语义信息,利用多个CNN集成降低数据不平衡性对情绪原因识别的影响,克服传统情绪原因识别方法的繁琐规则制定、特征抽取、特征空间降维等过程。

背景

张志华:提出基于RNN对长文本进行情感语义建模,解决了长文本的情感分类问题。

Yaqi Wang:利用RNN对句子建模,实现微博文本数据的多标签情绪分类。

采用CNN的句子建模能获得最好的分类性能。

why情绪归因:我们关注的重点不只是公众情绪是什么,而是公众为什么会从同情演变为愤怒的情绪情绪归因是针对文本中出现的被描述者的情绪,抽取出触发被描述者情绪产生的原因信息

关键:找出情绪原因的特征,定位其特征位置


情绪归因的研究进展

  • Ying Chen:通过对标注语料的分析,发现超过80%的情绪原因信息位于出现情绪的核心子句的前后两个子句中(即上下文信息)
  • Sophia Yat Mei Lee:建立了情感归因的语料库,且根据标注的语料库建立了相应规则,用于情绪原因句子的识别。
  • Alena Neviarouskaya:通过句法、语法和骨子额相结合的方法,分析“乐”的8种情绪原因的语言现象,以此推测一段文斌的情绪类别和原因。
  • Lin Gui:通过建立25条规则来进行文本情绪原因的预测,也用分类方法预测。

基于E-CNN的情绪归因的研究流程

研究目的:精准定位情绪原因子句

流程:建库——标注情绪子句——标注情绪原因子句——归因预测——判定预测正误

详细流程:> 构建情绪归因语料库——标注表达情绪的核心子句——在核心句的前后子句标注情绪原因子句——从核心句的前后每个子句中抽取候选原因事件——通过分类训练器最后判定抽取的候选原因事件是否真的为情绪核心子句的原因事件

E-CNN情绪原因识别模型

情绪归因识别框架图

情绪归因识别过程图

情绪归因识别过程:文本——通过E-CNN模型得到每个子句的一个概率值——选概率最大的候选原因子句作为每组示例的情绪原因子句

Q:为什么将多原因子句分开训练再集成到一起?

A:由于原因子句与非原因子句分别构成多个较平衡的数据集,故分别在各个新数据集上进行对应的CNN训练,然后将训练好的多个CNN集成组合构成E-CNN模型(E-CNN是由多个CNN集成的);最后在E-CNN上进行情绪原因子句的分类用于识别包含情绪原因信息的子句。

CNN 模型

Thanks!