德岛大学 日本德岛大学任福继研究室:基于上下文语境和情感关联学习实现文本情感识别
日本德岛大学任福继研究室提出一种带有标签编码的分层网络,以实现基于上下文语境的情感识别。该方法证明情感关联信息及上下文语境信息能有效提高文本情感识别的准确率。相关成果以“Hierarchical Network with Label Embedding for Contextual Emotion Recognition”为题发表在Research上。
研究背景
情感识别涉及详细的情绪状态的识别,主要是指广泛的心理状态,例如幸福、愤怒和恐惧。
文本情感识别是一种细粒度的情感分析,根据所采用的基本情感理论为文本表达分配一个或多个情感类别。在自然语言处理领域,TER有着很广泛的应用,例如心理健康监控,情绪管理,社交网络和人机对话等。在最近的几十年中,TER相关研究引起了学术界的极大兴趣。TER研究主要在句子层面进行,从给定句子中提取情感词语等特征来识别微妙的情绪。然而,情感表达是复杂的,同一句子在不同的上下文中可能表现出不同的情感。在没有上下文信息的情况下,甚至人类也无法做出自信的情感判断。研究进展
本项工作主要探索了如何通过上下文语境及情感标签关联的学习实现句子级别情感识别。
首先提出了一种句子级至语境级别的情感识别分层模型:使用预训练的语言模型BERT作为句子级编码器,并使用基于注意力的双向LSTM作为上下文级编码器。通过这样的结构,可以基于上下文学习给定句子的情感表达。此外,为了实现情感相关学习,通过联合学习训练了标签嵌入矩阵:通过计算句子表示和每个标签嵌入之间的相似性特征来获得情绪相关性。这有利于实现基于情感相关的情感预测。整个模型结构如图1所示。图1 模型框架概览
除了模型结构,本项工作中提出的组合损失函数,能够有效的实现分层网络和标签嵌入的联合学习,以优化模型参数。在多标签情感识别任务中,经常使用二进制交叉熵作为损失函数。但是这样的损失函数把每个情感标签作为一个单独的类别,忽略了情感标签之间的关联性。为了将情感关联信息进一步融入损失函数,使用了考虑情感关联的损失函数:此外,还引入了相似度损失函数,以预测输入句子的情感表达和标签嵌入矩阵之间的距离:为确保标签嵌入矩阵能够学习到各个情感标签的特征标,又引入了一个附加网络,以从相应的标签嵌入中识别出每种情感。这部分的损失通过二进制交叉熵计算。本项工作中,模型训练的目标函数主要由以上三个部分组成。实验结果表明,该方法在TER任务中具有令人满意的性能。本项工作证实了上下文语境及情感关联学习在情感识别研究中的重要性。
在未来的工作中,可以考虑将该项研究拓展到对话领域,并结合对话双方的个性特征,以实现聊天过程中的动态情感识别。
任福继,男,博士,情感计算与智能机器人实验室主任,日本德岛大学工学院教授、博士生导师。日本工程院院士,欧盟科学院院士,CAAI名誉副理事长,日本工学会fellow,IEICE fellow,CAAI fellow。1991年获日本国立北海道大学工学博士学位。同年,就职于日本CSK。1994年加入日本广岛市立大学担任副教授。2001年进入日本德岛大学担任教授。2006年担任智能信息系统系主任,2008年担任智能工程研究生院院长,2010年担任研究生院信息部门长。2003年起兼任国际先进信息研究院院长。主要研究领域为人工智能、自然语言处理、情感计算及情感机器人。德岛大学工学院任福继研究室研究方向为研究人工智能和机器学习的前沿理论和算法、自然语言处理、情感计算、情感机器人;研究计算机视觉算法、人脸表情检测及情感计算、大规模图像分类算法等。