论文阅读（2019） EmotionX-IDEA: Emotion BERT – an Affectional Model for Conversation|电子爱好者

admin管理员组
文章数量:1530897

摘要

研究了预训练语言模型BERT的情感识别能力，根据两句结构的BERT框架的性质，使BERT适用于连续对话情感预测任务，这在很大程度上依赖于句子级的上下文感知理解

介绍

基于文本的情感检测应用可以从单个话语扩展到由一系列话语组成的对话，即使是同一个人说同一句话，它所传达的情感也可能是多种多样的，这可能取决于不同的谈话背景、说话语气或个性。因此，对于情绪检测，来自对话中先前话语的信息相对重要

数据集

EmotionLines

模型

主要目标是预测对话中话语的情感。关注的四个主要困难:

话语的情感不仅取决于文本，还取决于之前发生的互动
两个数据集的来源不同。Friends是基于语音的对话，EmotionPush是基于聊天的对话。它使得数据集具有不同的特征
在两个训练数据集中只有1000个对话，这对于训练复杂的基于神经的模型的稳定性来说不够大
预测目标(情感标签)高度不平衡

Causal Utterance Modeling 因果话语建模

给定包含话语序列的对话，为了保存话语和对话的情感信息，我们将每两个连续的话语重新排列成单个句子表示，注意会话中的第一个话语没有其原因话语(前一句)，原因话语将被设置为[none]

由于两个数据集的特征不同，定制不同的因果话语建模策略来提炼文本中的信息。

Friends：有两个特定的属性。首先，大部分对话都围绕着六个主要人物展开。第二，六个角色的个人特征非常鲜明。每个主角都有自己的情感波动规律。为了利用这些特征，我们引入了有助于学习六个角色的个性的个性标记化。如果说话者是六个字符之一，个性标记化连接说话者并在输入话语之前说出标记。
EmotionPush：文本是非正式的聊天，包括俚语，缩写，打字，超链接和表情符号。另一个特点是特定的命名实体用随机索引来标记。我们认为这些非正式文本中的一些与表达情感有关，如重复键入、有意大写和表情符号。因此，我们保留了大多数非正式表达式，但只通过统一标记来处理超链接、空话语和命名实体。

Model Pre-training 模型预训练

两个数据集的大小对于复杂的基于神经的模型训练来说都不够大，并且BERT模型仅在正式文本数据集上进行预训练，所以过拟合和域偏差的问题是设计预训练过程的重要考虑因素。为了避免我们的模型在训练数据上过度拟合，并增加对非正式文本的理解，对BERT进行了修改，并导出了两个模型，即FriendsBERT和ChatBERT

FriendsBERT：收集了《老友记》所有十季电视节目的完整脚本，包括61，309个话语中的3，107个场景。所有的话语都按照前面提到的预处理方法组成用于掩蔽语言模型预训练任务的语料库。相同场景中的后续话语被视为后续句子，以预训练下一个句子预测任务。在预训练过程中，训练损失是两个训练前任务的平均可能性的总和
ChatBERT：在Twitter数据集上预训练我们的模型，因为Twitter上的文本和写作风格接近于聊天文本，其中两者都可能涉及许多非正式的单词或表情符号。twitter情绪数据集，来自情绪轮的8种基本情绪，由Twitter流API收集，具有特定的情绪相关标签，如#愤怒、#喜悦、#哭泣、#悲伤等。推文中的标签被视为模型微调的情感标签。这些推文经过精细的处理，包括删除重复的推文，情感标签必须出现在推文的最后位置。

Fine-tuning

Experiments

Conclusion and Future work

提出了FriendsBERT和ChatBERT用于情感线上的多话语情感识别任务。所提出的模型改编自BERT ，在模型训练过程中有三个主要改进，即因果话语建模机制、特定模型预训练和适应加权损失。因果话语建模在模型推理过程中利用了句子级的上下文信息。特定的模型预训练有助于克服不同文本领域的偏见。加权损失避免了我们的模型只能在大样本上预测。

考虑加入条件概率约束。模型应该基于对情境情绪的某种理解来预测情绪。这对于引导模型来说可能比仅仅直接预测句子的情感更合理。
由于BERT输入格式的限制，输入句子的模糊数现在正成为我们未来工作的一个重要设计要求
个性嵌入开发将是情感识别的另一个未来工作。个性嵌入将被认为是注入到单词嵌入中的句子嵌入，并且看起来这种附加信息可能有助于一些改进。

本文标签：论文 EmotionX IDEA Emotion Affectional

版权声明：本文标题：论文阅读（2019） EmotionX-IDEA: Emotion BERT – an Affectional Model for Conversation 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dianzi/1725456193a1024216.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

论文阅读（2019） EmotionX-IDEA: Emotion BERT – an Affectional Model for Conversation

摘要

介绍

数据集

模型

Causal Utterance Modeling 因果话语建模

Model Pre-training 模型预训练

Fine-tuning

Experiments

Conclusion and Future work

更多相关文章

Cylinder3D: An Effective 3D Framework for Driving-scene LiDAR Semantic Segmentation（论文阅读笔记）

科技论文----论搜索引擎现状及发展趋势

2022年美国大学生数学建模-【美赛】A题：Game Theory in Cycling（附获奖论文）

win10获取管理员权限_论文排版工具—LaTeX 安装+获取

基于SpringBoot和Vue电影购票管理系统的设计与实现论文

IDEA出现&quot;Using platform encoding (UTF-8 actually) to copy filtered resources, i.e. 的解决方法

IDEA 做测试出现 Can't find bundle for base name javax.servlet.LocalStrings, locale zh_CN错误

APMCM（亚太地区数模竞赛）2014年-A题：Routine Scheme for UAVs Surveillance（附获奖论文）

《每日论文》Problem Solving with Algorithms and Data Structures using Python.（第一章）

不用再找了，吐血整理ChatGPT 论文指令手册~ 【2024年 更新】

不用再找了，吐血整理 ChatGPT 论文润色、降重指令手册~ 【2024年 更新】

不用再找了，ChatGPT 3.54.0新手使用手册~ (论文润色、降重指令) 【亲测】

亲测好用，ChatGPT 3.54.0新手使用手册~ 【论文润色、降重、扩写指令】

论文Learning to Solve Large-Scale Security-Constrained Unit Commitment Problems阅读笔记

idea快捷键(win)

IDEA使用技巧

Java集成开发环境（IDE）之 =＞ “IntelliJ IDEA“ 安装

IntelliJ IDEA 16 本地LicenseServer激活（破解）

2021.3.1idea(jdk+tomcat+maven)安装与配置

IntelliJ IDEA（Ultimate版本）的下载、安装和WordCount的初步使用（本地模式和集群模式）...

发表评论

推荐文章

双系统重装win7后，修复grub

超实用的浏览器插件json格式转换

如何在chrome浏览器设置夜间模式

大数据安全和网络安全基础知识

wifi的html页面,笔记本怎么设置wifi

热门文章

win10运行在哪里_升级！Win10 2004版即将推送，减少CPU占用率，旧电脑也运行如飞...

Chrome浏览器自带翻译功能不能使用了？看我的解决方法

揭开斐讯免费路由器通过京东热销的幕后真相

【树莓派】树莓派通过HC06蓝牙模块实现串口登陆

dell系统重装后无法进入系统_戴尔笔记本电脑重新安装后无法在BIOS引导项中找到硬盘引导项，最近自动更新后也无法进入系统...

【冬瓜哥手绘雄文】集群文件系统架构演变终极深度梳理图解

怎么修复Windows11中的AMD驱动程序崩溃

跟杀毒软件说不

傻白入门芯片设计，盘点CPU业界的顶尖人才（十四）

QQ拼音输入法词库和搜狗输入法词库[相互导入]（使用Excel公式）

最新文章

3 Linux基础篇-VMware和Linux的安装

笔记本搞双系统-安装Ubuntu过程没有出现选择试用-安装、没有选择“安装类型”页面、安装类型页面为空等问题解决

linux安装系统识别不到硬盘,安装系统找不到硬盘解决方法【图文教程】

装有XP系统的联想台式电脑忘记密码怎么办？(上文)

电脑更换硬盘＋安装系统

CRISDISK.zip：BIOS恢复与更新工具集合

tcl电视linux软件升级,【高清范】TCL电视升级刷机常见问题大汇总！

0x0000007b电脑蓝屏的解决方法

Windows蓝屏错误代码解释

粉丝答疑：电脑蓝屏了怎么办？

蓝屏&quot;的硬件原因及解决

ibm3400服务器改win7系统,dell3578win10改win7系统bios如何设置_戴尔win10改win7系统bios设置步骤...

电脑系统--装系统

蓝屏的调试艺术[转]

dell电脑如何安装ubuntu系统_UbuntuWIN10双系统安装教程 | Dell 中国

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

IDEA出现"Using platform encoding (UTF-8 actually) to copy filtered resources, i.e. 的解决方法

不用再找了，吐血整理ChatGPT 论文指令手册~ 【2024年更新】

不用再找了，吐血整理 ChatGPT 论文润色、降重指令手册~ 【2024年更新】

蓝屏"的硬件原因及解决

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载