A Diversity-Promoting Objective Function for Neural Conversation Models 论文阅读零散笔记|电子爱好者

admin管理员组
文章数量:1531657

A Diversity-Promoting Objective Function for Neural Conversation Models

SEQ2SEQ模型用于conversational responses倾向于产生safe， commonplace的response,比如（“I don’t know”）。这篇论文中作者提出了MMI(Maximum Mutual Information)作为object function 而不是原来的MLE。

MLE求得给定input message sequence $S$ 下，取得target sequence $T$ 的公式为：
$\widehat{T}=\underset{T}{argmax}\{logp(T|S)\}$
上述公式对于高频的generic response敏感，而类似“I don’t know”和“i don’t know what you are talking about”这种回答是高频的，而且是dull的，这种高频可能使回答并不能很好的契合 $S$ 。
作者提到了互信息的公式：
$log\frac{p(S,T)}{p(S)p(T)}$
确保S与T相关
$\widehat{T}=\underset{T}{argmax}\{logp(T|S)-logp(T)\}$
当然实际上采用的是
$\widehat{T}=\underset{T}{argmax}\{logp(T|S)-\lambda logp(T)\}$
可以理解成是在 $\widehat{T}=\underset{T}{argmax}\{logp(T|S)\}$ 上增加了一个惩罚项 $logp(T)$ ,对于高频的T惩罚力度大，低频的惩罚力度小。

经过贝叶斯公式推导可写成
$\widehat{T}=\underset{T}{argmax}\{(1-\lambda)logp(T|S)+\lambda logp(S|T)\}$

因采用的公式的不同，作者提到了两种方法MMI-antiLM和MMI-bdi。当然作者提到它们都可能产生ungrammatical output，因而两种方法在原公式的基础上作出了一定的修改。

MMI-antiLM

$p(T)=\prod_{k=1}^{N_{t}}p(t_{k}|t_{1},t_{2},...,t_{k-1})$
序列T中每一个token $t_{i}$ 出现都是与前面的i-1个token相关的（考虑SEQ2SEQ中attention机制的存在），因而出现的概率是组成它的各个token的联乘形式。
其实由于句子长度各不完全一致，T的长度不是一个定值，导致对于不同长度的T， $p(T)$ 的数量级差别很大。因此我个人认为需要考虑T的长度因素。事实上，作者是这么考虑的，只不过是放到了后面再说。
被改写为
$U(T)=\prod_{k=1}^{N_{t}}p(t_{k}|t_{1},t_{2},...,t_{k-1}) \cdot g(k)$
其中

g(k)={10ififk≤γk>γ g ( k ) = { 1 i f k ≤ γ 0 i f k > γ $g(k)=\left\{\begin{matrix} 1 & if & k\leq \gamma \\ 0 & if &k > \gamma \end{matrix}\right.$
γ γ $\gamma$ 是选定的threshold.
这样公式就变成了：
Tˆ=argmaxT{logp(T|S)−λlogU(T)} T ^ = a r g m a x T { l o g p ( T | S ) − λ l o g U ( T ) } $\widehat{T}=\underset{T}{argmax}\{logp(T|S)-\lambda logU(T)\}$
作者的意图有二：
其一，在SEQ2SEQ模型中，上一个输出的单词在很大程度下决定着下一个单词，因而T序列中靠前的单词对于整个序列的影响更大，penalize前面的单词相比penalize后面的单词更能确保diversity
其二，ungrammatical segments 更可能出现在句子的后半部分（特别是长句子）。

上式中公式中 $g(k)$ 的取值决定了，只是对长度超过阈值 $\gamma$ 的序列才施加 $U(T)$ 的惩罚。

MMI-bidi

$\widehat{T}=\underset{T}{argmax}\{(1-\lambda)logp(T|S)+\lambda logp(S|T)\}$
由于SEQ2SEQ每一步产生的是每个单词作为输出可能的概率，其每一步的输出都会使得输出中的待选择的序列成指数倍增长，待选序列T太多了，对于每一个T计算 $logp(S|T)$ 并不现实，所以实际操作中，先按照
$\widehat{T}=\underset{T}{argmax}\{logp(T|S)\}$ 选择出N-best list, 这N个应该是generally grammatical的，再用上面的公式进行计算来对这N个序列来rerank。

实际中，作者注意到了序列的长度 $N_{t}$ 在训练中是不可忽视的，因此对于上面公式都加上了 $\gamma N_{t}$
即对于MMI-antiLM
$Score(T)=p(T|S)-\lambda U(T) + \gamma N_{t}$
MMI-bidi同

实验部分用来俩数据集 Twitter Conversation Triple Dataset 以及 OpenSubtitles数据集。
具体就不说了。
本文完

本文标签：零散笔记论文 Objective Promoting

版权声明：本文标题：A Diversity-Promoting Objective Function for Neural Conversation Models 论文阅读零散笔记内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1725456972a1024307.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

A Diversity-Promoting Objective Function for Neural Conversation Models 论文阅读零散笔记

MMI-antiLM

MMI-bidi

更多相关文章

计算机视觉论文-2021-06-11

Re41：读论文 NumLJP Judicial knowledge‑enhanced magnitude‑aware reasoning for numerical legal judgment p

[论文笔记]彻底讲透FCN语义分割开山之作Fully Convolutional Networks

[读论文]-Language as Queries for Referring Video Object Segmentation（R-VOS）有参考视频对象分割

Python数据分析笔记groupbycontact reset_index

ChatGPT transformer 5篇经典论文以及代码和解读

不用再找了，吐血整理ChatGPT 新手使用手册~ (论文润色、降重指令)

不用再找了，吐血整理ChatGPT 论文新手使用手册~ (含论文润色指令~)

亲测好用，ChatGPT 3.54.0新手使用手册~ 【论文润色、降重、扩写指令】

如何使用Sci-Down下载论文

Java工作笔记Java面试题Java八股文Java常用API

HCIA 笔记

Linux 学习包括但不限于linux使用问题笔记

网络安全笔记

横空出世-轰炸手机在线使用-小白网安笔记

[RK3399][Android7.1] 调试笔记 ---谷歌拼音替换搜狗输入法

新手玩荔枝派 f1c100s nano折腾笔记（三）

最新区块链论文速读--CCF A会议 INFOCOM 2023 共5篇 附pdf下载

NDT-MCL定位算法论文解读

英语语法笔记——并列句（二）

发表评论

推荐文章

u盘不能格式化怎么办

win10 使用tsmmc.msc 提示无法创建管理单元

amd显卡驱动linux 卸载,AMD Clean Uninstall Utility

[教程]AMD芯片用VirtualBox安装MacOS虚拟机

基于8266WIFI模块实现智能手机与51单片机的通信入门

热门文章

Chrome 浏览器 模糊的解决方法

设置无线网登陆连接到服务器,路由器设置登录连接到服务器

3·15晚会曝光，浏览网页就能获取手机号，骚扰电话背后的秘密

韦东山开发板恢复出厂系统

Win10方便快捷键

【AMD平台下DPDK的使用--以dpdk-19.11.10为例】

android手机root后的安全问题 （二）

Qt FFmpeg视频播放器开发（一）：FFmpeg简介与项目环境搭建

Android WIFI认证方式

tcl电视linux软件升级,【高清范】TCL电视升级刷机常见问题大汇总！

最新文章

The Little Prince

SCI论文写作常用表达整理

Spring官方文档（中文版！！！）

Improvements in Deep Q Learning: Dueling Double DQN, Prioritized Experience Replay, and fixed…

无穷小：历史与应用

windows11的镜像下载

英语易混淆词语：四六级，考研均适用（持续更新中~）

Spring核心接口之Ordered

电子专业 英语词汇大全（持续更新）

关于APK打包所报Messages错误

大学英语六级考试题型分值分配、时间分配、做题策略

EnjoyToShare | 考研英语复试口语

linux kernel调试

irene换脸资源_电线之间：数据可视化科学家艾琳·罗斯（Irene Ros）的访谈

【开源电机驱动】使用电气等效对机械系统建模

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

最新区块链论文速读--CCF A会议 INFOCOM 2023 共5篇附pdf下载

Chrome 浏览器模糊的解决方法

android手机root后的安全问题（二）

电子专业英语词汇大全（持续更新）

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载