解读《The Curious Case of Neural Text Degeneration 》论文笔记|电子爱好者

admin管理员组
文章数量:1612098

1、引言

尽管神经网语言模型的取得了很大的进步，但对于生成任务来，解码策略的选择很重要，即使是使用很先进的语言模型，使用Beam search 的方法，也很容易导致生成的文本，不连贯。重复等，本文提出了一种核采样(Nucleus Sampling)的解码策略。

2、关注的问题

1、为什么beam seach 的解码方法导致了degeneratext？

从公式上来看我们需要最大化生成文本的概率

采用的解码方法有 beam search greedy decoding（beam=1）

使用这样的解码方法，容易出现 positive-feedback loop 的现象，即容易选取使得该文本序列概率最的词，从直觉上来，容易生成重复的词。

从人类续写的例子来看，人的书写并不是每次都选取概率最的那个词

2、为什么 truncated 采样的方式比在整个词表上好？

长尾分布，即那些概率很小的词，但是这样的词的数量很多，所以，还会大概率的采样到这些词。

截断采样的方式有

1、samping with temperature

2、 Top-k Sampling

top-k的意思是，选取概率最大的前k个词进行采样

3、top-p (Nucleus Sampling)

选取前几个词的概率加起来大于P，然后进行采样。这样的效果确实很好。

本文标签：笔记论文 case curious neural

版权声明：本文标题：解读《The Curious Case of Neural Text Degeneration 》论文笔记内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1728630886a1167068.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

安装opensuse的笔记-重庆linux开源组织

15小时前

mate: 伙伴 matey: 融洽的, 易于亲近的. get matey with sb. poison: a. 有毒的, n.毒药毒酒v. 下毒, 破坏, 污染 slander [ 撕烂的~~], n. 中伤,诽谤, v. 诽谤 sl

无线感知论文速览 | SenSys 2023, 使用商用WiFi设备构建手部骨架 Construct 3D Hand Skeleton with Commercial WiFi

14小时前

注1:本文系“最新论文速览”系列之一,致力于简洁清晰地介绍、解读最新的顶会顶刊论文无线感知论文速览 | SenSys 2023, 使用商用WiFi设备构建手部骨架 Construct 3D Hand Skeleton with Comm

Python笔记——‘utf-8‘ codec can‘t decode byte 0xff in position 0: invalid start byte

9小时前

该报错说明csv文件不是utf-8编码形式，解决方式为： 改变csv文件的编码，可以用记事本打开csv文件再将其另存为utf-8编码形式并覆盖原文件。

笔记：将惠普1188a 接路由器pandavan打造打印服务器

8小时前

一、准备设备环境设备小米路由器mini，刷机成pandavan，登录管理页面，系统管理，无线接入点AP模式(旁路模式)，这样就

大数据之-Hadoop3.x_Yarn_容量调度器队列案例---大数据之hadoop3.x工作笔记0152

4小时前

然后我们再来看,可以看到default队列我们要陪着,他占用总内存的百分之40,然后最大资源容量占用总资源的百分之60, 然后我们再添加一个队列,hive队列,然后让这个hive队列占用总内存的百分之60,然后最大资源容量占用总资

A - A Curious Matt (排序)2014ACMICPC亚洲区北京站-重现赛（感谢北师和上交）

2小时前

There is a curious man called Matt. One day, Matts best friend Ted is wandering on the non-negative half of the number

Curious Cupid

2小时前

..给定n个男女排列，每个人会说一种语言，相同语言的一对男女可以组成一对cp，问区间 [l,r] 之间最多有多少对cp..直接套莫队就好了..

A Curious Matt

2小时前

G - A Curious Matt Time Limit:2000MS Memory Limit:512000KB 64bit IO Format:%I64d & %I64u Submit Status Descrip

Curious Array CodeForces - 407C (高阶差分)

2小时前

高阶差分板子题 const int N1e5111;int a[N], n, m, k;int C[N][111], d[N][111];signed main() {scanf("%d%d", &n, &

HDU 5112 A Curious Matt (Java comparator + 快速IO + 控制浮点精度)

2小时前

A Curious Matt Time Limit: 20002000 MS (JavaOthers) Memory Limit: 512000512000 K (JavaOthers)Total Submission(s

HDU 5112 A Curious Matt (14北京排序水题)

2小时前

A Curious Matt Time Limit: 20002000 MS (JavaOthers) Memory Limit: 512000512000 K (JavaOthers) Total Submission(

A Curious Matt5112

2小时前

A Curious Matt Time Limit: 20002000 MS (JavaOthers) Memory Limit: 512000512000 K (JavaOthers) Total Submission(s

水题：HDU 5112 A Curious Matt

2小时前

Description There is a curious man called Matt. One day, Matts best friend Ted is wandering on the non-negative half of

hdu5112A Curious Matt 水题

2小时前

给出每个点在每个时间的位置 ， 找出其最大的可能的速度由于其位置在一条直线上所以直接对时间排序，然后对相邻的两个点直接求最大的速度 ，画一下

HDU 5112 A Curious Matt（水~）

2小时前

Description一个人在跑步，给出其在n个位置的时刻，每两个相邻位置之间这个人速度恒定，忽略加速的时间，问这个人最大速度Input第一

HDOJ--5112--A Curious Matt

2小时前

题目描述： There is a curious man called Matt. One day, Matt’s best friend Ted is wandering on the non-negative h

Monads for the Curious Programmer, Part 1 (中英文对照版)

2小时前

原文链接：http:bartoszmilewski.wordpress20110109monads-for-the-curious-programmer-part-1 Monads for the Cu

This Curious AI Beats Many Games...and Gets Addicted to the TV

2小时前

拥有好奇心的ai容易被闪烁的内容吸引，在3d场景中，如果某块墙壁的贴图不停切换，ai倾向于停在墙壁前不动

HDU 5112 2014ICPC北京站现场赛 A Curious Matt

2小时前

A Curious Matt Time Limit: 20002000 MS (JavaOthers) Memory Limit: 512000512000 K (JavaOthers)

The Curious Coder’s Java Web Frameworks Comparison: Spring MVC, Grails, Vaadin, GWT, Wicket, Play, S

1小时前

http:zeroturnaroundrebellabsthe-curious-coders-java-web-frameworks-comparison-spring-mvc-grails-vaadin-gwt-wicket-pl

电子爱好者 - 最新技术资讯及电子产品介绍！

解读 《The Curious Case of Neural Text Degeneration 》 论文 笔记

1、引言

2、关注的问题

1、为什么beam seach 的解码方法导致了degeneratext？

2、为什么 truncated 采样的方式比在整个词表上好？

3、top-p (Nucleus Sampling)

更多相关文章

安装opensuse的笔记-重庆linux开源组织

无线感知论文速览 | SenSys 2023, 使用商用WiFi设备构建手部骨架 Construct 3D Hand Skeleton with Commercial WiFi

Python笔记——‘utf-8‘ codec can‘t decode byte 0xff in position 0: invalid start byte

笔记：将惠普1188a 接路由器pandavan打造打印服务器

大数据之-Hadoop3.x_Yarn_容量调度器队列案例---大数据之hadoop3.x工作笔记0152

A - A Curious Matt (排序)2014ACMICPC亚洲区北京站-重现赛（感谢北师和上交）

Curious Cupid

A Curious Matt

Curious Array CodeForces - 407C (高阶差分)

HDU 5112 A Curious Matt (Java comparator + 快速IO + 控制浮点精度)

HDU 5112 A Curious Matt (14北京 排序 水题)

A Curious Matt5112

水题：HDU 5112 A Curious Matt

hdu5112A Curious Matt 水题

HDU 5112 A Curious Matt（水~）

HDOJ--5112--A Curious Matt

Monads for the Curious Programmer, Part 1 (中英文对照版)

This Curious AI Beats Many Games...and Gets Addicted to the TV

HDU 5112 2014ICPC北京站现场赛 A Curious Matt

The Curious Coder’s Java Web Frameworks Comparison: Spring MVC, Grails, Vaadin, GWT, Wicket, Play, S

发表评论

推荐文章

PPL文档——Excel制作的甘特图加上动态今日线

计算机excel中行高在哪里,电脑Excel表格怎么对行高和列宽进行调整

惠普HP LaserJet Pro M329dw 驱动

【报错】Uncaught (in promise) Error: Avoided redundant navigation to current location:

This Curious AI Beats Many Games...and Gets Addicted to the TV

热门文章

深度解读汽车域控制器_动力域控制器，2024年最新上海大厂Golang面试经历

跑完HttpClient后出现Connection refused:no further information

excel表格计算机二级销售,计算机二级excel真题：制作产品销售情况表

HTML制作表格

position跟display、overflow、 float这些特性相互叠加后会怎么样?

Fair Scheduler与Capacity Scheduler比较

CUDA out of memory. Tried to allocate 16.00 MiB (GPU 0； 6.00 GiB total capacity； 4.54 GiB already a

使用StringBuffer类提供的length( )和capacity( )方法完成三种不同构造方法构造StringBuffer对象的输出。（java）

写一个程序包含如下的函数，完成： (a) 输入current_date的值： void input_date(struct date_rec *current_date) (b) 将current_d

No symbol &quot;xxx&quot; in current context解决

最新文章

Photoshop期末大作业

Photoshop2024下载安装包（附安装教程）

Window系统查询电脑生产日期、系统信息、主机序列号和真实配置信息

计算机显示文档在哪打开,我的文档在哪?小编教你找到电脑Windows系统我的文档在哪...

修改Windows“区域设置”对系统的影响

Photoshop 2021正式版更新，附全系列下载

Photoshop下载

windows默认编码格式修改

Windows10电脑用户中文名修改为英文名的详细教程【亲测有用】

windows桌面怎么添加计算机,Windows桌面添加我的电脑

windows server 2019系统激活与优化

Photoshop零基础全套学习教程资源百度云分享

windows+中标麒麟双系统启动优先顺序调整方法

如何判断自己的电脑有没有装java(windows7版本)

三步解决VMware “这台电脑无法运行 Windows 11”

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

解读《The Curious Case of Neural Text Degeneration 》论文笔记

HDU 5112 A Curious Matt (14北京排序水题)

No symbol "xxx" in current context解决

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载