Skip-Thought Vectors阅读笔记|电子爱好者

admin管理员组
文章数量:1534194

论文原文	Skip-Thought Vectors
论文信息	NIPS2015
个人解读	Wang & Hytn Chen
更新时间	2020-02-17

句子表示简介

句子分布式表示：将一句话用固定长度的向量进行表示，向量往往高维，因此也可看作将一句话嵌入进高维空间中去，也叫做句嵌入，让句子的语义更准确地编码到有限维的向量中，在向量子空间中保持句子的语义关系，更好地利用语言模型以及无监督上下文信息。

BERT出来之后，句表示领域就很少出来工作了，而这篇文章是BERT借鉴的一篇工作。

早期一点的句表示值得一提的是TF-IDF，中心思想是认为一句话每一个词对于这句话的语义都是有不同程度的贡献的，因此有了权重的概念，那么在已经有词向量的基础上如何通过计算每个词适合的权重，加权求和得到句表示呢？由此就引入了TF-IDF方法，TF代表词频，IDF代表逆文件频率指数，通过这两个特征来计算得出权重，从而得到句表示。

基于神经网络的句表示之前的阅读笔记中已经提及，在此不多加赘述。

基于复述句匹配的句表示，其训练的中心思想就是两句话互为复述句的话句向量应该更加相似，不为复述句的话句向量之间的距离应该更加远。复述句的训练集很容易获取，通过一个已训练好的翻译模型，将翻译结果和标签就可以当做一对复述句。

这里总结一下，上面的种种模型有什么优缺点呢？

基于语言模型的句表示

优点就是利用词与词的共现信息可以抓取到一部分特征，无监督的语料更加降低了成本，但缺点是词与词之间的共现信息还是太片面太模糊了，仅仅抓取这样的信息是不准确不够智能的，而且并未使用句与句之间的语义联系来做一些什么。

基于复述句对的句表示

优点是建模了句对之间的相似性关系，通过这个关系来训练模型，同时训练集的获取成本也低。但是缺点就是仅仅建模了相关性，相似性也还是比较偏面。

当时的skip-gram训练词向量的时候，主导的思想就是，要想了解一个词应该去了解它的上下文到底是什么。而skip thought的中心思想就是认为，当前句子总是会与其上下句之间存在语义联系的，那么就可以利用这样的语义联系来预测上下文的句子，就像skip-gram做的那样。

而skip thought的主要目标就是解决这样一个问题：如何利用大规模无监督语料来完整建模句子间的关系？

skip thought模型

模型简图如下所示：

编码器就是GRU，拿到最后时刻的隐层状态作为当前句子的表示。而解码器也是GRU，与编码器不同的是，在编码器已经得到中间句语义信息的时候，解码器要把这个信息融入进decoder中。原始GRU的原理图如下

对GRU原理理解之前，先看看LSTM的原理。在此不多赘述，其公式如下
r t = σ ( W r x t + U r h t − 1 ) z t = σ ( W z x t + U z h t − 1 ) h ‾ t = tanh ⁡ ( W x t + U ( r t ⊙ h t − 1 ) ) h t = ( 1 − z t ) ⊙ h t − 1 + z t ⊙ h ‾ t \begin{aligned} \mathbf{r}^{t} &=\sigma\left(\mathbf{W}_{r} \mathbf{x}^{t}+\mathbf{U}_{r} \mathbf{h}^{t-1}\right) \\ \mathbf{z}^{t} &=\sigma\left(\mathbf{W}_{z} \mathbf{x}^{t}+\mathbf{U}_{z} \mathbf{h}^{t-1}\right) \\ \overline{\mathbf{h}}^{t} &=\tanh \left(\mathbf{W} \mathbf{x}^{t}+\mathbf{U}\left(\mathbf{r}^{t} \odot \mathbf{h}^{t-1}\right)\right) \\ \mathbf{h}^{t} &=\left(1-\mathbf{z}^{t}\right) \odot \mathbf{h}^{t-1}+\mathbf{z}^{t} \odot \overline{\mathbf{h}}^{t} \end{aligned} rtzththt=σ(Wrx

本文标签：笔记 SKIP Thought Vectors

版权声明：本文标题：Skip-Thought Vectors阅读笔记内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1726875794a1088333.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

Skip-Thought Vectors阅读笔记

句子表示简介

skip thought模型

更多相关文章

Java 初学笔记（2024.9.3始 更新中）

[RK3399][Android7.1] 调试笔记 ---谷歌拼音替换搜狗输入法

新手玩荔枝派 f1c100s nano折腾笔记（三）

lnwdh笔记

小米笔记安装双系统linux,小米笔记本电脑怎么安装双系统？-小米win7

分享会笔记——关于批评

Chain of Thought Prompting和Zero Shot Chain of Thought初步认识

【Chain-of-Thought 专题】Self-consistency Improves Chain Of Thought Reasoning in Language Models

思维链（Chain-of-Thought）作为提示

理解思维链Chain of Thought（CoT）

Skip-Thought Vectors阅读笔记

大语言模型提示词方式 CoT（Chain of Thought）

Skip-Thought Vector学习笔记

人工智能-深度学习：句表示学习方法：Skip Thought模型、Quick thoughts模型(A kind of Encoder-Decoder)

COT:chain of thought

Skip-Thought词向量模型实现Sent2Vec

TOT(Tree of Thought) | 让GPT-4像人类一样思考

什么是 Prompt engineering 里的 Chain-of-Thought

some thought

【论文精读】Chain-of-Thought Prompting Elicits Reasoning in Large Language Models

发表评论

推荐文章

暴风影音硬件加速播放高清影片

文件夹提示文件或目录损坏且无法读取

浅谈windows 8.1--如何从xp或win 7 过渡到win 8.1

java 翻译_java实现简单的英汉翻译功能

cas在360浏览器单点登录失败

热门文章

【货干】：联想小新 Pro 16 AMD WIFI 无法使用解决方案

Linux下安装搜狗拼音输入法

移动硬盘安装系统无法读取电脑其他硬盘的解决方法

ChatGPT背后有哪些关键技术？CSIG企业行带你一探究竟_chatgpt是以下哪种技术的代表 a语音识别技术b图像识别技术c生成式人工智能技(1)

ChatGPT的技术发展路径和带来的影响

【研究生学术英语读写教程翻译 中国科学院大学Unit5】

桌面计算机打开不了怎么办,电脑启动不了桌面怎么办

关闭windows自带安全中心（便于三方软件的破解安装）

《MongoDB极简教程》第一章 NoSQL简史 &amp;amp; MongoDB安装&amp;amp;环境配置

亚马逊云科技入门资源中心，从0到1轻松上云

最新文章

Win7系统提示找不到diskraid.exe文件的解决办法

Win7系统提示找不到wow64win.dll文件的解决办法

联想拯救者Y7000 2020H原厂Win10系统镜像：重拾纯净体验

win7系统如何安装,win7系统安装教程图解

电脑怎么重装系统windows7,电脑如何重装系统windows7

回归经典：Win7 SP1 原版32位，你的稳定之选

操作系统发展简史（UnixLinux 篇 + DOSWindows 篇）| Mac 与 Microsoft 之风云争霸

Win11系统提示找不到OEMDefaultAssociations.dll文件的解决办法

单、双硬盘装Windows和Ubuntu双系统——准备篇

小白级别重装Windows系统（保姆级教程）

Win7系统提示找不到hal.dll文件的解决办法

Win7系统提示找不到winload.exe文件的解决办法

win7怎么安装系统 win7系统怎么装机

win7系统版本如何安装 win7系统安装图文教程

小白如何给笔记本一键重装win7系统,新手重装系统win7方法

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

Java 初学笔记（2024.9.3始更新中）

【研究生学术英语读写教程翻译中国科学院大学Unit5】

《MongoDB极简教程》第一章 NoSQL简史 & MongoDB安装&环境配置

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载