ChatGPT理论分析|电子爱好者

admin管理员组
文章数量:1590877

团队模型、论文、博文、直播合集，点击此处浏览

一、背景

这里我就直接贴上跟ChatGPT的对话作为背景输入，说真的，它的回答比我写的还要专业，具体见如下截图：

二、原理

从官网介绍可以看到，ChatGPT与InstructGPT是同源的模型。那么接下来我们来看下什么是InstructGPT。从字面上来看，顾名思义，它就是指令式的GPT，“which is trained to follow an instruction in a prompt and provide a detailed response”。接下来我们来看下InstructGPT论文[1]中的主要原理：

从该图可以看出，InstructGPT是基于GPT-3模型训练出来的，具体步骤如下：

步骤1.）从GPT-3的输入语句数据集中采样部分输入，基于这些输入，采用人工标注完成希望得到输出结果与行为，然后利用这些标注数据进行GPT-3有监督的训练。该模型即作为指令式GPT的冷启动模型。

步骤2.）在采样的输入语句中，进行前向推理获得多个模型输出结果，通过人工标注进行这些输出结果的排序打标。最终这些标注数据用来训练reward反馈模型。

步骤3.）采样新的输入语句，policy策略网络生成输出结果，然后通过reward反馈模型计算反馈，该反馈回过头来作用于policy策略网络。以此反复，这里就是标准的reinforcement learning强化学习的训练框架了。

所以总结起来ChatGPT（对话GPT）其实就是InstructGPT（指令式GPT）的同源模型，然后指令式GPT就是基于GPT-3，先通过人工标注方式训练出强化学习的冷启动模型与reward反馈模型，最后通过强化学习的方式学习出对话友好型的ChatGPT模型。如下是论文中相应对话友好型的定量结果（其中PPO-ptx曲线就是InstructGPT模型），可以看到在回答友好型上InstructGPT是远超原始GPT的：

ChatGPT它非常擅长对话、情感分析、文本生成、摘要提取等，有了这些直接打开了更广阔的应用面。可想而知，如若在垂直领域做定向训练，它将会发挥出更极致的性能，即可作咨询用途，同时也可以辅助创作（这将颠覆很多行业的工作方式）等等。

效果是非常惊艳的，使用完之后的体感是这应该能辅助到各行各业中，应用空间无限大，这类技术可能会成为未来AI系统的基石应用之一。

三、其他

文生图体验，文章《人工智能内容生成元年—AI绘画原理解析》中已介绍到Midjourney的用户通过该文生图的能力，在美国科罗拉多州举办的艺术博览会，《太空歌剧院》的画作获得数字艺术类别冠军。相应参与界面如下：

四、文献

[1]InstructGPT：https://arxiv/abs/2203.02155

本文标签：理论 chatGPT

版权声明：本文标题：ChatGPT理论分析内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1728105179a1145673.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

ChatGPT理论分析

团队模型、论文、博文、直播合集，点击此处浏览

一、背景

二、原理

三、其他

四、文献

更多相关文章

5个充分掌握ChatGPT的使用技巧！

最近爆火的ChatGPT是什么，ChatGPT对人类未来有哪些影响？

各种使用chatgpt prompts技巧

一、软件测试概念和理论

软件测试概念和理论

Linux系统之系统管理与维护（理论+实战）

[网络]OSPF理论

询问chatgpt现在高频的同替+单词记忆

软连接 --chatGPT

ChatGPT三个关键技术

百度chatGPT chatgpt 程序员

ChatGPT基础入门教学

ChatGPT：短期被高估

Day921.chatGPT

chatgpt接口调用

教师可以在课堂上使用 CHATGPT 的 3 种方式

ChatGPT 提示的艺术：制作清晰有效提示的指南(The Art of ChatGPT Prompting)

ChatGPT 简单介绍

什么是真正的ChatGPT——ChatGPT的工作原理、优点和限制分析

利用ChatGPT巧妙提升演讲技巧，轻松驾驭演讲舞台【文末送书】

发表评论

推荐文章

Linux常用命令指南 - ln 命令 创建链接

解决老Mac强行双系统后Mac系统引导丢失出现no bootable device

服务器上文件夹带锁子,win7文件夹带锁是什么意思_win7文件上的小锁如何取消-win7之家...

教您恢复回收站删除的文件

计算机 键盘启动,键盘开机如何打开键盘

热门文章

w7计算机虚拟内存设置,win7电脑虚拟内存怎么设置_win7电脑虚拟内存设置方法-win7之家...

android QQ文字提取,手机QQ更新，图片提取文字更加方便

聊一聊进程、线程和协程以及线程的那些“锁“事

完整版JavaWeb环境搭建-maven-servlet...与测试，欢迎大家一起学习【狂神说】

sublime text3 3207 mac 激活

qt实现对bin文件的加密以及输出加密后的数据到数组中

Video-based Evanescent, Anonymous, Asynchronous Social Interaction: Motivation and Adaption to Mediu

如何在 Windows 10 中重置忘记的密码而不丢失数据

VMware esxi-6.0root密码恢复和数据恢复

GHOST双系统（XP和VISTA）详细图解教程

最新文章

Windows常见垃圾清理方式

windows7 64位机上配置MinGW+Codeblocks+ wxWidgets

ubuntu挂载windows下的文件目录的步骤

windows密码抓取的多种方法

在虚拟机里安装windows

【翻译自mos文章】使用Process Monitor 来跟踪windows下的系统调用（system calls）

在Win7下删除Ubuntu系统分区后未分配空间如何恢复到原来的磁盘？

2020年11月windows7安装使用nodejs

Windows 2008 &amp; Windows7 针对某一个应用程序 取消用户账户控制

windows设置环境变量代理

windows service 2008和xp或者win7有什么区别啊？

windows连接到linux上的FTP服务器进行文件传输

Windows系统下配置OpenCV_DNN模块使用CUDA加速(Windows10、VS2017、CUDA10.1、cuDNN7.6.5、OpenCV4.2.0)

FinalShell 远程桌面连接虚拟机 Win 7

【致土豪们】如何在苹果电脑上使用windows系统

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

Linux常用命令指南 - ln 命令创建链接

计算机键盘启动,键盘开机如何打开键盘

Windows 2008 & Windows7 针对某一个应用程序取消用户账户控制

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载