LLMs之Lamini-1：《Banishing LLM Hallucinations Requires Rethinking Generalization消除大型语言模型幻觉需要重新思考》翻译与解读|电子爱好者

admin管理员组
文章数量:1531793

LLMs之Lamini-1：《Banishing LLM Hallucinations Requires Rethinking Generalization消除大型语言模型幻觉需要重新思考泛化问题》翻译与解读

导读：论文从实验的角度，重新审视现有大规模语言模型(LLM)在推理过程中的“幻想”现象，并提出一种名为“Lamini记忆调整”的新方法来消除这一问题。主要核心点总结如下：

>> 背景痛点：

当前LLM的训练方法重视泛化误差，无法消除对关键事实的“幻想”。

泛化误差不能区分有无幻想的模型。

消除幻想需要的计算量远大于缩放规律所需。

>> 解决方案：

通过随机化实验证明LLM容易拟合随机标签，但不影响泛化能力。

提出“Lamini记忆调整”训练方法，通过重训练精确还原关键事实。

开发基于大量记忆专家混合体(MoME)的Lamini-1模型架构。

>> 核心思路：

将事实存储在MoME的专家中，通过交叉注意力选择相关专家。

固定主干网络和注意力机制，仅更新选择的专家实现精确求解。

大大降低每个事实训练的计算成本。

>> 主要优势：

理论上可以精确存储与参数数量等规模的事实数量。

通过系统优化大幅降低消除幻想所需计算。

提供一代试点模型证明此框架在事实回溯上的效果。

《Banishing LLM Hallucinations Requires Rethinking Generalization》翻译与解读

Abstract

11 Conclusion

《Banishing LLM Hallucinations Requires Rethinking Generalization》翻译与解读

地址	论文地址：https://arxiv/abs/2406.17642
时间	2024年6月25日
作者	Lamini团队

Abstract

Despite their powerful chat, coding, and reasoning abilities, Large Language Models (LLMs) frequently hallucinate. Conventional wisdom suggests that hallu-cinations are a consequence of a balance between creativity and factuality, which can be mitigated, but not eliminated, by grounding the LLM in external knowledge sources. Through extensive systematic experiments, we show that these traditional approaches fail to explain why LLMs hallucinate in practice. Specifically, we show that LLMs augmented with a massive Mixture of Memory Experts (MoME) can easily memorize large datasets of random numbers. We corroborate these experimental findings with a theoretical construction showing that simple neural networks trained to predict the next token hallucinate when the training loss is above a threshold as it usually does in practice when training on internet scale data. We interpret our findings by comparing against traditional retrieval methods for mitigating hallucinations. We use our findings to design a first generation model for removing hallucinations - Lamini-1 - that stores facts in a massive mixture of millions of memory experts that are retrieved dynamically.

虽然大型语言模型(LLMs)具有强大的聊天、编码和推理能力，但经常会出现幻觉。传统观念认为，幻觉是创造力和事实之间的平衡的结果，可以通过将LLM与外部知识源联系起来来减轻，但无法完全消除。通过广泛系统的实验，我们发现这些传统方法无法解释LLM为何在实践中会出现幻觉。具体而言，我们发现，通过增加大量混合记忆专家(MoME)的LLM可以轻松记忆大量随机数数据集。我们用理论构建支持这些实验结果，该构建表明，简单的神经网络在训练损失高于阈值时会出现幻觉，这在实践中通常发生，尤其是在以互联网规模数据进行训练时。我们通过与传统检索方法对比解释了我们的发现，用这些发现设计了一个用于去除幻觉的第一代模型——Lamini-1，它将事实存储在数百万个记忆专家的大量混合中，并且可以动态检索出来。

11 Conclusion

This paper presents a groundbreaking study that challenges the conventional wisdom on large language models (LLMs) and their ability to generalize without hallucinations. We demonstrate that LLMs can easily memorize random labels without increasing their generalization error, contradicting the notion that hallucinations are a consequence of a balance between creativity and factuality. Furthermore, we show that generalization error does not discriminate between models that hallucinate and those that don’t, and that training long enough to remove hallucinations is computationally intensive and may not be feasible on existing systems in 2024. Our study highlights the need for new metrics and approaches to evaluate the ability of LLMs to memorize and recall facts precisely, and suggests that LLMs have sufficient capacity to store large datasets of facts precisely, even when the training data is noisy or random. The findings have significant implications for the development of LLMs, their applications, and related deep neural networks trained with SGD. Our results underscore the importance of rethinking the design and training of these models to mitigate hallucinations and improve factual recall.

本文介绍了一项开创性的研究，挑战了关于大型语言模型（LLMs）及其在没有幻觉情况下泛化能力的传统认知。我们证明了LLMs可以轻松地记住随机标签，而不会增加其泛化误差，这与幻觉是创造力和事实之间平衡的结果的观念相矛盾。此外，我们还表明，泛化误差并不区分是否会产生幻觉的模型，以及那些不会产生幻觉的模型，并且要消除幻觉需要进行耗时的训练，可能在2024年的现有系统上无法实现。我们的研究突显了需要新的指标和方法来评估LLMs精确记忆和召回事实的能力，并提出LLMs有足够的容量来精确存储大量数据集中的事实，即使训练数据是嘈杂或随机的。这些发现对LLMs的发展、应用以及使用SGD训练的相关深度神经网络具有重要意义。我们的结果强调了重新思考设计和训练这些模型的重要性，以减少幻觉并提高事实召回能力。

本文标签：幻觉模型语言 Banishing LLM

版权声明：本文标题：LLMs之Lamini-1：《Banishing LLM Hallucinations Requires Rethinking Generalization消除大型语言模型幻觉需要重新思考》翻译与解读内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dongtai/1726826552a1086141.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

LLMs之Lamini-1：《Banishing LLM Hallucinations Requires Rethinking Generalization消除大型语言模型幻觉需要重新思考》翻译与解读

《Banishing LLM Hallucinations Requires Rethinking Generalization》翻译与解读

Abstract

11 Conclusion

更多相关文章

LLM学习笔记-6

C语言中嵌入SQL语句

C语言实现文件的局部修改,C语言：在文件的指定位置实现局部修改，而无需重写文件的其他部分...

knn 邻居数量k的选取_在k个最近邻居knn的掩盖下和流行的模型验证技术

组合模型预测模型_改进著名的nfl预测模型

数学模型预测模型_改进著名的nfl预测模型

JavaScript Window - 浏览器对象模型

用免费的Cloudflare Workers搭建一个telegram的chatgpt机器人并接入oneapi支持各大ai模型

号称世界上第一个开源实时翻译的 App，微软开源GraphRAG：极大增强大模型问答、摘要、推理，以及开源基于ChatGPT的超级文本代码智能体（附代码地址）

“本草”大模型开源，ChatGPT时代，连AI私人医生都出现了？

复旦团队发布类ChatGPT模型MOSS，服务崩掉后并给出回复

最新ChatGPT4.0，GPTs，AI换脸，文档分析，Suno-AI音乐生成大模型

vqvae简单实战，利用vqvae来提升模型向量表达

学生信息管理系统（C语言）

c语言百文百鸡问题答案,python_百文买百鸡问题

一口气了解大模型相关通识，基础笔记！

dell笔记本c语言系统,戴尔Latitude 5280笔记本如何将自带win10改成win7

C语言之指针

搞懂C语言指针，看这篇就够了！

学习模型论，何其难？

发表评论

推荐文章

如何重装系统windows7,怎么重装系统windows7

amd插帧技术如何开启_玩家真谛：通过AMD的 专属福利“插帧补帧”技术了解播放器原理...

centos-安装并使用五笔输入法-极点五笔输入法

基于校园上网行为感知的学生成绩预测方法

ASUS华硕天选4笔记本电脑FA507XV原厂Windows11系统22H2

热门文章

痛苦的刷路由器 破校园网 小米mini潘多拉

多线程安全，无锁化编程

【AMD GPU】使用A卡进行ai模型训练

Windows桌面鼠标右键取消AMD选项

WIN10 + Ubuntu18.04 双系统安装教程（新机）

Intellij IDEA安装过程

各型号电脑U盘启动快捷键查询

安装中间件使linux系统能够读取移动硬盘

mac更新完后读取不出移动硬盘的问题解决

如何在SQL Server中处理过多的SOS_SCHEDULER_YIELD等待类型值

最新文章

微信QQ中已停止访问该网页的处理办法

Win10升级后执行系统封装(Sysprep)报错

win7与win10系统哪个好？你听过中兴新支点操作系统么

win7下vs2008过期升级没有提示序列号

XPWin7Ubuntu多系统下修改C盘UUID造成Ubuntu启动错误的解决办法

前端html第三方登录集合，微信，微博，企鹅

微信公众号之用户登录

在64位Win7操作系统中安装Microsoft Access Engine的解决方案(转)

计算机无法启动打印服务,win7打印服务无法启动怎么办？打印服务无法启动修复...

nvidia控制面板点了没反应win7_控制面板无响应怎么办_为什么nvidia控制面板打不开图文步骤...

公众号开发(2) —— 盛派.net SDK + vue搭建微信公众号网页开发框架

科普：黑客盗QQ究竟是怎么回事？

解决win7 vs2008没有升级按钮导致无法升级

原创---爱普生LQ-690K打印机win7共享报错解决方案“Windows无法连接到打印机。无法找...

六个Win7下XP模式的缺陷

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

amd插帧技术如何开启_玩家真谛：通过AMD的专属福利“插帧补帧”技术了解播放器原理...

痛苦的刷路由器破校园网小米mini潘多拉

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载