一文读懂「RAG，Retrieval-Augmented Generation」检索增强生成|电子爱好者

admin管理员组
文章数量:1630629

Retrieval-Augmented Generation（RAG）作为机器学习和自然语言处理领域的一大创新，不仅代表了技术的进步，更在实际应用中展示了其惊人的潜力。

RAG结合了检索（Retrieval）和生成（Generation）两大核心技术，通过这种独特的混合机制，能够在处理复杂的查询和生成任务时，提供更加准确、丰富的信息。无论是在回答复杂的问题，还是在创作引人入胜的故事，RAG都展现了其不可小觑的能力。

一、什么是RAG？

检索增强生成（Retrieval Augmented Generation），简称 RAG，已经成为当前最火热的LLM应用方案。它是一个为大模型提供外部知识源的概念，这使它们能够生成准确且符合上下文的答案，同时能够减少模型幻觉。

但是大模型应用于实际业务场景时会发现，通用的基础大模型基本无法满足我们的实际业务需求，主要有以下几方面原因：

知识的局限性：模型自身的知识完全源于它的训练数据，而现有的主流大模型（ChatGPT、文心一言、通义千问…）的训练集基本都是构建于网络公开的数据，对于一些实时性的、非公开的或离线的数据是无法获取到的，这部分知识也就无从具备。
幻觉问题：所有的AI模型的底层原理都是基于数学概率，其模型输出实质上是一系列数值运算，大模型也不例外，所以它有时候会一本正经地胡说八道，尤其是在大模型自身不具备某一方面的知识或不擅长的场景。而这种幻觉问题的区分是比较困难的，因为它要求使用者自身具备相应领域的知识。
数据安全性：对于企业来说，数据安全至关重要，没有企业愿意承担数据泄露的风险，将自身的私域数据上传第三方平台进行训练。这也导致完全依赖通用大模型自身能力的应用方案不得不在数据安全和效果方面进行取舍。
而RAG是解决上述问题的一套有效方案。

二、RAG结构

简单来讲，RAG就是通过检索获取相关的知识并将其融入Prompt，让大模型能够参考相应的知识从而给出合理回答。因此，可以将RAG的核心理解为“检索+生成”，前者主要是利用向量数据库的高效存储和检索能力，召回目标知识；后者则是利用大模型和Prompt工程，将召回的知识合理利用，生成目标答案。

完整的RAG应用流程主要包含两个阶段：

数据准备阶段：数据提取 >> 文本分割 >> 向量化（embedding) >> 数据入库
应用阶段：用户提问 >> 数据检索（召回） >> 注入Prompt >> LLM生成答案

2.1 数据准备阶段

数据准备一般是一个离线的过程，主要是将私域数据向量化后构建索引并存入数据库的过程。主要包括：数据提取、文本分割、向量化、数据入库等环节。

数据提取

数据加载：包括多格式数据加载、不同数据源获取等，根据数据自身情况，将数据处理为同一个范式。
数据处理：包括数据过滤、压缩、格式化等。
元数据获取：提取数据中关键信息，例如文件名、Title、时间等。

文本分割

文本分割主要考虑两个因素：

1）embedding模型的Tokens限制情况；
2）语义完整性对整体的检索效果的影响。

一些常见的文本分割方式如下：

句分割：以”句”的粒度进行切分，保留一个句子的完整语义。常见切分符包括：句号、感叹号、问号、换行符等。
固定长度分割：根据embedding模型的token长度限制，将文本分割为固定长度（例如256/512个tokens），这种切分方式会损失很多语义信息，一般通过在头尾增加一定冗余量来缓解。

向量化（embedding）

向量化是一个将文本数据转化为向量矩阵的过程，该过程会直接影响到后续检索的效果。目前常见的embedding模型如表中所示，这些embedding模型基本能满足大部分需求，但对于特殊场景（例如涉及一些罕见专有词或字等）或者想进一步优化效果，则可以选择开源Embedding模型微调或直接训练适合自己场景的Embedding模型。

数据入库

数据向量化后构建索引，并写入数据库的过程可以概述为数据入库过程，适用于RAG场景的数据库包括：FAISS、Chromadb、ES、milvus等。一般可以根据业务场景、硬件、性能需求等多因素综合考虑，选择合适的数据库。

2.2 应用阶段

在应用阶段，我们根据用户的提问，通过高效的检索方法，召回与提问最相关的知识，并融入Prompt，大模型参考当前提问和相关知识，生成相应的答案。关键环节包括：数据检索、注入Prompt等。

数据检索

常见的数据检索方法包括：相似性检索、全文检索等，根据检索效果，一般可以选择多种检索方式融合，提升召回率。

相似性检索：即计算查询向量与所有存储向量的相似性得分，返回得分高的记录。常见的相似性计算方法包括：余弦相似性、欧氏距离、曼哈顿距离等。
全文检索：全文检索是一种比较经典的检索方式，在数据存入时，通过关键词构建倒排索引；在检索时，通过关键词进行全文检索，找到对应的记录。

注入Prompt

Prompt作为大模型的直接输入，是影响模型输出准确率的关键因素之一。在RAG场景中，Prompt一般包括任务描述、背景知识（检索得到）、任务指令（一般是用户提问）等，根据任务场景和大模型性能，也可以在Prompt中适当加入其他指令优化大模型的输出。一个简单知识问答场景的Prompt如下所示：

【任务描述】假如你是一个专业的客服机器人，请参考【背景知识】，回【背景知识】 {content} // 数据检索得到的相关文本【问题】
石头扫地机器人P10的续航时间是多久？

Prompt的设计只有方法、没有语法，比较依赖于个人经验，在实际应用过程中，往往需要根据大模型的实际输出进行针对

本文标签：一文读懂 RAG Generation Augmented

版权声明：本文标题：一文读懂「RAG，Retrieval-Augmented Generation」检索增强生成内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1729069395a1184893.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

一文读懂「RAG，Retrieval-Augmented Generation」检索增强生成

一 、什么是RAG？

二、RAG结构

2.1 数据准备阶段

2.2 应用阶段

更多相关文章

LLM之RAG实战（三十二）| 使用RAGAs和LlamaIndex评估RAG

一文带你了解ARM的发展历程

mp3转换器具体怎么用？一文解答mp3转换工具的用法

一文说清 OCLint 源码解析及工作流分析

一文带你读懂宽带上下行速率不对称的原因

一文讲清楚机械硬盘和固态硬盘的工作原理

一文了解十大 Java 开发者必备测试框架！

一文了解十大 Java 开发者必备测试框架

Win11初始化系统遇一文解决

一文彻底了解鸿蒙系统、澎湃系统和安卓系统的区别？_鸿蒙系统和hyperos

一文读懂量化系统接入及相关平台

一文看尽深度学习中的20种卷积（附源码整理和论文解读）

LLMs之LCM：《MemLong: Memory-Augmented Retrieval for Long Text Modeling》翻译与解读

generation的重复性问题

INTRODUCTION TO THE LAW OF VIRTUAL AND AUGMENTED REALITY

一文看懂priority_queue自定义比较函数有几种方法

一文彻底了解鸿蒙系统、澎湃系统和安卓系统的区别？_鸿蒙系统和hyperos(2)

2024年最全一文彻底了解鸿蒙系统、澎湃系统和安卓系统的区别？_鸿蒙架构图，字节跳动 算法面试题

一文彻底了解鸿蒙系统、澎湃系统和安卓系统的区别？_鸿蒙系统和hyperos(3)

一文读懂「RAG，Retrieval-Augmented Generation」检索增强生成

发表评论

推荐文章

在CentOS中安装MySQL报错： Failing package is: mysql-community-common-5.7.42-1.el7.x86_64 GPG Keys are conf

centos：usrbinperl is needed by mysql-community-server

免费装Office2021工具Office Tool Plus使用教程

Scractch3.0_Arduino_ESP32_图形化编程学习_WIFI一键配网web（五）

【电脑视频录制软件】各种录屏软件优缺点，OBS的格式转化，清晰度调节，基本使用，下载链接

热门文章

MySQL community server和MySQL installer有什么区别？

python开发工具pycharm-community版安装教程

CAD绘图电气元件库：助力电气工程设计的强大工具

交通杀马特︱道路瘦身全纪录：用金钱和生命来衡量降速交通的好处

VMware12启动虚拟机电脑蓝屏

酷开系统和鸿蒙系统,鸿蒙正式取代安卓？余承东：不是取代，而是下一代的操作系统！...

鸿蒙操作系统和安卓操作系统相比哪个更优,华为鸿蒙操作系统开源！随时可用、比安卓性能更强...

多个jpg图片怎么转换成pdf文档

安装ps缺少dll文件怎么修复？解决方法分享

VScode配置verilog环境

最新文章

hashcat在windows上的安装与简单使用

Windows实现微信双开

解决Jenkins启动jar包后，进程被杀死（windows下spring boot项目）

windows客户端开发--xmpp协议gloox库

Windows的复制粘贴快键键突然不可用的解决方案

【转载】windowsServer环境下的flask+nginx部署方案

转载好用的小工具 【who-lock-me】

idea关闭Run窗口时点了Disconnect, RememberMe

xbox手柄适配器驱动_用于Windows的Xbox 360控制器无线接收器适配器

PCI设备WINDOWS驱动程序的开发

关于windows下安装freesshd的一些经验

各浏览器User-Agent用户代理字符串整理

解决windows11下无法安装.net framework 3.5（包括.net2.0和3.0）

C#调用Windows API详解（上）

[技巧]Ubuntu与Windows10局域网共享文件夹

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

一、什么是RAG？

2024年最全一文彻底了解鸿蒙系统、澎湃系统和安卓系统的区别？_鸿蒙架构图，字节跳动算法面试题

转载好用的小工具【who-lock-me】

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载