嗯？大火的ChatGPT和new bing都离不开它？|电子爱好者

admin管理员组
文章数量:1532372

概述：本文是对 WhalePaper 向量检索领域第一次直播活动内容的文字版，会对向量检索这个 ChatGPT 和 new bing 都离不开的技术进行介绍，结合了 ChatGPT 以及 new bing 的应用场景进行讲解，相信被标题骗进来的你还真能有所收获的（手动狗头）！本期内容入门友好，对课件进行了一些注解，图文结合在一起全是干货，长文预警！

脉络

本次分享的主题是：基于图索引的多向量检索及其GPU加速。

主讲人：浙江大学在读博士王梦召。

将从以下几个方面进行:

背景介绍：包含 ChatGPT 的工作原理，向量检索的发展现状，什么是向量索引。

多向量检索：会介绍什么是多向量，为什么需要多向量检索，如何进行多向量检索。

如何通过GPU加速图索引的多向量检索：这部分内容讲解了如何基于图索引进行多向量检索，如何用GPU来加速图索引搜索。

对未来的思考：主要说明了一些王博士未来研究的一个方向。

背景介绍

我们每个人每天都会接触大量的非结构化数据，比如视频、语音、文本等等，根据IDC（国际数据公司）的统计，当前我们世界上所有的数据中有百分之八十是非结构化数据。目前主流的处理非结构化数据的方式是通过深度神经网络把非结构化数据转变为高维的稠密向量，再对这些向量进行分析处理。那么这些跟 ChatGPT 和 new bing 有什么关系呢？先来简单介绍一下这两者的工作方式。

ChatGPT 直接根据用户提供的上文，直接生成回应。那这个是怎么生成的呢？是靠用户给出上文提示，它才能返回下文。但是自然语言的上下文，机器并不能看懂，所以要把自然语言编码为向量的形式，回复时同样是把向量解码为一段文字。

new bing 是先用 bing 搜索找到一些参考，然后使用 GPT 模型进行归纳总结。整体工作流程分为两个部分。首先是检索，就是根据用户的搜索，先找到可靠的依赖信息。之后就是归纳总结，把搜索来的知识（网页信息）归纳为一段精炼的文字。这个过程就类似向量检索，根据 query（查询的向量）把相似向量检索到，然后使用这些向量完成下游任务，例如：归纳总结，推荐。

从两者的工作原理可以看出向量数据的重要性，AI应用离不开向量数据，而只要在搜索过程中涉及到对向量的处理，便离不开向量检索。那么什么是向量检索？

什么是向量检索?

还记得中学时期计算向量间的距离吗？这其实就是向量检索的本质。还是举个例子帮助我们更好的理解。

上图为一个二维空间，里面存放着由非结构化数据转变成的向量，我们给定一个查询（图中小绿点），即我们要搜索的事物，然后把查询也转变成向量，通过计算向量间的距离，将距离最小的几个向量（连线小红点）作为结果返回，即召回离它最近的一些结果，这就是一个比较简单的向量检索的过程。

向量检索的分类

向量检索的索引技术可以分为四个流派，分别是Tree（树索引）、Hashing（哈希索引）、Quantization（量化索引）和PG（图索引），四种方法各有各的优势。其中基于图的这种方式在效率和精度上有一个比较好的均衡，所以目前受到了大家更多的关注，也是我们这次分享的重点，后面会具体进行说明。

对另外三种索引方式感兴趣的朋友可以自行上网搜索，或者关注我们整理的相关论文：Unstructured-Data-Community/

本文标签：大火 chatGPT Bing

版权声明：本文标题：嗯？大火的ChatGPT和new bing都离不开它？内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dongtai/1726838756a1086535.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

嗯？大火的ChatGPT和new bing都离不开它？

脉络

背景介绍

什么是向量检索?

向量检索的分类

更多相关文章

chatGPT流式回复是怎么实现的

chatGPT成功之道-数据

用户已过亿，ChatGPT为什么那么多人用？

国内各种免费AI聊天机器人(ChatGPT)推荐(中)

【ChatGPT自动生成系列】SpringBoot集成Mybatis

探索未来编程新体验：ChatGPT VSCode 扩展插件

基于 ChatGPT 和 React 搭建 JSON 转 TS 的 Web 应用

ChatGPT评论

用ChatGPT三分钟免费做出数字人视频- 提升自媒体魅力

这样设置Prompt，让ChatGPT输出更好的效果！

ChatGPT背后有哪些关键技术？CSIG企业行带你一探究竟

ChatGPT学习第一周

探索未来对话新境界：ChatGPT万能工具箱

ChatGPT-Midjourney 开源项目教程

【我用ChatGPT学编程】Vue-Router中history模式Nginx部署后刷新404的问题

Chatgpt如何提问，提高回答效率

如果告诉ChatGPT，人类将会关闭它，它会悲伤吗？

文心一言 VS 讯飞星火 VS chatgpt （321）-- 算法导论22.3 13题

跟随chatgpt学前端之写一个简单的helloworld网页

chatgpt赋能python：Python程序入口怎么写

发表评论

推荐文章

联想笔记本安装AMD显卡驱动失败 提示 ：出问题了。错误184-由于操作系统不支持，AMD Software安装程序无法继续。

DEEPIN 设置U盘启动

搜狗拼音输入法怎么打出特殊符号

工作站 linux系统安装win7,Dell T7500工作站 Win7RHEL5.5双系统启动菜单修复

ChatGPT到底是如何运作？

热门文章

记录win10无法通过IE浏览器设置受信任的站点的几种方法

设置路由器多人拨号使用wifi（使用路由器交换机功能）

w ndows系统启动日志ID,WIN7日志总能看到 特殊登陆 事件ID 4672，是怎么回事？

amd显卡linux卡死,Radeon 520显卡使用amdgpu时的死机问题 [不用点进来看了，解决方法是换一台电脑]...

运行docker镜像报错：WARNING: The requested image‘s platform (linuxamd64)的解决办法

Java 初学笔记（2024.9.3始 更新中）

移动硬盘弹出文件或目录损坏且无法读取解决办法

umpc 安卓 linux双系统,牛人改造旧款UMPC运行四系统 Win7+Mac OS

OpenAI ChatGPT API + FaskAPI SSE Stream 流式周转技术 以及前端Fetch 流式请求获取案例

深度完美 XP SP3 完美优化DVD装机版 V2013

最新文章

DiskGenius备份还原分区=备份Windows系统

linux卷影复制功能,系统还原和卷影复制可以清理吗,系统还原使用的卷影复制服务无法...

Mac Time Machine恢复系统 Time Machine还原系统教程

电脑设置系统还原点

树莓派系统的备份与还原（五）

Ubuntu20.04系统备份和恢复 -- 绝对好用

银河麒麟系统还原后的激活方法

利用360安全卫士里的【系统备份与还原】小工具进行系统备份与还原

Windows10进行还原恢复电脑系统配置

便捷式备份系统并还原

恢复W ndows10系统方法步骤,教你windows10的映像文件还原系统

电脑语音设置修复计算机,win10系统麦克风正确设置的恢复办法

计算机桌面有黑边怎么调整,电脑屏幕旁边有黑色框如何恢复_电脑两边黑边怎么还原-win7之家...

冰点还原2023中文版最新电脑系统数据恢复软件

飞腾FT-20004处理器下（麒麟系统）Clonezilla再升龙快速备份还原及部署系统（2）--恢复还原

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

联想笔记本安装AMD显卡驱动失败提示：出问题了。错误184-由于操作系统不支持，AMD Software安装程序无法继续。

w ndows系统启动日志ID,WIN7日志总能看到特殊登陆事件ID 4672，是怎么回事？

Java 初学笔记（2024.9.3始更新中）

OpenAI ChatGPT API + FaskAPI SSE Stream 流式周转技术以及前端Fetch 流式请求获取案例

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载