admin管理员组

文章数量:1532372

概述:本文是对 WhalePaper 向量检索领域第一次直播活动内容的文字版,会对向量检索这个 ChatGPT 和 new bing 都离不开的技术进行介绍,结合了 ChatGPT 以及 new bing 的应用场景进行讲解,相信被标题骗进来的你还真能有所收获的(手动狗头)!本期内容入门友好,对课件进行了一些注解,图文结合在一起全是干货,长文预警!
  1. 脉络

本次分享的主题是:基于图索引的多向量检索及其GPU加速。

主讲人:浙江大学在读博士王梦召。

将从以下几个方面进行:

  • 背景介绍:包含 ChatGPT 的工作原理,向量检索的发展现状,什么是向量索引。

  • 多向量检索:会介绍什么是多向量,为什么需要多向量检索,如何进行多向量检索。

  • 如何通过GPU加速图索引的多向量检索:这部分内容讲解了如何基于图索引进行多向量检索,如何用GPU来加速图索引搜索。

  • 对未来的思考:主要说明了一些王博士未来研究的一个方向。

  • Q&A

  1. 背景介绍

我们每个人每天都会接触大量的非结构化数据,比如视频、语音、文本等等,根据IDC(国际数据公司)的统计,当前我们世界上所有的数据中有百分之八十是非结构化数据。目前主流的处理非结构化数据的方式是通过深度神经网络把非结构化数据转变为高维的稠密向量,再对这些向量进行分析处理。那么这些跟 ChatGPT 和 new bing 有什么关系呢?先来简单介绍一下这两者的工作方式。

ChatGPT 直接根据用户提供的上文,直接生成回应。那这个是怎么生成的呢?是靠用户给出上文提示,它才能返回下文。但是自然语言的上下文,机器并不能看懂,所以要把自然语言编码为向量的形式,回复时同样是把向量解码为一段文字。

new bing 是先用 bing 搜索找到一些参考,然后使用 GPT 模型进行归纳总结。整体工作流程分为两个部分。首先是检索,就是根据用户的搜索,先找到可靠的依赖信息。之后就是归纳总结,把搜索来的知识(网页信息)归纳为一段精炼的文字。这个过程就类似向量检索,根据 query(查询的向量)把相似向量检索到,然后使用这些向量完成下游任务,例如:归纳总结,推荐。

从两者的工作原理可以看出向量数据的重要性,AI应用离不开向量数据,而只要在搜索过程中涉及到对向量的处理,便离不开向量检索。那么什么是向量检索?

  1. 什么是向量检索?

还记得中学时期计算向量间的距离吗?这其实就是向量检索的本质。还是举个例子帮助我们更好的理解。

上图为一个二维空间,里面存放着由非结构化数据转变成的向量,我们给定一个查询(图中小绿点),即我们要搜索的事物,然后把查询也转变成向量,通过计算向量间的距离,将距离最小的几个向量(连线小红点)作为结果返回,即召回离它最近的一些结果,这就是一个比较简单的向量检索的过程。

  1. 向量检索的分类

向量检索的索引技术可以分为四个流派,分别是Tree(树索引)、Hashing(哈希索引)、Quantization(量化索引)和PG(图索引),四种方法各有各的优势。其中基于图的这种方式在效率和精度上有一个比较好的均衡,所以目前受到了大家更多的关注,也是我们这次分享的重点,后面会具体进行说明。

对另外三种索引方式感兴趣的朋友可以自行上网搜索,或者关注我们整理的相关论文:Unstructured-Data-Community/

本文标签: 大火chatGPTBing