17-6 向量数据库之野望6 - 最全教程|电子爱好者

admin管理员组
文章数量:1547183

· 1. 简介
· 2. 矢量数据库 Vs. 其他数据库
· 3. 矢量数据库 Vs. 矢量索引
· 4. 流行的矢量数据库
∘ 4.1. 矢量数据库如何工作？
· 5. 索引技术
· 6. 精确匹配
∘ 6.1. 平面索引
· 7. 近似匹配
∘ 7.1. Annoy近似最近邻
∘ 7.2. 倒排文件（IVF）索引
∘ 7.3. 随机投影（RP）
∘ 7.4. 乘积量化（PQ）
∘ 7.5. 局部敏感哈希（LSH）
∘ 7.6. 分层可导航小世界（HNSW）
∘ 7.7.基于密度的噪声空间聚类 (DBSCAN)
· 8. 相似性度量：距离度量
∘ 8.1. 如何选择相似性度量
 · 9. 过滤
· 10. 选择矢量数据库
∘ 10.1. 比较参数
·结论

1. 简介

在之前的博客中，我们已经介绍了如何将原始数据嵌入到向量中。为了重复使用嵌入的信息，我们需要存储嵌入，以便可以按需访问它们。为此，我们使用一种特殊的数据库，称为矢量数据库。

对于使用检索增强生成 (RAG) 的大规模应用程序而言，高效存储和检索嵌入（具有 CRUD 操作、元数据过滤和水平扩展等功能）至关重要。ChromaDB、Pinecone 和 Weaviate 等矢量数据库专门从事此工作，可提供快速检索和相似性搜索。

集成正确的矢量数据库对于最大限度地提高 RAG 性能至关重要。考虑到用例的复杂性，经过深思熟虑的选择可确保无缝存储和检索，从而优化检索增强生成模型的功能。

在这篇博客中，我们将深入研究矢量数据库和索引方法。

2. 矢量数据库与其他数据库

3. 矢量数据库与矢量索引

在科技行业，一种普遍的误解认为矢量数据库只是近似最近邻 (ANN) 搜索算法的包装器。

从本质上讲，向量数据库是非结构化数据的综合解决方案。与这种误解相反，它包含了当今结构化/半结构化数据库管理系统中发现的用户友好功能，包括云原生、多租户和可扩展性。它解决了独立向量索引的局限性，解决了可扩展性挑战、集成复杂性以及缺乏实时更新和内置安全措施的问题。随着我们深入研究本教程，这一点变得显而易见。

另一方面，轻量级 ANN 库（如FAISS和ScaNN）可用作构建向量索引的工具。这些库旨在加速多维向量的最近邻搜索。虽然适用于生产系统中的小型数据集，但随着数据集的增长，可扩展性成为一项挑战。

4. 流行的矢量数据库

4.1. 矢量数据库如何工作？

我们知道传统数据库是以行和列的形式存储字符串、数字等标量数据，而向量数据库是针对向量进行操作的，因此优化和查询的方式有很大不同。

在传统数据库中，我们通常会查询数据库中的值与查询完全匹配的行。在向量数据库中，我们应用相似度度量来查找与查询最相似的向量。

矢量数据库使用多种算法的组合，这些算法均参与近似最近邻 (ANN) 搜索。这些算法通过各种索引技术优化搜索。

这些算法被组装成一个管道，可以快速准确地检索查询向量的邻居。由于向量数据库提供近似结果，因此我们考虑的主要权衡是准确性和速度。结果越准确，查询速度就越慢。但是，一个好的系统可以提供超快的搜索和近乎完美的准确性。

以下是矢量数据库的常见流程：

索引：向量数据库使用 PQ、LSH 或 HNSW 等算法对向量进行索引（更多信息见下文）。此步骤将向量映射到可实现更快搜索的数据结构。
查询：向量数据库将索引查询向量与数据集中的索引向量进行比较，以找到最近的邻居（应用该索引使用的相似度度量）
后处理：在某些情况下，矢量数据库从数据集中检索最终的最近邻居，并对其进行后处理以返回最终结果。此步骤可以包括使用不同的相似性度量对最近邻居重新排序。

在以下章节中，我们将更详细地讨论每种算法，并解释它们如何有助于提高矢量数据库的整体性能。

5.索引技术

基于树的方法对于低维数据非常有效，并且提供精确的最近邻搜索。然而，由于“维数灾难”，它们的性能在高维空间中通常会下降。它们还需要大量内存，并且对于大型数据集效率较低，从而导致更长的构建时间和更高的延迟。

量化方法

本文标签：向量最全野望数据库教程

版权声明：本文标题：17-6 向量数据库之野望6 - 最全教程内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dianzi/1727190082a1101342.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

17-6 向量数据库之野望6 - 最全教程

目录

1. 简介

2. 矢量数据库与其他数据库

3. 矢量数据库与矢量索引

4. 流行的矢量数据库

4.1. 矢量数据库如何工作？

5.索引技术

更多相关文章

Docker在windows下使用教程，通过Dockerfile创建镜像容器，以YOLO系列为例

VMware安装+Linux镜像下载+Linux系统安装全教程(图文详细)

ap设置 维盟660g_WayOS|路由器WAN口数设置详细教程

opthbaseconf 中不能启动hbase_Ventoy下载 U盘启动盘制作Ventoy v1.0.25 单文件便携版 附使用教程 下载...

win10 linux 硬盘安装教程,【亲测】Win10下硬盘安装Ubuntu双系统教程(EasyBCD法)

Ubuntu18.04完整新手安装教程和分区设置

自己在家给电脑重装系统Win10教程

个人虚拟化集群搭建教程

Chat with Milvus #11 回顾- 分布式数据库与Milvus分布式

数据库的设计过程

Typora新手教程（简单入门）

不想上班了？死磕这4个AI副业，普通人有电脑就能做！（附详细教程）

java计算机毕业设计家用电器销售网站源码+mysql数据库+系统+lw文档+部署

【Liunx】manjaro双系统安装教程

Python软件测试最全考试面试题，看完让你offer拿到手软！

1.1 《数据库系统概论》之数据库系统概述（数据、数据库、数据库管理系统、数据库系统、数据库的产生和发展）

Java最全八股文（2023最新整理）

[GIS教程] 5.2 空间数据管理 | SDE空间数据引擎

无涯教程-robots协议文件

caxa自动保存的文件在哪里_CAXA CAD教程之软件临时文件的清理

发表评论

推荐文章

第25周-Photoshop-脚本编程简介

服务器光驱装系统教程图解,图文解析win7系统光驱装系统的具体步骤

一招解决windows电脑禁用笔记本自带键盘问题

获取浏览器具体的下载链接地址，通过迅雷下载

MacOS系统无法连接5g wifi的解决办法

热门文章

【kali】安装ibus中文输入法

win10控制面板快捷键_你没玩过的全新版本：Win10这些操作你知多少

Adobe Photoshop运行故障：一键修复msvcp140.dll缺失问题

win10电脑死机后蓝屏怎么解决方法

Mac环境，appium+网易mumu模拟器下，调用手机浏览器打开百度网页DEMO

**记录win10+ubuntu双系统安装过程踩过的坑**

软件测试课堂作业+期末整理【超实用】

软件定义存储的定义与分类

软件测试计划书

【求助】windows摄像头相机黑屏、闪退，错误代码：0xA00F4240、0xA00F4292

最新文章

netsh命令改IP和重置winsock(可解决能上QQ不能上网的问题)

彻底理解 Raft 共识算法及 etcdraft 源码解析

VSCode卸载、重装配置、常用快捷键、插件

联想天逸F41AT2390装server2008R2(win7核心)所遇到的问题

软件测试总结

重新更新VScode配置（CC++）——负责任、手把手教学，亲测有效

MySQL8 中文参考（九十九）

Ubuntu 22.04 系统在 Windows 11 下重装

Win10系统常见问题

.NET 5.0来喽

现代 JavaScript Web 开发秘籍（六）

caxa自动保存的文件在哪里_CAXA CAD教程之软件临时文件的清理

win10 mysql卸载5.5与重新安装5.7.19（最全踩坑）

彻底移除你的 Boot Camp 分区

JAVA入门深究之System类

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

ap设置维盟660g_WayOS|路由器WAN口数设置详细教程

opthbaseconf 中不能启动hbase_Ventoy下载 U盘启动盘制作Ventoy v1.0.25 单文件便携版附使用教程下载...

记录win10+ubuntu双系统安装过程踩过的坑

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载