什么是全文搜索引擎？|电子爱好者

admin管理员组
文章数量:1530304

常用的搜索网站，比如百度，谷歌，必应

数据的分类

结构化数据：指具有固定格式或有限长度的数据，如数据库，元数据等

对于结构化数据，我们一般都是可以通过关系型数据库(mysql，oracle等)的 table 的方式存储和搜索，也可以建⽴立索引。通过b-tree等数据结构快速搜索数据

非结构化数据：全文数据，指不定长或无固定格式的数据，如邮件，word文档等

对于非结构化数据，也即对全文数据的搜索主要有两种方法：顺序扫描法，全文搜索法

顺序扫描

按字面意思，我们可以了解它的大概搜索方式，就是按照顺序扫描的方式查找特定的关键字。比如让你在一篇篮球新闻中，找出"科比"这个名字在哪些段落出现过。那你肯定需要从头到尾把文章阅读一遍，然后标记出关键字在哪些地方出现过

这种方法毋庸置疑是最低效的，如果文章很长，有几万字，等你阅读完这篇新闻找到"科比"这个关键字，那得花多少时间

全文搜索

对非结构化数据进行顺序扫描很慢，我们是否可以进行优化？把我们的非结构化数据想办法弄得有一定结构不就行了吗？

将非结构化数据中的一部分信息提取出来，重新组织，使其变得有一定结构，然后对这些有一定结构的数据进行搜索，从而达到搜索相对较快的目的。这种方式就构成了全文搜索的基本思路。这部分从非结构化数据中提取出的然后重新组织的信息，我们称之索引

我们以NBA中国网站为例，假设我们都是篮球爱好者，并且我们是科密，那如何快速找到有关科比的新闻呢？全文搜索的方式就是，将所有新闻中所有的关键字进行提取，比如"科比"，"詹姆斯"，"总冠军"，"MVP"等关键字，然后对这些关键字建立索引，通过索引我们就可以找到对应的该关键词出现的新闻了

什么是全文搜索引擎

根据百度百科中的定义，全文搜索引擎是目前广泛应用的主流搜索引擎。它的工作原理理是计算机索引程序通过扫描文章中的每一个词，对每一个词建立一个索引，指明该词在文章中出现的次数和位置，当用户查询时，检索程序就根据事先建立的索引进行查找，并将查找的结果反馈给用户的

搜索引擎

Lucene
Solr
Elastic search

本文标签：搜索引擎全文

版权声明：本文标题：什么是全文搜索引擎？内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dongtai/1726552400a1075135.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

什么是全文搜索引擎？

更多相关文章

sql server2019安装失败 显示Data Quality Servers、全文和语义提取搜索、数据库引擎服务、SQL Sever复制错误

超好用的搜索引擎推荐

空间搜索引擎：Censys

20款开源搜索引擎介绍与比较

安装sql server 数据库引擎服务,sql server 复制,全文搜索等失败

【Golang星辰图】数据管理利器：Go编程语言中的数据库和搜索引擎综合指南

搜索引擎原理第一阶段之爬行和抓取

Google和必应都无法替代的10大深网搜索引擎

vc中读写excel(数据库找不到搜索引擎对象)

python实现简易搜索引擎

大型网站系统架构演化实例_7.使用NoSQL和搜索引擎

网盘搜索引擎原理大揭秘

如何让搜索引擎搜索到自己的个人博客网站（如何提交网站到各搜索引擎，如百度、必应Bing，以及提交页面URL的地址）

ElasticSearch分布式搜索引擎原理与代码实例讲解

搜索引擎原理第三阶段之排名

百度、谷歌搜索引擎原理

elasticsearch搜索引擎设计方案

大学英语精读第三版（第六册）学习笔记（原文及全文翻译）——5B - Isaac Newton（艾萨克·牛顿）

现代大学英语精读第二版（第四册）学习笔记（原文及全文翻译）——5A - For Want of a Drink（因为缺水）

现代大学英语精读第二版（第四册）学习笔记（原文及全文翻译）——1A - Thinking as a Hobby（把思考作为爱好）

发表评论

推荐文章

2017多校联合第五场1011hdu6095Rikka with Competition（排序）

关于win10，python3.8 安装dlib的问题

Win7 用户文件夹转移方法

amd没有relive选项卡_记录游戏每个瞬间，AMD ReLive图文演示

信捷XD系列PLC程序远程上下载怎么做？

热门文章

用计算机用u盘怎么切换,u盘上的东西换个电脑就不见了怎么办啊

快来查查自己个人隐私数据泄漏没有

JavaScript获取浏览器可视区域的宽高

八六、Linux 服务器+Nginx服务简介

笔记本安装双系统ubuntu时踩的坑——戴尔

amd同步多线程_使用方法及感受_AMD Ryzen Threadripper 1950X_CPUCPU评测-中关村在线

ubuntu五笔输入法安装_打造最强Windows 10微软拼音输入法 + 600万词库下载

计算机工作模式s0 s1,电源选项中S0,S1,S2,S3,S4,S5的含义.docx

【软件创新实验室2021年暑假集训】Java技术培训——Java前置知识学习

使用windows10系统怎么连接同一网络下别人共享的打印机

最新文章

ubuntu18下安装搜狗拼音输入法并配置

Ubuntu22.04 安装搜狗拼音输入法

Ubuntu 安装搜狗拼音输入法

Ubuntu下搜狗拼音输入法打不出汉字的解决方法

搜狗拼音输入法新加词库的基本使用

如何用搜狗拼音输入法输入各种上下标

Linux下安装搜狗拼音输入法（Ubuntu18.04.2 LTS）

卸载搜狗拼音输入法linux,Ubuntu下使用搜狗拼音输入法

搜狗拼音输入法皮肤设置【笔记】

ubuntu下搜狗拼音输入法不见了

搜狗拼音输入法运行时提示系统错误msvcr100.dll丢失的全方位解决方案与深入解析

Android中文输入的新选择——搜狗拼音输入法

ubuntu安装搜狗拼音输入法

ubuntu安装配置搜狗拼音输入法

特殊的搜狗拼音输入法

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

sql server2019安装失败显示Data Quality Servers、全文和语义提取搜索、数据库引擎服务、SQL Sever复制错误

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载