admin管理员组文章数量:1531793
2024年5月21日发(作者:)
搜索引擎:
所谓搜索引擎,就是根据用户需求与一定算法,运用特定策略从 互联网检索出
制定信息反馈给用户的一门检索技术。搜索弓摩依托于 多种技术,如网络爬虫技术、
检索排序技术、网页处理技术、大数据 处理技术、自然语言处理技术等”为信息检
索用户提供快速、高相关 性的信息服务。搜索引擎技术的核心模块一般包括爬虫、
索引、检索 和排序等,同时可添加其他一系列辅助模块,以为用户创造更好的网 络
使用环境。
搜索引擎工作原理:
搜索引擎的工作原理总共有四步:
第一步:爬行,搜索弓摩是通过一种特定规律的软件跟踪网页的 链接,从一个
链接爬到另外一个链
接,所以称为爬行。
第二步:抓取存储,搜索引擎是通过蜘蛛跟踪链接爬行到网页, 并将爬行的数
据存入原始页面数据库。
第三步:预处理,搜索引擎将蜘蛛抓取回来的页面,进行各种步 骤的预处理。
第四步:排名,用户在搜索框输入关键词后,排名程序调用索引 库数据,计算排名
显示给用户,排名过程与用户直接互动的。
不同的搜索引擎查出来的结果是根据引擎内部资料所决定的。比 如:某一种搜
索引擎没有这种资料,您就查询不到结果。
定义
—个搜索引擎由搜索器、索引器、检索器和用户接四个部分组成。 搜索器的功
能是在互联网中漫游,发现和搜集信息。索引器的功能是 理解搜索器所搜索的信息,
从中抽取出索引项,用于表示文档以及生 成文档库的索引表。
检索器的功能是根据用户的查询在索引库中快速检出文档,进行 文档与查询的
相关度评价,对将要输出的结果进行排序,并实现某种 用户相关性反馈机制。用户
接口的作用是输入用户查询、显示查询结 果、提供用户相关性反馈机制。
起源
所有搜索引擎的祖先,是1990年由Montreal的McGill University 三名学生
(Alan Emtage、Peter
Deutsch、Bill Wheelan )发明的 Archie ( Archie FAQ )
o
Alan Emtage等想到
了开发一个可以用文件名查找文件的系统,于是便有 了 Archie
o
Archie是第一个自动索弓I互联网上匿名FTP网站文件的程序, 但它还不是真
正的搜索引擎。Archie是一个可搜索的FTP文件名列 表,用户必须输入精确的文件
名搜索,然后Archie会告诉用户哪一 个FTP地址可以下载该文件。
由于Archie深受欢迎,受其启发‘Nevada System Computing Services 大学
于 1993 年开发了一个 Gopher ( Gopher FAQ )搜索 工具 Veronica ( Veronica
FAQ )。Jughead 是后来另一个 Gopher 搜索工具。
版权声明:本文标题:搜索引擎工作原理 内容由热心网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:https://m.elefans.com/dianzi/1716278430a495459.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论