admin管理员组

文章数量:1530304

第六章 搜索引擎

搜索引擎(search engine)就是网络信息资源检索与利用的核心工具
目录:

4.1 搜索引擎原理与分类

搜索引擎是一个提供信息“检索”服务的网站,它使用某些程序把因特网上的所有信息归类以帮助人们在茫茫网海中搜寻有信息归类以帮助人们在茫茫网海中搜寻到所需要的信息。
搜索引擎常常是用户利用网上资源的第一途径。

4.1.1 工作原理

从互联网上抓取网页→建立索引数据库→在索引数据库中搜索排序。
大多数搜索引擎并不真正搜索互联网,它搜索的实际上是预先整理好的网页索引数据库。
搜索引擎也不能真正理解网页上的内容,它只能机械的匹配网页上的文字

4.1.2 工作特点

搜索引擎与其它文献数据库相比,其中一个最重要的不同是搜索引擎通过计算机自动完成信息资源的发现、标引和入库。
搜索引擎普遍存在以下缺点:
(1)搜索结果中广告、垃圾网站和死链比较多。
(2)没有统一的网络信息分类标准,令网络用和死链比较多。
(2)没有统一的网络信息分类标准,令网络用户无所适从。
(3)对资源不具有选择和价值判断的能力,排序结果不理想,难以搜索动态网页,查全率下降。
(4)与学术型数据库接口少,搜索出的有效学术信息大部分只能浏览目录信息,不能下载全文。

本文标签: 第六章第三版信息检索搜索引擎