admin管理员组

文章数量:1530065

搜索引擎原理第三阶段之排名


文章目录

  • 搜索引擎原理第三阶段之排名
  • 前言
  • 一、搜索词处理
    • 1、中文分词
    • 2、去停止词
    • 3、指令处理
    • 4、拼写错误矫正
    • 5、整合搜索触发
    • 6、搜索框提示
  • 二、文件匹配
  • 三、初始子集的选择
  • 四、相关性计算
    • 1、关键词常用程度
    • 2、词频及密度
    • 3、关键词位置及形式
    • 4、关键词距离
    • 5、链接分析及页面权重
  • 五、排名过滤及调整
  • 六、排名显示
  • 七、搜索级存
  • 八、查询及点击日志


前言

搜索引擎工作过程非常复杂,接下来的我用三篇文章简单介绍搜索引擎是怎样实现网页排名的。这里介绍的内容相对于真正的搜索引擎技术来说只是皮毛。不过对大部分SEO人员已经够用了。

搜索引擎的工作过程大体上可以分成三个阶段。

(1)爬行和抓取:搜索引擎蜘蛛通过跟踪搂发现和访问网页,读取页面HTML代码,存入数据库。

(2)预处理:索引程序对抓取来的页面数据进行文字提取、中文分词、索引、倒排索引等处理,以备排名程序调用。

(3)排名:用户输入查询词后,排名程序调用索引库数据,计算相关性,然后按一定格式生成搜索结果页面。


本篇文章主要介绍排名

经过搜索引擎蜘蛛抓取页面.索引程序计算得到倒排索引后,搜索引擎就准备好可以随时处理用户搜索了。用户在搜索框填入查询词后,排名程序调用索引数据,计算排名显示给用户,排名过程是与用户直接互动的。

一、搜索词处理

本文标签: 第三阶段原理搜索引擎