admin管理员组文章数量:1536592
2024年6月20日发(作者:)
PageRank算法
PageRank的缩写是PR。PR是Google创始人之一拉里佩奇发明的,用于表示页面
重要性的概念。用最简单的话就是说,反向链接越多的页面就是越重要的页面,因此PR
值也就越高。
的概念
我们可以把互联网理解为由结点及链接组成的有向图,页面就是一个个结点,页面之
间的有向链接传递着页面的重要性。一个链接传递的PR值决定于导入链接所在页面的PR
值,发出链接的页面本身PR值越高,所能传递出去的PR也越高。传递的PR数值也取决
于页面上的导出链接数目。对于给定PR值的页面来说,假设能传递到下级页面100份PR,
页面上有10个导出链接,每个链接能传递10份PR,页面上有20个导出链接的话,每个
链接只能传递5份PR。所以一个页面的PR值取决于导入链接总数,发出链接页面的PR
值,以及发出链接页面上的导出链接数目。
的计算
PR值计算公式是:
PR(A)=(1-d)+d(PR(t
1
)/C(t
1
)+
…
+(PR(t
n
)/C(t
n
))
A代表页面A。
PR(A)则代表页面A的PR值。
d为阻尼指数。通常认为d=0.85。
t
1
…t
n
代表链接向页面A的页面t
1
到t
n
。
C代表页面上的导出链接数目。C(t
1
)即为页面t
1
上的导出链接数目。
从概念及计算公式都可以看到,计算PR值必须使用迭代计算。页面A的PR值取决
于链接向A的页面t
1
至t
n
页面的PR值,而t
1
至t
n
页面的PR值又取决于其他页面的PR
值,其中很可能还包含页面A.所以PR需要多次迭代才能得到。计算时先给所有页面设定
一个初始值,经过一定次数的迭代计算后,各个页面的PR值将趋于稳定。研究证明,无论
初始值怎么选取,经过迭代计算的最终PR值不会受到影响。
3. PR的意义
PR是 Google排名算法中的重要因素之一。除了直接影响排名,PR的重要性还体现
在下面几点。
(1)网站收录深度和总页面数。搜索引擎蜘姝爬行时间及数据库的空间都是有限的。
Google希望尽量优先收录重要性高的页面,所以PR值越高的网站就能被收录更多页面,
蜘蛛爬行内页的深度也更高。对大中型网站来说,首页PR值是带动网站收录的重要因素
之一。
(2)更新频率。PR值越高的网站,搜索引擎蜘蛛访问得就越频繁,网站上出现新页面
或旧页面上内容更新时,都能更快速地被收录。由于网站新页面通常都会在现有页面上出
现链接,因此更新频率高也就意味着被发现的速度快。
版权声明:本文标题:PR算法 内容由热心网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:https://m.elefans.com/xitong/1718821087a729480.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论