admin管理员组

文章数量:1536592

2024年6月20日发(作者:)

PageRank算法

PageRank的缩写是PR。PR是Google创始人之一拉里佩奇发明的,用于表示页面

重要性的概念。用最简单的话就是说,反向链接越多的页面就是越重要的页面,因此PR

值也就越高。

的概念

我们可以把互联网理解为由结点及链接组成的有向图,页面就是一个个结点,页面之

间的有向链接传递着页面的重要性。一个链接传递的PR值决定于导入链接所在页面的PR

值,发出链接的页面本身PR值越高,所能传递出去的PR也越高。传递的PR数值也取决

于页面上的导出链接数目。对于给定PR值的页面来说,假设能传递到下级页面100份PR,

页面上有10个导出链接,每个链接能传递10份PR,页面上有20个导出链接的话,每个

链接只能传递5份PR。所以一个页面的PR值取决于导入链接总数,发出链接页面的PR

值,以及发出链接页面上的导出链接数目。

的计算

PR值计算公式是:

PR(A)=(1-d)+d(PR(t

1

)/C(t

1

)+

+(PR(t

n

)/C(t

n

))

A代表页面A。

PR(A)则代表页面A的PR值。

d为阻尼指数。通常认为d=0.85。

t

1

…t

n

代表链接向页面A的页面t

1

到t

n

C代表页面上的导出链接数目。C(t

1

)即为页面t

1

上的导出链接数目。

从概念及计算公式都可以看到,计算PR值必须使用迭代计算。页面A的PR值取决

于链接向A的页面t

1

至t

n

页面的PR值,而t

1

至t

n

页面的PR值又取决于其他页面的PR

值,其中很可能还包含页面A.所以PR需要多次迭代才能得到。计算时先给所有页面设定

一个初始值,经过一定次数的迭代计算后,各个页面的PR值将趋于稳定。研究证明,无论

初始值怎么选取,经过迭代计算的最终PR值不会受到影响。

3. PR的意义

PR是 Google排名算法中的重要因素之一。除了直接影响排名,PR的重要性还体现

在下面几点。

(1)网站收录深度和总页面数。搜索引擎蜘姝爬行时间及数据库的空间都是有限的。

Google希望尽量优先收录重要性高的页面,所以PR值越高的网站就能被收录更多页面,

蜘蛛爬行内页的深度也更高。对大中型网站来说,首页PR值是带动网站收录的重要因素

之一。

(2)更新频率。PR值越高的网站,搜索引擎蜘蛛访问得就越频繁,网站上出现新页面

或旧页面上内容更新时,都能更快速地被收录。由于网站新页面通常都会在现有页面上出

现链接,因此更新频率高也就意味着被发现的速度快。

本文标签: 页面链接收录网站导出