STAKE中国官方网站

STAKE中国官方网站看法

PageRank算法浅析

宣布时间:2009-08-20

STAKE中国官方网站将对PageRank算法举行叙述。。。。。在这里 ,, ,,,STAKE中国官方网站使用Google网站和其他地方所用的“投票”这一比喻取代原来的“随机冲浪”一词所表达的寄义。。。。。

基于链接的排序算法似乎已普遍应用到种种商业搜索引擎中。。。。。为了让设计出来的网站能够在种种搜索引擎中获得较高排名 ,, ,,,设计者们应该知道这些算法的原理。。。。。Google的乐成意味着PageRank算法值得特别的关注。。。。。PageRank算法是少数几个果真的排序算法之一。。。。。PageRank算法对数学要求很高 ,, ,,,但可以做些简朴的诠释 ,, ,,,以剖析它对网络空间的影响。。。。。搜索引擎的其他排序算法也可能获得与PageRank算法相同的效果 ,, ,,,只管他们没有果真任何与其相关的信息。。。。。HITS算法是另一个基于链接的排序算法 ,, ,,,与PageRank算法形成鲜明比照 ,, ,,,下面的引述归纳综合了链接关于搜索引擎的价值。。。。。 “通太过析网页间的链接关系 ,, ,,,搜索引擎可以判断出一个网页是关于什么的 ,, ,,,也可以判断它是否很主要并值得列入排序列表中去。。。。。”

搜索引擎在排序历程中不思量链接因素 ,, ,,,而使用一个基于要害词词频的公式 ,, ,,,该公式在潜在匹配文档中统计以用户为中心的盘问的要害词的词频。。。。。例如 ,, ,,,检索“动物学”时 ,, ,,,引擎可能返回文档问题、头部和正文或是在URL中泛起该词语的所有网页。。。。。这种排序算法可能无法判断哪些是关于“动物学”的最权威的网页 ,, ,,,而只能判断哪些页面中与“动物学”相关的词语最多。。。。。但PageRank算法却可以通过链接结构 ,, ,,,判别出哪个是最权威的网页——排名位于最前面的谁人 ,, ,,,即拥有最多入链的网页。。。。。这就使得引擎能够返回一个真正的权威网页 ,, ,,,而不是一个类似于“动物学”课程表的网页。。。。。

1998年Google的PageRank算法的设计者和涤讪者Brin和Page将其焦点部分果真。。。。。随后 ,, ,,,在1999年他们和Motwani、Winogriad对其举行了更为详细地叙述。。。。。直到2004年 ,, ,,,该算法仍在使用 ,, ,,,只是作为一个更大规模的算法集的一部分 ,, ,,,该算法集接纳100多个指标来判断网页是否和用户的盘问相关 ,, ,,,并对它们举行排序。。。。。Google官方声明:“虽然我们有许多工程师在为周全提高Google的各个方面而起劲 ,, ,,,但PageRank算法仍然是我们网络搜索工具手艺的基础。。。。。”下面是支持PageRank算法的两个基本理念:

·人链是权衡目的网页主要性的很好的指标。。。。。

·源于主要网页的人链比源于次要网页的人链更能说明该网页的主要性。。。。。

STAKE中国官方网站将对PageRank算法举行叙述。。。。。在这里 ,, ,,,STAKE中国官方网站使用Google网站和其他地方所用的“投票”这一比喻取代原来的“随机冲浪”一词所表达的寄义。。。。。

在一个简朴的基于链接的投票系统中 ,, ,,,可以给每个网页投票 ,, ,,,并允许网页将其一票中分后投给它所链接的网页 ,, ,,,最后统计每个网页的最终票数便可形成一个排序系统。。。。。在这一历程中 ,, ,,,拥有较多人链的网站能获得较高的票数。。。。。然而 ,, ,,,这个简朴的投票系统缺乏以说明问题。。。。。如受欢迎的列表网页的入链许多 ,, ,,,就会获得许多投票 ,, ,,,但该页面只有一票 ,, ,,,可中分给它所链接的目的网页 ,, ,,,这些目的网页中可能含有有价值的内容。。。。。重复这个投票历程 ,, ,,,使得每个网页在前一轮中获得的票数中分给其目的网页。。。。。然而遗憾的是 ,, ,,,当投票系统陷入循环时 ,, ,,,或遇到一个没有出链的网页时 ,, ,,,投票的重复历程便无法举行下去了。。。。。

对此 ,, ,,,Brin和Page提出的解决计划是 ,, ,,,在每次投票时 ,, ,,,网页接纳一部分票数 ,, ,,,而不所有转达给它的链接目的网页。。。。。他们建议保存15%的票数 ,, ,,,这样 ,, ,,,每次投票时 ,, ,,,网页只将其85%的票数中分给其链接目的网页 ,, ,,,而另外15%的票数供系统中所有的URL中分。。。。。运用数学算法可以有用地实现这一投票系统。。。。。重复这样的投票历程 ,, ,,,直至所有网页的票数都趋于稳固 ,, ,,,即在新的一轮投票中 ,, ,,,网页票数的转变很小 ,, ,,,这样 ,, ,,,PageRank算法便降生了。。。。。

有两种PageRank算法和修正算法 ,, ,,,修正后的算法有显着的差别。。。。。实践中 ,, ,,,Google接纳的可能是PageRank修正算法。。。。。种修正算法是由Lifantsel在2000年提出的 ,, ,,,即将PageRank的投票统计建设在网站的基础上 ,, ,,,而不是对单个网页举行投票统计。。。。。第二种修正算法是由Page、Brin、Motwain和Winograd于1999年提出的 ,, ,,,即自动付与一个网站的首页较高的票数。。。。。Google似乎同时接纳了这两种修正算法 ,, ,,,可能是与基于网页的标准算法相团结 ,, ,,,也可能是完全将其取代 ,, ,,,但这些都只是推测。。。。。

tel 24小时免费服务咨询热线:400-080-3010

连忙咨询连忙咨询 联系STAKE中国官方网站联系STAKE中国官方网站
【网站地图】【sitemap】