STAKE中国官方网站

STAKE中国官方网站看法

对搜索效果排序的两种算法

宣布时间:2009-12-03

能否把与用户检索需求最相关的高质量文档纳入效果排序的前面是权衡搜索引擎性能的要害手艺之一。。。。 。

任何一个搜索引擎的目的就是更快速的响应用户的搜索,,,,,,,,把知足用户需求的搜索效果反响给搜索用户。。。。 。能否把与用户检索需求最相关的高质量文档纳入效果排序的前面是权衡搜索引擎性能的要害手艺之一。。。。 。Google最乐成的地方在于使用PageRank对Google排名效果排序,,,,,,,,让好的效果排在前面,,,,,,,,从而提高了检索质量。。。。 。

现在,,,,,,,,差别的搜索引擎使用了差别的相关度排序要领。。。。 。较量盛行的有两类:词频统计法,,,,,,,,即网页文档中泛起盘问词的频率越高,,,,,,,,其排序就越靠前;;;;;;超链接剖析法,,,,,,,,即一个网页被链接的次数越多并且链接的站点越权威就说明此网页的质量越高。。。。 。别的,,,,,,,,尚有点击率法,,,,,,,,即网页被点击的次数越多,,,,,,,,相关度越高;;;;;;付费竞价法,,,,,,,,以网站付费的几多来决议排序前后。。。。 。

1.词频统计法

词频统计法也就是向量空间模子接纳的相似度盘算要领。。。。 。许多搜索引擎都以索引项的词频和位置作为相关度的判断标准,,,,,,,,接纳前述的词频加权要领来盘算相关度。。。。 。一个词在网页文档中泛起的频率越高,,,,,,,,它代表该文档主题的水平就越大,,,,,,,,其作为索引项的准确性也就越高,,,,,,,,权值就越大。。。。 。在与盘问词匹配时,,,,,,,,它所代表的文档与盘问请求的相关度就越高。。。。 。除词频外,,,,,,,,一个词在文档中的位置也对索引器选词和盘算词的权值爆发影响。。。。 。例如在网页title标签、链点标签、Meta keyword标签、Meta description标签中选词并按词频盘算权值时,,,,,,,,或索引项泛起在网页问题、文章前几段、段首等位置时,,,,,,,,其权值会加大。。。。 。虽然大大都搜索引擎都以词频和词的位置来盘算相关度,,,,,,,,但在细节上又各有差别。。。。 。在盘算网页的相关度时,,,,,,,,其中各词的关系和词间的相对位置也是影响因素。。。。 。网页中各词的相互距离越近则效果排序越靠前。。。。 。以词频和词位置盘算相关度的要领是较为客观准确的,,,,,,,,它是应用最为普遍也是最成熟的要领,,,,,,,,各大搜索引擎迄今仍以它作为盘算相关度的基本要领。。。。 。但它较易为人使用来实现不良竞争,,,,,,,,容易地把其网页设计修改成“含有要害词的网页”,,,,,,,,从而在搜索引擎效果中排在前面。。。。 。这使搜索引擎效果的客观性和准确性受到损害,,,,,,,,检索的查准率受到影响。。。。 。各大搜索引擎于是实验了种种反使用手艺和处分步伐,,,,,,,,特殊是在网页自己之外另辟蹊径,,,,,,,,寻找相关度的判断标准,,,,,,,,其中最主要的就是下面所述的链接剖析法。。。。 。

2.链接剖析法

面临网络这个新的情形,,,,,,,,必需使用新的排序手艺才华抵达较好的检索效果。。。。 。由此,,,,,,,,基于超链剖析的种种排序算法被搜索引擎界提出。。。。 。绝大部分超链剖析算法都有配合的起点:更多地被其他页面链接的页面是质量更好的页面,,,,,,,,并且从更主要的页面出发的链接有更大的权重。。。。 。最著名的链接剖析法是Brin.s和Page.L于1998年提出并应用到Google搜索引擎中的PageRank,,,,,,,,以及IBM用于CLEVER搜索引擎的HITS(Hypertext InducedTopic Selection)。。。。 。

tel 24小时免费服务咨询热线:400-080-3010

连忙咨询连忙咨询 联系STAKE中国官方网站联系STAKE中国官方网站
【网站地图】【sitemap】