STAKE中国官方网站

STAKE中国官方网站看法

HITS搜索引擎算法的研究

宣布时间:2009-01-20

HITS算法是Web结构挖掘中最具有权威性和使用最普遍的算法。。。。。。 。。其基本头脑是使用页面之间的引用链来挖掘隐含在其中的有用信息(如权威性),, ,,,,具有盘算简朴且效率高的特点。。。。。。 。。

HITS算法是Web结构挖掘中最具有权威性和使用最普遍的算法。。。。。。 。。其基本头脑是使用页面之间的引用链来挖掘隐含在其中的有用信息(如权威性),, ,,,,具有盘算简朴且效率高的特点。。。。。。 。。HITS算法通过两个评价权值——内容权威度(Authority)和链接权威度(Hub)来对网页质量举行评估。。。。。。 。。内容权威度与网页自身直接提供内容信息的质量相关,, ,,,,被越多网页所引用的网页,, ,,,,其内容权威度越高;; ;;;;;链接权威度与网页提供的超链接页面的质量相关,, ,,,,引用越多高质量页面的网页,, ,,,,其链接权威度越高。。。。。。 。。HITS算法以为对每一个网页应该将其内容权威度和链接权威度脱离来思量,, ,,,,在对网页内容权威度做出评价的基础上再对页面的链接权威度举行评价,, ,,,,然后给出该页面的综合评价。。。。。。 。。

然而HITS算法也有其显着的缺乏。。。。。。 。。首先,, ,,,,它完全将网页的内容或文本扫除在外,, ,,,,仅思量网页之间的链接结构来剖析页面的权威性,, ,,,,这与现实网络中的权威页面相比,, ,,,,其不科学性显而易见。。。。。。 。。

由于权威页面必需针对某一主题或要害词而言。。。。。。 。。某一页面临一确定主题的具有较大权威性的页面并不料味在其他与其无关的主题方面同样具有权威性。。。。。。 。。其次一个页面临另一页面的引用有多种情形,, ,,,,其中包括了一页面临另一页面的认可,, ,,,,但除此之外也有其他目的链接,, ,,,,如为了导航或为了付费广告。。。。。。 。。而HITS算法在实现历程中均没有思量以上情形.导致了效果与目的的差别。。。。。。 。。就HITS算法的头脑与实现历程做了详尽的研究与归纳综合。。。。。。 。。

针对前面种缺乏,, ,,,,就有相关的学者提出了一种使用超链文字及其周围文字与要害字相匹配而盘算超链权值的要领,, ,,,,并引入系数对周围文字和超链文字举行权值的相对控制,, ,,,,很好地将页面文本信息引入到HITS算法,, ,,,,提高了算法的可靠性,, ,,,,并在现实中取得了很好的效果。。。。。。 。。对HITS算法的第二个缺乏,, ,,,,即非正常目的的引用.在HITS算法看来,, ,,,,也误以为是正常引用,, ,,,,导致现实效果与目的的收支。。。。。。 。。

厥后,, ,,,,经由一直的刷新。。。。。。 。。HITS算法又引入了时间参数,, ,,,,即使用对一链接引用的时问是非来评价是否为正常引用。。。。。。 。。由于非正常链接其引用时问一定不会很长(如交流链接、广告链接),, ,,,,相反,, ,,,,若是一页面临另一页面的链接时间较长,, ,,,,则一定反应此页面就是用户的寻找页面。。。。。。 。。即目的页面或至少是正常引用。。。。。。 。。

若是设准时间阀值,, ,,,,则可以将非正常引用的链接在HITS算法的实现历程中筛选出来。。。。。。 。。如设定会见时间少于1分钟者为非正常引用。。。。。。 。。另外可结构时间会见函数,, ,,,,控制权威页面的相对巨细。。。。。。 。。如随会见时间的增大而其权威性也逐渐非线性增大.这样可为HITS算法的权威页面提供更合理、更科学的诠释。。。。。。 。。

链接稳固性,, ,,,,在外部链接的建设中,, ,,,,占有很是主要的职位。。。。。。 。。STAKE中国官方网站在SEO链接的稳固性 URL:http://www.seo.com.cn/seo-stability.html一文中,, ,,,,就强调过链接越稳固,, ,,,,对排名的资助就越大。。。。。。 。。

tel 24小时免费服务咨询热线:400-080-3010

连忙咨询连忙咨询 联系STAKE中国官方网站联系STAKE中国官方网站
【网站地图】【sitemap】