链接分析算法之HillTop算法
接下来我们分析“专家页面”P在接收到查询时,是怎样将分值传递给与其有链接关系的“目标页面”的。假设系统接收到的查询请求为“奥巴马”,在接收到查询后,系统首先根据上述章节所述,找出“专家页面”并给予分值,而网页P是作为“专家页面”其中一个页面,并获得了相应的分值S,我们重点关注分值传播步骤。 对于查询“奥巴马”来说,网页P中包含这个查询词的“关键片段”集合为:{奥巴马, 奥巴马访问中国 ,标题:奥巴马访问中国},如上所述,这三个“关键片段”都能够支配页面,所以网页P传递给的分值为S*3。而对于目标页面来说,这三个“关键片段”中只有{ 奥巴马访问中国 ,标题:奥巴马访问中国}这两个能够支配目标页面,所以网页P传递给的分值为S*2。 对于包含多个查询词的用户请求,则每个查询词单独如上计算,将多个查询词的传递分值累加即可。 5. Hilltop在应用中不足 专家页面的搜索和确定对算法起关键作用,专家页面的质量决定了算法的准确性;而专家页面的质量和公平性在一定程度上难以保证。Hiltop忽略了大多数非专家页面的影响。 在Hilltop的原型系统中,专家页面只占到整个页面的1.79%,不能全面反映民意。 (编辑:西安站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |