基于PageRank的网页主题相关性算法研究

来源 :光盘技术 | 被引量 : 0次 | 上传用户:frontwave
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为主题网络蜘蛛搜索策略的核心部分,主题相关性判断算法是网络蜘蛛能够围绕设定主题进行聚焦检索的关键。本文针对现有基于链接结构的相关性算法PageRank算法的不足,提出了基于网页主题相关度的改进PageRank算法。理论分析和实验表明,相对于传统的信息采集策略,改进的策略在准确率和召回率方面具有明显的优势。
其他文献
加强和改善企业内部控制状况,建立公司内控体系是目前大部分企业发展过程中亟待解决的问题,信息系统审计作为有效的企业IT治理的手段,过程与一般审计过程一样,分为准备阶段、
将平均取代度为6.5的负电性磺化β-环糊精手性添加剂应用于毛细管电泳对映体拆分的研究中。在不同电极性条件下,考察了背景电解质pH值及磺化β-环糊精浓度对手性拆分的影响,并应用磺化
以建筑废弃物粉煤灰砖块为原料,经破碎、筛分成不同粒径制备粉煤灰砖颗粒(简称FAB),研究了三种不同厂家的粉煤灰砖对水体中磷的去除效率。成分分析结果显示相对于粉煤灰原灰,FA
网络教学研究已成为当今教育领域的一大热点。我们必须把握机遇,迎接挑战,以树立现代教育思想为先导,将信息技术合理有效地应用于语文教育教学改革,推动面向二十一世纪基础教
采用一种新型的样品制备技术-固相微萃取代替传统的顶空进样技术,结合毛细管气相色谱,快速,灵敏地检测出污染进口棕榈油的低浓度的二甲苯。以苯为内标,以大豆油模拟基质制作标准曲
网络时代到来,各行各业的企业开始经受考验。就像下早霜时,有的花朵看着光鲜,却不久就呈败相;而有的却霜重色愈浓,尽显英雄本色。未来,谁将笑傲移动互联江湖?谁主网络品牌沉浮?
随着改革开放的不断深入发展,市场经济在人民群众合法经营下稳步发展,但仍有不法分子在利益的驱使下从事非法经营,给经济市场以重大冲击。那么在新时期下,如何有效地打击非法
慕岩对记者说,他最大的愿望是做一个幸福使者,让百合网成全更多的年轻人,看到他们找到目己的另一半,组建家庭,并过上幸福的生活。
本文针对外延逻辑的局限性,运用格值偶逻辑(LVPL)的理论,提出了内涵逻辑建构及形式化的初步设想,并指出这些设想可能成为设计人工智能机的逻辑基础与数学基础.
本文针对运行将近20年的烷基化碱洗沉降罐内壁表面出现的许多裂纹和鼓包,进行解剖分析,并提供了大量理化检测资料,证明裂纹属于氢诱发开裂。其本质是氢损伤。 In this paper