利用超链接信息改进网页爬行器的搜索策略

来源 :吉林大学学报(信息科学版) | 被引量 : 0次 | 上传用户:epippo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网页爬行器在Web空间中爬行时,要面对如下两个问题:1)由于Internet上的信息量十分巨大,网络搜索引擎不可能包含整个Web网页;2)受到硬件资源的限制,它所能存储的网页是有限的.爬行器如果按照传统的宽度优先搜索策略在Web空间中爬行,它对所有的网页都采取一视同仁的态度,这样爬行的结果就导致了它所爬行回来的网页质量不高.为此,给出了利用超链接信息改进网页爬行器搜索策略的算法.该算法充分考虑了网页之间的超链接信息,克服了传统的宽度优先搜索策略的盲目性爬行.实验表明,利用该算法爬行得到的网页与某一特定主题
其他文献
"审美—逻辑"教学模式是一种将德育与美育有机结合的全新教学思想理论和操作模式,其最突出的特点是不仅强调教学要素的外在形式美,更追求教学要素之间的内在逻辑美,是形式美和
为缩短训练飞行员的周期,提高训练飞行员的质量,设计并实现了一种仪表飞行仿真系统.对系统中使用的各种技术进行了深入的研究,包括应用系数构造法实现空气动力学模型,采用基
鉴定了两种纽带科线虫:松拟盘旋线虫及双宫螺旋线虫。松拟盘旋线虫为我国新记录种,分离自上海植物园细辛根围。双宫螺旋线虫为上海常见的螺旋线虫之一,根据观察认为双螺旋线虫的
对抗赤霉病基因库进行四轮抗赤霉病性状表型轮回选择,显著降低了基因库群体的平均单穗发病率,病小穗数和病情指数。C4群体中不育株和可育株的穗发病率,病小穗数和病情指数分别比C0群
苗期人工接种,对转化CMV-cp基因的番茄品种8805R1-R4代进行接种CMV病毒试验。结果表明:黄瓜花叶病毒外壳蛋白基因在番茄中的表达,对抑制CMV病毒症状的表现及延迟其发展均起到一定作用。8805R3代对CMV的抗性明显
分析了6种吨粮种植模式经济投入和产出的稻田梯度差异;揭示了在现有耕作和技术水平条件下,各类吨粮种植模式全年粮食单位面积(666.67m^2)产量从中高产水平上长到吨粮水平时,经济效益递增,超过
本研究于1989 ̄1994年对45个籼稻品种(包括杂交籼稻组合和制种亲本品种)进行的观察结果表明,籼稻一生有两类葫芦叶特征出现。第一类出现在移栽稻的分蘖期,由植伤引起,N叶期移栽,第(N+2)叶与第(N+3)叶为第一
1990年以来,对为害崇明中草药附的北方根结线虫进行了形态学鉴定描述;对其年发生世代、发生量、寄主及在不同茬口为害情况和田间防治等方面进行了研究。结果表明,该线虫在附子一个生
针对目前没有公认的模型可靠地描述用户参数的问题,提出了在MPEG-21(Moving Picture Experts Group 21)下基于统计矢量矩阵和交互式管理相结合的方法,并通过数字项调节和代理的协
腥黑粉菌是禾本科植物的重要病原菌。利用美国进口的六月禾种了中截获的腥黑粉菌为材料,通过形态观察和萌发生理研究,明确了六月禾腥黑粉菌的形态特征、各冬孢子萌发特性,并将该