基于链接分块的相关链接提取方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:yp0202
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
每个网页都包含了大量的超链接,其中既包含了相关链接,也包含了大量噪声链接。提出了一种基于链接分块的相关链接提取方法。首先,将网页按照HTML语言〈table〉签将网页分成许多的块,从块中提取链接。形成若干链接块;其次,根据相关链接的成块出现,相关链接文字与其所在网页标题含相同词等特征,应用规则与统计相结合的方法从所有链接块中提取相关链接块。相关链接提取方法测试结果,精确率在85%以上,召回率在70%,左右,表明该方法很有效。
其他文献
市场上常规的逻辑分析仪可移植性差、价格昂贵,使得这类仪器不能普遍应用于教学和科研实践中与各类硬件开发装置配合实现同步检测.介绍了一种嵌入式逻辑分析仪,该装置可嵌入
针对模糊交货期Flow-shop调度问题的特点,论文提出用微粒群这种具有快速收敛、全局性能好的迭代优化算法进行求解,并使用惩罚函数、增加数据记忆库和自适应变异机制等方法对微
论文研究了面向体育视频的运动目标跟踪技术,提出了一种最优化的混合跟踪方法。首先,采用粒子滤波算法来预测运动目标的初略位置,通过比较预测位置上的目标同目标模型之间的相似度,当相似度小于一定的阀值时,认为目标运动模型发生了根本变化,需要启用新的运动模型;当相似度大于一定的阀值时则认为目标运动模型没有发生大的变化,不需要启用新的运动模型,通过这种方式找到目标的最优化运动模型。最后将最优化的运动模型用于基
网络游戏中分布的玩家利用多播机制将游戏状态的更新通知给同一兴趣域中的其它玩家,从而维护玩家之间游戏状态的一致性。研究了目前提出的几种典型的基于结构化P2P覆盖网络的
面向高等院校师生开发了一套应用文计算机辅助写作(CAW,Computer—Aided Writing)系统。该系统对高校师生常用的各种典型应用文从文体和用户的角度给出了两种分类,制作了写作模板
在支持具有不同优先级和不同QoS需求的多业务网络中,抢占是带宽分配和管理的有效策略,但同时也对网络造成了振荡.基于普通的LSP路由方案,提出了一个动态的LSP抢占算法--Min_P
文中提出一种基于局部复杂度视频序列中显著点的提取方法。首先,将视觉认知中的注意力机制引入视频处理,通过计算空域像素局部复杂度来提取图像显著点。其次,利用均值漂移聚类方法在时域中对显著点进行聚类,从而去除了分散的噪声点,它能自动确定类别数并具有严格的收敛性,该方法减少了运算量,提高了运算速度。实验证明,该方法提取的结果与人的视觉感知系统具有较好的一致性。