【摘 要】
:
利用Web页面的采集序位和被检索页面的相关信息和主题,使得以主题为分块的网络爬虫算法,能够尽可能多地把整个Web按照主题为依据进行分块整合,可以采用对URL定位信息,提高了
【机 构】
:
安阳师范学院计算机与信息工程学院,安阳师范学院公共计算机教学部
论文部分内容阅读
利用Web页面的采集序位和被检索页面的相关信息和主题,使得以主题为分块的网络爬虫算法,能够尽可能多地把整个Web按照主题为依据进行分块整合,可以采用对URL定位信息,提高了页面的高效检索能力.仿真实验中表明,提出的主题相关爬虫算法能够跨越BBS中URL网页中的断裂带,提高了URL网页的召回率,也不至于因为网页的断裂而中止检索.算法精度分析表明,误判点都在等分线附近徘徊,偏差不大,表明算法精度较高.
其他文献
本文以兰陵县太平村铁矿为例,进行非煤矿井下火灾危险源的安全预评价分析。通过事故树分析法定量地找出导致火灾事故顶上事件的基本事件,为非煤矿井火灾事故的安全预评价的进行
建筑装修行业,也是服务业范畴,和其他服务业一样,为了达到较好的装修成果,作为一名工程技术人员,首先要领会、吃透设计图纸,做好各专项施工方案;在施工过程中,通过精细化管理,严格控制
由《机器人技术与应用》杂志社和立德融创智能机器人技术研究院承办的第四届中国机器人峰会将于2017年5月15~17日在浙江余姚举行。本次大会主题是"智能+时代智胜未来",届时将邀
运用DEA中的基本模型和超效率模型,对1996~2010年间我国高校、科研院所和企业三大R&D执行部门的研发效率进行了评价和比较。结果表明,1996~2010年间高校R&D效率最高,科研机构
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
荷兰兰斯塔德地区是国际多中心城镇群的典范,拥有着丰富的区域协调规划经验。鉴于兰斯塔德的区域规划顶层设计基本架构特征,从公共行政视角分析兰斯塔德的区域规划特征,了解
4月15日,副省长魏增军在全省春季农业生产工作现场会上强调要以乡村振兴战略为统领,统筹推进农业农村各项工作;要立足粮食安全,调优粮食生产结构,划定粮食生产功能区,推动粮食生产
随着人工合成材料的广泛应用,石油化工生产企业的数量和规模日益扩大,生产设备的安装工程越来越多,其施工质量的高低和成本大小的控制,成为石油化工项目开发企业逐渐重视的焦
目的分析小儿快速心律失常心电生理临床异常与诊断价值。方法选取2015年8月—2018年5月在十堰市人民医院诊治的134例快速心律失常患儿,包括房室折返性心动过速(AVRT)患儿(AVR