基于关键词相关性的有害信息爬虫系统研究

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:gandianci20
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的互联网有害信息发现方法是依据Google、百度等元搜索工具,用户输入关键词进行检索,然后对获取的结果进行研判,但是用户经常无法准确地描述所需的资料,给出的关键词不准确,搜索结果常有用户不关心的垃圾数据,而一些有用的数据却不能列出。文中探讨了一种基于元搜索,引入关键词扩充技术的爬虫方法。该方法在网页抓取,用户检索的时候能扩充输入的关键词,从而提高搜索覆盖率和精度。该方法投入小,效果好,还可通过扩展应用到其他领域。
其他文献
目的探讨单纯子宫腺肌病病灶切除术后联合促性腺激素在子宫腺肌病患者临床治疗中的应用效果。方法 94例子宫腺肌病患者,按随机数字表法分为对照组与观察组,每组47例。对照组
孕产妇病死率是衡量一个国家或地区医疗水平的重要指标,同时也被世界卫生组织(World Health Organization,WHO)纳入干预的范围。2018年中国孕产妇病死率为18.3/10万,已提前实
目的探讨硼替佐米皮下注射治疗多发性骨髓瘤(MM)的疗效及不良反应,为优化MM的治疗提供依据。方法 26例采用硼替佐米+地塞米松方案(BD方案)治疗的MM患者,随机分为静推组(14例)和皮下
云计算技术已经越来越得到人们的关注和接受。在保证用户性能的前提下,怎样有效提高服务器资源的利用率,同时又能节约能源已成为一个热门话题。针对云计算环境下虚拟机初次部署
目的分析西米替丁联合喜炎平治疗小儿轮状病毒肠炎的临床效果。方法 200例小儿轮状病毒肠炎患儿,随机分为对照组和观察组,各100例。对照组采取喜炎平进行治疗,观察组采取西米