互联网主题信息调研与拓展系统的设计与实现

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:re_man
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网大数据时代,人们的生活已经离不开互联网,都难免留下痕迹,这些痕迹淹没在庞大的数据海洋中,看似无从循迹。事实上,依靠科技的力量,只要方法得当,我们依然可以从海量数据中寻找到需要的信息。本课题来源于作者工作实践,主要解决两类问题,一是对于给定的主题信息,通过互联网,尽可能发现和收集与其相关的数据,搭建数据库予以保存;二是对于可疑线索,一方面同样通过互联网搜索尽可能多的相关信息,另一方面和已知特定目标的信息库进行比对,力求发现可疑线索最终指向的幕后目标。本课题研究的核心内容包括三部分:一是设计一种高精度聚焦网络爬虫程序,根据不同线索类型提取数据特征,自动化分析数据源,尽可能排除无关数据的干扰,从海量网络资源中获取与可疑线索相关的敏感信息;二是针对可疑目标的线索扩展技术。该部分需紧密结合使用部门的工作实际,数据类型和维度标准由业务部门指定并可灵活添加、修改,并采用基于Whois、Nslookup、搜索引擎及网络爬虫等数据,针对嫌疑线索进行自动化智能扩展;三是基于数据挖掘的多维信息分类与关联分析技术。重点研究了如何挖掘海量数据之间蕴含的关联规则,并通过关联规则从海量数据中提取有用信息,发现新的线索成果。
其他文献
随着我国经济的发展和居民生活水平的提高,建筑工程的发展也迎来了日益广阔的空间。建筑工程的施工质量将会对其使用周期以及人们的生命财产安全带来直接的影响。因此,在建筑施
本文针对徐州某小区建筑项目的具体工程地质条件,确定了基坑支护设计参数,并对具体的施工要求进行了介绍。
食物过敏是食品安全的重要问题之一,且大部分食物过敏是在胃肠道消化过程中引发的。食物过敏原蛋白经胃肠道消化后形成肽段,其中部分消化肽在通过肠上皮组织屏障进入肠道黏膜
高等职业教育是中国高等教育的重要组成部分,而高等职业教育中的教育类专业更是中国高等职业教育中的一大特色。2011年,教育部把高等职业教育的人才培养目标由过去的"培养高
为探明冻结方式对草鱼肉挥发性风味物质的影响,以草鱼背肉和红肉为研究对象,采用新型材料MonoTrap作为固相萃取整体捕集剂,通过电子鼻和气相色谱-质谱联用技术对经过速冻、酒
当前,随着经济的快速发展,建设工程规模以及数量在不断扩大和增加。建设项目的开展往往会受到场地环境的限制,不利于塔吊布置。尤其是在深基坑施工过程中,在基坑周边布置塔吊更是