论文部分内容阅读
在线网络是具有亚社会性质的网络,其建立在电子计算机、远程通讯技术基础上,通过信息交互系统连接不同主体,然后彼此之间信息共享、互换与交流。由于互联网具有开放性、隐蔽性等特点,很多人借此抒发自己真实的想法,互联网逐渐成为舆论的汇集地。网络中的舆论即包含积极的、进取的、有益的信息,也包含很多反动的、暴力的、色情的信息。网络中不同的个体扮演的角色也不尽相同。一些别有用心的个人和组织,通过发布一些虚假的、负面的谣言混淆视听,这些谣言通过互联网不断的放大、渲染。如果不加以控制和疏导,可能会引发深层次的社会问题。本文主要工作是在深入分析与挖掘在线网络用户和群体行为特性并基于本课题组的最近几年的研究理论基础上设计与实现了一个在线网络数据挖掘系统,其主要内容和贡献如下:一、对网页信息抽取技术的研究与分析,设计与实现了网页智能抓取和网页数据抽取、整理功能模块。二、设计和实现了支持多种用户交互模式的用户视图模块和用户交互网络统计分析模块。三、设计与实现了网络数据挖掘与分析模块,其功能包括:犯罪概率更新、异常用户推理、潜在组织划分等功能。