在线网络挖掘系统的研究与实现

来源 :南京航空航天大学 | 被引量 : 1次 | 上传用户:qianwenlong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在线网络是具有亚社会性质的网络,其建立在电子计算机、远程通讯技术基础上,通过信息交互系统连接不同主体,然后彼此之间信息共享、互换与交流。由于互联网具有开放性、隐蔽性等特点,很多人借此抒发自己真实的想法,互联网逐渐成为舆论的汇集地。网络中的舆论即包含积极的、进取的、有益的信息,也包含很多反动的、暴力的、色情的信息。网络中不同的个体扮演的角色也不尽相同。一些别有用心的个人和组织,通过发布一些虚假的、负面的谣言混淆视听,这些谣言通过互联网不断的放大、渲染。如果不加以控制和疏导,可能会引发深层次的社会问题。本文主要工作是在深入分析与挖掘在线网络用户和群体行为特性并基于本课题组的最近几年的研究理论基础上设计与实现了一个在线网络数据挖掘系统,其主要内容和贡献如下:一、对网页信息抽取技术的研究与分析,设计与实现了网页智能抓取和网页数据抽取、整理功能模块。二、设计和实现了支持多种用户交互模式的用户视图模块和用户交互网络统计分析模块。三、设计与实现了网络数据挖掘与分析模块,其功能包括:犯罪概率更新、异常用户推理、潜在组织划分等功能。
其他文献
可比较语料库是自然语言处理领域中非常有价值的资源,但是,目前并没有足够规模的可利用的公共可比较语料库,构建大规模中英文可比较语料库有理论价值和应用价值。本文提出了
随着语义Web的迅速发展,本体的数量也不断增加。本体异构是阻碍本体重用和共享的障碍,而解决本体异构最有效的方法是本体映射技术。因此,本文将着重对此进行研究。首先,论文
数据降维是模式识别领域中一个重要环节,其基本任务是从高维数据中提取稳定有效的特征以满足后续学习任务。典型相关分析作为一种经典的多视图数据降维方法,其目的是研究同一对
基于多图谱的标签融合技术作为一项新兴的研究方法,在模式识别和医学图像分割领域受到越来越多的关注,它利用了更多的已有专家先验知识,通过图谱图像的指导将图谱标签传播到待分
云计算是信息技术(IT)行业的一个新兴领域,由于它具有高性能、高可用性、低成本等特点。信息泄露、缺乏适当的安全控制策略和信息哨兵的弱点是这些云计算公司的主要的缺点。因此
在计算机信息通信行业迅猛发展的今天,网上信息量以带宽的指数级增长,因此网络带宽和数据通信之间的矛盾将在未来很长一段时期内作为社会发展的主要矛盾之一。同时,在其他一些特
在最近几年社会化应用和移动智能端快速普及的浪潮中,海量、实时的由亿万用户提供的社会化数据呈现出一种爆炸式的增长。数十亿用户依托各类新的社会化服务来实现网络交友、
人脸是人类一出生就具有的,可以作为人类在网络时代的信息交互的一种凭证,它具有独立性、唯一性与不被复制性,而且还具有各种立体信息,包括视觉和多维度识别信息。因此人脸识
近年来,随着P2P技术的不断发展,出现了大量基于该技术的应用系统。同时这些应用的出现也极大地促进了P2P网络的发展。文件存储作为P2P网络的一个主要应用,成为对等网络技术发
随着生活水平的提高,人们对自身的健康状况给予了越来越多的关注。但因时间地点的限制,人们无法时刻了解自己的健康状况。移动健康这个概念因此而产生,因其能够摆脱时间和地域的