网络舆情中热点挖掘及文本倾向性分析技术的研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:muspace
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet技术的迅猛发展,互联网已经确立了它第四大媒体的主导地位,成为社会公众发布信息、获取信息和传递信息的主要载体。网络舆情作为社会舆情在网络中的延伸,不仅反映了现实社会中的各类问题,而且会对现实社会产生重大影响。因此,对网络舆情分析技术的研究已成为一项紧迫而又重要的课题。在网络舆情分析中,网络舆情信息获取的快与准、内容分析的确定性、舆情研判的准确性、舆情响应及时性、信息跟踪的及时性等目标的实现是网络舆情分析研究的重中之重,其核心技术即舆情分析引擎。   针对网络舆情分析的实际应用,本文在综合考虑网络舆情的特征和人们的认知规律基础上,进行了舆情热点挖掘、文本倾向性分析两个关键技术的研究,主要工作如下:   1、描述了网络舆情分析中的重点内容,研究了网络舆情分析中网络信息的采集与提取、话题发现与跟踪、网络文本的倾向性分析和多文档自动文摘这四项主要技术的当前发展状况和基本实现过程。   2、探讨了网络舆情热点的表示及特性,研究了舆情的主题关注度计算公式和关联主题的判定方法。详细阐述了基于网络间关系方法的舆情热点挖掘算法,即舆情传播网络中节点与链接的关系可以构成复杂型网络,具有典型的小世界与无标度特征,使用PageRank方法与Hits方法,可以进行页面重要性排序,从而获取网络舆情热点。以维基百科数据为仿真实例,利用维基条目间的结构化语义关系和属性信息,模拟构建舆情网络,验证了上述两种方法在网络舆情热点挖掘中的有效性。   3、在总结文本语义倾向性的基本概念的基础上,讨论了文本倾向性分析的现有技术,并以文本倾向性分析多项技术中的基于语气标注的方法为出发点,提出了改进算法,提高了褒义类、中立类、负面贬义类文本的查全率和查准率。   4、结合基于网络间关系方法的舆情热点挖掘算法和改进的文本倾向性分析算法,设计并实现了一个网络舆情分析系统。
其他文献
智能视频监控领域的行人流量统计技术是指采用基于计算机视觉的方法统计某一时间段内出入某个通道的行人流量。因其高度的适应性和非侵入性,该技术可以自然融入到已广泛使用的
在石油勘探和开发过程中,为了评价储层的好坏,需对井下取得的储层岩石样品进行孔隙结构分析,其中储层结构分析所需的主要参数是由毛管压力曲线确定的。所以,岩石毛管压力曲线
在网络信息时代,随着通信技术的不断发展,即时通信得到了广泛应用,产生了巨大的短消息数据,短消息数据中蕴藏了大量有用信息资源,如何对短消息数据进行采集、存储、分析和挖掘,对于
随着计算机技术,特别是Internet的迅速发展,可共享的资源越来越多,各种Web数据库中已经存放了涵盖各个领域的大量有价值的信息,成为人们获取信息的主要渠道。然而由于Web数据库所
近年期货公司发展迅猛,势头强劲,期货公司用于服务个人用户和其他实体企业的系统平台成为整个期货行业的迫切需求,本项目正是在此背景下研发的。本文的目标是为期货公司开发
监控环境的多样性和复杂性导致视频分析算法的鲁棒性较差,对于复杂的算法,在嵌入式环境下也不能满足实时性需求。为了使得视频分析算法适合应用于嵌入式环境,本文主要研究嵌
无线传感器网络是一个热点的研究领域。随机分布的大量传感器节点,以无线的方式构成网络,感知各种物理参数并将数据汇聚到数据管理中心。为了满足远程管理的需要,数据管理中
随着互联网技术的发展和信息量的迅速增长,人们迫切需要一种准确、高效的信息获取方式。从搜索引擎到智能交互式问答系统,信息的获取方式越来越接近于自然交互。一方面因为海
随着数字图像信息的爆炸式增长,用户对多媒体搜索的需求也越来越强烈。传统的图像检索技术,是利用图像周围的文本信息对数据库进行检索,但由于视觉特征与文本特征之间存在着
视频拼接技术是指将多个摄像设备采集到的小视角视频图像拼接成一路具有大视野的视频图像。视频拼接技术被应用于军事国防、安全监控等领域,对于降低风险和提高安全性具有重