【摘 要】
:
随着互联网的快速发展,网络上汇集了包括网络新闻在内的大量的信息。网络新闻已成为当今社会重要的信息载体和人们获取信息的重要渠道。由于网络新闻内容丰富多样,情感倾向也
论文部分内容阅读
随着互联网的快速发展,网络上汇集了包括网络新闻在内的大量的信息。网络新闻已成为当今社会重要的信息载体和人们获取信息的重要渠道。由于网络新闻内容丰富多样,情感倾向也各不相同,对网络新闻文本内容的自动情感分析成为近年来文本处理领域的一个研究热点。目前,大部分情感分析素材来自评论。评论的情感倾向比较明显,而且大多是短文本。相对于评论文本,新闻文本是对某一事件的描述,主观性比较弱,而且大多是长文本。针对上述特点,本文对新闻进行了情感分析研究,主要工作如下:基于JST模型进行了新闻文本的情感分析,验证了JST模型在新闻文本上的可用性。JST模型是无监督的,无需标注训练样本,不存在领域转移问题。对JST模型加入先验知识——褒贬义词典,可以进一步提高分类准确率。新闻标题是对新闻内容的概括,有时也具有一定的情感倾向,因而本文将新闻标题极性分析加入到新闻情感分析中。首先对新闻标题进行极性分类,然后将标题极性结合JST模型进行新闻情感分类。本文采用两种新闻标题极性判断算法:基于情感词典和基于知网语义相似度。新闻一般是长文本,其中存在大量与情感主题无关的句子,会影响分类准确率。本文给出一种情感主题句抽取方法,首先,给出适用于新闻的主观线索,对文档中每个句子进行主观句评分;其次,使用主题句识别方法,对文档中每个句子进行主题句评分;最后,综合句子的主观句与主题句评分,抽取得分最高的前k个句子,作为此文本的情感主题句。将情感主题句代替新闻全文进行分析。实验验证,本文提出的方法是有效的。
其他文献
由于NAND Flash的低访问延迟和低能耗等优点,伴随着其容量的不断增长,越来越多的服务器采用闪存作为存储器。然而,不同存储服务器之间的I/O负载不均衡造成了各闪存服务器之间
人脸识别是生物识别技术中的一种。与其他生物识别技术不同,人脸识别具有使用者友好和可以被大量应用的显著优点,而这也使得它成为模式识别的一个具有挑战性的课题。人脸识别
DDoS攻击是目前网络违法行为中,不法分子使用的终极武器。由于攻击工具易于开发、攻击危害程度大、以及攻击数据包的源地址伪造而使得攻击者不易被发现,等等这些原因,使DDoS攻击
聚类是数据分析的重要工具,主要包括划分法、层次法、密度算法、图论方法、网格算法以及模型算法等方法,其中模糊C均值算法(FCM)是目前最常用的算法之一。如何提高聚类算法的
软件安全事件的频繁发生引起人们极大关注,对软件的安全性进行准确客观地分析与评估,是软件安全保障的前提和必要条件,本文正是基于此点展开论述与研究的。 为有效表示和检测
数据挖掘是从20世纪90年代以来迅速发展起来的一门新兴技术.其处理对象是大量的日常业务数据,目的是将隐含的、尚不为人知的,同时又是潜在有用的信息从数据中提取出来.机器学
当前数字信息技术和网络高速发展,嵌入式系统已经广泛地渗透到科学研究、工程设计、军事技术、各类产业和商业、文化、艺术以及人们日常生活等方方面面。随着嵌入式系统应用
数据流是一个按时间到来的有序的项集。和传统静态数据库中的数据不同的是,数据流是连续的、无限的、通常以很高的速度到来的并且数据分布随着时间而改变。由于数据流的特点使
随着存储容量和CPU的处理能力的快速增长,磁盘带宽能力却没有得到相应的提升,I/O已经成为影响计算机性能的瓶颈。并行文件系统和并行I/O成为解决磁盘数据处理能力和CPU计算能
目前网络上分布着海量的空间地理信息,这些信息以诸多的格式存储,由不同的个人和单位维护。信息之间的互操作性已成为近年来业内关注的热点问题。然而,传统的方法比如数据格