【摘 要】
:
文本情感倾向性分析在电子商务、电子政务、民意分析上有巨大的应用价值。如何准确分析出作者所要表达的情感是文本倾向性情感分析的目标。特征抽取是提高文本倾向性情感分析
论文部分内容阅读
文本情感倾向性分析在电子商务、电子政务、民意分析上有巨大的应用价值。如何准确分析出作者所要表达的情感是文本倾向性情感分析的目标。特征抽取是提高文本倾向性情感分析正确性的主要手段之一。本文以篇章的情感倾向性分析为基础对特征抽取的方法作了研究。本文的主要工作有:(1)针对篇章情感倾向性研究,给出了使用组合策略分析篇章情感等问题的理论解释及相关框架,分析了该框架兼容性问题。我们通过分析语句的情感进而得到篇章的情感倾向性。其优点在于可以根据语句的位置、语句的评论对象的差异来调整其篇章情感倾向分析的权重,进而得到更为近似的情感密度函数。从而解决传统方法将篇章看作整体笼统地分析文本情感存在的问题。(2)分析了规则和统计相结合的情感倾向性分析思想的有效性,并使用搭配规则(资源方法)和判定表(统计方法)验证此思想是可行的。基于资源的情感倾向性分析优点在于情感词表准确,缺点是完备性较差。而统计的方法则恰恰相反。本文将两种方法相结合目的在于取其所长,避其所短。实验表明:基于规则和统计相结合的情感分析(DLCR)方法相对于使用规则(CR)和统计(DL)分析文本的情感的准确率有了明显的提高;DLCR分析效果也明显优于SVM, Bayes的分析效果。这表明基于规则和统计相结合的文本情感倾向性分析算法有着较好的实用价值。
其他文献
随着数据库技术的发展,越来越多的行业的建立了自己的数据库系统。随着企业的不断扩张及管理信息的不断完善,企业数据库往往需要管理几百G甚至几T的数据量。随着数据库数据量的
随着电脑的普及,网络技术的发展,目前各种类型的考试都逐渐采用计算机出题,并且随着网络时代的到来和迅速发展,用计算机进行在线考试已经成为了一种不可逆转的趋势。网络考试
软件测试是提高软件可靠性和保证软件正确性最基本和最重要的手段,而测试用例的设计又是软件测试的核心,是软件测试质量的根本保障。随着软件系统规模的日益扩大和应用领域的
三维人体建模技术一直是国内外众多学者研究的热点。不同应用领域对人体模型的创建要求各不相同。如何快速创建个性化人体模型也就成为建模的关键和研究的重点。针对上面的问
本文提出了一种灵活的处理分析多文件程序评分的方法,这种评分方法在自动评分系统中使用动态和静态实现方式。静态和动态评分都可以分析使用多个程序文件来解决一个编程问题的
随着互联网时代的来临,Web已经成为世界上最大的信息源,给人们生活带来了极大的方便。但是Web在给人们提供丰富信息的同时,又使人们在对它们的有效使用方面面临一个巨大的挑
随着网络技术迅速发展与分布式计算的日益成熟,企业数据库的应用正不断向着分布式、大型化的方向发展。然而不同的企业或企业的不同部门根据自身需要或者由于历史或技术的原
随着现代信息技术的快速发展和迅速普及,人类的生产、工作和生活方式正发生着深刻的变化。以高校为例,现代信息技术的发展为高校教育信息化建设提供了新的工具和手段。最近几
农作物病虫害的爆发意味着农作物的大规模减产和品质下降,同时农户盲目施药也导致了农药残留超标、环境破坏等严重后果。随着计算机技术的发展,机器视觉技术的研究与应用已经
由于日益庞大的业务处理,许多决策系统和OLAP系统的数据正在朝着TB数量级发展。面对各种存储了海量数据的巨型表,如何充分利用存储空间,节省系统维护成本,在查询海量数据时取