情感词网的自学习研究

被引量 : 0次 | 上传用户:ibyxpr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着博客、论坛、微博等web2.0应用的蓬勃发展,大量用户评论随之产生。通过对这些评论的分析,可以了解大众舆论对于某一事物的看法和一段时间内公众的情绪变化,因此迅速获取和处理这些评价信息变得尤为重要,而其中核心技术就是文本情感分析。本文提出了情感词网的概念,并以情感词网的自动构建作为研究目标,开展了以下工作:  首先,针对传统语素方法对于种子词语数量的依赖,和传统图方法召回率较低的问题,提出一种将词语间语素关系融入到图模型中,并结合词语同义关系进行中文褒贬词典半监督构建的方法。首先利用语素模型计算词语间语素相似度,然后利用同义词林和双语词典资源,构建词语间同义关系,最后将二种关系结合,并利用标签传播算法进行词语的褒贬分类。  接着,提出了基于非负矩阵分解的情感词网构建方法。首先,基于评论语料库,通过点互信息的方法获取情感词语与评价对象的共现关系,得到情感词语和评价对象的关系矩阵。然后利用非负矩阵分解算法对该矩阵进行分解,得到情感词语之间的共现矩阵和新的情感词语与评价对象关系矩阵。最后,两种关系矩阵和情感词典一起构成情感词网。  最后,针对网络评论因文本短小,语言不规范而造成的基于传统机器学习的分类方法特征稀疏的问题,提出了基于情感词网特征扩展的文本分类方法。方法将原有的情感词语等特征通过情感词网扩展得到其概念空间。实验表明该方法缓解了特征稀疏的问题,从而改进了分类效果。
其他文献
突发事故一旦发生,如何快速检测网络舆情非常重要。由于我国微博用户数量的快速增长和微博在信息传播速度、广度和便捷性上的优势,微博在聚合网络舆论方面发挥了巨大的作用,发展
随着智能触屏手机、平板电脑以及嵌入式PDA等设备的快速普及,嵌入式移动设备在工业控制、娱乐消费及医疗卫生等诸多领域得到了广泛应用。目前绝大多数医疗信息系统(HospitalIn
极端学习机(ELM: Extreme Learning Machine)是训练单隐含层前馈型神经网络的学习算法,它不用迭代调整权值,隐含层的输入权值和偏置都是随机生成的,输出权值是通过分析的方法确定
智能监控技术是计算机视觉和安全防范监控领域的一个研究热点,主要涉及计算机视觉、模式识别、人工智能、视频分析与处理等多个领域,以该技术为支持的智能视频监控系统因其广阔
铁路轨道是铁路运输的基础设施之一,在车辆行驶中,来自机车车体的压力和震动直接作用于轨道,导致轨道质量发生恶化。轨道质量状态的优劣影响到列车运行安全性、旅客乘车舒适
随着信息技术的发展,需要存储和管理的数据越来越多,作为存储系统重要支撑之一的分布式文件系统将面临更严峻的挑战。缓存机制是提高分布式文件系统性能的重要手段。本文以分布
无线传感器网络具有通信能力有限、电源能量有限、计算速度和存储空间有限、传感器节点配置密集和网络拓扑结构灵活多变等缺陷,不能保证数据信息在传输中机密性,完整性,真实
近年来,虚拟化技术凭借其良好的独立性、高资源利用率和容易管理的特性备受业界关注,已经在数据中心的系统安全、负载均衡、服务器管理整合等方面得到广泛的应用。虚拟化环境
目前,汽车日趋复杂与异构,通常涉及机械、电子、通信、液压、控制等多个学科领域。完整地设计跨领域复杂系统需要对系统进行多领域建模,传统汽车开发方法难以控制系统的复杂
头部姿态估计作为计算机视觉的重要问题,在人脸识别与身份认证系统、智能安全监控系统、视觉注意力监测系统、辅助安全驾驶系统、视频会议系统、人机交互等众多领域中具有广泛