社会新媒体的信息获取与情感分类关键技术研究及实现

来源 :河北科技大学 | 被引量 : 0次 | 上传用户:ie286
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本情感分类是利用计算机对文本进行情感倾向性分类,利用文本情感分类可以对网络中舆情进行预测,可以对商业产品进行优缺点分析,甚至在网上用户行为挖掘中也可以加入情感分类的内容。近年来,随着网络技术的发展和成熟,网络从以计算机为中心转变到以网络用户为中心,用户可以在网上随意发表自己的观点评论,而微博的出现更加速了网络中用户之间的交流。大量微博评论信息充斥网络,如何有效利用这些数据服务大众,也越来越急迫。   本文设计了一种基于向量空间模型的情感分类算法,利用情感句中评价对象及情感单元建立情感向量,计算出情感句的情感倾向,并得出相应的情感倾向权重值。最终设计并实现了一个微博情感分类的检索系统。本文中所做的工作如下:   1)利用数据抓包工具HttpWatch对新浪微博数据交互过程进行分析,并实现了对新浪微博数据的爬取。   2)对情感词典进行了筛选,并结合情感词典提出了一种评价类情感句中情感单元的抽取方法。   3)利用正态分布的规律对情感词情感权重计算进行了研究,并设计实验进行了实验分析。   4)在向量空间模型的基础上,提出了一种短文本情感分类算法,利用评价对象作为维度,情感单元中情感权重作为维度权值建立向量空间模型,计算得出情感句的情感类别及情感权重。   最终通过实验验证了本课题提出的抽取方法和情感分类算法具有一定的科学性及可行性。  
其他文献
RFID防碰撞算法直接影响着RFID系统的性能。准确地识别出RFID系统中碰撞标签的信息是RFID识别技术的难点,也是保证识别信息实时性的重要因素。RFID系统中应用最多的标签防碰撞
网络编码是信息论领域里信息处理与传输理论研究的一项重大突破。与传统的储存与转发的传输方式不同,网络编码技术首先对接收到的数据包进行编码组合,然后再进行发送。网络编
无线Mesh骨干网络拓扑优化是无线Mesh网络研究的核心技术问题,网络拓扑控制的好坏直接影响到无线Mesh网络整体性能的发挥。同时无线Mesh网络的整体性能也受到无线网络通讯干
在人体的三维重构中,骨骼的体网格生成不但具有重要的意义,而且亟待解决。随着骨骼的受损几率的增大(各种车祸、骨瘤等),有些骨骼(如骨盆)本身的形状和解剖结构的复杂,为更好地理
近年来,协作通信已经成为了通信领域的研究热点。研究表明,协作通信在抵抗信道衰落,提升信道容量、频谱利用率和可靠性等系统指标方面取得了显著的提高。作为协作分集的一个
在计算机极为智能的今天,让计算机来帮助人们快速、正确地识别数字早已成为一种潮流。计算机在识别一些书写规范、大小固定、甚至是打印体的数字字符时,只需要按照用户给定的具
本文从原始扫描的作品入手,按照预处理、形态学处理、风格特征量化处理、风格特征概率诊断的顺序将书法作品依次处理,最终获得该书法作品的真伪概率,并提供相应的可疑的证据
泛函网络是对人工神经网络一种全新的拓展,在许多应用领域取得了较大的成功。但由于泛函网络是人工神经网络一个新兴的研究分支,在理论和应用方面尚存在许多的不足,需要人们
室内定位技术由于受非视距传播及多径传播的影响,目前被广泛研究的无线室内定位技术都有其不足之处,定位效果不显著。比起室外环境,室内环境相对复杂,室内装潢、内部物体布局、材
无线传感器网络是一种新型的无线网络,它能够对感兴趣的区域进行实时的监测,并对周围环境进行相关数据的采集、处理并传输给需要的用户,在军事、工业、环境、反恐等领域有着