【摘 要】
:
随着网络数据的爆炸式增长,大数据所展现出来的应用潜力也越来越明显。数据挖掘技术可以发现大数据中的一些特定模式,进而对人们的生产生活进行科学的指导,这其中就包括情感信息
论文部分内容阅读
随着网络数据的爆炸式增长,大数据所展现出来的应用潜力也越来越明显。数据挖掘技术可以发现大数据中的一些特定模式,进而对人们的生产生活进行科学的指导,这其中就包括情感信息分析。情感是一种自然语言特有的高层语义抽象,所以分析文本的情感往往需要大量人力的参与。情感信息分析是一种自动获取文本情感信息的技术,既可以节省许多的人力物力,同时能在很多人机交互应用中融入情感,增加了其智能型。情感分析包括三个子任务:情感抽取、情感分类和情感检索。传统的情感分析研究在这三个子任务上有如下不足。第一点,情感抽取的模型或者没有考虑文本的语法结构信息,或者模型非常复杂,难以训练;第二点,情感分类试图尽可能多的利用一些启发式的文本特征,造成相关模型的适应性非常低;第三点,文本级的情感检索中没有考虑文本的静态质量,而后者是在传统信息检索中非常关键的一种排序因子。本课题所针对的语料库是用户评论,既网络购物后的用户文本反馈。相对于其他文体形式,用户评论有着发布者单一、主题单一的特点。本课题利用用户评论的特点,针对传统情感分析研究的问题,一一提出了解决方法。首先,在情感信息抽取中,本课题利用新模型简化了语法结构信息的融入;然后,把所有的启发式文本情感特征规约到情感对特征,完全基于情感对特征完成了情感分类;最后,基于用户威望机制,为情感检索融入了文本静态质量这一排序因子。本课题详细论述了新模型和算法的提出,并通过基准测试验证了其有效性。
其他文献
在很长的一段时间里,明代书坊主这一群体多被视为小说刊刻、销售的主角,浓厚的商人气息掩盖了他们文人的特质。随着有关明代小说研究领域的不断深入,研究视野的不断拓宽。明代书
在分析林火指挥扑救目标的基础上,采用RS、GIS、DSS等技术,通过模糊数据开采方法设计了林火指挥扑救决策支持系统,系统能实时进行林火行为的模拟预测,形成扑火力量集结方案,为林火
针对全国正在大量建设的“农家书屋”,指出加强其后续管理的重要性,以中山市“农家书屋”建设为例,探讨其后续管理的思路与对策。
概述了近年来国内外对水环境中汞的形态、分离富集手段及其测定方法的研究报道.文献表明随着对汞环境化学行为研究的深入,汞的形态分析技术在今后依然是极富挑战的课题.
目前各师范院校学前教育专业普遍开设了《幼儿教师口语》课程,以期提高学生的语言能力,但该课程教学中还存在诸多可改进的地方。本文针对学前教育专业《幼儿教师口语》课程教学
《杜诗偶评》是清中期一代诗坛领袖沈德潜的选杜之作,虽然评点较少,但选诗精当,批点简练,为清中期较好的杜诗选本。但到目前为止对此书深入细致的研究还比较少,我就此对这本书作了
联合站作为油田集输系统的重要生产环节,担负着油气处理与集输的任务。它接收自各个油井、分井计量站或接转站的来油,在站内完成油气分离、原油脱水、稳定等工作,然后将达标
用磁控溅射的方法在天然白云母上制备AZO透明导电薄膜、AZO/Ag/AZO三明治夹层结构透明导电薄膜。研究了溅射过程中,制备单层AZO薄膜与AZO/Ag/AZO三明治夹层结构中不同Ag夹层
随着GNSS技术的发展,其在海洋观测领域的应用日益凸显。鉴于波浪和潮位的周期相差较大,利用GNSS卫星信号的多普勒频偏原理测量浮标的运动状态,进而反演出波浪谱,最后由波浪谱
作品以散文笔调叙写了我少年时代书法学习经历,颇具自传色彩。文章以一个农村少年的寂寞生活开头,写出了我与书法的缘分。回忆了我的启蒙老师,第一堂书法课,书法玩伴,一个爱