基于模板匹配的文本倾向性研究

被引量 : 0次 | 上传用户:ylznaf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本情感分析技术采用计算机来自动分析带有情感色彩的、主观性文本所表达的观点、态度等情感信息。文本情感分析已经被广泛应用于垃圾信息过滤、产品评价、舆情分析等领域。汉语中词语在不同语境中其倾向性有差异,而传统的情感倾向性分析都忽略了语境对情感倾向性的影响。针对上述问题,论文采用模板匹配的方法来判断词语所在语境的倾向性,进而在词语倾向性分析的基础上对文本进行倾向性分析。其目的是为了判断词语在具体语境中的倾向性,提高文本倾向性分析的准确率。本文的主要工作如下:(1)词语相似度计算:分析基于知网的词语相似度计算中存在的问题,改进了词语相似度计算的方法,使词语相似度计算更加合理准确,为词语倾向性分析研究奠定了基础。(2)情感词汇本体构建:根据知网及语义词典构建情感词汇本体,根据情感词汇本体过滤出有情感倾向性的语料,为文本倾向性分析实验提供了高质量的语料。(3)文本倾向性分析:首先,针对一些词语在不同语境中情感倾向性的不同,把具有情感倾向性的词语分为两类:单一词和二义词。单一词根据与基准词的紧密程度判断其倾向性。二义词先根据模板匹配的方法判断在语境中的倾向性,再计算倾向强度。然后,根据副词和反问句对倾向性影响的不同对文本进行不同的处理,在词语倾向性分析的基础上对文本进行倾向性分析。最后,通过对网络评论进行倾向性分析的实验证明本方法具有较高的准确率。(4)文本倾向性分析应用:将基于模板匹配的文本情感倾向性分析应用到考试系统的作文情感分析中。通过对学生作文的倾向性分析,使教师能方便及时的了解学生的情感倾向,对于教师了解学生的心理状况有指导作用。该功能的实现是对文本倾向性分析应用领域的新尝试,也展示了将模板匹配的方法应用到作文情感倾向性分析中的可行性。
其他文献
明清时期的贱民问题是明清社会史研究的一个重要课题。由于贱民身份低微,史料记载少,故学术界对其研究较少,而对于贱民阶层中的小种户民的研究则更少。本文将在尽可能多地搜
黄沙坪矽卡岩型铅锌矿位于湖南省郴州市桂阳县境内,南岭成矿带的中段,是湖南省最大的铅锌矿原料产地。矿区开采历史悠久,基础地质研究程度较高,但在流体地球化学和成矿深度方面研
三维图形引擎中对流体类似物的仿真方法一直是国内外研究机构及相关人员关注的焦点。多年来,大量研究学者对这类仿真问题在运动建模、行为建模、绘制方法等方面,不断提出新的解
研究目的:肿瘤可以通过多种方式逃避免疫系统的监控,其中IDO和记忆性T细胞是近年来在肿瘤免疫逃逸机制中备受关注的两个重要因素,两者在肿瘤的发生发展过程中都起着重要作用,
目前,我国已建和在建隧道总长度已超过4600公里,居世界首位。据统计,隧道的运营费用与隧道长度的三次方呈正比例关系,隧道通风技术已成为公路隧道发展的关键因素。因此,对隧
秦淮灯会历史悠久,文化灿烂,是南京地区广为流传的民俗文化活动。它是南京地域文化的具体体现,也是南京民众生活的鲜活反映;它延续着传承节日文化、联络民族情感的重要作用,也
转制煤炭国有企业近年来经历多次整合与重组,部分企业的人力资源管理基本上还处于以经验管理为主的传统管理模式,主要存在三大问题:总量冗余,存量不足;人才断档,通道狭窄;机制老化,效
美国当代华裔作家谭恩美(Amy Tan,1952-)对记忆有着特殊的情感,至亲和自己亲身经历的遗忘事件让她对记忆充满了深深的恐惧和怀念,由此激发并开启了她通过创作向记忆朝拜的历
目的:探讨外周血血小板、血清、贫血小板血浆中肿瘤抑素(Tumstatin)、血管内皮生长因子(VEGF)以及凝血酶敏感蛋白-1(TSP-1)水平在非小细胞肺癌中的临床应用价值。方法:分别使用CT
唇裂是口腔颌面部常见的先天性畸形,常与腭裂伴发,它不仅导致患儿严重的功能和容颜缺陷,而且给患儿造成严重的心理障碍,给家庭带来极大的精神负担。根据流行病学调查,新生儿