【摘 要】
:
目前,大多数方法在判别文本情感极性上采用的是提取情感特征并应用分类器进行分类的方式。然而由于网络文本表述方式多样,主题分散等特点,使得情感特征提取过程变得愈发困难
【机 构】
:
国防科学技术大学计算机学院,国防科学技术大学高性能计算重点实验室
【基金项目】
:
国家自然科学基金 Nos.61170287,61232016~~
论文部分内容阅读
目前,大多数方法在判别文本情感极性上采用的是提取情感特征并应用分类器进行分类的方式。然而由于网络文本表述方式多样,主题分散等特点,使得情感特征提取过程变得愈发困难。借助LDA(latent Dirichlet allocation)主题模型,首先对文本进行主题聚类,然后在每个主题子类上应用循环神经网络的方法对正、负情感样本分别建立主题模型,最后基于所属主题和所属情感的概率进行联合判断。采用这种方法,通过划分子类的方式规整了不同主题下文本的表述方式,限制了不同主题下词汇词义改变的问题,并且利用训练语言模型的方法很好地规避了直接提取特征的困难,将特征的挖掘过程内化在了训练模型的过程中。通过在IMDB电影评论样本上的实验可以看出,在应用了主题聚类后,模型分类的准确性有了显著提高。
其他文献
据商务部网站消息,中日双方投资促进机构第20次联席会议日前在北京召开。中国商务部部长高虎城在会议上表示,利用外资是中国对外开放基本国策的重要内容,中国政府会继续大幅
当下的文学批评正面临种种诘难与怀疑,批评的品格发生了蜕变,批评的信誉也已降到了冰点。批评意识的缺席、批评中文学感受和文学体验的缺乏、批评精神的屈从和不确定性等都是
命名实体识别任务能够搭建知识库与自然语言之间的桥梁,为关键字提取、机器翻译、主题检测与跟踪等研究工作提供支撑。通过对目前命名实体识别领域的相关研究进行分析,提出了一
亚太地区的造纸市场在全球中的地位,近几年随着中国市场和其他新兴市场的发展而逐渐突出,而亚太地区也同时拥有日本这个在全球造纸行业中产量和消费量均排名第三的造纸大国。
针对当前人工智能方法存在的训练精度瓶颈问题和智能系统对高精度人工智能方法的迫切需求问题,结合小波分析和BP(back propagation)、RBF(radial basis function)神经网络的优点,提
乡村学校布局调整若片面追求规模效益而忽视地方特点,易加重学校负担和农民负担,拉大村小与中心校之间的差距,而采取寄宿制则让孩子从小就与乡村生活、乡村社会隔绝;乡村初中的高
以教育学院为例的一类高等师范院校教学质量评价体系存在诸多问题,诸如尚未建构与学院办学定位和人才培养规格相适宜的、科学的、有效的教学质量评价标准(指标体系);教学质量评价
全球化语境下的我国英语教学应该顺应时代发展的需要,将跨文化教育和中国传统文化教育的结合,与时俱进,为国家培养高素质的新世纪人才。
伴随着新型大学的诞生,“大一国文”历经百年探索,由曾经的辉煌而转入低迷正期待再次的“飞扬”。“大学语文”是“大一国文”的现代形态,现状不甚令人满意。大学语文改革是一个
目的研究自制喉扩张模在预防严重喉气管损伤术后喉气管狭窄的疗效,探讨放置喉扩张模的时限。方法1992年1月~2004年12月收治严重喉气管损伤患者26例,其中闭合性损伤7例,开放性