基于深度学习的文本情绪多标签分类方法研究

来源 :山西大学 | 被引量 : 2次 | 上传用户:gaoxuan1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的快速发展给电子商务平台和社交平台注入了新的活力,交互网站的数量迅速增加,人们越来越倾向于通过社交媒介来发表自己的意见和看法。因此,大量的包含人们情感和情绪的文本数据累积于互联网上,如何有效的利用自然语言处理技术来分析和挖掘这类数据并提取出有价值的信息,已经成为网络舆情监控、用户消费行为分析和电子商务交互等领域关注的热点课题。对于文本情感分析而言,传统的基于单标签的有监督学习方法已经难以满足多样性的文本处理需求,开展对文本的情感和情绪进行多标签分类具有重要的理论意义和应用价值。在自然语言处理领域,深度学习技术可将文本数据进行分布式表示,再通过构建复杂网络来学习数据的深层次抽象特征,以避免繁琐的特征构建工作。因此,本文基于深度学习方法,开展文本情绪的多标签分类方法研究。具体内容和结论如下:(1)文本情绪多标签分类问题分析。通过对文本情感数据的分析,对文本中存在的多种情感信息,确定了以细粒度的方式来进行文本的情感分类。(2)融合标签特征的情绪多标签分类。当文本对应多个情感标签时,每个标签都包含着文本的不同信息,标签中的信息量相对较大,合理的利用标签特征将更加有利于文本的表示,从而提高文本多标签分类的性能。本文提出一种融合标签特征的卷积神经网络模型的情绪文本多标签分类方法。该方法利用卷积神经网络对文本及其对应的情绪标签分别进行特征抽取,最后将情绪文本特征和标签特征融合作为对文本的整体表示对文本的多标签进行分类。我们在NLPCC2014的中文微博情绪分析数据集上进行实验,平均精确率达到了0.6227,从而表明了使用标签特征的CNN模型可以提升微博情绪分类的性能。(3)分层注意力的LSTM文本多标签分类。为了利用句子的结构和层次信息对文本进行深层次的表示,同时又利用标签之间的相关性信息,本文给出一种基于层次结构和注意力模型的循环神经网络的文本情绪多标签分类方法。该方法分为编码和解码两个过程,编码过程将情绪文本从词到句子,再到文本逐层进行表示,并加入词到句子的注意力以及句子到文本的注意力,自下向上对情绪文本进行表示。解码时使用循环神经网络对文本进行多标签表示。在文献[47]数据集上,平均精确率达到了0.6086。
其他文献
本文以西部地区平凉市白水镇小学为调研对象,调研分析了农村留守儿童义务教育的现状。提出了解决问题的对策,主张家庭、学校、社会三方面应全力配合协调,积极解决存在问题,认
为了提高大跨空间结构复杂结构体系地震反应分析的效率,将基于荷载的Ritz向量代替特征值向量引入反应谱分析和模态时程分析,与直接积分法和利用特征值向量进行的反应谱和模态时
弯管机弯曲模具在汽车工业有着最为广泛的应用,随着商用重卡和中卡行业中气(油)管路设计的日趋成熟,对于钢管弯曲也提出了新的技术要求,文章将结合实际工作,介绍一套组合模具在
目的:放射增敏是肿瘤治疗研究的热点,磷脂酰肌醇-3-羟基激酶/蛋白激酶B(PI3K/AKT)信号传导通路是调节放射抵抗的主要因素,其功能失调存在于多种人体肿瘤中。PI3K阻滞剂能够增强
公务卡结算制度在高校的全面推行,对提高经费使用透明度、控制预算单位现金流量、加强预算执行监管力度、强化对高校财政监督等方面起到了积极推动作用。通过结合工作实际分
目的:探讨经肝动脉介入治疗对原发性肝癌术后复发率的影响,寻找相关治疗指征,为原发性肝癌的临床综合治疗提供依据。材料与方法:总结1999年至2006年本院行肝癌切除术后患者20
<正>When Jiang Rong’s(姜戎)novel Wolf Totem was published in 2004,it saw huge sales,won critical acclaim(the inaugural Man Asia Literary Prize),achieved resona
职业决策困难是指个体未能对自己未来的职业生涯作出最终决定,这种困难对于大学毕业生的未来发展有着重大影响。本文以大学毕业生为主要研究对象,选用可就业能力为自变量、职业决策自我效能感为中介变量、职业决策困难为因变量,探讨当代毕业生减少职业困难的方法和途径,以此来缓解职业决策困难的现状。本研究采用问卷法,选择比较成熟的量表作为测量工具,依次为《可就业能力量表》、《职业决策困难量表》、《职业决策自我效能感
<正>前言这本是一个老生常谈的问题,但随着国家体育战略的调整,生物力学今后的发展方向、研究范围与主题却是一个新的命题。目前作为体育类院校,生物力学正经历着从运动生物
会议
"改造成矿作用"理论是中国科学院涂光炽院士提出的完善矿床成因分类学"四分法"的新理论,是中国学者对世界地球科学的重要贡献。该文根据会泽铅-锌(银、锗)矿床地质地球化学特