【摘 要】
:
[目的 /意义]通过在标注资源丰富的源领域(Source Domain)中学习,并将目标领域(Target Domain)的文档投影到与源领域相同的特征空间(Feature Space)中去,从而解决目标领域因
【机 构】
:
中南财经政法大学信息与安全工程学院;
【基金项目】
:
国家自然科学基金面上项目“大数据环境下基于领域知识获取与对齐的观点检索研究”(项目编号:71373286)和国家自然科学基金青年项目“突发公共卫生事件社交媒体信息主题演化与影响力建模”(项目编号:71603189)研究成果之一
论文部分内容阅读
[目的 /意义]通过在标注资源丰富的源领域(Source Domain)中学习,并将目标领域(Target Domain)的文档投影到与源领域相同的特征空间(Feature Space)中去,从而解决目标领域因标注数据量较小而难以获得好的分类模型的问题。[方法 /过程]选择亚马逊在书籍、DVD和音乐类目下的中文评论作为实验数据,以跨领域情感分析作为研究任务,提出一种跨领域深度循环神经网络(Cross Domain Deep Recurrent Neural Network,CD-DRNN)模型,实现不同领域环境下的知识迁移。CD-DRNN模型在跨领域环境下的平均分类准确度达到了81. 70%,优于传统的栈式长短时记忆网络(Stacked Long Short Term Memory,Stacked-LSTM)模型(79. 90%)、双向长短时记忆网络模型(Bidirectional Long Short Term Memory,Bi-LSTM)模型(80. 50%)、卷积神经网络长短时记忆网络串联(Convolution Neural Network with Long Short Term Memory,CNN-LSTM)(74. 70%)模型以及卷积神经网络长短时记忆网络并联(Merged Convolution Neural Network with Long Short Term Memory,Merged-CNNLSTM)模型(80. 90%)。[结果 /结论]源领域和目标领域的知识迁移能够有效解决监督学习在小数据集上难以获得好的分类效果的问题,通过CD-DRNN模型能够从无标注数据中有效地筛选特征,从而大大降低目标领域数据标注相关的工作量。
其他文献
帕金森病又称为帕金森综合征,是以静止性震颤、肌僵直、运动减少及姿势障碍为特征的一种临床综合征,帕金森病患者应注意的问题睡硬板床因为患者肢体震颤,肌肉强直,不宜睡柔软无支
介绍了Google发布的新一代智能手机平台Android的系统架构,并在分析手机用户和商家需求的基础上进行了相应的功能设计和数据库设计,利用Google的地图应用接口和XML等技术,实
本文介绍了香港政府工业署的职权,着重从研究发展,资本投入,人力资源,基本设施和工业技术等诸方面论述了香港政府的工业发展政策。
技术进步是经济增长的最终源泉。技术具有正的外部性,存在溢出效应。国际贸易是国际间技术溢出的主要渠道之一。本文以实证分析为主,考察了我国对外贸易中来自国外的技术溢出
细胞死亡是机体抗感染免疫反应过程中重要的组成部分,可分为程序性死亡和被动性死亡。前者需要代谢能量,由特定的细胞信号和效应分子介导,主要包括焦亡(pyroptosis)、自噬(au
经济全球化与区域一体化是当今世界经济发展的两大趋势。区域一体化是实现经济全球化的前提。目前,区域一体化在全世界蓬勃发展,欧盟是发展最为完善的区域一体化组织,2005年底北
全球化在给中国和东盟带来了前所未有的机遇和挑战的同时,也加深了双方之间的经济联系。作为最大的发展中国家,中国已成为发展中国家中吸引外商投资量最多的国家,也成为一些东盟
城市绿化景观提升规划是在大事件背景下开展的新类型规划,旨在提升城市形象。《南京市建邺区绿化景观提升规划》便是城市绿化景观提升规划的一个典型案例。该规划以2014年青
改革开放20多年来,外商投资企业对中国产生了巨大的作用,它促进了国民经济的增长,提升了产业结构和出口产品竞争力,引进了国际先进技术和管理经验,也推动了中国市场经济改革。地方