【摘 要】
:
提出了一种改进的文本表示模型提取文本特征词向量方法。首先构建基于词典索引和所对应的词性索引的double word-embedding列表的word-embedding词向量,其次,利用在此基础上B
【机 构】
:
北京邮电大学软件学院,北京邮电大学计算机学院
论文部分内容阅读
提出了一种改进的文本表示模型提取文本特征词向量方法。首先构建基于词典索引和所对应的词性索引的double word-embedding列表的word-embedding词向量,其次,利用在此基础上Bi-LSTM循环神经网络对生成后的词向量进一步进行特征提取,最后,通过mean-pooling层处理句子向量后且使用了softmax层进行文本分类。实验验证了Bi-LSTM和double word-embedding神经网络相结合的模型训练效果与提取情况。实验结果表明,该模型不但能较好地处理高质量的文本特征向量提取和表达序列,而且比LSTM、LSTM+context window和Bi-LSTM这3种神经网络有较明显的表达效果。
其他文献
当一个国家人均GDP达到3000美元左右,进入中等收入国家行列后,极易出现社会问题突出、经济停滞不前的窘境,从而掉入"中等收入陷阱"。而拉美地区和东南亚一些国家则是陷入"中
随着我国社会经济文化的发展,人们的法律意识和自我保护意识越来越强,加之医患关系的日益紧张,医疗纠纷出现的频率逐渐增大。作为医疗服务的供方,三级医院责无旁贷。院长办公
信息技术应用于高中生物教学,具有传统教学方式不可比拟的优势:能创设情景,激发学生的学习兴趣;能突破教学重难点,提高学生自主学习的能力;能转变学生的学习方式,增强学生学
<正>会计的可比性原则作为对会计信息质量的要求之一,是再熟悉不过的一项会计原则了。但细究起来,却发现人们对会计信息的可比性的认识存在有不少偏差。这些偏差已经或正在对
汉语与日语语言属于同一语系,中国人和日本人在学习英语方面具有共性:虽投入大,但成效小;语言应用能力差。语言结构(中日对比英语)之间的巨大差异是造成我们学习英语困难的主
本文利用全国多个省份和地区的60多家企业860名员工的调研数据,对雇佣关系视角下冲突管理行为与员工创造力之间的影响机制进行了研究,并检验了心理授权的中介效应,得出以下研
我国铁路发展进入高速铁路时代,铁路系统党组织的领导作用和党的组织建设直面新的要求和考验。党的领导在基层实际工作中能否正确地有效地实现,与基层党支部的建设息息相关。
海外学者对改革开放以来中国共产党的执政问题从不同角度进行了研究,形成了一些有价值的观点,初步揭示了其中的一些规律,对此我们要高度重视,全面分析,积极借鉴。特别是要看
中国是世界上最早酿造酒的国家之一,酒在人们生活中产生了重要的作用。但是,由于酒具有两面性,过度饮酒害人害己,从大禹的"绝旨酒"开始,历代统治者制定了不同的禁酒政策。秦
为了研究太湖蓝藻爆发的发生规律和演变趋势,根据2008~2013年太湖蓝藻MODIS遥感监测成果,分析了太湖蓝藻爆发与同期气象、水质和人类活动等相关因素之间的关系。分析结果表明