基于深度学习的中文标准文献语言模型

来源 :吉林大学学报(工学版) | 被引量 : 0次 | 上传用户:a275505
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为解决中文标准文献的自然语言处理问题,对Hierarchical Log-Bilinear英文统计语言模型算法进行了改进,构建了适用于中文语言的模型。采用深度神经网络技术,将无监督学习与有监督学习相结合,利用多层受限玻尔兹曼机训练文本词向量,并将训练好的词向量输入到前馈神经网络进行有监督训练,完成对中文标准文献内容的机器学习。对100多万条标准题录数据进行训练的实验结果表明,该方法能有效提高语言模型的学习能力。
其他文献
移动互联网技术的成熟和智能手机、平板电脑等移动终端的普及,移动阅读已经成为数字阅读发展的新趋势,数字期刊的移动阅读也将呈现数字平台移动阅读开发力度加大、读图成iPad
<正>人类社会的每一次繁荣进步都离不开科技的突破,但人类文明的每一次飞跃发展更离不开思想的解放。当互联网带来指数科技的繁荣,我们又一次站在了时代的风口,就在大工业发
分析了硕士研究生所特有的过渡性特点,指出了培养硕士研究生科研能力的重要性,从工作安排、课程设置、科研工作、论文写作四个方面分析了现存研究生培养体制在硕士研究生科研
本文拟从中国传统法律文化的独特视野出发,对于清官信仰的民间意识、清官司法的理性认识能力、清官司法的权力界限以及清官司法的社会意义和法律意义四个方面进行检讨
通过对现有制程能力进行评估改进,通过试验不同设备、不同工艺方法改善激光钻机识别板厚>1.60 mm的棕化HDI板标靶难的问题。
铜上直接成孔(Copper-direct)工艺是CO2激光成孔技术中一种非常重要的盲孔加工方式。本文就铜上直接成孔工艺中存在的侧蚀(Undercut)现象进行研究,阐述了侧蚀现象产生的原因以及
当代大学生的思想政治教育工作,要从中国优秀传统文化中吸取营养。《论语》是中国传统文化中的瑰宝,具有巨大的文化价值。《论语》对思想政治教育的方法提出了极具价值的观点
本文以焊接自动化技术为背景,针对需要自行研制的焊接进给工作台,主要研究工作台进给系统的伺服控制技术,根据工作台在实际运行时所将面临的工件与焊极接触状态检测、低速运
随着改革的不断深入和城市化建设加快,在"土地倒逼机制"与城乡收入差距的推拉作用下,越来越多的少数民族人口流入城市地区从事第二、三产业劳动。他们所获经济收入不仅为摆脱
在我们这个商品经济的时代,经济的竞争在某种意义上是商品的竞争,商品的竞争其实就是广告的竞争。本文旨在从广告作为技术性的存在出发,论述广告中欲望的生成,以及欲望如何进