基于改进的多层BLSTM的中文分词和标点预测

来源 :计算机应用 | 被引量 : 0次 | 上传用户:wqh4975156
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前主流的序列标注问题是基于循环神经网络(RNN)实现的。针对RNN和序列标注问题进行研究,提出了一种改进型的多层双向长短时记忆(BLSTM)网络,该网络每层的BLSTM都有一次信息融合,输出包含更多的上下文信息。另外找到一种基于序列标注的可以并行执行中文分词和标点预测的联合任务方法。在公开的数据集上的实验结果表明,所提出的改进型的多层BLSTM网络模型性能优越,提升了中文分词和标点预测的分类精度;在需要完成中文分词和标点预测两项任务时,联合任务方法能够大幅地降低系统复杂度;新的模型及基于该模型的联合任务
其他文献
本文合成了一种腺苷亲和层析凝胶,并采用亲和层析法从牛脑细胞膜上分离出了几种膜上结合的腺苷结合蛋白质。这些蛋白质在SDS-PAGE电泳凝胶上为单一或主要的蛋白带,分子量分别为64kd、45kd和:15kd。腺
本研究以提升医学专业学生的自主学习能力为目标,将“翻转课堂和对分课堂”两种教学模式相结合,并运用于人体解剖学教学中,可以使学生在课后,通过教学视频、音频、电子教材等
脂肪酶(lipase,EC3.1.1.3),学名甘油三酯水解酶(triacylglycerol hydrolase),能催化甘油酯水解产生甘油和脂肪酸,亦可催化羧酸脂类水解产生醇类和脂肪酸。在催化酯化和酯交换反应
吸烟可以诱发许多疾病,几乎可以损害人体的各个系统的所有器官。在我国,控制吸烟是一项比较普遍的活动,在诸多公众场所均要求禁止吸烟。医院作为一个具有特殊意义的公众场所,
20世纪90年代,中国公共财政在卫生筹资领域的责任弱化,导致民众医药费用的负担大大加剧,产生了严重的社会不公。自2003年以来,这种局面开始逆转,中国卫生总费用中公共筹资或
<正> 存款是金融机构竞争能力强弱的综合反映。近几年来,农村信用社存款市场占有率持续下降,如何正确看待这个问题?笔者分析了1996年行社脱钩以来的绍兴市金融系统存款的变化
烤烟大田期的光照、温度、降雨量等是影响优质烟叶产量和品质的重要气候生态学因素。烤烟作为主要经济作物之一,在赣南老烟区及赣北、赣中新烟区均有大量种植,然而,其在生长
为了明确赤霉素对猕猴桃种子萌发的影响,采用75%的赤霉素结晶粉对猕猴桃种子进行处理,在猕猴桃种子萌发的适宜条件下试验,结果表明:用赤霉素处理的种子发芽势和发芽率明显高于
巴金写《随想录》跨越了整整八年的时间,基本贯穿了中国在"文革"后最大的历史转变——拨乱反正,肃清极"左"路线的流毒,坚持改革开放的整个过程,因此,《随想录》实际上是20世
传统的图像物体分类与检测算法及策略难以满足图像视频大数据在处理效率、性能和智能化等方面所提出的要求。深度学习通过模拟类似人脑的层次结构建立从低级信号到高层语义的