基于BI-LSTM-CRF模型的中文分词法

来源 :长春理工大学学报(自然科学版) | 被引量 : 0次 | 上传用户:vict1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
递归神经网络能够很好地处理序列标记问题,已被广泛应用到自然语言处理(NLP)任务中。提出了一种基于长短期记忆(LSTM)神经网络改进的双向长短期记忆条件随机场(BI-LSTM-CRF)模型,不仅保留了LSTM能够利用上下文信息的特性,同时能够通过CRF层考虑输出标签之间前后的依赖关系。利用该分词模型,通过加入预训练的字嵌入向量,以及使用不同词位标注集在Bakeoff2005数据集上进行的分词实验,结果表明:BI-LSTM-CRF模型比LSTM和双向LSTM模型具有更好的分词性能,同时具有很好地泛化能力;相比四词位,采用六词位标注集的神经网络模型能够取得更好的分词性能。
其他文献
立足于输变电工程调试项目实际应用,对不同电压等级输变电工程下的不同类型调试项目进行全维度诊断,从调试定额应用范围和普遍性两个维度对输变电工程调试项目的费用计列标准
第三代移动通信技术已成为国内外移动通信领域的研究热点,现有主要的3G标准有WCDMA,CDMA2000,TD-SCDMA。无论采用哪种标准的无线通信技术,射频前端的技术的应用都不可或缺。
正义是社会的首要价值。如何理解社会的正义并确立一个正义的社会,自古以来一直是哲学思想家们所探讨的重大主题。尤其是自上个世纪70年代罗尔斯《正义论》出版以后,正义问题
党的十六届四中全会提出了“构建社会主义和谐社会”这一重大论题。构建社会主义和谐社会是我们现阶段的一项重大任务。社会主义和谐社会是民主法制、公平正义、诚信友爱、充
本文以河北省21所市级体校所有项目的495名教练员为研究对象,采用文献资料法、访谈法、特尔菲法、问卷调查法、比较分析法和数理统计法等对河北省市级体校教练员知识结构的构
本论文立足于中国传统文化思想和绘画理念及审美精神,以整体研究法和比较研究法进行现象还原提炼出中国山水画章法的特征和章法规律,比较西方绘画构图及其创作理念,推断当代
在目前激烈的市场竞争中,随着技术创新的加快,企业研发正成为企业生存和发展的关键因素,也是企业获取竞争优势的重要途径。企业研发组织模式的选择是企业研发的重要方面,在传
训诂自两汉兴盛,完成了从单纯实践到理论阐释的过程。这种蓬勃发展的局面是依托经学而确立的,经学大师多是解读儒家经书的宗师。在儒学独尊的格局下,训诂和儒学联系最为密切
零备件库存管理是设备密集型企业为保证设备连续运转,合理使用库存资金而进行的一项重要工作。充分利用业务系统中的大量数据,建立数学模型对零备件库存进行优化成为企业赢得
发展生产力,提高综合国力,缩小地区差距,实现共同富裕是我们的共同目标。我国作为一个经济发展不平衡的大国,需要根据国情和现代化建设的实践,制定和实施切实可行的区域发展