中文分词研究综述

来源 :软件导刊 | 被引量 : 0次 | 上传用户:happy_0421
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分词作为自然语言处理(NLP)的第一步,有着不可或缺的作用。中文分词(CWS)由于语言的复杂性成为学者研究热点。根据历年文献资料,分词方法主要包括词典分词、统计分词以及神经网络分词。随着机器学习的发展,神经网络成为分词领域主流算法,基于神经网络的长短时记忆网络和基于统计的条件随机场分词在提高准确度方面作用巨大,准确度达97%。在此之后,分词歧义和未登录词识别得到很大改进,但研究发现改进模型结构带来的准确度波动不大,且增加了模型复杂性,降低了运算速度。卷积神经网络能更好地理解语义信息,利用稀疏连接缩短运算时
其他文献
采用系统抽样调查法及样带调查法,对丰都县野生食药用菌资源进行了初步调查。结果表明,丰都县现有野生食药用菌2亚门3纲4目18科52属51种。为进一步合理开发利用和保护这一地区
阐述城市园林建设的地位与作用,联系商丘市的实际,分析当前城市园林绿化存在的问题;提出科学推进生态宜居城市的思路与措施。
变电运行活动是电力企业进行供电管理工作的必要环节,各种变电设备在变电运行活动中发挥主要作用.为了可以满足变电运行工作的基本需求,很多新型的电气设备也被增加到基础变
分析行道树的生长环境,介绍行道树的树种选择、种植方式、定干高度及株距与工程管线之间的关系,并总结行道树的栽植和养护管理技术。
结合实际生活,研究设计了一种新型灶具炉架。