中文新词识别技术综述

来源 :计算机科学 | 被引量 : 0次 | 上传用户:luckyhelen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
新词识别是中文信息处理领域的关键技术。新词识别主要包括候选字串的提取过滤和词性猜测两项任务。中文没有特定符号标志词边界,因此任何相部字符都有成词的可能性,这给新词提取过滤带来了很大困难;由于没有先验知识和统计数据,新词词性猜测一直是中文词性标注的技术瓶颈。详细分析了中文新词识别技术的研究现状,重点讨论了候选新词提取和词性猜测的研究方法与存在的主要问题,最后对新词识别研究方向进行了展望。
其他文献
目的建立适合临床实践的常见致病真菌的PCR检测方法。方法根据真菌的保守基因设计不同的特异性引物,对152例临床标本进行PCR检测,与传统检验方法的结果进行比较。结果真菌培
目的探讨石家庄市老年人居家养老服务需求与对策。方法采用问卷调查方法对石家庄市老年人居家养老服务需求与对策进行调查。结果石家庄市社区医疗服务现状并不能很好满足老年
基坑设计土体参数的正确选取直接影响支护结构的位移和内力计算结果,特别是土体水平抗力比例系数m值对支护结构位移的影响最为显著.结合基坑开挖工程实例,通过材料性状与基坑