基于统计的开放式汉语自动分词

来源 :福建电脑 | 被引量 : 0次 | 上传用户:kruotreo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉语自动分词在面向大规模真实文本时,仍然存在很多困难。本文在传统的语料库方法的基础上,提出一种基于开放性语料库的汉语自动分词方法。建立开放性语料库,并引入开放式知识库学习和评价机制。实验结果表明,开放机制的引入能有效提高汉语自动分词的精确率。
其他文献
在中文信息处理中,汉语的自动分词是一个难点。本文对汉语自动分词的方法及已有的词典机制进行了探讨。
本文分析了我国现有住宅与小康水平住宅存在的几点差距,针对这些问题,提出建造2000年小康水平住宅要引导解决以下八方面的问题,提高居住环境质量;加强宅区的综合开发;采用新型住宅结构
字“远”,1978年生,浮梁人。自幼酷爱丹青、书法,系江西省高级陶瓷美术师,景德镇鱼画瓷艺馆馆长,昌南书画院专业画师,中函艺联理事,1996年毕业于江西工艺美术学院,师承粉彩瓷画名家汪
今年以来,面对新冠肺炎疫情影响和国内外经济运行不确定性的增大,党中央国务院在"六稳"方针的基础上,明确提出了"六保"新任务。在"六保"中,十分鲜明的一条就是"保市场主体",
在橡胶加工领域,偏析行为主要指补强填料(炭黑、白炭黑、碳纤维等)在胶料中的不均匀分布。本文借助RPA、DMA、TEM等动态力学方法探讨炭黑在低硬度NR/BR并用胶中的偏析行为。首先
本文介绍了太阳能发电设备的工作原理及相关的技术指标,着重讨论了计算机测控系统的构成及实现的功能。
期刊
目的调查北京某医院艾滋病门诊接受抗病毒治疗的HIV感染者的高血压、高血糖的患病率,分析与高血压、高血糖相关的影响因素,为今后更好地控制病人的血压、血糖提供参考依据。
随着网上数字化信息资源的不断增长,怎么样自动处理这些信息已成为目前一个重要的研究课题,汉语自动分词在中文海量信息处理中起着非常重要的作用。由于汉字之间没有明显的分