基于最大间隔马尔可夫网模型的汉语分词方法

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:ccf107893228
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分词是汉语自然语言处理研究中非常重要的一个环节,在早先的研究中,最大熵模型和条件随机场(CRF)模型已经广泛运用到汉语自动分词的工作中。最大间隔马尔可夫网(M3N)模型是近年来由B.Taskar等人提出的一种新型结构学习模型。该文尝试将这一模型用于汉语分词建模并进行实验,实验结果显示,基于给定的训练语料与测试语料,分词精度可以达到95%,表明基于最大间隔马尔科夫网的汉语分词方法可以取得较高的分词精度,是一种有效的汉语分词方法。
其他文献
目的探讨品管圈干预对脑卒中清醒患者早期活动的影响。方法选取意识清醒的脑卒中患者266例为研究对象,根据入院就诊号的先后顺序分为观察组(n=95)与对照组(n=171),观察组行品
随着社会的不断发展,农业生产逐渐变得更具规模化、现代化、机械化,而我国的农业也逐步朝着高技术、高效率、高生产的方向不断发展。农业生产的不断进步,使得我国玉米的种植
针对不同结构的液冷板,采用标准的k-e湍流模型,运用有限元分析软件FLUENT对电池模组液冷板进行建模仿真。研究结果表明,双进出水口结构液冷板对冷却液的散热性能明显好于单进
为解决济南黄河隧道项目施工中出现的泥水盾构机搅拌器频繁卡滞问题,基于计算流体力学采用DPM和滑移网格方法建立了泥水盾构机搅拌器工作的仿真模型。根据仿真模型研究了实际