中文分词算法研究综述

来源 :成组技术与生产现代化 | 被引量 : 0次 | 上传用户:guanyucomputer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对制约中文分词算法效能的歧义消除和未登录词识别两大瓶颈,归纳和总结近年来基于词典、基于统计以及基于语义理解中文分词算法的研究内容.基于词典的分词算法以提高时间和空间效率为目标,通过改进词典结构来提高分词效率.双字哈希结构是目前查词性能较好的词典机制,但对于歧义消除和未登录词识别的贡献度有限.基于统计的分词算法通过改进统计语言概率模型,在一定程度上可消除中文分词的歧义,较好地识别出未登录词.条件随机场模型(CRF)综合了隐马尔科夫模型(HMM)和最大熵模型(ME)的特征,是目前基于统计分词算法的主流训练模
其他文献
近年来,企业之间相互拖欠货款形成的“三角债”问题。已引起了社会各界的高度关注,为了彻底解决这个问题。今年四月份以来,从中央到地方的各级政府和银行都投入大量的人力、
稻瘟病是水稻的主要病害之一,在世界各水稻种植区域发病率都较高,严重影响着水稻的产量。抗稻瘟病基因的定位和克隆技术被认为是水稻新品种选育及防治稻瘟病的关键策略。就近
高校附属医院产权制度改革是一项系统工程,需要几方面制度条件的支持才可能取得成功,包括:完善的法律和政策条件;行政主管部门职能改变--实现政院分开;建立新型领导体制和管
目的:探讨临床药师参与药物治疗方案的制订与药学监护的方法.方法:临床药师参与了1例患者的抗感染治疗,通过文献和指南的学习,分析评价治疗方案,提出用药建议,并开展药学服务.结果:临床药师的建议被采纳,患者病情好转出院.结论:临床药师可协助医师制订更为安全有效的治疗方案,对患者康复有促进作用.
目的探索操作简便,环境友好的4-苯基-5-乙氧羰基-6-甲基-3,4-二氢嘧啶-2(1H)-酮的合成方法。方法 以苯甲醛、乙酰乙酸乙酯和尿素作为起始原料,在无溶剂和微波加热条件下,选择1-丁基-3-甲基咪唑
目前强化赖氨酸的研究,不仅限于了解受试对象蛋白质代谢情况,而且已扩展到从器官、组织和分子水平。观察对机体脂类代谢、免疫、核酸、酶和激素等影响,并对有关机理进行了探
戏剧界倘若有勇气,便必须正视戏剧不断衰落的严酷现实。感叹也好,人为地“振兴”也罢,都无济于事。人们一再将戏剧衰落的原因归结为电影、电视的冲击、多样化的娱乐选择和商
一、有计划的商品经济是一种新型的经济制度。计划调节和市场调节的关系是溶合关系,即共性的发展和差异的互补。人们在讨论计划与市场的关系时。要么把经济制度(计划经济)与
又一个充满希望的新春已经来临。
骶管阻滞麻醉是小儿外科手术中常用的麻醉方法,具有操作简便、安全有效的特点。笔者比较了氯胺酮复合骶管阻滞与传统氯胺酮用于不同年龄小儿疝气的临床效果,现报道如下。