基于词典和词频的中文分词方法

来源 :微计算机信息 | 被引量 : 0次 | 上传用户:colinvin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉语分词是中文信息处理的前提和基础。由于中文句子中,词与词之间没有明显的分隔标志,且存在多音多义词,因此不可避免的存在切分歧义。汉语分词已成为中文信息处理的"瓶颈"。本文通过使用带有词频的词典,采用逐词分解实现了中文自动分词,并使用词频计算、歧义消除等方法提高了分词的准确率。
其他文献
目的探究超声心动图在心肌梗死诊断中的应用价值。方法对2013年12月~2014年5月收住在我院心血管内科疑似为心肌梗死的120例患者的临床资料和实验室数据进行分析,依据心电图不
<正> 据统计,《红楼梦》里描写的人物有六百人左右(包括后四十回),其中有姓名的约有三百余人。给这些众多的人物安上一个名字,看起来好象很容易,事实上却不是简单的事情。曹
非营利组织,又称非政府组织,志愿者组织,第三部门等,20世纪70年代兴起,80-90年代在全球范围内得到迅速发展。作为一种新生力量,非营利组织在现代社会生活中发挥着重要作用,引
本论文以三峡库区后靠移民的生活方式为研究对象,其研究方法主要是采取文献资料法、参与观察法、个案访谈法等手段,通过对后靠移民的生产方式、住房、交通、作息、消费、饮食
自上世纪80年代以来,西方主要国家进行了一系列卓有成效的政府改革与创新。基于对英国、美国、日本、澳大利亚、新西兰等西方主要国家中央政府机构架构及运行机制的前期研究,
在硅谷的中国大陆电脑工程师中,正在兴起一股投资创业的热潮。由于他们独特的文化背景,其中的成功者将对硅谷的文化,社会结构产生长远的影响。 Among computer engineers in
期刊
本文在综述各类多水平中介模型的基础上,聚焦于自变量、中介变量、因变量都来自多水平结构中较低水平的多水平随机中介效应模型,通过蒙特卡洛模拟研究比较该模型与简化的多水
目的探讨优质护理对改善重症急性胰腺炎患者生活质量的有效性。方法研究对象为2014年2月至2015年1月间被我院收治患者共90例,将其随机分为2组,对照组给予常规护理,观察组给予
《斜阳》中的人物直治是一个无赖。通过对文本中直治言行的分析,认为其所说的“贵族”实质为精神贵族。直治推崇拥有本真、纯粹的品质的精神贵族,对虚伪的社会与人类充满不信
<正>伦理学总是与对人性的理解纠结在一起。伦理学何以可能的问题或许可从对人性结构的理解中找到终极根据。维持和繁衍生命是人的物性,寻求生命的意义是人的神性。神是无限