融合语言学知识与统计方法的汉语分词

来源 :信息与电脑 | 被引量 : 0次 | 上传用户:s5067744
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
笔者介绍了一种汉语分词框架,能够综合利用语言学知识与统计方法对输入的汉语句子实施词汇切分。首先,根据机读词典从汉语句子中切分出可信度最高的单词;然后,使用统计方法从大规模语料库中提取高频出现的元组,并利用这些元组对汉语句子进行词汇切分;最后,消除两种词汇切分结果中的歧义。
其他文献
2001年,随着国家《幼儿园教育指导纲要(试行)》的颁布,广西各地市幼儿园出现了新一轮的幼儿园课程改革热潮,幼儿园的各种方案教学纷纷出台。但是,我们的许多幼儿园对于方案教学的
活字帖是在电脑、移动设备上通过软件来模拟传统书法的临摹练习,汉文的活字帖已经在国内诞生并且被广泛使用,取得了很好的成绩。不仅练习方便,同时又能达到书法练习的效果。汉文
关于元年,我们说过很多,云计算元年,大数据元年,移动互联网元年,等等。我曾经写过一篇文章叫做《2009,中央网络银行元年》,写的是当时的支付宝,从纯净的市场规则来看,支付宝一路走来,确
利用大气等离子喷涂技术(APS),在45号钢基体上制备纳米掺杂5%-30%Al2O3+13%TiO2(质量分数)涂层,利用扫描电镜(SEM)、X射线衍射(XRD)等技术手段测定涂层组织结构及密度、孔隙度、通孔率等性
计算机技术在经济的发展中是非常重要的,伴随着科技的发展,已步入了信息时代。计算机技术的出现,可以为人们的工作和生活提供便利,也能够为人们带来经济效益。分层技术在计算
随着社会信息化程度的提高,网络舆情事件频频发生,地方政府网络舆情监测的紧迫性日益突出。笔者通过对地方政府网络舆情监测的需求分析,提出了舆情监测系统模型,设计了系统架
根据语文课程标准中“认识中华文化的丰厚博大”的精神和我校学生的实际情况,我们选择了“中国文化经典诵读”作为校本课程来加以开发。从2002年12月进入实验,我们借鉴了台湾
儿科门诊输液一直以来都是最考验护理人员护理服务厦门质量的区域。因服务对象的特殊性,不仅需要护理人员不断提升临床护理技术水平,灵活运用各种沟通技巧也成了应对突发护患
业委会的法律地位尚待认可狄尚志:《物权法》草案在第六章中,明确了业主委员会可以对"对任意弃置垃圾、侵占通道、排放大气污染物、施放噪声、违反规定饲养动物、违章搭建、