基于多知识源的中文词法分析系统

来源 :计算机学报 | 被引量 : 0次 | 上传用户:snowl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉语词法分析是中文自然语言处理的首要任务.文中深入研究中文分词、词性标注、命名实体识别所面临的问题及相互之间的协作关系,并阐述了一个基于混合语言模型构建的实用汉语词法分析系统.该系统采用了多种语言模型,有针对性地处理词法分析所面临的各个问题.其中分词系统参加了2005年第二届国际汉语分词评测,在微软亚洲研究院、北京大学语料库开放测试中,分别获得F量度为97.2%与96.7%.而在北京大学标注的《人民日报》语料库的开放评测中,词性标注获得96.1%的精确率,命名实体识别获得的F量度值为88.6%.
其他文献
DNA分子计算的工作原理是对生物系统进行编码,以生物化学反应为基础,利用生物技术实现生物系统的状态转移来推进计算过程.2001年以色列的Yaakov Benenson等人在基于DNA计算的发
除了流行的MD和MP3随身听,CD随身听同样是市场上的焦点。广泛的软件支持、良好的音质和相对便宜的价格都是CD随身听的优势所在。经常听到有人问,索尼(SONY)和松下(Panasonic)哪
很多人不了解、为什么一些人身边总少不了一个价格昂贵的盒子和花哨的碟片。让我来解开这个谜吧!因为我们是年轻的生命,年轻的生命怎能缺少优美的音乐?怎能没有酷炫的时尚?又
随着DNA计算的不断发展,如何克服穷举算法带来的指数爆炸问题已成为DNA计算领域的重要研究目标之一.将图灵机中的剪枝算法设计技术应用于最大团问题的DNA计算中,提出一种最大团
如今数码摄像机(DV)正逐步走入平常百姓家庭,但其拍摄时间不长始终是一个令人头痛的问题,通常最长的摄录时间不会超过1小时,这为用户带来了诸多不便。因此,给爱机再配备一块大容
常言道:“好记性不如烂笔头”,意思是说,记忆力再好,也不如用纸笔记录来得牢靠。不过本文的主角可不是传统意义的纸笔,而是数码产品大家族中的一员——数码录音笔。
常有这种摄友——他们在网上交流摄影心得,利用互联网组织大家集体活动。他们把这类外出采风的活动称作“外拍”:邀请数个MM当模特,到当地的一些风景区或者公园进行人像或风景拍
网络入侵检测系统的处理速度越来越难以跟上网络的速度,使用多个探测器并行处理网络数据流可以大幅度提高网络入侵检测系统的性能,其关键问题是如何将网络流量划分给多个探测器
随着工艺的进步,微处理器将面临越来越严重的软错误威胁.文中提出了两种片上多核处理器容软错误执行模型:双核冗余执行模型DCR和三核冗余执行模型TCR.DCR在两个冗余的内核上以