基于多知识源的中文词法分析系统

来源 :计算机学报 | 被引量 : 0次 | 上传用户：snowl

【摘要】

：

汉语词法分析是中文自然语言处理的首要任务．文中深入研究中文分词、词性标注、命名实体识别所面临的问题及相互之间的协作关系，并阐述了一个基于混合语言模型构建的实用汉语词

【作者】

：

姜维王晓龙关毅赵健

【机构】

：

哈尔滨工业大学计算机科学与技术学院

【出处】

：

计算机学报

【发表日期】

：

2007年1期

【关键词】

：

词法分析汉语分词词性标注命名实体识别语言模型 lexical analysis Chinese word segmentation part-of-

【基金项目】

：

本课题得到国家自然科学基金重点项目“问答式信息检索的理论与方法”（60435020）及国家自然科学基金（60504021）资助.

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

汉语词法分析是中文自然语言处理的首要任务．文中深入研究中文分词、词性标注、命名实体识别所面临的问题及相互之间的协作关系，并阐述了一个基于混合语言模型构建的实用汉语词法分析系统．该系统采用了多种语言模型，有针对性地处理词法分析所面临的各个问题．其中分词系统参加了2005年第二届国际汉语分词评测，在微软亚洲研究院、北京大学语料库开放测试中，分别获得F量度为97．2％与96．7％．而在北京大学标注的《人民日报》语料库的开放评测中，词性标注获得96．1％的精确率，命名实体识别获得的F量度值为88．6％．

其他文献

基于DNA计算的分子下推自动机

DNA分子计算的工作原理是对生物系统进行编码，以生物化学反应为基础，利用生物技术实现生物系统的状态转移来推进计算过程．2001年以色列的Yaakov Benenson等人在基于DNA计算的发

期刊

分子下推自动机DNA计算biomolecular pushdown automaton DNA computing

主流CD随身听导购——一网打尽

除了流行的MD和MP3随身听，CD随身听同样是市场上的焦点。广泛的软件支持、良好的音质和相对便宜的价格都是CD随身听的优势所在。经常听到有人问，索尼(SONY)和松下(Panasonic)哪

期刊

CD随身听MDMP3随身听松下音质索尼选购导购市场价格

芸芸众生话数码

很多人不了解、为什么一些人身边总少不了一个价格昂贵的盒子和花哨的碟片。让我来解开这个谜吧!因为我们是年轻的生命，年轻的生命怎能缺少优美的音乐?怎能没有酷炫的时尚?又

期刊

年轻享受家族生命MD数码音乐激情音响碟片时尚

一种改进的最大团问题DNA计算机算法

随着DNA计算的不断发展，如何克服穷举算法带来的指数爆炸问题已成为DNA计算领域的重要研究目标之一．将图灵机中的剪枝算法设计技术应用于最大团问题的DNA计算中，提出一种最大团

期刊

DNA超级计算最大团问题剪枝技术NP完全问题DNA-based supercomputing maximum clique problem prun

电池？我不愁：DIY数码摄像机电池包

如今数码摄像机(DV)正逐步走入平常百姓家庭，但其拍摄时间不长始终是一个令人头痛的问题，通常最长的摄录时间不会超过1小时，这为用户带来了诸多不便。因此，给爱机再配备一块大容

期刊

数码摄像机电池索尼DVFM售价大容量价格DIY需求

数码录音笔导购——好记性不如“烂笔头”

常言道：“好记性不如烂笔头”，意思是说，记忆力再好，也不如用纸笔记录来得牢靠。不过本文的主角可不是传统意义的纸笔，而是数码产品大家族中的一员——数码录音笔。

期刊

导购数码产品主角记录家族数码录音笔

长沙的休闲——世界之窗摄友会外拍随记

常有这种摄友——他们在网上交流摄影心得，利用互联网组织大家集体活动。他们把这类外出采风的活动称作“外拍”：邀请数个MM当模特，到当地的一些风景区或者公园进行人像或风景拍

期刊

长沙数码摄影IT数码影像俱乐部外景拍摄

PABCS：一种用于并行入侵检测的流量划分算法

网络入侵检测系统的处理速度越来越难以跟上网络的速度，使用多个探测器并行处理网络数据流可以大幅度提高网络入侵检测系统的性能，其关键问题是如何将网络流量划分给多个探测器

期刊

入侵检测并行处理流量划分负载均衡序列假设测试intrusion detection parallel process traffic partit

出手联想G808手机

期刊

联想公司G80840和弦铃声GPRS手机七色来电闪灯设计

片上多核处理器容软错误执行模型

随着工艺的进步,微处理器将面临越来越严重的软错误威胁.文中提出了两种片上多核处理器容软错误执行模型：双核冗余执行模型DCR和三核冗余执行模型TCR.DCR在两个冗余的内核上以

期刊

片上多核处理器执行模型软错误恢复软错误屏蔽双核冗余三核冗余chip multiprocessorexecution modelsoft erro

基于多知识源的中文词法分析系统

与本文相关的学术论文