中文分词技术综述

来源 :全国Web信息系统及其应用学术会议、全国语义Web与本体论学术研讨会暨全国电子政务技术与应用学术研讨会 | 被引量 : 0次 | 上传用户:aaasssddd001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本分类有助于用户有选择地阅读和处理海量文本,因此其预备工作——分词系统的研究很有意义。汉语分词是计算机中文信息处理中的难题,也是中文文献内容分析中必须解决的关键问题之一.本文对已有自动分词方法进行研究,实现对应的分词系统,分析这些方法的分词率和效率。
其他文献
本文提出一种分层环状的NoC拓扑结构,该结构中链路具有两组环网,每组由一条数据环和一条控制环所组。针对于这种结构,提出了时分复用、优先级机制,空分路由分配,有保证服务策
会议
我做次贷生意,专和银行谈判我的工作,就是帮那些还不起房贷的人和银行谈判,以低于房贷的价格,将房子卖掉。这样,银行虽然吃亏,但收回的是钱,而不是房子;贷款者获得解脱,保住
多线程技术是当前嵌入式系统开发中的常用技术,但一般都依赖于操作系统或者特定的函数库,通用性和可移植性较差.本文提出了一种通用的轻量级多线程模型1wThread,采用标准C语
会议
本文描述了在层次式FPGA上的基于动态规划的布线算法策略.本文首先分析了层次式FPGA结构的特点,实现了基于树形的布线资源图动态规划的布线策略.它利用了层次式结构的特点,在
本文分析了用于高速串行收发系统接收端的时钟分频电路的设计,通过对扭环计数器计数原理的分析,提出了一种基于类扭环计数器的分频电路,该电路可以模式可选的实现奇数分频和
面对转基因食品,食用安全的问题是人们首先考虑的,例如插入基因的漂移、抗性、过敏和中毒等。众多专家对转基因食品的安全问题已经进行了许多研究,并在不少实际工作中得到应
针对参数化Cache一致性协议状态空间爆炸问题,本文提出共享集合伪临界值(pseudo-cutoff)的概念,有效优化了参数化目录Cache协议状态空间,并提出了解决小概率的大共享度事件的
存储设计是影响SoC系统性能和功耗的重要因素.在SoC系统级设计过程中,早期存储需求分析,有助于SoC设计与优化并缩短上市时间.本文提出一种面向SoC软硬件划分的多粒度应用程序
会议
解释可满足性模理论(Satisfiability Modulo Theories,SMT)公式不可满足的原因在众多领域都具有非常重要的理论与应用价值,而极小不可满足子式能够为公式不可满足的原因提供
会议
针对用户的个性化兴趣,满足人们对个性化高质量搜索引擎的需求,本文将面向特定领域的垂直搜索引擎与Web信息挖掘技术相结合,构建了可完成个性化Web信息检索的模型.在模型构建