中文分词器相关论文
自然语言处理是计算机科学领域与人工智能领域中的一个重要方向,广泛用于源自邮件、音频、文件、网页、论坛、社交媒体中的数据分析......
利用Hash表在查找效率上的优势,提出了基于Hash机制的词典查找、更新、删除和添加等操作算法.该算法根据汉字GB码的特点,将保存首......
Lucene是一个高效的全文检索工具包,本文主要研究了Lucene的体系架构及其在中文检索上的应用。通过对基于最大匹配算法的中文分词......
针对通用搜索引擎不能检索校园网内网的不足,提出建立校园网搜索引擎,实现为用户提供基于关键字进行校园内部信息检索的服务平台。通......
在对工艺知识的检索需求分析基础上,提出了适用于工艺领域的知识检索方法,并构建了以搜索引擎架构Lucene为基础的检索流程。为解决工......
摘要:农业由原来的小农经济模式向现代集成化迈进,不断产生农业系统知识,通过农业集成化,提出了农业知识库系统的架构设计这一个新型概......
Lucene开放源代码的特性让很多人使用它来构建具体的全文检索应用,然而对于中文检索来说,Lucene自带的中文分词器对中文的分词处理......
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清......
提出了农业知识库系统的架构设计。同时,介绍了农业知识库的设计、中文农业专业分词器以及查重器设计与实现;并给出了中文农业专业分......