词典机制相关论文
分词词典是基于词典机制的汉语自动分词系统的重要组成部分,其性能的优劣直接影响到分词系统的速度和效率。本文首先总结了目前常用......
随着计算机技术和网络技术的不断发展,校园网作为学校内部信息共享、校际间信息交流的平台也得到了快速发展。校园网上信息量的增......
分词词典是汉语自动分词系统的一个基本组成部分,词典的查询速度直接影响到分词系统的处理速度。在因特网上的中文文本检索、汉字......
中文自动分词是实现搜索引擎信息检索的基础,长期以来一直是人们研究的重点,它广泛应用于中文信息处理的各个领域。传统的分词系统大......
由于通用搜索很难满足个性化和专业化的需求,垂直搜索应运而生。垂直搜索能提供给人们更相关的信息。本文对中文垂直搜索中的几个......
分词词典是基于词典机制的汉语自动分词系统的重要组成部分,其性能的优劣直接影响到分词系统的速度和效率。本文首先总结了目前......
近年来,随着国民经济信息化的不断发展以及Internet的普及,中文信息处理技术的应用日益广泛。由于中文文本是按句连写的,词间无间......
中文分词是中文信息处理系统中的一个重要部分。主题信息检索系统对分词的速度和准确率有特殊的要求。文中回答了词库建立的词条来......
针对现有中文分词算法无法为移动搜索提供用户兴趣偏好信息的现状,提出一种改进的正向最大匹配中文分词算法。该算法基于逐字二分......
词典的查询速度直接影响到分词系统的处理速度,从而影响到整个系统的性能,基于多重数组的分词词典技术很好的解决了词典的查询速度......
本文主要通过对影响正向最大匹配算法效率的因素的分析,提出对该算法的一点改进,以及设计了相应的词典结构,以期在匹配过程中尽可......
针对汉语分词词典中双字哈希索引机制未能充分利用索引分词,而分词效率又明显优于首字哈希索引机制的问题,在充分分析汉语构词特点......
中文分词是中文信息处理的前提,本文研究了已有的分词算法、分词词典机制,提出了一种新的词典机制——带词长整词二分词典。该方法通......
在使用相同分词算法的情况下,词典机制决定着词语的查询速度,也影响着分词的速度和分词系统的广泛应用。根据词语在文本中出现频率......
汉语词典机制很大程度上影响中文分词的效率.为了提高现有基于词典的分词机制的查询效率,在双哈希词典机制和整词二分法相结合的基......
实现了一种基于哈希表索引和匹配算法的藏文分词的系统。进行分词时,为达到消除部分歧义的目的,采用了正向最大匹配和逆向最大匹配......
深入探讨基于词典的分词过程、常见词典结构以及分词算法。在分析现有系统的基础上,设计一个新的词典结构,对经典的分词算法进行改......
海军舰船是一个庞大的系统,它拥有种类繁多、数量庞大的设备。随着舰船技术日益发展,越来越多结构复杂的设备被应用到舰船上。一方......
随着数字信息时代的到来,搜索引擎的索引数据变得越来越大,其开发与维护的成本亦越来越高。开源的全文搜索引擎工具包Lucene作为一......
分词词典是信息处理系统的一个基本组成部分,其查询效率将直接影响信息处理系统的性能。根据信息在计算机内都是以二进制编码存放......
针对制约中文分词算法效能的歧义消除和未登录词识别两大瓶颈,归纳和总结近年来基于词典、基于统计以及基于语义理解中文分词算法......
自动分词是中文信息处理的关键步骤。由于具有结构简单、易于实现和开发周期短等优点,基于词典的分词方法被广泛应用。结合中文多......
为提高逆向最大匹配分词算法的速率,分析传统的整词二分词典机制,针对哈希结构尾字词典的不足,提出一种基于双哈希结构的整词二分......
汉语词典查询是中文信息处理系统的重要基础部分,对系统效率有重要的影响.国内自80年代中后期就开展了中文分词词典机制的研究,为......