正向最大匹配相关论文
分词和词性标注是自然汉语处理(NLP)的基础,前几届师兄已经在这方面做了大量的研究,我所做的课题就是在他们的基础上对这部分内容进......
由于来自于网络的信息具备信息量大、信息来源复杂等特点,人们在查找自己需要的信息时,已经习惯使用搜索引擎作为信息筛选的工具。......
词是语言中最小的能够独立活动的有意义的语言成分,是信息处理的基本单位。词频统计、语音识别、字符识别、自动分类、机器翻译、......
做为最直接的分词思路,最大匹配具有直观、实现简单等优点,但也存在着精度低的致命缺点。本文对正向匹配算法做了实现和分析,为该方法......
中文分词技术是一项在搜索引擎中广泛应用的关键技术,也是中文信息处理中的一项关键技术。文章通过对中文分词系统中预处理模块的......
设计了一个正向最大匹配和逆向最大匹配共用的正序分词词典,该词典占用内存较少并且易于维护。在此分词词典基础上用PHP实现了双向......
针对在科技文献中,未登录词等相关专业术语其变化多端,在中文分词中难以识别,影响了专业领域文章的分词准确度,结合实际情况给出了......
中文分词是中文信息处理的基础,在诸如搜索引擎,自动翻译等多个领域都有着非常重要的地位。中文分词词典是中文机械式分词算法的基础......
随着当代信息技术和应用的快速发展,文献和数据正在以前所未有的速度增长。在我国,中文文献和数据等更是以惊人的速度增长。在此背......
汉语分词词典是中文信息处理系统的重要基础,词典算法设计的优劣直接关系着分词的速度和效率。分析了三种典型的分词词典结构,提出了......
介绍了中文分词算法和MFC应用程序,在中文分词方面,采用双向最大匹配算法,即正向最大匹配和逆向最大匹配算法。在系统设计方面,采用MFC......
对中文电子病历中的否定术语进行检测,可以为非结构化的电子病历文本的概念索引的建立提供依据。对于电子病历中术语的提取,在经典......
随着国际互联网和企业内部互联网的飞速发展,各种电子文本数据的数量急剧增加,如何快速有效的获取、管理和使用这些文本数据,已经......
现代社会是一个信息社会,随着计算机的普及以及互联网的迅猛发展,每天都有大量信息以电子文档的形式出现在人们面前。如何在海量信息......
分词是中文信息处理的一部分,分词本身并不是目的,而是后续处理过程的必要阶段,是中文信息处理的基础技术.正向最大匹配法是一种基......
随着Internet及网络技术的发展,计算机技术得到了广泛应用。网上教学平台是Internet和网络应用的一个典型案例,而自动答疑系统是网......
从搜索流程的分词和页面排序出发,由于中文分词比较复杂,鉴于正向最大分词算法和逆向最大分词算法的优缺点,提出基于正向最大和逆向最......
为了让计算机具有处理甚至理解自然语言的能力,人们发明了很多自然语言语义分析理论。但是应用在电力系统工作票和操作票的领域中还......
为了提高俄语地名翻译效率,本文通过分析俄语语音特点和俄语地名音译规则,构建了俄汉音译对照表,提出了一种俄语地名专名自动快速......
对于中文电子病历文本中的否定术语的检出,目前有很多方法,基于规则的否定检出是比较常用的一种算法。但是该方法无法解决由于标点......