歧义处理相关论文
中文分词是中文信息处理领域的基础课题,也是中文信息处理发展的瓶颈之一,其中对歧义字段的处理是影响分词精度的关键,国内外许多研究......
自动分词技术是中文信息处理的基础工程。任何基于词一级中文处理应用系统都离不开分词系统。自动分词技术的重点和难点在于歧义切......
汉语自动分词是中文信息处理领域的基础课题,也是中文信息处理发展的瓶颈之一,其中对歧义字段的处理是影响分词精度的关键,国内外......
随着企业信息的飞速增长,企业信息检索逐渐成为信息检索领域研究的热点,中文分词作为信息检索的文本处理阶段一个重要步骤,直接影......
中文自动分词是实现搜索引擎信息检索的基础,长期以来一直是人们研究的重点,它广泛应用于中文信息处理的各个领域。传统的分词系统大......
自动分词技术是汉外机器翻译的基础工程。 汉语自动分词不仅是汉外机器翻译的必要环节,也是各种汉语信息处理包括语音处理、词频......
中文分词是计算机进行汉语文本分析的关键技术,分词算法的好坏直接影响中文分析系统的实用性,搜索引擎是中文分词技术的重要应用之......
针对自然语言理解歧义处理的研究现状,以及自然语言理解在现代产品设计中的应用情况,本文主要进行了以下研究工作:1.分析了歧义处......
自然语言理解是人工智能的一项重要环节,而歧义处理又是自然语言理解中的难点之一。本文通过对歧义现象的分析,提出了针对特殊搭配......
歧义处理是影响分词系统切分精度的重要因素,是自动分词系统设计中的一个最困难也是最核心的问题。该文利用一种统计的方法来解决交......
对中文文本的公司名简称的识别提出了一种有效的识别方法,即在公司名第一次出现时要充分利用其给出的定义信息,作为以后识别此公司......
介绍中文分词算法的理论知识,通过介绍歧义存在的种类,分析分词结果出现歧义的必然性.提出改进"退一字组合法",实现歧义消除.在保持......
藏文自动分词问题是藏文自然语言处理的基本问题之一。针对藏文自动分词中的重点难点,例如:格助词的识别、歧义切分、未登录词识别......
叙述了雅信 CAT— 2.5简体英汉双向版(网络版)和东方快车3000英汉翻译软件对源语的切分以及由源语向译语转换的过程。翻译软件使用......
探讨可测集E[x;f(x)>a]存在歧义性,给出处理办法.同时证明:如果f(x)在E上可测,并且规定当f(x)=0时,(1)/(f(x))=+∞;当f(x)=±......
提出了一种基于语词的分词系统,设计了相应的分词词典.该分词词典支持词条首字Hash查找和标准的不限词条长度的二分查找算法,并应......
近年来,信息技术日新月异,带动了各个行业的迅速发展,相应的数据量也在不断剧增,地址信息也相应地跟随更新和增加。电子地图的出现......
从自动分词中歧义产生的根源上对歧义进行了新的分类,并给出了处理每一类歧义的方法,提出自动分词中的歧义研究应集中在对第二类歧义......
随着数字信息时代的到来,搜索引擎的索引数据变得越来越大,其开发与维护的成本亦越来越高。开源的全文搜索引擎工具包Lucene作为一......
本文研究了汉语与手语(Sigh Language)这两种不同语言形式各自的特点,并结合语言学的知识加以说明。另外,本论文根据汉语到手语翻......
中文分词是中文信息处理的基础技术之一,被广泛应用于搜索引擎、机器翻译、自动分类、自动校对、语音合成等方面。阐述了一种基于双......
歧义处理是汉语自动分词的核心问题,汉语自动分词是中文信息检索的基础性课题.目前有基于词典的分词方法、基于统计的分词方法、基......
随着“信息化”军事作战时代的到来,单纯人工处理海量的作战文书已经远远不能满足信息提取的快速性和正确性的要求,那么人们希望计算......
针对互联网环境下新词出现和更新频率高的特点,将机械分词与基于规则分词相结合,提出一种动态更新词库的中文分词架构.本架构给出......
词是最小的能独立运用的语言单位,然而汉语不同于西方语言的一个显著特点是文本中词与词之间没有显式的分隔标记。中文分词是是中......
分类是数据挖掘领域的研究热点,具有重要的意义,被广泛应用在现实生活中。虽然现阶段分类技术已经比较成熟了,但随着人类社会的发展,出......
随着计算机网络的飞速普及,人们已经进入信息时代。在这个信息社会里,信息的重要性与日俱增,无论是个人,企业,乃至政府都需要获取,......
随着信息时代的到来,人类将面对着浩瀚的信息海洋。已知在由计算机进行存储的信息中有80%是由文字为载体进行传输的。面对这样庞大......
对于汉语的自然语言处理来说,汉语自动分词是文本分析的第一个步骤。目前的中文分词方法,可以分为基于词典的分词方法、基于统计的......
随着现代信息技术的发展,自动分词技术已经广泛应用在信息检索、信息抽取、机器翻译、语音合成等自然语言处理领域,同时结合中文文......
随着互联网的快速发展,数据信息呈指数级增长,分类算法在大规模数据面前面临着巨大的挑战。当前,国内外的学者对分类模型与算法的......