音字转换相关论文
音字转换是指由计算机自动地将拼音串转换为汉字串。音字转换技术是中文信息处理领域一个重要的研究方向,在语音识别、中文拼音输......
同音词的智能识别是一个具有重要研究价值和应用价值的研究方向,机器词典作为其中的基础资源和判别依据,在整个同音词识别系统中具......
随着自动语音识别从孤立词发展到大词汇量连续语音,发音词典已成为这类系统的重要组成部分之一,它一方面对语言模型有着影响,又在词层......
该文研究的音字转换模块中,首先实现了对用户键盘输入拼音串的分析和预处理,以汉语拼音知识为指导,研究了拼音流的自动切分、检错......
汉字输入技术是中文信息处理领域特有的一项基础性关键技术,中文输入法是中文用户使用计算机必备的应用软件。依赖于键盘的中文输入......
本文以音字转换问题为背景,以最大熵模型为基本框架,对汉语语言模型进行研究。音字转换是指由计算机自动地将连续的拼音串转换成相应......
词法分析是自然语言处理领域中最基础的处理步骤,尤其对汉语这种没有分割符的语言来说更是如此。本文研究的汉语词法分析主要包......
本文对中国盲文计算机系统语句级输入法进行了研究。主要内容如下: (1)在音节串切分方面,结合拼音纠错技术,引入了拼音最大匹配算......
本文实现了基于N-gram统计语言模型的音字转换栈解码算法,提出了双栈和多栈两种策略并设计和优化了搜索算法,引入了中文词法树来限......
该文讨论了为研制拼音—汉字自动句转换系统而设计的支撑环境和开发工具—字音转换工具、语料抓取对齐工具和音字转换评判工具的实......
关于拼音汉字智能转换的研究大都致力于整句分析转换。这样做难度很大,且在汉字键盘输入的应用中,修改错误的汉字也不方便。该文提出......
该文主要研究词义知识的利用,词义模型训练和词的发类问题。首先给了使用统计模型标准中文文本词义的实验。其中,所用的词义标注集包......
语音识别是人工智能领域的一个重要课题,其在人机交互、办公自动化、通讯以及军事等领域都有着重要的作用.近年来,随着计算机技术......
文中描述了一种在音字转换系统中从规模不限的在线文本中自动获取纠错规则的机器学习技术.该技术从音字转换结果中自动获取误转换结......
提出了一种语句级汉字输入技术,把N-gram统计语言模型与语言规则结合起来共同指导拼音流到文字流的转换过程.描述了拼音流自动切分......
音字转换在语音识别和汉字语句键盘输入方面都占有很重要的地位,现在比较流行的方法是基于大语料统计的Markov模型的音字转换方法,其中基于......
该文介绍了语句级汉字拼音输入技术评估方法的研究意义及其重要性。从信息论角度出发,提出了基于损失函数的语句级汉字拼音输入技术......
本文提出一种集成声学和语言学(特别是词间近邻关联和远邻语法规则)知识的组合概率模型,以及将这一模型用于音字转换过程的时间同步的......
汉语音字转换是一个重要而困难的问题。语料库语言学为我们提供了新思路。作者们通过建立统计语言模型,将基于语料库的方法与传统......
本文提出了基于多知识源的同音词识别方法。该方法利用上下文条件测试函数实现了不定范围的信息相关处理,并根据词性,语义,位置,音节和......
本文研究了汉语连续语音识别音字转换中的容错算法,以纠正声学识别的替代、插入、删除错误.为了解决容错算法的计算量问题,本文提......
针对N-gram在音字转换中不易融合更多特征,本文提出了一种基于支持向量机(SVM)的音字转换模型,有效提供可以融合多种知识源的音字......
音字转换是中文信息处理领域的一个重要研究方向,在语音识别、中文拼音输入中都有广泛应用。该文对音字转换中的拼音流切分歧义问......
本文提出了音字转换学习系统的模型,给出了它所采用的三种机器学习形式:单词学习,规则学习,参数修正学习、单词以及规则的自动获取......
提高音字转换的正确率是新一代汉字输入技术-语句输入技术的核心问题,而基于语料库统计模式和基于语法规则相结合是提高音字转换正......
提出了一种语句级汉字输入技术,把N-gram统计语言模型与语言规则结合起来共同指导拼音流到文字流的转换过程。描述了拼音流自动切分、词网......
针对汉语语言模型中的数据稀疏问题,利用词语语义信息,将词语相似度同back-off平滑技术相结合,提出一种基于词语相似度的汉语语言模型......
本文系统介绍了拼音-汉字转移系统的设计与实现方法。系统主要由拼音自动分词子系统和语法分析子系统两部分组成,拼音自动分词了了系......
音字转换是汉语言信息处理的一个重要方面,在语音识别、汉语拼音输入等方面都有广泛的应用。本文首先回顾了词树的理论知识,然后对词......
为准确抽取语料库中的高频词串,使其能更好地应用于语言模型中,提出了一种基于字串切分度的中文高频词串(CFS)抽取算法,并用该算法抽......
文中描述了一种在音字转换系统中从规模不限的在线文本中自动获取纠错规则的机器学习技术。该技术从音字转换结果中自动获取误转换......
介绍利用语言模型实现音字转换的一种高效解码算法,涉及到零概率重估、路径剪枝和多音字处理等技术,实验结果证明算法有效。......
隐马尔科夫模型是当今应用最广泛的语言模型之一。为了提高模型的描述能力,通常模型中的“有限历史假设”被扩展,得到高阶的隐马尔......
案多人少怎么办?书记员不够用怎么办?法官助理配不齐怎么办?法官疲劳办案怎么办?书记员、法官助理、法官,职责应该怎么划分?法院的......
介绍语句级汉字拼音输入技术的基本原理,讨论在移动设备上面临的问题和解决方案,并实现基于Android操作系统的语句级汉字拼音输入......
汉语音字转换和句子规范化处理是中文信息处理研究中的难题。本论文以汉英语音翻译系统为研究背景,对音字转换和汉语句子规范化处理......
文中首先通过语言学特征表来对文本信息进行结构化处理,同时实现了对远距离约束的表示;然后借助于面向个体的数据泛化算法来去除语......
语言模型是自然语言的数学描述,是人们为了解释、利用自然语言规律而构建的抽象的形式化系统。语言模型的研究是自然语言处理领域......
识别结果纠错是提升语音识别系统的一个重要手段。本文将识别结果纠错看成是错误的识别结果到正确的结果之间的翻译,提出一种基于......
在语音识别的后处理中使用良好的语言模型能够在很大程度上改善语音系统的识别效果。本文对语音识别中基于规则的语言模型进行了研......
维吾尔语是属于阿尔泰语系的黏着性语言,构词特点比较复杂,尤其是维吾尔语中的人名,由于来源差别巨大,识别难度很高,到目前为止,还......
本文提出了基于多知识源的同音词识别方法。该方法利用上下文条件测试函数实现了不定范围的信息相关处理,并根据词性、语义、位置、......
随着安卓系统的日益普及以及微博、微信等应用的广泛传播,人们越来越依赖于通过手机、平板等手持设备进行沟通和交流。快速高效地......