论文部分内容阅读
文语转换技术与自然语言处理和语音信号处理密切相关,它是试图利用计算机技术来模拟人类具有的自然语音功能。研究文语转换技术对于人机语音通信、自然语言人机接口和智能计算机系统等,都有十分重要的理论意义和实用价值。 作者总结和分析了近年来国内外在文语转换领域出现的新方法和新技术,提出了文语转换的两阶段理论模型,在此基础上可以将现有的各种文语转换技术统一起来,促进对文语转换的理论研究。 本文运用自然语言理解的方法来研究提高文语转换系统性能的新途径,通过对文本句子的词法分析和句法分析等获取其对应的音段特征参数和超音段特征参数,提出并实现了基于SC-分析方法的文本正则化、句法分析和字音转换等。 在文本正则化过程中研究了句子边界的确定、特殊符号的读音处理方法、缩略语的扩展方法和词语边界的确定等问题。关于句子边界的确定给出了根据结构特征和上下文条件的实现算法,并讨论了对具有歧义的标点,如“,”、“.”和“:”的处理方法;在特殊符号处理中主要讨论了数字串的读音问题;缩略语在英语文语转换中必须进行扩展,本文提出了缩略语词典结合上下文分析的扩展方法;在词语边界的确定过程中,我们分别讨论了英语短语边界的确定和汉语的分词问题; 关于英语短语边界的确定,本文讨论了利用短语词典和短语规则的实现方法;在汉语自动分词的研究中,作者提出了用MM法一遍完成切分与歧义字段检测的算法,并提出并实现了利用词频和词长等信息校正歧义字段的方法。 在句法分析中,本文主要讨论了句子结构和兼类词的词性确定问题,因为在英语中,有些词的读音与其在句子中充当的词性有直接的关系;在此,本文给出了以SC-文法为基础的句法分析的实现算法,根据句法规则来确定兼类词的词性。 在字音转换中,分别讨论了英语和汉语的字音转换策略。关于英语的字音转换,本文给出了利用字音转换规则结合例外词词典确定单词读