基于SC文法的文语转换系统的研究

来源 :中国科学院研究生院(计算技术研究所) | 被引量 : 2次 | 上传用户:pjzh210427
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文语转换技术与自然语言处理和语音信号处理密切相关,它是试图利用计算机技术来模拟人类具有的自然语音功能。研究文语转换技术对于人机语音通信、自然语言人机接口和智能计算机系统等,都有十分重要的理论意义和实用价值。 作者总结和分析了近年来国内外在文语转换领域出现的新方法和新技术,提出了文语转换的两阶段理论模型,在此基础上可以将现有的各种文语转换技术统一起来,促进对文语转换的理论研究。 本文运用自然语言理解的方法来研究提高文语转换系统性能的新途径,通过对文本句子的词法分析和句法分析等获取其对应的音段特征参数和超音段特征参数,提出并实现了基于SC-分析方法的文本正则化、句法分析和字音转换等。 在文本正则化过程中研究了句子边界的确定、特殊符号的读音处理方法、缩略语的扩展方法和词语边界的确定等问题。关于句子边界的确定给出了根据结构特征和上下文条件的实现算法,并讨论了对具有歧义的标点,如“,”、“.”和“:”的处理方法;在特殊符号处理中主要讨论了数字串的读音问题;缩略语在英语文语转换中必须进行扩展,本文提出了缩略语词典结合上下文分析的扩展方法;在词语边界的确定过程中,我们分别讨论了英语短语边界的确定和汉语的分词问题; 关于英语短语边界的确定,本文讨论了利用短语词典和短语规则的实现方法;在汉语自动分词的研究中,作者提出了用MM法一遍完成切分与歧义字段检测的算法,并提出并实现了利用词频和词长等信息校正歧义字段的方法。 在句法分析中,本文主要讨论了句子结构和兼类词的词性确定问题,因为在英语中,有些词的读音与其在句子中充当的词性有直接的关系;在此,本文给出了以SC-文法为基础的句法分析的实现算法,根据句法规则来确定兼类词的词性。 在字音转换中,分别讨论了英语和汉语的字音转换策略。关于英语的字音转换,本文给出了利用字音转换规则结合例外词词典确定单词读
其他文献
本文以台湾当代美术的文化生态为研究内容,以政府机制、民间资本、精神态势为分析重点,按照时间顺序梳理台湾当代美术发展变化的前因后果,论述台湾当代美术主流化的过程,提出
清代蒙古佛教版画是清代中国佛教版画的重要的组成部分,也是中国佛教版画的一颗璀璨的明珠。其内容丰富,形式多样,种类繁多,不仅丰富了清代佛教版画,而且从数量到质量,从传播
中国肉鸡产业从上世纪八十年代起步,九十年代大规模兴起,到2012年总体规模占世界第二,仅次美国之后。山东省作为我国肉鸡生产的大省,主要采用“公司+农户”的经营模式,通过养
作为十九世纪中后期法国最具代表性的艺术家之一,让-弗朗索瓦.米勒以《播种者》、《拾穗者》、《晚祷》等作品而举世闻名。然而,从十九世纪中期至现在,艺术评论和专业研究中
随着现代社会信息技术越来越发达,各类软硬件技术在图书采编工作中的应用也逐步得到更加广泛的推广和应用。作为国际通用的ISBN编码系统,充分认识其结构和特点有利于进一步发现
本文讨论了一种结合现代科学技术的棒、线材轧机,该设备由压下机架、初轧机组、中间轧机和精轧机组构成。
《The Daily》,这个默多克口中"令人兴奋不已的杰作"、乔布斯赞许过的"i Pad上最令人期待的新闻阅读产品",于2012年12月正式宣告停止运营,享年不到两岁。这是默多克的新闻集团在
这篇论文主要分为两个部分:第一章主要通过分析戍、行、师、卫等地方性军事组织对王畿区进行界说。晚商各个时期,边境压力以东、西两个方向表现得最明显,因此遗留下来的材料也使
来津留学生数量已经具有相当规模,学生数量呈上升趋势,学习专业也逐步由单一的汉语专业扩大到医学、经济等领域。随着高等教育国际化的进程,对留学生教育也提出了更高的要求。分