论文部分内容阅读
人机交互是研究人与硬件环境及二者相互影响的领域,交互过程是人与硬件系统之间各种符号与动作的双向信息交换。本质上,是人类的操作行为,借助交互环境的硬件设施作用于系统数据,完成目标信息的输入、转换、加工和输出,并获得硬件系统的操作反馈的过程。随着交互设计、人工智能的不断发展,人机交互由传统的键盘鼠标交互模式发展到智能的、多通道、多媒体的交互方式。语音交互是智能交互的一种,即利用人类语言表达交互语义,系统识别操作者的声音信息,完成音频提取并翻译,映射到相应的功能响应。语音交互是目前最接近于自然交互的方式之一。GIS系统的现状是功能强大但交互方式单一,造成了在某些环境下的交互不便利。扩展GIS交互方式不能生搬硬套其它系统,应充分研究分析GIS的交互特征,因地制宜。GIS的交互对象是空间数据,交互操作是对空间数据的增、删、改等加工处理和对GIS系统环境的控制,其交互语言语义明确,语法规则具有规律。本文围绕着将语音交互引入到GIS图形系统领域这一目的,开展以下研究工作:1.语音交互模式对语音交互领域的相对成熟的技术体系展开研究,探索交互模式,分析交互流程。重点剖析语音识别、语义理解和语音交互设计三项核心技术。2.语音识别研究语音识别理论,提取音频识别模型,总结音频处理的难点和解决方法。根据现有的语音识别技术,确定一个有限词汇量、特定人、孤立词的语音识别方案;利用现有的技术实现语音识别的原型系统。3.GIS图形系统交互语言理解将语言理解限定在GIS图形系统领域内,从典型的GIS图形系统的功能反向分析交互语义,总结交互命令语言特征,并由交互语义制定GIS图形系统的领域词汇表。将领域词汇分为名词类型和动词类型,分别利用概念从属结构和网络结构完成名词知识与动词知识的建模;由交互语言特征,总结出一个GIS图形系统交互的基本语法——“名-动-名/形/副”,以此语法为基准,结合概念从属理论,制定了语义推理的方法。采用链接文法,以文件的方式为系统的名词概念知识和动词概念知识建模,将推理出的语义映射系统的功能函数,实现交互的系统响应。最后,设计了一个原型系统,测试GIS图形系统的语音交互可行性。论文的主要成果为:语音交互技术满足GIS图形系统交互的基本需求;论文提出的交互语言的概念知识能够表达操作行为的概念语义和人的观念;建立的语法与推理规则能正确推理交互语义,映射系统的功能。语音交互也将成为在不便于使用键盘鼠标的交互环境(如外业调绘、野外数据采集)下的重要交互方式。