论文部分内容阅读
随着计算机技术的日益发展,互联网已经成为人们日常生活中的一个重要组成部分网络以一种便捷的方式为人们提供了海量的信息资源。然而目前的网页主要采用基于视觉的方式设计,因此盲人的上网问题成了一个难题。虽然非视觉浏览器的出现初步缓解了盲人上网难的问题,但是目前的非视觉浏览器在交互技术方面还有很多不足,因此本文着重于研究面向非视觉浏览器的交互技术,分别从输出和输入两个方面研究了相关技术,希望能够提高网络的可用性和盲人用户的上网体验。
在输出方面,针对目前非视觉浏览器中普遍存在的信息过载问题,本文强调了对网页内容的分析和组织,提出了一个全新的网页预处理流程。总的来说,这部分的工作成果主要有以下四点:(1)提出了一种基于启发式规则的网页分类算法,本文针对网页的内容结构和用户的浏览习惯的差异,将网页分为主题型网页和非主题型网页两种类型,以方便对这两种网页做有针对性的后续处理;(2)针对主题型网页,提出了一种基于去噪方式的内容抽取算法,重点突出了这类网页的主体内容,方便用户的快速浏览;(3)针对非主题型网页,提出了一种基于DOM-TREE的网页分块算法,提高了网页内容的粒度,以支持用户更加便捷的访问;(4)实现了将HTML转换为VoiceXML的技术,本文采用基于模板的方法,将经过分析后的HTML网页转换为VoiceXML网页,以支持更广泛的语音应用。
在输入方面,本文直接面向盲人更加熟悉的盲文点字编码方式,重点研究了盲文点字到汉字的转换算法。本文针对盲汉转换问题的具体情况,合理地引入了自然语言处理领域的相关技术,分别使用了基于词的三元语法模型和和感知器模型来解决盲汉转换问题,并取得了不错的效果。