论文部分内容阅读
在互联网与移动计算技术迅猛发展的今天,移动终端已经与我们生活息息相关,移动学习也成为大势所趋。当用户使用小屏幕移动终端访问互联网上已存在的海量资源时,上网速度慢、内存小、计算能力弱、待机时间短等问题将会在不久的将来得到较好解决;另一方面,由于手机屏幕尺寸与其便携性之间存在着不可调和的矛盾,就目前的技术和手段,短期内难以得到彻底解决。因此,当使用小屏幕的终端访问目前网络已经存在的海量资源时,就不可避免存在页面自适应适配难题。针对该难题,目前的研究主要采用如基于缩略图的浏览、基于网页标记语言自动转换与网页智能布局等方法解决。但是这些研究单纯以网页本身为研究对象,自适应转换后,网页原有的语义一致性被破坏,同时打破了原有网页设计者的布局,用户无法迅速找到自己熟悉的功能模块,从而导致用户体验度低。本文从用户角度出发,将用户浏览网页时的眼动特征引入到本文研究中,旨在解决小屏幕终端网页内容适配中上述系列问题。本文得到了国家“十二五”科技支撑计划重大项目“低成本体验式农村信息服务关键技术与终端研发”(NO.2012BAD35B02)和国家核高基重大专项课题“国产基础软件在数字教育领域的适配研究及重大应用示范”(NO.2010ZX01045-001-005-3)的资助。本文的主要工作包括以下几个方面:(1)网页浏览眼动特征模型的构建。本文区别于以往研究中以网页本身为研究对象,从用户角度出发,将眼动特征引入小屏幕设备网页内容自适应研究中。本文首先利用眼动仪采集用户浏览网页的眼动特征数据,生成网页浏览的热度图,然后对HTML的文档对象模型(HTML DOM)进行了分类与扩展,在此基础上,提出了基于网页眼动热度图的注意力模型。文章提出了一种基于位置坐标的热度图映射机制,进而提出了网页的自由浏览模式和完全浏览模式两种网页眼动浏览模式。(2)基于布局特征的网页分类算法。依据网页的布局特征,本文将网页分为目录型网页和内容型网页两类,同时定义网页的链接密度和文本密度表征网页的布局特征。在此基础上,研究并实现了基于布局特征的网页分类算法,同时实验证明了基于布局特征的网页分类算法的有效性。(3)基于热度图的网页分割算法。本文提出网页的最小信息单元概念,给出了明确的定义与属性说明,并研究提出了基于规则的网页最小信息单元的识别算法。利用网页完全浏览模式生成的热度图,综合考虑相邻两个最小信息单元标签属性相似度以及热度图相似度计算,采用相邻两个最小信息单元相似性计算和融合的方法,实现了对网页进行分割。实验表明本文提出的基于热度图的网页分割算法的准确率略优于微软的VIPS算法,部分解决了网页分割后语义一致性被破坏的问题。(4)基于眼动特征网页自适应转换算法。针对目录型网页,本文利用自由浏览模式采集到的热度图信息,实现对网页分块的重要度的计算,并依据重要度值对网页分块的排序。针对内容型网页,本文综合利用热度图信息、网页的文本密度和链接密度,提取网页的主要内容,并分别对目录型网页和内容型自适应转换和呈现。实验表明本文提出的基于眼动特征网页分块重要度计算方法准确率明显优于微软提出的基于位置特征和内容特征重要度计算方法,在主要内容提取方法上与基于网页分块的方法相当,但显著优于DOM-Based方法。本文从用户角度出发,将用户浏览网页时的眼动特征引入到小屏幕网页内容自适应研究中,构建网页浏览眼动特征模型,依据网页完全浏览眼动特征数据,指导网页分割。利用网页浏览眼动特征数据生成热度图,计算分块重要度值并提取网页主要内容。在此基础上,实现对目录型和内容型网页的自适应转换,从而在一定程度上解决了小屏幕设备网页内容适配中网页语义一致性被破坏、用户无法快速定位等问题。实验证明,本文提出的方法准确率和满意度均优于同类方法,具有较强的实用价值。