论文部分内容阅读
随着我国经济的大力发展以及电子技术的飞速提升,人们的生活越来越重视移动设备的使用,尤其是智能手机、平板电脑等。进一步,借助无线网络,人们通过移动设备能够随时随地的向网络获取信息和处理事务。然而,这些网络信息资源和处理事务的途径一般都是来自于Web网页,如有提供新闻资源的新闻网页,提供搜索服务的门户网页,提供商品出售的购物网页,提供视频观看的视频网页等等。但是这些网页都是基于PC端电脑而开发设计的,由于移动设备硬件具有其自身先天性的局限性:计算能力有限、存储量小、屏幕小以及带宽低等,当我们使用移动设备去直接浏览这些网页会出现许多问题,如加载速度慢甚至不完全,显示效果混乱不规整,滚屏操作繁琐等等。若要充分利用现有的Web网页资源,就必须将PC端网页转换成适用于移动设备显示的新网页。而这-转换过程中最为关键的环节是对Web网页进行页面分块,因此本文对Web页面分块算法进行了深入研究,目的是使移动设备能够直接快速的浏览PC端Web页面。基于文档对象模型(DOM树)的页面分块算法是现有页面分块算法之一,该算法适用于各种复杂网站。目前基于DOM树的页面分块算法包括利用HTML标记的布局规律、利用HTML标记之间的关系以及利用<TABLE>标记的布局特点的页面分块算法。这些算法只对对有固定格式、规范标记用法的Web页面和采用表格<TABLE>布局的Web页面有较高的分块效率和正确率。但是,随着网络技术发展的不断进步,现有网页的布局方式已经发展为DIV+CSS的布局方式,该布局方式解决了表格<TABLE>布局的嵌套关系复杂、网页维护和改版困难等缺点,使得网页制作更加方便灵活。故本文提出了面向DIV+CSS布局方式的页面分块算法。本文在过去算法以及DIV+CSS (Division+Cascading Style Sheets)布局特点的基础上设计出了基于该布局方式的Web页面分块算法。该方法实现了对采用DIV+CSS布局的网页进行页面分块,并通过实验证明,此方法具有一定的有效性和可行性。本文主要工作内容安排如下:1.对国内外的页面分块技术进行了研究与分析,并对各个分块算法的优缺点和网页针对性做了比较与分析。2.研究了DIV+CSS布局方法和它的HTML文本结构,并与表格<TABLE>布局方法进行比较。3.提出面向DIV+CSS布局的Web页面分块算法。利用DIV+CSS布局方式的Web页面结构,首先通过分析HTML文本,生成一颗DIV树;然后对该树进行前序遍历:提取对应的CSS文件中各个<DIV>标记的宽度,以移动设备小屏幕的宽度作为阈值,比较两个宽度的大小;最后根据比较结果对Web页面进行分块,再将分好的页面块按照原网页的布局格式进行重新组合,进而转换成适用于小屏幕浏览的新页面。4.实现了面向移动设备的Web页面分块转换系统。该系统以面向DIV+CSS布局的页面分块算法为核心,以普通PC端Web页面作为输入,以适用于移动设备小屏幕浏览的Web页面作为输出,有效地将Web页面进行了转换。