论文部分内容阅读
目前互联网上的信息资源大部分是以网页形式存在,其中绝大多数网页是针对桌面计算机的显示屏幕分辨率设计的。手持智能终端的屏幕尺寸小,分辩率无法达到现有网页的要求,导致信息浏览效率的下降。 针对小屏幕手持智能终端网页信息浏览效率低的问题,目前已有多种解决方案。总的来说,要提高手持智能终端浏览网页的质量有两种途径:一是令网站的网页尺寸适应手持智能终端的屏幕;二是通过开发新的浏览器解析和显示现有的网页,也就是让手持智能终端自适应现有的互联网网页。 基于智能终端的网页浏览方式、基于缩略图转换的网页浏览方式、基于HTML标签动态重构的网页浏览方式或者多种技术相结合的网页浏览方式,在现阶段被普遍采用。虽然页面动态重构和缩略图转换技术针对不同类型的网页具有良好的效果,但同时又存在各自的问题。前者在保证信息易读性的同时,破坏了页面原始布局;后者虽然较好地保持了页面的布局结构,却降低了清晰度。因此,需要新的方法来提高手持智能终端的网页浏览效率,同时保证用户操作的便捷性。 本文基于网页缩略图转换的基础,结合信息抽取技术,提出并实现了一种新的网页浏览系统WID(Web Info Discovery)。WID在保留网页架构原始布局的同时,将KPX(Key Phrase eXtraction)算法获得的网页关键短语,在网页的相应位置进行标注。使用户既能准确把握网页的整体结构,又方便获悉网页的主要内容。 本文完成的主要工作及创新之处: 1.对小屏幕移动手持终端上网页显示研究的现状进行了综述; 2.提出了一种新的基于信息抽取技术的文本关键短语抽取算法KPX; 3.结合KPX算法和网页缩略转化技术,设计实现了基于小屏幕手持智能终端的网页浏览系统WID; 4.对KPX算法以及WID系统的性能进行了评测,实验结果表明:KPX抽取网页关键短语的性能良好,抽取准确率较其他同类系统有明显改善;WID系统操作便捷,增强了小屏幕手持智能终端对于现有网页的浏览能力,提高了阅读效率。