基于网页分割和摘要的小屏幕设备网页自适应技术研究与实现

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:kobiko
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着手持移动设备的在日常生活中的日益普及,利用其获取Web网页信息的应用模式迅速发展。目前互联网绝大多数网页是针对桌面计算机的显示屏幕分辨率设计的。手持移动设备的屏幕尺寸小,分辨率无法达到现有网页的要求,导致信息浏览效率的下降。因此,探讨如何提高小屏幕设备上的网页浏览效率并降低用户操作负担,已经成为一个普遍关注的课题。本文对小屏幕设备上的网页自适应问题进行研究。作者在借鉴现有网页分割技术和网页摘要技术的基础上,提出了基于网页分割和摘要的小屏幕设备网页自适应解决方案。按照实际应用环境对这两项技术作改进,使它们能有效地解决小屏幕设备上的网页自适应问题。为了获得更好的网页自适应能力,本文提出的方法引入对设备描述文件的分析,以根据不同的设备尺寸生成适合屏幕显示的网页摘要结果。本文关键的研究内容概括如下:对于网页自动分割技术,本文首先分析了目前采用的主要技术和存在的不足,以此为基础提出了利用多个语义线索的网页分割算法。以往的网页分割技术只考虑单一信息线索,而本文提出的算法尽可能从用户感知的角度出发,综合考虑非视觉因素和视觉因素来识别网页结构,并借鉴信息提取技术中的模式检测法对分割作调整。同时,该算法并不局限于应用环境,可作为各种应用场景下的通用方法。与现有工作相比,该算法有所创新,并且实验证明该算法的平均准确率比以往算法高,而且更为鲁棒,适用范围更广。对于网页摘要技术,本文将网页摘要的算法结合具体的应用环境,提出了基于屏幕尺寸的网页自动摘要算法。该算法的特点是摘要的屏幕自适应性,即根据不同的屏幕尺寸选择摘要内容。算法利用传统文档摘要的方法同时,还利用网页的半结构化特征抽取隐含的语义信息,以提高摘要的质量。最后在详细阐述这两个关键的算法之后,作者设计和实现了代理服务器端的原型系统,详细介绍了代理服务器的系统结构及其主要模块,并针对两个算法设计了实验以验证算法的有效性。
其他文献
随着互联网的快速发展,网络中产生的数据量呈指数级增长趋势,如何对海量数据进行高效的存取已经成了计算机领域的一个研究热点。HDFS(HadoopDistributed File System)是Hadoop
计算机和网络技术的进展使信息的发布与共享不再受到时空限制,同时也给我们带来了“信息过载”的问题,即信息资源极大丰富,而真正有用的信息和知识却相对匮乏。作为一个全球
近年来,网络教育由于不受时间和空间的限制而被广泛应用,作为教与学桥梁的网络课程,常在网络教学中承担教师、教材和教学媒体三种角色。尽管从网络教学的本质和技术特质上来看,网
随着网络门户技术的飞速发展,门户中的应用系统越来越多,而每个应用系统往往都有自己的一套用户认证方法,用户管理往往非常困难。为了对用户进行统一的管理,有必要将不同系统
人脸识别技术也就是利用计算机分析人脸图像,进而从中提取出有效的识别信息,用来辨识身份的一门技术。它涉及了图像处理与分析、计算机视觉、人工智能、模式识别及生物学等多
基于.NET课件点播(Courseware on Demand,COD)系统的主要目的是为了对学校的教学课件资源进行整合,为在校师生提供课件点播学习环境,促进学生的学习积极性,提高教师的教学水
随着高科技的发展,智能监控系统的应用越来越广泛。运动物体视觉分析作为智能监控中的一项核心技术,它包括运动物体检测与提取、物体分类、事件检测、行为识别和分析等,而运
计算机技术与无线通信技术的结合,使得无线移动设备广泛应用于各个领域。无线移动设备可以通过无线链路接入Internet,同时能够快速、方便地访问Internet资源。无线局域网是有
随着互联网技术的成熟,各类依托于网络的电子平台得到很好的发展和普及,人们可以通过这样的网络媒体表达自己的观点和意见,其中蕴藏着大量信息,具有不可小觑的研究价值。产品
VoIP(Voice over IP)技术包含SIP、H.323等一系列的协议,它以强大的功能、低廉的价格以及高度的灵活性对传统传统通信提出了强大的挑战。VoIP不但支持语音的传输,而且能够提