网页表观的视觉感知与学习

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:zyr1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网页已经成为人们在工作和生活中必不可少的工具之一。除了向用户提供信息之外,网页还担负着用户和互联网之间的交互任务,是用户访问互联网的最主要的接口。在愈来愈强调用户体验的今天,如何提高网页的用户体验,已经成为一项非常重要的研究课题,并在网页设计、人机交互、以及认知心理学等多个领域备受关注。用户对网页表观的视觉感知,极大地影响着用户对网页的体验。因此,研究用户对网页表观的视觉感知,并建立起网页表观的自动评价模型,能够有助于我们更好地认识与提高网页的用户体验,同时对与网页相关的各种应用也具有积极的意义。由于缺乏必要的互联网挖掘和机器学习领域的方法与手段,目前对网页表观视觉感知的研究无论是从特征描述上,还是从评价模型的构建上都非常简单,不能够很全面地提取能够对网页表观进行有效表示的各个层面上的特征,也未能够很好地建立起表观特征与用户对网页表观的视觉感知之间的关联。本文针对网页表观的感知与模型构建研究的现状,综合地利用了数据挖掘、计算机视觉与机器学习等多领域的理论和方法,深入地研究了表观的视觉感知与评价模型学习等一系列关键问题。在本文中,主要的工作和贡献有:   ①分析了多用户标注的综合表达方法,并提出了一种新的综合表达方法。单一用户对一幅网页的表观感知与标注结果只反映了该用户对这幅网页的视觉感知,不具有代表性。需要记录多用户(大众)的表观感知标注结果并将其综合表达成一定的数量,以整体上反映大众的视觉感知与体验结果。现有研究一般用一个类别标签或者分值来综合多用户的网页表观标注结果,本文提出利用大众在基标签上的标注分布这种新的表达方法,能够更好地体现网页表观感知的主观性。   ②提出了网页表观自动评价模型构建的一般框架。该框架考虑了三种类型的特征:底层特征(即直接从网页源码中获取的较为初级的特征)、中层特征(能够反映网页结构信息与部分视觉信息的特征)以及高层视觉特征(包括色调、彩色度、纹理等特征)。这些特征基本上涵盖了网页表观的绝大部分因素。现有的网页表观分类与回归模型都过于简单,所考虑的特征一般不超过三个,难以有效地表达一幅网页的视觉特性。且所采用的模型训练方法一般均为基于多项式回归的数据拟合算法,其模型的泛化性能较差。本文引入了具有较好泛化性能的机器学习算法来进行模型学习。在所提出的自动评价模型构建的一般框架下,本文引入一种用于网页布局提取的结构挖掘算法,通过这个算法可以有效地获取网页的主要布局块。   ③针对所提出的利用多用户标注在基标签上的分布来综合表达大众对网页表观的感知,本文提出了一种支持向量分布回归机器学习算法。我们首先引入结构化的支持向量机理论来设计基本的学习框架。在所提出的支持向量分布回归算法里面,利用特征与基标签之间的关系以及基标签之间的关联关系来构建输入特征向量。实验结果表明所提出的支持向量分布回归算法要优于在常规算法(如神经网络、支持向量机)上做简单改进而得到的算法。同时,本文进一步把所提出的支持向量分布回归算法用于图像视觉质量评价上,并根据在线用户的图像视觉质量标注数据的特点分别提出了两种学习策略来消除在线标注的一些固有缺陷。   ④针对网页搜索的需要,提出了一种多人标注下的排序学习算法,用以构建网页表观质量排序模型。现有的网页表观评价算法主要面向分类与打分,几乎没有工作来直接研究网页表观的排序。同时在本文所提出的网页表观的三大类特征中,部分特征的提取复杂度很高,难以应用于网络搜索这种对实时性要求非常高的场合。本文结合了概率排序模型、最大似然估计以及经典的排序学习等诸多方法,提出了一种新的概率排序模型并用于构建多标注者下的排序学习算法。并在常用的排序学习数据集上验证了其有效性。最后利用提出的算法构建了一个网页视觉复杂度排序模型,结果表明几个简单的特征所构建的排序模型的性能接近于几个经典的算法。   总而言之,本文首次对网页表观的视觉感知与模型学习进行了深入地研究,在视觉表观的特征表示与自动评价模型的构建上做出了有益的探索。
其他文献
随着科学计算、数据分析、数据挖掘等数据密集型应用技术的迅猛发展,集中共享存储以其易管理、高可用、易扩展等优点,可以满足应用对存储系统高可用、可扩展以及高性能的要求。
随着图像信息量的骤增,图像处理成为目前研究领域的热点。图像分割技术是图像处理的基本环节,其结果直接影响后续的图像分析与理解。基于图像像元的聚类算法是图像分割的常用
语义Web是对当前Web的一个功能性扩展,旨在使得Web中的信息具有语义,能够被计算机理解,从而加强人和计算机之间的交互与协作。语义Web采用RDF来描述网络上的各种资源信息,并
随着计算机体系结构的不断发展,新的处理器会在旧处理器的基础上增加新功能或使用新的处理器体系结构来提高处理器性能。这些新的体系结构特征为应用程序提供了更多的优化机会
移动IPv6作为下一代网络建设的重要组成部分,为用户提供了强大的移动通信支持,已经成为当前网络研究中的一个热点。随着手机、手提电脑等便携式移动通信终端设备的广泛应用,
无线定位技术是各种基于位置服务的基础。目前大多数基于射频信号强度匹配定位算法均采用信号不随时间变化的静态射频指纹(Radio Map)模型,或未有效利用目标连续运动信息,从而
随着数字化技术的发展和三网融合的加剧,IPTV技术正在得到广泛的应用。TS流技术作为IPTV中的关键技术之一,也得到了越来越多的关注,所谓TS流是根据ITU-T Rec H220.ISO/IEC DI
随着电子商务在世界范围内应用的日益广泛,网上交易的数据安全等课题已经成为电子商务领域的重要组成部分。安全套接层协议SSL是Internet上使用最为广泛的进行保密通信的安全
伴随着经济的发展,科学技术的进步及生活水平的不断提高,人们对健康、保健的追求,使得中国的医疗体系发生着巨大的改变。传统意义上的医疗模式是建立在以医院为中心的基础上,而现
视频监控技术一直是人们关注的热点之一,随着网络和计算机的普及,监控探头大量出现在住宅区、公路、银行等场所,为人们的财产安全保驾护航,为公安机关侦破案件提供重要的线索