页面分块相关论文
随着互联网和电子商务的发展,目前许多公司都通过Web广告来推广自己的产品,很多大型互联网公司的主要收入来源也来自于Web广告,因......
学位
随着Web相关技术的日益成熟和Deep Web所蕴含信息量的快速增长,对Web数据库的访问逐渐成为获取信息的主要手段,Deep Web的研究也越......
随着社会信息化进程的不断发展,人们对信息的需求和依赖程度越来越高,如何从海量信息中快速有效的获取有用信息,已经成为人们研究......
随着Internet的普及和飞速发展,万维网累积了大量的信息资源。它作为一个巨大的资源库和知识库,与人们的生活联系越来越紧密。通过......
20世纪90年代以来,互联网技术快速发展,网页页面样式也越发多样。现时的网页中,充斥着大量的导航、广告等与页面主体内容无关的信息,这......
随着移动通信技术的发展及智能移动终端的广泛普及,人们通过手机、平板电脑等移动终端访问互联网逐渐成为一种趋势,以手机为代表的......
随着网络技术的不断发展,WEB平台成为人们获取信息的主要途径之一,目前各式各样的消息充斥着页面,其中包含很多与网页主题无关的噪......
研究基于CURE聚类的Web页面分块方法及正文块的提取规则。对页面DOM树增加节点属性,使其转换成为带有信息节点偏移量的扩展DOM树。......
随着通信技术的发展,人们迫切希望能方便地利用手持移动设备访问Web网站,由于移动设备的小屏幕和低带宽的缺点,使得这一难题一直没......
在对大量Web邮件页面模式分析的基础上,对页面进行分块,并根据信息块的结构与内容属性,实现主题信息块和主题相关信息信息块的析取,对......
Shark-Search算法是一个经典的主题爬取算法.针对该算法在爬取噪音链接较多的Web页面时性能并不理想的问题,提出了基于网页分块的Sha......
目前各种PDF转化工具中,将PDF元素抽取后还原顺序的方法是根据每个文字元素的坐标---由左到右,由上到下的顺序重排元素。这种重排方......
Internet发展至今,除了静态的网页文本,目前出现较多的是基于动态文本的BBS评论、电子商务评论等。如何自动挖掘这些评论信息,变得日......
页面分块在文档分类,信息抽取,主题信息采集,以及搜索引擎优化等方面具有重要的作用。首先提出了一种基于Web标准的页面分块算法,......
近年来,随着互联网越来越深入的影响人们的日常生活,互联网也演变为除电视、报纸外一个非常重要的广告传播媒介。Web广告由于其覆盖......
随着我国经济的大力发展以及电子技术的飞速提升,人们的生活越来越重视移动设备的使用,尤其是智能手机、平板电脑等。进一步,借助......
随着移动终端的广泛普及和移动通信技术的不断发展,越来越多的人期望使用移动终端来浏览Web页面,但由于显示屏幕的局限、内存和无......
利用网页的视觉特征和DOM树的结构特性对网页进行分块,并采用逐层分块逐层删减的方法将与正文无关的噪音块删除,从而得到正文块。......