论文部分内容阅读
基于视觉信息的Web数据高效提取技术研究
【摘 要】
:
Web数据提取技术在网络数据挖掘、情报获取、商业竞争和大数据分析中发挥着重要作用。随着互联网的普及和快速发展,网络中承载的海量数据信息已经成为一个宝贵的资源,但由于Web页面难以获取、数据形式不统一,加上随处可见的噪声信息等原因使Web数据不能得到充分利用。如何有效的抽取Web页面中包含的结构化数据成为一个热门的研究方向。本文分析了 Web页面获取困难的原因和网页的视觉信息特点,针对DOM树匹配算
【出 处】
:
北京交通大学
【发表日期】
:
2019年01期
其他文献