基于标准XML的Web信息高效抽取算法

来源 :湖北工业大学学报 | 被引量 : 0次 | 上传用户:fxingzhe2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
讨论了一种基于XML在网络中抽取信息的方法.理想的数据抽取过程是仅仅分析由HTML页面组成的网站数据库.然而,全面的信息抽取过程需要面对许多障碍.正确的数据抽取还需要有可靠的数据验证和错误恢复服务,以应对无法避免的数据抽取故障.提出一个名为NIES的软件框架,它可以大大提高网络信息抽取的效率和准确度,保证了网络信息抽取的质量.NIES的关键部分是用XML技术来进行数据抽取,它包含了XHTML和XSLT并且支持连接"深度网络".
其他文献
对我国大陆地区36家网站隐私权保护政策进行调查发现:有三分之一的网站没有任何有关隐私权保护的条款规定;多数网站首页的显著位置无隐私权保护政策的链接;而在有隐私条款的23
针对斜向进刀过程中的切入角和刀具旋向的变化对铣刀所受载荷的影响,进行了高速铣刀的有限元分析,解决了斜向进刀中刀具旋向和切入角的选取问题.
针对自卸车多在道路不平,超载或偏载严重的工况下作业而容易出现失稳倾翻事故的问题,联合应用MSC.ADAMS和Pro/ENGINEER进行自卸车整车虚拟样机建模以及动力学仿真.找出在一定