表格信息在主题爬行中的作用

来源 :吉林大学学报:理学版 | 被引量 : 0次 | 上传用户:gmgan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
采用计算向量之间相似度的方法,通过实验分析验证了表格信息在主题爬行中的重要性.研究结果表明,与整个网页相比,表格所能提供的与用户相关的信息占整个网页信息总量的80%以上,因而在主题爬行领域可以充分利用这一结论进行网页解析.在舍弃除表格和标题之外的其他元素后,提高了爬行程序的效率.
其他文献
提出一种基于查询/视图/转换(QVT)规范的模型转换技术,并采用这种模型转换技术,利用Kermeta语言中的模型转换功能,通过对QVT核心分层,设计了一种基于映射四层QVT结构的模型转换工具,实
分别对不带吸附项和带吸附项的一阶拟线性方程以测度为初值的两类Cauchy问题的BV解进行了综述.首先, 综述了上述两类Cauchy问题解的存在性、惟一性及渐进性.其次, 给出了在此
概述网络搜索引擎的基本原理, 给出新一代网络搜索引擎系统CHINA_VIVI的体系结构, 并描述CHINA_VIVI的实现方法.