切换导航
文档转换
企业服务
Action
Another action
Something else here
Separated link
One more separated link
vip购买
不 限
期刊论文
硕博论文
会议论文
报 纸
英文论文
全文
主题
作者
摘要
关键词
搜索
您的位置
首页
期刊论文
表格信息在主题爬行中的作用
表格信息在主题爬行中的作用
来源 :吉林大学学报:理学版 | 被引量 : 0次 | 上传用户:gmgan
【摘 要】
:
采用计算向量之间相似度的方法,通过实验分析验证了表格信息在主题爬行中的重要性.研究结果表明,与整个网页相比,表格所能提供的与用户相关的信息占整个网页信息总量的80%以上,因而
【作 者】
:
黄凤云
王辉
左万利
【机 构】
:
吉林大学计算机科学与技术学院
【出 处】
:
吉林大学学报:理学版
【发表日期】
:
2007年3期
【关键词】
:
主题爬行
链接
TF—IDF
相似度
focused crawling
URL
TF-IDF
similarity
【基金项目】
:
国家自然科学基金(批准号:60373099).
下载到本地 , 更方便阅读
下载此文
赞助VIP
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
采用计算向量之间相似度的方法,通过实验分析验证了表格信息在主题爬行中的重要性.研究结果表明,与整个网页相比,表格所能提供的与用户相关的信息占整个网页信息总量的80%以上,因而在主题爬行领域可以充分利用这一结论进行网页解析.在舍弃除表格和标题之外的其他元素后,提高了爬行程序的效率.
其他文献
一种基于QVT的模型转换技术
提出一种基于查询/视图/转换(QVT)规范的模型转换技术,并采用这种模型转换技术,利用Kermeta语言中的模型转换功能,通过对QVT核心分层,设计了一种基于映射四层QVT结构的模型转换工具,实
期刊
模型驱动架构
编织
转换
分层
model driven architecture
weave
transformation
layer
一阶拟线性方程以测度为初值的BV解
分别对不带吸附项和带吸附项的一阶拟线性方程以测度为初值的两类Cauchy问题的BV解进行了综述.首先, 综述了上述两类Cauchy问题解的存在性、惟一性及渐进性.其次, 给出了在此
期刊
存在性
惟一性
CAUCHY问题
拟线性方程
existence
uniqueness
Cauchy problem
quasilinear equati
新一代网络搜索引擎系统CHINA—VIVI的实现
概述网络搜索引擎的基本原理, 给出新一代网络搜索引擎系统CHINA_VIVI的体系结构, 并描述CHINA_VIVI的实现方法.
期刊
网络搜索引擎系统
CHINA-VIVI
体系结构
网络信息检索
WEB挖掘
搜索器
页面分类器
Internet
Internet search engine
其他学术论文