领域Web数据库查询接口的自动发现

来源 :江西师范大学学报:自然科学版 | 被引量 : 0次 | 上传用户:dancheman001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于Deep web查询接口的自动发现是获取Deep web信息的基础,提出了基于搜索引擎的表单发现方法和基于语义相似度的查询表单判定方法.该文首先定义了查询表单的特征的表示方法,然后自动提取样本查询接口的特征并将其中的文字特征进行组合提交给搜索引擎以实现查询表单的搜索,最后基于语义相似度和字面相似度的方法判定搜索表单和样本表单之间的相似度,并由此判定是否是WDB的查询接口.实验证明该文方法具有良好的可行性和实用性,为深入研究Deep web提供了良好的条件.
其他文献
为了提高单纯形法的效率,先证明定理,然后给出新规则,并详细描述了新算法的步骤,通过数值试验对新规则与Bland规则进行比较,结果表明该规则优于其他规则,从而证明了其优势性:既能避
通过对Brown等人介绍的5粒子纠缠态的新应用研究,利用5粒子纠缠态作为量子信道提出了一个单粒子任意态的信息共享方案.首先,发送者对自己拥有的粒子做一次4粒子von-Neumann联
K-均值算法是文档聚类中常用的一种划分方法.近年来,为提高聚类质量,出现了不少优化初始中心的改进算法.该文在基于密度选择中心点算法的基础上,建立了相似度概率模型辅助密度参数