【摘 要】
:
Deep Web指那些存储在网络数据库里、不能通过超链接访问,而需要通过动态网页技术访问的信息资源。网络数据库包括搜索引擎数据库、在线专业数据库及站内搜索数据库,统称为可
论文部分内容阅读
Deep Web指那些存储在网络数据库里、不能通过超链接访问,而需要通过动态网页技术访问的信息资源。网络数据库包括搜索引擎数据库、在线专业数据库及站内搜索数据库,统称为可检索数据库(Retrieval Database)。Deep Web中包含着丰富的可供访问的信息,将Deep Web数据源按所属领域进行分类是Deep Web数据集成搜索的一个关键步骤,大部分的Deep Web数据源拥有结构化的查询接口和结构化的查询结果,通常查询接口可以反映Deep Web数据源的内容组织结构。本文提出一种基于模型匹配的Deep Web数据库自动分类方法,该方法通过分析网页结构,根据标记之间的深度特征来自动抽取查询接口的特征词,进而形成特征向量。并从新的角度对VSM向量模型中的权值进行定义,同时采用一种新的向量模型来构建一个数据库查询接口,然后利用模型匹配的分类方法按深度遍历的顺序对其进行分类,最后通过实验验证该方法在查全率和准确率方面的有效性。
其他文献
经济增长与通货膨胀总是相伴而生,政府在宏观调控时应该要考虑居民的通货膨胀承受能力。通过构建居民通货膨胀承受力的测度指标,以1995—2014年间的数据进行实证分析,发现无
传统的校园网络监控只是监控用户的网络流量、传输异常,在进行维护时很难及时发现问题用户并迅速解决。因此建立一个高效率的管理系统,采集网络运行中的数据,进行网络检测与
介绍了国内油井水泥膨胀剂的发展现状及作用机理 ,制定了其检测标准及评价方法 ,并从水泥膨胀率、抗压强度、水泥浆自由水含量及发气时间等方面对膨胀剂进行了较为全面的检测
<正>首届"国医大师"荣誉称号获得者何任教授,长期致力于中医药治疗内科杂病的临床研究,尤其在中医药治疗肿瘤疾病上积累了丰富的经验。何教授提出"扶正祛邪"的治疗大法,对于
篦冷机堆雪人的原因预防及处理(二)江旭昌(天津水泥工业设计研究院)[接上期〕对预分解窑,容易出现温度过高或含低熔点的碱成分增加而使液相量过多。液相量过多或提前出现是窑尾结皮
滨海开放空间是城市公共空间的重要组成部分,对城市滨海区的建设发挥着极其重要的作用。近年来,随着城市公共空间建设的事业不断发展和深入,针对如何加强滨海开放空间环境建
介绍了基于DSP芯片TMS320LF2407A的过电压在线监测装置的设计原理和实现过程。该装置由DSP系统和AD转换芯片组成,实现6路信号的同步采样。它自动检测电网内的各种随机过电压
研制了一种用于油水井解堵的脉冲大电流电源。它采用中频恒流源给升压变压器供电,经桥式整流给高压脉冲电容器充电,通过封闭式气体开关产生脉冲高压施于液体放电间隙,使之击穿形
改革开放以来,我国的收入分配制度发生了很大的变化,分配制度的变迁实际上就是一个不断探索效率与公平关系的过程,即经历了效率优先,兼顾公平—从理论到实践的失衡,公平正义
分析了固井后环空气窜的原因、途径及其危害 ,阐述了国内外固井环空气窜预测、水泥浆防气窜性能评价和室内模拟实验方法 ,综述了近几年来国内外防气窜水泥浆体系和工艺技术 ,