【摘 要】
:
随着WWW的迅速发展和Internet的广泛应用, Web已成为用户获取信息的重要来源,XML数据规范已经成为目前Web上信息表示和交换的标准,因此大量的异构数据集成于XML文档之中
论文部分内容阅读
随着WWW的迅速发展和Internet的广泛应用, Web已成为用户获取信息的重要来源,XML数据规范已经成为目前Web上信息表示和交换的标准,因此大量的异构数据集成于XML文档之中。由于现在Web的用户群已经由过去的少量专业人员扩展到大量的普通用户,他们对 XML 文档的结构和内容并不可能完全了解,并且他们的查询意图本身通常也是模糊或不精确的,因此用户很难从 XML 文档中获取完备、有效的信息。因此,满足大量普通用户即时需求的Top-K近似信息查询正成为XML数据查询技术的研究热点。 本文提出了一种基于结构和内容松弛的XML数据Top-K近似查询方法,该方法通过收集用户每次查询的不重复查询片段构建查询历史,当新的小枝模式查询到来时,通过计算查询历史中每个查询片段的新鲜度和兴趣度推测出用户对小枝模式查询中各个查询片段的偏好程度,进而根据已得到的用户偏好对查询片段进行排序;根据查询片段重要程度,对小枝模式查询进行查询松弛,最不重要的查询片段最先松弛,从而确保获得与原始小枝模式查询最为相关的近似查询结果;最后,根据查询片段的新鲜度和兴趣度计算出近似查询结果对原始查询和用户偏好的满足程度,并以此对查询结果进行排序。 通过在真实数据集上进行的多次实验,得出的实验结果证实了本文所提出的近似查询方法具有较高的查全率和准确率,所获得的查询结果符合用户真实的查询需求和偏好。
其他文献
对蚁群算法进行了深入研究,指出了蚁群算法在解决大型非线性系统优化问题时的优越性。仔细分析现有算法在解决露天矿卡车调度系统问题的不足之处,基于蚁群算法的优点,并根据露天
自由搜索(Free Search,FS)算法是近年来新提出的一种群体智能算法,体现的是一种“以不确定应对不确定,以无穷尽应对无穷尽”的思想。该算法模拟一些高等群居动物寻找水源的过程
双目视觉技术是计算机视觉领域的热点研究内容,它利用计算机的软、硬件对动物的双眼视觉进行模拟仿真。双目视觉根据三角几何原理获取物体的深度信息并进行三维重建,实现了非接
血压是人体关键的生理参数,是医生诊断病人身体状态的重要根据。血压反映了整个身体循环系统的运转状况,当循环系统的机能发生变化,血压会随着发生变化。在一些重要的医疗场
随着电子商务个性化推荐服务的发展进步,网购模式逐渐从以用户海量检索为主的单一购物方式转变为以系统个性化推荐为代表的多元化个性化购物方式。作为个性化推荐服务核心内容
制造业在先进制造,网络化制造,制造网格等制造模式的影响下,随着信息技术和物联网的发展,云制造的概念被提起。在一切皆服务的云制造环境下,用户按需使用制造资源和能力需要制造云
随着计算机技术和网络技术的发展,传统的二维平面和三维动画已经不能满足现代展示的需求,虚拟现实技术的出现极大地填补了这个缺陷。虚拟漫游是虚拟现实中一个很重要的虚拟技
如今,信息资源已发展成为一种非常重要的国家战略资源。伴随着信息产业的发展,信息系统的安全问题也越来越引起人们的重视。
可信计算是从计算机的硬件体系结构上入手,从根
随着信息技术的发展,以互联网为依托的计算机通信方式备受社会各界青睐,在大部分公司与集团内部,计算机的通信早已成为一种主流的通信方式,因此对计算机通信网络的研究也逐渐
随着全球化的加深,品牌在决定企业竞争力方面起着重要的作用,如何对品牌价值进行合理量化,以达到提高企业竞争力的目的值得思考。传统的品牌评估方法通过调查问卷或者统计品