【摘 要】
:
随着Web服务的发展和网络上的数据量呈几何式的增长,人们认识到将关系数据库和信息检索的技术融合到一起可以给用户提供更高效的信息检索服务。论文讨论了在关系数据库上进行
论文部分内容阅读
随着Web服务的发展和网络上的数据量呈几何式的增长,人们认识到将关系数据库和信息检索的技术融合到一起可以给用户提供更高效的信息检索服务。论文讨论了在关系数据库上进行基于q个关键词(k1,k2,k3,...,kq)的搜索方法。这里的关系数据库可以被建模为带权图模型G(V,E)。其中的V是指图上的结点(即数据库中的元组);E是指数据图上的边,它表示的是元组间的外主键关联。假设Si表示一组包含关键词ki的结点,并且Si?V。我们研究的问题是怎样找到权重最小的k个结果树,并且结果树要包含每个集合Si中的至少一个结点。当k等于1时,该问题等价于最小斯坦纳树问题(Steiner Tree Problem),该问题是NP难的。该问题还有两个前提,即关键词的个数q很小,因为用户一般不会输入过多的关键词;而且图中的边的数目m和结点数的关系,通常满足不等式m<<n2,即数据图是松散的。基于上述特性,本文最主要的工作是提出了一个在数据图上进行关键词搜索的算法,并以此为基础,实现了适用于带权数据图模型的关键词搜索系统DBSearch。通过本文的实验可以看到,该系统在搜索时间和结果质量上,比实验中的其他系统都有所提升。
其他文献
电信号的测量、计算、分析和研究是电气技术人员工作的主要内容,在电气技术人员的工作过程中还需要经常查询电气资料供参考。所以电气技术人员的工作就离不开万用表、示波器
从非结构化和半结构化的互联网信息中抽取结构化信息的技术广泛应用于商业数据挖掘、社交网络分析和垂直搜索引擎等领域。信息结构化包括一系列环节:设定信息抽取范围、网页爬
随着我国经济的快速发展和人民生活水平的提高,人们对现代交通的要求也越来越高,因此智能交通系统(ITS)成为发展现代交通的重要趋势。交通场景中的运动目标检测和分类技术是智
本文通过图像分割技术实时监测整个中药贴剂的生产流程,分析在线采集的贴剂图像的灰度特征、找到贴剂均匀度的影响因素,以此来实现经皮给药系统的自动化生产。其中通过图像分
随着计算机网络技术、信息技术的发展以及制造企业所处市场环境的变化,使得传统的项目管理模式不能适应当今社会的发展和需求。因此,构建一个支持分布式的、基于动态联盟的分
考生在高考后对大学专业的选择是其职业生涯的起点。根据考生自身的特性,选择适合他们的专业是促进其日后职业发展的前提。本文尝试用数据挖掘算法来发现规律,将数据挖掘算法
伴随着Web2.0的不断发展,互联网上论坛、社区、博客、评论专栏等互动平台中的评论信息迅速增长,这些网络评论反映了人们对于特定产品,事件、政策的态度,其社会影响力越来越大。研
随着视频电话等多媒体应用的增多和无线通讯设备的推广,在无线Ad Hoc网络上传输多媒体业务具有良好的应用前景。传输多媒体业务需要网络提供服务质量(QoS)保证,要求在网络中
随着图像处理技术迅猛发展,人们能够更好治疗某些疾病以及愈后恢复情况的及时监控,从而使得诊疗水平得到极大的改善。图像计算机系统的建立,可以对眼底很多组织进行定量测量