【摘 要】
:
关系数据库中存储了大量的结构化数据,且其数据量每天都在不断的增长。随着数据库技术和信息检索技术的成熟,使得用户能够方便高效的检索数据库中结构化数据,在数据库上实现
论文部分内容阅读
关系数据库中存储了大量的结构化数据,且其数据量每天都在不断的增长。随着数据库技术和信息检索技术的成熟,使得用户能够方便高效的检索数据库中结构化数据,在数据库上实现关键词查询是目前的研究热点。该技术使得用户不需要懂得复杂的结构化查询语言和底层的数据库模式,便可以对数据库中的数据进行查询。目前的研究工作主要是基于元组级别的方法,由于数据库的规范化设计使得完整的实体信息被分散到多个表中,从而该方法返回的结果并不是完整的实体信息,用户通常难以理解。对象级别的信息检索更直观地描述了检索结果的语义,返回的检索结果具有上下文信息,更加符合用户的查询需求,已经引起越来越多的关注和研究。本文首先对目前几种典型的具有对象级别思想的检索方法进行了介绍;然后给出关系数据库对象模型的定义,简单的说,一个对象就是数据库中若干紧密相关的元组集合;最后设计了一个对象级别的关系数据库信息检索方法——DBORank。 DBORank算法从数据库和信息检索两个角度出发设计了一种灵活有效的评分机制,它既考虑了对象级别数据图的链接结构,还考虑了图中对象结点的内部结构,边的类型和权值,对象内容相关性等因素,提高了算法的检索效果,同时从迭代算法和Top-K排序算法两个方面对DBORank算法的检索效率进行了优化。最后实现了一个对象级别的关系数据库信息检索原型系统,利用DBLP数据集对DBORank算法的检索效果和检索效率进行了实验验证。论文采用P@K和平均查准率MAP两个评价指标对算法的检索效果进行评价,同时验证了方法改进后的迭代算法和Top-K排序算法的效率。最终的实验结果表明DBORank算法具有良好的检索效果和检索效率。
其他文献
患者男,22岁。面部红斑、丘疹和脓疱,伴脱屑3月余。面部可见数个红色或暗红色斑块和丘疹,顶部可见针尖大脓疱,伴破渍。血常规正常。皮损组织病理示:表皮角化过度、棘层轻度增厚。
经典竞争凝聚(CA)算法具有自动寻找聚类总数的特性,避免了预判参数对聚类结果的影响,但在聚类过程中,该算法并未利用样本数据中普遍存在的少量已知信息,而这些已知信息往往能够对整个聚类过程提供有益的帮助;此外算法在相似度度量函数上采用了最为常见的欧氏距离,该距离仅适用于球状的聚类,且存在等划分的趋势,这就制约了算法的应用范围.针对上述问题,通过引入具有半监督学习能力的半监督项,增强隶属度矩阵的划分能力
目的探讨改良小切口腕管综合征减压、正中神经松解的临床疗效。方法 96位患者,112例腕管综合征均采用平行鱼际纹至腕横纹,沿腕横纹远侧向尺侧横行1~1.5cm的类"L"形切口。术中
5月22日上午9时,第十三届全国人民代表大会第三次会议在北京人民大会堂开幕。国务院总理李克强作政府工作报告。这次新冠肺炎疫情,是新中国成立以来我国遭遇的传播速度最快、
针对粒子群优化算法在优化过程因失去种群多样性而陷入局部极小点问题,提出一种改进的基于梯度搜索的粒子群优化算法,从两个方面来提高粒子群的搜索性能.一方面,在粒子相互吸
为了确保盾构法隧道施工的安全高效,盾构机需配备自动导向系统来实时测量其位姿。两棱镜法、三棱镜法和激光标靶法是几种主要的盾构自动导向方法,几种测量方式具有不同的优缺点
中共中央总书记、国家主席、中央军委主席习近平22日下午在参加他所在的十三届全国人大三次会议内蒙古代表团审议时强调,中国共产党根基在人民、血脉在人民。党团结带领人民
科学家最早于1968年提出非对称简单排它过程(asymmetric simple exclusion process,简称ASEP)模型,最初主要用于探索和模拟生物高聚物合成机理。ASEP模型主要描述在一维模型
<正> 酿酒工艺一般分为固态发酵、液态发酵和半固态发酵,半固态发酵即是采用先固后液的固液结合法。桂林三花酒的酿制即属此工艺。一、原料:大米。
针对政府工作报告提到的常态化疫情防控、刺激消费、保障粮食安全等多项任务、目标,在全国两会的部长通道、国新办新闻发布会等多个场合,相关部委负责人作出进一步回应,释放