基于轮廓查询的实体排序算法的研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:yhch157
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
实体检索是目前学者研究的重要领域。实体检索系统的性能好坏主要由实体的排序顺序决定的。实体排序的研究成为实体检索领域中重要的任务之一。在过去的大部分工作中,排序算法主要计算检索的备选实体计算与查询的相似度,依此为根据从大到小排序备选实体,输出前K个实体结果。全部的备选实体需要计算相似度,而且在处理完整体实体集后才能返回第一个结果。为解决上述两种问题,本文研究一种分块的轮廓查询的实体排序算法。本论文研究了实体排序算法应用轮廓查询需要的各种条件,对备选实体集进行一些预处理。对备选实体集中的实体表现形式进行结构化处理,实体的文本型属性特征量化处理,把主题扩展为查询。然后,设计实体排序算法。根据不同的用户需求,提出了两种算法实现。第一种:在备选实体集的轮廓实体集中选择前K个实体作为最终的实体列表。将备选实体集划分为不同的分组,构建最小外接矩形层次结构,建立R索引树。从R树中检索具有最优偏好函数得分的轮廓实体对象作为第一个返回的实体。以最小外接矩形为单位判断实体之间的支配关系,被支配的则被修剪掉,不被支配的继续处理,直到检索到K个轮廓实体对象。第二种:用户指定具有不同权重的偏好函数,检索到的实体结果并不完全是轮廓实体。与前面算法不同之处在于检索到第一个最优的轮廓实体对象后,从该轮廓实体的支配区域内的轮廓实体对象和原来除去该轮廓实体对象后的剩余轮廓实体对象的集合中检索次轮廓实体对象。最后,对本论文提出的实体排序算法进行维护和算法分析。本文不仅研究增加和删除实体时,如何保持正确的最终实体列表,还证明了本文提出算法的正确性和优越性。实验在维基百科实体集上进行以验证算法的有效性,同时验证了实体属性维度对算法性能的影响。因此本论文提出的算法具有很好理论意义。
其他文献
学位
真实感是很多CG电影与动画作品的主要追求,真实感材质是真实感渲染中最重要的组成部分之一。材质决定一个物体的颜色,透明度,粗糙度等属性。经过多年的研究,很多复杂的材质模
随着信息技术的发展,业务流程的范围也从部门和组织内部扩展到跨越部门,甚至跨越企业的边界,业务流程呈现出复杂、多变的特点。面向对象Petri网(Object-Oriented Petri Nets)
目前,许多重要领域都涉及到不确定数据的管理,如:数据集成,无线传感器网络,金融监控,趋势预测以及移动对象的管理。由于固有以及人为的多方面原因,这些领域的数据具有不可避免
当前互联网资源形式和内容多样,都是对客观世界事物的反映,也是资源生产者如网站编辑等在自身对客观世界认识基础上构建的概念世界的体现。同时,对于同一事物,不同的人有不同
虚拟化技术自诞生以来就受到人们的关注,由于其在资源利用率、安全性、管理便捷性方面的优势,它被越来越多的企业所采用。虚拟机热迁移技术,是虚拟化技术的一大亮点,它允许在
随着模型驱动开发技术的不断发展和在不同领域中的广泛应用,模型已经成为软件开发过程中的主要产品,软件建模也成为了软件开发与系统设计不可缺少的辅助手段。由于可视化建模
目标的检测、跟踪与行为识别作为视频监控的主要研究内容,是当前计算机视觉领域的研究热点,其不但具有重要的实际意义,而且对计算机视觉的其他研究领域有着重要的推动作用。
随着无线射频识别(Radio Frequency Identification, RFID)、传感器等电子数据采集设备(Electronic Data Gathering Equipment, EDGE)的不断发展,产生了空前的海量数据。由于
不管是在现实生活中还是在科研领域内,人体运动识别都起着至关重要的作用。其研究成果可以应用于多个领域,如:安保系统、智能家居、体感交互等等。随着技术的发展与革新,用于