支持文本属性和数值属性的关系Top-N查询处理

来源 :河北大学 | 被引量 : 0次 | 上传用户:zhaobaodong2006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,作为数据库领域和信息检索领域的前沿课题之一,对Top-N查询的研究得到了蓬勃发展,研究重点主要是查询处理策略和排序函数。以关系数据库为基础的Top-N查询能够检索出与关键词匹配程度最好的前N个元组,并且按指定的排序函数对输出的结果集合排序。目前,单纯针对数值属性的Top-N查询不断取得新的进展,但是,如何处理文本属性,并进一步将两者结合起来,还是一个涉足较少的领域。支持自然语义的Top-N查询不仅能够得到精确匹配的结果,同时也能得到在语义上相同或相似的答案,结果集将按照语义和数值的综合距离排序,实现更为复杂的查询。本文将讨论同时处理文本属性和数值属性的Top-N查询。本文的研究针对一种实现Top-N查询的方法,通过建立一个包含亲缘词和数值信息的索引,对查询相关信息实现高效的存储、预载入和检索,利用WordNet进行语义扩展,查询时首先搜索该索引,得到所有查询结果的元组标识,然后根据综合排序函数计算语义和数值距离并排序,得到候选元组集,最后利用SQL语句从数据库中获得完整的结果集信息,从而得到Top-N结果。实验内容包括对该索引的时间开销、空间占用以及查准率的计算,结果显示,这种方法是有效而且高效的。
其他文献
随着电子商务技术的发展,推荐系统的被广泛地应用于发掘用户兴趣,以提高商品销售量,在实际的推荐系统应用中,基于邻域的推荐系统是最为常见的推荐模型。在传统的基于邻域的推
IPv6被认为是下一代互联网络协议核心标准之一。随着网络厂商和开发商逐渐在不同的平台上引入IPv6,IPv4和IPv6将长期共存。在IPv4向IPv6过渡的时期,同时存在两种网络,以及各种各
随着IT架构不断被部署到关系国计民生的支撑行业中,提供24×7的高可用性变得越发重要,对于运行着关键服务的系统任何形式的打断都将造成巨大损失。操作系统作为整个软件体系架
随着数字图像处理技术的快速发展和Internet的普及,数字图像的应用愈加广泛,对图像进行有效管理和查询的需求也越来越迫切。基于内容的图像检索(content-based image retriev
探究式学习是一种强调学生自主积极投身其中的学习方式,主要有自主探究、合作探究和启发探究等模式。国际上对探究式学习对人才的成长和发展所产生的重要影响已经产生了共识,我
CISC结构的微处理器指令功能复杂,指令长度、格式不定。设计高效合理的译码器是加快指令译码速度,提高指令流水效率,进而有效提高处理器性能的重要保证。 本论文来源于西北工
支持向量机作为一种基于统计学习理论的新型学习算法,能很好的解决有限样本情况下的学习问题。这种方法从理论上控制了机器学习的复杂性,同时具有良好的收敛速度和推广能力。它
在企业的信息化建设过程中,企业组织中的各个部门或者地区分公司根据自身情况,构建了不同的信息系统来维护与自己工作相关的数据,这样企业的整个信息资产就被分裂成通常所说
随着互联网技术的发展,人们获取新闻的方式也在发生显著地变化,从传统的报纸、杂志向新闻聚合网站发展,如国内的网易新闻、新浪新闻,国外的谷歌新闻、雅虎新闻等。人们从信息