面向大数据中心的数据检索研究与实现

来源 :辽宁工程技术大学 | 被引量 : 0次 | 上传用户:pbsiszx1234567
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着信息获取技术的迅猛发展,各种应用所产生的数据呈指数级增长,同时伴随着新数据源的不断涌现,数据内容也越来越丰富,预示着我们已经进入大数据时代。面对如此庞大的数据量、繁多的数据类型和复杂的数据结构,如何高效、统一地管理数据、获取有价值的信息显得迫在眉睫。为了解决这一难题,各类数据管理系统应运而生,大数据中心系统就是其中之一,提供了对于现有数据资源的综合检索和管理能力。本文结合大数据中心系统的应用需求,从空间数据和非空间数据两个方面出发,系统地研究了数据检索的实现方法,旨在实现目标数据的快速、准确获取,进而为用户的决策分析提供参考和依据。(1)空间数据检索部分。论文在分析空间数据基本特征和Oracle Spatial技术的基础上,选取空间数据的空间特征、属性特征和空间关系特征等作为空间数据检索的基本方向,研究了基于Oracle Spatial的空间数据检索功能的工作原理和实现方法;同时提出了基于九交模型的拓扑关系查询方法,实现了对所有拓扑关系的唯一表达;阐述了空间对象缓冲区的建立方法,实现了典型的距离关系查询——缓冲区查询;最后对空间数据的描述信息进行有效组织,进而实现海量空间数据的高效检索。(2)非空间数据检索部分。论文以文本数据作为主要研究对象,提出了基于摘要实现数据检索的方法。其中,涉及的重点内容包括:自动分词中,利用分词词典的分层设计架构优化了正向最大匹配分词算法,进一步提高了自动分词的效率;自动文摘中,在分析现有文摘方法的基础上,提出了基于结构和统计相结合的自动文摘方法,弥补了现有方法在适用范围和文摘可读性方面的缺陷与不足;最后阐述了基于词表的全文检索技术,打破了以往关键词检索的局限性。这种通过附加摘要提高数据检索效率的思想为海量非空间数据的检索奠定了基础。(3)将论文研究内容应用于实践,设计并开发了面向大数据中心系统的数据检索功能,证实了论文研究成果的准确性和实用性。
其他文献
早期教育对促进儿童大脑发育和智力发展具有重要作用。0~6岁儿童正处于大脑迅速发育的感知运动和前运算阶段,故儿童具有独特的心理特点,且与成长认知情况具有明显的差异性。
现代化促使西北民族地区的社会结构发生转型,推动了经济繁荣和社会进步,而与此同时,社会剧变也诱发了与民族有关的诸多社会矛盾,致使民族地区社会的稳定发展出现了新情况、新
语素与语素意识是近年来语言习得中的研究热点。语素意识指的是对词语内部结构的认识和操控能力,国内外的研究者发现语素意识与阅读理解存在着正向的关系。关于语素意识与阅读理解,现有研究关注了其是否会对阅读理解有影响,但是针对语素意识与阅读理解关系的研究不多。本项研究从语素意识与阅读理解的关系着手,探究了其与阅读理解的直接和间接关系,期待为语素意识研究提供佐证。按照专业培养要求,作者选取职前英语教师作为研究
改革开放以来,我国经济蓬勃发展。但随之而来的是市场经济的激烈竞争,众多行业呈现“红海”一片。如何在激烈的市场竞争中谋求生存与发展,已成为企业界关注的焦点。品牌营销
随着社会经济不断发展,营销活动逐渐成为企业未来发展的重要内容之一,良好的营销活动,不仅能够展现优秀的企业文化,且能够给企业带来更高的经济效益。在当代社会,为了更好推
守门员要扩大防守范围,减轻防守的压力,必须具备善于出击的能力。在足球比赛中,往往由于守门员出击不及时或是不应出击而出击,造成失球的现象。本文对足球守门员出击的重要性
总结本院实施卫生部"优质护理服务示范工程"活动的经验,包括动员与培训,转变护理人员服务理念,垂直管理,绩效考核与分配挂钩,岗位管理,优化工作流程,制订护理路径表单,成立支
针灸学从古至今一直运用于临床急救中。它因具有特效、速效、针对性强、简便易行的特点,随身携带,便于应急,不受地点条件限制的优越性,被历代医家所重视。现综合古今文献,总
结合陕西明业煤矿实际状况,对巷道围岩支护等问题进行探究,在认知与分析支护原理及锚锚注浆机理的基础上,提出锚锚注联合支护技术,通过有效支护技术形成稳定结构,切实控制巷道围岩