【摘 要】
:
随着互联网的高速发展,Web搜索引擎已成为人们获取信息的必不可少的工具。很多情况下,用户查询的信息都与位置信息相关,比如旅游信息,某地商业信息和某地发生的时间信息。用
论文部分内容阅读
随着互联网的高速发展,Web搜索引擎已成为人们获取信息的必不可少的工具。很多情况下,用户查询的信息都与位置信息相关,比如旅游信息,某地商业信息和某地发生的时间信息。用户在进行查询与位置相关的信息时,希望检索出在特定区域内并满足检索条件中的文本约束的相关页面。随着旅游业和全球贸易等行业的发展,人们跨区域的活动就日益频繁,人们在互联网上在查询指定的区域检索相关的信息的需求越来越突出。由此看出,位置相关的查询需求日益增多,同时位置信息的重要性也引起了相关领域学者的关注。本文重点围绕如何解决基于位置感知的Web文本搜索中的关键技术展开研究。本文首先对分析基于位置感知的Web文本搜索引擎特点后提出了其所面临的三个关键问题:(1)确定网页地理范围;(2)地理位置信息和文本信息融合;(3)设计一种高效的检索算法。然后通过具体研究提出了采用基于模式匹配和基于地名数据库的方法抽取网页地理信息和通过概率分布确定网页的地理范围。在确定网页地理范围基础之上,本文提出了一种新型的地理位置信息和文本信息融合的索引结构MR-Tree和倒排索引相互独立的索引结构。同时基于MR-Tree和倒排索引相互独立的索引结构,设计了一种高效、稳定的查询算法。最后,在解决三个关键问题之后,本文设计和实现了一个位置相关的Web文本搜索引擎的模型并在大量现实数据集上加以测试和验证,取得了很好的效果。实践证明,基于位置感知的Web文本搜索是普遍存在的现实需求,同时如何实现该类搜索也是一类复杂问题和极具挑战性的研究工作,具有重要的理论研究价值和现实意义。由于研究时间和自身水平有限,论文的研究工作尚缺乏深度,且存在很多不足之处,作者将在后续的研究过程中加以持续改进。
其他文献
摘要:随着软件技术的飞速发展,软件的质量一直是软件行业关注的主题。软件测试作为保证软件质量的重要手段,在软件开发过程中发挥着至关重要的作用。软件测试在软件开发过程中
无线传感网络是以数据为中心的网络,如何实现感知数据的有效收集是实现传感网络广泛应用的关键技术之一。随着移动传感网络的发展应用,若继续采用传统数据收集模式,则数据传
随着机器人技术发展和成熟,机器人的的应用和需求也与日俱增。白定位与地图构建是实现机器人自主导航的关键问题,集中体现了移动机器人的感知能力和智力水平。与单移动机器人
数字信号处理器(Digital Signal Processor, DSP)往往具有不同于通用处理器的体系结构,传统编译技术生成的代码无法满足信号处理的高性能要求。这需要我们采用与传统不同的编
随着计算机网络技术的迅速发展,企业在信息化建设过程中,需要有很多的信息管理系统来维护企业数据。由于企业间以及企业内部各部门间的相对独立性,造成了构建系统数据的分布
语音识别在实验室环境中已取得了令人满意的效果,但当运用到实际环境时却往往出现识别率显著下降的情况,如何提高噪声环境下的语音识别鲁棒性是当今语音识别研究中最为重要的问
随着计算机、网络和多媒体技术的迅速发展,人们越来越多的接触到大量的视频信息。如何从包含大量信息的庞大视频库中检索出所需要的有用信息,已经是一个迫切需要解决的研究难
随着信息网络化和印刷技术的不断发展,文档的复制和传播变得非常容易,文档信息的安全面临着极为严重的挑战。数字水印作为一种潜在的解决方案,备受青睐。本文重点研究了提升
近年来,云计算的研究与应用在学术界和行业界都取得了巨大的进展,它为众多的用户提供了经济和便捷的服务,使越来越多的公司和用户计划将其数据上传到公共云。但是,由于数据所
随着计算机技术的进一步发展,信息产业已经渗透到当今社会的各行各业。在教育领域,如何突破传统教学模式及考试模式,使教育信息化在当前教育教学中发挥更大作用是我国当前教