论文部分内容阅读
随着GPS技术的不断完善和发展,基于位置的服务LBS(Location-Based Service)也呈现出多样化的发展趋势,应用领域不断得到扩充,如电子地图系统、旅游信息查询系统、日常兴趣点查询系统等。为了能够准确查询地址,需要一个优良的地址描述匹配检测算法,该类算法不仅是LBS的核心技术之一,同时,也是自然语言处理的重要研究方向之一。本文通过引入句子相似度计算技术,较好的解决的地址描述匹配检测问题,句子相似度计算是自然语言处理领域的重要研究方向之一,在文本分类、机器翻译等应用中发挥着重要作用。近年来,研究人员提出了许多衡量句子相似性的方法,但由于这些方法几乎都是从基于长文本的处理方法中衍生出来的,不适合具有较短长度的地址描述串的相似度比较。本论文研究具有较短长度的地址描述串的相似度计算,特别是中文地址和英文地址之间的相似性,提出了一个地址描述串相似度计算的算法。该算法在计算中英文地址的相似度过程中,综合利用两者的结构和语义信息的相似性,其中包括词典翻译信息、词序信息等,同时对词向量的元素进行合理的权值分配。实验结果分析表明,该方法具有较高的准确性,能够满足相似地址匹配检测的应用需求。基于该算法,本文实现了一个基于自然语言描述的地理位置查询系统。