Q-Gram相关论文
数据质量是保证数据能够有效地发挥作用的关键。数据质量的保证贯穿于数据的整个生命周期,它是一个系统过程,是一个质量评估分析和各......
相似字符串匹配过滤算法因其适合大库查找而被广泛应用,为通过提高过滤算法的过滤效率加快匹配速度,提出一种基于匹配区域特征的过......
如何在大型文本库中快速找出给定串的近似串是大数据时代要解决的关键问题.基于多种子的近似串匹配算法因匹配速度快而得到众多学......
模式匹配是数据集成的重要步骤之一,而数据库异构、数据量大等特点是匹配的难点所在。在梳理模式匹配概念和研究现状的基础上,提出......
大数据量的相似重复记录检测是数据清洗中的一个重要问题,提出一种基于q-gram层次空间的聚类检测方法:它首先将数据映射成q-gram空......
相似性查询在实际应用中用途广泛,例如相似网页检测、相似图像检索、语言识别、数据清理等。而基于q-gram的字符串相似性查询作为主......
进入二十一世纪,信息技术的快速发展,计算机的普及,互联网的广泛应用,全球信息共享日益加大,信息量爆炸式的增长。在大量的信息面......