相似文本的快速搜索

来源 :计算机工程 | 被引量 : 7次 | 上传用户:dianquan999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
相似文本的快速搜索是大规模文本处理需要解决的基本问题。从两方面改进了Udi的相似文本搜索方法,通过Hash把集合映射成ID,从而得到更快的集合比较算法,重新定义了相似关系,能够减少误判,同时对有固定格式的文本也有更好的效果。
其他文献
提出了一种基于快表机制的PMI+PKI安全访问控制模型.该方案通过使用带有缓冲功能的快表机制,使应用PMI+PKI技术的Web站点自身具有验证证书状态和分配权限的功能,从而使大量的
提出一种新的视频实时加密算法RMVEA.RMVEA建立在数字多媒体实时动态系统上,独立于任何视频压缩算法,为实时数字视频提供高强度、高速度的加密.实验结果表明该算法在基本不增
提出一种基于小波域区域分割的估计图像噪声的新方法。该方法利用图像的小波高频系数,在提出图像平滑区域的基础上,准确地估计图像高斯噪声的标准方差。由于考虑了图像的局部信息,因此该方法优于传统的估计方法。用于多幅实验图像的结果表明:在图像受噪声比较小或图像含高频信息较丰富时,该方法比传统方法更准确。
随着Web的发展,用户检索有用的信息变得越来越难.因此,在Web环境下,迫切需要研发相应的系统解决这个问题.而这一系统的核心是问题解决标记语言和基于PSML语言的Web推理引擎.