论文部分内容阅读
大数据中对目标信息的准确查询,能够为信息分析提供更多的信息资源保障和技术支持。对大数据中目标信息的查询,需要对原始目标信息特征空间进行降维,给出目标信息码本阈值,完成对信息准确的查询。传统方法先给出分布式乘积量化模型的形式化定义,利用训练出的码本模型对分布式数据进行编码,但忽略了对原始数据进行降维处理,导致查询效果不理想。提出基于哈希的大数据中目标信息准确查询方法。提取目标信息的特征,给出信息间的相似性关系,获取两个相关矩阵的归一化的内积,得到基于目标信息字面上的词项的相似度,通过主成分分析理论对原