数据依赖的多索引哈希算法

来源 :西安电子科技大学学报 | 被引量 : 1次 | 上传用户:BENLAOQIAN
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于多索引哈希基于数据集中的二进制码呈均匀分布这一假设,不能有效地处理非均匀分布的数据集,故针对这一问题提出数据依赖的多索引哈希算法.首先把二进制码划分为多个连续不重合的子串,并通过计算二进制码每位之间的相关性为每一个子串学习得到自适应投影向量;在为每个子串建立哈希表时,使用投影向量对子串进行投影,从而得到哈希表中的下标;采用自适应投影的方法可以使得哈希表中的元素接近于均匀分布,进而提升了查询速度.此外,提出一个基于熵的分布度量方法,以评价哈希表中数据元素的分布情况.在大规模数据集上的实验表明,与多
其他文献
采用电流求和结构,提出了一种高性能BiCMOS差分参考电压源,引入零反馈补偿技术有效提高了差分参考电压的电源抑制比,电流求和温度补偿技术保证了差分参考电压的高精度、低温漂。
一次,马克·吐温到芝加哥办事,结束时已经很晚了,只好到一家旅店借宿,希望能好好休息,因为第二天还要到另一个城市讲课。  由于是盛夏,天气炎热,蚊蝇叮咬非常厉害。他在服务台登记房间时,恰好一只蚊子飞了过来,马克·吐温非常懊恼,心想:“这旅馆的条件也太差了,怎么能睡好呢!”但他却一脸微笑地对服务员说道:“你们这里的蚊子真聪明,竟然会预先来看好我的房间号码,想趁着夜晚来临之时,饱餐一顿。”服务员一听,禁