面向基于关键词的相似性搜索的嵌入方法有效性分析

来源 :计算机应用研究 | 被引量 : 3次 | 上传用户:xraid
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
FastMap、SparseMap、BoostMap被认为是适用于任何度量空间的嵌入方法。然而之前的研究者高估了它们的适用性,它们在基于关键词的度量空间中并不适用。为了评估它们在关键词空间中的适用性,通过将它们实例化到基于关键词的相似性搜索的场景中,利用嵌入方法与局部敏感哈希相结合的方法,针对它们的嵌入效果进行了研究。重点从精确度、召回率、应力(stress)和距离保存效率方面,给出了它们在不同数据集上的实验结果。发现它们在基于关键词的度量空间中的嵌入效果并不好,得出了它们并不适用于所有的度量空间的
其他文献
根据铁路现场车流组织的实际特点,构建基于最远站法则的列车编组计划优化双层规划模型。上层规划模型以车流组织总成本最小为目标函数,以车流组织方案的唯一性、技术站的改编
以轨道质量指数评价轨道区段的平顺状态,不能反映具体的运营车辆相对轨道的动力学响应。因此,借鉴能量集中率的思想,提出综合评价车辆/轨道系统动态特性的广义能量指标,并引
为了使空间故障树具有智能推理的能力,采用因素空间中背景关系分析的基本原理,提出了可分析实际故障数据的故障及影响因素关系分析方法。将影响故障因素设为影响因素,将故障概率
通过对青藏铁路清水河地区拼装式涵洞地基温度和沉降的观测,研究多年冻土区拼装式涵洞现浇混凝土基础对冻土的热扰动影响、地基的回冻规律和冻土人为上限的变化特征,分析涵洞
为了研究地铁杂散电流场的分布规律及其影响范围,建立二维地铁杂散电流场数学模型,采用伽辽金有限单元法进行求解,根据有限元控制方程编制求解程序。对存在解析解的圆环域恒
对流体力学计算软件FLUENT6.3进行二次开发,建立二维平面模型,将Newmark方法的代码嵌入用户自定义函数UDF,运用FLUENT动网格技术对南京大胜关长江大桥吊杆进行涡激振动仿真计
复杂网络结构的复杂性以及节点行为的多样性等因素,使得分数阶复杂网络的同步与控制研究得到了国内外研究者的广泛关注。讨论了异结构分数阶复杂网络的同步问题。应用自适应控制方法设计出一类非常简单的控制器。基于分数阶稳定性理论,选择合适的分数阶参数,推导出两类异结构分数阶复杂网络状态同步的充分条件。仿真结果进一步验证了所设计自适应控制器的有效性,并详细分析了分数阶参数复杂网络同步的影响。
中国铁道科学研究院坚持“行业服务为立院之本,成果转化为兴院之策”的建院方针,积极融入行业发展的大局,紧紧围绕和谐铁路建设重点领域,努力提高科技创新能力和水平,2008年共主持
鉴于传统的协同过滤推荐算法在处理冷启动和数据较稀疏的问题上表现不佳,提出一种将堆栈降噪自编码器(stacked denoising autoencodes,SDAE)与最近邻推荐方法相结合的混合SDAE推荐模型。使用逐层自编码的思想将极限学习机与降噪自编码器堆叠形成基于极限学习机(extreme learning machine,ELM)计算的堆栈降噪自编码器的深度学习模型,最终用模型提取的抽象特