排序学习中数据噪音敏感度分析

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:changaty
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
排序学习是当前信息检索领域研究热点之一。为了避免训练集中噪音的影响,当前排序学习算法较多关注鲁棒性。已有的工作发现相同的排序学习方法的性能在不同的数据集上会有截然不同的噪音敏感度。模型改变是导致性能下降的直接原因,而模型又是从训练集学习到的,因此根源在于训练数据的某些特性。该文根据具体排序学习场景分析得出影响噪音敏感度的根本原因在于训练集中文档对分布的结论,并在LETOR3.0上的实验验证了这一结论。
其他文献
介绍了有关数字水印的一些典型技术、实现算法和应用,并对这些技术的优缺点作了简单的评价.文章也提出了一种新的水印技术的设想,并对其可行性进行了系统的分析,建立了相应的
提出一种简单的基于倍频器的同步采样脉冲发生器装置.通过理论分析和实际效果表明,装置能实现采样频率和信号基频的完全同步,具有测试精度高,测试速度快的优势.
昆明蔬菜调味品(集团)股份有限公司原为昆明市蔬菜副食酿造总公司,于二00一年三月改制为昆明蔬菜调味品(集团)股份有限公司。现有下属企业14个,其中:3个调味品加工厂、2个豆
期刊
TI公司生产的TMS320F240是专门用于控制的芯片,它特有的芯片结构和功能决定了它在控制中广泛的应用.文章介绍了F240的结构和特性,并介绍了对无刷直流电动机的实际控制.
<正>~~
期刊
针对爆发谱特征不稳定的问题,论文提出了一种基于能量变化率的汉语塞音检测方法.该方法首先基于Seneff听觉谱提取了一组描述音段能量变化率特性的参数,然后采用Fisherface方
为促进国内各民族语言文字信息处理技术的学术研究,加强同行间的学术交流与合作,中国中文信息学会少数民族语言文字信息处理专业委员会定于2011年7月29日在内蒙古呼和浩特举