基于协同过滤加权预测的主动学习缺失值填补算法

来源 :南京大学学报:自然科学版 | 被引量 : 0次 | 上传用户:sgcc7186
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在机器学习应用中,缺失值填补作为一种预处理技术,能有效提高数据的可用性,然而在缺失值较多或不均衡时,这些技术的效果并不理想.主动学习场景允许机器与用户交互,以获取少量关键数据,提高分类精度.针对主动获取数据量有限的问题,提出基于协同过滤加权预测的主动学习缺失值填补算法(Collaborative Filtering weighted prediction based Active Learning,CFAL).首先采用基于样本和基于属性的协同过滤方法分别预测缺失值;然后根据预测值的差异对数据进行排序,差异
其他文献
极化合成孔径雷达具备全天候的积雪观测能力,而且能提供丰富的极化特征用于积雪识别.选取2014年3月19日新疆玛纳斯河流域典型区Radarsat-2数据,首先对全极化SAR(Synthetic Ape
中英西南基础教育项目在逻辑框架的验证指标中提出:“到项目结束时,与基线相比,省教育厅及县教育局的管理者、项目管理人员和农村学校女教师和女校长比例得到增加,尤其是女校长人
纳米氧化锌(ZnO NPs)在水环境中的存在形态对水生植物的生态风险有重要影响,研究了ZnO NPs在水体中的稳定性及对沉水植物金鱼藻的毒性效应.ZnO NPs进入到培养液中后观察到明显
最近几年,信号的稀疏表示在图像处理、人脸识别、纹理分类等领域得到了广泛的应用.在粒子滤波框架下,视频跟踪问题被看作是使用若干个目标模板来稀疏化线性表示候选区域的过程,并使用"小模板"来处理目标物在视频场景中出现的各种复杂变化,这种算法过程简单,但效率很低.提出一种改进方法,使用下采样方式降低稀疏编码的复杂度,并设计了性能良好的稀疏系数向量融合方法.实验表明,该算法在对跟踪精度几乎没有影响的前提下,
湘东北大型栗山铅锌铜多金属矿床位于幕阜山岩体边部,矿体赋存于岩体及其内外接触带中的硅化构造角砾岩带内.根据野外调查和显微岩(矿)相学观察,可将栗山矿床的主成矿期——热液成
频域自适应算法有较快的收敛速度和较低的运算量,这使得其很适合在实时有源噪声控制系统中使用。常用的归一化频域算法在非因果条件时,收敛不到最优解。本文分析了归一化频域算
复合粗糙集及其扩展模型可同时对信息系统中多个二元关系进行有效处理,已在实际中得到成功应用.研究了概率复合粗糙集模型中的复合关系,通过对信息系统中数值类型数据进行处
绝缘体上锗(Germanium-on-Insulator,GOI)结合了Ge材料及SOI(Silicon-on-Insulator)结构的优点,是一种极具吸引力的Si基新型材料.GOI材料不仅具有高的电子和空穴迁移率,同时其独
块效应是由于对图像做离散余弦变换(DCT),在量化过程中丢失边缘的高频信息,从而导致在重建图像中块边界处出现不连续的跳变的现象.本文针对图像的块效应原理,用Contourlet变换对图像进行分解,将得到的Contourlet系数通过去块效应算法进行更新,并用得到的新系数进行图像重构.实验结果表明,该算法保留了更多原图像的细节部分,在处理图像边缘信息方面比传统方法有更好的恢复效果.
该工作利用区域模式(WRF),对我国东部三大城市群区域的气溶胶活化颗粒物浓度增加的气候效应进行了模拟研究。结果表明:增加气溶胶活化颗粒物后,我国东部许多地区的地表感热、潜热