论文部分内容阅读
图像是日常生活中人们传递互换信息的一个重要载体,对于图像内容的研究就是图像分析。图像分析的应用涉及到计算机视觉、机器视觉、信号处理、数字几何等各个领域,因此研究图像分析算法具有重要的理论价值和现实意义。本文研究图像分析领域的两类重要算法,即图像的聚类算法和检测算法。从应用上讲,图像聚类和目标检测是图像分析的关键技术,广泛应用于图像检索、医学成像、多媒体通信与娱乐等,研究这两类算法具有重大的社会意义。从理论上讲,图像聚类算法是典型的无监督学习问题,而目标检测算法属于有监督学习任务,研究这两类算法具有重要的学术价值。本文创新点如下:一、GNMF中存在两个问题,一是k-NN构图方式对异常值敏感,二是目标函数中的正则项在优化时存在尺度转移,针对以上两个问题,文章提出了基于鲁棒k-NN图和重构正则的非负矩阵分解(RG~2NMF),用在图像聚类任务上。RG~2NMF一方面在构图的同时进行特征选择,剔除异常值,减小了噪声及不相关特征的干扰,另一方面提出重构正则项,稳固目标函数,使其总能够找到一个次优解。实验结果表明,相对于原始模型和当前具有代表性的其他模型,RG~2NMF显著提高了图像聚类性能。二、YOLO目标检测算法存在一些不足,主要是对小目标及不常见长宽比的目标泛化能力较差,定位错误率较高,使得YOLO算法的准确度低于当前准确度最高的目标检测方法。针对以上问题,文章提出了基于显著性和多尺度思想的YOLO算法(SMSYOLO),用在目标检测任务上。SMSYOLO一是引入多尺度目标检测的思想,在多个特征图上匹配不同尺度的目标,二是使用深度残差网络作为基础网络,提取更有力的特征,三是引入显著性先验知识,提高定位准确度。实验结果表明,相对于原始模型和当前具有代表性的其他模型,SMSYOLO明显提高了目标检测性能。