论文部分内容阅读
随着实际生活中应用方面的需求急速扩大,基于航空航天的科学探测和天文观测、民用领域的视频监控、军事目标跟踪以及医学疾病诊断等方面的分类和识别问题,应运而生了许多优秀的算法,并在日益强大的计算机技术的帮助下得以实现。Boosting是一种可以改善弱分类算法的通用方法,通过集成学习,把正确率较低的弱分类器结合成正确率较高的强分类器。AdaBoost算法是Boosting算法的优秀代表,有着越发完善的理论基础和广泛的应用领域。AdaBoost弥补了Boosting算法有关弱分类器要预先知道其正确率下限的不足,实现了真正意义上对任何分类算法都可以提升其准确率的想法。文章首先分析了Boosting算法和AdaBoost算法的基本框架,为后续工作奠定了理论基础,然后基于一种新的弱学习算法,改进最优规则AdaBoost,提出多规则AdaBoost算法。该算法在训练过程中首先标准化所有特征的特征值,然后根据每个特征和样本标签之间的规律性强弱,来反应个体的不同特征对分类的影响,并以此选取分类规则设定权重,提高算法的识辨率。这种弱分类算法更多的挖掘了特征值数据本身的价值,而不用对特征值数据进行更繁琐的处理和转换,这样就可以节约更多的时间和运行空间,因而在解决问题时更具有实用性。在UCI数据库中,选取了SPECTF Heart数据集,Ionosphere数据集和Wine Quality数据集对该算法和改进前的算法进行了实验,通过稳定性和准确率等方面的比较,表明该算法有更优的训练和测试能力,从而证明多规则算法可以提高集成分类器的整体正确率。