论文部分内容阅读
乳腺癌是严重威胁女性健康的肿瘤性疾病,在女性癌症死亡率中占据首位。目前我国乳腺癌的发病率和发病速率均为世界首位,且呈上升趋势。鉴于乳腺癌对生命健康的严重危害,世界范围内相关的科研人员和机构为找到完善的诊断、治疗方案做着不懈的努力。随着计算机性能和机器学习水平的提高,智能算法已经可以在一些领域代替人的行为和判断。传统的乳腺癌诊断流程需要医学专家反复观察患者的乳腺样本细胞形态和胸部影像学图片,在这种情况下,利用算法技术快速反馈给医生一个大概率的参考结果,这对于增加诊断效率和减轻医生检查负担尤为重要。针对现有乳腺癌识别方法精度不足问题,本文分别研究了数值型和超声图像类别的乳腺癌诊断数据特征,并提出了相应的乳腺癌分类识别算法。本文的主要研究内容及成果如下:1)提出并实现了一种基于鲸鱼优化算法(WOA,Whale Optimization Algorithm)迭代调整支持向量机(SVM,Support Vector Machine)关键参数以提升乳腺癌识别精度的方案。为验证WOA-SVM算法性能,本文使用UCI数据库中的威斯康辛州乳腺癌数据集WBCD(Wisconsin Breast Cancer Databas)进行性能验证实验。实验表明WOA-SVM模型在留出法验证下精度高于98.53%,10折交叉验证下精度为97.50%,相较于传统的乳腺癌识别模型具备更高的识别精度。2)针对10折交叉验证下WOA-SVM算法精度较低问题,对其进行改进。首先采用支持向量机递归特征消除方法SVM-RFE对原始数据集进行降维处理,然后对WOA算法引入动态增加优质算子的思想进行改进并得到MWOA(Modified Whale Optimization Algorithm)算法。再次使用WBCD数据集实验,实验结果证明了MWOA-SVM算法相较于WOA-SVM性能更加优越,识别精度提高了0.44%。3)基于特征提取方法,提出并实现了一种面向超声图像数据的乳腺癌分类识别算法。该算法首先采用可视化机器学习工具Weka对超声图像进行PHOG特征提取,然后采用随机森林算法对特征数据进行分类识别。使用乳房超声图像数据集BUSI(Breast Ultra Sound Images)进行性能验证实验,实验结果表明该算法流程AUC为95.60%,具备较高可信度和应用价值。