论文部分内容阅读
乳腺癌已成为严重影响妇女身心健康甚至危及生命的最常见的恶性肿瘤之乳腺病变的早期发现是提高治愈率和降低死亡率的关键。乳腺钼靶X线图像是临床上女性乳腺疾病最常用的检测手段,但纯用人工方法阅片会产生耗时多、易疲劳、漏诊和误诊率高等问题。肿块是乳腺癌最常见的征象,利用计算机辅助乳腺肿块检测系统,可以帮助影像科医师减少阅片时间、缓解疲劳、提高诊断准确率。然而,传统的基于机器学习的计算机辅助肿块检测方法的准确率、训练效率都有待提升,在大规模训练集上尚无良好的解决方案。极限学习机(Extreme Learning Machine, ELM)的提出为乳腺肿块辅助检测开辟了一条有效的途径,本文在现有的肿块检测和机器学习方法的基础上,提出了一系列基于极限学习机的乳腺肿块检测技术。主要工作包括以下几点:(1)基于ELM的面向单幅图像的乳腺肿块检测方法。基于乳腺钼靶X线图像建立了包含形态和纹理特征的疑似肿块区域的特征模型,提出了一种基于ELM的面向单幅图像的乳腺肿块检测方法,相比支持向量机的方法,在训练速度、检测准确率等方面都有明显提升。(2)基于ELM的面向单侧双视图的乳腺肿块检测方法。建立了融合CC视图、MLO视图的单幅图像特征向量和双视图特征向量的特征模型,对该模型进行特征选择后,基于ELM进行肿块检测,相比面向单幅图像的乳腺肿块检测方法,得到了较高的检测准确率。(3)基于ELM的面向双侧单视图的乳腺肿块检测方法。建立了双侧特征集合,并融入左右两侧的单幅图像特征,形成双侧单视图特征模型并进行特征选择,基于ELM进行肿块检测,相比面向单幅图像的乳腺肿块检测方法,得到了较高的检测准确率。(4)基于MapReduce框架的分布式极限学习机方法。通过分析,发现ELM运算过程中最耗费计算量的是矩阵乘法运算,从理论上证明了该运算是可分解的,并提出了基于MapReduce框架的分布式极限学习机(ELM*)的方法,通过实验验证该法可以高效学习大规模训练数据集。(5)分布式极限学习机的性能优化方法。理论上证明了ELM*中最耗费计算量的部分是可以进行增量、减量和纠错计算的,提出了一种分布式极限学习机的性能优化方法,并通过实验验证该法可以增强ELM*的更新数据集学习能力。(6)基于极限学习机的乳腺肿块检测原型系统。设计与实现了一个基于极限学习机的乳腺肿块检测原型系统,并通过该系统验证了本文提出的理论和方法的有效性。综上所述,本文研究了基于极限学习机的乳腺肿块检测关键技术,提出了基于极限学习机的面向单幅图像、单侧双视图图像和双侧单视图图像的乳腺肿块检测方法,有效地提高了训练速度和检测的准确率。并提出了基于MapReduce的分布式极限学习机及其性能优化方法,解决了大数据量学习和更新学习等问题,使传统极限学习机的可扩展性得到增强。最后,实现了基于极限学习机的乳腺肿块检测原型系统,在该原型系统上通过大量的实验和分析验证了以上方法的有效性。这些方法的研究对推动计算机辅助乳腺肿块检测技术的发展具有重要的学术价值和一定的临床指导意义。