论文部分内容阅读
每年全球有700多万人死于癌症,一些常见的癌症,例如肺癌,宫颈癌等可以通过细胞学检查进行诊断。因此细胞核图像分类在临床医学检验中有着重大意义。只有将细胞核图像正确分类,才能对细胞核显微图像进行病理分析,如计算细胞核的DNA指数,判断细胞是否癌变或者有其他病变。细胞核图像分类的过程主要有细胞核分割,特征计算,分类这三大步骤。 在细胞核图像分割中,本文使用了基于椭圆分割的ESnake算法,在使用该算法的过程中,发现该方法虽然分割效果良好,但也会出现分割失败的情况。分析了分割失败的例子后,结合了大津法分割算法,得到了更好的分割效果,并有效的提升了分类的准确率。 在特征的计算中,考虑到特征的区分度和计算的时间复杂度,我们总共精心选取了21个特征,这些特征主要是几何特征和光密度特征。这些特征的计算速度较快,而且有更好的区分度。本文给出了这些特征在分类中的重要性排序,可以根据需要进行筛选,进一步降低计算的时间复杂度。 在分类算法中,本文使用了批量算法——随机森林和支持向量机。通过实验结果分析,证明其分类准确率都比较高,完全可以投入到临床使用。但是目前该领域的研究中使用的都是批量分类算法,本文使用了在线支持分类器LASVM,用以满足训练数据动态增长的情况。该算法在训练时间方面具有极大的提升。同时本文进一步对该算法进行了改进,进一步提高了分类的准确率。