论文部分内容阅读
体外受精-胚胎移植技术(invitrofertilizationandembryotransfer,IVF-ET),俗称试管婴儿,发展至今已经为许多不孕不育患者解决了难题。提高胚胎移植的着床成功率是试管婴儿技术的关键。目前对试管婴儿早期胚胎着床潜能的评估主要是对D3天卵裂胚医学图像的形态学分析,通过观察卵裂期胚胎图像中卵裂胚细胞数目、胚胎的碎片程度、卵裂胚是否均匀以及是否含有空泡等。形态学特征的弊端在于,发育时长较短的胚胎不具备形态学特征,胚胎通常需要在体外培育2-3天,直至具有形态学特征的囊胚期。而长时间的体外培育会耗费大量培育资源,并且胚胎在体外培养时容易受培养环境因素的影响(例如温度、光照等参数的变化),从而降低胚胎移植成功率。因此本文的主要研究目的是通过胚胎图像模式识别,在胚胎体外发育时间极短的情况下(发育时长仅为2h),以复杂性特征替代形态学特征作为胚胎能否顺利着床的依据。
本文的实验主体是胚胎图像。胚胎在CO2培养箱和适宜的环境中持续培育4-5天,每隔15min对胚胎进行一次显微拍摄,获得当时的胚胎发育状态图像,本文从中选择发育时长仅为2h的图像进行研究,样本总数为89,其中着床(1类)样本数为59,未着床(0类)样本数为30。胚胎图像需要先经过预处理,包括灰度化、剔除无用背景,之后对裁剪后的图像进行BEMD分解,得到一组BIMF,将原裁剪图象和对应的各阶BIMF压缩为32*32像素大小,目的是为了提高计算效率。
压缩后的图像需要先通过空间填充曲线降维、转变为一维序列后才能够提取复杂性特征。本文选择二维希尔伯特曲线和二维中心螺旋曲线分别扫描压缩后的图像,之后再分别计算不同细粒化程度所对应的格子复杂性特征。
胚胎能否着床属于一个二分类问题,并且样本总数为89例,属于小样本,因此本文选择针对小样本的SVM分类器。为了寻找合适的SVM参数,首先将全部样本进行10折交叉验证,并搭配前向特征选择法筛选出最佳特征组合。在筛选特征时,为了避免不同类型特征之间的抵消作用,本文还将全部特征划分为非BIMF特征和BIMF特征,两种类别特征分别筛选特征。得到合适的SVM参数和最佳特征组合后,将全部样本随机划分为训练集和测试集,训练集用于建立模型,测试集验证模型的鲁棒性。全部特征10折交叉验证准确率、测试集准确率和AUC值分别为96.6292%、88.64%(39/44)和0.9137,最佳特征组合维数为44。
胚胎的发育过程是一个动态的过程,除了二维图像,本文还对胚胎的三维图像进行实验,只是没有加入三维EMD分解。因此三维特征中没有IMF特征。全部的三维特征10折交叉验证准确率、测试集准确率和AUC值分别为93.2584%、90.91%(40/44)和0.949,最佳特征组合维数为20。从结果看,三维图像的分类效果略低于二维图像,但是最佳特征组合维数较低,只有二维的一半。造成的原因可能是在胚胎培育的过程中产生了细胞偏移现象,从而导致后续图像处理过程产生偏差。总而言之,复杂性特征在预测胚胎着床上效果显著,具有较大的应用前景。
本文的实验主体是胚胎图像。胚胎在CO2培养箱和适宜的环境中持续培育4-5天,每隔15min对胚胎进行一次显微拍摄,获得当时的胚胎发育状态图像,本文从中选择发育时长仅为2h的图像进行研究,样本总数为89,其中着床(1类)样本数为59,未着床(0类)样本数为30。胚胎图像需要先经过预处理,包括灰度化、剔除无用背景,之后对裁剪后的图像进行BEMD分解,得到一组BIMF,将原裁剪图象和对应的各阶BIMF压缩为32*32像素大小,目的是为了提高计算效率。
压缩后的图像需要先通过空间填充曲线降维、转变为一维序列后才能够提取复杂性特征。本文选择二维希尔伯特曲线和二维中心螺旋曲线分别扫描压缩后的图像,之后再分别计算不同细粒化程度所对应的格子复杂性特征。
胚胎能否着床属于一个二分类问题,并且样本总数为89例,属于小样本,因此本文选择针对小样本的SVM分类器。为了寻找合适的SVM参数,首先将全部样本进行10折交叉验证,并搭配前向特征选择法筛选出最佳特征组合。在筛选特征时,为了避免不同类型特征之间的抵消作用,本文还将全部特征划分为非BIMF特征和BIMF特征,两种类别特征分别筛选特征。得到合适的SVM参数和最佳特征组合后,将全部样本随机划分为训练集和测试集,训练集用于建立模型,测试集验证模型的鲁棒性。全部特征10折交叉验证准确率、测试集准确率和AUC值分别为96.6292%、88.64%(39/44)和0.9137,最佳特征组合维数为44。
胚胎的发育过程是一个动态的过程,除了二维图像,本文还对胚胎的三维图像进行实验,只是没有加入三维EMD分解。因此三维特征中没有IMF特征。全部的三维特征10折交叉验证准确率、测试集准确率和AUC值分别为93.2584%、90.91%(40/44)和0.949,最佳特征组合维数为20。从结果看,三维图像的分类效果略低于二维图像,但是最佳特征组合维数较低,只有二维的一半。造成的原因可能是在胚胎培育的过程中产生了细胞偏移现象,从而导致后续图像处理过程产生偏差。总而言之,复杂性特征在预测胚胎着床上效果显著,具有较大的应用前景。