基于卷积神经网络的宫颈病变图像分类方法研究

来源 :新生代·上半月 | 被引量 : 0次 | 上传用户:lxj364199013
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘要】:宫颈病变图像分类具有重要的临床应用价值。基于人工提取特征的分类算法,存在需要专业领域知识、耗时费力、提取高质量特征困难等问题。为此,采用一种改进的深度卷积神经网络模型,实现了宫颈病变图像的自动分类;同时,利用数据增强方法,有效避免了深度学习模型受样本量限制时易出现的过拟合问题。实验结果表明,该方法的识别率可达到89%,且具有较好的鲁棒性和泛化性。
  【关键词】:宫颈病变图像分类 深度学习 卷积神经网络 数据增强
  引言
  在中国,宫颈癌是第二大高发癌症,但是宫颈癌可以通过早期的普查,予以预防和治疗,从而明显降低患病率和死亡率。而临床诊断的核心问题是诊断的假阳性率较高[1-3],那么宫颈癌细胞的特征识别就成了问题的核心,如何识别更加有效的癌细胞特征,如何自动化的完成分类,是亟待解决的问题,本文探索了从宫颈癌细胞的获得,到细胞特征识别,并分类的全过程,并阐述基本原理。
  1 方法
  深度学习可看作是多层的人工神经网络【4】,通过构建含有多个隐层的神经网络模型,将低层特征通过逐层非线性特征组合变换,形成更加抽象的高层特征表达,以发现数据的分布式特征表示【5】。卷积神经网络作为最常使用的深度学习模型之一,以2D或3D图像直接作为网络的输入,避免了传统机器学习算法中复杂的特征提取过程,相比全连接的神经网络,其局部连接、权值共享和下采样的特性减少了网络参数的数量,降低了计算复杂度,同时对图像的平移、缩放、旋转等变化具有高度不变性。图1显示了深度卷积神经网络的特征学习过程,模型从原始图像仅能学习到一些边缘、纹理、颜色等低层特征,随着层数的加深,模型可以学习到更抽象的包含丰富语义信息的高层特征。
  对比目前常用的深度卷积神经网络模型LeNet【6】、AlexNet【7】、VGG【8】等,选用ILSVRC14竞赛中获得冠军的GoogLeNet【9】作为本文模型的基础架构,该模型共计22层,主要包括输入层、2个普通卷积层、9个Inception层和若干池化层。其中,每个Inception层包含6个卷积层和1个池化层。包括Inception结构在内的所有卷积都使用ReLU函数。模型通过Inception结构,在增加网络宽度的同时,减少了参数的数量,降低了计算复杂度;通过在不同深度处增加两个loss来保证梯度回传的消失。
  2深度卷积神经网络架构
  2.1网络架构设计
  本文采用LeNet的模型,如图1所示。
  第一层,卷积层:这一层的输入就是原始的图像像素,LeNet-5模型接受的输入层大小为32*32*1。第一个卷积层过滤器的尺寸为5*5,深度为6,不使用全0填充,步长为1.因为没有使用全0填充,所以这一层的输出的尺寸为32-5+1=28,深度为6。这一个卷积层总共有5*5*1*6+6=156个参数,其中6个为偏置项参数。
  第二层,池化层:这一层的输入为第一层的输出,是一个28*28*6的节点矩阵。本层采用的过滤器大小为2*2,长和宽的步长均为2,所以本层的输出矩阵大小为14*14*6。
  第三层,卷积层:本层的输入矩阵大小为14*14*6,使用的过滤器大小为5*5,深度为16。本层不适用全0填充,步长为1。本层的输出矩阵大小为10*10*16。按照标准的卷积层,本层应该有5*5*6*16+16=2416个参数。
  第四层,池化层:本层的输入矩阵大小为10*10*16,采用的过滤器大小为2*2,步长为2.本层的输出矩阵大小为5*5*16。
  第五层,全连接层:本层的输入矩阵大小为5*5*16,在LeNet-5模型的论文中将这一层称为卷积层,但是因为过滤器的大小就是5*5,所以和全连接层没有区别。本层的输出节点个数为120,总共有5*5*16*120+120=48120个参数。
  第六层,全连接层:本层的输入节点个数为120个,输出节点个数为84个,总共参数为120*84+84=10164个。
  第七个,全连接层:本层的输入节点个数为84个,输出节点个数为10个,总共参数为84*10+10=850个。
  2.2 Softmax分类器
  Softmax分类器是除了SVM以外,另一种常见的线性分类器,它是Logistic回归推广到多类分类的形式。原始神经网络的输出被用作置信度来生成新的输出,而新的输出满足概率分布的所有要求。这个新的输出可以理解为经过神经网络的推导,一个样例为不同类别的概率分别是多大。
  2.3 数据增强
  Keras图片预处理工具提供了两个很強大的功能:图片增强功能和样本无线生成功能。所有的图片预处理工具都写在一个类ImageDataGenerator中,该类的主要功能的不断生成一个batch的图像数据,支持实时数据增强。数据增强包括均值化、白化样本图片,也包括对图片的旋转、平移、伸缩、翻转等变换。训练时该函数会无限生成数据,直到达到规定的epoch次数为止。
  通过Keras图片增强功能,可以有效提高图片利用率,这在一定程度上提高了深度网络的性能,防止过拟合(同一张图片的不同变换保证了模型在更多情况下对该图片的拟合)。本文将图片旋转30°,水平偏移和竖直偏移的幅度都为0.1,剪切强度为0.2,缩放幅度为0.2,进行水平方向翻转,当进行变换时超出边界的点将根据nearest的方法进行处理。
  3 实验及结果分析
  3.1 数据集
  本文采用的实验数据来自合作医院泉州妇幼保健医院提供的470例宫颈病变图像,其中阳性400例阴性(炎症)70例, 包括CIN1总2162张图片,CIN2总1135张图片,CIN3总878张图片,normal总325张图片,总图片数4500张。   3.2 训练策略
  增强前和增强后的数据集均被随机分成三部分:训练集50%、验证集25%和测试集25%。其中,训练集用于模型训练和参数学习;验证集用于优化模型,在训练过程中对模型进行测试,根据测试结果自动微调参数;测试集用于测试模型的识别和泛化能力。为保证模型对未知数据的泛化能力,数据集之间互不交叉。
  3.3 实验工具
  本文模型在ASUS,Intel i7 CPU,NVIDIA GTX 1081Ti GPU上训练,使用keras框架,数据增强算法由keras的ImageDataGenerator实现。
  3.4 实验结果及分析
  从实验结果图2、图三训练效果看来,准确率在89%左右,效果不错了。
  4 结束语
  本文研究了利用深度学习方法实现宫颈病变图像的分类。采用的深度卷积神经网络模型具有更深、更复杂的结构,而参数更少,准确率更高,避免了人工提取特征的复杂性和局限性。采用的数据增强方法有效避免了深度学习算法在样本量不足时易出现的过拟合问题,实验证明本文方法提高了识别率,具有较好的鲁棒性和泛化性,在一定程度上满足了更高要求的临床需求。
  【参考文献】:
  【1】 潘晨,闫相国,郑崇勋等.利用单类支持向量机分割血细胞图像[J].西安交通大学学报,2005,39(2):150-153.
  【2】 窦智宙,平子良,冯文兵等.多分类支持向量机分割彩色癌细胞图像[J].计算机工程与应用,2009,45(20):236-239.
  【3】 王卫星,苏培垠.基于颜色、梯度矢量流活动轮廓及支持向量机实现白细胞的提取和分类[J].光学精密工程,2012,20(12):2781-2790.
  【4】 Shen D,Wu G,Suk H I.Deep learning in medical image analysis[J].Annual Review of Biomedical Engi- neering,2017,19(1).
  【5】 Bengio Y,Delalleau O.On the expressive power of deep architectures[C]//International Conference on Algorithmic Learning Theory.Berlin Heidelberg:Springer,2011:18-36.
  【6】 LeCun Y,Bottou L,Bengio Y,et al.Gradient-based learn-ing applied to document recognition[J].Proceedings of the IEEE,1998,86(11):2278-2324.
  【7】 Krizhevsky A,Sutskever I,Hinton G E.Imagenet classi-fication with deep convolutional neural networks[C]// Advances in Neural Information Processing Systems,2012:1097-1105.
  【8】 Simonyan K,Zisserman A.Very deep convolutional net-works for large- scale image recognition[J].arXiv preprint arXiv:1409.1556,2014.
  【9】 Szegedy C,Liu W,Jia Y,et al.Going deeper with con-volutions[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,2015:1-9.
  作者简介:宋丹(1994—),女,汉族,山西大同市人,硕士研究生,单位:华侨大学工学院计算机专业,研究方向:深度学习。
  張育钊(1963—),男,汉族,福建泉州市人,副教授,单位:华侨大学工学院,研究方向:电子信息、通信、自动控制、计算机采集控制。
其他文献
【摘要】:新媒体发展以来对于电影宣传营销可以说是带来了革命性的变化,国内也如雨后春笋般涌现了很多的电影宣传的app或是电影网站,而在这其中我们不得不忽视的就是对于相较之下的弱势群体低成本电影而言,或许新媒体是能够帮助他们突出重围的最后一根稻草。  【关键词】: 新媒体 低成本 传播  新媒体发展对整体电影行业带来重大影响  新媒体的概念定义  清华大学新闻与传播学院熊澄宇教授如此定义新媒体:“在计
期刊
【摘要】:全球化进程的加快使得文化多样性的问题日益显现在大众的视野之下,跨文化交际在各国的政治、经济、文化等交流之中扮演着越来越重要的角色。中日两国自古以来交往密切,如今更是在各个领域都不可或缺的重要伙伴。翻译作为跨文化交际中的重要一环,可以解决跨文化交际中语言障碍的问题,翻译是促进中日两国跨文化交际,实促进中日两国文明、友好、和谐发展的重要途径。当今中日两国之间的跨文化交际者大部分都是译者,因此
期刊
【摘要】:随着经济全球化的推进、多媒体信息技术的传播,媒介对于现今社会的利用度也越来越高。因生活水平的提高,交流信息方式需求等的多元化,其编辑出版能力教育在我国未来发展规划的地位也越来越重要。因此在媒介融合不断发展的现在,对编辑出版人才的培养也日渐更为重视。对于编辑出版专业人才的培养,不是一蹴而就的,需要进行一些专门的培训学习,所以本文将就现阶段媒介融合趋势与编辑出版教育发展状况、我国编辑出版专业
期刊
【摘要】:父母养育方式与儿童心理健康之间存在密切关系,父母亲教育方式不当会十分不利于孩子的心理健康,良好的教育方式对孩子的心理健康至关重要。鉴于此,本文分析了父母教养方式与孩子心理健康的关系之间的关系,在此基础上通过现象看本质,提出了相应的对策建议,希望父母要准确的把握孩子心理情绪,给孩子及时的鼓励和疏导,要言传身教,为孩子树立正面形象,促进他们的心理健康发展。  【关键词】:教养方式 青少年 心
期刊
【摘要】:“易班”平台是为高校学生群体提供教育教学、生活服务、文化娱乐的互动性线上社区,是高校学生学习、生活重要的工具。目前,在互联网时代,易班平台面临着前所未有的机遇与挑战。陕西省作为西部地区的高校院校聚集大省,易班平台在陕西省的大范围推广具有极大的现实意义与现实价值。本文依据陕西省内一省属本科高校和一高职院校的抽样分析数据,对易班平台在高校网络思政教育中出现的问题进行剖析,并提出了相应的对策意
期刊
【摘要】:现阶段,我国的烟草生产效率已经有了很大的提升,在效率提升过程中,对烟草加工工艺提出了较高的要求,因此,在我们烟草种植的实践过程中,为了能够确保烟草的整体质量,因此要注重烟草的加工工艺,提升相应的工艺质量,这就要求能够合理的运用相关方法,有效的提升其工艺质量管理水平。本文将探索如何能够提升烟草加工工艺质量的管理措施进行研究,以期望能够更好的促进烟草加工的工艺质量。  【关键词】:烟草加工
期刊
【摘要】:随着社会的发展和科技的进步,时代对党的要求也不断变化,促使党不断改革创新,完善自我,以此促进时代进步和发展。新时代、新矛盾、新历史方位,无一不在昭示党处于发展变革的新局势中,因此提高和加强党性修养刻不容缓。基于此,本文将简单分析并提出几点提高党性修养的对策,以期促进党执政能力的提升。  【关键词】:党性修养 提升 思考及对策  党性是政党的基本属性,也是区别于其他政党的关键因素。在新时代
期刊
【摘要】:英国人福霞站在文化的角度看中国的美食,以非虚构写作的形式创作出美食书籍《鱼翅与花椒》。在她的笔下,鱼翅由古至今的演变史反映东方神话的兴衰,花椒则凭借其奇特的口感成为中国文化的象征。福霞初入中国的时间、地点对其进行中西文化关照也有深远意义:成都独特的文化个性给她提供了了解中国底层生存文化的途径;九十年代特殊的时代环境则给予她思考传统文化“变”与“不变”问题的空间。就这样,一个外国人在中国烹
期刊
一、“加百利”轮案概述  阿昌格罗斯投资公司所属希腊籍“加百利(Archangelos Gabriel)”油轮于2011年8月12日在我国琼州海峡中水道附近搁浅,该轮当时船上船员26人并载有卡宾达原油54580吨,可能发生事故,严重威胁人命、财产和海洋环境安全。南海救助局接受投资公司委托对该轮进行救助。最终该轮成功脱险。之后双方就救助费的给付产生纠纷,南海救助局于2012年8月30日向广州海事法院
期刊
【摘要】:移动互联网技术的不断发展,也催生了短视频APP行业的火热,短视频逐渐受到人们的青睐。各家短视频APP在吸引流量的同时也存在诸多问题,我们应当采取哪些措施来规范短视频行业的发展,如何依托移动互联网背景下短视频APP的发展坚定文化自信。  【关键词】:文化自信 短视频APP 问题 措施  一、当前坚定文化自信的背景条件  (一)何谓文化自信  习近平总书记曾指出:"我们要坚持道路自信、理论自
期刊