基于自编码网络的乳腺病变检测系统

来源 :科学导报·学术 | 被引量 : 0次 | 上传用户:xiaobaitu11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:乳腺癌是导致女性癌症死亡的首要原因,严重危害广大女性的身体健康,早期的诊断和治疗是防治的关键。针对当前乳腺X线图像人工标注工作量大、数据不易获取、图像特征提取耗时且难度大等问题,现以稀疏自编码网络为基础,训练具有两个隐含层的神经网络以对图像进行有无病变分类。首先,使用自编码器以无监督方式单独训练各隐含层。然后训练最终Softmax层,并将这些层连接在一起形成堆叠网络,该网络最后以有监督方式进行训练。医生可通过系统得出的结果对患者是否患有乳腺病变进行诊断。
  关键词:乳腺X线图像;稀疏自编码器;深度学习;病变检测;MATLAB
  1. 前言
  目前国内外学者先后提出了多种乳腺病变检测系统。Christoyiarni等人提出在肿块疑似区域上利用独立元分析方法提取特征辨别肿块与正常组织,再利用神经网络方法分类训练肿块,能达到较高检测率同时能区分肿块的良恶性[1]。尽管特征提取确实得到很大提升,但是CAD系统中的分类器在分类病变图像的准确度上仍然存在很大缺陷。近年来,深度学习在诸多领域能够同时进行特征学习和分类,深度学习技术中的无监督特征学习技术已经成功地被应用于计算机视觉领域。因其不需要依赖于先验知识,可以自适应地构建有效的特征描述,所以灵活性和普遍性较传统特征提取方法更具有优越性[2]。自编码器(Auto-encoder,AE)就是深度学习中最流行的代表性学习方法中的一种,该学习方法能实现良好的性能,并具有较少的调节参数和低的迭代次数等优点,在图像特征表达中得到广泛的运用[3]。由此设计一个基于自编码网络的乳腺病变检测系统,采用无监督自编码网络训练及有监督的微调,训练建立能够区分乳腺X线图像是否发生病变的神经网络模型,检测结果对乳腺癌诊断有很好的参考价值,对促进医学影像诊断的智能化发展具有重要的意义。
  2. 基于自编码网络的乳腺病变检测系统
  2.1 数据集加载
  本文使用乳腺X线图像数据进行训练和测试。每个数据图像为256×256像素,共有1200张训练样本,其中包括1000张正常的乳腺X线图像和200张已发生病变的乳腺X线图像。通过for循环依次将1200张训练数据加载到MATLAB中,然后使用imresize函数把每个数据图像压缩为28×28像素,利用rgb2gray函数将真彩色图像转换成灰度图像。
  训练图像的标签存储在一个2×1200的矩阵中,其中每列都有一个元素为1,指示该图像所属的类,该列中的所有其他元素为0。数据加载完成后利用for循环查看其中一些图像,查看效果。
  2.2 训练自编码网络
  2.2.1 训练第一个自编码器
  首先在不使用标签的情况下基于训练数据训练稀疏自编码器。自编码器是一种神经网络,该网络会尝试在其输出端复制其输入。因此,其输入的大小将与其输出的大小相同。当隐含层中的神经元数量小于输入的大小时,自编码器将学习输入的压缩表示。
  第一步:顯示设置随机数生成器种子。
  第二步:设置自编码器的隐含层的大小。
  第三步:训练自编码器。
  第四步:可以使用view函数查看自编码器的图。自编码器由一个编码器和一个解码器组成。编码器将输入映射为隐含表示,解码器则尝试进行逆映射以重新构造原始输入。
  2.2.2 可视化第一个自编码器的权重
  自编码器的编码器部分所学习的映射可用于从数据中提取特征。编码器中的每个神经元都具有一个与之相关联的权重向量,该向量将进行相应调整以响应特定可视化特征。
  自编码器的隐含层的100维输出是输入的压缩版本,它汇总了对上面可视化的特征的响应。基于从训练数据中提取的一组向量训练下一个自编码器。首先,必须使用经过训练的自编码器中的编码器生成特征。
  2.2.3 训练第二个自编码器
  第二个自编码器的训练与第一个类似,主要区别在于将使用从第一个自编码器生成的特征作为第二个自编码器中的训练数据并且将隐含表示的大小减小到50,以便第二个自编码器中的编码器学习输入数据的更小表示。将前一组特征传递给第二个自编码器中的编码器,以此提取第二组特征。
  2.2.4 训练最终Softmax层
  训练Softmax层以对50维特征向量进行分类。与自编码器不同,将使用训练数据的标签以有监督方式训练Softmax层。
  2.2.5 形成堆叠神经网络
  已单独训练了组成堆叠神经网络的三个网络:autoenc1、autoenc2和Softmax。
  将自编码器中的编码器与Softmax层堆叠在一起形成用于分类的堆叠网络。
  2.2.6 微调堆叠神经网络
  为了更好地进行分类,通过以有监督方式基于训练数据重新训练网络来对整个多层网络执行反向传播,改进堆叠神经网络的结果。
  2.3 基于自编码网络的乳腺病变检测
  本文使用乳腺X线图像数据进行测试。每个数据图像为256×256像素,共有1375张测试样本,其中包括1000张正常的乳腺X线图像和375张已发生病变的乳腺X线图像。通过for循环依次将1375张测试数据加载到MATLAB中,然后使用imsize函数把每个数据图像压缩为28×28像素,利用rgb2gray函数将真彩色图像转换成灰度图像。数据集加载方式与训练数据集加载方式类似,可参考前文。
  测试图像的标签存储在一个2×1375的矩阵中,其中每列都有一个元素为1,指示该图像所属的类,该列中的所有其他元素为0。
  2.4 实验结果分析
  在MATLAB command window窗口输入guide命令查看图形用户界面GUI,包括一个可编辑文本;四个按钮,功能分别是导入训练数据、训练网络、导入测试数据、测试;两个坐标轴,用于展示训练集和测试集中的部分乳腺X线图像。
  可以看出目标类加载的1000个正常的测试数据中有988个被正确检测出,12个被检测错误,第一类数据检测的准确率为98.8%;加载的1000个正常的测试数据中有988个被正确检测出,12个被检测错误,第一类数据检测的准确率为98.8%;目标类加载的375个有病变的测试数据中有350个被正确检测出,25个被检测错误,第二类数据检测的准确率为93.3%;输出类中第一类数据被正确检测的有988张,错误检测的有25张,检测的准确率为97.5%;输出类中第二类数据被正确检测的有350张,错误检测的有12张,检测的准确率为96.7%;经过多次测试,整个系统分类的准确率最高达到了97.3%。
  3. 结论
  在本文完成过程中,做了大量的实验工作,实现了基于自编码网络的方法对乳腺X线图像中的病变进行检测。本文将自编码网络模型应用在乳腺病变的检测任务中,提高了计算机辅助诊断系统的精度,测试阶段,单幅图像平均处理时间为0.00236秒。经过多次测试,整个系统分类的准确率最高达到了97.3%。为医生诊断患者是否患有乳腺癌病变提供了有力的帮助。
  参考文献
  [1]  王金平. 基于深度卷积稀疏自编码分层网络的人脸识别技术. 太原理工大学学报,2018,49(05):765~770
  [2]  朱恩泽. 基于深度学习的医学图像分割方法. 徐州医科大学学报,2019,39(2):143~147
  [3]  余立付. 基于深度自编码网络的高光谱图像空谱联合分类:[硕士学位论文]. 西安:西安电子科技大学,2017
其他文献
摘 要:大学英语教学改革的重点在于如何改变传统教学模式,如何使学生成为学习的主体,形成自主学习英语和综合运用语言的能力。  关键词:多媒体;交互式教学;语言输入;语言输出  教育部关于《大学英语课程教学要求》提倡各高校根据自身条件设计适合本校的基于互联网和校园网的多媒体教学,进行大学英语教学改革,从根本上改变传统的教学模式,提高办学效果。大学英语教学的目的是培养学生自主学习能力和综合运用语言的能力
期刊
摘 要:提出禅心思维作为教学法学术研究的指针,深入课程本质及原理方法内核谈教学,阐述了工程图学基于工程实物的设计表达需要而教学,然后围绕工程行业国家标准强制规范而准备的基本属性。既然画法几何学及其正投影理论确立了用离散的三视图有机对应准确表达空间实物形状的核心知识架构,那么,立于此坚实架构之上,围绕工程制图课程的教学内容和方法,针对教育部工程图学教学指导委员会提出的“新要求”,提出课堂教学环节可实
期刊
摘 要:当前的职业教育越来越注重对学生的实践能力和个人素质培养,在此背景下,各地都在组织各种形式的职业技能大赛,作为激发学生创造能力和提升学生实践能力的重要途径。文章结合江西生物科技职业学院经济贸易系参加互联网+大赛等竞赛的经验、体会,从教学改革、校企合作、师资队伍建设等3个方面探讨了职业技能大赛对高职经贸类人培养的影响。  关键词:职业技能竞赛;人才培养;职业教育  职业技能大赛是当前学生综合素
期刊
摘 要:随着电信行业竞争的日益激烈,电信竞争的核心正在由以业务为中心向以客户为中心转变,客户服务必将成为电信企业的下一个竞争焦点。本文从市场、价格等为切入口深度探讨了运营商有关价格竞争利弊,并以此探索客户服务提升和服务价值体现,以供参考和交流学习。  关键词:通信行业;价格竞争;服务提升  一、引言  电信行业要走出价格战的阴影,需要全面提升客户服务水平,实现可持续发展战略,使整个产业摆脱低迷状态
期刊
摘 要:随着信息技术的不断发展,高校思政教育需要意识到文化直接影响青少年成长的长期性和多维性。必须要加强校园文化建设,从文化的角度来分析,在思政教育中将文化的优势全面发挥出来。  关键词:高校;校园文化活动;德育功能  校园文化与德育工作有着不可分割的联系,其从多个角度、多个方面都直接影响学生的发展,对培养学生正确的“三观”是非常有利的。因此,当前我国有关人员需要着重探究的问题是如何加强校园文化德
期刊
摘 要:作为高校音乐教学重要课程之一的钢琴课,注重理论与实践的紧密结合,并且以实践教学为主体。集体课教学模式,目前已广泛应用于音乐院校钢琴教学实践以及相关的课程领域中,学生通过钢琴集体课的学习,一方面能够互相促进,提高学生的演奏表达能力,另一方面也能开阔自身的艺术视野,提高音乐素养。本文分析我国当前高校钢琴集体课教学中存在的问题,尝试对有效的高校钢琴集体课教学模式进行探索。  关键词:高校钢琴课;
期刊
摘 要:实践类的线上课程对互动要求更高,如何增强在线课程多维深度互动近年来都是学界和业界关注的重点。本研究基于深度访谈和问卷调查的研究方法,发现了影响多维深度互动效果的“首位效应”,即第一位带头发言同学的互动内容对后续其他同学互动内容和形式有着显著的影响。此外,本研究还从师生互动方面,发现了互动氛围、网络技术流畅性、教学设计和教学内容、学生互动能力和学生个性的影响因素;在生生互动方面,发现了互动氛
期刊
摘 要:数学课程标准明确提出,数学教学需要推动学生数学思维发展。核心问题作为引导学生数学思维发展的载体之一,其无疑就成为发散学生思维、提高学生数学能力的重要途径。对小学数学教学来说,因为小学生本身的抽象思维能力相对较差,要想充分发挥核心问题的作用,如何设计数学核心问题就成为关键所在。鉴于此,本研究主要基于小学生思维特征提出几点基于学生数学思维发展的核心问题设计的措施,旨在希望通过本研究为小学数学教
期刊
摘 要:网络平台在大学英语教学中的普遍应用给教学带来了新契机,也给教师提出了新问题。本文中,笔者基于自己的网络平台在大学英语中的实践教学经验,浅析了网络平台在语言教学中的优势,并对如何有效在其帮助下提高教学质量提出几点建议。  关键词:英语教学;网络平台;教学质量;  随着大学英语教材的不断改版及其配套网络平台的开发,网络平台在高校大学英语教学中已经得到了比较广泛的应用。那么在实践教学中,网络平台
期刊
摘 要:物理是一门以实验为基础的学科,在新课程改革的背景下,以传授知识为主的传统课堂教学已经不适应时代的发展了,教师必须通过求真、求异、求变和求活四个方面来进行创新实验教学,培养学生的核心素养,即培养学生的物理观念、科学思维、科学探究和科学态度与责任,从而促进学生的全面发展。  关键词:物理;创新实验;教学;核心素养  物理实验教学主要有演示实验和学生实验,物理实验与社会生活紧密联系,具有科学性、
期刊