【摘 要】
:
近年来,许多基于手工设计卷积神经网络(CNN)的方法在自动视网膜血管分割中取得了良好的效果。然而,这些CNN在复杂眼底图像中捕捉视网膜血管方面仍受到限制。为了提高其分割性能,这些CNN趋向于具有较多的模型参数,这可能会导致模型过拟合和计算复杂度较高。此外,手工设计有竞争力的CNN模型非常耗时,且要求设计人员具备大量的领域经验知识。为了解决上述问题,本文提出了一种新颖的神经架构搜索方法或者自动化设计
论文部分内容阅读
近年来,许多基于手工设计卷积神经网络(CNN)的方法在自动视网膜血管分割中取得了良好的效果。然而,这些CNN在复杂眼底图像中捕捉视网膜血管方面仍受到限制。为了提高其分割性能,这些CNN趋向于具有较多的模型参数,这可能会导致模型过拟合和计算复杂度较高。此外,手工设计有竞争力的CNN模型非常耗时,且要求设计人员具备大量的领域经验知识。为了解决上述问题,本文提出了一种新颖的神经架构搜索方法或者自动化设计方法用于生成U型CNN,称为Genetic U-Net。该方法得到的CNN可以实现更好的视网膜血管分割效果,并且具有很少的模型参数。首先,我们设计了一个基于U型编码器-解码器的紧凑但灵活的搜索空间。然后,我们使用改进的遗传算法在搜索空间中识别出性能更好的网络架构,并研究了在极少模型参数的约束下找到性能更优网络架构的可能性。实验结果表明,所提出方法得到的网络架构获得了优异的性能,并且模型参数明显少于其他的网络架构,特别地,所获得网络架构的模型参数量要少于原始U-Net的1%。此外,通过对实验结果的深入研究,确定了几种有效的操作和网络模式可以明显改进网络架构的视网膜血管分割性能。
其他文献
智慧教育需要在非接触条件下感知精神压力过大的学生,过大的精神压力对人体危害极大,需要及时干预。非接触式光电容积脉搏波描记法(Remote Photo-plethysmography,rPPG)是通过摄像机来获取心动周期造成的肉眼看不见的周期性细微皮肤颜色变化从而提取脉搏波的技术,具有无感、快速和成本低等优点,本文的研究目的是基于rPPG技术使用面部视频进行精神压力识别。首先,建立了rPPG样本集。
无人机具有拍摄范围广、灵活性强以及成本低等优点,在运动物体的检测与跟踪、特殊环境下的搜索和救援以及智能交通系统的构建等方面具有重要的意义。由于无人机拍摄视角和高度,以及目标存在尺寸较小、尺度多变等问题,导致通用场景下的检测算法效果差。因此,研究快速、准确的无人机图像目标检测方法是无人机视觉领域的重要课题。本文的具体研究内容如下:首先,综述目标检测的发展历程,包括以手工设计特征为代表的传统目标检测方
可视对讲系统的设计,作为通信领域的重点研究方向,在智能家居、实体防护、出入控制等领域得到广泛应用。本文结合实际技术发展新趋势,应用SIP协议和多媒体H.264协议设计实现一种新型可视化对讲系统,具体主要研究工作如下:本文首先深入分析了SIP实时传输协议、媒体流结构、H.264编解码标准,在此基础上讲述了系统的构建与实现。对开源协议栈Re SIProcate的实现机制进行剖析和Media Strea
近年来,基于单模聚合物光纤(polymer optical fiber,POF)的传感器制作与应用已成为学术界的研究热点。与传统的石英光纤(silica optical fiber,SOF)相比,POF具有很多优势,如硬度较小、柔韧性更好、热光系数更大、杨氏模量更小、具有固有的生物相容性等。由于单模POF与单模石英光纤之间没有商用连接器,我们引入了一种投影成像方法,将单模POF与单模SOF对准,然
近年来,以机器学习,深度学习等为代表的人工智能技术突飞猛进,这些技术在改变我们生活的同时也使得各种信息爆炸式的增长.如何才能够快速而准确的从大量信息中找到所需要的答案成为相关研究者广泛关注的问题,而开放域问答系统则在这样的背景下应运而生.现阶段的开放域问答技术基本都采用检索-阅读理解交互式框架,但基于这个架构的开放域问答系统仍然存在很多缺陷.例如对阅读理解模型而言,通常是通过预测文章中答案的起始与
青藏高原是世界上海拔最高、面积最大、地质年代最年轻、自然环境最独特的高原,是南极和北极之外的最大淡水储备库,其上星罗密布的湖泊,造就了中国最大、最密集的大型湖泊群和湖泊带。特殊的地理位置使其成为全球气候变化与区域性响应的重要研究对象。本文以青藏高原上149个典型湖泊为研究对象,利用Google Earth Engine平台提取了JRC、ERA5再分析影像资料中1985-2020年的湖泊面积以及气候
在生物医学统计中,对存在删失的超高维数据的研究一直存在困难.基于稀疏性假定,对超高维数据进行特征筛选是至关重要的.本文采用了多种特征筛选的方法,对生存时间的预测从简单线性加速失效模型扩展到可加模型,提高了预测的准确性和可解释性.本文所用数据来自GEO数据库中的弥漫大B细胞淋巴瘤(DLBCL)有关研究,该数据共包含414位患者样本.研究对414位患者分别进行了基因表达谱分析,得到基因特征54675个
随着科学技术的飞速发展,雷达设备、通信设备、强力电磁干扰设备等的广泛使用,种类繁多、数量庞大、功能复杂的电磁信号充斥于战场空间中,战场电磁辐射能量由弱变强,频谱由窄变宽,电磁环境趋于复杂,这对处于电磁环境中的电磁设备和人员安全造成很大的影响,因此需要对其复杂度进行评估研究从而采取对应措施来保障设备完好和人员安全。复杂电磁环境信号具有显著的非线性性质,传统的线性信号处理技术对其的应用效果不佳,而数学
空气质量指数是定量描述空气质量状况的重要指标,建立一个空气质量指数区间预测模型能够支持相关部门发布空气污染的防治措施,做好公共卫生防护工作,也因此有助于避免空气污染物浓度超标所带来的健康威胁。本文提出了一种基于变分模态分解(VMD)及和声搜索算法(HS)的支持向量回归(SVR)比例系数法区间预测模型。构造该模型的主要过程为:(1)引入VMD分解技术,通过选定不同的分量个数K值对空气质量指数序列数据
疟疾是雌性按蚊叮咬传播疟原虫而引起的蚊媒血液病,广泛分布于热带、亚热带和温带的90多个国家和地区,是严重危害人类健康的寄生虫病之一。对疟疾感染细胞的精确检测是后续治疗的前提。镜检是疟疾检测的“金标准”,检测结果准确但是耗时较长而且检测结果的可靠性取决于检测人员的专业水平。引入深度学习辅助甚至代替人工镜检不仅可以在快速诊断的同时保证准确性,而且还可以节省大量诊断所用的资金用以疟疾的防控。YOLO V