基于深度学习的鸟类细粒度识别的研究与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:newhing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习的发展和计算机硬件资源的提升,计算机视觉领域中的通用图像识别任务已经取得了出色的成果,而对于需要识别某一类别下具体子类的细粒度图像识别任务,由于其存在子类类内差异大、类间差异小的特点,即便使用最先进的卷积神经网络也很难取得准确的分类结果,因而成为目前的热门研究方向。鸟类与自然生态和人类生产生活都有着密不可分的关系,准确识别鸟类对相关从业者和鸟类爱好者都具有重要意义,因此从计算机视觉角度上对鸟类进行有效地识别分类,是一项具备较高研究价值和广阔应用前景的有挑战性任务。本课题选择手动构造的鸟类图像数据集和加州理工学院发布的公开数据集作为研究对象,在分析并使用一些常见数据增强方法用于扩充训练数据后,再对训练数据进行必要的预处理。随后使用三种图像识别算法在数据集上进行实验,首先选择采用基于迁移学习的方法,对预训练的模型进行微调,将结果作为本文任务的baseline;其次提出一种基于显著性图的识别方法,将关键部位区域的裁剪图像与原始图像输入两个卷积模型,对最终结果进行共同决策;最后提出一种基于类激活映射图的数据增强方法,生成更特殊的图像用于训练,具体包括对注意力区域的裁剪、遮挡和形变采样,从而有效增强模型的特征提取能力。在训练出具有较高准确率的识别模型后,经过需求分析与总体设计,开发实现了一个基于浏览器端的鸟类细粒度图像识别系统,具有上传并识别分析、数据存储、日志收集等功能,并且能够提供良好的用户交互。本文探索在只有图像级标签的情况下实现一个基于深度学习且具有较高分类准确率的鸟类细粒度图像识别算法,经过反复实验和对比,由类激活映射指导的数据增强方法,在公开数据集上的分类准确率为88.2%,不弱于现有的先进算法,且其识别效率较高并具有良好的可解释性,这种更具针对性的数据增强方法也为今后鸟类细粒度分类任务开拓了新的研究方向。
其他文献
随着科技的进步及人们对生活、办公环境追求的不断提高,智能建筑技术在现代建筑工程中得到了广泛的应用。智能化建筑解决方案带给我们智能化、精致化和人性化的生活及办公体验,智能化建筑有能耗低、效率高、绿色环保、健康舒适、可扩展性强等明显特点。2012年,我国智能化市场总值4537.51亿元,至2019年,短短7年时间增至9215.98亿元,预计未来几年还会以每年3%的速度递增,市场空间巨大。相比西方一些发
目的 了解2019年秦皇岛市城区中小学生超重肥胖的流行特征及影响因素,为中小学生生长发育及营养水平评价提供参考依据.方法 于2019年4-5月采用整群随机抽样方法随机抽取秦皇岛市海港区3所中学、4所小学的全部中小学生3489人为研究对象,进行问卷调查,问卷内容包括基本情况、每天是否按时吃三餐、是否喜欢吃蔬菜水果、吃夜宵频次、吃膨化食品频次、吃甜点频次、喝甜饮料频次、户外活动时间、每天看电视或玩手机时间等.测定中小学生和父母的身高体重.采用SPSS 17.0统计软件进行x2检验和多因素非条件logistic
目的 了解深圳市社区居民的甲状腺结节患病情况及其影响因素,为制定甲状腺结节的防控策略提供科学依据.方法 于2018年10月,随机抽取深圳市4个行政区中8个社区的常住居民作为研究对象,最终共797名调查对象纳入研究,对其进行问卷调查、体格测量、甲状腺彩超检查和实验室检测等.采用SPSS 23.0软件进行t检验、x2检验和多因素logistic回归分析.结果 在797名研究对象中,共检出281例甲状腺结节患者,检出率为35.26%.其中,单发性结节164例(58.36%),多发性结节117例(41.64%).
随着我国社会经济的发展和居民生活水平的不断提高,居民的生活方式也发生了巨大的变化,引起心血管疾病的危险因素暴露逐渐增加.监测数据显示,我国心血管疾病的发病人数持续增加,2018年中国心血管病报告数据显示,今后10年心血管患病人数将快速增长[1].与此同时,我国居民心血管病危险因素流行水平较为严峻,并且心血管疾病的疾病负担也逐渐增加[2-3].
目的 了解北京市慢性病高风险人群高风险特征流行现况及其影响因素,为开展有针对性的健康教育和生活方式干预提供依据.方法 数据来源于2017年北京市成人慢性病及其危险因素监测.该监测采用多阶段分层随机抽样方法选取13240名18~79岁北京市常住居民进行现场调查,其中未患高血压、糖尿病和血脂异常者6279人纳入本研究.调查内容包括问卷调查、体格测量和实验室检测3个部分.采用SPSS 20.0统计软件进行x2检验、秩和检验和有序logistic回归分析.结果 共调查慢性病高风险人群3522名,无高风险特征者27
目的 探讨氨磺必利和利培酮治疗急性期精神分裂症的效果及对血清非酶抗氧化物的影响,为急性期精神分裂症的治疗提供依据.方法 于2018年3月至2020年2月,选取苏州市广济医院住院治疗的114例急性期精神分裂症患者为研究对象,随机分为氨磺必利组(51例)及利培酮组(63例),分别给予氨磺必利及利培酮治疗6周.采用阳性和阴性症状量表(PANSS)评估两组患者的疗效,采用副反应量表(TESS)评价两组患者的不良反应发生情况.比较两组患者治疗前后血清非酶抗氧化物[白蛋白(ALB)、总胆红素(TBIL)和尿酸(UA)
随着大数据时代的到来,人们的隐私信息泄露愈发严重,电信诈骗也因此愈演愈烈。人们的每次通话都会产生用于记录原始通信信息的通信话单,传统的机器学习方法主要通过挖掘通信话单的统计信息,从而识别诈骗用户。但这种方法仅能孤立地利用用户的通信行为,不能充分挖掘通信话单中用户之间的关联信息。为了充分利用通信话单中含有的关联信息以识别诈骗用户,论文从用户通信话单中提取个人特征向量及用户之间的亲密度,构建通信图描述
目的 分析2007-2017年天津市滨海新区宫颈癌发病率、死亡率及其变化趋势,为制定相关防治策略提供理论依据.方法 数据来源于2007-2017年天津市滨海新区恶性肿瘤发病和死亡登记数据库资料,采用SPSS19.0及Excel 2007进行统计分析,计算宫颈癌的发病率、死亡率、标化率,使用Joinpoint软件计算年度变化百分比(APC)及95%CI,分析宫颈癌的时间变化趋势.结果 2007-2017年天津市滨海新区宫颈癌的发病率为20.59/10万,APC为1.55%,变化趋势无统计学意义(P>0.05
目的 了解重庆市渝中区脑卒中死亡率趋势变化,为开展脑卒中防治提供科学建议.方法 2010-2019年重庆市渝中区脑卒中死亡个案资料来源于中国疾病预防控制中心人口死亡信息登记管理系统.根据国际疾病分类编码(ICD-10)进行疾病分类.计算死亡率、标化死亡率、年龄别死亡率和构成比.采用SPSS 19.0软件进行x2检验.率的趋势变化采用年度变化百分比(APC)分析.结果 2010年与2019年脑卒中死亡率分别为58.49/10万与55.30/10万,变化趋势无统计学意义(t=-0.99,P>0.05).脑卒中
目的 研究槐耳颗粒联合盐酸吡柔比星(THP)对荷MDA-MB-231和MCF-7乳腺癌干细胞瘤裸鼠的治疗效果,为临床治疗提供科学的依据.方法 将64只SPF级雌性Balb/c裸鼠随机分为2组,每组32只,分别建立荷MDA-MB-231和MCF-7细胞肿瘤干细胞裸鼠模型.每组再随机分为4组,各组均为8只.其中,对照组尾静脉注射生理盐水,0.2 ml肷,每周2次,共3周;THP组尾静脉注射剂量为5 mg/kg的化疗药物THP,0.2 ml/次,每周1次,共3周;槐耳颗粒组,用600 ml纯净水将20 g槐耳颗