图片自动清洗标注平台的设计与实现

来源 :北京交通大学 | 被引量 : 1次 | 上传用户:asdfghjkg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着科学技术的不断发展,人们已经进入了大数据、人工智能时代。计算机视觉作为人工智能的重要领域之一,更是对人们的生活产生了重大影响。计算机视觉发展的三要素是数据、算法、算力,数据在其中起到至关重要的作用。由于日常生活中产生的原始数据杂乱无章且无标签,原始数据集需要清洗标注后才可用于算法模型训练。目前公司内部图片数据集清洗标注主要采取人工的方式,该方式不仅效率低,且成本高。本文研发的图片自动清洗标注平台是通过利用机器学习算法模型,以更加高效、智能、低成本的方式实现图片自动清洗标注,帮助公司降低数据集清洗标注成本,提升数据集清洗标注效率。作者在项目研发过程中首先参与了项目的可行性分析和需求分析,确立了项目的总体目标。通过分析平台需求,将平台划分为用户交互子系统和数据集处理子系统,其中用户交互子系统包括用户管理模块、数据集管理模块、运营管理模块,数据集处理子系统包括图片清洗标注模块。在概要设计阶段,作者设计了系统架构、系统核心流程、数据库表结构、图片清洗标注流程。在详细设计阶段,作者采用Spring Boot框架、Kafka消息队列、Open CV库、Mysql数据库、OSS对象存储服务等技术设计并开发了该平台。该项目在数据集处理方面,为实现高效、智能的图片清洗,使用Laplacian算法进行模糊图片自动清洗,使用差异值哈希算法进相似图片自动清洗,使用Haar分类器进行无人脸图片自动清洗,并通过远程调用百度AI开放平台人脸识别服务进行图片自动标注。在数据存储方面,平台将异构数据分类存储,使用Mysql数据库存储平台基础业务数据,使用OSS对象存储服务存储数据集文件。在系统部署方面,为实现服务高可用,使用Tomcat+Nginx+Keepalived部署用户交互子系统,使用Docker集群部署数据集处理子系统。最后作者对平台进行了全面测试并部署上线。该平台提供的图片自动清洗标注服务,使得公司内部的图片清洗标注效率大大提高,并且极大地节约了时间成本和人力成本。
其他文献
随着工业化和现代化脚步不断地前行,智能电网已成为人们生活中必不可少的基础设施。而无线通信凭借其部署便捷、覆盖范围广等优势正逐步应用于智能电网,其中大规模多输入多输出(Multi-Input Multi-Output,MIMO)技术可以大幅度提升其通信系统的数据传输速率、频谱效率,但同时带来了巨大的硬件成本开销和能耗等问题。研究表明,通过配置低精度的模数转换器(Analog-to-Digital C
目的:研究谷胱甘肽过氧化物酶3基因及蛋白在腮腺多形性腺瘤中的表达及其与多形性腺瘤恶变的关系,以明确谷胱甘肽过氧化物酶3与腮腺多形性腺瘤发生、发展的相关性,为临床上预测腮腺多形性腺瘤的发生及恶变提供参考。方法:收集符合纳入标准的手术样本,将所选样本分为三组:腮腺多形性腺瘤组织30例(良性组),多形性腺瘤恶变组织10例(恶性组),腮腺多形性腺瘤瘤旁2cm腺体组织30例(对照组),并根据TNM分期及恶性
高校章程作为高校内部的“宪法”和高校教师权利保障的规范性文件,教师学术权利需要在高校章程中得以保护。本论文试图对高校章程中教师学术权利组织保障方面的相关规定进行文本研究,以探析这些相关规定是否可以使高校教师学术权利得到保障?其目的是为了进一步完善我国高校章程文本中教师学术权利的组织保障方面的相关规定。本文主要采用文本分析法,从组织的内涵来建构整体分析框架体系,从静态、动态两个维度对9所高校章程文本
近年来,自由基参与的远端官能团迁移策略获得了越来越多的关注,大量有关自由基参与的远端1,n-官能团迁移(n=4,5,6)的例子如雨后春笋般涌现。远端官能团迁移策略为实现非活化
能源是人类社会发展的重要的物质基础,能源的开发和利用极大的推动了经济和科学技术的发展。当前,传统化石能源仍占据着能源消费的大部分,然而传统能源储量有限、污染严重。
DNA和蛋白质是重要的生物分子。常规化学分析手段仅能从宏观状态了解物质属性。近些年发展起来的单分子检测手段(SMD),不仅能够对单个分子进行观测和鉴定,而且能够获得单个生
淇河鲫(Qihe crucian carp,Carassius auratus)是分布于河南豫北地区具有较高经济价值的天然三倍体鱼类。近年来,随着养殖密度增加,鱼类免疫力下降,常受到一些病原的入侵而爆
具有光管理功能的高雾度高透光率材料一直是许多光电子器件的重要组成部分。目前常见的高雾度材料仍然以难以降解的合成高分子为主,例如聚甲基丙烯酸甲酯、聚对苯二甲酸乙二
大规模三维多输入多输出(3 Dimensional Massive Multiple Input Multiple Output,3D Massive MIMO)技术通过在基站端部署大量天线,引入垂直角维度,大大提高了无线通信系统性能,已经成为5G通信中的关键技术。为了进一步提高系统容量,降低系统复杂度,本文研究了FDD系统下基于码本的有限反馈预编码方案,具体研究工作如下:第一,本文提出了基于有限
随着复杂系统及大规模网络的出现,多智能体系统在生物、经济及各工程领域受到广泛的关注.具有自主决策能力的个体视为智能体.智能体之间彼此通信,通过协调共同完成任务的系统