基于嵌入式平台的杂草识别与空间定位方法研究及实现

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:beauty85123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在农业生产当中,除草一直是一个非常影响作物产量的重要工作,现有的机械除草、化学除草等除草手段存在着非常消耗人力、对环境污染较大等各种问题。因此,在现代化的智慧农业生产当中,如何更加高效环保地进行除草一直是一个非常重要的研究课题。基于深度学习的计算机视觉技术的发展使得农田中的杂草识别定位变得更加精准,推动了机器智能除草的快速发展。基于自动识别定位杂草的机器智能除草技术能够自动按需喷洒农药,在解放人力的同时,减少农药浪费,降低环境污染。要实现针对农田中杂草的自动按需施药,需要解决两个问题,一个是识别图像中的杂草区域,二是将图像中的杂草位置对应到真实空间位置。本文基于对杂草图像语义分割网络及双目深度估计网络的改进,提出了一个多任务学习的框架,同时完成了在嵌入式计算平台上的实际部署。本文的具体研究内容如下:(1)研究了杂草的图像数据特点,提出杂草图像语义分割网络DUSeg。基于双路语义分割网络构建结合低级空间特征和高级语义特征的分割网络。针对田间杂草数据分类空间小的特点,使用太大的特征提取网络对于精度的提升非常有限。本文使用了轻量并结构简单的Unet作为特征提取网络,在不损失精度的情况下具有更快的速度。同时在Unet基础上,使用更密集的连接以减少不必要的空间路径。针对田间杂草数据存在严重不平衡的问题,使用Dice损失函数替换了交叉熵损失函数,得到了较好的语义分割效果。(2)为了获得分割后的杂草的空间位置,引入了深度估计网络,提出了一个语义分割和深度估计联合的多任务学习框架。本文使用双目相机采集的数据,用传统立体匹配方法计算视差与深度,构建了一个双目深度估计数据集。训练了基于视差残差的深度估计网络来进行深度估计。在此基础上构建了一个多任务学习网络结构,视差估计网络和语义分割网络共享Unet特征提取模块,一个分支用代价聚合网络进行视差估计,另一个分支使用了语义分割网络,实现双目视差估计和语义分割的多任务联合。本文还对多任务的损失函数权重设计进行实验探讨,让语义分割任务和视差估计任务相互促进,超越单独任务的性能。在共享特征提取网络减少运算消耗的同时,还提高了各自任务的准确率。基于语义分割与深度估计的计算结果,结合相机参数,完成从输入图片到输出杂草区域边界位置空间坐标的转化并进行了可视化。(3)基于英伟达的Jeston TX2计算平台,利用Tensor RT的优化器与部署引擎部署了神经网络的预测推理,将整个系统部署到高能效嵌入式计算平台上。在神经网络的推理部署过程当中,将训练时的数值类型FP32在推理时转换为半精度浮点类型FP16,达到预测精度与预测速度之间最佳的平衡效果。
其他文献
在工业生产线上,机械臂让刚体零件的装配效率有着极大的提高,但对于线性柔软体零件,比如线缆、软绳等零件,由于自由度多,在受外在作用力的情况下,极易发生形变;并且难以根据机械臂末端位姿推测整个柔软体的位姿。因此当前柔软体装配仅靠机器人是难以完成的。本课题针对带线缆的装配问题,开展了在受限环境下线缆自动装配时存在的问题的研究,其中主要包括无标记线缆的无物理模型下的形状跟踪技术和线缆形状伺服控制的研究。本
本文以装车工业现场货车测量与定位为背景,研究了基于传统方法和深度学习的货车点云分割与测量方法。点云语义分割是三维场景理解的基本任务,在无人驾驶、增强现实、机器人避障等领域获得广泛应用。基于聚类、RANSAC模型拟合等传统点云分割方法适合于规则几何物体分割,但是算法的参数需要手工设置。为了提高算法通用性,本文基于PointNet++基本框架,结合最新的Transformer技术和注意力机制实现KNN
十九届五中全会指出,新时代新阶段的发展必须是高质量的发展,不仅要强化企业创新主体地位,提高全要素生产率,同时应遵循绿色发展、协同发展,全面塑造发展新优势。然而现有关于企业全要素生产率的研究较少关注企业生产过程中的污染问题。少数考察企业绿色全要素生产率的研究多采用将地区污染物按比例折算为企业非期望产出的做法,不仅无法真实判断企业绿色发展质量,更易因“搭便车”行为造成“公地悲剧”。重污染行业作为经济发
随着互联网技术的迅速发展,图像的应用越来越广泛,在图像的传输与存储的过程中也面临许许多多的安全与效率问题。为了实现图像的安全、快速传输,对图像加密与压缩技术的研究具有研究价值和现实意义。本文通过对超混沌系统与压缩感知进行研究,首先设计一个超混沌系统,然后将超混沌系统与压缩感知进行结合,构造安全可靠的图像压缩加密算法。接着,针对压缩感知执行效率低的问题,本文尝试将二维压缩感知引入图像压缩加密方案。本
大数据管理旨在建立支持多种模型、多种类型数据的数据中心。数据湖和数据仓库是构建多种模型数据存储很有前途的体系结构。集成的数据中心在多模态查询处理上面临着很多问题,比如现有的查询语言语义不够丰富、现有的索引调优技术不足以应对复杂的多模态场景、目前尚未有成熟的多模态查询处理技术等。为了提高多模态查询处理的效率,本文研究了多模态查询处理的关键技术,包括统一灵活多模态查询语言Multi-SQL的设计、面向
本文主要研究了面向监控视频的压缩处理方法。对于视频的压缩处理,现有的很多技术方法都是针对普通的视频进行编解码压缩的,然而针对监控视频的处理技术比较稀少。因此,本文提出了一种针对监控视频的压缩处理方法。我们通过结合Hi3559AV100开发板实现了视频的编解码处理工作。随后为了进一步提高图像的质量,我们实现了重构视频的图像质量增强任务。在图像质量增强任务中,我们尝试采集监控视频,并通过Hi3559A
分布式流处理引擎根据其算子特性可以分为有状态与无状态两种;在基于数据并行的有状态分布式流处理引擎中,如果数据发生较大倾斜,那么各个处理节点的计算负载就会出现不均衡的现象,对系统的吞吐与处理延迟造成影响。通过更改路由策略可以使得数据更加均衡的分发到不同处理节点中,平衡各个节点的处理负载。这个过程中,由于处理节点是有状态的,在更改路由策略之后,要相应的迁移节点中的状态来保证调整前后系统状态的一致性。现
随着我国国民生活水平的不断提升,对3C电子产品的消费逐渐提高,促进了3C产业的繁荣发展。据公开数据显示,我国占据了全球3C产业70%的产能。人力成本是3C产品生产的主要成本之一,因此提高3C产品的自动化生产十分必要。在3C产品中有大量柔性线材的使用,然而柔性线材具有柔性高、变形难以控制、容易发生形变等特点,因此对其实现自动化操作较为困难。为此本文对3C产品中柔性线材的自动化操作开展了相关的研究工作
学位
随着计算机行业的快速发展以及各种图像采集设备质量的迅速提升,商业摄影的人像美化受到广泛关注。目前,人像摄影图像后期处理仍主要依靠人工完成,其精修过程需要耗费大量时间和精力。因此,开发一款面向商业人像摄影的自动后期修饰软件具有十分重要的理论意义和应用价值。现有的人像美化软件大多面向移动端拍摄的图像,当其应用于摄影图像时会使皮肤区域过于平滑而失去质感,对背景颜色和细节也有一定程度的破坏。本课题借助深度