【摘 要】
:
目标数量估计是实际生产生活中的重要任务之一,在城市安防、智慧交通、农业信息管理等方面有着广泛的应用需求,其目的是统计特定目标的数目。在众多计数解决方案之中,基于计算机视觉的方法因其高速、准确的特点,是当前学术界的研究热点之一。它起源于检测、分割方案,后逐渐被全局或像素级的回归方法所取代,但仍然受到数据分布以及真值噪声等问题的影响。为了解决这些问题,基于局部预测的计数被提出。这一方法因其区域计数的特
【基金项目】
:
国家自然科学基金面上项目“基于深度局部回归模型的田间目标计数方法研究”(课题编号:61876211);
论文部分内容阅读
目标数量估计是实际生产生活中的重要任务之一,在城市安防、智慧交通、农业信息管理等方面有着广泛的应用需求,其目的是统计特定目标的数目。在众多计数解决方案之中,基于计算机视觉的方法因其高速、准确的特点,是当前学术界的研究热点之一。它起源于检测、分割方案,后逐渐被全局或像素级的回归方法所取代,但仍然受到数据分布以及真值噪声等问题的影响。为了解决这些问题,基于局部预测的计数被提出。这一方法因其区域计数的特性对于真值噪声具有鲁棒性,逐步成为视觉计数的主要解决方案之一。尽管局部计数方法展示了其作为计数方案的潜力,但其中仍然存在着样本不均衡、尺度多样性以及实例可区分性较差等问题,制约了其进一步发展。本文为了解决上述存在的问题,基于局部计数框架开展了深入研究,作出了如下的贡献:首先,针对目标计数中存在的真值噪声问题以及样本不均衡的现象,本文提出基于稠密等级分类的计数策略,构建局部稠密等级分类网络,同时利用信息熵权重在训练过程中进一步平衡不同稠密类别的损失。另外,针对局部计数的网格效应,本文采用冗余预测的方法提升分辨率。在实验中可以验证,该提出方法相比较于局部计数回归的基准方法,显著地提升了计数性能。其次,本文在实验中发现,目标的尺寸和预测数值的尺度之间有较强的关联性,两者不匹配时性能会显著下降。基于该实验发现,本文提出一种尺度失配抑制算法,并基于此构建了尺度失配感知局部计数网络,旨在筛除多尺度预测中尺度关系不匹配的预测结果,仅对于无明显错误的预测进行融合。实验结果表明,本文提出方法能有效提升局部计数网络的尺度适应性。再次,本文提出了计数问题建模的新思路。受到人逐步计数目标的行为以及天平工作机制的启发,本文提出计数天平模型将目标计数构建成为时序决策任务,用虚拟计数砝码“称”出图像中的目标数目,并且基于不同天平形式以及时序决策解决方案构建了天平系列网络。实验中,本文对于不同形式的天平网络进行了分析,展示了各种实现的特点与优劣。在多个数据集上的实验结果表明,计数天平的性能优于或至少与密度图等主流计数方法相近。在对通用目标计数问题的研究基础上,本文进一步将局部计数推广至实际应用。实例可区分是农业目标计数应用对算法输出结果的实际需求,因此本文的最后一项工作研究如何提升局部计数方法的实例可区分性。分析可知,一般局部计数实例可区分性不足的问题来源于低分辨率的输出以及背景误响应。针对这两个问题,本文提出引导上采样以及融合分割先验预测的计数,并以此为基准构建了基于局部计数的实例可区分农作物计数方法。在多个农业数据集上获得的实验结果显示,本文提出方法的输出结果更易于区分不同实例,并且可以显著提升计数精度,说明该方法是一种实例可区分性与计数精度兼具的农作物计数解决方案。
其他文献
永磁同步电机伺服系统作为机器人、数控机床、医疗设备、电子制造设备等高端装备的基础部件,其运动性能直接决定了高端装备综合性能指标。然而,应用对象日益增长的综合性能需求,迫切期望伺服系统控制策略不仅能有效处理状态耦合、参数时变、负载扰动、执行器饱和与延时等多约束条件,实现系统的闭环稳定,还需确保系统在多种目标性能(如鲁棒性、响应速度及跟踪精度等)上达到设定约束指标。针对上述多约束多目标,传统伺服控制方
在“30·60”战略目标推动下,以光伏、风电为代表的分布式电源在电网中的渗透率不断升高。微电网因其运行方式灵活,可有效发挥多类型源、荷、储资源的互补优势,已成为分布式电源并网消纳的重要形式。然而,单个微电网存在工作容量有限、抗扰动能力弱等缺点,仅能满足局部地区分布式电源的接入需求。若将地理位置邻近的多个非均质交、直流微电网互连,构成交直流混合微电网群,则可将大量小规模资产聚合形成众多的产用储一体化
多轴加工是复杂零件制造领域重要的工艺方法,在航空、航天、航海等设备的制造中扮演着重要的角色。其中,零件的加工精度受到了加工系统几何学、运动学、静力学、动力学等因素的综合影响。通过姿态轨迹的合理规划,可以在刀具姿态空间内实现对切削力、切削稳定性等切削性能的优化,另一方面可以在关节轴空间内,实现对运动光顺性、动静刚度等加工系统性能的优化,复合约束下的加工姿态轨迹规划是实现多轴加工精度提升的重要途径。因
激光雷达技术以其高空间分辨率的廓线探测优势,在大气科学相关领域发挥着重要作用。相比于采用传统回波能量接收方式的激光雷达技术,基于光谱检测的瑞利-布里渊激光雷达技术的参数反演方法更加简便、高效。但是,瑞利-布里渊激光雷达技术的现有光谱处理方法,一方面会受到光电转换过程中的电噪声影响,另一方面会受到去卷积产生额外频谱引起的光噪声影响而降低参数反演精度。对于该技术的现有参数反演方法,散射谱半高线宽与温度
焦栈图像是聚焦于场景不同深度的二维图像序列,其所含的对焦变化和深度信息对立体显示、显微成像、沉浸式多媒体等领域有着关键作用。然而,焦栈图像在提供对场景的细致描述和全面呈现的同时,通常受限于采样密集、表示冗余、数据体量巨大等瓶颈,给数据压缩、存储、传输和应用带来了巨大的挑战。针对上述挑战,本文提出了表示模型以实现焦栈图像的高效表示,进而基于表示模型设计编码方法以解决单视点和多视点条件下的焦栈图像压缩
本世纪以来,随着云计算、物联网、网络直播、元宇宙等各种互联网业务不断发展,第五代移动通信完成铺设开始普及,网络流量的分布逐渐演变为新的形态。持续增长的用户和终端数量,日趋多样化的网络业务,使中短距光纤通信系统流量逐渐超越传统的长距骨干网流量。当前,中短距光纤通信系统面临着频谱资源有限、成本敏感与通信容量需求增长之间的矛盾。研究调制复用技术和简化接收方案,对于实现高频谱效率、低成本的下一代光纤通信系
近些年随着网络科学、人工智能、数据挖掘和知识发现技术的突破性发展,人们已经具备定量分析自然科学和社会科学中诸多复杂问题的能力。在这些研究中,复杂网络被广泛地用于描述复杂系统和建模实际问题。其中具备多层结构的复杂网络扮演着极为重要的角色。现有针对多层网络的研究绝大多数是在已知完整多层结构信息(层信息)的前提下展开的。而在实践中,更常见的情况是网络的层信息是未知的或部分已知的。这使得研究缺失层信息的网
日益严重的人口老龄化问题是目前世界各国共同面临的难题之一。我国人口老龄化、高龄化现象十分严重,老年人口总量大而且老龄化程度逐渐加深。国家统计局的公报显示,2022年我国60岁及以上人口为28004万人,占总人口的19.84%。人口老龄化带来的一个严重后果是患病率的上升,尤其是慢性病发病率上升,进而导致老年人口的失能。由于科学技术的发展,医疗水平也在不断提高,使得我国人口的人均预期寿命也在不断延长。