基于RGB-D图像的物体检测

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:wondercn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在人工智能、增强现实(AR)等前沿科技的实际应用中,物体检测具有很高的研究价值,涉及到人机交互和多媒体检索等多项关键内容,但是由于复杂的类内多样性和偶发的类间相似性,依赖RGB数据的准确物体定位识别依然是一个巨大挑战。随着计算机视觉技术和硬件设备日新月异的发展,基于深度信息的物体识别和场景理解越来越受到人们的关注,由深度相机获取的RGB-D图像更是为研究深度信息的学者们提供了数据支撑。如因特尔的RealSense,微软的Kinect,苹果公司的PrimeSense等设备均可以获得较高精度的深度信息,甚至在手机端Tangle和IPhone X上都携带了深度传感设备。深度信息的引入能够有效地解决物体检测过程中受光照变化、拍摄角度、物体数量和物体尺寸等因素的影响出现的准确性和实时性较低的问题。因此,本文基于物体的彩色和深度图像组,将物体检测流程分为似物性采样和物体识别两个阶段进行分析,分别提出了分步超像素聚合似物性采样方法和多模态信息融合的目标识别方法,有效提升了检测效率和精度。(1)在似物性采样(object proposal)阶段,依据人眼对显著性物体观察时先注意其色彩后判断其空间深度信息的特点,首先对图像进行超像素分割,然后结合颜色信息和深度信息对分割后的像素块分步进行多阈值尺度自适应超像素聚合,通过先验条件的进一步筛选可以去除似物性区域中仍包含的部分重叠和错误区域,最终得到在下一步识别中需要用到的预选窗口。(2)在物体识别阶段,利用多核学习方法融合在窗口物体中提取的颜色、纹理、轮廓、深度多模态特征,实现物体不同信息的充分表达。将特征融合核输入支持向量机多分类机制中进行学习和分类检测,有效降低因多特征融合产生的特征维数过大、计算复杂度高的问题。本文实验基于华盛顿大学RGB-D数据集和课题组采集的真实场景集。通过将本文算法与当前主流算法进行对比得到检测精度提升了4.7%,运行时间减少了3倍以上。同时,在物体定位性能上优于当前主流似物性采样方法,在相同召回率下采样窗口数量约低于其他算法4倍。多信息融合在目标识别阶段优于单一特征和其他多特征融合方法。结果证明了本文方法在实际物体检测应用中具有十分重要的作用和意义。
其他文献
近年来,有机无机杂化钙钛矿太阳能电池因其优异的光电性能及较低的成本迅速成为目前新一代薄膜太阳能电池研究的热点。经过十余年的发展,钙钛矿太阳能电池的光电转换效率从最初的3.8%提高到25%以上,逼近单晶硅太阳能电池认证的最高效率,在商业化的道路上展现出了极大的应用潜力。虽然三维结构钙钛矿材料展现出了优异的光电性能,然而其结构中包含的机组分容易受环境湿度、温度以及紫外光照的影响,显示相对较差的长期稳定
开展古河道相关研究不仅为国民经济建设提供必要的基础数据,也为研究当地地理环境的演变提供科学依据,还可以为旅游业、农业、国土资源、工程规划设计等领域的发展提供一定的服务。本文通过研究古河道及其与新构造运动之间的联系得出松辽平原中南部地区第四纪以来的水系演化过程,并分析了由此对当地生态环境带来的影响,从地质环境演变的角度揭示了研究区现今恶劣生态环境产生的机理,为解决当地突出的土地荒漠化、土壤盐碱化等生
乙烯基乙炔(MVA),是氯丁橡胶(CR)生产工艺中非常重要的化学中间体,氯丁橡胶因为其在化学和机械上有较好的性能,在酸碱、光照、臭氧、高温等条件下都相对良好的稳定,因此它在建筑材料行业、橡胶制品制造业、粘合剂制造等生产业中有着广泛且不可或缺的应用价值。目前MVA主要是通过乙炔二聚反应来生产,此路线对煤的依赖性较大,这对应着我们国家的能源特点。然而,乙炔二聚反应过程中所采用的纽兰德催化剂(Nieuw
天然纤维切割机是制造复合材料时使用的主要设备之一,用于纤维的预处理工艺中。随着科技的高速发展,对高性能复合材料的需求越来越多,因此对天然纤维切割设备的性能及要求也越来越高。国外发达国家研制的纤维切割机大多价格昂贵,而国内开发的产品与国外的产品差距较大,尤其是在切割质量和设备稳定性方面做得还不够好。本课题是在借鉴国内外研究现状的基础上,研究出一种新型的天然纤维切割设备,以期更好的解决纤维切割机的切割
溶菌酶,又称N-乙酰胞壁质肽聚糖水解酶,是一种无害、无毒,不会残留在体内的天然蛋白质。其广泛分布于不同生物体中,是一种能水解微生物细胞壁黏多糖的碱性水解酶。2007年,本实验室首次分离和鉴定了海参i-型溶菌酶基因,并已在原核细胞和真核细胞中高效表达其目的蛋白。该研究以本实验室已构建的能高效表达的海参i-型溶菌酶的毕赤酵母基因工程菌HS3-1为发酵出发菌株,运用发酵罐对该工程菌进行发酵生产。发酵液经
目的:应用速度向量成像(Velocity vector imaging,VVI)技术测量二叶式主动脉瓣(Bicuspid aortic valve,BAV)患者升主动脉弹性和左室心肌整体峰值应变,并探讨BAV患者的升主动脉弹性与左心室收缩功能的相关性。方法:严格按照纳入排除标准,选取BAV患者40例作为病例组,依据患者近端升主动脉内径,又将病例组分为病例1组(≤35mm),病例2组(>35m
在内燃机研究领域,节能减排是目前的主要发展方向。缸内直喷汽油机凭借其出色的性能得到了乘用车市场的认可,但是其微粒排放过高,对人体健康和环境有很大影响。微粒的主要成分是碳烟,对于碳烟形成原因及相关控制策略的研究,很大程度上依赖于对火焰内部碳烟的实时观测。近年来,以激光诱导炽光法为代表的激光诊断技术,作为一种非介入式的光学手段,可以在不干扰燃烧的情况下测量火焰中瞬态碳烟分布。本文采用基于双色法的激光诱
随着机器视觉技术的快速推进,运动目标的捕捉及跟踪技术的研究正逐渐成为该领域的重要研究环节。目前,许多高校、科研机构乃至大型的科技公司都投入了大量的精力去研究和探索
目的:应用18F-NaF PET/CT(18F-Sodium Fluoride Positron Emission Tomography-Computed Tomography)成像检测动脉粥样斑块微钙化的可行性研究,寻找早期检测动脉粥样硬化钙化
大豆胞囊线虫病(Heterodera glycines,SCN)是大豆生产中最重要的病害之一,生物防治因其持效长、对环境友好和低毒低残留等优点在大豆胞囊线虫防治中具有广阔的应用前景。微生物在防治植物病害过程中具有多种作用方式,其代谢物具有广泛的生物活性,在诱导植物抗病性过程中起到了重要的作用。有研究已经证明简单芽孢杆菌Sneb545发酵液包衣大豆种子具有诱导大豆抗胞囊线虫的作用,但其具诱导活性的成