自监督相关论文
认知科学和神经科学领域的大量研究表明,人脸和语音之间存在潜在的关联,利用这种关联,可完成跨人脸-语音生物特征识别。跨人脸-语......
使用深度学习方法进行单目深度估计时, 由使用多级下采样会出现重建结果细节信息缺失、边缘轮廓模糊等问题. 为此, 提出一种基于高分......
声源分离任务是音频领域相对古老的任务之一,最初提出时,被赋予“鸡尾酒会问题”这个优雅的名字。该问题最初旨在解决复杂场景下人......
低剂量CT扫描应用越来越广,然其斑纹噪声和非平稳条纹伪影复杂,当下仅依靠推断条件后验概率来实现图像去噪的算法,无法应对低剂量CT图......
遥感图像能够快速获取大范围地面信息,在资源环境调查、地物分类、作物种植面积提取等多个领域起到重要作用。在实际应用中,仅靠单......
深度神经网络在多种人工智能任务中有广泛的应用,然而研究表明深度神经网络在对抗样本的攻击下会输出完全错误的预测结果,整体模型的......
基于骨架的动作识别方法因其对动态环境和复杂背景的强大适应性,已被广泛研究。为了从骨架关节点序列中识别不同的动作,对骨架所代......
学位
图神经网络已被证明是建模图结构数据的强大工具,其优异的性能引起了学者高度的关注。而随着预训练在计算机视觉和自然语言处理等领......
大脑作为人体最重要的器官,一些不健康的生活方式可能会导致各种脑部疾病的产生,这些疾病严重威胁着人类的身体健康。临床上通常使......
点云数据配准任务的目的是对两帧点云数据做空间点级的匹配工作,在无人驾驶、家用机器人、无人机的飞行、地理信息系统的研发等领......
光场相机是一种新型的多目成像设备,通过单次拍摄可获取场景的空间和多视角信息。利用光场数据可以估计场景深度,在三维重建等计算......
由于具备体积小,价格实惠和控制稳定的优点,多旋翼无人机近十年来被逐渐广泛应用在各个领域,亦被广泛研究。其中基于单目视觉的无......
基于深度学习的三维目标检测方法需要大规模的标注数据才能达到良好的性能,而三维框的标注需要标注者在不完整的2.5D稀疏点云下,凭......
随着大数据与自动化时代的飞速发展,人们对于数据的正确性与自动化过程中安全性要求越来越高,异常检测任务也越来越受到人们重视。......
数据增强作为一种简单有效的方法被广泛应用以提升模型泛化能力,特别是在训练深度神经网络时。近年来研究人员们提出了不少新的数......
针对现有语种识别技术在低资源情况下无法具备优异识别效果的问题,提出了一种基于自监督预训练模型的低资源语种类型识别的方法.通......
人工高昂的注释成本以及某些稀有类别数据的稀疏性限制了当前深度模型对于有效学习新视觉任务的适用性,而元学习基于先验知识,可以......
随着卫星及无人机等各种对地观测平台系统的快速发展,获取大量高分辨率遥感图像变得越来越容易。这些高分辨率图像已成为各种遥感......
目的 由于跨模态数据集有限和模态异构表征问题,利用跨模态检索算法解决实际应用问题一直是当前多模态研究中的一大研究方向.方法 ......
目的基于深度学习的图像哈希检索是图像检索领域的热点研究问题。现有的深度哈希方法忽略了深度图像特征在深度哈希函数训练中的指......
在单目内窥镜场景下人体内组织表面纹理稀疏,视野受限给图像的深度估计带来了一定的困难。针对以上问题,提出了一种基于半稠密COLM......
针对单目图像深度估计中采用监督学习方法的条件限制和深度图结果存在边界伪影、轮廓不清晰、预测范围较小等问题,提出了一种基于......
针对在非线性子空间中同时探索多视角数据的互补性与一致性的问题,提出了一种互补与一致的多视角子空间聚类网络C2MSCN。该网络由......
协同显著性检测是近年来计算机视觉领域迅速兴起和快速发展的一个研究领域,旨在一组图像中找到外观相似或者语义相同的处在前景中......
医学影像的统计研究表明,组织的边缘信息是医学影像重建最难恢复的一个部分,但现有基于深度学习的重建方法均缺乏对边缘信息的显式......
期刊
由于对核电厂执行A类安全功能的软件要求极高,必须遵守核质保体系的开发要求,如HAF 003和IEC 60880等,市场上这类软件较少。对此,......
本文研究了神经网络无导师自监督学习子空间模式识别方法的收敛性问题,证明了学习子空间法的变换矩阵收敛于模式的自相关矩阵估计;证......
肝脏肿瘤是世界上主要癌症致死类型之一,为了帮助医生辅助诊断治疗,临床上亟需全自动的精准的肝脏分割方法[1]。卷积神经网络在医......
针对文本聚类过程中无法对多义词有效表征而导致的聚类效果低,引入Bert预训练语言模型增强句向量的语义表示,将生成的句向量利用K-......
目前利用自监督单目深度估计方法对城市街道进行深度估计时,由于物体间存在遮挡和运动,导致估计的深度图结果模糊以及出现边界伪影......
阜成门烤鸭店位于西城区阜志门内人奇对9号.该店经营状炉烤鸭、山东风味莱希。十多年来靠严格管理。遵纪守法,坚守信誉,1997车被西城......
提出一种基于惩罚培育的拓扑构造算法,针对P2P系统中普遍存在的搭便车、sybil攻击、whitewashing等不合作行为,在移动P2P拓扑构造过......
自2014年被提出以来,GAN在图像生成、图像风格转换、图像缺失补全等计算机视觉相关领域,以及语音合成、自然语言处理等领域都取得......
随着信息技术在社会各领域的深入渗透,人类社会所拥有的数据总量达到了一个前所未有的高度。一方面,海量数据为基于数据驱动的机器......
数字化反应堆保护系统运行期间需要通过各种监督测试确认其可用性和安全性,自监督是一种重要的监督测试类型,从功能安全角度分析自......
深度学习理论在微创手术视频分析中的应用日趋广泛,在微创手术工具检测与跟踪、微创手术工具存在检测和微创手术流程识别等领域已......
Kinect等深度相机采集的三维数据往往存在噪音、低分辨率等问题,导致两帧点云的局部几何特征匹配一直面临挑战。目前多采用基于特......
极化合成孔径雷达(PolSAR)是一种多通道、多参数、高分辨率的相干成像遥感设备,使用矢量测量方法记录不同极化方式下的散射回波信......