轻量化图像显著性识别网络研究

来源 :南昌大学 | 被引量 : 0次 | 上传用户:yuen370181406
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着高性能计算设备的不断升级,大数据时代到来,人工智能领域获得了长足发展,其中深度学习技术已经成为当前的研究热点并获得了广泛的应用,已经成为计算机视觉领域主流算法。在计算机视觉众多的分支中,如分类任务,检测任务及图像分割等,目前最优秀的算法就是深度神经网络(DNNs)。而卷积神经网络(CNNs)无疑是深度神经网络结构中最引人注目的一种,当前绝大部分的图像相关任务都会选择应用这种结构,卷积神经网络结构是一种典型的数据驱动的算法,需要利用大规模的数据进行训练,数据标注需要耗费大量、昂贵的人力成本,这无疑是限制了算法在其他领域的泛化。显著性识别算法在数据标注过程中可以有效的减少成本,在研究相关问题中,我们提出了一个新的显著性识别算法结构。尽管现存的基于CNN网络的结构,已经可以达到较高的检测准确率,但大多数无法有效利用多尺度的特征和全局语义信息。本文基于此认知可以进一步挖掘算法潜力,提出新的显著性目标识别结构--门控双金字塔网络结构。结构主体包含特征金字塔网络(FPN,Feature Pyramid Network)以及金字塔池化模块(PPM,Pyramid Pooling Module)两部分分别捕获多尺度金字塔层级特征和全局语义信息。我们基于此特征进行改进,设计了“交叉门”结构和“单一门”结构两种门控策略分别应用两种金字塔网络模块中,去除掉隐特征信息中的不显著目标信息等无关信息。我们通过五个显著性识别任务的主流基准数据集进行实验,有竞争力的实验结果验证了我们研究的准确性。结构参数的冗余和巨大计算代价严重制约算法的落地应用,本文针对网络结构内部参数的冗余进行了分析,研究当前较为通用的网络轻量化技术,设计了一种由多方式联合的网络轻量化方案。针对提出的门控网络结构特点,在网络训练完成后进行网络剪枝,在不损伤网络性能过多的前提下大幅度减少网络参数数量,并在此基础上进行二值化或三值化参数量化。这种方法的优点在于可以在不变更网络结构的情况下,减小网络尺寸,加快网络运算速度,具有部署应用的价值。
其他文献
本文主要对概念漂移检测算法进行了研究,并针对视觉跟踪场景的特性对传统的概念漂移算法进行了改进,提出了一个基于概念漂移检测的跟踪算法。为了更进一步地提高本文的概念漂移算法的鲁棒性,本文引入了对跟踪目标稀疏表达,过滤掉了由于遮挡对漂移检测算法带来的影响。最后实验显示,本文基于概念漂移检测的跟踪算法有着很高的精度。在数据挖掘领域中,旧有的模型可能会因为环境的变化而失效。漂移检测算法的目的是为了及时侦测出
近年来,伴随着使用内置GPS智能设备的用户的增长,基于位置的社交网络(Location-based Social Network,LBSN)得到了空前的发展,比如Foursquare和Gowalla等平台。对于用户来说,
随着社会的发展和科技的进步,基于马赫-曾德尔干涉(Mach-Zehnder Interference,MZI)的光纤传感器在许多领域发挥了巨大的作用,例如军事、国防、航天航空等。由于其具有结构小
前列腺癌的发病率在全球居于第四位,在男性中居于第二位,是男性当中最为常见的恶性肿瘤。2018年,前列腺癌在全球和中国的死亡例数分别为35.9万和2.3万,转移是造成前列腺癌患者死亡的主要原因。目前,前列腺癌的治疗手段十分有限,且副作用大,病人会对有些治疗方式产生抗性,因此,深入研究前列腺癌发生、发展和转移的分子机制,为其临床治疗提供新的药物靶点,在理论和临床上具有重要意义。酪氨酸激酶分为受体酪氨酸
在数字图像处理的各种任务中,图像去噪是基础而又重要的任务之一.近几十年来,学者们从各种角度对数字图像处理进行了深入研究,提出了大量的图像恢复算法.但由于图像信息的多
四足机器人依靠着腿部关节的灵活运动,能够从容面对多种多样的地理环境,完成许多轮式或履带式机器人无法执行的任务,如在山地丘陵等地区背负物资。快速灵活的机器人有着节省
干细胞是生命体的起源细胞,具有自我更新能力和多向分化潜能,可以分化为生命体的多种组织细胞,具有重要的研究价值。目前,国内外学者对干细胞展开了大量的研究工作并取得了丰
近年Z市城镇化进程不断加快,城市交通拥堵压力增大,Z市政府推进实施了城乡公交一体化改革。A公交公司作为Z市城区公交的唯一运营方,成为城乡公交一体化的实施主体。票价收入
随着人类社会进入移动互联网的新时代,基于地理位置信息的相关服务也迅速的发展起来。目前人们已经不仅仅满足于室外环境下的位置信息服务,在室内环境下的人员和设备定位等服
医学图像是一类被广泛应用于临床诊断的数字图像,但医学图像具有分辨率低,不同器官组织分界模糊的特点。近年来,针对医学图像的自动语义理解研究已经成为了一个焦点。目标检