【摘 要】
:
随着计算机视觉和互联网技术的不断发展,Logo检测技术在商业宣传、商标侵权检测和城市智能化交通等实际生活中的应用越来越广泛。在商业宣传领域,挖掘图片中的Logo信息进行品牌追踪,并通过分析用户对品牌的偏好进行个性化推荐,可以对品牌宣传起到巨大推动作用;在商标侵权检测领域,通过对Logo图像进行智能检索及识别,可以判定所申请的商标是否存在侵权情况,对产品Logo检测以判定产品是否为虚假产品,为知识产
论文部分内容阅读
随着计算机视觉和互联网技术的不断发展,Logo检测技术在商业宣传、商标侵权检测和城市智能化交通等实际生活中的应用越来越广泛。在商业宣传领域,挖掘图片中的Logo信息进行品牌追踪,并通过分析用户对品牌的偏好进行个性化推荐,可以对品牌宣传起到巨大推动作用;在商标侵权检测领域,通过对Logo图像进行智能检索及识别,可以判定所申请的商标是否存在侵权情况,对产品Logo检测以判定产品是否为虚假产品,为知识产权保护和社会的稳定发展提供保障;在城市智能化交通领域,由于车辆增多、道路拥堵、交通事故频发等问题,路标及车牌检测对交通安全至关重要。因此,Logo检测是一项值得研究的课题。Logo图像检测技术是通过对输入图像进行处理,在图像中找出Logo所在的区域并判定Logo的具体类别。传统的Logo检测方法由于手工提取特征的局限性导致检测性能较差。目前,随着卷积神经网络的迅速发展和应用,以深度学习为基础的模型也表现出了较高的检测性能。因此,针对现实场景中Logo图像的特点,本文以深度学习方法为基础对Logo检测方法展开研究。在目前已有的大规模数据集和主流检测方法的基础上,通过分析Logo图像的特点和目前检测方法在Logo检测任务上的局限性,本文对基础方法进行了改进以获得更好的检测性能。本文的工作主要包括以下两个方面:(1)设计基于变形卷积和特征融合的Logo检测方法。卷积神经网络在对Logo进行建模时,由于其固定的几何结构不能较好地适应Logo的几何变化,因此检测性能存在一定局限性。针对Logo具有不同的几何变化和目标检测性能差的问题,本文提出了基于变形卷积和特征融合的Logo检测方法。具体来说,本文首先在Res Net50网络中添加可调节的变形卷积模块来学习偏移量和调节权重,使卷积核的采样位置根据Logo的大小、形状自适应调整,充分提取具有不同几何变化的Logo的特征;然后在特征金字塔网络中引入内容感知特征重组算子,根据特征图的语义信息在每个位置生成自适应内核并进行特征重组,获得包含更多语义信息的特征图,改进的特征金字塔网络融合了不同尺度的特征,显著提升了Logo检测的效果;最后在回归过程中引入DIoU损失函数,实现更精准的边界框定位。(2)设计基于动态训练分类器和回归器的Logo检测方法。在训练过程中,网络中的固定设置会限制检测器的性能,比如标签分配策略(固定的IoU阈值设置)和固定的回归损失函数不能灵活地适应候选框的分布变化。理论上来说,高IoU阈值能够获得较高质量的候选框,但在训练初期设置较高IoU阈值会导致正样本数量不足,而低IoU则无法训练出判别高质量候选框的分类器;此外,在回归分支,随着网络训练的进行,回归标签的分布也发生变化,由于候选框质量提高,其均值、方差逐渐下降,固定的设置使得高质量候选框对训练的贡献减少。针对上述问题,本文引入动态的标签分配策略和动态平滑损失函数,具体来说,在训练过程中,根据候选框分布变化自动更新IoU阈值,逐步获得更高质量的候选框;在回归分支,调整回归损失函数参数,使其自动调整参数以适应回归标签的分布,增强高质量候选框对网络训练的贡献。此外,本文在Res Net50网络中使用了不同空洞率的卷积,并通过开关函数自适应选择感受野,以检测不同尺度的Logo。本文在不同规模的数据集上对提出的两个方法进行了实验评估,首先与一些检测性能较高的方法进行了大量的对比实验,然后通过消融实验分别证明每个模块方法的有效性,最后展示可视化结果来说明本文方法对现实场景的Logo图像具有较高的检测性能。
其他文献
实践性知识是教师知识体系中的重要部分,显著影响教师的教学活动和专业发展。教师以其个人经历和在教学实践中的评估与反思为基础,将理论联系实践,逐渐累积发展实践性知识,并以教学行为、教学思考加以显现。可以说,实践性知识是教师做出教学判断、教学决策的基准。教育实习是师范生走上教学岗位的重要环节,在这个阶段,师范生处于学生-教师身份转换的关键时期,也是其实践性知识发展的重要初始阶段,对教师专业发展意义重大。
随着疫情在全球范围内爆发,线上对外汉语教学获得长足发展,对外汉字教学也越来越受到人们的重视。目前,海外华裔儿童是线上学习汉语的主力军之一,汉字一直是其学习汉语的难点,汉字偏误问题一直普遍存在。在笔者实习过程中,巴拿马华裔儿童的汉字偏误问题十分突出。因此,如何纠正华裔儿童汉字书写中的偏误、提高他们汉字书写水平和能力值得深入研究。笔者以巴拿马孔子学堂的华裔儿童为例,搜集学生近一年来的课堂练习和书面作业
“产出导向法”(POA)强调目的语产出在第二语言学习中的重要作用,采取以输出为驱动的教学起点,调动语言学习者的学习积极性,提升其课堂参与度。中文口语课堂的教学目标是培养学习者在真实、具体的中文口语交际情景或交际场景中运用中文进行倾听、理解和表达的能力。同时,作为主要的语言技能课之一,口语课要求学习者在课上多说多练,在反复练习中巩固所学中文知识,提高中文表达的流畅性与准确性。随着在线课堂教学在国际中
国家形象是一国实力水平和现实影响力的综合体现,在疫情大背景下对外汉语教学在对于帮助外国人了解真实中国形象上发挥着无可替代的作用,阅读是对外汉语学习中的重要技能之一,对外汉语教学新态势让阅读在汉语教学应用中日益受到关注。因此,分级阅读理念推广下汉语分级读物的地位也越来越显著,从具有代表性的汉语分级读物入手,以读物里的中国形象作为研究切入点,这对于分级读物的编写、教学里中国形象的呈现、对外汉语阅读教学
情绪与人们的认知、决策和生活状态息息相关,其产生涉及到大脑中不同脑区的信息交互。研究情绪的神经机制和情绪识别方法,一方面可以帮助计算机具有理解人类情绪的能力,使得当前的人机交互更加智能;另一方面,可以应用于抑郁症等精神类疾病的辅助诊断和治疗等。然而,基于脑电信号(EEG)的情绪识别是一项复杂的任务,难以通过单一维度的特征来获得较好的情绪识别效果,因此需要提取最能够表征情绪状态的特征并采用合适的融合
小细胞肺癌(Small cell lung cancer,SCLC)是一种常见的高风险的肿瘤疾病,其死亡率高、发病率高,严重危害患者的身体健康,约占肺癌总数的15%-20%。SCLC具有侵袭性较高,快速生长、早期转移、耐药性强等特点。临床诊断中,现有SCLC的定位及分割多依赖于医生通过计算机断层扫描技术(Computed tomography,CT)诊断,需要较高的人工成本。临床治疗发现,多数病人
随着无线电子技术与网络通讯技术的进步与发展,无线传感器网络通信技术已然成为当今世界一项必不可少的新兴技术,相关问题的研究受到越来越多研究者的关注。然而,在实际应用中,多数系统会出现未知扰动,同时受制于系统的传输能力和通信链路故障等因素,测量信息在传输过程中很容易丢失,从而造成估计器估计性能的下降。针对无线传感器网络中含丢包和未知输入的状态估计问题,本文提出了两种不同情况下的含未知输入与丢包现象的分
目的:本研究旨在探讨白介素17(IL-17)及白介素6(IL-6)与胆囊结石形成的作用及相关性。方法:回顾性的分析新疆维吾尔自治区人民医院2019年12月至2022年1月明确诊断为胆囊结石并进行胆囊切除术的234例患者和与之相匹配的363例对照组的病历资料,分析白介素17(IL-17)及白介素6(IL-6)与临床病理特征之间的关系。结果:比较两组临床资料,结果显示胆囊结石患者的WBC、NEU、D-
随着时代的发展和市场的需求,网络汉语教学的发展已成为语言教学中的一项重要内容,因此对口语教学中网络直播平台应用的研究显得非常重要。但在汉语中级口语教学中,网络直播平台的应用还处于探索阶段,尚未形成较为完善的教学模式。基于此,本文在总结前人成果的基础上,以钉钉网络直播平台为例,对汉语中级口语课中网络直播平台的应用情况进行了研究,主要研究内容如下:第一章为绪论。论文重点介绍了选题缘由与研究意义,选题的
在互联网时代的发展中,多智能体系统已经成为被广泛研究的课题。正系统是一种特殊的动力学系统,并在许多领域中得到了广泛的应用。输入-状态稳定性理论在现代非线性控制理论发展中具有重要的地位,特别是在非线性系统的稳定性理论中。在现实生活中,多智能体系统存在干扰的现象虽然是很普遍的,但缺乏针对出现干扰现象时的正多智能体系统的状态一致性研究,于是本文针对非线性正多智能体系统,深入研究了在状态反馈与脉冲控制下的