论文部分内容阅读
人类可以轻松地检测和识别图像中存在的物体。人体视觉系统快速准确,可以执行复杂的任务,例如识别多个物体并以很少的意识思考来检测障碍物。长期以来,人们一直试图使计算机了解图像上的内容。借助大量数据的可用性,更快的GPU和更好的算法,我们现在可以轻松地训练计算机以高精度检测和分类图像中的多个对象。如今,这些典型的多层深层神经体系结构已成为各种学科(例如计算机视觉)中最新系统的组成部分。计算机视觉是人工智能(AI)的领域,它训练计算机解释和理解视觉世界。借助摄像机和视频中的数字图像以及深度学习模型,机器可以准确地识别和分类对象,然后对它们“看到的”做出反应。人类视线的优势在于可以终身使用上下文来训练如何区分物体,物体有多远,物体是否在移动等等。计算机视觉训练机器执行这些功能,但是它必须用相机,数据和算法而不是视网膜,视神经和皮层在更少的时间内完成。例如,要训练一台计算机来识别品牌苹果,就需要向计算机馈送大量的品牌苹果图像和与苹果相关的物品,以了解差异并识别一个苹果。无论如何,社交媒体上的图像为市场研究提供了有用的信息来源。可靠的徽标检测是进一步分析品牌互动的重要组成部分。
许多公司进行市场调查以收集有关其客户的信息。此外,他们通常想知道客户的期望,满意度,品牌知名度和品牌知名度。调查是收集此类数据以进行市场调查的经典工具。诚然,尽管调查可以提供有关客户关系许多方面的有价值的见解,但它们既耗时又昂贵。由于这些限制,通常只能以相对较少的人作为样本进行调查。因此,市场研究组织一直希望通过不同的渠道获取数据。社交媒体的兴起开辟了这样的渠道。如今,手机摄像头无处不在,许多人在社交媒体网站上发布自己的日常生活图片。这样,他们记录了与某些品牌的互动。尽管有时记录品牌互动是一种有意识的举动,例如,通过向朋友展示新车或通过对啤酒品牌的热爱来记录品牌互动。但是,更多时候,人们无意间记录了与这些品牌互动的人的形象。例如,自画像可以吸引用户喜欢穿的服装品牌。因此,社交媒体上的图像为市场研究提供了有用的信息来源。可靠地测试公司徽标是进一步分析这些品牌互动的重要组成部分。
徽标识别在计算机视觉领域具有悠久的历史,其历史可追溯到1993年。虽然问题定义明确(检测并识别图像中的品牌徽标),但由于没有明确定义构成的内容,因此它是一个具有挑战性的对象识别和分类问题。一个徽标。徽标可以被视为品牌的艺术表现形式,可以是(风格化的)字母或文字,图形图形或这些图形的任意组合。此外,某些徽标具有一组固定的颜色和已知字体,而其他徽标则具有多种颜色和专门的未知字体。另外,由于徽标的性质(作为品牌标识),不能保证徽标的上下文或在图像中的位置,实际上徽标可以出现在任何产品,背景或广告表面上。同样,此问题具有较大的类内变化,例如对于特定品牌,存在各种徽标类型和类别间变化,例如存在属于不同品牌但外观相似的徽标。
人工智能可以是一件美丽的事情,尤其是在您的徽标上。随着机器学习,深度学习和AI变得越来越突出和智能化,类似于软件的徽标识别也在增长。借助可靠的徽标识别软件,您可以查看徽标在社交媒体,电视或其他地方弹出的位置,消费者对徽标的反应或与之交互的方式以及是否在使用中恶意或伪造了徽标的用途。徽标识别工具可让您检测徽标在互联网上的显示位置。对于具有独特徽标的任何品牌,徽标识别都是必不可少的。徽标识别软件的使用方法有很多,为简单起见,我们将其分为三个主要类别。
徽标识别是弄清楚您的品牌在网上出现的频率的一种好方法。借助当今复杂的算法,徽标识别软件可以查看您的品牌在社交媒体平台上被提及的频率。这种软件还可以查看您的品牌在现实世界中的使用时间。例如,如果您在足球场上有宣传公司的标语,徽标识别软件可以告诉您在播放比赛时徽标在电视上出现的频率。这样一来,您就可以知道您的广告是否处在重要位置,以便在家中的观众可以看到您的全部内容。
使用徽标识别的第二种方法是在更恶劣的情况下使用。有时,无论是大品牌还是新兴公司,人们都以伪造或非法的方式使用徽标。他们可能在制造盗版产品,并盗用您公司的徽标。一家著名的时装公司通常会在盗版产品上看到其徽标。徽标识别软件使公司可以找到这类产品并适当地处理情况。有时,人们会在网上发布有关品牌的有害内容。他们可能散布有关您公司的虚假信息,或者在内容不当或与您的信息不符的社交媒体帖子中使用您的徽标。徽标识别是根除这些情况并加以解决的好方法。
人们对您的品牌有何反应?在线评论和真实评论是一回事,但是徽标识别软件可以让公司查看消费者对他们的产品或服务的真实想法,检查社交媒体帖子,博客文章以及其他有关品牌的提及。这对于衡量ROI(投资回报率)非常有用,因为公司可以评估其营销工作是否有成果。如果一家公司将其产品推广为一件事,而人们却将其视为另一件事,那么重新评估营销计划可能是明智的。
对象检测是一个常见的计算机视觉问题,用于识别和定位图像中某些类别的对象。主要有两种类型的最新对象检测器。一方面,我们有两阶段的检测器,例如FasterR-CNN(基于区域的卷积神经网络)或MaskR-CNN,它们在第一阶段使用RegionProposalNetwork生成感兴趣的区域并发送该区域提出了有关对象分类和边界框回归的建议。这样的模型达到最高的准确率,但通常较慢。另一方面,我们有单级检测器,例如YOLO(仅查看一次)和SSD(单发检测器),它们通过获取输入图像并学习类概率和边界框来将对象检测视为简单的回归问题。坐标。这种模型的准确率较低,但比两阶段目标检测器要快得多。
近年来,随着基于深度卷积神经网络的目标检测管线(如YOLO)的兴起,目标检测取得了长足的进步。YOLO有其自己的基于CNN和锚框的简洁体系结构,并被证明是一种针对广泛使用的问题的移动目标检测技术。随着时间的推移,它变得越来越快,其版本分别为YOLOv1,YOLOv2和YOLOv3.YOLOV2在准确性和速度方面都优于v1。在我们的项目中,我们使用Yolov2来检测徽标,因为正如我所说,它非常快速,准确,并且可以在手机中使用。在[18]的先前工作中,他们将这些新技术应用于公司徽标测试。他们创建了一个新的目标检测数据集,并将其用作公司徽标检测的基准。尽管从表面上看,公司徽标检测只是对象检测的一种特殊情况,但是当将这些新的对象检测管道应用于新数据集时,他们注意到了某些功能。例如,他们已经注意到,尽管R-CNN的速度较慢,但对于我们的数据集,这种最旧的方法比诸如FasterR-CNN的新方法的性能要好得多,后者通常被认为是对R-CNN的改进。检测性能和速度方面。
我的工作目的是在TensorFlow深度学习框架中创建一个对象检测模型,该模型能够基于单个网络评估来识别和定位图片上的不同徽标。此外,本文还介绍了使用YOLOv2创建的,用于Android移动设备的实时徽标检测系统的功能,该技术是最先进的一级目标检测器和卷积神经网络,其速度在准确性上远远超过其他实时对象检测器。计算机视觉领域中与视觉计算有关的工作,例如图像识别和对象检测。它介绍了人工神经网络(ANN),深度神经网络和深度学习以及卷积神经网络(CNN)的概念,以及训练CNN的方法。这些网络广泛用于图像分类和物体检测。本章详细介绍了当代图像分类和目标检测体系结构及其性能评估。然后,它描述了可用于各种目标检测模型的开源框架以及目标检测模型的速率和准确性。在我的工作中,首先介绍一种基于卷积神经网络(CNN)的检测器,称为“一次只看一次(YOLO)”算法和其他版本。在本文的下一部分中,我将介绍YOLO和训练算法的体系结构和实现步骤。在培训期间,我使用了各种方法来帮助提高识别的准确性并加速培训。在论文的最后,我客观地评估了结果。实验结果表明,我们在NvidiaGeforceGTX1070上获得了82.3%的最终精度和35fps的速度(每秒帧数)。与以前的工作相比,以前的工作获得了74.4%的精度,并且发现我们的模型在检测。在相当合理的情况下,误报率非常低。
许多公司进行市场调查以收集有关其客户的信息。此外,他们通常想知道客户的期望,满意度,品牌知名度和品牌知名度。调查是收集此类数据以进行市场调查的经典工具。诚然,尽管调查可以提供有关客户关系许多方面的有价值的见解,但它们既耗时又昂贵。由于这些限制,通常只能以相对较少的人作为样本进行调查。因此,市场研究组织一直希望通过不同的渠道获取数据。社交媒体的兴起开辟了这样的渠道。如今,手机摄像头无处不在,许多人在社交媒体网站上发布自己的日常生活图片。这样,他们记录了与某些品牌的互动。尽管有时记录品牌互动是一种有意识的举动,例如,通过向朋友展示新车或通过对啤酒品牌的热爱来记录品牌互动。但是,更多时候,人们无意间记录了与这些品牌互动的人的形象。例如,自画像可以吸引用户喜欢穿的服装品牌。因此,社交媒体上的图像为市场研究提供了有用的信息来源。可靠地测试公司徽标是进一步分析这些品牌互动的重要组成部分。
徽标识别在计算机视觉领域具有悠久的历史,其历史可追溯到1993年。虽然问题定义明确(检测并识别图像中的品牌徽标),但由于没有明确定义构成的内容,因此它是一个具有挑战性的对象识别和分类问题。一个徽标。徽标可以被视为品牌的艺术表现形式,可以是(风格化的)字母或文字,图形图形或这些图形的任意组合。此外,某些徽标具有一组固定的颜色和已知字体,而其他徽标则具有多种颜色和专门的未知字体。另外,由于徽标的性质(作为品牌标识),不能保证徽标的上下文或在图像中的位置,实际上徽标可以出现在任何产品,背景或广告表面上。同样,此问题具有较大的类内变化,例如对于特定品牌,存在各种徽标类型和类别间变化,例如存在属于不同品牌但外观相似的徽标。
人工智能可以是一件美丽的事情,尤其是在您的徽标上。随着机器学习,深度学习和AI变得越来越突出和智能化,类似于软件的徽标识别也在增长。借助可靠的徽标识别软件,您可以查看徽标在社交媒体,电视或其他地方弹出的位置,消费者对徽标的反应或与之交互的方式以及是否在使用中恶意或伪造了徽标的用途。徽标识别工具可让您检测徽标在互联网上的显示位置。对于具有独特徽标的任何品牌,徽标识别都是必不可少的。徽标识别软件的使用方法有很多,为简单起见,我们将其分为三个主要类别。
徽标识别是弄清楚您的品牌在网上出现的频率的一种好方法。借助当今复杂的算法,徽标识别软件可以查看您的品牌在社交媒体平台上被提及的频率。这种软件还可以查看您的品牌在现实世界中的使用时间。例如,如果您在足球场上有宣传公司的标语,徽标识别软件可以告诉您在播放比赛时徽标在电视上出现的频率。这样一来,您就可以知道您的广告是否处在重要位置,以便在家中的观众可以看到您的全部内容。
使用徽标识别的第二种方法是在更恶劣的情况下使用。有时,无论是大品牌还是新兴公司,人们都以伪造或非法的方式使用徽标。他们可能在制造盗版产品,并盗用您公司的徽标。一家著名的时装公司通常会在盗版产品上看到其徽标。徽标识别软件使公司可以找到这类产品并适当地处理情况。有时,人们会在网上发布有关品牌的有害内容。他们可能散布有关您公司的虚假信息,或者在内容不当或与您的信息不符的社交媒体帖子中使用您的徽标。徽标识别是根除这些情况并加以解决的好方法。
人们对您的品牌有何反应?在线评论和真实评论是一回事,但是徽标识别软件可以让公司查看消费者对他们的产品或服务的真实想法,检查社交媒体帖子,博客文章以及其他有关品牌的提及。这对于衡量ROI(投资回报率)非常有用,因为公司可以评估其营销工作是否有成果。如果一家公司将其产品推广为一件事,而人们却将其视为另一件事,那么重新评估营销计划可能是明智的。
对象检测是一个常见的计算机视觉问题,用于识别和定位图像中某些类别的对象。主要有两种类型的最新对象检测器。一方面,我们有两阶段的检测器,例如FasterR-CNN(基于区域的卷积神经网络)或MaskR-CNN,它们在第一阶段使用RegionProposalNetwork生成感兴趣的区域并发送该区域提出了有关对象分类和边界框回归的建议。这样的模型达到最高的准确率,但通常较慢。另一方面,我们有单级检测器,例如YOLO(仅查看一次)和SSD(单发检测器),它们通过获取输入图像并学习类概率和边界框来将对象检测视为简单的回归问题。坐标。这种模型的准确率较低,但比两阶段目标检测器要快得多。
近年来,随着基于深度卷积神经网络的目标检测管线(如YOLO)的兴起,目标检测取得了长足的进步。YOLO有其自己的基于CNN和锚框的简洁体系结构,并被证明是一种针对广泛使用的问题的移动目标检测技术。随着时间的推移,它变得越来越快,其版本分别为YOLOv1,YOLOv2和YOLOv3.YOLOV2在准确性和速度方面都优于v1。在我们的项目中,我们使用Yolov2来检测徽标,因为正如我所说,它非常快速,准确,并且可以在手机中使用。在[18]的先前工作中,他们将这些新技术应用于公司徽标测试。他们创建了一个新的目标检测数据集,并将其用作公司徽标检测的基准。尽管从表面上看,公司徽标检测只是对象检测的一种特殊情况,但是当将这些新的对象检测管道应用于新数据集时,他们注意到了某些功能。例如,他们已经注意到,尽管R-CNN的速度较慢,但对于我们的数据集,这种最旧的方法比诸如FasterR-CNN的新方法的性能要好得多,后者通常被认为是对R-CNN的改进。检测性能和速度方面。
我的工作目的是在TensorFlow深度学习框架中创建一个对象检测模型,该模型能够基于单个网络评估来识别和定位图片上的不同徽标。此外,本文还介绍了使用YOLOv2创建的,用于Android移动设备的实时徽标检测系统的功能,该技术是最先进的一级目标检测器和卷积神经网络,其速度在准确性上远远超过其他实时对象检测器。计算机视觉领域中与视觉计算有关的工作,例如图像识别和对象检测。它介绍了人工神经网络(ANN),深度神经网络和深度学习以及卷积神经网络(CNN)的概念,以及训练CNN的方法。这些网络广泛用于图像分类和物体检测。本章详细介绍了当代图像分类和目标检测体系结构及其性能评估。然后,它描述了可用于各种目标检测模型的开源框架以及目标检测模型的速率和准确性。在我的工作中,首先介绍一种基于卷积神经网络(CNN)的检测器,称为“一次只看一次(YOLO)”算法和其他版本。在本文的下一部分中,我将介绍YOLO和训练算法的体系结构和实现步骤。在培训期间,我使用了各种方法来帮助提高识别的准确性并加速培训。在论文的最后,我客观地评估了结果。实验结果表明,我们在NvidiaGeforceGTX1070上获得了82.3%的最终精度和35fps的速度(每秒帧数)。与以前的工作相比,以前的工作获得了74.4%的精度,并且发现我们的模型在检测。在相当合理的情况下,误报率非常低。