CN113076972A - 一种基于深度学习的两阶段Logo图像检测方法及*** - Google Patents

一种基于深度学习的两阶段Logo图像检测方法及*** Download PDF

Info

Publication number
CN113076972A
CN113076972A CN202110240268.2A CN202110240268A CN113076972A CN 113076972 A CN113076972 A CN 113076972A CN 202110240268 A CN202110240268 A CN 202110240268A CN 113076972 A CN113076972 A CN 113076972A
Authority
CN
China
Prior art keywords
network
image detection
logo
image
deep learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110240268.2A
Other languages
English (en)
Inventor
侯素娟
侯强
孟晔
王静
贾伟宽
郑元杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Normal University
Original Assignee
Shandong Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Normal University filed Critical Shandong Normal University
Priority to CN202110240268.2A priority Critical patent/CN113076972A/zh
Publication of CN113076972A publication Critical patent/CN113076972A/zh
Priority to ZA2022/02140A priority patent/ZA202202140B/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本公开公开的一种基于深度学习的两阶段Logo图像检测方法及***,包括:获取待识别的Logo图像;将待识别的Logo图像输入训练好的图像检测模型中,获取图像识别结果;其中,图像检测模型包括特征提取网络、全连接网络和卷积网络,特征提取网络的输出分别输入全连接网络和卷积网络中,进行图像检测。实现了对Logo图像的准确识别。

Description

一种基于深度学习的两阶段Logo图像检测方法及***
技术领域
本发明涉及图像识别技术领域,尤其涉及一种基于深度学习的两阶段Logo图像检测方法及***。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成在先技术。
随着互联网广告的不断增加,虚假广告和违规广告等情况也愈演愈烈,商标的盗用、篡改、侵权等事件时有发生。为了保障互联网市场经济的健康快速发展以及维护广大人民群众的合法权益,更重要的是要在技术上进行严格的把关,对图像中的商标进行检测与识别已经成为人们迫切的需求。通过商标的自动检测技术可以快速准确识别商家上架的商品商标,判断其是否属于违规商品品牌。利用商标的检测技术可以通过检测互联网上的图像,通过结果分析某类品牌的关注度,以及在哪些场景下更加适用,从而给出特定的发展方向。一方面,商标检测可以通过分析结果给出商家进行后续营销的策略,如互联网广告投放等。另一方面,商标检测可以定向分析用户的品牌偏好,并对用户进行个性化推荐。研究如何对互联网图片中商标的有效、质量、快速检测是具有非常重要的应用价值。
目前目标检测领域的深度学习方法主要分为两大类:两阶段方法和一阶段方法。两阶段方法:首先由算法生成一系列作为样本的候选框,再通过卷积神经网络进行目标分类和目标回归。常见的算法有R-CNN、Fast R-CNN和Faster R-CNN等,它们的特点是准确度高但速度较慢。一阶段方法:不需要产生候选框,直接将目标框定位的问题转化为回归问题处理,常见的算法有YOLO和SSD等,它们的特点是速度快但准确度不高。对于Logo图像检测而言,存在类别多、数量大、目标较小、形变大、多尺度等特点,使得采用现有的两阶段方法或一阶段方法对Logo图像进行识别时,识别准确率较低。
发明内容
本公开为了解决上述问题,提出了一种基于深度学习的两阶段Logo图像检测方法及***,实现了对Logo图像的准确识别。
为实现上述目的,本公开采用如下技术方案:
第一方面,提出了一种基于深度学习的两阶段Logo图像检测方法,包括:
获取待识别的Logo图像;
将待识别的Logo图像输入训练好的图像检测模型中,获取图像识别结果;
其中,图像检测模型包括特征提取网络、全连接网络和卷积网络,特征提取网络的输出分别输入全连接网络和卷积网络中,进行图像检测。
第二方面,提出了一种基于深度学习的两阶段Logo图像检测***,包括:
图像获取模块,用于获取待识别的Logo图像;
图像识别模块,用于将待识别的Logo图像输入训练好的图像检测模型中,获取图像识别结果;
其中,图像检测模型包括特征提取网络、全连接网络和卷积网络,特征提取网络的输出分别输入全连接网络和卷积网络中,进行图像检测。
第三方面,提出了一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成一种基于深度学习的两阶段Logo图像检测方法所述的步骤。
第四方面,提出了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成一种基于深度学习的两阶段Logo图像检测方法所述的步骤。
与现有技术相比,本公开的有益效果为:
1、本公开通过利用两个不同的分支生成类别置信度和边框偏移量,全连接网络可以更好的对logo进行分类,而卷积网络可以更好的对logo边界框进行回归,使得检测结果更加准确,尤其是对多类别的预测。
2、本公开通过使用FPN网络和BFP网络相结合的方式来融合增强特征图,使得检测结果更加准确,尤其是对一部分小logo图像而言,可以在小logo检测的基线上获得显著的性能提升。
本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
图1为本公开实施例1公开方法的流程图;
图2为本公开实施例1公开方法中网络爬虫的具体流程图;
图3为本公开实施例1公开的Logo数据样本示例图;
图4为本公开实施例1公开的Logo检测的框架图;
图5为本公开实施例1公开的特征的提取、融合及增强流程图;
图6为本公开实施例1公开的高斯非局部注意力机制示意图;
图7为本公开实施例1构建模型的测试结果示例图。
具体实施方式:
下面结合附图与实施例对本公开作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
在本公开中,术语如“上”、“下”、“左”、“右”、“前”、“后”、“竖直”、“水平”、“侧”、“底”等指示的方位或位置关系为基于附图所示的方位或位置关系,只是为了便于叙述本公开各部件或元件结构关系而确定的关系词,并非特指本公开中任一部件或元件,不能理解为对本公开的限制。
本公开中,术语如“固接”、“相连”、“连接”等应做广义理解,表示可以是固定连接,也可以是一体地连接或可拆卸连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的相关科研或技术人员,可以根据具体情况确定上述术语在本公开中的具体含义,不能理解为对本公开的限制。
实施例1
为了实现对Logo图像的准确识别,在该实施例中,公开了一种基于深度学习的两阶段Logo图像检测方法,包括:
获取待识别的Logo图像;
将待识别的Logo图像输入训练好的图像检测模型中,获取图像识别结果;
其中,图像检测模型包括特征提取网络、全连接网络和卷积网络,特征提取网络的输出分别输入全连接网络和卷积网络中,进行图像检测。
进一步的,特征提取网络通过骨干网络进行特征提取,采用特征金字塔网络对提取的特征进行融合,输出特征图,将特征图使用平衡的特征金字塔进行特征增强,获得增强特征图,将增强特征图输入区域生成网络中,输出增强特征图的感兴趣区域。
进一步的,在平衡的特征金字塔中引入高斯非局部注意力机制。
进一步的,选用残差网络作为特征提取网络的骨干网络。
进一步的,通过全连接网络来检测图像的种类;通过卷积网络对图像进行位置定位。
进一步的,获取Logo图片,对Logo图片中的Logo进行标注,构建数据集;
对数据集进行训练集、验证集和测试集的划分;
通过划分后的数据集对图像检测模型进行训练,获得训练好的图像检测模型。
进一步的,通过网络爬虫技术获取Logo图片;
对获取的Logo图片进行清理;
对清理后的Logo图片进行Logo标注。
结合图1-7对本实施例公开的一种基于深度学习的两阶段Logo图像检测方法进行详细说明。
如图1所示,包括:
S1:获取待识别的Logo图像。
S2:将待识别的Logo图像输入训练好的图像检测模型中,获取图像识别结果。
在具体实施时,通过以下步骤获取训练好的图像检测模型。
S21:获取Logo图像,构建数据集,具体为:
在***上查找比较贴近生活的Logo品牌列表,然后通过网络爬虫技术从Baidu,Bing,Google三大网站上进行图片爬取,为了更加贴近生活,使用类别+关键词的方式进行爬取,如食品+可口可乐,如图2为网络爬虫技术的具体流程。
对爬取到的图片进行清理,清理与当前类别完全无关的图片。
然后使用LabelImg图像标注软件对清理完成的图片进行Logo标注工作,生成符合pascal VOC格式的xml文件,如图3所示用外接矩形贴近Logo目标的边缘进行标注,按照VOC的数据集的格式生成标注文件,方便后续生成模型的训练目标。
按照训练集:验证集:测试集=7:2:1的比例来对数据集进行划分。
S22:构建图像检测模型,图像检测模型的结构如图4所示,包括特征提取网络、全连接网络和卷积网络,其中,通过特征提取网络输出感兴趣区域,将感兴趣区域分别输入全连接网络和卷积网络中,通过全连接网络来检测图像的种类,通过卷积网络对图像进行位置定位。
其中,特征提取网络通过残差网络(ResNet-101)作为骨干网络进行特征提取,并采用特征金字塔网络(Feature Pyramid Networks,FPN)以自上而下和横向连接的方式对提取到的特征进行融合,获得特征图,随后在FPN网络的输出特征图的基础上使用平衡的特征金字塔(Balanced Feature Pyramid,BFP)对特征进行增强,增强原特征,得到增强特征图。
将增强特征图输入到区域生成网络(Region Proposal Network,RPN),然后通过soft max函数来判定预先在输入图片上定义的锚框是正样本还是负样本,经过筛选得到正样本候选框。再进一步通过边界框回归对正样本候选框进行修正,在增强特征图上生成感兴趣区域(Region of Interest,ROI),并通过ROI Align方法使得不同的区域采样至相同的尺寸大小。
对构建的图像检测模型进行详细说明,其中,特征的提取、融合及增强流程如图5所示。
(1)ResNet-101特征提取
通过残差网络(ResNet-101)作为骨干网络进行特征提取,残差网络在一定程度上可以缓解梯度弥散问题,使得信息前后向传播更加顺畅,通过卷积、池化、残差连接等操作丰富图像的语义信息,得到的特征图表示为{F2,F3,F4,F5}。
(2)FPN特征融合
因为ResNet是经过不断地下采样操作以得到多样的特征图,所以对于小目标来说,经过不断的下采样操作以后,信息就会逐渐的减少甚至消失。即F5虽然包含了丰富的语义信息,但是并不适合用来对小目标做检测。因此将特征图{F2,F3,F4,F5}通过FPN网络即自上而下和横向连接的方式进行融合,从而得到特征金字塔,将特征金字塔的各层特征图表示为{B2,B3,B4,B5}。这样特征金字塔的每一层都包含了丰富的语义信息和位置信息。
(3)BFP特征增强
为了更进一步的对各层特征图进行信息融合,使用BFP网络来对特征金字塔的每一层特征图进行增强操作。
将特征图{B2,B3,B4,B5}通过插值或池化的方式,将各层特征图统一调整为B4大小及维度进行融合,得到融合后的特征图为B,其中Bl表示第l层特征,L表示参与计算的特征的个数。如公式(1)所示:
Figure BDA0002961858830000091
得到B后,将其输送到高斯非局部注意力机制中,对于最终输出的增强特征图Y,其在每一个空间位置Yi均可表示为:
Figure BDA0002961858830000092
Bi代表输入图像的各个像素点位置,f用来计算Bi与Bj像素点之间的相关性,在此处使用嵌入式高斯的方式进行计算。如图6所示,FPN网络融合得到的特征图B依次经过三个1×1的卷积,其中θ(Bi)=WθBi与φ(Bj)=WφBj是两个嵌入层,g(Bj)=WgBj为一个线性转化,最终均通过C(x)归一化操作来实现。
Figure BDA0002961858830000093
相应操作如图6所示,经过3个1×1的卷积分别得到了3个不同的特征{R,S,T},再将S的转置与R相乘,得到一个自相关特征f,f的作用为计算出特征中的自相关性,即得到每个像素对其他所有像素的关系。然后对自相关特征进行Soft max操作,得到一个0~1的权重。紧接着将该权重与特征T相乘,最后与原输入特征图B做残差计算,获得输出增强特征图Y。
由上述可以得出,增强特征图Y融合了全图的特征信息,接着对Y重新采样并分别与{B2,B3,B4,B5}融合,得到最后的特征金字塔{P2,P3,P4,P5}。
(4)生成感兴趣区域
使用RPN网络来生成感兴趣区域,把经过融合和精炼的特征图{P2,P3,P4,P5}作为RPN网络的输入,然后经过滑动窗口(即3×3的卷积层),在滑动窗口的每个像素点对应的原图上设置9个锚框,并将其输入到两个1×1的卷积中进行分类和回归,最后通过Soft NMS剔除掉无用信息得到最优的候选框,再通过一定的比例投影到特征图中,其最终结果就是在特征图上产生多个候选框,即感兴趣区域,再输入到ROI Align中进行裁剪到相同的尺寸。
(5)分类和回归分支
图像中一些突出区域的特征可能具有丰富的分类信息,而边界周围的特征可能擅长边界回归,因此如图4所示,分类和回归可以看作是两个不同的任务,可以使用不同的方法来进行预测。分为两个分支,两个分值的输入均为增强特征图的感兴趣区域,其中一支用FC(全连接层)用来预测logo的类别置信度,另一支用CONV(卷积层)用来预测边框的偏移量,目的是获得更准确的矩形框。
S23:通过获取的数据集对构建的图像检测模型进行训练,获得训练好的图像检测模型。
使用迁移学习的方法,ResNet-101在ImageNet训练得到的模型作为本方法的预训练模型。使用的数据集为LogoDet-1000,其中包括53049张训练集图片,22736张验证集图片,9559张测试集图片。调整初始学习率为0.0025,使用训练集进行训练,不断计算模型预测值与训练目标之间的损失,使之达到最优的网络模型,应用测试集对上述最优网络模型进行测试,测试结果为矩形框标出每个logo所在的位置以及判定是否为当前类别的得分。
整个模型的损失函数由两部分组成,分别由RPN与结果预测阶段产生,如公式(4)所示:
L=Lrpn+Lfc+Lconv (4)
其中Lrpn是由RPN阶段产生的,Lfc和Lconv则是由模型的两个头部分支包括卷积层的头部和全连接层的头部产生的。
训练完成以后,得到最优的网络模型,开始进行测试,测试结果如图7所示,为矩形框标出每个logo所在的位置以及判定是否为当前类别的得分。
S24:将待识别的Logo图像输入训练好的图像检测模型中,获取图像识别结果。
本发明充分考虑了logo图像的种类多、数量多的特点,重新考虑了图像定位与图像分类的不同,采用卷积头部来预测logo图像的定位,采用全连接头部来预测logo图像的类别。并且采用改进的BFP(平衡的特征特征金字塔)模块来加强传统的FPN(特征金字塔模块),更加有效地整合利用多尺度特征。综合起来,本发明可以比较精准的实现对Logo图像的检测,从而获得比较高的识别结果。
实施例2
在该实施例中,公开了一种基于深度学习的两阶段Logo图像检测***,包括:
图像获取模块,用于获取待识别的Logo图像;
图像识别模块,用于将待识别的Logo图像输入训练好的图像检测模型中,获取图像识别结果;
其中,图像检测模型包括特征提取网络、全连接网络和卷积网络,特征提取网络的输出分别输入全连接网络和卷积网络中,进行图像检测。
实施例3
在该实施例中,公开了一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成实施例1公开的一种基于深度学习的两阶段Logo图像检测方法所述的步骤。
实施例4
在该实施例中,公开了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成实施例1公开的一种基于深度学习的两阶段Logo图像检测方法所述的步骤。
以上仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。

Claims (10)

1.一种基于深度学习的两阶段Logo图像检测方法,其特征在于,包括:
获取待识别的Logo图像;
将待识别的Logo图像输入训练好的图像检测模型中,获取图像识别结果;
其中,图像检测模型包括特征提取网络、全连接网络和卷积网络,特征提取网络的输出分别输入全连接网络和卷积网络中,进行图像检测。
2.如权利要求1所述的基于深度学***衡的特征金字塔进行特征增强,获得增强特征图,将增强特征图输入区域生成网络中,输出增强特征图的感兴趣区域。
3.如权利要求2所述的基于深度学***衡的特征金字塔中引入高斯非局部注意力机制。
4.如权利要求2所述的基于深度学习的两阶段Logo图像检测方法,其特征在于,选用残差网络作为特征提取网络的骨干网络。
5.如权利要求1所述的基于深度学习的两阶段Logo图像检测方法,其特征在于,通过全连接网络来检测图像的种类;通过卷积网络对图像进行位置定位。
6.如权利要求1所述的基于深度学习的两阶段Logo图像检测方法,其特征在于,获取Logo图片,对Logo图片中的Logo进行标注,构建数据集;
对数据集进行训练集、验证集和测试集的划分;
通过划分后的数据集对图像检测模型进行训练,获得训练好的图像检测模型。
7.如权利要求6所述的基于深度学习的两阶段Logo图像检测方法,其特征在于,通过网络爬虫技术获取Logo图片;
对获取的Logo图片进行清理;
对清理后的Logo图片进行Logo标注。
8.一种基于深度学习的两阶段Logo图像检测***,其特征在于,包括:
图像获取模块,用于获取待识别的Logo图像;
图像识别模块,用于将待识别的Logo图像输入训练好的图像检测模型中,获取图像识别结果;
其中,图像检测模型包括特征提取网络、全连接网络和卷积网络,特征提取网络的输出分别输入全连接网络和卷积网络中,进行图像检测。
9.一种电子设备,其特征在于,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成权利要求1-7任一项所述的一种基于深度学习的两阶段Logo图像检测方法的步骤。
10.一种计算机可读存储介质,其特征在于,用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1-7任一项所述的一种基于深度学习的两阶段Logo图像检测方法的步骤。
CN202110240268.2A 2021-03-04 2021-03-04 一种基于深度学习的两阶段Logo图像检测方法及*** Pending CN113076972A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202110240268.2A CN113076972A (zh) 2021-03-04 2021-03-04 一种基于深度学习的两阶段Logo图像检测方法及***
ZA2022/02140A ZA202202140B (en) 2021-03-04 2022-02-21 Two-stage logo image detection method and system based on deep learning

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110240268.2A CN113076972A (zh) 2021-03-04 2021-03-04 一种基于深度学习的两阶段Logo图像检测方法及***

Publications (1)

Publication Number Publication Date
CN113076972A true CN113076972A (zh) 2021-07-06

Family

ID=76609910

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110240268.2A Pending CN113076972A (zh) 2021-03-04 2021-03-04 一种基于深度学习的两阶段Logo图像检测方法及***

Country Status (2)

Country Link
CN (1) CN113076972A (zh)
ZA (1) ZA202202140B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114004859A (zh) * 2021-11-26 2022-02-01 山东大学 基于多视图融合网络的超声心动左心房图分割方法及***
CN117557675A (zh) * 2024-01-12 2024-02-13 北京航空航天大学杭州创新研究院 一种深度学习mri图像加速重建方法及***

Citations (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108509839A (zh) * 2018-02-02 2018-09-07 东华大学 一种基于区域卷积神经网络高效的手势检测识别方法
CN109543754A (zh) * 2018-11-23 2019-03-29 中山大学 基于端对端深度学习的目标检测与语义分割的并行方法
CN109614985A (zh) * 2018-11-06 2019-04-12 华南理工大学 一种基于密集连接特征金字塔网络的目标检测方法
CN109800631A (zh) * 2018-12-07 2019-05-24 天津大学 基于掩膜区域卷积神经网络的荧光编码微球图像检测方法
CN110717532A (zh) * 2019-09-27 2020-01-21 广东工业大学 基于SE-RetinaGrasp模型的机器人目标抓取区域实时检测方法
CN110991435A (zh) * 2019-11-27 2020-04-10 南京邮电大学 一种基于深度学习的快递运单关键信息定位方法和装置
CN111210443A (zh) * 2020-01-03 2020-05-29 吉林大学 基于嵌入平衡的可变形卷积混合任务级联语义分割方法
CN111444973A (zh) * 2020-03-31 2020-07-24 西安交通大学 一种无人零售购物台商品检测方法
CN111523545A (zh) * 2020-05-06 2020-08-11 青岛联合创智科技有限公司 一种结合深度信息的物品查找方法
CN111523610A (zh) * 2020-05-06 2020-08-11 青岛联合创智科技有限公司 一种样本高效标注的物品识别方法
CN111626200A (zh) * 2020-05-26 2020-09-04 北京联合大学 一种基于Libra R-CNN的多尺度目标检测网络和交通标识检测方法
CN111735815A (zh) * 2020-06-18 2020-10-02 江苏方天电力技术有限公司 一种输电线路小金具缺陷检测方法、装置及存储介质
CN111814753A (zh) * 2020-08-18 2020-10-23 深延科技(北京)有限公司 针对雾天条件下的目标检测方法和装置
CN112164038A (zh) * 2020-09-16 2021-01-01 上海电力大学 一种基于深度卷积神经网络的光伏热斑检测方法
CN112215217A (zh) * 2020-12-03 2021-01-12 印迹信息科技(北京)有限公司 模拟医师阅片的数字图像识别方法及装置
CN112270280A (zh) * 2020-11-02 2021-01-26 重庆邮电大学 一种基于深度学习的遥感图像中的露天矿场检测方法
CN112308822A (zh) * 2020-10-10 2021-02-02 杭州电子科技大学 基于深度卷积神经网络的椎间盘ct图像检测方法
CN112330651A (zh) * 2020-11-13 2021-02-05 山东师范大学 一种基于深度学习的Logo检测方法及***
CN112418296A (zh) * 2020-11-18 2021-02-26 中国科学院上海微***与信息技术研究所 基于人眼视觉注意机制的仿生双眼目标识别与跟踪方法

Patent Citations (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108509839A (zh) * 2018-02-02 2018-09-07 东华大学 一种基于区域卷积神经网络高效的手势检测识别方法
CN109614985A (zh) * 2018-11-06 2019-04-12 华南理工大学 一种基于密集连接特征金字塔网络的目标检测方法
CN109543754A (zh) * 2018-11-23 2019-03-29 中山大学 基于端对端深度学习的目标检测与语义分割的并行方法
CN109800631A (zh) * 2018-12-07 2019-05-24 天津大学 基于掩膜区域卷积神经网络的荧光编码微球图像检测方法
CN110717532A (zh) * 2019-09-27 2020-01-21 广东工业大学 基于SE-RetinaGrasp模型的机器人目标抓取区域实时检测方法
CN110991435A (zh) * 2019-11-27 2020-04-10 南京邮电大学 一种基于深度学习的快递运单关键信息定位方法和装置
CN111210443A (zh) * 2020-01-03 2020-05-29 吉林大学 基于嵌入平衡的可变形卷积混合任务级联语义分割方法
CN111444973A (zh) * 2020-03-31 2020-07-24 西安交通大学 一种无人零售购物台商品检测方法
CN111523545A (zh) * 2020-05-06 2020-08-11 青岛联合创智科技有限公司 一种结合深度信息的物品查找方法
CN111523610A (zh) * 2020-05-06 2020-08-11 青岛联合创智科技有限公司 一种样本高效标注的物品识别方法
CN111626200A (zh) * 2020-05-26 2020-09-04 北京联合大学 一种基于Libra R-CNN的多尺度目标检测网络和交通标识检测方法
CN111735815A (zh) * 2020-06-18 2020-10-02 江苏方天电力技术有限公司 一种输电线路小金具缺陷检测方法、装置及存储介质
CN111814753A (zh) * 2020-08-18 2020-10-23 深延科技(北京)有限公司 针对雾天条件下的目标检测方法和装置
CN112164038A (zh) * 2020-09-16 2021-01-01 上海电力大学 一种基于深度卷积神经网络的光伏热斑检测方法
CN112308822A (zh) * 2020-10-10 2021-02-02 杭州电子科技大学 基于深度卷积神经网络的椎间盘ct图像检测方法
CN112270280A (zh) * 2020-11-02 2021-01-26 重庆邮电大学 一种基于深度学习的遥感图像中的露天矿场检测方法
CN112330651A (zh) * 2020-11-13 2021-02-05 山东师范大学 一种基于深度学习的Logo检测方法及***
CN112418296A (zh) * 2020-11-18 2021-02-26 中国科学院上海微***与信息技术研究所 基于人眼视觉注意机制的仿生双眼目标识别与跟踪方法
CN112215217A (zh) * 2020-12-03 2021-01-12 印迹信息科技(北京)有限公司 模拟医师阅片的数字图像识别方法及装置

Non-Patent Citations (20)

* Cited by examiner, † Cited by third party
Title
CHENCHEN ZHU等: "Soft Anchor-Point Object Detection", 《ARXIV:1911.12448V2 [CS.CV] 》 *
CHENCHEN ZHU等: "Soft Anchor-Point Object Detection", 《ARXIV:1911.12448V2 [CS.CV] 》, 7 July 2020 (2020-07-07), pages 1 - 20 *
FORREST N. IANDOLA等: "DeepLogo: Hitting Logo Recognition with the Deep Neural Network Hammer", 《ARXIV:1510.02131V1》 *
FORREST N. IANDOLA等: "DeepLogo: Hitting Logo Recognition with the Deep Neural Network Hammer", 《ARXIV:1510.02131V1》, 7 November 2015 (2015-11-07), pages 1 - 12 *
HAOQIN JI等: "Backbone Based Feature Enhancement for Object Detection", 《ASIAN CONFERENCE ON COMPUTER VISION》 *
HAOQIN JI等: "Backbone Based Feature Enhancement for Object Detection", 《ASIAN CONFERENCE ON COMPUTER VISION》, 25 February 2021 (2021-02-25), pages 1 - 15 *
JIANGMIAO PANG等: "Libra R-CNN: Towards Balanced Learning for Object Detection", 《2019 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR)》 *
JIANGMIAO PANG等: "Libra R-CNN: Towards Balanced Learning for Object Detection", 《2019 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR)》, 9 January 2020 (2020-01-09), pages 821 - 830 *
JIANGQIAO YAN等: "FAS-Net: Construct Effective Features Adaptively for Multi-Scale Object Detection", 《THE THIRTY-FOURTH AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE (AAAI-20)》 *
JIANGQIAO YAN等: "FAS-Net: Construct Effective Features Adaptively for Multi-Scale Object Detection", 《THE THIRTY-FOURTH AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE (AAAI-20)》, 31 December 2020 (2020-12-31), pages 12573 - 12580 *
JING WANG等: "Logo-2K+: A Large-Scale Logo Dataset for Scalable Logo Classification", 《ARXIV:1911.07924V1 [CS.CV]》 *
JING WANG等: "Logo-2K+: A Large-Scale Logo Dataset for Scalable Logo Classification", 《ARXIV:1911.07924V1 [CS.CV]》, 11 November 2019 (2019-11-11), pages 1 - 9 *
JING WANG等: "LogoDet-3K: A Large-Scale Image Dataset for Logo Detection", 《ARXIV:2008.05359V1 [CS.CV]》 *
JING WANG等: "LogoDet-3K: A Large-Scale Image Dataset for Logo Detection", 《ARXIV:2008.05359V1 [CS.CV]》, 12 August 2020 (2020-08-12), pages 1 - 11 *
LIFU CHEN等: "A New Deep Learning Network for Automatic Bridge Detection from SAR Images Based on Balanced and Attention Mechanism", 《REMOTE SENSING》 *
LIFU CHEN等: "A New Deep Learning Network for Automatic Bridge Detection from SAR Images Based on Balanced and Attention Mechanism", 《REMOTE SENSING》, 31 January 2020 (2020-01-31), pages 1 - 19 *
SHAOQING REN等: "Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks", 《ARXIV》, pages 1 - 14 *
SUJUAN HOU等: "Deep Hierarchical Representation from Classifying Logo-405", 《HINDAWI》 *
SUJUAN HOU等: "Deep Hierarchical Representation from Classifying Logo-405", 《HINDAWI》, 10 October 2017 (2017-10-10), pages 1 - 12 *
XIAOLONG WANG等: "Non-local Neural Networks", 《ARXIV》, pages 1 - 10 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114004859A (zh) * 2021-11-26 2022-02-01 山东大学 基于多视图融合网络的超声心动左心房图分割方法及***
CN117557675A (zh) * 2024-01-12 2024-02-13 北京航空航天大学杭州创新研究院 一种深度学习mri图像加速重建方法及***
CN117557675B (zh) * 2024-01-12 2024-04-30 北京航空航天大学杭州创新研究院 一种深度学习mri图像加速重建方法及***

Also Published As

Publication number Publication date
ZA202202140B (en) 2022-05-25

Similar Documents

Publication Publication Date Title
EP3866026A1 (en) Theme classification method and apparatus based on multimodality, and storage medium
CN109284733B (zh) 一种基于yolo和多任务卷积神经网络的导购消极行为监控方法
CN104063712B (zh) 一种车辆信息提取方法和***
US20170109615A1 (en) Systems and Methods for Automatically Classifying Businesses from Images
CN104715023A (zh) 基于视频内容的商品推荐方法和***
WO2012071696A1 (zh) 基于用户兴趣学习的个性化广告推送方法与***
CN105808610A (zh) 一种互联网图片过滤方法及装置
US11966829B2 (en) Convolutional artificial neural network based recognition system in which registration, search, and reproduction of image and video are divided between and performed by mobile device and server
CN110737785B (zh) 一种图片标注的方法及装置
CN113076972A (zh) 一种基于深度学习的两阶段Logo图像检测方法及***
CN114821665A (zh) 一种基于卷积神经网络的城市人流小目标检测方法
CN113221770B (zh) 基于多特征混合学习的跨域行人重识别方法及***
CN111259823A (zh) 一种基于卷积神经网络的色情图像识别方法
CN113052039A (zh) 一种交通路网行人密度检测的方法、***及服务器
CN110413825B (zh) 面向时尚电商的街拍推荐***
CN113762257B (zh) 一种美妆品牌图像中标志的识别方法及装置
Lin et al. An analysis of English classroom behavior by intelligent image recognition in IoT
CN113255787B (zh) 一种基于语义特征和度量学习的小样本目标检测方法及***
CN111582057B (zh) 一种基于局部感受野的人脸验证方法
He et al. Variable scale learning for visual object tracking
CN110781817B (zh) 一种解决部件不对齐的行人再识别方法
CN116958740A (zh) 基于语义感知和自适应对比学习的零样本目标检测方法
CN116383517A (zh) 动态传播特征增强的多模态谣言检测方法及***
CN114882372A (zh) 一种目标检测的方法及设备
CN114743045A (zh) 一种基于双分支区域建议网络的小样本目标检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination