CN111414910B - 基于双重卷积神经网络的小目标增强检测方法和装置 - Google Patents

基于双重卷积神经网络的小目标增强检测方法和装置 Download PDF

Info

Publication number
CN111414910B
CN111414910B CN202010193865.XA CN202010193865A CN111414910B CN 111414910 B CN111414910 B CN 111414910B CN 202010193865 A CN202010193865 A CN 202010193865A CN 111414910 B CN111414910 B CN 111414910B
Authority
CN
China
Prior art keywords
target
neural network
detection
confidence threshold
deconvolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010193865.XA
Other languages
English (en)
Other versions
CN111414910A (zh
Inventor
李华伟
王斯建
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiawo Photoelectric Technology Co ltd
Original Assignee
Shanghai Jiawo Photoelectric Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiawo Photoelectric Technology Co ltd filed Critical Shanghai Jiawo Photoelectric Technology Co ltd
Priority to CN202010193865.XA priority Critical patent/CN111414910B/zh
Publication of CN111414910A publication Critical patent/CN111414910A/zh
Application granted granted Critical
Publication of CN111414910B publication Critical patent/CN111414910B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

一种基于双重卷积神经网络的小目标增强检测方法,既能提升检测准确性,又能保持与通用检测模型相近的检测速度。检测方法级联双重卷积神经网络,第一重卷积神经网络采用兼顾目标定位和目标识别功能的MobileNet‑SSD网络,并以较低的置信度阈值筛选出候选目标,较低的阈值可以确保小目标不漏检;第二重卷积神经网络根据第一轮检测得到候选目标区域,逐个截取图片子块,采用只含目标识别功能的MobileNet网络,并以较高的置信度阈值筛选出目标,较高的阈值可以确保小目标不错检。通过本发明提出的两轮增强检测方法,可以提升小目标的检测准确性,降低目标错检率和漏检率。

Description

基于双重卷积神经网络的小目标增强检测方法和装置
技术领域
本发明涉及目标检测技术领域,具体涉及一种基于双重卷积神经网络的小目标增强检测方法和装置。
背景技术
目标检测是计算机视觉的一项基础技术,该技术在给定的一副图像中,实现对目标所在区域的定位并识别出目标的类别信息。在实际图像中,目标的尺寸变化范围很大,摆放目标的角度、姿态、在图像中的位置都不一样,目标之间可能还有重叠现象,这使得目标检测的难度变得很大。目前学术和工业界出现的目标检测算法主要分成两类:
传统基于人工规则提取特征的方法,采用基于滑动窗口的区域选择策略,采用HOG算子提取目标特征向量,典型算法是:级联Cascade+HOG+Haar/SVM以及上述方法的诸多改进、优化。其主要问题:基于滑动窗口的区域选择策略没有针对性,时间复杂度高,窗口冗余;手工设计的特征对于多样性的变化没有很好的鲁棒性。
近年基于卷积神经网络自动提取特征的方法,其中又经历了两个阶段发展。第一阶段是候选区域+深度学习分类的两步法,通过提取候选区域,并对相应区域进行以深度学习方法为主的分类的方案,如:R-CNN、Fast R-CNN、Faster R-CNN等系列方法。R-CNN方法有效地改善了传统方法的两个问题;卷积神经网络CNN方法,替代手工特征,提升了算法的鲁棒性。Faster R-CNN虽然速度有所改进,但是速度上并不能满足实时的要求,而且需要训练多个神经网络模型。于是,卷积神经网络发展到一个全新的阶段,第二个阶段是基于深度学习回归的一步法,这类算法不需要单独提取候选区域,而是把区域的识别也放到深度学习中,实现了端到端的目标检测,如:YOLO/SSD/MobileNet-SSD等方法。其中,MobileNet-SSD把SSD的前端VGG特征提取网络替换为MobileNet,MobileNet是Google提出的适用于手机端目标识别的卷积神经网络模型。
小目标检测在深度学习卷积神经网络模型中一直是一个难题。目标检测算法从传统到深度学习经历了一系列的改进,在目标检测准确性和实时性取得了长足的发展,但仍然存在小目标识别准确性差的问题。小目标有两种定义方式,一种是相对尺寸大小,如目标尺寸的长宽是原图像尺寸的0.1,即可认为是小目标,另外一种是绝对尺寸的定义,即尺寸小于32*32像素的目标即可认为是小目标,本发明采用第一种定义。早期的小目标检测方法大多数是基于通用的面向常规中大型目标的方法,如经典的单步方法SSD,两步法FasterR-CNN等,这些方法主要是针对通用目标数据集来设计的解决方案,擅长检测中大型目标,因此对于图像中的小目标来说,检测效果不是很理想。
近年提出了利用多层特征图的第二种方法,对小目标检测的效果产生了显著的提升,多层特征图方法分为以下3类:特征金字塔、RNN思想、逐层预测。特征金字塔:参考多尺度特征图的特征信息,同时兼顾了较强的语义特征和位置特征。该方法的优势在于,多尺度特征图是卷积神经网络中固有的过渡模块,堆叠多尺度特征图对于算法复杂度的增加微乎其微。逐层预测:该方法对于卷积神经网络的每层特征图输出进行一次预测,最后综合考量得出结果。同样,该方法也需要极高的硬件性能。RNN思想:参考了RNN算法中的门限机制、长短期记忆等,同时记录多层次的特征信息。但RNN固有的缺陷是训练速度较慢。
上述两大类现有技术中,第一类采用MobileNet-SSD等面向常规中大型目标的通用检测模型,存在小目标检测准确性低,容易导致错检或漏检的问题。第二类采用多层特征图的方法,因为增加了特征图,大大增加了训练和推理时间,影响算法的实时性。
发明内容
本发明提供了一种基于双重卷积神经网络的小目标增强检测方法和装置,解决了上述技术问题,既能提升检测准确性,又能保持与通用检测模型相近的检测速度。
本发明提供的一种基于双重卷积神经网络的小目标增强检测方法,具体技术方案包括以下步骤:
第一重卷积神经网络采用兼顾目标定位和目标识别功能的缩小版MobileNet-SSD检测网络;
第一重卷积神经网络检测结果以较低的置信度阈值(0.01-0.1)筛选出候选目标区域,较低的阈值可以确保小目标不漏检;
根据第一重卷积神经网络得到候选目标区域,逐个截取目标图片子块,从而提升目标像素占比,把小目标变成像素占比较高的目标,图片子块送入第二重卷积神经网络;
第二重卷积神经网络采用只含目标识别功能的缩小版MobileNet识别网络;
第二重卷积神经网络以较高的置信度阈值(0.85-0.95)筛选出目标,较高的阈值可以确保小目标不错检。
本发明的有益效果在于,采用双重卷积神经网络进行目标检测,相对于网络缩小因子a默认为1.0的标准版MobileNet-SSD网络,不降低检测速度的同时,提升了小目标的检测准确率,以Pascal VOC数据集中的类别bottle为例,AP提升40%。
附图说明
图1为本发明基于双重卷积神经网络的小目标增强检测方法流程图。
具体实施方式
下文中,结合附图和实施例对本发明作进一步阐述。
本实施例提供的一种基于双重卷积神经网络的小目标增强检测方法,将待检测图片送入双重卷积神经网络,最终得到目标列表,包括目标位置和类别。本发明流程如图1所示,具体实现步骤如下:
本发明双重卷积神经网络包括第一重卷积神经网络和第二重卷积神经网络,第一重卷积神经网络采用兼顾目标定位和目标识别功能的缩小版MobileNet-SSD检测网络,即网络缩小因子a从标准版MobileNet-SSD的1.0降低为0.5,缩小版检测网络的检测时间是基准检测网络的1/4;
待测图片送入第一重卷积神经网络执行推理过程,第一重卷积神经网络输出检测的结果,在结果队列中,检测目标按置信度概率值从高到低排序,以较低的置信度阈值(0.1)筛选出候选目标;
根据第一重卷积神经网络得到候选目标区域,逐个截取目标图片子块,从而提升目标像素占比,把像素占比较小(<1%)的小目标变成像素占比较高(>50%)的大目标,图片子块送入第二重卷积神经网络;
第二重卷积神经网络采用只含目标识别功能的MobileNet识别网络,识别网络的计算时间是基准检测网络1/8,假设第二重卷积神经网络识别4个目标,识别计算时间1/2。
将目标像素占比较高的图像子块逐个送入第二重卷积神经网络执行推理过程,得到按置信度概率值从高到低排序的目标队列,以较高的置信度阈值(0.85-0.95)筛选出目标,即如果目标队列某个目标的置信度高于阈值,则图像子块确认是目标;否则不是目标。
双重卷积神经网络总共计算时间占基准检测网络的3/4(1/4+1/2),以上第二重卷积网络采用网络缩小因子为1.0的标准版MobileNet,如果第二重卷积网络也采用缩小版MobileNet,比如网络缩小因子设为0.5,可以进一步提升识别目标的数量。
本发明实施例采用双重卷积神经网络进行目标检测,相对于网络缩小因子a默认为1.0的MobileNet-SSD网络,不降低检测速度的同时,提升了小目标的检测准确率,以Pascal VOC数据集中的类别bottle为例,测试集所有样本的平均精度(AP)值提升40%。
本实施例还提供了一种基于双重卷积神经网络的小目标增强检测装置,检测装置包括:包括第一重卷积神经网络单元和第二重卷积神经网络单元。
第一重卷积神经网络单元采用兼顾目标定位和目标识别功能的缩小版MobileNet-SSD检测网络,筛选出候选目标区域,通过对筛选出的候选目标区域逐个截取目标图片子块,从而提升目标像素占比,形成高像素占比目标图片子块,将高像素占比目标图片子块送入第二重卷积神经网络单元;
第二重卷积神经网络单元采用只含目标识别功能的缩小版MobileNet识别网络,对高像素占比目标图片进行目标识别,筛选出目标。
较佳地,所述第一重卷积神经网络单元通过设置低置信度阈值筛选出候选目标区域,所述低置信度阈值的范围为0.01-0.1。
较佳地,所述第二重卷积神经网络单元通过设置高置信度阈值筛选出目标,所述高置信度阈值的范围为0.85-0.95。
在本申请所提供的几个实施例中,应该理解到,所揭露的***,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random AccessMemory)、电载波信号、电信信号以及软件分发介质等。
一种存储器,存储器存储有计算机程序,计算机程序执行如下步骤:
第一重卷积神经网络采用兼顾目标定位和目标识别功能的缩小版MobileNet-SSD检测网络,第一重卷积神经网络通过设置低置信度阈值筛选出候选目标区域;
根据第一重卷积神经网络筛选出的候选目标区域,逐个截取目标图片子块,从而提升目标像素占比,形成高像素占比目标图片子块,将高像素占比目标图片子块送入第二重卷积神经网络;
第二重卷积神经网络采用只含目标识别功能的缩小版MobileNet识别网络,对高像素占比目标图片进行目标识别,通过设置高置信度阈值筛选出目标。
本发明虽然已以较佳实施例公开如上,但其并不是用来限定本发明,任何本领域技术人员在不脱离本发明的精神和范围内,都可以利用上述揭示的方法和技术内容对本发明技术方案做出可能的变动和修改,因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化及修饰,均属于本发明技术方案的保护范围。

Claims (10)

1.一种基于双重卷积神经网络的小目标增强检测方法,其特征在于,所述方法包括以下步骤:
第一重卷积神经网络采用兼顾目标定位和目标识别功能的缩小版MobileNet-SSD检测网络,第一重卷积神经网络通过设置低置信度阈值筛选出候选目标区域;
根据第一重卷积神经网络筛选出的候选目标区域,逐个截取目标图片子块,从而提升目标像素占比,形成高像素占比目标图片子块,将高像素占比目标图片子块送入第二重卷积神经网络;
第二重卷积神经网络采用只含目标识别功能的缩小版MobileNet识别网络,对高像素占比目标图片进行目标识别,通过设置高置信度阈值筛选出目标。
2.如权利要求1所述的一种基于双重卷积神经网络的小目标增强检测方法,其特征在于,第一重卷积神经网络设置的低置信度阈值的范围为0.01-0.1。
3.如权利要求2所述的一种基于双重卷积神经网络的小目标增强检测方法,其特征在于,第二重卷积神经网络设置的高置信度阈值的范围为0.85-0.95。
4.如权利要求3所述的一种基于双重卷积神经网络的小目标增强检测方法,其特征在于,第二重卷积神经网络筛选出的目标包括目标位置和目标类别。
5.如权利要求4所述的一种基于双重卷积神经网络的小目标增强检测方法,其特征在于,缩小版MobileNet-SSD检测网络的网络缩小因子a设为0.5。
6.如权利要求5所述的一种基于双重卷积神经网络的小目标增强检测方法,其特征在于,第一重卷积神经网络设置的低置信度阈值为0.1。
7.一种基于双重卷积神经网络的小目标增强检测装置,其特征在于,所述检测装置包括第一重卷积神经网络单元和第二重卷积神经网络单元;
第一重卷积神经网络单元采用兼顾目标定位和目标识别功能的缩小版MobileNet-SSD检测网络,筛选出候选目标区域,通过对筛选出的候选目标区域逐个截取目标图片子块,从而提升目标像素占比,形成高像素占比目标图片子块,将高像素占比目标图片子块送入第二重卷积神经网络单元;
第二重卷积神经网络单元采用只含目标识别功能的缩小版MobileNet识别网络,对高像素占比目标图片进行目标识别,筛选出目标。
8.如权利要求7所述的一种基于双重卷积神经网络的小目标增强检测装置,其特征在于,所述第一重卷积神经网络单元通过设置低置信度阈值筛选出候选目标区域,所述低置信度阈值的范围为0.01-0.1。
9.如权利要求8所述的一种基于双重卷积神经网络的小目标增强检测装置,其特征在于,所述第二重卷积神经网络单元通过设置高置信度阈值筛选出目标,所述高置信度阈值的范围为0.85-0.95。
10.一种存储器,所述存储器存储有计算机程序,其特征在于,所述计算机程序执行如下步骤:
第一重卷积神经网络采用兼顾目标定位和目标识别功能的缩小版MobileNet-SSD检测网络,第一重卷积神经网络通过设置低置信度阈值筛选出候选目标区域;
根据第一重卷积神经网络筛选出的候选目标区域,逐个截取目标图片子块,从而提升目标像素占比,形成高像素占比目标图片子块,将高像素占比目标图片子块送入第二重卷积神经网络;
第二重卷积神经网络采用只含目标识别功能的缩小版MobileNet识别网络,对高像素占比目标图片进行目标识别,通过设置高置信度阈值筛选出目标。
CN202010193865.XA 2020-03-18 2020-03-18 基于双重卷积神经网络的小目标增强检测方法和装置 Active CN111414910B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010193865.XA CN111414910B (zh) 2020-03-18 2020-03-18 基于双重卷积神经网络的小目标增强检测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010193865.XA CN111414910B (zh) 2020-03-18 2020-03-18 基于双重卷积神经网络的小目标增强检测方法和装置

Publications (2)

Publication Number Publication Date
CN111414910A CN111414910A (zh) 2020-07-14
CN111414910B true CN111414910B (zh) 2023-05-02

Family

ID=71493011

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010193865.XA Active CN111414910B (zh) 2020-03-18 2020-03-18 基于双重卷积神经网络的小目标增强检测方法和装置

Country Status (1)

Country Link
CN (1) CN111414910B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112634201B (zh) * 2020-12-02 2023-12-05 歌尔股份有限公司 目标检测方法、装置和电子设备
CN112966609B (zh) * 2021-03-05 2023-08-11 北京百度网讯科技有限公司 目标检测方法及装置
CN113327253B (zh) * 2021-05-24 2024-05-24 北京市遥感信息研究所 一种基于星载红外遥感影像的弱小目标检测方法
CN115501050A (zh) * 2022-10-31 2022-12-23 江苏理工学院 一种基于计算机视觉的轮椅用户健康监测***及其检测网络的训练方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013113101A1 (en) * 2012-02-02 2013-08-08 Smart Technologies Ulc Interactive input system and method of detecting objects
CN103971127A (zh) * 2014-05-16 2014-08-06 华中科技大学 一种前视雷达成像海面目标关键点检测识别方法
CN107451602A (zh) * 2017-07-06 2017-12-08 浙江工业大学 一种基于深度学习的果蔬检测方法
CN110009679A (zh) * 2019-02-28 2019-07-12 江南大学 一种基于多尺度特征卷积神经网络的目标定位方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8229163B2 (en) * 2007-08-22 2012-07-24 American Gnc Corporation 4D GIS based virtual reality for moving target prediction

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013113101A1 (en) * 2012-02-02 2013-08-08 Smart Technologies Ulc Interactive input system and method of detecting objects
CN103971127A (zh) * 2014-05-16 2014-08-06 华中科技大学 一种前视雷达成像海面目标关键点检测识别方法
CN107451602A (zh) * 2017-07-06 2017-12-08 浙江工业大学 一种基于深度学习的果蔬检测方法
CN110009679A (zh) * 2019-02-28 2019-07-12 江南大学 一种基于多尺度特征卷积神经网络的目标定位方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
姚群力 ; 胡显 ; 雷宏 ; .深度卷积神经网络在目标检测中的研究进展.计算机工程与应用.2018,(17),全文. *
段仲静 ; 李少波 ; 胡建军 ; 杨静 ; 王铮 ; .深度学习目标检测方法及其主流框架综述.激光与光电子学进展.(12),全文. *
熊丽婷 ; 张青苗 ; 沈克永 ; .基于搜索区域条件概率CNN的精确目标探测方法.计算机工程与应用.2017,(20),全文. *
王志 ; 陈平 ; 潘晋孝 ; .基于深度学习的复杂背景下目标检测.重庆理工大学学报(自然科学).2018,(04),全文. *

Also Published As

Publication number Publication date
CN111414910A (zh) 2020-07-14

Similar Documents

Publication Publication Date Title
CN111414910B (zh) 基于双重卷积神经网络的小目标增强检测方法和装置
CN109977943B (zh) 一种基于yolo的图像目标识别方法、***和存储介质
CN109035304B (zh) 目标跟踪方法、介质、计算设备和装置
EP3493101B1 (en) Image recognition method, terminal, and nonvolatile storage medium
CN111488791A (zh) 将指尖运动模式实时地设备上分类为手势
CN107729809B (zh) 一种自适应生成视频摘要的方法、装置及其可读存储介质
CN110765860A (zh) 摔倒判定方法、装置、计算机设备及存储介质
EP3203417B1 (en) Method for detecting texts included in an image and apparatus using the same
CN111368636B (zh) 目标分类方法、装置、计算机设备和存储介质
KR20180065889A (ko) 타겟의 검측 방법 및 장치
US20240078680A1 (en) Image segmentation method, network training method, electronic equipment and storage medium
WO2024001123A1 (zh) 基于神经网络模型的图像识别方法、装置及终端设备
CN115410030A (zh) 目标检测方法、装置、计算机设备及存储介质
CN111444976A (zh) 目标检测方法、装置、电子设备和可读存储介质
CN111126401A (zh) 一种基于上下文信息的车牌字符识别方法
CN108830377B (zh) 一种神经网络电路及其自循环多级迭代方法
CN112396035A (zh) 基于注意力检测模型的物体检测方法和装置
CN113903036A (zh) 一种文本识别方法、装置、电子设备、介质及产品
JP2024508867A (ja) 画像クラスタリング方法、装置、コンピュータ機器及びコンピュータプログラム
CN110516731B (zh) 一种基于深度学习的视觉里程计特征点检测方法及***
CN114170269B (zh) 一种基于时空相关性的多目标跟踪方法、设备及存储介质
CN113283351B (zh) 一种使用cnn优化相似度矩阵的视频抄袭检测方法
WO2015031350A1 (en) Systems and methods for memory utilization for object detection
CN109977738B (zh) 一种视频场景分割判断方法、智能终端及存储介质
CN112861803A (zh) 一种图像识别方法、装置、服务器以及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant