CN112949767B - 样本图像增量、图像检测模型训练及图像检测方法 - Google Patents
样本图像增量、图像检测模型训练及图像检测方法 Download PDFInfo
- Publication number
- CN112949767B CN112949767B CN202110371342.4A CN202110371342A CN112949767B CN 112949767 B CN112949767 B CN 112949767B CN 202110371342 A CN202110371342 A CN 202110371342A CN 112949767 B CN112949767 B CN 112949767B
- Authority
- CN
- China
- Prior art keywords
- image
- candidate region
- loss value
- probability
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 100
- 238000012549 training Methods 0.000 title claims abstract description 47
- 238000012545 processing Methods 0.000 claims abstract description 85
- 238000000034 method Methods 0.000 claims abstract description 65
- 238000013507 mapping Methods 0.000 claims abstract description 16
- 239000002131 composite material Substances 0.000 claims description 5
- 238000004590 computer program Methods 0.000 abstract description 14
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 238000013135 deep learning Methods 0.000 abstract description 2
- 238000007689 inspection Methods 0.000 abstract description 2
- 238000004891 communication Methods 0.000 description 11
- 230000000694 effects Effects 0.000 description 11
- 230000008569 process Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000000605 extraction Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 238000009499 grossing Methods 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 239000005337 ground glass Substances 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000007769 metal material Substances 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/60—Image enhancement or restoration using machine learning, e.g. neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/73—Deblurring; Sharpening
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20076—Probabilistic image processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30108—Industrial image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30168—Image quality inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本公开提供了一种样本图像增量方法、图像检测模型训练方法、图像检测方法,以及对应的装置、电子设备、计算机可读存储介质及计算机程序产品,涉及计算机视觉和深度学习等人工智能领域,可应用于智能云和工业质检场景下。一具体实施方式包括:获取原始样本图像的第一卷积特征;根据区域生成网络和第一卷积特征确定候选区域、候选区域中包含目标对象的第一概率;基于第一概率在候选区域中确定目标候选区域,并将目标候选区域映射回原始样本图像,得到中间图像;对中间图像中对应目标候选区域的部分进行图像增强处理和/或对中间图像中对应非目标候选区域的部分进行图像模糊处理,得到增量样本图像。应用该实施方式生成的增量样本图像可用性更高。
Description
技术领域
本公开涉及为人工智能领域,具体涉及计算机视觉和深度学习技术,可应用于智能云和工业质检场景下,尤其涉及一种样本图像增量方法、图像检测模型训练方法、图像检测方法,以及对应的装置、电子设备、计算机可读存储介质及计算机程序产品。
背景技术
在目标检测领域中,机器学习算法往往需要通过对大量已标注的训练样本进行学习,从而利用训练好的模型对实际样本进行目标检测。
在部分技术领域下,由于目标物体数量稀少或者获得难度极高,很难收集到足够的训练样本,也就无法保证训练出的模型的识别能力。
现有技术通常通过对样本图像进行旋转等变换方式、基于生成对抗网络或迁移学习的方式来实现小样本的样本增量。
发明内容
本公开实施例提出了一种样本图像增量方法、图像检测模型训练方法、图像检测方法,以及对应的装置、电子设备、计算机可读存储介质及计算机程序产品。
第一方面,本公开实施例提出了一种样本图像增量方法,包括:获取原始样本图像的第一卷积特征;根据区域生成网络和第一卷积特征确定候选区域、候选区域中包含目标对象的第一概率;基于第一概率在候选区域中确定目标候选区域,并将目标候选区域映射回原始样本图像,得到中间图像;对中间图像中对应目标候选区域的部分进行图像增强处理和/或对中间图像中对应非目标候选区域的部分进行图像模糊处理,得到增量样本图像。
第二方面,本公开实施例提出了一种样本图像增量装置,包括:第一卷积特征获取单元,被配置成获取原始样本图像的第一卷积特征;候选区域及概率确定单元,被配置成根据区域生成网络和第一卷积特征确定候选区域、候选区域中包含目标对象的第一概率;目标候选区域确定及映射单元,被配置成基于第一概率在候选区域中确定目标候选区域,并将目标候选区域映射回原始样本图像,得到中间图像;中间图像处理单元,被配置成对中间图像中对应目标候选区域的部分进行图像增强处理和/或对中间图像中对应非目标候选区域的部分进行图像模糊处理,得到增量样本图像。
第三方面,本公开实施例提出了一种图像检测模型训练方法,包括:获取增量样本图像的第二卷积特征;其中,增量样本图像通过如第一方面中的任一实现方式得到;根据区域生成网络和第二卷积特征确定新候选区域、新候选区域包含目标对象的第二概率;获取对应第一概率的第一损失值,以及对应第二概率的第二损失值;基于加权后的第一损失值和第二损失值,确定综合损失值;基于综合损失值满足预设要求,得到训练完成的图像检测模型。
第四方面,本公开实施例提出了一种图像检测模型训练装置,包括:第二卷积特征获取单元,被配置成获取增量样本图像的第二卷积特征;其中,增量样本图像通过如第二方面中的任一实现方式得到;新候选区域及概率确定单元,被配置成根据区域生成网络和第二卷积特征确定新候选区域、新候选区域包含目标对象的第二概率;损失值获取单元,被配置成获取对应第一概率的第一损失值,以及对应第二概率的第二损失值;综合损失值确定单元,被配置成基于加权后的第一损失值和第二损失值,确定综合损失值;图像检测模型训练单元,被配置成基于综合损失值满足预设要求,得到训练完成的图像检测模型。
第五方面,本公开实施例提供了一种图像检测方法,包括:接收待检测图像;调用图像检测模型对待检测图像进行检测;其中,图像检测模型通过如第三方面中的任一实现方式得到。
第六方面,本公开实施例提供了一种图像检测装置,包括:待检测图像接收单元,被配置成接收待检测图像;图像检测单元,被配置成调用图像检测模型对待检测图像进行检测;其中,图像检测模型通过如第四方面中的任一实现方式得到。
第七方面,本公开实施例提供了一种电子设备,该电子设备包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,该指令被至少一个处理器执行,以使至少一个处理器执行时能够实现如第一方面中任一实现方式描述的样本图像增量方法和/或第三方面任一实现方式描述的图像检测模型训练方法和/或第五方面任一实现方式描述的图像检测方法。
第八方面,本公开实施例提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行时能够实现如第一方面中任一实现方式描述的样本图像增量方法和/或第三方面任一实现方式描述的图像检测模型训练方法和/或第五方面任一实现方式描述的图像检测方法。
第九方面,本公开实施例提供了一种包括计算机程序的计算机程序产品,该计算机程序在被处理器执行时能够实现如第一方面中任一实现方式描述的样本图像增量方法和/或第三方面任一实现方式描述的图像检测模型训练方法和/或第五方面任一实现方式描述的图像检测方法。
本公开实施例提供的样本图像增量方法、图像检测模型训练方法、图像检测方法,以及对应的装置、电子设备、计算机可读存储介质及计算机程序产品,首先,获取原始样本图像的第一卷积特征;然后,根据区域生成网络和第一卷积特征确定候选区域、候选区域中包含目标对象的第一概率;接下来,基于第一概率在候选区域中确定目标候选区域,并将目标候选区域映射回原始样本图像,得到中间图像;最后,对中间图像中对应目标候选区域的部分进行图像增强处理和/或对中间图像中对应非目标候选区域的部分进行图像模糊处理,得到增量样本图像。
本公开所提供的技术方案借助区域生成网络来确定可能包含有目标对象的候选区域,然后将其中包含概率较高的作为目标候选区域,通过将其目标候选区域映射回原图,并对原图中对应目标候选区域和/或对应非目标候选区域的部分采用相应的清晰化或模糊化处理方式,进而得到尽可能凸显出目标对象的增量样本图像。通过该技术方案得以在不破坏原始样本图像中关键部分的前提下,生成高可用性的增量样本图像。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本公开的其它特征、目的和优点将会变得更明显:
图1是本公开可以应用于其中的示例性***架构;
图2为本公开实施例提供的一种样本图像增量方法的流程图;
图3为本公开实施例提供的另一种样本图像增量方法的流程图;
图4为本公开实施例提供的一种图像检测模型训练方法的流程图;
图5为本公开实施例提供的在一应用场景下的样本图像增量方法的流程示意图;
图6为本公开实施例提供的一种样本图像增量装置的结构框图;
图7为本公开实施例提供的一种图像检测模型训练装置的结构框图;
图8为本公开实施例提供的一种图像检测装置的结构框图;
图9为本公开实施例提供的一种适用于执行样本图像增量方法和/或图像检测模型训练方法和/或图像检测方法的电子设备的结构示意图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,采取了必要的保密措施,且不违背公序良俗。
首先,图1示出了可以应用本公开的样本图像增量方法、图像检测模型训练方法、图像检测方法,以及对应的装置、电子设备及计算机可读存储介质的实施例的示例性***架构100。
如图1所示,***架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103和服务器105上可以安装有各种用于实现两者之间进行信息通讯的应用,例如图像传输类应用、样本图像增量类应用、目标检测模型训练类应用等。
终端设备101、102、103和服务器105可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等;当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中,其可以实现成多个软件或软件模块,也可以实现成单个软件或软件模块,在此不做具体限定。当服务器105为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器;服务器为软件时,可以实现成多个软件或软件模块,也可以实现成单个软件或软件模块,在此不做具体限定。
服务器105通过内置的各种应用可以提供各种服务,以可以提供样本图像增量服务的图像增量类应用为例,服务器105在运行该图像增量类应用时可实现如下效果:首先,通过网络104从终端设备101、102、103中接收原始样本图像,然后通过常规的特征提取网络提取到其第一卷积特征;然后,根据区域生成网络和第一卷积特征确定候选区域、候选区域中包含目标对象的第一概率;接下来,基于第一概率在候选区域中确定目标候选区域,并将目标候选区域映射回原始样本图像,得到中间图像;最后,对中间图像中对应目标候选区域的部分进行图像增强处理和/或对中间图像中对应非目标候选区域的部分进行图像模糊处理,得到增量样本图像。
进一步的,服务器105还可以利用生成的增量样本图像训练相应的图像检测模型,例如服务器105在运行模型训练类应用时可实现如下效果:获取增量样本图像的第二卷积特征;根据区域生成网络和第二卷积特征确定新候选区域、新候选区域包含目标对象的第二概率;获取对应第一概率的第一损失值,以及对应第二概率的第二损失值;基于加权后的第一损失值和第二损失值,确定综合损失值;基于综合损失值满足预设要求,得到训练完成的图像检测模型。
更进一步的,在服务器105按照上述训练方式得到训练完成的图像检测模型后,还可以对外提供基于图像检测模型的图像检测服务,即通过调用该图像检测模型对待检测图像进行检测,并返回检测结果。
需要指出的是,原始样本图像除可以从终端设备101、102、103通过网络104获取到之外,也可以通过各种方式预先存储在服务器105本地。因此,当服务器105检测到本地已经存储有这些数据时(例如开始处理之前留存的待处理样本图像增量任务),可选择直接从本地获取这些数据,在此种情况下,示例性***架构100也可以不包括终端设备101、102、103和网络104。进一步的,原始样本图像的第一卷积特征也可以事先经由特征提取网络提取得到,后续将直接获取到成品来使用。
由于进行图像增量需要占用较多的运算资源和较强的运算能力,因此本公开后续各实施例所提供的样本图像增量方法一般由拥有较强运算能力、较多运算资源的服务器105来执行,相应地,样本图像增量装置一般也设置于服务器105中。但同时也需要指出的是,在终端设备101、102、103也具有满足要求的运算能力和运算资源时,终端设备101、102、103也可以通过其上安装的图像增量类应用完成上述本交由服务器105做的各项运算,进而输出与服务器105同样的结果。尤其是在同时存在多种具有不同运算能力的终端设备的情况下,但图像增量类应用判断所在的终端设备拥有较强的运算能力和剩余较多的运算资源时,可以让终端设备来执行上述运算,从而适当减轻服务器105的运算压力,相应的,样本图像增量装置也可以设置于终端设备101、102、103中。在此种情况下,示例性***架构100也可以不包括服务器105和网络104。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
请参考图2,图2为本公开实施例提供的一种样本图像增量方法的流程图,其中流程200包括以下步骤:
步骤201:获取原始样本图像的第一卷积特征;
本步骤旨在由样本图像增量方法的执行主体(例如图1所示的服务器105)获取原始样本图像的第一卷积特征。
其中,第一卷积特征可通过特征提取网络提取自该原始样本图像,特征提取网络的具体类型不做限定。原始样本图像为包含有目标对象的图像,目标对象根据实际需求的不同,可以为小样本场景的各种物体,例如显微镜下的金属材料中的裂隙、处于某种运动状态的微生物等等。
步骤202:根据区域生成网络和第一卷积特征确定候选区域、候选区域中包含目标对象的第一概率;
在步骤201的基础上,本步骤旨在由上述执行主体将第一卷积特征输入区域生成网络,以利用区域生成网络确定疑似包含目标对象的候选区域,以及各候选区域中包含目标对象的第一概率。具体的,该第一概率用于描述所属候选区域确实包含有目标对象的可能性大小,甚至还可以将其量化为概率得分。应当理解的是,候选区域是区域生成网络基于卷积特征(图)确定出的可能包含目标对象的区域,也就是说区域生成网络应当具有识别目标对象的卷积特征的能力。
步骤203:基于第一概率在候选区域中确定目标候选区域,并将目标候选区域映射回原始样本图像,得到中间图像;
在步骤202的基础上,本步骤旨在由上述执行主体根据给候选区域的第一概率,从中将有较大概率包含目标对象的候选区域确定为目标候选区域,并进一步的将目标候选区域映射回原始样本图像,进而得到对疑似存在目标对象进行边界框定的中间图像。
应当理解的是,由于候选区域是基于原始样本图像中提取出的卷积特征(图)确定出的,因此候选区域是卷积特征图上的区域,并不直接是原始样本图像上的区域,但可以借助卷积特征与原始样本图像之间的对应关系,将目标候选区域映射回原始样本图像上,从而在原始样本图像上框定目标对象的存在边界。但应当理解的是,目标对象的存在边界框定的是否准确,依赖于区域生成网络提取候选区域及确定第一概率的准确性。
步骤204:对中间图像中对应目标候选区域的部分进行图像增强处理和/或对中间图像中对应非目标候选区域的部分进行图像模糊处理,得到增量样本图像。
在步骤203的基础上,本步骤旨在由上述执行主体对中间图像中框定出的存在目标对象的部分和/或不存在目标对象的部分,采用不同的图像处理手段,进而将处理后的增量样本图像。
具体的,本步骤具体包含了三种不同的实现方式:
第一种:仅对中间图像中对应目标候选区域的部分进行图像增强处理,并将经图像增强处理后的中间图像作为增量样本图像;
第二种:仅对中间图像中对应非目标候选区域的部分进行图像模糊处理,并将将经图像模糊处理后的中间图像作为增量样本图像;
第三种:不仅对中间图像中对应目标候选区域的部分进行图像增强处理,还对对中间图像中对应非目标候选区域的部分进行图像模糊处理,将经过图像增强和图像模糊处理后的中间图像作为增量样本图像。
无论是上述哪一种实现方式的目的都是为了尽可能的突出目标对象存在的部分区域。
应当理解的是,图像增强处理是一种提升图像清晰度的图像处理手段、图像模糊处理则是降低图像清晰度的图像处理手段,图像越清晰、越容易准确的识别出是否包含目标对象。
本公开实施例提供了一种样本图像增量方法,该方法借助区域生成网络来确定可能包含有目标对象的候选区域,然后将其中包含概率较高的作为目标候选区域,通过将其目标候选区域映射回原图,并对原图中对应目标候选区域和/或对应非目标候选区域的部分采用相应的清晰化或模糊化处理方式,进而得到尽可能凸显出目标对象的增量样本图像。通过该技术方案得以在不破坏原始样本图像中关键部分的前提下,生成高可用性的增量样本图像。
请参考图3,图3为本公开实施例提供的另一种样本图像增量方法的流程图,其中流程300包括以下步骤:
步骤301:获取原始样本图像的第一卷积特征;
步骤302:根据区域生成网络和第一卷积特征确定候选区域、候选区域中包含目标对象的第一概率;
以上步骤301-302与如图2所示的步骤201-202一致,相同部分内容请参见上一实施例的相应部分,此处不再进行赘述
步骤303:将第一概率大于预设概率的候选区域确定为目标候选区域,并将目标候选区域映射回原始样本图像,得到中间图像;
在步骤203的基础上,本实施例通过本步骤提供了一种选取出目标候选区域的具体实现方式,即通过预先设置一个被认为能够区分概率高低的预设概率(例如70%),因此只需要将各候选区域的第一概率与该预设概率进行比较即可选取出高概率存在目标对象的目标候选区域。
除步骤303所提供的基于预设概率确定目标候选区域的方式外,还可以选用诸如将第一概率的大小排名前几(按从大到小排,排名前N指概率值较大的N个)的候选区域确定为目标候选区域,也可以基于前百分比等方式进行选取。即无论哪种方式的目的都是将尽可能高概率包含目标对象的候选区域确定为目标候选区域,以使将目标候选区域映射回原始样本图像后,能够尽可能准确的框定出原始样本图像中的目标对象。
步骤304:对中间图像中对应非目标候选区域的部分进行高斯模糊处理;
在步骤303的基础上,本步骤旨在由上述执行主体对中间图像中对应非目标候选区域的部分进行高斯模糊处理。
高斯模糊也被称为高斯平滑,通常用它来减少图像噪声以及降低细节层次。通过该种模糊技术生成的图像,其视觉效果就像是经过一个毛玻璃在观察图像,这与镜头焦外成像效果散景以及普通照明阴影中的效果都明显不同。高斯平滑也用于计算机视觉算法中的预先处理阶段,以增强图像在不同比例大小下的图像效果。从数学的角度来看,图像的高斯模糊过程就是图像与正态分布做卷积。由于正态分布又叫作高斯分布,所以这项技术就叫作高斯模糊。图像与圆形方框模糊做卷积将会生成更加精确的焦外成像效果。由于高斯函数的傅立叶变换是另外一个高斯函数,所以高斯模糊对于图像来说是一个低通滤波器。
步骤305:对中间图像中的第一目标区域进行第一图像增强处理;
步骤306:对中间图像中的第二目标区域进行第二图像增强处理;
在步骤303的基础上,步骤305和步骤306分别对中间图像中的第一目标区域和第二目标区域进行不同图像增强强度的图像增强处理,以区别不同目标区域的图像增强效果。
其中,第一目标区域为至少两个目标候选区域映射在原始样本图像中的重叠部分;区别于第一目标区域,第二目标区域为单个目标候选区域映射在原始样本图像中的部分。可以理解的是,越多目标候选区域映射在原始样本图像的同一位置,将能够进一步提升该位置下存在目标对象的判断准确性,反之则仅能保持原判断准确性。因此,本实施例通过步骤305和步骤306对越有可能存在目标对象的部分区域使用了图像增强强度较高的图像增强手段,而对存在目标对象的可能性一般的部分区域使用了较常规的图像增强手段。
步骤307:将经处理后的图像作为增量样本图像。
在上一实施例所提供的技术方案的基础上,本实施例通过步骤303提供了一种具体的基于第一概率确定目标候选区域的方法;通过步骤304提供了对中间图像中对应非目标候选区域的部分具体采用高斯模糊的图像模糊处理方式,通过步骤305-步骤306提供了对中间图像中对应非目标候选区域的部分按照是否为多个目标候选区域重叠,采用了不同图像增强强度的图像增强处理,以尽可能的凸显目标对象。
应当理解的是,步骤303、步骤304、步骤305-步骤306各自所提供的具体实现方式均可以与流程200所示的实施例单独结合形成不同的实施例,其各自之间不存在因果和依赖关系。因此本实施例实际上仅是同时三个具体实现方式的优选实施例。
上述任意实施例提供了不同的样本图像增量方案,进一步的,还可以结合上述生成增量样本图像的技术方案,提供了一种用于训练得到目标检测模型的模型训练方法,一种包括且不限于的实现方式可参见如图4所示的流程图,其流程400包括以下步骤:
步骤401:获取增量样本图像的第二卷积特征;
第二卷积特征提取自增强样本图像,用于提取得到第二卷积特征的方式可与从原始样本图像提取到第一卷积特征的方式相同,例如采用相同的特征提取网络。
步骤402:根据区域生成网络和第二卷积特征确定新候选区域、新候选区域包含所述目标对象的第二概率;
新候选区域和其第二概率类似于候选区域和其第一概率,区别为新候选区域和其第二概率的对象是增量样本图像,候选区域和其第一概率的对象是原始样本图像。
步骤403:获取对应第一概率的第一损失值,以及对应第二概率的第二损失值;
在步骤402的基础上,本步骤旨在分别获取到用于指导模型训练的损失值,由于存在原始样本图像和增量样本图像,因此分别基于第一概率和第二概率确定出相应的损失值。
步骤404:基于加权后的第一损失值和第二损失值,确定综合损失值;
在步骤403的基础上,本步骤旨在综合加权后的第一损失值和第二损失值来确定更加合理的综合损失值。其中,用于对第一损失值进行加权的权值与用于对第二损失值进行加权的权值可以相同也可以不同,可根据实际情况灵活调整。
一种包括且不限于的实现方式为:将加权后的第一损失值与加权后的第二损失值的和,作为综合损失值。
步骤405:基于综合损失值满足预设要求,得到训练完成的图像检测模型。
在步骤404的基础上,本步骤旨在由上述执行主体基于综合损失值满足预设要求,得到训练完成的图像检测模型。
一种包括且不限于的实现方式为:响应于综合损失值为预设轮数的迭代训练中的最小值,输出训练完成的图像检测模型。此种方式可以理解为以控制综合损失值最小为训练目标,综合损失值越小将使得模型的检测精度越高。
如图4所示的实施例在之前各实施例的基础上,进一步结合增量后的样本图像训练目标检测模型,以便后续可直接使用训练好的目标检测模型来准确、高效的检测待测图像中是否存在目标对象。
一种图像检测方法可以为:
首先,接收待检测图像,然后,调用图像检测模型对待检测图像进行检测。后续还可以返回得到的检测结果。
为加深理解,本公开还结合一个具体应用场景,给出了一种具体的实现方案,请参见如图5所示的流程示意图。
针对样本图像数量较少的现实目标检测场景,本实施例提供了一种基于区域生成增强的目标检测方法,旨在利用候选区域生成进行数据增强,可与现有的各种样本增量技术一起使用,从而从不同的角度综合提升增量样本的可用性,最后基于增量后的样本集训练出检测效果更好的目标检测模型:
1)对原始图像A使用卷积神经网络提取卷积特征;
2)通过区域生成网络对提取到卷积特征生成可能含有目标的候选区域,以及各个候选区域可能含有目标的概率得分;
3)由2)中获得的候选区域和1)提取的卷积特征经过常见的ROI(region ofinterest,感兴趣区域)池化,输入到两个全连接层中,得到数千个分类概率,其中每一个分类概率都有其对应的回归边界,将其记为分类概率a1和回归边界a2;
4)将2)中得到的候选区域按照概率得分从高到低排序,选择前N个候选区域映射回原图(N取50,该参数可以根据具体任务进行调整),可以获得一张标有N个检测框的中间图像;
5)将4)获得的中间图像中位于检测框之外的区域记为背景区域,将该背景区域进行高斯模糊,并对位于检测框内的前景区域使用图像增强提升其清晰度,获得图像B;
6)将图像B输入到卷积特征提取网络中,最终可以得到分类概率b1和回归边界b2;
7)将分类概率a1与分类概率a2加权求和后获得最终的分类概率,按照一定阈值将分类概率对应的回归边界(即b1和b2)映射到待检测的原始图像中,获得最终的检测结果。
由于处理过程中,会对候选区域映射后的图像进行背景模糊,所以只有当候选区域包含图像中所有待检测目标时,候选区域映射后的图像在训练过程中的损失值才会更加收敛。
上述方案也可以移植到基于区域生成网络的现有方法中,还可以和其它用于小样本检测的技术共同提高效果,以进一步提升实用性。
作为对上述各图所示方法的实现,本公开还分别提供了装置实施例,即与图2所示的样本图像增量方法对应的样本图像增量装置、与图4所示的图像检测模型训练方法对应的图像检测模型训练装置,与图像检测方法对应的图像检测装置,各装置可具体应用于各种电子设备中。
如图6所示,本实施例的样本图像增量装置600可以包括:第一卷积特征获取单元601、候选区域及概率确定单元602、目标候选区域确定及映射单元603、中间图像处理单元604。其中,第一卷积特征获取单元601,被配置成获取原始样本图像的第一卷积特征;候选区域及概率确定单元602,被配置成根据区域生成网络和第一卷积特征确定候选区域、候选区域中包含目标对象的第一概率;目标候选区域确定及映射单元603,被配置成基于第一概率在候选区域中确定目标候选区域,并将目标候选区域映射回原始样本图像,得到中间图像;中间图像处理单元604,被配置成对中间图像中对应目标候选区域的部分进行图像增强处理和/或对中间图像中对应非目标候选区域的部分进行图像模糊处理,得到增量样本图像。
在本实施例中,样本图像增量装置600中:第一卷积特征获取单元601、候选区域及概率确定单元602、目标候选区域确定及映射单元603、中间图像处理单元604的具体处理及其所带来的技术效果可分别参考图2对应实施例中的步骤201-204的相关说明,在此不再赘述。
在本实施例的一些可选的实现方式中,中间图像处理单元604可以包括对中间图像中对应非目标候选区域的部分进行图像模糊处理的模糊处理子单元,模糊处理子单元被进一步配置成:
对中间图像中对应非目标候选区域的部分进行高斯模糊处理。
在本实施例的一些可选的实现方式中,目标候选区域确定及映射单元603可以包括被配置成基于第一概率在候选区域中确定目标候选区域的目标候选区域确定子单元,目标候选区域确定子单元被进一步配置成:
将第一概率大于预设概率的候选区域确定为目标候选区域。
在本实施例的一些可选的实现方式中,中间图像处理单元604可以包括对中间图像中对应目标候选区域的部分进行图像增强处理的增强处理子单元,增强处理子单元被进一步配置成:
对中间图像中的第一目标区域进行第一图像增强处理,第一目标区域为至少两个目标候选区域映射在原始样本图像中的重叠部分;
对中间图像中的第二目标区域进行第二图像增强处理,第二目标区域为单个目标候选区域映射在原始样本图像中的部分,第一图像增强处理的图像增强强度大于第二图像增强处理的图像增强强度。
如图7所示,本实施例的图像检测模型训练装置700可以包括:第二卷积特征获取单元701、新候选区域及概率确定单元702、损失值获取单元703、综合损失值确定单元704、图像检测模型训练单元705。其中,第二卷积特征获取单元701,被配置成获取增量样本图像的第二卷积特征;其中,增量样本图像通过如图6所示的样本图像增量装置得到;新候选区域及概率确定单元702,被配置成根据区域生成网络和第二卷积特征确定新候选区域、新候选区域包含目标对象的第二概率;损失值获取单元703,被配置成获取对应第一概率的第一损失值,以及对应第二概率的第二损失值;综合损失值确定单元704,被配置成基于加权后的第一损失值和第二损失值,确定综合损失值;图像检测模型训练单元705,被配置成基于综合损失值满足预设要求,得到训练完成的图像检测模型。
在本实施例的一些可选的实现方式中,综合损失值确定单元可以被进一步配置成:
将加权后的第一损失值与加权后的第二损失值的和,作为综合损失值。
在本实施例的一些可选的实现方式中,图像检测模型训练单元被进一步配置成:
响应于综合损失值为预设轮数的迭代训练中的最小值,输出训练完成的图像检测模型。
如图8所示,本实施例的图像检测装置800可以包括:待检测图像接收单元801、图像检测单元802。其中,待检测图像接收单元801,被配置成接收待检测图像;图像检测单元802,被配置成调用图像检测模型对待检测图像进行检测;其中,图像检测模型通过如图7所示的图像检测模型训练装置得到。
本实施例作为对应于上述方法实施例的装置实施例存在,本公开实施例所提供的样本图像增量装置借助区域生成网络来确定可能包含有目标对象的候选区域,然后将其中包含概率较高的作为目标候选区域,通过将其目标候选区域映射回原图,并对原图中对应目标候选区域和/或对应非目标候选区域的部分采用相应的清晰化或模糊化处理方式,进而得到尽可能凸显出目标对象的增量样本图像。通过该技术方案得以在不破坏原始样本图像中关键部分的前提下,生成高可用性的增量样本图像。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图9示出了可以用来实施本公开的实施例的示例电子设备900的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图9所示,设备900包括计算单元901,其可以根据存储在只读存储器(ROM)902中的计算机程序或者从存储单元908加载到随机访问存储器(RAM)903中的计算机程序,来执行各种适当的动作和处理。在RAM 903中,还可存储设备900操作所需的各种程序和数据。计算单元901、ROM 902以及RAM 903通过总线904彼此相连。输入/输出(I/O)接口905也连接至总线904。
设备900中的多个部件连接至I/O接口905,包括:输入单元906,例如键盘、鼠标等;输出单元907,例如各种类型的显示器、扬声器等;存储单元908,例如磁盘、光盘等;以及通信单元909,例如网卡、调制解调器、无线通信收发机等。通信单元909允许设备900通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元901可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元901的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元901执行上文所描述的各个方法和处理,例如样本图像增量方法。例如,在一些实施例中,样本图像增量方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元908。在一些实施例中,计算机程序的部分或者全部可以经由ROM 902和/或通信单元909而被载入和/或安装到设备900上。当计算机程序加载到RAM 903并由计算单元901执行时,可以执行上文描述的样本图像增量方法的一个或多个步骤。备选地,在其他实施例中,计算单元901可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行样本图像增量方法。
本文中以上描述的***和技术的各种实施方式可以在数字电子电路***、集成电路***、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上***的***(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程***上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储***、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储***、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的***和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的***和技术实施在包括后台部件的计算***(例如,作为数据服务器)、或者包括中间件部件的计算***(例如,应用服务器)、或者包括前端部件的计算***(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的***和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算***中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将***的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机***可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决传统物理主机与虚拟专用服务器(VPS,Virtual Private Server)服务中存在的管理难度大,业务扩展性弱的缺陷。
本公开实施例所提供的样技术方案借助区域生成网络来确定可能包含有目标对象的候选区域,然后将其中包含概率较高的作为目标候选区域,通过将其目标候选区域映射回原图,并对原图中对应目标候选区域和/或对应非目标候选区域的部分采用相应的清晰化或模糊化处理方式,进而得到尽可能凸显出目标对象的增量样本图像。通过该技术方案得以在不破坏原始样本图像中关键部分的前提下,生成高可用性的增量样本图像。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
Claims (16)
1.一种图像检测模型训练方法,包括:
获取增量样本图像的第二卷积特征;
根据区域生成网络和所述第二卷积特征确定新候选区域、所述新候选区域包含目标对象的第二概率;
获取对应第一概率的第一损失值,以及对应所述第二概率的第二损失值;
基于加权后的第一损失值和第二损失值,确定综合损失值;
基于所述综合损失值满足预设要求,得到训练完成的图像检测模型;
其中,所述增量样本图像通过下述方式获取得到:
获取原始样本图像的第一卷积特征;
根据区域生成网络和所述第一卷积特征确定候选区域、所述候选区域中包含目标对象的第一概率;
基于所述第一概率在所述候选区域中确定目标候选区域,并将所述目标候选区域映射回所述原始样本图像,得到中间图像;
对所述中间图像中对应所述目标候选区域的部分进行图像增强处理和/或对所述中间图像中对应非所述目标候选区域的部分进行图像模糊处理,得到所述增量样本图像。
2.根据权利要求1所述的方法,其中,所述对所述中间图像中对应非所述目标候选区域的部分进行图像模糊处理,包括:
对所述中间图像中对应非所述目标候选区域的部分进行高斯模糊处理。
3.根据权利要求1所述的方法,其中,所述基于所述第一概率在所述候选区域中确定目标候选区域,包括:
将所述第一概率大于预设概率的候选区域确定为目标候选区域。
4.根据权利要求1所述的方法,其中,所述对所述中间图像中对应所述目标候选区域的部分进行图像增强处理,包括:
对所述中间图像中的第一目标区域进行第一图像增强处理,所述第一目标区域为至少两个所述目标候选区域映射在所述原始样本图像中的重叠部分;
对所述中间图像中的第二目标区域进行第二图像增强处理,所述第二目标区域为单个所述目标候选区域映射在所述原始样本图像中的部分,所述第一图像增强处理的图像增强强度大于所述第二图像增强处理的图像增强强度。
5.根据权利要求1所述的方法,其中,所述基于加权后的第一损失值和第二损失值,确定综合损失值,包括:
将加权后的第一损失值与加权后的第二损失值的和,作为所述综合损失值。
6.根据权利要求1所述的方法,其中,所述基于所述综合损失值满足预设要求,得到训练完成的图像检测模型,包括:
响应于所述综合损失值为预设轮数的迭代训练中的最小值,输出训练完成的图像检测模型。
7.一种图像检测方法,包括:
接收待检测图像;
调用图像检测模型对所述待检测图像进行检测;其中,所述图像检测模型根据权利要求1-6中任一项所述的图像检测模型训练方法得到。
8.一种图像检测模型训练装置,包括:
第一卷积特征获取单元,被配置成获取原始样本图像的第一卷积特征;
候选区域及概率确定单元,被配置成根据区域生成网络和所述第一卷积特征确定候选区域、所述候选区域中包含目标对象的第一概率;
目标候选区域确定及映射单元,被配置成基于所述第一概率在所述候选区域中确定目标候选区域,并将所述目标候选区域映射回所述原始样本图像,得到中间图像;
中间图像处理单元,被配置成对所述中间图像中对应所述目标候选区域的部分进行图像增强处理和/或对所述中间图像中对应非所述目标候选区域的部分进行图像模糊处理,得到增量样本图像;
第二卷积特征获取单元,被配置成获取所述增量样本图像的第二卷积特征;
新候选区域及概率确定单元,被配置成根据区域生成网络和所述第二卷积特征确定新候选区域、所述新候选区域包含目标对象的第二概率;
损失值获取单元,被配置成获取对应第一概率的第一损失值,以及对应所述第二概率的第二损失值;
综合损失值确定单元,被配置成基于加权后的第一损失值和第二损失值,确定综合损失值;
图像检测模型训练单元,被配置成基于所述综合损失值满足预设要求,得到训练完成的图像检测模型。
9.根据权利要求8所述的装置,其中,所述中间图像处理单元包括对所述中间图像中对应非所述目标候选区域的部分进行图像模糊处理的模糊处理子单元,所述模糊处理子单元被进一步配置成:
对所述中间图像中对应非所述目标候选区域的部分进行高斯模糊处理。
10.根据权利要求8所述的装置,其中,所述目标候选区域确定及映射单元包括被配置成基于所述第一概率在所述候选区域中确定目标候选区域的目标候选区域确定子单元,所述目标候选区域确定子单元被进一步配置成:
将所述第一概率大于预设概率的候选区域确定为目标候选区域。
11.根据权利要求8所述的装置,其中,所述中间图像处理单元包括对所述中间图像中对应所述目标候选区域的部分进行图像增强处理的增强处理子单元,所述增强处理子单元被进一步配置成:
对所述中间图像中的第一目标区域进行第一图像增强处理,所述第一目标区域为至少两个所述目标候选区域映射在所述原始样本图像中的重叠部分;
对所述中间图像中的第二目标区域进行第二图像增强处理,所述第二目标区域为单个所述目标候选区域映射在所述原始样本图像中的部分,所述第一图像增强处理的图像增强强度大于所述第二图像增强处理的图像增强强度。
12.根据权利要求8所述的装置,其中,所述综合损失值确定单元被进一步配置成:
将加权后的第一损失值与加权后的第二损失值的和,作为所述综合损失值。
13.根据权利要求8所述的装置,其中,所述图像检测模型训练单元被进一步配置成:
响应于所述综合损失值为预设轮数的迭代训练中的最小值,输出训练完成的图像检测模型。
14.一种图像检测装置,包括:
待检测图像接收单元,被配置成接收待检测图像;
图像检测单元,被配置成调用图像检测模型对所述待检测图像进行检测;其中,所述图像检测模型根据权利要求8-13中任一项所述的图像检测模型训练装置得到。
15.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-6任一项所述的图像检测模型训练方法和/或权利要求7所述的图像检测方法。
16.一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行权利要求1-6任一项所述的图像检测模型训练方法和/或权利要求7所述的图像检测方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110371342.4A CN112949767B (zh) | 2021-04-07 | 2021-04-07 | 样本图像增量、图像检测模型训练及图像检测方法 |
PCT/CN2022/075152 WO2022213718A1 (zh) | 2021-04-07 | 2022-01-30 | 样本图像增量、图像检测模型训练及图像检测方法 |
JP2022552961A JP2023531350A (ja) | 2021-04-07 | 2022-01-30 | サンプル画像を増分する方法、画像検出モデルの訓練方法及び画像検出方法 |
US17/939,364 US20230008696A1 (en) | 2021-04-07 | 2022-09-07 | Method for incrementing sample image |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110371342.4A CN112949767B (zh) | 2021-04-07 | 2021-04-07 | 样本图像增量、图像检测模型训练及图像检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112949767A CN112949767A (zh) | 2021-06-11 |
CN112949767B true CN112949767B (zh) | 2023-08-11 |
Family
ID=76232374
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110371342.4A Active CN112949767B (zh) | 2021-04-07 | 2021-04-07 | 样本图像增量、图像检测模型训练及图像检测方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20230008696A1 (zh) |
JP (1) | JP2023531350A (zh) |
CN (1) | CN112949767B (zh) |
WO (1) | WO2022213718A1 (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112949767B (zh) * | 2021-04-07 | 2023-08-11 | 北京百度网讯科技有限公司 | 样本图像增量、图像检测模型训练及图像检测方法 |
CN113361535B (zh) * | 2021-06-30 | 2023-08-01 | 北京百度网讯科技有限公司 | 图像分割模型训练、图像分割方法及相关装置 |
CN113516185B (zh) * | 2021-07-09 | 2023-10-31 | 北京百度网讯科技有限公司 | 模型训练的方法、装置、电子设备及存储介质 |
CN114596637B (zh) * | 2022-03-23 | 2024-02-06 | 北京百度网讯科技有限公司 | 图像样本数据增强训练方法、装置及电子设备 |
CN115100431B (zh) * | 2022-07-26 | 2023-08-08 | 北京百度网讯科技有限公司 | 目标检测方法、神经网络及其训练方法、设备和介质 |
CN117036227A (zh) * | 2022-09-21 | 2023-11-10 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置、电子设备、介质及程序产品 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102665062A (zh) * | 2012-03-16 | 2012-09-12 | 华为技术有限公司 | 一种使视频中目标物体图像稳定的方法及装置 |
WO2018121690A1 (zh) * | 2016-12-29 | 2018-07-05 | 北京市商汤科技开发有限公司 | 对象属性检测、神经网络训练、区域检测方法和装置 |
CN109559285A (zh) * | 2018-10-26 | 2019-04-02 | 北京东软医疗设备有限公司 | 一种图像增强显示方法及相关装置 |
CN110248107A (zh) * | 2019-06-13 | 2019-09-17 | Oppo广东移动通信有限公司 | 图像处理方法和装置 |
CN110599503A (zh) * | 2019-06-18 | 2019-12-20 | 腾讯科技(深圳)有限公司 | 检测模型训练方法、装置、计算机设备和存储介质 |
CN111428875A (zh) * | 2020-03-11 | 2020-07-17 | 北京三快在线科技有限公司 | 图像识别方法、装置及相应模型训练方法、装置 |
CN111597945A (zh) * | 2020-05-11 | 2020-08-28 | 济南博观智能科技有限公司 | 一种目标检测方法、装置、设备及介质 |
WO2021017261A1 (zh) * | 2019-08-01 | 2021-02-04 | 平安科技(深圳)有限公司 | 识别模型训练方法、图像识别方法、装置、设备及介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109003260B (zh) * | 2018-06-28 | 2021-02-09 | 深圳视见医疗科技有限公司 | Ct图像肺结节检测方法、装置、设备及可读存储介质 |
CN110503097A (zh) * | 2019-08-27 | 2019-11-26 | 腾讯科技(深圳)有限公司 | 图像处理模型的训练方法、装置及存储介质 |
CN112949767B (zh) * | 2021-04-07 | 2023-08-11 | 北京百度网讯科技有限公司 | 样本图像增量、图像检测模型训练及图像检测方法 |
-
2021
- 2021-04-07 CN CN202110371342.4A patent/CN112949767B/zh active Active
-
2022
- 2022-01-30 JP JP2022552961A patent/JP2023531350A/ja active Pending
- 2022-01-30 WO PCT/CN2022/075152 patent/WO2022213718A1/zh active Application Filing
- 2022-09-07 US US17/939,364 patent/US20230008696A1/en active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102665062A (zh) * | 2012-03-16 | 2012-09-12 | 华为技术有限公司 | 一种使视频中目标物体图像稳定的方法及装置 |
WO2018121690A1 (zh) * | 2016-12-29 | 2018-07-05 | 北京市商汤科技开发有限公司 | 对象属性检测、神经网络训练、区域检测方法和装置 |
CN109559285A (zh) * | 2018-10-26 | 2019-04-02 | 北京东软医疗设备有限公司 | 一种图像增强显示方法及相关装置 |
CN110248107A (zh) * | 2019-06-13 | 2019-09-17 | Oppo广东移动通信有限公司 | 图像处理方法和装置 |
CN110599503A (zh) * | 2019-06-18 | 2019-12-20 | 腾讯科技(深圳)有限公司 | 检测模型训练方法、装置、计算机设备和存储介质 |
WO2021017261A1 (zh) * | 2019-08-01 | 2021-02-04 | 平安科技(深圳)有限公司 | 识别模型训练方法、图像识别方法、装置、设备及介质 |
CN111428875A (zh) * | 2020-03-11 | 2020-07-17 | 北京三快在线科技有限公司 | 图像识别方法、装置及相应模型训练方法、装置 |
CN111597945A (zh) * | 2020-05-11 | 2020-08-28 | 济南博观智能科技有限公司 | 一种目标检测方法、装置、设备及介质 |
Non-Patent Citations (1)
Title |
---|
The Analysis of Image Enhancement for Target Detection;Rui Zhang 等;ICSI 2018;全文 * |
Also Published As
Publication number | Publication date |
---|---|
WO2022213718A1 (zh) | 2022-10-13 |
JP2023531350A (ja) | 2023-07-24 |
US20230008696A1 (en) | 2023-01-12 |
CN112949767A (zh) | 2021-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112949767B (zh) | 样本图像增量、图像检测模型训练及图像检测方法 | |
CN113033537B (zh) | 用于训练模型的方法、装置、设备、介质和程序产品 | |
CN113436100B (zh) | 用于修复视频的方法、装置、设备、介质和产品 | |
CN113239807B (zh) | 训练票据识别模型和票据识别的方法和装置 | |
CN113643260A (zh) | 用于检测图像质量的方法、装置、设备、介质和产品 | |
CN114359932B (zh) | 文本检测方法、文本识别方法及装置 | |
CN112508005B (zh) | 用于处理图像的方法、装置、设备以及存储介质 | |
CN117333443A (zh) | 一种缺陷检测方法、装置、电子设备及存储介质 | |
CN114724144B (zh) | 文本识别方法、模型的训练方法、装置、设备及介质 | |
CN113628192B (zh) | 图像模糊检测方法、装置、设备、存储介质及程序产品 | |
CN114677566B (zh) | 深度学习模型的训练方法、对象识别方法和装置 | |
CN114612651B (zh) | Roi检测模型训练方法、检测方法、装置、设备和介质 | |
CN113888635B (zh) | 视觉定位方法、相关装置 | |
CN114093006A (zh) | 活体人脸检测模型的训练方法、装置、设备以及存储介质 | |
CN115019057A (zh) | 图像特征提取模型确定方法及装置、图像识别方法及装置 | |
CN114581711A (zh) | 目标对象检测方法、装置、设备、存储介质以及程序产品 | |
CN114119990A (zh) | 用于图像特征点匹配的方法、装置及计算机程序产品 | |
CN113870142B (zh) | 用于增强图像对比度的方法、装置 | |
CN113643257B (zh) | 图像噪点检测方法、装置、设备、存储介质及程序产品 | |
CN114092739B (zh) | 图像处理方法、装置、设备、存储介质和程序产品 | |
CN115147902B (zh) | 人脸活体检测模型的训练方法、装置及计算机程序产品 | |
CN114037865B (zh) | 图像处理方法、装置、设备、存储介质和程序产品 | |
CN116071625B (zh) | 深度学习模型的训练方法、目标检测方法及装置 | |
CN112633276B (zh) | 训练方法、识别方法、装置、设备、介质 | |
CN116580050A (zh) | 医疗图像分割模型的确定方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |