CN111814902A - 目标检测模型训练方法、目标识别方法、装置和介质 - Google Patents
目标检测模型训练方法、目标识别方法、装置和介质 Download PDFInfo
- Publication number
- CN111814902A CN111814902A CN202010705176.2A CN202010705176A CN111814902A CN 111814902 A CN111814902 A CN 111814902A CN 202010705176 A CN202010705176 A CN 202010705176A CN 111814902 A CN111814902 A CN 111814902A
- Authority
- CN
- China
- Prior art keywords
- training
- detection model
- model
- images
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title claims abstract description 348
- 238000001514 detection method Methods 0.000 title claims abstract description 185
- 238000000034 method Methods 0.000 title claims abstract description 74
- 238000012545 processing Methods 0.000 claims description 106
- 238000005520 cutting process Methods 0.000 claims description 63
- 238000013434 data augmentation Methods 0.000 claims description 33
- 238000004590 computer program Methods 0.000 claims description 28
- 230000003321 amplification Effects 0.000 claims description 25
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 25
- 238000013138 pruning Methods 0.000 claims description 24
- 230000008859 change Effects 0.000 claims description 9
- 238000012216 screening Methods 0.000 claims description 7
- 238000003672 processing method Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 8
- 230000006872 improvement Effects 0.000 abstract description 6
- 238000010586 diagram Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 11
- 230000019771 cognition Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 3
- 230000003416 augmentation Effects 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000010008 shearing Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4084—Scaling of whole images or parts thereof, e.g. expanding or contracting in the transform domain, e.g. fast Fourier transform [FFT] domain scaling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/513—Sparse representations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本申请实施例提供了一种目标检测模型训练方法、目标识别方法、装置和介质,所述目标检测模型训练方法通过对所述M张样本图像进行数据增广处理,可以得到更为丰富的训练图像。将所述N张训练图像作为所述初始检测模型的样本集,极大的提高了训练样本的丰富性,使得所述目标检测模型可以从多个维度对目标进行检测或识别,可以有效避免目标的漏检极大的提高所述目标检测模型对于目标检测或者识别的准确度,解决了现有技术中存在的检测模型的检测效果不理想,容易发生漏掉目标的情况的技术问题,达到了提高目标检测模型全面性和准确度的技术效果。
Description
技术领域
本申请涉及目标检测技术领域,特别是涉及一种目标检测模型训练方法、目标识别方法、装置和介质。
背景技术
随着人工智能的发展,可以通过无人机等设备对于目标进行拍摄及识别,以实现对不同环境与不同类别的目标进行快速准确识别与检测,以及时发现并确定目标的位置。在目标识别过程中,深度学习可以代替人工来检测目标的类别、目标各零部件位置、形貌特征等。目前一般通过无人机等对目标进行拍摄,将拍摄到的多张目标图像输入至服务器等处理设备,由嵌有检测模型的处理设备对目标进行深度学习的检测。但是,现有的检测模型的检测效果并不理想,容易发生漏掉目标的情况。
发明内容
基于此,有必要针对上述技术问题,提供一种目标检测模型训练方法、目标识别方法、装置和介质。
一种目标检测模型训练方法,所述方法包括:
对M张样本图像进行数据增广处理,得到N张训练图像,其中M、N均为不小于1的正整数,且M<N;
将所述N张训练图像输入至初始检测模型进行训练,得到第一训练模型;
对所述第一训练模型进行稀疏化和剪枝训练,得到第二训练模型;
将所述N张训练图像输入至所述第二训练模型进行训练,得到目标检测模型。
在其中一个实施例中,所述N张训练图像包括:第一训练图像、第二训练图像和第三训练图像;所述对所述M张样本图像进行数据增广处理,得到N张训练图像,包括:
对所述M张样本图像进行切图数据增广处理,得到N1张第一训练图像,其中N1为不小于1的正整数,且M<N1<N;
对所述M张样本图像进行HSV色域变化数据增广处理,得到N2张第二训练图像,其中N2为不小于1的正整数,且M<N2<N;
对所述M张样本图像进行马赛克数据增广处理,得到N3张第三训练图像,其中N1为不小于1的正整数,且M<N3<N。
在其中一个实施例中,所述N1张第一训练图像包括第一切图图像和第二切图图像;所述对所述M张样本图像进行切图数据增广处理,得到N1张第一训练图像,包括:
对所述M张样本图像进行第一切图处理,得到N11张第一切图图像,其中N11为不小于1的正整数,且M<N11<N1;
对所述M张样本图像进行第二切图处理,得到N12张第二切图图像,其中N12为不小于1的正整数,且M<N12<N1,所述第二切图处理与所述第一切图切图方式不同。
在其中一个实施例中,所述对所述M张样本图像进行切图数据增广处理,得到N1张第一训练图像,包括:
按照预设模型对所述M张样本图像进行切图处理,得到M1张切图图像;
对所述M1张切图图像进行筛选,去除无目标图像,得到所述N1张第一训练图像,所述无目标图像是指图像中未出现目标的图像。
在其中一个实施例中,所述对所述第一训练模型进行稀疏化和剪枝训练,得到第二训练模型,包括:
确定预设区间,所述预设区间是指预设的缩放因子数值范围;
去除所述第一训练模型中所述预设区间内的缩放因子对应的通道,得到所述第二训练模型。
在其中一个实施例中,所述确定预设区间,包括:
对所述第一训练模型中的多个缩放因子按照大小进行排序,得到缩放因子序列表;
在所述缩放因子序列表中,从最小数值的所述缩放因子开始,将连续的预设数量的所述缩放因子确定为所述预设区间。
在其中一个实施例中,所述将所述N张训练图像输入至所述第二训练模型进行训练,得到目标检测模型,包括:
将所述N张训练图像输入至所述第二训练模型进行训练,得到中间检测模型;
计算所述中间检测模型的平均精度均值;
若所述平均精度均值不小于预设阈值,则确定所述中间检测模型为所述目标检测模型。
在其中一个实施例中,还包括:
若所述平均精度均值小于预设阈值,则将所述中间检测模型确定为所述第一训练模型,并返回执行所述对所述第一训练模型进行稀疏化和剪枝训练,得到第二训练模型。
一种目标检测模型训练装置,所述装置包括:
数据增广模块,用于对M张样本图像进行数据增广处理,得到N张训练图像,其中M、N均为不小于1的正整数,且M<N;
模型训练模块,用于将所述N张训练图像输入至初始检测模型进行训练,得到第一训练模型;对所述第一训练模型进行稀疏化和剪枝训练,得到第二训练模型;将所述N张训练图像输入至所述第二训练模型进行训练,得到目标检测模型。
一种目标识别方法,包括:
获取待识别图像;
将所述待识别图像输入至所述目标检测模型,通过所述目标检测模型对所述待识别图像进行目标识别处理,其中,所述目标检测模型通过如上所述的目标检测模型训练方法训练得到;
根据所述目标检测模型的目标识别处理结果确定目标。
一种目标识别装置,所述装置包括:
图像获取模块,用于获取待识别图像;
目标识别模块,用于将所述待识别图像输入至所述目标检测模型,通过所述目标检测模型对所述待识别图像进行目标识别处理,其中,所述目标检测模型通过如上所述的目标检测模型训练方法训练得到;
目标确定模块,用于根据所述目标检测模型的目标识别处理结果确定目标。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如上所述的方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的方法的步骤。
本申请实施例提供了一种目标检测模型训练方法,对预先获取的M张样本图像进行数据增广处理,得到N张训练图像,也就是形成训练样本集。然后基于所述训练样本集进行训练和处理得到目标检测模型。本申请实施例通过对所述M张样本图像进行数据增广处理,可以得到更为丰富的训练图像。将所述N张训练图像作为所述初始检测模型的样本集,极大的提高了训练样本的丰富性,使得所述目标检测模型可以从多个维度对目标进行检测或识别,可以有效避免目标的漏检极大的提高所述目标检测模型对于目标检测或者识别的准确度,解决了现有技术中存在的检测模型的检测效果不理想,容易发生漏掉目标的情况的技术问题,达到了提高目标检测模型全面性和准确度的技术效果。
附图说明
图1为一个实施例中目标检测模型训练方法和目标识别方法的应用环境图;
图2为一个实施例中目标检测模型训练方法的流程示意图;
图3为一个实施例中目标检测模型训练方法的流程示意图;
图4为一个实施例中目标检测模型训练方法的流程示意图;
图5为一个实施例中目标检测模型训练方法的流程示意图;
图6为一个实施例中目标检测模型训练方法的流程示意图;
图7为一个实施例中目标检测模型训练方法的流程示意图;
图8为一个实施例中目标检测模型训练方法的流程示意图;
图9为一个实施例中目标识别方法的流程示意图;
图10为一个实施例中目标检测模型训练装置的结构框图;
图11为一个实施例中目标识别装置的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
请参见图1,本申请实施例提供的一种目标检测模型训练方法和目标识别方法可以应用于计算机设备,该计算机设备的内部结构图可以如图1所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种目标检测模型训练方法和目标识别方法。
请参见图2,本申请一个实施例提供了一种目标检测模型训练方法和目标识别方法,可以应用于计算机设备、服务器、处理器等,以下实施例以该方法应用于图1中的计算机设备,用于对目标检测模型训练为例进行说明,包括以下步骤:
S100、对M张样本图像进行数据增广处理,得到N张训练图像,其中M、N均为不小于1的正整数,且M<N。
所述样本图像是指包含有目标的图像,所述样本图像作为训练的最原始图像,也就是最初始的图像训练样本集。所述训练图像是经过所述数据增广处理后的训练图像,也就是作为后续处理的样本集。所述数据增广用于增加训练图像数据集的丰富性,让所述训练图像数据集尽可能的多样化,从而使得训练得到的模型具有更强的泛化能力。通过所述数据增广处理对所述样本图像进行多样化处理,从而得到比所述样本图像数量更多的所述训练图像,以增加目标的背景丰富性。所述数据增广的方式可以通过水平/垂直翻转、旋转、缩放、裁剪、剪切、平移、对比度、色彩抖动、噪声等方式进行,本实施例不作具体限定,可根据实际情况具体选择或者设定。
S200、将所述N张训练图像输入至初始检测模型进行训练,得到第一训练模型。
所述初始检测模型可以采用YOLO V1、YOLO V2或YOLO V3等训练模型,每个所述初始检测模型具有多个BN(Batch Normalization)层,每个所述BN层代表一个通道,具有一个确定的缩放因子,不同的BN层对应具有不同的所述缩放因子。同理,训练得出的所述第一训练模型的每个所述BN层也对应有一个所述缩放因子。将所述N张训练图像输入至所述初始检测模型进行训练,例如:以像素为单位对所述N张训练图像进行数据处理和训练,例如可以进行特征提取、特征降维、特征空值处理、特征转换(one-hot)、特征归一化、目标值空值处理,目标值转换等以得到所述第一训练模型。本实施例中的训练可以建立在pytorch深度学习框架上,例如选用YOVO V3模型作为所述初始检测模型以提高所述训练模型的精度。所述N张训练图像的像素可以为608×608,批次大小为128,使用wramup学习率策略,对所述N张训练图像训练70个epoch。本实施例对于所述初始检测模型进行训练的具体过程不作限定,只需要满足基于所述N张训练图像的样本集训练得出所述第一训练模型的目的即可。
S300、对所述第一训练模型进行稀疏化和剪枝训练,得到第二训练模型。
所述稀疏化是指对所有BN层的所述缩放因子进行惩罚,减小所述缩放因子的数量,从而减小所述第一训练模型的体积和内部运算量。所述剪枝是指对所述第一训练模型中的部分通道进行去除,例如可以根据实际需要,按照一定规则对所述第一模型的部分通道进行去除。所述第二训练模型是指对所述第一训练模型进行稀疏化和剪枝训练后得到的训练模型,所述稀疏化和剪枝训练可以采用范式函数,例如L1 norm损失函数、L2 norm损失函数等,本实施例对于所述稀疏化和剪枝训练的具体方式不作限定,可根据实际情况具体选择或者设定,只需要满足可以实现对所述第一训练模型进行稀疏化和剪枝训练的功能即可。
S400、将所述N张训练图像输入至所述第二训练模型进行训练,得到目标检测模型。
所述N张训练图像是经过步骤S100对原始样本图像进行数据增广处理过的图像,所述第二训练模型是经过步骤S300进行稀疏化和剪枝训练得到训练模型,将所述N张训练图像作为所述第二训练模型的样本集对所述第二训练模型进行训练,训练方法可以与步骤S200中对所述第一训练模型的训练方法相同,例如均可以使用wramup学习率策略,对所述N张训练图像训练例如100个epoch,以得到所述目标检测模型。本实施例对于所述第二训练模型进行训练的具体过程不作限定,只需要满足基于所述N张训练图像的样本集训练得出所述目标检测模型的目的即可。
本申请实施例提供了一种目标检测模型训练方法,对预先获取的M张样本图像进行数据增广处理,得到N张训练图像,也就是形成训练样本集。然后基于所述训练样本集进行训练和处理得到目标检测模型。本申请实施例通过对所述M张样本图像进行数据增广处理,可以得到更为丰富的训练图像。将所述N张训练图像作为所述初始检测模型的样本集,极大的提高了训练样本的丰富性,使得所述目标检测模型可以从多个维度对目标进行检测或识别,可以有效避免目标的漏检极大的提高所述目标检测模型对于目标检测或者识别的准确度,解决了现有技术中存在的检测模型的检测效果不理想,容易发生漏掉目标的情况的技术问题,达到了提高目标检测模型全面性和准确度的技术效果。
请参见图3,在一个实施例中,所述N张训练图像包括:第一训练图像、第二训练图像和第三训练图像。所述步骤S100包括:步骤S110-步骤S130。
S110、对所述M张样本图像进行切图数据增广处理,得到N1张第一训练图像,其中N1为不小于1的正整数,且M<N1<N。
所述切图数据增广处理是指按照一定的规则对每张所述样本图像进行切图处理,例如可以对每张所述样本图像按照上下左右不同区域进行切割,或者以中心点为圆心,按一定的角度进行扇形切割,或者采用其他方式或者随机切割等均可。本实施例对于切割规则不作具体限定,可根据实际情况具体设定,只需要满足可以实现通过对所述样本图像进行切割以得到更多的所述第一训练图像的功能即可。例如当所述样本图像的数量为1万张时,经所述切图数据增广处理后的图像大约为3万张,即所述第一训练图像的数量N1为3万。目标所处的场景差异性较大,通过切图数据增广可以有效增加各种场景的负样本,将经过所述切图数据增广处理后的所有的包括无目标和有目标的图像集合起来,以减少在后续检测过程中可能出现的误识别或者漏检,从而提高对于本实施例所述目标检测模型目标识别的准确性。
S120、对所述M张样本图像进行HSV色域变化数据增广处理,得到N2张第二训练图像,其中N2为不小于1的正整数,且M<N2<N。
所述HSV色域是指针对图像的色调H、饱和度S和明度V。色调H是指所述样本图像的颜色,饱和度S是指所述样本图像的深浅,明度V是指所述样本图像的明暗变化。所述HSV色域变化数据增广是指通过对所述样本图像的色调H、饱和度S和明度V的参数进行调整,以增加具有不同色调H、饱和度S和明度V参数的图像,从而得到更多的图像,也就是得到更多的所述第二训练图像。例如当所述样本图像的数量M为1万张时,通过所述HSV色域变化数据增广处理后得到的所述第二训练图像的数量N2大约为3万张。本实施例对于所述HSV色域变化数据增广处理的具体过程和所述色调H、饱和度S和明度V参数改变等均不作任何限定,可根据实际情况具体选择或者设定。
S130、对所述M张样本图像进行马赛克数据增广处理,得到N3张第三训练图像,其中N1为不小于1的正整数,且M<N3<N。
所述马赛克数据增广是指mosaic数据增广或者mosaic数据增强,通过所述mosaic数据增广例如约一万张图像,也就是在所述M张样本图像的基础上再通过所述马赛克数据增广增加例如1万张样本图像,以丰富目标的背景。所述mosaic数据增广可以针对遮挡问题,通过随机擦除目标的特征模拟遮挡的效果,提高模型的泛化能力,使模型在训练过程中仅通过局部特征便可实现对目标的识别,强化模型对于目标局部特征的认知,弱化模型对于目标全部特征的依赖,同时通过这样的数据进行训练,模型也会对噪声和遮挡更具鲁棒性。
请参见图4,在一个实施例中,所述N1张第一训练图像包括第一切图图像和第二切图图像。所述步骤S110包括步骤S111-S112。
S111、对所述M张样本图像进行第一切图处理,得到N11张第一切图图像,其中N11为不小于1的正整数,且M<N11<N1。
所述第一切图处理是指分别对每张所述样本图像按照一定的规则分别截图生成新的图像,以形成更多的训练图像,也就是得到N11张第一切图图像,将所述N11张第一切图图像增加至原始的M张所述样本图像中,以丰富所述样本图像集。所述第一切图处理可以为按照上左、上中、上右、下左、下中、下右六个区域进行截图,也可以采用其他的规则进行截图,以使得在目标不够完整的情况下,仅通过部分特征便可实现对目标的识别,强化模型对于目标局部特征的认知以及对特定背景的认知,弱化模型对于目标全部特征的依赖。本实施例对于所述第一切图的规则不作具体限定,可根据实际情况具体设定,只需要满足可以得到更多的所述第一切图图像的目的即可。
S112、对所述M张样本图像进行第二切图处理,得到N12张第二切图图像,其中N12为不小于1的正整数,且M<N12<N1,所述第二切图处理与所述第一切图切图方式不同。
所述第二切图处理是指分别对每张所述样本图像按照一定的规则分别截图生成新的图像,以形成更多的训练图像,也就是得到N12张第二切图图像,将所述N12张第二切图图像增加至原始的M张所述样本图像中,以丰富所述样本图像集。所述第二切图处理可以为按照左右两个区域进行截图,也可以采用其他的规则进行截图,但需要指出的是,所述第二切除处理的规则和所述第一切图处理的规则不同。通过所述第二切图处理可以使得所述目标检测模型在目标不够完整的情况下,仅通过部分特征便可实现对目标的识别,强化模型对于目标局部特征的认知以及对特定背景的认知,弱化模型对于目标全部特征的依赖。本实施例对于所述第二切图的规则不作具体限定,可根据实际情况具体设定,只需要满足可以得到更多的所述第二切图图像的目的即可。
请参见图5,在一个实施例中,所述S110包括步骤S140-150:
S140、按照预设模型对所述M张样本图像进行切图处理,得到M1张切图图像。
所述预设模型是指对于所述M张样本图像进行切图的规则,例如可以按照左右两个区域对每张所述M张样本图像进行截图,或者按照上左、上中、上右、下左、下中、下右六个区域进行截图,或者也可以采用其他截图规则进行截图,以提高所述样本图像的丰富性。本实施例对于所述切图处理的规则或方式等均不作具体限定,可根据实际情况具体选择或者设定。
S150、对所述M1张切图图像进行筛选,去除无目标图像,得到所述N1张第一训练图像,所述无目标图像是指图像中未出现目标的图像。
所述M1张切图图像是经过切图处理后得到的大量的包含有目标和无目标的图像,例如当所述样本图像的数量M为1万张时,则所述切图图像的数量M1大约为3万张,然后通过筛选去除无目标图像。去除仅包含纯背景的图像,得到剩余的含有目标的图像,也就是所述第一训练图像,以精简所述样本图像,从而在保证所述目标检测模型的准确性的前提下减小所述目标检测模型的体积。
请参见图6,在一个实施例中,步骤S300包括S310-S320:
S310、确定预设区间,所述预设区间是指预设的缩放因子数值范围。
每个BN层,也就是每个通道对应有一个缩放因子,所述第一训练模型中具有多个通道,也就是对应有多个所述缩放因子,多个所述缩放因子具有不同的数值。所述预设区间就是根据实际情况对多个所述缩放因子进行取舍的范围,例如需要去除10%~50%之间的所述缩放因子,则所述预设区间即为10%~50%。
S320、去除所述第一训练模型中所述预设区间内的缩放因子对应的通道,得到所述第二训练模型。
所述预设区间也就是在步骤S310中确定的按照实际需要确定出的需要去除的所述缩放因子。每个通道也就是每个BN层对应有一个缩放因子,每个所述缩放因子与每个通道都是一一对应的。所述缩放因子与每个通道一一对应,按照所述预设区间对所述第一训练模型进行剪枝处理,也就是去除所述第一模型中所述缩放因子处于所述预设区间内的通道,以得到所述第二训练模型。通过剪枝处理便可实现在保证所述目标检测模型的准确性的前提下减小所述目标检测模型的体积。
请参见图7,在一个实施例中,步骤S310包括步骤S311-S312:
S311、对所述第一训练模型中的多个缩放因子按照大小进行排序,得到缩放因子序列表。
所述缩放因子序列表是指将多个所述缩放因子按照大小进行排序形成的缩放因子的排列表。每个通道对应有一个所述缩放因子,则所述第一训练模型中对应有多个所述缩放因子,对所述多个缩放因子按照数值大小进行排序,可以按照由小及大的顺序进行排序,也可以按照由大及小的顺序进行排序,以得到所述缩放因子序列表。
S312、在所述缩放因子序列表中,从最小数值的所述缩放因子开始,将连续的预设数量的所述缩放因子确定为所述预设区间。
所述预设数量是步骤S310中所述预设区间内所述缩放因子的数量,所述预设数量可以按照对所述第一训练模型进行稀疏化程度进行设置,例如可以100、200,或者可以为所述缩放因子总数的80%、90%等。
请参见图8,在一个实施例中,步骤S400包括步骤S410-S440:
S410、将所述N张训练图像输入至所述第二训练模型进行训练,得到中间检测模型。
所述第二训练模型是对所述第一训练模型进行稀疏化和剪枝训练得到的,本实施例中所述第二训练模型的训练方法和训练过程与步骤S200中对于所述初始检测模型的训练方法可以相同,例如均可以使用wramup学习率策略,对所述N张训练图像训练例如100或200个epoch。本实施例对于所述第二训练模型进行训练的具体过程不作限定,只需要满足基于所述N张训练图像的样本集训练得出所述中间检测模型的目的即可。
S420、计算所述中间检测模型的平均精度均值。
AP(Average precision)值是指平均精度值,将曲线下的面积当做衡量尺度对训练模型,也就是本实施例中的所述中间检测模型的准确率计算平均值。对于模型训练肯定会有多个epoch,对于多次epoch的所述中间检测模型的准确率取平均值,也就得到所述平均精度均值mAP(Mean average precision)。本实施例对于所述平均精度均值的确定方式不作具体限定,可根据实际情况具体选择。
S430、若所述平均精度均值不小于预设阈值,则确定所述中间检测模型为所述目标检测模型。
所述预设阈值可以根据实际情况具体选择或者设定,例如可以为50%、60%等。例如所述预设阈值为50%,在对所述中间检测模型训练100个epoch后,对所述中间检测模型进行测试得到的所述中间检测模型的平均精度均值为68.2%,则证明所述中间检测模型的准确度达到预设目标,则停止对于所述中间检测模型的训练,确定当前的所述中间检测模型为所述目标检测模型。
若所述平均精度均值小于预设阈值,则将所述中间检测模型确定为所述第一训练模型,并返回执行步骤S300所述对所述第一训练模型进行稀疏化和剪枝训练,得到第二训练模型。
对所述中间检测模型训练一定周期后,对所述中间检测模型的平均精度均值进行测试,当所述中间检测模型的平均精度还未达到所述预设阈值时,则证明此时的所述中间检测模型的准确度还比较低。此时,可以返回步骤S300,将所述中间检测模型作为所述第一训练模型,继续执行步骤S300,对所述中间检测模型的稀疏化程度和剪枝通道进一步调整,并继续进行多个周期的训练,以提高所述中间检测模型的准确性。
请参见图9,本申请一个实施例提供了一种目标识别方法,包括步骤S500-S700:
S500、获取待识别图像。
所述待识别图像可以为任意包括有目标的图像的图像集,所述待识别图像可以为任意场景或者环境下的图像。本实施例对于所述待识别图像的数量或者类别等均不作具体限定,可根据实际情况具体选择。
S600、将所述待识别图像输入至所述目标检测模型,通过所述目标检测模型对所述待识别图像进行目标识别处理,其中,所述目标检测模型通过如上所述的目标检测模型训练方法训练得到。
可以先对所述待识别图像的目标识别处理包括对所述待识别图像的预处理,将每张所述待识别图像通过拉伸、压缩等方法统一大小,或者提取每个候选区域的固定长度的特征,然后使用特定类别的线性SVM分类器对每个候选区域进行分类,最近进行BoundingBox回归,会得到一个回归值。然后对所述朳检测模型进行预训练、特征领域的微调、以及将所有候选区域与真实框重叠大于和等于0.5的作为该框类的正例,其余的在进行AVM分类。
S700、根据所述目标检测模型的目标识别处理结果确定目标。
通过步骤S600确定所述目标检测模型对于所述待识别图像的识别结果进行预测,根据在步骤S600中得到的回归值与所要预测的Grounding Truth之间的关系,反向推到Grounding Truth的位置或者根据得到的置信度参数等预测目标的位置,以达到确定目标的目的。
应该理解的是,虽然流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
请参见图10,本申请一个实施例提供了一种目标检测模型训练装置10,所述装置包括:数据增广模块100和模型训练模块200。
所述数据增广模块100用于对M张样本图像进行数据增广处理,得到N张训练图像,其中M、N均为不小于1的正整数,且M<N;
所述模型训练模块200用于将所述N张训练图像输入至初始检测模型进行训练,得到第一训练模型;对所述第一训练模型进行稀疏化和剪枝训练,得到第二训练模型;将所述N张训练图像输入至所述第二训练模型进行训练,得到目标检测模型。
所述数据增广模块100还用于对所述M张样本图像进行切图数据增广处理,得到N1张第一训练图像,其中N1为不小于1的正整数,且M<N1<N;对所述M张样本图像进行HSV色域变化数据增广处理,得到N2张第二训练图像,其中N2为不小于1的正整数,且M<N2<N;对所述M张样本图像进行马赛克数据增广处理,得到N3张第三训练图像,其中N1为不小于1的正整数,且M<N3<N。
所述数据增广模块100还用于对所述M张样本图像进行第一切图处理,得到N11张第一切图图像,其中N11为不小于1的正整数,且M<N11<N1;对所述M张样本图像进行第二切图处理,得到N12张第二切图图像,其中N12为不小于1的正整数,且M<N12<N1,所述第二切图处理与所述第一切图切图方式不同。
所述数据增广模块100还用于按照预设模型对所述M张样本图像进行切图处理,得到M1张切图图像;对所述M1张切图图像进行筛选,去除无目标图像,得到所述N1张第一训练图像,所述无目标图像是指图像中未出现目标的图像。
所述模型训练模块200还用于确定预设区间,所述预设区间是指预设的缩放因子数值范围;去除所述第一训练模型中所述预设区间内的缩放因子对应的通道,得到所述第二训练模型。
所述模型训练模块200还用于对所述第一训练模型中的多个缩放因子按照大小进行排序,得到缩放因子序列表;在所述缩放因子序列表中,从最小数值的所述缩放因子开始,将连续的预设数量的所述缩放因子确定为所述预设区间。
所述模型训练模块200还用于将所述N张训练图像输入至所述第二训练模型进行训练,得到中间检测模型;计算所述中间检测模型的平均精度均值;若所述平均精度均值不小于预设阈值,则确定所述中间检测模型为所述目标检测模型。
所述模型训练模块200还用于若所述平均精度均值小于预设阈值,则将所述中间检测模型确定为所述第一训练模型,并返回执行所述对所述第一训练模型进行稀疏化和剪枝训练,得到第二训练模型。
请参见图11,本申请一个实施例提供了一种目标识别装置20,所述装置包括:图像获取模块300、目标识别模块400和目标确定模块500。
图像获取模块300用于获取待识别图像;
目标识别模块400用于将所述待识别图像输入至所述目标检测模型,通过所述目标检测模型对所述待识别图像进行目标识别处理,其中,所述目标检测模型通过如上所述的目标检测模型训练方法训练得到;
目标确定模块500用于根据所述目标检测模型的目标识别处理结果确定目标。
关于所述目标检测模型训练装置10和所述目标识别装置20的具体限定可以参见上文中对于目标检测模型训练和目标识别方法的限定,在此不再赘述。上述所述目标检测模型训练装置10和所述目标识别装置20中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,包括:包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如下步骤:
对M张样本图像进行数据增广处理,得到N张训练图像,其中M、N均为不小于1的正整数,且M<N;
将所述N张训练图像输入至初始检测模型进行训练,得到第一训练模型;
对所述第一训练模型进行稀疏化和剪枝训练,得到第二训练模型;
将所述N张训练图像输入至所述第二训练模型进行训练,得到目标检测模型。
在一个实施例中,处理器执行计算机程序时还实现:对所述M张样本图像进行切图数据增广处理,得到N1张第一训练图像,其中N1为不小于1的正整数,且M<N1<N;对所述M张样本图像进行HSV色域变化数据增广处理,得到N2张第二训练图像,其中N2为不小于1的正整数,且M<N2<N;对所述M张样本图像进行马赛克数据增广处理,得到N3张第三训练图像,其中N1为不小于1的正整数,且M<N3<N。
在一个实施例中,处理器执行计算机程序时还实现:对对所述M张样本图像进行第一切图处理,得到N11张第一切图图像,其中N11为不小于1的正整数,且M<N11<N1;对所述M张样本图像进行第二切图处理,得到N12张第二切图图像,其中N12为不小于1的正整数,且M<N12<N1,所述第二切图处理与所述第一切图切图方式不同。
在一个实施例中,处理器执行计算机程序时还实现:对按照预设模型对所述M张样本图像进行切图处理,得到M1张切图图像;对所述M1张切图图像进行筛选,去除无目标图像,得到所述N1张第一训练图像,所述无目标图像是指图像中未出现目标的图像。
在一个实施例中,处理器执行计算机程序时还实现:对确定预设区间,所述预设区间是指预设的缩放因子数值范围;去除所述第一训练模型中所述预设区间内的缩放因子对应的通道,得到所述第二训练模型。
在一个实施例中,处理器执行计算机程序时还实现:对所述第一训练模型中的多个缩放因子按照大小进行排序,得到缩放因子序列表;在所述缩放因子序列表中,从最小数值的所述缩放因子开始,将连续的预设数量的所述缩放因子确定为所述预设区间。
在一个实施例中,处理器执行计算机程序时还实现:将所述N张训练图像输入至所述第二训练模型进行训练,得到中间检测模型;计算所述中间检测模型的平均精度均值;若所述平均精度均值不小于预设阈值,则确定所述中间检测模型为所述目标检测模型。
在一个实施例中,处理器执行计算机程序时还实现:若所述平均精度均值小于预设阈值,则将所述中间检测模型确定为所述第一训练模型,并返回执行所述对所述第一训练模型进行稀疏化和剪枝训练,得到第二训练模型。
在一个实施例中,处理器执行计算机程序时还实现:
获取待识别图像;
将所述待识别图像输入至所述目标检测模型,通过所述目标检测模型对所述待识别图像进行目标识别处理,其中,所述目标检测模型通过如上所述的目标检测模型训练方法训练得到;
根据所述目标检测模型的目标识别处理结果确定目标。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如下步骤:
对M张样本图像进行数据增广处理,得到N张训练图像,其中M、N均为不小于1的正整数,且M<N;
将所述N张训练图像输入至初始检测模型进行训练,得到第一训练模型;
对所述第一训练模型进行稀疏化和剪枝训练,得到第二训练模型;
将所述N张训练图像输入至所述第二训练模型进行训练,得到目标检测模型。
在一个实施例中,计算机程序被处理器执行时还实现:对所述M张样本图像进行切图数据增广处理,得到N1张第一训练图像,其中N1为不小于1的正整数,且M<N1<N;对所述M张样本图像进行HSV色域变化数据增广处理,得到N2张第二训练图像,其中N2为不小于1的正整数,且M<N2<N;对所述M张样本图像进行马赛克数据增广处理,得到N3张第三训练图像,其中N1为不小于1的正整数,且M<N3<N。
在一个实施例中,计算机程序被处理器执行时还实现:对所述M张样本图像进行第一切图处理,得到N11张第一切图图像,其中N11为不小于1的正整数,且M<N11<N1;对所述M张样本图像进行第二切图处理,得到N12张第二切图图像,其中N12为不小于1的正整数,且M<N12<N1,所述第二切图处理与所述第一切图的切图方式不同。
在一个实施例中,计算机程序被处理器执行时还实现:对按照预设模型对所述M张样本图像进行切图处理,得到M1张切图图像;对所述M1张切图图像进行筛选,去除无目标图像,得到所述N1张第一训练图像,所述无目标图像是指图像中未出现目标的图像。
在一个实施例中,计算机程序被处理器执行时还实现:对确定预设区间,所述预设区间是指预设的缩放因子数值范围;去除所述第一训练模型中所述预设区间内的缩放因子对应的通道,得到所述第二训练模型。
在一个实施例中,计算机程序被处理器执行时还实现:对所述第一训练模型中的多个缩放因子按照大小进行排序,得到缩放因子序列表;在所述缩放因子序列表中,从最小数值的所述缩放因子开始,将连续的预设数量的所述缩放因子确定为所述预设区间。
在一个实施例中,计算机程序被处理器执行时还实现:将所述N张训练图像输入至所述第二训练模型进行训练,得到中间检测模型;计算所述中间检测模型的平均精度均值;若所述平均精度均值不小于预设阈值,则确定所述中间检测模型为所述目标检测模型。
在一个实施例中,计算机程序被处理器执行时还实现:若所述平均精度均值小于预设阈值,则将所述中间检测模型确定为所述第一训练模型,并返回执行所述对所述第一训练模型进行稀疏化和剪枝训练,得到第二训练模型。
在一个实施例中,计算机程序被处理器执行时还实现:
获取待识别图像;
将所述待识别图像输入至所述目标检测模型,通过所述目标检测模型对所述待识别图像进行目标识别处理,其中,所述目标检测模型通过如上所述的目标检测模型训练方法训练得到;
根据所述目标检测模型的目标识别处理结果确定目标。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (13)
1.一种目标检测模型训练方法,其特征在于,所述方法包括:
对M张样本图像进行数据增广处理,得到N张训练图像,其中M、N均为不小于1的正整数,且M<N;
将所述N张训练图像输入至初始检测模型进行训练,得到第一训练模型;
对所述第一训练模型进行稀疏化和剪枝训练,得到第二训练模型;
将所述N张训练图像输入至所述第二训练模型进行训练,得到目标检测模型。
2.根据权利要求1所述的目标检测模型训练方法,其特征在于,所述N张训练图像包括:第一训练图像、第二训练图像和第三训练图像;所述对所述M张样本图像进行数据增广处理,得到N张训练图像,包括:
对所述M张样本图像进行切图数据增广处理,得到N1张第一训练图像,其中N1为不小于1的正整数,且M<N1<N;
对所述M张样本图像进行HSV色域变化数据增广处理,得到N2张第二训练图像,其中N2为不小于1的正整数,且M<N2<N;
对所述M张样本图像进行马赛克数据增广处理,得到N3张第三训练图像,其中N1为不小于1的正整数,且M<N3<N。
3.根据权利要求2所述的目标检测模型训练方法,其特征在于,所述N1张第一训练图像包括第一切图图像和第二切图图像;所述对所述M张样本图像进行切图数据增广处理,得到N1张第一训练图像,包括:
对所述M张样本图像进行第一切图处理,得到N11张第一切图图像,其中N11为不小于1的正整数,且M<N11<N1;
对所述M张样本图像进行第二切图处理,得到N12张第二切图图像,其中N12为不小于1的正整数,且M<N12<N1,所述第二切图处理与所述第一切图切图方式不同。
4.根据权利要求2所述的目标检测模型训练方法,其特征在于,所述对所述M张样本图像进行切图数据增广处理,得到N1张第一训练图像,包括:
按照预设模型对所述M张样本图像进行切图处理,得到M1张切图图像;
对所述M1张切图图像进行筛选,去除无目标图像,得到所述N1张第一训练图像,所述无目标图像是指图像中未出现目标的图像。
5.根据权利要求1所述的目标检测模型训练方法,其特征在于,所述对所述第一训练模型进行稀疏化和剪枝训练,得到第二训练模型,包括:
确定预设区间,所述预设区间是指预设的缩放因子数值范围;
去除所述第一训练模型中所述预设区间内的缩放因子对应的通道,得到所述第二训练模型。
6.根据权利要求5所述的目标检测模型训练方法,其特征在于,所述确定预设区间,包括:
对所述第一训练模型中的多个缩放因子按照大小进行排序,得到缩放因子序列表;
在所述缩放因子序列表中,从最小数值的所述缩放因子开始,将连续的预设数量的所述缩放因子确定为所述预设区间。
7.根据权利要求1所述的目标检测模型训练方法,其特征在于,所述将所述N张训练图像输入至所述第二训练模型进行训练,得到目标检测模型,包括:
将所述N张训练图像输入至所述第二训练模型进行训练,得到中间检测模型;
计算所述中间检测模型的平均精度均值;
若所述平均精度均值不小于预设阈值,则确定所述中间检测模型为所述目标检测模型。
8.根据权利要求7所述的目标检测模型训练方法,其特征在于,还包括:
若所述平均精度均值小于预设阈值,则将所述中间检测模型确定为所述第一训练模型,并返回执行所述对所述第一训练模型进行稀疏化和剪枝训练,得到第二训练模型。
9.一种目标检测模型训练装置,其特征在于,所述装置包括:
数据增广模块,用于对M张样本图像进行数据增广处理,得到N张训练图像,其中M、N均为不小于1的正整数,且M<N;
模型训练模块,用于将所述N张训练图像输入至初始检测模型进行训练,得到第一训练模型;对所述第一训练模型进行稀疏化和剪枝训练,得到第二训练模型;将所述N张训练图像输入至所述第二训练模型进行训练,得到目标检测模型。
10.一种目标识别方法,其特征在于,包括:
获取待识别图像;
将所述待识别图像输入至所述目标检测模型,通过所述目标检测模型对所述待识别图像进行目标识别处理,其中,所述目标检测模型通过如权利要求1-8任一项所述的目标检测模型训练方法训练得到;
根据所述目标检测模型的目标识别处理结果确定目标。
11.一种目标识别装置,其特征在于,所述装置包括:
图像获取模块,用于获取待识别图像;
目标识别模块,用于将所述待识别图像输入至所述目标检测模型,通过所述目标检测模型对所述待识别图像进行目标识别处理,其中,所述目标检测模型通过如权利要求1-8任一项所述的目标检测模型训练方法训练得到;
目标确定模块,用于根据所述目标检测模型的目标识别处理结果确定目标。
12.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至9中任一项所述的方法的步骤。
13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至9中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010705176.2A CN111814902A (zh) | 2020-07-21 | 2020-07-21 | 目标检测模型训练方法、目标识别方法、装置和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010705176.2A CN111814902A (zh) | 2020-07-21 | 2020-07-21 | 目标检测模型训练方法、目标识别方法、装置和介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111814902A true CN111814902A (zh) | 2020-10-23 |
Family
ID=72861091
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010705176.2A Pending CN111814902A (zh) | 2020-07-21 | 2020-07-21 | 目标检测模型训练方法、目标识别方法、装置和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111814902A (zh) |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112835589A (zh) * | 2021-01-05 | 2021-05-25 | 南方电网数字电网研究院有限公司 | 一种隐藏代码的激活方法 |
US11403069B2 (en) | 2017-07-24 | 2022-08-02 | Tesla, Inc. | Accelerated mathematical engine |
US11409692B2 (en) | 2017-07-24 | 2022-08-09 | Tesla, Inc. | Vector computational unit |
US11487288B2 (en) | 2017-03-23 | 2022-11-01 | Tesla, Inc. | Data synthesis for autonomous control systems |
US11537811B2 (en) | 2018-12-04 | 2022-12-27 | Tesla, Inc. | Enhanced object detection for autonomous vehicles based on field view |
US11562231B2 (en) | 2018-09-03 | 2023-01-24 | Tesla, Inc. | Neural networks for embedded devices |
US11561791B2 (en) | 2018-02-01 | 2023-01-24 | Tesla, Inc. | Vector computational unit receiving data elements in parallel from a last row of a computational array |
US11567514B2 (en) | 2019-02-11 | 2023-01-31 | Tesla, Inc. | Autonomous and user controlled vehicle summon to a target |
US11610117B2 (en) | 2018-12-27 | 2023-03-21 | Tesla, Inc. | System and method for adapting a neural network model on a hardware platform |
US11636333B2 (en) | 2018-07-26 | 2023-04-25 | Tesla, Inc. | Optimizing neural network structures for embedded systems |
US11665108B2 (en) | 2018-10-25 | 2023-05-30 | Tesla, Inc. | QoS manager for system on a chip communications |
US11681649B2 (en) | 2017-07-24 | 2023-06-20 | Tesla, Inc. | Computational array microprocessor system using non-consecutive data formatting |
US11734562B2 (en) | 2018-06-20 | 2023-08-22 | Tesla, Inc. | Data pipeline and deep learning system for autonomous driving |
US11748620B2 (en) | 2019-02-01 | 2023-09-05 | Tesla, Inc. | Generating ground truth for machine learning from time series elements |
US11790664B2 (en) | 2019-02-19 | 2023-10-17 | Tesla, Inc. | Estimating object properties using visual image data |
US11816585B2 (en) | 2018-12-03 | 2023-11-14 | Tesla, Inc. | Machine learning models operating at different frequencies for autonomous vehicles |
US11841434B2 (en) | 2018-07-20 | 2023-12-12 | Tesla, Inc. | Annotation cross-labeling for autonomous control systems |
US11893393B2 (en) | 2017-07-24 | 2024-02-06 | Tesla, Inc. | Computational array microprocessor system with hardware arbiter managing memory requests |
US11893774B2 (en) | 2018-10-11 | 2024-02-06 | Tesla, Inc. | Systems and methods for training machine models with augmented data |
US12014553B2 (en) | 2019-02-01 | 2024-06-18 | Tesla, Inc. | Predicting three-dimensional features for autonomous driving |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180068198A1 (en) * | 2016-09-06 | 2018-03-08 | Carnegie Mellon University | Methods and Software for Detecting Objects in an Image Using Contextual Multiscale Fast Region-Based Convolutional Neural Network |
CN110895714A (zh) * | 2019-12-11 | 2020-03-20 | 天津科技大学 | 一种YOLOv3的网络压缩方法 |
CN111079623A (zh) * | 2019-12-09 | 2020-04-28 | 成都睿沿科技有限公司 | 一种目标检测方法、装置及存储介质 |
-
2020
- 2020-07-21 CN CN202010705176.2A patent/CN111814902A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180068198A1 (en) * | 2016-09-06 | 2018-03-08 | Carnegie Mellon University | Methods and Software for Detecting Objects in an Image Using Contextual Multiscale Fast Region-Based Convolutional Neural Network |
CN111079623A (zh) * | 2019-12-09 | 2020-04-28 | 成都睿沿科技有限公司 | 一种目标检测方法、装置及存储介质 |
CN110895714A (zh) * | 2019-12-11 | 2020-03-20 | 天津科技大学 | 一种YOLOv3的网络压缩方法 |
Non-Patent Citations (1)
Title |
---|
姚巍巍;张洁;: "基于模型剪枝和半精度加速改进YOLOv3-tiny算法的实时司机违章行为检测", 计算机***应用, no. 04, pages 45 - 51 * |
Cited By (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US12020476B2 (en) | 2017-03-23 | 2024-06-25 | Tesla, Inc. | Data synthesis for autonomous control systems |
US11487288B2 (en) | 2017-03-23 | 2022-11-01 | Tesla, Inc. | Data synthesis for autonomous control systems |
US11681649B2 (en) | 2017-07-24 | 2023-06-20 | Tesla, Inc. | Computational array microprocessor system using non-consecutive data formatting |
US11403069B2 (en) | 2017-07-24 | 2022-08-02 | Tesla, Inc. | Accelerated mathematical engine |
US11409692B2 (en) | 2017-07-24 | 2022-08-09 | Tesla, Inc. | Vector computational unit |
US11893393B2 (en) | 2017-07-24 | 2024-02-06 | Tesla, Inc. | Computational array microprocessor system with hardware arbiter managing memory requests |
US11797304B2 (en) | 2018-02-01 | 2023-10-24 | Tesla, Inc. | Instruction set architecture for a vector computational unit |
US11561791B2 (en) | 2018-02-01 | 2023-01-24 | Tesla, Inc. | Vector computational unit receiving data elements in parallel from a last row of a computational array |
US11734562B2 (en) | 2018-06-20 | 2023-08-22 | Tesla, Inc. | Data pipeline and deep learning system for autonomous driving |
US11841434B2 (en) | 2018-07-20 | 2023-12-12 | Tesla, Inc. | Annotation cross-labeling for autonomous control systems |
US11636333B2 (en) | 2018-07-26 | 2023-04-25 | Tesla, Inc. | Optimizing neural network structures for embedded systems |
US11562231B2 (en) | 2018-09-03 | 2023-01-24 | Tesla, Inc. | Neural networks for embedded devices |
US11983630B2 (en) | 2018-09-03 | 2024-05-14 | Tesla, Inc. | Neural networks for embedded devices |
US11893774B2 (en) | 2018-10-11 | 2024-02-06 | Tesla, Inc. | Systems and methods for training machine models with augmented data |
US11665108B2 (en) | 2018-10-25 | 2023-05-30 | Tesla, Inc. | QoS manager for system on a chip communications |
US11816585B2 (en) | 2018-12-03 | 2023-11-14 | Tesla, Inc. | Machine learning models operating at different frequencies for autonomous vehicles |
US11537811B2 (en) | 2018-12-04 | 2022-12-27 | Tesla, Inc. | Enhanced object detection for autonomous vehicles based on field view |
US11908171B2 (en) | 2018-12-04 | 2024-02-20 | Tesla, Inc. | Enhanced object detection for autonomous vehicles based on field view |
US11610117B2 (en) | 2018-12-27 | 2023-03-21 | Tesla, Inc. | System and method for adapting a neural network model on a hardware platform |
US11748620B2 (en) | 2019-02-01 | 2023-09-05 | Tesla, Inc. | Generating ground truth for machine learning from time series elements |
US12014553B2 (en) | 2019-02-01 | 2024-06-18 | Tesla, Inc. | Predicting three-dimensional features for autonomous driving |
US11567514B2 (en) | 2019-02-11 | 2023-01-31 | Tesla, Inc. | Autonomous and user controlled vehicle summon to a target |
US11790664B2 (en) | 2019-02-19 | 2023-10-17 | Tesla, Inc. | Estimating object properties using visual image data |
CN112835589A (zh) * | 2021-01-05 | 2021-05-25 | 南方电网数字电网研究院有限公司 | 一种隐藏代码的激活方法 |
CN112835589B (zh) * | 2021-01-05 | 2022-03-04 | 南方电网数字电网研究院有限公司 | 一种隐藏代码的激活方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111814902A (zh) | 目标检测模型训练方法、目标识别方法、装置和介质 | |
CN109977943B (zh) | 一种基于yolo的图像目标识别方法、***和存储介质 | |
WO2019100724A1 (zh) | 训练多标签分类模型的方法和装置 | |
CN111754396B (zh) | 脸部图像处理方法、装置、计算机设备和存储介质 | |
CN110765860A (zh) | 摔倒判定方法、装置、计算机设备及存储介质 | |
KR20180065889A (ko) | 타겟의 검측 방법 및 장치 | |
CN112132156A (zh) | 多深度特征融合的图像显著性目标检测方法及*** | |
CN111935479B (zh) | 一种目标图像确定方法、装置、计算机设备及存储介质 | |
KR20170026222A (ko) | 이미지의 객체를 분류하기 위한 방법 및 디바이스, 및 대응하는 컴퓨터 프로그램 제품 및 컴퓨터 판독가능한 매체 | |
CN112001403B (zh) | 一种图像轮廓检测方法及*** | |
CN110222718A (zh) | 图像处理的方法及装置 | |
CN112836625A (zh) | 人脸活体检测方法、装置、电子设备 | |
CN110852327A (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN111179270A (zh) | 基于注意力机制的图像共分割方法和装置 | |
CN113705294A (zh) | 一种基于人工智能的图像识别方法、装置 | |
CN116206334A (zh) | 一种野生动物识别方法和装置 | |
CN111178310A (zh) | 手掌特征识别方法、装置、计算机设备和存储介质 | |
CN113065379A (zh) | 融合图像质量的图像检测方法、装置、电子设备 | |
CN112818774A (zh) | 一种活体检测方法及装置 | |
CN117173677A (zh) | 手势识别方法、装置、设备及存储介质 | |
CN115937596A (zh) | 目标检测方法及其模型的训练方法、设备以及存储介质 | |
CN112699809B (zh) | 痘痘类别识别方法、装置、计算机设备及存储介质 | |
CN115115552A (zh) | 图像矫正模型训练及图像矫正方法、装置和计算机设备 | |
CN111582057B (zh) | 一种基于局部感受野的人脸验证方法 | |
CN112084874B (zh) | 一种物体检测方法、装置及终端设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: Room 86, room 406, No.1, Yichuang street, Zhongxin Guangzhou Knowledge City, Huangpu District, Guangzhou City, Guangdong Province Applicant after: Southern Power Grid Digital Grid Research Institute Co.,Ltd. Address before: 511458 Room 1301, Chengtou Building, 106 Fengze East Road, Nansha District, Guangzhou City, Guangdong Province (self-compiled 1301-12159) Applicant before: Southern Power Grid Digital Grid Research Institute Co.,Ltd. |