WO2021056914A1

WO2021056914A1 - 一种目标检测模型的自动建模方法及装置

Info

Publication number: WO2021056914A1
Application number: PCT/CN2019/130024
Authority: WO
Inventors: 刘红丽; 李峰; 刘鑫
Original assignee: 苏州浪潮智能科技有限公司
Priority date: 2019-09-25
Filing date: 2019-12-30
Publication date: 2021-04-01
Also published as: EP4036796A1; JP2022548293A; CN110705573A; EP4036796A4; JP7335430B2; KR20220051383A; US20220383627A1

Abstract

一种目标检测模型的自动建模方法，该方法包括：S1、根据预定的第一神经网络搜索NAS网络模型；S2、利用训练集训练第一目标检测模型；当训练次数达到第一预设次数后，利用验证集对当前的第一目标检测模型进行评估；并输出评估结果；其中，所述第一目标检测模型是所述NAS网络模型和第二目标检测模型的检测部分融合得到的模型；S3、计算所述当前的第一目标检测模型对应的reward；S4、根据所述reward调整搜索所述NAS网络模型所用的参数；重复步骤S1-S4第二预设次数，根据所述评估结果确定最优的第一目标检测模型。本发明还公开了自动建模装置。本发明提供的方法和装置能够根据不同任务搜索出不同模型，提高了目标检测效果。

Description

一种目标检测模型的自动建模方法及装置

本申请要求于2019年9月25日提交中国专利局、申请号为201910912868.1、发明名称为“一种目标检测模型的自动建模方法及装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本发明涉及目标检测领域，尤其涉及目标检测领域中一种自动建模方法及装置。

背景技术

目标检测作为图像处理和计算机视觉领域中的经典课题，在交通监控、图像检索、人机交互等方面有着广泛的应用。它旨在一个静态图像(或动态视频)中检测出人们感兴趣的目标对象。目前比较流行的算法有Yolo、SSD、R-CNN系算法等。但是，现有目标检测算法采用固定网络结构提取图像特征，不能根据不同任务和数据特点采用不同网络结构提取最合适的图像特征，使得人工设计的目标检测模型只能针对特定任务实现较高精度，缺乏灵活性。

发明内容

本发明要解决的技术问题是提供一种目标检测模型的自动建模方法，能够根据不同任务搜索出不同模型，提高目标检测效果。

为了解决上述技术问题，本发明实施例提供了一种目标检测模型的自动建模方法，包括：

S1、根据预定的第一神经网络搜索神经网络结构搜索NAS网络模型；

S2、利用训练集训练第一目标检测模型；当训练次数达到第一预设次数后，利用验证集对当前的第一目标检测模型进行评估；并输出评估结果；其中，所述第一目标检测模型是所述NAS网络模型和第二目标检测模型的检测部分融合得到的模型；

S3、计算所述当前的第一目标检测模型对应的目标检测任务奖励 reward；

S4、根据所述目标检测任务奖励reward调整搜索所述NAS网络模型所用的参数；

重复步骤S1-S4第二预设次数，根据所述评估结果确定最优的第一目标检测模型。

优选地，所述第一神经网络为循环神经网络RNN；

步骤S1包括：

步骤S11、根据预先配置的超参数通过循环神经网络RNN控制器采样，获取子网络结构编码；其中，所述超参数包括子网络超参数、控制器的超参数；子网络超参数包括子网络的层数、cell分支数目、与子网络学习率相关的参数、输出通道数目；控制器的超参数包括与控制器学习率相关的参数、优化器配置参数；

步骤S12、通过解码器对所述子网络结构编码进行解码，输出NAS网络模型。

优选地，所述NAS网络模型为没有全连接层的NAS网络；

所述NAS网络和所述第一目标检测模型的检测部分融合是指：

所述NAS网络模型的多个不同尺度的输出端各自连接一个1*1卷积层，将所述1*1卷积层的输出作为所述第二目标检测模型的检测部分的输入。

优选地，根据所述评估结果确定最优的第一目标检测模型后，包括：

利用训练集对评估结果最优的第一目标检测模型进行训练，并对所述训练后的评估结果最优的第一目标检测模型在测试集上进行测试。

优选地，所述第二目标检测模型包括Yolo。

优选地，利用验证集对当前的第一目标检测模型进行评估，包括：

利用验证集对当前的第一目标检测模型进行均值平均精度MAP评估；

根据所述评估结果确定最优的第一目标检测模型，包括：

将第二预设次数内最大的MAP对应的第一目标检测模型确定为最优的第一目标检测模型。

优选地，计算所述当前的第一目标检测模型对应的目标检测任务奖励 reward，包括：

其中

其中，L _cla为分类loss，L _reg为回归loss，所述baseline为预设的数值或公式。

优选地，根据所述reward调整搜索所述NAS网络模型所用的参数，包括：

将所述reward反馈到所述RNN控制器，

通过

更新所述RNN控制器的可训练参数；其中，θ表示所述RNN控制器的可训练参数，

表示所述可训练参数的反向传播梯度，γ表示预设参数，logπ _θ(s _t，a _t)为第t次执行步骤S1时搜索到的NAS网络模型对应的交叉熵loss，R _t表示第t次执行步骤S1时搜索到的NAS网络模型对应的reward值。

为了解决上述技术问题，本发明实施例还提供了一种目标检测模型的自动建模装置，包括：存储器和处理器；

所述存储器，用于保存用于目标检测模型的自动建模的程序；

所述处理器，用于读取执行所述用于目标检测模型的自动建模的程序，执行如下操作：

优选地，所述第一神经网络为循环神经网络RNN；

步骤S1包括：

优选地，所述NAS网络模型为没有全连接层的NAS网络；

所述NAS网络和所述第一目标检测模型的检测部分融合是指：

优选地，所述处理器，用于读取执行所述用于目标检测模型的自动建模的程序，执行如下操作：

根据所述评估结果确定最优的第一目标检测模型后，利用训练集对评估结果最优的第一目标检测模型进行训练，并对所述训练后的评估结果最优的第一目标检测模型在测试集上进行测试。

优选地，所述第二目标检测模型包括Yolo。

根据所述评估结果确定最优的第一目标检测模型，包括：

优选地，计算所述当前的第一目标检测模型对应的目标检测任务奖励reward，包括：

其中

将所述reward反馈到所述RNN控制器，

通过

综上，本发明实施例提供一种目标检测模型的自动建模方法及装置，通过将根据不同任务搜索出的用于特征提取模型与现有技术中的目标检测模型融合形成新的目标检测模型，提高了目标检测效果。

附图说明

图1为根据本发明实施例的一种目标检测模型的自动建模方法的示意图。

图2为根据本发明实施例的目标检测模型的自动建模的流程图。

图3为根据本发明实施例的Yolo3的原理图。

图4为根据本发明实施例的Yolo3-NAS模型的自动建模示意图。

图5为根据本发明实施例的目标检测模型的自动建模装置的示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白，下文中将结合附图对本发明的实施例进行详细说明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互任意组合。

实施例一

图1为本发明实施例的一种目标检测模型的自动建模方法的示意图，如图1所示，本实施例的自动建模方法包括：

S1、根据预定的第一神经网络搜索NAS网络模型。

一种示例性的实施例中，所述第一神经网络可以为循环神经网络RNN；NAS网络模型指神经网络结构搜索(Neural Architecture Search)网络模型

步骤S1可以包括：

一种示例性的实施例中，所述NAS网络模型为没有全连接层的NAS网络；

一种示例性的实施例中，所述NAS网络和所述第一目标检测模型的检测部分融合是指：

一种示例性的实施例中，利用验证集对当前的第一目标检测模型进行评估，可以包括：

其中，所述第二目标检测模型可以包括Yolo。Yolo(You Only Live Once)是基于深度神经网络的对象识别和定位算法。其属于一步走(one-stage)算法，即直接对输入图像应用算法并输出类别和相应的定位。

一种示例性的实施例中，根据所述评估结果确定最优的第一目标检测模型，可以包括：

S3、计算所述当前的第一目标检测模型对应的目标检测任务奖励reward。

一种示例性的实施例中，计算所述当前的第一目标检测模型对应的目标检测任务奖励reward，包括：

其中

一种示例性的实施例中，根据所述reward调整搜索所述NAS网络模型所用的参数，包括：

将所述reward反馈到所述RNN控制器，

通过

其中，NAS网络模型所用的参数可以包括RNN控制器的可训练参数。

S5、重复步骤S1-S4第二预设次数，根据所述评估结果确定最优的第一目标检测模型。

一种示例性的实施例中，根据所述评估结果确定最优的第一目标检测模型后，可以包括：

实施例2

图2为本发明实施例的一种目标检测模型的自动建模方法的示意图。如图2所示，包括步骤如下：

步骤201：初始化输入。

初始化输入包括超参数配置和数据库读入数据集。其中，超参数可包括子网络超参数和控制器超参数。其中，子网络超参数主要包括子网络的层数、cell分支数目、模型学习率相关参数、输出通道数目等。子网络的层数就是cell的个数，子网络学习率相关的参数指，如指数衰减中的衰减率、衰减步骤等。上述数据集可以包括训练集、验证集和测试集。

步骤202：采用RNN网络作为控制器，采样输出子网络结构编码。

步骤203：通过解码器输出NAS网络模型，并融合Yolo3的输出部分，形成Yolo3-NAS模型。

如图3所示，当前Yolo3采用Darknet-53的网络结构提取图像特征，在检测部分，参考了FPN(feature pyramid networks)的思想。

如图4所示，本发明将Yolo3中特征提取网络Darknet-53替换为自动搜索生成的NAS网络(normal cell和reduce cell叠加)，通过去掉NAS网络模型的全连接层，并在NAS网络模型的多个输出端添加1*1卷积来与Yolo的检测输出部分融合，形成Yolo3-NAS模型。需要说明的是，本实施例以Yolo3为基础进行说明，但在实际应用中不仅局限于Yolo3，其它目标检测模型也可以此方式改进。

步骤204：在训练集上训练Yolo3-NAS模型，达到预设的训练次数后，通过验证集验证Yolo3-NAS模型，并输出评估结果。

其中，评估结果可以用均值平均精度MAP评估。其中MAP评估为现有技术，在此不再赘述。

步骤205：计算Yolo3-NAS模型对应的目标检测任务奖励reward。

其中，奖励(reward)的计算公式为：

其中

其中，L _cla为分类loss，L _reg为回归loss，baseline为预设的数值或公式。目标检测有分类和回归两部分，分类就是目标检测中目标类别是否分类正确，回归就是目标的位置是否正确。分类和回归对应的loss就是分类loss和回归loss。同时本发明通过函数扩大激励效果(由(-1，1)扩大至(-∞，∞))，使得控制器参数更新更快，即更快的搜索到最佳模型结构。

步骤206：将reward反馈到控制器，更新该控制器的可训练参数。

其中，更新控制器参数公式为

其中，θ表示所述RNN控制器的可训练参数，

表示所述可训练参数的反向传播梯度，γ表示预设参数，logπ _θ(s _t，a _t)可理解为第t次结构(第t次执行步骤S1时搜索到的NAS网络模型)对应的交叉熵loss。为了确保这个结构真的是“正确的”,我们的loss在原本基础上乘以R _t(第t次结构(第t次执行步骤S1时搜索到的NAS网络模型)对应的reward值),用reward来反馈这个交叉熵算出来的梯度是不是一个值得信任的梯度。如果reward小，或者是负的，说明这个梯度下降是一个错误的方向，我们应该向着另一个方向更新参数，如果reward是正的,或很大，说明这个梯度下降是一个正确的方向，并朝着这个方向更新参数。

步骤207：重复上述步骤202-206预设次数，该预设次数的评估结果最大的作为搜索到的最佳子网络模型(也即所述NAS网络模型和第二目标检测模型的检测部分融合得到的模型)，重新训练并在测试集上测试其最终效果。

本发明通过将目标检测改为自动搜索最佳模型方式，可根据不同任务搜索出不同模型，从而有针对性地提高检测效果。

图5为本发明实施例的一种目标检测模型的自动建模装置的示意图，如图5所示，本实施例的自动建模装置包括：存储器和处理器；

S3、计算所述当前的第一目标检测模型对应的目标检测任务奖励reward；

可选地，所述第一神经网络为循环神经网络RNN；

可选地，步骤S1包括：

可选地，所述NAS网络模型为没有全连接层的NAS网络；

可选地，所述NAS网络和所述第一目标检测模型的检测部分融合是指：

可选地，所述处理器，用于读取执行所述用于目标检测模型的自动建模的程序，执行如下操作：

可选地，所述第二目标检测模型包括Yolo。

可选地，利用验证集对当前的第一目标检测模型进行评估，包括：

可选地，根据所述评估结果确定最优的第一目标检测模型，包括：

可选地，计算所述当前的第一目标检测模型对应的目标检测任务奖励reward，包括：

其中

可选地，根据所述reward调整搜索所述NAS网络模型所用的参数，包括：

将所述reward反馈到所述RNN控制器，

通过

本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件完成，所述程序可以存储于计算机可读存储介质中，如只读存储器、磁盘或光盘等。可选地，上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地，上述实施例中的各模块/单元可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。本发明不限制于任何特定形式的硬件和软件的结合。

以上仅为本发明的优选实施例，当然，本发明还可有其他多种实施例，在不背离本发明精神及其实质的情况下，熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形，但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

Claims

一种目标检测模型的自动建模方法，其特征在于，包括：

S1、根据预定的第一神经网络搜索神经网络结构搜索NAS网络模型；

S2、利用训练集训练第一目标检测模型；当训练次数达到第一预设次数后，利用验证集对当前的第一目标检测模型进行评估；并输出评估结果；其中，所述第一目标检测模型是所述NAS网络模型和第二目标检测模型的检测部分融合得到的模型；

S3、计算所述当前的第一目标检测模型对应的目标检测任务奖励reward；

S4、根据所述目标检测任务奖励reward调整搜索所述NAS网络模型所用的参数；

重复步骤S1-S4第二预设次数，根据所述评估结果确定最优的第一目标检测模型。
如权利要求1所述的方法，其特征在于，

所述第一神经网络为循环神经网络RNN；

步骤S1包括：

步骤S11、根据预先配置的超参数通过循环神经网络RNN控制器采样，获取子网络结构编码；其中，所述超参数包括子网络超参数、控制器的超参数；子网络超参数包括子网络的层数、cell分支数目、与子网络学习率相关的参数、输出通道数目；控制器的超参数包括与控制器学习率相关的参数、优化器配置参数；

步骤S12、通过解码器对所述子网络结构编码进行解码，输出NAS网络模型。
如权利要求2所述的方法，其特征在于，

所述NAS网络模型为没有全连接层的NAS网络；

所述NAS网络和所述第一目标检测模型的检测部分融合是指：

所述NAS网络模型的多个不同尺度的输出端各自连接一个1*1卷积层，将所述1*1卷积层的输出作为所述第二目标检测模型的检测部分的输入。
如权利要求1所述的方法，其特征在于，根据所述评估结果确定最优的第一目标检测模型后，包括：

利用训练集对评估结果最优的第一目标检测模型进行训练，并对所述训练后的评估结果最优的第一目标检测模型在测试集上进行测试。
如权利要求1所述的方法，其特征在于，

所述第二目标检测模型包括Yolo。
如权利要求1所述的方法，其特征在于，

利用验证集对当前的第一目标检测模型进行评估，包括：

利用验证集对当前的第一目标检测模型进行均值平均精度MAP评估；

根据所述评估结果确定最优的第一目标检测模型，包括：

将第二预设次数内最大的MAP对应的第一目标检测模型确定为最优的第一目标检测模型。
如权利要求1所述的方法，其特征在于，计算所述当前的第一目标检测模型对应的目标检测任务奖励reward，包括：

其中

其中，L _cla为分类loss，L _reg为回归loss，所述baseline为预设的数值或公式。
如权利要求2所述的方法，其特征在于，

根据所述reward调整搜索所述NAS网络模型所用的参数，包括：

将所述reward反馈到所述RNN控制器，

通过
更新所述RNN控制器的可训练参数；其中，θ表示所述RNN控制器的可训练参数，
表示所述可训练参数的反向传播梯度，γ表示预设参数，log π _θ(s _t，a _t)为第t次执行步骤S1时搜索到的NAS网络模型对应的交叉熵loss，R _t表示第t次执行步骤S1时搜索到的NAS网络模型对应的reward值。
一种目标检测模型的自动建模装置，包括：存储器和处理器；其特征在于：

所述存储器，用于保存用于目标检测模型的自动建模的程序；

所述处理器，用于读取执行所述用于目标检测模型的自动建模的程序，执行如下操作：

S1、根据预定的第一神经网络搜索神经网络结构搜索NAS网络模型；

S2、利用训练集训练第一目标检测模型；当训练次数达到第一预设次数后，利用验证集对当前的第一目标检测模型进行评估；并输出评估结果；其中，所述第一目标检测模型是所述NAS网络模型和第二目标检测模型的检测部分融合得到的模型；

S3、计算所述当前的第一目标检测模型对应的目标检测任务奖励reward；

S4、根据所述目标检测任务奖励reward调整搜索所述NAS网络模型所用的参数；

重复步骤S1-S4第二预设次数，根据所述评估结果确定最优的第一目标检测模型。
如权利要求9所述的装置，其特征在于，

所述第一神经网络为循环神经网络RNN；

步骤S1包括：

步骤S11、根据预先配置的超参数通过循环神经网络RNN控制器采样，获取子网络结构编码；其中，所述超参数包括子网络超参数、控制器的超参数；子网络超参数包括子网络的层数、cell分支数目、与子网络学习率相关的参数、输出通道数目；控制器的超参数包括与控制器学习率相关的参数、优化器配置参数；

步骤S12、通过解码器对所述子网络结构编码进行解码，输出NAS网络模型。
如权利要求10所述的装置，其特征在于，

所述NAS网络模型为没有全连接层的NAS网络；

所述NAS网络和所述第一目标检测模型的检测部分融合是指：

所述NAS网络模型的多个不同尺度的输出端各自连接一个1*1卷积层，将所述1*1卷积层的输出作为所述第二目标检测模型的检测部分的输入。
如权利要求9所述的装置，其特征在于，所述处理器，用于读取执行所述用于目标检测模型的自动建模的程序，执行如下操作：

根据所述评估结果确定最优的第一目标检测模型后，利用训练集对评估结果最优的第一目标检测模型进行训练，并对所述训练后的评估结果最优的第一目标检测模型在测试集上进行测试。
如权利要求9所述的装置，其特征在于，

所述第二目标检测模型包括Yolo。
如权利要求9所述的装置，其特征在于，

利用验证集对当前的第一目标检测模型进行评估，包括：

利用验证集对当前的第一目标检测模型进行均值平均精度MAP评估；

根据所述评估结果确定最优的第一目标检测模型，包括：

将第二预设次数内最大的MAP对应的第一目标检测模型确定为最优的第一目标检测模型。
如权利要求9所述的装置，其特征在于，计算所述当前的第一目标检测模型对应的目标检测任务奖励reward，包括：

其中

其中，L _cla为分类loss，L _reg为回归loss，所述baseline为预设的数值或公式。
如权利要求10所述的装置，其特征在于，

根据所述reward调整搜索所述NAS网络模型所用的参数，包括：

将所述reward反馈到所述RNN控制器，

通过
更新所述RNN控制器的可训练参数；其中，θ表示所述RNN控制器的可训练参数，
表示所述可训练参数的反向传播梯度，γ表示预设参数，log π _θ(s _t，a _t)为第t次执行步骤S1时搜索到的NAS网络模型对应的交叉熵loss，R _t表示第t次执行步骤S1时搜索到的NAS网络模型对应的reward值。