CN112434780A

CN112434780A - 目标对象识别网络模型及其训练方法、目标对象识别方法

Info

Publication number: CN112434780A
Application number: CN201910788789.4A
Authority: CN
Inventors: 徐杨柳
Original assignee: Shanghai Goldway Intelligent Transportation System Co Ltd
Current assignee: Shanghai Goldway Intelligent Transportation System Co Ltd
Priority date: 2019-08-26
Filing date: 2019-08-26
Publication date: 2021-03-02
Anticipated expiration: 2039-08-26
Also published as: CN112434780B

Abstract

本发明公开了一种目标对象识别网络模型及其训练方法、目标对象识别方法。目标对象识别方法包括接收具有干扰因素的待识别目标对象；将待识别目标对象输入训练好的目标对象识别网络模型；其中，目标对象识别网络模型包括干扰排除网络和目标对象识别网络；干扰排除网络包括至少一个基于生成式对抗网络的第一类干扰排除网络以及与第一类干扰排除网络连接的第二类干扰排除网络；分别利用第一类干扰排除网络和第二类干扰排除网络对待识别目标对象中的不同干扰因素进行干扰排除；利用目标对象识别网络对经过干扰排除后的待识别目标对象进行识别。本技术方案解决现有的目标对象识别技术在对具有干扰的目标对象进行识别时抗干扰能力不强的问题。

Description

目标对象识别网络模型及其训练方法、目标对象识别方法

【技术领域】

本发明涉及基于神经网络的目标对象识别技术领域，尤其涉及一种目标对象识别网络模型及其训练方法、目标对象识别方法。

【背景技术】

随着目标对象识别技术的快速发展，在外界干扰较少的情况下，文字图像已经能够被很好地识别，例如印刷体扫描件、证件照等，但当出现干扰时，往往容易发生错误，干扰包括旋转、异常的光照、模糊、复杂的颜色和背景。由于神经网络本身具备一定的噪声过滤能力，因此业界致力于人为地生成更多样本，达到进一步提高神经网络噪声过滤能力的目的，但是这种做法的抗干扰能力也是有限的。

【发明内容】

有鉴于此，本发明实施例提供了一种目标对象识别网络模型及其训练方法、目标对象识别方法，用以解决现有的目标对象识别技术在对具有干扰的目标对象进行识别时抗干扰能力不强的问题。

一方面，本发明实施例提供了一种目标对象识别方法，包括：接收待识别目标对象，其中所述待识别目标对象具有干扰因素；将所述待识别目标对象输入训练好的目标对象识别网络模型；其中，所述目标对象识别网络模型包括干扰排除网络和目标对象识别网络；所述干扰排除网络包括至少一个基于生成式对抗网络的第一类干扰排除网络以及与所述第一类干扰排除网络连接的第二类干扰排除网络；分别利用所述第一类干扰排除网络和所述第二类干扰排除网络对所述待识别目标对象中的不同干扰因素进行干扰排除；利用所述目标对象识别网络对经过干扰排除后的待识别目标对象进行识别。

可选的，所述干扰排除网络通过如下方法训练完成：获取训练样本对，且每个所述训练样本对包括标准无干扰训练样本和有干扰训练样本；将所述有干扰训练样本经过所述干扰排除网络后输出生成无干扰样本；利用所述目标对象识别网络分别从所述标准无干扰训练样本中提取标准特征和从所述生成无干扰样本中提取生成特征；比较所述标准特征和所述生成特征以得到特征误差；在训练所述干扰排除网络的过程中，基于所述特征误差辅助训练所述干扰排除网络，以完成对所述干扰排除网络的训练。

可选的，所述第一类干扰排除网络通过如下方法训练完成：将所述有干扰训练样本经过所述第一类干扰排除网络后输出第一生成无干扰样本；利用所述目标对象识别网络分别从所述标准无干扰训练样本中提取第一标准特征和从所述第一生成无干扰样本中提取第一生成特征；比较所述第一标准特征和所述第一生成特征以得到第一特征误差；在训练所述第一类干扰排除网络的过程中，基于所述第一特征误差辅助训练所述第一类干扰排除网络，以完成对所述第一类干扰排除网络的训练。

可选的，所述在训练所述第一类干扰排除网络的过程中，基于所述第一特征误差辅助训练所述第一类干扰排除网络，以完成对所述第一类干扰排除网络的训练包括：交替训练所述生成式对抗网络的生成网络和判别网络，以分别优化所述生成网络和所述判别网络；基于所述第一特征误差辅助训练所述生成网络；将训练后的所述生成网络作为训练完成后的所述第一类干扰排除网络。

可选的，所述第二类干扰排除网络通过如下方法训练完成：将所述有第一生成无干扰样本经过所述第二类干扰排除网络后输出第二生成无干扰样本；利用所述目标对象识别网络分别从所述标准无干扰训练样本中提取第二标准特征和从所述第二生成无干扰样本中提取第二生成特征；比较所述第二标准特征和所述第二生成特征以得到第二特征误差；在训练所述第二类干扰排除网络的过程中，基于所述第二特征误差辅助训练所述第二类干扰排除网络，以完成对所述第二类干扰排除网络的训练。

另一方面，本发明实施例还提供了一种目标对象识别装置，包括：待识别对象接收模块，用于接收待识别目标对象，其中所述待识别目标对象具有干扰因素；待识别对象处理模块，用于将所述待识别目标对象输入训练好的目标对象识别网络模型；其中，所述目标对象识别网络模型包括干扰排除网络和目标对象识别网络；所述干扰排除网络包括至少一个基于生成式对抗网络的第一类干扰排除网络以及与所述第一类干扰排除网络连接的第二类干扰排除网络；干扰排除模块，用于分别利用所述第一类干扰排除网络和所述第二类干扰排除网络对所述待识别目标对象中的不同干扰因素进行干扰排除；目标对象识别模块，用于利用所述目标对象识别网络对经过干扰排除后的待识别目标对象进行识别。

另一方面，本发明实施例还提供了一种目标对象识别模型的训练方法，所述目标对象识别网络模型包括干扰排除网络和目标对象识别网络；

所述训练方法包括：获取训练样本对，且每个所述训练样本对包括标准无干扰训练样本和有干扰训练样本；将所述有干扰训练样本经过所述干扰排除网络后输出生成无干扰样本；利用所述目标对象识别网络分别从所述标准无干扰训练样本中提取标准特征和从所述生成无干扰样本中提取生成特征；比较所述标准特征和所述生成特征以得到特征误差；在训练所述干扰排除网络的过程中，基于所述特征误差辅助训练所述干扰排除网络，以完成对所述干扰排除网络的训练。

再一方面，本发明实施例还提供了一种目标对象识别模型，包括：干扰排除网络和目标对象识别网络；其中，所述干扰排除网络包括至少一个基于生成式对抗网络的第一类干扰排除网络以及与所述第一类干扰排除网络连接的第二类干扰排除网络；所述第一类干扰排除网络和所述第二类干扰排除网络分别用于排除待识别目标对象中的不同干扰因素；所述目标对象识别网络用于对经过干扰排除后的待识别目标对象进行识别。

与现有技术相比，本技术方案至少具有如下有益效果：

根据本发明实施例提供的目标对象识别方法，所利用的目标对象识别模型包括干扰排除网络和目标对象识别网络，其中，干扰排除网络包括至少一个基于生成式对抗网络的第一类干扰排除网络以及与所述第一类干扰排除网络连接的第二类干扰排除网络。通过两类干扰排除网络可以逐层对待识别目标对象的不同干扰因素进行干扰排除，从而使得目标对象识别网络只需要对干扰因素较小(即噪声较小)的待识别目标对象进行识别，减小了目标对象识别网络的复杂度和运算量。

进一步，在对目标对象识别模型进行训练时，在训练干扰排除网络的过程中，利用了目标对象识别网络分别从所述标准无干扰训练样本中提取标准特征和从所述生成无干扰样本中提取生成特征，通过比较标准特征和所述生成特征以得到特征误差，再基于所述特征误差辅助训练所述干扰排除网络。而在对目标对象识别网络进行训练时，先利用标准无干扰训练样本进行预训练，然后在干扰排除网络训练完成后，利用标准无干扰训练样本和有干扰训练样本对预训练后的目标对象识别网络进行训练，从而完成对目标对象识别网络的训练。因此，在整个对目标对象识别网络模型训练过程中，干扰排除网络和目标对象识别网络之间是相辅相成，并非孤立地各自完成训练，从而使得训练后的目标对象识别网络模型能更好地识别目标对象。

【附图说明】

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1是本发明实施例提供的目标对象识别方法的一个实施例的流程示意图；

图2是图1所述目标对象识别方法中的目标对象识别模型的结构示意图；

图3是图2所示的目标对象识别模型中干扰排除网络的训练方法的流程示意图；

图4A是图2所示的目标对象识别模型中第一类干扰排除网络的训练方法的流程示意图；

图4B是图4A所述的第一类干扰排除网络的训练方法的一个具体实施例的示意图；

图5A是图2所示的目标对象识别模型中第二类干扰排除网络的训练方法的一个具体实施例的流程示意图；

图5B是图5A所述的第二类干扰排除网络的训练方法的一个具体实施例的示意图。

图6是图2所示的目标对象识别模型中目标对象识别网络的训练方法的一个具体实施例的流程示意图；

图7是本本发明实施例提供的目标对象识别装置的一个实施例的结构示意图；

图8本发明实施例提供的目标对象识别网络模型的训练装置的一个实施例的结构示意图。

【具体实施方式】

为了更好的理解本发明的技术方案，下面结合附图对本发明实施例进行详细描述。

应当明确，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

图1是本发明实施例提供的目标对象识别方法的一个实施例的流程示意图。参考图1，所述目标对象识别方法包括如下步骤：

步骤101、接收待识别目标对象，其中所述待识别目标对象具有干扰因素。

步骤102、将所述待识别目标对象输入训练好的目标对象识别网络模型。其中，所述目标对象识别网络模型包括干扰排除网络和目标对象识别网络；所述干扰排除网络包括至少一个基于生成式对抗网络的第一类干扰排除网络以及与所述第一类干扰排除网络连接的第二类干扰排除网络。

步骤103、分别利用所述第一类干扰排除网络和所述第二类干扰排除网络对所述待识别目标对象中的不同干扰因素进行干扰排除。

步骤104、利用所述目标对象识别网络对经过干扰排除后的待识别目标对象进行识别。

本实施例以对具有干扰因素的文字图片(作为所述待识别目标对象)进行识别，以识别出图片上的文字的应用场景为例进行描述。在本实施例中，待识别文字图片上具有待识别的文字和不同干扰因素。其中，一类干扰因素包括但不限于图片背景干扰、光照干扰、模糊干扰以及颜色干扰，这些干扰可以视为待识别文字图片的噪声干扰。另一类干扰因素包括但不限于待识别文字本身的文字倾斜透视干扰、文字弯曲干扰等。

图2是图1所述目标对象识别方法中的目标对象识别模型的结构示意图。

参考图2，所述目标对象识别网络模型21包括干扰排除网络211和目标对象识别网络212。其中，所述干扰排除网络211包括至少一个基于生成式对抗网络的第一类干扰排除网络2111以及与所述第一类干扰排除网络2111连接的第二类干扰排除网络2112。所述第一类干扰排除网络2111和所述第二类干扰排除网络2112分别用于排除待识别目标对象中的不同干扰因素。所述目标对象识别网络212用于对经过干扰排除后的待识别目标对象进行目标对象识别。如图2所示，所述待识别目标对象为包含文字“generator”和背景颜色(黑色)的文字图片，经过所述目标对象识别模型21后，可以识别出所述待识别目标对象上的文字“generator”。

具体来说，利用本实施例提供的目标对象识别网络模型21中的干扰排除网络211可以先排除待识别目标对象上的不同干扰因素，然后再利用目标对象识别网络模型21中的目标对象识别网络212对排除了干扰因素的待识别目标对象进行识别，因此目标对象识别网络只需要对干扰因素较小的待识别目标对象进行识别，减小了目标对象识别网络的复杂度和运算量。

进一步，所述干扰排除网络211包括第一类干扰排除网络2111以及与所述第一类干扰排除网络2111连接的第二类干扰排除网络2112。其中，所述第一类干扰排除网络2111是基于生成式对抗网络(Generative Adversarial Networks，简称GAN)中的生成网络G确定的干扰排除网络。本实施例中，所述第一类干扰排除网络2111用于排除待识别目标对象中的噪声干扰(即图片背景干扰、光照干扰、模糊干扰以及颜色干扰中的任一种或多种干扰因素)。所述第二类干扰排除网络2112是朝向矫正网络，例如可以采用基于薄板函数模型(TPS)的矫正网络或者基于仿射变换(Affine Transformation)的矫正网络对待识别目标对象进行几何矫正。本实施例中，所述第二类干扰排除网络2112用于排除待识别目标对象中文字倾斜透视干扰和文字弯曲干扰中的任一种或多种干扰因素。

下面将详细描述本实施例提供的目标对象识别模型的训练方法。

图3是图2所示的目标对象识别模型中干扰排除网络的训练方法的流程示意图。参考图3，所述训练方法包括如下步骤：

步骤301、获取训练样本对，且每个所述训练样本对包括标准无干扰训练样本和有干扰训练样本；

步骤302、将所述有干扰训练样本经过所述干扰排除网络后输出生成无干扰样本；

步骤303、利用所述目标对象识别网络分别从所述标准无干扰训练样本中提取标准特征和从所述生成无干扰样本中提取生成特征；

步骤304、比较所述标准特征和所述生成特征以得到特征误差；

步骤305、在训练所述干扰排除网络的过程中，基于所述特征误差辅助训练所述干扰排除网络，以完成对所述干扰排除网络的训练。

与现有技术不同，在本实施例中，在对干扰排除网络进行训练过程中，将利用目标对象识别网络分别从标准无干扰训练样本中提取标准特征和从经过干扰排除网络后得到的生成无干扰样本中提取生成特征，然后通过比较标准特征和生成特征以得到特征误差，再基于特征误差辅助训练所述干扰排除网络，从而使训练完成后的干扰排除网络具有更强的干扰排除能力。

在步骤301中，所述训练样本对可以采用现有的人工样本生成工具生成，生成的每对训练样本对包括标准无干扰训练样本和有干扰训练样本。其中，所述标准无干扰训练样本即没有干扰因素的目标对象样本，而所述有干扰训练样本是在所述标准无干扰训练样本的基础上附加了不同干扰因素后的目标对象样本。

在步骤302中，将上述步骤301中生成的有干扰训练样本输入所述干扰排除网络后输出生成无干扰样本。其中，所述干扰排除网络是一种神经网络，通过该神经网络可以对输入的有干扰训练样本进行干扰排除，以输出生成无干扰样本。

在本实施例提供的目标对象识别模型中，针对两种不同类型的干扰因素，设置两类干扰排除网络，分别为第一类干扰排除网络和第二类干扰排除网络。其中，所述第一类干扰排除网络用于排除所述有干扰训练样本中的噪声干扰(例如背景干扰、光照干扰、模糊干扰以及颜色干扰中的任一种或多种干扰因素)。所述第二类干扰排除网络用于排除所述有干扰训练样本中的目标对象倾斜透视干扰和目标对象弯曲干扰中的任一种或多种干扰因素。针对这两类干扰排除网络的具体训练方法将在下文的实施例中详细描述。

如步骤304和步骤305所述，将利用目标对象识别网络分别从所述标准无干扰训练样本中提取标准特征和从所述生成无干扰样本中提取生成特征，并比较所述标准特征和所述生成特征以得到特征误差。

具体来说，所述目标对象识别网络可以从待识别目标对象中提取特征(例如文字的端点、分叉点、凹凸部分等)，然后根据提取的这些特征的位置和相互关系进行逻辑组合判断，得到识别结果。其中，所述目标对象识别网络可以采用基于Attention的识别网络或者基于CTC(Connectionist Temporal Classification)的识别网络或者其他基于这两个框架衍生出的其他目标对象识别网络。

在本实施例中，利用所述目标对象识别网络的特征提取部分分别从所述标准无干扰训练样本中提取标准特征和从所述生成无干扰样本中提取生成特征，然后比较所述标准特征和所述生成特征，以得到两者之间的特征误差。所述特征误差体现了所述生成无干扰样本与标准无干扰样本之间的差异。

如步骤306所述，在训练所述干扰排除网络的过程中，基于所述特征误差辅助训练所述干扰排除网络，以完成对所述干扰排除网络的训练。也就是说，在对所述干扰排除网络进行训练过程中，利用所述目标对象识别网络反馈的特征误差进一步对所述干扰排除网络中的相关参数进行优化调整。

图4A是图2所示的目标对象识别模型中第一类干扰排除网络的训练方法的流程示意图。参考图4A，所述训练方法包括如下步骤：

步骤401、将所述有干扰训练样本经过所述第一类干扰排除网络后输出第一生成无干扰样本；

步骤402、利用所述目标对象识别网络分别从所述标准无干扰训练样本中提取第一标准特征和从所述第一生成无干扰样本中提取第一生成特征；

步骤403、比较所述第一标准特征和所述第一生成特征以得到第一特征误差；

步骤404、在训练所述第一类干扰排除网络的过程中，基于所述第一特征误差辅助训练所述第一类干扰排除网络，以完成对所述第一类干扰排除网络的训练。

在本实施例中，所述第一类干扰排除网络是基于生成式对抗网络的干扰排除网络。本领域技术人员理解，生成式对抗网络(以下简称GAN网络)是一种深度学习模型，GAN网络由生成网络G和判别网络D组成，在训练过程中，生成网络G的目标就是尽量生成接近真实的图片去欺骗判别网络D，而判别网络D的目标是判断输入的图片是由生成网络G生成的图片还是真实的图片，即判别网络的输出代表输入的图片为真实图片的概率，如果为1，就代表100％是真实的图片，而输出为0，就代表不可能是真实的图片。因此，生成网络G和判别网络D构成了一个动态的博弈过程。

图4B是图4A所述的第一类干扰排除网络的训练方法的一个具体实施例的示意图。在图4B中，(a)是固定判别网络D的参数，对生成网络G进行训练的示意图；(b)是固定生成网络G的参数，对判别网络D进行训练的示意图。

如图4B所示，其中(a)和(b)所示的是交替训练所述生成式对抗网络的生成网络和判别网络，以分别优化所述生成网络和所述判别网络的过程。

具体来说，(a)所示的是固定判别网络D的参数以训练生成网络G的过程，先将有干扰训练样本经过生成网络G后输出所述第一生成无干扰样本，然后再将所述第一生成无干扰样本与所述有干扰训练样本输入所述判别网络D，判别网络D输出的所述第一生成无干扰样本为所述标准无干扰训练样本(即真实的无干扰样本)的概率，并将判别结果反馈至所述生成网络G，以调节所述生成网络G的参数。

(b)所示的是在依照上述(a)所示的训练过程调节所述生成网络G的参数后，固定所述生成网络G的参数以训练判别网络D的过程。随机选择经由生成网络G输出的第一生成无干扰样本或者标准无干扰训练样本中的一个作为输入样本输入判别网络D，所述判别网络D将根据所述有干扰训练样本与接收到的输入样本进行比较，从而识别输入样本是第一生成无干扰样本还是标准无干扰训练样本，以输出输入样本为标准无干扰训练样本的概率。

依照上述方式交替训练所述生成网络和判别网络，以分别优化所述生成网络和所述判别网络中的参数。

与现有技术不同，继续参考图4B中的(a)，在训练所述生成网络G的过程中，利用所述目标对象识别网络分别从所述标准无干扰训练样本中提取第一标准特征和从所述第一生成无干扰样本中提取第一生成特征，然后比较所述第一标准特征和所述第一生成特征以得到第一特征误差，进而基于所述第一特征误差辅助训练所述生成网络，将训练后的所述生成网络作为训练完成后的所述第一类干扰排除网络。

进一步，在训练所述生成网络G的过程中，还将分别从所述标准无干扰训练样本和从所述第一生成无干扰样本中提取像素特征，以对两者进行像素级比较，从而确定两者之间的像素级误差，进而结合像素级误差辅助训练所述生成网络。因此，在基于判别网络的反馈对生成网络进行训练的同时，还将训练过程中得到的第一生成无干扰样本与标准无干扰训练样本进行像素级比较和特征级比较，从而使得所述生成网络能生成更细致的第一生成无干扰样本。

从数学模型角度来说，所述第一类干扰排除网络可以通过如下公式表示：

G^*＝argmin_Gmax_DLc_GAN(G，D)+λ₁L_L1(G)+λ₂L_L2(G)

其中，G*是第一类干扰排除网络，L_cGAN(G,D)是GAN网络的通用损失函数，L_L1(G)是将生成的所述第一生成无干扰样本和标准无干扰训练样本进行像素级比较的损失函数，L_L2(G)是将所述第一生成无干扰样本和标准无干扰训练样本进行特征级比较的损失函数。在训练过程中，通过调整所述判别网络D使L_cGAN(G,D)尽可能大，调整所述生成网络G使L_cGAN(G,D)尽可能小，G与D形成对抗关系，从而使得所述第一生成无干扰样本和标准无干扰训练样本接近。L_L1(G)通过像素级比较，使生成的第一生成无干扰样本在细节上与标准无干扰训练样本近似，L_L2(G)通过特征级比较，使第一生成无干扰样本中对文本识别结果有决定性作用的信息与标准无干扰训练样本保持一致。

需要说明的是，在所述目标对象识别模型中，所述第一类干扰排除网络的数目可以根据所要排除的干扰因素来决定。例如，可以通过一个所述第一类干扰排除网络排除多种干扰因素(例如光照干扰、模糊干扰以及颜色干扰)，这种情况下，所述第一类干扰排除网络的计算量较大，网络结构较为复杂。又例如，也可以设置多个相互级联的所述第一类干扰排除网络，每个所述第一类干扰排除网络用于排除一种干扰因素，这种情况下，每个所述第一类干扰排除网络的计算量将大幅减小。

图5A是图2所示的目标对象识别模型中第二类干扰排除网络的训练方法的一个具体实施例的流程示意图。参考图5A，所述训练方法包括如下步骤：

步骤501、将所述有第一生成无干扰样本经过所述第二类干扰排除网络后输出第二生成无干扰样本；

步骤502、利用所述文字识别网络分别从所述标准无干扰训练样本中提取第二标准特征和从所述第二生成无干扰样本中提取第二生成特征；

步骤503、比较所述第二标准特征和所述第二生成特征以得到第二特征误差；

步骤504、在训练所述第二类干扰排除网络的过程中，基于所述第二特征误差辅助训练所述第二类干扰排除网络，以完成对所述第二类干扰排除网络的训练。

在本实施例中，所述第二类干扰排除网络接收的是经过所述第一类干扰排除网络后输出的所述第一生成无干扰样本。所述第一生成无干扰样本是经过光照干扰、模糊干扰以及颜色干扰排除后的样本，经过所述第二类干扰排除网络将进一步对所述第一生成无干扰样本的目标对象倾斜透视干扰或目标对象弯曲干扰中的任一种或多种干扰进行排除。

所述第二类干扰排除网络是朝向矫正网络，例如可以采用基于薄板函数模型(TPS)的矫正网络或者基于仿射变换(Affine Transformation)的矫正网络。对所述朝向矫正网络进行训练的方式可以根据不同的矫正网络来确定，例如以基于仿射变换(AffineTransformation)的矫正网络为例，利用神经网络回归文字的四角点，再利用仿射变换等几何手段将文字矫正到水平位置。

结合参考图5B所示的第二类干扰排除网络的训练方法的一个具体实施例的示意图。

与现有技术不同，在本实施例中，利用所述目标对象识别网络分别从所述标准无干扰训练样本中提取第二标准特征和从所述第二生成无干扰样本中提取第二生成特征，然后比较所述第二标准特征和所述第二生成特征以得到第二特征误差，进而在训练所述第二类干扰排除网络的过程中，基于所述第二特征误差辅助训练所述第二类干扰排除网络。

在实际应用中，例如在所述朝向矫正网络后连接所述目标对象识别网络，将经过所述朝向矫正网络矫正后得到的第二生成无干扰样本直接输入目标对象识别网络，根据目标对象识别网络识别的效果，估计当前矫正需要进行的调整。

图6是图2所示的目标对象识别模型中目标对象识别网络的训练方法的一个具体实施例的流程示意图。参考图6，所述训练方法包括如下步骤：

步骤601、利用所述标准无干扰训练样本对所述目标对象识别网络进行预训练；

步骤602、在所述干扰排除网络训练完成后，利用所述标准无干扰训练样本和有干扰训练样本对预训练后的所述目标对象识别网络进行训练，以得到训练好的所述目标对象识别网络。

本实施例中，所述目标对象识别网络可以采用基于Attention的识别网络或者基于CTC(Connectionist Temporal Classification)的识别网络或者其他基于这两个框架衍生出的其他目标对象识别网络。

所述目标对象识别网络包括特征提取部分、编码部分(如有需要)和解码部分。

对所述目标对象识别网络的训练是希望训练后的目标对象识别网络从所述第二生成无干扰样本与从标准无干扰训练样本中提取的特征基本一致，这样训练得到的目标对象识别网络可以正确地从待识别目标对象中识别目标对象。

为了达到这一目的，不希望目标对象识别网络的性能太强，因此首先利用标准无干扰训练样本来训练目标对象识别网络(即对所述目标对象识别网络进行预训练)，使其对干扰更加敏感。然后，利用经过预训练后的目标对象识别网络辅助训练所述干扰排除网络(包括第一类干扰排除网络和第二类干扰排除网络)，在所述干扰排除网络完成训练后，再利用标准无干扰训练样本和有干扰训练样本对预训练后的目标对象识别网络进行训练，从而完成对目标对象识别网络的训练，从而使得目标对象识别网络的性能进一步提升。

因此，在整个对目标对象识别网络模型训练过程中，干扰排除网络和目标对象识别网络之间是相辅相成，并非孤立地各自完成训练，从而使得训练后的目标对象识别网络模型能更好地识别目标对象。

图7是本发明实施例提供的目标对象识别装置的一个实施例的结构示意图。参考图7，所述目标对象识别装置7包括：待识别对象接收模块71，用于接收待识别目标对象，其中所述待识别目标对象具有干扰因素。待识别对象处理模块72，用于将所述待识别目标对象输入训练好的目标对象识别网络模型；其中，所述目标对象识别网络模型包括干扰排除网络和目标对象识别网络；所述干扰排除网络包括至少一个基于生成式对抗网络的第一类干扰排除网络以及与所述第一类干扰排除网络连接的第二类干扰排除网络。干扰排除模块73，用于分别利用所述第一类干扰排除网络和所述第二类干扰排除网络对所述待识别目标对象中的不同干扰因素进行干扰排除。目标对象识别模块74，用于利用所述目标对象识别网络对经过干扰排除后的待识别目标对象进行识别。

目标对象识别装置7还包括干扰排除网络训练模块75。所述干扰排除网络训练模块75，用于获取训练样本对，且每个所述训练样本对包括标准无干扰训练样本和有干扰训练样本；将所述有干扰训练样本经过所述干扰排除网络后输出生成无干扰样本；利用所述目标对象识别网络分别从所述标准无干扰训练样本中提取标准特征和从所述生成无干扰样本中提取生成特征；比较所述标准特征和所述生成特征以得到特征误差；在训练所述干扰排除网络的过程中，基于所述特征误差辅助训练所述干扰排除网络，以完成对所述干扰排除网络的训练。

所述干扰排除网络训练模块75包括第一类干扰排除网络训练单元751，用于将所述有干扰训练样本经过所述第一类干扰排除网络后输出第一生成无干扰样本；利用所述目标对象识别网络分别从所述标准无干扰训练样本中提取第一标准特征和从所述第一生成无干扰样本中提取第一生成特征；比较所述第一标准特征和所述第一生成特征以得到第一特征误差；在训练所述第一类干扰排除网络的过程中，基于所述第一特征误差辅助训练所述第一类干扰排除网络，以完成对所述第一类干扰排除网络的训练。

所述第一类干扰排除网络训练单元751还用于交替训练所述生成式对抗网络的生成网络和判别网络，以分别优化所述生成网络和所述判别网络；基于所述第一特征误差辅助训练所述生成网络；将训练后的所述生成网络作为训练完成后的所述第一类干扰排除网络。

所述干扰排除网络训练模块75包括第二类干扰排除网络训练单元752，用于将所述有第一生成无干扰样本经过所述第二类干扰排除网络后输出第二生成无干扰样本；利用所述目标对象识别网络分别从所述标准无干扰训练样本中提取第二标准特征和从所述第二生成无干扰样本中提取第二生成特征；比较所述第二标准特征和所述第二生成特征以得到第二特征误差；在训练所述第二类干扰排除网络的过程中，基于所述第二特征误差辅助训练所述第二类干扰排除网络，以完成对所述第二类干扰排除网络的训练。

图8本发明实施例提供的目标对象识别网络模型的训练装置的一个实施例的结构示意图。参考图8，所述训练装置8包括：训练样本获取模块81，用于获取训练样本对，且每个所述训练样本对包括标准无干扰训练样本和有干扰训练样本。生成无干扰样本模块82，用于将所述有干扰训练样本经过所述干扰排除网络后输出生成无干扰样本。生成特征提取模块83，用于利用所述目标对象识别网络分别从所述标准无干扰训练样本中提取标准特征和从所述生成无干扰样本中提取生成特征。特征误差确定模块84，用于比较所述标准特征和所述生成特征以得到特征误差。辅助训练模块85，用于在训练所述干扰排除网络的过程中，基于所述特征误差辅助训练所述干扰排除网络，以完成对所述干扰排除网络的训练。

其中，所述干扰排除网络包括至少一个基于生成式对抗网络的第一类干扰排除网络。所述生成无干扰样本模块82用于将所述有干扰训练样本经过所述第一类干扰排除网络后输出第一生成无干扰样本。所述生成特征提取模块83用于利用所述目标对象识别网络分别从所述标准无干扰训练样本中提取第一标准特征和从所述第一生成无干扰样本中提取第一生成特征。所述特征误差确定模块84用于比较所述第一标准特征和所述第一生成特征以得到第一特征误差。所述辅助训练模块85用于在训练所述第一类干扰排除网络的过程中，基于所述第一特征误差辅助训练所述第一类干扰排除网络，以完成对所述第一类干扰排除网络的训练。

所述干扰排除网络还包括与所述第一类干扰排除网络连接的第二类干扰排除网络。所述生成无干扰样本模块82还用于将所述有第一生成无干扰样本经过所述第二类干扰排除网络后输出第二生成无干扰样本。所述生成特征提取模块83还用于利用所述目标对象识别网络分别从所述标准无干扰训练样本中提取第二标准特征和从所述第二生成无干扰样本中提取第二生成特征。所述特征误差确定模块84还用于比较所述第二标准特征和所述第二生成特征以得到第二特征误差。所述辅助训练模块85还用于在训练所述第二类干扰排除网络的过程中，基于所述第二特征误差辅助训练所述第二类干扰排除网络，以完成对所述第二类干扰排除网络的训练。

本发明实施例还提供了一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序用于执行上述目标对象识别方法的实施例中的各个步骤。

本发明实施例还提供了一种电子设备，所述电子设备包括：处理器；用于存储所述处理器可执行指令的存储器；所述处理器，用于从所述存储器中读取所述可执行指令，并执行所述指令以实现上述目标对象识别方法的实施例中的各个步骤。

本发明实施例还提供了一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序用于执行上述目标对象识别网络模型的训练方法的实施例中的各个步骤。

本发明实施例还提供了一种电子设备，所述电子设备包括：处理器；用于存储所述处理器可执行指令的存储器；所述处理器，用于从所述存储器中读取所述可执行指令，并执行所述指令以实现上述目标对象识别网络模型的训练方法的实施例中的各个步骤。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明保护的范围之内。

Claims

1.一种目标对象识别方法，其特征在于，包括：

接收待识别目标对象，其中所述待识别目标对象具有干扰因素；

将所述待识别目标对象输入训练好的目标对象识别网络模型；其中，所述目标对象识别网络模型包括干扰排除网络和目标对象识别网络；所述干扰排除网络包括至少一个基于生成式对抗网络的第一类干扰排除网络以及与所述第一类干扰排除网络连接的第二类干扰排除网络；

分别利用所述第一类干扰排除网络和所述第二类干扰排除网络对所述待识别目标对象中的不同干扰因素进行干扰排除；

利用所述目标对象识别网络对经过干扰排除后的待识别目标对象进行识别。

2.如权利要求1所述的方法，其特征在于，所述干扰排除网络通过如下方法训练完成：

获取训练样本对，且每个所述训练样本对包括标准无干扰训练样本和有干扰训练样本；

将所述有干扰训练样本经过所述干扰排除网络后输出生成无干扰样本；

利用所述目标对象识别网络分别从所述标准无干扰训练样本中提取标准特征和从所述生成无干扰样本中提取生成特征；

比较所述标准特征和所述生成特征以得到特征误差；

在训练所述干扰排除网络的过程中，基于所述特征误差辅助训练所述干扰排除网络，以完成对所述干扰排除网络的训练。

3.如权利要求2所述的方法，其特征在于，所述第一类干扰排除网络通过如下方法训练完成：

将所述有干扰训练样本经过所述第一类干扰排除网络后输出第一生成无干扰样本；

利用所述目标对象识别网络分别从所述标准无干扰训练样本中提取第一标准特征和从所述第一生成无干扰样本中提取第一生成特征；

比较所述第一标准特征和所述第一生成特征以得到第一特征误差；

在训练所述第一类干扰排除网络的过程中，基于所述第一特征误差辅助训练所述第一类干扰排除网络，以完成对所述第一类干扰排除网络的训练。

4.如权利要求3所述的方法，其特征在于，所述在训练所述第一类干扰排除网络的过程中，基于所述第一特征误差辅助训练所述第一类干扰排除网络，以完成对所述第一类干扰排除网络的训练包括：

交替训练所述生成式对抗网络的生成网络和判别网络，以分别优化所述生成网络和所述判别网络；

基于所述第一特征误差辅助训练所述生成网络；

将训练后的所述生成网络作为训练完成后的所述第一类干扰排除网络。

5.如权利要求3所述的方法，其特征在于，所述第二类干扰排除网络通过如下方法训练完成：

将所述有第一生成无干扰样本经过所述第二类干扰排除网络后输出第二生成无干扰样本；

利用所述目标对象识别网络分别从所述标准无干扰训练样本中提取第二标准特征和从所述第二生成无干扰样本中提取第二生成特征；

比较所述第二标准特征和所述第二生成特征以得到第二特征误差；

在训练所述第二类干扰排除网络的过程中，基于所述第二特征误差辅助训练所述第二类干扰排除网络，以完成对所述第二类干扰排除网络的训练。

6.一种目标对象识别装置，其特征在于，包括：

待识别对象接收模块，用于接收待识别目标对象，其中所述待识别目标对象具有干扰因素；

待识别对象处理模块，用于将所述待识别目标对象输入训练好的目标对象识别网络模型；其中，所述目标对象识别网络模型包括干扰排除网络和目标对象识别网络；所述干扰排除网络包括至少一个基于生成式对抗网络的第一类干扰排除网络以及与所述第一类干扰排除网络连接的第二类干扰排除网络；

干扰排除模块，用于分别利用所述第一类干扰排除网络和所述第二类干扰排除网络对所述待识别目标对象中的不同干扰因素进行干扰排除；

目标对象识别模块，用于利用所述目标对象识别网络对经过干扰排除后的待识别目标对象进行识别。

7.如权利要求6所述的装置，其特征在于，还包括干扰排除网络训练模块：所述干扰排除网络训练模块，用于获取训练样本对，且每个所述训练样本对包括标准无干扰训练样本和有干扰训练样本；将所述有干扰训练样本经过所述干扰排除网络后输出生成无干扰样本；利用所述目标对象识别网络分别从所述标准无干扰训练样本中提取标准特征和从所述生成无干扰样本中提取生成特征；比较所述标准特征和所述生成特征以得到特征误差；在训练所述干扰排除网络的过程中，基于所述特征误差辅助训练所述干扰排除网络，以完成对所述干扰排除网络的训练。

8.一种目标对象识别网络模型的训练方法，其特征在于，所述目标对象识别网络模型包括干扰排除网络和目标对象识别网络；

所述训练方法包括：

比较所述标准特征和所述生成特征以得到特征误差；

9.如权利要求8所述的方法，其特征在于，所述干扰排除网络包括至少一个基于生成式对抗网络的第一类干扰排除网络；

所述将所述有干扰训练样本经过所述干扰排除网络后输出生成无干扰样本包括：将所述有干扰训练样本经过所述第一类干扰排除网络后输出第一生成无干扰样本；

所述利用所述目标对象识别网络分别从所述标准无干扰训练样本中提取标准特征和从所述生成无干扰样本中提取生成特征包括：利用所述目标对象识别网络分别从所述标准无干扰训练样本中提取第一标准特征和从所述第一生成无干扰样本中提取第一生成特征；

所述比较所述标准特征和所述生成特征以得到特征误差包括：比较所述第一标准特征和所述第一生成特征以得到第一特征误差；

所述在训练所述干扰排除网络的过程中，基于所述特征误差辅助训练所述干扰排除网络，以完成对所述干扰排除网络的训练包括：在训练所述第一类干扰排除网络的过程中，基于所述第一特征误差辅助训练所述第一类干扰排除网络，以完成对所述第一类干扰排除网络的训练。

10.如权利要求9所述的方法，其特征在于，所述干扰排除网络还包括与所述第一类干扰排除网络连接的第二类干扰排除网络；

所述将所述有干扰训练样本经过所述干扰排除网络后输出生成无干扰样本包括：将所述有第一生成无干扰样本经过所述第二类干扰排除网络后输出第二生成无干扰样本；

所述利用所述目标对象识别网络分别从所述标准无干扰训练样本中提取标准特征和从所述生成无干扰样本中提取生成特征包括：利用所述目标对象识别网络分别从所述标准无干扰训练样本中提取第二标准特征和从所述第二生成无干扰样本中提取第二生成特征；

所述比较所述标准特征和所述生成特征以得到特征误差包括：比较所述第二标准特征和所述第二生成特征以得到第二特征误差；

所述在训练所述干扰排除网络的过程中，基于所述特征误差辅助训练所述干扰排除网络，以完成对所述干扰排除网络的训练包括：在训练所述第二类干扰排除网络的过程中，基于所述第二特征误差辅助训练所述第二类干扰排除网络，以完成对所述第二类干扰排除网络的训练。

11.一种目标对象识别网络模型的训练方装置，其特征在于，所述目标对象识别网络模型包括干扰排除网络和目标对象识别网络；

所述训练装置包括：

训练样本获取模块，用于获取训练样本对，且每个所述训练样本对包括标准无干扰训练样本和有干扰训练样本；

生成无干扰样本模块，用于将所述有干扰训练样本经过所述干扰排除网络后输出生成无干扰样本；

生成特征提取模块，用于利用所述目标对象识别网络分别从所述标准无干扰训练样本中提取标准特征和从所述生成无干扰样本中提取生成特征；

特征误差确定模块，用于比较所述标准特征和所述生成特征以得到特征误差；

辅助训练模块，用于在训练所述干扰排除网络的过程中，基于所述特征误差辅助训练所述干扰排除网络，以完成对所述干扰排除网络的训练。

12.一种目标对象识别网络模型，其特征在于，包括：干扰排除网络和目标对象识别网络；其中，所述干扰排除网络包括至少一个基于生成式对抗网络的第一类干扰排除网络以及与所述第一类干扰排除网络连接的第二类干扰排除网络；

所述第一类干扰排除网络和所述第二类干扰排除网络分别用于排除待识别目标对象中的不同干扰因素；所述文字识别网络用于对经过干扰排除后的待识别目标对象进行识别。

13.一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序用于执行上述权利要求1-5中任一所述目标对象识别方法。

14.一种电子设备，所述电子设备包括：

处理器；

用于存储所述处理器可执行指令的存储器；

所述处理器，用于从所述存储器中读取所述可执行指令，并执行所述指令以实现上述权利要求1-5中任一所述目标对象识别方法。

15.一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序用于执行上述权利要求8-10中任一所述目标对象识别网络模型的训练方法。

16.一种电子设备，所述电子设备包括：

处理器；

用于存储所述处理器可执行指令的存储器；

所述处理器，用于从所述存储器中读取所述可执行指令，并执行所述指令以实现上述权利要求8-10中任一所述目标对象识别网络模型的训练方法。