WO2015074428A1

WO2015074428A1 - 神经网络、基于神经网络的图像解析方法和装置

Info

Publication number: WO2015074428A1
Application number: PCT/CN2014/081975
Authority: WO
Inventors: 罗平; 王晓刚; 梁炎; 刘健庄; 汤晓鸥
Original assignee: 华为技术有限公司
Priority date: 2013-11-22
Filing date: 2014-07-10
Publication date: 2015-05-28
Also published as: CN104657776B; CN104657776A

Abstract

本发明实施例提供一种神经网络***、基于神经网络***的图像解析方法和装置，包括：所述神经网络***获取目标事物的第一视觉特征向量x，所述神经网络***的遮挡估计子网络根据目标事物的第一视觉特征x向量确定所述目标事物被遮挡部分的遮挡标记向量x^o，所述遮挡补全子网络根据所述第一视觉特征向量x与所述遮挡标记向量x^o确定补全所述遮挡部分后所述目标事物的第三视觉特征向量x^c，所述分解子网络根据所述第三视觉特征向量x^c确定所述目标事物的各部位的类标图像，组合所述各部位的类标图像得到所述目标事物的解析结果。上述方法能够解决目标事物被遮挡时的图像解析问题，即使目标事物被遮挡了，也能够准确的得到目标事物的解析结果。

Description

神经网络***、基于神经网络***的图像解析方法和装置技术领域

本发明涉及数据通讯技术，尤其涉及一种神经网络***、基于神经网络***的图像解析方法和装置。背景技术

行人目标解析，就是将一幅行人图像分解成具有特定语义的区域，例如头发、躯干、手臂、腿等。行人目标进行解析后，可以方便用于行人姿势估计、行为分析等多种行人目标分析与理解任务，在图像与视频搜索、视频监控等方法都有重要的应用价值。行人目标解析问题具有很大的挑战性，不仅由于行人在表观、姿势、形状等方面具有很大的变化，而且在视频监控等真实环境下拍摄到的行人图像经常存在大的遮挡和杂乱的背景。目前已有的行人目标解析方法一般可以分为两类：模板匹配法和贝叶斯推断法。模板匹配法是通过预先建立一个人体各部位的模板库，每个部位收集若干样本，当输入一幅输入的行人图像进行解析时，首先，利用现有的图像分割算法进行分割，得到一组超像素，作为备选的人体各部位区域，然后，将备选区域与模板库中的若干样本进行匹配，将最有可能是某部位的备选区域排在前面，最后，在一些约束条件下对最有可能的备选区域进行组合，约束条件包括上半身部位必须出现在下半身上面等，利用层次化的表观模型对以上组合进行排序，选出最佳组合，作为行人目标解析结果。模板匹配法缺点是过度依赖模板，分解的区域边界不准确，而且没有考虑目标被遮挡情况。贝叶斯推断法是利用标注好的训练图像，首先，学习形状模型，形状模型是一个 MSBM, 可以确定图像上每个像素的类标的概率，然后，学习表观模型，表观模型是每个人体部位在混合高斯模型下的参数统计，可以确定某个人体部位在某表观下出现的概率，最后将形状模型与表观模型组合得到联合模型，确定出图像、形状、表观、类标四者之间的联合概率。当给定测试图像，利用联合模型，通过图像、形状和表观来推断类标，贝叶斯推断法的缺点是对杂乱的背景、复杂的姿势和许多种类的衣服类型敏感，推断过程速度慢，没有考虑遮挡情况。通过上述可知，现有的行人目标解析方法都没有考虑行人目标被遮挡的情况，如果行人目标被遮挡，利用现有的方法进行解析，会导致解析结果不准确。

发明内容

本发明提供一种神经网络***、基于神经网络***的图像解析方法和装置，能够解决目标事物被遮挡时的解析问题，使得解析结果更加准确。

本发明第一方面提供一种基于神经网络***的图像解析方法，包括：所述神经网络***获取目标事物的第一视觉特征向量 X，所述神经网络***包括遮挡估计子网络、遮挡补全子网络、分解子网络；

所述遮挡估计子网络根据目标事物的第一视觉特征 X向量确定所述目标事物被遮挡部分的遮挡标记向量 ^，所述遮挡标记向量 ^的各分量的取值为大于 0小于 1 ;

所述遮挡补全子网络根据所述第一视觉特征向量 X与所述遮挡标记向量确定所述目标事物的第三视觉特征向量 ^，所述第三视觉特征向量为补全所述遮挡部分后所述目标事物的视觉特征向量；

所述分解子网络根据所述第三视觉特征向量确定所述目标事物的各部位的类标图像，组合所述各部位的类标图像得到所述目标事物的解析结果。

在本发明第一方面的第一种可能的实现方式中，所述遮挡估计子网络为三层网络，包括：输入层、隐含层和输出层，所述输入层、隐含层和输出层依次连接；

所述遮挡估计子网络根据所述第一视觉特征向量 X确定所述目标事物被遮挡部分的遮挡标记向量，包括：

所述遮挡估计子网络将所述第一视觉特征向量 X作为所述遮挡估计子网络的输入层的输入参数，根据以下公式（1 ) 和（2 ) 计算所述遮挡标记向量 ^

= p{W°' x + b°' ) ( 1 )

x° = r(W + ） ( 2 ) 其中，公式（1) 为所述遮挡估计子网络的输入层与隐含层之间的映射函数，公式（2) 为所述遮挡估计子网络的的隐含层与输出层之间的映射函数， W '为所述遮挡估计子网络的输入层与隐含层之间的权重矩阵， _b。、为所述遮挡估计子网络的输入层与隐含层之间的偏置， W ^^^ )为非线性激活函数， W 是所述遮挡估计子网络的隐含层与输出层之间的权重矩阵，是所述遮挡估计子网络的隐含层与输出层之间的偏置，

(x) = l/(l + exp(-x)是 S型函数，返回值大于 0小于 1。

在本发明第一方面的第二种可能的实现方式中，所述遮挡补全子网络为五层网络，包括：输入层、 3个隐含层和输出层，所述 3个隐含层分别为第一隐含层、第二隐含层、第三隐含层，所述输入层、第一隐含层、第二隐含层、第三隐含层和输出层依次连接；

所述遮挡补全子网络根据所述第一视觉特征向量 X与所述遮挡标记向量确定所述目标事物的第三视觉特征向量 ^，包括：

所述遮挡补全子网络将所述遮挡标记向量与所述第一视觉特征向量 X逐分量相乘，得到遮挡特征向量 χ*χ。，其中，所述遮挡标记向量 ^与所述第一视觉特征向量 X的维度相同；

所述遮挡补全子网络将所述遮挡特征向量 χ*χ。作为所述遮挡补全子网络的输入层的参数，根据以下公式（3) 、（4) 、 (5) 、 (6) 计算所述第三视觉特征向量

Z_l = p(W^c'(x*x°) + b^c') (3)

z₂ = p{W^c'_Zl + b^c') (4)

Z₃ = 7(W^C2' z₂ +_M ^¾) (5)

x^c = p W^c'' z₃ +u^c') (6) 其中，公式（3) 为所述遮挡补全子网络的输入层与第一隐含层之间映射函数，公式（4) 为所述遮挡补全子网络的第一隐含层与第二隐含层之间的映射函数，公式（5) 为所述遮挡补全子网络的第二隐含层与第三隐含层之间的映射函数，公式（6) 为所述遮挡补全子网络的第三隐含层与输出层之间的映射函数，为所述遮挡补全子网络的输入层与第一隐含层之间的权重矩阵，为所述遮挡补全子网络的输入层与第一隐含层之间的偏置，为所述遮挡补全子网络的第一隐含层与第二隐含层之间的权重矩阵，为所述遮挡补全子网络的第一隐含层与第二隐含层之间的偏置，为所述遮挡补全子网络的第二隐含层与第三隐含层之间的权重矩阵， ^为所述遮挡补全子网络的第二隐含层与第三隐含层之间的偏置， W 为所述遮挡补全子网络的第三隐含层与输出层之间的权重矩阵，为所述遮挡补全子网络的第三隐含层与输出层之间的偏置， W 是的转置矩阵，是 W 的转置矩阵， /Hx) = max(0, x)为非线性激活函数。

在本发明第一方面的第三种可能的实现方式中，所述分解子网络为三层网络，包括：输入层、隐含层和输出层，所述输入层、隐含层和输出层依次连接；

所述分解子网络根据所述第三视觉特征向量确定所述目标事物的各部位的类标图像，组合所述各部位的类标图像得到所述目标事物的解析结果，包括：

所述分解子网络将所述第三视觉特征向量作为所述分解子网络的输入层的输入参数，根据以下公式（7 ) 和（8 ) 确定所述目标事物的各部位的类标图像： z ^ p{W^h x + b^h ) ( 7 )

其中，公式（7 ) 为所述分解子网络的输入层和隐含层之间的映射函数，公式（8 )为所述分解子网络的隐含层和输出层之间的映射函数，为所述分解子网络的输入层和隐含层之间的权重矩阵，为所述分解子网络的输入层和隐含层之间的偏置，表示所述目标事物的第部分的类标图像，表示所述第部分的类标图像对应的所述分解子网络的隐含层和输出层之间的权重矩阵，表示所述第 ,·部分的类标图像对应的所述分解子网络的隐含层和输出层之间的偏置， x) = _m«x(0, x)为非线性激活函数， (x) = l/(l + exp(-x)是 S型函数，返回值大于 0小于 1 ;

将所述各类标图像组合起来，得到所述目标事物的解析结果。

在本发明第一方面的第四种可能的实现方式中，所述遮挡估计子网络根据目标事物的第一视觉特征 X向量确定所述目标事物被遮挡部分的遮挡标记向量，包括：

所述遮挡估计子网络对所述第一视觉特征 X向量降采样，得到第二视觉特征向量 x^d，并根据所述第一视觉特征向量确定所述所述目标事物被遮挡部分的遮挡标记向量，其中，听述第二视觉特征向量的维度小于所述第一视觉特征 X，所述遮挡标记向』与述第二视觉特征向: t x^d的维度相同。

所述遮挡补全子网络根 I据所述第一视觉特征向与所述遮挡标记向: 确定所述目标事物的第三觉特征向量 ^，包括：

所述遮挡补全子网络根据所述第二视觉特征向与所述遮挡标记向: ^x°确定所述目标事物的第三视觉特征向量。

本发明第二方面提供一种基于神经网络***的图像解析方法，包括：获取所述神经网络***的各子网络对应的训练样本，所述神经网络系统包括遮挡估计子网络、遮挡补全子网络、分解子网络，所述各子网络对应的训练样本分别包括 I副图像， I取大于 1的正整数；

根据所述各子网络对应的训练样本分别对所述遮挡估计子网络、遮挡补全子网络、分解子网络进行预训练，得到所述各子网络的参数，所述各子网络的参数包括所述各子网络中相互连接的两层之间的权重矩阵和偏置。

在本发明第二方面的第一种可能的实现方式中，所述遮挡估计子网络为三层网络，包括：输入层、隐含层和输出层，所述输入层、隐含层和输出层依次连接；

所述根据各子网络对应的训练样本对所述遮挡估计子网络进行预训练，包括：

提取所述遮挡估计子网络对应的训练样本中各图像的视觉特征向量，得到所述训练样本中各图像的特征向量集合 Χ = {χ, }，其中，列向量 X,表示第副图像的视觉特征向量， l≤i≤I ;

分别确定所述各图像的遮挡部分，获取所述遮挡估计子网络对应的训练样本中各图像遮挡部分的遮挡标记向量集合 ^ = {^}，其中，列向量表示第副图像的视觉特征向量 X,对应的遮挡标记向量；

根据所述各图像遮挡标记向量集合 ^^ { }和各图像的特征向量集合 Χ = {χ, }确定所述遮挡估计子网络的输入层和隐含层之间的权重矩阵 W。《和偏置，以及确定所述遮挡估计子网络的隐含层与输出层之间的权重矩阵 W 禾口偏置 b。。在本发明第二方面的第二种可能的实现方式中，所述根据所述各图像遮挡标记向量集 ^^ { }和各图像的特征向量集 X = {X,}确定所述遮挡估计子网络的输入层与隐含层之间的权重矩阵 W。和偏置 ^，以及确定所述遮挡估计子网络的隐含层与输出层之间的权重矩阵 W 和平偏置 b 包括：令 W。'x_; + b⁰' = W⁰'^，其中，。' = [W¹ ,b。i ]， x_t = [_X:,b⁰' ]， χ,.表示第 i畐 lj图像的视觉特征向量， [X]'表示转置运算；

令 ²/ϊ,。' +b°² =W°²h°^l，其中， A.⁰' = 7(W°' .)， W°² = [W° b°²]， h°^l =[h°' ,l]； ^^argmin_{m n}。₂ X" -T(W^¾H⁰' )|L²，得到所述 W。'、 b°、、 W 禾 t ，其中，。、 ={ '} 求角军 W ,W II

是遮挡估计子网络的输入层的输出， II是 Frobenius范数。

在本发明第二方面的第三种可能的实现方式中，所述遮挡补全子网络为五层网络，包括：输入层、 3个隐含层和输出层，所述 3个隐含层分别为第一隐含层、第二隐含层、第三隐含层，所述输入层、第一隐含层、第二隐含层、第三隐含层和输出层依次连接；

所述根据所述各子网络对应的训练样本对所述遮挡补全子网络进行预训练，包括：

提取所述遮挡补全子网络对应的训练样本中各图像无遮挡时的视觉特征向量集合，其中，所述遮挡补全子网络对应的训练样本中各图像是无遮挡的目标事物；

提取所述遮挡补全子网络对应的训练样本中各图像设置有遮挡时的视觉特征向量集合 _;

根据所述遮挡补全子网络对应的训练样本中各图像有遮挡时的视觉特征向量集合^和无遮挡时的视觉特征向量集合确定所述遮挡补全子网络的输入层与第一隐含层之间的权重矩阵和偏置，确定所述遮挡补全子网络的第一隐含层与第二隐含层之间的权重矩阵和偏置，确定所述遮挡补全子网络的第二隐含层与第三隐含层之间的权重矩阵和偏置^，确定所述遮挡补全子网络的第三隐含层与输出层之间的权重矩阵 '和偏置，其中， f 是的转置矩阵， w 是的转置矩阵。

在本发明第二方面的第四种可能的实现方式中，所述根据所述遮挡补全子网络对应的训练样本中各图像有遮挡时的视觉特征向量集合 ^和无遮挡的情况下视觉特征向量集合确定所述遮挡补全子网络的输入层与第之间的权重矩阵和偏置 V，确定所述遮挡补全子网络的第一隐含层与第二隐含层之间的权重矩阵^ 和偏置 ^，确定所述遮挡补全子网络的第二隐含层与第三隐含层之间的权重矩阵和偏置^，确定所述遮挡补全子网络的第三隐含层与输出层之间的权重矩阵 W 和偏置，包括：

令/^ = W +b 为所述遮挡补全子网络的输入层的输出，是特征向量集合^中的一个向量，最小化以下第一受限玻尔兹曼机 RBM能量：

\ 2

E(V， h^Cl ) - X "- b^c - ，其中， σ_Μ是将所述遮挡补全子网络对应的训练样本中各图像的遮挡部分作为噪声时的标准差向量 σ的第 m个分量，是特征向量 Ϋ^ε的第 m个分量， h;为 h^c、的第 n个分量，表示连接 ~ 和的权重， }';为的第 _n个分量，表示的第 m个分量；

采用对比度扩散法对所述第一 RBM能量最小化，得到所述权重矩阵、偏置禾口 M^Cl ；

将所述遮挡补全子网络的输入层的输出作为所述第一隐含层的输入，令所述第一隐含层的输出为 ^ (W- ^ +bV，最小化以下第二受限波尔兹曼机 RBM能量：

„ (h^c' - u^C2 )² „ „h^c'

2 p.q

2<y_p p.q

其中， _;;是 = 7(^^' + 1^ )的第 p个分量， '为/ ^的第 p个分量，为 h 的第 q个分量， H表示连接和！^的权重，为！^的第 q个分量， u^c表示^ 的第 p个分量；

采用对比度扩散法对所述第二 RBM能量最小化，得到所述权重矩阵 W 、偏置 ^和" ；

求所述权重矩阵 nwf的转置矩阵，得到和 _W 。

在本发明第二方面的第五种可能的实现方式中，所述根据所述有遮挡的情况下视觉特征向量集合和无遮挡的情况下视觉特征向量集合确定所述遮挡补全子网络的输入层与第一隐含层之间的权重矩阵和偏置 V，确定所述遮挡补全子网络的第一隐含层与第二隐含层之间的权重矩阵 W 和偏置 ^，确定所述遮挡补全子网络的第二隐含层与第三隐含层之间的权重矩阵 W 和偏置^，确定所述遮挡补全子网络的第三隐含层与输出层之间的权重矩阵 ίΤι'和偏置之后，包括：

根据以下公式重新构建所述训练样本中各图像无遮挡的情况下视觉特征向量集合

V^c ^ p(W^c' 'p(W^C2'p(W^C2p(W^c'V^c + b^c' ) + b^C2 ) + u^C2 )u^c' ) ；

采用梯度下降法最小化所述 ^和之间的误差，得到调整后的 W 、 W b^Cl、 u^Cl、禾口 M ₀

在本发明第二方面的第六种可能的实现方式中，所述分解子网络为三层网络，包括：输入层、隐含层和输出层，所述输入层、隐含层和输出层依此连接；

所述根据各子网络对应的所述训练样本对所述分解子网络进行预训练，包括：

提取所述分解子网络对应的训练样本中各图像的视觉特征向量集合 ^= {^} , 其中，所述分解子网络对应的的训练样本是无遮挡时的目标事物；提取所述分解子网络对应的训练样本中各图像的各部位类标图像集合 = { )

令为特征向量集合中的一个视觉特征向量在所述分解子网络的输入层的输出 /^ = ^ +i i)，，·表示类标图像的个数，，·的取值为 i≤ M的正整数，，将 V按照以下映射函数映射为不同的类标图像：

其中，表示所述目标事物的第个部位的类标图像， ^表示所述第部分的类标图像对应的所述分解子网络的隐含层和输出层之间的偏置，表示所述第部分的类标图像对应的所述分解子网络的隐含层和输出层之间的权重矩阵；

令 r为中所有视^特征向量在所述分解子网络上映射成的类标图像的集合，最小化所述 r和 F之间的误差，得到 w'i、

结合本发明第二方面以及第二方面的第一种至第六种可能的实现方式，在本发明第二方面的第七种可能的实现方式中，所述根据所述训练样本分别对所述遮挡估计子网络、遮挡补全子网络、分解子网络进行预训练，得到所述各子网络的参数之后，还包括：

构建损失函数 E, 最小化所述损失函数 E:

E(X;WM =

其中， χ={χ,}是遮挡估计子网络训练样本中各图像的视觉特征向量集， X,表示第副图像的视觉特征向量， F = }是人工确定的所述训练样本中各图像的类标图像集合， ^；是人工确定的第幅图像的类标图像， r = {y,}是所述神经网络***的输出所述训练样本中各图像的类标图像集，是所述神经网络***输出的第幅图像的类标图像， W和 b是所述神经网络 ***的权重矩阵和偏置的集合；

采用随机梯度下降法求解所述损失函数 E的最优解，确定所述神经网络***的调整后的权重矩阵和偏置。

在本发明第二方面的第八种可能的实现方式中，所述采用随机梯度下降法求解所述损失函数 E的最优解，确定所述神经网络***的调整后的权重矩阵，包括：

将预训练得到所述各子网络的权重矩阵，按照以下公式进行迭代： Δ.₊₁ =0.9·Δ, -O.OOl-f-W , W' ^W¹ +Α .₊₁ ,

^{J+l 1 1} ^ ' ^{+l 1 1+1} 其中， Ζ表示所述神经网络系统的层数， /_e{l,...L}，表示迭代次数， Δ表示梯度下降时的变化率， £是学习率， ^是导数， ^ = /^( '是第层的后向投影误差^与上一层是输出/ -¹之间的乘积。在本发明第二方面的第九种可能的实现方式中，所述神经网络***的最后一层的后向投影误差 =^^( -3 ^¾^(1-} ，其中 ί¾¾(·)表示取对角矩阵运算， y表示一幅图像的实际的类标图像， _y表示所述神经网络***输出的所述图像的类标图像。

在本发明第二方面的第十种可能的实现方式中，如果第层有 s型函数运算，则第 /层的后向投影误差

, 其中， diag(. 表示取对角矩阵运算，是上一层的权重矩阵，是上一层的后向投影误差。在本发明第二方面的第十一种可能的实现方式中，如果第层有 /^x max^x)运算，则第 Z层的后向投影误差 _e' =f 〉^Q，其中，

=[wV-¹+b']_i， [.],.表示一个向量的第 ,·个分量。本发明第三方面提供一种神经网络***，包括：

遮挡估计子网络，用于根据获取到的目标事物的第一视觉特征"^向量确定所述目标事物被遮挡部分的遮挡标记向量，所述遮挡标记向量的各分量的取值为大于 0小于 1，所述第一视觉特征向量为有遮挡时所述目标事物的视觉特征向量；

遮挡补全子网络，用于根据所述第一视觉特征向量 X与所述遮挡标记向量确定所述目标事物的第三视觉特征向量 ^，所述第三视觉特征向量为无遮挡时所述目标事物的视觉特征向量；

分解子网络，用于根据所述第三视觉特征向量确定所述目标事物的各部位的类标图像，组合所述各部位的类标图像得到所述目标事物的解析结果。

在本发明第三方面的第一种可能的实现方式中，所述遮挡估计子网络为三层网络，包括：输入层、隐含层和输出层，所述输入层、隐含层和输出层依次连接；

所述遮挡估计子网络的输入层和隐含层之间的映射函数为公式（1 ) ： h。、 = 。、 x + b^) , 其中 W为所述遮挡估计子网络的输入层和隐含层之间的权重矩阵， ^为所述遮挡估计子网络的输入层与隐含层之间的偏置， 7(X) = _mor(0,X)为非线性激活函数；

所述遮挡估计子网络的隐含层和输出层之间的映射函数为公式（2) ： _x" =T{W^h^ +b°-) , W。是所述遮挡估计子网络的隐含层与输出层之间的权重矩阵，是所述遮挡估计子网络的隐含层与输出层之间的偏置，

(x) = l/(l + exp(-x)是 S型函数，返回值大于 0小于 1；

所述遮挡估计子网络具体用于：

将所述第一视觉特征向量 X作为所述遮挡估计子网络的输入层的输入参数，根据公式（1 ) 和（2) 计算所述遮挡标记向量 ^。

在本发明第三方面的第二种可能的实现方式中，所述遮挡补全子网络为五层网络，包括：输入层、 3个隐含层和输出层，所述 3个隐含层分别为第一隐含层、第二隐含层、第三隐含层，所述输入层、第一隐含层、第二隐含层、第三隐含层和输出层依次连接；

所述遮挡补全子网络的输入层与第一隐含层之间映射函数为公式

(3) ： _Ζι =

, 其中， ίΤ'为所述遮挡补全子网络的输入层与第一隐含层之间的权重矩阵，为所述遮挡补全子网络的输入层与第一隐含层之间的偏置；

所述遮挡补全子网络的第一隐含层与第二隐含层之间的映射函数为公式（4) ： _Z2 =p(W^z_{1 +}b^) ' 其中，为所述遮挡补全子网络的第一隐含层与第二隐含层之间的权重矩阵，为所述遮挡补全子网络的第一隐含层与第二隐含层之间的偏置；

所述遮挡补全子网络的第二隐含层与第三隐含层之间的映射函数为公式（5) ： _zc _z» 为所述遮挡补全子网络的第二隐含层与第三隐含层之间的权重矩阵， ^为所述遮挡补全子网络的第二隐含层与第三隐含层之间的偏置；

所述遮挡补全子网络的第三隐含层与输出层之间的映射函数为公式

(6) ： _x^ =p(W^ _{Z3 +} u^ , W 为所述遮挡补全子网络的第三隐含层与输出层之间的权重矩阵，为所述遮挡补全子网络的第三隐含层与输出层之间的偏置， W 是的转置矩阵， f是的转置矩阵， W^ax^x)为非线性激活函数；

所述遮挡估计子网络具体用于：

将所述相乘结果为 χ*χ。作为所述遮挡补全子网络的输入层的参数，根据公式（3) 、（4) 、 (5) 、 (6) 计算所述第三视觉特征向量。

在本发明第三方面的第三种可能的实现方式中，所述分解子网络为三层网络，包括：输入层、隐含层和输出层，所述输入层、隐含层和输出层以此连接；

所述分解子网络的输入层和所述隐含层之间的映射函数为公式（7) ： z =p(W^x ₊b'^ , 为所述分解子网络的输入层和隐含层之间的权重矩阵，为所述分解子网络的隐含层和输出层之间的偏置；

所述分解子网络的隐含层和输出层之间的映射函数为公式（8) ： ),_;=^ _{z +}b^) , 其中，为所述分解子网络的隐含层和输出层之间的偏置，表示所述目标事物的第部分的类标图像，表示所述分解子网络的隐含层和输出层之间的第部分的类标图像的权重矩阵， b 表示所述分解子网络的隐含层和输出层之间的第部分的类标图像的偏置，

p(x) = max(0, x)为非线性激活函数， (x) = l/(l + exp(-x)是 S型函数，返回值大于 0小于 1 ;

所述分解子网络具体用于：将所述第三视觉特征向量作为所述分解子网络的输入层的输入参数，根据公式（7 ) 和（8 ) 确定所述目标事物的各部位的类标图像，将所述各类标图像组合起来，得带所述目标事物的解析结果。

在本发明第三方面的第四种可能的实现方式中，所述遮挡估计子网络具体用于：

对所述第一视觉特征 X向量降采样，得到第二视觉特征向量 x^d，并根据所述第一视觉特征向量确定所述所述目标事物被遮挡部分的遮挡标记向量，所述第二视觉特征向量 ^的维度小于所述第一视觉特征 X，所述遮挡标记向量与述第二视觉特征向量的维度相同；

所述遮挡补全子网络具体用于：

根据所述第二视觉特征向量 x^d与所述遮挡标记向量 ^确定所述目标事物的第三视觉特征向量。

本发明第四方面提供一种基于神经网络***的图像解析装置，包括：获取模块，用于获取所述神经网络***的各子网络对应的训练样本，所述神经网络***包括遮挡估计子网络、遮挡补全子网络、分解子网络，所述各子网络对应的训练样本分别包括 I副图像， I取大于 1的正整数；训练模块，用于根据所述各子网络对应的训练样本分别对所述遮挡估计子网络、遮挡补全子网络、分解子网络进行预训练，得到所述各子网络的参数，所述各子网络的参数包括所述各子网络中相互连接的两层之间的权重矩阵和偏置。

在本发明第四方面的第一种可能的实现方式中，所述遮挡估计子网络为三层网络，包括：输入层、隐含层和输出层，所述输入层、隐含层和输出层依次连接；

所述训练模块具体用于：提取所述遮挡估计子网络对应的训练样本中各图像的视觉特征向量，得到所述训练样本中各图像的特征向量集合

Χ ={χ,}，其中，列向量 X,表示第副图像的视觉特征向量， 1≤ ≤/；

分别确定所述各图像的遮挡部分，获取所述遮挡估计子网络对应的训练样本中各图像遮挡部分的遮挡标记向量集合^ ^ί ΐ,其中，列向量表示第 ,·副图像的视觉特征向量 X,对应的遮挡标记向量；

根据所述各图像遮挡标记向量集合 ^^{ }和各图像的特征向量集合 Χ ={χ,}确定所述遮挡估计子网络的输入层和隐含层之间的权重矩阵 W。《和偏置 ^，以及确定所述遮挡估计子网络的隐含层与输出层之间的权重矩阵 W 禾口偏置 b。

在本发明第四方面的第二种可能的实现方式中，所述训练模块具体用令 + b⁰' =W°' . , 其中， W"¹ = [W° b°' ]， . = [_X:,b⁰' ]， ,.表示第副图像的视觉特征向量， [χ]'表示转置运算；

。²/i,。' +b°² ^W°²h ，其中， = W°^lx_t)， W°² = [W° b°^ 1]';

数。在本发明第四方面的第三种可能的实现方式中，所述遮挡补全子网络为五层网络，包括：输入层、 3个隐含层和输出层，所述 3个隐含层分别为第一隐含层、第二隐含层、第三隐含层，所述输入层、第一隐含层、第二隐含层、第三隐含层和输出层依次连接；

所述训练模块具体用于：提取所述遮挡补全子网络对应的训练样本中各图像无遮挡时的视觉特征向量集合，其中，所述遮挡补全子网络对应的训练样本中各图像是无遮挡的目标事物；

提取所述遮挡补全子网络对应的训练样本中各图像设置有遮挡时的视觉特征向量集合 ; 根据所述遮挡补全子网络对应的训练样本中各图像有遮挡时的视觉特征向量集合^和无遮挡时的视觉特征向量集合确定所述遮挡补全子网络的输入层与第一隐含层之间的权重矩阵和偏置，确定所述遮挡补全子网络的第一隐含层与第二隐含层之间的权重矩阵和偏置 ^，确定所述遮挡补全子网络的第二隐含层与第三隐含层之间的权重矩阵和偏置^，确定所述遮挡补全子网络的第三隐含层与输出层之间的权重矩阵 W 和偏置 M 其中， W 是的转置矩阵，是的转置矩阵。

在本发明第四方面的第四种可能的实现方式中，所述训练模块具体用于：

令/^ = W + b 为所述遮挡补全子网络的输入层的输出， Ϋ^ε是特征向量集合中的一个向量，最小化以下第一受限玻尔兹曼机 RBM能量：

E(v^c， h^c' ) = "― h^c - ，

2

其中， T_m是将所述遮挡补全子网络对应的训练样本中各图像的遮挡部分作为噪声时的标准差向量的第 _m个分量，是特征向量的第 m个分量， h:' 为 W、的第 n个分量， _:„表示连接 ~ 和的权重， b:'为 b^c'的第 _n个分量，表示的第 m个分量；

采用对比度扩散法对所述第一 RBM能量最小化，得到所述权重矩阵、偏置 V禾口；

将所述遮挡补全子网络的输入层的输出作为所述第一隐含层的输入，令所述第一隐含层的输出为 =_Pnn 、，最小化以下第二受限波尔兹曼机 RBM能量：

其中， _;;是 = 7(^^' + 1^ )的第 p个分量， '为/ ^的第 P个分量，为 h 的第 q个分量， H表示连接和!^的权重，为!^的第 q个分量， u^c表示^ 的第 p个分量；

采用对比度扩散法对所述第二 RBM能量最小化，得到所述权重矩阵 W 、偏置 ^和" ；求所述权重矩阵 w 和 ^的转置矩阵，得到和。

在本发明第四方面的第五种可能的实现方式中，所述训练模块还用于：根据以下公式重新构建所述训练样本中各图像无遮挡的情况下视觉特征向量集合

V^c ^ p(W^Cl 'p(W^C2'p(W^C2p(W^c'V^c + b^Cl ) + b^C2 ) + u^C2 )u^Cl ) ; 采用梯度下降法最小化所述 ^和之间的误差，得到调整后的 w 、 W^C'、 b 、 U^C2、 V禾口 M ^q。在本发明第四方面的第六种可能的实现方式中，所述分解子网络为三层网络，包括：输入层、隐含层和输出层，所述输入层、隐含层和输出层依此连接；

所述训练模块具体用于：提取所述分解子网络对应的训练样本中各图像的视觉特征向量集合 ^ = {^}，其中，所述分解子网络对应的的训练样本是无遮挡时的目标事物；

提取所述分解子网络对应的训练样本中各图像的各部位类标图像集合令为特征向量集合^中的一个视觉特征向量在所述分解子网络的输入层的输出 = ^ +W)，，·表示类标图像的个数，，·的取值为 i≤ M的正整数，，将按照以下映射函数映射为不同的类标图像：

其中，表示所述目标事物的第个部位的类标图像，表示所述第部分的类标图像对应的所述分解子网络的隐含层和输出层之间的偏置，表示所述第部分的类标图像对应的所述分解子网络的隐含层和输出层之间的权重矩阵；

令 r为中所有视觉特征向量在所述分解子网络上映射成的类标图像的集合，最小化所述 r和 F之间的误差，得到 w'i、。结合本发明第四方面以及第四方面的第一种至第六种可能的实现方式，在本发明第四方面的第七种可能的实现方式中，还包括：

参数调整模块，用于构建损失函数 E, 最小化所述损失函数 E:

E(X ;W,b) {χ, }

是遮挡估计子网络训练样本中各图像的视觉特征向量集， X,表示第副图像的视觉特征向量， F = }是人工确定的所述训练样本中各图像的类标图像集合， ^：是人工确定的第幅图像的类标图像， r = {y,}是所述神经网络***的输出所述训练样本中各图像的类标图像集，是所述神经网络***输出的第幅图像的类标图像， W和 b是所述神经网络 ***的权重矩阵和偏置的集合；

在本发明第四方面的第八种可能的实现方式中，所述参数调整模块具体用于：

将预训练得到所述各子网络的权重矩阵，按照以下公式进行迭代： △ =0.9.△, -0.001. £.W/_£.^， W' ^W'+A_M , 其中， Z表示所述神经网络系统的层数， /_e{l,...L}，表示迭代次数， Δ表示梯度下降时的变化率， £是学习率， ^是导数， ^ = /^ (^是第层的后向投影误差^与上一层是输出/ -¹之间的乘积。在本发明第四方面的第九种可能的实现方式中，所述神经网络***的最后一层的后向投影误差 e^L = diag(y- y)diag(l- y)，其中 diag (·)表示取对角矩阵运算， y表示一幅图像的实际的类标图像， _y表示所述神经网络***输出的所述图像的类标图像。

在本发明第四方面的第十种可能的实现方式中，如果第 /层有 S型函数运算，则第 /层的后向投影误差

, 其中， diag(. 表示取对角矩阵运算，是上一层的权重矩阵，是上一层的后向投影误差。在本发明第四方面的第十一种可能的实现方式中，如果第层有

/^x max^x)运算，则第 Z层的后向投影误差〉^Q，其中，

， <0

δ[ = [w'h'-^ b'],.， [.],表示一个向量的第个分量。

本发明实施例提供的神经网络***、基于神经网络***的图像解析方法和装置，通过神经网络***获取目标事物的第一视觉特征向量 X，然后，根据目标事物的第一视觉特征 X向量确定目标事物被遮挡部分的遮挡标记向量 ^，根据第一视觉特征向量 X与遮挡标记向量 ^确定目标事物的第三视觉特征向量 ^，第三视觉特征向量 ^为补全遮挡部分后目标事物的视觉特征向量，最后，根据第三视觉特征向量确定目标事物的各部位的类标图像，组合各部位的类标图像得到目标事物的解析结果，可以解决目标事物有遮挡时的图像解析问题，能够准确的估计出有遮挡部分的目标事物。附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。图 1为本发明基于神经网络***的图像解析方法一个实施例的流程图；图 2为无遮挡目标行人的解析结果示意图；图 3为有遮挡目标行人的解析结果示意图；图 4为处理有遮挡的目标行人解析过程示意图；图 5为本发明神经网络***的训练方法一个实施例的流程图；图 6为预训练遮挡补全子网络时目标行人遮挡设置示意图；图 7为本发明神经网络***一个实施例例的结构示意图；图 8 为本发明基于神经网络***的图像解析装置一实施例的结构示意图；

图 9为本发明基于神经网络***的图像解析装置又一实施例的结构示意图；

图 10为本发明神经网络***又一实施例的结构示意图；图 11 为本发明基于神经网络***的图像解析装置还一实施例结构示意图。具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图 1为本发明基于神经网络***的图像解析方法一个实施例的流程图，如图 1所示，本实施例的方法可以包括：

歩骤 101、神经网络***获取目标事物的第一视觉特征向量 χ。

本实施例中，神经网络***主要包括遮挡估计子网络、遮挡补全子网络、分解子网络，遮挡估计子网络主要用于估计目标事物有哪些部分被遮挡，遮挡补全子网络主要用于合成被遮挡部分的视觉特征向量，分解子网络主要用于将补全的视觉特征向量映射为该目标事物各部分的类标图像。需要说明的是，本发明各实施例中，在对一幅目标图像进行解析时，是对目标图像中的一个目标事物进行解析，举例来说，一幅图像中包括行人和一些背景，目标事物就是指这幅图像中的行人，目标事物还可以是一幅图像中的猫、狗、飞机、轿车等等。

神经网络***可通过方向梯度值方图 HOG、 SIFT 、 Gabor、 LBP提取目标图像中的目标事物的第一视觉特征向量，当然还可以通过其他现有的方法提取目标事物的第一视觉特征向量，本发明并不对此进行限制。

歩骤 102、遮挡估计子网络根据目标事物的第一视觉特征 X向量确定目标事物被遮挡部分的遮挡标记向量 ^，遮挡标记向量的各分量的取值为大于 0小于 1。

遮挡估计子网络主要用于估计目标事物有哪些部分被遮挡，遮挡估计子网络作为一个神经网络***，可以包括一个输入层、多个隐含层和一个输出层，隐含层的个数并不做限制。在一种可行的实现方式中，遮挡估计子网络为三层网络，包括：一个输入层、一个隐含层和一个输出层，输入层、隐含层和输出层依次连接，即输入层与隐含层连接，隐含层与输出层连接。每层包括多个单元，相邻层的单元之间是互相连接的，并赋予这些连接以权重，权重是通过对神经网络***进行预训练得到的。

遮挡估计子网络根据第一视觉特征向量 X确定目标事物被遮挡部分的遮挡标记向量，具体为：首先，遮挡估计子网络将第一视觉特征向量 X作为遮挡估计子网络的输入层的输入参数，然后，根据以下公式（1 )和（2 ) 计算遮挡标记向量 ^

= p{W^0l x + b^0> ) ( 1 ) ， x° = ( 。Ί) ( 2 )

其中，公式（1 ) 为遮挡估计子网络的输入层与隐含层之间的映射函数，公式（2 )为遮挡估计子网络的的隐含层与输出层之间的映射函数，为遮挡估计子网络的输入层与隐含层之间的权重矩阵，为遮挡估计子网络的输入层与隐含层之间的偏置， W ^^ x)为非线性激活函数， W 是遮挡估计子网络的隐含层与输出层之间的权重矩阵，是遮挡估计子网络的隐含层与输出层之间的偏置， (x) = l/(l _{+ eX}p(-x)是 S型函数，返回值大于 0小于 1。

遮挡标记向量是针对第一视觉特征向量 "^来说的，简单说就是第一视觉特征向量 ^中的哪些分量被遮挡了，遮挡标记向量 ^的每个分量取值在 0 和 1之间，越接近 0说明此分量越可能被遮挡，越接近 1说明此分量越可能无遮挡。

需要说明的是，本实施例中，输入图像的目标事物可以是有遮挡，也可以是无遮挡的，当目标事物无遮挡时，估计出的遮挡标记向量的分量更接近于 1。

歩骤 103、遮挡补全子网络根据第一视觉特征向量 X与遮挡标记向量确定目标事物的第三视觉特征向量 ^，第三视觉特征向量 ^为补全遮挡部分后目标事物的视觉特征向量。

遮挡补全子网络主要用于合成被遮挡部分的视觉特征向量，遮挡补全子网络作为一个神经网络***，可以包括一个输入层、多个隐含层和一个输出层，隐含层的个数并不做限制。在一种可行的实现方式中，遮挡估计子网络为五层网络，包括：一个输入层、三个隐含层和一个输出层，三个隐含层分别为第一隐含层、第二隐含层、第三隐含层，输入层、第一隐含层、第二隐含层、第三隐含层和输出层依次连接。每层包括多个单元，相邻层的单元之间是互相连接的，并赋予这些连接以权重，权重是通过对神经网络***进行预训练得到的。

遮挡补全子网络根据第一视觉特征向量 X与遮挡标记向量确定目标事物的第三视觉特征向量 ^，具体为：首先，遮挡补全子网络将遮挡标记向量 Χ与第一视觉特征向量 _χ逐分量相乘，得到遮挡特征向量 χ * χ。，其中，遮挡标记向量与第一视觉特征向量 X的维度相同；然后，遮挡补全子网络将遮挡特征向量 X*X。作为遮挡补全子网络的输入层的参数，根据以下公式（3) 、（4) 、 (5) 视觉特征向 x^c .

Z, = 7(W^C'( * 。） + V) (3)

z₂ = p(W^C2 _Zl + b^C2) (4)

Z₃ = 7(W^C2 Z₂ +_M ^¾) (5)

x^c = p(W^c'' z₃ +u^c') (6)

其中，公式（3) 为遮挡补全子网络

函数，公式（4) 为遮挡补全子网络的第

射函数，公式（5) 为遮挡补全子网络的第二隐含层与第三隐含层之间的映射函数，公式（6) 为遮挡补全子网络的第三隐含层与输出层之间的映射函数，为遮挡补全子网络的输入层与第一隐含层之间的权重矩阵，为遮挡补全子网络的输入层与第一隐含层之间的偏置，为遮挡补全子网络的第一隐含层与第二隐含层之间的权重矩阵，为遮挡补全子网络的第一隐含层与第二隐含层之间的偏置， w 为遮挡补全子网络的第二隐含层与第三隐含层之间的权重矩阵， ^为遮挡补全子网络的第二隐含层与第三隐含层之间的偏置， W 为遮挡补全子网络的第三隐含层与输出层之间的权重矩阵，为遮挡补全子网络的第三隐含层与输出层之间的偏置， W 是的转置矩阵， f是的转置矩阵， /^)= x(0,x)为非线性激活函数。

本歩骤中，通过将第一视觉特征向量与遮挡标记向量逐分量相乘后，得到遮挡特征向量 χ*χ。，然后经过遮挡补全子网络，合成被遮挡部分的视觉特征，得到补全遮挡部分后第三视觉特征向量。

歩骤 104、分解子网络根据第三视觉特征向量 ^确定目标事物的各部位的类标图像，组合各部位的类标图像得到目标事物的解析结果。

分解子网络主要用于将补全的视觉特征向量映射为该目标事物各部分的类标图像，分解子网络作为一个神经网络***，可以包括一个输入层、多个隐含层和一个输出层，隐含层的个数并不做限制。在一种可行的实现方式中，分解子网络为三层网络，包括：输入层、隐含层和输出层，输入层、隐含层和输出层依次连接。每层包括多个单元，相邻层的单元之间是互相连接的，并赋予这些连接以权重，权重是通过对神经网络***进行预训练得到的。分解子网络根据第三视觉特征向量确定目标事物的各部位的类标图像，组合各部位的类标图像得到目标事物的解析结果，具体为：首先，分解子网络将第三视觉特征向量 ^作为分解子网络的输入层的输入参数，根据以下公式（7 ) 和（8 ) 确定目标事物的各部位的类标图像： z ^ p{W x^c + b ) ( 7 )

其中，公式（7 ) 为分解子网络的输入层和隐含层之间的映射函数，公式（8 ) 为分解子网络的隐含层和输出层之间的映射函数，为分解子网络的输入层和隐含层之间的权重矩阵，为分解子网络的输入层和隐含层之间的偏置。将目标事物分解为 M个不同的部位，每个部分对应一个类标图像，表示目标事物的第部分的类标图像，表示第部分的类标图像对应的分解子网络的隐含层和输出层之间的权重矩阵，表示第部分的类标图像对应的分解子网络的隐含层和输出层之间的偏置， p(x) = max(0, x)为非线性激活函数， (x) = l/(l + exp(-x)是 S型函数，返回值大于 0小于 1。

本歩骤中，将歩骤 103中得到补全遮挡部分后第三视觉特征向量进行分解，得到目标事物各部分的类标图像，然后将各类标图像组合起来，接得到了目标事物的解析结果。

需要说明的是，本实施例提供的方法，不仅适用于没有遮挡的目标事物的解析，也适用于没有遮挡的目标事物的解析，能够获得准确的标解目标事物的解析结果，并且对遮挡、杂乱背景、复杂的姿势变化和衣服类型等具有鲁棒性。图 2为无遮挡目标行人的解析结果示意图，图 3为有遮挡目标行人的解析结果示意图，图 2中第一行的图像表示现实环境中实际拍摄到的图像，第二行表示本实施例解析出的目标行人的结果，第三行表示手工标定的真实类标图像；图 3中第一行的图像表示现实环境中实际拍摄到的图像，这些图像中的目标行人都被部分遮挡了，第二行表示本实施例解析出的目标行人的结果，第三行表示手工标定的真实类标图像。

本实施例提供的方法，通过神经网络***获取目标事物的第一视觉特征向量 X，然后，根据目标事物的第一视觉特征 X向量确定目标事物被遮挡部分的遮挡标记向量 ^，根据第一视觉特征向量 X与遮挡标记向量 ^确定目标事物的第三视觉特征向量 ^，第三视觉特征向量为补全遮挡部分后目标事物的视觉特征向量，最后，根据第三视觉特征向量 ^确定目标事物的各部位的类标图像，组合各部位的类标图像得到目标事物的解析结果，可以解决目标事物有遮挡时的图像解析问题，能够准确的估计出有遮挡部分的目标事物。

需要说明的是，在本实施的一种实现方式中，神经网络***在获取到第一视觉特征向量 X后，还可以对第一视觉特征向量 X降采样。降采样的主要目的是减少数据量，从而达到提高神经网络***处理速度的目的。具体地，遮挡估计子网络对第一视觉特征 X向量降采样，得到第二视觉特征向量，并根据第一视觉特征向量确定目标事物被遮挡部分的遮挡标记向量，其中，第二视觉特征向量的维度小于第一视觉特征 X，遮挡标记向量 ^与述第二视觉特征向量 x^d的维度相同。

相应地，遮挡补全子网络根据第一视觉特征向量 "^与遮挡标记向量确定目标事物的第三视觉特征向量 ^，具体为：遮挡补全子网络根据第二视觉特征向量 ^与遮挡标记向量确定目标事物的第三视觉特征向量。具体实现方式可参照实施例一的中描述，这里不再赘述。如图 4所示，图 4为处理有遮挡的目标行人解析过程示意图，首先对输入的图像提取目标行人第一视觉特征向量 X，然后对第一视觉特征向量 X进行降采样得到第二视觉特征向量 ^，同时根据第一视觉特征向量 X确定目标行人的被遮挡部分的遮挡标记向量 ^，遮挡补全子网络将遮挡标记向量 ^与第一视觉特征向量 X逐分量相乘，得到遮挡特征向量 χ * χ。，遮挡补全子网络将遮挡特征向量 χ * χ。作为遮挡补全子网络的输入层的参数，得到特征向量，分解子网络根据第三视觉特征向量确定目标事物的各部位的类标图像 y,，如图中所示，为根据第三视觉特征向量 ^确定目标行人的头发类标图像，表示该目标行人的上身类标图像，）¾表示该目标行人的下身类标图像，当确定出目标行人的所有类标图像后，将各部位的类标图像按照一定的方式组合得到该目标行人的解析结果。

在执行实施例一所示的基于神经网络***的图像解析方法之前，还需要对该神经网络***进行预训练，得到神经网络***的一些参数，图 5为本发明神经网络***的训练方法一个实施例的流程图，如图 5所示，本实施例的方法可以包括：歩骤 201、获取神经网络***的各子网络对应的训练样本。在对神经网络***进行预训练之前，首先要获取神经网络***神经网络***的各子网络对应的训练样本，本实施例中，神经网络***主要包括三个子网络，分别为遮挡计子网络、遮挡补全子网络、分解子网络，每个字网络对应一个训练样; ，在训练时分别根据各子网络对应的训练样本对各子网络进行训练，各¥网络的训练样本不同，各子网络对应的训练样本分别包括 I副图像， I取大于 1的正整数。

歩骤 202、根据各子网络对应的训练样本分别对遮挡估计子网络、遮挡补全子网络、分解子网络进行预训练，得到各子网络的参数，各子网络的参数包括各子网络中相互连接的两层之间的权重矩阵和偏置。

在获取各子网络的对应的训练样本后，根据各子网络对应的训练样本分别对遮挡估计子网络、遮挡补全子网络、分解子网络进行预训练，得到各子网络的参数。以下将具体介绍各个子网络的训练过程：

首先，对遮挡估计子网络进行预训练，以遮挡估计子网络为三层网络为例进行说明，遮挡估计子网络包括：输入层、隐含层和输出层，输入层、隐含层和输出层依次连接。应该明确的是遮挡估计子网络的层数还可以更多，本发明并不对此限制，不论遮挡估计子网络有几层，都可以按照本实施例提供的方法进行训练，本实施例中只是以遮挡估计子网络为三层为例进行说明，根据各子网络对应的训练样本对遮挡估计子网络进行预训练，具体包括：

第一歩：提取遮挡估计子网络对应的训练样本中各图像的视觉特征向量，得到训练样本中各图像的特征向量集合 Χ = { χ, }，其中，列向量 X,表示第副图像的视觉特征向量， 1≤ ≤/。

遮挡估计子网络对应的训练样本中包括 I副图像，这 I副图像主要包括两种类型的图像，第一种类型为目标事物被遮挡的图像，第二种类型为目标事物没有被遮挡的图像。分别提取训练样本中各图像的视觉特征向量，得到训练样本中各图像的特征向量集合 Χ = { χ, }，特征向量集合 Χ = { χ, } 中的每一列表示一幅图像的视觉特征向量。

第二歩、分别确定各图像的遮挡部分，获取遮挡估计子网络对应的训练样本中各图像遮挡部分的遮挡标记向量集合^ ^ ^} ,其中，列向量表小 ,·副图像的视觉特征向量 X,对应的遮挡标记向量。

在进行预训练时，可通过人工的方式确定各图像的遮挡部分，获取遮挡估计子网络对应的训练样本中各图像遮挡部分的遮挡标记向量集合

7 = { }, 其中，列向量表示第副图像的视觉特征向量 X,对应的遮挡标记向量，如果哪一幅图像没有被遮挡，则该图像的遮挡标记向量各分量为第三歩、根据各图像遮挡标记向量集合 ={ }和各图像的特征向量集合 X={x,}确定遮挡估计子网络的输入层和隐含层之间的权重矩阵 W。《和偏置，以及确定遮挡估计子网络的隐含层与输出层之间的权重矩阵 W。和偏置 b。

首先， ^W .+b⁰' = ν°' , 其中， W°' = [W°',b°'], ΐ,. =[χ,.' 。']'， χ,表示第! '畐¹ J 图像的视觉特征向量， W'表示转置运算；

令 ²/ϊ,。' +b°² =W°²h°^l，其中， ¾' = ， W°² = [W° b°²]， h°^l =[h°' l]； argmin^, 。 X⁰ -T(W^¾H⁰') b°、、 W°²禾 t 。²，其中， H°' 求解 ^s

是遮挡估计子网络的输入层的输出， ={3 ， III是 Frobenius范数, χ。 — T(W H⁰')

其中，求解的最优化问题可采用以下两种方式：方式一：可基于最小平方字典学习 (least squares dictionary learning)方式求解，可迭代求解以下两个公式：

ar min 禾口 arg min

1 Ψ² 即首先用线性变换 w。将线性逼近，一旦求解出来，再用另一个线性变换 W。，将/?。？^。¹ 逼近。上述两个问题可基于以下两个闭型公式求解：

w ϋ(χχ')— w f。/?。'（/?。'/?。' Γ¹，

方式二：如果训练样本数目过多，以上矩阵求逆运算时复杂度太高，可以采用在线字典学习算法求解。

然后，介绍对遮挡补全子网络的预训练，以遮挡补全子网络为五层网络为例，遮挡补全子网络包括：输入层、三个隐含层和输出层，三个隐含层分别为第一隐含层、第二隐含层、第三隐含层，输入层、第一隐含层、第二隐含层、第三隐含层和输出层依次连接。应该明确的是遮挡补全子网络的层数还可以更多，本发明并不对此限制，不论遮挡补全子网络有几层，都可以按照本实施例提供的方法进行训练，本实施例中只是以遮挡补全子网络为五层为例进行说明，根据各子网络对应的训练样本对遮挡补全子网络进行预训练，可以包括以下歩骤：

第一歩、提取遮挡补全子网络对应的训练样本中各图像无遮挡时的视觉特征向量集合 ;

其中，遮挡补全子网络对应的训练样本中各图像是无遮挡的目标事物，可采用真实环境中拍摄到的无遮挡的图像。

第二歩、提取遮挡补全子网络对应的训练样本中各图像设置有遮挡时的视觉特征向量集合

遮挡补全子网络对应的训练样本中各图像是无遮挡的目标事物，在提取遮挡补全子网络对应的训练样本中各图像设置有遮挡时的视觉特征向量集合 VS 可通过人工方式对真实环境中拍摄到的无遮挡的图像人为模拟出遮挡部分，图 6为预训练遮挡补全子网络时目标行人遮挡设置示意图，如图 6所示，目标事物为目标行人，分别人为设置各图像的正当部分，图中黑色部分表示图像设置的遮挡部分，图***为遮挡了目标行人的 40各部分，模拟出对目标行人的 40种遮挡模式。

第三歩、根据遮挡补全子网络对应的训练样本中各图像有遮挡时的视觉特征向量集合和无遮挡时的视觉特征向量集合确定遮挡补全子网络的输入层与第一隐含层之间的权重矩阵和偏置，确定遮挡补全子网络的第一隐含层与第二隐含层之间的权重矩阵和偏置，确定遮挡补全子网络的第二隐含层与第三隐含层之间的权重矩阵 w 和偏置^，确定遮挡补全子网络的第三隐含层与输出层之间的权重矩阵 f和偏置，其中， f是 ^的转置矩阵，是 w 的转置矩阵。

具体地，令 = W + l^ )为遮挡补全子网络的输入层的输出， Ϋ^Ε是特征向量集合中的一个向量，最小化以下第一受限玻尔兹曼机 RBM能量：

E{V， h^c' ) = ^(Vm_"₂ ^m') "― h^c - ，

，

其中， x_m是将遮挡补全子网络对应的训练样本中各图像的遮挡部分作为噪声时的标准差向量的第 m个分量， Ϋ;是特征向量 Ϋ^Ε的第 m个分量， h;;为 V 的第 n个分量， „表示连接和1^的权重，为^'的第11个分量，表示^ 的第 m个分量；

采用对比度扩散法对第一 RBM能量最小化，得到权重矩阵 W 偏置和 u^c' ；

将遮挡补全子网络的输入层的输出作为第一隐含层的输入，令第一隐含层的输出为 = _Pm +b ，最小化以下第二受限波尔兹曼机 RBM能量：

(j2^c、 -u^C2)²

E(h^c、， h^C2)，=Y-^ ~ 2 "― ,

其中， _;;是 = 7(^^' + 1 ')的第 p个分量， '为/ ^的第 P个分量，为 h 的第 q个分量， H表示连接和!^的权重，为的第 q个分量， u^c表示^ 的第 p个分量；

采用对比度扩散法对第二 RBM能量最小化，得到权重矩阵 W 、偏置 ^和

«^¾ ；

求权重矩阵 ^^¾和^^'的转置矩阵，得到 '和 f。

一种方式中，为了得到更准确的参数，在得到权重矩阵 W W W^'和偏置、 ^和" ；之后，还包括：

根据以下公式重新构建训练样本中各图像无遮挡的情况下视觉特征向量集合

V^c ^ p(W^Ci'p(W^C2'p(W^C2p(W^CiV^c +b^Ci) + b^C2) + u ²)u^Ci)；

采用梯度下降法最小化 ^和之间的误差，得到调整后的 w 、 W b " 、和" ，将调整后的 W 、 W b u V和" ^ε '作为遮挡补全子网络的最终参数。

最后，介绍分解子网络的预训练过程，以分解子网络为三层网络为例进行说明，分解子网络包括：输入层、隐含层和输出层，输入层、隐含层和输出层依此连接。应该明确的是分解子网络的层数还可以更多，本发明并不对此限制，不论分解子网络有几层，都可以按照本实施例提供的方法进行训练，本实施例中只是以分解子网络为三层为例进行说明，根据各子网络对应的训练样本对分解子网络进行预训练，包括以下歩骤：

第一歩、提取分解子网络对应的训练样本中各图像的视觉特征向量集合 ^ = {^}, 其中，分解子网络对应的的训练样本是无遮挡时的目标事物。

第二歩、提取分解子网络对应的训练样本中各图像的各部位类标图像集合？⁷ = {^}。

令为特征向量集合^中的一个视觉特征向量在分解子网络的输入层的输出 ^ = 0^ ₊ )，分解子网络的隐含层对应 M个权重矩阵 {W^ } , i 表示类标图像的个数，的取值为 i ≤M的正整数，将按照以下映射函数映射为不同的类标图像：

其中，表示目标事物的第个部位的类标图像，表示第部分的类标图像对应的分解子网络的隐含层和输出层之间的偏置，表示第 ,·部分的类标图像对应的分解子网络的隐含层和输出层之间的权重矩阵，可通过人工方式标定每副图像的各部位的类标图像

令 r为中^ f有视觉特征向量在分解子网络上映射成的类标图像的集合，最小化 r和 F之间的误差，得到 w'i、 w; 。

需要说明的是，对遮挡估计子网络、遮挡补全子网络、分解子网络的预训练是独立进行的，训练时也没有先后的顺序。

为例提高整个神经网络***的性能，在得到各个子网络的参数后，将各子网络的参数作为一个整体进一歩作调整。参数调整包括以下几个歩骤：第一歩、构建损失函数 E，并最小化以下损失函数 E:

其中， E(Hb) = |F-i^， Χ = {χ, }是遮挡估计子网络训练样本中各图像的视觉特征向量集， X,表示第副图像的视觉特征向量， F = }是人工确定的训练样本中各图像的类标图像集合，是人工确定的第幅图像的类标图像， r = {y, }是神经网络***的输出训练样本中各图像的类标图像集，是神经网络 ***输出的第 ,·幅图像的类标图像， W和 b是神经网络***的权重矩阵和偏置的集合；

第二歩、采用随机梯度下降法求解损失函数 E的最优解，确定神经网络***的调整后的权重矩阵和偏置。

采用随机梯度下降法求解损失函数 E的最优解，确定神经网络***的调整后的权重矩阵，具体为：

将预训练得到各子网络的权重矩阵，按照以下公式进行迭代： Δ.₊₁ =0.9 Δ, -Ο.ΟΟΙ ε-W' -ε ^- , W' =W'+A_M ,

^{J J J} 其中， Ζ表示神经网络***的层数， /_{e {}l,...L}，表示迭代次数， Δ表示梯度下降时的变化率， £是学习率， ^是导数， ^^-W是第层的后向投影误差 ^与上一层是输出/ 之间的乘积。

后向投影误差 ^有三种不同的计算方式，神经网络***的最后一层的后向投影误差为^ = ^^( -3 ^^(1-} ，其中 ί¾¾(·)表示取对角矩阵运算， y 表示一幅图像的实际的类标图像， y表示神经网络***输出的图像的类标图像。如果第层有 S型函数运算，则第 z层的后向投影误差

e^l ^diag{W^l+ve^l+l)diag{h^l){\-h^l) , 其中， agO表示取对角矩阵运算，是上一层的权重矩阵，是上一层的后向投影误差。如果第 /层有 / x) = m_ax(0,x) 运算，则第层的后向投影误差

[-],表示一个向量的第个分量。图 7为本发明神经网络***一个实施例例的结构示意图，如图 7所示，本实施例的神经网络***可以包括：遮挡估计子网络 31、遮挡补全子网络 32、分解子网络 33。

其中，遮挡估计子网络 31，用于根据获取到的目标事物的第一视觉特征 ^向量确定目标事物被遮挡部分的遮挡标记向量，遮挡标记向量的各分量的取值为大于 0小于 1，第一视觉特征向量为有遮挡时目标事物的视觉特征向量；

遮挡补全子网络 32，用于根据第一视觉特征向量 X与遮挡标记向量确定目标事物的第三视觉特征向量 ^，第三视觉特征向量 ^为无遮挡时目标事物的视觉特征向量；

分解子网络 33，用于根据第三视觉特征向量 ^确定目标事物的各部位的类标图像，组合各部位的类标图像得到目标事物的解析结果。

可选地，遮挡估计子 31网络为三层网络，包括：输入层、隐含层和输出层，输入层、隐含层和输出层依次连接；遮挡估计子网络 31的输入层和隐含层之间的映射函数为公式（1) ： h^ =p{^ x ₊ b^), 其中 W为遮挡估计子网络 31的输入层和隐含层之间的权重矩阵， ^为遮挡估计子网络 31的输入层与隐含层之间的偏置，

p(x) = max(0, x)为非线性激活函数；

遮挡估计子网络 31的隐含层和输出层之间的映射函数为公式（2) ：

^ =T(W^h^ ₊b^) , W 是遮挡估计子网络 31的隐含层与输出层之间的权重矩阵，是遮挡估计子网络 31的隐含层与输出层之间的偏置，

(x) = l/(l + exp(-x)是 S型函数，返回值大于 0小于 1；

遮挡估计子网络 31具体用于：

将第一视觉特征向量 X作为遮挡补全子网络 31的输入层的输入参数，根据公式（1) 和（2) 计算遮挡标记向量。

可选地，遮挡补全子网络 31为五层网络，包括：输入层、 3个隐含层和输出层， 3个隐含层分别为第一隐含层、第二隐含层、第三隐含层，输入层、第一隐含层、第二隐含层、第三隐含层和输出层依次连接；

遮挡补全子网络 32的输入层与第一隐含层之间映射函数为公式（3) :

_Zl =p(WHx*x°) + b^ , 其中，为遮挡补全子网络 32的输入层与第一隐含层之间的权重矩阵，为遮挡补全子网络 32的输入层与第一隐含层之间的偏置；

遮挡补全子网络 32的第一隐含层与第二隐含层之间的映射函数为公式（4) ： z^piW^z^b^) , 其中， W 为遮挡补全子网络 32的第一隐含层与第二隐含层之间的权重矩阵，为遮挡补全子网络 32的第一隐含层与第二隐含层之间的偏置；

遮挡补全子网络 32的第二隐含层与第三隐含层之间的映射函数为公式（5) ： _{Z3 = 7(}w^_{Z2 +} ^), 为遮挡补全子网络 32的第二隐含层与第三隐含层之间的权重矩阵， ^为遮挡补全子网络 ₃₂的第二隐含层与第三隐含层之间的偏置；

遮挡补全子网络 32的第三隐含层与输出层之间的映射函数为公式 (6) ： _x^ =p(w^_{Z3 +} u^ , w 为遮挡补全子网络 32的第三隐含层与输出层之间的权重矩阵，为遮挡补全子网络 32的第三隐含层与输出层之间的偏置， W 是的转置矩阵， f是的转置矩阵， /^)= χ(0,χ)为非线性激活函数；遮挡补全子网络 32具体用于：

将相乘结果为 χ*χ。作为遮挡补全子网络 32的输入层的参数，根据公式（3) 、（4) 、 (5) 、 (6) 计算第三视觉特征向量。

可选地，分解子网络 33为三层网络，包括：输入层、隐含层和输出层，输入层、隐含层和输出层以此连接；

分解子网络 33的输入层和隐含层之间的映射函数为公式（7) ： z -p(W"x^c+b") , 为分解子网络 33的输入层和隐含层之间的权重矩阵， ^为分解子网络 33的隐含层和输出层之间的偏置；

分解子网络 33的隐含层和输出层之间的映射函数为公式（8) ： ),_;=^ _{z +}b^) ,其中，为分解子网络 33的隐含层和输出层之间的偏置，表示目标事物的第 i部分的类标图像，表示分解子网络的隐含层和输出层之间的第 i部分的类标图像的权重矩阵，表示分解子网络的隐含层和输出层之间的第第 i部分的类标图像的偏置， W ^ x)为非线性激活函数， (x) = l/(l + exp(-x)是 S型函数，返回值大于 0小于 1;

分解子网络 33具体用于：将第三视觉特征向量 ^作为分解子网络的输入层的输入参数，根据公式（7) 和（8) 确定目标事物的各部位的类标图像，将各类标图像组合起来，得带目标事物的解析结果。

在一种实现方式中，遮挡估计子网络 31具体用于：对第一视觉特征 X 向量降采样，得到第二视觉特征向量，并根据第一视觉特征向量确定目标事物被遮挡部分的遮挡标记向量 ^，第二视觉特征向量的维度小于第一视觉特征 X，遮挡标记向量与述第二视觉特征向量 x^d的维度相同；遮挡补全子网络 32具体用于：根据第二视觉特征向量与遮挡标记向量确定目标事物的第三视觉特征向量 ^。

本实施例提供的神经网络***，可用于执行图 1所示方法实施例提供的技术方案，具体实现方式和技术效果类似，这里不再赘述。

图 8为本发明基于神经网络***的图像解析装置一实施例的结构示意图，如图 8所示，本实施例提供的基于神经网络***的图像解析装置，包括：获取模块 41、训练模块 42。

其中，获取模块 41，用于获取神经网络***的各子网络对应的训练样本，神经网络***包括遮挡估计子网络、遮挡补全子网络、分解子网络，各子网络对应的训练样本分别包括 I副图像， I取大于 1的正整数；训练模块 42，用于根据各子网络对应的训练样本分别对遮挡估计子网络、遮挡补全子网络、分解子网络进行预训练，得到各子网络的参数，各子网络的参数包括各子网络中相互连接的两层之间的权重矩阵和偏置。

本实施例中，遮挡估计子网络可以为三层网络，包括：输入层、隐含层和输出层，输入层、隐含层和输出层依次连接，训练模块 42具体用于: 提取遮挡估计子网络对应的训练样本中各图像的视觉特征向量，得到训练样本中各图像的特征向量集合 Χ ={χ,}，其中，列向量 X,表示第副图像的视觉特征向量， l≤i≤i ;

分别确定各图像的遮挡部分，获取遮挡估计子网络对应的训练样本中各图像遮挡部分的遮挡标记向量集合 ^^{ } , 其中，列向量表示第副图像的视觉特征向量 X,对应的遮挡标记向量；

根据各图像遮挡标记向量集合^ ^ί ΐ和各图像的特征向量集合 Χ ={χ,}确定遮挡估计子网络的输入层和隐含层之间的权重矩阵 W。和偏置 b- , 以及确定遮挡估计子网络的隐含层与输出层之间的权重矩阵 W 和偏置

训练模块 42具体通过以下方式确定 w。、 b。'、 w 和首先，令

W'x^b⁰' =W°' . , 其中，。' =[W。'，&。']， . =[x_; ⁰']', x,表示第 !·副图像的视觉特征向量， [χ]'表示转置运算；令 W。f + ²= ^¾ '，其中， Α_;。' i_;)，

W°² ，得到 w。'、 b°

和，其中，是遮挡估计子网络的输入层的输出， ={ }， H 是 Frobenius范数。

本实施例中，遮挡补全子网络为五层网络，包括：输入层、 3 个隐含层和输出层， 3 个隐含层分别为第一隐含层、第二隐含层、第三隐含层，输入层、第一隐含层、第二隐含层、第三隐含层和输出层依次连接；训练模块 42 具体用于：

提取遮挡补全子网络对应的训练样本中各图像无遮挡时的视觉特征向量集合，其中，遮挡补全子网络对应的训练样本中各图像是无遮挡的目标事提取遮挡补全子网络对应的训练样本中各图像设置有遮挡时的视觉特征向量集合 ;

根据遮挡补全子网络对应的训练样本中各图像有遮挡时的视觉特征向量集合和无遮挡时的视觉特征向量集合确定遮挡补全子网络的输入层与第一隐含层之间的权重矩阵和偏置，确定遮挡补全子网络的第一隐含层与第二隐含层之间的权重矩阵和偏置 ^，确定遮挡补全子网络的第二隐含层与第三隐含层之间的权重矩阵和偏置^，确定遮挡补全子网络的第三隐含层与输出层之间的权重矩阵 W 和偏置 ^，其中， W 是的转置矩阵，是 w 的转置矩阵。

训练模块 42具体通过以下方式得到权重矩阵 w W 偏置 ^、 " 、 V禾口 M^C' ：

令/^ = W + b 为遮挡补全子网络的输入层的输出， ^是特征向量集合 ^中的一个向量，最小化以下第一受限玻尔兹曼机 RBM能量：

E{V， h^c' ) = "― h^c - ，

，

其中， x_m是将遮挡补全子网络对应的训练样本中各图像的遮挡部分作为噪声时的标准差向量的第 m个分量， Ϋ;是特征向量的第 m个分量， i ^为的第 n个分量，表示连接和的权重，为的第 n个分量，表示的第 m个分量；

采用对比度扩散法对第一 RBM能量最小化，得到权重矩阵、偏置和 u^c' ；

将遮挡补全子网络的输入层的输出作为第一隐含层的输入，令第一隐含层的输出为 ^Λ¾ = P(^^{C2 hCi} +b ，最小化以下第二受限波尔兹曼机 RBM能量：

其中， _;;是 = 7(¹^^ + 1^ )的第 p个分量，为/^的第 p个分量，为/^ 的第 q个分量， H表示连接和!^的权重，为的第 q个分量， u^c表示^ 的第 p个分量；

«^¾ ；

求权重矩阵 W 和 ^的转置矩阵，得到 W 和 _W 。

本实施例中，训练模块还用于：根据以下公式重新构建训练样本中各图像无遮挡的情况下视觉特征向量集合

V^c = p(W^c''p(W^'p(W^p(W^c'V^c + b^c' ) + b^c + u^c u^c') .采用梯度下降法最小化 ^和^ 之间的误差，得到调整后的 W 、 W b u 和 ^。

本实施例中，分解子网络可以为三层网络，包括：输入层、隐含层和输出层，输入层、隐含层和输出层依此连接。训练模块 42具体用于： _ 取分解子网络对应的训练样本中各图像的视觉特征向量集合

^{X C} = ^ 其中，分解子网络对应的的训练样本是无遮挡时的目标事物；

_ 取分解子网络对应的训练样本中各图像的各部位类标图像集合令为特征向量集合^中的一个视觉特征向量在分解子网络的输入层的输出 = p{W'^ ~ ^ ) , 表示类标图像的个数，的取值为 1 ^'≤M的正整数，，将按照以下映射函数映射为不同的类标图像：

其中，表示目标事物的第个部位的类标图像，表示第部分的类标图像对应的分解子网络的隐含层和输出层之间的偏置，表示第部分的类标图像对应的: ^解子网络的隐含层和输出层之间的权重矩阵；

令 r为中所有视觉特征向量在分解子网络上映射成的类标图像的集合，最小化和之间的误差，得到 w 、 ^ 。本实施例提供的基于神经网络***的图像解析装置，可用于执行图 5 所示方法实施例提供的技术方案，具体实现方式和技术效果类似，这里不再赘述。图 9为本发明基于神经网络***的图像解析装置又一实施例的结构示意图，如图 9所示，本实施例的装置在图 8所示装置结构的基础上，进一歩地，还可以包括：参数调整模块 43。

其中，参数调整模块 43，用于构建损失函数 E, 最小化损失函数 E:

E(X ;W, b) =

, 其中， Χ = {χ, }是遮挡估计子网络训练样本中各图像的视觉特征向量集， X,表示第副图像的视觉特征向量， F = {^}是人工确定的训练样本中各图像的类标图像集合，是人工确定的第幅图像的类标图像， r = {y,}是神经网络***的输出训练样本中各图像的类标图像集，是神经网络 ***输出的第幅图像的类标图像， W和 b是神经网络***的权重矩阵和偏置的集合；

采用随机梯度下降法求解损失函数 E的最优解，确定神经网络***的调整后的权重矩阵和偏置。

本实施例中，参数调整模块 43具体用于：将预训练得到各子网络的权重矩阵，按照以下公式进行迭代：，

W _+l ^ W + A_j+l , 其中， Z表示神经网络***的层数， / _e {l, . . . L}， ·表示迭代次数， Δ表示梯度下降时的变化率， £是学习率， ^是导数，是 aw' aw'

第 /层的后向投影误差 ^与上一层是输出/ -¹之间的乘积。

神经网络***的后向投影误差有以下三种形式：神经网络***的最后一层的后向投影误差 e^L = diag (y - y)diag(l - y)，其中 diag (·)表示取对角矩阵运算， y表示一幅图像的实际的类标图像， _y表示神经网络***输出的图像的类标图像。如果第 Z层有 S型函数运算，贝层的后向投影误差 e - diag (W ¹⁺¹ e^l+1 )diag (h^l )(1 - h^l )，其中， diag (·)表示取对角矩阵运算，是上一层的权重矩阵，是上一层的后向投影误差。如果第 /层有 / x) = m_ax(0,x) 运算，则第层的后向投影误差

[-],表示一个向量的第个分量。

本实施例提供的基于神经网络***的图像解析装置，可用于执行图 5 所示方法实施例提供的技术方案，具体实现方式和技术效果类似，这里不再赘述。

图 10为本发明神经网络***又一实施例的结构示意图，如图 10所示，本实施例的神经网络*** 500包括：处理器 51和存储器 52，处理器和存储器通过总线连接，存储器 52存储执行指令，当神经网络*** 500运行时，处理器 51与存储器 52之间通信，处理器 51执行指令使得神经网络 *** 500执行本发明提供的基于神经网络***的图像解析方法。本实施例中，神经网络***的遮挡估计子网络、遮挡补全子网络和分解子网络都可以通过处理器 51来实现，由处理器 51执行各个子网络的功能。具体地：处理器 51控制遮挡估计子网络根据获取到的目标事物的第一视觉特征"^向量确定目标事物被遮挡部分的遮挡标记向量，遮挡标记向量的各分量的取值为大于 0小于 1，第一视觉特征向量为有遮挡时目标事物的视觉特征向量；

处理器 51控制遮挡补全子网络根据第一视觉特征向量 X与遮挡标记向量确定目标事物的第三视觉特征向量 ^，第三视觉特征向量 ^为无遮挡时目标事物的视觉特征向量 ·'

处理器 51控制分解子网络根据第三视觉特征向量确定目标事物的各部位的类标图像，组合各部位的类标图像得到目标事物的解析结果。

本实施例中，遮挡估计子网络可以为三层网络，包括：输入层、隐含层和输出层，输入层、隐含层和输出层依次连接；遮挡估计子网络的输入层和隐含层之间的映射函数为公式（1) ： h^ =p{^ x ₊ b^) , 其中 W为遮挡估计子网络的输入层和隐含层之间的权重矩阵， ^为遮挡估计子网络的输入层与隐含层之间的偏置， W = max(0, X)为非线性激活函数；

遮挡估计子网络的隐含层和输出层之间的映射函数为公式（2) ： ^ =T(W^h^ ₊b^) , W 是遮挡估计子网络的隐含层与输出层之间的权重矩阵，是遮挡估计子网络的隐含层与输出层之间的偏置， (x) = l/(l _{+ eX}p(-x) 是 S型函数，返回值大于 0小于 1;

处理器 51具体控制遮挡估计子网络将第一视觉特征向量 X作为遮挡估计子网络的输入层的输入参数，根据公式（1) 和（2) 计算遮挡标记向量 o

X

本实施例中，遮挡补全子网络为五层网络，包括：输入层、 3个隐含层和输出层， 3个隐含层分别为第一隐含层、第二隐含层、第三隐含层，输入层、第一隐含层、第二隐含层、第三隐含层和输出层依次连接；

遮挡补全子网络的输入层与第一隐含层之间映射函数为公式（3) ： _Ζι =

,其中，为遮挡补全子网络的输入层与第一隐含层之间的权重矩阵， W为遮挡补全子网络的输入层与第一隐含层之间的偏置；遮挡补全子网络的第一隐含层与第二隐含层之间的映射函数为公式 (4) ： _Z2 =p(W^z_{1 +} b^) ' 其中， W 为遮挡补全子网络的第一隐含层与第二隐含层之间的权重矩阵，为遮挡补全子网络的第一隐含层与第二隐含层之间的偏置；

遮挡补全子网络的第二隐含层与第三隐含层之间的映射函数为公式 (5) ： z₃ =p(W^z_{2 +}u^) ' 为遮挡补全子网络的第二隐含层与第三隐含层之间的权重矩阵， ^为遮挡补全子网络的第二隐含层与第三隐含层之间的偏置；

遮挡补全子网络的第三隐含层与输出层之间的映射函数为公式（6) ： ^ =p(W^ z_{3 +} u-) , W 为遮挡补全子网络的第三隐含层与输出层之间的权重矩阵，为遮挡补全子网络的第三隐含层与输出层之间的偏置， w 是的转置矩阵， W 是的转置矩阵， W ax^x)为非线性激活函数；

处理器 51具体控制遮挡估计子网络将相乘结果为 x*x。作为遮挡补全子网络的输入层的参数，根据公式（3) 、（4) 、 (5) 、 (6) 计算第三视觉特征向量 ^。

本实施例中，分解子网络为三层网络，包括：输入层、隐含层和输出层，输入层、隐含层和输出层以此连接；分解子网络的输入层和隐含层之间的映射函数为公式（7) ： z =p{W^x^c+b^) , 为分解子网络的输入层和隐含层之间的权重矩阵，为分解子网络的隐含层和输出层之间的偏置；分解子网络的隐含层和输出层之间的映射函数为公式（8) ：

y_{i =}T(W^ _{Z +}b^) , 其中，为分解子网络的隐含层和输出层之间的偏置， _y! 表示目标事物的第部分的类标图像，表示分解子网络的隐含层和输出层之间的第部分的类标图像的权重矩阵，表示分解子网络的隐含层和输出层之间的第部分的类标图像的偏置， W ^^x)为非线性激活函数， (x) = l/(l + exp(-x)是 S型函数，返回值大于 0小于 1;

处理器 51具体用于控制分解子网络将第三视觉特征向量作为分解子网络的输入层的输入参数，根据公式（7) 和（8) 确定目标事物的各部位的类标图像，将各类标图像组合起来，得带目标事物的解析结果。

本实施例中，处理器 51具体用于控制遮挡估计子网络：对第一视觉特征 X向量降采样，得到第二视觉特征向量，并根据第一视觉特征向量确定目标事物被遮挡部分的遮挡标记向量 ^，第二视觉特征向量的维度小于第一视觉特征 X，遮挡标记向量与述第二视觉特征向量 ^的维度相同；并控制遮挡补全子网络根据第二视觉特征向量 ^与遮挡标记向量确定目标事物的第三视觉特征向量 ^。

本实施例的神经网络***，可以用于执行图 1所示方法实施例的技术方案，其实现原:! S和技术效果类似，此处不再赘述。

图 11为本发明基于神经网络***的图像解析装置还一实施例结构示意图，本实施例的基于神经网络***的图像解析装置 600包括：处理器 61 和存储器 62，处理器 61和存储器 62通过总线连接，存储器 62存储执行指令，当基于神经网络***的图像解析装置 600运行时，处理器 61与存储器 62之间通信，处理器 61执行指令使得基于神经网络***的图像解析装置 600执行本发明提供的基于神经网络***的图像解析方法。处理器 61 具体用于执行以下操作：

获取神经网络***的各子网络对应的训练样本，神经网络***包括遮挡估计子网络、遮挡补全子网络、分解子网络，各子网络对应的训练样本分别包括 I副图像， I取大于 1的正整数；

根据各子网络对应的训练样本分别对遮挡估计子网络、遮挡补全子网络、分解子网络进行预训练，得到各子网络的参数，各子网络的参数包括各子网络中相互连接的两层之间的权重矩阵和偏置。

本实施例中，遮挡估计子网络为三层网络，包括：输入层、隐含层和输出层，输入层、隐含层和输出层依次连接。处理器 61根据各子网络对应的训练样本对遮挡估计子网络进行预训练，具体为：

提取遮挡估计子网络对应的训练样本中各图像的视觉特征向量，得到训练样本中各图像的特征向量集合 Χ = { χ, }，其中，列向量 X,表示第副图像的视觉特征向量， 1≤ ≤/；

分别确定各图像的遮挡部分，获取遮挡估计子网络对应的训练样本中各图像遮挡部分的遮挡标记向量集合 } , 其中，列向量表示第副图像的视觉特征向量 X,对应的遮挡标记向量；

根据各图像遮挡标记向量集合^ = { }和各图像的特征向量集合 Χ = { χ, }确定遮挡估计子网络的输入层和隐含层之间的权重矩阵 W。i和偏置 b- , 以及确定遮挡估计子网络的隐含层与输出层之间的权重矩阵 W 和偏置 O

处理器 61根据各图像遮挡标记向量集 = { }和各图像的特征向量集 Χ = { χ, }确定遮挡估计子网络的输入层与隐含层之间的权重矩阵 W。i和偏置 b。'，以及确定遮挡估计子网络的隐含层与输出层之间的权重矩阵 W 和平偏置 b。具体为：

令 W。' x,. + b⁰' = W°' .，其中，。' = [W°' ,b°' ]， . = [χ_; °' ]'， x,表示第 i副图像的视觉特征向量， [X]'表示转置运算；

令 W。²/i,。' + b°² = W°²h°'，其中， = p{W °^l x_t)， W°² = [W° b°^， h = [ f ； are min_{no n}。. X⁰ - T(W^¾H⁰' ) b' w°²禾 t ，其中， H°' = { ' } 求解 ^S

是遮挡估计子网络的输入层的输出， = {3 ， II是 Frobenius范数。

本实施例中，遮挡补全子网络为五层网络，包括：输入层、 3 个隐含层和输出层， 3 个隐含层分别为第一隐含层、第二隐含层、第三隐含层，输入层、第一隐含层、第二隐含层、第三隐含层和输出层依次连接；处理器 61根据各子网络对应的训练样本对遮挡补全子网络进行预训练，具体为：

根据遮挡补全子网络对应的训练样本中各图像有遮挡时的视觉特征向量集合^和无遮挡时的视觉特征向量集合确定遮挡补全子网络的输入层与第一隐含层之间的权重矩阵和偏置 ^，确定遮挡补全子网络的第一隐含层与第二隐含层之间的权重矩阵和偏置，确定遮挡补全子网络的第二隐含层与第三隐含层之间的权重矩阵和偏置^，确定遮挡补全子网络的第三隐含层与输出层之间的权重矩阵 w 和偏置 _M ，其中， w 是的转置矩阵，是的转置矩阵。

处理器 61 根据遮挡补全子网络对应的训练样本中各图像有遮挡时的视觉特征向量集合^和无遮挡的情况下视觉特征向量集合确定遮挡补全子网络的输入层与第一隐含层之间的权重矩阵和偏置 V，确定遮挡补全子网络的第一隐含层与第二隐含层之间的权重矩阵^和偏置 ^，确定遮挡补全子网络的第二隐含层与第三隐含层之间的权重矩阵和偏置^，确定遮挡补全子网络的第三隐含层与输出层之间的权重矩阵和偏置，具体为：

令/^ = W^+b 为遮挡补全子网络的输入层的输出， ^是特征向量集合 ^中的一个向量，最小化以下第一受限玻尔兹曼机 RBM能量： Ε(Ψ， h^c' ) = 、 ^m ₂ ^m/ "- h^c - 2^ ，

2(T_m m,n _m

其中， σ_Μ是将遮挡补全子网络对应的训练样本中各图像的遮挡部分作为噪声时的标准差向量 σ的第 m个分量， Ϋ;是特征向量 Ϋ^Ε的第 m个分量， h:'为的第 n个分量， _:„表示连接 Ϋ; 和 h:'的权重，为的第 n个分量，表示的第 m个分量；

采用对比度扩散法对第一 RBM能量最小化，得到权重矩阵偏置和 u^c'；

其中， _;;是 = 7(^^ + 1 ')的第 ρ个分量， '为/ ^的第 ρ个分量，为 h 的第 q个分量，表示连接 h;和的权重，为 b 的第 q个分量， _u ^c表示^ 的第 p个分量；

采用对比度扩散法对第二 RBM能量最小化，得到权重矩阵 W 、偏置 ^和 " ；

最后，求权重矩阵 ^ 和^^'的转置矩阵，得到 '和 '。

处理器 61 在确定权重矩阵 W W 偏置、 " 、 b ^之后，还用于：根据以下公式重新构建训练样本中各图像无遮挡的情况下视觉特征向量集合

V^c ^p(W^c'p(W^C2'p(W^C2p(W^c'V^c+b^c') + b^C2) + u^C2)u^c') ;

采用梯度下降法最小化 ^和之间的误差，得到调整后的 w 、 w b

U^Cl、禾口 M 。

本实施例中，分解子网络为三层网络，包括：输入层、隐含层和输出层，输入层、隐含层和输出层依此连接；

处理器 61根据各子网络对应的训练样本对分解子网络进行预训练，具体为：

提取分解子网络对应的训练样本中各图像的视觉特征向量集合 ^^}, 其中，分解子网络对应的的训练样本是无遮挡时的目标事物；

提取分解子网络对应的训练样本中各图像的各部位类标图像集合 Y^c ={y^c _t}

令为特征向量集合^中的一个视觉特征向量在分解子网络的输入层的输出 =p{W'^ ₊ b^) , 表示类标图像的个数，的取值为 I≤''≤M的正整数，，将按照以下映射函数映射为不同的类标图像：

其中，表示目标事物的第个部位的类标图像，表示第部分的类标图像对应的分解子网络的隐含层和输出层之间的偏置，表示第 ,·部分的类标图像对应的分解子网络的隐含层和输出层之间的权重矩阵；

令 r为中^有视觉特征向量在分解子网络上映射成的类标图像的集合，最小化；和 F之间的误差，得到 w'i、 H 、。

本实施例中，处理器 61根据训练样本分别对遮挡估计子网络、遮挡补全子网络、分解子网络进行预训练，得到各子网络的参数之后，还用于：

构建损失函数 E, 最小化损失函数 E:

E{X;W,b) = f-Y\l,其中， Χ ={χ,}是遮挡估计子网络训练样本中各图像的视觉特征向量集， X,表示第副图像的视觉特征向量， F = }是人工确定的训练样本中各图像的类标图像集合，是人工确定的第幅图像的类标图像， r={y,}是神经网络***的输出训练样本中各图像的类标图像集，是神经网络 ***输出的第幅图像的类标图像， W和 b是神经网络***的权重矩阵和偏置的集合；

其中，处理器 61采用随机梯度下降法求解损失函数 E的最优解，确定神经网络***的调整后的权重矩阵，具体为：将预训练得到各子网络的权重矩阵，按照以下公式进行迭代： Δ,₊₁ =0.9.Δ,-0.001^/- ^，

^{J 1 1} dw

W_j'_+l ^W_j ^l ₊A_j+l , 其中， Z表示神经网络***的层 /_e {l,...L}，表示迭代次数， Δ表示梯度下降时的变化率， £是学习率，是

第 /层的后向投影误差 ^与上一层是输出/ -¹之间的乘积。

本实施例中神经网络***的后向投影误差有三种形式，神经网络*** 的最后一层的后向投影误差 e^L = diag(y - y)diag(l - y)，其中表示取对角矩阵运算， _y表示一幅图像的实际的类标图像， _y表示神经网络***输出的图像的类标图像。如果第层有 S型函数运算，则第 z层的后向投影误差 e^l ^ diag {W^l+ve^l+l )diag {h^l ){\ - h^l ) , 其中， agO表示取对角矩阵运算，是上 —层的权重矩阵，是上一层的后向投影误差。如果第 /层有 / x) = m_ax(0, x) 运算，则第层的后向投影误差 ,

[-],表示一个向量的第个分量。

本实施例的装置，可以用于执行图 5所示方法实施例的技术方案，其实现原理和技术效果类似，此处不再赘述。

本领域普通技术人员可以理解：实现上述各方法实施例的全部或部分歩骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时，执行包括上述各方法实施例的歩骤；而前述的存储介质包括： R0M、 RAM, 磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

权利要求书

1、一种基于神经网络***的图像解析方法，其特征在于，包括：所述神经网络***获取目标事物的第一视觉特征向量 X，所述神经网络***包括遮挡估计子网络、遮挡补全子网络、分解子网络；

所述遮挡估计子网络根据目标事物的第一视觉特征 X向量确定所述目标事物被遮挡部分的遮挡标记向量 ^，所述遮挡标记向量 ^的各分量的取值为大于 0小于 1;

所述遮挡补全子网络根据所述第一视觉特征向量 X与所述遮挡标记向量确定所述目标事物的第三视觉特征向量 ^，所述第三视觉特征向量 ^ 为补全所述遮挡部分后所述目标事物的视觉特征向量；

2、根据权利要求 1所述的方法，其特征在于，所述遮挡估计子网络为三层网络，包括：输入层、隐含层和输出层，所述输入层、隐含层和输出层依次连接；

所述遮挡估计子网络将所述第一视觉特征向量 X作为所述遮挡估计子网络的输入层的输入参数，根据以下公式（1) 和（2) 计算所述遮挡标记向量 ^

h°' - p(W^0lx + b⁰¹) ( 1)

x。 =r(W。 +&。²) (2)

其中，公式（1) 为所述遮挡估计子网络的输入层与隐含层之间的映射函数，公式（2) 为所述遮挡估计子网络的的隐含层与输出层之间的映射函数， W '为所述遮挡估计子网络的输入层与隐含层之间的权重矩阵，。为所述遮挡估计子网络的输入层与隐含层之间的偏置， W ^^^ )为非线性激活函数， W 是所述遮挡估计子网络的隐含层与输出层之间的权重矩阵，是所述遮挡估计子网络的隐含层与输出层之间的偏置，

(x) = l/(l + exp(-x)是 S型函数，返回值大于 0小于 1。 3、根据权利要求 2所述的方法，其特征在于，所述遮挡补全子网络为五层网络，包括：输入层、 3个隐含层和输出层，所述 3个隐含层分别为第一隐含层、第二隐含层、第三隐含层，所述输入层、第一隐含层、第二隐含层、第三隐含层和输出层依次连接；

Ζ, = 7(W^C'( * 。） + V)

z₂ = p(W^C2 _Zl + b^C2)

Z₃ = 7(W^C2 Z₂ +_M ^¾)

其中，公式（3) 为所述遮挡补全子网络的输入层与第一隐含层之间映射函数，公式（4) 为所述遮挡补全子网络的第一隐含层与第二隐含层之间的映射函数，公式（5) 为所述遮挡补全子网络的第二隐含层与第三隐含层之间的映射函数，公式（6) 为所述遮挡补全子网络的第三隐含层与输出层之间的映射函数，为所述遮挡补全子网络的输入层与第一隐含层之间的权重矩阵，为所述遮挡补全子网络的输入层与第一隐含层之间的偏置，为所述遮挡补全子网络的第一隐含层与第二隐含层之间的权重矩阵，为所述遮挡补全子网络的第一隐含层与第二隐含层之间的偏置，为所述遮挡补全子网络的第二隐含层与第三隐含层之间的权重矩阵，

^为所述遮挡补全子网络的第二隐含层与第三隐含层之间的偏置， w 为所述遮挡补全子网络的第三隐含层与输出层之间的权重矩阵，为所述遮挡补全子网络的第三隐含层与输出层之间的偏置， W 是的转置矩阵，是的转置矩阵， /Hx) = max(0, x)为非线性激活函数。

4、根据权利要求 3所述的方法，其特征在于，所述分解子网络为三层网络，包括：输入层、隐含层和输出层，所述输入层、隐含层和输出层依次连接；

所述分解子网络将所述第三视觉特征向量 ^作为所述分解子网络的输入层的输入参数，根据以下公式（7 ) 和（8 ) 确定所述目标事物的各部位的类标图像：

z ^ p{W x^c + b ) ( 7 )

其中，公式（7 ) 为所述分解子网络的输入层和隐含层之间的映射函数，公式（8 )为所述分解子网络的隐含层和输出层之间的映射函数，为所述分解子网络的输入层和隐含层之间的权重矩阵，为所述分解子网络的输入层和隐含层之间的偏置，表示所述目标事物的第部分的类标图像，表示所述第 ,·部分的类标图像对应的所述分解子网络的隐含层和输出层之间的权重矩阵，表示所述第 ,·部分的类标图像对应的所述分解子网络的隐含层和输出层之间的偏置， x) = _m«x(0, x)为非线性激活函数， (x) = l/(l + exp(-x)是 S型函数，返回值大于 0小于 1；

5、根据权利要求 1所述的方法，其特征在于，所述遮挡估计子网络根据目标事物的第一视觉特征 X向量确定所述目标事物被遮挡部分的遮挡标记向量 · 包括：

所述遮挡估计子网络对所述第一视觉特征 X向量降采样，得到第二视觉特征向量 x^d，并根据所述第一视觉特征向量确定所述所述目标事物被遮挡部分的遮挡标记向量，其中，所述第二视觉特征向量的维度小于所述第一视觉特征 X，所述遮挡标记向量与述第二视觉特征向量 x^d的维度相同 ·，

所述遮挡补全子网络根据所述第二视觉特征向量 x^d与所述遮挡标记向量 ^确定所述目标事物的第三视觉特征向量。 6、一种基于神经网络***的图像解析方法，其特征在于，包括：获取所述神经网络***的各子网络对应的训练样本，所述神经网络系统包括遮挡估计子网络、遮挡补全子网络、分解子网络，所述各子网络对应的训练样本分别包括 I副图像， I取大于 1的正整数；

7、根据权利要求 6所述的方法，其特征在于，所述遮挡估计子网络为三层网络，包括：输入层、隐含层和输出层，所述输入层、隐含层和输出层依次连接；

提取所述遮挡估计子网络对应的训练样本中各图像的视觉特征向量，得到所述训练样本中各图像的特征向量集合 Χ ={χ,}，其中，列向量 X,表示第副图像的视觉特征向量， l≤i≤I ;

分别确定所述各图像的遮挡部分，获取所述遮挡估计子网络对应的训练样本中各图像遮挡部分的遮挡标记向量集合^ ^ },其中，列向量表示第副图像的视觉特征向量 X,对应的遮挡标记向量；

根据所述各图像遮挡标记向量集合 ^^ί ΐ和各图像的特征向量集合

Χ ={χ,}确定所述遮挡估计子网络的输入层和隐含层之间的权重矩阵 W。i和偏置 ^，以及确定所述遮挡估计子网络的隐含层与输出层之间的权重矩阵 W 禾口偏置 b°

8、根据权利要求 7所述的方法，其特征在于，所述根据所述各图像遮挡标记向量集 }和各图像的特征向量集 Χ ={χ,}确定所述遮挡估计子网络的输入层与隐含层之间的权重矩阵 W。《和偏置 ^，以及确定所述遮挡估计子网络的隐含层与输出层之间的权重矩阵 W 和平偏置 ^，包括：令 W。'x_; + b⁰' = W⁰'^，其中，。' = [W^0> ,b。' ]， x_t = [_X:,b⁰' ]， x,表示第 i畐 lj图像的视觉特征向量， [X]'表示转置运算；

令 W。²/i,。' +b°² ^W°²h ，其中， h = 7(W°' .)， W°² ^[W° b°²]， hp =[ Ϊ'',1]'； X⁰ )| ，得到所述 W。'、 b。、、 W°²禾口，其中， H°' = } 求解 ^S

9、根据权利要求 6所述的方法，其特征在于，所述遮挡补全子网络为五层网络，包括：输入层、 3个隐含层和输出层，所述 3个隐含层分别为第一隐含层、第二隐含层、第三隐含层，所述输入层、第一隐含层、第二隐含层、第三隐含层和输出层依次连接；

提取所述遮挡补全子网络对应的训练样本中各图像无遮挡时的视觉特征向量集合其中，所述遮挡补全子网络对应的训练样本中各图像是无遮挡的目标事物；

提取所述遮挡补全子网络对应的训练样本中各图像设置有遮挡时的视觉特征向量集合 ;

根据所述遮挡补全子网络对应的训练样本中各图像有遮挡时的视觉特征向量集合和无遮挡时的视觉特征向量集合确定所述遮挡补全子网络的输入层与第一隐含层之间的权重矩阵和偏置，确定所述遮挡补全子网络的第一隐含层与第二隐含层之间的权重矩阵和偏置，确定所述遮挡补全子网络的第二隐含层与第三隐含层之间的权重矩阵和偏置^，确定所述遮挡补全子网络的第三隐含层与输出层之间的权重矩阵 '和偏置，其中，是的转置矩阵，是 ^的转置矩阵。

10、根据权利要求 9所述的方法，其特征在于，所述根据所述遮挡补全子网络对应的训练样本中各图像有遮挡时的视觉特征向量集合和无遮挡的情况下视觉特征向量集合确定所述遮挡补全子网络的输入层与第一隐含层之间的权重矩阵和偏置 V，确定所述遮挡补全子网络的第一隐含层与第二隐含层之间的权重矩阵^ 和偏置 ^，确定所述遮挡补全子网络的第二隐含层与第三隐含层之间的权重矩阵和偏置^，确定所述遮挡补全子网络的第三隐含层与输出层之间的权重矩阵 w 和偏置，包括：

令/^ = W + )为所述遮挡补全子网络的输入层的输出，是特征向量集合^中的一个向量，最小化以下第一受限玻尔兹曼机 RBM能量：

£(V^C， h^C' ) = - ) _ _ ，

2(T_m 其中， T_m是将所述遮挡补全子网络对应的训练样本中各图像的遮挡部分作为噪声时的标准差向量 σ的第 m个分量，是特征向量 Ϋ^Ε的第 m个分量，为的第 n个分量， ¾„表示连接 ~ 和 1^的权重， b:'为的第 n个分量，表示^的第 m个分量；

采用对比度扩散法对所述第一 RBM能量最小化，得到所述权重矩阵 W 偏置禾口 M^C' ；

将所述遮挡补全子网络的输入层的输出作为所述第一隐含层的输入，令所述第一隐含层的输出为 =p(W^h-+b ，最小化以下第二受限波尔兹曼机 RBM能量：， q q q

p 2o_p q VA p

其中， _;;是 = 7(^^ + 1 ')的第 p个分量， '为/ ^的第 p个分量，为 h 的第 q个分量，表示连接 h;和的权重，为的第 q个分量， u^c表示^ 的第 p个分量；

求所述权重矩阵 nwf的转置矩阵，得到和 _W 。

11、根据权利要求 10所述的方法，其特征在于，所述根据所述有遮挡的情况下视觉特征向量集合和无遮挡的情况下视觉特征向量集合确定所述遮挡补全子网络的输入层与第一隐含层之间的权重矩阵和偏置 '，确定所述遮挡补全子网络的第一隐含层与第二隐含层之间的权重矩阵 W 和偏置 ^，确定所述遮挡补全子网络的第二隐含层与第三隐含层之间的权重矩阵和偏置^，确定所述遮挡补全子网络的第三隐含层与输出层之间的权重矩阵 W 和偏置之后，包括：

V^c ^ p(W^c,'p(W^C2'p(W^C2p(W^c'V^c +b^c') + b^C2) + u ²)u^c')；

采用梯度下降法最小化所述 ^和之间的误差，得到调整后的 w 、 w b 、 u^C2、 V禾口 M^C' ₀

12、根据权利要求 6所述的方法，其特征在于，所述分解子网络为三层网络，包括：输入层、隐含层和输出层，所述输入层、隐含层和输出层依此连接；

提取所述分解子网络对应的训练样本中各图像的视觉特征向量集合 ^ = {^} , 其中，所述分解子网络对应的的训练样本是无遮挡时的目标事物；提取所述分解子网络对应的训练样本中各图像的各部位类标图像集合 = {^}

令为特征向量集合中的一个视觉特征向量在所述分解子网络的输入层的输出 = (W' +W)，，·表示类标图像的个数，，·的取值为 i≤ M的正整数，，将按照以下映射函数映射为不同的类标图像：

令 r为中所有视^特征向量在所述分解子网络上映射成的类标图像的集合，最小化所述 r和之间的误差，得到 w'i、 w; 。

13、根据权利要求 6-12任一项所述的方法，其特征在于，所述根据所述训练样本分别对所述遮挡估计子网络、遮挡补全子网络、分解子网络进行预训练，得到所述各子网络的参数之后，还包括：

构建损失函数 E, 最小化所述损失函数 E:

E(X ;W, b) = {χ, }

14、根据权利要求 13所述的方法，其特征在于，所述采用随机梯度下降法求解所述损失函数 E的最优解，确定所述神经网络***的调整后的权重矩阵，包括：

将预训练得到所述各子网络的权重矩阵，按照以下公式进行迭代：

Δ.₊₁ =0.9-Δ, - . Ι ε-W' -ε ^- , W' ^W'+A_i+1 , 其中， /表示所述神经网络系统的层数， /_e{l,...L}，表示迭代次数， Δ表示梯度下降时的变化率， £是学习率， ^是导数， ^ = /^( '是第层的后向投影误差^与上一层是输出/ -¹之间的乘积。

15、根据权利要求 14所述的方法，其特征在于，所述神经网络*** 的最后一层的后向投影误差 e^L = diag(y - y)diag(l- y)，其中表示取对角矩阵运算， y表示一幅图像的实际的类标图像， _y表示所述神经网络*** 输出的所述图像的类标图像。

16、根据权利要求 14所述的方法，其特征在于，如果第 Z层有 S型函数运算，则第 /层的后向投影误差

其中， diag(. 表示取对角矩阵运算，是上一层的权重矩阵，是上一层的后向投影误差。

17、根据权利要求 14所述的方法，其特征在于，如果第层有 /^x max^x)运算，则第 Z层的后向投影误差 _e' =f 〉^Q，其中， =[wV-¹+b']_i , [.],表示一个向量的第 !·个分量。

18、一种神经网络***，其特征在于，包括：

遮挡估计子网络，用于根据获取到的目标事物的第一视觉特征"^向量确定所述目标事物被遮挡部分的遮挡标记向量，所述遮挡标记向量的各分量的取值为大于 0小于 1，所述第一视觉特征向量为有遮挡时所述目标事物的视觉特征向量；遮挡补全子网络，用于根据所述第一视觉特征向量 X与所述遮挡标记向量确定所述目标事物的第三视觉特征向量，所述第三视觉特征向量为无遮挡时所述目标事物的视觉特征向量；

分解子网络，用于根据所述第三视觉特征向量 ^确定所述目标事物的各部位的类标图像，组合所述各部位的类标图像得到所述目标事物的解析结果。

19、根据权利要求 18所述的神经网络***，其特征在于，所述遮挡估计子网络为三层网络，包括：输入层、隐含层和输出层，所述输入层、隐含层和输出层依次连接；

所述遮挡估计子网络的输入层和隐含层之间的映射函数为公式（1) ： h⁰' =p(w- x ₊ b⁰') , 其中 W为所述遮挡估计子网络的输入层和隐含层之间的权重矩阵， ^为所述遮挡估计子网络的输入层与隐含层之间的偏置， p(x) = max(0, x)为非线性激活函数；

所述遮挡估计子网络的隐含层和输出层之间的映射函数为公式（2) ： x^a =T{W^h^ +b^) , W。是所述遮挡估计子网络的隐含层与输出层之间的权重矩阵，是所述遮挡估计子网络的隐含层与输出层之间的偏置，

(x) = l/(l + exp(-x)是 S型函数，返回值大于 0小于 1；

所述遮挡估计子网络具体用于：

将所述第一视觉特征向量 X作为所述遮挡估计子网络的输入层的输入参数，根据公式（1) 和（2) 计算所述遮挡标记向量 ^。

20、根据权利要求 18所述的神经网络***，其特征在于，所述遮挡补全子网络为五层网络，包括：输入层、 3个隐含层和输出层，所述 3个隐含层分别为第一隐含层、第二隐含层、第三隐含层，所述输入层、第一隐含层、第二隐含层、第三隐含层和输出层依次连接；

(3) ： _Ζι

, 其中，为所述遮挡补全子网络的输入层与第一隐含层之间的权重矩阵，为所述遮挡补全子网络的输入层与第一隐含层之间的偏置；

所述遮挡补全子网络的第一隐含层与第二隐含层之间的映射函数为公式（4) ： z^piW^z^b^) , 其中， W 为所述遮挡补全子网络的第一隐含层与第二隐含层之间的权重矩阵，为所述遮挡补全子网络的第一隐含层与第二隐含层之间的偏置；

所述遮挡补全子网络的第二隐含层与第三隐含层之间的映射函数为公式（5) ： _Zi =p^z_{2 +}u^) , 为所述遮挡补全子网络的第二隐含层与第三隐含层之间的权重矩阵， ^为所述遮挡补全子网络的第二隐含层与第三隐含层之间的偏置；

所述遮挡补全子网络的第三隐含层与输出层之间的映射函数为公式 (6) ： _x^ =p(W^ _{Z3 +} u^ , W 为所述遮挡补全子网络的第三隐含层与输出层之间的权重矩阵，为所述遮挡补全子网络的第三隐含层与输出层之间的偏置， W 是的转置矩阵， f是的转置矩阵， /^)= X(0,X)为非线性激活函数；

所述遮挡估计子网络具体用于：

将所述相乘结果为 χ*χ。作为所述遮挡补全子网络的输入层的参数，根据公式（3) 、（4) 、 (5) 、 (6) 计算所述第三视觉特征向量 ^。

21、根据权利要求 18所述的神经网络***，其特征在于，所述分解子网络为三层网络，包括：输入层、隐含层和输出层，所述输入层、隐含层和输出层以此连接；

所述分解子网络的输入层和所述隐含层之间的映射函数为公式（7) ： z =p(W'^^c+b^ , 为所述分解子网络的输入层和隐含层之间的权重矩阵，为所述分解子网络的隐含层和输出层之间的偏置；

所述分解子网络的隐含层和输出层之间的映射函数为公式（8) ： y_{i =}T(W^ _{Z +}b^) , 其中，为所述分解子网络的隐含层和输出层之间的偏置，表示所述目标事物的第部分的类标图像，表示所述分解子网络的隐含层和输出层之间的第部分的类标图像的权重矩阵， b 表示所述分解子网络的隐含层和输出层之间的第 ,·部分的类标图像的偏置，

p(x) = max(0, x)为非线性激活函数， (x) = l/(l + exp(-x)是 S型函数，返回值大于 0小于 1;

所述分解子网络具体用于：将所述第三视觉特征向量 ^作为所述分解子网络的输入层的输入参数，根据公式（7) 和（8) 确定所述目标事物的各部位的类标图像，将所述各类标图像组合起来，得带所述目标事物的解 ^: 估据

向

遮挡标记向量与述第二视觉特征向量 x^d的维度相同 ·，

所述遮挡补全子网络具体用于：

根据所述第二视觉特征向量 x^d与所述遮挡标记向量 ^确定所述目标事物的第三视觉特征向量 ^。

23、一种基于神经网络***的图像解析装置，其特征在于，包括：获取模块，用于获取所述神经网络***的各子网络对应的训练样本，所述神经网络***包括遮挡估计子网络、遮挡补全子网络、分解子网络，所述各子网络对应的训练样本分别包括 I副图像， I取大于 1的正整数；训练模块，用于根据所述各子网络对应的训练样本分别对所述遮挡估计子网络、遮挡补全子网络、分解子网络进行预训练，得到所述各子网络的参数，所述各子网络的参数包括所述各子网络中相互连接的两层之间的权重矩阵和偏置。

24、根据权利要求 23所述的装置，其特征在于，所述遮挡估计子网络为三层网络，包括：输入层、隐含层和输出层，所述输入层、隐含层和输出层依次连接；

所述训练模块具体用于：提取所述遮挡估计子网络对应的训练样本中各图像的视觉特征向量，得到所述训练样本中各图像的特征向量集合 Χ = {_Χ, }，其中，列向量 X,表示第 ,·副图像的视觉特征向量， l≤i≤I ;

分别确定所述各图像的遮挡部分，获取所述遮挡估计子网络对应的训练样本中各图像遮挡部分的遮挡标记向量集合 ^^ { } ,其中，列向量表示第副图像的视觉特征向量 X,对应的遮挡标记向量；

根据所述各图像遮挡标记向量集合 ^^ ί ΐ和各图像的特征向量集合 Χ = {χ, }确定所述遮挡估计子网络的输入层和隐含层之间的权重矩阵 W。《和偏置 ^，以及确定所述遮挡估计子网络的隐含层与输出层之间的权重矩阵 W 禾口偏置 b°

25、根据权利要求 24所述的装置，其特征在于，所述训练模块具体用于：

令 W。'x_; + = °ⁱx_i , 其中，。' = [W° b°' ]， x ~_t = [χ_; °' ]'， X,表示第 i副图像的视觉特征向量， [X]'表示转置运算；

^W°²h +b°² ^W°²h , 其中， Α_;。' ΐ,.)， W°² ^[W° b°²] , hp ^[h 'l]； x。— T( 。'）||_p ²，得到所述 b。、 w 禾 t ，其中，求解 ^S

= { }是遮挡估计子网络的输入层的输出，是 Frobenius范

26、根据权利要求 23所述的装置，其特征在于，所述遮挡补全子网络为五层网络，包括：输入层、 3个隐含层和输出层，所述 3个隐含层分别为第一隐含层、第二隐含层、第三隐含层，所述输入层、第一隐含层、第二隐含层、第三隐含层和输出层依次连接；

提取所述遮挡补全子网络对应的训练样本中各图像设置有遮挡时的视觉特征向量集合^; 根据所述遮挡补全子网络对应的训练样本中各图像有遮挡时的视觉特征向量集合和无遮挡时的视觉特征向量集合确定所述遮挡补全子网络的输入层与第一隐含层之间的权重矩阵和偏置 W，确定所述遮挡补全子网络的第一隐含层与第二隐含层之间的权重矩阵和偏置 ^，确定所述遮挡补全子网络的第二隐含层与第三隐含层之间的权重矩阵和偏置^，确定所述遮挡补全子网络的第三隐含层与输出层之间的权重矩阵 W 和偏置 ^，其中， W 是的转置矩阵，是 W 的转置矩阵。

27、根据权利要求 26所述的装置，其特征在于，所述训练模块具体用于：

令/^ = W +b 为所述遮挡补全子网络的输入层的输出， Ϋ^ε是特征向量集合中的一个向量，最小化以下第一受限玻尔兹曼机 RBM能量： Ε(Ψ， h^c' ) = 、 ^m ₂ ^m/ "- h 2^—K^wln，

m 2(T_m n m,n _m

其中， T_m是将所述遮挡补全子网络对应的训练样本中各图像的遮挡部分为噪声时的标准差向量的第 m个分量， Ϋ 是特征向量的第 m个分量， h:' 为 W、的第 n个分量， _:„表示连接和的权重，为的第 n个分量 u!!表示的第 m个分量；

采用对比度扩散法对所述第一 RBM能量最小化，得到所述权重矩阵、偏置禾口 M^C'；

将所述遮挡补全子网络的输入层的输出作为所述第一隐含层的输入，令所述第一隐含层的输出为 =p(W^h-+b ，最小化以下第二受限波尔兹曼机 RBM能量：

E(h^Cl， h^¾) '-Y Δ ,

其中， _;;是 = 7(¹^^ + 1^)的第 p个分量，为/^的第 p个分量，为/^ 的第 q个分量，表示连接 h;和的权重，为 b 的第 q个分量， _u ^c表示^ 的第 p个分量；

采用对比度扩散法对所述第二 RBM能量最小化，得到所述权重矩阵 W 、偏置 ^和" ；求所述权重矩阵 W 和 ^的转置矩阵，得到和 _W 。

28、根据权利要求 27所述的装置，其特征在于，所述训练模块还用于：根据以下公式重新构建所述训练样本中各图像无遮挡的情况下视觉特征向量集合

V^c ^ p(W^Cl'p(W^C2'p(W^C2p(W^ClV^c +b^c') + b^C2) + u ²)u^Cl)；采用梯度下降法最小化所述 ^和之间的误差，得到调整后的 w 、

W^C'、 b 、 U^C2、 V禾口 M^q。

29、根据权利要求 23所述的装置，其特征在于，所述分解子网络为三层网络，包括：输入层、隐含层和输出层，所述输入层、隐含层和输出层依此连接；

提取所述分解子网络对应的训练样本中各图像的各部位类标图像集合令为特征向量集合^中的一个视觉特征向量在所述分解子网络的输入层的输出 = (W'i +W)，，·表示类标图像的个数，，·的取值为 l≤ M的正整数，，将 V按照以下映射函数映射为不同的类标图像：

其中，表示所述目标事物的第个部位的类标图像，表示所述第部分的类标图像对应的所述分解子网络的隐含层和输出层之间的偏置，表示所述第 ,·部分的类标图像对应的所述分解子网络的隐含层和输出层之间的权重矩阵；

令 r为中所有视觉特征向量在所述分解子网络上映射成的类标图像的集合，最小化所述 r和 F之间的误差，得到 w w; _b。

30、根据权利要求 23-29任一项所述的装置，其特征在于，还包括：参数调整模块，用于构建损失函数 E, 最小化所述损失函数 E:

E(X;W,b) =

, 其中， X ={x,}是遮挡估计子网络训练样本中各图像的视觉特征向量集， X,表示第副图像的视觉特征向量， F = { 是人工确定的所述训练样本中各图像的类标图像集合，是人工确定的第幅图像的类标图像， r = {y,}是所述神经网络***的输出所述训练样本中各图像的类标图像集，是所述神经网络***输出的第幅 ,·图像的类标图像， W和 b是所述神经网络 ***的权重矩阵和偏置的集合；

31、根据权利要求 30所述的装置，其特征在于，所述参数调整模块具体用于：

将预训练得到所述各子网络的权重矩阵，按照以下公式进行迭代： Δ.₊₁ =0.9-A_j - . Ι ε-Wl -ε ^γ ^ W^ ^Wj +A_j+l , 其中， Ζ表示所述神经网络系统的层数， /_e {l, ... L}，表示迭代次数， Δ表示梯度下降时的变化率， £是学习率， ^是导数， ^ = /^( '是第层的后向投影误差^与上一层是输出/ -¹之间的乘积。

32、根据权利要求 31所述的装置，其特征在于，所述神经网络*** 的最后一层的后向投影误差 e^L = diag(y - y)diag(l - y)，其中表示取对角矩阵运算， y表示一幅图像的实际的类标图像， _y表示所述神经网络*** 输出的所述图像的类标图像。

33、根据权利要求 31所述的装置，其特征在于，如果第 z层有 S型函数运算，则第/层的后向投影误差

其中， diag (. 表示取对角矩阵运算，是上一层的权重矩阵，是上一层的后向投影误差。

34、根据权利要求 31所述的装置，其特征在于，如果第层有

/^x max^ x)运算，则第 Z层的后向投影误差〉^Q，其中，

， < 0

δ[ = [Wh'-^ b'],.， [.],表示一个向量的第个分量。