WO2019128660A1

WO2019128660A1 - 训练神经网络的方法和设备、图像处理方法和设备以及存储介质

Info

Publication number: WO2019128660A1
Application number: PCT/CN2018/119372
Authority: WO
Inventors: 邢宇翔; 梁凯超; 沈乐; 张丽; 杨洪恺; 康克军; 陈志强; 李荐民; 刘以农
Original assignee: 清华大学; 同方威视技术股份有限公司
Priority date: 2017-12-29
Filing date: 2018-12-05
Publication date: 2019-07-04
Also published as: RU2709437C1; EP3506209B1; US10984565B2; CN110047113A; EP3506209A1; CN110047113B; US20190206095A1

Abstract

公开了一种训练神经网络的方法和设备、图像处理方法和设备以及存储介质。神经网络包括：投影域网络，处理输入的投影数据，得到估计投影数据；解析重建网络层，由估计投影数据得到重建图像；图像域网络，处理重建图像，得到估计图像；投影层，得到估计图像的投影结果；和统计模型层，确定输入的投影数据、估计投影数据和估计图像的投影结果基于统计模型的一致性。神经网络还可包括先验模型层。所述方法包括：利用基于输入的投影数据、估计投影数据、以及估计图像的投影结果的数据模型的一致性代价函数调整图像域网络和投影域网络的卷积核参数。利用上述方案，训练得到的神经网络能够在投影数据存在缺陷时重建质量更高的图像。

Description

训练神经网络的方法和设备、图像处理方法和设备以及存储介质

本申请要求于2017年12月29日提交的、申请号为201711498783.0的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本公开的实施例涉及辐射成像，具体涉及一种训练神经网络的方法和设备、图像处理方法、图像处理设备以及存储介质。

背景技术

X射线CT(Computerized-Tomography)成像***在医疗、安检、工业无损检测等领域中都有着广泛的应用。射线源和探测器按照一定的轨道采集一系列的衰减信号数据，经过预处理、图像重建算法的复原可以得到被检查对象的线性衰减系数的三维空间分布。CT图像重建过程在于从探测器采集到的数据中恢复线性衰减系数分布。目前，在实际应用中主要使用滤波反投影(Filtered Back-Projection)、FDK(Feldkmap-Davis-Kress)类的解析重建算法和ART(Algebra Reconstruction Technique)、MAP(Maximum A Posterior)等迭代重建方法。

随着X光CT成像的需求越来越多样化，对降低辐射剂量的要求也越来越高。已经提出了利用卷积神经网络来重建CT图像的技术。但是在利用卷积神经网络来重建方法中，在训练神经网络的过程中需要进行有监督的训练。这样的方法需要获取大量真实图像作为标签，即卷积神经网络既需要稀疏采样的投影数据，又需要完备采样的投影数据(真值)。

发明内容

根据本公开实施例，提出了一种训练神经网络的方法和设备、图像处理方法、图像处理设备以及存储介质，通过训练得到的神经网络能够提高重建图像的质量。

在本公开的一个方面，提出了一种用于训练神经网络的方法，所述神经网络包括：投影域网络，用于处理输入的投影数据，得到估计投影数据；解析重建网络层，用于对估计投影数据进行解析重建，得到重建图像；图像域网络，用于对重建图像进行处理，得到估计图像；投影层，用于利用CT扫描***的***投影矩阵对估计图像进行投影运算，得到估计图像的投影结果；和统计模型层，用于确定输入的投影数据、估计投影数据和估计图像的投影结果这三者基于统计模型的一致性；

其中，所述方法包括：利用基于输入的投影数据、估计投影数据、以及估计图像的投影结果这三者的数据模型的一致性代价函数来调整图像域网络和投影域网络的卷积核参数。

根据本公开实施例，所述方法还包括：利用投影层构建与投影一致的代价函数，利用统计模型层构建似然关系代价函数，以及与投影一致的代价函数和似然关系代价函数中的至少一个形成所述数据模型的一致性代价函数。

根据本公开实施例，所述卷积神经网络还包括至少一个先验模型层，所述先验模型层利用基于估计图像的先验模型代价函数调整图像域网络，并经过解析重建网络层对梯度进行反向传递，以调整投影域网络的卷积核参数。

根据本公开实施例，投影域网络、解析重建网络层和图像域网络的正向传递过程包括：

投影域网络的输入投影数据表示为g＝{g ₁，g ₂，...，g _M}，投影域网络输出的估计投影数据表示为

M′≥M，经过加权后得到

经过斜坡滤波层后得到

经过反投影得到解析重建网络层的输出

令

表示图像域网络的作用函数，则图像域网络输出的估计图像

其中，上标T表示矩阵的转置，h为离散化的斜坡滤波算子，H _R是M′×N维重建用***矩阵，N是重建图像的像素总数，W ₁，W ₂，……，W _M′表示加权系数。

根据本公开实施例，将所述数据模型的一致性代价函数表示为

来自数据模型一致性的误差传递关系为：

其中，

为似然关系代价函数，

越小，则投影数据g与估计投影数据

越吻合，

为与投影一致的代价函数，β为拉格朗日乘子参数，H为***投影矩阵。

根据本公开实施例，所述先验模型代价函数

包括局部条件的全变分、马尔科夫场先验、纹理先验、特征空间稀疏度之一或其组合，其中

为所述估计图像。

根据本公开实施例，所述方法还包括利用先验误差ε ^Pr定义先验模型代价函数

根据本公开实施例，根据各个先验模型的代价函数

在误差反馈过程中的重要性λ来调整图像域网络。

根据本公开实施例，在解析重建网络层，按照如下的传递关系实现解析重建网络层的先验误差反向传递：

其中，投影域网络的输入投影数据表示为g＝{g ₁，g ₂，...，g _M}，投影域网络输出的估计投影数据表示为

M′≥M，经过加权后得到

经过斜坡滤波层后得到

经过反投影得到解析重建网络层的输出

其中上标T表示矩阵的转置，h为离散化的斜坡滤波算子，H _R是M′×N维重建用***矩阵，N是重建图像的像素总数，W ₁，W ₂，……，W _M′表示加权系数。

根据本公开实施例，其中，假定

表示图像域网络的作用函数，即

则按照如下的传递关系实现先验误差反向传递：

根据本公开实施例，所述方法还包括：将

和

共同传递至投影域网络，以便对各层参数进行更新。

根据本公开实施例，所述方法还包括：由CT扫描***获取对象的衰减信号数据，并对衰减信号数据进行预处理得到输入的投影数据。

根据本公开实施例，所述方法还包括由CT扫描***按照如下扫描方式之一来获取对象的投影数据：探测器欠采样扫描、稀疏角度扫描、内重建扫描、有限角扫描、和直线轨迹扫描。

根据本公开实施例，投影域网络包括多个并行的卷积神经网络支路。

根据本公开实施例，图像域网络包括U型卷积神经网络。

根据本公开实施例，所述方法还包括：将仿真数据集合作为输入的投影数据训练所述卷积神经网络。

根据本公开的另一方面，提供了一种图像处理方法，包括：

由CT扫描***获取对象的投影数据；以及

利用卷积神经网络对所述投影数据进行处理，以获取所述对象的估计图像；

其中，所述卷积神经网络包括：投影域网络，用于处理输入的投影数据，得到估计投影数据；解析重建网络层，用于对估计投影数据进行解析重建，得到重建图像；图像域网络，用于对重建图像进行处理，得到估计图像；投影层，用于利用CT扫描***的***投影矩阵对估计图像进行投影运算，得到估计图像的投影结果；和统计模型层，用于确定输入的投影数据、估计投影数据和估计图像的投影结果这三者基于统计模型的一致性；

其中，所述图像处理方法包括训练卷积神经网络，包括：利用基于输入的投影数据、估计投影数据、以及估计图像的投影结果这三者的数据模型的一致性代价函数来调整图像域网络和投影域网络的卷积核参数。

根据本公开的另一方面，提供了一种用于训练神经网络的设备，包括：

存储器，用于存储指令和数据，

处理器，配置为执行所述指令，以便：

构建所述神经网络，使其包括：投影域网络，用于处理输入的投影数据，得到估计投影数据；解析重建网络层，用于对估计投影数据进行解析重建，得到重建图像；图像域网络，用于对重建图像进行处理，得到估计图像；投影层，用于利用CT扫描***的***投影矩阵对估计图像进行投影运算，得到估计图像的投影结果；和统计模型层，用于确定输入的投影数据、估计投影数据和估计图像的投影结果这三者基于统计模型的一致性；

其中，所述处理器还配置为训练所述神经网络，包括利用基于输入的投影数据、估计投影数据、以及估计图像的投影结果这三者的数据模型的一致性代价函数来调整图像域网络和投影域网络的卷积核参数。

根据本公开的另一方面，提供了一种图像处理设备，包括：

存储器，用于存储指令和数据，

处理器，配置为执行所述指令，以便：

接收CT扫描***获取的对象的投影数据；以及

其中，所述处理器还配置为构建所述卷积神经网络，使其包括：投影域网络，用于处理输入的投影数据，得到估计投影数据；解析重建网络层，用于对估计投影数据进行解析重建，得到重建图像；图像域网络，用于对重建图像进行处理，得到估计图像；投影层，用于利用CT扫描***的***投影矩阵对估计图像进行投影运算，得到估计图像的投影结果；和统计模型层，用于确定输入的投影数据、估计投影数据和估计图像的投影结果这三者基于统计模型的一致性；

其中，所述处理器还配置为训练所述卷积神经网络，包括利用基于输入的投影数据、估计投影数据、以及估计图像的投影结果这三者的数据模型的一致性代价函数来调整图像域网络和投影域网络的卷积核参数。

根据本公开的另一方面，提供了一种计算机可读存储介质，其中存储有计算机指令，当所述指令被处理器执行时实现根据本公开的方法。

利用本公开上述实施例的方案，能够在无监督情况下训练神经网络，从而使得重建得到质量更高的图像。

附图说明

为了更好地理解本公开实施例，将根据以下附图对本公开实施例进行详细描述：

图1示出了本公开一个实施例的CT设备的结构示意图；

图2是如图1所示的CT设备中控制与数据处理装置的结构示意图；

图3示出了根据本公开实施例的中投影数据的正弦图的例子；

图4示出了在不同扫描方式下的正弦图中包含的数据的示意图；

图5是根据本公开一实施例的实现稀疏角度采样扫描方式的扫描装置的示意图；

图6A示出了根据本公开一个实施例的神经网络的一种结构示意图；

图6B示出了根据本公开一个实施例的神经网络的另一种结构示意图；

图7是描述如图6A和图6B所示的神经网络架构中各个模块处理的图像的示意图；

图8示出了根据本公开实施例的设备中使用的投影域网络的结构示意图；

图9示出了根据本公开实施例的设备中使用的解析重建网络层的结构示意图；

图10示出了根据本公开又一实施例的设备中图像域网络的结构示例示意图；

图11示出了本公开实施例的卷积神经网络中使用的平滑条件卷积核的结构示意图；

图12A、图12B和图12C示出了根据本公开实施例的设备中使用的滤波器核的尺寸示意图；

图13A是描述根据本公开的实施例的图像处理方法的示意性流程图；

图13B是描述根据本公开的实施例的训练神经网络方法的示意性流程图；

图14是根据本公开另一实施例的实现有限角度CT扫描的扫描装置的示意图；

图15是根据本公开再一实施例的实现内重建扫描方式的扫描装置的示意图；

图16是根据本公开再一实施例的实现探测器欠采样扫描方式的扫描装置的示意图；以及

图17示出了根据本公开再一实施例的实现直线轨迹CT扫描的扫描装置的示意图。

具体实施方式

下面将详细描述本公开实的具体实施例，应当注意，这里描述的实施例只用于举例说明，并不用于限制本公开实施例。在以下描述中，为了提供对本公开实施例的透彻理解，阐述了大量特定细节。然而，对于本领域普通技术人员显而易见的是：不必采用这些特定细节来实行本公开实施例。在其他实例中，为了避免混淆本公开实施例，未具体描述公知的结构、材料或方法。

在整个说明书中，对“一个实施例”、“实施例”、“一个示例”或“示例” 的提及意味着：结合该实施例或示例描述的特定特征、结构或特性被包含在本公开至少一个实施例中。因此，在整个说明书的各个地方出现的短语“在一个实施例中”、“在实施例中”、“一个示例”或“示例”不一定都指同一实施例或示例。此外，可以以任何适当的组合和/或子组合将特定的特征、结构或特性组合在一个或多个实施例或示例中。此外，本领域普通技术人员应当理解，这里使用的术语“和/或”包括一个或多个相关列出的项目的任何和所有组合。

本公开的实施例提出了一种用于训练神经网络的方法及其设备和一种图像处理方法及其设备。其中利用神经网络来处理输入的投影数据以获得对象的估计图像。该神经网络可以包括：投影域网络、解析重建网络层、图像域网络、投影层和统计模型层。投影域网络处理输入的投影数据，得到估计投影数据。解析重建网络层对估计投影数据进行解析重建，得到重建图像。图像域网络对重建图像进行处理，得到估计图像。投影层利用CT扫描***的***投影矩阵对估计图像进行投影运算，得到估计图像的投影结果。统计模型层确定输入的投影数据、估计投影数据和估计图像的投影结果这三者基于统计模型的一致性。利用基于输入的投影数据、估计投影数据、以及估计图像的投影结果这三者的数据模型的一致性代价函数来调整图像域网络和投影域网络的卷积核参数。利用本公开上述实施例的方案，训练得到的神经网络能够在投影数据存在缺陷时重建得到质量更高的图像。

图1示出了本公开一个实施例的CT设备的结构示意图。如图1所示，根据本实施例的CT设备包括X射线源10、机械运动装置50、探测器和数据采集***20，以及控制和数据处理装置60，对被检查对象40进行CT扫描和数据处理，例如神经网络的训练和利用训练后的网络重建图像。

X射线源10例如可以为X光机，可以根据成像的分辨率选择合适的X光机焦点尺寸。在其他实施例中也可以不使用X光机，而是使用直线加速器等产生X射线束。

机械运动装置50包括载物台和机架以及控制***等。载物台可平移以调整旋转中心的位置，机架可平移使X射线源(X光机)10、探测器和旋转中心三者对准。本实施例中按照旋转载物台、固定机架的圆周扫描轨迹或者螺旋轨迹进行描述。由于载物台与机架的运动属于相对运动，也可采用载物台静止、机架旋转的方式实现本实施例的方法。

探测器及数据采集***20包括X射线探测器和数据采集电路等。X射线探测器可以使用固体探测器，也可以使用气体探测器或者其他探测器，本公开的实施例不限于此。数据采集电路包括读出电路、采集触发电路及数据传输电路等。

控制和数据处理装置60例如包括安装有控制程序和数据处理程序的计算机设备，负责完成CT***运行过程的控制，包括机械转动、电气控制、安全联锁控制等，训练神经网络，并且利用训练的神经网络从投影数据重建CT图像等。

图2示出了如图1所示的控制和数据处理设备200的结构示意图。如图2所示，探测器及数据采集***20采集得到的数据通过接口单元270和总线280存储在存储设备210中。只读存储器(ROM)220中存储有计算机数据处理器的配置信息以及程序。随机存取存储器(RAM)230用于在处理器250工作过程中暂存各种数据。另外，存储设备210中还存储有用于进行数据处理的计算机程序，例如训练神经网络的程序和重建CT图像的程序等等。内部总线280连接上述的存储设备210、只读存储器220、随机存取存储器230、输入装置240、处理器250、显示设备260和接口单元270。

在用户通过诸如键盘和鼠标之类的输入装置240输入的操作命令后，计算机程序的指令代码命令处理器250执行训练神经网络的算法和/或重建CT图像的算法。在得到重建结果之后，将其显示在诸如LCD显示器之类的显示设备260上，或者直接以诸如打印之类硬拷贝的形式输出处理结果。

根据本公开的实施例，利用上述设备对被检查对象进行CT扫描，得到原始衰减信号。这样的衰减信号数据也可以显示为二维图像的形式，图3示出了根据本公开的实施例得到的衰减信号数据的例子。如图3所示的原始衰减信号的横轴方向表示探测器像素序列(例如从1到256)，而纵轴表示角度(例如从1度到360度)。原始衰减信号进行预处理后成为投影数据。例如，可以由CT扫描***对投影数据进行负对数变换等预处理得到投影数据。然后，控制设备中的处理器250执行重建程序，利用训练的神经网络对投影数据进行处理，得到估计投影数据，进而通过解析重建网络层对估计投影数据进行重建操作，得到重建图像。进一步对重建图像进行处理，得到最终图像。例如，利用训练的(例如U型)卷积神经网络处理重建的图像，得到不同尺度的特征图，并且对不同尺度的特征图进行合并，得到结果图像。

在本公开的实施例中，在投影域利用训练的卷积神经网络对投影数据进行处理，然后进行重建层重建操作来重建图像，最后图像域网络对重建图像进行处理，得到估计图像。卷积神经网络可以包括卷积层、池化、和全连接层。卷积层识别输入数据集合的特性表征，每个卷积层带一个非线性激活函数运算。池化层精炼对特征的表示，典型的操作包括平均池化和最大化池化。一层或多层的全连接层实现高阶的信号非线性综合运算，全连接层也带非线性激活函数。常用的非线性激活函数有Sigmoid、Tanh、ReLU等等。

虽然上面的描述主要是针对360度圆周扫描得到完备投影数据的情况来描述的，但是本领域的技术人员能够理解，上述方案可以用于对非完备投影数据的情况，例如应用于探测器欠采样、稀疏角度采样、有限角、内重建、或者直线轨迹扫描等方式。

图4示出了在不同扫描方式下的正弦图中包含的数据的示意图。如图4所示，角度稀疏采样CT扫描、有限角度CT扫描、探测器欠采样CT扫描和内重建CT扫描得到的投影数据都是不完备的。尽管投影数据不完备，但是利用上述的方案，也能够从这些不完备的投影数据中重建得到质量较高的图像。

图5是根据本公开再一实施例的实现稀疏角度采样扫描方式的扫描装置的示意图。如图5所示，从射线源10发出的X射线透射视野45中的被检查对象40后，被探测器30接收，转换成电信号并进而转换成表示衰减值的数字信号，预处理后作为投影数据，以便由计算机进行重建。利用上述的方案，即使对被检查对象40进行若干旋转位置下的CT扫描(例如6个位置)，利用本公开的方法训练的神经网络也能够重建得到质量较高的图像。这样，即使对被检查对象进行稀疏角度CT扫描，也能够从非完备的投影数据中重建得到质量较高的图像。

图6A示出了根据本公开的实施例的卷积神经网络的一种结构示意图。如图6A所示，无监督X射线CT图像重建神经网络的输入为CT扫描后的衰减信号经预处理得到的投影数据。神经网络主要可以包括投影域网络610、解析重建网络层620、图像域网络630。进一步，根据本公开实施例的神经网络还可以包括统计模型层640和投影层650。图6B示出了根据本公开的实施例的卷积神经网络的另一种结构示意图。与图6A所示的神经网络结构不同的是，图6B中的神经网络还可以包括至少一个先验模型层，图6B示出了三个先验模型层660、670和680作为示例。

图7是描述如图6A和6B所示的神经网络架构中各个模块处理的图像的示意图。如图7所示，输入的投影数据可以表示为g，经投影域网络处理后的数据表示为

可以将其称作“估计投影数据”。经解析重建网络层处理后的数据表示为

经图像域网络处理后的数据表示为

可以将其称作“估计图像”。

投影域网络610用于投影数据的恢复和缺失数据估计，以得到完备投影数据。解析重建网络层620包括多个层。这些层虽然是基于本领域技术人员了解的解析重建算法构建的，但是却经过了特殊的矩阵化，下文将详细介绍这些层的特殊构造。图像域网络630用于减少重建图像的伪影和误差，进一步提高重建图像的质量。投影层650利用CT扫描***的投影矩阵对估计图像

进行投影运算，得到估计图像的投影，从而可构建与投影一致的代价函数，类似于ART的代价函数。统计模型层640构成网络的一个代价支路，描述投影采集时的统计涨落，用于确定输入的投影数据、估计投影数据和估计图像的投影结果这三者基于统计模型的一致性，其全部或一部分可以是例如采集的X光CT数据与真实数据在统计模型下满足的似然关系代价函数。

如图6B所示，根据本公开实施例的神经网络还可以包括先验模型层660、670、680，构成网络的末端代价函数。本领域技术人员可以理解，图6B中的三个先验模型层仅为示例，神经网络也可以包括1个或者其他数目的并联的先验模型层(也可称为约束条件)。先验模型层660、670、680可以分别为局部条件的全变分、马尔科夫场先验、纹理先验、特征空间稀疏度及其他模型中的至少之一。参数λ调节先验模型或约束条件的重要性(或强度)，图6中示出了λ ₁、λ ₂、λ ₃，可以分别作为先验模型层660、670、680反向传递的权重。

整体网络的正向运算流程如图6A和6B的实线箭头所示。用g＝{g ₁，g ₂，...，g _M}表示投影域网络输入的投影数据，投影域网络610输出的估计投影数据为

通常M′≥M。经过图9所示的加权层后得到

W ₁，W ₂，……，W _M′表示加权系数。经过斜坡滤波层后得到滤波后正弦图

h为离散化的斜坡滤波算子，可以是例如Ram-Lak滤波器或者Shepp-Logan滤波器。在一个示例中，h可以为离散化的斜坡卷积核。经过反投影层得到解析重建网络层的输出

其中上标T表示矩阵的转置。H _R是M′×N维重建用***矩阵，与正向投影矩阵H(***投影矩阵)类似，由CT扫描***的架构和扫描方式确定，

完成反投影过程，在扇束或锥束扫描下完成加权反投影过程。经过重建网络后

继续前馈通过图像域网络，得到对扫描物体的估计图像

各个先验模型层的输出为代价函数

可以是多种如局部条件的全变分、马尔科夫场先验、纹理先验、特征空间稀疏度等之一或其组合。

整体网络的误差反向传递如图6所示的虚线箭头所示。反向传递分两条主线：数据模型的一致性代价和先验模型的吻合度代价。根据先验模型的吻合度代价函数

定义先验误差

参数λ定义了各个

的在误差反馈过程中的重要度，也就是图像空间先验模型的重要性。先验模型的吻合度代价的误差传递至图像域网络，逐层向前按链式求导法则计算各层输入与各层参数对代价函数的导数。然后通过解析重建网络层，按照如下传递方式完成解析重建网络层的先验误差反向传递：

假设

代表图像域网络的作用函数，即

则反向传递可进一步表示为

数据模型的一致性代价包括似然关系代价函数和与投影一致的代价函数中的至少一个。似然关系代价函数是根据信号的统计模型定义的，可以是高斯噪声分布、泊松概率分布、高斯和泊松混合概率分布等计算似然函数(在误差最小化的框架下取其负)

这里定义的

越小，则输入投影数据g与估计投影数据

越吻合。与投影一致的代价函数反映了前次估计结果(估计图像)通过投影层投影后的投影结果与估计投影数据

之间的差异。数据模型的一致性代价函数可以表示为：

由此，来自数据模型一致性的误差传递关系为：

其中β为拉格朗日乘子参数，

为与投影一致的代价函数，H为***投影矩阵。

和

共同传递至投影域网络，对各层参数进行更新。

传递到图像域网络，并经过解析重建网络层传递到投影域网络。

根据本公开的实施例，训练集数据可包含仿真工具产生覆盖应用情景的仿真模型，并按照实际CT***参数和扫描方式生成投影数据集。在实际***上扫描物体，获得CT扫描数据，其中一部分也作为训练集数据输入到此网络进行进一步训练，并利用另一部分采集数据对网络训练效果进行测试。

图8示出了根据本公开实施例的设备对稀疏角度应用的投影域卷积神经网络的结构示意图。使用例如CT扫描***对采集的原始衰减信号进行负对数变换等预处理(预处理还可以包括加空气值校正、一致性校正)后，得到投影数据g，投影域网络610使用该投影数据作为输入。投影域网络以卷积神经网络方式补全缺失数据。如图8所示的并联网络的输入是在稀疏角度情况下采集的数据。估计的缺失角度数据分为多组，每一组数据与采集角度规模相同，为与采集角度相差一个恒定角度的数据。对每个组，使用已有的投影数据作为输入数据，通过包含激活函数的卷积层(Conv)的级联完成多级特征的提取，通过全连接层(可以用1x1的卷积层实现)获得缺失的投影数据。

对于投影域的网络610，所有尺度的2维卷积核有两个维度，此处定义第一维度为探测器方向，第二维度为扫描角度方向。两个维度的卷积核长度不必相同，一般设置卷积核在探测器方向的尺度大于扫描角度方向的尺度，例如取3*1，5*3，7*3，9*3的卷积核。也可以根据投影图的两个维度比例关系取卷积核大小。每个尺度可以设置多个卷积核。卷积层带一个激活函数。

例如，投影域网络的主要作用为提升投影数据在角度方向的分辨率。投影域网络可以包括例如图8所示的5支路并行网络。每一支路包括例如七层卷积神经网络，中间部分由于探测器和投影数的比例关系采用长方形卷积核(图12A、12B、12C)，在最后一层卷积核尺寸为1*1实现特征图方向全连接，每一层巻积层输出均使用Relu函数作为非线性激活函数。卷积过程中，角度方向使用其周期性进行边界数据填补使特征图大小始终维持与输入相同。

如图8所示，在七层网络并行分别处理后，经插值处理，将4组缺失投影估计与1组已采集并经过网络降噪的投影合并形成360密集角度的估计投影图，并传向解析重建网络层。虽然图8所示为包括多个并行支路的卷积网络，但是本领域的技术人员可想到用其他形式的网络也能实现本公开的技术方案。虽然在上述实施例中是用投影域网络来恢复缺失的数据，也就是应用于得到非完备数据的CT扫描情况下，但是本领域的技术人员可以理解，上述投影域网络可以对完备的投影数据进行处理，提高投影数据的质量。

图9示出了根据本公开实施例的设备中使用的解析重建网络层的结构示意图。解析重建网络层620可以包括加权层(可选)、斜坡滤波层(可选)和反投影层。加权层实现对每个数据的余弦加权。斜坡滤波层实现传统解析重建方法中的斜坡滤波运算。反投影层实现从投影域到图像域的反向投影(对于扇束CT和锥形束CT反投影层为距离加权反投影)。通常解析重建网络层根据CT成像***的架构设计和实施，网络训练过程中不作参数修改。

例如，解析重建网络层620将解析重建算法显性加入网络结构，从而简化网络需要学习的物理规律。解析重建网络层620包括三层。

第一层为加权层。根据本应用中CT扫描几何参数用216*1的余弦向量对探测器方向数据进行余弦归一，为实现与估计投影之间点乘，对余弦归一向量在角度方向进行拓展得到216*360的加权矩阵W，这里W的每一列值均相等。经过W层后，投影图表示为

第二层是斜坡滤波层。斜坡滤波对投影图探测器方向进行离散滤波操作。在本应用中即分别对每一个角度下216探测器响应向量滤波，可用矩阵乘法描述，生成216*216的滤波矩阵F与加权后投影数据矩阵乘法完成滤波过程

第三层为反投影层。反投影层将滤波后投影按几何关系重建为图像，按本应用几何参数采用像素驱动方法生成距离加权反投影矩阵

对滤波后图像进行反投影，得到图像域重建图像。

图10示出了根据本公开又一实施例的设备中使用的图像域网络的示例示意图。图像域网络可以完成图像域的伪影抑制和噪声抑制。例如图6所示的图像域网络630可以是图10所示的U型网络。

例如，利用如图10所示的U型卷积神经网络处理重建的图像，可以得到不同尺度的特征图，并且对不同尺度的特征图进行合并，可以得到结果图像。更具体地，利用上采样操作逐级融合多个尺度下的特征图，并最终得到被检查物体的结果图像。例如，在估计投影解析重建的基础之上，图像域网络进一步应用先验知识进行去伪影。在本实例中，图像域网络采用U型网络设计(如图10)。其中，例如200*200的重建图像经过4次池化，逐步缩小特征图尺寸从而增大接受域学习图像全局特征。随后逐步扩展，并与同尺寸没有降采样的特征图合并，用于防止因降采样导致信息损失，最终再次恢复200*200尺寸经过网络处理后最终重建图像。在图10所示的图像域网络中，在不同层级卷积核大小均例如是3*3。图像在降采样过程中，随着特征图尺寸减小，特征图数量逐渐增多，在升采样过程中，特征图数量再逐渐减少。

虽然图10将图像域网络示例为一种U型网络的具体结构示例，但是本领域的技术人员可想到用其他结构的U型网络也能实现本公开的技术方案。此外，本领域的技术人员也可以想到将其他网络用作图像域网络，例如自编码网络(Auto-Encoder)、全卷积神经网络(Fully convolution neural network)等，也能够实现本公开的技术方案。

根据本公开的实施例，投影域网络610和图像域网络630的所有卷积核为待定的网络参数，可随机初始化，也可使用其它途径的预训练结果，在本网络训练过程中更新。此外，该网络分别对输入数据在投影域和图像域进行处理，使待优化的目标函数(在深度学习领域常称为损失函数)达到最优结果。由于在投影域和图像域相邻像素所具有的几何关系不同，因此投影域卷积层和图像域卷积层可以起到互补作用。

根据本公开的实施例的一个具体示例，在图像域基于图像连续性的先验知识，采用邻域相似性约束，通过一固定卷积核w ₀实现此运算。图11表示了一种固定的3*3卷积核。可以使用图像平滑的代价函数作为待优化的目标函数，可表达为

对数据模型一致性代价函数Ψ的设计，在本示例中，采集的投影数据g是一组符合独立高斯分布的采样，其均值为被扫描对象在对应射线路径上线性衰减系数的积分。约束中的第一项是高斯模型似然代价函数，完成由采样g到分布真值的极大似然估计约束，仅适用于被采集稀疏角度投影部分降噪网络。而第二项代表投影与图像的一致性约束，适用于投影域网络的各部分。

其中，g为采集到的稀疏角度投影数据，

为对应于已采集稀数角度投影数据的射线路径上的估计值，

为网络输出的估计图像，∑为对角线元素为投影数据方差的对角阵，H为***投影矩阵，β为拉格朗日乘子参数。

先验模型的吻合度代价函数反向传递可以表示为

对网络输出图像求导，并且梯度经解析重建层反向传递后作用于投影域网络卷积核。

数据保真约束Ψ中同时有

和

梯度反向传递同时从

更新投影域网络以及

传给图像域网络。

在对神经网络训练的过程中可能用到仿真数据集和实际数据集这两个数据集。

仿真数据集是来自网络等来源的高质量人体CT断层图片。根据机械几何关系，举一个示例，角度可以从3度开始，按照以5度为步长递增，到358度结束，来生成仿真投影数据，光子数为10 ⁵。得到一组216*72规模的仿真投影数据。将其中的4/5用于网络的无监督训练，剩下1/5作为验证集，用于控制网络的范化效果。

实际数据集可以是在扇束螺旋CT平台上按5度角度间隔和216探测器阵列对模体扫描产生投影，控制管电流时间达到正常剂量。用另一组不同的模体按同样的方式进行扫描得到投影作为测试集，在训练完成后用于对网络效果进行测试。

根据本发明的一个实施例，采用直接训练方式。在直接训练过程中，随机初始化投影域网络及图像域网络卷积核权值，由实际采集数据集进行训练，训练完成后，用另一组实际采集数据作为测试集以验证网络训练效果。

根据本发明的另一个实施例，可以采用预训练辅助直接训练的方式，数据仿真阶段是可以产生高质量的投影数据的，可以将使用仿真数据集训练神经网络的过程称为“预训练”。先利用仿真数据生成360个角度完整投影数据，有监督的单独训练并行投影估计网络。待预训练完成后(仿真数据集训练到收敛后)，利用此投影估计网络作为整体网络投影域网络的初始值，再按照直接训练的除了赋予初始值之外的方式整体训练网络。

对于实际CT扫描过程，把采集的数据输入上述训练过程获得已训练网络(此时网络参数固定)，获得重建图像。

图13A是描述根据本公开实施例的图像处理方法的示意流程图。如图13A所示，在步骤S131，由CT扫描***获取对象的投影数据。在步骤S132，利用卷积神经网络对投影数据进行处理，以获取所述对象的估计图像。

根据本公开实施例的神经网络可以包括投影域网络、解析重建网络层和图像域网络。投影域网络用于处理输入的投影数据，得到估计投影数据。解析重建网络层对估计投影数据进行解析重建，得到重建图像。图像域网络对重建图像进行处理，得到估计图像。根据本公开实施例的神经网络可以包括投影层，用于利用CT扫描***的***投影矩阵对估计图像进行投影运算，得到估计图像的投影结果；以及统计模型层，用于确定输入的投影数据、估计投影数据和估计图像的投影结果这三者基于统计模型的一致性。

根据本公开实施例的图像处理方法还可以包括对神经网络进行训练。图13B是描述根据本公开的实施例的训练神经网络的方法的示意性流程图。

如图13B所示，在步骤S1321，在第一训练过程，将仿真数据集合作为输入的投影数据训练神经网络。第一训练过程是对神经网络进行预训练，可加快训练过程。

在步骤S1322，在第二训练过程，将采集的真实CT数据作为输入的投影数据进一步训练神经网络。在步骤S1322中，可以利用基于估计图像的先验模型代价函数调整图像域网络，并经过解析重建网络层对梯度进行反向传递，以调整投影域网络的卷积核参数。在步骤S1322，利用基于输入的投影数据、估计投影数据、以及估计图像的投影结果这三者的数据模型的一致性代价函数来调整图像域网络和投影域网络的卷积核参数。更为具体的实现方案参见如上结合图6A和图6B所示的网络结构所描述的实施例，这里不再赘述。

虽然上面给出了角度稀疏采样扫描等方式，但是本领域技术人员可以想到，本公开的训练方法同样可以用在有限角度CT扫描、内重建扫描、探测器欠采样扫描以及直线轨迹CT扫描***中。

图14是根据本公开另一实施例的实现有限角度CT扫描的扫描装置的示意图。如图14所示，从射线源10发出的X射线透射视野45中的被检查对象40后，被探测器30接收，转换成电信号得到衰减数据，经过预处理操作后得到投影数据，由计算机进行重建。利用上述的方案，即使对被检查对象40进行有限角度的CT扫描(例如130度)，训练得到的神经网络也能够重建得到质量较高的图像。

图15是根据本公开再一实施例的实现内重建扫描方式的扫描装置的示意图。如图15所示，从射线源10发出的X射线透射视野45中的被检查对象40的一部分后，被探测器30接收，转换成电信号并进而转换成表示衰减值的数字信号，作为投影数据，由计算机进行重建。利用上述的方案，即使对被检查对象40进行内重建CT扫描，训练得到的神经网络也能够重建得到质量较高的图像。

图16是根据本公开再一实施例的实现探测器欠采样扫描方式的扫描装置的示意图。如图16所示，从射线源10发出的X射线透射视野45中的被检查对象40后被探测器30接收，转换成电信号并进而转换成表示衰减值的数字信号，作为投影数据，由计算机进行重建。在该例子中，探测器30被设置成欠采样的情形，例如将各个探测器单元间隔预定的距离来实现欠采样。这样，利用上述的方案，即使对被检查对象40进行探测器欠采样CT扫描，训练得到的神经网络也能够重建得到质量较高的图像。

图17示出了根据本公开再一实施例的实现直线轨迹CT扫描的扫描装置的示意图。如图17所示，从射线源10发出的X射线透射视野中的被检查物体40后被探测器30接收，转换成电信号并进而转换成表示衰减值的数字信号，作为投影数据，由计算机进行重建。在该例子中，被检查物体40在与探测器平行的传送带上沿着直线轨迹运动。探测器在水平方向与射线源张角尽可能大，在竖直方向覆盖物体。例如，探测器阵列放置在源的对边，要求射线水平张角θ在90度以上，得到直线轨迹CT扫描投影数据。利用上述的方案，即使对被检查物体40进行直线轨迹CT扫描，训练得到的神经网络也能够重建得到质量较高的图像。

本公开实施例的训练方法可以先采用仿真数据来进行预训练，再利用真实数据进行无监督训练。另外，也可以直接利用大量的真实数据无监督训练。这样深度挖掘数据信息，形成卷积神经网络和***针对性参数，获得高效的CT图像重建方法。

本公开的方法可以灵活适用于不同的CT扫描模式和***架构，可用于医学诊断、工业无损检测和安检领域。

以上的详细描述通过使用示意图、流程图和/或示例，已经阐述了训练神经网络的方法和设备的众多实施例。在这种示意图、流程图和/或示例包含一个或多个功能和/或操作的情况下，本领域技术人员应理解，这种示意图、流程图或示例中的每一功能和/或操作可以通过各种结构、硬件、软件、固件或实质上它们的任意组合来单独和/或共同实现。在一个实施例中，本公开实施例所述主题的若干部分可以通过专用集成电路(ASIC)、现场可编程门阵列(FPGA)、数字信号处理器(DSP)、或其他集成格式来实现。然而，本领域技术人员应认识到，这里所公开的实施例的一些方面在整体上或部分地可以等同地实现在集成电路中，实现为在一台或多台计算机上运行的一个或多个计算机程序(例如，实现为在一台或多台计算机***上运行的一个或多个程序)，实现为在一个或多个处理器上运行的一个或多个程序(例如，实现为在一个或多个微处理器上运行的一个或多个程序)，实现为固件，或者实质上实现为上述方式的任意组合，并且本领域技术人员根据本公开，将具备设计电路和/或写入软件和/或固件代码的能力。此外，本领域技术人员将认识到，本公开所述主题的机制能够作为多种形式的程序产品进行分发，并且无论实际用来执行分发的信号承载介质的具体类型如何，本公开所述主题的示例性实施例均适用。信号承载介质的示例包括但不限于：可记录型介质，如软盘、硬盘驱动器、紧致盘(CD)、数字通用盘(DVD)、数字磁带、计算机存储器等；以及传输型介质，如数字和/或模拟通信介质(例如，光纤光缆、波导、有线通信链路、无线通信链路等)。

虽然已参照几个典型实施例描述了本公开实施例，但应当理解，所用的术语是说明和示例性、而非限制性的术语。由于本公开实施例能够以多种形式具体实施而不脱离公开实施例的精神或实质，所以应当理解，上述实施例不限于任何前述的细节，而应在随附权利要求所限定的精神和范围内广泛地解释，因此落入权利要求或其等效范围内的全部变化和改型都应为随附权利要求所涵盖。

Claims

一种用于训练神经网络的方法，所述神经网络包括：

投影域网络，用于处理输入的投影数据，得到估计投影数据；

解析重建网络层，用于对估计投影数据进行解析重建，得到重建图像；

图像域网络，用于对重建图像进行处理，得到估计图像；

投影层，用于利用CT扫描***的***投影矩阵对估计图像进行投影运算，得到估计图像的投影结果；和

统计模型层，用于确定输入的投影数据、估计投影数据和估计图像的投影结果这三者基于统计模型的一致性；

其中，所述方法包括：

利用基于输入的投影数据、估计投影数据、以及估计图像的投影结果这三者的数据模型的一致性代价函数来调整图像域网络和投影域网络的卷积核参数。
如权利要求1所述的方法，还包括：利用投影层构建与投影一致的代价函数，利用统计模型层构建似然关系代价函数，以及利用与投影一致的代价函数和似然关系代价函数中的至少一个形成所述数据模型的一致性代价函数。
如权利要求1所述的方法，其中，所述卷积神经网络还包括至少一个先验模型层，所述先验模型层用于基于估计图像的先验模型代价函数调整图像域网络，并经过解析重建网络层对梯度进行反向传递，以调整投影域网络的卷积核参数。
如权利要求1或3所述的方法，其中，投影域网络、解析重建网络层和图像域网络的正向传递过程包括：

投影域网络的输入投影数据表示为g＝{g ₁，g ₂，...，g _M}，投影域网络输出的估计投影数据表示为
M′≥M，经过加权后得到
经过斜坡滤波层后得到
经过反投影得到解析重建网络层的输出
令
表示图像域网络的作用函数，则图像域网络输出的估计图像

其中，上标T表示矩阵的转置，h为离散化的斜坡滤波算子，H _R是M′×N维重建用***矩阵，N是重建图像的像素总数，W ₁，W ₂，……，W _M′表示加权系数。
如权利要求4述的训练方法，其中，将所述数据模型的一致性代价函数表示为
来自数据模型一致性的误差传递关系为：

其中，
为似然关系代价函数，
越小，则投影数据g与估计投影数据
越吻合，
为与投影一致的代价函数，β为拉格朗日乘子参数，H为***投影矩阵。
如权利要求3或4所述的方法，其中，所述先验模型代价函数
包括局部条件的全变分、马尔科夫场先验、纹理先验、特征空间稀疏度之一或者组合，其中
为所述估计图像。
如权利要求6所述的方法，还包括利用先验误差ε ^Pr定义先验模型代价函数
如权利要求6所述的方法，其中，根据各个先验模型代价函数
在误差反馈过程中的重要性λ来调整图像域网络。
如权利要求7所述的方法，其中，在解析重建网络层，按照如下的传递关系实现解析重建网络层的先验误差反向传递：

其中，投影域网络的输入投影数据表示为g＝{g ₁，g ₂，...，g _M}，投影域网络输出的估计投影数据表示为
M′≥M，经过加权后得到
经过斜坡滤波层后得到
经过反投影得到解析重建网络层的输出
其中上标T表示矩阵的转置，h为离散化的斜坡滤波算子，H _R是M′×N维重建用***矩阵，N是重建图像的像素总数，W ₁，W ₂，……，W _M′表示加权系数。
如权利要求9所述的方法，其中，用
表示图像域网络的作用函数，即
则按照如下的传递关系实现先验误差反向传递：
如权利要求10述的方法，所述方法还包括：将
和
共同传递至投影域网络，以便对各层参数进行更新。
如权利要求1所述的方法，还包括：由CT扫描***获取衰减信号数据，并对衰减信号数据进行预处理得到输入的投影数据。
如权利要求1所述的方法，还包括由CT扫描***按照如下扫描方式之一来获取对象的投影数据：探测器欠采样扫描、稀疏角度扫描、内重建扫描、有限角扫描、和直线轨迹扫描。
如权利要求1所述的方法，其中，投影域网络包括多个并行的卷积神经网络支路。
如权利要求1所述的方法，其中，图像域网络包括U型卷积神经网络。
如权利要求1所述的方法，还包括：将仿真数据集合作为输入的投影数据，以对所述卷积神经网络进行预训练。
一种图像处理方法，包括：

由CT扫描***获取对象的投影数据；以及

利用卷积神经网络对所述投影数据进行处理，以获取所述对象的估计图像；

其中，所述卷积神经网络包括：

投影域网络，用于处理输入的投影数据，得到估计投影数据；

解析重建网络层，用于对估计投影数据进行解析重建，得到重建图像；

图像域网络，用于对重建图像进行处理，得到估计图像；

投影层，用于利用所述CT扫描***的***投影矩阵对估计图像进行投影运算，得到估计图像的投影结果；和

统计模型层，用于确定输入的投影数据、估计投影数据和估计图像的投影结果这三者基于统计模型的一致性；

其中，所述图像处理方法包括训练卷积神经网络，包括：

利用基于输入的投影数据、估计投影数据、以及估计图像的投影结果这三者的数据模型的一致性代价函数来调整图像域网络和投影域网络的卷积核参数。
一种用于训练神经网络的设备，包括：

存储器，用于存储指令和数据，

处理器，配置为执行所述指令，以便：

构建所述神经网络，使其包括：

投影域网络，用于处理输入的投影数据，得到估计投影数据；

解析重建网络层，用于对估计投影数据进行解析重建，得到重建图像；

图像域网络，用于对重建图像进行处理，得到估计图像；

投影层，用于利用CT扫描***的***投影矩阵对估计图像进行投影运算，得到估计图像的投影结果；和

统计模型层，用于确定输入的投影数据、估计投影数据和估计图像的投影结果这三者基于统计模型的一致性；

其中，所述处理器还配置为训练所述卷积神经网络，包括利用基于输入的投影数据、估计投影数据、以及估计图像的投影结果这三者的数据模型的一致性代价函数来调整图像域网络和投影域网络的卷积核参数。
一种图像处理设备，包括：

存储器，用于存储指令和数据，

处理器，配置为执行所述指令，以便：

接收CT扫描***获取的对象的投影数据；以及

利用卷积神经网络对所述投影数据进行处理，以获取所述对象的估计图像；

其中，所述处理器还配置为构建所述卷积神经网络，使其包括：

投影域网络，用于处理输入的投影数据，得到估计投影数据；

解析重建网络层，用于对估计投影数据进行解析重建，得到重建图像；

图像域网络，用于对重建图像进行处理，得到估计图像；

投影层，用于利用CT扫描***的***投影矩阵对估计图像进行投影运算，得到估计图像的投影结果；和

统计模型层，用于确定输入的投影数据、估计投影数据和估计图像的投影结果这三者基于统计模型的一致性；

其中，所述处理器还配置为训练所述卷积神经网络，包括利用基于输入的投影数据、估计投影数据、以及估计图像的投影结果这三者的数据模型的一致性代价函数来调整图像域网络和投影域网络的卷积核参数。
一种计算机可读存储介质，其中存储有计算机指令，当所述指令被处理器执行时实现如权利要求1-17之一所述的方法。