CN112884706B

CN112884706B - 一种基于神经网络模型的图像评估***和相关产品

Info

Publication number: CN112884706B
Application number: CN202110045622.6A
Authority: CN
Inventors: 任玉雪; 陈伟; 吴伯阳; 其他发明人请求不公开姓名
Original assignee: Beijing Zhituo Vision Technology Co ltd
Current assignee: Beijing Zhituo Vision Technology Co ltd
Priority date: 2021-01-13
Filing date: 2021-01-13
Publication date: 2022-12-27
Anticipated expiration: 2041-01-13
Also published as: CN112884706A

Abstract

本发明涉及一种基于神经网络模型的图像评估***和相关产品，包括一个或多个处理器、第一神经网络单元、第二神经网络单元以及一个或多个计算机可读存储介质，其中第一神经网络单元接收并处理图像数据，以获得目标向量数据，其中所述图像数据包含与目标图像区域的几何特征相关的张量数据。第二神经网络单元接收并且处理所述目标向量数据，以输出用于评估所述目标图像区域的评估结果，以便对目标区域图像的发展做出预测。

Description

一种基于神经网络模型的图像评估***和相关产品

技术领域

本发明总体上涉及图像处理领域。更具体地，本发明涉及一种基于神经网络模型的图像评估***和相关产品。

背景技术

随着图像处理技术的不断演进，越来越多的研究关注于图像在时间维度上的发展，以期对图像中的目标物在时间的变化做出合理的评估和预测。在这些研究中，一个兴起的领域是对包括病灶区域的图像的研究。众所周知，病灶区域中通常包含有助于临床诊断的丰富信息，因此对病灶区域的图像特征进行提取和分析显得尤为重要。目前传统的处理方式是提取病灶区域的影像学特征，并将影像学特征用于后续的分析和研究，以期对病灶区域做出评价。然而，如何有效地提取病灶区域的高阶几何特征以及如何根据提取的高阶几何特征对病灶区域进行有效的评估和预测成为急需解决的问题。

发明内容

为了至少解决上面的技术问题，本发明提供一种基于神经网络模型的图像评估***。简而言之，本发明使用了基于神经网络的技术来接收并处理图像数据以输出用于评估图像区域的评估结果。利用该评估结果，本发明的方案可以对目标图像在时间维度上的发展进行预测。鉴于此，本发明在如下的多个方面提供相应的解决方案。

在一个方面，本发明提供一种基于神经网络模型的图像评估***，包括：一个或多个处理器；第一神经网络单元；第二神经网络单元；以及一个或多个计算机可读存储介质，其存储有实现所述第一神经网络单元和第二神经网络单元的程序指令，当所述程序指令由所述一个或多个处理器执行时，使得：第一神经网络单元接收并处理图像数据，以获得目标向量数据，其中所述图像数据包含与目标图像区域的几何特征相关的张量数据；以及第二神经网络单元接收并且处理所述目标向量数据，以输出用于评估所述目标图像区域的评估结果。

在一个实施例中，其中所述第一神经网络单元包括多个编码器和特征提取器，其中：所述多个编码器中的每个编码器包括多个卷积层，其配置用于对所述图像数据进行多层卷积处理，以从所述图像数据获得针对于不同几何特征的多个特征向量；以及所述特征提取器，其配置成对所述多个特征向量执行特征融合操作，以获得所述目标向量数据。

在另一个实施例中，其中所述多个卷积层串行连接，并且串行连接的最后一个卷积层的输出端连接到所述特征提取器的输入端。

在又一个实施例中，其中所述特征融合操作包括对所述多个特征向量执行数据拼接操作，以便输出所述目标向量数据。

在又一个实施例中，其中所述第二神经网络单元包括长短期记忆神经网络，其配置成接收和处理所述目标向量数据，以输出用于评估所述目标图像区域的评估结果。

在又一个实施例中，其中所述目标图像区域是与生命个体的病灶区域相关的图像区域。

在又一个实施例中，其中所述张量数据包括三维张量数据，并且所述一个或多个计算机可读存储介质还存储有获得所述三维张量数据的程序指令，当所述程序指令由所述一个或多个处理器执行时，使得：基于所述原始数据来生成四面体网格；以及利用所述四面体网格来确定几何特征，并且将所述几何特征表示为三维张量数据。

在再一个实施例中，其中所述几何特征包括里奇曲率、梯度或者平均曲率。

在另一个方面，本发明提供一种计算设备，其中包括基于神经网络模型的图像评估***的多个实施例。

在又一个方面，本发明提供一种计算机可读存储介质，其包括用于基于神经网络模型对图像进行评估的计算机程序，当所述计算机程序由设备的一个或多个处理器执行时，使得所述设备执行前述图像评估***的操作及多个实施例。

通过上述方案，本领域技术人员可以理解本发明通过第一神经网络单元和第二神经网络单元来对图像数据进行处理，从而可以有效地获得用于目标图像区域评估和预测的评估结果。在使用神经网络单元的过程中，本发明的方案还使用特征融合操作来对数据进行融合，从而显著提升数据处理的效率。在一个应用场景中，前述的评估结果可以有效地对目标图像区域的质量进行预测，这在当目标图像区域包括病灶区域时尤其重要。例如，基于评估结果，医生可以通过病灶的质量来判断患者的病情和发展趋势，并且在必要时及时人为介入，从而有效控制病情。

附图说明

通过参考附图阅读下文的详细描述，本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中，以示例性而非限制性的方式示出了本发明的若干实施方式，并且相同或对应的标号表示相同或对应的部分其中：

图1是示出根据本发明多个实施例的图像评估***的功能框图；

图2是示出根据本发明多个实施例的用于对图像的几何特征进行提取的方法的流程图；

图3是示出根据本发明多个实施例的用于生成二维网格的方法的示例性流程图；

图4是示出根据本发明多个实施例的四面体网格的示意图；

图5是示出根据本发明多个实施例的利用几何特征值替换体素值的方法的示例性流程图；

图6是示出根据本发明多个实施例的一部分网格顶点及其邻边的示例性示意图；

图7是示出根据本发明多个实施例的第一神经网络单元的操作框图；

图8示出根据本发明多个实施例的编码器的操作框图；

图9是示出根据本发明多个实施例的第一神经网络单元和第二神经网络单元的操作框图；

图10是示出根据本发明多个实施例的第二神经网络单元的操作原理图；以及

图11是示出根据本发明多个实施例的用于基于神经网络模型对图像进行评估的计算设备的方框图。

具体实施方式

下面将结合附图对本发明实施例中的技术方案进行清楚和完整地描述。应当理解的是本说明书所描述的实施例仅是本发明为了便于对方案的清晰理解和符合法律的要求而提供的部分实施例，而并非可以实现本发明的所有实施例。基于本说明书公开的实施例，本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1是示出根据本发明多个实施例的图像评估***100的功能框图。该图像评估***100包括处理器101、第一神经网络单元102、第二神经网络模单元103以及计算机可读存储介质105。如图中所示，在本发明的一个实现场景中，前述的第一神经网络单元和第二神经网络单元可以实现为存储(或者说驻留于)计算机可读存储介质上的计算机程序指令，例如二进制的指令代码。

在一个实施例中，上述的处理器可以是一个或者多个，因此本发明对于处理器的个数并不做限制。在一些实施场景中，处理器既可以是通用处理器(“CPU”)，也可以是专用图形处理器(“GPU”)。在另外一些实施场景中，还可以使用CPU和GPU的组合，例如在一些异构架构***下。当使用前述的异构架构***时，可以在CPU处编译关于本发明方案的计算机程序指令，以得到可执行程序。接着，可以通过CPU和GPU之间的驱动程序接口将该可执行程序传送至GPU，以便执行该程序来对输入的图像数据执行评估。

尽管图中以单个的方框来示出计算机可读存储介质，但其数目也可以是多个，例如可以是能够存储计算机程序指令的各类存储介质。如上所述，该程序指令可以包括用于实现第一神经网络单元的程序指令和用于实现第二神经网络单元的程序指令。例如，当处理器执行前述一个或者多个程序指令时，本发明的第一神经网络单元可以配置成接收图中左侧所示的图像数据104，并且对该图像数据进行处理以获得目标向量数据。相应地，本发明的第二神经网络单元可以配置成接收前述获得的目标向量数据，并且对该目标向量数据进行处理，从而最终获得目标图像的评估结果(例如以质量或体积比的形式来表达)。

在一个应用场景中，上述图像数据可以是包含与目标图像区域相关的几何特征相关的张量数据，并且该张量数据可以是三维张量数据。在一个实施例中，目标图像区域可以例如是与生命个体的病灶区域相关的图像区域，其原始数据可以通过例如电子计算机断层扫描(Computed Tomography，“CT”)技术或设备所获得的CT图像数据。基于上述描述，上述计算机可读存储介质还存储有获得所述张量数据的程序指令，当所述程序指令由所述一个或多个处理器执行时，使得基于前述获得的原始数据来生成四面体网格，并且通过生成的四面体网格来确定目标图像区域的几何特征。进一步地，将几何特征表示为例，如三维张量数据，以作为目标图像区域的几何特征相关的张量数据。下面将结合图2-图6对本发明如何进行前述的几何特征的提取进行详细地描述。

图2是示出根据本发明多个实施例的用于对图像的几何特征进行提取的方法200的流程图。

首先，需要注意的是本发明的方法200可以通过包括例如计算机的各类计算设备来实施，其中涉及到的病灶区域的三维图像数据可以是通过例如电子计算机断层扫描技术或设备所获得的三维图像数据。进一步，本发明的病灶区域的三维图像数据中包含立方体结构，如体积元素(简称“体素”)。正如本领域技术人员所知，体素主要用于三维成像、科学数据与医学成像领域，其是数字数据在三维空间上所能进行分割和识别的最小单位。进一步，体素的数值(简称“体素值”)可以表示不同的特性。例如，在CT图像中，前述的体素值是亨氏单位(Hounsfield Unit，“HU”)。在一个实施例中，可以通过支持CT技术的设备来获取三维图像数据并且通过计算来获得本发明的体素值。在该情形中，体素值是图像的灰度值(即下文本发明实施例中所讨论涉及的灰度值)。附加地，可以对前述的灰度值进行转换以获得CT值，其单位是上述的亨氏单位。

如图2中所示，在基于例如上述讨论的CT技术获得三维图像数据后，在步骤202处，方法200可以根据病灶区域的三维图像数据来生成由多个顶点连接而成的四面体网格。在一个实施例中，生成四面体网格可以包括生成四面体网格的边界，再生成四面体网格的内部顶点。在该情形中，四面体网格的边界可以是根据三维图像数据的边界生成的二维网格，并且四面体网格的内部顶点可以是体素的顶点。进一步地，将生成的二维网格作为四面体网格的边界，由此可以利用该边界来获得四面体网格外表面的先验信息，从而加快了四面体网格的生成速度。进一步地，本发明实施例通过构建(或者说重建)四面体网格，可以对病灶区域的形状进行精确描述。进一步，本发明可以通过该四面体网格来确定高阶几何参数(例如梯度)的位置，以便为后续对病灶区域的分析提供更为准确的数据。

在通过步骤202生成四面体网格后，流程前进到步骤204处。在该步骤204处，方法200利用所述顶点处的体素值来确定所述顶点处的几何特征值。如前所述，顶点处的体素值可以直接通过支持例如CT技术的装置或者设备来获得，并且获得的体素值通常是CT图像(即本发明实施例中的病灶区域图像)的灰度值，该灰度值可以是0-255之间的任一对应值。根据本发明的一个或多个实施例，前述的几何特征可以包括但不限于里奇曲率、梯度或者平均曲率。接着，在步骤206处，方法200利用所述几何特征值来替换所述体素值，以实现对所述病灶区域的几何特征提取。当本发明的几何特征是上述的里奇曲率、梯度或者平均曲率中的一种时，计算该顶点处的里奇曲率值、梯度值或者平均曲率值。基于此，利用前述步骤204处获得的四面体网格顶点处的里奇曲率值、梯度值或者平均曲率值作为该顶点处的灰度值来替换体素值。在一个实施例中，这里获得的里奇曲率值、梯度值或者平均曲率值可以是具有多个维度的张量数据，例如三维张量数据。

上文结合图2对本发明的几何特征提取方案进行了描述。基于上文的描述，本领域技术人员可以理解本发明首先对病灶区域重建四面体网格，并通过四面体网格顶点处的体素值来计算几何特征值，例如里奇曲率值、梯度值或者平均曲率值。进一步地，利用获得的几何特征值替换顶点处的体素值以提取几何特征，并且将该几何特征表示为三维张量数据，以便于后续的研究和分析。

结合上述描述，本领域技术人员可以理解本发明通过对病灶区域图像的高阶几何特征的提取，使得包含更加丰富的特征信息，从而能够反映目标图像区域本质几何属性。同时，与传统的特征提取相比，本发明基于病灶区域图像提取的高阶几何特征更具可解释性。进一步地，通过利用本发明获得的高阶几何特征，并将其表示为三维张量数据，以作为例如深度神经网络的机器学习算法的训练数据，可以训练获得针对于病灶发展趋势的预测模型，从而对病灶区域的发展做出准确预测，以便进行有效的人为干预。

图3是示出根据本发明多个实施例的用于生成二维网格的方法300的示例性流程图。结合上文对图2的描述，本领域技术人员可以理解四面体网格的边界可以是根据三维图像数据的边界生成的二维网格。由此，本发明提出利用图3示出的方法300来获得前述的二维网格。这里需要指出的是方法300是图2所示方法200中部分步骤的具体实现方式，因此关于方法200所做的相应描述也同样适用于下文对于方法300的讨论。

如图3中所示，在步骤302处，方法300利用布尔型变量来标记所述三维图像区域。在一个实施场景中，本领域技术人员可以理解二维网格的生成，其实质是对于布尔型变量(bool)数据外表面的网格生成。具体地，可以利用bool标记病灶区域的三维图像区域，并令其为f(Ω)，其中f为光滑函数，Ω为所述三维图像存在的区域。接着，在步骤304处，方法300根据标记后的三维图像区域来生成所述二维网格。例如，基于前述标记的三维图像区域f(Ω)，可以通过f^-1(1)表示内部体素，f^-1(0)表示外部体素，而f^-1(a)(其中0＜a＜1)则表示三维图像数据的边界，并通过光滑插值计算f函数的a等值面网格。在一个实施场景中，可以利用例如计算几何算法库(Computational Geometry Algorithms Library，“CGAL”)执行前述插值来生成二维网格。

在生成上述二维网格后，本领域技术人员可以对该二维网格进行前述的CDT处理，从而保证二维网格和四面体网格的边界一致性。也就是说，使得生成的二维网格恰好是四面体网格的边界。进一步地，本领域技术人员还可以对四面体网格进行更强的限制，即将三维数据的体素顶点作为四面体网格的内部顶点。由此，基于获得的二维网格和体素顶点，最终生成由多个顶点连接而成的四面体网格。为了便于理解，图4示出了根据本发明实施例生成的四面体网格的一部分的示例性示意图。根据获得的四面体网格，可以利用该网格各顶点处的灰度值以确定该网格顶点处的几何特征值。在一个实施例中，几何特征值可以是里奇曲率值、梯度值或者平均曲率值。进一步地，利用前述几何特征值替换四面体网格顶点处的体素值。

图5是示出根据本发明多个实施例的用于利用几何特征值替换体素值的方法500的示例性流程图。这里需要理解的是方法500是图2所示方法200中部分步骤的一种具体实现方式，因此关于方法200所做的相应描述也同样适用于方法500。

根据前文的描述，在生成由多个顶点连接而成的四面体网格后，在步骤502处，方法500可以根据前述生成的四面体网格的网格顶点处的体素值来计算所述顶点处的里奇曲率值、梯度值或平均曲率值。在一个实施场景中，可以通过下面所描述的数学操作来计算里奇曲率值。首先，可以定义四面体网格中的顶点邻接的边的权值F(e)，并将其表示为：

其中，ω_e表示边e的权值，

和

分别表示顶点v₁和v₂处的权重，

表示所有与顶点v₁邻接的边(不包括边e)，

表示所有与顶点v₂邻接的边(不包括边e)。为了便于理解，图6示出了根据本发明多个实施例的一部分网格顶点及其邻边的示例性示意图。

如图6所示，v₁和v₂可以表示上述生成的四面体网格中共边的两个顶点e为顶点v₁和顶点v₂的连接边。进一步，顶点v₁还包括与其邻接的边

以及

类似地，顶点v₂也包括与其邻接的边

以及

在一个实施例中，将顶点v₁处的权重定义为

顶点v₂处的权重定义为

前述权重

和

可以是顶点v₁和顶点v₂处的体素值(即灰度值)。由此，基于顶点v₁和顶点v₂处的权重

和

可以获得v₁和v₂共边e的权重ω_e：

结合上述公式(1)和公式(2)可以获得四面体网格中的顶点邻接的边的权值F(e)。基于前述获得的权重F(e)，进一步地根据如下公式可以获得每个顶点处的里奇曲率Ric：

在上述公式(3)中，e_v表示与顶点v相邻接的边，e_v～v表示所有与顶点v相邻的边，deg(v)可以表示e_v的个数，也即点v相邻的边的个数。在该情形下，里奇曲率值的计算结果是一个数值。

在另一个实施例中，可以只基于上述公式(1)和公式(2)来计算四面体网格中的顶点邻接的边的权重。例如，可以分别计算顶点处相互正交的三个轴(即x轴、y轴、z轴)上的权重，将该三个轴的权重作为里奇曲率值。前述三个轴重可以表示三维张量的张量数据。由此，里奇曲率值可以被表示为三维张量。

上文就如何计算获得里奇曲率值进行了示例性的描述。关于上述提到的几何特征值涉及的梯度值，在一个实施场景中，可以首先采用高斯函数对四面体网格进行卷积，基于卷积后的四面体网格计算其梯度。进一步地，对获得的梯度计算其模长。采用数学方式将四面体网格的梯度值计算表示为

具体地，G表示方差为σ的高斯分布，*表示卷积，f表示四面体网格中的体素值(即灰度值)。针对高斯卷积运算，本领域技术人员可以通过图像处理软件(例如MATLAB)直接调用高斯滤波函数来进行计算。需要理解的是，在该情形下，前述获得顶点处的梯度值是一个实数。本领域技术人员还可以通过分别计算顶点处的三个轴(即x轴、y轴、z轴)的偏导数，以该三个轴上的偏导数作为三维张量的三个维度上的张量数据。由此，梯度值也可以被表示为三维张量。

进一步，关于上述提到的几何特征值还涉及的平均曲率，在又一个实施场景中，假设病灶区域图像为函数F，并且顶点x所在的等值面的法向量为

则可以将顶点x处的平均曲率K定义为：

上述等值面可以理解成是具有相同灰度值的点的集合所组成的曲面。对于三维数据来说，其可以看成是多个前述等值面的集合。需要理解的是，基于前述定义获得的平均曲率是一个实数。由此，平均曲率可以直接采用基于公式(4)计算得到的实数表示。

返回到图5，基于上述获得里奇曲率值、梯度值或者平均曲率值后，接着方法500前进至步骤504。在该步骤504处，方法500利用所述里奇曲率值、梯度值或平均曲率值来替换所述顶点处的体素值。具体来说，可以将每个顶点处的体素值替换成上述获得的里奇曲率值、梯度值或平均曲率值，其中里奇曲率值和梯度值可以表示为三维张量。由此，本发明通过确定里奇曲率值、梯度值或平均曲率值而实现了对病灶区域的几何特征的提取。

结合上述描述，本发明实施例通过对病灶区域提取高阶几何特征值，例如里奇曲率值、梯度值或者平均曲率值，并且将里奇曲率值和梯度值表示三维张量。进一步地，本发明实施例病灶区域的体素值替换成前述几何特征值，便于后续的分析和研究。在一个实现场景中，本领域技术人员可以将获得的几何特征值(例如以三维张量数据的形式)作为数据源，应用于例如神经网络，经过训练或深度学习以获得针对病灶区域发展趋势的预测模型，从而对病灶区域的发展做出准确预测，以便进行有效的人为干预。

上面结合图2-图6对本发明的几何特征提取进行了详细地描述。如前所述，本发明的方案可以基于包括该几何特征的图像数据，也即三维张量数据。进一步地，利用神经网络单元来对三维张量数据进行处理，以获得对包括例如病灶区域的目标图像区域的评估结果。下面将结合图7-图11来描述本发明的如图1中所示的图像评估***100所执行的具体操作。

在基于结合上述图2-图6所描述的提取方式来获取包括所述几何特征的图像数据(也即三维张量数据)后，由于该图像数据通常采用0到255范围内的灰度值表示，因此通常需要对获取到的图像数据进行预处理。在一个实施例中，本发明提出利用最大-最小(max-min)准则将图像数据的灰度值归一化到0到1之间的浮点数。接着，本发明的第一神经网络单元接收该预处理后的图像数据，并对其进行处理以获取目标向量数据。在应用本发明的几何特征提取方案的实施场景中，前述图像数据还可以是与目标图像区域的几何特征相关的原始数据、一维数据和/或二维数据。其中，一维数据可以是例如基于上述几何特征提取方案获得的平均曲率值。

图7是示出根据本发明多个实施例的第一神经网络单元102的操作框图。需要理解的是，图7所示第一神经网络单元102是图1所示图像评估***100中的第一神经网络单元102的一种具体实施方式。由此，关于图1描述的图像评估***100的相关细节和特征也适用于图7的描述。

如图所示，图中左侧虚线框中表示不同类型的图像数据，从上到下依次表示原始数据701、三维数据702、二维数据703以及一维数据704。在一个实施例中，一维数据可以存储为TXT格式，其大小可以是1*400(即一行400个数据位)；二维数据可以存储为图片(例如png)格式，其像素大小例如可以是256*256。三维张量数据可以存储为nii格式，其尺寸大小可以是512位*512位*512位。如前所述，本发明的方案提出使用max-min准则对上述的图像数据进行归一化处理，从而保持处理后的数据格式和尺寸大小不变。

在接收到上述的图像数据(例如经归一化预处理的图像数据)后，本发明的第一神经网络单元102首先将图像数据通过不同的编码器来提取不同类型的图像数据对应的特征向量。

具体来说，编码器1对原始数据701进行处理以输出特征向量701-1。类似地，三维数据702、二维数据703以及一维数据704可以分别通过编码器2、编码器3以及编码器4提取出相对应的特征向量702-1、特征向量703-1以及特征向量704-1。需要理解的是，图7中所示的图像数据维度的维度数和编码器的个数仅仅是示例性而非限制性的，本领域技术人员可以根据需求选择其他的图像数据格式或类型。例如，在一些应用场景中，可以采用原始数据、一维到三维数据中的任意一种数据来用于评估。在另一些应用场景中，可以将前述的原始数据以及一维到三维数据中的任意两种或多种进行组合以用于评估。因此，本发明在数据格式和数据使用方式等方面并不作任何的限制。类似地，本发明也对与前述数据格式相对应的编码器的数目和类型不做任何的限制。

在一个实施例中，本发明的上述编码器可以通过神经网络中的卷积层(或者说卷积算子)来实现。在一个实现场景中，可以通过如图8中所示出的包括两个卷积层和一个自适应卷积层的层结构来实现对数据的编码操作，以获得如上所述的特征向量数据，具体描述如下。

图8示出根据本发明多个实施例的编码器800的操作框图。可以理解的是该编码器800可以是图7中的编码器1-编码器4中任意之一。如图中所示，该编码器800可以包括卷积层801、卷积层802以及一个自适应卷积层803。假设该图中左侧数据是上述图中的三维张量数据702(例如里奇曲率或者梯度)，该编码器800设定为上述图7中的编码器2。由此，三维张量数据702经过编码器800中的卷积层801进行第一次卷积。接着，经过卷积层802进行第二次卷积，并可选地经过自适应卷积803进行第三次卷积获得特征向量702-1。类似的，原始数据701、二维数据703和一维数据704(例如平均曲率)分别通过如上所述的编码器1、编码器3、和编码器4处理后，可以对应获得如图7中的特征向量701-1、特征向量703-1以及特征向量704-1。

根据实际的应用场景，本发明的上述编码器中的前两个卷积层可以分别采用128和64个卷积核来执行卷积操作。在该情形下，输入可以分别是256*256和128*128大小的特征图，而输出可以分别是128*128和64*64大小的特征图。对于第三个卷积层来说，其可以是使用32个卷积核的自适应卷积层，并且其输出是大小为32*32的特征图。这里，增加自适应卷积层的目的仅仅是为了固定编码器的输出大小，即使得本披露的编码器总出输出固定大小的特征图，例如前述的32*32的特征图。基于此，本领域技术人员可以理解本发明的自适应卷积层是可选的设置，并且在其他的一些应用场景中，可以不使用或由另一卷积层来代替。进一步，本发明的神经网络中的卷积核大小均可以是3*3的阵列，并可以采用均匀分布来初始化。

结合图7和图8所示内容，本领域技术人员可以理解本发明的第一神经网络单元中的多个编码器中的多个卷积层串行连接，并且串行连接的最后一个卷积层的输出端连接至第一神经网络单元的特征提取器(即图7中的特征提取器705)的输入端。就图8所示的卷积层结构来说，编码器中的自适应卷积层803的输出端连接至特征提取器的输入端，以便由特征提取器对多个向量数据执行数据拼接操作来获取目标向量数据。

参考图7所示出的特征提取器705，其对例如上述的四种特征向量执行特征融合操作(也即图中中间虚线框中的操作)。具体地，首先对特征向量701-1、特征向量702-1、特征向量703-1以及特征向量704-1分别进行一次卷积获得各自的卷积结果，再将每个特征向量的卷积结果进行融合(例如拼接)来获取目标向量数据706。例如将特征向量702-1、特征向量703-1以及特征向量704-1各自的卷积结果与特征向量701-1的卷积结果进行拼接获得特征向量701-2。类似地，将特征向量701-1、特征向量703-1以及特征向量704-1各自的卷积结果与特征向量702-1的卷积结果进行拼接获得特征向量702-2。由此，还可以获得特征向量703-2、特征向量704-2。接着，对于特征向量701-2、特征向量702-2、特征向量703-2以及特征向量704-2再执行多次(例如两次)前述操作可以获得特征向量701-10、特征向量702-10、特征向量703-10以及特征向量704-10，并且将其拼接形成目标向量数据706。

在一个实施场景中，上述卷积采用的卷积核的大小可以是3*3、1*1(与其本身卷积时)，卷积次数可以是三次，本发明对此不作限制。此外，目标向量数据的维数也可以根据需求设定，本发明也不作限制。例如，本发明中获得的目标向量数据是1024维，并且该目标向量数据是病人一次CT图像数据。在应用于病灶区图像分析的场景中，通常可以分别采集病人不同时期的多个CT图像，并且基于上述第一神经网络单元描述的操作，从而获得不同时期下的多个目标向量数据，以作为第二神经网络单元的输入端，例如图9所示。

图9是示出根据本发明多个实施例的第一神经网络单元和第二神经网络单元的操作框图。图中最左侧表示采集到病人在Tn个时期下的图像数据(例如CT1图像数据、CT2图像数据以及CTn图像数据)，第一神经网络单元102分别接收前述图像数据并对其进行处理，从而分别获取到T1时刻的目标向量数据901、T2时刻的目标向量数据902以及T刻时期的目标向量数据910。接着，第二神经网络单元103接收获取到多个目标向量数据，并对其处理最终获得病灶区域的评估结果。在一个实施例中，第二神经网络单元可以是长短期记忆神经网络(Long Short-Term Memory，“LSTM”)，例如图10所示。

图10是示出根据本发明多个实施例的第二神经网络单元的操作原理图。如上所述，本发明的第二神经网络单元在一个实施场景中可以实现为LSTM神经网络，并且该LSTM神经网络中可以包括输入层、一个或多个隐藏层以及输出层。

如图10中所示，代表患者CT_t时期、CT_t-1时期以及CT_t+1时期的图像数据，经过第一神经网络单元特征融合，分别获得目标向量数据X_t、目标向量数据X_t-1以及目标向量数据X_t+1。LSTM神经网络以目标向量数据X_t、目标向量数据X_t-1以及目标向量数据X_t+1作为输入，并利用目标向量数据X_t和前一时刻病人第t-1次CT的记忆S_t-1来计算当前时刻病人第t次CT的记忆S_t。类似地，可以基于病人第t次CT的记忆S_t计算病人第t+1次CT的记忆S_t+1。在一个实施场景中，可以多次重复前述操作(例如调整输入层到隐藏层的权重U、隐藏层到输出层的权重V以及上一时刻隐藏层到当前时刻隐藏层的权重W)并完成计算所有时刻下的记忆，最终获取输出Ot，该Ot即为评估结果。通常情况下，前述评估结果可以表示为质量(例如病灶区域的质量)以及体积比(病灶区域与整个图像的体积比)。通过分析该评估结果，可以确定图像数据中的目标特征随时间发展的情形。例如，当该图像数据是包含病灶区域的图像数据时，可以对该病灶区的发展进行评估和预测。

尽管上文没有提及本发明的神经网络单元的训练过程，但基于本发明公开的内容，本领域技术人员可以理解本发明的神经网络单元可以通过训练数据来进行训练，从而获得具有高精度的神经网络单元。例如，在神经网络训练的前向传播过程中，本发明可以利用通过结合图2-图6所获得的包括几何特征的图像数据来对本发明的神经网络单元进行训练，并且将训练结果与预期的结果(或称真实值)进行比较以获得相应的损失函数。进一步，在神经网络训练的反向传播过程中，本发明利用获得的损失函数并基于例如梯度下降算法来对权重(例如图10中的权重U、V以及W)进行更新，以减小输出Ot与真实值的误差。

结合上述描述，利用本发明实施例的图像评估***，可以通过第一神经网络单元对图像数据进行特征融合来获取目标向量数据，第二神经网络单元对目标向量数据处理获得图像的评估结果。例如，可以将病人的CT图像输入本发明图像评估***，由此直接获得病人的病灶区域的评估结果(例如质量和体积比)。通过对该质量或者体积比对病人的病情以及病灶区域的发展趋势进行预测，以便人工干预。

图11是示出根据本发明多个实施例的用于基于神经网络模型对图像进行评估的计算设备的方框图。如图11所示，计算设备1100可以包括中央处理单元(“CPU”)其可以是通用CPU、专用CPU或者其他信息处理以及程序运行的执行单元。进一步，计算设备1100还可以包括大容量存储器1112和只读存储器(“ROM”)1113，其中大容量存储器1112可以配置用于存储各类数据，例如包括各种与病灶区域相关的图像数据、算法数据、中间结果和运行计算设备1100所需要的各种程序。只读存储器1113可以配置成存储对于计算设备1100的加电自检、***中各功能模块的初始化、***的基本输入/输出的驱动程序及引导操作***所需的数据。

可选地，计算设备1100还可以包括其他的硬件平台或组件，例如示出的TPU(张量处理单元)1114、GPU(图形处理单元或图形处理器)1115、FPGA(现场可编程门阵列)1116和MLU(机器学***台或组件，但这里仅仅是示例性的而非限制性的，本领域技术人员可以根据实际需要增加或移除相应的硬件。例如，计算设备1100可以仅包括CPU来实现本发明的图像评估***。

本发明的计算设备1100还包括通信接口1118，从而可以通过该通信接口1118连接到局域网/无线局域网(LAN/WLAN)1105，进而可以通过LAN/WLAN连接到本地服务器1106或连接到因特网(“Internet”)1107。替代地或附加地，本发明的计算设备1100还可以通过通信接口1118基于无线通信技术直接连接到因特网或蜂窝网络，例如基于第3代(“3G”)、第4代(“4G”)或第5代(“5G”)的无线通信技术。在一些应用场景中，本发明的计算设备1100还可以根据需要访问外部网络的服务器1108以及数据库1109，以便获得各种已知的图像模型、数据和模块，并且可以远程地存储各种数据，例如用于呈现病灶区域图像的各类数据。

计算设备1100的***设备可以包括显示装置1102、输入装置1103以及数据传输接口1104。在一个实施例中，显示装置1102可以例如包括一个或多个扬声器和/或一个或多个视觉显示器，其配置用于对本发明的显示病灶区域图像的运算过程或者最终结果进行语音提示和/或图像视频显示。输入装置1103可以包括例如键盘、鼠标、麦克风、姿势捕捉相机等其他输入按钮或控件，其配置用于接收病灶区域图像数据的输入和/或用户指令。数据传输接口1104可以包括例如串行接口、并行接口或通用串行总线接口(“USB”)、小型计算机***接口(“SCSI”)、串行ATA、火线(“FireWire”)、PCI Express和高清多媒体接口(“HDMI”)等，其配置用于与其他设备或***的数据传输和交互。根据本发明的方案，该数据传输接口1104可以接收来自于CT设备的病灶区域图像或病灶区域图像数据，并且向计算设备1100传送包括病灶区域的图像数据或各种其他类型的数据、结果。

本发明的计算设备1100的上述CPU 1111、大容量存储器1112、只读存储器ROM1113、TPU 1114、GPU 1115、FPGA 1116、MLU 1117和通信接口1118可以通过总线1119相互连接，并且通过该总线与***设备实现数据交互。在一个实施例中，通过该总线1119，CPU1111可以控制计算设备1100中的其他硬件组件及其***设备。

以上结合图11描述了可以用于执行本发明的图像评估***的计算设备。需要理解的是这里的计算设备结构仅仅是示例性的，本发明的实现方式和实现实体并不受其限制，而是可以在不偏离本发明的精神下做出改变。

还应当理解，本发明示例的执行指令的任何模块、单元、组件、服务器、计算机、终端或设备可以包括或以其他方式访问计算机可读介质，诸如存储介质、计算机存储介质或数据存储设备(可移除的)和/或不可移动的)例如磁盘、光盘或磁带。计算机存储介质可以包括以用于存储信息的任何方法或技术实现的易失性和非易失性，可移动和不可移动介质，例如计算机可读指令、数据结构、程序模块或其他数据。

应当理解，本发明的权利要求、说明书及附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象，而不是用于描述特定顺序。本发明的说明书和权利要求书中使用的术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解，在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的，而并不意在限定本发明。如在本发明说明书和权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。还应当进一步理解，在本发明说明书和权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

如在本说明书和权利要求书中所使用的那样，术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地，短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。

虽然本发明的实施方式如上，但所述内容只是为便于理解本发明而采用的实施例，并非用以限定本发明的范围和应用场景。任何本发明所述技术领域内的技术人员，在不脱离本发明所揭露的精神和范围的前提下，可以在实施的形式上及细节上作任何的修改与变化，但本发明的专利保护范围，仍须以所附的权利要求书所界定的范围为准。

Claims

1.一种基于神经网络模型的图像评估***，包括：

一个或多个处理器；

第一神经网络单元；

第二神经网络单元；以及

一个或多个计算机可读存储介质，其存储有实现所述第一神经网络单元和第二神经网络单元的程序指令，当所述程序指令由所述一个或多个处理器执行时，使得：

第一神经网络单元接收并处理图像数据，以获得目标向量数据，其中所述图像数据包含与目标图像区域的几何特征相关的张量数据；以及

第二神经网络单元接收并且处理所述目标向量数据，以输出用于评估所述目标图像区域的评估结果，所述评估结果表示为病灶区域的质量以及体积比；

其中所述第一神经网络单元包括多个编码器和特征提取器；所述第二神经网络单元包括长短期记忆神经网络；

其中所述张量数据包括三维张量数据，并且所述一个或多个计算机可读存储介质还存储有获得所述三维张量数据的程序指令，当所述程序指令由所述一个或多个处理器执行时，使得：

基于所述图像数据来生成四面体网格；以及

利用所述四面体网格来确定几何特征，并且将所述几何特征表示为三维张量数据。

2.根据权利要求1所述的图像评估***，其中：

所述多个编码器中的每个编码器包括多个卷积层，其配置用于对所述图像数据进行多层卷积处理，以从所述图像数据获得针对于不同几何特征的多个特征向量；以及

所述特征提取器，其配置成对所述多个特征向量执行特征融合操作，以获得所述目标向量数据。

3.根据权利要求2所述的图像评估***，其中所述多个卷积层串行连接，并且串行连接的最后一个卷积层的输出端连接到所述特征提取器的输入端。

4.根据权利要求2所述的图像评估***，其中所述特征融合操作包括对所述多个特征向量执行数据拼接操作，以便输出所述目标向量数据。

5.根据权利要求1-4的任意一项所述的图像评估***，其中所述目标图像区域是与生命个体的病灶区域相关的图像区域。

6.根据权利要求1所述的图像评估***，其中所述几何特征包括里奇曲率、梯度或者平均曲率。

7.一种计算设备，其包括根据权利要求1-6的任意一项所述的基于神经网络模型的图像评估***。

8.一种计算机可读存储介质，其包括用于基于神经网络模型对图像进行评估的计算机程序，当所述计算机程序由设备的一个或多个处理器执行时，使得所述设备执行根据权利要求1-6中任意一项所述的图像评估***的操作。