CN115457020B

CN115457020B - 一种融合残差图像信息的2d医学图像配准方法

Info

Publication number: CN115457020B
Application number: CN202211201681.9A
Authority: CN
Inventors: 丁熠; 卜君健; 曹明生; 邓伏虎; 赵洋; 周尔强; 秦臻
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2022-09-29
Filing date: 2022-09-29
Publication date: 2023-12-26
Anticipated expiration: 2042-09-29
Also published as: CN115457020A

Abstract

本发明公开了一种融合残差图像信息的2D医学图像配准方法，涉及医学图像技术领域，包括：构建医学图像配准模型；模型训练；模型在图像配准的应用。本发明在计算MSE相似度时引入残差图像，有效融合局部像素信息，解决了像素失位和变形折叠的问题；基于卷积神经网络的局部性和Vision Transformer中多头注意力机制的全局性，设计了一个基础地配准网络，并在该基础配准网络中创新性地使用了融合残差图像信息的跳跃连接，解决了MSE仅对像素值计算，无法准确找到像素之间特征匹配的问题，并有效提高了配准模型的泛化性能；提出了多分辨率渐进配准策略，提高了配准的准确性，在变形过程中增强了拓扑保持性。

Description

一种融合残差图像信息的2D医学图像配准方法

技术领域

本发明涉及医学图像技术领域，具体而言，涉及一种融合残差图像信息的2D医学图像配准方法。

背景技术

图像配准在医学图像处理与分析中有众多具有实用价值的应用。随着医学成像设备的进步，对于同一患者，可以采集含有准确解剖信息的图像诸如CT，MRI；同时，也可以采集到含有功能信息的图像诸如SPECT。然而，通过观察不同的图像进行诊断需要凭着空间想象和医生的主观经验。采用正确的图像配准方法则可以将多种多样的信息准确地融合到同一图像中，使医生更方便更精确地从各个角度观察病灶和结构。同时，通过对不同时刻采集的动态图像的配准，可以定量分析病灶和器官的变化情况，使得医疗诊断、制定手术计划、放射治疗计划更准确可靠。

1.传统的迭代优化算法

传统的配准算法如demons、SyN。

Demons将需要对齐的图像轮廓视为一种扩散模型，针对轮廓上的每一个像素点施加一个恶魔力(demon force)，每个轮廓点受恶魔力的作用下进行位移扩散。每个点的恶魔力根据图像周围像素的数值梯度计算得到，缺点在于对齐的像素之间缺少图像语义特征的匹配。

SyN方法扩展了Avants等人描述的拉格朗日二型配准技术(2006a)。这种新的公式具有配准两个图像I和J所需的对称属性，在差异转换的空间中，无论选择的相似性度量如何，都可以保证对称性。对称的微分同胚映射保证了两种配准中固有的属性：1)从i到j的配准与从j到i的配准在计算时应不受相似性度量或优化参数的影响2)图像配准需要对称性，并使配准结果不受人为意志的影响，即决定两张图像为“固定图像”或“移动图像”的输入顺序。是目前传统方法中的最好的方法，但缺点在于过分强调了配准过程中的对称性，有时无法同时保证配准准确性。

传统方法中都存在的一个共有缺点是：传统的配准方法通过对齐具有相似外观的体素，同时对配准映射实施约束，解决了每个体积对的优化问题，但求解成对优化可能是计算密集型的，因此在实践中很慢。例如，在CPU上运行的最先进的算法可能需要数十分钟到数小时才能注册一对高精度扫描。

2.现有的基于深度学习的方法

为了提高图像配准效率，许多基于深度学习的配准方法被提出。根据网络的训练方式，可以将这些方法归类为有监督的学习和无监督学习。

在有监督的方法中，需要变形场真值或解剖学真值标签，模型根据输入的图像对，以变形场真值标签作为优化目标提取特征。Sokooti等提出了一种卷积神经元网络(CNN)，以直接依赖人工生成的位移矢量场来直接估计变形场。Cao等已经开发了一种可变形的模态间图像配准方法，该方法使用同一模态内相似性监督的深神经网络估算了跨模态图像间配准的变形场。这些方法的缺点在于这些方法的配准性能在很大程度上取决于通常在临床情况下很难获得的变形场真值。

至于无监督的方法，它们不需要变形场的真值，模型根据输入的图像对，以最小化图像的差异性作为优化的目标。Balakrishnan等提出了一个3D医疗图像注册模型VoxelMorph，该模型使用具有空间变换层的CNN重建注册结果。Zhao等已经设计了一种卷积神经网络(VTN)，包括级联的子网，以递归改善配准性能。Kim等已经提出了一种称为Cyclemorph的循环一致的可变形图像而批准方法，该方法可以通过将循环一致性损失引入网络来改善拓扑保持性，增强配准性能。缺点在于，这些方法尽管都在改善拓扑保持性，但这些方法依然难以保证配准过程中图像拓扑结构的保留，这通常会导致结构信息丢失导致配准不正确。

现有问题的总结：

1)用于2D图像配准时效果不佳，配准准确性低，拓扑保持性差。传统方法在配准时效率低，且用于2D图像时效果不稳定。现有的深度学习算法配准算法大多专注于解决3D图像配准问题，用于2D图像配准时效果不佳。

2)配准过程中存在像素失位和变形折叠的问题。现有的方法以最小化图像对本身的相似性损失为主要优化目标，会导致2D图像像素间特征匹配关系的缺少和过度拟合训练集数据，带来像素失位和变形折叠的问题。

3)泛化性能有限。传统方法针对每一对输入图像单独进行迭代，但效率低下且配准效果无法保证。现有的深度学习方法对训练集所在数据集外的图像泛化性能不佳。

发明内容

本发明在于提供一种融合残差图像信息的2D医学图像配准方法，其能够缓解上述问题。

为了缓解上述的问题，本发明采取的技术方案如下：

本发明提供了一种融合残差图像信息的2D医学图像配准方法，包括以下步骤：

S100、构建医学图像配准模型，所述图像配准模型包括第一堆叠模块C1、第二堆叠模块C2、粗配准分支网络和精细配准分支网络，所述粗配准分支网络和精细配准分支网络均包括基于卷积神经网络、流预测网络和视觉转换器中的多头注意力网络构建的配准网络；

S200、选择若干数据对构成训练数据对集，每个数据对均包括一张待配准医学训练图像和一张参考医学训练图像，利用所述训练数据对集对所述医学图像配准模型进行若干次训练，每次训练过程使用一个没有用过的数据对，每一次训练过程具体包括以下步骤：

S210、从所述训练数据对集选择一数据对，根据所述第一堆叠模块C1、粗配准分支网络，以及当前选择的数据对的待配准医学训练图像I_moving1和参考医学训练图像I_fixed1，得到大位移变形场V_coarse和粗配准图像I_coarse；

S220、根据所述参考医学训练图像I_fixed1、粗配准图像I_coarse、第二堆叠模块C2、大位移变形场V_coarse、待配准医学训练图像I_moving1和精细配准分支网络，得到完整变形场V_full和最终配准后图像I_moved1；

S230、使用MSE计算所述粗配准图像I_coarse和参考医学训练图像I_fixed1之间的相似度损失L_mse1，使用多分辨率残差图像相似度金字塔模块，根据所述粗配准图像I_coarse和参考医学训练图像I_fixed1计算残差图像的相似度损失L_res1，使用L-2范数的平方作为大位移变形场V_coarse的平滑度正则化损失L_reg1，根据超参数、相似度损失L_mse1、相似度损失L_res1和交叉熵损失L_reg1，计算粗配准阶段总损失L_total1；

S240、使用MSE计算所述最终配准后图像I_moved1和参考医学训练图像I_fixed1之间的相似度损失L_mse2，使用多分辨率残差图像相似度金字塔模块，根据所述最终配准后图像I_moved1和参考医学训练图像I_fixed1计算残差图像的相似度损失L_res2，使用L-2范数的平方作为完整变形场V_full的平滑度正则化损失L_reg2，根据超参数、相似度损失L_mse2、相似度损失L_res2和交叉熵损失L_reg2，计算细配准阶段总损失L_total2；

S250、利用粗配准阶段总损失L_total1，计算所述粗配准分支网络中各神经元的梯度，并进行梯度回传，更新网络参数；

S260、利用细配准阶段总损失L_total2，计算所述医学图像配准模型中的各神经元计算梯度，并进行梯度回传，更新网络参数，完成所述医学图像配准模型的当前次训练；

S300、将待配准医学图像I_moving2和参考医学图像I_fixed2输入训练好的所述医学图像配准模型，输出得到配准后的图像I_moved2。

在本发明的一较佳实施方式中，步骤S210具体包括以下步骤：

S211、将待配准医学训练图像I_moving1和参考医学训练图像I_fixed1通过第一堆叠模块C1进行堆叠；

S212、将步骤S211中堆叠后的图像输入所述粗配准分支网络，输出得到大位移变形场V_coarse和粗配准图像I_coarse。

在本发明的一较佳实施方式中，步骤S212中，通过所述粗配准分支网络获取大位移变形场V_coarse和粗配准图像I_coarse的方法包括：

对步骤S211中堆叠后的图像进行下采样，得到图像I₁；

将图像I₁输入配准网络，输出得到大位移变形场V；

对大位移变形场V进行上采样以及和上采样同倍率的数值放大后得到大位移变形场V_coarse；

使用大位移变形场V_coarse通过STN模块将待配准医学训练图像I_moving1变形为粗配准图像I_coarse。

在本发明的一较佳实施方式中，步骤S220具体包括以下步骤：

S221、将粗配准图像I_coarse和参考医学训练图像I_fixed1通过第二堆叠模块C2进行堆叠；

S222、将大位移变形场V_coarse、待配准医学训练图像I_moving1和步骤S221中堆叠后的图像输入所述精细配准分支网络，输出得到完整变形场V_full和最终配准后图像I_moved1。

在本发明的一较佳实施方式中，步骤S222中，通过所述精细配准分支网络获取完整变形场V_full和最终配准后图像I_moved1的方法包括：

将步骤S221中堆叠后的图像输入配准网络，输出得到精细变形场V_fine；

将大位移变形场V_coarse和精细变形场V_fine进行组合后得到完整变形场V_full；

使用完整变形场V_full通过STN模块将待配准医学训练图像I_moving1变形为最终配准后图像I_moved1。

在本发明的一较佳实施方式中，所述配准网络通过堆叠后的图像获取变形场的方法包括：

通过卷积补丁嵌入层提取堆叠后的图像I^input的局部特征信息；

对局部特征信息使用可学习的位置编码进行位置嵌入；

将位置嵌入后的局部特征信息输入多头注意力网络，进行全局特征的匹配，输出得到特征矩阵；

将多头注意力网络输出的特征矩阵进行卷积上采样；

对堆叠后的图像I^input依次进行下采样和上采样，得到图像

将图像与原图像I^input计算残差得到残差图像/>

通过卷积块利用残差图像得到概率值掩码；

将卷积上采样后的特征矩阵与概率值掩码相乘，得到新矩阵；

利用流预测网络，根据新矩阵得到变形场。

在本发明的一较佳实施方式中，当获取到待配准医学图像I_moving2中感兴趣区域的待配准真值后，可通过使用配准网络输出得到的变形场，利用STN模块作用于待配准真值，得到待配准医学图像I_moving2中感兴趣区域的配准真值，所述待配准真值为待配准医学图像I_moving2中感兴趣区域的真值标签。

在本发明的一较佳实施方式中，步骤S230中，粗配准阶段总损失L_total1和细配准阶段总损失L_total2的计算公式分别如下：

L_total1＝αL_mse1+βL_reg1+γL_res1

L_total2＝αL_mse2+βL_reg2+γL_res2

其中，α,β,γ是超参数，用于调节各项损失的比重。

在本发明的一较佳实施方式中，在训练过程中，采用多分辨率残差图像相似度金字塔模块计算残差图像的相似度损失的公式如下：

其中，L_res为残差图像的相似度损失，i表示金字塔层级号，K为金字塔总层数，F_i为金字塔第i层输入的参考医学图像，F_i ^r为对F_i依次进行下采样和上采样后得到的图像，M_i为金字塔第i层输入的待配准图像，为对M_i依次进行下采样和上采样后得到的图像；对于金字塔第一层后面的层级，其输入的图像，为金字塔上一层级下采样后得到的图像。

与现有技术相比，本发明的有益效果是：

针对3D配准常用的NCC、NMI相似性度量在2D图像上表现不佳，且在2D图像上表现最好的MSE度量无法准确匹配图像对之间像素特征，导致像素失位和变形折叠的问题，本发明提出了残差图像金字塔模块，在计算MSE相似度时引入残差图像，有效融合局部像素信息，解决了像素失位和变形折叠的问题；

本发明利用卷积神经网络的局部性和Vision Transformer(视觉转换器，以下简记为ViT)中多头注意力机制的全局性，设计了一个基础地配准网络，并在该基础配准网络中创新性地使用了融合残差图像信息的跳跃连接(图4中的虚线框内的操作过程)，解决了MSE仅对像素值计算，无法准确找到像素之间特征匹配的问题，并有效提高了配准模型的泛化性能；

针对现有图像配准方法用于2D图像配准时效果不佳，配准准确性低，拓扑保持性差，本发明提出了多分辨率渐进配准策略，先针对粗分辨率图像进行粗配准预测大位移场，粗配准有利于后续阶段可以集中于解决输入图像对之间的复杂错位，从而降低了后续高阶段问题的复杂性，再在粗配准后的全分辨率图像与参考图像上预测精细的小位移场，最后将大位移场与小位移场叠形成完整的位移场，提高了配准的准确性，在变形过程中增强了拓扑保持性。

为使本发明的上述目的、特征和优点能更明显易懂，下文特举本发明实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1是本发明所述医学图像配准方法的总流程图；

图2是本发明所述医学图像配准模型每一次训练的流程图；

图3是本发明所述医学图像配准模型的架构示意图；

图4是本发明所述配准网络的架构及延伸示意图；

图5是本发明所述多分辨率残差图像相似度金字塔模块的结构实例图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。

因此，以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参照图1、2、3，本发明公开了一种融合残差图像信息的2D医学图像配准方法，基本思想是针对图像配准任务，从一张待配准图像向一张参考图像配准，使用深度神经网络去拟合求解使待配准图像向参考图像对齐的变形场的优化函数。

本发明的方法是一种基于学习的无监督2D医学图像非刚性配准模型，基于学习意味着模型需要先经过在一定量数据集(例如斯坦福EchoNet超声心动图数据集、CAMUS心脏超声数据集、ACDC心脏核磁数据集这三个数据集)上训练的过程，无监督意味着本方法在训练过程不需要变形场的真值作监督。

本发明包括以下步骤：

S100、构建医学图像配准模型，图像配准模型包括第一堆叠模块C1、第二堆叠模块C2、粗配准分支网络和精细配准分支网络，粗配准分支网络和精细配准分支网络均包括基于卷积神经网络、流预测网络和视觉转换器中的多头注意力网络构建的配准网络。其中，流预测网络由一个卷积块构成。

本发明利用卷积神经网络的局部性和ViT的全局性设计配准网络，并利用由粗到细的两阶段配准策略设计了整个医学图像配准模型，以提高配准的准确性并在变形过程中增强拓扑保持性。构建的医学图像配准模型架构如图3所示。图4中的虚线框内的结构，以及卷积补丁嵌入到流预测模块构成了配准网络。

S200、选择若干数据对构成训练数据对集，每个数据对均包括一张待配准医学训练图像和一张参考医学训练图像，利用训练数据对集对医学图像配准模型进行若干次训练，每次训练过程使用一个没有用过的数据对，每一次训练过程如图2所示，具体包括以下步骤：

S210、从训练数据对集选择一数据对，根据第一堆叠模块C1、粗配准分支网络，以及当前选择的数据对的待配准医学训练图像I_moving1和参考医学训练图像I_fixed1，得到大位移变形场V_coarse和粗配准图像I_coarse，具体过程包括：

S211、将待配准医学训练图像I_moving1和参考医学训练图像I_fixed1通过第一堆叠模块C1进行堆叠。

S212、将步骤S211中堆叠后的图像输入粗配准分支网络，输出得到大位移变形场V_coarse和粗配准图像I_coarse，具体为：

对步骤S211中堆叠后的图像进行下采样，得到图像I₁；

将图像I₁输入配准网络，输出得到大位移变形场V；

对大位移变形场V进行上采样以及和上采样同倍率数值放大后得到大位移变形场V_coarse；

使用大位移变形场V_coarse通过STN模块(空间变形模块，用于将变形场应用到图像上对图像进行扭曲)将待配准医学训练图像I_moving1变形为粗配准图像I_coarse(图3中的Coarse Moved)。

在本发明中，如图3、4所示，配准网络通过堆叠后的图像I₁获取大位移变形场V的方法具体为包括：

通过卷积补丁嵌入层提取堆叠后的图像I₁的局部特征信息；

对局部特征信息使用可学习的位置编码进行位置嵌入；

将多头注意力网络输出的特征矩阵进行卷积上采样；

对堆叠后的图像I₁依次进行下采样和上采样，得到图像

将图像与原图像I₁计算残差得到残差图像/>

通过卷积块利用残差图像得到概率值掩码，即图4中的logit mask；

利用流预测网络，根据新矩阵得到大位移变形场V。

S220、根据参考医学训练图像I_fixed1、粗配准图像I_coarse、第二堆叠模块C2、大位移变形场V_coarse、待配准医学训练图像I_moving1和精细配准分支网络，得到完整变形场V_full和最终配准后图像I_moved1，具体过程包括：

S221、将粗配准图像I_coarse和参考医学训练图像I_fixed1通过第二堆叠模块C2进行堆叠。

S222、将大位移变形场V_coarse、待配准医学训练图像I_moving1和步骤S221中堆叠后的图像输入精细配准分支网络，输出得到完整变形场V_full和最终配准后图像I_moved1，具体为：

将大位移变形场V_coarse和精细变形场V_fine进行组合后得到完整变形场V_full，计算公式为

其中，⊙被定义为STN模块进行的翘曲操作；

在本发明中，如图3、4所示，配准网络通过步骤S221中堆叠后的图像获取精细变形场V_fine的方法具体为包括：

通过卷积补丁嵌入层提取步骤S221中堆叠后的图像的局部特征信息；

对局部特征信息使用可学习的位置编码进行位置嵌入；

将多头注意力网络输出的特征矩阵进行卷积上采样；

对步骤S221中堆叠后的图像依次进行下采样和上采样，得到图像

将图像与原步骤S221中堆叠后的图像计算残差得到残差图像/>

将卷积上采样后的特征矩阵(恢复大小后的特征矩阵)与概率值掩码相乘，得到新矩阵；

利用流预测网络，根据新矩阵得到精细变形场V_fine。

S230、使用MSE计算粗配准图像I_coarse和参考医学训练图像I_fixed1之间的相似度损失L_mse1，使用多分辨率残差图像相似度金字塔模块，根据粗配准图像I_coarse和参考医学训练图像I_fixed1计算残差图像的相似度损失L_res1，使用L-2范数的平方作为大位移变形场V_coarse的平滑度正则化损失L_reg1，根据超参数、相似度损失L_mse1、相似度损失L_res1和交叉熵损失L_reg1，计算粗配准阶段总损失L_total1，计算公式如下：

L_total1＝αL_mse1+βL_reg1+γL_res1

其中，α,β,γ是根据人工经验手动调参，多次尝试找到最适合的超参数，用于调节各项损失的比重。

S240、使用MSE计算最终配准后图像I_moved1和参考医学训练图像I_fixed1之间的相似度损失L_mse2，使用多分辨率残差图像相似度金字塔模块，根据最终配准后图像I_moved1和参考医学训练图像I_fixed1计算残差图像的相似度损失L_res2，使用L-2范数的平方作为完整变形场V_full的平滑度正则化损失L_reg2，根据超参数、相似度损失L_mse2、相似度损失L_res2和交叉熵损失L_reg2，在本发明中，计算细配准阶段总损失L_total2，计算公式如下：

L_total2＝αL_mse2+βL_reg2+γL_res2

其中，α,β,γ是超参数，用于调节各项损失的比重。

在本发明中，下采样和上采样均采用二次线性插值实现，均使用了0.5的下采样比率和2的上采样比率。上采样恢复原分辨率后的每个像素聚合了临近像素的信息，使得目标模型能更关注图像对的残差纹理信息，并消除图像对之间可能存在的亮度差异。

在本发明中，将残差图像引入MSE相似度的计算对求解的目标模型施加了一个隐式正则化，防止模型在训练集上的过拟合，增强模型的泛化性。

在步骤S230和S240中，采用多分辨率残差图像相似度金字塔模块计算残差图像的相似度损失的方法相同，如以下公式所示：

步骤S230中，粗配准图像I_coarse即为M₁，为待配准图像对应的金字塔的第一层的输入图像，参考医学训练图像I_fixed1即为F₁，为参考图像对应的金字塔的第一层的输入图像。

步骤S240中，最终配准后图像I_moved1即为M₁，为待配准图像对应的金字塔的第一层的输入图像，参考医学训练图像I_fixed1即为F₁，为参考图像对应的金字塔的第一层的输入图像。

在图5中示出的多分辨率残差图像相似度金字塔模块为3层，即金字塔总层数K＝3，以此类推，根据实际精度需要，还可有更多层级。

S250、利用粗配准阶段总损失L_total1，计算对粗配准分支网络中各神经元的梯度，进行梯度回传，更新网络参数；

S260、利用细配准阶段总损失L_total2对整个医学图像配准模型网络中的各神经元计算梯度，进行梯度回传，更新网络参数，完成医学图像配准模型的训练；

S250、利用粗配准阶段总损失L_total1，计算粗配准分支网络中各神经元的梯度，并进行梯度回传，更新网络参数，具体过程如下：

在粗配准阶段，将我们的粗配准分支网络抽象为表达式：

I_coarse＝f_coarse(concat(I_moving1,I_fixed1))，

其中，f_coarse函数代表了粗配准分支的作用，包含了其中各模块包含的各个卷积层、全连接层中包含的可训练参数，concat即附图3中的C1堆叠模块。

粗配准分支网络中各参数的梯度如表达式所示：

其中代表了f_coarse中的可训练参数，然后我们使用Adam优化器更新网络的参数：/>

S260、利用细配准阶段总损失L_total2，计算医学图像配准模型中的各神经元计算梯度，并进行梯度回传，更新网络参数，完成医学图像配准模型的当前次训练，具体如下：

在细配准阶段，将我们的细配准分支网络抽象为表达式：

I_moved1＝f_fine(concat(I_coarse,I_fixed1))，

其中f_fine函数代表了细配准分支的作用，包含了其中各模块包含的各个卷积层、全连接层中包含的可训练参数，此处concat即附图3中的C2堆叠模块。

细配准分支网络中各参数的梯度如表达式所示：

其中代表了f_fine中的可训练参数。

由于I_coarse由粗配准分支得到，我们可进一步得到粗配准分支中各参数的梯度如表达式所示：

其中代表了f_coarse中的可训练参数，

然后我们使用Adam优化器更新网络的参数：

S300、将待配准医学图像I_moving2和参考医学训练图像I_fixed2输入训练好的所述医学图像配准模型，输出得到配准后的图像I_moved2以及中间结果完整变形场V_full2。

在本发明中，请参照图4，当获取到待配准医学图像I_moving2中感兴趣区域的待配准真值后，可通过使用配准网络输出得到的变形场，利用STN模块作用于待配准真值，得到待配准医学图像I_moving2中感兴趣区域的配准真值，待配准真值为待配准医学图像I_moving2中感兴趣区域的真值标签。

本发明训练得到的医学图像配准模型，在斯坦福EchoNet超声心动图数据集、CAMUS心脏超声数据集、ACDC心脏核磁数据集这三个数据集上进行的实验表明，本发明方法在2D医学图像配准准确性、鲁棒性和泛化性方面，优于现有的基于学习的配准方法，并保留了基于学习的方法的运行时优势。与现有技术相比，具有的优势是：

1)是首个针对2D图像的2D图像专用深度学习配准算法，使用了由粗配准到精细配准的配准策略，展现了不错的配准效果；

2)结合CNN的局部性和ViT的全局性创新性地设计了一个基础的配准网络，同时创新性的加入了融合残差图像的跳跃连接，有效减少变形折叠问题并提高了配准的泛化性；

3)创新性地提出了残差图像金字塔相似度模块，有效解决了MSE度量在2D图像上像素之间缺少特征匹配关系的问题。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种融合残差图像信息的2D医学图像配准方法，其特征在于，包括以下步骤：

S300、将待配准医学图像I_moving2和参考医学训练图像I_fixed2输入训练好的所述医学图像配准模型，输出得到配准后的图像I_moved2；

采用多分辨率残差图像相似度金字塔模块计算残差图像的相似度损失的公式如下：

2.根据权利要求1所述的方法，其特征在于，步骤S210具体包括以下步骤：

3.根据权利要求2所述的方法，其特征在于，步骤S212中，通过所述粗配准分支网络获取大位移变形场V_coarse和粗配准图像I_coarse的方法包括：

对步骤S211中堆叠后的图像进行下采样，得到图像I₁；

将图像I₁输入配准网络，输出得到大位移变形场V；

4.根据权利要求3所述的方法，其特征在于，步骤S220具体包括以下步骤：

5.根据权利要求4所述的方法，其特征在于，步骤S222中，通过所述精细配准分支网络获取完整变形场V_full和最终配准后图像I_moved1的方法包括：

6.根据权利要求5所述的方法，其特征在于，所述配准网络通过堆叠后的图像获取变形场的方法包括：

对局部特征信息使用可学习的位置编码进行位置嵌入；

将多头注意力网络输出的特征矩阵进行卷积上采样；

对堆叠后的图像I^input依次进行下采样和上采样，得到图像

将图像与原图像I^input计算残差得到残差图像/>

通过卷积块利用残差图像得到概率值掩码；

利用流预测网络，根据新矩阵得到变形场。

7.根据权利要求6所述的方法，其特征在于，当获取到待配准医学图像I_moving2中感兴趣区域的待配准真值后，可通过使用配准网络输出得到的变形场，利用STN模块作用于待配准真值，得到待配准医学图像I_moving2中感兴趣区域的配准真值，待配准真值为待配准医学图像I_moving2中感兴趣区域的真值标签。

8.根据权利要求6所述的方法，其特征在于，步骤S230中，粗配准阶段总损失L_total1和细配准阶段总损失L_total2的计算公式分别如下：

L_total1＝αL_mse1+βL_reg1+γL_res1

L_total2＝αL_mse2+βL_reg2+γL_res2

其中，α,β,γ是超参数，用于调节各项损失的比重。