CN114283151A - 用于医学图像的图像处理方法、装置、设备及存储介质 - Google Patents
用于医学图像的图像处理方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN114283151A CN114283151A CN202110938701.XA CN202110938701A CN114283151A CN 114283151 A CN114283151 A CN 114283151A CN 202110938701 A CN202110938701 A CN 202110938701A CN 114283151 A CN114283151 A CN 114283151A
- Authority
- CN
- China
- Prior art keywords
- image
- sample
- network
- image processing
- decoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/7715—Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
- G06V10/454—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/776—Validation; Performance evaluation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/03—Recognition of patterns in medical or anatomical images
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Biodiversity & Conservation Biology (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
- Image Processing (AREA)
Abstract
本申请关于一种用于医学图像的图像处理方法、装置、设备及存储介质,涉及医疗技术领域。该方法包括:调用第一编码网络对目标医学对象的第一模态的样本医学图像进行编码,获得第一特征图;调用解码网络,基于第一特征图获得用以指示预测出的至少一个指定类型区域的预测分割图像;调用生成网络基于第一特征图生成第二模态的预测生成图像;基于预测分割图像与标签图像之间的差异,预测生成图像与目标医学对象的第二模态的样本医学图像之间的差异,对图像处理模型进行训练。通过上述方法,使得训练获得图像处理模型能够基于单一模态的医学图像,获取到多模态的医学图像的特征,进而获得较为全面的医学图像分割结果,提高了对医学图像的分割效果。
Description
技术领域
本申请涉及医疗技术领域,特别涉及用于医学图像的图像处理方法、装置、设备及存储介质。
背景技术
在医疗领域,通过医学成像技术进行医学图像分割已成为辅助医生进行病例判断的常用技术。
在相关技术中,通常将医学图像输入到神经网络模型中,基于神经网络提取到的医学图像特征进行医学图像分割,从而获得医学图像分割结果。
然而,上述技术中的神经网络模型,其关注的医学图像特征往往与输入的医学图像的强表现性特征,对医学图像中弱表现性特性关注较少,使得获得的医学图像分割结果包含的信息不全面,使得医学图像分割效果较差。
发明内容
本申请实施例提供了一种用于医学图像的图像处理方法、装置、设备及存储介质,可以提高获得的图像处理效果。该技术方案如下:
一方面,提供了一种用于医学图像的图像处理方法,所述方法包括:
调用图像处理模型中的第一编码网络,对第一样本图像进行编码,获得所述第一样本图像对应的第一特征图;所述第一样本图像是目标医学对象的第一模态的样本医学图像;
调用所述图像处理模型中的解码网络,基于所述第一特征图进行解码,获得所述第一样本图像的预测分割图像;所述预测分割图像用以指示预测出的至少一个指定类型区域;
调用所述图像处理模型中的生成网络,基于所述第一特征图生成预测生成图像;所述预测生成图像是所述第一样本图像对应的第二模态的预测图像;
基于所述预测分割图像与标签图像之间的差异,所述预测生成图像与第二样本图像之间的差异,对所述图像处理模型进行训练;所述第二样本图像是所述目标医学对象的第二模态的样本医学图像;所述标签图像是所述目标医学对象对应的,用以指示至少一个指定类型区域的图像。
另一方面,提供了一种用于医学图像的图像处理装置,所述装置包括:
第一编码模块,用于调用图像处理模型中的第一编码网络,对第一样本图像进行编码,获得所述第一样本图像对应的第一特征图;所述第一样本图像是目标医学对象的第一模态的样本医学图像;
解码模块,用于调用所述图像处理模型中的解码网络,基于所述第一特征图进行解码,获得所述第一样本图像的预测分割图像;所述预测分割图像用以指示预测出的至少一个指定类型区域;
生成模块,用于调用所述图像处理模型中的生成网络,基于所述第一特征图生成预测生成图像;所述预测生成图像是所述第一样本图像对应的第二模态的预测图像;
模型训练模块,用于基于所述预测分割图像与所述标签图像之间的差异,所述预测生成图像与第二样本图像之间的差异,对所述图像处理模型进行训练;所述第二样本图像是所述目标医学对象的第二模态的样本医学图像;所述标签图像是所述目标医学对象对应的,用以指示至少一个指定类型区域的图像。
在一种可能的实现方式中,所述模型训练模块,包括:
第一确定子模块,用于基于所述预测分割图像与所述标签图像之间的差异,确定第一损失函数的函数值;
第二确定子模块,用于基于所述预测生成图像与所述第二样本图像之间的差异,确定第二损失函数的函数值;
模型训练子模块,用于基于所述第一损失函数的函数值,以及所述第二损失函数的函数值,对所述图像处理模型进行训练。
在一种可能的实现方式中,所述模型训练子模块,用于基于所述第一损失函数的函数值,对所述第一编码网络的参数以及所述解码网络的参数进行更新;
基于所述第二损失函数的函数值,对所述第一编码网络的参数以及所述生成网络的参数进行更新。
在一种可能的实现方式中,所述第一确定子模块,包括:
第一确定单元,用于基于所述预测分割图像与所述标签图像的相似性,确定所述第一损失函数的第一分支函数的函数值;
第二确定单元,用于基于所述预测分割图像中预测出的至少一个指定类型区域的位置,与所述标签图像中的至少一个指定类型区域的位置,确定所述第一损失函数的第二分支函数的函数值;
第三确定单元,用于基于所述第一分支函数的函数值以及第二分支函数的函数值,确定所述第一损失函数的函数值。
在一种可能的实现方式中,所述第一确定单元,用于获取所述预测分割图像中的各个划分区域分别对应的权重值;所述预测分割图像中的各个划分区域包含所述至少一个指定类型区域;
基于所述预测分割图像中的各个划分区域分别对应的权重值,以及所述预测分割图像中的各个划分区域与所述标签图像中的各个划分区域的相似性,确定所述第一损失函数的第一分支函数的函数值。
在一种可能的实现方式中,所述装置还包括:
判别模块,用于调用判别器对所述预测生成图像进行判别,获得所述预测生成图像的判别结果;
第三确定模块,用于基于所述判别结果,确定第三损失函数的函数值;所述判别结果用以指示所述预测生成图像是否为真实图像;
所述模型训练模块,用于基于所述第一损失函数的函数值,所述第二损失函数的函数值以及所述第三损失函数的函数值,对所述图像处理模型进行训练。
在一种可能的实现方式中,所述第一编码网络包含N个编码层,且所述N个编码层两两相连,N≥2,且为正整数;
所述第一编码模块,包括:
集合获取子模块,用于获取所述第一样本图像对应的第一图像金字塔,所述第一图像金字塔是对所述第一样本图像按照指定梯度下采样获取的图像集合,所述第一图像金字塔中包含N个第一待处理图像;
编码子模块,用于将所述N个第一待处理图像分别输入到对应的编码层中,对所述N个第一待处理图像进行编码,获得所述第一样本图像对应的N个第一特征图;
其中,响应于目标编码层为所述N个编码层中的非第一个编码层,所述目标编码层的输入还包括上一个编码层输出的第一特征图。
在一种可能的实现方式中,所述图像处理模型中的解码网络包含N个解码层,且所述N个解码层两两相连,所述N个解码层与所述N个编码层一一对应;
所述解码模块,包括:
解码子模块,用于将所述N个第一特征图分别输入到所述解码网络对应的解码层中,对所述N个第一特征图进行解码,获得N个解码结果;所述N个解码结果具有相同的分辨率;
合并子模块,用于对所述N个解码结果进行合并,获得所述第一样本图像的预测分割图像;
其中,响应于目标解码层为所述N个解码层中的非第一个解码层,所述目标解码层的输入还包括上一个解码层输出的解码结果。
在一种可能的实现方式中,所述装置还包括:
图像获取模块,用于基于第三样本图像,获取所述图像处理模型的先验约束图像;所述第三样本图像是所述目标医学对象的第三模态的样本医学图像;所述先验约束图像用以指示所述目标医学对象在所述第三样本图像中的位置;
第二编码模块,用于调用所述图像处理模型中的第二编码网络,基于所述先验约束图像进行编码,获得所述第三样本图像对应的第二特征图;
合并模块,用于对所述第一特征图以及所述第二特征图进行合并,获得综合特征图;
所述解码模块,用于调用所述图像处理模块中的解码网络,基于所述综合特征图进行解码,获得所述第一样本图像的所述预测分割图像;
所述生成模块,用于调用所述图像处理模型中的生成网络,基于所述综合特征图生成所述预测生成图像。
在一种可能的实现方式中,所述装置还包括:
裁剪模块,用于基于所述目标医学对象的位置,对所述先验约束图像进行裁剪;
所述第二编码模块,用于调用所述图像处理模型中的第二编码网络,对裁剪后的所述先验约束图像进行编码,获得所述第三样本图像对应的第二特征图。
在一种可能的实现方式中,所述图像获取模块,用于调用语义分割网络,对所述第三样本图像进行处理,获取所述图像处理模型的先验约束图像。
在一种可能的实现方式中,所述第二编码网络中的参数与所述第一编码网络中的参数权值共享。
另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储由至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现上述用于医学图像的图像处理方法。
另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条计算机程序,所述计算机程序由处理器加载并执行以实现上述用于医学图像的图像处理方法。
另一方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选实现方式中提供的用于医学图像的图像处理方法。
本申请提供的技术方案可以包括以下有益效果:
本申请实施例提供的用于医学图像的图像处理方法,获取目标医学对象对应的多模态的样本医学图像,以及目标医学图像对应的包含指定类型区域标签的标签图像,基于多模态的样本医学图像中的第一样本图像生成预测分割图像,以及预测生成图像,基于预测分割图像与标签图像之间的差异,预测生成图像与目标医学对象对应的第二样本图像之间的差异,对包含第一编码网络,解码网络以及生成网络的图像处理模型进行训练,从而使得训练获得图像处理模型能够基于单一模态的医学图像,获取到多模态的医学图像的特征,使得获得的医学图像分割结果包含的信息较为全面,提高了对医学图像的分割效果;
进一步的,基于训练获得的图像处理模型可以基于单一模态的医学图像,生成其他模态的医学图像,从而解决医学图像分析过程中的图像缺失问题。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1示出了本申请一示例性实施例提供的用于医学图像的图像处理方法的***架构的示意图;
图2示出了本申请一示例性实施例提供的用于医学图像的图像处理方法的流程图;
图3是根据一示例性实施例示出的一种图像处理模型生成以及图像处理的框架图;
图4示出了本申请一示例性实施例提供的用于医学图像的图像处理方法的流程图;
图5示出了本申请一示例性实施例示出的用于医学图像的图像处理方法的流程图;
图6示出了本申请一示例性实施例示出的近似标记的合成示意图;
图7示出了本申请一示例性实施例示出的图像处理模型的结构示意图;
图8示出了本申请一示例性实施例示出的编码层的结构示意图;
图9示出了本申请一示例性实施例示出的解码层的结构示意图;
图10示出了本申请一示例性实施例示出的图像处理模型的应用过程的示意图;
图11示出了本申请一示例性实施例示出的用于医学图像的图像处理装置的方框图;
图12示出了本申请一示例性实施例示出的计算机设备的结构框图;
图13示出了本申请一示例性实施例示出的计算机设备的结构框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
应当理解的是,在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
本申请实施例提供了一种用于医学图像的图像处理方法,可以提高图像分割准确性。本申请涉及人工智能技术以及机器学习技术;
其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。本申请所示的包含图像采集组件的显示设备主要涉及其中的计算机视觉技术以及机器学习/深度学习等方向。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。
图1示出了本申请一示例性实施例提供的用于医学图像的图像处理方法的***架构的示意图,如图1所示,该***包括:计算机设备110以及医学图像采集设备120。
其中,上述计算机设备110可以实现为终端或服务器,当该计算机设备110实现为服务器时,该计算机设备110可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式***,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。当该计算机设备110实现为终端时,该计算机设备110可以是智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
上述医学图像采集设备120为具有医学图像采集功能的设备,比如该医学图像采集设备可以是用于医学检测的CT(Computed Tomography,计算机断层扫描)检测仪,核磁共振仪,正电子发射计算机断层扫描仪,心脏磁共振仪等带有图像采集装置的设备等。示意性的,以心脏磁共振仪为例,心脏磁共振成像(Cardiac Magnetic Resonance,CMR)是指用磁共振成像技术诊断心脏及大血管疾病的方法。磁共振是一种无创口的成像技术;基于心脏磁共振成像获得的CMR图像可以提供心脏的解剖和功能信息,以辅助心脏疾病的临床诊断和治疗,比如,CMR图像可以辅助对于心肌梗死的临床诊断和治疗。
心脏磁共振成像是一种多模态的成像方法,不同的CMR成像序列对应有不同的显像重点,用于提供不同的心脏特征信息,示意性的,CMR的成像序列可以包括:平衡式稳态自由进动序列(balanced-Steady State Free Precession,bSSFP),该序列可以捕获心脏运动,以使得其对应的bSSFP图像可以呈现完整清晰的心肌边界;T2加权成像,其对应的T2加权图像可以清楚地显示心肌水肿或心肌缺血损伤,比如,T2加权图像以高亮显示的形式显示心肌水肿部位或心肌缺血损伤部位;延迟钆增强(Late Gadolinium Enhancement,LGE)技术,其对应的LGE图像可以突出显示心肌瘢痕或心肌梗塞区域。通过组合多个图像序列,可以获得关于心肌病理学和形态学的丰富且可靠的信息,以辅助临床诊断和治疗计划的设定,需要说明的是,上述对CMR的成像序列的说明仅为示意性的,相关人员可以根据实际需求设置不同的成像序列,以获取不同的CMR图像,本申请对此不进行限制。进一步的,本申请所示的多模态的医学图像可以是基于不同的医学图像采集设备获取到的对应于同一医学对象的医学图像,比如,多模态的医学图像可以包含T1加权图像,T2加权图像以及CT图像等医学图像。
可选的,上述***中包含一个或者多个计算机设备110,以及一个或多个医学图像采集设备120。本申请实施例对于计算机设备110和医学图像采集设备120的个数不做限制。
医学图像采集设备120以及计算机设备110通过通信网络相连。可选的,通信网络是有线网络或无线网络。
可选的,上述的无线网络或有线网络使用标准通信技术和/或协议。网络通常为因特网、但也可以是任何网络,包括但不限于局域网(Local Area Network,LAN)、城域网(Metropolitan Area Network,MAN)、广域网(Wide Area Network,WAN)、移动、有线或者无线网络、专用网络或者虚拟专用网络的任何组合。在一些实施例中,使用包括超文本标记语言(Hyper Text Mark-up Language,HTML)、可扩展标记语言(Extensible MarkupLanguage,XML)等的技术和/或格式来代表通过网络交换的数据。此外还可以使用诸如安全套接字层(Secure Socket Layer,SSL)、传输层安全(Transport Layer Security,TLS)、虚拟专用网络(Virtual Private Network,VPN)、网际协议安全(Internet ProtocolSecurity,IPsec)等常规加密技术来加密所有或者一些链路。在另一些实施例中,还可以使用定制和/或专用数据通信技术取代或者补充上述数据通信技术。本申请在此不做限制。
图2示出了本申请一示例性实施例提供的用于医学图像的图像处理方法的流程图,该方法由计算设备执行,该计算机设备可以实现图1所示的服务器,如图2所示,该用于医学图像的图像处理方法包括以下步骤:
步骤210,调用图像处理模型中的第一编码网络,对第一样本图像进行编码,获得第一样本图像对应的第一特征图;该第一样本图像是目标医学对象的第一模态的样本医学图像。
在本申请实施例中,对于医学图像而言,该指定类型区域标签可以用以表示第一样本图像中的病灶信息,该病灶信息可以包括病灶在第一样本图像中的位置和形状等信息。
本申请实施例中的样本图像(包括第一样本图像,第二样本图像),可以是通过医学图像采集设备获取的医学图像,比如图1所示的医学图像采集设备;或者,该样本图像可以是基于数据库中存储的医学图像数据获取的,示意性的,本申请实施例中涉及的样本图像可以是基于公开数据集MyoPS20中的图像数据获取的,该数据集由多序列心肌病例CMR组成,包括45例的bSSFP图像、T2加权图像和LGE图像,其中25例带有标签。对于每位患者的原始CMR序列,bSSFP图像由8-12个切片组成,面内分辨率为1.25×1.25毫米,切片厚度为8至13毫米。T2加权图像由3-7个切片组成,面内分辨率为1.35×1.35mm,切片厚度为12-20mm。LGE图像有10-18个切片,面内分辨率为0.75×0.75mm,切片厚度为5mm。将上述图像对齐到一个公共空间并重新采样到相同的空间分辨率,以获得本申请中的样本图像。
该第一样本图像对应的标签图像可以包含第一样本图像中分辨率较低的其他病灶区域,示意性的,以第一样本图像是目标医学对象的T2加权图像为例,其中分辨率较高的病灶区域为心肌水肿区域,若该T2加权图像对应的目标医学对象对应有心肌瘢痕,那么该T2加权图像对应的标签图像中,除了包含心肌水肿区域标签之外,还可以包含心肌瘢痕区域标签。相对应的,当第一样本图像是目标医学对象的LGE图像时,其中分辨率较高的病灶区域为心肌瘢痕区域,该LGE图像对应的标签图像中,除了包含心肌瘢痕区域标签之外,还可以包含心肌水肿区域标签;也就是说,同一个目标医学对象的不同模态的医学图像所对应的标签图像相同。
样本医学图像的模态用以指示医学图像的获取方式,示意性的,第一模态的样本医学图像可以是T2加权图像,或者,第一模态的样本医学图像也可以是LEG图像,或者,第一模态的样本医学图像也可以其他任意一种医学图像采集方式采集到的医学图像。
步骤220,调用图像处理模型中的解码网络,基于第一特征图进行解码,获得第一样本图像的预测分割图像;该预测分割图像用以指示预测出的至少一个指定类型区域。
可选的,该预测分割图像中的预测出的指定类型区域的数量与标签图像中指定标签区域的数量相等。示意性的,该预测指定类型区域可以是基于第一编码网络和解码网络处理后,预测出的该第一样本图像中的病灶区域。
步骤230,调用图像处理模型中的生成网络,基于第一特征图生成预测生成图像;该预测生成图像是第一样本图像对应的第二模态的预测图像。
其中,第一样本图像所属的第一模态,与预测生成图像所属的第二模态不同。
步骤240,基于预测分割图像与标签图像之间的差异,预测生成图像与第二样本图像之间的差异,对图像处理模型进行训练;该第二样本图像是目标医学对象的第二模态的样本医学图像;该标签图像是目标医学对象对应的,用以指示至少一个指定类型区域的图像。
计算机设备获取不同的第一模态的样本医学图像为第一样本图像,迭代执行上述步骤210至步骤240,基于各个第一样本图像对应的预测分割图像与标签图像之间的差异,预测生成图像与第二样本图像之间的差异,对图像处理模型中的参数进行迭代更新,直至达到训练完成条件,该训练完成条件包括:图像处理模型收敛,迭代次数达到次数阈值等等。
训练完成后的图像处理模型可以用于对输入的第一模态的目标医学图像进行医学图像分割,获得该目标医学图像中的指定类型区域,和/或,生成该目标医学图像对应的第二模态的医学图像。
综上所述,本申请实施例提供的用于医学图像的图像处理方法,获取目标医学对象对应的多模态的样本医学图像,以及目标医学图像对应的包含指定类型区域标签的标签图像,基于多模态的样本医学图像中的第一样本图像生成预测分割图像,以及预测生成图像,基于预测分割图像与标签图像之间的差异,预测生成图像与目标医学对象对应的第二样本图像之间的差异,对包含第一编码网络,解码网络以及生成网络的图像处理模型进行训练,从而使得训练获得图像处理模型能够基于单一模态的医学图像,获取到多模态的医学图像的特征,使得获得的医学图像分割结果包含的信息较为全面,提高了对医学图像的分割效果;
进一步的,基于训练获得的图像处理模型可以基于单一模态的医学图像,生成其他模态的医学图像,从而解决医学图像分析过程中的图像缺失问题。
在本申请实施例所述的方案中,通过同一目标医学对象的多模态医疗样本图像,以及将目标医学对象对应的标签图像训练获得图像处理模型,可以提高图像处理模型的医学图像分割效果,和/或解决医学图像分析过程中的图像缺失问题。上述方案的应用场景包括但不限于以下场景:
1)心肌梗塞诊断和治疗场景:
心肌活力的评估对于心肌梗塞患者的诊断和治疗管理至关重要,在实际应用中,可以通过心脏核磁共振(CMR)成像技术,获取心脏对应于成像序列的CMR图像,以提供心脏的解剖和功能信息。不同的成像序列可以成像并提供心脏的不同特征信息,包括显示心肌梗塞区域的延迟钆增强(LGE)图像,对心肌水肿或心肌缺血损伤进行高亮的T2加权图像,以及能够捕获心脏运动并呈现清晰的界限的平衡式稳态自由进动序列(bSSFP)序列图像,这些多序列CMR图像可以提供关于心肌病理学和形态学信息的丰富和可靠的信息,为医生的诊断和治疗计划提供帮助。然而在单一模态的场景下,基于单一模态的医学图像所能获取到的心脏的信息有限,比如,在只存在T2加权图像时,只能基于T2加权图像获取到较为明确的心肌水肿或者心肌缺血损伤,而难以获取到心肌梗塞(心肌瘢痕)区域的信息;在只存在LGE图像时,只能获取到较为明确的心肌梗塞区域,而难以获取到心肌水肿或心肌缺血损伤的信息;在此情况下,可以基于本申请实施例提供的用于医学图像的图像处理方法分别获得的T2加权图像以及LGE图像各自对应的图像处理模型,即将T2加权模态的样本医学图像获取为第一样本图像训练获得的图像处理模型,以及将LGE模态的样本医学图像获取为第一样本图像训练获得的图像处理模型,将该T2加权图像输入到T2加权模态对应的图像处理模型中,以获得包含心肌瘢痕区域以及心肌水肿(或心肌缺血损伤)的分割图像,和/或T2加权图像对应LGE图像;或者,将该LGE图像输入到LGE模态对应的图像处理模型中,以获得包含心肌瘢痕区域以及心肌水肿(或心肌缺血损伤)的分割图像,和/或,LGE图像对应的T2加权图像。
2)医学图像病灶判断场景:
在医学领域,医护人员往往通过医学图像采集设备获取到的医学图像对器官的病灶区域进行判断,比如,对胃部进行病灶检查,确认胃溃疡;确认肺部肿瘤;以及确认脑部肿瘤等。在上述场景中,可以通过本申请提供的用于医学图像的图像处理方法,获得对应于上述各个场景的图像处理模型,用以确定病灶在器官中的位置形状等信息,比如,确定胃溃疡在胃部的病灶位置、形状和大小,以使得医护人员基于存在病灶的位置、形状和大小等进行医疗资源分配;因此,基于本申请提供的用于医学图像的图像处理方法所获得的图像处理模型,能够提高对医疗图像进行分割的准确性,可以进一步提高病灶判断的准确性,从而实现对医疗资源的合理分配。
本申请涉及的方案包括图像处理模型生成阶段以及图像处理阶段。图3是根据一示例性实施例示出的一种图像处理模型生成以及图像处理的框架图,如图3所示,在图像处理模型生成阶段,图像处理模型生成设备310通过预先设置好的训练样本数据集(包括第一模态的样本医学图像以及样本医学图像对应目标医学对象的标签图像),得到图像处理模型;之后,基于该图像处理模型生成图像处理模型。在图像处理阶段,图像处理设备320基于该图像处理模型,对输入的第一模态的目标医学图像进行处理,获得该第一模态的目标医学图像的图像分割结果,该图像分割结果中可以包含目标医学图像对应的医学对象的在多个模态的医学图像中所能获取的病症区域标注,比如,确定该目标医学图像对应的医学对象中的至少一个病灶位置、形状等信息;和/或,对输入的第一模态的目标医学图像进行处理,获得该第一模态的目标医学图像的图像生成结果,生成第一模态的目标医学图像对应的医学对象的第二模态医学图像,以解决图像缺失的问题,同时使得图像分割结果具有可解释性。
在一种可能的实现方式中,对图像处理模型进行应用时,若需要对目标医学图像进行图像分割,则可以使用图像处理模型中的第一编码网络和解码网络,或者,基于图像处理模型中的第一编码网络和解码网络,可以重新构建一个图像分割模型,该图像分割模型中的参数与图像处理模型中第一编码网络和解码网络的参数保持一致;在另一种可能的实现方式中,对图像处理模型进行应用时,若需要基于输入的第一模态的目标医疗图像,生成对应的第二模态的医疗图像,则可以使用图像处理模型中的第一编码网络和生成网络,或者,基于图像处理模型中的第一编码网络和生成网络,可以重新构建一个图像生成模型,该图像生成模型中的参数与图像处理模型中第一编码网络和生成网络的参数保持一致。
其中,上述图像处理模型生成设备310和图像处理设备320可以是计算机设备,比如,该计算机设备可以是个人电脑、服务器等固定式计算机设备,或者,该计算机设备也可以是平板电脑、电子书阅读器等移动式计算机设备。
可选的,上述图像处理模型生成设备310和图像处理设备320可以是同一个设备,或者,图像处理模型生成设备310和图像处理设备320也可以是不同的设备。并且,当图像处理模型生成设备310和图像处理设备320是不同设备时,图像处理模型生成设备310和图像处理设备320可以是同一类型的设备,比如图像处理模型生成设备310和图像处理设备320可以都是服务器;或者图像处理模型生成设备310和图像处理设备320也可以是不同类型的设备,比如图像处理设备320可以是个人电脑或者终端,而图像处理模型生成设备310可以是服务器等。本申请实施例对图像处理模型生成设备310和图像处理设备320的具体类型不做限定。
图4示出了本申请一示例性实施例提供的用于医学图像的图像处理方法的流程图,该方法由计算设备执行,该计算机设备可以实现为图1所示的服务器,如图4所示,该用于医学图像的图像处理方法包括以下步骤:
步骤410,调用图像处理模型中的第一编码网络,对第一样本图像进行编码,获得第一样本图像对应的第一特征图;该第一样本图像是目标医学对象的第一模态的样本医学图像。
步骤420,调用图像处理模型中的解码网络,基于第一特征图进行解码,获得第一样本图像的预测分割图像;该预测分割图像用以指示预测出的至少一个指定类型区域。
步骤430,调用图像处理模型中的生成网络,基于第一特征图生成预测生成图像;该预测生成图像是第一样本图像对应的第二模态的预测图像。
步骤440,基于预测分割图像与标签图像之间的差异,确定第一损失函数的函数值。
在本申请实施例中,基于预测分割图像与标签图像的相似性,确定第一损失函数的第一分支函数的函数值;
基于预测分割图像中的至少一个指定类型区域,与标签图像中的至少一个指定类型区域标签,确定第一损失函数的第二分支函数的函数值;
基于第一分支函数的函数值以及第二分支函数的函数值,确定第一损失函数的函数值。
由于同一医学图像中,不同划分区域占医学图像的面积存在较大的差异,即存在正负样本极不平衡的状态,因此,为了平衡正负样本的重要性,可以使用Focal Dice损失LFDL作为第一损失函数中的第一分支函数;在该第一分支函数中,不同的划分区域对应设置有不同的权重,从而使得难以分割的划分区域在分割过程中可以获得更高的权重,使得网络可以专注于学习更难的类别,该第一损失函数的第一分支函数可以表示为:
其中,Dice系数(Dice coefficient)是用于评估两个样本的相似性的度量函数,取值范围在0到1之间,取值越大表示越相似,在本申请实施例中,这两个样本之间的相似性体现为预测分割图像与标签图像之间的相似性,进一步体现为,预测分割图像中的各个划分区域与标签图像中对应的划分区域的相似性。示意性的,预测图像中的划分区域可以包含病灶区域,正常区域以及背景区域,一般而言,背景区域的面积占医学图像的面积的比例较大,正常区域的面积占医学图像的面积的比例次之,病灶区域的面积占医学图像的面积的比例最小;为使得解码网络更加关注病灶区域,可以将第一分支函数中,该病灶区域对应的权重值设置为最大,正常区域对应的权重值次之,背景区域对应的权重值最小;可选的,权重值的取值与各个划分区域的面积占医学图像的面积成反比;或者,权重值的取值与各个划分区域的类型相对应,比如,以该医学图像为心肌图像为例,其对应的病灶包括心肌瘢痕以及心肌水肿,则可以设置预测分割图像中的各个划分区域对应的权重集合为ω={1,1,1,0.5},其中,心肌瘢痕对应的划分区域的权重为1,心肌水肿对应划分区域的权重为1,正常心肌对应的划分区域的权重为1,背景对应的划分区域的权重为0.5;需要说明的是,上述权重的设置仅为示意性的,本申请对各个划分区域分别对应的权重值,以及各个权重值之间的关系不进行限定。
在本申请实施例中,可以采用均方差损失函数来量化预测分割图像中预测出的至少一个指定位置区域的位置,与标签图像中至少一个指定类型区域的位置之间的差异,该第一损失函数的第二分支函数可以表示为:
其中,H和W分别表示预测分割图像(标签图像)的宽和高,Pt和Gt分别代表指定类型区域t的预测位置和标签图像位置。可选的,标签图像中的指定类型区域可以包含病灶区域,正常区域以及背景区域中的至少一种。
在本申请实施例中,将第一分支函数的函数值与第二分支函数的函数值的和,获取为第一损失函数的函数值;进一步的,为平衡第一分支函数与第二分支函数的作用,可以为第一分支函数以及第二分支函数设置不同的权重值,示意性的,该第一损失函数可以表示为:
Lseg=LFDL+λLmse
其中,λ表示第二分支函数相对于第一分支函数的权重值;示意性的,λ的取值可以为100。
步骤450,基于预测生成图像与第二样本图像之间的差异,确定第二损失函数的函数值;该第二样本图像是目标医学对象的第二模态的样本医学图像。
示意性的,第二损失函数可以表示为:
其中,x标识预测生成图像,x'表示目标医学对象的第二模态的样本医学图像,H和W分别表示预测生成图像(第二模态的样本医学图像)的宽和高。
步骤460,基于第一损失函数的函数值,以及第二损失函数的函数值,对图像处理模型进行训练。
在本申请实施例中,第一损失函数与第二损失函数对图像处理模型中的不同网络组合进行参数更新;
可选的,基于第一损失函数的函数值,对第一编码网络的参数以及解码网络的参数进行更新;
基于第二损失函数的函数值,对第一编码网络的参数以及生成网络的参数进行更新。
也就是说,第一损失函数的函数值以及第二损失函数的函数值均会对图像处理模型中的第一编码网络的参数更新进行指导;因此,生成网络用以辅助图像分割模型(包含编码网络和解码网络的模型)的生成;或者说,解码网络用以辅助图像生成模型(包含编码网络和生成网络的模型)的生成。
在本申请实施例中,还可以引入第三损失函数,对图像处理模型进行训练,该第三损失函数用以指示预测生成图像的真实性;该过程可以实现为:
调用判别器对预测生成图像进行判别,获得预测生成图像的判别结果;
基于判别结果,确定第三损失函数的函数值;该判别结果用以指示预测生成图像是否为真实图像。
示意性的,该第三损失函数可以表示为:
在上述情况下,对图像处理模型进行训练包括:基于第一损失函数的函数值,第二损失函数的函数值以及第三损失函数的函数值,对图像处理模型进行训练。
在本申请实施例中,基于第三损失函数的函数值,对第一编码网络的参数以及生成网络的参数进行更新。
其中,该判别器可以是预先训练好的;或者,该判别器中的参数可以基于第三损失函数的函数值进行更新,在此情况下,该判别器的输入还包括目标医学对象对应的第二模态的样本医学图像,以对该判别器进行训练;该判别器对生成网络的训练起到辅助作用,用以提高生成网络生成的图像的质量。
综上所述,本申请实施例提供的用于医学图像的图像处理方法,获取目标医学对象对应的多模态的样本医学图像,以及目标医学图像对应的包含指定类型区域标签的标签图像,基于多模态的样本医学图像中的第一样本图像生成预测分割图像,以及预测生成图像,基于预测分割图像与标签图像之间的差异,预测生成图像与目标医学对象对应的第二样本图像之间的差异,对包含第一编码网络,解码网络以及生成网络的图像处理模型进行训练,从而使得训练获得图像处理模型能够基于单一模态的医学图像,获取到多模态的医学图像的特征,使得获得的医学图像分割结果包含的信息较为全面,提高了对医学图像的分割效果;
进一步的,基于训练获得的图像处理模型可以基于单一模态的医学图像,生成其他模态的医学图像,从而解决医学图像分析过程中的图像缺失问题。
可选的,为了提高模型训练的准确性,降低类不平衡问题带来的误差,可以基于第三样本图像,获取图像处理模型的先验约束图像,该先验约束图像用以指示目标医学对象在样本图像中的预测位置。其中,该第三样本图像可以是第一样本图像和第二样本图像中的一个,或者,该第三样本图像也可以是目标医学图像的第三模态的样本医学图像;对于心脏磁共振获得的CMR图像而言,该第三样本图像可以是能够捕获心脏运动并呈现清晰的界限的bSSFP图像,相较于T2加权图像与LGE图像,基于bSSFP图像可以获得更加准确的心肌位置和形状,因此,基于bSSFP图像获取的先验约束图像对目标医学对象在样本图像中的位置的预测更加准确。
在上述情况下,基于图4所示实施例所示的用于医学图像的图像处理方法,图5示出了本申请一示例性实施例示出的用于医学图像的图像处理方法的流程图,如图5所示,该方法包括以下步骤:
步骤510,基于第三样本图像,获取图像处理模型的先验约束图像;该第三样本图像是目标医学对象的第三模态的样本医学图像;该先验约束图像用以指示目标医学对象在第三样本图像中的位置。
该先验约束图像指示的有目标医学对象在第三样本图像中的位置,能够指示该目标医学图像在其他样本图像(包括第一样本图像与第二样本图像)中的位置。
在本申请实施例中,可以调用语义分割网络(U-Net),对第三样本图像进行处理,获取图像处理模型的先验约束对象;
其中,该语义分割网络是基于样本图像集训练获得的;该样本图像集中包含第四样本图像,以及第四样本图像对应的近似标记,该第四样本图像是指其他医学对象对应的第三模态的样本医学图像;该近似标记用以指示第四样本图像中其他医学对象的位置。
以其他医学对象的类型为心肌为例,由于心肌医学图像中,心肌水肿区域,心肌瘢痕区域占医学图像的比例较低,且各自对应的区域并不重合,因此,可以将合并了正常心肌区域、心肌水肿区域以及心肌瘢痕区域的图像,获取为医学图像对应的近似标记;图6示出了本申请一示例性实施例示出的近似标记的合成示意图,如图6所示,从标签图像中提取心肌水肿区域610以及心肌瘢痕区域620,结合正常心肌区域630合并生成近似标记640;将该近似标记获取为第一样本对象的标签,对语义分割图像进行训练,以使得训练后的语义分割图像可以对输入的第三样本图像进行处理,获得第三样本图像对应的先验约束图像。
步骤520,调用图像处理模型中的第二编码网络,基于先验约束图像进行编码,获得第三样本图像对应的第二特征图。
在本申请实施例中,该图像处理模型还可以包含第二编码网络,为了缓解网络参数过大造成的过拟合问题,在本申请实施例中,可以设置第二编码网络的参数与第一编码网络的参数保持一致,即第二编码网络中的参数与第一编码网络中的参数权值共享。
可选的,为了进一步减少背景区域对模型训练的影响,可以在获得先验约束图像之后,基于目标医学对象的位置,对先验约束图像进行裁剪;之后,调用图像处理模型中的第二编码网络,对裁剪后的先验约束图像进行编码,获得第三样本图像对应的第二特征图。
与该先验约束图像的大小相适应,对其他样本图像(包括第一样本图像,第二样本图像)进行预处理,即,对其他样本图像进行裁剪,并保证目标医学对象在其他图样本图像中的位置与目标医学对象在先验约束图像中的位置在指定误差范围内相似,可选的,可以在保证目标医学对象在其他图像样本中的位置与目标医学对象在先验约束图像中的位置在指定误差范围内处于图像中心。以目标医学对象为心肌为例,对于先验约束图像而言,由于心肌是圆环形的对称组织,因此根据上述获得的近似标记的中心,对先验约束图像进行裁剪;对于其他样本图像而言,则可以根据标签图像中指定类型区域的位置进行裁剪,或者,也可以根据上述近似标记的中心进行裁剪,本申请对其他样本图像的裁剪依据不进行限制。
可选的,由于不同病例对应的数据范围差异较大,因此可以对裁剪后的先验图像进行进一不处理,比如,应用直方图均衡和随机伽马方法,在统一设置窗位和窗宽之后对数据分布进行进一步平衡。
此外,在对样本图像进行处理之前,可以先对样本图像进行数据增强处理,该数据增强处理方法包括随机旋转、随机裁剪和随机缩放等方法。
步骤530,调用图像处理模型中的第一编码网络,对第一样本图像进行编码,获得第一样本图像对应的第一特征图;该第一样本图像是目标医学对象的第一模态的样本医学图像。
若输入第二编码网络的图像为先验约束图像,该第一样本图像为原始的第一样本图像;若输入第二编码网络的图像为裁剪后的先验约束图像,该第一样本图像为裁剪后的第一样本图像;也就是说,输入到各个编码网络中的图像的尺寸保持一致。
在本申请实施例中,为使得生成的预测分割图像和/或预测生成图像更加准确,该图像处理模型可以是基于蝴蝶型网络架构搭建的,该蝴蝶型网络中的第一编码网络包含N个编码层,且N个编码层两两相连;该蝴蝶型网络中的解码网络包含N个解码层,N个解码层两两相连,解码网络中的N个解码层与第一编码网络中的N个编码层一一对应。图7示出了本申请一示例性实施例示出的图像处理模型的结构示意图,如图7所示,该第一编码网络710包含N个编码层,解码网络730包含N个解码层,其中,第一编码网络710中的第一个编码层711与解码网络730中的第N个解码层733一一对应,第一编码网络710中的第二个编码层712与解码网络730中的第N-1个解码层732一一对应;以此类推,第一编码网络710中的第N个编码层713与解码网络730中的第一个解码层731一一对应。可选的,如图7所示,该图像处理模型中包含第二编码层720,该第二编码网络720中也可以包含N个编码层,第二编码层中N个编码层两两相连。
当图像处理模型为图7所示的基于蝴蝶型网络架构搭建的模型时,调用图像处理模型中的第一编码网络,对第一样本图像进行编码,获得第一样本图像对应的第一特征图的过程可以实现为:
获取第一样本图像对应的第一图像金字塔,该第一图像金字塔是对第一样本图像按照指定梯度下采样获取的图像集合,该第一图像金字塔中包含N个第一待处理图像;
将N个第一待处理图像分别输入到对应的编码层中,对N个第一待处理图像进行编码,获得第一样本图像对应的N个第一特征图;
其中,响应于目标编码层为N个编码层中的非第一个编码层,该目标编码层的输入还包括上一个编码层输出的第一特征图。
第一图像金字塔中的各个第一待处理图像的分辨率存在差异,第一图像金字塔中的每个图像对应有一个侧输入路径,每个侧输入路径用以将对应的第一待处理图像输入到第一编码网络中对应的编码层中,如图7所示,第一图像金字塔750中包含N个第一待处理图像,每个第一待处理图像对应有一个侧输入路径,对于第一编码网络710中的非第一个编码层而言,其输入包含对应的侧输入路径输入的第一待处理图像,以及该编码层的上一个编码层输出的第一特征图。
相适应的,以输入第二编码网络720的图像为裁剪后的先验约束图像为例,对于第二编码网络720而言,获取第二特征图的过程包括:获取裁剪后的先验约束图像对应的第二图像金字塔,该第二图像金字塔是对裁剪后的先验约束图像按照该指定梯度进行下采样获取的图像集合,该第二图像金字塔中包含N个第二待处理图像;
将N个第二待处理图像分别输入第二编码网络中对应的编码层中,对N个第二待处理图像进行编码,获得裁剪后的先验约束图像对应的N个编码结果;
对N个编码结果进行合并,获得裁剪后的先验约束图像对应的第二特征图;
其中,当第二编码网络中的编码层为非第一个编码层时,该编码层的输入还包括上一个编码层输出的编码结果。
第二图像金字塔中的各个第二待处理图像的分辨率存在差异,第二图像金字塔中的每个第二待处理图像对应有一个侧输入路径,每个侧输入路径用以将对应的第二待处理图像输入到第二编码网络中对应的编码层中,如图7所示,第二图像金字塔760中包含N个第二待处理图像,每个第二待处理图像对应有一个侧输入路径,对于第二编码网络720中的非第一个编码层而言,其输入包含对应的侧输入路径输入的第二待处理图像,以及该编码层的上一个编码层输出的编码结果。
在本申请实施例中,编码网络(第一编码网络/第二编码网络)中的编码层的结构,可以采用两层的“3x3可分离卷积+ReLU激活函数+Dropout操作”的卷积层结构,图8示出了本申请一示例性实施例示出的编码层的结构示意图,如图8所示,编码网络中的编码层包含卷积层810以及卷积层820,两层卷积层中间使用残差连接的方式加入通道注意力模块830;在通道注意力模块830中,通过使用最大池化和平均池化在空间维度上压缩经过卷积层810获得的特征图;共享网络由多层感知器(Multi-Layer Perceptron,MLP)组成,通过对压缩后的特征图进行感知,串联合并,以及激活函数处理,获得通道注意力特征图;将通道注意力特征图与通道注意力模块的输入相乘,与编码网络的卷积层810的输出相加以形成残差结构,获得中间特征图,其后接卷积层820,用于使用指定步长的卷积层对中间特征图进行下采样,以获得卷积层820输出的特征图(第一特征图/编码结果),示意性的,该指定步长可以为2;可选的,为更好的提取输入图像的特征,可以将编码网络中的卷积层替换为深度可分离卷积层。
步骤540,对第一特征图以及第二特征图进行合并,获得综合特征图。
当图像处理模型为图7所示的基于蝴蝶型网络架构搭建的模型时,该综合特征图是第一编码网络710第N个编码层输出的第一特征图与第二编码网络720输出的第二特征图的合并结果。
步骤550,调用图像处理模块中的解码网络,基于综合特征图进行解码,获得第一样本图像的预测分割图像。
当图像处理模型为图7所示的基于蝴蝶型网络架构搭建的模型时,调用图像处理模块中的解码网络,基于综合特征图进行解码,获得第一样本图像的预测分割图像的过程可以实现为:
将N个第一特征图分别输入到解码网络对应的解码层中,对N个第一特征图进行解码,获得N个解码结果;N个解码结果具有相同的分辨率;
对N个解码结果进行合并,获得第一样本图像的预测分割图像;
其中,响应于目标解码层为N个解码层中的非第一个解码层,该目标解码层的输入还包括上一个解码层输出的解码结果。
在本申请实施例中,解码网络中的解码层的结构,可以采用两层的“3x3可分离卷积+ReLU激活函数+Dropout操作”的卷积层的结构,图9示出了本申请一示例性实施例示出的解码层的结构示意图,如图9所示,解码网络中的解码层包含卷积层910以及卷积层920,两层卷积层中间使用残差连接的方式加入控件注意力模块930,该空间注意力模块930主要关注位置信息;在空间注意力模块930中,通过使用最大池化和平均池化在通道维度上进行处理,获得一个特征图,再通过一个卷积层进行级联和卷积,再经过激活函数处理,获得空间注意力特征图;将空间注意力特征图与空间注意力模块的输入相乘,与解码网络的卷积层910的输出相加以形成残差结构,获得中间特征图,其后接卷积层920,用于使用指定步长的卷积层对中间特征图进行下采样,获得卷积层920输出的解码结果。
步骤560,调用图像处理模型中的生成网络,基于综合特征图生成预测生成图像。
如图7所示,该图像处理模型中可以包含生成网络740,用以与综合特征图生成预测生成图像741。
步骤570,基于预测分割图像与标签图像之间的差异,该预测生成图像与第二样本图像之间的差异,对图像处理模型进行训练;该第二样本图像是目标医学对象的第二模态的样本医学图像;该标签图像是目标医学对象对应的,用以指示至少一个指定类型区域的图像。
本申请提供的蝴蝶形网络架构的图像处理模型,能够将深层语义信息和地层位置信息相结合,从而在保证网络宽度的同时,可以减轻梯度消失的情况,另一方面,通过对多尺度,多分辨率的输入图像的监督,能够获得更多的图像特征,进而获得更好的图像分割效果,和/或图像生成效果。
综上所述,本申请实施例提供的用于医学图像的图像处理方法,获取目标医学对象对应的多模态的样本医学图像,以及目标医学图像对应的包含指定类型区域标签的标签图像,基于多模态的样本医学图像中的第一样本图像生成预测分割图像,以及预测生成图像,基于预测分割图像与标签图像之间的差异,预测生成图像与目标医学对象对应的第二样本图像之间的差异,对包含第一编码网络,解码网络以及生成网络的图像处理模型进行训练,从而使得训练获得图像处理模型能够基于单一模态的医学图像,获取到多模态的医学图像的特征,使得获得的医学图像分割结果包含的信息较为全面,提高了对医学图像的分割效果;
进一步的,基于训练获得的图像处理模型可以基于单一模态的医学图像,生成其他模态的医学图像,从而解决医学图像分析过程中的图像缺失问题。
在一种可能的实现方式中,在对图像处理模型进行训练时,可以结合两个图像处理模型的训练结果以获得最终的图像处理模型;示意性的,第一图像处理模型的输入为第一样本图像,该第一样本图像是目标医学对象的第一模态的样本医学图像,以目标医学对象对应的标签图像,以及第二样本图像为标签,对第一图像处理模型进行训练,获得训练好的第一图像处理模型,该第二样本图像是目标医学对象的第二模态的图样本医学图像;该第一图像处理模型用以生成输入的第一模态的医学图像对应的预测分割图像,和/或,生成输入的第一模态的医学对象对应的第二模态的医学生成图像;第二图像处理模型的输入为第二样本图像,以目标医学对象对应的标签图像,以及第一样本图像为标签,对第二图像处理模型进行训练,获得训练好的第二图像处理模型,该第二图像处理模型用于成输入的第二模态的医学图像对应的预测分割图像,和/或,生成输入的第二模态的医学对象对应的第一模态的医学生成图像。其中,若两个图像处理模型输入图像为同一医学对象不同模态的医学图像,基于第一图像处理模型和第二图像修理模型分别处理后获得的预测分割图像相同,或者误差在指定阈值范围内。
可选的,为减少网络参数,可以对第一图像处理模型的编码网络和解码网络的参数,与第二图像处理模型中的编码网络和解码网络的参数进行权值共享;该过程可以在模型训练过程中进行,或者,在模型训练完成后进行。示意性的,权值共享可以实现为:将其中一个图像处理模型中编码网络和解码网络的参数替换到另一个图像处理模型的编码网络和解码网络中,或者,可以取两个图像处理模型中编码网络的参数的平均值和解码网络的参数的平均值,分别替换到两个图像处理模型的编码网络和解码网络中,本申请权值共享的方式不进行限制。
示意性的,以分割心肌瘢痕与心肌水肿为例,对基于本申请生成的图像处理模型的应用过程进行说明,图10示出了本申请一示例性实施例示出的图像处理模型的应用过程的示意图,该过程可以实现在部署有图像处理模型的终端或服务器,或者,部署有基于图像处理模型构建的图像分割模型的终端或服务器中,如图10所示,基于心脏磁共振技术,获取同一医疗对象对应的CMR图像,图10中为bSSFP图像,T2加权图像以及LGE图像;在第一阶段,将bSSFP图像1010输入到U-Net网络1020中,以获取U-Net网络输出的先验约束图像1030,该先验约束图像用以指示该医疗对象在CMR图像中的位置信息;基于该先验约束图像中医疗对象的中心位置,对该先验约束图像,T2加权图像,以LGE图像进行裁剪,将裁剪后的T2加权图像以及裁剪后的先验约束图像输入到对应T2模式的第一图像处理模型1040中,获得第一图像处理模型输出的第一预测分割图像1050,该第一预测分割图像包含心肌瘢痕的位置信息以及心肌水肿的位置信息;将裁剪后的LGE图像以及裁剪后的先验约束图像输入到对应LGE模式的第二图像处理模型1060中,获得第二图像处理模型输出的第二预测分割图像1070;为进一步提高预测分割图像的准确性,将第一预测分割图像与第二预测分割图像进行合并,获得该医学对象对应的心肌瘢痕与心肌水肿的分割图像1080;另外,当该过程实现在部署有图像处理模型的终端或服务器中时,可以基于T2加权图像生成对应的LGE图像,以及,基于LGE图像生成对应的T2加权图像。
图11示出了本申请一示例性实施例示出的用于医学图像的图像处理装置的方框图,如图11所示,该装置包括:
第一编码模块1110,用于调用图像处理模型中的第一编码网络,对第一样本图像进行编码,获得所述第一样本图像对应的第一特征图;所述第一样本图像是目标医学对象的第一模态的样本医学图像;
解码模块1120,用于调用所述图像处理模型中的解码网络,基于所述第一特征图进行解码,获得所述第一样本图像的预测分割图像;所述预测分割图像用以指示预测出的至少一个指定类型区域;
生成模块1130,用于调用所述图像处理模型中的生成网络,基于所述第一特征图生成预测生成图像;所述预测生成图像是所述第一样本图像对应的第二模态的预测图像;
模型训练模块1140,用于基于所述预测分割图像与所述标签图像之间的差异,所述预测生成图像与第二样本图像之间的差异,对所述图像处理模型进行训练;所述第二样本图像是所述目标医学对象的第二模态的样本医学图像;所述标签图像是所述目标医学对象对应的,用以指示至少一个指定类型区域的图像。
在一种可能的实现方式中,所述模型训练模块1140,包括:
第一确定子模块,用于基于所述预测分割图像与所述标签图像之间的差异,确定第一损失函数的函数值;
第二确定子模块,用于基于所述预测生成图像与所述第二样本图像之间的差异,确定第二损失函数的函数值;
模型训练子模块,用于基于所述第一损失函数的函数值,以及所述第二损失函数的函数值,对所述图像处理模型进行训练。
在一种可能的实现方式中,所述模型训练子模块,用于基于所述第一损失函数的函数值,对所述第一编码网络的参数以及所述解码网络的参数进行更新;
基于所述第二损失函数的函数值,对所述第一编码网络的参数以及所述生成网络的参数进行更新。
在一种可能的实现方式中,所述第一确定子模块,包括:
第一确定单元,用于基于所述预测分割图像与所述标签图像的相似性,确定所述第一损失函数的第一分支函数的函数值;
第二确定单元,用于基于所述预测分割图像中预测出的至少一个指定类型区域的位置,与所述标签图像中的至少一个指定类型区域的位置,确定所述第一损失函数的第二分支函数的函数值;
第三确定单元,用于基于所述第一分支函数的函数值以及第二分支函数的函数值,确定所述第一损失函数的函数值。
在一种可能的实现方式中,所述第一确定单元,用于获取所述预测分割图像中的各个划分区域分别对应的权重值;所述预测分割图像中的各个划分区域包含所述至少一个指定类型区域;
基于所述预测分割图像中的各个划分区域分别对应的权重值,以及所述预测分割图像中的各个划分区域与所述标签图像中的各个划分区域的相似性,确定所述第一损失函数的第一分支函数的函数值。
在一种可能的实现方式中,所述装置还包括:
判别模块,用于调用判别器对所述预测生成图像进行判别,获得所述预测生成图像的判别结果;
第三确定模块,用于基于所述判别结果,确定第三损失函数的函数值;所述判别结果用以指示所述预测生成图像是否为真实图像;
所述模型训练模块1140,用于基于所述第一损失函数的函数值,所述第二损失函数的函数值以及所述第三损失函数的函数值,对所述图像处理模型进行训练。
在一种可能的实现方式中,所述第一编码网络包含N个编码层,且所述N个编码层两两相连,N≥2,且为正整数;
所述第一编码模块1110,包括:
集合获取子模块,用于获取所述第一样本图像对应的第一图像金字塔,所述第一图像金字塔是对所述第一样本图像按照指定梯度下采样获取的图像集合,所述第一图像金字塔中包含N个第一待处理图像;
编码子模块,用于将所述N个第一待处理图像分别输入到对应的编码层中,对所述N个第一待处理图像进行编码,获得所述第一样本图像对应的N个第一特征图;
其中,响应于目标编码层为所述N个编码层中的非第一个编码层,所述目标编码层的输入还包括上一个编码层输出的第一特征图。
在一种可能的实现方式中,所述图像处理模型中的解码网络包含N个解码层,且所述N个解码层两两相连,所述N个解码层与所述N个编码层一一对应;
所述解码模块1120,包括:
解码子模块,用于将所述N个第一特征图分别输入到所述解码网络对应的解码层中,对所述N个第一特征图进行解码,获得N个解码结果;所述N个解码结果具有相同的分辨率;
合并子模块,用于对所述N个解码结果进行合并,获得所述第一样本图像的预测分割图像;
其中,响应于目标解码层为所述N个解码层中的非第一个解码层,所述目标解码层的输入还包括上一个解码层输出的解码结果。
在一种可能的实现方式中,所述装置还包括:
图像获取模块,用于基于第三样本图像,获取所述图像处理模型的先验约束图像;所述第三样本图像是所述目标医学对象的第三模态的样本医学图像;所述先验约束图像用以指示所述目标医学对象在所述第三样本图像中的位置;
第二编码模块,用于调用所述图像处理模型中的第二编码网络,基于所述先验约束图像进行编码,获得所述第三样本图像对应的第二特征图;
合并模块,用于对所述第一特征图以及所述第二特征图进行合并,获得综合特征图;
所述解码模块1120,用于调用所述图像处理模块中的解码网络,基于所述综合特征图进行解码,获得所述第一样本图像的所述预测分割图像;
所述生成模块1130,用于调用所述图像处理模型中的生成网络,基于所述综合特征图生成所述预测生成图像。
在一种可能的实现方式中,所述装置还包括:
裁剪模块,用于基于所述目标医学对象的位置,对所述先验约束图像进行裁剪;
所述第二编码模块,用于调用所述图像处理模型中的第二编码网络,对裁剪后的所述先验约束图像进行编码,获得所述第三样本图像对应的第二特征图。
在一种可能的实现方式中,所述图像获取模块,用于调用语义分割网络,对所述第三样本图像进行处理,获取所述图像处理模型的先验约束图像。
在一种可能的实现方式中,所述第二编码网络中的参数与所述第一编码网络中的参数权值共享。
综上所述,本申请实施例提供的用于医学图像的图像处理装置,通过获取目标医学对象对应的多模态的样本医学图像,以及目标医学图像对应的包含指定类型区域标签的标签图像,基于多模态的样本医学图像中的第一样本图像生成预测分割图像,以及预测生成图像,基于预测分割图像与标签图像之间的差异,预测生成图像与目标医学对象对应的第二样本图像之间的差异,对包含第一编码网络,解码网络以及生成网络的图像处理模型进行训练,从而使得训练获得图像处理模型能够基于单一模态的医学图像,获取到多模态的医学图像的特征,使得获得的医学图像分割结果包含的信息较为全面,提高了对医学图像的分割效果;
进一步的,基于训练获得的图像处理模型可以基于单一模态的医学图像,生成其他模态的医学图像,从而解决医学图像分析过程中的图像缺失问题。
图12示出了本申请一示例性实施例示出的计算机设备1200的结构框图。该计算机设备可以实现为本申请上述方案中的服务器。所述计算机设备1200包括中央处理单元(Central Processing Unit,CPU)1201、包括随机存取存储器(Random Access Memory,RAM)1202和只读存储器(Read-Only Memory,ROM)1203的***存储器1204,以及连接***存储器1204和中央处理单元1201的***总线1205。所述计算机设备1200还包括用于存储操作***1209、应用程序1210和其他程序模块1211的大容量存储设备1206。
所述大容量存储设备1206通过连接到***总线1205的大容量存储控制器(未示出)连接到中央处理单元1201。所述大容量存储设备1206及其相关联的计算机可读介质为计算机设备1200提供非易失性存储。也就是说,所述大容量存储设备1206可以包括诸如硬盘或者只读光盘(Compact Disc Read-Only Memory,CD-ROM)驱动器之类的计算机可读介质(未示出)。
不失一般性,所述计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、可擦除可编程只读寄存器(Erasable Programmable Read Only Memory,EPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-OnlyMemory,EEPROM)闪存或其他固态存储其技术,CD-ROM、数字多功能光盘(DigitalVersatile Disc,DVD)或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然,本领域技术人员可知所述计算机存储介质不局限于上述几种。上述的***存储器1204和大容量存储设备1206可以统称为存储器。
根据本公开的各种实施例,所述计算机设备1200还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即计算机设备1200可以通过连接在所述***总线1205上的网络接口单元1207连接到网络1208,或者说,也可以使用网络接口单元1207来连接到其他类型的网络或远程计算机***(未示出)。
所述存储器还包括至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、至少一段程序、代码集或指令集存储于存储器中,中央处理器1201通过执行该至少一条指令、至少一段程序、代码集或指令集来实现上述各个实施例所示的用于医学图像的图像处理方法中的全部或部分步骤。
图13示出了本申请一个示例性实施例提供的计算机设备1300的结构框图。该计算机设备1300可以实现为上述的终端,比如:智能手机、平板电脑、笔记本电脑或台式电脑。计算机设备1300还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
通常,计算机设备1300包括有:处理器1301和存储器1302。
处理器1301可以包括一个或多个处理核心,比如4核心处理器、13核心处理器等。处理器1301可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1301也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器1301可以集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器1301还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器1302可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器1302还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器1302中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器1301所执行以实现本申请中方法实施例提供的用于医学图像的图像处理方法中的全部或部分步骤。
在一些实施例中,计算机设备1300还可选包括有:***设备接口1303和至少一个***设备。处理器1301、存储器1302和***设备接口1303之间可以通过总线或信号线相连。各个***设备可以通过总线、信号线或电路板与***设备接口1303相连。具体地,***设备包括:射频电路1304、显示屏1305、摄像头组件1306、音频电路1307、定位组件1308和电源1309中的至少一种。
***设备接口1303可被用于将I/O(Input/Output,输入/输出)相关的至少一个***设备连接到处理器1301和存储器1302。在一些实施例中,处理器1301、存储器1302和***设备接口1303被集成在同一芯片或电路板上;在一些其他实施例中,处理器1301、存储器1302和***设备接口1303中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
在一些实施例中,计算机设备1300还包括有一个或多个传感器1310。该一个或多个传感器1310包括但不限于:加速度传感器1311、陀螺仪传感器1312、压力传感器1313、指纹传感器1314、光学传感器1315以及接近传感器1316。
本领域技术人员可以理解,图13中示出的结构并不构成对计算机设备1300的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
在一示例性实施例中,还提供了一种计算机可读存储介质,用于存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现上述用于医学图像的图像处理方法中的全部或部分步骤。例如,该计算机可读存储介质可以是只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、只读光盘(Compact Disc Read-Only Memory,CD-ROM)、磁带、软盘和光数据存储设备等。
在一示例性实施例中,还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述图2、图4或图5任一实施例所示方法的全部或部分步骤。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。
Claims (15)
1.一种用于医学图像的图像处理方法,其特征在于,所述方法包括:
调用图像处理模型中的第一编码网络,对第一样本图像进行编码,获得所述第一样本图像对应的第一特征图;所述第一样本图像是目标医学对象的第一模态的样本医学图像;
调用所述图像处理模型中的解码网络,基于所述第一特征图进行解码,获得所述第一样本图像的预测分割图像;所述预测分割图像用以指示预测出的至少一个指定类型区域;
调用所述图像处理模型中的生成网络,基于所述第一特征图生成预测生成图像;所述预测生成图像是所述第一样本图像对应的第二模态的预测图像;
基于所述预测分割图像与标签图像之间的差异,所述预测生成图像与第二样本图像之间的差异,对所述图像处理模型进行训练;所述第二样本图像是所述目标医学对象的第二模态的样本医学图像;所述标签图像是所述目标医学对象对应的,用以指示至少一个指定类型区域的图像。
2.根据权利要求1所述的方法,其特征在于,所述基于预测分割图像与所述标签图像之间的差异,所述预测生成图像与所述第二样本图像之间的差异,对所述图像处理模型进行训练,包括:
基于所述预测分割图像与所述标签图像之间的差异,确定第一损失函数的函数值;
基于所述预测生成图像与所述第二样本图像之间的差异,确定第二损失函数的函数值;
基于所述第一损失函数的函数值,以及所述第二损失函数的函数值,对所述图像处理模型进行训练。
3.根据权利要求2所述的方法,其特征在于,所述基于所述第一损失函数的函数值,以及所述第二损失函数的函数值,对所述图像处理模型进行训练,包括:
基于所述第一损失函数的函数值,对所述第一编码网络的参数以及所述解码网络的参数进行更新;
基于所述第二损失函数的函数值,对所述第一编码网络的参数以及所述生成网络的参数进行更新。
4.根据权利要求2所述的方法,其特征在于,所述基于所述预测分割图像与所述标签图像之间的差异,确定第一损失函数的函数值包括:
基于所述预测分割图像与所述标签图像的相似性,确定所述第一损失函数的第一分支函数的函数值;
基于所述预测分割图像中预测出的至少一个指定类型区域的位置,与所述标签图像中的至少一个指定类型区域的位置,确定所述第一损失函数的第二分支函数的函数值;
基于所述第一分支函数的函数值以及第二分支函数的函数值,确定所述第一损失函数的函数值。
5.根据权利要求4所述的方法,其特征在于,基于所述预测分割图像与所述标签图像的相似性,确定所述第一损失函数的第一分支函数的函数值,包括:
获取所述预测分割图像中的各个划分区域分别对应的权重值;所述预测分割图像中的各个划分区域包含所述至少一个指定类型区域;
基于所述预测分割图像中的各个划分区域分别对应的权重值,以及所述预测分割图像中的各个划分区域与所述标签图像中的各个划分区域的相似性,确定所述第一损失函数的第一分支函数的函数值。
6.根据权利要求2所述的方法,其特征在于,所述方法还包括:
调用判别器对所述预测生成图像进行判别,获得所述预测生成图像的判别结果;
基于所述判别结果,确定第三损失函数的函数值;所述判别结果用以指示所述预测生成图像是否为真实图像;
所述基于所述第一损失函数的函数值,以及所述第二损失函数的函数值,对所述图像处理模型进行训练,包括:
基于所述第一损失函数的函数值,所述第二损失函数的函数值以及所述第三损失函数的函数值,对所述图像处理模型进行训练。
7.根据权利要求1所述的方法,其特征在于,所述第一编码网络包含N个编码层,且所述N个编码层两两相连,N≥2,且为正整数;
所述调用图像处理模型中的第一编码网络,对第一样本图像进行编码,获得所述第一样本图像对应的第一特征图,包括:
获取所述第一样本图像对应的第一图像金字塔,所述第一图像金字塔是对所述第一样本图像按照指定梯度下采样获取的图像集合,所述第一图像金字塔中包含N个第一待处理图像;
将所述N个第一待处理图像分别输入到对应的编码层中,对所述N个第一待处理图像进行编码,获得所述第一样本图像对应的N个第一特征图;
其中,响应于目标编码层为所述N个编码层中的非第一个编码层,所述目标编码层的输入还包括上一个编码层输出的第一特征图。
8.根据权利要求7所述的方法,其特征在于,所述图像处理模型中的解码网络包含N个解码层,且所述N个解码层两两相连,所述N个解码层与所述N个编码层一一对应;
所述调用所述图像处理模型中的解码网络,基于所述第一特征图进行解码,获得所述第一样本图像的预测分割图像,包括:
将所述N个第一特征图分别输入到所述解码网络对应的解码层中,对所述N个第一特征图进行解码,获得N个解码结果;所述N个解码结果具有相同的分辨率;
对所述N个解码结果进行合并,获得所述第一样本图像的预测分割图像;
其中,响应于目标解码层为所述N个解码层中的非第一个解码层,所述目标解码层的输入还包括上一个解码层输出的解码结果。
9.根据权利要求1所述的方法,其特征在于,所述方法还包括:
基于第三样本图像,获取所述图像处理模型的先验约束图像;所述第三样本图像是所述目标医学对象的第三模态的样本医学图像;所述先验约束图像用以指示所述目标医学对象在所述第三样本图像中的位置;
调用所述图像处理模型中的第二编码网络,基于所述先验约束图像进行编码,获得所述第三样本图像对应的第二特征图;
对所述第一特征图以及所述第二特征图进行合并,获得综合特征图;
所述调用所述图像处理模型中的解码网络,基于所述第一特征图进行解码,获得所述第一样本图像的预测分割图像,包括:
调用所述图像处理模块中的解码网络,基于所述综合特征图进行解码,获得所述第一样本图像的所述预测分割图像;
所述调用所述图像处理模型中的生成网络,基于所述第一特征图生成预测生成图像,包括:
调用所述图像处理模型中的生成网络,基于所述综合特征图生成所述预测生成图像。
10.根据权利要求9所述的方法,其特征在于,在调用所述图像处理模型中的第二编码网络,基于所述先验约束图像进行编码,获得所述第三样本图像对应的第二特征图之前,还包括:
基于所述目标医学对象的位置,对所述先验约束图像进行裁剪;
所述调用所述图像处理模型中的第二编码网络,基于所述先验约束图像进行编码,获得所述第三样本图像对应的第二特征图,包括:
调用所述图像处理模型中的第二编码网络,对裁剪后的所述先验约束图像进行编码,获得所述第三样本图像对应的第二特征图。
11.根据权利要求9所述的方法,其特征在于,所述基于第三样本图像,获取所述图像处理模型的先验约束图像,包括:
调用语义分割网络,对所述第三样本图像进行处理,获取所述图像处理模型的先验约束图像。
12.根据权利要求9所述的方法,其特征在于,所述第二编码网络中的参数与所述第一编码网络中的参数权值共享。
13.一种用于医学图像的图像处理装置,其特征在于,所述装置包括:
第一编码模块,用于调用图像处理模型中的第一编码网络,对第一样本图像进行编码,获得所述第一样本图像对应的第一特征图;所述第一样本图像是目标医学对象的第一模态的样本医学图像;
解码模块,用于调用所述图像处理模型中的解码网络,基于所述第一特征图进行解码,获得所述第一样本图像的预测分割图像;所述预测分割图像用以指示预测出的至少一个指定类型区域;
生成模块,用于调用所述图像处理模型中的生成网络,基于所述第一特征图生成预测生成图像;所述预测生成图像是所述第一样本图像对应的第二模态的预测图像;
模型训练模块,用于基于所述预测分割图像与所述标签图像之间的差异,所述预测生成图像与第二样本图像之间的差异,对所述图像处理模型进行训练;所述第二样本图像是所述目标医学对象的第二模态的样本医学图像;所述标签图像是所述目标医学对象对应的,用以指示至少一个指定类型区域的图像。
14.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器存储有至少一条指令、至少一条程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至12任一所述的用于医学图像的图像处理方法。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条计算机程序,所述计算机程序由处理器加载并执行以实现如权利要求1至12任一所述的用于医学图像的图像处理方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110938701.XA CN114283151A (zh) | 2021-08-16 | 2021-08-16 | 用于医学图像的图像处理方法、装置、设备及存储介质 |
PCT/CN2022/107341 WO2023020198A1 (zh) | 2021-08-16 | 2022-07-22 | 用于医学图像的图像处理方法、装置、设备及存储介质 |
US18/132,824 US20230245426A1 (en) | 2021-08-16 | 2023-04-10 | Image processing method and apparatus for medical image, device and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110938701.XA CN114283151A (zh) | 2021-08-16 | 2021-08-16 | 用于医学图像的图像处理方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114283151A true CN114283151A (zh) | 2022-04-05 |
Family
ID=80868460
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110938701.XA Pending CN114283151A (zh) | 2021-08-16 | 2021-08-16 | 用于医学图像的图像处理方法、装置、设备及存储介质 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20230245426A1 (zh) |
CN (1) | CN114283151A (zh) |
WO (1) | WO2023020198A1 (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114494251A (zh) * | 2022-04-06 | 2022-05-13 | 南昌睿度医疗科技有限公司 | Spect图像处理方法以及相关设备 |
CN114708436A (zh) * | 2022-06-02 | 2022-07-05 | 深圳比特微电子科技有限公司 | 语义分割模型的训练方法、语义分割方法、装置和介质 |
WO2023020198A1 (zh) * | 2021-08-16 | 2023-02-23 | 腾讯科技(深圳)有限公司 | 用于医学图像的图像处理方法、装置、设备及存储介质 |
CN116778021A (zh) * | 2023-08-22 | 2023-09-19 | 北京大学 | 医学图像生成方法、装置、电子设备和存储介质 |
WO2023207743A1 (zh) * | 2022-04-27 | 2023-11-02 | 腾讯科技(深圳)有限公司 | 图像检测方法、装置、计算机设备、存储介质及程序产品 |
WO2024077738A1 (en) * | 2022-10-13 | 2024-04-18 | Guangdong Oppo Mobile Telecommunications Corp., Ltd. | Learned image compression based on fast residual channel attention network |
WO2024087858A1 (zh) * | 2022-10-24 | 2024-05-02 | 腾讯科技(深圳)有限公司 | 图像处理模型的训练方法、装置、电子设备、计算机程序产品及计算机存储介质 |
CN118071742A (zh) * | 2024-04-19 | 2024-05-24 | 山东工商学院 | 一种基于标签引导扩散模型的特征级虚拟多模态融合方法 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116402812B (zh) * | 2023-06-07 | 2023-09-19 | 江西业力医疗器械有限公司 | 一种医疗用影像数据的处理方法及*** |
CN116433795B (zh) * | 2023-06-14 | 2023-08-29 | 之江实验室 | 基于对抗生成网络的多模态影像生成方法和装置 |
CN116580037B (zh) * | 2023-07-10 | 2023-10-13 | 天津医科大学第二医院 | 一种基于深度学习的鼻咽癌图像分割方法及*** |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10346974B2 (en) * | 2017-05-18 | 2019-07-09 | Toshiba Medical Systems Corporation | Apparatus and method for medical image processing |
CN109754447B (zh) * | 2018-12-28 | 2021-06-22 | 上海联影智能医疗科技有限公司 | 图像生成方法、装置、设备和存储介质 |
CN110544275B (zh) * | 2019-08-19 | 2022-04-26 | 中山大学 | 生成配准的带病灶分割标签的多模态mri的方法、***及介质 |
CN111145147B (zh) * | 2019-12-14 | 2023-08-22 | 中国科学院深圳先进技术研究院 | 多模态医学图像的分割方法及终端设备 |
CN112669247A (zh) * | 2020-12-09 | 2021-04-16 | 深圳先进技术研究院 | 一种用于多任务医学图像合成的先验指导型网络 |
CN114283151A (zh) * | 2021-08-16 | 2022-04-05 | 腾讯科技(深圳)有限公司 | 用于医学图像的图像处理方法、装置、设备及存储介质 |
-
2021
- 2021-08-16 CN CN202110938701.XA patent/CN114283151A/zh active Pending
-
2022
- 2022-07-22 WO PCT/CN2022/107341 patent/WO2023020198A1/zh unknown
-
2023
- 2023-04-10 US US18/132,824 patent/US20230245426A1/en active Pending
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023020198A1 (zh) * | 2021-08-16 | 2023-02-23 | 腾讯科技(深圳)有限公司 | 用于医学图像的图像处理方法、装置、设备及存储介质 |
CN114494251A (zh) * | 2022-04-06 | 2022-05-13 | 南昌睿度医疗科技有限公司 | Spect图像处理方法以及相关设备 |
CN114494251B (zh) * | 2022-04-06 | 2022-07-15 | 南昌睿度医疗科技有限公司 | Spect图像处理方法以及相关设备 |
WO2023207743A1 (zh) * | 2022-04-27 | 2023-11-02 | 腾讯科技(深圳)有限公司 | 图像检测方法、装置、计算机设备、存储介质及程序产品 |
CN114708436A (zh) * | 2022-06-02 | 2022-07-05 | 深圳比特微电子科技有限公司 | 语义分割模型的训练方法、语义分割方法、装置和介质 |
WO2024077738A1 (en) * | 2022-10-13 | 2024-04-18 | Guangdong Oppo Mobile Telecommunications Corp., Ltd. | Learned image compression based on fast residual channel attention network |
WO2024087858A1 (zh) * | 2022-10-24 | 2024-05-02 | 腾讯科技(深圳)有限公司 | 图像处理模型的训练方法、装置、电子设备、计算机程序产品及计算机存储介质 |
CN116778021A (zh) * | 2023-08-22 | 2023-09-19 | 北京大学 | 医学图像生成方法、装置、电子设备和存储介质 |
CN116778021B (zh) * | 2023-08-22 | 2023-11-07 | 北京大学 | 医学图像生成方法、装置、电子设备和存储介质 |
CN118071742A (zh) * | 2024-04-19 | 2024-05-24 | 山东工商学院 | 一种基于标签引导扩散模型的特征级虚拟多模态融合方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2023020198A1 (zh) | 2023-02-23 |
US20230245426A1 (en) | 2023-08-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114283151A (zh) | 用于医学图像的图像处理方法、装置、设备及存储介质 | |
EP3335158B1 (en) | Three-dimensional (3d) convolution with 3d batch normalization | |
CN111429421B (zh) | 模型生成方法、医学图像分割方法、装置、设备及介质 | |
CN111597946B (zh) | 图像生成器的处理方法、图像生成方法及装置 | |
CN107688783B (zh) | 3d图像检测方法、装置、电子设备及计算机可读介质 | |
KR102328198B1 (ko) | 인공신경망을 이용한 장기의 부피 측정 방법 및 그 장치 | |
Shu et al. | LVC-Net: Medical image segmentation with noisy label based on local visual cues | |
CN107194933A (zh) | 结合卷积神经网络和模糊推理的脑肿瘤分割方法和装置 | |
CN112396605A (zh) | 网络训练方法及装置、图像识别方法和电子设备 | |
Nazir et al. | Machine Learning‐Based Lung Cancer Detection Using Multiview Image Registration and Fusion | |
CN113822323A (zh) | 脑部扫描图像的识别处理方法、装置、设备及存储介质 | |
WO2024087858A1 (zh) | 图像处理模型的训练方法、装置、电子设备、计算机程序产品及计算机存储介质 | |
CN112686899A (zh) | 医学图像分析方法和装置、计算机设备及存储介质 | |
Cahan et al. | Weakly supervised attention model for RV strain classification from volumetric CTPA scans | |
CN115965785A (zh) | 图像分割方法、装置、设备、程序产品及介质 | |
CN114974522A (zh) | 医学影像处理方法、装置、电子设备及存储介质 | |
CN113379770B (zh) | 鼻咽癌mr图像分割网络的构建方法、图像分割方法及装置 | |
Khanh Phung et al. | A research for segmentation of brain tumors based on GAN model | |
You et al. | Semantic difference guidance for the uncertain boundary segmentation of ct left atrial appendage | |
CN115552464A (zh) | 通过预测有符号距离图进行形状感知器官分割 | |
CN113724185B (zh) | 用于图像分类的模型处理方法、装置及存储介质 | |
Zhou et al. | Mdsu-net: A multi-attention and depthwise separable convolution network for stroke lesion segmentation | |
CN113724185A (zh) | 用于图像分类的模型处理方法、装置及存储介质 | |
KR102671699B1 (ko) | 신장암의 진단에 필요한 정보를 제공하는 방법 및 장치 | |
EP4386665A1 (en) | Image processing apparatus, method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40067088 Country of ref document: HK |
|
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |