CN111192269A - 模型训练、医学影像分割方法和装置 - Google Patents

模型训练、医学影像分割方法和装置 Download PDF

Info

Publication number
CN111192269A
CN111192269A CN202010001039.0A CN202010001039A CN111192269A CN 111192269 A CN111192269 A CN 111192269A CN 202010001039 A CN202010001039 A CN 202010001039A CN 111192269 A CN111192269 A CN 111192269A
Authority
CN
China
Prior art keywords
voxel
vector
medical image
feature extraction
extraction model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010001039.0A
Other languages
English (en)
Other versions
CN111192269B (zh
Inventor
杨斌斌
魏东
马锴
郑冶枫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010001039.0A priority Critical patent/CN111192269B/zh
Publication of CN111192269A publication Critical patent/CN111192269A/zh
Application granted granted Critical
Publication of CN111192269B publication Critical patent/CN111192269B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/20ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • G06T2207/10081Computed x-ray tomography [CT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • G06T2207/10088Magnetic resonance imaging [MRI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10132Ultrasound image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30016Brain
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30061Lung
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Radiology & Medical Imaging (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Image Analysis (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本申请涉及一种模型训练、医学影像分割方法和装置,所述方法包括:获取已标注医学影像;将所述已标注医学影像的体素切块,输入至特征提取模型,得到所述特征提取模型输出的体素特征向量;根据所述支撑集体素切块的体素特征向量,得到与所述支撑集体素切块的体素类别对应的类别原型向量;确定所述预测集体素切块的体素特征向量与所述类别原型向量之间的向量距离;根据所述向量距离对所述特征提取模型进行训练,得到训练后特征提取模型;所述训练后特征提取模型用于对待标注医学影像进行影像分割。采用上述的方法可以节省进行模型训练时制作大量已标注医学影像所需耗费的时间和操作,提升了模型训练的效率。

Description

模型训练、医学影像分割方法和装置
技术领域
本申请涉及医学影像处理技术领域,特别是涉及一种用于医学影像分割的方法和装置、一种医学影像分割方法和装置、一种计算机可读存储介质和一种计算机设备。
背景技术
医学影像分割是影像学诊断中一项较为重要的技术。医学人员需要利用分割的医学影像进行病患分析和研究。
目前较为常见的医学影像分割方法,主要是利用卷积神经网络模型的语义分割。具体地,可以将医学影像输入至卷积神经网络模型,卷积神经网络模型提取出医学影像中各个体素切块的特征向量,根据特征向量标注各个体素切块的体素类别,当对医学影像中各个体素切块进行了体素类别的标注,则完成了医学影像的分割。
为了更准确地进行医学影像分割,需要利用大量的已标注的医学影像作为训练样本对卷积神经网络模型进行训练。
然而,不同于对普通的影像标注,医学影像的标注需要专业人员针对医学影像中密集的大量体素逐个进行标注,该人工标注的过程,通常需要耗费大量的人力物力才能得到足够的训练样本对用于进行医学影像分割的卷积神经网络模型进行训练。
因此,相关技术的图像分割方法存在着模型训练的效率较低的问题。
发明内容
基于此,有必要针对模型训练的效率较低的技术问题,提供一种用于医学影像分割的方法和装置、一种医学影像分割方法和装置、一种计算机可读存储介质和一种计算机设备。
一种用于医学影像分割的模型训练方法,包括:
获取已标注医学影像;所述已标注医学影像包括多个体素切块;多个所述体素切块标注有体素类别;多个所述体素切块包括支撑集体素切块和预测集体素切块;
将所述已标注医学影像的体素切块,输入至特征提取模型,得到所述特征提取模型输出的体素特征向量;
根据所述支撑集体素切块的体素特征向量,得到与所述支撑集体素切块的体素类别对应的类别原型向量;
确定所述预测集体素切块的体素特征向量与所述类别原型向量之间的向量距离;
根据所述向量距离对所述特征提取模型进行训练,得到训练后特征提取模型;所述训练后特征提取模型用于对待标注医学影像进行影像分割。
一种医学影像分割方法,包括:
接收终端上传的医学影像;所述医学影像包括已标注医学影像和待标注医学影像;所述已标注医学影像包括标注有体素类别的多个体素切块;所述已标注医学影像中的所述体素切块包括支撑集体素切块和预测集体素切块;
将所述已标注医学影像的体素切块,输入至特征提取模型,得到所述特征提取模型输出的体素特征向量;
根据所述支撑集体素切块的体素特征向量,得到与所述支撑集体素切块的体素类别对应的类别原型向量;
确定所述预测集体素切块的体素特征向量与所述类别原型向量之间的向量距离;
根据所述向量距离对所述特征提取模型进行训练,得到训练后特征提取模型;
将所述待标注医学影像的体素切块,输入至所述训练后特征提取模型,得到所述训练后特征提取模型输出的待预测体素特征向量;
确定所述待预测体素特征向量与所述类别原型向量之间的向量距离,并根据所述待预测体素特征向量与所述类别原型向量之间的向量距离,确定目标类别原型向量;
将所述待标注医学影像的体素切块标注为所述目标类别原型向量对应的体素类别,并对标注后的所述待标注医学影像进行影像分割,得到分割医学影像;
将所述分割医学影像发送至所述终端。
一种用于医学影像分割的模型训练装置,包括:
影像获取模块,用于获取已标注医学影像;所述已标注医学影像包括多个体素切块;多个所述体素切块标注有体素类别;多个所述体素切块包括支撑集体素切块和预测集体素切块;
输入模块,用于将所述已标注医学影像的体素切块,输入至特征提取模型,得到所述特征提取模型输出的体素特征向量;
原型向量确定模块,用于根据所述支撑集体素切块的体素特征向量,得到与所述支撑集体素切块的体素类别对应的类别原型向量;
向量距离确定模块,用于确定所述预测集体素切块的体素特征向量与所述类别原型向量之间的向量距离;
训练模块,用于根据所述向量距离对所述特征提取模型进行训练,得到训练后特征提取模型;所述训练后特征提取模型用于对待标注医学影像进行影像分割。
一种医学影像分割装置,包括:
影像接收模块,用于接收终端上传的医学影像;所述医学影像包括已标注医学影像和待标注医学影像;所述已标注医学影像包括标注有体素类别的多个体素切块;所述已标注医学影像中的所述体素切块包括支撑集体素切块和预测集体素切块;
输入模块,用于将所述已标注医学影像的体素切块,输入至特征提取模型,得到所述特征提取模型输出的体素特征向量;
原型向量确定模块,用于根据所述支撑集体素切块的体素特征向量,得到与所述支撑集体素切块的体素类别对应的类别原型向量;
向量距离确定模块,用于确定所述预测集体素切块的体素特征向量与所述类别原型向量之间的向量距离;
训练模块,用于根据所述向量距离对所述特征提取模型进行训练,得到训练后特征提取模型;
分割模块,用于将所述待标注医学影像的体素切块,输入至所述训练后特征提取模型,得到所述训练后特征提取模型输出的待预测体素特征向量;确定所述待预测体素特征向量与所述类别原型向量之间的向量距离,并根据所述待预测体素特征向量与所述类别原型向量之间的向量距离,确定目标类别原型向量;将所述待标注医学影像的体素切块标注为所述目标类别原型向量对应的体素类别,并对标注后的所述待标注医学影像进行影像分割,得到分割医学影像;
反馈模块,用于将所述分割医学影像发送至所述终端。
一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如下步骤:
获取已标注医学影像;所述已标注医学影像包括多个体素切块;多个所述体素切块标注有体素类别;多个所述体素切块包括支撑集体素切块和预测集体素切块;
将所述已标注医学影像的体素切块,输入至特征提取模型,得到所述特征提取模型输出的体素特征向量;
根据所述支撑集体素切块的体素特征向量,得到与所述支撑集体素切块的体素类别对应的类别原型向量;
确定所述预测集体素切块的体素特征向量与所述类别原型向量之间的向量距离;
根据所述向量距离对所述特征提取模型进行训练,得到训练后特征提取模型;所述训练后特征提取模型用于对待标注医学影像进行影像分割。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:
获取已标注医学影像;所述已标注医学影像包括多个体素切块;多个所述体素切块标注有体素类别;多个所述体素切块包括支撑集体素切块和预测集体素切块;
将所述已标注医学影像的体素切块,输入至特征提取模型,得到所述特征提取模型输出的体素特征向量;
根据所述支撑集体素切块的体素特征向量,得到与所述支撑集体素切块的体素类别对应的类别原型向量;
确定所述预测集体素切块的体素特征向量与所述类别原型向量之间的向量距离;
根据所述向量距离对所述特征提取模型进行训练,得到训练后特征提取模型;所述训练后特征提取模型用于对待标注医学影像进行影像分割。
上述的用于医学影像分割的方法和装置、医学影像分割方法和装置、计算机可读存储介质和计算机设备,通过首先采用已标注医学影像中的支撑集体素切块的体素特征向量,得到各个体素类别的类别原型向量,然后,根据已标注医学影像中的预测集体素切块的体素特征向量与各个体素类别的类别原型向量之间的向量距离,对特征提取模型进行训练。由此,利用同一个已标注医学影像中各个体素切块在体素特征向量的相关性对特征提取模型进行训练,根据体素特征向量之间的向量距离,即可以使得特征提取模型训练至收敛,因此,无须采用大量的已标注医学影像作为训练样本对特征提取模型进行训练,从而节省了进行模型训练时制作大量已标注医学影像所需耗费的时间和操作,提升了模型训练的效率。
附图说明
图1为一个实施例中一种模型训练方法的应用环境图;
图2为一个实施例中一种用于医学影像分割的模型训练方法的流程示意图;
图3A为一个实施例的一种脑部MRI影像的示意图;
图3B为一个实施例的脑部MRI影像分割的示意图;
图3C是一个实施例的一种肺部CT影像的示意图;
图3D是一个实施例的一种肺部CT影像分割的示意图;
图4为一个实施例的一种基于向量距离确定体素切块的体素类别的示意图;
图5为一个实施例中一种医学影像分割方法的流程示意图;
图6为一个实施例中一种用于医学影像分割的模型训练装置的结构框图;
图7为一个实施例中一种医学影像分割装置的结构框图;
图8为一个实施例中一种脑部MRI影像分割方法的流程示意图;
图9为一个实施例中一种脑部MRI影像分割的应用场景的示意图;
图10为一个实施例中一种计算机设备的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
图1为一个实施例中一种模型训练方法的应用环境图。参照图1,该模型训练方法应用于医学影像分割***。该医学影像分割***包括终端110和服务器120。其中,终端110和服务器120通过网络连接。终端110具体可以是台式终端或移动终端,移动终端具体可以手机、平板电脑、笔记本电脑等中的至少一种。服务器120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
如图2所示,在一个实施例中,提供了一种用于医学影像分割的模型训练方法。本实施例主要以该方法应用于上述图1中的服务器120来举例说明。
首先需要说明的是,本申请的模型训练方法可以应用于医学影像分割的应用场景中。医学影像的影像模态通常可以包括有计算机断层成像(CT,Computed Tomography),核磁共振成像(MRI,Magnetic Resonance Imaging),超声成像(Ultrasound)等影像模态。在上述的应用场景中,用户可以通过终端110登录医学影像处理平台,医学影像处理平台提供医学影像的上传入口,用户通过上传入口可以将某个患者的一组特定部位的相同影像模态的医学影像上传至服务器120。例如,可以将患者的脑部的多张MRI影像上传至服务器120。
用户可以通过医学影像处理平台提供的标注功能,对其中一张医学影像进行标注。例如,对于脑部MRI影像,用户可以根据脑部MRI影像中各个体素所处的脑组织,标注体素的脑组织结构类别,从而完成对医学影像的标注。
图3A是一个实施例的一种脑部MRI影像的示意图。如图所示的脑部MRI影像,包含有多种脑组织结构类别的脑组织。未分割的脑部MRI影像中,各个脑组织的轮廓不清晰,用户难以分析和研究。用户可以通过人工标注的方式,对脑部MRI影像中的各个体素标注。
图3B是一个实施例的一种脑部MRI影像分割的示意图。如图所示,经过标注之后,可以根据标注对脑部MRI影像进行分割,得到各个脑组织的轮廓之间清晰可见的脑部MRI影像,便于用户分析和研究。
图3C是一个实施例的一种肺部CT影像的示意图。如图所示,肺部CT影像,包含有多种肺组织结构类别的肺部组织。未分割的肺部CT影像中,各个肺部组织的轮廓不清晰,用户难以分析和研究。用户可以通过人工标注的方式,对肺部CT影像中的各个体素标注。
图3D是一个实施例的一种肺部CT影像分割的示意图。如图所示,经过标注之后,可以根据标注对肺部CT影像进行分割,得到各个肺部组织的轮廓之间清晰可见的肺部CT影像,便于用户分析和研究。
服务器120得到了一组医学影像,其中的一个医学影像为已标注医学影像,其余的医学影像为待标注医学影像。服务器120可以利用已标注医学影像作为训练样本,对预设的特征提取模型进行训练,并利用训练后的特征提取模型,对其余待标注医学影像进行标注,并根据标注的结果进行影像分割。
本申请的模型训练方法应用于上述的医学影像分割的应用场景时,可以采用少量的已标注医学影像对用于进行影像分割的模型进行训练,而无须制作大量的训练样本,节省了进行模型训练的时间和操作,提升了模型训练的效率。
参照图2,该模型训练方法具体包括如下步骤:
S202,获取已标注医学影像;所述已标注医学影像包括多个体素切块;多个所述体素切块标注有体素类别;多个所述体素切块包括支撑集体素切块和预测集体素切块。
其中,已标注医学影像可以为经过标注的三维医学影像。例如,CT影像、MRI影像等。
其中,体素可以为三维医学影像分割中的最小体积单位,通常也称为体积元素(Volume Pixel)。体素的概念是相对于二维影像中的像素而言,像素通常是二维平面,体素则通常为三维立方体。
其中,体素切块可以为在已标注医学影像中分割出的包含有一个或多个体素的影像块。例如,体素切块可以为23像素*23像素*23像素的一个影像块。
其中,体素类别可以为体素切块中所包含的体素所属的类别。例如,脑部的MRI影像中包括有不同的脑组织,不同的脑组织具有对应的脑组织结构类别,根据体素在影像中所处的脑组织所属的脑组织结构类别,确定体素切块的体素类别。
其中,支撑集体素切块可以为已标注医学影像中的用于确定不同体素类别的类别原型向量的体素切块。
其中,预测集体素切块可以为已标注医学影像中除支撑集体素切块之外的体素切块。
具体实现中,服务器120可以接收到用户通过终端110上传的经过人工标注的医学影像,作为上述的已标注医学影像。服务器120可以将已标注医学影像划分出多个切块,每个切块可以包含有已标注医学影像中的一个或多个体素,由此得到多个体素切块。
由于已标注医学影像中的体素已经被标注相应的体素类别,因此可以确定各个体素切块对应的体素类别。对于包含有多个体素的体素切块,则可以将处于切块中心的体素的体素类别,作为该体素切块的体素类别。
服务器120可以采用已标注医学影像中的体素切块,构建出对特征提取模型进行训练的训练样本集。
首先,服务器120可以将多个体素切块按照其体素类别进行分类,得到多个同类切块样本集,每个同类切块样本集中的体素切块,均属于相同的体素类别。多个同类切块样本集则形成一个完整的训练样本集。
然后,服务器120可以在训练样本集中随机选取出K个同类切块样本集。在每个同类切块样本集中,随机选取出N个体素切块,组成支撑集。支撑集中的体素切块,作为上述的支撑集体素切块。服务器120可以在K个同类切块样本集中除支撑集体素切块之外的体素切块中,随机选取出部分体素切块,组成预测集。预测集中的体素切块,作为上述的预测集体素切块。
S204,将所述已标注医学影像的体素切块,输入至特征提取模型,得到所述特征提取模型输出的体素特征向量。
其中,特征提取模型可以为用于从体素切块中提取出特征向量的深度神经网络。通过特征提取模型可以得到反映体素切块在特征空间上的特征的向量,因此,特征提取模型可以实现体素切块从数据空间至特征空间的映射。
具体实现中,服务器120可以预置一个特征提取模型,将已标注医学影像中的支撑集体素切块和预测集体素切块,作为训练样本输入至该特征提取模型,特征提取模型可以相应地输出各个体素切块的特征向量,得到支撑集体素切块和预测集体素切块各自的体素特征向量。
S206,根据所述支撑集体素切块的体素特征向量,得到与所述支撑集体素切块的体素类别对应的类别原型向量。
其中,类别原型向量可以为根据多个支撑集体素切块的体素特征向量得到的、用于反映属于同一体素类别的体素切块的共同特征的特征向量。
具体实现中,服务器120可以提取出属于同一体素类别的多个支撑集体素切块,并根据提取出的多个支撑集体素切块的体素特征向量,得到相应的体素类别的类别原型向量。重复上述过程,即可得到各个体素类别的类别原型向量。
根据多个支撑集体素切块的体素特征向量得到上述的类别原型向量的具体实施方式可以有多种,其中一种具体实施方式中,可以确定一个目标体素类别,针对属于该目标体素类别的多个支撑集体素切块的体素特征向量,确定多个体素特征向量的均值,将该均值作为目标体素类别的类别原型向量。另一种具体实施方式中,可以确定一个目标体素类别,针对属于该目标体素类别的多个支撑集体素切块的体素特征向量,确定多个体素特征向量的中间值,将该中间值作为目标体素类别的类别原型向量。
当然,本领域技术人员可以采用其他方式以根据多个支撑集体素切块的体素特征向量得到上述的类别原型向量,以使得体素类别对应的类别原型向量可以反映出该体素类别的体素切块的体素特征向量的共同特征。
S208,确定所述预测集体素切块的体素特征向量与所述类别原型向量之间的向量距离。
其中,向量距离可以用于度量特征向量之间在特征空间上的距离。向量距离可以具体为欧式距离((Euclidean Distance)、马氏距离(Mahalanobis Distance)等。
具体实现中,服务器120可以首先确定预测集体素切块的目标体素类别,然后查找该目标体素类别对应的类别原型向量。服务器120可以计算预测集体素切块的体素特征向量与目标体素类别对应的类别原型向量之间在特征空间上的距离,得到上述的向量距离。
S210,根据所述向量距离对所述特征提取模型进行训练,得到训练后特征提取模型;所述训练后特征提取模型用于对待标注医学影像进行影像分割。
首先需要说明的是,上述的向量距离可以度量预测集体素切块与所属的体素类别的类别原型向量之间的相似度。如果某个预测集体素切块的体素特征向量,与其所属体素类别对应的类别原型向量之间的向量距离较大,表明特征提取模型从体素切块中提取出的体素特征向量并不准确,需要进行训练,直至得到预测集体素切块的体素特征向量与其所属体素类别对应的类别原型向量之间的向量距离较小、而与其他体素类别对应的类别原型向量之间的向量距离较大为止。
具体实现中,服务器120在确定向量距离之后,可以根据该向量距离的距离大小,对特征提取模型中的权重值、偏置值等模型参数进行训练,以训练后特征提取模型的模型参数。
其中一种具体实施方式中,可以确定预测集体素切块的体素特征向量与多个体素类别的类别原型向量之间的向量距离,得到了多个向量距离。然后,确定预测集体素切块的体素特征向量与多个体素类别的类别原型向量之间的期望向量距离,根据向量距离与期望向量距离之间的差异,通过随机梯度下降优化的方式训练后特征提取模型的模型参数。
另一种具体实施方式中,可以根据预测集体素切块的体素特征向量与多个体素类别的类别原型向量之间的向量距离,确定预测集体素切块属于各个体素类别的预测概率,即,对预测集体素切块属于不同体素类别进行预测的概率分布。根据该概率分布确定交叉熵损失值,根据该交叉熵损失值,通过随机梯度下降优化的方式训练后特征提取模型的模型参数。
当然,本领域技术人员还可以通过其他方式以根据向量距离对特征提取模型进行训练。
实际应用中,可以根据向量距离对特征提取模型进行多轮的训练,直至特征提取模型收敛,即,预测集体素切块的体素特征向量与该预测集体素切块实际的体素类别的类别原型向量之间的向量距离较小、而与其他体素类别的类别原型向量之间的向量距离较大。当特征提取模型收敛,该特征提取模型即为上述的训练后特征提取模型。
服务器120得到训练后特征提取模型之后,可以将已标注医学影像的体素切块输入至该训练后特征提取模型,训练后特征提取模型输出优化的体素特征向量,根据该优化体素特征向量,可以得到各个体素类别对应的优化类别原型向量。在对待标注医学影像进行分割时,可以将待标注医学影像中的体素切块输入至训练后特征提取模型,得到待预测的体素切块的体素特征向量,计算待预测的体素切块的体素特征向量与各个体素类别的优化类别原型向量之间的向量距离,将向量距离最小的体素类别,标注为待标注医学影像中的体素切块的体素类别,由此对待标注医学影像中的各个体素切块进行标注,最后根据标注的结果,完成对待标注医学影像的影像分割。
上述的模型训练方法中,首先采用已标注医学影像中的支撑集体素切块的体素特征向量,得到各个体素类别的类别原型向量,然后,根据已标注医学影像中的预测集体素切块的体素特征向量与各个体素类别的类别原型向量之间的向量距离,对特征提取模型进行训练。由此,利用同一个已标注医学影像中各个体素切块在体素特征向量的相关性对特征提取模型进行训练,根据体素特征向量之间的向量距离,即可以使得特征提取模型训练至收敛,因此,无须采用大量的已标注医学影像作为训练样本对特征提取模型进行训练,从而节省了进行模型训练时制作大量已标注医学影像所需耗费的时间和操作,提升了模型训练的效率。
在一个实施例中,在所述步骤S202之后,所述方法还包括:
在多个所述体素类别中,随机选取出K个目标体素类别;K≥1;提取所述已标注医学影像中被标注为所述目标体素类别的体素切块,得到K个同类切块样本集;分别在K个所述同类切块样本集中,选取出N个所述支撑集体素切块;N>1;在K个所述切块样本集中除所述支撑集体素切块之外的体素切块中,选取出所述预测集体素切块;
当所述特征提取模型收敛,所述方法还包括:返回至所述在多个所述体素类别中,随机选取出K个目标体素类别的步骤,直至得到所述训练后特征提取模型。
具体实现中,服务器220在得到已标注医学影像之后,可以随机选取出K个目标体素类别。然后,从已标注医学影像的各个体素切块中,提取出体素类别为目标体素类别的体素切块,组成上述的同类切块样本集。由此,得到K个同类切块样本集,每个同类切块样本集中各个体素切块的体素类别均相同。
服务器120可以在K个同类切块样本集中,分别选取出N个体素切块,得到K*N个体素切块,组成支撑集(support set)。支撑集中的各个体素切块,即为上述的支撑集体素切块。
服务器120可以在K个切块样本集中,选取出除支撑集体素切块之外的体素切块,组成预测集(query set)。预测集中的各个体素切块,即为上述的预测集体素切块。
服务器120得到支撑集体素切块和预测集体素切块,采用支撑集体素切块和预测集体素切块对特征提取模型进行训练,当特征提取模型收敛,则可以返回至随机选取出K个目标体素类别的步骤,以采用不同的体素类别的体素切块对特征提取模型进行训练,直至得到上述的训练后特征提取模型。
需要说明的是,上述在K个体素类别中分别选取出N个体素切块进行模型训练的方式,通常称为小样本学习(few-shot learning)。小样本学习通过少量的样本对模型训练,在保证训练效果的同时,无须制作大量的训练样本,提升了模型训练的效率。
需要进一步说明的是,上述的支撑集和预测集,在模型训练中也称为Meta-Task(元任务)。采用Meta-Task进行模型训练的方式,也称为元学习(Meta Learning)或者学习如何学习(learning to learn)。整个模型训练的过程中,将样本集分解为多个不同的Meta-Task,在采用一个Meta-Task对模型训练之后,再采用新的Meta-Task对模型进行训练。通过采用不同的Meta-Task进行训练的机制,使得特征提取模型可以学习到不同的Meta-Task的共性,即,学习到不同体素类别的体素切块的体素特征向量的共同特征,使得在提取体素切块的体素特征向量时,即使对于新的体素类别的体素切块,特征提取模型仍然可以提取出准确反映体素切块的特征的体素特征向量,提升了特征提取模型的泛化能力。
上述的模型训练方法中,通过在多个体素类别中随机选取出K个体素类别,根据K个体素类别得到相应的K个同类切块样本集,再从K个同类切块样本集中分别选取出N个体素切块作为支撑集体素切块,从K个同类切块样本集中选取出支撑集体素切块之外的预测集体素切块,采用根据K个体素类别得到的支撑集体素切块和预测集体素切块将特征提取模型训练至收敛之后,再随机选取出另外K个体素类别,以采用不同体素类别的支撑集体素切块和预测集体素切块,对特征提取模型进行下一轮的训练,由此,在对用于医学影像分割的特征提取模型的训练过程中结合小样本学习和元学习,在提升模型训练的效率的同时,提升特征提取模型的泛化能力。
在一个实施例中,所述支撑集体素切块具有多个,所述步骤S206,包括:
确定多个所述支撑集体素切块的切块数量;统计多个所述支撑集体素切块的体素特征向量的向量总和;计算所述向量总和与所述切块数量的比值,得到所述类别原型向量。
具体实现中,服务器120可以首先统计属于同一个体素类别的多个支撑集体素切块的切块数量,以及,统计属于同一个体素类别的多个支撑集体素切块的体素特征向量的向量总和,将该向量总和除以切块数量,得到多个支撑集体素切块所属的体素类别对应的类别原型向量。
实际应用中,可以通过以下公式计算得到体素类别的类别原型向量ck
Figure BDA0002353471050000141
其中,|Sk|代表第k类体素类别的支撑集中所包含的支撑集体素切块的切块数量;xi代表第i个体素切块;yi代表第i个体素切块的体素类别;fφ(xi)代表第i个体素切块的体素特征向量;ck代表第k类体素类别的类别原型向量。
上述模型训练方法中,通过统计支撑集体素切块的体素特征向量的向量总和和支撑集体素切块的切块数量,根据向量总和和切块数量计算多个支撑集体素切块的体素特征向量的均值,无须通过复杂的计算方式即可得到体素类别的类别原型向量,节省了计算资源,提升了模型训练的效率。
在一个实施例中,所述步骤S208,包括:
确定所述预测集体素切块的体素特征向量的第一特征空间坐标;确定所述类别原型向量的第二特征空间坐标;根据所述第一特征空间坐标与所述第二特征空间坐标之间的坐标距离,得到所述向量距离。
具体实现中,服务器120可以通过欧式距离的方式计算出体素特征向量与类别原型向量之间的向量距离。具体地,可以确定预测集体素切块的体素特征向量在特征空间中的特征空间坐标,作为上述的第一特征空间坐标。服务器120还可以确定类别原型向量在特征空间中的特征空间坐标,作为上述的第二特征空间坐标。可以计算第一特征空间坐标与第二特征空间坐标之间的坐标距离,得到体素特征向量与类别原型向量之间的向量距离。
在一个实施例中,所述向量距离具有多个,所述步骤S210,包括:
根据多个所述向量距离的指数特征值,得到距离特征值总和;根据多个所述向量距离的指数特征值分别与所述距离特征值总和的比值,得到所述预测集体素切块的类别概率分布;根据所述类别概率分布训练所述特征提取模型,得到所述训练后特征提取模型;所述类别概率分布包括多个候选体素类别及其对应的实际预测概率。
其中,类别概率分布可以为多个候选体素类别及其对应的实际预测概率。
其中,实际预测概率可以为实际预测得到的预测集体素切块属于特定体素类别的概率。
具体实现中,针对于多个候选体素类别,服务器120分别计算预测集体素切块的体素特征向量与各个候选体素类别的类别原型向量之间的向量距离,由此得到多个向量距离。服务器120可以首先计算多个向量距离的相反数,对多个向量距离的相反数进行指数运算,得到各个向量距离的指数特征值。然后,计算多个向量距离的指数特征值的总和,得到上述的距离特征值总和。下一步,根据各个向量距离的指数特征值与距离特征值总和之间的比值,得到预测集体素切块属于各个候选体素类别的预测概率。
实际应用中,可以通过以下公式计算得到预测集体素切块的类别概率分布pφ
Figure BDA0002353471050000151
其中,exp(x)代表以自然常数e为底数的指数函数;d(fφ(x),ck)代表体素切块x的体素特征向量fφ(xi)与第k类体素类别的类别原型向量ck之间的向量距离;y代表体素切块x的体素类别;d(fφ(x),ck′)代表预测集中所有体素切块x的向量距离。上述公式中,计算向量距离的相反数,再将向量距离的相反数进行exp指数运算,得到指数特征值。将某个向量距离的指数特征值与针对多个向量距离的指数特征值的累计总和的比值,求得该向量距离对应的体素切块属于某个体素类别的预测概率。
服务器120得到类别概率分布之后,可以根据该类别概率分布对特征提取模型进行训练。通过多轮迭代训练,使得类别概率分布中预测集体素切块的实际体素类别的实际预测概率达到饱和时或者不再下降时,而其他候选体素类别的实际预测概率接近于0%时,代表特征提取模型收敛,可以将该特征提取模型作为上述的训练后特征提取模型。
需要说明的是,当预测集体素切块的体素特征向量与某个体素类别的类别原型向量之间的向量距离越小,预测集体素切块属于某个候选体素类别的实际预测概率越高,通过将向量距离转换为对各个候选体素类别的预测概率,可以简化计算过程,避免对数据量较大的向量距离进行运算。
上述的模型训练方法中,通过将向量距离转换为对各个候选体素类别的预测概率,得到类别概率分布,并基于类别概率分布对特征提取模型进行训练,可以避免对数据量较大的向量距离进行运算,简化了进行模型训练的计算量,提升了模型训练的效率。
在一个实施例中,所述根据所述类别概率分布训练所述特征提取模型,得到所述训练后特征提取模型,包括:
确定所述预测集体素切块的实际体素类别;根据所述实际体素类别,确定所述类别概率分布中各个所述候选体素类别的期望预测概率;计算各个所述候选体素类别的实际预测概率与所述期望预测概率的差值,得到多个交叉熵损失值;根据多个所述交叉熵损失值调整所述特征提取模型的模型参数,并返回至所述将所述已标注医学影像的体素切块,输入至特征提取模型的步骤,直至多个所述交叉熵损失值符合预设的模型收敛条件时,将所述模型参数调整后的特征提取模型作为所述训练后特征提取模型。
具体实现中,服务器120可以根据已标注医学影像中对预测集体素切块的标注结果,确定预测集体素切块的实际体素类别。
确定预测集体素切块的实际体素类别之后,可以确定类别概率分布中各个候选体素类别的期望预测概率。例如,类别概率分布中包括候选体素类别A、B和C,实际预测概率分别为20%、30%、50%。确定实际体素类别为A,因此,候选体素类别A、B和C的期望预测概率分别为100%、0%、0%。
服务器120可以根据实际预测概率与期望预测概率,通过交叉熵损失函数和随机梯度下降算法,调整特征提取模型的模型参数。
实际应用中,可以采用下列的交叉熵损失函数计算交叉熵损失值:
Figure BDA0002353471050000171
其中,Q代表预测集中预测集体素切块的切块数量;x代表预测集体素切块;k代表预测集体素切块x的实际体素类别;pφ代表类别概率分布;J(φ)代表预测集体素切块的交叉熵损失值。
根据交叉熵损失值调整特征提取模型的模型参数之后,可以返回至上述的步骤S204,得到支撑集体素切块和预测集体素切块更新的体素特征向量,根据支撑集体素切块更新的体素特征向量,得到更新的类别原型向量。然后,根据预测集体素切块更新的体素特征向量与更新的类别原型向量之间的向量距离,再次调整特征提取模型的模型参数,得到更新的特征提取模型,当更新的特征提取模型符合模型收敛条件时,将更新的特征提取模型作为上述的训练后特征提取模型。
在一个实施例中,还包括:
获取待标注医学影像,并将所述待标注医学影像的体素切块,输入至所述训练后特征提取模型,得到所述训练后特征提取模型输出的待预测体素特征向量;确定所述待预测体素特征向量与所述类别原型向量之间的向量距离;根据所述待预测体素特征向量与所述类别原型向量之间的向量距离,确定目标类别原型向量;将所述待标注医学影像的体素切块标注为所述目标类别原型向量对应的体素类别,并对标注后的所述待标注医学影像进行影像分割。
其中,待标注医学影像可以为未标注的医学影像。待标注医学影像包括多个体素切块。
具体实现中,在模型训练之后,服务器120可以将待标注医学影像的各个体素切块输入至训练后特征提取模型,训练后特征提取模型输出各个体素切块的体素特征向量。为了区分说明,待标注医学影像的各个体素切块的体素特征向量,命名为待预测体素特征向量。
服务器120可以计算体素切块的待预测体素特征向量与各个体素类别的类别原型向量之间的向量距离,确定与待预测体素特征向量之间的向量距离最小的类别原型向量,作为上述的目标类别原型向量,针对待标注医学影像的体素切块,标注目标类别原型向量对应的体素类别。
图4是一个实施例的一种基于向量距离确定体素切块的体素类别的示意图。如图所示,在特征空间中存在有多个体素类别的类别原型向量401,属于目标体素类别的体素切块的体素特征向量402,与目标体素类别的类别原型向量401之间的向量距离较小。当得到了待标注医学影像中某个体素切块的待预测体素特征向量403,计算待预测体素特征向量403与各个体素类别的类别原型向量401之间的向量距离,查找与待预测体素特征向量403之间的向量距离最小的类别原型向量401,由此确定类别原型向量401对应的目标体素类别,作为待标注医学影像中某个体素切块的体素类别。
服务器120对待标注医学影像中的各个体素切块均标注完成之后,则可以根据标注的结果对待标注医学影像进行影像分割。
如图5所示,在一个实施例中,提供了一种医学影像分割方法。本实施例主要以该方法应用于上述图1中的服务器120来举例说明。参照图5,该医学影像分割方法具体包括如下步骤:
S502,接收终端上传的医学影像;所述医学影像包括已标注医学影像和待标注医学影像;所述已标注医学影像包括标注有体素类别的多个体素切块;所述已标注医学影像中的所述体素切块包括支撑集体素切块和预测集体素切块;
S504,将所述已标注医学影像的体素切块,输入至特征提取模型,得到所述特征提取模型输出的体素特征向量;
S506,根据所述支撑集体素切块的体素特征向量,得到与所述支撑集体素切块的体素类别对应的类别原型向量;
S508,确定所述预测集体素切块的体素特征向量与所述类别原型向量之间的向量距离;
S510,根据所述向量距离对所述特征提取模型进行训练,得到训练后特征提取模型;
S512,将所述待标注医学影像的体素切块,输入至所述训练后特征提取模型,得到所述训练后特征提取模型输出的待预测体素特征向量;确定所述待预测体素特征向量与所述类别原型向量之间的向量距离,并根据所述待预测体素特征向量与所述类别原型向量之间的向量距离,确定目标类别原型向量;将所述待标注医学影像的体素切块标注为所述目标类别原型向量对应的体素类别,并对标注后的所述待标注医学影像进行影像分割,得到分割医学影像;
S514,将所述分割医学影像发送至所述终端。
具体实现中,用户可以通过终端110登录医学影像处理平台,医学影像处理平台提供医学影像的上传入口,用户通过上传入口可以将某个患者的一组特定部位的相同影像模态的医学影像上传至服务器120。终端110上传的医学影像中可以包含有已标注医学影像和待标注医学影像。
服务器120可以根据已标注医学影像中的体素切块,得到支撑集体素切块和预测集体素切块,并采用支撑集体素切块和预测集体素切块对特征提取模型进行训练,得到训练后特征提取模型。
由于服务器120对特征提取模型进行训练的过程在上述实施例中已有详细说明,在此不再赘述。
服务器120可以将待标注医学影像的体素切块,输入至训练后特征提取模型中,训练后特征提取模型输出体素切块的待预测体素特征向量。服务器120计算待预测体素特征向量与各个体素类别的类别原型向量之间的向量距离,得到与待预测体素特征向量之间的向量距离最小的目标类别原型向量,将目标类别原型向量对应的体素类别,标注为待标注医学影像中的体素切块的体素类别,由此对待标注医学影像中的各个体素切块进行标注,最后根据标注的结果,完成对待标注医学影像的影像分割。
服务器120对标注后的待标注医学影像进行影像分割,得到分割医学影像,并将分割医学影像反馈至终端110。
上述的医学影像分割方法中,首先采用已标注医学影像中的支撑集体素切块的体素特征向量,得到各个体素类别的类别原型向量,然后,根据已标注医学影像中的预测集体素切块的体素特征向量与各个体素类别的类别原型向量之间的向量距离,对特征提取模型进行训练。由此,利用同一个已标注医学影像中各个体素切块在体素特征向量的相关性对特征提取模型进行训练,根据体素特征向量之间的向量距离,即可以使得特征提取模型训练至收敛,因此,无须采用大量的已标注医学影像作为训练样本对特征提取模型进行训练,从而,节省了用户制作大量已标注医学影像所需耗费的时间和操作,提升了进行医学影像分割的效率。
应该理解的是,虽然图2和图5的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2和图5中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
如图6所示,在一个实施例中,提供了一种用于医学影像分割的模型训练装置,包括:
影像获取模块602,用于获取已标注医学影像;所述已标注医学影像包括多个体素切块;多个所述体素切块标注有体素类别;多个所述体素切块包括支撑集体素切块和预测集体素切块;
输入模块604,用于将所述已标注医学影像的体素切块,输入至特征提取模型,得到所述特征提取模型输出的体素特征向量;
原型向量确定模块606,用于根据所述支撑集体素切块的体素特征向量,得到与所述支撑集体素切块的体素类别对应的类别原型向量;
向量距离确定模块608,用于确定所述预测集体素切块的体素特征向量与所述类别原型向量之间的向量距离;
训练模块610,用于根据所述向量距离对所述特征提取模型进行训练,得到训练后特征提取模型;所述训练后特征提取模型用于对待标注医学影像进行影像分割。
在一个实施例中,所述向量距离具有多个,所述训练模块610,具体用于:
根据多个所述向量距离的指数特征值,得到距离特征值总和;根据多个所述向量距离的指数特征值分别与所述距离特征值总和的比值,得到所述预测集体素切块的类别概率分布;所述类别概率分布包括多个候选体素类别及其对应的实际预测概率;根据所述类别概率分布训练所述特征提取模型,得到所述训练后特征提取模型。
在一个实施例中,所述训练模块610,还具体用于:
确定所述预测集体素切块的实际体素类别;根据所述实际体素类别,确定所述类别概率分布中各个所述候选体素类别的期望预测概率;计算各个所述候选体素类别的实际预测概率与所述期望预测概率的差值,得到多个交叉熵损失值;根据多个所述交叉熵损失值调整所述特征提取模型的模型参数,并返回至所述将所述已标注医学影像的体素切块,输入至特征提取模型的步骤,直至所述特征提取模型收敛。
在一个实施例中,所述支撑集体素切块具有多个,所述原型向量确定模块606,具体用于:
确定多个所述支撑集体素切块的切块数量;统计多个所述支撑集体素切块的体素特征向量的向量总和;计算所述向量总和与所述切块数量的比值,得到所述类别原型向量。
在一个实施例中,所述向量距离确定模块608,具体用于:
确定所述预测集体素切块的体素特征向量的第一特征空间坐标;确定所述类别原型向量的第二特征空间坐标;根据所述第一特征空间坐标与所述第二特征空间坐标之间的坐标距离,得到所述向量距离。
在一个实施例中,所述装置还包括:
影像分割模块,用于获取待标注医学影像,并将所述待标注医学影像的体素切块,输入至所述训练后特征提取模型,得到所述训练后特征提取模型输出的待预测体素特征向量;确定所述待预测体素特征向量与所述类别原型向量之间的向量距离;根据所述待预测体素特征向量与所述类别原型向量之间的向量距离,确定目标类别原型向量;将所述待标注医学影像的体素切块标注为所述目标类别原型向量对应的体素类别,并对标注后的所述待标注医学影像进行影像分割。
在一个实施例中,所述装置还包括:
类别选取模块,用于在多个所述体素类别中,随机选取出K个目标体素类别;K≥1;
样本集构建模块,用于提取所述已标注医学影像中被标注为所述目标体素类别的体素切块,得到K个同类切块样本集;
支撑集构建模块,用于分别在K个所述同类切块样本集中,选取出N个所述支撑集体素切块;N>1;
预测集构建模块,用于在K个所述切块样本集中除所述支撑集体素切块之外的体素切块中,选取出所述预测集体素切块;
返回模块,用于返回至所述在多个所述体素类别中,随机选取出K个目标体素类别的步骤,直至得到所述训练后特征提取模型。
如图7所示,在一个实施例中,提供了一种医学影像分割装置,包括:
影像接收模块702,用于接收终端上传的医学影像;所述医学影像包括已标注医学影像和待标注医学影像;所述已标注医学影像包括标注有体素类别的多个体素切块;所述已标注医学影像中的所述体素切块包括支撑集体素切块和预测集体素切块;
输入模块704,用于将所述已标注医学影像的体素切块,输入至特征提取模型,得到所述特征提取模型输出的体素特征向量;
原型向量确定模块706,用于根据所述支撑集体素切块的体素特征向量,得到与所述支撑集体素切块的体素类别对应的类别原型向量;
向量距离确定模块708,用于确定所述预测集体素切块的体素特征向量与所述类别原型向量之间的向量距离;
训练模块710,用于根据所述向量距离对所述特征提取模型进行训练,得到训练后特征提取模型;
分割模块712,用于将所述待标注医学影像的体素切块,输入至所述训练后特征提取模型,得到所述训练后特征提取模型输出的待预测体素特征向量;确定所述待预测体素特征向量与所述类别原型向量之间的向量距离,并根据所述待预测体素特征向量与所述类别原型向量之间的向量距离,确定目标类别原型向量;将所述待标注医学影像的体素切块标注为所述目标类别原型向量对应的体素类别,并对标注后的所述待标注医学影像进行影像分割,得到分割医学影像;
反馈模块714,用于将所述分割医学影像发送至所述终端。
关于模型训练、医学影像分割装置的具体限定可以参见上文中对于模型训练、医学影像分割方法的限定,在此不再赘述。上述模型训练、医学影像分割装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
上述提供的模型训练、医学影像分割装置可用于执行上述任意实施例提供的模型训练、医学影像分割方法,具备相应的功能和有益效果。
图8为一个实施例中一种脑部MRI影像分割方法的流程示意图。如图所示,该医学影像分割方法可以具体包括以下步骤:
S802,接收终端上传的一张已标注的脑部MRI影像和多张待标注的脑部MRI影像;
S804,在已标注的脑部MRI影像中,提取出多个体素切块,并根据脑部MRI影像的标注,确定提取出的多个体素切块的脑组织结构类别;
S806,采用提取出的多个体素切块,构建完整的训练样本集D={(x,y)};
S808,在训练样本集D={(x,y)}中,选取出K个脑组织结构类别的体素切块,得到K个同类切块样本集{N1,...,NK};
S810,从K个同类切块样本集中,分别提取出N个体素切块,形成支撑集Sk
S812,在K个同类切块样本集中提取出剩余的体素切块,形成预测集Qk
S814,将支撑集和预测集中的体素切块输入至预设的特征提取模型,得到支撑集和预测集中的体素切块各自的特征向量;
S816,根据支撑集中体素切块各自的特征向量,得到多个脑组织结构类别的原型向量ck
S818,分别计算预测集中的体素切块与各个脑组织结构类别的原型向量之间的欧式距离;
S820,根据预测集中的体素切块与各个脑组织结构类别的原型向量之间的欧式距离,得到预测集中的体素切块被预测为属于各个脑组织结构类别的概率;
S822,根据预测集中的体素切块被预测为属于各个脑组织结构类别的概率与预测集中的体素切块实际的脑组织结构类别,计算交叉熵损失值;
S824,根据交叉熵损失值训练后特征提取模型中的权重值和偏置值,得到中间特征提取模型;
S826,当中间特征提取模型收敛,则将中间特征提取模型作为训练后特征提取模型;
S828,在待标注的脑部MRI影像中,提取出多个体素切块,并输入提取出的多个体素切块至训练后特征提取模型,训练后特征提取模型输出各个体素切块的特征向量;
S830,计算训练后特征提取模型输出的特征向量与各个脑组织结构类别的原型向量之间的欧式距离;
S832,将与训练后特征提取模型输出的特征向量之间的欧式距离最小的原型向量,作为目标原型向量;
S834,根据目标原型向量对应的脑组织结构类别,对待标注的脑部MRI影像中的体素切块进行标注;
S836,根据待标注的脑部MRI影像中各个体素切块的标注结果,对待标注的脑部MRI影像进行影像分割,并将进行影像分割后的脑部MRI影像返回至终端,供终端显示。
图9为一个实施例中一种脑部MRI影像分割的应用场景的示意图。如图所示,通过用户对脑部MRI影像902中各个体素进行人工标注,得到已标注的脑部MRI影像904。采用已标注的脑部MRI影像904中被标注了体素类别的各个体素切块作为训练样本,对特征提取模型进行训练。训练完成后,将待标注的脑部MRI影像906输入至特征提取模型,特征提取模型可以输出待标注的脑部MRI影像906中各个体素切块的特征向量,根据输出的特征向量与不同体素类别的原型向量之间的欧式距离,确定体素切块的体素类别并标注,并根据标注对脑部MRI影像906进行分割,输出分割好的脑部MRI影像908。
图10示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是图1中的服务器120。如图10所示,该计算机设备包括该计算机设备包括通过***总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作***,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现模型训练、医学影像分割方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行模型训练、医学影像分割方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的模型训练、医学影像分割装置可以实现为一种计算机程序的形式,计算机程序可在如图10所示的计算机设备上运行。计算机设备的存储器中可存储组成该模型训练、医学影像分割装置的各个程序模块,比如,图6所示的影像获取模块602、输入模块604、原型向量确定模块606、向量距离确定模块608和训练模块610。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的模型训练、医学影像分割方法中的步骤。
例如,图10所示的计算机设备可以通过如图6所示的模型训练装置中的输入模块604执行将所述已标注医学影像的体素切块,输入至特征提取模型,得到所述特征提取模型输出的体素特征向量。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述模型训练、医学影像分割方法的步骤。此处模型训练、医学影像分割方法的步骤可以是上述各个实施例的模型训练、医学影像分割方法中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述模型训练、医学影像分割方法的步骤。此处模型训练、医学影像分割方法的步骤可以是上述各个实施例的模型训练、医学影像分割方法中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (12)

1.一种用于医学影像分割的模型训练方法,包括:
获取已标注医学影像;所述已标注医学影像包括多个体素切块;多个所述体素切块标注有体素类别;多个所述体素切块包括支撑集体素切块和预测集体素切块;
将所述已标注医学影像的体素切块,输入至特征提取模型,得到所述特征提取模型输出的体素特征向量;
根据所述支撑集体素切块的体素特征向量,得到与所述支撑集体素切块的体素类别对应的类别原型向量;
确定所述预测集体素切块的体素特征向量与所述类别原型向量之间的向量距离;
根据所述向量距离对所述特征提取模型进行训练,得到训练后特征提取模型;所述训练后特征提取模型用于对待标注医学影像进行影像分割。
2.根据权利要求1所述的方法,其特征在于,所述向量距离具有多个,所述根据所述向量距离对所述特征提取模型进行训练,得到训练后特征提取模型,包括:
根据多个所述向量距离的指数特征值,得到距离特征值总和;
根据多个所述向量距离的指数特征值分别与所述距离特征值总和的比值,得到所述预测集体素切块的类别概率分布;所述类别概率分布包括多个候选体素类别及其对应的实际预测概率;
根据所述类别概率分布训练所述特征提取模型,得到所述训练后特征提取模型。
3.根据权利要求2所述的方法,其特征在于,所述根据所述类别概率分布训练所述特征提取模型,得到所述训练后特征提取模型,包括:
确定所述预测集体素切块的实际体素类别;
根据所述实际体素类别,确定所述类别概率分布中各个所述候选体素类别的期望预测概率;
根据各个所述候选体素类别的实际预测概率与所述期望预测概率,得到多个交叉熵损失值;
根据多个所述交叉熵损失值调整所述特征提取模型的模型参数,并返回至所述将所述已标注医学影像的体素切块,输入至特征提取模型的步骤,直至所述特征提取模型收敛。
4.根据权利要求1所述的方法,其特征在于,所述支撑集体素切块具有多个,所述根据所述支撑集体素切块的体素特征向量,得到与所述支撑集体素切块的体素类别对应的类别原型向量,包括:
确定多个所述支撑集体素切块的切块数量;
统计多个所述支撑集体素切块的体素特征向量的向量总和;
计算所述向量总和与所述切块数量的比值,得到所述类别原型向量。
5.根据权利要求1所述的方法,其特征在于,所述确定所述预测集体素切块的体素特征向量与所述类别原型向量之间的向量距离,包括:
确定所述预测集体素切块的体素特征向量的第一特征空间坐标;
确定所述类别原型向量的第二特征空间坐标;
根据所述第一特征空间坐标与所述第二特征空间坐标之间的坐标距离,得到所述向量距离。
6.根据权利要求1所述的方法,其特征在于,还包括:
获取待标注医学影像,并将所述待标注医学影像的体素切块,输入至所述训练后特征提取模型,得到所述训练后特征提取模型输出的待预测体素特征向量;
确定所述待预测体素特征向量与所述类别原型向量之间的向量距离;
根据所述待预测体素特征向量与所述类别原型向量之间的向量距离,确定目标类别原型向量;
将所述待标注医学影像的体素切块标注为所述目标类别原型向量对应的体素类别,并对标注后的所述待标注医学影像进行影像分割。
7.根据权利要求3所述的方法,其特征在于,在所述获取已标注医学影像之后,所述方法还包括:
在多个所述体素类别中,随机选取出K个目标体素类别;K≥1;
提取所述已标注医学影像中被标注为所述目标体素类别的体素切块,得到K个同类切块样本集;
分别在K个所述同类切块样本集中,选取出N个所述支撑集体素切块;N>1;
在K个所述切块样本集中除所述支撑集体素切块之外的体素切块中,选取出所述预测集体素切块;
当所述特征提取模型收敛,所述方法还包括:
返回至所述在多个所述体素类别中,随机选取出K个目标体素类别的步骤,直至得到所述训练后特征提取模型。
8.一种医学影像分割方法,包括:
接收终端上传的医学影像;所述医学影像包括已标注医学影像和待标注医学影像;所述已标注医学影像包括标注有体素类别的多个体素切块;所述已标注医学影像中的所述体素切块包括支撑集体素切块和预测集体素切块;
将所述已标注医学影像的体素切块,输入至特征提取模型,得到所述特征提取模型输出的体素特征向量;
根据所述支撑集体素切块的体素特征向量,得到与所述支撑集体素切块的体素类别对应的类别原型向量;
确定所述预测集体素切块的体素特征向量与所述类别原型向量之间的向量距离;
根据所述向量距离对所述特征提取模型进行训练,得到训练后特征提取模型;
将所述待标注医学影像的体素切块,输入至所述训练后特征提取模型,得到所述训练后特征提取模型输出的待预测体素特征向量;
确定所述待预测体素特征向量与所述类别原型向量之间的向量距离,并根据所述待预测体素特征向量与所述类别原型向量之间的向量距离,确定目标类别原型向量;
将所述待标注医学影像的体素切块标注为所述目标类别原型向量对应的体素类别,并对标注后的所述待标注医学影像进行影像分割,得到分割医学影像;
将所述分割医学影像发送至所述终端。
9.一种用于医学影像分割的模型训练装置,包括:
影像获取模块,用于获取已标注医学影像;所述已标注医学影像包括多个体素切块;多个所述体素切块标注有体素类别;多个所述体素切块包括支撑集体素切块和预测集体素切块;
输入模块,用于将所述已标注医学影像的体素切块,输入至特征提取模型,得到所述特征提取模型输出的体素特征向量;
原型向量确定模块,用于根据所述支撑集体素切块的体素特征向量,得到与所述支撑集体素切块的体素类别对应的类别原型向量;
向量距离确定模块,用于确定所述预测集体素切块的体素特征向量与所述类别原型向量之间的向量距离;
训练模块,用于根据所述向量距离对所述特征提取模型进行训练,得到训练后特征提取模型;所述训练后特征提取模型用于对待标注医学影像进行影像分割。
10.一种医学影像分割装置,包括:
影像接收模块,用于接收终端上传的医学影像;所述医学影像包括已标注医学影像和待标注医学影像;所述已标注医学影像包括标注有体素类别的多个体素切块;所述已标注医学影像中的所述体素切块包括支撑集体素切块和预测集体素切块;
输入模块,用于将所述已标注医学影像的体素切块,输入至特征提取模型,得到所述特征提取模型输出的体素特征向量;
原型向量确定模块,用于根据所述支撑集体素切块的体素特征向量,得到与所述支撑集体素切块的体素类别对应的类别原型向量;
向量距离确定模块,用于确定所述预测集体素切块的体素特征向量与所述类别原型向量之间的向量距离;
训练模块,用于根据所述向量距离对所述特征提取模型进行训练,得到训练后特征提取模型;
分割模块,用于将所述待标注医学影像的体素切块,输入至所述训练后特征提取模型,得到所述训练后特征提取模型输出的待预测体素特征向量;确定所述待预测体素特征向量与所述类别原型向量之间的向量距离,并根据所述待预测体素特征向量与所述类别原型向量之间的向量距离,确定目标类别原型向量;将所述待标注医学影像的体素切块标注为所述目标类别原型向量对应的体素类别,并对标注后的所述待标注医学影像进行影像分割,得到分割医学影像;
反馈模块,用于将所述分割医学影像发送至所述终端。
11.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至8中任一项所述方法的步骤。
12.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至8中任一项所述方法的步骤。
CN202010001039.0A 2020-01-02 2020-01-02 模型训练、医学影像分割方法和装置 Active CN111192269B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010001039.0A CN111192269B (zh) 2020-01-02 2020-01-02 模型训练、医学影像分割方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010001039.0A CN111192269B (zh) 2020-01-02 2020-01-02 模型训练、医学影像分割方法和装置

Publications (2)

Publication Number Publication Date
CN111192269A true CN111192269A (zh) 2020-05-22
CN111192269B CN111192269B (zh) 2023-08-22

Family

ID=70709672

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010001039.0A Active CN111192269B (zh) 2020-01-02 2020-01-02 模型训练、医学影像分割方法和装置

Country Status (1)

Country Link
CN (1) CN111192269B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111429460A (zh) * 2020-06-12 2020-07-17 腾讯科技(深圳)有限公司 图像分割方法、图像分割模型训练方法、装置和存储介质
CN111815764A (zh) * 2020-07-21 2020-10-23 西北工业大学 基于自监督3d全卷积神经网络的超声三维重建方法
CN112150471A (zh) * 2020-09-23 2020-12-29 创新奇智(上海)科技有限公司 基于少样本的语义分割方法及装置、电子设备、存储介质
CN112561921A (zh) * 2020-11-10 2021-03-26 联想(北京)有限公司 一种图像分割方法及设备
CN112950774A (zh) * 2021-04-13 2021-06-11 复旦大学附属眼耳鼻喉科医院 一种三维建模装置、手术规划***及教学***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109410185A (zh) * 2018-10-10 2019-03-01 腾讯科技(深圳)有限公司 一种图像分割方法、装置和存储介质
CN109872333A (zh) * 2019-02-20 2019-06-11 腾讯科技(深圳)有限公司 医学影像分割方法、装置、计算机设备和存储介质
CN110148192A (zh) * 2019-04-18 2019-08-20 上海联影智能医疗科技有限公司 医学影像成像方法、装置、计算机设备和存储介质
US20190279361A1 (en) * 2018-03-07 2019-09-12 University Of Virginia Patent Foundation Automatic quantification of cardiac mri for hypertrophic cardiomyopathy

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190279361A1 (en) * 2018-03-07 2019-09-12 University Of Virginia Patent Foundation Automatic quantification of cardiac mri for hypertrophic cardiomyopathy
CN109410185A (zh) * 2018-10-10 2019-03-01 腾讯科技(深圳)有限公司 一种图像分割方法、装置和存储介质
CN109872333A (zh) * 2019-02-20 2019-06-11 腾讯科技(深圳)有限公司 医学影像分割方法、装置、计算机设备和存储介质
CN110148192A (zh) * 2019-04-18 2019-08-20 上海联影智能医疗科技有限公司 医学影像成像方法、装置、计算机设备和存储介质

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111429460A (zh) * 2020-06-12 2020-07-17 腾讯科技(深圳)有限公司 图像分割方法、图像分割模型训练方法、装置和存储介质
CN111429460B (zh) * 2020-06-12 2020-09-22 腾讯科技(深圳)有限公司 图像分割方法、图像分割模型训练方法、装置和存储介质
CN111815764A (zh) * 2020-07-21 2020-10-23 西北工业大学 基于自监督3d全卷积神经网络的超声三维重建方法
CN112150471A (zh) * 2020-09-23 2020-12-29 创新奇智(上海)科技有限公司 基于少样本的语义分割方法及装置、电子设备、存储介质
CN112150471B (zh) * 2020-09-23 2023-09-05 创新奇智(上海)科技有限公司 基于少样本的语义分割方法及装置、电子设备、存储介质
CN112561921A (zh) * 2020-11-10 2021-03-26 联想(北京)有限公司 一种图像分割方法及设备
CN112950774A (zh) * 2021-04-13 2021-06-11 复旦大学附属眼耳鼻喉科医院 一种三维建模装置、手术规划***及教学***

Also Published As

Publication number Publication date
CN111192269B (zh) 2023-08-22

Similar Documents

Publication Publication Date Title
CN111192269B (zh) 模型训练、医学影像分割方法和装置
CN110321920B (zh) 图像分类方法、装置、计算机可读存储介质和计算机设备
CN102629376B (zh) 图像配准
CN110599526B (zh) 图像配准方法、计算机设备和存储介质
BR112020022270A2 (pt) sistemas e métodos para unificar modelos estatísticos para diferentes modalidades de dados
US11403812B2 (en) 3D object reconstruction method, computer apparatus and storage medium
US20220253977A1 (en) Method and device of super-resolution reconstruction, computer device and storage medium
US20220076052A1 (en) Similarity determining method and device, network training method and device, search method and device, and electronic device and storage medium
CN114298234B (zh) 脑部医学影像分类方法、装置、计算机设备和存储介质
CN111507285A (zh) 人脸属性识别方法、装置、计算机设备和存储介质
CN115861248A (zh) 医学图像分割方法、医学模型训练方法、装置和存储介质
US20240148321A1 (en) Predicting Body Composition from User Images Using Deep Learning Networks
CN109410189B (zh) 图像分割方法以及图像的相似度计算方法、装置
CN116129141A (zh) 医学数据处理方法、装置、设备、介质和计算机程序产品
CN111209946B (zh) 三维图像处理方法、图像处理模型训练方法及介质
Shekar et al. An efficient stacked ensemble model for the detection of COVID-19 and skin cancer using fused feature of transfer learning and handcrafted methods
CN113962990B (zh) 胸部ct图像识别方法、装置、计算机设备和存储介质
CN116188478A (zh) 图像分割方法、装置、电子设备及存储介质
CN115690063A (zh) 骨密度参数检测方法、计算机设备和存储介质
CN112801908B (zh) 图像去噪方法、装置、计算机设备和存储介质
CN115393376A (zh) 医学图像处理方法、装置、计算机设备和存储介质
CN115375787A (zh) 伪影校正方法、计算机设备及可读存储介质
CN114724016A (zh) 图像分类方法、计算机设备和存储介质
CN114241198A (zh) 获取局部影像组学特征的方法、装置、设备以及存储介质
CN115151951A (zh) 通过分析配准确定图像相似性

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant