CN114359169A - 训练模型的方法、图像处理方法、装置及电子设备 - Google Patents
训练模型的方法、图像处理方法、装置及电子设备 Download PDFInfo
- Publication number
- CN114359169A CN114359169A CN202111534785.7A CN202111534785A CN114359169A CN 114359169 A CN114359169 A CN 114359169A CN 202111534785 A CN202111534785 A CN 202111534785A CN 114359169 A CN114359169 A CN 114359169A
- Authority
- CN
- China
- Prior art keywords
- image
- model
- processed
- human tissues
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000012549 training Methods 0.000 title claims abstract description 45
- 238000003672 processing method Methods 0.000 title claims abstract description 17
- 238000012545 processing Methods 0.000 claims abstract description 40
- 238000004590 computer program Methods 0.000 claims description 10
- 230000011218 segmentation Effects 0.000 abstract description 16
- 230000008569 process Effects 0.000 abstract description 14
- 210000001519 tissue Anatomy 0.000 description 55
- 238000002591 computed tomography Methods 0.000 description 28
- 238000010586 diagram Methods 0.000 description 11
- 210000003205 muscle Anatomy 0.000 description 9
- 210000003489 abdominal muscle Anatomy 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000005070 sampling Methods 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 6
- 210000001596 intra-abdominal fat Anatomy 0.000 description 6
- 210000004003 subcutaneous fat Anatomy 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 239000013598 vector Substances 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000001360 synchronised effect Effects 0.000 description 4
- 238000003709 image segmentation Methods 0.000 description 3
- 238000011176 pooling Methods 0.000 description 3
- 208000024172 Cardiovascular disease Diseases 0.000 description 2
- 206010020772 Hypertension Diseases 0.000 description 2
- 208000008589 Obesity Diseases 0.000 description 2
- 210000000579 abdominal fat Anatomy 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000002790 cross-validation Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 230000007721 medicinal effect Effects 0.000 description 2
- 208000030159 metabolic disease Diseases 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 235000020824 obesity Nutrition 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 230000003187 abdominal effect Effects 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013501 data transformation Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001125 extrusion Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 238000002595 magnetic resonance imaging Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 235000003715 nutritional status Nutrition 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000000149 penetrating effect Effects 0.000 description 1
- 238000002600 positron emission tomography Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Processing (AREA)
- Apparatus For Radiation Diagnosis (AREA)
Abstract
本申请实施例提供了一种训练模型的方法和一种图像处理方法,应用于图像处理领域,尤其是医学图像处理,在训练模型的过程中,加入注意力机制,以权重的形式对各人体组织的区域进行重校正,使得当前卷积层的部分目标权重大于前一卷积层的预设权重,从而提升目标模型的处理效果。在图像处理过程中,利用该目标模型代替传统的手动分割,从而实现CT图像中多个人体组织的自动分割。本申请实施例提供的方法,能够一次性分割出多个人体组织,提高准确性。
Description
技术领域
本申请属于图像处理领域,尤其涉及一种训练模型的方法、图像处理方法、装置及电子设备。
背景技术
人体成分分析是测量身体组成成分(主要是肌肉和脂肪)比例的一种分析方法,常用于评估营养状态、以及肥胖、代谢性疾病、心血管疾病、高血压等。电子计算机断层成像(Computed Tomography,CT)是进行人体成分分析的常用手段,CT是通过X射线对人体进行扫描,获得断层图像,断层图像能清晰地显示人体的肌肉和脂肪等组织的分布区域,基于断层图像中人体的肌肉和脂肪等组织的分布区域测量身体组成成分的比例。
目前,获取断层图像后,需要人工手动分割人体的肌肉和脂肪等组织的分布区域,人工手动分割依赖于主观经验,分割的准确性较低,大大限制了基于CT的人体成分分析在医学中的广泛应用。
发明内容
针对上述技术问题,本申请实施例提供一种训练模型的方法、图像处理方法、装置及电子设备,能够自动分割出人体的肌肉和脂肪等组织的分布区域,提高准确性。
第一方面,本申请实施例提供了一种训练模型的方法,该方法包括:
通过预设模型的当前卷积层对第一图像使用多个目标权重进行卷积处理,得到第二图像,第一图像中包括多个人体组织,第二图像上标注了多个人体组织在第二图像中所占的区域,多个目标权重与多个人体组织一一对应,多个目标权重中的部分目标权重大于相对应的预设权重,预设权重是前一卷积层在进行卷积处理时使用的权重;
根据第二图像与第三图像进行模型训练,得到目标模型,第三图像是经人工处理后得到的,第三图像上标注了多个人体组织在第三图像中所占的区域。
特别的,多个人体组织中指定类型的人体组织的目标权重大于相对应的预设权重。
指定类型的人体组织包括腹部脂肪和腹部肌肉。
特别的,预设模型以Unet模型为基础模型。
特别的,当前卷积层包括第一卷积模块和第二卷积模块,第一卷积模块位于第二卷积模块之前,第一卷积模块用于提取第一图像中的多个人体组织的信息,第二卷积模块用于对预设权重进行调整得到目标权重。
第二方面,本申请实施例提供了一种训练模型的装置,该装置包括:
处理单元,用于通过预设模型的当前卷积层对第一图像使用多个目标权重进行卷积处理,得到第二图像,第一图像中包括多个人体组织,第二图像上标注了多个人体组织在第二图像中所占的区域,多个目标权重与多个人体组织一一对应,多个目标权重中的部分目标权重大于相对应的预设权重,预设权重是前一卷积层在进行卷积处理时使用的权重;根据第二图像与第三图像进行模型训练,得到目标模型,第三图像是经人工处理后得到的,第三图像上标注了多个人体组织在第三图像中所占的区域。
第三方面,本申请实施例提供了一种图像处理方法,该方法包括:
获取待处理图像,所述待处理图像包括多个人体组织;
将待处理图像输入目标模型,得到处理后的图像,处理后的图像上标注了多个人体组织在待处理图像中所占的区域,目标模型为前述第一方面得到的目标模型。
第四方面,本申请实施例提供了一种图像处理装置,该装置包括:
获取模块,用于获取待处理图像,待处理图像包括多个人体组织;
处理模块,用于将待处理图像输入目标模型,得到处理后的图像,处理后的图像上标注了多个人体组织在待处理图像中所占的区域,目标模型为前述第一方面得到的目标模型。
第五方面,本申请实施例还提供了一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如第三方面所述的图像处理方法。
第六方面,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,当所述计算机指令在计算机上运行时,使得所述计算机执行如第一方面所述的训练模型的方法,或如第三方面所述的图像处理方法。
第七方面,本申请实施例还提供了一种计算机程序产品,所述计算机程序产品包括计算机程序,当所述计算机程序产品在计算机上运行时,实现如第一方面所述的训练模型的方法,或如第三方面所述的图像处理方法。
本申请实施例提供了一种训练模型的方法和一种图像处理方法,在训练模型的过程中,加入注意力机制,使得当前卷积层的部分目标权重大于前一卷积层的预设权重,从而提升目标模型的处理效果。在图像处理过程中,利用该目标模型代替传统的手动分割,从而实现CT图像中多个人体组织的自动分割。本申请实施例提供的方法,能够一次性分割出多个人体组织,提高准确性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种训练模型的方法的流程示意图;
图2是本申请实施例提供的一种预设模型的结构示意图;
图3是本申请实施例提供的一种第二卷积模块的结构示意图;
图4是本申请实施例提供的一种图像处理方法的流程示意图;
图5是本申请实施例提供的又一种图像处理方法的流程示意图;
图6中的(a)图是本申请实施例提供的一种原始图像的示意图;
图6中的(b)图是本申请实施例提供的一种标注图像的示意图;
图6中的(c)图是本申请实施例提供的一种输出图像的示意图;
图7是本申请实施例提供的一种装置的结构示意图;
图8是本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
以下,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请实施例的描述中,除非另有说明,“多个”的含义是两个或两个以上,“至少一个”、“一个或多个”是指一个、两个或两个以上。
在本说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
电子计算机断层成像(CT)通过X射线穿透不同衰减系数的人体物质,获得断层图像,断层图像能清晰地显示人体肌肉和脂肪等组织的分布区域,通过分析人体组成成分,可以评估人体的营养状态,诊断肥胖、代谢性疾病、心血管疾病、高血压、癌症等疾病。
然而,目前获取断层图像后,需要医师手动分割人体的肌肉和脂肪等组织的分布区域,需要耗费的时间和人力成本较高,且医师依赖于主观经验,影响分割的准确性和客观性,大大限制了基于CT人体成分分析在医学中的广泛应用。或者,针对特定任务设计人工特征分割算法,但是该方法同样依赖医生的先验知识,并且医学图像标注数据获取困难,由于大部分算法是基于少数部位设计的,不能应用于其他部位,鲁棒性和泛化性能较差。因此,如何实现精准、快速、客观地对CT图像上肌肉和脂肪等人体组织进行分割是目前需要解决的问题。
为此,本申请实施例提供了一种训练模型的方法和一种图像处理方法,通过训练模型,实现端到端的肌肉、脂肪等人体组织的自动分割。在训练模型的过程中,加入注意力机制,以权重的形式对特征(人体组织)进行重校正,使得当前卷积层的部分目标权重大于前一卷积层的预设权重,从而提升目标模型的处理效果。在图像处理过程中,利用该目标模型代替传统的手动分割,从而实现CT图像中多个人体组织的自动分割,提高准确性。本申请实施例提供的方法,能够一次性自动分割出多个的人体组织,具有高Dice系数,收敛速度快,泛化性强,算法鲁棒性高等优点。
首先,对本申请实施例提供的训练模型的方法进行说明,图1示出了本申请实施例提供一种训练模型的方法100,该方法100至少包括以下步骤:
S101:获取训练集。
获取多张原始图像和每张原始图像对应的标注图像,例如,获取位于第三腰椎水平的腹部CT图像的多张原始图像与对应的多张标注图像,原始图像即通过仪器扫描的得到的CT图像,也可以称为CT切片,原始图像包括多个人体组织,如皮下脂肪、腹部肌肉、内脏脂肪以及其他组织等。标注图像上标注了皮下脂肪、腹部肌肉、内脏脂肪以及其他组织在原始图像中所占的区域,标注图像可以是医院的医师手工标注得到的。标注图像对应于第三图像。
CT图像用CT值来表示人体的每个组织器官的吸收系数,Hounsfield Units(HU)是CT值的单位,CT图像上的值代表了拍摄的部位是否正常,是否有病变。腹部肌肉可以使用第一预定阈值-29HU至+150HU进行标定,腹部脂肪组织可以使用第二预定阈值-190HU至-30HU进行标定。医师可以根据CT图像中像素的值对原始图像进行标注。
将原始图像输入预设模型之前对其进行预处理。将原始图像中低于-128HU的值设置为-128,高于150HU的值设置为150,以减少输入网络模型的信息量,CT图像可能是不同仪器扫描的,对原始图像进行z-score标准化,减少不同仪器之间的差距:
标注图像是单通道的灰度图,本申请实施例中,在模型训练时,可以将单通道的灰度图根据人体组织分为多通道图像,例如,采用one-hot编码方法将单通道的灰度图,按照皮下脂肪、腹部肌肉、内脏脂肪以及其他组织编码为四个通道图像,皮下脂肪对应的通道图像中,皮下脂肪的位置的像素点设置为1,其他部位的像素设置为0;腹部肌肉对应的通道图像中,腹部肌肉的位置设置为1,其他部位设置为0;内脏脂肪对应的通道图像中,内脏脂肪的位置设置为1,其他部位设置为0;其他组织对应的通道图像中,其他组织的位置设置为1,其他部位设置为0;则模型输出的图像可以是四通道图像。
将获取的所有原始图像分为训练集和验证集,如共545张原始图像,其中436张原始图像作为训练集,109张原始图像作为验证集。
对于训练集,通过对原始图像使用随机旋转、随机水平翻转、随机垂直翻转等数据增强手段,增加训练集的原始图像的数量。
将训练集中的原始图像作为模型的输入,原始图像的尺寸可以根据实际情况确定,例如,每张原始图像的大小为512×512像素。
S102:构建预设模型。
本申请实施例以Unet模型为基础模型,结合注意力机制构建预设模型。
示例性的,图2示出了本申请实施例提供的一种预设模型的结构示意图。如图2所示,预设模型的深度为5,包括自上而下的5个卷积层,为一个U形结构,预设模型包括两部分,编码和解码。在U形的左侧进行编码,编码用来获取人体组织的信息,减少图像的空间维度,增加通道数量,在U形的右侧进行解码,对人体组织进行精确定位。
且每一卷积层均设置第一卷积模块(ResConv)和第二卷积模块(SECA),第一卷积模块用于提取输入图像中多个人体组织的信息,第二卷积模块用于确定每个人体组织对应的权重,并增加或减少每个人体组织对应的权重。应理解,第一卷积模块和第二卷积模块的数量,具体可以根据需要进行设置,本申请实施例对此不进行任何限制。示例性的,在图2中,每个卷积层均在解码阶段设置1个第一卷积模块和1个第二卷积模块,在编码阶段设置1个第一卷积模块和1个第二卷积模块。
在左边的解码阶段,首先,将训练集中的图像(第一图像)输入到第一卷积层,通过第一卷积层中的第一卷积模块对输入图像进行通道增加,得到多个通道图,相当于放大输入图像的特征;并提取多个人体组织的信息,此处,将单通道的输入图像1×512×512转换为8通道的图像8×512×512,预设权重为人工手动设置的。通过第二卷积模块对8通道的图像8×512×512中的每个人体组织调整权重,得到目标权重,如,提高皮下脂肪、腹部肌肉、内脏脂肪的权重,降低其他组织的权重。图中,模块上方的数字例1、8、16表示特征图的通道数,模块侧面的数字例512×512表示特征图的尺寸。
然后,将第一卷积层中的第二卷积模块输出的特征信息(8通道的图像8×512×512)通过卷积进行下采样,得到8×256×256的图像,再输入第二卷积层的第一卷积模块中继续增加通道,提取特征信息,得到16通道的图像16×256×256,此时,第二卷积层使用的权重为第一卷积层的第二卷积模块输出的权重(当前卷积层的目标权重,下一卷积层的预设权重)。然后,通过第二卷积层的第二卷积模块继续对每个人体组织调整权重。应理解,通过卷积进行下采样,可以缩小图像尺寸,获取到更多图像的局部信息。
同理,将第二卷积层中的第二卷积模块输出的特征信息,通过卷积下采样为128×128,再输入第三卷积层中的第一卷积模块中继续增加通道至32,提取特征信息。将第三卷积层中的第二卷积模块输出的特征信息通过卷积继续进行下采样,再输入第四卷积层中的第一卷积模块中继续增加通道至64,提取特征信息。将第四卷积层中的第二卷积模块输出的特征信息通过卷积继续进行下采样,再输入第五卷积层中的第一卷积模块中继续增加通道至128,提取特征信息,此时图像为128×32×32。增加卷积层使得卷积的更深,得到的特征维度更高,更抽象,同时拟合的函数更多,最后使得图像效果更好。
并且,在每一次使用第一卷积模块提取特征信息后,第二卷积模块均对每个人体组织的权重进行调整。
在第一卷积层和第二卷积层中,第一卷积模块的卷积尺寸和填充尺寸(padding)分别为7和3;其余卷积层中,第一卷积模块的卷积尺寸均为3,padding均为1,所有的卷积模块步长均为1。下采样可以使用多种方式完成,例如最大池化(MaxPooling)。
在右边的编码阶段,首先,将第五卷积层中的第二卷积模块输出的特征信息通过反卷积进行上采样,再通过跳跃连接(Skip-Connection),与下采样时第四卷积层中的第二卷积模块提取的特征信息,进行特征拼接,将拼接后的特征信息依次传输至第一卷积模块和第二卷积模块,上采样过程中的第一卷积模块减少通道进行特征提取,第二卷积模块同样调整权重。应理解,上采样操作用于放大图像特征的尺寸,提高图像分辨率;比如,上采样操作可以采用内插值方法,即在原有图像像素的基础上在像素点之间采用合适的插值算法***新的元素。
第四卷积层依次向第三卷积层传输;直到传输至第一卷积层,利用一个1×1卷积(1×1Conv2D)进行通道调整,得到与输入图像相同尺寸的输出图像,或者,还原出4×512×512的4个的通道灰度图像,作为输出图像。
此外,上采样采用转置卷积(UpConv)恢复空间分辨率,上采样过程中的卷积核尺寸、步长和padding均与下采样过程中对应相同。由于下采样和上采样次数相同,由此,处理得到的输出图像和输入图像的尺寸相同。
示例性的,图3示出了图2中的一种第二卷积模块的结构示意图。
第二卷积模块为通道注意力模块,为预设模型添加注意力机制,将第一卷积模块提取的特征,送入通道注意力模块,将每个通道的特征进行区别对待,使预设模型更关注重要特征,抑制其他无关特征,使重要特征在处理过程中权重更大。
如图3所示,对输入第二卷积模块的特征图通过不同尺寸的卷积核进行卷积,从输入特征图中提取特征,差异部分被强化,其它部分被弱化。例如,将一个H×W×C大小的特征图做两种卷积得到图像U1和U2,所运用的卷积核大小分别是3和5,即kernel3×3和kernel5×5。
将两种卷积得到的图像相加(element-wise sum)得到图像U,后再对U进行挤压操作(Squeeze),由C×H×W的特征图得到C×1×1的channel级向量S,向量S将每个空间压缩成一系列实数。Squeeze的实现方式可以是全局平均池化(Fgp),全局平均池化将特征图所有像素值相加求平均,得到一个数值,即用该数值表示对应特征图,能够减少参数数量,减少计算量,减少过拟合。
然后通过一维卷积(Conv1D)避免降维,通过学习通道注意力得到向量Z,然后经过两个全连接层(Ffc)和softmax激活函数后,输出通道注意力向量,即两个矩阵α和β,将α和β分别与原始特征图卷积后的特征图U1和U2进行矩阵相乘(element-wise multiplication),然后加和输出最终向量V,向量V对应第二卷积模块输出的调整权重后的多通道图像。
S103:通过预设模型的当前卷积层对第一图像使用多个目标权重进行卷积处理,得到第二图像,根据第二图像与第三图像进行模型训练,得到目标模型。
第一卷积层中,第一图像为训练集中的图像,输入第一图像,输出第一卷积层卷积处理后的第二图像。
第二卷积层,以第一卷积层输出的第二图像为第一图像,进行卷积处理,得到第二卷积层输出的第二图像。其他卷积层同理。
在经过预设模型得到输出图像后,将输出图像与第三图像进行对比,求输出图像与第三图像之间的差值,即损失值,根据损失值确定预设模型的优化方向。
其中,yi,c为符号函数(0或1),若像素i的真实类别等于c则取1,否则为0。pi,c为第i个像素预测为第c类的概率。
本申请实施例在训练过程中可以采用Adam优化器来优化损失函数,可以采用余弦退火算法衰减学习率,应理解的是,也可以采用其他方式优化损失函数和学习率,本申请实施例在此不做限定。
除了通过以上方式训练目标模型外,在另一种实现方式中,可以采用五折交叉验证法,对获取的所有原始图像进行划分,即将获取的所有原始图像平均分成5等份,训练模型时将其中一份作为训练集,将其他4份作为验证集,训练方法与图1所示实施例相同,则可以训练5个模型,得到5个训练后的模型,将这5个训练后的模型使用一定的数据变换,例如求和,得到目标模型,该方法训练的目标模型可以解决稀疏标注情况下的过拟合问题。
在得到目标模型后,可以应用于实际医疗活动中,图4为本申请实施例提供的一种图像处理方法400,该方法400至少包括以下步骤:
S401:获取待处理图像,待处理图像包括多个人体组织。
S402:将待处理图像输入目标模型,得到处理后的图像,处理后的图像上标注了多个人体组织在待处理图像中所占的区域。
即将医疗活动中拍摄的CT图像,输入到目标模型中,得到处理后的图像,处理后的图像上标注了多个人体组织在待处理图像中所占的区域,即对图像进行了分割,医师可以根据分割图像对人体成分进行分析。
上述原始图像可以是增强CT图像,也可以是平扫CT图像。根据增强CT图像训练得到的目标模型,同样可以对平扫CT图像进行处理,增强了网络模型的泛化性。
应理解的是,本申请实施例提供的方法除了应用于CT图像分割外,经适当变形后,也可应用于正电子发射型计算机断层显像(Positron Emission Computed Tomography,PET)、磁共振成像(Magnetic Resonance Imaging,MRI)等类型的图像分割。
总之,本申请实施例提供了一种网络模型的训练方法和一种图像处理方法,如图5所示,获取训练集和测试集,并由医学专家对训练集和测试集中每张图像进行标注,得到模型训练时的标签,对训练集使用数据增强手段增加图像数量,经过归一化和交叉验证等处理后,使用训练集进行训练模型,得到目标模型。在训练模型的过程中,加入注意力机制,探索特征信息的多样性,使得网络更加关注重要的特征,抑制其他特征的权重,从而提升目标模型的处理效果。
使用测试集对目标模型进行测试,将测试集输入到目标模型,得到分割结果,将分割结果和测试集的标签进行对比,实现对目标模型的性能分析。
在图像处理过程中,利用该目标模型代替传统的手动分割,从而实现CT图像中各人体组织的自动分割。本申请实施例提供的方法,能够一次性分割出多个人体组织,提高准确性。此外,本申请实施例可以在不训练平扫CT图像的前提下得到较优的平扫CT图像分割结果。本申请实施例提供的方法有效提高了模型性能,加速了模型的收敛速度,增强了模型的泛化性。
以下对本申请实施例的有效性进行示例性说明。如图6所示,图6中的(a)图为原始图像,图6中的(b)图为人工标注后的图像,图6中的(c)图为将原始图像输入到目标模型中,目标模型输出的分割后的图像,对比图6中的(b)图和图6中的(c)图可知,目标模型输出的图像与人工标注后的图像相似度较高,可以表明目标模型分割的准确度较高,验证了本申请实施例提供的图像处理方法的可行性和有效性。
以下对本申请实施例提供的装置和电子设备进行说明。
图7为本申请实施例提供的一种图像处理装置700,该装置700包括:获取模块701,处理模块702。
获取模块701,用于获取待处理图像,待处理图像包括多个人体组织。
处理模块702,用于将待处理图像输入目标模型,得到处理后的图像,处理后的图像上标注了多个人体组织在待处理图像中所占的区域。
应理解的是,本申请实施例的装置700可以通过专用集成电路(application-specific integrated circuit,ASIC)实现,或可编程逻辑器件(programmable logicdevice,PLD)实现,上述PLD可以是复杂程序逻辑器件(complex programmable logicaldevice,CPLD),现场可编程门阵列(field-programmable gate array,FPGA),通用阵列逻辑(generic array logic,GAL)或其任意组合。也可以通过软件实现图4所示的方法,通过软件实现图4所示的方法时,装置700及其各个模块也可以为软件模块。
图8为本申请实施例提供的一种电子设备800的结构示意图。如图8所示,该设备800包括处理器801、存储器802、通信接口803和总线804。其中,处理器801、存储器802、通信接口803通过总线804进行通信,也可以通过无线传输等其他手段实现通信。该存储器802用于存储指令,该处理器801用于执行该存储器802存储的指令。该存储器802存储程序代码8021,且处理器801可以调用存储器802中存储的程序代码8021执行图4所示的图像处理方法。
应理解,在本申请实施例中,处理器801可以是CPU,处理器801还可以是其他通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者是任何常规的处理器等。
该存储器802可以包括只读存储器和随机存取存储器,并向处理器801提供指令和数据。存储器802还可以包括非易失性随机存取存储器。该存储器802可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read-only memory,ROM)、可编程只读存储器(programmable ROM,PROM)、可擦除可编程只读存储器(erasable PROM,EPROM)、电可擦除可编程只读存储器(electricallyEPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(random access memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(static RAM,SRAM)、动态随机存取存储器(DRAM)、同步动态随机存取存储器(synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(double datadate SDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(direct rambus RAM,DR RAM)。
该总线804除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见,在图8中将各种总线都标为总线804。
上述实施例,可以全部或部分地通过软件、硬件、固件或其他任意组合来实现。当使用软件实现时,上述实施例可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载或执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以为通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集合的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质。半导体介质可以是固态硬盘(solid state drive,SSD)。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (8)
1.一种训练模型的方法,其特征在于,所述方法包括:
通过预设模型的当前卷积层对第一图像使用多个目标权重进行卷积处理,得到第二图像,所述第一图像中包括多个人体组织,所述第二图像上标注了多个所述人体组织在所述第二图像中所占的区域,多个所述目标权重与多个所述人体组织一一对应,多个所述目标权重中的部分目标权重大于相对应的预设权重,所述预设权重是前一卷积层在进行卷积处理时使用的权重;
根据所述第二图像与第三图像进行模型训练,得到目标模型,所述第三图像是经人工处理后得到的,所述第三图像上标注了多个所述人体组织在所述第三图像中所占的区域。
2.根据权利要求1所述的方法,其特征在于,多个所述人体组织中指定类型的人体组织的目标权重大于相对应的预设权重。
3.根据权利要求1或2所述的方法,其特征在于,所述预设模型以Unet模型为基础模型。
4.根据权利要求3所述的方法,其特征在于,所述当前卷积层包括第一卷积模块和第二卷积模块,所述第一卷积模块用于提取所述第一图像中的多个所述人体组织的信息,所述第二卷积模块用于对所述预设权重进行调整得到所述目标权重。
5.一种图像处理方法,其特征在于,所述方法包括:
获取待处理图像,所述待处理图像包括多个人体组织;
将所述待处理图像输入目标模型,得到处理后的图像,所述处理后的图像上标注了多个所述人体组织在所述待处理图像中所占的区域,所述目标模型为利用权利要求1至4中任一项所述的方法得到的目标模型。
6.一种图像处理装置,其特征在于,所述装置包括:
获取模块,用于获取待处理图像,所述待处理图像包括多个人体组织;
处理模块,用于将所述待处理图像输入目标模型,得到处理后的图像,所述处理后的图像上标注了多个所述人体组织在所述待处理图像中所占的区域,所述目标模型为利用权利要求1至4中任一项所述的方法得到的目标模型。
7.一种电子设备,其特征在于,包括:存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求5所述的方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,当所述计算机指令在电子设备上运行时,使得所述电子设备执行如权利要求1至4中任一项所述的训练模型的方法,和/或,如权利要求5所述的图像处理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111534785.7A CN114359169A (zh) | 2021-12-15 | 2021-12-15 | 训练模型的方法、图像处理方法、装置及电子设备 |
PCT/CN2022/137661 WO2023109651A1 (zh) | 2021-12-15 | 2022-12-08 | 训练模型的方法、图像处理方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111534785.7A CN114359169A (zh) | 2021-12-15 | 2021-12-15 | 训练模型的方法、图像处理方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114359169A true CN114359169A (zh) | 2022-04-15 |
Family
ID=81099934
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111534785.7A Pending CN114359169A (zh) | 2021-12-15 | 2021-12-15 | 训练模型的方法、图像处理方法、装置及电子设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN114359169A (zh) |
WO (1) | WO2023109651A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023109651A1 (zh) * | 2021-12-15 | 2023-06-22 | 深圳先进技术研究院 | 训练模型的方法、图像处理方法、装置及电子设备 |
CN116503932A (zh) * | 2023-05-24 | 2023-07-28 | 北京万里红科技有限公司 | 重点区域加权的眼周特征提取方法、***及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111127487A (zh) * | 2019-12-27 | 2020-05-08 | 电子科技大学 | 一种实时多组织医学图像的分割方法 |
CN111951274A (zh) * | 2020-07-24 | 2020-11-17 | 上海联影智能医疗科技有限公司 | 图像分割方法、***、可读存储介质和设备 |
CN112651979A (zh) * | 2021-01-11 | 2021-04-13 | 华南农业大学 | 肺部x光图像分割方法、***、计算机设备及存储介质 |
CN113012172A (zh) * | 2021-04-09 | 2021-06-22 | 杭州师范大学 | 一种基于AS-UNet的医学图像分割方法及*** |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11222425B2 (en) * | 2020-02-11 | 2022-01-11 | DeepVoxel, Inc. | Organs at risk auto-contouring system and methods |
CN112651438A (zh) * | 2020-12-24 | 2021-04-13 | 世纪龙信息网络有限责任公司 | 多类别图像的分类方法、装置、终端设备和存储介质 |
CN113129310B (zh) * | 2021-03-04 | 2023-03-31 | 同济大学 | 一种基于注意力路由的医学图像分割*** |
CN114359169A (zh) * | 2021-12-15 | 2022-04-15 | 深圳先进技术研究院 | 训练模型的方法、图像处理方法、装置及电子设备 |
-
2021
- 2021-12-15 CN CN202111534785.7A patent/CN114359169A/zh active Pending
-
2022
- 2022-12-08 WO PCT/CN2022/137661 patent/WO2023109651A1/zh unknown
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111127487A (zh) * | 2019-12-27 | 2020-05-08 | 电子科技大学 | 一种实时多组织医学图像的分割方法 |
CN111951274A (zh) * | 2020-07-24 | 2020-11-17 | 上海联影智能医疗科技有限公司 | 图像分割方法、***、可读存储介质和设备 |
CN112651979A (zh) * | 2021-01-11 | 2021-04-13 | 华南农业大学 | 肺部x光图像分割方法、***、计算机设备及存储介质 |
CN113012172A (zh) * | 2021-04-09 | 2021-06-22 | 杭州师范大学 | 一种基于AS-UNet的医学图像分割方法及*** |
Non-Patent Citations (1)
Title |
---|
王枫等: "基于通道注意力机制和U-net的医学图像分割方法", 《计算机时代》, no. 2021, 31 May 2021 (2021-05-31), pages 64 - 72 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023109651A1 (zh) * | 2021-12-15 | 2023-06-22 | 深圳先进技术研究院 | 训练模型的方法、图像处理方法、装置及电子设备 |
CN116503932A (zh) * | 2023-05-24 | 2023-07-28 | 北京万里红科技有限公司 | 重点区域加权的眼周特征提取方法、***及存储介质 |
CN116503932B (zh) * | 2023-05-24 | 2024-06-18 | 北京万里红科技有限公司 | 重点区域加权的眼周特征提取方法、***及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2023109651A1 (zh) | 2023-06-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10997725B2 (en) | Image processing method, image processing apparatus, and computer-program product | |
EP3979198A1 (en) | Image segmentation model training method and apparatus, computer device, and storage medium | |
CN112927255B (zh) | 一种基于上下文注意力策略的三维肝脏影像语义分割方法 | |
WO2023109651A1 (zh) | 训练模型的方法、图像处理方法、装置及电子设备 | |
CN116097302A (zh) | 用于病灶检测的利用联合训练的连接式机器学习模型 | |
US11430123B2 (en) | Sampling latent variables to generate multiple segmentations of an image | |
CN112750137B (zh) | 基于深度学习的肝脏肿瘤分割方法及*** | |
CN113034507A (zh) | 基于ccta影像的冠状动脉三维分割方法 | |
CN115471470A (zh) | 一种食管癌ct图像分割方法 | |
CN113436173A (zh) | 基于边缘感知的腹部多器官分割建模、分割方法及*** | |
CN109949288A (zh) | 肿瘤类型确定***、方法及存储介质 | |
CN112365512B (zh) | 训练图像分割模型的方法、图像分割的方法及其装置 | |
Gamal et al. | GAU U-Net for multiple sclerosis segmentation | |
CN116309551B (zh) | 确定病灶取样区的方法、装置、电子设备及可读介质 | |
CN113096132B (zh) | 图像处理的方法、装置、存储介质和电子设备 | |
CN112767403A (zh) | 医学影像分割模型训练方法、医学影像分割方法及装置 | |
US20230162353A1 (en) | Multistream fusion encoder for prostate lesion segmentation and classification | |
Takahashi et al. | Automated volume measurement of abdominal adipose tissue from entire abdominal cavity in Dixon MR images using deep learning | |
Gu et al. | Discriminative feature representation for Noisy image quality assessment | |
US20230267607A1 (en) | Hybrid convolutional wavelet networks for predicting treatment response via radiological images of bowel disease | |
US20230404509A1 (en) | Systems and Methods for Automated Diagnosis and Prognosis Support using Radiomics | |
US20230410471A1 (en) | Method and network to embed image data and meta data | |
CN118279579A (zh) | 图像分割模型训练方法、图像分割方法、装置及设备 | |
CN118261848A (zh) | 医学图像分析方法、***、电子设备及存储介质 | |
CN116452543A (zh) | 一种病灶检测方法和*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |