CN111739645A - 一种免疫相关性肺炎预测模型的训练方法 - Google Patents

一种免疫相关性肺炎预测模型的训练方法 Download PDF

Info

Publication number
CN111739645A
CN111739645A CN202010407606.2A CN202010407606A CN111739645A CN 111739645 A CN111739645 A CN 111739645A CN 202010407606 A CN202010407606 A CN 202010407606A CN 111739645 A CN111739645 A CN 111739645A
Authority
CN
China
Prior art keywords
parameters
value
image
parameter
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010407606.2A
Other languages
English (en)
Other versions
CN111739645B (zh
Inventor
石磊
哈达
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Shenrui Bolian Technology Co Ltd
Shenzhen Deepwise Bolian Technology Co Ltd
Original Assignee
Shanghai Yizhi Medical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Yizhi Medical Technology Co ltd filed Critical Shanghai Yizhi Medical Technology Co ltd
Priority to CN202010407606.2A priority Critical patent/CN111739645B/zh
Publication of CN111739645A publication Critical patent/CN111739645A/zh
Application granted granted Critical
Publication of CN111739645B publication Critical patent/CN111739645B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/20ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS

Landscapes

  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Engineering & Computer Science (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Radiology & Medical Imaging (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Apparatus For Radiation Diagnosis (AREA)

Abstract

本发明主要公开了一种免疫相关性肺炎预测模型的训练方法,包括:获取目标对象的N1个临床参数;获取基于目标对象CT影像的N2个影像参数;在所述N1个临床参数和N2个影像参数中确定N个参数;以多个目标对象的所述N个参数训练免疫相关性肺炎预测模型。采用本发明所提供的方案,利于以较快的速度训练出性能较好的免疫相关性肺炎预测模型,进而可以准确的预测受检者是否患有免疫相关性肺炎,在一定程度上利于医生的诊断和对受检者后期的治疗。

Description

一种免疫相关性肺炎预测模型的训练方法
技术领域
本发明涉及医疗技术领域,特别涉及一种免疫相关性肺炎预测模型的训练方法。
背景技术
肺癌是目前发病率和死亡率最高的恶性肿瘤之一。晚期肺癌占肺癌发病率的60-70%,目前晚期肺癌主要的治疗手段包括化疗、靶向及免疫治疗。对于存在EGFR、ALK、ROS1等基因突变的患者,靶向药物治疗能够给患者带来显著的生存获益。对于没有基因突变的患者,免疫治疗是当前重要的治疗手段,多项研究证实了免疫治疗给患者的生存期带来的获益。
用于临床使用的免疫治疗主要是基于PD1/PD-L1的免疫检查点抑制剂,包括NIVOLUMAB,PEBLIZUMAB等药物,研究表明,这类药物不仅仅显著提高患者生存时间,而且能够较化疗明显降低不良反应。
目前免疫检查点抑制剂已经在临床中广泛用于晚期非小细胞肺癌的治疗以及局部晚期非小细胞肺癌放化疗后的巩固治疗。尽管不良反应发生率低,但是,患者的免疫不良反应存在着不易预测的特点,部分重度免疫相关性肺炎往往是致死性的,然而,目前缺少有效的预测模型来预测免疫相关性肺炎的发生。
因此,如何能够提供一种免疫相关性肺炎预测模型的训练方法,训练出有效的免疫相关性肺炎预测模型,进而较准确的预测受检者是否患有免疫相关性肺炎,成为目前亟待解决的问题之一。
发明内容
本发明提供一种免疫相关性肺炎预测模型的训练方法,以训练出有效的免疫相关性肺炎预测模型,进而准确的预测受检者是否患有免疫相关性肺炎,在一定程度上利于医生的诊断和对受检者后期的治疗。
本发明提供一种免疫相关性肺炎预测模型的训练方法,包括:
获取目标对象的N1个临床参数;
获取基于目标对象CT影像的N2个影像参数;
在所述N1个临床参数和N2个影像参数中确定N个参数;
以多个目标对象的所述N个参数训练免疫相关性肺炎预测模型。
可选的,所述临床参数包括:性别、年龄、吸烟史、病理类型、免疫治疗模式、既往胸部放疗史中的一种或多种。
可选的,所述获取基于目标对象CT影像的N2个影像参数,包括:
分割目标对象CT影像中的肺部区域;
基于所述肺部区域生成CT值直方图;
至少基于所述CT值直方图获得N2个影像参数中的参数。
可选的,所述基于所述肺部区域生成CT值直方图,包括:
获取所述肺部区域中每个体素的CT值;
统计预设CT值区间内CT值对应的体素的频数;
基于预设CT值区间内CT值及与其对应的体素的频数生成CT值直方图。
可选的,所述预设CT值区间为(-1000HU,0HU),所述基于预设CT 值区间内CT值及与其对应的体素的频数生成CT值直方图包括:
将所述预设CT值区间均分为K个子区间,其中,K为大于等于1的自然数;
获取各子区间对应的频数,所述各子区间对应的频数是指该子区间的CT 值对应的体素的频数之和;
以各子区间对应的频数为该子区间的各CT值对应的体素的频数生成CT 值直方图。
可选的,所述至少基于所述CT值直方图获得N2个影像参数中的参数,包括:
以所述CT值直方图的分布曲线的熵、能量、峰度、偏度和峰值作为影像参数中的参数。
可选的,所述至少基于所述CT值直方图获得N2个影像参数中的参数,还包括:
计算所述肺部区域的体积,
分别计算M个CT值区间体素所占体积与所述肺部区域的体积的比值,其中,M为大于等于1的自然数;
以M个比值作为影像参数中的参数。
可选的,所述至少基于所述CT值直方图获得N2个影像参数中的参数,还包括:
获取标准曲线;
基于标准曲线和CT值直方图的分布曲线获取海林格距离参数和IOU参数;
以所述海林格距离参数和IOU参数作为影像参数中的参数。
可选的,获取基于目标对象CT影像的N2个影像参数,还包括:
获取所述肺部区域中每个体素的CT值;
以所述肺部区域中所有体素的CT值的平均值、中位数和标准差作为个影像参数中的参数。
可选的,所述在所述N1个临床参数和N2个影像参数中确定N个参数,包括:
对影像参数矩阵进行归一化处理;
基于Boruta方法确定临床参数和影像参数的重要性及其重要度;
在确定了重要性及重要度的临床参数和影像参数中通过递归特征消除选择N个参数。
本发明还提供一种免疫相关性肺炎预测模型的训练装置,包括:
第一获取单元,用于获取目标对象的N1个临床参数;
第二获取单元,用于获取基于目标对象CT影像的N2个影像参数;
确定单元,用于在所述N1个临床参数和N2个影像参数中确定N个参数;
训练单元,用于以多个目标对象的所述N个参数训练免疫相关性肺炎预测模型。
本发明还提供一种计算机设备,包括至少一个处理器、以及至少一个存储器,其中,所述存储器存储有计算机程序,当所述程序被所述处理器执行时,使得所述处理器能够执行上述的免疫相关性肺炎预测模型的训练方法。
本发明还提供一种计算机可读存储介质,当所述存储介质中的指令由设备内的处理器执行时,使得所述设备能够执行上述的免疫相关性肺炎预测模型的训练方法。
与现有技术相比,本发明的技术方案具有如下有益效果:
首先,在获取了目标对象的N1个临床参数和基于目标对象CT影像的N2个影像参数后,在所述N1个临床参数和N2个影像参数中确定N个参数。最终以多个目标对象的N个参数训练免疫相关性肺炎预测模型。由于训练免疫相关性肺炎预测模型时参数的选择来源于目标对象的临床参数和目标对象CT影像的影像参数,并基于二者的基础上确定最终的训练参数,因此利于训练出性能较好的免疫相关性肺炎预测模型,且由于训练免疫相关性肺炎预测模型时是基于最终确定的每一个目标对象的N个参数进行训练的,因此,可以以较快的速度训练出性能较好的免疫相关性肺炎预测模型,进而可以准确的预测受检者是否患有免疫相关性肺炎,在一定程度上利于医生的诊断和对受检者后期的治疗。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例的免疫相关性肺炎预测模型训练方法的流程示意图;
图2为本发明实施例的CT值直方图示意图;
图3为本发明实施例的确定N个参数的流程示意图;
图4为本发明实施例的临床参数和影像参数的重要度排序示意图;
图5为本发明实施例的不同参数组对应的RMSE值的示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
图1为本发明实施例的免疫相关性肺炎预测模型训练方法的流程示意图。如图1所示,所述免疫相关性肺炎预测模型的训练方法包括如下步骤:
S101,获取目标对象的N1个临床参数。
S102,获取基于目标对象CT影像的N2个影像参数。
S103,在所述N1个临床参数和N2个影像参数中确定N个参数。
S104,以多个目标对象的所述N个参数训练免疫相关性肺炎预测模型。
执行S101,获取目标对象的N1个临床参数,其中,N1为大于等于1的自然数。本实施例中,目标对象也可以称之为目标患者,这里是指接受了免疫性治疗的患者。所述临床参数可以包括但不限于性别、年龄、吸烟史、病理类型、免疫治疗模式、既往胸部放疗史中的一种或多种。病理类型,包括鳞状细胞癌、腺癌、小细胞未分化癌和大细胞未分化癌。免疫治疗模式,包括单独免疫治疗药物的治疗和免疫治疗药物联合其他药物的治疗。既往胸部放疗史,则是指患者在进行免疫性治疗前,胸部是否有进行过放疗。本领域技术人员知晓,所述临床参数仅为举例说明,在其他实施例中,所述临床参数还可以包括其他临床参数,实际应用中,可以根据实际临床需求选择不同的临床参数。
执行S102,获取基于目标对象CT影像的N2个影像参数,其中,N2为大于等于1的自然数。本实施例中,可以通过分割目标对象CT影像中的肺部区域,基于所述肺部区域生成CT值直方图,至少基于所述CT值直方图获得N2个影像参数中的参数。
具体地,本实施例中,分割目标对象CT影像中的肺部区域可以通过阈值法、区域增长法、均值迭代分割法、最大类间方差分割法、基于模式分类的方法,基于图像配准的方法、基于形状模型的方法、AI算法(三维卷积神经网络分割模型等)等分割出肺部(双肺)区域。本实施例中对此不做限定,只要可以从目标对象的CT影像中分割出肺部区域即可。
基于所述肺部区域生成CT值直方图,本实施例中,首先需获取所述肺部区域中每个体素的CT值,然后,统计预设CT值区间内CT值对应的体素的频数,最后,基于预设CT值区间内CT值及与其对应的体素的频数生成CT 值直方图。本领域技术人员知晓,不同的体素对应的CT值可能相同,或者说同一个CT值对应了多个体素,CT值对应的体素的频数是指,对于某一个CT 值而言,其对应的体素的个数,举例来说,CT值为100HU时,体素的个数为 12个,则与100HU对应的体素的频数为12。本实施例中,预设CT值区间可以为(-1000HU,0HU),基于预设CT值区间内CT值及与其对应的体素的频数生成CT值直方图,具体地,可以通过如下方式获得:
首先,将所述预设CT值区间均分为K个子区间,本实施例中,K为大于等于1的自然数。然后,获取各子区间对应的频数,所述各子区间对应的频数是指该子区间的CT值对应的体素的频数之和。最后,以各子区间的各CT值对应的体素的频数为该子区间对应的频数生成CT值直方图。本实施例中,以预设CT值区间为(-1000HU,0HU),将其均分为100个子区间,每一个子区间包括的CT值的个数为10个,子区间为(-10HU,0HU)为例,若CT值为-10HU时对应的体素的频数为12,CT值为-9HU时对应的体素的频数为15, CT值为-8HU时对应的体素的频数为11,CT值为-7HU时对应的体素的频数为13,CT值为-6HU时对应的体素的频数为14,CT值为-5HU时对应的体素的频数为12,CT值为-4HU时对应的体素的频数为16,CT值为-3HU时对应的体素的频数为17,CT值为-2HU时对应的体素的频数为15,CT值为-1HU 时对应的体素的频数为12,CT值为0HU时对应的体素的频数为13,则该子区间(-10HU,0HU)对应的频数为150,将该子区间(-10HU,0HU)对应的频数150作为该子区间(-10HU,0HU)中每一个CT值对应的体素的频数,则可以生成CT值直方图。图2为本发明实施例的CT值直方图示意图,图2 中的current曲线及其覆盖的黑色区域为肺部区域的CT值直方图。图2中,横坐标为CT值,纵坐标为与该CT值对应的体素的频数。图2中,将CT值区间(-1000HU,0HU)先均分为10个子区间(-1000HU,-900HU)、(-900HU, -800HU)、(-800HU,-700HU),……,(-100HU,0HU),然后再将这10 个子区间中的每一个区间均分为10个子区间,也即将(-1000HU,0HU)均分为100个子区间,每一个子区间中各CT值对应的体素的频数均相同,即为该子区间对应的频数。本实施例中,以预设CT值区间为(-1000HU,0HU),将该预设CT值区间均分为100个子区间为例进行了说明,在其他实施例中,预设CT值区间及子区间的个数可以根据实际的临床需求而定,因此,预设CT 值区间为(-1000HU,0HU),子区间个数为100不应作为对本发明技术方案的限定。
至此通过上述过程生成了所述目标对象肺部区域的CT值直方图。本实施例中,可以至少基于所述CT值直方图获得N2个影像参数中的参数。具体地,可以以所述CT值直方图的分布曲线的熵、能量、峰度、偏度和峰值作为影像参数中的参数。
CT值直方图的分布曲线的熵通过如下公式获得:
Figure RE-GDA0002588781840000081
CT值直方图的分布曲线的偏度通过如下公式获得:
Figure RE-GDA0002588781840000082
CT值直方图的分布曲线的峰度通过如下公式获得:
Figure RE-GDA0002588781840000083
CT值直方图的分布曲线的能量通过如下公式获得:
Figure RE-GDA0002588781840000084
CT值直方图的分布曲线的峰值通过如下公式获得:
peak=lmax
其中,l为各体素的CT值,lmin为所有CT值中的最小值,lmax为所有CT 值中的最大值,n(l)为每个CT值对应的体素个数,m为所有CT值的平均值, s为所有CT值的标准差,N为所有体素的个数,c为普通常数。
还可以,计算所述肺部区域的体积,分别计算M个CT值区间体素所占体积与所述肺部区域的体积的比值,其中,M为大于等于1的自然数。以M个比值作为影像参数中的参数。具体地,肺部区域的体积可以通过肺部区域中体素的个数和预设比例尺来确定肺部区域的体积。预设比例尺可以依据经验设置。同样地,每一个CT值区间体素所占体积则是该CT值区间的体素的个数与预设比例尺的乘积。而该CT值区间的体素的个数则可以直接由CT值直方图中对应区间的频数获得。本实施例中,M可以取100,即分别计算100个CT值区间体素所占的体积,如图2所示的100个区间,每一个区间的体素的个数即为该区间对应的频数。在其他实施例中,可以根据临床实际需求对M取不同的值。
再可以,获取标准曲线。基于标准曲线和CT值直方图的分布曲线获取海林格距离参数和IOU参数。以所述海林格距离参数和IOU参数作为影像参数中的参数。继续参见图2,图2中baseline曲线为标准曲线,所述标准曲线通常是基于正常人肺部区域的CT值获得,具体的可以是对大量正常人肺部区域的CT值中,同一CT值对应的体素的频数取平均值得到。举例来说:目标对象1肺部区域CT值为-700时,对应的体素的频数为50,目标对象2肺部区域CT值为-700时,对应的体素的频数为60,目标对象3肺部区域CT值为-700 时,对应的体素的频数为50,目标对象4肺部区域CT值为-700时,对应的体素的频数为80,……,目标对象Y肺部区域CT值为-700时,对应的体素的频数为80,则对于同样的CT值-700,基准曲线上该CT值对应的体素的频数应为目标对象1,……,目标对象Y在CT值为-700时各自对应的频数之和与Y的比值。在确定了每个CT值对应的体素的平均频数之后,以CT值为横坐标,该CT值对应的体素的平均频数为纵坐标即可获得标准曲线。
本实施例中,海林格距离参数通过如下公式获得:
Figure RE-GDA0002588781840000091
其中,pi为CT值直方图曲线上的点,qi为标准曲线上的点。
当海林格值即H(P,Q)越接近0,则表明目标对象肺部区域的CT值直方图与标准曲线分布的相似性越高。
本实施例中,IOU参数通过如下公式获得:
Figure RE-GDA0002588781840000092
其中,Area(A)为CT值直方图曲线下的面积,Area(B)为标准曲线下的面积。当IOU越接近1时,则表明目标对象肺部区域的CT值直方图曲线与标准曲线的相似性越高。本实施例中,可以通过IOU的大小来判断目标对象肺部区域的 CT值直方图分布与标准曲线之间的相似度。
本实施例中,除了可以至少基于所述CT值直方图获得N2个影像参数中的参数以外,还可以通过以下方式获得基于目标对象CT影像的N2个影像参数中的参数,具体地,获取所述肺部区域中每个体素的CT值。以所述肺部区域中所有体素的CT值的平均值、中位数和标准差作为N2个影像参数中的参数。
肺部区域中所有体素的CT值的平均值通过如下公式获得:
Figure RE-GDA0002588781840000101
肺部区域中所有体素的CT值的标准差通过如下公式获得:
Figure RE-GDA0002588781840000102
其中,l为各体素的CT值,lmin为所有CT值中的最小值,lmax为所有CT 值中的最大值,m为所有CT值的平均值,N为所有体素的个数。
肺部区域中所有体素的CT值的中位数,则是指将所有体素的CT值按照预定顺序进行排列(如:由小至大,或者由大至小),在排序好的队列中,取位于中间位置的体素的CT值作为所有体素的CT值的中位数。若排序好的队列为第1个至第2n+1个体素,则第n+1个体素的CT值为所有体素的CT值的中位数,若排序好的队列为第1个至第2n个体素,则第n个或第n+1个体素的CT值为所有体素的CT值的中位数。举例来说,若n=4,按照CT值由小至大的顺序排列后依次为第1个~第9个体素,则第5个体素的CT值为这9 个体素的CT值的中位数。若n=3,按照CT值由小至大的顺序排列后依次为第1个~第6个体素,则第3个体素或第4个体素的CT值为这6个体素的CT 值的中位数。
本实施例中,在获取了目标对象的N1个临床参数和N2个影像参数后,在N1个临床参数和N2个影像参数中确定N个参数,其中,N<N1+N2。参见图3,图3为本发明实施例的确定N个参数的流程示意图,具体地,包括:
S301:对影像参数矩阵进行归一化处理。
S302:基于Boruta方法确定临床参数和影像参数的重要性及其重要度。
S303:在确定了重要性及重要度的临床参数和影像参数中通过递归特征消除选择N个参数。
执行S301,具体地,可以采用最小值最大值归一化法、Z-Score标准化方法、L2标准化法等对影像参数矩阵进行归一化。
执行S302,具体地,
1.以临床参数和影像参数作为特征值生成特征矩阵,对特征矩阵中的各个特征取值进行随机排序(shuffle),将shuffle后的特征(shadow features)值与原特征值(realfeatures)拼接构成新的特征矩阵。
2.将新的特征矩阵作为特征重要度模型的输入以输出每个特征的重要性和重要度。特征重要度模型可以为RandomForest,LightGBM,XGBoost等。
3.计算real features和shadow features的Z_score,其中,Z_score通过如下公式获得:
Z_score=average_feature/feature_importance的标准差
其中,单个特征在单棵数上的 feature_importance=oob_acc-oob_acc_after_perputation。
其中,oob_acc_after_perputation是指将该维特征进行shuffle之后再用 out_of_bag的样本在单棵树上的accuracy。
4.在shadow features中找出最大的Z_score记为Z_max。
5.将Z_score大于Z_max的real features标记为“重要”,将Z_score显著小于Z_max的real features标记为“不重要”,并且从特征集合中永久删除。
6.删除所有的shadow features。
7.重复1~6,直到所有的real features都被标记为“重要”或“不重要”。
对于标记了“重要”的real features而言,其Z_score可以作为该real features的重要度。
图4为本发明实施例的临床参数和影像参数的重要度排序示意图,如图4 所示,图4中横坐标为临床参数和影像参数,纵坐标为重要度。实际应用中,对于同样的临床参数或者影像参数而言,由于选取样本的不同,其重要度并非一个定值(对于不同的目标对象而言,同一个临床参数或者影像参数的重要度是有所差异的),而是分布在一预定范围。本实施例中,以该分布范围的重要度的中位数作为该参数的重要度,图4中,以柱状标识中的黑色的横线代表该参数的重要度。从图4中可以看出,临床参数和影像参数的重要度主要分布在 0~8之间,明显地,图4中,临床参数中的6个参数,如年龄、病理类型、既往胸部放疗史、吸烟史、既往治疗史、性别,以及双肺体积参数的重要度相对来说比较低,而图4中从左至右起,第11个参数、第12个参数、第13个参数……第30个参数的重要度明显高于第2个参数、第3个参数、第4个参数、第6个参数……第9个参数的重要度。
在通过Boruta方法确定了临床参数和影像参数的重要性及其重要度后,为了找到可以训练免疫相关性肺炎预测模型的最佳参数,执行S303,通过递归特征消除在具有重要性和重要度的临床参数和影像参数中选择N个参数。
在通过递归特征消除在具有重要性和重要度的临床参数和影像参数中选择参数时,为了使得免疫相关性肺炎预测模型输出的结果最为准确,在采用递归特征消除选择参数的同时,还可以通过RMSE值来衡量预测值和真实值之间的偏差以确定最终要选择的参数组。
本实施例中,可以根据重要度的高低,在重要度较高的多个参数中挑选出 N个参数,实际应用中可以将重要度大于预定阈值的参数作为重要度较高的参数,预定阈值可以经验而定。本实施例中,可以从图4中第11个参数……第 30个参数中挑选出N个参数。
具体地,可以给每一个参数赋予一个预设权重,然后采用免疫相关性肺炎预测模型进行训练,调整每一个参数的权重,以使得损失函数小于预设值。在获取到调整后的参数的权重后,对这些权重取绝对值,把最小绝对值权重对应的参数剔除。然后在剩下的参数中重复前述过程,以选出多个参数,本实施例中通过递归特征消除选出的参数小于20个。为了使得免疫相关性肺炎预测模型输出的结果最准确,对通过递归特征消除选出的参数进行任意的组合得到各组参数,并将与各组参数对应的多个样本作为免疫相关性肺炎预测模型的输入,以获得与该组参数对应的RMSE值。本领域技术人员知晓,RMSE值反映了预测值和真实值的接近程度,RMSE值越小,预测值和真实值越接近。因此,本实施例中,将RMSE值最小时对应的一组参数,作为最终选择的N个参数。
参见图5,图5为本发明实施例的不同参数组对应的RMSE值的示意图,需要说明的是,图5中的横坐标仅示意出了参数组所包括的参数的个数,实际应用中还包括该参数组具体包括哪几个参数,本实施例中,图5中横坐标8对应的8个参数为海林格距离参数、CT值直方图的分布曲线的能量、CT值直方图的分布曲线的峰度、CT值直方图的分布曲线的熵、CT值在(-1000HU, -900HU)的体素所占的体积与肺部体积的比值、CT值在(-500HU,-400HU) 的体素所占的体积与肺部体积的比值、CT值在(-300HU,-200HU)的体素所占的体积与肺部体积的比值、CT值在(-200HU,-100HU)的体素所占的体积与肺部体积的比值。从图5中可以看出,对于免疫相关性肺炎预测模型而言,当其输入的参数为前述的8个参数时,RMSE值最小,也即预测值和真实值最接近,或者说当其输入参数为前述的8个参数时,免疫相关性肺炎预测模型的预测结果最准确,前述的8个输入参数可以使得免疫相关性肺炎预测模型充分受益,而当输入参数并非前述的8个输入参数时,可能会导致免疫相关性肺炎预测模型不稳定。
至此,通过上述过程确定了对免疫相关性肺炎预测模型进行训练的8个参数,如上所述,本实施例中,这8个参数可以为海林格距离参数、CT值直方图的分布曲线的能量、CT值直方图的分布曲线的峰度、CT值直方图的分布曲线的熵、CT值在(-1000HU,-900HU)的体素所占的体积与肺部体积的比值、 CT值在(-500HU,-400HU)的体素所占的体积与肺部体积的比值、CT值在 (-300HU,-200HU)的体素所占的体积与肺部体积的比值、CT值在(-200HU, -100HU)的体素所占的体积与肺部体积的比值。其中海林格距离参数、CT值直方图的分布曲线的能量、CT值直方图的分布曲线的峰度、CT值直方图的分布曲线的熵这四个参数,可以用于比较不同目标对象该参数在CT值直方图分布曲线上的差异,如分布曲线的形态、分布曲线的一阶特征等。而剩下的在四个CT值区间的体素所占的体积与肺部体积的比值则可以反映出目标对象的肺部在组织密度分布上的差异,实际应用中,通过对比不同目标对象的上述8个参数,进而可以区分目标对象属于肺炎组还是非肺炎组。
执行S104,以多个最终获得的目标对象的N个参数训练免疫相关性肺炎预测模型。也即可以用大量的上述目标对象的8个参数来训练免疫相关性肺炎预测模型,进而获得免疫相关性肺炎预测结果。本实施例中,免疫相关性肺炎预测模型可以为以VGG作为backbone的U-NET神经网络模型,也可以是全卷积神经网络模型等。
本发明实施例还提供一种免疫相关性肺炎预测模型的训练装置,包括:
第一获取单元,用于获取目标对象的N1个临床参数;
第二获取单元,用于获取基于目标对象CT影像的N2个影像参数;
确定单元,用于在所述N1个临床参数和N2个影像参数中确定N个参数;
训练单元,用于以多个目标对象的所述N个参数训练免疫相关性肺炎预测模型。
本实施例的免疫相关性肺炎预测模型的训练装置的实施可以参见上述的免疫相关性肺炎预测模型的训练方法的实施,此处不再赘述。
基于相同的技术构思,本发明实施例提供了一种计算机设备,包括至少一个处理器、以及至少一个存储器,其中,所述存储器存储有计算机程序,当所述程序被所述处理器执行时,使得所述处理器能够执行上述的免疫相关性肺炎预测模型的训练方法。
基于相同的技术构思,本发明实施例提供了一种计算机可读存储介质,当所述存储介质中的指令由设备内的处理器执行时,使得所述设备能够执行上述的免疫相关性肺炎预测模型的训练方法。
本领域内的技术人员应明白,本发明的实施例可提供为方法、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、 CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和 /或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/ 或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种免疫相关性肺炎预测模型的训练方法,其特征在于,
获取目标对象的N1个临床参数;
获取基于目标对象CT影像的N2个影像参数;
在所述N1个临床参数和N2个影像参数中确定N个参数;
以多个目标对象的所述N个参数训练免疫相关性肺炎预测模型。
2.如权利要求1所述的方法,其特征在于,
所述临床参数包括:性别、年龄、吸烟史、病理类型、免疫治疗模式、既往胸部放疗史中的一种或多种。
3.如权利要求1所述的方法,其特征在于,所述获取基于目标对象CT影像的N2个影像参数,包括:
分割目标对象CT影像中的肺部区域;
基于所述肺部区域生成CT值直方图;
至少基于所述CT值直方图获得N2个影像参数中的参数。
4.如权利要求3所述的方法,其特征在于,所述基于所述肺部区域生成CT值直方图,包括:
获取所述肺部区域中每个体素的CT值;
统计预设CT值区间内CT值对应的体素的频数;
基于预设CT值区间内CT值及与其对应的体素的频数生成CT值直方图。
5.如权利要求4所述的方法,其特征在于,
所述预设CT值区间为(-1000HU,0HU),所述基于预设CT值区间内CT值及与其对应的体素的频数生成CT值直方图包括:
将所述预设CT值区间均分为K个子区间,其中,K为大于等于1的自然数;
获取各子区间对应的频数,所述各子区间对应的频数是指该子区间的CT值对应的体素的频数之和;
以各子区间对应的频数为该子区间的各CT值对应的体素的频数生成CT值直方图。
6.如权利要求3所述的方法,其特征在于,所述至少基于所述CT值直方图获得N2个影像参数中的参数,包括:
以所述CT值直方图的分布曲线的熵、能量、峰度、偏度和峰值作为影像参数中的参数。
7.如权利要求3所述的方法,其特征在于,所述至少基于所述CT值直方图获得N2个影像参数中的参数,还包括:
计算所述肺部区域的体积,
分别计算M个CT值区间体素所占体积与所述肺部区域的体积的比值,其中,M为大于等于1的自然数;
以M个比值作为影像参数中的参数。
8.如权利要求3所述的方法,其特征在于,所述至少基于所述CT值直方图获得N2个影像参数中的参数,还包括:
获取标准曲线;
基于标准曲线和CT值直方图的分布曲线获取海林格距离参数和IOU参数;
以所述海林格距离参数和IOU参数作为影像参数中的参数。
9.如权利要求3所述的方法,其特征在于,获取基于目标对象CT影像的N2个影像参数,还包括:
获取所述肺部区域中每个体素的CT值;
以所述肺部区域中所有体素的CT值的平均值、中位数和标准差作为个影像参数中的参数。
10.如权利要求1所述的方法,其特征在于,所述在所述N1个临床参数和N2个影像参数中确定N个参数,包括:
对影像参数矩阵进行归一化处理;
基于Boruta方法确定临床参数和影像参数的重要性及其重要度;
在确定了重要性及重要度的临床参数和影像参数中通过递归特征消除选择N个参数。
CN202010407606.2A 2020-05-14 2020-05-14 一种免疫相关性肺炎预测模型的训练方法 Active CN111739645B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010407606.2A CN111739645B (zh) 2020-05-14 2020-05-14 一种免疫相关性肺炎预测模型的训练方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010407606.2A CN111739645B (zh) 2020-05-14 2020-05-14 一种免疫相关性肺炎预测模型的训练方法

Publications (2)

Publication Number Publication Date
CN111739645A true CN111739645A (zh) 2020-10-02
CN111739645B CN111739645B (zh) 2024-01-30

Family

ID=72647200

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010407606.2A Active CN111739645B (zh) 2020-05-14 2020-05-14 一种免疫相关性肺炎预测模型的训练方法

Country Status (1)

Country Link
CN (1) CN111739645B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102429679A (zh) * 2011-09-09 2012-05-02 华南理工大学 基于胸部ct图像的肺气肿计算机辅助诊断***
CN103793711A (zh) * 2014-01-17 2014-05-14 首都医科大学 一种基于脑部核磁共振图像的多维度纹理提取方法
CN104933711A (zh) * 2015-06-10 2015-09-23 南通大学 一种肿瘤病理图像自动快速分割方法
CN106981068A (zh) * 2017-04-05 2017-07-25 重庆理工大学 一种联合像素与超像素的交互式图像分割方法
US20190005655A1 (en) * 2017-06-29 2019-01-03 Sogang University Research Foundation Method and system of tracking an object based on multiple histograms
CN109658411A (zh) * 2019-01-21 2019-04-19 杭州英库医疗科技有限公司 一种基于ct影像学特征与非小细胞肺癌患者预后情况的相关性分析方法
CN109919973A (zh) * 2019-02-19 2019-06-21 上海交通大学 基于多特征联合的多视角目标关联方法、***及介质
CN110163891A (zh) * 2019-04-30 2019-08-23 长沙师范学院 基于感知模型的长期目标跟踪方法
CN110391015A (zh) * 2019-06-14 2019-10-29 广东省人民医院(广东省医学科学院) 一种基于影像组学量化肿瘤免疫状态的方法
CN110766723A (zh) * 2019-10-22 2020-02-07 湖南大学 一种基于颜色直方图相似性的无人机目标跟踪方法及***

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102429679A (zh) * 2011-09-09 2012-05-02 华南理工大学 基于胸部ct图像的肺气肿计算机辅助诊断***
CN103793711A (zh) * 2014-01-17 2014-05-14 首都医科大学 一种基于脑部核磁共振图像的多维度纹理提取方法
CN104933711A (zh) * 2015-06-10 2015-09-23 南通大学 一种肿瘤病理图像自动快速分割方法
CN106981068A (zh) * 2017-04-05 2017-07-25 重庆理工大学 一种联合像素与超像素的交互式图像分割方法
US20190005655A1 (en) * 2017-06-29 2019-01-03 Sogang University Research Foundation Method and system of tracking an object based on multiple histograms
CN109658411A (zh) * 2019-01-21 2019-04-19 杭州英库医疗科技有限公司 一种基于ct影像学特征与非小细胞肺癌患者预后情况的相关性分析方法
CN109919973A (zh) * 2019-02-19 2019-06-21 上海交通大学 基于多特征联合的多视角目标关联方法、***及介质
CN110163891A (zh) * 2019-04-30 2019-08-23 长沙师范学院 基于感知模型的长期目标跟踪方法
CN110391015A (zh) * 2019-06-14 2019-10-29 广东省人民医院(广东省医学科学院) 一种基于影像组学量化肿瘤免疫状态的方法
CN110766723A (zh) * 2019-10-22 2020-02-07 湖南大学 一种基于颜色直方图相似性的无人机目标跟踪方法及***

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
朱正伟;祝磊;饶鹏;: "基于BS-HMM和巴式距离的手势识别技术研究", 计算机应用与软件, no. 06 *
王斯盾;琚生根;周刚;刘玉娇;: "基于集成分类器的用户属性预测研究", 四川大学学报(自然科学版), no. 06 *
董明刚;姜振龙;敬超;: "基于海林格距离和SMOTE的多类不平衡学习算法", 计算机科学, no. 01 *

Also Published As

Publication number Publication date
CN111739645B (zh) 2024-01-30

Similar Documents

Publication Publication Date Title
Naqi et al. Lung nodule detection using polygon approximation and hybrid features from CT images
CN107077736A (zh) 依据基于解剖学界标的特征分割医学图像的***和方法
CN108492300B (zh) 管状结构增强与能量函数结合的肺部血管树分割方法
Kavitha et al. ECM-CSD: an efficient classification model for cancer stage diagnosis in CT lung images using FCM and SVM techniques
CN111008984A (zh) 医学影像中正常器官的轮廓线自动勾画方法及***
de Sousa Costa et al. Classification of malignant and benign lung nodules using taxonomic diversity index and phylogenetic distance
CN109064470A (zh) 一种基于自适应模糊聚类的图像分割方法及装置
CN112102351A (zh) 医学图像分析方法、装置、电子设备及可读存储介质
CN114266729A (zh) 一种基于机器学习的胸部肿瘤放疗后放射性肺炎预测方法和***
US20200175674A1 (en) Quantified aspects of lesions in medical images
CN113139948A (zh) 器官轮廓线质量评估方法、装置及***
Zhang et al. Deep belief network for lung nodules diagnosed in CT imaging
Dong et al. An improved YOLOv5 network for lung nodule detection
US12009090B2 (en) Liver cancer detection
CN111739645A (zh) 一种免疫相关性肺炎预测模型的训练方法
Zhang et al. Dial/Hybrid cascade 3DResUNet for liver and tumor segmentation
Dickson et al. A Dual Channel Multiscale Convolution U-Net Methodfor Liver Tumor Segmentation from Abdomen CT Images
CN111738980B (zh) 一种医学影像的显示方法、计算机设备及存储介质
CN113706541B (zh) 一种图像处理方法及装置
CN115100155A (zh) 放射性肺炎预测模型的建立方法与***
CN110599482B (zh) 肺裂曲面确定方法、装置、电子设备和存储介质
Abdelhafeez et al. A Neutrosophic based c-means approach for improving breast cancer clustering performance
Zhang et al. MCs Detection with Combined Image Features and Twin Support Vector Machines.
Korabelnikov et al. Liver tumor segmentation ct data based on alexnet-like convolutional neural nets
CN111292289B (zh) 基于分割网络的ct肺肿瘤分割方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220318

Address after: 100089 area a, 21 / F, block a, No. 8, Haidian Street, Haidian District, Beijing

Applicant after: BEIJING SHENRUI BOLIAN TECHNOLOGY Co.,Ltd.

Applicant after: SHENZHEN DEEPWISE BOLIAN TECHNOLOGY Co.,Ltd.

Address before: 200051 units 06 and 07, 23 / F, 523 Loushanguan Road, Changning District, Shanghai

Applicant before: SHANGHAI YIZHI MEDICAL TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant