CN110148471A - 肝胆肿瘤患者生存率预测数据收集***及模型构建方法 - Google Patents

肝胆肿瘤患者生存率预测数据收集***及模型构建方法 Download PDF

Info

Publication number
CN110148471A
CN110148471A CN201910215575.8A CN201910215575A CN110148471A CN 110148471 A CN110148471 A CN 110148471A CN 201910215575 A CN201910215575 A CN 201910215575A CN 110148471 A CN110148471 A CN 110148471A
Authority
CN
China
Prior art keywords
patient
score
survival rate
divided
testing result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910215575.8A
Other languages
English (en)
Other versions
CN110148471B (zh
Inventor
陆荫英
贾晓东
卢姗姗
张婷
吴大为
陈香玲
白隽帆
曾珍
董政
路营
向娇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fifth Medical Center of PLA General Hospital
Original Assignee
Fifth Medical Center of PLA General Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fifth Medical Center of PLA General Hospital filed Critical Fifth Medical Center of PLA General Hospital
Priority to CN201910215575.8A priority Critical patent/CN110148471B/zh
Publication of CN110148471A publication Critical patent/CN110148471A/zh
Application granted granted Critical
Publication of CN110148471B publication Critical patent/CN110148471B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

一种肝胆肿瘤患者生存率预测数据收集***,其包括患者招募部分,患者信息部分,患者随访部分,数据分析部分;其特征在于,通过患者招募部分招募患者,将招募到的患者信息录入患者信息部分,且通过患者随访部分的信息也录入到患者信息部分,数据分析部分从患者信息部分抽提需要的信息进行分析。通过上述***收集的数据并通过数据整理分析构建了一种一种肝胆肿瘤一年期生存率预测模型,通过将模型构建在一个平面上通过各个标尺线来显示,在未来对病人一年期生存率进行预测时,可以直接通过模型,读出各个指标的得分,并最终得到各个指标对应的总分,利用总分与一年期存活率的标尺线进行对应,得到最终的一年期存活率,给出医生与患者一个依据,当通过治疗后在进行预测,可以有效的了解治疗效果。

Description

肝胆肿瘤患者生存率预测数据收集***及模型构建方法
技术领域
本发明属于肿瘤生存率预测方法及***技术领域,尤其涉及肝胆肿瘤方 面,具体涉及为一种肝胆肿瘤患者生存率预测数据收集***及模型构建方法。
背景技术
肝肿瘤是指发生在肝脏部位的肿瘤病变。肝脏是肿瘤好发部位之一,良性 肿瘤较少见,恶性肿瘤中转移性肿瘤较多。原发性肿瘤可发生于肝细胞索、胆 管上皮、血管或其他中胚层组织,转移性肿瘤中多数为转移性癌,少数为转移 性肉瘤。
由于肝脏是人体最大的实质性器官,承担人体的各类重要代谢功能,因此, 肝脏一旦出现恶性肿瘤将导致危及生命的严重后果。又由于肝脏具有丰富的血 流供应,与人体的重要血管关系密切且肝脏恶性肿瘤发病隐匿,生长快速,因 此治疗甚为困难,目前总体疗效和预后不十分理想。
鉴于肝胆肿瘤的的预后效果差的问题,如果能根据肝胆肿瘤患者的各种生 理指标有效实现对患者的一定时间内的生存率的预测,则可根据此生存率的数 值了解患者病情的严重程度及病程的进展情况,结合生存率给出相应的治疗方 案,另外,在经过治疗后,再次通过生存率预测模型进行预测,通过生存率的 改变情况评估治疗手段的有效性,通过这样大量的数据整理及收集,得到最佳 的治疗手段,进一步反馈到临床治疗中。
现有技术中,没有发现存在有进行肝脏相关肿瘤生存率预测的模型及相关 构建方法等,本发明针对现有技术缺乏相关技术的问题,提供一种肝胆肿瘤患 者生存率预测数据收集***及模型构建方法。
发明内容
为了克服现有技术中没有发现存在有进行肝脏相关肿瘤生存率预测的模 型及相关构建方法等问题,本发明提供一种肝胆肿瘤患者生存率预测数据收集 ***及模型构建方法。
一种肝胆肿瘤患者生存率预测数据收集***,其包括患者招募部分,患者 信息部分,患者随访部分,数据分析部分;其特征在于,通过患者招募部分招 募患者,将招募到的患者信息录入患者信息部分,且通过患者随访部分的信息 也录入到患者信息部分,数据分析部分从患者信息部分抽提需要的信息进行分 析;
进一步,患者信息部分按照肝胆肿瘤的类型进行分类录入,患者信息部分 分别录入患者的基本信息,检查信息,临床分期及诊断信息,治疗信息,随访 信息;
基本信息包括患者的姓名,年龄,既往史,婚育史,家庭史;
检查信息包括患者各次入院后的检查数据,如血常规检查、生化检查、凝 血功能检查、肿瘤标记物检查;肝炎五项及DNA定量检测数据;
临床分期及诊断信息包括患者各次入院后医生的诊断信息;
治疗信息包括患者入院后治疗方式的记录;
随访信息包括安排的特定日期的随访安排及随访记录。
进一步,肝胆肿瘤包括:原发性肝癌,胆管细胞癌,肝移植;中晚期肝癌;
进一步,患者随访部分设置各种检索窗口,包括检索患者姓名的患者关联 窗口,病种窗口,随访表窗口,到期情况窗口;检索完成情况的填写窗口;备 注窗口及随访日期范围的窗口。
进一步,分析部分包括单变量分析,人群整体分析,候选模型特定时长生 存率,测试集模型验证,特定时长生存率测试模型。
单变量分析可以对患者的各个单一因素与特定时长生存率的关系。
人群整体分析获得所有患者的平均生存时长,给出特定时长设定的依据。
候选模型特定时长生存率的计算,通过不同的数学模型方法对患者的生存 率进行计算。
测试集模型验证,选取优选的数学模型方式,对测试集模型及候选模型特 定时长的生存率进行比较分析。
特定时长生存率测试模型,在上述分析基础下,对各个指标进行划分,得 出可以直观得到特定时长生存率的表格。
进一步,数据收集***还包括安排部分与提醒部分,将设定的随访日期分 别到安排部分,当到达特定日期后,提醒部分进行提醒,保证随访时间的有效 性,及数据的完整性。
进一步,特定时长生存率为一年期生存率。
本发明还公开了一种肝胆肿瘤患者生存率预测模型构建方法,1)、招募 足够数量的肝胆肿瘤患者病例,2)、收集对应患者基本信息,入院检查指标, 治疗手段;3)、每隔一定时间对患者的情况进行随访直至死亡;4)、当招募 患者都死亡后,针对各生理指标与死亡时间及特定时长的存活率进行分析,得 出肝胆肿瘤患者生存率预测模型。
进一步,招募300人以上的肝胆肿瘤患者病例。
进一步,基本信息包括患者的姓名,年龄,既往史,婚育史,家庭史;
检查信息包括患者各次入院后的检查数据,如血常规检查、生化检查、凝 血功能检查、肿瘤标记物检查;肝炎五项及DNA定量检测数据;
临床分期及诊断信息包括患者各次入院后医生的诊断信息;
治疗信息包括患者入院后治疗方式的记录;
进一步,将数据集以75%和25%的比例分为训练集和测试集;模型的构建 在训练集中进行,而后使用训练集中获得的参数在测试集中进行评价。 进一步,数学模型包括:弹性网络模型、仅包含肿瘤特征的逻辑回归模型,包含 肿瘤标记物和肿瘤特征的逻辑回归模型,具体参数方式如下:
1.弹性网络模型
β=argminβ(L(x:β)+λ[(1-α)||β||2+α||β||1])
其中,β为预测模型中各变量的权重,L(x:β)为预测模型的损失函数,x代表 模型中使用的预测变量,包括肿瘤标记物,肿瘤特征(分期分级),实验室 检查等;λ和α为模型中使用的超参数(hyperparameter),λ超参数代表对模 型回归系数的惩罚强度,α超参数代表惩罚更偏向于剔除不重要变量(selection) 还是缩小所有变量回归系数的大小(shrinkage)。通过选择不同大小的λ和α,来 调节对待估计参数β的惩罚程度,从而灵活地筛选变量,并调节变量在预测模 型中权重;
通过不同α和λ选择时,交叉验证误差的大小,来选择最优的超参数组合。
2.逻辑回归模型
逻辑回归模型可以看作弹性网络模型中λ和α固定为0的特殊情况,即惩罚模 型中的变量,而是通过现有文献和临床知识来对模型中放入的x进行选择。
评价方法为:在测试集中对模型的预测1年生存率的能力进行测试,并绘制ROC 曲线。
ROC曲线的绘制步骤如下:
首先,使用训练集估计各模型中的β值,得到预测模型。
然后,使用训练得到的模型带入测试集中的数据,得到相应的预测分数。
最后,选择不同的预测分数作为断点,将低于断点的数据分类为生存时间短于1年,高于断点的数据分类为生存时间高于1年。通过与测试集中实际的生存时间 数据进行对比,计算该断点下的灵敏度和特异度。通过穷举所有可能断点,可以 获得一系列灵敏度和特异度的组合,以(1-特异度)为横坐标,灵敏度为横坐标 即可绘制ROC曲线,这是预测模型评价的标准方法。
ROC曲线下面积越大,则模型的预测性能越好。经验证,弹性网络模型优于传统 的逻辑回归模型,因此,仅选择弹性网络模型来绘制1年生存率预测的评分尺。 然后使用获得的模型参数来计算回归系数,并筛选其中系数不等于0的预测指标 (各指标分数如何确定的说明)。
各指标分数的计算方式如下步骤:
1.选择回归系数最大的预测指标,将其指标分数定为100
2.根据各变量与最大预测能力变量的回归系数比值确定其他预测 指标的得分。
通过对弹性网络模型的训练,最终选择了中性粒细胞-淋巴细胞比(Neut-to-Lymph Ratios)、前蛋白(Pro-albumin)、乳酸脱氢酶(lactate dehydrogenase,LDH)、 纤维蛋白原(Fibrinogen)、糖类抗原CA125、糖类抗原CA199、癌胚抗原 (carcino-embryonicantigen CEA)、肿瘤边缘清晰(Tumor-at-Margin)等8个检 测指标进行计分预测生存率。
进一步,在生存率预测模型中,1.中性粒细胞-淋巴细胞比(Neut-to-LymphRatios) 检测结果>2.76得分62分,≤2.76得分0分;2.前蛋白(Pro-albumin)检测结果>195得分50分,≤195得分0分;3.乳酸脱氢酶(lactate dehydrogenase,LDH)检测结 果>237得分10分,≤237得分0分;4.纤维蛋白原(Fibrinogen)检测结果>3.5 得分10分,≤237得分0分;5.糖类抗原CA125检测结果>17.4得分100分,≤17.4 得分0分;6.糖类抗原CA199检测结果>492得分76分,≤492得分0分;7.癌胚抗原 (carcino-embryonic antigen CEA)检测结果>3.6得分10分,≤3.6得分0分;8.肿瘤边 缘清晰(Tumor-at-Margin)检测结果为1时得分20分,为0时得分0分。肿瘤 边缘清晰对应检测结果为0;肿瘤边缘不清晰对应检测结果为1。进一步,根据 各个指标的得分求和,得到一个总分,其根据分析有一个总分与一年期生存率的 线性关系y=-0.00133x+0.7;其中y为生存率,x为得分和;当求和数据大于375时, 概率较小,统一统计,分数大于375时,存活率小于0.2。
进一步,当分数总分过高或过低时,利用Linear predictor换算生存概率以供参考, 与生存率的具体关系公式为
本发明还公开了一种肝胆肿瘤一年期生存率预测模型;其包括与各个检测 指标的检测结果与得分的关系;所有指标的得分总和与一年期存活率关系;
进一步,生存率预测模型包括上部的单个指标得分参考线,及下部各个检 测指标及在特定测量结果时的得分线,底部还包括一个总得分线,及总分线下 方一个与总分线对应的存活率线。通过模型可以直接得到各个指标的得分及各 个指标得分的总和,通过在总得分可以直接读出存活率,整个模型能很快得出 患者的生存率,且简单快捷。
进一步,检测指标包括中性粒细胞-淋巴细胞比(Neut-to-Lymph Ratios)、 前蛋白(Pro-albumin)、乳酸脱氢酶(lactate dehydrogenase,LDH)、纤维蛋 白原(Fibrinogen)、糖类抗原CA125、糖类抗原CA199、癌胚抗原 (carcino-embryonic antigenCEA)、肿瘤边缘清晰(Tumor-at-Margin);
进一步,检测指标的检测结构与得分的关系为:1.中性粒细胞-淋巴细胞比(Neut-to-Lymph Ratios)检测结果>2.76得分62分,≤2.76得分0分;2.前蛋 白(Pro-albumin)检测结果>195得分50分,≤195得分0分;3.乳酸脱氢酶(lactate dehydrogenase,LDH)检测结果>237得分10分,≤237得分0分;4.纤维蛋白 原(Fibrinogen)检测结果>3.5得分10分,≤237得分0分;5.糖类抗原CA125 检测结果>17.4得分100分,≤17.4得分0分;6.糖类抗原CA199检测结果>492得 分76分,≤492得分0分;7.癌胚抗原(carcino-embryonicantigen CEA)检测结果>3.6 得分10分,≤3.6得分0分;8.肿瘤边缘清晰(Tumor-at-Margin)检测结果为1 时得分20分,为0时得分0分。
进一步,总得分与一年期生存率关系公式为:y=-0.00133x+0.7。
还可将一年期生存率预测模型一平面的形式展示出来或者设置在模型展 现板上,平面或模型展现板的最上方设置一检测指标得分参考线,下方依次对 应设置各个检测指标检测结果得分线,对应的检测结果得分与上方得分刻度对 应分数对应,另外在最下方两行为总分刻度线及总分刻度线下方设置于对应分 数对应的一年期生存率刻度。
进一步,检测指标得分参考线的范围为0-100,分数间隔为2或2.5。
进一步,检测结果得分线分别为:中性粒细胞-淋巴细胞比(Neut-to-LymphRatios)、前蛋白(Pro-albumin)、乳酸脱氢酶(lactate dehydrogenase,LDH)、 纤维蛋白原(Fibrinogen)、糖类抗原CA125、糖类抗原CA199、癌胚抗原 (carcino-embryonic antigenCEA)、肿瘤边缘清晰(Tumor-at-Margin)八个检 测指标检测结果得分线。
进一步,检测结果线的两端设置标示,检测结果线一端标示对应得分为0 分,另一端标示对应其得分的刻度处;
进一步,1.中性粒细胞-淋巴细胞比(Neut-to-Lymph Ratios)检测结果得分 线的对应刻度为0-62分,0分处的标示为≤2.76的检测结果;62分处的标示 为>2.76的检测结果;
2.前蛋白(Pro-albumin)检测结果得分线的对应刻度为0-50分,0分处的 标示为≤195的检测结果;50分处的标示为>195的检测结果;
3.乳酸脱氢酶(lactate dehydrogenase,LDH)检测结果得分线的对应刻度为 0-10分,0分处的标示为≤237的检测结果;10分处的标示为>237的检测结果;
4.纤维蛋白原(Fibrinogen)检测结果得分线的对应刻度为0-10分,0分处 的标示为≤237的检测结果;10分处的标示为>237的检测结果;
5.糖类抗原CA125检测结果得分线的对应刻度为0-100分,0分处的标示为 ≤17.4的检测结果;100分处的标示为>17.4的检测结果;
6.糖类抗原CA199检测结果得分线的对应刻度为0-76分,0分处的标示为 ≤492的检测结果;76分处的标示为>492的检测结果;
7.癌胚抗原(carcino-embryonic antigen CEA)检测结果得分线的对应刻度为0-10分,0分处的标示为≤3.6的检测结果;10分处的标示为>3.6的检测结果;
8.肿瘤边缘清晰(Tumor-at-Margin)检测结果得分线的对应刻度为0-200 分,0分处的标示为0的检测结果;20分处的标示为1的检测结果。
进一步,所述总分的得分范围为0-400分,一年期生存率的范围为0.7-0.2 逐渐减小,对应的总分值与对应的一年期生存率值对应;当分数值大于380时, 不在继续显示对应的一年期生存率的值。
进一步,在模型显现板上的各个端的标示处设置按钮灯,按钮灯与控制结 构连接,且在总分线下各个分数处设置微型指示灯,且一年期生存率线上的也 设设置微型指示灯,控制结构也与微型指示灯连接,在完成对各个检测指标按 钮灯的按压后,控制结构计算结果,并控制对应的总分线上的微型指示灯与一 年期生存率线上的等显示;
进一步,所述控制结构还包括一显示结构,在完成对各个检测指标按钮灯 的按压后,控制结构计算结果,并将总分数及一年期存活率的值显示在显示结 构上。
通过设置生存率预测数据收集***的设置,可以有效的收集足够多的患者 数据,并根据患者的肝胆肿瘤种类进行区分;且设置了有效的模型构建方法, 将各种临床检测指标与一年期生存率的关系进行联系,给临床医生的诊疗提供 有效的借鉴;另外构建了有效的模型,且模型通过验证有效可用。
附图说明
图1肝胆肿瘤患者总体生存率曲线图;
图2不同属性模型的ROC曲线图;设置backward模型的目的:Backward是 一种传统的变量筛选和降维方法,通过依次尝试排除预测能力最小的变量来实现 减少模型中预测因子,避免发生过度拟合的现象,也是目前临床预测模型中最常 使用的降维方法。由于本专利采用弹性网络也是一种降维方法,设置该模型是为 了让新模型和传统模型保持一定的可比性。
图3肝胆肿瘤患者一年期生存率预测模型;
图4为不同风险的一年期预测生存率患者的实际生存率对比图;
图5为不同风险的一年期预测生存率患者的对应生存天数比例对比图;
图6为本发明实施例2的整体结构示意图;
图7为本发明实施例2的无后盖部分的透视结构示意图;
图8为本发明实施例2的无后盖部分的后面观结构示意图;
图9为本发明实施例2的后盖部分结构示意图;
图中,1、检测指标得分参考线;2、检测指标检测结果得分线;21、总分线;22、 一年期生存率线;3、按钮灯;4、控制结构;41、显示结构。
具体实施方式
(对附图中未画出的结构进行说明,可以没有)
实施例1模型的构建方法及验证
1.患者招募及收据收集
通过该***,在招募***招募肝胆肿瘤患者540名,收集所有患者的中性粒细胞 -淋巴细胞比(Neut-to-Lymph Ratios)、前蛋白(Pro-albumin)、乳酸脱氢酶(lactatedehydrogenase,LDH)、纤维蛋白原(Fibrinogen)、糖类抗原CA125、糖类抗原 CA199、癌胚抗原(carcino-embryonic antigen CEA)、肿瘤边缘清晰 (Tumor-at-Margin)及其他相关检测指标的数据。
2.人群整体寿命的统计
根据所有胆管细胞癌患者从发现到死亡数据的统计,并统计其具体死亡时间 及生存时长。
结果为,如图1所示胆管细胞癌患者中位生存时间是392天,约为1年,因 此以一年生存率作为一个模型构建时间标准。
3.利用不同模型的进行检测指标的筛选
将数据集以75%和25%的比例分为训练集和测试集;模型的构建在训练集中进行,而后使用训练集中获得的参数在测试集中进行评价。通过弹性网络模型、仅 包含肿瘤特征的逻辑回归模型,包含肿瘤标记物和肿瘤特征的逻辑回归模型进行 评价。具体模型及参数如下:
1).弹性网络模型
β=argminβ(L(x:β)+λ[(1-α)||β||2+α||β||1])
其中,β为预测模型中各变量的权重,L(x:β)为预测模型的损失函数,x代表模型 中使用的预测变量,包括肿瘤标记物,肿瘤特征(分期分级),实验室检查等; λ和α为模型中使用的超参数(hyperparameter),λ超参数代表对模型回归系数 的惩罚强度,α超参数代表惩罚更偏向于剔除不重要变量(selection)还是缩小所有 变量回归系数的大小(shrinkage)。通过选择不同大小的λ和α,来调节对待估计参数 β的惩罚程度,从而灵活地筛选变量,并调节变量在预测模型中权重;
通过不同α和λ选择时,交叉验证误差的大小,来选择最优的超参数组合。
2).逻辑回归模型
逻辑回归模型可以看作弹性网络模型中λ和α固定为0的特殊情况,即惩罚模型 中的变量,而是通过现有文献和临床知识来对模型中放入的x进行选择。
评价方法为:在测试集中对模型的预测1年生存率的能力进行测试,并绘制ROC 曲线。具体ROC曲线如图2所示。最终因为弹性网络模型的曲线下面积达到最 大的0.911,而选择弹性网络模型。
ROC曲线的绘制步骤如下:
首先,使用训练集估计各模型中的β值,得到预测模型。
然后,使用训练得到的模型带入测试集中的数据,得到相应的预测分数。
最后,选择不同的预测分数作为断点,将低于断点的数据分类为生存时间短于1年,高于断点的数据分类为生存时间高于1年。通过与测试集中实际的生存时间 数据进行对比,计算该断点下的灵敏度和特异度。通过穷举所有可能断点,可以 获得一系列灵敏度和特异度的组合,以(1-特异度)为横坐标,灵敏度为横坐标 即可绘制ROC曲线,这是预测模型评价的标准方法。
ROC曲线下面积越大,则模型的预测性能越好。
经验证,弹性网络模型优于传统的逻辑回归模型,因此,仅选择弹性网络模型来绘制1年生存率预测的评分尺。然后使用获得的模型参数来计算回归系数,并筛 选其中系数不等于0的预测指标。最终选择中性粒细胞-淋巴细胞比 (Neut-to-Lymph Ratios)、前蛋白(Pro-albumin)、乳酸脱氢酶(lactate dehydrogenase,LDH)、纤维蛋白原(Fibrinogen)、糖类抗原CA125、糖类抗原 CA199、癌胚抗原(carcino-embryonic antigen CEA)、肿瘤边缘清晰 (Tumor-at-Margin)等8个指标。
选择回归系数最大的预测指标,将其指标分数定为100
根据各变量与最大预测能力变量的回归系数比值确定其他预测指标的得分。
4.具体模型:
一种肝胆肿瘤一年期生存率预测模型;其包括与各个检测指标的检测结果与得分的关系;所有指标的得分总和与一年期存活率关系;生存率预测模型包括上部的 单个指标得分参考线,及下部各个检测指标及在特定测量结果时的得分线,底部 还包括一个总得分线,及总分线下方一个与总分线对应的存活率线。通过模型可 以直接得到各个指标的得分及各个指标得分的总和,通过在总得分可以直接读出 存活率,整个模型能很快得出患者的生存率,且简单快捷。
检测指标包括中性粒细胞-淋巴细胞比(Neut-to-Lymph Ratios)、前蛋白 (Pro-albumin)、乳酸脱氢酶(lactate dehydrogenase,LDH)、纤维蛋白原 (Fibrinogen)、糖类抗原CA125、糖类抗原CA199、癌胚抗原(carcino-embryonic antigen CEA)、肿瘤边缘清晰(Tumor-at-Margin);
检测指标的检测结构与得分的关系为:1.中性粒细胞-淋巴细胞比(Neut-to-Lymph Ratios)检测结果>2.76得分62分,≤2.76得分0分;2.前蛋白(Pro-albumin)检 测结果>195得分50分,≤195得分0分;3.乳酸脱氢酶(lactate dehydrogenase, LDH)检测结果>237得分10分,≤237得分0分;4.纤维蛋白原(Fibrinogen)检 测结果>3.5得分10分,≤237得分0分;5.糖类抗原CA125检测结果>17.4得分 100分,≤17.4得分0分;6.糖类抗原CA199检测结果>492得分76分,≤492得 分0分;7.癌胚抗原(carcino-embryonic antigen CEA)检测结果>3.6得分10分, ≤3.6得分0分;8.肿瘤边缘清晰(Tumor-at-Margin)检测结果为1时得分20分, 为0时得分0分。
总得分与一年期生存率关系,具体模型包含0-400的等分线,其对应的存活率为0.7-0.2的等分线;其中总分数为0,存活率为0.7的点相对应;总分数为375, 得分为0.2的点相对应。当需要具体数值是通过线性预测值及公式计算,公式为
具体模型如图3.
4.风险分层能力的的验证方法
首先根据逻辑回归模型一年生存率的预测值大小将患者平均分为高危-中危-低危三个组别;后从数据收集***中收集每组患者的一年期存活率及每组患者的实 际生存时长,分别对三组的实际一年期存活率情况及3组的实际生存时长情况进 行分析;
结果为:如图4所示,根据三组患者实际的一年期存活率,可以很好的得出,高 危组到中风险组再到低危风险组的存活率依次为0.04,0.5,0.82,依次增高,且 存在显著性差异。通过分析每组患者的实际生存时长,高危组到中风险组再到低 危风险组的在相同时长的存活率出现了明显的分层,如图5所示是三组患者的实 际生存曲线。这两个结果显示了预测模型具有较好的风险分层能力。
实施例2一种肝胆肿瘤患者生存率预测模型展现器械
将一年期生存率预测模型一平面的形式展示出来或者设置在模型展现板 上,平面或模型展现板的最上方设置一检测指标得分参考线,下方依次对应设 置各个检测指标检测结果得分线2,对应的检测结果得分与上方得分刻度对应 分数对应,另外在最下方两行为总分刻度线及总分刻度线下方设置于对应分数 对应的一年期生存率刻度。
检测指标得分参考线的范围为0-100,分数间隔为2或2.5.
检测结果得分线分别为:中性粒细胞-淋巴细胞比(Neut-to-Lymph Ratios)、 前蛋白(Pro-albumin)、乳酸脱氢酶(lactate dehydrogenase,LDH)、纤维蛋 白原(Fibrinogen)、糖类抗原CA125、糖类抗原CA199、癌胚抗原 (carcino-embryonic antigenCEA)、肿瘤边缘清晰(Tumor-at-Margin)八个检 测指标检测结果得分线2。
检测结果线的两端设置标示,检测结果线一端标示对应得分为0分,另一 端标示对应其得分的刻度处;
1.中性粒细胞-淋巴细胞比(Neut-to-Lymph Ratios)检测结果得分线的对应 刻度为0-62分,0分处的标示为≤2.76的检测结果;62分处的标示为>2.76的 检测结果;
2.前蛋白(Pro-albumin)检测结果得分线的对应刻度为0-50分,0分处的 标示为≤195的检测结果;50分处的标示为>195的检测结果;
3.乳酸脱氢酶(lactate dehydrogenase,LDH)检测结果得分线的对应刻度为0-10分,0分处的标示为≤237的检测结果;10分处的标示为>237的检测结果;
4.纤维蛋白原(Fibrinogen)检测结果得分线的对应刻度为0-10分,0分处 的标示为≤237的检测结果;10分处的标示为>237的检测结果;
5.糖类抗原CA125检测结果得分线的对应刻度为0-100分,0分处的标示为 ≤17.4的检测结果;100分处的标示为>17.4的检测结果;
6.糖类抗原CA199检测结果得分线的对应刻度为0-76分,0分处的标示为 ≤492的检测结果;76分处的标示为>492的检测结果;
7.癌胚抗原(carcino-embryonic antigen CEA)检测结果得分线的对应刻度为0-10分,0分处的标示为≤3.6的检测结果;10分处的标示为>3.6的检测结果;
8.肿瘤边缘清晰(Tumor-at-Margin)检测结果得分线的对应刻度为0-200 分,0分处的标示为0的检测结果;20分处的标示为1的检测结果。
所述总分的得分范围为0-400分,一年期生存率的范围为0.7-0.2逐渐减小, 对应的总分值与对应的一年期生存率值对应;当分数值大于380时,不在继续 显示对应的一年期生存率的值。
在模型显现板上的各个端的标示处设置按钮灯3,按钮灯3与控制结构4 连接,且在总分线21下各个分数处设置微型指示灯,且一年期生存率线22上 的也设设置微型指示灯,控制结构4也与微型指示灯连接,在完成对各个检测 指标按钮灯3的按压后,控制结构4计算结果,并控制对应的总分线21上的 微型指示灯与一年期生存率线22上的等显示;
所述控制结构4还包括一显示结构41,在完成对各个检测指标按钮灯3 的按压后,控制结构4计算结果,并将总分数及一年期存活率的值显示在显示 结构41上。
上述实施例的说明只是用于理解本发明。应当指出,对于本领域的普通技 术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进, 这些改进也将落入本发明权利要求的保护范围内。

Claims (10)

1.一种肝胆肿瘤患者生存率预测数据收集***,其包括患者招募部分,患者信息部分,患者随访部分,数据分析部分;其特征在于,通过患者招募部分招募患者,将招募到的患者信息录入患者信息部分,且通过患者随访部分的信息也录入到患者信息部分,数据分析部分从患者信息部分抽提需要的信息进行分析。
2.根据权利要求1所述的***,其特征在于,患者信息部分按照肝胆肿瘤的类型进行分类录入,患者信息部分分别录入患者的基本信息,检查信息,临床分期及诊断信息,治疗信息,随访信息。
3.根据权利要求2所述的***,其特征在于,肝胆肿瘤包括:原发性肝癌,胆管细胞癌,肝移植;中晚期肝癌。
4.一种肝胆肿瘤患者生存率预测模型构建方法,1)、招募足够数量的肝胆肿瘤患者病例,2)、收集对应患者基本信息,入院检查指标,治疗手段;3)、每隔一定时间对患者的情况进行随访直至死亡;4)、当招募患者都死亡后,针对各生理指标与死亡时间及特定时长的存活率进行分析,得出肝胆肿瘤患者生存率预测模型。
5.一种肝胆肿瘤一年期生存率预测模型;其包括与各个检测指标的检测结果与得分的关系;所有指标的得分总和与一年期存活率关系。
6.根据权利要求5所述的预测模型,其特征在于,生存率预测模型包括上部的单个指标得分参考线,及下部各个检测指标及在特定测量结果时的得分线,底部还包括一个总得分线,及总分线下方一个与总分线对应的存活率线。
7.根据权利要求5所述的预测模型,其特征在于,检测指标包括中性粒细胞-淋巴细胞比(Neut-to-Lymph Ratios)、前蛋白(Pro-albumin)、乳酸脱氢酶(lactatedehydrogenase,LDH)、纤维蛋白原(Fibrinogen)、糖类抗原CA125、糖类抗原CA199、癌胚抗原(carcino-embryonic antigen CEA)、肿瘤边缘清晰(Tumor-at-Margin)。
8.根据权利要求6所述的预测模型,其特征在于,检测指标的检测结构与得分的关系为:1.中性粒细胞-淋巴细胞比(Neut-to-Lymph Ratios)检测结果>2.76得分62分,≤2.76得分0分;2.前蛋白(Pro-albumin)检测结果>195得分50分,≤195得分0分;3.乳酸脱氢酶(lactate dehydrogenase,LDH)检测结果>237得分10分,≤237得分0分;4.纤维蛋白原(Fibrinogen)检测结果>3.5得分10分,≤237得分0分;5.糖类抗原CA125检测结果>17.4得分100分,≤17.4得分0分;6.糖类抗原CA199检测结果>492得分76分,≤492得分0分;7.癌胚抗原(carcino-embryonic antigen CEA)检测结果>3.6得分10分,≤3.6得分0分;8.肿瘤边缘清晰(Tumor-at-Margin)检测结果为1时得分20分,为0时得分0分。
9.根据权利要求5所述的预测模型,其特征在于,将一年期生存率预测模型一平面的形式展示出来或者设置在模型展现板上,平面或模型展现板的最上方设置一检测指标得分参考线,下方依次对应设置各个检测指标检测结果得分线,对应的检测结果得分与上方得分刻度对应分数对应,另外在最下方两行为总分刻度线及总分刻度线下方设置于对应分数对应的一年期生存率刻度。
10.根据权利要求6-9任意一项所述的预测模型,其特征在于,检测指标得分参考线的范围为0-100,分数间隔为2或2.5。
CN201910215575.8A 2019-03-21 2019-03-21 肝胆肿瘤患者生存率预测数据收集***及模型构建方法 Active CN110148471B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910215575.8A CN110148471B (zh) 2019-03-21 2019-03-21 肝胆肿瘤患者生存率预测数据收集***及模型构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910215575.8A CN110148471B (zh) 2019-03-21 2019-03-21 肝胆肿瘤患者生存率预测数据收集***及模型构建方法

Publications (2)

Publication Number Publication Date
CN110148471A true CN110148471A (zh) 2019-08-20
CN110148471B CN110148471B (zh) 2023-01-13

Family

ID=67588882

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910215575.8A Active CN110148471B (zh) 2019-03-21 2019-03-21 肝胆肿瘤患者生存率预测数据收集***及模型构建方法

Country Status (1)

Country Link
CN (1) CN110148471B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110706808A (zh) * 2019-09-12 2020-01-17 北京深睿博联科技有限责任公司 动脉瘤破裂状态预测方法和装置
CN112562810A (zh) * 2020-12-15 2021-03-26 张丽 一种浆细胞肿瘤疾病管理录入***及录入方法
CN112786145A (zh) * 2021-03-04 2021-05-11 华中科技大学同济医学院附属协和医院 一种器官移植患者他克莫司用药剂量精准预测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512477A (zh) * 2015-12-03 2016-04-20 万达信息股份有限公司 基于降维组合分类算法非计划性再入院风险评估预测模型
CN106650229A (zh) * 2016-11-09 2017-05-10 中国人民解放军第二军医大学第二附属医院 肾癌病例数字化信息管理***
CN107305596A (zh) * 2016-04-15 2017-10-31 中国科学院上海生命科学研究院 肝门部胆管癌患者预后预测模型
CN108922628A (zh) * 2018-04-23 2018-11-30 华北电力大学 一种基于动态Cox模型的乳腺癌预后生存率预测方法
KR101947725B1 (ko) * 2017-10-13 2019-02-13 고려대학교 산학협력단 암 치료 예측결과 제공 방법 및 시스템

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512477A (zh) * 2015-12-03 2016-04-20 万达信息股份有限公司 基于降维组合分类算法非计划性再入院风险评估预测模型
CN107305596A (zh) * 2016-04-15 2017-10-31 中国科学院上海生命科学研究院 肝门部胆管癌患者预后预测模型
CN106650229A (zh) * 2016-11-09 2017-05-10 中国人民解放军第二军医大学第二附属医院 肾癌病例数字化信息管理***
KR101947725B1 (ko) * 2017-10-13 2019-02-13 고려대학교 산학협력단 암 치료 예측결과 제공 방법 및 시스템
CN108922628A (zh) * 2018-04-23 2018-11-30 华北电力大学 一种基于动态Cox模型的乳腺癌预后生存率预测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
孙帆: "纤维蛋白原与前白蛋白比值在结直肠癌诊断及预后中的应用价值", 《中国优秀硕士学位论文全文数据库》 *
曾钦: "肝癌患者治疗预后的多因素分析", 《中国优秀硕士学位论文全文数据库》 *
郑雨晗: "加权部分自适应弹性网络及其在癌症诊断中的应用", 《中国优秀硕士学位论文全文数据库》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110706808A (zh) * 2019-09-12 2020-01-17 北京深睿博联科技有限责任公司 动脉瘤破裂状态预测方法和装置
CN112562810A (zh) * 2020-12-15 2021-03-26 张丽 一种浆细胞肿瘤疾病管理录入***及录入方法
CN112786145A (zh) * 2021-03-04 2021-05-11 华中科技大学同济医学院附属协和医院 一种器官移植患者他克莫司用药剂量精准预测方法
CN112786145B (zh) * 2021-03-04 2023-09-05 华中科技大学同济医学院附属协和医院 一种器官移植患者他克莫司用药剂量精准预测方法

Also Published As

Publication number Publication date
CN110148471B (zh) 2023-01-13

Similar Documents

Publication Publication Date Title
Swets Measuring the accuracy of diagnostic systems
CN110148471A (zh) 肝胆肿瘤患者生存率预测数据收集***及模型构建方法
CN105319364B (zh) 用于预测小肝癌复发的联合诊断标记
CN106248945B (zh) 对肝细胞癌患者进行肝细胞癌根治切除术预后情况分组的方法、***以及试剂盒
CN113270188B (zh) 食管鳞癌根治术后患者预后预测模型构建方法及装置
CN113327679A (zh) 一种肺栓塞临床风险及预后评分方法与***
Jeon et al. Subcirrhotic liver stiffness by FibroScan correlates with lower risk of hepatocellular carcinoma in patients with HBV-related cirrhosis
CN113223722B (zh) 基于列线图的肺结节数据库及预测模型的构建方法及***
CN106461664A (zh) 用于肺癌的循环肿瘤细胞诊断
CN110070128A (zh) 一种基于随机森林模型的慢性肝病风险评估***
CN112331333A (zh) 一种基于肝癌三联检的肝癌诊断模型的建立方法
CN107180154A (zh) 对单个肿瘤的肝细胞癌患者进行原位肝移植术预后情况分组的方法和***
CN111584082A (zh) 一种基于临床检验多维数据的原发性肝细胞癌微血管侵犯回归预测模型的建立及其应用
CN114864080A (zh) 一种肝癌诊断模型c-galad ii的建立方法、***、设备及介质
CN115099331A (zh) 基于可解释性机器学习算法的恶性胸腔积液辅助诊断***
CN117133439A (zh) 一种卵巢恶性和交界性肿瘤诊断模型构建方法
CN112201318A (zh) 实验室指标模型在covid-19患者危险分层中的应用方法
CN113744869B (zh) 基于机器学习建立早期筛查轻链型淀粉样变性的方法及其应用
Inoue et al. Combining longitudinal studies of PSA
CN112946276B (zh) I期肺腺癌患者术后复发风险预测***及其应用
CN106290874A (zh) 对肝细胞癌患者进行肝移植术预后情况分组的方法、***以及试剂盒
CN113851217A (zh) 一种对hcc患者术后早期无复发生存率的预测方法
Yu et al. Clinical prediction models for hepatitis B virus-related acute-on-chronic liver failure: a technical report
CN116030963A (zh) 一种甲胎蛋白阴性原发性肝细胞癌列线图诊断模型及其构建方法和应用
CN116313077A (zh) 一种用于胆管癌根治性切除术后预后风险评估方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant