CN111524597A - 一种食管鳞癌预后评估模型装置及其建模方法 - Google Patents

一种食管鳞癌预后评估模型装置及其建模方法 Download PDF

Info

Publication number
CN111524597A
CN111524597A CN202010304356.XA CN202010304356A CN111524597A CN 111524597 A CN111524597 A CN 111524597A CN 202010304356 A CN202010304356 A CN 202010304356A CN 111524597 A CN111524597 A CN 111524597A
Authority
CN
China
Prior art keywords
data
module
prognosis
esophageal squamous
evaluation model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010304356.XA
Other languages
English (en)
Inventor
毛羽
付占昭
董立新
张运捷
张强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
First Hospital Of Qinhuangdao
Original Assignee
First Hospital Of Qinhuangdao
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by First Hospital Of Qinhuangdao filed Critical First Hospital Of Qinhuangdao
Priority to CN202010304356.XA priority Critical patent/CN111524597A/zh
Publication of CN111524597A publication Critical patent/CN111524597A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Medical Informatics (AREA)
  • Pathology (AREA)
  • Public Health (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Analytical Chemistry (AREA)
  • Databases & Information Systems (AREA)
  • Immunology (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种食管鳞癌预后评估模型装置及其建模方法,其包括GEO数据库模块、数据获取模块、数据预处理模块、含量特征提取模块、特征变量提取模块、预后模型建立模块;所述数据获取模块用于获取所述GEO数据库模块中的食管鳞癌相关的基因表达数据及预后数据;所述数据预处理模块用于对食管鳞癌相关的基因表达数据及预后数据进行预处理;所述含量特征提取模块用于提取所述数据预处理模块处理后数据的含量特征。本发明能够筛选与生存时间相关的肿瘤浸润淋巴细胞亚型并建立预后模型,当有新的特征数据时,只要输入这些特征数据的值到回归模型当中就可以得到癌症患者的生存时间概率,对癌症的预后具有重要的意义。

Description

一种食管鳞癌预后评估模型装置及其建模方法
技术领域
本发明涉及医疗器械领域,尤其涉及一种食管鳞癌预后评估模型装置及其建模方法。
背景技术
食管鳞癌(Esophageal squamous cell carcinoma,ESCC)在全球范围内最为常见的癌症类型之一,也是造成癌症相关死亡率较高的常见原因。尽管在诊断方法、化疗、放疗和手术等方面取得了进展,ESCC发病率及死亡率仍较高,晚期患者的预后仍然很差。目前ESCC的预后评估主要根据诊断时肿瘤的TNM分期状况预测预后结局。尽管TNM分期是一种稳定有效的预后评价体系,然而在临床中其精确度有待提高。因此,临床上迫切需要一个新的、更具针对性的ESCC预后评估指标或模型。
肿瘤免疫微环境(Tumor immune microenvironment,TIME)是肿瘤细胞生存的环境,其中浸润各种免疫细胞,包括自然杀伤细胞(Natural killer cell,NK)、调节性T细胞(Regulatory T cell,Tregs)、树突状细胞(Dendritic cell,DC)、中性粒细胞(Neutrophils)、CD8+T细胞等。这些肿瘤组织中浸润的淋巴细胞可影响肿瘤的发生发展。迄今为止,已证实肿瘤浸润性免疫细胞的含量与肺癌、食管鳞癌、乳腺癌和卵巢癌等恶性肿瘤的临床结局有关。
目前,国内外有许多新的基于TIME的免疫预后评价体系的建立。但是,研究者多以一两个免疫细胞为着眼点,探究其与癌症预后的关系,所建立的预后模型也存在较大的完善空间。
发明内容
本发明的目的是为了解决现有技术中存在的缺点,而提出的一种食管鳞癌预后评估模型装置及其建模方法。
为了实现上述目的,本发明采用了如下技术方案:
一种食管鳞癌预后评估模型装置,包括GEO数据库模块、数据获取模块、数据预处理模块、含量特征提取模块、特征变量提取模块、预后模型建立模块;
所述数据获取模块用于获取所述GEO数据库模块中的食管鳞癌相关的基因表达数据及预后数据;
所述数据预处理模块用于对食管鳞癌相关的基因表达数据及预后数据进行预处理;
所述含量特征提取模块用于提取所述数据预处理模块处理后数据的含量特征;
所述特征变量提取模块用于提取所述含量特征提取模块提取的含量中的特征变量;
所述预后模型建立模块用于建立预后评估模型,所述预后评估模型为:OS风险值(Risk)=3.02Memory B cells-0.004CD8Tcells-4.04CD4 memoryTcells(resting)-3.55Tregs+2.36Gammadelta T cells-3.74NKcells(activated)+10.15Dendriticcells(resting)+2.59Dendritic cells(activated)-1.54Mastcells(resting)。
优选的,所述数据预处理模块包括数据赋值单元、缺失值补充单元和批次差去除单元。
优选的,所述含量特征提取模块采用CIBERSORT分析方法进行分析提取。
优选的,所述特征变量提取模块采用LASSO-COX算法进行提取。
一种食管鳞癌预后评估模型装置的建模方法,具体包括以下步骤:
S1:从GEO数据库中获取食管鳞癌相关的基因表达数据及预后数据共n=179例;
S2:对S1中的临床数据进行数字赋值,使临床数据以数字形式展示;
S3:利用R语言对临床数据进行缺失值补充;
S4:对补充后的数据进行归一化处理去除批次差;
S5:利用CIBERSORT分析得到22种肿瘤浸润淋巴细胞亚型的含量特征;
S6:利用LASSO-COX算法对22种肿瘤浸润淋巴细胞亚型的含量进行特征选择并建模,得到肿瘤浸润淋巴细胞预后模型。
优选的,所述步骤S6中构建所得的肿瘤浸润淋巴细胞预后模型为:OS风险值(Risk)=3.02Memory B cells-0.004CD8Tcells-4.04CD4 memoryTcells(resting)-3.55Tregs+2.36Gammadelta Tcells-3.74NKcells(activated)+10.15Dendriticcells(resting)+2.59Dendritic cells(activated)-1.54Mastcells(resting)。
本发明从Gene Expression Omnibus(GEO)公共数据库获取食管鳞癌mRNA表达谱的数据为研究对象,利用CIBERSORT分析得到22种肿瘤浸润淋巴细胞亚型的含量特征,采用LASSO(Least absolute shrinkage and selection operator,最小绝对值收敛和选择算子)-Cox回归方法,筛选与生存时间相关的肿瘤浸润淋巴细胞亚型并建立预后模型,当有新的特征数据时,只要输入这些特征数据的值到回归模型当中就可以得到癌症患者的生存时间概率,对癌症的预后具有重要的意义。
附图说明
图1为本发明的流程示意图。
图2为本发明的22种肿瘤浸润淋巴细胞亚型的含量特征示意图。
图3为本发明的肿瘤浸润淋巴细胞预后模型建立过程示意图。
图4为本发明的低风险组和高风险组示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
参照图1-4一种食管鳞癌预后评估模型装置,包括GEO数据库模块、数据获取模块、数据预处理模块、含量特征提取模块、特征变量提取模块、预后模型建立模块;
所述数据获取模块用于获取所述GEO数据库模块中的食管鳞癌相关的基因表达数据及预后数据;
所述数据预处理模块用于对食管鳞癌相关的基因表达数据及预后数据进行预处理;
所述含量特征提取模块用于提取所述数据预处理模块处理后数据的含量特征;
所述特征变量提取模块用于提取所述含量特征提取模块提取的含量中的特征变量;
所述预后模型建立模块用于建立预后评估模型,所述预后评估模型为:OS风险值(Risk)=3.02Memory B cells-0.004CD8Tcells-4.04CD4 memoryTcells(resting)-3.55Tregs+2.36Gammadelta Tcells-3.74NKcells(activated)+10.15Dendriticcells(resting)+2.59Dendritic cells(activated)-1.54Mastcells(resting)。
所述数据预处理模块包括数据赋值单元、缺失值补充单元和批次差去除单元,所述含量特征提取模块采用CIBERSORT分析方法进行分析提取,所述特征变量提取模块采用LASSO-COX算法进行提取。
一种食管鳞癌预后评估模型装置的建模方法,具体包括以下步骤:
S1:从GEO数据库中获取食管鳞癌相关的基因表达数据及预后数据共n=179例;
S2:对S1中的临床数据进行数字赋值,使临床数据以数字形式展示;
S3:利用R语言对临床数据进行缺失值补充;
S4:对补充后的数据进行归一化处理去除批次差;
S5:利用CIBERSORT分析得到22种肿瘤浸润淋巴细胞亚型的含量特征(过程如图2);
S6:利用LASSO-COX算法对22种肿瘤浸润淋巴细胞亚型的含量进行特征选择并建模,得到肿瘤浸润淋巴细胞预后模型(过程如图3)。
本实施方式中,所述步骤S6中构建所得的肿瘤浸润淋巴细胞预后模型为:OS风险值(Risk)=3.02Memory B cells-0.004CD8Tcells-4.04CD4 memoryTcells(resting)-3.55Tregs+2.36Gammadelta T cells-3.74NKcells(activated)+10.15Dendriticcells(resting)+2.59Dendritic cells(activated)-1.54Mastcells(resting)。
验证模型的可靠性:
我们通过从The Cancer Genome Atlas(TCGA)公共数据库中,下载ESCC患者的mRNA表达数据及预后信息(共n=81例),按照以上步骤进行预后分析。计算测试队列中每个患者的Risk值,通过ROC曲线分析,取曲线下面积最大处为截断值,将患者分为低风险组和高风险组(如图4)。
根据截断值,在验证队列中,KM生存分析发现高风险组在测试对列中预后较差(OS:HR=1.956,95%CI:1.152to 3.368,log rank P=0.014)。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (6)

1.一种食管鳞癌预后评估模型装置,其特征在于,包括GEO数据库模块、数据获取模块、数据预处理模块、含量特征提取模块、特征变量提取模块、预后模型建立模块;
所述数据获取模块用于获取所述GEO数据库模块中的食管鳞癌相关的基因表达数据及预后数据;
所述数据预处理模块用于对食管鳞癌相关的基因表达数据及预后数据进行预处理;
所述含量特征提取模块用于提取所述数据预处理模块处理后数据的含量特征;
所述特征变量提取模块用于提取所述含量特征提取模块提取的含量中的特征变量;
所述预后模型建立模块用于建立预后评估模型,所述预后评估模型为:OS风险值(Risk)=3.02Memory B cells-0.004CD8Tcells-4.04CD4 memoryTcells(resting)-3.55Tregs+2.36Gammadelta T cells-3.74NKcells(activated)+10.15Dendriticcells(resting)+2.59Dendritic cells(activated)-1.54Mastcells(resting)。
2.根据权利要求1所述的一种食管鳞癌预后评估模型装置,其特征在于,所述数据预处理模块包括数据赋值单元、缺失值补充单元和批次差去除单元。
3.根据权利要求1或2所述的一种食管鳞癌预后评估模型装置,其特征在于,所述含量特征提取模块采用CIBERSORT分析方法进行分析提取。
4.根据权利要求3所述的一种食管鳞癌预后评估模型装置,其特征在于,所述特征变量提取模块采用LASSO-COX算法进行提取。
5.一种食管鳞癌预后评估模型装置的建模方法,其特征在于,具体包括以下步骤:
S1:从GEO数据库中获取食管鳞癌相关的基因表达数据及预后数据共n=179例;
S2:对S1中的临床数据进行数字赋值,使临床数据以数字形式展示;
S3:利用R语言对临床数据进行缺失值补充;
S4:对补充后的数据进行归一化处理去除批次差;
S5:利用CIBERSORT分析得到22种肿瘤浸润淋巴细胞亚型的含量特征;
S6:利用LASSO-COX算法对22种肿瘤浸润淋巴细胞亚型的含量进行特征选择并建模,得到肿瘤浸润淋巴细胞预后模型。
6.根据权利要求5所述的一种食管鳞癌预后评估模型装置的建模方法,其特征在于,所述步骤S6中构建所得的肿瘤浸润淋巴细胞预后模型为:OS风险值(Risk)=3.02Memory Bcells-0.004CD8Tcells-4.04CD4 memoryTcells(resting)-3.55Tregs+2.36Gammadelta Tcells-3.74NKcells(activated)+10.15Dendriticcells(resting)+2.59Dendritic cells(activated)-1.54Mastcells(resting)。
CN202010304356.XA 2020-04-17 2020-04-17 一种食管鳞癌预后评估模型装置及其建模方法 Pending CN111524597A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010304356.XA CN111524597A (zh) 2020-04-17 2020-04-17 一种食管鳞癌预后评估模型装置及其建模方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010304356.XA CN111524597A (zh) 2020-04-17 2020-04-17 一种食管鳞癌预后评估模型装置及其建模方法

Publications (1)

Publication Number Publication Date
CN111524597A true CN111524597A (zh) 2020-08-11

Family

ID=71901758

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010304356.XA Pending CN111524597A (zh) 2020-04-17 2020-04-17 一种食管鳞癌预后评估模型装置及其建模方法

Country Status (1)

Country Link
CN (1) CN111524597A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112635063A (zh) * 2020-12-30 2021-04-09 华南理工大学 一种肺癌预后综合预测模型、构建方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107273718A (zh) * 2017-06-27 2017-10-20 电子科技大学 一种融合dna甲基化特征的生存时间分析方法
CN108389624A (zh) * 2018-01-31 2018-08-10 浙江大学 基于cox比例风险模型的十二指肠腺癌预后预测***
CN109859801A (zh) * 2019-02-14 2019-06-07 辽宁省肿瘤医院 一种含有七个基因作为生物标志物预测肺鳞癌预后的模型及建立方法
CN109880894A (zh) * 2019-03-05 2019-06-14 杭州西合森医学检验实验室有限公司 基于RNAseq的肿瘤免疫微环境预测模型的构建方法
CN109897899A (zh) * 2019-03-01 2019-06-18 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所) 一种用于局部晚期食管鳞癌预后判断的标志物及其应用
CN110273003A (zh) * 2019-07-26 2019-09-24 安徽医科大学第一附属医院 一种***状肾细胞癌患者预后复发检测标志工具及其风险评估模型的建立

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107273718A (zh) * 2017-06-27 2017-10-20 电子科技大学 一种融合dna甲基化特征的生存时间分析方法
CN108389624A (zh) * 2018-01-31 2018-08-10 浙江大学 基于cox比例风险模型的十二指肠腺癌预后预测***
CN109859801A (zh) * 2019-02-14 2019-06-07 辽宁省肿瘤医院 一种含有七个基因作为生物标志物预测肺鳞癌预后的模型及建立方法
CN109897899A (zh) * 2019-03-01 2019-06-18 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所) 一种用于局部晚期食管鳞癌预后判断的标志物及其应用
CN109880894A (zh) * 2019-03-05 2019-06-14 杭州西合森医学检验实验室有限公司 基于RNAseq的肿瘤免疫微环境预测模型的构建方法
CN110273003A (zh) * 2019-07-26 2019-09-24 安徽医科大学第一附属医院 一种***状肾细胞癌患者预后复发检测标志工具及其风险评估模型的建立

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
章婧文: "基于肿瘤免疫微环境的胃癌患者预后因素分析及死亡预测模型构建", 《中国博士学位论文全文数据库 医药卫生科技辑》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112635063A (zh) * 2020-12-30 2021-04-09 华南理工大学 一种肺癌预后综合预测模型、构建方法及装置
CN112635063B (zh) * 2020-12-30 2022-05-24 华南理工大学 一种肺癌预后综合预测模型、构建方法及装置

Similar Documents

Publication Publication Date Title
Sherafatian Tree-based machine learning algorithms identified minimal set of miRNA biomarkers for breast cancer diagnosis and molecular subtyping
CN104694663B (zh) Brca基因易感snp位点检测组合物
Shi et al. CXCL10 potentiates immune checkpoint blockade therapy in homologous recombination-deficient tumors
CN113160889B (zh) 一种基于cfDNA组学特性的癌症无创早筛方法
CN108470114B (zh) 基于单样本的二代测序数据分析肿瘤突变负荷的方法
KR102381252B1 (ko) 혈중 무세포 dna 기반 간암 치료 예후예측 방법
Liu et al. Comprehensive molecular analyses of a novel mutational signature classification system with regard to prognosis, genomic alterations, and immune landscape in glioma
CN112542247A (zh) 乳腺癌新辅助化疗后病理学完全缓解概率预测方法及***
EP4372751A1 (en) Cancer detection model and construction method therefor, and reagent kit
CN111524597A (zh) 一种食管鳞癌预后评估模型装置及其建模方法
EP2602733A2 (en) Biological cell assessment using whole genome sequence and oncological therapy planning using same
CN111180071B (zh) 高危型hpv型别和***前病变阶段关系的计算方法及装置
Cao et al. A signature of 13 autophagy‑related gene pairs predicts prognosis in hepatocellular carcinoma
Li et al. Screening and identification of an immune‐associated lncRNA prognostic signature in ovarian carcinoma: evidence from bioinformatic analysis
Sun et al. [Retracted] The Immune Infiltration in HNSCC and Its Clinical Value: A Comprehensive Study Based on the TCGA and GEO Databases
Chen et al. Identification and validation of CYBB, CD86, and C3AR1 as the key genes related to macrophage infiltration of gastric cancer
CN114203256B (zh) 基于微生物丰度的mibc分型及预后预测模型构建方法
CN111584002A (zh) 用于检测肿瘤突变负荷的方法、计算设备和计算机存储介质
CN103815926B (zh) 乳腺癌检测方法和装置
CN112382341A (zh) 一种用于鉴定食管鳞癌预后相关的生物标志物的方法
Wang et al. A Prognostic Model of Non-Small Cell Lung Cancer With a Radiomics Nomogram in an Eastern Chinese Population
KR20190114351A (ko) 비침습적 산전 검사에 의한 태아 염색체의 미세결실 또는 미세증폭의 확인 방법
CN115188415A (zh) 一种基于免疫特征的肠癌分子分型方法和装置
Bao et al. Identifying potential neoantigens for cervical cancer immunotherapy using comprehensive genomic variation profiling of cervical intraepithelial neoplasia and cervical cancer
CN113822872A (zh) 一种用于肝癌影像组学图像特征信息提取方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200811