CN115862876A - 基于免疫微环境基因群预测肺腺癌患者预后和用药指导的装置及计算机可读存储介质 - Google Patents
基于免疫微环境基因群预测肺腺癌患者预后和用药指导的装置及计算机可读存储介质 Download PDFInfo
- Publication number
- CN115862876A CN115862876A CN202310186412.8A CN202310186412A CN115862876A CN 115862876 A CN115862876 A CN 115862876A CN 202310186412 A CN202310186412 A CN 202310186412A CN 115862876 A CN115862876 A CN 115862876A
- Authority
- CN
- China
- Prior art keywords
- lung adenocarcinoma
- immune
- subtype
- patient
- genes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 208000010507 Adenocarcinoma of Lung Diseases 0.000 title claims abstract description 185
- 201000005249 lung adenocarcinoma Diseases 0.000 title claims abstract description 182
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 111
- 238000004393 prognosis Methods 0.000 title claims abstract description 50
- 239000003814 drug Substances 0.000 title claims abstract description 23
- 229940079593 drug Drugs 0.000 title claims abstract description 20
- 238000002512 chemotherapy Methods 0.000 claims abstract description 28
- 238000013394 immunophenotyping Methods 0.000 claims description 56
- 230000014509 gene expression Effects 0.000 claims description 55
- 230000004083 survival effect Effects 0.000 claims description 51
- 230000000391 smoking effect Effects 0.000 claims description 38
- 238000012360 testing method Methods 0.000 claims description 30
- 101000979599 Homo sapiens Protein NKG7 Proteins 0.000 claims description 20
- 102100023370 Protein NKG7 Human genes 0.000 claims description 20
- 230000008901 benefit Effects 0.000 claims description 19
- 238000011282 treatment Methods 0.000 claims description 19
- -1 ndifs 1 Proteins 0.000 claims description 18
- DQLATGHUWYMOKM-UHFFFAOYSA-L cisplatin Chemical compound N[Pt](N)(Cl)Cl DQLATGHUWYMOKM-UHFFFAOYSA-L 0.000 claims description 16
- 229960004316 cisplatin Drugs 0.000 claims description 16
- GBABOYUKABKIAF-GHYRFKGUSA-N vinorelbine Chemical compound C1N(CC=2C3=CC=CC=C3NC=22)CC(CC)=C[C@H]1C[C@]2(C(=O)OC)C1=CC([C@]23[C@H]([C@]([C@H](OC(C)=O)[C@]4(CC)C=CCN([C@H]34)CC2)(O)C(=O)OC)N2C)=C2C=C1OC GBABOYUKABKIAF-GHYRFKGUSA-N 0.000 claims description 16
- 229960002066 vinorelbine Drugs 0.000 claims description 16
- 102100040121 Allograft inflammatory factor 1 Human genes 0.000 claims description 15
- 102100022717 Atypical chemokine receptor 1 Human genes 0.000 claims description 15
- 102100021411 C-terminal-binding protein 2 Human genes 0.000 claims description 15
- 101001110283 Canis lupus familiaris Ras-related C3 botulinum toxin substrate 1 Proteins 0.000 claims description 15
- 102100026658 Cathepsin W Human genes 0.000 claims description 15
- 101000890626 Homo sapiens Allograft inflammatory factor 1 Proteins 0.000 claims description 15
- 101000678879 Homo sapiens Atypical chemokine receptor 1 Proteins 0.000 claims description 15
- 101000910988 Homo sapiens Cathepsin W Proteins 0.000 claims description 15
- 101001065658 Homo sapiens Leukocyte-specific transcript 1 protein Proteins 0.000 claims description 15
- 101000923835 Homo sapiens Low density lipoprotein receptor adapter protein 1 Proteins 0.000 claims description 15
- 101001110313 Homo sapiens Ras-related C3 botulinum toxin substrate 2 Proteins 0.000 claims description 15
- 101000686246 Homo sapiens Ras-related protein R-Ras Proteins 0.000 claims description 15
- 101000837067 Homo sapiens SH3 domain-binding glutamic acid-rich-like protein 3 Proteins 0.000 claims description 15
- 102100034389 Low density lipoprotein receptor adapter protein 1 Human genes 0.000 claims description 15
- 102100022129 Ras-related C3 botulinum toxin substrate 2 Human genes 0.000 claims description 15
- 102100024683 Ras-related protein R-Ras Human genes 0.000 claims description 15
- 102100028643 SH3 domain-binding glutamic acid-rich-like protein 3 Human genes 0.000 claims description 15
- 102100027233 Solute carrier organic anion transporter family member 1B1 Human genes 0.000 claims description 15
- 101150052649 ctbp2 gene Proteins 0.000 claims description 15
- 101000620009 Homo sapiens Polyunsaturated fatty acid 5-lipoxygenase Proteins 0.000 claims description 14
- 102100022364 Polyunsaturated fatty acid 5-lipoxygenase Human genes 0.000 claims description 14
- 238000000034 method Methods 0.000 claims description 14
- 102100025620 Cytochrome b-245 light chain Human genes 0.000 claims description 11
- 101000856723 Homo sapiens Cytochrome b-245 light chain Proteins 0.000 claims description 11
- 102100024341 10 kDa heat shock protein, mitochondrial Human genes 0.000 claims description 10
- 102100030877 28S ribosomal protein S16, mitochondrial Human genes 0.000 claims description 10
- 102100028104 39S ribosomal protein L19, mitochondrial Human genes 0.000 claims description 10
- 102100038222 60 kDa heat shock protein, mitochondrial Human genes 0.000 claims description 10
- 102100021405 ATP-dependent RNA helicase DDX1 Human genes 0.000 claims description 10
- 102100029647 Apoptosis-associated speck-like protein containing a CARD Human genes 0.000 claims description 10
- 102100026198 Aspartate-tRNA ligase, mitochondrial Human genes 0.000 claims description 10
- 102100025218 B-cell differentiation antigen CD72 Human genes 0.000 claims description 10
- 102100032367 C-C motif chemokine 5 Human genes 0.000 claims description 10
- 102100025338 Calcium-binding tyrosine phosphorylation-regulated protein Human genes 0.000 claims description 10
- 102100037085 Complement C1q subcomponent subunit B Human genes 0.000 claims description 10
- 102100035436 Complement factor D Human genes 0.000 claims description 10
- 102100028233 Coronin-1A Human genes 0.000 claims description 10
- 102100034501 Cyclin-dependent kinases regulatory subunit 1 Human genes 0.000 claims description 10
- 102100028188 Cystatin-F Human genes 0.000 claims description 10
- 102100026234 Cytokine receptor common subunit gamma Human genes 0.000 claims description 10
- 102100030418 DENN domain-containing protein 3 Human genes 0.000 claims description 10
- 101100444938 Danio rerio eif3ja gene Proteins 0.000 claims description 10
- 102100039147 Dimethyladenosine transferase 2, mitochondrial Human genes 0.000 claims description 10
- 102100021381 Eukaryotic translation elongation factor 1 epsilon-1 Human genes 0.000 claims description 10
- 102100034226 Eukaryotic translation initiation factor 3 subunit J Human genes 0.000 claims description 10
- 102100039466 Eukaryotic translation initiation factor 5B Human genes 0.000 claims description 10
- 102100041007 Glia maturation factor gamma Human genes 0.000 claims description 10
- 102100030386 Granzyme A Human genes 0.000 claims description 10
- 102100030385 Granzyme B Human genes 0.000 claims description 10
- 102100022132 High affinity immunoglobulin epsilon receptor subunit gamma Human genes 0.000 claims description 10
- 101000980303 Homo sapiens 10 kDa heat shock protein, mitochondrial Proteins 0.000 claims description 10
- 101000635698 Homo sapiens 28S ribosomal protein S16, mitochondrial Proteins 0.000 claims description 10
- 101001079803 Homo sapiens 39S ribosomal protein L19, mitochondrial Proteins 0.000 claims description 10
- 101000883686 Homo sapiens 60 kDa heat shock protein, mitochondrial Proteins 0.000 claims description 10
- 101001041697 Homo sapiens ATP-dependent RNA helicase DDX1 Proteins 0.000 claims description 10
- 101000728679 Homo sapiens Apoptosis-associated speck-like protein containing a CARD Proteins 0.000 claims description 10
- 101000630206 Homo sapiens Aspartate-tRNA ligase, mitochondrial Proteins 0.000 claims description 10
- 101000934359 Homo sapiens B-cell differentiation antigen CD72 Proteins 0.000 claims description 10
- 101000797762 Homo sapiens C-C motif chemokine 5 Proteins 0.000 claims description 10
- 101000935132 Homo sapiens Calcium-binding tyrosine phosphorylation-regulated protein Proteins 0.000 claims description 10
- 101000740680 Homo sapiens Complement C1q subcomponent subunit B Proteins 0.000 claims description 10
- 101000737554 Homo sapiens Complement factor D Proteins 0.000 claims description 10
- 101000860852 Homo sapiens Coronin-1A Proteins 0.000 claims description 10
- 101000710200 Homo sapiens Cyclin-dependent kinases regulatory subunit 1 Proteins 0.000 claims description 10
- 101000916688 Homo sapiens Cystatin-F Proteins 0.000 claims description 10
- 101001055227 Homo sapiens Cytokine receptor common subunit gamma Proteins 0.000 claims description 10
- 101000842747 Homo sapiens DENN domain-containing protein 3 Proteins 0.000 claims description 10
- 101000889470 Homo sapiens Dimethyladenosine transferase 2, mitochondrial Proteins 0.000 claims description 10
- 101000615221 Homo sapiens Eukaryotic translation elongation factor 1 epsilon-1 Proteins 0.000 claims description 10
- 101001036496 Homo sapiens Eukaryotic translation initiation factor 5B Proteins 0.000 claims description 10
- 101001039458 Homo sapiens Glia maturation factor gamma Proteins 0.000 claims description 10
- 101001009599 Homo sapiens Granzyme A Proteins 0.000 claims description 10
- 101001009603 Homo sapiens Granzyme B Proteins 0.000 claims description 10
- 101000824104 Homo sapiens High affinity immunoglobulin epsilon receptor subunit gamma Proteins 0.000 claims description 10
- 101000777628 Homo sapiens Leukocyte antigen CD37 Proteins 0.000 claims description 10
- 101000764294 Homo sapiens Lymphotoxin-beta Proteins 0.000 claims description 10
- 101000760817 Homo sapiens Macrophage-capping protein Proteins 0.000 claims description 10
- 101001128500 Homo sapiens Marginal zone B- and B1-cell-specific protein Proteins 0.000 claims description 10
- 101000623673 Homo sapiens Mitochondrial fission regulator 1 Proteins 0.000 claims description 10
- 101000946889 Homo sapiens Monocyte differentiation antigen CD14 Proteins 0.000 claims description 10
- 101000966872 Homo sapiens Myotubularin-related protein 2 Proteins 0.000 claims description 10
- 101001109620 Homo sapiens Nucleolar and coiled-body phosphoprotein 1 Proteins 0.000 claims description 10
- 101001109600 Homo sapiens Nucleolar protein 7 Proteins 0.000 claims description 10
- 101000991945 Homo sapiens Nucleotide triphosphate diphosphatase NUDT15 Proteins 0.000 claims description 10
- 101001129851 Homo sapiens Paired immunoglobulin-like type 2 receptor alpha Proteins 0.000 claims description 10
- 101001124792 Homo sapiens Proteasome subunit beta type-10 Proteins 0.000 claims description 10
- 101000817237 Homo sapiens Protein ECT2 Proteins 0.000 claims description 10
- 101000835295 Homo sapiens Protein THEMIS2 Proteins 0.000 claims description 10
- 101000794048 Homo sapiens Ribosome biogenesis protein BRX1 homolog Proteins 0.000 claims description 10
- 101000633782 Homo sapiens SLAM family member 8 Proteins 0.000 claims description 10
- 101000826081 Homo sapiens SRSF protein kinase 1 Proteins 0.000 claims description 10
- 101000863882 Homo sapiens Sialic acid-binding Ig-like lectin 7 Proteins 0.000 claims description 10
- 101000653812 Homo sapiens Small nuclear ribonucleoprotein E Proteins 0.000 claims description 10
- 101000934346 Homo sapiens T-cell surface antigen CD2 Proteins 0.000 claims description 10
- 101000946863 Homo sapiens T-cell surface glycoprotein CD3 delta chain Proteins 0.000 claims description 10
- 101000738335 Homo sapiens T-cell surface glycoprotein CD3 zeta chain Proteins 0.000 claims description 10
- 101000946843 Homo sapiens T-cell surface glycoprotein CD8 alpha chain Proteins 0.000 claims description 10
- 101000809875 Homo sapiens TYRO protein tyrosine kinase-binding protein Proteins 0.000 claims description 10
- 101000979190 Homo sapiens Transcription factor MafB Proteins 0.000 claims description 10
- 101000801232 Homo sapiens Tumor necrosis factor receptor superfamily member 1B Proteins 0.000 claims description 10
- 101001009087 Homo sapiens Tyrosine-protein kinase HCK Proteins 0.000 claims description 10
- 101001047681 Homo sapiens Tyrosine-protein kinase Lck Proteins 0.000 claims description 10
- 101000617278 Homo sapiens Tyrosine-protein phosphatase non-receptor type 7 Proteins 0.000 claims description 10
- 101000939529 Homo sapiens UDP-glucose 6-dehydrogenase Proteins 0.000 claims description 10
- 101000744322 Homo sapiens eIF5-mimic protein 1 Proteins 0.000 claims description 10
- 108010017411 Interleukin-21 Receptors Proteins 0.000 claims description 10
- 102100030699 Interleukin-21 receptor Human genes 0.000 claims description 10
- 102100031586 Leukocyte antigen CD37 Human genes 0.000 claims description 10
- 102100026894 Lymphotoxin-beta Human genes 0.000 claims description 10
- 102100024573 Macrophage-capping protein Human genes 0.000 claims description 10
- 102100031826 Marginal zone B- and B1-cell-specific protein Human genes 0.000 claims description 10
- 102100023197 Mitochondrial fission regulator 1 Human genes 0.000 claims description 10
- 102100035877 Monocyte differentiation antigen CD14 Human genes 0.000 claims description 10
- 102100040602 Myotubularin-related protein 2 Human genes 0.000 claims description 10
- 102100023617 Neutrophil cytosol factor 4 Human genes 0.000 claims description 10
- 102100022726 Nucleolar and coiled-body phosphoprotein 1 Human genes 0.000 claims description 10
- 102100022741 Nucleolar protein 7 Human genes 0.000 claims description 10
- 102100030661 Nucleotide triphosphate diphosphatase NUDT15 Human genes 0.000 claims description 10
- 102100031651 Paired immunoglobulin-like type 2 receptor alpha Human genes 0.000 claims description 10
- 102100029081 Proteasome subunit beta type-10 Human genes 0.000 claims description 10
- 102100040437 Protein ECT2 Human genes 0.000 claims description 10
- 102100026110 Protein THEMIS2 Human genes 0.000 claims description 10
- 102100029834 Ribosome biogenesis protein BRX1 homolog Human genes 0.000 claims description 10
- 102100029214 SLAM family member 8 Human genes 0.000 claims description 10
- 102100023010 SRSF protein kinase 1 Human genes 0.000 claims description 10
- 101150024632 STARD5 gene Proteins 0.000 claims description 10
- 102100029946 Sialic acid-binding Ig-like lectin 7 Human genes 0.000 claims description 10
- 102100029809 Small nuclear ribonucleoprotein E Human genes 0.000 claims description 10
- 102100026709 StAR-related lipid transfer protein 5 Human genes 0.000 claims description 10
- 102100025237 T-cell surface antigen CD2 Human genes 0.000 claims description 10
- 102100035891 T-cell surface glycoprotein CD3 delta chain Human genes 0.000 claims description 10
- 102100037906 T-cell surface glycoprotein CD3 zeta chain Human genes 0.000 claims description 10
- 102100034922 T-cell surface glycoprotein CD8 alpha chain Human genes 0.000 claims description 10
- 102100038717 TYRO protein tyrosine kinase-binding protein Human genes 0.000 claims description 10
- 102100023234 Transcription factor MafB Human genes 0.000 claims description 10
- 102100033733 Tumor necrosis factor receptor superfamily member 1B Human genes 0.000 claims description 10
- 102100027389 Tyrosine-protein kinase HCK Human genes 0.000 claims description 10
- 102100024036 Tyrosine-protein kinase Lck Human genes 0.000 claims description 10
- 102100021648 Tyrosine-protein phosphatase non-receptor type 7 Human genes 0.000 claims description 10
- 102100029640 UDP-glucose 6-dehydrogenase Human genes 0.000 claims description 10
- 101150029915 eIF3j gene Proteins 0.000 claims description 10
- 102100039119 eIF5-mimic protein 1 Human genes 0.000 claims description 10
- 108010086154 neutrophil cytosol factor 40K Proteins 0.000 claims description 10
- 238000010276 construction Methods 0.000 claims description 9
- 238000011161 development Methods 0.000 claims description 3
- 101000973439 Homo sapiens NADH-ubiquinone oxidoreductase 75 kDa subunit, mitochondrial Proteins 0.000 claims description 2
- 102100022195 NADH-ubiquinone oxidoreductase 75 kDa subunit, mitochondrial Human genes 0.000 claims description 2
- 238000001647 drug administration Methods 0.000 claims description 2
- 239000000126 substance Substances 0.000 claims description 2
- 238000004519 manufacturing process Methods 0.000 claims 1
- 230000002265 prevention Effects 0.000 claims 1
- 208000020816 lung neoplasm Diseases 0.000 abstract description 18
- 206010058467 Lung neoplasm malignant Diseases 0.000 abstract description 16
- 201000005202 lung cancer Diseases 0.000 abstract description 16
- 230000000694 effects Effects 0.000 abstract description 10
- 238000003745 diagnosis Methods 0.000 abstract description 7
- 239000000523 sample Substances 0.000 description 85
- 230000008676 import Effects 0.000 description 31
- 238000004458 analytical method Methods 0.000 description 15
- 238000012795 verification Methods 0.000 description 12
- 238000001325 log-rank test Methods 0.000 description 10
- 238000012549 training Methods 0.000 description 8
- 206010028980 Neoplasm Diseases 0.000 description 7
- 239000011159 matrix material Substances 0.000 description 7
- 230000000521 hyperimmunizing effect Effects 0.000 description 6
- 238000003559 RNA-seq method Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 206010018338 Glioma Diseases 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000005965 immune activity Effects 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 230000035772 mutation Effects 0.000 description 4
- 239000013610 patient sample Substances 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- 208000025174 PANDAS Diseases 0.000 description 3
- 208000021155 Paediatric autoimmune neuropsychiatric disorders associated with streptococcal infection Diseases 0.000 description 3
- 240000004718 Panda Species 0.000 description 3
- 235000016496 Panda oleosa Nutrition 0.000 description 3
- 230000036039 immunity Effects 0.000 description 3
- 208000002154 non-small cell lung carcinoma Diseases 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 238000012502 risk assessment Methods 0.000 description 3
- 210000004881 tumor cell Anatomy 0.000 description 3
- 208000029729 tumor suppressor gene on chromosome 11 Diseases 0.000 description 3
- 238000010200 validation analysis Methods 0.000 description 3
- 208000037051 Chromosomal Instability Diseases 0.000 description 2
- 108020004414 DNA Proteins 0.000 description 2
- 208000032612 Glial tumor Diseases 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 201000007983 brain glioma Diseases 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 102000052116 epidermal growth factor receptor activity proteins Human genes 0.000 description 2
- 108700015053 epidermal growth factor receptor activity proteins Proteins 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 230000001900 immune effect Effects 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- YOHYSYJDKVYCJI-UHFFFAOYSA-N n-[3-[[6-[3-(trifluoromethyl)anilino]pyrimidin-4-yl]amino]phenyl]cyclopropanecarboxamide Chemical compound FC(F)(F)C1=CC=CC(NC=2N=CN=C(NC=3C=C(NC(=O)C4CC4)C=CC=3)C=2)=C1 YOHYSYJDKVYCJI-UHFFFAOYSA-N 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000002626 targeted therapy Methods 0.000 description 2
- 238000011269 treatment regimen Methods 0.000 description 2
- 101150048714 75 gene Proteins 0.000 description 1
- 102100031480 Dual specificity mitogen-activated protein kinase kinase 1 Human genes 0.000 description 1
- 101710146526 Dual specificity mitogen-activated protein kinase kinase 1 Proteins 0.000 description 1
- 102000010834 Extracellular Matrix Proteins Human genes 0.000 description 1
- 108010037362 Extracellular Matrix Proteins Proteins 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 101001126417 Homo sapiens Platelet-derived growth factor receptor alpha Proteins 0.000 description 1
- 101000686031 Homo sapiens Proto-oncogene tyrosine-protein kinase ROS Proteins 0.000 description 1
- 101000984753 Homo sapiens Serine/threonine-protein kinase B-raf Proteins 0.000 description 1
- 229940076838 Immune checkpoint inhibitor Drugs 0.000 description 1
- 102000037984 Inhibitory immune checkpoint proteins Human genes 0.000 description 1
- 108091008026 Inhibitory immune checkpoint proteins Proteins 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- 229940124647 MEK inhibitor Drugs 0.000 description 1
- 108010057466 NF-kappa B Proteins 0.000 description 1
- 102000003945 NF-kappa B Human genes 0.000 description 1
- 102100030485 Platelet-derived growth factor receptor alpha Human genes 0.000 description 1
- 102100023347 Proto-oncogene tyrosine-protein kinase ROS Human genes 0.000 description 1
- 102100027103 Serine/threonine-protein kinase B-raf Human genes 0.000 description 1
- 238000000692 Student's t-test Methods 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 208000009956 adenocarcinoma Diseases 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 238000003915 air pollution Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 210000000621 bronchi Anatomy 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 230000005929 chemotherapeutic response Effects 0.000 description 1
- 238000009104 chemotherapy regimen Methods 0.000 description 1
- 230000002380 cytological effect Effects 0.000 description 1
- 238000013399 early diagnosis Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 210000002744 extracellular matrix Anatomy 0.000 description 1
- 230000007614 genetic variation Effects 0.000 description 1
- 210000004907 gland Anatomy 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 210000002865 immune cell Anatomy 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 239000012274 immune-checkpoint protein inhibitor Substances 0.000 description 1
- 230000002757 inflammatory effect Effects 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000015788 innate immune response Effects 0.000 description 1
- 229940079322 interferon Drugs 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000004877 mucosa Anatomy 0.000 description 1
- 210000003097 mucus Anatomy 0.000 description 1
- 210000000440 neutrophil Anatomy 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 238000009522 phase III clinical trial Methods 0.000 description 1
- 238000011518 platinum-based chemotherapy Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 102000016914 ras Proteins Human genes 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 238000012353 t test Methods 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了诊断领域中基于免疫微环境基因群预测肺腺癌患者预后和用药指导的装置及计算机可读存储介质。本发明所要解决的技术问题是如何预测肺癌患者的预后或对其进行指导用药。本发明所保护的一个技术方案为预测待测肺腺癌患者预后的装置,所述装置可包括免疫分型模型构建模块、免疫分型模块和预后预测模块,通过基于免疫微环境基因群75个基因对待测患者进行免疫亚型分型,并根据免疫分型亚型预测待测肺腺癌患者的预后或指导待测患者的临床用药。使用本发明所提供的装置可有效预测肺腺癌患者的预后;并可以避免过渡使用化疗,一方面能使患者避免承受化疗带来的严重副作用,另一方面也将减轻患者和社会的经济负担。
Description
技术领域
本发明涉及诊断领域中基于免疫微环境基因群预测肺腺癌患者预后和用药指导的装置及计算机可读存储介质。
背景技术
肺癌中非小细胞肺癌占到了所有肺癌的80%。50-60%的非小细胞肺癌为肺腺癌,约30%的初诊非小细胞肺癌为早中期(I-IIIB)腺癌。并且由于人口老龄化和空气污染,各亚型肺癌的发病率仍然处于上升阶段,严重危害人群健康。肺腺癌起源于支气管黏膜上皮细胞,少数起源于大支气管的粘液腺,好发于老年人群。
由于二代测序技术的普及,结合对肺腺癌发病机制的深入探索,DNA水平上的基因组变异检测在晚期肺腺癌的诊断治疗中得到广泛应用,目前已建立相对归一化的治疗策略。对于携带EGFR突变、ALK融合、ROS1融合、MET突变、BRAF/RAS/MEK1突变等遗传学变异的肺癌患者可开展靶向治疗,而针对无法应用靶向治疗的晚期肺癌患者,主要开展铂类药物为基础的化疗,但其治疗效果有限,5年生存期仅提升5%,而且副作用大,常导致严重的骨髓抑制,并发中性粒细胞的减少和严重感染。而近年来开展的免疫检查点抑制剂的治疗,虽然为肺癌患者带来了福音,但也存在很大个体差异,仅有<25%的病人能够获益。
肺癌的早期发现、早期诊断将能显著提升患者的生存期。从群体层面看,I期肺癌手术后的5年生存率在58%至73%之间。由于体检、早筛的普及,近年来被诊断的肺癌患者越来越多趋向于早中期肺癌。但是,现有的常规诊断和分子病理检测,尚无法对早中期肺癌开展客观、精准的个体化风险评估,也不能预测其对化疗的应答。现有分子分型研究,尽管发现了基于细胞增殖、细胞外基质及直接与预后相关的基因网络,但均未能有效应用于早中期肺腺癌的个体化风险评估和化疗应答的预测。
发明内容
本发明所要解决的技术问题是如何对肺癌患者进行分型和/或如何对肺癌患者进行指导用药和/或如何预测肺癌患者的预后和/或如何对肺癌患者进行风险评估。
为了解决上述技术问题,本发明首先提供了预测待测肺腺癌患者预后的装置,所述装置可包括如下模块:
M1)免疫分型模型构建模块:用于基于已知肺腺癌样本集的75个基因的表达谱数据、层级聚类和SVM算法获得预测单样本肺腺癌患者免疫亚型的免疫分型模型;
M2)免疫分型模块:用于基于待测肺腺癌患者的所述75个基因的表达谱数据使用所述免疫分型模型预测待测肺腺癌患者的免疫分型亚型;
M3)预后预测模块:用于基于所述免疫分型亚型预测待测肺腺癌患者的预后。
所述75个基因可为如下所示的基因:
ACKR1、AIF1、ALOX5、C1QB、CAPG、CCL5、CD14、CD2、CD247、CD37、CD3D、CD72、CD8A、CFD、CORO1A、CST7、CTSW、CYBA、DENND3、FCER1G、GMFG、GZMA、GZMB、HCK、IL21R、IL2RG、LCK、LDLRAP1、LST1、LTB、MAFB、MZB1、NCF1、NCF4、NKG7、PILRA、PSMB10、PTPN7、PYCARD、RAC2、RRAS、SH3BGRL3、SIGLEC7、SLAMF8、STARD5、THEMIS2、TNFRSF1B、TYROBP、BRIX1、BZW2、CABYR、CKS1B、CTBP2、DARS2、DDX1、ECT2、EEF1E1、EIF3J、EIF5B、HSPD1、HSPE1、MRPL19、MRPS16、MTFR1、MTMR2、NDUFS1、NOL7、NOLC1、NUDT15、SLC7A11、SNRPE、SRPK1、TFB2M、UGDH和YWHAE。
所述免疫亚型分型可包括高免疫亚型(Immune High)和低免疫亚型(ImmuneLow)。所述Immune High亚型可为高免疫活性的免疫分型亚型;所述Immune Low亚型可为低免疫活性的免疫分型亚型。
所述免疫分型亚型为Immune High亚型的待测肺腺癌患者的预后可好于所述免疫分型亚型为Immune Low亚型的待测肺腺癌患者。
所述75个基因具体可为如下所示的基因:ACKR1(GenBank号:2532,update date:2022-12-5)、AIF1(GenBankGenBank号:199,update date:2022-12-4)、ALOX5(GenBankGenBank号:240,update date:2022-12-8)、BRIX1(GenBank号:55299,updatedate:2022-12-4)、BZW2(GenBank号:28969,update date:2022-8-12)、C1QB(GenBank号:713,update date:2022-12-13)、CABYR(GenBank号:26256,update date:2022-8-12)、CAPG(GenBank号:822,update date:2022-12-8)、CCL5(GenBank号:6352,update date:2022-12-13)、CD14(GenBank号:929,update date:2022-12-8)、CD2(GenBank号:914,updatedate:2022-12-8)、CD247(GenBank号:919,update date:2022-12-21)、CD37(GenBank号:951,update date:2022-9-22)、CD3D(GenBank号:915,update date:2022-12-8)、CD72(GenBank号:971,update date:2022-11-13)、CD8A(GenBank号:925,update date:2022-12-14)、CFD(GenBank号:1675,update date:2022-12-8)、CKS1B(GenBank号:1163,updatedate:2022-12-8)、CORO1A(GenBank号:11151,update date:2022-11-6)、CST7(GenBank号:8530,update date:2022-8-5)、CTBP2(GenBank号:1488,update date:2022-12-4)、CTSW(GenBank号:1521,update date:2022-9-18)、CYBA(GenBank号:1535,update date:2022-12-13)、DARS2(GenBank号:55157,update date:2022-11-6)、DDX1(GenBank号:1653,update date:2022-12-8)、DENND3(GenBank号:22898,update date:2022-12-8)、ECT2(GenBank号:1894,update date:2022-12-13)、EEF1E1(GenBank号:9521,update date:2022-12-4)、EIF3J(GenBank号:8669,update date:2022-12-8)、EIF5B(GenBank号:9669,update date:2022-12-8)、FCER1G(GenBank号:2207,update date:2022-9-22)、GMFG(GenBank号:9535,update date:2022-12-8)、GZMA(GenBank号:3001,update date:2022-9-9)、GZMB(GenBank号:3002,update date:2022-12-13)、HCK(GenBank号:3055,updatedate:2022-12-8)、HSPD1(GenBank号:3329,update date:2022-12-8)、HSPE1(GenBank号:3336,update date:2022-12-4)、IL21R(GenBank号:50615,update date:2022-10-9)、IL2RG(GenBank号:3561,update date:2022-11-4)、LCK(GenBank号:3932,update date:2022-12-21)、LDLRAP1(GenBank号:26119,update date:2022-11-5)、LST1(GenBank号:7940,update date:2022-9-22)、LTB(GenBank号:4050,update date:2022-12-9)、MAFB(GenBank号:9935,update date:2022-12-8)、MRPL19(GenBank号:9801,update date:2022-12-8)、MRPS16(GenBank号:51021,update date:2022-12-21)、MTFR1(GenBank号:9650,update date:2022-12-17)、MTMR2(GenBank号:8898,update date:2022-12-8)、MZB1(GenBank号:51237,update date:2022-8-12)、NCF1(GenBank号:653361,update date:2022-12-8)、NCF4(GenBank号:4689,update date:2022-12-8)、NDUFS1(GenBank号:4719,update date:2022-12-8)、NKG7(GenBank号:4818,update date:2022-9-22)、NOL7(GenBank号:51406,update date:2022-12-8)、NOLC1(GenBank号:9221,update date:2022-12-4)、NUDT15(GenBank号:55270,update date:2022-11-27)、PILRA(GenBank号:29992,update date:2022-9-22)、PSMB10(GenBank号:5699,update date:2022-12-8)、PTPN7(GenBank号:5778,update date:2022-12-8)、PYCARD(GenBank号:29108,updatedate:2022-12-8)、RAC2(GenBank号:5880,update date:2022-12-8)、RRAS(GenBank号:6237,update date:2022-12-8)、SH3BGRL3(GenBank号:83442,update date:2022-12-4)、SIGLEC7(GenBank号:27036,update date:2022-8-18)、SLAMF8(GenBank号:56833,updatedate:2022-9-22)、SLC7A11(GenBank号:23657,update date:2022-12-13)、SNRPE(GenBank号:6635,update date:2022-12-8)、SRPK1(GenBank号:6732,update date:2022-12-8)、STARD5(GenBank号:80765,update date:2022-12-8)、TFB2M(GenBank号:64216,updatedate:2022-12-8)、THEMIS2(GenBank号:9473,update date:2022-12-8)、TNFRSF1B(GenBank号:7133,update date:2022-11-6)、TYROBP(GenBank号:7305,update date:2022-10-9)、UGDH(GenBank号:7358,update date:2022-12-4)和YWHAE(GenBank号:7531,update date:2022-12-8)。
M1)所述免疫分型模型构建模块可通过包括如下步骤的方法建立:
M1-1)基于已知肺腺癌样本集的75个基因的表达谱数据进行层级聚类获得所述已知肺腺癌样本的免疫分型结果;
M1-2)基于已知肺腺癌样本集的75个基因的表达谱数据和所述免疫分型结果,使用SVM算法获得预测单样本肺腺癌患者免疫亚型的免疫分型模型。
所述SVM算法可来源于python语言中机器学习包sklearn包。所述已知肺腺癌样本集中的样本数量可大于100个。
上述装置中,所述肺腺癌患者可为早中期肺腺癌患者。
所述预后可为总生存率,如5年以上的总生存率。
上述装置中,所述肺腺癌患者可为肺腺癌吸烟患者。
所述肺腺癌吸烟患者可为I期、II期或者III期A肺腺癌患者。
为了解决上述技术问题,本发明还提供了预测待测肺腺癌患者指导用药的装置,所述装置可包括如下模块:
N1)免疫分型模型构建模块:用于基于已知肺腺癌样本集的75个基因的表达谱数据、层级聚类和SVM算法获得预测单样本肺腺癌患者免疫亚型的免疫分型模型;
N2)免疫分型模块:用于基于待测肺腺癌患者的75个基因的表达谱数据使用所述免疫分型模型预测待测肺腺癌患者的免疫分型亚型;
N3)指导用药输出模块:用于基于所述免疫分型亚型确定待测肺腺癌患者是否受益于顺铂联合长春瑞宾进行化疗。
上述装置中,所述免疫分型亚型可包括Immune High亚型和Immune Low亚型。所述Immune High亚型可为高免疫活性的免疫分型亚型;所述Immune Low亚型可为低免疫活性的免疫分型亚型。
N3)中所述免疫分型亚型为Immune Low亚型的待测肺腺癌患者的指导用药可为受益于使用顺铂联合长春瑞宾进行化疗。所述免疫分型亚型为Immune High亚型的待测肺腺癌患者的指导用药可为不受益于顺铂联合长春瑞宾进行化疗。
所述75个基因可为如下所示的基因:
ACKR1、AIF1、ALOX5、C1QB、CAPG、CCL5、CD14、CD2、CD247、CD37、CD3D、CD72、CD8A、CFD、CORO1A、CST7、CTSW、CYBA、DENND3、FCER1G、GMFG、GZMA、GZMB、HCK、IL21R、IL2RG、LCK、LDLRAP1、LST1、LTB、MAFB、MZB1、NCF1、NCF4、NKG7、PILRA、PSMB10、PTPN7、PYCARD、RAC2、RRAS、SH3BGRL3、SIGLEC7、SLAMF8、STARD5、THEMIS2、TNFRSF1B、TYROBP、BRIX1、BZW2、CABYR、CKS1B、CTBP2、DARS2、DDX1、ECT2、EEF1E1、EIF3J、EIF5B、HSPD1、HSPE1、MRPL19、MRPS16、MTFR1、MTMR2、NDUFS1、NOL7、NOLC1、NUDT15、SLC7A11、SNRPE、SRPK1、TFB2M、UGDH和YWHAE。
所述75个基因具体可为如下所示的基因:
ACKR1(GenBank号:2532,update date:2022-12-5)、AIF1(GenBank号:199,updatedate:2022-12-4)、ALOX5(GenBank号:240,update date:2022-12-8)、BRIX1(GenBank号:55299,update date:2022-12-4)、BZW2(GenBank号:28969,update date:2022-8-12)、C1QB(GenBank号:713,update date:2022-12-13)、CABYR(GenBank号:26256,update date:2022-8-12)、CAPG(GenBank号:822,update date:2022-12-8)、CCL5(GenBank号:6352,update date:2022-12-13)、CD14(GenBank号:929,update date:2022-12-8)、CD2(GenBank号:914,update date:2022-12-8)、CD247(GenBank号:919,update date:2022-12-21)、CD37(GenBank号:951,update date:2022-9-22)、CD3D(GenBank号:915,update date:2022-12-8)、CD72(GenBank号:971,update date:2022-11-13)、CD8A(GenBank号:925,update date:2022-12-14)、CFD(GenBank号:1675,update date:2022-12-8)、CKS1B(GenBank号:1163,update date:2022-12-8)、CORO1A(GenBank号:11151,update date:2022-11-6)、CST7(GenBank号:8530,update date:2022-8-5)、CTBP2(GenBank号:1488,update date:2022-12-4)、CTSW(GenBank号:1521,update date:2022-9-18)、CYBA(GenBank号:1535,update date:2022-12-13)、DARS2(GenBank号:55157,update date:2022-11-6)、DDX1(GenBank号:1653,update date:2022-12-8)、DENND3(GenBank号:22898,update date:2022-12-8)、ECT2(GenBank号:1894,update date:2022-12-13)、EEF1E1(GenBank号:9521,update date:2022-12-4)、EIF3J(GenBank号:8669,update date:2022-12-8)、EIF5B(GenBank号:9669,update date:2022-12-8)、FCER1G(GenBank号:2207,update date:2022-9-22)、GMFG(GenBank号:9535,update date:2022-12-8)、GZMA(GenBank号:3001,update date:2022-9-9)、GZMB(GenBank号:3002,update date:2022-12-13)、HCK(GenBank号:3055,update date:2022-12-8)、HSPD1(GenBank号:3329,updatedate:2022-12-8)、HSPE1(GenBank号:3336,update date:2022-12-4)、IL21R(GenBank号:50615,update date:2022-10-9)、IL2RG(GenBank号:3561,update date:2022-11-4)、LCK(GenBank号:3932,update date:2022-12-21)、LDLRAP1(GenBank号:26119,update date:2022-11-5)、LST1(GenBank号:7940,update date:2022-9-22)、LTB(GenBank号:4050,update date:2022-12-9)、MAFB(GenBank号:9935,update date:2022-12-8)、MRPL19(GenBank号:9801,update date:2022-12-8)、MRPS16(GenBank号:51021,update date:2022-12-21)、MTFR1(GenBank号:9650,update date:2022-12-17)、MTMR2(GenBank号:8898,update date:2022-12-8)、MZB1(GenBank号:51237,update date:2022-8-12)、NCF1(GenBank号:653361,update date:2022-12-8)、NCF4(GenBank号:4689,update date:2022-12-8)、NDUFS1(GenBank号:4719,update date:2022-12-8)、NKG7(GenBank号:4818,update date:2022-9-22)、NOL7(GenBank号:51406,update date:2022-12-8)、NOLC1(GenBank号:9221,update date:2022-12-4)、NUDT15(GenBank号:55270,update date:2022-11-27)、PILRA(GenBank号:29992,update date:2022-9-22)、PSMB10(GenBank号:5699,update date:2022-12-8)、PTPN7(GenBank号:5778,update date:2022-12-8)、PYCARD(GenBank号:29108,update date:2022-12-8)、RAC2(GenBank号:5880,updatedate:2022-12-8)、RRAS(GenBank号:6237,update date:2022-12-8)、SH3BGRL3(GenBank号:83442,update date:2022-12-4)、SIGLEC7(GenBank号:27036,update date:2022-8-18)、SLAMF8(GenBank号:56833,update date:2022-9-22)、SLC7A11(GenBank号:23657,update date:2022-12-13)、SNRPE(GenBank号:6635,update date:2022-12-8)、SRPK1(GenBank号:6732,update date:2022-12-8)、STARD5(GenBank号:80765,update date:2022-12-8)、TFB2M(GenBank号:64216,update date:2022-12-8)、THEMIS2(GenBank号:9473,update date:2022-12-8)、TNFRSF1B(GenBank号:7133,update date:2022-11-6)、TYROBP(GenBank号:7305,update date:2022-10-9)、UGDH(GenBank号:7358,update date:2022-12-4)和YWHAE(GenBank号:7531,update date:2022-12-8)。
N1)所述免疫分型模型构建模块可通过包括如下步骤的方法建立:
N1-1)基于已知肺腺癌样本集的75个基因的表达谱数据进行层级聚类获得所述已知肺腺癌样本的免疫分型结果;
N1-2)基于已知肺腺癌样本集的75个基因的表达谱数据和所述免疫分型结果,使用SVM算法获得预测单样本肺腺癌患者免疫亚型的免疫分型模型。
所述SVM算法可来源于python语言中机器学习包sklearn包。所述已知肺腺癌样本集中的样本数量可大于100个。
为了解决上述技术问题,本发明还提供了预测待测肺腺癌患者预后的计算机可读存储介质,所述计算机可读存储介质可使计算机运行如下步骤:
C1)基于已知肺腺癌样本集的75个基因的表达谱数据、层级聚类和SVM算法获得预测单样本肺腺癌患者免疫亚型的免疫分型模型;
C2)基于待测肺腺癌患者的75个基因的表达谱数据使用所述免疫分型模型预测待测肺腺癌患者的免疫分型亚型;
C3)基于所述免疫分型亚型预测待测肺腺癌患者的预后。
所述75个基因可为如下所示的基因:
ACKR1、AIF1、ALOX5、C1QB、CAPG、CCL5、CD14、CD2、CD247、CD37、CD3D、CD72、CD8A、CFD、CORO1A、CST7、CTSW、CYBA、DENND3、FCER1G、GMFG、GZMA、GZMB、HCK、IL21R、IL2RG、LCK、LDLRAP1、LST1、LTB、MAFB、MZB1、NCF1、NCF4、NKG7、PILRA、PSMB10、PTPN7、PYCARD、RAC2、RRAS、SH3BGRL3、SIGLEC7、SLAMF8、STARD5、THEMIS2、TNFRSF1B、TYROBP、BRIX1、BZW2、CABYR、CKS1B、CTBP2、DARS2、DDX1、ECT2、EEF1E1、EIF3J、EIF5B、HSPD1、HSPE1、MRPL19、MRPS16、MTFR1、MTMR2、NDUFS1、NOL7、NOLC1、NUDT15、SLC7A11、SNRPE、SRPK1、TFB2M、UGDH和YWHAE。
所述免疫分型可包括Immune High亚型和Immune Low亚型。所述Immune High亚型可为高免疫活性的免疫分型亚型;所述Immune Low亚型可为低免疫活性的免疫分型亚型。
所述免疫分型亚型为Immune High亚型的待测肺腺癌患者的预后可好于所述免疫分型亚型为Immune Low亚型的待测肺腺癌患者。
上述计算机可读存储介质中,所述肺腺癌患者可为早中期肺腺癌患者。所述预后可为5年以上的总生存率。
所述肺腺癌患者可为肺腺癌吸烟患者。所述肺腺癌吸烟患者可为I期、II期或者III期A肺腺癌患者。
C1)所述免疫分型模型构建可通过包括如下步骤的方法建立:
C1-1)基于已知肺腺癌样本集的75个基因的表达谱数据进行层级聚类获得所述已知肺腺癌样本的免疫分型结果;
C1-2)基于已知肺腺癌样本集的75个基因的表达谱数据和所述免疫分型结果,使用SVM算法获得预测单样本肺腺癌患者免疫亚型的免疫分型模型。
所述免疫分型可包括Immune High亚型和Immune Low亚型。所述Immune High亚型可为高免疫活性的免疫分型亚型;所述Immune Low亚型可为低免疫活性的免疫分型亚型。
所述免疫分型亚型为Immune High亚型的待测肺腺癌患者的预后可好于所述免疫分型亚型为Immune Low亚型的待测肺腺癌患者。
为了解决上述技术问题,本发明还提供了预测待测肺腺癌患者指导用药的计算机可读存储介质,所述计算机可读存储介质使计算机运行如下步骤:
D1)免疫分型模型构建模块:用于基于已知肺腺癌样本集的75个基因的表达谱数据、层级聚类和SVM算法获得预测单样本肺腺癌患者免疫亚型的免疫分型模型;
D2)免疫分型模块:用于基于待测肺腺癌患者的75个基因的表达谱数据使用所述免疫分型模型预测待测肺腺癌患者的免疫分型亚型;
D3)指导用药输出模块:用于基于所述免疫分型亚型确定待测肺腺癌患者是否受益于顺铂联合长春瑞宾进行化疗。
所述75个基因可为如下所示的基因:
ACKR1、AIF1、ALOX5、C1QB、CAPG、CCL5、CD14、CD2、CD247、CD37、CD3D、CD72、CD8A、CFD、CORO1A、CST7、CTSW、CYBA、DENND3、FCER1G、GMFG、GZMA、GZMB、HCK、IL21R、IL2RG、LCK、LDLRAP1、LST1、LTB、MAFB、MZB1、NCF1、NCF4、NKG7、PILRA、PSMB10、PTPN7、PYCARD、RAC2、RRAS、SH3BGRL3、SIGLEC7、SLAMF8、STARD5、THEMIS2、TNFRSF1B、TYROBP、BRIX1、BZW2、CABYR、CKS1B、CTBP2、DARS2、DDX1、ECT2、EEF1E1、EIF3J、EIF5B、HSPD1、HSPE1、MRPL19、MRPS16、MTFR1、MTMR2、NDUFS1、NOL7、NOLC1、NUDT15、SLC7A11、SNRPE、SRPK1、TFB2M、UGDH和YWHAE。
上述计算机可读存储介质中,所述免疫分型可包括Immune High亚型和ImmuneLow亚型。所述Immune High亚型可为高免疫活性的免疫分型亚型;所述Immune Low亚型可为低免疫活性的免疫分型亚型。
D3)中,所述免疫分型亚型为Immune Low亚型的待测肺腺癌患者的指导用药可为受益于使用顺铂联合长春瑞宾进行化疗;所述免疫分型亚型为Immune High亚型的待测肺腺癌患者的指导用药可为不受益于顺铂联合长春瑞宾进行化疗。
上文所述75个基因具体可为如下所示的基因:
ACKR1(GenBank号:2532,update date:2022-12-5)、AIF1(GenBank号:199,updatedate:2022-12-4)、ALOX5(GenBank号:240,update date:2022-12-8)、BRIX1(GenBank号:55299,update date:2022-12-4)、BZW2(GenBank号:28969,update date:2022-8-12)、C1QB(GenBank号:713,update date:2022-12-13)、CABYR(GenBank号:26256,update date:2022-8-12)、CAPG(GenBank号:822,update date:2022-12-8)、CCL5(GenBank号:6352,update date:2022-12-13)、CD14(GenBank号:929,update date:2022-12-8)、CD2(GenBank号:914,update date:2022-12-8)、CD247(GenBank号:919,update date:2022-12-21)、CD37(GenBank号:951,update date:2022-9-22)、CD3D(GenBank号:915,update date:2022-12-8)、CD72(GenBank号:971,update date:2022-11-13)、CD8A(GenBank号:925,update date:2022-12-14)、CFD(GenBank号:1675,update date:2022-12-8)、CKS1B(GenBank号:1163,update date:2022-12-8)、CORO1A(GenBank号:11151,update date:2022-11-6)、CST7(GenBank号:8530,update date:2022-8-5)、CTBP2(GenBank号:1488,update date:2022-12-4)、CTSW(GenBank号:1521,update date:2022-9-18)、CYBA(GenBank号:1535,update date:2022-12-13)、DARS2(GenBank号:55157,update date:2022-11-6)、DDX1(GenBank号:1653,update date:2022-12-8)、DENND3(GenBank号:22898,update date:2022-12-8)、ECT2(GenBank号:1894,update date:2022-12-13)、EEF1E1(GenBank号:9521,update date:2022-12-4)、EIF3J(GenBank号:8669,update date:2022-12-8)、EIF5B(GenBank号:9669,update date:2022-12-8)、FCER1G(GenBank号:2207,update date:2022-9-22)、GMFG(GenBank号:9535,update date:2022-12-8)、GZMA(GenBank号:3001,update date:2022-9-9)、GZMB(GenBank号:3002,update date:2022-12-13)、HCK(GenBank号:3055,update date:2022-12-8)、HSPD1(GenBank号:3329,updatedate:2022-12-8)、HSPE1(GenBank号:3336,update date:2022-12-4)、IL21R(GenBank号:50615,update date:2022-10-9)、IL2RG(GenBank号:3561,update date:2022-11-4)、LCK(GenBank号:3932,update date:2022-12-21)、LDLRAP1(GenBank号:26119,update date:2022-11-5)、LST1(GenBank号:7940,update date:2022-9-22)、LTB(GenBank号:4050,update date:2022-12-9)、MAFB(GenBank号:9935,update date:2022-12-8)、MRPL19(GenBank号:9801,update date:2022-12-8)、MRPS16(GenBank号:51021,update date:2022-12-21)、MTFR1(GenBank号:9650,update date:2022-12-17)、MTMR2(GenBank号:8898,update date:2022-12-8)、MZB1(GenBank号:51237,update date:2022-8-12)、NCF1(GenBank号:653361,update date:2022-12-8)、NCF4(GenBank号:4689,update date:2022-12-8)、NDUFS1(GenBank号:4719,update date:2022-12-8)、NKG7(GenBank号:4818,update date:2022-9-22)、NOL7(GenBank号:51406,update date:2022-12-8)、NOLC1(GenBank号:9221,update date:2022-12-4)、NUDT15(GenBank号:55270,update date:2022-11-27)、PILRA(GenBank号:29992,update date:2022-9-22)、PSMB10(GenBank号:5699,update date:2022-12-8)、PTPN7(GenBank号:5778,update date:2022-12-8)、PYCARD(GenBank号:29108,update date:2022-12-8)、RAC2(GenBank号:5880,updatedate:2022-12-8)、RRAS(GenBank号:6237,update date:2022-12-8)、SH3BGRL3(GenBank号:83442,update date:2022-12-4)、SIGLEC7(GenBank号:27036,update date:2022-8-18)、SLAMF8(GenBank号:56833,update date:2022-9-22)、SLC7A11(GenBank号:23657,update date:2022-12-13)、SNRPE(GenBank号:6635,update date:2022-12-8)、SRPK1(GenBank号:6732,update date:2022-12-8)、STARD5(GenBank号:80765,update date:2022-12-8)、TFB2M(GenBank号:64216,update date:2022-12-8)、THEMIS2(GenBank号:9473,update date:2022-12-8)、TNFRSF1B(GenBank号:7133,update date:2022-11-6)、TYROBP(GenBank号:7305,update date:2022-10-9)、UGDH(GenBank号:7358,update date:2022-12-4)和YWHAE(GenBank号:7531,update date:2022-12-8)。
D1)所述免疫分型模型构建可通过包括如下步骤的方法建立:
D1-1)基于已知肺腺癌样本集的75个基因的表达谱数据进行层级聚类获得所述已知肺腺癌样本的免疫分型结果;
D1-2)基于已知肺腺癌样本集的75个基因的表达谱数据和所述免疫分型结果,使用SVM算法获得预测单样本肺腺癌患者免疫亚型的免疫分型模型。
检测人基因组75个基因的表达谱的物质或装置在制备预测待测肺腺癌患者预后和/或指导用药的产品中的应用也属于本发明的保护范围。
所述75个基因可为如下所示的基因:
ACKR1、AIF1、ALOX5、C1QB、CAPG、CCL5、CD14、CD2、CD247、CD37、CD3D、CD72、CD8A、CFD、CORO1A、CST7、CTSW、CYBA、DENND3、FCER1G、GMFG、GZMA、GZMB、HCK、IL21R、IL2RG、LCK、LDLRAP1、LST1、LTB、MAFB、MZB1、NCF1、NCF4、NKG7、PILRA、PSMB10、PTPN7、PYCARD、RAC2、RRAS、SH3BGRL3、SIGLEC7、SLAMF8、STARD5、THEMIS2、TNFRSF1B、TYROBP、BRIX1、BZW2、CABYR、CKS1B、CTBP2、DARS2、DDX1、ECT2、EEF1E1、EIF3J、EIF5B、HSPD1、HSPE1、MRPL19、MRPS16、MTFR1、MTMR2、NDUFS1、NOL7、NOLC1、NUDT15、SLC7A11、SNRPE、SRPK1、TFB2M、UGDH和YWHAE。
所述75个基因具体可为如下所示的基因:
ACKR1(GenBank号:2532,update date:2022-12-5)、AIF1(GenBank号:199,updatedate:2022-12-4)、ALOX5(GenBank号:240,update date:2022-12-8)、BRIX1(GenBank号:55299,update date:2022-12-4)、BZW2(GenBank号:28969,update date:2022-8-12)、C1QB(GenBank号:713,update date:2022-12-13)、CABYR(GenBank号:26256,update date:2022-8-12)、CAPG(GenBank号:822,update date:2022-12-8)、CCL5(GenBank号:6352,update date:2022-12-13)、CD14(GenBank号:929,update date:2022-12-8)、CD2(GenBank号:914,update date:2022-12-8)、CD247(GenBank号:919,update date:2022-12-21)、CD37(GenBank号:951,update date:2022-9-22)、CD3D(GenBank号:915,update date:2022-12-8)、CD72(GenBank号:971,update date:2022-11-13)、CD8A(GenBank号:925,update date:2022-12-14)、CFD(GenBank号:1675,update date:2022-12-8)、CKS1B(GenBank号:1163,update date:2022-12-8)、CORO1A(GenBank号:11151,update date:2022-11-6)、CST7(GenBank号:8530,update date:2022-8-5)、CTBP2(GenBank号:1488,update date:2022-12-4)、CTSW(GenBank号:1521,update date:2022-9-18)、CYBA(GenBank号:1535,update date:2022-12-13)、DARS2(GenBank号:55157,update date:2022-11-6)、DDX1(GenBank号:1653,update date:2022-12-8)、DENND3(GenBank号:22898,update date:2022-12-8)、ECT2(GenBank号:1894,update date:2022-12-13)、EEF1E1(GenBank号:9521,update date:2022-12-4)、EIF3J(GenBank号:8669,update date:2022-12-8)、EIF5B(GenBank号:9669,update date:2022-12-8)、FCER1G(GenBank号:2207,update date:2022-9-22)、GMFG(GenBank号:9535,update date:2022-12-8)、GZMA(GenBank号:3001,update date:2022-9-9)、GZMB(GenBank号:3002,update date:2022-12-13)、HCK(GenBank号:3055,update date:2022-12-8)、HSPD1(GenBank号:3329,updatedate:2022-12-8)、HSPE1(GenBank号:3336,update date:2022-12-4)、IL21R(GenBank号:50615,update date:2022-10-9)、IL2RG(GenBank号:3561,update date:2022-11-4)、LCK(GenBank号:3932,update date:2022-12-21)、LDLRAP1(GenBank号:26119,update date:2022-11-5)、LST1(GenBank号:7940,update date:2022-9-22)、LTB(GenBank号:4050,update date:2022-12-9)、MAFB(GenBank号:9935,update date:2022-12-8)、MRPL19(GenBank号:9801,update date:2022-12-8)、MRPS16(GenBank号:51021,update date:2022-12-21)、MTFR1(GenBank号:9650,update date:2022-12-17)、MTMR2(GenBank号:8898,update date:2022-12-8)、MZB1(GenBank号:51237,update date:2022-8-12)、NCF1(GenBank号:653361,update date:2022-12-8)、NCF4(GenBank号:4689,update date:2022-12-8)、NDUFS1(GenBank号:4719,update date:2022-12-8)、NKG7(GenBank号:4818,update date:2022-9-22)、NOL7(GenBank号:51406,update date:2022-12-8)、NOLC1(GenBank号:9221,update date:2022-12-4)、NUDT15(GenBank号:55270,update date:2022-11-27)、PILRA(GenBank号:29992,update date:2022-9-22)、PSMB10(GenBank号:5699,update date:2022-12-8)、PTPN7(GenBank号:5778,update date:2022-12-8)、PYCARD(GenBank号:29108,update date:2022-12-8)、RAC2(GenBank号:5880,updatedate:2022-12-8)、RRAS(GenBank号:6237,update date:2022-12-8)、SH3BGRL3(GenBank号:83442,update date:2022-12-4)、SIGLEC7(GenBank号:27036,update date:2022-8-18)、SLAMF8(GenBank号:56833,update date:2022-9-22)、SLC7A11(GenBank号:23657,update date:2022-12-13)、SNRPE(GenBank号:6635,update date:2022-12-8)、SRPK1(GenBank号:6732,update date:2022-12-8)、STARD5(GenBank号:80765,update date:2022-12-8)、TFB2M(GenBank号:64216,update date:2022-12-8)、THEMIS2(GenBank号:9473,update date:2022-12-8)、TNFRSF1B(GenBank号:7133,update date:2022-11-6)、TYROBP(GenBank号:7305,update date:2022-10-9)、UGDH(GenBank号:7358,update date:2022-12-4)和YWHAE(GenBank号:7531,update date:2022-12-8)。
上文所述应用中,所述肺腺癌患者可为早中期肺腺癌患者。所述预后可为5年以上的总生存率。
所述肺腺癌患者可为肺腺癌吸烟患者。所述肺腺癌吸烟患者可为I期、II期或者III期A肺腺癌患者。
上文所述的装置或上文所述的计算机可读存储介质在开发和/或制备预防和/或治疗肺腺癌的产品中的应用也属于本发明的保护范围。
吸烟等环境因素是驱动肺癌起源的核心因素,为更好地提升具有吸烟史的早中期肺腺癌患者的精准治疗水平,对早中期肺腺癌患者进行有效的风险评估以及治疗应答预测,本发明提供了基于早中期肺腺癌患者免疫微环境基因群75个基因的表达谱建立的SVM单样本亚型预测模型对早中期肺腺癌患者进行免疫亚型分子分型可以预测患者的预后:所述免疫分型亚型为Immune High亚型的待测肺腺癌患者的预后可好于所述免疫分型亚型为Immune Low亚型的待测肺腺癌患者;同时基于免疫微环境基因群75个基因和SVM单样本亚型预测模型可指导患者的临床用药:所述免疫分型亚型为Immune Low亚型的待测肺腺癌患者的指导用药可为受益于使用顺铂联合长春瑞宾进行化疗;所述免疫分型亚型为ImmuneHigh亚型的待测肺腺癌患者的指导用药可为不受益于顺铂联合长春瑞宾进行化疗。使用本发明所提供的免疫微环境基因群75个基因及建立的SVM单样本亚型预测模型可以避免在肺腺癌患者中过渡使用化疗,一方面能使患者避免承受化疗带来的严重副作用,另一方面也将减轻患者和社会的经济负担。
附图说明
图1为TCGA数据集中SVM单样本亚型预测模型分型结果受试者工作特征曲线(receiver operating characteristic curve,简称ROC)图。纵坐标为真阳性率,横坐标为假阳性率。
图2为GSE81089数据集中SVM单样本亚型预测模型分型结果ROC图。纵坐标为真阳性率,横坐标为假阳性率。
图3为GSE68465数据集中SVM单样本亚型预测模型分型结果ROC图。纵坐标为真阳性率,横坐标为假阳性率。
图4为GSE14814数据集中SVM单样本亚型预测模型分型结果ROC图。纵坐标为真阳性率,横坐标为假阳性率。
图5为TCGA早中期肺腺癌(TCGA-LUAD)吸烟患者Immune High和Immune Low分子亚型的总体生存曲线。纵坐标为生存率,横坐标为总生存时间(年)。
图6为TCGA II期及IIIA期肺腺癌吸烟患者Immune High和Immune Low分子亚型的总体生存曲线。纵坐标为生存率,横坐标为总生存时间(年)。
图7为GSE81089中早中期肺腺癌吸烟患者Immune High 和Immune Low 分子亚型的总体生存曲线。纵坐标为生存率,横坐标为总生存时间(年)。
图8为GSE68465早中期肺腺癌吸烟患者中Immune High 和Immune Low 分子亚型的总体生存曲线。纵坐标为生存率,横坐标为总生存时间(年)。
图9为GSE68465 II期及IIIA期肺腺癌吸烟患者Immune High和Immune Low分子亚型的总体生存曲线。纵坐标为生存率,横坐标为总生存时间(年)。
图10为GSE14814肺腺癌患者Immune High和Immune Low分子亚型的总体生存曲线。纵坐标为生存率,横坐标为总生存时间(年)。
图11为GSE14814数据集中Immune High 和 Immune Low 亚型特异的化疗应答分析。t代表时间:治疗后1年或2-5年,作为生存率分析的landmark。A:化疗组(ACT)与 观察组(OBS)生存曲线;B:Immune High组化疗(ACT)病人与不进行化疗(OBS)病人的生存曲线。C:Immune Low组化疗(ACT)病人与不进行化疗(OBS)病人的生存曲线。
图12为利用不同数据集建立的单样本亚型预测模型—SVM预测模型及其准确度的验证。A为利用TCGA训练集建立的单样本亚型预测模型—SVM在TCGA数据集中验证的准确度;B为利用TCGA数据集建立的单样本亚型预测模型-SVM在GSE81089数据集中的准确度;C为利用GSE68465数据集建立的单样本亚型预测模型-SVM在GSE68465数据集中验证的准确度;D为利用GSE68465数据集建立的单样本亚型预测模型—SVM在GSE14814数据集中验证的准确度。
具体实施方式
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。
下述实施例中的实验方法,如无特殊说明,均为常规方法,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
实施例 1、早中期肺腺癌的分子诊断标志物的筛选及分子分型。
1.早中期肺腺癌分子诊断标志物的筛选。
本发明在前期人类胶质瘤转录组大数据研究中发现了250个与免疫相关的基因,利用TCGA公共数据库提供的人类肺腺癌RNA-seq平台表达量数据集(TCGA-LUAD)(portal.gdc.cancer.gov)以及GEO公共数据库数据集GSE14814(www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE14814),通过层级聚类差异表达分析,将这两个数据库中的早中期肺腺癌样本按照250个与免疫相关基因的表达谱自动分为高表达250基因的ImmuneHigh组(高免疫亚型组)和低表达250基因的Immune Low组(低免疫亚型组)。
在GSE14814数据集中进行Immune High和Immune Low两组样本数据的比较,在上述250基因中筛选出87个在两组样本中存在差异表达基因;同时筛选出48个于Immune Low组样本相比较于Immune high组样本高表达的基因。此阶段选出的肺腺癌免疫亚型分组(Immune High和Immune Low组)相关的基因共135个。利用135个基因对TCGA-LUAD 及GSE14814数据集重新分组,在分组后的样本中进行t检验,删除60个在Immune High组和Immune Low组之间表达差异较小的基因,得到如下75个基因用作为肺腺癌免疫亚型分类器基因。在此75个分类器基因中,48个基因仅在Immune High组中高表达,而另外的27个基因则仅在Immune Low组中高表达。
75个分类器基因的名称及对应的NCBI上的GenBank号信息如下:
ACKR1(GenBank号:2532,update date:2022-12-5)、AIF1(GenBank号:199,updatedate:2022-12-4)、ALOX5(GenBank号:240,update date:2022-12-8)、BRIX1(GenBank号:55299,update date:2022-12-4)、BZW2(GenBank号:28969,update date:2022-8-12)、C1QB(GenBank号:713,update date:2022-12-13)、CABYR(GenBank号:26256,update date:2022-8-12)、CAPG(GenBank号:822,update date:2022-12-8)、CCL5(GenBank号:6352,update date:2022-12-13)、CD14(GenBank号:929,update date:2022-12-8)、CD2(GenBank号:914,update date:2022-12-8)、CD247(GenBank号:919,update date:2022-12-21)、CD37(GenBank号:951,update date:2022-9-22)、CD3D(GenBank号:915,update date:2022-12-8)、CD72(GenBank号:971,update date:2022-11-13)、CD8A(GenBank号:925,update date:2022-12-14)、CFD(GenBank号:1675,update date:2022-12-8)、CKS1B(GenBank号:1163,update date:2022-12-8)、CORO1A(GenBank号:11151,update date:2022-11-6)、CST7(GenBank号:8530,update date:2022-8-5)、CTBP2(GenBank号:1488,update date:2022-12-4)、CTSW(GenBank号:1521,update date:2022-9-18)、CYBA(GenBank号:1535,update date:2022-12-13)、DARS2(GenBank号:55157,update date:2022-11-6)、DDX1(GenBank号:1653,update date:2022-12-8)、DENND3(GenBank号:22898,update date:2022-12-8)、ECT2(GenBank号:1894,update date:2022-12-13)、EEF1E1(GenBank号:9521,update date:2022-12-4)、EIF3J(GenBank号:8669,update date:2022-12-8)、EIF5B(GenBank号:9669,update date:2022-12-8)、FCER1G(GenBank号:2207,update date:2022-9-22)、GMFG(GenBank号:9535,update date:2022-12-8)、GZMA(GenBank号:3001,update date:2022-9-9)、GZMB(GenBank号:3002,update date:2022-12-13)、HCK(GenBank号:3055,update date:2022-12-8)、HSPD1(GenBank号:3329,updatedate:2022-12-8)、HSPE1(GenBank号:3336,update date:2022-12-4)、IL21R(GenBank号:50615,update date:2022-10-9)、IL2RG(GenBank号:3561,update date:2022-11-4)、LCK(GenBank号:3932,update date:2022-12-21)、LDLRAP1(GenBank号:26119,update date:2022-11-5)、LST1(GenBank号:7940,update date:2022-9-22)、LTB(GenBank号:4050,update date:2022-12-9)、MAFB(GenBank号:9935,update date:2022-12-8)、MRPL19(GenBank号:9801,update date:2022-12-8)、MRPS16(GenBank号:51021,update date:2022-12-21)、MTFR1(GenBank号:9650,update date:2022-12-17)、MTMR2(GenBank号:8898,update date:2022-12-8)、MZB1(GenBank号:51237,update date:2022-8-12)、NCF1(GenBank号:653361,update date:2022-12-8)、NCF4(GenBank号:4689,update date:2022-12-8)、NDUFS1(GenBank号:4719,update date:2022-12-8)、NKG7(GenBank号:4818,update date:2022-9-22)、NOL7(GenBank号:51406,update date:2022-12-8)、NOLC1(GenBank号:9221,update date:2022-12-4)、NUDT15(GenBank号:55270,update date:2022-11-27)、PILRA(GenBank号:29992,update date:2022-9-22)、PSMB10(GenBank号:5699,update date:2022-12-8)、PTPN7(GenBank号:5778,update date:2022-12-8)、PYCARD(GenBank号:29108,update date:2022-12-8)、RAC2(GenBank号:5880,updatedate:2022-12-8)、RRAS(GenBank号:6237,update date:2022-12-8)、SH3BGRL3(GenBank号:83442,update date:2022-12-4)、SIGLEC7(GenBank号:27036,update date:2022-8-18)、SLAMF8(GenBank号:56833,update date:2022-9-22)、SLC7A11(GenBank号:23657,update date:2022-12-13)、SNRPE(GenBank号:6635,update date:2022-12-8)、SRPK1(GenBank号:6732,update date:2022-12-8)、STARD5(GenBank号:80765,update date:2022-12-8)、TFB2M(GenBank号:64216,update date:2022-12-8)、THEMIS2(GenBank号:9473,update date:2022-12-8)、TNFRSF1B(GenBank号:7133,update date:2022-11-6)、TYROBP(GenBank号:7305,update date:2022-10-9)、UGDH(GenBank号:7358,update date:2022-12-4)和YWHAE(GenBank号:7531,update date:2022-12-8)。
2.使用75个分类器基因构建并验证早中期肺腺癌样本分子分型的模型。
2.1数据来源。
下载RNA-Seq平台的TCGA-LUAD数据集(portal.gdc.cancer.gov)和GSE81089数据集(www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE81089)以及来自Affymetrix芯片平台U133A的GSE68465数据集(www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE68465)和GSE14814数据集(www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE14814)进行早中期肺腺癌单样本免疫亚型预测模型的建立和预测。
2.2 模型建立和模型验证。
利用TCGA-LUAD数据集的469例I-III期的早中期肺腺癌样本中75个分类器基因的表达量数据,首先使用层级聚类的方式使用75个免疫亚型分类器基因把这469例早中期肺腺癌分为了 Immune High 和 Immune Low 两个免疫亚型。聚类参数:FC=1.2,p=1.46e-5,q=1.45e-5。但基于聚类的分类方法不能针对单独样本进行分子分型。为了实施个体化诊断,将 469 例样本按照 大约2:1的比例随机划分为训练集(312例)和验证集(157例)。其中训练集样本数据用于建立早中期肺腺癌单样本亚型预测模型,验证集样本数据用于个体化评估预测模型。取样采取了分层取样的方式,以保证训练集和测试集样本中 Immune High 和Immune Low 两个亚型分组中样本的比例与数据来源数据库中本身比例保持一致。
根据训练集中 312例样本的 75 个分类器基因的表达量数据(表达谱数据:其中48个分类器基因在Immune High样本中高表达但在Immune Low样本中低表达,而另外的27个分类器基因在Immune Low样本中高表达但在Immune High样本中低表达)和基于这些表达量数据使用层级聚类聚类算法将312 例样本分成的 Immune High 和 Immune Low 两个免疫亚型标签,使用python语言中机器学***台的单个早中期肺腺癌患者样本 Immune High 亚型和Immune Low 亚型的模型,该模型为单样本亚型预测模型,以下简称SVM预测模型。
并采用该模型对TCGA-LUAD数据集中的验证集样本及GSE81089数据集中样本的免疫亚型进行了预测验证。并绘制受试者工作特征曲线(receiver operatingcharacteristic curve,简称ROC曲线)验证模型分型的准确性。
代码如下:
数据标准化以及标准分型标签的确立:
在R(下载网址:https://cran.r-project.org/mirrors.html)以及R Studio(下载网址:https://posit.co/download/rstudio-desktop/)中运行:
setwd("SVM/TCGA-LUAD");
GSE81089<-read.csv("GSE81089.csv");
LUAD<-read.csv("New LUAD.csv")。
##读入归一化之后的所有变量的表达谱矩阵:
gene<-read.csv("gene.csv");
RNA_Seq<-merge(GSE81089,LUAD,by="ID");
data<-t(RNA_Seq);
data<-data.frame(data);
colnames(data)=data[1,];
data1=data[-1,];
data2=as.data.frame(lapply(data1,as.numeric));
out_pca<-prcomp(data2[,-9418]);
autoplot(out_pca,data=data2,colour='Lable',size=1,label=FALSE)。
##绘制PCA图,判断是否存在批次效应:
pheno<- data2;
row.names(RNA_Seq)<-RNA_Seq[,1];
RNA_Seq1<-RNA_Seq[,-1];
combat_edata<- ComBat(dat = RNA_Seq1, batch = pheno$Lable)。
##使用combat消除批次效应:
dat5=as.data.frame(t(combat_edata));
out_pca<-prcomp(dat5[,-9418]);
autoplot(out_pca,data=dat5,colour='Lable',size=1,label=FALSE);
dat4=as.data.frame(combat_edata);
write.csv(dat4,file = "RNA seq_batch.csv");
datt<-read.csv("RNA seq_batch.csv");
GENE<-read.csv("GENE_75.csv");
RNA_seq_75<-merge(datt,GENE,by="X.2");
write.csv(RNA_seq_75,file = "RNA seq_74batch.csv")。
##取得消除批次效应之后的75基因表达谱矩阵:
training_data=read.table("LUAD_batch.csv",sep = ",",header = T,row.names=1);
dim(training_data);
LUAD_USE<-apply(training_data, 2,scale)。
##数据标准化。
##python中运行SVM算法代码如下:
import pandas as pd;
import numpy as np;
import math;
import pandas as pd;
import matplotlib.pyplot as plt;
from sklearn import svm,datasets,preprocessing;
from sklearn.metrics import roc_curve,auc;
from sklearn.model_selection import train_test_split;
from sklearn.model_selection import cross_val_score;
from sklearn.model_selection import cross_val_score;
from sklearn.multiclass import OneVsRestClassifier。
##加载必须的模块:
DATA_LUAD=pd.read_csv(r"SVM\LUAD_73batch_ex.csv");
xunlian_y=pd.read_csv(r"SVM\TCGA-LUAD\LUAD-class-469-hc2.csv");
shujufenge1=np.array(xunlian_y);
xunlian_y=shujufenge1.transpose();
for e in range(len(xunlian_y));
xunlian_y[e]=int(xunlian_y[e]);
xunlian_y=xunlian_y.ravel();
xunlian_y=xunlian_y.transpose();
xunlian_y;
shuju=DATA_LUAD;
shujufenge=np.array(shuju);
shujufenge=shujufenge.transpose();
xunlian_x=shujufenge[:,:];
for i in range(len(xunlian_x)):
for j in range(len(xunlian_x[0])):
xunlian_x[i][j]=float(xunlian_x[i][j])。
#将数据矩阵化并且命名为xunlian_x,将标签矩阵化并命名为xunlian_y:
x_train, x_test, y_train, y_test = train_test_split(xunlian_x,xunlian_y, test_size=0.33, random_state=12)。
#将数据按照比例分割:
y_train=y_train.ravel();
from cProfile import label;
from colorsys import yiq_to_rgb;
from random import random;
from tkinter import Y;
import numpy as np;
import matplotlib.pyplot as plt;
from itertools import cycle;
import pandas as pd;
from sklearn import svm,datasets,preprocessing;
from sklearn.metrics import roc_curve,auc;
from sklearn.model_selection import train_test_split;
from sklearn.preprocessing import label_binarize;
from sklearn.multiclass import OneVsOneClassifier;
import os;
model=svm.SVC(kernel='linear',probability=True,class_weight='balanced',C=15);
model.fit(x_train,y_train.astype('int'))。
##建立模型:
predict_test=model.predict(test_x)。
##预测:
y_score = model.decision_function(test_x);
from sklearn.metrics import confusion_matrix;
import matplotlib.pyplot as plt。
#生成混淆矩阵:
import numpy as np;
cm=confusion_matrix(test_y,predict_test);
fpr,tpr,threshold=roc_curve(test_y.astype('float'),y_score);
roc_auc=auc(fpr,tpr);
plt.figure();
print(roc_auc);
lw=2;
plt.figure();
plt.plot(fpr,tpr,color='darkorange',lw=lw,label='ROC curve (area = %0.2f)'%roc_auc);
plt.plot([0, 1], [0, 1], color='navy', lw=lw, linestyle='--');
plt.xlim([-0.025, 1.025]);
plt.ylim([-0.025, 1.025]);
plt.legend(loc=4);
plt.xlabel('False Positive Rate');
plt.ylabel('True Positive Rate');
plt.title('TCGA-LUAD');
plt.legend(loc="lower right");
plt.savefig('LUAD.pdf');
plt.show()。
#绘制ROC曲线。
#使用步骤2.1所建立的早中期肺腺癌单样本亚型预测模型对同为RNA-seq平台的GSE81089数据集样本进行亚型预测的代码如下:
#DATA=pd.read_csv(r"SVM\GSE81089_73batch_ex.csv");
#test_y=pd.read_csv(r"SVM\GSE81089_class.csv");
shujufenge1=np.array(test_y);
test_y=shujufenge1.transpose();
for e in range(len(test_y)):
test_y[e]=int(test_y[e]);
test_y=test_y.ravel();
test_y=test_y.transpose();
test_y;
shuju=DATA;
shujufenge=np.array(shuju);
shujufenge=shujufenge.transpose();
test_x=shujufenge[:,:];
for i in range(len(test_x)):
for j in range(len(test_x[0])):
test_x[i][j]=float(test_x[i][j])。
model=svm.SVC(kernel='linear',probability=True,class_weight='balanced',C=15);
model.fit(x_train,y_train.astype('int'));
predict_test=model.predict(test_x);
y_score = model.decision_function(test_x)。
根据返回的ROC曲线以及混淆矩阵的准确度,不断迭代优化模型,最终得到了准确度超过90%的早中期肺腺癌单样本免疫亚型预测模型。该早中期肺腺癌单样本免疫亚型预测模型为上述SVM预测模型。
基于TCGA-LUAD数据集的验证集中的单个样本使用构建的模型进行免疫分型,与基于层级聚类建立的分型标准得到的TCGA-LUAD数据集中样本的免疫亚型相比,准确度见图12中A(均达到94%以上);ROC曲线见图1(AUC值为0.98)。
使用基于TCGA数据集建立的单样本亚型预测模型—SVM预测模型对同为RNA-seq平台的GSE81089数据集中早中期肺腺癌样本进行单样本免疫亚型预测,与基于层级聚类建立的分型标准得到的免疫亚型分型结果相比准确度见图12中B,受样本量的限制,GSE81089数据集容易受到噪音的影响,但使用单样本亚型预测模型基于75个分类器基因预测的免疫亚型仍然能够保持85%以上;ROC曲线见图2(AUC值为0.90)。
2.3 基于芯片数据集中建立并验证早中期肺腺癌单样本亚型预测模型。
为确定75个分类器基因在Affymetrix芯片数据中应用的可能性,在GEO肺腺癌数据库中使用步骤2.2中同样的方法,建立了基于U133A平台的SVM单样本亚型预测模型。
对于U133A芯片平台的数据集GSE68465和GSE14814,利用GSE68465数据集的439例I-III期的早中期肺腺癌样本中75个分类器基因的表达量数据,首先使用层级聚类的聚类方式把这439例早中期肺腺癌样本分为了 Immune High 和 Immune Low 两个亚型。聚类参数为:p=0.002,q=2.4e-4。为实施个体化分型预测,将439例样本按照约2:1 的比例随机划分为训练集(293例)样本和验证集(146例)样本,用于建立和评估验证使用75个分类器基因构建的个体化分型预测的分类器。取样采取了分层取样的方式,以保证训练集和验证集样本中 Immune High 和 Immune Low 两个亚型的样本比例与数据来源数据库中本身比例维持一致。
使用步骤2.2同样的方法,根据GSE68465数据集的训练集中293例样本的75个分类器基因的表达量数据和层级聚类算法分成的 Immune High 和 Immune Low 两个亚型标签分组,使用python语言中机器学***台的单个早中期肺腺癌样本患者 Immune High 亚型和Immune Low 亚型的模型;并采用该模型对GSE68465数据集中的验证集样本以及GSE14814数据集的样本进行了免疫亚型预测。同时绘制ROC曲线验证模型分型的准确性。
代码如下:
DATA_LUAD=pd.read_csv(r"SVM\GSE68465_batch_ex.csv");
xunlian_y=pd.read_csv(r"SVM\GSE68564-class2.csv");
shujufenge1=np.array(xunlian_y);
xunlian_y=shujufenge1.transpose();
for e in range(len(xunlian_y)):
xunlian_y[e]=int(xunlian_y[e])。
xunlian_y=xunlian_y.ravel();
xunlian_y=xunlian_y.transpose();
xunlian_y。
shuju=DATA_LUAD;
shujufenge=np.array(shuju);
shujufenge=shujufenge.transpose();
xunlian_x=shujufenge[:,:];
for i in range(len(xunlian_x)):
for j in range(len(xunlian_x[0])):
xunlian_x[i][j]=float(xunlian_x[i][j])。
#将数据矩阵化并且命名为xunlian_x,将标签矩阵化并命名为xunlian_y:
x_train, x_test, y_train, y_test = train_test_split(xunlian_x,xunlian_y, test_size=0.33, random_state=12)。
#将数据按照比例分割:
y_train=y_train.ravel();
model=svm.SVC(kernel='linear',probability=True,class_weight='balanced',C=0.01);
model.fit(x_train,y_train.astype('int'))。
##建立模型:
predict_test=model.predict(test_x)。
##预测:
y_score = model.decision_function(test_x);
from sklearn.metrics import confusion_matrix;
import matplotlib.pyplot as plt。
#生成混淆矩阵:
import numpy as np;
cm=confusion_matrix(test_y,predict_test);
fpr,tpr,threshold=roc_curve(test_y.astype('float'),y_score);
roc_auc=auc(fpr,tpr);
plt.figure();
print(roc_auc);
lw=2;
plt.figure();
plt.plot(fpr,tpr,color='darkorange',lw=lw,label='ROC curve (area = %0.2f)'%roc_auc);
plt.plot([0, 1], [0, 1], color='navy', lw=lw, linestyle='--');
plt.xlim([-0.025, 1.025]);
plt.ylim([-0.025, 1.025]);
plt.legend(loc=4)。
plt.xlabel('False Positive Rate');
plt.ylabel('True Positive Rate');
plt.title('TCGA-LUAD');
plt.legend(loc="lower right");
plt.savefig('LUAD.pdf');
plt.show()。
#绘制ROC曲线。
使用所建立的单样本亚型预测模型对同为U133A芯片平台的GSE14814数据集进行亚型预测代码如下:
#DATA=pd.read_csv(r"SVM\GSE14814batch_ex.csv");
#test_y=pd.read_csv(r"SVM\GSE14814_class.csv");
shujufenge1=np.array(test_y);
test_y=shujufenge1.transpose();
for e in range(len(test_y)):
test_y[e]=int(test_y[e])。
test_y=test_y.ravel();
test_y=test_y.transpose();
test_y;
shuju=DATA;
shujufenge=np.array(shuju);
shujufenge=shujufenge.transpose();
test_x=shujufenge[:,:];
for i in range(len(test_x)):
for j in range(len(test_x[0])):
test_x[i][j]=float(test_x[i][j])。
model=svm.SVC(kernel='linear,probability=True,class_weight='balanced',C=0.01);
model.fit(x_train,y_train.astype('int'));
predict_test=model.predict(test_x);
y_score = model.decision_function(test_x)。
基于GSE68465数据集的验证集中的单个样本使用构建的模型—SVM预测模型进行免疫分型,与基于层级聚类建立的分型标准得到的免疫亚型相比,模型对免疫亚型预测结果如图12中C所示(准确度均在95%以上);ROC曲线见图3(AUC值为0.99)。
GSE14814数据库含有71例早中期肺腺癌样本。使用基于GSE68465数据集中的验证集样本建立的单样本免疫亚型预测模型—SVM预测模型对GSE14814芯片数据集中的单样本进行免疫分型,与基于层级聚类建立的分型标准得到的免疫亚型相比,预测结果如图12中D所示(准确度均在89%以上);ROC曲线见图4(AUC值为0.98)。
实施例2、应用早中期肺腺癌的SVM单样本亚型预测模型预测吸烟肺腺癌患者预后存活率。
1.使用模型预测TCGA-LUAD数据集早中期肺腺癌吸烟患者的免疫亚型和预后。
根据TCGA-LUAD数据集469例早中期肺腺癌患者样本(治疗前检测)的 75个分类器基因的表达量数据,采用实施例 1中建立的早中期肺腺癌单样本SVM免疫分型模型,将该469例样本中的319例吸烟患者进行免疫亚型预测分类。预测得到141例早中期肺腺癌吸烟患者为Immune High亚型,178例早中期肺腺癌吸烟患者为Immune Low亚型。
2. 早中期肺腺癌吸烟患者的预后分析。
根据319例早中期肺腺癌吸烟患者的随访结果,进行5年生存期分析(Kaplan-Meier曲线及Log-rank检验)。生存曲线结果如图5所示,步骤1中免疫亚型分型为ImmuneHigh和 Immune Low的两组早中期肺腺癌亚型吸烟患者具有显著不同的预后:Immune High亚型(高免疫亚型)的5年总体生存率显著高于Immune Low 亚型(低免疫亚型)(log-rank检验,p=0.0005;风险比 0.4828)。并且如图6所示,即使同样是II期和IIIA期的病人(319例早中期肺腺癌吸烟患者中的173例),免疫亚型分型(Immune Signature)仍然能够将这群患者区分为预后较好的Immune High组(高免疫亚型组,62例)和预后较差的Immune Low组(低免疫亚型组,111例),Immune High亚型的5年总体生存率显著高于Immune Low 亚型(log-rank 检验,p=0.0454;风险比 0.5905)。
因此,实施例1中基于75 个Immune分类器基因群建立的SVM单样本免疫亚型预测模型可以预测待测早中期肺腺癌吸烟患者的预后,尤其是II期或者IIIA期患者。
3. 使用模型预测GSE81089 数据集早中期肺腺癌吸烟患者的免疫亚型和预后。
根据GSE81089数据集中103例早中期肺腺癌患者样本(治疗前检测)的75个Immune分类器基因的表达量数据,分别采用实施例1获得的肺腺癌SVM单样本亚型预测模型将该103例样本中的43例吸烟患者的免疫亚型分类。其中,得到22例 Immune High亚型早中期肺腺癌吸烟患者和21例Immune Low亚型早中期肺腺癌吸烟患者。
43例吸烟患者的最长随访时间为84个月,根据随访结果,进行生存期分析(Kaplan-Meier曲线及Log-rank检验),结果如图7所示,可以看到在GSE81089数据集中,Immune High 和 Immune Low 两个亚型早中期肺腺癌吸烟患者同样具有显著不同的预后:Immune High亚型(高免疫亚型)吸烟患者的7年总体生存率显著高于 Immune Low亚型(低免疫亚型)吸烟患者(log-rank 检验,p=0.042;风险比 0.3556)。
4. 使用模型预测GSE68465数据集早中期肺腺癌吸烟患者的免疫亚型和预后。
根据数据库GSE68465中439例早中期肺腺癌吸烟患者样本(治疗前检测)的75个Immune分类器基因的表达量数据,分别采用实施例1获得的早中期肺腺癌SVM单样本亚型预测模型将该439例样本分为 Immune High(234例)和 Immune Low 两个亚型(205例)。其中吸烟患者298例,145例为Immune High亚型,153例为Immune Low亚型。
298例吸烟患者的最长随访时间为60个月。根据随访结果,进行生存期分析(Kaplan-Meier曲线及Log-rank检验)。结果如图8所示,Immune High 和Immune Low 两个亚型同样具有显著不同的预后:Immune High 亚型(高免疫亚型)的5年总体生存率显著高于 Immune Low 亚型(低免疫亚型)(log-rank 检验,p=0.0007,风险比0.5447)。并且如图9所示,即使同样是II期和IIIA期的病人(298例吸烟患者中的219例),免疫亚型分型(ImmuneSignature)仍然能够将这群患者分为预后较好的Immune High组(100例)和预后较差的Immune Low组(119例),Immune High亚型(高免疫亚型)的5年总体生存率显著高于ImmuneLow 亚型(低免疫亚型)(log-rank 检验,p=0.0006;风险比 0.5053)。
因此,实施例1中建立的基于75 个Immune分类器基因群的SVM单样本亚型预测模型可以预测基于芯片平台的待测早中期肺腺癌吸烟患者的预后,尤其是II期或者III期A患者。
5. 使用模型预测GSE14814数据集早中期肺腺癌吸烟患者的免疫亚型和预后。
根据数据库GSE14814中验证集71例早中期肺腺癌吸烟患者样本(治疗前检测)的75个Immune分类器基因的表达量数据,采用实施例1获得的SVM单样本亚型预测模型将该71例样本分为 Immune High(35例)和 Immune Low 两个亚型(36例)。
71例患者的最长随访时间为120个月,根据随访结果,进行生存期分析(Kaplan-Meier曲线及Log-rank检验),结果如图10所示,在GSE14814数据集中,Immune High 和Immune Low 两个亚型同样具有显著不同的预后:Immune High 亚型(高免疫亚型)的5年总体生存率显著高于Immune Low 亚型(低免疫亚型)(log-rank 检验,p=0.0230;风险比0.3436)。
实施例 3、早中期肺腺癌的免疫微环境基因群及其分子分型在预测待测患者是否能够得益于顺铂联合长春瑞滨治疗中的应用。
GSE14814数据集早中期肺腺癌的表达量数据集源自一项前瞻性III期临床试验(JBR.10),附有病人的药物治疗方案。该试验把病人随机分到实验组(ACT, 顺铂联合长春瑞滨化疗,39例)和观察组(OBS,32例)。入组病人的转录组表达量数据均采集于治疗前。由于短时间内治疗效果难以体现,1年内生存期差异不显著,本发明使用Landmark分段分析的方法,如图11中A所示,在治疗后1年内(t≤1)ACT组和OBS组差异不显著:restricted meansurvival time (RMST)分析,p=0.6913。ACT组使用顺铂联合长春瑞滨化疗方案在治疗后的第2-5年(t>1)呈现显著的生存优势,与OBS组相比对,ACT组的生存率显著提升:RMST分析,p=0.014。
采用实施例1获得的基于免疫微环境基因群75个基因的表达谱建立的SVM单样本亚型预测模型预测该样本数据集中每个样本的免疫亚型,共获得Immune High和ImmuneLow两个亚型分组。然后分别在 Immune High(ACT组23例,OBS组12例)和 Immune Low(ACT组16例,OBS组20例)两个亚型中按药物治疗方案分组后进行生存期分析(Landmark分段分析及RMST分析)。
结果如图11所示,图11中B 为 Immune High组的Landmark分段及RMST分析,图11中C 为 Immune Low组的Landmark分段及RMST分析。可以观察到,与观察组(OBS组)相比,使用顺铂联合长春瑞宾的化疗组(ACT组)仅能延长Immune Low组中患者的生存期(图11中C),不能延长Immune High组中患者的生存期(图11中B)。具体体现在:Immune High组不论是治疗后1年内(t≤1)还是治疗后第2-5年(t>1),化疗(ACT组)与观察组(OBS组)相比均没有显示生存优势(图11中B,t≤1,p=0.5019;t>1,p=0.9456)。而Immune Low组内ACT方案在治疗后的第2-5年(t>1)呈现显著的生存优势,与OBS组相比对,ACT组的生存率提升:RMST分析,p=0.0011(图11中C,t≤1,p=0.4251;t>1,p=0.0011)。由此,仅Immune Low组的早中期肺腺癌能够得益于顺铂联合长春瑞滨的治疗,而Immune High 组的早中期肺腺癌则不能得益于顺铂联合长春瑞滨的治疗。
综上所述,本发明基于免疫微环境基因群75个基因的表达谱建立的SVM单样本亚型预测模型对早中期肺腺癌患者进行免疫亚型分子分型可以预测患者的预后;同时指导患者的临床用药,可以避免在 Immune High组病人中使用化疗,一方面能使患者避免承受化疗带来的严重副作用,另一方面也将减轻患者和社会的经济负担。
肿瘤样本中的免疫微环境是机体对肿瘤细胞所携带的各种基因组变异的综合反映。肿瘤细胞中的DNA层面的变异(即基因突变),有可能产生机体发育过程中从未遇见的蛋白质,进而被机体认作“neoantigen",激活机体对肿瘤的排斥性免疫反应。而肿瘤细胞携带的染色体不稳定性,将激活先天免疫的cGAS-STING信号通道,导致I型干扰素信号通道的激活有抑制肿瘤生长作用,但染色体不稳定性导致的NF-kB信号通道的激活,则诱导各种炎症因子的产生,建立感染样微环境,促进肿瘤的生存和演进。在前期原创发现基于细胞学起源的脑胶质瘤EM/PM分子分型(Sun et al. A glioma classification scheme based oncoexpression modules of EGFR and PDGFRA[J]. Proceedings of the NationalAcademy of Sciences of the United States of America, 2018, 2014年111卷9期:3538-43页.)的基础上,本发明反复探索,发现在多种肿瘤的转录组大数据中存在一群能代表其微环境中不同免疫细胞群的基因群。该基因群也能将IDH野生型胶质瘤区分为高表达或低表达免疫微环境基因群的分子亚型。但是,与低表达免疫微环境基因群的IDH野生型胶质瘤相比,高表达免疫微环境基因群的IDH野生型胶质瘤进展快,具有显著差的预后。与脑胶质瘤中免疫微环境分子分型的结果相反,本发明发现高表达免疫微环境基因群免疫亚型(Immune High组)的早中期肺腺癌预后好,但不能得益于化疗,而低表达免疫微环境基因群免疫亚型(Immune Low组)的早中期肺腺癌预后差,但能够得益于化疗。
以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、实验平台和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。
Claims (10)
1.预测待测肺腺癌患者预后的装置,其特征在于:所述装置包括如下模块:
M1)免疫分型模型构建模块:用于基于已知肺腺癌样本集的75个基因的表达谱数据、层级聚类和SVM算法获得预测单样本肺腺癌患者免疫亚型的免疫分型模型;
M2)免疫分型模块:用于基于待测肺腺癌患者的所述75个基因的表达谱数据使用所述免疫分型模型预测待测肺腺癌患者的免疫分型亚型;
M3)预后预测模块:用于基于所述免疫分型亚型预测待测肺腺癌患者的预后;所述75个基因为如下所示的基因:
ACKR1、AIF1、ALOX5、C1QB、CAPG、CCL5、CD14、CD2、CD247、CD37、CD3D、CD72、CD8A、CFD、CORO1A、CST7、CTSW、CYBA、DENND3、FCER1G、GMFG、GZMA、GZMB、HCK、IL21R、IL2RG、LCK、LDLRAP1、LST1、LTB、MAFB、MZB1、NCF1、NCF4、NKG7、PILRA、PSMB10、PTPN7、PYCARD、RAC2、RRAS、SH3BGRL3、SIGLEC7、SLAMF8、STARD5、THEMIS2、TNFRSF1B、TYROBP、BRIX1、BZW2、CABYR、CKS1B、CTBP2、DARS2、DDX1、ECT2、EEF1E1、EIF3J、EIF5B、HSPD1、HSPE1、MRPL19、MRPS16、MTFR1、MTMR2、NDUFS1、NOL7、NOLC1、NUDT15、SLC7A11、SNRPE、SRPK1、TFB2M、UGDH和YWHAE。
2.根据权利要求1所述的装置,其特征在于:所述肺腺癌患者为早中期肺腺癌患者。
3.根据权利要求1或2所述的装置,其特征在于:所述肺腺癌患者为肺腺癌吸烟患者。
4.预测待测肺腺癌患者指导用药的装置,其特征在于:所述装置包括如下模块:
N1)免疫分型模型构建模块:用于基于已知肺腺癌样本集的75个基因的表达谱数据、层级聚类和SVM算法获得预测单样本肺腺癌患者免疫亚型的免疫分型模型;
N2)免疫分型模块:用于基于待测肺腺癌患者的75个基因的表达谱数据使用所述免疫分型模型预测待测肺腺癌患者的免疫分型亚型;
N3)指导用药输出模块:用于基于所述免疫分型亚型确定待测肺腺癌患者是否受益于顺铂联合长春瑞宾进行化疗;
所述75个基因为如下所示的基因:
ACKR1、AIF1、ALOX5、C1QB、CAPG、CCL5、CD14、CD2、CD247、CD37、CD3D、CD72、CD8A、CFD、CORO1A、CST7、CTSW、CYBA、DENND3、FCER1G、GMFG、GZMA、GZMB、HCK、IL21R、IL2RG、LCK、LDLRAP1、LST1、LTB、MAFB、MZB1、NCF1、NCF4、NKG7、PILRA、PSMB10、PTPN7、PYCARD、RAC2、RRAS、SH3BGRL3、SIGLEC7、SLAMF8、STARD5、THEMIS2、TNFRSF1B、TYROBP、BRIX1、BZW2、CABYR、CKS1B、CTBP2、DARS2、DDX1、ECT2、EEF1E1、EIF3J、EIF5B、HSPD1、HSPE1、MRPL19、MRPS16、MTFR1、MTMR2、NDUFS1、NOL7、NOLC1、NUDT15、SLC7A11、SNRPE、SRPK1、TFB2M、UGDH和YWHAE。
5.预测待测肺腺癌患者预后的计算机可读存储介质,其特征在于:所述计算机可读存储介质使计算机运行如下步骤:
C1)基于已知肺腺癌样本集的75个基因的表达谱数据、层级聚类和SVM算法获得预测单样本肺腺癌患者免疫亚型的免疫分型模型;
C2)基于待测肺腺癌患者的75个基因的表达谱数据使用所述免疫分型模型预测待测肺腺癌患者的免疫分型亚型;
C3)基于所述免疫分型亚型预测待测肺腺癌患者的预后;
所述75个基因为如下所示的基因:
ACKR1、AIF1、ALOX5、C1QB、CAPG、CCL5、CD14、CD2、CD247、CD37、CD3D、CD72、CD8A、CFD、CORO1A、CST7、CTSW、CYBA、DENND3、FCER1G、GMFG、GZMA、GZMB、HCK、IL21R、IL2RG、LCK、LDLRAP1、LST1、LTB、MAFB、MZB1、NCF1、NCF4、NKG7、PILRA、PSMB10、PTPN7、PYCARD、RAC2、RRAS、SH3BGRL3、SIGLEC7、SLAMF8、STARD5、THEMIS2、TNFRSF1B、TYROBP、BRIX1、BZW2、CABYR、CKS1B、CTBP2、DARS2、DDX1、ECT2、EEF1E1、EIF3J、EIF5B、HSPD1、HSPE1、MRPL19、MRPS16、MTFR1、MTMR2、NDUFS1、NOL7、NOLC1、NUDT15、SLC7A11、SNRPE、SRPK1、TFB2M、UGDH和YWHAE。
6.根据权利要求5所述的计算机可读存储介质,其特征在于:所述肺腺癌患者为早中期肺腺癌患者;所述预后为5年以上的总生存率。
7.预测待测肺腺癌患者指导用药的计算机可读存储介质,其特征在于:所述计算机可读存储介质使计算机运行如下步骤:
D1)免疫分型模型构建模块:用于基于已知肺腺癌样本集的75个基因的表达谱数据、层级聚类和SVM算法获得预测单样本肺腺癌患者免疫亚型的免疫分型模型;
D2)免疫分型模块:用于基于待测肺腺癌患者的75个基因的表达谱数据使用所述免疫分型模型预测待测肺腺癌患者的免疫分型亚型;
D3)指导用药输出模块:用于基于所述免疫分型亚型确定待测肺腺癌患者是否受益于顺铂联合长春瑞宾进行化疗;
所述75个基因为如下所示的基因:
ACKR1、AIF1、ALOX5、C1QB、CAPG、CCL5、CD14、CD2、CD247、CD37、CD3D、CD72、CD8A、CFD、CORO1A、CST7、CTSW、CYBA、DENND3、FCER1G、GMFG、GZMA、GZMB、HCK、IL21R、IL2RG、LCK、LDLRAP1、LST1、LTB、MAFB、MZB1、NCF1、NCF4、NKG7、PILRA、PSMB10、PTPN7、PYCARD、RAC2、RRAS、SH3BGRL3、SIGLEC7、SLAMF8、STARD5、THEMIS2、TNFRSF1B、TYROBP、BRIX1、BZW2、CABYR、CKS1B、CTBP2、DARS2、DDX1、ECT2、EEF1E1、EIF3J、EIF5B、HSPD1、HSPE1、MRPL19、MRPS16、MTFR1、MTMR2、NDUFS1、NOL7、NOLC1、NUDT15、SLC7A11、SNRPE、SRPK1、TFB2M、UGDH和YWHAE。
8.检测人基因组75个基因的表达谱的物质或装置在制备预测待测肺腺癌患者预后和/或指导用药的产品中的应用;
所述75个基因为如下所示的基因:
ACKR1、AIF1、ALOX5、C1QB、CAPG、CCL5、CD14、CD2、CD247、CD37、CD3D、CD72、CD8A、CFD、CORO1A、CST7、CTSW、CYBA、DENND3、FCER1G、GMFG、GZMA、GZMB、HCK、IL21R、IL2RG、LCK、LDLRAP1、LST1、LTB、MAFB、MZB1、NCF1、NCF4、NKG7、PILRA、PSMB10、PTPN7、PYCARD、RAC2、RRAS、SH3BGRL3、SIGLEC7、SLAMF8、STARD5、THEMIS2、TNFRSF1B、TYROBP、BRIX1、BZW2、CABYR、CKS1B、CTBP2、DARS2、DDX1、ECT2、EEF1E1、EIF3J、EIF5B、HSPD1、HSPE1、MRPL19、MRPS16、MTFR1、MTMR2、NDUFS1、NOL7、NOLC1、NUDT15、SLC7A11、SNRPE、SRPK1、TFB2M、UGDH和YWHAE。
9.根据权利要求8所述的应用,其特征在于:所述肺腺癌患者为早中期肺腺癌患者;所述预后为5年以上的总生存率。
10.权利要求1-4中任一权利要求所述的装置或权利要求5-7中任一权利要求所述的计算机可读存储介质在开发和/或制备预防和/或治疗肺腺癌的产品中的应用。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310186412.8A CN115862876B (zh) | 2023-03-02 | 2023-03-02 | 基于免疫微环境基因群预测肺腺癌患者预后的装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310186412.8A CN115862876B (zh) | 2023-03-02 | 2023-03-02 | 基于免疫微环境基因群预测肺腺癌患者预后的装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115862876A true CN115862876A (zh) | 2023-03-28 |
CN115862876B CN115862876B (zh) | 2023-05-26 |
Family
ID=85659564
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310186412.8A Active CN115862876B (zh) | 2023-03-02 | 2023-03-02 | 基于免疫微环境基因群预测肺腺癌患者预后的装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115862876B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160102364A1 (en) * | 2013-05-28 | 2016-04-14 | Beijing Normal University | Neuroglioma Molecular Subtyping Gene Group and Use Thereof |
CN109790583A (zh) * | 2016-05-17 | 2019-05-21 | 基因中心治疗公司 | 对肺腺癌亚型分型的方法 |
CN109841281A (zh) * | 2017-11-29 | 2019-06-04 | 郑州大学第一附属医院 | 基于共表达相似性识别肺腺癌早期诊断标识及风险预测模型的构建方法 |
CN110499364A (zh) * | 2019-07-30 | 2019-11-26 | 北京凯昂医学诊断技术有限公司 | 一种用于检测扩展型遗传病全外显子的探针组及其试剂盒和应用 |
CN111183235A (zh) * | 2017-10-03 | 2020-05-19 | 基因序列有限公司 | 使用微rna基因表达来对黑素瘤进行诊断、分期和监测的方法 |
CN112233796A (zh) * | 2020-10-15 | 2021-01-15 | 杭州慕谷科技有限公司 | 一种在早期肝癌中免疫增强的分子亚型的研究方法 |
WO2022122994A1 (en) * | 2020-12-11 | 2022-06-16 | Fondazione Di Religione E Di Culto "Casa Sollievo Della Sofferenza" - Opera Di San Pio Da Pietrelcina | Prognostic method for aggressive lung adenocarcinomas |
CN115537467A (zh) * | 2022-10-17 | 2022-12-30 | 重庆大学附属肿瘤医院 | 基于深度神经网络的卵巢癌生存预后预测分子模型的建立方法及其应用 |
-
2023
- 2023-03-02 CN CN202310186412.8A patent/CN115862876B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160102364A1 (en) * | 2013-05-28 | 2016-04-14 | Beijing Normal University | Neuroglioma Molecular Subtyping Gene Group and Use Thereof |
CN109790583A (zh) * | 2016-05-17 | 2019-05-21 | 基因中心治疗公司 | 对肺腺癌亚型分型的方法 |
CN111183235A (zh) * | 2017-10-03 | 2020-05-19 | 基因序列有限公司 | 使用微rna基因表达来对黑素瘤进行诊断、分期和监测的方法 |
CN109841281A (zh) * | 2017-11-29 | 2019-06-04 | 郑州大学第一附属医院 | 基于共表达相似性识别肺腺癌早期诊断标识及风险预测模型的构建方法 |
CN110499364A (zh) * | 2019-07-30 | 2019-11-26 | 北京凯昂医学诊断技术有限公司 | 一种用于检测扩展型遗传病全外显子的探针组及其试剂盒和应用 |
CN112233796A (zh) * | 2020-10-15 | 2021-01-15 | 杭州慕谷科技有限公司 | 一种在早期肝癌中免疫增强的分子亚型的研究方法 |
WO2022122994A1 (en) * | 2020-12-11 | 2022-06-16 | Fondazione Di Religione E Di Culto "Casa Sollievo Della Sofferenza" - Opera Di San Pio Da Pietrelcina | Prognostic method for aggressive lung adenocarcinomas |
CN115537467A (zh) * | 2022-10-17 | 2022-12-30 | 重庆大学附属肿瘤医院 | 基于深度神经网络的卵巢癌生存预后预测分子模型的建立方法及其应用 |
Also Published As
Publication number | Publication date |
---|---|
CN115862876B (zh) | 2023-05-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6067686B2 (ja) | 癌の分子的診断検査 | |
CN109880910A (zh) | 一种肿瘤突变负荷的检测位点组合、检测方法、检测试剂盒及*** | |
CN111128299B (zh) | 一种结直肠癌预后显著相关ceRNA调控网络的构建方法 | |
CN101743327B (zh) | 黑色素瘤的预后预测 | |
JP2011523049A (ja) | 頭頚部癌の同定、モニタリングおよび治療のためのバイオマーカー | |
CN111933211B (zh) | 癌症精准化疗分型标志物筛选方法、化疗敏感性的分子分型方法和应用 | |
Simon | Genomic clinical trials and predictive medicine | |
CN111128385B (zh) | 一种用于食管鳞癌的预后预警***及其应用 | |
CN111676288B (zh) | 用于预测肺腺癌患者预后的***及其应用 | |
Bi et al. | Identification and validation of tumor environment phenotypes in lung adenocarcinoma by integrative genome-scale analysis | |
CN115497562B (zh) | 一种基于铜死亡相关基因的胰腺癌预后预测模型构建方法 | |
CN112831562A (zh) | 一种用于预测肝癌患者切除术后复发风险的生物标志物组合、试剂盒 | |
CN115410713A (zh) | 一种基于免疫相关基因的肝细胞癌预后风险预测模型构建 | |
US20150294062A1 (en) | Method for Identifying a Target Molecular Profile Associated with a Target Cell Population | |
CN114203256B (zh) | 基于微生物丰度的mibc分型及预后预测模型构建方法 | |
CN109929934B (zh) | 免疫相关基因在结直肠癌预后的试剂盒和***中的应用 | |
CN116200490A (zh) | 一种检测实体瘤微小残留病灶的方法 | |
CN111690747A (zh) | 一种与早中期结肠癌相关的联合标记物、检测试剂盒以及检测*** | |
US20190112729A1 (en) | Novel set of biomarkers useful for predicting lung cancer survival | |
CN115862876B (zh) | 基于免疫微环境基因群预测肺腺癌患者预后的装置 | |
CN116072258A (zh) | 膀胱癌肿瘤抗原的开发及预测膀胱癌患者指导用药和预后的装置 | |
CN106119406B (zh) | 多发性肉芽肿血管炎及微小动脉炎的基因分型诊断试剂盒及使用方法 | |
WO2019206217A1 (zh) | 多发性骨髓瘤分子分型及应用 | |
CN112037851A (zh) | 自噬相关基因在结直肠癌预后的试剂盒和***中的应用 | |
CN117476097B (zh) | 一种基于三级***构特征基因的结直肠癌预后和治疗反应预测模型及其构建方法和应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20240611 Address after: Room 01-23565, 2nd Floor, No. 99 Shuixian West Road, Tongzhou District, Beijing, 101100 Patentee after: Beijing Tongcheng Rongxin Technology Co.,Ltd. Country or region after: China Address before: 100875, 19, Xinjie street, Haidian District, Beijing Patentee before: BEIJING NORMAL University Country or region before: China |