CN110534156A - 一种提取免疫治疗新抗原的方法及*** - Google Patents

一种提取免疫治疗新抗原的方法及*** Download PDF

Info

Publication number
CN110534156A
CN110534156A CN201910823630.1A CN201910823630A CN110534156A CN 110534156 A CN110534156 A CN 110534156A CN 201910823630 A CN201910823630 A CN 201910823630A CN 110534156 A CN110534156 A CN 110534156A
Authority
CN
China
Prior art keywords
sample
tumor tissues
specific
neoantigen
tumour
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910823630.1A
Other languages
English (en)
Other versions
CN110534156B (zh
Inventor
万季
宋麒
潘有东
夏迪
刘鹏
汪健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Neocura Biotechnology Corp
Original Assignee
Shenzhen Neocura Biotechnology Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Neocura Biotechnology Corp filed Critical Shenzhen Neocura Biotechnology Corp
Priority to CN201910823630.1A priority Critical patent/CN110534156B/zh
Publication of CN110534156A publication Critical patent/CN110534156A/zh
Priority to US16/991,042 priority patent/US20210061870A1/en
Application granted granted Critical
Publication of CN110534156B publication Critical patent/CN110534156B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4748Tumour specific antigens; Tumour rejection antigen precursors [TRAP], e.g. MAGE
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/0005Vertebrate antigens
    • A61K39/0011Cancer antigens
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1072Differential gene expression library synthesis, e.g. subtracted libraries, differential screening
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/10Libraries containing peptides or polypeptides, or derivatives thereof
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/70Multivalent vaccine

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Microbiology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Oncology (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Mycology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Crystallography & Structural Chemistry (AREA)

Abstract

本发明公开了一种提取免疫治疗新抗原的方法及***,其中方法包括:步骤S1:获取样本肿瘤组织与样本正常组织的常规蛋白质组;步骤S2:获取样本肿瘤组织与样本正常组织的碱基单体单元序列库以及样本肿瘤组织的特异蛋白质组;步骤S3:基于样本肿瘤组织的常规蛋白质组、样本肿瘤组织的特异蛋白质组和人类白细胞抗原HLA分子分型,获得若干候选的肿瘤特异性新抗原;步骤S4:基于所获取的若干候选的肿瘤特异性新抗原,分别计算其在样本肿瘤组织常规蛋白质组、样本正常组织常规蛋白质组、样本肿瘤组织碱基单体单元序列库与样本正常组织碱基单体单元序列库中的存在情况,并与基因表达变化倍数作为过滤规则,获得肿瘤特异性新抗原。从来源上讲,通过本发明的方案发现的肿瘤特异新抗原部分来自基因组非编码区,而不局限于编码区,因此可以发现更多的新抗原。

Description

一种提取免疫治疗新抗原的方法及***
技术领域
本发明涉及肿瘤免疫治疗技术领域,特别涉及一种提取免疫治疗新抗原的方法及***。
背景技术
目前,恶性肿瘤是对人类危害最严重的疾病之一。针对恶性肿瘤的治疗方法在过去几十年中得到了不断地丰富和发展。目前常规的恶性肿瘤治疗方法包括手术、放疗、化疗及靶向治疗,然而以上治疗手段都有一定的局限性并且容易受到毒副作用和肿瘤复发的影响。
近年来,基于激活免疫***从而抑制和杀伤肿瘤细胞的免疫治疗方法成为了恶性肿瘤领域新的热点。主要的免疫治疗方法根据其作用机理可以分为三类:
(1).通过抑制免疫***的抑制信号从而激活免疫***的免疫检查点抑制剂,
(2).通过修饰T淋巴细胞使其识别特定抗原的过继性细胞免疫治疗,
(3).通过预测肿瘤特异抗原,并根据所预测特异抗原制备疫苗或体外刺激T细胞以回输体内的基于新抗原的免疫治疗方法。
与免疫检查点抑制剂和过继性细胞免疫治疗相比,基于新抗原的免疫治疗方法具有作用范围广和毒副作用小等特点。目前新抗原的预测包括分析肿瘤及正常组织的全外显子组测序和转录组测序数据,鉴定蛋白质编码区的DNA突变及人类白细胞抗原亚型,利用生物信息方法获得由突变DNA所翻译的突变多肽,并最终预测突变多肽是否能被人类白细胞抗原被提呈到细胞表面。尽管由以上方法预测的新抗原在肿瘤突变负荷较大的肿瘤中(比如黑色素瘤)展现了良好的临床效果。然而对于肿瘤突变负荷较小的恶性肿瘤,则可能因为被预测出的新抗原数目较少而限制肿瘤新抗原疫苗配方的选择。因此扩大现有新抗原预测的筛选范围对于新抗原的临床应用便具有重要的意义。
发明内容
针对存在的上述问题,综合考虑了被注释为非蛋白质编码区域的肿瘤特异RNA产生突变多肽类的可能性,本发明提供了一种提取免疫治疗新抗原的方法。
本发明提供的一种提取免疫治疗新抗原的方法,包括:
步骤S1:获取样本肿瘤组织与样本正常组织的常规蛋白质组;
步骤S2:获取样本肿瘤组织与样本正常组织的碱基单体单元序列库以及样本肿瘤组织的特异蛋白质组;
步骤S3:基于所述样本肿瘤组织的常规蛋白质组、样本肿瘤组织的特异蛋白质组和人类白细胞抗原HLA分子分型,获得若干候选的肿瘤特异性新抗原;
步骤S4:基于所获取的若干候选的肿瘤特异性新抗原,分别计算若干所述候选的肿瘤特异性新抗原的特征值,利用预设的规则过滤,获得肿瘤特异性新抗原。
可选的,S1获取样本肿瘤组织与样本正常组织的常规蛋白质组包括:
步骤S11:检测样本肿瘤组织与样本正常组织转录本单碱基变异;
步骤S12:计算样本肿瘤组织与样本正常组织中转录本的表达水平;
步骤S13:构建样本肿瘤组织与样本正常组织突变外显子组;
步骤S14:翻译样本肿瘤组织与样本正常组织突变外显子组。
可选的,S2获取样本肿瘤组织与样本正常组织的碱基单体单元序列库以及样本肿瘤组织的特异蛋白质组包括:
步骤S21:生成预设长度的碱基单体单元序列库;
步骤S22:获得肿瘤特异碱基单体单元序列;
步骤S23:组装肿瘤特异碱基单体单元序列;
步骤S24:阅读框翻译肿瘤特异性序列。
可选的,S3基于所述样本肿瘤组织的常规蛋白质组、样本肿瘤组织的特异蛋白质组和人类白细胞抗原HLA分子分型,获得候选的肿瘤特异性新抗原包括:
步骤S31:获取人类白细胞抗原HLA分子分型;
步骤S32:基于所确定的样本肿瘤组织常规蛋白质组和样本肿瘤组织特异蛋白质组,产生全局肿瘤蛋白质组;
步骤S33:利用获得的全局肿瘤蛋白质组以及人类白细胞抗原(HLA)分子分型结果对全局肿瘤蛋白质组进行亲和力预测,获得目标肽段序列;
步骤S34:注释目标肽段序列特征,获取候选的肿瘤特异性新抗原。
本发明还提供一种提取免疫治疗新抗原的***,包括:
常规蛋白质组获取单元,用于获取样本肿瘤组织与样本正常组织的常规蛋白质组;
特异蛋白质组获取单元,用于获取样本肿瘤组织与样本正常组织的碱基单体单元序列库以及样本肿瘤组织的特异蛋白质组;
候选新抗原确定单元,基于所述样本肿瘤组织的常规蛋白质组、样本肿瘤组织的特异蛋白质组和人类白细胞抗原HLA分子分型,获得若干候选的肿瘤特异性新抗原;
肿瘤特异性新抗原确定单元,基于所获取的若干所述候选的肿瘤特异性新抗原,分别计算所述候选的肿瘤特异性新抗原的特征值,利用预设的规则过滤,获得肿瘤特异性新抗原。
可选的,常规蛋白质组获取单元包括:
检测子单元,用于检测样本肿瘤组织与样本正常组织转录本单碱基变异;
计算子单元,用于计算样本肿瘤组织与样本正常组织中转录本的表达水平;
构建子单元,用于构建样本肿瘤组织与样本正常组织突变外显子组;
翻译子单元,用于翻译样本肿瘤组织与样本正常组织突变外显子组。
可选的,特异蛋白质组获取单元包括:
生成子单元,用于生成预设长度的碱基单体单元序列库;;
获得子单元,用于获得肿瘤特异碱基单体单元序列;
组装子单元,用于组装肿瘤特异碱基单体单元序列;
阅读框翻译子单元,用于阅读框翻译肿瘤特异性序列。
可选的,候选新抗原确定单元包括:
人类白细胞抗原获取子单元,用于获取人类白细胞抗原HLA分子分型;
全局肿瘤蛋白质组产生子单元,用于基于所确定的样本肿瘤组织常规蛋白质组和样本肿瘤组织特异蛋白质组,产生全局肿瘤蛋白质组;
目标肽段序列获得子单元,利用获得的全局肿瘤蛋白质组以及人类白细胞抗原(HLA)分子分型结果对全局肿瘤蛋白质组进行亲和力预测,获得目标肽段序列;
候选的肿瘤特异性新抗原获取子单元,注释目标肽段序列特征,获取候选的肿瘤特异性新抗原。
与现有技术相比,本发明的方案具有如下优势:
一、从来源上讲,通过本发明的方案发现的肿瘤特异新抗原部分来自基因组非编码区,而不局限于编码区,因此可以发现更多的新抗原。当前常用的方法主要采用靶向区域捕获测序或外显子组测序处理流程,识别体细胞变异后通过亲和力预测得到新抗原;这实质上是将分析区域局限在了基因组上的编码区。
二、本发明获得的肿瘤特异新抗原大部分来自于非突变的高表达转录本(如内源性逆转录),因此在不同肿瘤类型中有一定的通用性。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例中一种提取免疫治疗新抗原的方法的示意图;
图2为本发明实施例中获取样本肿瘤组织与样本正常组织的常规蛋白质组的示意图;
图3为本发明实施例中获取样本肿瘤组织与样本正常组织的碱基单体单元序列库以及样本肿瘤组织的特异蛋白质组的示意图;
图4为本发明实施例中获得候选的肿瘤特异性新抗原的示意图;
图5为本发明实施例中一种提取免疫治疗新抗原的***的示意图。
图中:
41、常规蛋白质组获取单元;42、特异蛋白质组获取单元;43、候选新抗原确定单元;44、肿瘤特异性新抗原确定单元。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
本发明实施例中提供一种提取免疫治疗新抗原的方法的示意图。如图1所示,包括:
步骤S1:获取样本肿瘤组织与样本正常组织的常规蛋白质组;
步骤S2:获取样本肿瘤组织与样本正常组织的碱基单体单元序列库以及样本肿瘤组织的特异蛋白质组;
步骤S3:基于所述样本肿瘤组织的常规蛋白质组、样本肿瘤组织的特异蛋白质组和人类白细胞抗原HLA分子分型,获得若干候选的肿瘤特异性新抗原;
步骤S4:基于所获取的若干候选的肿瘤特异性新抗原,分别计算若干所述候选的肿瘤特异性新抗原的特征值,利用预设的规则过滤,并与基因表达变化倍数作为过滤规则,获得肿瘤特异性新抗原。
上述技术方案的工作原理和有益效果为:
基于所述样本肿瘤组织的常规蛋白质组、样本肿瘤组织的特异蛋白质组和人类白细胞抗原HLA分子分型,获得候选的肿瘤特异性新抗原;然后基于所获取的候选的肿瘤特异性新抗原,分别计算若干所述候选的肿瘤特异性新抗原的特征值,特征值为候选的肿瘤特异性新抗原在样本肿瘤组织常规蛋白质组、样本正常组织常规蛋白质组、样本肿瘤组织碱基单体单元序列库与样本正常组织碱基单体单元序列库中的存在情况,若存在记为1,不存在记为0。将这四个特征值组合成特征向量进行判断,并以基因表达变化倍数(20倍)作为过滤规则,获得肿瘤特异性新抗原。从而实现发现基因非编码区的肿瘤特异性新抗原。
从来源上讲,通过本发明的方案发现的肿瘤特异新抗原部分来自基因组非编码区,而不局限于编码区,因此可以发现更多的新抗原。当前常用的方法主要采用靶向区域捕获测序或外显子组测序处理流程,识别体细胞变异后通过亲和力预测得到新抗原;这实质上是将分析区域局限在了基因组上的编码区。
获得的肿瘤特异新抗原大部分来自于非突变的高表达转录本(如内源性逆转录),因此在不同肿瘤类型中有一定的通用性。
在一个实施例中,S1获取样本肿瘤组织与样本正常组织的常规蛋白质组包括:
步骤S11:检测样本肿瘤组织与样本正常组织转录本单碱基变异;
首先,二代高通量测序原始数据过滤对后续分析至关重要,去除一些无用的序列可以提高后续分析的准确率和效率。具体地,利用测序数据过滤软件trimmomatic对原始数据进行过滤。
接下来,利用序列比对软件star将过滤后的数据回帖到参考基因组,然后利用变异识别程序freebayes进行突变识别。
步骤S12:计算样本肿瘤组织与样本正常组织中转录本的表达水平;
具体地,利用序列定量软件kallisto对每一个转录本进行表达定量。
步骤S13:构建样本肿瘤组织与样本正常组织突变外显子组;
具体的,将突变检测的结果中变异质量大于20的变异使用程序包pygeno分别构建样本肿瘤组织与样本正常组织突变外显子组。
步骤S14:翻译样本肿瘤组织与样本正常组织突变外显子组。
首先,根据转录本的表达量分析的结果选取表达量大于0的转录本并利用构建的样本肿瘤组织与样本正常组织突变外显子组,翻译得到样本肿瘤组织与样本正常组织的蛋白序列。
接下来,为了使结果能在获取样本肿瘤组织特异蛋白质组分析流程中使用,需要重新格式化翻译结果。
在一个实施例中,S2获取样本肿瘤组织与样本正常组织的碱基单体单元序列库以及样本肿瘤组织的特异蛋白质组包括:
步骤S21:生成预设长度的碱基单体单元序列库;
根据分析样本测序数据,利用软件jellyfish获取长度为I型表位多肽理论长度范围(8-12个氨基酸)3倍的样本肿瘤组织与样本正常组织的碱基单体单元序列库,这里需要注意的碱基单体单元长度的选取。
步骤S22:获得肿瘤特异碱基单体单元序列;
根据碱基单体单元序列在样本正常组织与样本肿瘤组织中的出现情况,选择在样本肿瘤组织中特有的碱基单体单元序列。
步骤S23:组装肿瘤特异碱基单体单元序列;
利用短序列组装软件Nektar assembly对肿瘤特异碱基单体单元进行组装,获得肿瘤特异性序列。
步骤S24:阅读框翻译肿瘤特异性序列。
对上述得到的肿瘤特异性序列进行阅读框翻译,获取肿瘤特异性氨基酸序列,本发明选取长度大于8的氨基酸序列。
在一个实施例中,S3基于所述样本肿瘤组织的常规蛋白质组、样本肿瘤组织的特异蛋白质组和人类白细胞抗原HLA分子分型,获得候选的肿瘤特异性新抗原包括:
步骤S31:获取人类白细胞抗原HLA分子分型;
利用白细胞抗原分子分型软件计算人类白细胞抗原分子分型。
步骤S32:基于所确定的样本肿瘤组织常规蛋白质组和样本肿瘤组织特异蛋白质组,产生全局肿瘤蛋白质组;
合并样本肿瘤组织常规蛋白质组与样本肿瘤组织特异蛋白质组,由此产生的数据称为全局肿瘤蛋白质组。
步骤S33:利用获得的全局肿瘤蛋白质组以及人类白细胞抗原(HLA)分子分型结果对全局肿瘤蛋白质组进行亲和力预测,获得目标肽段序列;
利用软件NetMHC-4.0以及人类白细胞抗原(HLA)分子分型结果对全局肿瘤蛋白质组进行亲和力预测,获得目标肽段序列。
步骤S34:注释目标肽段序列特征,获取候选的肿瘤特异性新抗原。将目标肽段注释为获选的肿瘤特异性新抗原的特征。
本发明中,分别计算若干所述候选的肿瘤特异性新抗原的特征值,利用预设的规则过滤,获得肿瘤特异性新抗原具体如下:
为了获取候选肿瘤特异新抗原,分别在样本肿瘤组织常规蛋白质组、样本正常组织常规蛋白质组、样本肿瘤组织碱基单体单元库与样本正常组织碱基单体单元库中查询每个肽段编码序列,若在数据库中存在记为1,不存在记为0。将这四个特征值组合成特征向量进行判断。本发明中,无论其编码序列检测状态如何,都排除在样本正常组织常规蛋白质组中检测到的肽段,因为它们可能是致耐受性的,即特征向量为[*,1,*,*](*为0或是1)的全部排除。真正具有肿瘤特异性的肽段,其应该未在样本正常组织中检测到,换句话说,既未在样本正常组织常规蛋白质组中检测到,也未在样本正常组织碱基单体单元库中检测到,即对应的特征向量为[1,0,1,0]、[0,0,1,0],具有这种肽段的候选肿瘤特异新抗原也可被标记为肿瘤特异新抗原。在样本正常组织常规蛋白质组中没检测到的肽段,在其他数据库中检测到,即对应的特征向量为[1,0,1,1],具有这种肽段的候选肿瘤特异新抗原也可被标记为肿瘤特异新抗原。在样本正常组织常规蛋白质组与样本肿瘤组织常规蛋白质组中均不存在的肽段,但是存在于样本正常组织碱基单体单元库与样本肿瘤组织碱基单体单元库中,对应的特征向量为[0,0,1,1],需要其RNA编码序列在肿瘤细胞中比在正常细胞中表达至少高20倍才能被标记。最后,对应于衍生自不同蛋白质的RNA序列的肽段编码序列是一致的,也可被标记为肿瘤特异性抗原候选物。
本发明还提供一种提取免疫治疗新抗原的***,包括:
常规蛋白质组获取单元41,用于获取样本肿瘤组织与样本正常组织的常规蛋白质组;
特异蛋白质组获取单元42,用于获取样本肿瘤组织与样本正常组织的碱基单体单元序列库以及样本肿瘤组织的特异蛋白质组;
候选新抗原确定单元43,基于所述样本肿瘤组织的常规蛋白质组、样本肿瘤组织的特异蛋白质组和人类白细胞抗原HLA分子分型,获得若干候选的肿瘤特异性新抗原;
肿瘤特异性新抗原确定单元44,基于所获取的若干所述候选的肿瘤特异性新抗原,分别计算所述候选的肿瘤特异性新抗原的特征值,利用预设的规则过滤,获得肿瘤特异性新抗原。从而实现发现基因非编码区的肿瘤特异性新抗原。
上述技术方案的工作原理和有益效果为:首先,常规蛋白质组获取样本肿瘤组织与样本正常组织的常规蛋白质组、特异蛋白质组获取单元获取样本肿瘤组织与样本正常组织的碱基单体单元序列库以及样本肿瘤组织的特异蛋白质组;然后候选新抗原肽段确定单元基于所述样本肿瘤组织的常规蛋白质组、样本肿瘤组织的特异蛋白质组和人类白细胞抗原HLA分子分型,获得候选的肿瘤特异性新抗原;最后,基于所获取的候选的肿瘤特异性新抗原,分别计算若干所述候选的肿瘤特异性新抗原的特征值,特征值为候选的肿瘤特异性新抗原在样本肿瘤组织常规蛋白质组、样本正常组织常规蛋白质组、样本肿瘤组织碱基单体单元序列库与样本正常组织碱基单体单元序列库中的存在情况,若存在记为1,不存在记为0。将这四个特征值组合成特征向量进行判断,并与基因表达变化倍数作为过滤规则,获得肿瘤特异性新抗原。从来源上讲,通过本发明的方案发现的肿瘤特异新抗原部分来自基因组非编码区,而不局限于编码区,因此可以发现更多的新抗原。当前常用的方法主要采用靶向区域捕获测序或外显子组测序处理流程,识别体细胞变异后通过亲和力预测得到新抗原;这实质上是将分析区域局限在了基因组上的编码区。
获得的肿瘤特异新抗原大部分来自于非突变的高表达转录本(如内源性逆转录),因此在不同肿瘤类型中有一定的通用性。
在一个实施例中,常规蛋白质组获取单元包括:
检测子单元,用于检测样本肿瘤组织与样本正常组织转录本单碱基变异;
首先,二代高通量测序原始数据过滤对后续分析至关重要,去除一些无用的序列可以提高后续分析的准确率和效率。具体地,利用测序数据过滤软件trimmomatic对原始数据进行过滤。
接下来,利用序列比对软件star将过滤后的数据回帖到参考基因组,然后利用变异识别程序freebayes进行突变识别。
计算子单元,用于计算样本肿瘤组织与样本正常组织中转录本的表达水平;
具体地,利用序列定量软件kallisto对每一个转录本进行表达定量。
构建子单元,用于构建样本肿瘤组织与样本正常组织突变外显子组;
具体的,将突变检测的结果中变异质量大于20的变异使用程序包pygeno分别构建样本肿瘤组织与样本正常组织突变外显子组。
翻译子单元,用于翻译样本肿瘤组织与样本正常组织突变外显子组。
首先,根据转录本的表达量分析的结果选取表达量大于0的转录本并利用构建的样本肿瘤组织与样本正常组织突变外显子组,翻译得到样本肿瘤组织与样本正常组织的蛋白序列。
接下来,为了使结果能在获取样本肿瘤组织特异蛋白质组分析流程中使用,需要重新格式化翻译结果。
在一个实施例中,特异蛋白质组获取单元包括:
生成子单元,用于预设长度的碱基单体单元序列库;根据分析样本测序数据,利用软件jellyfish获取获取长度为I型表位多肽理论长度范围(8-12个氨基酸)3倍的样本肿瘤组织与样本正常组织的碱基单体单元序列库,这里需要注意的碱基单体单元长度的选取。
获得子单元,用于获得肿瘤特异碱基单体单元序列;
根据碱基单体单元序列在样本正常组织与样本肿瘤组织中的出现情况,选择在样本肿瘤组织中特有的碱基单体单元序列。
组装子单元,用于组装肿瘤特异碱基单体单元序列;
利用短序列组装软件Nektar assembly对肿瘤特异碱基单体单元进行组装,获得肿瘤特异性序列。
阅读框翻译子单元,用于阅读框翻译肿瘤特异性序列。
对上述得到的肿瘤特异性序列进行阅读框翻译,获取肿瘤特异性氨基酸序列,本发明选取长度大于8的氨基酸序列。
在一个实施例中,候选新抗原确定单元包括:
人类白细胞抗原获取子单元,用于获取人类白细胞抗原HLA分子分型;
利用白细胞抗原分子分型软件计算人类白细胞抗原分子分型。
全局肿瘤蛋白质组产生子单元,用于基于所确定的样本肿瘤组织常规蛋白质组和样本肿瘤组织特异蛋白质组,产生全局肿瘤蛋白质组;
合并样本肿瘤组织常规蛋白质组与样本肿瘤组织特异蛋白质组,由此产生的数据称为全局肿瘤蛋白质组。
目标肽段序列获得子单元,利用获得的全局肿瘤蛋白质组以及人类白细胞抗原(HLA)分子分型结果对全局肿瘤蛋白质组进行亲和力预测,获得目标肽段序列;
利用软件NetMHC-4.0以及人类白细胞抗原(HLA)分子分型结果对全局肿瘤蛋白质组进行亲和力预测,获得目标肽段序列。
候选的肿瘤特异性新抗原获取子单元,注释目标肽段序列特征,获取候选的肿瘤特异性新抗原。将目标肽段注释为获选的肿瘤特异性新抗原的特征。
本发明中,分别计算若干所述候选的肿瘤特异性新抗原的特征值,利用预设的规则过滤,获得肿瘤特异性新抗原具体如下:
为了获取肿瘤特异新抗原,基于所获取的候选的肿瘤特异性新抗原的注释目标肽段分别在样本肿瘤组织常规蛋白质组、样本正常组织常规蛋白质组、样本肿瘤组织碱基单体单元库与样本正常组织碱基单体单元库中查询每个肽段编码序列,若注释目标肽段在数据库中存在记为1,不存在记为0。将这四个特征值组合成特征向量进行判断。本发明中,无论其编码序列检测状态如何,都排除在样本正常组织常规蛋白质组中检测到的肽段,因为它们可能是致耐受性的,即特征向量为[*,1,*,*](*为0或是1)的全部排除。真正具有肿瘤特异性的肽段,其应该未在样本正常组织中检测到,换句话说,既未在样本正常组织常规蛋白质组中检测到,也未在样本正常组织碱基单体单元库中检测到,即对应的特征向量为[1,0,1,0]、[0,0,1,0],具有这种肽段的候选肿瘤特异新抗原可被标记为肿瘤特异新抗原。在样本正常组织常规蛋白质组中没检测到的肽段,在其他数据库中检测到,即对应的特征向量为[1,0,1,1],具有这种肽段的候选肿瘤特异新抗原也可被标记为肿瘤特异新抗原。在样本正常组织常规蛋白质组与样本肿瘤组织常规蛋白质组中均不存在的肽段,但是存在于样本正常组织碱基单体单元库与样本肿瘤组织碱基单体单元库中,对应的特征向量为[0,0,1,1],需要其RNA编码序列在肿瘤细胞中比在正常细胞中表达至少高20倍才能被标记。最后,对应于衍生自不同蛋白质的RNA序列的肽段编码序列是一致的,也可被标记为肿瘤特异性抗原。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (8)

1.一种提取免疫治疗新抗原的方法,其特征在于,包括:
步骤S1:获取样本肿瘤组织与样本正常组织的常规蛋白质组;
步骤S2:获取样本肿瘤组织与样本正常组织的碱基单体单元序列库以及样本肿瘤组织的特异蛋白质组;
步骤S3:基于所述样本肿瘤组织的常规蛋白质组、样本肿瘤组织的特异蛋白质组和人类白细胞抗原HLA分子分型,获得若干候选的肿瘤特异性新抗原;
步骤S4:基于所获取的若干所述候选的肿瘤特异性新抗原,分别计算若干所述候选的肿瘤特异性新抗原的特征值,利用预设的规则过滤,获得肿瘤特异性新抗原。
2.如权利要求1所述的提取免疫治疗新抗原的方法,其特征在于,S1获取样本肿瘤组织与样本正常组织的常规蛋白质组包括:
步骤S11:检测样本肿瘤组织与样本正常组织转录本单碱基变异;
步骤S12:计算样本肿瘤组织与样本正常组织中转录本的表达水平;
步骤S13:构建样本肿瘤组织与样本正常组织突变外显子组;
步骤S14:翻译样本肿瘤组织与样本正常组织突变外显子组。
3.如权利要求1所述的提取免疫治疗新抗原的方法,其特征在于,S2获取样本肿瘤组织与样本正常组织的碱基单体单元序列库以及样本肿瘤组织的特异蛋白质组包括:
步骤S21:生成预设长度的碱基单体单元序列库;
步骤S22:获得肿瘤特异碱基单体单元序列;
步骤S23:组装肿瘤特异碱基单体单元序列;
步骤S24:阅读框翻译肿瘤特异性序列。
4.如权利要求1所述的提取免疫治疗新抗原的方法,其特征在于,S3基于所述样本肿瘤组织的常规蛋白质组、样本肿瘤组织的特异蛋白质组和人类白细胞抗原HLA分子分型,获得候选的肿瘤特异性新抗原包括:
步骤S31:获取人类白细胞抗原HLA分子分型;
步骤S32:基于所确定的样本肿瘤组织常规蛋白质组和样本肿瘤组织特异蛋白质组,产生全局肿瘤蛋白质组;
步骤S33:利用获得的全局肿瘤蛋白质组以及人类白细胞抗原(HLA)分子分型结果对全局肿瘤蛋白质组进行亲和力预测,获得目标肽段序列;
步骤S34:注释目标肽段序列特征,获取候选的肿瘤特异性新抗原。
5.一种提取免疫治疗新抗原的***,其特征在于,包括:
常规蛋白质组获取单元,用于获取样本肿瘤组织与样本正常组织的常规蛋白质组;
特异蛋白质组获取单元,用于获取样本肿瘤组织与样本正常组织的碱基单体单元序列库以及样本肿瘤组织的特异蛋白质组;
候选新抗原确定单元,基于所述样本肿瘤组织的常规蛋白质组、样本肿瘤组织的特异蛋白质组和人类白细胞抗原HLA分子分型,获得若干候选的肿瘤特异性新抗原;
肿瘤特异性新抗原确定单元,基于所获取的若干所述候选的肿瘤特异性新抗原,分别计算所述候选的肿瘤特异性新抗原的特征值,利用预设的规则过滤,获得肿瘤特异性新抗原。
6.如权利要求5所述的提取免疫治疗新抗原的***,其特征在于,常规蛋白质组获取单元包括:
检测子单元,用于检测样本肿瘤组织与样本正常组织转录本单碱基变异;
计算子单元,用于计算样本肿瘤组织与样本正常组织中转录本的表达水平;
构建子单元,用于构建样本肿瘤组织与样本正常组织突变外显子组;
翻译子单元,用于翻译样本肿瘤组织与样本正常组织突变外显子组。
7.如权利要求5所述的提取免疫治疗新抗原的***,其特征在于,特异蛋白质组获取单元包括:
生成子单元,用于生成预设长度的碱基单体单元序列库;
获得子单元,用于获得肿瘤特异碱基单体单元序列;
组装子单元,用于组装肿瘤特异碱基单体单元序列;
阅读框翻译子单元,用于阅读框翻译肿瘤特异性序列。
8.如权利要求5所述的提取免疫治疗新抗原的***,其特征在于,候选新抗原确定单元包括:
人类白细胞抗原获取子单元,用于获取人类白细胞抗原HLA分子分型;
全局肿瘤蛋白质组产生子单元,用于基于所确定的样本肿瘤组织常规蛋白质组和样本肿瘤组织特异蛋白质组,产生全局肿瘤蛋白质组;
目标肽段序列获得子单元,利用获得的全局肿瘤蛋白质组以及人类白细胞抗原(HLA)分子分型结果对全局肿瘤蛋白质组进行亲和力预测,获得目标肽段序列;
候选的肿瘤特异性新抗原获取子单元,注释目标肽段序列特征,获取候选的肿瘤特异性新抗原。
CN201910823630.1A 2019-09-02 2019-09-02 一种提取免疫治疗新抗原的方法及*** Active CN110534156B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910823630.1A CN110534156B (zh) 2019-09-02 2019-09-02 一种提取免疫治疗新抗原的方法及***
US16/991,042 US20210061870A1 (en) 2019-09-02 2020-08-12 Method and system for extracting neoantigens for immunotherapy

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910823630.1A CN110534156B (zh) 2019-09-02 2019-09-02 一种提取免疫治疗新抗原的方法及***

Publications (2)

Publication Number Publication Date
CN110534156A true CN110534156A (zh) 2019-12-03
CN110534156B CN110534156B (zh) 2022-06-17

Family

ID=68666240

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910823630.1A Active CN110534156B (zh) 2019-09-02 2019-09-02 一种提取免疫治疗新抗原的方法及***

Country Status (2)

Country Link
US (1) US20210061870A1 (zh)
CN (1) CN110534156B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111599410A (zh) * 2020-05-20 2020-08-28 深圳市新合生物医疗科技有限公司 一种整合多组学数据提取微卫星不稳定免疫治疗新抗原的方法和应用
CN111627497A (zh) * 2020-05-19 2020-09-04 深圳市新合生物医疗科技有限公司 基于新转录本组装的肿瘤特异转录区域提取免疫治疗新抗原的方法和应用

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117174166B (zh) * 2023-10-26 2024-03-26 北京基石生命科技有限公司 基于三代测序数据的肿瘤新抗原预测方法及***

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102498219A (zh) * 2009-06-15 2012-06-13 癌症学术基金会 在得自对象的生物学样品中评价癌症的方法
CN107750278A (zh) * 2015-04-27 2018-03-02 癌症研究技术有限公司 治疗癌症的方法
CN109073637A (zh) * 2016-05-13 2018-12-21 生物技术Rna制药有限公司 用于预测蛋白质或蛋白质片段用于免疫治疗的有用性的方法
WO2019050994A1 (en) * 2017-09-05 2019-03-14 Gritstone Oncology, Inc. IDENTIFICATION OF NEOANTIGEN FOR LYMPHOCYTE THERAPY T
CN109801678A (zh) * 2019-01-25 2019-05-24 上海鲸舟基因科技有限公司 基于全转录组的肿瘤抗原预测方法及其应用

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108513593A (zh) * 2015-04-23 2018-09-07 南托米克斯有限责任公司 癌症新表位

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102498219A (zh) * 2009-06-15 2012-06-13 癌症学术基金会 在得自对象的生物学样品中评价癌症的方法
CN107750278A (zh) * 2015-04-27 2018-03-02 癌症研究技术有限公司 治疗癌症的方法
CN109073637A (zh) * 2016-05-13 2018-12-21 生物技术Rna制药有限公司 用于预测蛋白质或蛋白质片段用于免疫治疗的有用性的方法
WO2019050994A1 (en) * 2017-09-05 2019-03-14 Gritstone Oncology, Inc. IDENTIFICATION OF NEOANTIGEN FOR LYMPHOCYTE THERAPY T
CN109801678A (zh) * 2019-01-25 2019-05-24 上海鲸舟基因科技有限公司 基于全转录组的肿瘤抗原预测方法及其应用

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
YUYU LI: ""ProGeo-neo: a customized proteogenomic workflow for neoantigen prediction and selection"", 《BIORXIV》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111627497A (zh) * 2020-05-19 2020-09-04 深圳市新合生物医疗科技有限公司 基于新转录本组装的肿瘤特异转录区域提取免疫治疗新抗原的方法和应用
CN111627497B (zh) * 2020-05-19 2023-06-13 深圳市新合生物医疗科技有限公司 基于新转录本组装的肿瘤特异转录区域提取免疫治疗新抗原的方法和应用
CN111599410A (zh) * 2020-05-20 2020-08-28 深圳市新合生物医疗科技有限公司 一种整合多组学数据提取微卫星不稳定免疫治疗新抗原的方法和应用
CN111599410B (zh) * 2020-05-20 2023-06-13 深圳市新合生物医疗科技有限公司 一种整合多组学数据提取微卫星不稳定免疫治疗新抗原的方法和应用

Also Published As

Publication number Publication date
CN110534156B (zh) 2022-06-17
US20210061870A1 (en) 2021-03-04

Similar Documents

Publication Publication Date Title
Marcu et al. HLA Ligand Atlas: a benign reference of HLA-presented peptides to improve T-cell-based cancer immunotherapy
Cillo et al. Immune landscape of viral-and carcinogen-driven head and neck cancer
Luca et al. Atlas of clinically distinct cell states and ecosystems across human solid tumors
CN110534156A (zh) 一种提取免疫治疗新抗原的方法及***
Burger et al. Antigen dominance hierarchies shape TCF1+ progenitor CD8 T cell phenotypes in tumors
CN108388773B (zh) 一种肿瘤新生抗原的鉴定方法
JP2020536553A5 (zh)
US20200243164A1 (en) Systems and methods for patient-specific identification of neoantigens by de novo peptide sequencing for personalized immunotherapy
Hanna et al. Defining an inflamed tumor immunophenotype in recurrent, metastatic squamous cell carcinoma of the head and neck
JP2013525759A (ja) がん、自己免疫および感染症の免疫療法開発用自然処理hla制限ペプチドの特異的定量方法
Polyakova et al. Proteogenomics meets cancer immunology: mass spectrometric discovery and analysis of neoantigens
US11885732B2 (en) Morphometric genotyping of cells in liquid biopsy using optical tomography
RU2013145154A (ru) Анализ экспрессии биомаркеров в клетках с помощью кластеров
US20230047716A1 (en) Method and system for screening neoantigens, and uses thereof
Capasso et al. A novel in silico framework to improve MHC-I epitopes and break the tolerance to melanoma
Becker et al. The importance of being presented: target validation by immunopeptidomics for epitope-specific immunotherapies
WO2018232580A1 (zh) 基于三代捕获测序对二倍体基因组单倍体分型的方法和装置
Tang et al. NIEluter: Predicting peptides eluted from HLA class I molecules
CA3198427A1 (en) Method, system and computer program product for determining peptide immunogenicity
Han et al. Weighting tumor-specific TCR repertoires as a classifier to stratify the immunotherapy delivery in non–small cell lung cancers
KR102330099B1 (ko) Hla 클래스 i 또는 ii 대립유전자와 다양한 길이의 펩타이드를 대상으로 신생항원을 예측하는 방법 및 컴퓨터 프로그램
CN111192632B (zh) 整合dna和rna的深度测序数据提取基因融合免疫治疗新抗原的方法和装置
Ye et al. Combinatory strategy using nanoscale proteomics and machine learning for T cell subtyping in peripheral blood of single multiple myeloma patients
WO2024051097A1 (zh) 肿瘤特异环状rna的新抗原鉴定方法及装置、设备、介质
KR20180077227A (ko) D-단백질 리간드의 구조 기반의 설계

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant