CN112133372B - 抗原特异性tcr数据库的建立方法及抗原特异性tcr的评估方法 - Google Patents

抗原特异性tcr数据库的建立方法及抗原特异性tcr的评估方法 Download PDF

Info

Publication number
CN112133372B
CN112133372B CN202010828988.6A CN202010828988A CN112133372B CN 112133372 B CN112133372 B CN 112133372B CN 202010828988 A CN202010828988 A CN 202010828988A CN 112133372 B CN112133372 B CN 112133372B
Authority
CN
China
Prior art keywords
sequence
specific
antigen
tcr
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010828988.6A
Other languages
English (en)
Other versions
CN112133372A (zh
Inventor
任树成
宋瑾
梅博源
张恒辉
沈宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhenzhi Medical Technology Co ltd
Original Assignee
Beijing Zhenzhi Medical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhenzhi Medical Technology Co ltd filed Critical Beijing Zhenzhi Medical Technology Co ltd
Priority to CN202010828988.6A priority Critical patent/CN112133372B/zh
Publication of CN112133372A publication Critical patent/CN112133372A/zh
Application granted granted Critical
Publication of CN112133372B publication Critical patent/CN112133372B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search

Landscapes

  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明公开一种抗原特异性TCR数据库的建立方法及抗原特异性TCR的评估方法,其中该建立方法包括:采集T细胞样本,分离出T细胞样本中的特异性T细胞克隆;对特异性T细胞克隆进行测序,获得特异性T细胞克隆的CDR3β序列信息;对特异性T细胞克隆进行过滤处理;修剪特异性T细胞克隆的CDR3β区域的序列,得到第一类特异性T细胞克隆;通过TCR公共数据库获取其中的序列,对序列进行可信度评分;选取可信度评分大于预设值的序列,修剪其CDR3β区域的序列,得到第二类特异性T细胞克隆;根据第一类特异性T细胞克隆和第二类特异性T细胞克隆建立抗原特异性TCR数据库。通过本发明实施例建立的数据库可作为抗原特异性TCR分析的参考数据库。

Description

抗原特异性TCR数据库的建立方法及抗原特异性TCR的评估 方法
技术领域
本发明涉及生物技术领域,尤其涉及一种抗原特异性TCR数据库的建立方法及抗原特异性TCR的评估方法。
背景技术
淋巴细胞通过其表面抗体识别特异性抗原来发挥免疫功能。其对抗原识别的特异性体现在克隆水平,即同一克隆的淋巴细胞能识别具有相同的抗原受体,识别同一抗原表位。T细胞抗原受体(TCR)是T细胞特异识别和结合抗原肽-MHC分子的结构,T细胞受体是异源二聚体,由两个不同的亚基所构成。95%的T细胞的受体由α亚基和β亚基构成,另外5%的受体由γ亚基和δ亚基构成,其比例会因为个体发育或疾病而变化。
TRB是编码TCRβ的基因座,其包含可变段(V)、多变段(D)、连接段(J)和恒定区(C)4个基因片段,而V、D、J、C又分为若干等位基因,T细胞发育过程中TRB基因座内发生基因重组,为TCRβ的多样性提供了分子基础,另外通过在基因重组位点附近的碱基的随机***和缺失等机制,最终产生了多样性的TCR,以满足机体识别多种多样的抗原的需要。
TCRβ的CDR3区由V基因片段末端、D基因片段、J基因片段前端及V、D、J之间***的核苷酸序列组成。TCRβ链按等位排斥的方式优先于TCRα链的重排,能较好的反应T细胞的TCR特征。此外,TCR的每个亚基的可变区都包含三个高度易变的互补决定区(complementarity determining regions,CDR),最重要的CDR3负责直接与MHC所呈递的多肽结合,而且序列高度可变,故TCR的多样性主要由CDR3决定。通过对TCRβ的CDR3区进行测序,可以评价免疫组库中TCRβ的多样性等参数,进一步可以分析免疫***的应答发生机制及过程。因此,对抗原特异性T细胞受体的鉴定往往也集中于对β链CDR3编码序列的检测。
T细胞介导的细胞免疫属于适应性免疫的一种,是免疫***对病原体和肿瘤细胞进行识别和清除的重要途径。通过增强T细胞介导的适应性免疫反应,修复机体免疫监视、防御和调控功能的过继T细胞(Adoptive Celltransfer Therapy,简称ACT)疗法克服了传统治疗技术的局限性。ACT疗法包括肿瘤浸润T细胞(Tumor Infiltrating Lymphocytes,简称TIL)疗法、CAR-T细胞疗法、和TCR-T(T cell receptor-gene engineered T cells)疗法。TCR-T疗法是当前ACT领域最新技术,是通过基因工程的手段,直接改造T细胞识别肿瘤抗原的表面受体TCR,从而加强T细胞识别和杀伤肿瘤细胞的能力,受到广泛的关注并成为研究热点,在已进行的临床试验中,被证实具有良好的疗效,研究成果被Science、Nature等顶级杂志争相报道。这种疗法对传染性疾病和特定病毒的治疗潜力目前也已有研究展开探索。比如HIV、HBV和COVID-19,均可以成为TCR-T的靶点,作为创新性疗法应用于传染病的治疗和控制。以HBV感染为例,目前的抗病毒治疗仅仅是抑制病毒复制,治愈的患者不到5%。用抗病毒药物和CAR/TCR-T细胞联合治疗这些患者可能是一个可行的选择。现有技术表明,使用mRNA电穿孔对CAR/TCR-T细胞进行基因改造的方法将它们的功能活性限制在短时间内,因此提供了增强的安全特性,适合在慢性病毒性疾病患者中使用。
抗原特异性TCR的鉴定,是TCR-T疗法及药物开发最为关键的步骤,高通量抗原特异性TCR鉴定的方法,将大大缩短TCR-T疗法的开放周期,降低成本。
无论是特异性靶向肿瘤特定抗原的肿瘤新生抗原疫苗、TCR-T抗原特异性或其他病原体抗原特异性免疫细胞疗法,还是靶向免疫检查点的检查点抑制剂(ICIs),其发挥作用的重要基础,都是调动T细胞识别抗原、引发肿瘤特异性地杀伤响应。免疫治疗过程中,抗原特异性的T细胞克隆的扩增、持续、衰退,可以直观地反映免疫治疗的效果。因此,抗原特异性TCR的鉴定方法,不仅能够检验免疫疗法是否有效地激发抗原特异性T细胞响应,还可以用于免疫治疗过程中特异T细胞变化的监测,具有免疫治疗的伴随诊断潜在价值。
现有技术中,有利用5'RACE及巢式PCR的方法对TCRβ的CDR3区进行扩增建库并测序,对其测序结果进行分析比对。5'RACE及巢式PCR的方法固定以RNA为起始材料,样本类型较单一,相对于其他技术对操作要求相对较高,并且全部流程繁杂,重复性可能会受到影响。并且,仅能够获得检测材料中的T细胞的总体组库,无法实现特异性TCR的检测。
发明内容
本发明的主要目的在于提供一种抗原特异性TCR数据库的建立方法及抗原特异性TCR的评估方法,以解决现有技术缺乏有效对抗原特异性TCR进行检测和鉴定的技术的问题。
根据本发明的一个方面提出一种抗原特异性TCR数据库的建立方法,其包括:采集T细胞样本,分离出所述T细胞样本中的特异性T细胞克隆;对所述特异性T细胞克隆进行测序,获得所述特异性T细胞克隆的CDR3β序列信息;根据所述特异性T细胞克隆在所述T细胞样本中的频率和排名,对所述特异性T细胞克隆进行过滤处理;对经过过滤处理的特异性T细胞克隆,修剪其CDR3β区域的序列,得到序列格式一致的第一类特异性T细胞克隆;通过TCR公共数据库获取其中的序列,对所述序列进行可信度评分,所述可信度评分规则包括:测序法评分规则、TCR-pMHC首次鉴定法评分规则、T细胞特异性鉴定法评分规则;选取所述可信度评分大于预设值的序列,修剪其CDR3β区域的序列,得到序列格式一致的第二类特异性T细胞克隆;根据所述第一类特异性T细胞克隆和所述第二类特异性T细胞克隆建立抗原特异性TCR数据库。
其中,所述抗原特异性TCR数据库中的序列包括入库基本信息和统计基本信息;所述入库基本信息进一步包括:抗原基因名、HLA型别、抗原表位氨基酸序列、修剪后CDR3β氨基酸序列、VDJ基因;所述统计基本信息进一步包括:CDR3β所占频率、VJ占比、CDR3部分长度及分布。
其中,所述分离出所述T细胞样本内的特异性T细胞克隆的步骤包括:使用HLA限定的MHC-抗原表位肽复合物对所述T细胞样本中的特异性的T细胞进行标记;使用流式细胞分选技术或磁珠细胞分选技术分离出所述T细胞样本内的特异性的T细胞克隆。
其中,所述对所述序列进行可信度评分的步骤,包括:所述测序法评分规则包括:若包含单细胞测序,则为3X分;若为扩增子测序,则为2X分;若为sanger测序,但有两个及两个以上的细胞测序结果,则为2X分,若仅有一个细胞,则为1X分;如果未能提供测序方法,则不得分;其中,设置所述测序法得分为a;所述TCR-pMHC复合体提取法评分规则包括:若基于细胞分选且频率大于0.1,则为1X分;若基于细胞培养且频率大于0.5,则为1X分;若未提供复合体提取办法,则不得分;其中,设置所述TCR-pMHC复合体提取法得分为b;所述T淋巴细胞特异性鉴定法评分规则包括:若包含直接鉴定法,则为3分;若采用目标抗原刺激法,则为2X分;若仅采用染色法,则为1X分;其中,设置所述T淋巴细胞特异性鉴定法得分为c;其中,X为整数,所述可信度评分为a与b加c之和两项中较小的一项的分数。
根据本发明的另一方面还提出一种抗原特异性TCR的评估方法,其包括:获取靶标CDR3β序列;通过所述数据库获取参考序列;将所述靶标CDR3β序列与所述参考序列进行序列比对,根据比对结果得到所述靶标CDR3β序列的抗原识别综合指数;根据所述抗原识别综合指数输出所述靶标CDR3β序列中的抗原特异性TCR。
其中,将所述靶标CDR3β序列与所述参考序列进行序列比对的步骤,包括:计算所述靶标CDR3β序列与所述参考序列之间的Hamming距离,得到序列相似性评分;计算所述靶标CDR3β序列与所述参考序列之间的氨基酸相似性,得到氨基酸相似性评分;根据所述靶标CDR3β序列的不同位置的氨基酸生成抗原接触位点加权向量,其中抗原接触位点位置的权重大于非抗原接触位点位置的权重;根据所述序列相似性评分、所述氨基酸相似性评分与氨基酸所在位置的加权向量得到比对结果。
其中,所述根据比对结果得到所述靶标CDR3β序列的抗原识别综合指数的步骤,包括:根据所述氨基酸相似性评分与氨基酸所在位置的加权向量的加和再加上序列相似性评分,得到所述抗原识别综合指数。
其中,所述抗原识别综合指数的高低与序列的相似性成反比。
其中,采用Hamming距离计算所述靶标CDR3β序列与所述参考序列的差异性。
其中,采用Blosum矩阵计算所述氨基酸相似性评分。
根据本发明实施例建立的抗原特异性TCR数据库,可作为抗原特异性TCR分析的参考数据库;并且,通过将任意TCR的CDR3β序列与本发明中构建的抗原特异性TCR数据库中CDR3β序列的相似度进行评价,可判定某个TCR能否识别特定的抗原。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的抗原特异性TCR数据库的建立方法的流程图;
图2是根据本发明实施例的抗原特异性TCR的评估方法的流程图;
图3是根据本发明实施例的Blosum90矩阵示意图;
图4A-图4D是根据本发明实施例的AFP和MAGEA1抗原特异性TCR比较的示意图;
图5A和图5B是根据本发明实施例的AFP和MAGEA1肿瘤特异性CD8+MHC多聚体+T细胞流式检测的示意图;
图6为本发明实施例CMV阳性供者CMV特异性CD8+MHC多聚体+T细胞流式检测的示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明具体实施例及相应的附图对本发明技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
以下结合附图,详细说明本发明各实施例提供的技术方案。
根据本发明实施例提供了一种抗原特异性TCR数据库的建立方法,该数据库中的抗原特异性TCR主要有两个来源,即公共数据和自建数据。参考图1,该方法包括以下步骤:
步骤S102,采集T细胞样本,分离出所述T细胞样本中的特异性T细胞克隆。
具体地,对于具有含有潜在的目标抗原特异性TCR的可能性的细胞样本,使用HLA(人类白细胞抗原)限定的MHC-抗原表位肽复合物对其中特异性的T细胞进行标记,然后使用流式细胞分选技术(FACS)或磁珠细胞分选技术(MACS)分离出T细胞样本内的特异性的T细胞克隆。其中,可使用现有技术确定T细胞样本内是否含有潜在的目标抗原特异性TCR。
步骤S104,对所述特异性T细胞克隆进行测序,获得所述特异性T细胞克隆的CDR3β序列信息。
上述特异性T细胞克隆的CDR3β序列,可采用但不限于使用现有技术中的测序方法测定特异性T细胞克隆的CDR3β序列。例如,二代测序方法(NGS)或一代测序(SANGER)方法。高通量测序技术是对传统测序一次革命性的改变,一次对几十万到几百万条DNA分子进行序列测定,因此在有些文献中称其为下一代测序技术(Next Generation Sequencing,简称NGS),同时高通量测序使得对一个物种的转录组和基因组进行细致全貌的分析成为可能,所以又被称为深度测序(deep sequencing)。
步骤S106,根据所述特异性T细胞克隆在所述T细胞样本中的频率和排名,对所述特异性T细胞克隆进行过滤处理。
其中,所述的特异性T细胞克隆,可能是多个或一个,通过T细胞克隆在样本中的频率和排名进行过滤,能够保证特异性T细胞的真实克隆最大限度被保留。例如,过滤条件可设定为单个克隆的频率>10%且该克隆频率在单个样本内排名前五;或者过滤条件还可设定为单个克隆的频率>20%且该克隆频率在单个样本内排名前五。
步骤S108,对经过过滤处理的特异性T细胞克隆,修剪该特异性T细胞克隆的CDR3β区域的序列,得到序列格式一致的第一类特异性T细胞克隆。
其中,所述修剪CDR3区域的序列,可以是保留IMGT定义的C104(C)位氨基酸到F118(F)位氨基酸之间的序列段。
通过以上步骤S102-S108可到自建数据。
步骤S110,通过TCR公共数据库获取其中的TCR序列。
在本申请实施例中,所述TCR公共数据库可以是VDJdb、McPAS-TCR、TCR3d等三个公开数据库、以及未纳入数据库的参考文献。
步骤S112,对通过TCR公共数据库获取的TCR序列进行可信度评分,所述可信度评分规则包括:测序法评分规则、TCR-pMHC首次鉴定法评分规则、T细胞特异性鉴定法评分规则。
由于公共数据来源序列数据的标准和质量不一致,因此需要先对数据进行清洗。例如,VDJdb、McPAS-TCR、TCR3d三个公开数据库以及未纳入数据库的多篇文献报道中的序列,对信息不完整、矛盾和重复的条目进行梳理和筛选,最终保留的是符合入库标准的条目。
对序列进行数据清洗后,对序列数据进行可信度评分。具体地可信度评分规则主要由三部分构成:测序法评分规则、TCR-pMHC首次鉴定法评分规则、以及T细胞特异性鉴定法评分规则。
(1)测序评分规则。
对于能确定测序方法的数据,根据测序方法对此项进行评分。例如,若包含单细胞测序,为3分;若为扩增子测序,为2分;若为sanger测序,但有两个及两个以上的细胞测序结果,亦为2分,若仅有一个细胞,则为1分;如果未能提供测序方法,则不得分。此得分记为a得分。
(2)TCR-pMHC复合体提取法评分规则。
对于能确定TCR-pMHC复合体提取方法的序列,根据提取方法对此项进行评分。例如,若基于细胞分选且频率大于0.1,则得1分;若基于细胞培养且频率大于0.5,则得1分;若未提供复合体提取办法,则不得分。此得分记为b得分。
(3)T淋巴细胞特异性鉴定法评分规则。
对于能确定T淋巴细胞特异性鉴定办法的序列,根据其思路以及方法进行评分。若包含直接鉴定法,例如Protein Data Bank或其他直接鉴定TCR-pMHC结合的手段,此项得3分;若采用目标抗原刺激法,此项得2分;若仅采用染色法,此项得1分。此得分记为c得分。
最终得分为:a得分,b和c得分之和,这两项中较小的一项(最终得分上限为3分)。需要说明,上述三种评分规则的得分仅为示例性说明,在其他实施例中的得分还可为以上分数的整数倍。
步骤S114,选取所述可信度评分大于预设值的序列数据,对修剪其CDR3β区域的序列,得到序列格式一致的第二类特异性T细胞克隆。
对序列进行过滤处理,例如选取可信度评分大于或等于2的序列,然后对序列进行修剪处理,修剪其CDR 3区域的序列,例如保留IMGT定义的C104(C)位氨基酸到F118(F)位氨基酸之间的序列段,使得通过TCR公共数据库得到的序列格式一致,并且使得公共数据与自建数据的序列格式一致。
通过步骤S110-S114可得到公共数据。
步骤S116,根据所述第一类特异性T细胞克隆和所述第二类特异性T细胞克隆建立抗原特异性TCR数据库,该抗原特异性TCR数据库可作为抗原特异性TCR分析的参考数据库。
在本申请实施例中,将特异性T细胞克隆分为第一类特异性T细胞克隆和第二类特异性T细胞克隆,并不表示其数据类型不一致,而是表示其数据来源不一致。其中,数据来源为自建数据的特异性T细胞克隆以第一类特异性T细胞克隆表示,数据来源为公用数据的特异性T细胞克隆以第二类特异性T细胞克隆表示。
在本申请的实施例中,所述抗原特异性TCR数据库中的数据以克隆型为单位,依据入库基本信息以及统计基本信息标准,进行规范化的注释和统计。入库基本信息包含抗原基因名、HLA型别、抗原表位氨基酸序列、修剪后CDR3β氨基酸序列、VDJ基因等;统计基本信包括其所占频率、VJ占比、CDR3部分长度及分布等。将上述结果进行匹配,形成完整的数据内容,将处理完毕的数据内容归纳相对应的肿瘤特异性抗原数据库内。
参考图2,根据本申请实施例还提供一种抗原特异性TCR的评估方法,其包括:
步骤S202,获取靶标CDR3β序列。
具体地,提取靶标CDR3β序列并对序列进行修剪处理,保留自IMGT定义C104位置起第三位氨基酸到F118位起前两位氨基酸的序列段,该序列段为结构域最常用段落。
步骤S204,通过所述数据库获取参考序列;其中,所述数据库是以上所述的抗原特异性TCR数据库,可以选择数据库中的全部抗原或部分抗原作为参考序列进行比对。
步骤S206,将所述靶标CDR3β序列与所述参考序列进行序列比对,根据比对结果得到所述靶标CDR3β序列的抗原识别综合指数。
具体地,序列比对主要包括:序列相似度分析、氨基酸相似性分析和抗原接触位点加权,下面详细描述。
(1)序列相似度分析。
两个等长字符串之间的Hamming距离是两个字符串对应位置的不同字符的个数。在本申请实施例中,通过采用Hamming距离计算序列之间的差异性。具体地,通过计算靶标CDR3β序列与参考序列之间的Hamming距离,得到序列相似性评分。此步骤用于给出一个对于计算靶标序列与参考序列之间的不同的量化标准,用以表示序列之间的差异性。
在Hamming距离计算的算法中,靶标序列氨基酸与参考序列氨基酸差异数上限被设定为2。对于氨基酸的增添或者删除突变情况,在对齐其他氨基酸位置后,若存在有出入的位置,以空值标记。
(2)氨基酸相似性分析。
Blosum系列矩阵是用于对氨基酸序列相似性进行打分的矩阵,其编号代表矩阵构建来源序列的一致性。原则上亲缘关系越近的序列,在打分时需采用更高编号的Blosum矩阵,由于本算法针对相似度较高的人源TCR序列,优选地可采用Blosum90打分矩阵对氨基酸序列进行打分(参考图3)。在不同的氨基酸序列中,性质相似的氨基酸替换不倾向于导致特异性的重大改变,在此环节中得分会更趋近于零,反之亦然;若标定位置为空值,则赋在选定范围内最大值。此项评分定义为氨基酸相似性评分。在此算法内,默认距离评分范围可为0到5。
(3)抗原接触位点加权。
T细胞能识别特定抗原的分子基础是TCR-pMHC复合体的晶体结构,TCR-pMHC晶体结构中,与抗原肽段距离极近的部分氨基酸序列段可被认为与抗原肽段进行了结合,即在TCR-pMHC特异性识别中起主要作用。通过对公开的TCR-pMHC晶体结构数据进行整理,总结给定区域内不同位置氨基酸到抗原肽的距离的规律性,发现在已知的TCR-pMHC复合体晶体结构中,大多数与抗原肽段距离接近的氨基酸段,都落在CDR3β区相对固定的位置。基于此,生成抗原接触位点加权向量,对靶标CDR3β序列上的不同位置附加相应的权重,抗原接触位点权重为3,其他位置(非抗原接触位点)为1。
最终的目标序列(靶标CDR3β序列)相对于参考序列的抗原识别综合指数为:氨基酸相似性评分与氨基酸所在位置的加权向量的加和再加上序列相似性评分。
步骤S208,根据所述可能性分数输出所述靶标CDR3β序列中的抗原特异性TCR。所述抗原识别综合指数,代表靶标CDR3β序列与参考序列识别同一抗原的可能性,其中评分的高低与序列的相似性成反比。
在输出结果之前,需将同一目标序列的不同比对结果进行精简,每单一克隆型仅保留评分最低、即相似性最高的参考序列。相对于其他序列,此结果对参考序列对应的抗原更有可能具有特异性识别。其结果具有标准化的格式规范,可对接其他生物信息分析统计,为下游分析提供可信的、具有潜在抗原特异性的TCR序列。
在实际应用中,采集肝癌患者不同治疗时期的全血样本,采用本发明方法检测患者的组织及全血样本中的特异性CDR3β序列,对该患者不同治疗时期的CDR3β序列进行比对,结果如图4A-图4D所示,经肿瘤特异性抗原免疫治疗后,患者的组织及全血样本中的AFP和MAGEA1抗原特异性TCR均有显著增加。
在本申请实施例中,所述抗原特异性TCR的评估方法包括肿瘤抗原特异性TCR的评估方法和病原体抗原特异性TCR的评估方法。在评估肿瘤抗原特异性TCR时使用肿瘤抗原特异性TCR数据库,在评估病原体抗原特异性TCR时使用病原体抗原特异性TCR数据库。
设计并合成AFP和MAGEA1的表位肽,然后将其分别制备成MHC多聚体。使用CD8+T细胞分离试剂盒分选经回输CTL治疗后患者PBMC中CD8+T细胞。使用合成的MHC多聚体分别对患者CD8+T细胞进行染色,通过流式细胞仪对染色后的CD8+T进行分选,得到CD8+MHC多聚体+T细胞。对所得到的双阳性T细胞使用本发明中的方法检测其TCR的CDR3β序列,将此序列与患者组织及全血样本中的TCR的CDR3β序列进行比对,参考图5A-5B,此结果表明该患者的TCR为肿瘤抗原特异性TCR。所鉴定得到TCR的CDRβ氨基酸序列展示如下:
表1.AFP和MAGEA1特异性CDRβ
抗原 表位肽序列 HLA型别 CDR3β序列 频率
AFP GLSPNLNRFL HLA-A*02 ASSLLLQETQY 0.4843181
AFP FMNKFIYEI HLA-A*02 ASSLELSETQY 0.2426883
MAGEA1 KVLEYVIKV HLA-A*02 ASSLYQETQY 0.1529936
设计并合成CMV的表位肽,然后将其制备成MHC多聚体。使用CD8+T细胞分离试剂盒对CMV阳性供者的PBMC中CD8+T细胞。使用合成的MHC多聚体对患者CD8+T细胞进行染色,通过流式细胞仪对染色后的CD8+T进行分选,得到CD8+MHC多聚体+T细胞。对所得到的双阳性T细胞使用本发明中的方法检测其TCR的CDR3β序列,即完成CMV抗原特异性TCR的鉴定,参考图6,所鉴定得到TCR的CDRβ氨基酸序列展示如下:
表2.CMV特异性CDRβ
抗原 表位肽序列 HLA型别 CDR3β序列 频率
CMV NLVPMVATV HLA-A*02 CASRGQGFSYEQYF 0.521353
CMV NLVPMVATV HLA-A*02 CASSFLGLNEQFF 0.3332293
本领域技术人员应明白,本发明的实施例可提供为方法、***或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上所述仅为本发明的实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。

Claims (9)

1.一种抗原特异性TCR数据库的建立方法,其特征在于,包括:
采集T细胞样本,分离出所述T细胞样本中的特异性T细胞克隆;
对所述特异性T细胞克隆进行测序,获得所述特异性T细胞克隆的CDR3β序列信息;
根据所述特异性T细胞克隆在所述T细胞样本中的频率和排名,对所述特异性T细胞克隆进行过滤处理;
对经过过滤处理的特异性T细胞克隆,修剪其CDR3β区域的序列,得到序列格式一致的第一类特异性T细胞克隆;
通过TCR公共数据库获取其中的序列,对所述序列进行可信度评分,可信度评分规则包括:测序法评分规则、TCR-pMHC复合体提取法评分规则、T淋巴细胞特异性鉴定法评分规则;
所述测序法评分规则包括:若包含单细胞测序,则为3X分;若为扩增子测序,则为2X分;若为sanger测序,但有两个及两个以上的细胞测序结果,则为2X分,若仅有一个细胞,则为1X分;如果未能提供测序方法,则不得分;其中,设置所述测序法得分为a;
所述TCR-pMHC复合体提取法评分规则包括:若基于细胞分选且频率大于0.1,则为1X分;若基于细胞培养且频率大于0.5,则为1X分;若未提供复合体提取办法,则不得分;其中,设置所述TCR-pMHC复合体提取法得分为b;
所述T淋巴细胞特异性鉴定法评分规则包括:若包含直接鉴定法,则为3X分;若采用目标抗原刺激法,则为2X分;若仅采用染色法,则为1X分;其中,设置所述T淋巴细胞特异性鉴定法得分为c;
其中,X为整数,所述可信度评分为a与b加c之和两项中较小的一项的分数;
选取所述可信度评分大于预设值的序列,修剪其CDR3β区域的序列,得到序列格式一致的第二类特异性T细胞克隆;
根据所述第一类特异性T细胞克隆和所述第二类特异性T细胞克隆建立抗原特异性TCR数据库。
2.根据权利要求1所述的方法,其特征在于,所述抗原特异性TCR数据库中的序列包括入库基本信息和统计基本信息;
所述入库基本信息进一步包括:抗原基因名、HLA型别、抗原表位氨基酸序列、修剪后CDR3β氨基酸序列、VDJ基因;
所述统计基本信息进一步包括:CDR3β所占频率、VJ占比、CDR3部分长度及分布。
3.根据权利要求1所述的方法,其特征在于,所述分离出所述T细胞样本内的特异性T细胞克隆的步骤包括:
使用HLA限定的MHC-抗原表位肽复合物对所述T细胞样本中的特异性的T细胞进行标记;
使用流式细胞分选技术或磁珠细胞分选技术分离出所述T细胞样本内的特异性的T细胞克隆。
4.一种使用权利要求1至3中任一项所述的数据库进行抗原特异性TCR的评估方法,其特征在于,包括:
获取靶标CDR3β序列;
通过所述数据库获取参考序列;
将所述靶标CDR3β序列与所述参考序列进行序列比对,根据比对结果得到所述靶标CDR3β序列的抗原识别综合指数;
根据所述抗原识别综合指数输出所述靶标CDR3β序列中的抗原特异性TCR。
5.根据权利要求4所述的方法,其特征在于,将所述靶标CDR3β序列与所述参考序列进行序列比对的步骤,包括:
计算所述靶标CDR3β序列与所述参考序列之间的Hamming距离,得到序列相似性评分;
计算所述靶标CDR3β序列与所述参考序列之间的氨基酸相似性,得到氨基酸相似性评分;
根据所述靶标CDR3β序列的不同位置的氨基酸生成抗原接触位点加权向量,其中抗原接触位点位置的权重大于非抗原接触位点位置的权重;
根据所述序列相似性评分、所述氨基酸相似性评分与氨基酸所在位置的加权向量得到比对结果。
6.根据权利要求5所述的方法,其特征在于,所述根据比对结果得到所述靶标CDR3β序列的抗原识别综合指数的步骤,包括:
根据所述氨基酸相似性评分与氨基酸所在位置的加权向量的加和再加上序列相似性评分,得到所述抗原识别综合指数。
7.根据权利要求6所述的方法,其特征在于,所述抗原识别综合指数的高低与序列的相似性成反比。
8.根据权利要求5所述的方法,其特征在于,采用Hamming距离计算所述靶标CDR3β序列与所述参考序列的差异性。
9.根据权利要求5所述的方法,其特征在于,采用Blosum矩阵计算所述氨基酸相似性评分。
CN202010828988.6A 2020-08-18 2020-08-18 抗原特异性tcr数据库的建立方法及抗原特异性tcr的评估方法 Active CN112133372B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010828988.6A CN112133372B (zh) 2020-08-18 2020-08-18 抗原特异性tcr数据库的建立方法及抗原特异性tcr的评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010828988.6A CN112133372B (zh) 2020-08-18 2020-08-18 抗原特异性tcr数据库的建立方法及抗原特异性tcr的评估方法

Publications (2)

Publication Number Publication Date
CN112133372A CN112133372A (zh) 2020-12-25
CN112133372B true CN112133372B (zh) 2022-06-03

Family

ID=73850984

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010828988.6A Active CN112133372B (zh) 2020-08-18 2020-08-18 抗原特异性tcr数据库的建立方法及抗原特异性tcr的评估方法

Country Status (1)

Country Link
CN (1) CN112133372B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111574613A (zh) * 2020-05-23 2020-08-25 湖南源品细胞生物科技有限公司 一种tcr富集克隆型及其获取方法与应用
CN113450877B (zh) * 2021-06-28 2022-04-08 深圳裕泰抗原科技有限公司 一种基于多重免疫组化技术的生物标志物分析方法及其应用
CN113980899A (zh) * 2021-11-29 2022-01-28 杭州艾沐蒽生物科技有限公司 一种高通量筛选抗原特异性tcr的方法
CN114360644A (zh) * 2021-12-30 2022-04-15 山东师范大学 T细胞受体与抗原表位的结合预测方法及***
CN116564423B (zh) * 2023-07-05 2023-09-15 广州源古纪科技有限公司 一种微生物宏基因组数据库构建方法及***

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107074932A (zh) * 2014-10-02 2017-08-18 美国卫生和人力服务部 分离对癌症特异性突变具有抗原特异性的t细胞受体的方法
US20180201991A1 (en) * 2016-12-09 2018-07-19 Regeneron Pharmaceuticals, Inc. Systems and Methods for Sequencing T Cell Receptors and Uses Thereof
CN108603171A (zh) * 2015-12-23 2018-09-28 基因医疗免疫疗法有限责任公司 新一代抗原-特异性tcr
CN110277135A (zh) * 2019-08-10 2019-09-24 杭州新范式生物医药科技有限公司 一种基于预期疗效选择个体化肿瘤新抗原的方法和***
CN110318100A (zh) * 2019-06-04 2019-10-11 四川常青树生物科技有限公司 构建匹配抗原表位和抗体识别区及编码基因数据库的方法以及数据库、存储介质和电子设备
US20200056237A1 (en) * 2017-03-31 2020-02-20 The United States Of America,As Represented By The Secretary,Department Of Health And Human Services Methods of isolating neoantigen-specific t cell receptor sequences
CN111534602A (zh) * 2020-04-22 2020-08-14 深圳市血液中心(深圳市输血医学研究所) 一种基于高通量测序分析人类血型基因型的方法及其应用

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107074932A (zh) * 2014-10-02 2017-08-18 美国卫生和人力服务部 分离对癌症特异性突变具有抗原特异性的t细胞受体的方法
CN108603171A (zh) * 2015-12-23 2018-09-28 基因医疗免疫疗法有限责任公司 新一代抗原-特异性tcr
US20180201991A1 (en) * 2016-12-09 2018-07-19 Regeneron Pharmaceuticals, Inc. Systems and Methods for Sequencing T Cell Receptors and Uses Thereof
US20200056237A1 (en) * 2017-03-31 2020-02-20 The United States Of America,As Represented By The Secretary,Department Of Health And Human Services Methods of isolating neoantigen-specific t cell receptor sequences
CN110318100A (zh) * 2019-06-04 2019-10-11 四川常青树生物科技有限公司 构建匹配抗原表位和抗体识别区及编码基因数据库的方法以及数据库、存储介质和电子设备
CN110277135A (zh) * 2019-08-10 2019-09-24 杭州新范式生物医药科技有限公司 一种基于预期疗效选择个体化肿瘤新抗原的方法和***
CN111534602A (zh) * 2020-04-22 2020-08-14 深圳市血液中心(深圳市输血医学研究所) 一种基于高通量测序分析人类血型基因型的方法及其应用

Also Published As

Publication number Publication date
CN112133372A (zh) 2020-12-25

Similar Documents

Publication Publication Date Title
CN112133372B (zh) 抗原特异性tcr数据库的建立方法及抗原特异性tcr的评估方法
Sohail et al. In silico T cell epitope identification for SARS-CoV-2: Progress and perspectives
Meysman et al. On the viability of unsupervised T-cell receptor sequence clustering for epitope preference
Mohanty et al. Prolonged proinflammatory cytokine production in monocytes modulated by interleukin 10 after influenza vaccination in older adults
WO2016040900A1 (en) Personalized cancer vaccines and methods therefor
CN110706742B (zh) 泛癌种肿瘤新生抗原高通量预测方法及其应用
Gaseitsiwe et al. Peptide microarray-based identification of Mycobacterium tuberculosis epitope binding to HLA-DRB1* 0101, DRB1* 1501, and DRB1* 0401
Gironi et al. A novel data mining system points out hidden relationships between immunological markers in multiple sclerosis
CN112331344A (zh) 免疫状态评估方法及应用
Palgen et al. Innate and secondary humoral responses are improved by increasing the time between MVA vaccine immunizations
CN108559778A (zh) 多发性骨髓瘤分子分型及其在用药指导上的应用
McKinney et al. Cytokine expression patterns associated with systemic adverse events following smallpox immunization
Lukowski et al. Absence of Batf3 reveals a new dimension of cell state heterogeneity within conventional dendritic cells
CN116368570A (zh) 用于确定肽免疫原性的方法、***和计算机程序产品
Yohannes et al. Clustering based approach for population level identification of condition-associated T-cell receptor β-chain CDR3 sequences
Cai et al. SARS-CoV-2 vaccination enhances the effector qualities of spike-specific T cells induced by COVID-19
Milighetti et al. Large clones of pre-existing T cells drive early immunity against SARS-COV-2 and LCMV infection
Chen et al. Association between HLA-DRB1 alleles and tuberculosis: a meta-analysis
US20210403529A1 (en) Tcr-enriched clonotype, acquisition method and use thereof
KR20220123276A (ko) 최적의 백신 설계를 위한 방법 및 시스템
EP3767629A1 (en) Effective clustering of immunological entities
Feraoun et al. The route of vaccine administration determines whether blood neutrophils undergo long-term phenotypic modifications
CN108570501A (zh) 多发性骨髓瘤分子分型及应用
US20220238188A1 (en) Method for determining responsiveness to an epitope
CN113248593A (zh) 一种tcr富集克隆型及其获取方法与应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant