CN114174827A - 用于诊断结直肠癌的方法 - Google Patents

用于诊断结直肠癌的方法 Download PDF

Info

Publication number
CN114174827A
CN114174827A CN202080051929.0A CN202080051929A CN114174827A CN 114174827 A CN114174827 A CN 114174827A CN 202080051929 A CN202080051929 A CN 202080051929A CN 114174827 A CN114174827 A CN 114174827A
Authority
CN
China
Prior art keywords
concentration
subject
leu
colorectal cancer
trim28
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080051929.0A
Other languages
English (en)
Inventor
D·高维尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Marvata
Original Assignee
Marvata
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Marvata filed Critical Marvata
Publication of CN114174827A publication Critical patent/CN114174827A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57419Specifically defined cancers of colon
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57484Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites
    • G01N33/57488Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites involving compounds identifable in body fluids
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2470/00Immunochemical assays or immunoassays characterised by the reaction format or reaction type
    • G01N2470/04Sandwich assay format
    • G01N2470/06Second binding partner specifically binding complex of analyte with first binding partner

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Immunology (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Urology & Nephrology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Hematology (AREA)
  • Cell Biology (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明提供了一种诊断受试者的结直肠癌的非侵入性方法。该方法包括确定受试者中蛋白质TRIM28、PLOD1和CEACAM5(以及任选的P4HA1)的血液浓度。进行浓度分析以确定受试者是否患有结直肠癌。

Description

用于诊断结直肠癌的方法
技术领域
本发明涉及用于诊断受试者的结直肠癌的方法,延伸至用于诊断和治疗受试者的结直肠癌的方法。本发明还提供了适用于本发明的诊断测定的试剂盒,以及用于自动进行诊断测定的计算机程序。
背景技术
结直肠癌(CRC)是第三最常见的癌症形式。在全球范围内,它每年影响超过120万个人,并导致约700,000人死亡。由于更好的诊断、手术和肿瘤治疗,在过去30年中存活率有所提高。然而,存活仍然与诊断时的肿瘤分期最为相关。在I期,5年存活率为87-92%;II期为49-87%,III期为53-89%,IV期为11-12%。因此,必须尽早鉴定结直肠肿瘤,为存活提供最佳前景。这导致了许多国家建议进行国家筛查项目。这些项目主要基于检测粪便中的潜血,然后进行结肠镜检查(和任选的活检)以确认诊断。这增加了CRC的早期检测并降低了死亡率。然而,一个问题是筛查项目会产生大量假阳性,导致许多健康个体接受不必要的结肠镜检查。这项调查成本高昂,并且被许多受试者认为是不愉快的或痛苦的。此外,结肠镜检查与肠穿孔的较小风险相关。因此,需要改进的和更准确的生物标志物,其允许CRC的早期诊断,同时减少初始筛查中的假阳性数量,从而减少不必要进行的结肠镜检查的次数。已经提出了几种这样的生物标志物,包括多种蛋白质的组合(参见例如Bünger等,BMC Cancer2012,12:393)、微小RNA(Nana-Sinkam等,Ann NY Acad Sci 2010,1210:25-33)、DNA甲基化(例如Warren等,BMC Medicine 2011,9:133)或血液或粪便中的肿瘤DNA(例如Petit等,JSurg Res 2019,236:184-197)。
然而,一般而言,这些提议的基于生物标志物的诊断测试不会用于临床环境。较新的测试由于各种原因尚未被采用,比如测量过于复杂,或未能令人满意地证明其准确性。尽管如此,迄今为止进行的研究的一个重要观察结果是,相对于使用单个生物标志物进行的测试,基于生物标志物组合的测试提供了更高的诊断准确性(参见例如
Figure BDA0003474827530000011
等,TumourBiol 2015,36:9839-47)。这表明,需要一种标准的诊断测定,其基于数量有限的可以在常规临床环境中测量的高度准确的生物标志物。然而,最近一项医学文献的调查显示开发这种测定的问题的规模,该调查鉴定了383种蛋白质、94种mRNA、35种DNA和185种其他形式的CRC潜在生物标志物(Zhang等,Database 2018,Bay046)。
发明内容
本发明人已开发出这种适用于常规临床环境的标准诊断测定。该测定基于3或4种血浆蛋白生物标志物的组合,其中一些是已知的CRC生物标志物,而另一些之前未显示与CRC相关。根据发明人的新测定,可以仅基于蛋白生物标志物的血浆浓度来诊断CRC。因此,该测试是非侵入性的,可以使用常规临床方法和仪器快速进行,并且如实施例中所示,是高度准确的。该测定也可以是自动化的。该测试在标准筛查项目中的使用有可能显著提高筛查项目的准确性,减少假阳性,从而减少不必要进行的结肠镜检查的次数,减轻医疗保健***的负担并且使得健康个体避免与结肠镜检查相关的风险。
因此,在第一方面,本发明提供了一种诊断受试者的结直肠癌的方法,包括确定来自受试者的血液来源样品中蛋白质TRIM28、PLOD1和CEACAM5的浓度,并基于所述蛋白质的总浓度和/或相对浓度确定受试者是否患有结直肠癌。
在第二方面,本发明提供了一种诊断受试者的结直肠癌的方法,包括确定来自受试者的血液来源样品中蛋白质TRIM28、PLOD1、CEACAM5和P4HA1的浓度,并基于所述蛋白质的总浓度和/或相对浓度确定受试者是否患有结直肠癌。
在第三方面,本发明提供了一种诊断并治疗受试者的结直肠癌的方法,包括进行根据本发明的第一或第二方面的诊断结直肠癌的方法,并且当受试者被诊断患有结直肠癌时,对受试者给予结直肠癌的治疗。
在第四方面,本发明提供了一种试剂盒,其包含一组用于确定样品中TRIM28、PLOD1、CEACAM5和任选的P4HA1的存在或浓度的试剂。
此类试剂可以包含能够特异性结合TRIM28、PLOD1、CEACAM5或P4HA1并将其与另一种蛋白质区分开的结合剂,例如抗体。用于确定特定蛋白质的存在或浓度的试剂能够报告其在样品中的存在或不存在,或更具体地可以能够定量样品中存在的蛋白质的量。这种试剂可以定义为对蛋白质具有特异性。
在第五方面,本发明提供了一种包含指令的计算机程序产品,当执行所述指令时,将使处理器进行根据第一或第二方面的方法。
在第六方面,本发明提供了第四方面的试剂盒在结直肠癌的诊断中的用途,其中所述诊断是使用根据第一或第二方面的方法进行的。
因此,本申请提供了诊断受试者的结直肠癌的方法。结直肠癌也称为肠癌,在某些情况下,结肠癌和直肠癌被称为不同的癌症。如本文所用,根据本领域的标准实践,结直肠癌包括源自结肠或直肠组织的任何癌症。因此,结直肠癌包括原发性结直肠癌,即位于结肠或直肠内其原始发展部位的结直肠癌,和继发性结直肠癌,即位于身体其他部位的结直肠癌转移。根据标准实践,存在于结肠或直肠中但源自身体其他部位的继发性肿瘤不被视为结直肠癌。
本发明的方法可以用于诊断任何类型的结直肠癌,包括腺癌、鳞状细胞癌和腺鳞癌、肉瘤、类癌瘤和淋巴瘤。类似地,本发明的方法可以用于诊断任何时期的结直肠癌,包括I期、II期、III期和IV期结直肠癌。Dukes分期***也可以用于描述结直肠癌的进展,并且同样地,本发明的方法可以用于诊断Dukes A期、Dukes B期、Dukes C期或Dukes D期的结直肠癌。
被进行这些方法的受试者是人类受试者。受试者可以是任何年龄段或种族的男性或女性。该方法可以用于正在经历结直肠癌症状的受试者、被认为有患结直肠癌风险的受试者或明显健康的受试者的结直肠癌诊断。例如,该方法可以用于通用筛查项目以筛查群体的结直肠癌。该方法还可以用于筛选先前已被成功治疗该疾病的受试者的结直肠癌复发。
如本文所用的术语“诊断”可以理解为确定受试者是否患有结直肠癌。因此,该方法可以用于确定受试者患有(或可能患有)结直肠癌、筛查结直肠癌的受试者没有患有(或可能没有患有)结直肠癌,或用于排除被怀疑患有结直肠癌的个体的结直肠癌。值得注意的是,虽然本发明提供了用于诊断结直肠癌的方法,但这些方法的使用不排除进行额外的诊断步骤以确认基于本发明的方法做出的诊断。例如,设想通过本发明的方法表明患有结直肠癌的个体将接受确认性结肠镜检查以确认癌症诊断,并且可能进行活检。也有可能本发明的诊断方法可以在群体筛查项目中与粪便潜血试验结合使用。
本发明的方法包括确定来自受试者的血液来源样品中蛋白质TRIM28、PLOD1和CEACAM5的浓度。TRIM28由TRIM28基因编码,也被称为TIF1β或KAP1。TRIM28的UniProt登录号为Q13263,其氨基酸序列如SEQ ID NO:1所示。PLOD1由PLOD1基因编码,也被称为LH1。PLOD1的UniProt登录号为Q02809,其氨基酸序列如SEQ ID NO:2所示。CEACAM5由CEACAM5基因编码,也被称为CEA、胎粪抗原100和CD66e。CEACAM5的UniProt登录号为P06731,其氨基酸序列如SEQ ID NO:3所示。
本发明的方法可以进一步包括确定来自受试者的血液来源样品中蛋白质P4HA1的浓度。P4HA1由P4HA1基因编码,并且其UniProt登录号为P13674。P4HA1的氨基酸序列如SEQID NO:4所示。本发明方法中所使用的蛋白质在本文中被称为“感兴趣的蛋白质”。它们也可以称为生物标志物。
如上所述,受试者是人,因此本文所有提及的TRIM28、PLOD1、CEACAM5和P4HA1分别是指人TRIM28、PLOD1、CEACAM5和P4HA1。
CEACAM5可以通过作为细胞粘附分子并通过调节分化、凋亡和细胞极性来促进肿瘤发展;TRIM28是一种转录辅阻遏物,具有复杂的、情景依赖性作用。例如,在肝癌小鼠模型中,TRIM28阻碍肿瘤发生(Herquel等,Proc Natl Acad Sci USA 2011,108:8212-8217);PLOD1在细胞外基质形成中具有重要作用(Wang等,Genet Test Mol Bioma 2018,22:366-373);P4HA1调节胶原蛋白的形成,并且与黑色素瘤有关(Atkinson等,J Invest Dermatol2019,139(5):1118-1126)。CEACAM5和TRIM28先前已被鉴定为CRC的潜在血液生物标志物(Shiromizu等,Sci Rep 2017,7:12782)。
技术人员将理解,由于自然变异(比如编码基因中的单核苷酸多态性(SNP)、mRNA的突变或选择性剪接),TRIM28、PLOD1、CEACAM5和P4HA1中的一个或多个的氨基酸序列可以与SEQ ID NO:1-4中所示的那些序列略有不同。如有疑问,则TRIM28在本文中被定义为涵盖具有与SEQ ID NO:1所示的氨基酸序列具有至少90%序列同一性的氨基酸序列并且被特异性结合SEQ ID NO:1的蛋白质的抗体识别的任何蛋白质。TRIM28还可以被定义为涵盖具有与SEQ ID NO:1所示的氨基酸序列具有至少95%、98%或99%序列同一性的氨基酸序列并且被特异性结合SEQ ID NO:1的蛋白质的抗体识别的任何蛋白质。再或者,TRIM28被定义为SEQ ID NO:1的蛋白质。
类似地,PLOD1在本文中被定义为涵盖具有与SEQ ID NO:2所示的氨基酸序列具有至少90%序列同一性的氨基酸序列并且被特异性结合SEQ ID NO:2的蛋白质的抗体识别的任何蛋白质。PLOD1还可以被定义为涵盖具有与SEQ ID NO:2所示的氨基酸序列具有至少95%、98%或99%序列同一性的氨基酸序列并且被特异性结合SEQ ID NO:2的蛋白质的抗体识别的任何蛋白质。再或者,PLOD1被定义为SEQ ID NO:2的蛋白质。
CEACAM5在本文中被定义为涵盖具有与SEQ ID NO:3所示的氨基酸序列具有至少90%序列同一性的氨基酸序列并且被特异性结合SEQ ID NO:3的蛋白质的抗体识别的任何蛋白质。CEACAM5还可以被定义为涵盖具有与SEQ ID NO:3所示的氨基酸序列具有至少95%、98%或99%序列同一性的氨基酸序列并且被特异性结合SEQ ID NO:3的蛋白质的抗体识别的任何蛋白质。再或者,CEACAM5被定义为SEQ ID NO:3的蛋白质。
P4HA1在本文中被定义为涵盖具有与SEQ ID NO:4所示的氨基酸序列具有至少90%序列同一性的氨基酸序列并且被特异性结合SEQ ID NO:4的蛋白质的抗体识别的任何蛋白质。P4HA1还可以被定义为涵盖具有与SEQ ID NO:4所示的氨基酸序列具有至少95%、98%或99%序列同一性的氨基酸序列并且被特异性结合SEQ ID NO:4的蛋白质的抗体识别的任何蛋白质。再或者,P4HA1被定义为SEQ ID NO:4的蛋白质。
序列同一性可以通过任何方便的方法来评估。但是,为了确定序列之间的序列同一性程度,可以使用对序列进行成对或多重比对的计算机程序,例如EMBOSS Needle或EMBOSS stretcher(二者均是Rice,P.等,Trends Genet.,16,(6),第276-277页,2000年)可以用于成对序列比对,而Clustal Omega(Sievers F等,Mol.Syst.Biol.7:539,2011年)或MUSCLE(Edgar,RC,Nucleic Acids Res.32(5):1792-1797,2004年)可以用于多重序列比对,尽管也可以使用任何其他合适的程序。无论是成对比对还是多重比对,都必须全局(即在整个参考序列中)进行而不是局部进行。
序列比对和同一性百分比计算可以使用例如标准Clustal Omega参数确定:矩阵Gonnet,空位开放罚分6,空位延伸罚分1。或者,可以使用标准EMBOSS Needle参数:矩阵BLOSUM62,空位开放罚分10,空位延伸罚分0.5。也可以使用任何其他合适的参数。
在本文中,“特异性结合”另一个的实体(例如分子)被称为“特异性结合剂”。特异性结合剂是与特定结合配偶体特异性结合的试剂(即分子)。更具体地,特异性结合剂能够以一种不同于与非靶分子结合的方式与其靶标结合。因此,相对于与靶分子的结合,与非靶分子的结合可以忽略不计或显著降低。抗体是特异性结合剂的一个例子。
特异性结合SEQ ID NO:1的蛋白质(即TRIM28)的特异性结合剂(例如抗体)可以是与TRIM28结合的亲和力大于与其他分子或至少大多数其他分子结合的亲和力的分子。因此,例如,如果结合TRIM28的特异性结合剂与人细胞的裂解物接触,则特异性结合剂将首先结合TRIM28。特别地,特异性结合剂结合TRIM28上存在的序列或构型,优选其他分子上不存在的独特序列或构型。当特异性结合剂是抗体时,序列或构型是抗体结合的表位。结合TRIM28的特异性结合剂不一定只与TRIM28结合:特异性结合剂可以与某些其他未定义的靶分子发生交叉反应,或者当与大量分子的混合物(例如细胞裂解物等)接触时,可能会表现出一定程度的非特异性结合。然而,技术人员将能够使用本领域的标准技术,例如ELISA、蛋白质印迹、表面等离子共振(SPR)等,来容易地鉴定特异性结合剂是否对TRIM28显示出特异性。类似地,与SEQ ID NO:2的蛋白质(即PLOD1)结合的特异性结合剂可以是与PLOD1结合的亲和力大于与其他分子或至少大多数其他分子结合的亲和力的分子(例如抗体);与SEQ IDNO:3的蛋白质(即CEACAM5)结合的特异性结合剂可以是与CEACAM5结合的亲和力大于与其他分子或至少大多数其他分子结合的分子(例如抗体);并且与SEQ ID NO:4的蛋白质(即P4HA1)结合的特异性结合剂可以是与P4HA1结合的亲和力大于与其他分子或至少大多数其他分子结合的分子(例如抗体)。
如本文所定义,如果蛋白质被抗体或其他结合分子特异性结合,则该蛋白质被该抗体或其他结合分子“识别”。特异性结合剂还可以被定义为给定蛋白质的特异性结合配偶体。如上所述,可以通过本领域的标准技术来确定抗体是否特异性结合特定分子,例如蛋白质,例如使用ELISA、蛋白质印迹或SPR等。
术语“抗体”在本文中用于泛指任何和所有类型的抗体分子或抗体片段。因此,该术语包括为全长免疫球蛋白分子或其片段或衍生物的任何分子。因此,该术语包括任何抗体类型或抗体衍生的分子或片段,或更通常地,包含衍生自或获得自抗体(例如免疫球蛋白分子,比如天然抗体)的抗原结合结构域的任何分子,或基于抗体的抗原结合结构域的任何分子。抗体还可以被定义为免疫结合剂或免疫相互作用剂。
全长免疫球蛋白分子包含两条全长重链和两条轻链。通常,重链彼此相同,轻链彼此相同。轻链比重链短(因而更轻)。重链包含四个或五个结构域:位于N-端的可变(VH)域,然后是三个或四个恒定域(从N-端到C-端分别是CH1、CH2、CH3和CH4(如果存在))。轻链包含两个结构域:位于N-端的可变(VL)域,位于C-端的恒定(CL)域。在重链中,非结构化铰链区位于CH1和CH2结构域之间。抗体的两条重链通过存在于铰链区的半胱氨酸残基之间形成的二硫键连接,每条重链分别通过存在于CH1和CL结构域的半胱氨酸残基之间的二硫键与一条轻链连接。
在哺乳动物中,产生两种轻链,称为lambda(λ)和kappa(κ)。对于κ轻链,可变域和恒定域分别可以被称为Vκ结构域和Cκ结构域。轻链是λ还是κ轻链取决于其恒定区:λ和κ轻链的恒定区不同,但在任何给定物种中所有相同类型的轻链中均相同。在一个物种中任何给定同种型的所有抗体中重链的恒定区均相同,但同种型之间不同(抗体同种型的例子为IgG、IgE、IgM、IgA和IgD类;还存在许多抗体亚型,例如IgG抗体有四种亚型:IgG1、IgG2、IgG3和IgG4)。抗体的特异性由其可变区的序列决定。
因此,抗体可以是任何期望的或方便的物种、类别或亚型。它可以是天然的、衍生的或合成的。如下文进一步描述的,包括多克隆或单克隆抗体及其任何片段。抗体衍生物,比如单链抗体、嵌合抗体和其他合成制造或改变的抗体样分子在下文进一步描述,并且所有都包括在内。
“来自受试者的血液来源样品”是指来自受试者的血液的任何样品。样品可以是从受试者获得的全血(在本文中也简称为“血液”),没有进行任何额外的处理,例如分级分离,或者它可以是经过处理的样品,例如,全血样品的一部分。处理还可以包括其他步骤。例如,血液样品或其部分可以或可以不例如与各种试剂接触,比如抗凝剂或可能存在于血液收集容器中的任何其他成分。
可以使用标准临床方法从受试者获得血液,例如静脉穿刺(放血)、指刺或脚跟刺血。血液样品可能是静脉血样品,但动脉血同样适用。任何合适的方法都可以用于从受试者获得血样,如临床医生、护士和抽血医师等本领域技术人员已知的方法。在一个特定的实施方案中,本发明的方法进一步包括从受试者采集血样。可以使用上面列出的技术从受试者采集血样。值得注意的是,从受试者采集血样的步骤可以并且实际上很可能由与对血液来源样品进行诊断方法的个体不同的个体进行。例如,如上所述,血样可以通过例如医生、护士或抽血医师采集,而下文描述的诊断方法可以由例如病理学家或临床生物化学家进行。
血液来源样品可以是通过处理从受试者获得的血样而获得的样品。本发明的方法可以进一步包括处理来自受试者的血样以产生血液来源样品。如上所述,这种处理可以包括分级分离,特别是获得其中血细胞已经被去除的血液的部分。在一个特定的实施方案中,血液来源样品是血浆样品。如技术人员已知的,血浆(plasma)(或blood plasma)是血液的液体成分。可以通过从血液中去除血细胞而从全血中获得血浆。用于分离血细胞和血浆(即血液分级分离)的适当方法是本领域公知的。例如,血浆可以通过全血离心获得,这是本领域当前的标准程序。为防止凝血,在采集时会向血样中添加抗凝剂。合适的抗凝剂是本领域公知的,包括EDTA钠和EDTA钾、柠檬酸钠、肝素和草酸钾。适当的离心方案是本领域已知的,例如示例性的离心方案是在4℃下以1,300×g旋转含有抗凝剂的全血20分钟。离心全血的上相是血浆,可以使用例如移液器从其他相中移取。因此,本发明可以包括将抗凝剂添加到来自受试者的血样中并且随后将血样离心以从受试者中分离血浆样品的步骤。
在另一个实施方案中,血液来源样品是血清样品。血清(serum)(或blood serum)是缺乏凝血因子的血浆。血清也可以被认为是凝血后残留血液的液体部分。从血液中分离血清的方法是本领域公知的。通常,通过收集全血样品,并且使样品在室温下不受干扰例如15-30分钟或凝血形成所需的时间以凝结,从而获得血清。因此,与血浆分离的过程不同,如果期望分离血清,则不向血样中添加抗凝剂。
然后将凝结的血液离心以分离血清和血凝块。合适的离心方案是在4℃下以约1,500×g旋转样品10分钟。离心后,样品的上相是血清,可以用例如移液器从其他相中移取。因此,本发明可以包括使来自受试者的血样凝结并且随后将血样离心以获得来自受试者的血清样品的步骤。
然后确定血液来源样品中TRIM28、PLOD1和CEACAM5的浓度。任选地,还确定血液来源样品中P4HA1的浓度。蛋白质的浓度可以通过任何合适的方法确定。几种这样的方法,即可以确定样品中蛋白质浓度的方法,是本领域已知的。
在一个特定的实施方案中,使用免疫测定确定感兴趣蛋白质的浓度。术语免疫测定是指在感兴趣蛋白质的检测/定量中利用抗体的任何测定。可以使用如上定义和描述的任何抗体。
在Rodrigo等,Antibodies,卷4(3),第259-277页,2015年中讨论了抗体片段。抗体片段包括例如Fab、F(ab')2、Fab'和Fv片段,所有这些都是本领域公知和理解的。Fab片段由抗体的抗原结合域组成,即,可以看到单个抗体包含两个Fab片段,每个Fab片段由轻链和与其相连的重链N-端部分组成。因此,Fab片段包含完整的轻链以及与其结合的重链的VH和CH1结构域。Fab片段可以通过用木瓜蛋白酶消化抗体来获得。
F(ab')2片段由抗体的两个Fab片段以及重链的铰链区组成,包括将两条重链连接在一起的二硫键。换句话说,F(ab')2片段可以看作是两条共价连接的Fab片段。F(ab')2片段可以通过用胃蛋白酶消化抗体来获得。F(ab')2片段的还原产生两条Fab'片段,产生的Fab'片段可以看作是含有额外巯基的Fab片段,巯基可用于该片段与其他分子的缀合。
Fv片段仅由轻链和重链的可变域组成。这些不是共价连接的,仅通过非共价相互作用微弱地保持在一起。可以修饰Fv片段以产生称为单链Fv(scFv)分子的合成构建体。这种修饰通常以重组的方式进行,通过工程改造抗体基因以产生其中单个多肽同时包含VH和VL结构域的融合蛋白。scFv片段通常包括共价连接VH和VL区的肽接头,这有助于分子的稳定性。接头可以包含1至20个氨基酸,例如1、2、3或4个氨基酸,5、10或15个氨基酸,或适当地在1至20范围内的其他中间数。肽接头可以由任何一般适当的氨基酸残基形成,比如由甘氨酸和/或丝氨酸形成。合适的接头的一个实例是Gly4Ser。可以使用这样的连接体的多聚体,比如二聚体、三聚体、四聚体或五聚体,例如(Gly4Ser)2、(Gly4Ser)3、(Gly4Ser)4或(Gly4Ser)5。然而,接头不是必需存在的,并且VL结构域可以通过肽键连接至VH结构域。
其他类型的抗体衍生分子和包含抗体的抗原结构域的构建体是本领域已知和描述的,包括例如多聚抗体、嵌合抗体、工程改造或重组抗体、微型抗体(minibody)、双体和各种其他抗体。适当的情况下,任何此类抗体均可用于免疫测定。
用于蛋白质浓度测定的优选免疫测定是定量ELISA。进行定量ELISA的方法是本领域公知的。此外,用于进行定量ELISA的试剂盒是可商购获得的,并且包括说明书/方案。用于进行定量ELISA以确定样品中TRIM28浓度的试剂盒可从MyBiosource,Inc.(美国圣地亚哥)获得,产品编号MBS9902706;用于进行定量ELISA以确定样品中PLOD1浓度的试剂盒可从Aviva Systems Biology Corp.(美国圣地亚哥)获得,产品编号OKDD00473;用于进行定量ELISA以测定样品中CEACAM5浓度的试剂盒可从LifeSpan BioSciences,Inc.(美国西雅图)获得,产品编号LS-F24454;用于进行定量ELISA以确定样品中P4HA1浓度的试剂盒可从Signalway Antibody LLC(美国巴尔的摩)获得,产品编号EK2716。
在本发明的方法中可以使用任何形式的ELISA测定,包括直接ELISA、间接ELISA和夹心ELISA。夹心ELISA优选用于本发明,因为在测定过程中只有感兴趣的抗原被捕获到ELISA板上。用于进行ELISA夹心测定的方案是本领域公知的。根据一个示例性的非限制性夹心ELISA方案,首先将针对感兴趣抗原的抗体固定到ELISA板的孔上(即在本发明中,针对TRIM28、PLOD1和CEACAM5以及任选的P4HA1的抗体被固定到ELISA板的孔上。针对所有这些蛋白质的抗体广泛地可商购获得。“针对”特定分子的抗体是指特异性结合该分子的抗体,例如,针对TRIM28的抗体也可以被称为特异性结合TRIM28或识别TRIM28的抗体)。被固定在ELISA板的孔上的抗体被称为“捕获抗体”。
可以使用多种方法将抗体固定在ELISA板上,例如被动吸附,由此将抗体在包被缓冲液中被施加到板上并孵育板。可以使用任何合适的包被缓冲液。合适的包被缓冲液的一个实例是碳酸盐/碳酸氢盐缓冲液,其含有例如0.2M碳酸钠/碳酸氢钠,pH约为9.5。捕获抗体可以以1-10μg/ml范围的浓度包含在包被缓冲液中,吸附步骤在4℃下过夜进行。用于固定捕获抗体的替代方法包括例如抗体与ELISA板的亲和附着或交联。对于亲和附着,通常将包含标签的抗体用作捕获抗体,使得标签可以与其在ELISA板表面的特异性结合配偶体结合。可以使用本领域已知的任何固定方法。
ELISA板是本领域公知的,包括专门为通过吸附的抗体附着、通过亲和结合的抗体附着和通过交联的抗体附着而设计的ELISA板。这种板可从例如Thermo FisherScientific(美国)获得。所有ELISA板都是多孔板。常见的实例包括96孔和384孔ELISA板。例如,为通过吸附的抗体附着而设计的ELISA板通常具有亲水表面;为通过亲和结合的抗体附着而设计的ELISA板通常包被有用于连接至抗体的标签的结合配偶体,例如,如果抗体带有多组氨酸(His)标签,则ELISA板可以具有包被有镍的表面,或者如果抗体带有谷胱甘肽S-转移酶(GST)标签,则ELISA板可以具有包被有谷胱甘肽的表面。基于捕获抗体固定的预期方法选择合适的ELISA板。
作为ELISA板的替代方案,可以使用ELISA条,例如8孔或10孔条。ELISA条本质上是较小版本的ELISA板,用于使用较少样品的较小测定。
在捕获抗体固定后,可以洗涤板的孔,例如用PBS洗涤,然后封闭。合适的封闭剂包括例如含有1-5%w/v脱脂奶粉或1-5%BSA的PBS。封闭可以在4℃下过夜进行。可以使用利用任何合适的封闭剂的任何合适的封闭方案。封闭后,可以再次洗涤板,例如用PBS洗涤。
在将抗体施加到板上并封闭后,将样品(即在这种情况下是血液来源样品)施加到孔中,并且将板进行孵育以使得靶抗原与吸附的捕获抗体结合。将含有已知浓度的感兴趣蛋白的连续稀释标准品添加到ELISA板的单独孔中。样品(即血液来源样品)也可以以连续稀释的方式施加。然后孵育板,例如在37℃下90分钟。
样品孵育后,从孔中移除样品(和标准品),然后再次洗涤板(例如用PBS)。然后将同样结合感兴趣抗原的检测抗体施加到孔中并孵育板,例如在室温下2小时。检测抗体可以与可检测标记缀合以能够检测所结合的抗体。或者,检测抗体可以是非缀合的。在施加检测抗体后,将其从板中移除并洗涤板(例如用PBS)。如果检测抗体未与可检测标记缀合,则施加与可检测标记缀合的二抗,然后孵育板(例如在室温下2小时)。然后去除二抗,可以再次洗涤板。
或者,检测抗体可以与生物素缀合。在施加检测抗体并洗涤板后,施加标记的亲和素(或链霉亲和素)缀合物代替二抗。
合适的可检测标记是本领域已知的。优选地,标记能够比色检测抗体结合,使得可以使用酶标仪检测抗体和板结合样品的结合。此类标记的实例包括辣根过氧化物酶(HRP)和碱性磷酸酶(ALP)。HRP在与氢供体的氧化反应偶联的反应中裂解过氧化氢,该氢供体在反应过程中会发生颜色变化。合适的供体的实例包括3,3',5,5'-四甲基联苯胺(TMB)和邻苯二胺二盐酸盐(OPD)。为了检测颜色变化,首先使用终止液(例如H2SO4)终止反应,然后在酶标仪中分析ELISA板。该分析包括在适当的波长下测量孔中溶液的光密度。如果使用TMB,则波长为450nm;如果使用OPD,则波长为492nm。ALP在显色反应中裂解对-硝基苯磷酸(pNPP),产生硝基苯酚。可以使用NaOH终止反应,并使用酶标仪通过测量405nm处的光密度来分析板。或者,可以使用能够对抗原进行化学荧光或化学发光检测的可检测标记。可以使用本领域已知的任何可检测标记。
连续标准品的光密度用于生成光密度与靶分子浓度相关联的标准曲线。然后可以基于与标准曲线的简单比较来计算样品中感兴趣抗原的浓度。
在任何夹心ELISA测定中,必须选择捕获抗体和检测抗体的组合以使用“匹配对”。这要求捕获抗体和检测抗体各自在不同的表位(或在靶抗原表面多次出现的表位处)识别靶抗原,使得捕获抗体与抗原的结合不会阻碍检测抗体与抗原的结合。此外,如果使用二抗检测检测抗体,则检测抗体和捕获抗体必须在不同物种中产生,以防止二抗与捕获抗体结合。可以使用本领域的标准步骤凭经验确定一对特定的抗体是否适合组合使用。通过使用商业ELISA试剂盒进行测定,可以确保抗体匹配对的使用。捕获抗体和检测抗体均优选地是单克隆的。
“单克隆抗体”是指由单一抗体种类组成的抗体制剂,即制剂中的所有抗体具有相同的氨基酸序列并因此结合其靶抗原上的相同表位。使用本领域的标准技术,可以从杂交瘤获得单克隆抗体。
在定量ELISA中,例如按照上述方案,抗体片段可以用作用于捕获和/或检测的抗体。方案可以为此进行调整。特别地,如果抗体片段用于抗原检测,则通常不可能使用抗Fc二抗来结合检测抗体片段。因此,检测抗体片段将需要本身包含可检测标记,或者被标记以允许二次检测。例如,如上所述,检测抗体片段可以与生物素缀合,以允许使用包含可检测标记的亲和素或链霉亲和素缀合物进行检测。或者,检测抗体片段可以包含标签,比如His标签、FLAG标签或HA标签,其可以被包含可检测标记的二抗结合。当使用抗体片段时,优选它是单克隆抗体的片段。
另一种可以确定蛋白质浓度的免疫测定是定量蛋白质印迹。可以使用光密度法进行定量蛋白质印迹。在Taylor&Posch,Biomed Research International 2014,文章编号361590中公开了进行定量蛋白质印迹的方法。
一旦确定了感兴趣的蛋白质(即TRIM28、PLOD1和CEACAM5,以及任选的P4HA1)的浓度,就进一步确定受试者是否患有结直肠癌。该确定基于样品中感兴趣蛋白质的总浓度或相对浓度。“总浓度”可以是样品中所有感兴趣蛋白质的总组合浓度。或者,感兴趣蛋白质的“总浓度”可以通过将某些感兴趣蛋白质的浓度加在一起并减去其他蛋白质的浓度来确定。特别地,可以基于常数值来修改感兴趣蛋白质的浓度(例如,通过将感兴趣蛋白质的浓度乘以或除以确定的常数值)。“相对浓度”是指蛋白质浓度彼此之间的关系。例如,可以基于各种感兴趣蛋白质的浓度之间的比率或感兴趣蛋白质的绝对浓度来确定受试者是否患有结直肠癌。
技术人员将意识到浓度可以作为摩尔值或以重量/体积的形式测量。根据本发明的方法,可以使用任一种形式的浓度测量,尽管如下详述,在本文公开的本发明的具体实施方案中,蛋白质浓度以重量/体积(例如ng/ml和pg/ml)的形式测量。
本发明提供了一个具体的实施方案,其中基于TRIM28、PLOD1和CEACAM5的浓度如下确定受试者是否患有结直肠癌:
i)如果TRIM28的浓度大于0.3ng/ml,则受试者不患有结直肠癌;
ii)如果TRIM28的浓度小于或等于0.3ng/ml并且PLOD1的浓度大于或等于1.7ng/ml,则受试者患有结直肠癌;
iii)如果TRIM28的浓度小于或等于0.3ng/ml、PLOD1的浓度小于1.7ng/ml并且CEACAM5的浓度大于或等于0.13pg/ml,则受试者患有结直肠癌;和
iv)如果TRIM28的浓度小于或等于0.3ng/ml、PLOD1的浓度小于1.7ng/ml并且CEACAM5的浓度小于0.13pg/ml,则受试者不患有结直肠癌。
在同一实施方案的进一步的、更具体的版本中,如下确定受试者是否患有结直肠癌:
i)如果TRIM28的浓度大于0.27ng/ml,则受试者不患有结直肠癌;
ii)如果TRIM28的浓度小于或等于0.27ng/ml并且PLOD1的浓度大于或等于1.69ng/ml,则受试者患有结直肠癌;
iii)如果TRIM28的浓度小于或等于0.27ng/ml、PLOD1的浓度小于1.69ng/ml并且CEACAM5的浓度大于或等于0.125pg/ml,则受试者患有结直肠癌;和
iv)如果TRIM28的浓度小于或等于0.27ng/ml、PLOD1的浓度小于1.69ng/ml并且CEACAM5的浓度小于0.125pg/ml,则受试者不患有结直肠癌。
本发明提供了另一个具体的实施方案,其中基于TRIM28、PLOD1、CEACAM5和P4HA1的浓度如下确定受试者是否患有结直肠癌:
i)如果(6.7×[TRIM28])-(0.7×[PLOD1])-(13.1×[CEACAM5])+(0.4×[P4HA1])-2.2小于零,则受试者患有结直肠癌;和
ii)如果(6.7×[TRIM28])-(0.7×[PLOD1])-(13.1×[CEACAM5])+(0.4×[P4HA1])-2.2大于或等于零,则受试者不患有结直肠癌。
在同一实施方案的进一步的、更具体的版本中,如下确定受试者是否患有结直肠癌:
i)如果(6.7×[TRIM28])-(0.65×[PLOD1])-(13.13×[CEACAM5])+(0.43×[P4HA1])-2.21小于零,则受试者患有结直肠癌;和
ii)如果(6.7×[TRIM28])-(0.65×[PLOD1])-(13.13×[CEACAM5])+(0.43×[P4HA1])-2.21大于或等于零,则受试者不患有结直肠癌。
在本实施方案中,根据标准注释,[TRIM28]表示TRIM28的浓度;[PLOD1]表示PLOD1的浓度;[CEACAM5]表示CEACAM5的浓度;[P4HA1]表示P4HA1的浓度。在该实施方案中,TRIM28、PLOD1和P4HA1的浓度各自均以ng/ml计。CEACAM5的浓度以pg/ml计。
如上所述,本发明的方法可以方便地是自动化的。特别地,基于所确定的蛋白质浓度值确定受试者是否患有结直肠癌的步骤可以由被编程为进行所述步骤的计算机处理器进行。在另一个实施方案中,确定(例如计算)蛋白质浓度的步骤(例如从所使用的测定中获得的值,即从测定输出值,推导出蛋白质浓度)还可以或可以另外地由被编程为进行所述步骤的计算机处理器进行。进一步地,测量蛋白质浓度的测定步骤的进行可以是自动化的。因此,所述测定可以在一个装置中进行,所述装置包括被编程为控制所述装置进行所述测定的计算机处理器。
测量或获得或计算蛋白质浓度的步骤可以由一台计算机处理器进行,而确定受试者是否患有结直肠癌的步骤可以由不同的计算机处理器进行。优选地,两个步骤都由被编程为进行这两个步骤的单个计算机处理器进行。
例如,测量蛋白质浓度的步骤可以是自动化的,使得可以将血液来源样品提供给由被编程为进行测量蛋白质浓度的步骤的计算机处理器控制的机器,从而一旦提供了样品,浓度确定步骤就由机器进行。例如,计算机处理器可以被编程以使得它通过机器控制定量ELISA的进行。用于进行自动化ELISA的机器是本领域已知的,包括例如ELISA NIMBUS(美国Hamilton公司)。
计算机处理器可以类似地被编程为进行蛋白质浓度的分析,以确定受试者是否患有结直肠癌。例如,计算机处理器可以被编程为基于所确定的蛋白质浓度进行上述分析以确定受试者是否患有结直肠癌。计算机处理器可以要求用户输入相关蛋白质浓度。或者,相关蛋白质浓度可以直接从测量步骤获得。例如,单个计算机处理器可以指导机器进行定量ELISA以测量蛋白质浓度(在向机器提供血液来源样品后),然后分析所确定的蛋白质浓度以确定受试者是否患有结直肠癌。
在另一方面,本发明提供了一种诊断和治疗受试者的结直肠癌的方法。如上所述进行结直肠癌的诊断。因此,诊断步骤包括本发明的诊断方法,但可以进一步包括额外的诊断测试,特别是结肠镜检查,并且有可能是疑似癌症的活检。如上所述,受试者可以是任何人类受试者。结直肠癌如上文所定义。
在本发明的该方法中,如果受试者被诊断为结直肠癌,则对该受试者给予结直肠癌的治疗。可以给予本领域已知的适合治疗结直肠癌的任何治疗。例如,治疗可以包括手术,以从受试者去除癌症。治疗可以包括放射治疗,其可以从外部(即从身体外部)或内部(即近距放射治疗)给予,由此将辐射源******并直接应用于癌症。治疗可以包括化学疗法,化学疗法可以通过任何适当的途径(例如口服或静脉内)给予。适用于结直肠癌的化疗药物包括5-氟尿嘧啶(5FU)、卡培他滨、奥沙利铂(任选与5FU或卡培他滨联合)和伊立替康(任选与5FU联合)。治疗可以包括免疫疗法,比如施用单克隆抗体。例如,可以施用检查点抑制剂。可以使用过继细胞疗法,例如WO 2017/194555公开了一种T-细胞受体,其可用于治疗显示出微卫星不稳定性的CRC。根据熟练医师鉴于受试者和癌症的特征的判断,可以使用这些疗法的任何组合。
根据癌症被诊断时的阶段,所给予的治疗可以是治愈性的(或旨在治愈性的)或姑息性的。根据标准医疗实践,可以给予任何癌症治疗。
值得注意的是,诊断结直肠癌并治疗其的步骤可以并且实际上很可能由不同的个体进行。例如,如上所述,血样可以由临床医生、护士或抽血医师从受试者获得。本发明的诊断步骤可以由例如病理学家或临床生物化学家进行,有可能使用上述自动化***进行。然后可以由医生例如外科医生或肿瘤学家给予治疗。
在另一方面,本发明提供了一种试剂盒,其包括一组用于确定样品中TRIM28、PLOD1和CEACAM5的存在或浓度的试剂。所述试剂盒可以进一步包括用于确定样品中P4HA1的存在或浓度的试剂。
在一个特定的实施方案中,样品是如上定义的血液来源样品。试剂优选单独提供,每种试剂在试剂盒内各自的单独容器中。试剂盒可以适用于上述诊断方法。该试剂盒可以提供在例如盒子或包装中,并且除了试剂之外还可以包含一组使用说明。
如上所述,用于确定给定蛋白质的存在或浓度的试剂可以是任何试剂或试剂的组或组合,其可用于专门检测该蛋白质(即,将其与样品中可能存在的其他蛋白质或分子区分开来)并确定样品中存在的蛋白质的量或水平。因此,一种或多种试剂可以对靶蛋白具有特异性,并且可以报告其在样品中的存在或不存在,或量。
在一个特定的实施方案中,试剂盒包括:
i)结合TRIM28或其片段的特异性结合剂;
ii)结合PLOD1或其片段的特异性结合剂;和
iii)结合CEACAM5或其片段的特异性结合剂。
“特异性结合剂”如上所定义。特异性结合剂可以分别结合TRIM28、PLOD1和CEACAM5的片段或部分。也就是说,每种特异性结合剂不需要全长靶蛋白来发生结合。相反,每种试剂也可以与其分子配偶体的片段特异性结合。显然,这并不意味着每种试剂会结合其分子配偶体的任何和每个片段。相反,每种特异性结合剂将结合其分子配偶体的包含其结合位点的任何片段。因此,例如如果特异性结合剂是抗体,它将结合其抗原的包含其表位的任何片段。
本发明的试剂盒可以进一步包含结合P4HA1或其片段的特异性结合剂。
在本发明的一个特定实施方案中,试剂盒中的每种特异性结合剂都是抗体。优选地,每种抗体都是单克隆抗体。在特定的实施方案中,特异性结合剂可以是如上所述的全长抗体的片段,优选全长单克隆抗体的片段。
本发明试剂盒的抗体可以来自任何物种。例如,抗体可以是人的,或者它们可以是非人的,例如,它们可以来自小鼠、大鼠、兔、山羊或任何其他通常或可以从中获得抗体的动物。试剂盒的抗体可以全部来自同一物种,或者可以来自不同物种。抗体可以是任何同种型,即IgG、IgE、IgM、IgA或IgD,并且可以是其同种型内的任何亚型,例如如果抗体是IgG抗体,则它可以是IgG1、IgG2、IgG3或IgG4亚型。抗体可以包含λ轻链或κ轻链。试剂盒中的抗体可以全部都是相同的同种型,或者可以是不同的同种型。
方便地,特异性结合剂可以与用于当特异性结合剂与其靶蛋白结合时检测所述特异性结合剂的手段一起提供,特别是可以将其与其他特异性结合蛋白区分开的手段。此类手段可以是任何报告子,即可以用于直接或间接提供可被检测的信号的任何部分或实体。因此,报告子可以直接或间接地发出信号。例如,报告子可以是可检测标记,例如可以被直接检测的可检测标记,例如光学或分光光度计可检测的标记,例如比色或荧光标记等,或放射性同位素,或量子点、纳米粒子等。或者,报告子可以通过进一步的反应或与进一步的成分缀合产生信号,或者它可以为可检测标记,或为其自身包含检测标记的进一步检测分子(例如为标记的检测探针),或为进一步的信号生成手段提供结合位点。
本发明的试剂盒可以用于进行ELISA,即该试剂盒可以是ELISA试剂盒。ELISA试剂盒包含针对每种抗原的检测抗体。检测抗体可以包含可检测标记。可检测标记如上所述。在一个代表性的实施方案中,检测抗体还可以包含共价缀合的生物素分子。试剂盒可以进一步包含与检测抗体特异性结合的二抗。如果检测抗体是生物素缀合物,则试剂盒可以包含含有可检测标记的亲和素或链霉亲和素构建体。或者,检测抗体可以包含亲和素或链霉亲和素标签,并且试剂盒进一步包含含有可检测标记的生物素构建体。
ELISA试剂盒可以优选地是夹心ELISA试剂盒。在这种情况下,试剂盒可以进一步包含针对每种抗原的捕获抗体。捕获抗体和检测抗体的兼容性要求如上所述。如果提供捕获抗体,则针对每种抗原所提供的捕获抗体和检测抗体形成匹配对。无论使用的抗体是抗体片段还是全长抗体,配对要求都同样适用。
ELISA试剂盒可以进一步包含一个或多个ELISA板。如果ELISA试剂盒是夹心ELISA试剂盒,则ELISA板优选具有预先固定在孔表面上的捕获抗体。孔还优选地被预先封闭。或者,可以在试剂盒中提供封闭剂(例如BSA)。
ELISA试剂盒可以进一步包含检测试剂,其适合于检测抗体或二抗上使用的可检测标记。与常见可检测标记一起使用的合适检测试剂如上所述。
ELISA试剂盒可以进一步包含纯化的TRIM28、PLOD1和CEACAM5,以及任选的P4HA1,用于标准品以生成标准曲线。这些可以以系列稀释的形式提供,或者以待用户连续稀释的储备溶液形式提供。这些蛋白质的纯化版本可以是可商购获得的,例如,重组TRIM28可从Abcam(英国)购买,产品编号ab131899。或者,可以使用本领域的标准技术克隆编码这些蛋白质的基因,并重组表达和纯化所述蛋白质。
本发明进一步提供了如上所述的试剂盒在结直肠癌诊断中的用途,其中所述诊断包括进行如上所述的本发明的方法。类似地,本发明提供了一种诊断结直肠癌的方法,包括使用如上所述的试剂盒以进行如上所述的诊断方法。类似地,本发明提供了一种诊断和治疗结直肠癌的方法,包括使用如上所述的试剂盒以进行如上所述的诊断方法,并且如果被进行所述诊断方法的受试者被诊断为结直肠癌,则向所述受试者给予如上所述的用于结直肠癌的治疗。特别地,本发明的ELISA试剂盒可以用于进行如上所述的定量夹心ELISA测定。
还提供了一种包含指令的计算机程序产品,当执行所述指令时将使处理器进行本发明的方法。计算机程序产品可以以存储计算机程序产品的有形计算机可读存储介质的形式提供,例如CD。此类计算机程序产品如上所述。
附图说明
通过参考以下非限制性实施例和附图,可以进一步理解本发明,其中:
图1显示了22个配对样本的分类准确度:结直肠癌肿瘤样本(CRC)和邻近组织(AT)。箱线图显示了以下所选蛋白质的CRC和AT组的判别函数得分(Hao等(Sci Rep 7:42436,2017)报告的百万分之一的单位[ppm]的总和):PLOD1、P4HA1、LCN2、GNS、C12orf10、P3H1、TRIM28、CEACAM5、MAD1L1。p值是使用双侧Wilcoxon符号秩检验计算的。框中的条代表中位数,第25和第75个百分位数,而须延伸至±2.7σ。
图2显示了96个配对样本的分类准确度:结直肠癌肿瘤样本(CRC)和邻近组织(AT)。箱线图显示了CRC和AT组的判别函数得分(2的针对以下所选蛋白质的CPTAC研究(见下文)中报告的非共享对数比率(Unshared Log Ratio)得分次方的总和:PLOD1、P4HA1、LCN2、GNS、C12orf10、P3H1、TRIM28、CEACAM5、MAD1L1)。使用双侧Wilcoxon符号秩检验对配对样本计算显著性p值,并且使用Wilcoxon秩和检验对未配对样本计算显著性p值。框中的条代表中位数,第25和第75个百分位数,而须延伸至±2.7σ。箱线图下方的数字表示每个类别的观察次数。(A)来自肿瘤(CRC)和AT的样本之间的区别。(B)分别在男性和女性中CRC和AT样本之间的区别。(C)根据组织学亚型的CRC和AT样本之间的区别。(D)根据肿瘤阶段的CRC和AT样本之间的区别。(E)根据种族的CRC和AT样本之间的区别。(F)根据既往结肠息肉病史的CRC和AT样本之间的区别。
图3显示了结直肠癌肿瘤样本(CRC)和邻近组织(AT)的分类准确度。箱线图显示了CRC和AT组的判别函数得分(2的针对以下所选蛋白质的CPTAC研究中报告的非共享对数比率得分次方的总和:PLOD1、P4HA1、LCN2、GNS、C12orf10、P3H1、TRIM28、CEACAM5、MAD1L1)。使用双侧Wilcoxon符号秩检验对配对样本计算显著性p值,并且使用Wilcoxon秩和检验对未配对样本计算显著性p值。框中的条代表中位数,第25和第75个百分位数,而须延伸至±2.7σ。箱线图下方的数字表示每个类别的观察次数。通过(A)BRAF基因分析结果;(B)种族;(C)NRAS突变的存在(研究中仅报告了一例没有NRAS突变的样本);(D)其他癌症病史;(E)MLH1表达;(F)MSH2表达;(G)MSH6表达;(H)KRAS突变的存在(研究中仅报告了一例没有KRAS突变的样本),来区分CRC和AT样本之间的区别。
图4显示了结直肠癌肿瘤样本(CRC)和邻近组织(AT)的分类准确度。箱线图显示了CRC和AT组的判别函数得分(2的针对以下所选蛋白质的CPTAC研究中报告的非共享对数比率得分次方的总和:PLOD1、P4HA1、LCN2、GNS、C12orf10、P3H1、TRIM28、CEACAM5、MAD1L1)。使用双侧Wilcoxon符号秩检验对配对样本计算显著性p值,并且使用Wilcoxon秩和检验对未配对样本计算显著性p值。框中的条代表中位数,第25和第75个百分位数,而须延伸至±2.7σ。箱线图下方的数字表示每个类别的观察次数。通过(A)有结直肠癌病史的一级亲属的数量;(B)PMS2表达来区分CRC和AT样本之间的区别。
图5显示了16个样本的分类准确度:早期结直肠癌肿瘤样本(CRC)、正常和发炎组织。(A)箱线图表示判别函数得分(基于九种感兴趣蛋白质的数据集中存在的四种蛋白质的总和:P4HA1、LCN2、C12orf10和TRIM28)。(B)在正常、发炎和早期CRC组织中的C12orf10表达差异。(C)在正常、发炎和早期CRC组织中的LCN2表达差异。(D)LCN2和C12orf10蛋白浓度的总和将正常和早期CRC组织样本分开。使用双侧Wilcoxon秩和检验计算显著性p值。框中的条代表中位数,第25和第75个百分位数,而须延伸至±2.7σ。箱线图下方的数字表示每个类别的观察次数。
图6显示了转录组分析数据集中的结直肠肿瘤(CRC)样本和邻近组织(AT)的分类准确度。(A)来自6个正常表面上皮样本、7个正常隐窝上皮样本、17个CRC样本、11个转移瘤和17个腺瘤(总共19个受试者)的结直肠样本的转录组分析。(B)54个正常结肠组织样本、186个CRC样本和49个息肉。(C)74个正常样本、来自三个不同研究的CRC样本(分别为n=4、288和52)、30个腺瘤、4个家族性增生性息肉病样本、47个溃疡性结肠炎样本和37个克罗恩病样本。使用双侧Wilcoxon秩和检验计算每个图的显著性p值。框中的条代表中位数,第25和第75个百分位数,而须延伸至±2.7σ。
图7显示了基于生物反应路径分析(Ingenuity Pathway Analysis),九种选定蛋白质高度相互关联并形成调节细胞死亡和增殖的网络模块。
图8显示了训练组中72名患者和72名对照样本的分类准确度。(A)箱线图表示基于用ELISA测量的血浆样品中蛋白质浓度的判别函数得分。判别函数得分计算为九种蛋白质的总和。框中的条代表中位数,第25和第75个百分位数,而须延伸至±2.7σ。(B)基于通过ELISA测量的患者和对照的血浆样品中九种蛋白质的浓度总和,为分类器获得的接受者操作特征曲线(Kinsella等,数据库2011:bar030)。最佳操作点(判别函数截止值)用圆圈标出,它对应的分值为-0.34。(C)箱线图显示了训练集中患者和对照的判别函数得分。选定的判别函数截止值用水平实线表示。每个点代表一个单独的样本。框中的条代表中位数,第25和第75个百分位数,而须延伸至±2.7σ。
图9显示了8名患者和对照样本的测试集中两种、三种或四种蛋白质的不同组合的分类准确度。箱线图表示基于测试组中患者和对照的血浆样品中通过ELISA测量的两种、三种或四种蛋白质组合的浓度的判别函数得分。显示以下蛋白质组合的结果:(A)TRIM28和PLOD1;(B)TRIM28、PLOD1和CEACAM5;以及(C)TRIM28、PLOD1、CEACAM5和P4HA1。判别函数得分计算为各自蛋白质浓度的总和。判别截止值用水平实线表示。点分别表示测试组中的患者和对照获得的值。框中的条代表中位数,第25和第75个百分位数,而须延伸至±2.7σ。对于两种蛋白质的组合,当将TRIM28和PLOD1的浓度相加时获得了最佳结果(灵敏度为88%,特异性为75%)。三种蛋白质的最佳组合产生了100%的灵敏度和88%的特异性(TRIM28、PLOD1和CEACAM5的总和)。然而,当使用四种蛋白质,即TRIM28、PLOD1、CEACAM5和P4HA1时,最佳样本分离是可能的(灵敏度和特异性均为100%)。
具体实施方式
实施例
在血液中可以被测量的针对CRC的蛋白质生物标志物是通过基于已公布的CRC组织和邻近组织(AT)的全基因组和全蛋白质组分析的荟萃分析的方法确定的。对于已公布的分析,参见Hao等(Sci Rep 7:42436,2017),Shiromizu等(同上),Quesada-Calvo等(ClinProteomics 14:9,2017)和Torrente等(PLoS ONE 11(6):e0157484,2016)。
发明人专注于差异表达的基因,根据人类蛋白质图谱(Petryszak等,NucleicAcids Res 44:D746-D752,2016),其蛋白质产物可能被释放到细胞外。为了确定有限数量的蛋白质的最佳组合(以及基于这些的诊断方法),发明人使用了他们的分类算法(Hellberg等,Cell Reports 16:2928-2939,2016)。最后,发明人使用来自新诊断的CRC患者和健康对照的血浆测试了已鉴定的生物标志物。
材料和方法
使用随机弹性网络的蛋白质优先级排序
为了对蛋白质进行排序,发明人分析了22名CRC患者——取自肿瘤和AT的配对样本(Hao等,同上)的蛋白质组分析数据。对于每种鉴定的蛋白质,倍数变化计算为结直肠肿瘤样本中的平均蛋白质表达除以AT中的平均蛋白质表达。从Hao等(同上)获得差异表达,通过配对t检验进行分析。对于使用随机弹性网络的生物标志物优先级排序,发明人预先选择了以下这些蛋白质:a)差异性表达的(使用Storey描述的程序进行多重校正调整),p值<0.01;b)在CRC肿瘤样本中上调的(倍数变化超过2倍)和c)根据人类蛋白质图谱(https://www.proteinatlas.org,2017年7月下载的数据)预测为分泌的。
113种满足上述标准的蛋白质使用随机弹性网络按其预测值进行排序。如Meinshausen等(Journal of the Royal Statistical Society:Series B(StatisticalMethodology)72:417-473,2010)所述,随机弹性网络是作为随机lasso的改进而实施。在这里,lasso被弹性网络替换。对于交叉验证中选择的λ和对于α=0.5,发明人通过为区间[1/α,1]中的每个预测因子(蛋白质)添加随机惩罚因子来排列数据。接下来,估算模型系数(弹性网络)。进行了100,000次排列。选择了在100,000次排列中的至少一次中具有非零系数的预测因子。对于下游分析,选择在至少45%的排列中选择的蛋白质(对应于9种蛋白质)。
样本分类
基于所选择的蛋白质,发明人构建了一个分类器,其中判别函数是所有九种蛋白质的表达总和。蛋白质组数据中的所有零都被NaN替换并被视为缺失值(使用了nansum())。为了计算ROC曲线下面积-AUC值-使用MATLAB函数perfcurve(),将结直肠肿瘤(CRC)样本作为阳性组,将邻近组织(AT)样本作为阴性组。为了获得显著性值,发明人对基于CRC和AT组的判别函数得分计算的得分,对配对样本进行了Wilcoxon符号秩检验并对非配对样本进行了Wilcoxon秩和检验。
为了测试所选择的蛋白质是否是比偶然获得的更好的CRC生物标志物,发明人从数据集中随机选择了九种上调的蛋白质,并重复计算AUC得分10,000次。排列p值是通过将随机AUC值与原始值进行比较来计算的。
独立数据集中的验证
为了测试所选的九种蛋白质,发明人在两个独立的、公开可用的蛋白质组数据集中重复了如上所述的分类和分类测试:
1)从101个个体(临床蛋白质组肿瘤分析联合会,CPTAC)获得的集。该集包含取自肿瘤部位(CRC)和邻近组织(AT)的样本。对于分类,发明人使用了2的所报告“非共享对数比率”得分次方。从分析中删除了未配对的样本;
2)从四个正常粘膜样本、四个发炎的粘膜样本和八个早期癌症样本中获得的集(ProteomeXchange数据集PXD005735)。此外,发明人分析了编码所选蛋白质的九种基因的转录组分析是否可以区分CRC和AT。发明人分析了以下数据集:
1)EGEOD-77955:6个正常表面上皮,7个正常隐窝上皮,17个CRC,11个转移瘤,17个腺瘤样本(共19个受试者);
2)E-GEOD-41258:54个正常结肠组织,186个CRC,49个息肉样本;
3)E-MTAB-3732,它聚集并标准化了来自健康和患病结直肠组织的不同研究的微阵列数据集。这包括74个健康结肠组织,来自4、288和52名患者的三项研究的CRC,30个腺瘤,4个家族性增生性息肉病和47个溃疡性结肠炎。
判别分数和临床数据
在由100个个体组成的公开可用数据集(CPTAC)中,发明人还测试了判别得分是否受性别、组织学亚型、既往息肉病史或种族的影响。当样本被配对时使用Wilcoxon符号秩检验进行分析,否则在特定样本亚组之间使用Wilcoxon秩和检验。
来自CRC患者和健康对照的血浆样品的ELISA
招募了来自瑞典东南部的80名CRC患者(40名女性和40名男性,平均年龄为71.8岁(范围34-89岁)),这些患者在瑞典延雪平县延雪平县地区外科护理部外科部(Departmentof Surgery,Division of Surgical Care,Region
Figure BDA0003474827530000171
County,
Figure BDA0003474827530000172
Sweden)接受了原发性CRC的手术切除术。CRC患者的肿瘤位于结肠(n=37)或直肠(n=43),TNM分期为I-IV(I=13、II=34、III=29和IV=4)。对照组由80名健康献血者(40名女性和40名男性,平均年龄55.9岁(范围33-67岁))组成,没有已知的CRC病史,并且来自与癌症患者相同的地理区域。
采集静脉血样并在采集后1小时内离心以分离血浆和血细胞。血浆样品在实验室服务生物库中在-80℃下储存直到分析,注册号为868,地区瑞典延雪平延雪平县。该研究得到了位于林雪平的区域伦理审查委员会(瑞典林雪平)的审查和批准(98113和2013/271-31)。本研究中所包括的所有患者都给予了在研究中使用他们的材料的知情书面同意书。根据制造商的说明,使用商品化酶联免疫吸附测定(ELISA)分析了九种潜在生物标志物的血浆水平:C12orf10(MyBiosource,Inc.,美国加利福尼亚州圣地亚哥)、CEACAM5(LifeSpanBioSciences,Inc.,美国华盛顿州西雅图)、GNS(MyBiosource,Inc.)、LCN2(Aviva SystemsBiology Corp.,美国加利福尼亚州圣地亚哥)、MAD1L1(Abbexa Ltd.,英国剑桥)、P3H1(Abbexa Ltd.)、P4HA1(Signalway Antibody LLC,美国马里兰州巴尔的摩)、PLOD1(AvivaSystems Biology Corp.)和TRIM28(MyBiosource,Inc.)。使用Sunrise Tecan酶标仪(Tecan Austria GmbH,奥地利萨尔斯堡)和Magellan 7.×2010软件(Tecan AustriaGmbH)测定了九种潜在生物标志物的蛋白质水平。C12orf10、GNS、LCN2、MAD1L1、P4HA1、PLOD1和TRIM28的蛋白质水平表示为纳克每毫升(ng/mL)。CEACAM5和P3H1的蛋白质水平表示为皮克每毫升(pg/mL)。如果蛋白质值超出ELISA试剂盒检测限,为了计算,我们假定ELISA试剂盒最大检测限或值为0,视情况而定。
已鉴定的九种蛋白质的网络分析
生物反应路径分析(Ingenuity Pathway Analysis,IPA)软件(Qiagen,德国希尔登)用于测试这九种蛋白质是否属于同一网络模块的一部分。IPA的亚网络形成过程如下:首先,所有与九种蛋白质有直接或间接相互作用的基因作为“种子”来生成网络。这些焦点基因被组合到网络中以将它们的特定相互连结性最大化(焦点基因之间的连接性与它们与IPA全球网络中其他基因的相互作用数量相比)。添加了来自IPA全球网络的其他基因,以连接由焦点基因形成的较小网络。最后,基于它们包含的焦点基因的数量对生成的网络进行评分-得分越高,在给定网络中随机找到该数量的焦点基因的概率越低。
样本分离为训练集和测试集
对于九种单独蛋白质中的每一种,发明人使用双侧Wilcoxon秩和检验来测试它们在患者和对照之间的表达是否显著不同。接下来,发明人对所有九种蛋白质的表达求和以获得判别函数得分并计算AUC(如之前的,MATLAB perfcurve()函数用于该目的)。尽管基于组织样本(蛋白质组分析),所有九种蛋白质在患者样本中都应该被上调,但在血浆样品中,与对照相比,患者中的一些蛋白质实际上被下调。因此,这些蛋白质的浓度从判别函数得分中减去,而不是相加。使用双侧Wilcoxon秩和检验计算P值。接下来,发明人旨在减少分类器良好运行所需的蛋白质数量。对于这些分析,10%的患者样本(n=8)和10%的对照样本(n=8)被随机选择作为测试组,并从初始分析中排除,其中发明人尝试了所测量的蛋白质的不同组合。使用MATLAB函数perfcurve()选择最佳操作点(判别截止值)。这是基于从点(0,1)移动一条直线,斜率定义为:
Figure BDA0003474827530000181
其与ROC曲线相交。这里TP、FP、TN和FN分别是真阳性、假阳性、真阴性和假阴性,分类成本表示为Cost()。由于最重要的是降低假阴性(将患者分类为健康对照)概率,因此发明人假设TN和TP分类成本为零,阳性类错误分类成本为0.8,阴性类错误分类成本为0.2。
测试组的分类
最后,使用如上所述构建的分类器,发明人对排除的患者和对照的样本进行分类,计算准确度、灵敏度和特异性,以及p值(p值是使用双侧Wilcoxon秩和检验基于对患者和对照之间的排除样本获得的判别函数得分计算的)。
结果
生物标志物选择
为了将蛋白质作为CRC的推定生物标志物进行排序,发明人分析了从22名受试者收集的CRC样本和配对AT样本的公开可用蛋白质组分析(Hao等,同上)。首先,发明人预选的蛋白质是:
a)差异性表达的(针对多重检验进行校正,基于配对t检验p值<0.01来定义);
b)与AT样本相比在CRC样本中上调的(倍数变化>2);并且
C)根据人类蛋白质图谱预测为分泌的。
发明人鉴定了113种这样的蛋白质。使用随机弹性网络(材料和方法),发明人根据其预测值对蛋白质进行排序以区分CRC和AT。为了进一步分析,发明人选择了前九种蛋白质:PLOD1(Q02809)、P4HA1(P13674)、LCN2(P80188)、GNS(P15586)、C12orf10(Q9HB07)、P3H1(Q32P28)、TRIM28(Q13263)、CEACAM5(P06731)和MAD1L1(Q9Y6D9);(随机弹性网络频率>0.45;材料和方法)。发明人发现这九种蛋白质的表达值的总和以高准确度区分CRC和AT(接受者操作特征曲线下的面积AUC=1,Wilcoxon符号秩检验p=4.0×10-5;图1)。这显著高于当使用九种随机蛋白质时(排列检验p<1.0×10-4,OR=1.66)。在这9种蛋白质中,有3种在之前被报告为可能的CRC生物标志物;即CEACAM5(通常称为CEA)、LCN2和TRIM28(Shiromizu等,同上)。
独立蛋白质组数据集中的生物标志物测试
为了评估我们结果的可重复性,发明人分析了两个独立的、公开可用的CRC蛋白质组分析数据集。首先,发明者分析了一个由101个个体组成的数据集——该数据由国家癌症研究所临床蛋白质组肿瘤分析联合会(CPTAC)生成。数据由从肿瘤部位(CRC)和AT获得的96个配对样本组成。其次,发明人验证了所选择的九种蛋白质可以将肿瘤样本与AT分开。发明人获得了近乎完美的分类准确度(AUC=0.99,Wilcoxon符号秩检验p=1.8×10-17,图2A),高于九种随机选择的蛋白质偶然获得的分类准确度(排列检验p=1.0×10-4,OR=2.21)。
在CPTAC研究中,作者报告了包括性别、种族、组织学亚型和既往结肠息肉病史在内的临床数据。因此,发明人测试了这些协变量中的任何一个是否对样本分类有影响(图2B-F、图3和图4)。发明人发现仅在粘液性和非粘液性肿瘤之间(Wilcoxon秩和检验p=0.046;图2C);病理性肿瘤I期和III期(双侧Wilcoxon秩和检验p=0.049;图2D);来自肿瘤II期和IV期患者的AT样本(Wilcoxon秩和检验p=0.02,图2D);种族之间——黑人/非裔美国人患者相对于亚洲人或白人患者(分别为p值=0.008和0.002,图2E);MHL1和PMS2的表达或不表达(分别为Wilcoxon秩和检验p=0.02,图3E;和p=0.008,图4B),判别函数得分存在显著差异。此外,发明人测试了病理性肿瘤分期和判别函数得分之间的相关性并且没有发现显著相关性(Pearson PCC=0.12,p=0.12)。然而,如图2所示,这些协变量对整体分类准确度没有显著影响。
然后,发明人测试了另一个由76个组织样本组成的蛋白质组数据集,其中汇集了4到5个患者样本消化。总的来说,对八个来自CRC早期阶段的结直肠组织样本的集合、八个明显正常组织(在手术切缘)样本的集合和四个发炎粘膜样本的集合进行了蛋白质组学分析(Quesada-Calvo等,同上)。该数据集仅包含九个选定的推定生物标志物中的四个:P4HA1(P13674)、LCN2(P80188)、C12orf10(Q9HB07)和TRIM28(Q13263)。出于这个原因,基于这四个暂定的CRC生物标志物的总和创建了一个新的分类器,该分类器在区分早期CRC与正常组织方面具有高的分类准确度(AUC=0.91,Wilcoxon秩和检验,未配对样本,p=0.03,图5A)。发明人还发现正常组织和发炎组织之间存在显著差异(Wilcoxon秩和检验p=0.03,图5A)。然而,四种蛋白质的组合并没有产生比四种随机蛋白质偶然预期更高的AUC得分(p=0.08,OR=1.68)。因此,发明人提出了一个问题,单个蛋白质是否可以区分正常组织和肿瘤组织。发明人发现LCN2和C12orf10在两种情况下有区别(两种蛋白质的AUC=0.97,Wilcoxon秩和检验p=0.008),这高于随机单基因分类器的偶然预期(两种蛋白质的排列检验p=0.03,OR=1.86;图5B、C)。这两种蛋白质的组合提供了更高的分类准确度(AUC=1,Wilcoxon秩和检验p=0.004;图5D),其高于两种随机蛋白质的预期(排列检验p=1.0×10-4,OR=1.9)。这表明九种蛋白质的子集可能足以对患者和对照进行高度准确的分类。
独立转录组学数据集中的生物标志物测试
发明人还测试了CRC的3项转录组分析研究。如果选定的九种基因中的一些基因在测试数据集中没有表达,则使用表达的基因构建分类器。首先,发明人分析了由6个正常表面上皮样本、7个正常隐窝上皮样本、17个CRC样本、11个转移瘤和17个腺瘤样本组成的数据集(总共19个受试者;EGEOD-77955)。该数据集缺乏C12orf10基因表达的细节。因此,发明人基于剩余的八种基因创建了分类器。当将正常隐窝上皮样本与CRC、转移瘤和腺瘤样本进行比较时,发明人获得了高分类准确度(AUC>0.95,Wilcoxon秩和检验p<6.1×10-4;图6A;表1)。然而,与正常表面样本相比,没有获得良好的组分离(AUC<0.43,Wilcoxon秩和检验p>0.25;图6A;表1)。
Figure BDA0003474827530000201
表1. 6个正常表面上皮样本和7个正常隐窝上皮样本相比于17个CRC、11个转移瘤和17个腺瘤样本分别在接受者操作特征下的分类面积(Price等,Nat Biotechnol 35:747-756,2017)。使用双侧Wilcoxon秩和检验(p)计算显著性。
类似地,在另一项测试的转录组分析研究(E-GEOD-41258)中,发明人获得了良好的组间分离(AUC>0.77,Wilcoxon秩和检验p<3.4×10-10;图6B;表2)。在此,发明人比较了54个正常结肠组织样本与186个原发性CRC和49个息肉样本。该数据集也缺乏C12orf10的表达谱,因此使用剩余的八种基因进行分类。
原发性CRC 息肉
AUC 0.78 0.96
P 3.3×10<sup>-10</sup> 1.2×10<sup>-15</sup>
表2. 54个正常结肠组织相比于186个原发性CRC和49个息肉样本在接受者操作特征(Price等,同上)下的分类面积。使用双侧Wilcoxon秩和检验(p)计算显著性。
最后,发明人分析了数据集(E-MTAB-3732),该数据集聚集并标准化了来自74个健康组织的结直肠样本、三项CRC研究(分别为n=4、288和52)、4个家族性增生性息肉病样本、30个结直肠腺瘤、47个溃疡性结肠炎样本和37个克罗恩病样本的微阵列数据。对所有九种暂定的生物标志物进行了分析。在该数据集中,将正常结直肠组织样本与其他组进行比较。对于大多数比较,这产生了高分离度(AUC>0.82;Wilcoxon秩和检验p<0.002;图6C;表3)。发明人还发现正常组织与CRC之间存在显著差异(中等分离AUC=0.78,Wilcoxon秩和检验p=1.3×10-7)。然而,分类器无法区分正常结直肠组织和家族性增生性息肉病(AUC=0.42,Wilcoxon秩和检验p=0.59)。
Figure BDA0003474827530000211
表3. 74个正常样本相比于37个克罗恩病样本、三项CRC研究(分别为n=4例结肠肿瘤、288例结直肠腺癌和52例结直肠癌)、30个结直肠腺瘤、4个家族性增生性息肉病样本和47个溃疡性结肠炎样本在接受者操作特征(Price等,同上)下的分类面积。使用双侧Wilcoxon秩和检验(p)计算显著性。
总之,转录组分析数据的分析表明,所选择的九个暂定的CRC生物标志物可以将结直肠肿瘤样本与明显正常的样本分开。
网络分析支持九种蛋白质的致病相关性
为了测试生物标志物的致病相关性,发明人进行了如前所述的生物反应路径分析(Gustafsson等,Science Translational Medicine 7(313):313ra178,2015)。简而言之,该方法的背景是与同一疾病相关的蛋白质往往在功能上相关并相互作用,形成网络模块(Tan等,Curr Colorect Canc R 12:151-161,2016)。因此,如果蛋白质确实相互作用,这将支持它们的致病和生物标志物相关性。事实上,发明人发现这九种蛋白质确实形成了一个网络模块,其具有压倒性的功能,即调节细胞死亡和增殖(图7)。
来自CRC患者和健康对照的血浆样本中9种潜在蛋白质生物标志物的分析
本发明人继续测试从80名CRC患者和80名对照获得的血浆样本中的所有九种选择的生物标志物。发现,患者和对照之间有七种蛋白质存在显著差异:PLOD1,中位数10(0-10)相比于0.19(0-7.9)ng/mL,p=1.19×10-21;LCN2,2.0(0-10)相比于2.3(1.3-4.2)ng/mL,p=4.84×10-2;MAD1L1,0(0-3.1)相比于0(0-10)ng/mL,p=2.73×10-2;CEACAM5,0(0-0.45)相比于0(0-3.8)pg/mL,p=1.52×10-3;P4HA1,3.7(0-17)相比于5.9(1.4-22)ng/mL,p=4.88×10-6;TRIM28,0(0-0.82)相比于1.14(0-20)ng/mL,p=1.00×10-27;和GNS,7.1(2.8-13)相比于10(5.3-14)ng/mL,p=1.05×10-14。相比之下,C12orf10,1.6(0.1-11)相比于1.6(0.58-20)pg/mL,p=4.07×10-1和P3H1,7.8(0-86)相比于5.9(0-586)pg/mL,p=1.28×10-1(双侧Wilcoxon秩和检验)没有发现显著差异。尽管其中7种蛋白质在患者和对照之间存在显著差异,但它们表现出相当大的可变性。这表明,就其本身而言,没有一种蛋白质足以作为早期诊断的潜在生物标志物。然后测试所有九种蛋白质的组合以确定该组合是否以高准确度将患者和对照分开。出于该目的,发明人如前所述计算了AUC和p值(双侧Wilcoxon秩和检验p=1.62×10-19;图8)。虽然p值非常显著,但患者和对照之间仍存在一些重叠,导致92%的特异性和90%的灵敏度。
然后测试更少数量的蛋白质的组合。首先,在由随机选择的72名患者和72名对照组成的训练集中测试了9种蛋白质的所有可能组合。如上所述,蛋白质的最佳组合和基于这些的诊断方法是使用发明人的分类算法确定的。基于训练集,两种蛋白质的最佳组合利用了TRIM28和PLOD1;三种蛋白质的最佳组合利用了TRIM28、PLOD1和CEACAM5;四种蛋白质的最佳组合利用了TRIM28、PLOD1、CEACAM5和P4HA1。然后在由其余8名患者和8名对照组成的测试集中对鉴定的组合进行测试(图9)。如图所示,两种蛋白质的组合产生的分类准确度为81%(灵敏度为88%,特异性为75%)。三种蛋白质的组合是更优的,分类准确度为94%(灵敏度100%,特异性88%),而四种蛋白质的组合显示了100%的准确度。相对于现有方法,三种和四种蛋白质的组合尤其显著提高了CRC筛查的准确度。重要的是,两者都显示100%的灵敏度,表明假阴性可以降到最低。
确定了通过分类算法应用的诊断方法。对于基于三种蛋白质的方法,确定了进行以下诊断方法:
i)如果TRIM28的浓度大于0.27ng/ml,则受试者不患有结直肠癌;
ii)如果TRIM28的浓度小于或等于0.27ng/ml并且PLOD1的浓度大于或等于1.69ng/ml,则受试者患有结直肠癌;
iii)如果TRIM28的浓度小于或等于0.27ng/ml、PLOD1的浓度小于1.69ng/ml并且CEACAM5的浓度大于或等于0.125pg/ml,则受试者患有结直肠癌;和
iv)如果TRIM28的浓度小于或等于0.27ng/ml、PLOD1的浓度小于1.69ng/ml并且CEACAM5的浓度小于0.125pg/ml,则受试者不患有结直肠癌。
对于基于四种蛋白质的方法,确定了进行以下诊断方法:
i)如果(6.7×[TRIM28])-(0.65×[PLOD1])-(13.13×[CEACAM5])+(0.43×[P4HA1])-2.21小于零,则受试者患有结直肠癌;和
ii)如果(6.7×[TRIM28])-(0.65×[PLOD1])-(13.13×[CEACAM5])+(0.43×[P4HA1])-2.21大于或等于零,则受试者不患有结直肠症。在该方法中,蛋白质浓度按以下单位使用:TRIM28、PLOD1和P4HA1以ng/ml计,CEACAM5以pg/ml计。
序列表
<110> 马瓦塔公司
<120> 用于诊断结直肠癌的方法
<130> FSP1V214043ZX
<150> GB 1907663.7
<151> 2019-05-30
<160> 4
<170> PatentIn version 3.5
<210> 1
<211> 835
<212> PRT
<213> 智人(Homo sapiens)
<400> 1
Met Ala Ala Ser Ala Ala Ala Ala Ser Ala Ala Ala Ala Ser Ala Ala
1 5 10 15
Ser Gly Ser Pro Gly Pro Gly Glu Gly Ser Ala Gly Gly Glu Lys Arg
20 25 30
Ser Thr Ala Pro Ser Ala Ala Ala Ser Ala Ser Ala Ser Ala Ala Ala
35 40 45
Ser Ser Pro Ala Gly Gly Gly Ala Glu Ala Leu Glu Leu Leu Glu His
50 55 60
Cys Gly Val Cys Arg Glu Arg Leu Arg Pro Glu Arg Glu Pro Arg Leu
65 70 75 80
Leu Pro Cys Leu His Ser Ala Cys Ser Ala Cys Leu Gly Pro Ala Ala
85 90 95
Pro Ala Ala Ala Asn Ser Ser Gly Asp Gly Gly Ala Ala Gly Asp Gly
100 105 110
Thr Val Val Asp Cys Pro Val Cys Lys Gln Gln Cys Phe Ser Lys Asp
115 120 125
Ile Val Glu Asn Tyr Phe Met Arg Asp Ser Gly Ser Lys Ala Ala Thr
130 135 140
Asp Ala Gln Asp Ala Asn Gln Cys Cys Thr Ser Cys Glu Asp Asn Ala
145 150 155 160
Pro Ala Thr Ser Tyr Cys Val Glu Cys Ser Glu Pro Leu Cys Glu Thr
165 170 175
Cys Val Glu Ala His Gln Arg Val Lys Tyr Thr Lys Asp His Thr Val
180 185 190
Arg Ser Thr Gly Pro Ala Lys Ser Arg Asp Gly Glu Arg Thr Val Tyr
195 200 205
Cys Asn Val His Lys His Glu Pro Leu Val Leu Phe Cys Glu Ser Cys
210 215 220
Asp Thr Leu Thr Cys Arg Asp Cys Gln Leu Asn Ala His Lys Asp His
225 230 235 240
Gln Tyr Gln Phe Leu Glu Asp Ala Val Arg Asn Gln Arg Lys Leu Leu
245 250 255
Ala Ser Leu Val Lys Arg Leu Gly Asp Lys His Ala Thr Leu Gln Lys
260 265 270
Ser Thr Lys Glu Val Arg Ser Ser Ile Arg Gln Val Ser Asp Val Gln
275 280 285
Lys Arg Val Gln Val Asp Val Lys Met Ala Ile Leu Gln Ile Met Lys
290 295 300
Glu Leu Asn Lys Arg Gly Arg Val Leu Val Asn Asp Ala Gln Lys Val
305 310 315 320
Thr Glu Gly Gln Gln Glu Arg Leu Glu Arg Gln His Trp Thr Met Thr
325 330 335
Lys Ile Gln Lys His Gln Glu His Ile Leu Arg Phe Ala Ser Trp Ala
340 345 350
Leu Glu Ser Asp Asn Asn Thr Ala Leu Leu Leu Ser Lys Lys Leu Ile
355 360 365
Tyr Phe Gln Leu His Arg Ala Leu Lys Met Ile Val Asp Pro Val Glu
370 375 380
Pro His Gly Glu Met Lys Phe Gln Trp Asp Leu Asn Ala Trp Thr Lys
385 390 395 400
Ser Ala Glu Ala Phe Gly Lys Ile Val Ala Glu Arg Pro Gly Thr Asn
405 410 415
Ser Thr Gly Pro Ala Pro Met Ala Pro Pro Arg Ala Pro Gly Pro Leu
420 425 430
Ser Lys Gln Gly Ser Gly Ser Ser Gln Pro Met Glu Val Gln Glu Gly
435 440 445
Tyr Gly Phe Gly Ser Gly Asp Asp Pro Tyr Ser Ser Ala Glu Pro His
450 455 460
Val Ser Gly Val Lys Arg Ser Arg Ser Gly Glu Gly Glu Val Ser Gly
465 470 475 480
Leu Met Arg Lys Val Pro Arg Val Ser Leu Glu Arg Leu Asp Leu Asp
485 490 495
Leu Thr Ala Asp Ser Gln Pro Pro Val Phe Lys Val Phe Pro Gly Ser
500 505 510
Thr Thr Glu Asp Tyr Asn Leu Ile Val Ile Glu Arg Gly Ala Ala Ala
515 520 525
Ala Ala Thr Gly Gln Pro Gly Thr Ala Pro Ala Gly Thr Pro Gly Ala
530 535 540
Pro Pro Leu Ala Gly Met Ala Ile Val Lys Glu Glu Glu Thr Glu Ala
545 550 555 560
Ala Ile Gly Ala Pro Pro Thr Ala Thr Glu Gly Pro Glu Thr Lys Pro
565 570 575
Val Leu Met Ala Leu Ala Glu Gly Pro Gly Ala Glu Gly Pro Arg Leu
580 585 590
Ala Ser Pro Ser Gly Ser Thr Ser Ser Gly Leu Glu Val Val Ala Pro
595 600 605
Glu Gly Thr Ser Ala Pro Gly Gly Gly Pro Gly Thr Leu Asp Asp Ser
610 615 620
Ala Thr Ile Cys Arg Val Cys Gln Lys Pro Gly Asp Leu Val Met Cys
625 630 635 640
Asn Gln Cys Glu Phe Cys Phe His Leu Asp Cys His Leu Pro Ala Leu
645 650 655
Gln Asp Val Pro Gly Glu Glu Trp Ser Cys Ser Leu Cys His Val Leu
660 665 670
Pro Asp Leu Lys Glu Glu Asp Gly Ser Leu Ser Leu Asp Gly Ala Asp
675 680 685
Ser Thr Gly Val Val Ala Lys Leu Ser Pro Ala Asn Gln Arg Lys Cys
690 695 700
Glu Arg Val Leu Leu Ala Leu Phe Cys His Glu Pro Cys Arg Pro Leu
705 710 715 720
His Gln Leu Ala Thr Asp Ser Thr Phe Ser Leu Asp Gln Pro Gly Gly
725 730 735
Thr Leu Asp Leu Thr Leu Ile Arg Ala Arg Leu Gln Glu Lys Leu Ser
740 745 750
Pro Pro Tyr Ser Ser Pro Gln Glu Phe Ala Gln Asp Val Gly Arg Met
755 760 765
Phe Lys Gln Phe Asn Lys Leu Thr Glu Asp Lys Ala Asp Val Gln Ser
770 775 780
Ile Ile Gly Leu Gln Arg Phe Phe Glu Thr Arg Met Asn Glu Ala Phe
785 790 795 800
Gly Asp Thr Lys Phe Ser Ala Val Leu Val Glu Pro Pro Pro Met Ser
805 810 815
Leu Pro Gly Ala Gly Leu Ser Ser Gln Glu Leu Ser Gly Gly Pro Gly
820 825 830
Asp Gly Pro
835
<210> 2
<211> 727
<212> PRT
<213> 智人(Homo sapiens)
<400> 2
Met Arg Pro Leu Leu Leu Leu Ala Leu Leu Gly Trp Leu Leu Leu Ala
1 5 10 15
Glu Ala Lys Gly Asp Ala Lys Pro Glu Asp Asn Leu Leu Val Leu Thr
20 25 30
Val Ala Thr Lys Glu Thr Glu Gly Phe Arg Arg Phe Lys Arg Ser Ala
35 40 45
Gln Phe Phe Asn Tyr Lys Ile Gln Ala Leu Gly Leu Gly Glu Asp Trp
50 55 60
Asn Val Glu Lys Gly Thr Ser Ala Gly Gly Gly Gln Lys Val Arg Leu
65 70 75 80
Leu Lys Lys Ala Leu Glu Lys His Ala Asp Lys Glu Asp Leu Val Ile
85 90 95
Leu Phe Ala Asp Ser Tyr Asp Val Leu Phe Ala Ser Gly Pro Arg Glu
100 105 110
Leu Leu Lys Lys Phe Arg Gln Ala Arg Ser Gln Val Val Phe Ser Ala
115 120 125
Glu Glu Leu Ile Tyr Pro Asp Arg Arg Leu Glu Thr Lys Tyr Pro Val
130 135 140
Val Ser Asp Gly Lys Arg Phe Leu Gly Ser Gly Gly Phe Ile Gly Tyr
145 150 155 160
Ala Pro Asn Leu Ser Lys Leu Val Ala Glu Trp Glu Gly Gln Asp Ser
165 170 175
Asp Ser Asp Gln Leu Phe Tyr Thr Lys Ile Phe Leu Asp Pro Glu Lys
180 185 190
Arg Glu Gln Ile Asn Ile Thr Leu Asp His Arg Cys Arg Ile Phe Gln
195 200 205
Asn Leu Asp Gly Ala Leu Asp Glu Val Val Leu Lys Phe Glu Met Gly
210 215 220
His Val Arg Ala Arg Asn Leu Ala Tyr Asp Thr Leu Pro Val Leu Ile
225 230 235 240
His Gly Asn Gly Pro Thr Lys Leu Gln Leu Asn Tyr Leu Gly Asn Tyr
245 250 255
Ile Pro Arg Phe Trp Thr Phe Glu Thr Gly Cys Thr Val Cys Asp Glu
260 265 270
Gly Leu Arg Ser Leu Lys Gly Ile Gly Asp Glu Ala Leu Pro Thr Val
275 280 285
Leu Val Gly Val Phe Ile Glu Gln Pro Thr Pro Phe Val Ser Leu Phe
290 295 300
Phe Gln Arg Leu Leu Arg Leu His Tyr Pro Gln Lys His Met Arg Leu
305 310 315 320
Phe Ile His Asn His Glu Gln His His Lys Ala Gln Val Glu Glu Phe
325 330 335
Leu Ala Gln His Gly Ser Glu Tyr Gln Ser Val Lys Leu Val Gly Pro
340 345 350
Glu Val Arg Met Ala Asn Ala Asp Ala Arg Asn Met Gly Ala Asp Leu
355 360 365
Cys Arg Gln Asp Arg Ser Cys Thr Tyr Tyr Phe Ser Val Asp Ala Asp
370 375 380
Val Ala Leu Thr Glu Pro Asn Ser Leu Arg Leu Leu Ile Gln Gln Asn
385 390 395 400
Lys Asn Val Ile Ala Pro Leu Met Thr Arg His Gly Arg Leu Trp Ser
405 410 415
Asn Phe Trp Gly Ala Leu Ser Ala Asp Gly Tyr Tyr Ala Arg Ser Glu
420 425 430
Asp Tyr Val Asp Ile Val Gln Gly Arg Arg Val Gly Val Trp Asn Val
435 440 445
Pro Tyr Ile Ser Asn Ile Tyr Leu Ile Lys Gly Ser Ala Leu Arg Gly
450 455 460
Glu Leu Gln Ser Ser Asp Leu Phe His His Ser Lys Leu Asp Pro Asp
465 470 475 480
Met Ala Phe Cys Ala Asn Ile Arg Gln Gln Asp Val Phe Met Phe Leu
485 490 495
Thr Asn Arg His Thr Leu Gly His Leu Leu Ser Leu Asp Ser Tyr Arg
500 505 510
Thr Thr His Leu His Asn Asp Leu Trp Glu Val Phe Ser Asn Pro Glu
515 520 525
Asp Trp Lys Glu Lys Tyr Ile His Gln Asn Tyr Thr Lys Ala Leu Ala
530 535 540
Gly Lys Leu Val Glu Thr Pro Cys Pro Asp Val Tyr Trp Phe Pro Ile
545 550 555 560
Phe Thr Glu Val Ala Cys Asp Glu Leu Val Glu Glu Met Glu His Phe
565 570 575
Gly Gln Trp Ser Leu Gly Asn Asn Lys Asp Asn Arg Ile Gln Gly Gly
580 585 590
Tyr Glu Asn Val Pro Thr Ile Asp Ile His Met Asn Gln Ile Gly Phe
595 600 605
Glu Arg Glu Trp His Lys Phe Leu Leu Glu Tyr Ile Ala Pro Met Thr
610 615 620
Glu Lys Leu Tyr Pro Gly Tyr Tyr Thr Arg Ala Gln Phe Asp Leu Ala
625 630 635 640
Phe Val Val Arg Tyr Lys Pro Asp Glu Gln Pro Ser Leu Met Pro His
645 650 655
His Asp Ala Ser Thr Phe Thr Ile Asn Ile Ala Leu Asn Arg Val Gly
660 665 670
Val Asp Tyr Glu Gly Gly Gly Cys Arg Phe Leu Arg Tyr Asn Cys Ser
675 680 685
Ile Arg Ala Pro Arg Lys Gly Trp Thr Leu Met His Pro Gly Arg Leu
690 695 700
Thr His Tyr His Glu Gly Leu Pro Thr Thr Arg Gly Thr Arg Tyr Ile
705 710 715 720
Ala Val Ser Phe Val Asp Pro
725
<210> 3
<211> 702
<212> PRT
<213> 智人(0Homo sapiens)
<400> 3
Met Glu Ser Pro Ser Ala Pro Pro His Arg Trp Cys Ile Pro Trp Gln
1 5 10 15
Arg Leu Leu Leu Thr Ala Ser Leu Leu Thr Phe Trp Asn Pro Pro Thr
20 25 30
Thr Ala Lys Leu Thr Ile Glu Ser Thr Pro Phe Asn Val Ala Glu Gly
35 40 45
Lys Glu Val Leu Leu Leu Val His Asn Leu Pro Gln His Leu Phe Gly
50 55 60
Tyr Ser Trp Tyr Lys Gly Glu Arg Val Asp Gly Asn Arg Gln Ile Ile
65 70 75 80
Gly Tyr Val Ile Gly Thr Gln Gln Ala Thr Pro Gly Pro Ala Tyr Ser
85 90 95
Gly Arg Glu Ile Ile Tyr Pro Asn Ala Ser Leu Leu Ile Gln Asn Ile
100 105 110
Ile Gln Asn Asp Thr Gly Phe Tyr Thr Leu His Val Ile Lys Ser Asp
115 120 125
Leu Val Asn Glu Glu Ala Thr Gly Gln Phe Arg Val Tyr Pro Glu Leu
130 135 140
Pro Lys Pro Ser Ile Ser Ser Asn Asn Ser Lys Pro Val Glu Asp Lys
145 150 155 160
Asp Ala Val Ala Phe Thr Cys Glu Pro Glu Thr Gln Asp Ala Thr Tyr
165 170 175
Leu Trp Trp Val Asn Asn Gln Ser Leu Pro Val Ser Pro Arg Leu Gln
180 185 190
Leu Ser Asn Gly Asn Arg Thr Leu Thr Leu Phe Asn Val Thr Arg Asn
195 200 205
Asp Thr Ala Ser Tyr Lys Cys Glu Thr Gln Asn Pro Val Ser Ala Arg
210 215 220
Arg Ser Asp Ser Val Ile Leu Asn Val Leu Tyr Gly Pro Asp Ala Pro
225 230 235 240
Thr Ile Ser Pro Leu Asn Thr Ser Tyr Arg Ser Gly Glu Asn Leu Asn
245 250 255
Leu Ser Cys His Ala Ala Ser Asn Pro Pro Ala Gln Tyr Ser Trp Phe
260 265 270
Val Asn Gly Thr Phe Gln Gln Ser Thr Gln Glu Leu Phe Ile Pro Asn
275 280 285
Ile Thr Val Asn Asn Ser Gly Ser Tyr Thr Cys Gln Ala His Asn Ser
290 295 300
Asp Thr Gly Leu Asn Arg Thr Thr Val Thr Thr Ile Thr Val Tyr Ala
305 310 315 320
Glu Pro Pro Lys Pro Phe Ile Thr Ser Asn Asn Ser Asn Pro Val Glu
325 330 335
Asp Glu Asp Ala Val Ala Leu Thr Cys Glu Pro Glu Ile Gln Asn Thr
340 345 350
Thr Tyr Leu Trp Trp Val Asn Asn Gln Ser Leu Pro Val Ser Pro Arg
355 360 365
Leu Gln Leu Ser Asn Asp Asn Arg Thr Leu Thr Leu Leu Ser Val Thr
370 375 380
Arg Asn Asp Val Gly Pro Tyr Glu Cys Gly Ile Gln Asn Lys Leu Ser
385 390 395 400
Val Asp His Ser Asp Pro Val Ile Leu Asn Val Leu Tyr Gly Pro Asp
405 410 415
Asp Pro Thr Ile Ser Pro Ser Tyr Thr Tyr Tyr Arg Pro Gly Val Asn
420 425 430
Leu Ser Leu Ser Cys His Ala Ala Ser Asn Pro Pro Ala Gln Tyr Ser
435 440 445
Trp Leu Ile Asp Gly Asn Ile Gln Gln His Thr Gln Glu Leu Phe Ile
450 455 460
Ser Asn Ile Thr Glu Lys Asn Ser Gly Leu Tyr Thr Cys Gln Ala Asn
465 470 475 480
Asn Ser Ala Ser Gly His Ser Arg Thr Thr Val Lys Thr Ile Thr Val
485 490 495
Ser Ala Glu Leu Pro Lys Pro Ser Ile Ser Ser Asn Asn Ser Lys Pro
500 505 510
Val Glu Asp Lys Asp Ala Val Ala Phe Thr Cys Glu Pro Glu Ala Gln
515 520 525
Asn Thr Thr Tyr Leu Trp Trp Val Asn Gly Gln Ser Leu Pro Val Ser
530 535 540
Pro Arg Leu Gln Leu Ser Asn Gly Asn Arg Thr Leu Thr Leu Phe Asn
545 550 555 560
Val Thr Arg Asn Asp Ala Arg Ala Tyr Val Cys Gly Ile Gln Asn Ser
565 570 575
Val Ser Ala Asn Arg Ser Asp Pro Val Thr Leu Asp Val Leu Tyr Gly
580 585 590
Pro Asp Thr Pro Ile Ile Ser Pro Pro Asp Ser Ser Tyr Leu Ser Gly
595 600 605
Ala Asn Leu Asn Leu Ser Cys His Ser Ala Ser Asn Pro Ser Pro Gln
610 615 620
Tyr Ser Trp Arg Ile Asn Gly Ile Pro Gln Gln His Thr Gln Val Leu
625 630 635 640
Phe Ile Ala Lys Ile Thr Pro Asn Asn Asn Gly Thr Tyr Ala Cys Phe
645 650 655
Val Ser Asn Leu Ala Thr Gly Arg Asn Asn Ser Ile Val Lys Ser Ile
660 665 670
Thr Val Ser Ala Ser Gly Thr Ser Pro Gly Leu Ser Ala Gly Ala Thr
675 680 685
Val Gly Ile Met Ile Gly Val Leu Val Gly Val Ala Leu Ile
690 695 700
<210> 4
<211> 534
<212> PRT
<213> 智人(Homo sapiens)
<400> 4
Met Ile Trp Tyr Ile Leu Ile Ile Gly Ile Leu Leu Pro Gln Ser Leu
1 5 10 15
Ala His Pro Gly Phe Phe Thr Ser Ile Gly Gln Met Thr Asp Leu Ile
20 25 30
His Thr Glu Lys Asp Leu Val Thr Ser Leu Lys Asp Tyr Ile Lys Ala
35 40 45
Glu Glu Asp Lys Leu Glu Gln Ile Lys Lys Trp Ala Glu Lys Leu Asp
50 55 60
Arg Leu Thr Ser Thr Ala Thr Lys Asp Pro Glu Gly Phe Val Gly His
65 70 75 80
Pro Val Asn Ala Phe Lys Leu Met Lys Arg Leu Asn Thr Glu Trp Ser
85 90 95
Glu Leu Glu Asn Leu Val Leu Lys Asp Met Ser Asp Gly Phe Ile Ser
100 105 110
Asn Leu Thr Ile Gln Arg Gln Tyr Phe Pro Asn Asp Glu Asp Gln Val
115 120 125
Gly Ala Ala Lys Ala Leu Leu Arg Leu Gln Asp Thr Tyr Asn Leu Asp
130 135 140
Thr Asp Thr Ile Ser Lys Gly Asn Leu Pro Gly Val Lys His Lys Ser
145 150 155 160
Phe Leu Thr Ala Glu Asp Cys Phe Glu Leu Gly Lys Val Ala Tyr Thr
165 170 175
Glu Ala Asp Tyr Tyr His Thr Glu Leu Trp Met Glu Gln Ala Leu Arg
180 185 190
Gln Leu Asp Glu Gly Glu Ile Ser Thr Ile Asp Lys Val Ser Val Leu
195 200 205
Asp Tyr Leu Ser Tyr Ala Val Tyr Gln Gln Gly Asp Leu Asp Lys Ala
210 215 220
Leu Leu Leu Thr Lys Lys Leu Leu Glu Leu Asp Pro Glu His Gln Arg
225 230 235 240
Ala Asn Gly Asn Leu Lys Tyr Phe Glu Tyr Ile Met Ala Lys Glu Lys
245 250 255
Asp Val Asn Lys Ser Ala Ser Asp Asp Gln Ser Asp Gln Lys Thr Thr
260 265 270
Pro Lys Lys Lys Gly Val Ala Val Asp Tyr Leu Pro Glu Arg Gln Lys
275 280 285
Tyr Glu Met Leu Cys Arg Gly Glu Gly Ile Lys Met Thr Pro Arg Arg
290 295 300
Gln Lys Lys Leu Phe Cys Arg Tyr His Asp Gly Asn Arg Asn Pro Lys
305 310 315 320
Phe Ile Leu Ala Pro Ala Lys Gln Glu Asp Glu Trp Asp Lys Pro Arg
325 330 335
Ile Ile Arg Phe His Asp Ile Ile Ser Asp Ala Glu Ile Glu Ile Val
340 345 350
Lys Asp Leu Ala Lys Pro Arg Leu Arg Arg Ala Thr Ile Ser Asn Pro
355 360 365
Ile Thr Gly Asp Leu Glu Thr Val His Tyr Arg Ile Ser Lys Ser Ala
370 375 380
Trp Leu Ser Gly Tyr Glu Asn Pro Val Val Ser Arg Ile Asn Met Arg
385 390 395 400
Ile Gln Asp Leu Thr Gly Leu Asp Val Ser Thr Ala Glu Glu Leu Gln
405 410 415
Val Ala Asn Tyr Gly Val Gly Gly Gln Tyr Glu Pro His Phe Asp Phe
420 425 430
Ala Arg Lys Asp Glu Pro Asp Ala Phe Lys Glu Leu Gly Thr Gly Asn
435 440 445
Arg Ile Ala Thr Trp Leu Phe Tyr Met Ser Asp Val Ser Ala Gly Gly
450 455 460
Ala Thr Val Phe Pro Glu Val Gly Ala Ser Val Trp Pro Lys Lys Gly
465 470 475 480
Thr Ala Val Phe Trp Tyr Asn Leu Phe Ala Ser Gly Glu Gly Asp Tyr
485 490 495
Ser Thr Arg His Ala Ala Cys Pro Val Leu Val Gly Asn Lys Trp Val
500 505 510
Ser Asn Lys Trp Leu His Glu Arg Gly Gln Glu Phe Arg Arg Pro Cys
515 520 525
Thr Leu Ser Glu Leu Glu
530

Claims (20)

1.一种诊断受试者的结直肠癌的方法,包括确定来自所述受试者的血液来源样品中蛋白质TRIM28、PLOD1和CEACAM5的浓度,并且基于所述蛋白质的总浓度和/或相对浓度确定所述受试者是否患有结直肠癌。
2.根据权利要求1所述的方法,进一步包括确定所述样品中蛋白质P4HA1的浓度,其中P4HA1的浓度包括在确定所述受试者是否患有结直肠癌中。
3.根据权利要求1所述的方法,其中:
i)如果TRIM28的浓度大于0.3ng/ml,则所述受试者不患有结直肠癌;
ii)如果TRIM28的浓度小于或等于0.3ng/ml并且PLOD1的浓度大于或等于1.7ng/ml,则所述受试者患有结直肠癌;
iii)如果TRIM28的浓度小于或等于0.3ng/ml、PLOD1的浓度小于1.7ng/ml并且CEACAM5的浓度大于或等于0.13pg/ml,则所述受试者患有结直肠癌;和
iv)如果TRIM28的浓度小于或等于0.3ng/ml、PLOD1的浓度小于1.7ng/ml并且CEACAM5的浓度小于0.13pg/ml,则所述受试者不患有结直肠癌。
4.根据权利要求2所述的方法,其中:
i)如果(6.7×[TRIM28])-(0.7×[PLOD1])-(13.1×[CEACAM5])+(0.4×[P4HA1])-2.2小于零,则所述受试者患有结直肠癌;和
ii)如果(6.7×[TRIM28])-(0.7×[PLOD1])-(13.1×[CEACAM5])+(0.4×[P4HA1])-2.2大于或等于零,则所述受试者不患有结直肠症;
其中TRIM28、PLOD1和P4HA1的浓度以ng/ml计,CEACAM5的浓度以pg/ml计。
5.根据权利要求1至4任一项所述的方法,进一步包括从所述受试者采集血液样品。
6.根据权利要求1至5任一项所述的方法,其中所述血液来源样品是血浆样品。
7.根据权利要求1至6任一项所述的方法,其中所述蛋白质浓度是通过免疫测定测量的。
8.根据权利要求7所述的方法,其中所述免疫测定是定量ELISA。
9.根据权利要求1至8任一项所述的方法,其中所述测量所述蛋白质浓度并且确定所述受试者是否患有结直肠癌的步骤由被编程为进行所述步骤的计算机处理器进行。
10.一种诊断和治疗受试者的结直肠癌的方法,包括:
a)测量血液来源样品中蛋白质TRIM28、PLOD1和CEACAM5的浓度;
b)基于所述浓度,确定所述受试者是否患有结直肠癌;其中:
i)如果TRIM28的浓度大于0.3ng/ml,则所述受试者不患有结直肠癌;
ii)如果TRIM28的浓度小于或等于0.3ng/ml并且PLOD1的浓度大于或等于1.7ng/ml,则所述受试者患有结直肠癌;
iii)如果TRIM28的浓度小于或等于0.3ng/ml、PLOD1的浓度小于1.7ng/ml并且CEACAM5的浓度大于或等于0.13pg/ml,则所述受试者患有结直肠癌;和
iv)如果TRIM28的浓度小于或等于0.3ng/ml、PLOD1的浓度小于1.7ng/ml并且CEACAM5的浓度小于0.13pg/ml,则所述受试者不患有结直肠癌,以及
c)如果所述受试者被诊断患有结直肠癌,则向所述受试者给予结直肠癌的治疗。
11.一种诊断和治疗受试者的结直肠癌的方法,包括:
a)测量血液来源样品中蛋白质TRIM28、PLOD1、CEACAM5和P4HA1的浓度,其中TRIM28、PLOD1和P4HA1的浓度以ng/ml计,CEACAM5的浓度以pg/ml计;和
b)基于所述浓度,确定所述受试者是否患有结直肠癌;其中:
i)如果(6.7×[TRIM28])-(0.7×[PLOD1])-(13.1×[CEACAM5])+(0.4×[P4HA1])-2.2小于零,则所述受试者患有结直肠癌;和
ii)如果(6.7×[TRIM28])-(0.7×[PLOD1])-(13.1×[CEACAM5])+(0.4×[P4HA1])-2.2大于或等于零,则所述受试者不患有结直肠症;以及
c)如果所述受试者被诊断患有结直肠癌,则向所述受试者给予结直肠癌的治疗。
12.根据权利要求10或11所述的方法,其中所述治疗包括手术、化学疗法、放射疗法和/或免疫疗法。
13.一种试剂盒,其包含一组用于确定样品中TRIM28、PLOD1和CEACAM5的存在或浓度的试剂。
14.根据权利要求13所述的试剂盒,其进一步包括用于确定样品中P4HA1的存在或浓度的试剂。
15.根据权利要求13所述的试剂盒,所述试剂盒包含:
i)结合TRIM28或其片段的特异性结合剂;
ii)结合PLOD1或其片段的特异性结合剂;和
iii)结合CEACAM5或其片段的特异性结合剂。
16.根据权利要求15所述的试剂盒,所述试剂盒进一步包含结合P4HA1或其片段的特异性结合剂。
17.根据权利要求15或16所述的试剂盒,其中每种特异性结合剂均是抗体。
18.根据权利要求13至17任一项所述的试剂盒,其中所述试剂盒用于进行ELISA。
19.一种计算机程序产品,其包含指令,当执行所述指令时,将使处理器进行如权利要求1至4任一项所定义的方法。
20.根据权利要求13至18任一项所定义的试剂盒在结直肠癌诊断中的用途,其中使用如权利要求1至9任一项所定义的方法进行所述诊断。
CN202080051929.0A 2019-05-30 2020-05-29 用于诊断结直肠癌的方法 Pending CN114174827A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB1907663.7 2019-05-30
GBGB1907663.7A GB201907663D0 (en) 2019-05-30 2019-05-30 Method for diagnosing colorectal cancer
PCT/EP2020/065062 WO2020240011A1 (en) 2019-05-30 2020-05-29 Method for diagnosing colorectal cancer

Publications (1)

Publication Number Publication Date
CN114174827A true CN114174827A (zh) 2022-03-11

Family

ID=67002054

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080051929.0A Pending CN114174827A (zh) 2019-05-30 2020-05-29 用于诊断结直肠癌的方法

Country Status (5)

Country Link
US (1) US20220244261A1 (zh)
EP (1) EP3977129A1 (zh)
CN (1) CN114174827A (zh)
GB (1) GB201907663D0 (zh)
WO (1) WO2020240011A1 (zh)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140045915A1 (en) * 2010-08-31 2014-02-13 The General Hospital Corporation Cancer-related biological materials in microvesicles
GB201608052D0 (en) 2016-05-09 2016-06-22 Univ Oslo Hf T-cell receptors which recognise frameshift mutants of TGF-beta RII
WO2019008414A1 (en) * 2017-07-05 2019-01-10 Datar Rajan GENE EXPRESSION ANALYSIS BASED ON EXOSOMES FOR THE CARE OF CANCER

Also Published As

Publication number Publication date
US20220244261A1 (en) 2022-08-04
WO2020240011A1 (en) 2020-12-03
GB201907663D0 (en) 2019-07-17
EP3977129A1 (en) 2022-04-06

Similar Documents

Publication Publication Date Title
US20200326344A1 (en) Soluble B7-H1
US20110201517A1 (en) Autoantigen biomarkers for early diagnosis of lung adenocarcinoma
CN112362871B (zh) 食管癌的生物标志物及其应用
Wang et al. Screening of tumor-associated antigens based on Oncomine database and evaluation of diagnostic value of autoantibodies in lung cancer
WO2022063156A1 (zh) 乳腺癌的生物标志物及其应用
JP2019012077A (ja) 炎症性肝疾患の診断のための方法および組成物
JP2018524585A (ja) Pla2r1エピトーププロファイルおよびpla2r1エピトープスプレッディングの分析に基づく膜性腎症の予後およびモニタリング
US20230408520A1 (en) Arteriosclerosis and cancer detection method using deoxyhypusine synthase gene as indicator
US20180216194A1 (en) Compositions and methods for detecting pancreatic cancer
ES2974307T3 (es) PERM como marcador de cáncer de endometrio
JP6361943B2 (ja) 補体因子bタンパク質に特異的に結合する抗体及び糖鎖抗原19−9タンパク質に特異的に結合する抗体を含む膵臓癌診断用キット
US20200018758A1 (en) Methods for differentiating benign prostatic hyperplasia from prostate cancer
JP4668180B2 (ja) 癌疾患の再発を予測する方法
CN115372616A (zh) 胃癌相关的生物标志物及其应用
CN114174827A (zh) 用于诊断结直肠癌的方法
WO2019242741A1 (en) Biomarkers for urothelial carcinoma and applications thereof
KR102131860B1 (ko) 아르기닌이 메틸화된 ggt1에 특이적으로 결합하는 대장암 진단용 바이오마커 조성물
KR102128251B1 (ko) 아르기닌이 메틸화된 drd2에 특이적으로 결합하는 대장암 진단용 바이오마커 조성물
US20230375550A1 (en) Method for diagnosing breast cancer by using biomarker
TWI842716B (zh) 泌尿道上皮細胞癌生物標記及其應用
US20130095483A1 (en) Predictive biomarkers for breast cancer
Sun et al. Diagnostic performance of anti-MAGEA family protein autoantibodies in esophageal squamous cell carcinoma
CN117616280A (zh) 预测癌症复发
US20120301879A1 (en) Novel use of ca-125
Rai et al. Immunologic Approaches to Tumor Markers: Assays, Applications, and Discovery

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination