CN101611313A - 质谱法生物标记测定 - Google Patents

质谱法生物标记测定 Download PDF

Info

Publication number
CN101611313A
CN101611313A CNA2007800219002A CN200780021900A CN101611313A CN 101611313 A CN101611313 A CN 101611313A CN A2007800219002 A CNA2007800219002 A CN A2007800219002A CN 200780021900 A CN200780021900 A CN 200780021900A CN 101611313 A CN101611313 A CN 101611313A
Authority
CN
China
Prior art keywords
biomarker
signal
sample
quality
msba
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2007800219002A
Other languages
English (en)
Inventor
西村俊秀
荻原淳
川村猛
T·卡瓦卡米
京野完
金泽光洋
F·尼贝里
G·马科-瓦加
安养寺久荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AstraZeneca UK Ltd
Medical Proteoscope Co Ltd
Original Assignee
AstraZeneca UK Ltd
Medical Proteoscope Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AstraZeneca UK Ltd, Medical Proteoscope Co Ltd filed Critical AstraZeneca UK Ltd
Publication of CN101611313A publication Critical patent/CN101611313A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6848Methods of protein analysis involving mass spectrometry
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/74Optical detectors
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers
    • G01N30/7233Mass spectrometers interfaced to liquid or supercritical fluid chromatograph

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biotechnology (AREA)
  • Cell Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Microbiology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

本发明提供了确定样品中一种或多种生物标记存在的方法,包括步骤:(a)使样品进行质谱(MS)分析并且记录每个检测信号的保留时间指数和相应质量;(b)使相应于每个信号的质量与生物标记质量的参考数据库相关联,以形成每个信号和参考生物标记之间的相关性,并抛弃那些质量不与参考生物标记质量相关的信号;(c)储存那些质量与参考生物标记相关的信号;(d)通过利用相似性度量将每个信号的MS光谱与数据库中参考生物标记的MS光谱匹配,确定每个储存信号和参考生物标记之间的相关性,以界定一组阳性相关信号;(d)测量每个阳性相关信号的强度,并利用辨别函数对它的绝对信号强度或相对信号强度记分;(e)将阈值应用于获自辨别函数的得分值,以确定生物标记的存在或不存在。

Description

质谱法生物标记测定
本发明涉及对生物标记的测定。特别是,本发明描述了能够通过质谱法自动筛选样品中生物标记的存在的多重测定。
多种生物学标记,称为生物标记,已经通过生化和分子生物学应用于医学和毒理状态而被鉴定和研究。生物标记可在组织和生物液中发现,所述血液是用于生物标记研究的最常见生物液。
生物标记可具有可预测的能量,并且因而可用于预测或检测特定病症或疾病的存在,水平,类型或阶段(包括特定微生物或毒素的存在或水平),对特定病症或疾病的易感性(包括遗传易感性),或对特定治疗的反应(包括药物治疗)。据认为,通过提高研究和研发计划的效能,生物标记将在药物发现和研发的未来起着越来越重要的作用。生物标记可用作诊断试剂,疾病进展的监控物,治疗的监控物和临床结果的预测物。例如,多种生物标记研究计划正试图鉴定特定癌症和特定心血管和免疫疾病的标记物。
完整的蛋白可利用基于凝胶以及液相的分离技术以多种方式测定。使用了具有溶解的蛋白的二维凝胶电泳,其中蛋白根据电荷和大小被分离。蛋白被分离,使得同质异构形式以及翻译后的修饰分离。通过染色技术定量蛋白,其中可利用预染色和后染色技术。代谢标记也允许线性范围延伸多达5个数量级,提供毫微微摩尔(femtomolar)范围内的灵敏度。从切除的凝胶斑进行蛋白鉴定。化学降解和修饰之后消化蛋白。产生的肽混合物从分离的凝胶样品中抽提,并且然后通过质谱法鉴定。
多维HPLC(高效液相色谱)可用作分离蛋白或肽的良好的替代方法。蛋白或肽混合物连续通过产生更高分辨率的色谱固定相或维度。HPLC对于许多实验方法是灵活的,并且可由于它们在分离感兴趣的特定蛋白或肽类中的适宜性和相互之间以及与下游检测和鉴定质谱方法的兼容性而选择多种固定和活动相。高效液相色谱法目前对于溶质分离是最好的方法,其也允许高度再现地自动化操作。这些类型的多装置分离平台的在线构造普遍地应用于蛋白质组学研究中。
质谱法(MS)也是一种蛋白质组学领域的关键要素。事实上,MS是此领域中用于研究和表征纯化蛋白的主要工具。蛋白质组和MS的界面连接,展现出数百或数千的蛋白,是通过凝胶技术产生的,其中在单个凝胶上可获得高分辨率。研究者正成功地利用MS的能力以代替原先给予蛋白质组动力的二维凝胶。
质谱法(MS)的应用和发展以鉴定通过液相分离技术和/或基于凝胶的分离技术分离的蛋白质或肽已经在蛋白质和肽表达分析中产生了显著技术进步。对于蛋白质和肽的质谱表征有两种主要的方法:基质辅助激光解吸电离(MALDI)和电雾化离子化(ESI)。利用多种方法,MALDI和ESI离子来源可与飞行时间(TOF)或其他类型的质谱分析法组合以确定肽的质量或序列。
在MALDI中,肽与基质共结晶,并且用激光脉冲。这种处理使肽蒸发和离子化。带电的肽的分子量(质量)然后在TOF分析器中确定。在这种装置中,电场加速了带电分子朝向检测器,并且其使得离子化的肽到达检测器的时长的差异(它们的飞行时间)揭示了肽的分子量,更小的肽更快地到达检测器。这种方法产生了肽混合物的质量轮廓-也就是,混合物中肽的分子量和数量的轮廓。这种轮廓可然后用于从蛋白质序列数据库中鉴定已知的蛋白质。
通过将ESI-MS界面制备到液相色谱(LC/MS/MS),来自LC-柱的洗脱肽被引入质谱仪的离子源中。对非常细的针施加电压。然后所述针将液滴喷入质谱分析器中,在其中所述液滴蒸发并且肽离子相应于各种电荷状态并从测定序列的位置释放,所述电荷状态是分段的(fragmented)。在LC/MS/MS中,研究者利用了微毛细管LC装置以最初分离肽。
质谱法(MS)是一种有价值的分析技术,因为它高度灵敏地测量生物分子的内在性质。因此MS可用于测量宽范围的分子类型(蛋白,肽,或任何其他生物分子)和宽范围的样品类型/生物材料。正确的样品制备已知对于MS信号产生和光谱分辨和灵敏度是关键的。样品制备因此对于分析的总的可行性和灵敏度是关键的。
蛋白是很难通过液相色谱分离技术分离的生物大分子,因为在色谱柱材料,固定相,的颗粒中的不利的物质转移。然而,可通过将连接两个相邻氨基酸的肽键破坏而使蛋白成为更小单元(肽或多肽)形式。这可通过蛋白酶,能够相互作用和溶解其他蛋白上的肽键的蛋白,的酶切而完成。胰蛋白酶是最常用的蛋白酶,用于蛋白表达分析研究中。酶降解之后,产生的肽复合混合物将通过毛细管色谱法分离和分馏。样品中消化蛋白的全体的所有肽在此阶段是未分离的。从相应蛋白产生的肽在色谱分馏步骤中将不会分离为一个单元,而是与从样品中所有其他蛋白产生的肽一起分离。来自毛细管的高度拆分(resolved)和分离的洗脱肽,最通常地基于电荷和疏水性而被分馏。分离的肽从平台的色谱部分在线引入质谱仪,由此避免可能的污染。肽然后进行质量测定(m/z),以捕获在给定时间窗口中的所有肽。接下来,为测序(MS/MS)而选择许多肽质量,基于它们在给定的时间窗口的丰度(abundance)。这依靠电雾化离子化离子阱质谱***通过新的离子取样界面而进行。界面利用线性四极作为离子导向器和离子阱以提高阱的性能。在线性四极中捕获的离子证明提高了***的负载循环。在线性四极中捕获的离子的偶极激发用于喷射不需要的离子。
在1990年第一次成功地使用仪器之后,利用电雾化离子化(ESI)的离子阱质谱法已经成为用于痕量分析的广泛使用的工具。电雾化是可离子化重要分析物例如肽和蛋白的缓和的来源。ESI中产生的高度带电的离子可扩展质量分析器的范围。阱质谱仪具有良好的性能例如灵活的串联的MS性能(MS n......)。在本离子化方法中,通过在一些形成的片段离子在阱中不稳定的条件下加速入质量选择性线性离子阱而活化前体离子。时间迟延之后,改变离子阱的稳定性参数以允许先前为不稳定的片段的捕获。结果是源于具有改变的内能分配的前体离子的产品离子光谱。允许前体离子进入线性离子阱之后,遵循前体内能分配的演变许多毫秒是可能的。时间-延迟的片段化产品离子光谱典型地显示出降低的连续的片段化产品,产生更容易解释的光谱。对于时间-迟延的片段化重要的几种重要实验参数已被鉴定并被讨论。这些技术对于小前体离子和多电荷肽都是有用。
串联质谱法(MS/MS)是大多数对于复合混合物的现代质谱研究的核心。片段化涉及通过与目标气体碰撞的前体离子的活化,并且可产生带电和中性的片段。片段离子的性质,以及它们的强度,通常指示了前体离子的结构并且因而可产生对于鉴定未知分析物的有用信息,并提供用于不同类分析物的有用的筛选技术。通过多种碰撞的活化延长了活化时间并且使得更高的能量储存入前体离子中。更高的碰撞气体压力也暗示了更高的碰撞弛豫率。
在通过2D凝胶电泳的蛋白分离和通过质谱法的分析的结合已被建立为用于生物标记分析的同时,能够分析几种生物标记的多***目前正处于实验阶段。
许多疾病已经显示出与生物标记的复合模式有关,其可以用于诊断疾病或指示病人对药物治疗的反应。这些模式经常涉及几种生物标记,需要多种同时的分析。因此,需要能够同时测试多种生物标记的***。理想地,该***可以是自动化的。
发明概述
本发明提供了对于样品中生物标记的测定,其是自动化的并且是精确的。本测定依赖于质谱法以鉴定生物标记,并且在本文中称为质谱法生物标记测定(MSBA)。
本发明提供了用于确定一种或多种多肽生物标记在,优选,人测试样品中的存在的方法,其可包括非人测试样品,其典型地限制于一定体积的生物液中,所述生物液包含天然存在的蛋白和包含在一定量的组织,血液或其他临床上获得的样本中的肽。
本方法优选包含下述步骤:
(a)使样品进行质谱(MS)分析并记录每个检测信号的保留时间指数和相应的质量;
(b)使相应于每个信号的质量与参考数据库相关联,所述参考数据库含有来自已知疾病或生物改变的标准组的生物标记质量,以形成每个测试样品信号和来自参考数据库中标准组生物标记的生物标记之间的相关性,并抛弃那些质量不与主数据组中的参考生物标记质量相关的测试信号;
(c)储存那些质量与标准数据中的参考生物标记相关的测试样品信号;
(d)通过利用相似性度量将每个信号的MS光谱与数据库中参考生物标记的MS光谱匹配,确定每个储存信号和参考生物标记之间的相关性,以界定一组阳性相关信号;
(d)测量阳性相关的每个储存测试信号,并利用辨别函数对它的绝对信号强度或相对信号强度记分;
(e)将阈值应用于获自辨别函数的得分值,以确定生物标记的存在或不存在。
优选,本发明的方法利用测试样品筛选阶段的主数据组(masterdata set)。
有利地,本方法过滤和筛选数据组的质量和序列特性,所述特性基于与主数据组中某种鉴定的蛋白序列相关的电荷,质量,序列光谱的唯一性质。
因此,在第一方面,本发明提供了用于确定在样品中一种或多种多肽生物标记的存在的方法,包括步骤:
(a)使样品进行质谱(MS)分析并记录每个检测信号的保留时间指数和对应的质量;
(b)使对应于每个信号的质量与生物标记质量的参考数据库相关联,以形成每个信号和参考生物标记之间的相关性,并抛弃那些质量不与参考生物标记质量相关的信号;
(c)储存那些质量与参考生物标记相关的信号;
(d)通过利用相似性度量将每个信号的MS光谱与数据库中参考生物标记的MS光谱匹配,确认每个储存信号和参考生物标记之间的相关性,以界定一组阳性相关信号;
(d)测量每个阳性相关信号的强度,并利用辨别函数对它的绝对信号强度或相对信号强度记分;
(e)将阈值应用于获自辨别函数的得分值,以确定生物标记的存在或不存在。
本发明的方法允许使用者同时分析样品中成百上千的生物标记。本方法依赖于生物标记的数据库,其已经显示为与疾病相关,其包含了每个生物标记的质量和光谱数据,并且允许所述生物标记通过MSBA软件在给定的样品中精确地鉴定。通过筛选存在于样品中的肽并基于保留时间指数排除不期望的序列,其与肽到达MS检测器的时间相关,超过30,000个序列可在数分钟内被分析,并且给定的生物标记高度置信地鉴定。本方法是可自动化的,高通量的,并且可被相对不熟练的技术人员操作。
样品可在不进行先前分离操作而进行MS分析。在所述实施方式中,优选通过利用静电纳米电雾化原理直接输注,流动注射或样品富集流动注射,而分析样品。
有利地,在MS分析之前处理样品,优选在将它们负载到MS上之前分离样品成分。例如,样品处理包括通过单相或多相高压液相色谱法(HPLC)的样品分离。
MS***自身优选是电雾化离子化(ESI)MS,基质辅助激光解吸电离-飞行时间(MALDI-TOF)MS或表面增强激光解吸电离-飞行时间(SELDI-TOF)MS。
根据本发明的方法有利地是自动化的并且在计算机控制下实施。通过与所述生物标记的参考数据比较而鉴定样品中生物标记;优选,多种生物标记的参考质量和MS光谱数据储存在计算机上。
对于给定的生物标记的参考MS光谱优选是通过聚类计算(clustering calculation)而由实际和测量数据获得的平均光谱。
本发明的方法可以两种方式实现;利用内标以提供用于定量信号强度的参考,和不利用所述标准。因而,在一个实施方式中,在通过MS分析之前将一种或多种内标添加到样品中。优选,内标是标记的。
在本发明的所述实施中,通过测量生物标记信号强度并将它与一种或多种已知内标的信号强度比较,而对每个生物标记信号的绝对信号强度记分。
在替代实施中,不添加内标处理样品。在所述实施方式中,通过测量患者中个别生物标记信号强度与患者组的参考信号强度之间的比例,而对相对信号强度记分。
生物标记可描述为“客观地测量并评价为正常生物过程,病理过程,或对治疗干预的药理反应的指示的一种特征”。生物标记是与特定病症或疾病相关的任何可鉴定和可测量的指示物,所述情况下具有生物标记存在或水平与所述病症或疾病的一些方面的相关性(包括所述病症或疾病的存在,水平或改变的水平,类型,阶段,易感性,或对用于治疗所述病症或疾病的药物的反应性)。相关性可以是定性,定量,或定性和定量。典型地,生物标记是化合物,化合物片段或化合物组。所述化合物可以是发现于或产生自生物体的任何化合物,包括蛋白(和肽),核酸和其他化合物。
样品可以是任何感兴趣的生物物质,但有利地是生物组织并且优选地是生物液例如血液或血浆。
本发明的方法依赖于观察到的MS信号与已知生物标记的参考质量和MS光谱的相关性。参考数据优选储存在计算机服务器上,其允许整个方法在计算机控制下实施。
通过比较将信号与参考标准相关,例如利用如本文所述计算机函数。优选地,信号根据是否获得相似性的阈值表征为“阳性”或“阴性”;阴性并且不获得相似性阈值的信号在MSBA方法中被抛弃,同时那些阳性的信号与生物标记匹配并且导致对生物样品中所述生物标记的存在的诊断。
根据MSBA测定的实施,参考添加到生物样品中的已知对照标准,或通过与患者组中计算出的参考强度比较,而测量信号强度。
在用标准实施的情况下,通过存在于样品中的生物标记信号和添加到样品中的内标的比例而计算生物标记信号的MSBA得分。在多重测定中的所有生物标记将以相同方式分析,导致最终的MSBA得分因子。
为在MSBA方法中建立绝对的定量,优选利用内部(calibrant)标准。所述标准例如是同位素标记的,使得测定读出在蛋白序列方面高度精确,并且在绝对定量方面是有利的。在MSBA筛选中校准序列的建立将允许血液或任何其他临床样品中绝对蛋白生物标记水平的测量。
提供了一种新方法,由用于检测和定量蛋白序列生物标记的多个连接步骤组成,具有多重的读出,其中2-100个,但不限于其,的生物标记的表达水平可在单个MSBA读出中描绘出(mapped)。MSBA***建立于液相平台上,其可处理单线诊断描绘,或同时平行处理样品的多重配置流程,由此提高***的容量和通量。MSBA方法的检测模式是通过质谱法的精确的质量鉴定和序列确定和接下来的定量。
本方法可应用于任何类型的生物样品,其为液体形式或可转化为液体形式。MSBA方法还可处理来自任何类型的细胞的,或生物技术的方法的样品,其中例如测量相对于时间的动力学轮廓。通过接下来随着时间样品自动地引入MSBA平台,实施相对于时间的分析。MSBA诊断轮廓测量的整个分析能力是完全计算机控制的,包括通过衡量区别和最终MSBA得分诊断的质量信号评价,序列分析,多重定量。在此平台上运行的MSBA循环中的所有中间步骤通过专用算法进行评价,所述专用算法作出精确的判定,从产生于自任何给定的生物样品的MSBA分析的每个循环的大量数据中作出判定。
MSBA方法使得鉴定了特定肽以及其生物化学修饰的变体的鉴定,其表现为分离的实体或存在于蛋白和肽的复合混合物之内。每种肽可通过特定的氨基酸序列限定,其可通过其精确的质量或其对于给定的免疫学试剂的独特免疫亲和结合性质而选择性鉴定。
本方法允许鉴定统计学显著的蛋白性质和其修饰形式。而且,可能测量样品中每种生物标记的相对数量,甚至在不利用内标的情况下。或者,通过利用内标可对任何给定生物样品中每种生物标记分别进行绝对定量,其中内标(例如,n=1-20)是生物标记的蛋白序列。这些内标可然后制定为冷(cold)氨基酸序列,或为同位素标记氨基酸序列。除了可能的标记例外之外,标准具有与选择的生物标记同一的序列。
本方法结合了产生特定的处理,离析,分离,和鉴定存在于生物材料样品中的独特蛋白序列的几种关键步骤。本方法可应用于人临床样品。本方法还可应用于源于非人动物的样品。
我们提供了用于鉴定独特蛋白序列的性质的多步骤方法,所述性质表现为例如来自生物样品的原子质量单元的实体,其已经证明在给定的多重生物标记组中具有数量上的改变,其大小例如在给定样品中可在2-100的范围内变动。
我们还提供了确定或确认在任何特定生物样品中的生物标记具有蛋白序列的生物标记组的多重数量改变的方法,其在临床,细胞或任何其他类型样品中被预先确定。这种数量改变最终通过MSBA算法计算以产生MSBA得分,其将成为诊断性读出。
而且,统计学显著的相似性可被检测并登记为独特的蛋白序列性质或多种肽的性质。确定统计学显著的相似性涉及利用公众可获取的蛋白和基因序列数据库以及特别为满足MSBA方法的要求而发展的算法。
用于生物标记鉴定的方法步骤的整合是有利的。整合的方法依赖于下述原理:1)高质量的生物医学临床材料,2)具有接下来的液相分离的可再现和高速的样品处理,3)精确的定量和定性确定多重组的生物标记和4)将依次控制数据产生和计算和允许多重蛋白序列组中生物标记的分离的算法。
附图简述
图1显示了MSBA原理的示意图。
图2更详细地例示了MSBA中涉及的数据处理方法。
图3显示了来自血样的质谱,所述血样来自肺病患者。鉴定了样品中的多种生物标记。
图4显示了从多重测定中制作的生物标记注解的例子,表现为MS光谱,其中通过MSBA软件和接下来的代表产生的CVLFPYGGCQGNGNK生物标记的MS/MS光谱识别生物标记。
图5显示了如实施例2所述评价MSBA模型的可预测性的例子,所述MSBA模型对于19个患者的样品数据具有11种生物标记信号。利用了当作盲样品的10种例子和9种对照。利用等式5计算对于每个受试者的MSBA得分。在此实施例中,MSBA得分等于1或大于1的受试者诊断为病例(红圈)。否则该受试者被认为是对照(蓝圈)。预测精确度是100%。
图6显示了如实施例3所述利用对于96个患者的样品数据具有10种信号的MSBA模型的自身辨别结果。每个点代表一个患者,并且垂直轴线代表辨别得分(z),其利用等式6计算。如果得分>0,则将其解释为病例(红圈),否则该受试者被认为是对照(蓝圈)。预测精确度是83.3%。
发明详述
生物标记
FDA对于生物标记的定义是“客观地测量并评价为正常生物过程,病理过程,或对治疗干预的药理反应的指示的一种特征”。
如本文所用,术语“生物标记”指可用于监测疾病的存在或进展的多肽,与上述FDA定义一致。
生物标记可用作诊断试剂,疾病进展的监测物,治疗的监测物和临床结果的预测物。例如,多重生物标记研究计划正试图鉴定特定癌症和特定心血管和免疫疾病的标记。
一些这些疾病相关蛋白可鉴定为新的药物靶标,并且一些可用于疾病进展的生物标记。所述生物标记可用于提高新药的临床研发或用于研发特定疾病的新的诊断法。
疾病相关蛋白是本领域已知的,并且已经建立了它们用作疾病的生物标记的用途。所述生物标记可通过本发明方法监测。然而,可鉴定新的疾病相关蛋白。例如,可通过下述方法获得疾病相关蛋白的监测。蛋白样品获取自单个患者或患者组。这些样品可以是细胞,组织,或生物液,其被处理以提取和富集蛋白和/或肽组分。典型地,本方法需要分配入液相中,但也可包括附着于固体基质的蛋白和/或肽成分的建立。分离和分析(蛋白质组学,肽组学)之后,通过定性和定量测量对于疾病和健康受试者产生了蛋白表达指纹图谱。这些指纹图谱可用作区别个体和/或建立和/或追踪某种自然或疾病过程的独特的鉴定物。这些原型指纹图谱对于每种独立样品/受试者建立,并在计算机数据库中记录为数值。然后利用生物信息工具分析该指纹图谱,以鉴定和选择蛋白或肽,所述蛋白或肽存在于原型指纹图谱中并且其表达在源于健康和疾病受试者样品中可有差别地存在或没有差别地存在。这些蛋白/肽然后进一步被表征并且产生了详细的轮廓,其鉴定蛋白或肽的特征性物理性质。单一的蛋白/肽或蛋白/肽组可被确定以与某种自然或疾病过程显著相关。
质谱法
质谱法是用于蛋白和肽的分析的选择方法。现代生物标记发现研究应用了两种主要质谱法原理:MALDI-TOF(基质辅助激光解吸电离飞行时间)质谱法,其中蛋白以晶体状态进行分析,和ESI(电雾化离子化)质谱法,其中蛋白以液体状态进行分析。另外,MALDI的表面增强芯片应用,称为表面增强激光解吸电离(SELDI),已被广泛用于生物标记发现研究中。见例如,Petricoin等人,Lancet,16,572-577,2002;Alexe等人,Proteomics.2004,4766-4783;和Liotta等人,EndocrRelat Cancer.2004 Dec;11(4):585-7。
表面增强激光解吸/电离(SELDI)-TOF-MS技术利用了结合于测定靶板的色谱表面。板上的蛋白结合材料然后通过MALDI-MS直接分析。SELDI测定主要是低分子量范围的肽和蛋白。这种技术对于主要的,对于没有整合出适当的在前的纯化方案的中等丰富的肽和蛋白是可应用的。SELDI技术主要导致一种模式,从该模式中,可利用肽的MALDI-TOF-TOF鉴定测序。
多-装置分离平台保证了利用电雾化离子化色谱法在线地,或利用离子化原理例如基质辅助激光解吸电离色谱法的离线地,构建高分辨率的肽分离方法。见例如,Aebersold,R.&Goodlett,D.R.Chem.Rev.2001,101,269-295;Mann,等人,Annu.Rev.Biochem,2001.70,437-473;Wolters,等人Anal.Chem.73,5683-5690(2001);和Washburn,等人,Nat.Biotechnol.19,242-247(2001)。
质谱法(MS)也是蛋白质组学领域的关键要素。事实上,MS是本领域用于研究和表征蛋白结构和序列的主要工具。见Aebersold,R.&Mann,M.Mass spectrometry-based proteomics.Nature 422,198-207(2003);Steen,H.和M.Mann(2004).Nat Rev Mol Cell Biol 5(9):699-711;和Olsen,J.V.和M.Mann(2004)Proc Natl Acad Sci U S A101(37):13417-22。
研究者正成功地利用MS的功效以代替最初给予蛋白质组推动力的二维凝胶。利用ESI和液相色谱(LC)/MS/MS,将一种电压应用于一种非常细的针,所述针包含肽混合物,产生肽序列,从LC-柱洗脱。所述针然后将液滴喷射入质谱分析器中,在其中液滴蒸发并且肽离子被释放。在LC/MS/MS中,研究者利用了微毛细管LC装置以起始地分离肽。
质谱法(MS)是一种有价值的分析技术,因为它高度灵敏地测量生物分子的内在性质,它的质量。因此,MS可用于测量宽范围的样品类型/生物材料中的宽范围的分子类型(蛋白,肽,或任何其他生物分子)。
正确的样品制备可影响MS信号产生和光谱分辨率和灵敏度。高分辨率分离***例如单维高压液相色谱法(LC)和多维液相色谱法(LC/LC)可直接与质谱法连接。这种连接允许快速自动化地获得和收集大的数据组,其代表了在产生的质谱中的定量和序列信息。这种整合的鸟枪蛋白质组学技术称为MudPIT(多维蛋白鉴定技术)。见Eng等人,J Am Soc Mass Spectrom 1994,5:976-989;Link等人,NatBiotechnol.1999 Jul;17(7):676-82;Washburn等人,Nat Biotechnol.2001Mar;19(3):242-7;Lin等人,American Genomic/Proteomic Technology,2001 1(1):38-46;和Tabb等人,J.Proteome Res.2002 1:21-26。
在鸟枪蛋白质组学方法中,分析通过特定蛋白消化酶例如胰蛋白酶和其他内-和外-肽酶/蛋白酶产生的肽,而不是完整的蛋白。这种片段化提供了明确的优点,因为甚至非常大的蛋白,其具有改变的物理和化学特征例如非常疏水,或非常碱性的蛋白,可以被分析。所述蛋白类否则是很难处理的。这些蛋白将产生大小和数量足以允许精确的蛋白注解和鉴定的肽混合物。然而,既然从各自每种蛋白产生了几种肽,待分析混合物的复杂性提高了。结果,对于鸟枪方法需要相当大的仪器时间和计算能力。然而,蛋白表达信息的资源是广泛的,并且在完全自动化的设置中产生,并且同时地实时鉴定蛋白。
为能够处理代表了多种程度的疾病的不同患者样品,可应用不同方法调整和校准产生的液相色谱法色谱和质谱。可通过一种软件方法进行这种归一化,由此产生于整个实验的总的信号产生被利用并与多种分析患者样品的总的信号产生进行比较。所有信号的平均值和共同体将被校准以允许差别定量。
在第二方法中,预定量的肽标准被添加到样品中。这种添加将在样品消化之前和之后,之前或之后进行。利用的标准将是合成为同位素标记序列的实际生物标记序列,或没有同位素标记,并且加入样品(spiked with the sample)。
在蛋白质组学领域中标记技术用于定量的临床蛋白调整研究的用途是非常普遍的。通过利用多种结合化学,多种标记技术已经被发展并且被应用。在蛋白质组学领域最普遍应用的标记是ICAT和ITRAQ标记。见Parker等人,Mol.Cell.Proteomics,625-659,3,2004;Ross等人,Cell.Proteomics,3,1153-1169,2004;和DeSouza等人,J.ProteomeRes.,2005,4,377-386。
样品分离
单,或多维HPLC(高效液相色谱)将用作用于分离蛋白或肽的优选选择方法。蛋白或肽混合物通过连续的色谱固定相或维,其产生更高的分辨率。HPLC对于许多实验方法是可适用的,并且可由于它们对于分离感兴趣的特定蛋白或肽类的适合性和相互之间和与下游监测和鉴定质谱方法的兼容性而选择多种固定和移动相。HPLC用于分离已被蛋白水解酶消化的临床样品,其中产生了相应的酶产品,肽混合物。样品制备方法应用于蛋白样品例如血液,组织,或任何其他类型的生物液。见例如,Schulte等人,Expert Rev.Diagn.,5(2),2005,145-157;Chertov等人,Expert Rev.Diagn.,5(2),2005,139-145;Adkins等人,Mol.Cell.Proteomics,1(12),2002 947-955;Pieper等人,Proteomics.2003 Jul;3(7):1345-64;和Anderson,N.L.& Anderson,N.G.Mol.CellProteom.20021,845-867。
相应的肽混合物通过连续的色谱固定相或维,其产生了高分辨率。HPLC对于许多实验方法是灵活的;在本发明的设置中,产生了一种特别地消除了在人血样品中表达的高丰度组分的蛋白的最优化,由此在中等,和低等丰度区域产生蛋白的富集。肽和蛋白的分离是基于肽序列,肽序列的功能组,以及物理性质。
MSBA-操作原理
在将样品进行MSBA之前,在大多数情况下需要样品处理和制备步骤。在MSBA方法之前引入此步骤是为了消除干扰试剂和基质组分,由此促进提高的总的可检测性,导致注解以及总的灵敏性的增加。然而,在某些实施方案中,样品制备可免除,特别是当生物标记处于更高的丰度并且样品复杂性很低时。本领域技术人员将能够确定制备步骤是否是关键的。
MSBA平台可以多种不同方式操作,主要地通过样品的性质和其复杂性而确定。
通过多重分析在患者样品中定性和定量确定生物标记蛋白序列。可利用标记和未标记MSBA原理,根据两种可能的原理利用MSBA测定构型:内标添加原理和没有内标原理。
一般方法
样品制备之后,样品注射入MSBA平台。
接下来采取下述操作;
步骤1A
首先,生物标记MS-信号需要在样品中鉴定。
在生物液样品中筛选与保留时间指数和各自生物标记相应质量相关的生物标记名单质量+/-1道尔顿的预先确定名单。获自大多数MSBA测定的相关保留时间指数在数分钟内确定,并且具有大约+/-2%的可变性,然而这种数值可能改变。
如图1所示,通过将实时质谱与MSBA参考光谱库匹配而实施这些步骤。
接下来,将MS光谱中的质量与生物标记参考名单的质量进行比较,至大约+/-1道尔顿。
步骤1B
当生物标记候选质量被鉴定为具有参考名单中+/-1Da之内匹配的MS光谱的生物标记时,其信息保存在MSBA-服务器上。如果该质量是不正确的,MSBA筛选不将光谱文件储存到服务器上。
这些操作通过文件共享和进程通信(例如用户-服务器类型通信)机制实施。
步骤2A
当MS-光谱中的质量特性被鉴定时,开始质量鉴定和序列特性分析。
MSBA软件之内的模式匹配步骤将鉴定某种相似性度量,例如余弦相关性。利用相似性度量,确定了正确的蛋白序列。通过光谱匹配进行这种确认。通过比较样品光谱和MSBA数据库中的参考光谱进行这种光谱匹配。对于此阶段的阳性特性,需要0.8或更高的余弦相关性因子以确认精确的蛋白序列。对于替代的相似性度量的等价阈值对于本领域技术人员是明显的。
参考光谱的比较和评价以下述方式进行。
MS/MS光谱表示为一列成对数(doublets)(m,v),其中m代表质荷比,v表示离子信号强度值。通过用mb的间隔对m进行二进制扩展(binning),(mb=bin的实际宽度)MS/MS光谱还可表示为矢量 v → = { v 1 , · · · , v n } , 其中它的长度(n)等于bin的数量,并且每一要素(element)的值是在每一bin之内的所有信号的强度总和。这是MS/MS光谱的轮廓(profile)表现。
两种不同的MS/MS光谱
Figure A20078002190000172
的余弦相关性(S)可如根据等式1(eq1)的余弦相关性计算:
Figure A20078002190000181
S的值在0到1之间变化。A值为0表示两个矢量是完全独立的,在S矢量值为1时,这表示这两个矢量的方向是相同的。
注意两个MS/MS光谱矢量必须具有相同的二进制扩展(binning),即,如果一个矢量的m的二进制扩展(binning)是500-501,501-502,...1999-2000,则另一光谱必须以相同方式二进制扩展(binned)。结果,两个矢量的长度必须是相同的。
为判断测量的MS信号是否是正确的生物标记,测量信号的MS/MS部分被提取出来,并通过利用例如上述余弦相关性与样品的MS/MS参考光谱比较。
如果余弦相关性值S等于或大于预定的阈值,例如0.8,则判断测量的信号源于参考组中的推定生物标记。
下述部分描述了如何构建从许多个体患者中作为组特异性光谱获得的参考光谱。
对于每种候选生物标记,一旦建立了所述生物标记,应收集几种MS/MS光谱以构建参考MS/MS光谱图。这是来自实际和测量数据组的平均光谱,并且通过聚类计算而获得。
所述参考光谱的构建的例子如下:
(1)为目标生物标记收集多重MS/MS光谱。这些MS/MS光谱必须通过MASCOT,SEQUEST或其他程序以给定的确信水平确认为获自目标生物标记。
(2)研究了具有上述类似性的每种收集的MS/MS光谱的相似性。这通过利用相似性度量的聚类计算而实施。这种聚类计算实施到相似性度量降低到预定阈值。这些聚类计算之后,产生了在MS/MS光谱之内的所有保留的蛋白序列离子的概括名单。接下来的步骤是除去来自聚类计算的概括名单中的保留的蛋白序列离子。
(3)利用来自聚类的建立的和合格的概括MS/MS光谱,可能计算光谱矢量的每种要素的算术平均数。这种平均矢量现在可用作MS/MS参考光谱。
(4)在聚类方法过程中,可能获得从患者组产生多于一种参考的结果。
a)在该例子中,有多于一种的聚类包含在MS/MS光谱轮廓图中的差别。设置于这些环境上的标准是这些组需要具有可信赖的目标生物标记鉴定。然后有可能产生和利用用于一种目标的多于一种的参考光谱。如果具有在组中不同但与相同注解的蛋白相关的MS/MS片段离子,将出现所述情况。
b)还可能获得具有聚类分析数据的情形,其中具有生物标记轮廓图中的差别。那将表示可从患者群例如不同显型中建立几种个体组。在这些情况下,比较多重模式将是显型特异性的。但是,在显型之间还可能存在生物标记重叠。
如下所例示的,这些确认算法在高通量筛选操作的MSBA平台之内实时应用和利用。
步骤2B
一旦鉴定了阳性生物标记质量,质谱仪(例如Finnigan LTQ)将停留在质量目标之上,以进行生物标记离子信号的重复扫描。扫描的数量将依赖于每种特定蛋白序列产生的得分匹配,但将校准到生物标记的阳性特性。扫描窗口将通过MSBA软件自动确定。
对于阳性相关性的标准在余弦相关性相似性度量中将是高于或等于0.8。
接下来的随后步骤是通过利用具有蛋白数据库的商业搜索引擎例如MSCOT或SEQUEST或任何其他搜索引擎产生蛋白序列的统计学显著的特性,以确认它是正确的生物标记特性。
MSBA***将仅仅储存和存档在生物标记质量和序列范围之内的信号和数据文件。产生自该测定的所有其他数据不转移到MSBA数据库。
步骤3
多重生物标记测定读出的计算
多重生物标记测定读出的计算通过应用MSBA算法而实施,所述MSBA算法由计算诊断性MSBA得分的辨别函数组成。
辨别函数定义为函数x1,...,xn,其中xi代表第i个生物标记的n绝对或相对信号强度。辨别函数的输出根据诊断结果必须是阳性或阴性值。例如,如果诊断为阳性,辨别函数的输出值必须是阳性的,反之亦然。
例如,利用的辨别函数为等式2:
Σ i = 1 n a i x i - a θ x total - - - ( Eq 2 )
其中n是用于诊断的多重生物标记的数量。xi是第i个生物标记的绝对或相对信号强度,并且xtotal是MS测量的总信号强度。
还有包括在MSBA软件的算法中的权重因子。
矢量{a1,...,an,aθ}是确定分离的超平面法矢量的方向的权矢量,其将n维信号强度空间分为两种:诊断阳性和诊断阴性。确定权矢量的方法的一个例子在后将进行描述,然而,可利用多重算法,例如,支撑矢量机(Support Vector Machine),人工神经网络(Artificial NeuralNetwork)及其他,以确定权矢量。
辨别函数的另一例子包括在MSBA算法中并且定义如下:
αfp(x1,...,xn)-βfn(x1,...,xn)    (Eq3)
函数fp和fn是产生一组待诊断患者中的测量的生物标记和数组MSBA服务器中的参考生物标记信号之间的相似性或距离的度量的任意函数。fp表示来自诊断阳性参考的相似性或差异函数,并且fn表示来自诊断阴性参考的相似性或差异函数。
α和β是可用于不相等地加权诊断阳性和诊断阴性度量的系数。
如果函数fp和fn产生了类似性度量,则当等式3产生阳性值时患者样品将诊断为阳性。如果该函数产生距离度量,等式3的阳性值表示诊断阴性。
所述函数的一个例子是欧几里德距离(Euclidean distance),其中yi是在待诊断患者中第i个生物标记信号强度,
Σ i = 1 n ( y i - x i ) 2 - - - ( Eq 4 )
并且xi是参考组的第i个生物标记信号强度。
另一例子是以下式的回归分析的预测值的标准误差:
( n Σ i = 1 n y i 2 - ( Σ i = 1 n y i ) 2 - ( n Σ i = 1 n x i y i - ( Σ i = 1 n x i ) ( Σ i = 1 n y i ) ) 2 n Σ i = 1 n x i 2 - ( Σ i = 1 n x i ) 2 ) / n ( n - 2 ) - - - ( Eq 5 )
其中n是生物标记信号的数量,xi是患者样品的第i个测量信号强度,并且yi是通过利用线性回归线从每个xi中预测的值,其通过测量的xi的信号和参考信号之间最小二乘拟合而计算。
图2中概述了整个软件方案,包括控制方法内的每个特定步骤的算法。
步骤4
生物标记注解和定量
MSBA测定平台建立在:
A)分离的原理
B)非分离的原理
在非分离原理的情况中,我们能够进行生物标记注解和定量,通过:
(a)直接的MS-分析
i)通过利用静电纳米电雾化原理将生物样品直接输注。利用一次性的纳米喷射针,其中每个纳米喷射针将仅仅暴露于一个生物样品,由此回避了样品超载和记忆效果。
ii)流动注射分析模式,其中样品作为插塞(plug)注射。插塞内选择的样品体积与各自的生物标记蛋白序列的信号强度直接相关。对于低丰度生物标记还可能利用大(几ml)样品注射体积,由此到达质谱仪的离子信号效能的饱和(稳定状态)。
(iii)通过利用色谱固相提取富集柱的MS分析的样品富集流动注射。这种步骤允许同时清洁,通过清除样品内的基质成分,和生物标记的痕量富集。这种方法的优点是有可能从高度复杂的样品来源例如组织提取物中分析生物标记。
另外,在样品富集模式(iii)中,我们能够产生在2-500范围但不限于此的信号扩增因子。另外,本方法将提高以低水平表达的生物标记的可检测性,以及蛋白序列注解的精确性。
B)在分离分析中,液相色谱法(LC)整合的生物标记鉴定依赖于LC的高分辨率,其可在单柱模式中(见图x)操作,或在多柱模式中利用柱转换操作,其中样品以连续模式分析,由此提高样品通量。
MSBA编程
此处是计算权重矢量(或模型)和利用支撑矢量机算法预测诊断的核心部分的示例代码。这种代码以R-Language写成。一种模型(model)从训练数据组(train)构建,并然后被利用以产生给定测试数据组(test)的预测(pred)。数据组train和test是包含多种数量的数据点的数据框架,其由包含诊断结果的目标diag(分类值:“阳性”或“阴性”,该值对于pred的例子是空的),和包含每个生物标记的信号强度和总信号强度的矢量组成。MSBA编程将依赖于产生于在两个患者组上实施的蛋白序列筛选的数据,生物标记产生于所述患者组。
在MSBA软件之内的编程通过下述方式实施:
库(e1071)
model<-svm(Diag~.,数据=train)
##上述等式可计算模型,但太简单而不能反映等式2.
##选择的支撑矢量是:model$SV
##并且权重矢量是:model$coefs
pred<-predict(model,test)
实施例
下述实施例是来自肺癌研究的例示,所述研究通过在人血样中的LC-MS蛋白轮廓测量而实施。分析了两个患者组,具有差异蛋白表达差别的病例和对照癌症组被分析。
实施例1
实验细节
从每个患者大约取6ml血到包含肝素钠盐的采样试管中,并且上下混合2-3次。然后,在4℃下以2,000xg离心10分钟。从上清液中获得三ml的血浆。样品在-80℃冷冻保存。接下来,蛋白从血浆中抽提并且在耗尽丰富的人血浆白蛋白和IgG之后进行胰蛋白酶消化。如前所述(WO06100446),等分试样的分馏血浆样品然后通过LC-MS,然后MS/MS进行分析。
MSBA设计
多重生物标记概括设计代表了在肺癌研究中患者生物标记的多重表达数据。
产生于MSBA方法的10-重生物标记诊断读出分别例示了每个和每种生物标记(见图3)。数量差别,即在MSBA数据库中已知和储存的倍数改变的差别(见图1)与数量差别一起用于测定生物标记。产生于肺癌研究的生物标记数据从诊断多重MSBA读出中正确地将所有这些患者鉴定为阳性。
所有这些10个患者的得分在0.80-1.0的范围内。
图4显示了从多重测定中得到的生物标记注解的例子,其通过其中生物标记被MSBA软件识别的MS光谱,和接下来的代表了得到的CVLFPYGGCQGNGNK生物标记的MS/MS光谱(见图4)表示。MSBA匹配,利用应用了余弦相关性的MSBA-数据库中的参考生物标记光谱,显示余弦相关性等于或高于0.8。
表1代表MSBA-数据产生的细节,其中分析了被调节的生物标记的预定质量。
表1
  生物标记信号数   保留时间/分钟   MS-值组分质量m/z   MS/MS-值组分质量m/z   MS/MS光谱的平均相关性得分   倍数改变
  1   10.433   608.5   276.6,363.2,439.2,449.2,457.8,513.8,522.3,552.3,572.8,577.3,664.4,740.4,777.4,853.4,914.5,940.5,1043.5,1069.5   0.94   3.682
  2   19.94   862.5   229.1,286.2,298.2,303.2,325.2,432.2,506.8,515.3,550.3,560.3,567.4,595.4,603.3,611.8,620.3,621.4,666.4,673.4,795.4,802.4,856.4,873.4,908.5,1008.6,1012.5,1036.6,1137.6,1165.61222.6,1265.7,1293.7   0.96   3.625
  3   25.744   492.1   320.2,401.2,418.2,475.2,545.3,562.3,563.3,644.3,661.3,721.4,749.4,806.4,807.4,824.4   0.92   0.336
  4   32.057   838.6   245.1,499.2,727.4,760.3   0.93   0.442
  5   32.149   682.5   373.7,467.2,492.8,694.9,708.9,798.9,809.4,967.0,1001.6,1286.7,1301.7,1487.8   0.91   0.492
  6   35.108   767.5   175.1,331.7,410.7,411.7,420.2,507.2,549.2,598.8,707.3,792.4   0.93   3.250
  7   36.113   908.6   426.7,531.2,532.3,661.4,778.9,792.9,793.4,842.4,850.9,1008.4,1023.5,1110.5,1155.5,1284.6,1285.6,1341.6,1383.6,1428.6,1499.6,1612.7,1669.8   0.90   3.571
  8   36.232   1010.5   447.3,550.3,562.3,562.8,636.3,690.3,723.3,768.4,837.9,881.4,1053.5,1124.5,1271.6,1342.6,1445.6,1558.7,1615.7,1745.8   0.87   3.4
  9   69.621   851.1   -   0.89   0.355
  10   69.71   1236.5   379.2,405.2,463.7,514.3,587.8,631.4,638.3,692.4,737.8,760.4,761.4,816.9,895.4,903.9,917.9,956.5,1080.5,1137.1,1157.6,1158.6,1193.6,1229.1,1236.1,1243.1,1278.6,1286.6,1343.2,1345.6,1615.8,1616.8,1632.8   0.92   0.357
实施例2
下述另一实施例是源于肺疾病病例-对照研究,其通过在人血样品中的LC-MS蛋白轮廓测量(profiling)而实施。分析两个患者组,具有差异的蛋白表达分析的病例和对照肺疾病组。
实验细节
血浆样品收集和制备的程序与上述实施例相同。
MSBA模型建立和评价
由10个病例和36个对照组成的46个患者样品数据用于构建MSBA模型。我们已经分别构建了包含14,8,26,8,和11个信号的5个不同的MSBA模型。组合了5个模型之后,显示出最后的MSBA模型(5th)具有显著的辨别能力。由此我们在下面步骤中仅仅使用第5个模型。最后模型的11个信号的LC-MS信息(保留时间(分钟)/MS-值(m/z))如下:11.6/485.2,12.5/608.1,18.3/547.0,20.2/681.3,21.1/575.1,21.3/531.5,25.5/561.6,23.1/514.5,32.5/682.2,44.0/985.2,48.7/945.8。
为评价模型的可预测性,我们利用10个病例和9个对照尝试预测病例/对照,将其当作盲样品。根据上述MSBA诊断程序(也例示于图2),对每个测试样品鉴定11-重生物标记信号,并进行每个峰信号的定量。从所有11-重信号的数量中,利用上式(等式5)计算每个受试者的MSBA得分。在此实施例中,MSBA得分等于或大于1的受试者诊断为病例(表2,MSBA诊断)。结果,我们可正确预测所有样品,即,辨别能力为100%(见图5)。
实施例3
下述实施例也源于肺疾病病例-对照研究,其通过在两个患者组(病例和对照)的人血样品中的LC-MS蛋白轮廓测量(profiling)而实施。在此实施例中,另一组的多重生物标记用于构建MSBA模型,其具有大得多的不同患者数据组。
实验细节
血浆样品收集和制备的程序与上述实施例相同。
MSBA模型建立和评价
由21个病例和75个对照组成的96个患者的样品数据用作训练数据组。当样品数量提高时,样品变异性也提高。因此首先我们应用了Smirnov测试以除去异常信号。结果,包含很多异常值的5个样品也从分析组中除去。利用t-测试的结果,我们构建了包含100个候选生物标记信号的起始MSBA模型。然后通过递归地应用判别式分析从辨别模型中除去最小贡献信号,最后我们获得了具有10个信号的MSBA模型。见表3的10重标记信号列表。
在此实施例中,为计算判别式得分(z),我们利用了另一下式表示的记分函数。
z=∑ai·xi+C    (Eq.6)
(xi:信号强度,ai&C:表3所述系数)
如果分值是阳性,其解释为病例,否则为对照。
为评价模型的可预测性,我们利用相同的数据组(21个病例+75个对照,总共96个)尝试预测病例/对照。根据上述MSBA诊断程序(也例示于图2),对每个样品鉴定了10-重生物标记信号,对每个峰信号进行定量。从所有10-重信号的数量中,利用上式(等式6)计算每个受试者的MSBA得分。在此实施例中,MSBA得分等于或大于0的受试者诊断为病例。表4和图6显示自辨别结果。在图6中,每个点代表一个患者,并且垂直轴代表判别式得分(z)。在此实施例中,灵敏性是85.7%,特异性是82.7%,并且预测精确性是83.3%。
表2
表3
Figure A20078002190000291
表4
Figure A20078002190000311

Claims (17)

1.确定样品中一种或多种多肽生物标记存在的方法,所述方法包括以下步骤:
(a)使样品进行质谱(MS)分析并且记录每个检测信号的保留时间指数和相应质量;
(b)使相应于每个信号的质量与生物标记质量的参考数据库相关联,以形成每个信号和参考生物标记之间的相关性,并抛弃那些质量不与参考生物标记质量相关的信号;
(c)储存那些质量与参考生物标记相关的信号;
(d)通过利用相似性度量将每个信号的MS光谱与数据库中参考生物标记的MS光谱匹配,确定每个储存信号和参考生物标记之间的相关性,以界定一组阳性相关信号;
(d)测量每个阳性相关信号的强度,并利用辨别函数对它的绝对信号强度或相对信号强度记分;
(e)将阈值应用于获自辨别函数的得分值,以确定生物标记的存在或不存在。
2.权利要求1的方法,其中使测试样品在没有预先的分离操作的情况下进行MS分析。
3.权利要求2的方法,其中通过利用静电纳米电雾化原理的直接输注、流动注射分析或样品富集流动注射分析测试样品。
4.权利要求1的方法,其中测试样品在MS分析之前被处理。
5.权利要求4的方法,其中所述样品处理包括通过单相或多相高压液相色谱法(HPLC)的样品分离。
6.前述任一项权利要求的方法,其中MS是电雾化离子化(ESI)MS、基质辅助激光解吸电离-飞行时间(MALDI-TOF)MS或表面增强激光解吸电离-飞行时间(SELDI-TOF)MS。
7.前述任一项权利要求的方法,其中用于多种生物标记的参考质量和MS光谱数据以电子形式或纸件形式储存。
8.前述任一项权利要求的方法,其中用于给定的生物标记的参考MS光谱是通过聚类计算而由实际和测量数据获得的平均光谱。
9.前述任一项权利要求的方法,其中参考肽的一种或多种内标在MS分析之前加入到样品中。
10.权利要求9的方法,其中内标用分子标签标记。
11.权利要求9的方法,其中内标被标记并包括在主数据组中。
12.权利要求11的方法,其中绝对信号强度通过测量生物标记信号强度并将其与一种或多种已知内标比较而记分。
13.权利要求1-9任一项的方法,其中在没有添加内标的情况下处理样品。
14.权利要求13的方法,其中通过测量患者中个体生物标记信号强度和患者组的参考信号强度之间的比例而对相对信号强度记分。
15.权利要求13的方法,其是完全自动化的。
16.权利要求1的方法,其中计算来自MS信号强度的得分的辨别函数任选包括利用任何临床变量,例如临床检查结果和/或临床观察的表型和/或医疗记录。
17.确定疾病的存在的诊断方法,所述方法包括比较测试样品的蛋白序列生物标记与参考生物标记,其中参考生物标记包括表1中鉴定的肽。
CNA2007800219002A 2006-06-13 2007-06-13 质谱法生物标记测定 Pending CN101611313A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GBGB0611669.3A GB0611669D0 (en) 2006-06-13 2006-06-13 Mass spectrometry biomarker assay
GB0611669.3 2006-06-13

Publications (1)

Publication Number Publication Date
CN101611313A true CN101611313A (zh) 2009-12-23

Family

ID=36745797

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2007800219002A Pending CN101611313A (zh) 2006-06-13 2007-06-13 质谱法生物标记测定

Country Status (10)

Country Link
EP (1) EP2035829A2 (zh)
JP (1) JP2009540319A (zh)
KR (1) KR20090068199A (zh)
CN (1) CN101611313A (zh)
AU (1) AU2007258970A1 (zh)
BR (1) BRPI0711967A2 (zh)
CA (1) CA2651934A1 (zh)
GB (1) GB0611669D0 (zh)
MX (1) MX2008015158A (zh)
WO (1) WO2007144606A2 (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102201039A (zh) * 2010-08-19 2011-09-28 上海聚类生物科技有限公司 一种分析ltq数据的方法
CN107683476A (zh) * 2015-05-29 2018-02-09 英国质谱公司 样品质谱分析
CN108427002A (zh) * 2017-02-13 2018-08-21 萨默费尼根有限公司 生成用于靶向质谱分析的包含列表的方法
CN109416360A (zh) * 2016-03-31 2019-03-01 迪森德克斯公司 生物标志物数据库的生成和用途
CN109477840A (zh) * 2016-05-24 2019-03-15 因欧沃私人有限责任公司 用于在卵内非破坏性地确定家禽性别的方法和***
CN109863239A (zh) * 2016-08-19 2019-06-07 莫纳什大学 用于病原体的鉴定和定量的光谱学***和方法
CN111316106A (zh) * 2017-09-05 2020-06-19 迪森德克斯公司 自动化样品工作流程门控和数据分析
CN111479464A (zh) * 2017-12-22 2020-07-31 阿西姆普托特有限公司 与用于生物样品的冷却条件相关的方法和***
CN111672658A (zh) * 2020-06-08 2020-09-18 深圳市康泓威科技有限公司 电子雾化设备最佳雾化温度的检测与控制方法及其电子雾化设备
CN112424825A (zh) * 2018-05-15 2021-02-26 文塔纳医疗***公司 染色聚集体中信号的定量
CN114965728A (zh) * 2021-02-18 2022-08-30 塞莫费雪科学(不来梅)有限公司 用数据非依赖性采集质谱分析生物分子样品的方法和设备

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011528790A (ja) * 2008-07-23 2011-11-24 ピー デバイシズ インコーポレーテッド プラズマを利用する携帯型診断装置及び診断方法
GB0906698D0 (en) 2009-04-17 2009-06-03 Queen Mary & Westfield College Method for quantifying modified peptides
KR101144237B1 (ko) * 2009-12-29 2012-05-11 한국기초과학지원연구원 고분해능 질량분석법과 약리활성검사를 이용한 천연물의 약리 활성물질 발굴 방법
GB201006360D0 (en) * 2010-04-16 2010-06-02 Immatics Biotechnologies Gmbh Method for differentially quantifying naturally processed HLA-restricted peptides for cancer, autoimmune and infectious diseases immunotherapy development
US9141756B1 (en) 2010-07-20 2015-09-22 University Of Southern California Multi-scale complex systems transdisciplinary analysis of response to therapy
GB201204278D0 (en) 2012-03-09 2012-04-25 Queen Mary & Westfield College Method
FR3016461B1 (fr) * 2014-01-10 2017-06-23 Imabiotech Procede de traitement de donnees d'imagerie moleculaire et serveur de donnees correspondant
DE102014000646B4 (de) * 2014-01-17 2023-05-11 Bruker Daltonics GmbH & Co. KG Massenspektrometrische Resistenzbestimmung durch Metabolismus-Messung
JP6613490B2 (ja) * 2016-02-19 2019-12-04 国立大学法人 宮崎大学 腺癌の検出方法
CA3101968A1 (en) * 2017-06-29 2019-01-03 Quanticision Diagnostics Canada, Inc. Apparatus and method for absolute quantification of biomarkers for solid tumor diagnosis
US10837970B2 (en) 2017-09-01 2020-11-17 Venn Biosciences Corporation Identification and use of glycopeptides as biomarkers for diagnosis and treatment monitoring
CN113383236A (zh) * 2018-11-23 2021-09-10 新加坡科技研究局 多属性鉴定未知生物样品的方法
KR102632163B1 (ko) 2022-04-13 2024-02-01 오보젠 주식회사 가금류 알(卵)의 암수 검사 및 선별장치 그리고 이를 이용한 선별방법

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8014952B2 (en) * 2002-12-18 2011-09-06 Queen Elizabeth Hospital Serum biomarkers in lung cancer
DE10324149A1 (de) * 2003-05-26 2004-12-16 Imat-Uve Gmbh Verfahren und Vorrichtung zur GC/MS- oder LC/MS-Screeninganalyse
CA2561535A1 (en) * 2004-03-30 2005-10-20 Eastern Virginia Medical School Lung cancer biomarkers
GB2430794B (en) * 2004-05-20 2009-10-21 Waters Investments Ltd Method and apparatus for identifying proteins in mixtures

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102201039A (zh) * 2010-08-19 2011-09-28 上海聚类生物科技有限公司 一种分析ltq数据的方法
CN107683476A (zh) * 2015-05-29 2018-02-09 英国质谱公司 样品质谱分析
CN109416360A (zh) * 2016-03-31 2019-03-01 迪森德克斯公司 生物标志物数据库的生成和用途
CN109477840B (zh) * 2016-05-24 2022-12-23 因欧沃控股私人有限责任公司 用于在卵内非破坏性地确定家禽性别的方法和***
CN109477840A (zh) * 2016-05-24 2019-03-15 因欧沃私人有限责任公司 用于在卵内非破坏性地确定家禽性别的方法和***
CN109863239A (zh) * 2016-08-19 2019-06-07 莫纳什大学 用于病原体的鉴定和定量的光谱学***和方法
CN108427002B (zh) * 2017-02-13 2021-01-12 萨默费尼根有限公司 生成用于靶向质谱分析的包含列表的方法
CN108427002A (zh) * 2017-02-13 2018-08-21 萨默费尼根有限公司 生成用于靶向质谱分析的包含列表的方法
CN111316106A (zh) * 2017-09-05 2020-06-19 迪森德克斯公司 自动化样品工作流程门控和数据分析
CN111479464A (zh) * 2017-12-22 2020-07-31 阿西姆普托特有限公司 与用于生物样品的冷却条件相关的方法和***
CN112424825A (zh) * 2018-05-15 2021-02-26 文塔纳医疗***公司 染色聚集体中信号的定量
CN111672658A (zh) * 2020-06-08 2020-09-18 深圳市康泓威科技有限公司 电子雾化设备最佳雾化温度的检测与控制方法及其电子雾化设备
CN114965728A (zh) * 2021-02-18 2022-08-30 塞莫费雪科学(不来梅)有限公司 用数据非依赖性采集质谱分析生物分子样品的方法和设备
CN114965728B (zh) * 2021-02-18 2024-04-12 塞莫费雪科学(不来梅)有限公司 用数据非依赖性采集质谱分析生物分子样品的方法和设备

Also Published As

Publication number Publication date
BRPI0711967A2 (pt) 2012-01-24
CA2651934A1 (en) 2007-12-21
MX2008015158A (es) 2009-04-30
GB0611669D0 (en) 2006-07-19
KR20090068199A (ko) 2009-06-25
JP2009540319A (ja) 2009-11-19
AU2007258970A1 (en) 2007-12-21
EP2035829A2 (en) 2009-03-18
WO2007144606A3 (en) 2008-04-03
WO2007144606A2 (en) 2007-12-21

Similar Documents

Publication Publication Date Title
CN101611313A (zh) 质谱法生物标记测定
Veenstra Global and targeted quantitative proteomics for biomarker discovery
Issaq et al. Peer reviewed: SELDI-TOF MS for diagnostic proteomics
US20060269944A1 (en) Mass Intensity profiling system and uses thereof
CN110838340B (zh) 一种不依赖数据库搜索的蛋白质生物标志物鉴定方法
Sokolowska et al. Applications of mass spectrometry in proteomics
CN112305121B (zh) 代谢标志物在动脉粥样硬化性脑梗死中的应用
EP1887351A1 (en) Screening method for specific protein in proteome comprehensive analysis
CN112305122B (zh) 代谢物标志物及其在疾病中的应用
Khan et al. Proteomics by mass spectrometry—Go big or go home?
O'riordan et al. Technology Insight: renal proteomics—at the crossroads between promise and problems
Merkley et al. A proteomics tutorial
CN101169417A (zh) 用磁珠支持基质及质谱判断正常人与肝癌的试剂盒和方法
CN112630344B (zh) 代谢标志物在脑梗死中的用途
Hachey et al. Proteomics in reproductive medicine: the technology for separation and identification of proteins
CN112147344B (zh) 动脉粥样硬化性脑梗死的代谢标志物及其在诊疗中的应用
Sigdel et al. Interpreting the proteome and peptidome in transplantation
Vaezzadeh et al. Proteomics and opportunities for clinical translation in urological disease
Del Boccio et al. Homo sapiens proteomics: clinical perspectives
Fassbender et al. Proteomic biomarkers for endometriosis
CN114624317B (zh) 一种基于直接进样质谱的定性和定量分析方法
Wang et al. SWATH-MS in proteomics: current status
Lottspeich Top down and bottom up analysis of proteins (focusing on quantitative aspects)
Winters et al. The future of cancer diagnostics: proteomics, immunoproteomics, and beyond
JPWO2007072648A1 (ja) 質量分析システムおよび質量分析方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20091223