CN101622360A - 脓毒症的诊断 - Google Patents

脓毒症的诊断 Download PDF

Info

Publication number
CN101622360A
CN101622360A CN200680052873A CN200680052873A CN101622360A CN 101622360 A CN101622360 A CN 101622360A CN 200680052873 A CN200680052873 A CN 200680052873A CN 200680052873 A CN200680052873 A CN 200680052873A CN 101622360 A CN101622360 A CN 101622360A
Authority
CN
China
Prior art keywords
biomarker
kinds
spectrum
experimenter
various features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200680052873A
Other languages
English (en)
Inventor
理查德·L·摩尔
石松
威廉姆·A·努斯鲍默
克雷格·C·怀特福特
托马斯·M·詹特尔
詹姆士·A·加勒特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Becton Dickinson and Co
Original Assignee
Becton Dickinson and Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Becton Dickinson and Co filed Critical Becton Dickinson and Co
Publication of CN101622360A publication Critical patent/CN101622360A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明提供了用于预测具有发展形成脓毒症风险的个体中脓毒症的发展的方法和装置。评价个体的生物标记谱中的特征。如果这些特征满足特定数值集,则该个体可能发展为脓毒症。本发明还提供了用于预测具有发展到脓毒症某一阶段的风险的个体中脓毒症某一阶段的发展的方法和装置。评价个体的生物标记谱的多种特征。如果这些特征值满足特定数值集,则该个体有可能发展为该阶段的脓毒症。提供了诊断个体脓毒症的方法和装置。评价个体的生物标记谱的多种特征。当所述多种特征满足特定数值集时,该个体可能发展为脓毒症。

Description

脓毒症的诊断
相关申请的交叉引用
本申请要求于2005年12月15日提交的美国临时专利申请号60/751,197的优先权,其在此通过引用全文引入。本申请也要求于2006年7月10日提交的美国临时专利申请号60/819,983的优先权,其在此通过引用全文引入。
1.发明领域
本发明涉及诊断或预测个体中脓毒症和/或其进展阶段的方法和组合物。本发明还涉及诊断个体中全身性炎症反应综合征的方法和组合物。
2.发明背景
疾病状态的早期检出通常可以进行更有效的治疗,从而获得相应的更有利的临床结果。然而多数情况下,由于疾病的复杂性,难以早期检测疾病的症状;因此,可能在被诊断之前,疾病已变为相对晚期。全身性炎症状况代表这样一类疾病。这些病症,尤其是脓毒症,通常(但不总是)由病原微生物和宿主的防御***之间的相互作用引起,该相互作用在宿主中引发过度且异常调节的炎性反应。全身炎症反应期间宿主应答的复杂性使得了解疾病发病机理的努力错综复杂(Healy,2002,Annul.Pharmacother.36:648-54中综述)。对疾病发病机理的不完全理解又导致难以发现有用的诊断性生物标记。然而,由于脓毒症非常快地发展成威胁生命的病症,所以迫切需要早期可靠的诊断。
个体中脓毒症的进展遵循明确的进程,从全身性炎症反应综合征(“SIRS”)-阴性进展为SIRS-阳性,然后再进展为脓毒症,然后可能发展成严重脓毒症、脓毒性休克、多器官功能障碍(“MOD”),最终死亡。当受感染的个体随后发生SIRS时,其也可能出现脓毒症。“脓毒症”通常定义为对SIRS感染的全身宿主应答同时存在已证实的感染。“严重脓毒症”与MOD、低血压、弥漫性血管内凝血(“DIC”)或者低灌注异常(包括乳酸性酸中毒、少尿和精神状态改变)有关。“脓毒性休克”通常定义为脓毒症诱导的耐受液体复苏的低血压,还存在低灌注异常。
已经证明,证实临床上对脓毒症重要的病原微生物的存在是困难的。通常通过培养个体的血液、痰、尿、伤口分泌物、内置线导管表面等来检测致病微生物。然而,致病微生物可能仅存在于体内的某些微环境中,从而使得所培养的具体材料可能不含有污染性微生物。感染部位的微生物数目少可使检测更加复杂。血液中病原体数目少给通过培养血液诊断脓毒症带来了具体困难。例如,在一项研究中,仅在17%的呈现脓毒症临床表现的个体中得到阳性培养结果(Rangel-Frausto等,1995,JAMA 273:117-123)。非病原微生物污染样品可使诊断更加复杂。例如,在对707名败血病患者的研究中,仅有12.4%的检出微生物具有临床意义(Weinstein等,1997,Clinical Infectious Diseases,24:584-602)。
与脓毒症相关的高发病率和高死亡率反映出该疾病早期诊断的困难。当前脓毒症是美国位居第十位的死亡原因并且在非冠脉(noncoronary)重病监护室(ICU)中的住院患者中特别普遍,在重病监护室中脓毒症是最常见的死亡原因。总死亡率高达35%,估计仅在美国每年就发生750,000例死亡。仅在美国治疗脓毒症的年花费就达数十亿美元。
因此,需要利用令人满意的特异性和灵敏性的技术来尽早诊断脓毒症,使得可以有效地干预和防止。
3.发明概要
本发明涉及用于诊断受试者脓毒症(包括脓毒症发作)的方法和组合物。本发明还涉及用于预测受试者脓毒症的方法和组合物。
本发明进一步涉及用于诊断或预测个体脓毒症发展阶段的方法和组合物。本发明还进一步涉及用于诊断受试者全身性炎症反应综合征(SIRS)的方法和组合物。
一方面,本发明提供一种预测具有发展成为脓毒症风险的受试者脓毒症进展的方法。该方法包括评价受试者的生物标记谱中的多种特征是否满足一个数值集,其中满足该数值集意味着该受试者将有可能发展成为脓毒症,该可能性取决于为了确定所述多种特征是否满足该数值集所应用的判定规则的准确性。在一些实施方案中,判定规则的准确性至少为60%、至少70%、至少80%或至少90%。因此,相应地,当多种特征满足该数值集时,个体发展成为脓毒症的可能性至少为60%、至少70%、至少80%或至少90%。
本发明的又一个方面包括诊断受试者脓毒症的方法。这些方法包括评价受试者的生物标记谱中的多种特征是否满足一个数值集,其中满足该数值集预测该受试者有可能患有脓毒症,该可能性取决于为了确定所述多种特征是否满足该数值集所应用的判定规则的准确性。当该多个生物标记包括补体成分C3和补体成分C4时,该多个生物标记包括三种或更多的生物标记。在一些实施方案中,判定规则的准确性至少为60%、至少70%、至少80%或至少90%。因此,相应地,当多种特征满足该数值集时受试者患有脓毒症的可能性至少为60%、至少70%、至少80%或至少90%。
在具体的实施方案中,生物标记谱包括至少两种特征,每一种特征代表在表1的第3列或第4列所列出的相应生物标记的特征。在一个实施方案中,生物标记谱包括在表1的第3列或第4列所列出的至少两种不同的生物标记。在这样的实施方案中,生物标记谱可以包括所述至少两种生物标记的各自相应的特征。通常,该至少两种生物标记来源于至少两种不同的基因。当该多个生物标记包括补体成分C3和补体成分C4时,该多个生物标记包括三种或更多生物标记。
在所述至少两种不同生物标记中的生物标记在表1的第3列列出的情况下,该生物标记可以是,例如,由所列基因获得的转录物、其互补物,或区别性片段或其互补物,或其cDNA,或cDNA的区别性片段,或扩增的对应于所有或部分转录物或其互补物的区别性核酸分子,或该基因编码的蛋白质,或该蛋白质的区别性片段,或上述任一的指示。进一步地,生物标记可以是,例如,在表1的第4列中列出的蛋白质,或该蛋白质的区别性片段,或上述任一的指示。在此,区别性分子或片段是在检测时指示上述转录物、cDNA、扩增的核酸或蛋白质的存在或丰度的分子或片段。根据该实施方案,本发明的生物标记谱可以使用本领域技术人员公知的任何标准测定法或本文所述用来检测生物标记的测定法而获得。所述测定法例如能够检测特定基因的表达产物(例如核酸和/或蛋白质)或目标基因的等位基因(例如表1中披露的基因)。在一个实施方案中,所述测定法利用核酸微阵列。在一些实施方案中,生物标记谱包括来自表1的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45或50种不同的生物标记。
在具体的实施方案中,生物标记谱包括至少两种特征,每一种特征代表在表4的第3列或第4列所列出的相应生物标记的特征。在一个实施方案中,生物标记谱包括在表4的第3列或第4列所列出的至少两种不同的生物标记。在这样的实施方案中,生物标记谱可以包括所述至少两种生物标记的各自相应的特征。通常,至少两种生物标记来源于至少两种不同的基因。在所述至少两种不同生物标记中的生物标记在表4的第3列列出的情况下,该生物标记可以是,例如,由所列基因获得的转录物、其互补物,或区别性片段或其互补物,或其cDNA,或cDNA的区别性片段,或扩增的对应于所有或部分转录物或其互补物的区别性核酸分子,或该基因编码的蛋白质,或该蛋白质的区别性片段,或上述任一的指示。进一步地,生物标记可以是,例如,在表4的第4列中列出的蛋白质,或该蛋白质的区别性片段,或上述任一的指示。在此,区别性分子或片段是在检测时指示上述转录物、cDNA、扩增的核酸或蛋白质的存在或丰度的分子或片段。根据该实施方案,本发明的生物标记谱可以使用本领域技术人员公知的任何标准测定法或本文所述用来检测生物标记的测定法而获得。所述测定法例如能够检测特定基因的表达产物(例如核酸和/或蛋白质)或目标基因的等位基因(例如表4中披露的基因)。在一个实施方案中,所述测定法利用核酸微阵列。在一些实施方案中,生物标记谱包括来自表4的至少2、3、4、5、6、7、8、9或10种不同的生物标记。在一些实施方案中,生物标记谱包括SERPINC1、APOA2和CRP。在一些实施方案中,生物标记谱包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括表4中的至少1、2、3、4、5、6或7种其它另外的生物标记。在一些实施方案中生物标记谱包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括来自表1、4、5、6和7的任意组合的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19和20或更多种另外的生物标记。在一些实施方案中,生物标记谱包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括来自表1、4、5、6和7的任意一个的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19和20或更多种另外的生物标记。在一些实施方案中,谱中的每种生物标记为蛋白质。在一些实施方案中,谱中的每种生物标记为核酸。在一些实施方案中,谱中的一些生物标记为核酸并且一些生物标记为蛋白质。
在具体的实施方案中,生物标记谱包括至少两种特征,每一种特征代表在表5的第3列或第4列所列出的相应生物标记的特征。在一个实施方案中,生物标记谱包括在表5的第3列或第4列所列出的至少两种不同的生物标记。在这样的实施方案中,生物标记谱可以包括所述至少两种生物标记的各自相应的特征。通常,所述至少两种生物标记来源于至少两种不同的基因。在所述至少两种不同生物标记中的生物标记在表5的第3列列出的情况下,该生物标记可以是,例如,由所列基因获得的转录物、其互补物,或区别性片段或其互补物、或其cDNA、或cDNA的区别性片段、或扩增的对应于所有或部分转录物或其互补物的区别性核酸分子、或该基因编码的蛋白质、或该蛋白质的区别性片段、或上述任一的指示。进一步地,生物标记可以是,例如,在表5的第4列中列出的蛋白质、或该蛋白质的区别性片段、或上述任一的指示。在此,区别性分子或片段是在检测时指示上述转录物、cDNA、扩增的核酸或蛋白质的存在或丰度的分子或片段。根据该实施方案,本发明的生物标记谱可以使用本领域技术人员公知的任何标准测定法或本文所述用来检测生物标记的测定法而获得。所述测定法例如能够检测特定基因的表达产物(例如核酸和/或蛋白质)或目标基因的等位基因(例如表5中披露的基因)。在一个实施方案中,所述测定法利用核酸微阵列。在一些实施方案中,生物标记谱包括来自表5的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45或50种不同的生物标记。
在具体的实施方案中,生物标记谱包括至少两种特征,每一种特征代表在表6的第3列或第4列所列出的相应生物标记的特征。在一个实施方案中,生物标记谱包括在表6的第3列或第4列所列出的至少两种不同的生物标记。在这样的实施方案中,生物标记谱可以包括所述至少两种生物标记的各自相应的特征。通常,至少两种生物标记来源于至少两种不同的基因。在所述至少两种不同生物标记中的生物标记在表6的第3列列出的情况下,该生物标记可以是,例如,由所列基因获得的转录物、其互补物、或区别性片段或其互补物、或其cDNA、或cDNA的区别性片段、或扩增的对应于所有或部分转录物或其互补物的区别性核酸分子、或该基因编码的蛋白质、或该蛋白质的区别性片段、或上述任一的指示。进一步地,生物标记可以是,例如,在表6的第4列中列出的蛋白质、或该蛋白质的区别性片段、或上述任一的指示。在此,区别性分子或片段是在检测时指示上述转录物、cDNA、扩增的核酸或蛋白质的存在或丰度的分子或片段。根据该实施方案,本发明的生物标记谱可以使用本领域技术人员公知的任何标准测定法或本文所述用来检测生物标记的测定法而获得。所述测定法例如能够检测特定基因的表达产物(例如核酸和/或蛋白质)或目标基因的等位基因(例如表6中披露的基因)。在一个实施方案中,所述测定法利用核酸微阵列。在一些实施方案中,生物标记谱包括来自表6的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25种不同的生物标记。
在具体的实施方案中,生物标记谱包括至少两种特征,每一种特征代表在表7的第3列或第4列所列出的相应生物标记的特征。在一个实施方案中,生物标记谱包括在表7的第3列或第4列所列出的至少两种不同的生物标记。在这样的实施方案中,生物标记谱可以包括所述至少两种生物标记的各自相应的特征。通常,所述至少两种生物标记来源于至少两种不同的基因。在所述至少两种不同生物标记中的生物标记在表7的第3列列出的情况下,该生物标记可以是,例如,由所列基因获得的转录物、其互补物、或区别性片段或其互补物、或其cDNA、或cDNA的区别性片段、或扩增的对应于所有或部分转录物或其互补物的区别性核酸分子、或该基因编码的蛋白质、或该蛋白质的区别性片段、或上述任一的指示。进一步地,生物标记可以是,例如,在表7的第4列中列出的蛋白质、或该蛋白质的区别性片段、或上述任一的指示。在此,区别性分子或片段是在检测时指示上述转录物、cDNA、扩增的核酸或蛋白质的存在或丰度的分子或片段。根据该实施方案,本发明的生物标记谱可以使用本领域技术人员公知的任何标准测定法或本文所述用来检测生物标记的测定法而获得。所述测定法例如能够检测特定基因的表达产物(例如核酸和/或蛋白质)或目标基因的等位基因(例如表7中披露的基因)。在一个实施方案中,所述测定法利用核酸微阵列。在一些实施方案中,生物标记谱包括来自表7的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23或24种不同的生物标记。
在具体的实施方案中,生物标记谱包括至少两种特征,每一种特征代表在表8的第3列或第4列所列出的相应生物标记的特征。在一个实施方案中,生物标记谱包括在表8的第3列或第4列所列出的至少两种不同的生物标记。在这样的实施方案中,生物标记谱可以包括所述至少两种生物标记的各自相应的特征。通常,所述至少两种生物标记来源于至少两种不同的基因。
在所述至少两种不同生物标记中的生物标记在表8的第3列列出的情况下,该生物标记可以是,例如,由所列基因获得的转录物、其互补物、或区别性片段或其互补物、或其cDNA、或cDNA的区别性片段、或扩增的对应于所有或部分转录物或其互补物的区别性核酸分子、或该基因编码的蛋白质、或该蛋白质的区别性片段、或上述任一的指示。进一步地,生物标记可以是,例如,在表8的第4列中列出的蛋白质、或该蛋白质的区别性片段、或上述任一的指示。在此,区别性分子或片段是在检测时指示上述转录物、cDNA、扩增的核酸或蛋白质的存在或丰度的分子或片段。根据该实施方案,本发明的生物标记谱可以使用本领域技术人员公知的任何标准测定法或本文所述用来检测生物标记的测定法而获得。所述测定法例如能够检测特定基因的表达产物(例如核酸和/或蛋白质)或目标基因的等位基因(例如表8中披露的基因)。在一个实施方案中,所述测定法利用核酸微阵列。在一些实施方案中,生物标记谱包括来自表8的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45或50种不同的生物标记。
在所述至少两种不同生物标记中的生物标记在表9的第3列列出的情况下,该生物标记可以是,例如,由所列基因获得的转录物、其互补物、或区别性片段或其互补物、或其cDNA、或cDNA的区别性片段、或扩增的对应于所有或部分转录物或其互补物的区别性核酸分子、或该基因编码的蛋白质、或该蛋白质的区别性片段、或上述任一的指示。进一步地,生物标记可以是,例如,在表9的第4列中列出的蛋白质、或该蛋白质的区别性片段、或上述任一的指示。在此,区别性分子或片段是在检测时指示上述转录物、cDNA、扩增的核酸或蛋白质的存在或丰度的分子或片段。根据该实施方案,本发明的生物标记谱可以使用本领域技术人员公知的任何标准测定法或本文所述用来检测生物标记的测定法而获得。所述测定法例如能够检测特定基因的表达产物(例如核酸和/或蛋白质)或目标基因的等位基因(例如表9中披露的基因)。在一个实施方案中,所述测定法利用核酸微阵列。在一个实施方案中,生物标记谱包括来自表9的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45或50种不同的生物标记。
在具体的实施方案中,生物标记谱包括至少两种特征,每一种特征代表在表1、4、5、6、7、8和9的任何组合的第3列或第4列所列出的相应生物标记的特征。在一个实施方案中,生物标记谱包括在表1、4、5、6、7、8和9的任何组合的第3列或第4列所列出的至少两种不同的生物标记。在这样的实施方案中,生物标记谱可以包括所述至少两种生物标记的各自相应的特征。通常,所述至少两种生物标记来源于至少两种不同的基因。在所述至少两种不同生物标记中的生物标记在表1、4、5、6、7、8和9的任何组合的第3列列出的情况下,该生物标记可以是,例如,由所列基因获得的转录物、其互补物、或区别性片段或其互补物、或其cDNA、或cDNA的区别性片段、或扩增的对应于所有或部分转录物或其互补物的区别性核酸分子、或该基因编码的蛋白质、或该蛋白质的区别性片段、或上述任一的指示。进一步地,生物标记可以是,例如,在表1、4、5、6、7、8和9的任何组合的第4列中列出的蛋白质、或该蛋白质的区别性片段、或上述任一的指示。在此,区别性分子或片段是在检测时指示上述转录物、cDNA、扩增的核酸或蛋白质的存在或丰度的分子或片段。根据该实施方案,本发明的生物标记谱可以使用本领域技术人员公知的任何标准测定法或本文所述用来检测生物标记的测定法而获得。所述测定法例如能够检测特定基因的表达产物(例如核酸和/或蛋白质)或目标基因的等位基因(例如表1、4、5、6、7、8和9的任何组合中披露的基因)。在一个实施方案中,所述测定法利用核酸微阵列。在一些实施方案中,生物标记谱包括来自表1、4、5、6、7、8和9的任何组合的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45或50种不同的生物标记。在一些实施方案中,生物标记谱包括下表4中所述的生物标记CRP、APOA2和SERPINC1。在一些实施方案中这三种生物标记为蛋白质。在一些实施方案中这三种生物标记为核酸。在一些实施方案中,这三种生物标记为蛋白质和核酸的任意组合。在一些实施方案中,生物标记谱包括CRP、APOA2和SERPINC1中的至少一种,并且另外包括表4中所述的1、2、3、4、5、6或7种生物标记。在一些实施方案中,生物标记谱包括CRP、APOA2和SERPINC1中的至少一种,并且另外包括来自表1、4、5、6、7、8和9的任何一个的第3列和/或第4列所列出的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多种另外的生物标记。在一些实施方案中,生物标记谱包括生物标记CRP、APOA2和SERPINC1中的至少一种,并且另外包括来自表1、4、5、6、7、8和9的任何组合的第3列和/或第4列所列出的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多种另外的生物标记。
在具体的实施方案中,生物标记谱包括至少四种特征,每一种特征代表在表1、4、5、6、7、8和9的任何组合的第3列或第4列所列出的相应生物标记的特征。在一个实施方案中,生物标记谱包括在表1、4、5、6、7、8和9的任何组合的第3列或第4列所列出的至少四种不同的生物标记。在这样的实施方案中,生物标记谱可以包括所述至少四种生物标记的各自相应的特征。通常,所述至少四种生物标记来源于至少四种不同的基因。在所述至少四种不同生物标记中的生物标记在表1、4、5、6、7、8和9的任何组合的第3列列出的情况下,该生物标记可以是,例如,由所列基因获得的转录物、其互补物、或区别性片段或其互补物、或其cDNA、或cDNA的区别性片段、或扩增的对应于所有或部分转录物或其互补物的区别性核酸分子、或该基因编码的蛋白质、或该蛋白质的区别性片段、或上述任一的指示。进一步地,生物标记可以是,例如,在表1、4、5、6、7、8和9的任何组合的第4列中列出的蛋白质、或该蛋白质的区别性片段、或上述任一的指示。在此,区别性分子或片段是在检测时指示上述转录物、cDNA、扩增的核酸或蛋白质的存在或丰度的分子或片段。根据该实施方案,本发明的生物标记谱可以使用本领域技术人员公知的任何标准测定法或本文所述用来检测生物标记的测定法而获得。所述测定法例如能够检测特定基因的表达产物(例如核酸和/或蛋白质)或目标基因的等位基因(例如表1、4、5、6、7、8和9的任何组合中披露的基因)。在一个实施方案中,所述测定法利用核酸微阵列。在一些实施方案中,生物标记谱包括来自表1、4、5、6、7、8和9的任何组合的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45或50种不同的生物标记。
尽管本发明的方法尤其可用于检测或预测SIRS个体中脓毒症的发作,但是本领域技术人员应当理解本发明的方法可以用于任何个体,包括但不限于:怀疑患有SIRS或者处于脓毒症的任一阶段的个体。例如,可以从个体采集生物样品,并且可以根据从几种不同类型的训练群体中获得的生物标记谱评价该样品中的生物标记谱。典型的训练群体不同地包括,例如,包括SIRS阴性个体的群体,包括SIRS阳性个体的群体,和/或包括特定脓毒症阶段的个体的群体。根据这些不同训练群体每个群体生物标记谱的评价可以用来确定受试者是SIRS-阴性的还是SIRS-阳性的,是可能发展为脓毒症还是已经患有脓毒症的特定阶段。以本发明的方法所得的诊断为基础,可以启动合适的治疗方案。
在具体的实施方案中,本发明也提供可用于诊断或预测个体中脓毒症或SIRS发展的试剂盒(见下文的第5.3节)。本发明的一些试剂盒包含至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、96或更多种生物标记和/或用来检测所述生物标记的存在或丰度的试剂。在一些实施方案中,每一生物标记都来自表1。在一些实施方案中,每一生物标记都来自表4。在一些实施方案中,试剂盒中的三种生物标记为CRP、APOA2和SERPINC1。在一些实施方案中,试剂盒中的生物标记为SERPINC1、APOA2和CRP中的至少一种,以及来自表1、4、5、6、7、8和9的任何组合的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多种另外的生物标记。在一些实施方案中,试剂盒中的生物标记为SERPINC1、APOA2和CRP中的至少一种,以及来自表1、4、5、6、7、8和9的任何一个的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多种另外的生物标记。在一些实施方案中,每一生物标记来自表5。在一些实施方案中,每一生物标记都来自表6。在一些实施方案中,每一生物标记都来自表7。在一些实施方案中,每一生物标记都来自表1、4、5、6、7、8和9的任何组合。在另一个实施方案中,本发明的试剂盒包含至少两种但也可多达一百种或更多种的生物标记和/或用来检测这些生物标记的存在或丰度的试剂。
在具体的实施方案中,本发明的试剂盒包含至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、96、100或200种或更多的特异性结合本发明生物标记的试剂。例如,所述试剂盒可以包含特异性结合本发明生物标记的核酸分子和/或抗体分子。
在本发明中有用的具体示例性的生物标记在第6节的表1、4、5、6、7、8和9中描述。本发明试剂盒的生物标记可以用来产生本发明的生物标记谱。所述试剂盒内的生物标记和/或试剂类型的例子包括但不限于蛋白质及其片段、肽、多肽、抗体、蛋白聚糖、糖蛋白、脂蛋白、碳水化合物、脂质、核酸(例如mRNA、DNA、cDNA、siRNA)、有机和无机化学物质、天然和合成聚合物、或其区别性分子或片段。
本发明的另一方面包括用于评价受试者是否可能发展成为脓毒症或SIRS的计算机和计算机可读介质。例如,本发明的一个实施方案提供一种与计算机***结合使用的计算机程序产品。该计算机程序产品包括计算机可读存储介质和嵌入其中的计算机程序机制。该计算机程序机制包括评价具有发展成为脓毒症风险的受试者的生物标记谱中的多种特征是否满足第一数值集的指令。满足该第一数值集则预示该受试者可能会发展成为脓毒症。在一些实施方案中,该特征为包括表1、4、5、6、7、8和9中任何一个列出的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种生物标记的多个生物标记的可测量方面。当所述多个生物标记包括补体成分C3和补体成分C4时,该多个生物标记包括三种或更多的生物标记。在一些实施方案中,该特征为包括表1、4、5、6、7、8和9的任何组合列出的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种生物标记的多个生物标记的可测量方面。在一些实施方案中,计算机程序产品进一步包括评价受试者的生物标记谱中的多种特征是否满足第二数值集的指令。满足第二数值集预测该受试者可能不会发展成为脓毒症。在一些实施方案中,所述生物标记谱具有表1、4、5、6、7、8和9的一个所列出的3-50种生物标记、表1、4、5、6、7、8和9的一个所列出的3-40种生物标记、表1、4、5、6、7、8和9的一个列出的至少四种生物标记或表1、4、5、6和7列出的至少六种生物标记。在一些实施方案中,生物标记谱具有来自表4的第3列和/或第4列的至少1、2、3、4、5、6、7、8、9或10种生物标记。在一些实施方案中,生物标记谱包括CRP、APOA2和SERPINC1。在一些实施方案中,生物标记谱包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括表4中的至少1、2、3、4、5、6或7种其它另外的生物标记。在一些实施方案中,生物标记谱包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括来自表1、4、5、6、7、8和9的任何组合的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种或更多另外的生物标记。在一些实施方案中,生物标记谱包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括来自表1、4、5、6、7、8和9的任何一个的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20种或更多另外的生物标记。
本发明的另一计算机实施方案包括中央处理器和与中央处理器连接的存储器。该存储器存储评价具有发展成为脓毒症风险的受试者的生物标记谱中多种特征是否满足第一数值集的指令。满足第一数值集预测该受试者可能发展成为脓毒症。这些特征是多种生物标记的可测量方面。在一些实施方案中,所述多种生物标记包括来自表1、4、5、6、7、8和9的一个的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20种生物标记。在一些实施方案中,所述多种生物标记包括来自表1、4、5、6、7、8和9的任何组合的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20种生物标记。在一些实施方案中,所述存储器进一步存储评价受试者的生物标记谱中的多种特征是否满足第二数值集的指令,其中满足第二数值集预测该受试者可能不会发展成为脓毒症。在一些实施方案中,所述生物标记谱由表1、4、5、6和7的一个所列出的3-50种生物标记,表1、4、5、6、7、8和9的一个所列出的3-40种生物标记,表1、4、5、6、7、8和9的一个所列出的至少四种生物标记,表1、4、5、6、7、8和9的一个所列出的至少八种生物标记组成。在一些实施方案中,当多种生物标记包括补体成分C3和补体成分C4时,所述多种生物标记包括三种或更多生物标记。
本发明的另一计算机实施方案包括用于确定受试者是否可能发展成为脓毒症的计算机***。该计算机***包括中央处理器和与中央处理器连接的存储器。该存储器存储获得受试者的生物标记谱的指令。所述生物标记谱包括多种特征。在一些实施方案中,所述多种特征包括表1、4、5、6、7、8和9的任何一个所列出的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种生物标记。在一些实施方案中,所述多种特征包括表1、4、5、6、7、8和9的任何组合所列出的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种生物标记。当所述多种特征包括补体成分C3和补体成分C4的特征时,所述多种特征包括三种或更多生物标记。该存储器进一步包括用于将生物标记谱传送至远程计算机的指令。该远程计算机包括评价受试者的生物标记谱中的多种特征是否满足第一数值集的指令。满足第一数值集预测该受试者可能发展成为脓毒症。该存储器进一步包括从远程计算机接收关于该受试者的生物标记谱中的多种特征是否满足第一数值集的判定结果的指令。该存储器还包括报告该受试者的生物标记谱中的多种特征是否满足第一数值集的指令。在一些实施方案中,所述远程计算机进一步包括评价受试者的生物标记谱中的多种特征是否满足第二数值集的指令。满足第二数值集预测该受试者可能不会发展成为脓毒症。在这样的实施方案中,所述存储器进一步包括从远程计算机接收关于该受试者的生物标记谱中的多种特征是否满足第二数值集的判定结果的指令,以及报告该受试者的生物标记谱中的多种特征是否满足第二数值集的指令。在一些实施方案中,所述多种生物标记包括CRP、APOA2和SERPINC1。在一些实施方案中,所述生物标记谱包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括表4中列出的至少1、2、3、4、5、6或7种其它另外的生物标记。在一些实施方案中,生物标记谱包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括来自表1、4、5、6、7、8和9的任何组合的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20种或更多另外的生物标记。在一些实施方案中,生物标记谱包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括来自表1、4、5、6、7、8和9的任何一个的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20种或更多另外的生物标记。在一些实施方案中,多种生物标记包括来自表4的至少两种生物标记。在一些实施方案中,当多种生物标记包括补体成分C3和补体成分C4时,所述多种生物标记包括三种或更多生物标记。
本发明的又一实施方案包括表现为载波的数字信号,其包括生物标记谱中多种特征中每一个的相应值。所述多种特征是多种生物标记的可测量方面。在一些实施方案中,所述多种生物标记包括表1、4、5、6、7、8和9的任何一个所列出的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种生物标记。在一些实施方案中,所述多种生物标记包括表1、4、5、6、7、8和9的任何组合所列出的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种生物标记。在一些实施方案中,所述多种生物标记包括来自表4的至少2、3、4、5、6、7、8、9或10种生物标记。在一些实施方案中,所述多种生物标记包括CRP、APOA2和SERPINC1。在一些实施方案中,所述多种生物标记包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括表4中的至少1、2、3、4、5、6或7种其它另外的生物标记。在一些实施方案中,所述多种生物标记包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括来自表1、4、5、6、7、8和9的任何组合的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20种或更多另外的生物标记。在一些实施方案中,当所述多种生物标记包括补体成分C3和补体成分C4时,所述多种生物标记包括三种或更多生物标记。
本发明的又一方面提供表现为载波的数字信号,其包括关于受试者的生物标记谱中的多种特征是否满足一个数值集的判定结果。所述多种特征是多种生物标记的可测量方面。在一些实施方案中,所述多种生物标记包括表1、4、5、6、7、8和9的任何一个所列出的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种生物标记。在一些实施方案中,所述多种生物标记包括表1、4、5、6、7、8和9的任何组合所列出的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种生物标记。满足该数值集预测该受试者可能发展成为脓毒症。在一些实施方案中,所述多种生物标记包括CRP、APOA2和SERPINC1。在一些实施方案中,所述多种生物标记包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括来自表1、4、5、6、7、8和9的任何组合的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20种或更多另外的生物标记。在一些实施方案中,所述多种生物标记包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括来自表1、4、5、6、7、8和9的任何一个的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20种或更多另外的生物标记。在一些实施方案中,所述多种生物标记包括表4的第3列或第4列所列出的至少2、3、4、5、6、7、8、9或10种生物标记。在一些实施方案中,当所述多种生物标记包括补体成分C3和补体成分C4时,所述多种生物标记包括三种或更多生物标记。
本发明的又一实施方案提供表现为载波的数字信号,其包括关于受试者的生物标记谱中的多种特征是否满足一个数值集的判定结果。所述多种特征是多种生物标记的可测量方面。在一些实施方案中,所述多种生物标记包括表1、4、5、6、7、8和9的任何一个所列出的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种生物标记。所述多种生物标记包括表1、4、5、6、7、8和9的任何组合所列出的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种生物标记。满足该数值集预测该受试者可能不会发展成为脓毒症。在一些实施方案中,所述多种生物标记包括CRP、APOA2或SERPINC1。在一些实施方案中,所述多种生物标记包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括表4中的至少1、2、3、4、5、6或7种其它另外的生物标记。在一些实施方案中,所述多种生物标记包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括来自表1、4、5、6、7、8和9的任何组合的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20种或更多另外的生物标记。在一些实施方案中,所述多种生物标记包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括来自表1、4、5、6、7、8和9的任何一个的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20种或更多另外的生物标记。在一些实施方案中,当所述多种生物标记包括补体成分C3和补体成分C4时,所述多种生物标记包括三种或更多生物标记。
本发明的另一实施方案提供一种用于确定受试者是否可能发展成为脓毒症的图形用户界面。该图形用户界面包括一个显示区,该显示区用于显示从远程计算机接收的表现为载波的数字信号中编码的结果。所述特征是多种生物标记的可测量方面。在一些实施方案中,所述多种生物标记包括表1、4、5、6、7、8和9的任何一个所列出的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种生物标记。在一些实施方案中,所述多种生物标记包括表1、4、5、6、7、8和9的任何组合所列出的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种生物标记。当受试者的生物标记谱中的多种特征满足第一数值集时,所述结果具有第一数值。当受试者的生物标记谱中的多种特征满足第二数值集时,所述结果具有第二数值。在一些实施方案中,所述多种生物标记包括CRP、APOA2或SERPINC1。在一些实施方案中,所述多种生物标记包括来自表4的至少2、3、4、5、6、7、8、9或10种生物标记。在一些实施方案中,所述多种生物标记包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括表4中的至少1、2、3、4、5、6或7种其它另外的生物标记。在一些实施方案中,所述多种生物标记包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括来自表1、4、5、6、7、8和9的任何组合的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20种或更多另外的生物标记。在一些实施方案中,所述多种生物标记包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括来自表1、4、5、6、7、8和9的任何一个的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20种或更多另外的生物标记。在一些实施方案中,当所述多种生物标记包括补体成分C3和补体成分C4时,所述多种生物标记包括三种或更多生物标记。
本发明的另一方面提供用于确定受试者是否可能发展成为脓毒症的计算机***。该计算机***包括中央处理器和与中央处理器连接的存储器。该存储器存储获得受试者的生物标记谱的指令。所述生物标记谱包括多种特征。所述多种特征是多种生物标记的可测量方面。在一些实施方案中,所述多种生物标记包括表1、4、5、6、7、8和9的任何一个所列出的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种生物标记。在一些实施方案中,所述多种生物标记包括表1、4、5、6、7、8和9的任何组合所列出的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种生物标记。该存储器进一步存储评价受试者的生物标记谱中的多种特征是否满足第一数值集的指令。满足第一数值集预测该受试者可能发展成为脓毒症。该存储器还存储报告该受试者的生物标记谱中的多种特征是否满足第一数值集的指令。在一些实施方案中,所述多种生物标记包括CRP、APOA2和SERPINC1。在一些实施方案中,所述多种生物标记包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括来自表1、4、5、6、7、8和9的任何组合的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20种或更多另外的生物标记。在一些实施方案中,所述多种生物标记包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括来自表1、4、5、6、7、8和9的任何一个的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20种或更多另外的生物标记。在一些实施方案中,所述多种生物标记包括来自表4的至少2、3、4、5、6、7、8、9或10种生物标记。在一些实施方案中,当所述多种生物标记包括补体成分C3和补体成分C4时,所述多种生物标记包括三种或更多生物标记。
在此公开的每一种方法、计算机程序产品和计算机可任选地进一步包括输出结果(例如至监视器、至用户、至计算机可读介质,例如存储介质或至远程计算机)的步骤或指令。
4.附图简述
图1显示本发明的计算机***。
图2根据本发明鉴定的蛋白质举例说明了参与区分脓毒症和SIRS患者的经典和替代的补体级联反应。
图3根据本发明鉴定的蛋白质举例说明了参与区分脓毒症和SIRS患者的内在凝血酶原活化途径。
5.优选实施方案的详述
本发明允许通过评价生物标记谱中的生物标记特征快速且准确地诊断或预测脓毒症。这些生物标记谱可以用个体在处于发展成为脓毒症风险的过程中的一个时间点(“快照”)或多个这样的时间点的的一种或多种生物样品来构建。有利地,可以在通常的临床症状发作前诊断或者预测脓毒症,从而允许更有效的治疗性干预。
5.1定义
“全身性炎症反应综合征”或“SIRS”是指由感染性的或非感染性的状况如局部或全身性感染、创伤、烫伤或无菌炎性过程(例如急性胰腺炎)引发的临床应答。SIRS在个体(i)经受对任何上述感染性的或非感染性的状况应答时,以及(ii)表现出以下一些临床表现时存在:
发烧(体温大于38.3℃);
低温(体温低于36℃);
心率(HR)大于90次/分钟或超过年龄标准值>2的标准偏差;
呼吸急促
精神状态改变;
显著的水肿或阳性的体液平衡(>20mL/kg超过24小时);
无糖尿病时的高血糖症(血浆葡萄糖>120mg/dL或7.7mmol/L);
白细胞增多(白细胞计数>12,000μL-1);
白细胞减少(白细胞计数<4,000μL-1);
正常的白细胞计数>10%未成熟的形式;
血浆C反应蛋白>标准值以上2个标准偏差;
血浆降钙素原>标准值以上2个标准偏差;
低动脉压(成人中SBP<90mmHg,MAP<80或SBP降低>40mmHg或<正常年龄以下两个标准偏差);
心脏指数>3.5L·min-1·M-23
动脉血氧过少(PaO2/FIO2<300);
急性少尿症(排尿<0.5mL·kg-1·hr-1或45mmol/L至少两小时);
肌酐增加>0.5mg/dL;
凝血异常(INR>1.5或aPTT>60秒);
肠梗阻(缺乏肠鸣音);
血小板减少症(血小板计数<100,000μL-1);
高胆红素血症(血浆总胆红素>4mg/dL或70mmol/L);
高乳酸血症(>1mmol/L);和
降低的毛细管再灌注或成斑。
SIRS的这些症状代表SIRS的公认的定义,该定义在将来可以被修改或者被其它定义所代替。本定义用于阐明当前的临床实践,并不代表本发明的关键方面。对于定义SIRS的标准的更多信息参见,例如American College ofChest Physicians/Society of Critical Care Medicine Consensus Conference:Definitions for Sepsis and Organ Failure and Guidelines for the Use of InnovativeTherapies in Sepsis,1992,Crit.Care.Med.20,864-874;Levy等,2003,“2001SCCM/ESICM/ACCP/ATS/SIS International Sepsis Definitions Conference”.Crit.Care Med.31,1250-1256;和Carrigan等,2004,“Toward Resolving theChallenges of Sepsis Diagnosis”,1301-1314,每篇在此通过引用整体引入。
SIRS个体具有被归为如上所定义的SIRS的临床表现,但是在临床上不被认为是脓毒症。确定哪些个体具有发展成为脓毒症风险的方法是本领域技术人员公知的。这些个体包括,例如,ICU中的患者和遭受生理创伤如烧伤、手术或者其它损伤的患者。SIRS的标志是产生促炎症状态,其表现为心动过速、呼吸急迫或呼吸过度、低血压、灌注不足、少尿、白细胞增多或白细胞减少、发热或体温过低和需要大量输液。SIRS特征性地不包括已证实的感染来源(例如菌血症)。
“脓毒症”是这样的状态,其中个体具有(i)SIRS和(ii)证实的或疑似的感染(例如,后来实验室确认有临床上意义的感染,如生物培养阳性)。因此,脓毒症是对感染的全身炎症应答(参见,例如American College of Chest PhysiciansSociety of Critical Care Medicine,Chest,1997,101:1644-1655,此处通过引用引入全部内容)。本文使用的术语“感染”指由微生物诱发的病理过程。所述感染可由致病的革兰氏阴性和***、厌氧菌、真菌、酵母或多种微生物引起。所述感染的非限制性部位为呼吸道感染、泌尿生殖器感染和腹内感染。本文使用的“脓毒症”包括脓毒症的所有阶段,包括但不限于脓毒症的发作、严重脓毒症、脓毒性休克和与脓毒症末期相关的多器官功能障碍(“MOD”)。
“脓毒症的发作”是指脓毒症的早期阶段,即,在其常规临床表现足以支持临床上怀疑脓毒症之前的阶段。因为本发明的方法用于在使用常规技术可以怀疑脓毒症的时间之前检测脓毒症,所以只能在脓毒症临床表现更明显的时候回顾性地证实个体在早期脓毒症时的疾病状态。个体发展成为脓毒症的确切机理不是本发明的关键方面。本发明的方法可不依赖于感染过程的来源而检测脓毒症的发病。
“严重脓毒症”是指与器官功能障碍、低灌注异常或脓毒症诱导的低血压有关的脓毒症。低灌注异常包括但不限于乳酸性酸中毒、少尿或者精神状态的急剧改变。
成人中的“脓毒性休克”指以其它因素无法解释的持续性低动脉压为特征的急性循环衰竭状态。低血压定义为在无其它引起低血压的因素时,即使有充分的容量复苏,动脉收缩压仍低于90mmHg(或在儿童中<2SD低于其年龄标准),MAP<60,或收缩压从基线降低>40mmHg。儿童和新生儿的血管紧张度比成年人高。因此,儿童中休克状态出现在高血压之前很久。儿科患者中的脓毒性休克定义为具有灌注音降低的心动过速(低体温患者中可能没有),包括与中心脉搏相比较降低的外周脉搏、警报信号改变、毛细管瞬间再灌注或毛细管再灌注>2秒、肢端麻或凉、或排尿量减少。在儿童中低血压为最近的和失代偿性休克的征兆。参见,例如Levy等,2003,“2001 SCCM/ESICM/ACCP/ATS/SIS International Sepsis Definitions Conference”,Crit.Care Med.31,1250-1256;和Carrigan等,2004,“Toward Resolving the Challenges of SepsisDiagnosis”,1301-1314;和Carcillo,2002,“Clinical Practice Paramaters forHemodynamic Support of Pediatric and Neonatal Patients in Septic Shock”,Crit.Care Med.30,第1-13页,每篇在此通过引用整体引入。
“转变者”或“转变个体”是指在被监视期间,通常在ICU停留期间,发展为在临床上怀疑有脓毒症的SIRS阳性患者。
“非转变者”非转变个体”是指在被监视期间,通常在ICU停留期间,不发展为在临床上怀疑有脓毒症的SIRS阳性患者。
“生物标记”是存在于或来源于生物样品的几乎任何可检测的化合物,如蛋白质、肽、多肽、蛋白聚糖、糖蛋白、脂蛋白、碳水化合物、脂质、核酸(例如,DNA如cDNA或扩增的DNA,或RNA,如mRNA)、有机或无机化学物质、天然或合成聚合物、小分子(例如代谢物)或上述任一物质的区别性分子或区别性片段。本文使用的“来源于”指化合物当被检测到时指示生物样品中存在特定分子。例如,特定cDNA的检测指示生物样品中存在特定的RNA转录物。作为另一个例子,对结合特定抗体的检测可指示生物样品中存在或缺少特定抗原(例如蛋白质)。在此,区别性分子或片段是当检测时指示上述化合物的存在或丰度的分子或片段。
生物标记可以,例如,从生物样品中分离、直接在生物样品中测量、或者在生物样品中检测或确定。生物标记例如可以是功能性的、部分功能性的、或非功能性的。在本发明的一个实施方案中,生物标记被分离并使用,例如,用来产生在多种诊断测定中便于检测生物标记的特异性结合抗体。任何免疫测定法可以使用能够结合生物标记分子的任何抗体、其抗体片段或衍生物(例如,Fab、F(ab′)2、Fv或scFv片段)。所述免疫测定法在本领域中公知。另外,如果生物标记是蛋白质或其片段,可以使用已经建立的技术测序或者克隆其编码基因。当特定的生物标记在此列出时,例如作为生物标记谱、试剂盒或其它的一部分,该生物标记可以是例如,所列生物标记的前体、所列生物标记的完全加工型、生物标记的剪接变体、其片段、其抗体或其区别性分子。在这里CRP例如可以是指C反应蛋白、C反应蛋白前体、其片段、其抗体、编码完整或其片段的核酸、其区别性分子或任何其它类型的CRP生物标记。在这里APOA2可以是指例如载脂蛋白A-II、载脂蛋白A-II前体、其片段、其抗体、编码完整或其片段的核酸、其区别性分子或任何其它类型的APOA2生物标记。在这里SERPINC1是指例如丝氨酸(或半胱氨酸)蛋白酶抑制因子(或任何其同义词,包括但不限于C亚型、抗凝血酶成员1、抗凝血酶-III前体、ATIII等等)、其片段、其抗体、编码完整或其片段的核酸、其区别性分子或任何其它类型的SERPINC生物标记。
本文使用的术语“生物标记种类”是指本文所述生物标记的任何区别性部分或区别性片段,如本文所述的特定基因(例如,下文表1、4、5、6、7、8和/或9中列出的基因)的剪接变体。在此,区别性部分或区别性片段是当检测时指示上述转录物、cDNA、扩增的核酸或蛋白质的存在或丰度的分子的部分或片段。
除非另外说明,本文使用的术语“蛋白质”、“肽”和“多肽”可以互换。
“生物标记谱”包括多种一个类型或多个类型的生物标记(例如mRNA分子、cDNA分子、蛋白质和/或碳水化合物等),或其指示,以及生物标记的特征,如可测量方面(如丰度)。生物标记谱包括至少两种所述生物标记或其指示,其中这些生物标记可以属于相同的或者不同的类别,如核酸和碳水化合物。生物标记谱还可以含有至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100种或更多生物标记或其指示。在一个实施方案中,生物标记谱含有数百或者甚至数千类型生物标记或其指示。生物标记谱还可以含有一种或多种对照或内标。在一个实施方案中,生物标记谱含有至少一种生物标记或其指示作为内标。在另一个实施方案中,生物标记谱含有一种类型或多种类型生物标记的指示。本文使用的术语“指示”仅指生物标记谱含有生物标记的符号、数据、缩写或其它类似的标记,而不是生物标记分子实体的本身。在一些实施方案中,生物标记谱包括来自表1、4、5、6、7、8和9任何一个的基因转录物量的标称指示。本发明的又另一示例性生物标记谱包含微阵列,物理量的来自表1、4、5、6、7、8和9任何一个的基因转录物结合到该微阵列上。在最后一种示例性生物标记谱中,至少20%、40%或40%以上的探针斑点是基于表1、4、5、6、7、8和9的一个表的序列。在另一示例性生物标记谱中,至少20%、40%或40%以上的探针斑点是基于表1、4、5、6、7、8和9的任何一个表所列出的生物标记的探针集中的序列。在一些实施方案中,当生物标记谱包括生物标记成分C3和补体成分C4时,该生物标记谱包括三种或更多生物标记。
典型的实施方案中,生物标记谱中的每种生物标记包括相应的“特征”。本文使用的“特征”是指生物标记的可测量方面。特征可以包括,例如,来自个体的生物样品中的生物标记的存在或不存在,如示例性生物标记谱1中所示:
示例性生物标记谱1.
  生物标记   特征样品中的存在
  基因A的转录物   存在
  基因B的转录物   不存在
在示例性生物标记谱1中,基因A的转录物的特征值是“存在”,基因B的转录物的特征值是“不存在”。
特征可以包括,例如,来自个体的生物样品中的生物标记的丰度,如示例性生物标记谱2中所示:
示例性生物标记谱2.
  生物标记   特征样品中的丰度,相对单位
  基因A的转录物   300
  基因B的转录物   400
在示例性生物标记谱2中,基因A的转录物的特征值是300单位,基因B的转录物的特征值是400单位。
特征还可以包括生物标记的两种或多种可测量方面的比值,如示例性生物标记谱3中所示:
示例性生物标记谱3
Figure G2006800528730D00291
Figure G2006800528730D00301
在示例性生物标记谱3中,基因A的转录物的特征值和基因B的转录物的特征值是0.75(300/400)。
特征还可以是从两种样品获得的相应生物标记的可测量方面之间的差异,其中这两种样品是两个不同时间点从个体采集。例如,考虑如下情况:生物标记是基因A的转录物,“可测量方面”是通过(例如)RT-PCR或微阵列分析确定的从个体获得的样品中该转录物的丰度。在该实例中,测定第一样品和第二样品中基因A的转录物的丰度。第一样品在第二样品之前数小时从个体采集。为了计算基因A的特征,从第二样品中基因A转录物的丰度中减去一种样品中基因A转录物的丰度。特征也可以是关于从个体中获得的生物样品中生物标记的丰度是否随时间增加的指示,和/或关于从个体中获得的生物样品中生物标记的丰度是否随时间降低的指示。
在一些实施方案中,在特征与生物标记谱中的生物标记之间存在一一对应关系,如以上示例性生物标记谱1所示。在一些实施方案中,特征和本发明的生物标记谱中的生物标记之间的关系更加复杂,如以上示例性生物标记谱3所示。
本领域技术人员应当理解,也可以设计其它计算特征的方法,所有这些方法都在本发明的范围内。例如,特征可以代表在两个或多个时间点从个体中采集的生物样品中生物标记的丰度的平均值。此外,特征可以是在一个时间点从个体中获得的生物样品的两种或多种生物标记的丰度差异或比值。生物标记谱也可以包含至少3、4、5、10、20、30种或更多的特征。在一个实施方案中,生物标记谱包含数百或者甚至上千特征。
在一些实施方案中,使用微阵列测量生物标记的特征。为了获得丰度数据而用来构建和处理微阵列的技术是众所周知的,例如由Draghici,2003,DataAnalysis Tools for DNA Microarrays,Chapman & Hall/CRC和国际公开WO03/061564中描述,每篇在此通过引用全文引入。微阵列包含多种探针。在一些情况中,每种探针识别例如结合不同的生物标记。在一些情况中,微阵列上两种或多种不同的探针识别例如结合相同的生物标记。因此,微阵列上的探针斑点与个体生物标记之间的关系一般是2∶1对应、3∶1对应或其它一些形式的对应关系。然而,也可以是微阵列上的探针与生物标记之间存在独特的一一对应关系。
“表型变化”是与个体的给定状态有关的参数的可检测的变化。例如,表型变化可以包括体液中生物标记的增加或者减少,其中该变化与SIRS、脓毒症、脓毒症发作有关,或与脓毒症进展的特定阶段有关。表型变化还可以包括该个体给定状态的可检测方面的变化,该变化不是生物标记的可测量方面的变化。例如,表型中的变化可以包括体温、呼吸率、脉搏、血压、或者其它生理参数的可检测的变化。这些变化可通过临床观察和使用本领域技术人员熟知的常规技术测量来确定。
本文使用的术语“互补的”在用于核酸序列(例如编码本文所述基因的核苷酸序列)时,是指特定含氮碱基之间由它们的氢键性质引起的化学亲和力。例如,鸟嘌呤(G)只与胞嘧啶(C)形成氢键,而腺嘌呤在DNA中只与胸腺嘧啶(T)形成氢键,在RNA中与尿嘧啶(U)形成氢键。这些反应被描述为碱基配对,配对的碱基(G与C,或A与T/U)被认为是互补的。因此,如果两种核酸序列的含氮碱基能够形成氢键,则它们可以是互补的。这些序列彼此被称为“互补物”。这些互补序列可以是天然存在的,或可以是通过本领域技术人员所知的任意方法化学合成的,例如,对于与DNA分子或RNA分子的有义链互补的反义核酸分子(例如mRNA转录物)。参见,例如,Lewin,2002,Genes VII.Oxford University Press Inc,New York,NY,其在此通过引用全文引入。
本文中使用的“常规技术”在谈及诊断或预测脓毒症或SIRS的内容中是那些基于表型变化对个体分类的技术,这些技术不会得到根据本发明的生物标记谱。
“判定规则(decision rule)”是用于评价生物标记谱的方法。该判定规则可以采取本领域中公知的一种或多种形式,如Hastie等,2001,The Elements ofStatistical Learning,Springer-Verlag,New York中所举例说明的形式,其在此通过引用全文引入。判定规则可施用于特征的数据集以例如预测脓毒症的发作、确定脓毒症的发展、或者诊断脓毒症。可以在本发明的一些实施方案中使用的示例性的判定规则在下文第5.5节进一步详细描述。
“预测脓毒症的发展”是确定个体是否将发展为脓毒症。任何这种预测都受用来进行这种确定的方法准确性的限制。本发明提供了一种方法,例如,通过利用判定规则进行这种确定,其准确率为60%或更高。本文使用的术语“预测脓毒症的发展”和“预测脓毒症”可以互换。在一些实施方案中,预测脓毒症的发展(预测脓毒症)通过使用指示脓毒症发展的判定规则评价来自个体的一种或多种生物标记谱来实现,并且作为这种评价的结果,得到指示个体将发展为脓毒症的判定规则的结果。这种用判定规则对来自受试者的一种或多种生物标记谱进行的评价是利用一种或多种生物标记谱中的一些或全部的特征来获得这种结果。
本文使用的术语“获得”和“得到”是指“拥有”。例如,这可以通过从计算机***的数据存储中接收数据来进行。例如,这也可以通过直接测量来进行。
本文使用的术语“特异性地”和类似的术语在抗体的背景中是指与一种抗原或片段特异性结合而不与其它抗原或其它片段特异性结合的肽、多肽和抗体或其片段。如通过标准实验技术所确定的,与一种抗原特异性结合的肽或多肽可以以更低亲和力地与其它肽或多肽结合,例如通过本领域技术人员公知的免疫测定法。这些免疫测定法包括但不限于放射免疫测定(RIA)和酶联免疫吸附测定(ELISA)。与抗原特异性结合的抗体或片段可以与相关抗原交叉反应。优选地,与抗原特异性结合的抗体或其片段不与其它抗原交叉反应。关于抗原-抗体相互作用、特异性和交叉反应性以及测定全部上述性质的方法的论述,参见例如,Paul编,2003,Fundamental Immunology,第5版,RavenPress,New York,第69-105页,其在此通过引用引入。
本文使用的“个体”是指动物,优选指哺乳动物,更优选指非人灵长类动物,最优选指人。术语“个体”、“个人”和“患者”在此可以互换使用。
本文使用的“受试者”一般是不在用来构建判定规则的训练群体中的任何个体。受试者任选地可以被怀疑患有脓毒症或具有发展成为脓毒症的风险。
本文使用的“组织类型”是组织的类型。组织是多细胞生物中具有共同的胚胎学来源或途径和类似的结构和功能的细胞的联合。组织细胞通常在细胞膜处相邻,但是有些情况下组织也可以是液体(例如血液)。组织的细胞可以全部是一种类型(简单组织,例如鳞状上皮、植物实质),或者是一种以上的类型(混合组织,例如,***)。
本文使用的“训练群体”是来自用来构建判定规则的个体群的一组样本,其使用数据分析算法,用于评价具有发展成为脓毒症风险的个体的生物标记谱。在优选实施方案中,训练群体包括来自为转变者的个体的样本和为非转变者的个体的样本。
本文使用的“数据分析算法”是使用训练群体中的个体的生物标记谱来构建判定规则的算法。代表性的数据分析算法在第5.5节描述。“判定规则”是数据分析算法的最终结果,其特征是一种或多种数值集,其中每个数值集指示SIRS的一个方面、脓毒症的发作、脓毒症、或对个体将发展为脓毒症的预测。在一个具体实例中,数值集代表对个体将发展为脓毒症的预测。在另一实例中,数值集代表对个体将不发展为脓毒症的预测。
本文使用的“验证群体”是从用来确定判定规则准确性的个体群体获得的一组样本。在优选实施方案中,验证群体包括来自转变者个体和非转变者个体的样本。在优选实施方案中,验证群体不包括用来训练判定规则的训练群体中的个体,正是要获取该判定规则的准确性测量。
本文使用的“数值集”是生物标记谱中特征的数值集合或数值范围。该数值集的性质和其中的数值取决于生物标记谱中存在的特征的类型和用来构建规定数值集的判定规则的数据分析算法。为了说明,再次考虑示例性生物标记谱2:
示例性生物标记谱2.
  生物标记   特征样品中的丰度,相对单位
  基因A的转录物   300
  基因B的转录物   400
在该实例中,获得训练群体每个成员的生物标记谱。每个生物标记谱包括基因A转录物的测量的特征,在此为丰度,和基因B转录物的测量的特征,在此为丰度。数据分析算法使用这些特征值,在此为丰度值,来构建判定规则。在该实例中,数据分析算法是如第5.5.1节所述的决策树,数据分析算法的最终结果,即判定规则,是决策树。一种示例性的决策树在图1中举例说明。判定规则限定数值集。一种这样的数值集预测脓毒症的发作。其生物标记特征值满足该数值集的个体可能发展为脓毒症。该类别中的一个示例性数值集是示例性数值集1:
示例性数值集1
  生物标记   数值集成分(样品中的丰度,相对单位)
  基因A的转录物   <400
  基因B的转录物   <600
另外一种这样的数值集预测无脓毒症状态。其生物标记特征值满足该数值集的个体可能不会发展为脓毒症。该类别中的一个示例性数值集是示例性数值集2:
示例性数值集2
  生物标记   数值集成分(样品中的丰度,相对单位)
  基因A的转录物   >400
  基因B的转录物   >600
如果数据分析算法是神经网络分析并且该神经网络分析的最终结果是适当加权的神经网络时,一种数值集是这样的生物标记谱特征值范围,其将导致加权的神经网络指示脓毒症可能发生。另一数值集是这样的生物标记谱特征值范围,其将导致加权神经网络指示不可能发生脓毒症。
本文使用的术语“探针斑点”在微阵列背景中是指单链DNA分子(例如单链cDNA分子或合成DNA寡聚体),在此被称为“探针”,其用来确定样品中特定核酸的丰度。例如,可以利用探针斑点确定来自受试者的生物样品(例如细胞集合)中mRNA的水平。在具体实施方案中,典型的微阵列包含置于载玻片(或其它基质)上已知网格位置中的多个探针斑点。用于每个探针斑点的核酸是基因或目标基因序列的单链相邻部分(例如10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个核苷酸或更大),并且是针对特定基因或目标基因编码的mRNA的探针。每一探针斑点由单一核酸序列表征,并且在使只与其互补DNA链或mRNA分子杂交的条件下杂交。同样,在基底上可以有多个探针斑点,并且每一个可代表独特的目标基因或序列。另外,两个或多个探针斑点可以代表相同的基因序列。在一些实施方案中,标记的核酸样品与探针斑点杂交,并且可以对与探针斑点特异性杂交的标记的核酸量进行定量,以确定特定生物样品中具体核酸(例如特定基因的mRNA转录物)的水平。探针、探针斑点和微阵列在Draghici,2003,Data Analysis Tools for DNA Microarrays,Chapman &Hall/CRC,第2章中总体地描述,在此通过引用全文引入。
本文使用的术语“注释数据”是指描述生物标记性质的任何类型的数据。注释数据包括但不限于生物途径成员、酶的类别(例如磷酸二酯酶、激酶、金属蛋白酶等)、蛋白质结构域信息、酶底物信息、酶促反应信息、蛋白质相互作用数据、疾病相关性、细胞定位、组织型定位和细胞型定位。
本文使用的术语“T-12”是指在个体被临床诊断为脓毒症之前最后一次从个体中获得的血液的时间。由于在本发明中每24小时采集个体的血液,因此T-12代表一群患者在脓毒症发作之前的平均时间,其中某些患者在12小时标志之前发展为脓毒症,某些患者在12小时标志之后发展为脓毒症。然而,在整个一群患者中,该最后一次采血的平均时间是12小时标志,在此命名为T-12”。
5.2筛查个体的方法
本发明允许通过对来自受试者的一种或多种生物样品中的每一种检测被怀疑发展成为脓毒症或具有发展成为脓毒症风险的受试个体的生物标记谱的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多种特征,来准确、快速地预测和/或诊断脓毒症。在一个实施方案中,只需要在一个时间点从受试者采集的一种生物样品来构建用来进行脓毒症预测或诊断的生物标记谱。在另一实施方案中,使用在不同时间点从受试者采集的多种生物样品来构建用来进行脓毒症预测或诊断的生物标记谱。
在本发明的特定实施方案中,使用本发明的方法筛查具有发展成为脓毒症或SIRS风险的个体。根据这些实施方案,可以利用本发明的方法筛查(例如)被送入ICU的个体和/或曾经经历某种创伤(例如手术、交通事故、枪伤等)的个体。
在特定实施方案中,在入院后采集生物样品,如血液。在一些实施方案中,生物样品是血液、血浆、血清、唾液、痰、尿、脑脊液、细胞、细胞提取物、组织标本、组织活检物或粪便标本。在一些实施方案中,生物样品是全血,并且应用该全血获得对生物标记谱的测量值。在一些实施方案中,生物样品是全血的某些成分。例如,在一些实施方案中,对血液细胞部分内或液体(例如血浆或血清部分)内的蛋白质、核酸和/或其它分子(例如代谢物)的混合物的某些部分进行解析,作为生物标记谱。这可以通过测量生物标记谱中生物标记的特征来实现。在一些实施方案中,生物样品是全血,但是由分离自全血的特定细胞型中的生物标记来解析生物标记谱。在一些实施方案中,生物样品是全血,但是由分离自全血的单核细胞中表达或以其它方式发现的生物标记来解析生物标记谱。在一些实施方案中,生物样品是全血,但是由分离自全血的红细胞中表达或以其它方式发现的生物标记来解析生物标记谱。在一些实施方案中,生物样品是全血,但是由分离自全血的血小板中表达或以其它方式发现的生物标记来解析生物标记谱。在一些实施方案中,生物样品是全血,但是由分离自全血的嗜中性粒细胞中表达或以其它方式发现的生物标记来解析生物标记谱。在一些实施方案中,生物样品是全血,但是由分离自全血的嗜酸性粒细胞中表达或以其它方式发现的生物标记来解析生物标记谱。在一些实施方案中,生物样品是全血,但是由分离自全血的嗜碱性粒细胞中表达或以其它方式发现的生物标记来解析生物标记谱。在一些实施方案中,生物样品是全血,但是由分离自全血的淋巴细胞中表达或以其它方式发现的生物标记来解析生物标记谱。在一些实施方案中,生物样品是全血,但是由分离自全血的单核细胞中表达或以其它方式发现的生物标记来解析生物标记谱。在一些实施方案中,生物样品是全血,但是由选自红细胞、血小板、嗜中性粒细胞、嗜酸性粒细胞、嗜碱性粒细胞、淋巴细胞和单核细胞的1、2、3、4、5、6或7种细胞型来解析生物标记谱。
在一些实施方案中,生物标记谱包括多种一个或多个类型的生物标记(例如mRNA分子、cDNA分子、蛋白质和/或碳水化合物等)或其指示以及生物标记的特征,如可测量的方面(例如丰度)。生物标记谱可包含至少两种这样的生物标记或其指示,其中生物标记可以属于相同或不同的类别,例如,核酸和碳水化合物。在一些实施方案中,生物标记谱包含至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、96或100或更多种的生物标记或其指示。在一个实施方案中,生物标记谱包含数百,或者甚至上千种生物标记或其指示。在一些实施方案中,生物标记谱包含至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50或更多种生物标记或其指示。在一些实施方案中,生物标记谱包含选自表1的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多种生物标记或其指示。在另一个实例中,一些实施方案中,生物标记谱包含选自表4的至少2、3、4、5、6、7、8、9或更多种生物标记或其指示。在另一个实例中,一些实施方案中,生物标记谱至少包含CRP、APOA2和SERPINC1或其指示。在一些实施方案中,生物标记谱包含SERPINC1、APOA2和CRP中的至少一种,并且另外包括表4的至少1、2、3、4、5、6或7种其它另外的生物标记。在一些实施方案中,生物标记谱包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括来自表1、4、5、6、7、8和9的任何组合的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多种另外的生物标记。在一些实施方案中,生物标记谱包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括来自表1、4、5、6、7、8和9的任何一个的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多种另外的生物标记。在另一个实例中,一些实施方案中,生物标记谱包括选自表5的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多种生物标记或其指示。在又一个实例中,一些实施方案中,生物标记谱包括选自表6的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多种生物标记或其指示。在一个实例中,一些实施方案中,生物标记谱包括选自表7的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多种生物标记或其指示。在一个实例中,一些实施方案中,生物标记谱包括选自表8的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多种生物标记或其指示。在一个实例中,一些实施方案中,生物标记谱包括选自表9的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多种生物标记或其指示。在一些实施方案中,当生物标记谱包括补体成分C3和补体成分C4时,该生物标记谱包括三种或更多种生物标记。在典型的实施方案中,生物标记谱中的每种生物标记表示为特征。换句话说,在生物标记和特征之间存在对应关系。在一些实施方案中,生物标记和特征之间的对应关系为1∶1,意味着对于每一种生物标记,存在一种特征。在一些实施方案中,对于每一种生物标记,存在一种以上的特征。在一些实施方案中,对应于生物标记谱中一种生物标记的特征数目不同于对应于该生物标记谱中另一生物标记的特征数目。由此,在一些实施方案中,假如在生物标记谱中存在至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、96、100种或更多种的生物标记,生物标记谱可能包含至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、96、100种或更多种的特征。在一些实施方案中,生物标记谱可以包含至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50种或更多种特征。
无论实施方案如何,这些特征都可以利用任何可重复的测量技术或测量技术的组合来确定。这些技术包括本领域中公知的那些技术,包括本文所述的任何技术,例如,在下文所披露的任何技术。一般来说,使用在一个时间点从个体中采集的生物样品或者使用在多个时间点采集的多种样品,利用这些技术测量特征值。在一个实施方案中,从采自个体的样品中获得生物标记谱的技术的一个例子是cDNA微阵列。在另一个实施方案中,从采自个体的样品中获得生物标记谱的技术的一个例子是基于蛋白质的测定法或其它形式的基于蛋白质的技术,如在BD Cytometric Bead Array(CBA)人类炎症试剂盒使用手册(BD Biosciences)中所述的,或在美国专利号5,981,180中描述的磁珠测定法,其在此通过引用全文引入,特别是其中关于测定生物样品中蛋白质浓度的各种方法的教导。在另一实施方案中,生物标记谱为混合的,意思是它包含一些为核酸或其指示的生物标记,和一些为蛋白质或其指示的生物标记。在这些实施方案中,基于蛋白质和基于核酸的技术都可以用来从采自个体的一种或多种样品中获得生物标记谱。换句话说,与作为核酸的生物标记谱中生物标记相关的特征的特征值通过基于核酸的测量技术(例如,核酸微阵列)获得,与作为蛋白质的生物标记谱中生物标记相关的特征的特征值通过基于蛋白质的测量技术获得。在一些实施方案中,生物标记谱可以使用试剂盒如以下第5.3节所述的试剂盒获得。
在特定实施方案中,以必要的频率(例如在ICU停留期间)使用本发明的方法和组合物筛查个体以诊断或预测个体的脓毒症或SIRS。在优选实施方案中,在个体到达ICU或其它的医疗机构后马上筛查。在一些实施方案中,在个体达到ICU或其它的医疗机构后每天筛查。在一些实施方案中,在个体到达ICU或其它的医疗机构后每1-4小时、1-8小时、8-12小时、12-16小时或16-24小时筛查。
5.3试剂盒
本发明还提供了可用于诊断或预测个体中脓毒症的发展或诊断个体中SIRS的试剂盒。在一些实施方案中,本发明的试剂盒含有至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、96、100、105、110、115、120、125、130、135、140、145、150种或更多种生物标记。在其它实施方案中,本发明的试剂盒含有至少2种、多达几百种或更多的生物标记。在具体的实施方案中,本发明的试剂盒含有至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、96、100、105、110、115、120、125、130、135、140、145、150种或更多种特异性结合本发明生物标记的试剂。可用于本发明的具体的生物标记在第5.6节以及第6节的表1、4、5、6、7、8和9中阐述。该试剂盒的生物标记可用于产生本发明的生物标记谱。试剂盒中化合物类别的实例包括但不限于蛋白质和其片段、肽、蛋白多糖、糖蛋白、脂蛋白、碳水化合物、脂类、核酸(例如DNA如cDNA或扩增的DNA,或RNA如mRNA)、有机或无机的化合物、天然或合成的聚合物、小分子(例如代谢产物)或任何上述的区别性分子或区别性片段。在此,区别性分子或片段为检测时指示目标分子(例如cDNA、扩增的核酸分子或蛋白质)存在或丰度的分子或片段。在具体的实施方案中,生物标记有特定的大小(例如至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、130、135、140、145、150、155、160、165、170、175、180、185、190、195或200Da或更大)。该生物标记可以是阵列的一部分,或该生物标记可以分开和/或单独包装。该试剂盒也可以包含用于产生本发明生物标记谱的至少一种内标。同样地,该内标或标准可以是任何上述化合物的类别。
在一个实施方案中,本发明提供包含探针和/或引物的试剂盒,该探针和/或引物可以固定或者不固定在基底上可寻址的位置(例如在微阵列上的那样)处。在特定实施方案中,本发明提供这样的微阵列。
本发明的试剂盒也可包含可用于检测包含在生物样品中的产生生物标记谱的生物标记的试剂。在具体实施方案中,本发明提供一种预测受试者中脓毒症发展的试剂盒,其含有多种抗体,所述抗体特异性结合表1、4、5、6、7、8和9的任何一个所列出的多个生物标记。在另一个具体实施方案中,本发明提供一种预测受试者中脓毒症发展的试剂盒,其含有多种抗体,所述抗体特异性结合表1、4、5、6、7、8和9的任何组合所列出的多个生物标记。根据该实施方案,试剂盒可含有一组抗体或其功能性片段或衍生物(例如,Fab、F(ab′)2、Fv或scFv片段),其特异性结合表1、4、5、6、7、8和9的任何一个所示的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25种或更多种的基于蛋白质的生物标记。在一些实施方案中,当试剂盒包括补体成分C3和补体成分C4的抗体时,该试剂盒包括表1、4、5、6、7、8和9的任何一个的中至少一种其它的生物标记的抗体。根据该实施方案,试剂盒可含有抗体或其功能性片段或衍生物(例如,Fab、F(ab′)2、Fv或scFv片段),其特异性结合本发明的生物标记。在一个实施方案中,所述抗体可以被可检测地标记。在一个实施方案中,该试剂盒包括表4中所示蛋白质任何组合的抗体。在一个实施方案中,该试剂盒包括CRP、APOA2、和SERPINC1的抗体。在一些实施方案中,生物标记谱包括SERPINC1、APOA2和CRP中的至少一种的抗体,并且另外包括表4中至少1、2、3、4、5、6或7种其它另外的生物标记的抗体。在一些实施方案中,生物标记谱包括SERPINC1、APOA2和CRP中的至少一种的抗体,并且另外包括来自表1、4、5、6、7、8和9的任何组合的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20种或更多种另外的生物标记的抗体。在一些实施方案中,该生物标记谱包括SERPINC1、APOA2和CRP中的至少一种的抗体,并且另外包括来自表1、4、5、6、7、8和9的任何一个的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20种或更多种另外的生物标记的抗体。
在本发明的其它实施方案中,试剂盒可含有特异性生物标记结合成分,如适体。如果生物标记含有核酸,那么试剂盒可以提供寡核苷酸探针,该探针能够与该生物标记或者该生物标记的互补链形成双链体。寡核苷酸探针可被可检测地标记。
本发明的试剂盒还可包含试剂如缓冲液,或可用于构建生物标记谱的其它试剂。通过包含多种抗细菌和抗真菌剂,例如,对羟苯甲酸酯、三氯叔丁醇、苯酚山梨酸等等可以确保防止微生物的作用。可能还希望包括等渗剂,如糖、氯化钠等。
本发明的一些试剂盒包含微阵列。在一个实施方案中,该微阵列包含多个探针斑点,其中多个探针斑点中至少20%的探针斑点对应于表1、4、5、6、7、8和9中任何一个的生物标记。在一些实施方案中,多个探针斑点中至少40%、或至少60%、或至少80%的探针斑点对应于表1、4、5、6、7、8和9中任何一个的生物标记。在一些实施方案中,该微阵列包含多个探针斑点,其中多个探针斑点中至少20%的探针斑点对应于表1、4、5、6、7、8和9中任何组合的生物标记。在一些实施方案中,多个探针斑点中至少40%、或至少60%、或至少80%的探针斑点对应于表1、4、5、6、7、8和9中任何组合的生物标记。在一些实施方案中,当多个探针斑点包含对应于补体成分C3和补体成分C4的斑点时,该多个探针斑点包括用于表1、4、5、6、7、8和9的至少一种任何其它生物标记的探针斑点。在一些实施方案中,微阵列由位于基底上的大约3个到大约100个探针斑点组成。在一些实施方案中,微阵列由位于基底上的大约3个到大约100个探针斑点组成。本文使用的“大约”是指在所述值的5%之内,在所述值的10%之内,或在所述值的25%之内。
本发明的一些试剂盒还包括一种与计算机***一起使用的计算机程序产品。在这样的试剂盒中,计算机程序产品包括计算机可读存储介质和嵌入其中的计算机程序机制。该计算机程序机制包括评价具有发展成为脓毒症风险的受试者的生物标记谱中的多种特征是否满足第一数值集的指令。满足该第一数值集则预示该受试者可能会发展成为脓毒症。在一个实施方案中,多个特征对应于包括表1、4、5、6、7、8和9中任何一个列出的生物标记。在一个实施方案中,所述多个特征对应于表1、4、5、6、7、8和9任意组合中列出的生物标记。在一个实施方案中,所述多个特征包括SERPINC1、APOA2和CRP的特征。在一些实施方案中,所述多个特征包括SERPINC1、APOA2和CRP中至少一种的特征,并且另外包括表4中至少1、2、3、4、5、6或7种其它生物标记。在一些实施方案中,所述多个特征包括SERPINC1、APOA2和CRP中至少一种的特征,并且另外包括表1、4、5、6、7、8和9的任何组合中的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20种或更多种生物标记的特征。在一些实施方案中,所述多个特征包括SERPINC1、APOA2和CRP中至少一种的特征,并且另外包括表1、4、5、6、7、8和9中任何一个的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种或更多种生物标记的特征。在一些实施方案中,当多个特征包括补体成分C3和补体成分C4时,所述多个特征包括表1、4、5、6、7、8和9任何一个中的至少一个其它生物标记。在一些试剂盒中,所述计算机程序产品还包括评价受试者的生物标记谱中的多种特征是否满足第二数值集的指令。满足第二数值集预测该受试者可能不会发展成为脓毒症。
本发明的一些试剂盒包括计算机,其具有中央处理器和与该中央处理器连接的存储器。该存储器存储评价具有发展成为脓毒症风险的受试者的生物标记谱中的多种特征是否满足第一数值集的指令。满足第一数值集预测该受试者可能发展成为脓毒症。在一个实施方案中,多种特征对应于表1、4、5、6、7、8和9的任何一个所列出的生物标记。在一个实施方案中,当多种特征包括补体成分C3和补体成分C4的特征时,所述多种特征包括表1、4、5、6、7、8和9的任何一个中至少一种任何其它生物标记的特征。在一个实施方案中,多种特征对应于表1、4、5、6、7、8和9的任何组合所列出的生物标记。
图1详述了一种支持以上所述功能的示例性***。该***优选地是计算机***10,其具有:
·中央处理器22;
·非易失性主存储器14,例如硬盘驱动器,用于存储软件和数据,该存储器14器由存储控制器12控制;
·***存储器36,优选高速随机存取存储器(RAM),用于存储***控制程序、数据和应用程序,包括从非易失性存储器14加载的程序和数据;***存储器36还可包括只读存储器(ROM);
·用户界面32,包括一种或多种输入装置(例如,键盘28)和显示器26或其它输出装置;
·网络接口卡20,用于连接到任何有线或无线通信网络34(例如,广域网,如因特网);
·内部总线30,用于将该***的上述部件互连;和
·电源24,为上述部件供电。
·计算机10的操作主要由操作***40控制,该操作***40由中央处理器22执行。操作***40可以存储在***存储器36中。在典型的执行***存储器36中,除了操作***40以外,还包括:
·文件***42,用于控制对本发明使用的各种文件和数据结构的存取;
·训练数据集44,用于根据本发明构建一种或多种判定规则;
·数据分析算法模块54,用于处理训练数据和构建判定规则;
·一种或多种判定规则56;
·生物标记谱评价模块60,用于确定受试者的生物标记谱中的多种特征是否满足第一数值集或第二数值集;
·受试者生物标记谱62,包括生物标记64和对于每种生物标记的特征66;和
·本发明选择的生物标记的数据库68(例如,表1、4、5、6、7、8和/或9)。
训练数据集46包括多个个体46的数据。对于每个个体46,存在个体标识符48和多种生物标记50。对于每个生物标记50,存在至少一种特征52。尽管图1未示出,但是对于每个特征52,存在一个特征值。对于采用数据分析算法构建的每个判定规则56,存在至少一个判定规则数值集58。
如图1所示,计算机10包括软件程序模块和数据结构。存储在计算机10中的数据结构包括训练数据集44、判定规则56、受试者生物标记谱62和生物标记数据库68。每个数据结构可以包含任何形式的数据存储***,包括但不限于平面ASCII或二进制文件、Excel电子表格、关系数据库(SQL)或联机分析处理(OLAP)数据库(MDX和/或其变形)。在一些特定实施方案中,这些数据结构均为一种或多种包括层次结构(例如,星型模式)的数据库的形式。在一些实施方案中,这些数据结构均为不具有明确层次的(例如,维数表未分层排列的)数据库的形式。
在一些实施方案中,***10存储或可存取的每种数据结构是单数据结构。在其它实施方案中,这些数据结构实际上包括多个数据结构(例如数据库、文件、文档),这些数据结构可以全部以同一计算机10为主机或者可以不全部以同一计算机10为主机。例如,在一些实施方案中,训练数据集44包括多个Excel电子表格,该Excel电子表格存储在计算机10上和/或存储在计算机10通过广域网34可寻址的计算机上。在另一实例中,训练数据集44包括数据库,该数据库存储在计算机10上或者分布在计算机10通过广域网34可寻址的一台或多台计算机之间。
应当理解,图1示出的许多模块和数据结构可以位于一台或多台远程计算机上。例如,本申请的一些实施方案是网络服务型实现的(web service-typeimplementation)。在这些实施方案中,生物标记谱评价模块60和/或其它模块可以存在于通过网络34与计算机10通信的客户计算机上。在一些实施方案中,例如,生物标记谱评价模块60可以是交互式网页。
在一些实施方案中,图1示出的训练数据集44、判定规则56和/或生物标记数据库68位于一台计算机(计算机10)上,而在其它实施方案中,一种或多种所述数据结构和模块位于一台或多台远程计算机(未示出)上。图1示出的数据结构和软件模块在一台或多台计算机上的任何设置都在本发明的范围内,条件是这些数据结构和软件模块是在网络34或通过其它电子手段互相可寻址的。因此,本发明完全包括多种计算机***阵列。
本发明的另一试剂盒包括用于评价受试者是否可能发展成为脓毒症或SIRS的计算机和计算机可读介质。例如,本发明的一个实施方案提供一种与计算机***结合使用的计算机程序产品。该计算机程序产品包括计算机可读存储介质和嵌入其中的计算机程序机制。该计算机程序机制包括评价具有发展成为脓毒症风险的受试者的生物标记谱中的多种特征是否满足第一数值集的指令。满足第一数值集预测该受试者可能发展成为脓毒症。在一些实施方案中,所述多种特征是多种生物标记的可测量方面。多种生物标记可包括表1、4、5、6、7、8和9的任何一个所列出至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种生物标记。在某些实施方案中,所述多种生物标记包括表1、4、5、6、7、8和9的任何组合所列出至少1、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种生物标记。在一些实施方案中,所述多种生物标记包括CRP、APOA2和SERPINC1。在一些实施方案中,所述多种生物标记包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括表4中的至少1、2、3、4、5、6或7种其它另外的生物标记。在一些实施方案中,所述多种生物标记包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括来自表1、4、5、6、7、8和9的任何组合的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种或更多种另外的生物标记。在一些实施方案中,所述多种生物标记包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括来自表1、4、5、6、7、8和9的任何一个的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种或更多种另外的生物标记。在一些实施方案中,当所述多种生物标记包括补体成分C3和补体成分C4时,所述多种生物标记包括来自表1、4、5、6、7、8和9的任何一个的至少一种其它生物标记。在一些实施方案中,所述计算机程序产品进一步包括评价受试者的生物标记谱中的多种特征是否满足第二数值集的指令。满足第二数值集预测该受试者可能不会发展成为脓毒症。在一些实施方案中,该生物标记谱具有表1、4、5、6、7、8和9的任何一个所列出的3种至50种生物标记,表1、4、5、6、7、8和9的任何一个所列出的3种至40种生物标记,表1、4、5、6、7、8和9的任何一个所列出的至少4种生物标记,或表1、4、5、6、7、8和9的任何一个所列出的至少8种生物标记。在一些实施方案中,该生物标记谱具有表1、4、5、6、7、8和9的任何组合所列出的3种至50种生物标记,表1、4、5、6、7、8和9的任何组合所列出的3种至40种生物标记,表1、4、5、6、7、8和9的任何组合所列出的至少4种生物标记,或表1、4、5、6、7、8和9的任何组合所列出的至少8种生物标记。
本发明的另一个试剂盒包括中央处理器和与该中央处理器连接的存储器。该存储器存储评价具有发展成为脓毒症风险的受试者的生物标记谱中的多种特征是否满足第一数值集的指令。满足第一数值集预测该受试者可能发展成为脓毒症。所述多种特征是多种生物标记的可测量方面。在一些实施方案中,多种生物标记包括表1、4、5、6、7、8和9的任何一个的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种生物标记。在一些实施方案中,所述多种生物标记包括来自表1、4、5、6、7、8和9的任何组合的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种生物标记。在一些实施方案中,所述多种生物标记包括CRP、APOA2和SERPINC1。在一些实施方案中,所述多种生物标记包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括表4中的至少1、2、3、4、5、6或7种其它另外的生物标记。在一些实施方案中,所述多种生物标记包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括来自表1、4、5、6、7、8和9的任何组合的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种或更多种另外的生物标记。在一些实施方案中,所述多种生物标记包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括来自表1、4、5、6、7、8和9的任何一个的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种或更多种另外的生物标记。在一些实施方案中,当所述多种生物标记包括补体成分C3和补体成分C4时,所述多种生物标记包括来自表1、4、5、6、7、8和9的任何一个的至少一种其它的生物标记。在一些实施方案中,该存储器进一步存储评价受试者的生物标记谱中的多种特征是否满足第二数值集的指令。满足第二数值集预测该受试者可能不会发展成为脓毒症。在一些实施方案中,生物标记谱由表1、4、5、6、7、8和9的任何一个所列出的3种至50种生物标记,表1、4、5、6、7、8和9的任何一个所列出的3种至40种生物标记,表1、4、5、6、7、8和9的任何一个所列出的至少4种生物标记,或表1、4、5、6、7、8和9的任何一个所列出的至少8种生物标记组成(例如,所有在表1中的生物标记,所有在表4中的生物标记,所有在表5中的生物标记,所有在表6中的生物标记,所有在表7中的生物标记,所有在表8中的生物标记)。在一些实施方案中,所述生物标记谱由表1、4、5、6、7、8和9的任何组合所列出的3种至50种生物标记,表1、4、5、6、7、8和9的任何组合所列出的3种至40种生物标记,表1、4、5、6、7、8和9的任何组合所列出的至少3、4、5、6、7、8、9或10种生物标记组成(例如,所有在表1或4中的生物标记,所有在表4或5中的生物标记,所有在表1、5、7、8和9中的生物标记)。
本发明的另一种试剂盒包括用于确定个体可能发展为脓毒症的计算机***。该计算机***包括中央处理器和与该中央处理器连接的存储器。该存储器存储用于获得受试者生物标记谱的指令。该生物标记谱包括多种特征。所述多种特征中的每种特征为对应于多种生物标记中生物标记的可测量方面。在一些实施方案中,所述多种生物标记包括表1、4、5、6、7、8和9的任何组合所列出至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种生物标记。在一些实施方案中,所述多种生物标记包括表1、4、5、6、7、8和9的任何一个所列出至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种生物标记。在一些实施方案中,所述多种生物标记包括CRP、APOA2和SERPINC1。在一些实施方案中,所述生物标记谱包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括表4中的至少1、2、3、4、5、6或7种其它另外的生物标记。在一些实施方案中,所述生物标记谱包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括来自表1、4、5、6、7、8和9的任何一个的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种或更多种另外的生物标记。在一些实施方案中,当所述多种生物标记包括补体成分C3和补体成分C4时,所述多种生物标记包括来自表1、4、5、6、7、8和9的任何一个的至少一种其它的生物标记。存储器进一步包括用于将生物标记谱传送至远程计算机的指令。该远程计算机包括用于评估受试者的生物标记谱中的多种特征是否满足第一数值集的指令。满足第一数值集预测该受试者可能发展成为脓毒症。该存储器进一步包括指令,用于接受来自远程计算机的、关于受试者的生物标记谱中多种特征是否满足第一数值集的结果。该存储器还包括用于报告受试者的生物标记谱中多种特征是否满足第一数值集的指令。在一些实施方案中,多种生物标记包括表1、4、5、6、7、8和9的任何一个所列出至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种生物标记。在一些实施方案中,所述多种生物标记包括表1、4、5、6、7、8和9的任何组合所列出至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种生物标记。在一些实施方案中,该远程计算机进一步包括用于评估受试者的生物标记谱中的多种特征是否满足第二数值集的指令。满足第二数值集预测该受试者可能不会发展成为脓毒症。在所述实施方案中,存储器进一步包括用于接受来自远程计算机的、关于受试者的生物标记谱中多种特征是否满足第二数值集的结果,以及用于报告受试者的生物标记谱中多种特征是否满足第二数值集的指令。
本发明的再另一方面包括表现为载波的数字信号,其包括生物标记谱中多种特征中每一个的相应值。所述多种特征是多种生物标记的可测量方面。在一些实施方案中,多种生物标记包括表1、4、5、6、7、8和9的任何一个所列出至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种生物标记。在一些实施方案中,所述多种生物标记包括表1、4、5、6、7、8和9的任何组合所列出至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种生物标记。在一些实施方案中,所述多种生物标记包括来自表1的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25种生物标记。在一些实施方案中,所述多种生物标记包括来自表4的至少2、3、4、5、6、7、8、9、10种生物标记。在一些实施方案中,所述多种生物标记包括来自表5的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25种生物标记。在一些实施方案中,所述多种生物标记包括来自表6的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25种生物标记。在一些实施方案中,所述多种生物标记包括来自表7的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25种生物标记。在一些实施方案中,所述多种生物标记包括来自表8的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15种生物标记。在一些实施方案中,所述多种生物标记包括来自表9的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15种生物标记。在一些实施方案中,所述多种生物标记包括CRP、APOA2和SERPINC1。在一些实施方案中,所述多种生物标记包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括表4中的至少1、2、3、4、5、6或7种其它另外的生物标记。在一些实施方案中,所述多种生物标记包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括来自表1、4、5、6、7、8和9的任何组合的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种或更多种另外的生物标记。在一些实施方案中,所述多种生物标记包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括来自表1、4、5、6、7、8和9的任何一个的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种或更多种另外的生物标记。在一些实施方案中,当所述多种生物标记包括补体成分C3和补体成分C4时,所述多种生物标记包括来自表1、4、5、6、7、8和9的任何一个的至少一种其它的生物标记。
本发明的再另一方面提供了表现为载波的数字信号,其包括关于受试者的生物标记谱中的多种特征是否满足一个数值集的判定结果。所述多种特征是多种生物标记的可测量的方面。在一些实施方案中,多种生物标记包括表1、4、5、6、7、8和9的任何一个所列出至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种生物标记。在一些实施方案中,所述多种生物标记包括表1、4、5、6、7、8和9的任何组合所列出至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种生物标记。在一些实施方案中,所述多种生物标记包括来自表1的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25种生物标记。在一些实施方案中,所述多种生物标记包括来自表4的至少2、3、4、5、6、7、8、9、10种生物标记。在一些实施方案中,所述多种生物标记包括来自表5的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25种生物标记。在一些实施方案中,所述多种生物标记包括来自表6的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25种生物标记。在一些实施方案中,所述多种生物标记包括来自表7的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25种生物标记。在一些实施方案中,所述多种生物标记包括来自表8的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15种生物标记。在一些实施方案中,所述多种生物标记包括来自表9的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15种生物标记。在一些实施方案中,所述多种生物标记包括CRP、APOA2和SERPINC1。在一些实施方案中,所述多种生物标记包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括来自表1、4、5、6、7、8和9的任何组合的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种或更多种另外的生物标记。在一些实施方案中,所述多种生物标记包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括来自表1、4、5、6、7、8和9的任何一个的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种或更多种另外的生物标记。在一些实施方案中,当所述多种生物标记包括补体成分C3和补体成分C4时,所述多种生物标记包括来自表1、4、5、6、7、8和9的任何一个的至少一种其它的生物标记。
再另一实施方案提供表现为载波的数字信号,其包括关于受试者的生物标记谱中的多种特征是否满足一个数值集的判定结果。所述多种特征是多种生物标记的可测量方面。在一些实施方案中,多种生物标记包括表1、4、5、6、7、8和9的任何一个所列出至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种生物标记。在一些实施方案中,所述多种生物标记包括表1、4、5、6、7、8和9的任何组合所列出至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种生物标记。在一些实施方案中,所述多种生物标记包括来自表1的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25种生物标记。在一些实施方案中,所述多种生物标记包括来自表4的至少2、3、4、5、6、7、8、9、10种生物标记。在一些实施方案中,所述多种生物标记包括来自表5的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25种生物标记。在一些实施方案中,所述多种生物标记包括来自表6的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25种生物标记。在一些实施方案中,所述多种生物标记包括来自表7的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25种生物标记。在一些实施方案中,所述多种生物标记包括来自表8的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15种生物标记。在一些实施方案中,所述多种生物标记包括来自表9的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15种生物标记。在一些实施方案中,所述多种生物标记包括CRP、APOA2和SERPINC1。在一些实施方案中,所述多种生物标记包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括来自表1、4、5、6、7、8和9的任何组合的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种或更多种另外的生物标记。在一些实施方案中,所述多种生物标记包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括来自表1、4、5、6、7、8和9的任何一个的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种或更多种另外的生物标记。在一些实施方案中,当所述多种生物标记包括补体成分C3和补体成分C4时,所述多种生物标记包括来自表1、4、5、6、7、8和9的任何一个的至少一种其它的生物标记。
本发明的另一实施方案提供一种用于确定个体是否可能发展成为脓毒症的图形用户界面。该图形用户界面包括一个显示区,用于显示从远程计算机接收的表现为载波的数字信号编码的结果。所述多种特征是多种生物标记的可测量方面。在一些实施方案中,所述多种生物标记包括表1、4、5、6、7、8和9的任何一个所列出至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种生物标记。在一些实施方案中,所述多种生物标记包括表1、4、5、6、7、8和9的任何组合所列出至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种生物标记。在一些实施方案中,所述多种生物标记包括来自表1的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25种生物标记。在一些实施方案中,所述多种生物标记包括来自表4的至少2、3、4、5、6、7、8、9、10种生物标记。在一些实施方案中,所述多种生物标记包括来自表5的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25种生物标记。在一些实施方案中,所述多种生物标记包括来自表6的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25种生物标记。在一些实施方案中,所述多种生物标记包括来自表7的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25种生物标记。在一些实施方案中,所述多种生物标记包括来自表8的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15种生物标记。在一些实施方案中,所述多种生物标记包括来自表9的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15种生物标记。在一些实施方案中,所述多种生物标记包括CRP、APOA2和SERPINC1。在一些实施方案中,所述多种生物标记包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括来自表1、4、5、6、7、8和9的任何组合的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种或更多种另外的生物标记。在一些实施方案中,所述多种生物标记包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括来自表1、4、5、6、7、8和9的任何一个的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种或更多种另外的生物标记。在一些实施方案中,当所述多种生物标记包括补体成分C3和补体成分C4时,所述多种生物标记包括来自表1、4、5、6、7、8和9的任何一个的至少一种其它的生物标记。
本发明的另一试剂盒提供用于确定个体是否可能发展成为脓毒症的计算机***。该计算机***包括中央处理器和与中央处理器连接的存储器。该存储器存储获得受试者的生物标记谱的指令。所述生物标记谱包括多种特征。所述多种特征是多种生物标记的可测量的方面。在一些实施方案中,多种生物标记包括表1、4、5、6、7、8和9的任何一个所列出至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种生物标记。在一些实施方案中,所述多种生物标记包括表1、4、5、6、7、8和9的任何组合所列出至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种生物标记。该存储器进一步存储评价受试者的生物标记谱中的多种特征是否满足第一数值集的指令。满足第一数值集预测该受试者可能发展成为脓毒症。该存储器还存储报告该受试者的生物标记谱中的多种特征是否满足第一数值集的指令。在一些实施方案中,所述多种生物标记包括来自表1的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25种生物标记。在一些实施方案中,所述多种生物标记包括来自表4的至少2、3、4、5、6、7、8、9、10种生物标记。在一些实施方案中,所述多种生物标记包括来自表5的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25种生物标记。在一些实施方案中,所述多种生物标记包括来自表6的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25种生物标记。在一些实施方案中,所述多种生物标记包括来自表7的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25种生物标记。在一些实施方案中,所述多种生物标记包括来自表8的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15种生物标记。在一些实施方案中,所述多种生物标记包括来自表9的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15种生物标记。在一些实施方案中,所述多种生物标记包括CRP、APOA2和SERPINC1。在一些实施方案中,所述多种生物标记包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括表4中的至少1、2、3、4、5、6或7种其它另外的生物标记。在一些实施方案中,所述多种生物标记包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括来自表1、4、5、6、7、8和9的任何组合的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种或更多种另外的生物标记。在一些实施方案中,所述多种生物标记包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括来自表1、4、5、6、7、8和9的任何一个的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种或更多种另外的生物标记。在一些实施方案中,当所述多种生物标记包括补体成分C3和补体成分C4时,所述多种生物标记包括来自表1、4、5、6、7、8和9的任何一个的至少一种其它的生物标记。
5.4生物标记谱的产生
根据一个实施方案,本发明的方法包括由采自个体的生物样品产生生物标记谱。该生物样品可以是,例如全血、血浆、血清、红细胞、血小板、嗜中性粒细胞、嗜酸性粒细胞、嗜碱性粒细胞、淋巴细胞、单核细胞、唾液、痰、尿、脑脊液、细胞、细胞提取物、组织样品、组织活检物、粪便样品或任何可以利用本领域技术人员公知的技术从个体获得的样品。在特定实施方案中,使用在一个或多个不同时间点从个体中采集的样品确定生物标记谱。在另一特定实施方案中,使用在不同时间点从个体中采集的样品确定生物标记谱。在一个实例中,这些样品从个体一次性获得,或者每天取样一次,或者更频繁,例如每4、6、8或12小时取样一次。在一些实施方案中,在无规律时间基础上,在多个不同的时间点从个体收集这些样品。在一个特定实施方案中,使用从一种组织型采集的样品确定生物标记谱。在另一特定实施方案中,使用从至少2、3、4、5、6或7种不同的组织型采集的样品确定生物标记谱。
5.4.1检测核酸生物标记的方法
在本发明的特定实施方案中,生物标记谱中的生物标记是核酸。可以(例如)通过检测本发明所述的一种或多种基因(例如表1、4、5、6、7、8和9列出的基因)的表达产物(例如多核苷酸或多肽)而产生生物标记谱的这些生物标记和相应的特征。在特定实施方案中,通过使用本领域技术人员公知的任何方法,包括但不限于杂交、微阵列分析、RT-PCT、核酸酶保护实验和Northern印迹法分析,检测和/或分析此处公开的基因(例如表1、4、5、6、7、8和9列出的基因)所表达的一种或多种核酸,来获得生物标记谱的这些生物标记和相应的特征。
在某些实施方案中,通过本发明的方法和组合物检测和/或分析的核酸包括RNA分子,如表达的RNA分子,其包括信使RNA(mRNA)分子、mRNA剪接变体,以及调控RNA、cRNA分子(例如,由在体外转录的cDNA分子制备的RNA分子)及其区别性片段。通过本发明的方法和组合物检测和/或分析的核酸还可包括,例如DNA分子,如基因组DNA分子、cDNA分子及其区别性片段(例如寡核苷酸、EST、STS等)。
通过本发明的方法和组合物检测和/或分析的核酸分子可以是天然存在的核酸分子,如从样品中分离的基因组或基因组外DNA分子,或RNA分子,如存在于、分离自或来源于生物样品的mRNA分子。通过本发明的方法和组合物检测和/或分析的核酸的样品包括,例如DNA、RNA或DNA和RNA的共聚物的分子。通常,这些核酸对应于特定基因或基因的等位基因,或者对应于特定基因转录物(例如,对应于在特定细胞型中表达的特定mRNA序列,或对应于这些mRNA序列衍生的特定cDNA序列)。通过本发明的方法和组合物检测和/或分析的核酸的样品可以对应于同一基因的不同的外显子,例如,从而可以检测和/或分析该基因的不同的剪接变体。
在特定实施方案中,在体外由存在于或分离自或部分分离自生物样品的核酸制备核酸。例如,在一个实施方案中,从样品中提取RNA(例如总细胞RNA、poly(A)+信使RNA、其部分),并且从提取的总RNA中纯化信使RNA。制备总RNA或poly(A)+RNA的方法在本领域中是公知的,例如,在Sambrook等,2001,Molecular Cloning:A Laboratory Manual.第3版Cold Spring HarborLaboratory Press(Cold Spring Harbor,New York)中有一般性描述,在此通过引用全文引入。在一个实施方案中,通过使用硫氰酸胍裂解,然后进行CsCl离心和oligo-dT纯化,从样品中提取RNA(Chirgwin等,1979,Biochemistry18:5294-5299)。在另一个实施方案中,通过使用硫氰酸胍裂解,然后在RNeasy柱(Qiagen,Valencia,California)上纯化,从样品中提取RNA。然后使用例如oligo-dT或随机引物由纯化的mRNA合成cDNA。在特定实施方案中,靶核酸是由从样品中提取的纯化的信使RNA制备的cRNA。本文使用的cRNA在此被定义为与来源RNA互补的RNA。提取的RNA采用如下方法扩增,其中使用以能够引导反义RNA转录的方向与RNA聚合酶启动子连接的引物由RNA合成双链cDNA。然后使用RNA聚合酶由双链cDNA的第二链转录反义RNA或cRNA(参见,例如美国专利号5,891,636、5,716,785、5,545,522和6,132,997,其在此通过引用引入)。可以使用oligo-dT引物(美国专利号5,545,522和6,132,997,在此通过引用引入)或含有RNA聚合酶启动子或其互补物的随机引物。在一些实施方案中,靶核酸是代表样品的原核酸群体的短和/或片段核酸分子。
在一个实施方案中,本发明的核酸可以被可检测地标记。例如,cDNA可以被直接标记,例如用核苷酸类似物直接标记,或者间接标记,例如,通过使用第一链作为模板制备标记的第二cDNA链。或者,双链cDNA可以转录为cRNA并标记。
在一些实施方案中,可检测标记是荧光标记,例如,通过掺入核苷酸类似物。适用于本发明的其它标记包括但不限于生物素、免疫生物素、抗原、辅因子、二硝基苯、硫辛酸、烯族化合物、可检测的多肽、富含电子的分子、通过作用于底物能够产生可检测信号的酶、放射性同位素。合适的放射性同位素包括32P、35S、14C、15N和125I。适合本发明的荧光分子包括但不限于荧光素及其衍生物、罗丹明及其衍生物、德克萨斯红、5′羧基-荧光素(“FMA”)、6-羧基-4′,5′-二氯-2′,7′-二甲氧基荧光素、琥珀酰亚胺脂(“JOE”)、6-羧基四甲基罗丹明(“TAMRA”)、6N羧基-X-罗丹明(“ROX”)、HEX、TET、IRD40和IRD41。适合本发明的荧光素分子还包括但不限于:氰胺(cyamine)染料,包括但不限于Cy3、Cy3.5和Cy5;BODIPY染料,包括但不限于BODIPY-FL、BODIPY-TR、BODIPY-TMR、BODIPY-630/650、BODIPY-650/670;和ALEXA染料,包括但不限于ALEXA-488、ALEXA-532、ALEXA-546、ALEXA-568和ALEXA-594;以及其它本领域技术人员公知的荧光染料。适合本发明的富含电子的指示剂分子包括但不限于:铁蛋白、血蓝蛋白和胶体金。或者,在一些实施方案中,靶核酸可以通过以下方法标记:将第一基团与核酸特异性复合。可以利用与指示剂分子共价连接并且具有对第一基因的亲和力的第二基团间接检测靶核酸。在这种实施方案中,适合作为第一基团使用的化合物包括但不限于生物素和免疫生物素。适合作为第二基团使用的化合物包括但不限于抗生物素蛋白和链霉抗生物素蛋白。
5.4.1.1核酸阵列
在本发明的某些实施方案中,利用核酸阵列,通过检测本发明所述的任一种或多种基因(例如表1、4、5、6、7、8和/或9列出的基因)的表达,产生生物标记谱中的生物标记的特征。在本发明的一个实施方案中,微阵列,如cDNA微阵列,用来确定生物标记谱中的生物标记的特征值。cDNA阵列的诊断应用在本领域中是公知的(参见,例如,Zou等,2002,Oncogene21:4855-4862;以及Draghici,2003,Data Analysis Tools for DNA Assays,Chapman & Hall/CRC,均通过引用全文引入)。
在某些实施方案中,生物标记谱中的生物标记的特征值如下获得:将可检测标记的核酸与含有一个或多个探针斑点的微阵列杂交,该核酸代表或对应于生物样品中存在的mRNA转录物的核酸序列(例如,由样品合成的荧光标记的cDNA)。
核酸阵列,例如微阵列,可以用多种方法来制备,其中几种方法在本文描述。优选地,阵列是可再生产的,从而允许产生多个拷贝的特定阵列,并且将来自所述微阵列的结果互相进行比较。优选地,由在结合(例如核酸杂交)条件下稳定的材料制备阵列。本领域技术人员应当知道适合将检测探针与阵列上的探针斑点杂交的支持物、基底或载体,或者能够利用常规实验确定这些。
所用的阵列,例如微阵列,可以包括一种或多种检测探针。在一些实施方案中,每种检测探针包括与待检测的RNA或DNA的亚序列互补的核酸序列。每种探针一般具有不同的核酸序列,每种探针在阵列固体表面上的位置通常是已知的或者可以确定的。本发明有用的阵列可以包括,例如寡核苷酸微阵列、基于cDNA的阵列、SNP阵列、剪接变体阵列和其它任何能够定性、定量或半定量检测本发明所述基因(例如表1、4、5、6、7、8和/或9列出的基因)表达的阵列。某些类型的微阵列是可寻址的阵列。更具体地,某些微阵列是在位置上可寻址的阵列。在一些实施方案中,阵列的每种探针位于固体支持体上已知的、预定的位置处,从而可以由其在阵列上(例如,在支持体或表面上)的位置来确定每种探针的身份(例如,序列)。在一些实施方案中,阵列是有序的阵列。Draghici,2003,Data Analysis Tools for DNA Microassays,Chapman & Hall/CRC总体上描述了微阵列,其在此通过引用全文引入。
在本发明的一些实施方案中,表达的转录物(例如,本发明所述基因的转录物)呈现在核酸阵列中。在这些实施方案中,一组结合位点可以包括具有不同核酸的探针,该核酸与表达的转录物的不同序列片段互补。属于该类别的示例性核酸的长度可以为15-200个碱基、20-100个碱基、25-50个碱基、40-60个碱基或其它的碱基范围。每种探针序列除了与其靶序列互补的序列以外还可以包括一种或多种连接序列。本文使用的连接序列是位于与其靶序列互补的序列和支持体表面之间的序列。例如,本发明的核酸阵列可以包括对每种靶基因或外显子特异的一种探针。然而,如果需要,核酸阵列也可以含有至少2、5、10、100或1000种或更多的对于某些表达转录物(例如如表1、4、5、6、7、8和/或9中的本发明所述基因的转录物)特异的探针。例如,阵列可含有覆盖基因的最长mRNA同种型的序列的探针。
应当理解,当制备与细胞如生物样品中的细胞的RNA互补的cDNA并在适当杂交条件下与微阵列杂交时,与阵列中对应于本发明所述基因(例如表1、4、5、6、7、8和/或9列出的基因)的位点的杂交水平将反映由该基因转录的一种或多种mRNA在细胞中的普遍程度。或者,在辨别特定基因产生的多个同种型或可变剪接变体的情况中,与总细胞mRNA互补的可检测地标记(例如用荧光团)的cDNA可以与微阵列杂交,并且对于未被转录或在细胞RNA剪接过程中除去的基因外显子的位点,该阵列上没有或者只有极弱的信号(例如荧光信号),而对应于表达基因外显子的编码mRNA普遍存在的的该外显子的位点则具有相对较强的信号。然后通过对该基因进行监测的整组外显子之中的信号强度模型来确定来自同一基因通过可变剪接产生的不同mRNA的相对丰度。
在一个实施方案中,在不同的、相同的微阵列上分别测量不同杂交时间的杂交水平。对于每种检测,在测定杂交水平的杂交时间时,优选地在室温下用高到中盐浓度(例如,0.5-3M盐浓度)的水溶液短暂地洗涤微阵列,洗涤条件为保留所有结合的或杂交的核酸,同时除去所有未结合的核酸。然后通过适合于所用的特定标记方法的方法,测量在每种探针上保留的杂交的核酸分子上的可检测标记。然后将得到的杂交水平组合,形成杂交曲线。在另一个实施方案中,使用单微阵列实时检测杂交水平。在该实施方案中,使微阵列与样品不间断地杂交,并且在每一杂交时间以非侵入方式访问(interrogate)微阵列。在另一实施方案中,可以使用一种阵列,短时间杂交、洗涤并测量杂交水平,放回至同一样品,杂交另一段时间,洗涤并再次检测,得到杂交时间曲线。
在一些实施方案中,选择核酸杂交和洗涤条件,使待分析的核酸生物标记与该阵列的互补核酸序列、通常与其互补DNA所在的特定阵列位点特异性结合或特异性杂交。
其上含有双链探针DNA的阵列可以经历变性条件,以使DNA在接触靶核酸分子之前成为单链。含有单链探针DNA(例如合成的寡脱氧核糖核酸)的阵列在接触靶核酸分子之前可能需要变性,例如,以除去由于自身互补序列而形成的发夹或二聚体。
最适杂交的条件将取决于探针和靶核酸的长度(例如,寡聚体vs多于200个碱基的多核苷酸)和类型(例如,RNA或DNA)。核酸的特异性(即严格的)杂交条件的常用参数在Sambrook等,(同上)和Ausubel等,1988,Current Protocolsin Molecular Biology,Greene Publishing and Wiley-Interscience,New York中有描述。当使用Shena等的cDNA微阵列时,典型杂交条件是在5×SSC+0.2%SDS中65℃杂交4小时,然后在低严格性洗涤缓冲液(1×SSC+0.2%SDS)中25℃洗涤,随后在较高严格性洗涤缓冲液(0.1×SSC+0.2%SDS)中25℃洗涤10分钟(Shena等,1996,Proc.Natl.Acad.Sci.U.S.A.93:10614)。有效的杂交条件也在以下文献中提供,例如:Tijessen,1993,Hybridization With Nucleic AcidProbes,Elsevier Science Publishers B.V.;Kricka,1992,Nonisotopic DNA ProbeTechniques,Academic Press,San Diego,CA;和Zou等,2002,Oncogene21:4855-4862;和Draghici,Data Analysis Tools for DNA Microanalysis,2003,CRC Press LLC,Boca Raton,Florida,第342-343页,其在此通过引用全文引入。
在特定实施方案中,可以利用微阵列分析通过例如以下第5.4.1.2节所述的方法产生的RT-PCR产物。
5.4.1.2RT-PCR
在某些实施方案中,为了确定本发明的生物标记谱中的生物标记的特征值,通过使用反转录(RT)结合聚合酶链反应(PCR)从样品中扩增RNA,检测本发明所述的一种或多种基因(例如表1、4、5、6、7、8和/或9中列出的基因)的表达水平。根据该实施方案,反转录可以是定量或半定量的。此处教导的RT-PCR法可以与以上例如在第5.4.1.1节中所述的微阵列法结合使用。例如,可以进行批量PCR(bulk PCR)反应,解析PCR产物,并用作微阵列上的探针斑点。
使用来自样品的总RNA或mRNA作为模板,使用对于转录的基因部分具有特异性的引物,开始反转录。将RNA反转录为cDNA的方法是众所周知的,并且在Sambrook等,2001(同上)中有描述。引物设计可以基于已经发表的或可从公共序列数据库如GenBank中获得的已知核苷酸序列来实现。例如,可以为本发明所述的任何基因(参见例如,表1、4、5、6、7、8和/或9,这些表提供了在此所述的基因的核苷酸和氨基酸序列的Genbank登录号)设计引物。此外,引物设计也可以使用商品软件(例如,Primer Designer 1.0,ScientificSoftware等)实现。然后使用反转录的产物作为PCR的模板。
PCR提供了一种快速扩增特定核酸序列的方法,它是通过使用热稳定的DNA依赖性DNA聚合酶催化多个DNA复制循环来扩增靶序列。进行PCR需要存在待扩增的核酸、两条位于待扩增序列侧翼的单链寡核苷酸引物、DNA聚合酶、脱氧核糖核苷三磷酸、缓冲液和盐。PCR方法在本领域中公知。例如,PCR如Mullis和Faloona,1987,Methods Enzymol.155:335所述进行,其在此通过引用全文引入。
PCR可以使用模板DNA或cDNA(至少1fg;更有效的为1-1000ng)和至少25pmol寡核苷酸引物进行。典型的反应混合物包括:2μl DNA,25pmol寡核苷酸引物,2.5μl 10M PCR缓冲液1(Perkin-Elmer,Foster City,CA),0.4μl1.25M dNTP,0.15μl(或2.5单位)Taq DNA聚合酶(Perkin Elmer,Foster City,CA)和去离子水加至总体积为25μl。覆盖矿物油,使用可编程热循环仪进行PCR。
PCR循环每一步骤的时间长度和温度以及循环数按照实际的严格性需要来调整。退火温度和时间取决于预期引物与模板退火的效率和容许的错配程度。优化引物退火条件的严格性的能力属于本领域技术人员的知识之内。可以使用30℃至72℃之间的退火温度。最初模板分子的变性通过在92℃至99℃下进行4分钟完成,然后是20-40个循环,每一循环包括变性(94-99℃进行15秒至1分钟)、退火(温度如上所述确定;进行1-2分钟)和延伸(72℃进行1分钟)。最终的延伸步骤通常在72℃下进行4分钟,并可接下来在4℃进行不确定时间(0-24小时)的步骤。
也可以进行在性质上为定量的定量RT-PCR(“QRT-PCR”),来提供基因表达水平的定量测定。在QRT-PCR中,反转录和PCR可以分两步进行,或者反转录可以与PCR组合同时进行。一种这样的技术用转录物特异性反义探针进行,该技术可以使用商业上可获得的试剂盒如Taqman(Perkin Elmer,Foster City,CA),或者由Applied Biosystems(Foster City,CA)提供。该探针对于PCR产物(例如基因衍生的核酸片段)是特异性的,并且用与寡核苷酸5′端复合的猝灭剂和荧光报道探针来制备。不同的荧光标记连接到不同的报道分子上,从而允许在一个反应中检测两种产物。当Taq DNA聚合酶被活化时,它基于5′→3′外切核酸酶活性切下与模板结合的探针的荧光报道分子。在不存在猝灭剂的情况下,报道分子发出荧光。报道分子的颜色变化与每种特定产物的量成正比,并且通过荧光计测量;因此,测定每种颜色的量,并且对PCR产物定量。PCR反应在96孔板上进行,因此来自许多个体的样品可以同时处理并测定。Taqman***具有不需要凝胶电泳并且允许使用标准曲线定量的额外优点。
可用于定量检测PCR产物的第二种技术是使用嵌入染料,如可作为商品获得的QuantiTect SYBR Green PCR(Qiagen,Valencia California)。使用SYBR绿作为荧光标记进行RT-PCR,该染料在PCR阶段掺入PCR产物内,并且产生与PCR产物量成正比的荧光。
Taqman和QuantiTect SYBR***都可以在RNA反转录后使用。反转录可以在与PCR步骤相同的反应混合物中进行(一步方案),也可以在PCR扩增前先进行(两步方案)。
另外,也已知其它定量检测mRNA表达产物的***,包括MolecularBeacons
Figure G2006800528730D00701
,它使用具有荧光分子和猝灭分子的探针,该探针能够形成发夹结构,使得在发夹形式时,荧光分子被猝灭,而当杂交时,荧光增加,产生对基因表达的定量检测。
其它定量检测RNA表达的技术包括但不限于:聚合酶链反应、连接酶链反应、Qβ复制酶(参见,例如,国际申请PCT/US87/00880,其在此通过引用全文引入)、等温扩增法(参见,例如,Walker等,1992,PNAS 89:382-396,其在此通过引用全文引入)、链置换扩增(SDA)、修复链反应、不对称定量PCR(参见,例如,美国公开US 2003/30134307A1,其在此通过引用引入)和Fuja等,2004,Journal of Biotechnology 108:193-205描述的多路微球珠测定,其在此通过引用引入。
一种或多种本发明所述基因(例如表1、4、5、6、7、8和/或9所列的基因)的表达水平例如可以通过应用扩增法(NASBA)从样品中扩增RNA来检测。参见,例如Kwoh等,1989,PNAS USA 86:1173;国际公开WO 88/10315;和美国专利号6,329,179,均在此通过引用全文引入。在NASBA中,可以使用常规方法扩增准备核酸,例如,苯酚/氯仿抽提、热变性、裂解缓冲液处理、和小型旋转柱分离DNA和RNA、或胍氯化物提取RNA。这些扩增技术包括使具有靶特异性序列的引物退火。在聚合后,用RNase H消化DNA/RNA杂合物,同时再使双链DNA分子热变性。在任一情况下,通过添加第二条靶特异性引物然后聚合,使单链DNA成为完全的双链。然后用聚合酶如T7或SP6倍增转录双链DNA分子。在等温循环反应中,将RNA反转录为双链DNA,并用聚合酶如T7或SP6转录一次。得到的产物无论是截短的还是完整的,都指示靶特异性序列。
可以利用几种技术来分离扩增产物。例如,可以使用常规方法通过琼脂糖、琼脂糖-丙烯酰胺或聚丙烯酰胺凝胶电泳来扩增产物。参见,Sambrook等,2001。根据本发明也可以使用几种不需电泳检测PCR产物的技术(参见,例如,PCR Protocols,A Guide to Methods and Applications,Innis等,1990,AcademicPress,Inc.N.Y,其在此通过引用引入)。例如,可以使用层析技术实现分离。本发明可以使用多种层析法:吸附、分配、离子交换和分子筛、HPLC,和使用它们的许多专门技术,包括柱、纸、薄层和气相层析(Freifelder,PhysicalBiochemistry Applications to Biochemistry and Molecular Biology,第2版,Wm.Freeman and Co,New York,N.Y,1982,其在此通过引用引入)。
分离方法的另一个实例是使用各种类型的小分子配体共价标记PCR反应中使用的寡核苷酸引物。在一种这样的分离中,在每种寡核苷酸上存在不同的配体。利用与一种配体特异性结合的分子包被板如96孔ELISA板的表面,该分子或许是抗体,或者如果配体是生物素则为抗生物素蛋白。在将PCR反应液加到这样准备的板表面上时,PCR产物与该表面特异性结合。在洗板除去未结合的试剂后,加入含有与第一配体结合的第二分子的溶液。该第二分子连接到某些种类的报道***上。只有当产生PCR产物从而两种寡核苷酸引物被掺入到最终的PCR产物中时,该第二分子才与板结合。然后如同检测和定量ELISA反应一样,使用商品读板器检测并定量PCR产物的量。ELISA-样***如在此描述的***已经由Raggio Italgene开发(商品名为C-Track)。
为了证实扩增了目标核酸序列,即本发明所述的一种或多种基因(例如表1、4、5、6、7、8和/或9列出的基因)的核酸序列,应当显示扩增产物。一般典型的显示方法包括用溴乙锭对胶染色,并在紫外线下显示。或者,如果扩增产物用放射性或荧光标记的核苷酸整体标记,则可以使扩增产物在分离后暴露于X-光胶片或在适当的激发光谱下显示。
在一个实施方案中,间接实现显示。在分离扩增产物后,使标记的核酸探针接触扩增的目标核酸序列,即本发明所述的一种或多种基因(例如表1、4、5、6、7、8和/或9列出的基因)的核酸序列。探针优选地与发色团偶联,但是也可以被放射性标记。在另一实施方案中,探针与结合配偶体如抗体或生物素偶联,其中该结合对的另一成员带有可检测部分。
在另一实施方案中,通过Southern印迹法以及与标记探针杂交来检测。涉及Southern印迹法的技术是本领域技术人员公知的,并且可以在许多关于分子方案的标准书籍中找到。参见,Sambrook等,2001。简要地说,通过凝胶电泳分离扩增产物。然后使该凝胶接触膜,如硝酸纤维素,以允许核酸转移并且非共价结合。然后,该膜与能够与目标扩增产物杂交的发色团偶联的探针一起孵育。通过将膜暴露于X-光胶片或离子发射检测装置进行检测。美国专利号5,279,721描述了上述方法的一个例子,其在此通过引用引入,其公开了自动化电泳和核酸转移的装置和方法。该装置允许电泳和印迹法,而无需对凝胶进行外部操作,并且理想地适合实施本发明的方法。
5.4.1.3核酸酶保护测定法
在特定实施方案中,通过进行核酸酶保护测定(包括核糖核酸酶保护测定和S1核酸酶测定)来检测和定量特定mRNA(例如表1、4、5、6、7、8和/或9所述基因的mRNA),可以获得生物标记谱中生物标记的特征值。这些测定法例如在Sambrook等,2001(同上)中描述。在核酸酶保护测定中,反义探针(例如用放射性标记或非同位素标记)在溶液中与RNA样品杂交。杂交后,用核酸酶降解未杂交的单链探针和RNA。利用丙烯酰胺凝胶分离剩余的受到保护的片段。溶液杂交一般比基于膜的杂交更有效,它可以适合高达100μg的样品RNA,而与之相比,斑点杂交的最大值为20-30μg。
核糖核酸酶保护测定是最常见的核酸酶保护测定类型,它需要使用RNA探针。寡核苷酸和其它单链DNA探针只能在含有S1核酸酶的测定中使用。为了防止核酸酶切割探针:靶杂合体,单链反义探针一般必须与靶RNA完全同源。
5.4.1.4Northern印迹法测定
可以利用本领域公知的任何杂交技术来产生生物标记谱中的生物标记的特征值。在其它一些特定实施方案中,可以通过Northern印迹分析检测和定量特定RNA分子(例如表1、4、5、6、7、8和/或9所述基因的RNA)来获得生物标记谱中的生物标记的特征值。可以利用标准Northern印迹测定,按照本领域技术人员公知的常规Northern杂交技术,来确定样品中RNA转录物的大小、鉴定可变剪接的RNA转录物,和一种或多种本发明所述基因(特别是mRNA)的相对量。在Northern印迹法中,首先通过在变性条件下进行琼脂糖凝胶电泳,根据大小分离RNA样品。然后将RNA转移到与被标记的探针交联并杂交的膜上。可以使用非同位素或高比活性放射性标记的探针,包括随机引发的、缺口翻译的或PCR产生的DNA探针、体外转录的RNA探针和寡核苷酸。另外,也可以使用只有部分同源性的序列(例如,来自不同种的cDNA或可能含有外显子的基因组DNA片段)作为探针。标记的探针,例如,放射性标记的cDNA,其含有全长、单链DNA或该DNA序列的片段,可以具有至少20、至少30、至少50或至少100个连续核苷酸的长度。该探针可以用本领域技术人员公知的许多不同方法中的任一种来标记。最常用于这些研究的标记是放射性元素、酶、在暴露于紫外线时发荧光的化学物质,等等。多种荧光物质是已知的,并且可以用作标记。包括但不限于荧光素、罗丹明、金胺、德克萨斯红、AMCA蓝和萤光黄。放射性标记可以用当前可用的任何计数方法来检测。同位素的非限制性例子包括3H、14C、32P、35S、36Cl、51Cr、57Co、58Co、59Fe、90Y、125I、131I和186Re。酶标记物同样是有用的,可以利用当前可用的任何比色、分光光度、荧光分光光度、电流计或气体定量技术来检测。酶通过与桥接分子如碳二亚胺、二异氰酸酯、戊二醛等反应,与所选颗粒偶联。可以使用本领域技术人员公知的任何酶。这些酶的例子包括但不限于:过氧化物酶、β-D-半乳糖苷酶、脲酶、葡萄糖氧化酶+过氧化物酶和碱性磷酸酶。作为例子,参考美国专利号3,654,090、3,850,752和4,016,043中关于备选标记材料和方法的公开内容。
5.4.2检测蛋白质的方法
在本发明的特定实施方案中,通过检测蛋白质,例如,检测一种或多种本发明所述基因(例如表1、4、5、6、7、8和/或9所列的基因)的表达产物(例如核酸或蛋白质),或者这些蛋白质的翻译后修饰、或其它方式修饰、或加工形式,可以获得生物标记谱中的生物标记的特征值。在一个具体实施方案中,利用本领域技术人员公知的任何检测蛋白质的方法,包括但不限于蛋白质微阵列分析、免疫组化法和质谱法,通过检测和/或分析本发明所公开的基因(例如表1、4、5、6、7、8和/或9所列的基因)表达的一种或多种蛋白质和/或其区别性片段,获得生物标记谱。
可以利用标准技术测定样品中存在的一种或多种目标蛋白质(例如由表1、4、5、6、7、8和/或9所列基因表达的蛋白质)的量。例如,标准技术可以采用,例如,免疫测定,例如Western印迹法、免疫沉淀后进行十二烷基硫酸钠聚丙烯酰胺凝胶电泳(SDS-PAGE)、免疫细胞化学法等来确定样品中存在的一种或多种目标蛋白质的量。一种用于检测目标蛋白质的试剂的例子是能够与目标蛋白质特异性结合的抗体,优选直接或间接地可检测标记的抗体。
对于这些检测方法,如果需要,可以使用本领域技术人员公知的技术容易地分离待分析样品中的蛋白质。蛋白质分离方法可以是,例如,Harlow和Lane,1988,Antibodies:A Laboratory Manual,Cold Spring Harbor LaboratoryPress(Cold Spring Harbor,New York)描述的那些方法,其在此通过引用全文引入。
在某些实施方案中,检测一种或多种目标蛋白质的方法包括通过与蛋白质特异性抗体相互作用来检测。例如,针对目标蛋白质(例如由本发明所述基因表达的蛋白质,例如表1、4、5、6、7、8和/或9所列的蛋白质)的抗体。可以使用本领域技术人员公知的标准技术产生抗体。在特定实施方案中,抗体可以是多克隆抗体,或更优选地,是单克隆抗体。例如,可以使用完整的抗体,或抗体片段(例如,scFv、Fab或F(ab′)2)。
例如,可以利用对于目标蛋白质特异性的抗体或抗体片段定性或定量地检测蛋白质的存在。这可以利用例如免疫荧光技术来实现。另外,抗体(或其片段)还可以在组织学上使用,作为免疫荧光或免疫电子显微镜检查,用于原位检测目标蛋白质。原位检测可以如下进行:从患者中取出生物样品(例如,活检标本),将针对目标蛋白质(例如,由表1、4、5、6、7、8和/或9所列的基因表达的蛋白质)的标记的抗体应用到该生物样品上。优选地通过将抗体(或片段)覆盖到生物样品上来应用该抗体(或片段)。通过利用该方法,不仅有可能确定特定样品中目标蛋白质的存在,而且有可能确定其分布。可以利用多种公知的组织学方法(如染色方法)实现这种原位检测。
对目标蛋白质的免疫测定一般包括将生物样品与能够鉴定目标蛋白质的可检测地标记的抗体一起孵育,并且利用本领域公知的任何技术检测结合的抗体。如下文更详细描述的,术语“标记”可以指抗体的直接标记,例如,通过将可检测物质与抗体偶联(即,物理连接),也可以指抗体通过与另外一种直接标记的试剂反应性地间接标记。间接标记的例子包括利用荧光标记的第二抗体检测第一抗体。
生物样品可以接触并固定到能够固定细胞、细胞颗粒或可溶性蛋白质的固相支持体或载体如硝酸纤维素或其它固体支持体上。该支持体然后可以用适当的缓冲液洗涤,然后用可检测地标记的指纹基因特异性抗体处理。固相支持体然后可以用缓冲液进行第二次洗涤,以除去未结合的抗体。然后可以利用常规方法检测结合到固体支持体上的标记的量。
“固相支持体或载体”是指任何能够结合抗原或抗体的支持体。众所周知的支持体或载体包括玻璃、聚苯乙烯、聚丙烯、聚乙烯、葡聚糖、尼龙、淀粉酶、天然和改性纤维素、聚丙烯酰胺和磁铁矿材料。对于本发明,载体的性质可以是一定程度上可溶的,也可以是不溶性的。支持体材料实际上可以具有任何可能的结构构造,只要偶联的分子能够与抗原或抗体结合即可。因此,支持体构造可以是球形、珠形或圆柱形、在试管的内表面或杆状物的外表面。或者,表面也可以是扁平的,例如片状、测试条等。优选的支持体包括聚苯乙烯珠。本领域技术人员应当知道其它多种适合结合抗体或抗原的载体,或者将能够利用常规实验进行确定。
可以可检测地标记目标蛋白质的特异性抗体的一种方法是将其与酶连接,并在酶免疫测定(EIA)中使用(Voller,1978,“The Enzyme LinkedImmunosorbent Assay(ELISA)”,Diagnostic Horizons 2:1-7,MicrobiologicalAssociates Quarterly Publication,Walkersville,MD;Voller等,1978,J.Clin.Pathol.31:507-520;Butler,J.E,1981,Meth.Enzymol.73:482-523;Maggio(编),1980,Enzyme Immunoassay,CRC Press,Boca Raton,FL;Ishikawa等,(编),1981,Enzyme Immunoassay,Kgaku Shoin,Tokyo,均在此通过引用全文引入)。与抗体结合的酶将与适当的底物,优选发色底物反应,这样产生例如可通过分光光度法、荧光法或目测方式检测的化学部分。可用来可检测地标记抗体的酶包括但不限于苹果酸脱氢酶、葡萄球菌核酸酶、δ-5-类固醇异构酶、酵母乙醇脱氢酶、α-甘油磷酸酶、脱氢酶、磷酸丙糖异构酶、辣根过氧化物酶、碱性磷酸酶、天冬酰胺酶、葡萄糖氧化酶、β-半乳糖苷酶、核糖核酸酶、脲酶、过氧化氢酶、葡萄糖-6-磷酸脱氢酶、葡萄糖淀粉酶和乙酰胆碱酯酶。可以通过使用酶的发色底物的比色法实现检测。也可以通过目视比较底物与类似制备的标准酶促反应程度来实现检测。
也可以使用多种其它免疫测定中的任一种来实现检测。例如,通过放射性标记抗体或抗体片段,可能利用放射免疫测定(RIA)检测目标蛋白质(参见,例如,Weintraub,1986,Principles of Radioimmunoassays,Seventh TrainingCourse on Radioligand Assay Techniques,The Endocrine Society,其在此通过引用引入)。放射性同位素(例如,125I、131I、35S或3H)可以通过如使用γ计数器或闪烁计数器等手段或通过放射自显影术来检测。
也可以用荧光化合物标记抗体。当荧光标记的抗体暴露于适当波长的光时,可以根据荧光检测它的存在。最常使用的荧光标记化合物有异硫氰酸荧光素、罗丹明、藻红蛋白、藻青蛋白、别藻蓝蛋白、邻苯二醛和荧光胺。
也可以使用发射荧光的金属如152Eu或其它镧系金属可检测地标记抗体。可以使用诸如二乙烯三胺五乙酸(DTPA)或乙二胺四乙酸(EDTA)等金属螯合基团将这些金属连接到抗体上。
也可以通过将抗体与化学发光化合物偶联来可检测地标记抗体。然后通过检测在化学反应过程中产生的光的存在来确定化学发光标记的抗体的存在。特别有用的化学发光标记化合物的例子有鲁米诺、异氨基苯二酰肼、theromatic吖啶酯、咪唑、吖啶盐和草酸盐。
同样,可以使用生物发光化合物标记本发明的抗体。生物发光是在生物***中发现的一类化学发光,其中催化性蛋白质提高化学发光反应效率。通过检测发光的存在来检测生物发光蛋白质的存在。用于标记的重要的生物发光化合物是萤光素、萤光素酶和水母荧光素。
在另一个实施方案中,抗体以外的特异性结合分子,如适体,可以用来结合生物标记。在另一实施方案中,生物标记谱可包含传染物(例如,脂多糖类或病毒蛋白质)或其组分的可测量方面。
在一些实施方案中,利用蛋白质芯片测定(例如,ProteinChip
Figure G2006800528730D00791
BiomarkerSystem,Ciphergen,Fremont,California)测定生物标记谱中的生物标记的特征值。参见例如,Lin,2004,Modern Pathology,1-9;Li,2004,Journal of Urology171,1782-1787;Wadsworth,2004,Clinical Cancer Research,10,1625-1632;Prieto,2003,Journal of Liquid Chromatography & Related Technologies 26,2315-2328;Coombes,2003,Clinical Chemistry 49,1615-1623;Mian,2003,Proteomics 3,1725-1737;Lehre等,2003,BJU International 92,223-225;和Diamond,2003,Journal of the American Society for Mass Spectrometry 14,760-765,均在此通过引用全文引入。
在一些实施方案中,利用珠测定法来检测生物标记谱中的生物标记的特征值。一种这样的珠测定法是Becton Dickinson Cytometric珠测定法(CBA)。CBA使用具有不连续荧光强度的一系列颗粒同时检测多种可溶性分析物。CBA与流式细胞术结合,产生多路测定。Becton Dickinson CBA***,例如在Becton Dickinson人类炎症试剂盒中具体包括的该***,在基于颗粒的免疫测定中,利用流式细胞术扩增的荧光检测的灵敏性来测量可溶性分析物。CBA中的每个珠子提供针对特定蛋白质的捕获表面,并且类似于ELISA板中单独包被的孔。BD CBA捕获珠混合物在悬浮液中,从而允许检测小体积样品中的多种分析物。
在一些实施方案中,利用美国专利号5,981,180(“180专利”)(完整引入本文作为参考)描述的多路分析,特别是其对普通方法学、珠技术、***硬件和抗体检测的教导,来测定生物标记谱中的生物标记的特征值。对于该分析,合成微粒矩阵,其中该矩阵由不同组微粒组成。每组微粒可以具有数千个固定在微粒表面上的不同抗体捕获剂分子,并且可以通过掺入不同量的两种荧光染料来进行颜色编码。两种荧光染料的比例为每组微粒提供不同的发射谱,从而允许在合并不同组微粒后鉴定微粒组。美国专利号6,268,222和6,599,331也在此通过引用全文引入,特别是其中关于为多路分析标记微粒的不同方法的教导。
5.4.3其它检测方法的应用
在一些实施方案中,可以利用分离方法确定生物标记谱中的生物标记的特征值,由此只分析样品中的一组生物标记。例如,所分析样品中的生物标记可以是来自细胞提取物的mRNA种类,该细胞提取物已经被分级分离,只获得样品内的核酸生物标记,或者生物标记可以来自样品中蛋白质的总补体的一部分,该样品已经通过层析技术分级分离。
生物标记谱中的生物标记的特征值也可以(例如)利用一种或多种如下所述的方法产生。例如,方法可以包括核磁共振(NMR)光谱法、质谱法,如光离子质谱法(ESI-MS)、ESI-MS/MS、ESI-MS/(MS)n(n为大于0的整数)、基质辅助激光解吸-电离飞行时间质谱法(MALDI-TOF-MS)、表面增强激光解吸/电离飞行时间质谱法(SELDI-TOF-MS)、硅上解吸/电离(DIOS)、次级离子质谱法(SIMS)、四极飞行时间(Q-TOF)、大气压化学电离质谱法(APCI-MS)、APCI-MS/MS、APCI-(MS)n、大气压光电离质谱法(APPI-MS)、APPI-MS/MS和APPI-(MS)n。其它质谱法尤其可以包括四极、傅里叶变换质谱法(FTMS)和离子阱。其它合适的方法可以包括化学提取分配、柱层析、离子交换层析、疏水(反相)液相层析、等电聚焦、一维聚丙烯酰胺凝胶电泳(PAGE)、二维聚丙烯酰胺凝胶电泳(2D-PAGE)或其它层析法,如薄层、气相或液相层析,或它们的任意组合。在一个实施方案中,生物样品可以在使用分离法之前分级分离。
在一个实施方案中,利用激光解吸/电离飞行时间质谱法产生确定生物标记谱中的特征值,其中生物标记是已经被入射激光辐射电离并从固定支持体蒸发的蛋白质或蛋白质片段,并且特征值是在质谱图中代表这些片段的峰的存在或不存在。本领域中公知多种激光解吸/电离技术(参见,例如,Guttman等,2001,Anal.Chem.73:1252-62和Wei等,1999,Nature 399:243-246,均在此通过引用全文引入)。
激光解吸/电离飞行时间质谱法允许在相对较短的时间内产生大量信息。将生物样品施加到几种支持体的一种上,该支持体结合样品中的所有生物标记或其亚组。细胞裂解物或样品以小至0.5μL的体积直接施加到这些表面,之前进行或不进行纯化和分级分离。裂解物或样品在施加到支持体表面之前可以浓缩或稀释。然后利用激光解吸/电离在少至3小时内产生一种或多种样品的质谱。
5.5数据分析算法
在本发明中鉴定其相应特征值能够区别转变者和非转变者的生物标记。可以利用这些生物标记的身份及其相应的特征(例如,表达水平)发展出用来区别转变者和非转变者的判定规则或多种判定规则。数据分析算法可用于构建大量这样的判定规则。每种数据分析算法使用本发明在包括转变者和非转变者的训练群体中鉴定的生物标记亚组的特征(例如,表达水平)。当个体在限定的时间期限(例如,观察期)内不发展成为脓毒症时,一般认为SIRS个体是非转变者。该限定的时间期限可以是,例如12小时、24小时、48小时、一天、一周、一个月或更长。用于构建在限定的时间期限内区别发展成为脓毒症的个体和不发展成为脓毒症的个体的一种判定规则或多种判定规则的具体数据分析算法将在下面的小节中描述。一旦利用这些示例性的数据分析算法或其它本领域已知的技术建立了判定规则,即可利用判定规则将受试者分为两种或多种表型类别之一(例如,转变者或非转变者)。这通过将判定规则应用于获自受试者的生物标记谱来实现。因此,这些判定规则具有作为诊断指示的大量数值。
本发明在一方面提供了相对于从训练群体获得的生物标记谱评价来自受试者的生物标记谱。在一些实施方案中,从训练群体中的个体以及受试者获得的每种生物标记谱包括多种不同生物标记的每一个标记的特征。在一些实施方案中,这种比较通过如下方法实现:(i)使用来自训练群体的生物标记谱发展判定规则,和(ii)对来自受试者的生物标记谱应用判定规则。因此,利用本发明的某些实施方案中使用的判定规则来确定具有SIRS的受试者是否有可能发展为脓毒症。
在本发明的一些实施方案中,当应用判定规则的结果指示个体可能发展为脓毒症时,该个体被诊断为“脓毒症”个体。如果应用判定规则的结果指示该个体将不发展为脓毒症,则该个体被诊断为“SIRS”个体。因此,在一些实施方案中,上述二元判定情况中的结果具有4种可能的结果:
(i)真脓毒症,其中判定规则指示该个体将发展为脓毒症,且该个体实际上确实在确定的时间期限内发展为脓毒症(真阳性,TP);
(ii)假脓毒症,其中判定规则指示该个体将发展为脓毒症,但是实际上该个体在确定的时间期限内不发展为脓毒症(假阳性,FP);
(iii)真SIRS,其中判定规则指示该个体将不发展为脓毒症,实际上,该个体在确定的时间期限内确实没有发展为脓毒症(真阴性,TN);或
(iv)假SIRS,其中判定规则指示该个体将不发展为脓毒症,但是实际上该个体在确定的时间期限内发展为脓毒症(假阴性,FN);
应当理解,可以对TP、FP、TN、FN进行其它定义。例如,TP可以被定义为其中判定规则指示该个体将不发展为脓毒症,而实际上该个体在确定的时间期限内不发展为脓毒症。尽管所有这些替代定义处于本发明的范围内,但是为了易于理解本发明,除非另外说明,本文中使用以上定义(i)到(iv)给出的TP、FP、TN、FN的定义。
本领域技术人员应当理解,可以利用若干种定量标准表达在被检测的生物标记谱和参比生物标记谱之间进行的比较(例如,对来自受试者的生物标记谱应用判定规则)。其中包括阳性预测值(PPV)、阴性预测值(NPV)、特异性、灵敏度、准确性和确定性。另外,也可以利用其它构建体,如接收操作特性曲线(ROC)来评价判定规则的表现。本文使用的:
PPV=TP/(TP+FP)
NPV=TN(TN+FN)
特异性=TN/(TN+FP)
灵敏度=TP/(TP+FN)
准确性=确定性=(TP+TN)/N。
在此,N是所比较的样本数(例如,用于确定脓毒症或SIRS的测试样本数)。例如,考虑对10个个体进行SIRS/脓毒症分类的情况。为这10个个体中的每一个构建生物标记谱。然后,通过应用判定规则来评价每一种生物标记谱,其中该判定规则是基于从训练群体获得的生物标记谱而发展的。在该实例中,上述方程式中的N等于10。N一般是样本数,其中每个样本收集自群体的不同成员。该群体实际上可以是两种不同的类型。在一种类型中,群体包括如下所述的个体,其样本和表型数据(例如,生物标记的特征值和个体是否发展为脓毒症的指示)被用来构建或细化判定规则。这种群体在此被称为训练群体。在另一类型中,群体包括不用来构建判定规则的个体。这种群体在此被称为验证群体。除非另外说明,由N表示的群体全是训练群体或全是验证群体,而不是两种群体类型的混合体。应当理解,当基于训练群体而不是验证群体时,得分如准确性将更高(更接近于一致)。然而,除非在此另外明确说明,用来评价判定规则(或其它对来自受试者的生物标记谱的评价形式)的表现(包括确定性(准确性))的所有标准是指通过对训练群体或验证群体应用对应于该标准的判定规则而确定的标准。此外,以上定义的PPV、NPV、特异性、灵敏度和准确性也可以见于Draghici,Data Analysis Tools for DNA Microanalysis,2003,CRC Press LLC,Boca Raton,Florida,第342-343页,其在此通过引用全文引入。
在一些实施方案中,训练群体包括非转变者和转变者。在一些实施方案中,使用该群体中转变者脓毒症发病之前的某些时间从该训练群体采集的生物样品,由该群体构建生物标记谱。这样,对于训练群体的转变者,可以在转变者发展为脓毒症两周前、一周前、四天前、三天前、一天前或任何其它时间点采集生物样品。实践中,所有采集物都是在SIRS诊断入院后以固定时间间隔采集生物样品获得的。例如,在一种方法中,在医院中已经被诊断为SIRS的个体作为训练群体。一旦因SIRS入院,就在选定的时间(例如每小时、每8小时、每12小时、每天,等等)采集该个体的生物样品。一部分个体发展为脓毒症,一部分个体不发展为脓毒症。对于发展为脓毒症的个体,恰在脓毒症发作之前从该个体采集的生物样品被称为T-12生物样品。来自该个体的所有其它生物样品相对于这些生物样品追溯性地编入索引(retroactivelyindexed)。例如,当每日从个体中采集生物样品时,在T-12样品前一天采集的生物样品被称为T-36生物样品。训练群体中非转变者的生物样品的时间点通过将非转变个体与转变个体“时间匹配”来确定。为了说明,考虑其中训练群体中的个体在加入后第6天被临床确定为脓毒症的情况。为了说明,对于该个体,T-36是研究的第4天,T-36生物样品是在研究的第4天获得的生物样品。同样,对于匹配的非转变者的T-36被认为是对该配对非转变者进行研究的第4天。
在一些实施方案中,N为多于1、多于5、多于10、多于20、10-100之间、多于100、或少于1000名个体。判定规则(或其它比较形式)可以具有相对于训练群体或验证群体至少大约99%的确定性,或者在一些实施方案中甚至更高。在其它实施方案中,确定性为相对于训练群体或验证群体(因此,也就是相对于不是训练群体一部分的单个个体,如临床患者)至少大约97%、至少大约95%、至少大约90%、至少大约85%、至少大约80%、至少大约75%、至少大约70%、至少大约65%或至少大约60%。确定性的有用程度可以根据本发明的具体方法而不同。本文使用的“确定性”是指“准确性”。在一个实施方案中,灵敏度和/或特异性为相对于训练群体或验证群体至少大约97%、至少大约95%、至少大约90%、至少大约85%、至少大约80%、至少大约75%或至少大约70%。在一些实施方案中,利用这些判定规则预测脓毒症的发展,具有所述的准确性。在一些实施方案中,利用这些判定规则诊断脓毒症,具有所述的准确性。在一些实施方案中,利用这些判定规则确定脓毒症阶段,具有所述的准确性。
可以被判定规则用来以足够的确定性对受试者进行分类的特征数目为两个或更多。在一些实施方案中,为3个或更多、4个或更多、10个或更多、或介于10-200个之间。然而,根据确定性程度,在判定规则中使用的特征的数目可以更多或更少,但是在所有情况下均至少为两个。在一个实施方案中,将可以被判定规则用来对受试者进行分类的特征数目进行优化,以允许以高准确性分类受试者。
用于发展判定规则的相关数据分析算法包括但不限于:判别分析,包括线性分析、逻辑分析、更灵活的判别技术(参见,例如,Gnanadesikan,1977,Methods for Statistical Data Analysis of Multivariate Observations,New York:Wiley 1977,其在此通过引用全文引入);基于树的算法,如分类和回归树(CART)和变量(参见,例如,Breiman,1984,Classification and Regression Trees,Belmont,California:Wadsworth International Group,其在此通过引用全文引入,以及以下第5.1.3节);概括累加模型(参见,例如,Tibshirani,1990,GeneralizedAdditive Models,London:Chapman and Hall,其在此通过引用全文引入);神经网络(参见,例如,Neal,1996,Bayesian Learning for Neural Networks,New York:Springer-Verlag;和Insua,1998,Feedforward Neural Networks for nonparametricregression In:Practical Nonparametric and Semiparametric Bayesian Statistics,第181-194页,New York:Springer,其在此通过引用全文引入)。
在一个实施方案中,将受试者的生物标记谱与从训练群体获得的生物标记谱进行比较,并且包括应用判定规则。用数据分析算法例如计算机模式识别算法来构建判定规则。其它构建判定规则的合适的数据分析算法包括但不限于:逻辑回归或检测特征值分布中差异的非参数算法(例如,Wilcoxon符号秩检验(未调整的和调整的))。判定规则可以基于2、3、4、5、10、20或更多种特征,对应于来自1、2、3、4、5、10、20或更多种生物标记的测量的可检测值。在一个实施方案中,判定规则基于数百种特征或更多。判定规则也可以使用分类树算法来建立。例如,来自训练群体的每种生物标记谱可以包括至少三种特征,其中这些特征是分类树算法的预测指标。用判定规则预测群体内的身份(或类别),准确性为至少大约70%、至少大约75%、至少大约80%、至少大约85%、至少大约90%、至少大约95%、至少大约97%、至少大约98%、至少大约99%或大约100%。
合适的数据分析算法在本领域中已知,其中一些在Hastie等(同上)中综述。在一个特定实施方案中,本发明的数据分析算法包括分类和回归树(CART)、多重累加回归树(MART)、微阵列预测分析(PAM)或随机森林分析。这些算法将来自生物材料如血样的复杂光谱进行分类,以将个体区分为正常个体或具有特定疾病状态的特征性生物标记表达水平的个体。在其它实施方案中,本发明的数据分析算法包括ANOVA和非参数等价、线性判别分析、逻辑回归分析、最近邻分类器分析、神经网络、主成分分析、二次判别分析、回归分类器和支持向量机。尽管可以利用这些算法构建判定规则和/或提高应用判定规则的速度和效率并避免研究人员偏倚,但本领域技术人员应当认识到,实施本发明的方法不必须使用基于计算机的算法。
可以利用判定规则评价生物标记谱,与生物标记谱的产生方法无关。例如,用气相色谱法产生可以用来评价生物标记谱的合适的判定规则,如Harper,“Pyrolysis and GC in Polymer Analysis”,Dekker,New York(1985)所述。此外,Wagner等,2002,Anal.Chem.74:1824-1835公开了一种判定规则,该判定规则通过基于静态TOF-SIMS(飞行时间次级离子质谱法)获得的光谱提高了对个体进行分类的能力。另外,在此通过引用全文引入的Bright等,2002,J Microbiol.Methods 48:127-38公开了一种通过MALDI-TOF-MS光谱分析以高确定性(79-89%正确分类率)区分细菌株的方法。在此通过引用全文引入的Dalluge,2000,Fresenius J.Anal.Chem.366:701-711讨论了利用MALDI-TOF-MS和液相层析-光离子质谱法(LC/ESI-MS)对复杂生物样品中的生物标记谱进行分类。
5.5.1决策树
可以用本发明鉴定的生物标记的特征值构建的一种类型的判定规则是决策树。在此,“数据分析算法”是可以建立决策树的任何技术,而最终的“决策树”是判定规则。决策树使用训练群体和特定数据分析算法构建。决策树在Duda,2001,Pattern Classification,John Wiley & Sons,Inc,New York.第395-396页有概括性的描述,其在此通过引用引入。基于树的方法将特征空间分区为一组矩形,然后在每一个矩形中拟合一种模型(如一个常数)。
训练群体数据包括训练组群体中的本发明的生物标记的特征(例如,表达值或其它一些观察值)。可以用来构建决策树的一种具体算法是分类和回归树(CART)。其它具体决策树算法包括但不限于:ID3、C4.5、MART和随机森林算法。CART、ID3和C4.5在以下文献中描述:Duda,2001,PatternClassification,John Wiley & Sons,Inc,New York.第396-408页和第411-412页,CART、MART和C4.5在Hastie等,2001,The Elements of Statistical Learning,Springer-Verlag,New York,第9章,其在此通过引用引入。随机森林描述于Breiman,1999,“Random Forests-Random Features”,Technical Report 567,Statistics Department,U.C.Berkeley,1999年9月,其在此通过引用全文引入。
在本发明的一些实施方案中,利用决策树使用本发明的生物标记组合的特征对个体进行分类。决策树算法属于监督学习算法类别。决策树的目的是用来自真实世界样本数据产生分类器(树)。可以利用该树对没有用于推导决策树的未见过的样本进行分类。因此,决策树是由训练数据推导出的。示例性的训练数据含有多个个体(训练群体)的数据。对应每一个体存在相应类别(例如,脓毒症/SIRS)的多种特征。在本发明的一个实施方案,训练数据是训练群体中生物标记组合的表达数据。
以下算法描述了决策树推导的一个例子:
树(样本,类别,特征)
产生根节点
如果所有样本具有相同的类别值,则给予该根这种标记
否则如果特征为空,则根据最常见的值标记该根
否则开始
计算每一特征的信息增益
选择具有最高信息增益的特征A,并且使其为根特征
对于该特征的每个可能的值v,
在根下加上一个新的分支,对应于A=v
使样本(v)为A=v的样本
如果样本(v)为空,则使该新分支为叶节点,该叶节点用样本中最常见的值标记
否则使该新分支为树(样本(v),类别,特征-{A})产生的树
结束
下文更详细地描述如何计算信息增益。如果样本的可能类别vi具有概率P(vi),则实际回答的信息内容I由下式给出:
I ( P ( v 1 ) , . . . , P ( v n ) ) = Σ i = 1 n - P ( v 1 ) log 2 P ( v 1 )
I值显示需要多少信息才能描述对所用特定数据集的分类结果。假如数据集含有p个阳性(例如将发展为脓毒症)和n个阴性(例如将不发展为脓毒症)样本(例如个体),则正确回答中所含的信息为:
I ( p p + n , n p + n ) = - p p ÷ n log 2 p p + n - n p + n log 2 n p + n
其中log2为使用基础2的对数。通过检验单一特征,可以减少进行正确分类所需的信息量。特定特征A(例如代表特定生物标记)的余数显示需要的信息可以减少多少。
Figure G2006800528730D00902
“v”是某数据集中特征A的独特属性值的数字,“i”是特定属性值,“Pi”是其中分类为阳性(例如将发展成为脓毒症)的特征A的样本数,“ni”是其中分类为阴性(例如将为发展成为脓毒症)的特征A的样本数。
特定特征A的信息增益计算为特征A的类别和余数的信息内容之间的差异:
利用信息增益评价不同特征对于分类有多重要(它们分割样本有多好),以及具有最高信息的特征。
通常存在大量不同的决策树算法,其中许多在Duda,Pattern Classification,第2版,2001,John Wiley & Sons,Inc.中有描述。决策树算法通常需要考虑特征处理、杂质检测、停止标准和修剪。具体的决策树算法包括但不限于分类和回归树(CART)、多变量决策树、ID3和C4.5。
在一种方法中,当使用决策树时,在训练群体中本发明所述基因的选择组合的基因表达数据被标准化为具有平均值0和单位方差。将训练群体的成员随机分为训练组和测试组。例如,在一个实施方案中,将训练群体中2/3的成员置入训练组,并将训练群体中1/3的成员置入测试组。利用本发明所述生物标记的选择组合的表达值构建决策树。然后,确定决策树对测试组成员进行正确分类的能力。在一些实施方案中,对生物标记的特定组合进行几次这样的计算。在每次重复计算中,将训练群体的成员随机指定为训练组和测试组。然后,采用生物标记组合的质量作为每次重复决策树计算的平均值。
除了单变量决策树(每次分割都基于本发明生物标记组中相应生物标记的特征值、或者两种这样生物标记的相对特征值进行)以外,也可以应用多变量决策树作为判定规则。在这种多变量决策树中,一些或全部判定实际上包括本发明多种生物标记的特征值的线性组合。这种线性组合可以用已知技术训练,例如分类上的梯度下降,或者利用误差平方和(sum-squared-error)标准。为了说明这种决策树,考虑表达式:
0.04x1+0.16x2<500
其中,x1和x2是指本发明生物标记中两种不同生物标记的两种不同的特征。为了对判定规则投票(poll),由未分类个体的测量值得到特征x1和x2的值。然后将这些值代入方程式中。如果计算小于500的值,则采用决策树中的第一分支。否则,采用决策树中的第二分支。多变量决策树在Duda,2001,PatternClassification,John Wiley & Sons,Inc,New York,第408-409页中有描述,其在此通过引用引入。
本发明可以使用的另外一种方法是多变量适应性条回归(multivariateadaptive regression splines,MARS)。MARS是一种适应性回归程序,非常适合本发明所要解决的高维问题。MARS可以被视为分步线性回归的概括或为提高CART在回归设置中的表现而对CART法的改良。MARS在Hastie等,2001,The Elements of Statistical Learning,Springer-Verlag,New York,第283-295页中有描述,其在此通过引用全文引入。
5.5.2微阵列的预测分析(PAM)
使用本发明生物标记的特征值发展判定规则的一种方法是最小形心距离分类器(nearest centroid classifier)。这种技术对于每一类别(脓毒症和SIRS)计算该类别中生物标记的平均特征水平给出的形心,然后将新的样本分配到与形心最接近的类别。该方法类似于k-平均值聚类法,不同之处在于用已知类别(class)代替聚类(cluster)。当使用大量生物标记时,该算法可能对噪音敏感。可以使用收缩(shrinkage)来提高该技术:对于每种生物标记,如果认为类别形心之间的差异可能是偶然引起,则将其设为0。该方法应用于微阵列的预测分析或PAM。参见,例如,Tibshirani等,2002,Proceedings of the National Academyof Science USA 99;6567-6572,其在此通过引用全文引入。收缩由阈值来控制,低于该阈值的差异被认为是噪音。排除显示没有噪音水平以上差异的生物标记。阈值可以通过交叉验证来选择。当阈值降低时,包括更多生物标记,并且估计的分类误差降低,直到它们达到底部,并由于噪音生物标记而再次开始上升-这种现象被称为过拟合(overfitting)。
5.5.3装袋(Bagging)、强化(boosting)和随机子空间方法
装袋、强化、随机子空间方法和累加树是已知的作为组合技术的数据分析算法,可以用来改善弱判定规则。这些技术设计用于,并且通常应用于决策树,如上文第5.5.1节所述的决策树。另外,这些技术也可以用于使用其它类型数据分析算法如线性判别分析发展的判定规则。
在装袋中,从产生随机独立引导程序复制(bootstrap replicates)的训练组中取样,对其中每一个构建判定规则,并且通过最终判定规则中的简单多数投票将其组合。参见,例如,Breiman,1996,Machine Learning 24,123-140;Efron和Tibshirani,An Introduction to Boostrap,Chapman & Hall,New York,1993,其在此通过引用全文引入。
在强化中,对训练组的加权形式构建判定规则,其中训练组依赖于之前的分类结果。开始时,被考虑的所有特征都具有相等的权重,并在该数据集上构建第一判定规则。然后根据该判定规则的表现改变权重。错误分类的特征获得较大的权重,在重新分配权重的训练组上强化下一个判定规则。这样,获得一系列的训练组和判定规则,然后通过在最终判定规则中的简单多数投票或通过加权多数投票将其组合。参见,例如,Freund和Schapire,“Experimentswith a new boosting algorithm”,Proceedings 13th International Conference onMachine Learning,1996,148-156,其在此通过引用全文引入。
为了说明强化,考虑研究中的群体表现两种表型的情况,表型1(例如,在限定的时间期限内发展为脓毒症)和表型2(例如,仅有SIRS,即该个体在限定的时间期限内不发展为脓毒症)。来自训练组数据的预测生物标记具有向量(例如,代表这种生物标记的特征向量),则判定规则G(X)采用两个数值集中的类型值之一进行预测:{表型1,表型2}。训练样本上的错误率为:
err ‾ = 1 N Σ i = 1 N I ( y i ≠ G ( x i ) )
其中N是训练组中的个体数(具有表型1或表型2的个体总数)。例如,如果有49个生物发展为脓毒症,有72个生物保持SIRS状态,则N为121。弱判定规则是其错误率仅略好于随机猜测的判定规则。在强化算法中,对数据的修改形式重复应用弱判定规则,由此产生一系列判定规则Gm(x),m,=1、2、……、M。然后通过加权多数投票对来自该系列中的所有判定规则的预测进行组合,产生最终判定规则:
G ( x ) = sign ( Σ m = 1 M α m G m ( x ) )
其中α1、α2、……、αM通过强化算法计算,它们的目的是对每一相应判定规则Gm(x)的贡献给予权重。它们的作用是对该顺序中更准确的判定规则给予更高的影响。
每一强化步骤的数据修改包括对训练性观察(xi,yi),i=1,2,…,N应用权重w1,W2,…,wn。开始时将所有权重都设为wi=1/N,使得第一步以通常的方式在数据上训练判定规则。对于每个连续的迭代m=2,3,…,M,单独修改观察权重,并将判定规则再次应用于加权观察。在步骤m时,被前一步骤中产生的判定规则Gm-1(x)错误分类的观察值,其权重增加,而正确分类的观察值的权重降低。因此,随着迭代继续,难以正确分类的观察值接受不断增加的影响。由此使每一连续的判定规则集中于被该系列判定规则中前面的规则错过的那些训练观察值。
示例性的强化算法概述如下:
1.初始化观察权重wi=1/N,i=1,2,…,N。
2.对于m=l至M:
(a)使用权重wi将判定规则Gm(x)与训练组拟合。
(b)计算
err m = Σ i = 1 N w i I ( y i ≠ G m ( x i ) ) Σ i = 1 N w i
(c)计算αm=log((1-errw)/errm)。
(d)设置wi←wi·exp[αm·I(yi≠Gm(xi))],i=1,2,…,N。
Figure G2006800528730D00952
在根据这个算法的一个实施方案中,每个对象实际上是因子。此外,在该算法中,当前的判定规则Gm(x)在第2a行的加权观察值上导出。在第2b行计算产生加权误差率。第2c行计算产生最终分类器G(x)(第3行)时赋予Gm(x)的权重αm。为第2d行的下一个迭代,更新每一观察值的权重。被Gm(x)错误分类的观察值的权重被因子exp(αm)放大,提高了它们对产生该系列中下一个分类器Gm+1(x)的相对影响。在一些实施方案中,使用Freund和Schapire,1997,Journal of Computer and System Sciences 55,第119-139页的修改的强化法。参见,例如,Hasti等,The Elements of Statistical Learning,2001,Springer,NewYork,第10章,其在此通过引用全文引入。例如,在一些实施方案中,使用诸如Park等,2002,Pac.Symp.Biocomput.6,52-63(其在此通过引用全文引入)的非参数评分法等技术进行特征预选择。特征预选择是一种维数减少的形式,其中能最佳区分分类的基因用于分类器。然后,使用Friedman等,2000,AnnStat 28,337-407介绍的LogitBoost方法,而不是Freund和Schapire的强化法。在一些实施方案中,本发明使用Ben-Dor等,2000,Journal of ComputationalBiology 7,559-583的强化和其它分类法,其在此通过引用全文引入。在一些实施方案中,使用Freund和Schapire,1997,Journal of Computer and SystemSciences 55,119-139的强化和其它分类法,其在此通过引用全文引入。
在随机子空间法中,在数据特征空间的随机子空间中构建判定规则。这些判定规则通常通过在最终判定规则中进行简单多数投票来组合。参见,例如,Ho,“The Random subspace method for constructing decision forests”,IEEETrans Pattern Analysis and Machine Intelligence,1998;20(8):832-844,其在此通过引用全文引入。
5.5.4多重累加回归树
多重累加回归树(MART)是另一种构建可在本发明中使用的判定规则的方法。用于MART的一般算法是:
Figure G2006800528730D00961
2.对于m=1至M:
(a)对于I=1,2,…,N计算
r im = - [ ∂ L ( y i , f ( x i ) ) ∂ f ( x i ) ] f = f m - 1
(b)对靶标rim拟合回归树,得到末端区Rjm,j=1,2,…,Jm。
(c)对于j=1,2,…,Jm计算
γ jm = arg min γ Σ x i ∈ R jm L ( y l , f m - 1 ( x i ) + γ ) .
Figure G2006800528730D00964
3.输出 f ^ ( x ) = f M ( x ) .
通过***不同的损失标准L(y,f(x))获得具体算法。将该算法的第一行初始化为最佳常数模型,它是单末端结点树。在第2(a)行计算的负梯度的分量被称为概括假残差r。用于常用损失函数的梯度总结在Hastie等,2001,The Elementsof Statistical Learning,Springer-Verlag,New York,第321页的表10.2中,其在此通过引用引入。用于分类的算法是类似的,并且描述于Hastie等的第10章中,其在此通过引用全文引入。与MART程序有关的调谐参数是迭代的次数M和每一个构成树的大小Jm,m=1,2,…,M。
5.5.5通过回归推导的判定规则
在一些实施方案中,利用回归来建立用于分类个体的判定规则。在这些实施方案中,可以将判定规则表征为回归分类器,优选逻辑回归分类器。这种回归分类器包括用来构建该分类器的每种生物标记的系数(例如,每种生物标记的特征)。在这些实施方案中,例如,使用最大似然法计算回归分类器的系数。在这种计算中,使用生物标记的特征(例如RT-PCR、微阵列数据)。在特定实施方案中,使用仅来自两个性状亚组(例如,性状亚组a:将在限定的时间期限内发展为脓毒症,性状亚组b:在限定的时间期限内不发展为脓毒症)的分子标记数据,并且因变量为在可以获得其生物标记数据的个体中特定性状的存在或不存在。
在另一特定实施方案中,训练群体包括多个性状亚组(例如,三个或更多的性状亚组、四个或更多的特定性状亚组等)。这些多性状亚组可对应于训练群体中从健康到SIRS、到脓毒症、到脓毒症更晚期的表型进展的不连续阶段。在这种特定实施方案中,可以利用处理多类应答的逻辑回归模型的概括来发展出区分训练群体中各种性状亚组的判定。例如,可以将所选分子标记的测量数据应用于Agresti,An Introduction to Categorical Data Analysis,1996,JohnWiley & Sons,Inc,New York,第8章(其在此通过引用全文引入)所述的任一多类逻辑模型,以发展能够区分训练群体中表示的多个性状亚组中任一个的分类器。
5.5.6神经网络
在一些实施方案中,可以利用测量的本发明所选生物标记的特征数据(例如RT-PCR数据、质谱数据、微阵列数据)训练神经网络。神经网络是两阶段回归或分类判定规则。神经网络具有分层结构,包括通过权重层与输出单元层连接的输入单元层(和偏差)。对于回归,输出单元层一般只包括一个输出单元。然而,神经网络可以以无缝方式处理多重定量应答。
在多层神经网络中,存在输入单元(输入层)、隐含单元(隐含层)和输出单元(输出层)。此外还存在与输入单元以外的每一单元连接的单一偏差单元。神经网络在Duda等,2001,Pattern Classification,Second Edition,John Wiley &Sons,Inc,New York;和Hastie等,2001,The Elements of Statistical Learning,Springer-Verlag,New York中有描述,这两篇文献在此通过引用全文引入。神经网络在Draghici,2003,Data Analysis Tools for DNA Microassays,Chapman &Hall/CRC;和Mount,2001,Bioinformatics:sequence and genome analysis,ColdSpring Harbor Laboratory Press,Cold Spring Harbor,New York中也有描述,这两篇文献均在此通过引用全文引入。以下公开的是神经网络形式的一些例子。
使用神经网络的基本方法是从未训练的网络开始,为输入层提供训练模式,并且使信号通过该网络,确定输出层的输出。然后将这些输出与目标值进行比较;任何差异对应于误差。该误差或标准函数是权重的一些标量函数,当网络输出与所需输出匹配时误差被最小化。因此,调节权重以降低误差量度。对于回归,这种误差可以是误差平方和。对于分类,这种误差可以是平方误差或互熵(偏离)。参见,例如,Hastie等,2001,The Elements of StatisticalLearning,Springer-Verlag,New York,其在此通过引用全文引入。
三种常用的训练方案是随机、批量和在线训练。在随机训练中,从训练组中随机选择模式,并为每一模式更新网络权重。通过梯度下降法(如随机后向传播)训练的多层非线性网络对网络拓扑学定义的分类器中的权重值进行最大似然估计。在批量训练中,所有模式都在发生学习之前提供给网络。在批量训练中一般通过训练的数据进行几次处理(pass)。在在线训练中,每一模式提供一次,并且只提供给网络一次。
在一些实施方案中,考虑起始值的权重。如果权重接近0,则在神经网络隐含层中通常使用的S形的操作部分(参见,例如,Hastie等,2001,The Elementsof Statistical Learning,Springer-Verlag,New York,其通过引用引入)大致是线性的,因此神经网络塌陷为接近线性的分类器。在一些实施方案中,权重的起始值为接近0的随机数值。因此,分类器以接近线性开始,并且随着权重增加而成为非线性的。各单元按方向定位,并在需要时导入非线性。使用0权重导致0衍生值和完全对称,并且该算法决不会移动。此外,以大权重为起始通常导致较差的方案。
由于输入的缩放比例确定底层中权重的有效缩放比例,因此对最终方案的质量可能具有较大影响。因此,在一些实施方案中,开始时将所有表达值都标准化为平均值为0和标准差为1。这确保了所有输入都以规律的方法同等地处理,并且允许为随机起始权重选择有意义的范围。利用标准化输入,一般在[-0.7,+0.7]内采用随机均一权重。
在使用三层网络中一个反复出现的问题是在网络中使用的最佳隐含层数。三层网络的输入和输出数取决于所要解决的问题。在本发明中,特定神经网络的输入数将等于从训练群体中选择的生物标记的数目。神经网络的输出数一般就是一个。然而,在一些实施方案中使用一个以上的输出,以便可以通过网络限定2个以上的状态。例如,可以利用多输出神经网络区分健康表型、SIRS的各个阶段和/或脓毒症的各个阶段。如果在神经网络中使用太多隐含单元,则网络将具有太大的自由度,并且训练时间太长,存在网络过拟合(overfit)数据的风险。如果存在的隐含层太少,则训练组不能学习。然而,一般来说,具有多的隐含层好于隐含层过少。使用的隐含层太少,分类器可能没有足够的灵活性来捕获数据中的非线性;使用太多的隐含层,如果如下所述进行适当的正则化或修剪,则额外的权重可能缩小为0。在典型的实施方案中,隐含单元数为5-100个,其数目随输入数和训练例数而增加。
一种确定隐含单元数的常用方法是应用正则化方法。在正则化方法中,构建新的标准函数,该标准函数不仅依赖于经典训练误差,而且依赖于分类器复杂性。具体来说,新的标准函数不利于高度复杂的分类器;寻找该标准中的最小值是为了平衡训练组上的误差与训练组加上正则化项的误差,正则化项表示方案的约束或所需性质:
J=Jpat+λJreg
将参数λ调节为使正则化更强或更弱。换句话说,较大的λ值将倾向于使权重缩小为0:一般利用验证组进行交叉验证来估计λ。该验证组可以通过排除训练群体的随机亚组而获得。曾经提出了其它处罚形式,例如,权重消除处罚(参见,例如,Hastie等,2001,The Elements of Statistical Learning,Springer-Verlag,New York,其通过引用引入)。
用来确定隐含单元数的另外一种方法是消除(eliminate)-修剪(prune)-最少需要的权重。在一种方法中,消除最小数量级的权重(设为0)。可以使用这种基于强度的修剪,但不是最佳的;有时具有小数量级的权重对于学习和训练数据是重要的。在一些不是使用基于数量级的修剪方法的实施方案中,计算Wald卡方。Wald卡方的基本思想是它们可以用来估计隐含单元(权重)在分类器中的重要性。然后,(通过将其输入和输出权重设为0)消除重要性最低的隐含单元。在此方面,两种算法是最佳脑损害(Optimal Brain Damage,OBD)和最佳脑手术算法(Optimai Brain Surgeon,OBS),它们使用二级近似来预测训练误差如何依赖于权重,并消除导致训练误差最小增加的权重。
最佳脑损害和最佳脑手术具有相同的训练网络的基本方法,其将网络在权重w训练至最小局部误差,然后修剪导致训练误差最小增加的权重。对完全权重向量δw的变化误差的预测的函数增加为:
δJ = ( ∂ J ∂ w ) t · δw + 1 2 δw t · ∂ 2 J ∂ w 2 · δw + O ( | | δw | | 3 )
其中为Hessian矩阵。首项在误差局部极小值时消失;忽略第三δw2和高阶项。如果有删除一个权重的限制,则使该函数最小化的通解是:
δw = - w q [ H - 1 ] qq H - 1 · u q L q = 1 2 - w q 2 [ H - 1 ] qq
其中,uq是沿权重空间中第q方向的单位向量,Lq是与权重q显著性的近似性一训练误差的增加(如果权重q被修剪并且其它权重更新了δw的话)。这些方程需要H的逆转。一种计算这种逆矩阵的方法是从小数值开始,H0 -1=α-1I,其中α是小参数一有效地是权重常数。然后根据下式用每种模式更新矩阵:
H m + 1 - 1 = H m - 1 - H m - 1 X m + 1 X m + 1 T H m - 1 n a m + X m + 1 T H m - 1 X m + 1 Eqn . 1
其中下标对应于呈现的模式,am随m降低。在全部训练组已经呈现后,通过H-1=Hn -1给出逆Hessian矩阵。在算法型中,最佳脑手术法是:
开始初始化nH、W、θ
训练合理大的网络,以使误差最小化
用方程1计算H-1
q * ← arg min q w q 2 / ( 2 [ H - 1 ] qq ) (显著性Lq)
w ← w - w q * [ H - 1 ] q * q * H - 1 e q * (显著性Lq)
直到J(w)>θ
返回w
结束。
最佳脑损害法在计算上比较简单,因为对于对角矩阵而言,第3行的逆Hessian矩阵计算特别简单。当误差大于初始化为θ的标准时,上述算法终止。另一方法是当去除权重所引起的J(w)改变大于某些标准值时,改变第6行以终止。在一些实施方案中,是反向传播神经网络。参见,例如,Abdi,1994,“ANeural Network primer”,J.Biol System.2,247-283,其通过引用全文引入。
5.5.7聚类
在一些实施方案中,利用本发明所选生物标记的特征将训练组聚类。例如,考虑使用本发明所述的10个特征(对应于10种生物标记)的情况。训练群体的每个成员m将具有10种生物标记中之一种的特征值(例如表达值)。来自训练群体的成员m的值限定向量:
X1m X2m X3m X4m X5m X6m X7m X8m X9m X10m
其中Xim是生物体m中第i种生物标记的表达水平。如果在训练组中有m个生物体,选择i种生物标记将限定m个向量。注意本发明的方法不需要在向量中使用的每一种生物标记的每个表达值都在每个单一向量m中表示。换句话说,来自未发现第i种生物标记的个体的数据仍然可以用于聚类。在这些情况中,缺少的表达值被赋值为“0”或某些其它标准化的值。在一些实施方案中,在聚类之前,将特征值标准化为平均值为0且方差为1。
在训练组中显示相似表达模式的训练群体的成员将倾向于聚类在一起。当向量聚类到在训练群体中发现的性状组内时,本发明的基因的特定组合被认为是本发明该方面的良好分类器。例如,如果训练群体包括类别a:不发展成为脓毒症的个体,和类别b:发展成为脓毒症的个体,理想的聚类分类器将该群体聚类为两个组,一个聚类组仅表示类别a,另一个聚类组仅表示类别b。
聚类在Duda和Hart,Pattern Classification and Scene Analysis,1973,JohnWiley & Sons,Inc,New York的第211-256页有描述(下文称为“Duda 1973”),其在此通过引用全文引入。如Duda 1973的第6.7节所述,聚类问题被描述为一种在数据集中发现天然分组的方法。为了确定天然分组,需要解决两个问题。第一,确定两个样本之间的测量相似性(或不相似性)的方法。利用该测量(相似性测量)确保一类中的样本彼此之间的相似性高于与其它类中样本的相似性。第二,确定利用这种相似性测量将数据分配到类中的机制。
相似性测量在Duda 1973的第6.7节描述,其中说明开始聚类研究的一种方法是确定数据集中所有样本对之间的距离函数并计算距离矩阵。如果距离是相似性的良好量度,则同一类中样本之间的距离显著小于不同类中样本之间的距离。然而,如Duda 1973第215页所述,聚类不需要使用距离测量。例如,可以利用非测量的相似性函数s(x,x′)来比较两种向量x和x′。通常,s(x,x′)是一种对称函数,当x和x′“相似”时,其值较大。Duda 1973第216页提供了非测量的相似性函数s(x,x′)的一个例子。
一旦选定了检测数据集中点之间“相似性”或“不相似性”的方法,聚类就需要一个标准函数以测量任何数据分区的聚类质量。利用将标准函数极限化的数据集分区将数据聚类。参见Duda 1973第217页。标准函数在Duda 1973第6.8节描述。
最近,Duda等,Pattern Classification,第2版,John Wiley & Sons,Inc.NewYork已经出版。第537-563页详细描述了聚类。关于聚类方法的更多信息可见于Kaufman和Rousseeuw,1990,Finding Groups in Data:An Introduction toCluster Analysis,Wiley,New York,NY;Everitt,1993,Cluster analysis(第3版),Wiley,New York,NY和Backer,1995,Computer-Assisted Reasoning in ClusterAnalysis,Prentice Hall,Upper Saddle River,New Jersey。本发明可以使用的聚类法的具体例子包括但不限于层次聚类(使用最近邻算法、最远邻算法、平均连续算法、形心算法或平方和算法的合并聚类(agglomerative clustering))、k-平均值聚类、模糊k-平均值聚类算法和Jarvis-Patrick聚类。
5.5.8主成分分析
已经建议用主成分分析(PCA)分析基因表达数据。更普遍地,可以用PCA分析本发明生物标记的特征值数据,以构建用于区分转变者和非转变者的判定规则。主成分分析是一种经典技术,通过将数据转化为总结数据特征的新的一组变量(主成分)而减少数据集的维度。参见,例如,Jolliffe,1986,PrincipalComponents Analysis,Springer,New York,其通过引用引入。主成分分析在Draghici,2003,Data Analysis Tools for DNA Microassays,Chapman & Hall/CRC中也有描述,其通过引用引入。下面是主成分分析的非限制性例子。
主成分(PC)相互之间不相关,并且是这样排序的,即得第k种PC具有在PC中第k大的方差。第k种PC可以被解释为将数据点投影最大化从而使其垂直于前k-1种PC的方向。前面少数几种PC捕获数据集中的方差的大部分。相反,后面几种PC通常被认为只捕获数据中的残余“噪音”
可以根据本发明所述利用PCA产生分类器。在这种方法中,可以按照与以上聚类所述相同的方法构建本发明所选生物标记的向量。实际上,向量组(其中每一向量代表从训练群体特定成员选择的基因的特征值(例如,丰度值))可以被视为一个矩阵。在一些实施方案中,该矩阵用定性二元描述单体的Free-Wilson法表示(Kubinyi,1990,3D QSAR in drug design theory methods andapplications,Pergamon Press,Oxford,第589-638页),并且使用PCA将该矩阵分布在最大压缩空间中,使得第一主成分(PC)捕获最多的可能的方差信息,第二主成分(PC)捕获所有方差的第二多的信息,如此类推,直到矩阵中的所有方差信息都已被考虑。
然后,将每一向量(其中每一向量代表训练群体的成员)作图。可能作许多不同类型的图。在一些实施方案中,制作一维图。在该一维图中,将来自训练群体每一成员的第一主成分的值作图。在该形式的图中,预期第一亚组的成员(例如在确定时间期限内不发展成为脓毒症的个体)将在第一主成分值的一个范围内聚类,并且第二亚组的成员(例如在确定时间期限内发展成为脓毒症的个体)将在第一主成分值的第二个范围内聚类。
在一个理想的实例中,训练群体包括两个亚组:“脓毒症”和“SIRS”。第一主成分利用整个训练群体数据集中本发明所选生物标记的分子标记表达值来计算。然后,将训练组的每个成员作图,作为第一主成分的值的函数。在这种理想的实例中,其中第一主成分为阳性的训练群体的成员是“应答者”,而其中第一主成分为阴性的训练群体的成员是“脓毒症个体”。
在一些实施方案中,将训练群体的成员按照一种以上的主成分作图。例如,在一些实施方案中,训练群体的成员在二维图上作图,其中第一维是第一主成分,而第二维是第二主成分。在这种二维图中,预期训练群体中代表每一亚组的成员将聚类为不连续的组。例如,二维图上的第一类成员代表在特定时间期限内发展成为脓毒症的个体,而二维图上的第二类成员代表在特定时间期限内不发展成为脓毒症的个体。
5.5.9最近邻分析
最近邻分类器是基于记忆的,并且不需要拟合分类器。给出一个询问点x0,确定在距离上最接近于x0的k个训练点x(r),r,…,k,然后使用k个最近邻域将点x0分类。连接(tie)可以被随机打破。在一些实施方案中,利用特征空间中的Euclidean距离确定距离:
d(i)=‖x(r)-x0
一般来说,当使用最近邻算法时,将用来计算线性判别式的表达数据标准化为平均值为0且方差为1。在本发明中,将训练群体的成员随机分入训练组和测试组。例如,在一个实施方案中,将训练群体中2/3的成员置入训练组,并将训练群体中1/3的成员置入测试组。本发明生物标记的所选组合代表特征空间,在其中对测试组成员作图。然后,计算训练组正确表征测试组成员的能力。在一些实施方案中,对本发明生物标记的特定组合进行几次最近邻计算。在每次重复计算中,将训练群体的成员随机指定为训练组和测试组。然后,采用生物标记组合的质量作为每次重复最近邻计算的平均值。
可以改进最近邻规则以处理不等的类别优先级(class prior)、差异性误分类成本和特征选择的问题。许多这样的改进涉及对邻居进行某些形式的加权表决。关于最近邻分析的更多信息见Duda,Pattern Classification,Second Edition,2001,John Wiley & Sons,Inc和Hastie,2001,The Elements of StatisticalLearning,Springer,New York,其在此通过引用全文引入。
5.5.10线性判别分析
线性判别分析(LDA)试图根据某些目标性质将个体分类为两个类别之一。换句话说,LDA检验在实验中测得的目标属性是否预测该目标的分类。LDA一般需要连续自变量和二项分类因变量。在本发明中,训练群体亚组中本发明生物标记所选组合的特征值被作为要求的连续自变量。训练群体的每个成员的性状亚组分类被作为二项分类因变量。
LDA利用分组信息寻找使组间方差和组内方差的比值最大化的变量的线性组合。潜在地,LDA使用的线性权重依赖于训练组中分子标记的特征值如何在两个组(例如,在限定的时间期限内发展成为脓毒症的组a和在限定的时间期限内不发展成为脓毒症的组b)中分开以及这些特征值如何与其它生物标记的特征值相关。在一些实施方案中,LDA应用于训练样本中N个成员与本发明所述生物标记组合中的K种生物标记的数据矩阵。然后将训练群体每个成员的线性判别式作图。理想地,训练群体中代表第一亚组的这些成员(例如,在限定时间期限内发展成为脓毒症的个体)将被分类到线性判别值的一个范围内(例如阴性),而训练群体中代表第二亚组的那些成员(例如,在限定时间期限内不发展成为脓毒症的个体)将被分类到线性判别值的第二范围内(例如阳性)。当判别值类之间的分离较大时,认为LDA更加成功。关于线性判别分析的更多信息见Duda,Pattern Classification,第2版,2001,John Wiley & Sons,Inc;Hastie,2001,The Elements of Statistical Learning,Springer,New York;Venables和Ripley,1997,Modern Applied Statistics with s-plus,Springer,NewYork,其通过引用全文引入。
5.5.11二次判别分析
二次判别分析(QDA)采用与LDA相同的输入参数并返回相同的结果。QDA使用二次方程,而不是线性方程,来获得结果。LDA和QDA是可互换的,其利用软件的偏好性和/或可利用性来支持该分析。Logistic回归采用与LDA和QDA相同的输入参数并返回相同的结果。
5.5.12支持向量机
在本发明的一些实施方案中,利用支持向量机(SVM)用本发明所述基因的特征值将个体分类。SVM是相对较新类型的学***面分离给定的一组二元标记数据和训练数据,该超平面与它们具有最大距离。对于不可能进行线性分离的情况,SVM可以与“核心(kernels)”技术组合工作,该技术自动实现对特征空间的非线性作图。SVM在特征空间中发现的超平面对应于输入空间中的非线性判定边界。
在一种方法中,当使用SVM时,将特征数据标准化为平均值为0且方差为1,并将训练群体的成员随机分到训练组和测试组中。例如,在一个实施方案中,将训练群体中2/3的成员置入训练组,并将训练群体中1/3的成员置入测试组。利用本发明所述基因组合的表达值训练SVM。然后,确定训练后的SVM正确分类测试组成员的能力。在一些实施方案中,对生物标记的特定组合进行几次这样的计算。在每次重复计算中,将训练群体的成员随机指定为训练组和测试组。然后,采用生物标记组合的质量作为每次重复SVM计算的平均值。
5.5.13渐进法
由生物进化过程得到启示,设计判定规则的渐进法对判定规则使用随机搜索。在概述中,这种方法从本发明所述的生物标记组合中产生几种判定规则,即规则群。每一判定规则彼此略微不同。然后,用训练群体中的特征数据对判定规则打分。与生物进化模拟一致,得到的(标量)得分有时被称为适合度。根据其得分将判定规则排序,保留最佳判定规则(所有判定规则中的一些部分)。而且,与生物命名学一致,这被称为最适者生存。判定规则在下一代(子或后代)随机改变。一些后代判定规则的得分会高于它们前一代的亲代,一些得分会较低。然后在下一代重复总过程:对判定规则打分,保留最好的一个,随机改变得到另一代,等等。部分地,由于排序,每一代平均具有比前一代略高的得分。当一代中的一个最佳判定规则具有超过所需标准值的得分时,该过程停止。关于渐进法的更多信息见,例如,Duda,Pattern Classification,Second Edition,2001,John Wiley & Sons,Inc。
5.5.14其它数据分析算法
上述数据分析算法仅是可以用来构建区别转变者和非转变者的判定规则的方法类型的实例。而且,可以使用上述技术的组合。已经描述了一些组合,例如决策树和强化的组合的应用。然而,许多其它的组合也是可能的。另外,也可以利用本领域的其它技术如投影寻踪和加权表决构建判定规则。
5.6生物标记
在特定实施方案中,本发明提供在诊断或预测个体中的脓毒症和/或其进展阶段中有用的生物标记。尽管本发明的方法可以使用无偏法来鉴定预测性生物标记,但是技术人员将明白与生理应答或各种信号途径有关的特定生物标记组可以是特别注意的对象。特别是,来自生物样品的生物标记与可被用于通过与生物标记直接和特异性相互作用而测量各种生物标记的量的阵列(例如抗体阵列或核酸阵列)接触的情况。在这种情况中,阵列成分的选择可以基于如下提示,即特定途径与个体中脓毒症或SIRS状态的确定有关。特定生物标记具有预测或诊断脓毒症或SIRS的特征的提示可以产生以如下预期,即以同样方式进行生理调节的其它生物标记也同样可以提供预测或诊断性的特征。然而技术人员将理解,由于生物***的复杂性,这种预期可能不会实现。例如,如果特定mRNA生物标记的量是预测性特征,则如果其它生物标记的表达在翻译后水平上调节,另一生物标记的mRNA表达的一致变化可能是不可测定的。此外,生物标记的mRNA表达水平可受多重汇聚途径的影向,该多重汇聚途径可以与对脓毒症的生理应答有关或者可能无关。
生物标记可从任何生物样品获得,该生物样品例如是但不限于来自宿主或个体的全血、血浆、唾液、血清、红细胞、血小板、嗜中性粒细胞、嗜酸性粒细胞、嗜碱性粒细胞、淋巴细胞、单核细胞、尿、脑脊液、痰、粪便、细胞和细胞提取物、或其它生物液体样品、组织样品、组织活检物。采自个体的具体生物样品可能变化,但是采样优选地是侵入性最低的,并且是易于通过常规技术进行的。
表型改变的检测可以通过任何常规技术进行。体温、呼吸率、脉搏、血压或其它生理参数的测量可以通过临床观察和检测来实现。生物标记分子的测量可以包括,例如,指明生物标记分子的存在、其浓度、表达水平或任何其它与生物标记分子相关的值的测量。生物标记分子检测形式一般依赖于用来形成来自生物样品之生物标记谱的方法。参见以上第5.4节和以下的表1、4、5、6、7、8和/或9。
在特定实施方案中,生物标记谱包含以下表1、4、5、6、7、8和9的任何一个所列出至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种生物标记。在另一个特定实施方案中,生物标记谱包含表1、4、5、6、7、8和9的任何组合所列出至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种生物标记。在另一个特定实施方案中,生物标记谱包含以下表4所列出的至少2、3、4、5、6、7、8、9或10种不同的生物标记。在另一个特定实施方案中,生物标记谱至少包含CRP、APOA2和SERPINC1。在一些实施方案中,生物标记谱包含SERPINC1、APOA2和CRP中的至少一种,并且另外包括来自表1、4、5、6、7、8和9的任何组合的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种或更多种另外的生物标记。在一些实施方案中,生物标记谱包含SERPINC1、APOA2和CRP中的至少一种,并且另外包括来自表1、4、5、6、7、8和9的任何一个的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种或更多种另外的生物标记。生物标记谱进一步包含谱中每个生物标记的各自相应的特征。这些生物标记可以是,例如,mRNA转录物、cDNA或一些其它核酸,例如扩增的核酸或蛋白质。通常,生物标记谱中的生物标记来源于至少两种不同的基因。在生物标记谱中的生物标记在表1、4、5、6、7、8和/或9中列出的情况下,生物标记可以是例如,由列出的基因形成的转录物、其互补物、或区别性片段或其互补物、或其cDNA、或cDNA的区别性片段、或扩增的对应于所有或部分转录物或其互补物的区别性核酸分子,或该基因编码的蛋白质,或该蛋白质的区别性片段,或上述任一的指示。进一步地,生物标记可以是,例如,在表1、4、5、6、7、8和/或9中列出基因的蛋白质,或该蛋白质的区别性片段,或上述任一的指示。在此,区别性分子或片段是在检测时指示上述转录物、cDNA、扩增的核酸或蛋白质的存在或丰度的分子或片段。根据该实施方案,本发明的生物标记谱可以使用本领域技术人员公知的任何标准实验或本文所述用来检测生物标记的实验来获得。这些实验例如能够检测特定基因的表达产物(例如核酸和/或蛋白质)或目标基因的等位基因(例如表1、4、5、6、7、8和/或9中披露的基因)。在一个实施方案中,这种实验利用核酸微阵列。
在一些实施方案中,生物标记谱具有表1列出的2-100种生物标记。在一些实施方案中,生物标记谱具有表1列出的3-50种生物标记。在一些实施方案中,生物标记谱具有表1列出的4-25种生物标记。在一些实施方案中,生物标记谱具有表1列出的至少3种生物标记。在一些实施方案中,生物标记谱具有表1列出的至少4种生物标记。在一些实施方案中,生物标记谱具有表1列出的至少6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、96或100种生物标记。在一些实施方案中,每种这样的生物标记是核酸。在一些实施方案中,每种这样的生物标记是蛋白质。在一些实施方案中,生物标记谱中的一些生物标记是核酸,生物标记谱中的一些生物标记是蛋白质。
在一些实施方案中,生物标记谱具有表4列出的2-10种生物标记。在一些实施方案中,生物标记谱具有表4列出的3-8种生物标记。在一些实施方案中,生物标记谱具有表4列出的至少2、3、4、5、6、7、8、9或10种生物标记。在一些实施方案中,每种这样的生物标记是核酸。在一些实施方案中,每种这样的生物标记是蛋白质。在一些实施方案中,生物标记谱中的一些生物标记是核酸,生物标记谱中的一些生物标记是蛋白质。在一些实施方案中,生物标记谱至少包括CRP、APOA2和SERPINC1。在一些实施方案中,生物标记谱包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括来自表1、4、5、6、7、8和9的任何组合的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种或更多种另外的生物标记。在一些实施方案中,生物标记谱包括SERPINC1、APOA2和CRP中的至少一种,并且另外包括来自表1、4、5、6、7、8和9的任何一个的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种或更多种另外的生物标记。
在一些实施方案中,生物标记谱中的一些生物标记是核酸,生物标记谱中的一些生物标记是蛋白质。在一些实施方案中,生物标记谱具有表5列出的2-100种生物标记。在一些实施方案中,生物标记谱具有表5列出的3-50种生物标记。在一些实施方案中,生物标记谱具有表5列出的4-25种生物标记。在一些实施方案中,生物标记谱具有表5列出的至少3种生物标记。在一些实施方案中,生物标记谱具有表5列出的至少4种生物标记。在一些实施方案中,生物标记谱具有表5列出的至少6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90种生物标记。在一些实施方案中,每种这样的生物标记是核酸。在一些实施方案中,每种这样的生物标记是蛋白质。在一些实施方案中,生物标记谱中的一些生物标记是核酸,生物标记谱中的一些生物标记是蛋白质。
在一些实施方案中,生物标记谱具有表6列出的2-30种生物标记。在一些实施方案中,生物标记谱具有表6列出的3-50种生物标记。在一些实施方案中,生物标记谱具有表6列出的4-25种生物标记。在一些实施方案中,生物标记谱具有表6列出的至少3种生物标记。在一些实施方案中,生物标记谱具有表6列出的至少4种生物标记。在一些实施方案中,生物标记谱具有表6列出的至少6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90种生物标记。在一些实施方案中,每种这样的生物标记是核酸。在一些实施方案中,每种这样的生物标记是蛋白质。在一些实施方案中,生物标记谱中的一些生物标记是核酸,生物标记谱中的一些生物标记是蛋白质。
在一些实施方案中,生物标记谱具有表7列出的2-20种生物标记。在一些实施方案中,生物标记谱具有表7列出的3-25种生物标记。在一些实施方案中,生物标记谱具有表7列出的4-25种生物标记。在一些实施方案中,生物标记谱具有表7列出的至少3种生物标记。在一些实施方案中,生物标记谱具有表7列出的至少4种生物标记。在一些实施方案中,生物标记谱具有表7列出的至少6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种生物标记。在一些实施方案中,每种这样的生物标记是核酸。在一些实施方案中,每种这样的生物标记是蛋白质。在一些实施方案中,生物标记谱中的一些生物标记是核酸,生物标记谱中的一些生物标记是蛋白质。
在一些实施方案中,生物标记谱具有表8列出的2-20种生物标记。在一些实施方案中,生物标记谱具有表8列出的3-25种生物标记。在一些实施方案中,生物标记谱具有表8列出的4-25种生物标记。在一些实施方案中,生物标记谱具有表8列出的至少3种生物标记。在一些实施方案中,生物标记谱具有表8列出的至少4种生物标记。在一些实施方案中,生物标记谱具有表8列出的至少6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种生物标记。在一些实施方案中,每种这样的生物标记是核酸。在一些实施方案中,每种这样的生物标记是蛋白质。在一些实施方案中,生物标记谱中的一些生物标记是核酸,生物标记谱中的一些生物标记是蛋白质。
在一些实施方案中,生物标记谱具有表9列出的2-20种生物标记。在一些实施方案中,生物标记谱具有表9列出的3-25种生物标记。在一些实施方案中,生物标记谱具有表9列出的4-25种生物标记。在一些实施方案中,生物标记谱具有表9列出的至少3种生物标记。在一些实施方案中,生物标记谱具有表9列出的至少4种生物标记。在一些实施方案中,生物标记谱具有表9列出的至少6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种生物标记。在一些实施方案中,每种这样的生物标记是核酸。在一些实施方案中,每种这样的生物标记是蛋白质。在一些实施方案中,生物标记谱中的一些生物标记是核酸,生物标记谱中的一些生物标记是蛋白质。
为了参考目的,生物标记通过基因符号和基因名称在表1、4、5、6、7、8和9中列出。然而,除了这些,本发明还涵盖了这些基因的核酸产物形式和蛋白质产物形式,和其区别性片段。在以下第5.6.1节提供表1、4、5、6、7、8和9中所列的生物标记更详细的说明。
5.6.1有用的生物标记的分离
本节中的登录号指国家生物技术信息中心(NCBI)的登录号,通过NCBI门户Entrez至NCBI核苷酸数据库和NCBI蛋白质序列数据库。NCBI核苷酸数据库为一些来源的序列的集合,包括EST数据库、GSS数据库、HomoloGene、HTG数据库、SNP数据库、RefSeq(Release17)、UniSTS、UniGene和PDB。
Figure G2006800528730D01162
是NIH遗传序列数据库,带注释的所有公众可得到的DNA序列的集合(Nucleic Acids Research 2005 January 13;33(DatabaseIssue):D34-D36)。到2006年2月为止,记录在常规GenBank部分的54,584,635序列中大约有59,750,386,305个碱基而记录在WGS部分的12,465,546序列中有63,183,065,091个碱基。EST数据库是表达序列标签或读取自mRNA的短的单程序列(cDNA)的集合。GSS数据库是基因组调查序列或短的单程基因组序列的数据库。HomoloGene是比较一对生物体之间核苷酸序列以鉴定推定的同源物的基因同源性工具。HTG数据库是来自大规模基因组测序中心的高-通过量基因组序列的集合,包括测序未完成和完成的序列。SNP数据库是单-碱基核苷酸取代和短的缺失和***多态性的中心储存库。RefSeq数据库是非-冗余对照序列标准的数据库,包括基因组DNA重叠群、已知基因的mRNA和蛋白质。关于RefSeq的更多信息,参见NCBI Reference Sequence(RefSeq):基因组、转录物和蛋白质的精确的非-冗余序列数据库,Pruitt等,2005,NucleicAcids Res 33:D501-D504。STS数据库是序列标签位点或基因组中调控上独特的短序列的数据库。UniSTS数据库是序列标签位点(STS)的统一、非-冗余的梗概。UniGene数据库是EST和组织成簇的全长mRNA序列的集合,每个代表用定位图和表达信息以及对其它来源的相互对照注释的独特的已知或推定的人基因。NCBI蛋白质数据库汇集自各种来源,包括SwissProt、ProteinInformation Resource(PIR)、PRF、Protein Data Bank(PDB)(来自已揭示结构的序列)和来自GenBank和RefSeq中带注释的编码区的翻译产物。
C4B的核苷酸序列(由登录号K02403确定)公开于,例如,Belt等,1984,“The structural basis of the multiple forms of human complement component C4”,Cell 36,907-914,C4B的氨基酸序列(由登录号确定AAB67980)公开于,例如,Xie等,2003,“Analysis of the gene-dense major histocompatibility complex classIII region and its comparison to mouse”,Genome Res.13,2621-2635,每篇在此通过引用全文引入。
SERPIN A3的核苷酸序列(由登录号NM_001085确定)公开于,例如,Furiya,Y  等,2005,“Alpha-1-antichymotrypsin gene polymorphism andsusceptibility to multiple system atrophy(MSA)”,Brain Res.Mol.Brain Res.138(2),178-181,SERPINA3的氨基酸序列(由登录号NP_001076确定)公开于,例如,Furiya,Y  等,2005,“Alpha-1-antichymotrypsin gene polymorphism andsusceptibility to multiple system atrophy(MSA)”,Brain Res.Mol.BrainRes.138(2),178-181,每篇在此通过引用全文引入。
ACTB的核苷酸序列(由登录号NM_001101确定)公开于,例如,Dahlen,A.等,2004,“Molecular genetic characterization of the genomic ACTB-GLI fusion inpericytoma with t(7;12)”,Biochem.Biophys.Res.Commun.325(4),1318-1323,ACTB的氨基酸序列(由登录号AAS79319确定)公开于Livingston,R.J等并未发表,并且每篇在此通过引用全文引入。
AFM的核苷酸序列(由登录号NM_001133确定)公开于,例如,Jerkovic,L等,2005,“Afamin is a novel human vitamin E-binding glycoproteincharacterization and in vitro expression”,J.Proteome Res.4(3),889-899,AFM的氨基酸序列(由登录号AAA21612确定)公开于,例如,Lichenstein,H.S等,1994,“Afamin is a new member of the albumin,alpha-fetoprotein,and vitaminD-binding protein gene family”,J.Biol.Chem.269(27),18149-18154,每篇在此通过引用全文引入。
AGT的核苷酸序列(由登录号NM_000029确定)公开于,例如,Rasmussen-Torvik,L.J  等,2005,“A  population association study ofangiotensinogen polymorphisms and haplotypes with left ventricular phenotypes”,Hypertension 46(6),1294-1299,AGT的氨基酸序列(由登录号AAR03501确定)公开于,例如Crawford,D.C等,2004,“Haplotype diversity across 100 candidategenes for inflammation,lipid metabolism,and blood pressure regulation in twopopulations”,Am.J.Hum.Genet.74(4),610-622,每篇在此通过引用全文引入。
AHSG的核苷酸序列(由登录号NM_001622确定)公开于,例如,Matsushima,K等,1982,“Purification and physicochemical characterization ofhuman alpha 2-HS-glycoprotein”,Biochim.Biophys.Acta 701(2),200-205;Keeley,F.W.等,1985,“Identification and quantitation of alpha 2-HS-glycoprotein in themineralized matrix of calcified plaques of atherosclerotic human aorta”,Atherosclerosis 55(1),63-69;Yoshioka,Y等,1986,“The complete amino acidsequence of the A-chain of human plasma alpha 2HS-glycoprotein”,J.Biol.Chem.261(4),1665-1676,AHSG的氨基酸序列(由登录号NP_001613确定)公开于,例如,Matsushima,K等,1982,“Purification and physicochemicalcharacterization of human alpha 2-HS-glycoprotein”,Biochim.Biophys.Acta701(2),200-205(1982);Keeley,F.W等,1985,“Identification and quantitation ofalpha 2-HS-glycoprotein in the mineralized matrix of calcified plaques ofatherosclerotic human aorta”,Atherosclerosis 55(1),63-69;Yoshioka.Y等,1986,“The complete amino acid sequence of the A-chain of human plasma alpha2HS-glycoprotein”,J.Biol.Chem.261(4),1665-1676,每篇在此通过引用全文引入。
AMBP的核苷酸序列(由登录号NM_001633确定)公开于,例如,Ekstrom,B.等,1977,“Human alphal-microglobulin.Purification procedure,chemical andphysiochemical properties”,J.Biol.Chem.252(22),8048-8057;Grubb,A.O.等,1983,“Isolation of human complex-forming glycoprotein,heterogeneous incharge(protein HC),and its IgA complex from plasma.Physiochemical andimmunochemical properties,normal plasma concentration”,J.Biol.Chem.258(23),14698-14707;Bourguignon,J等,1985,“Human inter-alpha-trypsin-inhibitor:characterization and partial nucleotide sequencing of a light chain-encodingcDNA”,Biochem.Biophys.Res.Commun.131(3),1146-1153,AMBP的氨基酸序列(由登录号NP_001624确定)公开于,例如,Ekstrom,B等,1977,“Humanalphal-microglobulin.Purification procedure,chemical and physiochemicalproperties”,J.Biol.Chem.252(22),8048-8057;Grubb,A.O等,1983,“Isolation ofhuman complex-forming glycoprotein,heterogeneous in charge(protein HC),andits IgA complex from plasma.Physiochemical and immunochemical properties,normal plasma concentration”,J.Biol.Chem.258(23),14698-14707;Bourguignon,J等,1985,“Human inter-alpha-trypsin-inhibitor:characterization and partialnucleotide sequencing of a light chain-encoding cDNA”,Biochem.Biophys.Res.Commun.131(3),1146-1153,每篇在此通过引用全文引入。
APOF的核苷酸序列(由登录号NM_001638确定)公开于,例如,Olofsson,S.O等,1978,“Isolation and partial characterization of a new acidicapolipoprotein(apolipoprotein F)from high density lipoproteins of human plasma”,Biochemistry 17(6),1032-1036;Koren,E等,“Isolation and characterization ofsimple and complex lipoproteins containing apolipoprotein F from human plasma”,Biochemistry 21(21),5347-5351;Day,J.R等,1994,″Purification and molecularcloning of human apolipoprotein F”,Biochem.Biophys.Res.Commun.203(2),1146-1151,APOF的氨基酸序列(由登录号AAA65642确定)公开于,例如,Day,J.R.等,1994,“Purification and molecular cloning of human apo1ipoproteinF”,Biochem.Biophys.Res.Commun.203(2),1146-1151,每篇在此通过引用全文引入。
APOA1的核苷酸序列(由登录号NM_000039确定)公开于,例如,Breslow等,1987,“Isolation and characterization of cDNA clones for humanapolipoprotein A-I”,Proc.Natl.Acad.Sci.U.S.A.79(22),6861-6865;Karathanasis等,1983,“An inherited polymorphism in the human apolipoprotein A-I gene locusrelated to the development of atherosclerosis”,Nature 301(5902),718-720;Law等,1983,“cDNA cloning of human apoA-I:amino acid sequence ofpreproapoA-I”,Biochem.Biophys.Res.Commun.112(1),APOA1的氨基酸序列(由登录号AAD34604确定)公开于,例如,Hamidi等,1999,“A novelapolipoprotein A-I variant,Argl73Pro,associated with cardiac and cutaneousamyloidosis”,Biochem.Biophys.Res.Commun.257,584-588,每篇在此通过引用全文引入。
APOA1前体的核苷酸序列(由登录号NM_000039确定)公开于,例如,Breslow,J.L等,1987,“Isolation and characterization of cDNA clones for humanapolipoprotein A-I5”,Proc.Natl.Acad.Sci.U.S.A.79(22),6861-6865;Karathanasis,S.K.等,1983,“An inherited polymorphism in the human apolipoprotein A-I genelocus related to the development of atherosclerosis”,Nature 301(5902),718-720;Law,S.W等,1983,“cDNA cloning of human apoA-I:amino acid sequence ofpreproapoA-I”,Biochem.Biophys.Res.Commun.112(1),APOA1前体的氨基酸序列(由登录号P02647确定)公开于,例如,Shoulders,1983,“Gene structure ofhuman apolipoprotein A1”,Nucleic Acids Research 1.1983,2827-2837,每篇在此通过引用全文引入。
APOA2的核苷酸序列(由登录号NM_001643确定)公开于,例如,Brewer,H.B.Jr.等,1972,“Amino acid sequence of human apoLp-GIn-II(apoA-II),anapolipoprotein isolated from the high-density lipoprotein complex”,Proc.Natl.Acad.Sci.U.S.A.69(5),1304-1308;Servillo,L等,1981,“Evaluation ofthe mixed interaction between apolipoproteins A-II and C-I equilibriumsedimentation”,Biophys.Chem.13(1),29-38;Koren,E等,1982,“Isolation andcharacterization of simple and complex lipoproteins containing apolipoprotein Ffrom human plasma”,Biochemistry 21(21),5347-5351,APOA2的氨基酸序列(由登录号AAA51701确定)公开于,例如,Chan,L.等,1987,“Molecular cloning andsequence analysis of human apolipoprotein A-II cDNA”,Meth.Enzymol.128,745-752,每篇在此通过引用全文引入。
载脂蛋白A-II前体的核苷酸序列(由登录号X00955确定)公开于,例如,Brewer等,1972,“Amino acid sequence of human apoLp-GIn-II(ApoA-II),anapoliprotein isolated from the high-density lipoprotein complex”,Proc.Natl.Acad.Sci.U.S.A.69,1304-1308,载脂蛋白A-II前体的核苷酸序列(由登录号P02652确定)公开于,例如,Knott等,1985,“The human apolipoprotein All genestructural organization and sites of expression”,Nucleic Acids Research 13,6387-6398,每篇在此通过引用全文引入。
APOA4的核苷酸序列(由登录号NM_000482确定)公开于,例如,Karathanasis,S.K.,1985,“Apolipoprotein multigene family:tandem organizationof human apolipoprotein AI3 CIII,and AIV genes”,Proc.Natl.Acad.Sci.U.S.A.82(19),6374-6378;Elshourbagy,N.A等,1986,“The nucleotide and derivedamino acid sequence of human apolipoprotein A-IV mRNA and the close linkageof its gene to the genes of apolipoproteins A-I and C-III”,J.Biol.Chem.261(5),1998-2002;Karathanasis,S.K.等,1986,“Structure,evolution,and tissue-specificsynthesis of human apolipoprotein AIV”,Biochemistry 25(13),3962-3970,APOA4的氨基酸序列(由登录号AAS68228确定)公开于,例如,Fullerton等,2004,“The effects of scale:variation in the APOA1/C3/A4/A5 gene cluster”,Hum.Genet.115(1),36-56(2004),每篇在此通过引用全文引入。
APOB的核苷酸序列(由登录号NM_000384确定)公开于,例如,Mahley,R.W.等,1984,“Plasma lipoproteins:apolipoprotein structure and function”,J.Lipid Res.25(12),1277-1294;Lusis,AJ等,1985,“Cloning and expression ofapolipoprotein B,the major protein of low and very low density lipoproteins”,Proc.Natl.Acad.Sci.U.S.A.82(14),4597-4601;Deeb,S.S.等,1985,“A partialcDNA clone for human apolipoprotein B”,Proc.Natl.Acad.Sci.U.S.A.82(15),4983-4986,APOB的氨基酸序列(由登录号AAP72970确定)公开于,Yang等,1986,“The complete cDNA and amino acid sequence of human apolipoproteinB-100”,J.Biol.Chem.261,12918-12921,每篇在此通过引用全文引入。
APOC1的核苷酸序列(由登录号NM_001645确定)公开于,例如,Servillo,L.等,1981,“Evaluation of the mixed interaction between apolipoproteins A-II andC-I equilibrium sedimentation”,Biophys.Chem.13(1),29-38;Curry,M.D等,1981,“Quantitative determination of apolipoproteins C-I and C-II in human plasma byseparate electroimmunoassays”,Clin.Chem.27(4),543-548;Knott,TJ等,1984,“Characterisation of mRNAs encoding the precursor for human apolipoprotein CI”,Nucleic Acids Res.12(9),3909-3915,APOC1的氨基酸序列(由登录号AAQ91813确定)公开于,Jackson等,1974,“The primary strueture of apolipoprotein-serine,”J.Biol.Chem.249:5308-5313,每篇在此通过引用全文引入。
APOC3的核苷酸序列(由登录号BC027977确定)公开于,例如,Strausberg,R.L.等,2002,“Generation and initial analysis of more than 15,000 full-lengthhuman and mouse cDNA sequences”,Proc.Natl.Acad.Sci.U.S.A.99(26),16899-16903,APOC3的氨基酸序列(由登录号AAB59372确定)公开于,例如,Maeda,H等,1987,“Molecular cloning of a human apoC-III variant:Thr 74-Ala74 mutation prevents O-glycosylation”,J.Lipid Res.28(12),1405-1409,每篇在此通过引用全文引入。
APOE的核苷酸序列(由登录号NM_000041确定)公开于,例如,Utermann,G.等,1979,“Polymorphism of apolipoprotein E.III.Effect of a singlepolymorphic gene locus on plasma lipid levels in man”,Clin.Genet.15(1),63-72;Rail,S.C.Jr.等,1982,“Structural basis for receptor binding heterogeneity ofapolipoprotein E from type III hyperlipoproteinemic subjects”,Proc.Natl.Acad.Sci.U.S.A.79(15),4696-4700;Breslow,JX.等,1982,“Identification and DNA sequence of a human apolipoprotein E cDNA clone”,J.Biol.Chem.257(24),14639-14641,APOE的氨基酸序列(由登录号AAB59397确定)公开于,例如,Emi,M等,1988,“Genotyping and sequence analysis ofapolipoprotein E isoforms”,Genomics 3(4),373-379;Das,H.K等,1985,“Isolation,characterization,and mapping to chromosome 19 of the humanapolipoprotein E gene”,J.Biol.Chem.260(10),6240-6247,每篇在此通过引用全文引入。
APOH的核苷酸序列(由登录号NM_000042确定)公开于,例如Lee,.N.S等,1983,“beta 2-Glycoprotein I.Molecular properties of an unusual apolipoprotein,apolipoprotein H”,J.Biol.Chem.258(8),4765-4770;Lozier等,1984,“Completeamino acid sequence of human plasma beta 2-glycoprotein I”,Proc.Natl.Acad.Sci.U.S.A.81(12),3640-3644;Henry等,1988,“Inhibition of theactivation of Hageman factor(factor XII)by beta 2-glycoprotein I”,J.Lab.Clin.Med.Il l(5),519-523,APOH的氨基酸序列(由登录号CAA40977确定)公开于,例如Mehdi等,1991,“Nucleotide sequence and expression of thehuman gene encoding apolipoprotein H(beta 2-glycoprotein I)”,Gene 108(2),293-298,每篇在此通过引用全文引入。
SERPINC1的核苷酸序列(由登录号NM_000488确定)公开于,例如,Bjork等,1981,“The site in human antithrombin for functional proteolytic cleavage byhuman thrombin,”FEBS Lett.126(2),257-260;Lijnen,H.R等,1983,“Heparinbinding properties of human histidine-rich glycoprotein.Mechanism and role in theneutralization of heparin in plasma”,J.Biol.Chem.258,3803-3808;Chandra等,1983,“Isolation and sequence characterization of a cDNA clone of humanantithrombin III”,Proc.Natl.Acad.Sci.U.S.A.80,1845-1848,SERPINC1的氨基酸序列(由登录号CAI14923确定)公开于,例如,Sehra,2005,DirectSubmission,Wellcome Trust Sanger Institute,Hinxton,Cambridgeshire,每篇在此通过引用全文引入。
抗凝血酶-III前体的核苷酸序列(ATIII)(由登录号X68793确定)公开于Bock等1988,“Antithrombin III Utah:proline-407 to leucine mutation in a highlyconserved region near the inhibitor reactive site,”Biochemistry 27,6171-6178,抗凝血酶-III前体的氨基酸序列公开于Bock,1982,“Cloning and expression of thecDNA for human antithrombin III,”Nucleic Acids Res 10,8113-8125,每篇在此通过引用全文引入。
AZGP1的核苷酸序列(由登录号NM_001185确定)公开于,例如,Burgi等,1981,“Preparation and properties of Zn-alpha 2-glycoprotein of normal humanplasma”,J.Biol.Chem.236,1066-1074;Shibata  等,1982,“Nephrogenicglycoprotein.IX.Plasma  Zn-alpha2-glycoprotein as a second source ofnephritogenic glycoprotein in urine”,Nephron 31(2),170-176;Ueyama,H等,1991,“Cloning and nucleotide sequence of a human Zn-alpha 2-glycoproteincDNA and chromosomal assignment of its gene”,Biochem.Biophys.Res.Commun.177(2),696-703,AZGP1的氨基酸序列(由登录号NP_001176确定)公开于,例如,Burgi,W等,1981,“Preparation and propertiesof Zn-alpha 2-glycoprotein of normal human plasma”,J.Biol.Chem.236,1066-1074;Shibata等,1982,“Nephritogenic glycoprotein.IX.Plasma Zn-alpha2-glycoprotein as a second source of nephritogenic glycoprotein in urine”,Nephron31(2),170-176;Ueyama,H.等,1991,“Cloning and nucleotide sequence of ahuman Zn-alpha 2-glycoprotein cDNA and chromosomal assignment of its gene”,Biochem.Biophys.Res.Commun.177,696-703,每篇在此通过引用全文引入。
BF的核苷酸序列(由登录号NM_001710确定)公开于,例如,Arnason,A.等,1977,“Very close linkage between HLA-B and BF inferred from allelicassociation”,Nature 268(5620),527-528;Woods等,1982,“Isolation of cDNAclones for the human complement protein factor B,a class III majorhistocompatibility complex gene product”,Proc.Natl.Acad.Sci.U.S.A.79(18),5661-5665;Campbell,R.D等,1983,“Molecular cloning and characterization ofthe gene coding for human complement protein factor B”,Proc.Natl.Acad.Sci.U.S.A.80(14),4464-4468。
SERPING1的核苷酸序列(由登录号NM_000062确定)公开于,例如,Chesne,S.等,1982,“Fluid-phasa interaction of C1 inhibitor(C1 Inh)and thesubcomponents CIr and CIs of the first component of complement,C1,Biochem.J.201(1),61-70;Brower,M.S等,1982,“Proteolytic cleavage and inactivation ofalpha 2-plasmin inhibitor and C1 inactivator by human polymorphonuclearleukocyte elastase”,J.Biol.Chem.257(16),9849-9854;Nilsson,T等,1983,“Structural and circular-dichroism studies on the interaction between humanC1-esterase inhibitor and CIs”,Biochem.J.213(3),617-624(1983),SERPING1的氨基酸序列(由登录号AAW69393确定)公开于,例如,Stoppa-Lyonnet,1990,“Clusters of intragenic AIu repeats predispose the human C1 inhibitor locus todeleterious rearrangements,”Proc.Natl.Acad.Sci.USA 87:1551-1555,每篇在此通过引用全文引入。
血浆蛋白酶C1抑制剂前体的核苷酸序列(由登录号确定AB209826)公开于,例如,Carter,1988,“Genomic and cDNA cloning of the human C1 inhibitor.Intron-exon junctions and comparison to other serpins,”Eur.J.Biochem.173:163-169,血浆蛋白酶C1抑制剂前体的氨基酸序列(由登录号P05155确定)公开于,例如,Dunbar and Fothergill,1988,Eur.J.Biochm 173,163-169,每篇在此通过引用全文引入。
C1QB的核苷酸序列(由登录号确定NM_000491)公开于,例如,Reid,K.B等,1978,“Amino acid sequence of the N-terminal 108 amino acid residues of theB chain of subcomponent CIq of the first component of human complement”,Biochem.J.173(3),863-868;Reid,K.B.,1979,“Complete amino acid sequences ofthe three collagen-like regions present in subcomponent CIq of the first componentof human complement”,Biochem.J.179(2),367-371;Reid,K.B等,1982,“Completion of the amino acid sequences of the A and B chains of subcomponentCIq of the first component of human complement”,Biochem.J.203(3),559-569,ClQB的氨基酸序列(由登录号NP_000482确定)公开于,Reid,K.B等,1978,“Amino acid sequence of the N-terminal 108 amino acid residues of the B chain ofsubcomponent CIq of the first component of human complement”,Biochem.J.173(3),863-868;Reid,K.B,1979,“Complete amino acid sequences of the threecollagen-like regions present in subcomponent CIq of the first component ofhuman complement”,Biochem.J.179(2),367-371;Reid,K.B等,1982,“Completion of the amino acid sequences of the A and B chains of subcomponentCIq of the first component of human complement”,Biochem.J.203(3),559-569,每篇在此通过引用全文引入。
C1S的核苷酸序列(由登录号NM_201442确定)公开于,例如,Nilsson,T等,1983,“Structural and circular-dichroism studies on the interaction betweenhuman C1-esterase inhibitor and CIs”,Biochem.J.213(3),617-624;Bock,S.C等,1986,“Human C1 inhibitor:primary structure,cDNA cloning,and chromosomallocalization”,Biochemistry 25(15),4292-4301(1986);Mackinnon,CM.,1987,“Molecular cloning of cDNA for human complement component CIs.Thecomplete amino acid sequence”,Eur.J.Biochem.169(3),547-553,C1S的氨基酸序列(由登录号AAW69393确定)公开于,例如,Nilsson,T等,1983,“Structural andcircular-dichroism studies on the interaction between human C1-esterase inhibitorand CIs”,Biochem.J.213(3),617-624;Bock,S.C等,1986,“Human C1 inhibitor:primary structure,cDNA cloning,and chromosomal localization”,Biochemistry25(15),4292-4301;Mackinnon,C.M.1987,“Molecular cloning of cDNA forhuman complement component CIs.The complete amino acid sequence”,Eur.a.Biochem.169(3),547-553,每篇在此通过引用全文引入。
C2的核苷酸序列(由登录号NM_000063确定)公开于,例如,Lutsenko,S.M等,1976,“Circulating blood volume and regional hemodynamics in acutegastrointestinal hemorrhage”,J.Biol.Chem.2,38-41;Bentley,D.R等,1984,“Isolation of cDNA clones for human complement component C2”,Proc.Natl.Acad.Sci.U.S.A.81(4),1212-1215;Bentley,D.R.,1985,“DNApolymorphism of the C2 locus”,Immunogenetics 22(4),377-390。
C3的核苷酸序列(由登录号NM_000064确定)公开于,例如,Alper,CA等,1970,“Studies in vivo and in vitro on an abnormality in the metabolism ofC3in a patient with increased susceptibility to infection”,J.Clin.Invest.49(11),1975-1985;Renwick,A.G等,1978,“The fate of saccharin impurities:theexcretion and metabolism of[3-14C]Benz[d]-isothiazoline-1,l-dioxide(BIT)inman and rat”,Xeriobiotica 8(8),475-486;Bischof,P等,1984.“Pregnancy-associated plasma protein A(PAPP-A)specifically inhibits the thirdcomponent of human complement(C3)”,Placenta 5(1),1-7,C3的氨基酸序列(由登录号AAR89906确定)公开于,例如,Hugli,1975,“Humananaphylatoxin(C3a)from the third component of complment”,J.Biol.Chem.250:8293-8301;Oxvig等,1995,“Identification of angiotensinogen and complementC3dg as novel proteins binding the proform of eosinophil major basic protein inhuman pregnancy serum and plasma”,J.Biol.Chem.270:13645013651;和Thomas等,1982,“Third compoment of human complement:localization of the internalthiolester bond”,Proc.Natl.Acad.Sci.USA 79:1054-1058,每篇在此通过引用全文引入。
C4BPA的核苷酸序列(由登录号NM_001017367确定)公开于,例如,Hillarp,A等,1988,“Novel subunit in C4b-binding protein required for protein Sbinding”,J.Biol.Chem.263(25),12759-12764(1988);Hillarp.A.,1990“T Cloningof cDNA coding for the beta chain of human complement component C4b-bindingprotein:sequence homology with the alpha chain”,Proc.Natl.Acad.Sci.U.S.A.87(3),1183-1187;Andersson,A等,1990“Genes for C4b-binding proteinalpha-and beta-chains(C4BPA and C4BPB)are located on chromosome 1,bandIq32,in humans and on chromosome  13 in rats”,Somat.CellMol.Genet.16(5),493-500,每篇在此通过引用全文引入。
C5的核苷酸序列(由登录号NM 001736确定)公开于,例如,Gerard,N.P.等,1991,“The chemotactic receptor for human C5a anaphylatoxin”,Nature349(6310),614-617;Boulay,F.,等,1991,“T Expression cloning of a receptor forC5a anaphylatoxin on differentiated HL-60 cells”,Biochemistry30(12),2993-2999;Bao,L.,等,1992,“Mapping of genes for the human C5areceptor(C5AR),human FMLP receptor(FPR),and two FMLP receptor homologueorphan receptors(FPRH1,FPRH2)to chromosome 19,Genomics 13(2),437-440,C5的氨基酸序列(由登录号NP_001726确定)公开于,例如,Tack,B.F等,1979,“Fifth component of human complement:purification from plasma andpolypeptide chain structure”,Biochemistry 18(8),1490-1497;Lundwall,A.B等,1985,“Isolation and sequence analysis of a cDNA clone encoding the fifthcomplement component″,J.Biol.Chem.260(4),2108-2112;Wetsel,R.A等,1988,“Molecular analysis of human complement component C5:localization of thestructural gene to chromosome 9,Biochemistry 27(5),1474-1482,每篇在此通过引用全文引入。
C8A的核苷酸序列(由登录号NM_000562确定)公开于,例如,Matthews,1980,“Recurrent meningococcal infections associated with a functional deficiencyof the C8 component of human complement”,CHn.Exp.Immunol.39(1),53-59;Stewart,JX等,1985,“Analysis of the specific association of the eighth and ninthcomponents of human complement:identification of a direct role for the alphasubunit of C8”,Biochemistry 24(17),4598-4602;Rao,A.G.,1987,“ComplementaryDNA and derived amino acid sequence of the alpha subunit of human complementprotein C8:evidence for the existence of a separate alpha subunit messenger RNA”,Biochemistry 26(12),3556-3564,C8A的氨基酸序列(由登录号CAI19172确定)公开于,例如,Steckel,1980,“The eight component of human complment”,J.Biol.Chem.255:11997-12005,每篇在此通过引用全文引入。
C8G的核苷酸序列(由登录号NM_000606确定)公开于,例如,Ng,S.C等,1987,“The eighth component of human complement:evidence that it is anoligomeric serum protein assembled from products of three different genes”,Biochemistry 26(17),5229-5233;Haefliger,J.A.等,1987,“Structural homology ofhuman complement component C8 gamma and plasma protein HC:identity ofthecysteine  bond  pattern”,Biochem.Biophys.Res.Commun.149(2),750-754;Kaufman,K.M等,1994,“Genomic structure of the human complement protein C8gamma:homology to the lipocalin gene family”,Biochemistry 33(17),5162-5166,C8G的氨基酸序列(由登录号CAI19172确定)公开于,例如,Schreck等,2000,“Human complement protein C8 gamma”,Biochim.Biophys.Acta 1482:199-208;Ortlund等,“Crystal structure of human complement protein C8 gamma”,Biochemistry 41:7030-7037,每篇在此通过引用全文引入。
C9的核苷酸序列(由登录号NM_001737确定)公开于,例如,DiScipio,R.G等,1984,“Nucleotide sequence of cDNA and derived amino acid sequence ofhuman complement component C9”,Proc.Natl.Acad.Sci.U.S.A.81(23),7298-7302;Stanley,K.K等,1985,“The sequence and topology of humancomplement component C9”,EMBO J.4(2),375-382;Stewart,J.L等,1985,“Analysis of the specific association of the eighth and ninth components of humancomplement:identification of a direct role for the alpha subunit of C8”,Biochemistry 24(17),4598-4602,C9的氨基酸序列(由登录号NP_001728确定)公开于,例如DiScipio,R.G等,1984,“Nucleotide sequence of cDNA and derivedamino acid sequence of human complement component C9”,Proc.Natl.Acad.Sci.U.S.A.81(23),7298-7302;Stanley,K.K等,1985,“Thesequence and topology of human complement component C9”,EMBOJ.4(2),375-382;Stewart,J.L等,1985,“Analysis of the specific association of theeighth and ninth components of human complement:identification of a direct rolefor the alpha subunit of C8”,Biochemistry 24(17),4598-4602,每篇在此通过引用全文引入。
SERPINA6的核苷酸序列(由登录号NM_001756确定)公开于,例如,Rosner,W等,1976,“Identification of conicosteroid-binding globulin in humanmilk:measurement with a filter disk assay”,J.Clin.Endocrinol.Metab.42(6),1064-1073;Agrimonti,F等,1982,“Circadian and circaseptan rhythmicities incorticosteroid  -binding  globulin(CBG)binding  activity of human milk”,J.Chromatogr.9(3),281-290;Hammond,G.L等,1986,“Identification andmeasurement of sex hormone binding globulin(SHBG)and corticosteroid bindingglobulin(CBG)in human saliva”,Acta Endocrinol.112(4),603-608,SERPINA6的氨基酸序列(由登录号NP_001002236,NP_000286确定)公开于,例如,Kurachi,K.等,1981,“Cloning and sequence of cDNA coding for alpha1-antitrypsin”,Proc.Natl.Acad.Sci.U.S.A.78(11),6826-6830;Lobermann,H等,1982,“Interaction of human alpha 1-proteinase inhibitor with chymotrypsinogen Aand crystallization of a proteolytically modified alpha 1-proteinase inhibitor″,Hoppe-Seyler′s Z.Physiol.Chem.363(11),1377-1388;Bollen,A等,1983,“Cloningand expression in Escherichia coli of full-length complementary DNA coding forhuman alpha 1-antitrypsin”,DNA 2(4),255-264,每篇在此通过引用全文引入。
CD14的核苷酸序列(由登录号NM_000591确定)公开于,例如,Goyert,S.M等,1988,“The CD14 monocyte differentiation antigen maps to a regionencoding growth factors and receptors”,Science 239(4839),497-500;Ferrero,E.等,1988,“Nucleotide sequence of the gene encoding the monocyte differentiationantigen,CD14”,Nucleic Acids Res.16(9),4173;Simmons,D.L等,1989,“Monocyteantigen CD 14 is a phospholipid anchored membrane protein”,Blood 73(1),284-289,每篇在此通过引用全文引入。
CLU的核苷酸序列(由登录号NM_203339确定)公开于,例如,Murphy,B.F等,1988,“SP-40,40,a newly identified normal human serum protein found in theSC5b-9 complex of complement and in the immune deposits inglomerulonephritis”,J.Clin.Invest.81(6),1858-1864;Yokoyama,M等,1988,“Isolation and characterization of sulfated glycoprotein from human pancreaticjuice”,Biochim.Biophys.Acta 967(1),34-42;Kirszbaum,L等,1989,“Molecularcloning and characterization of the novel,human complement-associated protein,SP-40,40:a link between the complement and reproductive systems”,EMBOJ.8(3),711-718,CLU的氨基酸序列(由登录号AAP88927确定)公开于,例如,James等,1991,“Characterization of a human high density lipoprotein-associatedprotein”,Arterioscler.Thromb.11:645-652;de Silva等,1990,“Purification andcharacterization of apolipoprotein J,“J.Biol.Chem.265:14292-14297,每篇在此通过引用全文引入。
CP的核苷酸序列(由登录号NM_000096确定)公开于,例如,Kingston,LB等,1977,“Chemical evidence that proteolytic cleavage causes the heterogeneitypresent in human ceruloplasmin preparations”,Proc.Natl.Acad.Sci.U.S.A.74(12),5377-5381;Polosatov,M.V等,1979,“Interaction of synthetic human big gastrinwith blood proteins of man and animals”,Proc.Natl.Acad.Sci.U.S.A.26(2),154-159;Rask,L等,1983,“Subcellular localization in normal and vitaminA-deficient rat liver of vitamin A serum transport proteins,albumin,ceruloplasminand class I major histocompatibility antigens”,Exp.Cell Res.143(1),91-102,CP的氨基酸序列(由登录号NP_000087确定)公开于,例如,Kingston,LB等,1977,“Chemical evidence that proteolytic cleavage causes the heterogeneity present inhuman ceruloplasmin preparations”,Proc.Natl.Acad.Sci.U.S.A.74(12),5377-5381;Polosatov,M.V等,1979,″Interaction of synthetic human biggastrin with blood proteins of man and animals”,Proc.Natl.Acad.Sci.U.S.A.26(2),154-159;Rask,L等,1983,“Subcellular localization in normal and vitaminA-defiota]cient rat liver of vitamin A serum transportproteins,albumin,ceruloplasmin and class I major histocompatibility antigens”,Exp.Cell Res.143(1),91-102,每篇在此通过引用全文引入。
CRP的核苷酸序列(由登录号NM_000567确定)公开于,例如,Osmand,A.P等,1977,“Characterization of C-reactive protein and the complementsubcomponent CIt as homologous proteins displaying cyclic pentamericsymmetry(pentraxins)”,Proc.Natl.Acad.Sci.U.S.A.74(2),739-743;Oliveira,E.B等,1979,“Primary structure of human C-reactive protein”,J.Biol.Chem.254(2),489-502;Whitehead,A.S等,1983,“Isolation of humanC-reactive protein complementary DNA and localization of the gene tochromosome 1”,Science 221(4605),69-71,CRP的氨基酸序列(由登录号NP_000558确定)公开于,例如,Osmand,A.P等,1977,“Characterization ofC-reactive protein and the complement subcomponent CIt as homologous proteinsdisplaying cyclic pentameric symmetry(pentraxins)”,Proc.Natl.Acad.Sci.U.S.A.74(2),739-743;Oliveira,E.B等,1979,“Primary structure of human C-reactiveprotein”,J.Biol.Chem.254(2),489-502;Whitehead,A.S等,1983,“Isolation ofhuman C-reactive protein complementary DNA and localization of the gene tochromosome 1”,Science 221(4605),69-71,每篇在此通过引用全文引入。
C-反应蛋白前体的核苷酸序列和氨基酸序列(分别由M11880和AAB59526确定)公开于,例如,Who等,1985,“Characterization of genomic andcomplementary DNA sequence of human C-reactive poretin,comparison with thecomplementary DNA sequence of serum amyloid P component,“J.Biol.Chem.260,13384-13388,其在此通过引用全文引入。
F2的核苷酸序列(由登录号NM_000506确定)公开于,例如,Bergmann等,1982,“Receptor-bound thrombin is not internalized through coated pits inmouse embryo cells”,J.Cell.Biochem.20(3),247-258;Degen等,1983,“Characterization of the complementary deoxyribonucleic acid and gene coding forhuman prothrombin”,Biochemistry 22(9),2087-2097;Wicki,A.N等,1985,“Structure and function of platelet membrane glycoproteins Ib and V.Effects ofleukocyte elastase and other proteases on platelets response to von Willebrandfactor and thrombin”,Eur.J.Biochem.153(1),1-11,F2的氨基酸序列(由登录号AAL77436确定)公开于WaIz等,1972,“Amino Acid Sequence of humanprothrombin fragments 1 and 2”,Proc.Natl.Acad.Sci.U.S.A.74:1969-1972;Butkowski等,1977,“Primary structure of human prethrombin 2 andalpha-thrombin”,J.Biol.Chem.252:4942-4957,每篇在此通过引用全文引入。
F9的核苷酸序列(由登录号NM_000133确定)公开于,例如,Davie等,1975,“Basic mechanisms in blood coagulation”,Annu.Rev.Biochem”.44,799-829;Gentry,P.A.,1977,“Interaction of heparin with canine coagulationproteins:in vivo and in vitro studies”,Can.J.Comp.Med.41(4),396-403;Choo,K.H等,1982,“Molecular cloning of the gene for human anti-haemophilic factor IX5”,Nature 299(5879),178-180,F9的氨基酸序列(由登录号NP_000124确定)公开于,例如,Scherer Davie,E.W等,1975,“Basic mechanisms in blood coagulation”,Annu.Rev.Biochem.44,799-829;Gentry,P.A.,1977,“Interaction of heparin withcanine coagulation proteins:in vivo and in vitro studies”,Can.J.Comp.Med.41(4),396-403;Choo,K.H等,1982,“Molecular cloning of the gene for human anti-haemophilic factor IX”,Nature 299(5879),178-180,每篇在此通过引用全文引入。
FGA的核苷酸序列(由登录号BC070246确定)公开于,例如,Strausberg等,2002,“Generation and initial arnalysis of more than 15,000 full-length humanand mouse cDNA sequences”,Proc.Natl.Acad.Sci.U.S.A.99(26),16899-16903,FGA的氨基酸序列(由登录号BAC55116确定)公开于,例如,Hamasaki,N.,2002,Direct Submission,Naotaka Hamasaki,Kyushu University Hospital,Department of clinical chemistry and laboratory;3-1-1 maidasi,Higasi-kuFukuokasi,Fukuoka 812-8582,Japan,Watanabe,K等,未发表,“Identification ofsimultaneous mutation of fibrinogen alpha;chain and protain C genes in a Japanesekindred”,每篇在此通过引用全文引入。
FGB的核苷酸序列(由登录号NM_005141确定)公开于,例如,Tarakhovskii等,1979,“Temperature-dependent changes in the profile of the sarcoplasmicreticulum membrane hydrophobic zones”,Biokhimiia 44(5),897-902;Weinger,R.S等,1980,“Fibrinogen Houston:a dysfibrinogen exhibiting defectivefibrin monomer aggregation and alpha-chain cross-linkages”,Am.J.Hematol.9(3),237-248;Chung,D.W等,1983,“Characterization of complementarydeoxyribonucleic acid and genomic deoxyribonucleic acid for the beta chain ofhuman firinogen”,Biochemistry 22(13),3244-3250,FGB的氨基酸序列(由登录号AAA18024确定)公开于,例如,Chung,D.W等,1991,“Nucleotide sequencesof the three genes coding for human fibrinogen”,Fibrinogen,Thrombosis,Coagulation and Fibrinolysis:39-48;Plenum Press,New York,每篇在此通过引用全文引入。
FGG的核苷酸序列(由登录号NM_000509确定)公开于,例如,Olaisen,B等,1982,“Fibrinogen gamma chain locus is on chromosome 4 in man”,Hum.Genet.61(1),24-26,Hawiger,J等,1982,“gamma and alpha chains of humanfibrinogen possess sites reactive with human platelet receptors”,Proc.Natl.Acad.Sci.U.S.A.79(6),2068-2071;Chung,D.W.等,1983,″Characterization of a complementary deoxyribonucleic acid coding for thegamma chain ofhuman fibrinogen”,Biochemistry 22(13),3250-3256,FGG的氨基酸序列(由登录号AAB59531确定)公开于,例如,Rixon,M.W等,1985,“Nucleotide sequence of the gene for the gamma chain of human fibrinogen”,Biochemistry 24(8),2077-2086,每篇在此通过引用全文引入。
FLNA的核苷酸序列(由登录号NM_001456确定)公开于,例如,Wallach,D.等,1978,“Cyclic AMP-dependent phosphorylation of the actin-binding proteinfilamin”,Proc.Natl.Acad.Sci.U.S.A.9,371-379;Gorlin,J.B等,1990,“Humanendothelial actin-binding protein(ABP-280,nonmuscle filamin):a molecular leafspring”,J.Cell Biol.111(3),1089-1105;Maestrini,E等,1990,“Probes for CpGislands on the distallong arm of the human X chromosome are clustered in Xq24and Xq28”,Genomics 8(4),664-670,FLNA的氨基酸序列(由登录号CAI43227确定)公开于,例如,Heath,P.,2002,Direct Submission,Wellcome Trust SangerInstitute,Hinxton,Cambridgeshire,CBlO ISA,UK,每篇在此通过引用全文引入。
FN1的核苷酸序列(由登录号BT006856确定)公开于,例如,Kalnine等,2003,Direct Submission,BD Biosciences Clontech,1020 East Meadow Circle,Palo Alto,California 94303,USA;Kalnine,N.等,“Cloning of human full-lengthCDSs in BD Creator(TM)System Donor vector”,FN1的氨基酸序列(由登录号BAD52437确定)公开于,例如,Kato,2004,Direct Submission,Seishi Kato,National Rehabilitation Center for Persons with Disabilities,Research Institute,Department of Rehabilitation Engineering;4-1 Namiki,Tokorozawa,Saitama359-8555,Japan;Kato,2004,“Human full-length cDNA starting with the cappedsite sequence”,只在数据库公开,每篇在此通过引用全文引入。
GC的核苷酸序列(由登录号NM_000583确定)公开于,例如,Mikkelsen,M等,1977,“Possible localization of Gc-System on chromosome 4.Loss of long arm4 material associated with father-child incompatibility within the Gc-System”,Hum.Hered.27(2),105-107;Constans,J.等,1981,“Binding of the apo and holoforms of the serum vitamin D-binding protein to human lymphocyte cytoplasm andmembrane by indirect immunofluorescence”,Immunol.Lett.3(3),159-162;Wooten,M.W等,1985,“Identification of a major endogenous substrate forphospholipid/Ca2+-dependent kinase in pancreatic acini as Gc(vitamin D-bindingprotein)”,FEBS Lett.191(1),97-101,GC的氨基酸序列(由登录号NP_000574确定)公开于,例如,Mikkelsen,M等,1977,“Possible localization of Gc-System onchromosome  4.Loss of long arm 4 material associated with father-childincompatibility within the Gc-System”,Hum.Hered.27(2),105-107;Constans,J等,1981,“Binding of the apo and holo forms of the serum vitamin D-bindingprotein to human lymphocyte cytoplasm and membrane by indirectimmunofluorescence”,Immunol.Lett.3(3),159-162;Wooten,M.W等,1985,“Identification of a major endogenous substrate for phospholipid/Ca2+-dependentkinase in pancreatic acini as Gc(vitamin D-binding protein)”,FEBS Lett.191(1),97-101,每篇在此通过引用全文引入。
GSN的核苷酸序列(由登录号BC026033确定)公开于,例如,Strausberg等,2002,“Generation and initial analysis of more than 15,000 full-length humanand mouse cDNA sequences”,Proc.Natl.Acad.Sci.U.S.A.99(26),16899-16903,其在此通过引用全文引入。
HBB的核苷酸序列(由登录号NM_000518确定)公开于,例如,Marotta,CA等,1976,“Nucleotide sequence analysis of coding and noncoding regions ofhuman beta-globin mRNA”,Prog.Nucleic Acid Res.Mol.Biol.19,165-175;Proudfoot,N.J.,1977,“Complete 3’noncoding region sequences of rabbit andhuman beta-globin messenger RNAs,”,Cell 10(4),559-570;Marotta,CA等,1977,“Human  beta-globin  messenger  RNA.III.Nucleotide sequences derived fromcomplementary DNA”,J.Biol.Chem.252(14),5040-5053,HBB的氨基酸序列(由登录号AAD19696确定)公开于,例如,Braunitzer等,1961,“The constitutionof normal adult human haemoglobin”,Hoppe-Seyler′sZ.Physiol.Chem.325:283-286,每篇在此通过引用全文引入。
SERPIND1的核苷酸序列(由登录号NM_000185确定)公开于,例如,Ragg,H.,1986,“A new member of the plasma protease inhibitor gene family”,Nucleic Acids Res.14(2),1073-1088;Inhorn,R.C等,1986,“Isolation andcharacterization of a partial cDNA clone for heparin cofactor III”,Biochem.Biophys.Res.Commun.137(1),431-436;Hortin,G  等,1986,“Identification of two sites of sulfation of human heparin cofactor II”,J.Biol.Chem.261(34),15827-15830,SERPIND1的氨基酸序列(由登录号CAG30459确定)公开于,例如,Collins等,2004,“A genome annotation-drivenapproach to cloning the human ORFeome”,Genome Biol.5(10),R84,每篇在此通过引用全文引入。
HP的核苷酸序列(由登录号BC107587确定)公开于,例如Strausberg等,2002,“Generation and initial analysis of more than 15,000 full-length human andmouse cDNA sequences”,Proc.Natl.Acad.Sci.U.S.A.99(26),16899-16903,HP的氨基酸序列(由登录号NP_005134确定)公开于,例如,Kazim,A.L等,1980,“Haemoglobin binding with haptoglobin.Unequivocal demonstration that thebeta-chains of human haemoglobin bind to haptoglobin”,Biochem.J.185(1),285-287;Eaton等,1982,“Haptoglobin:a natural bacteriostat”,Science 215(4533),691-693;Costanzo等,Sequence of human haptoglobin cDNA:evidence that thealpha and beta subunits are coded by the same mRNA”,Nucleic Acids Res.11(17),5811-5819,每篇在此通过引用全文引入。
HPX的核苷酸序列(由登录号NM_000613确定)公开于,例如,Morgan,W.T  等,1978,“Interaction of rabbit hemopexin with bilirubin”,Biochim.Biophys.Acta 532(1),57-64;Takahashi.N等,1984,“Structure of humanhemopexin:O-glycosyl and N-glycosyl sites and unusual clustering of tryptophanresidues”,Proc.Natl.Acad.Sci.U.S.A.81(7),2021-2025;Frantikova,V等,”Aminoacid sequence of the N-terminal region of human hemopexin”,FEBS Lett.178(2),213-216,HPX的氨基酸序列(由登录号NP_000604确定)公开于,例如,Morgan,W.T  等,1978,“Interaction of rabbit hemopexin with bilirubin”,Biochim.Biophys.Acta 532(1),57-64;Takahashi,N等,1984,“Structure ofhumanhemopexin:O-glycosyl and N-glycosyl sites and unusual clustering of tryptophanresidues”,Proc.Natl.Acad.Sci.U.S.A.81(7),2021-2025;Frantikova,V等,“Aminoacid sequence of the N-terminal region of human hemopexin”,FEBS Lett.178(2),213-216.每篇在此通过引用全文引入。
HRG的核苷酸序列(由登录号NM_000412确定)公开于,例如,Heimburger,N等,1972,“Human serum proteins with high affinity to carboxymethylcellulose.II.Physico-chemical and immunological characterization of a histidine-rich 3,8S-2-glycoportein(CM-protein I)”,Hoppe-Seyler′s Z.Physiol.Chem.353(7),1133-1140;Silverstein,R.L等,1984,“Complex formation of platelet thrombospondinwith plasminogen.Modulation of activation by tissue activator”,J.Clin.Invest.74(5),1625-1633;Leung,L.L.,1986,“Interaction of histidine-rich glycoproteinwith fibrinogen and fibrin”,J.Clin.Invest.77(4),1305-1311,HRG的氨基酸序列(由登录号NP_000403确定)公开于,例如,Heimburger,N等,1972,“Humanserum proteins with high affinity to carboxymethylcellulose.II.Physico-chemicaland immunological characterization of a histidine-rich3,8S-2-glycoportein(CM-protein I)5”,Hoppe-Seyler′s Z.Physiol.Chem.353(7),1133-1140;Silverstein,R.L等,1984,“Complex formation of plateletthrombospondin with plasminogen.Modulation of activation by tissue activator”,J.Clin.Invest.74(5),1625-1633;Leung,L.L,1986,“Interaction of histidine-richglycoprotein with fibrinogen and fibrin”,J.Clin.Invest.77(4),1305-1311,每篇在此通过引用全文引入。
IF的核苷酸序列(由登录号NM_000204确定)公开于,例如,Catterall,CF等,1987,“Characterization of primary amino acid sequence of human complementcontrol protein factor I from an analysis of cDNA clones”,Biochem.J.242(3),849-856;Goldberger,G.等,1987,“Human complement factor I:analysis ofcDNA-derived primary structure and assignment of its gene to chromosome 4”,J.Biol.Chem.262(21),10065-10071;Shiang,R等,1989,“Mapping of the humancomplement factor I gene to 4q25”,Genomics 4(1),82-86,IF的氨基酸序列(由登录号NP_000195确定)公开于,例如,Catterall,CF等,1987,“Characterizationof primary amino acid sequence of human complement control protein factor Ifrom an analysis of cDNA clones”,Biochem.J.242(3),849-856;Goldberger,G等,1987,“Human complement factor I:analysis of cDNA-derived primary structureand assignment of its gene to chromosome 4”,J.Biol.Chem.262(21),10065 10071;Shiang,R等,1989,“Mapping of the human complement factor I gene to 4q25”,Genomics 4(1),82-86,每篇在此通过引用全文引入。
IGFALS的核苷酸序列(由登录号NM_004970确定)公开于,例如,Baxter,R.C等,1989,“High molecular weight insulin-like growth factor bindingprotein complex.Purification and properties of the acid-labile subunit from humanserum”,I J.Biol.Chem.264(20),11843-11848;Leong,S.R.等,1992,“Structure andfunctional expression of the acid-labile subunit of the insulin-like growthfactor-binding protein complex”,Mol.Endocrinol.6(6),870-876;Dai,J等,1992,“Molecular cloning of the acid-labile subunit of the rat insulin-like growth factorbinding protein complex”,Biochem.Biophys.Res.Comrnun.188(1),304-309,IGFALS的氨基酸序列(由登录号NP_004691确定)公开于,例如,Kubisch,C.等,1999,“KCNQ4,a novel potassium channel expressed in sensory outer haircells,is mutated in dominant deafness”,Cell 96(3),437-446;Selyanko,A.A.等,2000,“Inhibition of KCNQ 1-4potassium channels expressed in mammalian cellsvia Ml muscarinic acetylcholine receptors”,J.Physiol.(Lond.)522PT 3,349-355;Sogaard,R.等,2001,“KCNQ4 channels expressed in mammalian cells:functionalcharacteristics and pharmacology”,Am.J.Physiol.,Cell Physiol.280(4),C859-C866,每篇在此通过引用全文引入。
ITGA1的核苷酸序列(由登录号NM_181501确定)公开于,例如,Takada等,1987,“The very late antigen family of heterodimers is part of a superfamily ofmolecules involved in adhesion and embryogenesis”,Proc.Natl.Acad.Sci.U.S.A.84(10),3239-3243;MacDonald,T.T等,1990,“Increased expression of laminin/collagen receptor(VLA-I)on epithelium of inflamed human intestine”,J.Clin.Pathol.43(4),313-315;Tawil,N.J.等,1990,“Alpha 1 beta 1 integrinheterodimer functions as a dual laminin/collagen receptor in neural cells”,Biochemistry 29(27),6540-6544,ITGA1的氨基酸序列(由登录号NP_852478确定)公开于,例如,Scherer Takada,Y等,1987,“The very late antigen family ofheterodimers is part of a superfamily of molecules involved in adhesion andembryogenesis”,Proc.Natl.Acad.Sci.U.S.A.84(10),3239-3243;MacDonald,T.T等,1990,“Increased expression of laminin/collagen receptor(VLA-I)onepithelium of inflamed human intestine”,J.Clin.Pathol.43(4),313-315;Tawil,NJ等,1990,“Alpha 1 beta 1 integrin heterodimer functions as a duallaminin/collagen receptor in neural cells”,Biochemistry 29(27),6540-6544,每篇在此通过引用全文引入。
ITIH1的核苷酸序列(由登录号BC109115确定)公开于,例如,NIH MGCProject,2005,Direct Submission,National Institutes of Health,Mammalian GeneCollection(MGC),Bethesda,MD 20892-2590,USA,ITIH1的氨基酸序列(由登录号NP_002206,NP_032432确定)公开于,例如,Salier,J.P等,1987,“Isolation andcharacterization of cDNAs encoding the heavy chain of human inter-alpha-trypsininhibitor(I alpha TI):unambiguous evidence for multipolypeptide chain structureof I alpha TI”,Proc.Natl.Acad.Sci.U.S.A.84(23),8272-8276;Diarra-Mehrpour,M等,1989,“Human plasma inter-alpha-trypsin inhibitoris encoded by four gernes onthree chromosomes”,Eur.J.Biochem.179(1),147-154;Gebhard,W等,1989,“Twoout of the three kinds of subunits of inter-alpha-trypsin inhibitor are structurallyrelated”,Eur.J.Biochem.181(3),571-576,每篇在此通过引用全文引入。
ITIH2的核苷酸序列(由登录号NM_002216确定)公开于,例如,Salier,J.P等,1987,“Isolation and characterization of cDNAs encoding the heavy chain ofhuman inter-alpha-trypsin inhibitor(I alpha TI):unambiguous evidence formultipolypeptide chain structure of I alpha TI”,Proc.Natl.Acad.Sci.U.S.A.84(23),8272-8276;Gebhard,W等,1988,“Complementary DNA and derived amino acidsequence of the precursor of one of the three protein components of theinter-alpha-trypsin inhibitor complex”,FEBS Lett.229(1),63-67;Salier,J.P等,1988,“Human inter-alpha-trypsin inhibitor.Isolation and characterization ofheavy(H)chain cDNA clones coding for a 383 amino-acid sequence of the Hchain”,Biol.Chem.Hoppe-Seyler 369 SUPPL,15-18,ITIH2的氨基酸序列(由登录号NP_002207确定)公开于,例如,Salier,J.P等,1987,“Isolation andcharacterization of cDNAs encoding the heavy chain of human inter-alpha-trypsininhibitor(I alpha TI):unambiguous evidence for multipolypeptide chain structureof I alpha TI”,Proc.Natl.Acad.Sci.U.S.A.84(23),8272-8276;Gebhard,W等,1988,“Complementary DNA and derived amino acid sequence of the precursor of one ofthe three protein components of the inter-alpha-trypsin inhibitor complex”,FEBSLett.229(1),63-67;Salier.J.P等,1988,“Human inter-alpha-trypsininhibitor.Isolation and characterization of heavy(H)chain cDNA clones coding fora 383 amino-acid sequence of the H chain”,Biol.Chem.Hoppe-Seyler 369 SUPPL,15-18,每篇在此通过引用全文引入。
ITIH4的核苷酸序列(由登录号NM_002218确定)公开于,例如,Tobe,T.等,1995,“Mapping of human inter-alpha-trypsin inhibitor family heavychain-related protein gene(ITIHLl)to human chromosome 3p21->p14”,Cytogenet.Cell Genet.71(3),296-298;Saguchi,K等,1995,“Cloning andcharacterization of cDNA for inter-alpha-trypsin inhibitor family heavychain-related protein(IHRP),a novel human plasma glycoprotein”,J.Biochem.117(1),14-18;Nishimura,H等,1995,“cDNA and deduced amino acid sequence ofhuman PK-120,a plasma kallikrein-sensitive glycoprotein”,FEBS Lett.357(2),207-211,ITIH4的氨基酸序列(由登录号NP_002209确定)公开于,例如,Tobe,T.等,1995,“Mapping of human inter-alpha-trypsin inhibitor family heavychain-related protein gene(ITIHLl)to human chromosome 3p21->p14”,Cytogenet.Cell Genet.71(3),296-298;Saguchi等,1995,“Cloning andcharacterization of cDNA for inter-alpha-trypsin inhibitor family heavychain-related protein(IHRP),a novel human plasma glycoprotein”,J.Biochem.117(1),14-18;Nishimura,H.等,1995,“cDNA and deduced amino acid sequenceof human PK-120,a plasma kallikrein-sensitive glycoprotein”,FEBS Lett.357(2),207-211,每篇在此通过引用全文引入。
KLKB1的核苷酸序列(由登录号NM_000892确定)公开于,例如,Aznar,J.A等,1978,“Fletcher factor deficiency:report of a new family”,J.Biol.Chem.21(2),94-98;Thompson,R.E.等,“Studies of binding of prekallikreinand Factor XI to high molecular weight kininogen and its light chain”,Proc.Natl.Acad.Sci.U.S.A.76(10),4862-4866;Chung,D.W.,等,“Human plasmaprekallikrein,a zymogen to a serine protease that contains four tandem repeats”,Biochemistry 25(9),2410-2417,KLKB1的氨基酸序列(由登录号NP_000883确定)公开于,例如,Aznar,J.A等,1978,“Fletcher factor deficiency:report of a newfamily”,J.Biol.Chem.21(2),94-98;Thompson,R.E等,“Studies of binding ofprekallikrein and Factor XI to high molecular weight kininogen and its lightchain”,Proc.Natl.Acad.Sci.U.S.A.76(10),4862-4866;Chung,D.W.,等,“Humanplasma prekallikrein,a zymogen to a serine protease that contains four tandemrepeats”,Biochemistry 25(9),2410-2417,每篇在此通过引用全文引入。
KNG1的核苷酸序列(由登录号NM_000893确定)公开于,例如,Colman,R.W等,1975,“Williams trait.Human kininogen  deficiency withdiminished levels of plasminogen proactivator and prekallikrein associated withabnormalities of the Hageman factor-dependent pathways”,J.Clin.Invest.56(6),1650-1662;Thompson,R.E等,1979,“Studies of binding of prekallikrein andFactor XI to high molecular weight kininogen and its light chain”,Proc.Natl.Acad.Sci.U.S.A.76(10),4862-4866;Kerbiriou,D.M等,1979,“Humanhigh molecular weight kininogen.Studies of structure-function relationships and ofproteolysis of the molecule occurring during contact activation of plasma”,J.Biol.Chem.254(23),12020-12027,KNG1的氨基酸序列(由登录号NP_000884确定)公开于,例如,Colman,R.W等,1975,“Williams trait.Human kininogendeficiency with diminished levels of plasminogen proactivator and prekallikreinassociated with abnormalities of the Hageman factor-dependent pathways”,J.Clin.Invest.56(6),1650-1662;Thompson,R.E等,1979,“Studies of binding ofprekallikrein and Factor XI to high molecular weight kininogen and its lightchain”,Proc.Natl.Acad.Sci.U.S.A.76(10),4862-4866;Kerbiriou,D.M.等,1979,“Human high molecular weight kininogen.Studies of structure-functionrelationships and of proteolysis of the molecule occurring during contact activationofplasma”,J.Biol.Chem.254(23),12020-12027,每篇在此通过引用全文引入。
KRT1的核苷酸序列(由登录号BC063697确定)公开于,例如,Strausberg等,2002,“Generation and initial analysis of more than 15,000 full-length humanand mouse cDNA sequences”,Proc.Natl.Acad.Sci.U.S.A.99(26),16899-16903,KRT1的氨基酸序列(由登录号NP_000412确定)公开于,例如,Darmon,M.Y等,1987,“Sequence of a cDNA encoding human keratin No 10 selected accordingto  structural homologies of keratins and their tissue-specific expression”,Mol.Biol.Rep.12(4),277-283;Zhou,X.M等,1988,“The complete sequence of thehuman intermediate filament chain keratin 10.Subdomainal divisions and modelfor folding of end domain sequences”,J.Biol.Chem.263(30),15584-15589,每篇在此通过引用全文引入。
LGALS3BP的核苷酸序列(由登录号NM_005567、BC015761、BC002403、BC002998确定)公开于,例如,Rosenberg,I等,1991,“Mac-2-bindingglycoproteins.Putative ligands for a cytosolic beta-galactoside lectin”,J.Biol.Chem.266(28),18731-18736;Koths,K.等,1993,“Cloning andcharacterization of a human Mac-2-binding protein,a new member of thesuperfamily defined by the macrophage scavenger receptor cysteine-rich domain”,J.Biol.Chem.268(19),14245-14249;Ullrich,A.等,1994,“The secreted tumor-associated antigen 9OK is a potent immune stimulator”,J.Biol.Chem.269(28),18401-18407;Strausberg等,2002,“Generation and initial analysis of more than15,000 full-length human and mouse cDNA sequences”,Proc.Natl.Acad.Sci.U.S.A.99(26),16899-16903;LGALS3BP的氨基酸序列(由登录号NP_005558确定)公开于,例如,Rosenberg,I等,1991,“Mac-2-binding glycoproteins.Putativeligands for a cytosolic beta-galactoside lectin”,J.Biol.Chem.266(28),18731-18736;Koths,K等,1993,“Cloning and characterization of a humanMac-2-binding protein,a new member of the superfamily defined by themacrophage scavenger receptor cysteine-rich domain”,J.Biol.Chem.268(19),14245-14249;Ullrich,A等,1994,“The secreted tumor-associated antigen 9OK isa potent immune stimulator”,J.Biol.Chem.269(28),18401-18407,每篇在此通过引用全文引入。
LPA的核苷酸序列(由登录号NM_005577确定)公开于,例如,McLean,J.W等,1987,“cDNA sequence of human apolipoprotein(a)is homologous toplasminogen”,Nature 330(6144),132-137;Frank,S.L等,1998,“Theapolipoprotein(a)gene resides on human chromosome 6q26-27,in close proximityto the homologous gene for plasminogen”,Hum.Genet.79(4),352-356;Salonen,E.M等,1989,“Lipoprotein(a)binds to fibronectin and has serineproteinase activty capable of cleaving it”,EMBO J.8(13),4035-4040,LPA的氨基酸序列(由登录号NP_005568确定)公开于,例如,McLean,J.W等,1987,“cDNA sequence of human apolipoprotein(a)is homologous to plasminogen”,Nature 330(6144),132-137;Frank,S.L等,1998,“The apolipoprotein(a)generesides on human chromosome 6q26-27,in close proximity to the homologousgene for plasminogen”,Hum.Genet.79(4),352-356;Salonen,E.M.等,1989,“Lipoprotein(a)binds to fibronectin and has serine proteinase activity capable ofcleaving it”,EMBO J.8(13),4035-4040,每篇在此通过引用全文引入。
MLL的核苷酸序列(由登录号NM_005934确定)公开于,例如,Tkachuk,D.C等,1992,“Involvement of a homolog of Drosophila trithorax by 1Iq23 chromosomal translocations in acute leukemias”,Cell 71(4),691-700;Yamamoto,K等,1993,“Two distinct portions of LTG19/ENL at 19p13 areinvolved in t(11;19)leukemia”,Oncogene 8(10),2617-2625;Rubnitz,J.E等,1994,“ENL,the gene fused with HRX in t(11;19)leukemias,encodes a nuclearprotein with transcriptional activation potential in lymphoid and myeloid cells”,Blood 84(6),1747-1752,MLL的氨基酸序列(由登录号NP_005924确定)公开于,例如,Ziemin-van der Poel,S等,1991,“Identification of a gene,MLL,thatspans the breakpoint in 1 Iq23 translocations associated with human leukemias”,Proc.Natl.Acad.Sci.U.S.A.88(23),10735-10739;Djabali,M等,1992,“Atrithorax-like gene is interrupted by chromosome 1 Iq23 translocations in acuteleukaemias”,Nat.Genet.2(2),113-118;Tkachuk,D.C等,1992,“Involvement of ahomolog of Drosophila tri thorax by 1 Iq23 chromosomal translocations in acuteleukemias”,Cell 71(4),691 700,每篇在此通过引用全文引入。
MRC1的核苷酸序列(由登录号NM_002438确定)公开于,例如,Taylor,M.E等,1990,“Primary structure of the mannose receptor contains multiplemotifs resembling carbohydrate-recognition domains”,J.Biol.Chem.265(21),12156-12162;Ezekowitz,R.A等,1990,Molecular characterization of the humanmacrophage mannose receptor:demonstration of multiple carbohydraterecognition-like domains and phagocytosis of yeasts in Cos-1 cells”,J.Exp.Med.172(6),1785-1794;Taylor,M.E等,1992,“Contribution to Hgandbinding by multiple carbohydrate-recognition domains in the macrophage mannosereceptor”,J.Biol.Chem.267(3),1719-1726,MRC1的氨基酸序列(由登录号NP_002429确定)公开于,例如,Taylor,M.E.等,1990,“Primary structure of themannose receptor contains multiple motifs resembling carbohydrate-recognitiondomains”,J.Biol.Chem.265(21),12156-12162;Ezekowitz,R.A等,1990,“Molecular characterization of the human macrophage mannose receptor:demonstration of multiple carbohydrate recognition-like domains and phagocytosisof yeasts in Cos-1 cells”,J.Exp.Med.172(6),1785-1794;Taylor,M.E等,1992,“Contribution to ligand binding by multiple carbohydrate-recognition domains inthe macrophage mannose receptor”,J.Biol.Chem.267(3),1719-1726,每篇在此通过引用全文引入。
MYL2的核苷酸序列(由登录号NM_000432确定)公开于,例如,DallaLibera,L等,1989,“Isolation and nucleotide sequence of the cDNA encodinghuman ventricular myosin light chain 2”,Nucleic Acids Res.17(6),2360;Macera,M.J等,“Localization of the gene coding for ventricular myosin regulatory lightchain(MYL2)to human chromosome 12q23-q24.3”,Genomics 13(3),829-831;Wadgaonkar,R等,1993,“Interaction of a conserved peptide domain inrecombinant human ventricular myosin light chain-2 with myosin heavy chain”,Cell.Mol.Biol.Res.39(I)513-26,MYL2的氨基酸序列(由登录号AAH31006确定)公开于,例如,Strausberg,R.L.,“Generation and initial analysis of more than15,000 full-length human and mouse cDNA sequences”,Proc.Natl.Acad.Sci.U.S.A.99(26),16899-16903(2002),每篇在此通过引用全文引入。
MYO6的核苷酸序列(由登录号NM_004999确定)公开于,例如,Bement,W.M等,1994,“Identification and overlapping expression of multipleunconventional myosin genes in vertebrate cell types”,Proc.Natl.Acad.Sci.U.S.A.91(14),6549-6553;Avraham,K.B等,1995,“The mouse Snell′s waltzerdeafness gene encodes an unconventional myosin required for structural integrityof inner ear hair cells”,Nat.Genet.11(4),369-375;Avraham,K.B等,1997,“Characterization of unconventional MYO6,the human homologue of the generesponsible for deafness in Snell′s waltzer mice”,Hum.Mol.Genet.6(8),1225-1231,KCTD7的氨基酸序列(由登录号NP_004990确定)公开于,例如,Bement,W.M等,1994,“Identification and overlapping expression of multipleunconventional myosin genes in vertebrate cell types”,Proc.Natl.Acad.Sci.U.S.A.91(14),6549-6553;Avraham,K.B等,1995,“The mouseSnell′s waltzer deafness gene encodes an unconventional myosin required forstructural integrity of inner ear hair cells”,Nat.Genet.11(4),369-375;Avraham,K.B等,1997,“Characterization of unconventional MY06,the humanhomologue of the gene responsible for deafness in Snell′s waltzer mice”,Hum.Mol.Genet.6(8),1225-1231,每篇在此通过引用全文引入。
ORM1的核苷酸序列(由登录号NM_000607确定)公开于,例如,Schmid,K等,1974,“The disulfide bonds of alpha 1-acid glycoprotein”,Biochemistry 13(13),2694-2697;Mbuyi,J.M等,1982,“Plasma proteins in human cortical bone:enrichment of alpha 2 H S-glycoprotein,alpha 1 acid-glycoprotein,and IgE5”,Calcif.Tissue Int.34(3),229-231;Dente,L等,1985,“Structure of the human alpha1-acid glycoprotein gene:sequence homology with other human acute phaseprotein genes”,Nucleic Acids Res.13(11),3941-3952,ORM1的氨基酸序列(由登录号CAI 16859确定)公开于,例如,Schmid等,1973,“Structure of alpha1-acid glycoprotein”Biochemistry 12:2711-2724,每篇在此通过引用全文引入。
SERPINF1的核苷酸序列(由登录号NM_002615、BC013984)公开于,例如,Steele,F.R等,1993,“Pigment epithelium-derived factor:neurotrophic activity andidentification as a member of the serine protease inhibitor gene family”,Proc.Natl.Acad.Sci.U.S.A.90(4),1526-1530;Pignolo,RJ等,1993,“SenescentWI-38 cells fail to express EPC-I,a gene induced in young cells upon entry intothe GO state”,J.Biol.Chem.268(12),8949-8957;Becerra,S.P等,1993,“Overexpression of f等human pigment epithelium-derived factor in Escherichiacoli.A functionally active neurotrophic factor”,J.Biol.Chem.268(31),23148-23156,SERPINF1的氨基酸序列(由登录号AAH13984确定)公开于,例如,Petersen等,2003,“Pigment-epithelium-derived factor occurs at aphysiologically relevant concentration in human blood:purification andcharacterization”,Biochem J.374:199-206,每篇在此通过引用全文引入。
SERPINA1的核苷酸序列(由登录号BC015642、NM_000295确定)公开于,例如,NIH MGC Project,2001,Direct Submission,National Institutes ofHealth,Mammalian Gene Collection(MGC),Bethesda,MD 20892-2590,USA;Strausberg,R.L等,2002,“Generation and initial analysis of more than 15,000full-length human and mouse cDNA sequences”,Proc.Natl.Acad.Sci.U.S.A.99(26),16899-16903;Kurachi,K等,1981,“Cloning and sequence of cDNAcoding for alpha 1-antitrypsin”,Proc.Natl.Acad.Sci.U.S.A.78(11),6826-6830;Lobermann,H等,1982,“Interaction of human alpha 1-proteinase inhibitor withchymotrypsinogen A and crystallization of a proteolytically modified alpha1-proteinase inhibitor”,Hoppe-Seyler′s Z.Physiol.Chem.363(11),1377-1388;Bollen,A等,1983,“Cloning and expression in Escherichia coli of full-lengthcomplementary DNA coding for human alpha 1-antitrypsin”,DNA 2(4),255-264,SERPINA1的氨基酸序列(由登录号NP_001002235、NP_000286确定)公开于,例如,Kurachi,K等,1981,“Cloning and sequence of cDNA coding for alpha1-antitrypsin”,Proc.Natl.Acad.Sci.U.S.A.78(11),6826-6830;Lobermann,H等,1982,“Interaction of human alpha 1-proteinase inhibitor with chymotrypsinogen Aand crystallization of a proteolytically modified alpha 1-proteinase inhibitor”,Hoppe-Seyler′s Z.Physiol.Chem.363(11),1377-1388;Bollen,A等,1983,“Cloning and expression in Escherichia coli of full-length complementary DNAcoding for human alpha 1-antitrypsin”,DNA 2(4),255-264,每篇在此通过引用全文引入。
SERPINA4的核苷酸序列(由登录号NM_006215确定)公开于,例如,Wang,M.Y.等,1989,“Human kallistatin,a new tissue kallikrein-binding protein:purification and characterization”,Adv.Exp.Med.Biol.247B,1-8;Zhou,G.X等,1992,“Kallistatin:a novel human tissue kallikrein inhibitor.Purification,characterization,and reactive center sequence”,J.Biol.Chem.267(36),25873-25880;Chai,K.X等,1993,“Kallistatin:a novel human serine proteinaseinhibitor.Molecular cloning,tissue distribution,and expression in Escherichia coli”,J.Biol.Chem.268(32),24498-24505,SERPINA4的氨基酸序列(由登录号NP_006206确定)公开于,例如,Wang,M.Y等,1989,“Human kallistatin,a newtissue kallikrein-binding protein:purification and characterization”,Adv.Exp.Med.Bio1.247B,1-8;Zhou,G.X等,1992,“Kallistatin:a novel humantissue kallikrein inhibitor.Purification,characterization,and reactive centersequence”,J.Biol.Chem.267(36),25873-25880;Chai,K.X等,1993,“Kallistatin:a novel human serine proteinase inhibitor.Molecular cloning,tissue distribution,andexpression in Escherichia coli”,J.Biol.Chem.268(32),24498-24505,每篇在此通过引用全文引入。
SERPINF2的核苷酸序列(由登录号BC031592确定)公开于,例如,NIHMGC Project,2002,Direct Submission,NationalInstitutes of Health,MammalianGene Collection(MGC),Bethesda,MD 20892-2590,USA;Strausberg,R.L.等,2002,“Generation and initial analysis of more than 15,000 full-length human and mousecDNA sequences”,Proc.Natl.Acad.Sci.U.S.A.99(26),16899-16903,SERPINF2的氨基酸序列(由登录号NP_000925确定)公开于,例如,Wiman,B等,1979,“Onthe mechanism of the reaction between human alpha 2-antiplasmin and plasmin”,J.Biol.Chem.254(18),9291-9297;Yoshioka,A.等,1982,“Congenital deficiency ofalpha 2-plasmin inhibitor in three sisters”,Haemostasis 11(3),176-184;Brower,M.S等,1982,“Proteolytic cleavage and inactivation of alpha 2-plasmininhibitor and C1inactivator by human polymorphonuclear leukocyte elastase”,J.Biol.Chem.257(16),9849-9854,每篇在此通过引用全文引入。
PROS1的核苷酸序列(由登录号NM_000313确定)公开于,例如,Dahlback,B等,1981,“High molecular weight complex in human plasma betweenvitamin K-dependent protein S and complement component C4b-binding protein”,Proc.Natl.Acad.Sci.U.S.A.78(4),2512-2516;Comp,P.C等,1984,“Recurrentvenous thromboembolism in patients with a partial deficiency of protein S”,N.Engl.J.Med.311(24),1525-1528;Lundwall,A等,1986,“Isolation and sequenceof the cDNA for human protein S,a regulator of blood coagulation”,Proc.Natl.Acad.Sci.U.S.A.83(18),6716-6720,PROS1的氨基酸序列(由登录号NP_000304确定)公开于,例如,Dahlback,B等,1981,“High molecular weightcomplex in human plasma between vitamin K-dependent protein S andcomplement component C4b-binding protein”,Proc.Natl.Acad.Sci.U.S.A.78(4),2512-2516;Comp,P.C等,1984,“Recurrent venous thromboembolism in patientswith a partial deficiency of protein S”,N.Engl.J.Med.311(24),1525-1528;Lundwall,A等,1986,“Isolation and sequence of the cDNA for human protein S,aregulator of blood coagulation”,Proc.Natl.Acad.Sci.U.S.A.83(18),6716-6720,每篇在此通过引用全文引入。
QSCN6的核苷酸序列(由登录号NM_002826确定)公开于,例如Coppock,D.L等,1993,“Preferential gene expression in quiescent human lungfiroblasts”,Cell Growth Differ.4(6),483-493(1993);Hoober,K.L.,等,1999,″Homology between egg white sulfhydryl oxidase and quiescin Q6 defines a newclass of flavin-linked sulfhydryl oxidases”,J.Biol.Chem.274(45),31759-31762(1999);Coppock,D等,2000,“Regulation of thequiescence-induced genes:quiescin Q6,decorin,and ribosomal protein S29”,Biochem.Biophys.Res.Commun.269(2),604-610(2000),QSCN6的氨基酸序列(由登录号AAQ89300确定)公开于,例如,Clark,H.F等,2003,“The Secreted ProteinDiscovery Initiative(SPDI),a Large-ScaleEffort to Identify Novel Human Secretedand Transmembrane Proteins:A Bioinformatics Assessment”,Genome Res.13(10),2265-2270(2003),每篇在此通过引用全文引入。
RGS4的核苷酸序列(由登录号NM_005613确定)公开于,例如,Druey,K.M.等,1996,“Inhibition of G-protein-mediated MAP kinase activation by a newmammalian gene family”,Nature 379(6567),742-746;Berman,D.M等,1996,“GAIP and RGS4 are GTPase-activating proteins for the Gi subfamily of G proteinalpha subunits”,Cell 86(3),445-452;Heximer,S.P等,1997,“RGS2/G0S8 is aselective inhibitor of Gqalpha function”,Proc.Natl.Acad.Sci.U.S.A.94(26),14389-14393,RGS4的氨基酸序列(由登录号NP_005604确定)公开于,例如Druey,K.M等,1996,“Inhibition of G-protein-mediated MAP kinase activation bya new mammalian gene family”,Nature 379(6567),742-746;Berman,D.M等,1996,“GAIP and RGS4 are GTPase-activating proteins for the Gi subfamily of Gprotein alpha subunits”,Cell 86(3),445-452;Heximer,S.P.等,1997,“RGS2/G0S8is a selective inhibitor of Gqalpha function”,Proc.Natl.Acad.Sci.U.S.A.94(26),14389-14393,每篇在此通过引用全文引入。
SAA1的核苷酸序列(由登录号BC105796确定)公开于,例如,NIH MGCProject,2005,Direct Submission,National Institutes of Health,Mammalian GerneCollection(MGC),Bethesda,Maryland;Strausberg等,2002,“Generation andinitial analysis of more than 15,000 full-length human and mouse cDNAsequences”,Proc.Natl.Acad.Sci.U.S.A.99,16899-16903,SAA1的氨基酸序列(由登录号AAA64799、AAA30968确定)公开于,例如,Kluve-Beckerman,B.等,1998,“Human serum amyloid A.Three hepatic mRNAs and the correspondingproteins in one person”,J.Clin.Invest.82(5),1670-1675;Marhaug,G.等,1990,“Mink serum amyloid A protein.Expression and primary structure based on cDNAsequences”,J.Biol.Chem.265,10049-10054,每篇在此通过引用全文引入。
SAA4的核苷酸序列(由登录号NM_006512确定)公开于,例如,Bausserman,L.L.e等,1983,“Interaction of the serum amyloid A proteins withphospholipid”,J.Biol.Chem.258(17),10681-10688;Whitehead,A.S.等,1992,“Identification of novel members of the serum amyloid A protein superfamily asconstitutive apolipoproteins of high density lipoprotein”,J.Biol.Chem.267(6),3862-3867;Watson,G.等,1992,“Analysis of the genomic and derived proteinstructure of a novel human serum amyloid A gene,SAA4”,Scand.J.Immunol.36(5),703-712,SAA4的氨基酸序列(由登录号NP_006503确定)公开于,例如,Bausserman,L.L.等,1983,“Interaction of the serum amyloid A proteins withphospholipid”,J.Biol.Chem.258(17),10681-10688;Whitehead,A.S.等,1992,“Identification of novel members of the serum amyloid A protein superfamily asconstitutive apolipoproteins of high density lipoprotein”,J.Biol.Chem.267(6),3862-3867;Watson,G.等,1992,“Analysis of the genomic and derived proteinstructure of a novel human serum amyloid A gene,S AA4”,Scand.J.Immunol.36(5),703-712;and Kang等,1987,“The precursor of Alzheimer′s disease amyloid A4protein resembles a cell-surface receptor,Nature 325,733-736,每篇在此通过引用全文引入。
血清淀粉样蛋白A-4蛋白前体的核苷酸序列(由登录号M81349确定)公开于,例如,Whitehead等,1992,“Identification of novel members of the serumamyloid A protein superfamily as constitutive apolipoproteins of high densitylipoprotein,and the amino sequence of SAA4”,血清淀粉样蛋白A-4蛋白前体的氨基酸序列(由登录号P02375确定)公开于Sipe,1985,“Human serumamyloid A(SAA):biosynthesis and postsynthetic processing of preSAA andstructural variants defined by complementary DNA,“Biochemistry 24,2931-2936,每篇在此通过引用全文引入。
SERPINA7的核苷酸序列(由登录号NM_000354确定)公开于,例如,Flink,I.L等,1986,“Complete amino acid sequence of human thyroxine-bindingglobulin deduced from cloned DNA:close homology to the serine antiproteases”,Proc.Natl.Acad.Sci.U.S.A.83(20),7708-7712;Takeda,K等,1989,“Sequence ofthe variant thyroxine-binding globulin of Australian aborigines.Only one of twoamino acid replacements is responsible for its altered properties”,J.Clin.Invest.83(4),1344-1348;Mori,Y等,1990,“Replacement of Leu227 by Pro inthyroxine-binding globulin(TBG)is associated with complete TBG deficiency inthree of eight families with this inherited defect”,J.Clin.Endocrinol.Metab.70(3),804-809,SERPINA7的氨基酸序列(由登录号CAB06092确定)公开于,例如,Cheng,“Partial amino acid sequence of human thyroxine binding globulin”,Biochem.Biophys.Res.Commun.79:1212-1218,每篇在此通过引用全文引入。
TF的核苷酸序列(由登录号NM_001063确定)公开于,例如,Enns,CA等,1981,“Physical characterization of the transferrin receptor in human placentae”,J.Biol.Chem.256(19),9820-9823;Sass-Kuhn,S.P.等,1984,“Humangranulocyte/pollen-binding protein.Recognition and identification as transferrin”,J.Clin.Invest.73(1),202-210;Uzan,G等,1984,“Molecular cloning and sequenceanalysis of cDNA for human transferrin”,Biochem.Biophys.Res.Commun.119(1),273-281,TF的氨基酸序列(由登录号NP_001054确定)公开于,例如,Enns,CA等,1981,“Physical characterization of the transferrin receptor in humanplacentae”,J.Biol.Chem.256(19),9820-9823;Sass-Kuhn,S.P等,1984,“Humangranulocyte/pollen-binding protein.Recognition and identification as transferrin”,J.Clin.Invest.73(I)5202-210;Uzan,G等,1984,“Molecular cloning and sequenceanalysis of cDNA for human transferrin”,Biochem.Biophys.Res.Commun.119(1),273-281,每篇在此通过引用全文引入。
TFRC的核苷酸序列(由登录号NM_003234确定)公开于,例如,Enns,CA等,1981,“Physical  characterization of the transferrin receptor in humanplacentae”,J.Biol.Chem.256(19),9820-9823;Omary,M.B等,1981,“Biosynthesisof the human transferrin receptor in cultured cells”,J.Biol.Chem.256(24),12888-12892;Miller,Y.E.等,1983,“Chromosome3q(22-ter)encodes the human transferrin receptor”,Am.J.Hum.Genet.35(4),573-583,TFRC的氨基酸序列(由登录号NP_003225确定)公开于,例如,Enns,CA.等,1981,“Physical characterization of the transferrin receptor in humanplacentae”,J.Biol.Chem.256(19),9820-9823;Omary,M.B等,1981,″Biosynthesisof the human transferrin receptor in cultured cells”,J.Biol.Chem.256(24),12888-12892;Miller.Y.E等,1983,“Chromosome 3q(22-ter)encodes the human trarnsferrin receptor”,Am.J.Hum.Genet.35(4),573-583,每篇在此通过引用全文引入。
TTN的核苷酸序列(由登录号BC013396确定)公开于,例如,Strausberg等,2002,“Generation and initial analysis of more than 15,000 full-length humanand mouse cDNA sequences”,Proc.Natl.Acad.Sci.U.S.A.99(26),16899-16903,TTN的氨基酸序列(由登录号CAD12456确定)公开于,例如,Bang等,2001,“The complete gene sequence of titin,expression of an unusual approximately700-kDa titin isoform,and its interaction with obscurin identify a novel Z-line toI-band linking system”,Circ.Res.89(11),31065-1072,每篇在此通过引用全文引入。
TTR的核苷酸序列(由登录号NM_000371确定)公开于,例如,Fex等,1979,“Interaction between prealbumin and retinol-binding protein studied byaffinity chromatography,gel filtration and two-phase partition”,Eur.J.Biochem.99(2),353-360;Mita等,1984,“Cloning and sequence analysis of cDNA forhuman prealbumin”,Biochem.Biophys.Res.Commun.124(2),558-564,TTR的氨基酸序列(由登录号AAH05310、AAP35853确定)公开于,例如,Kanda等,“Theamino acid sequence of human plasma prealbumin”,J.Biol.Chem.249:6796-6805,每篇在此通过引用全文引入。
转甲状腺素蛋白前体(前清蛋白)的核苷酸序列(TBPA)(TTR)(ATTR)公开于Gu等,1991,“Transthyretin(prealbumin)gene in human primary hepatic cancer”,Chem.Life Scie Earth Sci.34,1312-1318,氨基酸序列公开于Mita等,1984,“Cloning and sequence analysis of cDNA for human prealbumin,“Biophys.Res.Commun.124,558-564,每篇在此通过引用全文引入。
UBC的核苷酸序列(由登录号NM_021009确定)公开于,例如,Wiborg,O等,1985,“The human ubiquitin multigene family:some genes contain multipledirectly repeated ubiquitin coding sequences”,EMBO J.4(3),755-759;Einspanier,R等,1987,“Cloning and sequence analysis of a cDNA encodingpoly-ubiquitin in human ovarian granulosa cells”,Biochem.Biophys.Res.Commun.147(2),581-587;Baker,R.T等,1989,“Unequalcrossover generates variation in ubiquitin coding unit number at the human UbCpolyubiquitin locus”,Am.J.Hum.Genet.44(4),534-542,UBC的氨基酸序列(由登录号NP_066289确定)公开于,例如,Wiborg,O等,1985,“The human ubiquitinmultigene family:some genes contain multiple directly repeated ubiquitin codingsequences”,EMBO J.4(3),755-759;Einspanier,R等,1987,“Cloning and sequenceanalysis of a cDNA encoding poly-ubiquitin in human ovarian granulosa cells”,Biochem.Biophys.Res.Commun.147(2),581-587;Baker,R.T等,1989,“Unequalcrossover generates variation in ubiquitin coding unit number at the human UbCpolyubiquitin locus”,Am.J.Hum.Genet.44(4),534-542,每篇在此通过引用全文引入。
VTN的核苷酸序列(由登录号NM_000638确定)公开于,例如,Suzuki,S.等,1984,“Domain structure of vitronectin.Alignment of active sites”,J.Biol.Chem.259(24),15307-15314;Suzuki,S等,1985,“Complete amino acid sequence ofhuman vitronectin deduced from cDNA.Similarity of cell attachment sites invitronectin and fibronectin”,EMBO J.4(10),2519-2524;Jenne,D等,1985,“Molecular cloning of S-protein,a link between complement,coagulation andcell-substrate adhesion”,EMBO J.4(12),3153-3157,VTN的氨基酸序列(由登录号P04004确定)公开于,例如,Zhou,A等,2003,“How vitronectin binds PAI-Ito modulate fibrinolysis and cell migration”,Nat.Struct.Biol.10(7),541-544;Kamikubo,Y等,2002,“Identification of the disulfide bonds in the recombinantsomatomedin B domain of human vitronectin”,J.Biol.Chem.277(30),27109-27119;Seger,D等,1998,“Phosphorylation of vitronectin by casein kinaseII.Identification of the sites and their promotion of cell adhesion and spreading”,J.Biol.Chem.273(38),24805-24813,每篇在此通过引用全文引入。
VWF的核苷酸序列(由登录号NM_000552确定)公开于,例如,Coller,B.S等,1983,“Studies with a murine monoclonal antibody that abolishes ristocetin-induced binding of von Willebrand factor to platelets:additional evidence insupport of GPIb as a platelet receptor for von Willebrand factor”,Blood 61(1),99-110;Lynch,D.C等,1985,“Molecular cloning of cDNA for human vonWillebrand factor:authentication by a new method”,Cell 41(1),49-56;GinsburgJD等,1985,“Human von Willebrand factor(vWF):isolation of complementaryDNA(cDNA)clones and chromosomal localization”,Science 228(4706),1401-1406,VWF的氨基酸序列(由登录号AAB59458确定)公开于,例如,Mancuso,DJ等,1989,“Structure of the gene for human von Willebrand factor”,J.Biol.Chem.264(33),19514-19527,每篇在此通过引用全文引入。
ALMS1的核苷酸序列(由登录号NM_015120确定)公开于,例如,Collin,G.B等,1999,“Alstrom syndrome:further evidence for linkage to humanchromosome 2p13”,Hum.Genet.105(5),474-479;Collin,G.B等,2002,“Mutationsin ALMS1 cause obesity,type 2 diabetes and neurosensory degeneration in Alstromsyndrome”,Nat.Genet.31(1),74-78;Hearn,T等,Mutation of ALMS1,a large genewith a tandem repeat encoding 47 amino acids,causes Alstrom syndrome”,Nat.Genet.31(1),79-83,ALMS1的氨基酸序列(由登录号NP_055935确定)公开于,例如,Collin,G.B等,1999,“Alstrom syndrome:further evidence for linkageto human chromosome 2p13”,Hum.Genet.105(5),474-479;Collin,G.B等,2002,“Mutations in ALMS1 cause obesity,type 2 diabetes and neurosensory degenerationin Alstrom syndrome”,Nat.Genet.31(1),74-78;Hearn,T等,Mutation of ALMS1,alarge gene with a tandem repeat encoding 47 amino acids,causes Alstromsyndrome”,Nat.Genet.31(1),79-83,每篇在此通过引用全文引入。ATRN的核苷酸序列(由登录号BC101705、NM_139321确定)公开于,例如,Strausberg,R.L等,2002,“Generation and initial analysis of more than 15,000 full-length humanand mouse cDNA sequences”,Proc.Natl.Acad.Sci.U.S.A.99(26),16899-16903;Mori,M.等,1992,“Topical timolol and blood-aqueous barrier permeability toprotein in human eyes”,Nippon Ganka Gakkai Zasshi 96(11),1418-1422;Duke-Cohan,J.S等,1996,“Serum high molecular weight dipeptidyl peptidaseIV(CD26)is similar to a novel antigen DPPT-L released from activated T cells”,J.Immunol.156(5),1714-1721;Duke-Cohan,J.S等,1998,“Attractin(DPPT-L),amember of the CUB family of cell adhesion and guidance proteins,is secreted byactivated human T lymphocytes and modulates immune cell interactions”,Proc.Natl.Acad.Sci.U.S.A.95(19),11336-11341,ATRN的氨基酸序列(由登录号CAI22615确定)公开于,例如,Sehra,H.,2005,Direct Submission,Wellcome TrustSanger Institute,Hinxton,Cambridgeshire,CB1O ISA,UK,每篇在此通过引用全文引入。
APOL1的核苷酸序列(由登录号BC017331、NM_003661确定)公开于,例如,Strausberg等,2002,“Generation and initial analysis of more than 15,000full-length human and mouse cDNA sequences”,Proc.Natl.Acad.Sci.U.S.A.99(26),16899-16903;Duchateau,P.N等,1997,“Apolipoprotein L,a new humanhigh density lipoprotein apolipoprotein expressed by the pancreas.Identification,cloning,characterization,and plasma distribution of apolipoprotein L”,Biol.Chem.272(41),25576-25582;Duchateau,P.N等,2000,“Plasma apolipoprotein Lconcentrations correlate with plasma triglycerides and cholesterol levels innormolipidemic,hyperlipidemic,and diabetic subjects”,J.Lipid Res.41(8),1231-1236;Duchateau,P.N等,2001,“Apolipoprotein L gene family:tissuespecific expression,splicing,promoter regions;discovery of a new gene”,J.LipidRes.42(4),620-630,APOL1的氨基酸序列(由登录号AAK20210确定)公开于,例如,Page  等,2001,“The human apolipoprotein L gene cluster:identification,classification,and sites of distribution”,Genomics 74(1),71-78,每篇在此通过引用全文引入。
TRIP11的核苷酸序列(由登录号NM_004239确定)公开于,例如,Lee,J.W等,1995,“Two classes of proteins dependent on either the presence or absence ofthyroid hormone for interaction with the thyroid hormone receptor”,Mol.Endocrinol.9(2),243-254;Chang,K.H等,1997,“A thyroid hormonereceptor coactivator negatively regulated by the retinoblastoma protein”,Proc.Natl.Acad.Sci.U.S.A.94(17),9040-9045;Abe,A等,1997,“Fusion of theplatelet-derived growth factor receptor beta to a novel gene CEV 14 in acutemyelogenous leukemia after clonal evolution”,Blood 90(11),42714277,TRIP11的氨基酸序列(由登录号NP_004230确定)公开于,例如,Lee,J.W等,1995,“Two classes of proteins dependent on either the presence or absence of thyroidhormone for interaction with the thyroid hormone receptor”,Mol.Endocrinol.9(2),243-254;Chang,K.H等,1997,“A thyroid hormone receptorcoactivator negatively regulated by the retinoblastoma protein”,Proc.Natl.Acad.Sci.U.S.A.94(17),9040-9045;Abe,A.等,1997,“Fusion of theplatelet-derived growth factor receptor beta to a novel gene CEV 14 in acutemyelogenous leukemia after clonal evolution”,Blood 90(11),4271-4277,每篇在此通过引用全文引入。
PDCD11的核苷酸序列(由登录号NM_014976确定)公开于,例如,Lacana,E.等,1999,“Regulation of Fas ligand expression and cell death byapoptosis-linked gene 4”,Nat.Med.5(5),542-547;Sweet,T.等,2003,“Identification of a novel protein from glial cells based on its ability to interactwith NF-kappaB subunits”,J.Cell.Biochem.90(5),884-891,PDCD11的氨基酸序列(由登录号NP_055791确定)公开于,例如,Lacana,E.等,1999,“Regulationof Fas ligand expression and cell death by apoptosis-linked gene 4”,Nat.Med.5(5),542-547;Sweet,T.等,2003,“Identification of a novel protein from glial cells basedon its ability to interact with NF-kappaB subunits”,J.Cell.Biochem.90(5),884-891,每篇在此通过引用全文引入。
KIAA0433的核苷酸序列(由登录号AB007893确定)公开于,例如,Ishikawa等,1997,“Prediction of the coding sequences of unidentified humangenes.VIII.78 new cDNA clones from brain which code for large proteins in vitro”,DNA Res.4(5),307-313,KIAA0433的氨基酸序列(由登录号BAA24863确定)公开于,例如,Kisarazu等,1997,“Prediction of the coding sequences ofunidentified human genes.VIII.78 new cDNA clones from brain which code forlarge proteins in vitro”,DNA Res.4(5),307-313,每篇在此通过引用全文引入。
SERPINA10的核苷酸序列(由登录号NM_016186确定)公开于,例如,Han,X.等,1998,“Isolation of a protein Z-dependent plasma protease inhibitor”,Proc.Natl.Acad.Sci.U.S.A.95(16),9250-9255;Han,X等,1999,“The proteinZ-dependent protease inhibitor is a serpin”,Biochemistry 38(34),11073-11078;Yin,Z.F.等,2000,“Prothrombotic phenotype of protein Z deficiency”,Proc.Natl.Acad.Sci.U.S.A.97(12),6734-6738,SERPINA10的氨基酸序列(由登录号NP_057270确定)公开于,例如,Han,X.等,1998,“Isolation of a proteinZ-dependent plasma protease inhibitor”,Proc.Natl.Acad.Sci.U.S.A.95(16),9250-9255;Han,X等,1999,“The protein Z-dependent protease inhibitor is aserpin”,Biochemistry 38(34),11073-11078;Yin,Z.F.等,2000,“Prothromboticphenotype of protein Z deficiency”,Proc.Natl.Acad.Sci.U.S.A.97(12),6734-6738,每篇在此通过引用全文引入。
BCOR的核苷酸序列(由登录号BC063536确定)公开于,例如,Strausberg等,2002,“Generation and initial analysis of more than 15,000 full-length humanand mouse cDNA sequences”,Proc.Natl.Acad.Sci.U.S.A.99(26),16899-16903,BCOR的氨基酸序列(由登录号AAG41429确定)公开于,例如,Huynh等,2000,“BCOR,a novel corepressor involved in BCL-6 repression”,GenesDev.14(14),1810-1823,每篇在此通过引用全文引入。
C10orf18的核苷酸序列(由登录号BC001759确定)公开于,例如,Strausberg等,2002,“Generation and initial analysis of more than 15,000full-length human and mouse cDNA sequences”,Proc.Natl.Acad.Sci.U.S.A.99(26),16899-16903,C10orf18的氨基酸序列(由登录号CAI13368确定)公开于,例如,Wray,P.,2005,Direct Submission,Wellcome Trust SangerInstitute,Hinxton,Cambridgeshire,CB1O ISA,UK,每篇在此通过引用全文引入。
YY1AP1的核苷酸序列(由登录号BC044887、BC014906确定)公开于,例如,Strausberg等,2002,“Generation and initial analysis of more than 15,000full-length human and mouse cDNA sequences”,Proc.Natl.Acad.Sci.U.S.A.99(26),16899-16903,YY1AP1的氨基酸序列(由登录号AAL75971、CAH71646确定)公开于,例如,Liang等,“Cloning and characterization of a novel YY1associated protein”,Almeida,J,2005,Direct Submission,Wellcome Trust SangerInstitute,Hinxton,Cambridgeshire,CB1O ISA,UK,每篇在此通过引用全文引入。
FLJ10006的核苷酸序列(由登录号BC110537、BC110536确定)公开于,例如,Strausberg等,2002,“Generation and initial analysis of more than 15,000full-length human and mouse cDNA sequences”,Proc.Natl.Acad.Sci.U.S.A.99(26),16899-16903,FLJ10006的氨基酸序列(由登录号AAH17012确定)公开于,例如,Director MGC Project,2005,Direct Submission,National Institutes ofHealth,Mammalian Gene Collection(MGC),Cancer Genomics Office,NationalCancer Institute,31 Center Drive,Room 11 A03,Bethesda,MD 20892-259O5USA;Strausberg等,2002,“Generation and initial analysis of more than 15,000full-length human and mouse cDNA sequences,“Proc.Natl.Acad.Sci.U.S.A.99(26),16899-16903,每篇在此通过引用全文引入。
BDP1的核苷酸序列(由登录号NM_018429确定)公开于,例如,Schramm,L等,2000,“Different human TFIIIB activities direct RNA polymerase IIItranscription from TATA-containing and TATA-less promoters”,Genes Dev.14(20),2650-2663;Kelter,A.R等,2000,“The transcription factor-like nuclearregulator(TFNR)contains a novel 55-amino-acid motif repeated nine times andmaps closely to SMN1”,Genomics 70(3),315-326;Weser,S.等,Transcriptionfactor(TF)-like nuclear regulator,the 250-kDa form of Homo sapiens TFIIIB’,is anessential component of human TFIIIC1 activity”,J.Biol.Chem.279(26),27022-27029,BDP1的氨基酸序列(由登录号AAH32146确定)公开于,例如,Strausberg,R.L等,“Generation and initial analysis of more than 15,000 full-lengthhuman and mouse cDNA sequences”,Proc.Natl.Acad.Sci.U.S.A.99(26),16899-16903(2002),每篇在此通过引用全文引入。
SMARCAD1的核苷酸序列(由登录号NM_020159确定)公开于,例如,Soininen,R.等,1992,“The mouse Enhancer trap locus 1(EtI-I):a novelmammalian gene related to Drosophila and yeast transcriptional regulator genes”,Mech.Dev.39(1-2),111-123;Adra,CN等,2000,“SMARCAD1,a novel humanhelicase family-defining member associated with genetic instability:cloning,expression,and mapping to 4q22-q23,a band rich in breakpoints anddeletion mutants involved in several human diseases”,Genomics 69(2),162-173,SMARCAD1的氨基酸序列(由登录号NP_064544确定)公开于,例如,Soininen,R等,1992,“The mouse Enhancer trap locus 1(EtI-I):a novel mammaliangene related to Drosophila and yeast transcriptional regulator genes”,Mech.Dev.39(1-2),111-123;Adra,CN等,2000,“SMARCADl,a novel humanhelicase family-defining member associated with genetic instability:cloning,expression,and mapping to 4q22-q23,a band rich in breakpoints anddeletion mutants involved in several human diseases”,Genomics 69(2),162-173,每篇在此通过引用全文引入。
MKL2的核苷酸序列(由登录号NM_014048确定)公开于,例如,Cen,B等,2003,“Megakaryoblastic leukemia 1,a potent transcriptional coactivator forserum response factor(SRF),is required for serum induction of SRF target genes”,Mol.Cell.Biol.23(18),6597-6608;Selvaraj,A等,2003,“Megakaryoblasticleukemia-1/2,a transcriptional co-activator of serum response factor,is requiredfor skeletal myogenic differentiation”,J.Biol.Chem.278(43),41977-41987,MKL2的氨基酸序列(由登录号AAH47761确定)公开于,例如,Strausberg等,2002,“Generation and initial analysis of more than 15,000 full-length human and mousecDNA sequences”,Proc.Natl.Acad.Sci.U.S.A.99(26),16899-16903,每篇在此通过引用全文引入。
CHST8的核苷酸序列(由登录号NM_022467、BC018723确定)公开于,例如,Xia等,2000,“Molecular cloning and expression of the pituitary glycoproteinhormone N-acetylgalactosamine-4-O-sulfotransferase”,J.Biol.Chem.275(49),38402-38409;Okuda,T等,2000,“Molecular cloning and characterization ofGaINAc 4-sulfotransferase expressed in human pituitary gland”,J.Biol.Chem.275(51),40605-40613;Hiraoka,N等,2001,“Molecular cloning and expression oftwo distinct human N-acetylgalactosamine 4-O-sulfotransferases that transfersulfate to GaINAc beta 1~>4GlcNAc beta 1->R in both N-and O-glycans,“Glycobiology 11(6),495-504;Strausberg等,2002,“Generation and initialanalysis of more than 15,000 full-length human and mouse cDNA sequences,“Proc.Natl.Acad.Sci.U.S.A.99(26),16899-16903,CHST8的氨基酸序列(由登录号NP_071912确定)公开于,例如,Xia等,2000,“Molecular cloning andexpression of the pituitary glycoprotein hormone Nacetylgalactosamine-4-O-sulfotransferase,”J.Biol.Chem.275(49),38402-38409;Okuda等,2000,“Molecular cloning and characterization of GaINAc4-sulfotransferase expressed in human pituitary gland”,J.Biol.Chem.275(51),40605-40613;Hiraoka,N等,2001,“Molecular cloning and expression of twodistinct human N-acetylgalactosamine 4-O-sulfotransferases that transfer sulfate toGaINAc beta 1->4GlcNAc beta 1->R in both N-and O-glycans”,Glycobiology11(6),495-504,每篇在此通过引用全文引入。
MCPH1的核苷酸序列(由登录号NM_024596、BC030702确定)公开于,例如,Jackson,A.P等,1998,“Primary autosomal recessivemicrocephaly(MCPH1)maps to chromosome 8p22-pter”,Am.J.Hum.Genet.63(2),541-546;Jackson,A.P等,2002,“Identification of microcephalin,a proteinimplicated in determining the size of the human brain”,Am.J.Hum.Genet.71(1),136-142;Kumar,A等,2002,“Primary microcephaly:microcephalin and ASPMdetermine the size of the human brain”,J.Biosci.27(7),629632,MCPH1的氨基酸序列(由登录号AAH30702确定)公开于,例如,Strausberg,R.L等,2002,“Generation and initial analysis of more than 15,000 full-length human and mousecDNA sequences”,Proc.Natl.Acad.Sci.U.S.A.99(26),16899-16903(2002),每篇在此通过引用全文引入。
MYO18B的核苷酸序列(由登录号NM_032608确定)公开于,例如,Nishioka,M等,2002,“MYO18B,a candidate tumor suppressor gene atchromosome 22q12.1,deleted,mutated,and methylated in human lung cancer”,Proc.Natl.Acad.Sci.U.S.A.99(19),12269-12274;Salamon,M.等,2003,“HumanMYO 18B,a novel unconventional myosin heavy chain expressed in striatedmuscles moves into the myonuclei upon differentiation”,J.Mol.Biol.326(1),137-149;Yabaihara,N等,2004,“Reduced expression of MYO1 8B,a candidatetumor-suppressor gene on chromosome arm 22q,in ovarian cancer”,Int.J.Cancer112(1),150-154,MYO18B的氨基酸序列(由登录号NP_115997确定)公开于,例如,Nishioka,M等,2002,“MYO 18B,a candidate tumor suppressor gene atchromosome 22q12.1,deleted,mutated,and methylated in human lung cancer”,Proc.Natl.Acad.Sci.U.S.A.99(19),12269-12274;Salamon,M等,2003,“HumanMYO  18B,a novel unconventional myosin heavy chain expressed in striatedmuscles moves into the myonuclei upon differentiation,“J.Mol.Biol.326(1),137-149;Yanaihara,N等,2004,“Reduced expression of MYO1 8B,a candidatetumor-suppressor gene on chromosome arm 22q,in ovarian cancer”,Int.J.Cancer112(1),150-154,每篇在此通过引用全文引入。
MICAL-L1的核苷酸序列(由登录号NM_033386确定)公开于,例如,Marzesco,A.M等,2002,“The small GTPase Rab13 regulates assembly offunctional tight junctions in epithelial cells”,Mol.Biol.Cell 13(6),1819-1831;Terman,J.R.等,2002,“MICALs,a family of conserved flavoproteinoxidoreductases,function in plexin-mediated axonal repulsion”,Cell 109(7),887-900;Collins,J.E等,2004,“A genome anotation driven approach to cloningthe human ORFeome”,Genome Biol.5(10),R84,MICAL-L1的氨基酸序列(由登录号AAH82243、AAH01090确定)公开于,例如,Strausberg等,2002,“Generation and initial analysis of more than 15,000 full-length human and mousecDNA sequences”,Proc.Natl.Acad.Sci.U.S.A.99(26),16899-16903,每篇在此通过引用全文引入。
PGLYRP2的核苷酸序列(由登录号NM_052890确定)公开于,例如,Liu,C等,2002,“Peptidoglycan recognition proteins:a novel family of four human innateimmunity pattem recognition molecules”,J.Biol.Chem.276(37),34686-34694;Xu,X.R等,2001,“Insight into hepatocellular carcinogenesis at transcriptome levelby comparing gene expression profiles of hepatocellular carcinoma with those ofcorresponding noncancerous liver”,Proc.Natl.Acad.Sci.U.S.A.98(26),15089-15094;Kibardin,A.V等,2003,“Expression analysis ofproteins encodedby genes of the tag7/tagL(PGRP-S,L)family in human peripheral blood cells”,Genetika 39(2),244-249,PGLYRP2的氨基酸序列(由登录号Q96PD5确定)公开于,例如,Zhang,H.等,2003,“Identification and quantification of N-linkedglycoproteins using hydrazide chemistry,stable isotope labeling and massspectrometry”,Nat.Biotechnol.21(6),660-666;Wang,Z.M等,2003,“Humanpeptidoglycan recognition protein-L is an N-acetylmuramoyl-L-alanine amidase”,J.Biol.Chem.278(49),49044-49052;Zhang,Z等,2004,“Signal peptide predictionbased on analysis of experimentally verified cleavage sites”,Protein Sci.13(10),2819-2824,每篇在此通过引用全文引入。
LRG1的核苷酸序列(由登录号NM_052972确定)公开于,例如,Takahashi,N等,1985,“Periodicity of leucine and tandem repetition of a 24-amino acidsegment in the primary structure of leucine-rich alpha 2 glycoprotein of humanserum”,Proc.Natl.Acad.Sci.U.S.A.82(7),1906-1910;O′Donnell,L.C等,2002,“Molecular characterization and expression analysis of leucine-richalpha2-glycoprotein,a novel marker of granulocytic differentiation”,J.Leukoc.Biol.72(3),478-485;Bunkenborg,J等,2004,“Screening forN-glycosylated proteins by liquid chromatography mass spectrometry”,Proteomics4(2),454-465,LRG1的氨基酸序列(由登录号AAH70198确定)公开于,例如,Strausberg等,2002,“Generation and initial analysis of more than 15,000full-length human and mouse cDNA sequences,“Proc.Natl.Acad.Sci.U.S.A.99(26),每篇在此通过引用全文引入。
KCTD7的核苷酸序列(由登录号NM_153033确定)公开于,例如,Scherer,S.W等,2003,“Human chromosome 7:DNA sequence and biology”,Science300(5620),767-772,KCTD7的氨基酸序列(由登录号NP_694578确定)公开于,例如,Scherer,S.W等,2003,“Human chromosome 7:DNA sequence andbiology”,Science 300(5620),767-772,每篇在此通过引用全文引入。
MGC27165的核苷酸序列(由登录号BC087841和BC005951确定)公开于,例如,Strausberg等,2002,“Generation and initial analysis of more than 15,000full-length human and mouse cDNA sequences”,Proc.Natl.Acad.Sci.U.S.A.99(26),16899-16903,MGC27165的氨基酸序列(由登录号AAH87841确定)公开于,例如,Strausberg等,2002,“Generation and initial analysis of more than15,000 full-length human and mouse cDNA sequences”,Proc.Natl.Acad.Sci.U.S.A.99(26),16899-16903,每篇在此通过引用全文引入。
A1BG的核苷酸序列(由登录号NM_130786确定)公开于,例如,Ishioka,N等,1986,“Amino acid sequence of human plasma alpha 1B-glycoprotein:homology to the immunoglobulin supergene family”,Proc.Natl.Acad.Sci.U.S.A.83(8),2363-2367;Gahne,B等,1987,“Genetic polymorphism of human plasmaalpha 1B-glycoprotein:phenotyping by immunoblotting or by a simple method of2-D electrophoresis”,Hum.Genet.76(2),111 115;Eiberg,H等,1989,“Linkagebetween alpha lB-glycoprotein(AlBG)and Lutheran(LU)red blood group system:assignment to chromosome 19:new genetic variants of AlBG”,Clin.Genet.36(6),415-418,A1BG的氨基酸序列(由登录号NP_570602确定)公开于,例如,Ishioka,N.等,1986,“Amino acid sequence of human plasma alpha 1B-glycoprotein:homology to the immunoglobulin supergene family″,Proc.Natl.Acad.Sci.U.S.A.83(8),2363-2367;Gahne,B.等,1987,“Genetic polymorphism of human plasmaalpha 1B-glycoprotein:phenotyping by immunoblotting or by a simple method of2-D electrophoresis”,Hum.Genet.76(2),111-115;Eiberg,H等,1989,“Linkagebetween alpha 1B-glycoprotein(A1BG)and Lutheran(LU)red blood group system:assignment to chromosome 19:new genetic variants of A1BG”,Clin.Genet.36(6),415-418,每篇在此通过引用全文引入。
A2M的核苷酸序列(由登录号NM_000014确定)公开于,例如,Nartikova等,1979,“Uniform method for determining the alpha 1-antitrypsin and alpha2-macroglobulin activity in human blood serum(plasma)”,Vopr.Med.Khim.25(4),494-499;Gustavsson等,1980,“Interaction between human pancreatic elastase andplasma protease inhibitors,“Hoppe-Seyler′s Z.Physiol.Chem.361(2),169-176;Murata等,1983,“Radioimmunoassay of human pancreatic elastase 1.In vitrointeraction of human pancreatic elastase 1 with serum protease inhibitors,“Enzyme 30(1),29-37,A2M的氨基酸序列(由登录号AAT02228确定)公开于,例如,Sottrup-Jensen等,1984,“Primary structure of human alpha 2-macroglobulin,“J.Biol.Chem 259:8318-8327,每篇在此通过引用全文引入。
ABLIM1的核苷酸序列(由登录号NM_002313确定)公开于,例如,Adams等,1995,“Initial assessment of human gene diversity and expression patternsbased upon 83 million nucleotides of cDNA sequence”,Nature 377(6547SUPPL),3-174;Roof等,1997,“Molecular characterization of abLIM,a novel actin-bindingand double zinc finger protein”,J.Cell Biol.138(3),575-588;Kim等,1997,“Limatin(LIMAB1),an actin-binding LIM protein,maps to mouse chromosome 19and human chromosome 10q25,a region frequently deleted in human cancers”,Genomics 46(2),291-293,ABLIM1的氨基酸序列(由登录号CAI10910确定)公开于,例如,Tracey,A.,2005,Direct Submission,Wellcome Trust Sanger Institute,Hinxton,Cambridgeshire,CB1O ISA,UK,每篇在此通过引用全文引入。
ACTA1的核苷酸序列(由登录号NM_001100确定)公开于,例如,Gunning,P等,1983,“Isolation and characterization of full-length cDNA clones forhuman alpha-,beta-,and gamma-actin mRNAs:skeletal but not cytoplasmic actinshave an amino-terminal cysteine that is subsequently removed”,Mol.Cell.Biol.3(5),787-795;Hanauer,A等,1983,“Isolation and characterization of cDNAclones for human skeletal muscle alpha actin”,Nucleic AcidsRes.11(11),3503-3516;Kedes,L等,1985,“The human beta-actin multigenefamily”,Trans.Assoc.Am.Physicians 98,42-46,ACTA1的氨基酸序列(由登录号CAI19052确定)公开于,例如,Matthews,N.,2005,Direct Submission,WellcomeTrust SangerInstitute,Hinxton,Cambridgeshire,CB1O ISA,UK,每篇在此通过引用全文引入。
ANK3的核苷酸序列(由登录号NM_020987确定)公开于,例如,Kordeli,E等,1995,“AnkyrinG.A new ankyrin gene with neural-specific isoforms localizedat the axonal initial segment and node of Ranvier”,J.Biol.Chem.270(5),2352-2359;Kapfhamer,D.等,Chromosomal localization of the ankyrinGgene(ANK3/Ank3)to human 10q21 and mouse 10”,Genomics 27(1),189-191;Devarajan,P等,1996,“Identification of a small cytoplasmic ankyrin(AnkG119)inthe kidney and muscle that binds beta I sigma spectrin and associates with theGolgi apparatus”,J.Cell Biol.133(4),819-830,ANK3的氨基酸序列(由登录号CAI40519确定)公开于,例如,Chapman,J,2005,Direct Submission,WellcomeTrust Sanger Institute,Hinxton,Cambridgeshire,CB1O ISA,UK,每篇在此通过引用全文引入。
APCS的核苷酸序列(由登录号BT006750确定)公开于,例如,Mantzouranis等,1985,“Human serum amyloid P component.cDNA isolation,completesequence of pre-serum amyloid P component,and localization of the gene tochromosome 1,“J.Biol.Chem.260:7752-7756,APCS的氨基酸序列(由登录号CAH73651确定)公开于例如Cobley,V.,2005,Direct Submission,WellcomeTrust Sanger Institute,Hinxton,Cambridgeshire,CB1O ISA,UK,每篇在此通过引用全文引入。
血清淀粉样蛋白P组分前体的核苷酸序列(由登录号确定BC007058)公开于,Strausberg,2002,“Generation and Initial analyis of more than 15,000full-length human and mouse cDNA sequences”,Proc.Natl.Acad.Sci.USA99,16899-16802,血清淀粉样蛋白P组分前体的氨基酸序列(由登录号NP001630确定)公开于,例如,Veerhuis等,2005,“Activation of human microgliaby fibrillar prion protein-related peptides is enhanced by amyloid-associatedfactors SAP and CIq,“Neurobiol.Dis.19,273-282,每篇在此通过引用全文引入。
B2M的核苷酸序列(由登录号NM_004048确定)公开于,例如,Krangel,M.S等,1979,“Assembly and maturation of HLA-A and HLA-B antigens in vivo”,Cell18(4),979-991;Suggs,S.V等,1981,“Use of synthetic oligonucleotides ashybridization probesrisolation of cloned cDNA sequences for human beta2-microglobulin”,Proc.Natl.Acad.Sci.U.S.A.78(11),6613-6617;Rosa,F等,1983,“The beta2-microglobulin mRNA in human Daudi cells has a mutated initiationcodon but is stillinducible by interferon”,EMBO J.2(2),239-243,B2M的氨基酸序列(由登录号AAA51811确定)公开于,例如,Gussow,D.等,1987,“Thehuman beta 2-microglobulin gene.Primary structure and definition of thetranscriptional unit”,J.Immunol.139(9),3132-3138,每篇在此通过引用全文引入。
C1R的核苷酸序列(由登录号NM_001733确定)公开于,例如,Lee,S.L等,1978,“Familial deficiency of two subunits of the first component ofcomplement.CIr and CIs associated with a lupus erythematosus-like disease”,Arthritis Rheum.21(8),958-967;Leytus,S.P等,1986,“Nucleotide sequence of thecDNA coding for human complement C1r”,Biochemistry 25(17),4855-4863;Journet,A等,1986,“Cloning and sequencing of full-length cDNA encoding theprecursor of human complement component C1r”,Biochem.J.240(3),783-787,C1R的氨基酸序列(由登录号NP_001724确定)公开于,例如,Lee,S.L等,1978,“Familial deficiency of two subunits of the first component of complement.CIr andCIs associated with a lupus erythematosus-like disease”,Arthritis Rheum.21(8),958-967;Leytus,S.P等,1986,″Nucleotide sequence of the cDNA coding forhuman complement C1r”,Biochemistry 25(17),4855-4863;Journet,A等,1986,“Cloning and sequencing of full-length cDNA encoding the precursor of humancomplement component C1r5”,Biochem.J.240(3),783-787,每篇在此通过引用全文引入。
C4B的核苷酸序列(由登录号NM_000592确定)公开于,例如,Teisberg,P.等,1976,“Genetic polymorphism of C4in man and localisation of a structural C4locus to the HLA gene complex of chromosome 6”,Nature 264(5583),253-254;Moon,K.E.等,1981,“Complete primary strueture of human C4a anaphylatoxin”,J.Biol.Chem.256(16),8685-8692;Mascart-Lemone,F等,1983,“Genetic deficiencyof C4presenting with recurrent infections and a SLE-like disease.Genetic andimmunologic studies”,Am.J.Med.75(2),295-304,C4B的氨基酸序列(由登录号AAR89095确定)公开于,例如,Sayer,D等,2003,Direct Submission,Dept ofClinical Immunology,Royal Perth Hospital,Wellington Street,Perth,WesternAustralia,Australia;Sayer,D.等,unpublished,“Molecular genetics of complementC4:implications for MHC evolution and disease susceptibility gene mapping,“每篇在此通过引用全文引入。
C6的核苷酸序列(由登录号NM_000065确定)公开于,例如,Hetland,G等,1986,“Synthesis of complement components C5,C6,C1,C8 and C9 in vitro byhuman monocytes and assembly of the terminal complement complex”,Scand.J.Immunol.24(4),421-428;Chakravarti,D.N等,1988,“Biochemicalcharacterization of the human complement protein C6.Association withalpha-thrombin-like enzyme and absence of serine protease activity in cytolyticallyactive C6”,J.Biol.Chem.263(34),18306-18312;Chakravarti,D.N等,1989,“Structural homology of complement protein C6 with other channel-formingproteins of complement”,Proc.Natl.Acad.Sci.U.S.A.86(8),2799-2803,C6的氨基酸序列(由登录号BAD02322确定)公开于,例如,Soejima等,2005,“Nucleotide sequence analyses of human complement 6(C6)gene suggestbalancing selection,“Ann.Hum.Genet.69(PT 3),239-252,每篇在此通过引用全文引入。
C7的核苷酸序列(由登录号NM_000587确定)公开于,例如,DiScipio,R.G.等,1988,“The structure of human complement component C7 and the C5b-7complex”,J.Biol.Chem.263(1),549-560;Nurnberger,W等,1989,“Familialdeficiency of the seventh component of complement associated with recurrentmeningococcal infections”,Eur.J.Pediatr.148(8),758-760;Coto,E.等,1991,“DNApolymorphisms and linkage relationship of the human complement component C6,C7,and C9genes”,Immunogenetics 33(3),184-187,C7的氨基酸序列(由登录号CAA72407确定)公开于,例如,Gonzalez,S.,1997,Direct Submission,S.Gonzalez,Servicio de Immunologia,Hospital Central Asturias,Julian Claverias.n.,33006 Oviedo,Asturias,SPAIN;Gonzalez,S.等,2002,“Cloning andcharacterization of human complement component C7 promoter”,每篇在此通过引用全文引入。
C8B的核苷酸序列(由登录号NM_000066确定)公开于,例如,Howard,O.M等,1987,“Complementary DNA and derived amino acid sequence of the betasubunit of human complement protein C8:identification of a close structural andancestral relationship to the alpha subunit and C9”,Biochemistry 26(12),3565-3570;Haefliger,J.A等,1987,“Complementary DNA cloning ofcomplement C8 beta and its sequence homology to C9”,Biochemistry 26(12),3551-3556;Stewart,J.L等,1987,“Evidence that C5b recognizes and mediates C8incorporation into the cytolytic complex of complement”,J.Immunol.139(6),1960-1964,C8B的氨基酸序列(由登录号CAC18532确定)公开于,例如,Howden,P.,2005,Direct Submission,Wellcome Trust Sanger Institute,Hinxton,Cambridgeshire,CB10 1SA,UK,每篇在此通过引用全文引入。
CDK5RAP2的核苷酸序列(由登录号NM_018249确定)公开于,例如,Ching,Y.P等,2000,“Cloning of three novel neuronal Cdk5 activator bindingproteins”,Gene 242(1-2),285-294;Wang,X等,2000,“Identification of a commonprotein association region in the neuronal Cdk5 activator”,J.Biol.Chem.275(41),31763-31769;Andersen,J.S.等,2003,“Proteomic characterization of the humancentrosome by protein correlation profiling”,Nature 426(6966),570-574,CDK5RAP2的氨基酸序列(由登录号CAI40927确定)公开于,例如,Beasley,H.,2005,Direct Submission,Wellcome Trust SangerInstitute,Hinxton,Cambridgeshire,CB10 1SA,UK,每篇在此通过引用全文引入。
CHGB的核苷酸序列(由登录号NM_001819确定)公开于,例如,Beneduralphal,U.M等,1987,“The primary structure of human secretograninI(chromogranin B):comparison with chromogranin A reveals homologousterminal domains and a large intervening variable region”,EMBO J.6(5),1203-1211;Gill,B.M等,1991,“Chromogranin B:isolation frompheochromocytoma,N-terminal sequence,tissue distribution and secretory vesicleprocessing”,Regul.Pept.33(2),223-235;Levine,M.A等,1991,“Mapping of thegene encoding the alpha subunit of the stimulatory G protein of adenylylcyclase(GNAS1)to 20q13.2-q13.3 in human by in situ hybridization”,Genomics11(2),478-479,CHGB的氨基酸序列(由登录号CAB55272确定)公开于,例如,Pelan,S.,2005,Direct Submission,Wellcome Trust Sanger Institute,Hinxton,Cambridgeshire,CB1O ISA,UK,每篇在此通过引用全文引入。
COMP的核苷酸序列(由登录号NM_000095确定)公开于,例如,Briggs,M.D.等,1993,“Genetic linkage of mild pseudo achondroplasia(PSACH)tomarkers in the pericentromeric region of chromosome 19”,Genomics 18(3),656-660;Oehlmann,R等,1994,“Genetic linkage mapping of multiple epiphysealdysplasia to the pericentromeric region of chromosome 19”,Am.J.Hum.Genet.54(1),3-10;Newton,G等,1994,“Characterization ofhuman andmouse cartilage oligomeric matrix protein”,Genomics 24(3),435-439,COMP的氨基酸序列(由登录号AAC83643确定)公开于,例如,Deere等,2001,“Analysisof the promoter region of human cartilage oligomeric matrix protein(COMP)”,Matrix Biol.19(8),783-792,每篇在此通过引用全文引入。
CORO1A的核苷酸序列(由登录号NM_007074确定)公开于,例如,Suzuki,K.等,1995,“Molecular cloning of a novel actin-binding protein,p57,witha WD repeat and a leucine zipper motif”,FEBS Lett.364(3),283-288;Okumura,M.,等,1998,“Definition of family of coronin-related proteins conserved betweenhumans and mice:close genetic linkage between coronin-2 and CD45-associatedprotein”,DNA Cell Biol.17(9),779-787;Ferrari,G等,1999,“A coat protein onphagosomes involved in the intracellular survival of mycobacteria”,Cell 97(4),435-447,CORO1A的氨基酸序列(由登录号NP_009005确定)公开于,例如,Suzuki,K等,1995,“Molecular cloning of a novel actin-binding protein,p57,with aWD repeat and a leucine zipper motif”,FEBS Lett.364(3),283-288;Okumura,M.等,1998,“Definition of family of coronin-related proteins conserved betweenhumans and mice:close genetic linkage between coronin-2 and CD45-associatedprotein”,DNA Cell Biol.17(9),779-787;Ferrari,G.等,1999,“A coat protein onphagosomes involved in the intracellular survival of mycobacteria”,Cell 97(4),435-447,每篇在此通过引用全文引入。
CPN1的核苷酸序列(由登录号NM_001308确定)公开于,例如,Skidgel,R.A.等,1988,“Amino acid sequence of the N-terminus and selectedtryptic peptides of the active subunit of human plasma carboxypeptidase N:comparison with other carboxy peptidases”,Biochem.Biophys.Res.Commun.154(3),1323-1329;Gebhard,W等,1989,“cDNA cloning ofkininase 1”,Adv.Exp.Med.Biol.247B,261-264;Gebhard,W等,1989,“cDNA cloning andcomplete primary structure of the small,active subunit of human carboxypeptidaseN(kininase I)”,Eur.J.Biochem.178(3),603-607,CPN1的氨基酸序列(由登录号NP_001299确定)公开于,例如,Skidgel,R.A等,1988,“Amino acid sequence ofthe N-terminus and selected tryptic peptides of the active subunit of human plasmacarboxypeptidase N:comparison with other carboxypeptidases”,Biochem.Biophys.Res.Commun.154(3),1323-1329;Gebhard,W等,1989,“cDNAcloning ofkininase 1”,Adv.Exp.Med.Biol.247B,261-264;Gebhard,W等,1989,“cDNA cloning and complete primary structure of the small,active subunit ofhuman carboxypeptidase N(kininase I)3”,Eur.J.Biochem.178(3),603-607,每篇在此通过引用全文引入。
CUL1的核苷酸序列(由登录号NM_003592确定)公开于,例如,Kipreos,E.T等,1996,“cul-1 is required for cell cycle exit in C.elegans andidentifies a novel gene family”,Cell 85(6),829-839;Lisztwan,J等,1998,“Association of human CUL-I and ubiquitin-conjugating enzyme CDC34 with theF-box protein p45(SKP2):evidence for evolutionary conservation in the subunitcomposition of the CDC34-SCF pathway”,EMBO J.17(2),368-383;Michel,JJ等,1998,“Human CUL-I,but not other cullin family members,selectively interactswith SKP1 to form a complex with SKP2 and cyclin A”,Cell Growth Differ.9(6),435-449,CUL1的氨基酸序列(由登录号NP_003583确定)公开于,例如,Kipreos,E.T等,1996,“cul-1 is required for cell cycle exit in C.elegans andidentifies a novel gene family”,Cell 85(6),829-839;Lisztwan,J等,1998,“Association of human CUL-I and ubiquitin-conjugating enzyme CDC34 with theF-box protein p45(SKP2):evidence for evolutionary conservation in the subunitcomposition of the CDC34-SCF pathway”,EMBO J.17(2),368-383;MichelJJ等,1998,“Human CUL-I,but not other cullin family members,selectively interactswith SKP1 to form a complex with SKP2 and cyclin A”,Cell Growth Differ.9(6),435-449,每篇在此通过引用全文引入。
DET1的核苷酸序列(由登录号NM_017966确定)公开于,例如,Eastman,S.W.等,2005,“Identification of human VPS37C,a component ofendosomal sorting complex required for transport-I importantfor viral budding”,J.Biol.Chem.280(1),628-636,DET1的氨基酸序列(由登录号NP_060466确定)公开于,例如,Wertz,I.E.等,2004,“Human De-etiolated-1regulates c-Jun byassembling a CUL4A ubiquitin ligase”,Science 303(5662),1371-1374,每篇在此通过引用全文引入。
DSC1的核苷酸序列(由登录号BC109161确定)公开于,例如,Strausberg,R.L等,2002,“Generation and initial analysis of more than 15,000full-length human and mouse cDNA sequences”,Proc.Natl.Acad.Sci.U.S.A.99(26),16899-16903,DET1的氨基酸序列(由登录号NP_060466确定)公开于,例如,Wertz,I.E.等,2004,“Human De-etiolated-1 regulates c-Jun by assembling aCUL4A ubiquitin ligase”,Science 303(5662),1371-1374,每篇在此通过引用全文引入。
F13A1的核苷酸序列(由登录号NM_000129确定)公开于,例如,Takahashi,N  等,1986,“Primary structure of blood coagulation factorXIIIa(fibrinoligase,transglutaminase)from human placenta”,Proc.Natl.Acad.Sci.U.S.A.83(21),8019-8023;Grundmann,U等,1986,“Characterization of cDNAcoding for human factor XIIIa”,Proc.Natl.Acad.Sci.U.S.A.83(21),8024-8028;Ichinose,A等,1986,″Amino acid sequence of the a subunit of human factorXIII”,Biochemistry 25(22),6900-6906,F13A1的氨基酸序列(由登录号CAC36886确定)公开于,例如,Sehra,H.,2005,Direct Submission,Wellcome TrustSanger Institute,Hinxton,Cambridgeshire,CB1O ISA,UK,每篇在此通过引用全文引入。
F5的核苷酸序列(由登录号NM_000130确定)公开于,例如,Suzuki,K等,1982,“Thrombin-catalyzed  activation of human coagulation factor  V”,J.Biol.Chem.257(11),6556-6564;Kane,W.H等,1986,“Cloning of a cDNAcoding for human factor V,a blood coagulation factor homologous to factor VIIIand ceruloplasmin”,Proc.Natl.Acad.Sci.U.S.A.83(18),6800-6804;Jenny,RJ等,1987,“Complete cDNA and derived amino acid sequence of human factor V”,Proc.Natl.Acad.Sci.U.S.A.84(14),48464850,F5的氨基酸序列(由登录号CAI23065、CAB16748确定)公开于,例如,Bird,C,2005,Direct Submission,Wellcome Trust Sanger Institute,Hinxton,Cambridgeshire,CB1O ISA,UK,每篇在此通过引用全文引入。
GOLGA1的核苷酸序列(由登录号NM_002077确定)公开于,例如,Griffith,KJ.等,1997,“Molecular cloning of a novel 97-kd Golgi complexautoantigen associated with sjogren′s syndrom”,ArthritisRheum.40(9),1693-1702;Barr,F.A.,1999,“A novel Rab6-interacting domaindefines a family of Golgi-targeted coiled-coil proteins”,Curr.Biol.9(7),381-384;Lu,L等,2003,“Interaction of ArIl-GTP with GRIP domains recruits autoantigensGolgin-97and Golgin-245/p230 onto the Golgi”,Mol.Biol.Cell14(9),3767-3781,GOLGA1的氨基酸序列(由登录号CAI39632确定)公开于,例如,Tracey,A.,2005,Direct Submission,Wellcome Trust Sanger Institute,Hinxton,Cambridgeshire,CB10 1SA,UK,每篇在此通过引用全文引入。
HBA1的核苷酸序列(由登录号NM_000558确定)公开于,例如,Kleihauer,E.F等,1968,“Hemoglobin-Bibba or alpha-2-136Pro-beta 2,an unstablealpha chain abnormal hemoglobin”,Biochim.Biophys.Acta 154(1),220-222;Boyer,S.H等,1968,“A survey of hemoglobins in the Republic of Chad andcharacterization of hemoglobin Chad:alpha-2-23Glu--Lys-beta-2”,Am.J.Hum.Genet.20(6),570-578;Fujiwara,N.等,1971,“HemoglobinAtago(alpha2-85Tyr beta-2)a new abnormal human hemoglobin found inNagasaki.Biochemical studies on hemoglobins and myoglobins.VI”,Int.J.ProteinRes.3(1),35-39,HBA1的氨基酸序列(由登录号AAO22464确定)公开于,例如,Elarn,D等,2002,Direct Submission,Medicine/Hematology-Oncology/Hemoglobin DNA Laboratory,Medical College ofGeorgia,15th Street,AC-1000,Augusta,Georgia 30912,USA,每篇在此通过引用全文引入。
HSPA5的核苷酸序列(由登录号NM_005347确定)公开于,例如,Munro,S等,1986,“An Hsp70-like protein in the ER:identity with the 78 kdglucose-regulated protein and immunoglobulin heavy chain binding protein”,Cell46(2),291-300;Pollok,B.A等,1987,“Molecular basis of the cell-surfaceexpression of immunoglobulin mu chain without light chain in human Blymphocytes”,Proc.Natl.Acad.Sci.U.S.A.84(24),9199-9203;Ting,J等,1988,“Human gene encoding the 78,000-dalton glucose-regulated protein and itspseudogene:structure,conservation,and regulation”,DNA 7(4),275-286,HSPA5的氨基酸序列(由登录号NP_005338确定)公开于,例如,Munro,S等,1986,“AnHsp70-like protein in the ER:identity with the 78 kd glucose-regulated protein andimmunoglobulin heavy chain binding protein”,Cell 46(2),291-300;Pollok,B.A等,1987,“Molecular basis of the cell-surface expression of immunoglobulin muchain without light chain in human B lymphocytes”,Proc.Natl.Acad.Sci.U.S.A.84(24),9199-9203;Ting,J等,1988,“Human geneencoding the 78,000-dalton glucose-regulated protein and its pseudogene:structure,conservation,and regulation”,DNA 7(4),275-286,每篇在此通过引用全文引入。
HUNK的核苷酸序列(由登录号NM_014586确定)公开于,例如,Gardner,H.P  等,2002,“Cloning and characterization of Hunk,a novelmammalian”,Genomics 63(1),46-59;Korobko,I.V等,2000,“The MAK-Vprotein kinase regulates endocytosis in mouse”,Mol.Gen.Genet.264(4)411-418;Korobko,LV等,2004,“Proteinkinase MAK-V/Hunk as a possible diagnostic andprognostic marker of human breast carcinoma”,Arkh.Patol.66(5),6-9,HUNK的氨基酸序列(由登录号NP_055401确定)公开于,例如,Gardner,H.P等,2002,“Cloning and characterization of Hunk,a novel mammalian”,Genomics 63(1),46-59;Korobko,I.V等,2000,“The MAK-V protein kinase regulates endocytosisin mouse”,Mol.Gen.Genet.264(4),411-418;Korobko,LV等,2004,“ProteinkinaseMAK-V/Hunk as a possible dianostic and prognostic marker of human breastcarcinoma”,Arkh.Patol.66(5),6-9,每篇在此通过引用全文引入。
IGFBP5的核苷酸序列(由登录号NM_000599确定)公开于,例如,Kiefer,M.C.等,1991,“Molecular cloning of a new human insulin-like growthfactor binding protein”,Biochem.Biophys.Res.Commun.176(1),219-225;Ehrenborg,E等,1991,“Strueture and localization of the human insulin-like growthfactor-binding protein 2 gene”,Biochem.Biophys.Res.Commun.176(3),1250-1255;Shimasaki,S等,1991,“Identification of five differentinsulin-like growth factor binding proteins(IGFBPs)from adult rat serum andmolecular cloning of a novel IGFBP-5 in rat and human”,J.Biol.Chem.266(16),10646-10653,IGFBP5的氨基酸序列(由登录号NP_000590确定)公开于,例如,Kiefer,M.C.等,1991,“Molecular cloning of a new human insulin-like growthfactor binding protein”,Biochem.Biophys.Res.Commun.176(1),219-225;Ehrenborg,E等,1991,“Structure and localization of the human insulin-likegrowth factor-binding protein 2 gene”,Biochem.Biophys.Res.Commun.176(3),1250-1255;Shimasaki,S等,1991,“Identification of five different insulin-likegrowth factor binding proteins(IGFBPs)from adult rat serum and molecularcloning of a novel IGFBP-5 in rat and human”,J.Biol.Chem.266(16),10646-10653,每篇在此通过引用全文引入。
IGHG1的核苷酸序列(由登录号BC092518确定)公开于,例如,Strausberg,R.L等,2002,“Generation and initial analysis of more than 15,000full-length human and mouse cDNA sequences”,Proc.Natl.Acad.Sci.U.S.A.99(26),16899-16903,IGHG1的氨基酸序列(由登录号CAC20454确定)公开于,例如,McLean等,2000,“Human and murine immunoglobulin expression vectorcassettes”,Mol.Immunol.37(14),837-845,每篇在此通过引用全文引入。
IGLV4-3的核苷酸序列(由登录号BC020236确定)公开于,例如,Strausberg,R.L等,2002,“Generation and initial analysis of more than 15,000full-length human and mouse cDNA sequences”,Proc.Natl.Acad.Sci.U.S.A.99(26),16899-16903,IGLV4-3的氨基酸序列(由登录号AAH20236确定)公开于,例如,Strausberg,R.L等,2002,“Generation and initial analysis of more than15,000 full-length human and mouse cDNA sequences”,Proc.Natl.Acad.Sci.U.S.A.99(26),16899-16903,每篇在此通过引用全文引入。
KIF5C的核苷酸序列(由登录号NM_004984确定)公开于,例如,Niclas,J等,“Cloning and localization of a conventional kinesin motor expressedexclusively in neurons,“Neuron 12(5),1059-1072,1994;KIF5C的氨基酸序列(由登录号AAH17298确定)公开于,例如,Strausberg,R.L等,“Generation andinitial analysis of more than 15,000 full-length human and mouse cDNAsequences,”Proc.Natl.Acad.Sci.U.S.A.99(26),16899-16903(2002),每篇在此通过引用全文引入。
KRT10的核苷酸序列(由登录号NM_000421确定)公开于,例如,Darmon,M.Y等,1987,“Sequence of a cDNA encoding human keratin No.10selected according to structural homologies of keratins and their tissue-specificexpression”,Mol.Biol.Rep.12(4),277-283;Zhou,X.M等,1988,“The completesequence of the human intermediate filament chain keratin 10.Subdomainaldivisions and model for folding of end domain sequences”,J.Biol.Chem.263(30),15584-15589;Lessin,S.R等,1988,“Chromosomal mapping of human keratingenes:evidence ofnon-linkage”,J.Invest.Dermatol.91(6),572-578,KRT10的氨基酸序列(由登录号NP_000412确定)公开于,例如,Darmon,M.Y等,1987,“Sequence of a cDNA encoding human keratin No 10 selected according tostructural homologies of keratins and their tissue-specific expression”,Mol.Biol.Rep.12(4),277-283;Zhou,X.M等,1988,“The complete sequence of thehuman intermediate filament chain keratin 10.Subdomainal divisions and modelfor folding of end domain sequences”,J.Biol.Chem.263(30),15584-15589;Lessin,S.R等,1988,“Chromosomal mapping of human keratin genes:evidence ofnon-linkage”,J.Invest.Dermatol.91(6),572-578,每篇在此通过引用全文引入。
KRT9的核苷酸序列(由登录号NM_000226确定)公开于,例如,Reis,A等,1992,“Mapping of a gene for epidermolytic palmoplantar keratoderma to theregion of the acidic keratin gene cluster at 17q12-q21”,Hum.Genet.90(1-2),113-116;Rogaev,E.I等,1993,“Identification of the genetic locus for keratosispalmaris et plantaris on chromosome 17 near the RARA and keratin type I genes”,Nat.Genet.5(2),158-162;Langbein,L等,1993,“Molecular characterization of thebody site-specific human epidermal cytokeratin 9:cDNA cloning,amino acidsequence,and tissue specificity of gene expression”,Differentiation 55(1),57-71,KRT9的氨基酸序列(由登录号NP_000217确定)公开于,例如,Reis,A.等,1992,“Mapping of a gene for epidermo1ytic palmoplantar keratoderma to the region ofthe acidic keratin gene cluster at 17q12-q21”,Hum.Genet.90(1-2),113-116;Rogaev,E.I等,1993,“Identification of the genetic locus for keratosis palmaris etplantaris on chromosome 17 near the RARA and keratin type I genes”,Nat.Genet.5(2),158-162;Langbein,L等,1993,“Molecular characterization of thebody site-specific human epidermal cytokeratin 9:cDNA cloning,amino acidsequence,and tissue specificity of gene expression”,Differentiation 55(1),57-71,每篇在此通过引用全文引入。
LBP的核苷酸序列(由登录号AF105067确定)公开于,例如,Long等,1998,“Cloning and sequencing of human lipopolysaccharide-binding protein gene,“Shengwu Huaxue Yu Shengwu WuIi Jinzhan 25,469-471,LBP的氨基酸序列(由登录号AAC39547确定)公开于,例如,Kirschning等,1997,“Similarorganization of the lipopolysaccharide-binding protein(LBP)and phospholipidtransfer protein(PLTP)genes suggests a common gene family of lipid-bindingproteins”,Genomics 46(3),416-425,每篇在此通过引用全文引入。
LUM的核苷酸序列(由登录号BC035997确定)公开于,例如,Strausberg等,2002,“Generation and initial analysis of more than 15,000 full-length humanand mouse cDNA sequences”,Proc.Natl.Acad.Sci.U.S.A.99(26),16899-16903,LUM的氨基酸序列(由登录号AAP35353确定)公开于,例如,Kalnine,N等,2003,Direct Submission,BD Biosciences Clontech,1020 East Meadow Circle,Palo Alto,California 94303,USA,每篇在此通过引用全文引入。
MMP14的核苷酸序列(由登录号NM_004995确定)公开于,例如,Sato,H等,1994,“A matrix m等loproteinase expressed on the surface ofinvasive tumourcells”,Nature 370(6484),61-65;Okada,A等,1995,“Membrane-type matrix m等loproteinase(MT-MMP)gene is expressed in stromal cells of humancolon,breast,and head and neck carcinomas”,Proc.Natl,Acad.Sci.U.S.A.92(7),2730-2734;Takino,T等,1995,“Cloning of a human gene potentially encoding anovel matrix m等loproteinase having a C-terminal transmembrane domain”,Gene155(2),293-298,MMP14的氨基酸序列(由登录号AAV40837确定)公开于,例如,Livingston,RJ.等,2004,Direct Submission,Genome Sciences,University ofWashington,1705 NE Pacific,Seattle,Washington 98195,USA,每篇在此通过引用全文引入。
MYH4的核苷酸序列(由登录号NM_017533确定)公开于,例如,Soussi-Yanicostas等,1993,“Five skeletal myosin heavy chain genes areorganized as a multigene complex in the human genome”,Hum.Mol.Genet.2(5),563-569;Sant′ana Pereira等,1995,“New method for the accurate characterizationof single human skeletal muscle fibres demonstrates a relation between mATPaseand MyHC expression in pure and hybrid fibre types,”J.MuscleRes.Cell.Motil.16(1),21-34,MYH4的氨基酸序列(由登录号NP_060003确定)公开于,例如,Soussi-Yanicostas等,1993,“Five skeletal myosin heavy chaingenes are organized as a multigene complex in the human genome”,Hum.Mol.Genet.2(5),563-569;Sant′ana Pereira等,1995,“New method for theaccurate characterization of single human skeletal muscle fibres demonstrates arelation between mATPase and MyHC expression in pure and hybrid fire types”,J.Muscle Res.Cell.Motil.16(1),21-34;and Weiss等,1999,“Organization ofhuman and mouse skeletal myosin heavy chain gene clusters is highly conserved”,Proc.Natl.Acad.Sci.U.S.A.96(6),2958-2963,每篇在此通过引用全文引入。
NEB的核苷酸序列(由登录号NM_004543确定)公开于,例如,Stedman,H.etai,1988,“Nebulin cDNAs detect a 25-kilobase transcript in skeletalmuscle and localize to human chromosome 2”,Genomics 2(1),1-7;Zeviani,M.等,1988,“Cloning and expression of human nebulin cDNAs and assignment ofthe gene to chromosome 2q31-q32”,Genomics 2(3),249-256;Labeit,S.等,1991,“Evidence that nebulin is a protein-ruler in muscle thin filaments”,FEBSLett.282(2),313-316,NEB的氨基酸序列(由登录号NP_004534确定)公开于,例如,Stedman,H等,1988,“Nebulin cDNAs detect a 25-kilobase transcript inskeletal muscle and localize to human chromosome 2”,Genomics 2(1),1-7;Zeviani,M等,1988,“Cloning and expression of human nebulin cDNAs andassignment of the gene to chromosome 2q31-q32”,Genomics 2(3),249-256;Labeit,S等,1991,“Evidence that nebulin is a protein-ruler in muscle thinfilaments”,FEBS Lett.282(2),313-316,每篇在此通过引用全文引入。
NUCB2的核苷酸序列(由登录号NM_005013确定)公开于,例如,Barnikol-Watanabe,S等,1994,“Human protein NEFA,a novel DNAbinding/EF-hand/leucine zipper protein.Molecular cloning and sequence analysisof the cDNA,isolation and characterization of the protein”,Biol.Chem.Hoppe-Seyler 375(8),497-512;Kroll,K.A等,1999,“Heterologousoverexpression of human NEFA and studies on the two EF-hand calcium-bindingsites”,Biochem.Biophys.Res.Commun.260(1),1-8;Taniguchi,N.等,2000,“Thepost mitotic growth suppressor necdin interacts with a calcium-bindingprotein(NEFA)in neuronal cytoplasm”,J.Biol.Chem.275(41),31674-31681,NUCB2的氨基酸序列(由登录号NP_005004确定)公开于,例如,Barnikol-Watanabe,S等,1994,“Human protein NEFA,a novel DNAbinding/EF-hand/leucine zipper protein.Molecular cloning and sequence analysisof the cDNA,isolation and characterization of the protein”,Biol.Chem.Hoppe-Seyler 375(8),497-512;Kroll,K.A等,1999,“Heterologousoverexpression of human NEFA and studies on the two EF-hand calcium-bindingsites”,Biochem.Biophys.Res.Commun.260(I)1-8;Taniguchi,N等,2000,“Thepostmitotic growth suppressor necdin interacts with a calcium-bindingprotein(NEFA)in neuronal cytoplasm”,J.Biol.Chem.275(41),31674-31681,每篇在此通过引用全文引入。
ORM2的核苷酸序列(由登录号NM_000608确定)公开于,例如,Schmid,K等,1973,“Structure of 1-acid glycoprotein.The complete amino acid sequence,multiple amino acid substitutions,and homology with the immunoglobulins”,Biochemistry 12(14),2711-2724;Schmid,K等,1974,“The disulfide bonds ofalphal-acid glycoprotein”,Biochemistry 13(13),2694-2697;Dente,L等,1987,“Structure and expression of the genes coding for human alpha 1-acidglycoprotein”,EMBO J.6(8),2289-2296,ORM2的氨基酸序列(由登录号NP_000599确定)公开于,例如,Schmid,K等,1973,“Structure of 1-acidglycoprotein.The complete amino acid sequence,multiple amino acidsubstitutions,and homology with the immunoglobulins”,Biochemistry 12(14),2711-2724;Schmid,K等,1974,“The disulfide bonds of alphal-acid glycoprotein”,Biochemistry 13(13),2694-2697;Dente,L等,1987,“Structure and expression ofthe genes coding for human alpha 1-acid glycoprotein”,EMBO J.6(8),2289-2296,每篇在此通过引用全文引入。
PF4V1的核苷酸序列(由登录号NM_002620确定)公开于,例如,Green,CJ等,1989,“Identification and characterization of PF4varl,a human gene variant ofplatelet factor 4”,Mol.Cell.Biol.9(4),1445-1451;Eisman,R等,1990,“Structuraland functional comparison of the genes for human platelet factor 4 and PF4alt”,Blood 76(2),336-344,PF4V1的氨基酸序列(由登录号NP_002611确定)公开于,例如,Green,C.J等,1989,“Identification and characterization of PF4varl,a humangene variant of platelet factor 4”,Mol.Cell.Biol.9(4),1445-1451;Eisman,R等,1990,“Structural and functional comparison of the genes for human platelet factor4 and PF4alt”,Blood 76(2),336-344,每篇在此通过引用全文引入。
PIGR的核苷酸序列(由登录号NM_002644确定)公开于,例如,Mizoguchi,A等,1982,“Structures of the carbohydrate moieties of secretorycomponent purified from human milk”,J.Biol.Chem.257(16),9612-9621;Hood,L等,1985,“T cell antigen receptors and the immunoglobulin supergene family”,Cell 40(2),225-229;Davidson,M.K等,1988,“Genetic mapping of the humanpolymeric immunoglobulin receptor gene to chromosome region Iq31-q41”,Cytogenet.Cell Genet.48(2),107-111,PIGR的氨基酸序列(由登录号CAC10060确定)公开于,例如,Schjerven,2000,“Mechanism of IL-4-mediated up-regulationof the polymeric Ig receptor:role of STAT6 in cell type-specific delayedtranscriptional response”,J.Immunol.165(7),3898-3906,每篇在此通过引用全文引入。
PLG的核苷酸序列(由登录号NM_000301确定)公开于,例如,Robbins,K.C等,1967,“The peptide chains of human plasmin.Mechanism of activation ofhuman plasminogen to plasmin”,J.Biol.Chem.242(10),2333-2342;Deutsch,D.G.等1970,“Plasminogen:purification from human plasma by affinitychromatography”,Science 170(962),1095-1096;Wiman,B等,1979,“On themechanism of the reaction between human alpha 2-antiplasmin and plasmin”,J.Biol.Chem.254(18),9291-9297,PLG的氨基酸序列(由登录号AAH60513确定)公开于,例如,Strausberg等,2002,“Generation and initial analysis of more than15,000 full-length human and mouse cDNA sequences”,Proc.Natl.Acad.Sci.U.S.A.99(26),16899-16903,每篇在此通过引用全文引入。
纤溶酶原前体的核酸序列公开于,例如,Forsgren等,1987,FEBS Lett213,254-260,而纤溶酶原前体的氨基酸序列(由登录号P00747确定)公开于,例如,Petersen等,“Characterization of the gene for human plasminogen,a keyproenzyme in the fibrinolytic system”,1990,J.Biol.Chem.265(11),6104-6111;和Forsgren等,1987,“Molecular cloning and characterization of a full-length cDNAclone for human plasminogen,FEBS Lett.213(2),254-260,每篇在此通过引用全文引入。
PON1的核苷酸序列(由登录号NM_000446确定)公开于,例如,Ortigoza-Ferado,J等,1984,“Paraoxon hydrolysis in human serum mediated by agenetically variable arylesterase and albumin”,Am.J.Hum.Genet.36(2),295-305;Gan,K.N等,1991,“Purification of human serumparaoxonase/arylesterase.Evidence for one esterase catalyzing both activities”,Drug Metab.Dispos.19(1),100-106;Hassett,C等,1991,“Characterization ofcDNA clones encoding rabbit and human serum paraoxonase:the mature proteinretains its signal sequence”,Biochemistry 30(42),10141-10149,PON1的氨基酸序列(由登录号NP_000437确定)公开于,例如,Ortigoza-Ferado,J等,1984,“Paraoxon hydrolysis in human serum mediated by a genetically variablearylesterase and albumin”,Am.J.Hum.Genet.36(2),295-305;Gan,K.N等,1991,“Purification of human serum paraoxonase/arylesterase.Evidence for one esterasecatalyzing both activities”,Drug Metab.Dispos.19(1),100-106;Hassett,C等,1991,“Characterization of cDNA clones encoding rabbit and human serumparaoxonase:the mature protein retains its signal sequence”,Biochemistry 30(42),10141-10149,每篇在此通过引用全文引入。
PPBP的核苷酸序列(由登录号NM_002704确定)公开于,例如,Begg,G.S等,1978,“Complete covalent structure of human beta-thromboglobulin”,Biochemistry 17(9),1739-1744;Kaplan,K.L.,1979,“Platelet alpha-granuleproteins:studies on release and subcellular localization”,Blood 53(4),604-618;McLaren,K.M等,1982,“Immunologicallocalisation of beta-thromboglobulin andplatelet factor 4 in human megakaryocytes and platelets”,J.Clin.Pathol.35(11),1227-1231,PPBP的氨基酸序列(由登录号CAG33086确定)公开于,例如,Ebert,L.et ai,2004,Direct Submission,RZPD Deutsches Ressourcenzentrum fuerGenomforschung GmbH,Im Neuenheimer FeId 580,D-69120Heidelberg,Germany;Ebert,L等,“Cloning of human full open reading frames inGateway(TM)system entry vector(pDONR201)”,每篇在此通过引用全文引入。
RBP4的核苷酸序列(由登录号NM_006744确定)公开于,例如,Rask,L.等,1971,“Studies on two physiological forms of the human retinol-bindingprotein differing in vitamin A and arginine content”,J.Biol.Chem.246(21),6638-6646;Fex,G等,1979,“Retinol-binding protein from human urine and itsinteraction with retinol and prealbumin”,Eur.J.Biochem.94(1),307-313;Fex,G等,1979,“Interaction between prealbumin and retinol-binding protein studied byaffinity chromatography,gel filtration and two-phase partition”,Eur.J.Biochem.99(2),353-360,RBP4的氨基酸序列(由登录号CAH72328确定)公开于,例如,Brown,A.,2005,Direct Submission,Wellcome Trust SangerInstitute,Hinxton,Cambridgeshire,CB1O ISA,UK,每篇在此通过引用全文引入。
RIMS1的核苷酸序列(由登录号NM_014989确定)公开于,例如,Kelsell,R.E等,1998,“Localization of a gene(CORD7)for a dominant cone-rod dystrophyto chromosome 6q”,Am.J.Hum.Genet.63(1),274-279;Betz,A等,2001,“Functional interaction of the active zone proteins Muncl 3-1 and RIM1 in synapticvesicle priming”,Neuron 30(1),183-196;Coppola,T等,2001,“Direct interactionof the Rab3 effector RJM with Ca2+ channels,SNAP-25,and synaptotagmin”,J.Biol.Chem.276(35),32756-32762,RIMS1的氨基酸序列(由登录号NP_055804确定)公开于,例如,Kelsell,R.E等,1998,“Localization of a gene(CORD7)for adominant cone-rod dystrophy to chromosome 6q”,Am.J.Hum.Genet.63(1),274-279;Betz,A等,2001,“Functional interaction of the active zone proteinsMuncl3-1 and RIM1 in synaptic vesicle priming”,Neuron 30(1),183-196;Coppola,T等,2001,“Direct interaction of the Rab3 effector RIM with Ca2+channels,SNAP-25,and synaptotagmin”,J.Biol.Chem.276(35),32756-32762,每篇在此通过引用全文引入。
RNF6的核苷酸序列(由登录号NM_005977确定)公开于,例如,Macdonald,D.H.等1999,“Cloning and characterization of RNF6,a novel RINGfinger gene mapping to 13q12”,Genomics 58(1),94-97;Lopez,P.,等,2002,“Genecontrol in germinal differentiation:RNF6,a transcription regulatory protein in themouse Sertoli cell”,Mol.Cell.Biol.22(10),3488-3496;Lo,H.S  等,2002,“Identification of somatic mutations of the RNF6 gene in human esophagealsquamous cell carcinoma″,Cancer Res.62(15),4191-4193,RNF6的氨基酸序列(由登录号CAH73183确定)公开于,例如,Tromans,A等,2004,DirectSubmission,Wellcome Trust Sanger Institute,Hinxton,Cambridgeshire,CB1OISA,UK,每篇在此通过引用全文引入。
SEMA3D的核苷酸序列(由登录号NM_152754确定)公开于,例如,Scherer,S.W等,2003,“Human chromosome 7:DNA sequence and biology″,Science 300(5620),767-772;Clark,H.F.,等,2003,“The secreted protein discoveryinitiative(SPDI),a large-scale effort to identify novel human secreted andtransmembrane proteinsra bioinformatics assessment”,Genome Res.13(10),2265-2270;SEMA3D的氨基酸序列(由登录号EAL24184确定)公开于,例如,Scherer等,2003,“Human chromosome 7:DNA sequence and biology”,Science300(5620),767-772,每篇在此通过引用全文引入。
SF3B1的核苷酸序列(由登录号NM_012433确定)公开于,例如,Wang,C等,1998,“Phosphorylation of spliceosomal protein SAP 155 coupled with splicingcatalysis”,Genes Dev.12(10),1409-1414;Pauling,M.H.等2000,“FunctionalCuslp is found with Hsh155p in a multiprotein splicing factor associated with U2snRNA”,Mol.Cell.Biol.20(6),2176-2185;Will,CL等,2001,“A novel U2 andU11/U12 snRNP protein that associates with the pre-mRNA branch site”,EMBOJ.20(16),4536-4546,SF3B1的氨基酸序列(由登录号NP_006833确定)公开于,例如,Gozani,O等,1996,“Evidence that sequence-independent binding of highlyconserved U2 snRNP proteins upstream of the branch site is required for assemblyof spliceosomal complex A”,Genes Dev.10(2),233-243;Agell,N.,等,1998,“Newnuclear functions for calmodulin”,Cell Calcium 23(2-3),115-121;Das,B.K.,等,1999,“Characterization of a protein complex containing spliceosomal proteinsSAPs 49,130,145,and 155”,Mol.Cell.Biol.19(10),6796-6802,每篇在此通过引用全文引入。
SPINK1的核苷酸序列(由登录号NM_003122确定)公开于,例如,Huhtala,MX等,1982,“inhibitor from the urine of a patient with-ovarian cancer”,J.Biol.Chem.257(22),13713-13716;Yamamoto,T等,1985,“Molecular cloningand nucleotide sequence of human pancreatic secretory trypsininhibitor(PSTI)cDNA”,Biochem.Biophys.Res.Cornrnun.132(2),605-612;Horii,A:,等,1987,“Primary structure of human pancreatic secretory trypsininhibitor(PSTI)gene”,Biochem.Biophys.Res.Commun.149(2),635-641,SPINK1的氨基酸序列(由登录号NP_003113确定)公开于,例如,Huhtala,M.L等,1982,inhibitor from the urine of a patient with ovarian cancer”,J.Biol.Chem.257(22),13713-13716;Yamamoto,T等,1985,“Molecular cloningand nucleotide sequence of human pancreatic secretory trypsininhibitor(PSTI)cDNA”,Biochem.Biophys.Res.Commun.132(2),605-612;Horii,A等,1987,“Primary structure of human pancreatic secretory trypsininhibitor(PSTI)gene”,Biochem.Biophys.Res.Commun.149(2),635-641,每篇在此通过引用全文引入。
SPP1的核苷酸序列(由登录号NM_000582确定)公开于,例如,Kiefer,M.C等,1989,“The cDNA and derived amino acid sequence for human osteopontin”,Nucleic Acids Res.17(8),3306;Nemir,M.,等,1989,“Normal rat kidney cellssecrete both phosphorylated and nonphosphorylated forms of osteopontin showingdifferent physiological properties”,J.Biol.Chem.264(30),18202-18208;Fisher,L.W等,“Human bone sialoprotein.Deduced protein sequence andchromosomal localization”,J.Biol.Chem.265(4),2347-2351,SPP1的氨基酸序列(由登录号AAH17387确定)公开于,例如,Strausberg,R.L等,2002,“TGeneration and initial analysis of more than 15,000 full-length human and mousecDNA sequences”,Proc.Natl.Acad.Sci.U.S.A.99(26),16899-16903,每篇在此通过引用全文引入。
SPTB的核苷酸序列(由登录号NM_001024858确定)公开于,例如,Carlier,M.F等,1984,“Interaction between microtubule-associated protein tau andspectrin”,Biochimie 66(4),305-311;Prchal,J.T.,等,1987,“Isolation andcharacterization of cDNA clones for human erythrocyte beta-spectrin”,Proc.Natl.Acad.Sci.U.S.A.84(21),7468-7472;Winkelmann,J.C等,1988,“Molecular cloningof the cDNA for human erythrocyte beta-spectrin”,Blood 72(1),328-334,SPTB的氨基酸序列(由登录号BAD92652确定)公开于,例如,Totoki,Y等,2000,Direct Submission,Osamu Ohara,Kazusa DNA ResearchInstitute,Department of Human Gene Research;2-6-7 Kazusa-kamatari,Kisarazu,Chiba,292-0818,Japan,每篇在此通过引用全文引入。
SYNE1的核苷酸序列(由登录号NM_182961确定)公开于,例如,Zhang,Q.等,“Nesprins:a novel family of spectrin-repeat-containing proteins that localize tothe nuclear membrane in multiple tissues”,J.Cell.Sci.114(PT 24),4485-4498(2001);Apel,E.D等,“Syne-1,a dystrophin-and Klarsicht-relatedprotein associated with synaptic nuclei at the neuromuscular junction”,J.Biol.Chem.275(41),31986-31995(2000);Nedivi,E.,等,“A set of genesexpressed in response to light in the aduh cerebral cortex and regulated duringdevelopment”,Proc.Natl.Acad.Sci.U.S.A.93(5),2048-2053(1996),SYNE1的氨基酸序列(由登录号AAH39121确定)公开于,例如,Strausberg,R.L等,“Generation and initial analysis of more than 15,000 full-length human and mousecDNA sequences”,Proc.Natl.Acad.Sci.U.S.A.99(26),16899-16903(2002),每篇在此通过引用全文引入。
TAF4B的核苷酸序列(由登录号NM_003187确定)公开于,例如,Parada,C.A.,等,“A novel LBP-I-mediated restriction of HIV-I transcription at thelevel of elongation in vitro”,J.Biol.Chem.270(5),2274-2283(1995);Zhou andSharp,“Novel mechanism and factor for regulation by HIV-I Tat”,EMBO J.14(2),321-328(1995);Ou等,“Role of flanking E box motfs in humanimmunodeficiency virus type 1 TATA element function”,J.Virol.68(11),7188-7199(1994);Kashanchi,F.等“Direct interaction of human TFIID with theHIV-I transactivator tat,”Nature 367(6460),295-299(1994),每篇在此通过引用全文引入,而TAF4B的氨基酸序列(由登录号XP_290809确定)通过带注释的基因组序列(NT_010966)利用基因预测方法:GNOMON的自动计算分析而预测。
TBC1D1的核苷酸序列(由登录号NM_015173确定)公开于,例如,White,R.A等,2000,“The gene encoding TBC1D1 with homology to thetre-2/USP6 oncogene,BUB2,and cdclomicrone maps to mouse chromosome 5 andhuman chromosome 4”,Cytogenet.Cell Genet.89(3-4),272-275;TBC1D1的氨基酸序列(由登录号NP_055988确定)公开于,例如,White,R.A等,2000,“Thegene encoding TBC1D1 with homology to the tre-2/USP6 oncogene,BUB2,andcdcl6 maps to mouse chromosome 5 and human chromosome 4”,Cytogenet.CellGenet.89(3-4),272-275,每篇在此通过引用全文引入。
TLN1的核苷酸序列(由登录号NM_006289确定)公开于,例如,Kupfer等,1990,“The PMA-induced specific association of LFA-I and talin in intactcloned T helper cells”,J.Mol.Cell.Immunol.4(6),317-325;Luna,E.J.等,1992,“Cytoskeleton-plasma membrane interactions”,Science 258(5084),955-964;Salgia,R等,1995,“Molecular cloning of human paxillin,a focal adhesion proteinphosphorylated by P210BCR/ABL”,J.Biol.Chem.270(10),5039-5047,TLN1的氨基酸序列(由登录号NP_006280确定)公开于,例如,Kupfer,A等,1990,“ThePMA-induced specific association of LFA-I and talin in intact cloned T helpercells”,J.Mol.Cell.Immunol.4(6),317-325;Luna,EJ等,1992,“Cytoskeleton-plasmamembrane interactions”,Science 258(5084),955-964;Salgia,R等,1995,“Molecular cloning of human paxillin,a focal adhesion protein phosphorylated byP210BCR/ABL”,J.Biol.Chem.270(10),5039-5047,每篇在此通过引用全文引入。
TMSB4X的核苷酸序列(由登录号NM_021109确定)公开于,例如,Erickson-Viitanen,S等,1983,“Distribution of thymosin beta 4 in vertebrateclasses”,Arch.Biochem.Biophys.221(2),570-576;Friedman,R.L  等,1984,“Transcriptional and posttranscriptional regulation of interferon-induced geneexpression in human cells”,Cell 38(3),745-755;Soma,G等,1985,“Detection ofa countertranscript in promyelocytic leukemia cells HL60 during earlydifferentiation by TPA”,Biochem.Biophys.Res.Commun.132(1),100-109,TMSB4X的氨基酸序列(由登录号NP_066932确定)公开于,例如,Erickson-Viitanen,S.et ai,1983,“Distribution of thymosin beta 4 in vertebrateclasses”,Arch.Biochem.Biophys.221(2),570-576;Friedman,R.L等,1984,“Transcriptional and posttranscriptional regulation of interferon-induced geneexpression in human cells”,Cell 38(3),745-755;Soma,G等,1985,“Detection ofa countertranscript in promyelocytic leukemia cells HL60 during earlydifferentiation by TPA″,Biochem.Biophys.Res.Commun.132(1),100-109,每篇在此通过引用全文引入。
UROC1的核苷酸序列(由登录号NM_144639确定)公开于,例如,Yamada,S等,2004,“Expression profiling and differential screening betweenhepatoblastomas and the corresponding normal livers:identification of highexpression of the PLK1 oncogene as a poor-prognostic indicator ofhepatoblastomas”,Oncogene 23(35),5901-5911,UROC1的氨基酸序列(由登录号NP_653240确定)公开于,例如,Yamada,S等,2004,“Expression profiling anddifferential screening between hepatoblastomas and the corresponding normallivers:identification of high expression of the PLK1 oncogene as a poor-prognosticindicator of hepatoblastomas”,Oncogene 23(35),5901-5911,每篇在此通过引用全文引入。
ZFHX2的核苷酸序列(由登录号NM_033400确定)公开于,例如,Nagase,T等,2000,“Prediction of the coding sequences of unidentified humangenes.XIX.The complete sequences of 100 new cDNA clones from brain whichcode for large proteins in vitro”,DNA Res.7(6),347-355;ZFHX2的氨基酸序列(由登录号NP_207646确定)公开于,例如,Nagase,T.等,2000,“Prediction of thecoding sequences of unidentified human genes.XIX.The complete sequences of100 new cDNA clones from brain which code for large proteins in vitro”,DNARes.7(6),347-355,每篇在此通过引用全文引入。
ZYX的核苷酸序列(由登录号NM_003461确定)公开于,例如,Wang,L.F等,1994,“Gene encoding a mammalian epididymal protein″,Biochem.Mol.Biol.Int.34(6),1131-1136;Reinhard,M等,1995,“Identification,purification,and characterization of a zyxin-related protein that binds the focaladhesion and microfilament protein VASP(vasodilator-stimulatedphosphoprotein)”,Proc.Natl.Acad.Sci.U.S.A.92(17),7956-7960;Hobert,O等,1996,“SH3 domain-dependent interaction of the proto-oncogene product Vav withthe focal contact protein zyxin”,Oncogene 12(7),1577-1581,ZYX的氨基酸序列(由登录号NP_001010972确定)公开于,例如,Wang,L.F.等,1994,“Geneencoding a mammalian epididymal protein”,Biochem.Mol.Biol.Int.34(6),1131-1136;Reinhard,M等,1995,″Identification,purification,andcharacterization of a zyxin-related protein that binds the focal adhesion andmicrofilament protein VASP(vasodilator-stimulated phosphoprotein)”,Proc.Natl.Acad.Sci.U.S.A.92(17),7956-7960;Hobert,O等,1996,“SH3domain-dependent interaction of the proto-oncogene product Vav with the focalcontact protein zyxin”,Oncogene 12(7),1577-1581,每篇在此通过引用全文引入。
5.6.2有用的生物标记的分离
本发明的生物标记如果是蛋白质,例如可以用来产生结合生物标记的抗体(使用此处所述的方法,或本领域技术人员公知的任何方法),或者如果是核酸,可以用来开发特异性寡核苷酸探针,例如使用此处所述的方法,或本领域技术人员公知的任何方法。本领域技术人员将容易地理解,可以进一步表征有用的特征,以确定生物标记的分子结构。以这种方式表征生物标记的方法在本领域中是公知的,包括X-射线结晶学、高分辨率质谱法、红外分光法、紫外分光法和核磁共振。确定核酸生物标记的核苷酸序列、多肽生物标记的氨基酸序列、碳水化合物生物标记的组成和序列的方法在本领域中是公知的。
5.7对SIRS个体应用本发明
在一个实施方案中,利用本发明公开的方法筛查具有发展成为脓毒症风险的SIRS个体。生物样品在一或多个不同的时间点从SIRS阳性个体采集,并且用来构建生物标记谱。然后评价生物标记谱,以确定生物标记谱的特征值是否满足与特定判定规则有关的第一数值集。该评价将个体分类为转变者或非转变者。然后可以启动治疗方案,以在个体被分类为转变者时预防或阻止脓毒症的进展。
5.8对脓毒症阶段应用本发明
在一个实施方案中,利用本发明公开的方法筛查特别有发展特定脓毒症阶段的风险的个体。生物样品从个体采集,并且用来构建生物标记谱。然后评价生物标记谱,以确定生物标记谱的特征值是否满足与特定判定规则有关的第一数值集。该评价将个体分类为具有或不具有特定脓毒症阶段。然后可以启动治疗方案,以治疗特定脓毒症阶段。在一些实施方案中,脓毒症阶段是,例如脓毒症发作、严重脓毒症、脓毒性休克或多器官功能障碍。
5.9示例性实施方案
在本发明的一些实施方案中,使用来自受试者,特别是具有发展成为脓毒症、患有脓毒症的风险的个体,或者怀疑患有脓毒症的个体的生物样品获得生物标记谱。评价这些实施方案中的生物标记谱。这种评价例如可以通过对受试者应用判定规则来进行。例如,判定规则可以基于从训练群体中的个体获得的生物标记谱来构建或者已经被构建。在一个实施方案中,训练群体包括:(a)患有SIRS、然后在观察期间被诊断为脓毒症的个体,以及(b)患有SIRS并且在观察期间不被诊断为脓毒症的个体。如果来自受试者的生物标记谱含有适当特征性的特征,则该受试者被诊断为更可能有机会发展为脓毒症、罹患脓毒症、或者处于脓毒症进展的特定阶段。各种个体群体,包括患有SIRS的个体(例如,SIRS阳性个体)或患有感染但未有SIRS的个体(例如,SIRS阴性个体)的群体,可以用作训练群体。因此,本发明允许临床医生区分未患SIRS的个体、患有SIRS但是在特定时间期限内可能不会发展成为脓毒症的个体、患有SIRS并且具有最终发展成为脓毒症的风险的个体、处于脓毒症进展特定阶段的个体。
5.10应用注释数据鉴定区别性生物标记
在一些实施方案中,数据分析算法鉴定一大组生物标记,这些生物标记的特征区分转变者和非转变者。例如,在一些实施方案中,对训练群体应用数据分析算法产生超过500种生物标记、超过1000种生物标记或超过10,000种生物标记选择。在一些实施方案中,期望进一步减少被认为是区别性的生物标记的数目。相应地,在一些实施方案中,利用与数据分析算法(例如,第5.5节的数据分析算法)互补的过滤规则进一步减少通过数据分析算法鉴定的区别性生物标记的列表。具体来说,对所测量的训练群体生物标记谱数据应用一种或多种数据分析算法鉴定出的生物标记的列表,可以对该列表应用基于注释数据的过滤规则来进一步精炼。在这些实施方案中,通过一种或多种数据分析算法鉴定的生物标记组中的生物标记,如果满足一种或多种所应用的基于注释数据的过滤规则,则保留在区别性生物标记组中。在一些实例中,通过一种或多种数据分析算法鉴定的生物标记组中的生物标记,如果不满足一种或多种所应用的基于注释数据的过滤规则,则从该组中除去。在其它一些实例中,对于一种或多种数据分析算法鉴定的生物标记组中的生物标记,在该组中保留那些不满足一种或多种应用的基于注释数据的过滤规则的生物标记,而从该组中除去那些满足一种或多种应用的基于注释数据的过滤规则的生物标记。这样,可以利用注释数据减少数据分析算法所鉴定的区别性生物标记组中的生物标记数。
基于注释数据的过滤规则是基于注释数据的规则。注释数据是指描述生物标记性质的任何类型的数据。注释数据的一个例子是鉴定给定生物标记所属的生物途径。注释数据的另一个例子是酶类别(例如磷酸二酯酶、激酶、金属蛋白酶等)。注释数据的其它实例包括但不限于蛋白质结构域信息、酶底物信息、酶促反应信息、和蛋白质相互作用数据。注释数据的另外一种实例是疾病相关性,换句话说,给定的生物标记与其该疾病过程相关或有影响。另外一种形式的注释数据是任何类型的以下数据,该数据将生物标记表达、生物标记丰度的其它形式和/或生物标记活性与细胞定位、组织型定位和/或细胞型定位相关联。
正如其名称所暗示的,注释数据用来构建基于注释数据的过滤规则。基于注释数据的过滤规则的一个例子是:
注释规则1:从训练组中除去所有转录因子。
将该过滤规则应用于一组生物标记,从该组中除去所有转录因子。
另外一种类型的基于注释数据的过滤规则是:
注释规则2:保留生物标记列表中的富含注释X的所有生物标记。
应用该过滤规则将只保留给定列表中那些富含(过表达)注释X的生物标记。为了更全面地理解该过滤规则,考虑一个示例性生物标记组,通过将数据分析算法(第5.5节)应用于用训练群体数据检测的生物标记谱而鉴定,该训练群体数据按照第5.4节所公开的技术检测。这个示例性的生物标记组含有500种生物标记。对于该说明性实例,假定人类中的全套生物标记由25,000种生物标记组成。在此,25,000种生物标记是一个群体,而500种生物标记组是样本。本文使用的术语“群体”由所有可观测的生物标记组成。术语“样本”是实际被考虑的数据。现在,对于该实例,设X=激酶。推测存在800种已知的人激酶,进一步推测对于激酶随机选择一组500种生物标记。在这些情况下,通过数据分析算法鉴定的500种生物标记的列表应当选择大约(500/25,000)*800=16种激酶。如果在一个样本中实际上存在50种激酶,则可以得出如下结论:相对于该群体,该样本中确实富含激酶。
更正式地,在该实例中,可以通过分析描述观察样本和群体的双向偶然性表来确定,相对于该群体,在通过数据分析算法鉴定的生物标记组(样本)中是否富含激酶:
Figure G2006800528730D02041
按照Agresti,1996,An Introduction to Categorical Data Analysis,John Wiley& Sons,New York,其在此通过引用全文引入,可以通过将每一行作为二项式自变量处理,来分析该双向偶然性表。在这种情况中,按比例的真实差异,称为π12,比较两行中的概率。该差异落入-1和+1之间。当π1=π2时,即,当在来自群体的样本中选择激酶不依赖于激酶注释时,它等于0。在群体中的N1=25,000种生物标记中,800种是激酶,比例p1=800/25,000=0.032。在使用数据分析算法鉴定的样本中的N2=500种生物标记中,50种是激酶,比例p2为50/500=0.10。该比例的样本差为0.032-0.10=-0.068。根据Agresti所述,当两行中的计数为独立的二项式样本时,估计的标准差p1-p2为:
其中N1和N2分别是群体的样本容量和通过数据分析算法选择的样本的样本容量。随着样本容量增大,标准差降低,因此π12的估计值提高。π12的大样本(100(1-α))%置信区间为:
(p1+p2)±za/2=z0.025=1.96
因此,对于该实例,估计的误差为:
0.032 ( 1 - 0.032 ) 25,000 + 0.10 ( 1 - 0.10 ) 500 = 0.013
真实差异的95%置信区间π12为-0.068±1.96(0.013)或-0.068±0.025。由于95%置信区间仅含有负值,可以得出如下结论:相对于25,000种生物标记的群体,样本(通过数据分析算法产生的生物标记组)中富含激酶。
除以上公开的方法外,上述实例中的双向偶然性表可以用其它本领域公知的方法来分析。例如,可以利用独立性卡方检验和/或Fisher精确检验来检验以下零假设:该双向偶然性表的行和列分类变量是独立的。
注释规则2中的术语“X”可以是任何形式的注释数据。在一个实施方案中,“X”是任何生物途径。因此基于注释数据的过滤规则具有以下形式。
注释规则3:
选择在生物标记列表中富含的任何生物途径中的所有生物标记。
为了确定是否富含特定作物途径,例如,使用上述双向偶然性表分析或本领域公知的其它技术,将样本中特定作物途径中的生物标记数与群体中特定作物途径中的生物标记数进行比较。如果样本中富含生物途径,则保留样本中该生物途径的所有其它生物标记,用基于注释数据的过滤规则作进一步分析。
给出了富含的一个例子,其中显示在整个95%置信区间上样本中的激酶比例大于群体中的激酶比例。在一个实施方案中,当通过双向偶然性表分析,在整个95%置信区间上样本中具有给定注释的生物标记的比例大于群体中具有该注释的生物标记的比例时,则认为相对于群体,在该样本中富含具有该注释的生物标记。在另一实施方案中,如果通过Fisher精确检验、卡方检验或相对算法确定p值为0.05或更小、0.005或更小、或0.0005或更小,则认为相对于群体,在该样本中富含具有给定注释的生物标记。
另一种形式的基于注释数据的过滤规则具有以下形式:
注释规则4:
选择生物途径X中的所有生物标记。
在一个实施方案中,使用数据分析算法确定一组生物标记。数据分析算法的例子在第5.5节公开。另外,第6节描述了某些也可以作为数据分析算法的检验。这些检测包括但不限于Wilcoxon检验和使用统计学显著性p值(例如,0.05或更小、0.04或更小等)的类似检验,和/或以下条件,即一个生物标记应显示从训练群体中转变者获得的生物样品和从非转变者获得的生物样品之间的平均差异丰度。在应用数据分析算法后,确定一组区分转变者和非转变者的生物标记。接下来,对这组区别性生物标记应用注释规则,例如注释规则4,以进一步减少这组生物标记。本领域技术人员应当理解,这些规则的应用顺序通常不是重要的。例如,可以首先应用注释规则4,然后应用某些数据分析算法,或者相反。在一些实施方案中,最终被认为可区分转变者和非转变者的生物标记满足以下标准:(i)使用静态(单时间点)数据,通过Wilcoxon调整检验确定,p值等于或小于0.05(p<0.05);(ii)使用静态(单时间点)数据,在训练组中转变者和非转变者之间的平均变化倍数等于或大于1.2;和(iii)存在于特定生物途径中。关于详细实施例参见下面第6.7节。在该实例中,不需要数据分析算法鉴定的这组生物标记中富含该途径的成员。此外,应当注意到标准(i)和(ii)是数据分析算法形式,而标准(iii)是基于注释数据的过滤规则。
在另一个实施方案中,一旦鉴定了区别性生物标记的列表,就可以利用这些生物标记确定与该区别性生物标记有关的特定生物途径的身份。在某些实施方案中,将基于注释数据的过滤规则应用于通过本发明的方法(例如第5.4、5.5、6节所述的方法)鉴定的区别性生物标记。这些基于注释数据的过滤规则鉴定数据分析算法所鉴定的区别性生物标记富含的一种或多种特定生物途径。在本发明的示例性实施方案中,利用可以从appsl.niaid.nih.gov/david/获得的DAVID 2.0软件来鉴定,并对数据分析算法鉴定的生物标记组应用基于注释数据的过滤规则,以鉴定富含于该组的途径。在一些实施方案中,选择富含的生物途径中的生物标记作为区别性生物标记,在本发明的试剂盒中使用。
在本发明的一些实施方案中,可以利用生物标记组(该生物标记组通过对包括转变者和非转变者的训练群体应用数据分析算法而确定)中富含的生物途径中的生物标记,作为过滤步骤来减少生物标记组中的生物标记数。在一种这样的方法中,例如,使用上文第5.4节和下文第6节所述的任一种或多种方法,获得来自训练群体中个体的生物样品。根据该实施方案,可以利用核酸阵列,如cDNA微阵列,通过检测已知或怀疑与所选生物途径有关的任一种或多种基因的表达,产生生物标记谱中生物标记的特征。然后可以利用上文第5.5节所述的任一种或多种分析算法分析cDNA微阵列得到的数据,以鉴定其特征可以区分转变者和非转变者的生物标记。这样可以鉴定其相应特征值能够区分(例如)转变者(即后来发展成为脓毒症的SIRS患者)和非转变者(即后来不发展成为脓毒症的SIRS患者)的生物标记,并且将其归为区别性生物标记。所富含的生物途径中的生物标记可以通过应用上述注释规则3从该组中选择。可以发现的代表性生物途径包括,例如,与Th1/Th2细胞分化途径有关的基因。在一个实施方案中,最终被认为可区分转变者和非转变者的生物标记满足以下标准:(i)通过Wilcoxon调整检验确定,p值等于或小于0.05(p<0.05);(ii)在训练组中转变者和非转变者之间的平均变化倍数等于或大于1.2;和(iii)存在于一个生物途径中,该生物途径富含于通过应用标准(i)和(ii)得出的生物标记组中。
在本发明的一些实施方案中,利用基于注释数据的过滤规则鉴定给定生物标记组中富含的生物途径。该生物标记组可以是,例如,通过对包括转变者和非转变者的训练数据应用数据分析算法而鉴定的一组生物标记。然后,使用本文公开的任何数据分析算法分析这些富含的生物途径中的生物标记,以鉴定可区分转变者和非转变者的生物标记。在一些例子中,富含的生物途径中的某些生物标记不属于最初给出的生物标记组中的生物标记。在一些例子中,富含的生物途径中的某些生物标记属于最初给出的生物标记组中的生物标记。在一些实施方案中,利用二次分析来采集富含的生物途径中的生物标记的特征数据,并且利用这些数据确定在富含的生物途径中的生物标记是否能够区分转变者和非转变者。
在一些实施方案中,鉴定目标生物途径中的生物标记。在一个实例中,鉴定与Th1/Th2细胞分化途径有关的基因。然后,利用本文公开的数据分析算法评价这些生物标记,以确定它们是否能区分转变者和非转变者。
6.实施例
征集收入ICU的SIRS阳性个体进行研究。受试者为18岁或年龄更大,并且取得知情同意,符合研究方案。在以下情况下从研究中排除个体,如果个体(i)怀孕,(ii)为治疗被怀疑的感染而服用抗生素,(iii)应用全身性皮质类固醇(在进入研究前48小时总剂量大于100mg氢化可的松或相当的量),(iv)具有脊髓损伤或其它需要高剂量皮质类固醇治疗的疾病,(v)是药理学免疫抑制的(例如,硫唑嘌呤、氨甲喋呤、环孢素、他克莫司、环磷酰胺、依那西普、阿那白滞素、英利昔单抗、leuflonamide、霉酚酸、OKT3、pentoxyphylin等),(vi)为器官移植受体,(vii)患有活动性或转移性癌症,(viii)在参加前8周内接受化学治疗或放射治疗,和/或(ix)在参加前30天内应用研究用药物。
在研究中,每天评价SIRS标准。收入ICU后进行APACHE II和SOFA评分。APACHE II是一种对医学疾病严重程度进行评价的***。APACHE代表“急性生理和慢性健康评价”,最常用来预测重症监护室中患者的院内健康。参见,例如,Gupta等,2004,Indian Journal of Medical Research 119,273-282,其在此通过引用全文引入。SOFA是一种检测脓毒症严重程度的检验。参见,例如,Vincent等,1996,Intensive Care Med.22,707-710,其在此通过引用全文引入。在长达两周的时间里,每天监测患者脓毒症的临床嫌疑,包括但不限于以下任何体征和症状:
·肺炎:体温>38.3℃或<36℃+白细胞计数(WBC)>12,000/mm3或<4,000/mm3+新出现浓痰+胸片上有新的或进展性的浸润(4个标准中的3个);
·创伤感染:体温>38.3℃或<36℃+疼痛+红斑+脓性排出物(4个标准中的3个);
·尿道感染:体温>38.3℃或WBC>12,000/mm3或<4,000/mm3+细菌尿和脓尿(>10WBC/hpf或阳性白细胞酯酶)(所有标准);
·line脓毒症:体温>38.3℃或<36℃+导管退出部位红斑/疼痛/化脓(4个标准中的3个,包括发热);
·腹内脓肿:体温>38.3℃或<36℃+WBC>12,000/mm3或<4,000/mm3+X线照片显示液体收集(3个标准中的2个);
·CNS感染:体温>38.3℃或<36℃+WBC>12,000/mm3或<4,000/mm3+通过LP或脑室引流的脑脊液细胞增多。
从开始研究后24小时内开始,最少连续4天每天抽血。监测患者,每天采血样,最多连续14天,除非临床怀疑感染。在最多14天研究的过程中任一个体的最大采血量不超过210mL。如果根据医生判断确定失血对患者造成风险,则中断用于研究的采血。每名患者每天采集两个Paxgene(RNA)试管。
从送入创伤中心或ICU的18岁以上的男女患者收集血样于PreAnalytiXPAXgeneTM血液收集管中。所有满足4种SIRS标准的两种的患者具有发展成为脓毒症的风险。每天取血样,最少4天且最多14天。因此,在送入ICU开始收集血浆样本,并且根据是否发展成为感染,将他们追溯性地分成脓毒症患者和SIRS患者。脓毒症样品代表脓毒症临床诊断之前的时间点并且与时间-匹配的未感染SIRS患者相比较。
蛋白质成谱实验分成两个独立的部分。第I部分检查血浆,利用电喷射离子陷阱质谱法(3D LC-MS/MS)三维LC分馏检查脓毒症和SIRS合并样本之间差异表达的蛋白质。在研究时间点“DOE(开始当天)”、T-60和T-12合并两轮(批量)血样。另一轮(批量)还包括来自T-36时间点的库,总共三个批量,每个用于脓毒症和SIRS。实验的第II部分也检查脓毒症和SIRS合并样本之间血浆的差异表达蛋白质。对于第II部分,对来自时间点T-12的库运行一轮LCMS/MS。
第I部分
来自25个SIRS和25个脓毒症患者的血浆样本(150μL)用于研究的该部分。从来自相同疾病状态(脓毒症或SIRS)的单个患者样品随机采取等量血浆(50μL)用于产生六个库(三个脓毒症批量和三个SIRS批量),每个包含总共20个单个样品。这些研究的目标为鉴定每个库数据集共有的蛋白质(这些蛋白质在脓毒症初期上调或下调),最终鉴定蛋白质生物标记。
免疫去除
血浆样本首先经免疫去除以除去大量蛋白质。合并的血浆样本利用Agilent Multiple Affinity Removal System(5185-5985,4.6mm×50mm,AgilentTechnologies)进行免疫去除。此免疫去除柱以亲和纯化的多克隆抗体技术为基础(Maccarone等,2004,Electrophoresis 25,2402-2412;Bjorhall等,2005,Proteomics 5,307-317;和Echan等,2005,Proteomics 5,3292-3303,每篇在此通过引用全文引入),包含六种类型的抗体以特异性地除去六种靶蛋白质:白蛋白、转铁蛋白、亲血球蛋白、抗-胰蛋白酶、IgG和IgA。该六种抗体定位在固体磁珠表面上并且通过FC(可结晶片段)区域化学交联,与以HPLC柱形式包装的物质形成稳定的、非-浸析的产物。
来自每个血浆样本的25μL等份用柱装载缓冲液A稀释5倍(AgilentTechnologies,#5185-5987)并且随后以12,000rpm离心十分钟。柱附着于毛细管HPLC泵并且用0.5mL/min流速的缓冲液A平衡10分钟。稀释的血浆样本随后上柱上并且该柱用0.25mL/min流速的缓冲液A洗涤。收集包含少量血浆蛋白质的第一个1.5mL穿过液(flow-through)。余下的蛋白质随后通过利用0.5mL/min流速的缓冲液B(Agilent Technologies#5185-5988)洗脱七分钟除去。余下的蛋白质通过2D-Gel检查并且除了这六种结合蛋白质没发现其它的蛋白质(Maccarone等,2004,Electrophoresis 25,2402-2412;和Echan等,2005,Proteomics 5,3292-3303)。该柱被存储或重新使用。通过考马斯蛋白质分析试剂盒(Pierce#23200)测定免疫去除前后样品的蛋白质浓度以验证该蛋白质去除方法。最后确定在免疫去除后,大约85%的总蛋白质从最初的血样被除去。
蛋白质酶切消化
对于每个合并的血浆样本,收集来自免疫去除柱的2mg蛋白质等份。蛋白质通过Vacufuge(eppendorf)浓缩至0.25mL(4mg/mL蛋白质)并且在8M尿素(ACROS)中变性10分钟。蛋白质分别利用5mM DL-二硫苏糖醇(Sigma)和10mM碘乙酰胺(Sigma)在37℃还原并且烷基化30分钟。样品随后利用100mM碳酸氢铵(Fluka)稀释4倍至2M尿素终浓度。蛋白质用胰蛋白酶(Promega)以1∶50的比例(w/w)消化过夜并且随后在相同的条件下用第二种胰蛋白酶酶切消化。用考马斯蛋白质分析试剂盒检验蛋白质的酶切消化效率。
三维色谱法和样品装载
利用该方法,基于疏水性通过第一个反相柱(RP1)预分馏肽混合物,且随后基于肽离子强度,通过SCX柱进一步分馏每种组分。在第二个反相柱(RP2)上通过由第一个反相(RP1)分馏梯度确定的浅反相梯度进行最终的高分辨率分离。
从每种合并的样本收集大约2mg经消化的蛋白质,并且随后使用直接连接了Agilent 1100纳泵和微型自动进样器的Agilent 1100陷阱***对0.5mg进行3-D LC-MS/MS分析。利用内部构建的压力传感器,5μm的Zorbax SB-C18填充材料(Agilent Technologies)填充入500μm ID 1/32 OD PEEK桶(UpchurchScientific)。切掉10cm区段以形成第一个维度RP柱(RP1)。用5μm的PolySulfoethyl(Western Analytic Production)填充材料填充类似的柱(500μm,ID,4cm长)作为SCX柱。长4cm并且250μm ID的第二个C18柱用作陷阱柱。零无用容积的1μm过滤器(Upchurch,M548)附着于每个柱的出口用于柱填充和连接。用5μm的Zorbax SB-C18填充材料(Agilent Technologies)填充熔融硅毛细管(100μm ID,360μM OD,20cm长)作为分析柱(RP2)。利用SutterP-2000激光牵拉仪(Sutter Instrument Company,Novato,California,USA),将熔融硅管的一端拉成ID小于5μm的尖端。利用相同的内部压力传感器将肽混合物装载在第一个C18柱(RP1)上。为了避免样品残留,每种样品用一套新的4个柱。为了维持良好可再现性以定量,在每个3D实验中,上述4个柱的每一个填充至准确的相同长度。该3-维LC分离由内部构建的两个HPLC泵、4个微-和纳-流LC柱以及开关阀一起组成。每种经消化的蛋白质样品的1mg等份装载在第一维度反相(RP)柱上,用于每一个分析。多达5种RP组分和多达8种强阳离子交换(SCX)组分从该装载柱连续洗脱到用于高分辨率肽分离的分析柱。相同批次内的样品所有分馏和分离方法都相同。每种组分的运行时间为约2.5小时且每种样品的总运行时间为约3天。阳性方式中应用200-2000m/z的扫描范围。
利用Spectrum Mill MS Proteomics工作台(2.7版软件,Agilent Technologies)分析光谱。产生超过一千万个光谱并且利用Agilent Technologies SpectrumMillXtractor鉴定峰值。在所有运行中,将总光谱数标准化,并且除去具有1或更小序列标签长度的条目。剩下的MS/MS光谱在国家生物技术信息中心(NCBI)限于人分类学的非冗余蛋白质数据库(NCBI-nr人11/06/2003,97027序列)中查找。酶参数限于具有最多2个错误切割的所有胰蛋白酶肽。所有其它的查找参数设为SpectrumMill的设置默认值(半胱氨酸的脲基甲基化、前体离子的+/-2.5道尔顿耐受性、片段离子的+/-0.7道尔顿耐受性、以及50%的最低的匹配峰强度)。
通过对组合的正-反相数据库(NCBI-nr人11/06/2003,97027序列,Peng,2003J.Proteome Res.2,43-50)查找一个3D数据集而评估假阳性率。自动验证共4294种光谱和107种蛋白质。其中,16种光谱和12种蛋白质来自反相数据库。因此过滤标准的假阳性率为0.75/%光谱和22%蛋白质。具有至少2个特有肽的蛋白质假阳性率为0.19/%光谱和2.8%蛋白质。仅选择具有至少2个特有肽的蛋白质用于相对定量分析。
SpectrumMill将具有相同组或亚组的特有肽的蛋白质归组在一起,以最小化蛋白质冗余。SpectrumMill中报告的鉴定的蛋白质数目为该数据库中鉴定的“蛋白质组”的数目而不是鉴定的蛋白质序列的数目。光谱计数用于相对的蛋白质定量。来自每种蛋白质的有效MS/MS光谱数被标准化成每个数据集的总MS/MS光谱数。样品被分成两个患者组,SIRS和脓毒症。Z-检验用于统计分析。计算2个组之间每个蛋白质的Z-得分(Δ/stdev),具有2以上Z-得分的蛋白质被认为是生物标记候选者。候选列表通过相对标准偏差(<100%)、绝对的MS/MS光谱数目(>=10)、特有的肽数目(>=2)和人工检查进一步筛选,以除去明显错误的命中者如角蛋白。
从所有这三个库中,Spectrum Mill Workbench output产生2,810种蛋白质条目。所有库和条目中,总光谱数被标准化,具有小于13的不同总标签得分。利用国家健康研究所(National Institute of Health)的基因2登陆表,交叉引用每个命中者的Genbank登录号与其相应的Entrez Gene ID。只有具有基因ID的蛋白质用于进一步分析(484个余下条目)。利用标准化的总光谱数计算脓毒症对SIRS的比例。当SIRS>脓毒症,则该比例利用1/(脓毒症/SIRS)计算。如果任一数目为零,则不能计算比例,该值视情况标记为SEPSIS+或SIRS+。对每一轮计算跨越时间点的数值范围,并且如果其具有>1.5的范围或在任何时间点包含SEPSIS+或SIRS+,则算入该蛋白质条目。这样留下151个余下的条目,组成下表1中鉴定的103个特有基因ID。
表1:区分脓毒症和Sirs的生物标记
  基因符号   基因名称   基因登录号   蛋白质登录号
  列1   列2   列3   列4
  SERPINA3   丝氨酸(或半胱氨酸)蛋白酶抑制因子,A亚型(α-1抗蛋白酶,抗胰蛋白酶),成员3   NM_001085   NP_001076
  ACTB   肌动蛋白,β   NM_001101   AAS79319
  AFM   Afamin   NM_001133   AAA21612
  AGT   血管紧张素原(丝氨酸(或半胱氨酸)蛋白酶抑制因子,A亚型(α-1抗蛋白酶,抗胰蛋白酶),成员8)   NM_000029   AAR03501
  AHSG   α-2-HS-糖蛋白   NM_001622   NP_001613
  AMBP   α-1-微球蛋白/bikunin前体   NM_001633   NP_001624
  APOF   载脂蛋白F   NM_001638   AAA65642
  APOA1   载脂蛋白A-I   NM_000039   AAD34604
  APOA2   载脂蛋白A-II   NM_001643   AAA51701
  APOA4   载脂蛋白A-IV   NM_000482   AAS68228
  APOB   载脂蛋白B(包括Ag(x)抗原)   NM_000384   AAP72970
  APOC1   载脂蛋白C-I   NM_001645   AAQ91813
  APOC3   载脂蛋白C-III   BC027977   AAB59372
  APOE   载脂蛋白E   NM_000041   AAB59397
  APOH   载脂蛋白H(β-2-糖蛋白I)   NM_000042   CAA40977
  SERPINC1   丝氨酸(或半胱氨酸)蛋白酶抑制因子,C亚型(抗凝血酶),成员1;抗凝血酶-III前体(ATIII)   NM_000488X68793   CAI19423P01008
  AZGP1   α-2-糖蛋白1,锌   NM_001185   NP_001176
  BF   B-因子,裂解素   NM_001710   CAI17456
  SERPING1   丝氨酸(或半胱氨酸)蛋白酶抑制因子,G亚型(C1抑制剂),成员1,(血管性水肿,遗传性的)   NM_000062;BC011171   AAW69393
  C1QB   补体成分1,q亚组分,β多肽   NM_000491   NP_000482
  C1S   补体成分1,s亚组分   NM_201442;NM_001734   NP_958850
  C2   补体成分2   NM_000063   CAI17451
  C3   补体成分3   NM_000064   AAR89906
  C4BPA   补体成分4结合蛋白,α   NM_001017367   CAH70782
  C5   补体成分5   NM_001736   NP_001726
  C8A   补体成分8,α多肽   NM_000562   CAI19172
  C8G   补体成分8,γ多肽   NM_000606   NP_000597
  C9   补体成分9   NM_001737   NP_001728
  SERPINA6   丝氨酸(或半胱氨酸)蛋白酶抑制因子,A亚型(α-1抗蛋白酶,抗胰蛋白酶),成员6   NM_001756   NP_001002236NP_000286
  CD14   CD 14抗原   NM_000591   AAP35995
  CLU   聚集素(补体裂解抑制剂,SP-40,40,硫化糖蛋白2,***-抑制的***信使2,载脂蛋白J)   NM_001831   AAP88927
  CP   血清铜蓝蛋白(铁氧化酶)   NM_000096   NP_000087
  CRP   C-反应蛋白   NM_000567   NP_000558
  CSK   c-src酪氨酸激酶   NM_004383   NP_004374
  F2   凝固因子II(凝血酶)   NM_000506   AAL77436
  F9   凝固因子IX(血浆促凝血成分,Christmas疾病,血友病B)   NM_000133   NP_000124
  FGA   纤维蛋白原α链   BC070246   BAC55116
  FGB   纤维蛋白原β链   NM_005141   AAA18024
  FGG   纤维蛋白原γ链   NM_000509   AAB59531
  FLNA   细丝蛋白A,α(肌动蛋白结合蛋白280)   NM_001456   CAI43227
  FN1   纤连蛋白1   BT006856   BAD52437
  GC   基团-特异性成分(维生素D结合蛋白)   NM_000583   NP_000574
  GSN   凝溶胶蛋白(淀粉样变性病,Finnish型)   BC026033   CAI14413
  HBB   血色素,β   NM_000518   AAD19696
  SERPIND1   丝氨酸(或半胱氨酸)蛋白酶抑制因子,D亚型(肝素辅因子),成员1   NM_000185   CAG30459
  HP   亲血球蛋白   BC107587   NP_005134
  HPX   血红素结合蛋白   NM_000613   NP_000604
  HRG   组氨酸-富集的糖蛋白   NM_000412   NP_000403
  IF   因子I(补体)   NM_000204   NP_000195
  IGFALS   ***结合蛋白,酸不稳定亚基   NM_004970   NP_004961
  ITGA1   整联蛋白,α1   NM_181501   NP_852478
  ITIH1   内-α(球蛋白)抑制剂H1   BC109115   NP_002206NP_032432
  ITIH2   内-α(球蛋白)抑制剂H2   NM_002216   NP_002207
  ITIH4   内-α(球蛋白)抑制剂H4(血浆激肽释放酶-敏感的糖蛋白)   NM_002218   NP_002209
  KLKB1   激肽释放酶B,血浆(Fletcher因子)1   NM_000892   NP_000883
  KNG1   激肽原1   NM_000893   NP_000884
  KRT1   角蛋白1(表皮松解性角化过度症)   BC063697   NP_000412
  LGALS3BP   植物凝集素,半乳糖苷-结合、可溶的3结合蛋白   NM_005567BC015761BC002403BC002998   NP_005558
  LPA   脂蛋白,Lp(a)   NM_005577   NP_005568
  MLL   脊髓/淋巴或混合-谱系的白血病(三胸同系物,果蝇)   NM_005934   NP_005924
  MRC1   甘露糖受体,C型1   NM_002438   NP_002429
  MYL2   肌球蛋白,轻多肽2,调控的、强心的、减缓   NM_000432   AAH31006
  MYO6   肌球蛋白VI   NM_004999   NP_004990
  ORM1   orosomucoid 1   NM_000607   CAI16859
  SERPINF1   丝氨酸(或半胱氨酸)蛋白酶抑制因子,F亚型(α-2抗血纤维蛋白酶,色素上皮来源的因子),成员1   NM_002615BC013984   AAH13984
  SERPINA1   丝氨酸(或半胱氨酸)蛋白酶抑制因子,A亚型(α-1抗蛋白酶,抗胰蛋白酶),成员1   BC015642NM_000295   NP_001002235NP_000286
  SERPINA4   丝氨酸(或半胱氨酸)蛋白酶抑制因子,A亚型(α-1抗蛋白酶,抗胰蛋白酶),成员4   NM_006215   NP_006206
  SERPINF2   丝氨酸(或半胱氨酸)蛋白酶抑制因子,F亚型(α-2抗血纤维蛋白酶,色素上皮来源的因子),成员2   BC031592   NP_000925
  PROS1   蛋白质S(α)   NM_000313   NP_000304
  QSCN6   静止素Q6   NM_002826   AAQ89300
  RGS4   G蛋白信号4调节剂   NM_005613   NP_005604
  SAA1   血清淀粉样蛋白A1   BC105796   AAA64799AAA30968
  SAA4   血清淀粉样蛋白A4,组成型/血清淀粉样蛋白A-4蛋白质前体(组成型表达的血清淀粉样蛋白A)(C-SAA)   NM_006512PQ5067   NP_006503
  SERPINA7   丝氨酸(或半胱氨酸)蛋白酶抑制因子,A亚型(α-1抗蛋白酶,抗胰蛋白酶),成员7   NM_000354   CAB06092
  TF   转铁蛋白   NM_001063   NP_001054
  TFRC   转铁蛋白受体(p90,CD71)   NM_003234   NP_003225
  TTN   肌联蛋白   BC013396   CAD12456
  TTR   转甲状腺蛋白(前清蛋白,淀粉样变性病型I)   NM_000371   AAH05310AAP35853
  UBC   泛素C   NM_021009   NP_066289
  VTN   玻连蛋白(血清扩散因子,促生长因子B,补体S-蛋白)   NM_000638   P04004
  VWF   冯·威利布兰德因子   NM_000552   AAB59458
  ALMS1   Alstrom综合症1   NM_015120   NP_055935
  ATRN   Attractin   BC101705NM_139321   CAI22615
  APOL1   载脂蛋白L,1   BC017331NM_003661   AAK20210
  TRIP11   甲状腺激素受体相互作用因子11   NM_004239   NP_004230
  PDCD11   细胞程序性死亡11   NM_014976   NP_055791
  KIAA0433   -   AB007893   BAA24863
  SERPINA10   丝氨酸(或半胱氨酸)蛋白酶抑制因子,A亚型(α-1抗蛋白酶,抗胰蛋白酶),成员10   NM_016186   NP_057270
  BCOR   BCL6其-阻遏物   BC063536   AAG41429
  C10orf18   染色体10可读框18   BC001759   CAI13368
  YY1AP1   YY1关联蛋白1   BC044887BC014906   AAL75971CAH71646
  FLJ10006   -   BC110537BC110536   AAH17012
  BDP1   B双向引物1,RNA聚合酶III转录起始因子IIIB的亚基   NM_018429   AAH32146
  SMARCAD1   染色质的SWI/SNF-相关的、基质-关联肌动蛋白依赖性调节剂亚家族a,包含DEAD/H框1   NM_020159   NP_064544
  MKL2   MKL/myocardin样2   NM_014048   AAH47761
  CHST8   糖类(N-乙酰半乳糖胺4-0)磺基转移酶8   NM_022467BC018723   NP_071912
  MCPH1   小头畸形的最初的常染色体隐性性状1   NM_024596BC030702   AAH30702
  MYO18B   肌球蛋白XVIIIB   NM_032608   NP_115997
  MICAL-L1   -   NM_033386   AAH82243
  PGLYRP2   肽聚糖识别蛋白2   NM_052890   Q96PD5
  LRG1   亮氨酸富集的α-2-糖蛋白1   NM_052972   AAH70198
  KCTD7   包含7的钾通道四聚体结构域   NM_153033   NP_694578
  MGC27165 -   BC087841BC005951   AAH87841
该103种蛋白质(Entrez Gene ID)上载于DAVID 2.1(用于注释、显现和整合发现的数据库,Dennis等,2003,Genome Biol.4:P3)。所有103种基因通过DAVID识别。数据中包含的标准途径通过选择来自Biocarta和KEGG途径的输出而检查。如下表2中阐述的,其包括含有来自103种的列表的至少两个基因并且具有概率得分(p-值)≤0.1的任何途径。表2中,“计数”是来自存在于表1中的具体途径的蛋白质数目,而“百分比”是上述计数除以该途径中给定数据库中总蛋白质的数目。该数据指示补体和凝集***的参与。
表2:与脓毒症和Sirs有关的途径
  分类***   术语   计数   百分比   P值
  KEGG_PATHWAY   补体和凝集级联   25   24   2.25E-33
  BIOCARTA   内在的凝血酶原活化途径   8   7   5.81E-09
  BIOCARTA   补体途径   7   6   1.04E-06
  BIOCARTA   经典补体途径   6   5   2.70E-06
  BIOCARTA   替代补体途径   5   4   2.86E-05
  BIOCARTA   植物凝集素诱发的补体途径   5   4   8.36E-05
  BIOCARTA   外来的凝血酶原活化途径   4   3   8.54E-04
  BIOCARTA   急性心肌梗塞   4   3   1.44E-03
  KEGGJPATHWAY   肌动蛋白细胞骨架的调控   8   7   8.59E-03
  KEGG_PATHWAY   病灶粘附   7   6   4.48E-02
  KEGG_PATHWAY   ECM-受体相互作用   4   3   7.31E-02
另外,通过输出任何“过表达”基因的本体类别,来检验表1中所述数据集内在的分子功能和生物过程。该数据中过表达的基因本体类别在下表3中阐述。在表2的情况下,“计数”是表1中的具体途径的蛋白质数目,而“百分比”是该计数(如此处限定的)/来自该数据库中该途径的总蛋白质数。与途径输出类似,补体和凝集活性在该数据集高度表达。存在于表3的数据的主要主题为免疫***活性。另外,脂类运输(载脂蛋白)为功能性的过程,可能证实该过程在区分脓毒症和SIRS中是重要的。
表3:表1中被过表达的基因本体类别。
  术语   计数   百分比   P值
 急性-期应答   18   17   5.07E-28
 对害虫、病原体或寄生虫的应答   34   33   5.70E-26
 补体激活   14   13   9.01E-20
 血液凝固   16   15   1.13E-17
 丝氨酸型肽链内切酶抑制剂活性   16   15   1.52E-17
 伤口愈合   16   15   2.96E-17
 脂类运输   12   11   1.76E-13
 体液免疫应答   14   13   2.56E-11
 免疫应答   39   37   4.73E-11
 体液防御机制(Sensu脊椎动物门)   12   11   1.61E-10
 炎症应答   12   11   3.87E-08
对本体进行筛选至仅包括具有水平5区分(最特异的基因本体)并且大于输入基因列表(表1)的10%的那些。仅引入来自分子功能或生物过程的本体。参见网址geneontology.org。通过DAVID鉴定的标准途径在表2中显示。该数据集中每个途径都是过表达的,暗示其包含比偶然预期更多的来自该数据的蛋白质。结果表明显著地集中在补体和凝集级联,已知其在脓毒症中作为重要部分。
补体途径由超过三十种血浆蛋白质的复合物系列组成,其为免疫应答的一部分,提供对感染的关键防卫。图2显示补体级联中来自该研究的鉴定的蛋白质。补体***的活化裂解细菌细胞,形成趋化肽(C3a和C5a),其吸引免疫细胞并且提高感染细胞的吞噬性清除。另外,补体途径可导致血管壁渗透性的提高以及炎症。大多数补体蛋白质以无活性的前体存在于血浆中,前体在蛋白水解级联中相互裂解和活化最终形成膜攻击复合物(MAC),其引起细胞裂解。MAC的形成可在蛋白水解级联开始时通过三种不同但共有其大部分组分的途径活化:经典途径、替代途径和膜攻击途径。这里,讨论经典途径和替代途径。经典途径通过结合细胞表面的抗体识别外来细胞而活化。该数据中,蛋白质C1S和C2是该途径特有的。在替代途径中通过C3转换酶从C3自活化而触发蛋白质水解。在此处呈现的数据中发现补体因子-B(蛋白质BF,裂解素),并且其是替代活化途径特有的。另外该研究中在血样中发现的蛋白质C3、C5、C8和C9为所有补体激活方法所共有。
凝集活化是急性炎症应答的标准组成,并且凝集紊乱在脓毒症中常见。组织因子产物增加并且导致内在和外来的凝血酶原活化途径均被活化。该研究中,数据有力地表明内在凝血酶原活化途径的参与(图3)。简单地说,血液凝集或凝固在三个基本时期发生。第一为凝血酶原活化复合物的活化,随后为凝血酶原活化的第二阶段。第三阶段由于纤维蛋白原被活化的凝血酶裂解而形成凝块。凝血酶原活化复合物由两种途径形成,每种产生不同形式的凝血酶原活化剂。凝血酶原活化剂形成的内在机制从对血液的创伤或受损血管壁中血液暴露至胶原开始。虽然外来途径是通过DAVID来确定的,由于相互重叠的蛋白质PROS、SERPINC1、凝血酶和纤维蛋白原,其看来被包括了。该数据还包括SERPING1、KNG、KLKB1和F9,其全部唯一地参与内在凝血酶原活化途径特异的凝血酶原活化复合物的形成。涵盖补体和凝血的表3中所含的基因本体还进一步支持这些途径在区别脓毒症和SIRS样品中的作用。如表4中举例说明的,利用这些标准,所有三个批量中来自脓毒症患者的血浆中七种蛋白质呈现共同的增加,而三种蛋白质(其中前体和终产物被算作一个生物标记)呈现共同的降低。
表4:与SIRS患者相比,脓毒症患者血浆中蛋白质的上调和下调。
Figure G2006800528730D02221
Figure G2006800528730D02231
通过随机分析无免疫去除的样二次来调查非特异性蛋白质与免疫去除柱结合的可能性(可引起较低丰度蛋白质的损失)。甚至在无免疫去除时,这十种蛋白质仍然被鉴定为有力的生物标记候选者。
利用DAVID对数据进行询问显示出补体和凝集途径过表达,提示其可能在区分脓毒症和SIRS中起重要作用。这些发现得到一些在这里鉴定的蛋白质的支持。表4中许多蛋白质已知为急性期蛋白质(C反应蛋白、纤溶酶原和血清淀粉样蛋白P),参与补体途径(补体成分C4)、凝集途径(抗凝血酶)或两者都参与(血浆蛋白酶C1抑制剂)或脂类运输(载脂蛋白)。已报道部分这些蛋白质水平的改变与SIRS和脓毒症有关(Mesters,1996,Mannucci等,Blood 88,881-886(抗凝血酶-III);Nakae等,1996,Surg Today 26,225-229(补体成分C3和补体成分C4);Chenaud等,2004,Crit.Care Med.32,632-637(ApoA1);Roemish等,2002,Blood Coagul.Fibrinolysis 13,657-670(抗凝血酶III);和Sierra等,2004,Intensive Care Med.30,2038-2045(C反应蛋白),每篇在此通过引用全文引入),因为已经了解补体和凝集途径都被活化(Mesters等,1996,Blood 88,881-886;Haeney 1998,J.Antimicrob Chemother.41,Suppl A:41-6;Wheeler等,1999,N.Engl J.Med.340,207-214;和Aird,2005,Crit.Care Clin 21,417-431,每篇在此通过引用引入)。
脓毒症为复杂的疾病,常见于特别危重的患者,仍然没有真正对其有效的早期诊断或治疗策略。该病可以在几天内迅速发展,并且有相当高的发病率和死亡率。血浆代表一种已被证明可以用于了解引起该病的生化级联复杂相互作用和进一步鉴定用于疾病诊断的生物标记。上述实验数据提供了免疫去除、3D LC分离和MS/MS分析的独特组合,以提供对围绕脓毒症发作的相互作用和其中可能的蛋白质生物标记鉴定的一些重要理解。该平台允许除去高丰度蛋白质,并从而检测之前受抑制的低丰度蛋白质。随后利用内置的开发的高分辨率分离的分析和串联质谱分析,能够检测~3000种较低丰度的血浆蛋白质以及最后观察这十种可能的脓毒症生物标记(其中前体和终产物算作单个生物标记),其中在来自SIRS患者的血浆中观察到七种蛋白质包括参与脂类运输的蛋白质的下调和三种蛋白质的上调。
第II部分
用于第II部分的方法根据以上表I的内容稍作改变,其中仅分析T-12小时时间点的单组合并的样本。程序上的差别为利用LC/MS-MS(不是LC3)分析样品并且在分析之前样品不进行免疫去除。因此,实验的第II部分也检查脓毒症和SIRS合并样本之间血浆的差异表达蛋白质。对时间点T-12的库进行单轮LCMS/MS。也利用Spectrum Mill Workbench软件分析数据。最终的输出报告包含具有不同的总标签得分>13的所有142个条目。将该数据标准化至第I部分所用的相同的等级。每个条目利用Uniprot ID鉴定,利用来自InternationalProtein Index的数据与其合适的Entrez Gene ID互相参照,且利用来自NCBI的数据注释。包括可与Entrez基因ID关联的条目。如第I部分那样计算比值数据。由于仅检查单个时间点,不可能随时间计算比例范围。当比例>1.5或为SEPSIS+或SIRS+时包括该条目。这剩下了代表下表5中的93个特有基因的93个剩余条目。
表5:区分脓毒症和Sirs的生物标记
  基因符号  基因名称   基因登录号   蛋白质登录号
  列1  列2   列3   列4
  A1BG  α-1-B糖蛋白   NM_130786   NP_570602
  A2M  α-2-巨球蛋白   NM_000014   AAT02228
  ABLIM1  肌动蛋白结合LIM蛋白1   NM_002313   CAI10910
  ACTA1  肌动蛋白,α1,骨骼肌   NM_001100   CAI19052
  AGT   血管紧张素原(丝氨酸(或半胱氨酸)蛋白酶抑制因子,A亚型(α-1抗蛋白酶,抗胰蛋白酶),成员8)   NM_000029   AAR03501
  AHSG   α-2-HS-糖蛋白   NM_001622   NP_001613
  ANK3   锚蛋白3,郎飞氏结(锚蛋白G)   NM_020987   CAI40519
  APCS   淀粉样蛋白P成分,血清   BT006750   CAH73651
  APOA1   载脂蛋白A-I   NM_000039   AAD34604
  APOA4   载脂蛋白A-IV   NM_000482   AAS68228
  APOB   载脂蛋白B(包括Ag(x)抗原)   NM_000384   AAP72970
  APOC3   载脂蛋白C-III   BC027977   AAB59372
  APOL1   载脂蛋白L,1   BC017331NM_003661   AAK20210
  AZGP1   α-2-糖蛋白1,锌   NM_001185   NP_001176
  B2M   β-2-微球蛋白   NM_004048   AAA51811
  BF   B-因子,裂解素   NM_001710   CAI17456
  C1R   补体成分1,r亚组分   NM_001733   NP_001724
  C1S   补体成分1,s亚组分   NM_201442;NM_001734   NP_958850NP_001725
  C2   补体成分2   NM_000063   CAI17451
  C4B   补体成分4B   NM_000592   AAR89095
  C5   补体成分5   NM_001736   NP_001726
  C6   补体成分6   NM_000065   BAD02322
  C7   补体成分7   NM_000587   CAA72407
  C8A   补体成分8,α多肽   NM_000562   CAI19172
  C8B   补体成分8,β多肽   NM_000066   CAC18532
  CDK5RAP2   CDK5调节亚基关联蛋白2   NM_018249   CAI40927
  CHGB   嗜铬粒蛋白B(分泌颗粒素1)   NM_001819   CAB55272
  CLU   聚集素(补体裂解抑制剂,SP-40,40,硫化糖蛋白2,***-抑制的***信使2,载脂蛋白J)   NM_001831   AAP88927
  COMP   软骨寡聚基质蛋白   NM_000095   AAC83643
  CORO1A   冠蛋白,肌动蛋白结合蛋白,1A   NM_007074   NP_009005
  CPN1   羧肽酶N,多肽1,50kD   NM_001308   NP_001299
  CUL1   cullin 1   NM_003592   NP_003583
  DET1   去黄化同系物1(Arabidopsis)   NM_017996   NP_060466
  DSC1   桥粒芯胶蛋白1   BC109161   NP_060466
  F13A1   凝固因子XIII,A1多肽   NM_000129   CAC36886
  F2   凝固因子II(凝血酶)   NM_000506   AAL77436
  F5   凝固因子V(促凝血球蛋白原,不稳定因子)   NM_000130   CAI23065CAB 16748
  FGB   纤维蛋白原β链   NM_005141   AAA18024
  GOLGA1   高尔基体自体抗原,高尔基体亚家族a,1   NM_002077   CAI39632
  GSN   凝溶胶蛋白(淀粉样变性病,Finnish型)   BC026033   CAI14413
  HBA1   血色素,α1   NM_000558   AA022464
  HBB   血色素,β   NM_000518   AAD19696
  HP   亲血球蛋白   BC107587   NP_005134
  HPX   血红素结合蛋白   NM_000613   NP_000604
  HSPA5   热休克70kD蛋白5(葡萄糖-调节蛋白,78kD)   NM_005347   NP_005338
  HUNK   激素上调的Neu-关联激酶   NM_014586   NP_055401
  IGFBP5   ***结合蛋白5   NM_000599   NP_000590
  IGHG1   免疫球蛋白重恒定γ1(Glm标记)   BC092518   CAC20454
  IGLV4-3   免疫球蛋白λ可变4-3   BC020236   AAH20236
  KIF5C   驱动蛋白家族成员5C   NM_004984   AAH17298
  KNG1   激肽原1   NM_000893   NP_000884
  KRT1   角蛋白1(表皮松解性角化过度症)   BC063697   NP_000412
  KRT10   角蛋白10(表皮松解性角化过度症;掌跖角化症)   NM_000421   NP_000412
  KRT9   角蛋白9(表皮松解性角化过度症;掌跖角皮病))   NM_000226   NP_000217
  LBP   脂多糖结合蛋白   AF_105067   AAC39547
  LGALS3BP   植物凝集素,半乳糖苷-结合、可溶的3结合蛋白   NM_005567BC015761BC002403BC002998   NP_005558
  LRG1   亮氨酸-富集的α-2-糖蛋白1   NM_052972   AAH70198
  LUM   光蛋白聚糖   BC035997   AAP35353
  MMP14   基质金属蛋白酶14(膜-嵌入的)   NM_004995   AAV40837
  MYH4   肌球蛋白,重多肽4,骨骼肌   NM_017533   NP_060003
  NEB   伴肌动蛋白   NM_004543   NP_004534
  NUCB2   核酸结合蛋白2   NM_005013   NP_005004
  ORM2   α-酸性糖蛋白2   NM_000608   NP_000599
  PF4V1   血小板因子4变体1   NM_002620   NP_002611
  PIGR   聚合免疫球蛋白受体   NM_002644   CAC10060
  PLG   纤溶酶原   NM_000301   AAH60513
  PON1   对氧磷酶1   NM_000446   NP_000437
  PPBP   原血小板碱性蛋白(趋化因子(C-X-C基序)配体7)   NM_002704   CAG33086
  RBP4   视黄醇结合蛋白4,血浆   NM_006744   CAH72328
  RIMS1   调节突触膜胞吐作用1   NM_014989   NP_055804
  RNF6   环指蛋白(C3H2C3型)6   NM_005977   CAH73183
  SAA1   血清淀粉样蛋白A1   BC105796   AAA64799AAA30968
  SEMA3D   sema结构域,免疫球蛋白结构域(Ig),短的基本结构域,分泌型,(semaphorin)3D   NM_152754   EAL24184
  SERPINA1   丝氨酸(或半胱氨酸)蛋白酶抑制因子,A亚型(α-1抗蛋白酶,抗胰蛋白酶),成员1   BC015642NM_000295   NP_001002235NP_000286
  SERPIND 1   丝氨酸(或半胱氨酸)蛋白酶抑制因子,D亚型(肝素辅因子),成员1   NM_000185   CAG30459
  SERPINF2   丝氨酸(或半胱氨酸)蛋白酶抑制因子,F亚型(α-2抗血纤维蛋白酶,色素上皮来源的因子),成员2   BC031592   NP_000925
  SERPING1   丝氨酸(或半胱氨酸)蛋白酶抑制因子,G亚型(CI抑制剂),成员1,(血管性水肿,遗传性的)   NM_000062;BC011171   AAW69393
  SF3B1   剪接因子3b,亚基1,155kD   NM_012433   NP_006833
  SPINK 1   丝氨酸蛋白酶抑制剂,Kazal型1   NM_003122   NP_003113
  SPP1   分泌型磷蛋白1(骨桥蛋白,骨骼唾液蛋白I,早期T-淋巴细胞活化1)   NM_000582   AAH17387
  SPTB   收缩蛋白,β,红细胞的(包括球形红细胞症,临床型I)   NM_001024858   BAD92652
  SYNE1   包含重复区的收缩蛋白,核膜1   NM_182961   AAH39121
  TAF4B   TAF4b RNA聚合酶II,TATA框结合蛋白(TBP)-关联因子,105kD   NM_003187   XP_290809
  TBC1D1   TBC1(tre-2/USP6、BUB2、cdcl6)结构域家族,成员1   NM_015173   NPJ355988
  TLN1   踝蛋白1   NM_006289   NP_006280
  TMSB4X   胸腺素,β4,X-连接的   NM_021109   NP_066932
  TRIP11   甲状腺激素受体相互作用因子11   NM_004239   NP_004230
  TTR   转甲状腺蛋白(前清蛋白,淀粉样变性病型I)   NM_000371   AAH05310AAP35853
  UROC1   尿硝酸酶结构域包含1   NM_144639   NP_653240
  VTN   玻连蛋白(血清扩散因子,促生长因子B,补体S-蛋白)   NM_000638   P04004
  VWF   冯·威利布兰德因子   NM_000552   AAB59458
  ZFHX2   锌指间源异型框2   NM_033400   NP_207646
  ZYX   Zyxin   NM_003461   NP_001010972
本发明的实施方案由表1和表5中都存在的生物标记组成,其列于以下表6中。
表6:表1和5中都存在的生物标记
  基因符号   基因名称  基因登录号   蛋白质登录号
  列1   列2  列3   列4
  AGT   血管紧张素原(丝氨酸(或半胱氨酸)蛋白酶抑制因子,A亚型(α-1抗蛋白酶,抗胰蛋白酶),成员8)  NM_000029   AAR03501
  AHSG   α-2-HS-糖蛋白  NM_001622   NP_001613
  APOA1   载脂蛋白A-I  NM_000039   AAD34604
  APOA4   载脂蛋白A-IV  NM_000482   AAS68228
  APOB   载脂蛋白B(包括Ag(x)抗原)  NM_000384   AAP72970
  APOC3   载脂蛋白C-III  BC027977   AAB59372
  AZGP1   α-2-糖蛋白1,锌  NM_001185   NP_001176
  BF   B-因子,裂解素  NM_001710   CAI17456
  SERPING 1   丝氨酸(或半胱氨酸)蛋白酶抑制因子,G亚型(CI抑制剂),成员1,(血管性水肿,遗传性的)  NM_000062;BC011171   AAW69393
  C1S   补体成分1,s亚组分  NM_201442;NM_001734   NP_958850NP_001725
  C2   补体成分2  NM_000063   CAI 17451
  C5   补体成分5  NM_001736   NP_001726
  C8A   补体成分8,α多肽  NM_000562   CAI19172
  CLU   聚集素(补体裂解抑制剂,SP-40,40,硫化糖蛋白2,***抑制的***信使2,载脂蛋白J)  NM_001831   AAP88927
  F2   凝固因子II(凝血酶)  NM_000506   AAL77436
  FGB   纤维蛋白原β链  NM_005141   AAA18024
  GSN   凝溶胶蛋白(淀粉样变性病,Finnish型)  BC026033   CAI14413
  HBB   血红蛋白,β  NM_000518   AAD19696
  SERPIND1   丝氨酸(或半胱氨酸)蛋白酶抑制因子,D亚型(肝素辅因子),成员1   NM_000185   CAG30459
  HP   亲血球蛋白   BC107587   NP_005134
  HPX   血红素结合蛋白   NM_000613   NP_000604
  KNG1   激肽原1   NM_000893   NP_000884
  KRT1   角蛋白1(表皮松解性角化过度症)   BC063697   NP_000412
  LGALS3BP   植物凝集素,半乳糖苷-结合、可溶的3结合蛋白   NM_005567BC015761BC002403BC002998   NP_005558
  SERPINA1   丝氨酸(或半胱氨酸)蛋白酶抑制剂,A亚型(α-1抗蛋白酶,抗胰蛋白酶),成员1   BC015642NM_000295   NP_001002235NP_000286
  SERPINF2   丝氨酸(或半胱氨酸)蛋白酶抑制剂,F亚型(α-2抗血纤维蛋白酶,色素上皮来源的因子),成员2   BC031592   NP_000925
  SAA1   血清淀粉样蛋白A1   BC105796   AAA64799AAA30968
  TTR   转甲状腺蛋白(前清蛋白,淀粉样变性病型I)   NM_000371   AAH05310AAP35853
  VTN   玻连蛋白(血清扩散因子,促生长因子B,补体S-蛋白)   NM_000638   P04004
  VWF   冯·威利布兰德因子   NM_000552   AAB59458
  APOL1   载脂蛋白L,1   BC017331NM_003661   AAK20210
  TRIP 11   甲状腺激素受体相互作用因子11   NM_004239   NP_004230
  LRG1   亮氨酸-富集的α-2-糖蛋白1   NM_052972   AAH70198
  AGT   血管紧张素原(丝氨酸(或半胱氨酸)蛋白酶抑制剂,A亚型(α-1抗蛋白酶,抗胰蛋白酶),成员8)   NM_000029   AAR03501
确定已知与凝集有关的表1或5中的生物标记,这些生物标记组成如表7中所述的本发明的另一个实施方案。
表7:已知与凝集有关的来源于表1或5的生物标记
  基因符号   基因名称   基因登录号   基因蛋白质名称
  列1   列2   列3   列4
  AGT   血管紧张素原(丝氨酸(或半胱氨酸)蛋白酶抑制剂,A亚型(α-1抗蛋白酶,抗胰蛋白酶),成员8)   NM_000029   AAR03501
  APCS   淀粉样蛋白P成分,血清   BT006750   CAH73651
  BF   B-因子,裂解素   NM_001710   CAI17456
  SERPING1   丝氨酸(或半胱氨酸)蛋白酶抑制因子,G亚型(C1抑制剂),成员1,(血管性水肿,遗传性的)   NM_000062BC011171   AAW69393
  C1QB   补体成分1,q亚组分,β多肽   NM_000491   NP_000482CAI22896
  C1R   补体成分1,r亚组分   NM_001733   NP_001724
  C1S   补体成分1,s亚组分   NM_201442;NM_001734   NP_958850NP_001725
  C2   补体成分2   NM_000063   CAI17451CAI41858
  C3   补体成分3   NM_000064   AAR89906
  C4BPA   补体成分4结合蛋白,α   NM_001017367   CAH70782
  C5   补体成分5   NM_001736   NP_001726
  C6   补体成分6   NM_000065   BAD02322
  C7   补体成分7   NM_000587   CAA72407
  C8A   补体成分8,α多肽   NM_000562   CAI19172
  C8B   补体成分8,β多肽   NM_000066   CAC18532
  C8G   补体成分8,γ多肽   NM_000606   NP_000597
  C9   补体成分9   NM_001737   NP_001728AAH20721
  CLU   聚集素(补体裂解抑制剂,SP-40,40,硫化糖蛋白2,***-抑制的***信使2,载脂蛋白J)   NM_001831   AAP88927
  CPN1   羧肽酶N,多肽1,50kD   NM_001308   NP_001299
  CRP   C-反应蛋白,正五聚蛋白相关的   NM_000567   NP_000558
  IF   因子I(补体)   NM_000204   稍后查询
  IGFBP5   ***结合蛋白5   NM_000599   NP_000590
  KRT1   角蛋白1(表皮松解性角化过度症)   BC063697   NP_000412
  PLG   纤溶酶原   NM_000301   AAH60513
  C4B   -   NM_000592   AAR89095
根据本发明另一个实施方案的生物标记在表8中阐述。
表8:根据本发明另一个实施方案的生物标记。
  基因符号   基因名称   基因登录号   蛋白质登录号
  列1   列2   列3   列4
  AGT   血管紧张素原(丝氨酸或半胱氨酸)蛋白酶抑制因子,A亚型(α-1抗蛋白酶,抗胰蛋白酶),成员8)   NM_000029   AAR03501
  AHSG   α-2-HS-糖蛋白   NM_001622   NP_001613
  APOA1   载脂蛋白A-I   NM_000039   AAD34604
  APOA4   载脂蛋白A-IV   NM_000482   AAS68228
  APOB   载脂蛋白B(包括Ag(x)抗原)   NM_000384   AAP72970
  APOC3   载脂蛋白C-III   BC027977   AAB59372
  AZGP1   α-2-糖蛋白1,锌指   NM_001185   NP_001176
  BF   B-因子,裂解素   NM_001710   CAI17456
  SERPING1   丝氨酸(或半胱氨酸)蛋白酶抑制因子,G亚型(CI抑制剂),成员1,(血管性水肿,遗传性的)   NM_000062;BC011171   AAW69393
  C1S   补体成分1,s亚组分   NM_201442;NM_001734   NP_958850NP_001725
  C2   补体成分2   NM_000063   CAI17451
  C8A   补体成分8,α多肽   NM_000562   CAI19172
  CLU   聚集素(补体裂解抑制剂,SP-40,40,硫化糖蛋白2,***-抑制的***信使2,载脂蛋白J)   NM_001831   AAP88927
  F2   凝固因子II(凝血酶)   NM_000506   AAL77436
  FGB   纤维蛋白原β链   NM_005141   AAA18024
  GSN   凝溶胶蛋白(淀粉样变性病,Finnish型)  BC026033   CAI14413
  HBB   血色素,β  NM_000518   AAD19696
  SERPIND1   丝氨酸(或半胱氨酸)蛋白酶抑制因子,D亚型(肝素辅因子),成员1  NM_000185   CAG30459
  HP   亲血球蛋白  BC107587   NP_005134
  HPX   血红素结合蛋白  NM_000613   NP_000604
  KNG1   激肽原1  NM_000893   NP_000884
  KRT1   角蛋白1(表皮松解性角化过度症)  BC063697   NP_000412
  LGALS3BP   植物凝集素,半乳糖苷-结合、可溶的3结合蛋白  NM_005567;BC015761BC002403BC002998   NP_005558
  SERPINA1   丝氨酸(或半胱氨酸)蛋白酶抑制剂,A亚型(α-1抗蛋白酶,抗胰蛋白酶),成员1  BC015642NM_000295   NP_001002235NP_000286
  SERPINF2   丝氨酸(或半胱氨酸)蛋白酶抑制剂,F亚型(α-2抗血纤维蛋白酶,色素上皮来源的因子),成员2  BC031592   NP_000925
  SAA1   血清淀粉样蛋白A1  BC105796   AAA64799AAA30968
  TTR   转甲状腺蛋白(前清蛋白,淀粉样变性病型I)  NM_000371   AAH05310AAP35853
  VTN   玻连蛋白(血清扩散因子,促生长因子B,补体S-蛋白)  NM_000638   P04004
  VWF   冯·威利布兰德因子  NM_000552   AAB59458
  APOL1   载脂蛋白L,1  BC017331NM_003661   AAK20210
  TRIP 11   甲状腺激素受体相互作用因子11  NM_004239   NP_004230
  LRG1   亮氨酸-富集的α-2-糖蛋白1  NM_052972   AAH70198
  AGT   血管紧张素原(丝氨酸(或半胱氨酸)蛋白酶抑制剂,A亚型(α-1抗蛋白酶,抗胰蛋白酶),成员8)  NM_000029   AAR03501
根据本发明另一个实施方案的生物标记在表9中阐述。
表9:根据本发明另一个实施方案的生物标记。
  基因符号   基因名称  基因登录号   蛋白质登录号
  列1   列2  列3   列4
  AGT   血管紧张素原(丝氨酸或半胱氨酸)蛋白酶抑制因子,A亚型(α-1抗蛋白酶,抗胰蛋白酶),成员8)  NM_000029   AAR03501
  AHSG   α-2-HS-糖蛋白  NM_001622   NP_001613
  APOA4   载脂蛋白A-IV  NM_000482   AAS68228
  APOB   载脂蛋白B(包括Ag(x)抗原)  NM_000384   AAP72970
  APOC3   载脂蛋白C-III  BC027977   AAB59372
  AZGP1   α-2-糖蛋白1,锌  NM_001185   NP_001176
  BF   B-因子,裂解素  NM_001710   CAI17456
  SERPING1   丝氨酸(或半胱氨酸)蛋白酶抑制因子,G亚型(CI抑制剂),成员1,(血管性水肿,遗传性的)  NM_000062;BC011171   AAW69393
  C1S   补体成分1,s亚组分  NM_201442;NM_001734   NP_958850NP_001725
  C2   补体成分2  NM_000063   CAI17451
  C8A   补体成分8,α多肽  NM_000562   CAI19172
  CLU   聚集素(补体裂解抑制剂,SP-40,40,硫化糖蛋白2,***-抑制的***信使2,载脂蛋白J)  NM_001831   AAP88927
  F2   凝固因子II(凝血酶)  NM_000506   AAL77436
  FGB   纤维蛋白原β链  NM_005141   AAA18024
  GSN   凝溶胶蛋白(淀粉样变性病,Finnish型)  BC026033   CAI14413
  HBB   血色素,β  NM_000518   AAD19696
  SERPIND1   丝氨酸(或半胱氨酸)蛋白酶抑制因子,D亚型(肝素辅因子),成员1  NM_000185   CAG30459
  HP   亲血球蛋白  BC107587   NP_005134
  HPX   血红素结合蛋白  NM_000613   NP_000604
  KNG1   激肽原1  NM_000893   NP_000884
  KRT1   角蛋白1(表皮松解性角化过度症)  BC063697   NP_000412
  LGALS3BP   植物凝集素,半乳糖苷-结合、可溶的3结合蛋白   NM_005567BC015761BC002403BC002998   NP_005558
  SERPINA1   丝氨酸(或半胱氨酸)蛋白酶抑制剂,A亚型(α-1抗蛋白酶,抗胰蛋白酶),成员1   BC015642NM_000295   NP_001002235NP_000286
  SERPINF2   丝氨酸(或半胱氨酸)蛋白酶抑制剂,F亚型(α-2抗血纤维蛋白酶,色素上皮来源的因子),成员2   BC031592   NP_000925
  SAA1   血清淀粉样蛋白A1   BC105796   AAA64799AAA30968
  TTR   转甲状腺蛋白(前清蛋白,淀粉样变性病型I)   NM_000371   AAH05310AAP35853
  VTN   玻连蛋白(血清扩散因子,促生长因子B,补体S-蛋白)   NM_000638   P04004
  APOL1   载脂蛋白L,1   BC017331NM_003661   AAK20210
  TRIP11   甲状腺激素受体相互作用因子11   NM_004239   NP_004230
  LRG1   亮氨酸-富集的α-2-糖蛋白1   NM_052972   AAH70198
  AGT   血管紧张素原(丝氨酸(或半胱氨酸)蛋白酶抑制剂,A亚型(α-1抗蛋白酶,抗胰蛋白酶),成员8)   NM_000029   AAR03501
7.替代的实施方案和引用的参考文献
在此引用的所有参考文献在此通过引用全文引入,并且用于如下目的,即达到就像每篇出版物、专利申请和专利都被分别明确地通过引用从而引入全文的相同程度。
本发明可以作为含有嵌入计算机可读存储介质中的计算机程序机制的计算机程序产品来实现。进一步地,可在一台或多台计算机或计算机***中实现不涉及测量步骤的本发明的任何方法。再进一步地,可在一个或多个计算机程序产品中实现不涉及测量步骤的本发明的任何方法。本发明的一些实施方案提供编码或具有用于完成此处公开的任何或所有方法的指令的计算机***或计算机程序产品。所述方法/指令可以存储在CD-ROM、DVD、磁盘存储产品或任何其它计算机可读数据或程序存储产品上。所述方法也可以嵌入固定存储器如ROM、一种或多种可编程芯片、或一种或多种专用集成电路(ASIC)中。这种固定存储器可以位于服务器、802.11入口点、802.11无线桥/站、中继器、路由器、移动电话或其它电子装置中。计算机程序产品中编码的所述方法也可以通过数字或在载波上传送的计算机数据信号(其中嵌入了软件模块)经由互联网或以其它方式电子分送。
本发明的一些实施方案提供包含图1中所示的任何或所有程序模块的计算机程序产品。这些程序模块可以存储在CD-ROM、DVD、磁盘存储产品或任何其它计算机可读数据或程序存储产品上。该程序模块也可以嵌入固定存储器如ROM、一种或多种可编程芯片、或一种或多种专用集成电路(ASIC)中。这种固定存储器可以位于服务器、802.11入口点、802.11无线桥/站、中继器、路由器、移动电话或其它电子装置中。计算机程序产品中的软件模块也可以通过数字或在载波上传送的计算机数据信号(其中嵌入了软件模块)经由互联网或以其它方式电子分送。
现在已经参照某些代表性实施方案和细节完全描述了本发明,本领域技术人员应当明白,可以在不背离本文所述本发明的精神或范围的情况下对其进行改变和修改。本文所述的具体实施方案只是作为实例提供,本发明仅由权利要求项进行限定,包括这些权利要求的等同方案的全部范围。

Claims (150)

1.预测具有发展成为脓毒症风险的受试者脓毒症发展的方法,该方法包括:
评价受试者生物标记谱的多种特征是否满足第一个数值集,其中满足第一数值集则预测该受试者可能发展成为脓毒症,并且其中所述多种特征为表1、4、5、6、7、8和/或9中所列出的多种生物标记的可测量方面,其中当所述多种生物标记包括补体成分C3和补体成分C4时,所述多种生物标记包括三种或更多种生物标记。
2.权利要求1的方法,该方法进一步包括:
评价所述受试者生物标记谱中的多种特征是否满足第二个数值集,其中满足该第二数值集则预测该受试者可能不会发展形成脓毒症。
3.权利要求1或2的方法,其中所述多种生物标记由表1、4、5、6、7、8和9中的一个表所列出的3-25种生物标记组成。
4.权利要求1或2的方法,其中所述多种生物标记由表1、4、5、6、7、8和9中的一个表所列出的4-25种生物标记组成。
5.权利要求1或2的方法,其中所述多种生物标记由表1、4、5、6、7、8和9中的一个表所列出的5-25种生物标记组成。
6.权利要求1或2的方法,其中所述多种生物标记包含表1、4、5、6、7、8和9中的一个表所列出的至少4种生物标记。
7.权利要求1或2的方法,其中所述多种生物标记包含表1、4、5、6、7、8和9中的一个表所列出的至少5种生物标记。
8.权利要求1或2的方法,其中所述多种生物标记包含C反应蛋白、载脂蛋白AII和抗凝血酶-III。
9.权利要求1-8的任何一项的方法,其中所述多种特征由对应于所述多种生物标记中3-100种生物标记的3-100种特征组成。
10.权利要求1-8的任何一项的方法,其中所述多种特征由对应于所述多种生物标记中4-40种生物标记的4-40种特征组成。
11.权利要求1-8的任何一项的方法,其中所述多种特征由对应于所述多种生物标记中5-25种生物标记的5-25种特征组成。
12.权利要求1-8的任何一项的方法,其中所述多种特征包含对应于所述多种生物标记中至少4种生物标记的至少4种特征。
13.权利要求1-8的任何一项的方法,其中所述多种特征包含对应于所述多种生物标记中至少5种生物标记的至少5种特征。
14.权利要求1-13的任何一项的方法,其中所述多种生物标记中的每种生物标记为表1中列出的生物标记。
15.权利要求1-13的任何一项的方法,其中所述多种生物标记中的每种生物标记为表4中列出的生物标记。
16.权利要求1-13的任何一项的方法,其中所述多种生物标记中的每种生物标记为表5中列出的生物标记。
17.权利要求1-13的任何一项的方法,其中所述多种生物标记中的每种生物标记为表6中列出的生物标记。
18.权利要求1-13的任何一项的方法,其中所述多种生物标记中的每种生物标记为表7中列出的生物标记。
19.权利要求1-13的任何一项的方法,其中所述多种生物标记中的每种生物标记为表8中列出的生物标记。
20.权利要求1-13的任何一项的方法,其中所述多种生物标记中的每种生物标记为表8中列出的生物标记,条件是所述多种生物标记不包括LRG1。
21.权利要求1-13的任何一项的方法,其中所述多种生物标记中的每种生物标记为表9中列出的生物标记。
22.权利要求1-13的任何一项的方法,其中所述多种生物标记中的每种生物标记为表9中列出的生物标记,条件是所述多种生物标记不包括LRG1。
23.权利要求1-19的任何一项的方法,其中所述多种生物标记中的每种生物标记为核酸。
24.权利要求1-19的任何一项的方法,其中所述多种生物标记中的每种生物标记为蛋白质。
25.权利要求1-24的任何一项的方法,其中所述多种特征中的特征为所述多种生物标记中生物标记的可测量方面,并且所述特征的特征值是利用在单个时间点取自所述受试者的生物样品来测定的。
26.权利要求25的方法,其中所述特征为所述样品中所述生物标记的丰度。
27.权利要求25的方法,其中所述特征为所述样品中所述生物标记的缺乏或存在。
28.权利要求25的方法,其中所述特征为所述样品中所述生物标记种类的鉴定。
29.权利要求25-28的任何一项的方法,其中所述生物样品为全血。
30.权利要求25-28的任何一项的方法,其中所述生物样品为血浆、血清、唾液、痰液、尿、脑脊液、细胞、细胞提取物、组织样本、组织活检或粪便样本。
31.权利要求25-28的任何一项的方法,其中所述生物样品为分离的嗜中性粒细胞、分离的嗜酸性粒细胞、分离的嗜碱性粒细胞、分离的淋巴细胞或分离的单核细胞。
32.权利要求1-31的任何一项的方法,其中所述多种特征中的特征为所述生物标记谱中生物标记的可测量方面,并且所述特征的特征值是用在不同时间点取自所述受试者的多种样品来测定的。
33.权利要求32的方法,其中所述特征指示所述生物标记的丰度是否随着时间提高或降低。
34.权利要求32或33的方法,其中所述多种样品中的第一样品是在受试者获得脓毒症之前的第一天取得而所述多种样品中的第二样品是在受试者获得脓毒症之前的第二天取得。
35.权利要求1-22的任何一项或权利要求25-35的任何一项的方法,其中所述生物标记谱中的生物标记为核酸的指示、蛋白质的指示、代谢产物的指示或碳水化合物的指示。
36.权利要求1-22的任何一项或权利要求25-35的任何一项的方法,其中所述生物标记谱中的生物标记为mRNA分子的指示或cDNA分子的指示。
37.权利要求1-22的任何一项或权利要求25-35的任何一项的方法,其中所述生物标记谱中的生物标记为抗体的指示。
38.权利要求1-22的任何一项或权利要求25-35的任何一项的方法,其中所述生物标记谱中的第一种生物标记为核酸的指示而所述生物标记谱中的第二种生物标记为蛋白质的指示。
39.权利要求1-38的任何一项的方法,该方法进一步包括在评价步骤之前构建所述生物标记谱。
40.权利要求39的方法,其中所述构建步骤包括从所述受试者的样品获得所述多种特征。
41.权利要求39的方法,其中所述样品为全血。
42.权利要求39的方法,其中所述生物样品为血浆、血清、唾液、痰液、尿、脑脊液、细胞、细胞提取物、组织样本、组织活检或粪便样本。
43.权利要求39的方法,其中所述生物样品为分离的嗜中性粒细胞、分离的嗜酸性粒细胞、分离的嗜碱性粒细胞、分离的淋巴细胞或分离的单核细胞。
44.权利要求39的方法,其中所述构建步骤包括对从群体成员获得的对应于表1、4、5、6、7、8和/或9中所列出的生物标记的特征应用第一种数据分析算法。
45.权利要求44的方法,其中所述群体包括后来发展为脓毒症(脓毒症个体)的个体和后来未发展为脓毒症的个体(SIRS个体)。
46.权利要求44或45的方法,其中从群体成员获得的对应于表1、4、5、6、7、8和/或9列出的生物标记的特征是在该群体成员获得脓毒症之前得到的。
47.权利要求44-46的任何一项的方法,其中所述第一种数据分析算法是决策树、微阵列预测分析、多重累加回归树、神经网络、聚类算法、主成分分析、最近邻分析、线性判别分析、二次判别分析、支持向量机、渐进法、投影寻踪或加权表决。
48.权利要求1的方法,该方法进一步包括在评价步骤之前构建所述第一数值集。
49.权利要求48的方法,其中所述构建步骤包括对从群体成员获得的多种特征运用数据分析算法。
50.权利要求49的方法,其中所述第二群体包括在观察期间发展为脓毒症的个体和在观察期间未发展成为脓毒症的个体。
51.权利要求49或50的方法,其中所述数据分析算法是决策树、微阵列预测分析、多重累加回归树、神经网络、聚类算法、主成分分析、最近邻分析、线性判别分析、二次判别分析、支持向量机、渐进法、投影寻踪或加权表决。
52.权利要求49-51的任何一项的方法,其中所述构建步骤产生判定规则,并且其中所述评价步骤包括对所述多种特征应用所述判定规则,以确定它们是否满足所述第一数值集。
53.权利要求52的方法,其中所述判定规则将所述群体中的个体分类为(i)发展为脓毒症的个体和(ii)不发展为脓毒症的个体,其准确度为70%或更高。
54.权利要求52的方法,其中所述判定规则将所述群体中的个体分类为(i)发展为脓毒症的个体和(ii)不发展为脓毒症的个体,其准确度为90%或更高。
55.权利要求1-54的任何一项的方法,其中在可能发展为脓毒症的患者中所述生物标记谱中的第一种生物标记上调。
56.权利要求1-54的任何一项的方法,其中在可能发展为脓毒症的患者中所述生物标记谱中的至少5种生物标记上调。
57.权利要求1-54的任何一项的方法,其中在可能发展为脓毒症的患者中所述生物标记谱中的第一种生物标记下调。
58.权利要求1-54的任何一项的方法,其中在可能发展为脓毒症的患者中所述生物标记谱中的至少5种生物标记下调。
59.权利要求1-58的任何一项的方法,其中所述受试者具有在4-8小时内发展为脓毒症的可能性。
60.权利要求1-58的任何一项的方法,其中所述受试者具有在8-12小时内发展为脓毒症的可能性。
61.权利要求1-58的任何一项的方法,其中所述受试者具有在12-24小时内发展为脓毒症的可能性。
62.权利要求1-58的任何一项的方法,其中所述受试者具有在24-36小时内发展为脓毒症的可能性。
63.权利要求1-58的任何一项的方法,其中所述受试者具有在36-48小时内发展为脓毒症的可能性。
64.权利要求1-58的任何一项的方法,其中所述受试者具有在48-72小时内发展为脓毒症的可能性。
65.权利要求1-64的任何一项的方法,所述方法进一步包括将所述受试者的所述生物标记谱中的所述多种特征是否满足所述第一数值集传送至用户、存储器、存储装置或软件程序。
66.一种诊断受试者中的脓毒症的方法,包括:
评价该受试者的生物标记谱中的多种特征是否满足第一数值集,其中满足该第一数值集则预测该受试者可能发展形成脓毒症,其中所述多种特征对应于多种生物标记,所述多种生物标记包括表1、4、5、6、7、8和9的任何一个所列出的至少两种生物标记,其中当所述多种生物标记包括补体成分C3和补体成分C4时,所述多种生物标记包括三种或更多种生物标记。
67.权利要求66的方法,所述方法进一步包括在所述评价步骤之前构建所述生物标记谱。
68.权利要求67的方法,其中所述构建步骤包括从所述受试者的样品获得所述多种特征。
69.权利要求68的方法,其中所述样品为全血。
70.权利要求68的方法,其中所述生物样品为血浆、血清、唾液、痰液、尿、脑脊液、细胞、细胞提取物、组织样本、组织活检或粪便样本。
71.权利要求68的方法,其中所述生物样品为分离的嗜中性粒细胞、分离的嗜酸性粒细胞、分离的嗜碱性粒细胞、分离的淋巴细胞或分离的单核细胞。
72.权利要求68的方法,其中所述样品为单一组织。
73.权利要求68的方法,其中所述样品来自所述受试者的一种以上组织。
74.权利要求66-73的任何一项的方法,其中所述构建步骤包括确定对应于所述多种特征的表1、4、5、6、7、8或9中生物标记的身份。
75.权利要求74的方法,其中所述确定步骤包括对从群体成员获得的对应于表1、4、5、6、7、8或9所列出的生物标记的特征运用数据分析算法。
76.权利要求75的方法,其中所述群体包括后来发展为脓毒症的个体(脓毒症个体)和未发展为脓毒症的个体(SIRS个体)。
77.权利要求66的方法,其中所述多种生物标记在表1中。
78.权利要求66的方法,其中所述多种生物标记在表4中。
79.权利要求66的方法,其中所述多种生物标记在表5中。
80.权利要求66的方法,其中所述多种生物标记在表6中。
81.权利要求66的方法,其中所述多种生物标记在表7中。
82.权利要求66的方法,其中所述多种生物标记在表8中。
83.权利要求66-76的任何一项的方法,其中所述多种生物标记包括C反应蛋白、载脂蛋白AII和抗凝血酶-III。
84.权利要求66-76的任何一项的方法,其中所述多种生物标记包括表1、4、5、6、7、8和9的任何一个所列出的至少三种生物标记。
85.权利要求66-76的任何一项的方法,其中所述多种生物标记包括表1、4、5、6、7、8和9的任何一个所列出的至少4种生物标记。
86.权利要求66-85的任何一项的方法,所述方法进一步包括将所述受试者的所述生物标记谱中的所述多种特征是否满足所述第一数值集传送至用户、存储器、存储装置或软件程序。
87.权利要求66-85的任何一项的方法,其中所述多种生物标记不包括LRG1。
88.一种包含多个探针斑点的微阵列,其中所述多个探针斑点中至少20%的探针斑点对应于表1、4、5、6、7、8或9所列出的多种生物标记。
89.权利要求88的微阵列,其中所述多种探针斑点中至少40%的探针斑点对应于表1、4、5、6、7、8或9所列出的生物标记。
90.权利要求88或89任一项的微阵列,其中所述微阵列由位于基底上的大约3-100个探针斑点组成。
91.权利要求88-90的任何一项的微阵列,其中所述微阵列为核酸微阵列。
92.权利要求88-90的任何一项的微阵列,其中所述微阵列为蛋白质微阵列。
93.权利要求88-90的任何一项的微阵列,其中所述多种生物标记不包括LRG1。
94.用于预测受试者中脓毒症发展的试剂盒,所述试剂盒包括特异性结合表1、4、5、6、7、8和/或9所列出的多种生物标记的多种抗体。
95.用于预测受试者中脓毒症发展的试剂盒,所述试剂盒包括特异性结合表1中列出的多种生物标记的多种抗体。
96.用于预测受试者中脓毒症发展的试剂盒,所述试剂盒包括特异性结合表4中列出的多种生物标记的多种抗体。
97.用于预测受试者中脓毒症发展的试剂盒,所述试剂盒包括特异性结合C反应蛋白的第一抗体、特异性结合载脂蛋白AII的第二抗体和特异性结合抗凝血酶-III前体的第三抗体。
98.用于预测受试者中脓毒症发展的试剂盒,所述试剂盒包括特异性结合表5中列出的多种生物标记的多种抗体。
99.用于预测受试者中脓毒症发展的试剂盒,所述试剂盒包括特异性结合表8中列出的多种生物标记的多种抗体。
100.与计算机***一起使用的计算机程序产品,其中该计算机程序产品包括计算机可读存储介质和嵌入其中的计算机程序机制,该计算机程序机制包括:
评价具有发展为脓毒症风险的受试者的生物标记谱中多种特征是否满足第一数值集的指令,其中满足该第一数值集则预测该受试者可能发展形成脓毒症,其中所述多种特征是多种生物标记的可测量方面,所述多种生物标记包括表1、4、5、6、7、8和/或9所列出的至少两种生物标记,其中当所述多种生物标记包括补体成分C3和补体成分C4时,所述多种生物标记包括三种或更多种生物标记。
101.权利要求100的计算机程序产品,该计算机程序产品进一步包括:
评价所述受试者的生物标记谱中的多种特征是否满足第二数值集的指令,其中满足该第二数值集则预测该受试者可能不会发展形成脓毒症。
102.权利要求100或101的计算机程序产品,其中所述生物标记谱由表1列出的2-90种生物标记组成。
103.权利要求100或101的计算机程序产品,其中所述生物标记谱由表4列出的2-10种生物标记组成。
104.权利要求100或101的计算机程序产品,其中所述多种生物标记包括表5列出的至少2-90种生物标记。
105.权利要求100或101的计算机程序产品,其中所述多种生物标记包括表8列出的至少2-90种生物标记。
106.权利要求100或101的计算机程序产品,其中所述生物标记谱包括C反应蛋白、载脂蛋白AII和抗凝血酶-III。
107.权利要求100-106任一项的计算机程序产品,所述计算机程序产品进一步包括:
用于将所述受试者的所述生物标记谱中的多种特征是否满足所述第一数值集传送至用户、存储器、存储装置或软件程序的指令。
108.权利要求100的计算机程序产品,其中所述多种生物标记包括表8或9所列出的至少两种生物标记并且其中所述多种生物标记不包括LRG1。
109.一种计算机,其包括:
中央处理器;
与中央处理器连接的存储器,该存储器存储:
评价具有发展成为脓毒症风险的受试者的生物标记谱中的多种特征是否满足第一数值集的指令,其中满足该第一数值集则预测该受试者可能发展形成脓毒症,其中所述多种特征是多种生物标记的可测量方面,所述多种生物标记包括表1、4、5、6、7、8和/或9所列出的至少二种生物标记,其中当所述多种生物标记包括补体成分C3和补体成分C4,所述多种生物标记包括三种或更多种生物标记。
110.权利要求109的计算机,所述存储器进一步包括:
评价所述受试者的生物标记谱中的多种特征是否满足第二数值集的指令,其中满足该第二数值集则预测该受试者可能不会发展形成脓毒症。
111.权利要求109或110的计算机,其中所述生物标记谱由2-100种生物标记组成。
112.权利要求109或110的计算机,其中所述生物标记谱由3-50种生物标记组成。
113.权利要求109-112的任一项的计算机,所述存储器进一步包括:
将所述受试者的所述生物标记谱中的所述多种特征是否满足所述第一数值集传送至用户、存储器、存储装置或软件程序的指令。
114.用于确定个体是否可能发展形成脓毒症的计算机***,该计算机***包括:
中央处理器;和
与中央处理器连接的存储器,该存储器存储:
获得受试者的生物标记谱的指令,其中所述生物标记谱包括多种特征,其中所述多种特征是多种生物标记的可测量方面,所述多种生物标记包括表1、4、5、6、7、8和9的任何一项所列出的至少两种生物标记,其中当所述多种生物标记包括补体成分C3和补体成分C4时,所述多种生物标记包括三种或更多种生物标记;
将该生物标记谱传送至远程计算机的指令,其中该远程计算机包括用于评价该受试者的生物标记谱中的多种特征是否满足第一数值集的指令,其中满足该第一数值集则预测该受试者可能发展形成脓毒症;
从该远程计算机接收关于该受试者的生物标记谱中的多种特征是否满足第一数值集的判定结果的指令;和
将该受试者的生物标记谱中的多种特征是否满足该第一数值集报告至用户、存储器、存储装置或软件程序的指令。
115.权利要求114的计算机***,其中
所述远程计算机进一步包括评价所述受试者的所述生物标记谱中的多种特征是否满足第二数值集的指令,其中满足该第二数值集则预测该受试者可能不会发展形成脓毒症;并且其中所述存储器进一步包括:
从所述远程计算机接收关于所述受试者的所述生物标记谱中的所述多种特征是否满足所述第二数值集的判定结果的指令;和
将所述受试者的生物标记谱中的所述多种特征是否满足所述第二数值集报告至用户、存储器、存储装置或软件程序的指令。
116.权利要求114的计算机***,其中所述多种生物标记包括表1中列出的至少三种生物标记。
117.权利要求114的计算机***,其中所述多种生物标记包括表5中列出的至少三种生物标记。
118.权利要求114的计算机***,其中所述多种生物标记包括C反应蛋白、载脂蛋白AII和抗凝血酶-III。
119.权利要求114的计算机***,其中所述多种生物标记包括表8中列出的至少三种生物标记。
120.权利要求114的计算机***,其中所述多种生物标记包括表9中列出的至少三种生物标记。
121.权利要求119或120的计算机***,其中所述多种生物标记不包括LRG1。
122.表现为载波的数字信号,其包括生物标记谱中多种特征中的每一个的相应值;其中所述多种特征是多种生物标记的可测量方面,所述多种生物标记包括表1、4、5、6、7、8和9的任何一个所列出的至少两种生物标记,其中当所述多种生物标记包括补体成分C3和补体成分C4时,所述多种生物标记包括三种或更多种生物标记。
123.权利要求122的数字信号,其中所述多种生物标记包括表1中列出的至少三种生物标记。
124.权利要求122的数字信号,其中所述多种生物标记包括表5中列出的至少三种生物标记。
125.权利要求122的数字信号,其中所述多种生物标记包括C反应蛋白、载脂蛋白AII和抗凝血酶-III。
126.权利要求122的数字信号,其中所述多种生物标记包括表8中列出的至少三种生物标记。
127.权利要求122的数字信号,其中所述多种生物标记包括表9中列出的至少三种生物标记。
128.表现为载波的数字信号,其包括关于受试者的生物标记谱中的多种特征是否满足一个数值集的判定结果,其中所述多种特征是多种生物标记的可测量方面,所述多种生物标记包括表1所列出的至少两种生物标记,且其中满足所述数值集则预测所述受试者可能发展成为脓毒症,并且其中当所述多种生物标记包括补体成分C3和补体成分C4时,所述多种生物标记包括三种或更多种生物标记。
129.权利要求128的数字信号,其中所述多种生物标记包括表1中列出的至少三种生物标记。
130.权利要求128的数字信号,其中所述多种生物标记包括C反应蛋白、载脂蛋白AII和抗凝血酶-III。
131.表现为载波的数字信号,其包括关于受试者的生物标记谱中的多种特征是否满足一个数值集的判定结果,其中所述多种特征是多种生物标记的可测量方面,所述多种生物标记包括表1、4、5、6、7、8和9的任何一个所列出的至少两种生物标记,且其中满足所述数值集则预测该受试者可能不会发展成为脓毒症,并且其中当所述多种生物标记包括补体成分C3和补体成分C4时,所述多种生物标记包括三种或更多种生物标记。
132.权利要求131的数字信号,其中所述多种生物标记包括表1中列出的至少4种生物标记。
133.权利要求131的数字信号,其中所述多种生物标记包括表5中列出的至少4种生物标记。
134.权利要求131的数字信号,其中所述多种生物标记包括C反应蛋白、载脂蛋白AII和抗凝血酶-III。
135.权利要求131的数字信号,其中所述多种生物标记包括表8中列出的至少两种生物标记。
136.权利要求131的数字信号,其中所述多种生物标记包括表9中列出的至少两种生物标记。
137.权利要求135或136的数字信号,其中所述多种生物标记不包括LRG1。
138.用于确定个体是否可能发展成为脓毒症的图形用户界面,该图形用户界面包括一个显示区,该显示区用于显示从远程计算机接收的表现为载波的数字信号编码的结果,其中所述多种特征是多种生物标记的可测量方面,所述多种生物标记包括表1、4、5、6、7、8和9的任何一个所列出的至少两种生物标记,其中当所述多种生物标记包括补体成分C3和补体成分C4时,所述多种生物标记包括三种或更多种生物标记,并且其中
当所述个体的生物标记谱中的多种特征满足第一数值集时,所述结果具有第一数值;并且
当所述个体的生物标记谱中的多种特征满足第二数值集时,所述结果具有第二数值。
139.权利要求138的图形用户界面,其中所述多种生物标记包括表1中列出的至少三种生物标记。
140.权利要求138的图形用户界面,其中所述多种生物标记包括表5中列出的至少三种生物标记。
141.权利要求138的图形用户界面,其中所述多种生物标记包括C反应蛋白、载脂蛋白AII和抗凝血酶-III。
142.权利要求138的图形用户界面,其中所述多种生物标记包括表8中列出的至少三种生物标记。
143.权利要求138的图形用户界面,其中所述多种生物标记包括表9中列出的至少三种生物标记。
144.用于确定个体是否可能发展成为脓毒症的计算机***,该计算机***包括:
中央处理器;和
与中央处理器连接的存储器,该存储器存储:
获得个体的生物标记谱的指令,其中所述生物标记谱包括多种特征,其中所述多种特征是多种生物标记的可测量方面,所述多种生物标记包括表1、4、5、6、7、8和9的任何一个所列出的至少两种生物标记,其中当所述多种生物标记包括补体成分C3和补体成分C4时,所述多种生物标记包括三种或更多种生物标记,且其中
评价所述个体的生物标记谱中的多种特征是否满足第一数值集的指令,其中满足该第一数值集则预测该受试者可能发展形成脓毒症;和
将该个体的生物标记谱中的多种特征是否满足第一数值集报告至用户、存储器、存储装置或软件程序的指令。
145.权利要求144的计算机***,其中所述多种生物标记包括表1中列出的至少两种生物标记。
146.权利要求144的计算机***,其中所述多种生物标记包括表5中列出的至少两种生物标记。
147.权利要求144的计算机***,其中所述多种生物标记包括C反应蛋白、载脂蛋白AII和抗凝血酶-III。
148.权利要求144的计算机***,其中所述多种生物标记包括表8中列出的至少两种生物标记。
149.权利要求144的计算机***,其中所述多种生物标记包括表9中列出的至少两种生物标记。
150.权利要求148或149的计算机***,其中所述多种生物标记不包括LRG1。
CN200680052873A 2005-12-15 2006-12-14 脓毒症的诊断 Pending CN101622360A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US75119705P 2005-12-15 2005-12-15
US60/751,197 2005-12-15
US60/819,983 2006-07-10

Publications (1)

Publication Number Publication Date
CN101622360A true CN101622360A (zh) 2010-01-06

Family

ID=41514913

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200680052873A Pending CN101622360A (zh) 2005-12-15 2006-12-14 脓毒症的诊断

Country Status (1)

Country Link
CN (1) CN101622360A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104204808A (zh) * 2011-11-14 2014-12-10 耶拿大学附属医院 脓毒血症和全身炎症反应综合征的诊断
CN106153945A (zh) * 2016-06-17 2016-11-23 李永旺 一种检测缺血性脑卒中的生物标志物及其应用
CN106367484A (zh) * 2016-08-29 2017-02-01 北京泱深生物信息技术有限公司 分子标志物在诊断脓毒症中的应用
CN106367488A (zh) * 2016-08-29 2017-02-01 北京泱深生物信息技术有限公司 Letmd1在脓毒症诊断中的应用
CN109490556A (zh) * 2019-01-04 2019-03-19 首都医科大学附属北京胸科医院 Agp1、orm2和c9在区分结核性胸腔积液和恶性胸腔积液中的应用
CN109671469A (zh) * 2018-12-11 2019-04-23 浙江大学 基于循环神经网络预测多肽与hla i型分子之间结合关系与结合亲和力的方法
CN110161235A (zh) * 2019-06-26 2019-08-23 江苏省中医院 三种血清蛋白联合用于强直性脊柱炎诊断的用途
CN110931082A (zh) * 2019-12-12 2020-03-27 爱尔生基因医学科技有限公司 一种用于基因检测评估的方法及***
CN113128654A (zh) * 2021-05-06 2021-07-16 中山大学 一种用于冠心病预诊断中的改进型随机森林模型及其预诊断***
CN114628024A (zh) * 2022-02-24 2022-06-14 重庆市急救医疗中心(重庆市第四人民医院、重庆市急救医学研究所) 一种生物标志物组在制备用于辅助筛查脓毒症的产品中的用途和辅助筛查方法及其***
CN114958963A (zh) * 2022-07-29 2022-08-30 深圳传世生物医疗有限公司 一种作用于凝血酶的抗凝药物检测试剂盒及其应用
CN115407067A (zh) * 2022-06-22 2022-11-29 郑州大学第一附属医院 一种脓毒血症诊断标志物

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104204808B (zh) * 2011-11-14 2016-08-24 耶拿大学附属医院 脓毒血症和全身炎症反应综合征的诊断
CN104204808A (zh) * 2011-11-14 2014-12-10 耶拿大学附属医院 脓毒血症和全身炎症反应综合征的诊断
US10712350B2 (en) 2011-11-14 2020-07-14 Universitätsklinikum, Jena Diagnosis of sepsis and systemic inflammatory response syndrome
CN106153945A (zh) * 2016-06-17 2016-11-23 李永旺 一种检测缺血性脑卒中的生物标志物及其应用
CN106153945B (zh) * 2016-06-17 2017-10-17 李永旺 一种检测缺血性脑卒中的生物标志物及其应用
CN106367484A (zh) * 2016-08-29 2017-02-01 北京泱深生物信息技术有限公司 分子标志物在诊断脓毒症中的应用
CN106367488A (zh) * 2016-08-29 2017-02-01 北京泱深生物信息技术有限公司 Letmd1在脓毒症诊断中的应用
CN109671469B (zh) * 2018-12-11 2020-08-18 浙江大学 基于循环神经网络预测多肽与hla i型分子之间结合关系与结合亲和力的方法
CN109671469A (zh) * 2018-12-11 2019-04-23 浙江大学 基于循环神经网络预测多肽与hla i型分子之间结合关系与结合亲和力的方法
CN109490556A (zh) * 2019-01-04 2019-03-19 首都医科大学附属北京胸科医院 Agp1、orm2和c9在区分结核性胸腔积液和恶性胸腔积液中的应用
CN109490556B (zh) * 2019-01-04 2022-04-19 首都医科大学附属北京胸科医院 Agp1、orm2和c9在区分结核性胸腔积液和恶性胸腔积液中的应用
CN110161235A (zh) * 2019-06-26 2019-08-23 江苏省中医院 三种血清蛋白联合用于强直性脊柱炎诊断的用途
CN110931082A (zh) * 2019-12-12 2020-03-27 爱尔生基因医学科技有限公司 一种用于基因检测评估的方法及***
CN113128654A (zh) * 2021-05-06 2021-07-16 中山大学 一种用于冠心病预诊断中的改进型随机森林模型及其预诊断***
CN113128654B (zh) * 2021-05-06 2023-12-19 中山大学 一种用于冠心病预诊断中的改进型随机森林模型及其预诊断***
CN114628024A (zh) * 2022-02-24 2022-06-14 重庆市急救医疗中心(重庆市第四人民医院、重庆市急救医学研究所) 一种生物标志物组在制备用于辅助筛查脓毒症的产品中的用途和辅助筛查方法及其***
CN115407067A (zh) * 2022-06-22 2022-11-29 郑州大学第一附属医院 一种脓毒血症诊断标志物
CN114958963A (zh) * 2022-07-29 2022-08-30 深圳传世生物医疗有限公司 一种作用于凝血酶的抗凝药物检测试剂盒及其应用
CN114958963B (zh) * 2022-07-29 2023-09-05 深圳传世生物医疗有限公司 一种作用于凝血酶的抗凝药物检测试剂盒及其应用

Similar Documents

Publication Publication Date Title
US20090104605A1 (en) Diagnosis of sepsis
CN101622360A (zh) 脓毒症的诊断
Cruts et al. Estimation of the genetic contribution of presenilin-1 and-2 mutations in a population-based study of presenile Alzheimer disease
US20210272695A1 (en) Systems and methods for using sequencing data for pathogen detection
EP3103046B1 (en) Biomarker signature method, and apparatus and kits therefor
Nishimura et al. Comparative genomics and gene expression analysis identifies BBS9, a new Bardet-Biedl syndrome gene
Bülow et al. Duodenal adenomatosis in familial adenomatous polyposis
CN103403543B9 (zh) 结肠癌基因表达签名及使用方法
Winter et al. Mapping complex traits in a diversity outbred F1 mouse population identifies germline modifiers of metastasis in human prostate cancer
Bayram et al. Risk factors for subclinical inflammation in children with Familial Mediterranean fever
US20140128277A1 (en) Method for Identifying a Subset of Polynucleotides from an Initial Set of Polynucleotides Corresponding to the Human Genome for the In Vitro Determination of the Severity of the Host Response of a Patient
Zhang et al. A rare missense variant of CASP7 is associated with familial late-onset Alzheimer's disease
AU2006210794A1 (en) Biomarkers for tissue status
Seifart et al. Genetics of chronic obstructive pulmonary disease
AU2006333077A1 (en) Diagnosis of sepsis
Gemmati et al. Cis-segregation of c. 1171C> T stop codon (p. R391*) in SERPINC1 gene and c. 1691G> A transition (p. R506Q) in F5 gene and selected GWAS multilocus approach in inherited thrombophilia
Gorman et al. Distinctive cross-ancestry genetic architecture for age-related macular degeneration
Morange et al. A rare coding mutation in the MAST2 gene causes venous thrombosis in a French family with unexplained thrombophilia: The Breizh MAST2 Arg89Gln variant
Faisal et al. MicroRNA-17-92a-1 host gene (MIR17HG) expression signature and rs4284505 variant association with alopecia areata: a case–control study
Rydberg et al. Genetic investigation of Nordic patients with complement-mediated kidney diseases
Lunghi et al. Whole-Exome Sequencing in a Family with an Unexplained Tendency for Venous Thromboembolism: Multicomponent Prediction of Low-Frequency Variant Deleteriousness and of Individual Protein Interaction
Gemmati et al. Gene Dosage of F5 c. 3481C> T Stop-Codon (p. R1161Ter) Switches the Clinical Phenotype from Severe Thrombosis to Recurrent Haemorrhage: Novel Hypotheses for Readthrough Strategy
WO2024145266A1 (en) Compositions and methods for diagnosing early-stage colorectal adenomas or cancers
CN117417999A (zh) 一种与ireb2基因相关的snp分子标记及其应用
Munz Identification of genetic risk factors predisposing to the inflammatory oral disease periodontitis

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20100106