CN1723217A - 使用单核苷酸多态性组分析受损样品的方法和组合物 - Google Patents
使用单核苷酸多态性组分析受损样品的方法和组合物 Download PDFInfo
- Publication number
- CN1723217A CN1723217A CNA038205491A CN03820549A CN1723217A CN 1723217 A CN1723217 A CN 1723217A CN A038205491 A CNA038205491 A CN A038205491A CN 03820549 A CN03820549 A CN 03820549A CN 1723217 A CN1723217 A CN 1723217A
- Authority
- CN
- China
- Prior art keywords
- nucleic acid
- snp
- snps
- sample
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6827—Hybridisation assays for detection of mutation or polymorphism
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6881—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for tissue or cell typing, e.g. human leukocyte antigen [HLA] probes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/16—Primer sets for multiplex assays
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Health & Medical Sciences (AREA)
- Zoology (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Physics & Mathematics (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Cell Biology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提供了分析受损核酸样品的方法和组合物。本发明还包括选择一组(a panel of)单核苷酸多态性的方法和该组单核苷酸多态性,选择该组单核苷酸多态性使其位于串联重复区域之外,并且不遗传连锁。
Description
技术领域
本发明涉及分析受损样品(compromised sample)的方法和组合物。
背景技术
经典遗传学、基因由核酸序列限定的发现、遗传物质结构的发现以及生物技术革命产生了通过核酸分析进行的人类鉴定科学。能够从完整的遗传物质样品高度可信地鉴定核酸样品来源的***已经迈了很大一步。
可以使用多种核酸分析技术用于揭示核酸样品之间的遗传相似性。例如,在基因组中存在的高度多态性重复序列可以用于遗传鉴定应用。这些应用可以在群体中高度可信地鉴定个体。一个重要的应用依赖于多态性串联重复基因座的分析。遗传鉴定应用的一个例子是FBI的组合DNA指数***或称CODIS,其使用13个多态性短串联重复基因座用于遗传鉴定。
串联重复基因座是基因组中的基因座,其含有变化长度的核苷酸序列的重复单位,如双核苷酸重复、三核苷酸重复、四核苷酸重复等等。重复单位的长度可从小至2个核苷酸变化至极大数目的核苷酸。重复可以是简单的串联序列重复或其复杂组合。在这种基因座的这些重复的长度或特性的改变称为这些基因座的多态性。这样的多态性最常起因于群体中的个体之间在一个基因座存在不同数目的这种重复。通过某些评估,串联重复在人类基因组中存在的平均频率为大约15000碱基。等位基因的数目,或在一个基因座的序列重复的多样性通常在大约少至3或4个到多至15或多至50甚至更多之间变化。其相对高的出现频率,以及显著程度的多态性使基因组的这些特征成为遗传鉴定应用的有吸引力的候选物。通过在核酸的非受损样品中测定足够数目的多态性串联重复基因座,并比较该个体的基因座的特性和来自第二个个体的参比样品中相同基因座的特性,可以确定所述个体是否与获得参比样品的第二个个体遗传相关。一般说来,在遗传鉴定应用中使用的多态性重复基因座的选择是使得它们彼此不连锁,或处于Hardy-Weinberg平衡。
在遗传鉴定应用中使用多种类型的串联重复基因座。短串联重复(STR)来自于核酸序列的短序列段的数目变化。在人类基因组中,认为STR在每几十万个碱基中出现一次。STR包括大约2-7个碱基,并且根据其含有的重复单位的数目而变化,并且其以简单和复杂重复存在。串联重复的另一种类型,小卫星重复,通常大约为10至50左右的碱基重复大约20-50次。微卫星重复通常为大约1-6碱基重复,多至6或多次。这些重复在基因组中可以发生成千上万次。对串联重复基因座的命名法是不准确的。这些和其它的串联重复可以用概括性的广义术语可变数目串联重复或VNTR来表示。
使用VNTR的遗传鉴定应用可以使用限制片段长度多态性分析(RFLP分析),一种基于凝胶的方法,或基于聚合酶链反应(PCR)的方法。RFLP分析利用了通过使用限制性内切核酸酶从非受损核酸样品中产生的核酸片段之间的长度差异。限制性内切核酸酶,简称内切核酸酶,是在高度可预测位置片段化或切割核酸的酶。如果两种完整的核酸样品被相同的内切核酸酶切割,如果它们的遗传序列是相同的,那么它们的片段化模式将是相同的。如果样品不同,则部分基于在某些位置的切割位点的选择,它们将产生不同的片段,这些位置的切割位点的选择使得根据在预测片段的切割位点内或切割位点处多态性串联重复基因座的出现,将产生预计不同的片段大小。如许多使用串联重复基因座的遗传鉴定应用一样,RFLP分析依赖于基于核酸片段通过大小分离凝胶(sizing gel)的电泳迁移或基于其它的大小分离方案来分离或分辨核酸片段的能力。然而,基于大小分离的方案由于大小分离方法的分辨能力而固有地被限制;太小或大小上仅轻微不同的片段是不可分辨的。尽管RFLP分析是潜在的强有力的遗传鉴定应用,但其通常需要相当完整的核酸样品。而且,RFLP分析需要相当量的核酸,并需要相对长的时间以产生和解释结果。
使用串联重复基因座和PCR的遗传鉴定应用需要较少的核酸。在基于PCR的应用中,含有具有串联重复序列的基因座的序列被扩增或被复制许多次,然后通常使用大小分离方案分离和鉴定。然而,由于PCR聚合酶的属性以及串联重复基因座的属性,由于PCR扩增过程中的“打滑(slippage)”或“口吃(stutter)”,PCR方法倾向于出现人为结果。这种打滑或口吃是由于聚合酶不能忠实和准确地复制含有串联重复的序列所致。串联重复序列的属性有时引起PCR聚合酶跳过重复单位元件而有时引起过度复制重复单位元件。结果,含有串联重复的序列的扩增拷贝比原始序列长或短,因此不能提供遗传鉴定应用所需要的忠实度。而且,大多数基于PCR的应用依赖于大小分离方法进行鉴定,因此在这一方面有与RFLP分析一样的缺点。由于许多有用的串联重复基因座的长度,扩增或复制的序列一般必须有至少接近100并多至1000或更多个碱基的长度。受损的核酸样品不一定如此完整到含有用于遗传鉴定应用的足够数目的串联重复基因座。
由于含有不确定身份(identity)或起源的核酸的样品的受损属性,使用现有的遗传鉴定应用常常不可能。许多因素导致不能从受损样品中提取遗传信息。样品可能已经暴露于物理作用,如热或剪切力,来自例如太阳的紫外线。样品可能经受过多的化学降解剂,以及许多生物降解过程,例如,暴露于微生物或核酸酶。这些过程可能导致样品含有的基因座数量比用于遗传分析的完整的有用基因座的最佳数量要少,导致受损样品没有足够的信息用于目前使用的遗传鉴定应用。
因此,仍然需要用于受损的核酸样品的遗传鉴定应用,其应该不必需依赖于大小分离方案而进行鉴定,以及不依赖于用于鉴定目的的足够的串联重复基因座的存在。
发明简述
在一个实施方案中,本发明包括一组(a panel of)用于从受损样品确定人身份的单核苷酸多态性。在本发明的另一个实施方案中,该组单核苷酸多态性包括选自如下一组中的核酸序列:SEQ ID NOS.25-36、61-72、98-109、134-145、170-181、206-217、242-253、278-289、314-325、351-362、387-398、423-434和457-467。
在另一个实施方案中,本发明包括一种从感兴趣的群体产生一组用于分析受损的核酸样品的单核苷酸多态性的方法,包括:在感兴趣的群体的基因组中选择一组两种或多种单核苷酸多态性,其中该组两种或多种单核苷酸多态性的每一种均是彼此不遗传连锁的基因组单核苷酸多态性,且其中该组两种或多种单核苷酸多态性的每一种均是位于串联重复核酸序列之外的基因组单核苷酸多态性,由此从感兴趣的的群体产生用于分析受损的核酸样品的该组单核苷酸多态性。在另一个实施方案中,本发明包括一种方法,其中所述受损样品包括长度为大约10个核苷酸至大约100个核苷酸的核酸。在另一个实施方案中,使用的方法中所述感兴趣的群体是人类。在另一个实施方案中,本发明使用的方法中的感兴趣的群体是一个失踪(missing)的人。
在另一个实施方案中,本发明包括一种从受损的核酸未知样品中确定个体身份的方法,包括:从个体获得具有两种或多种单核苷酸多态性的受损核酸的未知样品;鉴定存在于受损核酸未知样品中的两种或多种单核苷酸多态性;将受损样品中两种或多种单核苷酸多态性的每一种的性质与已知样品的一组单核苷酸多态性进行比较,以确定在未知样品中的两种或多种单核苷酸多态性的每一种和所述组之间的匹配数目,其中所述组包括两种或多种彼此不遗传连锁、并位于串联重复核酸序列之外的单核苷酸多态性;并根据未知样品和已知样品中两种或多种单核苷酸多态性的每一种之间匹配的数目确定未知样品和已知样品来自相同或相关个体的概率,因此从受损核酸未知样品确定个体的身份。
本发明的另一个实施方案包括一种从受损核酸未知样品确定个体身份的方法,包括:从个体获得具有两种或多种单核苷酸多态性的受损核酸的未知样品;获得具有两种或多种单核苷酸多态性的核酸的已知样品;选择一组两种或多种单核苷酸多态性,其中该组两种或多种单核苷酸多态性的每一种彼此不遗传连锁,并且其中该组的单核苷酸多态性的每一种均位于串联重复核酸序列之外;确定受损核酸样品中存在的该组两种或多种单核苷酸多态性的每一种的性质;确定已知样品中存在的该组两种或多种单核苷酸多态性的每一种的性质;比较在已知样品中观察到的该组两种或多种单核苷酸多态性的性质与在受损核酸的未知样品中观察到的该组两种或多种单核苷酸多态性的性质;并确定未知样品和已知样品来自相同或相关个体的概率,因此从受损核酸的未知样品确定个体的身份。
在本发明的另一个实施方案中,已知样品和未知样品来自相同个体。本发明的另一个实施方案包括已知样品来自一个家族成员的方法。在另一个实施方案中,所述受损核酸样品包括长度为大约10个核苷酸至大约100个核苷酸的核酸片段。在另一个实施方案中,使用单碱基引物延伸反应确定一或多个单核苷酸多态性的性质。在另一个实施方案中,受损样品的两种或多种单核苷酸多态性在一多重反应中鉴定。在另一个实施方案中,该组两种或多种单核苷酸多态性在一多重反应中鉴定。在另一个实施方案中,该组两种或多种单核苷酸多态性在一阵列中鉴定。在另一个实施方案中,受损样品的两种或多种单核苷酸多态性在一阵列中鉴定。在另一个实施方案中,所述阵列是可寻址阵列。在另一个实施方案中,所述阵列是可寻址阵列。在另一个实施方案中,所述阵列是虚拟(virtual)阵列。在另一个实施方案中,所述阵列是虚拟阵列。
在另一个实施方案中,本发明包括一种对受损核酸样品基因分型的方法,包括:从个体获得受损核酸样品;鉴定存在于受损核酸样品中的两种或多种单核苷酸多态性;并将受损样品中的两种或多种单核苷酸多态性的每一种的性质与一感兴趣群体的一组单核苷酸多态性进行比较,以确定受损样品中的所述两种或多种单核苷酸多态性的每一种在感兴趣的群体中的发生频率,其中所述组包括两种或多种彼此不遗传连锁、并位于串联重复核酸序列之外的单核苷酸多态性;由此对受损核酸样品基因分型。
在另一个实施方案中,本发明包括一种对受损核酸样品基因分型的方法,包括:从个体获得受损核酸样品;从感兴趣的群体基因组选择一组单核苷酸多态性,所述组包括两种或多种单核苷酸多态性,其中该组两种或多种单核苷酸多态性的每一种彼此不遗传连锁、并位于串联重复核酸序列之外;鉴定受损核酸样品中存在的两种或多种单核苷酸多态性;并将在受损样品中观察到的两种或多种单核苷酸多态性的性质与在该组中观察到的两种或多种单核苷酸多态性的性质进行比较以确定基因型,从而获得受损核酸样品基因型。一个进一步的实施方案包括一种基因分型方法,其中所述组的单核苷酸多态性是双等位基因的(biallelic),其中每一等位基因中的多态性性质是T和/或C。在另一个实施方案中,本发明包括一种基因分型方法,其中所述感兴趣的群体是人类。一个进一步的实施方案包括一种基因分型方法,其中所述样品包括人类核酸。另一个实施方案包括一种基因分型方法,其中所述受损核酸样品中存在的两种或多种单核苷酸多态性使用一单碱基引物延伸反应鉴定。另一个实施方案包括一种基因分型方法,其中受损核酸样品中存在的两种或多种单核苷酸多态性在一多重反应中鉴定。另一个实施方案包括一种基因分型方法,其中受损核酸样品中存在的两种或多种单核苷酸多态性在一阵列上鉴定。一个进一步的实施方案包括一种基因分型方法,其中所述阵列是可寻址阵列。仍然另一个实施方案包括一种基因分型方法,其中所述阵列是虚拟阵列。仍然另一个实施方案包括一种基因分型方法,其中所述受损核酸样品扩增至长度为大约10个核苷酸至大约100个核苷酸。
为了更好的理解本发明以及其它和进一步的优点和实施方案,以下结合描述实施例进行参考,保护范围在附加的权利要求中。
附图说明
图1描述了本发明的一个实施方案,其中获得受损的核酸样品;使用受损样品的核酸作为模板扩增含有单核苷酸多态性或称SNP的核酸;将扩增的含有单核苷酸多态性的核酸进行引物延伸反应,其中引物延伸一个单碱基,例如一个标记的核苷酸衍生物;确定扩增核酸的单核苷酸多态性的性质;将来自扩增核酸的每个单核苷酸多态性的性质与参比样品中的每一对应的单核苷酸多态性的性质进行比较;并确定受损样品的核酸与参比样品的核酸遗传相似的可能性。
优选实施方案详述
现在将结合优选实施方案描述本发明。这些实施方案是为了帮助理解本发明,而无意并且也不应该以任何方式限制本发明。所有的可选择方案、修改以及等同物对本领域技术人员来说在阅读完本发明的公开后将是显而易见的,并且包含在本发明的范围和精神之内。
本公开不是分析受损核酸的引物,对本领域技术人员来说已知的或容易确定的基本概念没有详细描述。
在一个实施方案中,本发明包括一组用于分析受损核酸样品的单核苷酸多态性,其包括两种或多种单核苷酸多态性,其中该组两种或多种单核苷酸多态性的每一种选自彼此不遗传连锁的单核苷酸多态性,且其中该组两种或多种单核苷酸多态性的每一种选自位于串联重复核酸序列之外的单核苷酸多态性。
“组(panel)”表示一组预选的适用于鉴定群体的一个成员的单核苷酸多态性。例如,在一个优选的实施方案中,所述的组包括一些从人类基因组的单核苷酸多态性预选的单核苷酸多态性,其中所述单核苷酸多态性的数量和特性足以将一个个体遗传鉴定到统计学可信的程度。遗传鉴定包括通过观察该组单核苷酸多态性的性质在群体中将一个个体与另一个体区别的能力。例如,通过将组中的单核苷酸多态性的性质与含有该组全部或一些单核苷酸多态性的受损样品进行比较而区别一个个体与另一个个体。遗传鉴定包括在具有统计学可信度的程度上确定受损样品中的单核苷酸多态性与参比样品中的单核苷酸多态性是否相同或是否不同。所述参比样品可以,例如,包含来自另一个个体如一个家族成员的核酸。“遗传鉴定”还指在统计学可信度的程度上确定受损样品中的单核苷酸与一个以上的参比样品的单核苷酸多态性是否相同或是否不同。例如,受损样品的单核苷酸多态性可以与一组参比样品例如假定的家族成员中的单核苷酸多态性进行比较,以确定受损样品的核酸是否来自与获取所述一或多种参比样品的个体遗传相关的一个或多个个体。
“比较”单核苷酸多态性表示确定一个样品的单核苷酸多态性是否与另一个样品的单核苷酸多态性相同或不同,其中这两个样品中的一个是受损样品或两个都是受损样品,或者一个样品是受损样品而另一个样品是参比样品。
参比样品可以包括从取自一或多个供体个体的生物材料中确定的单核苷酸多态性,其中所述单核苷酸多态性的性质是从所述生物材料中确定的。参比样品可以是以任何方式确定其性质的单核苷酸多态性的任何集合。例如,参比样品可以是这样的单核苷酸多态性的集合,其无须通过直接从核酸的生物样品中确定其性质而确定其存在,,而是例如通过从蛋白中推导核苷酸序列而产生的,或者通过在一组家族成员中观察单核苷酸多态性而产生单核苷酸多态性。例如,一个参比样品包括家族成员的预期基因型,而预期的家族成员的基因型是通过观察其它家族成员的基因型并使用本领域熟知的遗传算法和理论,获得家族成员的预期基因型而产生的。与本发明的实施方案相关的是,这样的预期基因型包括一组由家族成员的基因型和通过使用本领域已知的遗传算法和理论推导的预期家族成员会展示的单核苷酸多态性的性质。
以“统计学可信度的程度”鉴定个体是指建立受损样品与参比样品或另一受损样品遗传相关的统计学可信度的程度。为了获得该结果,在遗传鉴定领域中已知有多种方法。在一给定的例子中,为了达到统计学可信度,使用的算法和方法可以不同。例如,一组单核苷酸多态性在两个样品之间或者一个样品和一个参比样品之间相同时,统计学可信度的程度可以从与样品中的或每一基因座的每一等位基因相关的个体概率计算。
如果可以从统计学可信度的程度说样品来自限定的感兴趣的群体,那么一受损样品与另一受损样品或参比样品是“遗传相关的”。“限定的感兴趣的群体”是指在其基因组中共享某些特征的一组感兴趣的个体,例如,家族成员、种族如亚洲人、非洲人、土著美国人等等。“限定的感兴趣的群体”可以小至单个个体,或可以多至在人类种群中的所有女性或所有男性。因此,例如,如果限定的感兴趣的群体由所有亚洲人组成,那么来自亚洲种系的男性个体的受损样品可以是与亚洲女性同胞“遗传相关的”,但如果限定的感兴趣的群体仅由亚洲男性组成,那么这种情况下该男性个体的受损样品将将不能被认为是与亚洲女性同胞“遗传相关的”。
“受损的核酸样品”是指已知含有或怀疑含有核酸的生物样品,其中样品的核酸是被过度降解的。例如,用不含足量的完整的法医上有用的串联重复序列的片段组成的核酸样品是不能可靠地使用串联重复位点分析,例如使用依赖于CODIS基因座的鉴定***,完成核酸样品的遗传分析的。实际中,核酸样品,特别是用于法医分析的核酸样品可能是明显降解的。该样品可能已经暴露于物理作用,如热或剪切力,来自例如太阳的紫外线。样品可能已经受过多的化学降解过程。样品可能已经受到多种生物降解过程,例如,如暴露于微生物或核酸酶。这些过程可能导致样品含有低于可适于使用本领域已知的、并非利用单核苷酸多态性的遗传分析的最佳数量的完整有用基因座,由此使受损样品不能作为目前应用的遗传鉴定应用的有用信息。在本发明的一个优选的实施方案中,受损核酸样品包括长度为大约10个核苷酸至大约100个核苷酸的核酸。最优选地,受损核酸样品基本由长度为至少50个至至少大约100个核苷酸的核酸片段组成。实践中,受损样品甚至可能含有短至长度为一或两个核苷酸的核酸片段,只要在样品中存在足够的长度为10至100核苷酸的核酸,则该样品就携带了足够的单核苷酸多态性以对样品进行基因分析或以统计学可信度的程度鉴定个体。同样,受损样品可能含有长度超过100个核苷酸的核苷酸片段。
“彼此不遗传连锁”是指选择本发明的单核苷酸多态性以便如果它们位于相同的染色体和核酸分子上相互相距一个所需的距离。优选地,选择的一组单核苷酸多态性相距大约10至15兆个碱基。最优选地,一组单核苷酸多态性相距大约20至100或更多兆个碱基。合适的单核苷酸多态性包括彼此不是连锁不平衡的那些,虽然也不需要任何组的任何单核苷酸多态性存在完全的平衡。合适的一组单核苷酸多态性包括互相遗传独立的那些。也就是说,合适的单核苷酸多态性包括其中没有一个组的两个单核苷酸多态性总是一起遗传的那些。
串联重复基因座是基因组中的基因座,其含有变化长度的核苷酸序列的重复单位,如双核苷酸重复、三核苷酸重复、四核苷酸重复等等。重复单位的长度从小至2个核苷酸变化至极大数目的核苷酸。重复可以是简单的串联序列重复或其复杂组合。在这种基因座的这些重复的长度或特性的改变称为在这些基因座的多态性。这样的多态性最常起因于群体中的个体之间在一个基因座存在变化数目的这样的重复。通过某些评估,串联重复在人类基因组中存在的平均频率为大约15000碱基。在一个基因座的等位基因的数目或序列重复的多样性通常在大约少至3或4个到多至15或多至50或更多之间变化。其相对高的出现频率,以及显著程度的多态性使基因组的这些特征成为遗传鉴定应用的有吸引力的候选物。通过在核酸的非受损样品中检测足够数目的多态性串联重复基因座,并比较该个体的基因座的特性和来自第二个个体的参比样品中相同基因座的特性,可以确定所述个体是否与获得参比样品的第二个个体遗传相关。一般说来,在遗传鉴定应用中使用的多态性重复基因座的选择是使得彼此不连锁,或处于Hardy-Weinberg平衡。
在遗传鉴定应用中使用多种类型的串联重复基因座。短串联重复(STR)归因于短的核酸序列段数目的变化。在人类基因组中认为STR在每几十万个碱基中出现大约一次。STR大约为2-7个碱基,并且其含有的重复单位的数目可变,而且以简单和复杂重复存在。另一种类型的串联重复,小卫星重复,通常大约为10至50个左右碱基,重复大约20-50次。微卫星重复通常为大约1-6个碱基,重复多至6或多次。这些重复在基因组中可以出现成千上万次。对串联重复位点的命名法是不准确的。这些和其它的串联重复可以用通用的广义术语可变数目串联重复,或称VNTR来表示。
本发明的另一个实施方案包括一种从感兴趣的群体中产生一组单核苷酸多态性用于分析受损核酸样品的方法,包括:在感兴趣的群体的基因组中选择一组两种或多种单核苷酸多态性,其中所述一组两种或多种单核苷酸多态性的每一种是彼此不遗传连锁的基因组的单核苷酸多态性,且其中所述一组两种或多种单核苷酸多态性的每一种都是位于串联重复核酸序列之外的基因组的单核苷酸多态性,由此从感兴趣的群体中产生一组单核苷酸多态性用于分析受损核酸样品。
“产生一组单核苷酸多态性”是指从感兴趣的基因组中选择合适的单核苷酸多态性的方法,其中所述单核苷酸多态性用于遗传分析或鉴定。产生一组单核苷酸多态性包括选择本发明的位于串联重复核酸区域之外、并且彼此不遗传连锁的单核苷酸多态性。然后通过本领域已知的任何方法分析所述单核苷酸多态性以便选择能够在一多重反应中鉴定单核苷酸多态性的引物。该分析通常包括,例如选择多态性,其中所述检测引物和扩增引物将有相同或相似的解链和退火温度,用于扩增和单碱基延伸反应。
可以使用一或多种组分析含有受损核酸的单一样品。选择本发明的单核苷酸多态性以便在如果它们位于相同的染色体和核酸分子上时互相之间相距所需的距离。优选地,选择一组单核苷酸多态性以便相距大约10至15兆碱基。最优选地,一组单核苷酸多态性相距大约20至大约100或更多兆碱基。合适的单核苷酸多态性包括互相不是连锁不平衡的那些,虽然不需要任何组的任何单核苷酸多态性都处于完全平衡。合适的一组单核苷酸多态性包括互相遗传独立的那些。也就是说,合适的单核苷酸多态性包括其中没有一个组的两个单核苷酸多态性总是一起遗传的那些。最优选地,所述组的单核苷酸多态性是双等位基因的。最优选地,组的单核苷酸多态性的等位基因的性质全是T/C。
本发明的另一个实施方案包括一种从受损核酸的未知样品中确定个体身份的方法,包括:从个体获得具有两种或多种单核苷酸多态性的受损核酸的未知样品;鉴定存在于受损核酸的未知样品中的两种或多种单核苷酸多态性;将受损样品中的两种或多种单核苷酸多态性的每一种的性质和已知样品的一组单核苷酸多态性进行比较,以确定在未知样品中的两种或多种单核苷酸多态性的每一种和组之间匹配的数目,其中所述组包括两种或多种彼此不遗传连锁、并位于串联重复核酸序列之外的单核苷酸多态性;并根据未知样品和已知样品中两种或多种单核苷酸多态性的每一种之间匹配的数目确定未知样品和已知样品来自相同或相关个体的概率,因此从受损核酸的未知样品确定个体的身份。
“确定个体的身份”是指确定感兴趣的个体的特性。在一个优选的实施方案中,“确定个体的身份”是指在高度统计学可信度的程度上确定个体是感兴趣群体中的哪一个,以排除感兴趣的群体中的所有其它个体。在最优选的实施方案中,“确定个体的身份”包括具有高度统计学可信度的从整个人类群体中鉴定单一个体。最优选地,统计学可信度的程度是十亿中的一个或更高。这样程度的可信度是用大约三十个单核苷酸多态性获得的。然而,可以使用本发明,其中所述受损样品与参比样品比较,其中“确定个体的身份”需要低得多程度的统计学可信度。
“未知样品”是指已知物质或怀疑含有受损核酸的物质的样品,其中受损核酸来源的个体的身份是未知的,或未以期望程度的统计学可信度已知。
对一个受损样品中的单核苷酸多态性与另一个受损样品或参比样品中的单核苷酸多态性进行“性质比较”是指确定在一个样品中的单核苷酸多态性位点的核苷酸与在第二个样品中相同的单核苷酸多态性位点的核苷酸是否相同。对分析的每一个单核苷酸多态性都进行该比较,并确定每个单核苷酸多态性位点是否存在“匹配”。“匹配”是指在两个或更多样品中在一个单核苷酸多态性位点上的核酸的准确相同。在一个给定的单多态性位点上在相同链上带有相同核苷酸的两个或多个样品被称为对该位点而言“匹配”。
“确定未知样品和已知样品来自相同或相关个体的概率”是指比较在未知样品和已知样品中的单多态性位点存在的核苷酸的性质,并计算观察到的匹配偶然发生的统计学概率。本领域熟知计算匹配偶然发生的统计学可能性的方法和算法,其依赖于特定的核苷酸存在于一个特定的位点的概率。
“已知样品”是指已知含有受损或未受损核酸的物质的样品,其中已知样品来源的个体的身份是已知的,或以期望程度的统计学可信度已知。
本发明的另一个实施方案包括一种从受损核酸的未知样品确定个体身份的方法,包括:从个体获得具有两种或多种单核苷酸多态性的受损核酸的未知样品;获得具有两种或多种单核苷酸多态性的核酸的已知样品;选择一组两种或多种单核苷酸多态性,其中该组两种或多种单核苷酸多态性的每一种彼此不遗传连锁,并且其中该组单核苷酸多态性的每一种位于串联重复核酸序列之外;确定受损核酸样品中存在的该组两种或多种单核苷酸多态性的每一种的性质;以及确定已知样品中存在的该组两种或多种单核苷酸多态性的每一种的性质;比较在已知样品中观察到的该组两种或多种单核苷酸多态性的性质与在受损核酸的未知样品中观察到的该组两种或多种单核苷酸多态性的性质;以及确定未知样品和已知样品来自相同或相关个体的概率,因此从受损核酸的未知样品确定个体的身份。
“未知样品和已知样品来自相同个体”是指样品的来源来自属于同一个体的生物物质。如果两个个体相互具有任何程度的近亲相关,那么一个个体可以说是另一个个体的“家族成员”。最优选地,“家族成员”是胞亲或家系相关。
“单碱基引物延伸”是指在与多态性位点紧邻(immediatelyadiacent)的靶核酸上杂交延伸引物,并在聚合剂的存在下在足以使引物延伸的条件下延伸引物。最优选地,使用单一一个标记的终止核苷酸延伸引物。检测多态性位点的一个优选方法是使用酶辅助的引物延伸。SNP-ITTM(由Goelet,P.等人,和U.S.专利号5,888,819和6,004,744揭示,每一在此以其全文并入参考)是在靶核酸序列的预定多态性位点确定核苷酸性质的优选方法。因此,虽然其对确定多种多态性具有一般的实用性,但是其对SNP评分(scoring)是特别合适的。SNP-ITTM是一种多态性位点查询(interrogation)的方法,其中在靶核酸序列上多态性位点周围的核苷酸序列信息用于设计与靶核苷酸的多态性位点紧邻、但不包括可变核苷酸的区域互补的寡核苷酸引物。靶多核苷酸分离自生物样品,并与查询引物(interrogatingprimer)杂交。在分离以后,靶多核苷酸在与查询引物杂交前可以通过任何合适的手段扩增。通过单一标记的终止核苷酸子如双脱氧核苷酸,使用聚合酶,通常在存在一或多种链终止核苷三磷酸前体(或合适的类似物)下延伸引物。因此产生可检测的信号。如在此所用,与多态性位点紧邻包括在关于靶核酸方向是多态性位点的5’方向上大约1至大约100个核苷酸,更优选大约1至大约25个核苷酸。最优选地,引物在与多态性位点相关的5’方向与紧邻多态性位点的一个核苷酸杂交。
在SNP-ITTM的一些实施方案中,在延伸反应前引物结合到固体支持物上。在其它的实施方案中,在溶液中(如在一个试管内或微孔内)进行延伸反应,延伸产物随后结合到固体支持物上。在SNP-ITTM的另一个实施方案中,引物被可检测地标记并且延伸的终止子核苷酸被修饰以便能够使延伸的引物产物结合到固体支持物上。这例如包括引物被荧光标记,终止子核苷酸是生物素标记的终止子核苷酸,且固体支持物用抗生物素蛋白或链霉抗生物素蛋白包被或衍生。在这样的实施方案中,一个延伸的引物将能够与固体支持物结合并且非延伸的引物将不能够与支持物结合,因此依赖一个成功的延伸反应产生可检测的信号。
连接酶/聚合酶介导的遗传比特分析(genetic bit analysis)(U.S.Patent Nos.5,679,524和5,952,174,二者并入参考)是另一种用于确定在多态性位点的核苷酸性质的适当的聚合酶介导的引物延伸方法实例。连接酶/聚合酶SNP-ITTM使用两个引物。通常,一个引物被可检测地标记,而设计另一个引物结合到固体支持物上。连接酶/聚合酶SNP-ITTM的另外一个实施方案中,延伸的核苷酸被可检测地标记。设计连接酶/聚合酶SNP-ITTM的引物与一个多态性位点每一侧杂交,以便有一个包括多态性位点的缺口。只有在一个成功的延伸反应之后有一个成功的连接反应,才能产生一个可检测信号。这个方法通过仅使用杂交或引物延伸提供了产生具有相当低背景的信号的优势。
确定靶多核苷酸内预先确定的多态性位点的核苷酸特性的另一个方法由Sderlund et al.,U.S.Patent No.6,013,431(以其全文并入参考)描述,在这个方法中,使用靶核酸序列的多态性位点周围的核苷酸序列信息设计一个引物,该引物与靶的多态性位点5′侧翼的一个不包括可变核苷酸的区域互补。靶多核苷酸从生物学样品分离并且与一个查询引物杂交。这个方法的一些实施方案中,分离后,通过任何适当的手段扩增靶多核苷酸,然后与查询引物杂交。常常在存在至少一种标记脱氧核苷酸和一或多种链终止核苷三磷酸前体(或适当的类似物)的混合物时,使用聚合酶延伸引物。标记脱氧核苷酸掺入引物产生一个可检测信号。
本发明的引物延伸反应使用一或多个标记核苷酸混合物和聚合剂。在此使用的术语“核苷酸”或核酸指处于通过聚合剂能够被加入到引物中的任何磷酸化状态的核糖核苷酸,脱氧核糖核苷酸,核苷酸无环衍生物,和其功能性等价物或衍生物。例如,在一个扩增方法或一个引物延伸方法中,核苷酸的功能性等价物可作为聚合酶底物。核苷酸的功能性等价物也可形成保留了与靶多核苷酸以序列特异性方式杂交的能力的多核苷酸。核苷酸例如包括链终止核苷酸,最优选的是双脱氧核苷三磷酸(ddNTP),如ddATP,ddCTP,ddGTP和ddTTP;但是,本领域技术人员已知的其它的终止子,例如无环核苷酸类似物,其它无环类似物和***糖苷三磷酸也在本发明的范围内。优选ddNTP与常规的2’脱氧核苷三磷酸(dNTP)的不同在于它们在糖组分的3’位置没有羟基。
使用的核苷酸可带有一个可检测的特性。在此使用的可检测特性包括能够区分核苷酸的任何可鉴别的特性。重要的是,可检测的特性不能干扰本发明的任何方法。可检测的特性指使用适当的检测方法能够检测到的原子或分子或分子部分。可检测的特性包括固有质量(inherent mass),电荷,电子自旋,质量标记,发射性同位素,染料,生物发光,化学发光,核酸特性,半抗原,蛋白质,光散射/相移位(phase shifting)特性,或荧光特性。
可依据本领域已知的任何技术标记核苷酸和引物。优选的标记包括放射性标记,荧光标记,酶标记,蛋白质,半抗原,抗体,序列标记,质量标记,荧光标记等。优选的染料类型包括,但是不局限于,TAMRA(羧基一四甲基罗丹明),ROX(羧基-X-罗丹明),FAM(5-羧基荧光素)等。
本发明的引物延伸反应可使用一或多种标记核苷酸碱基。优选地,使用两或多种不同碱基的核苷酸。最优选地,本发明的引物延伸反应使用4个不同碱基的核苷酸。在最优选的实施方案中,所有4个不同类型的核苷酸被可区分的标记物标记。例如,使用dR6G标记A,使用dTAMRA标记C,使用dR110标记G和使用dROX标记T。
一旦使用引物延伸反应,延伸的和未延伸的引物(如果有)可被相互分离以便于鉴别一或多个被查询的等位基因的多态性位点。可通过任何本领域已知的方法分离核酸。一些分离方法包括使用嵌入染料例如溴化乙锭检测DNA双链,检测特异性序列和/或分离或捕获已知或未知结构的寡核苷酸分子的杂交方法以及与本领域熟知的印迹方法相关的杂交方法。杂交方法可与本领域熟知的其它分离技术组合使用,如通过固相捕获分离标记的寡核苷酸,如免疫亲和珠捕获半抗原连接的寡核苷酸,该珠可以是磁性的。固相捕获技术也包括DNA亲和层析,其中通过带有互补序列的固定化寡核苷酸捕获寡核苷酸。特异性多核苷酸标记被工程化入寡核苷酸引物,且通过与固定化互补序列杂交而分离。这样的固相捕获技术还包括在链霉抗生物素蛋白包被的珠(磁性或非磁性的)上捕获生物素标记的寡核苷酸。使用更传统的方法如离心,电泳方法或沉淀或表面沉积方法也可分离DNA。当延伸的或未延伸的引物存在于溶液相时,该方法非常好。术语“溶液相”在此指均相或非均相混合物。这样的混合物可以是水溶液的,有机的或同时含有水性成分和有机成分。术语“溶液”在此与悬浮液同义,其中包括悬浮在液体介质中的微粒。
通过任何本领域已知的方法可检测多态性位点。一个核苷酸检测方法是通过荧光技术。例如,可以构建在没有与靶核酸序列杂交时猝灭的荧光杂交探针。其它的方法利用具有重叠吸收(overlappingabsorption)和发射光谱的荧光团之间的能量转移作用,所以当如捕获或杂交时,在2个荧光团非常接近时可以检测信号。
通过涉及电磁辐射行为的多种分光光度法,或标记可检测的部分来检测核苷酸。这些分光光度法包括,例如,电子自旋共振,光学活性或旋光光谱学如圆二色谱学,荧光学,荧光偏振化,吸收/发射光谱学,紫外线,红外线,可见光或质谱学,Raman光谱学和核磁共振光谱学。
依据本领域已知的任何技术可标记核苷酸和其类似物,终止子和/或引物。优选的标记包括放射性标记,荧光标记,酶标记,蛋白质,半抗原,抗体,序列标记,质量标记,荧光标记等。优选的染料类型标记包括,但不局限于TAMRA(羧基二四甲基罗丹明),ROX(羧基-X-罗丹明),FAM(5-羧基荧光素)等。
术语“检测”指鉴别一种可检测的部分。这一术语包括通过电磁特性鉴别一种部分的能力,例如,电荷,光,荧光,化学发光,电磁特征的改变,例如,荧光偏振,光偏振,二色性,光散射,折射率改变,反射,红外线,紫外线和可见光谱,质量,质量:电荷比率和所有依赖于电磁辐射或电磁辐射改变的检测技术的方式。术语也包括基于结合亲和力,内在质量,质量沉积,和静电特性,大小和序列长度鉴别部分。要注意特性,如质量和分子量可以通过表观质量或表观分子量评估,所以术语“质量”或“分子量”在此不排除通过多种设备和方法评估,因此不限制这些术语是任何唯一的绝对数值,而不参考获得质量和分子量的方法和设备。
检测多态性位点的核苷酸的另一个方法是通过比较引物延伸反应之后任意时间点,保持在反应混合物中的游离的、未掺入的核苷酸的浓度。在本实施方案中通常使用质谱学例如电喷射质谱检测未掺入的核苷酸。这个检测方法是可行的,因为在引物延伸反应过程中,在反应混合物中只有与多态性碱基互补的核苷酸被耗尽。因此,可使用质谱比较核苷酸质量峰的相对强度,同样地,可确定未标记引物的浓度且使用这一信息获得多态性位点核苷酸的性质。
引物可以是能够在延伸反应中在3’末端延伸的多核苷酸或寡核苷酸。在此,术语“多核苷酸”包括任何数量的核苷酸聚合物。术语“寡核苷酸”包括任何数目核苷酸的多核苷酸分子,优选少于大约100个核苷酸的多核苷酸分子。更优选的,寡核苷酸的长度在5到100个核苷酸之间。最优选的,寡核苷酸长度在15到60个核苷酸之间。但是,特定寡核苷酸或多核苷酸的精确长度将依赖于许多因素,其依赖于其最终的功能或使用。影响寡核苷酸长度的一些因素是,例如寡核苷酸的序列,分析中使用的盐浓度和温度等变量的分析条件,以及是否寡核苷酸在5’末端被修饰以包括为了修饰寡核苷酸的质量:电荷比率的额外碱基,和/或提供一个标记捕获序列,其可用于地理分离寡核苷酸到DNA芯片或阵列上特异的杂交位置。短引物需要较低温度以与模板形成足够稳定的杂交复合体。本发明的引物应与靶核酸上链或下链互补。优选地,起始扩增引物在它们的3’末端不应自身互补,以避免引物折叠导致自身引导(self-priming)的结构和分析噪干扰信号。优选引物在3’末端缺乏自身互补的一个例外是在本发明的一个实施方案中,当使用一个延伸引物为flip-back引物时,优选某些程度的自身互补。当使用一个引物为flip-back引物时,引物应具有足够的自身互补性以便在没有靶核苷酸,或没有足够量的与自身引导事件竞争的靶核酸时,能够自身引导。本发明的优选引物包括从大约8到大约40个核苷酸长度的寡核苷酸。最优选地,PCR引物长度在大约18至大约25个碱基之间。最优选地,SNP-ITTM引物(Orchid Biosciences,Inc.)用作延伸引物以确定多态性位点核苷酸的性质。最优选地,SNP-ITTM引物的长度为40至45个碱基对,包括与多态性位点相邻序列互补的20至25个碱基对3’区域和与任何样品核酸序列都不互补的20个碱基对标记。
在现有技术中在非靶核酸的背景下,大约10个核苷酸的引物是可用于与互补的靶核酸序列选择性杂交的最短序列。最优选地,使用超过至少大约20到大约35个核苷酸的完整互补序列以保证充分水平的杂交特异性,当然靶DNA分子序列的长度可能有相当大的变化。本发明的引物必须能够与靶核酸序列特异性杂交,例如一或多个上游引物与一或多个靶核酸上链或一或多个核酸下链杂交。在此,如果2个分子在足以促进杂交的条件下能够形成反平行、双链核酸结构或杂合体,则这2个核酸序列被认为能够相互特异性杂交,但是在相同的条件下,与一个非靶核酸序列温育时它们必须基本上互相不能形成一个双链结构或杂合体。
如果一个核酸分子呈现完全的序列互补性,则称其是另一个核酸分子或是其自身的“互补物”。在此,当每个分子的每个核苷酸都能够与另一个分子的核苷酸形成碱基对时,这些分子被称是呈现“完全互补”。“基本上互补”指在至少常规的低严格条件下能够相互杂交或与自身杂交并具有足够的稳定性以允许退火的能力。同样地,如果在常规的高严格条件下,分子可相互杂交并具有足够稳定性以允许它们保持相互退火,则它们被称为是“互补的”。常规的严格条件例如Sambrook,J.,et al.,Molecular Cloning,a Laboratory Manual,2ndEdition,Cold Spring Harbor Press,Cold Spring Harbor,N.Y.(1989)(在此并入参考)描述。不是完全互补因而是可能的,只要这没有完全排除分子形成一个双链结构或杂合体的能力。
在实践本发明时使用的引物可以在5’端标记。标记包括任何标记,如放射性标记,荧光标记,酶标记,蛋白质,半抗原,抗体,序列标记等。优选地,标记不干扰本发明的方法。典型地,标记可附着到引物的5’末端,其其余引物序列与靶核酸互补。一个优选的标记包括独特标记或标记每种引物,所述引物具有与结合到固体支持物上的序列互补的独特序列,其中这样的固体支持物可包括阵列,包括可寻址阵列。因此,在适当的杂交条件下,当引物暴露于固体支持物时,标记与结合到固体支持物的互补序列杂交。这样,通过阵列上的几何位置或通过其它手段用探针鉴别与标记相关的点可以确定引物特性。与5’标记互补的序列可以在例如可寻址阵列上的离散位置上与固体支持物结合。
在本发明中使用的聚合剂可从多种生物体中分离或克隆,所述生物体包括病毒、细菌、古细菌、真菌、支原体、原核生物和真核生物。优选的聚合剂包括聚合酶。使用本发明的方法和设备进行单碱基延伸的优选聚合酶是呈现很少或没有核酸外切酶活性的聚合酶。更优选的是耐受并在超过生理温度具有活性的聚合酶,例如50℃到70℃或耐受至少90℃到大约95℃。优选的聚合酶包括来自水生栖热菌(T.aquaticus)(购自ABI,Foster City,CA)的Taq聚合酶,Sequenase和ThermoSequenase(购自U.S.Biochemical,Cleveland,OH)和Exo(-)聚合酶(购自New England Biolabs,Beverley,MA)和AmpliTaqGold。也可使用任何呈现热稳定性的聚合酶,例如,栖热菌属来源的聚合酶,包括水生栖热菌(Thermus aquaticus),Thermus brocianus,嗜热栖热菌(Thermus thermophilus)和黄栖热菌(Thermus flavus);火球菌(Pyrococcus)属,包括激烈火球菌(Pyrococcus furiosus),火球菌GB-D(Pyrococcus sp.GB-D)和沃氏火球菌(Pyrococcus woesei),Thermococcus litoralis和Thermogata maritime。生物活性的蛋白酶片段,重组聚合酶,遗传工程化的聚合酶和修饰的聚合酶都包括在聚合剂的定义中。可以理解不用过多的实验,本发明即可以使用多种来源的多种类型的聚合酶。
“多重反应”是指在一个单反应中鉴定两种或多种单核苷酸多态性。“多重反应”还包括在一个单反应中制备受损样品中存在的两种或多种靶核酸,例如通过扩增,以及鉴定两种或多种单核苷酸多态性。优选地,在一个“多重反应”中,至少大约10至大约50个单核苷酸多态性在一个单反应中被鉴定。最优选地,例如通过扩增制备大约12个靶核酸,在一个单反应中鉴定了大约12个单核苷酸多态性。优选地,用于从受损样品扩增核酸的引物显示了相似的解链温度,使得可以在一个单反应中产生包含一或多个组的单核苷酸多态性的多个扩增子。最优选地,在一个单反应中产生大约12个扩增子。可以通过本领域任何已知的方法实现对用于多重反应目的(multiplexingpurposes)的组的单核苷酸多态性的选择,可以基于解链温度的相似性选择延伸引物。最优选地,选择包含相距大约20-100兆碱基的、并是双等位基因的双等位基因T/C多态性的单核苷酸多态性的核酸序列并输入Autoprimer软件(http://www.autoprimer.com,在此并入参考),并且Autoprimer提供了大约12个适合用于多重扩增反应和基于引物的解链温度的单碱基延伸反应中的单核苷酸多态性的组。
可以通过本领域已知的任何方法分离和鉴定延伸引物。优选的分离和鉴定引物延伸产物的方法是通过毛细管凝胶电泳,其中使用荧光检测仪来鉴别荧光终止核苷酸标记的引物延伸产物。通过它们的质量:电荷比率分离带有荧光标记的延伸引物。最优选地,使用在其5’端带有标记捕获序列的SNP-ITTM引物(Orchid Biosciences,Inc.)。在该实施方案中,用荧光终止子在SNP位点进行单碱基引物延伸后,将反应混合物应用于带有与引物的标记捕获序列互补的序列的阵列上,其中在阵列上放置这样的互补序列的位置是已知的。在该实施方案中,在阵列的已知位置上的合适的荧光信号表明在SNP位点存在的核苷酸的性质。最优选地,使用SNPstream UHTAssay KitTM(OrchidBiosciences,Inc.)进行分析,并使用SNPstream UHT Array ImagerTM和SNPstream Laser EnclosureTM结合控制计算机、数据分析计算机、服务器计算机和SNPStream数据分析软件包(Data Analysis SoftwareSuiteTM)(全部来自Orchid Biosciences,Inc.)进行鉴定。然而,本领域技术人员已知多种分离和检测方法,而且此处本发明适合许多检测和分离方案。
优选的分离方法使用暴露任何延伸的和未延伸的引物到固体支持物上。固体支持物包括阵列。术语“阵列”在此指固定化生物分子在固体,半固体,凝胶或聚合物相上多个位置上的有序排列。这个定义包括已用二氧化硅,硅烷,硅,硅酸盐和其衍生物,塑料和其衍生物,例如,聚苯乙烯,尼龙和,特别是聚苯乙烯板,玻璃和其衍生物,包括衍生化玻璃,玻璃珠,可控孔度玻璃(CPG)处理或包被的相。固定化的生物分子包括寡核苷酸,其可以包括其它部分,如标记和/或亲和性部分。术语“阵列”包括且与术语“芯片”、“生物芯片”、“生物芯片阵列”、“DNA芯片”、“RNA芯片”、“核苷酸芯片”和“寡核苷酸芯片”同义。所有这些术语包括阵列的阵列,并包括生物学聚合物,例如,已知或未知序列的寡核苷酸和DNA分子的阵列
本发明优选的阵列包括,但不局限于,包括以上定义的阵列的可寻址阵列,其中各个位置具有已知坐标以便阵列上一定位置的信号可被鉴别为具有特殊可鉴别的特性。术语“芯片”,“生物芯片”,“生物芯片阵列”,“DNA芯片”,“RNA芯片”,“核苷酸芯片”和“寡核苷酸芯片”包括阵列和微阵列的组合。这些术语也包括任何形状或构型的阵列,2维阵列和3维阵列。
一个优选的阵列是Affymetrix,Inc.的GenFlexTM标记阵列,它由2000个标记序列的捕获探针组成。它们是20聚体,选自具有相似杂交特性且与公开的数据库中的序列至少具有最小的同源性的所有可能的20聚体。最优选的阵列是SNPstream UHT ArrayTM(OrchidBiosciences,Inc.)。
另一个优选的阵列是可寻址的阵列,其具有与本发明中使用的引物的任何5’标记互补的序列标记。这些互补的标记结合阵列上的已知位置。这种类型的标记在适当杂交条件下与阵列杂交。通过定位结合的引物和检测一或多个延伸的引物,多态性位点的核苷酸性质可被确定。
在本发明的一个优选的实施方案中,靶核酸序列被排列为允许多个同时检测(多重技术(multiplexing))以及使用寡核苷酸阵列平行处理的形式。
在另一个实施方案中,本发明包括虚拟(virtual)阵列,其中延伸的和未延伸的引物在包含微球体悬液的阵列上分离,其中微球体带有一或多个捕获部分以便分离独特标记的引物。微球体进而带有独特的鉴别特性以便它们能够基于该特性,例如,直径,密度,大小,颜色等而被分离。
在另一个实施方案中,本发明包括一种对受损核酸样品基因分型的方法,包括:从个体获得受损核酸样品;鉴定存在于受损核酸样品中的两种或多种单核苷酸多态性;并比较受损样品中的两种或多种单核苷酸多态性的每一种的性质和感兴趣的群体的一组单核苷酸多态性,以确定在受损样品和感兴趣的群体中的两种或多种单核苷酸多态性的每一种的出现频率,其中所述组包括两种或多种彼此不遗传连锁、并位于串联重复核酸序列之外的单核苷酸多态性;因此对受损核酸样品基因分型。
“基因分型”指首先限定一组感兴趣的遗传特性,然后以统计学可信度的程度确定感兴趣的遗传特性是否存在于受损核酸样品中的可能性。在本发明的一个实施方案中,感兴趣的遗传特性是感兴趣的群体中的一组单核苷酸多态性,其中单核苷酸多态性彼此不遗传连锁、并位于串联重复核酸序列之外。如在此所用,“基因分型”表示在一个样品或参比样品中发现的一或多个所述组的单核苷酸多态性的核苷酸的性质。
单核苷酸多态性的“出现频率”是指在感兴趣的群体中的特定单核苷酸多态性位点出现特定核苷酸的观测频率。最优选地,本发明的单核苷酸多态性是双等位基因的,而且多态性核苷酸的性质是T和/或C。
在另一个实施方案中,本发明包括一种对受损核酸样品基因分型的方法,包括:从个体获得受损核酸样品;从感兴趣的群体基因组中选择一组单核苷酸多态性,所述组包括两种或多种单核苷酸多态性,其中该组两种或多种单核苷酸多态性的每一种彼此不遗传连锁、并位于串联重复核酸序列之外;鉴定在受损核酸样品中存在的两种或多种单核苷酸多态性;并比较在受损样品中观察到的两种或多种单核苷酸多态性的性质与在组中观察到的两种或多种单核苷酸多态性的性质,以确定基因型,从而获得受损核酸样品的基因型。
“人类核酸”是指来自人类的任何种类的核酸。“人类核酸”是指包括含有被环境或其它因素降解或化学或物理修饰的核酸样品,唯一的限制是它们可以用于本发明的鉴定或遗传分型方法。
“扩增”是指增加靶核酸数目。在本发明的一个实施方案中,受损核酸样品的靶核酸通过使用PCR引物的聚合酶链反应(PCR)的方法被扩增。然而,“扩增”并不限于PCR。如在此所用,扩增指任何增加靶核酸数量的技术,包括但不限于杂交和用于富集感兴趣的靶核酸产量或数目的亲合性方法。
“靶核酸”是指含有一或多种感兴趣的单核苷酸多态性的核酸序列。靶核酸序列优选对于该核酸与寡核苷酸或多核苷酸分子杂交的能力而言是生物学活性的。靶核酸序列可以是DNA或RNA、单链或双链或DNA/RNA杂种双螺旋。靶核酸序列可以是多核苷酸或寡核苷酸。在本发明的受损核酸样品中的靶核酸序列优选是大约10至大约100个核苷酸长。最优选地,在本发明的受损核酸样品中的靶核酸序列是大约10至大约50个核苷酸长。回收降解的、受损的和/或分馏的DNA的方法是本领域熟知的,包括凝胶电泳、HPLC和例如能利用基于与捕获序列杂交的多种序列回收的技术。
靶核酸可以从生物样品中分离的或衍生的。在此所用术语“分离”指基本上没有其它物质如非核蛋白、脂质、碳水化合物和其它物质如细胞碎片或与靶核酸相关的生长介质的状态。典型地,术语“分离的”不打算指完全没有这些物质。术语“分离”一般也不打算指没有稳定剂如水、缓冲液或盐,除非它们以基本上干预了本发明的方法的量存在。在此所用术语“样品”一般指含有核酸,或者DNA或RNA或DNA/RNA杂种的任何物质。样品可以来自任何来源,包括植物和动物,包括人。一般,这样的物质是以下形式:血液样品、组织样品、直接来自个体的细胞或在培养基中繁殖的细胞、植物、酵母、真菌、支原体、病毒、古细菌、组织切片或口腔拭子的形式,可以是新鲜的、固定的、冷冻的或包埋在石蜡或其它固定剂中。这样的样品能进行通过例如碱裂解的模板制备。其它的样品类型能进行分析,但可能需要不同的或更高程度的模板制备,例如酚/氯仿抽提,或在存在高盐浓度时将DNA捕获至二氧化硅基质。
靶核酸可以是单琏的,并可以来自双链DNA、RNA或其它核酸分子的上游或下游链核酸。靶核酸的上游链包括核酸的正链或有义链。靶核酸的下游链是指与靶核酸的上游链互补的负链或反义链。因此,描述时可以指任一链并且包括多态性位点,而且引物可以设计与任一条或两条链杂交。靶核酸并不限制在编码区的序列中,也可以包括基因组的任何区域或含有至少一个多态性的基因组的部分。术语基因组包括复杂基因组(complex genome),如在动物中发现的那些,不排除人类,和植物,以及非常简单和较小来源的核酸,例如病毒、类病毒的核酸以及任何其它的含有核酸的生物物质。
靶核酸序列或其片段含有多态性位点,或包括这样的位点和位于所述位点的远端或近端的序列。这些多态性位点或突变在核酸序列的特定位点可以是缺失、***、重排、重复序列、碱基修饰或单一或多碱基改变的形式。该改变的序列和更多的流行的或正常的序列可以在群体中共同存在。在某些情况下,这些改变对物种或物种中的个体没有赋予优势或劣势,序列的多种等位基因可以是稳定或准稳定平衡。然而在某些情况下,这些序列改变将赋予物种存活或进化优势,因此改变的等位基因最后将掺入到该物种许多或大多数成员的基因组中。在另一些情况下,改变的序列赋予物种劣势,如当突变引起或倾向于使个体产生遗传疾病或缺陷。如在此所用术语“突变”或“多态性位点”指在物种的某些成员、物种中的一个群体或物种之间的核酸序列中的改变,这样的突变或多态性包括但不限于,单核苷酸多态性(SNP)、一或多个碱基缺失,或一或多个碱基***。
个体中的多态性可以是杂合的或纯合的。纯合个体在同源染色体的一或多个相应位点具有相同的等位基因。杂合个体在同源染色体的一或多个相应位点具有不同的等位基因。如在此所用,等位基因包括基因或核酸序列的可选择形式,在基因编码区的内部或外部,包括内含子、外显子和非转录或非翻译区域。特定基因的等位基因一般在同源染色体上占据相同的位置。因此,可以说多态性是“等位基因的”,在于由于存在多态性,一个物种的某些成员携带具有一个序列的基因(如原始或野生型“等位基因”),而其它成员可能具有改变的序列(如变体或突变的“等位基因”)。在最简单的情况下,只存在序列的一个突变变体,多态性被说成是双等位基因的。例如,如果在一个位点的两个等位基因是不可区分的(例如A/A),那么在这种情况下该个体在该位点是纯合的。如果在一个位点的两个等位基因是可区分的(例如A/G),那么在这种情况下该个体在该位点是杂合的。大多数已知的单核苷酸多态性是双等位基因的一其中在这种情况下在特定位点有两个可选择的碱基。
现在已经一般性地描述了本发明,参考下述实施例后其将更加容易理解,提供以下实施例是为了说明本发明而不是试图限制本发明的精神或保护范围。
实施例
扩增
对一选择的组,通过聚合酶链反应(PCR)从受损样品中制备包含组的单核苷酸多态性的扩增子,使用了热稳定的DNA聚合酶Amplitaq GoldTM聚合酶、DNA模板、核苷酸和两种分别对扩增子特异的引物,以便复制在受损样品中的片段的两条DNA链。产生多种这些引物对以允许通过组合等摩尔量(10μM)的24个引物的每一种而在一个反应中扩增12个扩增子。通过使用三步法扩增DNA:步骤1:DNA变性(94℃-100℃)以产生单链模板;步骤2:使用保证引物与靶核酸序列完全匹配结合的杂交条件退火(45℃-65℃)引物;及步骤3:延伸或DNA合成(72℃)。通常进行30-40个扩增循环以产生几百万个感兴趣的扩增子拷贝。
需要的材料包括10%漂白剂、2mL微管、单通道移液管(20μL-1000μL)、12通道移液管(2μL-20μL)、气溶胶抗性移液吸头、384孔PCR板和膜、10X PCR缓冲液II(Orchid Biosciences,Inc.)、25mM MgCl2、2.5mM dNTP混合物、十二对引物池(pool)、AmplitaqGoldTM聚合酶、无菌蒸馏水或去离子水、样品DNA、热循环仪、微量离心管和振荡器。
所有的PCR试剂应该在指定的pre-PCR实验室中制备。
在进行PCR之前和之后应该穿戴专门的实验工作服和手套,操作区域应该用10%漂白剂清洗。PCR反应混合物应该在通风厨内制备。使以下储存剂融化:2.5mM dNTP、10X PCR缓冲液II、引物池、25mM MgCl2、无菌水和待扩增的DNA样品。计算对特定样品数目每一试剂需要的量,记录在PCR实验记录的合适位置(计算超过样品的20%)。相同试剂的不同份数不要混合。在2mL微管中制备PCR主混合物,将每一试剂的份数记录在PCR记录中。
典型的扩增反应混合物
试剂 (每板/460样品) (每一样品)
10X PCR缓冲液II 230μL 0.5μL
25mM MgCl2 460μL 1μL
2.5mM dNTP 69μL 0.15μL
PCR引物池 11.5μL 0.025μL
水 563.5μL 1.225μL
Amplitaq GoldTM 46μL 0.1μL
DNA模板 2μL(共2ng/样品) 2μL(共2ng/样品)
总体积 每样品5μL 每样品5μL
PCR平板设定
确定标记平板的方向并用合适的标记组标记平板和实验组。使用12通道移液管向每一孔内加入3μL PCR混合物。离心含有所有DNA样品的平板,并使用12通道移液管如先前一样加入2μL的DNA模板。DNA板中的样品装载在PCR平板的相同位置。将一片密封膜放置在平板上,用辊子密封。离心平板去除任何气泡,置于热循环仪中。
典型PCR扩增过程
所有扩增反应在MJ Research TetradTM机器上进行。根据扩增引物的特性改变程序。通过使用在此所述的AutoprimerTM软件简化对组多重反应的扩增引物的解链和退火温度的选择,以便本领域技术人员可以选择合适的延伸和解链温度进行热循环,而不需要过多的实验。优选的热循环仪是MJ Research Tetrad热循环仪。
样品程序
Mode:Calculated
步骤1:95℃,5分钟
步骤2:95℃,30秒
步骤3:50℃,55秒
步骤4:72℃,30秒
步骤5:进行步骤2,2次
步骤6:95℃,30秒
步骤7:50℃,55秒+0.2°/循环
步骤8:72℃,33秒
步骤9:进行步骤6,18次
步骤10:95℃,30秒
步骤11:55℃,55秒
步骤12:72℃,30秒
步骤13:进行步骤10,8次
步骤14:72℃,7分钟
步骤15:4℃,始终
步骤16:结束
多重PCR扩增12个扩增子后,未掺入的核苷酸和多余的引物通过本领域已知的方法酶学去除,如用外切核酸酶I处理以及用虾碱性磷酸酶处理。PCR后处理优选使用SNP-ITTM Clean-up kit(OrchidBiosciences,Inc.)进行。
SNP-IT引物延伸反应
将延伸混合物和12个等位基因特异标记的SNP-ITTM引物池加入到处理过的反应混合物中。等位基因特异的SNP-ITTM引物与多重反应中与多态性位点紧邻的特异扩增子杂交。通过掺入荧光标记的链终止子,在双染料***中延伸标记的引物。双色(two-color)检测允许通过比较两种荧光染料的信号区别基因型。然后将延伸的SNP-ITTM引物与排列在384SNP-ITTM平板(Orchid Biosciences,Inc.)的每一孔中的12个独特探针之一通过标记-探针捕获特异性杂交。SNP-ITTM引物是含有与5’非模板特异序列附着的模板特异序列的单链DNA,其中“标记”指可以被结合到玻璃表面的特异探针捕获的非模板特异序列。与一个标记杂交的特异探针结合到384SNP-ITTM平板中的每一孔的玻璃表面上。共价结合到玻璃表面的探针能查询多至12从(12-plexed)核酸反应产物。已经掺入标记的SNP-ITTM反应产物将与共价结合到玻璃表面的相应探针杂交。在延伸反应之后,延伸的SNP-ITTM引物与每一孔中排列的12个独特探针之一特异性杂交。排列的探针捕获延伸的产物并允许检测每一SNP等位基因信号。严格的冲洗将去除游离的染料终止子和未与特异探针杂交的DNA。
玻璃表面的探针在384孔格式中的每一孔中以4×4阵列排列。在每个4×4阵列中包括3个正对照和1个负对照。左上位置是杂合对照,其具有与掺入两种染料标记的终止子的自身延伸寡核苷酸杂交的两种探针的等摩尔混合物。右上位置具有与掺入蓝色染料标记的终止子的自身延伸寡核苷酸特异性杂交的探针。左下位置具有与掺入绿色染料标记的终止子的自身延伸寡核苷酸杂交的探针。将等摩尔浓度的两种自身延伸寡核苷酸加入延伸混合物中并用染料标记的终止子在循环延伸反应中延伸。右下位置具有不自身延伸的探针,并与反应中的任何DNA缺少互补性。这些探针在每一孔中作为负对照。
引物延伸引物在无DNase/RNase水中悬浮,并分成12组。每个SNP-ITTM引物应该制备成120微摩。等体积的12个SNP-ITTM引物聚集在一起。每一SNP-ITTM引物在池中的终浓度为大约10微摩。在低重(low plexing)水平,保持每一SNP-ITTM引物的浓度在10微摩。
对多重SNP-ITTM反应,聚集SNP-ITTM引物以便制备等摩尔混合物。用分子生物级的水以1∶100稀释SNP-ITTM引物池。
SNP-ITTM引物
平板数 | 1/8 | 1/4 | 1/2 | 1 | 2 |
SNP-ITTM引物池 | 1.6μl | 3.2μl | 6.3μl | 12.6μl | 25.2μl |
H2O | 156μl | 312μl | 524μl | 1247μl | 2495μl |
总体积 | 158μl | 315μl | 630μl | 1260μl | 2520μl |
对SNP的类型选择正确的20X延伸混合物用于测试,并从-20℃储存中移除。(例如T/C SNP需要T/C延伸混合物)。
为了制备延伸混合物,计算在实验中需要的延伸混合物的体积。
延伸混合物
平板数 | 1/8 | 1/4 | 1/2 | 1 | 2 |
20×延伸混合物 | 10.5μl | 21μl | 42μl | 84μl | 168μl |
延伸混合物稀释液 | 197μl | 395μl | 790μl | 1580μl | 3160μl |
DNA聚合酶 | 2.1μl | 4.2μl | 8.3μl | 16.5μl | 33μl |
总体积 | 210μl | 420μl | 840μl | 1680μl | 360μl |
使用多通道移液器或自动液体处理装置,将稀释的SNP-ITTM引物和延伸混合物转移入液体库中用于吸取。
将3μl稀释的SNP-ITTM引物池加入PCR平板的相应孔中。用平板离心机离心平板。向相应孔中加入如前述制备的4μl延伸混合物,并充分混合。
如果SNP组是有限的(低于或等于8),三倍体积的稀释SNP-ITTM引物池可以与4倍体积的延伸混合物混合。7μl的延伸混合物加入到PCR板的每一相应孔中并通过用多通道移液器吸头人工上下吸取3次进行混合或通过振荡自动处理液体。
离心并密封PCR平板。使用以下程序在MJ热循环仪(或等同物)中进行热循环。
步骤1. 96℃进行3:00分钟
步骤2. 94℃进行0:20
步骤3. 40℃进行0:11
步骤4. 重复步骤2和3,25次
步骤5. 4℃最终保存
注意:该程序已经被最优化以用于MJ Research TetradTM。程序需要被修饰以用于具有不同加热和冷却速率的热循环仪。分析可以在该点被中断。在-20℃密封和储存SNP-ITTM平板。确保平板被完全密封以避免样品蒸发。
SNP-IT平板的制备
用DI H2O将UHT Prewash溶液(提供的20X储存液)稀释到1X。用试剂盒提供的1X UHT prewash缓冲液冲洗UHT Core kit ATM中提供的SNP-ITTM平板三次。应该包括附加的抽气(aspirating)步骤以干燥平板。注意:如果同时进行分散(dispensing)和抽气,每次冲洗应该使用50μl/孔。抽气吸头应该接近于玻璃表面和壁的边缘。
制备杂交液
a.确定要被分析的平板总数(不管延伸混合物类型或等位基因反应)。
b.UHT core kit含有95ml的杂交缓冲液和5.5ml的杂交添加剂,足以进行10个PCR平板,如果使用者每次使用平均2个平板。
c.对两个PCR平板,将9.45ml的杂交液与550μl的杂交添加剂充分混合。
d.向PCR平板的每一孔中加入8μl前述杂交溶液并充分混合。将8μl的溶液从PCR平板转移到玻璃SNP-IT平板上的相应孔中。
推荐用3N NaCl和水在移液之间使用冲洗吸头或每次移液使用新的吸头以消除交叉污染。
杂交
在转移2个平板后,玻璃SNP-ITTM平板放置在42℃的潮湿烘箱(或在烘箱中用湿纸巾湿化的带盖的托盘)中。温育平板2小时(+/-15分钟)。建议对2-12个平板进行每两个平板一批的孵育,对13-30个平板进行每5个平板一批的孵育。每一轮需错开进行以节约时间。
SNP-ITTM反应冲洗
通过混合25ml冲洗液和1.575L的DI H2O制备冲洗液。在UHTcore kit中提供了50ml的冲洗液,足以用于10个PCR平板。在杂交完全以后,用冲洗液冲洗SNP-ITTM平板3次。
预热SNPstreamTM UHT***,并将实验信息输入UHTPlateExplorerTM。确信已经将预试(pre-run)数据输入UHTPlateExplorerTM。
使用连接了1ml的移液器吸头的真空完全干燥SNP-ITTM平板。切断吸头以便它不会接触到玻璃表面。切断的末端的开口应该比孔大。在冲洗结尾如果有足够的抽气步骤则此步骤可以省略。重要的是注意湿孔增加了背景图像。打开真空源,以排或行将平孔真空化。准备平板在SNPstreamTM UHT***成像。如果成像前有延迟,则在暗盒中储存SNP-ITTM平板。
组
根据本发明的方法选择大约12个单核苷酸多态性的13个分离的组。每一组成员是T/C单核苷酸多态性。这些组用于筛选多种受损核酸的样品。
组5-17的扩增引物和SNP-ITTM引物列举如下。含有来自建筑物倒塌和烧伤的样品(样品组A)的受损核酸样品、来自医学检测办公室的法医样品(样品组B)和其它受损样品(样品组C)列于表8。
为了阐明该技术的原理,回收自许多受损骨骼、组织和其它生物学样品的核酸样品根据本发明使用许多组进行基因分型。表1示出了样品组A的受损核酸的基因分型,使用组5。表2示出样品组A和样品组B的受损核酸的基因分型,使用组6。表3示出样品组C的受损核酸的基因分型。表4示出样品组C的受损核酸的基因分型,使用组8。表5示出样品组C的受损核酸的基因分型,使用组11。表6示出样品组C的受损核酸的基因分型,使用组9。表7示出样品组C的受损核酸的基因分型,使用组10。这些数据表明这些SNP标记提供用于鉴定目的的可用遗传信息的能力。
表8示出测试受损核酸样品的组12-17。结果与STR基因分型方法比较。表8中的比较确定使用根据本发明的组的基因分型产生了可靠的结果。
表9示出测试受损核酸样品的组12-17。结果示出使用本发明的组成功鉴定的SNP。表9确定使用根据本发明的组的基因分型产生了可靠的结果。
表10示出测试受损核酸样品的组12-17。结果示出使用本发明的组成功鉴定的SNP。表10确定使用根据本发明的组的基因分型产生了可靠的结果。
表11概括了使用测试受损核酸样品的组12-17的来自44个人的24640可能基因型的结果。示出了使用的DNA量、测试的SNP数目和失败(FL)。结果确定使用根据本发明的组的基因分型产生了可靠的结果。
确认分析(validation asay)
确认分析使用1560个来自建筑物倒塌的样品进行。确认分析的方案描述如下。
该分析通过利用DNA聚合酶掺入染料标记的终止子的能力,因此允许单碱基引物延伸,使用SNP-ITTM技术进行。使用该技术可以通过使用不同的染料终止子检测单核苷酸多态性(SNP)以区分基因型。在12扩增子的多重PCR扩增之后,未掺入的核苷酸和引物酶学去除。将延伸混合物和12个等位基因特异的标记的SNP-IT引物池加入处理过的PCR中。这些SNP-ITTM引物与多重反应中的特异扩增子杂交,SNP位点3’的一个碱基。标记的引物通过掺入荧光标记的链终止核苷酸在双染料***中延伸。双色检测可以通过比较来自两种荧光染料的信号区分基因型。然后将延伸的SNP-ITTM引物与每孔中排列的12个独特探针之一特异杂交。排列的引物捕获延伸的产物,并允许检测每一SNP等位基因信号。
分析方案
1.打开UHT TM***和相关的计算机。
2.制备和放置校准平板作为第一个实验平板。
3.用新的384孔PCR平板以从原始的20μL PCR平板(源平板)中转移5μL的PCR产物:
a.在转移程序之前迅速离心所有使用的源平板。如果需要,首先融化。
b.用相同的信息标记新平板作为源平板(即批次数、组数、初始等等)。
c.使用多通道移液器将5μL PCR产物从源平板转移至新的平板。在完全转移整个平板后,密封两个平板。于-20℃储存剩余的15μL样品平板,如果需要进行重新测定。
d.迅速离心5μL平板,肉眼观察以便确信所有的样品都被合适地转移。如果没有观察到问题,进行下一步骤,否则记录问题通知检查者。
4.使用体积计算制备用于SNP-ITTM清除反应的Exo/SAP。
平板数 | 2 | 4 | 6 | 8 | 10 |
Exo/SAP | 101μl | 202μl | 303μl | 404μl | 505μl |
Exo/SAP缓冲液 | 2419μl | 4838μl | 7257μl | 9676μl | 12095μl |
总体积 | 2.520ml | 5.040ml | 7.560ml | 10.080ml | 12.600ml |
5.混合孔并转移至干净的试剂槽。
6.向384孔PCR平板中的每一孔中加入3.0μl的Exo/SAP混合物。
7.密封并迅速离心平板。确信肉眼观察每一孔确保每一孔接受等量的Exo/SAP。
8.进行Exo/SAP程序,循环平板37℃,30分钟,然后96℃10分钟。
注意:该程序被最佳化以用于MJ Research Tetrad。
9.当制备延伸混合物时在冰上融化SNP-ITTM引物池。
10.针对要被测试的SNP的类型选择正确的20x延伸混合物。
11.使用以下计算制备延伸混合物。
平板数 | 1/8 | 1/4 | 1/2 | 1 | 2 |
20×延伸混合物 | 10.5μl | 21μl | 42μl | 84μl | 168μl |
延伸混合物稀释液 | 197μl | 395μl | 790μl | 1580μl | 3160μl |
延伸酶 | 2.1μl | 4.2μl | 8.3μl | 16.5μl | 33μl |
总体积 | 209.6μl | 420.2μl | 840.3μl | 1680.5μl | 3361μl |
12.使用以下计算稀释SNP-ITTM引物池:
平板数 | 1/8 | 1/4 | 1/2 | 1 | 2 |
SNP-ITTM引物池 | 1.6μl | 3.2μl | 6.3μl | 12.6μl | 25.2μl |
H2O | 156μl | 312μl | 524μl | 1247μl | 2495μl |
总体积 | 157.6μl | 315.2μl | 530.3μl | 1259.6μl | 2520.2μl |
13.使用多通道移液器进行移液,将稀释的SNP-ITTM引物和延伸混合物转移进试剂槽。
14.向PCR平板相应的孔中加入3μl稀释的SNP-ITTM引物池。
迅速离心平板。确信肉眼观察每一孔确保每一孔接受等量的SNP-ITTM引物池。
15.向相应的孔中加入4μl延伸混合物,通过移液器上下混合均匀。
16.将平板密封完好并离心。确信肉眼观察每一孔确保每一孔接受适量的液体。
17.将平板置于热循环仪中,进行以下程序:
步骤1-96℃,3:00
步骤2-94℃,00:20
步骤3-40℃,00:11
步骤4-重复步骤2和3,25次
步骤5-4℃最终保存
注意:该程序被最佳化以用于MJ Research Tetrad热循环仪。测试可以在此时停止。在-20℃密封并储存SNP-ITTM平板。确信平板密封完全以避免样品蒸发。
18.用无菌水将20×UHTTM prewash溶液稀释至1x。
19.用1×UHTTM prewash缓冲液冲洗SNP-ITTM平板三次。用平板冲洗器抽气干燥平板。
20.通过向9.45ml的杂交溶液中加入550μl的杂交添加剂在15ml或50ml锥形管中制备杂交液。通过振荡完全混合。
21.向每一PCR平板孔中加入8μl杂交液,通过吸头上下混合完全。然后将每一孔中的8μl的溶液转移至玻璃SNP-IT平板上的相应孔中。
22.将玻璃SNP-ITTM平板置于42℃的潮湿烘箱(或在烘箱中用湿纸巾湿化的带盖的托盘)中。温育平板2小时。如果进行了许多平板,尽量成批错开以节省时间。
23.通过混合25ml冲洗液和1.575L的水(1∶64)制备严格冲洗液(stringent wash)。
24.在杂交完全以后,用严格冲洗液冲洗SNP-ITTM平板3次。
25.同时预热SNPstream UHT***,并将预试信息输入UHTPlateExplorerTM软件。
26.从烘箱中取出SNP-ITTM平板,并使用真空歧管将其完全干燥,该真空歧管连接有管子且1ml吸头***到该管子中。切断吸头以便它不会接触到玻璃表面。切断的末端应该具有比孔大的孔。注意:平板完全干燥是非常重要的。任何残留的液体会增加由激光捕获的背景图像,并能干扰基因型判断。
27.准备平板在UHTTM***成像。如果成像前有任何延迟,将平板储存在暗处。
使用组12-17,1560个来自灾难区域的组织样品使用上述的分析方案测试。结果是大于50%的来自灾难区域的受损组织样本产生了超过40个SNP的基因型。这些结果将可能产生超过1/109的鉴定指数(identification index)。
来自确认研究的结果总结(n=1560) | ||
SNP数 | 样品数 | 百分比 |
>60 | 643 | 41.22 |
>50 | 768 | 49.23 |
>40 | 859 | 55.06 |
>30 | 947 | 60.71 |
>20 | 1038 | 66.54 |
0、1或2个失败 | 457 | 29.29 |
大量试剂方案(bulk reagent protocol)
扩增可以使用大量试剂进行。在5μl和20μl体积中进行扩增的典型的反应混合物提供如下:
试剂 5μl混合物 20μl混合物
10X PCR缓冲液II 0.5μl 3.0μl
25mM MgCl2 1.0μl 6.0μl
2.5mM dNTP 0.15μl 0.9μl
PCR引物池 0.025μl 0.15μl
水 1.225μl 7.35μl
AmpliTaq Gold 0.1μl 0.6μl
DNA模板 2.0μl 2.0μl
Pfu酶 0 0.06μl
总体积 5.0μl 20.0μl
引物序列
扩增和鉴定引物的序列提供如下。
组5 PCR引物序列 SEQ.ID NO.
61955up tagtttacctctacttcctttcttatattactc 1
61955Lo cacttattttggaaagtggaatc 2
195849up taaggcagccacgggttg 3
195849Lo catgtatgcctgagtgttactgc 4
195869up cagaacacgtgaagactgaa 5
195869Lo catactgaacacatactaatgcagtaatt 6
148193up tatatttcttttcatgagttttgtgag 7
148193Lo cacctgtaatccccccca 8
238355up acttccctgtctggttactcc 9
238355Lo caatgtacagcttgaggacttg 10
63635up tctctccctccccacctc 11
63635Lo gagaacttggcagctccat 12
863949up tatagatgccatcagctcctc 13
863949Lo gaagtgtttctaagcacctgtg 14
211489up actgcatgtgtcagtttcagtc 15
211489Lo gatgagtgaagccactgaagg 16
206538up attttccggagtcagggtc 17
206538Lo gacagccaggctcaagag 18
233357up atttctaccgttactgtcttcttacc 19
233357Lo gaagtcatgctaggctattttaaaga 20
207845up attccatcctgtgctagatgc 21
207845Lo gcactttaataatttggccaga 22
231480up taatatttagagagcagcaaggaca 23
231480Lo cttcttcacccttttcccc 24
组5 SNP引物序列 SEQ.ID NO.
84760 acgcacgtccacggtgatttatcagctcctcagatgxgcxcctgact 25
195849 ggatggcgttccgtcctattcagccacgggttgccttctgtaact 26
195869 cgtgccgctcgtgatagaatggtccagaacacgtgaagactgaat 27
148193 agcgatctgcgagaccgtatgagggtattccccaaaxctctgtgttt 28
238355 gcggtaggttcccgacatattggttactccactataaaaxattcatc 29
63635 ggctatgattcgcaatgctttctccctccccacctcctcttgtcc 30
863949 agggtctctacgctgacgatatcagctcctcagatgxgcxcctgact 31
211489 gtgattctgtacgtgtcgcctttcagtcactcattcctttcttcc 32
206538 gacctgggtgtcgatacctaagggtcgggggttctxcxtgttcatct 33
233357 agatagagtcgatgccagctccttcagaagaactcacaaaatacc 34
207845 agagcgagtgacgcatactatgtgctagatgctgxagttgtccttca 35
231480 cgactgtaggtgcgtaactcatttagagagcagcaaxgacattcctc 36
组6 PCR引物序列 SEQ.ID NO.
63836-U1up tgcctttcctccagggtc 37
63836-U1low gaaattactgagctcctctggt 38
60676-U2up tgaattgattcaaggggatatatta 39
60676-U2low catattcctctcttgttctctaaacac 40
58091-U3up ggcagtttctttttctctctctc 41
58091-U3low ctcatttattatggtagacaatccc 42
169509-U4up taggagagaatgccagtgtg 43
169509-U4low gttgattggccaggtgga 44
238155-U5up ttgatggcaagaggtaactca 45
238155-U5low gattcaatccaccaaacttactattt 46
201688-U6up aagtaacctggcctctctgag 47
201688-U6low gtgagccaggcattcttg 48
57849-U7up caactcccagtggagagg 49
57849-U7low gataaggcttctgaggtgtgaa 50
56915-U8up tcctcggttgcttctctatc 51
56915-U8low cttgtcaggagtcaacagctt 52
56608-U9up tggtgtggagccaactgg 53
56608-U9low gtctatgaggttgagtctcccc 54
68532-U10up aacttttctcaactactgtttgtgac 55
68532-U10low catttgggtgtaggcggt 56
61500-U11up tttttgccagttgtgtatttttatc 57
61500-U11low caccagtacatacttgggcact 58
66026-U12up atttttagagtgaaaggctgct 59
66026-U12low cataagtaaaagaaataagtctcccaa 60
组6 SNP引物序列 SEQ ID NO.
63836 acgcacgtccacggtgatttcaggctgcctttcctccagggtcca 61
60676 ggatggcgttccgtcctatttatattaaattagaatgttgacctc 62
58091 cgtgccgctcgtgatagaatcxctctctttcttcccatagag 63
169509 agcgatctgcgagaccgtattgccagtgtggctcatcaggacatc 64
238155 gcggtaggttcccgacatatatggcaagaggtaactcaa 65
201688 ggctatgattcgcaatgcttctctctgagattcagtttxcacacctg 66
57849 agggtctctacgctgacgatctggaccaacxcxcagtggagagggta 67
56915 gtgattctgtacgtgtcgcccttctctatcataagcacaatg 68
56608 gacctgggtgtcgatacctacaactgggaggagggaaatgagaac 69
68532 agatagagtcgatgccagctttgtgacaacaatacaccaagtacc 70
61500 agagcgagtgacgcatactagtgtatttttatctcatttatccca 71
66026 cgactgtaggtgcgtaactcccatttttagagtgaaaggctgctc 72
组7 PCR引物序列 SEQ.ID NO
221499-UP tttcacaattattatatcagcgaagaac 73
221499-LO ttgatataattaacaaagtacctgaggat 74
89446-UP tttgataagataaattgaattgcaatc 75
89446-LO ccaggaaattatcattcaggaaga 76
229291-LO ctaactgggcatttcaaaataagct 77
229291-UP catctcgtaaagaaaaaaacacatc 78
83031-LO cagattaygctgaatcatgtacactg 79
83031-UP tctggccagcattccagc 80
226119-LO tctaaattgagtcaagatatagaggctttc 81
226119-UP gaactgacattaataatcaatgtacttaca 82
60409-UP tgcaggtgcaatgtttattagctc 83
60409-LO gtatgggaaacttaatcttgtatagtaactt 84
220990-UP acagtaatgagtatagctgtaaattagttatg 85
220990-LO aatatgttttagattcagatttataatttcc 86
63527-UP taccactgtttcctcctttctttct 87
63527-LO atttgccctaggattgagctaac 88
230299-LO tgcaatttgttttcacgtattcg 89
230299-UP cacaggcctggaaagggata 90
58040-LO ygaaaggaaaacctagagagagatt 91
58040-UP gaaacagaaagcgccaaaga 92
231480-UP ctaatatttagagagcagcaaggac 93
231480-LO cttcttcacccttttcccca 94
62059-UP tgataagctacaagttcaaatatactaaac 95
62059-LO gacatagagccagattctaccagg 96
97
组7 SNP引物序列 SEQ.ID NO.
221449 acgcacgtccacggtgattttatcagcgxagaacacttcagttgtaa 98
89446 ggatggcgttccgtcctatttgcaatcattttctgaagtttctta 99
229291 cgtgccgctcgtgatagaataaaacxcatcatagcaatctgtgaata 100
83031 agcgatctgcgagaccgtatattccagcxaagctttacttttgataa 101
226119 gcggtaggttcccgacatattaataatcaatxtacxtacataatata 102
60409 ggctatgattcgcaatgctttgtttattagctcgtttatcttcca 103
220990 agggtctctacgctgacgatatagctgtaaattagtxatgatataac 104
63527 gtgattctgtacgtgtcgccactgtttcctcctttctttctctct 105
230299 gacctgggtgtcgatacctaaggcctggaaagggaxattgtgagata 106
58040 agatagagtcgatgccagctagcgccaaagaacagagtagaacaa 106
62059 agagcgagt9acgcatactatacaaxttcaaatatactaaactattc 108
231480 cgactgtaggtgcgtaactcatttagagagcagcaaxgacattcctc 109
组8 PCR引物序列 SEQ.ID NO.
56763-UP cgaattttgtgtaggcagcct 110
56763-LO tctacagaggtagatagaattgaatagaag 111
61955-UP tacctctacttcctttcttatattactctt 112
61955-LO gtggatgcaggtcacttattttg 113
204593-UP cacagaatgtgcacagagattgac 114
204593-LO gacattgtacatgatgctgcttag 115
65068-UP ctggaattcttccttctaggtgta 116
65068-LO cttccctaaggctacacttatatattaa 117
114977-UP tgctactaagtctcagatcaattctg 118
114977-LO caataatatgtgtttgttagatcaatacag 119
148193-LO tggctcacacctgtaatccc 120
148193-UP catgagttttgtgagggtattcc 121
66158-UP cttacagataagagaatagaataacaaattac 122
66158-LO gaactgttgtgatattgtggaaaga 123
69003-UP aaaatacctttaacacctatttagtgtc 124
69003-LO ggaaacattttgtaaaaaatcaagta 125
63811-UP tcctaaaccaatcccaggg 126
63811-LO gctcctcctattacctgcaaat 127
860850-UP catgcatccgtccatggg 128
860850-LO atttcctgaatgactgtgtcca 129
63189-UP atccgtccatgggccact 130
63189-LO gctatttcctgaatgactgtgtcc 131
126922-UP gtgctttgataagactgtgatcatcac 132
126922-LO gctgcatgggtccatttgt 133
组8 SNP引物序列 SEQ.ID NO.
61955 acgcacgtccacggtgatttcttcctttcttatattactcttttc 134
65068 ggatggcgttccgtcctattttcttccttctaggtgtxtatctatac 135
114977 cgtgccgctcgtgatagaattaagtxtxaxatcaatxctgagaaaga 136
148193 agcgatctgcgagaccgtatgagggtattccccaaaxctctgtgttt 137
66158 gcggtaggttcccgacatatgagaatagaataacaaxttacttga 138
56763 ggctatgattcgcaatgcttttgtgtaggcagccttttagctctt 139
69003 agggtctctacgctgacgatatacctttaaxacctatttagtgtctt 140
63811 gtgattctgtacgtgtcgccaatcccaggggattxcagggttgca 141
860850 gacctgggtgtcgatacctatccgtccatggxccacxcgccgagaca 142
63189 agatagagtcgatgccagcttccgtccatggxccacxcgccgagaca 143
126922 agagcgagtgacgcatactatgtgatcatcacagcaggacagtat 144
204593 cgactgtaggtgcgtaactcgaatgtgcacagagattgactccac 145
组9 PCR引物序列 SEQ ID NO.
56593-UP cagagtggagagtcacaaaatgg 146
56593-LO aatcccttgacactggataacca 147
217856-UP cctctttctctctcctgatctgtctat 148
217856-LO gatggggtgtgaatatgtatacaga 149
231735-UP ctctattatttataaagggcagaatgag 150
231735-LO gcctgtctgtatctctctccttc 151
81917-UP gctctttcatctgatgccatga 152
81917-LO gatataggagtaatctgacagcagg 153
62684-UP taacacaaagaaagtatgcttttgca 154
62684-UP gtatgtggatgaaaatctcgcac 155
241554-UP gtgataataaaatttttgtgcctga 156
241554-LO catttgtttcacctgtgttcttaata 157
126264-UP ggataatgttctccgtaaggtttatac 158
126264-LO gagaaacaagcttgcccttaacta 159
224922-UP caaggaaaacttacataatcacagc 160
224922-LO gaaatataaaagctccacaaatagga 161
81081-UP aaagtaggcaatactgaagagtcatac 162
81081-LO gttcaattggcttggaagttatacc 163
66561-LO acttggatttaccctcattgatg 164
66561-UP cttcctctttggtttctgcttttaat 165
63799-UP gtgcccagctccctaatttct 166
63799-LO ctcttgtgactttcattaactatcttca 167
119770-UP agcctggctggaaatgaag 168
119770-LO cttctaccctcctgtacctgattta 169
组9 SNP引物序列 SEQ.ID NO.
56593 acgcacgtccacggtgattttggagagtcacaaaatgxcccttatta 170
217856 ggatggcgttccgtcctatttttctctctcctxatctgtctatcaaa 171
231735 cgtgccgctcgtgatagaattttataaagggcagaatgaggatta 172
81917 agcgatctgcgagaccgtattcatctgatgccatgagaaagc 173
62684 gcggtaggttcccgacatatagaaagtatxcxttxgcaaaaggtcca 174
241554 ggctatgattcgcaatgctttaataaaatttttgtgcxtgaggtata 175
126264 agggtctctacgctgacgatttctccgtaaggtttxtacattgacta 176
224922 gtgattctgtacgtgtcgcccataatcacagcttttttctcccaa 177
81081 gacctgggt9tcgatacctataggcaatactgaagagtcatacaa 178
66561 agatagagtcgatgccagctgxttctgctxttaatacaaaaccag 179
63799 agagcgagtgacgcatactaagctcxctaatttcttgatggg 180
119770 cgactgtaggtgcgtaactctggctggaaat9aaggaaaggaaag 181
组10 PCR引物序列 SEQ.ID NO.
63836-LO ctctggtgcccgacagc 182
63836-up gcatcaggctgcctttcct 183
58091-UP ctttttctctctctctttcttccc 184
58091-LO gctcatttattatggtagacaatcc 185
68909-UP gagtgttgggaagagagaccttc 186
68909-LO gctatgtggacagacccatctg 187
238155-UP ggtacttgatggcaagaggtaact 188
238155-LO aaacttactatttggatagagtgcttt 189
201688-LO ctgtgagccaggcattcttg 190
201688-UP caagtaacctggcctctctgagat 191
57849-UP gctggaccaactcccagtg 192
57849-LO gtgaatatctctcctttctctggg 193
56915-UP cctcggttgcttctctatcataa 194
56915-LO cttgtcaggagtcaacagcttc 195
56608-LO aggttgagtctcccccgtg 196
56608-UP gtggagccaactgggagga 197
68532-UP cttttctcaactactgtttgtgaca 198
68532-LO ccatttgggtgtaggcgg 199
61500-UP ttgccagttgtgtatttttatctca 200
61500-LO taacttaagcccaccagtacatact 201
66026-UP cccatttttagagtgaaaggctg 202
66026-LO taagtctcccaaggtggatacatg 203
60676-UP gattcaaggggatatattaaattagaat 204
60676-LO caagttcattattcctctcttgttctc 205
组10 SNP引物序列 SEQ.ID NO.
63836 acgcacgtccacggtgatttcaggctgcctttcctccagggtcca 206
60676 ggatggcgttccgtcctatttatattaaattagaatgttgacctc 207
58091 cgtgccgctcgtgatagaatcxctctcttttcttcccatagag 208
68909 agcgatctgcgagaccgtattgttxggxagagagaccttccattcat 209
238155 gcggtaggttcccgacatatatggcaagaggtaactcaatca 210
201688 ggctatgattcgcaatgcttctctctgagattcagtttxcacacctg 211
57849 agggtctctacgctgacgatctggaccaacxcxcagtggagagggta 212
56915 gtgattctgtacgtgtcgcccttctctatcataagcacaatg 213
56608 gacctgggtgtcgatacctacaactgggaggagggaaatgagaac 214
68532 agatagagtcgatgccagctttgtgacaacaatacaccaagtacc 215
61500 agagcgagtgacgcatactagtgtatttttatctcatttatccca 216
66026 cgactgtaggtgcgtaactcccatttttagagtgaaaggctgctc 217
组11 PCR引物序列 SEQ.ID NO.
212605-UP gcctgcttcccctttatctcct 218
212605-LO tcttatctcccatcttcctctacac 219
220875-UP ctggcaatctgggcacc 220
220875-LO cccaagtccacacacaaattat 221
65882-UP gtatactaaagagtctaagtttttgcctaa 222
65882-LO cttccctttttccttccctt 223
57575-UP tgaatagtctttggtctgagcct 224
57575-LO aggcagagtcttatctgggaca 225
66683-UP cagagaattggagttggctgg 226
66683-LO aggaggtagcagtcacactgattc 227
214674-UP gacttccgattgtgaggctg 228
214674-LO cctccttttattcttgctcatagc 229
248007-UP agctcactggatgcaagagtagt 230
248007-LO caagtggataagatgacccattc 231
63804-UP gatatacaggggaaacgggct 232
63804-LO cctcaggggggcactttac 233
56144-UP tcaatcttttgatgatgtcctaaga 234
56144-LO ttcagcacagtattctagtattttgtg 235
233357-UP cgttactgtcttcttacccttcag 236
233357-LO ggaa9tcatgctaggctattttaa 237
206538-UP agggtcgggggttctgc 238
206538-LO ctacagcctagggacagccag 239
60188-UP aggatgcatgcatgctgg 240
60188-LO ctcagagtatgtgccattgattg 241
组11 SNP引物序列 SEQ.ID NO.
212605 acgcacgtccacggtgatttttcccctttatcctcttcgcagcct 242
220875 ggatggcgttccgtcctattatctgggcxccaggcaggtggtcaggc 243
65882 cgtgccgctcgtgatagaatagtctaagtxtttgcctaaaagcagga 244
57575 agcgatctgcgagaccgtattgaatagtctttxgtctgagcctggaa 245
66683 gcggtaggttcccgacatatagagaattggagttggctggagata 246
214674 ggctatgattcgcaatgcttccgattgtgaggctgctgagaaggg 247
248007 agggtctctacgctgacgataagagtagttggggaaaggggctgt 248
63804 gtgattctgtacgtgtcgccatacaggggaaacxggxtccgagcaga 249
56144 gacctgggtgtcgatacctatgatgatgtcctaxgaaataatgactt 250
233357 agatagagtcgatgccagctccttcagaagaactcacaaaatacc 251
60188 agagcgagtgacgcatactagatgcatgcatgctgxcxttgaggaac 252
206538 cgactgtaggtgcgtaactcagggtcgggggttctxcxtgttcatct 253
56593-UP cagagtggagagtcacaaaatgg 254
56593-LO aatcccttgacactggataacca 255
217856-UP cctctttctctctcctgatctgtctat 256
217856-LO gatggggtgtgaatatgtatacaga 257
231735-UP ctctattatttataaagggcagaatgag 258
231735-LO gcctgtctgtatctctctccttc 259
81917-UP acttagcttggttctttgttttctaattaac 260
81917-LO atggaaaggcagatataggagtaatct 261
62684-UP taacacaaagaaagtatgcttttgca 262
62684-UP gtatgtggatgaaaatctcgcac 263
241554-UP gtgataataaaatttttgtgcctga 264
241554-LO catttgtttcacctgtgttcttaata 265
126264-UP ggataatgttctccgtaaggtttatac 266
126264-LO gagaaacaagcttgcccttaacta 267
230299-LO tgcaatttgttttcacgtattcg 268
230299-UP cacaggcctggaaagggata 269
224922-UP caaggaaaacttacataatcacagc 270
224922-LO gaaatataaaagctccacaaatagga 271
66561-LO acttggatttaccctcattgatg 272
66561-UP cttcctctttggtttctgcttttaat 273
63799-UP gtgcccagctccctaatttct 274
63799-LO ctcttgtgactttcattaactatcttca 275
119770-UP agcctggctggaaatgaag 276
56593 acgcacgtccacggtgattttggagagtcacaaaatgxcccttatta 278
217856 ggatggcgttccgtcctatttttctctctcctxatctgtctatcaaa 279
231735 cgtgccgctcgtgatagaattttataaagggcagaatgaggatta 280
81917 agcgatctgcgagaccgtattcatctgatgccatgagaaagc 281
62684 gcggtaggttcccgacatatagaaagtatxcxttxgcaaaaggtcca 282
241554 ggctatgattcgcaatgctttaataaaatttttgtgcxtgaggtata 283
126264 agggtctctacgctgacgatttctccgtaaggtttxtacattgacta 284
224922 gtgattctgtacgtgtcgcccataatcacagcttttttctcccaa 285
230299 gacctgggtgtcgatacctaaggcctggaaagggaxattgtgagata 286
66561 agatagagtcgatgccagctgxttctgctxttaatacaaaaccag 287
63799 agagcgagtgacgcatactaagctcxctaatttcttgatggg 288
119770 cgactgtaggtgcgtaactctggctggaaatgaaggaaaggaaag 289
63836-UP gcatcaggctgcctttcct 290
63836-LO ctctggtgcccgacagc 291
220875-UP ctggcaatctgggcacc 292
220875-LO cccaagtccacacacaaattat 293
58091-UP aatacttcatctctgggggca 294
58091-LO gctcatttattatggtagacaatcc 295
68909-UP gagtgttgggaagagagaccttc 296
68909-LO gctatgtggacagacccatctg 297
238155-UP ggtacttgatggcaagaggtaact 298
238155-LO aaacttactatttggatagagtgcttt 299
201688-UP caagtaacctggcctctctgagat 300
201688-LO ctgtgagccaggcattcttg 301
57849-UP gctggaccaactcccagtg 302
57849-LO gtgaatatctctcctttctctggg 303
56915-UP cctcggttgcttctctatcataa 304
56915-LO cttgtcaggagtcaacagcttc 305
56608-UP gtggagccaactgggagga 306
56608-LO aggttgagtctcccccgtg 307
68532-UP cttttctcaactactgtttgtgaca 308
68532-LO ccatttgggtgtaggcgg 309
62059-UP tgataagctacaagttcaaatatactaaac 310
62059-LO gacatagagccagattctaccagg 311
66026-UP cccatttttagagtgaaaggctg 312
66026-LO taagtctcccaaggtggatacatg 313
63836 acgcacgtccacggtgatttcaggctgcctttcctccagggtcca 314
220875 ggatggcgttccgtcctattatctgggcxccaggcaggtggtcaggc 315
58091 cgtgccgctcgtgatagaatcxctctctttcttcccatagag 316
68909 agcgatctgcgagaccgtattgttxggxagagagaccttccattcat 317
238155 gcggtaggttcccgacatatatggcaagaggtaactcaatca 318
201688 ggctatgattcgcaatgcttctctctgagattcagtttxcacacctg 319
57849 agggtctctacgctgacgatctggaccaacxcxcagtggagagggta 320
56915 gtgattctgtacgtgtcgcccttctctatcataagcacaatg 321
56608 gacctgggtgtcgatacctacaactgggaggagggaaatgagaac 322
68532 agatagagtcgatgccagctttgtgacaacaatacaccaagtacc 323
62059 agagcgagtgacgcatactatacaaxttcaaatatactaaactattc 324
66026 cgactgtaggtgcgtaactcccatttttagagtgaaaggctgctc 325
326
76268-UP ctgtttcatttcagcccttttag 327
76268-LO gttatccttagtgagttttctgtctaca 328
70371-UP gcgtcatatggagcctcct 329
70371-LO ctcatctggccttctgtgtcc 330
58388-UP ctgcagttcaggtggctgtt 331
58388-LO cctcgtctccaagggtgtct 332
105677-UP agccattagacctgccaatc 333
105677-LO aatgcagaggccaccagc 334
226119-UP gaactgacattaataatcaatgtacttaca 335
226119-LO tctaaattgagtcaagatatagaggctttc 336
63184-UP ctcaagcactctctcttttcatca 337
63184-LO ggagtccaggtagataggaacactag 338
63979-UP gtgatacacgaaggcagatgat 339
63979-LO gactgtgaatgtacttagccccc 340
130240-UP caacaggaagcgaggcc 341
130240-LO acaaggcaggaccaaggc 342
182622-UP gggcttgtgtgtccacaga 343
182622-LO tgtgtcaggaagaagaagatcaac 344
66567-UP ctgaacccaagaacttcctgat 345
66567-LO tgatgagtatataaccagaaggaacac 346
89614-UP agcagaggatggcagtcacc 347
89614-LO cacctctgttcctgttttctgtta 348
219561-UP cagtactatctcttctttaaagatctgaaa 349
219561-LO acccagctcaagatgctctg 350
76268 acgcacgtccacggtgatttttaggtatagttgattgttttaaga 351
70371RT ggatggcgttccgtcctattgcgtcatatgxagcctxctgggacaag 352
58388 cgtgccgctcgtgatagaatttcaggtggctgtttcagagctcag 353
105677 agcgatctgcgagaccgtatcxattagacctgccaatcxcctggaga 354
226119 gcggtaggttcccgacatattaataatcaabxtacxtacataatata 355
63184 ggctatgattcgcaatgcttcactctctcttttcatcactcatct 356
63979 agggtctctacgctgacgatcacgaaxgcagatxatxacggtcgcct 357
130240 gtgattctgtacgtgtcgccgaagcgaggccxcaggtcaaggtggga 358
182622 gacctgggtgtcgatacctatgtgtcxacagacagtggcgggcttca 359
66567 agatagagtcgatgccagctcaagaactxcctgatatgggaatcaaa 360
89614 agagcgagtgacgcatactacagtcaccctcagagcccagaa 361
219561 cgactgtaggtgcgtaactctgaaagtagaaccaatcaaggctcc 362
216327-UP cagtgggctctatttttttctaactt 363
216327-LO tggtctctcagctatggcctt 364
248075-UP gatcaaaaaagcatgagttcttatta 365
248075-LO cctcactaatggtgacacaacaag 366
85187-UP cccaggcaattaatgagtctg 367
85187-LO gtttatatattaggaacttttaggggag 368
225225-UP ctagacctaaatagtggccctaaat 369
225225-LO ctctactgaagacaaacttagaggaatg 370
82031-UP ttgacatcttcttagattctaaaatcac 371
82031-LO ctgttggcttttaaggtctcc 372
60409-UP tgcaggtgcaatgtttattagctc 373
60409-LO gtatgggaaacttaatcttgtatagtaactt 374
221499-UP tttcacaattattatatcagcgaagaac 375
221499-LO ttgatataattaacaaagtacctgaggat 376
168115-UP tcctgtagcattggaaaactgt 377
168115-LO agaaactggagttactcttgtcaga 378
177589-UP ctgaggaagagtgcagcatactc 379
177589-LO caggcatagggttgggatg 380
173632-UP gactcttcatggccaacacc 381
173632-LO attttgccactagtttttacatctcta 382
60188-UP aggatgcatgcatgctgg 383
60188-LO ctcagagtatgtgccattgattg 384
231480-UP ctaatatttagagagcagcaaggac 385
231480-LO cttcttcacccttttcccca 386
216327 acgcacgtccacggtgatttctatttttttctaacttcagaattt 387
248075RT ggatggcgttccgtcctattgcatgagttcttattattcaccaca 388
85187 cgtgccgctcgtgatagaatgcaattaatgagtctgxtaaaccta 389
225225 agcgatctgcgagaccgtatccctaaatttgtgttaxgcxttcccta 390
82031 gcggtaggttcccgacatattagattctxaaatcactttattcatac 391
60409 ggctatgattcgcaatgctttgtttattagctcgtttatcttcca 392
221499RT agggtctctacgctgacgattatcagcgxagaacacttcagttgtaa 393
168115 gtgattctgtacgtgtcgccaaactgttgttcattttctcaccac 394
177589 gacctgggtgtcgatacctagtgcagcatactcattcacaga 395
173632 agatagagtcgatgccagcttcatggccaacaxcaggtagtcagtat 396
60188 agagcgagtgacgcatactagatgcatgcatgctgxcxttgaggaac 397
231480 cgactgtaggtgcgtaactcatttagagagcagcaaxgacattcctc 398
61955-UP tacctctacttcctttcttatattactctt 399
61955-LO gtggatgcaggtcacttattttg 400
65068-UP ctggaattcttccttctaggtgta 401
65068-LO cttccctaaggctacacttatatattaa 402
65882-UP gtatactaaagagtctaagtttttgcctaa 403
65882-LO cttccctttttccttccctt 404
148193-UP catgagttttgtgagggtattcc 405
148193-LO tggctcacacctgtaatccc 406
66158-UP cttacagataagagaatagaataacaaattac 407
66158-LO gaactgttgtgatattgtggaaaga 408
56763-UP cgaattttgtgtaggcagcct 409
56763-LO tctacagaggtagatagaattgaatagaag 410
69003-UP aaaatacctttaacacctatttagtgtc 411
69003-LO ggaaacattttgtaaaaaatcaagta 412
212605-UP gcctgcttcccctttatcct 413
212605-LO tcttatctcccatcttcctctacac 414
860850-UP catgcatccgtccatggg 415
860850-LO atttcctgaatgactgtgtcca 416
235106-UP gcttttgaaaaaaaataaaattgc 417
235106-LO ggacccatttatagttttttaactttg 418
126922-UP gtgctttgataagactgtgatcatcac 419
126922-LO gctgcatgggtccatttgt 420
206538-UP agggtcgggggttctgc 421
61955 acgcacgtccacggtgatttcttcctttcttatattactcttttc 423
65068 ggatggcgttccgtcctattttcttccttctaggtgtxtatctatac 424
65882 cgtgccgctcgtgatagaatagtctaagtxtttgcctaaaagcagga 425
148193 agcgatctgcgagaccgtatgagggtattccccaaaxctctgtgttt 426
66158 gcggtaggttcccgacatatgagaatagaataacaaxttacttga 427
56763 ggctatgattcgcaatgcttttgtgtaggcagccttttagctctt 428
69003 agggtctctacgctgacgatatacctttaaxacctatttagtgtctt 429
212605RT gtgattctgtacgtgtcgccttcccctttatcctcttcgcagcct 430
860850 gacctgggtgtcgatacctatccgtccatggxccacxcgccgagaca 431
235106 agatagagtcgatgccagctaxaaataxaattgcttttgaatactga 432
126922 agagcgagtgacgcatactatgtgatcatcacagcaggacagtat 433
206538 cgactgtaggtgcgtaactcagggtcgggggttctxcxtgttcatct 434
228468-UP cctactttcagatcctgagtcttgt 435
228468-LO gcctctggtgttatttagactcc 436
214674-UP gacttccgattgtgaggctg 437
214674-LO cctccttttattcttgctcatagc 438
126243-UP ccagtgtttgaatgccgct 439
126243-LO gaagcggaggtttcagcag 440
207160-UP tgaatgaattaacaaagtcatggag 441
207160-LO ctctgcccccattccaac 442
66683-UP cagagaattggagttggctgg 443
66683-LO aggaggtagcagtcacactgattc 444
211324-UP tgccacacagtttggagtga 445
211324-LO cattcaatgggggagatgg 446
214373-UP ctggcaggcaagagatgtga 447
214373-LO gactggaaaggaacaaagaggtg 448
234217-UP acagtcatttgtacttacggagcg 449
234217-LO gagcctgcctcaacgagaag 450
63404-UP aggggctargtttggagaagag 451
63404-LO aatgcaaagaccacatctatcaat 452
72171-UP cacctgacctccagcaagag 453
72171-LO ggtgtgtccctgtgtgtagtgg 454
Amel-2-short-UP ccagataaagtggtttctcaagtg 455
228468 acgcacgtccacggtgattttcctgagtcttgttttgacccatga 457
214674RT ggatggcgttccgtcctattccgattgtgaggctgctgagaaggg 458
126243 cgtgccgctcgtgatagaataatgccgctgtgagacaaaggg 459
207160 agcgatctgcgagaccgtataacaaagtcatggagaaatcaactc 460
66683 gcggtaggttcccgacatatagagaattggagttggctggagata 461
211324 ggctatgattcgcaatgctttttgccacacagttxggagtgacccaa 462
214373RT agggtctctacgctgacgatggcaagagatgtgacaggcaagagt 463
234217 gacctgggtgtcgatacctaacttacggagcgctctttgtgagaa 464
63404 agatagagtcgatgccagctrgtttggagaxgagcctacrtcttaac 465
72171 cgactgtaggtgcgtaactctccaxcaagaggaatxcaagaatgcta 466
Amel-2U8 gtgattctgtacgtgtcgccgataaagtggtttctcaagtggtcc 467
表1.受损核酸样品组A的基因型,使用组5(共12个SNP)。样品是纯合子(XX或YY),杂合子(XY),或样品没有对每个SNP分型(一)。 | |||||||||||||
84760 | 195849 | 195869 | 148193 | 238355 | 63635 | 863949 | 211489 | 206538 | 233357 | 207845 | 231480 | #成功的SNP数 | |
DQ 31770 | - | XX | XY | YY | XX | XX | YY | XX | XY | YY | YY | XX | 11/12 |
DQ 31749 | - | YY | - | YY | - | YY | XX | XX | XX | XY | XY | XY | 9/12 |
DQ 31965 | - | XY | - | YY | XX | XY | XX | XX | YY | YY | XX | YY | 10/12 |
DQ232121 | - | YY | YY | XY | XX | XY | YY | XX | YY | YY | YY | XY | 11/12 |
DQ 14700 | - | XY | - | XY | XX | XY | XX | XX | - | YY | YY | XY | 9/12 |
DQ 14704 | - | XY | - | XY | - | XY | - | - | YY | XY | - | XY | 6/12 |
DQ 14775 | - | YY | YY | XY | - | YY | YY | XX | YY | XY | YY | XY | 10/12 |
DQ 12793 | - | XY | - | XY | XX | XY | XY | - | XY | XY | XY | XY | 9/12 |
DQ 12792 | - | - | - | XX | XX | XY | YY | - | YY | YY | XX | YY | 8/12 |
DQ 14686 | - | XY | - | XX | XX | XY | XX | - | XY | XY | YY | XY | 9/12 |
表2.受损核酸样品组A和受损核酸样品组B的基因型,使用组6(共12个SNP)。样品是纯合子(XX或YY),杂合子(XY),或样品没有对每个SNP分型(一)。 | |||||||||||||
63836 | 60676 | 58091 | 169509 | 238155 | 201688 | 57849 | 56915 | 56608 | 68532 | 61500 | 66026 | #成功的SNP数 | |
DQ12792 | XY | YY | XY | XY | YY | XY | XY | XY | XY | XX | XY | XY | 12/12 |
DQ12793 | XY | XY | XY | XY | XY | XY | XY | XY | XY | XY | XY | XY | 12/12 |
DQ14686 | XY | XY | XY | XY | XY | XY | XX | YY | XX | XY | XY | XY | 12/12 |
DQ14775 | XY | YY | XY | YY | YY | XY | XX | XX | XY | XX | XY | XY | 12/12 |
DQ14700 | XY | YY | XY | XY | XX | YY | XY | YY | XX | XY | XY | XY | 12/12 |
DQ14704 | XY | XX | YY | XY | XY | XY | YY | XX | XY | XY | XY | XY | 12/12 |
DQ231770 | YY | YY | XX | XY | YY | YY | XY | XX | XX | XY | XY | XY | 12/12 |
DQ231965 | XY | XY | XY | -Y | XY | XY | XY | XY | XX | YY | YY | XY | 12/12 |
DQ232121 | - | - | - | - | - | - | - | - | - | - | - | - | NoDNA |
DQ231749 | YY | XY | XX | XY | XY | XY | XY | XY | XX | XY | XY | YY | 12/12 |
DFS 2918034 | - | - | - | - | - | - | - | - | - | - | - | - | 0/12 |
DFS 294240 | - | - | - | - | - | - | - | - | - | - | - | - | 0/12 |
DFS 294235 | XY | YY | XX | YY | YY | XY | YY | XY | XX | XY | XY | YY | 12/12 |
DFS 2918027 | - | - | - | - | - | - | - | - | - | - | - | - | 0/12 |
DFS 3260001 | - | - | - | - | - | - | - | - | - | - | - | - | 0/12 |
DFS 3258001 | YY | - | - | - | - | - | - | - | - | - | - | XY | 2/12 |
DFS MITO | YY | XY | YY | XY | YY | XY | XY | XY | XY | XY | XY | YY | 12/12 |
DFS HAIR | YY | - | - | - | - | - | XX | - | - | - | - | - | 2/12 |
表3.用组7进行受损核酸样品组C基因分型.组C的受损样品来源见表8所述. | ||||||||||||
221499 | 89446 | 229291 | 83031 | 226119 | 60409 | 220990 | 63527 | 230299 | 58040 | 62059 | 231480 | |
3260-1 | - | - | - | - | - | - | - | - | - | - | - | - |
3135-4 | YY | - | - | XX | YY | - | - | XY | XX | YY | XX | YY |
3135-5 | - | - | XX | - | - | - | - | - | - | - | XX | YY |
3135-6 | - | - | - | - | - | - | - | - | - | - | - | - |
3106-4 | - | YY | - | - | - | - | - | XY | - | - | YY | YY |
3106-2 | - | - | - | - | - | - | - | XX | - | - | - | - |
3106-7 | - | - | - | YY | YY | - | - | XX | - | - | YY | XX |
表4.用组8进行受损核酸样品组C基因分型.组C的受损样品来源见表8所述. | ||||||||||||
61955 | 65068 | 114977 | 148193 | 66158 | 56763 | 69003 | 63811 | 860850 | 63189 | 126922 | 204593 | |
3260-1 | - | - | - | - | - | - | - | - | - | - | - | - |
3135-4 | - | XY | - | XX | - | YY | XX | XY | - | - | YY | - |
3135-5 | - | - | - | - | - | - | - | - | - | - | - | XX |
3135-6 | - | - | - | - | - | - | - | - | YY | - | - | - |
3106-4 | - | YY | - | XX | - | XX | - | YY | XX | XX | YY | - |
3106-2 | - | - | - | - | - | - | XX | - | - | - | - | - |
3106-7 | YY | - | - | XX | XX | - | YY | XX | XX | YY | YY | - |
表5.用组11进行受损核酸样品组C基因分型.组C的受损样品来源见表8所述. | ||||||||||||
212605 | 220875 | 65882 | 57575 | 66683 | 214674 | 248007 | 63804 | 56144 | 233357 | 60188 | 206538 | |
3260-1 | XY | - | - | - | - | - | - | XX | - | - | XX | XX |
3135-4 | - | - | - | - | - | YY | YY | YY | - | - | YY | YY |
3135-5 | - | - | - | - | - | - | - | - | - | - | - | - |
3135-6 | YY | - | - | - | - | - | - | - | - | - | - | - |
3106-4 | - | - | - | - | XX | - | YY | XX | XX | YY | - | - |
3106-2 | YY | - | - | - | XX | - | - | - | - | - | - | - |
3106-7 | - | - | XY | XY | - | - | - | - | YY | - | YY | YY |
表6.用组9进行受损核酸样品组C基因分型.组C的受损样品来源见表8所述. | ||||||||||||
56593 | 217856 | 231735 | 81917 | 62684 | 241554 | 126264 | 224922 | 81081 | 66561 | 63799 | 119770 | |
3260-1 | - | - | - | - | - | - | - | - | - | - | - | - |
3135-4 | - | XY | YY | XX | - | YY | XX | - | - | YY | - | XX |
3135-5 | XY | - | - | - | - | - | - | - | - | - | XX | XX |
3135-6 | - | - | - | - | - | - | - | - | - | - | - | - |
3106-4 | YY | - | - | - | XX | - | XX | - | YY | - | - | YY |
3106-2 | XX | - | XX | - | - | - | - | - | XX | - | - | XX |
3106-7 | - | YY | - | - | - | XX | - | - | - | - | YY | - |
表7.用组10进行受损核酸样品组C基因分型.组C的受损样品的来源见表8所述. | ||||||||||||
63836 | 60676 | 58091 | 68909 | 238155 | 201688 | 57849 | 56915 | 56608 | 68532 | 61500 | 66026 | |
3260-1 | - | - | - | - | - | - | - | - | - | - | - | - |
3135-4 | YY | - | XX | YY | XY | - | XY | XY | YY | XX | - | YY |
3135-5 | - | - | - | - | - | - | - | - | - | - | - | - |
3135-6 | - | - | - | - | - | - | - | - | - | - | - | - |
3106-4 | YY | -Y | XX | YY | - | XX | XX | XX | - | XX | YY | XX |
3106-2 | XY | - | - | - | - | - | - | - | - | - | - | X- |
3106-7 | - | - | XX | XX | - | - | XX | - | - | - | - | XX |
表8:组C的受损核酸样品的来源 | |||
样品号 | 样品类型 | 尝试的SNP数 | 成功的SNP数 |
3260-1 | 河岸边发现的骨 | 60 | 4 |
3135-4 | 取自车中的毛发(漂白的) | 60 | 35 |
3135-5 | 取自车中的毛发(漂白的) | 60 | 7 |
3135-6 | 取自车中的毛发(漂白的) | 60 | 2 |
3106-4 | 毛发(参比) | 60 | 31 |
3106-2 | 真空吸尘中的可能毛发(非裔美国人) | 60 | 10 |
3106-7 | 来自项链的拭样 | 60 | 25 |
表9.受损DNA样品的结果 | |||||
样品号 | AMEL. | STR数 | 尝试的SNP数 | 成功的SNP数 | SNP谱的频率 |
231965 | XY | 3 | 60 | 12 | 13,908 |
12792 | X | 1 | 48 | 31 | 1.22×109 |
12793 | XY | 1 | 24 | 17 | 37,594 |
14704 | X | 5 | 24 | 17 | N.D. |
14686 | XY | 3 | 24 | 18 | N.D. |
231749 | XY | 1 | 60 | 45 | 1.4×1010 |
14700 | XY | 5 | 60 | 56 | N.D. |
14775 | XX | 4 | 60 | 57 | N.D. |
232121 | XX | 6 | 60 | 59 | N.D. |
231770 | XY | 2 | 60 | 60 | 1.78×1022 |
表10.用本发明的组分析的受损核酸 | ||||
样品号 | PROT+ | COF | 尝试的SNP数 | 成功的SNP数 |
524-3A | 1个基因座 | 只是XY | 71 | 63 |
590-2A | 3个基因座 | 只是XY | 71 | 68 |
617-1A | 只是XY | 只是XY | 71 | 53 |
660-1A | 只是XY | NEG | 71 | 55 |
667-1A | NEG | 只是XY | 71 | 64 |
1268-1A | NEG | 只是XY | 71 | 65 |
1300-1A | NEG | NEG | 71 | 16 |
1337-2A | 4个基因座 | 2个基因座 | 71 | 70 |
1233-1A | NEG | NEG | 71 | 65 |
1473-2A | 4个基因座 | 1个基因座 | 71 | 68 |
1476-1A | NEG | 1个基因座 | 71 | 63 |
1477-1A | 2个基因座 | 3个基因座 | 71 | 59 |
1462-1A | 1个基因座 | NEG | 71 | 63 |
1514-1A | NEG | NEG | 71 | 47 |
1526-1A | NEG | 只是XY | 71 | 57 |
1650-2A | 4个基因座 | 2个基因座 | 71 | 68 |
1747-1A | 1个基因座 | NEG | 71 | 67 |
1818-1A | 4个基因座 | 2个基因座 | 71 | 68 |
1819-1A | 只是XY | 只是XY | 71 | 71 |
1945-1A | 1个基因座 | NEG | 71 | 50 |
1946-1A | 4个基因座 | 2个基因座 | 71 | 63 |
2163-1B | 6个基因座 | 4个基因座 | 71 | 68 |
2181-1B | NEG | NEG | 71 | 62 |
表11.总结44个人的研究-24640个可能的基因型 | ||||
DNA量 | 使用70个SNP的失败数 | %全部 | 错误分型数 | %全部 |
2ng | 81 | 97.37 | 0 | 100 |
320pg | 159 | 94.84 | 4 | 99.86 |
240pg | 145 | 95.29 | 9 | 99.69 |
160pg | 75 | 97.56 | 9 | 99.7 |
80pg | 140 | 95.45 | 12 | 99.55 |
40pg | 223 | 92.76 | 63 | 97.79 |
20pg | 458 | 85.13 | 146 | 94.43 |
10pg | 1090 | 64.64 | 220 | 88.95 |
2370 | 90.38 | 463 | 97.92 | |
虽然本发明已经结合其特定实施方案进行了描述,可以理解能够进行进一步的修改,而且本申请目的是涵盖本发明的任何改变、使用和修改,这通常根据发明的原理并包括在本发明所属领域内已知或习惯性实践中对本发明内容的偏离,如对于前面列举的必要特征以及附加的权利要求列出的保护范围。
Claims (31)
1.一组用于分析受损核酸样品的单核苷酸多态性,其包括两种或多种单核苷酸多态性,其中该组两种或多种单核苷酸多态性的每一种选自彼此不遗传连锁的单核苷酸多态性,且其中该组两种或多种单核苷酸多态性的每一种选自位于串联重复核酸序列之外的单核苷酸多态性。
2.根据权利要求1的组,其中所述单核苷酸多态性包括选自由SEQ ID NO.25-36、61-72、98-109、134-145、170-181、206-217、242-253、278-289、314-325、351-362、387-398、423-434和457-467组成的组中的核酸序列。
3.一种从感兴趣的群体中产生用于分析受损核酸样品的一组单核苷酸多态性的方法,包括:
在感兴趣的群体的基因组中选择一组两种或多种单核苷酸多态性,其中该组两种或多种单核苷酸多态性的每一种是彼此不遗传连锁的基因组的单核苷酸多态性,且其中该组两种或多种单核苷酸多态性的每一种是位于串联重复核酸序列之外的基因组的单核苷酸多态性,由此从感兴趣的群体中产生该组单核苷酸多态性用于分析受损核酸样品。
4.根据权利要求3的方法,其中所述受损样品包括长度为大约10个核苷酸至大约100个核苷酸的核酸。
5.根据权利要求3的方法,其中所述感兴趣的群体是人类。
6.根据权利要求3的方法,其中所述感兴趣的群体是一个失踪的人。
7.一种从受损核酸的未知样品确定个体身份的方法,包括:
从个体中获得具有两种或多种单核苷酸多态性的受损核酸的未知样品;
鉴定存在于受损核酸的未知样品中的两种或多种单核苷酸多态性;
将受损样品中两种或多种单核苷酸多态性的每一种的性质和来自己知样品的一组单核苷酸多态性进行比较,以确定未知样品的两种或多种单核苷酸多态性的每一种和所述组之间的匹配数目,其中所述组包括两种或多种彼此不遗传连锁、并位于串联重复核酸序列之外的单核苷酸多态性;及
根据未知样品中两种或多种单核苷酸多态性的每一种和已知样品之间的匹配数目确定未知样品和已知样品来自相同或相关个体的概率,由此从受损核酸未知样品确定个体的身份。
8.一种从受损核酸的未知样品确定个体身份的方法,包括:
从个体获得具有两种或多种单核苷酸多态性的受损核酸的未知样品;
获得具有两种或多种单核苷酸多态性的核酸的已知样品;
选择一组两种或多种单核苷酸多态性,其中该组两种或多种单核苷酸多态性的每一种彼此不遗传连锁,并且其中该组单核苷酸多态性的每一种位于串联重复核酸序列之外;
确定受损核酸样品中存在的该组两种或多种单核苷酸多态性的每一种的性质;以及
确定已知样品中存在的该组两种或多种单核苷酸多态性的每一种的性质;
比较在已知样品中观察到的该组两种或多种单核苷酸多态性的性质与在受损核酸的未知样品中观察到的该组两种或多种单核苷酸多态性的性质;以及
确定未知样品和已知样品来自相同或相关个体的概率,因而确定受损核酸的未知样品的个体身份。
9.根据权利要求7的方法,其中所述已知样品和未知样品来自相同个体。
10.根据权利要求7的方法,其中所述已知样品来自一个家族成员。
11.根据权利要求7的方法,其中所述受损核酸样品包括长度为大约10个核苷酸至大约100个核苷酸的核酸片段。
12.根据权利要求7的方法,其中使用单碱基引物延伸反应确定一或多个单核苷酸多态性的性质。
13.根据权利要求7的方法,其中受损样品的两种或多种单核苷酸多态性在一多重反应中鉴定。
14.根据权利要求7的方法,其中该组两种或多种单核苷酸多态性在一多重反应中鉴定。
15.根据权利要求7的方法,其中该组两种或多种单核苷酸多态性在一阵列中鉴定。
16.根据权利要求7的方法,其中受损样品的两种或多种单核苷酸多态性在一阵列中鉴定。
17.根据权利要求15的方法,其中所述阵列是可寻址阵列。
18.根据权利要求16的方法,其中所述阵列是可寻址阵列。
19.根据权利要求15的方法,其中所述阵列是虚拟阵列。
20.根据权利要求16的方法,其中所述阵列是虚拟阵列。
21.一种对受损核酸样品进行基因分型的方法,包括:
从个体获得受损核酸样品;
鉴定存在于受损核酸样品中的两种或多种单核苷酸多态性;及
将受损样品中的两种或多种单核苷酸多态性的每一种的性质与来自感兴趣的群体的一组单核苷酸多态性进行比较,以确定受损样品中的两种或多种单核苷酸多态性的每一种在感兴趣的群体中的出现频率,其中所述组包括两种或多种彼此不遗传连锁、并位于串联重复核酸序列之外的单核苷酸多态性;由此对受损核酸样品进行基因分型。
22.一种对受损核酸样品进行基因分型的方法,包括:
从个体获得受损核酸样品;
从感兴趣的群体基因组中选择一组单核苷酸多态性,所述组包括两种或多种单核苷酸多态性,其中该组两种或多种单核苷酸多态性的每一种彼此不遗传连锁、并位于串联重复核酸序列之外;
鉴定在受损核酸样品中存在的两种或多种单核苷酸多态性;及
将在受损样品中观察到的两种或多种单核苷酸多态性的性质与在所述组中观察到的两种或多种单核苷酸多态性的性质进行比较,以确定基因型,从而获得受损核酸样品的基因型。
23.根据权利要求22的基因分型的方法,其中所述单核苷酸多态性是双等位基因的,且单核苷酸多态性的等位基因的性质是T和/或C。
24.根据权利要求22的基因分型的方法,其中所述感兴趣的群体是人类。
25.根据权利要求22的基因分型的方法,其中所述样品包括人类核酸。
26.根据权利要求22的基因分型的方法,其中所述受损核酸样品中存在的两种或多种单核苷酸多态性使用单碱基引物延伸反应鉴定。
27.根据权利要求22的基因分型的方法,其中在受损核酸样品中存在的两种或多种单核苷酸多态性在一多重反应中鉴定。
28.根据权利要求22的基因分型的方法,其中在受损核酸样品中存在的两种或多种单核苷酸多态性在一阵列上鉴定。
29.根据权利要求28的基因分型的方法,其中所述阵列是可寻址阵列。
30.根据权利要求28的基因分型的方法,其中所述阵列是虚拟阵列。
31.根据权利要求22的基因分型的方法,其中所述受损核酸样品扩增至长度为大约10个核苷酸至大约100个核苷酸。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US39250402P | 2002-06-28 | 2002-06-28 | |
US60/392,504 | 2002-06-28 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1723217A true CN1723217A (zh) | 2006-01-18 |
CN100354298C CN100354298C (zh) | 2007-12-12 |
Family
ID=30000884
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB038205491A Expired - Fee Related CN100354298C (zh) | 2002-06-28 | 2003-06-26 | 使用单核苷酸多态性组分析受损样品的方法和组合物 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20060094010A1 (zh) |
EP (1) | EP1573037A4 (zh) |
CN (1) | CN100354298C (zh) |
AU (1) | AU2003247715B8 (zh) |
CA (1) | CA2491117A1 (zh) |
WO (1) | WO2004003220A2 (zh) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2740414A1 (en) * | 2008-10-14 | 2010-04-22 | Bioaccel | System and method for inferring str allelic genotype from snps |
US11332793B2 (en) | 2010-05-18 | 2022-05-17 | Natera, Inc. | Methods for simultaneous amplification of target loci |
US11939634B2 (en) | 2010-05-18 | 2024-03-26 | Natera, Inc. | Methods for simultaneous amplification of target loci |
US11332785B2 (en) | 2010-05-18 | 2022-05-17 | Natera, Inc. | Methods for non-invasive prenatal ploidy calling |
US11322224B2 (en) | 2010-05-18 | 2022-05-03 | Natera, Inc. | Methods for non-invasive prenatal ploidy calling |
US20190010543A1 (en) | 2010-05-18 | 2019-01-10 | Natera, Inc. | Methods for simultaneous amplification of target loci |
US11408031B2 (en) | 2010-05-18 | 2022-08-09 | Natera, Inc. | Methods for non-invasive prenatal paternity testing |
US11339429B2 (en) | 2010-05-18 | 2022-05-24 | Natera, Inc. | Methods for non-invasive prenatal ploidy calling |
US11326208B2 (en) | 2010-05-18 | 2022-05-10 | Natera, Inc. | Methods for nested PCR amplification of cell-free DNA |
US9677118B2 (en) | 2014-04-21 | 2017-06-13 | Natera, Inc. | Methods for simultaneous amplification of target loci |
EP2572003A4 (en) | 2010-05-18 | 2016-01-13 | Natera Inc | METHOD FOR NONINVASIVE PRANATAL PLOIDIE ASSIGNMENT |
US10316362B2 (en) | 2010-05-18 | 2019-06-11 | Natera, Inc. | Methods for simultaneous amplification of target loci |
CN106460070B (zh) | 2014-04-21 | 2021-10-08 | 纳特拉公司 | 检测染色体片段中的突变和倍性 |
WO2016183106A1 (en) | 2015-05-11 | 2016-11-17 | Natera, Inc. | Methods and compositions for determining ploidy |
US11001880B2 (en) | 2016-09-30 | 2021-05-11 | The Mitre Corporation | Development of SNP islands and application of SNP islands in genomic analysis |
US11485996B2 (en) | 2016-10-04 | 2022-11-01 | Natera, Inc. | Methods for characterizing copy number variation using proximity-litigation sequencing |
US10011870B2 (en) | 2016-12-07 | 2018-07-03 | Natera, Inc. | Compositions and methods for identifying nucleic acid molecules |
US11525159B2 (en) | 2018-07-03 | 2022-12-13 | Natera, Inc. | Methods for detection of donor-derived cell-free DNA |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5856092A (en) * | 1989-02-13 | 1999-01-05 | Geneco Pty Ltd | Detection of a nucleic acid sequence or a change therein |
US6013431A (en) * | 1990-02-16 | 2000-01-11 | Molecular Tool, Inc. | Method for determining specific nucleotide variations by primer extension in the presence of mixture of labeled nucleotides and terminators |
US5846710A (en) * | 1990-11-02 | 1998-12-08 | St. Louis University | Method for the detection of genetic diseases and gene sequence variations by single nucleotide primer extension |
US5888819A (en) * | 1991-03-05 | 1999-03-30 | Molecular Tool, Inc. | Method for determining nucleotide identity through primer extension |
US6004744A (en) * | 1991-03-05 | 1999-12-21 | Molecular Tool, Inc. | Method for determining nucleotide identity through extension of immobilized primer |
US5853989A (en) * | 1991-08-27 | 1998-12-29 | Zeneca Limited | Method of characterisation of genomic DNA |
US5302510A (en) * | 1992-07-27 | 1994-04-12 | Life Technologies, Inc. | DNA sizing control standards for electrophoretic analyses |
US5470723A (en) * | 1993-05-05 | 1995-11-28 | Becton, Dickinson And Company | Detection of mycobacteria by multiplex nucleic acid amplification |
WO1995012607A1 (en) * | 1993-11-03 | 1995-05-11 | Molecular Tool, Inc. | Single nucleotide polymorphisms and their use in genetic analysis |
JPH11505126A (ja) * | 1995-05-19 | 1999-05-18 | アボツト・ラボラトリーズ | プライマーシリーズ集団を使用する広い動的範囲の核酸検出 |
US5882857A (en) * | 1995-06-07 | 1999-03-16 | Behringwerke Ag | Internal positive controls for nucleic acid amplification |
WO1997035033A1 (en) * | 1996-03-19 | 1997-09-25 | Molecular Tool, Inc. | Method for determining the nucleotide sequence of a polynucleotide |
CA2260749A1 (en) * | 1996-07-16 | 1998-01-22 | Gen-Probe Incorporated | Methods for detecting rna analytes using modified probes |
US6133436A (en) * | 1996-11-06 | 2000-10-17 | Sequenom, Inc. | Beads bound to a solid support and to nucleic acids |
WO1999014228A1 (en) * | 1997-09-17 | 1999-03-25 | Affymetrix, Inc. | Genetic compositions and methods |
US6268146B1 (en) * | 1998-03-13 | 2001-07-31 | Promega Corporation | Analytical methods and materials for nucleic acid detection |
US6270973B1 (en) * | 1998-03-13 | 2001-08-07 | Promega Corporation | Multiplex method for nucleic acid detection |
US6235480B1 (en) * | 1998-03-13 | 2001-05-22 | Promega Corporation | Detection of nucleic acid hybrids |
US5952202A (en) * | 1998-03-26 | 1999-09-14 | The Perkin Elmer Corporation | Methods using exogenous, internal controls and analogue blocks during nucleic acid amplification |
US6074831A (en) * | 1998-07-09 | 2000-06-13 | Agilent Technologies, Inc. | Partitioning of polymorphic DNAs |
US6268147B1 (en) * | 1998-11-02 | 2001-07-31 | Kenneth Loren Beattie | Nucleic acid analysis using sequence-targeted tandem hybridization |
US20020025519A1 (en) * | 1999-06-17 | 2002-02-28 | David J. Wright | Methods and oligonucleotides for detecting nucleic acid sequence variations |
US6090590A (en) * | 1999-08-10 | 2000-07-18 | The Regents Of The University Of California | Reducing nontemplated 3' nucleotide addition to polynucleotide transcripts |
US6107061A (en) * | 1999-09-18 | 2000-08-22 | The Perkin-Elmer Corporation | Modified primer extension reactions for polynucleotide sequence detection |
WO2001029262A2 (en) * | 1999-10-15 | 2001-04-26 | Orchid Biosciences, Inc. | Genotyping reagents, kits and methods of use thereof |
US6287778B1 (en) * | 1999-10-19 | 2001-09-11 | Affymetrix, Inc. | Allele detection using primer extension with sequence-coded identity tags |
US6506568B2 (en) * | 2000-02-10 | 2003-01-14 | The Penn State Research Foundation | Method of analyzing single nucleotide polymorphisms using melting curve and restriction endonuclease digestion |
US6818758B2 (en) * | 2000-02-22 | 2004-11-16 | Applera Corporation | Estrogen receptor beta variants and methods of detection thereof |
-
2003
- 2003-06-26 CN CNB038205491A patent/CN100354298C/zh not_active Expired - Fee Related
- 2003-06-26 AU AU2003247715A patent/AU2003247715B8/en not_active Ceased
- 2003-06-26 WO PCT/US2003/020150 patent/WO2004003220A2/en not_active Application Discontinuation
- 2003-06-26 EP EP03762070A patent/EP1573037A4/en active Pending
- 2003-06-26 US US10/519,224 patent/US20060094010A1/en not_active Abandoned
- 2003-06-26 CA CA002491117A patent/CA2491117A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
AU2003247715A1 (en) | 2004-01-19 |
US20060094010A1 (en) | 2006-05-04 |
AU2003247715B8 (en) | 2008-06-05 |
EP1573037A4 (en) | 2007-05-09 |
CA2491117A1 (en) | 2004-01-08 |
WO2004003220A2 (en) | 2004-01-08 |
WO2004003220A3 (en) | 2005-08-04 |
EP1573037A2 (en) | 2005-09-14 |
CN100354298C (zh) | 2007-12-12 |
AU2003247715B2 (en) | 2008-01-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1289690C (zh) | Rna序列扩增的方法和组合物 | |
CN1723217A (zh) | 使用单核苷酸多态性组分析受损样品的方法和组合物 | |
CN1118581C (zh) | 对dna的特性分析 | |
CN1227357C (zh) | 用于扩增核酸序列的方法 | |
CN1034673C (zh) | 检测核苷酸顺序的方法 | |
CN1154733C (zh) | 改进的热稳定dna聚合酶 | |
CN1608137A (zh) | 通过同时探查和酶介导检测的多态性基因座多重分析 | |
CN1198943C (zh) | 通过裂解脱碱基位点的核酸产生可延伸的上游dna片段而鉴定核酸分子的方法 | |
CN1219972A (zh) | 短串联重复基因座的多重扩增 | |
CN1071955A (zh) | 分支杆菌引物及探针 | |
CN1370242A (zh) | 基因组分布分析:一种检测复杂生物样品中多种类型生物的存在的快速方法 | |
CN100351393C (zh) | 核苷酸多态性的检测方法 | |
CN1578841A (zh) | 退火控制引物及该退火控制引物的使用 | |
CN1898395A (zh) | 基于引物的核酸的多重扩增的方法和试剂盒 | |
CN1650031A (zh) | 基因组变异的快速分析 | |
CN1592792A (zh) | 检测核酸的材料和方法 | |
CN1451050A (zh) | 控制水相介质的微生物质量的方法及其试剂盒 | |
CN1040220A (zh) | 一种扩增核苷酸顺序的方法 | |
CN1656233A (zh) | 利用切割剂扩增核酸片段 | |
CN1806051A (zh) | 通过(例如)t细胞受体v/d/j基因中的重复鉴定克隆性细胞 | |
CN1325458A (zh) | 核酸扩增和测序方法 | |
CN1863927A (zh) | 核酸检测分析 | |
CN1665938A (zh) | 检测序列差异的方法 | |
CN1977050A (zh) | 丙型肝炎病毒基因型的确定 | |
CN1876843A (zh) | 检测突变和/或多态性的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |