CN1723217A

CN1723217A - 使用单核苷酸多态性组分析受损样品的方法和组合物

Info

Publication number: CN1723217A
Application number: CNA038205491A
Authority: CN
Inventors: 罗伯特·贾尔斯; 雅尼娜·M.·贝施; 布赖恩·麦基翁
Original assignee: Orchid Biosciences Inc
Current assignee: Orchid Cellmark Inc
Priority date: 2002-06-28
Filing date: 2003-06-26
Publication date: 2006-01-18
Anticipated expiration: 2023-06-26
Also published as: AU2003247715A1; US20060094010A1; AU2003247715B8; EP1573037A4; CA2491117A1; WO2004003220A2; WO2004003220A3; EP1573037A2; CN100354298C; AU2003247715B2

Abstract

本发明提供了分析受损核酸样品的方法和组合物。本发明还包括选择一组(a panel of)单核苷酸多态性的方法和该组单核苷酸多态性，选择该组单核苷酸多态性使其位于串联重复区域之外，并且不遗传连锁。

Description

使用单核苷酸多态性组分析受损样品的方法和组合物

技术领域

本发明涉及分析受损样品(compromised sample)的方法和组合物。

背景技术

经典遗传学、基因由核酸序列限定的发现、遗传物质结构的发现以及生物技术革命产生了通过核酸分析进行的人类鉴定科学。能够从完整的遗传物质样品高度可信地鉴定核酸样品来源的***已经迈了很大一步。

可以使用多种核酸分析技术用于揭示核酸样品之间的遗传相似性。例如，在基因组中存在的高度多态性重复序列可以用于遗传鉴定应用。这些应用可以在群体中高度可信地鉴定个体。一个重要的应用依赖于多态性串联重复基因座的分析。遗传鉴定应用的一个例子是FBI的组合DNA指数***或称CODIS，其使用13个多态性短串联重复基因座用于遗传鉴定。

串联重复基因座是基因组中的基因座，其含有变化长度的核苷酸序列的重复单位，如双核苷酸重复、三核苷酸重复、四核苷酸重复等等。重复单位的长度可从小至2个核苷酸变化至极大数目的核苷酸。重复可以是简单的串联序列重复或其复杂组合。在这种基因座的这些重复的长度或特性的改变称为这些基因座的多态性。这样的多态性最常起因于群体中的个体之间在一个基因座存在不同数目的这种重复。通过某些评估，串联重复在人类基因组中存在的平均频率为大约15000碱基。等位基因的数目，或在一个基因座的序列重复的多样性通常在大约少至3或4个到多至15或多至50甚至更多之间变化。其相对高的出现频率，以及显著程度的多态性使基因组的这些特征成为遗传鉴定应用的有吸引力的候选物。通过在核酸的非受损样品中测定足够数目的多态性串联重复基因座，并比较该个体的基因座的特性和来自第二个个体的参比样品中相同基因座的特性，可以确定所述个体是否与获得参比样品的第二个个体遗传相关。一般说来，在遗传鉴定应用中使用的多态性重复基因座的选择是使得它们彼此不连锁，或处于Hardy-Weinberg平衡。

在遗传鉴定应用中使用多种类型的串联重复基因座。短串联重复(STR)来自于核酸序列的短序列段的数目变化。在人类基因组中，认为STR在每几十万个碱基中出现一次。STR包括大约2-7个碱基，并且根据其含有的重复单位的数目而变化，并且其以简单和复杂重复存在。串联重复的另一种类型，小卫星重复，通常大约为10至50左右的碱基重复大约20-50次。微卫星重复通常为大约1-6碱基重复，多至6或多次。这些重复在基因组中可以发生成千上万次。对串联重复基因座的命名法是不准确的。这些和其它的串联重复可以用概括性的广义术语可变数目串联重复或VNTR来表示。

使用VNTR的遗传鉴定应用可以使用限制片段长度多态性分析(RFLP分析)，一种基于凝胶的方法，或基于聚合酶链反应(PCR)的方法。RFLP分析利用了通过使用限制性内切核酸酶从非受损核酸样品中产生的核酸片段之间的长度差异。限制性内切核酸酶，简称内切核酸酶，是在高度可预测位置片段化或切割核酸的酶。如果两种完整的核酸样品被相同的内切核酸酶切割，如果它们的遗传序列是相同的，那么它们的片段化模式将是相同的。如果样品不同，则部分基于在某些位置的切割位点的选择，它们将产生不同的片段，这些位置的切割位点的选择使得根据在预测片段的切割位点内或切割位点处多态性串联重复基因座的出现，将产生预计不同的片段大小。如许多使用串联重复基因座的遗传鉴定应用一样，RFLP分析依赖于基于核酸片段通过大小分离凝胶(sizing gel)的电泳迁移或基于其它的大小分离方案来分离或分辨核酸片段的能力。然而，基于大小分离的方案由于大小分离方法的分辨能力而固有地被限制；太小或大小上仅轻微不同的片段是不可分辨的。尽管RFLP分析是潜在的强有力的遗传鉴定应用，但其通常需要相当完整的核酸样品。而且，RFLP分析需要相当量的核酸，并需要相对长的时间以产生和解释结果。

使用串联重复基因座和PCR的遗传鉴定应用需要较少的核酸。在基于PCR的应用中，含有具有串联重复序列的基因座的序列被扩增或被复制许多次，然后通常使用大小分离方案分离和鉴定。然而，由于PCR聚合酶的属性以及串联重复基因座的属性，由于PCR扩增过程中的“打滑(slippage)”或“口吃(stutter)”，PCR方法倾向于出现人为结果。这种打滑或口吃是由于聚合酶不能忠实和准确地复制含有串联重复的序列所致。串联重复序列的属性有时引起PCR聚合酶跳过重复单位元件而有时引起过度复制重复单位元件。结果，含有串联重复的序列的扩增拷贝比原始序列长或短，因此不能提供遗传鉴定应用所需要的忠实度。而且，大多数基于PCR的应用依赖于大小分离方法进行鉴定，因此在这一方面有与RFLP分析一样的缺点。由于许多有用的串联重复基因座的长度，扩增或复制的序列一般必须有至少接近100并多至1000或更多个碱基的长度。受损的核酸样品不一定如此完整到含有用于遗传鉴定应用的足够数目的串联重复基因座。

由于含有不确定身份(identity)或起源的核酸的样品的受损属性，使用现有的遗传鉴定应用常常不可能。许多因素导致不能从受损样品中提取遗传信息。样品可能已经暴露于物理作用，如热或剪切力，来自例如太阳的紫外线。样品可能经受过多的化学降解剂，以及许多生物降解过程，例如，暴露于微生物或核酸酶。这些过程可能导致样品含有的基因座数量比用于遗传分析的完整的有用基因座的最佳数量要少，导致受损样品没有足够的信息用于目前使用的遗传鉴定应用。

因此，仍然需要用于受损的核酸样品的遗传鉴定应用，其应该不必需依赖于大小分离方案而进行鉴定，以及不依赖于用于鉴定目的的足够的串联重复基因座的存在。

发明简述

在一个实施方案中，本发明包括一组(a panel of)用于从受损样品确定人身份的单核苷酸多态性。在本发明的另一个实施方案中，该组单核苷酸多态性包括选自如下一组中的核酸序列：SEQ ID NOS.25-36、61-72、98-109、134-145、170-181、206-217、242-253、278-289、314-325、351-362、387-398、423-434和457-467。

在另一个实施方案中，本发明包括一种从感兴趣的群体产生一组用于分析受损的核酸样品的单核苷酸多态性的方法，包括：在感兴趣的群体的基因组中选择一组两种或多种单核苷酸多态性，其中该组两种或多种单核苷酸多态性的每一种均是彼此不遗传连锁的基因组单核苷酸多态性，且其中该组两种或多种单核苷酸多态性的每一种均是位于串联重复核酸序列之外的基因组单核苷酸多态性，由此从感兴趣的的群体产生用于分析受损的核酸样品的该组单核苷酸多态性。在另一个实施方案中，本发明包括一种方法，其中所述受损样品包括长度为大约10个核苷酸至大约100个核苷酸的核酸。在另一个实施方案中，使用的方法中所述感兴趣的群体是人类。在另一个实施方案中，本发明使用的方法中的感兴趣的群体是一个失踪(missing)的人。

在另一个实施方案中，本发明包括一种从受损的核酸未知样品中确定个体身份的方法，包括：从个体获得具有两种或多种单核苷酸多态性的受损核酸的未知样品；鉴定存在于受损核酸未知样品中的两种或多种单核苷酸多态性；将受损样品中两种或多种单核苷酸多态性的每一种的性质与已知样品的一组单核苷酸多态性进行比较，以确定在未知样品中的两种或多种单核苷酸多态性的每一种和所述组之间的匹配数目，其中所述组包括两种或多种彼此不遗传连锁、并位于串联重复核酸序列之外的单核苷酸多态性；并根据未知样品和已知样品中两种或多种单核苷酸多态性的每一种之间匹配的数目确定未知样品和已知样品来自相同或相关个体的概率，因此从受损核酸未知样品确定个体的身份。

本发明的另一个实施方案包括一种从受损核酸未知样品确定个体身份的方法，包括：从个体获得具有两种或多种单核苷酸多态性的受损核酸的未知样品；获得具有两种或多种单核苷酸多态性的核酸的已知样品；选择一组两种或多种单核苷酸多态性，其中该组两种或多种单核苷酸多态性的每一种彼此不遗传连锁，并且其中该组的单核苷酸多态性的每一种均位于串联重复核酸序列之外；确定受损核酸样品中存在的该组两种或多种单核苷酸多态性的每一种的性质；确定已知样品中存在的该组两种或多种单核苷酸多态性的每一种的性质；比较在已知样品中观察到的该组两种或多种单核苷酸多态性的性质与在受损核酸的未知样品中观察到的该组两种或多种单核苷酸多态性的性质；并确定未知样品和已知样品来自相同或相关个体的概率，因此从受损核酸的未知样品确定个体的身份。

在本发明的另一个实施方案中，已知样品和未知样品来自相同个体。本发明的另一个实施方案包括已知样品来自一个家族成员的方法。在另一个实施方案中，所述受损核酸样品包括长度为大约10个核苷酸至大约100个核苷酸的核酸片段。在另一个实施方案中，使用单碱基引物延伸反应确定一或多个单核苷酸多态性的性质。在另一个实施方案中，受损样品的两种或多种单核苷酸多态性在一多重反应中鉴定。在另一个实施方案中，该组两种或多种单核苷酸多态性在一多重反应中鉴定。在另一个实施方案中，该组两种或多种单核苷酸多态性在一阵列中鉴定。在另一个实施方案中，受损样品的两种或多种单核苷酸多态性在一阵列中鉴定。在另一个实施方案中，所述阵列是可寻址阵列。在另一个实施方案中，所述阵列是可寻址阵列。在另一个实施方案中，所述阵列是虚拟(virtual)阵列。在另一个实施方案中，所述阵列是虚拟阵列。

在另一个实施方案中，本发明包括一种对受损核酸样品基因分型的方法，包括：从个体获得受损核酸样品；鉴定存在于受损核酸样品中的两种或多种单核苷酸多态性；并将受损样品中的两种或多种单核苷酸多态性的每一种的性质与一感兴趣群体的一组单核苷酸多态性进行比较，以确定受损样品中的所述两种或多种单核苷酸多态性的每一种在感兴趣的群体中的发生频率，其中所述组包括两种或多种彼此不遗传连锁、并位于串联重复核酸序列之外的单核苷酸多态性；由此对受损核酸样品基因分型。

在另一个实施方案中，本发明包括一种对受损核酸样品基因分型的方法，包括：从个体获得受损核酸样品；从感兴趣的群体基因组选择一组单核苷酸多态性，所述组包括两种或多种单核苷酸多态性，其中该组两种或多种单核苷酸多态性的每一种彼此不遗传连锁、并位于串联重复核酸序列之外；鉴定受损核酸样品中存在的两种或多种单核苷酸多态性；并将在受损样品中观察到的两种或多种单核苷酸多态性的性质与在该组中观察到的两种或多种单核苷酸多态性的性质进行比较以确定基因型，从而获得受损核酸样品基因型。一个进一步的实施方案包括一种基因分型方法，其中所述组的单核苷酸多态性是双等位基因的(biallelic)，其中每一等位基因中的多态性性质是T和/或C。在另一个实施方案中，本发明包括一种基因分型方法，其中所述感兴趣的群体是人类。一个进一步的实施方案包括一种基因分型方法，其中所述样品包括人类核酸。另一个实施方案包括一种基因分型方法，其中所述受损核酸样品中存在的两种或多种单核苷酸多态性使用一单碱基引物延伸反应鉴定。另一个实施方案包括一种基因分型方法，其中受损核酸样品中存在的两种或多种单核苷酸多态性在一多重反应中鉴定。另一个实施方案包括一种基因分型方法，其中受损核酸样品中存在的两种或多种单核苷酸多态性在一阵列上鉴定。一个进一步的实施方案包括一种基因分型方法，其中所述阵列是可寻址阵列。仍然另一个实施方案包括一种基因分型方法，其中所述阵列是虚拟阵列。仍然另一个实施方案包括一种基因分型方法，其中所述受损核酸样品扩增至长度为大约10个核苷酸至大约100个核苷酸。

为了更好的理解本发明以及其它和进一步的优点和实施方案，以下结合描述实施例进行参考，保护范围在附加的权利要求中。

附图说明

图1描述了本发明的一个实施方案，其中获得受损的核酸样品；使用受损样品的核酸作为模板扩增含有单核苷酸多态性或称SNP的核酸；将扩增的含有单核苷酸多态性的核酸进行引物延伸反应，其中引物延伸一个单碱基，例如一个标记的核苷酸衍生物；确定扩增核酸的单核苷酸多态性的性质；将来自扩增核酸的每个单核苷酸多态性的性质与参比样品中的每一对应的单核苷酸多态性的性质进行比较；并确定受损样品的核酸与参比样品的核酸遗传相似的可能性。

优选实施方案详述

现在将结合优选实施方案描述本发明。这些实施方案是为了帮助理解本发明，而无意并且也不应该以任何方式限制本发明。所有的可选择方案、修改以及等同物对本领域技术人员来说在阅读完本发明的公开后将是显而易见的，并且包含在本发明的范围和精神之内。

本公开不是分析受损核酸的引物，对本领域技术人员来说已知的或容易确定的基本概念没有详细描述。

在一个实施方案中，本发明包括一组用于分析受损核酸样品的单核苷酸多态性，其包括两种或多种单核苷酸多态性，其中该组两种或多种单核苷酸多态性的每一种选自彼此不遗传连锁的单核苷酸多态性，且其中该组两种或多种单核苷酸多态性的每一种选自位于串联重复核酸序列之外的单核苷酸多态性。

“组(panel)”表示一组预选的适用于鉴定群体的一个成员的单核苷酸多态性。例如，在一个优选的实施方案中，所述的组包括一些从人类基因组的单核苷酸多态性预选的单核苷酸多态性，其中所述单核苷酸多态性的数量和特性足以将一个个体遗传鉴定到统计学可信的程度。遗传鉴定包括通过观察该组单核苷酸多态性的性质在群体中将一个个体与另一个体区别的能力。例如，通过将组中的单核苷酸多态性的性质与含有该组全部或一些单核苷酸多态性的受损样品进行比较而区别一个个体与另一个个体。遗传鉴定包括在具有统计学可信度的程度上确定受损样品中的单核苷酸多态性与参比样品中的单核苷酸多态性是否相同或是否不同。所述参比样品可以，例如，包含来自另一个个体如一个家族成员的核酸。“遗传鉴定”还指在统计学可信度的程度上确定受损样品中的单核苷酸与一个以上的参比样品的单核苷酸多态性是否相同或是否不同。例如，受损样品的单核苷酸多态性可以与一组参比样品例如假定的家族成员中的单核苷酸多态性进行比较，以确定受损样品的核酸是否来自与获取所述一或多种参比样品的个体遗传相关的一个或多个个体。

“比较”单核苷酸多态性表示确定一个样品的单核苷酸多态性是否与另一个样品的单核苷酸多态性相同或不同，其中这两个样品中的一个是受损样品或两个都是受损样品，或者一个样品是受损样品而另一个样品是参比样品。

参比样品可以包括从取自一或多个供体个体的生物材料中确定的单核苷酸多态性，其中所述单核苷酸多态性的性质是从所述生物材料中确定的。参比样品可以是以任何方式确定其性质的单核苷酸多态性的任何集合。例如，参比样品可以是这样的单核苷酸多态性的集合，其无须通过直接从核酸的生物样品中确定其性质而确定其存在，，而是例如通过从蛋白中推导核苷酸序列而产生的，或者通过在一组家族成员中观察单核苷酸多态性而产生单核苷酸多态性。例如，一个参比样品包括家族成员的预期基因型，而预期的家族成员的基因型是通过观察其它家族成员的基因型并使用本领域熟知的遗传算法和理论，获得家族成员的预期基因型而产生的。与本发明的实施方案相关的是，这样的预期基因型包括一组由家族成员的基因型和通过使用本领域已知的遗传算法和理论推导的预期家族成员会展示的单核苷酸多态性的性质。

以“统计学可信度的程度”鉴定个体是指建立受损样品与参比样品或另一受损样品遗传相关的统计学可信度的程度。为了获得该结果，在遗传鉴定领域中已知有多种方法。在一给定的例子中，为了达到统计学可信度，使用的算法和方法可以不同。例如，一组单核苷酸多态性在两个样品之间或者一个样品和一个参比样品之间相同时，统计学可信度的程度可以从与样品中的或每一基因座的每一等位基因相关的个体概率计算。

如果可以从统计学可信度的程度说样品来自限定的感兴趣的群体，那么一受损样品与另一受损样品或参比样品是“遗传相关的”。“限定的感兴趣的群体”是指在其基因组中共享某些特征的一组感兴趣的个体，例如，家族成员、种族如亚洲人、非洲人、土著美国人等等。“限定的感兴趣的群体”可以小至单个个体，或可以多至在人类种群中的所有女性或所有男性。因此，例如，如果限定的感兴趣的群体由所有亚洲人组成，那么来自亚洲种系的男性个体的受损样品可以是与亚洲女性同胞“遗传相关的”，但如果限定的感兴趣的群体仅由亚洲男性组成，那么这种情况下该男性个体的受损样品将将不能被认为是与亚洲女性同胞“遗传相关的”。

“受损的核酸样品”是指已知含有或怀疑含有核酸的生物样品，其中样品的核酸是被过度降解的。例如，用不含足量的完整的法医上有用的串联重复序列的片段组成的核酸样品是不能可靠地使用串联重复位点分析，例如使用依赖于CODIS基因座的鉴定***，完成核酸样品的遗传分析的。实际中，核酸样品，特别是用于法医分析的核酸样品可能是明显降解的。该样品可能已经暴露于物理作用，如热或剪切力，来自例如太阳的紫外线。样品可能已经受过多的化学降解过程。样品可能已经受到多种生物降解过程，例如，如暴露于微生物或核酸酶。这些过程可能导致样品含有低于可适于使用本领域已知的、并非利用单核苷酸多态性的遗传分析的最佳数量的完整有用基因座，由此使受损样品不能作为目前应用的遗传鉴定应用的有用信息。在本发明的一个优选的实施方案中，受损核酸样品包括长度为大约10个核苷酸至大约100个核苷酸的核酸。最优选地，受损核酸样品基本由长度为至少50个至至少大约100个核苷酸的核酸片段组成。实践中，受损样品甚至可能含有短至长度为一或两个核苷酸的核酸片段，只要在样品中存在足够的长度为10至100核苷酸的核酸，则该样品就携带了足够的单核苷酸多态性以对样品进行基因分析或以统计学可信度的程度鉴定个体。同样，受损样品可能含有长度超过100个核苷酸的核苷酸片段。

“彼此不遗传连锁”是指选择本发明的单核苷酸多态性以便如果它们位于相同的染色体和核酸分子上相互相距一个所需的距离。优选地，选择的一组单核苷酸多态性相距大约10至15兆个碱基。最优选地，一组单核苷酸多态性相距大约20至100或更多兆个碱基。合适的单核苷酸多态性包括彼此不是连锁不平衡的那些，虽然也不需要任何组的任何单核苷酸多态性存在完全的平衡。合适的一组单核苷酸多态性包括互相遗传独立的那些。也就是说，合适的单核苷酸多态性包括其中没有一个组的两个单核苷酸多态性总是一起遗传的那些。

串联重复基因座是基因组中的基因座，其含有变化长度的核苷酸序列的重复单位，如双核苷酸重复、三核苷酸重复、四核苷酸重复等等。重复单位的长度从小至2个核苷酸变化至极大数目的核苷酸。重复可以是简单的串联序列重复或其复杂组合。在这种基因座的这些重复的长度或特性的改变称为在这些基因座的多态性。这样的多态性最常起因于群体中的个体之间在一个基因座存在变化数目的这样的重复。通过某些评估，串联重复在人类基因组中存在的平均频率为大约15000碱基。在一个基因座的等位基因的数目或序列重复的多样性通常在大约少至3或4个到多至15或多至50或更多之间变化。其相对高的出现频率，以及显著程度的多态性使基因组的这些特征成为遗传鉴定应用的有吸引力的候选物。通过在核酸的非受损样品中检测足够数目的多态性串联重复基因座，并比较该个体的基因座的特性和来自第二个个体的参比样品中相同基因座的特性，可以确定所述个体是否与获得参比样品的第二个个体遗传相关。一般说来，在遗传鉴定应用中使用的多态性重复基因座的选择是使得彼此不连锁，或处于Hardy-Weinberg平衡。

在遗传鉴定应用中使用多种类型的串联重复基因座。短串联重复(STR)归因于短的核酸序列段数目的变化。在人类基因组中认为STR在每几十万个碱基中出现大约一次。STR大约为2-7个碱基，并且其含有的重复单位的数目可变，而且以简单和复杂重复存在。另一种类型的串联重复，小卫星重复，通常大约为10至50个左右碱基，重复大约20-50次。微卫星重复通常为大约1-6个碱基，重复多至6或多次。这些重复在基因组中可以出现成千上万次。对串联重复位点的命名法是不准确的。这些和其它的串联重复可以用通用的广义术语可变数目串联重复，或称VNTR来表示。

本发明的另一个实施方案包括一种从感兴趣的群体中产生一组单核苷酸多态性用于分析受损核酸样品的方法，包括：在感兴趣的群体的基因组中选择一组两种或多种单核苷酸多态性，其中所述一组两种或多种单核苷酸多态性的每一种是彼此不遗传连锁的基因组的单核苷酸多态性，且其中所述一组两种或多种单核苷酸多态性的每一种都是位于串联重复核酸序列之外的基因组的单核苷酸多态性，由此从感兴趣的群体中产生一组单核苷酸多态性用于分析受损核酸样品。

“产生一组单核苷酸多态性”是指从感兴趣的基因组中选择合适的单核苷酸多态性的方法，其中所述单核苷酸多态性用于遗传分析或鉴定。产生一组单核苷酸多态性包括选择本发明的位于串联重复核酸区域之外、并且彼此不遗传连锁的单核苷酸多态性。然后通过本领域已知的任何方法分析所述单核苷酸多态性以便选择能够在一多重反应中鉴定单核苷酸多态性的引物。该分析通常包括，例如选择多态性，其中所述检测引物和扩增引物将有相同或相似的解链和退火温度，用于扩增和单碱基延伸反应。

可以使用一或多种组分析含有受损核酸的单一样品。选择本发明的单核苷酸多态性以便在如果它们位于相同的染色体和核酸分子上时互相之间相距所需的距离。优选地，选择一组单核苷酸多态性以便相距大约10至15兆碱基。最优选地，一组单核苷酸多态性相距大约20至大约100或更多兆碱基。合适的单核苷酸多态性包括互相不是连锁不平衡的那些，虽然不需要任何组的任何单核苷酸多态性都处于完全平衡。合适的一组单核苷酸多态性包括互相遗传独立的那些。也就是说，合适的单核苷酸多态性包括其中没有一个组的两个单核苷酸多态性总是一起遗传的那些。最优选地，所述组的单核苷酸多态性是双等位基因的。最优选地，组的单核苷酸多态性的等位基因的性质全是T/C。

本发明的另一个实施方案包括一种从受损核酸的未知样品中确定个体身份的方法，包括：从个体获得具有两种或多种单核苷酸多态性的受损核酸的未知样品；鉴定存在于受损核酸的未知样品中的两种或多种单核苷酸多态性；将受损样品中的两种或多种单核苷酸多态性的每一种的性质和已知样品的一组单核苷酸多态性进行比较，以确定在未知样品中的两种或多种单核苷酸多态性的每一种和组之间匹配的数目，其中所述组包括两种或多种彼此不遗传连锁、并位于串联重复核酸序列之外的单核苷酸多态性；并根据未知样品和已知样品中两种或多种单核苷酸多态性的每一种之间匹配的数目确定未知样品和已知样品来自相同或相关个体的概率，因此从受损核酸的未知样品确定个体的身份。

“确定个体的身份”是指确定感兴趣的个体的特性。在一个优选的实施方案中，“确定个体的身份”是指在高度统计学可信度的程度上确定个体是感兴趣群体中的哪一个，以排除感兴趣的群体中的所有其它个体。在最优选的实施方案中，“确定个体的身份”包括具有高度统计学可信度的从整个人类群体中鉴定单一个体。最优选地，统计学可信度的程度是十亿中的一个或更高。这样程度的可信度是用大约三十个单核苷酸多态性获得的。然而，可以使用本发明，其中所述受损样品与参比样品比较，其中“确定个体的身份”需要低得多程度的统计学可信度。

“未知样品”是指已知物质或怀疑含有受损核酸的物质的样品，其中受损核酸来源的个体的身份是未知的，或未以期望程度的统计学可信度已知。

对一个受损样品中的单核苷酸多态性与另一个受损样品或参比样品中的单核苷酸多态性进行“性质比较”是指确定在一个样品中的单核苷酸多态性位点的核苷酸与在第二个样品中相同的单核苷酸多态性位点的核苷酸是否相同。对分析的每一个单核苷酸多态性都进行该比较，并确定每个单核苷酸多态性位点是否存在“匹配”。“匹配”是指在两个或更多样品中在一个单核苷酸多态性位点上的核酸的准确相同。在一个给定的单多态性位点上在相同链上带有相同核苷酸的两个或多个样品被称为对该位点而言“匹配”。

“确定未知样品和已知样品来自相同或相关个体的概率”是指比较在未知样品和已知样品中的单多态性位点存在的核苷酸的性质，并计算观察到的匹配偶然发生的统计学概率。本领域熟知计算匹配偶然发生的统计学可能性的方法和算法，其依赖于特定的核苷酸存在于一个特定的位点的概率。

“已知样品”是指已知含有受损或未受损核酸的物质的样品，其中已知样品来源的个体的身份是已知的，或以期望程度的统计学可信度已知。

本发明的另一个实施方案包括一种从受损核酸的未知样品确定个体身份的方法，包括：从个体获得具有两种或多种单核苷酸多态性的受损核酸的未知样品；获得具有两种或多种单核苷酸多态性的核酸的已知样品；选择一组两种或多种单核苷酸多态性，其中该组两种或多种单核苷酸多态性的每一种彼此不遗传连锁，并且其中该组单核苷酸多态性的每一种位于串联重复核酸序列之外；确定受损核酸样品中存在的该组两种或多种单核苷酸多态性的每一种的性质；以及确定已知样品中存在的该组两种或多种单核苷酸多态性的每一种的性质；比较在已知样品中观察到的该组两种或多种单核苷酸多态性的性质与在受损核酸的未知样品中观察到的该组两种或多种单核苷酸多态性的性质；以及确定未知样品和已知样品来自相同或相关个体的概率，因此从受损核酸的未知样品确定个体的身份。

“未知样品和已知样品来自相同个体”是指样品的来源来自属于同一个体的生物物质。如果两个个体相互具有任何程度的近亲相关，那么一个个体可以说是另一个个体的“家族成员”。最优选地，“家族成员”是胞亲或家系相关。

“单碱基引物延伸”是指在与多态性位点紧邻(immediatelyadiacent)的靶核酸上杂交延伸引物，并在聚合剂的存在下在足以使引物延伸的条件下延伸引物。最优选地，使用单一一个标记的终止核苷酸延伸引物。检测多态性位点的一个优选方法是使用酶辅助的引物延伸。SNP-IT^TM(由Goelet，P.等人，和U.S.专利号5,888,819和6,004,744揭示，每一在此以其全文并入参考)是在靶核酸序列的预定多态性位点确定核苷酸性质的优选方法。因此，虽然其对确定多种多态性具有一般的实用性，但是其对SNP评分(scoring)是特别合适的。SNP-IT^TM是一种多态性位点查询(interrogation)的方法，其中在靶核酸序列上多态性位点周围的核苷酸序列信息用于设计与靶核苷酸的多态性位点紧邻、但不包括可变核苷酸的区域互补的寡核苷酸引物。靶多核苷酸分离自生物样品，并与查询引物(interrogatingprimer)杂交。在分离以后，靶多核苷酸在与查询引物杂交前可以通过任何合适的手段扩增。通过单一标记的终止核苷酸子如双脱氧核苷酸，使用聚合酶，通常在存在一或多种链终止核苷三磷酸前体(或合适的类似物)下延伸引物。因此产生可检测的信号。如在此所用，与多态性位点紧邻包括在关于靶核酸方向是多态性位点的5’方向上大约1至大约100个核苷酸，更优选大约1至大约25个核苷酸。最优选地，引物在与多态性位点相关的5’方向与紧邻多态性位点的一个核苷酸杂交。

在SNP-IT^TM的一些实施方案中，在延伸反应前引物结合到固体支持物上。在其它的实施方案中，在溶液中(如在一个试管内或微孔内)进行延伸反应，延伸产物随后结合到固体支持物上。在SNP-IT^TM的另一个实施方案中，引物被可检测地标记并且延伸的终止子核苷酸被修饰以便能够使延伸的引物产物结合到固体支持物上。这例如包括引物被荧光标记，终止子核苷酸是生物素标记的终止子核苷酸，且固体支持物用抗生物素蛋白或链霉抗生物素蛋白包被或衍生。在这样的实施方案中，一个延伸的引物将能够与固体支持物结合并且非延伸的引物将不能够与支持物结合，因此依赖一个成功的延伸反应产生可检测的信号。

连接酶/聚合酶介导的遗传比特分析(genetic bit analysis)(U.S.Patent Nos.5,679,524和5,952,174，二者并入参考)是另一种用于确定在多态性位点的核苷酸性质的适当的聚合酶介导的引物延伸方法实例。连接酶/聚合酶SNP-IT^TM使用两个引物。通常，一个引物被可检测地标记，而设计另一个引物结合到固体支持物上。连接酶/聚合酶SNP-IT^TM的另外一个实施方案中，延伸的核苷酸被可检测地标记。设计连接酶/聚合酶SNP-IT^TM的引物与一个多态性位点每一侧杂交，以便有一个包括多态性位点的缺口。只有在一个成功的延伸反应之后有一个成功的连接反应，才能产生一个可检测信号。这个方法通过仅使用杂交或引物延伸提供了产生具有相当低背景的信号的优势。

确定靶多核苷酸内预先确定的多态性位点的核苷酸特性的另一个方法由Sderlund et al.，U.S.Patent No.6,013,431(以其全文并入参考)描述，在这个方法中，使用靶核酸序列的多态性位点周围的核苷酸序列信息设计一个引物，该引物与靶的多态性位点5′侧翼的一个不包括可变核苷酸的区域互补。靶多核苷酸从生物学样品分离并且与一个查询引物杂交。这个方法的一些实施方案中，分离后，通过任何适当的手段扩增靶多核苷酸，然后与查询引物杂交。常常在存在至少一种标记脱氧核苷酸和一或多种链终止核苷三磷酸前体(或适当的类似物)的混合物时，使用聚合酶延伸引物。标记脱氧核苷酸掺入引物产生一个可检测信号。

本发明的引物延伸反应使用一或多个标记核苷酸混合物和聚合剂。在此使用的术语“核苷酸”或核酸指处于通过聚合剂能够被加入到引物中的任何磷酸化状态的核糖核苷酸，脱氧核糖核苷酸，核苷酸无环衍生物，和其功能性等价物或衍生物。例如，在一个扩增方法或一个引物延伸方法中，核苷酸的功能性等价物可作为聚合酶底物。核苷酸的功能性等价物也可形成保留了与靶多核苷酸以序列特异性方式杂交的能力的多核苷酸。核苷酸例如包括链终止核苷酸，最优选的是双脱氧核苷三磷酸(ddNTP)，如ddATP，ddCTP，ddGTP和ddTTP；但是，本领域技术人员已知的其它的终止子，例如无环核苷酸类似物，其它无环类似物和***糖苷三磷酸也在本发明的范围内。优选ddNTP与常规的2’脱氧核苷三磷酸(dNTP)的不同在于它们在糖组分的3’位置没有羟基。

使用的核苷酸可带有一个可检测的特性。在此使用的可检测特性包括能够区分核苷酸的任何可鉴别的特性。重要的是，可检测的特性不能干扰本发明的任何方法。可检测的特性指使用适当的检测方法能够检测到的原子或分子或分子部分。可检测的特性包括固有质量(inherent mass)，电荷，电子自旋，质量标记，发射性同位素，染料，生物发光，化学发光，核酸特性，半抗原，蛋白质，光散射/相移位(phase shifting)特性，或荧光特性。

可依据本领域已知的任何技术标记核苷酸和引物。优选的标记包括放射性标记，荧光标记，酶标记，蛋白质，半抗原，抗体，序列标记，质量标记，荧光标记等。优选的染料类型包括，但是不局限于，TAMRA(羧基一四甲基罗丹明)，ROX(羧基-X-罗丹明)，FAM(5-羧基荧光素)等。

本发明的引物延伸反应可使用一或多种标记核苷酸碱基。优选地，使用两或多种不同碱基的核苷酸。最优选地，本发明的引物延伸反应使用4个不同碱基的核苷酸。在最优选的实施方案中，所有4个不同类型的核苷酸被可区分的标记物标记。例如，使用dR6G标记A，使用dTAMRA标记C，使用dR110标记G和使用dROX标记T。

一旦使用引物延伸反应，延伸的和未延伸的引物(如果有)可被相互分离以便于鉴别一或多个被查询的等位基因的多态性位点。可通过任何本领域已知的方法分离核酸。一些分离方法包括使用嵌入染料例如溴化乙锭检测DNA双链，检测特异性序列和/或分离或捕获已知或未知结构的寡核苷酸分子的杂交方法以及与本领域熟知的印迹方法相关的杂交方法。杂交方法可与本领域熟知的其它分离技术组合使用，如通过固相捕获分离标记的寡核苷酸，如免疫亲和珠捕获半抗原连接的寡核苷酸，该珠可以是磁性的。固相捕获技术也包括DNA亲和层析，其中通过带有互补序列的固定化寡核苷酸捕获寡核苷酸。特异性多核苷酸标记被工程化入寡核苷酸引物，且通过与固定化互补序列杂交而分离。这样的固相捕获技术还包括在链霉抗生物素蛋白包被的珠(磁性或非磁性的)上捕获生物素标记的寡核苷酸。使用更传统的方法如离心，电泳方法或沉淀或表面沉积方法也可分离DNA。当延伸的或未延伸的引物存在于溶液相时，该方法非常好。术语“溶液相”在此指均相或非均相混合物。这样的混合物可以是水溶液的，有机的或同时含有水性成分和有机成分。术语“溶液”在此与悬浮液同义，其中包括悬浮在液体介质中的微粒。

通过任何本领域已知的方法可检测多态性位点。一个核苷酸检测方法是通过荧光技术。例如，可以构建在没有与靶核酸序列杂交时猝灭的荧光杂交探针。其它的方法利用具有重叠吸收(overlappingabsorption)和发射光谱的荧光团之间的能量转移作用，所以当如捕获或杂交时，在2个荧光团非常接近时可以检测信号。

通过涉及电磁辐射行为的多种分光光度法，或标记可检测的部分来检测核苷酸。这些分光光度法包括，例如，电子自旋共振，光学活性或旋光光谱学如圆二色谱学，荧光学，荧光偏振化，吸收/发射光谱学，紫外线，红外线，可见光或质谱学，Raman光谱学和核磁共振光谱学。

依据本领域已知的任何技术可标记核苷酸和其类似物，终止子和/或引物。优选的标记包括放射性标记，荧光标记，酶标记，蛋白质，半抗原，抗体，序列标记，质量标记，荧光标记等。优选的染料类型标记包括，但不局限于TAMRA(羧基二四甲基罗丹明)，ROX(羧基-X-罗丹明)，FAM(5-羧基荧光素)等。

术语“检测”指鉴别一种可检测的部分。这一术语包括通过电磁特性鉴别一种部分的能力，例如，电荷，光，荧光，化学发光，电磁特征的改变，例如，荧光偏振，光偏振，二色性，光散射，折射率改变，反射，红外线，紫外线和可见光谱，质量，质量：电荷比率和所有依赖于电磁辐射或电磁辐射改变的检测技术的方式。术语也包括基于结合亲和力，内在质量，质量沉积，和静电特性，大小和序列长度鉴别部分。要注意特性，如质量和分子量可以通过表观质量或表观分子量评估，所以术语“质量”或“分子量”在此不排除通过多种设备和方法评估，因此不限制这些术语是任何唯一的绝对数值，而不参考获得质量和分子量的方法和设备。

检测多态性位点的核苷酸的另一个方法是通过比较引物延伸反应之后任意时间点，保持在反应混合物中的游离的、未掺入的核苷酸的浓度。在本实施方案中通常使用质谱学例如电喷射质谱检测未掺入的核苷酸。这个检测方法是可行的，因为在引物延伸反应过程中，在反应混合物中只有与多态性碱基互补的核苷酸被耗尽。因此，可使用质谱比较核苷酸质量峰的相对强度，同样地，可确定未标记引物的浓度且使用这一信息获得多态性位点核苷酸的性质。

引物可以是能够在延伸反应中在3’末端延伸的多核苷酸或寡核苷酸。在此，术语“多核苷酸”包括任何数量的核苷酸聚合物。术语“寡核苷酸”包括任何数目核苷酸的多核苷酸分子，优选少于大约100个核苷酸的多核苷酸分子。更优选的，寡核苷酸的长度在5到100个核苷酸之间。最优选的，寡核苷酸长度在15到60个核苷酸之间。但是，特定寡核苷酸或多核苷酸的精确长度将依赖于许多因素，其依赖于其最终的功能或使用。影响寡核苷酸长度的一些因素是，例如寡核苷酸的序列，分析中使用的盐浓度和温度等变量的分析条件，以及是否寡核苷酸在5’末端被修饰以包括为了修饰寡核苷酸的质量：电荷比率的额外碱基，和/或提供一个标记捕获序列，其可用于地理分离寡核苷酸到DNA芯片或阵列上特异的杂交位置。短引物需要较低温度以与模板形成足够稳定的杂交复合体。本发明的引物应与靶核酸上链或下链互补。优选地，起始扩增引物在它们的3’末端不应自身互补，以避免引物折叠导致自身引导(self-priming)的结构和分析噪干扰信号。优选引物在3’末端缺乏自身互补的一个例外是在本发明的一个实施方案中，当使用一个延伸引物为flip-back引物时，优选某些程度的自身互补。当使用一个引物为flip-back引物时，引物应具有足够的自身互补性以便在没有靶核苷酸，或没有足够量的与自身引导事件竞争的靶核酸时，能够自身引导。本发明的优选引物包括从大约8到大约40个核苷酸长度的寡核苷酸。最优选地，PCR引物长度在大约18至大约25个碱基之间。最优选地，SNP-IT^TM引物(Orchid Biosciences，Inc.)用作延伸引物以确定多态性位点核苷酸的性质。最优选地，SNP-IT^TM引物的长度为40至45个碱基对，包括与多态性位点相邻序列互补的20至25个碱基对3’区域和与任何样品核酸序列都不互补的20个碱基对标记。

在现有技术中在非靶核酸的背景下，大约10个核苷酸的引物是可用于与互补的靶核酸序列选择性杂交的最短序列。最优选地，使用超过至少大约20到大约35个核苷酸的完整互补序列以保证充分水平的杂交特异性，当然靶DNA分子序列的长度可能有相当大的变化。本发明的引物必须能够与靶核酸序列特异性杂交，例如一或多个上游引物与一或多个靶核酸上链或一或多个核酸下链杂交。在此，如果2个分子在足以促进杂交的条件下能够形成反平行、双链核酸结构或杂合体，则这2个核酸序列被认为能够相互特异性杂交，但是在相同的条件下，与一个非靶核酸序列温育时它们必须基本上互相不能形成一个双链结构或杂合体。

如果一个核酸分子呈现完全的序列互补性，则称其是另一个核酸分子或是其自身的“互补物”。在此，当每个分子的每个核苷酸都能够与另一个分子的核苷酸形成碱基对时，这些分子被称是呈现“完全互补”。“基本上互补”指在至少常规的低严格条件下能够相互杂交或与自身杂交并具有足够的稳定性以允许退火的能力。同样地，如果在常规的高严格条件下，分子可相互杂交并具有足够稳定性以允许它们保持相互退火，则它们被称为是“互补的”。常规的严格条件例如Sambrook，J.，et al.，Molecular Cloning，a Laboratory Manual，2ndEdition，Cold Spring Harbor Press，Cold Spring Harbor，N.Y.(1989)(在此并入参考)描述。不是完全互补因而是可能的，只要这没有完全排除分子形成一个双链结构或杂合体的能力。

在实践本发明时使用的引物可以在5’端标记。标记包括任何标记，如放射性标记，荧光标记，酶标记，蛋白质，半抗原，抗体，序列标记等。优选地，标记不干扰本发明的方法。典型地，标记可附着到引物的5’末端，其其余引物序列与靶核酸互补。一个优选的标记包括独特标记或标记每种引物，所述引物具有与结合到固体支持物上的序列互补的独特序列，其中这样的固体支持物可包括阵列，包括可寻址阵列。因此，在适当的杂交条件下，当引物暴露于固体支持物时，标记与结合到固体支持物的互补序列杂交。这样，通过阵列上的几何位置或通过其它手段用探针鉴别与标记相关的点可以确定引物特性。与5’标记互补的序列可以在例如可寻址阵列上的离散位置上与固体支持物结合。

在本发明中使用的聚合剂可从多种生物体中分离或克隆，所述生物体包括病毒、细菌、古细菌、真菌、支原体、原核生物和真核生物。优选的聚合剂包括聚合酶。使用本发明的方法和设备进行单碱基延伸的优选聚合酶是呈现很少或没有核酸外切酶活性的聚合酶。更优选的是耐受并在超过生理温度具有活性的聚合酶，例如50℃到70℃或耐受至少90℃到大约95℃。优选的聚合酶包括来自水生栖热菌(T.aquaticus)(购自ABI，Foster City，CA)的Taq聚合酶，Sequenase和ThermoSequenase(购自U.S.Biochemical，Cleveland，OH)和Exo(-)聚合酶(购自New England Biolabs，Beverley，MA)和AmpliTaqGold。也可使用任何呈现热稳定性的聚合酶，例如，栖热菌属来源的聚合酶，包括水生栖热菌(Thermus aquaticus)，Thermus brocianus，嗜热栖热菌(Thermus thermophilus)和黄栖热菌(Thermus flavus)；火球菌(Pyrococcus)属，包括激烈火球菌(Pyrococcus furiosus)，火球菌GB-D(Pyrococcus sp.GB-D)和沃氏火球菌(Pyrococcus woesei)，Thermococcus litoralis和Thermogata maritime。生物活性的蛋白酶片段，重组聚合酶，遗传工程化的聚合酶和修饰的聚合酶都包括在聚合剂的定义中。可以理解不用过多的实验，本发明即可以使用多种来源的多种类型的聚合酶。

“多重反应”是指在一个单反应中鉴定两种或多种单核苷酸多态性。“多重反应”还包括在一个单反应中制备受损样品中存在的两种或多种靶核酸，例如通过扩增，以及鉴定两种或多种单核苷酸多态性。优选地，在一个“多重反应”中，至少大约10至大约50个单核苷酸多态性在一个单反应中被鉴定。最优选地，例如通过扩增制备大约12个靶核酸，在一个单反应中鉴定了大约12个单核苷酸多态性。优选地，用于从受损样品扩增核酸的引物显示了相似的解链温度，使得可以在一个单反应中产生包含一或多个组的单核苷酸多态性的多个扩增子。最优选地，在一个单反应中产生大约12个扩增子。可以通过本领域任何已知的方法实现对用于多重反应目的(multiplexingpurposes)的组的单核苷酸多态性的选择，可以基于解链温度的相似性选择延伸引物。最优选地，选择包含相距大约20-100兆碱基的、并是双等位基因的双等位基因T/C多态性的单核苷酸多态性的核酸序列并输入Autoprimer软件(http：//www.autoprimer.com，在此并入参考)，并且Autoprimer提供了大约12个适合用于多重扩增反应和基于引物的解链温度的单碱基延伸反应中的单核苷酸多态性的组。

可以通过本领域已知的任何方法分离和鉴定延伸引物。优选的分离和鉴定引物延伸产物的方法是通过毛细管凝胶电泳，其中使用荧光检测仪来鉴别荧光终止核苷酸标记的引物延伸产物。通过它们的质量：电荷比率分离带有荧光标记的延伸引物。最优选地，使用在其5’端带有标记捕获序列的SNP-IT^TM引物(Orchid Biosciences，Inc.)。在该实施方案中，用荧光终止子在SNP位点进行单碱基引物延伸后，将反应混合物应用于带有与引物的标记捕获序列互补的序列的阵列上，其中在阵列上放置这样的互补序列的位置是已知的。在该实施方案中，在阵列的已知位置上的合适的荧光信号表明在SNP位点存在的核苷酸的性质。最优选地，使用SNPstream UHTAssay Kit^TM(OrchidBiosciences，Inc.)进行分析，并使用SNPstream UHT Array Imager^TM和SNPstream Laser Enclosure^TM结合控制计算机、数据分析计算机、服务器计算机和SNPStream数据分析软件包(Data Analysis SoftwareSuite^TM)(全部来自Orchid Biosciences，Inc.)进行鉴定。然而，本领域技术人员已知多种分离和检测方法，而且此处本发明适合许多检测和分离方案。

优选的分离方法使用暴露任何延伸的和未延伸的引物到固体支持物上。固体支持物包括阵列。术语“阵列”在此指固定化生物分子在固体，半固体，凝胶或聚合物相上多个位置上的有序排列。这个定义包括已用二氧化硅，硅烷，硅，硅酸盐和其衍生物，塑料和其衍生物，例如，聚苯乙烯，尼龙和，特别是聚苯乙烯板，玻璃和其衍生物，包括衍生化玻璃，玻璃珠，可控孔度玻璃(CPG)处理或包被的相。固定化的生物分子包括寡核苷酸，其可以包括其它部分，如标记和/或亲和性部分。术语“阵列”包括且与术语“芯片”、“生物芯片”、“生物芯片阵列”、“DNA芯片”、“RNA芯片”、“核苷酸芯片”和“寡核苷酸芯片”同义。所有这些术语包括阵列的阵列，并包括生物学聚合物，例如，已知或未知序列的寡核苷酸和DNA分子的阵列

本发明优选的阵列包括，但不局限于，包括以上定义的阵列的可寻址阵列，其中各个位置具有已知坐标以便阵列上一定位置的信号可被鉴别为具有特殊可鉴别的特性。术语“芯片”，“生物芯片”，“生物芯片阵列”，“DNA芯片”，“RNA芯片”，“核苷酸芯片”和“寡核苷酸芯片”包括阵列和微阵列的组合。这些术语也包括任何形状或构型的阵列，2维阵列和3维阵列。

一个优选的阵列是Affymetrix，Inc.的GenFlex^TM标记阵列，它由2000个标记序列的捕获探针组成。它们是20聚体，选自具有相似杂交特性且与公开的数据库中的序列至少具有最小的同源性的所有可能的20聚体。最优选的阵列是SNPstream UHT Array^TM(OrchidBiosciences，Inc.)。

另一个优选的阵列是可寻址的阵列，其具有与本发明中使用的引物的任何5’标记互补的序列标记。这些互补的标记结合阵列上的已知位置。这种类型的标记在适当杂交条件下与阵列杂交。通过定位结合的引物和检测一或多个延伸的引物，多态性位点的核苷酸性质可被确定。

在本发明的一个优选的实施方案中，靶核酸序列被排列为允许多个同时检测(多重技术(multiplexing))以及使用寡核苷酸阵列平行处理的形式。

在另一个实施方案中，本发明包括虚拟(virtual)阵列，其中延伸的和未延伸的引物在包含微球体悬液的阵列上分离，其中微球体带有一或多个捕获部分以便分离独特标记的引物。微球体进而带有独特的鉴别特性以便它们能够基于该特性，例如，直径，密度，大小，颜色等而被分离。

在另一个实施方案中，本发明包括一种对受损核酸样品基因分型的方法，包括：从个体获得受损核酸样品；鉴定存在于受损核酸样品中的两种或多种单核苷酸多态性；并比较受损样品中的两种或多种单核苷酸多态性的每一种的性质和感兴趣的群体的一组单核苷酸多态性，以确定在受损样品和感兴趣的群体中的两种或多种单核苷酸多态性的每一种的出现频率，其中所述组包括两种或多种彼此不遗传连锁、并位于串联重复核酸序列之外的单核苷酸多态性；因此对受损核酸样品基因分型。

“基因分型”指首先限定一组感兴趣的遗传特性，然后以统计学可信度的程度确定感兴趣的遗传特性是否存在于受损核酸样品中的可能性。在本发明的一个实施方案中，感兴趣的遗传特性是感兴趣的群体中的一组单核苷酸多态性，其中单核苷酸多态性彼此不遗传连锁、并位于串联重复核酸序列之外。如在此所用，“基因分型”表示在一个样品或参比样品中发现的一或多个所述组的单核苷酸多态性的核苷酸的性质。

单核苷酸多态性的“出现频率”是指在感兴趣的群体中的特定单核苷酸多态性位点出现特定核苷酸的观测频率。最优选地，本发明的单核苷酸多态性是双等位基因的，而且多态性核苷酸的性质是T和/或C。

在另一个实施方案中，本发明包括一种对受损核酸样品基因分型的方法，包括：从个体获得受损核酸样品；从感兴趣的群体基因组中选择一组单核苷酸多态性，所述组包括两种或多种单核苷酸多态性，其中该组两种或多种单核苷酸多态性的每一种彼此不遗传连锁、并位于串联重复核酸序列之外；鉴定在受损核酸样品中存在的两种或多种单核苷酸多态性；并比较在受损样品中观察到的两种或多种单核苷酸多态性的性质与在组中观察到的两种或多种单核苷酸多态性的性质，以确定基因型，从而获得受损核酸样品的基因型。

“人类核酸”是指来自人类的任何种类的核酸。“人类核酸”是指包括含有被环境或其它因素降解或化学或物理修饰的核酸样品，唯一的限制是它们可以用于本发明的鉴定或遗传分型方法。

“扩增”是指增加靶核酸数目。在本发明的一个实施方案中，受损核酸样品的靶核酸通过使用PCR引物的聚合酶链反应(PCR)的方法被扩增。然而，“扩增”并不限于PCR。如在此所用，扩增指任何增加靶核酸数量的技术，包括但不限于杂交和用于富集感兴趣的靶核酸产量或数目的亲合性方法。

“靶核酸”是指含有一或多种感兴趣的单核苷酸多态性的核酸序列。靶核酸序列优选对于该核酸与寡核苷酸或多核苷酸分子杂交的能力而言是生物学活性的。靶核酸序列可以是DNA或RNA、单链或双链或DNA/RNA杂种双螺旋。靶核酸序列可以是多核苷酸或寡核苷酸。在本发明的受损核酸样品中的靶核酸序列优选是大约10至大约100个核苷酸长。最优选地，在本发明的受损核酸样品中的靶核酸序列是大约10至大约50个核苷酸长。回收降解的、受损的和/或分馏的DNA的方法是本领域熟知的，包括凝胶电泳、HPLC和例如能利用基于与捕获序列杂交的多种序列回收的技术。

靶核酸可以从生物样品中分离的或衍生的。在此所用术语“分离”指基本上没有其它物质如非核蛋白、脂质、碳水化合物和其它物质如细胞碎片或与靶核酸相关的生长介质的状态。典型地，术语“分离的”不打算指完全没有这些物质。术语“分离”一般也不打算指没有稳定剂如水、缓冲液或盐，除非它们以基本上干预了本发明的方法的量存在。在此所用术语“样品”一般指含有核酸，或者DNA或RNA或DNA/RNA杂种的任何物质。样品可以来自任何来源，包括植物和动物，包括人。一般，这样的物质是以下形式：血液样品、组织样品、直接来自个体的细胞或在培养基中繁殖的细胞、植物、酵母、真菌、支原体、病毒、古细菌、组织切片或口腔拭子的形式，可以是新鲜的、固定的、冷冻的或包埋在石蜡或其它固定剂中。这样的样品能进行通过例如碱裂解的模板制备。其它的样品类型能进行分析，但可能需要不同的或更高程度的模板制备，例如酚/氯仿抽提，或在存在高盐浓度时将DNA捕获至二氧化硅基质。

靶核酸可以是单琏的，并可以来自双链DNA、RNA或其它核酸分子的上游或下游链核酸。靶核酸的上游链包括核酸的正链或有义链。靶核酸的下游链是指与靶核酸的上游链互补的负链或反义链。因此，描述时可以指任一链并且包括多态性位点，而且引物可以设计与任一条或两条链杂交。靶核酸并不限制在编码区的序列中，也可以包括基因组的任何区域或含有至少一个多态性的基因组的部分。术语基因组包括复杂基因组(complex genome)，如在动物中发现的那些，不排除人类，和植物，以及非常简单和较小来源的核酸，例如病毒、类病毒的核酸以及任何其它的含有核酸的生物物质。

靶核酸序列或其片段含有多态性位点，或包括这样的位点和位于所述位点的远端或近端的序列。这些多态性位点或突变在核酸序列的特定位点可以是缺失、***、重排、重复序列、碱基修饰或单一或多碱基改变的形式。该改变的序列和更多的流行的或正常的序列可以在群体中共同存在。在某些情况下，这些改变对物种或物种中的个体没有赋予优势或劣势，序列的多种等位基因可以是稳定或准稳定平衡。然而在某些情况下，这些序列改变将赋予物种存活或进化优势，因此改变的等位基因最后将掺入到该物种许多或大多数成员的基因组中。在另一些情况下，改变的序列赋予物种劣势，如当突变引起或倾向于使个体产生遗传疾病或缺陷。如在此所用术语“突变”或“多态性位点”指在物种的某些成员、物种中的一个群体或物种之间的核酸序列中的改变，这样的突变或多态性包括但不限于，单核苷酸多态性(SNP)、一或多个碱基缺失，或一或多个碱基***。

个体中的多态性可以是杂合的或纯合的。纯合个体在同源染色体的一或多个相应位点具有相同的等位基因。杂合个体在同源染色体的一或多个相应位点具有不同的等位基因。如在此所用，等位基因包括基因或核酸序列的可选择形式，在基因编码区的内部或外部，包括内含子、外显子和非转录或非翻译区域。特定基因的等位基因一般在同源染色体上占据相同的位置。因此，可以说多态性是“等位基因的”，在于由于存在多态性，一个物种的某些成员携带具有一个序列的基因(如原始或野生型“等位基因”)，而其它成员可能具有改变的序列(如变体或突变的“等位基因”)。在最简单的情况下，只存在序列的一个突变变体，多态性被说成是双等位基因的。例如，如果在一个位点的两个等位基因是不可区分的(例如A/A)，那么在这种情况下该个体在该位点是纯合的。如果在一个位点的两个等位基因是可区分的(例如A/G)，那么在这种情况下该个体在该位点是杂合的。大多数已知的单核苷酸多态性是双等位基因的一其中在这种情况下在特定位点有两个可选择的碱基。

现在已经一般性地描述了本发明，参考下述实施例后其将更加容易理解，提供以下实施例是为了说明本发明而不是试图限制本发明的精神或保护范围。

实施例

扩增

对一选择的组，通过聚合酶链反应(PCR)从受损样品中制备包含组的单核苷酸多态性的扩增子，使用了热稳定的DNA聚合酶Amplitaq Gold^TM聚合酶、DNA模板、核苷酸和两种分别对扩增子特异的引物，以便复制在受损样品中的片段的两条DNA链。产生多种这些引物对以允许通过组合等摩尔量(10μM)的24个引物的每一种而在一个反应中扩增12个扩增子。通过使用三步法扩增DNA：步骤1：DNA变性(94℃-100℃)以产生单链模板；步骤2：使用保证引物与靶核酸序列完全匹配结合的杂交条件退火(45℃-65℃)引物；及步骤3：延伸或DNA合成(72℃)。通常进行30-40个扩增循环以产生几百万个感兴趣的扩增子拷贝。

需要的材料包括10％漂白剂、2mL微管、单通道移液管(20μL-1000μL)、12通道移液管(2μL-20μL)、气溶胶抗性移液吸头、384孔PCR板和膜、10X PCR缓冲液II(Orchid Biosciences，Inc.)、25mM MgCl₂、2.5mM dNTP混合物、十二对引物池(pool)、AmplitaqGold^TM聚合酶、无菌蒸馏水或去离子水、样品DNA、热循环仪、微量离心管和振荡器。

所有的PCR试剂应该在指定的pre-PCR实验室中制备。

在进行PCR之前和之后应该穿戴专门的实验工作服和手套，操作区域应该用10％漂白剂清洗。PCR反应混合物应该在通风厨内制备。使以下储存剂融化：2.5mM dNTP、10X PCR缓冲液II、引物池、25mM MgCl₂、无菌水和待扩增的DNA样品。计算对特定样品数目每一试剂需要的量，记录在PCR实验记录的合适位置(计算超过样品的20％)。相同试剂的不同份数不要混合。在2mL微管中制备PCR主混合物，将每一试剂的份数记录在PCR记录中。

典型的扩增反应混合物

试剂 (每板/460样品) (每一样品)

10X PCR缓冲液II 230μL 0.5μL

25mM MgCl₂ 460μL 1μL

2.5mM dNTP 69μL 0.15μL

PCR引物池 11.5μL 0.025μL

水 563.5μL 1.225μL

Amplitaq Gold^TM 46μL 0.1μL

DNA模板 2μL(共2ng/样品) 2μL(共2ng/样品)

总体积每样品5μL 每样品5μL

PCR平板设定

确定标记平板的方向并用合适的标记组标记平板和实验组。使用12通道移液管向每一孔内加入3μL PCR混合物。离心含有所有DNA样品的平板，并使用12通道移液管如先前一样加入2μL的DNA模板。DNA板中的样品装载在PCR平板的相同位置。将一片密封膜放置在平板上，用辊子密封。离心平板去除任何气泡，置于热循环仪中。

典型PCR扩增过程

所有扩增反应在MJ Research Tetrad^TM机器上进行。根据扩增引物的特性改变程序。通过使用在此所述的Autoprimer^TM软件简化对组多重反应的扩增引物的解链和退火温度的选择，以便本领域技术人员可以选择合适的延伸和解链温度进行热循环，而不需要过多的实验。优选的热循环仪是MJ Research Tetrad热循环仪。

样品程序

Mode：Calculated

步骤1：95℃，5分钟

步骤2：95℃，30秒

步骤3：50℃，55秒

步骤4：72℃，30秒

步骤5：进行步骤2，2次

步骤6：95℃，30秒

步骤7：50℃，55秒+0.2°/循环

步骤8：72℃，33秒

步骤9：进行步骤6，18次

步骤10：95℃，30秒

步骤11：55℃，55秒

步骤12：72℃，30秒

步骤13：进行步骤10，8次

步骤14：72℃，7分钟

步骤15：4℃，始终

步骤16：结束

多重PCR扩增12个扩增子后，未掺入的核苷酸和多余的引物通过本领域已知的方法酶学去除，如用外切核酸酶I处理以及用虾碱性磷酸酶处理。PCR后处理优选使用SNP-IT^TM Clean-up kit(OrchidBiosciences，Inc.)进行。

SNP-IT引物延伸反应

将延伸混合物和12个等位基因特异标记的SNP-IT^TM引物池加入到处理过的反应混合物中。等位基因特异的SNP-IT^TM引物与多重反应中与多态性位点紧邻的特异扩增子杂交。通过掺入荧光标记的链终止子，在双染料***中延伸标记的引物。双色(two-color)检测允许通过比较两种荧光染料的信号区别基因型。然后将延伸的SNP-IT^TM引物与排列在384SNP-IT^TM平板(Orchid Biosciences，Inc.)的每一孔中的12个独特探针之一通过标记-探针捕获特异性杂交。SNP-IT^TM引物是含有与5’非模板特异序列附着的模板特异序列的单链DNA，其中“标记”指可以被结合到玻璃表面的特异探针捕获的非模板特异序列。与一个标记杂交的特异探针结合到384SNP-IT^TM平板中的每一孔的玻璃表面上。共价结合到玻璃表面的探针能查询多至12从(12-plexed)核酸反应产物。已经掺入标记的SNP-IT^TM反应产物将与共价结合到玻璃表面的相应探针杂交。在延伸反应之后，延伸的SNP-IT^TM引物与每一孔中排列的12个独特探针之一特异性杂交。排列的探针捕获延伸的产物并允许检测每一SNP等位基因信号。严格的冲洗将去除游离的染料终止子和未与特异探针杂交的DNA。

玻璃表面的探针在384孔格式中的每一孔中以4×4阵列排列。在每个4×4阵列中包括3个正对照和1个负对照。左上位置是杂合对照，其具有与掺入两种染料标记的终止子的自身延伸寡核苷酸杂交的两种探针的等摩尔混合物。右上位置具有与掺入蓝色染料标记的终止子的自身延伸寡核苷酸特异性杂交的探针。左下位置具有与掺入绿色染料标记的终止子的自身延伸寡核苷酸杂交的探针。将等摩尔浓度的两种自身延伸寡核苷酸加入延伸混合物中并用染料标记的终止子在循环延伸反应中延伸。右下位置具有不自身延伸的探针，并与反应中的任何DNA缺少互补性。这些探针在每一孔中作为负对照。

引物延伸引物在无DNase/RNase水中悬浮，并分成12组。每个SNP-IT^TM引物应该制备成120微摩。等体积的12个SNP-IT^TM引物聚集在一起。每一SNP-IT^TM引物在池中的终浓度为大约10微摩。在低重(low plexing)水平，保持每一SNP-IT^TM引物的浓度在10微摩。

对多重SNP-IT^TM反应，聚集SNP-IT^TM引物以便制备等摩尔混合物。用分子生物级的水以1∶100稀释SNP-IT^TM引物池。

SNP-IT^TM引物

平板数	1/8	1/4	1/2	1	2
平板数	1/8	1/4	1/2	1	2	SNP-IT^TM引物池	1.6μl	3.2μl	6.3μl	12.6μl	25.2μl
H₂O	156μl	312μl	524μl	1247μl	2495μl	SNP-IT^TM引物池	1.6μl	3.2μl	6.3μl	12.6μl	25.2μl
H₂O	156μl	312μl	524μl	1247μl	2495μl	总体积	158μl	315μl	630μl	1260μl	2520μl

对SNP的类型选择正确的20X延伸混合物用于测试，并从-20℃储存中移除。(例如T/C SNP需要T/C延伸混合物)。

为了制备延伸混合物，计算在实验中需要的延伸混合物的体积。

延伸混合物

平板数	1/8	1/4	1/2	1	2
平板数	1/8	1/4	1/2	1	2	20×延伸混合物	10.5μl	21μl	42μl	84μl	168μl
延伸混合物稀释液	197μl	395μl	790μl	1580μl	3160μl	20×延伸混合物	10.5μl	21μl	42μl	84μl	168μl
延伸混合物稀释液	197μl	395μl	790μl	1580μl	3160μl	DNA聚合酶	2.1μl	4.2μl	8.3μl	16.5μl	33μl
总体积	210μl	420μl	840μl	1680μl	360μl	DNA聚合酶	2.1μl	4.2μl	8.3μl	16.5μl	33μl

使用多通道移液器或自动液体处理装置，将稀释的SNP-IT^TM引物和延伸混合物转移入液体库中用于吸取。

将3μl稀释的SNP-IT^TM引物池加入PCR平板的相应孔中。用平板离心机离心平板。向相应孔中加入如前述制备的4μl延伸混合物，并充分混合。

如果SNP组是有限的(低于或等于8)，三倍体积的稀释SNP-IT^TM引物池可以与4倍体积的延伸混合物混合。7μl的延伸混合物加入到PCR板的每一相应孔中并通过用多通道移液器吸头人工上下吸取3次进行混合或通过振荡自动处理液体。

离心并密封PCR平板。使用以下程序在MJ热循环仪(或等同物)中进行热循环。

步骤1. 96℃进行3:00分钟

步骤2. 94℃进行0:20

步骤3. 40℃进行0:11

步骤4. 重复步骤2和3，25次

步骤5. 4℃最终保存

注意：该程序已经被最优化以用于MJ Research Tetrad^TM。程序需要被修饰以用于具有不同加热和冷却速率的热循环仪。分析可以在该点被中断。在-20℃密封和储存SNP-IT^TM平板。确保平板被完全密封以避免样品蒸发。

SNP-IT平板的制备

用DI H₂O将UHT Prewash溶液(提供的20X储存液)稀释到1X。用试剂盒提供的1X UHT prewash缓冲液冲洗UHT Core kit A^TM中提供的SNP-IT^TM平板三次。应该包括附加的抽气(aspirating)步骤以干燥平板。注意：如果同时进行分散(dispensing)和抽气，每次冲洗应该使用50μl/孔。抽气吸头应该接近于玻璃表面和壁的边缘。

制备杂交液

a.确定要被分析的平板总数(不管延伸混合物类型或等位基因反应)。

b.UHT core kit含有95ml的杂交缓冲液和5.5ml的杂交添加剂，足以进行10个PCR平板，如果使用者每次使用平均2个平板。

c.对两个PCR平板，将9.45ml的杂交液与550μl的杂交添加剂充分混合。

d.向PCR平板的每一孔中加入8μl前述杂交溶液并充分混合。将8μl的溶液从PCR平板转移到玻璃SNP-IT平板上的相应孔中。

推荐用3N NaCl和水在移液之间使用冲洗吸头或每次移液使用新的吸头以消除交叉污染。

杂交

在转移2个平板后，玻璃SNP-IT^TM平板放置在42℃的潮湿烘箱(或在烘箱中用湿纸巾湿化的带盖的托盘)中。温育平板2小时(+/-15分钟)。建议对2-12个平板进行每两个平板一批的孵育，对13-30个平板进行每5个平板一批的孵育。每一轮需错开进行以节约时间。

SNP-IT^TM反应冲洗

通过混合25ml冲洗液和1.575L的DI H₂O制备冲洗液。在UHTcore kit中提供了50ml的冲洗液，足以用于10个PCR平板。在杂交完全以后，用冲洗液冲洗SNP-IT^TM平板3次。

预热SNPstream^TM UHT***，并将实验信息输入UHTPlateExplorer^TM。确信已经将预试(pre-run)数据输入UHTPlateExplorer^TM。

使用连接了1ml的移液器吸头的真空完全干燥SNP-IT^TM平板。切断吸头以便它不会接触到玻璃表面。切断的末端的开口应该比孔大。在冲洗结尾如果有足够的抽气步骤则此步骤可以省略。重要的是注意湿孔增加了背景图像。打开真空源，以排或行将平孔真空化。准备平板在SNPstream^TM UHT***成像。如果成像前有延迟，则在暗盒中储存SNP-IT^TM平板。

组

根据本发明的方法选择大约12个单核苷酸多态性的13个分离的组。每一组成员是T/C单核苷酸多态性。这些组用于筛选多种受损核酸的样品。

组5-17的扩增引物和SNP-IT^TM引物列举如下。含有来自建筑物倒塌和烧伤的样品(样品组A)的受损核酸样品、来自医学检测办公室的法医样品(样品组B)和其它受损样品(样品组C)列于表8。

为了阐明该技术的原理，回收自许多受损骨骼、组织和其它生物学样品的核酸样品根据本发明使用许多组进行基因分型。表1示出了样品组A的受损核酸的基因分型，使用组5。表2示出样品组A和样品组B的受损核酸的基因分型，使用组6。表3示出样品组C的受损核酸的基因分型。表4示出样品组C的受损核酸的基因分型，使用组8。表5示出样品组C的受损核酸的基因分型，使用组11。表6示出样品组C的受损核酸的基因分型，使用组9。表7示出样品组C的受损核酸的基因分型，使用组10。这些数据表明这些SNP标记提供用于鉴定目的的可用遗传信息的能力。

表8示出测试受损核酸样品的组12-17。结果与STR基因分型方法比较。表8中的比较确定使用根据本发明的组的基因分型产生了可靠的结果。

表9示出测试受损核酸样品的组12-17。结果示出使用本发明的组成功鉴定的SNP。表9确定使用根据本发明的组的基因分型产生了可靠的结果。

表10示出测试受损核酸样品的组12-17。结果示出使用本发明的组成功鉴定的SNP。表10确定使用根据本发明的组的基因分型产生了可靠的结果。

表11概括了使用测试受损核酸样品的组12-17的来自44个人的24640可能基因型的结果。示出了使用的DNA量、测试的SNP数目和失败(FL)。结果确定使用根据本发明的组的基因分型产生了可靠的结果。

确认分析(validation asay)

确认分析使用1560个来自建筑物倒塌的样品进行。确认分析的方案描述如下。

该分析通过利用DNA聚合酶掺入染料标记的终止子的能力，因此允许单碱基引物延伸，使用SNP-IT^TM技术进行。使用该技术可以通过使用不同的染料终止子检测单核苷酸多态性(SNP)以区分基因型。在12扩增子的多重PCR扩增之后，未掺入的核苷酸和引物酶学去除。将延伸混合物和12个等位基因特异的标记的SNP-IT引物池加入处理过的PCR中。这些SNP-IT^TM引物与多重反应中的特异扩增子杂交，SNP位点3’的一个碱基。标记的引物通过掺入荧光标记的链终止核苷酸在双染料***中延伸。双色检测可以通过比较来自两种荧光染料的信号区分基因型。然后将延伸的SNP-IT^TM引物与每孔中排列的12个独特探针之一特异杂交。排列的引物捕获延伸的产物，并允许检测每一SNP等位基因信号。

分析方案

1.打开UHT ^TM***和相关的计算机。

2.制备和放置校准平板作为第一个实验平板。

3.用新的384孔PCR平板以从原始的20μL PCR平板(源平板)中转移5μL的PCR产物：

a.在转移程序之前迅速离心所有使用的源平板。如果需要，首先融化。

b.用相同的信息标记新平板作为源平板(即批次数、组数、初始等等)。

c.使用多通道移液器将5μL PCR产物从源平板转移至新的平板。在完全转移整个平板后，密封两个平板。于-20℃储存剩余的15μL样品平板，如果需要进行重新测定。

d.迅速离心5μL平板，肉眼观察以便确信所有的样品都被合适地转移。如果没有观察到问题，进行下一步骤，否则记录问题通知检查者。

4.使用体积计算制备用于SNP-IT^TM清除反应的Exo/SAP。

平板数	2	4	6	8	10
平板数	2	4	6	8	10	Exo/SAP	101μl	202μl	303μl	404μl	505μl
Exo/SAP缓冲液	2419μl	4838μl	7257μl	9676μl	12095μl	Exo/SAP	101μl	202μl	303μl	404μl	505μl
Exo/SAP缓冲液	2419μl	4838μl	7257μl	9676μl	12095μl	总体积	2.520ml	5.040ml	7.560ml	10.080ml	12.600ml

5.混合孔并转移至干净的试剂槽。

6.向384孔PCR平板中的每一孔中加入3.0μl的Exo/SAP混合物。

7.密封并迅速离心平板。确信肉眼观察每一孔确保每一孔接受等量的Exo/SAP。

8.进行Exo/SAP程序，循环平板37℃，30分钟，然后96℃10分钟。

注意：该程序被最佳化以用于MJ Research Tetrad。

9.当制备延伸混合物时在冰上融化SNP-IT^TM引物池。

10.针对要被测试的SNP的类型选择正确的20x延伸混合物。

11.使用以下计算制备延伸混合物。

平板数	1/8	1/4	1/2	1	2
平板数	1/8	1/4	1/2	1	2	20×延伸混合物	10.5μl	21μl	42μl	84μl	168μl
延伸混合物稀释液	197μl	395μl	790μl	1580μl	3160μl	20×延伸混合物	10.5μl	21μl	42μl	84μl	168μl
延伸混合物稀释液	197μl	395μl	790μl	1580μl	3160μl	延伸酶	2.1μl	4.2μl	8.3μl	16.5μl	33μl
总体积	209.6μl	420.2μl	840.3μl	1680.5μl	3361μl	延伸酶	2.1μl	4.2μl	8.3μl	16.5μl	33μl

12.使用以下计算稀释SNP-IT^TM引物池：

平板数

1/8

1/4

1/2

1

2

SNP-IT^TM引物池	1.6μl	3.2μl	6.3μl	12.6μl	25.2μl
SNP-IT^TM引物池	1.6μl	3.2μl	6.3μl	12.6μl	25.2μl	H₂O	156μl	312μl	524μl	1247μl	2495μl
总体积	157.6μl	315.2μl	530.3μl	1259.6μl	2520.2μl	H₂O	156μl	312μl	524μl	1247μl	2495μl

13.使用多通道移液器进行移液，将稀释的SNP-IT^TM引物和延伸混合物转移进试剂槽。

14.向PCR平板相应的孔中加入3μl稀释的SNP-IT^TM引物池。

迅速离心平板。确信肉眼观察每一孔确保每一孔接受等量的SNP-IT^TM引物池。

15.向相应的孔中加入4μl延伸混合物，通过移液器上下混合均匀。

16.将平板密封完好并离心。确信肉眼观察每一孔确保每一孔接受适量的液体。

17.将平板置于热循环仪中，进行以下程序：

步骤1-96℃，3:00

步骤2-94℃，00:20

步骤3-40℃，00:11

步骤4-重复步骤2和3，25次

步骤5-4℃最终保存

注意：该程序被最佳化以用于MJ Research Tetrad热循环仪。测试可以在此时停止。在-20℃密封并储存SNP-IT^TM平板。确信平板密封完全以避免样品蒸发。

18.用无菌水将20×UHT^TM prewash溶液稀释至1x。

19.用1×UHT^TM prewash缓冲液冲洗SNP-IT^TM平板三次。用平板冲洗器抽气干燥平板。

20.通过向9.45ml的杂交溶液中加入550μl的杂交添加剂在15ml或50ml锥形管中制备杂交液。通过振荡完全混合。

21.向每一PCR平板孔中加入8μl杂交液，通过吸头上下混合完全。然后将每一孔中的8μl的溶液转移至玻璃SNP-IT平板上的相应孔中。

22.将玻璃SNP-IT^TM平板置于42℃的潮湿烘箱(或在烘箱中用湿纸巾湿化的带盖的托盘)中。温育平板2小时。如果进行了许多平板，尽量成批错开以节省时间。

23.通过混合25ml冲洗液和1.575L的水(1∶64)制备严格冲洗液(stringent wash)。

24.在杂交完全以后，用严格冲洗液冲洗SNP-IT^TM平板3次。

25.同时预热SNPstream UHT***，并将预试信息输入UHTPlateExplorer^TM软件。

26.从烘箱中取出SNP-IT^TM平板，并使用真空歧管将其完全干燥，该真空歧管连接有管子且1ml吸头***到该管子中。切断吸头以便它不会接触到玻璃表面。切断的末端应该具有比孔大的孔。注意：平板完全干燥是非常重要的。任何残留的液体会增加由激光捕获的背景图像，并能干扰基因型判断。

27.准备平板在UHT^TM***成像。如果成像前有任何延迟，将平板储存在暗处。

使用组12-17，1560个来自灾难区域的组织样品使用上述的分析方案测试。结果是大于50％的来自灾难区域的受损组织样本产生了超过40个SNP的基因型。这些结果将可能产生超过1/10⁹的鉴定指数(identification index)。

来自确认研究的结果总结(n＝1560)
来自确认研究的结果总结(n＝1560)			SNP数	样品数	百分比
＞60	643	41.22	SNP数	样品数	百分比

＞50	768	49.23
＞50	768	49.23	＞40	859	55.06
＞30	947	60.71	＞40	859	55.06
＞30	947	60.71	＞20	1038	66.54
0、1或2个失败	457	29.29	＞20	1038	66.54

大量试剂方案(bulk reagent protocol)

扩增可以使用大量试剂进行。在5μl和20μl体积中进行扩增的典型的反应混合物提供如下：

试剂 5μl混合物 20μl混合物

10X PCR缓冲液II 0.5μl 3.0μl

25mM MgCl₂ 1.0μl 6.0μl

2.5mM dNTP 0.15μl 0.9μl

PCR引物池 0.025μl 0.15μl

水 1.225μl 7.35μl

AmpliTaq Gold 0.1μl 0.6μl

DNA模板 2.0μl 2.0μl

Pfu酶 0 0.06μl

总体积 5.0μl 20.0μl

引物序列

扩增和鉴定引物的序列提供如下。

组5 PCR引物序列 SEQ.ID NO.

61955up tagtttacctctacttcctttcttatattactc 1

61955Lo cacttattttggaaagtggaatc 2

195849up taaggcagccacgggttg 3

195849Lo catgtatgcctgagtgttactgc 4

195869up cagaacacgtgaagactgaa 5

195869Lo catactgaacacatactaatgcagtaatt 6

148193up tatatttcttttcatgagttttgtgag 7

148193Lo cacctgtaatccccccca 8

238355up acttccctgtctggttactcc 9

238355Lo caatgtacagcttgaggacttg 10

63635up tctctccctccccacctc 11

63635Lo gagaacttggcagctccat 12

863949up tatagatgccatcagctcctc 13

863949Lo gaagtgtttctaagcacctgtg 14

211489up actgcatgtgtcagtttcagtc 15

211489Lo gatgagtgaagccactgaagg 16

206538up attttccggagtcagggtc 17

206538Lo gacagccaggctcaagag 18

233357up atttctaccgttactgtcttcttacc 19

233357Lo gaagtcatgctaggctattttaaaga 20

207845up attccatcctgtgctagatgc 21

207845Lo gcactttaataatttggccaga 22

231480up taatatttagagagcagcaaggaca 23

231480Lo cttcttcacccttttcccc 24

组5 SNP引物序列 SEQ.ID NO.

84760 acgcacgtccacggtgatttatcagctcctcagatgxgcxcctgact 25

195849 ggatggcgttccgtcctattcagccacgggttgccttctgtaact 26

195869 cgtgccgctcgtgatagaatggtccagaacacgtgaagactgaat 27

148193 agcgatctgcgagaccgtatgagggtattccccaaaxctctgtgttt 28

238355 gcggtaggttcccgacatattggttactccactataaaaxattcatc 29

63635 ggctatgattcgcaatgctttctccctccccacctcctcttgtcc 30

863949 agggtctctacgctgacgatatcagctcctcagatgxgcxcctgact 31

211489 gtgattctgtacgtgtcgcctttcagtcactcattcctttcttcc 32

206538 gacctgggtgtcgatacctaagggtcgggggttctxcxtgttcatct 33

233357 agatagagtcgatgccagctccttcagaagaactcacaaaatacc 34

207845 agagcgagtgacgcatactatgtgctagatgctgxagttgtccttca 35

231480 cgactgtaggtgcgtaactcatttagagagcagcaaxgacattcctc 36

组6 PCR引物序列 SEQ.ID NO.

63836-U1up tgcctttcctccagggtc 37

63836-U1low gaaattactgagctcctctggt 38

60676-U2up tgaattgattcaaggggatatatta 39

60676-U2low catattcctctcttgttctctaaacac 40

58091-U3up ggcagtttctttttctctctctc 41

58091-U3low ctcatttattatggtagacaatccc 42

169509-U4up taggagagaatgccagtgtg 43

169509-U4low gttgattggccaggtgga 44

238155-U5up ttgatggcaagaggtaactca 45

238155-U5low gattcaatccaccaaacttactattt 46

201688-U6up aagtaacctggcctctctgag 47

201688-U6low gtgagccaggcattcttg 48

57849-U7up caactcccagtggagagg 49

57849-U7low gataaggcttctgaggtgtgaa 50

56915-U8up tcctcggttgcttctctatc 51

56915-U8low cttgtcaggagtcaacagctt 52

56608-U9up tggtgtggagccaactgg 53

56608-U9low gtctatgaggttgagtctcccc 54

68532-U10up aacttttctcaactactgtttgtgac 55

68532-U10low catttgggtgtaggcggt 56

61500-U11up tttttgccagttgtgtatttttatc 57

61500-U11low caccagtacatacttgggcact 58

66026-U12up atttttagagtgaaaggctgct 59

66026-U12low cataagtaaaagaaataagtctcccaa 60

组6 SNP引物序列 SEQ ID NO.

63836 acgcacgtccacggtgatttcaggctgcctttcctccagggtcca 61

60676 ggatggcgttccgtcctatttatattaaattagaatgttgacctc 62

58091 cgtgccgctcgtgatagaatcxctctctttcttcccatagag 63

169509 agcgatctgcgagaccgtattgccagtgtggctcatcaggacatc 64

238155 gcggtaggttcccgacatatatggcaagaggtaactcaa 65

201688 ggctatgattcgcaatgcttctctctgagattcagtttxcacacctg 66

57849 agggtctctacgctgacgatctggaccaacxcxcagtggagagggta 67

56915 gtgattctgtacgtgtcgcccttctctatcataagcacaatg 68

56608 gacctgggtgtcgatacctacaactgggaggagggaaatgagaac 69

68532 agatagagtcgatgccagctttgtgacaacaatacaccaagtacc 70

61500 agagcgagtgacgcatactagtgtatttttatctcatttatccca 71

66026 cgactgtaggtgcgtaactcccatttttagagtgaaaggctgctc 72

组7 PCR引物序列 SEQ.ID NO

221499-UP tttcacaattattatatcagcgaagaac 73

221499-LO ttgatataattaacaaagtacctgaggat 74

89446-UP tttgataagataaattgaattgcaatc 75

89446-LO ccaggaaattatcattcaggaaga 76

229291-LO ctaactgggcatttcaaaataagct 77

229291-UP catctcgtaaagaaaaaaacacatc 78

83031-LO cagattaygctgaatcatgtacactg 79

83031-UP tctggccagcattccagc 80

226119-LO tctaaattgagtcaagatatagaggctttc 81

226119-UP gaactgacattaataatcaatgtacttaca 82

60409-UP tgcaggtgcaatgtttattagctc 83

60409-LO gtatgggaaacttaatcttgtatagtaactt 84

220990-UP acagtaatgagtatagctgtaaattagttatg 85

220990-LO aatatgttttagattcagatttataatttcc 86

63527-UP taccactgtttcctcctttctttct 87

63527-LO atttgccctaggattgagctaac 88

230299-LO tgcaatttgttttcacgtattcg 89

230299-UP cacaggcctggaaagggata 90

58040-LO ygaaaggaaaacctagagagagatt 91

58040-UP gaaacagaaagcgccaaaga 92

231480-UP ctaatatttagagagcagcaaggac 93

231480-LO cttcttcacccttttcccca 94

62059-UP tgataagctacaagttcaaatatactaaac 95

62059-LO gacatagagccagattctaccagg 96

97

组7 SNP引物序列 SEQ.ID NO.

221449 acgcacgtccacggtgattttatcagcgxagaacacttcagttgtaa 98

89446 ggatggcgttccgtcctatttgcaatcattttctgaagtttctta 99

229291 cgtgccgctcgtgatagaataaaacxcatcatagcaatctgtgaata 100

83031 agcgatctgcgagaccgtatattccagcxaagctttacttttgataa 101

226119 gcggtaggttcccgacatattaataatcaatxtacxtacataatata 102

60409 ggctatgattcgcaatgctttgtttattagctcgtttatcttcca 103

220990 agggtctctacgctgacgatatagctgtaaattagtxatgatataac 104

63527 gtgattctgtacgtgtcgccactgtttcctcctttctttctctct 105

230299 gacctgggtgtcgatacctaaggcctggaaagggaxattgtgagata 106

58040 agatagagtcgatgccagctagcgccaaagaacagagtagaacaa 106

62059 agagcgagt9acgcatactatacaaxttcaaatatactaaactattc 108

231480 cgactgtaggtgcgtaactcatttagagagcagcaaxgacattcctc 109

组8 PCR引物序列 SEQ.ID NO.

56763-UP cgaattttgtgtaggcagcct 110

56763-LO tctacagaggtagatagaattgaatagaag 111

61955-UP tacctctacttcctttcttatattactctt 112

61955-LO gtggatgcaggtcacttattttg 113

204593-UP cacagaatgtgcacagagattgac 114

204593-LO gacattgtacatgatgctgcttag 115

65068-UP ctggaattcttccttctaggtgta 116

65068-LO cttccctaaggctacacttatatattaa 117

114977-UP tgctactaagtctcagatcaattctg 118

114977-LO caataatatgtgtttgttagatcaatacag 119

148193-LO tggctcacacctgtaatccc 120

148193-UP catgagttttgtgagggtattcc 121

66158-UP cttacagataagagaatagaataacaaattac 122

66158-LO gaactgttgtgatattgtggaaaga 123

69003-UP aaaatacctttaacacctatttagtgtc 124

69003-LO ggaaacattttgtaaaaaatcaagta 125

63811-UP tcctaaaccaatcccaggg 126

63811-LO gctcctcctattacctgcaaat 127

860850-UP catgcatccgtccatggg 128

860850-LO atttcctgaatgactgtgtcca 129

63189-UP atccgtccatgggccact 130

63189-LO gctatttcctgaatgactgtgtcc 131

126922-UP gtgctttgataagactgtgatcatcac 132

126922-LO gctgcatgggtccatttgt 133

组8 SNP引物序列 SEQ.ID NO.

61955 acgcacgtccacggtgatttcttcctttcttatattactcttttc 134

65068 ggatggcgttccgtcctattttcttccttctaggtgtxtatctatac 135

114977 cgtgccgctcgtgatagaattaagtxtxaxatcaatxctgagaaaga 136

148193 agcgatctgcgagaccgtatgagggtattccccaaaxctctgtgttt 137

66158 gcggtaggttcccgacatatgagaatagaataacaaxttacttga 138

56763 ggctatgattcgcaatgcttttgtgtaggcagccttttagctctt 139

69003 agggtctctacgctgacgatatacctttaaxacctatttagtgtctt 140

63811 gtgattctgtacgtgtcgccaatcccaggggattxcagggttgca 141

860850 gacctgggtgtcgatacctatccgtccatggxccacxcgccgagaca 142

63189 agatagagtcgatgccagcttccgtccatggxccacxcgccgagaca 143

126922 agagcgagtgacgcatactatgtgatcatcacagcaggacagtat 144

204593 cgactgtaggtgcgtaactcgaatgtgcacagagattgactccac 145

组9 PCR引物序列 SEQ ID NO.

56593-UP cagagtggagagtcacaaaatgg 146

56593-LO aatcccttgacactggataacca 147

217856-UP cctctttctctctcctgatctgtctat 148

217856-LO gatggggtgtgaatatgtatacaga 149

231735-UP ctctattatttataaagggcagaatgag 150

231735-LO gcctgtctgtatctctctccttc 151

81917-UP gctctttcatctgatgccatga 152

81917-LO gatataggagtaatctgacagcagg 153

62684-UP taacacaaagaaagtatgcttttgca 154

62684-UP gtatgtggatgaaaatctcgcac 155

241554-UP gtgataataaaatttttgtgcctga 156

241554-LO catttgtttcacctgtgttcttaata 157

126264-UP ggataatgttctccgtaaggtttatac 158

126264-LO gagaaacaagcttgcccttaacta 159

224922-UP caaggaaaacttacataatcacagc 160

224922-LO gaaatataaaagctccacaaatagga 161

81081-UP aaagtaggcaatactgaagagtcatac 162

81081-LO gttcaattggcttggaagttatacc 163

66561-LO acttggatttaccctcattgatg 164

66561-UP cttcctctttggtttctgcttttaat 165

63799-UP gtgcccagctccctaatttct 166

63799-LO ctcttgtgactttcattaactatcttca 167

119770-UP agcctggctggaaatgaag 168

119770-LO cttctaccctcctgtacctgattta 169

组9 SNP引物序列 SEQ.ID NO.

56593 acgcacgtccacggtgattttggagagtcacaaaatgxcccttatta 170

217856 ggatggcgttccgtcctatttttctctctcctxatctgtctatcaaa 171

231735 cgtgccgctcgtgatagaattttataaagggcagaatgaggatta 172

81917 agcgatctgcgagaccgtattcatctgatgccatgagaaagc 173

62684 gcggtaggttcccgacatatagaaagtatxcxttxgcaaaaggtcca 174

241554 ggctatgattcgcaatgctttaataaaatttttgtgcxtgaggtata 175

126264 agggtctctacgctgacgatttctccgtaaggtttxtacattgacta 176

224922 gtgattctgtacgtgtcgcccataatcacagcttttttctcccaa 177

81081 gacctgggt9tcgatacctataggcaatactgaagagtcatacaa 178

66561 agatagagtcgatgccagctgxttctgctxttaatacaaaaccag 179

63799 agagcgagtgacgcatactaagctcxctaatttcttgatggg 180

119770 cgactgtaggtgcgtaactctggctggaaat9aaggaaaggaaag 181

组10 PCR引物序列 SEQ.ID NO.

63836-LO ctctggtgcccgacagc 182

63836-up gcatcaggctgcctttcct 183

58091-UP ctttttctctctctctttcttccc 184

58091-LO gctcatttattatggtagacaatcc 185

68909-UP gagtgttgggaagagagaccttc 186

68909-LO gctatgtggacagacccatctg 187

238155-UP ggtacttgatggcaagaggtaact 188

238155-LO aaacttactatttggatagagtgcttt 189

201688-LO ctgtgagccaggcattcttg 190

201688-UP caagtaacctggcctctctgagat 191

57849-UP gctggaccaactcccagtg 192

57849-LO gtgaatatctctcctttctctggg 193

56915-UP cctcggttgcttctctatcataa 194

56915-LO cttgtcaggagtcaacagcttc 195

56608-LO aggttgagtctcccccgtg 196

56608-UP gtggagccaactgggagga 197

68532-UP cttttctcaactactgtttgtgaca 198

68532-LO ccatttgggtgtaggcgg 199

61500-UP ttgccagttgtgtatttttatctca 200

61500-LO taacttaagcccaccagtacatact 201

66026-UP cccatttttagagtgaaaggctg 202

66026-LO taagtctcccaaggtggatacatg 203

60676-UP gattcaaggggatatattaaattagaat 204

60676-LO caagttcattattcctctcttgttctc 205

组10 SNP引物序列 SEQ.ID NO.

63836 acgcacgtccacggtgatttcaggctgcctttcctccagggtcca 206

60676 ggatggcgttccgtcctatttatattaaattagaatgttgacctc 207

58091 cgtgccgctcgtgatagaatcxctctcttttcttcccatagag 208

68909 agcgatctgcgagaccgtattgttxggxagagagaccttccattcat 209

238155 gcggtaggttcccgacatatatggcaagaggtaactcaatca 210

201688 ggctatgattcgcaatgcttctctctgagattcagtttxcacacctg 211

57849 agggtctctacgctgacgatctggaccaacxcxcagtggagagggta 212

56915 gtgattctgtacgtgtcgcccttctctatcataagcacaatg 213

56608 gacctgggtgtcgatacctacaactgggaggagggaaatgagaac 214

68532 agatagagtcgatgccagctttgtgacaacaatacaccaagtacc 215

61500 agagcgagtgacgcatactagtgtatttttatctcatttatccca 216

66026 cgactgtaggtgcgtaactcccatttttagagtgaaaggctgctc 217

组11 PCR引物序列 SEQ.ID NO.

212605-UP gcctgcttcccctttatctcct 218

212605-LO tcttatctcccatcttcctctacac 219

220875-UP ctggcaatctgggcacc 220

220875-LO cccaagtccacacacaaattat 221

65882-UP gtatactaaagagtctaagtttttgcctaa 222

65882-LO cttccctttttccttccctt 223

57575-UP tgaatagtctttggtctgagcct 224

57575-LO aggcagagtcttatctgggaca 225

66683-UP cagagaattggagttggctgg 226

66683-LO aggaggtagcagtcacactgattc 227

214674-UP gacttccgattgtgaggctg 228

214674-LO cctccttttattcttgctcatagc 229

248007-UP agctcactggatgcaagagtagt 230

248007-LO caagtggataagatgacccattc 231

63804-UP gatatacaggggaaacgggct 232

63804-LO cctcaggggggcactttac 233

56144-UP tcaatcttttgatgatgtcctaaga 234

56144-LO ttcagcacagtattctagtattttgtg 235

233357-UP cgttactgtcttcttacccttcag 236

233357-LO ggaa9tcatgctaggctattttaa 237

206538-UP agggtcgggggttctgc 238

206538-LO ctacagcctagggacagccag 239

60188-UP aggatgcatgcatgctgg 240

60188-LO ctcagagtatgtgccattgattg 241

组11 SNP引物序列 SEQ.ID NO.

212605 acgcacgtccacggtgatttttcccctttatcctcttcgcagcct 242

220875 ggatggcgttccgtcctattatctgggcxccaggcaggtggtcaggc 243

65882 cgtgccgctcgtgatagaatagtctaagtxtttgcctaaaagcagga 244

57575 agcgatctgcgagaccgtattgaatagtctttxgtctgagcctggaa 245

66683 gcggtaggttcccgacatatagagaattggagttggctggagata 246

214674 ggctatgattcgcaatgcttccgattgtgaggctgctgagaaggg 247

248007 agggtctctacgctgacgataagagtagttggggaaaggggctgt 248

63804 gtgattctgtacgtgtcgccatacaggggaaacxggxtccgagcaga 249

56144 gacctgggtgtcgatacctatgatgatgtcctaxgaaataatgactt 250

233357 agatagagtcgatgccagctccttcagaagaactcacaaaatacc 251

60188 agagcgagtgacgcatactagatgcatgcatgctgxcxttgaggaac 252

206538 cgactgtaggtgcgtaactcagggtcgggggttctxcxtgttcatct 253

56593-UP cagagtggagagtcacaaaatgg 254

56593-LO aatcccttgacactggataacca 255

217856-UP cctctttctctctcctgatctgtctat 256

217856-LO gatggggtgtgaatatgtatacaga 257

231735-UP ctctattatttataaagggcagaatgag 258

231735-LO gcctgtctgtatctctctccttc 259

81917-UP acttagcttggttctttgttttctaattaac 260

81917-LO atggaaaggcagatataggagtaatct 261

62684-UP taacacaaagaaagtatgcttttgca 262

62684-UP gtatgtggatgaaaatctcgcac 263

241554-UP gtgataataaaatttttgtgcctga 264

241554-LO catttgtttcacctgtgttcttaata 265

126264-UP ggataatgttctccgtaaggtttatac 266

126264-LO gagaaacaagcttgcccttaacta 267

230299-LO tgcaatttgttttcacgtattcg 268

230299-UP cacaggcctggaaagggata 269

224922-UP caaggaaaacttacataatcacagc 270

224922-LO gaaatataaaagctccacaaatagga 271

66561-LO acttggatttaccctcattgatg 272

66561-UP cttcctctttggtttctgcttttaat 273

63799-UP gtgcccagctccctaatttct 274

63799-LO ctcttgtgactttcattaactatcttca 275

119770-UP agcctggctggaaatgaag 276

119770-LO cttctaccctcctgtacctgattta 277

56593 acgcacgtccacggtgattttggagagtcacaaaatgxcccttatta 278

217856 ggatggcgttccgtcctatttttctctctcctxatctgtctatcaaa 279

231735 cgtgccgctcgtgatagaattttataaagggcagaatgaggatta 280

81917 agcgatctgcgagaccgtattcatctgatgccatgagaaagc 281

62684 gcggtaggttcccgacatatagaaagtatxcxttxgcaaaaggtcca 282

241554 ggctatgattcgcaatgctttaataaaatttttgtgcxtgaggtata 283

126264 agggtctctacgctgacgatttctccgtaaggtttxtacattgacta 284

224922 gtgattctgtacgtgtcgcccataatcacagcttttttctcccaa 285

230299 gacctgggtgtcgatacctaaggcctggaaagggaxattgtgagata 286

66561 agatagagtcgatgccagctgxttctgctxttaatacaaaaccag 287

63799 agagcgagtgacgcatactaagctcxctaatttcttgatggg 288

119770 cgactgtaggtgcgtaactctggctggaaatgaaggaaaggaaag 289

63836-UP gcatcaggctgcctttcct 290

63836-LO ctctggtgcccgacagc 291

220875-UP ctggcaatctgggcacc 292

220875-LO cccaagtccacacacaaattat 293

58091-UP aatacttcatctctgggggca 294

58091-LO gctcatttattatggtagacaatcc 295

68909-UP gagtgttgggaagagagaccttc 296

68909-LO gctatgtggacagacccatctg 297

238155-UP ggtacttgatggcaagaggtaact 298

238155-LO aaacttactatttggatagagtgcttt 299

201688-UP caagtaacctggcctctctgagat 300

201688-LO ctgtgagccaggcattcttg 301

57849-UP gctggaccaactcccagtg 302

57849-LO gtgaatatctctcctttctctggg 303

56915-UP cctcggttgcttctctatcataa 304

56915-LO cttgtcaggagtcaacagcttc 305

56608-UP gtggagccaactgggagga 306

56608-LO aggttgagtctcccccgtg 307

68532-UP cttttctcaactactgtttgtgaca 308

68532-LO ccatttgggtgtaggcgg 309

62059-UP tgataagctacaagttcaaatatactaaac 310

62059-LO gacatagagccagattctaccagg 311

66026-UP cccatttttagagtgaaaggctg 312

66026-LO taagtctcccaaggtggatacatg 313

63836 acgcacgtccacggtgatttcaggctgcctttcctccagggtcca 314

220875 ggatggcgttccgtcctattatctgggcxccaggcaggtggtcaggc 315

58091 cgtgccgctcgtgatagaatcxctctctttcttcccatagag 316

68909 agcgatctgcgagaccgtattgttxggxagagagaccttccattcat 317

238155 gcggtaggttcccgacatatatggcaagaggtaactcaatca 318

201688 ggctatgattcgcaatgcttctctctgagattcagtttxcacacctg 319

57849 agggtctctacgctgacgatctggaccaacxcxcagtggagagggta 320

56915 gtgattctgtacgtgtcgcccttctctatcataagcacaatg 321

56608 gacctgggtgtcgatacctacaactgggaggagggaaatgagaac 322

68532 agatagagtcgatgccagctttgtgacaacaatacaccaagtacc 323

62059 agagcgagtgacgcatactatacaaxttcaaatatactaaactattc 324

66026 cgactgtaggtgcgtaactcccatttttagagtgaaaggctgctc 325

326

76268-UP ctgtttcatttcagcccttttag 327

76268-LO gttatccttagtgagttttctgtctaca 328

70371-UP gcgtcatatggagcctcct 329

70371-LO ctcatctggccttctgtgtcc 330

58388-UP ctgcagttcaggtggctgtt 331

58388-LO cctcgtctccaagggtgtct 332

105677-UP agccattagacctgccaatc 333

105677-LO aatgcagaggccaccagc 334

226119-UP gaactgacattaataatcaatgtacttaca 335

226119-LO tctaaattgagtcaagatatagaggctttc 336

63184-UP ctcaagcactctctcttttcatca 337

63184-LO ggagtccaggtagataggaacactag 338

63979-UP gtgatacacgaaggcagatgat 339

63979-LO gactgtgaatgtacttagccccc 340

130240-UP caacaggaagcgaggcc 341

130240-LO acaaggcaggaccaaggc 342

182622-UP gggcttgtgtgtccacaga 343

182622-LO tgtgtcaggaagaagaagatcaac 344

66567-UP ctgaacccaagaacttcctgat 345

66567-LO tgatgagtatataaccagaaggaacac 346

89614-UP agcagaggatggcagtcacc 347

89614-LO cacctctgttcctgttttctgtta 348

219561-UP cagtactatctcttctttaaagatctgaaa 349

219561-LO acccagctcaagatgctctg 350

76268 acgcacgtccacggtgatttttaggtatagttgattgttttaaga 351

70371RT ggatggcgttccgtcctattgcgtcatatgxagcctxctgggacaag 352

58388 cgtgccgctcgtgatagaatttcaggtggctgtttcagagctcag 353

105677 agcgatctgcgagaccgtatcxattagacctgccaatcxcctggaga 354

226119 gcggtaggttcccgacatattaataatcaabxtacxtacataatata 355

63184 ggctatgattcgcaatgcttcactctctcttttcatcactcatct 356

63979 agggtctctacgctgacgatcacgaaxgcagatxatxacggtcgcct 357

130240 gtgattctgtacgtgtcgccgaagcgaggccxcaggtcaaggtggga 358

182622 gacctgggtgtcgatacctatgtgtcxacagacagtggcgggcttca 359

66567 agatagagtcgatgccagctcaagaactxcctgatatgggaatcaaa 360

89614 agagcgagtgacgcatactacagtcaccctcagagcccagaa 361

219561 cgactgtaggtgcgtaactctgaaagtagaaccaatcaaggctcc 362

216327-UP cagtgggctctatttttttctaactt 363

216327-LO tggtctctcagctatggcctt 364

248075-UP gatcaaaaaagcatgagttcttatta 365

248075-LO cctcactaatggtgacacaacaag 366

85187-UP cccaggcaattaatgagtctg 367

85187-LO gtttatatattaggaacttttaggggag 368

225225-UP ctagacctaaatagtggccctaaat 369

225225-LO ctctactgaagacaaacttagaggaatg 370

82031-UP ttgacatcttcttagattctaaaatcac 371

82031-LO ctgttggcttttaaggtctcc 372

60409-UP tgcaggtgcaatgtttattagctc 373

60409-LO gtatgggaaacttaatcttgtatagtaactt 374

221499-UP tttcacaattattatatcagcgaagaac 375

221499-LO ttgatataattaacaaagtacctgaggat 376

168115-UP tcctgtagcattggaaaactgt 377

168115-LO agaaactggagttactcttgtcaga 378

177589-UP ctgaggaagagtgcagcatactc 379

177589-LO caggcatagggttgggatg 380

173632-UP gactcttcatggccaacacc 381

173632-LO attttgccactagtttttacatctcta 382

60188-UP aggatgcatgcatgctgg 383

60188-LO ctcagagtatgtgccattgattg 384

231480-UP ctaatatttagagagcagcaaggac 385

231480-LO cttcttcacccttttcccca 386

216327 acgcacgtccacggtgatttctatttttttctaacttcagaattt 387

248075RT ggatggcgttccgtcctattgcatgagttcttattattcaccaca 388

85187 cgtgccgctcgtgatagaatgcaattaatgagtctgxtaaaccta 389

225225 agcgatctgcgagaccgtatccctaaatttgtgttaxgcxttcccta 390

82031 gcggtaggttcccgacatattagattctxaaatcactttattcatac 391

60409 ggctatgattcgcaatgctttgtttattagctcgtttatcttcca 392

221499RT agggtctctacgctgacgattatcagcgxagaacacttcagttgtaa 393

168115 gtgattctgtacgtgtcgccaaactgttgttcattttctcaccac 394

177589 gacctgggtgtcgatacctagtgcagcatactcattcacaga 395

173632 agatagagtcgatgccagcttcatggccaacaxcaggtagtcagtat 396

60188 agagcgagtgacgcatactagatgcatgcatgctgxcxttgaggaac 397

231480 cgactgtaggtgcgtaactcatttagagagcagcaaxgacattcctc 398

61955-UP tacctctacttcctttcttatattactctt 399

61955-LO gtggatgcaggtcacttattttg 400

65068-UP ctggaattcttccttctaggtgta 401

65068-LO cttccctaaggctacacttatatattaa 402

65882-UP gtatactaaagagtctaagtttttgcctaa 403

65882-LO cttccctttttccttccctt 404

148193-UP catgagttttgtgagggtattcc 405

148193-LO tggctcacacctgtaatccc 406

66158-UP cttacagataagagaatagaataacaaattac 407

66158-LO gaactgttgtgatattgtggaaaga 408

56763-UP cgaattttgtgtaggcagcct 409

56763-LO tctacagaggtagatagaattgaatagaag 410

69003-UP aaaatacctttaacacctatttagtgtc 411

69003-LO ggaaacattttgtaaaaaatcaagta 412

212605-UP gcctgcttcccctttatcct 413

212605-LO tcttatctcccatcttcctctacac 414

860850-UP catgcatccgtccatggg 415

860850-LO atttcctgaatgactgtgtcca 416

235106-UP gcttttgaaaaaaaataaaattgc 417

235106-LO ggacccatttatagttttttaactttg 418

126922-UP gtgctttgataagactgtgatcatcac 419

126922-LO gctgcatgggtccatttgt 420

206538-UP agggtcgggggttctgc 421

206538-LO ctacagcctagggacagccag 422

61955 acgcacgtccacggtgatttcttcctttcttatattactcttttc 423

65068 ggatggcgttccgtcctattttcttccttctaggtgtxtatctatac 424

65882 cgtgccgctcgtgatagaatagtctaagtxtttgcctaaaagcagga 425

148193 agcgatctgcgagaccgtatgagggtattccccaaaxctctgtgttt 426

66158 gcggtaggttcccgacatatgagaatagaataacaaxttacttga 427

56763 ggctatgattcgcaatgcttttgtgtaggcagccttttagctctt 428

69003 agggtctctacgctgacgatatacctttaaxacctatttagtgtctt 429

212605RT gtgattctgtacgtgtcgccttcccctttatcctcttcgcagcct 430

860850 gacctgggtgtcgatacctatccgtccatggxccacxcgccgagaca 431

235106 agatagagtcgatgccagctaxaaataxaattgcttttgaatactga 432

126922 agagcgagtgacgcatactatgtgatcatcacagcaggacagtat 433

206538 cgactgtaggtgcgtaactcagggtcgggggttctxcxtgttcatct 434

228468-UP cctactttcagatcctgagtcttgt 435

228468-LO gcctctggtgttatttagactcc 436

214674-UP gacttccgattgtgaggctg 437

214674-LO cctccttttattcttgctcatagc 438

126243-UP ccagtgtttgaatgccgct 439

126243-LO gaagcggaggtttcagcag 440

207160-UP tgaatgaattaacaaagtcatggag 441

207160-LO ctctgcccccattccaac 442

66683-UP cagagaattggagttggctgg 443

66683-LO aggaggtagcagtcacactgattc 444

211324-UP tgccacacagtttggagtga 445

211324-LO cattcaatgggggagatgg 446

214373-UP ctggcaggcaagagatgtga 447

214373-LO gactggaaaggaacaaagaggtg 448

234217-UP acagtcatttgtacttacggagcg 449

234217-LO gagcctgcctcaacgagaag 450

63404-UP aggggctargtttggagaagag 451

63404-LO aatgcaaagaccacatctatcaat 452

72171-UP cacctgacctccagcaagag 453

72171-LO ggtgtgtccctgtgtgtagtgg 454

Amel-2-short-UP ccagataaagtggtttctcaagtg 455

Amel-2-short-LO gggaagctggtggtaggaac 456

228468 acgcacgtccacggtgattttcctgagtcttgttttgacccatga 457

214674RT ggatggcgttccgtcctattccgattgtgaggctgctgagaaggg 458

126243 cgtgccgctcgtgatagaataatgccgctgtgagacaaaggg 459

207160 agcgatctgcgagaccgtataacaaagtcatggagaaatcaactc 460

66683 gcggtaggttcccgacatatagagaattggagttggctggagata 461

211324 ggctatgattcgcaatgctttttgccacacagttxggagtgacccaa 462

214373RT agggtctctacgctgacgatggcaagagatgtgacaggcaagagt 463

234217 gacctgggtgtcgatacctaacttacggagcgctctttgtgagaa 464

63404 agatagagtcgatgccagctrgtttggagaxgagcctacrtcttaac 465

72171 cgactgtaggtgcgtaactctccaxcaagaggaatxcaagaatgcta 466

Amel-2U8 gtgattctgtacgtgtcgccgataaagtggtttctcaagtggtcc 467

表1.受损核酸样品组A的基因型，使用组5(共12个SNP)。样品是纯合子(XX或YY)，杂合子(XY)，或样品没有对每个SNP分型(一)。
															84760	195849	195869	148193	238355	63635	863949	211489	206538	233357	207845	231480	#成功的SNP数
DQ 31770	-	XX	XY	YY	XX	XX	YY	XX	XY	YY	YY	XX	11/12		84760	195849	195869	148193	238355	63635	863949	211489	206538	233357	207845	231480	#成功的SNP数
DQ 31770	-	XX	XY	YY	XX	XX	YY	XX	XY	YY	YY	XX	11/12	DQ 31749	-	YY	-	YY	-	YY	XX	XX	XX	XY	XY	XY	9/12
DQ 31965	-	XY	-	YY	XX	XY	XX	XX	YY	YY	XX	YY	10/12	DQ 31749	-	YY	-	YY	-	YY	XX	XX	XX	XY	XY	XY	9/12
DQ 31965	-	XY	-	YY	XX	XY	XX	XX	YY	YY	XX	YY	10/12	DQ232121	-	YY	YY	XY	XX	XY	YY	XX	YY	YY	YY	XY	11/12
DQ 14700	-	XY	-	XY	XX	XY	XX	XX	-	YY	YY	XY	9/12	DQ232121	-	YY	YY	XY	XX	XY	YY	XX	YY	YY	YY	XY	11/12
DQ 14700	-	XY	-	XY	XX	XY	XX	XX	-	YY	YY	XY	9/12	DQ 14704	-	XY	-	XY	-	XY	-	-	YY	XY	-	XY	6/12
DQ 14775	-	YY	YY	XY	-	YY	YY	XX	YY	XY	YY	XY	10/12	DQ 14704	-	XY	-	XY	-	XY	-	-	YY	XY	-	XY	6/12
DQ 14775	-	YY	YY	XY	-	YY	YY	XX	YY	XY	YY	XY	10/12	DQ 12793	-	XY	-	XY	XX	XY	XY	-	XY	XY	XY	XY	9/12
DQ 12792	-	-	-	XX	XX	XY	YY	-	YY	YY	XX	YY	8/12	DQ 12793	-	XY	-	XY	XX	XY	XY	-	XY	XY	XY	XY	9/12
DQ 12792	-	-	-	XX	XX	XY	YY	-	YY	YY	XX	YY	8/12	DQ 14686	-	XY	-	XX	XX	XY	XX	-	XY	XY	YY	XY	9/12

表2.受损核酸样品组A和受损核酸样品组B的基因型，使用组6(共12个SNP)。样品是纯合子(XX或YY)，杂合子(XY)，或样品没有对每个SNP分型(一)。
															63836	60676	58091	169509	238155	201688	57849	56915	56608	68532	61500	66026	#成功的SNP数
DQ12792	XY	YY	XY	XY	YY	XY	XY	XY	XY	XX	XY	XY	12/12		63836	60676	58091	169509	238155	201688	57849	56915	56608	68532	61500	66026	#成功的SNP数
DQ12792	XY	YY	XY	XY	YY	XY	XY	XY	XY	XX	XY	XY	12/12	DQ12793	XY	XY	XY	XY	XY	XY	XY	XY	XY	XY	XY	XY	12/12
DQ14686	XY	XY	XY	XY	XY	XY	XX	YY	XX	XY	XY	XY	12/12	DQ12793	XY	XY	XY	XY	XY	XY	XY	XY	XY	XY	XY	XY	12/12
DQ14686	XY	XY	XY	XY	XY	XY	XX	YY	XX	XY	XY	XY	12/12	DQ14775	XY	YY	XY	YY	YY	XY	XX	XX	XY	XX	XY	XY	12/12
DQ14700	XY	YY	XY	XY	XX	YY	XY	YY	XX	XY	XY	XY	12/12	DQ14775	XY	YY	XY	YY	YY	XY	XX	XX	XY	XX	XY	XY	12/12
DQ14700	XY	YY	XY	XY	XX	YY	XY	YY	XX	XY	XY	XY	12/12	DQ14704	XY	XX	YY	XY	XY	XY	YY	XX	XY	XY	XY	XY	12/12
DQ231770	YY	YY	XX	XY	YY	YY	XY	XX	XX	XY	XY	XY	12/12	DQ14704	XY	XX	YY	XY	XY	XY	YY	XX	XY	XY	XY	XY	12/12
DQ231770	YY	YY	XX	XY	YY	YY	XY	XX	XX	XY	XY	XY	12/12	DQ231965	XY	XY	XY	-Y	XY	XY	XY	XY	XX	YY	YY	XY	12/12
DQ232121	-	-	-	-	-	-	-	-	-	-	-	-	NoDNA	DQ231965	XY	XY	XY	-Y	XY	XY	XY	XY	XX	YY	YY	XY	12/12
DQ232121	-	-	-	-	-	-	-	-	-	-	-	-	NoDNA	DQ231749	YY	XY	XX	XY	XY	XY	XY	XY	XX	XY	XY	YY	12/12
DFS 2918034	-	-	-	-	-	-	-	-	-	-	-	-	0/12	DQ231749	YY	XY	XX	XY	XY	XY	XY	XY	XX	XY	XY	YY	12/12
DFS 2918034	-	-	-	-	-	-	-	-	-	-	-	-	0/12	DFS 294240	-	-	-	-	-	-	-	-	-	-	-	-	0/12
DFS 294235	XY	YY	XX	YY	YY	XY	YY	XY	XX	XY	XY	YY	12/12	DFS 294240	-	-	-	-	-	-	-	-	-	-	-	-	0/12
DFS 294235	XY	YY	XX	YY	YY	XY	YY	XY	XX	XY	XY	YY	12/12	DFS 2918027	-	-	-	-	-	-	-	-	-	-	-	-	0/12
DFS 3260001	-	-	-	-	-	-	-	-	-	-	-	-	0/12	DFS 2918027	-	-	-	-	-	-	-	-	-	-	-	-	0/12
DFS 3260001	-	-	-	-	-	-	-	-	-	-	-	-	0/12	DFS 3258001	YY	-	-	-	-	-	-	-	-	-	-	XY	2/12
DFS MITO	YY	XY	YY	XY	YY	XY	XY	XY	XY	XY	XY	YY	12/12	DFS 3258001	YY	-	-	-	-	-	-	-	-	-	-	XY	2/12
DFS MITO	YY	XY	YY	XY	YY	XY	XY	XY	XY	XY	XY	YY	12/12	DFS HAIR	YY	-	-	-	-	-	XX	-	-	-	-	-	2/12

表3.用组7进行受损核酸样品组C基因分型.组C的受损样品来源见表8所述.
表3.用组7进行受损核酸样品组C基因分型.组C的受损样品来源见表8所述.														221499	89446	229291	83031	226119	60409	220990	63527	230299	58040	62059	231480
3260-1	-	-	-	-	-	-	-	-	-	-	-	-		221499	89446	229291	83031	226119	60409	220990	63527	230299	58040	62059	231480
3260-1	-	-	-	-	-	-	-	-	-	-	-	-	3135-4	YY	-	-	XX	YY	-	-	XY	XX	YY	XX	YY
3135-5	-	-	XX	-	-	-	-	-	-	-	XX	YY	3135-4	YY	-	-	XX	YY	-	-	XY	XX	YY	XX	YY
3135-5	-	-	XX	-	-	-	-	-	-	-	XX	YY	3135-6	-	-	-	-	-	-	-	-	-	-	-	-
3106-4	-	YY	-	-	-	-	-	XY	-	-	YY	YY	3135-6	-	-	-	-	-	-	-	-	-	-	-	-
3106-4	-	YY	-	-	-	-	-	XY	-	-	YY	YY	3106-2	-	-	-	-	-	-	-	XX	-	-	-	-
3106-7	-	-	-	YY	YY	-	-	XX	-	-	YY	XX	3106-2	-	-	-	-	-	-	-	XX	-	-	-	-

表4.用组8进行受损核酸样品组C基因分型.组C的受损样品来源见表8所述.
表4.用组8进行受损核酸样品组C基因分型.组C的受损样品来源见表8所述.														61955	65068	114977	148193	66158	56763	69003	63811	860850	63189	126922	204593
3260-1	-	-	-	-	-	-	-	-	-	-	-	-		61955	65068	114977	148193	66158	56763	69003	63811	860850	63189	126922	204593
3260-1	-	-	-	-	-	-	-	-	-	-	-	-	3135-4	-	XY	-	XX	-	YY	XX	XY	-	-	YY	-
3135-5	-	-	-	-	-	-	-	-	-	-	-	XX	3135-4	-	XY	-	XX	-	YY	XX	XY	-	-	YY	-
3135-5	-	-	-	-	-	-	-	-	-	-	-	XX	3135-6	-	-	-	-	-	-	-	-	YY	-	-	-
3106-4	-	YY	-	XX	-	XX	-	YY	XX	XX	YY	-	3135-6	-	-	-	-	-	-	-	-	YY	-	-	-
3106-4	-	YY	-	XX	-	XX	-	YY	XX	XX	YY	-	3106-2	-	-	-	-	-	-	XX	-	-	-	-	-
3106-7	YY	-	-	XX	XX	-	YY	XX	XX	YY	YY	-	3106-2	-	-	-	-	-	-	XX	-	-	-	-	-

表5.用组11进行受损核酸样品组C基因分型.组C的受损样品来源见表8所述.
表5.用组11进行受损核酸样品组C基因分型.组C的受损样品来源见表8所述.														212605	220875	65882	57575	66683	214674	248007	63804	56144	233357	60188	206538
3260-1	XY	-	-	-	-	-	-	XX	-	-	XX	XX		212605	220875	65882	57575	66683	214674	248007	63804	56144	233357	60188	206538
3260-1	XY	-	-	-	-	-	-	XX	-	-	XX	XX	3135-4	-	-	-	-	-	YY	YY	YY	-	-	YY	YY
3135-5	-	-	-	-	-	-	-	-	-	-	-	-	3135-4	-	-	-	-	-	YY	YY	YY	-	-	YY	YY
3135-5	-	-	-	-	-	-	-	-	-	-	-	-	3135-6	YY	-	-	-	-	-	-	-	-	-	-	-
3106-4	-	-	-	-	XX	-	YY	XX	XX	YY	-	-	3135-6	YY	-	-	-	-	-	-	-	-	-	-	-
3106-4	-	-	-	-	XX	-	YY	XX	XX	YY	-	-	3106-2	YY	-	-	-	XX	-	-	-	-	-	-	-
3106-7	-	-	XY	XY	-	-	-	-	YY	-	YY	YY	3106-2	YY	-	-	-	XX	-	-	-	-	-	-	-

表6.用组9进行受损核酸样品组C基因分型.组C的受损样品来源见表8所述.
表6.用组9进行受损核酸样品组C基因分型.组C的受损样品来源见表8所述.														56593	217856	231735	81917	62684	241554	126264	224922	81081	66561	63799	119770
3260-1	-	-	-	-	-	-	-	-	-	-	-	-		56593	217856	231735	81917	62684	241554	126264	224922	81081	66561	63799	119770
3260-1	-	-	-	-	-	-	-	-	-	-	-	-	3135-4	-	XY	YY	XX	-	YY	XX	-	-	YY	-	XX
3135-5	XY	-	-	-	-	-	-	-	-	-	XX	XX	3135-4	-	XY	YY	XX	-	YY	XX	-	-	YY	-	XX
3135-5	XY	-	-	-	-	-	-	-	-	-	XX	XX	3135-6	-	-	-	-	-	-	-	-	-	-	-	-
3106-4	YY	-	-	-	XX	-	XX	-	YY	-	-	YY	3135-6	-	-	-	-	-	-	-	-	-	-	-	-
3106-4	YY	-	-	-	XX	-	XX	-	YY	-	-	YY	3106-2	XX	-	XX	-	-	-	-	-	XX	-	-	XX
3106-7	-	YY	-	-	-	XX	-	-	-	-	YY	-	3106-2	XX	-	XX	-	-	-	-	-	XX	-	-	XX

表7.用组10进行受损核酸样品组C基因分型.组C的受损样品的来源见表8所述.
表7.用组10进行受损核酸样品组C基因分型.组C的受损样品的来源见表8所述.														63836	60676	58091	68909	238155	201688	57849	56915	56608	68532	61500	66026
3260-1	-	-	-	-	-	-	-	-	-	-	-	-		63836	60676	58091	68909	238155	201688	57849	56915	56608	68532	61500	66026
3260-1	-	-	-	-	-	-	-	-	-	-	-	-	3135-4	YY	-	XX	YY	XY	-	XY	XY	YY	XX	-	YY
3135-5	-	-	-	-	-	-	-	-	-	-	-	-	3135-4	YY	-	XX	YY	XY	-	XY	XY	YY	XX	-	YY
3135-5	-	-	-	-	-	-	-	-	-	-	-	-	3135-6	-	-	-	-	-	-	-	-	-	-	-	-
3106-4	YY	-Y	XX	YY	-	XX	XX	XX	-	XX	YY	XX	3135-6	-	-	-	-	-	-	-	-	-	-	-	-
3106-4	YY	-Y	XX	YY	-	XX	XX	XX	-	XX	YY	XX	3106-2	XY	-	-	-	-	-	-	-	-	-	-	X-
3106-7	-	-	XX	XX	-	-	XX	-	-	-	-	XX	3106-2	XY	-	-	-	-	-	-	-	-	-	-	X-

表8：组C的受损核酸样品的来源
表8：组C的受损核酸样品的来源				样品号	样品类型	尝试的SNP数	成功的SNP数
3260-1	河岸边发现的骨	60	4	样品号	样品类型	尝试的SNP数	成功的SNP数
3260-1	河岸边发现的骨	60	4	3135-4	取自车中的毛发(漂白的)	60	35
3135-5	取自车中的毛发(漂白的)	60	7	3135-4	取自车中的毛发(漂白的)	60	35
3135-5	取自车中的毛发(漂白的)	60	7	3135-6	取自车中的毛发(漂白的)	60	2
3106-4	毛发(参比)	60	31	3135-6	取自车中的毛发(漂白的)	60	2
3106-4	毛发(参比)	60	31	3106-2	真空吸尘中的可能毛发(非裔美国人)	60	10
3106-7	来自项链的拭样	60	25	3106-2	真空吸尘中的可能毛发(非裔美国人)	60	10

表9.受损DNA样品的结果
表9.受损DNA样品的结果						样品号	AMEL.	STR数	尝试的SNP数	成功的SNP数	SNP谱的频率
231965	XY	3	60	12	13,908	样品号	AMEL.	STR数	尝试的SNP数	成功的SNP数	SNP谱的频率
231965	XY	3	60	12	13,908	12792	X	1	48	31	1.22×109
12793	XY	1	24	17	37,594	12792	X	1	48	31	1.22×109
12793	XY	1	24	17	37,594	14704	X	5	24	17	N.D.
14686	XY	3	24	18	N.D.	14704	X	5	24	17	N.D.
14686	XY	3	24	18	N.D.	231749	XY	1	60	45	1.4×1010
14700	XY	5	60	56	N.D.	231749	XY	1	60	45	1.4×1010
14700	XY	5	60	56	N.D.	14775	XX	4	60	57	N.D.
232121	XX	6	60	59	N.D.	14775	XX	4	60	57	N.D.
232121	XX	6	60	59	N.D.	231770	XY	2	60	60	1.78×1022

表10.用本发明的组分析的受损核酸
表10.用本发明的组分析的受损核酸					样品号	PROT+	COF	尝试的SNP数	成功的SNP数
524-3A	1个基因座	只是XY	71	63	样品号	PROT+	COF	尝试的SNP数	成功的SNP数
524-3A	1个基因座	只是XY	71	63	590-2A	3个基因座	只是XY	71	68
617-1A	只是XY	只是XY	71	53	590-2A	3个基因座	只是XY	71	68
617-1A	只是XY	只是XY	71	53	660-1A	只是XY	NEG	71	55
667-1A	NEG	只是XY	71	64	660-1A	只是XY	NEG	71	55
667-1A	NEG	只是XY	71	64	1268-1A	NEG	只是XY	71	65
1300-1A	NEG	NEG	71	16	1268-1A	NEG	只是XY	71	65
1300-1A	NEG	NEG	71	16	1337-2A	4个基因座	2个基因座	71	70
1233-1A	NEG	NEG	71	65	1337-2A	4个基因座	2个基因座	71	70
1233-1A	NEG	NEG	71	65	1473-2A	4个基因座	1个基因座	71	68
1476-1A	NEG	1个基因座	71	63	1473-2A	4个基因座	1个基因座	71	68
1476-1A	NEG	1个基因座	71	63	1477-1A	2个基因座	3个基因座	71	59
1462-1A	1个基因座	NEG	71	63	1477-1A	2个基因座	3个基因座	71	59
1462-1A	1个基因座	NEG	71	63	1514-1A	NEG	NEG	71	47
1526-1A	NEG	只是XY	71	57	1514-1A	NEG	NEG	71	47
1526-1A	NEG	只是XY	71	57	1650-2A	4个基因座	2个基因座	71	68
1747-1A	1个基因座	NEG	71	67	1650-2A	4个基因座	2个基因座	71	68
1747-1A	1个基因座	NEG	71	67	1818-1A	4个基因座	2个基因座	71	68
1819-1A	只是XY	只是XY	71	71	1818-1A	4个基因座	2个基因座	71	68
1819-1A	只是XY	只是XY	71	71	1945-1A	1个基因座	NEG	71	50
1946-1A	4个基因座	2个基因座	71	63	1945-1A	1个基因座	NEG	71	50
1946-1A	4个基因座	2个基因座	71	63	2163-1B	6个基因座	4个基因座	71	68
2181-1B	NEG	NEG	71	62	2163-1B	6个基因座	4个基因座	71	68

表11.总结44个人的研究-24640个可能的基因型
表11.总结44个人的研究-24640个可能的基因型					DNA量	使用70个SNP的失败数	％全部	错误分型数	％全部
2ng	81	97.37	0	100	DNA量	使用70个SNP的失败数	％全部	错误分型数	％全部
2ng	81	97.37	0	100	320pg	159	94.84	4	99.86
240pg	145	95.29	9	99.69	320pg	159	94.84	4	99.86
240pg	145	95.29	9	99.69	160pg	75	97.56	9	99.7
80pg	140	95.45	12	99.55	160pg	75	97.56	9	99.7
80pg	140	95.45	12	99.55	40pg	223	92.76	63	97.79
20pg	458	85.13	146	94.43	40pg	223	92.76	63	97.79
20pg	458	85.13	146	94.43	10pg	1090	64.64	220	88.95
	2370	90.38	463	97.92	10pg	1090	64.64	220	88.95
	2370	90.38	463	97.92

虽然本发明已经结合其特定实施方案进行了描述，可以理解能够进行进一步的修改，而且本申请目的是涵盖本发明的任何改变、使用和修改，这通常根据发明的原理并包括在本发明所属领域内已知或习惯性实践中对本发明内容的偏离，如对于前面列举的必要特征以及附加的权利要求列出的保护范围。

Claims

1.一组用于分析受损核酸样品的单核苷酸多态性，其包括两种或多种单核苷酸多态性，其中该组两种或多种单核苷酸多态性的每一种选自彼此不遗传连锁的单核苷酸多态性，且其中该组两种或多种单核苷酸多态性的每一种选自位于串联重复核酸序列之外的单核苷酸多态性。

2.根据权利要求1的组，其中所述单核苷酸多态性包括选自由SEQ ID NO.25-36、61-72、98-109、134-145、170-181、206-217、242-253、278-289、314-325、351-362、387-398、423-434和457-467组成的组中的核酸序列。

3.一种从感兴趣的群体中产生用于分析受损核酸样品的一组单核苷酸多态性的方法，包括：

在感兴趣的群体的基因组中选择一组两种或多种单核苷酸多态性，其中该组两种或多种单核苷酸多态性的每一种是彼此不遗传连锁的基因组的单核苷酸多态性，且其中该组两种或多种单核苷酸多态性的每一种是位于串联重复核酸序列之外的基因组的单核苷酸多态性，由此从感兴趣的群体中产生该组单核苷酸多态性用于分析受损核酸样品。

4.根据权利要求3的方法，其中所述受损样品包括长度为大约10个核苷酸至大约100个核苷酸的核酸。

5.根据权利要求3的方法，其中所述感兴趣的群体是人类。

6.根据权利要求3的方法，其中所述感兴趣的群体是一个失踪的人。

7.一种从受损核酸的未知样品确定个体身份的方法，包括：

从个体中获得具有两种或多种单核苷酸多态性的受损核酸的未知样品；

鉴定存在于受损核酸的未知样品中的两种或多种单核苷酸多态性；

将受损样品中两种或多种单核苷酸多态性的每一种的性质和来自己知样品的一组单核苷酸多态性进行比较，以确定未知样品的两种或多种单核苷酸多态性的每一种和所述组之间的匹配数目，其中所述组包括两种或多种彼此不遗传连锁、并位于串联重复核酸序列之外的单核苷酸多态性；及

根据未知样品中两种或多种单核苷酸多态性的每一种和已知样品之间的匹配数目确定未知样品和已知样品来自相同或相关个体的概率，由此从受损核酸未知样品确定个体的身份。

8.一种从受损核酸的未知样品确定个体身份的方法，包括：

从个体获得具有两种或多种单核苷酸多态性的受损核酸的未知样品；

获得具有两种或多种单核苷酸多态性的核酸的已知样品；

选择一组两种或多种单核苷酸多态性，其中该组两种或多种单核苷酸多态性的每一种彼此不遗传连锁，并且其中该组单核苷酸多态性的每一种位于串联重复核酸序列之外；

确定受损核酸样品中存在的该组两种或多种单核苷酸多态性的每一种的性质；以及

确定已知样品中存在的该组两种或多种单核苷酸多态性的每一种的性质；

比较在已知样品中观察到的该组两种或多种单核苷酸多态性的性质与在受损核酸的未知样品中观察到的该组两种或多种单核苷酸多态性的性质；以及

确定未知样品和已知样品来自相同或相关个体的概率，因而确定受损核酸的未知样品的个体身份。

9.根据权利要求7的方法，其中所述已知样品和未知样品来自相同个体。

10.根据权利要求7的方法，其中所述已知样品来自一个家族成员。

11.根据权利要求7的方法，其中所述受损核酸样品包括长度为大约10个核苷酸至大约100个核苷酸的核酸片段。

12.根据权利要求7的方法，其中使用单碱基引物延伸反应确定一或多个单核苷酸多态性的性质。

13.根据权利要求7的方法，其中受损样品的两种或多种单核苷酸多态性在一多重反应中鉴定。

14.根据权利要求7的方法，其中该组两种或多种单核苷酸多态性在一多重反应中鉴定。

15.根据权利要求7的方法，其中该组两种或多种单核苷酸多态性在一阵列中鉴定。

16.根据权利要求7的方法，其中受损样品的两种或多种单核苷酸多态性在一阵列中鉴定。

17.根据权利要求15的方法，其中所述阵列是可寻址阵列。

18.根据权利要求16的方法，其中所述阵列是可寻址阵列。

19.根据权利要求15的方法，其中所述阵列是虚拟阵列。

20.根据权利要求16的方法，其中所述阵列是虚拟阵列。

21.一种对受损核酸样品进行基因分型的方法，包括：

从个体获得受损核酸样品；

鉴定存在于受损核酸样品中的两种或多种单核苷酸多态性；及

将受损样品中的两种或多种单核苷酸多态性的每一种的性质与来自感兴趣的群体的一组单核苷酸多态性进行比较，以确定受损样品中的两种或多种单核苷酸多态性的每一种在感兴趣的群体中的出现频率，其中所述组包括两种或多种彼此不遗传连锁、并位于串联重复核酸序列之外的单核苷酸多态性；由此对受损核酸样品进行基因分型。

22.一种对受损核酸样品进行基因分型的方法，包括：

从个体获得受损核酸样品；

从感兴趣的群体基因组中选择一组单核苷酸多态性，所述组包括两种或多种单核苷酸多态性，其中该组两种或多种单核苷酸多态性的每一种彼此不遗传连锁、并位于串联重复核酸序列之外；

鉴定在受损核酸样品中存在的两种或多种单核苷酸多态性；及

将在受损样品中观察到的两种或多种单核苷酸多态性的性质与在所述组中观察到的两种或多种单核苷酸多态性的性质进行比较，以确定基因型，从而获得受损核酸样品的基因型。

23.根据权利要求22的基因分型的方法，其中所述单核苷酸多态性是双等位基因的，且单核苷酸多态性的等位基因的性质是T和/或C。

24.根据权利要求22的基因分型的方法，其中所述感兴趣的群体是人类。

25.根据权利要求22的基因分型的方法，其中所述样品包括人类核酸。

26.根据权利要求22的基因分型的方法，其中所述受损核酸样品中存在的两种或多种单核苷酸多态性使用单碱基引物延伸反应鉴定。

27.根据权利要求22的基因分型的方法，其中在受损核酸样品中存在的两种或多种单核苷酸多态性在一多重反应中鉴定。

28.根据权利要求22的基因分型的方法，其中在受损核酸样品中存在的两种或多种单核苷酸多态性在一阵列上鉴定。

29.根据权利要求28的基因分型的方法，其中所述阵列是可寻址阵列。

30.根据权利要求28的基因分型的方法，其中所述阵列是虚拟阵列。

31.根据权利要求22的基因分型的方法，其中所述受损核酸样品扩增至长度为大约10个核苷酸至大约100个核苷酸。