CN1723217A - 使用单核苷酸多态性组分析受损样品的方法和组合物 - Google Patents

使用单核苷酸多态性组分析受损样品的方法和组合物 Download PDF

Info

Publication number
CN1723217A
CN1723217A CNA038205491A CN03820549A CN1723217A CN 1723217 A CN1723217 A CN 1723217A CN A038205491 A CNA038205491 A CN A038205491A CN 03820549 A CN03820549 A CN 03820549A CN 1723217 A CN1723217 A CN 1723217A
Authority
CN
China
Prior art keywords
nucleic acid
snp
snps
sample
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA038205491A
Other languages
English (en)
Other versions
CN100354298C (zh
Inventor
罗伯特·贾尔斯
雅尼娜·M.·贝施
布赖恩·麦基翁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orchid Cellmark Inc
Original Assignee
Orchid Biosciences Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Orchid Biosciences Inc filed Critical Orchid Biosciences Inc
Publication of CN1723217A publication Critical patent/CN1723217A/zh
Application granted granted Critical
Publication of CN100354298C publication Critical patent/CN100354298C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6881Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for tissue or cell typing, e.g. human leukocyte antigen [HLA] probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Cell Biology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了分析受损核酸样品的方法和组合物。本发明还包括选择一组(a panel of)单核苷酸多态性的方法和该组单核苷酸多态性,选择该组单核苷酸多态性使其位于串联重复区域之外,并且不遗传连锁。

Description

使用单核苷酸多态性组分析受损样品的方法和组合物
技术领域
本发明涉及分析受损样品(compromised sample)的方法和组合物。
背景技术
经典遗传学、基因由核酸序列限定的发现、遗传物质结构的发现以及生物技术革命产生了通过核酸分析进行的人类鉴定科学。能够从完整的遗传物质样品高度可信地鉴定核酸样品来源的***已经迈了很大一步。
可以使用多种核酸分析技术用于揭示核酸样品之间的遗传相似性。例如,在基因组中存在的高度多态性重复序列可以用于遗传鉴定应用。这些应用可以在群体中高度可信地鉴定个体。一个重要的应用依赖于多态性串联重复基因座的分析。遗传鉴定应用的一个例子是FBI的组合DNA指数***或称CODIS,其使用13个多态性短串联重复基因座用于遗传鉴定。
串联重复基因座是基因组中的基因座,其含有变化长度的核苷酸序列的重复单位,如双核苷酸重复、三核苷酸重复、四核苷酸重复等等。重复单位的长度可从小至2个核苷酸变化至极大数目的核苷酸。重复可以是简单的串联序列重复或其复杂组合。在这种基因座的这些重复的长度或特性的改变称为这些基因座的多态性。这样的多态性最常起因于群体中的个体之间在一个基因座存在不同数目的这种重复。通过某些评估,串联重复在人类基因组中存在的平均频率为大约15000碱基。等位基因的数目,或在一个基因座的序列重复的多样性通常在大约少至3或4个到多至15或多至50甚至更多之间变化。其相对高的出现频率,以及显著程度的多态性使基因组的这些特征成为遗传鉴定应用的有吸引力的候选物。通过在核酸的非受损样品中测定足够数目的多态性串联重复基因座,并比较该个体的基因座的特性和来自第二个个体的参比样品中相同基因座的特性,可以确定所述个体是否与获得参比样品的第二个个体遗传相关。一般说来,在遗传鉴定应用中使用的多态性重复基因座的选择是使得它们彼此不连锁,或处于Hardy-Weinberg平衡。
在遗传鉴定应用中使用多种类型的串联重复基因座。短串联重复(STR)来自于核酸序列的短序列段的数目变化。在人类基因组中,认为STR在每几十万个碱基中出现一次。STR包括大约2-7个碱基,并且根据其含有的重复单位的数目而变化,并且其以简单和复杂重复存在。串联重复的另一种类型,小卫星重复,通常大约为10至50左右的碱基重复大约20-50次。微卫星重复通常为大约1-6碱基重复,多至6或多次。这些重复在基因组中可以发生成千上万次。对串联重复基因座的命名法是不准确的。这些和其它的串联重复可以用概括性的广义术语可变数目串联重复或VNTR来表示。
使用VNTR的遗传鉴定应用可以使用限制片段长度多态性分析(RFLP分析),一种基于凝胶的方法,或基于聚合酶链反应(PCR)的方法。RFLP分析利用了通过使用限制性内切核酸酶从非受损核酸样品中产生的核酸片段之间的长度差异。限制性内切核酸酶,简称内切核酸酶,是在高度可预测位置片段化或切割核酸的酶。如果两种完整的核酸样品被相同的内切核酸酶切割,如果它们的遗传序列是相同的,那么它们的片段化模式将是相同的。如果样品不同,则部分基于在某些位置的切割位点的选择,它们将产生不同的片段,这些位置的切割位点的选择使得根据在预测片段的切割位点内或切割位点处多态性串联重复基因座的出现,将产生预计不同的片段大小。如许多使用串联重复基因座的遗传鉴定应用一样,RFLP分析依赖于基于核酸片段通过大小分离凝胶(sizing gel)的电泳迁移或基于其它的大小分离方案来分离或分辨核酸片段的能力。然而,基于大小分离的方案由于大小分离方法的分辨能力而固有地被限制;太小或大小上仅轻微不同的片段是不可分辨的。尽管RFLP分析是潜在的强有力的遗传鉴定应用,但其通常需要相当完整的核酸样品。而且,RFLP分析需要相当量的核酸,并需要相对长的时间以产生和解释结果。
使用串联重复基因座和PCR的遗传鉴定应用需要较少的核酸。在基于PCR的应用中,含有具有串联重复序列的基因座的序列被扩增或被复制许多次,然后通常使用大小分离方案分离和鉴定。然而,由于PCR聚合酶的属性以及串联重复基因座的属性,由于PCR扩增过程中的“打滑(slippage)”或“口吃(stutter)”,PCR方法倾向于出现人为结果。这种打滑或口吃是由于聚合酶不能忠实和准确地复制含有串联重复的序列所致。串联重复序列的属性有时引起PCR聚合酶跳过重复单位元件而有时引起过度复制重复单位元件。结果,含有串联重复的序列的扩增拷贝比原始序列长或短,因此不能提供遗传鉴定应用所需要的忠实度。而且,大多数基于PCR的应用依赖于大小分离方法进行鉴定,因此在这一方面有与RFLP分析一样的缺点。由于许多有用的串联重复基因座的长度,扩增或复制的序列一般必须有至少接近100并多至1000或更多个碱基的长度。受损的核酸样品不一定如此完整到含有用于遗传鉴定应用的足够数目的串联重复基因座。
由于含有不确定身份(identity)或起源的核酸的样品的受损属性,使用现有的遗传鉴定应用常常不可能。许多因素导致不能从受损样品中提取遗传信息。样品可能已经暴露于物理作用,如热或剪切力,来自例如太阳的紫外线。样品可能经受过多的化学降解剂,以及许多生物降解过程,例如,暴露于微生物或核酸酶。这些过程可能导致样品含有的基因座数量比用于遗传分析的完整的有用基因座的最佳数量要少,导致受损样品没有足够的信息用于目前使用的遗传鉴定应用。
因此,仍然需要用于受损的核酸样品的遗传鉴定应用,其应该不必需依赖于大小分离方案而进行鉴定,以及不依赖于用于鉴定目的的足够的串联重复基因座的存在。
发明简述
在一个实施方案中,本发明包括一组(a panel of)用于从受损样品确定人身份的单核苷酸多态性。在本发明的另一个实施方案中,该组单核苷酸多态性包括选自如下一组中的核酸序列:SEQ ID NOS.25-36、61-72、98-109、134-145、170-181、206-217、242-253、278-289、314-325、351-362、387-398、423-434和457-467。
在另一个实施方案中,本发明包括一种从感兴趣的群体产生一组用于分析受损的核酸样品的单核苷酸多态性的方法,包括:在感兴趣的群体的基因组中选择一组两种或多种单核苷酸多态性,其中该组两种或多种单核苷酸多态性的每一种均是彼此不遗传连锁的基因组单核苷酸多态性,且其中该组两种或多种单核苷酸多态性的每一种均是位于串联重复核酸序列之外的基因组单核苷酸多态性,由此从感兴趣的的群体产生用于分析受损的核酸样品的该组单核苷酸多态性。在另一个实施方案中,本发明包括一种方法,其中所述受损样品包括长度为大约10个核苷酸至大约100个核苷酸的核酸。在另一个实施方案中,使用的方法中所述感兴趣的群体是人类。在另一个实施方案中,本发明使用的方法中的感兴趣的群体是一个失踪(missing)的人。
在另一个实施方案中,本发明包括一种从受损的核酸未知样品中确定个体身份的方法,包括:从个体获得具有两种或多种单核苷酸多态性的受损核酸的未知样品;鉴定存在于受损核酸未知样品中的两种或多种单核苷酸多态性;将受损样品中两种或多种单核苷酸多态性的每一种的性质与已知样品的一组单核苷酸多态性进行比较,以确定在未知样品中的两种或多种单核苷酸多态性的每一种和所述组之间的匹配数目,其中所述组包括两种或多种彼此不遗传连锁、并位于串联重复核酸序列之外的单核苷酸多态性;并根据未知样品和已知样品中两种或多种单核苷酸多态性的每一种之间匹配的数目确定未知样品和已知样品来自相同或相关个体的概率,因此从受损核酸未知样品确定个体的身份。
本发明的另一个实施方案包括一种从受损核酸未知样品确定个体身份的方法,包括:从个体获得具有两种或多种单核苷酸多态性的受损核酸的未知样品;获得具有两种或多种单核苷酸多态性的核酸的已知样品;选择一组两种或多种单核苷酸多态性,其中该组两种或多种单核苷酸多态性的每一种彼此不遗传连锁,并且其中该组的单核苷酸多态性的每一种均位于串联重复核酸序列之外;确定受损核酸样品中存在的该组两种或多种单核苷酸多态性的每一种的性质;确定已知样品中存在的该组两种或多种单核苷酸多态性的每一种的性质;比较在已知样品中观察到的该组两种或多种单核苷酸多态性的性质与在受损核酸的未知样品中观察到的该组两种或多种单核苷酸多态性的性质;并确定未知样品和已知样品来自相同或相关个体的概率,因此从受损核酸的未知样品确定个体的身份。
在本发明的另一个实施方案中,已知样品和未知样品来自相同个体。本发明的另一个实施方案包括已知样品来自一个家族成员的方法。在另一个实施方案中,所述受损核酸样品包括长度为大约10个核苷酸至大约100个核苷酸的核酸片段。在另一个实施方案中,使用单碱基引物延伸反应确定一或多个单核苷酸多态性的性质。在另一个实施方案中,受损样品的两种或多种单核苷酸多态性在一多重反应中鉴定。在另一个实施方案中,该组两种或多种单核苷酸多态性在一多重反应中鉴定。在另一个实施方案中,该组两种或多种单核苷酸多态性在一阵列中鉴定。在另一个实施方案中,受损样品的两种或多种单核苷酸多态性在一阵列中鉴定。在另一个实施方案中,所述阵列是可寻址阵列。在另一个实施方案中,所述阵列是可寻址阵列。在另一个实施方案中,所述阵列是虚拟(virtual)阵列。在另一个实施方案中,所述阵列是虚拟阵列。
在另一个实施方案中,本发明包括一种对受损核酸样品基因分型的方法,包括:从个体获得受损核酸样品;鉴定存在于受损核酸样品中的两种或多种单核苷酸多态性;并将受损样品中的两种或多种单核苷酸多态性的每一种的性质与一感兴趣群体的一组单核苷酸多态性进行比较,以确定受损样品中的所述两种或多种单核苷酸多态性的每一种在感兴趣的群体中的发生频率,其中所述组包括两种或多种彼此不遗传连锁、并位于串联重复核酸序列之外的单核苷酸多态性;由此对受损核酸样品基因分型。
在另一个实施方案中,本发明包括一种对受损核酸样品基因分型的方法,包括:从个体获得受损核酸样品;从感兴趣的群体基因组选择一组单核苷酸多态性,所述组包括两种或多种单核苷酸多态性,其中该组两种或多种单核苷酸多态性的每一种彼此不遗传连锁、并位于串联重复核酸序列之外;鉴定受损核酸样品中存在的两种或多种单核苷酸多态性;并将在受损样品中观察到的两种或多种单核苷酸多态性的性质与在该组中观察到的两种或多种单核苷酸多态性的性质进行比较以确定基因型,从而获得受损核酸样品基因型。一个进一步的实施方案包括一种基因分型方法,其中所述组的单核苷酸多态性是双等位基因的(biallelic),其中每一等位基因中的多态性性质是T和/或C。在另一个实施方案中,本发明包括一种基因分型方法,其中所述感兴趣的群体是人类。一个进一步的实施方案包括一种基因分型方法,其中所述样品包括人类核酸。另一个实施方案包括一种基因分型方法,其中所述受损核酸样品中存在的两种或多种单核苷酸多态性使用一单碱基引物延伸反应鉴定。另一个实施方案包括一种基因分型方法,其中受损核酸样品中存在的两种或多种单核苷酸多态性在一多重反应中鉴定。另一个实施方案包括一种基因分型方法,其中受损核酸样品中存在的两种或多种单核苷酸多态性在一阵列上鉴定。一个进一步的实施方案包括一种基因分型方法,其中所述阵列是可寻址阵列。仍然另一个实施方案包括一种基因分型方法,其中所述阵列是虚拟阵列。仍然另一个实施方案包括一种基因分型方法,其中所述受损核酸样品扩增至长度为大约10个核苷酸至大约100个核苷酸。
为了更好的理解本发明以及其它和进一步的优点和实施方案,以下结合描述实施例进行参考,保护范围在附加的权利要求中。
附图说明
图1描述了本发明的一个实施方案,其中获得受损的核酸样品;使用受损样品的核酸作为模板扩增含有单核苷酸多态性或称SNP的核酸;将扩增的含有单核苷酸多态性的核酸进行引物延伸反应,其中引物延伸一个单碱基,例如一个标记的核苷酸衍生物;确定扩增核酸的单核苷酸多态性的性质;将来自扩增核酸的每个单核苷酸多态性的性质与参比样品中的每一对应的单核苷酸多态性的性质进行比较;并确定受损样品的核酸与参比样品的核酸遗传相似的可能性。
优选实施方案详述
现在将结合优选实施方案描述本发明。这些实施方案是为了帮助理解本发明,而无意并且也不应该以任何方式限制本发明。所有的可选择方案、修改以及等同物对本领域技术人员来说在阅读完本发明的公开后将是显而易见的,并且包含在本发明的范围和精神之内。
本公开不是分析受损核酸的引物,对本领域技术人员来说已知的或容易确定的基本概念没有详细描述。
在一个实施方案中,本发明包括一组用于分析受损核酸样品的单核苷酸多态性,其包括两种或多种单核苷酸多态性,其中该组两种或多种单核苷酸多态性的每一种选自彼此不遗传连锁的单核苷酸多态性,且其中该组两种或多种单核苷酸多态性的每一种选自位于串联重复核酸序列之外的单核苷酸多态性。
“组(panel)”表示一组预选的适用于鉴定群体的一个成员的单核苷酸多态性。例如,在一个优选的实施方案中,所述的组包括一些从人类基因组的单核苷酸多态性预选的单核苷酸多态性,其中所述单核苷酸多态性的数量和特性足以将一个个体遗传鉴定到统计学可信的程度。遗传鉴定包括通过观察该组单核苷酸多态性的性质在群体中将一个个体与另一个体区别的能力。例如,通过将组中的单核苷酸多态性的性质与含有该组全部或一些单核苷酸多态性的受损样品进行比较而区别一个个体与另一个个体。遗传鉴定包括在具有统计学可信度的程度上确定受损样品中的单核苷酸多态性与参比样品中的单核苷酸多态性是否相同或是否不同。所述参比样品可以,例如,包含来自另一个个体如一个家族成员的核酸。“遗传鉴定”还指在统计学可信度的程度上确定受损样品中的单核苷酸与一个以上的参比样品的单核苷酸多态性是否相同或是否不同。例如,受损样品的单核苷酸多态性可以与一组参比样品例如假定的家族成员中的单核苷酸多态性进行比较,以确定受损样品的核酸是否来自与获取所述一或多种参比样品的个体遗传相关的一个或多个个体。
“比较”单核苷酸多态性表示确定一个样品的单核苷酸多态性是否与另一个样品的单核苷酸多态性相同或不同,其中这两个样品中的一个是受损样品或两个都是受损样品,或者一个样品是受损样品而另一个样品是参比样品。
参比样品可以包括从取自一或多个供体个体的生物材料中确定的单核苷酸多态性,其中所述单核苷酸多态性的性质是从所述生物材料中确定的。参比样品可以是以任何方式确定其性质的单核苷酸多态性的任何集合。例如,参比样品可以是这样的单核苷酸多态性的集合,其无须通过直接从核酸的生物样品中确定其性质而确定其存在,,而是例如通过从蛋白中推导核苷酸序列而产生的,或者通过在一组家族成员中观察单核苷酸多态性而产生单核苷酸多态性。例如,一个参比样品包括家族成员的预期基因型,而预期的家族成员的基因型是通过观察其它家族成员的基因型并使用本领域熟知的遗传算法和理论,获得家族成员的预期基因型而产生的。与本发明的实施方案相关的是,这样的预期基因型包括一组由家族成员的基因型和通过使用本领域已知的遗传算法和理论推导的预期家族成员会展示的单核苷酸多态性的性质。
以“统计学可信度的程度”鉴定个体是指建立受损样品与参比样品或另一受损样品遗传相关的统计学可信度的程度。为了获得该结果,在遗传鉴定领域中已知有多种方法。在一给定的例子中,为了达到统计学可信度,使用的算法和方法可以不同。例如,一组单核苷酸多态性在两个样品之间或者一个样品和一个参比样品之间相同时,统计学可信度的程度可以从与样品中的或每一基因座的每一等位基因相关的个体概率计算。
如果可以从统计学可信度的程度说样品来自限定的感兴趣的群体,那么一受损样品与另一受损样品或参比样品是“遗传相关的”。“限定的感兴趣的群体”是指在其基因组中共享某些特征的一组感兴趣的个体,例如,家族成员、种族如亚洲人、非洲人、土著美国人等等。“限定的感兴趣的群体”可以小至单个个体,或可以多至在人类种群中的所有女性或所有男性。因此,例如,如果限定的感兴趣的群体由所有亚洲人组成,那么来自亚洲种系的男性个体的受损样品可以是与亚洲女性同胞“遗传相关的”,但如果限定的感兴趣的群体仅由亚洲男性组成,那么这种情况下该男性个体的受损样品将将不能被认为是与亚洲女性同胞“遗传相关的”。
“受损的核酸样品”是指已知含有或怀疑含有核酸的生物样品,其中样品的核酸是被过度降解的。例如,用不含足量的完整的法医上有用的串联重复序列的片段组成的核酸样品是不能可靠地使用串联重复位点分析,例如使用依赖于CODIS基因座的鉴定***,完成核酸样品的遗传分析的。实际中,核酸样品,特别是用于法医分析的核酸样品可能是明显降解的。该样品可能已经暴露于物理作用,如热或剪切力,来自例如太阳的紫外线。样品可能已经受过多的化学降解过程。样品可能已经受到多种生物降解过程,例如,如暴露于微生物或核酸酶。这些过程可能导致样品含有低于可适于使用本领域已知的、并非利用单核苷酸多态性的遗传分析的最佳数量的完整有用基因座,由此使受损样品不能作为目前应用的遗传鉴定应用的有用信息。在本发明的一个优选的实施方案中,受损核酸样品包括长度为大约10个核苷酸至大约100个核苷酸的核酸。最优选地,受损核酸样品基本由长度为至少50个至至少大约100个核苷酸的核酸片段组成。实践中,受损样品甚至可能含有短至长度为一或两个核苷酸的核酸片段,只要在样品中存在足够的长度为10至100核苷酸的核酸,则该样品就携带了足够的单核苷酸多态性以对样品进行基因分析或以统计学可信度的程度鉴定个体。同样,受损样品可能含有长度超过100个核苷酸的核苷酸片段。
“彼此不遗传连锁”是指选择本发明的单核苷酸多态性以便如果它们位于相同的染色体和核酸分子上相互相距一个所需的距离。优选地,选择的一组单核苷酸多态性相距大约10至15兆个碱基。最优选地,一组单核苷酸多态性相距大约20至100或更多兆个碱基。合适的单核苷酸多态性包括彼此不是连锁不平衡的那些,虽然也不需要任何组的任何单核苷酸多态性存在完全的平衡。合适的一组单核苷酸多态性包括互相遗传独立的那些。也就是说,合适的单核苷酸多态性包括其中没有一个组的两个单核苷酸多态性总是一起遗传的那些。
串联重复基因座是基因组中的基因座,其含有变化长度的核苷酸序列的重复单位,如双核苷酸重复、三核苷酸重复、四核苷酸重复等等。重复单位的长度从小至2个核苷酸变化至极大数目的核苷酸。重复可以是简单的串联序列重复或其复杂组合。在这种基因座的这些重复的长度或特性的改变称为在这些基因座的多态性。这样的多态性最常起因于群体中的个体之间在一个基因座存在变化数目的这样的重复。通过某些评估,串联重复在人类基因组中存在的平均频率为大约15000碱基。在一个基因座的等位基因的数目或序列重复的多样性通常在大约少至3或4个到多至15或多至50或更多之间变化。其相对高的出现频率,以及显著程度的多态性使基因组的这些特征成为遗传鉴定应用的有吸引力的候选物。通过在核酸的非受损样品中检测足够数目的多态性串联重复基因座,并比较该个体的基因座的特性和来自第二个个体的参比样品中相同基因座的特性,可以确定所述个体是否与获得参比样品的第二个个体遗传相关。一般说来,在遗传鉴定应用中使用的多态性重复基因座的选择是使得彼此不连锁,或处于Hardy-Weinberg平衡。
在遗传鉴定应用中使用多种类型的串联重复基因座。短串联重复(STR)归因于短的核酸序列段数目的变化。在人类基因组中认为STR在每几十万个碱基中出现大约一次。STR大约为2-7个碱基,并且其含有的重复单位的数目可变,而且以简单和复杂重复存在。另一种类型的串联重复,小卫星重复,通常大约为10至50个左右碱基,重复大约20-50次。微卫星重复通常为大约1-6个碱基,重复多至6或多次。这些重复在基因组中可以出现成千上万次。对串联重复位点的命名法是不准确的。这些和其它的串联重复可以用通用的广义术语可变数目串联重复,或称VNTR来表示。
本发明的另一个实施方案包括一种从感兴趣的群体中产生一组单核苷酸多态性用于分析受损核酸样品的方法,包括:在感兴趣的群体的基因组中选择一组两种或多种单核苷酸多态性,其中所述一组两种或多种单核苷酸多态性的每一种是彼此不遗传连锁的基因组的单核苷酸多态性,且其中所述一组两种或多种单核苷酸多态性的每一种都是位于串联重复核酸序列之外的基因组的单核苷酸多态性,由此从感兴趣的群体中产生一组单核苷酸多态性用于分析受损核酸样品。
“产生一组单核苷酸多态性”是指从感兴趣的基因组中选择合适的单核苷酸多态性的方法,其中所述单核苷酸多态性用于遗传分析或鉴定。产生一组单核苷酸多态性包括选择本发明的位于串联重复核酸区域之外、并且彼此不遗传连锁的单核苷酸多态性。然后通过本领域已知的任何方法分析所述单核苷酸多态性以便选择能够在一多重反应中鉴定单核苷酸多态性的引物。该分析通常包括,例如选择多态性,其中所述检测引物和扩增引物将有相同或相似的解链和退火温度,用于扩增和单碱基延伸反应。
可以使用一或多种组分析含有受损核酸的单一样品。选择本发明的单核苷酸多态性以便在如果它们位于相同的染色体和核酸分子上时互相之间相距所需的距离。优选地,选择一组单核苷酸多态性以便相距大约10至15兆碱基。最优选地,一组单核苷酸多态性相距大约20至大约100或更多兆碱基。合适的单核苷酸多态性包括互相不是连锁不平衡的那些,虽然不需要任何组的任何单核苷酸多态性都处于完全平衡。合适的一组单核苷酸多态性包括互相遗传独立的那些。也就是说,合适的单核苷酸多态性包括其中没有一个组的两个单核苷酸多态性总是一起遗传的那些。最优选地,所述组的单核苷酸多态性是双等位基因的。最优选地,组的单核苷酸多态性的等位基因的性质全是T/C。
本发明的另一个实施方案包括一种从受损核酸的未知样品中确定个体身份的方法,包括:从个体获得具有两种或多种单核苷酸多态性的受损核酸的未知样品;鉴定存在于受损核酸的未知样品中的两种或多种单核苷酸多态性;将受损样品中的两种或多种单核苷酸多态性的每一种的性质和已知样品的一组单核苷酸多态性进行比较,以确定在未知样品中的两种或多种单核苷酸多态性的每一种和组之间匹配的数目,其中所述组包括两种或多种彼此不遗传连锁、并位于串联重复核酸序列之外的单核苷酸多态性;并根据未知样品和已知样品中两种或多种单核苷酸多态性的每一种之间匹配的数目确定未知样品和已知样品来自相同或相关个体的概率,因此从受损核酸的未知样品确定个体的身份。
“确定个体的身份”是指确定感兴趣的个体的特性。在一个优选的实施方案中,“确定个体的身份”是指在高度统计学可信度的程度上确定个体是感兴趣群体中的哪一个,以排除感兴趣的群体中的所有其它个体。在最优选的实施方案中,“确定个体的身份”包括具有高度统计学可信度的从整个人类群体中鉴定单一个体。最优选地,统计学可信度的程度是十亿中的一个或更高。这样程度的可信度是用大约三十个单核苷酸多态性获得的。然而,可以使用本发明,其中所述受损样品与参比样品比较,其中“确定个体的身份”需要低得多程度的统计学可信度。
“未知样品”是指已知物质或怀疑含有受损核酸的物质的样品,其中受损核酸来源的个体的身份是未知的,或未以期望程度的统计学可信度已知。
对一个受损样品中的单核苷酸多态性与另一个受损样品或参比样品中的单核苷酸多态性进行“性质比较”是指确定在一个样品中的单核苷酸多态性位点的核苷酸与在第二个样品中相同的单核苷酸多态性位点的核苷酸是否相同。对分析的每一个单核苷酸多态性都进行该比较,并确定每个单核苷酸多态性位点是否存在“匹配”。“匹配”是指在两个或更多样品中在一个单核苷酸多态性位点上的核酸的准确相同。在一个给定的单多态性位点上在相同链上带有相同核苷酸的两个或多个样品被称为对该位点而言“匹配”。
“确定未知样品和已知样品来自相同或相关个体的概率”是指比较在未知样品和已知样品中的单多态性位点存在的核苷酸的性质,并计算观察到的匹配偶然发生的统计学概率。本领域熟知计算匹配偶然发生的统计学可能性的方法和算法,其依赖于特定的核苷酸存在于一个特定的位点的概率。
“已知样品”是指已知含有受损或未受损核酸的物质的样品,其中已知样品来源的个体的身份是已知的,或以期望程度的统计学可信度已知。
本发明的另一个实施方案包括一种从受损核酸的未知样品确定个体身份的方法,包括:从个体获得具有两种或多种单核苷酸多态性的受损核酸的未知样品;获得具有两种或多种单核苷酸多态性的核酸的已知样品;选择一组两种或多种单核苷酸多态性,其中该组两种或多种单核苷酸多态性的每一种彼此不遗传连锁,并且其中该组单核苷酸多态性的每一种位于串联重复核酸序列之外;确定受损核酸样品中存在的该组两种或多种单核苷酸多态性的每一种的性质;以及确定已知样品中存在的该组两种或多种单核苷酸多态性的每一种的性质;比较在已知样品中观察到的该组两种或多种单核苷酸多态性的性质与在受损核酸的未知样品中观察到的该组两种或多种单核苷酸多态性的性质;以及确定未知样品和已知样品来自相同或相关个体的概率,因此从受损核酸的未知样品确定个体的身份。
“未知样品和已知样品来自相同个体”是指样品的来源来自属于同一个体的生物物质。如果两个个体相互具有任何程度的近亲相关,那么一个个体可以说是另一个个体的“家族成员”。最优选地,“家族成员”是胞亲或家系相关。
“单碱基引物延伸”是指在与多态性位点紧邻(immediatelyadiacent)的靶核酸上杂交延伸引物,并在聚合剂的存在下在足以使引物延伸的条件下延伸引物。最优选地,使用单一一个标记的终止核苷酸延伸引物。检测多态性位点的一个优选方法是使用酶辅助的引物延伸。SNP-ITTM(由Goelet,P.等人,和U.S.专利号5,888,819和6,004,744揭示,每一在此以其全文并入参考)是在靶核酸序列的预定多态性位点确定核苷酸性质的优选方法。因此,虽然其对确定多种多态性具有一般的实用性,但是其对SNP评分(scoring)是特别合适的。SNP-ITTM是一种多态性位点查询(interrogation)的方法,其中在靶核酸序列上多态性位点周围的核苷酸序列信息用于设计与靶核苷酸的多态性位点紧邻、但不包括可变核苷酸的区域互补的寡核苷酸引物。靶多核苷酸分离自生物样品,并与查询引物(interrogatingprimer)杂交。在分离以后,靶多核苷酸在与查询引物杂交前可以通过任何合适的手段扩增。通过单一标记的终止核苷酸子如双脱氧核苷酸,使用聚合酶,通常在存在一或多种链终止核苷三磷酸前体(或合适的类似物)下延伸引物。因此产生可检测的信号。如在此所用,与多态性位点紧邻包括在关于靶核酸方向是多态性位点的5’方向上大约1至大约100个核苷酸,更优选大约1至大约25个核苷酸。最优选地,引物在与多态性位点相关的5’方向与紧邻多态性位点的一个核苷酸杂交。
在SNP-ITTM的一些实施方案中,在延伸反应前引物结合到固体支持物上。在其它的实施方案中,在溶液中(如在一个试管内或微孔内)进行延伸反应,延伸产物随后结合到固体支持物上。在SNP-ITTM的另一个实施方案中,引物被可检测地标记并且延伸的终止子核苷酸被修饰以便能够使延伸的引物产物结合到固体支持物上。这例如包括引物被荧光标记,终止子核苷酸是生物素标记的终止子核苷酸,且固体支持物用抗生物素蛋白或链霉抗生物素蛋白包被或衍生。在这样的实施方案中,一个延伸的引物将能够与固体支持物结合并且非延伸的引物将不能够与支持物结合,因此依赖一个成功的延伸反应产生可检测的信号。
连接酶/聚合酶介导的遗传比特分析(genetic bit analysis)(U.S.Patent Nos.5,679,524和5,952,174,二者并入参考)是另一种用于确定在多态性位点的核苷酸性质的适当的聚合酶介导的引物延伸方法实例。连接酶/聚合酶SNP-ITTM使用两个引物。通常,一个引物被可检测地标记,而设计另一个引物结合到固体支持物上。连接酶/聚合酶SNP-ITTM的另外一个实施方案中,延伸的核苷酸被可检测地标记。设计连接酶/聚合酶SNP-ITTM的引物与一个多态性位点每一侧杂交,以便有一个包括多态性位点的缺口。只有在一个成功的延伸反应之后有一个成功的连接反应,才能产生一个可检测信号。这个方法通过仅使用杂交或引物延伸提供了产生具有相当低背景的信号的优势。
确定靶多核苷酸内预先确定的多态性位点的核苷酸特性的另一个方法由Sderlund et al.,U.S.Patent No.6,013,431(以其全文并入参考)描述,在这个方法中,使用靶核酸序列的多态性位点周围的核苷酸序列信息设计一个引物,该引物与靶的多态性位点5′侧翼的一个不包括可变核苷酸的区域互补。靶多核苷酸从生物学样品分离并且与一个查询引物杂交。这个方法的一些实施方案中,分离后,通过任何适当的手段扩增靶多核苷酸,然后与查询引物杂交。常常在存在至少一种标记脱氧核苷酸和一或多种链终止核苷三磷酸前体(或适当的类似物)的混合物时,使用聚合酶延伸引物。标记脱氧核苷酸掺入引物产生一个可检测信号。
本发明的引物延伸反应使用一或多个标记核苷酸混合物和聚合剂。在此使用的术语“核苷酸”或核酸指处于通过聚合剂能够被加入到引物中的任何磷酸化状态的核糖核苷酸,脱氧核糖核苷酸,核苷酸无环衍生物,和其功能性等价物或衍生物。例如,在一个扩增方法或一个引物延伸方法中,核苷酸的功能性等价物可作为聚合酶底物。核苷酸的功能性等价物也可形成保留了与靶多核苷酸以序列特异性方式杂交的能力的多核苷酸。核苷酸例如包括链终止核苷酸,最优选的是双脱氧核苷三磷酸(ddNTP),如ddATP,ddCTP,ddGTP和ddTTP;但是,本领域技术人员已知的其它的终止子,例如无环核苷酸类似物,其它无环类似物和***糖苷三磷酸也在本发明的范围内。优选ddNTP与常规的2’脱氧核苷三磷酸(dNTP)的不同在于它们在糖组分的3’位置没有羟基。
使用的核苷酸可带有一个可检测的特性。在此使用的可检测特性包括能够区分核苷酸的任何可鉴别的特性。重要的是,可检测的特性不能干扰本发明的任何方法。可检测的特性指使用适当的检测方法能够检测到的原子或分子或分子部分。可检测的特性包括固有质量(inherent mass),电荷,电子自旋,质量标记,发射性同位素,染料,生物发光,化学发光,核酸特性,半抗原,蛋白质,光散射/相移位(phase shifting)特性,或荧光特性。
可依据本领域已知的任何技术标记核苷酸和引物。优选的标记包括放射性标记,荧光标记,酶标记,蛋白质,半抗原,抗体,序列标记,质量标记,荧光标记等。优选的染料类型包括,但是不局限于,TAMRA(羧基一四甲基罗丹明),ROX(羧基-X-罗丹明),FAM(5-羧基荧光素)等。
本发明的引物延伸反应可使用一或多种标记核苷酸碱基。优选地,使用两或多种不同碱基的核苷酸。最优选地,本发明的引物延伸反应使用4个不同碱基的核苷酸。在最优选的实施方案中,所有4个不同类型的核苷酸被可区分的标记物标记。例如,使用dR6G标记A,使用dTAMRA标记C,使用dR110标记G和使用dROX标记T。
一旦使用引物延伸反应,延伸的和未延伸的引物(如果有)可被相互分离以便于鉴别一或多个被查询的等位基因的多态性位点。可通过任何本领域已知的方法分离核酸。一些分离方法包括使用嵌入染料例如溴化乙锭检测DNA双链,检测特异性序列和/或分离或捕获已知或未知结构的寡核苷酸分子的杂交方法以及与本领域熟知的印迹方法相关的杂交方法。杂交方法可与本领域熟知的其它分离技术组合使用,如通过固相捕获分离标记的寡核苷酸,如免疫亲和珠捕获半抗原连接的寡核苷酸,该珠可以是磁性的。固相捕获技术也包括DNA亲和层析,其中通过带有互补序列的固定化寡核苷酸捕获寡核苷酸。特异性多核苷酸标记被工程化入寡核苷酸引物,且通过与固定化互补序列杂交而分离。这样的固相捕获技术还包括在链霉抗生物素蛋白包被的珠(磁性或非磁性的)上捕获生物素标记的寡核苷酸。使用更传统的方法如离心,电泳方法或沉淀或表面沉积方法也可分离DNA。当延伸的或未延伸的引物存在于溶液相时,该方法非常好。术语“溶液相”在此指均相或非均相混合物。这样的混合物可以是水溶液的,有机的或同时含有水性成分和有机成分。术语“溶液”在此与悬浮液同义,其中包括悬浮在液体介质中的微粒。
通过任何本领域已知的方法可检测多态性位点。一个核苷酸检测方法是通过荧光技术。例如,可以构建在没有与靶核酸序列杂交时猝灭的荧光杂交探针。其它的方法利用具有重叠吸收(overlappingabsorption)和发射光谱的荧光团之间的能量转移作用,所以当如捕获或杂交时,在2个荧光团非常接近时可以检测信号。
通过涉及电磁辐射行为的多种分光光度法,或标记可检测的部分来检测核苷酸。这些分光光度法包括,例如,电子自旋共振,光学活性或旋光光谱学如圆二色谱学,荧光学,荧光偏振化,吸收/发射光谱学,紫外线,红外线,可见光或质谱学,Raman光谱学和核磁共振光谱学。
依据本领域已知的任何技术可标记核苷酸和其类似物,终止子和/或引物。优选的标记包括放射性标记,荧光标记,酶标记,蛋白质,半抗原,抗体,序列标记,质量标记,荧光标记等。优选的染料类型标记包括,但不局限于TAMRA(羧基二四甲基罗丹明),ROX(羧基-X-罗丹明),FAM(5-羧基荧光素)等。
术语“检测”指鉴别一种可检测的部分。这一术语包括通过电磁特性鉴别一种部分的能力,例如,电荷,光,荧光,化学发光,电磁特征的改变,例如,荧光偏振,光偏振,二色性,光散射,折射率改变,反射,红外线,紫外线和可见光谱,质量,质量:电荷比率和所有依赖于电磁辐射或电磁辐射改变的检测技术的方式。术语也包括基于结合亲和力,内在质量,质量沉积,和静电特性,大小和序列长度鉴别部分。要注意特性,如质量和分子量可以通过表观质量或表观分子量评估,所以术语“质量”或“分子量”在此不排除通过多种设备和方法评估,因此不限制这些术语是任何唯一的绝对数值,而不参考获得质量和分子量的方法和设备。
检测多态性位点的核苷酸的另一个方法是通过比较引物延伸反应之后任意时间点,保持在反应混合物中的游离的、未掺入的核苷酸的浓度。在本实施方案中通常使用质谱学例如电喷射质谱检测未掺入的核苷酸。这个检测方法是可行的,因为在引物延伸反应过程中,在反应混合物中只有与多态性碱基互补的核苷酸被耗尽。因此,可使用质谱比较核苷酸质量峰的相对强度,同样地,可确定未标记引物的浓度且使用这一信息获得多态性位点核苷酸的性质。
引物可以是能够在延伸反应中在3’末端延伸的多核苷酸或寡核苷酸。在此,术语“多核苷酸”包括任何数量的核苷酸聚合物。术语“寡核苷酸”包括任何数目核苷酸的多核苷酸分子,优选少于大约100个核苷酸的多核苷酸分子。更优选的,寡核苷酸的长度在5到100个核苷酸之间。最优选的,寡核苷酸长度在15到60个核苷酸之间。但是,特定寡核苷酸或多核苷酸的精确长度将依赖于许多因素,其依赖于其最终的功能或使用。影响寡核苷酸长度的一些因素是,例如寡核苷酸的序列,分析中使用的盐浓度和温度等变量的分析条件,以及是否寡核苷酸在5’末端被修饰以包括为了修饰寡核苷酸的质量:电荷比率的额外碱基,和/或提供一个标记捕获序列,其可用于地理分离寡核苷酸到DNA芯片或阵列上特异的杂交位置。短引物需要较低温度以与模板形成足够稳定的杂交复合体。本发明的引物应与靶核酸上链或下链互补。优选地,起始扩增引物在它们的3’末端不应自身互补,以避免引物折叠导致自身引导(self-priming)的结构和分析噪干扰信号。优选引物在3’末端缺乏自身互补的一个例外是在本发明的一个实施方案中,当使用一个延伸引物为flip-back引物时,优选某些程度的自身互补。当使用一个引物为flip-back引物时,引物应具有足够的自身互补性以便在没有靶核苷酸,或没有足够量的与自身引导事件竞争的靶核酸时,能够自身引导。本发明的优选引物包括从大约8到大约40个核苷酸长度的寡核苷酸。最优选地,PCR引物长度在大约18至大约25个碱基之间。最优选地,SNP-ITTM引物(Orchid Biosciences,Inc.)用作延伸引物以确定多态性位点核苷酸的性质。最优选地,SNP-ITTM引物的长度为40至45个碱基对,包括与多态性位点相邻序列互补的20至25个碱基对3’区域和与任何样品核酸序列都不互补的20个碱基对标记。
在现有技术中在非靶核酸的背景下,大约10个核苷酸的引物是可用于与互补的靶核酸序列选择性杂交的最短序列。最优选地,使用超过至少大约20到大约35个核苷酸的完整互补序列以保证充分水平的杂交特异性,当然靶DNA分子序列的长度可能有相当大的变化。本发明的引物必须能够与靶核酸序列特异性杂交,例如一或多个上游引物与一或多个靶核酸上链或一或多个核酸下链杂交。在此,如果2个分子在足以促进杂交的条件下能够形成反平行、双链核酸结构或杂合体,则这2个核酸序列被认为能够相互特异性杂交,但是在相同的条件下,与一个非靶核酸序列温育时它们必须基本上互相不能形成一个双链结构或杂合体。
如果一个核酸分子呈现完全的序列互补性,则称其是另一个核酸分子或是其自身的“互补物”。在此,当每个分子的每个核苷酸都能够与另一个分子的核苷酸形成碱基对时,这些分子被称是呈现“完全互补”。“基本上互补”指在至少常规的低严格条件下能够相互杂交或与自身杂交并具有足够的稳定性以允许退火的能力。同样地,如果在常规的高严格条件下,分子可相互杂交并具有足够稳定性以允许它们保持相互退火,则它们被称为是“互补的”。常规的严格条件例如Sambrook,J.,et al.,Molecular Cloning,a Laboratory Manual,2ndEdition,Cold Spring Harbor Press,Cold Spring Harbor,N.Y.(1989)(在此并入参考)描述。不是完全互补因而是可能的,只要这没有完全排除分子形成一个双链结构或杂合体的能力。
在实践本发明时使用的引物可以在5’端标记。标记包括任何标记,如放射性标记,荧光标记,酶标记,蛋白质,半抗原,抗体,序列标记等。优选地,标记不干扰本发明的方法。典型地,标记可附着到引物的5’末端,其其余引物序列与靶核酸互补。一个优选的标记包括独特标记或标记每种引物,所述引物具有与结合到固体支持物上的序列互补的独特序列,其中这样的固体支持物可包括阵列,包括可寻址阵列。因此,在适当的杂交条件下,当引物暴露于固体支持物时,标记与结合到固体支持物的互补序列杂交。这样,通过阵列上的几何位置或通过其它手段用探针鉴别与标记相关的点可以确定引物特性。与5’标记互补的序列可以在例如可寻址阵列上的离散位置上与固体支持物结合。
在本发明中使用的聚合剂可从多种生物体中分离或克隆,所述生物体包括病毒、细菌、古细菌、真菌、支原体、原核生物和真核生物。优选的聚合剂包括聚合酶。使用本发明的方法和设备进行单碱基延伸的优选聚合酶是呈现很少或没有核酸外切酶活性的聚合酶。更优选的是耐受并在超过生理温度具有活性的聚合酶,例如50℃到70℃或耐受至少90℃到大约95℃。优选的聚合酶包括来自水生栖热菌(T.aquaticus)(购自ABI,Foster City,CA)的Taq聚合酶,Sequenase和ThermoSequenase(购自U.S.Biochemical,Cleveland,OH)和Exo(-)聚合酶(购自New England Biolabs,Beverley,MA)和AmpliTaqGold。也可使用任何呈现热稳定性的聚合酶,例如,栖热菌属来源的聚合酶,包括水生栖热菌(Thermus aquaticus),Thermus brocianus,嗜热栖热菌(Thermus thermophilus)和黄栖热菌(Thermus flavus);火球菌(Pyrococcus)属,包括激烈火球菌(Pyrococcus furiosus),火球菌GB-D(Pyrococcus sp.GB-D)和沃氏火球菌(Pyrococcus woesei),Thermococcus litoralis和Thermogata maritime。生物活性的蛋白酶片段,重组聚合酶,遗传工程化的聚合酶和修饰的聚合酶都包括在聚合剂的定义中。可以理解不用过多的实验,本发明即可以使用多种来源的多种类型的聚合酶。
“多重反应”是指在一个单反应中鉴定两种或多种单核苷酸多态性。“多重反应”还包括在一个单反应中制备受损样品中存在的两种或多种靶核酸,例如通过扩增,以及鉴定两种或多种单核苷酸多态性。优选地,在一个“多重反应”中,至少大约10至大约50个单核苷酸多态性在一个单反应中被鉴定。最优选地,例如通过扩增制备大约12个靶核酸,在一个单反应中鉴定了大约12个单核苷酸多态性。优选地,用于从受损样品扩增核酸的引物显示了相似的解链温度,使得可以在一个单反应中产生包含一或多个组的单核苷酸多态性的多个扩增子。最优选地,在一个单反应中产生大约12个扩增子。可以通过本领域任何已知的方法实现对用于多重反应目的(multiplexingpurposes)的组的单核苷酸多态性的选择,可以基于解链温度的相似性选择延伸引物。最优选地,选择包含相距大约20-100兆碱基的、并是双等位基因的双等位基因T/C多态性的单核苷酸多态性的核酸序列并输入Autoprimer软件(http://www.autoprimer.com,在此并入参考),并且Autoprimer提供了大约12个适合用于多重扩增反应和基于引物的解链温度的单碱基延伸反应中的单核苷酸多态性的组。
可以通过本领域已知的任何方法分离和鉴定延伸引物。优选的分离和鉴定引物延伸产物的方法是通过毛细管凝胶电泳,其中使用荧光检测仪来鉴别荧光终止核苷酸标记的引物延伸产物。通过它们的质量:电荷比率分离带有荧光标记的延伸引物。最优选地,使用在其5’端带有标记捕获序列的SNP-ITTM引物(Orchid Biosciences,Inc.)。在该实施方案中,用荧光终止子在SNP位点进行单碱基引物延伸后,将反应混合物应用于带有与引物的标记捕获序列互补的序列的阵列上,其中在阵列上放置这样的互补序列的位置是已知的。在该实施方案中,在阵列的已知位置上的合适的荧光信号表明在SNP位点存在的核苷酸的性质。最优选地,使用SNPstream UHTAssay KitTM(OrchidBiosciences,Inc.)进行分析,并使用SNPstream UHT Array ImagerTM和SNPstream Laser EnclosureTM结合控制计算机、数据分析计算机、服务器计算机和SNPStream数据分析软件包(Data Analysis SoftwareSuiteTM)(全部来自Orchid Biosciences,Inc.)进行鉴定。然而,本领域技术人员已知多种分离和检测方法,而且此处本发明适合许多检测和分离方案。
优选的分离方法使用暴露任何延伸的和未延伸的引物到固体支持物上。固体支持物包括阵列。术语“阵列”在此指固定化生物分子在固体,半固体,凝胶或聚合物相上多个位置上的有序排列。这个定义包括已用二氧化硅,硅烷,硅,硅酸盐和其衍生物,塑料和其衍生物,例如,聚苯乙烯,尼龙和,特别是聚苯乙烯板,玻璃和其衍生物,包括衍生化玻璃,玻璃珠,可控孔度玻璃(CPG)处理或包被的相。固定化的生物分子包括寡核苷酸,其可以包括其它部分,如标记和/或亲和性部分。术语“阵列”包括且与术语“芯片”、“生物芯片”、“生物芯片阵列”、“DNA芯片”、“RNA芯片”、“核苷酸芯片”和“寡核苷酸芯片”同义。所有这些术语包括阵列的阵列,并包括生物学聚合物,例如,已知或未知序列的寡核苷酸和DNA分子的阵列
本发明优选的阵列包括,但不局限于,包括以上定义的阵列的可寻址阵列,其中各个位置具有已知坐标以便阵列上一定位置的信号可被鉴别为具有特殊可鉴别的特性。术语“芯片”,“生物芯片”,“生物芯片阵列”,“DNA芯片”,“RNA芯片”,“核苷酸芯片”和“寡核苷酸芯片”包括阵列和微阵列的组合。这些术语也包括任何形状或构型的阵列,2维阵列和3维阵列。
一个优选的阵列是Affymetrix,Inc.的GenFlexTM标记阵列,它由2000个标记序列的捕获探针组成。它们是20聚体,选自具有相似杂交特性且与公开的数据库中的序列至少具有最小的同源性的所有可能的20聚体。最优选的阵列是SNPstream UHT ArrayTM(OrchidBiosciences,Inc.)。
另一个优选的阵列是可寻址的阵列,其具有与本发明中使用的引物的任何5’标记互补的序列标记。这些互补的标记结合阵列上的已知位置。这种类型的标记在适当杂交条件下与阵列杂交。通过定位结合的引物和检测一或多个延伸的引物,多态性位点的核苷酸性质可被确定。
在本发明的一个优选的实施方案中,靶核酸序列被排列为允许多个同时检测(多重技术(multiplexing))以及使用寡核苷酸阵列平行处理的形式。
在另一个实施方案中,本发明包括虚拟(virtual)阵列,其中延伸的和未延伸的引物在包含微球体悬液的阵列上分离,其中微球体带有一或多个捕获部分以便分离独特标记的引物。微球体进而带有独特的鉴别特性以便它们能够基于该特性,例如,直径,密度,大小,颜色等而被分离。
在另一个实施方案中,本发明包括一种对受损核酸样品基因分型的方法,包括:从个体获得受损核酸样品;鉴定存在于受损核酸样品中的两种或多种单核苷酸多态性;并比较受损样品中的两种或多种单核苷酸多态性的每一种的性质和感兴趣的群体的一组单核苷酸多态性,以确定在受损样品和感兴趣的群体中的两种或多种单核苷酸多态性的每一种的出现频率,其中所述组包括两种或多种彼此不遗传连锁、并位于串联重复核酸序列之外的单核苷酸多态性;因此对受损核酸样品基因分型。
“基因分型”指首先限定一组感兴趣的遗传特性,然后以统计学可信度的程度确定感兴趣的遗传特性是否存在于受损核酸样品中的可能性。在本发明的一个实施方案中,感兴趣的遗传特性是感兴趣的群体中的一组单核苷酸多态性,其中单核苷酸多态性彼此不遗传连锁、并位于串联重复核酸序列之外。如在此所用,“基因分型”表示在一个样品或参比样品中发现的一或多个所述组的单核苷酸多态性的核苷酸的性质。
单核苷酸多态性的“出现频率”是指在感兴趣的群体中的特定单核苷酸多态性位点出现特定核苷酸的观测频率。最优选地,本发明的单核苷酸多态性是双等位基因的,而且多态性核苷酸的性质是T和/或C。
在另一个实施方案中,本发明包括一种对受损核酸样品基因分型的方法,包括:从个体获得受损核酸样品;从感兴趣的群体基因组中选择一组单核苷酸多态性,所述组包括两种或多种单核苷酸多态性,其中该组两种或多种单核苷酸多态性的每一种彼此不遗传连锁、并位于串联重复核酸序列之外;鉴定在受损核酸样品中存在的两种或多种单核苷酸多态性;并比较在受损样品中观察到的两种或多种单核苷酸多态性的性质与在组中观察到的两种或多种单核苷酸多态性的性质,以确定基因型,从而获得受损核酸样品的基因型。
“人类核酸”是指来自人类的任何种类的核酸。“人类核酸”是指包括含有被环境或其它因素降解或化学或物理修饰的核酸样品,唯一的限制是它们可以用于本发明的鉴定或遗传分型方法。
“扩增”是指增加靶核酸数目。在本发明的一个实施方案中,受损核酸样品的靶核酸通过使用PCR引物的聚合酶链反应(PCR)的方法被扩增。然而,“扩增”并不限于PCR。如在此所用,扩增指任何增加靶核酸数量的技术,包括但不限于杂交和用于富集感兴趣的靶核酸产量或数目的亲合性方法。
“靶核酸”是指含有一或多种感兴趣的单核苷酸多态性的核酸序列。靶核酸序列优选对于该核酸与寡核苷酸或多核苷酸分子杂交的能力而言是生物学活性的。靶核酸序列可以是DNA或RNA、单链或双链或DNA/RNA杂种双螺旋。靶核酸序列可以是多核苷酸或寡核苷酸。在本发明的受损核酸样品中的靶核酸序列优选是大约10至大约100个核苷酸长。最优选地,在本发明的受损核酸样品中的靶核酸序列是大约10至大约50个核苷酸长。回收降解的、受损的和/或分馏的DNA的方法是本领域熟知的,包括凝胶电泳、HPLC和例如能利用基于与捕获序列杂交的多种序列回收的技术。
靶核酸可以从生物样品中分离的或衍生的。在此所用术语“分离”指基本上没有其它物质如非核蛋白、脂质、碳水化合物和其它物质如细胞碎片或与靶核酸相关的生长介质的状态。典型地,术语“分离的”不打算指完全没有这些物质。术语“分离”一般也不打算指没有稳定剂如水、缓冲液或盐,除非它们以基本上干预了本发明的方法的量存在。在此所用术语“样品”一般指含有核酸,或者DNA或RNA或DNA/RNA杂种的任何物质。样品可以来自任何来源,包括植物和动物,包括人。一般,这样的物质是以下形式:血液样品、组织样品、直接来自个体的细胞或在培养基中繁殖的细胞、植物、酵母、真菌、支原体、病毒、古细菌、组织切片或口腔拭子的形式,可以是新鲜的、固定的、冷冻的或包埋在石蜡或其它固定剂中。这样的样品能进行通过例如碱裂解的模板制备。其它的样品类型能进行分析,但可能需要不同的或更高程度的模板制备,例如酚/氯仿抽提,或在存在高盐浓度时将DNA捕获至二氧化硅基质。
靶核酸可以是单琏的,并可以来自双链DNA、RNA或其它核酸分子的上游或下游链核酸。靶核酸的上游链包括核酸的正链或有义链。靶核酸的下游链是指与靶核酸的上游链互补的负链或反义链。因此,描述时可以指任一链并且包括多态性位点,而且引物可以设计与任一条或两条链杂交。靶核酸并不限制在编码区的序列中,也可以包括基因组的任何区域或含有至少一个多态性的基因组的部分。术语基因组包括复杂基因组(complex genome),如在动物中发现的那些,不排除人类,和植物,以及非常简单和较小来源的核酸,例如病毒、类病毒的核酸以及任何其它的含有核酸的生物物质。
靶核酸序列或其片段含有多态性位点,或包括这样的位点和位于所述位点的远端或近端的序列。这些多态性位点或突变在核酸序列的特定位点可以是缺失、***、重排、重复序列、碱基修饰或单一或多碱基改变的形式。该改变的序列和更多的流行的或正常的序列可以在群体中共同存在。在某些情况下,这些改变对物种或物种中的个体没有赋予优势或劣势,序列的多种等位基因可以是稳定或准稳定平衡。然而在某些情况下,这些序列改变将赋予物种存活或进化优势,因此改变的等位基因最后将掺入到该物种许多或大多数成员的基因组中。在另一些情况下,改变的序列赋予物种劣势,如当突变引起或倾向于使个体产生遗传疾病或缺陷。如在此所用术语“突变”或“多态性位点”指在物种的某些成员、物种中的一个群体或物种之间的核酸序列中的改变,这样的突变或多态性包括但不限于,单核苷酸多态性(SNP)、一或多个碱基缺失,或一或多个碱基***。
个体中的多态性可以是杂合的或纯合的。纯合个体在同源染色体的一或多个相应位点具有相同的等位基因。杂合个体在同源染色体的一或多个相应位点具有不同的等位基因。如在此所用,等位基因包括基因或核酸序列的可选择形式,在基因编码区的内部或外部,包括内含子、外显子和非转录或非翻译区域。特定基因的等位基因一般在同源染色体上占据相同的位置。因此,可以说多态性是“等位基因的”,在于由于存在多态性,一个物种的某些成员携带具有一个序列的基因(如原始或野生型“等位基因”),而其它成员可能具有改变的序列(如变体或突变的“等位基因”)。在最简单的情况下,只存在序列的一个突变变体,多态性被说成是双等位基因的。例如,如果在一个位点的两个等位基因是不可区分的(例如A/A),那么在这种情况下该个体在该位点是纯合的。如果在一个位点的两个等位基因是可区分的(例如A/G),那么在这种情况下该个体在该位点是杂合的。大多数已知的单核苷酸多态性是双等位基因的一其中在这种情况下在特定位点有两个可选择的碱基。
现在已经一般性地描述了本发明,参考下述实施例后其将更加容易理解,提供以下实施例是为了说明本发明而不是试图限制本发明的精神或保护范围。
实施例
扩增
对一选择的组,通过聚合酶链反应(PCR)从受损样品中制备包含组的单核苷酸多态性的扩增子,使用了热稳定的DNA聚合酶Amplitaq GoldTM聚合酶、DNA模板、核苷酸和两种分别对扩增子特异的引物,以便复制在受损样品中的片段的两条DNA链。产生多种这些引物对以允许通过组合等摩尔量(10μM)的24个引物的每一种而在一个反应中扩增12个扩增子。通过使用三步法扩增DNA:步骤1:DNA变性(94℃-100℃)以产生单链模板;步骤2:使用保证引物与靶核酸序列完全匹配结合的杂交条件退火(45℃-65℃)引物;及步骤3:延伸或DNA合成(72℃)。通常进行30-40个扩增循环以产生几百万个感兴趣的扩增子拷贝。
需要的材料包括10%漂白剂、2mL微管、单通道移液管(20μL-1000μL)、12通道移液管(2μL-20μL)、气溶胶抗性移液吸头、384孔PCR板和膜、10X PCR缓冲液II(Orchid Biosciences,Inc.)、25mM MgCl2、2.5mM dNTP混合物、十二对引物池(pool)、AmplitaqGoldTM聚合酶、无菌蒸馏水或去离子水、样品DNA、热循环仪、微量离心管和振荡器。
所有的PCR试剂应该在指定的pre-PCR实验室中制备。
在进行PCR之前和之后应该穿戴专门的实验工作服和手套,操作区域应该用10%漂白剂清洗。PCR反应混合物应该在通风厨内制备。使以下储存剂融化:2.5mM dNTP、10X PCR缓冲液II、引物池、25mM MgCl2、无菌水和待扩增的DNA样品。计算对特定样品数目每一试剂需要的量,记录在PCR实验记录的合适位置(计算超过样品的20%)。相同试剂的不同份数不要混合。在2mL微管中制备PCR主混合物,将每一试剂的份数记录在PCR记录中。
典型的扩增反应混合物
试剂                      (每板/460样品)   (每一样品)
10X PCR缓冲液II           230μL           0.5μL
25mM MgCl2               460μL           1μL
2.5mM dNTP                69μL            0.15μL
PCR引物池                 11.5μL          0.025μL
水                        563.5μL         1.225μL
Amplitaq GoldTM          46μL            0.1μL
DNA模板         2μL(共2ng/样品)   2μL(共2ng/样品)
总体积          每样品5μL         每样品5μL
PCR平板设定
确定标记平板的方向并用合适的标记组标记平板和实验组。使用12通道移液管向每一孔内加入3μL PCR混合物。离心含有所有DNA样品的平板,并使用12通道移液管如先前一样加入2μL的DNA模板。DNA板中的样品装载在PCR平板的相同位置。将一片密封膜放置在平板上,用辊子密封。离心平板去除任何气泡,置于热循环仪中。
典型PCR扩增过程
所有扩增反应在MJ Research TetradTM机器上进行。根据扩增引物的特性改变程序。通过使用在此所述的AutoprimerTM软件简化对组多重反应的扩增引物的解链和退火温度的选择,以便本领域技术人员可以选择合适的延伸和解链温度进行热循环,而不需要过多的实验。优选的热循环仪是MJ Research Tetrad热循环仪。
样品程序
Mode:Calculated
步骤1:95℃,5分钟
步骤2:95℃,30秒
步骤3:50℃,55秒
步骤4:72℃,30秒
步骤5:进行步骤2,2次
步骤6:95℃,30秒
步骤7:50℃,55秒+0.2°/循环
步骤8:72℃,33秒
步骤9:进行步骤6,18次
步骤10:95℃,30秒
步骤11:55℃,55秒
步骤12:72℃,30秒
步骤13:进行步骤10,8次
步骤14:72℃,7分钟
步骤15:4℃,始终
步骤16:结束
多重PCR扩增12个扩增子后,未掺入的核苷酸和多余的引物通过本领域已知的方法酶学去除,如用外切核酸酶I处理以及用虾碱性磷酸酶处理。PCR后处理优选使用SNP-ITTM Clean-up kit(OrchidBiosciences,Inc.)进行。
SNP-IT引物延伸反应
将延伸混合物和12个等位基因特异标记的SNP-ITTM引物池加入到处理过的反应混合物中。等位基因特异的SNP-ITTM引物与多重反应中与多态性位点紧邻的特异扩增子杂交。通过掺入荧光标记的链终止子,在双染料***中延伸标记的引物。双色(two-color)检测允许通过比较两种荧光染料的信号区别基因型。然后将延伸的SNP-ITTM引物与排列在384SNP-ITTM平板(Orchid Biosciences,Inc.)的每一孔中的12个独特探针之一通过标记-探针捕获特异性杂交。SNP-ITTM引物是含有与5’非模板特异序列附着的模板特异序列的单链DNA,其中“标记”指可以被结合到玻璃表面的特异探针捕获的非模板特异序列。与一个标记杂交的特异探针结合到384SNP-ITTM平板中的每一孔的玻璃表面上。共价结合到玻璃表面的探针能查询多至12从(12-plexed)核酸反应产物。已经掺入标记的SNP-ITTM反应产物将与共价结合到玻璃表面的相应探针杂交。在延伸反应之后,延伸的SNP-ITTM引物与每一孔中排列的12个独特探针之一特异性杂交。排列的探针捕获延伸的产物并允许检测每一SNP等位基因信号。严格的冲洗将去除游离的染料终止子和未与特异探针杂交的DNA。
玻璃表面的探针在384孔格式中的每一孔中以4×4阵列排列。在每个4×4阵列中包括3个正对照和1个负对照。左上位置是杂合对照,其具有与掺入两种染料标记的终止子的自身延伸寡核苷酸杂交的两种探针的等摩尔混合物。右上位置具有与掺入蓝色染料标记的终止子的自身延伸寡核苷酸特异性杂交的探针。左下位置具有与掺入绿色染料标记的终止子的自身延伸寡核苷酸杂交的探针。将等摩尔浓度的两种自身延伸寡核苷酸加入延伸混合物中并用染料标记的终止子在循环延伸反应中延伸。右下位置具有不自身延伸的探针,并与反应中的任何DNA缺少互补性。这些探针在每一孔中作为负对照。
引物延伸引物在无DNase/RNase水中悬浮,并分成12组。每个SNP-ITTM引物应该制备成120微摩。等体积的12个SNP-ITTM引物聚集在一起。每一SNP-ITTM引物在池中的终浓度为大约10微摩。在低重(low plexing)水平,保持每一SNP-ITTM引物的浓度在10微摩。
对多重SNP-ITTM反应,聚集SNP-ITTM引物以便制备等摩尔混合物。用分子生物级的水以1∶100稀释SNP-ITTM引物池。
SNP-ITTM引物
  平板数   1/8   1/4   1/2   1   2
  SNP-ITTM引物池   1.6μl   3.2μl   6.3μl   12.6μl   25.2μl
  H2O   156μl   312μl   524μl   1247μl   2495μl
  总体积   158μl   315μl   630μl   1260μl   2520μl
对SNP的类型选择正确的20X延伸混合物用于测试,并从-20℃储存中移除。(例如T/C SNP需要T/C延伸混合物)。
为了制备延伸混合物,计算在实验中需要的延伸混合物的体积。
延伸混合物
  平板数   1/8   1/4   1/2   1   2
  20×延伸混合物   10.5μl   21μl   42μl   84μl  168μl
  延伸混合物稀释液   197μl   395μl   790μl   1580μl  3160μl
  DNA聚合酶   2.1μl   4.2μl   8.3μl   16.5μl  33μl
  总体积   210μl   420μl   840μl   1680μl  360μl
使用多通道移液器或自动液体处理装置,将稀释的SNP-ITTM引物和延伸混合物转移入液体库中用于吸取。
将3μl稀释的SNP-ITTM引物池加入PCR平板的相应孔中。用平板离心机离心平板。向相应孔中加入如前述制备的4μl延伸混合物,并充分混合。
如果SNP组是有限的(低于或等于8),三倍体积的稀释SNP-ITTM引物池可以与4倍体积的延伸混合物混合。7μl的延伸混合物加入到PCR板的每一相应孔中并通过用多通道移液器吸头人工上下吸取3次进行混合或通过振荡自动处理液体。
离心并密封PCR平板。使用以下程序在MJ热循环仪(或等同物)中进行热循环。
步骤1. 96℃进行3:00分钟
步骤2. 94℃进行0:20
步骤3. 40℃进行0:11
步骤4. 重复步骤2和3,25次
步骤5. 4℃最终保存
注意:该程序已经被最优化以用于MJ Research TetradTM。程序需要被修饰以用于具有不同加热和冷却速率的热循环仪。分析可以在该点被中断。在-20℃密封和储存SNP-ITTM平板。确保平板被完全密封以避免样品蒸发。
SNP-IT平板的制备
用DI H2O将UHT Prewash溶液(提供的20X储存液)稀释到1X。用试剂盒提供的1X UHT prewash缓冲液冲洗UHT Core kit ATM中提供的SNP-ITTM平板三次。应该包括附加的抽气(aspirating)步骤以干燥平板。注意:如果同时进行分散(dispensing)和抽气,每次冲洗应该使用50μl/孔。抽气吸头应该接近于玻璃表面和壁的边缘。
制备杂交液
a.确定要被分析的平板总数(不管延伸混合物类型或等位基因反应)。
b.UHT core kit含有95ml的杂交缓冲液和5.5ml的杂交添加剂,足以进行10个PCR平板,如果使用者每次使用平均2个平板。
c.对两个PCR平板,将9.45ml的杂交液与550μl的杂交添加剂充分混合。
d.向PCR平板的每一孔中加入8μl前述杂交溶液并充分混合。将8μl的溶液从PCR平板转移到玻璃SNP-IT平板上的相应孔中。
推荐用3N NaCl和水在移液之间使用冲洗吸头或每次移液使用新的吸头以消除交叉污染。
杂交
在转移2个平板后,玻璃SNP-ITTM平板放置在42℃的潮湿烘箱(或在烘箱中用湿纸巾湿化的带盖的托盘)中。温育平板2小时(+/-15分钟)。建议对2-12个平板进行每两个平板一批的孵育,对13-30个平板进行每5个平板一批的孵育。每一轮需错开进行以节约时间。
SNP-ITTM反应冲洗
通过混合25ml冲洗液和1.575L的DI H2O制备冲洗液。在UHTcore kit中提供了50ml的冲洗液,足以用于10个PCR平板。在杂交完全以后,用冲洗液冲洗SNP-ITTM平板3次。
预热SNPstreamTM UHT***,并将实验信息输入UHTPlateExplorerTM。确信已经将预试(pre-run)数据输入UHTPlateExplorerTM
使用连接了1ml的移液器吸头的真空完全干燥SNP-ITTM平板。切断吸头以便它不会接触到玻璃表面。切断的末端的开口应该比孔大。在冲洗结尾如果有足够的抽气步骤则此步骤可以省略。重要的是注意湿孔增加了背景图像。打开真空源,以排或行将平孔真空化。准备平板在SNPstreamTM UHT***成像。如果成像前有延迟,则在暗盒中储存SNP-ITTM平板。
根据本发明的方法选择大约12个单核苷酸多态性的13个分离的组。每一组成员是T/C单核苷酸多态性。这些组用于筛选多种受损核酸的样品。
组5-17的扩增引物和SNP-ITTM引物列举如下。含有来自建筑物倒塌和烧伤的样品(样品组A)的受损核酸样品、来自医学检测办公室的法医样品(样品组B)和其它受损样品(样品组C)列于表8。
为了阐明该技术的原理,回收自许多受损骨骼、组织和其它生物学样品的核酸样品根据本发明使用许多组进行基因分型。表1示出了样品组A的受损核酸的基因分型,使用组5。表2示出样品组A和样品组B的受损核酸的基因分型,使用组6。表3示出样品组C的受损核酸的基因分型。表4示出样品组C的受损核酸的基因分型,使用组8。表5示出样品组C的受损核酸的基因分型,使用组11。表6示出样品组C的受损核酸的基因分型,使用组9。表7示出样品组C的受损核酸的基因分型,使用组10。这些数据表明这些SNP标记提供用于鉴定目的的可用遗传信息的能力。
表8示出测试受损核酸样品的组12-17。结果与STR基因分型方法比较。表8中的比较确定使用根据本发明的组的基因分型产生了可靠的结果。
表9示出测试受损核酸样品的组12-17。结果示出使用本发明的组成功鉴定的SNP。表9确定使用根据本发明的组的基因分型产生了可靠的结果。
表10示出测试受损核酸样品的组12-17。结果示出使用本发明的组成功鉴定的SNP。表10确定使用根据本发明的组的基因分型产生了可靠的结果。
表11概括了使用测试受损核酸样品的组12-17的来自44个人的24640可能基因型的结果。示出了使用的DNA量、测试的SNP数目和失败(FL)。结果确定使用根据本发明的组的基因分型产生了可靠的结果。
确认分析(validation asay)
确认分析使用1560个来自建筑物倒塌的样品进行。确认分析的方案描述如下。
该分析通过利用DNA聚合酶掺入染料标记的终止子的能力,因此允许单碱基引物延伸,使用SNP-ITTM技术进行。使用该技术可以通过使用不同的染料终止子检测单核苷酸多态性(SNP)以区分基因型。在12扩增子的多重PCR扩增之后,未掺入的核苷酸和引物酶学去除。将延伸混合物和12个等位基因特异的标记的SNP-IT引物池加入处理过的PCR中。这些SNP-ITTM引物与多重反应中的特异扩增子杂交,SNP位点3’的一个碱基。标记的引物通过掺入荧光标记的链终止核苷酸在双染料***中延伸。双色检测可以通过比较来自两种荧光染料的信号区分基因型。然后将延伸的SNP-ITTM引物与每孔中排列的12个独特探针之一特异杂交。排列的引物捕获延伸的产物,并允许检测每一SNP等位基因信号。
                   分析方案
1.打开UHT TM***和相关的计算机。
2.制备和放置校准平板作为第一个实验平板。
3.用新的384孔PCR平板以从原始的20μL PCR平板(源平板)中转移5μL的PCR产物:
a.在转移程序之前迅速离心所有使用的源平板。如果需要,首先融化。
b.用相同的信息标记新平板作为源平板(即批次数、组数、初始等等)。
c.使用多通道移液器将5μL PCR产物从源平板转移至新的平板。在完全转移整个平板后,密封两个平板。于-20℃储存剩余的15μL样品平板,如果需要进行重新测定。
d.迅速离心5μL平板,肉眼观察以便确信所有的样品都被合适地转移。如果没有观察到问题,进行下一步骤,否则记录问题通知检查者。
4.使用体积计算制备用于SNP-ITTM清除反应的Exo/SAP。
  平板数   2   4   6   8   10
  Exo/SAP   101μl   202μl   303μl   404μl   505μl
  Exo/SAP缓冲液   2419μl   4838μl   7257μl   9676μl   12095μl
  总体积   2.520ml   5.040ml   7.560ml   10.080ml   12.600ml
5.混合孔并转移至干净的试剂槽。
6.向384孔PCR平板中的每一孔中加入3.0μl的Exo/SAP混合物。
7.密封并迅速离心平板。确信肉眼观察每一孔确保每一孔接受等量的Exo/SAP。
8.进行Exo/SAP程序,循环平板37℃,30分钟,然后96℃10分钟。
注意:该程序被最佳化以用于MJ Research Tetrad。
9.当制备延伸混合物时在冰上融化SNP-ITTM引物池。
10.针对要被测试的SNP的类型选择正确的20x延伸混合物。
11.使用以下计算制备延伸混合物。
  平板数   1/8   1/4   1/2   1   2
  20×延伸混合物   10.5μl   21μl   42μl   84μl   168μl
  延伸混合物稀释液   197μl   395μl   790μl   1580μl   3160μl
  延伸酶   2.1μl   4.2μl   8.3μl   16.5μl   33μl
  总体积   209.6μl   420.2μl   840.3μl   1680.5μl   3361μl
12.使用以下计算稀释SNP-ITTM引物池:
  平板数   1/8   1/4   1/2   1   2
  SNP-ITTM引物池   1.6μl   3.2μl   6.3μl   12.6μl   25.2μl
  H2O   156μl   312μl   524μl   1247μl   2495μl
  总体积   157.6μl   315.2μl   530.3μl   1259.6μl   2520.2μl
13.使用多通道移液器进行移液,将稀释的SNP-ITTM引物和延伸混合物转移进试剂槽。
14.向PCR平板相应的孔中加入3μl稀释的SNP-ITTM引物池。
迅速离心平板。确信肉眼观察每一孔确保每一孔接受等量的SNP-ITTM引物池。
15.向相应的孔中加入4μl延伸混合物,通过移液器上下混合均匀。
16.将平板密封完好并离心。确信肉眼观察每一孔确保每一孔接受适量的液体。
17.将平板置于热循环仪中,进行以下程序:
步骤1-96℃,3:00
步骤2-94℃,00:20
步骤3-40℃,00:11
步骤4-重复步骤2和3,25次
步骤5-4℃最终保存
注意:该程序被最佳化以用于MJ Research Tetrad热循环仪。测试可以在此时停止。在-20℃密封并储存SNP-ITTM平板。确信平板密封完全以避免样品蒸发。
18.用无菌水将20×UHTTM prewash溶液稀释至1x。
19.用1×UHTTM prewash缓冲液冲洗SNP-ITTM平板三次。用平板冲洗器抽气干燥平板。
20.通过向9.45ml的杂交溶液中加入550μl的杂交添加剂在15ml或50ml锥形管中制备杂交液。通过振荡完全混合。
21.向每一PCR平板孔中加入8μl杂交液,通过吸头上下混合完全。然后将每一孔中的8μl的溶液转移至玻璃SNP-IT平板上的相应孔中。
22.将玻璃SNP-ITTM平板置于42℃的潮湿烘箱(或在烘箱中用湿纸巾湿化的带盖的托盘)中。温育平板2小时。如果进行了许多平板,尽量成批错开以节省时间。
23.通过混合25ml冲洗液和1.575L的水(1∶64)制备严格冲洗液(stringent wash)。
24.在杂交完全以后,用严格冲洗液冲洗SNP-ITTM平板3次。
25.同时预热SNPstream UHT***,并将预试信息输入UHTPlateExplorerTM软件。
26.从烘箱中取出SNP-ITTM平板,并使用真空歧管将其完全干燥,该真空歧管连接有管子且1ml吸头***到该管子中。切断吸头以便它不会接触到玻璃表面。切断的末端应该具有比孔大的孔。注意:平板完全干燥是非常重要的。任何残留的液体会增加由激光捕获的背景图像,并能干扰基因型判断。
27.准备平板在UHTTM***成像。如果成像前有任何延迟,将平板储存在暗处。
使用组12-17,1560个来自灾难区域的组织样品使用上述的分析方案测试。结果是大于50%的来自灾难区域的受损组织样本产生了超过40个SNP的基因型。这些结果将可能产生超过1/109的鉴定指数(identification index)。
  来自确认研究的结果总结(n=1560)
  SNP数   样品数   百分比
  >60   643   41.22
  >50   768   49.23
  >40   859   55.06
  >30   947   60.71
  >20   1038   66.54
  0、1或2个失败   457   29.29
大量试剂方案(bulk reagent protocol)
扩增可以使用大量试剂进行。在5μl和20μl体积中进行扩增的典型的反应混合物提供如下:
试剂                     5μl混合物     20μl混合物
10X PCR缓冲液II          0.5μl         3.0μl
25mM MgCl2              1.0μl         6.0μl
2.5mM dNTP               0.15μl        0.9μl
PCR引物池                0.025μl       0.15μl
水                       1.225μl       7.35μl
AmpliTaq Gold            0.1μl         0.6μl
DNA模板                  2.0μl         2.0μl
Pfu酶                    0              0.06μl
总体积                   5.0μl         20.0μl
引物序列
扩增和鉴定引物的序列提供如下。
         组5 PCR引物序列                                             SEQ.ID NO.
61955up  tagtttacctctacttcctttcttatattactc                           1
61955Lo  cacttattttggaaagtggaatc                                     2
195849up taaggcagccacgggttg                                          3
195849Lo catgtatgcctgagtgttactgc                                     4
195869up cagaacacgtgaagactgaa                                        5
195869Lo catactgaacacatactaatgcagtaatt                               6
148193up tatatttcttttcatgagttttgtgag                                 7
148193Lo cacctgtaatccccccca                                          8
238355up acttccctgtctggttactcc                                       9
238355Lo caatgtacagcttgaggacttg                                      10
63635up  tctctccctccccacctc                                          11
63635Lo  gagaacttggcagctccat                                         12
863949up tatagatgccatcagctcctc                                       13
863949Lo gaagtgtttctaagcacctgtg                                      14
211489up actgcatgtgtcagtttcagtc                                      15
211489Lo gatgagtgaagccactgaagg                                       16
206538up attttccggagtcagggtc                                         17
206538Lo gacagccaggctcaagag                                          18
233357up atttctaccgttactgtcttcttacc                                  19
233357Lo gaagtcatgctaggctattttaaaga                                  20
207845up attccatcctgtgctagatgc                                       21
207845Lo gcactttaataatttggccaga                                      22
231480up taatatttagagagcagcaaggaca                                   23
231480Lo cttcttcacccttttcccc                                         24
         组5 SNP引物序列                                             SEQ.ID NO.
84760    acgcacgtccacggtgatttatcagctcctcagatgxgcxcctgact             25
195849   ggatggcgttccgtcctattcagccacgggttgccttctgtaact               26
195869   cgtgccgctcgtgatagaatggtccagaacacgtgaagactgaat               27
148193   agcgatctgcgagaccgtatgagggtattccccaaaxctctgtgttt             28
238355   gcggtaggttcccgacatattggttactccactataaaaxattcatc             29
63635    ggctatgattcgcaatgctttctccctccccacctcctcttgtcc               30
863949   agggtctctacgctgacgatatcagctcctcagatgxgcxcctgact             31
211489   gtgattctgtacgtgtcgcctttcagtcactcattcctttcttcc               32
206538   gacctgggtgtcgatacctaagggtcgggggttctxcxtgttcatct             33
233357   agatagagtcgatgccagctccttcagaagaactcacaaaatacc               34
207845   agagcgagtgacgcatactatgtgctagatgctgxagttgtccttca             35
231480   cgactgtaggtgcgtaactcatttagagagcagcaaxgacattcctc             36
             组6 PCR引物序列                                    SEQ.ID NO.
63836-U1up   tgcctttcctccagggtc                                 37
63836-U1low  gaaattactgagctcctctggt                             38
60676-U2up   tgaattgattcaaggggatatatta                          39
60676-U2low  catattcctctcttgttctctaaacac                        40
58091-U3up   ggcagtttctttttctctctctc                            41
58091-U3low  ctcatttattatggtagacaatccc                          42
169509-U4up  taggagagaatgccagtgtg                               43
169509-U4low gttgattggccaggtgga                                 44
238155-U5up  ttgatggcaagaggtaactca                              45
238155-U5low gattcaatccaccaaacttactattt                         46
201688-U6up  aagtaacctggcctctctgag                              47
201688-U6low gtgagccaggcattcttg                                 48
57849-U7up   caactcccagtggagagg                                 49
57849-U7low  gataaggcttctgaggtgtgaa                             50
56915-U8up   tcctcggttgcttctctatc                               51
56915-U8low  cttgtcaggagtcaacagctt                              52
56608-U9up   tggtgtggagccaactgg                                 53
56608-U9low  gtctatgaggttgagtctcccc                             54
68532-U10up  aacttttctcaactactgtttgtgac                         55
68532-U10low catttgggtgtaggcggt                                 56
61500-U11up  tttttgccagttgtgtatttttatc                          57
61500-U11low caccagtacatacttgggcact                             58
66026-U12up  atttttagagtgaaaggctgct                             59
66026-U12low cataagtaaaagaaataagtctcccaa                        60
             组6 SNP引物序列                                    SEQ ID NO.
63836        acgcacgtccacggtgatttcaggctgcctttcctccagggtcca      61
60676        ggatggcgttccgtcctatttatattaaattagaatgttgacctc      62
58091        cgtgccgctcgtgatagaatcxctctctttcttcccatagag         63
169509       agcgatctgcgagaccgtattgccagtgtggctcatcaggacatc      64
238155       gcggtaggttcccgacatatatggcaagaggtaactcaa            65
201688       ggctatgattcgcaatgcttctctctgagattcagtttxcacacctg    66
57849        agggtctctacgctgacgatctggaccaacxcxcagtggagagggta    67
56915        gtgattctgtacgtgtcgcccttctctatcataagcacaatg         68
56608        gacctgggtgtcgatacctacaactgggaggagggaaatgagaac      69
68532        agatagagtcgatgccagctttgtgacaacaatacaccaagtacc      70
61500        agagcgagtgacgcatactagtgtatttttatctcatttatccca      71
66026        cgactgtaggtgcgtaactcccatttttagagtgaaaggctgctc      72
           组7 PCR引物序列                                     SEQ.ID NO
221499-UP  tttcacaattattatatcagcgaagaac                        73
221499-LO  ttgatataattaacaaagtacctgaggat                       74
89446-UP   tttgataagataaattgaattgcaatc                         75
89446-LO   ccaggaaattatcattcaggaaga                            76
229291-LO  ctaactgggcatttcaaaataagct                           77
229291-UP  catctcgtaaagaaaaaaacacatc                           78
83031-LO   cagattaygctgaatcatgtacactg                          79
83031-UP   tctggccagcattccagc                                  80
226119-LO  tctaaattgagtcaagatatagaggctttc                      81
226119-UP  gaactgacattaataatcaatgtacttaca                      82
60409-UP   tgcaggtgcaatgtttattagctc                            83
60409-LO   gtatgggaaacttaatcttgtatagtaactt                     84
220990-UP  acagtaatgagtatagctgtaaattagttatg                    85
220990-LO  aatatgttttagattcagatttataatttcc                     86
63527-UP   taccactgtttcctcctttctttct                           87
63527-LO   atttgccctaggattgagctaac                             88
230299-LO  tgcaatttgttttcacgtattcg                             89
230299-UP  cacaggcctggaaagggata                                90
58040-LO   ygaaaggaaaacctagagagagatt                           91
58040-UP   gaaacagaaagcgccaaaga                                92
231480-UP  ctaatatttagagagcagcaaggac                           93
231480-LO  cttcttcacccttttcccca                                94
62059-UP   tgataagctacaagttcaaatatactaaac                      95
62059-LO   gacatagagccagattctaccagg                            96
                                                               97
           组7 SNP引物序列                                     SEQ.ID NO.
221449     acgcacgtccacggtgattttatcagcgxagaacacttcagttgtaa     98
89446      ggatggcgttccgtcctatttgcaatcattttctgaagtttctta       99
229291     cgtgccgctcgtgatagaataaaacxcatcatagcaatctgtgaata     100
83031      agcgatctgcgagaccgtatattccagcxaagctttacttttgataa     101
226119     gcggtaggttcccgacatattaataatcaatxtacxtacataatata     102
60409      ggctatgattcgcaatgctttgtttattagctcgtttatcttcca       103
220990     agggtctctacgctgacgatatagctgtaaattagtxatgatataac     104
63527      gtgattctgtacgtgtcgccactgtttcctcctttctttctctct       105
230299     gacctgggtgtcgatacctaaggcctggaaagggaxattgtgagata     106
58040      agatagagtcgatgccagctagcgccaaagaacagagtagaacaa       106
62059      agagcgagt9acgcatactatacaaxttcaaatatactaaactattc     108
231480     cgactgtaggtgcgtaactcatttagagagcagcaaxgacattcctc     109
          组8 PCR引物序列                                   SEQ.ID NO.
56763-UP  cgaattttgtgtaggcagcct                             110
56763-LO  tctacagaggtagatagaattgaatagaag                    111
61955-UP  tacctctacttcctttcttatattactctt                    112
61955-LO  gtggatgcaggtcacttattttg                           113
204593-UP cacagaatgtgcacagagattgac                          114
204593-LO gacattgtacatgatgctgcttag                          115
65068-UP  ctggaattcttccttctaggtgta                          116
65068-LO  cttccctaaggctacacttatatattaa                      117
114977-UP tgctactaagtctcagatcaattctg                        118
114977-LO caataatatgtgtttgttagatcaatacag                    119
148193-LO tggctcacacctgtaatccc                              120
148193-UP catgagttttgtgagggtattcc                           121
66158-UP  cttacagataagagaatagaataacaaattac                  122
66158-LO  gaactgttgtgatattgtggaaaga                         123
69003-UP  aaaatacctttaacacctatttagtgtc                      124
69003-LO  ggaaacattttgtaaaaaatcaagta                        125
63811-UP  tcctaaaccaatcccaggg                               126
63811-LO  gctcctcctattacctgcaaat                            127
860850-UP catgcatccgtccatggg                                128
860850-LO atttcctgaatgactgtgtcca                            129
63189-UP  atccgtccatgggccact                                130
63189-LO  gctatttcctgaatgactgtgtcc                          131
126922-UP gtgctttgataagactgtgatcatcac                       132
126922-LO gctgcatgggtccatttgt                               133
          组8 SNP引物序列                                   SEQ.ID NO.
61955     acgcacgtccacggtgatttcttcctttcttatattactcttttc     134
65068     ggatggcgttccgtcctattttcttccttctaggtgtxtatctatac   135
114977    cgtgccgctcgtgatagaattaagtxtxaxatcaatxctgagaaaga   136
148193    agcgatctgcgagaccgtatgagggtattccccaaaxctctgtgttt   137
66158     gcggtaggttcccgacatatgagaatagaataacaaxttacttga     138
56763     ggctatgattcgcaatgcttttgtgtaggcagccttttagctctt     139
69003     agggtctctacgctgacgatatacctttaaxacctatttagtgtctt   140
63811     gtgattctgtacgtgtcgccaatcccaggggattxcagggttgca     141
860850    gacctgggtgtcgatacctatccgtccatggxccacxcgccgagaca   142
63189     agatagagtcgatgccagcttccgtccatggxccacxcgccgagaca   143
126922    agagcgagtgacgcatactatgtgatcatcacagcaggacagtat     144
204593    cgactgtaggtgcgtaactcgaatgtgcacagagattgactccac     145
          组9 PCR引物序列                                     SEQ ID NO.
56593-UP  cagagtggagagtcacaaaatgg                             146
56593-LO  aatcccttgacactggataacca                             147
217856-UP cctctttctctctcctgatctgtctat                         148
217856-LO gatggggtgtgaatatgtatacaga                           149
231735-UP ctctattatttataaagggcagaatgag                        150
231735-LO gcctgtctgtatctctctccttc                             151
81917-UP  gctctttcatctgatgccatga                              152
81917-LO  gatataggagtaatctgacagcagg                           153
62684-UP  taacacaaagaaagtatgcttttgca                          154
62684-UP  gtatgtggatgaaaatctcgcac                             155
241554-UP gtgataataaaatttttgtgcctga                           156
241554-LO catttgtttcacctgtgttcttaata                          157
126264-UP ggataatgttctccgtaaggtttatac                         158
126264-LO gagaaacaagcttgcccttaacta                            159
224922-UP caaggaaaacttacataatcacagc                           160
224922-LO gaaatataaaagctccacaaatagga                          161
81081-UP  aaagtaggcaatactgaagagtcatac                         162
81081-LO  gttcaattggcttggaagttatacc                           163
66561-LO  acttggatttaccctcattgatg                             164
66561-UP  cttcctctttggtttctgcttttaat                          165
63799-UP  gtgcccagctccctaatttct                               166
63799-LO  ctcttgtgactttcattaactatcttca                        167
119770-UP agcctggctggaaatgaag                                 168
119770-LO cttctaccctcctgtacctgattta                           169
          组9 SNP引物序列                                     SEQ.ID NO.
56593     acgcacgtccacggtgattttggagagtcacaaaatgxcccttatta     170
217856    ggatggcgttccgtcctatttttctctctcctxatctgtctatcaaa     171
231735    cgtgccgctcgtgatagaattttataaagggcagaatgaggatta       172
81917     agcgatctgcgagaccgtattcatctgatgccatgagaaagc          173
62684     gcggtaggttcccgacatatagaaagtatxcxttxgcaaaaggtcca     174
241554    ggctatgattcgcaatgctttaataaaatttttgtgcxtgaggtata     175
126264    agggtctctacgctgacgatttctccgtaaggtttxtacattgacta     176
224922    gtgattctgtacgtgtcgcccataatcacagcttttttctcccaa       177
81081     gacctgggt9tcgatacctataggcaatactgaagagtcatacaa       178
66561     agatagagtcgatgccagctgxttctgctxttaatacaaaaccag       179
63799     agagcgagtgacgcatactaagctcxctaatttcttgatggg          180
119770    cgactgtaggtgcgtaactctggctggaaat9aaggaaaggaaag       181
          组10 PCR引物序列                                SEQ.ID NO.
63836-LO  ctctggtgcccgacagc                               182
63836-up  gcatcaggctgcctttcct                             183
58091-UP  ctttttctctctctctttcttccc                        184
58091-LO  gctcatttattatggtagacaatcc                       185
68909-UP  gagtgttgggaagagagaccttc                         186
68909-LO  gctatgtggacagacccatctg                          187
238155-UP ggtacttgatggcaagaggtaact                        188
238155-LO aaacttactatttggatagagtgcttt                     189
201688-LO ctgtgagccaggcattcttg                            190
201688-UP caagtaacctggcctctctgagat                        191
57849-UP  gctggaccaactcccagtg                             192
57849-LO  gtgaatatctctcctttctctggg                        193
56915-UP  cctcggttgcttctctatcataa                         194
56915-LO  cttgtcaggagtcaacagcttc                          195
56608-LO  aggttgagtctcccccgtg                             196
56608-UP  gtggagccaactgggagga                             197
68532-UP  cttttctcaactactgtttgtgaca                       198
68532-LO  ccatttgggtgtaggcgg                              199
61500-UP  ttgccagttgtgtatttttatctca                       200
61500-LO  taacttaagcccaccagtacatact                       201
66026-UP  cccatttttagagtgaaaggctg                         202
66026-LO  taagtctcccaaggtggatacatg                        203
60676-UP  gattcaaggggatatattaaattagaat                    204
60676-LO  caagttcattattcctctcttgttctc                     205
          组10 SNP引物序列                                SEQ.ID NO.
63836     acgcacgtccacggtgatttcaggctgcctttcctccagggtcca   206
60676     ggatggcgttccgtcctatttatattaaattagaatgttgacctc   207
58091     cgtgccgctcgtgatagaatcxctctcttttcttcccatagag     208
68909     agcgatctgcgagaccgtattgttxggxagagagaccttccattcat 209
238155    gcggtaggttcccgacatatatggcaagaggtaactcaatca      210
201688    ggctatgattcgcaatgcttctctctgagattcagtttxcacacctg 211
57849     agggtctctacgctgacgatctggaccaacxcxcagtggagagggta 212
56915     gtgattctgtacgtgtcgcccttctctatcataagcacaatg      213
56608     gacctgggtgtcgatacctacaactgggaggagggaaatgagaac   214
68532     agatagagtcgatgccagctttgtgacaacaatacaccaagtacc   215
61500     agagcgagtgacgcatactagtgtatttttatctcatttatccca   216
66026     cgactgtaggtgcgtaactcccatttttagagtgaaaggctgctc   217
           组11 PCR引物序列                                 SEQ.ID NO.
212605-UP  gcctgcttcccctttatctcct                           218
212605-LO  tcttatctcccatcttcctctacac                        219
220875-UP  ctggcaatctgggcacc                                220
220875-LO  cccaagtccacacacaaattat                           221
65882-UP   gtatactaaagagtctaagtttttgcctaa                   222
65882-LO   cttccctttttccttccctt                             223
57575-UP   tgaatagtctttggtctgagcct                          224
57575-LO   aggcagagtcttatctgggaca                           225
66683-UP   cagagaattggagttggctgg                            226
66683-LO   aggaggtagcagtcacactgattc                         227
214674-UP  gacttccgattgtgaggctg                             228
214674-LO  cctccttttattcttgctcatagc                         229
248007-UP  agctcactggatgcaagagtagt                          230
248007-LO  caagtggataagatgacccattc                          231
63804-UP   gatatacaggggaaacgggct                            232
63804-LO   cctcaggggggcactttac                              233
56144-UP   tcaatcttttgatgatgtcctaaga                        234
56144-LO   ttcagcacagtattctagtattttgtg                      235
233357-UP  cgttactgtcttcttacccttcag                         236
233357-LO  ggaa9tcatgctaggctattttaa                         237
206538-UP  agggtcgggggttctgc                                238
206538-LO  ctacagcctagggacagccag                            239
60188-UP   aggatgcatgcatgctgg                               240
60188-LO   ctcagagtatgtgccattgattg                          241
           组11 SNP引物序列                                 SEQ.ID NO.
212605     acgcacgtccacggtgatttttcccctttatcctcttcgcagcct    242
220875     ggatggcgttccgtcctattatctgggcxccaggcaggtggtcaggc  243
65882      cgtgccgctcgtgatagaatagtctaagtxtttgcctaaaagcagga  244
57575      agcgatctgcgagaccgtattgaatagtctttxgtctgagcctggaa  245
66683      gcggtaggttcccgacatatagagaattggagttggctggagata    246
214674     ggctatgattcgcaatgcttccgattgtgaggctgctgagaaggg    247
248007     agggtctctacgctgacgataagagtagttggggaaaggggctgt    248
63804      gtgattctgtacgtgtcgccatacaggggaaacxggxtccgagcaga  249
56144      gacctgggtgtcgatacctatgatgatgtcctaxgaaataatgactt  250
233357     agatagagtcgatgccagctccttcagaagaactcacaaaatacc    251
60188      agagcgagtgacgcatactagatgcatgcatgctgxcxttgaggaac  252
206538     cgactgtaggtgcgtaactcagggtcgggggttctxcxtgttcatct  253
56593-UP   cagagtggagagtcacaaaatgg                            254
56593-LO   aatcccttgacactggataacca                            255
217856-UP  cctctttctctctcctgatctgtctat                        256
217856-LO  gatggggtgtgaatatgtatacaga                          257
231735-UP  ctctattatttataaagggcagaatgag                       258
231735-LO  gcctgtctgtatctctctccttc                            259
81917-UP   acttagcttggttctttgttttctaattaac                    260
81917-LO   atggaaaggcagatataggagtaatct                        261
62684-UP   taacacaaagaaagtatgcttttgca                         262
62684-UP   gtatgtggatgaaaatctcgcac                            263
241554-UP  gtgataataaaatttttgtgcctga                          264
241554-LO  catttgtttcacctgtgttcttaata                         265
126264-UP  ggataatgttctccgtaaggtttatac                        266
126264-LO  gagaaacaagcttgcccttaacta                           267
230299-LO  tgcaatttgttttcacgtattcg                            268
230299-UP  cacaggcctggaaagggata                               269
224922-UP  caaggaaaacttacataatcacagc                          270
224922-LO  gaaatataaaagctccacaaatagga                         271
66561-LO   acttggatttaccctcattgatg                            272
66561-UP   cttcctctttggtttctgcttttaat                         273
63799-UP   gtgcccagctccctaatttct                              274
63799-LO   ctcttgtgactttcattaactatcttca                       275
119770-UP  agcctggctggaaatgaag                                276
119770-LO  cttctaccctcctgtacctgattta                          277
Figure A0382054900552
56593      acgcacgtccacggtgattttggagagtcacaaaatgxcccttatta    278
217856     ggatggcgttccgtcctatttttctctctcctxatctgtctatcaaa    279
231735     cgtgccgctcgtgatagaattttataaagggcagaatgaggatta      280
81917      agcgatctgcgagaccgtattcatctgatgccatgagaaagc         281
62684      gcggtaggttcccgacatatagaaagtatxcxttxgcaaaaggtcca    282
241554     ggctatgattcgcaatgctttaataaaatttttgtgcxtgaggtata    283
126264     agggtctctacgctgacgatttctccgtaaggtttxtacattgacta    284
224922     gtgattctgtacgtgtcgcccataatcacagcttttttctcccaa      285
230299     gacctgggtgtcgatacctaaggcctggaaagggaxattgtgagata    286
66561      agatagagtcgatgccagctgxttctgctxttaatacaaaaccag      287
63799      agagcgagtgacgcatactaagctcxctaatttcttgatggg         288
119770     cgactgtaggtgcgtaactctggctggaaatgaaggaaaggaaag      289
Figure A0382054900561
63836-UP  gcatcaggctgcctttcct                                  290
63836-LO  ctctggtgcccgacagc                                    291
220875-UP ctggcaatctgggcacc                                    292
220875-LO cccaagtccacacacaaattat                               293
58091-UP  aatacttcatctctgggggca                                294
58091-LO  gctcatttattatggtagacaatcc                            295
68909-UP  gagtgttgggaagagagaccttc                              296
68909-LO  gctatgtggacagacccatctg                               297
238155-UP ggtacttgatggcaagaggtaact                             298
238155-LO aaacttactatttggatagagtgcttt                          299
201688-UP caagtaacctggcctctctgagat                             300
201688-LO ctgtgagccaggcattcttg                                 301
57849-UP  gctggaccaactcccagtg                                  302
57849-LO  gtgaatatctctcctttctctggg                             303
56915-UP  cctcggttgcttctctatcataa                              304
56915-LO  cttgtcaggagtcaacagcttc                               305
56608-UP  gtggagccaactgggagga                                  306
56608-LO  aggttgagtctcccccgtg                                  307
68532-UP  cttttctcaactactgtttgtgaca                            308
68532-LO  ccatttgggtgtaggcgg                                   309
62059-UP  tgataagctacaagttcaaatatactaaac                       310
62059-LO  gacatagagccagattctaccagg                             311
66026-UP  cccatttttagagtgaaaggctg                              312
66026-LO  taagtctcccaaggtggatacatg                             313
63836     acgcacgtccacggtgatttcaggctgcctttcctccagggtcca        314
220875    ggatggcgttccgtcctattatctgggcxccaggcaggtggtcaggc      315
58091     cgtgccgctcgtgatagaatcxctctctttcttcccatagag           316
68909     agcgatctgcgagaccgtattgttxggxagagagaccttccattcat      317
238155    gcggtaggttcccgacatatatggcaagaggtaactcaatca           318
201688    ggctatgattcgcaatgcttctctctgagattcagtttxcacacctg      319
57849     agggtctctacgctgacgatctggaccaacxcxcagtggagagggta      320
56915     gtgattctgtacgtgtcgcccttctctatcataagcacaatg           321
56608     gacctgggtgtcgatacctacaactgggaggagggaaatgagaac        322
68532     agatagagtcgatgccagctttgtgacaacaatacaccaagtacc        323
62059     agagcgagtgacgcatactatacaaxttcaaatatactaaactattc      324
66026     cgactgtaggtgcgtaactcccatttttagagtgaaaggctgctc        325
                                                             326
76268-UP  ctgtttcatttcagcccttttag                            327
76268-LO  gttatccttagtgagttttctgtctaca                       328
70371-UP  gcgtcatatggagcctcct                                329
70371-LO  ctcatctggccttctgtgtcc                              330
58388-UP  ctgcagttcaggtggctgtt                               331
58388-LO  cctcgtctccaagggtgtct                               332
105677-UP agccattagacctgccaatc                               333
105677-LO aatgcagaggccaccagc                                 334
226119-UP gaactgacattaataatcaatgtacttaca                     335
226119-LO tctaaattgagtcaagatatagaggctttc                     336
63184-UP  ctcaagcactctctcttttcatca                           337
63184-LO  ggagtccaggtagataggaacactag                         338
63979-UP  gtgatacacgaaggcagatgat                             339
63979-LO  gactgtgaatgtacttagccccc                            340
130240-UP caacaggaagcgaggcc                                  341
130240-LO acaaggcaggaccaaggc                                 342
182622-UP gggcttgtgtgtccacaga                                343
182622-LO tgtgtcaggaagaagaagatcaac                           344
66567-UP  ctgaacccaagaacttcctgat                             345
66567-LO  tgatgagtatataaccagaaggaacac                        346
89614-UP  agcagaggatggcagtcacc                               347
89614-LO  cacctctgttcctgttttctgtta                           348
219561-UP cagtactatctcttctttaaagatctgaaa                     349
219561-LO acccagctcaagatgctctg                               350
76268     acgcacgtccacggtgatttttaggtatagttgattgttttaaga      351
70371RT   ggatggcgttccgtcctattgcgtcatatgxagcctxctgggacaag    352
58388     cgtgccgctcgtgatagaatttcaggtggctgtttcagagctcag      353
105677    agcgatctgcgagaccgtatcxattagacctgccaatcxcctggaga    354
226119    gcggtaggttcccgacatattaataatcaabxtacxtacataatata    355
63184     ggctatgattcgcaatgcttcactctctcttttcatcactcatct      356
63979     agggtctctacgctgacgatcacgaaxgcagatxatxacggtcgcct    357
130240    gtgattctgtacgtgtcgccgaagcgaggccxcaggtcaaggtggga    358
182622    gacctgggtgtcgatacctatgtgtcxacagacagtggcgggcttca    359
66567     agatagagtcgatgccagctcaagaactxcctgatatgggaatcaaa    360
89614     agagcgagtgacgcatactacagtcaccctcagagcccagaa         361
219561    cgactgtaggtgcgtaactctgaaagtagaaccaatcaaggctcc      362
216327-UP  cagtgggctctatttttttctaactt                       363
216327-LO  tggtctctcagctatggcctt                            364
248075-UP  gatcaaaaaagcatgagttcttatta                       365
248075-LO  cctcactaatggtgacacaacaag                         366
85187-UP   cccaggcaattaatgagtctg                            367
85187-LO   gtttatatattaggaacttttaggggag                     368
225225-UP  ctagacctaaatagtggccctaaat                        369
225225-LO  ctctactgaagacaaacttagaggaatg                     370
82031-UP   ttgacatcttcttagattctaaaatcac                     371
82031-LO   ctgttggcttttaaggtctcc                            372
60409-UP   tgcaggtgcaatgtttattagctc                         373
60409-LO   gtatgggaaacttaatcttgtatagtaactt                  374
221499-UP  tttcacaattattatatcagcgaagaac                     375
221499-LO  ttgatataattaacaaagtacctgaggat                    376
168115-UP  tcctgtagcattggaaaactgt                           377
168115-LO  agaaactggagttactcttgtcaga                        378
177589-UP  ctgaggaagagtgcagcatactc                          379
177589-LO  caggcatagggttgggatg                              380
173632-UP  gactcttcatggccaacacc                             381
173632-LO  attttgccactagtttttacatctcta                      382
60188-UP   aggatgcatgcatgctgg                               383
60188-LO   ctcagagtatgtgccattgattg                          384
231480-UP  ctaatatttagagagcagcaaggac                        385
231480-LO  cttcttcacccttttcccca                             386
216327     acgcacgtccacggtgatttctatttttttctaacttcagaattt    387
248075RT   ggatggcgttccgtcctattgcatgagttcttattattcaccaca    388
85187      cgtgccgctcgtgatagaatgcaattaatgagtctgxtaaaccta    389
225225     agcgatctgcgagaccgtatccctaaatttgtgttaxgcxttcccta  390
82031      gcggtaggttcccgacatattagattctxaaatcactttattcatac  391
60409      ggctatgattcgcaatgctttgtttattagctcgtttatcttcca    392
221499RT   agggtctctacgctgacgattatcagcgxagaacacttcagttgtaa  393
168115     gtgattctgtacgtgtcgccaaactgttgttcattttctcaccac    394
177589     gacctgggtgtcgatacctagtgcagcatactcattcacaga       395
173632     agatagagtcgatgccagcttcatggccaacaxcaggtagtcagtat  396
60188      agagcgagtgacgcatactagatgcatgcatgctgxcxttgaggaac  397
231480     cgactgtaggtgcgtaactcatttagagagcagcaaxgacattcctc  398
Figure A0382054900591
61955-UP    tacctctacttcctttcttatattactctt                     399
61955-LO    gtggatgcaggtcacttattttg                            400
65068-UP    ctggaattcttccttctaggtgta                           401
65068-LO    cttccctaaggctacacttatatattaa                       402
65882-UP    gtatactaaagagtctaagtttttgcctaa                     403
65882-LO    cttccctttttccttccctt                               404
148193-UP   catgagttttgtgagggtattcc                            405
148193-LO   tggctcacacctgtaatccc                               406
66158-UP    cttacagataagagaatagaataacaaattac                   407
66158-LO    gaactgttgtgatattgtggaaaga                          408
56763-UP    cgaattttgtgtaggcagcct                              409
56763-LO    tctacagaggtagatagaattgaatagaag                     410
69003-UP    aaaatacctttaacacctatttagtgtc                       411
69003-LO    ggaaacattttgtaaaaaatcaagta                         412
212605-UP   gcctgcttcccctttatcct                               413
212605-LO   tcttatctcccatcttcctctacac                          414
860850-UP   catgcatccgtccatggg                                 415
860850-LO   atttcctgaatgactgtgtcca                             416
235106-UP   gcttttgaaaaaaaataaaattgc                           417
235106-LO   ggacccatttatagttttttaactttg                        418
126922-UP   gtgctttgataagactgtgatcatcac                        419
126922-LO   gctgcatgggtccatttgt                                420
206538-UP   agggtcgggggttctgc                                  421
206538-LO   ctacagcctagggacagccag                              422
Figure A0382054900592
61955       acgcacgtccacggtgatttcttcctttcttatattactcttttc      423
65068       ggatggcgttccgtcctattttcttccttctaggtgtxtatctatac    424
65882       cgtgccgctcgtgatagaatagtctaagtxtttgcctaaaagcagga    425
148193      agcgatctgcgagaccgtatgagggtattccccaaaxctctgtgttt    426
66158       gcggtaggttcccgacatatgagaatagaataacaaxttacttga      427
56763       ggctatgattcgcaatgcttttgtgtaggcagccttttagctctt      428
69003       agggtctctacgctgacgatatacctttaaxacctatttagtgtctt    429
212605RT    gtgattctgtacgtgtcgccttcccctttatcctcttcgcagcct      430
860850      gacctgggtgtcgatacctatccgtccatggxccacxcgccgagaca    431
235106      agatagagtcgatgccagctaxaaataxaattgcttttgaatactga    432
126922      agagcgagtgacgcatactatgtgatcatcacagcaggacagtat      433
206538      cgactgtaggtgcgtaactcagggtcgggggttctxcxtgttcatct    434
Figure A0382054900601
228468-UP       cctactttcagatcctgagtcttgt                   435
228468-LO       gcctctggtgttatttagactcc                     436
214674-UP       gacttccgattgtgaggctg                        437
214674-LO       cctccttttattcttgctcatagc                    438
126243-UP       ccagtgtttgaatgccgct                         439
126243-LO       gaagcggaggtttcagcag                         440
207160-UP       tgaatgaattaacaaagtcatggag                   441
207160-LO       ctctgcccccattccaac                          442
66683-UP        cagagaattggagttggctgg                       443
66683-LO        aggaggtagcagtcacactgattc                    444
211324-UP       tgccacacagtttggagtga                        445
211324-LO       cattcaatgggggagatgg                         446
214373-UP       ctggcaggcaagagatgtga                        447
214373-LO       gactggaaaggaacaaagaggtg                     448
234217-UP       acagtcatttgtacttacggagcg                    449
234217-LO       gagcctgcctcaacgagaag                        450
63404-UP        aggggctargtttggagaagag                      451
63404-LO        aatgcaaagaccacatctatcaat                    452
72171-UP        cacctgacctccagcaagag                        453
72171-LO        ggtgtgtccctgtgtgtagtgg                      454
Amel-2-short-UP ccagataaagtggtttctcaagtg                    455
Amel-2-short-LO gggaagctggtggtaggaac                        456
Figure A0382054900602
228468   acgcacgtccacggtgattttcctgagtcttgttttgacccatga      457
214674RT ggatggcgttccgtcctattccgattgtgaggctgctgagaaggg      458
126243   cgtgccgctcgtgatagaataatgccgctgtgagacaaaggg         459
207160   agcgatctgcgagaccgtataacaaagtcatggagaaatcaactc      460
66683    gcggtaggttcccgacatatagagaattggagttggctggagata      461
211324   ggctatgattcgcaatgctttttgccacacagttxggagtgacccaa    462
214373RT agggtctctacgctgacgatggcaagagatgtgacaggcaagagt      463
234217   gacctgggtgtcgatacctaacttacggagcgctctttgtgagaa      464
63404    agatagagtcgatgccagctrgtttggagaxgagcctacrtcttaac    465
72171    cgactgtaggtgcgtaactctccaxcaagaggaatxcaagaatgcta    466
Amel-2U8 gtgattctgtacgtgtcgccgataaagtggtttctcaagtggtcc      467
表1.受损核酸样品组A的基因型,使用组5(共12个SNP)。样品是纯合子(XX或YY),杂合子(XY),或样品没有对每个SNP分型(一)。
84760  195849  195869  148193  238355  63635  863949  211489  206538  233357  207845  231480 #成功的SNP数
 DQ 31770  -   XX   XY   YY   XX   XX   YY   XX   XY   YY   YY   XX     11/12
 DQ 31749  -   YY   -   YY   -   YY   XX   XX   XX   XY   XY   XY     9/12
 DQ 31965  -   XY   -   YY   XX   XY   XX   XX   YY   YY   XX   YY     10/12
 DQ232121  -   YY   YY   XY   XX   XY   YY   XX   YY   YY   YY   XY     11/12
 DQ 14700  -   XY   -   XY   XX   XY   XX   XX   -   YY   YY   XY     9/12
 DQ 14704  -   XY   -   XY   -   XY   -   -   YY   XY   -   XY     6/12
 DQ 14775  -   YY   YY   XY   -   YY   YY   XX   YY   XY   YY   XY     10/12
 DQ 12793  -   XY   -   XY   XX   XY   XY   -   XY   XY   XY   XY     9/12
 DQ 12792  -   -   -   XX   XX   XY   YY   -   YY   YY   XX   YY     8/12
 DQ 14686  -   XY   -   XX   XX   XY   XX   -   XY   XY   YY   XY     9/12
  表2.受损核酸样品组A和受损核酸样品组B的基因型,使用组6(共12个SNP)。样品是纯合子(XX或YY),杂合子(XY),或样品没有对每个SNP分型(一)。
 63836   60676   58091   169509   238155   201688   57849   56915   56608   68532   61500   66026 #成功的SNP数
  DQ12792   XY   YY   XY   XY   YY   XY   XY   XY   XY   XX   XY   XY   12/12
  DQ12793   XY   XY   XY   XY   XY   XY   XY   XY   XY   XY   XY   XY   12/12
  DQ14686   XY   XY   XY   XY   XY   XY   XX   YY   XX   XY   XY   XY   12/12
  DQ14775   XY   YY   XY   YY   YY   XY   XX   XX   XY   XX   XY   XY   12/12
  DQ14700   XY   YY   XY   XY   XX   YY   XY   YY   XX   XY   XY   XY   12/12
  DQ14704   XY   XX   YY   XY   XY   XY   YY   XX   XY   XY   XY   XY   12/12
  DQ231770   YY   YY   XX   XY   YY   YY   XY   XX   XX   XY   XY   XY   12/12
  DQ231965   XY   XY   XY   -Y   XY   XY   XY   XY   XX   YY   YY   XY   12/12
  DQ232121   -   -   -   -   -   -   -   -   -   -   -   -   NoDNA
  DQ231749   YY   XY   XX   XY   XY   XY   XY   XY   XX   XY   XY   YY   12/12
  DFS 2918034   -   -   -   -   -   -   -   -   -   -   -   -   0/12
  DFS 294240   -   -   -   -   -   -   -   -   -   -   -   -   0/12
  DFS 294235   XY   YY   XX   YY   YY   XY   YY   XY   XX   XY   XY   YY   12/12
  DFS 2918027   -   -   -   -   -   -   -   -   -   -   -   -   0/12
  DFS 3260001   -   -   -   -   -   -   -   -   -   -   -   -   0/12
  DFS 3258001   YY   -   -   -   -   -   -   -   -   -   -   XY   2/12
  DFS MITO   YY   XY   YY   XY   YY   XY   XY   XY   XY   XY   XY   YY   12/12
  DFS HAIR   YY   -   -   -   -   -   XX   -   -   -   -   -   2/12
  表3.用组7进行受损核酸样品组C基因分型.组C的受损样品来源见表8所述.
  221499   89446   229291   83031   226119   60409   220990   63527   230299   58040   62059   231480
  3260-1   -   -   -   -   -   -   -   -   -   -   -   -
  3135-4   YY   -   -   XX   YY   -   -   XY   XX   YY   XX   YY
  3135-5   -   -   XX   -   -   -   -   -   -   -   XX   YY
  3135-6   -   -   -   -   -   -   -   -   -   -   -   -
  3106-4   -   YY   -   -   -   -   -   XY   -   -   YY   YY
  3106-2   -   -   -   -   -   -   -   XX   -   -   -   -
  3106-7   -   -   -   YY   YY   -   -   XX   -   -   YY   XX
  表4.用组8进行受损核酸样品组C基因分型.组C的受损样品来源见表8所述.
  61955   65068   114977   148193   66158   56763   69003   63811   860850   63189   126922   204593
  3260-1   -   -   -   -   -   -   -   -   -   -   -   -
  3135-4   -   XY   -   XX   -   YY   XX   XY   -   -   YY   -
  3135-5   -   -   -   -   -   -   -   -   -   -   -   XX
  3135-6   -   -   -   -   -   -   -   -   YY   -   -   -
  3106-4   -   YY   -   XX   -   XX   -   YY   XX   XX   YY   -
  3106-2   -   -   -   -   -   -   XX   -   -   -   -   -
  3106-7   YY   -   -   XX   XX   -   YY   XX   XX   YY   YY   -
  表5.用组11进行受损核酸样品组C基因分型.组C的受损样品来源见表8所述.
  212605   220875   65882   57575   66683   214674   248007   63804   56144   233357   60188   206538
  3260-1   XY   -   -   -   -   -   -   XX   -   -   XX   XX
  3135-4   -   -   -   -   -   YY   YY   YY   -   -   YY   YY
  3135-5   -   -   -   -   -   -   -   -   -   -   -   -
  3135-6   YY   -   -   -   -   -   -   -   -   -   -   -
  3106-4   -   -   -   -   XX   -   YY   XX   XX   YY   -   -
  3106-2   YY   -   -   -   XX   -   -   -   -   -   -   -
  3106-7   -   -   XY   XY   -   -   -   -   YY   -   YY   YY
  表6.用组9进行受损核酸样品组C基因分型.组C的受损样品来源见表8所述.
 56593   217856   231735   81917   62684   241554   126264   224922   81081   66561   63799   119770
  3260-1   -   -   -   -   -   -   -   -   -   -   -   -
  3135-4   -   XY   YY   XX   -   YY   XX   -   -   YY   -   XX
  3135-5   XY   -   -   -   -   -   -   -   -   -   XX   XX
  3135-6   -   -   -   -   -   -   -   -   -   -   -   -
  3106-4   YY   -   -   -   XX   -   XX   -   YY   -   -   YY
  3106-2   XX   -   XX   -   -   -   -   -   XX   -   -   XX
  3106-7   -   YY   -   -   -   XX   -   -   -   -   YY   -
  表7.用组10进行受损核酸样品组C基因分型.组C的受损样品的来源见表8所述.
 63836   60676   58091   68909   238155   201688   57849   56915   56608   68532   61500   66026
  3260-1   -   -   -   -   -   -   -   -   -   -   -   -
  3135-4   YY   -   XX   YY   XY   -   XY   XY   YY   XX   -   YY
  3135-5   -   -   -   -   -   -   -   -   -   -   -   -
  3135-6   -   -   -   -   -   -   -   -   -   -   -   -
  3106-4   YY   -Y   XX   YY   -   XX   XX   XX   -   XX   YY   XX
  3106-2   XY   -   -   -   -   -   -   -   -   -   -   X-
  3106-7   -   -   XX   XX   -   -   XX   -   -   -   -   XX
  表8:组C的受损核酸样品的来源
  样品号   样品类型   尝试的SNP数   成功的SNP数
  3260-1   河岸边发现的骨   60   4
3135-4 取自车中的毛发(漂白的)   60   35
  3135-5 取自车中的毛发(漂白的)   60   7
  3135-6 取自车中的毛发(漂白的)   60   2
  3106-4   毛发(参比)   60   31
  3106-2 真空吸尘中的可能毛发(非裔美国人)   60   10
  3106-7   来自项链的拭样   60   25
  表9.受损DNA样品的结果
样品号   AMEL. STR数 尝试的SNP数 成功的SNP数 SNP谱的频率
  231965   XY   3   60   12   13,908
  12792   X   1   48   31   1.22×109
  12793   XY   1   24   17   37,594
  14704   X   5   24   17   N.D.
  14686   XY   3   24   18   N.D.
  231749   XY   1   60   45   1.4×1010
  14700   XY   5   60   56   N.D.
  14775   XX   4   60   57   N.D.
  232121   XX   6   60   59   N.D.
  231770   XY   2   60   60   1.78×1022
  表10.用本发明的组分析的受损核酸
  样品号   PROT+   COF   尝试的SNP数   成功的SNP数
  524-3A   1个基因座   只是XY   71   63
  590-2A   3个基因座   只是XY   71   68
  617-1A   只是XY   只是XY   71   53
  660-1A   只是XY   NEG   71   55
  667-1A   NEG   只是XY   71   64
  1268-1A   NEG   只是XY   71   65
  1300-1A   NEG   NEG   71   16
  1337-2A   4个基因座   2个基因座   71   70
  1233-1A   NEG   NEG   71   65
  1473-2A   4个基因座   1个基因座   71   68
  1476-1A   NEG   1个基因座   71   63
  1477-1A   2个基因座   3个基因座   71   59
  1462-1A   1个基因座   NEG   71   63
  1514-1A   NEG   NEG   71   47
  1526-1A   NEG   只是XY   71   57
  1650-2A   4个基因座   2个基因座   71   68
  1747-1A   1个基因座   NEG   71   67
  1818-1A   4个基因座   2个基因座   71   68
  1819-1A   只是XY   只是XY   71   71
  1945-1A   1个基因座   NEG   71   50
  1946-1A   4个基因座   2个基因座   71   63
  2163-1B   6个基因座   4个基因座   71   68
  2181-1B   NEG   NEG   71   62
  表11.总结44个人的研究-24640个可能的基因型
  DNA量   使用70个SNP的失败数   %全部   错误分型数   %全部
  2ng   81   97.37   0   100
  320pg   159   94.84   4   99.86
  240pg   145   95.29   9   99.69
  160pg   75   97.56   9   99.7
  80pg   140   95.45   12   99.55
  40pg   223   92.76   63   97.79
  20pg   458   85.13   146   94.43
  10pg   1090   64.64   220   88.95
  2370   90.38   463   97.92
虽然本发明已经结合其特定实施方案进行了描述,可以理解能够进行进一步的修改,而且本申请目的是涵盖本发明的任何改变、使用和修改,这通常根据发明的原理并包括在本发明所属领域内已知或习惯性实践中对本发明内容的偏离,如对于前面列举的必要特征以及附加的权利要求列出的保护范围。

Claims (31)

1.一组用于分析受损核酸样品的单核苷酸多态性,其包括两种或多种单核苷酸多态性,其中该组两种或多种单核苷酸多态性的每一种选自彼此不遗传连锁的单核苷酸多态性,且其中该组两种或多种单核苷酸多态性的每一种选自位于串联重复核酸序列之外的单核苷酸多态性。
2.根据权利要求1的组,其中所述单核苷酸多态性包括选自由SEQ ID NO.25-36、61-72、98-109、134-145、170-181、206-217、242-253、278-289、314-325、351-362、387-398、423-434和457-467组成的组中的核酸序列。
3.一种从感兴趣的群体中产生用于分析受损核酸样品的一组单核苷酸多态性的方法,包括:
在感兴趣的群体的基因组中选择一组两种或多种单核苷酸多态性,其中该组两种或多种单核苷酸多态性的每一种是彼此不遗传连锁的基因组的单核苷酸多态性,且其中该组两种或多种单核苷酸多态性的每一种是位于串联重复核酸序列之外的基因组的单核苷酸多态性,由此从感兴趣的群体中产生该组单核苷酸多态性用于分析受损核酸样品。
4.根据权利要求3的方法,其中所述受损样品包括长度为大约10个核苷酸至大约100个核苷酸的核酸。
5.根据权利要求3的方法,其中所述感兴趣的群体是人类。
6.根据权利要求3的方法,其中所述感兴趣的群体是一个失踪的人。
7.一种从受损核酸的未知样品确定个体身份的方法,包括:
从个体中获得具有两种或多种单核苷酸多态性的受损核酸的未知样品;
鉴定存在于受损核酸的未知样品中的两种或多种单核苷酸多态性;
将受损样品中两种或多种单核苷酸多态性的每一种的性质和来自己知样品的一组单核苷酸多态性进行比较,以确定未知样品的两种或多种单核苷酸多态性的每一种和所述组之间的匹配数目,其中所述组包括两种或多种彼此不遗传连锁、并位于串联重复核酸序列之外的单核苷酸多态性;及
根据未知样品中两种或多种单核苷酸多态性的每一种和已知样品之间的匹配数目确定未知样品和已知样品来自相同或相关个体的概率,由此从受损核酸未知样品确定个体的身份。
8.一种从受损核酸的未知样品确定个体身份的方法,包括:
从个体获得具有两种或多种单核苷酸多态性的受损核酸的未知样品;
获得具有两种或多种单核苷酸多态性的核酸的已知样品;
选择一组两种或多种单核苷酸多态性,其中该组两种或多种单核苷酸多态性的每一种彼此不遗传连锁,并且其中该组单核苷酸多态性的每一种位于串联重复核酸序列之外;
确定受损核酸样品中存在的该组两种或多种单核苷酸多态性的每一种的性质;以及
确定已知样品中存在的该组两种或多种单核苷酸多态性的每一种的性质;
比较在已知样品中观察到的该组两种或多种单核苷酸多态性的性质与在受损核酸的未知样品中观察到的该组两种或多种单核苷酸多态性的性质;以及
确定未知样品和已知样品来自相同或相关个体的概率,因而确定受损核酸的未知样品的个体身份。
9.根据权利要求7的方法,其中所述已知样品和未知样品来自相同个体。
10.根据权利要求7的方法,其中所述已知样品来自一个家族成员。
11.根据权利要求7的方法,其中所述受损核酸样品包括长度为大约10个核苷酸至大约100个核苷酸的核酸片段。
12.根据权利要求7的方法,其中使用单碱基引物延伸反应确定一或多个单核苷酸多态性的性质。
13.根据权利要求7的方法,其中受损样品的两种或多种单核苷酸多态性在一多重反应中鉴定。
14.根据权利要求7的方法,其中该组两种或多种单核苷酸多态性在一多重反应中鉴定。
15.根据权利要求7的方法,其中该组两种或多种单核苷酸多态性在一阵列中鉴定。
16.根据权利要求7的方法,其中受损样品的两种或多种单核苷酸多态性在一阵列中鉴定。
17.根据权利要求15的方法,其中所述阵列是可寻址阵列。
18.根据权利要求16的方法,其中所述阵列是可寻址阵列。
19.根据权利要求15的方法,其中所述阵列是虚拟阵列。
20.根据权利要求16的方法,其中所述阵列是虚拟阵列。
21.一种对受损核酸样品进行基因分型的方法,包括:
从个体获得受损核酸样品;
鉴定存在于受损核酸样品中的两种或多种单核苷酸多态性;及
将受损样品中的两种或多种单核苷酸多态性的每一种的性质与来自感兴趣的群体的一组单核苷酸多态性进行比较,以确定受损样品中的两种或多种单核苷酸多态性的每一种在感兴趣的群体中的出现频率,其中所述组包括两种或多种彼此不遗传连锁、并位于串联重复核酸序列之外的单核苷酸多态性;由此对受损核酸样品进行基因分型。
22.一种对受损核酸样品进行基因分型的方法,包括:
从个体获得受损核酸样品;
从感兴趣的群体基因组中选择一组单核苷酸多态性,所述组包括两种或多种单核苷酸多态性,其中该组两种或多种单核苷酸多态性的每一种彼此不遗传连锁、并位于串联重复核酸序列之外;
鉴定在受损核酸样品中存在的两种或多种单核苷酸多态性;及
将在受损样品中观察到的两种或多种单核苷酸多态性的性质与在所述组中观察到的两种或多种单核苷酸多态性的性质进行比较,以确定基因型,从而获得受损核酸样品的基因型。
23.根据权利要求22的基因分型的方法,其中所述单核苷酸多态性是双等位基因的,且单核苷酸多态性的等位基因的性质是T和/或C。
24.根据权利要求22的基因分型的方法,其中所述感兴趣的群体是人类。
25.根据权利要求22的基因分型的方法,其中所述样品包括人类核酸。
26.根据权利要求22的基因分型的方法,其中所述受损核酸样品中存在的两种或多种单核苷酸多态性使用单碱基引物延伸反应鉴定。
27.根据权利要求22的基因分型的方法,其中在受损核酸样品中存在的两种或多种单核苷酸多态性在一多重反应中鉴定。
28.根据权利要求22的基因分型的方法,其中在受损核酸样品中存在的两种或多种单核苷酸多态性在一阵列上鉴定。
29.根据权利要求28的基因分型的方法,其中所述阵列是可寻址阵列。
30.根据权利要求28的基因分型的方法,其中所述阵列是虚拟阵列。
31.根据权利要求22的基因分型的方法,其中所述受损核酸样品扩增至长度为大约10个核苷酸至大约100个核苷酸。
CNB038205491A 2002-06-28 2003-06-26 使用单核苷酸多态性组分析受损样品的方法和组合物 Expired - Fee Related CN100354298C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US39250402P 2002-06-28 2002-06-28
US60/392,504 2002-06-28

Publications (2)

Publication Number Publication Date
CN1723217A true CN1723217A (zh) 2006-01-18
CN100354298C CN100354298C (zh) 2007-12-12

Family

ID=30000884

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB038205491A Expired - Fee Related CN100354298C (zh) 2002-06-28 2003-06-26 使用单核苷酸多态性组分析受损样品的方法和组合物

Country Status (6)

Country Link
US (1) US20060094010A1 (zh)
EP (1) EP1573037A4 (zh)
CN (1) CN100354298C (zh)
AU (1) AU2003247715B8 (zh)
CA (1) CA2491117A1 (zh)
WO (1) WO2004003220A2 (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2740414A1 (en) * 2008-10-14 2010-04-22 Bioaccel System and method for inferring str allelic genotype from snps
US11332793B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for simultaneous amplification of target loci
US11939634B2 (en) 2010-05-18 2024-03-26 Natera, Inc. Methods for simultaneous amplification of target loci
US11332785B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11322224B2 (en) 2010-05-18 2022-05-03 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US20190010543A1 (en) 2010-05-18 2019-01-10 Natera, Inc. Methods for simultaneous amplification of target loci
US11408031B2 (en) 2010-05-18 2022-08-09 Natera, Inc. Methods for non-invasive prenatal paternity testing
US11339429B2 (en) 2010-05-18 2022-05-24 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11326208B2 (en) 2010-05-18 2022-05-10 Natera, Inc. Methods for nested PCR amplification of cell-free DNA
US9677118B2 (en) 2014-04-21 2017-06-13 Natera, Inc. Methods for simultaneous amplification of target loci
EP2572003A4 (en) 2010-05-18 2016-01-13 Natera Inc METHOD FOR NONINVASIVE PRANATAL PLOIDIE ASSIGNMENT
US10316362B2 (en) 2010-05-18 2019-06-11 Natera, Inc. Methods for simultaneous amplification of target loci
CN106460070B (zh) 2014-04-21 2021-10-08 纳特拉公司 检测染色体片段中的突变和倍性
WO2016183106A1 (en) 2015-05-11 2016-11-17 Natera, Inc. Methods and compositions for determining ploidy
US11001880B2 (en) 2016-09-30 2021-05-11 The Mitre Corporation Development of SNP islands and application of SNP islands in genomic analysis
US11485996B2 (en) 2016-10-04 2022-11-01 Natera, Inc. Methods for characterizing copy number variation using proximity-litigation sequencing
US10011870B2 (en) 2016-12-07 2018-07-03 Natera, Inc. Compositions and methods for identifying nucleic acid molecules
US11525159B2 (en) 2018-07-03 2022-12-13 Natera, Inc. Methods for detection of donor-derived cell-free DNA

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5856092A (en) * 1989-02-13 1999-01-05 Geneco Pty Ltd Detection of a nucleic acid sequence or a change therein
US6013431A (en) * 1990-02-16 2000-01-11 Molecular Tool, Inc. Method for determining specific nucleotide variations by primer extension in the presence of mixture of labeled nucleotides and terminators
US5846710A (en) * 1990-11-02 1998-12-08 St. Louis University Method for the detection of genetic diseases and gene sequence variations by single nucleotide primer extension
US5888819A (en) * 1991-03-05 1999-03-30 Molecular Tool, Inc. Method for determining nucleotide identity through primer extension
US6004744A (en) * 1991-03-05 1999-12-21 Molecular Tool, Inc. Method for determining nucleotide identity through extension of immobilized primer
US5853989A (en) * 1991-08-27 1998-12-29 Zeneca Limited Method of characterisation of genomic DNA
US5302510A (en) * 1992-07-27 1994-04-12 Life Technologies, Inc. DNA sizing control standards for electrophoretic analyses
US5470723A (en) * 1993-05-05 1995-11-28 Becton, Dickinson And Company Detection of mycobacteria by multiplex nucleic acid amplification
WO1995012607A1 (en) * 1993-11-03 1995-05-11 Molecular Tool, Inc. Single nucleotide polymorphisms and their use in genetic analysis
JPH11505126A (ja) * 1995-05-19 1999-05-18 アボツト・ラボラトリーズ プライマーシリーズ集団を使用する広い動的範囲の核酸検出
US5882857A (en) * 1995-06-07 1999-03-16 Behringwerke Ag Internal positive controls for nucleic acid amplification
WO1997035033A1 (en) * 1996-03-19 1997-09-25 Molecular Tool, Inc. Method for determining the nucleotide sequence of a polynucleotide
CA2260749A1 (en) * 1996-07-16 1998-01-22 Gen-Probe Incorporated Methods for detecting rna analytes using modified probes
US6133436A (en) * 1996-11-06 2000-10-17 Sequenom, Inc. Beads bound to a solid support and to nucleic acids
WO1999014228A1 (en) * 1997-09-17 1999-03-25 Affymetrix, Inc. Genetic compositions and methods
US6268146B1 (en) * 1998-03-13 2001-07-31 Promega Corporation Analytical methods and materials for nucleic acid detection
US6270973B1 (en) * 1998-03-13 2001-08-07 Promega Corporation Multiplex method for nucleic acid detection
US6235480B1 (en) * 1998-03-13 2001-05-22 Promega Corporation Detection of nucleic acid hybrids
US5952202A (en) * 1998-03-26 1999-09-14 The Perkin Elmer Corporation Methods using exogenous, internal controls and analogue blocks during nucleic acid amplification
US6074831A (en) * 1998-07-09 2000-06-13 Agilent Technologies, Inc. Partitioning of polymorphic DNAs
US6268147B1 (en) * 1998-11-02 2001-07-31 Kenneth Loren Beattie Nucleic acid analysis using sequence-targeted tandem hybridization
US20020025519A1 (en) * 1999-06-17 2002-02-28 David J. Wright Methods and oligonucleotides for detecting nucleic acid sequence variations
US6090590A (en) * 1999-08-10 2000-07-18 The Regents Of The University Of California Reducing nontemplated 3' nucleotide addition to polynucleotide transcripts
US6107061A (en) * 1999-09-18 2000-08-22 The Perkin-Elmer Corporation Modified primer extension reactions for polynucleotide sequence detection
WO2001029262A2 (en) * 1999-10-15 2001-04-26 Orchid Biosciences, Inc. Genotyping reagents, kits and methods of use thereof
US6287778B1 (en) * 1999-10-19 2001-09-11 Affymetrix, Inc. Allele detection using primer extension with sequence-coded identity tags
US6506568B2 (en) * 2000-02-10 2003-01-14 The Penn State Research Foundation Method of analyzing single nucleotide polymorphisms using melting curve and restriction endonuclease digestion
US6818758B2 (en) * 2000-02-22 2004-11-16 Applera Corporation Estrogen receptor beta variants and methods of detection thereof

Also Published As

Publication number Publication date
AU2003247715A1 (en) 2004-01-19
US20060094010A1 (en) 2006-05-04
AU2003247715B8 (en) 2008-06-05
EP1573037A4 (en) 2007-05-09
CA2491117A1 (en) 2004-01-08
WO2004003220A2 (en) 2004-01-08
WO2004003220A3 (en) 2005-08-04
EP1573037A2 (en) 2005-09-14
CN100354298C (zh) 2007-12-12
AU2003247715B2 (en) 2008-01-10

Similar Documents

Publication Publication Date Title
CN1289690C (zh) Rna序列扩增的方法和组合物
CN1723217A (zh) 使用单核苷酸多态性组分析受损样品的方法和组合物
CN1118581C (zh) 对dna的特性分析
CN1227357C (zh) 用于扩增核酸序列的方法
CN1034673C (zh) 检测核苷酸顺序的方法
CN1154733C (zh) 改进的热稳定dna聚合酶
CN1608137A (zh) 通过同时探查和酶介导检测的多态性基因座多重分析
CN1198943C (zh) 通过裂解脱碱基位点的核酸产生可延伸的上游dna片段而鉴定核酸分子的方法
CN1219972A (zh) 短串联重复基因座的多重扩增
CN1071955A (zh) 分支杆菌引物及探针
CN1370242A (zh) 基因组分布分析:一种检测复杂生物样品中多种类型生物的存在的快速方法
CN100351393C (zh) 核苷酸多态性的检测方法
CN1578841A (zh) 退火控制引物及该退火控制引物的使用
CN1898395A (zh) 基于引物的核酸的多重扩增的方法和试剂盒
CN1650031A (zh) 基因组变异的快速分析
CN1592792A (zh) 检测核酸的材料和方法
CN1451050A (zh) 控制水相介质的微生物质量的方法及其试剂盒
CN1040220A (zh) 一种扩增核苷酸顺序的方法
CN1656233A (zh) 利用切割剂扩增核酸片段
CN1806051A (zh) 通过(例如)t细胞受体v/d/j基因中的重复鉴定克隆性细胞
CN1325458A (zh) 核酸扩增和测序方法
CN1863927A (zh) 核酸检测分析
CN1665938A (zh) 检测序列差异的方法
CN1977050A (zh) 丙型肝炎病毒基因型的确定
CN1876843A (zh) 检测突变和/或多态性的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee