CN107002118B - 用于无细胞dna的定量遗传分析的方法 - Google Patents

用于无细胞dna的定量遗传分析的方法 Download PDF

Info

Publication number
CN107002118B
CN107002118B CN201480081729.4A CN201480081729A CN107002118B CN 107002118 B CN107002118 B CN 107002118B CN 201480081729 A CN201480081729 A CN 201480081729A CN 107002118 B CN107002118 B CN 107002118B
Authority
CN
China
Prior art keywords
dna
probe
artificial sequence
cfdna
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201480081729.4A
Other languages
English (en)
Other versions
CN107002118A (zh
Inventor
克里斯多弗·K·雷蒙德
林继力
克里斯多弗·D·阿莫尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Resolution Bioscience Inc
Original Assignee
Resolution Bioscience Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Resolution Bioscience Inc filed Critical Resolution Bioscience Inc
Priority to CN202210630244.2A priority Critical patent/CN115029342A/zh
Publication of CN107002118A publication Critical patent/CN107002118A/zh
Application granted granted Critical
Publication of CN107002118B publication Critical patent/CN107002118B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Plant Pathology (AREA)
  • Immunology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了在个体中进行遗传分析的方法,其在单次分析中揭示靶向的和特异性基因组基因座的遗传序列和染色体拷贝数。本发明还提供了用于灵敏和特异性检测靶基因序列和基因表达谱的方法。

Description

用于无细胞DNA的定量遗传分析的方法
关于序列表的声明
提供了以文本格式代替纸质拷贝的与本申请相关的序列表,并且通过引用将其并入本说明书中。包含序列表的文本文件的名称为CLFK_002_00US_ST25.txt。文本文件为117KB,创建于2014年8月22日,并通过EFS-Web以电子方式提交。
背景
技术领域
本发明通常涉及用于对无细胞DNA(cfDNA)进行定量遗传分析的组合物和方法。特别地,本发明涉及用于cfDNA的遗传表征和分析的改进的靶序列捕获组合物和方法。
相关技术描述
越来越清楚的是,大多数(如果不是全部)最常见的人类癌症是人类基因组的疾病。新出现的状况是在个体一生中体细胞突变累积,其中一些增加了它们所拥有的细胞可以发展成肿瘤的可能性(Vogelstein等人,Science 339(6127):1546-1558(2013))。仅具有累积的突变事件的错误组合,癌前生长失去了约束不受控制的增殖的限制,并且所得到的细胞团块变成癌症。必需且足以引起癌症的突变的群集通常统称为“驱动突变”。从最近和透彻的分子分析中出现的主题之一是癌症,一度被认为是单一的组织特异性疾病,事实上是一组相关疾病,每一种都有独特的分子病理学。人类基因组计划为癌症的全基因组分析奠定了基础。
例如,引入下一代测序技术(2004年至今)已加速了作为NSCLC诊断基础的致病基因组因子的发现步伐,从而清楚地表明NSCLC是真正的相关疾病家族,其中每一个可能是响应于不同的靶向治疗。
该技术缺乏用于遗传疾病分析的可靠和强大的分子分析方法。传统上,分子诊断学已由基于抗体的检测(免疫组织化学)、与DNA探针的原位杂交(荧光原位杂交)以及查询特定核苷酸序列的杂交或基于PCR的检测组成。直到最近,作为分子诊断工具的DNA测序通常限于一个或两个基因的编码外显子。尽管DNA测序已经用于实体癌的诊断和治疗,但是这些方法最显著的缺点之一是它们需要直接进入肿瘤组织。这种材料通常难以从用于诊断疾病的初始活检中获得,并且实际上不可能随时间以多次重复获得。类似地,不可能在患有不可进入的肿瘤的患者中进行活检,并且在患有转移性疾病的个体中不实用。
因此,用于遗传疾病、胎儿检测、亲子鉴定、预测对药物治疗的响应、诊断或监测医疗状况、孟德尔病症、遗传嵌合、病原体筛选、微生物组分析和器官移植监测的分子诊断的巨大潜力尚未实现。到目前为止,现有的分子诊断方法缺乏有效的克隆和扩增单个DNA分子的解决方案,以及有效靶向测序到特定基因组基因座的解决方案,其灵敏度足以将真阳性检测结果与样本处理过程中出现的假阳性信号区分开。
发明概述
本发明通常涉及组合物和方法,其用于对cfDNA进行遗传分析的改进的组合物和方法。
在各种实施方案中,提供了用于无细胞DNA(cfDNA)的遗传分析的方法,其包括:用一种或多种末端修复酶处理cfDNA以产生末端修复的cfDNA;将一个或多个衔接子连接到末端修复的cfDNA的每个末端以产生cfDNA文库;扩增cfDNA文库以产生cfDNA文库克隆;测定cfDNA克隆文库中基因组当量的数量;以及对cfDNA文库克隆中一个或多个靶遗传基因座进行定量遗传分析。
在具体的实施方案中,该方法还包括从对象的生物样本中分离cfDNA。
在另一实施方案中,从生物样本中分离所述cfDNA,所述生物样本选自:羊水、血液、血浆、血清、***、淋巴液、脑脊髓液、眼内液、尿、唾液、粪便、粘液和汗液。
在某一实施方案中,一个或多个衔接子包含多个衔接子种类。
在具体的实施方案中,一个或多个衔接子各自包含用于扩增cfDNA文库的引物结合位点。
在另一实施方案中,一个或多个衔接子各自包含一个或多个独特读取编码。
在另一实施方案中,一个或多个衔接子各自包含用于样本多重分析的一个或多个样本编码。
在另一实施方案中,一个或多个衔接子各自包含用于DNA测序的一个或多个序列。
在具体的实施方案中,对cfDNA克隆文库进行qPCR,并将qPCR测量结果与已知基因组当量的标准物进行比较以确定cfDNA克隆文库的基因组当量。
在另一具体的实施方案中,用结合Alu序列的引物和结合衔接子中序列的引物进行qPCR。
在某一实施方案中,对cfDNA文库克隆中的多个遗传基因座进行定量遗传分析。
在另一实施方案中,对多个cfDNA克隆文库中的多个遗传基因座进行定量遗传分析。
在另一实施方案中,定量遗传分析包括将一个或多个捕获探针与靶遗传基因座杂交以形成捕获探针-cfDNA克隆复合物。
在具体的实施方案中,定量遗传分析包括分离捕获探针-cfDNA克隆复合物。
在某一实施方案中,定量遗传分析包括扩增所分离的杂交的捕获探针-cfDNA克隆复合物中的cfDNA克隆序列。
在另一实施方案中,定量遗传分析包括DNA测序以产生多个测序读取。
在另一实施方案中,定量遗传分析包括多个测序读取的生物信息学分析。
在具体的实施方案中,使用生物信息学分析:以定量在所述cfDNA克隆文库中分析的基因组当量的数量;以检测靶遗传基因座中的遗传变体;以检测靶遗传基因座内的突变;以检测靶遗传基因座内的遗传融合;和以测量靶遗传基因座内的拷贝数波动。
在另一实施方案中,对象未患遗传疾病。
在某一实施方案中,对象未被诊断患有遗传疾病。
在另一实施方案中,对象已被诊断患有遗传疾病。
在另一实施方案中,定量遗传分析用于鉴定或检测导致遗传疾病或与遗传疾病相关的一个或多个遗传损伤。
在某一实施方案中,遗传损伤包括核苷酸转换或颠换、核苷酸***或缺失、基因组重排、拷贝数变化或基因融合。
在具体的实施方案中,遗传损伤包括将ALK基因的3'编码区融合到另一基因的基因组重排。
在具体的实施方案中,将ALK基因的3'编码区融合到EML4基因。
在另一实施方案中,遗传疾病是癌症。
在另一实施方案中,对象是怀孕的。
在另一实施方案中,将定量遗传分析用于鉴定或检测胎儿cfDNA中一个或多个靶遗传基因座的一个或多个遗传变体或遗传损伤。
在具体的实施方案中,对象是移植接受者。
在另一实施方案中,将定量遗传分析用于鉴定或检测对象中的供体cfDNA。
在不同的实施方案中,提供了预测、诊断或监测对象中的遗传疾病的方法,其包括:从对象的生物样本中分离或获得cfDNA;用一种或多种末端修复酶处理cfDNA以产生末端修复的cfDNA;将一个或多个衔接子连接到末端修复的cfDNA的每个末端以产生cfDNA文库;扩增cfDNA文库以产生cfDNA克隆文库;测定cfDNA克隆文库中基因组当量的数量;以及对cfDNA克隆文库中与遗传疾病相关的一个或多个靶遗传基因座进行定量遗传分析,其中鉴定或检测到所述一个或多个靶遗传基因座中的一个或多个遗传损伤预测出所述遗传疾病、诊断出遗传疾病或监测到遗传疾病的进展。
在另一实施方案中,从生物样本中分离所述cfDNA,所述生物样本选自:羊水、血液、血浆、血清、***、淋巴液、脑脊髓液、眼内液、尿、唾液、粪便、粘液和汗液。
在某一实施方案中,遗传损伤包括核苷酸转换或颠换、核苷酸***或缺失、基因组重排、拷贝数变化或基因融合。
在具体的实施方案中,遗传损伤包括将ALK基因的3'编码区融合到另一基因的基因组重排。
在另一实施方案中,将ALK基因的3'编码区融合到EML4基因。
在具体的实施方案中,遗传疾病是癌症。
在不同的实施方案中,提供了用于遗传疾病的伴随诊断,其包括:从对象的生物样本中分离或获得cfDNA;用一种或多种末端修复酶处理cfDNA以产生末端修复的cfDNA;将一个或多个衔接子连接到末端修复的cfDNA的每个末端以产生cfDNA文库;扩增cfDNA文库以产生cfDNA克隆文库;测定所述cfDNA克隆文库中基因组当量的数量;以及对cfDNA克隆文库中与遗传疾病相关的一种或多种生物标记进行定量遗传分析,其中检测或未检测到一种或多种生物标记中的至少一种指示对象是否应针对遗传疾病进行治疗。
在具体的实施方案中,从生物样本中分离所述cfDNA,所述生物样本选自:羊水、血液、血浆、血清、***、淋巴液、脑脊髓液、眼内液、尿、唾液、粪便、粘液和汗液。
在另一实施方案中,生物标记是遗传损伤。
在具体的实施方案中,遗传损伤包括核苷酸转换或颠换、核苷酸***或缺失、基因组重排、拷贝数变化或基因融合。
在另一实施方案中,遗传损伤包括将ALK基因的3'编码区融合到另一基因的基因组重排。
在另一实施方案中,将ALK基因的3'编码区融合到EML4基因。
在某一实施方案中,遗传疾病是癌症。
附图说明
图1显示了在不存在独特读取过滤的情况下,预期的相对于观察的变体频率作为混合稀释度函数。在没有独特的读取过滤的情况下,在这四个选择的位置处发生具有可测量的非零频率的随机碱基变化;因此,表明检测具体单核苷酸变体(SNV)缺乏灵敏性。
图2显示了对图1中生成的数据进行的独特读取过滤。左图显示了来自图1的针对BRAF I326T SNV的数据,没有独特读取过滤。右图显示使用相同数据的独特读取过滤增加了分析灵敏度,并允许区分真实信号和易出错的噪声。
图3显示作为长度和洗涤温度的函数的捕获探针性能。y轴显示与每个捕获探针相关的读取总数。条形图中的条形被分成两个类别,其中开口条形对应于与预期捕获探针目标对齐的中靶读取,实心条形显示与捕获探针相关联但映射到基因组的非预期区域的脱靶读取。总体而言,40-mer和60-mer捕获探针在44℃和47℃的洗涤下表现基本相同。在50℃洗涤下,40-mer捕获探针会不规律地运行。这些数据验证了在约44℃至约47℃范围的洗涤温度下使用40-mer捕获探针。
图4显示了ALK基因的内含子19的靶向和定向测序的示意图。A)在“野生型”参考序列中,反义定向的ALK捕获探针鉴定来自内含子19的序列。B)在致病融合基因的情况下,一些ALK捕获探针将鉴定与基因融合事件相关的连接序列。
图5显示了用于靶区域完全测序的高密度捕获探针放置的示意图。每个捕获探针捕获在每个碱基位置提供累积覆盖的序列集合。这里,覆盖由线表示,并且线的振幅表示来自具体捕获探针的覆盖深度。来自相邻捕获探针的重叠覆盖提供了在两个可能方向上靶区域的完全测序。此外,相反链捕获探针的头对头放置确保所有捕获探针结合位点被测序。
图6显示在文库构建中使用的片段化DNA的大小分布的代表性实例。
图7显示了在代表性实验中高密度40-mer捕获探针的性能。y轴显示读取的总数,其分为中靶读取、脱靶读取和不可映射读取。x轴列举了本实验中用于序列捕获的105个捕获探针中的每一个。
图8显示使用高密度40-mer捕获探针的靶区域的累积覆盖的代表性实例。这里显示的是TP53编码外显子的累积覆盖。
图9A显示了无细胞DNA(cfDNA)文库的大小分布的代表性实例。显性带与连接到90bp衔接子的170±10bp片段的集合一致。图9B显示了使用本文所公开和/或涉及的方法产生的cfDNA和代表性cfDNA文库的已发表的凝胶图像。定性的“梯型”外观在文库中是保守的,但是通过加入90bp的衔接子序列将文库转变到更高的质量。图9C显示来自卵巢癌患者(OvC)和“健康供体”(HD)的基因组、血浆衍生的cfDNA文库的代表性实例。
图10显示了来自四个血浆样本的跨越8个cfDNA文库的独特读取计数。在用该样本23407构建文库之前进行片段化(frag)使文库产量增加超过两倍。
图11显示了跨越TP53基因区域的cfDNA的代表性读取覆盖。随机选择由“TP53_NM_000546_chr17:7579351:区域_3:280nt:41:80:r”捕获探针(SEQ ID NO:201)捕获的24个131bp读取,并在UCSC基因组浏览器中使用BLAST算法比对。21个读取映射到靶区域,并且它们以重叠覆盖模式那样做。用箭头标记用于捕获这些读取的探针。
图12显示来自cfDNA基因组文库的TP53基因编码区的靶向DNA测序的概述。覆盖(水平轴)延伸跨越所有10个编码区,并且包括涉及mRNA剪接的内含子区。测序深度(垂直轴)达到最大值4851,并且在所有编码外显子上是相同的。
图13显示在基于ACA2的分析中独特读取计数相对于qPCR估计的基因组当量的图。qPCR测量结果显示在X轴上,与之相对的读取计数显示在Y轴上。这些测量之间的完美一致性显示为对角线。在测量之间存在非常差的(如果有的话)相关性,尤其是在较低的基因组输入时。这些数据显示基于ACA2的qPCR分析长期低估了文库复杂性,并且不足以测量基因组当量。
图14显示了将基因组重复特异性引物(例如,Alu)和长衔接子特异性引物偶联的qPCR基因组当量测量分析的核心元件示意图。(A)使用名为ACA2的单一25nt引物(引物1)进行标准文库扩增。(B)较长58nt版本的ACA2引物(引物2)由于茎环抑制而不扩增基因组文库。(C)针对共有的人Alu重复元件(引物3和引物4)的正向引物和反向引物来识别1000个基因座,并且便利地扩增基因组DNA。(D)与长ACA2引物(引物2)偶联的单独的单一Alu引物(正向或反向)(引物3或引物4),不扩增基因组DNA。(E)与(D)中便利地扩增含有Alu序列的基因组cfDNA文库克隆相同的引物对。
图15显示基因组当量的基于Alu加衔接子的qPCR分析的概念验证数据。(A)用各种PCR引物扩增10pg标准基因组文库。x轴所示为用于扩增的PCR引物,Y轴(对数标尺)所示为以fg/μL为单位测量的PCR信号。如预期的,标准ACA2引物产生强信号。ACA2长引物由于PCR抑制而不能产生信号。两个Alu引物对都产生1%ACA2量的信号,表明1%的克隆具有可扩增的Alu序列。任何Alu引物与长的ACA2引物的组合,也在
Figure GDA0003420037120000081
1%的克隆中产生信号。(B)针对10pg基因组DNA(左边四个样本)或10pg文库DNA(右边四个克隆)的验证。Alu引物对扩增来自基因组DNA或基因组文库的可比信号。相比之下,由Alu引物和长的ACA2引物组成的引物对,很少(L+A1F)或根本不(L+A1R)扩增基因组DNA。这些相同的引物对展示稍微超过来自Alu引物对的信号的文库扩增。
图16显示ACA2引物qPCR分析与Alu-ACA2长引物qPCR分析的直接比较。Alu ACA2长引物qPCR分析显示可检测的基因组当量增加8倍,这与来自测序数据的独特读取计数更一致。
图17显示了提供对所分析的基因组当量进行精确测定的高灵敏度、定量遗传分析的衔接子结构和功能的代表性实例。(A)衔接子连接链的精细结构。在实施例4中提供了与每个编号的元件相关的细节。(B)在45nt连接链和12nt伴侣寡核苷酸链之间形成的双链体,产生与末端修复的cfDNA片段(实心条形)相容的平末端连接底物。(C)连接后,通过DNA聚合酶介导的填充反应产生针对连接链的互补序列。
图18显示了处理成模拟cfDNA的两个DNA样本(NA06994&NCI-H2228)的尺寸分布的代表性实例。
图19显示了在与正常基因组DNA(N)混合的肿瘤样本DNA(H2228)中,TP53点突变Q331*的检测灵敏度的代表性实例。最灵敏的检测对应于1000个正常基因拷贝中TP53的
Figure GDA0003420037120000091
1个突变拷贝。
图20显示使用本文涉及的组合物和方法精确测定细胞系NCI-H2228中包含的EML4-ALK融合基因的连接序列。
图21显示与正常基因组DNA(N)混合的EML4-ALK融合基因肿瘤样本DNA(H2228)的检测。由于融合作为杂合子存在于NCI-H2228细胞系中,最灵敏的检测对应于ALK基因的
Figure GDA0003420037120000092
100个正常染色体拷贝(50个基因组当量)中的一个基因融合。
图22显示在稀释到正常人DNA(N)中的细胞系NCI-H69(H69)的混合物中,MYCN基因扩增的检测。两个正常二倍体拷贝的阈值显示为红色虚线。
图23显示在三种不同癌症患者的TP53基因中检测到的DNA突变。在图的顶部显示了典型的基因模型。这些峰代表DNA序列覆盖(X轴)和深度(Y轴)。对于所有分析的样本,测序深度>4000基因组当量。基因模型下方的外显子7的扩展视图,显示了所有检测到的突变在哪里被定位。显示了cfDNA(血浆)、肿瘤组织和正常邻近组织中突变体检测的频率,如果可用(NA-不可用)。OVA1和OVA2是卵巢癌患者;CRC406和CRC407是结肠直肠癌患者。在任何OVA1样本中没有发现TP53中的突变。
图24显示较大的13个基因的组(加框)的DNA测序。测序鉴定了来自卵巢癌患者OVA1的cfDNA和肿瘤中的KRAS突变。
图25显示较大的12个基因的组的DNA测序。该测序鉴定了在结肠直肠癌患者CRC407的血浆中的ERBB2基因扩增。
发明详述
A.综述
本发明部分地涉及使用无细胞DNA(cfDNA)对个体的遗传状态进行定量遗传分析的组合物和方法。如本文所用,术语“遗传状态”是指关于非致病的正常序列或关于针对遗传病况或疾病为致病性的序列的基因组中一个或多个靶基因组序列的序列。在一实施方案中,分析遗传状态是指鉴定、定量或监测靶遗传基因座中的遗传变体,其中相对于参考序列(例如,正常序列或突变序列)该变体变化了。本发明人已经提供了遗传病况或疾病的分子诊断问题的解决方案,所述问题涉及缺乏区分真阳性和假阳性的灵敏性、单个DNA分子的无效克隆和扩增,以及对特定基因组基因座的无效靶向测序。本文涉及的解决方案包括用于可靠和稳定的定量遗传分析的组合物和方法,其灵敏度足以将真阳性检测结果与在样本处理期间出现的假阳性信号区分开。
下一代测序技术为在包括癌症、胎儿诊断、亲子鉴定、病原体筛选和器官移植监测等多种情况下的分子诊断增加广泛的基因组调查提供了机会。在遗传疾病的背景下,下一代测序信息被用于临床设置中以鉴定可能改变基因功能的基因内突变,鉴定细胞内遗传物质的获得或丧失,以及鉴定未在正常的健康细胞中发现的基因组重排。这些广泛的诊断调查的结果经常用于指导患者治疗。
然而,直接进入受影响的组织以获得样本的需要,比DNA测序在诊断和治疗个体的遗传状态或遗传病况或疾病中的潜在益处更有价值。这种材料通常难以从用于诊断疾病的初始活检中获得,并且实际上不可能随时间以多次重复获得。类似地,在癌症患者中,在患有不可进入的肿瘤的患者中不可能进行活检,并且在患有转移性疾病的个体中不实用。相反,本发明人的方法来源于以下事实:所有组织需要有通向脉管***的入口以存活,并且因此这些团块将DNA沉积到体液中。其中发现患病细胞的DNA在体液中一个主要储存库是人血液的血浆。
与依赖于浅的全基因组序列覆盖的检测方法相反,本文涉及的用于个体遗传状态、遗传疾病、孟德尔病症、遗传嵌合、胎儿检测、亲子鉴定、预测对药物治疗的响应、诊断或监测医疗状况、病原体筛选、微生物组分析和器官移植监测的分子诊断,利用cfDNA的可用性以提供选择目标基因的深层序列覆盖。此外,本文涉及的基于cfDNA的癌症诊断具有检测多种遗传变化的能力,其包括改变蛋白质功能的体细胞序列变异,产生嵌合基因融合的大规模染色体重排,以及包括基因拷贝减少或增加的拷贝数变异。使用本文涉及的组合物和方法,面对由在健康组织内发生正常转换过程所贡献的cfDNA内的正常序列的显著稀释或混合,这些改变是可检测和可定量的。本文涉及的组合物和方法也成功地解决了与检测导致疾病的稀有遗传改变相关的主要挑战;即cfDNA是高度片段化的,cfDNA水平在不同个体之间显著变化,并且患病序列相对于正常序列的混合程度在患者中是高度可变的,甚至在患有相同分子疾病和阶段的个体内也是如此。
在不同的实施方案中,用于遗传分析的组合物和方法包括检测生物流体样本和粪便样本中的DNA部分。本文涉及的方法使用可从各种生物来源获得的cfDNA,提供新颖的全面框架地址分子遗传分析。将纯化的cfDNA克隆引入了标记的cfDNA序列,其为下游的分析提供信息,并使得能够扩增所得到的克隆文库。使用具有靶特异性寡核苷酸的杂交捕获来检索特定序列用于随后的分析。将对文库中存在的基因组数目的独立测量应用于每个样本,并且这些分析提供了估计分析的灵敏度的手段。本文涉及的分析提供用于分析、检测、诊断或监测遗传状态、病况或疾病的可靠、可重复和稳健的方法。
除非特别指出相反,本发明的具体实施方案的实践,将采用在本领域技术范围内化学、生物化学、有机化学、分子生物学、微生物学、重组DNA技术、遗传学、免疫学和细胞生物学的常规方法,为了说明的目的,下面描述其中的许多。在文献中充分解释了此类技术。参见,例如,Sambrook等人,Molecular Cloning:A Laboratory Manual(第3版,2001);Sambrook等人,Molecular Cloning:A Laboratory Manual(第2版,1989);Maniatis等人,Molecular Cloning:A Laboratory Manual(1982);Ausubel等人,Current Protocols inMolecular Biology(John Wiley和Sons,2008年7月更新);Short Protocols inMolecular Biology:A Compendium of Methods from Current Protocols in MolecularBiology,Greene Pub.Associates和Wiley-Interscience;Glover,DNA Cloning:APractical Approach,vol.I&II(IRL Press,Oxford,1985);Anand,Techniques for theAnalysis of Complex Genomes,(Academic Press,New York,1992);Transcription andTranslation(B.Hames&S.Higgins,Eds.,1984);Perbal,A Practical Guide toMolecular Cloning(1984)和Harlow and Lane,Antibodies,(Cold Spring HarborLaboratory Press,Cold Spring Harbor,N.Y.,1998)。
B.定义
除非另有定义,本文使用的所有技术和科学术语具有与本发明所属领域普通技术人员通常理解的相同的含义。虽然可以将与本文所述相似或等同的任何方法和材料用于本发明的实践或检测,但本文描述了组合物、方法和材料的优选实施方案。为了本发明的目的,以下术语定义如下。
冠词“一个/一种(a/an)”和“所述(the)”在本文中用于指该冠词的一个或多于一个/一种(即至少一个/一种)的语法对象。作为示例,“一元件”是指一个元件或多于一个元件。
可供选择方案(例如,“或”)的使用,应当被理解为意指可供选择方案中的一个、两个或其任何组合。
术语“和/或”应当被理解为意指这些可供选择方案中的一个或两个。
如本文所用,术语“约”或“大约”是指相对于参考数量、参考水平、参考值、参考数、参考频率、参考百分比、参考尺寸、参考大小、参考量、参考重量或参考长度,变化多达15%、10%、9%、8%、7%、6%、5%、4%、3%、2%或1%的数量、水平、值、数、频率、百分比、尺寸、大小、量、重量或长度。在一实施方案中,术语“约”或“大约”是指约±15%、±10%、±9%、±8%、±7%、±6%、±5%、±4%、±3%、±2%或±1%的参考数量、参考水平、参考值、参考数、参考频率、参考百分比、参考尺寸、参考大小、参考量、参考重量或参考长度的数量、水平、值、数、频率、百分比、尺寸、大小、量、重量或长度的范围。
在整个说明书中,除非上下文另有要求,否则词语“包含/包括(comprise/comprises/comprising”)”将被理解为意味着包括所述步骤或元件或步骤或元件的组,但不排除任何其它步骤或元件、或步骤或元件的组。在具体的实施方案中,术语“包括”、“具有”、“含有”和“包含”同义使用。
“由...组成”意指包括并限于短语“由...组成”之后的任何内容。因此,短语“由...组成”表示所列元件是必需的或强制性的,并且不存在其它元件。
“基本上由...组成”意指包括在短语之后列出的任何元件,并且限于不干扰或有助于本公开中针对所列元件指定的活性或作用的其他元件。因此,短语“基本上由...组成”表示所列元件是必需的或强制性的,但是没有其它元件是任选的,并且可以或不可以存在取决于它们是否影响所列元件的活性或作用。
在整个说明书中对“一实施方案”、“实施方案”、“具体实施方案”、“相关实施方案”、“某一实施方案”、“另一实施方案”(“an additional embodiment”)或“又一实施方案”(“a further embodiment”)或其组合的引用,意指结合实施方案描述的具体特征、结构或特性被包括在本发明的至少一个实施方案中。因此,在整个说明书中的各个地方出现的前述短语,不一定都指代相同的实施方案。此外,具体特征、结构或特性可以在一个或多个实施方案中以任何合适的方式组合。
如本文所用,术语“分离的”是指实质上或基本上不含通常以其天然状态伴随的组分的材料。在具体实施方案中,术语“获得的”或“衍生的”与分离的同义使用。
如本文所用,术语“DNA”是指脱氧核糖核酸。在不同的实施方案中,术语DNA指基因组DNA、重组DNA、合成DNA或cDNA。在一实施方案中,DNA是指基因组DNA或cDNA。在具体的实施方案中,DNA包含“靶区域”。本文涉及的DNA文库包括由RNA(例如RNA表达文库)构建的基因组DNA文库和cDNA文库。在不同的实施方案中,DNA文库包含一个或多个另外的DNA序列和/或标签。
“靶遗传基因座”或“DNA靶区域”是指DNA序列内的目的区域。在不同的实施方案中,在靶遗传基因座上进行靶向遗传分析。在具体的实施方案中,DNA靶区域是与具体遗传状态、遗传病况、遗传疾病、胎儿检测、遗传嵌合、亲子鉴定、预测对药物治疗的响应、诊断或监测医疗状况、微生物组分析、病原体筛选或器官移植监测相关的基因区域。
如本文所用,术语“循环DNA”、“循环无细胞DNA”和“无细胞DNA”通常可互换使用,并且是指作为细胞外DNA的DNA,已从细胞中挤出的DNA,或已从坏死性细胞或凋亡细胞释放的DNA。
如本文所用,“对象”、“个体”或“患者”包括表现出可用本文涉及的组合物来检测或鉴定的病况的症状的任何动物。合适的对象包括实验室动物(如小鼠、大鼠、兔或豚鼠)、农场动物(如马、牛、绵羊、猪)和家畜或宠物(如猫或狗)。在具体的实施方案中,对象是哺乳动物。在某些实施方案中,对象是非人类的灵长类动物,并且在优选的实施方案中,对象是人类。
C.无细胞DNA的遗传分析方法
在不同的实施方案中,提供了用于cfDNA的遗传分析方法。
在具体的实施方案中,用于cfDNA的遗传分析方法包括:产生和扩增cfDNA文库,确定cfDNA文库中基因组当量的数量,以及进行一个或多个基因组靶基因座的定量遗传分析。
用于cfDNA的遗传分析方法包括:用一种或多种末端修复酶处理cfDNA以产生末端修复的cfDNA,并将一个或多个衔接子连接到末端修复的cfDNA的每个末端以产生cfDNA文库;扩增cfDNA文库以产生cfDNA文库克隆;测定cfDNA文库克隆中基因组当量的数量;以及对cfDNA文库克隆中的一个或多个靶遗传基因座进行定量遗传分析。
1.产生cfDNA文库
在具体的实施方案中,本文涉及的遗传分析方法包括产生cfDNA文库,包括用一种或多种末端修复酶处理cfDNA以产生末端修复的cfDNA,并将一个或多个衔接子连接到末端修复的cfDNA的每个末端以产生cfDNA文库。
(a)无细胞DNA(cfDNA)
将本文涉及的方法和组合物设计为使用无细胞DNA(cfDNA)作为分析物,有效地分析、检测、诊断和/或监测遗传状态、遗传病况、遗传疾病、遗传镶嵌、胎儿诊断、亲子鉴定、微生物组分析、病原体筛选和器官移植监测。cfDNA的大小分布范围为约150bp至约180bp的片段。片段化可能是核酸内切活性和/或核酸外切活性的结果,并且对cfDNA的精确、可靠和稳定的分析提出了巨大的挑战。分析cfDNA的另一挑战是其在血流中的短半衰期,在约15分钟的数量级。不希望受任何具体理论的束缚,本发明部分地涉及cfDNA的分析,类似于“液体活检”,并且是当前生物进程的实时快照。
此外,因为cfDNA在细胞内不存在,并且可以从许多合适的来源获得,该来源包括但不限于生物流体和粪便样本,其不受到困扰下一代测序分析的现有限制,诸如直接进入正在分析的组织。
在具体的实施方案中,作为从其中分离cfDNA的合适来源的生物流体的示例性实例,包括但不限于羊水、血液、血浆、血清、***、淋巴液、脑脊髓液、眼内液、尿、唾液、粘液和汗水。
在具体的实施方案中,生物流体是血液或血浆。
在某些实施方案中,可商购的试剂盒和本领域技术人员已知的其它方法,可用于直接从患者的生物流体或从先前获得的生物样本和任选稳定的生物样本中分离cfDNA,例如通过冷冻和/或添加酶螯合剂(包括但不限于EDTA、EGTA或对二价阳离子有特异性的其他螯合剂)。
(b)产生末端修复的cfDNA
在具体的实施方案中,产生cfDNA文库包括分离的cfDNA的末端修复。通过末端修复酶处理片段化的cfDNA以产生具有平末端、5'悬突或3'悬突的末端修复的cfDNA。在一些实施方案中,末端修复酶可以产生例如。在一些实施方案中,末端修复的cfDNA含有平末端。在一些实施方案中,将末端修复的cfDNA处理成含有平末端。在一些实施方案中,将末端修复的cfDNA的平末端进一步修饰为含有单个碱基对悬突。在一些实施方案中,可以进一步处理含有平末端的末端修复的cfDNA,以含有腺嘌呤(A)/胸腺嘧啶(T)悬突。在一些实施方案中,可以进一步处理含有平末端的末端修复的cfDNA,以含有作为单个碱基对悬突的腺嘌呤(A)/胸腺嘧啶(T)悬突。在一些实施方案中,末端修复的cfDNA具有非模板化的3'悬突。在一些实施方案中,将末端修复的cfDNA处理成含有3'悬突。在一些实施方案中,用末端转移酶(TdT)处理末端修复的cfDNA以含有3'悬突。在一些实施方案中,可以通过TdT添加G尾巴。在一些实施方案中,使用任何已知的限制酶(例如用Sau3A酶等)进行部分消化,将末端修复的cfDNA处理成含有突出末端。
(c)将衔接子分子连接到末端修复的cfDNA
在具体的实施方案中,产生cfDNA文库包括将一个或多个衔接子连接到末端修复的cfDNA的每个末端。本发明部分地涉及了设计成在cfDNA文库中容纳大量基因组当量的衔接子模块。将衔接子模块配置成测量在cfDNA文库中存在的基因组当量的数量,并且扩展地,测量用于鉴定序列突变的测序分析的灵敏度。
如本文所用,术语“衔接子模块”是指包含至少五个元件的多核苷酸:(i)第一元件,其包含用于单引物文库扩增的PCR引物结合位点;(ii)第二元件,其包含用于唯一鉴定每个测序读取的5个核苷酸的读取编码;(iii)第三元件,其包含3个核苷酸的样本编码以鉴定不同的样本,并且使得能够在测序运行中实现样本多重分析;(iv)第四元件,其包含使得能够校准测序读取中正确的碱基请求并作为与伴侣寡核苷酸杂交的锚点的12个核苷酸的锚定序列;和(v)第五元件,其包含元件4的两个3'末端核苷酸(图17和表12-16)。将衔接子模块和与元件4互补的伴侣寡核苷酸杂交,以形成适合于连接至cfDNA(任选地末端修复的平末端cfDNA)末端的衔接子。
在具体的实施方案中,衔接子模块包含有效地连接底物的一个或多个PCR引物序列、一个或多个读取编码、一个或多个样本编码、一个或多个锚定序列和两个或更多个3'核苷酸。在另外的实施方案中,衔接子模块还包含一个或多个测序引物结合位点。
在具体的实施方案中,衔接子模块包含第一元件,该第一元件包含用于cfDNA文库的单引物扩增的一个或多个PCR引物结合序列。在一实施方案中,PCR引物结合序列是:约12至约40个核苷酸、约18至约40个核苷酸、约20至约35个核苷酸、或约20至约30个核苷酸。在另一实施方案中,PCR引物结合序列是:约12个核苷酸、约13个核苷酸、约14个核苷酸、约15个核苷酸、约16个核苷酸、约17个核苷酸、约18个核苷酸、约19个核苷酸、约20个核苷酸、约21个核苷酸、约22个核苷酸、约23个核苷酸、约24个核苷酸、约25个核苷酸、约26个核苷酸、约27个核苷酸、约28个核苷酸、约29个核苷酸、约30个核苷酸、约31个核苷酸、约32个核苷酸、约33个核苷酸、约34个核苷酸、约35个核苷酸、约36个核苷酸、约37个核苷酸、约38个核苷酸、约39个核苷酸、或约40个核苷酸或更多。
在一实施方案中,PCR引物结合序列是约25个核苷酸。
在具体的实施方案中,衔接子模块包括包含一个或多个读取编码序列的第二元件。如本文所用,术语“读取编码”是指用于鉴定独特测序读取的多核苷酸。在一实施方案中,读取编码是核苷酸的随机序列。在一实施方案中,读取编码是约1个核苷酸、约2个核苷酸、约3个核苷酸、约4个核苷酸、约5个核苷酸、约6个核苷酸、约7个核苷酸、约8个核苷酸、约9个核苷酸、约10个核苷酸或更多个核苷酸。
作为非限制性实例,5个核苷酸的编码由256种可能的独特序列组成,其中所选择的每个编码与该组中每个其他编码有2个核苷酸不同。这一特征使独特和不同的读取区别于由于编码区中的测序错误而显示为独特的读取。在具体的实施方案中,由于具体的序列组合,已经根据经验确定干扰衔接子功能的编码,可以从使用中排除,例如,256个中的7个编码具有G核苷酸的过表达并被排除。
在其他实施方案中,5个、6个、7个、8个、9个、10个或更多个核苷酸的每个读取编码,可以与每个其他读取编码相差2个、3个、4个或5个核苷酸。
在一实施方案中,读取编码为约5个核苷酸,并且与每个其他读取编码有2个核苷酸不同。
在具体的实施方案中,衔接子模块包括包含一个或多个样本编码序列的第三元件。如本文所用,术语“样本编码”是指用于鉴定样本的多核苷酸。样本编码在建立多重测序反应中也是有用的,因为每个样本编码对于该样本是独特的,并且因此可以用于在多重测序反应中鉴定来自具体样本的读取。
在一实施方案中,样本编码包含约1个、约2个核苷酸、约3个核苷酸、约4个核苷酸或约5个核苷酸或更多核苷酸的序列。在另一实施方案中,2个、3个、4个、5个或更多个核苷酸的每个样本可以与每个其他样本编码有2个、3个、4个或5个核苷酸不同。
在一实施方案中,样本编码是约三个核苷酸,并且与其他样本中使用的每个其他样本编码有2个核苷酸不同。
在具体的实施方案中,衔接子模块包括包含一个或多个锚定序列的第四元件。如本文所用,“锚定序列”是指与伴侣寡核苷酸杂交的至少8个核苷酸、至少10个核苷酸、至少12个核苷酸、至少14个核苷酸、或至少16个核苷酸的核苷酸序列,并且其包含以下三个特性:(1)每个锚定序列是四个锚定序列的家族的一部分,所述四个锚定序列共同代表在延伸内部每个位点处四种可能的DNA碱基中的每一种;这一特征(平衡的碱基代表)在具体实施方案中用于校正测序读取中的正确碱基调用;(2)每个锚定序列仅由四种可能碱基中的两种组成,并且这些被特定选择为相等数目的A+C或相等数目的G+T;仅由两种碱基形成的锚定序列,降低了锚定序列将参与妨碍正确衔接子功能的二级结构形成的可能性;和(3)因为每个锚定序列由相等数目的A+C或G+T组成,每个锚定序列与一组四个中的每个其他锚定序列共享大致相同的解链温度和双链体稳定性。
在具体的实施方案中,衔接子模块包含由元件4的两个3'末端核苷酸组成的第五元件。基于经验测定来选择每个锚点的3'末端的这两个碱基,其显示这两个核苷酸是用于连接到cfDNA的有效底物。在具体的实施方案中,元件5包含选自下述二核苷酸的序列:AA、CC、TT和GG。在具体的实施方案中,元件5不包含二核苷酸组合CG或TG,因为发明人已经确定这些组合不是有效的连接底物。
在具体的实施方案中,连接步骤包括将衔接子模块连接至末端修复的cfDNA,以产生“标记的”cfDNA文库。在一些实施方案中,采用单个衔接子模块。在一些实施方案中,采用两个、三个、四个或五个衔接子模块。在一些实施方案中,将相同序列的衔接子模块连接到片段化的末端修复的DNA的每个末端。
在一实施方案中,将多个衔接子种类连接到末端修复的cfDNA文库。多个衔接子中的每一个可以包含用于扩增cfDNA文库的一个或多个引物结合位点,一个或多个读取编码序列,用于样本多重分析的一个或多个序列,以及用于DNA测序的一个或多个序列。
可以通过本领域普通技术人员已知的方法,进行本文中涉及的一个或多个衔接子的连接。在具体的实施方案中,将本文涉及的一个或多个衔接子连接到包含平末端的末端修复的cfDNA。在某些实施方案中,将本文涉及的一个或多个衔接子连接到包含适用于所采用的连接方法的互补末端的末端修复的cfDNA。在某些实施方案中,将本文涉及的一个或多个衔接子连接到包含3'悬突的末端修复的cfDNA。
2.扩增cfDNA文库
在具体的实施方案中,本文涉及的遗传分析方法包括扩增cfDNA文库以产生cfDNA克隆文库或cfDNA克隆的文库。cfDNA文库的每个分子包含连接到末端修复的cfDNA的每个末端的衔接子,并且每个衔接子包含一个或多个PCR引物结合位点。在一实施方案中,将不同衔接子连接到末端修复的cfDNA的不同末端。
在优选的实施方案中,将相同的衔接子连接到cfDNA的两端。将相同衔接子连接到末端修复的cfDNA的两端,允许用单个引物序列进行PCR扩增。在具体的实施方案中,将使用标准PCR技术,用单个引物序列驱动扩增来扩增衔接子连接的cfDNA文库的一部分。在一实施方案中,所述单个引物序列是约25个核苷酸,任选地在标准离子强度条件下具有≥55℃的预计Tm。
在具体的实施方案中,将初始cfDNA文库的皮克数扩增到cfDNA克隆的微克中,意味着10,000倍的扩增。可以使用本领域已知的方法测量(例如在Qubit 2.0或Nanodrop仪器上定量)扩增产物的量。
3.测定基因组当量的数量
在不同的实施方案中,用于cfDNA的遗传分析的方法包括测定cfDNA克隆文库中的基因组当量的数量。如本文所用,术语“基因组当量”是指每个文库中的基因组拷贝数。本文涉及的组合物和方法遇到的重要挑战是,实现足够的分析灵敏度以检测和分析遗传序列中稀有的遗传突变或差异。为了确定基于逐个样本的分析灵敏度值,通过测量测序文库中存在的基因组当量的数量,来测量每个样本中存在的不同和有区别的序列的数量。为了建立灵敏度,必须测量每个样本库的基因组当量的数量。
可以通过qPCR分析或通过在进行测序之后使用基于生物信息学的计数来测定基因组当量数。在临床样本的处理流程中,将基因组当量的qPCR测量结果用作cfDNA文库的QC步骤。它在序列分析之前建立了分析灵敏度的预期,并且如果其相应的cfDNA克隆文库缺乏所需的基因组当量深度,则允许将样本从分析中排除。最后,基因组当量的基于生物信息学的计数,也用于鉴定每个给定cfDNA克隆文库的基因组当量—并因此鉴定分析灵敏度和假阴性估计。
经验qPCR分析和统计计数分析应当是良好相关的。在测序未能揭示cfDNA克隆文库中的序列深度的情况下,可能需要重新处理cfDNA克隆文库和/或另外的测序。
在一实施方案中,使用定量PCR(qPCR)分析测定cfDNA克隆文库中的基因组当量。在具体的实施方案中,使用已知浓度的标准文库来构建标准曲线,以及将来自qPCR分析的测量值拟合以产生标准曲线,并且基因组当量的值由该拟合导出。出人意料地,本发明人已经发现qPCR“基于重复”分析,其包含与基因组中的共同序列特异性杂交的一个引物(例如重复序列)和与衔接子中的引物结合位点结合的另一引物,与仅使用衔接子特异性引物(存在于cfDNA克隆的两端)的方法相比,已经测量出基因组当量的8倍增加。通过基于重复分析所测量的基因组当量的数目,提供了更一致的文库与文库性能以及在测序运行中基因组当量的qPCR估计和生物信息计数的标签当量之间的更好对齐。
适用于本文涉及的基于重复的基因组当量分析的重复的示例性实例包括但不限于:短散布核元件(SINE)(例如Alu重复)、长散布核元件(LINE)(例如LINE1、LINE2、LINE3)、微卫星重复元件(例如短串联重复(STR)、简单序列重复(SSR))和哺乳动物范围的散布重复(MIR)。
在一实施方案中,所述重复是Alu重复。
4.定量遗传分析
在不同的实施方案中,用于cfDNA的遗传分析方法包括对cfDNA文库克隆的一个或多个靶遗传基因座的定量遗传分析。定量遗传分析包括以下步骤中的一个或多个或全部:捕获包含靶遗传基因座的cfDNA克隆;扩增捕获的靶遗传基因座;将扩增的捕获靶遗传基因座测序;以及对所得序列读取的生物信息学分析。
(a)捕获靶遗传基因座
本发明部分地涉及将捕获探针模块设计为保持较大探针的效率和可靠性,但使cfDNA克隆文库中的非信息性序列产生最小化。“捕获探针模块”是指包含捕获探针序列和尾部序列的多核苷酸。在具体的实施方案中,捕获探针模块序列或其部分用作一个或多个测序引物的引物结合位点。
在具体的实施方案中,捕获探针模块包含捕获探针。如本文所用,“捕获探针”是指能够与特定DNA靶区域杂交的区域。因为cfDNA的平均大小为约150至约170bp并且是高度片段化的,所以本文涉及的组合物和方法包含使用高密度和相对短的捕获探针来探寻目标DNA靶区域。
使用高密度捕获探针特别关注的是,通常使用特定的“序列规则”来设计捕获探针。例如,在设计捕获探针时通常排除冗余序列的区域或展现出极端碱基组成偏差的区域。然而,本发明人已经发现,捕获探针设计规则中缺乏灵活性基本上不影响探针性能。相反,通过位置约束严格选择的捕获探针提供了中靶序列信息,展现极少的脱靶和不可映射的读取的捕获,并产生只有少数例外的均匀的、有用的中靶读取。此外,在靠近探针间距处的高冗余度,完全能补偿偶尔性能不佳的捕获探针。
在具体的实施方案中,靶区域由多个捕获探针靶向,其中将任意两个或更多个捕获探针设计为结合至下述的靶区域:在彼此的10个核苷酸内部、在彼此的15个核苷酸内部、在彼此的20个核苷酸内部、在彼此的25个核苷酸内部、在彼此的30个核苷酸内部、在彼此的35个核苷酸内部、在彼此的40个核苷酸内部、在彼此的45个核苷酸内部、或在彼此的50个核苷酸内部或更多个核苷酸内部,以及所有介于中间的核苷酸长度。
在一实施方案中,捕获探针是约25个核苷酸、约26个核苷酸、约27个核苷酸、约28个核苷酸、约29个核苷酸、约30个核苷酸、约31个核苷酸、约32个核苷酸、约33个核苷酸、约34个核苷酸、约35个核苷酸、约36个核苷酸、约37个核苷酸、约38个核苷酸、约39个核苷酸、约40个核苷酸、约41个核苷酸、约42个核苷酸、约43个核苷酸、约44个核苷酸、或约45个核苷酸。
在一实施方案中,捕获探针是约100个核苷酸、约200个核苷酸、约300个核苷酸、约400个核苷酸、或约100个核苷酸。在另一实施方案中,捕获探针是约100个核苷酸至约500个核苷酸、约200个核苷酸至约500个核苷酸、约300个核苷酸至约500个核苷酸、或约400个核苷酸至约500个核苷酸,或其任何介于中间的范围。
在具体的实施方案中,捕获探针不是60个核苷酸。
在另一个实施方案中,捕获探针基本上小于60个核苷酸,但是与靶向相同DNA靶区域的60个核苷酸的捕获探针相当、相同或更好地杂交。
在某一实施方案中,捕获探针是40个核苷酸。
在某些实施方案中,捕获探针模块包括尾部序列。如本文所用,术语“尾部序列”是指在捕获探针模块的5'末端的多核苷酸,其在具体的实施方案中可用作引物结合位点。在具体的实施方案中,测序引物结合尾区域中的引物结合位点。
在具体的实施方案中,尾部序列是约5至约100个核苷酸、约10至约100个核苷酸、约5至约75个核苷酸、约5至约50个核苷酸、约5至约25个核苷酸、或约5至约20个核苷酸。在某些实施方案中,第三区域是约10至约50个核苷酸、约15至约40个核苷酸、约20至约30个核苷酸、或约20个核苷酸,或任何介于中间数目的核苷酸。
在具体的实施方案中,尾部序列是约30个核苷酸、约31个核苷酸、约32个核苷酸、约33个核苷酸、约34个核苷酸、约35个核苷酸、约36个核苷酸、约37个核苷酸、约38个核苷酸、约39个核苷酸、或约40个核苷酸。
在不同的实施方案中,捕获探针模块包含结合对的特定成员,以能够分离和/或纯化与捕获探针杂交的标记的和/或扩增的cfDNA文库的一个或多个捕获片段。在具体的实施方案中,捕获探针模块与生物素或另一种合适的半抗原(例如二硝基苯酚、地高辛)结合。
在不同的实施方案中,捕获探针模块与标记的和任选扩增的cfDNA文库杂交以形成复合物。在一些实施方案中,多功能捕获探针模块基本上与cfDNA文库中的特定基因组靶区域杂交。
杂交或杂交条件可包括其中两个核苷酸序列形成稳定复合物的任何反应条件,例如,标记的cfDNA文库和捕获探针模块形成稳定的标记的cfDNA文库—捕获探针模块复合物。这样的反应条件是本领域公知的,本领域技术人员将理解,这样的条件可以适当地修改(例如,用较短长度的捕获探针降低退火温度),并且在本发明的范围内。当捕获探针复合物的第二区域展现与标记的cfDNA文库的区域具有100%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、85%、80%、75%或70%序列同一性、同源性或互补性时,可发生实质性杂交。
在具体的实施方案中,捕获探针是约40个核苷酸,并且具有约44℃至约47℃的最佳退火温度。
在某些实施方案中,本文涉及的方法包括分离标记的cfDNA文库—捕获探针模块复合物。在具体的实施方案中,用于分离DNA复合物的方法是本领域技术人员公知的,并且可以将本领域技术人员认为合适的任何方法与本发明的方法一起使用(Ausubel等,Current Protocols in Molecular Biology,2007-2012)。在具体的实施方案中,使用生物素—链霉亲和素分离技术来分离复合物。
在具体的实施方案中,涉及从分离的标记cfDNA文库-捕获探针模块复合物去除单链3'-末端。在某些实施方案中,所述方法包括用3'-5'核酸外切酶酶促处理分离的标记DNA文库-多功能捕获探针模块复合物以去除单链3'末端。
在某些其它实施方案中,所述方法包括利用分离的标记DNA文库片段作为模板,进行多功能捕获探针的5'-3'DNA聚合酶延伸。
在某些其它实施方案中,所述方法包括通过5'FLAP核酸内切酶、DNA聚合作用和通过DNA连接酶的切口封闭的协同作用,产生杂交的捕获探针-分离的标记cfDNA靶分子。
多种酶可用于以3'-5'核酸外切酶酶促处理分离的标记cfDNA文库-多功能捕获探针模块复合物。可以在具体的实施方案中使用的、展现出3'-5'核酸外切酶酶活性的合适酶的示例性实例包括但不限于:T4或核酸外切酶I、III、V(也参见,Shevelev IV,HübscherU.,3'5'exonucleases,“Nat Rev Mol Cell Biol.3(5):364-76(2002))。在具体的实施方案中,具有3'-5'核酸外切酶活性的酶是T4聚合酶。在具体的实施方案中,可以使用展现出3'-5'核酸外切酶酶活性并能够延伸引物模板的酶,包括例如T4或核酸外切酶I、III、V.(同上)。
在一些实施方案中,本文涉及的方法包括对上文和本文其它地方讨论的3'-5'核酸外切酶酶处理的复合物进行测序和/或PCR。在具体的实施方案中,复制捕获探针分子的尾部以产生杂交核酸分子。在一实施方案中,所产生的杂交核酸分子包含能够与捕获探针模块杂交的靶区域和捕获探针模块尾部序列的互补序列。
在具体的实施方案中,遗传分析包括:a)将一个或多个捕获探针模块与多个cfDNA文库克隆中一个或多个靶遗传基因座杂交,以形成一个或多个捕获探针模块-cfDNA文库克隆复合物;b)从a)分离一个或多个捕获探针模块-cfDNA文库克隆复合物;c)用酶处理来自步骤b)的一种或多种分离的捕获探针模块-cfDNA文库克隆复合物;d)对来自c)的酶处理复合物进行PCR,其中复制捕获探针分子的尾部以产生扩增的杂交核酸分子,其中所述扩增的杂交核酸分子包含能够与捕获探针和捕获探针模块尾部序列的互补序列杂交的靶遗传基因座中的靶序列;和e)对来自d)的扩增的杂交核酸分子进行定量遗传分析。
在具体的实施方案中,涉及了用于测定特定靶遗传基因座拷贝数的方法,其包括:a)将一个或多个捕获探针模块与多个cfDNA文库克隆中一个或多个靶遗传基因座杂交,以形成一个或多个捕获探针模块-cfDNA文库克隆复合物;b)从a)分离一个或多个捕获探针模块-cDNA文库克隆复合物;c)用酶处理来自步骤b)的一种或多种分离的捕获探针模块-cfDNA文库克隆复合物;d)对来自c)的酶处理的复合物进行PCR,其中复制捕获探针分子的尾部以产生扩增的杂交核酸分子,其中所述扩增的杂交核酸分子包含能够与捕获探针和捕获探针模块尾部序列的互补序列杂交的靶遗传基因座中的靶序列;e)对d)中扩增的杂交核酸分子进行PCR扩增;和f)定量e)中的PCR反应,其中所述定量允许测定特定靶区域的拷贝数。
在一实施方案中,步骤c)的酶处理包括:使用具有3'-5'核酸外切酶活性的酶,对来自b)的一个或多个捕获探针模块-cfDNA文库克隆复合物进行3'-5'核酸外切酶酶促处理,以去除单链3'末端;通过5'FLAP内切核酸酶、DNA聚合作用和通过DNA连接酶的切口封闭的协同作用,产生一个或多个杂交的捕获探针模块-cfDNA文库克隆分子;或使用复合物中分离的cfDNA克隆作为模板,进行捕获探针的5'-3'DNA聚合酶延伸。
在一实施方案中,步骤c)的酶处理包括:使用复合物中分离的cfDNA克隆作为模板,进行捕获探针的5'-3'DNA聚合酶延伸。
在具体的实施方案中,可以使用本领域技术人员熟知的任何标准PCR反应条件进行PCR。在某些实施方案中,e)中的PCR反应使用两种PCR引物。在一个实施方案中,e)中的PCR反应使用与靶遗传基因座内部的重复进行杂交的第一PCR引物。在具体的实施方案中,e)中的PCR反应使用在靶遗传基因座/尾部接合处与杂交核酸分子杂交的第二PCR引物。在某些实施方案中,e)中的PCR反应使用与靶遗传基因座杂交的第一PCR引物和在靶遗传基因座/尾接合处与扩增的杂交核酸分子杂交第二PCR引物。在具体的实施方案中,第二引物与靶遗传基因座/尾部结合处杂交,使得引物的至少一个或多个核苷酸与靶遗传基因座杂交,并且引物的至少一个或多个核苷酸与尾部序列杂交。
在某些实施方案中,对从步骤e)获得的扩增的杂交核酸分子进行测序,并且将所述序列水平比对,即彼此比对,但不与参考序列比对。在具体的实施方案中,步骤a)至步骤e)与一个或多个捕获探针模块重复一次或多次。捕获探针模块可以是相同或不同的,并且设计为靶向靶遗传基因座的cfDNA链。在一些实施方案中,当捕获探针不同时,它们在标记的cfDNA克隆文库中的靶遗传基因座内的重叠或相邻靶序列处杂交。在一实施方案中,使用高密度捕获探针策略,其中多个捕获探针与靶遗传基因座杂交,并且其中所述多个捕获探针中的每一个与在约5、10、15、20、25、30、35、40、45、50、100、200bp的任何其它捕获探针内部的靶遗传基因座杂交(所述任何其它捕获探针与标记的cfDNA克隆文库中的靶遗传基因座杂交),包括所有介于中间的距离。
在一些实施方案中,所述方法可以使用每个靶遗传基因座的两个捕获探针模块进行,其中一个与靶区域上游的“Watson”链(非编码链或模板链)杂交,并且另一个与靶区域下游的“Crick”链(编码链或非模板链)杂交。
在具体的实施方案中,本文涉及的方法还可以用任何数量的捕获探针模块进行多次,例如每个靶遗传基因座的2个、3个、4个、5个、6个、7个、8个、9个或10个或更多个捕获探针模块,其以任何组合、任何数量与Watson链或Crick链杂交。在一些实施方案中,可以将获得的序列彼此比对以便识别多个差异中的任何差异。
在某些实施方案中,在单个反应中使用一个或多个捕获探针模块查询多个靶遗传基因座,例如100、200、300、400、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000、10000、50000、100000、500000个或更多个。
(b)测序
在具体的实施方案中,定量遗传分析包括对多个杂交核酸分子(如本文别处所述,如上所述)进行测序,以产生足够的测序深度从而获得多个独特的测序读取。独特的读取被定义为来自下述读取“家族”的单一共有读取,所述读取“家族”在cfDNA内部全部共享相同的读取编码和序列起始点。通过分组到家族中,每个捕获探针产生一组由计算机从总读取中提取的独特读取。然后将给定样本的独特读取计算为在逐个探针基础上观察到的所有独特读取的平均值。从用于计算平均值的数据集中排除存在明显的拷贝数变化的情况。独特读取是重要的,因为每个独特读取必须来自独特的cfDNA克隆。每个独特读取代表基因组DNA的单倍体当量的输入和分析。独特读取的总和是所分析的单倍体基因组的总和。反过来,所分析的基因组数目决定了测序分析的灵敏度。作为非限制性实例,如果平均独特读取数为100基因组当量,则该具体分析具有能够检测100中一个突变读取或1%的灵敏度。任何小于此值的观察都是不合理的。
在具体的实施方案中,定量遗传分析包括来源于多个样本的杂交核酸分子的多重测序。
在不同的实施方案中,定量遗传分析包括获得一个或更多个或多个标记的DNA文库克隆,每个克隆包含第一DNA序列和第二DNA序列,其中第一DNA序列包含靶遗传基因座中的序列,并且第二DNA序列包含捕获探针序列;对一个或多个克隆进行配对的末端测序反应并获得一个或多个测序读取,或对一个或多个克隆进行测序反应并获得大于约100、200、300、400、500或更多个核苷酸的单个长测序读取,其中所述读数足以鉴定第一DNA序列和第二DNA序列;以及根据测序读取的探针序列对一个或多个克隆的测序读取进行排序或聚类。
(c)生物信息学分析
在不同的实施方案中,定量遗传分析还包括测序读取的生物信息学分析。生物信息学分析排除了在没有用于测序的组合物或方法的情况下进行的任何纯粹的心理分析。在某些实施方案中,生物信息学分析包括但不限于:序列比对、基因组当量分析、单核苷酸变异(SNV)分析、基因拷贝数变异(CNV)分析和遗传损伤的检测。在具体的实施方案中,生物信息学分析可用于定量cfDNA克隆文库中分析的基因组当量的数量;用于检测靶遗传基因座的遗传状态;用于检测靶遗传基因座中的遗传损伤;以及测量靶遗传基因座内的拷贝数波动。
可以在序列读取和一个或多个人参考DNA序列之间进行序列比对。在具体的实施方案中,测序比对可以用于检测靶遗传基因座中的遗传损伤,包括但不限于检测核苷酸转换或颠换、核苷酸***或缺失、基因组重排、拷贝数变化或基因融合。作为致病指示或预后指示的遗传损伤的检测可用于诊断、预后、治疗和/或监测具体遗传病况或疾病。
本文还涉及了可以在不需要与参考序列比对的情况下进行序列比对分析的方法,本文称为水平序列分析。可以对通过本文涉及的方法或任何其它方法产生的任何序列进行这样的分析。在具体的实施方案中,所述序列分析包括对通过本文涉及的方法获得的读取进行序列比对。
在一实施方案中,在进行测序后,使用基于生物信息学的计数确定cfDNA克隆文库中的基因组当量。每个测序读取与具体捕获探针相关联,并且将分配给每个捕获探针的读取集合解析为组。在一组内,个体读取的组在基因组序列内部共享相同的读取编码和相同的DNA序列起始位置。将这些个体读取分组为“家族”,并且将该家族的单个共识代表转结为“独特读取”。构成家族的所有个体读取来源于单个连接事件,并且因此它们彼此是扩增来源的“同胞”。每个独特读取被认为是独特的连接事件,并且独特读取的总和被认为等于所分析的基因组当量的数目。
随着独特克隆数目接近可能序列组合的总数,概率指示相同的编码和起始位点组合将由独立事件创建,并且这些独立事件将不适当地分组在单个家族中。净结果将低估所分析的基因组当量,并且稀有突变体读取可能作为测序错误而丢弃,因为它们与具有相同标识符的野生型读取重叠。
在具体的实施方案中,为了提供对cfDNA克隆文库的精确分析,所分析的基因组当量数目是可能的独特克隆数目的约1/10、约1/12、约1/14、约1/16、约1/18、约1/20、约1/25或更少。应当理解,上述程序仅仅是示例性的而不是限制性的。
在一些实施方案中,可能需要增加待分析的基因组当量的数量。为了扩大基因组当量的深度,涉及至少两种解决方案。第一个解决方案是每个样本使用多于一个衔接子集。通过组合衔接子,可以成倍地扩大可能的克隆总数,并且因此扩大基因组输入的舒适极限。第二种解决方案是将读取编码扩大1、2、3、4或5个或更多个碱基。与每个其他读取编码有至少2个碱基不同的可能读取编码的数量扩大为4(n-1),其中n是读取编码内部的碱基数。因此,在非限制性示例中,如果读取编码是5个核苷酸,那么4(5-1)=256;因此,包含额外碱基使得每个额外碱基将可用集合(the available repertoire)扩大四倍。
在一实施方案中,定量遗传分析包括测序读取的生物信息学分析以鉴定稀有的单核苷酸变异(SNV)。
下一代测序具有大约0.02-0.02%的固有错误率,意味着任何地方的1/200至1/500碱基响应是不正确的。为了检测在低于该频率的频率下(例如在每1000个序列1个的频率下)发生的变体和其它突变,有必要调用分子注释策略。作为非限制性实例,使用靶序列捕获技术分析5000个独特分子,将在>50,000个读取的足够测序深度下产生5000个独特读取的集合,其中每个独特读取属于全部具有相同的读取编码的读取“家族”。家族内发生的SNV是稀有变体的候选者。当在多于一个家族中观察到相同的变体时,其变为存在于起始样本内的稀有变体的非常强的候选者。相比之下,在家族内部偶尔发生的变体可能是测序错误,并且在一个且仅一个家族内发生的变体是稀有的或是在体外发生的碱基改变的结果(例如,DNA碱基氧化或PCR-引入错误)。
在一实施方案中,检测SNV的方法包括将10倍更多的基因组输入引入(基因组或基因组当量)作为分析的期望靶灵敏度。在一个非限制性实例中,如果期望的灵敏度是2%(100个中2个),则实验目标是2000个基因组的输入。
在具体的实施方案中,测序数据的生物信息学分析用于检测或鉴定与遗传状态、病况或疾病、遗传嵌合、胎儿检测、亲子鉴定、预测对药物治疗的响应、诊断或监测医学状况、微生物组分析、病原体筛选和监测器官移植相关的SNV。
在不同的实施方案中,提供了用于拷贝数测定分析的方法,其包括获得一个或多个或多个克隆,每个克隆包含第一DNA序列和第二DNA序列,其中第一DNA序列包含在靶遗传基因座中的序列,并且第二DNA序列包含捕获探针序列。在相关实施方案中,对一个或多个克隆进行配对的末端测序反应,并获得一个或多个测序读取。在另一实施方案中,对一个或多个克隆进行测序反应,其中获得大于约100个核苷酸的单个长测序读取,其中所述读取足以鉴定第一DNA序列和第二DNA序列。可以根据测序读取的探针序列对一个或多个克隆的测序读取进行排序或聚类。
拷贝数分析包括但不限于这样的分析,其检查在给定基因组DNA样本中发生的具体基因或突变的拷贝数,并且还可以包括定量测定给定基因的拷贝数或在给定的样本中的序列差异。在具体的实施方案中,拷贝数分析用于检测或鉴定与遗传状态、病况或疾病、胎儿检测、遗传嵌合、亲子鉴定、预测对药物治疗的响应、诊断或监测医疗状况、微生物组分析、病原体筛选和监测器官移植相关的基因扩增。
在具体的实施方案中,测序数据的生物信息学分析用于检测或鉴定靶基因座中的一个或多个序列或遗传损伤,包括但不限于:检测核苷酸转换或颠换、核苷酸***或缺失、基因组重排、拷贝数变化或基因融合。作为致病或预后指示的遗传损伤的检测,可用于诊断、预后、治疗和/或监测具体遗传病况或疾病。在一实施方案中,遗传损伤与遗传状态、病况或疾病、胎儿检测、遗传嵌合、亲子鉴定、预测对药物治疗的响应、诊断或监测医疗状况、微生物组分析、病原体筛选和监测器官移植相关。
D.定量遗传分析的临床应用
在不同的实施方案中,本发明涉及检测、鉴定、预测、诊断或监测对象中的病况或疾病的方法。
在具体的实施方案中,检测、鉴定、预测、诊断或监测对象中的遗传状态、病况或疾病的方法包括:对cfDNA克隆文库中一个或多个靶遗传基因座进行定量遗传分析,以检测或鉴定在一个或多个靶遗传基因座的序列中的变化。
在一实施方案中,检测、鉴定、预测、诊断或监测遗传状态、病况或疾病的方法包括:从对象的生物样本中分离或获得cfDNA;用一种或多种末端修复酶处理cfDNA以产生末端修复的cfDNA;将一个或多个衔接子连接到末端修复的cfDNA的每个末端以产生cfDNA文库;扩增cfDNA文库以产生cfDNA克隆文库;测定cfDNA克隆文库中的基因组当量的数量;以及对cfDNA克隆文库中一个或多个靶遗传基因座进行定量遗传分析,以检测或鉴定在一个或多个靶遗传基因座处的序列变化。
在具体的实施方案中,检测、鉴定、预测、诊断或监测遗传状态、或遗传病况或疾病的方法包括:从对象的生物样本中分离或获得cfDNA;用一种或多种末端修复酶处理cfDNA以产生末端修复的cfDNA;将一个或多个衔接子连接到末端修复的cfDNA的每个末端以产生cfDNA文库;扩增cfDNA文库以产生cfDNA克隆文库;测定cfDNA克隆文库中的基因组当量的数量;以及对cfDNA克隆文库中一个或多个靶遗传基因座进行定量遗传分析,以检测或鉴定在一个或多个靶遗传基因座处的序列中核苷酸转换或颠换、核苷酸***或缺失、基因组重排、拷贝数变化或基因融合,所述遗传状态、或遗传病况或疾病选自:遗传疾病、遗传嵌合、胎儿检测、亲子鉴定、预测对药物治疗的响应、诊断或监测医疗状况、微生物组分析、病原体筛选和器官移植监测。
可以用本文涉及的组合物和方法检测、鉴定、预测、诊断或监测的遗传疾病的示例性实例,包括但不限于:癌症、阿尔茨海默病(APOE1)、腓骨肌萎缩症、Leber遗传视神经病(LHON)、Angelman综合征(UBE3A,泛素蛋白连接酶E3A)、Prader-Willi综合征(15号染色体中的区域)、β-地中海贫血(HBB,β-球蛋白)、戈谢病(I型)(GBA,葡糖脑苷脂酶)、囊性纤维化(CFTR上皮氯离子通道)、镰状细胞病(HBB,β-球蛋白)、戴萨克斯(Tay–Sachs)症(HEXA,己糖胺酶A)、苯丙酮尿症(PAH,苯丙氨酸水解酶)、家族性高胆固醇血症(LDLR,低密度脂蛋白受体)、成人多囊性肾病(PKD1,多囊蛋白)、亨廷顿病(HDD,亨廷顿蛋白)、I型神经纤维瘤病(NF1,NF1肿瘤抑制基因)、强直性肌营养不良(DM,肌强直蛋白)、结节性硬化症(TSC1,结节蛋白)、软骨发育不全(FGFR3,成纤维细胞生长因子受体)、脆性X染色体综合征(FMR1,RNA结合蛋白)、杜氏肌营养不良(DMD,肌营养不良蛋白)、A型血友病(F8C,血液凝固因子VIII)、Lesch-Nyhan综合征(HPRT1,次黄嘌呤鸟嘌呤核糖基转移酶1)和肾上腺脑白质营养不良(ABCD1)。
可用本文涉及的组合物和方法检测、鉴定、预测、诊断或监测的癌症的示例性实例,包括但不限于:B细胞癌(例如多发性骨髓瘤)、黑素瘤、乳腺癌、肺癌(如非小细胞肺癌或NSCLC)、支气管癌、结肠直肠癌、***癌、胰腺癌、胃癌、卵巢癌、膀胱癌、脑癌或中枢神经***癌、外周神经***癌、食管癌、子***、子宫癌或子宫内膜癌、口腔癌或咽癌、肝癌、肾癌、睾丸癌、胆道癌、小肠癌或阑尾癌、唾液腺癌、甲状腺癌、肾上腺癌、骨肉瘤、软骨肉瘤、血液学组织的癌症、腺癌、炎症性肌成纤维细胞瘤、胃肠道间质瘤(GIST)、结肠癌、多发性骨髓瘤(MM)、骨髓增生异常综合征(MDS)、骨髓增生性疾病(MPD)、急性淋巴细胞性白血病(ALL)、急性髓细胞性白血病(AML)、慢性粒细胞白血病(CML)、慢性淋巴细胞白血病(CLL)、真性红细胞增多症、霍奇金淋巴瘤、非霍奇金淋巴瘤(NHL)、软组织肉瘤、纤维肉瘤、粘液肉瘤、脂肪肉瘤、骨源性肉瘤、脊索瘤、血管肉瘤、内皮肉瘤、***肉瘤、***内皮肉瘤、滑膜瘤、间皮瘤、尤因肉瘤、平滑肌肉瘤、横纹肌肉瘤、鳞状细胞癌、基底细胞癌、腺癌、汗腺癌、皮脂腺癌、***状癌、***状腺癌、髓样癌、支气管癌、肾细胞癌、肝细胞瘤、胆管癌、绒毛膜癌、***癌、胚胎性癌、维尔姆斯瘤、膀胱癌、上皮癌、神经胶质瘤、星形细胞瘤、成神经管细胞瘤、颅咽管瘤、室管膜瘤、松果体瘤、成血管细胞瘤、听神经瘤、少突神经胶质瘤、脑膜瘤、成神经细胞瘤、成视网膜细胞瘤、滤泡性淋巴瘤、弥漫性大B细胞淋巴瘤、套细胞淋巴瘤、肝细胞癌、甲状腺癌、胃癌、头颈癌、小细胞癌、原发性血小板增多症、原因不明的骨髓样化生、嗜酸性粒细胞增多综合征、***性肥大细胞增多症、常见的嗜酸性粒细胞增多症、慢性嗜酸性粒细胞白血病、神经内分泌癌、类癌瘤等。
在一实施方案中,遗传损伤是在宇宙数据库中注释的损伤(可以从cancer.sanger.ac.uk/cosmic/census下载损伤和序列数据)或是在癌症基因组图谱中注释的损伤(可以从tcga-data.nci.nih.gov/tcga/tcgaDownload.jsp下载损伤和序列数据)。
可以用本文涉及的组合物和方法检测、鉴定、预测、诊断或监测的具有与癌症相关的一个或多个遗传损伤的基因的示例性实例,包括但不限于:ABCB1、ABCC2、ABCC4、ABCG2、ABL1、ABL2、AKT1、AKT2、AKT3、ALDH4A1、ALK、APC、AR、ARAF、ARFRP1、ARID1A、ATM、ATR、AURKA、AURKB、BCL2、BCL2A1、BCL2L1、BCL2L2、BCL6、BRAF、BRCA1、BRCA2、Clorf144、CARD11、CBL、CCND1、CCND2、CCND3、CCNE1、CDH1、CDH2、CDH20、CDH5、CDK4、CDK6、CDK8、CDKN2A、CDKN2B、CDKN2C、CEBPA、CHEK1、CHEK2、CRKL、CRLF2、CTNNB1、CYP1B1、CYP2C19、CYP2C8、CYP2D6、CYP3A4、CYP3A5、DNMT3A、DOT1L、DPYD、EGFR、EPHA3、EPHA5、EPHA6、EPHA7、EPHB1、EPHB4、EPHB6、EPHX1、ERBB2、ERBB3、ERBB4、ERCC2、ERG、ESR1、ESR2、ETV1、ETV4、ETV5、ETV6、EWSR1、EZH2、FANCA、FBXW7、FCGR3A、FGFR1、FGFR2、FGFR3、FGFR4、FLT1、FLT3、FLT4、FOXP4、GATA1、GNA11、GNAQ、GNAS、GPR124、GSTP1、GUCY1A2、HOXA3、HRAS、HSP90AA1、IDH1、IDH2、IGF1R、IGF2R、IKBKE、IKZF1、INHBA、IRS2、ITPA、JAK1、JAK2、JAK3、JUN、KDR、KIT、KRAS、LRP1B、LRP2、LTK、MAN1B1、MAP2K1、MAP2K2、MAP2K4、MCL1、MDM2、MDM4、MEN1、MET、MITF、MLH1、MLL、MPL、MRE11A、MSH2、MSH6、MTHFR、MTOR、MUTYH、MYC、MYCL1、MYCN、NF1、NF2、NKX2-1、NOTCH1、NPM1、NQO1、NRAS、NRP2、NTRK1、NTRK3、PAK3、PAX5、PDGFRA、PDGFRB、PIK3CA、PIK3R1、PKHD1、PLCG1、PRKDC、PTCH1、PTEN、PTPN11、PTPRD、RAF1、RARA、RB1、RET、RICTOR、RPTOR、RUNX1、SLC19A1、SLC22A2、SLCO1B3、SMAD2、SMAD3、SMAD4、SMARCA4、SMARCB1、SMO、SOD2、SOX10、SOX2、SRC、STK11、SULT1A1、TBX22、TET2、TGFBR2、TMPRSS2、TNFRSF14、TOP1、TP53、TPMT、TSC1、TSC2、TYMS、UGT1A1、UMPS、USP9X、VHL和WT1。
在具体的实施方案中,遗传损伤包含核苷酸转换或颠换、核苷酸***或缺失、基因组重排,拷贝数变化或基因融合。
在一实施方案中,遗传损伤是将ALK基因的3'编码区融合到另一基因的基因融合。
在一实施方案中,基因损伤是将ALK基因的3'编码区融合到EML4基因的基因融合。
可以用本文涉及的组合物和方法检测、鉴定、预测、诊断或监测的适用于胎儿检测的病况的示例性实例,包括但不限于:唐氏综合征(21三体)、爱德华兹综合征(18三体)、帕陶氏综合征(13三体)、克莱恩费尔特综合征(XXY)、X三体综合征、XYY综合征、8三体综合征、16三体综合征、特纳综合征(XO)、罗伯逊易位、迪格奥尔格综合征和Wolf-Hirschhorn综合征。
可以用本文涉及的组合物和方法检测、鉴定、预测、诊断或监测的适用于亲子鉴定的等位基因的示例性实例,包括但不限于16个或更多个以下基因:D20S1082、D6S474、D12ATA63、D22S1045、D10S1248、D1S1677、D11S4463、D4S2364、D9S1122、D2S1776、D10S1425、D3S3053、D5S2500、D1S1627、D3S4529、D2S441、D17S974、D6S1017、D4S2408、D9S2157、釉原蛋白基因(Amelogenin)、D17S1301、D1GATA113、D18S853、D20S482和D14S1434。
可以用本文涉及的组合物和方法检测、鉴定、预测、诊断或监测适合用于预测药物治疗的响应的基因的示例性实例,包括但不限于以下基因中的一种或多种:ABCB1(ATP结合盒,亚家族B(MDR/TAP),成员1)、ACE(血管紧张素I转化酶)、ADH1A(乙醇脱氢酶1A(I类),α多肽)、ADH1B(乙醇脱氢酶IB(I类),β多肽)、ADH1C(乙醇脱氢酶1C(I类),γ多肽)、ADRB1(肾上腺素,β-1-受体)、ADRB2(肾上腺素,β-2-受体,表面)、AHR(芳香烃受体)、ALDH1A1(乙醛脱氢酶1家族,成员A1)、ALOX5(花生四烯酸5-脂氧合酶)、BRCA1(乳腺癌1,早发)、COMT(儿茶酚-O-甲基转移酶)、CYP2A6(细胞色素P450,家族2,亚家族A,多肽6)、CYP2B6(细胞色素P450,家族2,亚家族B,多肽6)、CYP2C9(细胞色素P450,家族2,亚家族C,多肽9)、CYP2C19(细胞色素P450,家族2,亚家族C,多肽19)、CYP2D6(细胞色素P450,家族2,亚家族D,多肽6)、CYP2J2(细胞色素P450,家族2,亚家族J,多肽2)、CYP3A4(细胞色素P450,家族3,亚家族A,多肽4)、CYP3A5(细胞色素P450,家族3,亚家族A,多肽5)、DPYD(二氢嘧啶脱氢酶)、DRD2(多巴胺受体D2)、F5(凝血因子V)、GSTP1(谷胱甘肽S-转移酶pi)、HMGCR(3-羟基-3-甲基戊二酰辅酶A还原酶)、KCNH2(钾电压门控通道,亚家族H(Eag相关的),成员2)、KCNJ11(钾内整流通道,亚家族J,成员11)、MTHFR(5,10-亚甲基四氢叶酸还原酶(NADPH))、NQO1(NAD(P)H脱氢酶,醌1)、P2RY1(嘌呤能受体P2Y,G-蛋白偶联的,1)、P2RY12(嘌呤能受体P2Y,G-蛋白偶联的,12)、PTGIS(***素I2(前列环素)合酶)、SCN5A(钠通道,电压门控的,V型,α(长QT综合征3))、SLC19A1(溶质载体家族19(叶酸转运蛋白),成员1)、SLCO1B1(溶质载体有机阴离子转运蛋白家族,成员1B1)、SULT1A1(磺基转移酶家族,胞质,1A,酚偏好,成员1)、TPMT(硫代嘌呤S-甲基转移酶)、TYMS(胸苷酸合酶)、UGT1A1(UDP葡糖醛酸糖基转移酶1家族,多肽A1)、VDR(维生素D(1,25-二羟基维生素D3)受体)、VKORC1(维生素K环氧化物还原酶复合物,亚基1)。
可以用本文涉及的组合物和方法检测、鉴定、预测、诊断或监测的医学病况的示例性实例,包括但不限于:中风、短暂性脑缺血发作、创伤性脑损伤、心脏病、心肌梗塞、心绞痛、动脉粥样硬化和高血压。
可以用本文涉及的组合物和方法筛选的病原体的示例性实例,包括但不限于:细菌、真菌和病毒。
可以用本文涉及的组合物和方法筛选的细菌种类的示例性实例,包括但不限于:分枝杆菌属、肺炎球菌属、埃希氏菌属、弯曲杆菌属、棒状杆菌属、梭状芽孢杆菌属、链球菌属、葡萄球菌属、假单胞菌属、志贺氏菌属、密螺旋体属或沙门氏菌属。
可以用本文涉及的组合物和方法筛选的真菌种类的示例性实例,包括但不限于:曲霉属、芽生菌属、假丝酵母属、球孢子菌属(a Coccicioides spp.)、隐球菌属、皮肤癣菌属、癣菌属、毛癣菌属、小孢子菌属、镰刀菌属、组织胞浆菌属、毛霉菌属(Mucoromycotinaspp.)、肺囊虫属、孢子丝菌属、突脐孢菌属(Exserophilum spp.)或枝孢菌属。
可以用本文涉及的组合物和方法筛选的病毒的示例性实例,包括但不限于:甲型流感(如H1N1、H1N2、H3N2和H5N1(禽流感))、乙型流感、丙型流感病毒、甲型肝炎病毒、乙型肝炎病毒、丙型肝炎病毒、丁型肝炎病毒、戊型肝炎病毒、轮状病毒、任何诺沃克病毒组的病毒、肠道腺病毒、细小病毒、登革热病毒、猴痘、单链负义病毒目、狂犬病毒属(如狂犬病病毒、拉格斯棒状病毒、莫克拉病毒、杜温哈格病毒、欧洲蝙蝠病毒1&2和澳大利亚蝙蝠病毒)、短时热病毒、水疱病毒,水疱性口炎病毒(VSV)、疱疹病毒(如1型和2型单纯疱疹病毒、水痘带状疱疹、巨细胞病毒、爱泼斯坦-巴尔病毒(EBV)、人疱疹病毒(HHV)、人疱疹病毒6型和8型)、莫洛尼氏鼠白血病病毒(M-MuLV)、莫洛尼氏鼠肉瘤病毒(MoMSV)、哈维鼠肉瘤病毒(HaMuSV)、鼠乳腺肿瘤病毒(MuMTV)、长臂猿白血病病毒(GaLV)、猫白血病病毒(FLV)、泡沫病毒、弗仑德鼠白血病病毒、鼠干细胞病毒(MSCV)和劳斯氏肉瘤病毒(RSV)、HIV(人免疫缺陷病毒;包括HIV1型和HIV2型)、维士纳-梅迪(visna-maedi)病毒(VMV)病毒、山羊关节炎-脑炎病毒(CAEV)、马传染性贫血病毒(EIAV)、猫免疫缺陷病毒(FIV)、牛免疫缺陷病毒(BIV)和猴免疫缺陷病毒(SIV)、***状瘤病毒、鼠γ疱疹病毒、沙粒病毒(如阿根廷出血热病毒、玻利维亚出血热病毒、萨比亚相关的出血热病毒、委内瑞拉出血热病毒、拉沙热病毒、马丘波病毒)、淋巴细胞性脉络丛脑膜炎病毒(LCMV)、布尼亚病毒科(如克里米亚-刚果出血热病毒、汉坦病毒、引起肾综合征出血热的病毒、裂谷热病毒)、包括埃博拉出血热和马尔堡出血热的丝状病毒科(线状病毒)、包括科萨努尔森林病病毒、鄂木斯克出血热病毒、致蜱传脑炎病毒的黄病毒科和副粘液病毒科(如亨德拉病毒和尼帕病毒),大天花和小天花(天花)、甲病毒(如委内瑞拉马脑炎病毒、东部马脑炎病毒、西部马脑炎病毒)、SARS相关冠状病毒(SARS-CoV)、西尼罗河病毒和任何致脑炎病毒。
可以用本文所考虑的组合物和方法检测、鉴定、预测、诊断或监测的适合用于监测移植受体中器官移植的基因的示例性实例,包括但不限于以下基因中的一种或多种:HLA-A、HLA-B、HLA-C、HLA-DR、HLA-DP和HLA-DQ。
在具体的实施方案中,使用生物信息学分析来定量在cfDNA克隆文库中分析的基因组当量的数量;检测靶遗传基因座中的遗传变体;检测靶遗传基因座内的突变;检测靶遗传基因座内的遗传融合;或测量靶遗传基因座内的拷贝数波动。
E.伴随诊断
在不同的实施方案中,提供了用于遗传疾病的伴随诊断,其包括:从对象的生物样本中分离或获得cfDNA;用一种或多种末端修复酶处理cfDNA以产生末端修复的cfDNA;将一个或多个衔接子连接到末端修复的cfDNA的每个末端以产生cfDNA文库;扩增cfDNA文库以产生cfDNA克隆文库;确定cfDNA克隆文库中的基因组当量的数量;以及对cfDNA克隆文库中与遗传疾病相关的一种或多种生物标记进行定量遗传分析,其中检测或无法检测所述一种或多种生物标记中的至少一种指示是否应对所述对象进行遗传疾病治疗。
如本文所用,术语“伴随诊断”是指与具体抗癌治疗相关的诊断检测。在具体的实施方案中,所述诊断方法包括检测与生物样本相关的生物标记中的遗传损伤,从而允许迅速识别是否应该用抗癌治疗进行治疗的患者。
抗癌治疗包括但不限于:手术、辐照、化疗、抗癌药物和免疫调节剂。
抗癌药物的示例性实例,包括但不限于:烷化剂,如塞替派和环磷酰胺(CYTOXANTM);烷基磺酸盐,如白消安、英丙舒凡和哌泊舒凡;氮丙啶,如苯并多巴、卡波醌、美妥替派和乌瑞替派;包括六甲蜜胺、三乙撑蜜胺、三亚乙基磷酰胺、三亚乙基硫代磷酰胺和三羟甲蜜胺的亚乙基亚胺和甲基蜜胺类;氮芥,如苯丁酸氮芥、萘氮芥、氯磷酰胺、雌氮芥、异环磷酰胺、二氯甲基二乙胺、盐酸氧氮芥、美法仑、新恩比兴、苯芥胆甾醇、松龙苯芥、曲洛磷胺、尿嘧啶氮芥;亚硝基脲,如亚硝脲氮芥、氯脲霉素、福莫司汀、环己亚硝脲、嘧啶亚硝脲、雷莫司汀;抗生素,如阿克拉霉素、放线菌素、安曲霉素、重氮丝氨酸、博莱霉素、放线菌素C、卡里奇霉素、卡拉比星(carabicin)、洋红霉素、嗜癌霉素、色霉素、更生霉素、柔红霉素、地托比星、6-重氮-5-氧-L-正亮氨酸、阿霉素及其聚乙二醇化制剂、表柔比星、依索比星、去甲氧基柔红霉素、麻西罗霉素、丝裂霉素、霉酚酸、诺加霉素、橄榄霉素类、培洛霉素、泊非霉素、嘌呤霉素、三铁阿霉素、罗多比星、链黑菌素、链脲菌素、杀结核菌素、乌苯美司、净司他汀、佐柔比星;抗代谢物,如甲氨蝶呤和5-氟尿嘧啶(5-FU);叶酸类似物,如二甲叶酸、甲氨蝶呤、蝶罗呤、三甲曲沙;嘌呤类似物,如氟达拉滨、6-巯基嘌呤、硫脒嘌呤、硫鸟嘌呤;嘧啶类似物,如环胞苷、阿扎胞苷、6-氮尿苷、卡莫氟、阿糖胞苷、二脱氧尿苷、去氧氟尿苷、依诺他滨、氟尿苷、5-FU;雄激素,如卡普睾酮、屈他雄酮丙酸、环硫雄醇、美雄烷、睾内酯;抗肾上腺药,如氨鲁米特、米托坦、曲洛司坦(trilostane);叶酸补充剂,如亚叶酸;醋葡醛内酯;醛磷酰胺糖苷;氨基乙酰丙酸;安丫啶;贝斯布西(bestrabucil);比生群;依达曲沙;地磷酰胺;秋水仙胺;地吖醌;依氟鸟氨酸(elformithine);依利醋铵;乙环氧啶(etoglucid);硝酸镓;羟基脲;香菇多糖;氯尼达明;米托胍腙;米托蒽醌;莫哌达醇;硝胺吖啶(nitracrine);喷司他丁;蛋氨氮芥;吡柔比星;鬼臼酸;2-乙基酰肼;甲基苄肼;
Figure GDA0003420037120000391
雷佐生(razoxane);西佐喃(sizofiran);螺旋锗;细交链孢菌酮酸;三亚胺醌;2,2',2”-三氯三乙胺;氨基甲酸乙酯;长春地辛;达卡巴嗪;甘露醇氮芥;二溴甘露醇;二溴卫矛醇;哌泊溴烷;Gacytosine;***糖苷(“Ara-C”);环磷酰胺;塞替派;紫杉烷类(taxoid),例如紫杉醇(
Figure GDA0003420037120000392
Bristol-Myers Squibb Oncology,Princeton,N.J.)和多烯紫杉醇(
Figure GDA0003420037120000393
Rhne-Poulenc Rorer,Antony,France);苯丁酸氮芥;吉西他滨;6-硫代鸟嘌呤;巯基嘌呤;氨甲喋呤;铂类似物,如顺铂和卡铂;长春花碱;铂;依托泊苷(VP-16);异环磷酰胺;丝裂霉素C;米托蒽醌;长春新碱;长春瑞滨;诺维本(navelbine);盐酸米托蒽醌(novantrone);替尼泊苷;氨基蝶呤;希罗达;伊班膦酸盐;CPT-11;拓扑异构酶抑制剂RFS2000;二氟甲基鸟氨酸(DMFO);视黄酸衍生物,如TargretinTM(贝沙罗汀)、PanretinTM(阿利维A酸);ONTAKTM(地尼白介素-毒素连接物);埃斯波霉素;卡培他滨;以及任何上述的药学上可接受的盐、酸或衍生物。该定义还包括用于调节或抑制对癌症的激素作用的抗激素剂,如抗***,包括例如他莫昔芬、雷洛昔芬、芳香酶抑制性4(5)-咪唑、4-羟基他莫昔芬、曲沃昔芬、盐酸雷洛昔芬(keoxifene)、LY117018、奥那司酮和托瑞米芬(Fareston);和抗雄激素,如氟他胺、尼鲁特米德、比卡鲁胺、亮丙瑞林和戈舍瑞林;以及任何上述的药学上可接受的盐、酸或衍生物。
免疫调节剂的示例性实例,包括但不限于:环孢菌素、他克莫司、曲培莫司、吡美莫司、西罗莫司、依维莫司、拉非莫司、拉喹莫德和咪喹莫特,以及其类似物、衍生物、盐、离子和复合物。
在本说明书中引用的所有出版物、专利申请和授权专利通过引用并入本文,如同每个单独的出版物、专利申请或授权专利被特别地和单独地指出通过引用并入。
尽管为了清楚理解的目的通过说明和实施例相当详细地描述了前述发明,但是根据本发明的教导,本领域普通技术人员将容易明白,可以在不脱离所附权利要求的精神或范围的情况下进行某些改变和修改。仅以说明而非限制的方式提供以下实施例。本领域技术人员将容易地认识到,可以改变或修改各种非关键参数以产生基本相似的结果。
实施例
实施例1
使用靶序列捕获技术精确检测稀有突变
目的
本实验的目的是提供使用靶序列捕获技术检测稀有变体的直接原理验证证明。
背景
靶序列捕获技术提供了核酸的定量、基于序列的遗传分析,并且可以用于进行药物代谢基因的组合突变和拷贝数分析。本发明人使用靶序列捕获技术和子序列遗传分析来检测稀有序列变体。
基因组DNA输入在稀有变体检测中发挥核心作用,但是基因组输入的定量分析和控制对稀有变异分析的估计灵敏度有限定。本发明人使用基因组qPCR分析来估计基因组输入。
稀有变体分析的一个实验目标是,引入10倍更多的基因组输入作为分析的目标灵敏度。换句话说,为了测量具有1%灵敏度(1/100)的变体,实验目标是输入1000个基因组。在测序的下游,生物信息学分析揭示了独特读取的数量,并且这具有作为基因组输入的正交和更直接的测量所需的质量。
总结
将具有已知SNV的细胞系(ZR75-30)与范围为1比1至1比1000稀释系列的种系DNA样本(NA12878)混合。使用靶序列捕获技术检索对应于已知序列差异的靶区域并测序。检测到以小于每1000个序列1个的频率发生的序列变体。
方法
捕获探针
下表显示了在本实验中使用的62个捕获探针的集合。
表1.在混合概念验证研究中使用的60个碱基探针序列
Figure GDA0003420037120000411
Figure GDA0003420037120000421
Figure GDA0003420037120000431
将储备板的捕获探针模块汇集,与伴侣寡聚物#138(SEQ ID NO:63)(GTGAAAACCAGGATCAACTCCCGTGCCAGTCACAT/3BioTEG/)合并,并稀释至1nM的最终工作浓度。
基因组样本
将来自种系样本NA12878和细胞系ZR75-30的商业购买的基因组DNA,在Covaris超声仪器上以10-20ng/μl的浓度片段化至500bp的靶片段大小。用1:1浓度的DNA纯化珠来纯化DNA,并使用New England Biolabs(NEB)Quick blunt试剂盒以终浓度为15-30ng/μL进行末端修复。分别以1:1、10:1、100:1和1000:1的比例,混合种系和细胞系DNA。构建、纯化和定量文库。在表2中显示了用于文库构建的样本编码、文库定量和输入。
表2.用作输入的衔接子和文库的基因组分析
混合 衔接子编码 基因组/μl #期望的基因组 进入PCR的μL
1:1 NNNNNNNNCATGGCCGCAGG(SEQ ID NO:64) 55 200 4
10:1 NNNNNNNNATCTTAGTGGCA(SEQ ID NO:65) 66 200 3
100:1 NNNNNNNNCGGAACTCGGAG(SEQ ID NO:66) 64 1000 16
1000:1 NNNNNNNNGACTCCGATCCC(SEQ ID NO:67) 77 10000 130
将基因组文库合并、变性、与探针组合、杂交并洗涤。将洗过的捕获探针标记的基因组文库复合物,用正向和反向全长引物扩增,纯化并在Pippin-prep仪器上筛选大小为225-600bp片段。最后,使用150-V3Illumina测序试剂盒对捕获的材料进行测序。
结果
使用靶向BRAF(在两个基因座中)、MYCN和CDH1的成对捕获探针,来分析这些基因座中的SNV。结果示于表3中。
表3.生物信息总结
Figure GDA0003420037120000441
Figure GDA0003420037120000451
第3列显示了独特读取计数的总数,这又提供了分析灵敏度的限定。估计和测量的基因组输入完全在彼此的范围内。浅色阴影框突出显示细胞系序列与种系序列不同的SNV。在没有独特读取过滤(显示在表的右部分)的情况下,在这四个所选位置处发生随机碱基变化,具有可测量的非零频率。图1。通过要求在独特读取家族内发生变化,可以从易出错的噪声中挑选真实信号。图2。
实施例2
有效用于在高度片段化的GDNA中靶区域全面测序的新探针设计
目的
这些实验的目的是开发一种分析***,以可靠地和可重复地查询循环DNA。
背景
来自体液的循环DNA的分析,代表了分子诊断中令人兴奋但还未实现的机会。基因组DNA是高度完整的。文献表明,循环DNA的平均大小是约150bp,其与包裹在单个核小体组蛋白复合物周围的DNA的大小良好地相关。
总结
设计本文涉及的靶序列捕获技术的技术参数,以适应高度片段化的DNA,并保持产生靶向DNA的全面序列覆盖的能力。增加捕获探针密度,并将捕获探针序列的长度从60个核苷酸减少到40个核苷酸,以使克隆文库中非信息序列的产生最小化。人类基因组零散分布着重复序列和碱基组成的剧烈变化,因此,不容许实现更高的捕获探针密度和更短的捕获探针的适合性,但是需要对新分析进行经验验证。
建立条件,其中较短的40mer捕获探针序列展示可靠和稳健的分析性能。在第一组实验中,将分析用于查询两个大区域—肿瘤抑制基因TP53的编码区和ALK致癌基因的长的、连续的内含子19,两者都是癌症诊断的核心。在第二组实验中,使用几个具有较短的40个核苷酸捕获探针序列的高密度成对捕获探针,来查询位于NCI-H69细胞系中的已知SNV。
将新的高密度更短的捕获探针成功地用于查询短片段化的DNA,并且结果表明该分析设计非常适合于在血液的血浆部分中发现的循环DNA的测序。
方法-修改的40mer捕获探针
表4中显示了用于经验验证40mer捕获探针性能的捕获探针序列。
Figure GDA0003420037120000461
Figure GDA0003420037120000471
Figure GDA0003420037120000481
Figure GDA0003420037120000491
Figure GDA0003420037120000501
将40mer捕获探针的性能与60mer捕获探针的性能进行比较。通过从60mer捕获探针的5'末端去除20个核苷酸,从60mer捕获探针设计40mer捕获探针。虽然两个捕获探针组的3'末端相对于从捕获的基因组克隆所复制的序列是相同的,但探针序列信号(配对末端读取的读取2)在60mer和40mer探针组之间是不同的。此设计是有用的,因为其允许捕获探针在测序期间的多重分析,并且在下游的生物信息学重迭解析期间随后分析其性能。
基因组样本
使用12个基因组DNA样本(选自112个人基因组DNA的Coriell人类组)的池作为靶DNA。将12个样本分成四组,每组四个样本,如表5中详细所示。
Figure GDA0003420037120000502
Figure GDA0003420037120000511
杂交、洗涤和测序
将六种不同的杂交条件,用于60mer探针和40mer探针与基因组靶DNA的杂交:
1)在50℃洗涤60mer探针。
2)在50℃洗涤40mer探针。
3)在47℃洗涤60mer探针。
4)在47℃洗涤40mer探针。
5)在44℃洗涤60mer探针。
6)在44℃洗涤40mer探针。
对于每个实验,将捕获探针寡核苷酸与伴侣寡核苷酸组合;双重捕获探针的最终浓度,对于每个捕获探针为1nM。
在40μl总体积中,每个杂交反应具有
Figure GDA0003420037120000512
2.5μg的基因组文库。将每个样本加热至98℃持续2分钟,然后在冰上冷却。加入20μl捕获探针和90μl杂交缓冲液,并将杂交混合物在80℃开始孵育,并且每48分钟降低1℃直至50℃,持续24小时。将复合物与1mL总体积的TEzero缓冲液+0.05%Tween20(TT)中的20μl链霉亲和素珠结合。将珠子洗涤3次,每次用200μl的TT洗涤5分钟,并且于45℃在洗涤缓冲液中洗涤5分钟。然后用TEzero洗涤珠子,并将每个反应重悬于20μl的TEzero中。然后用全长正向引物(ACA2_FLFP;SEQ ID NO:152;
AATGATACGGCGACCACCGAGATCTACACGTCATGCAGGACCAGAGAATTCGAATACA)和全长反向引物(CAC3_FLRP;SEQ ID NO:153;
CAAGCAGAAGACGGCATACGAGATGTGACTGGCACGGGAGTTGATCCTGGTTTTCAC)PCR扩增复合物。
扩增和纯化后,测量所得产物质量,并合并相等质量用于测序。
结果-修改的40mer引物
在图3中用图表显示了作为长度和洗涤温度的函数的捕获探针性能。总体上,40mer捕获探针以及60mer捕获探针进行44℃和47℃的洗涤。在50℃洗涤,40mer捕获探针展示分散的行为。这些数据经验证实,使用这些试剂时,使用40mer捕获探针和在44℃至47℃范围的洗涤温度。
方法-高密度40mer
通常,使用特定“规则”设计序列捕获探针。例如,通常避免冗长序列的区域或展现出极端碱基组成偏差的区域。对于沿着目标区域的高探针密度和探针的紧密间隔的要求,一个关键含义是:为了适应任何这样的探针设计规则,几乎没有或没有自由度来移动探针。在该研究中,仅基于它们相对于彼此的位置设计探针,而不考虑探针结合序列;因此,使用这种高密度方法需要经验地验证,杂交和处理方法将适应这样的探针集合。
人ALK基因编码在早期发育中重要的蛋白激酶,但正常成人中基本上检测不到正常的ALK基因表达。当ALK的内含子19经历非常规重组而将ALK的激酶编码部分融合到另一基因的5'末端时,就产生了致癌ALK融合。这种基因融合通常引起ALK激酶的异位表达,其反过来在驱动在肺肿瘤中观察到的不适当的细胞增殖中是重要的。在肺癌中,这种“其他基因”通常是EML4,但也检测到其他融合伴侣。为了产生可以检测任何可能的ALK基因融合事件的分析,设计了40个核苷酸探针,其被以80个核苷酸间隔置于ALK的内含子19中。将这些探针定向,使得它们相对于基因是反义的(图4)。这意味着它们的3'末端延伸并拷贝针对其杂交位点为5'的基因区域。当存在融合基因时,探针延伸来自位于融合连接复制连接序列附近的探针。从这些连接克隆得到的DNA序列在其5'端具有融合伴侣序列,在其3'端具有融合连接序列和ALK内含子19序列(图4B)。
癌症中另一重要的诊断目标是TP53基因。它编码肿瘤抑制因子,并且通常由于癌症中的突变而失活。可以使基因功能失活的突变散布在整个基因中,因此对于TP53失活突变的基于决定性序列的分析,必须解决基因的整个编码区和非翻译区(UTR)。因为循环DNA片段是短的,将高密度探针用于查询TP53基因的所有靶区域。与ALK不同,TP53的探针被置于两个可能的方向(图5)。在高探针密度下,来自多个探针的累积覆盖,提供了靶区域的均匀深度测序覆盖。
表6中显示了本研究中使用的105个探针的集合。除了靶向ALK的融合易感区域和TP53的编码区域的探针之外,还包括覆盖细胞系DNA中已知SNV的探针。
表6
Figure GDA0003420037120000531
Figure GDA0003420037120000541
Figure GDA0003420037120000551
Figure GDA0003420037120000561
Figure GDA0003420037120000571
Figure GDA0003420037120000581
基因组样本
分析了基因组DNA的三个样本:
1)种系样本NA 06994—从Coriell库获得的正常人样本;
2)癌细胞系NCI-H69—已知在TP53中具有突变的细胞系,MYCN基因座的扩增,以及被包括在目标探针组中的ALDH4A1、BRCA1、BRCA2、CDKN2A、DPYD、EPHX1、MYC、RB1和TNFRSF14中的SNV;
3)癌细胞系ZR-75-1,据报道其具有EML4-ALK融合基因(Lin等人,Mol.CancerRes.7(9):1466,2009)。
DNA测序文库通常由剪切的DNA片段构建。使用声学破坏来产生范围大小从200至>500bp的DNA片段。对声学断裂的DNA进行酶裂解以试图模仿循环DNA,其被认为由核小体的
Figure GDA0003420037120000582
150bp片段组成。简而言之,在200bp条件下对20-40ng/μl的DNA进行超声处理,从而产生范围大小从150bp至400bp的宽片段(broad smear)。通过向DNAse缓冲液(10mM Tris pH8.0,2.5mM MnCl2,0.5mM CaCl2)中50μl等分试样的DNA中,加入0.01和0.02μl的DNAse酶(New England Biolabs重组牛DNAse),进一步使DNA片段化。将DNAse反应在37℃孵育10分钟,并通过加入0.5M EDTA至终浓度为25mM而终止反应。首先向1体积DNA中加入0.9体积的珠,通过“双侧”珠选择来纯化平均大小为150bp的DNA。将结合不需要的较大片段的珠丢弃,并将另外1.6体积的珠加入到上清液中。然后将结合的材料纯化并定量。在图6中显示了用于文库构建的所得高度片段化的短DNA的琼脂糖凝胶。
使用QuickBeunt试剂盒形式NEB,将片段化的DNA进行末端修复,并以表7所示的比例混合。然后将10纳克的混合DNA连接到具有表7所示序列的衔接子上。对于混合物9和15,进行两个连接反应,每次10ng,随后合并。对于混合物16,进行四个反应。在表7中还显示了使用qPCR分析对每个文库的基因组输入的估计。
表7.样本和混合比
Figure GDA0003420037120000591
靶向的测序
汇集表7中所示的16个DNA文库中每一个的1微克,并调整至最终体积为160μL。将8个相同的20μL等分试样,在98℃变性,在冰上冷却,并以1nM/探针加入20μL的探针(表6)和50μL的CF hyb缓冲液。将样本从80℃至50℃退火24小时,洗涤并扩增。在所得捕获和处理的片段扩增后,使用大小选择为175-400bp的PippinPrepTM仪器,选择最终测序文库的大小。使用150读取V3试剂盒,在Illumina MiSeq上对文库进行测序。
结果
监测基于其在靶序列中的位置而选择的高密度捕获探针的捕获探针性能。每个捕获探针性能的图形显示如图7所示。这些数据表明:
1)通过位置约束严格选择的所有捕获探针提供中靶序列信息;
2)大多数捕获探针展示非常少的脱靶和不可映射的读取捕获;和
3)有用的中靶读取的产量基本上是均匀的。
进一步分析了捕获高比例的脱靶和不可映射读取的捕获探针。这些捕获探针通常位于低序列复杂性/高序列冗长的区域中。然而,在这里,这种捕获探针对测序深度没有显著的不利影响,因为高水平的探针冗长(高密度探针)意味着,所有区域被来自几个探针的读取覆盖。净效果是优异的覆盖均匀性。参见例如图8,使用40mer捕获探针的TP53基因的探针覆盖。
结论
总之,这些数据表明,捕获探针长度可以从60个核苷酸减少到40个核苷酸,探针性能的可识别损失很少或没有(一旦调节捕获洗涤温度)。它们还表明,探针设计可以遵循位置约束,并且通常可以忽略序列上下文或组成。即使该方法产生偶尔的不良性能探针,以紧密探针间隔的高冗余度完全能补偿单个探针缺陷。
实施例3
循环DNA的遗传分析
目的
这个实施例的目的是,使用cfDNA的有效克隆程序和目标检索***来对cfDNA的遗传分析进行基准检测。
背景
虽然科学和保健界对“液体活检”—与潜在疾病状态相关的标记物的循环DNA(cfDNA)的分析有极大的热情,但是关于这种潜在分析物的实际信息非常少。
总结
将从健康供体和患有卵巢或结肠癌的个体收集的血浆样本,用于进行循环DNA的遗传分析。循环cfDNA的量和总体特征可以在个体之间广泛变化。令人惊奇的是,本发明人发现cfDNA易于克隆,其效率与高度纯化和片段化的基因组DNA无明显区别;片段大小非常一致,平均克隆***片段大小为170±10bp(在7/8个样本中);并且来自这样的样本的基因组表示是统一的,并且与使用纯化的gDNA进行的实验相当。进一步确定,通过将独特读取计数,每个文库中的表示深度提供了患病患者cfDNA中存在的肿瘤标记物的次要等位基因频率的估计。这项研究确立了,本文涉及的构建和目标检索***能有效适用于cfDNA的定量遗传分析。
方法
DNA纯化
八组血浆样本购自Proteogenex,Inc.,Culver City,CA(表8)。使用来自Qiagen的循环核酸纯化试剂盒,从样本中提取循环DNA(在两个分开的场合)。采用离心使样本通过DNA微型柱。表8中显示了DNA的样本ID和产量。
表8.血浆样本和cfDNA产量
Figure GDA0003420037120000611
构建文库
将来自4mL血浆的纯化DNA收集在100μl洗脱缓冲液中。对于从结肠癌患者(CRC)收集的四个样本,将DNA分成两半,并将来自每个患者的一个50μl等分试样超声处理至200bp。将来自每个患者的一个50μl等分试样的未处理的cfDNA和一个50μl的片段化cfDNA(来自每个患者的整个样本),(每个样本)通过添加以下物质进行末端修复:
·6μl 10X快速平缓缓冲液(New England Biolabs(NEB))
·0.6μl 10mM dNTPs
·2.4μl快速钝化酶混合物
·1.2μl PreCR酶混合物。
将样本在20℃孵育30分钟,并在70℃孵育10分钟。通过组合与衔接子(表2)连接:
·60μl末端修复的cfDNA
·12μl衔接子双链体(10μM)
·10μl 10X连接酶缓冲液(NEB)
·15μl 50%PEG8000
·3μl HC T4 DNA连接酶
表9.用于四个CRC血浆样本的样本和编码
Progenex ID 样本# 预处理 衔接子
23149 1 NNNNNTTTTGTGTGTGTGTG(SEQ ID NO:275)
23407 2 NNNNNACTACACACACACAC(SEQ ID NO:276)
23406 3 NNNNNCTCGTGTGTGTGTGT(SEQ ID NO:277)
23185 4 NNNNNGAACACACACACACA(SEQ ID NO:278)
23149 5 片段化 NNNNNCATGTGTGTGTGTGT(SEQ ID NO:279)
23407 6 片段化 NNNNNGTGCACACACACACA(SEQ ID NO:280)
23406 7 片段化 NNNNNATAACACACACACAC(SEQ ID NO:281)
23185 8 片段化 NNNNNTACTGTGTGTGTGTG(SEQ ID NO:282)
反应在22℃孵育1小时,并在65℃孵育10分钟。通过加入100μl珠子,洗涤并在40μlTEzero中洗脱以纯化连接产物。通过PCR用引物ACA2(SEQ ID NO:283)扩增所有40μl连接产物,并将样本以相同质量组合用于靶向的捕获。
靶序列捕获和测序
将四个非片段化的和四个片段化的结肠血浆样本(图9C),与靶向TP53、ALK等的我们的高密度、40个核苷酸探针组杂交。如实施例2中所述处理捕获复合物。
结果
文库外观
装载有50ng每个文库的2%琼脂糖凝胶的伪色照片如图9A所示。平均片段大小在260±20bp的紧密范围内。这些数据表明,cfDNA的可克隆部分主要作为核小体片段存在。此外,cfDNA文库的大小与肾透析患者中的cfDNA具有相同的基本表面外观(Atamaniuk等人,Clinical Chemistry 52(3):pp.523-26(2006)),除了通过添加衔接子序列将cfDNA文库转变为更高质量(图9B)。相比之下,cfDNA文库与超声处理的gDNA文库有很大不同,它们显示为宽片段。
从两个卵巢癌患者血浆样本和来自健康志愿者的两个血浆样本,构建了另外四组cfDNA文库。在50μl总体积中,将38μl等分的cfDNA进行末端修复。连接物包括总体积80μl中40μl末端修复的片段、16μl衔接子(10μM)、8μl 10X连接酶缓冲液、16μl 50%PEG和4μlHCT4 DNA连接酶。将连接反应物在20℃下孵育1小时,并在65℃下孵育10分钟。为了纯化,加入20μl TEzero和150μl珠子。将纯化的连接产物重悬于40μl中,所有这些产物用于随后通过PCR的200μl文库扩增。得到的扩增文库如图9C所示。
测序数据分析
在八个文库中的每一个中,观察到的平均独特读取计数范围从
Figure GDA0003420037120000631
700个独特读取到>3000个独特读取,定义了从
Figure GDA0003420037120000632
0.15%至
Figure GDA0003420037120000633
0.03%的灵敏度范围。图10。可能会观察到不止一次的稀有突变读取,意味着最小灵敏度小于上述计算。在优选实施方案中,独特读取提供在统计上合理的观察频率的下限。
cfDNA克隆效率
将样本23407用作基准。从血浆样本中回收10ng/mL的cfDNA,在两个文库构建工作的每一个中,使用20ng分离的cfDNA。独特的读取计数表明,我们从非片段化的DNA(图10中的“23407”)恢复了平均700个独特读取(基因组当量)。考虑到每个基因组含有0.003ng的gDNA,则回收了该文库中2.1ng的输入DNA(10%克隆效率)。
在用该样本构建文库之前的片段化,将文库产量增加了超过两倍(图10中的“23407片段”)。这表明为使得可克隆,存在于23407样本中的大量DNA是需要片段化的高分子量DNA。因此,文库克隆效率可能远大于10%,并且可能在输入cfDNA的20%范围内。这种克隆效率与高度纯化的基因组DNA相当,并且表明cfDNA不可能以任何对下游克隆工作不利的方式被修饰。
文库覆盖范围
cfDNA文库类似于一组具有随机覆盖目标区域的离散条带。图11显示了序列数据的随机抽样。使用BLAT,将在克隆之前未被片段化的(参见图10)和被TP53探针“chr17:7579351:区域_3:280nt:41:80:r”(SEQ ID NO:201))捕获的来自样本23407的随机读取集合进行比对。考虑到样本制备的方式,总体上这些可能是cfDNA片段的反映,因为这些读取的左手部分(读取起始位点)随机分布在靶区域上。这种随机分布表明基因组DNA的随机破坏,并且它表明,尽管cfDNA文库的带状外观,测序输出是目标区域的随机覆盖。随机分布对于使用本文涉及的技术进行有效的遗传分析是重要的。
图12提供了用于典型cfDNA文库的TP53编码区测序的更高分辨率概述。靶向测序的要素—覆盖所有目标区域和在每个测序碱基的统一深度—是显而易见的。在每个碱基的>4000个独特读取的这个深度,并且要求必须至少遇到两次合理的候选碱基改变,可以估计,该具体文库的突变检测灵敏度在2000个序列中为约1个突变,或者0.05%。这种灵敏度水平代表了一个惊人的和意想不到的杰出技术成就。
结论
从具有与分离自细胞系(金标准)的高度纯化的gDNA相当的效率的血浆克隆中,分离并克隆cfDNA。所述cfDNA文库类似于循环核小体大小的DNA片段+衔接子,并且末端具有足够随机的特性,这使得能够进行有效的遗传分析。此外,血浆cfDNA文库的高度一致的大小特征,允许设计捕获策略和下面的探针序列,以最大程度地可靠地覆盖目标,距离探针末端120bp(=160-40)。
实施例4
测量循环DNA文库中的基因组当量
目的和背景
在循环无细胞DNA的分析中主要挑战之一是实现足够的分析灵敏度。如果没有获得足够的灵敏度,则cfDNA文库的分析陷入混乱中:如果样本被测序并且没有检测到突变事件,则该结果可以被解释为意味着没有突变存在,或者因取样深度太小而漏掉了重大事件。将分析的灵敏度在统计学术语中定义为假阴性率。在测序循环无细胞DNA的背景下,显著的障碍是检测混合到大量过量的参考序列中的稀有序列。
测定分析灵敏度的一种方法是测量突变体序列在一组样本中的出现,其中将突变体序列逐渐稀释到非突变体参考序列中。不再检测到突变序列的稀释度定义分析灵敏度。如果突变序列的同一性和稀释程度是已知的,则该方法是适当的。不幸的是,临床样本通常不提供任何参数。通常突变体序列的同一性是未知的,并且稀释程度随样本而变化。在这种情况下,在逐个样本的基础上建立分析灵敏度。
为了在逐个样本的基础上分配灵敏度值,通过测量存在于测序文库中的基因组当量的数目,来测量存在于每个样本中的不同序列和有区别的序列的数目。作为非限制性实例,如果已知DNA测序文库含有3ng(3000pg)人基因组DNA,并且每个人基因组具有3pg的质量,则文库具有3000÷3=1000个DNA的基因组当量。如果突变体DNA序列必须检测两次以具有统计学显著性,则对该具体文库的最佳可能的检测灵敏度估计是,2个突变体序列÷总计1000个序列=0.002=0.2%。为了建立灵敏度,必须测量每个样本文库的基因组当量的数目。
总结
使用两种方法来测量基因组当量。第一种方法是基于定量PCR(qPCR)。使用衔接子与基因组片段的连接和一对PCR引物(一个对共同基因组序列(例如,Alu I重复)是特异性的,另一个对衔接子是特异性的)构建基因组文库。测量这些cfDNA文库的连接的衔接子:片段序列的丰度。使用已知浓度的标准文库构建标准曲线,并将测量值与所得的标准曲线拟合,并从该拟合推导出基因组当量的值。
第二种测量基因组当量的方法,使用测序后进行的生物信息学计数。文库中的每个独特序列通过其随机序列标记和基因组序列的起始核苷酸来鉴定。此外,每个独特序列必须来源于独立的基因组。因此,存在于序列数据中的独特序列的总和,建立了样本中存在的基因组当量数目的精确定量测量。
方法和结果
开发qPCR分析
第一版基于qPCR的基因组当量分析使用ACA2引物(表10),但该分析长期过低报告了存在于cfDNA文库中的基因组当量的数目(图13)。
表10.用于开发基因组当量qPCR分析的PCR引物
Figure GDA0003420037120000661
所述分析的改进版本基于在整个人类基因组中以极高频率被发现的内源重复(例如,Alu重复)。通过将Alu特异性引物与衔接子特异性引物偶联,可靠地测量了衔接子与基因组片段连接的频率。产生使用已知基因组当量的文库的标准曲线,并通过与所述曲线拟合来测量克隆文库中基因组当量的数目。
用于开发基于Alu+衔接子的qPCR分析的PCR引物如表10中所示。使用PRIMER3(分别为Alu_F1&Alu_R1,SEQ ID NO:285和286),从共有的共有人Alu序列(Batzer&Deininger,Nat Rev Genet.3(5):370-9(2002)),设计用于Alu扩增的PCR引物。在文献(Marullo等人,Genome Biology 11:R9(2010))中,报道了剩余两个Alu引物(分别为Alu_F2和Alu_R2,SEQID NO:287和288)。
图14中提供了分析设计的示意图。因为单个PCR引物可用于扩增基因组DNA文库(图14A),所以使用识别衔接子序列但不能扩增基因组克隆的引物。58个核苷酸的ACA2-FLFP引物(以下缩写为AF,SEQ ID NO:284)符合这些标准,因为其长度诱导强的茎-环PCR抑制(图14B)。另外,使用一对功能性Alu引物(图14C)。此外,使用由一个Alu引物和不扩增基因组DNA的长ACA2引物组成的引物对(图14D)。这些相同的引物也扩增了基因组文库克隆(图14E)。
验证了用于基于功能性Alu分析的所有必需元件。图15。特别地,单独的长引物是惰性的,两组Alu引物对识别了人基因组DNA,并且一个Alu引物和长ACA2引物的任何组合扩增了基因组文库克隆(图15A)。最后,Alu引物加长ACA2引物对区分基因组DNA和基因组文库克隆的能力如图15B所示。将Alu_R1引物和AF引物的组合用于测量新构建的文库中的基因组当量。
在基于ACA2和基于Alu的qPCR分析之间的直接比较如图16所示。发现基因组当量的8倍差异。此外,基于Alu的分析法提供更一致的性能文库与文库和在测序运行中在qPCR衍生的当量和生物信息计数的标签当量之间更好的比对(表11)。
表11.qPCR与计数的测序标签
Figure GDA0003420037120000671
用于基于序列计数基因组当量的高灵敏度文库衔接子
如上所述,使用cfDNA的疾病监视的现实是,突变序列可能是在另外的大量过量的“正常”(意指种系)DNA序列中的稀有成分。因此,需要高度灵敏和可定量的测序分析。可以通过计数存在于测序文库中的独特序列的数目来测量分析灵敏度。然而,由于cfDNA片段相当短(
Figure GDA0003420037120000682
165bp),这种计数将导致错误的低估灵敏度,并且可能导致实际来源于独立克隆事件的相同读取。这个问题的一个解决方案是,在文库构建期间,通过在用于构建文库的衔接子中包括例如一组DNA标签来标记每个独立的测序克隆。
特别设计一组这样的文库构建衔接子,以测量cfDNA文库中存在的基因组当量的数目,并且,通过延伸,将测序分析的灵敏度用于监测突变序列。
如图17所示,高灵敏度文库衔接子的结构被配置为在cfDNA文库中容纳大量的基因组当量。在45个核苷酸连接链内部存在大量的分子工程,其是变成与末端修复的cfDNA片段连接的链。衔接子包含至少五个元件。
元件1是用于单引物文库扩增引物ACA2的PCR引物结合位点(表12)。
表12
元件 功能 序列数 序列(5'->3') SEQ ID NO:
元件1 PCR引物结合位点 1 TGCAGGACCAGAGAATTCGAATACA 289
元件2是5个核苷酸的读取编码。该编码与基因组DNA序列的组合构成了用于唯一鉴定每个读取的DNA标签。所述5个核苷酸编码由256个可能的独特序列组成,其被选择为与该组中每个其他编码不同的2个碱基变化。该特征使独特且有区别的读取与由于编码区中的测序错误而看起来是独特的读取区分开。将其中G残基被过度表示并且在经验上其被显示干扰衔接子功能的七个编码删除,留下249个随机编码。表13。
表13
Figure GDA0003420037120000681
Figure GDA0003420037120000691
Figure GDA0003420037120000701
元件3是相差至少两个碱基变化的3个核苷酸的样本编码。该元件用于鉴定不同的样本,并使测序运行中能够进行样本多重分析。表14。
表14
Figure GDA0003420037120000702
Figure GDA0003420037120000711
元件4是12个核苷酸的锚定序列,在文库构建和下游测序方面具有三个重要特征。表15。这些是:A)每个12个碱基延伸是四个12个碱基延伸家族的一部分,四个12个碱基延伸共同代表延伸内部每个位点处四个可能的DNA碱基中的每一个。Illumina测序仪器需要这种平衡的碱基代表的特征,以便在测序读取中校正正确的碱基调用。B)每个延伸都由四种可能碱基中的仅两种组成,并且这些被特别选择为6A’s+6C’s或6G’s+6T’s。这种仅由两个碱基形成的延伸,极大地降低了延伸序列将参与妨碍正确衔接子功能的二级结构形成的可能性。C)因为每个延伸由相同数目的A+C或G+T组成,每个延伸共享与一组四个中每个其它延伸大致相同的解链温度和双链体稳定性。
表15
Figure GDA0003420037120000712
元件5是在元件4的3'末端发现的两个碱基序列。基于经验数据选择所述具体的两个碱基延伸,经验数据显示这两个碱基序列是用于连接的有效底物。表15。
将衔接子模块与伴侣寡核苷酸杂交。表16。杂交发生在元件4中的序列和伴侣寡核苷酸之间。将双链衔接子连接到末端修复的cfDNA。
表16
Figure GDA0003420037120000713
Figure GDA0003420037120000721
为了将一组256个独立合成的并且合并的连接链(其中每个共享共同的样本编码并因此构成单个样本的衔接子集)转化为适合连接的双链体,将45个核苷酸的连接链与适当互补的12个核苷酸伴侣链组合,加热至95℃,冷却至65℃持续5分钟,然后冷却至室温。这种双链体形成钝端连接底物,如图17B所示。在连接和DNA纯化后,在PCR扩增之前发生的DNA聚合酶介导的步骤,置换了伴侣链并复制了连接链,以形成适用于通过单引物PCR的指数扩增的双链衔接子。
然后进行来自靶向的测序数据的基因组当量的定量分析。每个独特的读取被认为是独特的连接事件,并且独特读取的总和被认为等于所分析的基因组当量的数目。
进行粗糙的“信封背面(back-of-the-envelope)”、“经验法则(rule-of-thumb)”计算,以确定可以分析的基因组当量的数目。每个cfDNA克隆是约150个碱基对,其中50个碱基对是结合捕获探针所需要的。这在任何捕获的cfDNA克隆中留下大约100个可能的序列起始位点。将249个随机编码附加到100个可能的起始位点中的每一个,产生了约249,000个可能的独特克隆的总库。随着独特克隆的数目接近可能的序列组合的总数,概率指示相同的编码和起始位点组合将由独立事件创建,并且这些独立事件将被不适当地分组到单个家族中。净结果将是低估所分析的基因组当量,并且稀有突变体读取可能被当作测序错误丢弃,因为它们与具有相同标识符的野生型读数重叠。为了避免这种情况,使用qPCR分析法来试图将基因组输入限制为可能的独特克隆数目的十分之一或更少。例如,单个衔接子具有24,900个可能的克隆,因此具有提供对由2500个或更少基因组当量组成的文库进行精确分析的可靠能力。
所概述的过程作为实例提供,并且本文中涉及的方法不意味着受该实例的约束。在一些情况下,待分析的基因组当量数可能超过前一段落所示的2500个极限。为了扩展基因组当量的深度,这个问题的两种解决方案是随时可用的。第一个解决方案是,每个样本使用超过一个衔接子集。通过组合衔接子,可以扩展可能的克隆的总数,并因此扩大基因组输入的舒适极限。作为非限制性实例,用于一个样本的四个衔接子集的组合,将所述分析扩展为24,900×4=99,600个可能序列,和
Figure GDA0003420037120000731
10,000个合理分析的基因组当量。第二个解决方案是,将图17A中元件2的编码扩展为6、7或更多个碱基。与每个其他编码有至少2个碱基不同的可能编码的数目规模为4(n-1),其中n是元件2内部的碱基数。因此,在本文给出的非限制性实例中,n=5,且4(5-1)=256;因此,包含额外的碱基使得针对每个额外碱基将可用谱系扩大四倍。
结论
该实施例的结果显示,用于测定基因组当量的两种独立方法在样本处理工作流程中具有实用性。第一种方法qPCR,在cfDNA分析的文库构建阶段中实施,并且其被用作质量控制步骤以确保足够数目的基因组当量通过文库扩增、靶序列捕获和DNA测序移动。另一种方法使用独特读取的明确计数作为在信息学考虑下基因组当量的实际数目的更直接测量。
实施例5
定量遗传分析
目的
本实施例的目的是对正常DNA混合的癌症基因组和从癌症患者血浆中分离的未表征的cfDNA进行定量遗传分析。
背景
在人类癌症中是普遍存在三种类型的基因组事件。它们是:改变受影响的基因及其表达的蛋白质产物的功能的体细胞突变;产生嵌合基因融合物并因此表达具有新生物学性能的融合蛋白的基因组重排;以及导致基因丧失和基因产物过低表达、或相反地基因扩增和相应基因产物过度表达的基因拷贝数改变。在癌症患者的循环DNA中,这些异常基因座(其中许多在指导患者护理中具有关键意义)与患者的正常种系DNA混合(混合的)。
总结
在前面的实施例中,已经描述了为分析循环无细胞DNA(cfDNA)配置的技术,其目的在于癌症监视。然而,该技术广泛适用于任何分析、诊断和监测范例,包括但不限于:遗传疾病、胎儿检测、孟德尔病症、病原体筛选和器官移植监测,其中循环DNA是潜在的分析物。在该实施例中,将先前实施例中强调的技术特征应用于混合的癌症样本的分析。在该验证的第一阶段中,将来自癌症的细胞系与正常人DNA以限定的稀释度混合,并进行定量遗传分析。在本研究的第二阶段,从癌症患者血浆中分离出未表征的cfDNA,随后使用定量遗传分析进行检查。
方法
细胞系基因组DNA与正常人类DNA的混合物
使用以下DNA样本:
·NA06994—正常人基因组DNA(Coriell库);
·NCI-H2228—非小细胞肺癌细胞系(ATCC),在TP53(Q331*)和EML4-ALK基因融合(断裂点未知)中具有突变;和
·NCI-H69—小细胞肺癌细胞系(ATCC),含有MYCN基因的扩增(~100拷贝)。
文库制备:从细胞系分离的基因组DNA(以上全部三种)是与小尺寸cfDNA不同的高分子量材料。为了在这些验证实验中模拟cfDNA,首先使用Covaris Acoustic Sonicator,在“150bp”设置下将基因组DNA片段化。超声处理通常产生宽片段,并且使用“双侧”珠选择来进一步处理DNA。将DNA纯化珠的稀释溶液加入到样本中,并且丢弃粘附到珠子上的较高分子量片段(纯化的DNA的大小与加入的珠子的量成比例)。将另外的等分试样的珠子加入到剩余的上清液中,并且在该第二轮中,纯化粘附到珠子上的DNA(在结合缓冲液的较高总浓度中)。这种“双侧”纯化产生窄尺寸分布,其为cfDNA的合理代表(图18)。
将片段化的基因组DNA以表17中所示和下面结果部分所述的各种比例进行末端修复、定量和混合。
表17.用于验证研究的样本和混合物
Figure GDA0003420037120000751
cfDNA文库可能有有限的DNA输入。每mL患者血浆获得的cfDNA的量是广泛变化的,但是下限(例如,实施例3)通常为
Figure GDA0003420037120000752
10ng/mL,这相当于3300个人基因组。为了防止有限的cfDNA数量,模拟混合实验以反映常规地从患者收集的cfDNA的下限。这个约束适用于除最极端混合物之外的所有混合物。在这些后面的混合物中,制备文库以模拟来自低产量患者cfDNA的4mL(NA06994:H2228 1000:1)或8mL(NA06994:H69500:1)的输入。然后将混合样本连接到实施例4中描述的衔接子集。在表17中还显示了,使用qPCR(实施例4)测量每个纯化文库中的基因组当量。扩增、定量文库,并且合并每个文库的等量质量(每个500ng)。将合并的样本与实施例2的表6中列出的概念验证的高密度40mer捕获探针杂交。在链霉亲和素包被的珠子上捕获所得复合物,如前面实施例所述将所得复合物洗涤、处理、扩增、纯化并进行大小选择。使用Illumina MiSeq仪器上的Illumina 150bp-V3 Miseq测序试剂盒,分析所得文库。
对于生物信息学分析,使用稀有的体细胞变体调用者来检测突变,使用分离的读取比对器来检测融合基因,并且将量化的和在统计学上拟合标签的内部分析,用于称呼拷贝数变异(CNV)。
TP53基因中混合点突变的检测如图19所示。“预期”频率偏离混合比,因为已知TP53在NCI-H2228细胞系中是半合子的。自动化软件能够调用50:1混合物中的突变等位基因。需要手动处理来调用1000:1的突变事件。关于特异性,将实施例1中描述的标签过滤应用于分析,并且在应用该标签过滤器之后,TP53中没有检测到其他突变调用。
已知细胞系NCI-H2228在EML4和ALK之间具有融合基因;在荧光原位杂交分析和使用RT-PCR来检测融合基因转录物中,将该细胞系用作阳性对照。没有已发表的关于基因融合连接的确切位置的报道。使用ALK的内含子19区域的密集探针覆盖,序列分析揭示了当两个基因融合时所形成的连接的精确位置和序列(图20)。在NCI-H2228细胞系中,正常读取相对于连接读取的频率(分别为378对249)表明融合基因与ALK的正常拷贝是杂合的。
作为混合物的函数的连接读取的检测,如图21所示。与点突变检测一样,调整预期值以反映以下事实:每个二倍体基因组的一个拷贝中发现突变的等位基因。在1000:1的混合样本中未检测到融合读取。
图22显示作为混合物的函数的MYCN基因的CNV测定结果。NCI-H69细胞系含有高度扩增的MYCN基因。MYCN通常作为单拷贝基因被发现,每个二倍体基因组两个,因此对于逐渐更稀释的混合物的预期结果是,标签计算的CNV应该渐近地接近2个拷贝(图中突出显示渐近线)。这里显示的验证实验表明,本发明中描述的分析***对高度扩增的基因是强烈敏感的。
来自癌症患者的cfDNA的变异发现
本文涉及的技术的最严格验证是,将其应用于其中突变谱未知的cfDNA样本。通过对来自两个卵巢癌患者的匹配cfDNA、肿瘤和正常邻近组织(NAT)样本测序来进行分析。此外,分析了来自结肠直肠癌(CRC)患者的两个cfDNA样本和来自健康志愿者的两个cfDNA样本。在任何情况下,健康志愿者样本中没有检测到突变、融合或异常CNV。
使用实施例2的表6中描述的靶向探针,首先筛选来自四个癌症患者的cfDNA文库。这些探针主要配置为检测TP53基因中的点突变,与ALK的基因融合物和MYCN的扩增。该初始测序筛选的结果如图23所示。在一个卵巢患者的cfDNA、肿瘤和NAT中,发现了在相同碱基位置发生的点突变。在另一组卵巢癌患者的匹配样本中,未发现TP53突变。还在不能获得匹配组织的两个CRC cfDNA文库中检测到点突变。所有这些点突变先前已在肿瘤中鉴定,并且已知所有这些点突变是肿瘤发生的因果驱动因子。在cfDNA文库CRC406中,0.9%的突变序列检测完全在分析灵敏度的范围内。灵敏度由多个标记的读取家族的存在来定义,所有标记的读取都具有突变序列。这些数据突出了本文所涉及的***的临床效用。
为了进一步探索cfDNA文库和相关组织中癌症相关变化的检测,将相同的文库与一组针对总共20种不同癌症相关基因的679个探针杂交(表18)。在该探针组中,靶向14种基因的所有编码区,而在剩余的6种基因中靶向选择基因座。
表18.靶向的癌症基因
基因:靶向的编码区 基因:靶向的选择区
BRCA1 ALK
BRCA2 DPYD
BRAF EPHX1
CDH1 MYC
ERBB2 TNFRSF14
JAK2 ALDH4A1
NF2
PIK3CA
RB1
CDKN2A
KRAS
MYCN
PTEN
TP53
如图24所示,在TP53中缺乏任何可检测变化的OVA1样本,携带了在cfDNA中和在相应肿瘤中发现的KRAS突变。该观察结果突出了本文所述的分析***的显著特征。可以使用数百种(如在本实施例中),甚至数千种靶向探针来查询从cfDNA产生的文库。所得到的靶向文库的测序揭示了存在于受影响个体的肿瘤内部而不在种系内部的体细胞突变。这些肿瘤相关的体细胞标志物,也可用于定量从肿瘤脱落的循环DNA的量(与具有种系序列的cfDNA相反)。因此,不管其生物学意义如何,发现突变也提供了混合cfDNA中肿瘤含量的估计。
许多靶向的治疗在正常基因存在下最成功(例如,EGFR抑制剂仅在存在野生型KRAS的情况下起作用)。在没有发现基因突变的这些情况下,循环肿瘤DNA水平的定量评估变得特别重要。换句话说,在具体靶基因的循环肿瘤DNA的可证实存在,与野生型测序结果结合表明,靶基因在肿瘤内部是正常的,并且该结果可能在指导治疗的选择中具有显著影响。在图24中突出显示的是OVA1样本的情况。在cfDNA文库中存在KRAS突变表明,该患者的肿瘤含有野生型TP53基因。
异常基因发现的另一个实例如图25所示。靶向的定量遗传分析***揭示在ERBB2基因中存在显著扩增,或者称为HER-2/neu。虽然这种类型的扩增已经在乳腺癌中被广泛公开,但是它也偶尔在结肠直肠癌中被鉴定。
结论
采用细胞系DNA的验证实验,揭示了对于驱动癌症中肿瘤生长至关重要的三种类型的遗传变异的检测阈值。来自癌症患者的cfDNA的表征,揭示了肿瘤相关的遗传变化,其远远高于通过重建实验在分析的所有四个样本中设定的阈值。这些数据表明,本文涉及的定量分析***可具有显著的临床效用,特别是在液体活检最合适的设置下。
一般来说,在所附权利要求中所用的术语不应被解释为将权利要求限制于说明书和权利要求中公开的具体实施方案,而是应被解释为包括所有可能的实施方案以及这些权利要求所赋予的等同物的全部范围。因此,权利要求不受本公开的限制。
序列表
<110> 克里斯多弗·K·雷蒙德;
林继力;
克里斯多弗·D·阿莫尔
<120> 用于无细胞DNA的定量遗传分析的方法
<130> CLFK-002/00WO
<140> PCT
<141> 2014-08-22
<160> 562
<170> PatentIn version 3.5
<210> 1
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 1
taaacattgg aaaggtttct aattaaccag gagatccaaa agaaagcggt tcaagtagca 60
<210> 2
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 2
gatctcagtt tttttggtta actatgtatt ttggtatatg aagcttctgg gttttgcaca 60
<210> 3
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 3
gacagataag catacatatt aacatggata tatatgtgaa tttcattcaa atggttctca 60
<210> 4
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 4
agctcttagc ctttgggggg atgacactct tgagcggacg tggggacgcc tcgctcttta 60
<210> 5
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 5
aagcccccac cgccgcctct ttccaaaata aacaccagcc agccgccgag cccggagtcg 60
<210> 6
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 6
gcctcccttc cccctccccg cccgacagcg gccgctcggg ccccggctct cggttataag 60
<210> 7
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 7
ggtgtggcag ccaggggggc gcactctgct ctggctgggc cccttctccc atgttttctt 60
<210> 8
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 8
ttacacaacc tttgggcttg gacaacactt tggggtccaa agaacctaag agtctttctg 60
<210> 9
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 9
tgatgaaact tgggctggat ggggcacagg tagggtgctt gttgctttca gtcagatgaa 60
<210> 10
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 10
aatgaaagaa aaggaggcca gattgctact cctggtccct gccacacact aggtacccta 60
<210> 11
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 11
attgacaata cctacataaa actctttcca gaatgttgtt aagtcttagt cattagggag 60
<210> 12
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 12
ggatttccac caacactgta ttcatgtacc catttttctc ttaacctaac tttattggtc 60
<210> 13
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 13
caaaggggga aaaccatcag gacattattt aacaacggaa atatctaact gaaaggcaaa 60
<210> 14
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 14
caggcagacc aaccaaagtc tttgttccac cttttaaaac taaatcacat tttcacagag 60
<210> 15
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 15
ccccagccag cggtccgcaa cccttgccgc atccacgaaa ctttgcccat agcagcgggc 60
<210> 16
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 16
cgactcatct cagcattaaa gtgataaaaa aataaattaa aaggcaagtg gacttcggtg 60
<210> 17
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 17
ctgtggcgcg cactgcgcgc tgcgccaggt ttccgcacca agaccccttt aactcaagac 60
<210> 18
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 18
ttctactgcg acgaggagga gaacttctac cagcagcagc agcagagcga gctgcagccc 60
<210> 19
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 19
accgagctgc tgggaggaga catggtgaac cagagtttca tctgcgaccc ggacgacgag 60
<210> 20
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 20
gccgccgcct cagagtgcat cgacccctcg gtggtcttcc cctaccctct caacgacagc 60
<210> 21
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 21
ggcggctagg ggacaggggc ggggtgggca gcagctcgaa tttcttccag atatcctcgc 60
<210> 22
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 22
agacgagctt ggcggcggcc gagaagccgc tccacataca gtcctggatg atgatgtttt 60
<210> 23
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 23
aggagagcag agaatccgag gacggagaga aggcgctgga gtcttgcgag gcgcaggact 60
<210> 24
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 24
taagagtggc ccgttaaata agctgccaat gaaaatggga aaggtatcca gccgcccact 60
<210> 25
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 25
ttgtatttgt acagcattaa tctggtaatt gattatttta atgtaacctt gctaaaggag 60
<210> 26
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 26
gaggccacag caaacctcct cacagcccac tggtcctcaa gaggtgccac gtctccacac 60
<210> 27
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 27
agaggaggaa cgagctaaaa cggagctttt ttgccctgcg tgaccagatc ccggagttgg 60
<210> 28
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 28
tccaacttga ccctcttggc agcaggatag tccttccgag tggagggagg cgctgcgtag 60
<210> 29
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 29
gcttggacgg acaggatgta tgctgtggct tttttaagga taactacctt gggggccttt 60
<210> 30
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 30
gcatttgatc atgcatttga aacaagttca taggtgattg ctcaggacat ttctgttaga 60
<210> 31
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 31
cgccccgcgc cctcccagcc gggtccagcc ggagccatgg ggccggagcc gcagtgagca 60
<210> 32
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 32
ctctggcccc gccggccgcg ggacctcggc ggggcatcca cagggcaggg tcccgccgct 60
<210> 33
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 33
ggcatgactt ggagtgagtt tggatggggt ggccaggtct gagaaggtcc cccgccagtg 60
<210> 34
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 34
gcagggcacc ttcttctgcc acccacctgt aaacagaggg ctcagcccag ctggaggcag 60
<210> 35
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 35
cccaagatct ccaagtactg gggaacccca gggaggccct ggggggtggc agtgttccta 60
<210> 36
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 36
ctaatgcaca caaagcctcc ccctggttag cagtggccct ggtcagctct gaataaccaa 60
<210> 37
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 37
ctgctcctct tttagaaggc aggagggccc caagggaagc agaaggtgac agaaggggaa 60
<210> 38
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 38
tggggcagtg gcgggcaggc actgggttgt aagttgggag tttgcggctg gggtcaggct 60
<210> 39
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 39
tctgctgctg tttgtgcctc tctctgttac taacccgtcc tctcgctgtt agacatctct 60
<210> 40
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 40
cccacccctc ccatgtcacc tgtatgacac ctgcattcca cccggcccca gccctcccct 60
<210> 41
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 41
tgggccaggt agtctcccta gaaggtgatg ctgatgaggg tctggtgccc agggcgccac 60
<210> 42
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 42
ggtgcccacc ccttgcatcc tggggggtag agcacattgg gcacaaagca gaggcacata 60
<210> 43
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 43
caccctgcct ggtactgccc tattgcccct ggcacaccag ggcaaaacag cacagtgaaa 60
<210> 44
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 44
ccatttacag aaacaaacct ccccaccaaa atgagaaaac tgtgtttctc cctggcactc 60
<210> 45
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 45
ttattcttct tgtgcctggg cacggtaatg ctgctcatgg tggtgcacga agggccaggg 60
<210> 46
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 46
gaaggatagg acagggtggg ctgggccagg ctgcatgcgc agagggacag gaactgcagc 60
<210> 47
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 47
gggcccggac cctgatgctc atgtggctgt tgacctgtcc cggtatgaag gctgagacgg 60
<210> 48
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 48
tctgtctcct gccatcccca agagatgctg ccacatctgg atcctcagga ctctgtctgc 60
<210> 49
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 49
tcacgtccca gggcagtttt cttccctgaa gaaagttgga tggcatgatc tgtcttccca 60
<210> 50
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 50
gtgttgagaa cagactactg acttctaata gcagcgactt ctttaccttg ataaaccaca 60
<210> 51
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 51
aaaaaaagga tgggttccat atgggtggtg tcaagtgccc acctcctagc aagtcagcag 60
<210> 52
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 52
ccctcacaag gtcaaagcta tacatcagct cctgtgacat tgactcatcc cccagacctt 60
<210> 53
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 53
aacccaccga gatctgcaaa ctttgcagga tgcaccagat gtcttgtagc catgggtcaa 60
<210> 54
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> TYMSr4r 探针
<400> 54
tgcctccctc aggtgcctct gcacaaaacc agattgcttc cctctaagag tatggttagt 60
<210> 55
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 55
gttttacttt gcctttagct gtggtctttc aaaccaccat ccctccttat cttcctctgc 60
<210> 56
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 56
ctctgcaatt tgttttccca tattaaagaa ctgaagagct cagtgtggta ggctggcaag 60
<210> 57
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 57
ttttaaatga tgttttaaag aattgaaact aacatactgt tctgctttct cccccgggtt 60
<210> 58
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 58
cctgcccacc acttctccct aaactgaagc cccacatttg gagcagtcat ctttatcttg 60
<210> 59
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 59
ggttgcgctc caatcatgtt acataaccta cggcaaggta tcgacaggat catactcctg 60
<210> 60
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 60
gcacagttac atttgccagt ggcaacatcc ttaaaaatta ataactgata ggtcacggac 60
<210> 61
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 61
cgtcccgccg cgccacttgg cctgcctccg tcccgccgcg ccacttcgcc tgcctccgtc 60
<210> 62
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 62
ctgtaaggcg aggaggacga tgcgtcccct ccctcgcagg attgaggtta ggactaaacg 60
<210> 63
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 伴侣寡核苷酸 #138
<400> 63
gtgaaaacca ggatcaactc ccgtgccagt cacat 35
<210> 64
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 衔接子
<220>
<221> misc_feature
<222> (1)..(8)
<223> n 是 a, c, g或t
<400> 64
nnnnnnnnca tggccgcagg 20
<210> 65
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 衔接子
<220>
<221> misc_feature
<222> (1)..(8)
<223> n 是 a, c, g或t
<400> 65
nnnnnnnnat cttagtggca 20
<210> 66
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 衔接子
<220>
<221> misc_feature
<222> (1)..(8)
<223> n 是 a, c, g或t
<400> 66
nnnnnnnncg gaactcggag 20
<210> 67
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 衔接子
<220>
<221> misc_feature
<222> (1)..(8)
<223> n 是 a, c, g或t
<400> 67
nnnnnnnnga ctccgatccc 20
<210> 68
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 68
atgtgactgg cacgggagtt gatcctggtt ttcacgggtt tgagtggcat gagctaccta 60
ctggatgtgc ctgactgttt ccccttcttc ttccc 95
<210> 69
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 69
atgtgactgg cacgggagtt gatcctggtt ttcacctatc tccaggatgg agagagggaa 60
aaaaaagatg ggtctgtgtg ggagggcagg tactt 95
<210> 70
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 70
atgtgactgg cacgggagtt gatcctggtt ttcacgaaag aagccaggtc ttcaattaat 60
aagattccct ggtctcgttt gtctacctgt taatg 95
<210> 71
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 71
atgtgactgg cacgggagtt gatcctggtt ttcaccagac tcgcgcccaa ttttccccca 60
ccccttgtta ttgccacaaa atcctgagga tgatc 95
<210> 72
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 72
atgtgactgg cacgggagtt gatcctggtt ttcacaagca cctagcccca ttcctgctga 60
gcaggaggtg gcaggtaccc cagactggga ggtaa 95
<210> 73
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 73
atgtgactgg cacgggagtt gatcctggtt ttcacagtcg gtggggccag gatgaggccc 60
agtctgttca cacatggctg ctgcctctca gctct 95
<210> 74
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 74
atgtgactgg cacgggagtt gatcctggtt ttcaccctgg ccctcagcca gtacagaaag 60
tcatttgtca aggccttcag ttggcagacg tgctc 95
<210> 75
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 75
atgtgactgg cacgggagtt gatcctggtt ttcacagaat tcattgccag ctataaatct 60
gtggaaacgc tgccacacaa tcttagcaca caaga 95
<210> 76
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 76
atgtgactgg cacgggagtt gatcctggtt ttcacttact tccctccagt tttgttgctt 60
gcaaaacaac agaatcttct ctccatgaaa tcatg 95
<210> 77
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 77
atgtgactgg cacgggagtt gatcctggtt ttcaccaggg gtatctatta tccccatttt 60
ctcacaaagg aaaccaagat aaaaggttta aatgg 95
<210> 78
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 78
atgtgactgg cacgggagtt gatcctggtt ttcactgtta cctttaaaag acatctgctt 60
tctgccaaaa ttaatgtgct gaacttaaac ttacc 95
<210> 79
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 79
atgtgactgg cacgggagtt gatcctggtt ttcacttccc agtaaattac tcttaccaat 60
gcaacagact ttaaagaagt tgtgttttac aatgc 95
<210> 80
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 80
atgtgactgg cacgggagtt gatcctggtt ttcactaaat gacataacag ttatgatttt 60
gcagaaaaca gatctgtatt tatttcagtg ttact 95
<210> 81
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 81
atgtgactgg cacgggagtt gatcctggtt ttcacgacag gttttgaaag atatttgtgt 60
tactaatgac tgtgctataa cttttttttc tttcc 95
<210> 82
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 82
atgtgactgg cacgggagtt gatcctggtt ttcacctgtg gcgcgcactg cgcgctgcgc 60
caggtttccg caccaagacc cctttaactc aagac 95
<210> 83
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 83
atgtgactgg cacgggagtt gatcctggtt ttcacggcgg ctaggggaca ggggcggggt 60
gggcagcagc tcgaatttct tccagatatc ctcgc 95
<210> 84
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 84
atgtgactgg cacgggagtt gatcctggtt ttcacaccga gctgctggga ggagacatgg 60
tgaaccagag tttcatctgc gacccggacg acgag 95
<210> 85
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 85
atgtgactgg cacgggagtt gatcctggtt ttcacaggag agcagagaat ccgaggacgg 60
agagaaggcg ctggagtctt gcgaggcgca ggact 95
<210> 86
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 86
atgtgactgg cacgggagtt gatcctggtt ttcacctgta agttatcgta aaaaggagca 60
tctaggtagg tctttgtagc caatgttacc cgatt 95
<210> 87
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 87
atgtgactgg cacgggagtt gatcctggtt ttcacaatgg ccattcttcc aggaggcaca 60
gaaattacag gccatgcaca gagagaaata cccga 95
<210> 88
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 88
atgtgactgg cacgggagtt gatcctggtt ttcaccttgt tcgttccttg tactgagacc 60
ctagtctgcc actgaggatt tggtttttgc ccttc 95
<210> 89
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 89
atgtgactgg cacgggagtt gatcctggtt ttcacatcaa gactcatcag taccatcaaa 60
agctgagatg aaacagtgta agtttcaaca gaaat 95
<210> 90
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 90
atgtgactgg cacgggagtt gatcctggtt ttcactgtgt ccagctgtga aactcagaga 60
tgtaactgct gacatcctcc ctattttgca tctca 95
<210> 91
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 91
atgtgactgg cacgggagtt gatcctggtt ttcacatttg aaacaatttt atcatgaatg 60
ccatgaccaa agtattcttc tgtatcttct ttctt 95
<210> 92
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 92
atgtgactgg cacgggagtt gatcctggtt ttcactgatg ggtgggctcc cgaaggggcc 60
tcccgcagac ttgcgaagtt cccactctct gggcg 95
<210> 93
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 93
atgtgactgg cacgggagtt gatcctggtt ttcaccaggg tgcgggggca tccaggctgc 60
ccaagcggag gctgggccgg ctgtgctggc ctctt 95
<210> 94
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 94
atgtgactgg cacgggagtt gatcctggtt ttcacttttg aaatgtgggt ttgttgccat 60
gaaacgtgtt tcaagcatag ttttgacaga taacg 95
<210> 95
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 95
atgtgactgg cacgggagtt gatcctggtt ttcactgccc taaaagtgta tgtataacat 60
ccctgatgtc tgcatttgtc ctttgactgg tgttt 95
<210> 96
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 96
atgtgactgg cacgggagtt gatcctggtt ttcacaaccc ctcgaggctc agacctttgg 60
agcaggagtg tgattctggc caaccaccct ctctg 95
<210> 97
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 97
atgtgactgg cacgggagtt gatcctggtt ttcaccataa atatgtgtgc tagtcctgtt 60
agacccaagt gctgcccaag ggcagcgccc tgctc 95
<210> 98
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 98
atgtgactgg cacgggagtt gatcctggtt ttcactactt gttaattaaa aattcaagag 60
tttttttttc ttattctgag gttatctttt tacca 95
<210> 99
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 99
atgtgactgg cacgggagtt gatcctggtt ttcacccaaa atctgttttc caataaattc 60
tcagatccag gaagaggaaa ggaaaaacat caaaa 95
<210> 100
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 100
atgtgactgg cacgggagtt gatcctggtt ttcacatact ccatctcccg taaaaatagt 60
gagacttgag taatgtttga tgtcacttgt ctttc 95
<210> 101
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 101
atgtgactgg cacgggagtt gatcctggtt ttcaccagtc accactatat tattctaggt 60
atcccagaaa agttaaagtc aaatctgaaa cacat 95
<210> 102
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 102
atgtgactgg cacgggagtt gatcctggtt ttcaccgccc cgcgtccgac ccgcggatcc 60
cgcggcgtcc ggcccgggtg gtctggatcg cggag 95
<210> 103
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 103
atgtgactgg cacgggagtt gatcctggtt ttcacccata cgggcagcac gacgcgcgga 60
ctgcgattgc agaagatgac ctgggagggc tcgcg 95
<210> 104
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 104
atgtgactgg cacgggagtt gatcctggtt ttcactagag gggcttcaga ccgtgctatc 60
gtccctgctg ggtcgggcct aagcgccggg cccgt 95
<210> 105
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 105
atgtgactgg cacgggagtt gatcctggtt ttcacggcgc cgaggaggag atggaggccg 60
ggcggccgcg gcccgtgctg cgctcggtga actcg 95
<210> 106
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 106
atgtgactgg cacgggagtt gatcctggtt ttcacggtgt gggccaccgt gcccagccac 60
cggtgtggct ctttaacaac ctttgcttgt cccga 95
<210> 107
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 107
atgtgactgg cacgggagtt gatcctggtt ttcacaagtg gtctatcctg tacttaccac 60
aacaacctta tctttttaaa aagtaaaacg tcagt 95
<210> 108
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 108
atgtgactgg cacgggagtt gatcctggtt ttcaccttgt tcgttccttg tactgagacc 60
ctagtctgcc actgaggatt tggtttttgc ccttc 95
<210> 109
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 109
atgtgactgg cacgggagtt gatcctggtt ttcacatcaa gactcatcag taccatcaaa 60
agctgagatg aaacagtgta agtttcaaca gaaat 95
<210> 110
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 110
atgtgactgg cacgggagtt gatcctggtt ttcacaccta ctggatgtgc ctgactgttt 60
ccccttcttc ttccc 75
<210> 111
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 111
atgtgactgg cacgggagtt gatcctggtt ttcacgggaa aaaaaagatg ggtctgtgtg 60
ggagggcagg tactt 75
<210> 112
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 112
atgtgactgg cacgggagtt gatcctggtt ttcacttaat aagattccct ggtctcgttt 60
gtctacctgt taatg 75
<210> 113
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 113
atgtgactgg cacgggagtt gatcctggtt ttcaccccca ccccttgtta ttgccacaaa 60
atcctgagga tgatc 75
<210> 114
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 114
atgtgactgg cacgggagtt gatcctggtt ttcacgctga gcaggaggtg gcaggtaccc 60
cagactggga ggtaa 75
<210> 115
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 115
atgtgactgg cacgggagtt gatcctggtt ttcacggccc agtctgttca cacatggctg 60
ctgcctctca gctct 75
<210> 116
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 116
atgtgactgg cacgggagtt gatcctggtt ttcacgaaag tcatttgtca aggccttcag 60
ttggcagacg tgctc 75
<210> 117
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 117
atgtgactgg cacgggagtt gatcctggtt ttcacaatct gtggaaacgc tgccacacaa 60
tcttagcaca caaga 75
<210> 118
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 118
atgtgactgg cacgggagtt gatcctggtt ttcactgctt gcaaaacaac agaatcttct 60
ctccatgaaa tcatg 75
<210> 119
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 119
atgtgactgg cacgggagtt gatcctggtt ttcacatttt ctcacaaagg aaaccaagat 60
aaaaggttta aatgg 75
<210> 120
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 120
atgtgactgg cacgggagtt gatcctggtt ttcactgctt tctgccaaaa ttaatgtgct 60
gaacttaaac ttacc 75
<210> 121
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 121
atgtgactgg cacgggagtt gatcctggtt ttcacccaat gcaacagact ttaaagaagt 60
tgtgttttac aatgc 75
<210> 122
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 122
atgtgactgg cacgggagtt gatcctggtt ttcacatttt gcagaaaaca gatctgtatt 60
tatttcagtg ttact 75
<210> 123
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 123
atgtgactgg cacgggagtt gatcctggtt ttcactgtgt tactaatgac tgtgctataa 60
cttttttttc tttcc 75
<210> 124
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 124
atgtgactgg cacgggagtt gatcctggtt ttcactgcgc caggtttccg caccaagacc 60
cctttaactc aagac 75
<210> 125
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 125
atgtgactgg cacgggagtt gatcctggtt ttcacggggt gggcagcagc tcgaatttct 60
tccagatatc ctcgc 75
<210> 126
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 126
atgtgactgg cacgggagtt gatcctggtt ttcaccatgg tgaaccagag tttcatctgc 60
gacccggacg acgag 75
<210> 127
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 127
atgtgactgg cacgggagtt gatcctggtt ttcacgacgg agagaaggcg ctggagtctt 60
gcgaggcgca ggact 75
<210> 128
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 128
atgtgactgg cacgggagtt gatcctggtt ttcacgagca tctaggtagg tctttgtagc 60
caatgttacc cgatt 75
<210> 129
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 129
atgtgactgg cacgggagtt gatcctggtt ttcacgcaca gaaattacag gccatgcaca 60
gagagaaata cccga 75
<210> 130
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 130
atgtgactgg cacgggagtt gatcctggtt ttcacagacc ctagtctgcc actgaggatt 60
tggtttttgc ccttc 75
<210> 131
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 131
atgtgactgg cacgggagtt gatcctggtt ttcactcaaa agctgagatg aaacagtgta 60
agtttcaaca gaaat 75
<210> 132
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 132
atgtgactgg cacgggagtt gatcctggtt ttcacagaga tgtaactgct gacatcctcc 60
ctattttgca tctca 75
<210> 133
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 133
atgtgactgg cacgggagtt gatcctggtt ttcacgaatg ccatgaccaa agtattcttc 60
tgtatcttct ttctt 75
<210> 134
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 134
atgtgactgg cacgggagtt gatcctggtt ttcacgggcc tcccgcagac ttgcgaagtt 60
cccactctct gggcg 75
<210> 135
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 135
atgtgactgg cacgggagtt gatcctggtt ttcacgctgc ccaagcggag gctgggccgg 60
ctgtgctggc ctctt 75
<210> 136
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 136
atgtgactgg cacgggagtt gatcctggtt ttcacgccat gaaacgtgtt tcaagcatag 60
ttttgacaga taacg 75
<210> 137
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 137
atgtgactgg cacgggagtt gatcctggtt ttcacaacat ccctgatgtc tgcatttgtc 60
ctttgactgg tgttt 75
<210> 138
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 138
atgtgactgg cacgggagtt gatcctggtt ttcactttgg agcaggagtg tgattctggc 60
caaccaccct ctctg 75
<210> 139
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 139
atgtgactgg cacgggagtt gatcctggtt ttcacctgtt agacccaagt gctgcccaag 60
ggcagcgccc tgctc 75
<210> 140
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 140
atgtgactgg cacgggagtt gatcctggtt ttcacaagag tttttttttc ttattctgag 60
gttatctttt tacca 75
<210> 141
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 141
atgtgactgg cacgggagtt gatcctggtt ttcacaattc tcagatccag gaagaggaaa 60
ggaaaaacat caaaa 75
<210> 142
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 142
atgtgactgg cacgggagtt gatcctggtt ttcacatagt gagacttgag taatgtttga 60
tgtcacttgt ctttc 75
<210> 143
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 143
atgtgactgg cacgggagtt gatcctggtt ttcactaggt atcccagaaa agttaaagtc 60
aaatctgaaa cacat 75
<210> 144
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 144
atgtgactgg cacgggagtt gatcctggtt ttcacgatcc cgcggcgtcc ggcccgggtg 60
gtctggatcg cggag 75
<210> 145
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 145
atgtgactgg cacgggagtt gatcctggtt ttcacgcgga ctgcgattgc agaagatgac 60
ctgggagggc tcgcg 75
<210> 146
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 146
atgtgactgg cacgggagtt gatcctggtt ttcacctatc gtccctgctg ggtcgggcct 60
aagcgccggg cccgt 75
<210> 147
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 147
atgtgactgg cacgggagtt gatcctggtt ttcacggccg ggcggccgcg gcccgtgctg 60
cgctcggtga actcg 75
<210> 148
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 148
atgtgactgg cacgggagtt gatcctggtt ttcacgccac cggtgtggct ctttaacaac 60
ctttgcttgt cccga 75
<210> 149
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 149
atgtgactgg cacgggagtt gatcctggtt ttcacaccac aacaacctta tctttttaaa 60
aagtaaaacg tcagt 75
<210> 150
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 150
atgtgactgg cacgggagtt gatcctggtt ttcacagacc ctagtctgcc actgaggatt 60
tggtttttgc ccttc 75
<210> 151
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 151
atgtgactgg cacgggagtt gatcctggtt ttcactcaaa agctgagatg aaacagtgta 60
agtttcaaca gaaat 75
<210> 152
<211> 58
<212> DNA
<213> 人工序列
<220>
<223> ACA2_FLFP 引物
<400> 152
aatgatacgg cgaccaccga gatctacacg tcatgcagga ccagagaatt cgaataca 58
<210> 153
<211> 57
<212> DNA
<213> 人工序列
<220>
<223> CAC3_FLRP 引物
<400> 153
caagcagaag acggcatacg agatgtgact ggcacgggag ttgatcctgg ttttcac 57
<210> 154
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 154
atgtgactgg cacgggagtt gatcctggtt ttcaccgaat gagggtgatg tttttccgcg 60
gcacctcctt caggt 75
<210> 155
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 155
atgtgactgg cacgggagtt gatcctggtt ttcacgttgt agtcggtcat gatggtcgag 60
gtgcggagct tgctc 75
<210> 156
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 156
atgtgactgg cacgggagtt gatcctggtt ttcacgcagc tcctggtgct tccggcggta 60
cactgcaggt gggtg 75
<210> 157
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 157
atgtgactgg cacgggagtt gatcctggtt ttcacctaca caggccactt cctacaggaa 60
gcctccctgg atctc 75
<210> 158
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 158
atgtgactgg cacgggagtt gatcctggtt ttcacgaaat actaataaaa tgattaaaga 60
aggtgtgtct ttaat 75
<210> 159
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 159
atgtgactgg cacgggagtt gatcctggtt ttcactatat ggaaaataat tatttgtatt 60
atatagggca gagtc 75
<210> 160
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 160
atgtgactgg cacgggagtt gatcctggtt ttcacattag acccaatatg gtctgcagat 60
tttattagaa gaaat 75
<210> 161
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 161
atgtgactgg cacgggagtt gatcctggtt ttcacgtgaa ccagcagact gtgttgcaag 60
tataacccca cgtga 75
<210> 162
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 162
atgtgactgg cacgggagtt gatcctggtt ttcacgccat ggagcctaag gaagtttcag 60
caaggcccta agggg 75
<210> 163
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 163
atgtgactgg cacgggagtt gatcctggtt ttcaccccag gaattggcct gccttagtat 60
ttctgctgtg ctcag 75
<210> 164
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 164
atgtgactgg cacgggagtt gatcctggtt ttcactttga gggtgcagct gggatcttgg 60
tcagttgtgt ttcct 75
<210> 165
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 165
atgtgactgg cacgggagtt gatcctggtt ttcaccacat catgaaaaga tctctgaatt 60
ggtgtctggg gatct 75
<210> 166
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 166
atgtgactgg cacgggagtt gatcctggtt ttcactgagg accaggtcac aggacctctt 60
tggactgcag tttcc 75
<210> 167
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 167
atgtgactgg cacgggagtt gatcctggtt ttcactaacc actgccactc cccaccctct 60
agggttgtca atgaa 75
<210> 168
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 168
atgtgactgg cacgggagtt gatcctggtt ttcacgagct ctaccaatgt gagtgaccat 60
tatcactcct acatg 75
<210> 169
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 169
atgtgactgg cacgggagtt gatcctggtt ttcacaaaat tgtgattcag tgggtagatt 60
ctgtgtgtaa agccc 75
<210> 170
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 170
atgtgactgg cacgggagtt gatcctggtt ttcactatgt gctcagttcc ctcctctatg 60
caatggaccg accgt 75
<210> 171
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 171
atgtgactgg cacgggagtt gatcctggtt ttcacgtgta aattgccgag cacgtagtaa 60
ccatgcaaca agtgt 75
<210> 172
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 172
atgtgactgg cacgggagtt gatcctggtt ttcactgggg acacagtgtg tgctgccatc 60
tcccttctac cggca 75
<210> 173
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 173
atgtgactgg cacgggagtt gatcctggtt ttcacaagag cctttccctc tgcccttttc 60
aagcctctgc ccatc 75
<210> 174
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 174
atgtgactgg cacgggagtt gatcctggtt ttcacgacca cactgagttc tctgtgacct 60
gcaggtcagc tcacc 75
<210> 175
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 175
atgtgactgg cacgggagtt gatcctggtt ttcactttcc tatctctctg cctggagggt 60
ggtggagggc tggtt 75
<210> 176
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 176
atgtgactgg cacgggagtt gatcctggtt ttcacaaaca ggagctgcgc cggtggaagc 60
atgtgggagc tagaa 75
<210> 177
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 177
atgtgactgg cacgggagtt gatcctggtt ttcacggaca ctgaaggagc tccccacccc 60
ctgatcagcc aggag 75
<210> 178
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 178
atgtgactgg cacgggagtt gatcctggtt ttcacgggaa ctgcagctgc tctggtgggg 60
ggaaggttgg gagct 75
<210> 179
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 179
atgtgactgg cacgggagtt gatcctggtt ttcacaccca attccaggga ctagcataac 60
gaagtgacac cttgg 75
<210> 180
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 180
atgtgactgg cacgggagtt gatcctggtt ttcaccctgc ccccttggga gtccctgggg 60
ctctgtgcac tcacc 75
<210> 181
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 181
atgtgactgg cacgggagtt gatcctggtt ttcacggaag cacccccggt attaaaacga 60
acggggcgga aagaa 75
<210> 182
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 182
atgtgactgg cacgggagtt gatcctggtt ttcacctaac aaaggggacg cgacccgggg 60
tccagtgccc caggg 75
<210> 183
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 183
atgtgactgg cacgggagtt gatcctggtt ttcaccctgg ggggactggg tggcctcacc 60
cccaacccgg tcatc 75
<210> 184
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 184
atgtgactgg cacgggagtt gatcctggtt ttcaccgcgc tccagcttct cgcgggcgga 60
gaagccgctc cacat 75
<210> 185
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 185
atgtgactgg cacgggagtt gatcctggtt ttcaccccac ccggccgccg agtgcgtgga 60
tcccgccgtg gtctt 75
<210> 186
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 186
atgtgactgg cacgggagtt gatcctggtt ttcacgggca cgggcgctgg ctcgcgcttg 60
ttcacgggaa agggg 75
<210> 187
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 187
atgtgactgg cacgggagtt gatcctggtt ttcacaacat ggatatatat gtgaatttca 60
ttcaaatggt tctca 75
<210> 188
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 188
atgtgactgg cacgggagtt gatcctggtt ttcactaaac caacattctt aatgtcaaca 60
caatgtttgt ttaaa 75
<210> 189
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 189
atgtgactgg cacgggagtt gatcctggtt ttcaccccta cgtggagagt gaggatgcac 60
ccccacagaa gaaga 75
<210> 190
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 190
atgtgactgg cacgggagtt gatcctggtt ttcacatgac actcttgagc ggacgtgggg 60
acgcctcgct cttta 75
<210> 191
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 191
atgtgactgg cacgggagtt gatcctggtt ttcactctca cgctcaggga ccacgtgccg 60
gagttggtaa agaat 75
<210> 192
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 192
atgtgactgg cacgggagtt gatcctggtt ttcaccagtg gcctttttca aaatgaccac 60
cttggcggcc ttctc 75
<210> 193
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 193
atgtgactgg cacgggagtt gatcctggtt ttcacgctag ggggctgggg ttggggtggg 60
ggtggtgggc ctgcc 75
<210> 194
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 194
atgtgactgg cacgggagtt gatcctggtt ttcaccagtt tccataggtc tgaaaatgtt 60
tcctgactca gaggg 75
<210> 195
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 195
atgtgactgg cacgggagtt gatcctggtt ttcacctgcc atggaggagc cgcagtcaga 60
tcctagcgtc gagcc 75
<210> 196
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 196
atgtgactgg cacgggagtt gatcctggtt ttcactcatg ctggatcccc acttttcctc 60
ttgcagcagc cagac 75
<210> 197
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 197
atgtgactgg cacgggagtt gatcctggtt ttcacagccc cccagccctc caggtcccca 60
gccctccagg tcccc 75
<210> 198
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 198
atgtgactgg cacgggagtt gatcctggtt ttcacgcaga gacctgtggg aagcgaaaat 60
tccatgggac tgact 75
<210> 199
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 199
atgtgactgg cacgggagtt gatcctggtt ttcacgcagg gggatacggc caggcattga 60
agtctcatgg aagcc 75
<210> 200
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 200
atgtgactgg cacgggagtt gatcctggtt ttcacccgtg caagtcacag acttggctgt 60
cccagaatgc aagaa 75
<210> 201
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 201
atgtgactgg cacgggagtt gatcctggtt ttcacccaga aaacctacca gggcagctac 60
ggtttccgtc tgggc 75
<210> 202
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 202
atgtgactgg cacgggagtt gatcctggtt ttcacgaagg gacagaagat gacaggggcc 60
aggagggggc tggtg 75
<210> 203
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 203
atgtgactgg cacgggagtt gatcctggtt ttcacgtggc ccctgcacca gcagctccta 60
caccggcggc ccctg 75
<210> 204
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 204
atgtgactgg cacgggagtt gatcctggtt ttcacggggg gagcagcctc tggcattctg 60
ggagcttcat ctgga 75
<210> 205
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 205
atgtgactgg cacgggagtt gatcctggtt ttcacccccg gacgatattg aacaatggtt 60
cactgaagac ccagg 75
<210> 206
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 206
atgtgactgg cacgggagtt gatcctggtt ttcacctggg gggctggggg gctgaggacc 60
tggtcctctg actgc 75
<210> 207
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 207
atgtgactgg cacgggagtt gatcctggtt ttcaccctgg gcaaccagcc ctgtcgtctc 60
tccagcccca gctgc 75
<210> 208
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 208
atgtgactgg cacgggagtt gatcctggtt ttcacccatc gctatctgag cagcgctcat 60
ggtgggggca gcgcc 75
<210> 209
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 209
atgtgactgg cacgggagtt gatcctggtt ttcacgccat ctacaagcag tcacagcaca 60
tgacggaggt tgtga 75
<210> 210
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 210
atgtgactgg cacgggagtt gatcctggtt ttcaccatgg cgcggacgcg ggtgccgggc 60
gggggtgtgg aatca 75
<210> 211
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 211
atgtgactgg cacgggagtt gatcctggtt ttcactttgc caactggcca agacctgccc 60
tgtgcagctg tgggt 75
<210> 212
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 212
atgtgactgg cacgggagtt gatcctggtt ttcactgctt tatctgttca cttgtgccct 60
gactttcaac tctgt 75
<210> 213
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 213
atgtgactgg cacgggagtt gatcctggtt ttcacgaggg ccactgacaa ccacccttaa 60
cccctcctcc cagag 75
<210> 214
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 214
atgtgactgg cacgggagtt gatcctggtt ttcaccctca ggcggctcat agggcaccac 60
cacactatgt cgaaa 75
<210> 215
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 215
atgtgactgg cacgggagtt gatcctggtt ttcacaggaa atttgcgtgt ggagtatttg 60
gatgacagaa acact 75
<210> 216
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 216
atgtgactgg cacgggagtt gatcctggtt ttcacccagg gtccccaggc ctctgattcc 60
tcactgattg ctctt 75
<210> 217
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 217
atgtgactgg cacgggagtt gatcctggtt ttcacgaggc aagcagaggc tggggcacag 60
caggccagtg tgcag 75
<210> 218
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 218
atgtgactgg cacgggagtt gatcctggtt ttcaccctgg agtcttccag tgtgatgatg 60
gtgaggatgg gcctc 75
<210> 219
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 219
atgtgactgg cacgggagtt gatcctggtt ttcacactac atgtgtaaca gttcctgcat 60
gggcggcatg aaccg 75
<210> 220
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 220
atgtgactgg cacgggagtt gatcctggtt ttcaccttgc cacaggtctc cccaaggcgc 60
actggcctca tcttg 75
<210> 221
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 221
atgtgactgg cacgggagtt gatcctggtt ttcacctgca cccttggtct cctccaccgc 60
ttcttgtcct gcttg 75
<210> 222
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 222
atgtgactgg cacgggagtt gatcctggtt ttcaccctcg cttagtgctc cctgggggca 60
gctcgtggtg aggct 75
<210> 223
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 223
atgtgactgg cacgggagtt gatcctggtt ttcacgaccg gcgcacagag gaagagaatc 60
tccgcaagaa agggg 75
<210> 224
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 224
atgtgactgg cacgggagtt gatcctggtt ttcactctcc caggacaggc acaaacacgc 60
acctcaaagc tgttc 75
<210> 225
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 225
atgtgactgg cacgggagtt gatcctggtt ttcactctct tttcctatcc tgagtagtgg 60
taatctactg ggacg 75
<210> 226
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 226
atgtgactgg cacgggagtt gatcctggtt ttcacggaca ggtaggacct gatttcctta 60
ctgcctcttg cttct 75
<210> 227
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 227
atgtgactgg cacgggagtt gatcctggtt ttcacggcat tttgagtgtt agactggaaa 60
ctttccactt gataa 75
<210> 228
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 228
atgtgactgg cacgggagtt gatcctggtt ttcaccctga agggtgaaat attctccatc 60
cagtggtttc ttctt 75
<210> 229
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 229
atgtgactgg cacgggagtt gatcctggtt ttcaccctag cactgcccaa caacaccagc 60
tcctctcccc agcca 75
<210> 230
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 230
atgtgactgg cacgggagtt gatcctggtt ttcactgcct cagattcact tttatcacct 60
ttccttgcct ctttc 75
<210> 231
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 231
atgtgactgg cacgggagtt gatcctggtt ttcacatggc tttccaacct aggaaggcag 60
gggagtaggg ccagg 75
<210> 232
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 232
atgtgactgg cacgggagtt gatcctggtt ttcaccctgg agtgagccct gctcccccct 60
ggctccttcc cagcc 75
<210> 233
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 233
atgtgactgg cacgggagtt gatcctggtt ttcactccga gagctgaatg aggccttgga 60
actcaaggat gccca 75
<210> 234
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 234
atgtgactgg cacgggagtt gatcctggtt ttcaccatct tttaactcag gtactgtgta 60
tatacttact tctcc 75
<210> 235
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 235
atgtgactgg cacgggagtt gatcctggtt ttcacggcag gggagggaga gatgggggtg 60
ggaggctgtc agtgg 75
<210> 236
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 236
atgtgactgg cacgggagtt gatcctggtt ttcacgtcag tctgagtcag gcccttctgt 60
cttgaacatg agttt 75
<210> 237
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 237
atgtgactgg cacgggagtt gatcctggtt ttcaccctga agtccaaaaa gggtcagtct 60
acctcccgcc ataaa 75
<210> 238
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 238
atgtgactgg cacgggagtt gatcctggtt ttcacggcac agaccctctc actcatgtga 60
tgtcatctct cctcc 75
<210> 239
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 239
atgtgactgg cacgggagtt gatcctggtt ttcaccaggg gcttatgtgt ctccttgatg 60
acctgcggcg acgtc 75
<210> 240
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 240
atgtgactgg cacgggagtt gatcctggtt ttcacccatc atctcctccc ttccccttct 60
gcccaggctg ttgca 75
<210> 241
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 241
atgtgactgg cacgggagtt gatcctggtt ttcacaattc tggcttctcc ctgctcacac 60
tttcttccat tgcat 75
<210> 242
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 242
atgtgactgg cacgggagtt gatcctggtt ttcacgtcag ctcgtgttgg caacatacca 60
tcttcaacct ctgca 75
<210> 243
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 243
atgtgactgg cacgggagtt gatcctggtt ttcactaatt tcttggcccc tcttcggtaa 60
ccctgagcca aatgt 75
<210> 244
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 244
atgtgactgg cacgggagtt gatcctggtt ttcacggtga aataaaggaa gatactagtt 60
ttgctgaaaa tgaca 75
<210> 245
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 245
atgtgactgg cacgggagtt gatcctggtt ttcacactca tttgtatctg aagtggaacc 60
aaatgatact gatcc 75
<210> 246
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 246
atgtgactgg cacgggagtt gatcctggtt ttcacagttg agaccattca caggccaaag 60
acggtacaac ttcct 75
<210> 247
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 247
atgtgactgg cacgggagtt gatcctggtt ttcacgaaaa tgaatgctct gagctttgga 60
agctctcagg gtaca 75
<210> 248
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 248
atgtgactgg cacgggagtt gatcctggtt ttcacgggcc atcgcgatgt cgcacggtac 60
ctgcgcgcgg ctgcg 75
<210> 249
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 249
atgtgactgg cacgggagtt gatcctggtt ttcaccccca tccagcttca aaagctcttc 60
gaatcattga tgtgc 75
<210> 250
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 250
atgtgactgg cacgggagtt gatcctggtt ttcactgcca agcctgaact acccctcttt 60
tacactccta ttgat 75
<210> 251
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 251
atgtgactgg cacgggagtt gatcctggtt ttcacccacc ctgactgtgc tctgtccccc 60
cagggctgga catcc 75
<210> 252
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 252
atgtgactgg cacgggagtt gatcctggtt ttcacagtca ggagtgggat gatcttataa 60
aactcgtaga aagag 75
<210> 253
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 253
atgtgactgg cacgggagtt gatcctggtt ttcaccttcg gggagacaac gacggcggtg 60
gcgggagctt ctcca 75
<210> 254
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 254
atgtgactgg cacgggagtt gatcctggtt ttcaccatac agtcctggat gatgatgttt 60
ttgatgaagg tctcg 75
<210> 255
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 255
atgtgactgg cacgggagtt gatcctggtt ttcactttta ctgttcttcc tcagacattc 60
aaacgtgttt tgatc 75
<210> 256
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 256
atgtgactgg cacgggagtt gatcctggtt ttcacgtgga agcatactgc aaaatatttg 60
ttttcagtct ctgca 75
<210> 257
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 257
atgtgactgg cacgggagtt gatcctggtt ttcacacgta cccctctcag cccctcctct 60
tggactccag ccatg 75
<210> 258
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 258
atgtgactgg cacgggagtt gatcctggtt ttcacgtggc gtaagcgcgg cacgcggcgc 60
agtggtcccc gtcct 75
<210> 259
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 衔接子
<220>
<221> misc_feature
<222> (1)..(5)
<223> n 是 a, c, g或t
<400> 259
nnnnnaagat cttagtggca c 21
<210> 260
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 衔接子
<220>
<221> misc_feature
<222> (1)..(5)
<223> n 是 a, c, g或t
<400> 260
nnnnncgaca gaactattgc c 21
<210> 261
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 衔接子
<220>
<221> misc_feature
<223> n 是 a, c, g或t
<220>
<221> misc_feature
<222> (1)..(5)
<223> n 是 a, c, g或t
<400> 261
nnnnnactat cttagtggca c 21
<210> 262
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 衔接子
<220>
<221> misc_feature
<222> (1)..(5)
<223> n 是 a, c, g或t
<400> 262
nnnnnctcca gaactattgc c 21
<210> 263
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 衔接子
<220>
<221> misc_feature
<222> (1)..(5)
<223> n 是 a, c, g或t
<400> 263
nnnnnagcat cttagtggca c 21
<210> 264
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 衔接子
<220>
<221> misc_feature
<222> (1)..(5)
<223> n 是 a, c, g或t
<400> 264
nnnnncatca gaactattgc c 21
<210> 265
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 衔接子
<220>
<221> misc_feature
<222> (1)..(5)
<223> n 是 a, c, g或t
<400> 265
nnnnnataat cttagtggca c 21
<210> 266
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 衔接子
<220>
<221> misc_feature
<222> (1)..(5)
<223> n 是 a, c, g或t
<400> 266
nnnnnaagaa ggtagaccct c 21
<210> 267
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 衔接子
<220>
<221> misc_feature
<222> (1)..(5)
<223> n 是 a, c, g或t
<400> 267
nnnnntttct ctactcgtga c 21
<210> 268
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 衔接子
<220>
<221> misc_feature
<222> (1)..(5)
<223> n 是 a, c, g或t
<400> 268
nnnnnactaa ggtagaccct c 21
<210> 269
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 衔接子
<220>
<221> misc_feature
<222> (1)..(5)
<223> n 是 a, c, g或t
<400> 269
nnnnngaagc tacgagtatc c 21
<210> 270
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 衔接子
<220>
<221> misc_feature
<222> (1)..(5)
<223> n 是 a, c, g或t
<400> 270
nnnnnagcaa ggtagaccct c 21
<210> 271
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 衔接子
<220>
<221> misc_feature
<222> (1)..(5)
<223> n 是 a, c, g或t
<400> 271
nnnnncattg acgtctagag c 21
<210> 272
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 衔接子
<220>
<221> misc_feature
<222> (1)..(5)
<223> n 是 a, c, g或t
<400> 272
nnnnntcact ctactcgtga c 21
<210> 273
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 衔接子
<220>
<221> misc_feature
<222> (1)..(5)
<223> n 是 a, c, g或t
<400> 273
nnnnnataaa ggtagaccct c 21
<210> 274
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 衔接子
<220>
<221> misc_feature
<222> (1)..(5)
<223> n 是 a, c, g或t
<400> 274
nnnnntacct ctactcgtga c 21
<210> 275
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 衔接子
<220>
<221> misc_feature
<222> (1)..(5)
<223> n 是 a, c, g或t
<400> 275
nnnnnttttg tgtgtgtgtg 20
<210> 276
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 衔接子
<220>
<221> misc_feature
<222> (1)..(5)
<223> n 是 a, c, g或t
<400> 276
nnnnnactac acacacacac 20
<210> 277
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 衔接子
<220>
<221> misc_feature
<222> (1)..(5)
<223> n 是 a, c, g或t
<400> 277
nnnnnctcgt gtgtgtgtgt 20
<210> 278
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 衔接子
<220>
<221> misc_feature
<222> (1)..(5)
<223> n 是 a, c, g或t
<400> 278
nnnnngaaca cacacacaca 20
<210> 279
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 衔接子
<220>
<221> misc_feature
<222> (1)..(5)
<223> n 是 a, c, g或t
<400> 279
nnnnncatgt gtgtgtgtgt 20
<210> 280
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 衔接子
<220>
<221> misc_feature
<222> (1)..(5)
<223> n 是 a, c, g或t
<400> 280
nnnnngtgca cacacacaca 20
<210> 281
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 衔接子
<220>
<221> misc_feature
<222> (1)..(5)
<223> n 是 a, c, g或t
<400> 281
nnnnnataac acacacacac 20
<210> 282
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 衔接子
<220>
<221> misc_feature
<222> (1)..(5)
<223> n 是 a, c, g或t
<400> 282
nnnnntactg tgtgtgtgtg 20
<210> 283
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 283
tgcaggacca gagaattcga ataca 25
<210> 284
<211> 58
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 284
aatgatacgg cgaccaccga gatctacacg tcatgcagga ccagagaatt cgaataca 58
<210> 285
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 285
cggtggctca cgcctgta 18
<210> 286
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 286
gcctcggcct cccaaagt 18
<210> 287
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 287
gaggctgagg caggagaatc g 21
<210> 288
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 288
gtcgcccagg ctggagtg 18
<210> 289
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 元件1
<400> 289
tgcaggacca gagaattcga ataca 25
<210> 290
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 290
cgggt 5
<210> 291
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 291
cggtg 5
<210> 292
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 292
cgtgg 5
<210> 293
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 293
gcggt 5
<210> 294
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 294
gcgtg 5
<210> 295
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 295
gctgg 5
<210> 296
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 296
ggcgt 5
<210> 297
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 297
ggctg 5
<210> 298
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 298
gggct 5
<210> 299
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 299
ttaaa 5
<210> 300
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 300
ttacc 5
<210> 301
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 301
ttatt 5
<210> 302
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 302
ttcac 5
<210> 303
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 303
ttcca 5
<210> 304
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 304
tttat 5
<210> 305
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 305
tttta 5
<210> 306
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 306
gcacg 5
<210> 307
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 307
gcagc 5
<210> 308
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 308
gccag 5
<210> 309
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 309
gccga 5
<210> 310
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 310
gcgac 5
<210> 311
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 311
gcgca 5
<210> 312
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 312
ggaaa 5
<210> 313
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 313
ggacc 5
<210> 314
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 314
ggatt 5
<210> 315
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 315
ggcac 5
<210> 316
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 316
ggcca 5
<210> 317
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 317
ggtat 5
<210> 318
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 318
ggtta 5
<210> 319
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 319
gtagt 5
<210> 320
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 320
gtatg 5
<210> 321
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 321
gtgat 5
<210> 322
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 322
ccgtc 5
<210> 323
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 323
cctcg 5
<210> 324
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 324
cctgc 5
<210> 325
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 325
cgaat 5
<210> 326
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 326
cgata 5
<210> 327
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 327
cgcct 5
<210> 328
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 328
cgctc 5
<210> 329
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 329
cgtaa 5
<210> 330
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 330
cgtcc 5
<210> 331
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 331
cgttt 5
<210> 332
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 332
ctaag 5
<210> 333
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 333
ctaga 5
<210> 334
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 334
ctccg 5
<210> 335
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 335
ctcgc 5
<210> 336
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 336
ctgaa 5
<210> 337
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 337
ctgcc 5
<210> 338
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 338
ttgtc 5
<210> 339
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 339
tttcg 5
<210> 340
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 340
tttgc 5
<210> 341
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 341
aaaaa 5
<210> 342
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 342
aaacc 5
<210> 343
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 343
aaatt 5
<210> 344
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 344
aacac 5
<210> 345
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 345
aacca 5
<210> 346
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 346
aatat 5
<210> 347
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 347
aatta 5
<210> 348
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 348
acaac 5
<210> 349
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 349
acaca 5
<210> 350
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 350
accaa 5
<210> 351
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 351
acccc 5
<210> 352
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 352
acctt 5
<210> 353
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 353
actct 5
<210> 354
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 354
gggtc 5
<210> 355
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 355
ggtcg 5
<210> 356
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 356
ggtgc 5
<210> 357
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 357
gtcgg 5
<210> 358
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 358
gtgcg 5
<210> 359
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 359
gtggc 5
<210> 360
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 360
tgcgg 5
<210> 361
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 361
tggcg 5
<210> 362
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 362
tgggc 5
<210> 363
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 363
aaagg 5
<210> 364
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 364
aagag 5
<210> 365
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 365
aagga 5
<210> 366
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 366
accgg 5
<210> 367
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 367
acgcg 5
<210> 368
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 368
acggc 5
<210> 369
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 369
agaag 5
<210> 370
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 370
gtgta 5
<210> 371
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 371
gttag 5
<210> 372
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 372
gttga 5
<210> 373
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 373
taggt 5
<210> 374
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 374
tagtg 5
<210> 375
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 375
tatgg 5
<210> 376
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 376
tgagt 5
<210> 377
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 377
tgatg 5
<210> 378
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 378
tggat 5
<210> 379
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 379
tggta 5
<210> 380
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 380
tgtag 5
<210> 381
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 381
tgtga 5
<210> 382
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 382
ttagg 5
<210> 383
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 383
ttgag 5
<210> 384
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 384
ttgga 5
<210> 385
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 385
aacgt 5
<210> 386
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 386
ctgtt 5
<210> 387
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 387
cttgt 5
<210> 388
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 388
ctttg 5
<210> 389
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 389
gaact 5
<210> 390
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 390
gaatc 5
<210> 391
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 391
gacat 5
<210> 392
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 392
gacta 5
<210> 393
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 393
gatac 5
<210> 394
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 394
gatca 5
<210> 395
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 395
gcaat 5
<210> 396
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 396
gcata 5
<210> 397
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 397
gccct 5
<210> 398
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 398
gcctc 5
<210> 399
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 399
gctaa 5
<210> 400
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 400
gctcc 5
<210> 401
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 401
gcttt 5
<210> 402
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 402
acttc 5
<210> 403
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 403
ataat 5
<210> 404
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 404
atata 5
<210> 405
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 405
atcct 5
<210> 406
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 406
atctc 5
<210> 407
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 407
attaa 5
<210> 408
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 408
attcc 5
<210> 409
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 409
atttt 5
<210> 410
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 410
caaac 5
<210> 411
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 411
caaca 5
<210> 412
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 412
cacaa 5
<210> 413
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 413
caccc 5
<210> 414
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 414
cactt 5
<210> 415
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 415
catct 5
<210> 416
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 416
cattc 5
<210> 417
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 417
ccaaa 5
<210> 418
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 418
agaga 5
<210> 419
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 419
agccg 5
<210> 420
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 420
agcgc 5
<210> 421
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 421
aggaa 5
<210> 422
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 422
aggcc 5
<210> 423
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 423
aggtt 5
<210> 424
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 424
agtgt 5
<210> 425
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 425
agttg 5
<210> 426
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 426
atggt 5
<210> 427
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 427
atgtg 5
<210> 428
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 428
attgg 5
<210> 429
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 429
cacgg 5
<210> 430
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 430
cagcg 5
<210> 431
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 431
caggc 5
<210> 432
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 432
ccagg 5
<210> 433
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 433
ccgag 5
<210> 434
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 434
aactg 5
<210> 435
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 435
aagct 5
<210> 436
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 436
aagtc 5
<210> 437
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 437
aatcg 5
<210> 438
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 438
aatgc 5
<210> 439
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 439
acagt 5
<210> 440
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 440
acatg 5
<210> 441
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 441
acgat 5
<210> 442
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 442
acgta 5
<210> 443
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 443
actag 5
<210> 444
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 444
actga 5
<210> 445
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 445
agact 5
<210> 446
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 446
agatc 5
<210> 447
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 447
agcat 5
<210> 448
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 448
agcta 5
<210> 449
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 449
agtac 5
<210> 450
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 450
gtaac 5
<210> 451
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 451
gtaca 5
<210> 452
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 452
gtcaa 5
<210> 453
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 453
gtccc 5
<210> 454
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 454
gtctt 5
<210> 455
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 455
gttct 5
<210> 456
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 456
gtttc 5
<210> 457
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 457
taacg 5
<210> 458
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 458
taagc 5
<210> 459
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 459
tacag 5
<210> 460
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 460
tacga 5
<210> 461
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 461
tagac 5
<210> 462
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 462
tagca 5
<210> 463
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 463
tcaag 5
<210> 464
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 464
tcaga 5
<210> 465
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 465
tcccg 5
<210> 466
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 466
ccacc 5
<210> 467
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 467
ccatt 5
<210> 468
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 468
cccac 5
<210> 469
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 469
cccca 5
<210> 470
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 470
cctat 5
<210> 471
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 471
cctta 5
<210> 472
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 472
ctact 5
<210> 473
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 473
ctatc 5
<210> 474
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 474
ctcat 5
<210> 475
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 475
ctcta 5
<210> 476
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 476
cttac 5
<210> 477
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 477
cttca 5
<210> 478
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 478
taaat 5
<210> 479
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 479
taata 5
<210> 480
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 480
tacct 5
<210> 481
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 481
tactc 5
<210> 482
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 482
ccgga 5
<210> 483
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 483
cgacg 5
<210> 484
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 484
cgagc 5
<210> 485
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 485
cgcag 5
<210> 486
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 486
cgcga 5
<210> 487
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 487
cggac 5
<210> 488
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 488
cggca 5
<210> 489
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 489
gaaag 5
<210> 490
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 490
gaaga 5
<210> 491
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 491
gaccg 5
<210> 492
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 492
gacgc 5
<210> 493
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 493
gagaa 5
<210> 494
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 494
gagcc 5
<210> 495
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 495
gagtt 5
<210> 496
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 496
gatgt 5
<210> 497
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 497
gattg 5
<210> 498
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 498
agtca 5
<210> 499
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 499
atacg 5
<210> 500
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 500
atagc 5
<210> 501
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 501
atcag 5
<210> 502
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 502
atcga 5
<210> 503
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 503
atgac 5
<210> 504
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 504
atgca 5
<210> 505
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 505
caagt 5
<210> 506
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 506
caatg 5
<210> 507
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 507
cagat 5
<210> 508
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 508
cagta 5
<210> 509
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 509
catag 5
<210> 510
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 510
catga 5
<210> 511
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 511
cccgt 5
<210> 512
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 512
ccctg 5
<210> 513
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 513
ccgct 5
<210> 514
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 514
tccgc 5
<210> 515
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 515
tcgaa 5
<210> 516
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 516
tcgcc 5
<210> 517
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 517
tcgtt 5
<210> 518
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 518
tctgt 5
<210> 519
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 519
tcttg 5
<210> 520
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 520
tgaac 5
<210> 521
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 521
tgaca 5
<210> 522
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 522
tgcaa 5
<210> 523
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 523
tgccc 5
<210> 524
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 524
tgctt 5
<210> 525
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 525
tgtct 5
<210> 526
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 526
tgttc 5
<210> 527
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 527
ttcgt 5
<210> 528
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 528
ttctg 5
<210> 529
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 529
ttgct 5
<210> 530
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 530
tataa 5
<210> 531
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 531
tatcc 5
<210> 532
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 532
tattt 5
<210> 533
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 533
tcact 5
<210> 534
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 534
tcatc 5
<210> 535
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 535
tccat 5
<210> 536
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 536
tccta 5
<210> 537
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 537
tctac 5
<210> 538
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 元件2
<400> 538
tctca 5
<210> 539
<211> 3
<212> DNA
<213> 人工序列
<220>
<223> 元件3
<400> 539
aag 3
<210> 540
<211> 3
<212> DNA
<213> 人工序列
<220>
<223> 元件3
<400> 540
ctc 3
<210> 541
<211> 3
<212> DNA
<213> 人工序列
<220>
<223> 元件3
<400> 541
ggt 3
<210> 542
<211> 3
<212> DNA
<213> 人工序列
<220>
<223> 元件3
<400> 542
tca 3
<210> 543
<211> 3
<212> DNA
<213> 人工序列
<220>
<223> 元件3
<400> 543
act 3
<210> 544
<211> 3
<212> DNA
<213> 人工序列
<220>
<223> 元件3
<400> 544
cga 3
<210> 545
<211> 3
<212> DNA
<213> 人工序列
<220>
<223> 元件3
<400> 545
gtg 3
<210> 546
<211> 3
<212> DNA
<213> 人工序列
<220>
<223> 元件3
<400> 546
tac 3
<210> 547
<211> 3
<212> DNA
<213> 人工序列
<220>
<223> 元件3
<400> 547
agc 3
<210> 548
<211> 3
<212> DNA
<213> 人工序列
<220>
<223> 元件3
<400> 548
ccg 3
<210> 549
<211> 3
<212> DNA
<213> 人工序列
<220>
<223> 元件3
<400> 549
gaa 3
<210> 550
<211> 3
<212> DNA
<213> 人工序列
<220>
<223> 元件3
<400> 550
ttt 3
<210> 551
<211> 3
<212> DNA
<213> 人工序列
<220>
<223> 元件3
<400> 551
ata 3
<210> 552
<211> 3
<212> DNA
<213> 人工序列
<220>
<223> 元件3
<400> 552
cat 3
<210> 553
<211> 3
<212> DNA
<213> 人工序列
<220>
<223> 元件3
<400> 553
gcc 3
<210> 554
<211> 3
<212> DNA
<213> 人工序列
<220>
<223> 元件3
<400> 554
tgg 3
<210> 555
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 元件4
<400> 555
acccacacca aa 12
<210> 556
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 元件4
<400> 556
caaacacaac cc 12
<210> 557
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 元件4
<400> 557
gtgtgggttg tt 12
<210> 558
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 元件4
<400> 558
tgtgtttggt gg 12
<210> 559
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 元件4
<400> 559
tttggtgtgg gt 12
<210> 560
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 元件4
<400> 560
gggttgtgtt tg 12
<210> 561
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 元件4
<400> 561
aacaacccac ac 12
<210> 562
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 元件4
<400> 562
ccaccaaaca ca 12

Claims (9)

1.用于捕获并扩增靶遗传基因座的方法,其包括:
(a)将一种或多种捕获探针模块与标记的cfDNA文库中的靶遗传基因座杂交,以形成一种或多种捕获探针模块-cfDNA克隆复合物;
其中所述一种或多种捕获探针模块与特定DNA靶区域杂交,
其中所述一种或多种捕获探针模块各自包含捕获探针序列和尾部序列,其中所述尾部序列包含引物结合位点,
其中每条捕获探针序列短于45个核苷酸且长于25个核苷酸,和
其中所述标记的cfDNA文库包含在每个末端连接至衔接子模块的cfDNA,所述衔接子模块包含引物结合位点;
(b)分离来自(a)的一种或多种分离的捕获探针模块-cfDNA复合物;
(c)用酶处理来自(b)的一种或多种分离的捕获探针模块-cfDNA复合物,其中所述酶处理包括使用所述复合物中的cfDNA作为模板进行所述捕获探针的5'-3'DNA聚合酶延伸;和
(d)对来自(c)的酶处理复合物进行PCR以产生扩增的杂交核酸分子,其中所述扩增的杂交核酸分子包含所述尾部序列的互补序列和能够与所述捕获探针杂交的靶遗传基因座中的靶序列。
2.如权利要求1所述的方法,其中所述衔接子模块还包含:
(a)一个或多个独特读取编码;
(b)用于DNA测序的一个或多个序列;以及
(c)用于样本多重分析的一个或多个样本编码。
3.如权利要求1所述的方法,其中将多种捕获探针模块与所述标记的cfDNA文库中的靶遗传基因座杂交。
4.如权利要求1所述的方法,其中所述方法是在多个靶遗传基因座上进行的。
5.如权利要求1-4中任一项所述的方法,其中所述捕获探针为40个核苷酸。
6.如权利要求1所述的方法,还包括测定cfDNA文库中基因组当量的数量。
7.如权利要求1-4和6中任一项所述的方法,其中所述cfDNA分离自对象的生物样本,所述生物样本选自:羊水、血液、血浆、血清、***、淋巴液、脑脊髓液、眼内液、尿、唾液、粪便、粘液和汗液。
8.如权利要求1-4和6中任一项所述的方法,其中至少一种捕获探针模块与靶区域的下游杂交,并且至少一种捕获探针模块与靶区域的上游杂交。
9.如权利要求1-4和6中任一项所述的方法,其中多种捕获探针与靶遗传基因座杂交,其中所述多种捕获探针中的每一种在任何其它捕获探针的200bp内杂交。
CN201480081729.4A 2014-08-22 2014-08-22 用于无细胞dna的定量遗传分析的方法 Active CN107002118B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210630244.2A CN115029342A (zh) 2014-08-22 2014-08-22 用于无细胞dna的定量遗传分析的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US2014/052317 WO2016028316A1 (en) 2014-08-22 2014-08-22 Methods for quantitative genetic analysis of cell free dna

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202210630244.2A Division CN115029342A (zh) 2014-08-22 2014-08-22 用于无细胞dna的定量遗传分析的方法

Publications (2)

Publication Number Publication Date
CN107002118A CN107002118A (zh) 2017-08-01
CN107002118B true CN107002118B (zh) 2022-07-08

Family

ID=51494529

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202210630244.2A Pending CN115029342A (zh) 2014-08-22 2014-08-22 用于无细胞dna的定量遗传分析的方法
CN201480081729.4A Active CN107002118B (zh) 2014-08-22 2014-08-22 用于无细胞dna的定量遗传分析的方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202210630244.2A Pending CN115029342A (zh) 2014-08-22 2014-08-22 用于无细胞dna的定量遗传分析的方法

Country Status (6)

Country Link
EP (1) EP3194612B1 (zh)
JP (1) JP6709778B2 (zh)
CN (2) CN115029342A (zh)
CA (1) CA2957657A1 (zh)
SG (1) SG11201701113WA (zh)
WO (1) WO2016028316A1 (zh)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11939634B2 (en) 2010-05-18 2024-03-26 Natera, Inc. Methods for simultaneous amplification of target loci
CA2824387C (en) 2011-02-09 2019-09-24 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US9892230B2 (en) 2012-03-08 2018-02-13 The Chinese University Of Hong Kong Size-based analysis of fetal or tumor DNA fraction in plasma
CA2892646A1 (en) 2012-12-10 2014-06-19 Resolution Bioscience, Inc. Methods for targeted genomic analysis
TW202409295A (zh) 2014-07-18 2024-03-01 香港中文大學 Dna混合物中之組織甲基化模式分析
JP7441584B6 (ja) * 2014-08-22 2024-03-15 レゾリューション バイオサイエンス, インコーポレイテッド 無細胞DNA(cfDNA)の定量的遺伝子解析のための方法
US10364467B2 (en) 2015-01-13 2019-07-30 The Chinese University Of Hong Kong Using size and number aberrations in plasma DNA for detecting cancer
EP3294906B1 (en) 2015-05-11 2024-07-10 Natera, Inc. Methods for determining ploidy
KR20180113973A (ko) 2015-11-11 2018-10-17 레졸루션 바이오사이언스, 인크. Dna 라이브러리의 고효율 작제
US11479878B2 (en) 2016-03-16 2022-10-25 Dana-Farber Cancer Institute, Inc. Methods for genome characterization
WO2017190067A1 (en) * 2016-04-28 2017-11-02 Impact Genomics, Inc. Methods of assessing and monitoring tumor load
CA3022545A1 (en) * 2016-04-29 2017-11-02 The Medical College Of Wisconsin, Inc. Multiplexed optimized mismatch amplification (moma)-real time pcr for assessing cancer
CN106047998B (zh) * 2016-05-27 2019-11-12 深圳市海普洛斯生物科技有限公司 一种肺癌基因的检测方法及应用
US11832801B2 (en) * 2016-07-11 2023-12-05 Arizona Board Of Regents On Behalf Of Arizona State University Sweat as a biofluid for analysis and disease identification
MX2019002093A (es) * 2016-08-25 2019-06-20 Resolution Bioscience Inc Métodos para la detección de cambios de copia genómica en muestras de adn.
CA3043476A1 (en) * 2016-11-17 2018-05-24 Seracare Life Sciences, Inc. Methods for preparing dna reference materials and controls
CA3039685A1 (en) 2016-11-30 2018-06-07 The Chinese University Of Hong Kong Analysis of cell-free dna in urine and other samples
JP2020524519A (ja) 2017-06-20 2020-08-20 ザ メディカル カレッジ オブ ウィスコンシン,インコーポレイテッドThe Medical College of Wisconsin, Inc. 全セルフリーdnaによる移植合併症リスクの評価
EP3752643B1 (en) * 2018-02-12 2024-01-17 F. Hoffmann-La Roche AG Method of predicting response to therapy by assessing tumor genetic heterogeneity
WO2019173552A1 (en) * 2018-03-08 2019-09-12 St. John's University Circulating serum cell-free dna biomarkers and methods
JP2021520816A (ja) 2018-04-14 2021-08-26 ナテラ, インコーポレイテッド 循環腫瘍dnaの個別化された検出を用いる癌検出およびモニタリングの方法
CN108517567B (zh) * 2018-04-20 2020-08-11 江苏康为世纪生物科技有限公司 用于cfDNA建库的接头、引物组、试剂盒和建库方法
CN108676891B (zh) * 2018-07-12 2022-02-01 吉林大学 一种直肠腺癌易感性预测试剂盒及***
US11926821B2 (en) * 2018-10-22 2024-03-12 The Chinese University Of Hong Kong Cell-free DNA quality
US20220064708A1 (en) * 2019-01-15 2022-03-03 General Incorporated Association, Bio Education Laboratory Method for preparing liquid biopsy using pva sponge
US11931674B2 (en) 2019-04-04 2024-03-19 Natera, Inc. Materials and methods for processing blood samples
CN112301103B (zh) * 2019-08-02 2023-04-11 北京贝瑞和康生物技术有限公司 一种非特异性扩增天然短片段核酸的方法和试剂盒
CN110819622A (zh) * 2019-10-09 2020-02-21 广州达正生物科技有限公司 一种快速提取石蜡组织rna的方法
CN111254194B (zh) * 2020-01-13 2021-09-07 东南大学 基于cfDNA的测序及数据分析的癌症相关生物标记及其在cfDNA样品分类中的应用
US11211147B2 (en) 2020-02-18 2021-12-28 Tempus Labs, Inc. Estimation of circulating tumor fraction using off-target reads of targeted-panel sequencing
US11475981B2 (en) 2020-02-18 2022-10-18 Tempus Labs, Inc. Methods and systems for dynamic variant thresholding in a liquid biopsy assay
US11211144B2 (en) 2020-02-18 2021-12-28 Tempus Labs, Inc. Methods and systems for refining copy number variation in a liquid biopsy assay
US20230323455A1 (en) * 2020-07-24 2023-10-12 Cornell University Methods for assessing the severity and progression of sars-cov2 infections using cell-free dna
WO2023039539A1 (en) * 2021-09-10 2023-03-16 Foundation Medicine, Inc. Gene fusions in sarcoma

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012028746A1 (en) * 2010-09-03 2012-03-08 Centre National De La Recherche Scientifique (Cnrs) Analytical methods for cell free nucleic acids and applications
WO2014052487A1 (en) * 2012-09-28 2014-04-03 Cepheid Two-primer pcr for microrna multiplex assay
WO2014071295A1 (en) * 2012-11-02 2014-05-08 Enzymatics Inc. Methods and kits for nucleic acid sample preparation for sequencing
WO2014093330A1 (en) * 2012-12-10 2014-06-19 Clearfork Bioscience, Inc. Methods for targeted genomic analysis
WO2014122288A1 (en) * 2013-02-08 2014-08-14 Qiagen Gmbh Method for separating dna by size

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9023769B2 (en) * 2009-11-30 2015-05-05 Complete Genomics, Inc. cDNA library for nucleic acid sequencing
US20130288915A1 (en) * 2012-04-27 2013-10-31 Htg Molecular Diagnostics, Inc. Compositions and methods for alk molecular testing

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012028746A1 (en) * 2010-09-03 2012-03-08 Centre National De La Recherche Scientifique (Cnrs) Analytical methods for cell free nucleic acids and applications
WO2014052487A1 (en) * 2012-09-28 2014-04-03 Cepheid Two-primer pcr for microrna multiplex assay
WO2014071295A1 (en) * 2012-11-02 2014-05-08 Enzymatics Inc. Methods and kits for nucleic acid sample preparation for sequencing
WO2014093330A1 (en) * 2012-12-10 2014-06-19 Clearfork Bioscience, Inc. Methods for targeted genomic analysis
WO2014122288A1 (en) * 2013-02-08 2014-08-14 Qiagen Gmbh Method for separating dna by size

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Linear amplification for deep sequencing;Hoeijmakers Wieteke A M ET AL;《Nature Protocols》;20110731;第6卷(第7期);第1026-1036页 *
Non-solid oncogenes in solid tumors: EML4-ALK fusion genes in lung cancer;Mano Hiroyuki;《Cancer Science》;20081231;第99卷(第12期);第2349-2355页 *
Preparation of Fragment Libraries for Next-Generation Sequencing on the Applied Biosystems SOLiD Platform;Yegnasubramanian Srinivasan;《LABORATORY METHODS IN ENZYMOLOGY: DNA》;20131231;第529卷;第185-200页 *
Sequence and structural variation in a human genome uncovered by short-read, massively parallel ligation sequencing using two-base encoding;McKernan Kevin Judd ET AL;《Genome Research》;20090930;第19卷(第9期);第1527-1541页 *

Also Published As

Publication number Publication date
JP2017525371A (ja) 2017-09-07
CA2957657A1 (en) 2016-02-25
EP3194612B1 (en) 2024-07-03
CN115029342A (zh) 2022-09-09
WO2016028316A1 (en) 2016-02-25
CN107002118A (zh) 2017-08-01
SG11201701113WA (en) 2017-03-30
JP6709778B2 (ja) 2020-06-17
EP3194612A1 (en) 2017-07-26

Similar Documents

Publication Publication Date Title
CN107002118B (zh) 用于无细胞dna的定量遗传分析的方法
US20180179578A1 (en) Methods for quantitative genetic analysis of cell free dna
US20220267763A1 (en) High efficiency construction of dna libraries
US20220325353A1 (en) Methods for the detection of genomic copy changes in dna samples
AU2014248511B2 (en) Systems and methods for prenatal genetic analysis
EP2880182B1 (en) Recombinase mediated targeted dna enrichment for next generation sequencing
JP5986572B2 (ja) 固定化プライマーを使用した標的dnaの直接的な捕捉、増幅、および配列決定
US20120003657A1 (en) Targeted sequencing library preparation by genomic dna circularization
KR102398479B1 (ko) 카피수 보존 rna 분석 방법
US20240026440A1 (en) Methods of labelling nucleic acids
AU2022202281A1 (en) Preparation Of Nucleic Acid Libraries From RNA And DNA
US20220267848A1 (en) Detection and quantification of rare variants with low-depth sequencing via selective allele enrichment or depletion
EP3827011B1 (en) Methods and composition for targeted genomic analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant