CN108374042A - 离子激流基因组测序 - Google Patents

离子激流基因组测序 Download PDF

Info

Publication number
CN108374042A
CN108374042A CN201810225084.7A CN201810225084A CN108374042A CN 108374042 A CN108374042 A CN 108374042A CN 201810225084 A CN201810225084 A CN 201810225084A CN 108374042 A CN108374042 A CN 108374042A
Authority
CN
China
Prior art keywords
primer
sequence
target
nucleic acid
artificial sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810225084.7A
Other languages
English (en)
Inventor
L.T.道姆
G.W.费希尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Longhorn Vaccines and Diagnostics LLC
Original Assignee
Longhorn Vaccines and Diagnostics LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Longhorn Vaccines and Diagnostics LLC filed Critical Longhorn Vaccines and Diagnostics LLC
Publication of CN108374042A publication Critical patent/CN108374042A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • C12Q1/701Specific hybridization probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Virology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及离子激流基因组测序。公开了用于通过半导体测序,优选离子激流测序快速且成本节约地分析微生物序列的增强方法。这种方法提供了多个基因组的全长分析和多个区域(例如基因)分析。这些方法鉴定负责对抗生素或其它化学化合物赋予抗性或敏感性的特定基因的遗传突变。将特定生物体的多种不同种、株系和/或血清型连同生物体的完整基因组快速且有效筛选并鉴定突变。通过选择产生具有跨越整个基因组的序列的扩增子的相似大小和GC含量的引物对,通过离子激流方法分析的单一PCR反应可以测定完整基因组的序列。方法可用于测序病毒因子(诸如流感病毒)和细菌因子(诸如结核病细菌)的基因组。

Description

离子激流基因组测序
本申请是申请日为2013年5月9日的中国专利申请201380024174.5“离子激流基因组测序”的分案申请。
相关申请的引用
本申请要求2012年12月14日提交的题为“Ion Torrent Genomic Sequencing”的美国临时申请号61/737,250、2012年8月31日提交的题为“Ion Torrent Genomic Sequencing”的美国临时申请号61/695,960、2012年5月11日提交的题为“Drug Susceptibility Determination by Ion Torrent Sequencing”的美国临时申请号61/646,060和2012年5月9日提交的“Drug Susceptibility Determination by Ion Torrent Sequencing”的美国临时申请号61/644,876的优先权,并且其中每个申请的完整内容通过引用具体并入。
序列表
本申请含有已经经由EFS-Web以ASCII格式提交且在此以其整体通过引用并入的序列表。所述ASCII拷贝,在2013年5月7日生成,名为3022.018.PCT_SL.txt,大小为37,927字节。
技术领域
本发明涉及用于通过半导体测序鉴定遗传突变和数兆碱基的核酸信息的工具、组合物和方法,特别是涉及通过离子激流(ion torrent)测序分析基因和完整基因组。
背景技术
结核分枝杆菌(Mycobacterium tuberculosis,MTB)为结核病的致病因子,是(特别是在HIV感染患者中)具有显著发病率和死亡率的高度传染性细菌病原体。从1997年以来,结核病仍然是南非的首要死亡原因,这是与该国日益严重的HIV流行关联的统计信息。此外,越来越多例的多药抗性(MDR)和广泛抗药(XDR)的临床分离株已经加重了具有活跃MTB的患者的有效治疗措施。
MDR结核病菌株对一线抗生素利福平(RIF)和异烟肼(INH)是耐受的,而XDR MTB菌株对于是RIF和INH两者以及任何氟喹诺酮和二线可注射抗生素药物(例如,阿米卡星、卡那霉素或卷曲霉素)是耐受的。约6%的所有TB病例是MDR菌株,且南非持续每年报道更高百分比的XDR病例。尽管7%感染标准MTB菌株的患者屈服于感染,但MDR结核病的死亡率上升至几乎50%。抗生素耐受的MTB菌株的出现强调迫切需要快速和高度精确的诊断,特别是在非洲的发展中国家中。此外,迁移群体使得抗药性菌株的地理监测和追踪更加迫切。
MDR菌株的基于培养的药物敏感性试验(DST)被认为是金标准,但费时(数周至数个月),技术上有挑战性且成本过高,特别是在资源有限的国家中。例如,BACTEC MGIT 960(Becton Dickinson Microbiology System, Silver Sparks NV, USA),是一种基于自动化连续培养的监控***,其测量细菌的氧消耗,并且可以使用可获得的制备的试剂盒进行DST,用于分析菌株对多种抗生素的敏感性。用BACTEC MGIT 960获得的DST结果得到可靠且可重复的结果,但需要操作活且有潜在感染性的培养物数天至数周或推迟直到获得结果,专业的实验室设施,和与仪器和耗材相关的高成本。
近年中,已经开发了几种用于测定MTB抗药性的基于核酸的测定法。最流行的商购诊断测定法之一是Hain LifeScience的GenoType MTBDRplus线性探针测定法(LPA)。该试验采用核酸提取、PCR扩增、杂交探针和侧面条上经由碱性磷酸酶反应的色度可视化。已经显示LPA是敏感且特异的,但存在几个缺点。LPA对于所有抗性相关突变的灵敏度将最有可能从未达到100%,因为许多赋予抗性的突变尚待发现。LPA的另一个固有限制是无法检测含有抗性和敏感菌株的混合物的样品群体。没有检测到具有将氨基酸变为LPA上没有呈现的以前未表征或未知突变的取代突变的菌株。此外,LPA只允许检测引起抗性的最频繁的突变。如果菌株含有靶向突变以外的突变,则野生型带型出现将看起来导致假阴性(易感)结果。
因此,存在对于用于关键基因(诸如,例如,与一线和二线抗药性相关的基因)的全长基因分析的快速、标准化、成本节约的方案的需求。
发明内容
本发明克服了与目前策略和设计相关的缺点,并且在此提供了用于分析包括全长基因和完整基因组的核酸的序列信息的工具、组合物和方法。
本发明的一个实施方案涉及通过半导体测序和,优选地,离子激流测序分析抗药性突变。含有感兴趣的基因的核酸区段通过PCR扩增,并且将扩增产物处理,并随后通过测序进行分析。测序优选通过离子激流,或下一代测序仪,包括离子激流个人基因组机器(PGM)。优选地,所述扩增产物代表许多生物体的种、株系和/或血清型的基因的共同全长或多个重叠片段。将扩增产物测序,并鉴定和作图突变。作图鉴定已知和先前未知的突变两者,并且可用于追踪群体间抗药性的进展和活动。优选地,本发明分析病原体的核酸,诸如,例如,病毒、细菌或寄生物。优选地,病毒病原体是流感或HIV的致病因子,并且细菌病原体是结核病的致病因子。核酸区段的离子激流测序为全长基因分析的快速、有效、成本节约的方案提供了增强的测序。立即测定抗药性和其它突变。
本发明的另一个实施方案涉及用于对完整基因组进行半导体测序,优选离子激流测序的工具、组合物和方法。本发明包括获得感兴趣的生物体的DNA序列,并使用多对核酸引物进行聚合酶链式反应分析。设计每对引物以便在类似PCR条件下同时扩增基因组的重叠区段。优选的引物具有类似的GC含量和总体大小。基因组的单一PCR扩增产生数百个扩增产物,其序列包括生物体的全长基因、大基因和非编码区段或整个基因组。分析这些产品,优选通过离子激流测序,并匹配序列以生成整个基因组的序列图。
本发明的另一个实施方案涉及鉴定微生物基因组中赋予针对抗微生物化合物的抗性的序列基序的方法,其包括:提供从微生物的多种不同菌株或血清型获得的多种核酸样品;通过聚合酶链式反应扩增多种核酸样品的序列;通过离子激流测序获得扩增序列的序列信息;从获得的序列信息鉴定至少一种微生物菌株或血清型的基因组中的多态性;和将鉴定的多态性与至少一种微生物菌株或血清型的表型或基因组位置关联,以鉴定赋予针对抗微生物化合物的抗性的序列基序。优选地,微生物是病毒、细菌、真菌或寄生物,并且病毒是流感病毒且细菌是结核分枝杆菌。优选地,核酸样品在含水分子转运介质中提供,所述含水分子转运介质含有离液剂、去污剂、还原剂、螯合剂、缓冲剂和醇,它们以足以裂解细胞、变性蛋白、失活核酸酶、杀灭病原体且不会降解核酸的量一起存在。优选地,扩增在利用扩增与针对抗微生物化合物的抗性相关的基因或核酸区段的引物对一步聚合酶链式反应中进行,并且聚合酶链式反应在含水混合物中进行,所述含水混合物包含:热稳定聚合酶;包含约等量的dATP、dCTP、dGTP和dTTP的脱氧核苷酸三磷酸的混合物,螯合剂,摩尔渗透压浓度试剂,白蛋白,镁盐;和缓冲剂。优选地,抗微生物化合物是抗生素。
本发明的另一个实施方案涉及用通过本发明的方法鉴定的抗微生物化合物治疗由至少一种微生物菌株或血清型引起的疾病或病症的方法。
本发明的另一个实施方案涉及用于测定微生物基因组的完整序列的方法,其包括:通过在含水混合物中进行基因组的单一聚合酶链式反应(PCR)而产生一系列的扩增子,所述含水混合物含有热稳定聚合酶;包含约等量的dATP、dCTP、dGTP和dTTP的脱氧核苷酸三磷酸的混合物;螯合剂;盐;缓冲剂;稳定剂;和多个引物对,其中多个引物对中的各引物具有类似的退火温度;通过半导体测序来测序产生的扩增子系列中的每一个,并且关联扩增子的序列,并且构建基因组的完整序列。优选地,多个引物对中的各引物包含长度为15至25个核酸的引物,且各具有约25-50%的GC含量。优选地,设计各引物对以PCR扩增扩增子,并且PCR扩增的扩增子的集合涵盖完整基因组序列的重叠区段。优选地,多个引物与基因组杂交,并且以约每500到2,000个核苷酸沿基因组隔开。优选地,微生物是病毒、细菌、真菌、寄生物或细胞,并且病毒是流感病毒且细菌是结核分枝杆菌。
本发明的另一个实施方案涉及在一个步骤中测定核酸区段的序列的方法,其包括:对核酸区段进行聚合酶链式反应,以产生一系列扩增子,其中所述PCR包括:热稳定聚合酶;包含约等量的dATP、dCTP、dGTP和dTTP的脱氧核苷酸三磷酸的混合物;螯合剂;盐;缓冲剂;稳定剂;和多个引物对,其中多个引物对中的各引物具有5℃内的退火温度;通过半导体测序来测序产生的扩增子系列中的每个,并且关联扩增子的序列,并且构建核酸区段的序列。优选地,核酸区段长度为1 Mb或更长,更优选长度大于2或更多Mb,更优选长度为5或更多Mb,且更优选长度为10或更多Mb。优选地,多个引物对中的各引物长度为16至24个核苷酸,具有约28-35%的GC含量,且具有其它各引物的3℃内的退火温度。优选地,设计各引物对以PCR扩增代表核酸区段的序列的部分的扩增子,并且PCR扩增的扩增子的集合代表区段的完整序列的重叠部分。优选地,多个引物对以长度为约800至1,200个核苷酸的间隔与所述区段杂交。
本发明的另一个实施方案涉及包含多对核酸引物的混合物,其中,在使该集合连同核酸区段进行聚合酶链式反应之后,引物对的集合生成扩增子的集合,其中各扩增子长度为约500至2,000个核苷酸,从而使得区段的整个序列被代表在所得的扩增子集合中。优选地,引物对集合中的各引物长度为约15至25个核苷酸,具有约25-45%的GC含量,和其它各引物的3℃内的退火温度,并且引物对集合中的各引物含有与相同微生物的基因组杂交的序列。优选地,微生物是病毒、细菌、寄生物或真菌。优选地,混合物含有热稳定聚合酶;包含约等量的dATP、dCTP、dGTP和dTTP的脱氧核苷酸三磷酸的混合物;螯合剂;盐;缓冲剂;稳定剂和无核酸酶的水。
本发明的其它实施方案和优点部分地在其后的说明书中描述,并且部分地,可以从该说明书中是显而易见的,或者可以从本发明的实践中知道。
附图说明
图1说明pncA基因序列加上100个侧接碱基对以及反向互补序列、蛋白序列和引物序列。
图2说明H37RV基因菌株的核苷酸序列以及TB 16S核糖体RNA基因测序引物的序列。
图3说明赋予对利福平的敏感性/抗性的rpoB基因以及rpoB的正向和反向引物序列。
图4说明结核分枝杆菌H37Ra,完整基因组(GenBank:CP000611.1) GyrA基因和三组正向和反向引物。
图5结核分枝杆菌H37Ra,完整基因组(GenBank:CP000611.1)过氧化氢酶-过氧化物酶-过氧亚硝酸酶(peroxynitritase) T katG和三组正向和反向引物。
图6说明旋转酶A和IS 6110测定法的循环阈值。
图7说明通过循环数相比于Ct值使用序列分离株的旋转酶A测定法和IS 6110测定法。
图8说明相比于循环阈值(ct)使用序列分离株的旋转酶A测定法和IS 6110测定法。
图9使用各种引物对集合与离子激流测序方法在测序甲型流感基因组中获得结果的总结。
图10用于甲型流感(H3N2)的全基因组离子激流测序的引物对的表征。
图11(A) 将编码区显示为阴影的pncA基因序列,和(B) PCR平铺(PCR tiling)中利用的pncA正向和反向引物和pncA区域P1-P4。
发明描述
与抗药菌株相关的基因的快速分析对于许多疾病和病症的成功治疗是一个主要挑战。新出现的MTB抗药性的实时地理监测将有利于更适当的治疗策略(例如,药物、抗生素、化学品)。目前,可用的分子方法,诸如GenoType® MTBDRplus LPA提供有限的检测能力,特别是当新型/不常见氨基酸取代是在已知抗药性区域内时,或当未发现的氨基酸突变影响抗药性时。此外,包括离子激流方案的目前方法需要多步骤、辅助设备和增加的费用,并且是劳动密集型的。
已经令人惊讶地发现了用于全长基因和基因组的快速表征的简化的半导体测序方案。本发明包括利用全长基因的半导体测序和优选离子激流测序的标准化方案。该方案使得能够测序实施的整个编码区,允许表征已知突变和发现新型多态性。该方案还使得能够测序核苷酸信息的数兆碱基,从而使得可以测定细胞和生物体的完整基因组并容易作图和鉴定遗传多态性。优选地,细胞或生物体是引起疾病的原核或真核细胞,或酵母或真菌细胞。优选的引起疾病的生物体包括细菌、病毒、真菌和寄生物的株系。示例性生物体包括,但不限于,分枝杆菌(例如,结核分枝杆菌),流感病毒(例如H5N1、H1N1、H7N9),呼吸道合胞病毒,HIV和疟原虫(例如,恶性疟原虫(Plasmodium falciparum))。
这种相对快速(例如,1、2或3天或更短)、标准化、成本节约的方案允许基因的全长分析,所述基因诸如,例如,与一线和二线MTB抗药性相关的rpoB、katG、gyrA、pncA 和rrsMTB基因(参见图1-5)。用下一代离子激流个人基因组机器(PGM)使用在南非收集的26种地理上不同的临床分离株(包括MDR和XDR菌株)评价该方案。将从这种开发的方法获得的测序数据与来自培养物的HAIN LPA和基因分型DST数据进行比较。这种方法首次使得能够测序实现抗性的基因的整个编码区,允许表征已知突变和发现新型多态性。在rrs、rpoB、katG、 pncA gyrA基因上鉴定了先前未表征的取代突变。
本发明提供了在资源贫乏的环境诸如非洲、亚洲和印度更好利用下一代仪器的显著潜力。具体地,本发明改进了预先文库制备方法并使其简化。本发明的方法不需要使用制造者通常利用或需要的昂贵辅助设备件。具体地,本发明的标准化程序不需要用于DNA定量的Agilient生物分析仪;用于乳化PCR步骤的OneTouch ePCR***,或用于凝胶切割的PipinPrep。此外,由于本发明的方案涉及重新测序全编码基因(不必全基因组),所以不需要Bioruptor用于将DNA剪切为小块。此外,不必测序整个基因组,然后鉴定基因。本发明的方法和工具允许预先选择待测序的感兴趣的基因和/或区域。由于Agilent 2100生物分析仪、OneTouch、PipinPrep和Bioruptor都需要额外训练来使用,消耗宝贵的实验台空间,并且是非常昂贵的,所以本发明代表了相比于常规方法的显著进步和改进。
本发明的测序方法在本文中可以使用离子激流测序来例举,因为该测序方法已被应用于结核分枝杆菌。如相信对于本领域技术人员清楚的是,该方案涉及半导体测序,其通过离子激流测序来例举,并且因此,涉及大量不同区域的同时测序。测序和核酸方法可应用于基因、基因组或核酸序列的任何系列。
本发明还包括用于选择用于测序感兴趣的目标的引物对的方法。优选选择关于目标具有匹配的退火和解链温度的引物对。优选地,解链和退火温度基于序列特征,诸如序列的GC含量、引物自杂交的可能性(例如,在引物内形成发夹环),和结合位点附近可能的结构。优选地,引物在测序条件下不自杂交。优选地,引物的GC含量为约25%至50%,更优选约30%至40%,更优选约25%至35%,并且还更优选约40%至50%。因此,基于序列特征选择目标用于杂交的引物序列,从而使得用于该目标的所有引物对都将具有类似的对该目标的解链和/或退火温度。优选地,引物序列不含引物序列的合理可能自杂交的区域。优选地,针对退火和/或解离温度匹配引物对,所述退火和/或解离温度可在5℃内,4℃内,3℃内,2℃内,1℃内,且更优选相同的退火温度,相同的解链温度,或两者。引物对优选生成代表目标的重叠区段的长度为约500至约2,000个核苷酸(NT),更优选约600至1,500 NT,更优选约700至1,300 NT,更优选约800至1,200 NT,更优选约900至1,100 NT,且更优选约1,000 NT的扩增子。引物长度通常为12 NT至45 NT,更优选15至35 NT,且更优选约18至25 NT。尽管不是规则,但通常较长引物具有较低GC含量。针对pncA基因(参见图1)、H37RV基因菌株(参见图2)、rpoB基因(参见图3)、GyrA基因(参见图4)和katG基因(参见图5)鉴定示例性引物对。
在本发明的一个实施方案,针对结核分枝杆菌的五个基因确定半导体测序方案,用于确定MDR和XDR菌株中的抗药性(例如,累积测序11.4 kb/分离株)。结核分枝杆菌rpoB基因编码RNA依赖的DNA聚合酶的1,178个氨基酸的β亚基。rpoB基因的81-bp“核心区域”内的突变负责结核分枝杆菌菌株中近似95%的利福平抗性。这些突变中在位置516 (D→V)、526 (H→Y/D)和531 (S→L)处的三个构成该区域内的大多数突变。在该研究中表征的21种利福平抗性菌株中,11种(52.4%)携带rpoB基因的S531L突变,7种(33.3%)含有rpoB基因的位置516处的氨基酸取代,且3种(14.3%)含有rpoB基因的位置526处的突变(表1)。在位置516处观察到的最流行的rpoB取代为缬氨酸(D516V)。根据本发明的离子激流测序揭示7种菌株中的6种在该位置处含有较罕见的甘氨酸残基(D516G)(表1)。这6种菌株通过LPA对突变体和野生型条带两者均显示为不存在(表1)。类似地,在rpoB基因的位置526处鉴定了不常见的氨基酸取代。在rpoB基因的位置526处报道的最流行的氨基酸取代是组氨酸至酪氨酸或天冬氨酸(H526Y/D)。离子激流测序揭示3种分离株中的1种含有不常见的精氨酸(R)残基(H526R),其通过HAIN LPA对野生型和突变体条带两者均显示为不存在(表1)。尽管样品中不存在野生型和突变体条带根据LPA试验被解释为抗性的,但仍然存在不确定性,因为没有直接表征氨基酸改变的类型。这强调了离子激流测序用于抗性监测的实用性和流行的MTB菌株中新型氨基酸的发现。
表1
通过离子激流测序、Hain LPA基因分型和培养推导的来自南非的26种(14种MDR、7种XDR和5种完全易感的)结核分枝杆菌分离株的rpoB基因的前900个氨基酸残基*中10个氨基酸突变的总结。
* 存在在至少1种菌株中在3'末端(残基900-1253)注意到的5个rpoB氨基酸取代(R908C、Q1042H、P1043A、I1187T、和V1249F)。
** 与测序的H37Rv参考菌株相比。
katG基因编码过氧化氢酶-过氧化物酶,将异烟肼(INH)转化为活性形式的酶。大多数异烟肼抗性与katG密码子315 (S315T)相关,尽管inhAnod的启动子区域中的突变也有助于抗性。评估的26种菌株中,16种(62%)在位置315(S315T)含有赋予异烟肼抗性的特征性丝氨酸至苏氨酸的氨基酸取代(表2)。这些测序结果表现出与使用HAIN LPA和培养DST进行的比较的100%一致性。
表 2
通过离子激流测序、Hain LPA基因分型和培养推导的来自南非的26种(14种MDR、7种XDR和5种完全易感的)结核分枝杆菌分离株的katG基因中4个氨基酸突变的总结。
* 已知利福平抗性发生在rpoB的位置531(S→T)、526 (H→Y/D)和516 (D→V)。
** 与测序的H37Rv参考菌株相比。
吡嗪酰胺(PZA)是从1952年以来已经用作一线药物来对抗结核病的烟酰胺的合成衍生物。PZA的标准DST 是复杂的,这是由于体外的酸性pH要求,其抑制结核分枝杆菌生长且使精确表型评估复杂化。PZA抗性归因于编码吡嗪酰胺酶的pncA基因中的突变。这些赋予抗性的突变众多,且包括氨基酸取代、移码和终止密码子突变。从评估的26种南非分离株表征了七种突变,包括一个沉默突变,5个氨基酸取代,和一个链终止突变。在一个分离株中观察到的Q122 (Stop)终止突变(表3)是新型的,在其它地方没有报道。PZA表型评价的难度和沿pncA基因的突变的变化性进一步强调了离子激流基因测序评估这种高变MTB基因中的突变的附加价值。
表3
通过离子激流测序和培养推导的来自南非的26种(14种MDR、7种XDR和5种完全易感的)结核分枝杆菌的pncA基因中6个氨基酸突变的总结。
* 已知吡嗪酰胺抗性发生在Mphahele等人(23)描述的25个突变中。
** 与测序的H37Rv参考菌株相比。一种菌株在位置195 (C→T)含有沉默(同义)核苷酸突变。
结核分枝杆菌中氟喹诺酮类(FQ)的主要目标是DNA旋转酶,即由分别由gyrAgyrB基因编码的两个A和B亚基构成的II型拓扑异构酶。位于gyrA基因的被称为喹诺酮抗性-决定区(QRDR)的短区域内的氨基酸取代占大多数已知的FQ抗性结核病菌株。在来自该研究的10/26 (38.5%)序列中观察到QRDR中在位置88、90和94的取代突变(表4)。这10种菌株中的三种含有在gyrA基因中位置94的取代;注意到两种为D94G取代,且一种为D94Y取代。D94G和D94Y两者都已被表征为取代,且在密码子94的两种氨基酸取代都引起类似水平的FQ抗生素抗性。在评估的菌株中,gyrA基因是最易变的,在评估的26种临床分离株中含有9种氨基酸取代。此外,这些gyrA密码子中的两种(549和613),表现出异质残基(表4),相比于HAIN LPA和DST具有进行离子激流测序的优点。
表4
通过离子激流测序和培养推导的来自南非的26种(14种MDR、7种XDR和5种完全易感的)结核分枝杆菌分离株的gyrA基因中10个氨基酸突变的总结。
* 已知氟喹诺酮抗性发生在gyrA中位置88(G→C)、90 (A→V)、91 (S91P)和94 (D→H)。
** 与测序的H37Rv参考菌株相比。
+ 在一定比例的离子激流读取中存在杂合核苷酸突变;所述突变赋予混合的氨基酸取代。
新出现的被定义为具有获得的额外对FQ(即,氧氟沙星)和三种可注射的“二线药物”(即阿米卡星(AMK)、卡那霉素(KAN)或卷曲霉素(CAP))中至少一种的抗性的MDR病例的XDR结核病病例已经成为全球发展中国家中的公共健康威胁。大多数对二线药物的抗性与16 S核糖体RNA rrs基因中密码子1401 (A1401G)、1402 (C1402T)和1484 (G1483T)的突变相关。非洲MTB菌株的分析揭示,7/26(27%)被定义为XDR,如通过位置1401的核苷酸突变(A1401G)所证明(表4)。在来自该分析的菌株中还发现位置492、514和878的三种额外核苷酸突变(表5)。G878A是一种新型核苷酸突变,但根据DST显示为对AMK、KAN和CAP敏感。
表5
通过离子激流测序和培养推导的来自南非的26种(14种MDR、7种XDR和5种完全易感的)结核分枝杆菌分离株的rrs (16s)基因中4个核苷酸突变的总结。
* 已知氨基糖苷类抗性发生在位置1401 (A→G)、1402 (C→T)和1484(G→T)。
** 与测序的H37Rv参考菌株相比。
先前研究已经显示,katG密码子463和gyrA密码子95中的突变是用于将菌株归类为流行病学遗传组1、2和3的遗传标记物,并且这些密码子对抗生素抗性没有影响。第1组菌株是第2组和第3组菌株的遗传祖先,其连接主要非人分枝杆菌属(田鼠分枝杆菌(M. microti)和牛分枝杆菌(M. bovis)菌株)与人非洲分枝杆菌(M. africanum)和结核分枝杆菌(M.tuberculosis)谱系。如katG密码子463和gyrA密码子95中的取代突变所证明,在本研究中表征的非洲分离株中的总共7/26 (27%)、18/26 (69%)和1/26 (4%)分别为遗传组1、2和3中的成员。追踪第1组生物体在MTB检测的方面是重要的,因为几种属于遗传组1的分离株缺乏***序列1661 (IS-1661),这是用于几种基于PCR的MTB检测测定法的共同遗传目标。
可以将用于MTB抗药性的离子激流方案容易地整合至整个国家和地区诸如非洲、印度和中国的低资源设置中。离子激流方法不需要使用昂贵的辅助设备,诸如Agilent2100生物分析仪,DiaGenode Bioruptor®超声处理***,Ion OneTouch System™,超速离心机,或Pippin Prep™工作站,如目前的离子激流方案所推荐的。这是重要的,因为这些仪器和需要的配件和耗材可以是昂贵的,需要大量实验室台面,并且经常需要常规维护。
与GenoType® MTBDRplus或MTBDRsl线性探针测定(LPA)相反,离子激流 PGM方案提供了基因的全长表征,使得可能发现LPA可能潜在错过的新的氨基酸取代,因为LPA仅限于已知突变。使用该方案,已经发现在临床现场分离株中几种不常见的氨基酸变化。此外,来自离子激流的序列覆盖的广泛深度允许在分离株内发现异质或混合的菌株遗传群体。
离子激流测序的可成比例放大允许扩展以便在单一芯片上包括额外基因的数兆碱基。本发明的方法可扩展超出五个全长MTB基因以包括目前构成MTB抗药性的所有16个额外基因。使用离子激流 PGM的全长基因分析将鉴定新型突变,当与表型最小抑菌浓度(MIC)试验相关时,其鉴定新的结核病耐受残基以及多个突变的累积抑制作用。
本发明的另一个实施方案涉及利用半导体测序方案的兆碱基(megabase)序列鉴定。根据本发明的兆碱基测序涉及选择扩增目标序列的不同部分由此部分的集合代表目标序列整体的引物对。优选地,该部分在允许排列所得扩增子的程度上重叠,来形成完整的目标序列。优选设计引物对以形成扩增子,所述扩增子具有约0.5k至约5k核苷酸,优选约0.6k至约3 k核苷酸,更优选约0.7k至约2k核苷酸,且更优选约0.8k至约1k核苷酸的长度。引物对优选具有相似的GC含量(GC contact),从而使得退火或杂交温度相似或优选在约5℃内,更优选在约2℃内,且更优选在约1℃内。还优选的是,杂交解离温度是类似的,从而使得对于聚合和PCR,退火和解离发生在非常相似的温度。在退火和解离中,引物的长度影响温度概况,因此优选所有或至少大部分引物的长度相似。引物长度优选为约15-30个核苷酸,更优选约20-28个核苷酸,且更优选约18至25个核苷酸。尽管优选所有引物都具有此类相似特征,但当大于约80%、更优选85%或更高、更优选90%或更高、且甚至更优选95%或更高的引物共享一种或多种特征时,可以进行兆碱基测序。根据利用此类相似引物,用待用所有引物对的混合物扩增的一种目标核酸进行PCR反应。还优选的是在相同混合物上进行一式两份PCR分析。循环数的范围可以为10至50或更多,并且优选地,根据常规PCR温度和反应条件进行温度循环。
以下实施例说明了本发明的实施方案,但不应该视为限制本发明的范围。
具体实施方式
实施例
临床分离株。从University of Pretoria, South Africa和National Institutefor Communicable Diseases (NICD), Sandringham, South Africa的样品档案获得代表药物敏感、MD和XDR结核病菌株的总共26种地理上不同的临床分离株。包括H37Rv MTB实验室菌株作为整个方案的测序对照。使用的所有MTB分离株是来自纯培养MGIT™ 960***管(Becton Dickinson, Sparks, MD)的存档菌株,其中菌种鉴定和对利福平和异烟肼的基因型抗性使用Genotype® MTBDplus测定法(HAIN LifeSciences, Germany)根据制造商的说明书进行确定。如先前所述使用MGIT™ 960***进行对一线和二线药物的表型抗性。对于氧氟沙星和卡那霉素(二线药物)的临界浓度分别为2.0 µg/mL和5.0 µg/mL。对一线和二线药物的抗性使用标准诊断算法来确定。
DNA制备。MTB分离株始终以不知情的方式处理。将MTB样品(0.5 mL)移入含有1.5mL PrimeStore Molecular Transport Medium®(分子转运介质)(Longhorn Vaccines &Diagnostics, San Antonio, TX)的冷冻小管。将灭活样品在环境温度从南非转运到SanAntonio, Texas, USA(3-4天),并储存在5℃,直至使用。使用Qiagen® EZ1® AdvancedRobot和EZ1 DNA组织试剂盒(目录号953034)根据制造商的推荐(Qiagen Inc.,Germantown, MD)从含有灭活培养物的PrimeStore MTM®的200 µl等分试样纯化总DNA(50µl)。
引物设计。设计新型PCR引物用于扩增对于每个目标MTB基因的全长编码区(表6)。
表6
用于全长分析MTB基因的PCR扩增引物。
用于rpoB (2组引物)、katG、pncA、gyrArrs (16s)基因扩增的引物对使用结核分枝杆菌H37Rv菌株的基因组序列作为参考(GenBank登录号NC_000962)来设计。引物二级结构、解链温度和潜在的引物-二聚体形成使用LaserGene 9.1 (DNAStar, Madison, WI)和PrimerExpress 3.0 (Life Technologies, Foster City, CA)来确定。所有寡核苷酸使用标准的脱盐引物(Integrated DNA Technologies (IDT), San Diego, CA)来合成。
PCR扩增。设计和优化对于所有MTB基因目标的扩增反应,以在一组标准化的热循环参数下使用。所有PCR‘主混合物(mastermixes)’使用Platinum Taq DNA聚合酶、10X缓冲液和50 mM MgCl2 (P/N 10966-034; Life Technologies, Foster City, CA)来制备。扩增在50μl终体积反应混合物中实施,所述反应混合物含有24.1 µl Ambion无核酸酶的水(目录号AM 9932; Life Technologies, Foster City, CA)、5 µl 10X PCR缓冲液、2 µl 50mM MgCl2 (最终2 mM)、0.4 µl PCR核苷酸混合物Ultrapure dNTPS (对于每种dNTP最终为200 µM;P/N 77119; USB, Santa Clara, CA)、0.5 µl Platinum Taq DNA聚合酶(最终2.5单位)和2 µl引物共混物(rpoB、katG、pncA、gyrArrs基因; 对于每个引物最终为0.4 µM)。向每一34 µl‘主混合物’反应混合物中,添加16 μl提取的DNA以使总体积至50μl。反应在MicroAmp Optical 96-孔反应板(P/N N801-0560, Life Technologies, Foster City,CA)上实施,并且使用MicroAmp 8-盖条(8-Cap Strips)(P/N 4323032, LifeTechnologies, Foster City, CA)加盖。扩增使用ABI 2720热循环仪(LifeTechnologies, Foster City, CA)进行。热循环参数为:95℃持续2分钟,随后40个循环的95℃持续30秒,55℃持续15秒,72℃持续2分钟,并且在72℃最终延伸5分钟。所得扩增子在具有溴化乙锭(最终0.1 µg/mL;目录号161-0433; Bio-Rad, Hercules, CA)的1% (wt/vol)分子生物学级琼脂糖(目录号BP1356; Fischer Scientific, Pittsburg, PA)上通过添加5 µl PCR产物与1 µl GelPilot上样染料5X (P/N 1037649; Qiagen, Germantown,MD)来证实。产物的电泳分离在1X Tris硼酸盐-EDTA (TBE)缓冲液(目录号1B70153; IBIScientific, Peosta, IA)中以0.4 mV cm2实施60分钟。扩增子在紫外透照下可视化,并使用TrackIt 1 kb Plus DNA Ladder (P/N 10488-085; Life Technologies, FosterCity, CA)进行大小估计。可视化后,将对应于rpoB、katGpncAgyrArrs (16s)目标的每种临床分离株基因扩增的剩余PCR反应物(~45µL)转移至单一微量离心管中。将合并的对应于每个临床分离株的基因使用MinElute反应纯化试剂盒(目录号28204; Qiagen,Germantown, MD)根据制造商的说明书进行PCR纯化并稀释在50μl Low Tris-EDTA (TE)(目录号602-1155-010; Life Technologies, Foster City, CA)中。DNA的浓度和纯度使用NanoDrop ND 1000 (Thermo Fischer Scientific, Wilmington, DE)进行分光光度测定。
离子激流文库制备。条形码文库使用Ion Xpress Plus片段文库试剂盒(目录号4471269, Life Technologies, Foster City, CA)和Ion Xpress DNA Barcoding 1-16试剂盒(目录号4468654, Life Technologies, Foster City, CA)根据Xpress Plus gDNAand Amplicon Library Preparation中概述的方案的修改版本来生成。
扩增子剪切。化学剪切使用含有rpoBkatGpncAgyrArrs (16s)基因扩增子的近似等摩尔合并物的1-3 µg DNA进行。DNA剪切在50μl总反应体积中通过组合5 µl IonShear Plus 10X反应缓冲液,10 µl酶和35 µl合并的DNA模板(Ion Xpress Plus片段文库试剂盒, 目录号4471269, Life Technologies, Foster City, CA)来进行。将反应混合物在37℃孵育45分钟,用5μl Ion Shear终止缓冲液终止,并储存在冰上,直至纯化。剪切的DNA使用Agencourt Ampure XP-PCR纯化珠(P/N A63880; Beckman Coulter, Brea, CA)与Dynal磁珠支架(目录号123-21D; Life Technologies, Foster City, CA)根据制造商的推荐来纯化。简而言之,将99 µl Agencourt珠粒与50 µl ion剪切反应物混合,在室温孵育5分钟,放置在磁性支架上,用70% (v/v)乙醇洗涤两次,并用12 µl Low TE缓冲液(目录号602-1155-010; Life Technologies Inc., Foster City, CA)洗脱。
适配子连接。适配子连接在0.2 mL低结合PCR管(P/N PCR-02-L-C; Axygen Inc.,Union City, CA)中通过组合12 μl剪切的扩增子与1.25 μl连接酶缓冲液、1.25 µl P1-IA适配子混合物(Ion DNA Barcoding 1–16试剂盒, 目录号4468654 Life Technologies,Foster City, CA)和0.2 µl DNA连接酶(Ion Xpress Plus片段文库试剂盒, 目录号4471269, Life Technologies, Foster City, CA)来进行。将混合物上下抽吸5次,并且在室温下孵育(22-25℃)30分钟。适配子连接反应在10 µl Low TE缓冲液中使用AgencourtAmpure XP-PCR 纯化珠(P/N A63880; Beckman Coulter, Brea, CA)与Dynal磁珠支架(目录号123-21D; Life Technologies, Foster City, CA)根据制造商的推荐来纯化和洗脱。
切口平移与条形码扩增。来自每个患者样品的扩增子合并物使用Ion DNABarcoding 1–16试剂盒和Ion Xpress片段文库试剂盒(部件号分别为4468654和4471269;Life Technologies, Foster City, CA)来编条形码。为了尽可能增加产量,反应通过组合40 µl Platinum PCR SuperMix High Fidelity、4.4 µl Ion引物混合物(BC X 其中X=条形码1-16)和10 µl连接的DNA来成比例放大2x。扩增使用ABI 2720热循环仪(LifeTechnologies, Foster City, CA)进行。热循环参数包括72℃持续20分钟,95℃持续5分钟,随后10个循环的95℃持续15秒,58℃持续15秒,和68℃持续1分钟。扩增后,将编条形码的样品在50 µl Low TE (目录号602-1155-010; Life Technologies, Foster City, CA)中使用MinElute反应纯化试剂盒(目录号28204; Qiagen, Germantown, MD)根据制造商的说明书来纯化和洗脱。DNA浓度和纯度使用NanoDrop ND 1000 (Thermo FischerScientific, Wilmington, DE)通过分光光度分析来测定。纯化的编条形码样品的范围通常为150-300 ng/µl ,且A260/280纯度为1.7-1.9。将等摩尔浓度(~2-3 µg每种编条形码的样品)组合至单一的1.5mL无核酸酶的离心管中,并用于大小选择。
大小选择。将适当体积的GelPilot 5X上样染料(P/N 1037649; Qiagen,Germantown, MD)添加至合并的编条形码MTB文库管,并上样至含有溴化乙锭(最终0.1 µg/mL;目录号161-0433; Bio-Rad, Hercules, CA)的1 % (w/v)琼脂糖凝胶(目录号BP1356;Fischer Scientific, Pittsburg, PA)上。将编条型码的文库在1X TBE缓冲液(目录号1B70153; IBI Scientific, Peosta, IA)中以0.4 mV cm2电泳60分钟,并且在UV透照下可视化。大小估计使用TrackIt 1 kb Plus DNA Ladder (P/N 10488-085; LifeTechnologies, Foster City, CA)来确定。凝胶切割在UV透照下使用无菌手术刀片进行,切出75–200 bp之间的目标区域。将切割的琼脂糖凝胶片置于无菌的1.5 mL离心管中,并使用PureLink快速凝胶提取试剂盒(目录号K210012; Life Technologies, Foster City,CA)根据制造商的说明书进行DNA纯化。编条形码的DNA文库的浓度和纯度值使用NanoDropND 1000 (Thermo Fischer Scientific, Wilmington, DE)进行分光光度测定。用于乳液PCR的推荐文库输入为~140-560 x 106个分子/18 µl。该范围使用文库储存物和无核酸酶的水通过1:1000稀释来实现。
乳液聚合酶链式反应(emPCR)。乳液聚合酶链式反应在1 mL反应体积中使用Ion模板制备试剂盒(目录号4469000; Life Technologies, Foster City, CA)通过添加582 µl无核酸酶的水,200 µl 5X PCR试剂混合物,100 µl 10X PCR酶混合物,100 µl Ion球颗粒,和18 µl稀释的文库模板来进行。将制备物彻底混合,随后在微型离心机中短暂离心。乳液使用Ultra-Turrax Tube Drive (Life Technologies, Foster City, CA)来实现。将总共9 mL冷却的乳液油(离子激流制备试剂盒;目录号4469000, Life Technologies, FosterCity, CA)添加至Ion模板制备管(目录号4467226, Life Technologies, Foster City,CA)。将该乳液管放置并锁定在IKA Ultra-Turrax Tube Drive上并启动。当该管在运动中时,将整个1mL PCR主混合物溶液分配至盖口(cap port)并混合5分钟。将混合乳液转移至96孔PCR板,并使用以下热循环参数使用ABI 2720热循环仪(Life Technologies, FosterCity, CA)来扩增: 94℃持续6分钟,随后40个循环的94℃持续30秒,58℃持续30秒,和72℃持续90秒;随后5个循环的94℃持续30秒,和68℃持续6分钟。
Ion球颗粒(ISP)回收和Qubit测量。Ion球颗粒使用Ion Xpress模板试剂盒(目录号4469001, Life Technologies, Foster City, CA)中供应的试剂根据制造商的方案(Ion Xpress模板试剂盒用户指南v2.0,第18-19页)来回收。回收颗粒的定量使用Qubit2.0荧光计(Life Technologies, Foster City, CA)和Ion 球质量控制试剂盒(目录号4468656, Life Technologies, Foster City, CA)根据制造商的推荐(Ion Xpress模板试剂盒用户指南,第25-26页)来进行。模板-阳性ion球颗粒(ISPs)的最佳量为4-50%。在该范围之外获得的相对荧光单位(RFU)值不继续到随后的ISP富集中。
ISP富集。ISP使用Ion Xpress模板试剂盒、Ion测序试剂盒、和DynaBeads MyOneStreptavidin C1珠粒(目录号分别为4469001、4468997和650.01;Life Technologies,Foster City, CA)中供应的试剂根据制造商的方案(Ion Xpress 模板试剂盒用户指南v2.0,第15-17页)来富集。
离子激流 314芯片制备和PGM测序。离子激流 314芯片(目录号4462923; LifeTechnologies, Foster City, CA)根据制造商的推荐(Ion测序试剂盒用户指南v 2.0)来制备和上样。离子激流 PGM根据离子激流 314芯片说明书来运行,所述说明书包括65-循环测序方案,使用18兆欧姆纯净水和标准压缩的氩气以驱动射流(fluidics)通过PGM***。所有rpoB、katG、pncA、gyrArrs基因和相应的蛋白保藏在GenBank (登录号JX303203-JX303332)中。
用于TB检测的旋转酶PCR相比于6110 PCR测定法。离子激流 PGM上的用于OCR的旋转酶目标和整个旋转酶基因测序也可用于鉴定导致抗性的TB突变。该第二PCR目标允许TB菌株的精确分析,其可以不包括整个IS6110***元件。尽管IS6110测定法在大多数菌株中具有多个基因拷贝,但一些只有一个。如图6、7和8中显示,这种旋转酶测定法由于在这些分离株中的多个IS6110基因拷贝而具有相比于IS6110测定法通常更高的循环阈值,从而具有更高灵敏度。因此,可以通过这种全基因测序方法追踪任何可能的TB突变 - 甚至远离检测位点。
表型和基因型结果。通过rpoBkatGpncAgyrArrs (16s)基因的离子激流测序对26种结核分枝杆菌分离株的氨基酸表征分别总结在表1-5中,并且与BACTEC™ MGIT™960(表型),和/或HAIN GenoType® MTBDRplus (基因型)LPA比较。在26种MTB临床分离株中,通过BACTEC™ MGIT™ 960表型分析,14种(54%)为MDR,7种(27%)为XDR,且5种(19%)是对药物敏感。离子激流 PGM测序方法显示与通过MGIT™ 960培养物获得的表型抗性(表1-5)和通过Hain LPA获得的基因型rpoBkatG数据(表1、2)两者的100% (26/26)一致性。
rpoB基因突变。与H37Rv野生型菌株相比,在26种临床分离株中鉴定到总共10个rpoB氨基酸取代。共同的S531L突变是最流行的,但观察到密码子516和526中也已知赋予对利福平抗性的突变(表1)。此外,在rpoB开放阅读框内,但在81碱基对利福平抗性性决定区(RRDR;表1)之外观察到突变。在一个菌株中RRDR之外观察到的V194I突变是可能不与利福平抗性相关的独特取代。在至少一种菌株中在rpoB蛋白的残基位置900之外注意到五个氨基酸取代。存在七种具有rpoB突变的菌株(位置516处6种和位置526处1种),其中根据LPA,野生型条带不存在,没有相应的突变条带。在这七种分离株中的六种中,离子激流测序揭示了在位置516处的已知突变位点内的不常见氨基酸取代(即甘氨酸),在此处通常已知缬氨酸(V)取代(D516V)发生(表2)。类似地,在一种分离株中,离子激流测序揭示了在位置526处的已知突变位点内的精氨酸(R),在此处酪氨酸(Y)或天冬氨酸(D)取代(H526Y/D)通常发生。
katG基因突变。在具有S315T的katG基因中观察到四个氨基酸取代,已知S315T赋予存在于所有抗性菌株中的异烟肼抗性(表2)。具有R463L、W191R和N138H突变的临床菌株通过DST检测(表2),并且先前已经表征。先前已经显示katG中位置463处的取代(R463L)对抗生素抗性没有任何影响,并且可以用于将结核分枝杆菌分离株归类为遗传组1 (Arg463)或2/3 (Leu463)。在评估的26种临床分离株中,7种(27%)是如通过这种R463L取代证明的遗传组1的成员。
pncA基因突变。在至少一种菌株中在包含pncA基因的全长编码区的561 bp间注意到七个核苷酸突变(表3)。26种菌株中的九种(34.6%)含有赋予吡嗪酰胺抗性的氨基酸突变(表3)。在一种菌株中,在核苷酸位置195(C195T)表征了沉默(同义)核苷酸突变。五种菌株含有先前表征的已知赋予针对吡嗪酰胺的抗性的氨基酸取代(C14R、A102V、V139G、R154G、和L172P)。在一种分离株中在pncA蛋白的残基122 (Q122Stop)处发现先前在别处没有报道的编码终止stop密码子的新突变(表3)。
gyrA基因突变。在编码DNA旋转酶的亚基A的2,517 bp全长gyrA基因中观察到九个独特的突变。仅仅在喹诺酮抗性决定区(QRDR)中具有由gyrA中密码子88、90和94处的取代定义的突变的菌株中注意到对氟喹诺酮类(FQ)的抗性。还在QRDR以外的区域中观察到许多额外突变,包括在gyrA蛋白的位置549和613处的两个“混合菌株”突变(表4)。已知位置95处的突变(S95T)对FQ抗性没有影响,但可用于归类遗传组2或3中的菌株。在属于遗传组2/3的总共19种临床分离株中,根据gyrA位置95的评估(T =遗传组2,且S=遗传组3),18种(96%)是第2组,且1种(4%)是第3组。
rrs (16s)基因突变。在包含全长16s rrs基因的1,540 bp间注意到四个核苷酸突变。26种临床分离株中的七种(27%)被DST显示为对于氨基糖苷类是抗性的,且所有菌株都具有已知赋予抗性的A1401G突变(表5)。观察到两个其它氨基酸突变(C492T和A514C),但先前已经显示不抑制氨基糖苷类效力。观察到先前未表征的G878A核苷酸突变,但根据DST显示该分离株是敏感的 (表5)。
兆碱基测序。在五种不同条件(在图9中表示为路线(Tracks))下在甲型流感病毒的完整基因组上进行离子激流基因芯片测序。如上讨论制备甲型流感H3N2毒株(约14.4 kb总RNA)的完整病毒核酸,并且或者仅逆转录,或者逆转录并PCR扩增,如图9中所示。流感病毒基因组通过逆转录(RT)来大规模扩增,并使某些扩增的cDNA群体进行PCR。然后使用离子激流测序方案分析各结果。用统一的六聚体、Uni 12和/或24种不同的流感特异性引物(长度和序列均不同)进行RT和/或RT-PCR分析。统一的六聚体包含引物的集合,各自长度为6个核苷酸,由此该集合含有六个核苷酸的所有序列迭代(iteration)。Uni 12是含有与流感H3N2病毒基因组的各区段的3'末端处的12个核苷酸互补的序列的引物(5′-ACGCGTGATCAGCAAAAGCAGG; SEQ ID NO 13)。如图9中显示,用六聚体引物和Uni 12的路线4扩增和测序和随后用24种流感特异性引物的PCR扩增和离子激流方案测序鉴定了约70%的流感基因组。
进行额外实验以实现完整流感基因组的一步测序。开发将允许对于PCR反应进行统一条件的一系列流感特异性引物。开发的引物列在图10中。这些引物对于流感病毒基因组都是特异性的,其中引物对以约每800至1000个碱基长度沿基因组间隔开(参见图10,扩增子长度和引物放置的开始和终止位置及序列)。所有引物具有相似长度,约18-23个核苷酸,且含有相似的GC含量,约22.7%至38.9%,近似约33% ±6%,且最多约33%±3%。使用这些引物的不同集合进行PCR分析,并且使用离子激流测序方案鉴定扩增产物。
pncA基因的测序。pncA的基因序列使用根据本发明的沿pncA基因间隔或“平铺(tiled)”的一系列引物来测定。pncA基因的编码序列显示于图11A,并且利用的引物在图11B中以粗体和下划线显示。使用这些引物连同离子激流方法,测定pncA的整个编码区(参见图11B中的P1-P4)。延伸用于所有基因或特定区域的引物允许整个基因组的一步测序。
本发明的其它实施方案和用途对于本领域技术人员从考虑说明书和实施本文公开的本发明中将是显而易见的。本文引用的所用参考,包括所有出版物、美国和外国专利和专利申请,均明确地且完整地通过引用并入。术语包含(无论何处使用)旨在包括术语由……组成和基本上由……组成。此外,术语包含(comprising)、包括(including)和含有(containing)不旨在是限制性的。旨在将本说明书和实施例仅考虑为示例性的,具有由随后的权利要求表明的本发明的真正范围和精神。
序列表
<110> LONGHORN VACCINES AND DIAGNOSTICS, LLC
<120> 离子激流基因组测序
<130> 3022.018.PCT
<140>
<141>
<150> 61/737,250
<151> 2012-12-14
<150> 61/695,960
<151> 2012-08-31
<150> 61/646,060
<151> 2012-05-11
<150> 61/644,876
<151> 2012-05-09
<160> 90
<170> PatentIn版本3.5
<210> 1
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 1
tcctctaagg gctctcgtt 19
<210> 2
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 2
gtcaggtaca cgatctcgt 19
<210> 3
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 3
atcgaaacgc cgtaccgcaa 20
<210> 4
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 4
tgacgtcgag cacgtaactc cct 23
<210> 5
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 5
acaccaactc ctgggaagga at 22
<210> 6
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 6
tgatcgcaca tccagcacat tt 22
<210> 7
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 7
gacggatttg tcgctcacta c 21
<210> 8
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 8
gccggagacg atatccagat 20
<210> 9
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 9
aaggatgttc ggttcctgga t 21
<210> 10
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 10
taacactcgt acccggct 18
<210> 11
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 11
ttctaaatac ctttggctcc ct 22
<210> 12
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 12
tggccaactt tgttgtcatg ca 22
<210> 13
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 13
acgcgtgatc agcaaaagca gg 22
<210> 14
<211> 1161
<212> DNA
<213> 结核分枝杆菌(Mycobacterium tuberculosis)
<400> 14
aggcgggaat gaacaccgtc acagccgagt ccatcgcgac ctcgagttcg agatcgcgca 60
gcaccaccgt gccggagacg atatccagat cgcgatggaa cgtgatatcc cgcggcccga 120
tgaaggtgtc gtagaagcgg ccgatggcct catgccccac ctgcggctgc gaacccaccg 180
ggtcttcgac ccgcgcgtca ccggtgaaca acccgaccca gccggcgcgg tcgtgcgcgg 240
cggccgcttg cggcgagcgc tccaccgccg ccaacagttc atcccggttc ggcggtgcca 300
tcaggagctg caaaccaact cgacgctggc ggtgcgcatc tcctccagcg cggcgacggt 360
ggtatcggcc gacacacccg ctgtcaggtc caccagcacc ctggtggcca agccattgcg 420
taccgcgtcc tcggccgtct ggcgcacaca atgatcggtg gcaataccga ccacatcgac 480
ctcatcgacg ccgcgttgcc gcagccaatt cagcagtggc gtgccgttct cgtcgactcc 540
ttcgaagccg ctgtacgctc cggtgtaggc acccttgtag aacaccgcct cgattgccga 600
cgtgtccaga ctgggatgga agtccgcgcc gggagtaccg ctgacgcaat gcggtggcca 660
cgacgaggaa tagtccggtg tgccggagaa gtggtcaccc gggtcgatgt ggaagtcctt 720
ggttgccacg acgtgatggt agtccgccgc ttcggccagg tagtcgctga tggcgcgggc 780
cagcgcggcg ccaccggtta ccgccagcga gccaccctcg cagaagtcgt tctgcacgtc 840
gacgatgatc aacgcccgca tacgtccacc atacgttcgg gcgactgccc gggcagtttg 900
cctaccgacg cggcagccac agatataggg tccatgacgc cgcgacgatc gcgaacatga 960
ccagctgagc ggcggccacc caaccggcgg gatagatcac gccggtgatg tagtgagcga 1020
caaatccgtc cggtgacaga ggtgtcatcg cggccttggt gcgagcccag cgctccaccc 1080
aggtcagcgg gcagtcgacc cgcttagcgg cgatgccgat cccccatatc accgccggaa 1140
catgcagcca catcgtgcgt c 1161
<210> 15
<211> 1161
<212> DNA
<213> 结核分枝杆菌
<400> 15
gacgcacgat gtggctgcat gttccggcgg tgatatgggg gatcggcatc gccgctaagc 60
gggtcgactg cccgctgacc tgggtggagc gctgggctcg caccaaggcc gcgatgacac 120
ctctgtcacc ggacggattt gtcgctcact acatcaccgg cgtgatctat cccgccggtt 180
gggtggccgc cgctcagctg gtcatgttcg cgatcgtcgc ggcgtcatgg accctatatc 240
tgtggctgcc gcgtcggtag gcaaactgcc cgggcagtcg cccgaacgta tggtggacgt 300
atgcgggcgt tgatcatcgt cgacgtgcag aacgacttct gcgagggtgg ctcgctggcg 360
gtaaccggtg gcgccgcgct ggcccgcgcc atcagcgact acctggccga agcggcggac 420
taccatcacg tcgtggcaac caaggacttc cacatcgacc cgggtgacca cttctccggc 480
acaccggact attcctcgtc gtggccaccg cattgcgtca gcggtactcc cggcgcggac 540
ttccatccca gtctggacac gtcggcaatc gaggcggtgt tctacaaggg tgcctacacc 600
ggagcgtaca gcggcttcga aggagtcgac gagaacggca cgccactgct gaattggctg 660
cggcaacgcg gcgtcgatga ggtcgatgtg gtcggtattg ccaccgatca ttgtgtgcgc 720
cagacggccg aggacgcggt acgcaatggc ttggccacca gggtgctggt ggacctgaca 780
gcgggtgtgt cggccgatac caccgtcgcc gcgctggagg agatgcgcac cgccagcgtc 840
gagttggttt gcagctcctg atggcaccgc cgaaccggga tgaactgttg gcggcggtgg 900
agcgctcgcc gcaagcggcc gccgcgcacg accgcgccgg ctgggtcggg ttgttcaccg 960
gtgacgcgcg ggtcgaagac ccggtgggtt cgcagccgca ggtggggcat gaggccatcg 1020
gccgcttcta cgacaccttc atcgggccgc gggatatcac gttccatcgc gatctggata 1080
tcgtctccgg cacggtggtg ctgcgcgatc tcgaactcga ggtcgcgatg gactcggctg 1140
tgacggtgtt cattcccgcc t 1161
<210> 16
<211> 186
<212> PRT
<213> 结核分枝杆菌
<400> 16
Met Arg Ala Leu Ile Ile Val Asp Val Gln Asn Asp Phe Cys Glu Gly
1 5 10 15
Gly Ser Leu Ala Val Thr Gly Gly Ala Ala Leu Ala Arg Ala Ile Ser
20 25 30
Asp Tyr Leu Ala Glu Ala Ala Asp Tyr His His Val Val Ala Thr Lys
35 40 45
Asp Phe His Ile Asp Pro Gly Asp His Phe Ser Gly Thr Pro Asp Tyr
50 55 60
Ser Ser Ser Trp Pro Pro His Cys Val Ser Gly Thr Pro Gly Ala Asp
65 70 75 80
Phe His Pro Ser Leu Asp Thr Ser Ala Ile Glu Ala Val Phe Tyr Lys
85 90 95
Gly Ala Tyr Thr Gly Ala Tyr Ser Gly Phe Glu Gly Val Asp Glu Asn
100 105 110
Gly Thr Pro Leu Leu Asn Trp Leu Arg Gln Arg Gly Val Asp Glu Val
115 120 125
Asp Val Val Gly Ile Ala Thr Asp His Cys Val Arg Gln Thr Ala Glu
130 135 140
Asp Ala Val Arg Asn Gly Leu Ala Thr Arg Val Leu Val Asp Leu Thr
145 150 155 160
Ala Gly Val Ser Ala Asp Thr Thr Val Ala Ala Leu Glu Glu Met Arg
165 170 175
Thr Ala Ser Val Glu Leu Val Cys Ser Ser
180 185
<210> 17
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 17
tcatggaccc tatatctgtg 20
<210> 18
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 18
atgaactgtt ggcggcggtg 20
<210> 19
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 19
acggatttgt cgctcactac 20
<210> 20
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 20
atctggatat cgtctccggc 20
<210> 21
<211> 1737
<212> DNA
<213> 结核分枝杆菌
<400> 21
ggccatgctc ttgatgcccc gttgtcgggg gcgtggccgt ttgttttgtc aggatatttc 60
taaatacctt tggctccctt ttccaaaggg agtgtttggg ttttgtttgg agagtttgat 120
cctggctcag gacgaacgct ggcggcgtgc ttaacacatg caagtcgaac ggaaaggtct 180
cttcggagat actcgagtgg cgaacgggtg agtaacacgt gggtgatctg ccctgcactt 240
cgggataagc ctgggaaact gggtctaata ccggatagga ccacgggatg catgtcttgt 300
ggtggaaagc gctttagcgg tgtgggatga gcccgcggcc tatcagcttg ttggtggggt 360
gacggcctac caaggcgacg acgggtagcc ggcctgagag ggtgtccggc cacactggga 420
ctgagatacg gcccagactc ctacgggagg cagcagtggg gaatattgca caatgggcgc 480
aagcctgatg cagcgacgcc gcgtggggga tgacggcctt cgggttgtaa acctctttca 540
ccatcgacga aggtccgggt tctctcggat tgacggtagg tggagaagaa gcaccggcca 600
actacgtgcc agcagccgcg gtaatacgta gggtgcgagc gttgtccgga attactgggc 660
gtaaagagct cgtaggtggt ttgtcgcgtt gttcgtgaaa tctcacggct taactgtgag 720
cgtgcgggcg atacgggcag actagagtac tgcaggggag actggaattc ctggtgtagc 780
ggtggaatgc gcagatatca ggaggaacac cggtggcgaa ggcgggtctc tgggcagtaa 840
ctgacgctga ggagcgaaag cgtggggagc gaacaggatt agataccctg gtagtccacg 900
ccgtaaacgg tgggtactag gtgtgggttt ccttccttgg gatccgtgcc gtagctaacg 960
cattaagtac cccgcctggg gagtacggcc gcaaggctaa aactcaaagg aattgacggg 1020
ggcccgcaca agcggcggag catgtggatt aattcgatgc aacgcgaaga accttacctg 1080
ggtttgacat gcacaggacg cgtctagaga taggcgttcc cttgtggcct gtgtgcaggt 1140
ggtgcatggc tgtcgtcagc tcgtgtcgtg agatgttggg ttaagtcccg caacgagcgc 1200
aacccttgtc tcatgttgcc agcacgtaat ggtggggact cgtgagagac tgccggggtc 1260
aactcggagg aaggtgggga tgacgtcaag tcatcatgcc ccttatgtcc agggcttcac 1320
acatgctaca atggccggta caaagggctg cgatgccgcg aggttaagcg aatccttaaa 1380
agccggtctc agttcggatc ggggtctgca actcgacccc gtgaagtcgg agtcgctagt 1440
aatcgcagat cagcaacgct gcggtgaata cgttcccggg ccttgtacac accgcccgtc 1500
acgtcatgaa agtcggtaac acccgaagcc agtggcctaa ccctcgggag ggagctgtcg 1560
aaggtgggat cggcgattgg gacgaagtcg taacaaggta gccgtaccgg aaggtgcggc 1620
tggatcacct cctttctaag gagcaccacg aaaacgcccc aactggtggg gcgtaggccg 1680
tgaggggttc ttgtctgtag tgggcgagag ccgggtgcat gacaacaaag ttggcca 1737
<210> 22
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 22
tggccgtttg ttttgtcagg at 22
<210> 23
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 23
tacagacaag aacccctcac gg 22
<210> 24
<211> 1773
<212> DNA
<213> 结核分枝杆菌
<400> 24
gatccggaca gatcgttcgc cggccgaaac cgacaaaatt atcgcggcga acgggcccgt 60
gggcaccgct cctctaaggg ctctcgttgg tcgcatgaag tgctggaagg atgcatcttg 120
gcagattccc gccagagcaa aacagccgct agtcctagtc cgagtcgccc gcaaagttcc 180
tcgaataact ccgtacccgg agcgccaaac cgggtctcct tcgctaagct gcgcgaacca 240
cttgaggttc cgggactcct tgacgtccag accgattcgt tcgagtggct gatcggttcg 300
ccgcgctggc gcgaatccgc cgccgagcgg ggtgatgtca acccagtggg tggcctggaa 360
gaggtgctct acgagctgtc tccgatcgag gacttctccg ggtcgatgtc gttgtcgttc 420
tctgaccctc gtttcgacga tgtcaaggca cccgtcgacg agtgcaaaga caaggacatg 480
acgtacgcgg ctccactgtt cgtcaccgcc gagttcatca acaacaacac cggtgagatc 540
aagagtcaga cggtgttcat gggtgacttc ccgatgatga ccgagaaggg cacgttcatc 600
atcaacggga ccgagcgtgt ggtggtcagc cagctggtgc ggtcgcccgg ggtgtacttc 660
gacgagacca ttgacaagtc caccgacaag acgctgcaca gcgtcaaggt gatcccgagc 720
cgcggcgcgt ggctcgagtt tgacgtcgac aagcgcgaca ccgtcggcgt gcgcatcgac 780
cgcaaacgcc ggcaaccggt caccgtgctg ctcaaggcgc tgggctggac cagcgagcag 840
attgtcgagc ggttcgggtt ctccgagatc atgcgatcga cgctggagaa ggacaacacc 900
gtcggcaccg acgaggcgct gttggacatc taccgcaagc tgcgtccggg cgagcccccg 960
accaaagagt cagcgcagac gctgttggaa aacttgttct tcaaggagaa gcgctacgac 1020
ctggcccgcg tcggtcgcta taaggtcaac aagaagctcg ggctgcatgt cggcgagccc 1080
atcacgtcgt cgacgctgac cgaagaagac gtcgtggcca ccatcgaata tctggtccgc 1140
ttgcacgagg gtcagaccac gatgaccgtt ccgggcggcg tcgaggtgcc ggtggaaacc 1200
gacgacatcg accacttcgg caaccgccgc ctgcgtacgg tcggcgagct gatccaaaac 1260
cagatccggg tcggcatgtc gcggatggag cgggtggtcc gggagcggat gaccacccag 1320
gacgtggagg cgatcacacc gcagacgttg atcaacatcc ggccggtggt cgccgcgatc 1380
aaggagttct tcggcaccag ccagctgagc caattcatgg accagaacaa cccgctgtcg 1440
gggttgaccc acaagcgccg actgtcggcg ctggggcccg gcggtctgtc acgtgagcgt 1500
gccgggctgg aggtccgcga cgtgcacccg tcgcactacg gccggatgtg cccgatcgaa 1560
acccctgagg ggcccaacat cggtctgatc ggctcgctgt cggtgtacgc gcgggtcaac 1620
ccgttcgggt tcatcgaaac gccgtaccgc aaggtggtcg acggcgtggt tagcgacgag 1680
atcgtgtacc tgaccgccga cgaggaggac cgccacgtgg tggcacaggc caattcgccg 1740
atcgatgcgg acggtcgctt cgtcgagccg cgc 1773
<210> 25
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 25
accgacaaaa ttatcgcggc ga 22
<210> 26
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 26
atcgatcggc gaattggcct gt 22
<210> 27
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 27
tcgccgcgat caaggagt 18
<210> 28
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 28
tggaggtccg cgacgtgca 19
<210> 29
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 29
aatatctggt ccgcttgcac ga 22
<210> 30
<211> 2717
<212> DNA
<213> 结核分枝杆菌
<400> 30
gacgtcgacg cgcggcgcag ctttatcacc cgcaacgcca aggatgttcg gttcctggat 60
gtctaacgca accctgcgtt cgattgcaaa cgaggaatag atgacagaca cgacgttgcc 120
gcctgacgac tcgctcgacc ggatcgaacc ggttgacatc gagcaggaga tgcagcgcag 180
ctacatcgac tatgcgatga gcgtgatcgt cggccgcgcg ctgccggagg tgcgcgacgg 240
gctcaagccc gtgcatcgcc gggtgctcta tgcaatgttc gattccggct tccgcccgga 300
ccgcagccac gccaagtcgg cccggtcggt tgccgagacc atgggcaact accacccgca 360
cggcgacgcg tcgatctacg acagcctggt gcgcatggcc cagccctggt cgctgcgcta 420
cccgctggtg gacggccagg gcaacttcgg ctcgccaggc aatgacccac cggcggcgat 480
gaggtacacc gaagcccggc tgaccccgtt ggcgatggag atgctgaggg aaatcgacga 540
ggagacagtc gatttcatcc ctaactacga cggccgggtg caagagccga cggtgctacc 600
cagccggttc cccaacctgc tggccaacgg gtcaggcggc atcgcggtcg gcatggcaac 660
caatatcccg ccgcacaacc tgcgtgagct ggccgacgcg gtgttctggg cgctggagaa 720
tcacgacgcc gacgaagagg agaccctggc cgcggtcatg gggcgggtta aaggcccgga 780
cttcccgacc gccggactga tcgtcggatc ccagggcacc gctgatgcct acaaaactgg 840
ccgcggctcc attcgaatgc gcggagttgt tgaggtagaa gaggattccc gcggtcgtac 900
ctcgctggtg atcaccgagt tgccgtatca ggtcaaccac gacaacttca tcacttcgat 960
cgccgaacag gtccgagacg gcaagctggc cggcatttcc aacattgagg accagtctag 1020
cgatcgggtc ggtttacgca tcgtcatcga gatcaagcgc gatgcggtgg ccaaggtggt 1080
gatcaataac ctttacaagc acacccagct gcagaccagc tttggcgcca acatgctagc 1140
gatcgtcgac ggggtgccgc gcacgctgcg gctggaccag ctgatccgct attacgttga 1200
ccaccaactc gacgtcattg tgcggcgcac cacctaccgg ctgcgcaagg caaacgagcg 1260
agcccacatt ctgcgcggcc tggttaaagc gctcgacgcg ctggacgagg tcattgcact 1320
gatccgggcg tcggagaccg tcgatatcgc ccgggccgga ctgatcgagc tgctcgacat 1380
cgacgagatc caggcccagg caatcctgga catgcagttg cggcgcctgg ccgcactgga 1440
acgccagcgc atcatcgacg acctggccaa aatcgaggcc gagatcgccg atctggaaga 1500
catcctggca aaacccgagc ggcagcgtgg gatcgtgcgc gacgaactcg ccgaaatcgt 1560
ggacaggcac ggcgacgacc ggcgtacccg gatcatcgcg gccgacggag acgtcagcga 1620
cgaggatttg atcgcccgcg aggacgtcgt tgtcactatc accgaaacgg gatacgccaa 1680
gcgcaccaag accgatctgt atcgcagcca gaaacgcggc ggcaagggcg tgcagggtgc 1740
ggggttgaag caggacgaca tcgtcgcgca cttcttcgtg tgctccaccc acgatttgat 1800
cctgttcttc accacccagg gacgggttta tcgggccaag gcctacgact tgcccgaggc 1860
ctcccggacg gcgcgcgggc agcacgtggc caacctgtta gccttccagc ccgaggaacg 1920
catcgcccag gtcatccaga ttcgcggcta caccgacgcc ccgtacctgg tgctggccac 1980
tcgcaacggg ctggtgaaaa agtccaagct gaccgacttc gactccaatc gctcgggcgg 2040
aatcgtggcg gtcaacctgc gcgacaacga cgagctggtc ggtgcggtgc tgtgttcggc 2100
cggcgacgac ctgctgctgg tctcggccaa cgggcagtcc atcaggttct cggcgaccga 2160
cgaggcgctg cggccaatgg gtcgtgccac ctcgggtgtg cagggcatgc ggttcaatat 2220
cgacgaccgg ctgctgtcgc tgaacgtcgt gcgtgaaggc acctatctgc tggtggcgac 2280
gtcagggggc tatgcgaaac gtaccgcgat cgaggaatac ccggtacagg gccgcggcgg 2340
taaaggtgtg ctgacggtca tgtacgaccg ccggcgcggc aggttggttg gggcgttgat 2400
tgtcgacgac gacagcgagc tgtatgccgt cacttccggc ggtggcgtga tccgcaccgc 2460
ggcacgccag gttcgcaagg cgggacggca gaccaagggt gttcggttga tgaatctggg 2520
cgagggcgac acactgttgg ccatcgcgcg caacgccgaa gaaagtggcg acgataatgc 2580
cgtggacgcc aacggcgcag accagacggg caattaatca ggctcgcccg acgacgatgc 2640
ggatcgcgta gcgatctgag gaggaatcgg gcagctaggc tcggcagccg ggtacgagtg 2700
ttaggagtcg gggtgac 2717
<210> 31
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 31
ctaacgcaac cctgcgttcg at 22
<210> 32
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 32
attcctcctc agatcgctac g 21
<210> 33
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 33
cgtcgtagtt agggatgaaa tc 22
<210> 34
<211> 2640
<212> DNA
<213> 结核分枝杆菌
<400> 34
gtcttgcggg gttatcgccg atgtcgactg tgctgttggc gaggcaccct gtctgacggc 60
ctcggaccat aacggcttcc tgttggacga ggcggaggtc atctactggg gtctatgtcc 120
tgattgttcg atatccgaca cttcgcgatc acatccgtga tcacagcccg ataacaccaa 180
ctcctggaag gaatgctgtg cccgagcaac acccacccat tacagaaacc accaccggag 240
ccgctagcaa cggctgtccc gtcgtgggtc atatgaaata ccccgtcgag ggcggcggaa 300
accaggactg gtggcccaac cggctcaatc tgaaggtact gcaccaaaac ccggccgtcg 360
ctgacccgat gggtgcggcg ttcgactatg ccgcggaggt cgcgaccatc gacgttgacg 420
ccctgacgcg ggacatcgag gaagtgatga ccacctcgca gccgtggtgg cccgccgact 480
acggccacta cgggccgctg tttatccgga tggcgtggca cgctgccggc acctaccgca 540
tccacgacgg ccgcggcggc gccgggggcg gcatgcagcg gttcgcgccg cttaacagct 600
ggcccgacaa cgccagcttg gacaaggcgc gccggctgct gtggccggtc aagaagaagt 660
acggcaagaa gctctcatgg gcggacctga ttgttttcgc cggcaactgc gcgctggaat 720
cgatgggctt caagacgttc gggttcggct tcggccgggt cgaccagtgg gagcccgatg 780
aggtctattg gggcaaggaa gccacctggc tcggcgatga gcgttacagc ggtaagcggg 840
atctggagaa cccgctggcc gcggtgcaga tggggctgat ctacgtgaac ccggaggggc 900
cgaacggcaa cccggacccc atggccgcgg cggtcgacat tcgcgagacg tttcggcgca 960
tggccatgaa cgacgtcgaa acagcggcgc tgatcgtcgg cggtcacact ttcggtaaga 1020
cccatggcgc cggcccggcc gatctggtcg gccccgaacc cgaggctgct ccgctggagc 1080
agatgggctt gggctggaag agctcgtatg gcaccggaac cggtaaggac gcgatcacca 1140
gcggcatcga ggtcgtatgg acgaacaccc cgacgaaatg ggacaacagt ttcctcgaga 1200
tcctgtacgg ctacgagtgg gagctgacga agagccctgc tggcgcttgg caatacaccg 1260
ccaaggacgg cgccggtgcc ggcaccatcc cggacccgtt cggcgggcca gggcgctccc 1320
cgacgatgct ggccactgac ctctcgctgc gggtggatcc gatctatgag cggatcacgc 1380
gtcgctggct ggaacacccc gaggaattgg ccgacgagtt cgccaaggcc tggtacaagc 1440
tgatccaccg agacatgggt cccgttgcga gataccttgg gccgctggtc cccaagcaga 1500
ccctgctgtg gcaggatccg gtccctgcgg tcagccacga cctcgtcggc gaagccgaga 1560
ttgccagcct taagagccag atccgggcat cgggattgac tgtctcacag ctagtttcga 1620
ccgcatgggc ggcggcgtcg tcgttccgtg gtagcgacaa gcgcggcggc gccaacggtg 1680
gtcgcatccg cctgcagcca caagtcgggt gggaggtcaa cgaccccgac ggggatctgc 1740
gcaaggtcat tcgcaccctg gaagagatcc aggagtcatt caactccgcg gcgccgggga 1800
acatcaaagt gtccttcgcc gacctcgtcg tgctcggtgg ctgtgccgcc atagagaaag 1860
cagcaaaggc ggctggccac aacatcacgg tgcccttcac cccgggccgc acggatgcgt 1920
cgcaggaaca aaccgacgtg gaatcctttg ccgtgctgga gcccaaggca gatggcttcc 1980
gaaactacct cggaaagggc aacccgttgc cggccgagta catgctgctc gacaaggcga 2040
acctgcttac gctcagtgcc cctgagatga cggtgctggt aggtggcctg cgcgtcctcg 2100
gcgcaaacta caagcgctta ccgctgggcg tgttcaccga ggcctccgag tcactgacca 2160
acgacttctt cgtgaacctg ctcgacatgg gtatcacctg ggagccctcg ccagcagatg 2220
acgggaccta ccagggcaag gatggcagtg gcaaggtgaa gtggaccggc agccgcgtgg 2280
acctggtctt cgggtccaac tcggagttgc gggcgcttgt cgaggtctat ggcgccgatg 2340
acgcgcagcc gaagttcgtg caggacttcg tcgctgcctg ggacaaggtg atgaacctcg 2400
acaggttcga cgtgcgctga ttcgggttga tcggccctgc ccgccgatca accacaaccc 2460
gccgcagcac cccgcgagct gaccggctcg cggggtgctg gtgtttgccc ggcgcgattt 2520
gtcagacccc gcgtgcatgg tggtcgcagg cacgacgaga cggggatgac gagacgggga 2580
tgaggagaaa gggcgccgaa atgtgctgga tgtgcgatca cccggaagcc accgccgagg 2640
<210> 35
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 35
tcgcgatcac atccgtgatc ac 22
<210> 36
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 36
atgcacgcgg ggtctgacaa at 22
<210> 37
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 37
acaccaactc ctggaaggaa t 21
<210> 38
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 38
ttacagcggt aagcgggatc t 21
<210> 39
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 39
ttggcgaact cgtcggccaa tt 22
<210> 40
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 40
attatattca gtatggaaag aa 22
<210> 41
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 41
atatatccac agcttgttc 19
<210> 42
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 42
gatccactag catctttatt 20
<210> 43
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 43
gtacgtctct catttgtt 18
<210> 44
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 44
aaggcatttt cagaaagat 19
<210> 45
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 45
gtcgttttta aactattcag c 21
<210> 46
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 46
accatttgaa tggatgtc 18
<210> 47
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 47
ttgattcttt gtgatgtatg t 21
<210> 48
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 48
aatgatgact aattcacaag 20
<210> 49
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 49
ataattctca tccatcagc 19
<210> 50
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 50
aaatacacca agacaacata 20
<210> 51
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 51
catgaaggac aagctaaat 19
<210> 52
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 52
attttgaatg gatgtcaatc 20
<210> 53
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 53
gtgattgtga aagaaagct 19
<210> 54
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 54
ctgattcgaa atggaaga 18
<210> 55
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 55
cgtgtggttt gactatat 18
<210> 56
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 56
gatcaagtgc ataaaaacat 20
<210> 57
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 57
atagagtcct acagacttt 19
<210> 58
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 58
tgacgaacct gaattaag 18
<210> 59
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 59
gtacggataa caaatagtag 20
<210> 60
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 60
taattctatt aaccatgaag ac 22
<210> 61
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 61
gcatctgatc tcattattg 19
<210> 62
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 62
catacttttg attaacagca 20
<210> 63
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 63
ttaatgcact caaatgca 18
<210> 64
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 64
aataatcact cactgagtg 19
<210> 65
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 65
aatatgagat cttcgatctc 20
<210> 66
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 66
acaagaagtg cttatgag 18
<210> 67
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 67
ttccttaatt gtcgtactc 19
<210> 68
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 68
ctgagtgaca tcaaaatca 19
<210> 69
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 69
gcagctgttt gaaattttc 19
<210> 70
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 70
aagatgaatc caaaccaa 18
<210> 71
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 71
gtatcagctt ttcctgaa 18
<210> 72
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 72
gatagtgttg tttcatgg 18
<210> 73
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 73
ctaaaattgc gaaagcttat a 21
<210> 74
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 74
atattgaaag atgagcctt 19
<210> 75
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 75
tagtttttta ctccaactct a 21
<210> 76
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 76
acaaagacat aatggattct 20
<210> 77
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 77
ggtgtttttt atcatcaaat aag 23
<210> 78
<211> 960
<212> DNA
<213> 结核分枝杆菌
<400> 78
gacggatttg tcgctcacta catcaccggc gtgatctatc ccgccggttg ggtggccgcc 60
gctcagctgg tcatgttcgc gatcgtcgcg gcgtcatgga ccctatatct gtggctgccg 120
cgtcggtagg caaactgccc gggcagtcgc ccgaacgtat ggtggacgta tgcgggcgtt 180
gatcatcgtc gacgtgcaga acgacttctg cgagggtggc tcgctggcgg taaccggtgg 240
cgccgcgctg gcccgcgcca tcagcgacta cctggccgaa gcggcggact accatcacgt 300
cgtggcaacc aaggacttcc acatcgaccc gggtgaccac ttctccggca caccggacta 360
ttcctcgtcg tggccaccgc attgcgtcag cggtactccc ggcgcggact tccatcccag 420
tctggacacg tcggcaatcg aggcggtgtt ctacaagggt gcctacaccg gagcgtacag 480
cggcttcgaa ggagtcgacg agaacggcac gccactgctg aattggctgc ggcaacgcgg 540
cgtcgatgag gtcgatgtgg tcggtattgc caccgatcat tgtgtgcgcc agacggccga 600
ggacgcggta cgcaatggct tggccaccag ggtgctggtg gacctgacag cgggtgtgtc 660
ggccgatacc accgtcgccg cgctggagga gatgcgcacc gccagcgtcg agttggtttg 720
cagctcctga tggcaccgcc gaaccgggat gaactgttgg cggcggtgga gcgctcgccg 780
caagcggccg ccgcgcacga ccgcgccggc tgggtcgggt tgttcaccgg tgacgcgcgg 840
gtcgaagacc cggtgggttc gcagccgcag gtggggcatg aggccatcgg ccgcttctac 900
gacaccttca tcgggccgcg ggatatcacg ttccatcgcg atctggatat cgtctccggc 960
<210> 79
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 79
gacggatttg tcgctcac 18
<210> 80
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 80
agccaccctc gcagaa 16
<210> 81
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 81
catcgtcgac gtgcagaa 18
<210> 82
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 82
tgtccagact gggatggaa 19
<210> 83
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 83
attgcgtcag cggtact 17
<210> 84
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 84
tggccaagcc attgcgta 18
<210> 85
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 85
atcattgtgt gcgccaga 18
<210> 86
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的说明:合成引物
<400> 86
caacagttca tcccggtt 18
<210> 87
<211> 221
<212> DNA
<213> 结核分枝杆菌
<400> 87
gacggatttg tcgctcacta catcaccggc gtgatctatc ccgccggttg ggtggccgcc 60
gctcagctgg tcatgttcgc gatcgtcgcg gcgtcatgga ccctatatct gtggctgccg 120
cgtcggtagg caaactgccc gggcagtcgc ccgaacgtat ggtggacgta tgcgggcgtt 180
gatcatcgtc gacgtgcaga acgacttctg cgagggtggc t 221
<210> 88
<211> 245
<212> DNA
<213> 结核分枝杆菌
<400> 88
catcgtcgac gtgcagaacg acttctgcga gggtggctcg ctggcggtaa ccggtggcgc 60
cgcgctggcc cgcgccatca gcgactacct ggccgaagcg gcggactacc atcacgtcgt 120
ggcaaccaag gacttccaca tcgacccggg tgaccacttc tccggcacac cggactattc 180
ctcgtcgtgg ccaccgcatt gcgtcagcgg tactcccggc gcggacttcc atcccagtct 240
ggaca 245
<210> 89
<211> 246
<212> DNA
<213> 结核分枝杆菌
<400> 89
attgcgtcag cggtactccc ggcgcggact tccatcccag tctggacacg tcggcaatcg 60
aggcggtgtt ctacaagggt gcctacaccg gagcgtacag cggcttcgaa ggagtcgacg 120
agaacggcac gccactgctg aattggctgc ggcaacgcgg cgtcgatgag gtcgatgtgg 180
tcggtattgc caccgatcat tgtgtgcgcc agacggccga ggacgcggta cgcaatggct 240
tggcca 246
<210> 90
<211> 184
<212> DNA
<213> 结核分枝杆菌
<400> 90
atcattgtgt gcgccagacg gccgaggacg cggtacgcaa tggcttggcc accagggtgc 60
tggtggacct gacagcgggt gtgtcggccg ataccaccgt cgccgcgctg gaggagatgc 120
gcaccgccag cgtcgagttg gtttgcagct cctgatggca ccgccgaacc gggatgaact 180
gttg 184

Claims (29)

1.用于测定微生物的目标基因或基因组的完整序列的方法,其中所述目标基因或基因组长度大于1 Mb,所述方法包括:
通过在含水混合物中进行所述目标的单一聚合酶链式反应(PCR)而产生一系列扩增子,所述含水混合物含有热稳定聚合酶;包含约等量的dATP、dCTP、dGTP和dTTP的脱氧核苷酸三磷酸的混合物;螯合剂;盐;缓冲剂;稳定剂;和多个引物对,其中所述多个引物对中的各引物具有类似的退火温度,从而使得通过使用所述引物对,在类似PCR条件下扩增目标序列的重叠区段并且单一PCR扩增产生数百个扩增产物,其序列包括所述目标序列;
通过半导体测序来测序产生的一系列扩增子中的每一个,和
关联扩增子的序列,并且构建所述目标的完整序列。
2.权利要求1的方法,其中所述多个引物对中的各引物包含长度为15至25个核酸且具有约25%-50%的GC含量的引物。
3.权利要求2的方法,其中所述多个引物对中的各引物包含长度为16至24个核酸且具有约25%-45%的GC含量的引物。
4.权利要求1的方法,其中设计各引物对以PCR扩增扩增子,并且PCR扩增的扩增子的集合涵盖所述目标的完整序列的重叠区段。
5.权利要求1的方法,其中所述多个引物对与所述目标杂交,并且以约500到2,000个核苷酸的间隔沿所述目标间隔开。
6.权利要求1的方法,其中所述微生物是病毒、细菌、真菌、寄生物或细胞。
7.权利要求6的方法,其中所述病毒是流感病毒。
8.权利要求6的方法,其中所述细菌是结核分枝杆菌(Mycobacterium tuberculosis)。
9.用于在一个步骤中测定核酸目标序列的方法,其中所述核酸目标长度大于1 Mb,所述方法包括:
对所述核酸目标进行聚合酶链式反应,以产生一系列扩增子,其中所述反应包含:热稳定聚合酶;包含约等量的dATP、dCTP、dGTP和dTTP的脱氧核苷酸三磷酸的混合物;螯合剂;盐;缓冲剂;稳定剂;和多个引物对,其中所述多个引物对中的各引物具有5℃内的退火温度,从而使得通过使用所述引物对,在类似PCR条件下扩增目标序列的重叠区段并且单一PCR扩增产生数百个扩增产物,其序列包括所述目标序列;
通过半导体测序来测序产生的一系列扩增子中的每一个,和
关联扩增子的序列,并且构建所述核酸目标的序列。
10.权利要求9的方法,其中所述多个引物对中的各引物长度为15至25个核酸且具有约25%-50%的GC含量。
11.权利要求9的方法,其中所述核酸目标长度大于5 Mb。
12.权利要求10的方法,其中所述多个引物对中的各引物长度为16至24个核苷酸,具有约28-35%的GC含量,和所述多个引物对中其它各引物的3℃内的退火温度。
13.权利要求9的方法,其中设计各引物对以PCR扩增代表所述核酸目标的序列的部分的扩增子,并且PCR扩增的扩增子的集合代表所述目标的完整序列的重叠部分。
14.权利要求9的方法,其中所述多个引物对以长度为约800至1,500个核苷酸的间隔与所述目标杂交。
15.权利要求9或权利要求10的方法,其中所述核酸目标包括病毒、细菌、真菌或寄生物的序列。
16.权利要求15的方法,其中所述病毒是流感病毒。
17.权利要求15的方法,其中所述细菌是结核分枝杆菌。
18.包含多对核酸引物的混合物,其中,在使所述混合物连同核酸目标进行聚合酶链式反应时,所述核酸引物在约相同温度与所述核酸目标杂交,并生成扩增子的集合,其中所述集合中的各扩增子长度为约500至2,000个核苷酸,从而使得通过使用所述核酸引物,在类似PCR条件下扩增目标序列的重叠区段并且单一PCR扩增产生扩增子集合,其代表所述目标的整个序列,其中所述目标序列长度大于1 Mb。
19.权利要求18的混合物,其中所述多对核酸引物的各引物长度为15至25个核酸且具有约25%-50%的GC含量。
20.权利要求19的混合物,其中所述多对核酸引物的各引物长度为约16至24个核苷酸且具有约25%-45%的GC含量。
21.权利要求18的混合物,其中所述多对核酸引物的各引物具有其它各引物的5℃内的对目标的退火温度。
22.权利要求21的混合物,其中所述多对核酸引物的各引物具有其它各引物的3℃内的对目标的退火温度。
23.权利要求18的混合物,其中所述目标是微生物的基因或基因组。
24.权利要求23的混合物,其中所述基因是赋予所述微生物的抗生素抗性的基因。
25.权利要求23的混合物,其中所述微生物是病毒、细菌、寄生物或真菌。
26.权利要求25的方法,其中所述病毒是流感病毒。
27.权利要求25的方法,其中所述细菌是结核分枝杆菌。
28.权利要求18的混合物,其含有热稳定聚合酶;包含约等量的dATP、dCTP、dGTP和dTTP的脱氧核苷酸三磷酸的混合物;螯合剂;盐;缓冲剂;稳定剂和无核酸酶的水。
29.权利要求18的混合物,其中所述核酸引物不会自杂交。
CN201810225084.7A 2012-05-09 2013-05-09 离子激流基因组测序 Pending CN108374042A (zh)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201261644876P 2012-05-09 2012-05-09
US61/644876 2012-05-09
US201261646060P 2012-05-11 2012-05-11
US61/646060 2012-05-11
US201261695960P 2012-08-31 2012-08-31
US61/695960 2012-08-31
US201261737250P 2012-12-14 2012-12-14
US61/737250 2012-12-14
CN201380024174.5A CN104508142A (zh) 2012-05-09 2013-05-09 离子激流基因组测序

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201380024174.5A Division CN104508142A (zh) 2012-05-09 2013-05-09 离子激流基因组测序

Publications (1)

Publication Number Publication Date
CN108374042A true CN108374042A (zh) 2018-08-07

Family

ID=49548886

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201380024174.5A Pending CN104508142A (zh) 2012-05-09 2013-05-09 离子激流基因组测序
CN201810225084.7A Pending CN108374042A (zh) 2012-05-09 2013-05-09 离子激流基因组测序

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201380024174.5A Pending CN104508142A (zh) 2012-05-09 2013-05-09 离子激流基因组测序

Country Status (7)

Country Link
US (1) US9365904B2 (zh)
EP (2) EP3428291A3 (zh)
CN (2) CN104508142A (zh)
AU (2) AU2013259495B2 (zh)
CA (2) CA2976934C (zh)
WO (1) WO2013169998A1 (zh)
ZA (1) ZA201407053B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106170560A (zh) * 2013-10-29 2016-11-30 长角牛疫苗和诊断有限责任公司 下一代基因组测序方法
CN112481402A (zh) * 2020-12-29 2021-03-12 上海国际旅行卫生保健中心(上海海关口岸门诊部) 一种基于Sanger测序的结核分枝杆菌MLST分型检测用引物组及其应用

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9598737B2 (en) 2012-05-09 2017-03-21 Longhorn Vaccines And Diagnostics, Llc Next generation genomic sequencing methods
US9914979B2 (en) 2013-03-04 2018-03-13 Fry Laboratories, LLC Method and kit for characterizing microorganisms
WO2017008835A1 (en) * 2015-07-13 2017-01-19 Siemens Healthcare Gmbh Genetic testing for predicting resistance of acinetobacter species against antimicrobial agents
GB201902887D0 (en) * 2019-03-04 2019-04-17 St Georges Hospital Medical School Detection and antibiotic resistance profiling of microorganisms

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5550040A (en) * 1993-06-23 1996-08-27 Hoffman-La Roche Inc. Method, reagents and kits for the detection of Neisseria gonorrhoeae
WO2003080870A1 (en) * 2002-03-20 2003-10-02 Handylab Polynucleotide primers and probes for rapid detection of group b streptococcus (gbs)
WO2005001128A2 (en) * 2003-04-11 2005-01-06 University Of Florida Research Foundation, Inc. Materials and methods for producing dna libraries and detecting and identifying microorganisms
US20090233292A1 (en) * 2007-11-30 2009-09-17 Daniele Podini Method and kit for identification of genetic polymorphisms
US20110281776A1 (en) * 2010-05-06 2011-11-17 Ibis Biosciences, Inc. Integrated sample preparation systems and stabilized enzyme mixtures
CN102250924A (zh) * 2010-05-17 2011-11-23 中国疾病预防控制中心病毒病预防控制所 盖塔病毒全基因组序列、扩增方法及引物
US20120034685A1 (en) * 2010-08-06 2012-02-09 Tandem Diagnostics, Inc. Assay systems for determination of source contribution in a sample
WO2012037531A1 (en) * 2010-09-16 2012-03-22 Gen-Probe Incorporated Capture probes immobilizable via l-nucleotide tail

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5633131A (en) 1992-04-30 1997-05-27 Institut Pasteur Rapid detection of isoniazid resistance in mycobacterium tuberculosis probes for selecting nucleic acid encoding isoniazid resistance, and methods and kits
CA2604095A1 (en) * 2005-04-12 2006-10-19 454 Life Sciences Corporation Methods for determining sequence variants using ultra-deep sequencing
US8652782B2 (en) 2006-09-12 2014-02-18 Longhorn Vaccines & Diagnostics, Llc Compositions and methods for detecting, identifying and quantitating mycobacterial-specific nucleic acids
US9149473B2 (en) * 2006-09-14 2015-10-06 Ibis Biosciences, Inc. Targeted whole genome amplification method for identification of pathogens
US8691510B2 (en) * 2008-11-07 2014-04-08 Sequenta, Inc. Sequence analysis of complex amplicons
ES2402262T3 (es) 2010-08-13 2013-04-30 Multivac Sepp Haggenmüller Gmbh & Co Kg Procedimiento para el envasado, máquina de envasado de embutición profunda y envase
WO2012044956A1 (en) * 2010-10-01 2012-04-05 Ibis Biosciences, Inc. Targeted genome amplification methods
WO2012149438A1 (en) * 2011-04-28 2012-11-01 Life Technologies Corporation Methods and compositions for multiplex pcr

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5550040A (en) * 1993-06-23 1996-08-27 Hoffman-La Roche Inc. Method, reagents and kits for the detection of Neisseria gonorrhoeae
WO2003080870A1 (en) * 2002-03-20 2003-10-02 Handylab Polynucleotide primers and probes for rapid detection of group b streptococcus (gbs)
WO2005001128A2 (en) * 2003-04-11 2005-01-06 University Of Florida Research Foundation, Inc. Materials and methods for producing dna libraries and detecting and identifying microorganisms
US20090233292A1 (en) * 2007-11-30 2009-09-17 Daniele Podini Method and kit for identification of genetic polymorphisms
US20110281776A1 (en) * 2010-05-06 2011-11-17 Ibis Biosciences, Inc. Integrated sample preparation systems and stabilized enzyme mixtures
CN102250924A (zh) * 2010-05-17 2011-11-23 中国疾病预防控制中心病毒病预防控制所 盖塔病毒全基因组序列、扩增方法及引物
US20120034685A1 (en) * 2010-08-06 2012-02-09 Tandem Diagnostics, Inc. Assay systems for determination of source contribution in a sample
WO2012037531A1 (en) * 2010-09-16 2012-03-22 Gen-Probe Incorporated Capture probes immobilizable via l-nucleotide tail

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
L. T. DAUM ET AL.: ""Characterization of multi-drug resistant Mycobacterium tuberculosis from immigrants residing in the USA using Ion Torrent full-gene sequencing"", 《EPIDEMIOL. INFECT.》 *
LUKE T. DAUM ET AL.: ""Next-Generation Ion Torrent Sequencing of Drug Resistance Mutations in Mycobacterium tuberculosis Strains"", 《JOURNAL OF CLINICAL MICROBIOLOGY》 *
吕建新等: "《检验与临床诊断-分子诊断学分册》", 31 May 2010, 人民军医出版社 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106170560A (zh) * 2013-10-29 2016-11-30 长角牛疫苗和诊断有限责任公司 下一代基因组测序方法
CN112481402A (zh) * 2020-12-29 2021-03-12 上海国际旅行卫生保健中心(上海海关口岸门诊部) 一种基于Sanger测序的结核分枝杆菌MLST分型检测用引物组及其应用
CN112481402B (zh) * 2020-12-29 2024-03-22 上海国际旅行卫生保健中心(上海海关口岸门诊部) 一种基于Sanger测序的结核分枝杆菌MLST分型检测用引物组及其应用

Also Published As

Publication number Publication date
AU2013259495B2 (en) 2017-06-01
AU2017203556B2 (en) 2019-08-01
CN104508142A (zh) 2015-04-08
EP2847352A4 (en) 2015-11-25
CA2976934C (en) 2019-09-03
US20130302789A1 (en) 2013-11-14
AU2017203556A1 (en) 2017-06-15
AU2013259495A1 (en) 2014-11-06
CA2872479A1 (en) 2013-11-14
ZA201407053B (en) 2016-10-26
EP2847352A1 (en) 2015-03-18
EP3428291A2 (en) 2019-01-16
CA2976934A1 (en) 2013-11-14
US9365904B2 (en) 2016-06-14
EP3428291A3 (en) 2019-02-13
WO2013169998A1 (en) 2013-11-14
CA2872479C (en) 2017-11-28

Similar Documents

Publication Publication Date Title
Widmer Genetic heterogeneity and PCR detection of Cryptosporidium parvum
JP2022501039A (ja) 核酸を検出する方法
CN106170560A (zh) 下一代基因组测序方法
CN107075509A (zh) 通过数字化转座子的单倍体组测定
CN108374042A (zh) 离子激流基因组测序
CA2964265A1 (en) Polymerase chain reaction primers and probes for mycobacterium tuberculosis
JP2022071064A (ja) 次世代シークエンシングのための高分子量dnaサンプル追跡タグ
EP2504433A2 (en) Allelic ladder loci
AU2014279672A1 (en) Improved NGS workflow
CN101182585B (zh) 一种鉴别hbv基因突变类型的方法及其专用芯片与试剂盒
EP3286332A2 (en) Experimentally validated sets of gene specific primers for use in multiplex applications
CN105378109B (zh) 使用尿嘧啶-dna-n-糖基化酶使错误最小化
JP2021521878A (ja) 遺伝子複合体プ−ルのpcrに用いる複数の特異//非特異的プライマー
CN112384608A (zh) 细菌捕获测序平台及其设计、构建和使用方法
WO2015189685A2 (en) Improved ngs workflow
AU2003241562B9 (en) Molecular identification of Aspergillus species
Hill et al. The polymerase chain reaction in molecular and micro-biology
US11655510B2 (en) Experimentally validated sets of gene specific primers for use in multiplex applications
JP6756835B2 (ja) ウイルス性出血性敗血症ウイルスの遺伝子変異の検出方法
KR20220164745A (ko) 병원체 진단 시험
CN113151599A (zh) 用于检测新型冠状病毒的引物组、试剂、试剂盒及检测方法
KR101644776B1 (ko) 참돔 이리도바이러스 검출용 유전자 마커, 및 이를 이용한 원인바이러스의 검출 방법
WO2022258056A1 (en) Methods and compositions for identifying viral sequences
JP5110423B2 (ja) 微生物の識別方法、及び該方法に使用するプライマー並びに識別キット
KR101704121B1 (ko) 반코마이신 불균질 내성 황색포도알균 st5 클론타입 판별용 바이오마커 조성물 및 이를 이용한 판별용 키트

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180807