CN111849965B - 用于减少偏向性的多核苷酸衔接子设计 - Google Patents

用于减少偏向性的多核苷酸衔接子设计 Download PDF

Info

Publication number
CN111849965B
CN111849965B CN202010338716.8A CN202010338716A CN111849965B CN 111849965 B CN111849965 B CN 111849965B CN 202010338716 A CN202010338716 A CN 202010338716A CN 111849965 B CN111849965 B CN 111849965B
Authority
CN
China
Prior art keywords
sequence
strand
site
rna
polynucleotide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010338716.8A
Other languages
English (en)
Other versions
CN111849965A (zh
Inventor
管胜昔
S·马奎尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New England Biolabs Inc
Original Assignee
New England Biolabs Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by New England Biolabs Inc filed Critical New England Biolabs Inc
Publication of CN111849965A publication Critical patent/CN111849965A/zh
Application granted granted Critical
Publication of CN111849965B publication Critical patent/CN111849965B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1096Processes for the isolation, preparation or purification of DNA or RNA cDNA Synthesis; Subtracted cDNA library construction, e.g. RT, RT-PCR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/30Nucleotides
    • C12P19/34Polynucleotides, e.g. nucleic acids, oligoribonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/191Modifications characterised by incorporating an adaptor

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Medicinal Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明的发明名称为用于减少偏向性的多核苷酸衔接子设计。提供了组合物和使用方法,该组合物和使用方法允许衔接子与小RNA的有效连接等。组合物的实施方式包括用作3′衔接子的部分双链多核苷酸,其包含位于单链区和双链区之间的可切割的接头。在连接3′衔接子后,通过切割可切割的接头释放单链区。

Description

用于减少偏向性的多核苷酸衔接子设计
交叉引用
本申请要求2019年4月26日提交的美国临时申请号62/839,191和2020年2月20日提交的美国申请号16/796,113的优先权,在此将其整体引入作为参考。
背景技术
衔接子与RNA文库中的一些单链RNA(而不与其他)的优先连接导致文库组成的不准确概况分析(profile)。为了减少偏向性(bias),可以使用具有充当夹板(splint)的单链延伸部的衔接子。然而,这种衔接子可以因其相对于靶RNA的过量浓度而容易彼此部分连接。当靶RNA很小时,衔接子二聚体的形成特别成问题,因为连接假象如衔接子二聚体可能不容易基于大小而与靶RNA区分。因此,诸如电泳的标准尺寸分离技术是无效的。因此,目前的方法受到低灵敏度和高偏向性的挑战,限制了其捕获细胞小RNA群体的准确表示的能力。一些类别的小RNA(sRNA)在3’端核苷酸的核糖部分上包含2’-O-甲基化(2’OMe)修饰。这种修饰稳定化sRNA,并且存在于内源性siRNA、植物miRNA和动物piRNA中(Ghildiyal等(2009)Nature Reviews Genetics,10,94–108)。2’OMe修饰严重影响与单链DNA(ssDNA)衔接子的连接效率,以及模板切换方法所需的3’多腺苷酸化或多尿苷化的效率(Munafo等,(2010)RNA,16,2537–2552)。与结构和序列偏向性相结合,这种修饰可使2’OMe修饰的RNA的测序和发现困难,并且测序文库对修饰的sRNA具有偏见(Dard-Dascot等,(2018)BMC Genomics,19,118)。sRNA是基因表达的重要调节因子并且涉及人类发育和疾病。下一代测序(NGS)允许sRNA的可伸缩、基因组范围的研究,条件是衍生自sRNA群体的文库制备物代表组分RNA。现有的单链衔接子的连接效率和连接偏向性根据靶标和衔接子的序列而变化。不同的衔接子序列可以引起文库内容的巨大变化(Jayaprakash等(2011)Nucleic Acids Research,39,e141–e141;Baran-Gale等,(2015),Frontiers in Genetics,6,352;和McLaughlin等,(1982),125,639–643)。
发明内容
在此提供了具有上链(top strand)和下链(bottom strand)的部分双链多核苷酸分子等,该部分双链多核苷酸分子可以用作3’衔接子并且由此可以被称为随机化夹板衔接子(splint adapter)。这种多核苷酸分子的特征在于上链中的第一序列。下链的特征在于与第一序列互补的第二序列,和作为第二序列的3’并且包括至少4个简并核苷酸的序列的第三序列;以及位点特异性可切割的接头,该接头可以是序列、核苷酸或键,其中可切割的接头在第二和第三序列之间的连接处或附近。充当3’衔接子的部分双链多核苷酸的实施方式在图1中作为衔接子2示例。如示,在上链的5’端的核苷酸与下链碱基配对,使得双链多核苷酸分子具有下链的3’单链延伸部(或“伸出部”),该3’单链延伸部包含简并核苷酸。3’衔接子的上链可以经由通过3’衔接子的下链夹板固定(夹持的,splinted)的连接而连接至靶多核苷酸,如图1中所示。在一些实施方式中,该3’衔接子可与5’衔接子结合使用,5’衔接子的实例在图1中作为衔接子1也被示例。如示,5’衔接子可以是具有上链和下链的部分双链多核苷酸分子,其中上链包含第一序列,并且下链包含:与第一序列互补的第二序列和作为第二序列的5’并且包含至少4个简并核苷酸的序列的第三序列。在此衔接子中,上链3’端处的核苷酸与下链碱基配对,使得该双链多核苷酸分子具有下链的包含简并核苷酸的5’单链延伸部(或“伸出部”)。5’衔接子的上链经由通过5’衔接子的下链夹板固定的连接而连接至靶多核苷酸,如图1所示。如图1所示,该方法可涉及在位点特异性可切割的序列、核苷酸或键处切割3’多核苷酸衔接子的下链,以从连接产物去除简并序列,并且留下杂交至连接产物的第二序列。当靶多核苷酸是RNA时,第二序列的3’端然后可以通过逆转录酶延伸,从而复制靶RNA以形成cDNA。
衔接子具有改进的特性,包括其通常不自我连接,但可以有效地连接至靶多核苷酸如靶RNA,并且在结合RNA文库中基本上所有的RNA中显示出偏向性减少并且无偏好性。已经观察到与sRNA一起使用的这些衔接子组合物的实施方式的优点包括:与利用单链衔接子与sRNA连接的文库相比,来源于细胞样品的靶向sRNA的量增加(在用于测序的文库中表示)、由于衔接子-二聚体形成被防止而背景降低、以及RNA的表示改善——其中在来源于细胞样品的群体中的偏向性降低。
在此描述了衔接子组合物,其包括部分双链的多核苷酸分子,该部分双链的多核苷酸分子可以是DNA或RNA,并且可以由单条多核苷酸链(如发夹或环结构)形成。可选地,多核苷酸分子可以由两条多核苷酸链形成。部分双链多核苷酸分子的实施方式包括上链和下链,其中上链与下链的一部分互补以形成双链区。下链具有非互补3’单链延伸部,其包含随机的至少4个简并核苷酸的序列。下链还在双链区与单链延长部之间的连接处或附近具有位点特异性可切割的序列或核苷酸,适于导致通过切割而去除单链延长部。部分双链多核苷酸分子可以在部分双链多核苷酸分子的群体中,其中该群体中的各多核苷酸在其3’单链延伸部内具有至少4个随机简并核苷酸的不同序列。具有3’单链延伸部的多核苷酸分子可用作3’衔接子。3’衔接子可以任选地包含在下链的3’端处的阻断部分(blocking moiety)和/或在上链上的磷酸化或预腺苷酸化的5’端。
另一实施方式提供了适于RNA文库的衔接子,其包括部分双链多核苷酸分子,该部分双链多核苷酸分子包括具有第一核酸链和第二互补核酸链的双链区域,其中:(i)该第一链和第二链是多核苷酸分子的一部分或包括2个多核苷酸分子,(ii)该第一核酸链任选地在5’端包括磷酸化或预腺苷酸化的核苷酸中的一者或多者;(iii)第二互补链具有从双链区3’延伸以形成序列中含有至少4个简并核苷酸的单链延伸部的核酸序列;和(iv)位点特异性可切割的序列或核苷酸,在双链区和单链延伸部之间连接处或附近,适于通过切割去除单链延伸部。第二互补链可以任选地在3’端具有阻断部分。
另一实施方式提供了如上定义的3’衔接子的群体,其中,对于群体中的各3’衔接子,序列中包含至少4个简并核苷酸的单链延伸部不同。
在一些实施方式中,上链(或第一链)优选包括预腺苷酸化的5’端。
在一些实施方式中,3’单链延伸部具有在4-12个核苷酸范围内的长度和位点特异性可切割的序列或核苷酸。
位点特异性可切割的序列或核苷酸可以包括例如硫代磷酸酯、dUMP或限制性内切核酸酶的识别序列,其中该限制性内切核酸酶可以是野生型酶或在双链体的仅一条链(切口内切核酸酶)上切割的突变体。部分双链多核苷酸或3’衔接子的下链可以在DNA的主链上包含硫代磷酸酯修饰,其可以被硫代磷酸酯特异性限制酶或化学品切割。可选地,3’衔接子的下链可以包含尿嘧啶,用于通过尿嘧啶-DNA糖基化酶(UDG)和糖基化酶或糖基化酶/裂解酶切割。可选地,部分双链多核苷酸或3’衔接子的下链可以包含适于通过切口内切核酸酶进行单链切割的限制性内切核酸酶识别位点。
在一些实施方式中,位点特异性可切割的序列或核苷酸位于单链延伸部与双链区的连接处。
在一些实施方式中,位点特异性可切割的核苷酸或序列或键位于双链区内下链(或第二链)上单链延伸部与双链区的连接处的8个核苷酸,优选4个核苷酸内。
在一些实施方式中,在多核苷酸分子中存在多于一个可切割的核苷酸或序列,其中可切割的核苷酸或序列位于双链区中下链上单链延伸部与双链区的连接处的8个核苷酸内,优选地在自连接处起的4个核苷酸内。
在一些实施方式中,夹板衔接子上的阻断核苷酸防止连接,其中阻断核苷酸可包括选自下列的修饰:3’反向dT、3’C3间隔子(间隔区,spacer)、3’氨基dN、3’磷酸化dN和二脱氧核苷酸。
在一个实施方式中,提供了组合物,该组合物包括5’外切核酸酶,如λ5’外切核酸酶和切口酶(nicking enzyme)(一种或多种)。组合物除了5’外切核酸酶之外还可以包括选自下列的一种或多种酶:脱腺苷酶、切口内切核酸酶、和/或糖基化酶/裂解酶或糖基化酶。
在一个实施方式中,提供了方法,该方法包括:将如本文定义的随机化夹板衔接子连接至靶RNA的3’端,其中单链延伸部的切割防止衔接子二聚化;以及通过添加包括5’外切核酸酶和脱腺苷酶的第二组合物来去除3’衔接子的任何残余二聚体。在去除任何残余二聚体之后,方法可进一步包括连接5’衔接子。
还提供了试剂盒。在一些实施方式中,试剂盒可包括(a)部分双链多核苷酸分子,用作如本文所述的3’衔接子;以及(b)第二部分双链多核苷酸分子,适于用作具有以下特征的5’衔接子:由相同或不同的多核苷酸分子提供的上链和下链,其中上链与下链的一部分互补以形成双链区域,并且下链包含含有至少4个简并核苷酸的序列的5’单链延伸部。在一些实施方式中,试剂盒包含所述第二部分双链多核苷酸分子的群体,其中至少4个简并核苷酸序列是对于群体中各多核苷酸不同的随机序列。
在一些实施方式中,试剂盒可以进一步包括选自下列的一种或多种酶:连接酶、切口酶、糖基化酶、脱腺苷酶、和外切核酸酶。
第一和第二多核苷酸分子可以是DNA或RNA。在一个实施方式中,第一部分双链多核苷酸分子(3’衔接子)是用于连接至靶RNA或DNA的3’端的DNA,并且第二部分双链多核苷酸分子(5’衔接子)是用于连接至分子的5’端的RNA。在一个实施方式中,靶多核苷酸是RNA。在一个实施方式中,靶多核苷酸是RNA分子的文库,使得衔接子连接的RNA文库可以被逆转录并且任选地被扩增用以测序平台测序。试剂盒可以包括用于需要多个连接步骤的方法中的说明书,该连接步骤涉及单链靶多核苷酸或RNA分子文库以及3’和5’衔接子,用于与靶多核苷酸的表征和定量中的至少一者相关的目的。试剂盒的用途的实例包括:减少背景,背景在RNA的逆转录物的扩增期间加剧;用于测序反应(例如NGS或Sanger测序);定量和/或克隆;或本领域已知的其他用途。
在一个实施方式中,提供了用于将3’衔接子连接至单链靶多核苷酸分子的方法,该方法包括将任何上述3’衔接子多核苷酸分子与靶多核苷酸分子群体组合以产生反应混合物;温育该反应混合物以将3’衔接子多核苷酸分子连接至群体中的3’靶多核苷酸分子;以及在位点特异性可切割的序列或核苷酸处切割多核苷酸分子,从而去除简并序列。
在一个实施方式中,提供了用于将3’衔接子连接至RNA的方法,该方法包括将任何上述3’衔接子多核苷酸分子与RNA分子(靶多核苷酸)群体组合以产生反应混合物;温育该反应混合物以将3’衔接子多核苷酸分子连接至群体中的RNA分子的3’端;以及在位点特异性可切割的序列或核苷酸处切割多核苷酸分子,从而去除简并序列。
在进一步的实施方式中,该方法包括向以上定义的方法的产物中添加具有包含简并核苷酸的5’单链延伸部的如本文定义的5’多核苷酸衔接子分子,以产生第二反应混合物;以及温育第二反应混合物以将5’多核苷酸衔接子连接至群体中的3’衔接子连接的RNA分子。
在一些实施方式中,方法的步骤可以在单一反应容器中进行。
在一些实施方式中,方法步骤之间不进行中间纯化或分离步骤。
在一些实施方式中,方法可进一步包括将该方法的衔接子连接的产物与逆转录酶温育,以将连接的RNA拷贝到互补DNA(cDNA)中。在这些实施方式中,在3’单链延伸部已经被切割之后,可以使用多核苷酸分子的下链引发cDNA合成。
在一些实施方式中,高衔接子连接产量和减少的偏向性对于其他RNA群体没有显著变化。
在一些实施方式中,RNA文库中的靶RNA分子的大小和浓度是可变的。
在任何上述实施方式中,“上(top)”链的提及旨在包括对第一链的提及,并且“下(bottom)”链的提及旨在包括对第二链的提及。而且,在多核苷酸分子中的“简并核苷酸”提及指代至少4个核苷酸的序列,其中该至少4个简并核苷酸序列是对于多核苷酸群体中各多核苷酸不同的随机序列。简并序列中的核苷酸可选自A、G、U、T、C及其修饰型和类似物——其可以是天然存在的或非天然的化学类似物。
附图说明
图和附图旨在示例本文所述的组合物和/或方法的一个或多个形式。除非另作说明,否则这些并非旨在限制以解释任何权利要求的范围。
图1示出了其中多核苷酸衔接子分子可以被添加至包括具有未知末端的核酸的靶多核苷酸的3’端(衔接子2)和5’端(衔接子1)的工作流程。该图示例了其中衔接子连接至不具有聚腺苷酸(polyA)尾的RNA如sRNA和信使RNA片段的实例。在这个实例中,工作流程涉及四个步骤:(a)将包含3’单链延伸部(衔接子2)的夹板固定式双链衔接子的一条链连接至靶核酸的3’端;(b)通过切割衔接子中的位点并且任选地用外切核酸酶防止衔接子二聚体形成,来去除连接的衔接子的3’单链延伸部;(c)将包含5’单链延伸部(衔接子1)的双链核酸衔接子的链连接至靶核酸的5’端;(d)使步骤(c)的产物逆转录以产生在两端均具有衔接子序列的cDNA;和(e)任选地PCR扩增衔接子连接的多核苷酸(未显示),以产生测序文库。如示的3’衔接子的特征在于第一上链和互补下链,其中下链包括简并3’单链延伸部和一个或多个切割位点或接头,所述一个或多个切割位点或接头位于下链上单链或双链区的连接处的或被包含在双链区内下链上单链区附近(例如,在连接处的4个核苷酸内或自连接处不超过8个核苷酸内)。3’衔接子的其他特征可任选地包括在上链的5’端处的末端腺苷化二磷酸酯和在下链的3’端上的修饰末端核苷酸。5’衔接子类似地具有上链和互补下链,其中下链具有包含简并碱基的5’单链延伸部。衔接子1还可以任选地具有与衔接子2上的修饰相同或不同的连接阻断修饰。
图2示出了文库产量通过图1中例示的工作流程增强,其中3’衔接子(衔接子2)的下链的3’端被修饰的核苷酸阻断连接。
图3A-3B示出了两个工作流程中需要在不同阶段切割3’单链延伸部的工作流程的示意性表示。在图3A中,在第二连接“前”切割单链延伸部,而在图3B中,在两个连接事件切割衔接子2和1上的单链延伸部“在后切割”。图3C-3D示出了不同工作流程对衔接子二聚化(图3C)和3’衔接子连接的RNA的产量(图3D)的影响。结果显示,在靶RNA的5’端的第二连接之前切割单链延伸部与之后相比减少了衔接子二聚体形成(图3C)并且增加了文库产量(图3D)。在图3C和图3D中,衔接子2的下链的3’端核苷酸被阻断(任选的特征,用于阻断任何残余的自我连接)。
图4示出了在第一连接步骤之后切口限制内切核酸酶(在这个实例中,Nt.BsmAI)从3’随机化夹板衔接子切割单链延伸部时,与使用无切割的随机化夹板衔接子相比,文库中表示的衔接子连接的靶miRNA的浓度增加。
图5显示,采用图1中的工作流程(随机化夹板连接)的文库中表示的RNA的产量显著大于通过使用单链衔接子的Illumina和Bioo Scientific的可商购方法提供的产量。
图6显示,与依赖于单链衔接子的可商购的方法相比,利用图1中描述的使用随机化夹板衔接子的工作流程,偏向性显著降低。
图7示出了图1中的工作流程提供了所测RNA浓度范围(在10ng-1000ng靶RNA样品的范围内)的一致性能。
图8显示,图1中的工作流的性能可通过5’衔接子的5’单链延伸部的简并序列中的A/G/T和C替换为2-Ome A/G/T/C而进一步增强。
图9示出了3’衔接子(衔接子2)的一些不同形式。上链的5’端处的“App”或“p”分别是腺苷酰化或磷酸化。“X”是位点特异性切割位点。下链的3’端处的“*”是阻断核苷酸。
具体实施方式
除非另外定义,在此使用的所有技术和科学术语具有与所属领域普通技术人员通常理解的相同的含义。在此描述的实施方式可以包括一个或多个数值范围(例如,大小、浓度、时间、温度)。除非上下文另外明确指明,数值的范围将被理解为包括该范围内的所有数值,包括所述范围内的数值的子集(一个或多个),直至下限单位的十分之一。如本文所用,冠词“一个”、“一种”和“所述”同等地涉及单数或复数的含义,除非上下文另有规定。
术语“多核苷酸”是指DNA、RNA、嵌合DNA/RNA分子或与RNA链杂交的DNA链。如在此定义的术语“多核苷酸”用于描述靶标和衔接子。因此,靶多核苷酸、3’衔接子和/或5’衔接子中的任意者可以是DNA、RNA、或DNA/RNA嵌合体或杂交体;并且可以包含一个或多个修饰核苷酸,例如2’O甲基NTP。在一些实施方式中,当靶多核苷酸是RNA时,3’衔接子是DNA并且5’衔接子是RNA;虽然任选地5’衔接子也可以是DNA。如在此使用的“多核苷酸”可以具有一个或多个修饰碱基。
靶多核苷酸可以是源自自然界的单一物种,或者可以是合成的,或者可以是多核苷酸群体的一部分——该群体的成员源自细胞或基因组或其他来源。靶多核苷酸可以是单链完整sRNA或较大RNA分子的片段。这些RNA可以源自自然界,或可以是合成的,或可以是不同类型RNA的群组(池,pool)的部分。靶多核苷酸的大小可以在20个核苷酸长度到10kb或更长的范围内。
sRNA包括微小RNA(miRNA)、PIWI相关RNA(piRNA)、短干扰RNA(siRNA)、内源性短干扰RNA(esiRNA)和短发夹RNA(shRNA)、mRNA片段、病毒RNA和结构RNA如核糖体RNA(rRNA)、转移RNA(tRNA)和5S核糖体RNA(5S RNA)。任何或所有这些sRNA可以通过此方法连接和扩增。对多核苷酸无大小或序列要求。然而,多核苷酸优选地具有自由3’OH以允许其连接至3’衔接子的上链。
如在此使用的术语“链”是指由通过共价键(例如磷酸二酯键)共价连接在一起的核苷酸构成的核酸。双链DNA具有两条互补核酸链,在此称为“上”链和“下”链。一条链指定为为上链或下链(或任何等同术语,如“Watson”和“Crick”)是任意的,并且不暗示任何具体定向、功能或结构。
术语“简并序列”是指多核苷酸的区域,其中任何核苷酸可以存在,优选地以随机顺序。在多核苷酸群体中,简并序列因多核苷酸而不同。例如,在化学合成的寡核苷酸中,寡核苷酸聚合物中的具***置可以被指定具有任何掺入的核苷酸。这是通过在导致寡核苷酸链延长的逐步化学反应期间引入核苷酸的混合物(对于DNA寡核苷酸而言最常见的是dA、dG、dC、dT,而对于RNA寡核苷酸而言最常见的是A、G、C和U)来实现的。简并序列可通过式N2-10(例如,N3-N8)描述,其中N相应于G、A、C和T或U,或修饰的等同形式,例如2’O甲基化核苷酸(2’O Me核苷酸)。因此,包含“至少4个简并核苷酸”的多核苷酸包含4个核苷酸的序列,各核苷酸可以是N。简并序列的长度为至少4、5、6、7、8或9个核苷酸。简并序列还被描述为“随机”序列。简并序列包括一个或多个(例如至少2个、至少3个、至少4个、至少5个、或5至30个或更多个)选自R、Y、S、W、K、M、B、D、H、V、N(如IUPAC代码所定义的)的核苷酸。换言之,简并序列因分子而异。在一些实施方式中,简并序列可以是随机的(即,由一系列N构成,其中N由分子群体中的全部四个核苷酸表示)。具有简并序列的寡核苷酸可以如下制备:通过将限定序列的寡核苷酸混合在一起,或通过合成寡核苷酸使得碱基的混合物被添加至一个或多个位置。简并序列中的核苷酸可选自A、U、G、T和C或其修饰型或其类似物。修饰的核苷酸的实例包括甲基化的、羟甲基化的、或葡萄糖基化的核苷酸。其他修饰型包括8-氧代鸟嘌呤和胸苷二聚体。还包括任何已知的化学修饰,包括萘修饰的胞嘧啶(参见例如US 8,975,388)、修饰的苄基鸟嘌呤(参见例如US 8,178,314、US 8,163,479和US 8,227,602)和带标签的核苷酸如生物素化的核苷酸。
术语“连接”,如本文所用,是指将单独的单链多核苷酸彼此连接以形成单个分子。这通常但非一定地通过连接酶实现。RNA连接酶可容易地在RNA的3’端将单链DNA连接到单链RNA。RNA连接酶还可以容易地将RNA的5’端连接到RNA的3’端。在此描述的连接反应总体上是通过连接酶来实现,如New England Biolabs,Inc.目录中可商购和描述的。连接酶包括需要ATP的RNA连接酶,如T4RNA连接酶1和T4RNA连接酶2,如T4连接酶2截短KQ或如实例中描述的T4RNA连接酶2的其他突变体,并且还包括需要NAD的连接酶,如Taq连接酶。另一种可选的连接酶是用于夹板连接的小球藻(Chlorella)病毒PBCV-1连接酶。夹板连接可以在2个单链多核苷酸分子在单一互补“夹板”分子(单链多核苷酸)上的接近位置处退火并且连接发生在两个相邻单链多核苷酸的接近末端处时实现。
在此提供了多核苷酸分子,其是3’衔接子,在此也称为随机化夹板衔接子,其中衔接子的上链适于连接至单链靶多核苷酸的3’端。在一些实施方式中,3’衔接子可与5’衔接子结合使用,以由RNA分子群体制备cDNA文库。在一些实施方式中,这些衔接子的特征包括,对于3’衔接子而言,可切割的单链简并序列(其在连接过程中可以用作“夹板”)和阻断基团。当衔接子连接至RNA分子群体时,3’衔接子可以是DNA,同时5’衔接子可以是RNA或DNA/RNA杂交体,其中简并序列是DNA。个体衔接子包括在下链上的简并序列,其长度为至少4-10个或更多个核苷酸,并且优选少于100个核苷酸、少于50个核苷酸、或小于30个核苷酸。
3’衔接子包括由上链的第一序列和下链的第二序列构成的双链区。双链区应具有足够的长度以允许第一和第二序列在溶液中彼此碱基配对。在一些实施方式中,双链区应是至少6bp的长度、至少8bp的长度、或至少10bp的长度,但是在一些情况下可以较短。例如,双链区可以在4-50bp或8-30bp的范围内。上链的5’端可以被磷酸化或腺苷酸化,或在5’端具有促进双分子连接的其他化学部分。在上链的3’端无需阻断基团。3’衔接子分子可以在下链的3’端上具有阻断核苷酸。阻断核苷酸的实例包括修饰的脱氧核糖或核糖糖。在这些实例中,3’羟基不能用于通过3’至5’磷酸二酯形成导致寡核苷酸的进一步延伸。连接阻断修饰的实例包括3’反向dT、3’C3间隔子、3’氨基、3’磷酸化和二脱氧核苷酸。总体上,修饰防止3’端连接,即,使3’羟基不可用于3’至5’磷酸二酯键形成。
下链(即,第三序列)上的3’单链延伸部(“夹板”区)通过连接区连接至双链区,该连接区可以是核苷酸、接头或其他序列。形成夹板的简并核苷酸的单链延伸部具有例如至少4个核苷酸、5个核苷酸、6个核苷酸、7个核苷酸、8个核苷酸或9个核苷酸的长度,尽管在图中示例了6个核苷酸。用于创建单个文库的衔接子群组中的单链区域的序列可以相异。序列差异量可以取决于例如简并序列的长度和各位置处允许的差异核苷酸的数目。
依赖于简并单链延伸部等与未知单链靶序列杂交的3’衔接子设计能够实现显著减少偏向性并且增加sRNA群体的sRNA测序的产量、准确度和灵敏度的工作流程。与此前描述的单链衔接子(其中显著偏向性对与单链衔接子相关的某些靶序列有利(in favor)或不利(against)在评估文库内容方面是有问题的)相比,这种使用3’随机化夹板衔接子观察到的连接效率增加和/或连接偏向性减少是有利的。
在一个实施方式中,DNA衔接子的下链上的单链延伸部与靶单链RNA杂交。随后发生靶RNA的3’端和DNA衔接子上链的5’端的连接以形成双链区。然后通过切割去除衔接子上的单链延伸部。切割优选地发生在位于双链区和单链区之间的连接区处或者5或8个核苷酸之内的单个位点处。在某些实施方式中,1个核苷酸或在连接处是优选的。例如,切割位点可以在第二序列内,第二和第三序列之间连接处5’的上至8个核苷酸(例如,1、2、3、4、5、6、7或8个核苷酸)内。出于去除单链延伸部的目的,可以将多个切割位点引入到下链中,但是一个位点是足够的。DNA衔接子可以是用于靶多核苷酸的3’衔接子。
“切割”是指位点特异性可切割的序列或核苷酸可以包括例如硫代磷酸酯、dUMP或限制性内切核酸酶的识别序列,该限制性内切核酸酶是野生型的或已经被修饰以仅在一条链上切割(切口内切核酸酶)。切割还可以通过化学手段或通过光切割手段或这些方法的混合方法或其他方法而发生。由于作为切割位点5’的序列可以在本方法中用作引物,切割产生3’羟基。这种切割位点是可选择性切割的,因为其可以在不切割相同分子中的其他位点的情况下被切割。
例如,在此描述的3’衔接子的下链(例如,图1中的衔接子2)可含有选自上述任一种的切割位点,并可相应地被切割。
在一个实例中,可切割的位点是单核苷酸(脱氧尿苷),并且利用尿嘧啶去糖基化酶和AP内切核酸酶(如内切核酸酶IV)来释放夹板区域。在另一实例中,可切割的位点是可以被位点特异性切口内切核酸酶特异性切割的序列。用于这种切口内切核酸酶的识别序列可以与衔接子的双链区中的切割位点相同或不同。识别位点可以与在反应混合物中的夹板和靶多核苷酸之间形成双链分子之后发生切口的切割位点相同。切割产物提供用于模板依赖性聚合酶反应的3’端。
在连接至靶RNA之后切割衔接子以去除如图1中所示的单链延伸部可以同时发生,或者可以在用外切核酸酶处理连接的样品之后或之前,该外切核酸酶可以从5’端降解双链DNA,如λ外切核酸酶或外切核酸酶V,以从样品中去除任何残余衔接子。外切核酸酶的添加可以进一步包括添加脱腺苷酶,如焦磷酸酶,如烟草酸焦磷酸酶或焦磷酸水解酶,如RppH。
对于图3A-3D中所示的文库构建,可期望在第二连接步骤中使用5’衔接子以连接至单链靶多核苷酸的5’端。实施例8提供了在将3’和5’衔接子连接至sRNA然后逆转录和扩增之后文库构建的方法的一种实施方式。
5’衔接子可以是DNA,但优选是RNA或RNA/DNA杂交体。5’衔接子包括具有上链(RNA)和下链(DNA或RNA)的双链区,在5’端处具有单链延伸部(夹板区)。在一个实施方式中,单链延伸部的长度为至少4个核苷酸、至少5个核苷酸、至少6个核苷酸、至少7个核苷酸、至少8个核苷酸或至少9个核苷酸,尽管在图中示出了6个核苷酸。然而,对于5’衔接子,不要求特定的连接处核苷酸或序列,因为夹板区域的切割是不要求的;下链的任一端也不需要阻断核苷酸,因为连接仅发生在5’衔接子上链的3’端上的OH与RNA的5’端上的磷酸盐之间。
3’和5’衔接子分子可用于那些需要将已知序列附接至单链靶多核苷酸两端的反应。衔接子序列可以包含样品条码、独特分子标识符、用于扩增和测序的引发位点、和/或修饰或标记,如生物素或本领域中已知的促进衔接子-靶标构建体的分离或鉴定的其他标记。
3’衔接子适于模板切换工作流程,其中图1中所示的5’衔接子的添加由用于制备测序文库的模板切换步骤替代。当靶RNA缺少已知的3’端(如多A尾)时,3’衔接子至任何靶RNA的3’端的附接是特别有利的。5’衔接子可以通过模板切换而被任选地添加。
除了提供用于逆转录的引物之外,3’衔接子可以用作亲和标签以针对DNA、蛋白质、脂质、碳水化合物等背景富集细胞RNA。例如,3’衔接子可以包括亲和标记物,如生物素部分,以能够利用例如链霉亲和素富集衔接子连接的分子。5’衔接子与RNA的5’端和/或3’衔接子在RNA的3’端处的连接可以便于使用Oxford Nanopore平台直接测序RNA。
在附接了衔接子序列之后,RNA可以被转化为cDNA;任选地扩增,和/或通过多种方法测序。可选地,对于sRNA,可以直接对衔接子连接的RNA进行测序,例如使用Illumina测序平台。
当前衔接子连接的实施方式能够利用逆转录酶制备cDNA,其具有以下优点中的一个或多个:一锅法(一步法,one pot)工作流程;产生高产量的由RNA群体形成的偏向性降低的测序文库不需要纯化步骤;性能的一致性;以及对于具有宽范围的大小和宽范围的浓度的单链DNA和单链RNA靶多核苷酸的适合性。
在此描述的方法可以用于分析来自实质上任何生物体和/或来源于原核生物、真核生物、支原体和古细菌的样品类型的RNA(具体地,sRNA、长非编码RNA或片段化mRNA)。实例包括但不限于微生物、植物、动物(例如,爬行动物、哺乳动物、昆虫、蠕虫、鱼等)、组织样品、尸体组织、考古(archaeological)/古(ancient)样品等。在某些实施方式中,该方法中使用的RNA样品可以来源于哺乳动物,其中在某些实施方式中,哺乳动物是人。在示例性实施方式中,RNA样品可以包含来自哺乳动物细胞(如人类、小鼠、大鼠或猴细胞)的RNA。样品可以由培养的细胞或临床样品(例如,组织活检、刮擦物或灌洗液)的细胞或法医样品的细胞(即,在犯罪现场收集的样品的细胞)制成。在具体的实施方式中,RNA样品可以获自生物样品,如细胞、组织、体液、以及粪便。目标体液包括但不限于血液、血清、血浆、唾液、粘液、痰(phlegm)、脑脊髓液、胸膜液、泪液、泌乳管液、淋巴液、痰(sputum)、脑脊液、滑液、尿液、羊水、以及***。在具体的实施方式中,样品可以获得自对象,例如人。在一些实施方式中,分析的样品可以是从血液(例如,从怀孕女性或患者(如癌症患者)的血液)获得的无细胞RNA(cfRNA)的样品。在其他实施方式中,样品可以是病原生物体、来自微生物体的样品、植物样品或真菌样品,其中待测序的RNA诊断选定的情况,如疾病、生活条码或单个物种的群体中的表型分析。
衔接子和其在使用随机化夹板连接进行的文库制备过程中的应用解决了过往的挑战,降低了与这种连接策略相关的测序偏向性和敏感性。本文所述的工作流程适于检测一般18-33个核苷酸长度并且在转录和转录后基因调控中具有基本作用的差异表达sRNA。RNA可以诊断地用于多种目的,例如肿瘤和匹配的正常组织分析,其中肿瘤细胞与匹配的正常组织不同地表达微小RNA。基于sRNA的RNA沉默调控多种生物过程,包括细胞命运的发展、维持和确定、基因表达的精调、转座子沉默和抗病毒防御。tRNA片段是sRNA的新发现的且重要的类别。在此描述的基于随机化夹板连接的工作流程可以降低多种靶RNA(如一般与Argonaut蛋白家族的成员结合以形成核糖核蛋白复合物并且通过互补碱基配对充当靶向RNA沉默的导向物的sRNA)的sRNA测序的偏向性和增加其灵敏度。随机化夹板工作流程对于大RNA和DNA也是有效的,允许高度准确的RNA和DNA测序。
sRNA的实例包括例如2’OMe修饰的RNA、小干扰RNA、tRNA衍生片段、piwi相互作用RNA、植物miRNA、假尿苷修饰的RNA。转移tRNA片段(tRF)被分组成两个主要类别:较长的tRNA半体和较短的tRNA片段。较长的3′和5′tRNA半体在调控蛋白质合成中具有作用,并且其生物发生由细胞应激如感染、氧化或营养应激触发(Keam等,(2015)Life,5,1638–1651)。关于较短3′-tRFs和5′-tRFs知之较少。然而,已显示其可加载到Argonauts上,并利用与miRNA诱导的沉默类似的机制指导多种靶标上的mRNA沉默(参见例如Kumar等,(2014)BMCBiology,12,78;Shigematsu等,(2015),Gene Regul Syst Bio,9,27–33)。
一般,sRNA与Argonaut蛋白家族的成员结合以形成核糖核蛋白复合物并且通过互补碱基配对1充当靶向RNA沉默的指导物。基于sRNA的RNA沉默调控多种生物过程,包括细胞命运的发展、维持和确定、基因表达的精调、转座子的沉默以及抗病毒防御。此外,sRNA的异常表达涉及多种人类疾病。具体地,miRNA通常在肿瘤细胞中异常表达,并且在多种癌症类型中对于诊断和预后都是有用的生物标志物(Bottani等,(2019)Journal of ClinicalMedicine,8,1661)。
本公开还提供了用于实践本主题方法的试剂盒,如上所述。主题试剂盒可以至少包含本发明的3’衔接子(例如,如在图9中所述)。试剂盒可以进一步包括如上所述的5’衔接子;和/或试剂盒还可以包含一种或多种酶,如连接酶、脱腺苷酶、糖基化酶/裂解酶、和/或切口内切核酸酶。
试剂盒可以包括用于需要多个连接步骤的方法中的说明书,该连接步骤涉及单链靶多核苷酸以及3’和5’衔接子,用于与该多核苷酸的表征和定量中的至少一者相关的目的。试剂盒的用途的实例包括被细胞在基因组调节中使用并且还可以用作生物标志物的sRNA(21-23个核苷酸)的测序。其他用途包括对血液中的RNA片段测序。sRNA分子可以通过Illumina测序平台被直接测序,并且不需要逆转录酶用于分析。由于RNA很小,没有适当的内部位置用于引发互补链的合成,因此衔接子提供用于该目的的外部引发位点。
试剂盒的用途的实例包括减少在RNA的逆转录物的扩增期间加剧的背景,用于测序反应(例如NGS或Sanger测序)、定量和/或克隆或本领域已知的其他用途。
试剂盒的组分可以组合在一个容器中,或者各组分可以在其自身的容器中。例如,试剂盒的组分可以组合在单一反应管中或在一个或多个不同的反应管中。此试剂盒的组分的其他细节如上所述。试剂盒还可以含有上述和下述的其他试剂,这些试剂对于方法不是必需的,但是可以在方法中使用——取决于方法将如何实施。
试剂盒中提供的试剂也可以在区室化的盒(compartmentalized cassettes)或微流体装置中提供,或以适于多样品流体处理器的形式(包括多孔板)或其他形式提供。sRNA文库可以提供用于诊断患者的病理状态如癌症的生物标志物。本方法的实施方式可以有助于以至少两种方式改善诊断。
在第一方法中,例如,可以进行群体分析以表征“正常”sRNA,其表征健康的人。这需要大量文库,每个文库来自不同的个体——通过涉及机器学习(machine learning)的计算分析。处理这些文库以发现指示群体中的致病性的生物标志物需要来自具有表征的异常表型的患者的多个另外的样品。
在第二种方法中,拜访医生办公室进行个体化诊断的患者可以提供血液样品,该血液样品被送至测试实验室或被现场处理——可能以微流体装置的形式,其中sRNA文库用本方法构建。然后将文库在测序仪器(如测序仪(Illumina,San Diego,CA))中进行测序。然后将患者sRNA谱与sRNA群体数据的数据库相比较,以促进诊断。
在两种情况下,本文所述的3’衔接子以及随后5’衔接子顺序地连接至来自单个患者或患者群体的各sRNA上,其中至少3’衔接子或5’衔接子或两者包含样品条码。然后在PCR扩增步骤之前或之后,可以将这些文库组合成单个群组(pool)。然后可以进行群组化(合并的,pooled)文库的分析,然后通过MiSeq或其他测序平台进行测序。群体中来自单个患者的各种sRNA的谱(profile)的计算分析——其中患者数据与来自“正常”群体的数据进行比较——可以揭示患者可能具有什么类型的癌症或其他状况以及什么类型的治疗方案可能是适当的。
在本发明的实施方式中,在此描述的具有上链和下链的多核苷酸不是天然存在的。
术语“非天然存在”是指这样的核酸:其包含:(a)不同于处于其天然状态的核酸的核苷酸序列(即,与天然存在的核酸序列具有小于100%序列同一性);(b)一个或多个非天然存在的核苷酸单体(其可产生不是G、A、T或C的非天然主链或糖);和/或(c)可包含在核酸的5’端、3’端和/或5’端与3’端之间的一个或多个其他修饰(例如,添加的标记或其他部分)。
在制剂的环境下,术语“非天然存在”是指:(a)天然不组合(例如因为其处于不同的位置、不同的细胞或不同的细胞区室中)的组分的组合;(b)具有在自然界中未发现的相对浓度的组分的组合;(c)缺少自然界中通常与其中一种组分相关的某物的组合;(d)处于在自然界中未发现的形式的组合,例如干燥、冷冻干燥、结晶、水性;和/或(e)包含在自然界中未发现的组分的组合。例如,制剂可以包含“非天然存在的”缓冲剂(例如,Tris、HEPES、TAPS、MOPS、三羟甲基甘氨酸(tricine)或MES)、洗涤剂、染料、反应增强剂或抑制剂、氧化剂、还原剂、溶剂或防腐剂——在自然界中未被发现。
在本说明书中提及的所有出版物、专利和专利申请——包括2019年4月26日提交的美国临时申请号62/839,191和于2010年2月20日提交的美国申请号16/796,113——通过引用并入在此,其程度相当于各个出版物、专利或专利申请被具体地且单独地指出以通过引用并入。
实施例
虽然为了清楚理解的目的,前述发明已经被通过示例和实例的方式以一定细节描述,但是基于本发明的教导内容,对于本领域的普通技术人员而言很明显,可以对其进行某些改变和修改而不脱离所附权利要求的精神或范围。
如果没有另外说明,所有酶均来自New England Biolabs,Inc(Ipswich,MA)。除非另有说明,遵循制造商说明书。
实施例1:用于在单一反应容器中产生RNA测序文库的夹板连接
在此实施例中,输入RNA是微小RNA的群组(pool),其包含962种具有等摩尔浓度的合成miRNA(来自Miltenyi Biotec(Auburn,CA)的MiRXploreTM文库)。所有总RNA样品均获自BioChain,Inc.(Newark,CA)。所有寡核苷酸均由Integrated DNA Technologies,Inc.(Coralville,IA)合成。利用图1中所示的工作流程首先将DNA衔接子连接至3’端,并且然后将RNA衔接子连接至群组中的各输入RNA的5’端,以形成测序文库。5’RNA衔接子(具有5’单链延伸部的双链分子)可以用RNA杂交体取代,其中RNA是适于使用T4RNA连接酶与靶RNA的5’端杂交的上链,并且下链可以是DNA或RNA。
为了减少输入RNA的二级结构,将RNA加热至70℃,然后在冰上快速冷却。然后将输入RNA(群组化的miRNA)(50fmol)连接至3’衔接子(衔接子2)——使用T4RNA连接酶2截短KQ(NEB M0373),通过将反应混合物在25℃温育1小时。将衔接子2的下链在脱氧U处用UDG(NEBM0280)和内切核酸酶IV(NEB M0304)切割。然后将5’衔接子(衔接子1)添加至反应并且用T4RNA连接酶2连接至靶RNA的5’端。然后将II逆转录酶(NEB M0368)添加至反应混合物以延长衔接子2的下链,以形成cDNA。然后使用/>样品纯化珠(NEB E7767)纯化所得cDNA。将纯化的cDNA用/>DNA聚合酶(NEB M0491)进行PCR扩增。使用NEBNext样品纯化珠(NEB E7767)纯化PCR产物。文库的产量通过2100/>(Agilent,SantaClara,CA)确定。在/>或/>平台(Illumina,San Diego,CA)上进行文库的测序。
2.5pmol用于3’衔接子,并且随后5pmol用于5’衔接子。
3’和5’衔接子的序列如下:
3’衔接子:衔接子2:
上链:/5App/AGA TCG GAA GAG CAC ACG TCT/3InvdT/(SEQ ID NO:1)
下链:AGA CGT GTG CTC TTC CGA TC/ideoxyU/(N1:25252525)(N1)(N1)(N1)(N1)(N1)/3InvdT/(SEQ ID NO:2)
5’衔接子:衔接子1
上链:rGrUrUrCrArGrArGrUrUrCrUrArCrArGrUrCrCrGrAr CrGrArUrC(SEQ ID NO: 3)
下链:
(rN1:25252525)(rN1)(rN1)(rN1)(rN1)(rN1)rGrArUrCrGrUrCrGrGrArCrUrGrUrArGrArArCrUrCrUrGrArArC(SEQ ID NO:4)
衔接子1和2通过IDT(Coralville,IA)合成。
在利用预腺苷酸化的情况下,将3’和5’衔接子重悬于退火缓冲液(50mM NaCl、10mMTris HCl、0.1mM EDTA,pH 7.5)中。将3’衔接子的衔接子链用5’DNA腺苷酸化试剂盒(NEB E2610)预腺苷酸化,并且用DNA净化试剂盒(NEB T1030)纯化。
通过添加50mM终浓度的Tris-HCl缓冲液(pH 7.5)、75mM终浓度的氯化钾、10mM终浓度的DTT、500μM终浓度的各DNTP、20单位的鼠RNA酶抑制剂(M0314)、200单位的ProtoScript II逆转录酶(NEB M0368)以及无核酸酶水以使最终体积达到50μL,进行逆转录。然后将该反应在42℃温育1小时。使用70μL NEBNext样品纯化珠(NEBE7767)和70μL的100%异丙醇纯化第一链cDNA产物。根据制造商的指导,将反应在10μL无核酸酶水中洗涤和洗脱(还参见图1)。
使用NEBNext高保真度2×PCR主混合物(Master Mix)(NEB M0541)和各25pmol正向和反向引物,进行文库的PCR扩增。PCR通过以下程序进行:98℃初始变性30秒,随后是根据以下输入的不同数量的循环:98℃ 10秒,62℃ 30秒,72℃。随后72℃的最终延伸步骤5分钟。使用NEBNext样品纯化珠(NEB E7767)并且利用来自NEBNext小RNA文库试剂盒(NEBE7330)的小RNA文库尺寸选择方案对文库进行尺寸选择。在Agilent2100生物分析仪上测定纯化的文库,以在合并之前评估纯度和浓度,并且使用50循环的单端Illumina测序进行测序。
为了评估阻断修饰对衔接子2的下链的3’端的影响,添加反向dT阻断基团。对照是未修饰型(从IDT获得的衔接子2)。按照以上方法使用此衔接子,导致文库产量提高。使用阻断核苷酸的文库产量10倍高于没有阻断修饰的文库产量(参见图2)。
实施例2:夹板连接使提高的文库产量由人脑总RNA生成
使用相同量的起始材料(500ng的人脑总RNA)比较了构建RNA文库的三种不同方法。这些是(1)Illumina小RNA文库制备试剂盒(RS-200-0012,Illumina,SanDiego,CA),(2)Bioo Scientific/>小RNA-seq试剂盒V3(NOVA-5132-05,BiooScientific,Austin,TX),以及(3)实施例1中描述的基于夹板连接的RNA文库制备方法。按照制造商的说明制备文库。用生物分析仪评估文库产量。显示的数据是6-8个技术重复的平均值。将产量相对于9个PCR循环标准化。结果是,基于夹板连接的RNA文库制备方法产生的产量高于Illumina和Bioo Scientific方法(参见图5)。/>
实施例3:证明在第二连接步骤之前在3’衔接子上切割3’单链延伸部的益处
如实施例1中所述生成RNA文库,其中3’衔接子中的切割位点是脱氧尿苷,利用(NEB M5505)进行切割以去除下链上的单链延伸部。输入RNA:50fmol的miRXplore输入RNA和2.5pmol衔接子2被连接。在第二连接(其中将5.0pmol衔接子1连接至RNA的5’端)之前(“在前切割”)或在第二连接之后(“在后切割”)进行切割。结果示于图3C中。当在第二连接之前进行USER切割时,在与第二连接之后进行USER切割相比时,引物二聚体形成减少,同时靶miRNA产量提高。当对来自两种方法所得的文库进行比较时,在第二连接之前的切割导致靶标与衔接子二聚体之比为7:1,而在第二连接之后进行的切割产生了1.5:1的靶标与衔接子二聚体之比(图3C),证明在第二连接步骤之前切割单链延伸部的优点。
实施例4:证明与无切割相比在单链延伸部切割后产量提高
在此实施例中,切口内切核酸酶切割位点位于衔接子2的下链中,其中衔接子的双链区中具有切口内切核酸酶识别序列,以在连接之后去除衔接子2上的单链延伸部。衔接子2的下链被设计以包含BsmAI切口位点,用于切割单链延伸部。按照实施例1中的方法制备文库,其中将50fmol的miRXplore与2.5pmol衔接子2连接,然后用5U Nt.BsmAI(NEBR1021)进行切割,其在图4中以“切割”识别,并且在不存在切割的情况下为“无切割”。随后,将5.0pmol衔接子1添加至混合物中并且连接至RNA-衔接子缀合物的5’端。在切口酶切割的情况下RNA文库的产量是显著的,而在不存在单链延伸部切割的情况下几乎没有文库形成(图4)。
实施例5:mcroRNA文库测序显示与商品试剂盒相比偏向性降低
通过实施例2中所述的三个不同的工作流程,由如实施例1中所述的miRXplore通用参考RNA的50fmol输入产生测序文库,以确定来自衔接子连接反应的不期望的偏向性的程度。将文库在Illumina MiSeq上在单端模式中进行测序50个循环,至大于2百万个读数/文库的读数深度(read depth)。各文库双份测序。然后将数据集随机下采样至2百万个读数的深度用于分析。在衔接子修饰(trimming)之后,对读数进行计数——通过将其与由制造商提供的参考序列比对(mapping)。通过下列将读数标准化:将各文库中的比对读数总数除以962以给出每个miRNA种类的预期读数计数。然后将各miRNA的读数计数除以预期的读数计数,以得到标准化的读数计数。以预期量存在的miRNA具有的标准化读取计数将为1。过度表达的序列将具有大于1的标准化读取计数,并且表达不足的序列将具有小于1的标准化读取计数。将读数以对数标度作图。所有分析使用BBTools包(https://jgi.doe.gov/data-and-tools/bbtools/)进行。用Illumina工作流程生成的文库具有由大量表达不足的读数组成的最大偏向性。利用Bioo Scientific方法工作流程形成的文库也显示具有大的偏向性。另一方面,夹板连接方法具有最小的偏向性(图7)。
偏向性由在预期值1的2倍内的miRNA序列的百分比定量。用Illumina试剂盒制备的测序文库仅定量在预期值的2倍内的miRNA的20%,而Bioo Scientific试剂盒有38.3%,并且夹板连接方法有84.3%(图7)。
实施例6:3’衔接子连接工作流程对于宽范围的输入RNA浓度是一致的
由1000、500、100和10ng输入量的总人脑RNA(单一健康男性供体,BioChain,Newark,CA)制备文库。文库制备方案描述于实施例1中并且对于各输入水平是相同的,除了以下改变:两衔接子均被稀释用于较低输入水平(对于100ng输入量是10倍,并且对于10ng输入量是100倍)。此外,PCR循环的数目根据RNA输入量而变化(对于1000、500、100和10ng输入水平,分别为10、11、14和18个循环)。
对于1000ng和500ng的输入RNA,3’衔接子使用2.5pmol,并且随后5’衔接子使用5pmol。对于100ng的输入RNA,将衔接子1:10稀释(3’衔接子为0.25pmol,5’衔接子为0.5pmol)。对于10ng,将衔接子1:100稀释(3’衔接子为25fmol,5’衔接子为50fmol)。
将文库在Illumina MiSeq上以单端模式双份测序50个循环,并且下采样至2百万个的读数深度。使用STAR比对仪将读数与人类基因组(构建GRCh38)比对,并且利用标准编码管线(standard Encode pipeline)定量。然后对读数计数进行对数转化,并且利用标准线性回归跨越R(R-project.org)中的输入量相关联。基于夹板连接的RNA文库制备方法显示跨越不同RNA输入的性能一致。甚至对于10ng与1000ng之间的比较,R2值大于0.9,表明高度相关性并且反映该方法跨越宽范围的输入的性能一致(图7)。
实施例7:在5’衔接子单链延伸部中,通过用2’O Me核苷酸取代NTP,可以进一步改进夹板连接
5’衔接子(衔接子1)的下链的6简并核苷酸区域被设计以包含6×2’O Me核苷酸(SEQID NO:3)。根据实施例1用500ng的总人脑RNA(输入RNA)、2.5pmol衔接子2和5.0pmol衔接子1制备(IDT)文库。将用修饰的衔接子1获得的产量与正常衔接子1进行比较。结果显示修饰的核苷酸引起文库产量增加(图8)。
3’衔接子2:
上链:/5App/AGA TCG GAA GAG CAC ACG TCT/3InvdT/(SEQ ID NO:1)
下链:AGA CGT GTG CTC TTC CGA TC/ideoxyU/(N1:25252525)(N1)(N1)(N1)(N1)(N1)/3InvdT/(SEQ ID NO:2)
5’衔接子1
上链:rGrUrUrCrArGrArGrUrUrCrUrArCrArGrUrCrCrGrArCrGrArUrC(SEQ ID NO:3)
修饰的下链:
(mN1:25252525)(mN1)(mN1)(mN1)(mN1)(mN1)rGrArUrCrGrUrCrGrGrArCrUrGrUrArGrArArCrUrCrUrGrArArC/3InvdT/(SEQ ID NO:5)
实施例8:利用夹板连接的文库构建可以通过添加λ外切核酸酶和脱氨酶而被进一步改进
将50fmol的合成miRXplore RNA、或500ng的总RNA用作文库的输入。遵循制造商的指导,用NEBNext、NEXTflex和TruSeq试剂盒构建文库。RNA与衔接子的优选比例为1:5至1:10。在样品中的RNA量未知的情况下,进行滴定。基于初始测试,调节PCR循环,使得所有文库将被扩增至大约相同的浓度,这总体上需要通过随机化夹板方法制备的文库的扩增比使用单链衔接子的商业试剂盒少2-3个循环。使用以下方法构建随机化夹板连接文库。将以下组分添加到总RNA:1×终浓度的T4RNA连接酶缓冲液(NEB M0204)、20%终浓度的PEG(NEBM0204)、0.05%终浓度的吐温20(VWR Radnor,PA)、2.5pmol退火的3′衔接子(2.5pmol上链,5pmol下链)、200单位的T4RNA连接酶2截短KQ(NEB M0373)。这些反应在热循环仪中在25℃下温育1小时。连接后,添加2.5单位的λ外切核酸酶(NEB M0262)和25单位的5’脱腺苷酶(NEB M0331),并且将反应在30℃培温育5分钟,在37℃温育15分钟,和在75℃温育5分钟。
添加5单位的UDG(NEB M0280)和20单位的内切核酸酶IV(EndoIV)(M0304),并将反应在37℃下再温育1小时。虽然在此情况下,UDG和Endo IV是在λ外切核酸酶和脱氨酶之后添加的,但是这些酶可以按任何顺序、在前、期间或在后添加。
然后通过添加ATP至1mM的终浓度、5pmol的5′衔接子(5pmol上链,10pmol下链)和20单位的T4RNA连接酶2(NEB M0239),进行5′连接。将反应在37℃温育1小时。通过添加50mM终浓度的Tris-HCl缓冲液(pH 7.5)、75mM终浓度的氯化钾、10mM终浓度的DTT、500μM终浓度的各DNTP、20单位的鼠RNA酶抑制剂(NEB M0314)、200单位的ProtoScript II逆转录酶(NEBM0368)以及无核酸酶水以使最终体积达到50μL,进行逆转录。然后将该反应在42℃温育1小时。使用NEBNext样品纯化珠(NEB E7767)和100%异丙醇,纯化第一链cDNA产物。根据制造商的指导,将反应在无核酸酶水中洗涤和洗脱。使用NEBNext高保真度2×PCR主混合物(NEBM0541)和各25pmol正向和反向引物,进行文库的PCR扩增。PCR通过以下程序进行:98℃初始变性30秒,然后是取决于RNA与衔接子的输入比,不同数目的循环:98℃ 10秒,62℃ 30秒。这然后是最终延伸步骤,72℃,5分钟。使用NEBNext样品纯化珠(NEB E7767)并且使用来自NEBNext小RNA文库试剂盒(NEB E7330)的小RNA文库尺寸选择方案,对文库进行尺寸选择。在Agilent 2100生物分析仪上测定纯化的文库,以在合并之前评估纯度和浓度,并且利用50循环的单端Illumina测序进行测序。
表1:与单链衔接子相比,利用图1中所述的随机化夹板衔接子检测的微小RNA的平均数目的改进
/>
/>
序列表
<110> 新英格兰生物实验室公司
<120> 用于减少偏向性的多核苷酸衔接子设计
<130> NEB-414-US
<150> 62/839,191
<151> 2019-04-26
<160> 5
<170> PatentIn 版本3.5
<210> 1
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成构建物
<220>
<221> misc_feature
<222> (22)..(24)
<223> 3InvdT
<400> 1
agatcggaag agcacacgtc tttt 24
<210> 2
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成构建物
<220>
<221> misc_feature
<222> (21)..(21)
<223> 在位置21处的n是ideoxyU
<220>
<221> misc_feature
<222> (22)..(22)
<223> 在位置22处的n是a、或t、或g、或c,其中群体中DNA分子的25%具有a, 25%具有t, 25%具有g 并且25%具有c。
<220>
<221> misc_feature
<222> (23)..(27)
<223> n是a、c、g或t
<400> 2
agacgtgtgc tcttccgatc nnnnnnnttt 30
<210> 3
<211> 26
<212> RNA
<213> 人工序列
<220>
<223> 合成构建物
<400> 3
guucagaguu cuacaguccg acgauc 26
<210> 4
<211> 32
<212> RNA
<213> 人工序列
<220>
<223> 合成构建物
<220>
<221> misc_feature
<222> (1)..(1)
<223> 在位置1处的n是a、或t、或g、或c,其中群体中DNA分子的25%具有a, 25%具有t, 25%具有g 并且25%具有c。
<220>
<221> misc_feature
<222> (2)..(6)
<223> n是a、c、g或u
<400> 4
nnnnnngauc gucggacugu agaacucuga ac 32
<210> 5
<211> 35
<212> RNA
<213> 人工序列
<220>
<223> 合成构建物
<220>
<221> 修饰的碱基
<222> (1)..(6)
<220>
<221> misc_feature
<222> (1)..(1)
<223> 在位置1处的n是a、或t、或g、或c,其中群体中DNA分子的25%具有a, 25%具有t, 25%具有g 并且25%具有c。
<220>
<221> misc_feature
<222> (2)..(6)
<223> n是a、c、g或u
<220>
<221> misc_feature
<222> (33)..(35)
<223> n是t
<220>
<221> misc_feature
<222> (33)..(35)
<223> n 是3InvdT
<400> 5
nnnnnngauc gucggacugu agaacucuga acnnn 35

Claims (20)

1.组合物,其包含:具有上链和下链的部分双链多核苷酸分子,其中:
(a)所述上链包括第一序列;以及
(b)所述下链包括:
(i)第二序列,其中所述第二序列与所述第一序列互补;
(ii)第三序列,所述第三序列在连接处连接至所述第二序列的3’端并且包含至少4个简并核苷酸的序列;以及
(iii)位于所述第二序列和第三序列之间的所述连接处或附近的位点特异性可切割的序列或位点特异性可切割的核苷酸。
2.根据权利要求1所述的组合物,其中所述下链在3’端处进一步包括阻断部分;其中所述阻断部分防止连接;任选地,其中所述阻断部分包括选自下列的修饰:3’反向dT、3’C3间隔子、3’氨基dN、3’磷酸化dN、以及二脱氧核苷酸。
3.根据权利要求1或2所述的组合物,其中所述上链具有磷酸化的或预腺苷酸化的5’端。
4.根据权利要求1-3中任一项所述的组合物,其中所述上链和下链是相同寡核苷酸的部分;或其中所述上链和下链是在不同的寡核苷酸中。
5.根据权利要求1-4中任一项所述的组合物,其中所述多核苷酸分子是DNA;或其中所述多核苷酸分子是RNA。
6.根据权利要求1-5中任一项所述的组合物,其中所述第三序列具有在4-12个核苷酸范围内的长度。
7.根据权利要求1-6中任一项所述的组合物,其中所述位点特异性可切割的序列包含脱氧尿苷、硫代磷酸酯或限制性内切核酸酶切割位点。
8.根据权利要求1-6中任一项所述的组合物,其中所述位点特异性可切割的核苷酸是脱氧尿苷。
9.根据权利要求1-8中任一项所述的组合物,其中所述位点特异性可切割的序列或位点特异性可切割的核苷酸位于所述第二序列和第三序列的连接处;或其中所述位点特异性可切割的序列或位点特异性可切割的核苷酸位于所述第二序列中所述第二序列与第三序列之间的所述连接处的4个核苷酸内和/或;
其中在所述多核苷酸分子中存在多于一个位点特异性可切割的序列或位点特异性可切割的核苷酸,其中所述位点特异性可切割的核苷酸或位点特异性可切割的序列中的每一个均位于所述第二序列内所述第二序列与第三序列之间的所述连接的8个核苷酸内。
10.方法,包括:
将部分双链多核苷酸分子连接至靶RNA的3’端,以产生连接产物;其中所述部分双链多核苷酸分子具有上链和下链,其中:
(a)所述上链包括第一序列;以及
(b)所述下链包括:(i)第二序列,其中所述第二序列与所述第一序列互补;(ii)第三序列,所述第三序列在连接处连接至所述第二序列的3’端并且包含至少4个简并核苷酸的序列;和(iii)位于所述第二序列和第三序列之间的所述连接处或附近的位点特异性可切割的序列或位点特异性可切割的核苷酸;
以及
通过添加包含5’外切核酸酶的组合物,从所述连接产物中去除残余的所述部分双链多核苷酸分子的二聚体。
11.根据权利要求10所述的方法,其中所述5’外切核酸酶是λ5’外切核酸酶。
12.试剂盒,包括:
(a)组合物,其包含:具有上链和下链的部分双链多核苷酸分子,其中:
所述上链包括第一序列;以及
所述下链包括:(i)第二序列,其中所述第二序列与所述第一序列互补;(ii)第三序列,所述第三序列在连接处连接至所述第二序列的3’端并且包含至少4个简并核苷酸的序列;和(iii)位于所述第二序列和第三序列之间的所述连接处或附近的位点特异性可切割的序列或位点特异性可切割的核苷酸;
并且进一步包含:
(b)第二部分双链多核苷酸分子,所述第二部分双链多核苷酸分子包括上链和下链,其中:所述上链包括第一序列,并且所述下链包括:(i)第二序列,其中所述第二序列与所述第一序列互补;和(ii)第三序列,所述第三序列是所述第二序列的5’并且包含至少4个简并核苷酸的序列;和/或
(c)选自下列的一种或多种酶:连接酶、切口内切核酸酶、糖基化酶、脱腺苷酶、以及外切核酸酶。
13.将3’多核苷酸衔接子连接至靶多核苷酸的方法,包括:
(a)将部分双链多核苷酸分子连接至所述靶多核苷酸的3’端,以形成3’多核苷酸衔接子连接的靶多核苷酸;其中所述部分双链多核苷酸分子具有上链和下链,其中:
所述上链包括第一序列;以及
所述下链包括:(i)第二序列,其中所述第二序列与所述第一序列互补;(ii)第三序列,所述第三序列在连接处连接至所述第二序列的3’端并且包含至少4个简并核苷酸的序列;和(iii)位于所述第二序列和第三序列之间的所述连接处或附近的位点特异性可切割的序列或位点特异性可切割的核苷酸;
以及
(b)切割所述连接的3’多核苷酸衔接子的下链,以去除所述简并序列。
14.根据权利要求13所述的方法,其中所述3’多核苷酸衔接子是DNA,并且所述靶多核苷酸是RNA。
15.根据权利要求13或14所述的方法,进一步包括:
(c)将具有包含简并核苷酸的5’单链延伸部的5’多核苷酸衔接子分子连接至步骤(b)的产物;任选地,其中所述5’多核苷酸衔接子是RNA;任选地,其中所述方法进一步包括用逆转录酶温育步骤(c)的产物,以将连接的RNA拷贝到cDNA中。
16.根据权利要求13-15中任一项所述的方法,其中步骤(a)–(c)在单一反应容器中进行;和/或其中在步骤(a)-(c)之间不进行中间纯化或分离步骤。
17.根据权利要求13-16中任一项所述的方法,进一步包括在其已经被切割后,利用所述多核苷酸分子的所述下链引发cDNA合成。
18.根据权利要求13-17中任一项所述的方法,其中所述靶多核苷酸是包含大小和浓度可变的RNA分子的多核苷酸分子的群体。
19.根据权利要求10或13-18中任一项所述的方法或根据权利要求11所述的试剂盒,其中所述部分双链多核苷酸分子如权利要求2-9中任一项所限定。
20.部分双链多核苷酸分子,其包含由第一核酸链和第二核酸链形成的双链区,所述第二核酸链包含与所述第一核酸链的序列互补的序列,其中:
(i)所述第一核酸链和第二核酸链是1个多核苷酸分子的部分或是2个单独的多核苷酸分子;
(ii)所述第一核酸链任选地包括磷酸化或预腺苷酸化的5’端中的一者或多者;
(iii)所述第二核酸链进一步包括从所述双链区3’延伸以形成单链延伸部的核酸序列,所述单链延伸部的序列含有至少4个简并核苷酸和在3’端处的阻断部分;以及
(iv)位点特异性可切割的序列或位点特异性可切割的核苷酸,位于所述双链区与所述单链延伸部之间的连接处或附近,适于通过切割去除所述单链延伸部。
CN202010338716.8A 2019-04-26 2020-04-26 用于减少偏向性的多核苷酸衔接子设计 Active CN111849965B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201962839191P 2019-04-26 2019-04-26
US62/839,191 2019-04-26
US16/796,113 US11390915B2 (en) 2019-04-26 2020-02-20 Polynucleotide adapter design for reduced bias
US16/796,113 2020-02-20

Publications (2)

Publication Number Publication Date
CN111849965A CN111849965A (zh) 2020-10-30
CN111849965B true CN111849965B (zh) 2023-12-19

Family

ID=70464838

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010338716.8A Active CN111849965B (zh) 2019-04-26 2020-04-26 用于减少偏向性的多核苷酸衔接子设计

Country Status (4)

Country Link
US (2) US11390915B2 (zh)
EP (2) EP4119679A1 (zh)
CN (1) CN111849965B (zh)
WO (1) WO2020219838A1 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114763546B (zh) * 2021-01-12 2024-04-12 香港城市大学深圳研究院 一种dU5`衔接子及其应用和构建的cDNA文库
CN112680797B (zh) * 2021-02-04 2023-09-26 广州大学 一种去除高丰度rna的测序文库及其构建方法
CN112941073B (zh) * 2021-03-29 2023-03-14 武汉伯远生物科技有限公司 一种单链dna接头及其制备和应用
CN113249437A (zh) * 2021-04-20 2021-08-13 成都罗宁生物科技有限公司 一种用于sRNA测序的建库方法
CN113817804B (zh) * 2021-09-22 2024-03-08 上海金匙医学检验实验室有限公司 一种测序文库自连接头消除的方法及应用
CN114262735A (zh) * 2021-12-15 2022-04-01 成都齐碳科技有限公司 用于表征多核苷酸的衔接体及其用途
CN114736951A (zh) * 2022-04-20 2022-07-12 深圳大学 一种小分子rna的高通量测序文库构建方法
CN116287124A (zh) * 2023-05-24 2023-06-23 中国农业科学院农业基因组研究所 单链接头预连接方法、高通量测序文库的建库方法及试剂盒

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5994068A (en) * 1997-03-11 1999-11-30 Wisconsin Alumni Research Foundation Nucleic acid indexing
WO2012158603A2 (en) * 2011-05-13 2012-11-22 Bioo Scientific Corporation Pooled adapter strategy for reducing bias in small rna characterization
WO2018175258A1 (en) * 2017-03-20 2018-09-27 Illumina, Inc. Methods and compositions for preparing nuclelic acid libraries

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007526282A (ja) 2004-03-02 2007-09-13 ウペエフエル・エコル・ポリテクニック・フェデラル・ドゥ・ローザンヌ O6−アルキルグアニンdnaアルキルトランスフェラーゼ特異的基質
WO2006114409A1 (en) 2005-04-27 2006-11-02 Covalys Biosciences Ag Pyrimidines reacting with o6-alkylguanine-dna alkyltransferase
EP1882688A1 (en) 2006-07-25 2008-01-30 EPFL Ecole Polytechnique Fédérale de Lausanne Labelling of fusion proteins with synthetic probes
US7947447B2 (en) 2007-01-16 2011-05-24 Somalogic, Inc. Method for generating aptamers with improved off-rates
WO2012044847A1 (en) 2010-10-01 2012-04-05 Life Technologies Corporation Nucleic acid adaptors and uses thereof
WO2012012037A1 (en) * 2010-07-19 2012-01-26 New England Biolabs, Inc. Oligonucleotide adaptors: compositions and methods of use
WO2013019361A1 (en) 2011-07-07 2013-02-07 Life Technologies Corporation Sequencing methods
US9416405B2 (en) * 2012-11-02 2016-08-16 Life Technologies Corporation Compositions, methods and kits for enhancing PCR specificity
US9422551B2 (en) 2013-05-29 2016-08-23 New England Biolabs, Inc. Adapters for ligation to RNA in an RNA library with reduced bias
EP3268491B1 (en) 2015-03-13 2021-07-14 Life Technologies Corporation Methods, compositions and kits for small rna capture, detection and quantification
US10655170B2 (en) 2016-07-06 2020-05-19 Takara Bio Usa, Inc. Coupling adaptors to a target nucleic acid
US11198865B2 (en) 2017-11-02 2021-12-14 Amanda Raine Splinted ligation adapter tagging

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5994068A (en) * 1997-03-11 1999-11-30 Wisconsin Alumni Research Foundation Nucleic acid indexing
WO2012158603A2 (en) * 2011-05-13 2012-11-22 Bioo Scientific Corporation Pooled adapter strategy for reducing bias in small rna characterization
WO2018175258A1 (en) * 2017-03-20 2018-09-27 Illumina, Inc. Methods and compositions for preparing nuclelic acid libraries

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Single一stranded DNA library preparation from highly degraded DNA using T4 DNA ligase;MARIE-THERES GANSAUGE ET AL;《NUCLEIC ACIDS RESEARCH》;20170123;gkx033 *
SPlinted Ligation Adapter Tagging(SPLAT),a novel library preparation method for whole genome bisulphite sequencing;AMANDA RAINE ET AL;《NUCLEIC ACIDS RESEARCH》;20161129;第45卷(第6期);e36 *

Also Published As

Publication number Publication date
EP3730628A1 (en) 2020-10-28
EP4119679A1 (en) 2023-01-18
US20200340050A1 (en) 2020-10-29
WO2020219838A1 (en) 2020-10-29
EP3730628B1 (en) 2022-07-27
US20220213539A1 (en) 2022-07-07
US11390915B2 (en) 2022-07-19
CN111849965A (zh) 2020-10-30

Similar Documents

Publication Publication Date Title
CN111849965B (zh) 用于减少偏向性的多核苷酸衔接子设计
US11697843B2 (en) Methods for creating directional bisulfite-converted nucleic acid libraries for next generation sequencing
US10961529B2 (en) Barcoding nucleic acids
US11214798B2 (en) Methods and compositions for rapid nucleic acid library preparation
CN110191961B (zh) 制备经不对称标签化的测序文库的方法
US9745614B2 (en) Reduced representation bisulfite sequencing with diversity adaptors
US20220259638A1 (en) Methods and compositions for high throughput sample preparation using double unique dual indexing
JP2016511007A (ja) 鎖になったrnaまたはdnaのライブラリを生成するための方法、組成物およびキット
EA035092B1 (ru) Синтез двухцепочечных нуклеиновых кислот
CN113528628A (zh) 用于基因组应用和治疗应用的核酸分子的克隆复制和扩增的***和方法
US9422551B2 (en) Adapters for ligation to RNA in an RNA library with reduced bias
CN107083427B (zh) Dna连接酶介导的dna扩增技术
WO2018229547A9 (en) Duplex sequencing using direct repeat molecules
CN110468179A (zh) 选择性扩增核酸序列的方法
JP2024099616A (ja) ゲノム再編成検出のための配列決定方法
CN109153698A (zh) miRNA转录组方法和组合物

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant