附图简述
当参考附图来阅读下列详述时,本发明的这些及其它特征、方面和优点将变得更好理解。
图1阐述片段化dsDNA的连接酶辅助的全基因组扩增的一个实施方案的图示。
图2阐述从健康个体的血浆中分离的循环DNA的大小概况。
图3A阐述使用CIRCLIGASE IITM进行的从全血的非细胞级分中提取的循环DNA的连接酶辅助的全基因组扩增。
图3B阐述使用T4 DNA连接酶进行的从全血的非细胞级分中提取的循环DNA的连接酶辅助的全基因组扩增。
图3C阐述使用大肠杆菌(E. Coli) DNA连接酶进行的从全血的非细胞级分中提取的循环DNA的连接酶辅助的全基因组扩增。
图4阐述连接酶辅助的全基因组扩增用于四种不同的CODIS基因座的灵敏且均衡的DNA扩增的有效性。
图5阐述连接酶辅助的全基因组扩增用于十二种不同的CODIS基因座的灵敏且均衡的DNA扩增的有效性。
图6阐述连接酶辅助的全基因组扩增在不同的反应条件和缓冲条件下的效率。
图7阐述高分子量基因组DNA在连接酶辅助的全基因组扩增中的扩增的抑制。
图8阐述连接酶辅助的全基因组扩增的图示,其包括使用多核苷酸激酶加工(例如末端修复)片段化DNA,接着进行经加工的片段化DNA的连接酶辅助的扩增。
图9阐述在GTP存在下使用PNK和CIRCLIGASE IITM的片段化DNA的连接酶辅助扩增的单管反应的图示。
图10阐述使用男性-女性血浆/血液的单管连接酶辅助的扩增反应,其中使用由输入DNA建立的文库检测DYS14男性特异性标志物。
图11阐述片段化DNA的磷酸化和预腺苷化接着使用基本上非腺苷化的连接酶进行连接的图示。
图12阐述使用基本上非腺苷化的连接酶进行的预腺苷化DNA序列的环化的效率增加。
图13阐述当靶DNA序列为预腺苷化的且当使用非腺苷化的连接酶进行连接时,连接酶辅助的全基因组扩增的效率增加。
图14阐述使用CIRCLIGASETM II进行的血浆DNA的连接酶辅助的全基因组扩增。
图15阐述关于覆盖深度和均匀性水平的扩增DNA的定性分析。
图16阐述使用AT六聚体在靶序列区各处观察到的总体覆盖度和均匀性。
图17阐述当在生成单链DNA环之前用尿嘧啶DNA糖基化酶(UDG)和甲酰氨基嘧啶-DNA糖基化酶(Fpg)从单链DNA修复/消除损伤、或者从生成的单链DNA环修复/消除损伤时、或者当不进行DNA损伤修复/消除时的覆盖深度。
图18阐述当在生成单链DNA环之前用尿嘧啶DNA糖基化酶(UDG)和甲酰氨基嘧啶-DNA糖基化酶(Fpg)从单链DNA修复/消除DNA损伤、或者从生成的单链DNA环修复/消除DNA损伤时、或者当不进行DNA损伤修复/消除时的覆盖的深度和均匀性。
图19阐述当在滚环扩增之前用尿嘧啶DNA糖基化酶(UDG)和甲酰氨基嘧啶-DNA糖基化酶(Fpg)从单链DNA环修复/消除DNA损伤、或者从生成的单链DNA环修复/消除DNA损伤时、或者当不进行DNA损伤修复/消除时更佳的阳性预测值(PPV)和灵敏性。
详述
下列详述为示例性的且不意图其限制本发明或本发明的用途。在本说明书各处,特定术语的示例应视为非限制性实例。除非上下文另有明确指示,否则单数形式“一种”、“一个”和“所述”亦包括复数所指物。如在本文中使用的在本说明书和权利要求书各处的近似用语,可用于修饰任何这样的数量表述,其可允许变化而不会导致与之相关的基本功能上的改变。因此,被诸如“大约”等术语修饰的值,不限于规定的精确值。除非另有指示,否则用于本说明书和权利要求的表达成分的量、诸如分子量等特性、反应条件等的所有数字,应理解为在所有情况下均被术语“大约”修饰。因此,除非有相反指示,否则在下列说明书和随附权利要求中所述的数值参数均为近似值,其可根据试图通过本发明获得的所需特性而变化。最低限度上,且不企图限制所述权利要求的范围的等同原则的适用,应至少根据报告的有效数字的位数并通过使用常规的四舍五入技术来理解各数值参数。必要时,提供了范围,且所述范围包括其中的所有子范围。为更清楚和简明地描述和指出所要求的本发明的主题,给特定术语提供了下列定义,其用于下文描述和随附权利要求中。
如在本文中使用的术语“核苷”,是指其中核酸碱基(核碱基)与糖部分连接的糖基胺化合物。“核苷酸”是指磷酸核苷。可使用与其核苷相对应的按字母顺序排列的字母(字母命名)来表示核苷酸,如在表1中所述。例如,A表示腺苷(含核碱基腺嘌呤的核苷),C表示胞苷,G表示鸟苷,U表示尿苷以及T表示胸苷(5-甲基尿苷)。W表示A或T/U,以及S表示G或C。N表示随机核苷以及dNTP是指脱氧核苷三磷酸。N可为A、C、G或T/U的任一种。
表1:各种核苷酸的字母命名。
字母符号 |
字母符号代表的核苷酸 |
G |
G |
A |
A |
T |
T |
C |
C |
U |
U |
R |
G或A |
Y |
T/U或C |
M |
A或C |
K |
G或T/U |
S |
G或C |
W |
A或T/U |
H |
A或C或T/U |
B |
G或T/U或C |
V |
G或C或A |
D |
G或A或T/U |
N |
G或A或T/U或C |
(at N) |
2-氨基dA或2-硫代-dT或G或C |
如在本文中使用的术语“核苷酸类似物”,是指结构上类似于天然存在的核苷酸的化合物。核苷酸类似物可具有改变的磷酸骨架、改变的糖部分、改变的核碱基或其组合。核苷酸类似物可为天然核苷酸、合成核苷酸、修饰的核苷酸或替代的取代部分(例如肌苷)。一般而言,除了其它方面,具有改变的核碱基的核苷酸类似物还赋予不同的碱基配对和碱基堆积特性。如在本文中使用的术语“LNA (锁核酸)核苷酸”,是指这样的核苷酸类似物,其中核苷酸的糖部分包含锁在模拟核糖核酸(RNA)的糖构象中的二环呋喃糖单元。从化学角度而言,从脱氧核糖核苷酸(或核糖核苷酸)到LNA核苷酸的结构变化为受限的,即在2’位和4’位的碳原子之间引入另外的键连接(例如2’-C,4’-C氧亚甲基键连接;参见例如Singh, S.K.等,Chem. Comm.,4,455-456,1998,或Koshkin, A. A.等,Tetrahedron, 54,3607-3630,1998。))。LNA核苷酸中的呋喃糖单元的2’位和4’位可通过O-亚甲基来连接(例如,氧-LNA:2’-O,4’-C-亚甲基-β-D呋喃核糖基核苷酸)、S-亚甲基(硫代-LNA)或NH-亚甲基部分(氨基-LNA),等等。所述键连接限制呋喃糖环的构象自由。LNA寡核苷酸显示出对互补单链RNA以及互补的单链或双链DNA的增强的杂交亲和力。LNA寡核苷酸可诱导A型(RNA样)双链体构象。除了其它方面,具有改变的磷酸-糖骨架的核苷酸类似物(例如PNA、LNA)还常常改善链特性,例如二级结构形成。在字母命名之前的星号(*)符号,表示通过字母命名的核苷酸为硫代磷酸酯修饰的核苷酸。例如,*N代表硫代磷酸酯修饰的随机核苷酸。在字母命名之前加号(+)符号表示通过字母命名的核苷酸为LNA核苷酸。例如,+A代表腺苷LNA核苷酸,以及+N代表锁定的随机核苷酸(即随机LNA核苷酸)。字母命名“(at N)”代表包含核碱基2-氨基dA、2-硫代-dT、G或C的随机核苷酸。
如在本文中使用的术语“寡核苷酸”,是指核苷酸的寡聚物。如在本文中使用的术语“核酸”,是指核苷酸的多聚物。如在本文中使用的术语“序列”,是指寡核苷酸或核酸的核苷酸序列。在本说明书各处,每当通过字母序列表示寡核苷酸或核酸时,核苷酸均为从左向右5’→3’顺序的。例如,通过字母序列(W)x(N)y(S)z表示的寡核苷酸,其中x =2,y =3且z =1,代表寡核苷酸序列WWNNNS,其中W为5’末端核苷酸以及S为3’末端核苷酸。寡核苷酸或核酸可为DNA、RNA或其类似物(例如硫代磷酸酯类似物)。寡核苷酸或核酸亦可包含修饰的碱基和/或骨架(例如修饰的磷酸酯键连接或修饰的糖部分)。赋予核酸稳定性和/或其它优点的合成骨架的非限制性实例可包括硫代磷酸酯键连接、肽核酸、锁核酸、木糖核酸或其类似物。
如在本文中使用的术语“引物”,是指与靶核酸序列(例如待扩增的DNA模板)杂交以引发核酸合成反应的短线性寡核苷酸。引物可为RNA寡核苷酸、DNA寡核苷酸或嵌合序列。引物可包含天然的、合成的或修饰的核苷酸。引物的长度的上下限均以经验确定。引物长度的下限为在核酸扩增反应条件下与靶核酸杂交时形成稳定双链体所需的最小长度。在所述杂交条件下,非常短的引物(通常小于3个核苷酸长)不与靶核酸形成热力学稳定的双链体。上限常常通过在靶核酸的预定核酸序列之外的区域中具有双链体形成的可能性来确定。一般而言,合适的引物长度在约3个核苷酸长至约40个核苷酸长的范围。
如在本文中使用的术语“随机引物”,是指这样的引物序列的混合物,其通过将寡核苷酸序列的任何给定位置上的核苷酸随机化来生成,以此方式,使得给定位点可由任何可能的核苷酸或其类似物(完全随机化)组成。因此,随机引物为寡核苷酸序列的随机混合物,由序列内的核苷酸的各种可能的组合组成。例如,六聚体随机引物可通过序列NNNNNN或(N)6表示。六聚体随机DNA引物由4种DNA核苷酸A、C、G和T的各种可能的六聚体组合组成,产生包含46 (4,096)种独特的六聚体DNA寡核苷酸序列的随机混合物。当靶核酸的序列为未知的或者用于全基因组扩增反应,随机引物可有效用于引发核酸合成反应。
如在本文中所述的术语“部分限制引物”,是指这样的引物序列的混合物,其通过将寡核苷酸序列的一些核苷酸完全随机化(即核苷酸可以是任何的A、T/U、C、G或其类似物)同时限制另一些核苷酸的完全随机化(即特定位点上的核苷酸的随机化程度小于A、T/U、C、G或其类似物的可能组合)来生成。例如,通过WNNNNN表示的部分限制DNA六聚体引物,表示其中混合物中的所有序列的5’末端核苷酸为A或T的引物序列的混合物。此处,与完全随机DNA引物(NNNNNN)的最多四种可能的组合(A、T、G或C)相比,5’末端核苷酸受限于两种可能的组合(A或T)。部分限制引物的合适引物长度可在约3个核苷酸长至约15个核苷酸长的范围。
如在本文中所述的术语“具有末端错配的引物二聚体结构的部分限制引物”,是指这样的部分限制引物序列,其中当部分限制引物中的两个独立的引物序列以三个或更多个核苷酸的内部同源性彼此分子间杂交,以形成不具有凹末端的引物二聚体结构、或具有单核苷酸碱基3’凹末端的引物二聚体结构、或具有两个核苷酸碱基3’凹末端的引物二聚体结构时,在引物二聚体结构的两个3’末端核苷酸上均存在核苷酸错配(即未碱基配对的核苷酸)。例如,通过WNNNS表示的部分限制五聚体引物,当其分子间杂交以形成不具有凹末端的引物二聚体结构时,在两个3’末端核苷酸上均提供末端错配。在引物二聚体结构中,存在三个核苷酸的内部同源性(即当通过分子间杂交形成不具有凹末端的引物二聚体结构时,WNNNS中的三个随机核苷酸可彼此碱基配对)。然而,当该引物实例分子间杂交以形成具有单核苷酸碱基3’凹末端的引物二聚体结构时,其不提供末端错配。类似地,通过WWNNNS表示的部分限制六聚体引物,当其分子间杂交以形成不具有凹末端的引物二聚体结构时,在两个3’末端核苷酸上均提供末端错配。此外,即使在该引物实例分子间杂交以形成具有单核苷酸碱基3’凹末端的引物二聚体结构时,其亦在两个3’末端核苷酸上提供末端错配。通过WWWNNNS表示的部分限制六聚体引物,当其分子间杂交以形成不具有凹末端的引物二聚体结构时,在两个3’末端核苷酸上均提供末端错配。另外,当该引物实例分子间杂交以形成具有单核苷酸碱基3’凹末端的引物二聚体结构或者形成具有两个核苷酸碱基3’凹末端的引物二聚体结构时,其在两个3’末端核苷酸上均提供末端错配。
如在本文中使用的术语“滚环扩增(RCA)”,是指这样的核酸扩增反应,其经由滚环机制扩增环状核酸模板(例如单链DNA环)。滚环扩增反应通过引物与环状(常常为单链的)核酸模板杂交来启动。然后核酸聚合酶通过围绕环状核酸模板连续行进以反复不断地复制核酸模板的序列(滚环机制)来延伸与环状核酸模板杂交的引物。滚环扩增通常产生多联体,其包含环状核酸模板序列的串联重复单元。滚环扩增可为线性RCA (LRCA),其表现出线性扩增动力学(例如,使用单特异性引物的RCA),或者可为表现出指数扩增动力学的指数RCA (ERCA)。亦可使用多引物进行滚环扩增(多引物滚环扩增或MPRCA),得到超支化多联体。例如,在双引物RCA中,如在线性RCA中一样,一种引物可与环状核酸模板互补,而另一种引物可与RCA产物的串联重复单元核酸序列互补。因此,双引物RCA可作为具有指数(几何学)扩增动力学的链反应进行,以涉及两种引物的多重杂交、引物延伸和链置换事件的分支级联为特征。这常常生成一组离散的多联双链核酸扩增产物。可使用合适的核酸聚合物(例如Phi29 DNA聚合酶)在等温条件下体外进行滚环扩增。
如在本文中使用的多重置换扩增(MDA),是指这样的核酸扩增法,其中扩增包括以下步骤:使引物与变性的核酸退火结合,接着进行链置换核酸合成。因为通过链置换来合成核酸,所以逐渐增加数量的引发事件发生,形成超支化核酸结构的网络。对用于从小量基因组DNA样品生成具有有限序列偏好的高分子量DNA的全基因组扩增而言,MDA极其有用。除其核酸合成活性之外还具有链置换活性的任何链置换核酸聚合酶,例如Phi29 DNA聚合酶或Bst DNA聚合酶的大片段,均可用于MDA。常常使用随机引物在等温反应条件下进行MDA,以用于实现具有有限序列偏好的扩增。
如在本文中使用的术语“预腺苷化连接酶”,是指为其腺苷化形式的连接酶。连接酶的腺苷化形式能够在不存在ATP或dATP的情况下进行具有5’磷酰基和3’羟基的线性ssDNA分子的分子内连接。使用预腺苷化连接酶的连接,是指其中高比例的用于反应的连接酶分子为其腺苷化形式的连接反应。一般而言,多于60%的连接酶分子可为其腺苷化形式的。在一些实施方案中,当使用预腺苷化连接酶进行连接反应时,多于70%的用于反应的连接酶分子可为其腺苷化形式的。在另一些实施方案中,当使用预腺苷化连接酶进行连接反应时,多于80%、90%或95%的用于反应的连接酶分子可为其腺苷化形式的。
如在本文中使用的术语“腺苷化酶”,是指能够将核酸序列腺苷化以生成5’腺苷化核酸的酶。如在本文中使用的5’腺苷化核酸,是指在其3’端具有羟基且在其5’端具有腺苷化末端核苷酸的核酸序列。例如,5’腺苷化DNA (AppDNA),是指在其5’端为腺苷化的且在其3’端具有羟基的DNA序列。
如在本文中使用的术语“非腺苷化连接酶”,是指为其非腺苷化形式的连接酶。连接酶的非腺苷化形式能够在不存在ATP或dATP的情况下进行具有3’羟基的线性5’-腺苷化ssDNA分子的分子内连接。使用非腺苷化连接酶的连接,是指其中高比例的用于反应的连接酶分子为其非腺苷化形式的连接反应。一般而言,多于60%的连接酶分子可为其非腺苷化形式的。在一些实施方案中,当使用非腺苷化连接酶进行连接反应时,多于70%的用于反应的连接酶分子可为其非腺苷化形式的。在另一些实施方案中,当使用非腺苷化连接酶进行连接反应时,多于80%、90%或95%的用于反应的连接酶分子可为其非腺苷化形式的。
如在本文中使用的术语引物-模板核酸双链体的“解链温度”(Tm),是指二分之一的双链体解离成单链分子时的温度。引物-模板DNA双链体的稳定性可通过其Tm来测定。在设计成功扩增的参数上,引物长度和序列为关键决定因素。引物-模板核酸双链体的解链温度随引物长度增高且随GC含量增加而增高。一价和二价盐浓度(例如K+、Mg2+、K+)、温度和化学变性剂的存在可影响引物-模板核酸双链体的Tm并且可用于改变引物-模板核酸双链体的稳定性。例如,DNA双链体稳定性通常在较高盐浓度的情况下增加,但作为温度增加或者在变性剂存在下的函数而降低。例如,高浓度的盐(例如NaCl)使引物-靶DNA双链体的Tm升高,因为Na+离子可屏蔽磷酸二酯骨架上的负电荷,从而减小DNA链的静电排斥。在另一方面,较高的温度(在所用缓冲液条件下接近或超过引物-靶DNA杂合物的Tm)降低双链体稳定性和DNA杂交效率。任何限定序列的Tm取决于双链体长度、GC含量、盐浓度、变性剂浓度和包含pH在内的缓冲液组成的联合效应。此外,因为在DNA扩增反应期间需要杂交,所以缓冲液与酶活性的相容性亦为主要关注。为了最佳的酶活性,必须不仅要达到用于引物-模板杂交的条件,还要达到用于酶稳定性和酶活性的条件。在某些情况下,最优酶活性可能在引物-靶标杂交并非最优的条件下出现,以及将影响Tm的对引物组成的改进包含在内,可用于通过改进双链体在所使用的那些条件下的Tm来改善引物-靶标杂交。
在一些实施方案中,提供了用于通过与能够进行单链DNA的非模板依赖性分子内连接的合适的连接酶一起孵育,从线性DNA生成单链DNA环的方法。线性DNA可为线性染色体DNA、无细胞循环DNA、古代DNA或因环境暴露而降解的DNA、或者***固定的DNA。在一些实施方案中,线性DNA可为片段化的线性DNA。片段化线性DNA的长度范围可从15个核苷酸至21000个核苷酸。线性DNA可包括已具有可连接末端的序列,或者其可包括具有非连接性末端的序列。在一个实施方案中,线性DNA可包括已具有可连接末端的序列。例如,线性DNA可在5’末端已具有磷酸基团且在3’末端已具有羟基。这类DNA序列在与合适的连接酶一起孵育时可进行分子内连接。在一些实施方案中,提供了用于从线性染色体DNA生成单链DNA环的方法,其中所述方法包括将线性染色体DNA与能够进行单链DNA的非模板依赖性分子内分子连接的连接酶一起孵育以生成单链DNA环。在一些实施方案中,将预腺苷化连接酶用于连接反应。能够以非模板依赖性方式连接单链DNA序列的任何预腺苷化连接酶,均可使用。在一些实施方案中,将基本上腺苷化形式的TS2126 RNA连接酶用于非模板依赖性分子内连接反应。如果线性染色体DNA为双链形式的,则需要在分子内连接反应之前使之变性。连接反应可在不存在ATP和/或dATP的情况下进行。
在一些实施方案中,线性DNA可包括具有非连接性末端的序列。例如,线性DNA可具有5’羟基或3’磷酰基或二者。在一些实施方案中,所述方法包括以下步骤:提供线性DNA,通过在磷酸供体存在下使其与多核苷酸激酶(PNK)一起孵育末端修复线性DNA以生成在5’末端具有磷酸基团且在3’末端具有羟基的可连接DNA序列,以及用连接酶进行可连接DNA序列的分子内连接以生成单链DNA环。末端修复可包括5’末端核苷酸的磷酸化、3’末端核苷酸的去磷酸化或二者,以生成可连接DNA序列。如果末端修复的可连接DNA为双链形式的,则需要在分子内连接反应之前使其变性。在一些实施方案中,在PNK反应之前使DNA变性。单链DNA的磷酸化或去磷酸化通常比双链平末端或5’-凹末端更高效。对磷酸供体及其在反应混合物中的浓度进行选择,以使其不会抑制后续的分子内连接反应。例如,除三磷酸腺苷(ATP)或三磷酸脱氧腺苷(dATP)之外的任何合适的磷酸供体均可用于使用PNK的末端修复反应。合适的磷酸供体包括但不限于三磷酸鸟苷(GTP)、三磷酸胞苷(CTP)、三磷酸尿苷(UTP)或三磷酸脱氧胸苷(dTTP)。在一些实施方案中,将预腺苷化连接酶用于连接反应。能够非模板依赖性连接单链DNA序列的任何预腺苷化连接酶,均可使用。在一些实施方案中,将基本上腺苷化形式的TS2126 RNA连接酶用于非模板依赖性分子内连接反应。激酶反应和连接反应在不存在ATP和/或dATP的情况下进行。所述方法的所有步骤均在单个反应容器中进行而无需任何介入的分离或纯化步骤。所述方法的各个步骤可同时进行或以顺序方式进行,无需任何中间的纯化或分离步骤。例如,可连同GTP一起向包含含有线性靶DNA的核酸溶液的反应容器(例如eppendorf管)中加入PNK以促进线性靶DNA的末端修复。具有5’磷酸化活性和3’磷酸酶活性的任何PNK (例如T4 PNK),均可用于末端修复反应。各自具有5’磷酸化或3’磷酸酶的PNK的组合,亦可用于末端修复反应。一旦完成激酶反应,便可向相同的反应容器中加入预腺苷化连接酶以促进分子内连接反应。
线性DNA可为天然或合成来源的双链或单链DNA。可在体内或体外从生物样品(例如获自生物受试者的样品)中获得或者从未知物体中发现(例如在法医调查期间获得的DNA) DNA。例如,其可获自但不限于体液(例如血液、血浆、血清、尿、乳、脑脊液、胸膜液、淋巴、泪液、痰、唾液、粪便、肺抽吸物、咽拭子或生殖道拭子)、器官、组织、细胞培养物、细胞级分、切片(例如器官或组织的切片部分)或者从生物受试者或从生物受试者的特定区域(例如包含患病细胞或循环肿瘤细胞的区域)分离的细胞。包含或疑似包含靶线性DNA (即目的线性DNA)的生物样品可为真核来源的、原核来源的、病毒来源的或噬菌体来源的。例如,靶线性DNA可获自昆虫、原生动物、鸟、鱼、爬行动物、哺乳动物(例如大鼠、小鼠、奶牛、狗、豚鼠或兔)或者灵长类动物(例如黑猩猩或人类)。线性DNA可为基因组DNA (例如线性染色体DNA)或cDNA (互补DNA)。可使用反转录酶从RNA模板(例如mRNA、核糖体RNA)生成cDNA。线性DNA可为片段化的DNA且可具有非连接性末端核苷酸。例如,线性DNA可包含5’羟基和/或3’磷酸基团,以使DNA连接酶不能进行分子内连接反应。可将线性DNA分散在溶液或者可将其固定在固体支持物上,例如固定在印迹、被分析物、阵列、载玻片、微量滴定板或ELISA板中。例如,可通过引物将线性DNA固定在基底上,且随后可将其环化和扩增。
当线性DNA为双链形式时,需要在分子内连接反应之前使其变性成单链形式。这可通过使用用于将dsDNA转化成ssDNA序列的任何本领域公认的方法来实现。例如,可将dsDNA热变性、化学变性或者既热变性又化学变性。可使用降低dsDNA的解链温度的变性剂(例如甘油、乙二醇、甲酰胺、尿素或其组合)将dsDNA化学变性。对于向反应混合物中加入的每10%(体积/体积)的变性剂,变性剂可使解链温度降低5℃-6℃。变性剂或变性剂的组合(例如10%甘油和6-7%乙二醇)可构成1%、5%、10%、15%、20%或25%的反应混合物(体积/体积)。降低杂交严格性的盐可以低浓度包含在反应缓冲液中,以在低温下将dsDNA化学变性。可通过例如在95℃加热dsDNA来将dsDNA热变性。
在变性步骤之后,可使用能够在不存在模板的情况下进行ssDNA底物的分子内连接的DNA或RNA连接酶处理生成的ssDNA,以形成单链DNA环。可用于连接反应的合适的连接酶包括但不限于TS2126 RNA连接酶、T4 RNA连接酶、T4 DNA连接酶、T3 DNA连接酶或大肠杆菌DNA连接酶。通常使用诸如T4 RNA连接酶等连接酶,经由模板依赖性分子内连接反应进行线性单链DNA分子向单链DNA环的转化。然而,单链DNA或单链RNA的模板依赖性分子内连接仅得到有限的成功,特别是当要用未知序列和/或大小的ssDNA分子群体进行ssDNA分子的环化的情况下。尽管噬菌体T4 RNA连接酶I表现出非模板依赖性分子内连接活性,但对于实际用于从线性ssDNA分子生成环状ssDNA分子而言,该活性非常低且非常低效。
在一些实施方案中,使用对具有5’磷酰基和3’羟基的线性ssDNA和/或ssRNA底物有较好的非模板依赖性分子内连接活性的热稳定RNA连接酶进行ssDNA向单链DNA环的转化。连接酶可为基本上预腺苷化形式的。例如,来源于感染嗜热菌水生栖热菌(Thermus scotoductus)的栖热菌属噬菌体TS2126的TS2126 RNA连接酶,可用于从片段化线性ssDNA至环状ssDNA的非模板依赖性环化。与诸如T4 RNA连接酶等许多嗜中温RNA连接酶相比,TS2126 RNA连接酶更为热稳定的(稳定至约75℃)。TS2126 RNA连接酶活性的温度范围可为大于约40℃,例如从约50℃至约75℃。因此,可在较高温度下使用TS2126 RNA连接酶,所述较高温度进一步减少ssDNA的不合乎需要的二级结构。亦可通过除TS2126 RNA连接酶之外的连接酶或者通过使用具有DNA连接活性的任何其它酶(例如拓扑异构酶)来实现线性ssDNA的环化。在一些实施方案中,通过在环化线性片段化ssDNA分子方面具有较高的非模板依赖性连接酶活性的来源于嗜热古细菌嗜热自养甲烷杆菌(Methanobacterium thermoautotrophicum)的RNA连接酶1 (Mth RNA连接酶)来实现片段化单链DNA分子的环化。
在一些实施方案中,提供了用于改进通过TS2126 RNA连接酶环化ssDNA的效率的方法。使用具有pH 8.0的HEPES缓冲液用于连接反应增加了连接效率。当在TRIS缓冲液(例如,对于CIRCLIGASE IITM,EpiCenter建议的10x反应缓冲液包含0.33 M TRIS-醋酸盐(pH7.5)、0.66 M醋酸钾和5mM DTT)中进行反应时,非模板依赖性ssDNA连接为低效的。另外,连接反应所必需的辅因子锰,在碱性条件下快速氧化并在TRIS存在下形成沉淀。可强烈复合Mn3+离子的阴离子可促进Mn2+向Mn3+的空气氧化。例如,当将等体积的用HCl适当调节pH的0.2 mol/升TRIS与2 mmol/升MnCl2混合时,在pH 9.3 (仅TRIS碱的pH)时立即有颜色变化;在pH 8.5时,颜色变化有约3分钟的初始时间延迟;以及在pH值低于8.3时,在1小时内未检测到颜色变化。尽管在较低pH不发生反应,但通过加酸也未使在较高pH观察到的变化逆转。因锰在TRIS缓冲液中的快速氧化所致,当在TRIS缓冲液中进行分子内连接时,较高浓度的锰对于连接反应而言为必需的(例如添加MnCl2至2.5 mM的终浓度)。另外,因为锰浓度随时间不断减小,所以变得难以准确预测锰在反应中的工作浓度。当在单个反应容器中进行连接和扩增时,较高浓度的锰可导致聚合酶在扩增期间较高的错误率。通过在连接反应中将TRIS缓冲液替换成HEPES缓冲液,可使用低于0.5 mM的锰离子浓度实现有效的分子内连接。除HEPES之外,可将任何其它的Good’s缓冲液(参见例如Good, Norman等,Biochemistry,5(2): 467-477,1966;和Good, Norman等,Methods Enzymol.,24: 53-68,1972。)用于分子内连接反应。在一个实施方案中,在含有约2.5 mM MnCl2、约66 mM KOAc、约0.5 mM DTT、约0.003% (重量/重量) Tween-20和约0.5 M甜菜碱的35 mM HEPES缓冲液(pH =8.0)中进行分子内连接反应。
可经由滚环扩增(RCA)法,在等温条件下扩增连接反应混合物中的ssDNA环。可向相同反应容器中加入包含DNA聚合酶、引物和dNTP的扩增试剂,以产生扩增反应混合物和启动RCA反应。可对用于扩增反应的各试剂进行预处理以去除任何污染核酸。可通过使用本领域已知的任何方法来进行扩增试剂的净化。例如,诸如净化的phi29 DNA聚合酶等净化的校正DNA聚合酶,可用于RCA反应。可通过在不存在任何dNTP的情况下将校正DNA与二价阳离子一起孵育对其进行净化,以去除污染核酸。缺乏校正能力的DNA聚合酶,例如Bst DNA聚合酶,可在存在二价阳离子且不存在dNTP的情况下将其与校正DNA聚合酶一起孵育以去除污染核酸之后再使用。亦可通过将扩增试剂与诸如DNA酶等核酸酶一起孵育来进行净化。如果通过使用核酸酶来进行净化,则需要在扩增反应之前将其去除或消化。扩增反应混合物可进一步包含诸如单链DNA结合蛋白和/或合适的扩增反应缓冲液等试剂。ssDNA环的扩增在其中进行连接的相同反应容器中进行。在扩增反应之前不需要分离或纯化ssDNA环和/或去除连接酶。可通过用于DNA检测的任何目前已知的方法来检测扩增的DNA。
可使用本领域已知的任何DNA聚合酶(例如Phi29 DNA聚合酶、Bst DNA聚合酶)来进行RCA。其可使用随机引物混合物或通过使用特异性引物来进行。在一些实施方案中,将随机引物用于RCA反应。亦可使用包含一个或多个核苷酸类似物(例如LNA核苷酸、2-氨基-dA或2-硫代dT修饰)的引物序列。在一些实施方案中,将抗核酸酶引物(例如在适当位置包含硫代磷酸酯基团的引物序列)用于扩增反应(例如NNNN*N*N)。在一些实施方案中,RCA可通过以下进行:使ssDNA环与包含随机引物混合物的引物溶液接触以形成核酸模板-引物复合物;使核酸模板-引物复合物与DNA聚合酶和三磷酸脱氧核糖核苷酸接触;和扩增核酸模板。在一些实施方案中,引物溶液包含诸如WWNNS等部分限制引物。部分限制引物可具有末端错配的引物二聚体结构。在一些实施方案中,将由核苷酸序列(W)x(N)y(S)z组成的部分限制引物用于RCA反应,其中x、y和z为相互独立的整数值,且其中x的值为2或3,y的值为2、3或4且z的值为1或2。部分限制引物可包含一个或多个核苷酸类似物。在一些实施方案中,将包含修饰核苷酸且具有末端错配引物二聚体结构的抗核酸酶的部分限制引物用于RCA反应。合适的引物序列包括但不限于+W+WNNS、W+W+NNS、+W+WNNNS、W+W+NNNS、W+W+NN*S、+W+WNN*S、W+W+NNN*S、+W+WNNN*S、W+W+N*N*S、+W+WN*N*S、W+W+NN*N*S或+W+WNN*N*S。在一些实施方案中,通过使ssDNA环与以下引物溶液接触来进行RCA反应,所述引物溶液基本上由包含末端错配引物二聚体结构并扩增ssDNA环的部分限制引物混合物组成。在另一些实施方案中,通过使ssDNA环与以下引物溶液接触来进行RCA反应,所述引物溶液基本上由包含核苷酸类似物并扩增ssDNA环的部分限制引物混合物组成。ssDNA环的RCA产生具有减少的序列缺失和减少的扩增偏好的大量DNA。ssDNA连接和扩增的整个过程可在单管中进行而无需任何中间的纯化或分离步骤。为避免非靶标扩增,可对用于连接和/或核酸扩增的试剂(例如引物溶液、连接缓冲液、DNA聚合酶)进行预加工以去除任何污染核酸。
在一些实施方案中,提供了扩增线性染色体DNA的方法。所述方法可用于染色体DNA的全基因组扩增。线性染色体DNA可为无细胞循环DNA、从***固定的石蜡包埋样品分离的DNA、法医DNA样品或古代DNA样品。线性染色体DNA可为已暴露给环境条件的且可为片段化DNA。所述方法包括以下步骤:(a)提供线性染色体DNA,(b)将线性染色体DNA与能够进行单链DNA序列的非模板依赖性分子内连接的连接酶一起孵育,以生成单链DNA环,和(c)使用随机引物混合物,经由滚环扩增来扩增单链DNA环以形成扩增的DNA产物。所述方法的所有步骤均在单个反应容器中进行而无需任何介入的分离或纯化步骤。可对用于扩增反应的各试剂进行预处理以去除任何污染核酸。可使用本领域已知的任何方法来进行扩增试剂的净化。例如,诸如净化的phi29 DNA聚合酶等净化的校正DNA聚合酶,可用于RCA反应。可通过在不存在任何dNTP的情况下将校正DNA与二价阳离子一起孵育来对其进行净化,以去除污染核酸。连接酶可为TS2126 RNA连接酶、T4 RNA连接酶、T4 DNA连接酶、T3 DNA连接酶、大肠杆菌DNA连接酶或这些酶的组合。在一个示例性实施方案中,将预腺苷化的TS2126 RNA连接酶用于单链DNA序列的非模板依赖性分子内连接。当将标准随机引物混合物用于RCA反应时,过量的盐、连接试剂和/或其它副产物的存在可抑制生成的单链DNA环的滚环扩增。用于在单个反应容器中的连接酶辅助的全基因组扩增法的随机引物混合物,包含含有至少一种核苷酸类似物的寡核苷酸序列。对随机引物混合物中的核苷酸类似物进行选择,以使其增加引物的解链温度(Tm)、防止引物二聚体形成和/或使引物耐受核酸酶。例如,在一些实施方案中,所述方法掺入包含修饰核碱基(例如2-氨基-dA)和LNA的核苷酸类似物,其增加用于在单个反应容器中的连接酶辅助的全基因组扩增的随机引物混合物的解链温度。在随机六聚体引物混合物中每包含一个2-氨基-dA碱基,使Tm增加达约3℃,以及每包含一个LNA核苷酸,使Tm增加2-8℃。修饰的随机引物混合物可进一步包含含有核碱基2-硫代-脱氧胸苷(2-硫代-dT)的核苷酸类似物,其中掺入含2-氨基-dA和2-硫代-dA的核苷酸类似物防止引物二聚体形成。另外,包含含有2-氨基-dA和2-硫代-dT的核苷酸类似物改善引物与靶核酸杂交的能力,因为2-氨基-dA与未修饰的脱氧胸苷形成三个氢键,且2-硫代-dT与其未修饰的配偶体(即脱氧腺苷(dA))形成正常的稳定配对。在随机引物混合物中使用修饰的核苷酸类似物碱基和LNA核苷酸,允许使用更严格的杂交缓冲液,从而显著减少不需要的核酸双链体的形成并降低不需要的非靶核酸扩增的发生。此外,当引物为修饰的随机引物时,高盐浓度亦可用于核酸扩增反应。与靶线性染色体DNA相比,随机引物混合物一般过量使用。可使用诸如DNA酶等核酸酶将随机引物混合物预处理以去除任何污染核酸。在一些实施方案中,在连接和扩增反应之前,使用DNA修复酶处理线性染色体DNA。在一些实施方案中,在扩增反应之前用DNA修复酶处理线性染色体DNA。在一些实施方案中,在连接反应之后但在扩增反应之前使用DNA修复酶进行处理。可通过将连接混合物与尿嘧啶DNA糖基化酶、甲酰氨基嘧啶-DNA糖基化酶或其组合一起孵育来进行处理。在较高温度下(例如用于使用TS2126 RNA连接酶的连接的条件)增加的孵育时间,具有较大的自发性DNA碱基改变事件(例如导致C-T和G-A突变的DNA碱基转换)的风险。具体而言,与双链DNA相比,单链DNA表现出更快(140倍)的自发性脱氨动力学。例如,TS2126 RNA连接酶介导的环测序阐明,使用诸如尿嘧啶DNA糖基化酶(UDG)和/或甲酰氨基嘧啶-DNA糖基化酶(Fpg)等DNA修饰酶的处理,有效阻抑C-T和G-A突变。在一些实施方案中,所述方法的各个步骤以顺序方式进行而无需任何中间的纯化或分离步骤。所述方法的各步骤一般在不存在三磷酸腺苷或三磷酸脱氧腺苷的情况下在HEPES缓冲液中进行。在一个实施方案中,扩增反应在这样的缓冲液中进行,其包含约38 mMHEPES (pH 8.0)、约18 mM MgCl2、约1 mM TCEP、约2.5 mM KOAc、约2.5% PEG-8000、约0.007% Tween-20和约40 uM随机引物混合物,所述随机引物混合物包含具有至少一种核苷酸类似物的寡核苷酸序列。在一些实施方案中,所述方法的所有步骤同时进行而无需任何中间的纯化或分离步骤。当在单个反应容器中进行连接辅助的全基因组扩增时,来自连接反应的过量的连接试剂、过量的DNA、过量的盐和/或其它杂质(例如不合乎需要的连接产物)可在连接反应之后存在于反应容器中,且在相同反应容器中进行扩增反应而无需去除任何的这些试剂、盐、DNA和/或其它杂质。在又一个实施方案中,线性染色体DNA为片段化的,且可在连接步骤之前使用多核苷酸激酶处理以生成可连接的DNA。在除三磷酸腺苷或三磷酸脱氧腺苷之外的磷酸供体存在下进行PNK反应,以使包括PNK反应、分子内连接和RCA扩增在内的所有步骤均可在单个反应容器中进行而无需任何介入的分离或纯化步骤。
在一些实施方案中,随机引物混合物包含含有至少一种修饰碱基的寡核苷酸序列。在一些实施方案中,修饰的碱基为2-氨基-脱氧腺苷(2-氨基-dA)或2-硫代-脱氧胸苷(2-硫代-dT)。在另一些实施方案中,随机引物混合物包含含有至少一个2-硫代-脱氧胸苷和至少一个2-硫代-脱氧胸苷的寡核苷酸序列。在一个示例性实施方案中,用于全基因组扩增的随机引物混合物包含形成选择性结合互补寡核苷酸(SBC寡核苷酸)的寡核苷酸。SBC寡核苷酸为含有一个或多个修饰碱基对的互补的寡核苷酸对(即,形成互补对的各成员寡核苷酸为经修饰碱基修饰的)。每个修饰碱基不与其经修饰的配偶体形成稳定的碱基对,但与其天然的(未修饰的)对应物形成特别稳定的碱基对。因此,两个互补的SBC寡核苷酸不与彼此形成稳定的双链体,但每个SBC寡核苷酸与诸如互补靶标等未修饰序列形成非常稳定的双链体。该特性使SBC双链体能够与DNA或RNA双链体靶标的正义链和反义链二者有效地结合。
在一个具体的实施方案中,用于全基因组扩增的随机引物混合物基本上由SBC寡核苷酸组成。例如,可将随机引物混合物的寡核苷酸序列中的一个或多个脱氧腺苷替换成2-氨基-脱氧腺苷,以及可将随机引物混合物的寡核苷酸序列中的一个或多个脱氧胸苷替换成2-硫代-脱氧胸苷,以生成基本上由选择性结合互补对组成的引物混合物。掺入2-氨基-dA改善寡核苷酸与其靶标杂交的能力。与未修饰的A和T之间仅两个氢键(H-键)相比,2-氨基-dA核苷酸碱基与胸腺嘧啶(T)形成三个H-键。2-氨基A:T碱基对因而具有与G:C碱基对相同数量的H-键。因此,当2-氨基-dA寡核苷酸与其未修饰靶标结合时,与未修饰的情况相比,每个加入的2-氨基-dA残基使双链体的解链温度(Tm)增高达约3℃。此外,2-氨基-dA亦使A-G摆动错配不稳定,这可能是因为A上的2-氨基和G上的2-氨基之间的空间位阻所致。因此,与其未修饰对应物相比,2-氨基-dA修饰的寡核苷酸对靶标显示更好的特异性。可通过用2-氨基-dA替换A且用2-硫代-dT替换T来制备一对极佳的SBC寡核苷酸(在本文中称为AT随机引物)。鉴于2-氨基-dA仅与2-硫代-dT形成一个氢键,所以这些修饰碱基对很弱,且相应的双链体不稳定。然而,2-氨基-dA和2-硫代-dT二者分别与T和A碱基有效结合。一般而言,与DNA 20-mer靶标退火结合的SBC 20-mer表现出比对应的DNA-DNA杂合物高10℃的Tm值,而SBC-SBC杂合物表现出低3℃的Tm值。除2-氨基-dA和2-硫代-dT之外,AT随机引物混合物中的寡核苷酸亦可包含硫代磷酸酯修饰的核苷酸或LNA核苷酸,其可进一步改善引物-靶标双链体的解链温度(Tm)、防止引物二聚体结构的形成和/或使随机引物混合物耐受核酸外切酶。
当使用标准的抗核酸酶随机六聚体时,在单个反应容器中通过连接接着RCA而无需任何介入的分离和纯化步骤进行的线性染色体DNA的单管扩增为低效的(图14)。过量的盐、连接试剂和/或其它副产物的存在抑制生成的DNA环的滚环扩增。然而,使用含有包含2-氨基-dA、2-硫代-dT、硫代磷酸酯修饰的核苷酸和LNA核苷酸的寡核苷酸序列的AT随机引物,出人意料地使连接-扩增反应能够在单个反应容器中进行而无需任何介入的分离或纯化步骤。该引物使扩增反应能够在这些缓冲条件下进行得更好,而标准的抗核酸酶随机六聚体不能在相同水平进行扩增反应。对LNA核苷酸在引物序列中的位置进行选择,以使其不占用引物序列的3’末端。在一些实施方案中,随机引物混合物中的每一个寡核苷酸序列均包含至少一个2-氨基-dA或2-硫代-dT。在一个示例性实施方案中,使用包含具有通用结构+N+N(atN)(atN)(atN)*N的六聚体寡核苷酸序列的随机引物混合物进行在单个反应容器中的经由RCA的连接酶辅助的全基因组扩增。在上述全基因组扩增法期间,通常保持随机引物混合物的浓度高于单链DNA环的浓度,以促进多重随机引发的滚环扩增。
可将连接辅助的全基因组扩增的扩增DNA产物用于生成基因组DNA文库。可通过将扩增DNA产物片段化来生成基因组文库。在一些实施方案中,片段化产物包含多联体扩增DNA产物的单个单体序列。在另一些实施方案中,片段化产物包含多联体扩增DNA产物的多于一个单体序列。可对扩增DNA产物进一步测序。可通过使用任何本领域已建立的用于DNA测序的技术来进行测序,包括NextGen测序技术。鉴于扩增DNA产物为DNA环的串联重复序列,所以扩增DNA产物的测序可用于消除与NextGen测序技术相关的测序错误。高通量DNA测序的主要限制为产生的高比率的错误碱基识别(call)。经由连接辅助的RCA扩增通过全基因组扩增生成基因组DNA文库,允许对生成的基因组DNA文库的测序错误进行稳健的下游计算修正。因为线性染色体DNA模板为环化的、使用滚环聚合酶多次串联拷贝并随后用任何高通量测序仪测序,所以可对产生的各读出(read)进行计算加工以获得原始序列的所有连接拷贝的共有序列。物理连接拷贝确保各拷贝独立来源于原始序列并允许在这样的环测序方案中有效形成共有序列。因此,本文所述的全基因组扩增的方法允许用于单管扩增全基因组接着进行生成基因组DNA文库的无错误测序的便利方案。基因组DNA文库亦可用于靶基因组DNA的基于杂交的捕获。可在溶液中或在表面内(例如基于微阵列的捕获)进行基于杂交的捕获。特别是当涉及大量样品时,基于溶液的靶标捕获一般为更可扩展且更经济的。另外,靶DNA的基于溶液的捕获提供增加的覆盖均匀性。可通过靶向重测序对捕获的靶DNA进一步测序。可选择靶DNA序列作为基因组DNA的外显子组区,以使得能够进行外显子组测序。
在一些实施方案中,提供了用于经由多重置换扩增(MDA)来扩增有限量的线性片段化DNA的方法。当用线性片段化DNA尝试时,MDA的常规方法导致扩增速度降低且序列高度偏好的扩增。此外,尤其在片段化DNA的末端附近,常常观察到显著的序列缺失。为克服这些限制,首先将片段化dsDNA转化成ssDNA。然后经由非模板依赖性分子内连接反应将ssDNA转化成单链环状DNA (即DNA环),从而消除有问题的DNA末端。即使短于500 bp的ssDNA序列亦可使用ssDNA的非模板依赖性分子内连接来进行环化。另外,当以非模板依赖性方式进行ssDNA的连接时,不需要靶序列的先备知识来产生DNA环。在环化之前,可使用PNK处理片段化DNA以修复非连接性末端。在环化片段化ssDNA之后,在环化DNA上进行MDA。可经由采用滚环扩增(RCA)法在等温条件下进行扩增反应。可使用诸如TempliPhiTM RCA试剂盒(GEHealthcare)等市购可得的RCA扩增试剂盒来进行RCA。TempliPhiTM滚环扩增使用含锁核酸的随机引物,其提供更高的灵敏性和扩增均衡性。在一些实施方案中,将抗核酸酶引物用于RCA反应。本文所公开的方法改善扩增灵敏性、减少序列缺失并允许更均衡的扩增。鉴于即便在较低浓度下亦可用较短序列来实现单链片段化DNA的非模板依赖性环化,所以当将连接酶辅助的全基因组扩增用于扩增高度片段化DNA (例如血浆中的循环DNA)时,可实现具有更快的动力学和改善的序列覆盖度的更均衡的DNA扩增。例如,对于ssDNA的非模板依赖性环化而言,ssDNA的持续长度可为低至15个核苷酸。当CIRCLIGASETM用于连接反应时,在标准条件下,几乎不产生线性多联体或环状多联体。另外,环化和扩增反应二者均可在单个容器中进行而无需任何中间的纯化或分离步骤,进而减少了污染机会并简化了扩增工作流。可将连接酶辅助的全基因组扩增法用于但不限于分析循环血浆无细胞DNA、从***固定的石蜡包埋(FFPE)样品中分离的片段化DNA、因暴露给环境条件而损坏的法医DNA样品或者古代DNA样品。扩增文库可进一步用于经由qPCR或测序靶向检测扩增序列。
包括将ssDNA片段预先连接成DNA环接着滚环扩增的本文所述的各种连接辅助的全基因组扩增法,相对于高分子量基因组DNA,均提供片段化DNA的优先扩增。例如,包含循环DNA的血浆制品可能常常被纯化过程期间从血细胞释放的基因组DNA污染。经由MDA的全基因组扩增的常规方法扩增循环DNA和基因组DNA二者。相比之下,当首先用TS2126 RNA环化片段化的循环DNA分子接着使用Phi29 DNA聚合酶经由RCA扩增环化DNA分子时,相对于高分子量基因组DNA,优先扩增循环DNA。这样的相对于基因组DNA优先扩增片段化DNA,特别适于诊断应用,因为可优先扩增诊断相关的DNA以用于下游分析(参见实施例4)。另外,与常规基于MDA的全基因组扩增相比,连接酶相关的全基因组扩增允许更稳健地扩增片段化DNA。
图1描述片段化dsDNA的连接酶辅助的全基因组扩增的一个实施方案的图示。双链DNA的持续长度高得多(约150 bp)且其固有刚度使得小于500 bp的片段的环化非常低效。另外,使用约250 bp范围的小型双链片段化DNA分子时,除非末端为适当对齐的(约10.5bp/圈),否则环化为低效的。相比之下,与双链片段化DNA相比,单链片段化DNA的环化的持续长度非常小,为约15个核苷酸。如在图1中所述,在连接酶辅助的全基因组扩增中,首先将片段化dsDNA转化成单链DNA环。这可通过将片段化双链DNA在95℃孵育足够时间以使dsDNA变性成单链来实现。然后使用能够进行单链DNA底物的非模板依赖性分子内连接的DNA或RNA连接酶处理片段化ssDNA,以生成单链DNA环。可用于分子内连接的连接酶的非限制性实例包括CIRCLIGASETM、T3 DNA连接酶、T4 RNA连接酶、Mth RNA连接酶(MthRnl1)或大肠杆菌连接酶。然后加入包括DNA聚合酶、随机引物和dNTP在内的扩增试剂以启动在单链DNA环上的RCA反应。与常规全基因组扩增法相比,使用RCA的连接酶辅助的全基因组扩增产生具有减少的序列缺失和扩增偏好的大量DNA。因此,其可用于扩增和检测甚至高度片段化的DNA。单链DNA环的生成及其通过RCA的后续扩增的整个过程均在单管中进行而无需任何介入的纯化步骤。
在一些实施方案中,提供用于片段化DNA的连接酶辅助的全基因组扩增的单管工作流,其包括加工片段化的DNA以修复非连接性DNA末端。例如,如果片段化单链DNA不含5’磷酰基和3’羟基,那么其不能在分子内连接反应中得到连接。这类非连接性DNA序列的存在可在连接酶辅助的全基因组扩增中导致扩增偏好。例如,如在图8中进行图示,在细胞死亡期间通过DNA酶II消化生成的DNA片段可包含5’羟基、3’磷酰基。来源于包含5’羟基、3’磷酰基的这类双链DNA片段的单链DNA片段,将不会在分子内连接反应中得到环化。因此,DNA酶II型断裂在全基因组扩增中可能为非代表性的。在一些实施方案中,使用激酶(例如T4多核苷酸激酶,TPK)处理片段化DNA以将片段化DNA的5’羟基磷酸化和/或将3’磷酰基去磷酸化。在反应中包含激酶,允许有效环化库中不含5’磷酸的片段。使用激酶将片段化DNA的5’端磷酸化接着扩增片段化DNA,产生更具代表性的文库。
在一些实施方案中,可通过使用T4 PNK激酶来进行片段化dsDNA的磷酸化修复。磷酸化修复可在片段化的dsDNA上进行或在变性的片段化ssDNA上进行。如果在dsDNA上进行磷酸化修复,则随后将修复的dsDNA变性成线性ssDNA,其可随后使用CIRCLIGASE IITM (缩写为CLII)进行环化。CIRCLIGASE IITM包含基本上腺苷化形式的TS2126 RNA连接酶。较高浓度的ATP或dATP抑制通过CIRCLIGASE IITM的ssDNA的非模板依赖性分子内连接。然而,通过激酶的磷酸化修复常常需要ATP的存在。另外,在不损伤DNA的情况下从反应混合物中去除ATP可能并不容易。例如,磷酸酶处理反应混合物以去除ATP,亦将导致DNA的去磷酸化(除非例如通过预腺苷化来保护DNA),因而使DNA链成为非连接性的。因此,在单管中进行片段化DNA的磷酸化修复和ssDNA环的生成而无需任何介入的纯化或分离步骤,常常很难。本文提供的方法在激酶反应期间使用GTP、CTP、UTP或dTTP替代ATP。因为CIRCLIGASE IITM更耐受GTP或备选的磷酸供体(例如CTP或UTP),所以可在单个反应容器中进行激酶修复步骤和连接步骤而无需任何介入的纯化和/或分离步骤。激酶反应混合物可进一步包含额外的试剂,例如锰盐和甜菜碱(两性离子型三甲基甘氨酸)。一旦连接,ssDNA环便可进行扩增。通过在相对低的GTP浓度下进行连接和扩增反应,本文所述的单管工作流避免了酶处理之间的间歇性净化步骤并使DNA模板损失降至最低(对于包括激酶修复、连接和扩增的单管工作流的图示,参见图9)。
在一些实施方案中,提供了用于从线性DNA生成单链DNA环的备选方法,其中所述方法在分子内连接步骤之前采用了DNA预腺苷化步骤。首先,可在ATP存在下将线性DNA与多核苷酸激酶一起孵育以生成在5’末端包含磷酸基团且在3’末端包含羟基的可连接DNA序列。然后在三磷酸腺苷存在下将可连接DNA序列与腺苷化酶一起孵育以生成5’腺苷化DNA序列。5’腺苷化DNA具有游离的3’羟基。对连接反应中的ATP浓度进行选择,以使在可连接DNA序列的3’端不发生腺苷化。然后将5’腺苷化DNA序列与非腺苷化连接酶一起孵育以生成单链DNA环,所述非腺苷化连接酶能够进行5’腺苷化DNA序列的非模板依赖性分子内连接。如果使用ATP依赖性非腺苷化连接酶进行分子内连接反应,则可能需要在分子内连接反应之前通过用磷酸酶处理反应混合物来从反应混合物中去除ATP。通常将通过磷酸酶去除的DNA的末端核苷酸上的5’磷酸,因预腺苷化所致而免受磷酸酶处理。如果DNA为双链形式的,则需要在分子内连接反应之前使之变性。所述方法的所有步骤均在单个反应容器中进行而无需任何介入的分离或纯化步骤。
在一些实施方案中,在ATP存在下使用诸如来源于嗜热古代菌嗜热自养甲烷杆菌的RNA连接酶I (Mth RNA连接酶1)等RNA连接酶来生成线性DNA的腺苷化形式。可将在自腺苷化、去腺苷化和/或腺苷转移方面缺陷的突变的或适当工程改造的非ATP依赖性连接酶用于腺苷化线性DNA的分子内连接反应,以生成单链DNA环。例如,可使用Mth RNA连接酶的基序V赖氨酸突变体(K246A)。该突变体对于预腺苷化底物具有完全连接活性。亦可使用具有用丙氨酸取代基序I中的催化性赖氨酸的Mth RNA连接酶突变体(K97A)。K97A突变体对作为供体底物的预腺苷化RNA或单链DNA (ssDNA)的活性类似,但与具有相同序列的ssDNA相比,对作为受体底物的RNA具有两倍的优选性。如果将诸如TS2126 RNA连接酶等ATP依赖性连接酶用于5’腺苷化DNA序列的分子内连接反应,则可能需要在连接反应之前去除反应中的ATP。
在一些实施方案中,提供了使用备选工作流的连接酶辅助的全基因组扩增。该工作流的图示在图11中提供。方法包括在连接和扩增之前,在ATP存在下使用激酶修复片段化DNA并使用RNA连接酶或DNA连接酶在5’端预腺苷化片段化DNA。通过使用激酶的处理,将包含具有非连接性末端的序列(例如包含5’羟基和/或3’磷酰基的序列)的片段化DNA在5’端磷酸化以及在3’端去磷酸化,以生成可连接DNA序列。然后可在ATP存在下,使用诸如MthRNA连接酶(MthRnl 1)等RNA连接酶将可连接DNA序列腺苷化,以生成片段化DNA的腺苷化形式。然后通过用磷酸酶(例如虾碱性磷酸酶(SAP))处理反应混合物来从反应混合物中去除ATP。可使用本领域可得的用于DNA的5’腺苷化的任何方法(例如RNA连接酶法、DNA连接酶法或合成法)。然后使用具有低腺苷化程度的RNA连接酶(例如CIRCLIGASE ITM)处理预腺苷化的单链线性DNA,以经由分子内连接生成DNA环。然后使用RCA扩增DNA环。在其中使用CIRCLIGASE ITM经由分子内连接生成DNA环的实施方案中,在不存在ATP的情况下进行分子内DNA连接和后续扩增反应。在激酶处理和预腺苷化反应之后从反应混合物中去除ATP为必要的,因为通过CIRCLIGASE ITM的预腺苷化ssDNA的环化受ATP抑制。在一些实施方案中,通过用磷酸酶处理将ATP转化成腺苷和磷酸酯。虽然腺苷对于环化反应而言并非为抑制性的,但所得的磷酸酯可抑制分子内连接反应。通过用磷酸酯螯合酶或者用从溶液中沉淀或去除磷酸酯的试剂(例如磷酸酯结合树脂,如LayneRT树脂)处理反应混合物,来进一步去除生成的磷酸酯。亦可通过使用酶处理反应混合物来实现磷酸酯去除,所述酶例如麦芽糖磷酸化酶,其催化麦芽糖转化成葡萄糖和葡萄糖-1-磷酸,从而从溶液中去除磷酸酯。在反应中包含激酶,允许环化和扩增库中不含5’磷酸和/或3’羟基的DNA片段,从而经由连接酶辅助的扩增建立更具代表性的文库。靶DNA的预腺苷化利于使用具有低腺苷化程度的连接酶(例如CIRCLIGASE ITM,其为约30%腺苷化的)进行分子内连接反应。这可以是令人关注的,因为具有高腺苷化程度的连接酶(例如CIRCLIGASE IITM)仅单次连接未腺苷化的DNA。因此,常常需要化学计量量的连接酶来驱动分子内连接反应至完成。相比之下,具有低腺苷化程度的连接酶(例如CIRCLIGASE ITM)具有高周转性,其可可逆地以及催化地或反复地作用于多个预腺苷化的DNA分子。这增加了连接动力学,减少了所需连接酶的量以及潜在地允许增加更困难或更复杂DNA模板的环化。
在一些实施方案中,将用于连接酶辅助的全基因组扩增的方法用于诸如全血或尿等生物样品中的循环核酸(例如来自生物样品的非细胞级分的循环DNA)的扩增和后续检测。循环核酸可来源于凋亡细胞或坏死细胞,或者可从细胞中主动释放。因为细胞核酸酶将高分子量基因组DNA降解成小型的核小体大小的片段,所以循环核酸天然为高度片段化的。高度片段化的循环核酸常常不能进行常规的核酸扩增法。另外,循环核酸以非常低的数量存在于血流中。双链循环线性核酸的标准滚环扩增(RCA)为低效且高度偏好的。在滚环扩增之前将循环核酸分离成单链并用连接酶环化,改善了效率并导致较少偏好。为使在这类稀释DNA模板情况下的良好RCA动力学和高灵敏性成为可能,在存在过量连接试剂、盐和连接反应的其它副产物的情况下,使用采用包含核苷酸类似物和/或LNA的引物的RCA法。已针对痕量DNA和单细胞扩增优化改良的RCA。
在一些实施方案中,提供了从全血中扩增循环DNA的方法。从全血的非细胞级分(例如血浆或血清)中扩增循环DNA。该方法包括以下步骤:收集全血的非细胞级分,从非细胞级分中收集循环DNA (大部分以其天然双链形式存在),使双链DNA变性以生成线性单链DNA,使循环单链DNA分子环化以生成单链DNA环,和经由滚环扩增来扩增单链DNA环。因持续长度所致,环化具有小于150 bp的序列长度的dsDNA一般为不可能的,且直至DNA长于200bp之前,环化dsDNA也非常困难。相比之下,具有15个核苷酸(nt)或更多核苷酸的序列长度的线性ssDNA分子,非常有效地被合适的连接酶环化,只要5’端为磷酸化的且3’端为羟化的便可。通过能够进行单链DNA的非模板依赖性分子内连接的连接酶来实现单链DNA的环化以生成单链DNA环。在一些实施方案中,通过使用诸如CIRCLIGASE IITM等RNA连接酶处理单链线性DNA来进行单链DNA分子的环化。
在一些实施方案中,通过在ssDNA连接步骤和RCA之前用多核苷酸激酶(PNK)将循环核酸磷酸化来进一步增加循环DNA检测的灵敏性。将PNK步骤并入工作流之后,本文所示的连接酶辅助的全基因组扩增法可在以1%水平掺加时在女性全血中检出男性循环DNA (一式三份重复)。除非ssDNA模板具有5’磷酸基团和3’羟基,否则不能实现非模板依赖性分子内连接。许多条件在DNA中产生5’羟基(包括DNA酶II酶促裂解以及血液中的磷酸酶活性)。PNK处理排除该问题且改善滚环扩增的CNA文库的多样性。
在一些实施方案中,提供了用于从线性DNA生成单链DNA环的试剂盒。在一个实施方案中,试剂盒包含包装在一起的多核苷酸激酶、磷酸供体和能够进行ssDNA序列的非模板依赖性分子内连接的预腺苷化连接酶。多核苷酸激酶可为T4 PNK。磷酸供体可选自GTP、UTP、CTP或dTTP。在一个实施方案中,试剂盒可包含TS2126连接酶。多于60%的TS2126连接酶可为预腺苷化的。试剂盒可进一步包含用于通过所提供的方法来生成单链DNA环的缓冲液(例如HEPES)、DNA扩增试剂(例如DNA聚合酶、引物、dNTP)和其它试剂(例如MnCl2、甜菜碱)。在一些实施方案中,试剂盒可包含Phi29 DNA聚合酶和随机引物/部分限制引物。在另一个实施方案中,试剂盒包含包装在一起的腺苷化酶、磷酸酶和非腺苷化连接酶。试剂盒可进一步包含多核苷酸激酶和/或磷酸供体。腺苷化酶可为来源于嗜热自养甲烷杆菌的RNA连接酶I (Mth RNA连接酶)。非腺苷化连接酶可为TS2126连接酶的组合物,其中多于60%的连接酶为非腺苷化形式的。试剂盒可进一步包含用于从线性DNA生成单链DNA环的说明书。
从下列实施例将更加充分地理解本发明的实施,在本文中显示所述实施例仅以阐述为目的且不应理解为限制如通过随附权利要求所定义的本发明的范围。用于实施例部分的某些缩写如下展开:“mg”:毫克;“ng”:纳克;“pg”:皮克;“fg”:飞克;“mL”:毫升;“mg/mL”:毫克每毫升;“mM”:毫摩尔的;“mmol”:毫摩尔;“pM”:皮摩尔的;“pmol”:皮摩尔;“μL”:微升;“min.”:分钟和“h”:小时。