RU2783536C2 - Tagmentation using immobilized transposomes with linkers - Google Patents

Tagmentation using immobilized transposomes with linkers Download PDF

Info

Publication number
RU2783536C2
RU2783536C2 RU2018140894A RU2018140894A RU2783536C2 RU 2783536 C2 RU2783536 C2 RU 2783536C2 RU 2018140894 A RU2018140894 A RU 2018140894A RU 2018140894 A RU2018140894 A RU 2018140894A RU 2783536 C2 RU2783536 C2 RU 2783536C2
Authority
RU
Russia
Prior art keywords
sequence
transposon
complex
dna
linker
Prior art date
Application number
RU2018140894A
Other languages
Russian (ru)
Other versions
RU2018140894A (en
RU2018140894A3 (en
Inventor
Грейс ДЕСАНТИС
Стивен М. ГРОСС
Цзянь-Сень ЛИ
Натали МОРРЕЛЛ
Эндрю СЛАТТЕР
Кевин ШЕН
Саманта СНОУ
Original Assignee
Иллюмина Инк.
Иллюмина Кембридж Лимитед
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Иллюмина Инк., Иллюмина Кембридж Лимитед filed Critical Иллюмина Инк.
Priority claimed from PCT/US2018/018824 external-priority patent/WO2018156519A1/en
Publication of RU2018140894A publication Critical patent/RU2018140894A/en
Publication of RU2018140894A3 publication Critical patent/RU2018140894A3/ru
Application granted granted Critical
Publication of RU2783536C2 publication Critical patent/RU2783536C2/en

Links

Images

Abstract

FIELD: biotechnology.
SUBSTANCE: group of inventions is described, including a transposome complex for tagmentation, a composition for tagmentation, modified oligonucleotide for tagmentation, a method for the production of a library of labeled fragments of nucleic acids from double-stranded target nucleic acid, a method for the production of a transposome complex bound to solid substrate, a method for obtaining a sample for sequencing. In one of implementations, the transposome complex for tagmentation contains transposase, the first and the second transposons of DNA, and a cleaved linker.
EFFECT: invention expands the arsenal of means for tagmentation.
35 cl, 12 dwg, 7 tbl, 9 ex

Description

ВКЛЮЧЕНИЕ ЛЮБЫХ ПРИОРИТЕТНЫХ ЗАЯВОК ПОСРЕДСТВОМ ССЫЛОКINCLUSION OF ANY PRIORITY APPLICATIONS VIA LINKS

[0001] Настоящая заявка испрашивает приоритет по предварительной заявке на патент США №62/461620, поданной 21 февраля 2017 г., которая включена в настоящий документ полностью посредством ссылки.[0001] The present application claims priority over U.S. Provisional Application No. 62/461,620, filed Feb. 21, 2017, which is hereby incorporated by reference in its entirety.

ССЫЛКА НА ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙLINK TO SEQUENCE LISTING

[0002] Настоящее описание включает перечень последовательностей в электронном формате. Указанный перечень последовательностей представлен файлом, имеющим название ILLINC-398WO_Sequence_Listing.txt, созданным 20 февраля 2017 г., который имеет размер приблизительно 7 кБ. Информация в электронном формате из указанного перечня последовательностей включена в настоящий документ полностью посредством ссылки.[0002] The present disclosure includes a sequence listing in electronic format. This sequence listing is represented by a file named ILLINC-398WO_Sequence_Listing.txt, created on February 20, 2017, which is approximately 7 kB in size. Information in electronic format from the specified sequence listing is incorporated herein in its entirety by reference.

ОБЛАСТЬ ТЕХНИКИFIELD OF TECHNOLOGY

[0003] Настоящее изобретение относится к способам, композициям и наборам для обработки нуклеиновых кислот, в том числе способам и композициям для фрагментации и мечения нуклеиновых кислот (например, ДНК) с применением комплексов транспосом, иммобилизованных на твердой подложке.[0003] The present invention relates to methods, compositions, and kits for processing nucleic acids, including methods and compositions for fragmenting and labeling nucleic acids (eg, DNA) using transposome complexes immobilized on a solid support.

[0004] В современных протоколах секвенирования нового поколения («next-generation sequencing)), NGS) образцов нуклеиновой кислоты обычно задействован способ получения образцов, преобразующий ДНК или РНК в библиотеку фрагментированных секвенируемых матриц. Для осуществления способов получения образцов часто требуются несколько этапов и неоднократное перенесение материала, а также дорогие инструменты для проведения фрагментации, и, соответственно, такие способы часто бывают сложными, трудоемкими, дорогими и неэффективными.[0004] Current protocols for next-generation sequencing ("next-generation sequencing"), NGS) nucleic acid samples usually involve a sample preparation method that converts DNA or RNA into a library of fragmented sequencing templates. Sample preparation methods often require multiple steps and multiple material transfers, as well as expensive fragmentation tools, and, accordingly, such methods are often complex, time consuming, expensive, and inefficient.

[0005] Согласно одному подходу библиотеки фрагментов нуклеиновых кислот могут быть получены с применением способа на основе транспосом, когда две концевые последовательности транспозона, одна из которых соединена с последовательностью метки, и транспозаза образуют комплекс транспосомы. Комплексы транспосом используют для фрагментации и мечения целевых нуклеиновых кислот в растворе с получением готовой для использования в секвенаторе тагментированной библиотеки. Комплексы транспосом могут быть иммобилизованы на твердой поверхности, например, через биотин, добавленный на 5'-конце одной из двух концевых последовательностей. Применение иммобилизованных транспосом обеспечивает значимые преимущества относительно основанных на растворенной фазе способов за счет уменьшения затрачиваемого трудового и общего времени получения библиотек, стоимости и требований к реагентам, снижения затрат на получение образцов, а также возможности использования неочищенных или разложившихся образцов в качестве стартового материала для получения библиотек. Примеры процедур транспозиции и систем для иммобилизации транспосом на твердой поверхности для обеспечения однородного размера фрагментов и выхода библиотеки подробно описаны в источниках: WO 2014/108810 и WO 2016/189331, каждый из которых включен в настоящий документ полностью посредством ссылки.[0005] According to one approach, libraries of nucleic acid fragments can be obtained using a transposome-based method, where two terminal transposon sequences, one of which is linked to a tag sequence, and the transposase form a transposome complex. Transposome complexes are used to fragment and label target nucleic acids in solution to produce a tagged library ready for use in a sequencer. Transposome complexes can be immobilized to a solid surface, for example, through biotin added at the 5' end of one of the two terminal sequences. The use of immobilized transposomes provides significant advantages over dissolved phase methods by reducing labor and total library acquisition time, cost and reagent requirements, reducing sample acquisition costs, and the ability to use crude or degraded samples as starting material for library preparation. . Examples of transposition procedures and systems for immobilizing transposomes on a solid surface to ensure uniform fragment size and library yield are detailed in WO 2014/108810 and WO 2016/189331, each of which is hereby incorporated by reference in its entirety.

[0006] Согласно определенным способам тагментации на основе гранул, описанным в РСТ-публикации WO 2016/189331 и US 2014/093916 А1, транспосомы связывают с магнитными гранулами с применением биотин-стрептавидиновых взаимодействий. Во время проведения последующего ПЦР-этапа амплификации указанного протокола, связи биотина со стрептавидином разрушают путем термической денатурации, высвобождая таким образом биотинилированный продукт тагментации в раствор. Ампликоны с представляющими интерес последовательностями, или целевые ампликоны, при необходимости могут быть обогащены, например, путем захвата с помощью гибридизации, и секвенированы.[0006] According to certain bead-based tagging methods described in PCT Publication WO 2016/189331 and US 2014/093916 A1, transposomes are associated with magnetic beads using biotin-streptavidin interactions. During the subsequent PCR amplification step of this protocol, the biotin-streptavidin bonds are broken by thermal denaturation, thus releasing the biotinylated tag product into solution. Amplicons with sequences of interest, or target amplicons, can be enriched as needed, for example by hybridization capture, and sequenced.

[0007] Однако при обогащении полученных путем тагментации библиотек с применением иммобилизованных транспосом по определенным областям генома с применением общих способов захвата с помощью гибридизации, для определенных областей в геноме может быть достигнуто более низкое обогащение по ридам по сравнению, например, с обогащением библиотек, полученных с применением транспосомных способов в растворе.[0007] However, when enriching tag-derived libraries using immobilized transposoms at specific regions of the genome using general hybridization capture techniques, lower read enrichment can be achieved for certain regions in the genome compared to, for example, enrichment of libraries derived from using transposome methods in solution.

[0008] Кроме того, стабильность связанных с подложкой комплексов транспосом варьирует в зависимости от конструкции линкера, используемого для соединения комплекса транспосомы с подложкой. В тех случаях, когда комплексы разъединяют с подложкой при хранении или во время получения библиотек, это влияет на качество и эффективность итоговой библиотеки. Соответственно, имеется потребность в комплексах иммобилизованных транспосом с улучшенной стабильностью и в ассоциированных способах, демонстрирующих улучшенную эффективность при получении тагментированных библиотек, что, в свою очередь, обеспечивает увеличение обогащения по ридам в итоговых библиотеках. Имеется также потребность в композициях и способах для усовершенствования обогащения по ридам итоговых библиотек.[0008] In addition, the stability of support-bound transposome complexes varies depending on the design of the linker used to connect the transposome-support complex. When the complexes are released from the support during storage or during library preparation, the quality and efficiency of the final library is affected. Accordingly, there is a need for immobilized transposome complexes with improved stability and associated methods that demonstrate improved efficiency in obtaining tagged libraries, which in turn provides increased read enrichment in the resulting libraries. There is also a need for compositions and methods for improving read enrichment of the resulting libraries.

[0009] Настоящее изобретение относится к связанным с подложкой комплексам транспосом с модифицированными линкерами и размещением компонентов. Согласно настоящему изобретению предложены способы и композиции для получения готовых для секвенирования библиотек нуклеиновых кислот с применением таких модифицированных комплексов.[0009] The present invention relates to support-bound transposome complexes with modified linkers and component placement. The present invention provides methods and compositions for preparing sequencing-ready nucleic acid libraries using such modified complexes.

КРАТКОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯBRIEF DESCRIPTION OF THE INVENTION

[0010] Настоящее изобретение относится к способам, композициям и наборам для обработки нуклеиновых кислот, в том числе способам и композициям для фрагментации и мечения ДНК с применением комплексов транспосом на твердой подложке.[0010] The present invention relates to methods, compositions and kits for processing nucleic acids, including methods and compositions for DNA fragmentation and labeling using transposome complexes on a solid support.

[0011] Согласно настоящему изобретению предложен комплекс транспосомы, содержащий транспозазу, первый транспозон и второй транспозон, при этом первый транспозон содержит (а) 3'-часть, содержащую концевую последовательность указанного первого транспозона и (b) первую адапторную последовательность на 5'-конце концевой последовательности указанного первого транспозона, а второй транспозон содержит концевую последовательность второго транспозона, комплементарную по меньшей мере части концевой последовательности первого транспозона. Как правило, концевую последовательность первого транспозона и концевую последовательность второго транспозона аннелируют с формированием двухцепочечной концевой последовательности транспозона, распознаваемой транспозазой, комбинации, которая образует функциональный комплекс транспосомы.[0011] The present invention provides a transposome complex comprising a transposase, a first transposon, and a second transposon, wherein the first transposon comprises (a) a 3' portion containing the terminal sequence of said first transposon and (b) a first adapter sequence at the 5' end the terminal sequence of said first transposon, and the second transposon contains the terminal sequence of the second transposon, complementary to at least part of the terminal sequence of the first transposon. Typically, the terminal sequence of the first transposon and the terminal sequence of the second transposon are annulated to form a double-stranded transposon terminal sequence recognized by the transposase, a combination that forms a functional transposome complex.

[0012] Согласно некоторым аспектам указанный комплекс транспосомы содержит расщепляемый линкер, способный соединять первый транспозон (и соответственно указанный комплекс) с твердой подложкой. Согласно таким аспектам первый конец расщепляемого линкера присоединен к 5'-концу указанной первой адапторной последовательности, и согласно некоторым аспектам второй конец указанного расщепляемого линкера присоединен к аффинному элементу. Указанный аффинный элемент способен к связыванию (ковалентному или нековалентному) с партнером для аффинного связывания на твердой подложке. Согласно некоторым аспектам указанный аффинный элемент связывают (ковалентно или нековалентно) с партнером для аффинного связывания на твердой подложке, с получением связанного с твердой подложкой комплекса транспосомы. Указанные комплексы представляют собой комплексы транспосом с 5'-линкерами и связанные с твердой подложкой комплексы транспосом с 5'-линкерами.[0012] In some aspects, said transposome complex contains a cleavable linker capable of connecting the first transposon (and said complex, respectively) to a solid support. In such aspects, the first end of the cleavable linker is attached to the 5' end of said first adapter sequence, and in some aspects, the second end of said cleavable linker is attached to the affinity element. Said affinity element is capable of binding (covalently or non-covalently) to an affinity binding partner on a solid support. In some aspects, said affinity element is linked (covalently or non-covalently) to an affinity binding partner on a solid support to form a solid support-bound transposome complex. These complexes are complexes of transposomes with 5'-linkers and solid-supported complexes of transposomes with 5'-linkers.

[0013] Согласно другим аспектам комплекс транспосомы содержит 3'-линкер, способный соединять второй транспозон (и, соответственно, указанный комплекс) с твердой подложкой. Согласно таким аспектам первый конец указанного линкера присоединен к 3'-концу указанного второго транспозона, а второй конец указанного линкера присоединен к аффинному элементу. Указанный аффинный элемент способен к связыванию (ковалентно или нековалентно) с партнером для аффинного связывания на твердой подложке. Согласно некоторым аспектам указанный аффинный элемент связывают (ковалентно или нековалентно) с партнером для аффинного связывания на твердой подложке, с получением связанного с твердой подложкой комплекса транспосомы. Согласно некоторым аспектам указанный линкер представляет собой расщепляемый линкер. Указанные комплексы представляют собой комплексы транспосом с 3'-линкерами и связанные с твердой подложкой комплексы транспосом с 3'-линкерами.[0013] According to other aspects, the transposome complex contains a 3'-linker capable of connecting the second transposon (and, accordingly, the specified complex) with a solid support. In such aspects, the first end of said linker is attached to the 3' end of said second transposon, and the second end of said linker is attached to an affinity element. Said affinity element is capable of binding (covalently or non-covalently) to an affinity binding partner on a solid support. In some aspects, said affinity element is linked (covalently or non-covalently) to an affinity binding partner on a solid support to form a solid support-bound transposome complex. In some aspects, said linker is a cleavable linker. These complexes are transposome complexes with 3' linkers and solid support complexes of transposoms with 3' linkers.

[0014] Согласно некоторым аспектам настоящее изобретение относится к модифицированным олигонуклеотидам. Согласно некоторым аспектам указанный модифицированный олигонуклеотид содержит первый транспозон и второй транспозон, при этом указанный первый транспозон содержит (а) 3'-часть, содержащую концевую последовательность первого транспозона и (b) первую адапторную последовательность на 5'-конце концевой последовательности первого транспозона, а указанный второй транспозон содержит концевую последовательность второго транспозона, комплементарную по меньшей мере части концевой последовательности первого транспозона и аннелированную с ней; при этом первый конец расщепляемого линкера присоединен к 5'-концу указанной первой адапторной последовательности; и, согласно некоторым аспектам, второй конец указанного расщепляемого линкера присоединен к аффинному элементу.[0014] According to some aspects, the present invention relates to modified oligonucleotides. In some aspects, said modified oligonucleotide comprises a first transposon and a second transposon, wherein said first transposon comprises (a) a 3' portion containing the first transposon terminal sequence and (b) a first adapter sequence at the 5' end of the first transposon terminal sequence, and the specified second transposon contains the terminal sequence of the second transposon, complementary to at least part of the terminal sequence of the first transposon and annelated with it; wherein the first end of the cleavable linker is attached to the 5' end of said first adapter sequence; and, in some aspects, the second end of said cleavable linker is attached to an affinity element.

[0015] Согласно другим аспектам указанный модифицированный олигонуклеотид содержит первый транспозон и второй транспозон, при этом указанный первый транспозон содержит (а) 3'-часть, содержащую концевую последовательность первого транспозона и (b) первую адапторную последовательность на 5'-конце концевой последовательности первого транспозона, а указанный второй транспозон содержит концевую последовательность второго транспозона, комплементарную по меньшей мере части указанной первой концевой последовательности и аннелированную с ней, при этом первый конец линкера присоединен к 3'-концу указанного второго транспозона, а второй конец линкера присоединен к аффинному элементу. Согласно некоторым аспектам указанный линкер представляет собой расщепляемый линкер.[0015] According to other aspects, said modified oligonucleotide comprises a first transposon and a second transposon, wherein said first transposon comprises (a) a 3' portion containing the terminal sequence of the first transposon and (b) a first adapter sequence at the 5' end of the terminal sequence of the first transposon, and the specified second transposon contains the terminal sequence of the second transposon, complementary to at least part of the specified first terminal sequence and annelated with it, wherein the first end of the linker is attached to the 3'-end of the specified second transposon, and the second end of the linker is attached to the affinity element. In some aspects, said linker is a cleavable linker.

[0016] Согласно некоторым вариантам реализации комплекса транспосомы с 3 '-линкером аффинный элемент и линкер имеют структуру формулы (I), (I'), (Ia), (Ib), (Ic), (I(a)), (I(b)) или (I(c)) согласно описанию в настоящем документе. Согласно некоторым аспектам аффинный элемент ковалентно связан с 3'-концом второго транспозона, при этом указанный аффинный элемент и линкер имеют структуру формулы (I):[0016] In some embodiments of the transposome complex with the 3' linker, the affinity element and the linker have the structure of formula (I), (I'), (Ia), (Ib), (Ic), (I(a)), ( I(b)) or (I(c)) as described herein. In some aspects, the affinity element is covalently linked to the 3' end of the second transposon, said affinity element and linker having the structure of formula (I):

Figure 00000001
Figure 00000001

где:where:

АЭ представляет собой аффинный элемент;AE is an affine element;

Y представляет собой алкилен С2-6,Y is a C 2-6 alkylene,

X1 представляет собой О, NR1 или S;X 1 is O, NR 1 or S;

где R1 представляет собой Н или алкил C1-10;where R 1 represents H or alkyl C 1-10 ;

n представляет собой целое число, выбранное из группы, состоящей из 1, 2, 3, 4, 5 и 6;n is an integer selected from the group consisting of 1, 2, 3, 4, 5 and 6;

X2 представляет собой О, СH2 или S;X 2 represents O, CH 2 or S;

Ra представляет собой Н или -ОН; иR a is H or -OH; and

Z отсутствует, если Ra представляет собой Н, или представляет собой СH2, если Ra представляет собой Н или ОН;Z is absent if R a is H, or is CH 2 if R a is H or OH;

при этом символом

Figure 00000002
обозначена точка присоединения ко второму транспозону.while the symbol
Figure 00000002
the point of attachment to the second transposon is indicated.

[0017] Согласно некоторым аспектам линкер, описанный в настоящем документе, представляет собой 5'-линкер, при этом фосфатная группа в формуле (I) представляет собой концевую фосфатную группу в 5'-положении концевого нуклеотида первого транспозона. Согласно некоторым аспектам линкер, описанный в настоящем документе, представляет собой 3'-линкер, при этом фосфатная группа в формуле (I) соединена с 3'-гидроксилом олигонуклеотида второго транспозона, таким как 3'-концевой нуклеотид.[0017] In some aspects, the linker described herein is a 5' linker, wherein the phosphate group in formula (I) is the terminal phosphate group at the 5' position of the terminal nucleotide of the first transposon. In some aspects, the linker described herein is a 3'-linker, wherein the phosphate group in formula (I) is connected to the 3'-hydroxyl of a second transposon oligonucleotide, such as the 3'-terminal nucleotide.

[0018] Согласно другим аспектам настоящего изобретения предложены способы получения библиотеки меченых фрагментов нуклеиновых кислот из двухцепочечной целевой нуклеиновой кислоты, включающие инкубацию мишени с комплексом транспосомы, связанным с твердой подложкой, согласно описанию в настоящем документе. Согласно некоторым аспектам указанные способы включают обработку мишени иммобилизованным комплексом транспосомы в условиях, отличающихся тем, что указанная мишень фрагментирована, а 3'-конец первого транспозона присоединен к 5'-концам целевых фрагментов с получением множества 5'-меченых целевых фрагментов. Согласно некоторым вариантам реализации используют множество комплексов транспосом.[0018] According to other aspects of the present invention, methods are provided for obtaining a library of labeled nucleic acid fragments from a double-stranded target nucleic acid, comprising incubating a target with a transposome complex bound to a solid support, as described herein. In some aspects, these methods include treating a target with an immobilized transposome complex under conditions characterized in that said target is fragmented and the 3' end of the first transposon is attached to the 5' ends of the target fragments to produce a plurality of 5' labeled target fragments. In some embodiments, multiple transposome complexes are used.

[0019] Согласно некоторым вариантам реализации указанные способы дополнительно включают амплификацию одного или более из 5'-меченых целевых фрагментов. Согласно некоторым вариантам реализации указанные способы дополнительно включают секвенирование одного или более из 5'-меченых целевых фрагментов или продуктов их амплификации.[0019] In some embodiments, these methods further comprise amplifying one or more of the 5' labeled target fragments. In some embodiments, these methods further comprise sequencing one or more of the 5' labeled target fragments or amplification products thereof.

[0020] Соответственно, некоторые дополнительные варианты реализации настоящего изобретения относятся к способу получения библиотеки меченых фрагментов нуклеиновых кислот, включающему:[0020] Accordingly, some additional embodiments of the present invention relate to a method for obtaining a library of labeled nucleic acid fragments, including:

получение твердой подложки, содержащей иммобилизованный на ней комплекс транспосомы согласно описанию в настоящем документе; иobtaining a solid support containing a transposome complex immobilized thereon as described herein; and

приведение указанной твердой подложки в контакт с двухцепочечной целевой нуклеиновой кислотой в условиях, достаточных для фрагментации указанной целевой нуклеиновой кислоты на множество целевых фрагментов, и для присоединения 3'-конца указанного первого транспозона к 5'-концам целевых фрагментов с получением множества 5'-меченых целевых фрагментов.bringing said solid support into contact with a double-stranded target nucleic acid under conditions sufficient to fragment said target nucleic acid into a plurality of target fragments and to attach the 3' end of said first transposon to the 5' ends of the target fragments to produce a plurality of 5'-labeled target fragments.

[0021] Согласно некоторым аспектам указанный способ дополнительно включает амплификацию указанных 5'-меченых целевых фрагментов.[0021] In some aspects, said method further comprises amplifying said 5' labeled target fragments.

[0022] Согласно некоторым аспектам настоящего изобретения предложена библиотека 5'-меченых целевых фрагментов, полученных с применением способов, описанных в настоящем документе.[0022] According to some aspects of the present invention, a library of 5'-labeled target fragments is provided, obtained using the methods described herein.

[0023] Согласно настоящему изобретению также предложены способы получения модифицированных олигонуклеотид о в, комплексов транспосом и связанных с твердой подложкой комплексов транспосом согласно описанию в настоящем документе. Согласно некоторым аспектам такие способы включают обработку транспозазы первым и вторым транспозонами согласно описанию в настоящем документе в условиях, подходящих для образования указанного комплекса. Способы получения связанного с твердой подложкой комплекса транспосомы включают инкубацию комплекса транспосомы согласно описанию в настоящем документе с твердой подложкой, содержащей партнер для аффинного связывания, в условиях, достаточных для того, чтобы аффинный элемент связался (ковалентно или нековалентно) с указанным партнером для аффинного связывания.[0023] The present invention also provides methods for preparing modified oligonucleotide o's, transposome complexes, and solid-supported transposome complexes as described herein. In some aspects, such methods include treating the transposase with the first and second transposons as described herein under conditions suitable to form said complex. Methods for preparing a solid support-bound transposome complex include incubating the transposome complex as described herein with a solid support containing an affinity binding partner under conditions sufficient to cause the affinity element to bind (covalently or non-covalently) to said affinity binding partner.

[0024] Согласно некоторым вариантам реализации композиций и способов, описанных в настоящем документе, комплексы транспосом содержат две популяции, отличающиеся тем, что первые адапторные последовательности в каждой популяции различаются.[0024] In some embodiments of the compositions and methods described herein, transposome complexes comprise two populations, characterized in that the first adapter sequences in each population are different.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙBRIEF DESCRIPTION OF THE DRAWINGS

[0025] На фиг. 1 приведены примеры этапов способа закрепления варианта реализации комплекса транспосомы на поверхности гранул.[0025] In FIG. 1 shows examples of the steps of the method for attaching an embodiment of the transposome complex to the surface of the beads.

[0026] На фиг. 2 приведена схематическая диаграмма примера процесса тагментации на поверхности гранул путем образования кластеров на проточной ячейке.[0026] FIG. 2 is a schematic diagram of an example of the process of tagmentation on the surface of the granules by the formation of clusters on the flow cell.

[0027] На фиг. 3 представлены примеры этапов способа фрагментации и мечения ДНК с применением комплексов транспосом, иммобилизованных на поверхности гранул, с последующим целевым обогащением, приводящим к загрязнению нецелевыми ридами.[0027] FIG. Figure 3 shows exemplary steps in the DNA fragmentation and labeling process using transposome complexes immobilized on the surface of beads, followed by targeted enrichment resulting in contamination with non-targeted reads.

[0028] На фиг. 4 представлены примеры этапов способа фрагментации и мечения ДНК с применением комплексов транспосом, иммобилизованных на поверхности гранул посредством расщепляемого ферментативным путем линкера, с последующим целевым обогащением.[0028] In FIG. 4 shows exemplary steps in the DNA fragmentation and labeling process using transposome complexes immobilized on the surface of beads via an enzymatically cleavable linker, followed by targeted enrichment.

[0029] На фиг. 5А представлен пример биотинилированного 5'-конца последовательности транспозона, присоединенного к твердой поверхности для тагментации и последующей амплификации.[0029] FIG. 5A shows an example of a biotinylated 5' end of a transposon sequence attached to a solid surface for tagmentation and subsequent amplification.

[0030] На фиг. 5В представлен пример биотинилированного 3'-конца последовательности транспозона, присоединенного к твердой поверхности для тагментации и последующей амплификации.[0030] FIG. 5B shows an example of a biotinylated 3' end of a transposon sequence attached to a solid surface for tagmentation and subsequent amplification.

[0031] На фиг. 6А представлено сравнение выхода библиотеки при твердофазной тагментации на основе гранул со стрептавидином с применением комплексов транспосом, содержащих два разных 3'-биотинилированных линкера.[0031] In FIG. 6A shows a comparison of library yield from solid-phase streptavidin bead tagging using transposome complexes containing two different 3'-biotinylated linkers.

[0032] На фиг. 6В приведены данные исследования стабильности при ускоренном старении для библиотеки образцов, полученной путем твердофазной тагментации на основе гранул со стрептавидином с применением комплекса транспосомы, содержащего 3'-биотинилированный линкер формулы (I(a)), после старения в течение 4 месяцев, со сравнением с библиотекой образцов, полученной из не подвергавшейся старению партии того же комплекса (контроль).[0032] FIG. 6B shows accelerated aging stability data for a library of samples obtained by streptavidin bead solid-phase tagging using a transposome complex containing a 3'-biotinylated linker of formula (I(a)), after aging for 4 months, compared with a library of samples obtained from an unaged batch of the same complex (control).

[0033] На фиг. 6С продемонстрированы данные исследования стабильности с ускоренным старением библиотеки образцов, полученной из комплекса транспосомы, содержащего 3'-биотинилированный линкер формулы (I(c)), после старения в течение 4 месяцев и 8 месяцев, со сравнением с библиотеками образцов, полученных из не подвергавшейся старению комплексов (контролей).[0033] FIG. 6C shows data from an accelerated aging stability study of a sample library derived from a transposome complex containing a 3'-biotinylated linker of formula (I(c)), after aging for 4 months and 8 months, compared with sample libraries derived from untreated aging complexes (controls).

[0034] На фиг. 7А продемонстрирован целевой размер инсерций молекул ДНК как функция от плотности указанного комплекса при получении библиотеки с применением твердофазного способа на основе гранул со стрептавидином, когда указанные гранулы содержат иммобилизованный комплекс транспосомы, связанный с ними 3'-биотинилированным линкером.[0034] FIG. 7A shows the target DNA insertion size as a function of the density of said complex in library preparation using the solid phase streptavidin bead method, when said beads contain an immobilized transposome complex linked to them by a 3'-biotinylated linker.

[0035] На фиг. 7В представлен линейный график, отражающий целевой размер инсерций молекул ДНК как функции от условий SPRI (твердофазной обратимой иммобилизации, «solid phase reversible immobilization))) при применении гранул со стрептавидином с иммобилизованным комплексом транспосомы, содержащим гиперактивную транспозазу Tn5 и 3'биотинилированный линкер, при плотности комплекса 100 нМ.[0035] FIG. 7B is a line graph showing the target DNA insertion size as a function of SPRI (solid phase reversible immobilization) conditions using streptavidin beads with an immobilized transposome complex containing hyperactive Tn5 transposase and a 3' biotinylated linker, when complex density 100 nM.

[0036] На фиг. 7С представлен линейный график, отражающий целевой размер инсерций молекул ДНК как функции от условий SPRI при применении гранул со стрептавидином с иммобилизованным комплексом транспосомы, содержащим гиперактивную транспозазу Tn5 и 3'-биотинилированный линкер, при плотности комплекса 600 нМ.[0036] FIG. 7C is a line graph showing the target DNA insertion size as a function of SPRI conditions using streptavidin beads with an immobilized transposome complex containing an overactive Tn5 transposase and a 3'-biotinylated linker at a complex density of 600 nM.

ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯDETAILED DESCRIPTION OF THE INVENTION

[0037] Библиотеки фрагментированных нуклеиновых кислот часто получают из геномных нуклеиновых кислот для применения при секвенировании нового поколения (NGS). Согласно настоящему изобретению предложены способы, композиции и наборы для применения в способе получения иммобилизованных транспозиционных библиотек. Указанный способ получения иммобилизованных транспозиционных библиотек представляет собой быстрый способ относительно других способов получения библиотек и эффективен для получения библиотек как из первичных или неочищенных образцов (таких как кровь, мокрота, клеточные экстракты и т.п.), так и очищенных образцов (таких как очищенные геномные нуклеиновые кислоты). Обычно транспосому иммобилизуют на субстрате, таком как предметное стекло (слайд) или гранула, с применением партнеров для ковалентного или не ковалентно го связывания, например, аффинного элемента и партнера для аффинного связывания (фиг. 1). Например, комплекс транспосомы иммобилизуют на покрытой стрептавидином грануле посредством биотинилированного линкера, присоединенного к комплексу транспосомы. Целевые нуклеиновые кислоты захватывают иммобилизованным комплексом транспосомы, фрагментируют и метят («тагментация»). Меченые фрагменты амплифицируют, представляющие интерес ампликоны необязательно захватывают (например, посредством зондов для гибридизации); и меченые фрагменты секвенируют.[0037] Libraries of fragmented nucleic acids are often derived from genomic nucleic acids for use in next generation sequencing (NGS). The present invention provides methods, compositions and kits for use in a process for preparing immobilized transposition libraries. This method for obtaining immobilized transposition libraries is a fast method relative to other methods for obtaining libraries and is effective for obtaining libraries from both primary or crude samples (such as blood, sputum, cell extracts, etc.) and purified samples (such as purified genomic nucleic acids). Typically, the transposome is immobilized on a substrate such as a glass slide (slide) or bead using covalent or non-covalent binding partners such as an affinity element and an affinity binding partner (Figure 1). For example, the transposome complex is immobilized on a streptavidin-coated bead via a biotinylated linker attached to the transposome complex. Target nucleic acids are captured by the immobilized transposome complex, fragmented and labeled ("tagging"). Labeled fragments are amplified, amplicons of interest are optionally captured (eg, via hybridization probes); and the labeled fragments are sequenced.

[0038] При использовании соединенных с твердой подложкой комплексов транспосом для получения библиотек уменьшается необходимость в нормировании образцов, вводимых в процесс получения библиотеки, и в нормировании результатов получения библиотеки до этапов обогащения или секвенирования. Применение указанных комплексов также позволяет получать библиотеки с более стабильными размерами инсерций по сравнению со способами, осуществляемыми в фазе раствора, даже при использовании варьирующих концентраций вводимых образцов. Однако, согласно наблюдениям, определенные комплексы транспосом с биотинилированными линкерами отличаются пониженной стабильностью. Кроме того, определенные конфигурации связанных на подложке комплексов обуславливают получение нецелевых продуктов; в частности, при гибридизации и захвате ампликонов 5'-меченых целевых фрагментов может происходить загрязнение фрагментами нуклеиновых кислот, все еще гибридизованных с иммобилизованными нуклеиновыми кислотами (фиг. 3). Указанная неэффективность может приводить к потерям реагентов и пространства в инструменте для секвенирования или проточной ячейке, потраченных на нецелевые фрагменты, и данных секвенирования. Согласно настоящему изобретению предложены различные варианты дизайна комплекса транспосомы для решения проблем, связанных с качеством библиотек и снижения нецелевого захвата, и комплексы с модифицированными линкерами, которые демонстрируют улучшенную химическую стабильность.[0038] When using solid-supported transposome complexes for library generation, the need for standardization of samples introduced into the library production process and for standardization of library production results prior to enrichment or sequencing steps is reduced. The use of these complexes also makes it possible to obtain libraries with more stable insertion sizes compared to methods carried out in the solution phase, even when using varying concentrations of injected samples. However, certain transposome complexes with biotinylated linkers have been observed to be less stable. In addition, certain configurations of the complexes bound on the substrate cause non-target products to be obtained; in particular, hybridization and capture of amplicons of 5'-labeled target fragments may result in contamination with nucleic acid fragments still hybridized to immobilized nucleic acids (FIG. 3). This inefficiency can result in wasted reagents and space in the sequencing instrument or flow cell, wasted on non-target fragments, and sequencing data. The present invention provides various design options for the transposome complex to address library quality issues and reduce off-target uptake, and complexes with modified linkers that exhibit improved chemical stability.

[0039] Согласно некоторым вариантам реализации библиотеки нуклеиновых кислот, полученные с применением способов согласно описанию в настоящем документе, могут быть секвенированы с применением любой подходящей платформы для секвенирования нуклеиновых кислот для определения последовательности нуклеиновой кислоты целевой последовательности. До некоторой степени представляющие интерес последовательности коррелируют или ассоциированы с одним или более врожденными или наследственными расстройствами, патогенностью, устойчивостью к антибиотикам или генетическими модификациями. Секвенирование может применяться для определения последовательности нуклеиновых кислот короткого тандемного повтора, однонуклеотидного полиморфизма, гена, экзона, кодирующей области, экзома или частей перечисленного. Соответственно, способы и композиции, описанные в настоящем документе, относятся к созданию секвенируемых библиотек, подходящих, не ограничиваясь перечисленным, для диагностики, прогнозирования и терапии рака и заболеваний, применения для «фингерпринтинга» ДНК (например, работы с базами данных ДНК, работы с материалами уголовных дел), метагеномных исследований и поиска, применения в агрогеномике, а также для идентификации и мониторинга патогенов.[0039] In some embodiments, nucleic acid libraries obtained using the methods described herein can be sequenced using any suitable nucleic acid sequencing platform to determine the nucleic acid sequence of the target sequence. To some extent, sequences of interest correlate or are associated with one or more congenital or inherited disorders, pathogenicity, antibiotic resistance, or genetic modifications. Sequencing can be used to determine the nucleic acid sequence of a short tandem repeat, single nucleotide polymorphism, gene, exon, coding region, exome, or portions thereof. Accordingly, the methods and compositions described herein relate to the generation of sequencing libraries suitable for, but not limited to, cancer and disease diagnosis, prognosis, and therapy, DNA fingerprinting applications (e.g., DNA database manipulation, materials of criminal cases), metagenomic research and search, applications in agrogenomics, as well as for the identification and monitoring of pathogens.

[0040] Количество этапов, необходимых для трансформации целевой нуклеиновой кислоты, такой как ДНК, в модифицированные адапторами матрицы, готовые для использования при секвенировании нового поколения, может быть минимизировано за счет применения опосредованных транспозазой фрагментации и мечения. Указанный процесс, называемый в настоящем документе «тагментацией», часто включает модификацию целевой нуклеиновой кислоты комплексом транспосомы, содержащим фермент транспозазу в комплексе с парой транспозонов, включающих одноцепочечную адапторную последовательность и двухцепочечную концевую область последовательности транспозона, наряду с необязательными дополнительными последовательностями, разработанными с конкретной целью. Тагментация приводит к одновременной фрагментации целевой нуклеиновой кислоты и лигированию адаптеров с 5'-концами обоих цепей дуплексных фрагментов нуклеиновых кислот. При связывании комплексов транспосом с подложкой итоговые фрагменты связываются с твердой подложкой после реакции тагментации (либо прямо, в случае 5'-связанных комплексов транспосом, либо путем гибридизации в случае 3'-связанных комплексов транспосом).[0040] The number of steps required to transform a target nucleic acid, such as DNA, into adapter-modified templates ready for use in next generation sequencing can be minimized by the use of transposase-mediated fragmentation and labeling. This process, referred to herein as "tagmentation", often involves the modification of a target nucleic acid with a transposome complex containing the transposase enzyme complexed with a pair of transposons comprising a single-stranded adapter sequence and a double-stranded terminal region of the transposon sequence, along with optional additional sequences designed for a specific purpose. . Tagging results in simultaneous fragmentation of the target nucleic acid and ligation of adapters to the 5' ends of both strands of duplex nucleic acid fragments. Upon binding of transposome complexes to a support, the resulting fragments are bound to a solid support after a tagmentation reaction (either directly, in the case of 5'-linked transposome complexes, or by hybridization, in the case of 3'-linked transposome complexes).

[0041] Если не указано иное, все технические и научные термины в настоящем документе имеют общепринятые среди специалистов в соответствующей области техники значения. Все патенты, заявки, опубликованные заявки и другие публикации, упоминаемые в настоящем документе, полностью включены посредством ссылок, если не указано иное. В тех случаях, когда в настоящем документе использовано несколько определений термина, определения в настоящем разделе имеют решающее значение, если не указано иное. В настоящем описании и прилагаемой формуле изобретения термины в единственном числе, включая предваряемые дополнением «указанный» или «указанные», включают соответствующие термины во множественном числе, если иное явным образом не следует из контекста. Если не указано иное, используются стандартные методы масс-спектроскопии, ЯМР, ВЭЖХ, химии белков, биохимии, методики рекомбинантной ДНК и фармакологии. При применении терминов «или» или «и» подразумевается «и/или», если не указано иное. Кроме того, использование термина «включающий», а также других его форм, таких как «включают», «включает» и «включенный», является неограничивающим. При использовании в настоящем описании, в переходном выражении или в основной части пункта, термины «содержать», «содержит» и «содержащий» должны быть истолкованы как включающие открытое значение, то есть указанные термины должны быть истолкованы синонимичным выражениям «содержащий по меньшей мере» или «включающий по меньшей мере» образом. В контексте способа термин «содержащий»/«включающий» означает, что указанный способ включает по меньшей мере упоминаемые этапы, однако может включать и дополнительные этапы. При использовании в контексте соединения, композиции или устройства термин «содержащий» означает, что указанное соединение, указанная композиция или указанное устройство включает по меньшей мере упомянутые признаки или компоненты, однако может также включать дополнительные признаки или компоненты.[0041] Unless otherwise indicated, all technical and scientific terms in this document have the meanings generally accepted among specialists in the relevant field of technology. All patents, applications, published applications, and other publications referenced herein are incorporated by reference in their entirety unless otherwise noted. Where multiple definitions of a term are used in this document, the definitions in this section govern unless otherwise noted. In the present description and the appended claims, terms in the singular, including those preceded by the addition "specified" or "specified", include the corresponding terms in the plural, unless otherwise clearly follows from the context. Unless otherwise noted, standard methods of mass spectroscopy, NMR, HPLC, protein chemistry, biochemistry, recombinant DNA techniques, and pharmacology are used. When the terms "or" or "and" are used, "and/or" is meant unless otherwise indicated. In addition, the use of the term "including", as well as its other forms, such as "include", "includes" and "included", is non-limiting. When used in the present description, in a transitional expression or in the main body of a clause, the terms "comprise", "comprises" and "comprising" should be construed as including an open meaning, that is, these terms should be construed as synonymous with the expressions "comprising at least" or "including at least" in a manner. In the context of a method, the term "comprising"/"comprising" means that said method includes at least the steps mentioned, but may include additional steps. When used in the context of a compound, composition, or device, the term "comprising" means that said compound, said composition, or said device includes at least the features or components mentioned, but may also include additional features or components.

[0042] Названия разделов в настоящем документе служат исключительно организационным целям и не должны быть истолкованы как ограничивающие описываемый предмет изобретения.[0042] The section headings herein are for organizational purposes only and should not be construed as limiting the subject matter being described.

Химическая терминологияChemical terminology

[0043] В настоящем документе «алкил» относится к прямой или разветвленной углеводородной цепи, которая полностью насыщена (т.е. не содержит двойных или тройных связей). Указанная алкильная группа может содержать от 1 до 20 атомов углерода (в любом разделе настоящего документа указанный диапазон числовых значений, такой как «от 1 до 20», относится к любому целому числу в заданном диапазоне; например, «от 1 до 20 атомов углерода» означает, что алкильная группа может состоять из 1 атома углерода, 2 атомов углерода, 3 атомов углерода и так далее, до 20 атомов углерода включительно, хотя настоящим определением также охвачено употребление термина «алкил» без указания диапазона числовых значений). Указанная алкильная группа может также представлять собой алкил среднего размера, содержащий от 1 до 9 атомов углерода. Указанная алкильная группа может также представлять собой низший алкил, содержащий от 1 до 6 атомов углерода. Указанная алкильная группа может быть обозначена как «алкил C1-4» или аналогичным образом. Например, «алкил C1-6» означает наличие от одного до шести атомов углерода в алкильной цепи, т.е. указанная алкильная цепь выбрана из группы, состоящей из метила, этила, пропила, изопропила, н-бутила, изобутила, втор-бутила и трет-бутила. Типичные алкильные группы включают метил, этил, пропил, изопропил, бутил, изобутил, третичный бутил, пентил, гексил и т.п., однако никоим образом не ограничиваются перечисленными группами.[0043] As used herein, "alkyl" refers to a straight or branched hydrocarbon chain that is fully saturated (ie, contains no double or triple bonds). The specified alkyl group may contain from 1 to 20 carbon atoms (in any section of this document, a specified range of numerical values, such as "from 1 to 20", refers to any integer in a given range; for example, "from 1 to 20 carbon atoms" means that an alkyl group may consist of 1 carbon, 2 carbons, 3 carbons, and so on up to and including 20 carbons, although this definition also covers the use of the term "alkyl" without specifying a range of numerical values). Said alkyl group may also be a medium sized alkyl having 1 to 9 carbon atoms. Said alkyl group may also be a lower alkyl containing from 1 to 6 carbon atoms. Said alkyl group may be referred to as "C 1-4 alkyl" or the like. For example, "alkyl C 1-6 "means the presence of from one to six carbon atoms in the alkyl chain, ie. said alkyl chain is selected from the group consisting of methyl, ethyl, propyl, isopropyl, n-butyl, isobutyl, sec-butyl and tert-butyl. Representative alkyl groups include methyl, ethyl, propyl, isopropyl, butyl, isobutyl, tertiary butyl, pentyl, hexyl, and the like, but are by no means limited to these groups.

[0044] В настоящем документе «алкокси» относится к формуле -OR, где R представляет собой алкил согласно определению выше, такой как «алкокси С1-9», в том числе, но не ограничиваясь перечисленными, метокси, этокси, н-пропокси, 1-метилэтокси (изопропокси), н-бутокси, изобутокси, втор-бутокси и трет-бутокси; и т.п.[0044] As used herein, "alkoxy" refers to the formula -OR, where R is alkyl as defined above, such as "C 1-9 alkoxy", including, but not limited to, methoxy, ethoxy, n-propoxy , 1-methylethoxy (isopropoxy), n-butoxy, isobutoxy, sec-butoxy and tert-butoxy; etc.

[0045] В настоящем документе «арил» относится к ароматическому кольцу или кольцевой системе (т.е. двум или более слитым кольцам с двумя общими смежными атомами углерода), содержащими только углерод в остове кольца. В тех случаях, когда арил представляет собой кольцевую систему, каждое кольцо в указанной системе является ароматическим. Указанная ар ильная группа может содержать от 6 до 18 атомов углерода, хотя настоящим определением также охвачено употребление термина «арил» без указания диапазона числовых значений. Согласно некоторым вариантам реализации указанная ар ильная группа содержит от 6 до 10 атомов углерода. Указанная ар ильная группа может быть обозначена как «арил С6-10», «арил С6 или С10», или аналогичным образом. Примеры арильных групп включают, не ограничиваясь перечисленными, фенил, нафтил, азуленил и антраценил.[0045] As used herein, "aryl" refers to an aromatic ring or ring system (ie, two or more fused rings sharing two adjacent carbon atoms) containing only carbon in the backbone of the ring. Where aryl is a ring system, each ring in said system is aromatic. The specified aryl group may contain from 6 to 18 carbon atoms, although the present definition also covers the use of the term "aryl" without specifying the range of numerical values. In some embodiments, said aryl group contains 6 to 10 carbon atoms. Said aryl group may be referred to as "aryl C 6-10 ", "aryl C 6 or C 10 ", or the like. Examples of aryl groups include, but are not limited to, phenyl, naphthyl, azulenyl, and anthracenyl.

[0046] «Аралкил» или «арилалкил» представляет собой арильную группу, соединенную, в качестве заместителя, алкиленовой группой, например, «аралкил С7-14» и т.п., в том числе, но не ограничиваясь перечисленными, бензил, 2-фенилэтил, 3-фенилпропил и нафтилалкил. В некоторых случаях алкиленовая группа представляет собой низшую алкиленовую группу (т.е. алкиленовую С1-6 группу).[0046] “Aralkyl” or “arylalkyl” is an aryl group substituted with an alkylene group, such as “aralkyl C 7-14 ”, etc., including, but not limited to, benzyl, 2-phenylethyl, 3-phenylpropyl and naphthylalkyl. In some instances, the alkylene group is a lower alkylene group (ie, a C 1-6 alkylene group).

[0047] В настоящем документе «карбоциклил» означает неароматическое циклическое кольцо или кольцевую систему, содержащую только атомы углерода в остове указанной кольцевой системы. В тех случаях, когда карбоциклил представляет собой кольцевую систему, два или более колец могут быть объединены путем слияния, мостиковой связи или спироконденсации. Карбоциклилы могут отличаться любой степенью насыщенности, при условии, что по меньшей мере одно кольцо в кольцевой системе не является ароматическим. Соответственно, карбоциклилы включают циклоалкилы, циклоалкенилы и циклоалкинилы. Указанная карбоциклильная группа может содержать от 3 до 20 атомов углерода, хотя настоящим определением также охвачено употребление термина «карбоциклил» без указания диапазона числовых значений. Указанная карбоциклильная группа может также представлять собой карбоциклил среднего размера, содержащий от 3 до 10 атомов углерода. Указанная карбоциклильная группа может также представлять собой карбоциклил, содержащий от 3 до 6 атомов углерода. Указанная карбоциклильная группа может быть обозначена как «карбоциклил С3-6» или аналогичным образом. Примеры карбоциклильных колец включают, не ограничиваясь перечисленными, циклопропил, циклобутил, циклопентил, циклогексил, циклогексенил, 2,3-дигидро-инден, бицикло[2.2.2]октанил, адамантил и спиро[4.4]нонанил.[0047] As used herein, "carbocyclyl" means a non-aromatic cyclic ring or ring system containing only carbon atoms in the backbone of said ring system. Where the carbocyclyl is a ring system, two or more rings may be joined by fusion, bridging, or spirocondensation. The carbocyclyls may differ in any degree of saturation, provided that at least one ring in the ring system is non-aromatic. Accordingly, carbocyclyls include cycloalkyls, cycloalkenyls and cycloalkynyls. Said carbocyclyl group may contain from 3 to 20 carbon atoms, although the present definition also covers the use of the term "carbocyclyl" without specifying a range of numerical values. Said carbocyclyl group may also be a medium sized carbocyclyl having 3 to 10 carbon atoms. Said carbocyclyl group may also be a carbocyclyl containing 3 to 6 carbon atoms. Said carbocyclyl group may be referred to as "carbocyclyl C 3-6 " or the like. Examples of carbocyclyl rings include, but are not limited to, cyclopropyl, cyclobutyl, cyclopentyl, cyclohexyl, cyclohexenyl, 2,3-dihydro-indene, bicyclo[2.2.2]octanyl, adamantyl, and spiro[4.4]nonanyl.

[0048] В настоящем документе «Саb», или «Са-b», где «а» и «b» представляют собой целые числа, относятся к числу атомов углерода в указанной группе, то есть указанная группа может содержать от «а» до «b», включительно, атомов углерода. Соответственно, например, «алкил С14» или «алкильная С1-4» группа относится ко всем алкильным группам, содержащим от 1 до 4 атомов углерода, то есть СH3-, CH3CH2-, CH3CH2CH2-, (СН3)2СН-, CH3CH2CH2CH2-, CH3CH2СH(CH3)- и (СН3)3С-.[0048] As used herein, “C a -C b ”, or “C a-b ”, where “a” and “b” are integers, refer to the number of carbon atoms in the specified group, that is, the specified group may contain from "a" to "b", inclusive, carbon atoms. Accordingly, for example, "C 1 -C 4 alkyl" or "C 1-4 alkyl" group refers to all alkyl groups containing from 1 to 4 carbon atoms, i.e. CH 3 -, CH 3 CH 2 -, CH 3 CH 2 CH 2 -, (CH 3 ) 2 CH-, CH 3 CH 2 CH 2 CH 2 -, CH 3 CH 2 CH (CH 3 ) - and (CH 3 ) 3 C-.

[0049] В настоящем документе термин «ковалентно присоединенный» или «ковалентно связанный» относится к образованию химической связи, которая характеризуется общими для атомов парами электронов. Например, ковалентно присоединенное полимерное покрытие относится к полимерному покрытию, которое образует химические связи с функционализированной поверхностью субстрата, в отличие от прикрепления к поверхности другими способами, например, посредством адгезионного или электростатического взаимодействия. Следует понимать, что полимеры, ковалентно прикрепленные к поверхности, могут также быть связаны с применением других способов помимо ковалентного прикрепления, например, путем физической адсорбции.[0049] As used herein, the term "covalently attached" or "covalently bonded" refers to the formation of a chemical bond that is characterized by electron pairs shared between atoms. For example, a covalently attached polymer coating refers to a polymer coating that forms chemical bonds with a functionalized surface of a substrate, as opposed to being attached to the surface by other means, such as through adhesive or electrostatic interaction. It should be understood that polymers covalently attached to a surface may also be bonded using methods other than covalent attachment, such as by physical adsorption.

[0050] Термин «галоген» или «гало» в настоящем документе означает любой из радиостабильных атомов из 7 столбца периодической таблицы элементов, например, фтор, хлор, бром или йод, при этом фтор и хлор являются предпочтительными.[0050] The term "halogen" or "halo" as used herein means any of the radiostable atoms from column 7 of the Periodic Table of the Elements, such as fluorine, chlorine, bromine, or iodine, with fluorine and chlorine being preferred.

[0051] В настоящем документе «гетероарил» относится к ароматическому кольцу или кольцевой системе (т.е. двум или более слитым кольцам с двумя общими смежными атомами), которые содержат один или более гетероатомов, то есть элемент, отличный от углерода, в том числе, но не ограничиваясь перечисленными, азот, кислород и серу, в остове кольца. В тех случаях, когда указанный гетероарил представляет собой кольцевую систему, каждое кольцо в системе является ароматическим. Гетероарильная группа может содержать 5-18 членов в кольце (т.е. атомов, образующих остов кольца, в том числе атомов углерода и гетероатомов), хотя настоящим определением также охвачено употребление термина «гетероарил» без указания диапазона числовых значений. Согласно некоторым вариантам реализации гетероарильная группа содержит 5-10 членов в кольце или 5-7 членов в кольце. Указанная гетероарильная группа может быть обозначена как «5- 7-членный гетероарил», «5 10-членный гетероарил»; или аналогичным образом. Примеры гетероарильных колец включают, не ограничиваясь перечисленными, фурил, тиенил, фталазинил, пирролил, оксазолил, тиазолил, имидазолил, пиразолил, изоксазолил, изотиазолил, триазолил, тиадиазолил, пиридинил, пиридазинил, пиримидинил, пиразинил, триазинил, хинолинил, изохинолинил, бензимидазолил, бензоксазолил, бензотиазолил, индолил, изоиндолил и бензотиенил.[0051] As used herein, "heteroaryl" refers to an aromatic ring or ring system (i.e., two or more fused rings with two adjacent atoms in common) that contain one or more heteroatoms, i.e., an element other than carbon, including including, but not limited to, nitrogen, oxygen and sulfur, in the backbone of the ring. Where said heteroaryl is a ring system, each ring in the system is aromatic. A heteroaryl group may contain 5-18 ring members (i.e. ring backbone atoms, including carbon atoms and heteroatoms), although the use of the term "heteroaryl" without specifying a range of numerical values is also covered by this definition. In some embodiments, the heteroaryl group has 5-10 ring members or 5-7 ring members. Said heteroaryl group may be referred to as "5-7 membered heteroaryl", "5 x 10 membered heteroaryl"; or similar. Examples of heteroaryl rings include, but are not limited to, furyl, thienyl, phthalazinyl, pyrrolyl, oxazolyl, thiazolyl, imidazolyl, pyrazolyl, isoxazolyl, isothiazolyl, triazolyl, thiadiazolyl, pyridinyl, pyridazinyl, pyrimidinyl, pyrazinyl, triazinyl, quinolinyl, isoquinolinyl, benzimidazolyl , benzothiazolyl, indolyl, isoindolyl and benzothienyl.

[0052] В настоящем документе «гетероциклил» означает неароматическое циклическое кольцо или кольцевую систему, содержащие по меньшей мере один гетероатом в остове кольца. Гетероциклилы могут быть объединены путем слияния, мостиковой связи или спироконденсации. Гетероциклилы могут отличаться любой степенью насыщенности, при условии, что по меньшей мере одно кольцо в кольцевой системе не является ароматическим. Гетероатом(ы) могут присутствовать как в неароматическом, так и в ароматическом кольце в кольцевой системе. Гетероциклильная группа может содержать от 3 до 20 членов в кольце (т.е. атомов, образующих остов кольца, в том числе атомы углерода и гетероатомы), хотя настоящим определением также охвачено употребление термина «гетероциклил» без указания диапазона числовых значений. Гетероциклильная группа может также представлять собой гетероциклил среднего размера, содержащий от 3 до 10 членов в кольце. Гетероциклильная группа может также представлять собой гетероциклил, содержащий от 3 до 6 членов в кольце. Указанная гетероциклильная группа может быть обозначена как «3-6-членный гетероциклил» или аналогичным образом. В предпочтительных шестичленных моноциклических гетероциклилах гетероатом(ы) выбраны из чего-либо одного или более, или всех трех из О, N или S, а в предпочтительных пятичленных моноциклических гетероциклилах гетероатом(ы) выбраны из одного или двух гетероатомов, выбранных из О, N или S. Примеры гетероциклильных колец включают, не ограничиваясь перечисленными, азепинил, акридинил, карбазолил, циннолинил, диоксоланил, имидазолинил, имидазолидинил, морфолинил, оксиранил, оксепанил, тиепанил, пиперидинил, пиперазинил, диоксопиперазинил, пирролидинил, пирролидонил, пирролидионил, 4-пиперидонил, пиразолинил, пиразол ид инил, 1,3-диоксинил, 1,3-диоксанил, 1,4-диоксинил, 1,4-диоксанил, 1,3-оксатианил, 1,4-оксатиинил, 1,4-оксатианил, 2H-1,2-оксазинил, триоксанил, гексагидро-1,3,5-триазинил, 1,3-диоксолил, 1,3-диоксоланил, 1,3-дитиолил, 1,3-дитиоланил, изоксазолинил, изоксазолидинил, оксазолинил, оксазолидинил, оксазолидинонил, тиазолинил, тиазолидинил, 1,3-оксатиоланил, индолинил, изоиндолинил, тетрагидрофуранил, тетрагидропиранил, тетрагидротиофенил, тетрагидротиопиранил, тетрагидро-1,4-тиазинил, тиаморфолинил, дигидробензофуранил, бензимидазолидинил и тетрагидрохинолин.[0052] As used herein, "heterocyclyl" means a non-aromatic cyclic ring or ring system containing at least one heteroatom in the backbone of the ring. Heterocyclyls can be combined by fusion, bridging, or spirocondensation. Heterocyclyls may differ in any degree of saturation, provided that at least one ring in the ring system is non-aromatic. The heteroatom(s) may be present on both non-aromatic and aromatic rings in the ring system. The heterocyclyl group may contain from 3 to 20 ring members (i.e. ring backbone atoms, including carbon atoms and heteroatoms), although the use of the term "heterocyclyl" without specifying a range of numerical values is also covered by this definition. The heterocyclyl group may also be a medium sized heterocyclyl containing 3 to 10 ring members. The heterocyclyl group may also be a heterocyclyl having 3 to 6 ring members. Said heterocyclyl group may be referred to as "3-6 membered heterocyclyl" or the like. In preferred six-membered monocyclic heterocyclyls, the heteroatom(s) are selected from one or more or all three of O, N, or S, and in preferred five-membered monocyclic heterocyclyls, the heteroatom(s) are selected from one or two heteroatoms selected from O, N or S. Examples of heterocyclyl rings include, but are not limited to, azepinyl, acridinyl, carbazolyl, cinnolinyl, dioxolanyl, imidazolinyl, imidazolidinyl, morpholinyl, oxiranyl, oxepanyl, thiepanyl, piperidinyl, piperazinyl, dioxopiperazinyl, pyrrolidinyl, pyrrolidonyl, pyrrolidionyl, 4-piperidionyl, 4-piperidionyl, pyrazolinyl, pyrazolide inyl, 1,3-dioxinyl, 1,3-dioxanyl, 1,4-dioxinyl, 1,4-dioxanyl, 1,3-oxathianyl, 1,4-oxathiinyl, 1,4-oxathianyl, 2H- 1,2-oxazinyl, trioxanyl, hexahydro-1,3,5-triazinyl, 1,3-dioxolyl, 1,3-dioxolanyl, 1,3-dithiolyl, 1,3-dithiolanyl, isoxazolinyl, isoxazolidinyl, oxazolinyl, oxazolidinyl, oxazolidinonyl, thiazolinyl, thiazolidinyl, 1,3-oxathiolanyl, indolinyl, isoindolinyl , tetrahydrofuranyl, tetrahydropyranyl, tetrahydrothiophenyl, tetrahydrothiopyranyl, tetrahydro-1,4-thiazinyl, thiamorpholinyl, dihydrobenzofuranyl, benzimidazolidinyl and tetrahydroquinoline.

[0053] В настоящем документе замещенная группа происходит из незамещенной исходной группы, в которой произошла замена одного или более атомов водород на другой атом или группу. Если не указано иное, когда группу считают «замещенной», это означает, что указанная группа замещена одним или более заместителями, независимо выбранными из алкила C1-C6, алкенила C1-C6, алкинила C16, гетероалкила C1-C6, карбоциклила С3-C7 (необязательно замещенного галогеном, алкилом C16, алкокси C16, галогеналкилом C1-C6 и галогеналкокси C1-C6), С37-карбоциклил-С16-алкила (необязательно замещенного галогеном, алкилом C16, алкокси C16, галогеналкилом C1-C6 и галогеналкокси C16), 3-10-членного гетероциклила (необязательно замещенного галогеном, алкилом C1-C6, алкокси C16, галогеналкилом C16 и галогеналкокси C16), 3-10-членного гетероциклила-С1-C6-алкил (необязательно замещенного галогеном, алкилом C1-C6, алкокси C16, галогеналкилом C1-C6 и галогеналкокси C1-C6), арила (необязательно замещенного галогеном, алкилом C16, алкокси C16, галогеналкилом C1-C6 и галогеналкокси C16), арил(С16)алкила (необязательно замещенного галогеном, алкилом C1-C6, алкокси C16, галогеналкилом C16 и галогеналкокси C16), 5-10-членного гетероарила (необязательно замещенного галогеном, алкилом C1-C6, алкокси C1-C6, галогеналкилом C16 и галогеналкокси C16), 5-10-членного гетероарил(С16)алкила (необязательно замещенный галогеном, алкилом C1-C6, алкокси C1-C6, галогеналкилом C1-C6 и галогеналкокси C16), галогено, циано, гидрокси, алкокси C1-C6, алкокси C1-C616)алкила (т.е. простого эфира), арилокси, сульфгидрил(меркапто), галоген(С16)алкила (например, -CF3), галоген(С16)алкокси (например, -OCF3), алкилтио C1-C6, арилтио, амино, амино(С16)алкила, нитро, О-карбамила, N-карбамила, О-тиокарбамила, N-тиокарбамила, С-амидо, N-амидо, S-сульфонамидо, N-сульфонамидо, С-карбокси, О-карбокси, ацила, цианато, изоцианато, тиоцианато, изотиоцианато, сульфинила, сульфонила, сульфо, сульфино, сульфоната и оксо (=O). В тех случаях, когда группа описана где-либо как «необязательно замещенная», указанная группа может быть замещена вышеперечисленными заместителями.[0053] As used herein, a substituted group is derived from an unsubstituted parent group in which one or more hydrogen atoms have been replaced by another atom or group. Unless otherwise indicated, when a group is considered "substituted", this means that the specified group is substituted with one or more substituents independently selected from alkyl C 1 -C 6 , alkenyl C 1 -C 6 , alkynyl C 1 -C 6 , heteroalkyl C 1 -C 6 , carbocyclyl C 3 -C 7 (optionally substituted with halogen, C 1 -C 6 alkyl, C 1 -C 6 alkoxy, C 1 -C 6 haloalkyl and C 1 -C 6 haloalkoxy), C 3 -C 7 -carbocyclyl-C 1 -C 6 -alkyl (optionally substituted with halogen, C 1 -C 6 alkyl, C 1 -C 6 alkoxy, C 1 -C 6 haloalkyl and C 1 -C 6 haloalkoxy), 3-10 membered heterocyclyl (optionally substituted with halogen, C 1 -C 6 alkyl, C 1 -C 6 alkoxy, C 1 -C 6 haloalkyl and C 1 -C 6 haloalkoxy), 3-10 membered heterocyclyl-C 1 -C 6 -alkyl (optional substituted with halogen, C 1 -C 6 alkyl, C 1 -C 6 alkoxy, C 1 -C 6 haloalkyl and C 1 -C 6 haloalkoxy), aryl (optionally substituted with halogen, C 1 -C 6 alkyl, C 1 -C alkoxy 6 , haloalkyl C 1 -C 6 and halo C 1 -C 6 genalkoxy), aryl(C 1 -C 6 )alkyl (optionally substituted with halogen, C 1 -C 6 alkyl, C 1 -C 6 alkoxy, C 1 -C 6 haloalkyl, and C 1 -C 6 haloalkoxy) , 5-10 membered heteroaryl (optionally substituted with halogen, C 1 -C 6 alkyl, C 1 -C 6 alkoxy, C 1 -C 6 haloalkyl and C 1 -C 6 haloalkoxy), 5-10 membered heteroaryl ( C 1 -C 6 )alkyl (optionally substituted with halogen, C 1 -C 6 alkyl, C 1 -C 6 alkoxy, C 1 -C 6 haloalkyl and C 1 -C 6 haloalkoxy), halo, cyano, hydroxy, C 1 -C alkoxy 6 , alkoxy C 1 -C 6 (C 1 -C 6 )alkyl (i.e. ether), aryloxy, sulfhydryl(mercapto), halo(C 1 -C 6 )alkyl (eg -CF 3 ), halo(C 1 -C 6 )alkoxy (eg -OCF 3 ), alkylthio C 1 -C 6 , arylthio, amino, amino (C 1 -C 6 ) alkyl, nitro, O-carbamyl, N-carbamyl, O-thiocarbamyl, N-thiocarbamyl, C-amido, N-amido, S-sulfonamido, N-sulfonamido, C-carboxy, O-carboxy, acyl, cyanato, isocyanato, thiocyanato, isothiocyanato, sulfinyl, sulfonyl, sulfo, sulfino, sulfonate and oxo (=O). Where a group is described anywhere as "optionally substituted", said group may be substituted with the substituents listed above.

[0054] Согласно некоторым вариантам реализации указанные комплексы транспосом иммобилизуют на подложке посредством одного или более полинуклеотидов (например, олигонуклеотидов), таких как полинуклеотид (олигонуклеотид), содержащий концевую последовательность транспозона. Согласно некоторым вариантам реализации указанный комплекс транспосомы может быть иммобилизован посредством линкера, добавленного к концу последовательности транспозона, например, сопрягающего фермент транспозазу с твердой подложкой. Согласно некоторым вариантам реализации как фермент транспозазу, так и полинуклеотид транспозона (например, олигонуклеотид) иммобилизуют на твердой подложке. В отношении иммобилизации молекул (например, нуклеиновых кислот, ферментов) на твердой подложке термины «иммобилизованный», «закрепленный» и «прикрепленный» используются в настоящем документе взаимозаменяемо; предполагается, что оба термина охватывают прямое или непрямое, ковалентное или нековалентное прикрепление, если иное не указано явным образом или не следует из контекста. Согласно определенным вариантам реализации настоящего изобретения ковалентное прикрепление может быть предпочтительным, однако обычно требуется только то, чтобы молекулы (например, нуклеиновые кислоты, ферменты) оставались в иммобилизованном или присоединенном к подложке состоянии в условиях, в которых предполагается использование указанной подложки, например, во вариантах применения, требующих амплификации и/или секвенирования нуклеиновых кислот. В некоторых случаях при тагментации на основе гранул транспосомы могут быть связаны с поверхностью гранул парой лигандов, например, аффинным элементом и партнером для аффинного связывания.[0054] In some embodiments, said transposome complexes are immobilized on a support by one or more polynucleotides (eg, oligonucleotides), such as a polynucleotide (oligonucleotide) containing a transposon terminal sequence. In some embodiments, said transposome complex can be immobilized via a linker added to the end of the transposon sequence, such as a transposase enzyme-coupling to a solid support. In some embodiments, both the transposase enzyme and the transposon polynucleotide (eg, oligonucleotide) are immobilized on a solid support. With regard to the immobilization of molecules (eg, nucleic acids, enzymes) on a solid support, the terms "immobilized", "anchored", and "attached" are used interchangeably herein; both terms are intended to cover direct or indirect, covalent or non-covalent attachment, unless otherwise indicated or implied by the context. According to certain embodiments of the present invention, covalent attachment may be preferred, but generally only the molecules (e.g., nucleic acids, enzymes) are required to remain immobilized or attached to the support under the conditions under which said support is to be used, e.g. applications requiring amplification and/or sequencing of nucleic acids. In some cases, in bead-based tagmentation, transposomes can be bound to the bead surface by a pair of ligands, such as an affinity element and an affinity binding partner.

Транспосомы и транспозазыTransposomes and transposases

[0055] Технология на основе транспозонов может быть использована для фрагментации ДНК, например, согласно иллюстративному описанию технологического процесса для наборов для получения образцов NEXTERA™ XT и FLEX DNA (Illumina, Inc.), когда целевые нуклеиновые кислоты, такие как геномная ДНК, обрабатывают комплексами транспосом для одновременной фрагментации и мечения («тагментации») мишени, с получением таким образом популяции фрагментированных молекул нуклеиновой кислоты, меченых уникальными адапторными последовательностями на концах указанных фрагментов.[0055] Transposon-based technology can be used to fragment DNA, for example, according to the illustrative workflow for NEXTERA™ XT and FLEX DNA Sampler Kits (Illumina, Inc.), when target nucleic acids, such as genomic DNA, are processed transposome complexes for simultaneous fragmentation and labeling (“tagmentation”) of the target, thus obtaining a population of fragmented nucleic acid molecules labeled with unique adapter sequences at the ends of these fragments.

[0056] Реакция транспозиции представляет собой реакцию, отличающуюся тем, что один или более транспозонов инсертированы в целевые нуклеиновые кислоты в случайных сайтах или почти случайных сайтах. Компоненты в реакции транспозиции включают транспозазу (или другой фермент, способный к фрагментации и мечению нуклеиновой кислоты согласно описанию в настоящем документе, такой как интеграза) и элемент транспозона, который включает двухцепочечную концевую последовательность транспозона, которая связывается с ферментом, и адапторную последовательность, присоединенную к одной из двух концевых последовательностей транспозона. Одна цепь двухцепочечной концевой последовательности транспозона переносится в одну цепь целевой нуклеиновой кислоты, тогда как комплементарная цепь концевой последовательности транспозона не переносится (т.е. является не переносимой последовательностью транспозона). Указанная адапторная последовательность может содержать одну или более функциональных последовательностей (например, последовательностей праймеров), если это необходимо или требуется.[0056] A transposition reaction is a reaction characterized in that one or more transposons are inserted into the target nucleic acids at random or near random sites. The components in the transposition reaction include a transposase (or other enzyme capable of fragmenting and labeling a nucleic acid as described herein, such as an integrase) and a transposon element that includes a transposon double-stranded terminal sequence that binds to the enzyme and an adapter sequence fused to one of the two terminal sequences of the transposon. One strand of the double-stranded transposon terminal sequence is transferred to one strand of the target nucleic acid, while the complementary strand of the transposon terminal sequence is not transferred (ie, is a non-transferred transposon sequence). Said adapter sequence may contain one or more functional sequences (eg, primer sequences) as necessary or required.

[0057] «Комплекс транспосомы» состоит из по меньшей мере одного фермента транспозазы и последовательности распознавания транспозона. В некоторых таких системах транспозаза связывается с последовательностью распознавания транспозона с образованием функционального комплекса, который способен катализировать реакцию транспозиции. Согласно некоторым аспектам последовательность распознавания транспозона представляет собой двухцепочечную концевую последовательность транспозона. Транспозаза, или интеграза, связывается с сайтом распознавания транспозазы в целевой нуклеиновой кислоте и инсертирует последовательность распознавания транспозона в целевую нуклеиновую кислоту. В ходе некоторых таких инсерций одна цепь последовательности распознавания транспозона (или концевая последовательность) переносится в целевую нуклеиновую кислоту, что приводит также к расщеплению. Примеры процедур транспозиции и систем, которые могут быть легко адаптированы для применения с транспозазами согласно настоящему изобретению описаны, например, в РСТ-публикации WO10/048605, патентной публикации США №2012/0301925, патентной публикации США №2012/13470087 или патентной публикации США №2013/0143774, каждая из которых включена в настоящий документ полностью посредством ссылки.[0057] A "transposome complex" consists of at least one transposase enzyme and a transposon recognition sequence. In some of these systems, the transposase binds to the transposon recognition sequence to form a functional complex that is capable of catalyzing the transposition reaction. In some aspects, the transposon recognition sequence is the double-stranded terminal sequence of the transposon. A transposase, or integrase, binds to a transposase recognition site in a target nucleic acid and inserts a transposon recognition sequence into the target nucleic acid. During some of these insertions, one strand of the transposon recognition sequence (or terminal sequence) is transferred to the target nucleic acid, which also results in cleavage. Examples of transposition procedures and systems that can be easily adapted for use with transposases of the present invention are described, for example, in PCT Publication WO10/048605, US Patent Publication No. 2012/0301925, US Patent Publication No. 2012/13470087, or US Patent Publication No. 2013/0143774, each of which is incorporated herein in its entirety by reference.

[0058] Примеры транспозаз (или кодирующих их последовательностей), которые могут применяться в определенных вариантах реализации, предложенных согласно настоящему изобретению, включают: транспозазу Tn5 (см. ReznikofF et al., Biochem. Biophys. Res. Commun. 2000, 266, 729-734), Vibrio harveyi (транспозаза, охарактеризованная Agilent и используемая в продукте SureSelect QXT), транспозазу MuA и сайт распознавания транспозазы Ми, содержащий концевые последовательности RT и R2 (Mizuuchi, K., Cell, 35: 785, 1983; Savilahti, Н, et al., EMBO J., 14:4893, 1995), Staphylococcus aureus Tn552 (Colegio, O. etal., J. Bacteriol., 183:2384-8, 2001; Kirby, C. et al., Mol. Microbiol., 43:173-86, 2002), Tyl (Devine & Boeke, Nucleic Acids Res., 22:3765-72, 1994 и PCT-публикация №W095/23875), транспозон Tn7 (Craig, N.L., Science, 271:1512, 1996; Craig, N.L., Curr. Top.Microbiol. Immunol., 204:27-48, 1996), Tn/O и IS 10 (Kleckner N. et al., Curr. Top. Microbiol. Immunol., 204:49-82, 1996), транспозазу Mariner (Lampe, D.J. et al., EMBO J., 15:5470-9, 1996), Tel (Plasterk, R.H., Curr. Top. Microbiol. Immunol., 204:125-43, 1996), элемент P (Gloor, G.B., Methods Mol. Biol., 260:97-114, 2004), Tn3 (Ichikawa & Ohtsubo, J. Biol. Chem., 265:18829-32, 1990), бактериальные инсерционные последовательности (Ohtsubo & Sekine, Curr. Top.Microbiol. Immunol. 204:1-26, 1996), ретровирусы (Brown et al., Proc. Natl. Acad. Sci. USA, 86:2525-9, 1989) и ретротранспозон дрожжей (Boeke & Corces, Ann. Rev. Microbiol. 43:403-34, 1989). Дополнительные примеры включают IS5, Tn10, Tn903, IS911; и сконструированные варианты ферментов семейства транспозаз (Zhang et al., (2009) PLoS Genet. 5:e 1000689. Epub Oct. 16; Wilson C. et al. (2007) J. Microbiol. Methods 71:332-5). Способы, описанные в настоящем документе, могут также включать комбинации транспозаз, а не только одну транспозазу.[0058] Examples of transposases (or sequences encoding them) that may be used in certain embodiments of the present invention include: Tn5 transposase (see ReznikofF et al., Biochem. Biophys. Res. Commun. 2000, 266, 729 -734), Vibrio harveyi (a transposase characterized by Agilent and used in the SureSelect QXT product), MuA transposase, and a Mi transposase recognition site containing RT and R2 terminal sequences (Mizuuchi, K., Cell, 35: 785, 1983; Savilahti, H , et al., EMBO J., 14:4893, 1995), Staphylococcus aureus Tn552 (Colegio, O. et al., J. Bacteriol., 183:2384-8, 2001; Kirby, C. et al., Mol. Microbiol., 43:173-86, 2002), Tyl (Devine & Boeke, Nucleic Acids Res., 22:3765-72, 1994 and PCT Publication No. W095/23875), Tn7 transposon (Craig, N.L., Science, 271 :1512, 1996; Craig, N. L., Curr. Top. Microbiol. Immunol., 204:27-48, 1996), Tn/O and IS 10 (Kleckner N. et al., Curr. Top. Microbiol. Immunol., 204:49-82, 1996), transposase Marine r (Lampe, D.J. et al., EMBO J., 15:5470-9, 1996), Tel (Plasterk, R.H., Curr. Top. Microbiol. Immunol., 204:125-43, 1996), element P (Gloor, G.B., Methods Mol Biol., 260:97-114, 2004), Tn3 (Ichikawa & Ohtsubo, J. Biol. Chem., 265:18829-32, 1990), bacterial insertion sequences (Ohtsubo & Sekine, Curr. Top. Microbiol. Immunol 204:1-26, 1996), retroviruses (Brown et al., Proc. Natl. Acad. Sci. USA, 86:2525-9, 1989) and yeast retrotransposons (Boeke & Corces, Ann. Rev. Microbiol. 43 :403-34, 1989). Additional examples include IS5, Tn10, Tn903, IS911; and engineered variants of transposase family enzymes (Zhang et al., (2009) PLoS Genet. 5:e 1000689. Epub Oct. 16; Wilson C. et al. (2007) J. Microbiol. Methods 71:332-5). The methods described herein may also include combinations of transposases, not just one transposase.

[0059] Согласно некоторым вариантам реализации указанная транспозаза представляет собой транспозазу Tn5, МиА или Vibrio harveyi, или ее активный мутант.Согласно другим вариантам реализации указанная транспозаза представляет собой транспозазу Tn5 или ее активный мутант.Согласно некоторым вариантам реализации указанная транспозаза Tn5 представляет собой гиперактивную транспозазу Tn5 (см., например, Reznikoffet al., РСТ-публикация №WO2001/009363, патенты США №5925545, №5965443, №7083980 и №7608434; Goryshin and Reznikoff, J. Biol. Chem. 273:7367, 1998), или ее активный мутант. Согласно некоторым аспектам указанная транспозаза Tn5 представляет собой транспозазу Tn5 согласно описанию в РСТ-публикации WO2015/160895, которая включена в настоящий документ посредством ссылки. Согласно некоторым вариантам реализации указанная транспозаза Tn5 представляет собой слитый белок. Согласно некоторым вариантам реализации указанный слитый белок транспозазы Tn5 содержит метку - слитый фактор элонгации Ts (Tsf). Согласно некоторым вариантам реализации указанная транспозаза Tn5 представляет собой гиперактивную транспозазу Tn5, содержащую мутации аминокислот в положениях 54, 56 и 372 по сравнению с последовательностью дикого типа. Согласно некоторым вариантам реализации указанная гиперактивная транспозаза Tn5 представляет собой слитый белок, необязательно слитый с белком - фактором элонгации Ts (Tsf). Согласно некоторым вариантам реализации указанный сайт распознавания представляет собой сайт распознавания транспозазы Tn5-типа (Goryshin and Reznikoff, J. Biol. Chem., 273:7367, 1998). Согласно одному варианту реализации применяют сайт распознавания транспозазы, который образует комплекс с гиперактивной транспозазой Tn5 (например, транспозазой EZ-Tn5™, Epicentre Biotechnologies, Мэдисон, Висконсин).[0059] In some embodiments, said transposase is a Tn5, MiA, or Vibrio harveyi transposase, or an active mutant thereof. In other embodiments, said transposase is a Tn5 transposase, or an active mutant thereof. In some embodiments, said Tn5 transposase is a hyperactive transposase Tn5 (see, e.g., Reznikoffet al., PCT Publication No. WO2001/009363, US Pat. or its active mutant. In some aspects, said Tn5 transposase is a Tn5 transposase as described in PCT Publication WO2015/160895, which is incorporated herein by reference. In some embodiments, said Tn5 transposase is a fusion protein. In some embodiments, said Tn5 transposase fusion protein contains a Ts elongation factor (Tsf) fusion tag. In some embodiments, said Tn5 transposase is an overactive Tn5 transposase containing amino acid mutations at positions 54, 56, and 372 compared to the wild-type sequence. In some embodiments, said hyperactive Tn5 transposase is a fusion protein, optionally fused to a Ts elongation factor (Tsf) protein. In some embodiments, said recognition site is a Tn5-type transposase recognition site (Goryshin and Reznikoff, J. Biol. Chem., 273:7367, 1998). In one embodiment, a transposase recognition site is used that forms a complex with an overactive Tn5 transposase (eg, EZ-Tn5™ transposase, Epicentre Biotechnologies, Madison, Wisconsin).

[0060] Согласно некоторым вариантам реализации указанный комплекс транспосомы представляет собой димер двух молекул транспозазы. Согласно некоторым вариантам реализации указанный комплекс транспосомы представляет собой гомодимер, отличающийся тем, что каждая из двух молекул транспозазы связана с первым и вторым транспозонами одного типа (например, последовательности двух транспозонов, связанные с каждым мономером, являются одинаковыми, образуя «гомодимер»). Согласно некоторым вариантам реализации в композициях и способах, описанных в настоящем документе, задействованы две популяции комплексов транспосом. Согласно некоторым вариантам реализации транспозазы в каждой популяции одинаковы. Согласно некоторым вариантам реализации комплексы транспосом в каждой популяции представляют собой гомодимеры, при этом первая популяция содержит первую адапторную последовательность в каждом мономере, а вторая популяция содержит другую адапторную последовательность в каждом мономере.[0060] In some embodiments, said transposome complex is a dimer of two transposase molecules. In some embodiments, said transposome complex is a homodimer, characterized in that each of the two transposase molecules is associated with a first and second transposon of the same type (e.g., the sequences of the two transposons associated with each monomer are the same, forming a "homodimer"). In some embodiments, the compositions and methods described herein involve two populations of transposome complexes. In some embodiments, the transposases in each population are the same. In some embodiments, the transposome complexes in each population are homodimers, with the first population containing a first adapter sequence in each monomer and the second population containing a different adapter sequence in each monomer.

[0061] Согласно некоторым вариантам реализации указанная транспозаза представляет собой транспозазу Tn5. Согласно некоторым вариантам реализации комплекс транспозазы содержит димер транспозазы (например, транспозазы Tn5), содержащий первый и второй мономер. Каждый мономер содержит первый транспозон и второй транспозон, при этом указанный первый транспозон содержит концевую последовательность первого транспозона на 3'-конце и первую адапторную последовательность (при этом адапторные последовательности в каждом мономере димера являются одинаковыми или отличаются), а второй транспозон содержит концевую последовательность второго транспозона, по меньшей мере частично комплементарную концевой последовательности первого транспозона. Согласно некоторым вариантам реализации расщепляемого 5'-линкера первый транспозон содержит на 5'-конце расщепляемый линкер, соединенный с аффинным элементом. Согласно некоторым вариантам реализации 3'-линкера второй транспозон содержит на 3'-конце линкер (необязательно расщепляемый), соединенный с аффинным элементом. Соответственно, согласно предпочтительным вариантам реализации один транспозон из каждого мономера содержит аффинный элемент.Однако согласно некоторым вариантам реализации только один из двух мономеров включает аффинный элемент.[0061] In some embodiments, said transposase is a Tn5 transposase. In some embodiments, the transposase complex comprises a transposase dimer (eg, Tn5 transposase) containing a first and a second monomer. Each monomer contains the first transposon and the second transposon, while the specified first transposon contains the terminal sequence of the first transposon at the 3'-end and the first adapter sequence (while the adapter sequences in each monomer of the dimer are the same or different), and the second transposon contains the terminal sequence of the second a transposon at least partially complementary to the terminal sequence of the first transposon. In some embodiments of the cleavable 5' linker, the first transposon has a cleavable linker at the 5' end connected to an affinity element. In some embodiments of the 3' linker, the second transposon comprises at the 3' end a linker (optionally cleavable) linked to an affinity element. Accordingly, in preferred embodiments, one transposon from each monomer contains an affinity element. However, in some embodiments, only one of the two monomers contains an affinity element.

Адапторные последовательностиAdapter sequences

[0062] Согласно любому из вариантов реализации способа, описанного в настоящем документе, первый транспозон содержит первую адапторную последовательность. Согласно некоторым вариантам реализации вторичный адаптор добавляют к меченому фрагменту согласно описанию в настоящем документе с применением носителя вторичного адаптера, который содержит последовательность праймера и вторичную адапторную последовательность. Адапторные последовательности могут содержать одну или более функциональных последовательностей, выбранных из группы, состоящей из универсальных последовательностей, последовательностей праймеров, индексных последовательностей, последовательностей для захвата, штрихкодирующих последовательностей (используемых, например, для подсчета или коррекции ошибок), последовательностей для расщепления, связанных с секвенированием последовательностей и комбинаций перечисленного. Согласно некоторым вариантам реализации адапторная последовательность содержит последовательность праймера. Согласно другим вариантам реализации адапторная последовательность содержит последовательность праймера и индексная или «штрихкодирующую» последовательность. Последовательность праймера может также представлять собой универсальную последовательность. Настоящее изобретение не ограничено конкретным типом адапторных последовательностей, подходящих для применения; специалисту известны дополнительные последовательности, которые могут подходить для применения для получения библиотек и секвенирования нового поколения.[0062] According to any of the embodiments of the method described herein, the first transposon contains the first adapter sequence. In some embodiments, a secondary adapter is added to a tagged fragment as described herein using a secondary adapter carrier that contains a primer sequence and a secondary adapter sequence. The adapter sequences may comprise one or more functional sequences selected from the group consisting of universal sequences, primer sequences, index sequences, capture sequences, barcode sequences (used for example for scoring or error correction), cleavage sequences associated with sequencing sequences and combinations of the above. In some embodiments, the adapter sequence comprises a primer sequence. In other embodiments, the adapter sequence comprises a primer sequence and an index or "barcode" sequence. The primer sequence may also be a universal sequence. The present invention is not limited to the particular type of adapter sequences suitable for use; the skilled artisan is aware of additional sequences that may be suitable for use in library generation and next generation sequencing.

[0063] Адапторные последовательности, которые переносятся на 5'-концы фрагмента нуклеиновой кислоты при реакции тагментации (например, первая адапторная последовательность (последовательности)) могут содержать, например, универсальную последовательность. Универсальная последовательность представляет собой область последовательности нуклеотидов, общую для двух или более фрагментов нуклеиновых кислот. Необязательно, указанные два или более фрагментов нуклеиновых кислот также содержат области с различиями в последовательности. Универсальная последовательность, которая может присутствовать в разных фрагментах из множества фрагментов нуклеиновых кислот, может обеспечивать репликацию или амплификацию нескольких разных последовательностей при применении одного универсального праймера, комплементарного указанной универсальной последовательности.[0063] Adapter sequences that are transferred to the 5' ends of the nucleic acid fragment in the tagmentation reaction (eg, the first adapter sequence(s)) may contain, for example, a universal sequence. A universal sequence is a region of nucleotide sequence common to two or more nucleic acid fragments. Optionally, said two or more nucleic acid fragments also contain regions with differences in sequence. A universal sequence, which may be present in different fragments of a plurality of nucleic acid fragments, may allow for the replication or amplification of several different sequences using a single universal primer that is complementary to said universal sequence.

[0064] Согласно некоторым вариантам реализации в композициях и способах, описанных в настоящем документе, задействованы две популяции комплексов транспосом. Согласно некоторым вариантам реализации каждая популяция содержит адапторную последовательность с отличающейся последовательностью праймера. Согласно некоторым вариантам реализации первая популяция содержит последовательность праймера А14, а вторая популяция содержит последовательность праймера В15.[0064] In some embodiments, the compositions and methods described herein involve two populations of transposome complexes. In some embodiments, each population contains an adapter sequence with a different primer sequence. In some embodiments, the first population contains the A14 primer sequence and the second population contains the B15 primer sequence.

Аффинный элемент и партнер для аффинного связыванияAffine element and partner for affine binding

[0065] Аффинный элемент в настоящем документе представляет собой фрагмент, который может быть использован для ковалентного или нековалентного связывания с партнером для аффинного связывания. Согласно некоторым аспектам указанный аффинный элемент расположен на комплексе транспосомы, а партнер для аффинного связывания расположен на твердой подложке.[0065] An affinity element as used herein is a moiety that can be used for covalent or non-covalent binding to an affinity binding partner. In some aspects, said affinity element is located on the transposome complex and the affinity binding partner is located on a solid support.

[0066] Согласно некоторым вариантам реализации указанный аффинный элемент может связываться или связан нековалентным образом с партнером для аффинного связывания на твердой подложке, с нековалентным присоединением таким образом указанного комплекса транспосомы к твердой подложке. Согласно таким вариантам реализации аффинный элемент содержит или представляет собой, например, биотин, а партнер для аффинного связывания содержит или представляет собой авидин или стрептавидин. Согласно другим вариантам реализации указанная комбинация аффинного элемента/партнера для связывания содержит или представляет собой ФИТЦ/анти-ФИТЦ, дигоксигенин/ антитело к дигоксигенину, или гаптен/антитело. Дополнительные подходящие аффинные пары включают, не ограничиваясь перечисленными, дитиобиотин-авидин, иминобиотин-авидин, биотин-авидин, дитиобиотин-сукцинилированный авидин, иминобиотин-сукцинилированный авидин, биотин-стрептавидин и биотин-сукцинилированный авидин.[0066] In some embodiments, said affinity element can bind or be linked in a non-covalent manner to an affinity binding partner on a solid support, thereby non-covalently attaching said transposome complex to the solid support. In such embodiments, the affinity element comprises or is, for example, biotin, and the affinity binding partner comprises or is avidin or streptavidin. In other embodiments, said affinity element/binding partner combination comprises or is FITC/anti-FITC, digoxigenin/digoxigenin antibody, or hapten/antibody. Additional suitable affinity pairs include, but are not limited to, dithiobiotin-avidin, iminobiotin-avidin, biotin-avidin, dithiobiotin-succinylated avidin, iminobiotin-succinylated avidin, biotin-streptavidin, and biotin-succinylated avidin.

[0067] Согласно некоторым вариантам реализации аффинный элемент может связываться с партнером для аффинного связывания посредством химической реакции, или ковалентно путем проведения реакции с партнером для аффинного связывания на твердой подложке, с ковалентным прикреплением таким образом комплекса транспосомы к твердой подложке. Согласно некоторым аспектам указанная комбинация аффинного элемента/партнера для связывания содержит или представляет собой амин/карбоновую кислоту (например, связывающиеся посредством стандартной реакции сочетания пептидов в условиях, известных специалисту в данной области техники, например, ЭДК- или NHS-опосредованного сочетания). В результате реакции указанных двух компонентов аффинный элемент и партнер для связывания соединяются за счет амидной связи. Как вариант, аффинный элемент и партнер для связывания могут представлять собой два партнера «клик-химии» (например, азид/алкин, которые вступают в реакцию с образованием триазольной связи).[0067] In some embodiments, an affinity element can be bound to an affinity binding partner via a chemical reaction, or covalently by reacting with an affinity binding partner on a solid support, thereby covalently attaching the transposome complex to the solid support. In some aspects, said affinity element/binding partner combination comprises or is an amine/carboxylic acid (e.g., standard peptide coupling reaction binding under conditions known to one of skill in the art, e.g., EDC- or NHS-mediated coupling). As a result of the reaction of these two components, the affinity element and the binding partner are connected through an amide bond. Alternatively, the affinity element and the binding partner may be two click chemistry partners (eg, an azide/alkyne that react to form a triazole bond).

Расщепляемые линкерыCleavable linkers

[0068] Способность расщеплять связи, соединяющие два молекулярных объекта может быть эффективным инструментом для снижения захвата нецелевых продуктов гибридизации, устраняющим возможность полногеномного нецелевого захвата при первой гибридизации. Согласно определению в настоящем документе расщепляемый линкер представляет собой молекулу с двумя функциональными концевыми группами, объединенными расщепляемой связью. Указанные две функциональные концевые группы служат для прикрепления линкера к другим фрагментам; в указанном случае расщепляемый линкер соединяет 5'-конец последовательности первого транспозона с аффинном элементе. Обзор расщепляемых линкеров, классифицируемых в соответствии с условиями их расщепления и биологическим применением, приведен в источнике: Wagner et al., Bioorg. Med. Chem. 20, 571-582 (2012), который включен в настоящий документ посредством ссылки.[0068] The ability to cleave bonds connecting two molecular entities can be an effective tool to reduce the uptake of off-target hybridization products, eliminating the possibility of genome-wide off-target uptake on first hybridization. As defined herein, a cleavable linker is a molecule with two functional end groups linked by a cleavable bond. These two functional end groups serve to attach the linker to other fragments; in this case, the cleavable linker connects the 5' end of the first transposon sequence to the affinity element. For an overview of cleavable linkers, classified according to their cleavage conditions and biological applications, see: Wagner et al., Bioorg. Med. Chem. 20, 571-582 (2012), which is incorporated herein by reference.

[0069] Расщепляемый линкер в настоящем документе представляет собой линкер, который может быть расщеплен с помощью химических или физических способов, таких как, например, фотолиз, химическое расщепление, термальное расщепление или ферментативное расщепление. Согласно некоторым вариантам реализации указанное расщепление может осуществляться с применением биохимического, химического, ферментативного, нуклеофильного, чувствительного к восстановлению агента или других способов.[0069] A cleavable linker herein is a linker that can be cleaved by chemical or physical means such as, for example, photolysis, chemical cleavage, thermal cleavage, or enzymatic cleavage. In some embodiments, said cleavage may be carried out using a biochemical, chemical, enzymatic, nucleophilic, reduction-sensitive agent, or other means.

[0070] Согласно некоторым вариантам реализации расщепляемый линкер может включать нуклеотид или последовательность нуклеотидов, который(ая) может быть фрагментирован(а) различными способами. Например, расщепляемый линкер может содержать сайт расщепления рестрикционной эндонуклеазой; по меньшей мере один рибонуклеотид, расщепляемый РНКазой; аналоги нуклеотидов, расщепляемые в присутствии определенного химического агента (агентов); диольную связь, расщепляемую при обработке периодатом (например); дисульфидную группу, расщепляемую химическим восстанавливающим агентом; расщепляемый фрагмент, который может подвергаться фотохимическому расщеплению; и пептид, расщепляемый ферментом пептидазой, или другие подходящие средства. См., например, источники: патентные публикации США №2012/0208705 и №2012/0208724, и РСТ-публикацию №WO 2012/061832, каждый из которых полностью включен посредством ссылки.[0070] In some embodiments, the cleavable linker may include a nucleotide or sequence of nucleotides that can be fragmented in a variety of ways. For example, a cleavable linker may contain a restriction endonuclease cleavage site; at least one RNase cleavable ribonucleotide; nucleotide analogs cleavable in the presence of a specific chemical agent(s); a diol bond cleavable by periodate treatment (for example); a disulfide group cleavable by a chemical reducing agent; a cleavable fragment that can be subjected to photochemical cleavage; and a peptidase enzyme cleavable peptide or other suitable means. See, for example, US Patent Publication Nos. 2012/0208705 and 2012/0208724, and PCT Publication No. WO 2012/061832, each of which is incorporated by reference in its entirety.

[0071] Фоторасщепляемые (ФР) линкеры использовали в различных вариантах применения такие как индуцируемое фоторасщеплением очищение, конструирование белков, фотоактивация соединений и биомолекул а также мечение фоторасщепляемыми массовыми метками для мультиплексных анализов. ФР-линкеры могут содержать фотолабильную функциональную группу, расщепляемую УФ-светом со специфической длиной волны (300-350 нм). ФР-линкер может включать, например, 10-атомную единицу, которая может быть расщеплена при воздействии УФ-света в подходящем спектральном диапазоне. Такие фоторасщепляемые линкеры и фосфорамидитные реагенты коммерчески доступны от Integrated DNA Technologies (IDT)), Ambergen и Glen Research. Применение композиций фоторасщепляемых нуклеотидов подробно описано в патентах США №7057031, №7547530, №7897737, №7964352 и №8361727, которые включены в настоящий документ полностью посредством ссылки.[0071] Photocleavable (FR) linkers have been used in a variety of applications such as photocleavage-induced purification, protein engineering, photoactivation of compounds and biomolecules, and labeling with photocleavable mass labels for multiplex assays. FR linkers may contain a photolabile functional group that is cleavable with UV light at a specific wavelength (300-350 nm). The FR linker may include, for example, a 10 atom unit, which can be cleaved upon exposure to UV light in a suitable spectral range. Such photocleavable linkers and phosphoramidite reagents are commercially available from Integrated DNA Technologies (IDT)), Ambergen and Glen Research. The use of photocleavable nucleotide compositions is described in detail in US Pat. Nos. 7,057,031; 7,547,530; 7,897,737;

[0072] Согласно некоторым вариантам реализации расщепление ферментативно опосредовано за счет включения расщепляемого нуклеотида или нуклеооснования в расщепляемый линкер. Примеры таких фрагментов из нуклеооснований или нуклеотидов включают, не ограничиваясь перечисленными, урацил, уридин, 8-оксо-гуанин, ксантин, гипоксантин, 5,6-дигидроурацил, 5-метилцитозин, тиминовый димер, 7-метилгуанозин, 8-оксо-дезоксигуанозин, ксантозин, инозин, дезоксиинозин, дигидроуридин, бромдезоксиуридин, уридин, 5-метилцитидин, дезоксиуридин, 5,6-дигидрокситимин, тимингликоль, 5-гидрокси-5-метилгидантоин, урацилгликоль, 6-гидрокси-5,6-дигидротимин, метилтартронилмочевину (1,2) или сайт, лишенный азотистых оснований.[0072] In some embodiments, cleavage is enzymatically mediated by incorporating a cleavable nucleotide or nucleobase into a cleavable linker. Examples of such fragments from nucleobases or nucleotides include, but are not limited to, uracil, uridine, 8-oxo-guanine, xanthine, hypoxanthine, 5,6-dihydrouracil, 5-methylcytosine, thymine dimer, 7-methylguanosine, 8-oxo-deoxyguanosine, xanthosine, inosine, deoxyinosine, dihydrouridine, bromodeoxyuridine, uridine, 5-methylcytidine, deoxyuridine, 5,6-dihydroxythymine, thymine glycol, 5-hydroxy-5-methylhydantoin, uracil glycol, 6-hydroxy-5,6-dihydrothymine, methyltartronyl urea (1, 2) or a site devoid of nitrogenous bases.

[0073] Согласно некоторым вариантам реализации указанный расщепляемый линкер включает достаточное количество расщепляемых нуклеотидов, чтобы обеспечивать полное расщепление. Согласно некоторым вариантам реализации указанный линкер включает от 1 до 10 расщепляемых нуклеотидов. Согласно некоторым вариантам реализации указанный расщепляемый линкер включает по меньшей мере один расщепляемый нуклеотид. Согласно некоторым вариантам реализации указанный линкер включает по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9 или 10 расщепляемых нуклеотидов. Согласно предпочтительному варианту реализации указанный расщепляемый линкер содержит один или более урациловых нуклеотидов и, необязательно, другие стандартные основания ДНК. Согласно некоторым вариантам реализации в ходе дополнительного ферментативного этапа после ПЦР расщепляет указанный расщепляемый линкер по расщепляемому положению нуклеотида или нуклеозида. Примеры таких ферментов включают, не ограничиваясь перечисленными, урацил-ДНК-гликозилазу (UDG, также называемую урацил-N-гликозилазой, или UNG), формамидопиримидин-ДНК-гликозилазу (Fpg), РНКазу Н, эндонуклеазу III (Endo III), Endo IV, Endo V, Endo VIII, фермент Кленова или апиразу. Согласно некоторым вариантам реализации используют смесь ферментов, содержащую фермент, который расщепляет урациловые основания в нуклеиновых кислотах, и АП-нуклеазу. Эффективная концентрация ферментов может варьировать от 0,025 Ед/мкл до 10 Ед/мкл. Согласно предпочтительному варианту реализации указанная смесь ферментов представлена урацил-ДНК-гликозилазой и Endo IV. Коммерческие смеси ферментов для применения в способах, описанных в настоящем документе, включают UDEM (Epicentre Biotechnologies). Согласно еще одному варианту реализации указанная смесь ферментов представлена урацил-ДНК-гликозилазой и Endo VIII, коммерчески доступными под наименованиями USER (New England Biolabs) или Uracil Cleavage System (Sigma Aldrich). При расщеплении 5' аффинный элемент (например, фрагмент биотина) остается на коротком олигонуклеотиде, который может быть удален различными способами, известными специалисту, например, при очищении нуклеиновой кислоты, таком как извлечение целевых нуклеиновых кислот с применением методологии на основе гранул, когда олигонуклеотиды небольших размеров остаются незахвачеиными. При указанном расщеплении разрывается связь между аффинным элементом (например, биотином) и 5'-меченым целевым фрагментом. Согласно предпочтительным вариантам реализации указанные расщепляемые линкеры смежны с 5'-концом концевой последовательности транспозона дуплексного транспозона и присоединены к нему. Согласно некоторым вариантам реализации указанный расщепляемый линкер соединен с биотином. Согласно другим вариантам реализации биотин закреплен на покрытой стрептавидином грануле.[0073] In some embodiments, said cleavable linker includes a sufficient number of cleavable nucleotides to allow complete cleavage. In some embodiments, said linker comprises 1 to 10 cleavable nucleotides. In some embodiments, said cleavable linker comprises at least one cleavable nucleotide. In some embodiments, said linker comprises at least 1, 2, 3, 4, 5, 6, 7, 8, 9, or 10 cleavable nucleotides. In a preferred embodiment, said cleavable linker contains one or more uracil nucleotides and optionally other standard DNA bases. In some embodiments, an additional enzymatic step after PCR cleaves said cleavable linker at the cleavable position of the nucleotide or nucleoside. Examples of such enzymes include, but are not limited to, uracil DNA glycosylase (UDG, also referred to as uracil N-glycosylase or UNG), formamidopyrimidine DNA glycosylase (Fpg), RNase H, endonuclease III (Endo III), Endo IV , Endo V, Endo VIII, Klenow enzyme or apyrase. In some embodiments, an enzyme mixture is used containing an enzyme that cleaves uracil bases in nucleic acids and an AP nuclease. The effective concentration of enzymes can vary from 0.025 U/µl to 10 U/µl. In a preferred embodiment, said enzyme mixture is uracil DNA glycosylase and Endo IV. Commercial mixtures of enzymes for use in the methods described herein include UDEM (Epicentre Biotechnologies). In another embodiment, said enzyme mixture is uracil DNA glycosylase and Endo VIII, commercially available under the USER (New England Biolabs) or Uracil Cleavage System (Sigma Aldrich) names. Cleavage of the 5' affinity element (e.g., a biotin fragment) remains on a short oligonucleotide, which can be removed by various methods known to the skilled person, for example, in nucleic acid purification, such as extracting target nucleic acids using bead-based methodology, when oligonucleotides are small dimensions remain uncaptured. This cleavage breaks the link between the affinity element (eg, biotin) and the 5'-labeled target fragment. In preferred embodiments, said cleavable linkers are adjacent to and attached to the 5' end of the transposon terminal sequence of the duplex transposon. In some embodiments, said cleavable linker is coupled to biotin. In other embodiments, biotin is anchored to a streptavidin-coated bead.

Комплексы транспосом и транспозоны с 3'-линкерамиTransposome complexes and transposons with 3'-linkers

[0074] Согласно другим аспектам линкер соединен с 3'-концом второго транспозона, причем указанный линкер способен соединять указанный второй транспозон с твердой подложкой. В тех случаях, когда указанные первый и второй транспозоны являются частью комплекса транспосомы, линкер служит для соединения указанного комплекса с твердой подложкой. Согласно таким аспектам первый конец указанного линкера присоединен к 3'-концу указанного второго транспозона, а второй конец указанного линкера присоединен к аффинному элементу. Указанный аффинный элемент способен к связыванию (ковалентному или нековалентному) с партнером для аффинного связывания на твердой подложке. Согласно некоторым аспектам указанный аффинный элемент связывают (ковалентно или нековалентно) с партнером для аффинного связывания на твердой подложке, с получением связанного с твердой подложкой комплекса транспосомы. Согласно некоторым аспектам указанный линкер представляет собой расщепляемый линкер. Указанные комплексы представляют собой комплексы транспосом с 3'-линкерами и связанные с подложкой комплексы транспосом с 3'-линкерами. Согласно некоторым вариантам реализации указанный аффинный элемент представляет собой биотин, а партнер для аффинного связывания представляет собой стрептавидин.[0074] According to other aspects, the linker is connected to the 3'-end of the second transposon, and the specified linker is able to connect the specified second transposon with a solid support. Where said first and second transposons are part of a transposome complex, the linker serves to connect said complex to a solid support. In such aspects, the first end of said linker is attached to the 3' end of said second transposon, and the second end of said linker is attached to an affinity element. Said affinity element is capable of binding (covalently or non-covalently) to an affinity binding partner on a solid support. In some aspects, said affinity element is linked (covalently or non-covalently) to an affinity binding partner on a solid support to form a solid support-bound transposome complex. In some aspects, said linker is a cleavable linker. These complexes are transposome-3'-linker complexes and support-bound transposome-3'-linker complexes. In some embodiments, said affinity element is biotin and the affinity binding partner is streptavidin.

[0075] Согласно одному варианту реализации указанный линкер ковалентно присоединен к 3'-концу указанного второго транспозона. Согласно некоторым вариантам реализации указанный линкер ковалентно присоединен к 3'-концу концевой последовательности второго транспозона. Например, линкер, описанный в настоящем документе, может быть ковалентно и прямо прикреплен к 3'-концу гидроксильной группы указанного второго транспозона, с образованием, соответственно, -О-связи, или может быть ковалентно присоединен посредством другой группы, такой как фосфат или сложный эфир. Как вариант, описанный в настоящем документе линкер может быть ковалентно присоединен к фосфатной группе указанного второго транспозона или концевой последовательность второго транспозона, например, ковалентно присоединенные к 3'-гидроксилу посредством фосфатной группы, с образованием, соответственно, -O-Р(O)3-связи.[0075] In one embodiment, said linker is covalently attached to the 3' end of said second transposon. In some embodiments, said linker is covalently attached to the 3' end of the terminal sequence of the second transposon. For example, the linker described herein may be covalently and directly attached to the 3' end of the hydroxyl group of said second transposon, respectively, to form an -O-bond, or may be covalently attached via another group such as a phosphate or complex ether. Alternatively, the linker described herein may be covalently attached to the phosphate group of said second transposon, or the terminal sequence of the second transposon, for example, covalently attached to the 3'-hydroxyl via a phosphate group, to form, respectively, -O-P(O) 3 -connections.

[0076] Согласно некоторым вариантам реализации указанный комплекс транспосомы описанные в настоящем документе иммобилизуют на твердой подложке посредством линкера. Согласно некоторым таким вариантам реализации аффинный элемент представляет собой биотин, а твердая подложка содержит стрептавидин. Согласно некоторым дополнительным вариантам реализации указанная твердая подложка содержит или представляет собой гранулу. Согласно одному варианту реализации указанная гранула представляет собой парамагнитную гранулу.[0076] In some embodiments, said transposome complex described herein is immobilized on a solid support via a linker. In some such embodiments, the affinity element is biotin and the solid support contains streptavidin. In some additional embodiments, said solid support comprises or is a bead. In one embodiment, said bead is a paramagnetic bead.

[0077] Согласно некоторым вариантам реализации указанный линкер и аффинный элемент имеют структуру формулы (I):[0077] In some embodiments, said linker and affinity element have the structure of formula (I):

Figure 00000003
Figure 00000003

где:where:

АЭ представляет собой аффинный элемент;AE is an affine element;

Y представляет собой алкилен С2-6;Y is C 2-6 alkylene;

X1 представляет собой О, NR1 или S;X 1 is O, NR 1 or S;

где R1 представляет собой Н или алкил C1-10;where R 1 represents H or alkyl C 1-10 ;

n представляет собой целое число из группы, состоящей из 1, 2, 3, 4, 5 и 6;n is an integer from the group consisting of 1, 2, 3, 4, 5 and 6;

X2 представляет собой О, СH2 или S;X 2 represents O, CH 2 or S;

Ra представляет собой Н или -ОН; иR a is H or -OH; and

Z отсутствует, если Ra представляет собой Н, или представляет собой CH2, если Ra представляет собой Н или ОН;Z is absent if R a is H, or is CH 2 if R a is H or OH;

при этом символом

Figure 00000002
обозначена точка присоединения ко второму транспозону.while the symbol
Figure 00000002
the point of attachment to the second transposon is indicated.

[0078] Согласно некоторым вариантам реализации формулы (I) АЭ представляет собой необязательно замещенный биотин или аминогруппу. Согласно другим вариантам реализации АЭ представляет собой необязательно замещенный биотин. Согласно таким вариантам реализации биотин необязательно замещен алкилом C1-4. Согласно другим вариантам реализации АЭ представляет собой биотин.[0078] In some embodiments of Formula (I), the AE is an optionally substituted biotin or an amino group. In other embodiments, the AE is an optionally substituted biotin. In such embodiments, biotin is optionally substituted with C 1-4 alkyl. In other embodiments, the AE is biotin.

[0079] Согласно некоторым вариантам реализации формулы (I) Y представляет собой алкилен С2-6. Согласно другим вариантам реализации Y представляет собой алкилен С2-5. Согласно другим вариантам реализации Y представляет собой алкилен С2-4. Согласно другим вариантам реализации Y представляет собой алкилен С2-3. Согласно другим вариантам реализации Y представляет собой неразветвленный алкилен. Согласно другим вариантам реализации Y представляет собой алкилен С2. Согласно другим вариантам реализации Y представляет собой алкилен С3. Согласно другим вариантам реализации Y представляет собой алкилен С4. Согласно другим вариантам реализации Y представляет собой этилен. Согласно другим вариантам реализации Y представляет собой пропилен. Согласно другим вариантам реализации Y представляет собой бутилен.[0079] In some embodiments of Formula (I), Y is C 2-6 alkylene. In other embodiments, Y is a C 2-5 alkylene. In other embodiments, Y is C 2-4 alkylene. In other embodiments, Y is C 2-3 alkylene. In other embodiments, Y is straight chain alkylene. In other embodiments, Y is a C 2 alkylene. In other embodiments, Y is a C 3 alkylene. In other embodiments, Y is a C 4 alkylene. In other embodiments, Y is ethylene. In other embodiments, Y is propylene. In other embodiments, Y is butylene.

[0080] Согласно некоторым вариантам реализации формулы (I) X1 представляет собой NR1, где R1 представляет собой Н или алкил C1-10 Согласно некоторым таким вариантам реализации R1 представляет собой Н. Согласно некоторым вариантам реализации R1 представляет собой алкил C1-3. Согласно другим вариантам реализации X1 представляет собой О. Согласно другим вариантам реализации X1 представляет собой S.[0080] In certain embodiments of formula (I), X 1 is NR 1 where R 1 is H or C 1-10 alkyl. In certain such embodiments, R 1 is H. In certain such embodiments, R 1 is alkyl C 1-3 . In other embodiments, X 1 is O. In other embodiments, X 1 is S.

[0081] Согласно некоторым вариантам реализации формулы (I) n=1. Согласно другим вариантам реализации n=2. Согласно другим вариантам реализации n=3. Согласно другим вариантам реализации n=4.[0081] According to some embodiments of formula (I), n=1. According to other implementation options n=2. According to other implementation options n=3. According to other implementation options n=4.

[0082] Согласно некоторым вариантам реализации формулы (I) X2 представляет собой СH2. Согласно некоторым другим вариантам реализации, X2 представляет собой О. Согласно другим вариантам реализации X2 представляет собой S.[0082] In some embodiments of Formula (I), X 2 is CH 2 . In some other embodiments, X 2 is O. In other embodiments, X 2 is S.

[0083] Согласно некоторым вариантам реализации формулы (I) Ra представляет собой Н. Согласно другим вариантам реализации Ra представляет собой ОН.[0083] In some embodiments of Formula (I), R a is H. In other embodiments, R a is OH.

[0084] Согласно некоторым вариантам реализации формулы (I) Z отсутствует, и Ra представляет собой Н. Согласно некоторым вариантам реализации Z представляет собой СH2, и Ra представляет собой Н. Согласно некоторым вариантам реализации Z представляет собой СH2, и Ra представляет собой ОН.[0084] In some embodiments of Formula (I), Z is absent and R a is H. In some embodiments, Z is CH 2 and R a is H. In some embodiments, Z is CH 2 and R a is OH.

[0085] Согласно некоторым вариантам реализации указанный линкер и аффинный элемент имеют структуру формулы (1'):[0085] In some embodiments, said linker and affine element have the structure of formula (1'):

Figure 00000004
Figure 00000004

где АЭ, Y, X1, n, X2 определены согласно описанию в настоящем документе для формулы (I), a Z отсутствует или представляет собой СH2.where AE, Y, X 1 , n, X 2 are defined as described herein for formula (I), and Z is absent or represents CH 2 .

[0086] Согласно некоторым вариантам реализации указанный линкер и аффинный элемент имеют структуру формулы (Iа):[0086] In some embodiments, said linker and affinity element have the structure of formula (Ia):

Figure 00000005
Figure 00000005

отличающийся тем, что X1, n, X2, Ra и Z определены согласно описанию в настоящем документе для формулы (I). Согласно некоторым вариантам реализации Ra представляет собой Н.characterized in that X 1 , n, X 2 , R a and Z are defined as described herein for formula (I). In some embodiments, R a is H.

[0087] Согласно некоторым вариантам реализации указанный линкер и аффинный элемент имеют структуру формулы (Ib):[0087] In some embodiments, said linker and affine element have the structure of formula (Ib):

Figure 00000006
Figure 00000006

где АЭ соответствует определению для формулы (I) в настоящем документе; и n=1 или 2.where AE corresponds to the definition for formula (I) in this document; and n=1 or 2.

[0088] Согласно некоторым аспектам формулы (Ib) АЭ необязательно замещен биотином или аминогруппой. Согласно некоторым вариантам реализации АЭ представляет собой биотин.[0088] According to some aspects of formula (Ib), AE is optionally substituted with biotin or an amino group. In some embodiments, the AE is biotin.

[0089] Согласно некоторым вариантам реализации указанный линкер и аффинный элемент имеют структуру формулы (Iс):[0089] In some embodiments, said linker and affine element have the structure of formula (Ic):

Figure 00000007
Figure 00000007

где АЭ соответствует определению для формулы (I) в настоящем документе; X2 представляет собой О или СH2; n=1 или 2; и Z отсутствует или представляет собой СH2.where AE corresponds to the definition for formula (I) in this document; X 2 is O or CH 2 ; n=1 or 2; and Z is absent or is CH 2 .

[0090] Согласно некоторым вариантам реализации формулы (1 с), АЭ необязательно замещен биотином или аминогруппой. Согласно некоторым вариантам реализации АЭ представляет собой биотин. Согласно некоторым вариантам реализации X2 представляет собой О. Согласно некоторым вариантам реализации X2 представляет собой СH2. Согласно некоторым вариантам реализации n=1. Согласно некоторым вариантам реализации n=2. Согласно некоторым вариантам реализации Z отсутствует. Согласно некоторым вариантам реализации Z представляет собой СH2. Согласно некоторым вариантам реализации n=1, X2 представляет собой О, и Z отсутствует. Согласно некоторым вариантам реализации n=1, X2 представляет собой СH2, a Z представляет собой СH2.[0090] In some embodiments of formula (1c), the AE is optionally substituted with biotin or an amino group. In some embodiments, the AE is biotin. In some embodiments, X 2 is O. In some embodiments, X 2 is CH 2 . In some embodiments, n=1. In some embodiments, n=2. In some embodiments, Z is missing. In some embodiments, Z is CH 2 . In some embodiments, n=1, X 2 is O and Z is absent. In some embodiments, n=1, X 2 is CH 2 and Z is CH 2 .

[0091] Согласно некоторым вариантам реализации указанный линкер и аффинный элемент имеют структуру, выбранную из группы, состоящей из:[0091] In some embodiments, said linker and affine element have a structure selected from the group consisting of:

Figure 00000008
Figure 00000008

Figure 00000009
Figure 00000009

Figure 00000010
Figure 00000010

[0092] Согласно некоторым вариантам реализации указанный линкер и аффинный элемент имеют структуру (I(c)).[0092] In some embodiments, said linker and affine element have the structure (I(c)).

[0093] Согласно некоторым вариантам реализации указанная адапторная последовательность содержит последовательность праймера. Согласно некоторым вариантам реализации указанный последовательность праймера представляет собой последовательность праймера А14 или В15. Согласно некоторым вариантам реализации указанный последовательность праймера представляет собой последовательность праймера Р5 или последовательность праймера Р7. Согласно некоторым вариантам реализации указанная транспозаза представляет собой димер, каждый мономер связан с дуплексным транспозоном адапторной последовательностью согласно описанию в настоящем документе, при этом адапторная последовательность в каждом мономере одинакова. Согласно вариантам реализации, в которых транспозаза представляет собой димер, один или оба мономера включают линкер, соединяющий комплекс транспосомы с твердой подложкой. Каждый мономер включает первый транспозон с адапторной последовательностью.[0093] In some embodiments, said adapter sequence contains a primer sequence. In some embodiments, said primer sequence is an A14 or B15 primer sequence. In some embodiments, said primer sequence is a P5 primer sequence or a P7 primer sequence. In some embodiments, said transposase is a dimer, each monomer is linked to a duplex transposon by an adapter sequence as described herein, with the same adapter sequence in each monomer. In embodiments in which the transposase is a dimer, one or both of the monomers includes a linker connecting the transposome complex to the solid support. Each monomer includes a first transposon with an adapter sequence.

Твердая подложкаSolid backing

[0094] Термины «твердая поверхность», «твердая подложка» и другие грамматические эквиваленты относятся к любому материалу, подходящему или модифицируемому таким образом, чтобы подходить для прикрепления комплексов транспосом. Как будет понятно специалистам в данной области техники, существуют многочисленные возможные субстраты. Возможные субстраты включают, не ограничиваясь перечисленными, стекло и модифицированное или функционализированное стекло, пластики (в том числе акрилы, полистиролы и сополимеры стирола и других материалов, полипропилен, полиэтилен, полибутилен, полиуретаны, тефлон и т.п.), полисахариды, нейлон или нитроцеллюлозу, керамику, смолы, кремнезем или материалы на основе кремнезема, включая кремний и модифицированный кремний, углерод, металлы, неорганическое стекло, пластики, оптоволоконные световоды, гранулы, парамагнитные гранулы и множество других полимеров.[0094] The terms "solid surface", "solid support" and other grammatical equivalents refer to any material suitable or modified in such a way as to be suitable for the attachment of transposome complexes. As will be appreciated by those skilled in the art, there are numerous possible substrates. Possible substrates include, but are not limited to, glass and modified or functionalized glass, plastics (including acrylics, polystyrenes and copolymers of styrene and other materials, polypropylene, polyethylene, polybutylene, polyurethanes, Teflon, etc.), polysaccharides, nylon or nitrocellulose, ceramics, resins, silica or silica-based materials, including silicon and modified silicon, carbon, metals, inorganic glass, plastics, optical fibers, beads, paramagnetic beads, and a variety of other polymers.

[0095] Согласно некоторым таким вариантам реализации комплекс транспосомы иммобилизуют на твердой подложке с помощью линкера согласно описанию в настоящем документе. Согласно некоторым дополнительным вариантам реализации указанная твердая подложка содержит или представляет собой пробирку, лунку планшета, предметное стекло, гранулу или проточную ячейку, или их комбинацию. Согласно некоторым дополнительным вариантам реализации указанная твердая подложка содержит или представляет собой гранулу. Согласно одному варианту реализации указанная гранула представляет собой парамагнитную гранулу.[0095] In some such embodiments, the transposome complex is immobilized on a solid support with a linker as described herein. In some additional embodiments, said solid support comprises or is a tube, plate well, glass slide, bead, or flow cell, or a combination thereof. In some additional embodiments, said solid support comprises or is a bead. In one embodiment, said bead is a paramagnetic bead.

[0096] В способах и композициях, представленных в настоящем документе, комплексы транспосом иммобилизуют на твердой подложке. Согласно одному варианту реализации указанная твердая подложка представляет собой гранулу. Подходящие композиции для гранул включают, не ограничиваясь перечисленными, пластики, керамику, стекло, полистирол, метилстирол, акриловые полимеры, парамагнитные материалы, ториевый золь, угольный графит, диоксид титана, латекс или перекрестно-сшитые декстраны, такие как сефароза, целлюлоза, нейлон, перекрестно-сшитые мицеллы и тефлон, а также любые другие материалы для твердых подложек, перечисленные в настоящем документе. Согласно некоторым вариантам реализации микросферы представляют собой магнитные микросферы или гранулы, например, парамагнитные частицы, сферы или гранулы. Гранулы не обязательно должны быть сферическими; могут быть использованы частицы неправильной формы. Согласно альтернативным или дополнительным вариантам указанные гранулы могут быть пористыми. Размеры гранул варьируют от нанометров, например, 100 нм, до миллиметров, например, 1 мм, при этом предпочтительными являются размеры гранул от приблизительно 0,2 мкм до приблизительно 200 мкм; особенно предпочтительными являются размеры от приблизительно 0,5 до приблизительно 5 мкм, хотя согласно некоторым вариантам реализации могут применяться гранулы меньшего или большего размера. На гранулу может быть нанесено покрытие с партнером для аффинного связывания, например, указанная гранула может быть покрыта стрептавидином. Согласно некоторым вариантам реализации указанные гранулы представляют собой покрытые стрептавидином парамагнитные гранулы, например, гранулы Dynabeads MyOne Streptavidin C1 (Thermo Scientific, кат. №65601), частицы Streptavidin MagneSphere Paramagnetic Particles (Promega, кат. №Z5481), гранулы Streptavidin Magnetic Beads (NEB, кат. №S1420S) и MaxBead Streptavidin (Abnova, кат. №U0087). Твердая подложка может также представлять собой предметное стекло, например, проточную ячейку или другой слайд, модифицированный таким образом, чтобы на нем можно было иммобилизовать комплекс транспосомы.[0096] In the methods and compositions provided herein, transposome complexes are immobilized on a solid support. In one embodiment, said solid support is a granule. Suitable pellet compositions include, but are not limited to, plastics, ceramics, glass, polystyrene, methylstyrene, acrylic polymers, paramagnetic materials, thorium sol, carbon graphite, titanium dioxide, latex, or cross-linked dextrans such as sepharose, cellulose, nylon, cross-linked micelles and Teflon, and any other solid support materials listed in this document. In some embodiments, the microspheres are magnetic microspheres or beads, such as paramagnetic particles, spheres, or beads. The granules need not be spherical; irregularly shaped particles may be used. According to alternative or additional options, these granules may be porous. Granule sizes range from nanometers, eg 100 nm, to millimeters, eg 1 mm, with granule sizes from about 0.2 µm to about 200 µm being preferred; especially preferred are sizes from about 0.5 to about 5 µm, although smaller or larger granules may be used in some embodiments. The bead may be coated with an affinity binding partner, for example said bead may be coated with streptavidin. In some embodiments, said beads are streptavidin-coated paramagnetic beads, e.g., Dynabeads MyOne Streptavidin C1 beads (Thermo Scientific, Cat #65601), Streptavidin MagneSphere Paramagnetic Particles (Promega, Cat #Z5481), Streptavidin Magnetic Beads (NEB , cat. no. S1420S) and MaxBead Streptavidin (Abnova, cat. no. U0087). The solid support may also be a glass slide, such as a flow cell or other slide modified to allow immobilization of the transposome complex.

[0097] Согласно некоторым вариантам реализации плотность партнера для аффинного связывания на твердой подложке или грануле составляет от 1000 до приблизительно 6000 пмоль/мг, или от приблизительно 2000 до приблизительно 5000 пмоль/мг, или от приблизительно 3000 до приблизительно 5000 пмоль/мг, или от приблизительно 3500 до приблизительно 4500 пмоль/мг.[0097] In some embodiments, the density of the affinity binding partner on the solid support or bead is from 1000 to about 6000 pmol/mg, or from about 2000 to about 5000 pmol/mg, or from about 3000 to about 5000 pmol/mg, or from about 3500 to about 4500 pmol/mg.

[0098] Согласно одному варианту реализации указанная твердая поверхность представляет собой внутреннюю поверхность пробирки для образца. Согласно одному примеру указанная пробирка для образца представляет собой пробирку для ПЦР. Согласно другому варианту реализации указанная твердая поверхность представляет собой мембрану для захвата. Согласно одному примеру указанная мембрана для захвата представляет собой мембрану для захвата с биотином (например, доступную от Promega Corporation). Согласно другому примеру указанная мембрана для захвата представляет собой фильтровальную бумагу. Согласно некоторым вариантам реализации настоящего изобретения твердые подложки состояли из инертного субстрата или матрицы (например, стеклянных слайдов, полимерных гранул и т.п.), который(ая) был(а) функционализирован(а), например, путем нанесения слоя или покрытия из промежуточного материала, содержащего реакционноспособные группы, которые позволяют осуществить ковалентное прикрепление к таким молекулам, как полинуклеотиды. Примеры таких подложек включают, не ограничиваясь перечисленными, полиакриламидные гидрогели на подложке из инертного субстрата, такого как стекло, в частности, полиакриламидные гидрогели согласно описанию в WO 2005/065814 и US 2008/0280773, содержание которых включено в настоящий документ полностью посредством ссылки. Способы тагментации (фрагментации и мечения) ДНК на твердой поверхности для конструирования тагментированной библиотеки ДНК описан в WO 2016/189331 и US 2014/0093916 A1, которые включены в настоящий документ полностью посредством ссылки.[0098] In one embodiment, said hard surface is the inner surface of the sample tube. In one example, said sample vial is a PCR vial. In another embodiment, said solid surface is a capture membrane. In one example, said capture membrane is a biotin-encapsulated capture membrane (eg, available from Promega Corporation). According to another example, said capture membrane is filter paper. According to some variants of implementation of the present invention, the solid substrates consisted of an inert substrate or matrix (for example, glass slides, polymer beads, etc.), which (th) was (a) functionalized (a), for example, by applying a layer or coating of an intermediate material containing reactive groups that allow covalent attachment to molecules such as polynucleotides. Examples of such supports include, but are not limited to, polyacrylamide hydrogels supported by an inert substrate such as glass, in particular polyacrylamide hydrogels as described in WO 2005/065814 and US 2008/0280773, the contents of which are incorporated herein in their entirety by reference. Methods for tagging (fragmentation and labeling) DNA on a solid surface to construct a tagged DNA library are described in WO 2016/189331 and US 2014/0093916 A1, which are incorporated herein in their entirety by reference.

[0099] Некоторые дополнительные варианты реализации настоящего изобретения относятся к твердой подложке, содержащие иммобилизованный на ней комплекс транспосомы согласно описанию в настоящем документе, где линкер и аффинный элемент имеют структуру формулы (I), (I'), (Ia), (Ib), (Ic), (I(a)), (I(b)) или (I(c)) согласно описанию в настоящем документе. Согласно некоторым вариантам реализации комплекс транспосомы, описанный в настоящем документе, иммобилизуют на твердой подложке с помощью аффинного элемента. Согласно некоторым таким вариантам реализации твердая подложка содержит стрептавидин в качестве партнера для аффинного связывания, а аффинный элемент представляет собой биотин. Согласно некоторым дополнительным вариантам реализации указанная твердая подложка содержит или представляет собой гранулу. Согласно одному варианту реализации указанная гранула представляет собой парамагнитную гранулу.[0099] Some additional embodiments of the present invention relate to a solid support containing a transposome complex immobilized thereon as described herein, wherein the linker and affinity element have the structure of formula (I), (I'), (Ia), (Ib) , (Ic), (I(a)), (I(b)) or (I(c)) as described herein. In some embodiments, the transposome complex described herein is immobilized on a solid support with an affinity element. In some such embodiments, the solid support contains streptavidin as an affinity binding partner and the affinity element is biotin. In some additional embodiments, said solid support comprises or is a bead. In one embodiment, said bead is a paramagnetic bead.

[0100] Согласно некоторым вариантам реализации комплексы транспосом иммобилизуют на твердой подложке, такой как гранула, с конкретной плотностью или конкретным диапазоном плотности. Плотность комплексов на гранулах в настоящем документе относится к концентрации комплексов транспосом в растворе во время реакции иммобилизации. Плотность комплекса предполагает, что указанная реакция иммобилизации является количественно оцениваемой. После того как произошло образование комплексов с конкретной плотностью, указанная плотность остается постоянной для данной партии связанных с поверхностью комплексов транспосом. Полученные гранулы могут быть разбавлены, и итоговая концентрация комплексов в разбавленном растворе представляет собой полученную плотность гранул, разделенную на коэффициент разбавления. Разбавленные основные растворы гранул при приготовлении сохраняют указанную плотность комплексов, однако в разбавленном растворе указанные комплексы присутствуют в более низкой концентрации. На этапе разбавления плотность комплексов на гранулах не изменяется; таким образом, разбавление оказывает влияние на выход библиотеки, но не на размер инсерций (фрагментов). Согласно некоторым вариантам реализации указанная плотность составляет от приблизительно 5 нМ до приблизительно 1000 нМ, или от приблизительно 5 до 150 нМ, или от приблизительно 10 нМ до 800 нМ. Согласно другим вариантам реализации указанная плотность составляет приблизительно 10 нМ, или приблизительно 25 нМ, или приблизительно 50 нМ, или приблизительно 100 нМ, или приблизительно 200 нМ, или приблизительно 300 нМ, или приблизительно 400 нМ, или приблизительно 500 нМ, или приблизительно 600 нМ, или приблизительно 700 нМ, или приблизительно 800 нМ, или приблизительно 900 нМ, или приблизительно 1000 нМ. Согласно некоторым вариантам реализации указанная плотность составляет приблизительно 100 нМ. Согласно некоторым вариантам реализации указанная плотность составляет приблизительно 300 нМ. Согласно некоторым вариантам реализации указанная плотность составляет приблизительно 600 нМ. Согласно некоторым вариантам реализации указанная плотность составляет приблизительно 800 нМ. Согласно некоторым вариантам реализации указанная плотность составляет приблизительно 100 нМ. Согласно некоторым вариантам реализации указанная плотность составляет приблизительно 1000 нМ.[0100] In some embodiments, transposome complexes are immobilized on a solid support, such as a bead, at a specific density or a specific density range. The density of complexes on beads herein refers to the concentration of transposome complexes in solution during the immobilization reaction. The density of the complex suggests that said immobilization reaction is quantifiable. Once complexes have been formed at a particular density, that density remains constant for a given batch of surface-bound transposome complexes. The resulting granules can be diluted and the final concentration of complexes in the diluted solution is the resulting density of the granules divided by the dilution factor. Diluted basic solutions of granules during preparation retain the indicated density of complexes, however, in a dilute solution, these complexes are present at a lower concentration. At the stage of dilution, the density of the complexes on the granules does not change; thus, dilution affects the yield of the library, but not the size of the inserts (fragments). In some embodiments, said density is from about 5 nM to about 1000 nM, or from about 5 nM to 150 nM, or from about 10 nM to 800 nM. In other embodiments, said density is about 10 nM, or about 25 nM, or about 50 nM, or about 100 nM, or about 200 nM, or about 300 nM, or about 400 nM, or about 500 nM, or about 600 nM , or about 700 nM, or about 800 nM, or about 900 nM, or about 1000 nM. In some embodiments, said density is about 100 nM. In some embodiments, said density is about 300 nM. In some embodiments, the indicated density is approximately 600 nM. In some embodiments, said density is about 800 nM. In some embodiments, said density is about 100 nM. In some embodiments, said density is about 1000 nM.

[0101] Согласно некоторым вариантам реализации указанная твердая подложка представляет собой гранулу или парамагнитную гранулу, и с каждой гранулой связано более 10000, 20000, 30000, 40000, 50000 или 60000 комплексов транспосом.[0101] In some embodiments, said solid support is a bead or paramagnetic bead, and each bead has more than 10,000, 20,000, 30,000, 40,000, 50,000, or 60,000 transposome complexes associated with it.

[0102] Разные плотности связанных с твердой подложкой комплексов транспосом дают фрагменты разной длины (например, разные размеры инсерций). Например, как показано на фиг. 7А, 7В и 7С, варьирующая плотность комплекса приводит к варьирующим размерам инсерций. Размеры инсерций могут составлять от приблизительно 50 п.о. до приблизительно 1000 п.о., или от приблизительно 100 до приблизительно 600 п.о., или от приблизительно 175 до приблизительно 200 п.о., или приблизительно 500 п.о.[0102] Different densities of solid-supported transposome complexes produce fragments of different lengths (eg, different insertion sizes). For example, as shown in FIG. 7A, 7B, and 7C, varying density of the complex results in varying insert sizes. Insertion sizes can range from about 50 bp. to about 1000 bp, or from about 100 to about 600 bp, or from about 175 to about 200 bp, or about 500 bp.

Способы получения модифицированных олигонуклеотидов и комплексов иммобилизованных транспосомMethods for obtaining modified oligonucleotides and immobilized transposome complexes

[0103] Согласно настоящему изобретению также предложены способы получения модифицированных олигонуклеотидов, комплексов транспосом и связанных с твердой подложкой комплексов транспосом согласно описанию в настоящем документе. Согласно некоторым аспектам такие способы включают обработку транспозазы первым и вторым транспозонами согласно описанию в настоящем документе в условиях, подходящих для образования указанного комплекса. Способы получения связанного с твердой подложкой комплекса транспосомы включают инкубацию комплекса транспосомы согласно описанию в настоящем документе с твердой подложкой, содержащей партнер для аффинного связывания, в условиях, достаточных для того, чтобы аффинный элемент связался (ковалентно или нековалентно) с указанным партнером для аффинного связывания.[0103] The present invention also provides methods for preparing modified oligonucleotides, transposome complexes, and solid-supported transposome complexes as described herein. In some aspects, such methods include treating the transposase with the first and second transposons as described herein under conditions suitable to form said complex. Methods for preparing a solid support-bound transposome complex include incubating the transposome complex as described herein with a solid support containing an affinity binding partner under conditions sufficient to cause the affinity element to bind (covalently or non-covalently) to said affinity binding partner.

[0104] Согласно некоторым вариантам реализации предложен способ получения модифицированных олигонуклеотидов. Некоторые аспекты способов получения модифицированных олигонуклеотидов с линкером, соединенным с аффинным элементом, известны в данной области техники. Определенные способы, предусмотренные настоящим изобретением в настоящем документе включают проведение реакции линкерного реагента (или расщепляемого линкерного реагента), содержащего первую реакционноспособную функциональную группу (L-FG1), с нуклеотидом, содержащим вторую реакционноспособную функциональную группу (N-FG2), где первая и вторая реакционноспособные функциональные группы вступают в реакцию с образованием продукта линкер-нуклеотид с ковалентной связью (КС) между линкером и нуклеотидом (L-(КC)-N). Согласно некоторым вариантам реализации указанный линкер реагент включает АЭ-фрагмент (АЭ-Линкер-FG1). Согласно другим вариантам реализации указанный линкерный реагент содержит часть структуры указанного линкера, а АЭ размещают с помощью второй реакции сочетания с получением полной структуры АЭ-линкер.[0104] In some embodiments, a method for preparing modified oligonucleotides is provided. Some aspects of methods for producing modified oligonucleotides with a linker connected to an affinity element are known in the art. Certain methods contemplated herein include reacting a linker reagent (or cleavable linker reagent) containing a first reactive functional group (L-FG1) with a nucleotide containing a second reactive functional group (N-FG2), where the first and second reactive functional groups react to form a linker-nucleotide product with a covalent bond (CC) between the linker and the nucleotide (L-(KC)-N). In some embodiments, said linker reagent comprises an AE moiety (AE-Linker-FG1). In other embodiments, said linker reagent contains a portion of the structure of said linker, and the AE is placed via a second coupling reaction to form the complete structure of the AE linker.

[0105] Первая реакционноспособная функциональная группа может представлять собой, например, карбоксил, активированный карбоксил (такой как сложный эфир, сложный NHS-эфир, ацилгалид, ангидрид или т.п.), азидо, алкин, формил или амино. Согласно некоторым вариантам реализации указанная первая реакционноспособная функциональная группа представляет собой активированный карбоксил, предпочтительно сложный NHS-эфир.[0105] The first reactive functional group may be, for example, a carboxyl, an activated carboxyl (such as an ester, an NHS ester, an acyl halide, anhydride, or the like), an azido, an alkyne, formyl, or an amino. In some embodiments, said first reactive functional group is an activated carboxyl, preferably an NHS ester.

[0106] Вторая реакционноспособная функциональная группа может находиться в любом подходящем положении на нуклеотиде. Согласно некоторым вариантам реализации указанная вторая реакционноспособная функциональная группа находится в положении 3' гидроксила или положении 5' фосфата нуклеотида, либо вместо естественного заместителя, либо дополнительно посредством связывающей группы, такой как алкиленовая или гетероалкиленовая группа, или фосфатная группа в случае гидроксила нуклеотида. Согласно некоторым вариантам реализации указанная вторая реакционноспособная функциональная группа содержит С2-10-алкиламиногруппу. Согласно некоторым вариантам реализации указанная вторая реакционноспособная функциональная группа содержит гексиламиногруппу. Согласно некоторым вариантам реализации указанная вторая реакционноспособная функциональная группа представляет собой OP(O)3-(CH2)6-NH2. Согласно некоторым вариантам реализации указанная вторая реакционноспособная функциональная группа соединена с нуклеотидом через 3'-гидроксил указанного нуклеотида посредством фосфатной связывающей группы.[0106] The second reactive functional group may be at any suitable position on the nucleotide. In some embodiments, said second reactive functional group is at the 3' position of the hydroxyl or the 5' position of the phosphate of the nucleotide, either instead of a natural substituent, or additionally via a linking group such as an alkylene or heteroalkylene group, or a phosphate group in the case of the hydroxyl of the nucleotide. In some embodiments, said second reactive functional group contains a C 2-10 alkylamino group. In some embodiments, said second reactive functional group contains a hexylamino group. In some embodiments, said second reactive functional group is OP(O) 3 -(CH 2 ) 6 -NH 2 . In some embodiments, said second reactive functional group is linked to the nucleotide via the 3'-hydroxyl of said nucleotide via a phosphate linking group.

[0107] Указанный модифицированный нуклеотид может представлять собой часть олигонуклеотида до прикрепления линкера, в этом случае указанный нуклеотид может находиться, например, на 3'-конце или 5'-конце указанного олигонуклеотида. Как вариант, сначала к нуклеотиду присоединяют линкер, и модифицированный нуклеотид используют в качестве стартового материала для синтеза олигонуклеотида стандартными способами.[0107] Said modified nucleotide may be part of an oligonucleotide prior to linker attachment, in which case said nucleotide may be, for example, at the 3' end or 5' end of said oligonucleotide. Alternatively, a linker is first attached to the nucleotide and the modified nucleotide is used as a starting material for the synthesis of the oligonucleotide by standard methods.

[0108] Согласно некоторым вариантам реализации линкер формулы (I) соединен с 3'положением нуклеотида, таким как цитидин. Согласно некоторым вариантам реализации указанный способ получения модифицированного нуклеотида включает проведение реакции соединения формулы (II) с соединением формулы (III):[0108] In some embodiments, the linker of formula (I) is connected to the 3' position of the nucleotide, such as cytidine. In some embodiments, said method for producing a modified nucleotide comprises reacting a compound of formula (II) with a compound of formula (III):

Figure 00000011
Figure 00000011

где АЭ, Y, n, X2, Ra и Z соответствуют определению в настоящем документе;where AE, Y, n, X 2 , R a and Z are as defined herein;

-С(O)Х3 представляет собой активированный сложный эфир, такой как сложный эфир, ацилгалид, ангидрид сложного эфира или сложный NHS-эфир; и-C(O)X 3 is an activated ester such as an ester, an acyl halide, an ester anhydride, or an NHS ester; and

X4 представляет собой группу -ОН или -NH2;X 4 represents a -OH or -NH 2 group;

с образованием соединения [формула (I)]-нуклеотид.to form a compound [formula (I)]-nucleotide.

[0109] Согласно некоторым вариантам реализации соединение формулы (II) представляет собой AЭ-(CH2)4C(O)-O-NHS, а соединение формулы (III) представляет собой Н2N(CH2)6-ОР(O)(O-)O-нуклеотид, и продукт представляет собой АЭ-(СН2)4С(O)-NH-(CH2)6-OP(O)(O-)O-нуклеотид. Согласно некоторым вариантам реализации фосфат присоединен к 3'гидроксильной группе нуклеотида, такой как цитидин. Согласно некоторым вариантам реализации соединение [формула (I)]-нуклеотид (или АЭ-(CH2)4С(O)-NН-(CH2)6-ОР(O)(O-)O-нуклеотид) вступает в реакцию с дополнительными нуклеотидами с образованием [формулы (I)]-олигонуклеотида (или AЭ-(CH2)4C(O)-NH-(CH2)6-ОР(O)(O-)O-олигонуклеотида). Согласно некоторым вариантам реализации второй транспозон представляет собой [формулу (I)]-олигонуклеотид (или AЭ-(CH2)4C(O)-NH-(CH2)6-ОР(O)(O-)O-олигонуклеотид).[0109] In some embodiments, the compound of formula (II) is AE-(CH 2 ) 4 C(O)-O-NHS and the compound of formula (III) is H 2 N(CH 2 ) 6 -OP(O )(O - )O-nucleotide, and the product is AE-(CH 2 ) 4 C(O)-NH-(CH 2 ) 6 -OP(O)(O - )O-nucleotide. In some embodiments, the phosphate is attached to the 3'hydroxyl group of a nucleotide, such as cytidine. In some embodiments, the compound [formula (I)]-nucleotide (or AE-(CH 2 ) 4 C(O)-NH-(CH 2 ) 6 -OP(O)(O - )O-nucleotide) reacts with additional nucleotides to form [formula (I)]-oligonucleotide (or AE-(CH 2 ) 4 C(O)-NH-(CH 2 ) 6 -OP(O)(O - )O-oligonucleotide). In some embodiments, the second transposon is a [formula (I)]-oligonucleotide (or AE-(CH 2 ) 4 C(O)-NH-(CH 2 ) 6 -OP(O)(O - )O-oligonucleotide) .

[0110] Настоящее изобретение также относится к способам получения комплексом транспосом с применением модифицированных олигонуклеотидов, описанных в настоящем документе. Такие способы включают смешивание транспозазы, первого транспозона и второго транспозона согласно определениям в настоящем документе, отличающееся тем, что первый и второй концевые последовательности транспозона аннелируют друг с другом с образованием комплекса транспосомы. Согласно описанию в настоящем документе один из указанных первого и второго транспозонов содержит аффинный элемент (на 5'-конце в случае первого транспозона; на 3'-конце в случае второго транспозона). Согласно некоторым вариантам реализации указанный способ дополнительно включает связывание аффинного элемента с твердой подложкой, содержащей партнер для аффинного связывания. Указанное связывание может быть выполнено до или после образования комплекса транспосомы.[0110] The present invention also relates to methods for complex transposome production using the modified oligonucleotides described herein. Such methods include mixing a transposase, a first transposon, and a second transposon as defined herein, characterized in that the first and second terminal sequences of the transposon are annulated with each other to form a transposome complex. As described herein, one of said first and second transposons contains an affinity element (at the 5' end in the case of the first transposon; at the 3' end in the case of the second transposon). In some embodiments, said method further comprises linking the affinity element to a solid support containing an affinity binding partner. Said binding may be performed before or after the formation of the transposome complex.

Получение фрагментов для секвенирования - Амплификация меченых фрагментовObtaining fragments for sequencing - Amplification of labeled fragments

[0111] Согласно некоторым аспектам предложены способы получения фрагментов для секвенирования из целевой нуклеиновой кислоты, при этом указанный способ включает получение твердой подложки, содержащей иммобилизованный на ней согласно описанию в настоящем документе комплекс транспосомы, описанный в настоящем документе; приведение твердой подложки в контакт с целевой нуклеиновой кислотой в условиях фрагментации целевой нуклеиновой кислоты и лигирования первого транспозона с 5'-концом указанных фрагментов, за счет чего происходит иммобилизация указанного фрагмента на твердой подложке. Согласно некоторым аспектам указанный способ дополнительно включает амплификацию фрагментированных нуклеиновых кислот. Согласно определенному варианту реализации условие фрагментации представляет собой условие, подходящее для тагментации с применением комплекса транспосомы, для фрагментации и мечения целевой нуклеиновой кислоты.[0111] According to some aspects, methods are provided for obtaining fragments for sequencing from a target nucleic acid, the method comprising obtaining a solid support containing immobilized thereon, as described herein, the transposome complex described herein; bringing the solid support into contact with the target nucleic acid under conditions of fragmentation of the target nucleic acid and ligation of the first transposon with the 5' end of said fragments, thereby immobilizing said fragment on the solid support. In some aspects, said method further comprises amplifying the fragmented nucleic acids. In a particular embodiment, the fragmentation condition is a condition suitable for tagging using the transposome complex to fragment and label the target nucleic acid.

[0112] Согласно некоторым вариантам реализации способов, описанных в настоящем документе, указанные способы дополнительно включают удаление, после фрагментации и мечения, транспозазы с 5'-меченых целевых фрагментов для получения не входящих в комплекс 5'-меченых целевых фрагментов. Удаление транспозазы может осуществляться в химических условиях, таких как обработка денатурирующим агентом, таким как додецилсульфат натрия (ДСН). Такие способы могут дополнительно включать получение полностью дуплексных вариантов из 5'-меченых целевых фрагментов. Получение полного дуплекса может включать удаление аннелированного (но не лигированного) второго транспозона (АЭ-линкер-второй транспозон) из 5'-меченых целевых фрагментов и удлинение 5'-меченых целевых фрагментов с получением полностью дуплексных 5'-меченых целевых фрагментов. Получение может осуществляться, например, путем нагревания не входящих в комплекс 5'-меченых целевых фрагментов до температуры, достаточной для селективной денатурации второго транспозона, тогда как остальную дуплексную область фрагмента оставляют интактной. Удлинение может осуществляться в присутствии dNTP и подходящей полимеразы. Как вариант, получение может осуществляться в ходе одной реакции путем инкубации не входящих в комплекс 5'-меченых целевых фрагментов в присутствии одиночных нуклеотидов (dNTP) и полимеразы. Согласно некоторым вариантам реализации инкубация включает нагревание при одной или более температурах, достаточных для денатурации аннелированного второго транспозона и удлинения остальных дуплексов. Согласно другим вариантам реализации указанная полимераза представляет собой полимеразу для вытеснения цепей, которая служит для удаления второго транспозона и удлинения остального дуплекса с получением полностью дуплексных 5'-меченых целевых фрагментов. Подходящие полимеразы включают KAPA HiFi, Pfu и аналогичные ферменты. Подходящие полимеразы включают полимеразы для вытеснения цепей, такие как Bst, Bsu Vent, фермент Кленова и аналогичные ферменты.[0112] According to some embodiments of the methods described herein, these methods further comprise removing, after fragmentation and labeling, transposase from 5'-labeled target fragments to obtain non-complex 5'-labeled target fragments. Removal of the transposase can be accomplished under chemical conditions such as treatment with a denaturing agent such as sodium dodecyl sulfate (SDS). Such methods may further include generating full duplex variants from 5' labeled target fragments. Obtaining a full duplex may include removing the annelated (but not ligated) second transposon (AE-linker-second transposon) from the 5'-labeled target fragments and extending the 5'-labeled target fragments to obtain fully duplex 5'-labeled target fragments. Preparation can be carried out, for example, by heating the uncomplexed 5'-labeled target fragments to a temperature sufficient to selectively denature the second transposon, while leaving the rest of the duplex region of the fragment intact. The extension can be carried out in the presence of dNTP and a suitable polymerase. Alternatively, preparation may be carried out in a single reaction by incubating uncomplexed 5'-labeled target fragments in the presence of single nucleotides (dNTPs) and polymerase. In some embodiments, incubation includes heating at one or more temperatures sufficient to denature the annelated second transposon and elongate the remaining duplexes. In other embodiments, said polymerase is a strand displacement polymerase that serves to remove the second transposon and extend the remaining duplex to produce fully duplex 5' labeled target fragments. Suitable polymerases include KAPA HiFi, Pfu and similar enzymes. Suitable polymerases include strand displacement polymerases such as Bst, Bsu Vent, Klenow enzyme and similar enzymes.

[0113] Согласно некоторым аспектам указанные способы дополнительно включают амплификацию полностью дуплексных 5'-меченых целевых фрагментов. Амплификация может осуществляться любым подходящим для амплификации способом, таким как полимеразная цепная реакция (ПЦР), амплификация по типу катящегося кольца (RCA) или амплификация с множественным вытеснением цепи (MDA). Согласно некоторым вариантам реализации амплификацию осуществляют с применением ПЦР. Согласно некоторым вариантам реализации амплификацию и удлинение осуществляют в ходе одного реакционного этапа путем проведения реакции с dNTP в присутствии полимеразы.[0113] According to some aspects, these methods further include the amplification of fully duplex 5'-labeled target fragments. Amplification can be carried out by any suitable amplification method, such as polymerase chain reaction (PCR), rolling ring amplification (RCA), or multiple strand displacement amplification (MDA). In some embodiments, the amplification is performed using PCR. In some embodiments, amplification and extension are performed in a single reaction step by reacting with dNTP in the presence of a polymerase.

[0114] Согласно некоторым вариантам реализации амплификация служит для добавления одной или более вторичных адапторных последовательностей к полностью дуплексным 5'-меченым целевым фрагментам с образованием фрагментов для секвенирования. Амплификацию осуществляют путем инкубации полностью дуплексного 5'-меченого целевого фрагмента, содержащего последовательность праймера на каждом конце, с носителем вторичного адаптера, одиночными нуклеотидами и полимеразой в условиях, достаточных для амплификации целевых фрагментов и инсерций носителя вторичного адаптера (или комплементарной ему последовательности), причем указанный носитель вторичного адаптера содержит последовательность, комплементарную последовательности праймера, и вторичную адапторную последовательность.[0114] In some embodiments, amplification is used to add one or more secondary adapter sequences to full duplex 5'-labeled target fragments to form fragments for sequencing. Amplification is carried out by incubation of a fully duplex 5'-labeled target fragment containing the primer sequence at each end with the secondary adapter carrier, single nucleotides and polymerase under conditions sufficient to amplify the target fragments and insertions of the secondary adapter carrier (or its complementary sequence), and said secondary adapter carrier contains a sequence complementary to the primer sequence and a secondary adapter sequence.

[0115] Согласно некоторым вариантам реализации указанный носитель вторичного адаптера содержит последовательность праймера, индексную последовательность, «штрихкодирующую» последовательность, метку очистки или комбинацию перечисленного. Согласно некоторым вариантам реализации указанный носитель вторичного адаптера содержит последовательность праймера. Согласно некоторым вариантам реализации указанный носитель вторичного адаптера содержит индексную последовательность. Согласно некоторым вариантам реализации указанный носитель вторичного адаптера содержит индексную последовательность и последовательность праймера.[0115] In some embodiments, said secondary adapter carrier comprises a primer sequence, an index sequence, a "barcode" sequence, a clear mark, or a combination of the above. In some embodiments, said secondary adapter carrier contains a primer sequence. In some embodiments, said secondary adapter carrier contains an index sequence. In some embodiments, said secondary adapter carrier comprises an index sequence and a primer sequence.

[0116] Согласно некоторым вариантам реализации указанные полностью дуплексные 5'-меченые целевые фрагменты содержат разные последовательности праймера на каждом конце. Согласно таким вариантам реализации каждый носитель вторичного адаптера содержит последовательность, комплементарную одной из двух последовательностей праймеров. Согласно некоторым вариантам реализации два последовательности праймеров представляют собой последовательность праймера А14 и последовательность праймера В15.[0116] In some embodiments, these fully duplex 5'-tagged target fragments contain a different primer sequence at each end. In such embodiments, each secondary adapter carrier contains a sequence that is complementary to one of the two primer sequences. In some embodiments, the two primer sequences are an A14 primer sequence and a B15 primer sequence.

[0117] Согласно некоторым вариантам реализации добавляют множество вторичных адаптеров посредством амплификации. Согласно некоторым вариантам реализации каждый из носителей вторичного адаптера содержит одну из двух последовательностей праймеров. Согласно некоторым вариантам реализации каждый из носителей вторичного адаптера содержит одну из множества индексных последовательностей. Согласно некоторым вариантам реализации указанные носители вторичного адаптера содержат вторичные адаптеры с последовательностью праймера Р5 и вторичные адаптеры с последовательностью праймера Р7.[0117] In some embodiments, a plurality of secondary adapters are added via amplification. In some embodiments, each of the secondary adapter carriers contains one of two primer sequences. In some embodiments, each of the secondary adapter carriers contains one of a plurality of index sequences. In some embodiments, said secondary adapter carriers comprise secondary adapters with a P5 primer sequence and secondary adapters with a P7 primer sequence.

[0118] Согласно некоторым вариантам реализации фрагменты для секвенирования наносят на проточную ячейку. Согласно некоторым вариантам реализации указанные фрагменты для секвенирования гибридизуют с комплементарными праймерами, привитыми на проточную ячейку или поверхность. Согласно некоторым вариантам реализации последовательности указанных фрагментов для секвенирования детектируют с применением секвенирования на основе микромассивов или способов секвенирования нового поколения, таких как секвенирование путем синтеза.[0118] In some embodiments, sequencing fragments are applied to a flow cell. In some embodiments, said sequencing fragments are hybridized to complementary primers grafted onto a flow cell or surface. In some embodiments, the sequences of said fragments for sequencing are detected using microarray-based sequencing or next generation sequencing methods, such as sequencing by synthesis.

[0119] Праймеры Р5 и Р7 используют на поверхности коммерческих проточных ячеек, продаваемых Illumina, Inc., для секвенирования на различных платформах Illumina. Последовательности указанных праймеров описаны в патентной публикации США №2011/0059865 А1, которая включена в настоящий документ полностью посредством ссылки. Примеры праймеров Р5 и Р7, которые могут содержать терминальный алкин на 5'-конце, включают представленные ниже:[0119] Primers P5 and P7 are used on the surface of commercial flow cells sold by Illumina, Inc. for sequencing on various Illumina platforms. The sequences of these primers are described in US Patent Publication No. 2011/0059865 A1, which is incorporated herein by reference in its entirety. Examples of primers P5 and P7 that may contain a terminal alkyne at the 5' end include the following:

Figure 00000012
Figure 00000012

[0120] и их производные. Согласно некоторым примерам последовательность Р7 включает модифицированный гуанин в положении G*, например, 8-оксо-гуанин. Согласно другим примерам * показывает, что связь между G* и смежным 3'А представляет собой фосфотиоатную связь. Согласно некоторым примерам праймеры Р5 и/или Р7 включают не встречающиеся в природе линкеры. Необязательно, один или оба из праймеров Р5 и Р7 может или могут включать концевой поли-Т фрагмент.Указанный концевой поли-Т фрагмент обычно расположен на 5'-конце последовательности, приведенной выше, например, между 5'-основанием и концевым алкиновым элементом, однако в некоторых случаях может быть расположен на 3'конце. Последовательность поли-Т может включать любое число Т-нуклеотидов, например, от 2 до 20. Хотя в качестве примеров приведены праймеры Р5 и Р7, следует понимать, что любые подходящие праймеры для амплификации могут применяться в примерах, представленных в настоящем документе.[0120] and their derivatives. In some examples, the P7 sequence includes a modified guanine at the G* position, such as 8-oxo-guanine. In other examples, * indicates that the bond between G* and adjacent 3'A is a phosphothioate bond. In some examples, the P5 and/or P7 primers include non-naturally occurring linkers. Optionally, one or both of primers P5 and P7 may or may include a poly-T terminal moiety. Said poly-T terminal moiety is typically located at the 5' end of the sequence given above, for example between the 5' base and the terminal alkyne element, however, in some cases it may be located at the 3' end. The poly-T sequence can include any number of T-nucleotides, for example, from 2 to 20. While primers P5 and P7 are given as examples, it should be understood that any suitable amplification primers can be used in the examples provided herein.

[0121] Согласно некоторым вариантам реализации этап амплификации указанного способа включает ПЦР или изотермическую амплификацию. Согласно некоторым вариантам реализации этап амплификации указанного способа включает ПЦР.[0121] In some embodiments, the amplification step of said method comprises PCR or isothermal amplification. In some embodiments, the amplification step of said method includes PCR.

Краткое описание чертежейBrief description of the drawings

[0122] Фиг. 1 иллюстрирует примеры этапов способа получения комплексов транспосом и их закрепления на твердой поверхности (такой как гранула) посредством аффинного элемента, присоединенного к 5'-концу первого транспозона. В указанном примере две популяции (130а и 130b) аннелированных первого и второго транспозонов (олигонуклеотидов, содержащих аннелированную двухцепочечную область, содержащую концевую последовательность транспозона и однонитевую область), при этом в каждой популяции первый транспозон включает одну из двух адапторных последовательностей и аффинный элемент (110, где * указывает на аффинный элемент), такие как биотин, на 3'конце. Например, получают множество биотинилированных первых и вторых транспозонов, содержащих две адапторные последовательности (например, последовательности праймеров, такие как А14 и В15). Как видно на фигуре, цепь дуплексной последовательности транспозона, которая будет перенесена в матричные нуклеиновые кислоты, представляет собой первый транспозон, который содержит аффинный элемент (например, биотин). На этапе 115 получают комплекс каждой популяции олигонуклеотидов (130а и 130b) с мономерами транспозазы, такой как Tn5 (135), как правило, в отдельных реакциях, с получением двух дискретных популяций комплексов транспосом (140), каждая из которых содержит отличную адапторную последовательность (например, последовательности праймеров, такие как А14 и В15). После образования двух популяций комплексов их иммобилизуют на субстрате, в указанном примере на гранулах (120). Согласно некоторым вариантам реализации указанные две популяции комбинируют до иммобилизации, получая твердую поверхность или гранулу, которая содержит комплексы из каждой популяции. Согласно другим вариантам реализации указанные две популяции иммобилизуют по отдельности, получая две твердые поверхности или гранулы, каждая из которых содержит один из двух типов комплексов. После образования транспосомного комплекса транспосомы 140 связываются с поверхностью 145, покрытой партнером для аффинного связывания, таким как стрептавидин.[0122] FIG. 1 illustrates exemplary method steps for making transposome complexes and anchoring them to a solid surface (such as a bead) via an affinity element attached to the 5' end of the first transposon. In this example, two populations (130a and 130b) of annulated first and second transposons (oligonucleotides containing an annulated double-stranded region containing a transposon terminal sequence and a single-stranded region), while in each population the first transposon includes one of two adapter sequences and an affinity element (110 , where * indicates an affinity element), such as biotin, at the 3' end. For example, a plurality of biotinylated first and second transposons are prepared containing two adapter sequences (eg, primer sequences such as A14 and B15). As seen in the figure, the transposon duplex sequence strand to be transferred into the template nucleic acids is the first transposon that contains an affinity element (eg, biotin). In step 115, each population of oligonucleotides (130a and 130b) is complexed with transposase monomers such as Tn5 (135), typically in separate reactions, to produce two discrete populations of transposome complexes (140), each containing a different adapter sequence ( for example, primer sequences such as A14 and B15). After the formation of two populations of complexes, they are immobilized on a substrate, in this example, on granules (120). In some embodiments, the two populations are combined prior to immobilization to form a hard surface or bead that contains complexes from each population. In other embodiments, the two populations are immobilized separately to produce two solid surfaces or beads, each containing one of two types of complexes. Upon formation of the transposome complex, transposomes 140 bind to surface 145 coated with an affinity binding partner such as streptavidin.

[0123] На фиг. 2 приведен пример способа тагментации и получения библиотеки 200 на поверхности гранул после иммобилизации транспосомы с применением стратегии 5'-линкера, описанной в настоящем документе. Показана гранула 205 в способе 200 со связанными на ней транспосомами 140. ДНК 210 добавляют в образец гранул. При контакте ДНК 210 с транспосомами 140 указанная ДНК подвергается тагментации (фрагментации и мечению) и связывается с гранулами 205 через транспосомы 140. Связанная и тагментированная ДНК может быть ПЦР-амплифицирована с получением пула не связанных с гранулами ампликонов 215. ПЦР-этап может применяться для инсерций вторичных адапторных последовательностей, таких как последовательности праймеров (например, Р5 и Р7). Ампликоны 215 могут быть перенесены на поверхность проточной ячейки 220, например, путем прививки на поверхность или гибридизации с комплементарными праймерами на поверхности проточной ячейки. Может применяться протокол для получения кластеров (например, протокол для мостиковой амплификации или любой другой протокол амплификации, который может применяться для получения кластеров) с получением множества кластеров 225 на поверхности проточной ячейки. Кластеры представляют собой продукты клональной амплификации тагментированной ДНК. Кластеры, таким образом, готовы для применения на следующем этапе протокола секвенирования. Пример способа тагментации на поверхности гранул подробно описан в РСТ-публикации WO 2016/189331, которая включена в настоящий документ полностью посредством ссылки.[0123] In FIG. 2 shows an example of a method for tagging and obtaining a library 200 on the surface of beads after transposome immobilization using the 5' linker strategy described herein. Bead 205 is shown in method 200 with transposomes 140 bound thereon. DNA 210 is added to a bead sample. Upon contact of DNA 210 with transposomes 140, said DNA undergoes tagmentation (fragmentation and labeling) and binds to beads 205 via transposomes 140. Bound and tagged DNA can be PCR amplified to obtain a pool of 215 non-bead bound amplicons. The PCR step can be used to insertions of secondary adapter sequences such as primer sequences (eg P5 and P7). Amplicons 215 can be transferred to the surface of the flow cell 220, for example, by surface grafting or hybridization with complementary primers on the surface of the flow cell. A protocol for obtaining clusters (eg, a protocol for bridge amplification or any other amplification protocol that can be used for obtaining clusters) may be used to obtain a plurality of clusters 225 on the surface of the flow cell. Clusters are products of clonal amplification of tagged DNA. The clusters are thus ready for use in the next step of the sequencing protocol. An example of a method for tagging on the surface of granules is described in detail in PCT Publication WO 2016/189331, which is incorporated herein by reference in its entirety.

[0124] Фиг. 3 иллюстрирует проблемы, которые могут возникать при применении 5'-связанных комплексов транспосом. Этап 300 наглядно иллюстрирует способ тагментации комплексов транспосом 140, иммобилизованных на грануле 305 с геномной ДНК 315, с последующими амплификацией и целевым обогащением, включающим захват нецелевых нуклеиновых кислот. Иммобилизованная библиотека тагментированной геномной ДНК изображена под обозначением 310. Покрытые стрептавидином гранулы для захвата, содержащие на поверхности тагментированную ДНК, могут быть промыты (320) с применением промывочного буфера, содержащего, например, 5% ДСН, 100 мМ Tris-HCl с рН 7,5, 100 мМ NaCl и 0,1% Tween 20, с денатурацией и отсоединением таким образом транспозазы от комплекса транспосомы. Затем супернатант может быть удален после этапа промывания, путем магнитного захвата покрытых стрептавидином парамагнитных частиц (например, гранул), и гранулы для захвата, содержащие иммобилизованные тагментированные библиотеки, могут быть удержаны, и дополнительно промыты с применением 100 мМ Tris-HCl с рН 7,5, 100 мМ NaCl, 0,1% Tween 20. Связанные олигонуклеотиды удлиняют (330) с получением связанных дуплексов с полной комплементарностью.[0124] FIG. 3 illustrates the problems that may arise with the use of 5'-linked transposome complexes. Step 300 clearly illustrates the method of tagging transposome complexes 140 immobilized on bead 305 with genomic DNA 315, followed by amplification and targeted enrichment, including the capture of non-target nucleic acids. An immobilized library of tagged genomic DNA is depicted as 310. Streptavidin-coated capture beads containing tagged DNA on the surface can be washed (320) using a wash buffer containing, for example, 5% SDS, 100 mM Tris-HCl pH 7, 5, 100 mM NaCl and 0.1% Tween 20, denaturing and thus detaching the transposase from the transposome complex. The supernatant can then be removed after the washing step by magnetically capturing the streptavidin-coated paramagnetic particles (e.g. beads), and the capture beads containing the immobilized tagged libraries can be retained and further washed using 100 mM Tris-HCl pH 7. 5, 100 mM NaCl, 0.1% Tween 20. Linked oligonucleotides are extended (330) to give fully complementary linked duplexes.

[0125] На этапе 340 целевая амплификация продолжается посредством термоциклирования для амплификации тагментированной ДНК, с применением способов, известных специалисту в данной области техники. Например, раствор ПЦР-реагентов (например, смесь, содержащая, как минимум, ПЦР-буфер, дезоксинуклеотиды, дивалентный катион и ДНК-полимеразу) и добавки, необходимые для эффективной амплификации, могут быть добавлены в содержащий гранулы раствор; тагментированная ДНК, связанная с гранулой для захвата, может быть амплифицирована с помощью термоциклирования (например, 10 термических циклов): методология, известная специалисту в данной области техники. На этапе 350 амплифицированная тагментированная ДНК может быть необязательно очищена с применением, например, колонки для очищения (например, спин-колонки Zymo) и элюирована. Указанная амплифицированная тагментированная ДНК может также необязательно быть очищена с применением гранул SPRI или Ampure ХР (Beckman Coulter), способ очищения согласно настоящему изобретению не является ограничивающим.[0125] In step 340, target amplification continues through thermal cycling to amplify the tagged DNA, using methods known to one of skill in the art. For example, a solution of PCR reagents (eg, a mixture containing at least PCR buffer, deoxynucleotides, a divalent cation, and DNA polymerase) and additives necessary for efficient amplification can be added to the bead-containing solution; the tagged DNA bound to the capture bead can be amplified by thermal cycling (eg 10 thermal cycles): a methodology known to one of skill in the art. In step 350, the amplified tagged DNA may optionally be purified using, for example, a purification column (eg, a Zymo spin column) and eluted. Said amplified tagged DNA may also optionally be purified using SPRI or Ampure XP beads (Beckman Coulter), the purification method of the present invention being non-limiting.

[0126] На этапе 360 тагментированные библиотеки могут быть обогащены с применением протокола, соответствующего описанию протокола обогащения NEXTERA Rapid Capture (Illumina), или любого другого способа целевого захвата. В смеси после амплификации (370) присутствуют биотинилированные геномные фрагменты из начала полученной библиотеки, способные конкурировать с биотинилированными целевыми зондами (380), служащими в качестве полногеномных зондов для гибридизации во время целевого обогащения. Присутствие указанных биотинилированных геномных фрагментов на данной стадии может снижать эффективность обогащения. Кроме того, биотинилированные геномные фрагменты могут возникать в ходе ПЦР-амплификации при первичной обработке полимеразой и удлинении свободных биотинилированных адаптеров, не использованных в ходе реакции тагментации, с добавлением таким образом дополнительных нецелевых зондов для захвата на этапе целевого обогащения.[0126] At 360, the tagged libraries may be enriched using a protocol as described in the NEXTERA Rapid Capture (Illumina) enrichment protocol, or any other targeted capture method. The post-amplification mixture (370) contains biotinylated genomic fragments from the beginning of the resulting library that can compete with biotinylated target probes (380) serving as genome-wide hybridization probes during target enrichment. The presence of these biotinylated genomic fragments at this stage may reduce the efficiency of enrichment. In addition, biotinylated genomic fragments can arise during PCR amplification during polymerase pretreatment and elongation of free biotinylated adapters not used during the tagmentation reaction, thus adding additional non-target probes for capture at the stage of targeted enrichment.

[0127] Согласно настоящему изобретению предложен ряд решений указанной проблемы. Согласно одному способу, описанному в настоящем документе, один или более расщепляемых линкеров включены между аффинным элементом и адапторной последовательностью первого транспозона. После того как тагментация завершена, а тагментированная нуклеиновая кислота амплифицирована, указанный расщепляемый линкер может быть расщеплен с высвобождением биотинилированной части и минимизацией или элиминацией нецелевого захвата. Указанная модификация неожиданным образом и резко снижает нецелевой захват и улучшает обогащение относительно других методик тагментации на основе гранул. Далее, аффинный элемент переносят к 3'-концу второго транспозона и присоединяют необязательно расщепляемым линкером.[0127] According to the present invention proposed a number of solutions to this problem. In one method described herein, one or more cleavable linkers are inserted between an affinity element and a first transposon adapter sequence. Once tagmentation is complete and the tagged nucleic acid is amplified, said cleavable linker can be cleaved to release the biotinylated moiety and minimize or eliminate off-target uptake. This modification unexpectedly and dramatically reduces off-target capture and improves enrichment relative to other bead-based tagmentation techniques. Next, the affinity element is transferred to the 3' end of the second transposon and attached with an optionally cleavable linker.

[0128] На фиг. 4 наглядно проиллюстрированы этапы способа 400 фрагментации и мечения ДНК с применением комплексов транспосом, иммобилизованных на твердой поверхности посредством расщепляемого линкера. На фиг. 4 этапы 410, 420, 430, 440 и 450 соответствуют описанию для фиг. 3 (310, 320, 330, 340 и 350, соответственно), за исключением того, что биотинилированные геномные фрагменты, присутствующие в смеси после амплификации (470), содержат расщепляемый линкер (например, линкер, содержащий один или более урацилов). На этапе 460 биотин отщепляют от геномных фрагментов, расщепляя линкер с применением подходящего агента для расщепления. В примере с урацилом расщепление осуществляется расщепляющим урацил ферментом (например, Uracil DNA Excision Mix от Epicentre). В ходе этапа обогащения 480 нецелевые геномные фрагменты уже не биотинилированы и, соответственно, не захватываются как биотинилированные целевые зонды (490). Таким образом, указанный способ снижает нецелевой захват и увеличивает эффективность целевого обогащения по сравнению с 5'-связанным способом без расщепляемого линкера.[0128] In FIG. 4 illustrates the steps of a DNA fragmentation and labeling method 400 using transposome complexes immobilized on a solid surface with a cleavable linker. In FIG. 4, steps 410, 420, 430, 440, and 450 are as described for FIG. 3 (310, 320, 330, 340 and 350, respectively), except that the biotinylated genomic fragments present in the mixture after amplification (470) contain a cleavable linker (eg, a linker containing one or more uracils). In step 460, biotin is cleaved from the genomic fragments by cleaving the linker using a suitable cleavage agent. In the uracil example, digestion is performed by a uracil-cleaving enzyme (eg, Uracil DNA Excision Mix from Epicentre). During the enrichment step 480, non-target genomic fragments are no longer biotinylated and thus are not captured as biotinylated target probes (490). Thus, this method reduces off-target capture and increases the efficiency of targeted enrichment compared to the 5'-linked method without a cleavable linker.

[0129] Способ тагментации на основе гранул с применением адапторных последовательностей, которые включают аффинный элемент, такой как биотин, на 5'-конце, представлен на фиг. 5А. Вкратце, аффинный элемент на 5'-конце двух типов адапторных олигонуклеотидов 501 и 502 применяют для прикрепления двух популяций транспосом к поверхности (например, одной при помощи адапторной последовательности А14, и другой при помощи адапторной последовательности В15). ME и ME' представляют собой концевые последовательности транспозона. При тагментации образуются 5'-меченые фрагменты из целевой нуклеиновой кислоты, такой как геномная ДНК. Некоторые из указанных фрагментов включают А14 на 5'-конце одной цепи и В15 на 5'-конце другой цепи фрагмента, как видно на фигуре. Фрагменты удлиняют и/или проводят реакцию путем амплификации, например, ПЦР, необязательно в присутствии носителей вторичного адаптора, для получения полных дуплексов или ампликонов, необязательно содержащих вторичные адаптеры (например, последовательности праймеров, такие как Р5 и Р7, и/или индексные последовательности, которые показаны на нижнем изображении). При использовании биотина/стрептавидина аффинные связи разрываются в ходе ПЦР, при этом ампликоны биотинилированных фрагментов остаются в растворе, что может осложнять последующее обогащение. Как вариант, на фиг. 5В место прикрепления аффинного элемента и линкера изменяют на 3'-положение на втором транспозоне. В указанном случае указанные аффинный элемент и линкер присоединены к 3'-концу комплементарной концевой последовательности транспозона 503 (ME' последовательность). В указанной конфигурации первые транспозоны 501 и 502 не включают аффинный элемент.В указанном способе при тагментации образуется немеченая фрагментированная геномная ДНК, когда в указанный фрагмент переносят первый транспозон (в котором отсутствует аффинный элемент), и аффинный элемент присоединяется исключительно ввиду гибридизации второго транспозона с первым транспозоном. Адапторные последовательности А14-МЕ, ME, В15-МЕ, ME', А14, В15 и ME приведены ниже:[0129] A bead-based tagging method using adapter sequences that include an affinity element such as biotin at the 5' end is shown in FIG. 5A. Briefly, an affinity element at the 5' end of two types of adapter oligonucleotides 501 and 502 is used to attach two transposome populations to a surface (eg, one with an A14 adapter sequence and the other with a B15 adapter sequence). ME and ME' are transposon terminal sequences. Tagging generates 5'-labeled fragments from the target nucleic acid, such as genomic DNA. Some of these fragments include A14 at the 5'end of one strand and B15 at the 5'end of the other strand of the fragment, as seen in the figure. The fragments are elongated and/or reacted by amplification, e.g. PCR, optionally in the presence of secondary adapter carriers, to obtain full duplexes or amplicons, optionally containing secondary adapters (e.g. primer sequences such as P5 and P7 and/or index sequences, shown in the image below). When using biotin/streptavidin, affinity bonds are broken during PCR, while the amplicons of biotinylated fragments remain in solution, which can complicate subsequent enrichment. Alternatively, in FIG. 5 The attachment site of the affinity element and linker is changed to the 3' position on the second transposon. In this case, said affinity element and linker are attached to the 3' end of the complementary end sequence of the 503 transposon (ME' sequence). In this configuration, the first transposons 501 and 502 do not include an affinity element. In this method, unlabeled fragmented genomic DNA is formed during tagmentation when the first transposon (which lacks an affinity element) is transferred to the indicated fragment, and the affinity element is attached solely due to the hybridization of the second transposon with the first transposon. The adapter sequences A14-ME, ME, B15-ME, ME', A14, B15 and ME are shown below:

Figure 00000013
Figure 00000013

Figure 00000014
Figure 00000014

Целевая нуклеиновая кислотаTarget nucleic acid

[0130] Целевая нуклеиновая кислота может относиться к любому типу, включая ДНК, РНК, кДНК или т.п. Например, целевая нуклеиновая кислота может находиться на различных стадиях очищения, в том числе представлять собой очищенную нуклеиновую кислоту. Однако указанная нуклеиновая кислота не обязательно должна быть очищенной полностью или очищенной вообще в какой-либо степени, и может представлять собой часть биологического образца, например, лизата сырого образца, биологической жидкости, крови, плазмы или сыворотки, или может быть иным образом смешана с белком, другими видами нуклеиновых кислот, другими клеточными компонентами и/или любыми другими загрязняющими примесями. Согласно некоторым вариантам реализации указанный биологический образец содержит смесь нуклеиновых кислот (таких как ДНК), белка, другие виды нуклеиновых кислот, другие клеточные компоненты и/или любую другую загрязняющую примесь, присутствующие в приблизительно в той же пропорции, что и in vivo. Например, согласно некоторым вариантам реализации указанные компоненты обнаруживаются в той же пропорции, что и в интактной клетке. Поскольку предложенные согласно настоящему изобретению способы позволяют обеспечить связывание нуклеиновой кислоты или ДНК с твердой подложкой путем процесса тагментации, другие загрязняющие примеси могут быть удалены путем промывания указанной твердой подложки после проведения тагментации. Указанный биологический образец может содержать, например, неочищенный клеточный лизат или целые клетки. Например, неочищенный клеточный лизат, который наносят на твердую подложку в способе, представленном в настоящем документе, не обязательно подвергать одному или более этапам разделения, традиционно используемым для выделения нуклеиновых кислот из других клеточных компонентов.[0130] The target nucleic acid can be of any type, including DNA, RNA, cDNA, or the like. For example, the target nucleic acid may be at various stages of purification, including being a purified nucleic acid. However, said nucleic acid does not need to be completely purified or purified to any extent at all, and may be part of a biological sample, such as a crude sample lysate, body fluid, blood, plasma, or serum, or may be otherwise admixed with a protein. , other types of nucleic acids, other cellular components and/or any other contaminants. In some embodiments, said biological sample contains a mixture of nucleic acids (such as DNA), protein, other types of nucleic acids, other cellular components, and/or any other contaminant present in approximately the same proportion as in vivo. For example, in some embodiments, these components are found in the same proportion as in an intact cell. Since the methods of the present invention allow nucleic acid or DNA to be bound to a solid support by a tagging process, other contaminants can be removed by washing said solid support after tagging. Said biological sample may contain, for example, crude cell lysate or whole cells. For example, a crude cell lysate that is applied to a solid support in the method provided herein does not need to be subjected to one or more of the separation steps traditionally used to isolate nucleic acids from other cellular components.

[0131] Соответственно, согласно некоторым вариантам реализации указанный биологический образец может содержать не только очищенные нуклеиновые кислоты из любого источника, но также, например, неочищенные нуклеиновые кислоты, обнаруживаемые в крови, плазме, сыворотке, лимфе, слизи, мокроте, моче, семенной жидкости, спинномозговой жидкости, бронхиальном аспирате, экскрементах и мацерированной ткани, или их лизатах, или любой другой биологический препарат, содержащий нуклеиновую кислоту или ДНК-материал. Целевая нуклеиновая кислота может происходить из образца ткани, образца опухоли, раковых клеток или образца биопсии.[0131] Accordingly, in some embodiments, said biological sample may contain not only purified nucleic acids from any source, but also, for example, crude nucleic acids found in blood, plasma, serum, lymph, mucus, sputum, urine, semen , cerebrospinal fluid, bronchial aspirate, feces and macerated tissue, or their lysates, or any other biological preparation containing nucleic acid or DNA material. The target nucleic acid can be derived from a tissue sample, a tumor sample, cancer cells, or a biopsy sample.

[0132] Целевая нуклеиновая кислота может происходить из любого вида, или смеси видов. Например, целевая нуклеиновая кислота может происходить от млекопитающего (такого как человек, собака, кошка, корова, свинья, овца или другое одомашненное животное) или из другого вида, например, рыб, бактерий, вируса, гриба или археи. Нуклеиновая кислота может происходить из образцов окружающей среды, например, почвы или воды.[0132] The target nucleic acid may be from any species, or mixture of species. For example, the target nucleic acid may be from a mammal (such as a human, dog, cat, cow, pig, sheep, or other domesticated animal) or from another species, such as a fish, bacteria, virus, fungus, or archaea. The nucleic acid can be derived from environmental samples such as soil or water.

[0133] Согласно некоторым вариантам реализации целевая нуклеиновая кислота представляет собой ДНК. Согласно одному такому варианту реализации указанная ДНК является двухцепочечной. Согласно некоторым дополнительным вариантам реализации указанная двухцепочечная ДНК содержит геномную ДНК. Согласно некоторым другим вариантам реализации целевая нуклеиновая кислота представляет собой РНК или ее производное, или кДНК.[0133] In some embodiments, the target nucleic acid is DNA. In one such embodiment, said DNA is double stranded. In some additional embodiments, said double-stranded DNA comprises genomic DNA. In some other embodiments, the target nucleic acid is RNA or a derivative thereof, or cDNA.

[0134] Согласно некоторым вариантам реализации биологический образец (сырой образец или экстракт) обрабатывают для очищения целевой нуклеиновой кислоты до осуществления способов тагментации, описанных в настоящем документе. Согласно некоторым вариантам реализации указанный биологический образец представляет собой сырой образец или лизат сырого образца (например, крови или слюны). Согласно некоторым вариантам реализации указанный способ обработки включает получение сырого образца, лизата сырого образца или предварительно обработанного образца (например, образца крови или слюны), смешивание указанного образца с буфером для лизиса и протеиназой K, инкубацию указанной смеси для лизиса клеток в образце и высвобождения ДНК из клеток, с получением таким образом целевой нуклеиновой кислоты или кислот для применения в способах тагментации, описанных в настоящем документе.[0134] In some embodiments, the biological sample (crude sample or extract) is processed to purify the target nucleic acid prior to performing the tagging methods described herein. In some embodiments, said biological sample is a raw sample or a lysate of a raw sample (eg, blood or saliva). In some embodiments, said processing method includes obtaining a raw sample, a raw sample lysate, or a pre-treated sample (e.g., a blood or saliva sample), mixing said sample with lysis buffer and proteinase K, incubating said mixture to lyse cells in the sample, and release DNA from cells, thereby obtaining the target nucleic acid or acids for use in the tagging methods described herein.

[0135] Компоненты сырых образцов или лизатов сырых образцов, таких как кровь, или добавки в предварительно обработанных образцах, например, слюне, собранной в пробирку для сбора образцов Oragene (агенты для стабилизации в пробирках для сбора образцов), могут ингибировать реакции тагментации. Соответственно, согласно настоящему изобретению предложен способ обработки сырого образца, лизата сырого образца или предварительно обработанного образца для решения указанной проблемы. Согласно некоторым вариантам реализации указанный способ включает получение сырого образца, лизата сырого образца или предварительно обработанного образца (например, образца крови или слюны), смешивание указанного образца с буфером для лизиса, протеиназой K и гранулами очищения ДНК (например, гранулами SPRI, гранулами, содержащими карбоксильные группы, при этом указанные необязательно представляют собой магнитные гранулы), инкубацию указанной смеси для лизиса клеток в образце и высвобождения ДНК из клеток, с захватом таким образом ДНК на гранулах для очищения ДНК или гранулах для SPRI, и отделение указанных гранул, содержащих захваченную ДНК, от смеси. Указанное отделение служит для удаления потенциальных ингибиторов тагментации, присутствующих в супернатанте. Указанный способ дополнительно включает необязательное промывание гранул, содержащих захваченную ДНК, и элюирование ДНК с гранул с получением целевой нуклеиновой кислоты или кислот.[0135] Components of raw samples or raw sample lysates, such as blood, or additives in pre-treated samples, such as saliva collected in an Oragene sample collection tube (sample collection tube stabilization agents), can inhibit tagmentation reactions. Accordingly, the present invention provides a method for treating a raw sample, a raw sample lysate, or a pretreated sample to solve this problem. In some embodiments, said method includes obtaining a raw sample, a raw sample lysate, or a pretreated sample (e.g., a blood or saliva sample), mixing said sample with lysis buffer, proteinase K, and DNA purification beads (e.g., SPRI beads, beads containing carboxyl groups, said optionally being magnetic beads), incubating said mixture to lyse the cells in the sample and release the DNA from the cells, thereby trapping the DNA on the DNA purification beads or SPRI beads, and separating said beads containing the captured DNA , from the mixture. This section serves to remove potential inhibitors of tagmentation present in the supernatant. Said method further comprises optionally washing the beads containing the captured DNA and eluting the DNA from the beads to obtain the target nucleic acid or acids.

Способы секвенированияSequencing methods

[0136] Некоторые из способов, предложенных согласно настоящему изобретению, включают способы анализа нуклеиновых кислот. Такие способы включают получение библиотеки матричных нуклеиновых кислот для целевой нуклеиновой кислоты, получение данных о последовательностях из библиотеки матричных нуклеиновых кислот, и сборку модельной последовательности целевой нуклеиновой кислоты. Согласно некоторым вариантам реализации способы, описанные в настоящем документе, могут применяться в процессах секвенирования нового поколения, в том числе, но не ограничиваясь указанным, при секвенировании путем синтеза (SBS). Примеры процедур SBS, струйных систем и платформ для детекции, которые могут быть легко адаптированы для применения с библиотеками нуклеиновых кислот, полученными с помощью способов согласно настоящему изобретению, описаны, например, в источниках: Bentley et al., Nature 456:53-59 (2008), WO 04/018497; US 7,057,026; WO 91/06678; WO 07/123744; US 7329492; US 7211414; US 7315019; US 7405281 и US 2008/0108082, каждый из которых включен в настоящий документ посредством ссылки.[0136] Some of the methods proposed according to the present invention include methods for analyzing nucleic acids. Such methods include obtaining a template nucleic acid library for a target nucleic acid, obtaining sequence data from a template nucleic acid library, and assembling a model target nucleic acid sequence. In some embodiments, the methods described herein can be applied to next generation sequencing processes, including, but not limited to, sequencing by synthesis (SBS). Examples of SBS procedures, inkjet systems and detection platforms that can be readily adapted for use with nucleic acid libraries produced by the methods of the present invention are described, for example, in Bentley et al., Nature 456:53-59 ( 2008), WO 04/018497; US 7,057,026; W091/06678; WO 07/123744; US 7329492; US 7211414; US 7315019; US 7405281 and US 2008/0108082, each of which is incorporated herein by reference.

[0137] Некоторые варианты реализации SBS включают детекцию протона, высвобождаемого при включении нуклеотида в продукт удлинения. Например, при секвенировании, основанном на детекции высвобождаемых протонов, может быть использован электрический детектор и ассоциированные с ним методики, коммерчески доступные от Ion Torrent (Гилфорд, Коннектикут, подконтрольная компания Life Technologies); или способы и системы секвенирования, описанные в источниках: US 2009/0026082 A1; US 2009/0127589 A1; US 2010/0137143 A1; или US 2010/0282617 A1, каждый из которых включен в настоящий документ посредством ссылки.[0137] Some embodiments of SBS include detection of a proton released when a nucleotide is included in the extension product. For example, sequencing based on the detection of released protons can use an electrical detector and associated techniques commercially available from Ion Torrent (Guilford, Conn., a Life Technologies subsidiary); or methods and sequencing systems described in the sources: US 2009/0026082 A1; US 2009/0127589A1; US 2010/0137143A1; or US 2010/0282617 A1, each of which is incorporated herein by reference.

[0138] Другая полезная техника секвенирования представлена секвенированием в нанопорах (см., например, источники: Deamer et al. Trends Biotechnol. 18, 147-151 (2000); Deamer et al. Acc. Chem. Res. 35:817-825 (2002); Li et al. Nat. Mater. 2:611-615 (2003), содержание которых включено в настоящий документ посредством ссылок). Описанные в настоящем документе способы не ограничены использованием какого-либо конкретного типа инструментов для секвенирования.[0138] Another useful sequencing technique is nanopore sequencing (see, for example, sources: Deamer et al. Trends Biotechnol. 18, 147-151 (2000); Deamer et al. Acc. Chem. Res. 35:817-825 (2002); Li et al Nat Mater 2:611-615 (2003, the contents of which are incorporated herein by reference). The methods described herein are not limited to the use of any particular type of sequencing instrument.

ПРИМЕРЫEXAMPLES

[0139] Приведенные ниже примеры служат для описания, а не для ограничения объема настоящего изобретения.[0139] The following examples serve to describe and not limit the scope of the present invention.

Пример 1: Тагментация на твердой поверхности с применением линкера с расщепляемыми ферментативным путем нуклеотидамиExample 1 Tagging on a Solid Surface Using an Enzymatically Cleavable Nucleotide Linker

[0140] Транспозоны получали путем аннелирования двух наборов олигонуклеотидов (представленных любыми из последовательностей SEQ ID NO: 9-11 (модифицированные А14-МЕ) и любыми из последовательностей SEQ ID NO: 12-14 (модифицированные В15-МЕ)), обе из которых спариваются на протяжении мозаичной концевой последовательности (ME) длиной 19 оснований (SEQ ID NO: 8, показан строчными буквами) с комплементарной мозаичной концевой последовательностью (ME'; SEQ ID NO: 5). Олигонуклеотиды, представленные в последовательностях SEQ ID NO: 9 -SEQ ID NO: 14, 5'-биотинилировали для обеспечения последующего поверхностного связывания с покрытыми стрептавидином парамагнитными гранулами. Аннелированные транспозоны получали, комбинируя 50 мкМ каждого биотинилированного олигонуклеотида с 50 мкМ ME' (SEQ ID NO: 5) в присутствии 10 мМ Tris-HCl (рН 8,0), 1 мМ ЭДТК и 25 мМ NaCl и нагревали при 95°С в течение 10 мин, охлаждая до комнатной температуры в течение 2 часов. Затем аннелированные транспозоны смешивали с ферментом транспозазой в конечной концентрации 2 мкМ и инкубировали при 37°С в течение ночи.[0140] Transposons were generated by annulation of two sets of oligonucleotides (represented by any of SEQ ID NOs: 9-11 (A14-ME modified) and any of SEQ ID NOs: 12-14 (B15-ME modified)), both of which pair over a 19 base tiled end sequence (ME) (SEQ ID NO: 8, shown in lower case letters) with a complementary tiled end sequence (ME'; SEQ ID NO: 5). The oligonucleotides shown in the sequences SEQ ID NO: 9 -SEQ ID NO: 14, 5'-biotinylated to allow subsequent surface binding to streptavidin-coated paramagnetic beads. Annelated transposons were prepared by combining 50 μM of each biotinylated oligonucleotide with 50 μM ME' (SEQ ID NO: 5) in the presence of 10 mM Tris-HCl (pH 8.0), 1 mM EDTA, and 25 mM NaCl and heated at 95°C in for 10 minutes, cooling to room temperature over 2 hours. The annelated transposons were then mixed with the enzyme transposase at a final concentration of 2 μM and incubated at 37°C overnight.

[0141] Примеры последовательностей расщепляемого линкера с расщепляемыми нуклеотидными фрагментами представлены последовательностями SEQ ID NO: 9-14. Указанные подписанные как SEQ ID NO: 9 14 последовательности содержат мозаичную концевую (ME) последовательность длиной 19 оснований (обозначена строчными буквами) и последовательности рида 1 и рида 2 А14 и В15 (выделены курсивом). Последовательности, подписанные как SEQ ID NO: 9 и SEQ ID NO: 12, содержат три урациловых нуклеотида (подчеркнуты) после нескольких остатков тимина (выделены жирным шрифтом). Аналогичным образом, последовательности, подписанные как SEQ ID NO: 10 и SEQ ID NO: 13, содержат три урациловых нуклеотида в 3'-направлении от нескольких остатков тимина. Последовательности SEQ ID NO: 11 и SEQ ID NO: 14 содержат один урациловый нуклеотид после нескольких остатков тимина. Как отмечено в настоящем документе, остатки тимина входят в состав указанного расщепляемого линкера, и служат для соединения биотина с расщепляемыми фрагментами, расположенными в 5'-направлении от транспозона и/или адапторных последовательностей. Согласно некоторым вариантам реализации указанный расщепляемый линкер включает 1-10 расщепляемых урациловых нуклеотидов. Согласно некоторым вариантам реализации указанный расщепляемый линкер включает по меньшей мере один расщепляемый урациловый нуклеотид. Согласно определенному варианту реализации указанный расщепляемый линкер включает 2, 3, 4, 5, 6, 7, 8, 9 или 10 расщепляемых урациловых нуклеотидов. SEQ ID NO: 8 представляет собой мозаичную концевую (ME) последовательность длиной 19 оснований, a SEQ ID NO: 5 представляет собой комплементарную ей последовательность.[0141] Examples of cleavable linker sequences with cleavable nucleotide fragments are shown in SEQ ID NOs: 9-14. These 14 sequences, signed as SEQ ID NO: 9, contain a 19 base mosaic terminal (ME) sequence (indicated in lowercase letters) and read 1 and read 2 sequences A14 and B15 (in italics). The sequences labeled SEQ ID NO: 9 and SEQ ID NO: 12 contain three uracil nucleotides (underlined) after several thymine residues (bold). Similarly, the sequences signed as SEQ ID NO: 10 and SEQ ID NO: 13 contain three uracil nucleotides in the 3' direction from several thymine residues. The sequences of SEQ ID NO: 11 and SEQ ID NO: 14 contain one uracil nucleotide after several thymine residues. As noted herein, thymine residues are included in said cleavable linker and serve to link biotin to cleavable moieties located 5' from the transposon and/or adapter sequences. In some embodiments, said cleavable linker comprises 1-10 cleavable uracil nucleotides. In some embodiments, said cleavable linker comprises at least one cleavable uracil nucleotide. In a specific embodiment, said cleavable linker comprises 2, 3, 4, 5, 6, 7, 8, 9, or 10 cleavable uracil nucleotides. SEQ ID NO: 8 is a 19 base mosaic terminal (ME) sequence, and SEQ ID NO: 5 is its complementary sequence.

SEQ ID NO: 9 (модифицированный А14-МЕ #1)SEQ ID NO: 9 (modified A14-ME #1)

Figure 00000015
Figure 00000015

SEQ ID NO: 10 (модифицированный A14-ME #2)SEQ ID NO: 10 (modified A14-ME #2)

Figure 00000016
Figure 00000016

SEQ ID NO: 11 (модифицированный A14-ME #3)SEQ ID NO: 11 (modified A14-ME #3)

Figure 00000017
Figure 00000017

SEQ ID NO: 12 (модифицированный B15-ME #1)SEQ ID NO: 12 (modified B15-ME #1)

Figure 00000018
Figure 00000018

SEQ ID NO: 13 (модифицированный B15-ME #2)SEQ ID NO: 13 (modified B15-ME #2)

Figure 00000019
Figure 00000019

SEQ ID NO: 14 (модифицированный B15-ME #3)SEQ ID NO: 14 (modified B15-ME #3)

Figure 00000020
Figure 00000020

[0142] После образования транспосом их закрепляли на покрытых стрептавидином гранулах. Затем гранулы промывали разбавленным раствором транспосом в буфере НТ1 (Illumina). НТ1 содержит соли в высокой концентрации, необходимой для связывания биотина со стрептавидином на гранулах. Гранулы и транспосомы инкубировали при смешивании с помощью миксера в течение 1 часа. После смешивания гранулы ресуспендировали в буфере для хранения, содержащем 15% глицерина и другие буферные агенты (например, Tris).[0142] After the formation of transposome, they were fixed on streptavidin-coated beads. The beads were then washed with a dilute solution of transpos in HT1 buffer (Illumina). HT1 contains salts at a high concentration necessary for the binding of biotin to streptavidin on the beads. Beads and transposomes were incubated while mixing with a mixer for 1 hour. After mixing, the beads were resuspended in storage buffer containing 15% glycerol and other buffering agents (eg Tris).

[0143] Затем проводили тагментацию. Например, раствор для тагментации добавляли в образец, содержащий иммобилизованные транспосомы, и инкубировали при 55°С в течение приблизительно 15 минут. Реакция тагментации включала ДНК (например, приблизительно от 50 пг до 5 мкг ДНК) и буфер для тагментации. Согласно одному примеру указанный буфер для тагментации содержит компоненты, необходимые для протекания реакции тагментации, например, представляет собой буфер, содержащий 10 мМ Tris-ацетат (рН 7,6), 5 мМ ацетат магния и 10% диметилформамида, согласно описанию в патентах США №9080211, №9085801 и №9115396, каждый из которых включен посредством ссылки. Получали иммобилизованную библиотеку меченых фрагментов ДНК.[0143] Tagging was then performed. For example, a tag solution was added to a sample containing immobilized transposoms and incubated at 55° C. for approximately 15 minutes. The tagging reaction included DNA (eg, approximately 50 pg to 5 μg of DNA) and tagging buffer. According to one example, said tagging buffer contains the components necessary for the tagging reaction to proceed, for example, it is a buffer containing 10 mM Tris-acetate (pH 7.6), 5 mM magnesium acetate and 10% dimethylformamide, as described in US patents No. 9080211, No. 9085801 and No. 9115396, each of which is incorporated by reference. An immobilized library of labeled DNA fragments was obtained.

Пример 2: ПЦР-амплификация тагментированной ДНК и ферментативное расщеплениеExample 2: PCR Amplification of Tagged DNA and Enzymatic Digestion

[0144] Покрытые стрептавидином гранулы для захвата, содержащие тагментированную ДНК согласно описанию в примере 1, промывали (например, троекратно) промывочным буфером, содержащим 5% ДСН, 100 мМ Tris-HCl (рН 7,5), 100 мМ NaCl и 0,1% Tween 20, с денатурацией и отсоединением таким образом фермента транспозазы от комплекса транспосомы. После этапа промывания супернатант удаляли с помощью магнитного захвата покрытых стрептавидином парамагнитных частиц (например, гранул); гранулы, содержащие иммобилизованные тагментированные библиотеки, сохраняли и дополнительно промывали с применением 100 мМ Tris-HCl (рН 7,5), 100 мМ NaCl и 0,1% Tween 20.[0144] Streptavidin-coated capture beads containing tagged DNA as described in Example 1 were washed (e.g., three times) with wash buffer containing 5% SDS, 100 mM Tris-HCl (pH 7.5), 100 mM NaCl, and 0. 1% Tween 20, denaturing and thus detaching the transposase enzyme from the transposome complex. After the washing step, the supernatant was removed by magnetically capturing streptavidin-coated paramagnetic particles (eg, beads); the beads containing the immobilized tagged libraries were saved and additionally washed with 100 mM Tris-HCl (pH 7.5), 100 mM NaCl and 0.1% Tween 20.

[0145] Заполнение пропусков во фрагментах ДНК (для заполнения пропусков между 5'-концами последовательностей ME' и 3'-концами указанных фрагментов (см., например, фиг. 5 В) осуществляли путем добавления, например, смеси NEM (NEXTERA Rapid Capture Kit, Illumina) и инкубации при 72°С в течение 3 минут.[0145] Filling in the gaps in the DNA fragments (to fill in the gaps between the 5' ends of the ME' sequences and the 3' ends of the indicated fragments (see, for example, Fig. 5B) was carried out by adding, for example, a mixture of NEM (NEXTERA Rapid Capture Kit, Illumina) and incubation at 72°C for 3 minutes.

[0146] Проводили целевую амплификацию посредством термоциклирования для амплификации тагментированной ДНК с применением способов, известных специалисту в данной области техники. Согласно некоторым примерам к гранулам добавляли раствор реагентов для ПЦР (например, мастер-микс (например, смесь NEM (NEXTERA Rapid Capture Kit, Illumina) содержащий, как минимум, ПЦР-буфер, дезоксинуклеотиды, дивалентный катион, ДНК-полимеразу) и добавки, необходимые для эффективной амплификации; тагментированную ДНК, связанную с гранулами, амплифицировали с применением термоциклирования (например, 10 термических циклов).[0146] Conducted targeted amplification by thermal cycling to amplify tagged DNA using methods known to the person skilled in the art. According to some examples, a solution of PCR reagents (e.g., a master mix (e.g., NEM mix (NEXTERA Rapid Capture Kit, Illumina) containing at least PCR buffer, deoxynucleotides, divalent cation, DNA polymerase) and additives was added to the beads, required for efficient amplification, the tagged DNA associated with the beads was amplified using thermal cycling (eg, 10 thermal cycles).

[0147] Супернатант, содержащий амплифицированную тагментированную ДНК, извлекали из реакционной камеры и переносили в новую реакционную камеру (например, пробирку, лунку и т.п.). Смесь амплифицированных фрагментов обрабатывали одним или более ферментами, расщепляющими основания в расщепляемом линкере. Любой из ряда известных ферментов, разрушающих нуклеотидный остов, может применяться для расщепления нецелевых продуктов для предотвращения нецелевой гибридизации с геномом. Примеры подходящих ферментов включают, не ограничиваясь перечисленными, урацил-ДНК-гликозилазу (UDG, также называемую UNG), формамидо-пиримидин-ДНК-гликозилазу (Fpg), РНКазу Н, Endo IV, Endo VIII, фермент Кленова или апиразу.[0147] The supernatant containing the amplified tagged DNA was removed from the reaction chamber and transferred to a new reaction chamber (eg, tube, well, etc.). The mixture of amplified fragments was treated with one or more base cleaving enzymes in a cleavable linker. Any of a number of known backbone degrading enzymes can be used to cleave off-target products to prevent off-target hybridization with the genome. Examples of suitable enzymes include, but are not limited to, uracil DNA glycosylase (UDG, also referred to as UNG), formamido-pyrimidine DNA glycosylase (Fpg), RNase H, Endo IV, Endo VIII, Klenow enzyme, or apyrase.

[0148] Амплифицированную тагментированную ДНК очищали с применением гранул SPRI или Ampure ХР (Beckman Coulter), при этом способ очищения не ограничен описанными в настоящем документе. Тагментированные библиотеки могут быть обогащены с применением протокола обогащения, описанного для NEXTERA Rapid Capture (Illumina) или любого другого способа целевого захвата. После этого обогащенная библиотека ДНК готова для секвенирования.[0148] The amplified tagged DNA was purified using SPRI or Ampure XP beads (Beckman Coulter), and the purification method is not limited to those described herein. Tagged libraries can be enriched using the enrichment protocol described for NEXTERA Rapid Capture (Illumina) or any other targeted capture method. The enriched DNA library is then ready for sequencing.

Пример 3: Обогащение по ридам с применением ферментативного расщепления расщепляемого линкера, содержащего урацилExample 3 Read Enrichment Using Enzymatic Cleavage of a Cleavable Linker Containing Uracil

[0149] Вкратце, для каждого протестированного условия использовали 50 нг геномной ДНК NA12878 (Coriell Institute). В качестве контрольной реакции тагментировали ДНК, получали и обогащали библиотеки после выполнения протокола NEXTERA Rapid Capture Enrichment (Illumina) в соответствии с рекомендациями производителя. Использовали урацил-содержащие расщепляемые линкеры SEQ ID NO: 9 и SEQ ID NO: 13.[0149] Briefly, 50 ng of NA12878 genomic DNA (Coriell Institute) was used for each condition tested. As a control reaction, DNA was tagged, and libraries were obtained and enriched after NEXTERA Rapid Capture Enrichment protocol (Illumina) according to the manufacturer's recommendations. Uracil containing cleavable linkers SEQ ID NO: 9 and SEQ ID NO: 13 were used.

[0150] Вкратце, каждый реакционный объем 50 мкл содержал 5Х буфер для тагментации, 50 нг ДНК, 5 мкл 250 нМ конъюгированных с транспосомами парамагнитных гранул Dynal (Life Technologies) с расщепляемыми урациловыми линкерами, представленными в последовательностях SEQ ID NO: 9 и SEQ ID NO: 13. Реакцию инкубировали при 55°С в течение 15 минут с последующим добавлением 15 мкл буфера Stop Tagment Buffer (ST), а затем инкубировали при комнатной температуре в течение дополнительных 5 минут. Образцы помещали на магнит и удаляли супернатант. Гранулы ресуспендировали в 50 мкл NEM (Illumina) и инкубировали при 72°С в течение 5 минут с последующим охлаждением до 10°С. Образцы помещали на магнит, удаляли супернатант и промывали в промывочном буфере НТ2 (Illumina).[0150] Briefly, each 50 µl reaction volume contained 5X tag buffer, 50 ng DNA, 5 µl of 250 nM Dynal (Life Technologies) transposome conjugated paramagnetic beads with cleavable uracil linkers shown in SEQ ID NO: 9 and SEQ ID NO: 13. The reaction was incubated at 55° C. for 15 minutes followed by the addition of 15 μl Stop Tagment Buffer (ST) and then incubated at room temperature for an additional 5 minutes. The samples were placed on a magnet and the supernatant was removed. The beads were resuspended in 50 μl NEM (Illumina) and incubated at 72°C for 5 minutes followed by cooling to 10°C. The samples were placed on a magnet, the supernatant removed and washed in HT2 wash buffer (Illumina).

[0151] ПЦР-реакции проводили путем добавления 40 мкл ЕРМ, по 10 мкл каждого из индексных праймеров (например, Р5'-индекс-А14' и Р7'-индекс-В15') и воды. ПЦР-амплификацию выполняли следующим образом: 72°С в течение 3 минут; 98°С в течение 30 секунд с последующими 10 циклами при 98°С в течение 10 секунд; 65°С в течение 30 секунд; 72°С в течение 60 секунд. ПЦР-продукты обрабатывали 5 мкл смеси ферментов USER (1 Ед/мкл - артикульный номер NEB M5505L) и инкубировали при 37°С в течение 30 минут с последующим отбором по размеру, с применением парамагнитных гранул AMPure ХР (Beckman Coulter, кат. №А63880) на основе SPRI (твердофазной обратимой иммобилизации) в соответствии с рекомендациями производителя. Сначала 100 мкл обработанного USER ПНР-продукта смешивали с 55 мкл воды и 105 мкл парамагнитных гранул. Образец выдерживали при выключенном магнитном поле в течение 5 минут, при включенном магнитном поле в течение 5 минут, затем извлекали супернатант для второго отбора по размеру (250 мкл супернатанта + 30 мкл парамагнитных гранул). Гранулы промывали в 80% этаноле, высушивали воздухом и элюировали в 25 мкл RSB (Illumina).[0151] PCR reactions were performed by adding 40 μl of EPM, 10 μl of each of the index primers (eg, P5'-index-A14' and P7'-index-B15') and water. PCR amplification was performed as follows: 72°C for 3 minutes; 98°C for 30 seconds followed by 10 cycles at 98°C for 10 seconds; 65°C for 30 seconds; 72°C for 60 seconds. PCR products were treated with 5 µl of USER enzyme mixture (1 U/µl - NEB part number M5505L) and incubated at 37°C for 30 minutes, followed by size selection using AMPure XP paramagnetic beads (Beckman Coulter cat. no. A63880 ) based on SPRI (solid phase reversible immobilization) according to the manufacturer's recommendations. First, 100 µl of USER-treated PNR product was mixed with 55 µl of water and 105 µl of paramagnetic beads. The sample was held with the magnetic field turned off for 5 minutes, with the magnetic field turned on for 5 minutes, then the supernatant was removed for a second size selection (250 μl of supernatant + 30 μl of paramagnetic beads). The beads were washed in 80% ethanol, air dried and eluted in 25 μl RSB (Illumina).

[0152] Обогащение обработанных ферментами USER прошедших отбор по размерам образцов проводили с применением панели зондов TruSight One (Illumina) в соответствии с протоколом для набора NEXTERA Rapid Capture Enrichment согласно рекомендациям производителя (Illumina). Образцы секвенировали на HiSeq 2500 согласно рекомендациям производителя (Illumina).[0152] Enrichment of USER-treated size-selected samples was performed using a TruSight One Probe Panel (Illumina) according to the protocol for the NEXTERA Rapid Capture Enrichment Kit as recommended by the manufacturer (Illumina). Samples were sequenced on a HiSeq 2500 according to the manufacturer's recommendations (Illumina).

Figure 00000021
Figure 00000021

[0153] Как видно из таблицы 1, реализация тагментации и обогащения в растворе (например, NEXTERA Rapid Capture) приводила к 70% обогащению по ридам. При применении транспосом, закрепленных на гранулах урацил-содержащим линкером, но без обработки с ферментативным расщеплением, % обогащения по ридам был значимо ниже и составлял 45%. Однако при расщеплении урацилов в линкере посредством ферментативной обработки обогащение повышалось до 67%, с возвращением таким образом обогащения до уровня при тагментации и обогащения без иммобилизации, или в растворе.[0153] As can be seen from Table 1, the implementation of tagmentation and enrichment in solution (eg, NEXTERA Rapid Capture) resulted in 70% enrichment in reads. When using transposoms fixed on beads with a uracil-containing linker, but without treatment with enzymatic cleavage, the % enrichment in reads was significantly lower and amounted to 45%. However, when the uracils were cleaved in the linker by enzymatic treatment, the enrichment increased to 67%, thus returning the enrichment to the level of tagmentation and enrichment without immobilization, or in solution.

Пример 4: 6-плексное и 12-плексное обогащение экзома при ферментативном расщеплении и без ферментативного расщепления урацилового линкераExample 4: 6-Plex and 12-Plex Exome Enrichment with Enzymatic Cleavage and Without Enzymatic Cleavage of the Uracil Linker

[0154] В приведенном ниже примере продемонстрирован эксперимент по обогащению экзома с применением линкера из 5 тиминов (5Т) или линкера из двух тиминов и 3 урацилов (2T3U), без ферментативного расщепления и с ферментативным расщеплением (2T3U+ENZ), со сравнением с набором TruSeq Rapid Exome Kit (Illumina).[0154] The following example demonstrates an exome enrichment experiment using a 5 thymine linker (5T) or a two thymine and 3 uracil linker (2T3U), without enzymatic cleavage and with enzymatic cleavage (2T3U+ENZ), compared with the kit TruSeq Rapid Exome Kit (Illumina).

[0155] Экспериментальная процедура соответствовала описанию в примере 3 за исключением того, что использовали 7,5 мкл гранул с иммобилизованными транспосомами и исключали этап заполнения пропусков. Обогащение выполняли с применением набора TruSeq Rapid Exome Kit (Illumina). Секвенирование выполняли на HiSeq 2500 в соответствии с рекомендациями производителя (Illumina).[0155] The experimental procedure was as described in Example 3 except that 7.5 µl of transposome immobilized beads were used and the gap filling step was omitted. Enrichment was performed using the TruSeq Rapid Exome Kit (Illumina). Sequencing was performed on a HiSeq 2500 according to the manufacturer's recommendations (Illumina).

Figure 00000022
Figure 00000022

Figure 00000023
Figure 00000023

[0156] Как видно из таблицы 2, только линкер 2T3U при ферментативном расщеплении продемонстрировал показатели обогащения, сопоставимые с NEXTERA в растворе, при использовании TruSeq Rapid Exome Kit (Illumina) или стандартной тагментации на поверхности с остатками тимина 5Т.[0156] As can be seen from Table 2, only the 2T3U linker, when enzymatically digested, showed enrichment performance comparable to NEXTERA in solution using the TruSeq Rapid Exome Kit (Illumina) or standard 5T thymine surface tagging.

Пример 5: Сравнение способов с 5'- и 3'-биотинилированными адапторными олиго нуклеотидамиExample 5 Comparison of methods with 5' and 3' biotinylated adapter oligonucleotides

[0157] В определенных способах тагментации на основе гранул используются адапторные последовательности, биотинилированные по 5'-концу, как показано на фиг. 5А. Вкратце, 5'-биотинилированные адапторные олигонуклеотиды 501 и 502 прикрепляют транспосомы к поверхности. При тагментации образуется 5'-биотинилированная фрагментированная полногеномная ДНК, которая может быть загрязнителем на последующем этапе обогащения. Согласно одному варианту реализации место прикрепления биотина меняют на 3'-положение на комплементарной цепи (второй транспозон) для прикрепления транспосом к поверхности, как показано на фиг. 5 В. Вкратце, олигонуклеотиды 501 и 502 не содержат биотина. В указанном примере биотин присоединен к концевой последовательности транспозона 503 на комплементарной цепи (последовательность ME'). В указанной конфигурации при тагментации образуются не содержащие биотина фрагменты геномной ДНК.[0157] Certain bead-based tagging methods use adapter sequences biotinylated at the 5' end, as shown in FIG. 5A. Briefly, 5'-biotinylated adapter oligonucleotides 501 and 502 attach transposomes to surfaces. Tagging produces a 5'-biotinylated fragmented whole genome DNA, which can be a contaminant in a subsequent enrichment step. In one embodiment, the biotin attachment site is changed to the 3' position on the complementary strand (second transposon) to attach the transposome to the surface, as shown in FIG. 5B. Briefly, oligonucleotides 501 and 502 do not contain biotin. In this example, biotin is attached to the terminal sequence of the transposon 503 on the complementary strand (sequence ME'). In this configuration, biotin-free genomic DNA fragments are formed during tagmentation.

[0158] Согласно еще одному варианту реализации между 3'-олигонуклеотидом 503 и биотином располагается линкер. Это может способствовать уменьшению каких-либо стерических затруднений при осуществлении транспозиционной активности, которые могут возникать на твердой поверхности.[0158] According to another implementation variant between the 3'-oligonucleotide 503 and biotin is a linker. This may help to reduce any steric hindrance in the implementation of transpositional activity, which may occur on a solid surface.

[0159] В приведенном ниже примере продемонстрировано применение 3'-биотинилированного олигонуклеотида с линкером формулы (I(a)) (линкер типа глицерина) при получении библиотек для секвенирования. В качестве контрольной реакции ДНК тагментировали, получали и обогащали библиотеки после выполнения протокола обогащения NEXTERA Rapid Capture Enrichment в соответствии с рекомендациями производителя (Illumina). Следовали экспериментальному протоколу, описанному в примере 3, за исключением того, что тагментированные амплифицированные ДНК обогащали в соответствии с протоколом набора для захвата с гибридизацией Xgen Lockdown (Integrated DNA Technologies, IDT), используя панель для экзома и следуя рекомендованному производителем протоколу. В основном, наблюдалась менее чем оптимальное общее обогащение, поскольку для замены рекомендованных универсальных блокирующих олигонуклеотидов, поставляемых с набором Xgen Lockdown, использовали субоптимальные блокирующие олигонуклеотиды. Однако предмет внимания в данном эксперименте требовал не применения оптимальных блокирующих зондов, а исключительно возможности наблюдать измеримое изменение указанного предмета эксперимента. Субоптимальные блокирующие олигонуклеотиды, как ожидается, не влияют на предмет эксперимента.[0159] The following example demonstrates the use of a 3'-biotinylated oligonucleotide with a linker of formula (I(a)) (glycerol-type linker) in the preparation of sequencing libraries. As a control reaction, DNA was tagged and libraries were prepared and enriched following the NEXTERA Rapid Capture Enrichment protocol as recommended by the manufacturer (Illumina). The experimental protocol described in Example 3 was followed, except that the tagged amplified DNA was enriched according to the protocol of the Xgen Lockdown Hybridization Capture Kit (Integrated DNA Technologies, IDT) using an exome panel and following the manufacturer's recommended protocol. In general, less than optimal overall enrichment was observed because suboptimal blocking oligonucleotides were used to replace the recommended universal blocking oligonucleotides supplied with the Xgen Lockdown kit. However, the focus of this experiment did not require the use of optimal blocking probes, but solely the ability to observe a measurable change in the specified subject of the experiment. Suboptimal blocking oligonucleotides are not expected to affect the subject of the experiment.

Figure 00000024
Figure 00000024

[0160] Как видно из таблицы 3, для 5'-биотина с урациловым линкером и ферментным расщеплением наблюдалось значимо более низкий уровень обогащения по сравнению с контролем и 3'-биотином (с линкером или без линкера). Указанный более низкий уровень обогащения по ридам для способа, задействующего 5'-биотин с урациловым линкером и ферментное расщепление может быть результатом неполного расщепления смесью ферментов. В экспериментах с 3'-соединением продемонстрировано достижение уровней обогащения по ридам, сопоставимых с уровнями для контроля в растворе.[0160] As shown in Table 3, 5'-biotin with uracil linker and enzymatic digestion had a significantly lower level of enrichment compared to control and 3'-biotin (with or without linker). This lower level of read enrichment for a method involving 5'-biotin with a uracil linker and enzyme digestion may be the result of incomplete digestion by the enzyme mixture. In experiments with the 3'-compound, the achievement of read enrichment levels comparable to those for control in solution was demonstrated.

Пример 6: Получение Р-биотинилированных гранул для инсерций небольшого размера (150-200 п.о.)Example 6 Preparation of P-Biotinylated Beads for Small Size Inserts (150-200 bp)

Этап 1. Аннелирование транспозоновStage 1. Annulation of transposons

[0161] Каждый из А14-МЕ и В15-МЕ аннелировали с олигонуклеотидом МЕ'-линкер-биотин (состав описан ниже) с получением двух двухцепочечных комплексов, оба из которых содержат мозаичный концевой фрагмент (ME), специфически распознаваемый транспозазой, и последовательность А14 или В15, используемую при ПЦР для добавления вторичных адапторов. Олигонуклеотиды А14-МЕ, В15-МЕ, и ME' ресуспендировали до концентрации 200 нМ. В 2 лунки 96-луночного планшета для ПЦР добавляли составы, приведенные в таблице 4 ниже (1 лунка для А14:МЕ' и 1 лунка для В15-МЕ'). Планшет помещали в термоциклер на 10 мин при 95°С, затем вынимали из термоциклера и выставляли на стол при комнатной температуре на два часа.[0161] Each of A14-ME and B15-ME was annelated with the ME'-linker-biotin oligonucleotide (composition described below) to give two double-stranded complexes, both of which contain a mosaic end fragment (ME) specifically recognized by transposase and the A14 sequence or B15 used in PCR to add secondary adapters. Oligonucleotides A14-ME, B15-ME, and ME' were resuspended to a concentration of 200 nM. The formulations shown in Table 4 below (1 well for A14:ME' and 1 well for B15-ME') were added to 2 wells of a 96-well PCR plate. The tablet was placed in a thermal cycler for 10 min at 95°C, then removed from the thermal cycler and put on the table at room temperature for two hours.

Figure 00000025
Figure 00000025

Этап 2. Образование транспосомStage 2. Transposome formation

[0162] К описанным выше аннелированным транспозонам добавляли транспозазу Tn5 с образованием комплекса транспосомы, содержащего комплексы А14-МЕ/МЕ'-линкер-биотин и В15-МЕ/МЕ'-линкер-биотин. Аннелированные олигонуклеотиды, полученные на предыдущем этапе, использовали для проведения описанных ниже реакций в 96-луночном планшете для ПЦР. Одну лунку отводили для А14-МЕ и одну - для В15-МЕ. Каждую лунку инкубировали в термоциклере в течение ночи при 37°С, с получением двух популяций комплексов транспосом; затем содержимое двух лунок смешивали. После этапа смешивания приблизительно 220 мкл извлекали и добавляли в другую лунку. Добавляли приблизительно 220 мкл стандартного буфера для хранения (общий объем 440 мкл).[0162] Tn5 transposase was added to the annelated transposons described above to form a transposome complex containing A14-ME/ME'-linker-biotin and B15-ME/ME'-linker-biotin complexes. The annelated oligonucleotides obtained in the previous step were used to carry out the reactions described below in a 96-well PCR plate. One well was reserved for A14-ME and one well for B15-ME. Each well was incubated overnight in a thermal cycler at 37° C. to generate two populations of transposome complexes; then the contents of the two wells were mixed. After the mixing step, approximately 220 μl was withdrawn and added to another well. Approximately 220 μl of standard storage buffer was added (total volume 440 μl).

Figure 00000026
Figure 00000026

[0163] Полученные описанным выше способом комплексы транспосом, связанные с биотином, добавляли к гранулам со стрептавидином. Плотность комплексов на гранулах может быть скорректирована для контроля размеров инсерций в продуктах тагментации. Гранулы со стрептавидином тщательно перемешивали. Приблизительно 200 мкл гранул со стрептавидином помещали в пробирку объемом 1,5 мл и помещали на магнит для пробирок. Гранулы двукратно промывали 1 мл НТ1, а затем ресуспендировали и осаждали центрифугированием между промываниями. После второго промывания гранулы полностью ресуспендировали в 600 мкл НТ1. 400 мкл полученного описанным выше способом комплекса транспосомы добавляли в пробирку с НТ1. Указанную смесь перемешивали на ротационной мешалке в течение 1 часа, помещали на магнит и удаляли супернатант. Смесь ресуспендировали в 500 мкл 15% стандартного буфера для хранения. Гранулы нагружали в присутствии 1000 нМ комплексов транспосом; комплексы с итоговой плотностью 1000 нМ разбавляли и хранили при концентрации 400 нМ в растворе. Соответственно, основной раствор содержал гранулы с плотностью комплекса 1000 нМ, разбавленного до концентрации 400 нМ. На этапе разбавления изменялась не плотность комплексов на гранулах, а только итоговая концентрация комплексов в основном растворе.[0163] Biotin-bound transposome complexes prepared as described above were added to streptavidin beads. The density of the complexes on the beads can be adjusted to control the size of insertions in the tag products. Streptavidin granules were thoroughly mixed. Approximately 200 μl of streptavidin beads were placed in a 1.5 ml tube and placed on a tube magnet. The beads were washed twice with 1 ml HT1 and then resuspended and pelleted by centrifugation between washes. After the second wash, the beads were completely resuspended in 600 µl of HT1. 400 μl of the transposome complex obtained as described above was added to the HT1 tube. This mixture was stirred on a rotary mixer for 1 hour, placed on a magnet and the supernatant was removed. The mixture was resuspended in 500 µl of 15% standard storage buffer. The beads were loaded in the presence of 1000 nM transposome complexes; complexes with a final density of 1000 nM were diluted and stored at a concentration of 400 nM in solution. Accordingly, the stock solution contained beads with a complex density of 1000 nM diluted to a concentration of 400 nM. At the stage of dilution, it was not the density of the complexes on the granules that changed, but only the final concentration of the complexes in the main solution.

Этап 4. ТагментацияStage 4. Tagging

[0164] Образец ДНК тагментировали для получения фрагментов с применением нагруженных на гранулы транспосом для разрезания и добавления последовательности транспозона в образцы ДНК. В 96-луночном планшете для ПЦР комбинировали 5х Mg-буфер для тагментации (10 мкл), ДНК (>50 нг; 10 мкл), dH2О (20 мкл) и гранулы с транспосомами (полученные согласно этапу 3; 10 мкл). Смесь тщательно перемешивали и инкубировали при 55°С в течение 5 минут, а затем в течение 2 минут при 20°С. Процесс тагментации останавливали путем инактивации фермента транспозазы обработкой ДСН. Добавляли 10 мкл ДСН и тщательно перемешивали с реакционной смесью, полученной на описанном выше этапе. Затем указанную смесь инкубировали при комнатной температуре на столе в течение 5 минут и помещали на магнитную мешалку. После осветления раствора супернатант удаляли.[0164] The DNA sample was tagged to obtain fragments using bead-loaded transposome to cut and add the transposon sequence to the DNA samples. In a 96-well PCR plate, 5x Mg tag buffer (10 µl), DNA (>50 ng; 10 µl), dH 2 O (20 µl) and transposome beads (prepared according to step 3; 10 µl) were combined. The mixture was thoroughly mixed and incubated at 55°C for 5 minutes and then for 2 minutes at 20°C. The tagmentation process was stopped by inactivating the transposase enzyme by treatment with SDS. Added 10 μl of SDS and thoroughly mixed with the reaction mixture obtained in the above step. Then the specified mixture was incubated at room temperature on the table for 5 minutes and placed on a magnetic stirrer. After clarification of the solution, the supernatant was removed.

Этап 5. Промывание после остановки тагментацииStage 5. Washing after stopping tagging

[0165] Для получения образца для ПЦР ДСН отмывали с гранул. Реакционную смесь после остановки тагментации снимали с магнита и добавляли 100 мкл промывочного буфера. Образец перемешивали на вортексе в течение 20 секунд при 1600 об/мин. Затем его снова помещали на магнитную мешалку и после осветления раствора удаляли супернатант. Этап промывания повторяли в общей сложности три раза. После завершения промывания супернатант полностью удаляли и образец снимали с магнитной мешалки.[0165] To obtain a sample for PCR, SDS was washed from the beads. The reaction mixture was removed from the magnet after tagmentation was stopped, and 100 µl of washing buffer was added. The sample was vortexed for 20 seconds at 1600 rpm. Then it was again placed on a magnetic stirrer, and after clarification of the solution, the supernatant was removed. The washing step was repeated a total of three times. After washing was completed, the supernatant was completely removed and the sample removed from the magnetic stirrer.

Этап 6. ПНРStage 6. NDP

[0166] Полученный на этапе 5 образец ПЦР-амплифицировали с праймерами, которые распознают А14 и В15, и добавляли вторичные адаптеры. Праймеры также включают индексные последовательности и праймеры для секвенирования (Р5 и Р7). Описанный в таблице 6 мастер-микс добавляли в каждую лунку с образцом. Гранулы ресуспендировали в мастер-миксе и помещали в термоциклер, используя программу, описанную в таблице 7. Указанный этап служил для удаления неперенесенной /биотинилированной цепи, удлинения и амплификации для введения Р5 и Р7 одновременно в ходе одного процесса.[0166] The sample obtained in step 5 was PCR amplified with primers that recognize A14 and B15 and secondary adapters were added. The primers also include index sequences and sequencing primers (P5 and P7). The master mix described in Table 6 was added to each sample well. The beads were resuspended in the master mix and placed in a thermal cycler using the program described in Table 7. This step served to remove the non-transferred/biotinylated strand, extend and amplify to introduce P5 and P7 simultaneously in one process.

Figure 00000027
Figure 00000027

Figure 00000028
Figure 00000028

[0167] Образец вынимали из термоциклера и помещали на магнитную мешалку. Затем 45 мкл образца переносили из планшета для ПЦР в планшет MIDI. К образцам в планшете MIDI добавляли 77 мкл воды, и в каждый образец с водой добавляли по 88 мкл гранул для SPRI Ampure. Смесь тщательно перемешивали, инкубировали при комнатной температуре в течение 5 минут, а затем помещали на магнитную мешалку. После осветления раствора 200 мкл образца добавляли в новую лунку того же планшета MIDI. Добавляли 20 мкл гранул для SPRI Ampure, образец тщательно перемешивали и оставляли при комнатной температуре на 5 минут. Затем его опять помещали на магнитную мешалку.[0167] The sample was removed from the thermal cycler and placed on a magnetic stirrer. Then 45 µl of the sample was transferred from the PCR plate to the MIDI plate. 77 µl water was added to the samples in the MIDI plate, and 88 µl SPRI Ampure beads were added to each water sample. The mixture was thoroughly mixed, incubated at room temperature for 5 minutes, and then placed on a magnetic stirrer. After clarification of the solution, 200 μl of the sample was added to a new well of the same MIDI plate. 20 µl of SPRI Ampure beads were added, the sample was thoroughly mixed and left at room temperature for 5 minutes. Then it was again placed on a magnetic stirrer.

[0168] После осветления раствора супернатант удаляли и утилизировали. Планшет оставляли на магнитной мешалке и добавляли 200 мкл 80% этанола, не затрагивая осадок. Впоследствии этанол удаляли. Этап этанолом промывания повторяли в общей сложности еще два раза. После завершения промывания весь избыток этанола удаляли пипеткой из установленного на мешалке планшета. Образец сушили при комнатной температуре в течение 5 минут. Добавляли 27 мкл воды и тщательно перемешивали. Образец оставляли при комнатной температуре на 2 минуты и возвращали на магнитную мешалку. 25 мкл образца переносили в чистый планшет и хранили при -20°С.[0168] After clarification of the solution, the supernatant was removed and disposed of. The tablet was left on a magnetic stirrer and 200 μl of 80% ethanol was added without affecting the precipitate. Subsequently, ethanol was removed. The ethanol wash step was repeated a total of two more times. After washing was completed, all excess ethanol was pipetted from the plate on the stirrer. The sample was dried at room temperature for 5 minutes. 27 μl of water was added and mixed thoroughly. The sample was left at room temperature for 2 minutes and returned to the magnetic stirrer. 25 μl of the sample was transferred to a clean plate and stored at -20°C.

Пример 7. Транспозоны А14-МЕ и В15-МЕExample 7. Transposons A14-ME and B15-ME

[0169] Каждый из транспозонов А14-МЕ и В15-МЕ аннелировали с ME', содержащей 3'биотин. 3'биотин сопрягали с ME' с образованием линкеров 3'-(I(а)) и 3'-(I(c)). Реакцию аннелирования проводили в объеме 25 мкл с применением буфера NaCl. Получали комплексы каждого из итоговых двухцепочечных транспозонов с транспозазой путем проведения реакций в течение ночи при 37°С. После образования комплексов транспосом указанные комплексы транспосом А14 и В15 смешивали в равных объемах и нагружали ими гранулы со стрептавидином в концентрации 300 нМ с получением связанных комплексов с плотностью, составлявшей 300 нМ. После присоединения к гранулам смеси (I(a)) и (I(c)) с плотностью 300 нМ дополнительно разбавляли до концентрации 120 нМ. Соответственно, в разбавленном растворе гранулы по-прежнему имели плотность 300 нМ, однако комплексы присутствовали в концентрации 120 нМ. На этапе разбавления плотность комплексов на гранулах не изменяется; таким образом, разбавление оказывает влияние на выход библиотеки, но не на размер инсерций.[0169] Each of the A14-ME and B15-ME transposons were annelated with an ME' containing 3'biotin. 3'biotin was conjugated with ME' to form linkers 3'-(I(a)) and 3'-(I(c)). The annulation reaction was carried out in a volume of 25 μl using NaCl buffer. Received complexes of each of the final double-stranded transposons with transposase by carrying out reactions during the night at 37°C. After the formation of transposome complexes, these transposome complexes A14 and B15 were mixed in equal volumes and loaded with streptavidin beads at a concentration of 300 nM to obtain bound complexes with a density of 300 nM. After joining the granules mixture (I(a)) and (I(c)) with a density of 300 nm was further diluted to a concentration of 120 nm. Accordingly, in the dilute solution, the beads still had a density of 300 nM, however, the complexes were present at a concentration of 120 nM. At the stage of dilution, the density of the complexes on the granules does not change; thus, dilution has an effect on the yield of the library, but not on the size of the inserts.

[0170] Полученные два типа соединенных с гранулами транспосом, 3'-(I(a)) и 3'-(I(c)), хранили при 25°С в течение 28 и 56 дней. При помощи уравнений Аррениуса установлено, что указанная продолжительность соответствует ускоренному хранению для 4 месяцев (28 дней) и 8 (56 дней) месяцев. По завершении ускоренного старения указанные два типа соединенных с гранулами транспосом использовали для проведения этапов тагментация и получения библиотек согласно обсуждению выше для оценки активности транспосом.[0170] The resulting two types of bead-bound transpos, 3'-(I(a)) and 3'-(I(c)), were stored at 25° C. for 28 and 56 days. Using the Arrhenius equations, it was found that the specified duration corresponds to accelerated storage for 4 months (28 days) and 8 (56 days) months. Upon completion of accelerated aging, these two types of bead-coupled transposomes were used to carry out the tagmentation steps and obtain libraries as discussed above to evaluate transposome activity.

[0171] Соединенные с гранулами комплексы транспосом добавляли к гДНК вместе с магниевым буфером и выдерживали при 55°С в течение 5 минут. После завершения в реакцию добавляли ДСН-буфер и смесь оставляли для инкубации при комнатной температуре на 5 минут. Затем смесь помещали на магнитную мешалку и троекратно промывали NaCl и Tris-буфером. После промывания к гранулам добавляли мастер-микс для ПЦР с носителями вторичного адаптера, содержащими индексные последовательности, и полностью ресуспендировали. Затем образец ПЦР-амплифицировали для получения дополнительных ампликонов. После проведения ПЦР выполняли SPRI-постобработку для удаления избытка носителей. Образцы проводили через BioAnalyzer для измерения активности (выхода, обеспечиваемого способом получения библиотеки). Как показано на фиг. 6А, сравнивали выход библиотек при твердофазной тагментации на основе гранул со стрептавидином с комплексами транспосом, содержащих 3'биотинилированный линкер формулы (I(a)) (3'-(I(а)); глицериновый линкер) и формулы (I(c)) (3'-(I(с)); гексиловый линкер). Линкер 3'-(I(с)) обеспечивал существенный выход библиотеки. Линкер 3'-(I(а)) обеспечивал более низкий выход, но, тем не менее, пригодный для секвенирования. Линия НПС на графике представляет собой произвольный нижний предел спецификации.[0171] Bead-bound transposome complexes were added to gDNA along with magnesium buffer and kept at 55°C for 5 minutes. After completion, SDS buffer was added to the reaction and the mixture was left to incubate at room temperature for 5 minutes. The mixture was then placed on a magnetic stirrer and washed three times with NaCl and Tris buffer. After washing, the PCR master mix with secondary adapter carriers containing index sequences was added to the beads and completely resuspended. The sample was then PCR amplified to obtain additional amplicons. After PCR, SPRI post-processing was performed to remove excess carriers. Samples were run through a BioAnalyzer to measure activity (yield provided by the library preparation method). As shown in FIG. 6A, compared the yield of solid-phase tagging libraries based on streptavidin beads with transposome complexes containing a 3' biotinylated linker of formula (I(a)) (3'-(I(a)); glycerol linker) and formula (I(c) ) (3'-(I(c)); hexyl linker). The 3'-(I(c)) linker provided significant library yield. The 3'-(I(a)) linker provided a lower yield, but still suitable for sequencing. The LNP line on the graph represents an arbitrary lower specification limit.

[0172] На фиг. 6В представлены данные исследования стабильности при ускоренном старении библиотеки образцов, полученной при твердофазной тагментации на основе гранул со стрептавидином с применением комплекса транспосомы, содержащего линкер 3'-(I(а)), после старения в течение 4 месяцев (в условиях ускоренного хранения при 25°С в течение 28 дней), по сравнению с библиотекой образцов, полученной из не подвергавшегося старению контроля с тем же линкером, хранившегося при 4°С в течение 28 дней. На фиг. 6С приведены данные исследования стабильности при ускоренном старении библиотеки образцов, полученной с применением комплекса транспосомы, содержащего линкер 3'-(I(с)), после старения в течение 4 месяцев и 8 месяцев (в условиях ускоренного хранения при 25°С в течение 28 дней и 56 дней), по сравнению с библиотеками образцов, полученных из не подвергавшихся старению контролей с тем же линкером, хранившихся при 4°С в течение 28 дней и 56 дней, соответственно.[0172] FIG. 6B shows data from an accelerated aging stability study of a library of samples obtained by solid-phase tagging based on streptavidin beads using a transposome complex containing a 3'-(I(a) linker) after aging for 4 months (under accelerated storage conditions at 25 °C for 28 days) compared to a library of samples obtained from an unaged control with the same linker stored at 4°C for 28 days. In FIG. 6C shows data on accelerated aging stability of a library of samples obtained using a transposome complex containing a 3'-(I(c) linker) after aging for 4 months and 8 months (accelerated storage at 25°C for 28 days and 56 days) compared to sample libraries derived from unaged controls with the same linker stored at 4°C for 28 days and 56 days, respectively.

Пример 8. Транспозоны А14-МЕ и В15-МЕExample 8. Transposons A14-ME and B15-ME

[0173] Каждый из транспозонов А14-МЕ и В15-МЕ аннелировали с ME', содержащей 3'-биотин. 3'-биотин сопрягали с ME' посредством линкера 3'-(I(с)). Реакцию аннелирования проводили в объеме 25 мкл с применением NaCl-буфера. Каждый из итоговых двухцепочечных транспозонов присоединяли к транспозазе путем проведения реакций в течение ночи при 37°С. После образования транспосом комплексы транспосом А14 и В15 смешивали в равных объемах и нагружали ими гранулы со стрептавидином с различной плотностью (от 10 нМ до 800 нМ).[0173] Each of the A14-ME and B15-ME transposons were annelated with an ME' containing 3'-biotin. 3'-biotin was coupled to ME' via a 3'-(I(c)) linker. The annulation reaction was carried out in a volume of 25 µl using a NaCl buffer. Each of the final double-stranded transposons was attached to the transposase by carrying out reactions overnight at 37°C. After transposome formation, the A14 and B15 transposome complexes were mixed in equal volumes and loaded with streptavidin granules with different densities (from 10 nM to 800 nM).

[0174] Соединенные с гранулами транспосомы с различной плотностью добавляли к гДНК вместе с магниевым буфером и выдерживали при 55°С в течение 5 минут. После завершения в реакцию добавляли ДСН-буфер и инкубировали при комнатной температуре в течение 5 минут. Затем смесь помещали на магнитную мешалку и троекратно промывали NaCl и Tris-буфером. После промываний к гранулам добавляли мастер-микс для ПЦР с носителями вторичного адаптера, содержащими индексные последовательности, и полностью ресуспендировали. Затем проводили реакцию ПЦР на образцах для амплификации фрагментов. После ПЦР проводили SPRI-отбор по размеру при различных соотношениях с SPRI, что приводило к получению инсерций разного размера. Образцы проводили через ВА и HiSeq 2500 Rapid Output для измерения активности.[0174] Bead-bound transposomes of various densities were added to gDNA along with magnesium buffer and kept at 55°C for 5 minutes. After completion, SDS buffer was added to the reaction and incubated at room temperature for 5 minutes. The mixture was then placed on a magnetic stirrer and washed three times with NaCl and Tris buffer. After washes, the PCR master mix with secondary adapter carriers containing index sequences was added to the beads and completely resuspended. Then, a PCR reaction was performed on the samples for amplification of the fragments. After PCR, SPRI size selection was performed at various ratios with SPRI, which resulted in insertions of different sizes. Samples were run through BA and HiSeq 2500 Rapid Output to measure activity.

[0175] На фиг. 7А представлен целевой размер инсерций молекул ДНК как функция от плотности гранул при твердофазном получении библиотек на основе гранул со стрептавидином, где гранулы содержат иммобилизованный комплекс транспосомы, связанный с ними через 3'-(I(с)). На фиг. 7В представлен целевой размер инсерций молекул ДНК как функция от условий SPRI при применении гранул со стрептавидином с иммобилизованным комплексом транспосомы, содержащим гиперактивную транспозазу Tn5 и линкер 3'-(I(с)), при плотности комплекса 100 нМ; и на фиг. 7С представлен целевой размер инсерций молекул ДНК как функция от условий SPRI при применении гранул со стрептавидином с иммобилизованным комплексом транспосомы, содержащим гиперактивную транспозазу Tn5 и линкер 3'-(I(с)), при плотности комплекса 600 нМ.[0175] FIG. 7A shows the target DNA insertion size as a function of bead density in the solid phase preparation of streptavidin bead libraries, where the beads contain an immobilized transposome complex linked to them via 3'-(I(c)). In FIG. 7B shows the target DNA insertion size as a function of SPRI conditions using streptavidin beads with an immobilized transposome complex containing an overactive Tn5 transposase and a 3'-(I(c) linker) at a complex density of 100 nM; and in FIG. 7C shows the target DNA insertion size as a function of SPRI conditions using streptavidin beads with an immobilized transposome complex containing an overactive Tn5 transposase and a 3'-(I(c) linker) at a complex density of 600 nM.

Пример 9. Интегрированный протокол экстракции для крови и слюныExample 9 Integrated Extraction Protocol for Blood and Saliva

[0176] Свежую цельную кровь обрабатывали с применением набора реагентов для лизиса Flex Lysis Reagent Kit (Illumina, кат.№20015884). Свежую цельную кровь собирали в пробирки для сбора образцов с ЭДТК и хранили при 4°С до обработки. Мастер-микс для лизиса получали путем смешивания следующих объемов для каждого образца: 7 мкл буфера для лизиса крови, 2 мкл протеиназы K и 31 мкл не содержащей нуклеаз воды. Для каждого образца в одну лунку 96-луночного планшета для ПЦР добавляли 10 мкл крови, 40 мкл мастер-микса для лизиса и 20 мкл гранул SPRI и перемешивали раствор 10-кратным пипетированием. Планшет запечатывали и инкубировали в течение 10 минут при 56°С в термоциклере с нагреваемой крышкой. Затем планшет помещали на магнит для планшетов на 5 минут, супернатант утилизировали и добавляли 150 мкл 80% этанола. После инкубации в течение 30 секунд на магните этанол утилизировали, и планшет снимали с магнита. Гранулы ресуспендировали в 30 мкл воды, после чего они были готовы для получения библиотеки.[0176] Fresh whole blood was processed using the Flex Lysis Reagent Kit (Illumina cat#20015884). Fresh whole blood was collected in EDTA sample collection tubes and stored at 4° C. until processed. A lysis master mix was prepared by mixing the following volumes for each sample: 7 µl of blood lysis buffer, 2 µl of proteinase K, and 31 µl of nuclease-free water. For each sample, 10 µl of blood, 40 µl of master lysis mix and 20 µl of SPRI beads were added to one well of a 96-well PCR plate, and the solution was mixed by pipetting 10 times. The plate was sealed and incubated for 10 minutes at 56°C in a thermal cycler with a heated lid. The plate was then placed on a plate magnet for 5 minutes, the supernatant was discarded, and 150 μl of 80% ethanol was added. After incubation for 30 seconds on the magnet, the ethanol was discarded and the plate removed from the magnet. The beads were resuspended in 30 µl of water, after which they were ready to receive the library.

[0177] Слюну собирали в пробирки для сбора слюны Oragene DNA (DNA Genotek, кат. №OGR-500, №OGD-510), которые инкубировали по меньшей мере 1 час при 50°С для лизиса клеток, после чего тщательно перемешивали на вортексе. Для каждого образца в одну лунку 96-луночного планшета для ПЦР добавляли 20 мкл воды и 30 мкл слюны и медленно перемешивали пипетированием. Затем в лунку с образцом добавляли 20 мкл гранул SPRI, и гранулы тщательно перемешивали 10-кратным пипетированием раствора. Планшет инкубировали в течение 5 минут при комнатной температуре, после чего помещали на магнит для планшетов на 5 минут. Удаляли супернатант и добавляли 150 мкл 80% этанола к осадку с гранулами. Затем планшет оставляли на магните на 30 секунд, после чего удаляли этанол и снимали планшет с магнита. Гранулы ресуспендировали в 30 мкл воды, после чего они были готовы для получения библиотеки.[0177] Saliva was collected in Oragene DNA saliva collection tubes (DNA Genotek, cat. No. OGR-500, No. OGD-510), which were incubated for at least 1 hour at 50 ° C to lyse the cells, after which they were thoroughly mixed by vortexing . For each sample, 20 µl of water and 30 µl of saliva were added to one well of a 96-well PCR plate and mixed slowly by pipetting. Then, 20 μl of SPRI beads were added to the sample well, and the beads were thoroughly mixed by pipetting the solution 10 times. The plate was incubated for 5 minutes at room temperature and then placed on a plate magnet for 5 minutes. The supernatant was removed and 150 μl of 80% ethanol was added to the pellet pellet. Then the plate was left on the magnet for 30 seconds, after which the ethanol was removed and the plate was removed from the magnet. The beads were resuspended in 30 µl of water, after which they were ready to receive the library.

[0178] Был описан ряд вариантов реализации. Тем не менее, следует понимать, что могут быть внесены различные модификации. Таким образом, в объем приведенной ниже формулы изобретения входят и другие варианты реализации.[0178] A number of implementation options have been described. However, it should be understood that various modifications may be made. Thus, other embodiments are within the scope of the following claims.

--->--->

ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙSEQUENCE LIST

<110> ILLUMNA, INC. / ИЛЛУМИНА, ИНК.<110> ILLUMNA, INC. / ILLUMINA, INC.

ILLUMINA CAMBRIDGE LIMITED / ИЛЛУМИНА КЕМБРИДЖ ЛИМИТЕДILLUMINA CAMBRIDGE LIMITED

DeSantis, Grace / ДеСантис, ГрейсDeSantis, Grace / DeSantis, Grace

Gross, Stephen M. / Гросс, Стивен М.Gross, Stephen M. / Gross, Stephen M.

Li, Jian-Sen / Ли, Чян-СенLi, Jian-Sen / Li, Chiang-Sen

Morrell, Natalie / Моррелл, НаталиMorrell, Natalie / Morrell, Natalie

Slatter, Andrew / Слэттер, ЭндрюSlatter, Andrew / Slatter, Andrew

Shen, Kevin / Шен, КевинShen, Kevin / Shen, Kevin

Snow, Samantha / Сноу, СамантаSnow, Samantha / Snow, Samantha

<120> ТАГМЕНТАЦИЯ С ПРИМЕНЕНИЕМ ИММОБИЛИЗОВАННЫХ ТРАНСПОСОМ С ЛИНКЕРАМИ<120> TAGMENTATION USING IMMOBILIZED TRANSPOSOMS WITH LINKERS

<130> ILLINC.398WO<130> ILLINC.398WO

<150> 62/461620<150> 62/461620

<151> 2017-02-21<151> 2017-02-21

<160> 14<160> 14

<170> FastSEQ для Windows, версия 4.0<170> FastSEQ for Windows version 4.0

<210> 1<210> 1

<211> 29<211> 29

<212> DNA / ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер P5<223> primer P5

<400> 1<400> 1

aatgatacgg cgaccaccga gauctacac 29aatgatacgg cgaccaccga gauctacac 29

<210> 2<210> 2

<211> 24<211> 24

<212> DNA / ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> праймер P7<223> primer P7

<400> 2<400> 2

caagcagaag acggcatacg agat 24caagcagaag acggcatacg agat 24

<210> 3<210> 3

<211> 33<211> 33

<212> DNA / ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> адапторная последовательность A14-ME<223> adapter sequence A14-ME

<400> 3<400> 3

tcgtcggcag cgtcagatgt gtataagaga cag 33tcgtcggcag cgtcagatgt gtataagaga cag 33

<210> 4<210> 4

<211> 34<211> 34

<212> DNA / ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> адапторная последовательность B15-ME<223> adapter sequence B15-ME

<400> 4<400> 4

gtctcgtggg ctcggagatg tgtataagag acag 34gtctcgtggg ctcggagatg tgtataagag acag 34

<210> 5<210> 5

<211> 19<211> 19

<212> DNA / ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> адапторная последовательность ME'<223> adapter sequence ME'

<400> 5<400> 5

ctgtctctta tacacatct 19ctgtctctta tacacatct 19

<210> 6<210> 6

<211> 14<211> 14

<212> DNA / ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> A14 адапторная последовательность<223> A14 adapter sequence

<400> 6<400> 6

tcgtcggcag cgtc 14tcgtcggcag cgtc 14

<210> 7<210> 7

<211> 15<211> 15

<212> DNA / ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> адапторная последовательность B15<223> adapter sequence B15

<400> 7<400> 7

gtctcgtggg ctcgg 15gtctcgtggg ctcgg 15

<210> 8<210> 8

<211> 19<211> 19

<212> DNA / ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> адапторная последовательность ME<223> ME adapter sequence

<400> 8<400> 8

agatgtgtat aagagacag 19agatgtgtat aagagacag 19

<210> 9<210> 9

<211> 50<211> 50

<212> DNA / ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Модифицированная A14-ME №1<223> Modified A14-ME #1

<400> 9<400> 9

tttttttttt uuuacactcg tcggcagcgt cagatgtgta taagagacag 50tttttttttt uuuacactcg tcggcagcgt cagatgtgta taagagacag 50

<210> 10<210> 10

<211> 38<211> 38

<212> DNA / ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Модифицированная A14-ME №2<223> Modified A14-ME #2

<400> 10<400> 10

ttuuutcgtc ggcagcgtca gatgtgtata agagacag 38ttuuutcgtc ggcagcgtca gatgtgtata agagacag 38

<210> 11<210> 11

<211> 38<211> 38

<212> DNA / ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Модифицированная A14-ME №3<223> Modified A14-ME #3

<400> 11<400> 11

ttttutcgtc ggcagcgtca gatgtgtata agagacag 38ttttutcgtc ggcagcgtca gatgtgtata agagacag 38

<210> 12<210> 12

<211> 47<211> 47

<212> DNA / ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Модифицированная B15-ME №1<223> Modified B15-ME #1

<400> 12<400> 12

tttttttttt uuugtctcgt gggctcggag atgtgtataa gagacag 47tttttttttt uuugtctcgt gggctcggag atgtgtataa gagacag 47

<210> 13<210> 13

<211> 39<211> 39

<212> DNA / ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Модифицированная B15-ME №2<223> Modified B15-ME #2

<400> 13<400> 13

ttuuugtctc gtgggctcgg agatgtgtat aagagacag 39ttuuugtctc gtgggctcgg agatgtgtat aagagacag 39

<210> 14<210> 14

<211> 39<211> 39

<212> DNA / ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Модифицированная B15-ME №3<223> Modified B15-ME #3

<400> 14<400> 14

ttttugtctc gtgggctcgg agatgtgtat aagagacag 39ttttugtctc gtgggctcgg agatgtgtat aagagacag 39

<---<---

Claims (46)

1. Комплекс транспосомы для тагментации, содержащий:1. A transposome complex for tagging, containing: (i) транспозазу, (i) transposase, (ii) первый транспозон ДНК, содержащий:(ii) a first DNA transposon containing: (a) 3’-часть, содержащую концевую последовательность первого транспозона; и (a) 3'-part containing the terminal sequence of the first transposon; and (b) первую адапторную последовательность на 5’-конце концевой последовательности первого транспозона;(b) a first adapter sequence at the 5' end of the terminal sequence of the first transposon; (iii) второй транспозон ДНК, содержащий концевую последовательность второго транспозона, комплементарную по меньшей мере части концевой последовательности первого транспозона; и (iii) a second DNA transposon comprising a terminal sequence of the second transposon that is complementary to at least a portion of the terminal sequence of the first transposon; and (iv) расщепляемый линкер, имеющий первый конец, присоединенный к 3’-концу второго транспозона ДНК, и второй конец, присоединенный к аффинному элементу.(iv) a cleavable linker having a first end attached to the 3' end of the second DNA transposon and a second end attached to an affinity element. 2. Комплекс по п. 1, отличающийся тем, что указанная транспозаза представляет собой транспозазу Tn5.2. A complex according to claim 1, characterized in that said transposase is a Tn5 transposase. 3. Комплекс по п. 2, отличающийся тем, что указанная транспозаза Tn5 представляет собой транспозазу Tn5 дикого типа или гиперактивную транспозазу Tn5, или ее мутант, при этом указанная транспозаза необязательно конъюгирована с меткой очистки.3. A complex according to claim 2, characterized in that said Tn5 transposase is a wild-type Tn5 transposase or a hyperactive Tn5 transposase, or a mutant thereof, wherein said transposase is optionally conjugated to a purification label. 4. Комплекс по п. 2 или п. 3, отличающийся тем, что концевая последовательность первого транспозона и концевая последовательность второго транспозона представлены ME и ME’, где ME представляет собой AGATGTGTATAAGAGACAG (SEQ ID NO: 8), и где ME' представляет собой 5'-фос-CTGTCTCTTATACACATCT-3' (SEQ ID NO: 5). 4. The complex according to claim 2 or claim 3, characterized in that the terminal sequence of the first transposon and the terminal sequence of the second transposon are represented by ME and ME', where ME is AGATGTGTATAAGAGACAG (SEQ ID NO: 8), and where ME' is 5'-phos-CTGTCTCTTATACACATCT-3' (SEQ ID NO: 5). 5. Комплекс по любому из пп. 1-4, отличающийся тем, что первая адапторная последовательность содержит последовательность праймера. 5. The complex according to any one of paragraphs. 1-4, characterized in that the first adapter sequence contains a primer sequence. 6. Комплекс по п. 5, отличающийся тем, что указанная первая адапторная последовательность содержит A14 (SEQ ID NO: 6) или B15 (SEQ ID NO: 7).6. The complex according to claim 5, characterized in that said first adapter sequence contains A14 (SEQ ID NO: 6) or B15 (SEQ ID NO: 7). 7. Комплекс по любому из пп. 1-6, отличающийся тем, что указанный аффинный элемент связан с партнером для аффинного связывания на твердой подложке, за счет чего указанный комплекс связан с указанной твердой подложкой.7. The complex according to any one of paragraphs. 1-6, characterized in that said affinity element is associated with an affinity binding partner on a solid support, whereby said complex is associated with said solid support. 8. Комплекс по п. 7, отличающийся тем, что указанный аффинный элемент представляет собой биотин, а партнер для аффинного связывания представляет собой стрептавидин.8. A complex according to claim 7, characterized in that said affinity element is biotin and the affinity binding partner is streptavidin. 9. Комплекс по п. 7 или 8, отличающийся тем, что указанная твердая подложка представляет собой пробирку, лунку планшета, предметное стекло, гранулу или проточную ячейку, при этом необязательно указанная гранула представляет собой парамагнитную гранулу.9. A complex according to claim 7 or 8, characterized in that said solid support is a test tube, plate well, glass slide, bead or flow cell, optionally said bead is a paramagnetic bead. 10. Комплекс по любому из предшествующих пунктов, отличающийся тем, что указанная адапторная последовательность содержит одну или более последовательностей, выбранных из группы, состоящей из универсальных последовательностей, последовательностей праймеров или связанных с секвенированием последовательностей.10. A complex according to any one of the preceding claims, wherein said adapter sequence comprises one or more sequences selected from the group consisting of universal sequences, primer sequences, or sequencing-related sequences. 11. Композиция для тагментации, содержащая эффективное количество первого комплекса, причем указанный первый комплекс представляет собой комплекс по п. 5, где указанная первая адапторная последовательность первого комплекса содержит первую последовательность праймера, и эффективное количество второго комплекса, причем указанный второй комплекс представляет собой комплекс по п. 5, где указанная первая адапторная последовательность второго комплекса содержит вторую последовательность праймера.11. A tagmentation composition comprising an effective amount of a first complex, wherein said first complex is a complex according to claim 5, where said first adapter sequence of the first complex contains a first primer sequence, and an effective amount of a second complex, wherein said second complex is a complex according to claim 5. claim 5, wherein said first adapter sequence of the second complex contains a second primer sequence. 12. Композиция по п. 11, отличающаяся тем, что первая последовательность праймера содержит A14 (SEQ ID NO: 6), а вторая последовательность праймера содержит B15 (SEQ ID NO: 7).12. Composition according to claim 11, characterized in that the first primer sequence contains A14 (SEQ ID NO: 6) and the second primer sequence contains B15 (SEQ ID NO: 7). 13. Композиция по любому из пп. 11, 12, отличающаяся тем, что указанный аффинный элемент связан с партнером для аффинного связывания на твердой подложке, за счет чего указанный комплекс связан с указанной твердой подложкой.13. The composition according to any one of paragraphs. 11, 12, characterized in that said affinity element is associated with an affinity binding partner on a solid support, whereby said complex is associated with said solid support. 14. Композиция по п. 13, отличающаяся тем, что указанный аффинный элемент представляет собой биотин, а партнер для аффинного связывания представляет собой стрептавидин.14. Composition according to claim 13, characterized in that said affinity element is biotin and the affinity binding partner is streptavidin. 15. Композиция по п. 13 или 14, отличающаяся тем, что указанная твердая подложка представляет собой гранулу или парамагнитную гранулу.15. Composition according to claim 13 or 14, characterized in that said solid support is a granule or a paramagnetic granule. 16. Модифицированный олигонуклеотид для тагментации, содержащий первый транспозон ДНК и второй транспозон ДНК, причем указанный первый транспозон ДНК содержит (a) 3’-часть, содержащую концевую последовательность первого транспозона, и (b) первую адапторную последовательность на 5’-конце концевой последовательности первого транспозона, и второй транспозон ДНК, содержащий концевую последовательность второго транспозона, комплементарную по меньшей мере части концевой последовательности первого транспозона и аннелированную с ней, и при этом первый конец линкера присоединен к 3’-концу указанного второго транспозона, а второй конец указанного линкера присоединен к аффинному элементу. 16. Modified oligonucleotide for tagging, containing the first DNA transposon and the second DNA transposon, and the specified first DNA transposon contains (a) a 3'-part containing the terminal sequence of the first transposon, and (b) the first adapter sequence at the 5'-end of the terminal sequence of the first transposon, and the second DNA transposon containing the terminal sequence of the second transposon, complementary to at least part of the terminal sequence of the first transposon and annelated with it, and the first end of the linker is attached to the 3'-end of the specified second transposon, and the second end of the specified linker is attached to an affine element. 17. Способ получения библиотеки меченых фрагментов нуклеиновых кислот из двухцепочечной целевой нуклеиновой кислоты, включающий инкубацию указанной целевой нуклеиновой кислоты со связанным комплексом по любому из пп. 7-10 или композицией по любому из пп. 11-15 в условиях, достаточных для фрагментации указанной целевой нуклеиновой кислоты на множество целевых фрагментов, и для присоединения 3’-конца первого ДНК транспозона к 5’-концам целевых фрагментов с получением множества 5’-меченых целевых фрагментов. 17. A method for obtaining a library of labeled nucleic acid fragments from a double-stranded target nucleic acid, comprising incubating said target nucleic acid with an associated complex according to any one of paragraphs. 7-10 or a composition according to any one of paragraphs. 11-15 under conditions sufficient to fragment said target nucleic acid into a plurality of target fragments and to attach the 3' end of the first transposon DNA to the 5' ends of the target fragments to produce a plurality of 5' labeled target fragments. 18. Способ по п. 17, дополнительно включающий амплификацию одного или более из 5’-меченых целевых фрагментов. 18. The method of claim 17 further comprising amplifying one or more of the 5' labeled target fragments. 19. Способ по п. 18, отличающийся тем, что указанная амплификация включает получение и/или амплификацию полностью дуплексных 5’-меченых целевых фрагментов.19. The method according to claim 18, characterized in that said amplification includes the production and/or amplification of fully duplex 5'-labeled target fragments. 20. Способ по п. 18 или 19, отличающийся тем, что указанная амплификация включает инкубацию по меньшей мере одного полностью дуплексного 5’-меченого целевого фрагмента, содержащего последовательность праймера на каждом конце с носителем вторичного адаптора, одиночными нуклеотидами и полимеразой, в условиях, достаточных для амплификации указанных целевых фрагментов и встраивания указанного носителя вторичного адаптора, который содержит последовательность, комплементарную последовательности праймера, и вторичную адапторную последовательность, с получением таким образом библиотеки фрагментов для секвенирования.20. The method according to claim 18 or 19, characterized in that said amplification comprises incubating at least one fully duplex 5'-labeled target fragment containing a primer sequence at each end with a secondary adapter carrier, single nucleotides and a polymerase, under conditions sufficient to amplify said target fragments and insert said secondary adapter carrier that contains a sequence complementary to the primer sequence and a secondary adapter sequence, thereby obtaining a library of fragments for sequencing. 21. Способ по п. 20, отличающийся тем, что указанный носитель вторичного адаптора содержит последовательность праймера, индексную последовательность, штрихкодирующую последовательность, метку очистки или их комбинацию. 21. The method of claim 20, wherein said secondary adapter carrier comprises a primer sequence, an index sequence, a barcode sequence, a cleanup tag, or a combination thereof. 22. Способ по п. 21, отличающийся тем, что указанный носитель вторичного адаптора содержит индексную последовательность и последовательность праймера. 22. The method of claim 21, wherein said secondary adapter carrier comprises an index sequence and a primer sequence. 23. Способ по любому из пп. 19-22, отличающийся тем, что указанные полностью дуплексные 5’-меченые целевые фрагменты содержат разные последовательности праймера на каждом конце, при этом необязательно указанные разные последовательности праймеров представляют собой A14 (SEQ ID NO: 6) и B15 (SEQ ID NO: 7). 23. The method according to any one of paragraphs. 19-22, characterized in that these fully duplex 5'-tagged target fragments contain a different primer sequence at each end, optionally said different primer sequences are A14 (SEQ ID NO: 6) and B15 (SEQ ID NO: 7 ). 24. Способ по любому из пп. 21-23, отличающийся тем, что каждый из указанных носителей вторичного адаптора содержит одну из двух последовательностей праймеров, при этом необязательно указанные две последовательности праймеров представляют собой последовательность праймера P5 (SEQ ID NO: 1) и последовательность праймера P7 (SEQ ID NO: 2), и одну или более индексных последовательностей. 24. The method according to any one of paragraphs. 21-23, characterized in that each of said secondary adapter carriers contains one of two primer sequences, optionally said two primer sequences being a P5 primer sequence (SEQ ID NO: 1) and a P7 primer sequence (SEQ ID NO: 2 ), and one or more index sequences. 25. Способ по любому из пп. 17-24, отличающийся тем, что указанные фрагменты гибридизуют с комплементарными праймерами, привитыми на проточную ячейку или твердую подложку. 25. The method according to any one of paragraphs. 17-24, characterized in that these fragments are hybridized with complementary primers grafted onto a flow cell or solid support. 26. Способ по любому из пп. 17-25, дополнительно включающий секвенирование одного или более из 5’-меченых целевых фрагментов или продуктов их амплификации.26. The method according to any one of paragraphs. 17-25, further comprising sequencing one or more of the 5'-labeled target fragments or their amplification products. 27. Способ получения связанного с твердой подложкой комплекса транспосомы, включающий обработку транспозазы модифицированным олигонуклеотидом по п. 16, в условиях, достаточных для связывания указанной транспозазы и модифицированного олигонуклеотида в комплекс транспосомы.27. A method for preparing a transposome complex bound to a solid support, comprising treating the transposase with the modified oligonucleotide according to claim 16 under conditions sufficient to bind said transposase and the modified oligonucleotide into the transposome complex. 28. Способ по п. 27, дополнительно включающий инкубацию указанного комплекса транспосомы с твердой подложкой, содержащей партнер для аффинного связывания, в условиях, достаточных для того, чтобы указанный аффинный элемент связался с указанным партнером для аффинного связывания. 28. The method of claim 27, further comprising incubating said transposome complex with a solid support containing an affinity binding partner under conditions sufficient to cause said affinity element to bind to said affinity binding partner. 29. Способ получения образца для секвенирования, включающий:29. A method for obtaining a sample for sequencing, including: получение комплекса по любому из пп. 1-10;obtaining a complex according to any one of paragraphs. 1-10; нанесение нуклеиновой кислоты на указанный комплекс в условиях, подходящих для тагментации, с иммобилизацией таким образом фрагментов целевой нуклеиновой кислоты на твердой подложке;applying a nucleic acid to said complex under conditions suitable for tagging, thereby immobilizing target nucleic acid fragments on a solid support; амплификацию иммобилизованных тагментированных нуклеиновых кислот; amplification of immobilized tagged nucleic acids; расщепление расщепляемого фрагмента; иcleavage of the cleavable fragment; and обогащение целевыми амплифицированными нуклеиновыми кислотами, с получением таким образом образца для секвенирования.enrichment with target amplified nucleic acids, thereby obtaining a sample for sequencing. 30. Способ по п. 29, отличающийся тем, что указанный расщепляемый линкер содержит фоторасщепляемый или расщепляемый ферментативным путем нуклеотид, при этом необязательно указанный расщепляемый нуклеотид представляет собой урацил, уридин, 8-оксо-гуанин, ксантин, гипоксантин, 5,6-дигидроурацил, 5-метилцитозин, тиминовый димер, 7-метилгуанозин, 8-оксо-дезоксигуанозин, ксантозин, инозин, дигидроуридин, бромдезоксиуридин, уридин или 5-метилцитидин, при этом необязательно указанный расщепляемый нуклеотид представляет собой урацил.30. The method according to claim 29, characterized in that said cleavable linker contains a photo-cleavable or enzymatically cleavable nucleotide, optionally said cleavable nucleotide is uracil, uridine, 8-oxo-guanine, xanthine, hypoxanthine, 5,6-dihydrouracil , 5-methylcytosine, thymine dimer, 7-methylguanosine, 8-oxo-deoxyguanosine, xanthosine, inosine, dihydrouridine, bromodeoxyuridine, uridine or 5-methylcytidine, optionally said cleavable nucleotide is uracil. 31. Способ по п. 30, отличающийся тем, что расщепление осуществляют ферментом, представляющим собой (a) гликозилазу, необязательно выбранную из группы, состоящей из урацил-ДНК-гликозилазы, MUG, SMUG, TDG или MBD4, при этом необязательно указанная гликозилаза представляет собой урацил-ДНК-гликозилазу, или (b) представляющим собой апуриновую/aпиримидиновую (АП) эндонуклеазу, при этом необязательно указанная АП-эндонуклеаза выбрана из группы, состоящей из Endo VIII, Endo IV или Endo V, при этом необязательно указанная АП-эндонуклеаза представляет собой Endo VIII.31. The method according to p. 30, characterized in that the cleavage is carried out with an enzyme representing (a) a glycosylase, optionally selected from the group consisting of uracil-DNA glycosylase, MUG, SMUG, TDG or MBD4, while optionally said glycosylase is is a uracil-DNA glycosylase, or (b) is an apurine/apyrimidine (AP) endonuclease, optionally said AP endonuclease is selected from the group consisting of Endo VIII, Endo IV or Endo V, optionally said AP endonuclease is Endo VIII. 32. Способ по любому из пп. 29-31, отличающийся тем, что указанная твердая подложка содержит гранулы, необязательно парамагнитные гранулы.32. The method according to any one of paragraphs. 29-31, characterized in that said solid support contains granules, optionally paramagnetic granules. 33. Способ по любому из пп. 29-32, отличающийся тем, что указанная нуклеиновая кислота представляет собой (a) ДНК, при этом необязательно указанная ДНК является двухцепочечной, необязательно при этом указанная двухцепочечная ДНК представляет собой геномную ДНК, необязательно при этом указанную геномную ДНК выбирают из группы, включающей нуклеиновые кислоты одиночной клетки, ткани, опухоли, крови, плазмы, мочи или внеклеточные нуклеиновые кислоты, (b) РНК или ее производное, или (с) кДНК.33. The method according to any one of paragraphs. 29-32, characterized in that said nucleic acid is (a) DNA, optionally said DNA is double-stranded, optionally said double-stranded DNA is genomic DNA, optionally said genomic DNA is selected from the group consisting of nucleic acids single cell, tissue, tumor, blood, plasma, urine, or extracellular nucleic acids, (b) RNA or a derivative thereof, or (c) cDNA. 34. Способ по любому из пп. 29-33, отличающийся тем, что указанный этап амплификации включает одно или более из ПЦР или изотермической амплификации, или указанный этап амплификации представлен ПЦР.34. The method according to any one of paragraphs. 29-33, characterized in that said amplification step comprises one or more of PCR or isothermal amplification, or said amplification step is represented by PCR. 35. Способ по любому из пп. 29-34, отличающийся тем, что последовательность транспозона дополнительно содержит одну или более адапторных последовательностей, выбранных из группы, содержащей универсальные последовательности, последовательности праймеров или связанные с секвенированием последовательности.35. The method according to any one of paragraphs. 29-34, characterized in that the transposon sequence additionally contains one or more adapter sequences selected from the group containing universal sequences, primer sequences, or sequences associated with sequencing.
RU2018140894A 2017-02-21 2018-02-20 Tagmentation using immobilized transposomes with linkers RU2783536C2 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762461620P 2017-02-21 2017-02-21
US62/461,620 2017-02-21
PCT/US2018/018824 WO2018156519A1 (en) 2017-02-21 2018-02-20 Tagmentation using immobilized transposomes with linkers

Related Child Applications (1)

Application Number Title Priority Date Filing Date
RU2022128744A Division RU2022128744A (en) 2017-02-21 2018-02-20 TAGMENTATION USING IMMOBILIZED TRANSPOSOME WITH LINKERS

Publications (3)

Publication Number Publication Date
RU2018140894A RU2018140894A (en) 2020-05-20
RU2018140894A3 RU2018140894A3 (en) 2021-11-16
RU2783536C2 true RU2783536C2 (en) 2022-11-14

Family

ID=

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2149187C1 (en) * 1994-11-09 2000-05-20 Ниппон Пейпер Индастриз Ко., Лтд. Vector for insertion of required gene in plant (variants), method of transgenic plant producing and method of insertion of at least two required genes in plant
WO2012061832A1 (en) * 2010-11-05 2012-05-10 Illumina, Inc. Linking sequence reads using paired code tags
EP2712931A1 (en) * 2012-10-01 2014-04-02 Agilent Technologies, Inc. Immobilized transposase complexes for DNA fragmentation and tagging
WO2016003814A1 (en) * 2014-06-30 2016-01-07 Illumina, Inc. Methods and compositions using one-sided transposition
WO2016037394A1 (en) * 2014-09-12 2016-03-17 深圳华大基因科技有限公司 Method for constructing nucleic acid single-stranded cyclic library and reagents thereof
WO2016061517A2 (en) * 2014-10-17 2016-04-21 Illumina Cambridge Limited Contiguity preserving transposition
EP2527438B1 (en) * 2011-05-23 2016-10-19 Agilent Technologies, Inc. Methods and compositions for DNA fragmentation and tagging by transposases
WO2016189331A1 (en) * 2015-05-28 2016-12-01 Illumina Cambridge Limited Surface-based tagmentation

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2149187C1 (en) * 1994-11-09 2000-05-20 Ниппон Пейпер Индастриз Ко., Лтд. Vector for insertion of required gene in plant (variants), method of transgenic plant producing and method of insertion of at least two required genes in plant
WO2012061832A1 (en) * 2010-11-05 2012-05-10 Illumina, Inc. Linking sequence reads using paired code tags
EP2527438B1 (en) * 2011-05-23 2016-10-19 Agilent Technologies, Inc. Methods and compositions for DNA fragmentation and tagging by transposases
EP2712931A1 (en) * 2012-10-01 2014-04-02 Agilent Technologies, Inc. Immobilized transposase complexes for DNA fragmentation and tagging
WO2016003814A1 (en) * 2014-06-30 2016-01-07 Illumina, Inc. Methods and compositions using one-sided transposition
WO2016037394A1 (en) * 2014-09-12 2016-03-17 深圳华大基因科技有限公司 Method for constructing nucleic acid single-stranded cyclic library and reagents thereof
WO2016061517A2 (en) * 2014-10-17 2016-04-21 Illumina Cambridge Limited Contiguity preserving transposition
WO2016189331A1 (en) * 2015-05-28 2016-12-01 Illumina Cambridge Limited Surface-based tagmentation

Similar Documents

Publication Publication Date Title
US11708573B2 (en) Tagmentation using immobilized transposomes with linkers
US8551709B2 (en) Methods for fragmentation and labeling of nucleic acids
US11306348B2 (en) Complex surface-bound transposome complexes
JP2024511766A (en) Improved library preparation method
JP2017537657A (en) Target sequence enrichment
JP2023533418A (en) Methods for Increasing Yields of Sequencing Libraries
RU2783536C2 (en) Tagmentation using immobilized transposomes with linkers
RU2790295C2 (en) Complex systems of transposome bound on surface
TWI837127B (en) Single tube bead-based dna co-barcoding for accurate and cost-effective sequencing, haplotyping, and assembly
CN117062910A (en) Improved library preparation method