JP6924779B2 - トランスポザーゼランダムプライミング法によるdna試料の調製 - Google Patents

トランスポザーゼランダムプライミング法によるdna試料の調製 Download PDF

Info

Publication number
JP6924779B2
JP6924779B2 JP2018561978A JP2018561978A JP6924779B2 JP 6924779 B2 JP6924779 B2 JP 6924779B2 JP 2018561978 A JP2018561978 A JP 2018561978A JP 2018561978 A JP2018561978 A JP 2018561978A JP 6924779 B2 JP6924779 B2 JP 6924779B2
Authority
JP
Japan
Prior art keywords
primer
sequence
adapter
sample
tail
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018561978A
Other languages
English (en)
Other versions
JP2019517250A (ja
Inventor
アレジ,バフラム
ボーンズ,マイケル
ホグリフ,ホリー
ハンセン,コニー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Agilent Technologies Inc
Original Assignee
Agilent Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agilent Technologies Inc filed Critical Agilent Technologies Inc
Publication of JP2019517250A publication Critical patent/JP2019517250A/ja
Application granted granted Critical
Publication of JP6924779B2 publication Critical patent/JP6924779B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1082Preparation or screening gene libraries by chromosomal integration of polynucleotide sequences, HR-, site-specific-recombination, transposons, viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Plant Pathology (AREA)
  • Virology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Description

次世代シーケンシング(NGS)技術によって全ゲノムシーケンシング(WGS)は普通のことになり、様々な標的富化法によって研究者は、最も重要な目的の領域に関するシーケンシング力に焦点を当てることが可能となっている。しかしながら、ホルマリン固定されパラフィン包埋された(FFPE)固形腫瘍試料、無細胞または循環腫瘍DNA(cfDNA/ctDNA)、または損傷DNAサンプルなどの難しい標的DNAにNGSを適用する、より良い方法が依然必要とされている。このような標的のシーケンシングに関する問題には、DNA量が非常に少ない可能性、DNAが非常に短いか(例えば、断片状DNA)または化学修飾される可能性、および対立遺伝子頻度が非常に低い可能性が含まれる。これらの問題は多くのDNA鋳型の捕捉を必要とする。
特に、トランスポザーゼベースのタグ化方法を使用して、ゲノムDNAの小断片をシーケンシングすることは難題である。多くのこれらの方法は、各末端に適切なシーケンシングプライマー結合部位を有する断片を生成するのに2つの隣接トランスポザーゼの挿入を必要とし、このような小断片は隣接トランスポザーゼを収容するほど充分な長さではないことが多いからである。とりわけ本開示は、下流分析、例えば次世代シーケンシング用の、このようなDNA試料のタグ化と増幅を改善するための組成物および方法を提供する。
本開示の幾つかの態様は、(a)アダプタータグ化断片を生成するために、二本鎖DNA断片を含む試料と、それぞれアダプターが装着された複数のトランスポザーゼデュプレックスとを接触させるステップと、ここで、アダプターが、トランスポザーゼ認識配列を含むデュプレックス領域と第1のプライマー配列を含む5’オーバーハング領域とを含み、(b)ランダムプライマー伸長産物を生成するために、ランダムプライマーを使用してアダプタータグ化断片にプライマー伸長反応を実施するステップと、ここで、ランダムプライマーが、第2のプライマー配列を含むランダム3’ヌクレオチド配列と5’ヌクレオチド配列とを含み、(c)PCR増幅産物を生成するために、その3’末端に第1のプライマー配列を含むフォワードプライマーおよびその3’末端に第2のプライマー配列を含むリバースプライマーを使用して、ポリメラーゼ連鎖反応(PCR)により(b)のランダムプライマー伸長産物を増幅するステップと含む、試料中のDNA断片をタグ化するための方法を含む。生成するPCR増幅産物は、アダプター由来配列とランダムプライマー由来配列との間の、試料中のDNA断片由来の核酸配列を含み得る。1つまたは複数のバーコード、1つまたは複数の縮重塩基領域、1つまたは複数の制限部位、1つまたは複数の他のプライマー配列、1つまたは複数の検出可能標識、1つまたは複数の捕捉タグなどに限られないが、これらを含めた、他の機能性配列および/または部分がアダプターおよび/またはランダムプライマー中に存在し得ることに留意されたい。ある実施形態では、試料中のDNA断片は1kb未満の平均長を有する。
循環腫瘍DNAまたはFFPE切片から回収したDNAを分析するため方法を施用するときなど、特定施用に関して、試料中のDNAの量は限られている、かつ/または比較的少ない。多くのトランスポザーゼベースのライブラリー調製法は標的断片あたり2つの挿入部位を必要とするが、一方で本発明の方法は、標的DNAあたり1つの挿入部位のみを必要とする。したがって、本発明の方法を使用して、高い効率で標的断片を捕捉することができる。
代替的な実施形態では、ランダムプライマー伸長反応を、(i)テールアダプタータグ化断片を生成するために、ターミナルトランスフェラーゼを使用してアダプタータグ化断片の上部鎖にオリゴ−dNテールを加えるステップと(5’オーバーハング領域を有するアダプター配列をトランスポザーゼが連結させる鎖として上部鎖を定義する)、(ii)テールプライマー伸長産物を生成するために、テールプライマーを使用してテールアダプタータグ化断片にプライマー伸長反応を実施するステップと、ここで、テールプライマーが、オリゴ−dNテールとハイブリダイズする3’配列と第2のプライマー配列を含む5’配列とを含む、に置き換えることができることに留意されたい。あるいは、1つまたは複数の遺伝子特異的プライマーをプライマー伸長反応において使用して、第1および第2のプライマー配列を有する遺伝子特異的伸長産物を生成することができる。このような実施形態を使用して遺伝子特異的ライブラリーを生成することができ、またはこれらを標的遺伝子の富化に使用することができる。
本明細書に記載する方法を実施するためのキットも提供する。
本明細書に記載する方法は、DNA断片あたり2つのトランスポザーゼアダプターを加えることを必要とする、現在のタグ化プロトコールに優る明らかな利点を提供する。具体的には、DNA断片あたり1つのトランスポザーゼアダプターのみを加えるので、本開示の方法によってユーザーは、タグ化部位の片側上のゲノムDNA配列、従来のトランスポザーゼライブラリー調製法において失われる配列を回収することができる。さらに、(例えば、図3、オプション(ii)において示したように)直鎖増幅ステップの包含によって限定的な試料投入に関する問題を克服することができる。
当業者は、以下に記載する図面は単なる例示目的であることを理解する。これらの図面は、決して本教示の範囲の限定を意図するものではない。
本開示の態様によるアダプターの構造特徴を概略的に例示する図である。図1の上部に示すアダプターは、トランスポザーゼ認識配列と、5’オーバーハング領域を含む二本鎖領域(R1と表記する)とを含む。図1の下部に示すアダプターは上部のアダプターと構造が類似しており、R1中に含まれ得る2つの特異的配列(プライマー配列とバーコード)を示す。 2つの同一アダプターと複合体形成した(またはそれらが装着された)トランスポザーゼ二量体を概略的に例示する図である。 本開示の特定態様に従い、DNA断片をタグ化し増幅する方法を概略的に例示する図である。この実施形態は、プライマー伸長反応用のランダムプライマーを利用して、トランスポザーゼアダプタータグ化断片から伸長産物を生成する。 トランスポザーゼアダプタータグ化断片へのオリゴ−dAタグの付加、次いで3’ポリ−dT配列を有するテールプライマーを使用したプライマー伸長反応の実施形態を概略的に例示する図である。これは図3中に示すランダムプライマーステップの代替となり得る。 FFPE試料由来の肺腫瘍DNA断片の配列分析の結果を示す表である(実施例1参照)。 FFPE試料由来の***腫瘍および胃腫瘍DNA断片の配列分析の結果を示す表である(実施例2参照)。
[定義]
例示的な実施形態をさらに詳細に記載する前に、以下の定義を言及して、本記載中で使用する用語の意味および範囲を例示し定義する。
数値の範囲はその範囲を定義する数字を含む。他に示さない限り、それぞれ、核酸は左から右、5’から3’方向に記載し、アミノ酸配列は左から右、アミノ方向からカルボキシ方向に記載する。
他に示さない限り、本発明を実施して、当技術分野の技術範囲内にある従来の有機化学、ポリマー技術、(組換え技術を含めた)分子生物学、細胞生物学、生化学、および免疫学の技法および記載を利用することができる。このような従来の技法には、ポリマーアレイ合成、ハイブリダイゼーション、ライゲーション、および標識を使用したハイブリダイゼーションの検出がある。適切な技法の具体的な例示は、本明細書の以下の実施例を参照することによって得られる。しかしながら、他の同等な従来手順も当然ながら使用することができる。このような従来の技法および記載は、Genome Analysis:A Laboratory Manual Series(Vols.I−IV)、Using Antibodies:A Laboratory Manual、Cells:A Laboratory Manual、PCR Primer:A Laboratory Manual、and Molecular Cloning:A Laboratory Manual(いずれもCold Spring Harbor Laboratory Pressから)、Stryer、L.(1995)Biochemistry(4th Ed.)Freeman、New York、Gait、「Oligonucleotide Synthesis:A Practical Approach」1984、IRL Press、London、Nelson and Cox(2000)、Lehninger、A.、Principles of Biochemistry 3rd Ed.、W.H.Freeman Pub.、New York、N.Y.and Berg et al.(2002)Biochemistry 5th Ed.、W.H.Freeman Pub.、New York、N.Yなどの標準的な研究室マニュアルにおいて見ることができ、これらはいずれもその全体があらゆる目的で参照により本明細書の一部をなすものとする。
本明細書および添付の特許請求の範囲中で使用するように、文脈が明らかに他のことを示さない限り、単数形「a」、「an」、および「the」は複数の指示対象を含むことに留意しなければならない。例えば、用語「プライマー」は1つまたは複数のプライマー、すなわち1つのプライマーおよび多数のプライマーを指す。特許請求の範囲を立案して如何なる任意選択の要素も排除できることをさらに留意されたい。このように、この陳述は、特許請求の範囲の要素の詳説に関して、例えば「唯一」、「のみ」などの排他的術語の使用、または「否定的」限定の使用の先行基盤として働くものとする。
本明細書で使用する用語「試料」は、典型的には、必ずしもそうではないが、1つまたは複数の目的の検体を含有する、液状形の物質または物質の混合物に関する。一実施形態では、その広義で使用するこの用語は、DNAまたはRNAを含有する任意の植物、動物またはウイルス性物質、例えば、個体から単離した(血漿、血清、脳脊髄液、リンパ液、涙、唾液および組織切片を非制限的に含む)、保存組織から単離した(FFPE切片など)、またはin vitro細胞培養成分から単離した組織または体液など、および環境から単離した試料を指す。
本明細書で使用する用語「核酸試料」は、核酸を含有する試料を示す。本明細書で使用する核酸試料は、それらがヌクレオチド配列を含有する多数の異なる分子を含有する点において複合状態であり得る。哺乳動物(例えば、マウスまたはヒト)由来のゲノムDNA試料は複合タイプの試料である。複合試料は10、10、10または10個を超える異なる核酸分子を有する可能性がある。さらに、複合試料は数個の分子のみを含む可能性があり、この場合分子は一括して10、10、10または10個を超えるかまたはそれより多くのヌクレオチドを有する。DNA標的は、ゲノムDNA、または人工DNA構築物などの任意の供給源に由来し得る。核酸、例えば組織培養細胞から作製したゲノムDNAを含有する任意の試料、または組織の試料を本明細書において利用することができる。
用語「ヌクレオチド」は、周知のプリンおよびピリミジン塩基だけでなく、修飾された他の複素環構造塩基も含有する部分を含むことを意図する。このような修飾は、メチル化プリンまたはピリミジン、アシル化プリンまたはピリミジン、アルキル化リボースまたは他の複素環構造塩基を含む。さらに用語「ヌクレオチド」は、ハプテンまたは蛍光標識を含有する部分を含み、従来のリボースおよびデオキシリボース糖だけでなく、他の糖も含有し得る。例えば、1つまたは複数のヒドロキシル基がハロゲン原子または脂肪族官能基に置換され、エーテル、アミンなどとして官能基化される場合、修飾ヌクレオシドまたはヌクレオチドも糖部分に修飾を含む。
用語「核酸」と「ポリヌクレオチド」は本明細書では同義で使用して、ヌクレオチド、例えばデオキシリボヌクレオチドまたはリボヌクレオチドで構成される、任意の長さ、例えば約2塩基より長い、約10塩基より長い、約100塩基より長い、約500塩基より長い、1000塩基より長い、最大約10,000またはそれより長い塩基のポリマーを記載し、これは酵素によってまたは合成によって生成することができ(例えば、米国特許第5,948,902号およびその中に引用された参照文献中に記載されたPNA)、2つの天然に存在する核酸のそれと同様に配列特異的形式で天然に存在する核酸とハイブリダイズすることができ、例えばワトソン−クリックの塩基対形成相互作用に関与し得る。天然に存在するヌクレオチドには、グアニン、シトシン、アデニン、チミン、およびウラシルがある(それぞれG、C、A、TおよびU)。DNAとRNAはそれぞれデオキシリボースおよびリボース糖骨格を有し、一方PNAの骨格はペプチド結合によって連結した反復N−(2−アミノエチル)−グリシン単位で構成される。
本明細書で使用する用語「オリゴヌクレオチド」は、約2〜200ヌクレオチド、最大500ヌクレオチド長のヌクレオチドの一本鎖多量体を示す。オリゴヌクレオチドは合成的であってよく、または酵素によって作製することができ、幾つかの実施形態では、30〜150ヌクレオチド長である。オリゴヌクレオチドはリボヌクレオチドモノマーを含有することができ(すなわち、オリゴリボヌクレオチドであってよく)、またはデオキシリボヌクレオチドモノマー、またはリボヌクレオチドモノマーとデオキシリボヌクレオチドモノマーの両方を含有することができる。オリゴヌクレオチドは、例えば10〜20、11〜30、31〜40、41〜50、51〜60、61〜70、71〜80、80〜100、100〜150または150〜200ヌクレオチド長であり得る。
用語「プライマー」は、ポリヌクレオチド鋳型とデュプレックスを形成するとき、核酸合成の開始地点として作用することができ、伸長デュプレックスが形成されるように鋳型に沿ってその3’末端から伸長することができる、天然または合成いずれかのオリゴヌクレオチドを意味する。したがってプライマーは、標的核酸中の配列とハイブリダイズし核酸合成地点として作用するほど充分に相補的である、3’核酸配列を含む。プライマーは、3’ハイブリダイズ配列の上流に標的とハイブリダイズしない他の配列(例えば、5’配列)も含み得る。このような他の配列は、目的の領域(例えば、バーコード、他のプライマー配列など)を加える目的であり得る。伸長プロセス中に加えるヌクレオチドの配列は、鋳型ポリヌクレオチドの配列によって決定される。プライマーは、例えばDNAポリメラーゼによって伸長され得る。プライマーは一般に、プライマー伸長産物の合成におけるそれらの使用に適した長さであり、通常例えば10〜75、15〜60、15〜40、18〜30、20〜40、21〜50、22〜45、25〜40などの8〜100ヌクレオチド長の間の範囲、より典型的には18〜40、20〜35、21〜30ヌクレオチド長の範囲、および言及範囲間の任意の長さである。典型的プライマーは、例えば15〜45、18〜40、20〜30、21〜25などの10〜50ヌクレオチド長の間の範囲、および言及範囲間の任意の長さであり得る。幾つかの実施形態では、プライマーは通常約10、12、15、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65、または70ヌクレオチド長を超えない。
増幅における最大効率のためプライマーは通常一本鎖であるが、代替的に二本鎖である可能性もある。二本鎖である場合、プライマーは通常、伸長産物を調製するため使用する前にその鎖を分離するよう最初に処理する。この変性ステップは典型的には熱により行うが、代替的にアルカリの使用、次に中和によって実施することができる。したがって、「プライマー」は鋳型と相補的であり、水素結合またはハイブリダイゼーションにより鋳型と複合体形成しポリメラーゼによる合成開始のプライマー/鋳型複合体を生成し、これはDNA合成のプロセス中、鋳型と相補的なその3’末端で連結した共有結合塩基の付加によって伸長される。
用語「ハイブリダイゼーション」または「ハイブリダイズする」は、第2の相補的核酸鎖との正常なハイブリダイゼーション条件下、および同じ正常なハイブリダイゼーション条件下で無関係な核酸分子と安定状態のデュプレックスを形成しない条件下で、核酸鎖がアニーリングし、安定状態のデュプレックス、ホモデュプレックスまたはヘテロデュプレックスのいずれかを形成するプロセスを指す。デュプレックスの形成は、ハイブリダイゼーション反応における2つの相補的核酸鎖(またはアニーリングするほど充分相補的な配列)のアニーリングによって実施される。ハイブリダイゼーション反応は、2つの核酸鎖がほぼまたは完全に相補的である特異的配列中に特定数のヌクレオチドを含有しない限り、その2つの核酸鎖間のハイブリダイゼーションが安定状態のデュプレックス、例えば正常なストリンジェンシー条件下で二本鎖形成の領域を保持するデュプレックスを形成しないように、そのハイブリダイゼーション反応が起こる下での(ハイブリダイゼーションストリンジェンシーと呼ばれることが多い)ハイブリダイゼーション条件の調節によって非常に特異的に行うことができる。任意の所与のハイブリダイゼーション反応に関して「正常なハイブリダイゼーションまたは正常なストリンジェンシー条件」は容易に決定される。例えば、Ausubel et al.、Current Protocols in Molecular Biology、John Wiley and Sons、Inc.、New York、またはSambrook et al.、Molecular Cloning:A Laboratory Mannual、Cold Spring Harbor Laboratory Pressを参照されたい。本明細書で使用する用語「ハイブリダイズする」または「ハイブリダイゼーション」は、塩基対形成により核酸の鎖が相補鎖と結合する任意のプロセスを指す。
中〜高ストリンジェンシーハイブリダイゼーションおよび洗浄条件下で2つの配列が互いに特異的にハイブリダイズする場合、核酸は参照核酸配列に「選択的にハイブリダイズ可能」であると考えられる。中〜高ストリンジェンシーハイブリダイゼーション条件は知られている(例えば、Ausubel et al.、Short Protocols in Molecular Biology、3rd ed.、Wiley and Sons 1995 and Sambrook et al.、Molecular Cloning:A Laboratory Mannual、Third Edition、2001 Cold Spring Harbor、N.Y.を参照)。高ストリンジェンシー条件の一例には、50%ホルムアミド、5×SSC、5×Denhardt液、0.5%SDSおよび100ug/ml変性担体DNA中の約42℃におけるハイブリダイゼーション、次に室温における2×SSCおよび0.5%SDS中で2回、および42℃における0.1×SSCおよび0.5%SDS中でのさらに2回の洗浄がある。
本明細書で使用する用語「デュプレックス」または「デュプレックス状態」は、塩基対形成した、すなわち一緒にハイブリダイズした2つの相補的ポリヌクレオチドを記載する。
本明細書で使用する用語「増幅」は、鋳型核酸の片鎖または両鎖と相補的である核酸分子を合成するプロセスを指す。核酸分子の増幅は、鋳型核酸の変性、プライマーの融解温度未満である温度における鋳型核酸へのプライマーのアニーリング、および酵素でプライマーから延長して増幅産物を生成することを含み得る。変性、アニーリングおよび延長ステップは、それぞれ1回または複数回実施することができる。特定の場合、増幅産物の量がしばしば指数関数的倍数に増大するように、変性、アニーリングおよび延長ステップが多数回実施されるが、指数関数的増幅は本発明の方法に必要とされない。典型的に増幅は、デオキシリボヌクレオシド三リン酸、DNAポリメラーゼ酵素、およびポリメラーゼ酵素の最適活性に適したバッファーおよび/またはコファクターの存在を必要とする。用語「増幅産物」は、本明細書で定義する増幅プロセスから生じる核酸配列を指す。
「複数」は少なくとも2つの要素を含有する。特定の場合、複数は少なくとも10個、少なくとも100個、少なくとも100個、少なくとも10,000個、少なくとも100,000個、少なくとも10個、少なくとも10個、少なくとも10個または少なくとも10個またはそれより多くの要素を有し得る。
2つの核酸が「相補的」である場合、それらは高ストリンジェンシー条件下で互いにハイブリダイズする。用語「完全に相補的」を使用して、核酸の1つの各塩基が他の核酸中の相補的ヌクレオチドと塩基対形成するデュプレックスを記載する。多くの場合、相補的である2つの配列は相補性である少なくとも10個、例えば少なくとも12または15個のヌクレオチドを有する。
アダプターまたは標的ポリヌクレオチドの文脈では、「プライマー結合部位」または「プライマー配列」は、プライマー(例えば、オリゴヌクレオチドプライマー)がハイブリダイズするアダプターまたは標的ポリヌクレオチド中の部位を指す。オリゴヌクレオチドがあるプライマー用のプライマー結合部位またはプライマー配列を与えるかまたはそれを含む場合、次いでプライマーはそのオリゴヌクレオチドまたはその相補体(例えば、アダプタータグ化ポリヌクレオチド中のプライマー結合部位/プライマー配列)にハイブリダイズすることができる。
本明細書で使用する用語「ジェノタイピング」は任意のタイプの核酸配列の分析を指し、シーケンシング、多型性(SNP)分析、および再編成を確認するための分析を含む。
本明細書で使用する用語「シーケンシング」は、それによってポリヌクレオチドの少なくとも10個の連続ヌクレオチドの同一性(例えば、少なくとも20個、少なくとも50個、少なくとも100個または少なくとも200個またはそれより多くの連続ヌクレオチドの同一性)が得られる方法を指す。
用語「次世代シーケンシング」は、Illumina、Life Technologies、Pacific Bio、and Rocheなどにより現在利用されている、いわゆる並行的シーケンシング→合成またはシーケンシング→ライゲーションプラットフォームを指す。次世代シーケンシング法は、ナノポアシーケンシング法、またはLife Technologiesにより実用化されたIon Torrent技術などの電子検出ベース法も含み得る。
本明細書で使用する用語「伸長する」は、ポリメラーゼを使用したヌクレオチドの付加によるプライマーの伸長を指す。核酸にアニーリングするプライマーが伸長する場合、核酸は伸長反応の鋳型として作用する。
本明細書で使用する用語「バーコード」、「バーコード配列」または「分子バーコード」は、a)反応中のポリヌクレオチドの源を確認および/または追跡するため、および/またはb)(例えば、試料中のほぼ全ての分子が異なる配列でタグ化され、次いでその試料を増幅する場合)初期分子が何回シーケンシングされたか数えるために使用する、特有のヌクレオチド配列を指す。バーコード配列は大きさと組成が幅広く変わる可能性があり、以下の参照文献は特定の実施形態に適したバーコード配列のセットの選択に関する指針を与える:Casbon(Nuc.Acids Res.2011、22e81)、Brenner、米国特許第5,635,400号;Brenner et al、Proc.Natl.Acad.Sci.、97:1665−1670(2000);Shoemaker et al、Nature Genetics、14:450−456(1996);Morris et al、欧州特許公開0799897A1;Wallace、米国特許第5,981,179号など。特定の実施形態では、バーコード配列は4〜36ヌクレオチド、または6〜30ヌクレオチド、または8〜20ヌクレオチドの範囲の長さを有し得る。
バーコード中の「縮重塩基領域」または「DBR」は、DBRが加えられた断片を識別するのを助けるほど充分な複雑性を有するタイプの分子バーコードを指す。幾つかの場合、ほぼ全てのタグ化断片は異なるDBR配列を有し得る。これらの実施形態では、高い複雑性のDBR(例えば、少なくとも10,000または100,000配列で構成されるDBR)を使用することができる。他の実施形態では、数個の断片を同じDBR配列でタグ化することができるが、これらの断片は(i)DBR配列、(ii)断片の配列、(iii)断片の末端の配列、および/または(iv)断片中へのDBRの挿入部位の組合せによってさらに識別することができる。幾つかの実施形態では、少なくとも95%、例えば少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または少なくとも99.5%の標的ポリヌクレオチドが異なるDBR配列と結合した状態になる。幾つかの実施形態では、DBRは(IUPACコードにより定義された)R、Y、S、W、K、M、B、D、H、V、Nから選択される1つまたは複数の(例えば、少なくとも2個、少なくとも3個、少なくとも4個、少なくとも5個、または5〜30個またはそれより多くの)ヌクレオチドを含むことができる。
幾つかの場合、DBRはエラー修正であり得る。例示的なエラー確認(またはエラー修正)配列の記載は文献全体で見ることができる(例えば、いずれも参照により本明細書に組み込まれている米国特許出願公開US2010/0323348およびUS2009/0105959中に記載されている)。エラー修正可能コードは分子の絶対数を定量化するのに必要であり得る。文献中の多くの報告は、バイナリーシステムのエラー修正用に本来開発されたコード(Hammingコード、Reed Solomonコードなど)を使用し、またはクアターナリーシステムにこれらを適用する(例えば、クアターナリーHammingコード;Generalized DNA barcode design based on Hamming codes、Bystrykh2012PLoS One.2012 7:e36852を参照)。
幾つかの実施形態では、DBRをさらに使用して、分析された初期標的ポリヌクレオチド分子の数を決定することができる、すなわち分析された初期標的ポリヌクレオチド分子の数を「数える」ことができる。DBRでタグ化された分子のPCR増幅によって、異なる第二次集団のそれぞれが1つのタグ化分子から増幅される点でクローン関係にある、産物の多数の第二次集団をもたらす。明らかとなるように、任意のクローン関係にあるPCR産物の第二次集団中には数千または数百万またはそれより多くの分子が存在する可能性があり、これらのクローン関係にある第二次集団中の標的分子の数は大幅に変わる可能性があるが、方法の第1のステップ中でタグ化した分子の数は、PCR産物の集団中に現れる標的配列と結合したDBR配列の数を数えることによって推定することができる。ある実施形態では、この方法を使用して作製したPCR産物の集団をシーケンシングして複数の配列を生成することができるので、この数値は有用である。標的ポリヌクレオチドの配列と結合した異なるDBR配列の数を数えることができ、(例えば、断片の配列、断片の末端の配列、および/または断片中へのDBRの挿入部位と共に)この数値を使用して、シーケンシングされた初期鋳型核酸分子の数を推定することができる。
用語「試料識別子配列」は、標的ポリヌクレオチドに追加することができるタイプのバーコードであり、この配列は標的ポリヌクレオチドの源(すなわち、どの試料に標的ポリヌクレオチドが由来するか)を特定する。使用中、それぞれの試料は異なる試料識別子配列でタグ化し(例えば、一配列をそれぞれの試料に追加し、この場合異なる試料に異なる配列を追加し)、タグ化試料をプールする。プールした試料をシーケンシングした後、試料識別子配列を使用して配列の源を確認することができる。
本明細書で使用する用語「鎖」は、共有結合、例えばホスホジエステル結合によって1つに結合したヌクレオチドで構成される核酸を指す。細胞中、通常DNAは二本鎖型で存在し、このように、本明細書で「上部」鎖および「下部」鎖と呼ぶ核酸の2つの相補鎖を有する。特定の場合、染色体領域の相補鎖は、「プラス」鎖および「マイナス」鎖、「第1の」鎖および「第2の」鎖、「コード」鎖および「非コード」鎖、「ワトソン」鎖および「クリック」鎖、または「センス」鎖および「アンチセンス」鎖と呼ぶことができる。上部鎖および下部鎖としての鎖の割り当ては任意であり、如何なる特定の方向、機能または構造も意味しない。幾つかの例示的な哺乳動物染色体領域(例えば、BAC、アセンブリー、染色体など)の第1の鎖のヌクレオチド配列は知られており、例えばNCBIのGenbankデータベース中で見ることができる。
本明細書で使用する用語「上部鎖」は、核酸の両鎖ではなく核酸の片鎖を指す。オリゴヌクレオチドまたはプライマーが「上部鎖のみと」結合またはアニーリングするとき、それは一鎖とのみ結合し他の鎖とは結合しない。本明細書で使用する用語「下部鎖」は、「上部鎖」と相補的である鎖を指す。オリゴヌクレオチドが「一鎖のみと」結合またはアニーリングするとき、それは一鎖、例えば第1の鎖または第2の鎖とのみ結合し他の鎖とは結合しない。
用語「リバースプライマー」および「フォワードプライマー」は、二本鎖DNA分子中の異なる鎖とハイブリダイズするプライマーを指し、この場合ポリメラーゼによるプライマーの伸長は他のプライマーに向かう方向である。PCRにおいて、標的核酸を増幅するために使用するフォワードプライマーとリバースプライマーは「プライマー対」と呼ばれる。
本明細書で使用する用語「1kb長未満のDNA断片を含むDNA断片の集団」は、少なくとも1%、少なくとも5%、少なくとも10%、少なくとも20%、少なくとも30%、少なくとも50%、少なくとも80%または少なくとも90%の断片分子が1kb長未満である断片の集団を指す。幾つかの実施形態では、このような集団は50〜500bp、例えば100〜400bpの範囲内の平均断片長を有し得る。
本明細書で使用する用語「オリゴ−dNテール」は、ターミナルトランスフェラーゼの作用によりDNA分子の鎖の3’末端に加えられたGs、As、TsまたはCsのテールを指す。テールは10個〜100個を超えるヌクレオチドを有し得る。
本明細書で使用する用語「オリゴ−dNテールとハイブリダイズするプライマー」は、その3’末端に8〜20個またはそれより多くの塩基のオリゴ−dG、オリゴ−dA、オリゴ−dTまたはオリゴ−dC領域を有するプライマーを指し、この場合これらの塩基は断片に加えられた相補的ホモポリマーテールとハイブリダイズする。
本明細書で使用する用語「バーコードの配列」は、バーコードを構成するヌクレオチドの配列を指す。バーコードの配列は少なくとも3ヌクレオチド長、幾つかの場合5〜30以上のヌクレオチド長であり得る。
本明細書で使用する用語「マッチ」は、2配列を比較した作用状態を指し、それらが同一、相補的、または非常に類似的(例えば、エラー修正バーコードを使用したとき)である場合、それらはマッチした状態として示される。幾つかの実施形態では、マッチした配列が一群中に配列する。
本明細書で使用する用語「マッチした配列読み枠の構築」は、マッチした読み枠(すなわち、同一または非常に類似したバーコードを含有する配列またはその相補体)を互いに一直線に並べて、マッチした配列読み枠によってもたらされるサブ配列(sub−sequences)で構成された構築配列を得る、コンピューターによって行われるステップを指す。幾つかの実施形態では、配列構築は同一バーコードを有する配列読み枠からのコンセンサス配列の作製、および次いでそのコンセンサス配列からの配列の構築を含み得る。構築配列は時折「コンティグ」と呼ばれる。
本明細書で使用する用語「またはその変異体」は、周知の活性を有するタンパク質と少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも97%、少なくとも98%または少なくとも99%同一であるアミノ酸配列を有するタンパク質を指し、変異体は周知の活性のタンパク質と同じ活性を少なくともある程度有する。例えば、野生型トランスポザーゼの変異体は、DNAへの対応するトランスポザーゼの挿入を触媒することができるはずである。
用語「充填反応」または「ギャップの充填」は、DNAデュプレックスの一鎖中の(ヌクレオチドを欠く)5’オーバーハング領域および/または内部鎖切断部またはギャップを(例えば、DNAポリメラーゼの作用により)鋳型特異的形式で充填し、必要なときは、(例えば、DNAリガーゼの作用により)1つに連結させる酵素触媒反応を指す。
他の用語の定義は本明細書を通じて出現する可能性がある。
様々な実施形態を記載する前に、本開示の教示は記載する特定の実施形態に限られず、そのように、当然ながら変わり得ることを理解されたい。本教示の範囲は添付の特許請求の範囲によってのみ限定されるので、本明細書で使用する術語は単に特定の実施形態を記載する目的であり、限定的であることは意図しないことも理解されたい。
本明細書で使用する項目の見出しは単なる編成目的であり、決して記載する主題を限定するものとして解釈すべきではない。本教示は様々な実施形態に関して記載するが、本教示がこのような実施形態に限定されることは意図しない。反対に、当業者によって理解されるように、本教示は様々な代替、変更形態、および均等物を包含する。
他に定義しない限り、本明細書で使用する全ての技術および科学用語は、本開示が属する技術分野の当業者によって一般に理解されるのと同じ意味を有する。本明細書に記載するものと同様または同等の任意の方法および材料も、本教示の実施または試験において使用することはできるが、幾つかの例示的な方法および材料をここに記載する。
任意の刊行物の引用は出願日より前のその開示のためであり、本発明の特許請求の範囲が、従来の発明によるこのような刊行物に先行する権利がないことを認めるものとして解釈すべきでない。さらに、示された公開日は、別個に確認する必要があり得る実際の公開日とは異なる可能性がある。
本開示を読むことによって当業者に明らかとなるように、本明細書で記載し例示する個々の実施形態のそれぞれが、本教示の範囲または趣旨から逸脱せずに、他の幾つかの実施形態のいずれかの特徴から容易に分離するかまたはそれらと組み合わせることができる、別々の成分および特徴を有する。任意の列挙した方法は、引用した事象の順序または理論上可能である任意の他の順序で実施することができる。
本明細書で言及する全ての特許および刊行物は、このような特許および刊行物内で開示された全ての配列を含めて、明示的に参照により本明細書の一部をなすものとする。
本明細書で提供するのは、2つの同一アダプターが装着されたトランスポザーゼ二量体を使用して、短鎖DNA断片を含有する試料をタグ化するための様々な方法である。ある実施形態では、短鎖DNA断片は約200bp、500bp、700bp、900bp、1Kb、1.2Kb、1.5Kbの平均長を含めた約150bp〜約1.5Kbの平均長、およびこの間の平均長を有する。幾つかの実施形態では、例えばエンドヌクレアーゼを用いたせん断または処置により、DNA試料を処理してこの範囲内の平均長を得る。図1は、トランスポザーゼ認識配列およびR1と指定する5’オーバーハング領域を含む二本鎖領域(鎖の5’および3’末端を示す)を有する一般的アダプター(上部アダプター)を示す。R1は一本鎖であり、任意の数個の異なる機能性配列またはドメインを含み得る。例えば、(図1中の下部アダプター中に示したように)R1領域はプライマー配列およびバーコードを含み得る。図2は、2つの同一アダプターと複合体形成した/それらが装着されたトランスポザーゼ二量体を示す。
幾つかの方法を利用して、植物、動物(例えば、爬虫類、哺乳動物、昆虫、蠕虫、魚類など)、組織試料、細菌、真菌(例えば、酵母)、ファージ、ウイルス、死体組織、古細菌/古代生物試料などに限られないが、これらを含めた、ほぼ任意の生物由来のゲノムDNAを分析することができる。ある実施形態では、方法中で使用するゲノムDNAは哺乳動物に由来する可能性があり、ある実施形態では、哺乳動物はヒトである。例示的実施形態では、試料はヒト、マウス、ラット、またはサル細胞などの哺乳動物細胞由来のゲノムDNAを含有し得る。試料は、培養細胞または臨床試料の細胞、例えば生検材料組織、スクレープ(scrape)または洗浄液または法医学用試料の細胞(すなわち、犯罪現場で回収した試料の細胞)から作製することができる。特定の実施形態では、核酸試料を、細胞、組織、体液、および大便などの生物学的試料から得ることができる。目的の体液には、血液、血清、血漿、唾液、粘液、痰、脳脊髄液、胸膜液、涙、乳腺液、リンパ液、喀痰、滑液、尿、羊水、および***があるが、これらに限られない。特定の実施形態では、試料を対象、例えばヒトから得ることができる。
幾つかの実施形態では、試料は、臨床試料由来、例えばがん、炎症性疾患もしくは妊娠などの疾患または状態を有するかまたはこれらを有する疑いがある患者由来のDNA断片を含む。幾つかの実施形態では、保管された患者の試料、例えばホルマリン固定パラフィン包埋(FFPE)組織試料から断片状DNAを抽出することによって、試料を作製することができる。他の実施形態では、患者の試料は、体液、例えば末梢血由来の無細胞循環DNAの試料であり得る。方法の初期ステップ中で使用するDNA断片は、事前に変性していない非増幅DNAでなければならない。機械的に(例えば、超音波処理、噴霧、またはせん断によって)、または二本鎖DNAフラグメンターゼ酵素(New England Biolabs、Ipswich MA)を使用して酵素により、試料を断片化することができる。他の実施形態では、初期試料中のDNAが既に断片化している可能性がある(例えば、FFPE試料および循環無細胞DNA(cfDNA)、例えばctDNAに関する場合)。初期試料中の断片は1kb未満である(例えば、50bp〜500bp、80bp〜400bp、または100bp〜1000bpの範囲内の)平均サイズを有し得るが、この範囲外の平均サイズを有する断片を使用することができる。無細胞または循環腫瘍DNA(ctDNA)、すなわちがん患者の血液中を自由に循環する腫瘍DNAは、平均断片サイズ約165〜250bpで高度に断片化される(Newman et al Nat Med.2014 20:548−54)。全血を遠心分離して全細胞を除去し、次いで残存血漿を分析することによりcfDNAを得ることができる。
幾つかの実施形態では(および図3中に示すように)、本方法は、アダプタータグ化断片を生成するために、二本鎖DNA断片を含む試料2とそれぞれアダプターが装着された複数のトランスポザーゼデュプレックス1を接触させるステップを含み得る(1つのみのDNA断片とトランスポザーゼデュプレックスを示す)。ある実施形態では、DNA断片は1kb未満の平均長を有する。アダプターは、トランスポザーゼ認識配列を含むデュプレックス領域(図1中の黒塗り部分)および第1のプライマー(タグ)配列を含む5’オーバーハング領域(図1中の白塗り部分)を含む。使用するトランスポザーゼおよび/または試料の量を調整して、比較的高い割合のタグ化断片、例えば少なくとも25%、少なくとも50%、または少なくとも75%のタグ化断片、特に500bp長未満である小断片が平均1箇所挿入されるように、80〜500bp毎(例えば、100〜300bp毎)にトランスポザーゼ挿入部分を生成することができる。生成するタグ化断片の集団3は、1つの末端に結合した1つのアダプターを含有する断片の集団を含有する(1つのタグ化DNA断片のみを図3中に示す)。このタグ化DNA断片の上部鎖は、5’から3’方向に、5’オーバーハング配列(R1と示す白塗り部分)、トランスポザーゼ認識配列(黒塗り部分)の一本鎖、およびDNA断片の一本鎖を含む。下部鎖は、3’から5’方向に、トランスポザーゼ認識配列の相補鎖、ギャップ/ニック(スペース)、およびDNA断片の相補鎖を含む。このタグ化DNA断片の非タグ化末端は(示したように)不均一または平滑(示さず)であり得ることに留意されたい。
本方法のこのステップ中で使用するトランスポザーゼは、Tnトランスポザーゼ(例えば、Tn3、Tn5、Tn7、Tn10、Tn552、Tn903)、MuAトランスポザーゼ、Vibharトランスポザーゼ(例えば、ビブリオハーベイ(Vibrio harveyi)由来)、Ac−Ds、Ascot−1、Bs1、Cin4、Copia、En/Spm、Fエレメント、hobo、Hsmar1、Hsmar2、IN(HIV)、IS1、IS2、IS3、IS4、IS5、IS6、IS10、IS21、IS30、IS50、IS51、IS150、IS256、IS407、IS427、IS630、IS903、IS911、IS982、IS1031、ISL2、L1、Mariner、Pエレメント、Tam3、Tc1、Tc3、Tel、THE−1、Tn/O、TnA、Tn3、Tn5、Tn7、Tn10、Tn552、Tn903、Tol1、Tol2、TnlO、Tyl、これらの変異体を含めたトランスポザーゼであってよい。幾つかの場合、1つまたは複数の陽イオンを加えることにより挿入を助長および/または誘発することができる。陽イオンは、例えばCa2+、Mg2+およびMn2+などの二価陽イオンであってよい。
ある実施形態では、本方法の次のステップは、ランダムプライマー伸長産物5を生成するために、ランダムプライマー4を使用しアダプタータグ化断片の上部鎖11にプライマー伸長反応を実施するステップ(図3中の下向き矢印(i))を含み得る。ランダムプライマーは、ランダム3’配列(Nが任意のヌクレオチドである「Ns」によって示される)および第2のプライマー配列を含む5’配列(ハッシュがけ領域)を含む。伸長は破線矢印によって示す。好ましいDNAポリメラーゼは、鎖置換またはニックトランスレーション(5’−3’エクソ)活性を示し、上部鎖の最も3’末端へのランダムプライマーのアニーリング、および短鎖下流産物を置換しながらの完全長産物の合成を可能にする。
代替的な実施形態では、ランダムプライマーの代わりに1つまたは複数の遺伝子特異的プライマーを使用して、プライマー伸長反応を実施する。これらの実施形態では、アダプタータグ化断片の上部鎖11を、遺伝子特異的プライマーを使用して伸長させ(示さず)遺伝子特異的プライマー伸長産物を生成する。このように、多くのアダプタータグ化断片は、その内部配列に特異的である遺伝子特異的プライマーが存在しないため伸長しない。遺伝子特異的プライマーは、(図3中のランダムプライマー4と類似した)第2のプライマー配列を含む遺伝子特異的3’配列および5’配列を含む。幾つかの実施形態では、遺伝子特異的プライマーのプールを使用して1つまたは複数の特異的遺伝子(または他の遺伝子座)を伸長させ、任意の所望数の異なるプライマー、例えば2〜10,000個の異なる遺伝子特異的プライマーを含有し得る。
他の実施形態では、ランダムプライマー伸長反応(および図3中の下向き矢印(ii))の前に、本方法は、完全なトランスポザーゼタグ化断片デュプレックス8を形成するために、トランスポザーゼタグ化断片、R1配列と相補的な配列の下部鎖を充填し、ギャップを充填する(破線矢印6および上向き矢印7)ためのアダプタータグ化断片に伸長または伸長/ライゲーション反応を実施するステップを含むことができる(R1と相補的な配列はR1’で示す)。次いでこれらの完全なトランスポザーゼタグ化断片デュプレックスに、その3’末端に第1のプライマー配列を含む直鎖増幅プライマーP1を用いて直鎖増幅反応を施し、デュプレックス9を生成することができる。直鎖増幅反応は(「反復」矢印で示したように)反復することができ、これによってデュプレックス9の上部鎖のさらなるコピーが生じる(示さず)。直鎖増幅反応は、任意の所望回数、例えば2〜40回、例えば4回、10回、20回、30回など実施することができる。
次いで、直鎖増幅反応産物に、前に記載したようにランダムプライマー伸長を施し、ランダムプライマー伸長産物5を生成することができる。
ある実施形態では、アダプターおよび/またはランダムプライマーのいずれかが少なくとも1つの他の領域を含む。例えば、アダプターおよび/またはランダムプライマーはバーコードを含むことができる。バーコードは試料特異的バーコード、すなわちDNA断片が由来する試料を確認するために使用されるバーコードであってよい。幾つかの実施形態では、バーコードは縮重塩基領域(DBR)を含み、その使用は前で詳細に記載している。アダプターおよび/またはリバースプライマーにおいてバーコードの任意の組合せを使用することができる。アダプターとランダムプライマーの両方がバーコードを含む実施形態では、バーコードはアダプターとリバースプライマーにおいて同じである可能性があり、またはそれらは、ユーザーの要望、および下流プロセス/分析中でのバーコードの使用のされ方に応じて1箇所または複数個所で異なる可能性がある。
次に、本方法は、ポリメラーゼ連鎖反応(PCR)増幅産物10を生成するために、その3’末端に第1のプライマー配列を含むフォワードプライマーP1およびその3’末端に第2のプライマー配列を含むリバースプライマーP2を使用し、PCRによりランダムプライマー伸長産物5を増幅するステップを含む。これらの産物は、試料由来のDNA断片由来配列(グレー)およびドメインR1とR2の全体または一部(例えば、フォワードプライマーP1とリバースプライマーP2によって結合したドメインR1とR2の一部)を含有する。
ある実施形態では、図3中に示したランダムプライマー伸長反応は他の直鎖増幅プロセスに置き換えることができる。例えば、図4中に示したように、本方法は、テールアダプタータグ化断片12を生成するために、鋳型非依存的ポリメラーゼ活性を有するターミナルトランスフェラーゼまたは修飾DNAポリメラーゼを使用し、アダプタータグ化断片の上部鎖11にオリゴ−dNテールを加えるステップを含むことができる(この場合、dNテールはポリ−Aテールである)。次いでプライマー伸長反応を、テールプライマー13を使用しテールアダプタータグ化断片12に実施してテールプライマー伸長産物14を生成する。テールプライマーは、オリゴ−dNテールとハイブリダイズする3’配列(この場合ポリ−T配列)および第2のプライマー配列P2を含む5’配列R2を含む。これらのテールプライマー伸長産物14は、その3’末端に第1のプライマー配列P1を含むフォワードプライマーおよびその3’末端に第2のプライマー配列P2を含むリバースプライマーを使用し、ポリメラーゼ連鎖反応(PCR)により増幅してPCR増幅産物15を生成することができる(前に記載したPCR増幅と同様)。
これらのPCR増幅産物は、ユーザーによって望まれるように任意の所望の下流プロセスまたは分析に使用することができる。
ユーザーは、所望により、試料富化ステップ、試料浄化ステップ、および/または酵素不活性化または除去ステップを含めることができることをここで留意されたい。例えば、DNA断片の初期試料を、例えばハイブリダイゼーションベースの標的富化(例えば、Agilent SureSelectまたはHaloPlex Target Enrichment)を使用して、目的の特定の標的配列(複数可)に関して富化することができる。さらに、方法の任意の1ステップにおいて生成した産物を、例えば、増幅産物精製(例えば、Agencourt AMPure精製キット)、次のステップを実施する前に精製することができる。この点に関する制約は考えられない。
ある実施形態では、本方法はPCR増幅産物10のシーケンシングをさらに含むことができる。明らかであろうが、これらの実施形態では、所望のシーケンシングプラットフォームに適した配列を、例えばアダプター、ランダムプライマー、直鎖増幅プライマー、フォワードプライマー、またはリバースプライマーの一部として、方法中のいずれかの好都合なステップで断片に加えることができる。このように、2つのシーケンシングプライマー配列をシーケンシングプラットフォームで使用する実施形態では、第1のシーケンシングプライマー配列は、(i)第1のプライマー配列、(ii)フォワードPCRプライマーの5’テール上、または(iii)アダプター中の第1のプライマー配列の下流であってよく、第2のシーケンシングプライマー配列は、(i)第2のプライマー配列、(ii)リバースプライマーの5’テール上、または(iii)ランダムプライマー上の第2のプライマー配列の下流であってよい。Illuminaの可逆的ターミネーター法、Rocheのパイロシーケンシング法(454)、Life Technologiesのライゲーションによるシーケンシング(SOLiDプラットフォーム)、Life TechnologiesのIon TorrentプラットフォームまたはPacific Biosciencesの蛍光ベースの切断法に限られないが、これらを含めた任意の適切な方法を使用して産物をシーケンシングすることができる。このような方法の幾つかの例は以下の参照文献、Margulies et al(Nature2005 437:376−80);Ronaghi et al(Analytical Biochemistry1996 242:84−9);Shendure(Science2005 309:1728);Imelfort et al(Brief Bioinform.2009 10:609−18);Fox et al(Methods Mol Biol.2009;553:79−108);Appleby et al(Methods Mol Biol.2009;513:19−39)English(PLoS One.2012 7:e47768)およびMorozova(Genomics.2008 92:255−64)中に記載されており、これらは、各ステップに関する全ての出発物質、試薬、および最終産物を含めた方法および方法の特定のステップの一般的記載に関して、参照により本明細書の一部をなすものとする。
シーケンシングステップは、DNA断片配列の少なくとも一部分の配列、およびアダプターおよび/またはリバース/テールプライマー中に存在するタグ化DNA断片中の他の配列、例えばバーコードの配列を含む複数の配列の読み枠をもたらす。配列の読み枠をマッチさせ構築して、試料中のDNA断片の平均配列長より長い配列を表す構築配列(例えば、コンティグ)を得ることができる。このようなコンティグは、初期試料が由来した個体由来の所望のポリヌクレオチド配列(例えば、遺伝子、遺伝子座、cDNAなど)の大部分または全体を表し得る。明らかとなるように、方法のこの部分は、少なくとも幾つかの配列読み枠中のバーコードを互いに比較してマッチを得ること、およびマッチした配列読み枠を構築して目的の配列を得ることを含み得る。幾つかの実施形態では、試料特異的バーコードを有する異なる試料由来の(例えば、異なる個体由来の)DNA断片を、バーコードを加えた後およびシーケンシングステップ前の、いずれかの好都合なステップで組み合わせる。試料特異的バーコードの配列を含むこれらの組合せ試料由来の配列は、望む場合デコンボリューション処理(de−convoluted)および構築することができる。
前に記載した任意の方法において、方法は、何個のDBR配列が特定の配列と結合しているか決定し、それによって初期試料中のその配列のコピー数の推定値を得ることをさらに含むことができる。このような方法は、他の刊行物間ではCasbon(Nuc.Acids Res.2011、22e81)中に記載されている。
ある実施形態では、分析対象の初期DNAは1つの供給源(例えば、1つの生物、ウイルス、組織、細胞、対象など)に由来してよく、一方他の実施形態では、核酸試料は複数の供給源から抽出した核酸のプール(例えば、複数の生物、ウイルス、組織、細胞、対象などに由来する核酸のプール)であってよく、この場合「複数」によって2個以上を意味する。このように、ある実施形態では、1つのトランスポザーゼタグ化試料を、他の供給源、例えば2個以上の供給源、3個以上の供給源、5個以上の供給源、10個以上の供給源、50個以上の供給源、100個以上の供給源、500個以上の供給源、1000個以上の供給源、5000個以上の供給源、最大約10,000個またはそれより多くの供給源由来の複数のトランスポザーゼタグ化試料と組み合わせることができ、トランスポザーゼの分子バーコードによって、それらを分析した後に異なる供給源由来の配列を識別できる。
理解されるであろうが、方法の幾つかの分析ステップ、例えば比較ステップと構築ステップはコンピューターで実行することができる。ある実施形態では、一般目的のコンピューターを本明細書で開示する方法およびプログラム向けの機能機構に設定することができる。このようなコンピューターのハードウェアアーキテクチャーは当業者にはよく知られており、1つまたは複数のプロセッサー(CPU)、ランダムアクセスメモリー(RAM)、読み出し専用メモリー(ROM)、内部または外部データ記憶媒体(例えば、ハードディスクドライブ)を含めたハードウェアコンポーネントを含み得る。コンピューターシステムは、グラフィック情報を処理しディスプレイ手段に出力するための1つまたは複数のグラフィックボードも含み得る。前述のコンポーネントは、コンピューター内でバスを介して適切に相互接続することができる。コンピューターは、例えばモニター、キーボード、マウス、ネットワークなどの一般目的外部コンポーネントと通信するのに適したインターフェースをさらに含むことができる。幾つかの実施形態では、コンピューターは並列処理をすることができ、または本発明の方法およびプログラムに関する処理能力を高めるための並列または分散コンピューティング用に設定されたネットワークの一部であり得る。幾つかの実施形態では、記憶媒体からのプログラムコードの読み取り値を、コンピューターに挿入された拡張ボード、もしくはコンピューターに接続した拡張ユニット、および拡張ボードに備えられたCPUなどに与えられたメモリーに書き込むことができ、または拡張ユニットは、プログラムコードの命令に従いオペレーションの一部もしくは全部を実際に実行して、以下に記載する機能を果たすことができる。他の実施形態では、クラウドコンピューティングシステムを使用して方法を実施することができる。これらの実施形態では、データファイルおよびプログラミングを、プログラムを走らせユーザーに出力を返すクラウドコンピューターにエクスポートすることができる。
システムは、ある実施形態では、a)セントラルプロセッシングユニット、b)ソフトウェアおよびデータ記憶用の1つまたは複数のハードドライブを含み得るメイン不揮発性記憶ドライブ、ここにおいて記憶ドライブはディスクコントローラーによって制御される、c)不揮発性記憶ドライブからロードされたプログラムおよびデータを含めたシステムコントロールプログラム、データ、およびアプリケーションプログラムの記憶用のシステムメモリー、例えば高速ランダムアクセスメモリー(RAM)、ここにおいてシステムメモリーは読み出し専用メモリー(ROM)も含み得る、d)マウス、キーパッド、およびディスプレイなどの1つまたは複数の入力または出力デバイスを含めたユーザーインターフェース、e)任意の有線またはワイヤーレス通信ネットワーク、例えばプリンターと接続するための任意選択のネットワークインターフェースカード、およびf)前述のシステムの構成部品と相互接続するための内部バスを含むコンピューターを含む。
<キット>
本開示によってさらに提供するのは、前に記載したように主題の方法を実施するためのキットである。ある実施形態では、キットはそれぞれアダプターが装着された複数のトランスポザーゼデュプレックス(またはこのようなデュプレックスを作製するための別のトランスポザーゼおよびアダプター試薬)を含むことができ、アダプターは、トランスポザーゼ認識配列を有するデュプレックス領域および第1のプライマー配列を含む5’オーバーハング領域、ランダム3’配列および第2のプライマー配列を含む5’配列を有するランダムプライマー、またはオリゴ−dNテールとハイブリダイズする3’配列および第2のプライマー配列を含む5’配列を有するテールプライマー、その3’末端に第1のプライマー配列を有するフォワードプライマー、およびその3’末端に第2のプライマー配列を有するリバースプライマーを含む。幾つかの実施形態では、キットは別々の容器中に多数の異なるアダプターを含むことができ、それぞれの異なるアダプターは異なる試料由来のタグDNA断片と異なるバーコード配列を有する。キットは、本明細書に記載する任意の方法を実施するための、他の試薬を含むことができる。例えばキットは、酵素(例えば、リガーゼ、ポリメラーゼ、耐熱性ポリメラーゼ、ターミナルトランスフェラーゼなど)、ヌクレオチド、バッファー、核酸精製試薬などを含むことができる。
キットの様々な成分は別々の容器中に存在する可能性があり、または望む場合、特定の適合成分を1つの容器中で予め組み合わせることができる。前に記載した試薬以外に、キットは、前に記載した方法中で使用するいずれか他の成分、例えば1つまたは複数の酵素および/またはバッファーなどを含有し得る。
前述の成分以外に、主題のキットは、キットの成分を使用して主題の方法を実施するための説明書、すなわち試料分析用の説明書をさらに含むことができる。主題の方法を実施するための説明書は、一般に適切な記録媒体上に記録されている。例えば説明書は、紙またはプラスチックなどの基体上に印刷することができる。このように、説明書は、添付文書として、キットの容器またはその成分のラベルで(すなわち、パッケージングまたはサブパッケージング(subpackaging)などに付随して)キット中に存在し得る。他の実施形態では、説明書は適切なコンピューター可読記憶媒体、例えばCD−ROM、ディスケットなどの上に電子媒体記憶データファイルとして存在する。さらに他の実施形態では、実際の説明書はキット中に存在しないが、リモートソースから、例えばインターネットを介して説明書を得るための手段を提供する。この実施形態の一例はウェブアドレスを含むキットであり、この場合説明書はウェブアドレスで見ることができ、および/またはそこから説明書をダウンロードすることができる。説明書に関して、説明書を得るためのこの手段は適切な基体に記録される。
以下の実施例を言及して、これらは本発明の作製および使用の仕方に関する完全な開示と記載を当業者に示し、本発明者らが自身の発明とみなすものの範囲を限定するものではなく、以下の実験が実施した全てまたは唯一の実験であることを表すものでもない。使用した数値(例えば、量、温度など)に関する精度を保証するための努力は尽くしたが、ある程度の実験誤差および偏差は考慮しなければならない。
[材料および方法]
<試料DNAの断片化およびR1アダプター配列の挿入>
トランスポザーゼ装着配列:(1A)5’−CTGTCTCTTGATCACAAGT−3’(配列番号1);5’−GCTGACGTCGAGACTTGTGATCAAGAGACAG−3’(配列番号2)。(1A)を装着した100ngのトランスポザーゼをSureSelectQXTバッファー(Agilent Technologies P/N 5190−7053)中で10ngの試料DNAと混合する。次いで試料を42℃で10分間インキュベートする。試料を4℃に冷却し、次いで32μlのSureSelectQXT反応停止液(Agilent Technologies P/N 5190−7059)を加え、室温で1分間インキュベートする。試料の浄化:試料DNAを50μlのAgencourt AMPure XPビーズ(Beckman Coulter P/N A63882)と結合させ、70%エタノールで2回洗浄し、37℃においてヒートブロック上で乾燥させ、20μlの水中にDNAを溶出する。
<1Aを用いた第1の鎖の直鎖環状化>
第1の鎖の直鎖環状化用プライマー:5’−GCTGACGTCGAGACTTGTGA−3’(配列番号3)。反応設定(50μl):17.5μlの水、10μlのHerculase II Fusion PCR反応用バッファー(Agilent Technologies P/N 600675−52)、0.5μlのdNTPそれぞれ200μM(Agilent Technologies P/N 200415−51)、2μMの第1の鎖の直鎖環状化用プライマー、1μMのHerculase II Fusion DNAポリメラーゼ(Agilent Technologies P/N 600672−51)、および20μlの断片状試料DNA。環状化パラメーター:68℃で8分間、98℃で2分間、98℃で30秒間、57℃で30秒間、および72℃で1分間(4サイクル)、72℃で5分間。試料の浄化:試料DNAを50μlのAgencourt AMPure XPビーズ(Beckman Coulter P/N A63882)と結合させ、70%エタノールで2回洗浄し、37℃においてヒートブロック上で乾燥させ、20μlの水中にDNAを溶出する。
<第2の鎖の反応およびR2アダプター配列の挿入>
第2の鎖のランダムプライマー配列:5’−AGCTGTGCGTAGATGTGATCAAGAGACAGNNNN−3’(配列番号4)。反応設定(50μl):23μlの水、5μlのNEBuffer2(New England Biolabs P/N B7002S)、0.5μlのdNTP(Agilent Technologies P/N 200415−51)、0.5μlの第2の鎖のランダムプライマー(100μM)、20μlの第1の鎖の直鎖環状化DNAまたは20μlの断片状試料DNA、および変性後に加える1μlのエクソ(−)クレノウ断片(Agilent Technologiesバルク酵素50U/μl)。環状化パラメーター:95℃で2分間、4℃で15分間、4℃+1℃サイクル毎(32サイクル)、37℃で1時間および30分、70℃で10分間。試料の浄化:試料DNAを50μlのAgencourt AMPure XPビーズ(Beckman Coulter P/N A63882)と結合させ、70%エタノールで2回洗浄し、37℃においてヒートブロック上で乾燥させ、20μlの水中にDNAを溶出する。
<R1およびR2プライマーを使用した第2の鎖のDNAのPCR増幅>
フォワードR1プライマー:5’−GCTGACGTCGAGACTTGTGA−3’(配列番号3)、リバースR2プライマー:5’−CGGTGGAGCTGTGCGTAGATGTGATCAAGAGACAG−3’(配列番号5)。反応設定(50μl):18.25μlの水、10μlのHerculase II Fusion PCR反応用バッファー(Agilent Technologies P/N 600675−52)、0.5μlのdNTPそれぞれ200μM(Agilent Technologies P/N 200415−51)、それぞれ0.25μMのフォワードおよびリバースプライマー、1μlのHerculase II Fusion DNAポリメラーゼ(Agilent Technologies P/N 600672−51)、および20μlの第2の鎖のDNA。環状化パラメーター:98℃で2分間、98℃で30秒間、56℃で30秒間、および72℃で1分間(14サイクル)、72℃で5分間。試料の浄化:試料DNAを50μlのAgencourt AMPure XPビーズ(Beckman Coulter P/N A63882)と結合させ、70%エタノールで2回洗浄し、37℃においてヒートブロック上で乾燥させ、13μlの水中にDNAを溶出する。SureSelectQXT標的富化キット(Agilent Technologies P/N G9681B)を使用して標的富化を実施した。
<データの定義>
図5および6中の表は以下の情報を含む。Tn(ng)=それぞれ50μlDNAの断片化反応において使用した装着トランスポザーゼの量ng、第1の鎖のサイクル=第1の鎖のサイクルの数、維持された読み枠の%=フィルタリング後参照ゲノムにマッピングされる読み枠の割合、非マッピング読み枠の%=参照ゲノムにマッピングされない読み枠および低率の読み枠の割合、複製%=複製として示され特有ではないマッピング配列の割合、標的における%=捕捉用擬似ライブラリーまたはゲノムの標的領域に再度マッピングし位置合わせした読み枠の割合、倍率1倍、10倍、20倍=少なくとも1倍、10倍、または20倍の倍率で得た塩基の割合。高レベルの倍率では、それぞれの塩基は多数の位置合わせした配列読み枠に覆われ、したがって高レベルの信頼度でベースコール(base calls)を作製することができる。
[実施例1]
<肺腫瘍FFPEのDNA断片のタグ化−第1の鎖の合成サイクルおよびバーコード化>
ES配列の分子バーコード化によって第1の鎖の富化法を実施することができる。
方法:10ngのFFPE/FR DNA Input ClearSeq Comprehensive Cancer Panel、80万の読み枠、2×100の塩基、12のPre−hyb PCRサイクル。
シーケンシングの結果は図5中に要約する。4サイクルの第1の鎖の合成サイクルを使用した方法によって複雑性が改善し、複製%は低下し、標的における%は増大する。これによって、より良いシーケンシングの結果が生じることを実証する。
[実施例2]
<***腫瘍および胃腫瘍FFPEのDNA断片のタグ化−第1の鎖の合成サイクルなし、およびバーコード化なし>
方法:10ngのFFPE/FR DNA Input、ClearSeq Comprehensive Cancer Panel、80万の読み枠、2×100の塩基、12のPre−hyb PCRサイクル。
シーケンシングの結果は図6中に要約する。第1の鎖の合成サイクルなし、またはバーコード化を使用しない方法は高倍率を示す。
[実施形態]
本開示のある実施形態の非制限的な例を以下に与える。
1.本開示の幾つかの態様は、(a)アダプタータグ化断片を生成するために、150bp〜1.5Kbの平均長を有する二本鎖DNA断片を含む試料と、それぞれアダプターが装着された複数のトランスポザーゼデュプレックスとを接触させるステップと、ここで、アダプターが、トランスポザーゼ認識配列を含むデュプレックス領域と第1のプライマー配列を含む5’オーバーハング領域とを含み、(b)ランダムプライマー伸長産物を生成するために、ランダムプライマーを使用してアダプタータグ化断片にプライマー伸長反応を実施するステップと、ここで、ランダムプライマーが、ランダム3’配列と第2のプライマー配列とを含む5’配列を含み、(c)ポリメラーゼ連鎖反応(PCR)増幅産物を生成するために、その3’末端に第1のプライマー配列を含むフォワードプライマーと、その3’末端に第2のプライマー配列を含むリバースプライマーとを使用して、PCRにより(b)のランダムプライマー伸長産物を増幅するステップとを含む方法を含む。
2.ステップ(b)の前に、(i)5’オーバーハング領域を充填しアダプタータグ化断片のギャップを充填するために、アダプタータグ化断片に伸長または伸長/ライゲーション反応を実施するステップと、(ii)その3’末端に第1のプライマー配列を含む直鎖増幅プライマーを用いて少なくとも1回の直鎖増幅反応を実施するステップとをさらに含む、実施形態1に記載の方法。
3.ステップ(ii)が2〜30回の直鎖増幅反応を実施することを含む、実施形態2に記載の方法。
4.第1のプライマー配列が、第1のシーケンシングプライマー配列であり、フォワードプライマーが、第1のシーケンシングプライマー配列を含む5’テールを含み、またはアダプターが、第1のプライマー配列の下流に第1のシーケンシングプライマー配列をさらに含み、かつ、第2のプライマー配列が、第2のシーケンシングプライマー配列であり、リバースプライマーが、第2のシーケンシングプライマー配列を含む5’テールを含み、またはランダムプライマーが、第2のプライマー配列の下流に第2のシーケンシングプライマー配列をさらに含む、実施形態1に記載の方法。
5.第1および第2のシーケンシングプライマー配列が次世代シーケンシング用である、実施形態4に記載の方法。
6.アダプターが第1のシーケンシングプライマー配列の下流にバーコードをさらに含み、かつ/またはランダムプライマーが第2のシーケンシングプライマー配列の下流にバーコードをさらに含む、実施形態4に記載の方法。
7.アダプターおよび/またはランダムプライマー中のバーコードが試料特異的バーコードである、実施形態6に記載の方法。
8.アダプターおよび/またはランダムプライマー中のバーコードが縮重塩基領域(DBR)を含む、実施形態6に記載の方法。
9.試料中のDNA断片の少なくとも一部分に関する配列の読み枠を得るために、PCR増幅産物をシーケンシングするステップと、配列の読み枠をコンティグに構築するステップとをさらに含む、実施形態4から8のいずれか1実施形態に記載の方法。
10.DNA断片の試料を臨床試料から単離する、実施形態1に記載の方法。
11.臨床試料が体液から抽出した無細胞DNAである、実施形態10に記載の方法。
12.体液が血液である、実施形態11に記載の方法。
13.臨床試料がホルマリン固定されパラフィン包埋された(FFPE)試料である、実施形態10に記載の方法。
14.本開示の幾つかの態様は、(a)アダプタータグ化断片を生成するために、1kb未満の平均長を有する二本鎖DNA断片を含む試料とそれぞれアダプターが装着された複数のトランスポザーゼデュプレックスとを接触させるステップと、ここで、アダプターが、トランスポザーゼ認識配列を含むデュプレックス領域と、第1のプライマー配列を含む5’オーバーハング領域とを含み、(b)ターミナルトランスフェラーゼ活性を有する酵素を使用して、アダプタータグ化断片の上部鎖にオリゴ−dNテールを加えてテールアダプタータグ化断片を生成するステップと、(c)テールプライマー伸長産物を生成するために、テールプライマーを使用してテールアダプタータグ化断片にプライマー伸長反応を実施するステップと、ここで、テールプライマーが、オリゴ−dNテールとハイブリダイズする3’配列と、第2のプライマー配列を含む5’配列とを含み、(d)ポリメラーゼ連鎖反応(PCR)増幅産物を生成するために、その3’末端に第1のプライマー配列を含むフォワードプライマーと、その3’末端に第2のプライマー配列を含むリバースプライマーとを使用して、PCRにより(c)のテールプライマー伸長産物を増幅するステップとを含む方法を含む。
15.試料中のDNA断片の少なくとも一部分に関する配列の読み枠を得るためにPCR増幅産物をシーケンシングするステップと、配列の読み枠をコンティグに構築するステップとをさらに含む、実施形態14に記載の方法。
16.DNA断片の試料が臨床試料から単離されたものであり、臨床試料がホルマリン固定されパラフィン包埋された(FFPE)試料である、実施形態14に記載の方法。
17.本開示の幾つかの態様は、トランスポザーゼ認識配列を含むデュプレックス領域と第1のプライマー配列を含む5’オーバーハング領域とを含むアダプターがそれぞれ装着された複数のトランスポザーゼデュプレックス、ランダム3’配列と第2のプライマー配列を含む5’配列とを含むランダムプライマー、またはオリゴ−dNテールとハイブリダイズする3’配列および第2のプライマー配列を含む5’配列を含むテールプライマー、その3’末端に第1のプライマー配列を含むフォワードプライマー、その3’末端に第2のプライマー配列を含むリバースプライマー、および実施形態1または14に記載の方法を実施するための1つまたは複数の追加的試薬を含むキットを含む。

Claims (17)

  1. (a)アダプタータグ化断片を生成するために、150bp〜1.5Kbの平均長を有する二本鎖DNA断片を含む試料と、それぞれアダプターが装着された複数のトランスポザーゼデュプレックスとを接触させるステップと、ここで、アダプターが、トランスポザーゼ認識配列を含むデュプレックス領域と第1のプライマー配列を含む5’オーバーハング領域とを含み、
    (b)ランダムプライマー伸長産物を生成するために、ランダムプライマーを使用してアダプタータグ化断片にプライマー伸長反応を実施するステップと、ここで、ランダムプライマーが、ランダム3’配列と第2のプライマー配列とを含む5’配列を含み、および
    (c)ポリメラーゼ連鎖反応(PCR)増幅産物を生成するために、その3’末端に第1のプライマー配列を含むフォワードプライマーと、その3’末端に第2のプライマー配列を含むリバースプライマーとを使用して、PCRにより(b)のランダムプライマー伸長産物を増幅するステップと
    を含む方法。
  2. ステップ(b)の前に、
    (i)5’オーバーハング領域を充填しアダプタータグ化断片のギャップを充填するために、アダプタータグ化断片に伸長反応または伸長およびライゲーション反応を実施するステップと、
    (ii)その3’末端に第1のプライマー配列を含む直鎖増幅プライマーを用いて少なくとも1回の直鎖増幅反応を実施するステップと
    をさらに含む、請求項1に記載の方法。
  3. ステップ(ii)が2〜30回の直鎖増幅反応を実施することを含む、請求項2に記載の方法。
  4. 前記第1のプライマー配列が第1のシーケンシングプライマー配列であり、前記フォワードプライマーが第1のシーケンシングプライマー配列を含む5’テールを含み、または前記アダプターが前記第1のプライマー配列の下流に第1のシーケンシングプライマー配列をさらに含み、かつ
    前記第2のプライマー配列が第2のシーケンシングプライマー配列であり、前記リバースプライマーが第2のシーケンシングプライマー配列を含む5’テールを含み、または前記ランダムプライマーが前記第2のプライマー配列の下流に第2のシーケンシングプライマー配列をさらに含む、請求項1〜3のいずれか1項に記載の方法。
  5. 前記第1および第2のシーケンシングプライマー配列が次世代シーケンシング用である、請求項4に記載の方法。
  6. 前記アダプターが前記第1のシーケンシングプライマー配列の下流にバーコードをさらに含み、かつ/または
    前記ランダムプライマーが前記第2のシーケンシングプライマー配列の下流にバーコードをさらに含む、請求項4に記載の方法。
  7. 前記アダプターおよび/またはランダムプライマー中の前記バーコードが試料特異的バーコードである、請求項6に記載の方法。
  8. 前記アダプターおよび/またはランダムプライマー中の前記バーコードが縮重塩基領域(DBR)を含む、請求項6に記載の方法。
  9. 試料中のDNA断片の少なくとも一部分に関する配列の読み枠を得るために、PCR増幅産物をシーケンシングするステップと、配列の読み枠をコンティグに構築するステップとをさらに含む、請求項4〜8のいずれか1項に記載の方法。
  10. 前記DNA断片の試料を臨床試料から単離する、請求項1〜9のいずれか1項に記載の方法。
  11. 前記臨床試料が体液から抽出した無細胞DNAである、請求項10に記載の方法。
  12. 前記体液が血液である、請求項11に記載の方法。
  13. 前記臨床試料がホルマリン固定されパラフィン包埋された(FFPE)試料である、請求項10に記載の方法。
  14. (a)アダプタータグ化断片を生成するために、1kb未満の平均長を有する二本鎖DNA断片を含む試料とそれぞれアダプターが装着された複数のトランスポザーゼデュプレックスとを接触させるステップと、ここで、アダプターが、トランスポザーゼ認識配列を含むデュプレックス領域と、第1のプライマー配列を含む5’オーバーハング領域とを含み、
    (b)ターミナルトランスフェラーゼ活性を有する酵素を使用して、アダプタータグ化断片の上部鎖にオリゴ−dNテールを加えてテールアダプタータグ化断片を生成するステップと、ここで、前記上部鎖は、アダプタータグ化断片のうち、5’オーバーハング領域を有する方の鎖であり、
    (c)テールプライマー伸長産物を生成するために、テールプライマーを使用してテールアダプタータグ化断片にプライマー伸長反応を実施するステップと、ここで、テールプライマーが、オリゴ−dNテールとハイブリダイズする3’配列と、第2のプライマー配列を含む5’配列とを含み、および
    (d)ポリメラーゼ連鎖反応(PCR)増幅産物を生成するために、その3’末端に第1のプライマー配列を含むフォワードプライマーと、その3’末端に第2のプライマー配列を含むリバースプライマーとを使用して、PCRにより(c)のテールプライマー伸長産物を増幅するステップと
    を含む方法。
  15. 試料中のDNA断片の少なくとも一部分に関する配列の読み枠を得るためにPCR増幅産物をシーケンシングするステップと、配列の読み枠をコンティグに構築するステップとをさらに含む、請求項14に記載の方法。
  16. DNA断片の試料が臨床試料から単離されたものであり、臨床試料がホルマリン固定されパラフィン包埋された(FFPE)試料である、請求項14または15に記載の方法。
  17. トランスポザーゼ認識配列を含むデュプレックス領域と、第1のプライマー配列を含む5’オーバーハング領域とを含むアダプターが、それぞれ装着された複数のトランスポザーゼデュプレックス、
    ランダム3’配列と第2のプライマー配列を含む5’配列とを含むランダムプライマー、またはオリゴ−dNテールとハイブリダイズする3’配列および第2のプライマー配列を含む5’配列を含むテールプライマー、
    その3’末端に前記第1のプライマー配列を含むフォワードプライマー、
    その3’末端に前記第2のプライマー配列を含むリバースプライマー、および
    請求項1または14に記載の方法を実施するための1つまたは複数の追加的試薬を含むキット。
JP2018561978A 2016-05-27 2017-04-18 トランスポザーゼランダムプライミング法によるdna試料の調製 Active JP6924779B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/167,823 2016-05-27
US15/167,823 US10240196B2 (en) 2016-05-27 2016-05-27 Transposase-random priming DNA sample preparation
PCT/US2017/028200 WO2017204940A1 (en) 2016-05-27 2017-04-18 Transposase-random priming dna sample preparation

Publications (2)

Publication Number Publication Date
JP2019517250A JP2019517250A (ja) 2019-06-24
JP6924779B2 true JP6924779B2 (ja) 2021-08-25

Family

ID=60411835

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018561978A Active JP6924779B2 (ja) 2016-05-27 2017-04-18 トランスポザーゼランダムプライミング法によるdna試料の調製

Country Status (5)

Country Link
US (2) US10240196B2 (ja)
EP (1) EP3464575A4 (ja)
JP (1) JP6924779B2 (ja)
CN (1) CN109196096A (ja)
WO (1) WO2017204940A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL266197B2 (en) 2016-10-24 2024-03-01 Geneinfosec Inc Hiding information contained within nucleic acids
CN112272710A (zh) 2018-05-03 2021-01-26 贝克顿迪金森公司 高通量多组学样品分析
WO2019217486A1 (en) * 2018-05-08 2019-11-14 Memorial Sloan Kettering Cancer Center Methods and compositions for detecting myeloma
WO2019222688A1 (en) * 2018-05-17 2019-11-21 Illumina, Inc. High-throughput single-cell sequencing with reduced amplification bias
US20220298545A1 (en) * 2019-08-19 2022-09-22 Universal Sequencing Technology Corporation Methods and Compositions for Tracking Nucleic Acid Fragment Origin for Nucleic Acid Sequencing
WO2021232184A1 (zh) * 2020-05-18 2021-11-25 深圳华大智造科技有限公司 标签化的转座复合体及其在高通量测序中的应用

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5981179A (en) 1991-11-14 1999-11-09 Digene Diagnostics, Inc. Continuous amplification reaction
US5604097A (en) 1994-10-13 1997-02-18 Spectragen, Inc. Methods for sorting polynucleotides using oligonucleotide tags
US6458530B1 (en) 1996-04-04 2002-10-01 Affymetrix Inc. Selecting tag nucleic acids
US5948902A (en) 1997-11-20 1999-09-07 South Alabama Medical Science Foundation Antisense oligonucleotides to human serine/threonine protein phosphatase genes
EP2164985A4 (en) 2007-06-01 2014-05-14 454 Life Sciences Corp SYSTEM AND METHOD FOR IDENTIFYING INDIVIDUAL SAMPLES FROM A MULTIPLEX MIXTURE
EP3272879B1 (en) * 2008-10-24 2019-08-07 Epicentre Technologies Corporation Transposon end compositions and methods for modifying nucleic acids
US9080211B2 (en) 2008-10-24 2015-07-14 Epicentre Technologies Corporation Transposon end compositions and methods for modifying nucleic acids
US20100323348A1 (en) 2009-01-31 2010-12-23 The Regents Of The University Of Colorado, A Body Corporate Methods and Compositions for Using Error-Detecting and/or Error-Correcting Barcodes in Nucleic Acid Amplification Process
US9074251B2 (en) 2011-02-10 2015-07-07 Illumina, Inc. Linking sequence reads using paired code tags
EP2670894B1 (en) * 2011-02-02 2017-11-29 University Of Washington Through Its Center For Commercialization Massively parallel continguity mapping
WO2013020089A2 (en) * 2011-08-04 2013-02-07 Sage Science, Inc. Systems and methods for processing fluids
US20160153039A1 (en) * 2012-01-26 2016-06-02 Nugen Technologies, Inc. Compositions and methods for targeted nucleic acid sequence enrichment and high efficiency library generation
SG11201504334WA (en) * 2012-12-10 2015-07-30 Resolution Bioscience Inc Methods for targeted genomic analysis
EP2971097B1 (en) * 2013-03-15 2018-08-01 Verinata Health, Inc Generating cell-free dna libraries directly from blood
US20150051088A1 (en) * 2013-08-19 2015-02-19 Abbott Molecular Inc. Next-generation sequencing libraries
EP3066114B1 (en) 2013-11-07 2019-11-13 Agilent Technologies, Inc. Plurality of transposase adapters for dna manipulations
JP6366719B2 (ja) 2013-12-20 2018-08-01 イルミナ インコーポレイテッド 断片化したゲノムdna試料におけるゲノム連結性情報の保存
CN105899683A (zh) 2014-01-14 2016-08-24 凯杰有限公司 带标签dna片段的产生
EP3102691B1 (en) 2014-02-03 2019-09-11 Thermo Fisher Scientific Baltics UAB Method for controlled dna fragmentation
CN106661561B (zh) 2014-06-30 2020-10-30 亿明达股份有限公司 使用单侧转座的方法和组合物
WO2016033251A2 (en) * 2014-08-26 2016-03-03 Nugen Technologies, Inc. Compositions and methods for targeted nucleic acid sequence enrichment and high efficiency library generation
US11661597B2 (en) 2015-04-15 2023-05-30 The Board Of Trustees Of The Leland Stanford Junior University Robust quantification of single molecules in next-generation sequencing using non-random combinatorial oligonucleotide barcodes
CN107580632B (zh) 2015-04-23 2021-12-28 贝克顿迪金森公司 用于全转录组扩增的方法和组合物
WO2016191618A1 (en) * 2015-05-27 2016-12-01 Jianbiao Zheng Methods of inserting molecular barcodes
US20170175182A1 (en) * 2015-12-18 2017-06-22 Agilent Technologies, Inc. Transposase-mediated barcoding of fragmented dna

Also Published As

Publication number Publication date
JP2019517250A (ja) 2019-06-24
EP3464575A1 (en) 2019-04-10
WO2017204940A1 (en) 2017-11-30
US10240196B2 (en) 2019-03-26
USRE49207E1 (en) 2022-09-13
EP3464575A4 (en) 2020-01-01
CN109196096A (zh) 2019-01-11
US20170342483A1 (en) 2017-11-30

Similar Documents

Publication Publication Date Title
CN110191961B (zh) 制备经不对称标签化的测序文库的方法
US11085072B2 (en) Methods of generating libraries of nucleic acid sequences for detection via fluorescent in situ sequencing
US20220073909A1 (en) Methods and compositions for rapid nucleic library preparation
CN110036118B (zh) 用于识别核酸分子的组合物和方法
JP6924779B2 (ja) トランスポザーゼランダムプライミング法によるdna試料の調製
US11535889B2 (en) Use of transposase and Y adapters to fragment and tag DNA
JP6525473B2 (ja) 複製物配列決定リードを同定するための組成物および方法
JP6803327B2 (ja) 標的化されたシークエンシングからのデジタル測定値
RU2565550C2 (ru) Прямой захват, амплификация и секвенирование днк-мишени с использованием иммобилизированных праймеров
US10988795B2 (en) Synthesis of double-stranded nucleic acids
CN110777195A (zh) 采用一组snp的人身份识别
US20190169603A1 (en) Compositions and Methods for Labeling Target Nucleic Acid Molecules
US20120122161A1 (en) Sorting Asymmetrically Tagged Nucleic Acids by Selective Primer Extension
US20170175182A1 (en) Transposase-mediated barcoding of fragmented dna
JP2021514651A (ja) 単一分子配列決定のための一本鎖環状dna鋳型の作成
JP2017507663A (ja) コピー数が保持されるrna分析法
US20180305683A1 (en) Multiplexed tagmentation
CN109983125B (zh) 生成用于通过荧光原位测序检测的核酸序列文库的方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200406

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210323

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210623

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210706

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210802

R150 Certificate of patent or registration of utility model

Ref document number: 6924779

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150