JP2022548000A - シーケンシングライブラリーの多重製造方法 - Google Patents

シーケンシングライブラリーの多重製造方法 Download PDF

Info

Publication number
JP2022548000A
JP2022548000A JP2022515938A JP2022515938A JP2022548000A JP 2022548000 A JP2022548000 A JP 2022548000A JP 2022515938 A JP2022515938 A JP 2022515938A JP 2022515938 A JP2022515938 A JP 2022515938A JP 2022548000 A JP2022548000 A JP 2022548000A
Authority
JP
Japan
Prior art keywords
sequence
target
primer
amplification
library
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022515938A
Other languages
English (en)
Inventor
キャンベル,ネイサン
Original Assignee
パランカ・リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by パランカ・リミテッド filed Critical パランカ・リミテッド
Publication of JP2022548000A publication Critical patent/JP2022548000A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Immunology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

標的化次世代シーケンシングに使用される多重増幅によるライブラリー構築物のライブラリーの製造方法を記載する。該製造方法は、(a)(i)複数の異なる標的配列、(ii)複数の標的捕捉プライマーペアおよび(iii)1以上のタグ付けプライマーペアを含む反応容器を準備する工程、(b)標的配列を増幅すること、第1または第2リード配列を含む標的配列を生成すること、およびライブラリー構築物を含む反応産物を得ることが連続的に達成されるように構成された連続的アニーリング温度での増幅の連続的ラウンドを行う工程、ならびに(c)反応産物から構築物のライブラリーを捕捉する工程を含む。フォワードおよびリバースタグ付けプライマーの1つは5’末端に精製標識を含み、限界濃度で提供され、それにより、ライブラリー構築物は、ただ1つのインデックス化配列とただ1つのアダプター配列とを含有する多くの部分構築物、ならびに第1および第2インデックス化配列と第1および第2アダプター配列と精製標識とを含有する限られた数の完全(全)構築物を含む。捕捉工程は、精製標識を使用して、反応産物から完全(全)構築物を捕捉することを含む。【選択図】図1

Description

本発明は、標的化次世代シーケンシング(標的化次世代配列決定)に使用されるライブラリーの製造の多重(マルチプレックス)増幅方法に関する。また、多重増幅を含む標的化次世代シーケンシングの方法も想定される。
シーケンシング(配列決定)による標的化遺伝子型決定(GBS)は、ハイスループット次世代シーケンシングの実施のために、インデックス化(indexed)およびアダプター連結多重増幅産物を単一ライブラリーサンプル内にプールすることを含む。このシーケンシングデータから、個々の遺伝子型プロファイルを抽出し、逆多重化(demultiplexing)と対立遺伝子カウントとを含むバイオインフォマティクス手段により収集する。オープンソースおよび商業用の両方の、この主要方法の幾つかの変法が存在する(Eureka and AgriSeq Thermofisher,Nugen Allegro,Keygene SNPselect,LGC SeqSNP,AgriPlex Genomics PlexSeq)。オープンソース法は、しばしば、富化および実際のライブラリー製造の両方における酵素的増幅に基づく。
標的化GBS法のための社内ワークフローの開発は、以下のとおり、以下のプロセスに分けられうる。
1.標的特異的多重増幅、
2.サンプルのインデックス化(indexing)、シーケンシングプライマーおよびアダプターの添加、
3.正規化およびサイズ選択、
4.QCおよび最終ライブラリープール化、
5.次世代シーケンシング、
6.データ分析。
前記の全ての方法において、標的増幅およびライブラリー製造は複数の工程(工程1~4)で行われる。最初の反応はパネル内の全標的の多重増幅である。同じ増幅反応に多数の標的が存在すると、非特異的結合およびプライマー二量体形成による問題が生じうる。したがって、効率的に機能するアッセイパネルを実現するには、問題のある配列を回避するために、プライマー設計工程において初期反応の多重性を考慮する必要がある。最終的なパネルは、プロセスの反復を小規模で試験することによって微調整される。通常、増幅に基づく方法(GT-Seq、MonsterPlex、Hi-plex、PlexSeq)により、約500までの多重化レベルが報告される。MonsterPlex(文献においては、Hi-Plexに類似しているものとして参照されている)は、最初の実施時にマーカーの約85~90%が機能するという予想を示す。これらのライブラリーは、良好な有効範囲(カバレッジ)を得るために、サンプル当たり約500Kのリード(read)で、高深度でシーケンシングされる。Hi-Plex法は同様に増幅に基づくものであり、最大1000のプレックス(plexing)レベルを主張している(Nguyen-Dumontら,2013、Nguyen-Dumontら,2015、Popeら,2018、Hammetら,2019)。Hi-Plexは、2つの増幅工程を組合せることを目的とした唯一の方法である。インデックス化/アダプター導入プライマーは最初の増幅の後で多重化反応にスパイクされる。したがって、この方法はサンプルプレートの開口および再密閉を尚も要する。主要プロセスにおいて該著者が挙げた重要な側面は、高忠実度Taq酵素、ある範囲の標的が同時に増幅されることを可能にする許容初期増幅条件、およびそれに続く、標的特異的プライマーにより付加された尾部に対する大量の増幅、ならびに完全なプライミングおよび伸長を可能にする比較的長いサイクルである。60プレックスパネルに関して最初に公開された方法は、いわゆる短い架橋(ショートブリッジ)プライマーの別のセットを該マルチプレックスに添加することにより、1003プレックスを達成するために更に開発された。この場合、標的特異的増幅混合物は、標的特異的プライマーにより付加された尾部の一部に相補的な2つのより短いプライマーを含有する。増幅の大部分は、標的特異的および架橋プライマーを使用して最初の部分において行われる。インデックス化プライマーは最後の4サイクルまでは混合物に添加されない。これはそれらの初期60プレックス法とは異なる。該初期60プレックス法は、短い架橋プライマーを使用せず、この場合、インデックス化プライマーが添加された後で増幅の大部分が生じた。Hammetら(2019)の最近の刊行物は、オンターゲット増幅を改善するための、Hi-Plex法に関する更なる更新を記載している。この更新された方法においては、標的特異的およびタグ付けプライマーを使用する最初の2工程の増幅はより少数のサイクルを有し、ついでサイズ選択の後、構築ライブラリーを増幅するために別の増幅に進むが、サンプルプレートの開口および再密閉を尚も要する。短い汎用架橋プライマーはもはや使用されない。以前の方法と本方法との間のHammetの比較は、より低いプレックスレベル(300未満)で同様の効果を示しているが、より高い標的数では、該更新方法は能力の改善を示す。
標的プライマー間の一貫したアニーリングは、幾つかの標的をより均等に同時に増幅するために最も重要である。GT-Seq法は、全てのHi-plex形態に共通の単一温度でのより長いサイクルではなく、95℃から57℃への緩い勾配を含めることにより、これに対処して、10個の増幅サイクルで、より正確なアニーリングを可能にする。Chenら(2016)は、制限されたプライマー利用可能性を用いることにより増幅を均一にするための別の方法を記載しており、更なるプライマーを添加することなく、多重増幅産物が第2増幅工程における標的として使用される。この反応は、インデックス化に進む前に、利用可能な全てのプライマーを使い切るように実施され、より正規化された出力が得られるはずである(著者はこの方法を3ラウンド増幅と称している)。第3の増幅反応の導入は理想的ではないが、該マルチプレックスにおける適切なプライマー利用可能性の検証は有用でありうる。Hi-plexと同様に、GT-SeqおよびMonsterplex法は高価なTaq酵素を使用する。
1回のシーケンシングの実施のために複数のサンプルを一緒にプールすることを可能にするためには、各サンプルはユニーク(一意的)な標識を要する。これはDNAサンプルの両端または一方の末端のみにおける短い配列(例えば、6または8マー)のユニークな組合せにより行われうる。数千または数万個の個体が同一インデックス化実施においてシーケンシングされることを可能にするためには、体系的なインデックス化アプローチが必要である。例えば、一方のインデックスはウェル位置を示し、他方のインデックスはプレートを示す。この高密度サンプルプール化は、96ウェルまたは384ウェルに特異的なインデックスを異なるプレートインデックスと組合せて再利用することにより達成されうる。増幅に基づく標的化GBS法においては、一般的な尾部配列を含有する標的特異的多重プライマーによりインデックス化が可能となり、フォワードプライマーは、リバースプライマーにより共有される尾部とは異なる、同一尾部配列を共有する。ついで、これらの尾部は、シーケンシングアダプターおよびユニークインデックスを付加するプライマーにより行われる第2増幅工程において標的化される。更に、標的特異的プライマーにより導入される一般的な尾部はシーケンシング反応においてシーケンシングプライマー標的として機能する。第2増幅工程の後、多重化標的を含有するサンプル特異的ライブラリーが得られる。
これらの2つの反応を互いに連結するプロセスは様々でありうる。既に記載されているChenら(2016)と同様に、標的特異的プライマーの全てを使い果たすために、これら2つの間に増幅工程を含めることが可能である。GT-Seqにおいては、多重化反応からの増幅産物を、希釈後、新たなプレート上の第2のインデックス/アダプター添加増幅における標的として利用する。Hi-Plex法は、異なるアプローチを用いる。インデックス化プライマーは最初の増幅プレートに直接添加される。中間の希釈工程はない。この反応は、最初の増幅の準備において添加された酵素混合物を使用し、このアプローチは試薬とプレートとの両方を節約する。該プレートは穿孔または剥離、および更に再密閉を尚も要する。最終工程は、サンプルの汚染のリスクゆえに、ハイスループット適用においては困難でありうる。水浴に基づく熱サイクルを用いる場合には特にそうである。GB2536446は、逆相補(reverse complement)PCR(RC-PCR)により標的配列のアンプリコン構築物を生成する単一閉管(closed tube)PCR法を記載している。この方法は、(a)汎用(ユニバーサル)配列、およびその5’末端における又は5’末端側の標的特異的配列であって、標的配列の3’末端の1つにおける又はそれに隣接する配列の逆相補体にハイブリダイズしうるもの、ならびに(b)オリゴヌクレオチドプローブの汎用配列にハイブリダイズしうる配列を3’末端に含む汎用プライマーを使用する。このプロセスの重要な要素の1つは、それが正規化工程を含まず、代わりに、標的増幅+アダプター添加のための完全長オリゴを生成する場合の最初の工程におけるRC-PCR法においてブロッキング基を使用することであり、これは、完全長オリゴが生成するまで、標的特異的オリゴが結合しないことを妨げる。これは標的の均一化に役立ちうるが、該方法における正規化の欠如は、シーケンシング中にサンプルの幾つかがその他のサンプルを圧倒することをもたらし、多くのデータを使い果たすであろう。これは、この方法が適切に処理しうる標的の数を著しく制限する。Nimagenのウェブサイト(https://www.nimagen.com/applications/greenotype)を参照すると、この方法(GREENOTYPE RC-PCR)はせいぜい100個の標的の遺伝子型決定用に販売されており、一方、別の方法(GREENOTYPE MIP CAPTURE)はより高い処理量(最大5000個の標的)のために販売されている。したがって、GB2536446に開示されているRC-PCR法は、多数の標的を処理するのには適さない。
Meldgaardら(Clinica Chimica Acta,Vol.413;No.19(2012)およびWO2017/044100(Insilixa Inc.)は共に、プリントアレイまたはビーズ上に捕捉される一本鎖産物を製造するために非対称PCRを使用し、ついでフローサイトマーでの分析を行う標的増幅およびライブラリー製造の方法を記載している。各セットにおける2つのプライマーの1つが過剰に存在し、制限プライマーが使い果たされると、一本鎖産物が産生される。一本鎖産物は指数関数的ではなく直線的に増幅される。これらの例の両方において、最終目標は、ハイブリダイゼーションによって後に捕捉されうるこれらの一本鎖産物を製造することである。いずれの方法も標的化ハイスループット(NGS)シーケンシングおよびサンプルプール化に適していない。
Bybeeら(Genome Biology and Evolution,Vol.3,1 January 2011)は、同時に実施されうるサンプルの数を制限するRoche454シーケンシングと共に単一インラインバーコードを使用する多重PCR法による配列のライブラリーの作製方法を記載している。この方法は、第2PCR工程のために第2容器内に第1反応産物をアリコート化する前に、第1容器における第1PCR反応を要する。該2工程PCR法は手間と時間がかかり、容器間で産物を移動させる必要があるため、サンプル間の交差汚染のリスクが生じる。この方法は、Roche454シーケンシングに必要なエマルジョンPCR工程の一部としてのビーズ固定化の工程を含む。この方法においては、各個のサンプルを、ピコグリーンを使用して定量し、ついで液体処理ロボットを使用して正規化するが、これは長時間および高い費用を要する。
前記の問題の少なくとも1つを克服することが本発明の目的である。
発明の概括
本発明は、多重増幅による標的化ハイスループットシーケンシングに使用されるライブラリー構築物の単一閉管内製造方法を提供し、この場合、更なる成分を加えるために管(チューブ)を再び開く必要がない。本発明はまた、正規化における構成(ビルド)を有し、その結果、別個の正規化工程は不要である。図1を参照すると、該方法は、サンプルにおける各標的に特異的な標的捕捉プライマーペアと、該サンプルに特異的なタグ付けプライマーペアとを使用する。各標的捕捉プライマーペアは、標的特異的配列およびリード(read;読み取り)配列を含むフォワードプライマーおよびリバースプライマーを含み、ここで、標的特異的配列は、標的に隣接する位置において鋳型核酸に結合するように構成されている(工程1)。タグ付けプライマーペアは、アダプター配列(P5、P7)と、インデックス化配列(xxxxx)と、リード配列に結合する配列(リード配列プライマー部位)とをそれぞれが有するフォワードタグ付けプライマーおよびリバースタグ付けプライマーを含む(工程2)。最初の増幅工程(図1(1))は、リード配列(R1およびR2)に隣接する標的配列を含有する中間構築物を生成する。後続の増幅工程(図1(2))において、リード配列プライマー配列がリード配列にアニーリングすることにより、タグ付けプライマーが該中間構築物に結合する。本発明の方法においては、タグ付けプライマーの1つは限界濃度で提供され、精製タグ(B)をも含み、これは、部分構築物および完全構築物を含有する反応産物を与える(図1(3))。部分構築物は標的配列を含むが、1つのアダプター配列(P5)および1つのインデックス配列(xxxxx)のみを含む。一方、完全構築物は標的配列、第1および第2アダプター配列(P5、P7)、ならびに第1および第2インデックス配列(xxxxx)、ならびに精製タグを含む。タグ付けプライマーの1つ(図の場合はリバースタグ付けプライマー)の制限量の使用ゆえに、反応産物は完全構築物に対して過剰な部分構築物を含有し、その結果、各個の反応は、広範囲の鋳型DNAにわたって、比較的等しい存在量で、ほぼ同じ量の各標的化遺伝子座を含有する完全なシーケンシング構築物を生成する(すなわち、自己正規化)。図1において、リード配列R1、R2、およびアダプター配列P5、P7は例示のみを目的としており、当業者に公知の任意のリード配列、インデックス化配列およびアダプター配列が使用されうると理解されるべきである。
本発明の方法では、標的捕捉、インデックス化およびアダプター添加を、反応容器を開くことなく、同じ反応容器内で行い、ついで、精製標識を使用してライブラリー捕捉を行う。増幅反応後、精製標識(図1の例ではビオチン)を使用して達成される完全ライブラリー構築物の捕捉および精製により、数千の個々の反応から、サンプルを一緒にプールすることが可能である。各反応における第1および第2インデックス配列(例えば、i5およびi7バーコード配列)のユニークな組合せは、交差汚染のリスクを伴うことなく、多重増幅後の全てのサンプルのプールを可能にする。標的特異的プライマーの数が、所望のアッセイパネルに応じて変動しうる場合、反応当たり僅か2つのユニークタグ付けプライマーが必要であるに過ぎない。最初の増幅は、所望のゲノムDNA部位を増幅する標的捕捉プライマーを使用して行う。最初の2ラウンドの増幅の後、タグ付けプライマーに対する部分的結合部位が生成され、それらは、それらの相補体に対するアニーリングを開始しうる。次の数サイクルで、タグ付けプライマーに対する完全長相補体が生成され、これが生じたら、残りの反応は、タグ付けプライマーの完全プライミング部位を反映して、より高いアニーリング温度で行われる。本発明の方法は複数(例えば、最大200,000個)のサンプルの多重増幅に適用可能であり、この場合、各サンプルは数千個の標的配列(例えば、SNP)を含み、それらの全ては単一閉管内で行われうる。例えば50個の標的配列を含有するサンプルの場合、該方法は50個の標的特異的プライマーペアおよび1個のタグ付けプライマーペア(サンプルに特異的)を使用する。該方法を複数のサンプル、例えば、50個の標的配列をそれぞれが有する500個のサンプルに適用する場合、該方法は50×500個の標的特異的プライマーペアおよび50個のタグ付けプライマーペア(サンプルに1つ)を使用する。増幅はポリメラーゼ連鎖反応(PCR)または他の酵素的核酸増幅技術により行われうる。
Bybeeらの方法と比較して、本発明の方法は、標的捕捉プライマーペアおよびタグ付けプライマーペアが同一反応容器内に含有され、増幅工程の最初から増幅工程中にかけて同時に一緒にインキュベートされることを可能にする。これは処理を加速し簡素化し、交差汚染のリスクを低減する。そのような交差汚染は、最初のPCR工程の反応産物を第2のPCR工程のための第2の反応容器内へのアリコート化の前に洗浄する必要があるBybeeのような2工程PCR法に固有の問題である。また、本発明の方法に自己正規化工程を含めることにより、各サンプルが個別に定量化され次いで液体処理ロボットの使用によって正規化される必要(これは長時間および高い費用を要する)がなくなる。
GB2536446の方法と比較して、本発明の方法に自己正規化工程を含めることは低スループットの問題を克服し、複数のサンプルからの数百または数千個の標的を単一容器内で1回の実施で多重増幅することを可能にし、これは、異なる濃度または品質の標的DNAを含有する異なるサンプルに無関係に、標的の均一性を損なうことなく達成される。
第1の態様においては、本発明は、標的化ハイスループットシーケンシングに使用される多重増幅によるライブラリー構築物の製造方法を提供し、該製造方法は、
(a)(i)複数の異なる標的配列を含む少なくとも1つのサンプル、
(ii)前記の少なくとも1つのサンプルのための複数の標的捕捉プライマーペア(ここで、各標的捕捉プライマーペアは、5’から3’の方向に第1リード配列および標的特異的配列を含むフォワードプライマーと、5’から3’の方向に第2リード配列および標的特異的配列を含むリバースプライマーとを含む)、
(iii)5’から3’の方向に第1アダプター配列、第1インデックス化配列および第1リード配列プライマー部位を含むフォワードタグ付けプライマーと、5’から3’の方向に第2アダプター配列、第2インデックス化配列および第2リード配列プライマー部位を含むリバースタグ付けプライマーとを含む、前記の少なくとも1つのサンプルのためのタグ付けプライマーペア
を含む第1反応容器を準備する工程、
(b)標的配列を増幅すること、第1リード配列と第2リード配列とを含む標的配列を生成すること、およびアダプター連結ライブラリー構築物を含む反応産物を得ることが達成されるように構成された、連続的アニーリング温度での増幅の連続的ラウンドを連続的に行う工程、ならびに
(c)反応産物からアダプター連結ライブラリー構築物を捕捉する工程
を含み、
フォワードおよびリバースタグ付けプライマーの1つは5’末端に精製標識を含み、限界濃度で提供され、それにより、アダプター連結構築物のライブラリーは、
第1および第2インデックス化配列の1つのみと、第1および第2アダプター配列の1つのみとを含有する部分構築物、ならびに
第1および第2インデックス化配列と、第1および第2アダプター配列と、精製標識とを含む完全構築物
を含むことを特徴とし、
ここで、反応産物は、完全構築物に対して過剰の部分構築物を含み、工程(c)は、精製標識を含む完全構築物のみを捕捉することを含む。
典型的には、反応産物からの完全ライブラリー構築物の単離(捕捉)は、反応産物を、精製標識に対するリガンドを含む支持体と接触させることを含む。
サンプルは、標的配列を含む核酸からなる、または該核酸を含む。一般に、サンプルはDNAである。標的配列は、一般に、配列変異、例えば一塩基多型(SNP)または短いインデルである。
捕捉工程は、典型的には、反応産物を、精製標識に対するリガンドを含む支持体と反応させることを含む。精製標識はビオチンであることが可能であり、支持体はストレプトアビジン(例えば、ストレプトアビジンビーズ)を含みうる。他の精製標識および捕捉リガンドも使用可能であり、その詳細は当業者に公知であろう。
完全ライブラリー構築物を後続のハイスループットシーケンシングのために支持体から遊離させることが可能であり、またはそれを、支持体に尚も結合したまま、多重増幅工程において増幅して増幅産物を得、ついでこれを、ハイスループットシーケンシングを用いてシーケンシングすることが可能である。1つの実施形態においては、複数の増幅サイクルを行い、増幅産物を、典型的には、単離支持体から分離する。
一般に、工程(a)および(b)は、典型的には、該工程が行われるまで容器を開くことなく、閉じた容器(例えば、管(チューブ))において行われる。
増幅工程の熱サイクルは、標的配列を増幅すること、第1リード配列と第2リード配列とを含む標的配列を生成すること、およびアダプター連結ライブラリー構築物を含む反応産物を得ることが連続的に達成されるように構成される。イルミナ(Illumina)R1およびR2リード配列ならびにi5およびi7インデックス化配列を使用する記載されている実施形態においては、熱サイクルは増幅の初期、中間および最終ラウンドを用い、ここで、アニーリング温度を次第に増加させる。異なる供給源のリード配列およびインデックス化配列を使用する場合には、異なる熱サイクルプロトコルを使用しうると理解される。イルミナのリード配列およびインデックス化配列の使用は例示的なものであり、本出願の範囲を限定するものではない。
したがって、例えば、連続的アニーリング温度での増幅の連続的ラウンドは、
(i)第1アニーリング温度の反応容器内の1以上の初期ラウンドの増幅を行うこと、
(ii)第1リード配列と第2リード配列とを含む標的配列を生成するように構成された第2アニーリング温度の反応容器内の1以上の中間ラウンドの増幅を行うこと、および
(iii)部分構築物と完全構築物とを含むライブラリー構築物のライブラリーを含む反応産物を得るように構成された第3アニーリング温度の反応容器内の1以上の最終ラウンドの増幅を行うこと
を含みうる。
一般に、第2アニーリング温度は第1アニーリング温度より高く、第3アニーリング温度は第2アニーリング温度より高い。しかし、状況に応じて、異なる連続的アニーリング温度が用いられうる。
1つの実施形態においては、第1アニーリング温度は62℃ +/- 5℃であり、第2アニーリング温度は67℃ +/- 5℃であり、第3アニーリング温度は72℃ +/- 5℃である。
1つの実施形態においては、増幅の連続的ラウンドは1~5回の初期ラウンド(好ましくは1~3または2ラウンド)の増幅、1~5回の中間ラウンド(好ましくは2~4または3ラウンド)の増幅、および少なくとも10回(例えば10~50回)の最終ラウンドの増幅を含む。
1つの実施形態においては、精製標識はビオチンであり、単離工程は、反応産物をストレプトアビジンビーズと反応させることを含む。
1つの実施形態においては、工程(a)および(b)を複数のサンプルに対して行い、ここで、異なるサンプルの反応産物をプールし、プールされた反応産物に対して捕捉/単離工程(c)を行う。1つの実施形態においては、工程(a)および(b)を、2~2000,000個のサンプル、例えば、少なくとも100、1000、10,000、20,000、50,000、100,000、150,000または2000,000個のサンプルに対して行い、ついでプールする。1つの実施形態においては、工程(a)および(b)をマイクロタイタープレートのウェル内で行う。1つの実施形態においては、各サンプルは1~10,000個の標的配列、例えば、少なくとも10、50、100、500、1,000、2,000、3,000、4,000、5,000、6,000、7,000、8,000、9,000または10,000個の標的配列を含む。
増幅は、一般に、ポリメラーゼ連鎖反応(PCR)により行われる。標的配列に対してPCRを行うためには追加的な試薬が必要であり、それらの試薬は、用いるPCRのタイプに左右されると理解される。例えば、PCRを行うために、本発明の方法は熱安定性DNAポリメラーゼ(例えば、Taqポリメラーゼ)、および4つ全てのデオキシリボヌクレオチド(dATP、dTTP、cCTP、cGTP)を使用する。
もう1つの態様においては、本発明は、
本発明の方法により完全構築物のライブラリーを準備する工程、
および
完全構築物のライブラリーに対してハイスループットシーケンシングを行う工程
を含む、標的化ハイスループットシーケンシングの方法を提供する。
好ましい実施形態においては、ハイスループットシーケンシングは次世代シーケンシング技術である。一例はイルミナ色素シーケンシングであり、この場合、アダプター配列(および典型的には標的プライマーペアおよびタグ付けプライマーペア)はイルミナ色素シーケンシング用に構成される。
1つの実施形態においては、ハイスループットシーケンシングは少なくとも30%、40%、50%または60%のオンターゲット率を有する。
本発明の方法は、医学的、診断的または商業的目的のために、サンプルを遺伝子型決定するために使用されうる。1つの実施形態においては、本発明の方法は、食品、例えば、肉、魚、狩猟肉、野菜、豆類、穀物または果物製品の起源または正体を遺伝的に確認するために使用されうる。
もう1つの態様においては、本発明は、1以上のサンプルの標的化ハイスループットシーケンシングにおける使用に適した多重増幅によりライブラリー構築物を製造するためのキットを提供し、キットは各サンプル用のタグ付けプライマーペアを含み、各タグ付けプライマーペアは、
5’から3’の方向に第1アダプター配列、第1インデックス化配列および第1リード配列プライマー部位を含むフォワードタグ付けプライマー、ならびに
5’から3’の方向に第2アダプター配列、第2インデックス化配列および第2リード配列プライマー部位を含むリバースタグ付けプライマー
を含み、ここで、フォワードまたはリバースタグ付けプライマーの1つのみが5’末端に精製標識を含む。
1つの実施形態においては、キットは複数の標的特異的プライマーペア(サンプル当たり標的配列当たりに1つ)を含み、各プライマーペアは、
5’から3’の方向に第1リードプライマーシーケンシング部位および標的特異的配列を含むフォワードプライマー、ならびに
5’から3’の方向に第2リードプライマーシーケンシング部位および標的特異的配列を含むリバースプライマー
を含む。
1つの実施形態においては、精製標識はビオチンである。
1つの実施形態においては、キットは、ストレプトアビジンを含む支持体、例えば、ストレプトアビジンでコーティングされたビーズまたは磁性ビーズを含む。
1つの実施形態においては、標的プライマーペアおよびタグ付けプライマーペアはイルミナ色素シーケンシング用に構成される。
本発明の他の態様および好ましい実施形態は、後記の他の特許請求の範囲において定められ記載されている。
閉管多重ライブラリーの構築。
第1段階:星印で示されている標的SNP部位を有する鋳型DNAを含む初期増幅設定。フォワードおよびリバース標的捕捉プライマーは、それぞれのイルミナ標的特異的配列を介して標的配列に隣接する位置で鋳型DNAにアニーリングすることが示されている。タグ付けプライマーも示されている。フォワードタグ付けプライマーは5’から3’の方向に第1アダプター配列、第1インデックス化配列およびリード配列プライマー部位を含み、リバースタグ付けプライマーは5’から3’の方向にビオチン精製タグ(B)、アダプター配列、インデックス化配列およびリード配列プライマー部位を含む。
第2段階:組み込まれたリード配列R1およびR2を含む、初期低アニーリング温度増幅サイクルの後で部分的に形成されたDNA構築物。
第3段階:最終段階においては、増幅を多サイクルで進行させて、大量の部分構築物(標的配列、R1およびR2リード配列、1つのアダプター配列(P5)および1つのインデックス化配列を含有する)を得る一方で、限られたビオチン標識リバースタグ付けプライマーによって所定量の完全ライブラリー構築物[標的配列、R1およびR2リード配列、2つのアダプター配列(P5およびP7)および2つのインデックス化配列を含有する]を得る。
遺伝子座間のリード分布、および標的配列をも含有するフォワードプライマーの割合。 サンプル間のリード分布および要約データ。 単一遺伝子座の散布図の例。各データ点は単一サンプルである。
発明の詳細な説明
本明細書に挙げられている全ての刊行物、特許、特許出願および他の参考文献を、各個の刊行物、特許または特許出願が参照により組み入れられると具体的かつ個別に示されている場合およびそれらの内容が完全に記載されている場合と同様に、あらゆる目的で、それらの全体を参照により本明細書に組み入れることとする。
定義および一般的な好ましい形態
特に示されていない限り、本明細書中で用いる以下の用語は、該用語が当技術分野において有しうる任意のより広い(またはより狭い)意味に加えて、以下の意味を有すると意図される。
文脈によって特に要求されない限り、本明細書における単数形の使用は複数形を含むものとして解釈されるべきであり、その逆も同様である。単数形対象物はその対象物の1以上を意味すると解釈されるべきである。したがって、単数形、「1以上」および「少なくとも1つ」なる語は本明細書においては互換的に用いられる。
本明細書中で用いる「含む」なる語または「含み」もしくは「含んで」のようなその変形は、任意の列挙された整数(例えば、特徴、要素、特性、特質、方法/プロセス工程または限定)または整数群(例えば、特徴、要素、特性、特質、方法/プロセス工程または限定)の包含を示し、いずれの他の整数または整数群の除外をも示さないと解釈されるべきである。したがって、本明細書中で用いる「含む」なる語は包括的またはオープンエンド(open-ended)であり、追加的な列挙されていない整数または方法/プロセス工程を除外しない。
「標的配列」は、増幅される配列、例えば、核酸配列における変異、例えば多型(例えば、一塩基多型(SNP)または短いインデル)を意味する。核酸配列はゲノム核酸の任意の部分、例えば、ゲノムのコーディング部分または非コーディング部分でありうる。
「サンプル」は、標的配列を含有する核酸を含む組成物を意味する。サンプルは、一般に、生物学的物質(例えば、組織)のサンプルから精製された核酸(例えば、DNA)である。増幅されうる他の核酸には、cDNAが含まれる。増幅されるDNAは、任意の生物のゲノムの任意の部分から得られうる。例えば、DNAはヒトまたは他の動物ゲノム、植物ゲノム、真菌ゲノム、細菌ゲノム、ウイルスゲノムまたは任意の他のDNA分子から得られうる。生物学的物質および組織サンプルから核酸を分離する方法は当業者によく知られている。本発明の方法は、複数の標的を含有する単一のサンプル、単一の標的を含有する複数のサンプル、または複数の標的をそれぞれが含有する複数のサンプルに対して実施されうる。本発明の方法は、複数の標的、例えば、1以上のサンプルからの100、200、300、400または500個を超える標的との使用に特に適用可能である。
「ハイスループットシーケンシング」は、多数の異なる標的配列が同一反応において並行してシーケンシングされるシーケンシングを意味する。この語は「次世代シーケンシング」または「NGS」(「ディープシーケンシング」または「超並列シーケンシング」とも称される)を含み、これは、数百万個のDNA小断片のシーケンシングを並行して行うDNAシーケンシング技術である。合成によるシーケンシング(イルミナ)、パイロシーケンシング(Pyrosequencing)(454)、イオン半導体(イオントレントシーケンシング(Ion Torrent Sequencing))、コンビナトリアルプローブアンカー合成(cPAS-BGI-MGI)を含む種々のNGS技術が存在する。標的化NGSは、アンプリコンおよび特定の遺伝子に焦点を合わせた次世代シーケンシング技術であり、酵素増幅による、必要な遺伝子またはアンプリコンの増幅を用い、ついでそれをNGSプラットフォームでシーケンシングする。それはBybeeら(“Targeted Amplicon Sequencing(TAS):A Scalable Next-Gen Approach to Multilocus,Multitaxa Phylogenetics”.Genome Biology and Evolution.3:1312-1323.doi:10.1093/gbe/evr106.PMC 3236605)およびMasserら(“Targeted DNA Methylation Analysis by Next-generation Sequencing”.Journal of Visualized Experiments.96:52488.doi:10.3791/52488.PMC 4354667)に記載されている。
「ライブラリー構築物」は、次世代またはハイスループットシーケンシング(NGS)技術により該構築物がシーケンシングされることを可能にする、標的配列ならびに第1および第2アダプター配列を含有する本発明の多重増幅反応の産物を意味する。構築物は、一般に、標的配列に隣接する第1および第2リード配列(例えば、イルミナR1およびR2配列)、ならびにリード配列とアダプター配列との間に位置する2つのインデックス化配列(例えば、イルミナi5およびi7配列)をも含む。ライブラリーは、一般に、アダプター配列を1つだけ含有し精製標識を含有しない部分構築物と、NGSに必要な両方のアダプター配列、両方のインデックス配列および精製標識を含有する完全(または全)構築物とを含む。精製標識を使用する捕捉技術は、完全構築物が捕捉されてNGSにおいて使用されることを可能にする。完全(全)アダプターライブラリー構築物および部分的アダプターライブラリー構築物を図1(第3段階)に示す。
「アダプター配列」は、次世代シーケンシング技術、例えば、フローセルにおけるイルミナ色素シーケンシングを含む本明細書に記載されているNGS技術のいずれかによりアダプター連結ライブラリー構築物がシーケンシングされることを可能にするように構成されたDNAの配列である。アダプター配列は、任意のNGS技術によりアダプター連結構築物がシーケンシングされることを可能にするように構成されうる。イルミナのアダプターはhttps://support.illumina.com/downloads/illumina-adapter-sequences-document-1000000002694.htmlに記載されている。全ての主要NGSプラットフォームのためのアダプター配列はCoralville,Ohio,USAのIDT(Integrated DNA Technologies)により供給される(xGenTM UDI-UMI Adapters,xGenTM Stubby Adapters)。IDTは、カスタムNGSアダプターの設計に関する指針を提供するカスタム・アダプター・コンフィギュレーター・ツールも提供する。
「リード配列」は標的特異的プライマーの一部分である。標的特異的プライマーペアにおける両方のプライマーがリード配列を含む。リード配列は、標的DNAが増幅される際に増幅産物内に組み込まれ、タグ付けプライマーリード配列プライマー部位を介してタグ付けプライマーがアニーリングしうる配列を形成する。リード配列の例には、イルミナのR1およびR2リード配列が含まれうる。リード配列は、Thermo Fisherから、そのIon AmpliSeq(商標)DNAパネルおよびライブラリーキットの一部としても得られうる(https://www.thermofisher.com/ie/en/home/life-science/sequencing/next-generation-sequencing/ion-torrent-next-generation-sequencing-products-services/sequencing-reagents.html)。「リード配列プライマー部位」は、リード配列の1つを含有する標的DNAにタグ付けプライマーがアニーリングすることを可能にしリード配列の1つに相補的である、タグ付けプライマーの一部分である。
「インデックス化配列」は、シーケンシングデータを分析する際に構築物を特定するためのバーコードとして作用し最終的なライブラリ構築物内に組み込まれる、タグ付けプライマーの一部分である。一般に、インデックス化配列は6~8ヌクレオチド長であり、タグ付けプライマー内のリード配列プライマー部位とアダプター配列との間に配置される。タグ付けプライマーペアは2つの異なるインデックス化配列を含み、それらは共に、完全(全)ライブラリー構築物内に組み込まれる。インデックス化配列の一例としては、イルミナi5およびi7インデックス化配列、ならびにUS2018334712に記載されているインデックス化オリゴヌクレオチドが挙げられる。適切なインデックス化配列は、市販品、例えば、https://rdrr.io/bioc/DNABarcodes/https://omictools.com/dnabarcodes-toolを使用して作製されうる。
本発明の方法においては、精製標識を含むタグ付けプライマーは「限界濃度」で提供される。これは、部分構築物(精製標識を含有しない)が過剰に存在し、精製標識を含有する完全(全)構築物が限られたものである最終産物が得られるように、それが、部分形成DNA構築物に結合するには不十分なタグ付けプライマーが存在することをもたらす濃度で提供されることを意味する。これは、均一な初期標的増幅と組合されて、サンプル全体にわたって同等な出力を可能にして、サンプル特異的下流正規化の必要性を排除する。図1に示されている例では、P7アダプター配列を含有するリバースタグ付けプライマーが限界濃度で提供されている。
「精製標識」は、プライマー配列の末端に組み込まれうる標識であって、多重増幅の産物を精製するために使用されうる標識を意味する。典型的には、標識はアフィニティー標識であり、アフィニティー標識に対するリガンド(例えば、ストレプトアビジンビーズ)を含有する支持体を使用して増幅産物を精製するように構成される。1つの実施形態においては、標識はビオチンであり、その詳細は当業者に公知である。本発明の方法および産物において使用されうる他の精製標識には、オリゴヌクレオチドタグ(アクリダイト(Acridite))が含まれる。
「オンターゲット率」は、標的領域に特異的な、戻った(リターンした)配列データの割合(%)を意味する。オンターゲット率が高いほど、シーケンスランの使用の効率が高くなる。
実施例
次に、特定の実施例に関して本発明を説明する。これらは単なる典型例に過ぎず、例示のみを目的としている。それらは、特許請求されている独占権の範囲または記載されている本発明を何ら限定するものではない。これらの実施例は、本発明を実施するために現在想定される最良の形態を構成する。
本発明は、ビオチン標識のような精製標識を使用する、正規化工程が組み込まれた次世代シーケンシングのための標的ライブラリーの単一管内製造方法を提供する。典型的には、多重化ライブラリー製造は、2つの工程、すなわち、標的捕捉ならびにそれに続くタグ付けおよびアダプター添加を含む。先行技術の多数の方法においては、両方の工程は一般に増幅により達成される。一般に、それらの2つの増幅工程は精製工程とは別に行われる。Hi-plexは、これら2つの増幅工程を組合せることを目的とした方法であるが、Hi-plexにおいても、最初の増幅後にインデックス化/アダプター導入プライマーが多重反応に添加される。これは、該方法がサンプル容器の開口および再密閉を尚も要することを意味する。これはハイスループット法には理想的でない(Nguyen-Dumontら,2013、Nguyen-Dumontら,2015、Popeら,2018、Hammetら,2019)。本発明は、真に単一閉管内の方法に関するものであり、この場合、標的捕捉、インデックス化およびアダプター添加を同一反応容器内で行い、ついで、サンプル容器の開口および再密閉を必要とすることなく、そしてタグ付けおよびアダプター添加の前に精製工程を必要とすることなく、精製標識を使用してライブラリー捕捉を行う。
本発明のこの方法の着想は、各個の反応が、広範囲の鋳型DNA投入にわたって、比較的等しい存在量で、ほぼ同じ量の各標的化遺伝子座を含有する完全なシーケンシング構築物を生成するというものである。各反応におけるインデックスバーコード配列のユニークな組合せは、交差汚染のリスクを伴うことなく、多重増幅後の全てのサンプルのプールを可能にする。低濃度の精製タグ標識タグ付けプライマーの使用は、ただ1つのアダプターおよびインデックス化配列を含有する過剰な数の構築物を多重増幅が生成する一方で、完全ライブラリー構築物の量が制限されることを可能にする。これは、均一な初期標的増幅と組合されて、サンプル全体にわたって同等な出力を可能にして、サンプル特異的下流正規化の必要性をなくし、数百~数千個の多数の標的の多重増幅を可能にする。増幅後、数千の個々の反応からの反応サンプルを一緒にプールすることが可能であり、完全ライブラリー構築物の捕捉および精製は、例えば、精製標識としてビオチンを使用し、ビオチン標識を含有する完全構築物を捕捉するためにストレプトアビジンビーズを使用することにより、精製標識によって促進される。単一管アプローチの概要を図1に示す。他の方法とは異なり、標的捕捉およびタグ付けプライマーの全ては同一反応容器内に含まれ、それらの連続的な活性は熱サイクルにより誘導される。標的特異的プライマーの数が、所望のパネルに応じて変動しうる場合、反応当たり僅か2つのタグ付けプライマーが必要であるに過ぎない。最初の増幅は、所望のゲノムDNA部位を増幅する標的捕捉プライマーを使用して行う。最初の2ラウンドの増幅の後、リード配列から、タグ付けプライマーのための部分的結合部位が生成され、それらは、それらの相補体に対するアニーリングを開始しうる。次の数サイクルで、タグ付けプライマーに対する完全長相補体が生成され、これが生じたら、残りの反応は、タグ付けプライマーの完全プライミング部位を反映して、より高いアニーリング温度で行われる。
現在の指標サイクル条件を表1に示す。
Figure 2022548000000002

プライマー設計
標的捕捉プライマーは、標的特異的3’末端が59℃~61℃のアニーリング温度(Tm)を有するように設計される。下流プライマーヘテロ二量体アーチファクトのほとんどの原因を回避するために、該プライマーは、多重増幅用に生成されたパイプラインを用いて設計される。標的捕捉プライマーは、タグ付けプライマーの3’末端と一致する、イルミナR1またはR2リード配列のような完全長リード配列を有する。各タグ付けプライマーは、イルミナp5またはp7捕捉配列のようなアダプター配列とリード配列プライマー部位との間に挟まれた6塩基のインデックスバーコード配列を含有する。これはイルミナのもののような二重インデックスシーケンシングの使用を可能にし、fastqデータのような遺伝子データからの配列の逆多重化(demultiplexing)を可能にして、個々のサンプルの下流遺伝子型決定を可能にする。例えば、構築物のp5末端に関しては、タグ付けプライマーはp5配列、ユニーク6塩基バーコード配列およびイルミナのリード1シーケンシングプライマー部位からなりうる。一方、構築物のp7末端に関しては、タグ付けプライマーはビオチン標識5’末端、p7配列、ユニーク6塩基バーコード配列およびイルミナのリード2シーケンシングプライマー部位からなる。プライマーの重複部分は、典型的には、約60℃のアニーリング温度を有する。完全長相補体が生成されたら、完全プライマー部位のTmは構築物の各末端に関して約74℃である。
正規化
該方法はライブラリ構築後に個別の正規化工程を要しない。それどころか、異なるサンプルの均等な提示が、サイクル条件によって、および精製標識タグ付けプライマーの濃度を制限することによって制御される。熱サイクルの後期段階におけるタグ付けプライマーの消耗は、付加された精製タグを介して、等量のライブラリー完全構築物が支持体に結合することを可能にする。サンプル間の構築物の総量は変動可能であるが、完全タグを含有する画分は類似しているべきである。したがって、全てのサンプルはライブラリ構築後に一緒にプール可能であり、以下の全ての下流工程は単一サンプルに関して行われる:精製支持体を使用するライブラリー捕捉、支持体からのライブラリー遊離(例えば、短い熱サイクルによるもの)、最終的なライブラリーの浄化(クリーンアップ)(例えば、磁気ビーズの使用するもの)、およびライブラリーの定量。適切なタグ付けプライマーはイルミナのi7タグ付けプライマーである。適切な精製タグは、ストレプトアビジンビーズで捕捉されうるビオチンタグである。
材料
実験において使用するDNAを、磁気ビーズを利用してブタの耳のタグ組織サンプルから抽出して、24ng/μl(SD 11ng/μl)の平均収量を得た。全ての標的捕捉プライマーはIDTから取り寄せた。該プライマーは、標準的な脱塩精製を用いたものであり、Tris-EDTA(pH8.0)バッファー中の200μMの濃度の、25nmolの合成スケールのものであった。ビオチン標識i7タグ付けプライマーは、管(チューブ)形態の凍結乾燥状態のものを取り寄せ、10μMのストック濃度となるようにヌクレアーゼ非含有水に再懸濁させた。
多重増幅
標的捕捉プライマーをプールし、実施用ストックとして各プライマーごとに0.5μMの濃度に希釈した。試験ライブラリーのために、51個の標的捕捉プライマーを使用して、プライマープールを作製した。個々の反応を7μLの総量[3.5μLのQiagenプラス・マルチプレックス・マスター・ミックス、2μLのDNA抽出物、0.5μLの標的捕捉プライマー混合物、1μLの10μM i5タグ付けプライマー、約0.01μLのビオチン化i7タグ付けプライマー]として調製した。i5タグ付けプライマーの量は、プール内に存在する標的捕捉プライマーの数に応じて変化する必要があり、したがって、利用可能なプライマー部位のモル量はi5プライマーのものにほぼ等しい。この場合、全てのi5タグ付けプライマー部位の最終濃度は約1.8μMであり、使用した添加i5タグ付けプライマーの濃度は最終反応条件において約1.4μMであった。まず、52μLのプール化標的プライマー混合物、1μLの10μM ビオチン化i7タグ付けプライマーならびに371μLのQiagenプラス・マルチプレックス・マスターミックス(Qiagen,UK)を一緒にすることによってマスターミックスを調製することにより、96ウェルプレートにおいて増幅を準備した。各ウェルに4μLのマスターミックスを分注し、ついで1μLの10μM i5タグ付けプライマーおよび2μLの鋳型DNAを分注した。これは、マルチチャネルピペットを使用して行った。プレートをヒートシールし、穏やかにボルテックスし、短時間遠心分離した。増幅は、以下のサイクル条件で行った[95℃-15分(1×ホットスタート);95℃-30秒、61℃-30秒(低勾配0.2℃/秒)、72℃-30秒(5×);95℃-30秒、67℃-30秒(×3);95℃-30秒、72℃-30秒(×22);4℃-維持]。
ライブラリ捕捉および正規化
増幅後、マルチチャネルピペットを使用して、4μLの各反応物を単一プールへと混合した。500μLのアリコートを500μLの2×結合バッファー[10mM Tris-Hcl(pH7.5)、1mM EDTA、200mM NaClおよび0.02% Tween20バッファー]と一緒にした。1マイクロリットルのストレプトアビジンビーズを1.5mL 管内の1mLの1×結合バッファー中で洗浄し、磁気ラックを使用して捕捉した。上清を廃棄し、管を磁気スタンドから取り外し、1mLのプール化増幅混合物を使用して磁気ビーズを再懸濁させた。ビーズを室温で15分間インキュベートし、上清が清澄化するまで、再び磁気スタンドに約3分間戻した。磁気スタンド上で上清を除去し、1mLの1×結合バッファーを使用してビーズを1回洗浄した。再び、上清を廃棄し、ビーズを20μLの溶出バッファー(10mM Tris-HCl pH8.0)に再懸濁させた。捕捉されたライブラリー構築物をビーズから遊離させるために、再懸濁したストレプトアビジンビーズを使用して別の増幅を行う。この単一管反応を、20μLのQiagenプラス・マスターミックス(任意のPCRマスターミックスが使用可能であろう)、4μLの10μM イルミナP5プライマー、4μLの10μM イルミナP7プライマーおよび12μLの再懸濁ストレプトアビジンビーズを混合することにより準備した。以下の熱サイクル条件[94℃-15分(ホットスタート);94℃-30秒、60℃-30秒、72℃-30秒(5×);4℃-維持]を用いて、増幅を行った。5回の増幅サイクルの後、混合物を新鮮な1.5mL管に移し、磁気ラック上に配置した。清澄化上清の25μLアリコートを新鮮な1.5mL管に移し、15μLのCleanNGS(CleanNA,Netherlands)ビーズと混合した。この混合物を室温で5分間インキュベートし、管を磁気ラック上に3分間、再配置した。ついで清澄化上清を新鮮な1.5mL管に移し、更に13μLのCleanNGSビーズと混合した。混合物を再び室温で5分間インキュベートし、ついで磁気ラック上に3分間配置した。上清を除去し廃棄し、尚も磁気ラック上で、200μLの新鮮な70% エタノールを使用してビーズを2回洗浄した。エタノールを除去し、管を10分間風乾して、残留エタノールを蒸発させた。ついでビーズペレットを15μLの溶出バッファーに再懸濁させ、ビーズを磁気スタンド上で捕捉した。清澄化上清を回収し、新鮮な1.5mLの管に移し、1% Tween20を含有する1.5μLの溶出バッファーを加えた。これが最終的なライブラリーであった。
ライブラリーの定量
Applied Biosystems StepOnePlus装置(Thermo Fisher Scientific,UK)で、Kapa Biosystems(Roche Sequencing,US)のイルミナライブラリー定量キットを製造業者の説明に従い使用して、最終的なライブラリーの濃度を測定した。
シーケンシングおよびデータ分析
完成したライブラリーを、ペアエンド75サイクルキットを使用して、イルミナMiSeq装置でシーケンシングした。シーケンシング後、イルミナ変換スクリプト(これは、i7およびi5インデックス配列の包含が各配列のヘッダー行に加えられることを可能にする)を使用して、データをfastq形式に変換した。GTseq_BarcodeSplit_MP.py pythonスクリプトの入力ファイルとして提供される予想されるバーコードの組合せを使用して、シーケンシングリードを個々のサンプルごとに個別のfastqファイルに分割した。ついで、GTseq_Genotyper_v3.plperlスクリプトを使用する遺伝子型決定のために、各個のfastqファイルを使用した。ついで、遺伝子型、対立遺伝子比およびその他の配列リードデータを含む要約ファイルを分析して、該多重増幅ライブラリー製造方法の効率を評価した。
結果
24個のサンプルのセットに関して、最良の性能条件を試験した。4つのサンプルを分析から除外した。なぜなら、これらは鋳型を含有しておらず、またはPCR中に試薬が蒸発しており、または全ての試験条件下で劣悪な性能を示したからである。提示された条件を表すサンプルのこのサブセットでは、予想される6塩基のバーコードの組合せを含有する835,017個の生リードがシーケンシング後に戻された。ヒートシールが不十分なために蒸発したウェルの証拠がシーケンシング前に認められ、予想どおり、これらのウェルは乏しい数のリードを戻した。これらのサンプルを更なる分析から除外した。なぜなら、それらは典型的な反応条件を表していなかったからである。残りの個々のサンプル(n=20)のそれぞれからの生リードは比較的均一であり、平均41,751個のリードおよび18,068の標準偏差を有していた。戻された生リードの数は26,890~93,038の範囲であった。標的配列の割合(非標的またはアーチファクト配列のものと対照され、「オンターゲット率」とも称される)は、分析された20個のサンプルにおいて、平均31%であった。標的化リードの数が少ない場合でさえも、分析された20個のサンプルの全てに関して、良好に遺伝子型決定を行うのに十分なリードが存在し、平均コール率は98.9%であり、全てが、98%を超えるコール率を有していた。遺伝子座間のリードの均一性は、高いコール率に達するのに多数のリードが要求されるわけではなく、90%の閾値が僅か2,400個のオンターゲットリードで達成されることを意味した(図3)。選択された標的遺伝子座は予想どおりに挙動し、遺伝子型決定パイプラインを使用して容易にスコア化される明瞭な対立遺伝子比を示した(図4)。
均等物
前記の説明は本発明の現在好ましい実施形態を詳述している。これらの説明を考慮して、その実施における多数の修飾および変形が当業者に見出されると予想される。それらの修飾および変形は、本明細書に添付されている特許請求の範囲内に含まれると意図される。簡潔化のために、実施形態は単一の実施形態として記載されているが、これらの実施形態の種々の組合せが本発明の範囲内であると理解されるべきである。
参考文献
Hammet,F.,Mahmood,K.,Green,T.R.,Nguyen-Dumont,T.,Southey,M.C.,Buchanan,D.D.,Lonie,A.,Nathanson,K.,L.,Couch,F.J.,Pope,B.J.およびPark,D.J.2019:Hi-Plex2:a simple and robust approach to targeted sequencing-based genetic screening.BioTechniques.67(3):00-00(September 2019).10.2144/btn-2019-0026.
Nguyen-Dumont,Tu,Pope,B.,Hammet,F.,Southey,M.およびPark,D.2013:A high-plex PCR approach for massively parallel sequencing.Biotechniques.55:69-74.
Nguyen-Dumont,T.,Hammet,F.,Mahmoodi,M.,Pope,B.,Giles,G.,Hopper,J.,Southey,M.およびPark,D.2015:Abridged adapter primers increase the target scope of Hi-Plex.BioTechniques.58:33-36.
Pope,B.,Hammet,F.,Nguyen-Dumont,T.およびPark,D.2018:Hi-Plex for simple,accurate,and cost-effective amplicon-based targeted DNA sequencing.Chapter 5 in Steven R.Headら(編),Next Generation Sequencing:Methods and Protocols.vol.1712.

Claims (21)

  1. 標的化次世代シーケンシングに使用される多重増幅によるライブラリー構築物の製造方法であって、該製造方法が、
    (a)(i)複数の異なる標的配列を含む少なくとも1つのサンプル、
    (ii)前記の少なくとも1つのサンプルのための複数の標的特異的プライマーペア(ここで、各プライマーペアは、5’から3’の方向に第1リード配列および標的特異的配列を含むフォワードプライマーと、5’から3’の方向に第2リード配列および標的特異的配列を含むリバースプライマーとを含む)、
    (iii)5’から3’の方向に第1アダプター配列、第1インデックス化配列および第1リード配列プライマー部位を含むフォワードタグ付けプライマーと、5’から3’の方向に第2アダプター配列、第2インデックス化配列および第2リード配列プライマー部位を含むリバースタグ付けプライマーとを含む、前記の少なくとも1つのサンプルのためのタグ付けプライマーペア
    を含む第1反応容器を準備する工程、
    (b)標的配列を増幅すること、第1リード配列と第2リード配列とを含む標的配列を生成すること、およびアダプター連結構築物のライブラリーを含む反応産物を得ることが連続的に達成されるように構成された、連続的アニーリング温度での増幅の連続的ラウンドを第1反応容器内で行う工程、ならびに
    (c)反応産物からアダプター連結構築物のライブラリーを捕捉する工程
    を含み、
    フォワードおよびリバースタグ付けプライマーの1つが5’末端に精製標識を含み、限界濃度で提供され、それにより、アダプター連結構築物のライブラリーが、
    第1および第2インデックス化配列の1つのみと、第1および第2アダプター配列の1つのみとを含有する部分構築物、ならびに
    第1および第2インデックス化配列と、第1および第2アダプター配列と、精製標識とを含む完全構築物
    を含むことを特徴とし、
    ここで、反応産物が、完全構築物に対して過剰の部分構築物を含み、工程(c)が、精製標識を含む完全構築物のみを捕捉することを含む、前記製造方法。
  2. 第1反応容器が工程(b)中に閉じられている、請求項1記載の製造方法。
  3. 連続的アニーリング温度での増幅の連続的ラウンドが、
    (i)第1アニーリング温度の反応容器内の1以上の初期ラウンドの増幅を行うこと、
    (ii)第1リード配列と第2リード配列とを含む標的配列を生成するように構成された第2アニーリング温度の反応容器内の1以上の中間ラウンドの増幅を行うこと、および
    (iii)均一量の完全ライブラリー構築物を含む反応産物を得るように構成された第3アニーリング温度の反応容器内の1以上の最終ラウンドの増幅を行うこと
    を含む、請求項1または2記載の製造方法。
  4. 第2アニーリング温度が第1アニーリング温度より高く、第3アニーリング温度が第2アニーリング温度より高い、請求項3記載の製造方法。
  5. 第1アニーリング温度が61℃ +/- 5℃であり、第2アニーリング温度が67℃ +/- 5℃であり、第3アニーリング温度が72℃ +/- 5℃である、請求項4記載の製造方法。
  6. 1~5回の初期ラウンドの増幅、1~5回の中間ラウンドの増幅および10~20回の最終ラウンドの増幅を含む、請求項3~5のいずれか1項記載の製造方法。
  7. 精製標識がビオチンであり、捕捉工程が、反応産物をストレプトアビジンビーズと反応させることを含む、請求項1~6のいずれか1項記載の製造方法。
  8. 工程(a)および(b)を第1反応容器内の第1サンプルに対して行って、アダプター連結構築物の第1ライブラリーを含む第1反応産物を得、工程(a)および(b)を第2反応容器内の第2サンプルに対して行って、アダプター連結構築物の第2ライブラリーを含む第2反応産物を得、ここで、第1反応産物および第2反応産物をプールし、プール化反応産物に対して捕捉工程(c)を行う、前記請求項のいずれか1項記載の製造方法。
  9. 工程(a)および(b)を、100個を超えるサンプルのそれぞれに対して行う、請求項8記載の製造方法。
  10. 工程(a)および(b)を少なくとも1000個のサンプルのそれぞれに対して行う、請求項8記載の製造方法。
  11. 各サンプルが少なくとも10個の標的配列を含む、前記請求項のいずれか1項記載の製造方法。
  12. 各サンプルが少なくとも50個の標的配列を含む、前記請求項のいずれか1項記載の製造方法。
  13. 捕捉工程が、支持体上に完全構築物を捕捉し、ついで完全構築物を、支持体に付着させたままで増幅することを含む、前記請求項のいずれか1項記載の製造方法。
  14. 前記請求項のいずれか1項記載の製造方法によって完全構築物のライブラリーを準備する工程、および
    完全構築物のライブラリーに対してハイスループットシーケンシングを行う工程
    を含む、標的化次世代シーケンシングの方法。
  15. 次世代シーケンシングがイルミナ(illumina)色素シーケンシングである、請求項14記載の方法。
  16. 複数の標的配列を含有する少なくとも1つのサンプルの標的化ハイスループットシーケンシングにおける使用に適した多重増幅によりライブラリー構築物を製造するためのキットであって、該キットが、
    (ii)サンプルごとの複数の標的特異的プライマーペア(ここで、各プライマーペアは、
    5’から3’の方向に第1リード配列および標的特異的配列を含むフォワードプライマー、ならびに
    5’から3’の方向に第2リード配列および標的特異的配列を含むリバースプライマー
    を含む)、および
    (iii)
    5’から3’の方向に第1アダプター配列、第1インデックス化配列および第1リード配列プライマー部位を含むフォワードタグ付けプライマー、ならびに
    5’から3’の方向に第2アダプター配列、第2インデックス化配列および第2リード配列プライマー部位を含むリバースタグ付けプライマー
    を含む、サンプルごとのタグ付けプライマーペア
    を含み、
    ここで、フォワードまたはリバースタグ付けプライマーの1つのみが5’末端に精製標識を含む、前記キット。
  17. 精製標識がビオチンである、請求項16記載のキット。
  18. ストレプトアビジン磁性ビーズを含む、請求項16または17記載のキット。
  19. 標的プライマーペアおよびタグ付けプライマーペアがイルミナ色素シーケンシング用に構成されている、請求項16~18のいずれか1項記載のキット。
  20. 各サンプルのための複数の標的特異的プライマーペアと、サンプルごとのタグ付けプライマーペアとを含む、複数のサンプルの多重増幅のための、請求項16~19のいずれか1項記載のキット。
  21. 請求項1~15のいずれか1項記載の方法により得られうるアダプター連結構築物のライブラリー。
JP2022515938A 2019-09-11 2020-09-11 シーケンシングライブラリーの多重製造方法 Pending JP2022548000A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962898752P 2019-09-11 2019-09-11
US62/898,752 2019-09-11
EP19198454.1 2019-09-19
EP19198454 2019-09-19
PCT/EP2020/075529 WO2021048393A1 (en) 2019-09-11 2020-09-11 A multiplex method of preparing a sequencing library

Publications (1)

Publication Number Publication Date
JP2022548000A true JP2022548000A (ja) 2022-11-16

Family

ID=72659779

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022515938A Pending JP2022548000A (ja) 2019-09-11 2020-09-11 シーケンシングライブラリーの多重製造方法

Country Status (8)

Country Link
US (1) US20220411861A1 (ja)
EP (1) EP4028546A1 (ja)
JP (1) JP2022548000A (ja)
CN (1) CN114364812A (ja)
AU (1) AU2020345028A1 (ja)
BR (1) BR112022004371A2 (ja)
CA (1) CA3151485A1 (ja)
WO (1) WO2021048393A1 (ja)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PT3108009T (pt) * 2014-02-18 2021-05-10 Illumina Inc Métodos e composições para a criação de perfis de adn
CN105463585B (zh) * 2014-09-12 2018-04-20 清华大学 基于单链dna分子构建测序文库的方法及其应用
GB2536446B (en) 2015-03-17 2020-06-03 Salisbury Nhs Found Trust PCR method
CN108351349B (zh) * 2015-09-10 2020-09-29 因斯利克萨公司 用于多路定量核酸扩增的方法和***
US11028436B2 (en) 2017-05-08 2021-06-08 Illumina, Inc. Universal short adapters for indexing of polynucleotide samples
CN111201323A (zh) * 2017-06-20 2020-05-26 普梭梅根公司 利用唯一分子标识符的文库制备的方法和***

Also Published As

Publication number Publication date
AU2020345028A1 (en) 2022-03-10
WO2021048393A1 (en) 2021-03-18
EP4028546A1 (en) 2022-07-20
US20220411861A1 (en) 2022-12-29
CN114364812A (zh) 2022-04-15
CA3151485A1 (en) 2021-03-18
BR112022004371A2 (pt) 2022-06-07

Similar Documents

Publication Publication Date Title
DK3192877T3 (en) VESICULAR ADAPTERS AND APPLICATIONS THEREOF IN NUCLEIC ACID LIBRARY CONSTRUCTION AND SEQUENCE
EP3985122A1 (en) Methods of producing amplified double stranded deoxyribonucleic acids and compositions and kits for use therein
AU2021204166B2 (en) Reagents, kits and methods for molecular barcoding
TW201321518A (zh) 微量核酸樣本的庫製備方法及其應用
JP2019514360A (ja) 超並列シークエンシングのためのdnaライブラリーを生成する方法及びキット
US10900974B2 (en) Methods for identifying macromolecule interactions
US20140336058A1 (en) Method and kit for characterizing rna in a composition
WO2015050501A1 (en) Amplification paralleled library enrichment
CN112410331A (zh) 带分子标签和样本标签的接头及其单链建库方法
JP2023513606A (ja) 核酸を評価するための方法および材料
JP6513949B2 (ja) Vdj組み換え産物を特定する方法
US9708603B2 (en) Method for amplifying cDNA derived from trace amount of sample
EP3559268B1 (en) Methods and reagents for molecular barcoding
CN112680796A (zh) 一种靶标基因富集建库方法
CN108103052B (zh) 提高基因组覆盖度的单细胞全基因组扩增及文库构建方法
CN111788316A (zh) 库制备
JP2022548000A (ja) シーケンシングライブラリーの多重製造方法
CN116515977B (zh) 基于单端接头转座酶的单细胞基因组测序试剂盒和方法
EP3696279A1 (en) Methods for noninvasive prenatal testing of fetal abnormalities
WO2023215524A2 (en) Primary template-directed amplification and methods thereof
JP2024035110A (ja) 変異核酸の正確な並行定量するための高感度方法
JP2024035109A (ja) 核酸の正確な並行検出及び定量のための方法
JP2021182940A5 (ja)
EP4392577A1 (en) Optimised set of oligonucleotides for bulk rna barcoding and sequencing
JP2020103230A (ja) アダプターダイマーの生成抑制方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230330

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240305