JP2023553984A

JP2023553984A - 二重鎖修復の方法

Info

Publication number: JP2023553984A
Application number: JP2023535682A
Authority: JP
Inventors: エー．アダルステインソン，ヴィクター; ション，カン; シア，ダグラス; ローデス，ジャスティン
Original assignee: Broad Institute Inc
Current assignee: Broad Institute Inc
Priority date: 2020-12-11
Filing date: 2021-12-10
Publication date: 2023-12-26
Also published as: EP4259819A1; WO2022125977A1; US20240110223A1

Abstract

配列決定のための核酸試料（試料）の調製に関連する方法およびキットが開示される；これは、１つの鎖に限定されたヌクレオチド損傷または変化の増幅による偽変異の伝播を最小限に抑え、ここで試料の少なくとも一部は二本鎖である。

Description

関連出願の相互参照
この出願は、35 U.S.C. § 119(e)の下で、２０２０年１２月１１日に出願された米国仮出願第63/124,700号、表題「METHODS FOR DUPLEX REPAIR」、２０２１年１月２９日に出願された米国仮出願第63/143,397号、表題「METHODS FOR DUPLEX REPAIR」、２０２１年５月２０日に出願された米国仮出願第63/191,320号、表題「METHODS FOR DUPLEX REPAIR」、２０２１年５月２１日に出願された米国仮出願第63/191,914号、表題「METHODS FOR DUPLEX REPAIR」、および２０２１年６月３０日に出願された米国仮出願第63/217,007号、表題「METHODS FOR DUPLEX REPAIR」の利益を主張し、それぞれの全開示は、その全体が参照により本明細書に組み込まれる。

配列表
本出願はEFS-Webを介してASCII形式で提出された配列表を含み、その全体は参照により本明細書に組み込まれる。２０２１年１２月１０日に作成されたこのASCIIコピーはB119570118WO00-SEQ-GJM.txtという名称で、サイズは３５，０８８バイトである。

背景
核酸の正確な配列決定は、多くの分野（例えば生物医学の研究開発、臨床診断および治療）において極めて重要であるが、困難である。ＤＮＡ配列決定のコストは２０００年代初頭以来１００万分の１に低下したが、次世代配列決定（ＮＧＳ）のエラー率は依然として高く（～０．１％）、この数値は比較的変わっていない。このエラー率により、真の変異、特に存在量が少ない変異を解決することが困難になる。より高い忠実度は、各配列を複数回読み取ることで達成できる；例えば、元の各ＤＮＡ二重鎖の両方の鎖からのリード（read）のコンセンサスを必要とすることにより、「二重鎖配列決定」などの技法では０．０００１～０．００００１％（１×１０^－６～１×１０^－７）という低いエラー率を達成できる。しかしその精度は、真の変異を識別するために用いる上で最も重要な領域では失敗の可能性がある。例えば、ホルマリン固定腫瘍生検などの重度に損傷した（例えば、以下でさらに記載されるように、酸化、脱アミノ化された）試料のエラー率は、１００倍を超える可能性がある。これは、配列決定用の核酸を調製するのに必要な既存の方法では、各ＤＮＡ二重鎖の一部が再合成され、もともと一方の鎖に限定されていた増幅可能な病変または変化が、両方の鎖の真の変異から識別できなくなる可能性があるためである。したがって、各二重鎖の両方の鎖からの配列のコンセンサスを必要とする二重鎖配列決定などの既存の方法の精度を、変異検出を損なうことなく向上させるための新しい方法が必要である。

発明の概要
核酸の調製に使用される既存の方法は、多くの作業およびステップを実施する。「末端修復」（ＥＲ）および「ｄＡテーリング」（ＡＴ）（ＥＲ／ＡＴ）として知られる既存の方法はそれぞれ、ｄＴＭＰテール付き（dTMP-tailed）配列決定アダプターのライゲーションの準備として、ＤＮＡ断片を平滑化およびリン酸化し、デオキシアデノシン一リン酸（「ｄＡＭＰ」）の３’末端への非鋳型付加を実施するために使用される（図１）。ＥＲおよびＡＴは、逐次的に、または「ワンポット」反応内（例えば、プロセスおよび方法の全体が、ステップを分離することなく１つの反応容器内で同時に行われる）のいずれかで実施され、３’オーバーハングを消化して５’オーバーハングを埋め、かつ単一のｄＡＭＰを二重鎖の鎖の各３’末端に残すことが意図されている、ＤＮＡポリメラーゼ（単数または複数）を使用する。しかし、ＥＲ／ＡＴ（そのままで、またはNEB PreCR（登録商標）もしくはＥｘｏＶＩＩなどの前処理と組み合わせて；例えば、図３４および図３５Ａ～３５Ｃを参照）は、伝統的に、５’エキソヌクレアーゼおよび／または鎖置換活性を有する、１つ以上のＤＮＡポリメラーゼ（単数または複数）の使用を伴う。したがって、広範な鎖再合成が、二重鎖内の内部のニックおよびギャップ、および長い５’オーバーハングから生じる可能性があるという仮説が立てられた。再合成が、もともと一方の鎖に限定されていた増幅可能な病変または変化の存在下で生じると、エラーが両方の鎖にコピーされ、両方の鎖上の真の変異と区別できなくなり得るか、またはその可能性がある。二重鎖配列決定におけるこの偽の発見の源は、短い５’オーバーハングがしばしば埋められる断片末端で最も明確に見られるが（図２Ｃ）、本明細書では、かかるエラーは、以下が与えられている場合に断片のさらに深い部分にまで及び得ることが示されている：（ｉ）ＥＲ／ＡＴで一般的に使用されるＴａｑおよびクレノウなどのポリメラーゼの、５’エキソヌクレアーゼおよび鎖置換活性、および（ｉｉ）複数の内因性または外因性因子によって誘導される様々な程度の主鎖損傷、これは、鎖再合成のプライミング部位（例：ニック、ギャップ）として機能する。これは、２７１個の無細胞ＤＮＡ（ｃｆＤＮＡ）試料よりも約１００倍高いエラー率を示した重度の損傷を受けたＦＦＰＥ腫瘍ＤＮＡ試料において、３’断片末端からの距離に応じて減少する長いテールのエラーが観察された理由を、説明できる可能性がある（図２Ｃ）。このメカニズムは、従来のＥＲ／ＡＴキットを用いた、ニック、ギャップ、およびオーバーハングを有する合成オリゴヌクレオチドの処理を含む実験によっても確認された（図２Ｂおよび図３Ａ）。断片末端でのエラーは、断片末端のin silicoトリミングによって軽減できるが、各断片の内部（または断片末端から事前に指定された距離を超える、例えば１２ｂｐを超える部分）で発生するエラーは、この方法では、ＤＮＡ配列決定データの収量を大幅に妥協することなく解決することはできない。これは、二重鎖配列決定が理論的には、一方の鎖の塩基損傷エラーを識別できるが、実際にはその能力が出発物質の品質に依存しており、これには多くの理由から大きな問題があることを意味する。例えば、ＥＲ／ＡＴの前に、試料を断片化してライブラリーを調製する。この断片化は、核酸を小さな断片に分解する。これは、物理的（例えば、超音波処理または物理的力によって）、酵素的、または化学的に達成することができる。しかし、あらゆる形態の断片化は、本質的に鎖に損傷を与えて破断し、オフターゲット損傷（例：オーバーハング、ニック、ギャップ、損傷塩基）を誘導する可能性がある。

本明細書で開示されるのは、二重鎖修復（ＤＲ）と呼ばれる新しいＥＲ／ＡＴ方法であり、これは、既存の方法に固有の問題の多くを最小化および／または除去する。例えば限定することなく、ＤＲは、ＮＧＳアダプターのライゲーション前に、鎖再合成を最小限に抑え、これは偽変異の発見を大幅に制限する。本明細書に示すように、この再合成を最小限に抑えることで、ＤＲは、各二重鎖の両方の鎖からの配列のコンセンサスに依存する、二重鎖配列決定および他の関連方法の主要なアキレス腱に対処して、最大の精度および堅牢性を提供する。

したがっていくつかの側面において、本開示は、配列決定用の核酸試料（試料）を調製する方法であって、もともと一本の鎖に限定されていたヌクレオチド損傷または変化の増幅による偽変異の伝播を最小限に抑える、前記方法に関し、ここで試料の少なくとも一部は二本鎖であり、試料を反応容器に添加すること、ならびに以下を含む：（ａ）試料を、以下が可能な１つ以上の酵素と接触させること：（ｉ）１つ以上の損傷塩基を、試料から切除すること；（ｉｉ）１つ以上の脱塩基部位を切断すること、および得られた末端を、ＤＮＡポリメラーゼによる伸長および／またはＤＮＡリガーゼによるライゲーションに適合するように処理すること；および（ｉｉｉ）５’オーバーハングを消化すること；（ｂ）試料を、以下の１つ以上と接触させること：（ｉ）鎖置換および５’エキソヌクレアーゼ活性の両方を欠くが、試料の一本鎖セグメントを埋め、かつ試料の３’オーバーハングを消化することができる、ＤＮＡ依存性ＤＮＡポリメラーゼ；（ｉｉ）試料の鎖の５’末端をリン酸化することができる酵素；（ｃ）試料を、ニックをシーリング可能なＤＮＡリガーゼと接触させること；および（ｄ）アダプターライゲーション用の試料を調製するステップ、ここで該調製は、ｄＡＭＰを、試料の鎖の３’末端に付加すること（ｄＡテーリング）を含む。かかる酵素は当技術分野で周知であり、New England BioLabs、AMSBIO、およびSigma-Aldrichなどの商業的供給源を含む、任意の適切な供給源から入手することができる。当業者であれば、本明細書に開示される酵素の名前に基づき、本明細書に開示される酵素のアイデンティティ、および過度の実験なしで前記酵素を入手する方法を理解するであろう。

いくつかの態様において、ｄＡテーリングは、試料を、１つのデオキシアノシン一リン酸（ｄＡＭＰ）を試料の鎖の各３’末端に組み込むことができる酵素と接触させること、および試料をｄＮＴＰと接触させることを含む。いくつかの態様において、本開示の方法のステップ（ａ）～（ｃ）で使用される酵素および／またはｄＮＴＰは、ｄＡテーリングの前に、反応容器から実質的に除去される。いくつかの態様において、ｄＮＴＰは、実質的にｄＡＴＰを含む。

いくつかの態様において、試料は、方法の任意の後続のステップに進む前に、ステップ（ａ）の１つ以上の酵素と接触されて少なくとも５分間インキュベートされる。いくつかの態様において、試料は、方法の任意の後続のステップに進む前に、ステップ（ａ）の１つ以上の酵素と接触されて少なくとも２５分間インキュベートされる。いくつかの態様において、試料は、方法の任意の後続のステップに進む前に、ステップ（ａ）の１つ以上の酵素と接触されて少なくとも３０分間インキュベートされる。いくつかの態様において、試料は、方法の任意の後続のステップに進む前に、ステップ（ｂ）の１つ以上の酵素と接触されて少なくとも５分間インキュベートされる。いくつかの態様において、試料は、方法の任意の後続のステップに進む前に、ステップ（ｂ）の１つ以上の酵素と接触されて少なくとも２５分間インキュベートされる。いくつかの態様において、試料は、方法の任意の後続のステップに進む前に、ステップ（ｂ）の１つ以上の酵素と接触されて少なくとも３０分間インキュベートされる。いくつかの態様において、試料は、方法の任意の後続のステップに進む前に、ステップ（ｃ）の１つ以上の酵素と接触されて少なくとも１５分間インキュベートされる。いくつかの態様において、試料は、方法の任意の後続のステップに進む前に、ステップ（ｃ）の１つ以上の酵素と接触されて少なくとも３０分間インキュベートされる。いくつかの態様において、試料は、方法の任意の後続のステップに進む前に、ステップ（ｃ）の１つ以上の酵素と接触されて少なくとも４５分間インキュベートされる。いくつかの態様において、試料は、方法の任意の後続のステップに進む前に、ステップ（ｄ）の１つ以上の酵素と接触されて少なくとも４０分間インキュベートされる。いくつかの態様において、試料は、方法の任意の後続のステップに進む前に、ステップ（ｄ）の１つ以上の酵素と接触されて少なくとも６０分間インキュベートされる。いくつかの態様において、試料は、方法の任意の後続のステップに進む前に、ステップ（ｄ）の１つ以上の酵素と接触されて少なくとも７０分間インキュベートされる。

いくつかの態様において、ステップ（ａ）は、摂氏約３２度（℃）～約４２℃の温度で実施される。いくつかの態様において、ステップ（ａ）は、約３５℃～約３９℃の温度で実施される。いくつかの態様において、ステップ（ｂ）は、約３２℃～約４２℃の温度で実施される。いくつかの態様において、ステップ（ｂ）は、約３５℃～約３９℃の温度で実施される。いくつかの態様において、ステップ（ｃ）は、約３０℃～約７０℃の温度で実施される。いくつかの態様において、ステップ（ｃ）は、約３３℃～約６７℃の温度で実施される。いくつかの態様において、ステップ（ｄ）は、約１８℃～約６９℃の温度で実施される。いくつかの態様において、ステップ（ｄ）は、約２０℃～約６７℃の温度で実施される。

いくつかの態様において、ステップ（ａ）の前に、試料は（ｉ）断片化される；または（ｉｉ）切断およびタグ付けされる（タグメントされる）。いくつかの態様において、断片化は、（ａ）物理的断片化；（ｂ）酵素的断片化；および／または（ｃ）化学的断片化によるものである。いくつかの態様において、断片化は物理的断片化による。いくつかの態様において、断片化は酵素的断片化による。いくつかの態様において、断片化は化学的断片化による。

いくつかの態様において、ステップ（ａ）は、試料を、以下からなる群から選択される１つ以上の酵素と接触させることを含む：（１）エンドヌクレアーゼＩＶ（ＥｎｄｏＩＶ）；（２）ホルムアミドピリミジン［ｆａｐｙ］－ＤＮＡグリコシラーゼ（Ｆｐｇ）；（３）ウラシル－ＤＮＡグリコシラーゼ（ＵＤＧ）；（４）Ｔ４ピリミジンＤＮＡグリコシラーゼ（Ｔ４ＰＤＧ）；（５）エンドヌクレアーゼＶＩＩＩ（ＥｎｄｏＶＩＩＩ）、および（６）エキソヌクレアーゼＶＩＩ（ＥｘｏＶＩＩ）。かかる酵素は当技術分野で周知であり、New England BioLabs、AMSBIO、およびSigma-Aldrichなどの商業的供給源を含む、任意の適切な供給源から入手することができる。当業者であれば、本明細書に開示される酵素の名前に基づき本明細書に開示される酵素のアイデンティティ、および過度の実験なしで前記酵素を入手する方法を理解するであろう。

いくつかの態様において、１つ以上の酵素の活性は、試料上の以下のＤＮＡ改変を触媒する：（１）損傷塩基の切除；および（２）１つ以上の脱塩基部位を切断すること、および得られた末端を、ＤＮＡポリメラーゼによる伸長および／またはＤＮＡリガーゼによるライゲーションに適合するように処理すること。いくつかの態様において、１つ以上の酵素の活性は、逐次的または同時である。

いくつかの態様において、損傷塩基は、ウラシル；８’オキソＧ；酸化ピリミジン；およびシクロブタンピリミジン二量体からなる群から選択される。

いくつかの態様において、試料の少なくとも１つの鎖の５’オーバーハングは、少なくとも１０核酸塩基長である。いくつかの態様において、試料の少なくとも１つの鎖の５’オーバーハングは、少なくとも７５核酸塩基長である。いくつかの態様において、試料の少なくとも１つの鎖の３’オーバーハングは、少なくとも１０核酸塩基長である。いくつかの態様において、試料の少なくとも１つの鎖の３’オーバーハングは、少なくとも７５核酸塩基長である。

いくつかの態様において、１つ以上の酵素は、試料の少なくとも１つの鎖の５’オーバーハングを１６核酸塩基未満の長さに消化する。いくつかの態様において、１つ以上の酵素は、試料の少なくとも１つの鎖の５’オーバーハングを８核酸塩基未満の長さに消化する。いくつかの態様において、１つ以上の酵素は、試料の少なくとも１つの鎖の３’オーバーハングを１６核酸塩基未満の長さに消化する。いくつかの態様において、１つ以上の酵素は、試料の少なくとも１つの鎖の３’オーバーハングを８核酸塩基未満の長さに消化する。

いくつかの態様において、エンドヌクレアーゼＩＶ（ＥｎｄｏＩＶ）は、脱塩基部位を切断する。いくつかの態様において、ホルムアミドピリミジン［ｆａｐｙ］－ＤＮＡグリコシラーゼは、損傷プリンを切除する。いくつかの態様において、ウラシル－ＤＮＡグリコシラーゼ（ＵＤＧ）は、ウラシルを切除する。いくつかの態様において、Ｔ４ピリミジンＤＮＡグリコシラーゼ（Ｔ４ＰＤＧ）は、シクロブタンピリミジン二量体を切除する。いくつかの態様において、エンドヌクレアーゼＶＩＩＩ（ＥｎｄｏＶＩＩＩ）は、損傷ピリミジンを切除する。いくつかの態様において、ＤＮＡリガーゼは、ＨｉＦｉＴａｑＤＮＡリガーゼである。かかる酵素は当技術分野で周知であり、New England BioLabs、AMSBIO、およびSigma-Aldrichなどの商業的供給源を含む、任意の適切な供給源から入手することができる。当業者であれば、本明細書に開示される酵素の名前に基づき本明細書に開示される酵素のアイデンティティ、および過度の実験なしで前記酵素を入手する方法を理解するであろう。

いくつかの態様において、本開示の方法のステップ（ｂ）は、ＤＮＡ断片をポリヌクレオチドキナーゼ（Ｐｎｋ）と接触させるステップを含む。いくつかの態様において、Ｐｎｋは、Ｔ４ポリヌクレオチドキナーゼである。いくつかの態様において、本開示の方法のステップ（ｂ）で使用されるＤＮＡポリメラーゼは、Ｔ４ＤＮＡポリメラーゼである。いくつかの態様において、本開示の方法のステップ（ｄ）で使用されるＤＮＡポリメラーゼ（単数または複数）は、Ｔａｑポリメラーゼおよび／またはクレノウ断片を含む。かかる酵素は当技術分野で周知であり、New England BioLabs、AMSBIO、およびSigma-Aldrichなどの商業的供給源を含む、任意の適切な供給源から入手することができる。当業者であれば、本明細書に開示される酵素の名前に基づき本明細書に開示される酵素のアイデンティティ、および過度の実験なしで前記酵素を入手する方法を理解するであろう。

本開示の任意の方法のいくつかの態様において：（ａ）エンドヌクレアーゼＩＶ（ＥｎｄｏＩＶ）は、配列番号３または任意の既知のエンドヌクレアーゼＩＶ配列に対して少なくとも７０％の同一性を有するアミノ酸配列を含み；（ｂ）ホルムアミドピリミジン［ｆａｐｙ］－ＤＮＡグリコシラーゼ（Ｆｐｇ）は、配列番号４または任意の既知のホルムアミドピリミジン［ｆａｐｙ］－ＤＮＡグリコシラーゼ配列に対して少なくとも７０％の同一性を有するアミノ酸配列を含み；（ｃ）ウラシル－ＤＮＡグリコシラーゼ（ＵＤＧ）は、配列番号５～７からなる群から選択されるアミノ酸配列または任意の既知のウラシル－ＤＮＡグリコシラーゼ（ＵＤＧ）配列に対して少なくとも７０％の同一性を有するアミノ酸配列を含み；（ｄ）Ｔ４ピリミジンＤＮＡグリコシラーゼ（Ｔ４ＰＤＧ）は、任意の既知のＴ４ピリミジンＤＮＡグリコシラーゼ配列から選択されるアミノ酸配列に対して少なくとも７０％の同一性を有するアミノ酸配列を含み；および／または（ｅ）エンドヌクレアーゼＶＩＩＩ（ＥｎｄｏＶＩＩＩ）は、配列番号８～９からなる群から選択されるアミノ酸配列または任意の既知のエンドヌクレアーゼＶＩＩＩ配列に対して少なくとも７０％の同一性を有するアミノ酸配列を含む。

本開示の任意の方法のいくつかの態様において、ポリヌクレオチドキナーゼは、配列番号１０に対して少なくとも７０％の同一性を有するアミノ酸配列を含む。

本開示の任意の方法のいくつかの態様において：（１）ＤＮＡ依存性ＤＮＡポリメラーゼは、任意の既知のＤＮＡ依存性ＤＮＡポリメラーゼ配列に対して少なくとも７０％の同一性を有するアミノ酸配列を含み；および／または（２）ＤＮＡリガーゼは、配列番号１１～１３からなる群から選択されるアミノ酸配列または任意の既知のＤＮＡリガーゼ配列に対して少なくとも７０％の同一性を有するアミノ酸配列を含む。

いくつかの側面において、本開示は、偽変異の検出を軽減する二重鎖配列決定の方法であって、以下を含む方法に関する：（Ａ１）配列決定する核酸を取得すること；（Ａ２）態様１または態様２～５１のいずれか１つに記載の方法を実施すること；（Ａ３）試料を二重鎖配列決定すること；および（Ａ４）変異をコンピュータ分析により同定すること。

いくつかの側面において、コンピュータ分析は、依然としていくらかの再合成が起こる断片末端の限られた領域における偽変異の検出を避けるために、断片の末端（例：最後の１２ｂｐ）のトリミングを必要とする。

いくつかの側面において、本開示は、二重鎖配列決定におけるアーチファクトを低減する方法であって、以下を含む方法に関する：（Ａ１）配列決定する核酸を取得すること；（Ａ２）態様１または態様２～５１のいずれか１つに記載の方法を実施すること；および（Ａ３）試料を二重鎖配列決定すること。

いくつかの側面において、本開示は、配列決定のための核酸試料調製の間の、合成鎖の合成を低減する方法であって、以下を含む方法に関する：（Ａ１）配列決定する核酸を取得すること；および（Ａ２）態様１または態様２～５１のいずれか１つに記載の方法を実施すること。

いくつかの側面において、本開示は、変異同定の精度を高める方法であって、以下を含む方法に関する：（Ａ１）配列決定する核酸を取得すること；（Ａ２）態様１または態様２～５１のいずれか１つに記載の方法を実施すること；（Ａ３）試料を二重鎖配列決定すること；および（Ａ４）変異をコンピュータ分析により同定すること。

いくつかの側面において、本開示は、以下を含むキットに関する：（ａ）本開示の方法のいずれかを実施するための試薬；および（ｂ）容器。いくつかの態様において、キットはさらに反応容器を含む。いくつかの態様において、キットの試薬は：（ａ）以下の1つ以上：エンドヌクレアーゼＩＶ（ＥｎｄｏＩＶ）；エキソヌクレアーゼＶＩＩ（ＥｘｏＶＩＩ）、ホルムアミドピリミジン［ｆａｐｙ］－ＤＮＡグリコシラーゼ（Ｆｐｇ）；ウラシル－ＤＮＡグリコシラーゼ（ＵＤＧ）；Ｔ４ＤＮＡポリメラーゼ；Ｔ４ピリミジンＤＮＡグリコシラーゼ（Ｔ４ＰＤＧ）；Ｔ４ポリヌクレオチドキナーゼ（Ｔ４Ｐｎｋ）；クレノウ断片；ＨｉＦｉＴａｑリガーゼ；Ｔａｑポリメラーゼ；および／またはエンドヌクレアーゼＶＩＩＩ（ＥｎｄｏＶＩＩＩ）；および／または、（ｂ）ｄＮＴＰ、を含む。いくつかの態様において、キットはさらに、試料を断片化するための試薬および材料を含む。

いくつかの側面において、本開示は、試料の少なくとも一部が二本鎖である、核酸試料（試料）を調製する方法であって、試料を反応容器に添加すること、および、（ａ）試料を、以下が可能な１つ以上の酵素と接触させること：（ｉ）試料の鎖の５’末端をリン酸化すること；３’ヒドロキシル部分を、試料の鎖の３’末端に付加すること；および（ｉｉ）ニックをシーリングすること；（ｂ）試料を、５’および３’オーバーハングを除去すると同時にギャップ領域を消化して平滑化二重鎖を生成することができる１つ以上の酵素と接触させること；および（ｃ）デオキシアデノシン一リン酸（ｄＡＭＰ）を、試料の鎖の３’末端に付加すること（ｄＡテーリング）、を含む、前記方法に関する。

いくつかの態様において、本開示の方法は酵素の使用を含み、ここで該酵素は、Ｔ４ポリヌクレオチドキナーゼ、ＨｉＦｉＴａｑリガーゼ、またはそれらの組み合わせを含む。いくつかの態様において、本開示の方法は、ヌクレアーゼＳ１を含む酵素の使用を含む。

図面の簡単な説明
以下の図面は本明細書の一部を形成し、これらは本開示の一定の側面をさらに実証するために含まれており、これら図面の１つ以上を本明細書に提示される特定の態様の詳細な説明と組み合わせて参照することにより、さらによく理解することができる。明確にするために、すべての構成要素がすべての図面でラベル付けされているわけではない。図面に示されたデータは、決して本開示の範囲を限定するものではないことを理解されたい。図面においては、以下である：

図１は、二重鎖調製の従来方法（末端修復およびｄＡテーリング（ＥＲ／ＡＴ））と、本開示の二重鎖修復法（「二重鎖修復」）との比較を示す。二重鎖修復により提供される非限定的利点には、二重鎖修復がアダプターライゲーションの前に重合を制限して、配列決定されたほとんどの二重鎖塩基が元の入力ＤＮＡに天然に存在することを保証すること、および元々一方の鎖に限定されていた塩基損傷エラーまたはその他のミスマッチが、市販のＥＲ／ＡＴ方法で起こり得るようには両方の鎖にコピーされないこと、が含まれる。

図２Ａ～２Ｄは、ＥＲ／ＡＴを使用して鎖再合成を定量化する方法、およびKAPA（登録商標）HyperPrepキットを使用したＥＲ／ＡＴ中の鎖再合成の定量化を示す。図２Ａは、ＥＲ／ＡＴの間の埋め込み塩基を定量化するための方法の概略図である。図２Ｂは、測定されたinterpulse duration（ＩＰＤ；フレーム単位）を、５つの合成オリゴヌクレオチドの塩基位置の関数として示す。長いＩＰＤ（６０フレームを超える場合は灰色）は、修飾塩基によって生じる。垂直の破線は、ＥＲ／ＡＴの間に埋め込みの開始が予想される場所を示す。図２Ｃは、測定されたＩＰＤを、健康なドナーのｃｆＤＮＡ試料上の塩基位置の関数として示す。図２Ｄは、塩基の断片末端からの距離に対して測定された塩基エラー数のグラフを示す。２７１個のｃｆＤＮＡ試料対２個のホルマリン固定パラフィン包埋（ＦＦＰＥ）腫瘍生検の、集計の（aggregate）二重鎖エラー率（左パネル、トップおよびボトム）。測定されたinterpulse duration（ＩＰＤ；フレーム単位）を、広範な鎖再合成を受けた４つの強調表示された二重鎖の塩基位置の関数として示す（右パネル）。

図３Ａ～３Ｃは二重鎖修復の性能を示す。図３Ａは、二重鎖修復アプローチの性能を、複数の異なる合成オリゴヌクレオチドについてキャピラリー電気泳動により決定し、従来のＥＲ／ＡＴと比較して示す（ｉ～ｖｉｉ）。図３Ｂは、様々な量のＤＮａｓｅＩ（ニックの誘導のため）およびＣｕＣｌ_２／Ｈ_２Ｏ_２（酸化損傷の誘導のため）で処理した健康なドナーのｃｆＤＮＡについて、二重鎖修復対市販のＥＲ／ＡＴおよびIDT xGEN「汎がん」パネルを使用して測定した、二重鎖配列決定のエラー率を示す。図３Ｃは、ホルマリン固定腫瘍ＤＮＡの修復のために二重鎖修復対従来のＥＲ／ＡＴを使用した後の、二重鎖配列決定のエラー率を示す。二重鎖修復試料のエラーバーが広いのは、配列決定された合計の二重鎖が少ないためである。

図４は、市販のＥＲ／ＡＴおよびIDT xGEN「汎がん」パネルを使用し、様々な量のＤＮａｓｅＩおよびＣｕＣｌ_２／Ｈ_２Ｏ_２で処理した健康なドナーのｃｆＤＮＡに対して測定された、様々な変異に対する二重鎖配列決定のエラー率を示す。シトシンからアデニン（Ｃ→Ａ）への変異のエラー率の増加が、ＤＮａｓｅ１およびＣｕＣｌ_２／Ｈ_２Ｏ_２の濃度の増加に伴って観察されたことは、ＣｕＣｌ_２／Ｈ_２Ｏ_２の変異シグネチャーと整合する（Lee et al., Nucleic Acids Res., 2002）。

図５は、二重鎖修復のワークフローを示す概略図である。

図６は、Ｔ４ＤＮＡポリメラーゼがｄｓＤＮＡ上の２３ヌクレオチドのギャップを効率的に埋めることを実証する、キャピラリー電気泳動の結果を示す。

図７Ａ～７Ｂは、キャピラリー電気泳動を使用した二重鎖修復の特徴付けを示す。図７Ａは、二重鎖修復対従来のＥＲ／ＡＴ方法の概要を示す。図７Ｂは、キャピラリー電気泳動により決定された、二重鎖修復と従来のＥＲ／ＡＴの各ステップに供された様々な合成二重鎖の主要生成物の概略図である（生のトレースは図１４にある）。合成分子のフルオロフォアタグなしの末端が示されており、断片のサイズは一定の縮尺で示される。アスタリスク（^＊）で区切られた二重鎖はフルオロフォアを含有しないため、キャピラリー電気泳動で直接観察されなかった；ただしそれらの存在は、ＵＤＧおよびＦＰＧの特徴的な活性により予測されている。鎖再合成の領域は破線で示される。

図８は、キャピラリー電気泳動およびPacBio配列決定による鎖再合成の定量化に使用されるオリゴの、概略図を示す。

図９Ａ～９Ｂは、測定されたキャピラリー電気泳動ピーク位置対、６－ＦＡＭタグ付き（図９Ａ）オリゴヌクレオチドおよびATTO-550タグ付き（図９Ｂ）オリゴヌクレオチドについての真の長さの、線形回帰を示す。オリゴヌクレオチドの真の長さは、ＩＤＴの質量分析によって確認された（データは示されず）。

図１０Ａ～１０Ｂは、二重鎖修復対Kapa Hyperキットの、測定されたライブラリー変換効率を、ｇＤＮＡ入力の関数として、ｄｄＰＣＲアッセイを使用して示す。二重鎖修復のライブラリー変換効率は、Kapa Hyperキットを使用した従来のＥＲ／ＡＴのライブラリー変換効率に匹敵する。使用したｄｄＰＣＲプライマーついては、例２で詳述する。

図１１は、ＥＲ／ＡＴの間に再合成される塩基の数を定量化するための、アッセイの確立を示す。合成オリゴのどの領域に由来するかに基づいて、オリジナルまたは埋め込みとしてラベル付けされた、集計の塩基およびそのＩＰＤのヒストグラム。オリジナル領域と埋め込み領域を分割する領域では、収集を回避した。

図１２は、測定されたinterpulse duration（ＩＰＤ；フレーム単位）（ｉ）および再合成された塩基の予測パーセンテージ（ｉｉ）を、従来のＥＲ／ＡＴおよび改変ｄＮＴＰで処理した５つの合成オリゴヌクレオチド上の塩基位置の関数として示す。６０フレームを超える場合に薄い灰色で表示した、より長いＩＰＤは、修飾塩基から生じる。破線は、ＥＲ／ＡＴの間に再合成の開始が予想される位置を示す。

図１３Ａ～１３Ｃは、一分子リアルタイム配列決定を使用した、鎖再合成の定量化を示す。図１３Ａは、測定されたinterpulse duration（ＩＰＤ；フレーム単位）（ｉ）および再合成された塩基の予測パーセンテージ（ｉｉ）を、メチル化ｄＮＴＰを使用する従来のＥＲ／ＡＴで処理した５つの合成オリゴヌクレオチド上の塩基位置の関数として示す。６０フレームを超える場合に薄い灰色で表示した、より長いＩＰＤは、メチル化塩基により生じる。破線は、ＥＲ／ＡＴの間に埋め込みの開始が予想される位置を示す。図１３Ｂは、従来のＥＲ／ＡＴおよび標準または改変ｄＮＴＰで処理した５つの健康なドナーｃｆＤＮＡ試料について、測定された平均ＩＰＤを、調査した塩基の各二重鎖のいずれかの３’末端からの距離の関数として示す；挿入図は、ｃｆＤＮＡ試料およびＦＦＰＥ腫瘍生検について、各二重鎖のいずれかの末端から１２塩基を超えている再合成された塩基のフラクションを示す。図１３Ｃは、再合成された≧Ｘ個の塩基を有する二重鎖ＤＮＡ鎖のフラクションを、再合成された塩基数Ｘの関数として、従来のＥＲ／ＡＴまたは二重鎖修復で処理した、１つの損傷したｃｆＤＮＡ（１００μＭのＣｕＣｌ_２／Ｈ_２Ｏ_２および２ｍＵのＤＮａｓｅＩで処理したＨＤ＿７８ｃｆＤＮＡ）および１つのＦＦＰＥ腫瘍生検について示す。

図１４は、二重鎖修復対従来のＥＲ／ＡＴの各ステップに供された合成二重鎖の、キャピラリー電気泳動分析を示す。二重鎖修復の各ステップは、図７Ａ～７Ｂに示すように、意図された主要生成物を生成する際にその意図された機能を付与して、従来のＥＲ／ＡＴで見られる鎖再合成を最小限に抑える。オリゴヌクレオチドであって、（ｉ）５’オーバーハング、（ｉｉ）３’オーバーハング、（ｉｉｉ）ニック、（ｉｖ）１ヌクレオチドギャップ、（ｖ）５ヌクレオチドギャップ、（ｖｉ）１ヌクレオチドギャップの向かい側のウラシル、および（ｖｉｉ）１ヌクレオチドギャップの向かい側の８オキソＧ、を有する前記オリゴヌクレオチドを、従来のＥＲ／ＡＴおよび二重鎖修復の各ステップに供し、キャピラリー電気泳動に送った。各オリゴヌクレオチドのトップ鎖（top strand）の５’末端は６－ＦＡＭで標識し、各オリゴヌクレオチドのボトム鎖（bottom strand）の３’末端はATTO-550で標識した。

図１５は、病変修復酵素カクテル中の主要な酵素の活性の、キャピラリー電気泳動による特徴付けを示す。各損傷モチーフを修正する主要な酵素の活性（中央）は、病変修復酵素カクテル（下）中の他の酵素の影響を受けない。「病変修復」条件は、エンドヌクレアーゼＩＶ（ＥｎｄｏＩＶ）、ホルムアミドピリミジン［ｆａｐｙ］－ＤＮＡグリコシラーゼ（Ｆｐｇ）、ウラシル－ＤＮＡグリコシラーゼ（ＵＤＧ）、Ｔ４ピリミジンＤＮＡグリコシラーゼ（Ｔ４ＰＤＧ）、およびエンドヌクレアーゼＶＩＩＩ（ＥｎｄｏＶＩＩＩ）、およびエキソヌクレアーゼＶＩＩ（ＥｘｏＶＩＩ）による処理を示す。

図１６は、Ｔ４ＤＮＡポリメラーゼおよびＴ４ポリヌクレオチドキナーゼの活性の、キャピラリー電気泳動による特徴付けを示す。Ｔ４ＤＮＡポリメラーゼは、NEBuffer 2中３７℃で５または２７ｎｔのギャップを効率的に埋めるが、検出可能な鎖置換活性はない（中央）。ただし、室温で２７ｎｔギャップを埋めるＴ４ＤＮＡポリメラーゼの効率は、大幅に低い（下）。

図１７は、健康なドナーおよびがん患者から収集されたｃｆＤＮＡ、ならびにＦＦＰＥ腫瘍生検からのｇＤＮＡについて、最も近いＤＮＡ断片末端からの変異二重鎖塩基の距離を示す。試料は、従来のＥＲ／ＡＴまたは二重鎖修復のいずれかに供された。

図１８は、クレノウ断片（ｅｘｏ－）およびＴａｑＤＮＡポリメラーゼの活性の、キャピラリー電気泳動による特徴付けを示す。クレノウ（ｅｘｏ－）およびＴａｑＤＮＡポリメラーゼは、０．２ｍＭ（中央）または２ｍＭ（下）の濃度で存在するｄＡＴＰのみで、ｄＡテーリングを効率的に実施する。

図１９は、Ｔ４ＤＮＡリガーゼおよび５’デアデニラーゼの活性のBioAnalyzerによる特徴付けを示す。Ｔ４ＤＮＡリガーゼおよび５’デアデニラーゼは、ＮＧＳアダプターを、１５％（上）または２０％（下）重量／体積（ｗ／ｖ）のPEG 8000の存在下で、ｄＡテールを有する１６６ｂｐの平滑二重鎖に効率的にライゲートする。高いＰＥＧ濃度での偽の（spurious）分子間ライゲーションを最小限に抑えるために、二重鎖修復はアダプターライゲーションの間に１０％ｗ／ｖのPEG 8000のみを使用する。注意：上のパネルのｘ軸の単位は、BioAnalyzerソフトウェアではｂｐに変換できなかった。

図２０は、ｄＡテーリングとアダプターライゲーションの組み合わせ効率の、BioAnalyzerによる特徴付けを示す。二重鎖修復のｄＡテーリングとアダプターライゲーションの組み合わせ効率は、Kapa Hyperキットの効率よりも高い可能性がある。入力は２７４ｂｐの平滑化二重鎖であった。注意：上のパネルのｘ軸の単位は、BioAnalyzerソフトウェアではｂｐに変換できなかった。

図２１は、二重鎖修復（反応条件を最適化し、複数のAmpureクリーンアップを排除した後）の性能の、キャピラリー電気泳動による特徴付けを示す。二重鎖修復は、ＮＧＳアダプターにライゲートされたオリゴヌクレオチド（これは配列決定用途にすぐに使用できる）の主要生成物の形成を促進する。「ニックシーリング生成物」（中央）は、二重鎖修復のステップ１～３の後に、ただしｄＡテーリングの前に収集した。「アダプターライゲーション生成物」（下の行）には、二重鎖修復プロトコル全体およびＮＧＳアダプターへのライゲーションを経て、さらに３９～４０または３７～３８ｂｐ（固有の分子インデックスは、３塩基対または４塩基対のいずれか）が、二重鎖修復後のオリゴヌクレオチドの露出した３’末端および５’末端にそれぞれ付加されている。

図２２は、二重鎖修復（反応条件を最適化し、複数のAmpureクリーンアップを排除した後）の性能の、ＤＮＡ入力質量の関数としての、キャピラリー電気泳動による特徴付けを示す。二重鎖修復は、２０～２００ｎｇの範囲のｃｆＤＮＡ入力をＮＧＳ用に調製するのに効果的である。「ニックシーリング生成物」（上の行）は、二重鎖修復のステップ１～３の後に、ただしｄＡテーリングの前に収集した。「アダプターライゲーション生成物」（下の行）には、二重鎖修復プロトコル全体およびＮＧＳアダプターへのライゲーションを経て、さらに３９～４０または３７～３８ｂｐ（固有の分子インデックスは、３塩基対または４塩基対のいずれか）が、二重鎖修復後のオリゴヌクレオチドの露出した３’末端と５’末端にそれぞれ付加されている。

図２３Ａ～２３Ｄは、一分子リアルタイム（ＳＭＲＴ）配列決定を使用した、鎖再合成の定量化を示す。図２３Ａは、再合成領域の同定を助けるために改変ｄＮＴＰを使用した、PacBio ＳＭＲＴ配列決定のための、ライブラリー構築の概略図を示す。図２３Ｂは、従来のＥＲ／ＡＴおよび二重鎖修復のいくつかのバリエーションを使用して再合成された、内部塩基対（元の二重鎖断片の両端から＞１２ｂｐ）の推定フラクションを示す。図２３Ｃは、３つの試料タイプにわたり、環状コンセンサス配列（ＣＣＳ）リード鎖について観察された平均interpulse duration（ＩＰＤ；フレーム単位）を、それらの鎖の元の３’末端からの距離に対して示す。図２３Ｄは、３つの試料タイプにわたり従来のＥＲ／ＡＴおよび二重鎖修復の両方について、再合成された内部塩基対の推定フラクションを示す。

図２４は、ＦＦＰＥおよびｃｆＤＮＡ試料タイプにわたり、標準的なｄＮＴＰを使用した内部塩基対の、バックグラウンドの推定再合成を示す。

図２５は、ＤＮａｓｅ１の活性のBioAnalyzerによる特徴付けを示す。入力は、１００ｂｐのｄｓＤＮＡオリゴであった。結果は、ＤＮａｓｅ１が２０ｍＵになるまで、優勢な断片長は依然として１００ｂｐであることを示す。

図２６は、ＤＮａｓｅ１の活性の、キャピラリー電気泳動による特徴付けを示す。試験したすべての濃度のＤＮＡｓｅ１について、キャピラリー電気泳動によって決定された主要生成物は１００ｍｅｒの二重鎖である。ただし、中間サイズの断片（ボックス内に表示）は２ｍＵおよび２０ｍＵのＤＮａｓｅ１で検出され、２ｍＵ以上のＤＮａｓｅ１ニックを示唆するが、ｄｓＤＮＡを著しく分解はしない。これらの中間サイズの断片は、熱の前処理および変性が必要なため、キャピラリー電気泳動トレース中に存在するが、変性のないBioAnalyzerトレース上には存在しない（図２４）。

図２７は、ＣｕＣｌ_２／Ｈ_２Ｏ_２の酸化活性の、サンガー配列決定による特徴付けを示す。入力は２７４ｂｐのｄｓＤＮＡオリゴであり、様々な濃度のＣｕＣｌ_２／Ｈ_２Ｏ_２で処理された。破線のボックスは、１０００μＭのＣｕＣｌ_２／Ｈ_２Ｏ_２で処理した場合にＣ→Ａ変異が検出される場所を示す。配列番号３４が示される。

図２８Ａ～２８Ｄは、ｃｆＤＮＡおよびＦＦＰＥ腫瘍生検のターゲットパネル配列決定（targeted panel sequencing）を示す。図２８Ａは、様々な濃度のＤＮａｓｅＩ（ニックを誘導するため）およびＣｕＣｌ_２／Ｈ_２Ｏ_２（酸化損傷を誘導するため）で損傷され、その後、二重鎖修復または従来のＥＲ／ＡＴを用いて修復された（条件当たり３つの複製）、ＨＤ＿７８ｃｆＤＮＡの測定された二重鎖配列決定エラー率を示す。図２８Ｂは、従来のＥＲ／ＡＴまたは二重鎖修復で処理した、４つの健康なｃｆＤＮＡ試料（条件当たり３つの複製）、３つのがん患者ｃｆＤＮＡ試料（条件当たり１つの複製）、および５つのがん患者ＦＦＰＥ腫瘍生検（条件当たり３つの複製）の、二重鎖配列決定エラー率を示す。図２８Ｃは、集計の変異塩基および元の二重鎖断片の末端に対するそれらの位置を示す。破線は断片内部の閾値（１２ｂｐ）を表す。図２８Ｄは、図２８Ｂからのエラー率を、図２３Ｄからの対応する内部塩基対再合成フラクションの推定値と比較して示す。ピアソン相関をすべてのデータ点に対して計算した。

図２９は、様々な濃度のＣｕＣｌ_２／Ｈ_２Ｏ_２およびＤＮａｓｅＩで処理した健康なドナーｃｆＤＮＡにおいて観察された、変異コンテキスト別のエラー率を示す。

図３０は、従来のＥＲ／ＡＴ対二重鎖修復で処理されたｃｆＤＮＡ試料およびＦＦＰＥ腫瘍生検についての、汎がんパネルの二重鎖配列決定において観察された、変異コンテキスト別のエラー率を示す。

図３１Ａ～３１Ｄは、ｃｆＤＮＡおよびＦＦＰＥ腫瘍生検のターゲットパネル配列決定を示す。図３１Ａは、様々な濃度のＤＮａｓｅＩ（ニックを誘導するため）およびＣｕＣｌ_２／Ｈ_２Ｏ_２（酸化損傷を誘導するため）で損傷させ、その後、二重鎖修復または従来のＥＲ／ＡＴを用いて修復したＨＤ＿７８ｃｆＤＮＡの、測定された二重鎖配列決定エラー率を示す（条件当たり３つの複製）。図３１Ｂは、従来のＥＲ／ＡＴ対二重鎖修復に供され、同数の評価可能な二重鎖（ＤＳＣ）について正規化された、重度に損傷したｃｆＤＮＡ試料（２ｍＵのＤＮａｓｅＩ、１００μＭのＣｕＣｌ_２／Ｈ_２Ｏ_２）の汎がんパネル二重鎖配列決定におけるバックグラウンドエラーを示す。図３１Ｃ～３１Ｄは、二重鎖修復対従来のＥＲ／ＡＴで処理されたがん患者ｃｆＤＮＡ試料（条件当たり１つの複製、図３１Ｃ）および５つのＦＦＰＥ腫瘍生検（条件当たり３つの複製、図３１Ｄ）の、二重鎖配列決定エラー率を示す。図３１Ｃ～３１Ｄは、二重鎖修復対従来のＥＲ／ＡＴで処理されたがん患者ｃｆＤＮＡ試料（条件当たり１つの複製、図３１Ｃ）および５つのＦＦＰＥ腫瘍生検（条件当たり３つの複製、図３１Ｄ）の、二重鎖配列決定エラー率を示す。

図３２Ａ～３２Ｆ：二重鎖修復は鎖の再合成を低減し、配列決定精度を向上する。図３２Ａは、カスタムの一分子配列決定アッセイを用いて測定した、従来のＥＲ／ＡＴおよび二重鎖修復のいくつかのバリエーションを使用して再合成された内部塩基対（元の二重鎖断片のいずれかの末端から＞１２ｂｐ）の、推定フラクションを示す。図３２Ｂは、３つの試料タイプにわたり従来のＥＲ／ＡＴおよび二重鎖修復の両方について再合成された、内部塩基対の推定フラクションを示す。図３２Ｃは、従来のＥＲ／ＡＴまたは二重鎖修復で処理した、４つの健康なｃｆＤＮＡ試料（条件当たり３つの複製）、３つのがん患者ｃｆＤＮＡ試料（条件当たり１つの複製）、および５つのがん患者ＦＦＰＥ腫瘍生検（条件当たり３つの複製）の、二重配列決定エラー率を示す。図３２Ｄは、集計の変異塩基および、元の二重鎖断片の末端に対するそれらの位置を示す。破線は、断片内部の閾値（１２ｂｐ）を表す。図３２Ｅは、様々な濃度のＤＮａｓｅＩ（ニックを誘発する）およびＣｕＣｌ_２／Ｈ_２Ｏ_２（酸化損傷を誘発する）で損傷され、その後、二重鎖修復または従来のＥＲ／ＡＴを使用して修復したＨＤ＿７８ｃｆＤＮＡの、測定された二重鎖配列決定エラー率を示す（条件当たり３つの複製）。図３２Ｆは、ｃｆＤＮＡおよびＦＦＰＥ試料タイプに対する従来のＥＲ／ＡＴおよび二重鎖修復の比較を示し、リードのin silicoダウンサンプリングを介した分析により、リードペアの数の関数としての同等の二重鎖回収を示す。

図３３Ａ～３３Ｃ：図３３Ａは、二重鎖修復および二重鎖修復「ｖ２」（例：二重鎖修復の代替方法）の概要を、従来のＥＲ／ＡＴ方法と比較して示す。図３３Ｂは、キャピラリー電気泳動によって決定された、二重鎖修復および従来のＥＲ／ＡＴの各ステップに供された様々な合成二重鎖の主要生成物の概略図を示す。合成分子のフルオロフォアのタグなし末端が示されており、断片のサイズは一定の縮尺で示される。アスタリスク（^＊）で区切られた二重鎖はフルオロフォアを含有しないため、キャピラリー電気泳動では直接観察されなかった；ただしそれらの存在は、ＵＤＧとＦＰＧの特徴的な活性により予測されている。鎖再合成の領域は、破線で示される。図３３Ｃは、ｄｄＰＣＲアッセイを使用することにより、ＤＮＡ入力の関数としての、二重鎖修復対KAPA（商標）HyperPrepキットの測定されたライブラリー変換効率を示す。

図３４は、NEB PRECR（登録商標）前処理を用いた従来のＥＲ／ＡＴ修復（左の列）と、二重鎖修復（ＤＲ）ＥＲ／ＡＴ（右の列）との間のステップ毎の比較を示す。

図３５Ａ～３５Ｃは、従来のＥＲ／ＡＴ（NEB PRECR（登録商標）および／またはＥｘｏＶＩＩによる任意の前処理を伴う）対二重鎖修復（ＤＲ）ＥＲ／ＡＴの各ステップに関連する構造（図３５Ａ）の説明を提供する。ステップ（ｉ）～（ｖｉｉ）のそれぞれにおける酵素組成および活性の詳細を、従来のＥＲ／ＡＴ（NEB PRECR（登録商標）および／またはＥｘｏＶＩＩによる任意の前処理を伴う）について図３５Ｂに、および二重鎖修復について図３５Ｃに示す。ステップ（ｉ）～（ｖｉｉ）のそれぞれにおける酵素組成および活性の詳細を、従来のＥＲ／ＡＴ（NEB PRECR（登録商標）および／またはＥｘｏＶＩＩによる任意の前処理を伴う）について図３５Ｂに、および二重鎖修復について図３５Ｃに示す。

図３６は、ＨｉＦｉＴａｑＤＮＡリガーゼの活性の、キャピラリー電気泳動による特徴付けを示す。ＨｉＦｉＴａｑＤＮＡリガーゼは、NEBuffer 2とＨｉＦｉＴａｑリガーゼ緩衝液の混合物（下）において、ＨｉＦＴａｑリガーゼ緩衝液単独（中央）の場合と同様に、ニックを効率的にシールする。

図３７Ａ～３７Ｄは、ｃｆＤＮＡおよびＦＦＰＥ腫瘍生検に適用された、従来のＥＲ／ＡＴによる再合成塩基の定量化を示す。標準ｄＮＴＰまたは改変ｄＮＴＰのいずれかを有する従来のＥＲ／ＡＴを、健康なｃｆＤＮＡ（図３７Ａ）およびＦＦＰＥ腫瘍生検（図３７Ｂ）に適用した場合のＩＰＤシグナル、および、健康なｃｆＤＮＡ（図３７Ｃ）およびＦＦＰＥ腫瘍生検（図３７Ｄ）について、ＥＲ／ＡＴの間に埋められた塩基数の対応する推定値。標準ｄＮＴＰまたは改変ｄＮＴＰのいずれかを有する従来のＥＲ／ＡＴを、健康なｃｆＤＮＡ（図３７Ａ）およびＦＦＰＥ腫瘍生検（図３７Ｂ）に適用した場合のＩＰＤシグナル、および、健康なｃｆＤＮＡ（図３７Ｃ）およびＦＦＰＥ腫瘍生検（図３７Ｄ）について、ＥＲ／ＡＴの間に埋められた塩基数の対応する推定値。

詳細な説明
次世代配列決定（ＮＧＳ）の精度向上は、臨床医学における重要な目標である。これは、臨床検体中の低含量の変異を検出しようとする場合に特に重要であり、例えば、早期がん検出（Chabon et al., Nature, 2020；Corcoran et al., Ann Rev Cancer Bio, 2019）、微小残存病変（「ＭＲＤ」）のモニタリング（Parsons et al., Clinic Cancer Res, 2020; Tie et al., Sci Trans Med, 2016）、アクションが可能な（actionable）変異または耐性変異の追跡（Parikh et al., Nat Med, 2019）、出生前遺伝子検査の実施（Lo et al., Sci Trans Med, 2010）および微生物またはウイルス感染の検出（Blauwkamp et al., 2019）などのためであり、なぜならばエラーは、不正確な診断および処置につながり得るからである。ＤＮＡ塩基の損傷は、ＮＧＳにおける偽変異発見の主な原因である（Chen et al., Science, 2017）。シトシンの脱アミノ化、チミン二量体、ピリミジン二量体、８－オキソグアニン、６－Ｏ－メチルグアニン、脱プリン化、および脱ピリミジン化などの病変は、自然発生的に発生する場合と、次のような環境および化学的暴露に反応して発生する場合がある：紫外線（ＵＶ）照射、電離放射線、活性酸素種、および遺伝毒性物質、または試料処理手順、例えばホルマリン固定、凍結と解凍、加熱、音響剪断、および水溶液での長期保存など（Costello et al., Nucleic Acids Res, 2013；Wong et al., BMC Med Genomics, 2014）。修正することなく放置すると、かかる病変は、損傷乗り越え合成（translesion synthesis）が可能なポリメラーゼによってコピーされる場合に塩基対合の変化をもたらし、それによって偽変異の検出につながる可能性がある。これらの問題は、ライブラリー増幅および配列決定で導入される他のエラーと共に、標準的なＮＧＳにおいてエラー率０．１％～１％に寄与する（Salk et al., Nat Rev Genetics, 2018）。

塩基損傷エラーの偶然性のため、多くは、各ＤＮＡ断片の複数コピーを配列決定し、リード間のコンセンサスを必要とすることによって、克服することができる。かかる「コンセンサスベースの」配列決定は、ＤＮＡの各一本鎖からのコンセンサスを必要とする場合は最大１００倍まで、各ＤＮＡ二重鎖の両方のセンス鎖からのコンセンサスを必要とする場合は最大１０００倍まで、エラーを減らすことができる。

二重鎖の両方のセンス鎖の配列決定および読み取りを必要とする方法は、「二重鎖配列決定」として知られている（Schmitt et al., PNAS, 2012）。しかし、二重鎖ＤＮＡの主鎖損傷（例：ニック、ギャップ、およびオーバーハング）を修正し、かつＮＧＳアダプターのライゲーションを促進するために使用される「末端修復／ｄＡテーリング」（ＥＲ／ＡＴ）のための既存の方法では、アダプターライゲーションの前に各二重鎖の一部が再合成される可能性がある。塩基損傷の存在下で再合成が起こると、損傷乗り越え合成によりエラーが両方の鎖にコピーされ、両方の鎖上の真の変異と区別できなくなる可能性がある。

二重鎖配列決定における偽の発見の、この主な原因は、短い５’オーバーハングが埋められることが多い断片末端において最も明確に見られる。しかしこれは、（ｉ）ＥＲ／ＡＴで使用されるＴａｑおよびクレノウポリメラーゼの５’エキソヌクレアーゼ活性および鎖置換活性、および（ｉｉ）鎖再合成の「プライミング部位」として機能し得る様々な主鎖損傷、を考慮すると、さらに深くまで及び得る。

本明細書に開示されるのは、二重鎖修復と呼ばれるワークフローアプローチであり、これは塩基損傷エラーが両方の鎖にコピーされる可能性を、ある程度は、ＮＧＳアダプターライゲーション前の重合を最小限に抑え、二重鎖配列決定エラー率を劇的に低下させることにより制限するアプローチである（例えば、図１参照）。

本明細書において別段の定義がない限り、本明細書で使用されるすべての技術用語および科学用語は、本発明が属する技術分野の当業者によって一般的に理解されるのと同じ意味を有する。本明細書に記載のものと類似または等価の任意の方法および材料を、本発明の実施または試験に使用することができるが、好ましい方法および材料について説明する。

本明細書で参照されるすべての特許および刊行物（かかる特許および刊行物内に開示されるすべての配列を含む）は、参照により明示的に組み込まれる。

数値範囲は、範囲を定義する数値を含む。別段の指示がない限り、核酸は左から右に５’から３’の方向で記載される；アミノ酸配列はそれぞれ、左から右にアミノからカルボキシの方向で記載される。

本明細書で提供される見出しは、本発明の様々な側面または態様を限定するものではない。したがって、すぐ下で定義される用語は、明細書全体を参照することによってより完全に定義される。

別段の定義がない限り、本明細書で使用されるすべての技術用語および科学用語は、本発明が属する技術分野の当業者によって一般に理解されるのと同じ意味を有する。Singleton, et al., DICTIONARY OF MICROBIOLOGY AND MOLECULAR BIOLOGY, 3D ED., John Wiley and Sons, New York (2006)、およびHale & Markham, THE HARPER COLLINS DICTIONARY OF BIOLOGY, Harper Perennial, N.Y. (1991)は、本明細書で使用される多くの用語の一般的な意味を、当業者に提供する。ただし特定の用語については、明確さおよび参照の容易さのために、以下に定義する。

本明細書で使用され得る用語「変異」は、野生型配列と比較した場合の、核酸中のヌクレオチドに対する変化、変更、または改変を指す。例えば、限定されないが、変異は、置換、挿入、欠失、またはそれらの任意の組み合わせを含み得る。いくつかの態様において、少なくとも１つの変異が存在する。いくつかの態様において、複数の変異が存在する。いくつかの態様において、複数の変異が存在する場合、変異は別個である（例えば、同じ種類ではない（例：置換、挿入、欠失））。いくつかの態様において、複数の変異が存在する場合、それらの変異は同一である（例えば、同じ種類（例：置換、挿入、欠失））である。さらに、いくつかの態様において、変異はフレームシフトを引き起こす。本明細書で互換的に使用される「野生型」および「ネイティブな」という用語は当業者に理解される専門用語であり、自然界に存在する物品、生物、株、遺伝子、または特徴の典型的な形態であって、操作された、変異体、またはバリアント形態から区別されるものを意味する。

用語「核酸」、「ヌクレオチド配列」、「ポリヌクレオチド」、「オリゴヌクレオチド」、および「ヌクレオチドのポリマー」という用語は、本明細書において互換的に使用され得るように、少なくとも２つの、核酸塩基－糖－リン酸塩の組み合わせ（例えば、ヌクレオチド）のストリングを指し、とりわけ、一本鎖ＤＮＡおよび二本鎖ＤＮＡ、一本鎖領域と二本鎖領域の混合物であるＤＮＡ、一本鎖ＲＮＡおよび二本鎖ＲＮＡ、および一本鎖領域と二本鎖領域の混合物であるＲＮＡ、ハイブリッド分子であって、一本鎖、より典型的には二本鎖、または一本鎖領域と二本鎖領域の混合物であり得るＤＮＡおよびＲＮＡを含む前記ハイブリッド分子である。さらに、本明細書で使用される用語（例：核酸など）は、ＲＮＡまたはＤＮＡ、またはＲＮＡとＤＮＡの両方を含む、三本鎖領域を指し得る。かかる領域の鎖は、同じ分子に由来するものであっても、異なる分子に由来するものであってもよい。領域は、１つ以上の分子のすべてを含み得るが、より一般的には、分子の一部の領域のみを含む。三重らせん領域の分子の１つは、しばしばオリゴヌクレオチドと呼ばれる。

用語（例：核酸など）はまた、化学的、酵素的、または代謝的に改変された核酸の形態、ならびに単純型および複雑型細胞を含む、ウイルスおよび細胞に特徴的なＤＮＡおよびＲＮＡの化学的形態も包含する。例えば、本明細書で使用される用語（例：核酸など）は、１つ以上の修飾塩基を含む本明細書に記載のＤＮＡまたはＲＮＡを含むことができる。核酸はまた、以下も含み得る：天然ヌクレオシド（すなわち、アデノシン、チミジン、グアノシン、シチジン、ウリジン、デオキシアデノシン、デオキシチミジン、デオキシグアノシン、およびデオキシシチジン）、ヌクレオシド類似体（例：２－アミノアデノシン、２－チオチミジン、イノシン、ピロロピリミジン、３－メチルアデノシン、５－メチルシチジン、Ｃ５ブロモウリジン、Ｃ５フルオロウリジン、Ｃ５ヨードウリジン、Ｃ５プロピニルウリジン、Ｃ５プロピニルシチジン、Ｃ５メチルシチジン、７デアザアデノシン、７デアザグアノシン、８オキソアデノシン、８オキソグアノシン、Ｏ（６）メチルグアニン、４－アセチルシチジン、５－（カルボキシヒドロキシメチル）ウリジン、ジヒドロウリジン、メチルシュードウリジン、１－メチルアデノシン、１－メチルグアノシン、Ｎ６－メチルアデノシン、および２－チオシチジン）、化学的修飾塩基、生物学的修飾塩基（例：メチル化塩基）、インターカレート塩基、修飾糖（例：２’－フルオロリボース、リボース、２’－デオキシリボース、２’－Ｏ－メチルシチジン、アラビノース、およびヘキソース）、または修飾リン酸基（例：ホスホロチオアートおよび５’Ｎホスホロアミダイト結合）。したがって、２つの例のみを挙げると、イノシンなどの異常な塩基を含むＤＮＡまたはＲＮＡ、またはトリチル化塩基などの修飾塩基は、本明細書で使用される用語としての核酸である。用語（例：核酸など）はまた、ペプチド核酸（ＰＮＡ）、ホスホロチオアート、およびネイティブな核酸のリン酸主鎖の別のバリアントも含む。天然の核酸はリン酸主鎖を有し、人工核酸は他の種類の主鎖を含有することができるが、含有される塩基は同じである。したがって、安定性または他の理由で主鎖が改変されたＤＮＡまたはＲＮＡは、その用語が本明細書で意図されているように、核酸である。

本明細書で使用され得る「核酸塩基」という用語は、窒素塩基として当業者に知られている技術用語であり、ヌクレオシドの構成要素を形成する窒素含有生物学的化合物であり、それ自体はヌクレオチドの構成要素である。核酸塩基（本明細書では単に塩基とも呼ばれる）は、塩基対を形成しかつ互いに積み重なって長鎖らせん構造を形成する能力を有するため、核酸（例えば、ＤＮＡ、ＲＮＡ）の基本構成ブロックの１つである。５つの標準的な核酸塩基が存在する：アデニン（Ａ）、シトシン（Ｃ）、グアニン（Ｇ）、チミン（Ｔ）、およびウラシル（Ｕ）であり、Ａ、Ｃ、Ｇ、およびＴはＤＮＡに見出され、Ａ、Ｃ、Ｇ、およびＵはＲＮＡに見出される。

本明細書で使用され得る用語「ヌクレオシド」は、リン酸基のないヌクレオチドであることが一般に知られているグリコシルアミン（例：Ｎ－グリコシド）を指す。ヌクレオシドは、核酸塩基（例：窒素塩基）と五炭糖（例：ペントース）から構成される。五炭糖は、リボースまたはデオキシリボースのいずれかであり得る。ヌクレオシドは、ＲＮＡおよびＤＮＡの構成成分であるヌクレオチドの生化学的前駆体である。ヌクレオシドの例には、シチジン（Ｃ）、ウリジン（Ｕ）、アデノシン（Ａ）、グアノシン（Ｇ）、チミジン（Ｔ）、およびイノシン（Ｉ）が含まれるが、バリアント（例：改変または合成ヌクレオシド、改変または合成核酸塩基を含有するヌクレオシド）も含まれる。

本明細書で使用され得る「ヌクレオチド」という用語は、一般に、核酸塩基、糖、およびリン酸塩（例：ヌクレオシドおよびリン酸塩）を含む組成物を指すことが当業者に知られている技術用語である（これらの組成物（例：ヌクレオチド）は、プリンとピリミジンに分離される）。ヌクレオチドは、ポリメラーゼを用いてコピーすることができる核酸の構成要素である。ヌクレオシドであるシチジン（Ｃ）、ウリジン（Ｕ）、アデノシン（Ａ）、グアノシン（Ｇ）、チミジン（Ｔ）、およびイノシン（Ｉ）は、リン酸基と共に標準ヌクレオチドを表し、合成反応で使用される個々のヌクレオチド（例：３つのリン酸基を有するヌクレオチド（例：「三リン酸」））を指す場合、ＤＮＡ形態（例：デオキシリボースを有する）において、ｄＡＴＰ、ｄＧＴＰ、ｄＣＴＰ、およびｄＴＴＰと呼ばれ得る。リン酸基のうちの２つを加水分解すると、核酸の重合に使用する一リン酸ヌクレオチドが得られる。一般に、ｄＡＴＰ、ｄＧＴＰ、ｄＣＴＰ、およびｄＴＴＰは、ｄＮＴＰと呼ばれることがあり、ここで「Ｎ」は、ヌクレオシドの性質に関する曖昧さを表す。したがってｄＮＴＰの混合物は、それぞれの全部または一部の濃度を含み得る。ヌクレオチドは、既知のプリン塩基およびピリミジン塩基のみでなく、損傷を受けた他の複素環塩基（例：酸化、メチル化、アシル化、脱デニル化された塩基など）も含有する。この用語は当技術分野ではよく知られており、当業者には容易に理解されるであろう。

ＤＮＡ合成は、酵素ベースの合成方法（例：鋳型鎖に基づくＤＮＡポリメラーゼ）および化学合成方法の両方を包含する。様々な態様において、ＤＮＡ合成とは酵素プロセスを指し、このプロセスによりＤＮＡポリメラーゼは、入ってくるヌクレオチド塩基対を成長するＤＮＡ鎖の利用可能な３’末端に逐次的に結合させる触媒作用に基づいて、成長する鎖の末端ヌクレオチドと成長する鎖に付加される入ってくるヌクレオチド塩基との間の新しいホスホジエステル結合の形成を介して、ＤＮＡの新たな鎖を生成する。典型的には、成長するＤＮＡ鎖に付加されるヌクレオチド塩基の順序は、反対側のＤＮＡ鎖によって、「鋳型」鎖上の同族塩基対との水素結合に基づく対合を介して決定される。ＤＮＡ再合成とは、ＤＮＡ二重らせんの一方の鎖のニックまたはギャップで典型的には生じる、ＤＮＡ合成の形態を指し、この時利用可能な３’末端が露出され、そこからＤＮＡ合成が起こり、ここでＤＮＡポリメラーゼは、鋳型鎖に対して新しい鎖を合成しつつ、同時に下流の既存の鎖を置き換える。

本明細書で使用され得る「ポリメラーゼ」という用語は、核酸（例：ＤＮＡポリメラーゼ、ＲＮＡポリメラーゼ）およびポリマーの合成を助けるかまたはそれらを合成する酵素を一般に指すことが当業者に知られている技術用語である。多数のポリメラーゼが知られており、例えば、限定することなく、これらはすべて本明細書で企図される；ＤＮＡポリメラーゼＩ（Ｐｏｌガンマ、Ｐｏｌシータ、Ｐｏｌニュー）、ＤＮＡポリメラーゼＩＩ（Ｐｏｌアルファ、Ｐｏｌデルタ、Ｐｏｌイプシロン、Ｐｏｌゼータ）、ＤＮＡポリメラーゼＩＩＩホロ酵素、ＤＮＡポリメラーゼＩＶ（ＤｉｎＢ）（ＳＯＳ修復ポリメラーゼ、Ｐｏｌベータ、Ｐｏｌラムダ、Ｐｏｌミュー）、ＤＮＡポリメラーゼＶ（ＳＯＳポリメラーゼ、Ｐｏｌエータ、Ｐｏｌイオータ、Ｐｏｌカッパ）、逆転写酵素、およびＲＮＡポリメラーゼ（ＲＮＡＰｏｌＩ、ＲＮＡＰｏｌＩＩ、ＲＮＡＰｏｌＩＩＩ、Ｔ７ＲＮＡＰｏｌ、ＲＮＡレプリカーゼ、プライマーゼ）。さらに企図されるのは、細菌（例：Thermus aquaticus）由来のポリメラーゼである。例えば、Thermus aquaticusからのＴａｑは、ポリメラーゼ連鎖反応（ＰＣＲ）で使用される一般的なＤＮＡポリメラーゼである。いくつかの態様において、ポリメラーゼは、Ｔａｑポリメラーゼである。いくつかの態様において、ポリメラーゼは、３’→５’エキソヌクレアーゼ活性を欠いている。いくつかの態様において、ポリメラーゼは、クレノウ断片である。いくつかの態様において、ポリメラーゼは、３’→５’エキソヌクレアーゼ活性を欠くクレノウ断片である。いくつかの態様において、ポリメラーゼは、本明細書に記載されるポリメラーゼのいずれかのヒトバリアントである。

本明細書で使用され得る用語「アダプターライゲーション」は、ヌクレオチド（例：核酸、オリゴヌクレオチド、例えばアダプター）の既知の配列を、１つ以上の核酸（例：ＤＮＡ断片、ＤＮＡの相補鎖）の１つ以上の末端に付着（例：ライゲーション）するプロセスを一般に指すことが当業者に知られている用語を指す。多くの場合、アダプターは、それらが結合することが意図されている核酸断片に相補的な特定の配列を含有するが、例えば限定されないが、核酸がｄＡテール付きの場合、アダプターは「Ｔ」オーバーハングを有し得、ここで「Ｔ」は、チミン核酸塩基を含むヌクレオチドを指す。ＴオーバーハングはｄＡテールに相補的であるため、ライゲーションが容易になる。

本明細書で使用され得る用語「ｄＡテーリング」は、非鋳型アデノシン（Ａ）（例：アデノシン一リン酸）を含む「テール」を有する核酸（例：ＤＮＡ、ＲＮＡ）の状態または特徴を指す。「テール」とは、核酸（例：ＤＮＡ、ＲＮＡ）の３’末端のアデノシン（例：ＡＡＡＡＡ）が、相補鎖の５’末端ヌクレオチドを越えるオーバーハングを含むことを意味する。用語（例：ｄＡテール）は、アデノシンが核酸の３’末端に付加されるプロセスを説明する動詞（例：ｄＡテーリング）として使用される場合があるいくつかの態様において、ｄＡテーリングは、３’→５’エキソヌクレアーゼ活性を欠くクレノウ断片を用いて実施される。いくつかの態様において、ｄＡテーリングは、Ｔａｑポリメラーゼを用いて実施される。

本明細書で使用され得る用語「オーバーハング」は、反対側の鎖（例：相補鎖）の末端（例：末端ヌクレオチド）を越えて伸びる（例：突き出る）二本鎖核酸の部分を指すと当業者に知られている技術用語を指す。例えば、これに限定されないが、５’オーバーハングは、それと結合して二本鎖核酸二重鎖を形成する反対側の鎖（例：相補鎖）の３’末端（３’末端ヌクレオチド）を越えて伸びる核酸の鎖の部分を指すであろう。さらなる例として、限定されないが、３’オーバーハングは、それと結合して二本鎖核酸二重鎖を形成する反対側の鎖（例：相補鎖）の５’末端（５’末端ヌクレオチド）を越えて伸びる核酸の鎖の部分を指すであろう。当業者に理解されるように、二本鎖二重鎖（double-stranded duplex）は、５’および３’オーバーハングの両方、単一の５’オーバーハング、２つの５’オーバーハング、単一の３’オーバーハング、２つの３’オーバーハング、１つのオーバーハング（例：５’または３’）と１つの平滑末端、または２つの平滑末端を含み得る。本明細書で使用される用語「平滑末端」は、二本鎖二重鎖の性質を指し、ここで二重鎖を形成する２つの鎖は同じヌクレオチド対で終結し、したがって二重鎖のその末端にオーバーハングを有さない（例：末端は平滑である）。

本明細書で使用され得る用語「エキソヌクレアーゼ」は、核酸（例：ポリヌクレオチド、オリゴヌクレオチド）の末端からヌクレオチドを切断する活性を少なくとも有する酵素を指すことが当業者に一般に知られている技術用語を指す。いくつかの態様において、エキソヌクレアーゼは、ヌクレオチドを一度に１つずつ切断する。エキソヌクレアーゼは、核酸のいずれかの方向（例：５’末端からまたは３’末端からのいずれか）でヌクレオチドを切断することができる。かかる活性の説明において、ヌクレオチドを核酸の５’末端から開始して（例：３’末端の遠位にある５’ヌクレオチド）切断するエキソヌクレアーゼを指す場合、多くの場合表記は５’→３’エキソヌクレアーゼ活性と示され、または、ヌクレオチドを核酸の３’末端から開始して（例：５’末端の遠位にある３’ヌクレオチド）切断するエキソヌクレアーゼを指す場合、３’→５’エキソヌクレアーゼ活性と示される。いくつかの態様において、エキソヌクレアーゼは５’→３’エキソヌクレアーゼ活性を有する。いくつかの態様において、エキソヌクレアーゼは、ＥｘｏＶＩＩであり得る。

用語「相補的」および「相補性」は、本明細書において互換的に使用され得るように、鎖（例：オリゴヌクレオチド）内の核酸（例：ＲＮＡ、ＤＮＡ）におけるヌクレオチド（例：Ａ、Ｃ、Ｇ、Ｔ、Ｕ）の特性であって、反対方向の核酸鎖（例：平行に走っているが逆方向（すなわち、５’－３’が３’－５’と整列する、および３’－５’が５’－３’と整列する））内の別の特定のヌクレオチドと対合する（すなわち、ワトソン・クリック塩基対合ルール）ところの、前記特性を指す。デオキシリボ核酸（ＤＮＡ）に関して、相補的塩基対合は、アデニン（Ａ）とチミン（Ｔ）（例：ＡとＴ、ＴとＡ）、グアニン（Ｇ）とシトシン（Ｃ）（例：ＧとＣ、ＣとＧ）であり、リボ核酸（ＲＮＡ）に関して、相補的塩基対合は、Ａとウラシル（Ｕ）（例：ＡとＵ、ＵとＡ）、およびＧとＣ（例：ＧとＣ、ＣとＧ）である。これは、各塩基対がその相補的な塩基（例：Ａ－Ｔ／Ｕ、Ｔ／Ｕ－Ａ、Ｃ－Ｇ、Ｇ－Ｃ）と同数の水素結合を形成する能力によって生じ、例えばグアニンとシトシンの間の結合は、常に２つの水素結合を共有するＡ－Ｔ／Ｕ結合と比べて、３つの水素結合を共有する。

核酸の対の少なくとも一方の鎖のすべての塩基が、その相補的塩基対の反対側にある場合、かかる鎖はもう一方の鎖の配列に対して完全に相補的であるとみなされる。かかる鎖の１つ以上の塩基が、その相補的な塩基対を除く任意の他の塩基の反対側の位置にある場合、その塩基は「ミスマッチ」とみなされ、鎖は部分的に相補的であるとみなされる。したがって、鎖は、整列する塩基がなくなるまで、様々な程度の部分相補性を示すことができ、整列した時点でそれらは非相補的となる。

他の非標準ヌクレオチド（例：５－メチルシトシン、５－ヒドロキシメチルシトシン）は当技術分野で知られており、それらの特性および相補性は当業者には容易に明らかであろう。

二重鎖修復は、試料中に広範なＤＮＡ損傷がある場合でも、高精度の配列決定を保証することができる。ここでは、重度に損傷したｃｆＤＮＡ試料とＦＦＰＥｇＤＮＡ試料の両方で劇的なエラーの減少が観察されたが、ただし、二重鎖修復で修復されたＦＦＰＥｇＤＮＡ試料のエラー率は、ｃｆＤＮＡ試料のエラー率よりもわずかに高かった。塩基および主鎖の損傷は、自然に、および環境や化学剤に反応して発生し得ることを考慮すると、幅広い試料に対する二重鎖配列決定の信頼性を確保するには、二重鎖修復が必要である。

ＥｘｏＶＩＩは５’オーバーハングを完全に平滑化できないため、ギャップ領域および残りの短い（≦７ｎｔ）５’オーバーハング内で、ＤＮＡ病変修復およびオーバーハング除去ステップ後に、再合成が依然として必要であった。しかし、ギャップ領域の埋め込みを制限することで、二重鎖の最大限の回復を確保しつつ、エラーの伝播を防いだ。さらに、ＥＲ／ＡＴ中に埋められる５’オーバーハングの長さを制限することにより、断片末端内に末端修復エラーを集中させ、断片末端からの距離によってin silicoでそれらをフィルタリングすることが可能となった。さらに、ＤＮＡ病変修復およびオーバーハング除去ステップで使用された酵素カクテルは、最も一般的なＤＮＡ塩基病変のみを認識したが、一方でＤＮＡ内に生じて塩基の誤った対合につながり得る、多くの可能性ある塩基損傷が存在する（Cadet and Wagner 2013）。しかし、ＤＮＡ重合が起こらない二重鎖領域、またはポリメラーゼ（単数または複数）が損傷乗り越え合成できない二重鎖領域でそれらが偶然発生した場合、二重鎖配列決定エラーとしては現れないが、ＤＮＡ二重鎖の喪失が生じる可能性がある。

本明細書で使用され得る用語「ギャップ」は、二本鎖核酸二重鎖（例：二重鎖を形成するのに十分な相補性を有する核酸の少なくとも２つの鎖からなる、核酸）の部分を指すことが当業者に一般に知られている技術用語を指す；ギャップは一本鎖であり、その両側は二本鎖部分に結合されている。二本鎖部分の間のこの「ギャップ」は、少なくとも１つ（例えば、１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、またはそれ以上）のヌクレオシドおよび／またはリン酸塩をそれらの反対側に有さない、少なくとも１つ（例えば、１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、またはそれ以上）の一本鎖部分を含む。この用語は、反対側の鎖（例：相補鎖）の一部がギャップ内に存在しないという点で、用語「ニック」（以下でさらに定義される）と対比され、ここでニックの場合、鎖の一部は隣接するヌクレオチドに結合していない可能性があるが、しかしそれらはすべて反対側の鎖（例：相補鎖）には存在している。

本明細書で使用され得る用語「ニック」は、二本鎖核酸二重鎖（例：二重鎖を形成するのに十分な相補性を有する核酸の少なくとも２つの鎖からなる、核酸）の部分を指すことが当業者に一般に知られている技術用語を指し、ここで、鎖の２つの隣接する構成要素の間には、結合が欠如している。例えば、限定はされないが、ニックは、二重鎖の一方の鎖における２つの隣接するヌクレオチド間の連続性の欠如（例：不連続性）として説明され得る。ニックは様々な原因で形成される可能性があり、ＤＮＡの機能実行にとって有益な場合もあれば有害な場合もある。この用語は、反対側の鎖（例：相補鎖）の一部がニック内に存在せず、鎖の一部が隣接する鎖に結合できない可能性があるが、しかしそれらはすべて反対鎖（例：相補鎖）には存在するというという点で、用語「ギャップ」（上でさらに定義されているように）と対比される；一方でギャップでは、反対鎖（例：相補鎖）の一部（例：ヌクレオシド、リン酸基）が欠落している。

本明細書で開示されるのは、既存の方法に固有の問題の多くを最小化および／または除去する、二重鎖修復（ＤＲ）と呼ばれる新しいＥＲ／ＡＴ方法である。例えば、これに限定されないが、ＤＲはＮＧＳアダプターのライゲーション前の鎖再合成を最小限に抑え、これにより偽変異の発見を大幅に制限する。本明細書でわかるように、この再合成を最小限に抑えることにより、ＤＲは、二重鎖配列決定および各二重鎖の両方の鎖からの配列のコンセンサスに依存する他の関連方法の、主要なアキレス腱に対処し、最大の精度および堅牢性を提供する。

変異は、上記のように、野生型核酸とは異なる、所定の核酸（例：ＤＮＡ、ＲＮＡ）の領域（例：セクション、部分、核酸塩基、ヌクレオシド、ヌクレオチド）であり、ほとんどの場合、核酸のそれぞれの鎖に反映される。すなわち、試料に変異が存在する場合、その変異とその相補体が、配列決定時に核酸の各鎖で観察されるだろう。しかし、試料が一本鎖部分（例：ギャップ、オーバーハング）または鎖再合成を引き起こす可能性のある領域（例：ニック）を含有し得ることを考慮すると、これは問題である。この問題は、損傷塩基がそのような一本鎖領域または再合成される他の領域に存在する場合、損傷塩基がその相補鎖の合成に、それから試料が生成された核酸には元々存在しなかった塩基を含めるよう指示し得るために、発生する（損傷塩基は非標準塩基対合に影響を与える可能性があるため）。１本の鎖がミスマッチ塩基を含有する場合にも、同じことが起こり得る。かかる場合、ミスマッチは、そのネイティブのミスマッチ塩基ではなく、再合成された相補体中で対合したマッチ（paired match）を示す。これが起こると、両方の鎖の配列決定はそれぞれの鎖において変異を読み取り、変異を示す；しかしこの変異は、元の核酸を正確に反映していない可能性がある。かかる変異は、本明細書では「偽変異」と呼ばれる。偽変異は、核酸の相補鎖の再合成から生じる変異であり、試料が得られた元の（例：ネイティブ、野生型）核酸の相補鎖を表さない。

したがって、いくつかの側面において、本開示は、配列決定用の核酸試料（試料）を調製する方法であって、もともと一本の鎖に限定されていたヌクレオチド損傷または変化の増幅による偽変異の伝播を最小限に抑える、前記方法に関し、ここで試料の少なくとも一部は二本鎖であり、試料を反応容器に添加すること、ならびに以下を含む：（ａ）試料を、以下が可能な１つ以上の酵素と接触させること：（ｉ）１つ以上の損傷塩基を、試料から切除すること；（ｉｉ）１つ以上の脱塩基部位を切断すること、および得られた末端を、ＤＮＡポリメラーゼによる伸長および／またはＤＮＡリガーゼによるライゲーションに適合するように処理すること；および（ｉｉｉ）５’オーバーハングを消化すること；（ｂ）試料を、以下の１つ以上と接触させること：（ｉ）鎖置換および５’エキソヌクレアーゼ活性の両方を欠くが、試料の一本鎖セグメントを埋め、かつ試料の３’オーバーハングを消化することができる、ＤＮＡ依存性ＤＮＡポリメラーゼ；（ｉｉ）試料の鎖の５’末端をリン酸化することができる酵素；（ｃ）試料を、ニックをシーリング可能なＤＮＡリガーゼと接触させること；および（ｄ）アダプターライゲーション用の試料を調製するステップ、ここで該調製は、ｄＡＭＰを試料の鎖の３’末端に付加すること（ｄＡテーリング）を含む。

本明細書で使用され得る用語「反応容器」は、本明細書に記載の反応（例：方法）を実施するために使用される容器を指す。当業者には理解されるように、反応容器は、その中で行われる反応または方法に適したものである。例えば、プラスチック（例：ポリエチレン）、ガラス、金属、または他の適切な材料等の材料（例：本明細書に記載の方法の構成要素）であって、その中で使用される試薬（例：核酸、ｄＮＴＰ、酵素）によって分解されず、または損傷を受けにくいものを使用することができる。反応容器の例としては、９６ウェルプレート（または他の任意の数の既製ウェルプレート）、エッペンドルフチューブ、フラスコ、ビーカー、シリンダーなどが挙げられる。適切な反応容器の決定および選択は、当業者には直ちに明らかであり、過度の実験を必要としないであろう。

本明細書で使用され得る用語「リガーゼ」は、少なくとも化学結合の形成を通して２つの分子（例：ヌクレオチド、例えばヌクレオチドの糖およびリン酸基）の結合を触媒する活性を有する酵素を指すことが当業者に一般に知られている技術用語を指す。例えば、限定されないが、リガーゼは、ホスホジエステル結合の形成を通じてヌクレオチドを結合することができる（例：ＤＮＡリガーゼ（例：ＤＮＡリガーゼ１；NCBI RefSeqGene NG_007395.1；ＴａｑＤＮＡリガーゼ（例：ＨｉＦｉＴａｑＤＮＡリガーゼ；New England BioLabs, Inc.: neb.com/products/m0647-hi-fi-taq-dna-ligase#Product%20Information））。リガーゼは、本明細書で上に挙げた基本活性（例：２つの分子の結合を触媒すること）を利用する、様々な最終活性を有し得る；例えば、限定はされないが、それらはニックをシールし、および／または末端結合を可能にし得る（例：同じ核酸二重鎖に会合していない核酸などの、会合していない２つの核酸をライゲートする）。リガーゼは当技術分野で周知であり、当業者には容易に理解されるであろう。いくつかの態様において、リガーゼは、ニックシーリング活性を有する。いくつかの態様において、リガーゼは、末端結合活性を有さない（例：欠いている）。いくつかの態様において、リガーゼは、ニックシーリング活性を有するが、末端結合活性を欠いている。いくつかの態様において、リガーゼはＤＮＡリガーゼである。いくつかの態様において、リガーゼはＤＮＡリガーゼ１である。いくつかの態様において、リガーゼはＨｉＦｉＴａｑリガーゼである。いくつかの態様において、リガーゼはヒトリガーゼである。

本明細書で使用され得る用語「リアーゼ」は、少なくとも化学結合の破断（breaking）を触媒する活性を有する酵素を指すことが当業者に一般に知られている技術用語を指す。しかしリアーゼは、加水分解以外の手段（例：置換反応、付加反応、および脱離反応）によってこの破断を行うという点で、同様の活性を共有する他の酵素とは異なる。リアーゼ触媒反応は、多くの場合、炭素原子と別の原子（例：酸素、硫黄、または別の炭素原子）の間の結合を破断することによって、作用することが知られている。特定の種類のリアーゼが当分野に存在することは一般に知られており、その選択および使用は、本開示を読めば当業者には容易に明らかとなるであろう。例えば、限定されないが、いくつかの態様において、リアーゼはＡＰリアーゼ（例：ＤＮＡ－ＡＰ－リアーゼ）である。ＡＰリアーゼは、β脱離反応を介して核酸の脱塩基（例：非プリン性または非ピリミジン性）部位からのＣ_３’－Ｏ－Ｐ結合３’の切断を促進することが、当技術分野で一般に知られている。この反応により、３’末端不飽和糖と末端５’リン酸塩を有する生成物が残される。

本明細書で使用され得る用語「損傷した」とは、核酸塩基、ヌクレオシド、ヌクレオチド、または核酸を説明する文脈で使用される場合、これらの構成要素のいずれかが、その天然の状態から物質または環境要因との分解相互作用によって変化または改変されていることを指す。例えば、損傷塩基は、限定されないが、８’－オキソグアニンなどの酸化塩基、脱アミノ化塩基（例：シトシンの脱アミノ化によって生成されるウラシル、またはアデニンの脱アミノ化によって生成されるヒポキサンチン（例：イノシンに見られるような））、酸化ピリミジン、および／またはシクロブタンピリミジン二量体を指し得る。損傷塩基（例：ＤＮＡ病変）は当技術分野で周知であり、誤ったまたは非標準的な塩基対合（例：Ａ／Ｔ、Ｃ／Ｇ、Ａ／Ｕ以外の塩基対合）をもたらす可能性がある。さらに、この用語（例：損傷した）は、脱塩基部位を含むものと理解されるべきである。脱塩基部位とは、一般に、プリンもピリミジンも見出されない（例：ヌクレオチドがピリミジンでもプリンでもない）核酸（例：ＤＮＡ、ＲＮＡ）内の部位を指すことが、当技術分野で知られている。脱塩基部位は、ＤＮＡの糖リン酸主鎖は無傷であるが、核酸塩基自体が欠落している場合に発生する可能性がある。

二重鎖配列決定
二重鎖配列決定は、二重鎖の両方の鎖からの情報を用いて、試料または試料を得た対象のゲノムプロファイルに関する結果を生成する、核酸配列決定の一種である。本明細書で使用される用語「対象」は、本明細書の主題を用いた処置または診断を必要とする任意の生物を指す。例えば、限定されないが、対象は哺乳動物および非哺乳動物を含み得る。いくつかの態様において、対象は哺乳動物である。いくつかの態様において、対象は非哺乳動物である。本明細書で使用される場合、「哺乳動物」とは、哺乳綱を構成する任意の動物（例：ヒト、マウス、ラット、ネコ、イヌ、ヒツジ、ウサギ、ウマ、ウシ、ヤギ、ブタ、モルモット、ハムスター、ニワトリ、シチメンチョウ、または非ヒト霊長類（例：マーモセット、マカク））である。いくつかの態様において、哺乳動物はヒトである。本明細書で使用する用語「二重鎖配列決定」は、各ＤＮＡ二重鎖の両方の鎖からの配列のコンセンサスを必要とすることによって高精度を引き出す、任意の配列決定方法も包含する。二重鎖配列決定は、コンピュータ分析が二重鎖の既知の特性の使用によってエラーを解決できるため、核酸の配列に関してより高い精度を提供する能力を本質的に備えている。例えば限定はされないが、核酸塩基が、二重鎖の一部である場合に標準的な塩基「対合」を形成すると理解すること。核酸のこの特性は、少なくとも前世紀の後半以来よく知られており、当業者により容易に理解され認識されている。したがってこの知識を利用すると、二重鎖の一方の鎖の配列決定から、予測される相補的配列を推測し決定することが可能である。次いで、この推定された相補的配列を、二重鎖の核酸の配列決定された第２鎖からの結果と比較することができる。このように２本の鎖を比較すると、得られた配列を確認し、または相違点を強調することができるため、可能性ある病変（例：損傷塩基）または片方の鎖にのみ見られるミスマッチ、またはさらなる調査のための配列決定エラーもしくは領域を特定することができる。これらの違いは、誤った塩基の挿入、欠失、または変異（例：損傷塩基）によって生じ得る。さらに、配列決定された二重鎖の結果を参照データとさらに比較することで、配列内で起こり得る変異についての洞察をさらに得ることができる。したがって、二重鎖配列決定は、核酸の配列を解明する高精度の方法を提供し、その精度により、その差異の影響（例：ゲノムデータにおける変異の影響）を決定する際のより高い分解能が可能となる。

二重鎖配列決定は、従来の配列決定と同じステップの多くを必要とする。特に興味深いステップの１つは、試料二重鎖を、鎖が実質的に「二重鎖」になるように操作することであり、すなわち鎖は、一本鎖部分（例：ギャップ、オーバーハング）がなく、連続した（例：ニックが欠けた）核酸の２本の鎖から構成される。さらに、鎖を、配列決定プロセスで使用されるアダプターのライゲーション用に調製する必要がある。伝統的に、このプロセスでは多くの特定の酵素が用いられる：例えばＤＮＡポリメラーゼ（単数または複数）は、３’オーバーハングを主に消化し５’オーバーハングを埋め、ポリヌクレオチドキナーゼ（単数または複数）は断片末端をリン酸化し、およびＤＮＡポリメラーゼ（単数または複数）は、アデニン（例：デオキシアデノシン一リン酸（ｄＡＭＰ）の形態で）の、３’末端への非鋳型付加（例：デオキシチミン一リン酸（ｄＴＭＰ）テール付き配列決定アダプターのライゲーションが求められる場合）を実施する。例えば、ＤＮＡポリメラーゼ（単数または複数）は、ｄＮＴＰの混合物と共に提供されて、３’末端ヌクレオチドが認識されかつ対応する鋳型鎖が存在する場合に、鎖の合成を開始する。この部位（例：３’末端ヌクレオチド）は、二重鎖が５’オーバーハングを含有する鎖の、ニック、ギャップ、または３’末端に存在し得る。さらに、使用される１つ以上のＤＮＡポリメラーゼ（単数または複数）は、鎖置換活性または５’エキソヌクレアーゼ活性のいずれかを有するため、下流にあるすべての断片を除去（例：置換または消化）する。例えば、これに限定されないが、合成がニックまたはギャップで開始される場合、新たに合成された鎖は、下流の「ネイティブ」鎖を除去しこれを再合成する。この再合成は、前述の問題の一部を修正するがフェイルセーフではなく、元の「ネイティブ」鎖には存在しなかった誤った情報を、再合成された鎖に導入する可能性がある。これは、ミスマッチ塩基または損傷塩基（例：病変）を介した合成の結果として発生する可能性があり、ポリメラーゼに対し、「ネイティブ」鎖の塩基を代表していない、ミスマッチまたは損傷塩基に相補的な塩基を挿入するように、指示する可能性がある。これは次に、配列決定の結果において、一方の鎖上のミスマッチ塩基とは対照的に、両方の鎖上の正しく対になった塩基のセットとして解釈されるが、これは正確ではない（例：偽変異である）。これと同じエラーは、損傷塩基またはミスマッチ塩基を介して合成が起きるどの場所でも生じ得る（例：試料が一本鎖である場合などでも）。さらに、かかる鎖の置換および再合成は、鎖内の不一致、または二重鎖内のミスマッチがある場所を、覆い隠す（例：消去する）ことができる。したがって、二重鎖配列決定法の精度を高め、偽変異の導入を軽減するための改善が必要である。

本明細書で使用され得る用語「実質的に」は、活性の程度または豊富さを記載するために使用する場合、一般に、過度の努力なしで達成可能な量としての、活性の値を指す。理解できるように、この量は実施される活動に応じて変化し、単純な活動ではより高い閾値が必要となり、より複雑な活動ではより低い閾値が必要となる。例えば、限定されないが、試薬、ｄＮＴＰ、または酵素を混合物から実質的に排除または除去することを指す場合、実質的な量は、５０％以上の除去を指し得る。いくつかの態様において、実質的にとは、少なくとも５０％（例：５０％、５１％、５２％、５３％、５４％、５５％、５６％、５７％、５８％、５９％、６０％、６１％、６２％、６３％、６４％、６５％、６６％、６７％、６８％、６９％、７０％、７１％、７２％、７３％、７４％、７５％、７６％、７７％、７８％、７９％、８０％、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、９９．５％、９９．９％、９９．９５％、９９．９９％、またはそれ以上）、および実験誤差内にある変数のすべての値（例：平均について９５％信頼区間）または示された値の＋／－１０％以内の、いずれか大きい方を指す。いくつかの態様において、実質的にとは、標的の少なくとも７５％が除去されることを指す。いくつかの態様において、実質的にとは、標的の少なくとも８０％が除去されることを指す。いくつかの態様において、実質的にとは、標的の少なくとも８５％が除去されることを指す。いくつかの態様において、実質的にとは、標的の少なくとも９０％が除去されることを指す。いくつかの態様において、実質的にとは、標的の少なくとも９５％が除去されることを指す。

本明細書で使用され得る用語「キナーゼ」は、リン酸基の基質への転移（例：ＡＴＰからのリン酸基を、核酸（例：ＤＮＡ）へ）を触媒する酵素を指すことが当業者に知られている技術用語である。したがって、キナーゼを使用して、ライゲーション用のＤＮＡを調製することができる（例：５’リン酸塩が利用可能であることを確認することにより）。いくつかの態様において、キナーゼはポリヌクレオチドキナーゼ（Ｐｎｋ）である。いくつかの態様において、キナーゼはＴ４ポリヌクレオチドキナーゼである。

本明細書で使用され得る用語「下流」は、複数ヌクレオチド（例：核酸）の所与の配列におけるランドマークに対する、あるヌクレオチドの位置を指し、下流とは、ランドマークよりも「さらに３’側」を意味するものとする（核酸の場合）。例えばヌクレオチドは、それがランドマークよりも核酸の３’末端に近い（したがって５’末端から遠い）場合、ランドマークの下流にある。逆に、本明細書で使用され得る用語「上流」は、複数ヌクレオチド（例：核酸）の所与の配列のランドマークに対する、あるヌクレオチドの位置を指し、上流とは、ランドマークよりも「さらに５’側」を意味するものとする（核酸の場合）。例えばヌクレオチドは、それがランドマークよりも核酸の５’末端に近い（したがって３’末端から遠い）場合、ランドマークの上流にある。
二重鎖修復（ＤＲ）方法
したがっていくつかの側面において、本開示は、もともと天然では一本鎖のみにあったヌクレオチド損傷または変化の増幅による偽変異の伝播を最小限に抑える、配列決定用の核酸試料（試料；およびかかる用語は本明細書でさらに詳しく説明する）を調製する方法に関し、ここで試料の少なくとも一部は二本鎖であり、試料を反応容器に添加すること、ならびに以下を含む：（ａ）試料を、以下が可能な１つ以上の酵素と接触させること：（ｉ）１つ以上の損傷塩基を、試料から切除すること；（ｉｉ）１つ以上の脱塩基部位を切断すること、および得られた末端を、ＤＮＡポリメラーゼによる伸長および／またはＤＮＡリガーゼによるライゲーションに適合するように処理すること；（ｉｉｉ）および５’オーバーハングを消化すること；（ｂ）試料を、以下の１つ以上と接触させること：（ｉ）鎖置換および５’エキソヌクレアーゼ活性の両方を欠くが、試料の一本鎖セグメントを埋め、かつ／または試料の３’オーバーハングを消化することができる、ＤＮＡ依存性ＤＮＡポリメラーゼ；および（ｉｉ）試料の鎖の５’末端をリン酸化することができる酵素；および（ｃ）試料を、ニックをシーリング可能なＤＮＡリガーゼと接触させること。いくつかの態様において、本開示の方法はさらに以下を含む：（ｄ）アダプターライゲーション用の試料を調製すること、ここで調製は：（ｉ）デオキシアデノシン一リン酸（ｄＡＭＰ）を試料の鎖の３’末端に付加すること（ｄＡテーリング）；または（ｉｉ）任意に試料の末端をさらに平滑化すること、を含む。

いくつかの側面において、方法は、試料の少なくとも一部が二本鎖である核酸試料（試料）を調製することを含み、これは以下を含む：（ａ）試料を、以下が可能な１つ以上の酵素と接触させること：（ｉ）試料の鎖の５’末端をリン酸化すること；３’ヒドロキシル部分を、試料の鎖の３’末端に付加すること；および（ｉｉ）ニックをシーリングすること；（ｂ）試料を、５’および３’オーバーハングを除去すると共にギャップ領域を消化して平滑化二重鎖を生成することができる１つ以上の酵素と接触させること；および（ｃ）デオキシアデノシン一リン酸（ｄＡＭＰ）を、試料の鎖の３’末端に付加すること（ｄＡテーリング）。かかる方法において、損傷塩基を切除する必要性、ＥｘｏＶＩＩで処理する必要性、またはＥｘｏＶＩＩ処理後に残されたギャップおよび短い５’オーバーハングを埋める必要性は、酵素（例：エンドヌクレアーゼ（例：ヌクレアーゼＳ１））を使用して、一本鎖ギャップ領域を切断し、オーバーハング領域に存在するヌクレオチドを切断することにより、軽減され得る。いくつかの態様において、ステップ（ａ）（１）で使用される酵素は、Ｔ４ポリヌクレオチドキナーゼ、ＨｉＦｉＴａｑリガーゼ、またはそれらの組み合わせを含む。いくつかの態様において、ステップ（ｂ）で使用される酵素は、ヌクレアーゼＳ１である。

本明細書で使用され得る用語「エンドヌクレアーゼ」および「ヌクレアーゼ」は、一般にポリヌクレオチド鎖（例：オリゴヌクレオチド、核酸）内のホスホジエステル結合（単数または複数）を切断する酵素を指すことが当業者に知られている技術用語である。ヌクレアーゼは天然に存在する場合もあれば、遺伝子操作された場合もある。いくつかの態様において、エンドヌクレアーゼは、エンドヌクレアーゼＩＶ（ＥｎｄｏＩＶ）である。いくつかの態様において、エンドヌクレアーゼは、エンドヌクレアーゼＶＩＩＩ（ＥｎｄｏＶＩＩＩ）である。いくつかの態様において、ヌクレアーゼはヌクレアーゼＳ１を含む（例えば、限定はされないが以下を参照されたい：thermofisher.com/order/catalog/product/EN0321#/EN0321；promega.com/products/cloning-and-dna-markers/molecular-biology-enzymes-and-reagents/s1-nuclease/?catNum=M5761；takarabio.com/products/cloning/modifying-enzymes/nucleases/s1-nuclease；およびsigmaaldrich.com/US/en/product/SIGMA/N5661)。ヌクレアーゼＳ１は一本鎖核酸を分解し、５’－ホスホリルモノヌクレオチドまたはオリゴヌクレオチドを放出し、および、二本鎖ＤＮＡ（ｄｓＤＮＡ）を、ニック、ギャップ、ミスマッチ、またはループによって生じた一本鎖領域で切断することもある。

本明細書に記載の方法を実施することにより、偽変異が導入される可能性は実質的に軽減される。例えば、最初に損傷塩基を切除し、脱塩基部位を切断し、かつ得られた末端を、ＤＮＡポリメラーゼによる伸長と試料からのＤＮＡリガーゼによるライゲーションに適合するように処理する酵素を使用することにより、一方の鎖で塩基が切除されてギャップが生成されるか（ここで相補鎖は切除点にまだ存在し、二重鎖が無傷のままであるための主鎖を形成する）、または、二重鎖／鎖の破断が発生し、２つの「娘」二重鎖が作成される（ここで、相補鎖は切除点には存在せず、二重鎖は２つの小さな核酸に分解される）。このステップの利点は、限定されないが、損傷塩基が存在するギャップ領域において鎖破断を誘導することであり、なぜならば、本明細書に開示される方法のステップ（ｂ）はＤＮＡポリメラーゼを使用してギャップを埋めることを含み得るが、一方、アダプターライゲーション前に再合成されなかった完全二重鎖領域の１つの鎖上の任意の損傷塩基またはミスマッチ塩基は、修正されないままであれば、コンピュータで二重鎖配列決定を用いて解決される可能性があるからである。さらに、これらの得られた二重鎖（無傷であるか、または分解されている（例：鎖破断が起こっている））は、その後、５’オーバーハングを消化できる酵素に曝露される（例：接触される）と、任意の５’オーバーハングの長さが実質的に低減され、その後のステップ（ｂ）での、断片の最末端までの埋め込みを制限するであろう。次に得られた二重鎖を、鎖置換および５’エキソヌクレアーゼ活性の両方を欠くが、試料の一本鎖セグメントを埋めることができかつ３’オーバーハングの消化が可能なＤＮＡ依存性ＤＮＡポリメラーゼ、およびポリヌクレオチドキナーゼに曝露（例：接触）させると、前のステップで完全に消化されなかった任意の残りの短い５’オーバーハングは埋められて、平滑末端が得られ；任意の残りの３’オーバーハングは消化されて平滑末端が生成され；および、任意の内部ギャップ（例：損傷塩基の切除および脱塩基部位の切断によって生じる小さなギャップ、およびＤＮＡ断片にも存在し得る任意のより長いギャップ）は、下流のＤＮＡセグメントの５’末端まで埋められる。次に、得られた二重鎖を、ニックを（好ましくは、キメラ形成を避けるために最小限の末端結合活性で）シーリング可能なＤＮＡリガーゼに曝露（例：接触）させると、任意の残りのニック（例：試料中に本質的に存在する他のもののうち、ギャップを埋めた後に残ったニック）はシールされ、連続した平滑二重鎖を形成する。次に、得られた二重鎖を、それぞれ５’エキソヌクレアーゼ活性および鎖置換活性を有するＴａｑまたはクレノウ断片などのＤＮＡポリメラーゼを使用して、ＤＮＡ二重鎖の３’末端への、ｄＡＭＰの非鋳型伸長（例：付加）（例：ｄＡテーリング）を実行できるＤＮＡポリメラーゼに曝露する（例：接触させる）と、鎖再合成に利用できる「プライミング部位」が実質的に少なくなる。さらに、ステップ（ｄ）が、ｄＡＭＰ以外のヌクレオチドの付加を制限する条件下で実施される場合（例：このステップの前にｄＮＴＰを実質的に除去することによって、または極端に過剰なｄＡＴＰを提供することによって）、このステップでの鎖再合成の可能性は、大幅に軽減することができる。この保存された情報は、変異の精度および解像度の大幅な向上を可能にする。

本明細書で使用され得る用語「接触された」は、１つの物質（例：酵素、試薬、ｄＮＴＰ）の別の物質（例：試料、混合物）への暴露であって、ある量および意図で、すなわち、２つの物質が相互作用して、一方の物質の活性が他方の物質（例：試料に作用する酵素）に影響を与えるようにすること、または２つの物質が相互作用することを意図しての、前記曝露を記述するために使用される。この用語は、２つの物質間の物理的接触を必要とするものと解釈されるべきではないが、さらに物理的接触を禁止するものでもない。例えば、物質間の相互作用および／または活性に影響を与えるのに、近接性は十分であり得る。いくつかの態様において、接触は、物質を同じ容器（例：反応容器）に導入することによって達成される。いくつかの態様において、接触は、物質を同じ反応容器に導入することによって達成される。いくつかの態様において、接触は、物質Ａ（例：試薬、ｄＮＴＰ、酵素など）を、物質Ｂ（例：試料）を含有するか、物質Ｂが同時に導入されるか、または物質Ｂが後で導入される反応容器に導入することによって達成される。いくつかの態様において、接触は、物質が互いに物理的に接触する（例：物理的に相互作用する）ときに達成される。いくつかの態様において、接触は、物質が互いに化学的に相互作用するときに達成される。いくつかの態様において、接触は、物質が互いに酵素的に相互作用するときに達成される。いくつかの態様において、接触は、物質が互いに近接しているときに達成される。

いくつかの態様において、本開示の方法はさらに（ｄ）アダプターライゲーション用の試料を調製することを含み、ここで調製することは：（ｉ）デオキシアデノシン一リン酸（ｄＡＭＰ）を試料の鎖の３’末端に付加すること（ｄＡテーリング）；または（ｉｉ）試料の末端を平滑化すること、を含む。いくつかの態様において、ｄＡテーリングは、試料を、デオキシアデノシン一リン酸（ｄＡＭＰ）を試料の鎖の３’末端に組み込むことができる酵素と接触させること、および、試料を、ｄＮＴＰと接触させることを含む。いくつかの態様において、本開示の方法のステップ（ａ）～（ｃ）で使用される酵素および／またはｄＮＴＰは、ｄＡテーリングの前に、反応容器から実質的に除去される。いくつかの態様において、ｄＮＴＰは実質的にｄＡＴＰを含む。いくつかの態様において、本明細書に開示される方法の１つ以上（例：ステップ（ａ）、（ｂ）、（ｃ）、（ｄ）等の代表として、１、２、３、４、５、またはそれ以上）は、「ワンポット」反応で行われ、ここでこれらのステップは、酵素および緩衝液を同じ反応容器に順次添加し、反応条件（例：温度）を調整することによって、実施される。いくつかの態様において、ステップは連続して実施される。いくつかの態様において、前のステップからの試薬および酵素は、次のステップに進む前に混合物から除去されない。いくつかの態様において、前のステップからの試薬および酵素は、次のステップに進む前に混合物から除去される。いくつかの態様において、１つ以上のステップが１つの反応容器内で実施される。いくつかの態様において、１つ以上のステップが、２つ以上の反応容器内で実施される（例：方法全体を通じて少なくとも１つの時点で移される）。

いくつかの態様において、試料を、ステップ（ａ）の１つ以上の酵素と、方法の任意の後続のステップに進む前に少なくとも１５秒間（例：１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、５１、５２、５３、５４、５５、５６、５７、５８、５９、６０秒、またはそれ以上）接触させる。いくつかの態様において、試料を、ステップ（ａ）の１つ以上の酵素と、方法の任意の後続のステップに進む前に少なくとも１分間（例：１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、５１、５２、５３、５４、５５、５６、５７、５８、５９、６０分、またはそれ以上）接触させる。いくつかの態様において、試料を、方法の任意の後続のステップに進む前に、ステップ（ａ）の１つ以上の酵素と接触させて少なくとも５分間インキュベートする。いくつかの態様において、試料を、方法の任意の後続のステップに進む前に、ステップ（ａ）の１つ以上の酵素と接触させて少なくとも２５分間インキュベートする。いくつかの態様において、試料を、方法の任意の後続のステップに進む前に、ステップ（ａ）の１つ以上の酵素と接触させて少なくとも３０分間インキュベートする。いくつかの態様において、試料を、ステップ（ａ）の１つ以上の酵素と、方法の任意の後続のステップに進む前に６時間未満（例：６、５、４、３、２、１時間、またはそれ未満）接触させる。いくつかの態様において、試料を、ステップ（ａ）の１つ以上の酵素と、方法の任意の後続のステップに進む前に６０分未満（例：６０、５９、５８、５７、５６、５５、５４、５３、５２、５１、５０、４９、４８、４７、４６、４５、４４、４３、４２、４１、４０、３９、３８、３７、３６、３５、３４、３３、３２、３１、３０、２９、２８、２７、２６、２５、２４、２３、２２、２１、２０、１９、１８、１７、１６、１５、１４、１３、１２、１１、１０、９、８、７、６、５、４、３、２、１分、またはそれ未満）接触させる。いくつかの態様において、試料を、ステップ（ａ）の１つ以上の酵素と、方法の任意の後続のステップに進む前に１～６０分間接触させる。いくつかの態様において、試料を、ステップ（ａ）の１つ以上の酵素と、方法の任意の後続のステップに進む前に１０～４５分間接触させる。いくつかの態様において、試料を、ステップ（ａ）の１つ以上の酵素と、方法の任意の後続のステップに進む前に２０～３５分間接触させる。

いくつかの態様において、試料を、ステップ（ｂ）の１つ以上の酵素と、方法の任意の後続のステップに進む前に少なくとも１５秒間（例：１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、５１、５２、５３、５４、５５、５６、５７、５８、５９、６０秒、またはそれ以上）接触させる。いくつかの態様において、試料を、ステップ（ｂ）の１つ以上の酵素と、方法の任意の後続のステップに進む前に少なくとも１分間（例：１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、５１、５２、５３、５４、５５、５６、５７、５８、５９、６０分、またはそれ以上）接触させる。いくつかの態様において、試料を、方法の任意の後続のステップに進む前に、ステップ（ｂ）の１つ以上の酵素と接触させて少なくとも５分間インキュベートする。いくつかの態様において、試料を、方法の任意の後続のステップに進む前に、ステップ（ｂ）の１つ以上の酵素と接触させて少なくとも２５分間インキュベートする。いくつかの態様において、試料を、方法の任意の後続のステップに進む前に、ステップ（ｂ）の１つ以上の酵素と接触させて少なくとも３０分間インキュベートする。いくつかの態様において、試料を、ステップ（ｂ）の１つ以上の酵素と、方法の任意の後続のステップに進む前に６時間未満（例：６、５、４、３、２、１時間、またはそれ未満）接触させる。いくつかの態様において、試料を、ステップ（ｂ）の１つ以上の酵素と、方法の任意の後続のステップに進む前に６０分未満（例：６０、５９、５８、５７、５６、５５、５４、５３、５２、５１、５０、４９、４８、４７、４６、４５、４４、４３、４２、４１、４０、３９、３８、３７、３６、３５、３４、３３、３２、３１、３０、２９、２８、２７、２６、２５、２４、２３、２２、２１、２０、１９、１８、１７、１６、１５、１４、１３、１２、１１、１０、９、８、７、６、５、４、３、２、１分、またはそれ未満）接触させる。いくつかの態様において、試料を、ステップ（ｂ）の１つ以上の酵素と、方法の任意の後続のステップに進む前に１～６０分間接触させる。いくつかの態様において、試料を、ステップ（ｂ）の１つ以上の酵素と、方法の任意の後続のステップに進む前に１０～４５分間接触させる。いくつかの態様において、試料を、ステップ（ｂ）の１つ以上の酵素と、方法の任意の後続のステップに進む前に２０～３５分間接触させる。

いくつかの態様において、試料を、ステップ（ｃ）の１つ以上の酵素と、方法の任意の後続のステップに進む前に少なくとも１５秒間（例：１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、５１、５２、５３、５４、５５、５６、５７、５８、５９、６０秒、またはそれ以上）接触させる。いくつかの態様において、試料を、ステップ（ｃ）の１つ以上の酵素と、方法の任意の後続のステップに進む前に少なくとも１分間（例：１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、５１、５２、５３、５４、５５、５６、５７、５８、５９、６０分、またはそれ以上）接触させる。いくつかの態様において、試料を、方法の任意の後続のステップに進む前に、ステップ（ｃ）の１つ以上の酵素と接触させて少なくとも５分間インキュベートする。いくつかの態様において、試料を、方法の任意の後続のステップに進む前に、ステップ（ｃ）の１つ以上の酵素と接触させて少なくとも２５分間インキュベートする。いくつかの態様において、試料を、方法の任意の後続のステップに進む前に、ステップ（ｃ）の１つ以上の酵素と接触させて少なくとも３０分間インキュベートする。いくつかの態様において、試料を、ステップ（ｃ）の１つ以上の酵素と、方法の任意の後続のステップに進む前に６時間未満（例：６、５、４、３、２、１時間、またはそれ未満）接触させる。いくつかの態様において、試料を、ステップ（ｃ）の１つ以上の酵素と、方法の任意の後続のステップに進む前に６０分未満（例：６０、５９、５８、５７、５６、５５、５４、５３、５２、５１、５０、４９、４８、４７、４６、４５、４４、４３、４２、４１、４０、３９、３８、３７、３６、３５、３４、３３、３２、３１、３０、２９、２８、２７、２６、２５、２４、２３、２２、２１、２０、１９、１８、１７、１６、１５、１４、１３、１２、１１、１０、９、８、７、６、５、４、３、２、１分、またはそれ未満）接触させる。いくつかの態様において、試料を、ステップ（ｃ）の１つ以上の酵素と、方法の任意の後続のステップに進む前に１～９０間接触させる。いくつかの態様において、試料を、ステップ（ｃ）の１つ以上の酵素と、方法の任意の後続のステップに進む前に３０～６０分間接触させる。いくつかの態様において、試料を、ステップ（ｃ）の１つ以上の酵素と、方法の任意の後続のステップに進む前に３５～５５分間接触させる。いくつかの態様において、温度サイクルが起こり得る場合、本明細書に記載される接触時間は、任意の温度への暴露についての、または関係するステップの温度サイクルの任意の部分についてのものであり得る。

いくつかの態様において、試料を、ステップ（ｄ）の１つ以上の酵素と、方法の任意の後続のステップに進む前に少なくとも１５秒間（例：１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、５１、５２、５３、５４、５５、５６、５７、５８、５９、６０秒、またはそれ以上）接触させる。いくつかの態様において、試料を、ステップ（ｄ）の１つ以上の酵素と、方法の任意の後続のステップに進む前に少なくとも１分間（例：１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、５１、５２、５３、５４、５５、５６、５７、５８、５９、６０分、またはそれ以上）接触させる。いくつかの態様において、試料を、方法の任意の後続のステップに進む前に、ステップ（ｄ）の１つ以上の酵素と接触させて少なくとも５分間インキュベートする。いくつかの態様において、試料を、方法の任意の後続のステップに進む前に、ステップ（ｄ）の１つ以上の酵素と接触させて少なくとも２５分間インキュベートする。いくつかの態様において、試料を、方法の任意の後続のステップに進む前に、ステップ（ｄ）の１つ以上の酵素と接触させて少なくとも３０分間インキュベートする。いくつかの態様において、試料を、ステップ（ｄ）の１つ以上の酵素と、方法の任意の後続のステップに進む前に６時間未満（例：６、５、４、３、２、１時間、またはそれ未満）接触させる。いくつかの態様において、試料を、ステップ（ｄ）の１つ以上の酵素と、方法の任意の後続のステップに進む前に６０分未満（例：６０、５９、５８、５７、５６、５５、５４、５３、５２、５１、５０、４９、４８、４７、４６、４５、４４、４３、４２、４１、４０、３９、３８、３７、３６、３５、３４、３３、３２、３１、３０、２９、２８、２７、２６、２５、２４、２３、２２、２１、２０、１９、１８、１７、１６、１５、１４、１３、１２、１１、１０、９、８、７、６、５、４、３、２、１分、またはそれ未満）接触させる。いくつかの態様において、試料を、ステップ（ｄ）の１つ以上の酵素と、方法の任意の後続のステップに進む前に１～６０分間接触させる。いくつかの態様において、試料を、ステップ（ｄ）の１つ以上の酵素と、方法の任意の後続のステップに進む前に１０～４５分間接触させる。いくつかの態様において、試料を、ステップ（ｄ）の１つ以上の酵素と、方法の任意の後続のステップに進む前に２０～３５分間接触させる。

いくつかの態様において、試料を、方法の任意の後続のステップに進む前に、ステップ（ｄ）の１つ以上の酵素と接触させて少なくとも１５秒の第２の期間（例：１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、５１、５２、５３、５４、５５、５６、５７、５８、５９、６０秒、またはそれ以上）インキュベートする。いくつかの態様において、第２の期間は、少なくとも１分（例：１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、５１、５２、５３、５４、５５、５６、５７、５８、５９、６０分、またはそれ以上）である。いくつかの態様において、第２の期間は少なくとも５分である。いくつかの態様において、第２の期間は少なくとも２５分である。いくつかの態様において、第２の期間は少なくとも３０分である。いくつかの態様において、第２の期間は、６時間未満（例：６、５、４、３、２、１時間、またはそれ未満）である。いくつかの態様において、第２の期間は、６０分未満（例：６０、５９、５８、５７、５６、５５、５４、５３、５２、５１、５０、４９、４８、４７、４６、４５、４４、４３、４２、４１、４０、３９、３８、３７、３６、３５、３４、３３、３２、３１、３０、２９、２８、２７、２６、２５、２４、２３、２２、２１、２０、１９、１８、１７、１６、１５、１４、１３、１２、１１、１０、９、８、７、６、５、４、３、２、１分、またはそれ未満）である。いくつかの態様において、第２の期間は１～６０分である。いくつかの態様において、第２の期間は１０～４５分である。いくつかの態様において、第２の期間は、方法の任意の後続のステップに進む前に、２０～３５分である。

いくつかの態様において、本明細書に開示される任意の方法のステップ（ａ）は、約２０℃～約５０℃の温度（例：２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０℃）で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ（ａ）は、約２５℃～約４５℃の温度で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ（ａ）は、約３０℃～約４０℃の温度で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ（ａ）は、約３５℃～約３９℃の温度で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ（ａ）は、約３７℃の温度で実施される。

いくつかの態様において、本明細書に開示される任意の方法のステップ（ｂ）は、約２０℃～約５０℃の温度（例：２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０℃）で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ（ｂ）は、約２５℃～約４５℃の温度で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ（ｂ）は、約３０℃～約４０℃の温度で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ（ｂ）は、約３５℃～約３９℃の温度で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ（ｂ）は、約３７℃の温度で実施される。

いくつかの態様において、本明細書に開示される任意の方法のステップは、酵素反応を促進するために複数の温度で実行され得る。例えば、これに限定されないが、繰り返しの曝露と「サイクル」が望ましい場合、手動または自動の温度サイクルを使用することができる。かかるサイクルのための技術、方法、およびプロトコルは、当技術分野でよく知られている。いくつかの態様において、サイクルは、自動サーモサイクラーで実施されてもよい。いくつかの態様において、サイクルは、２つの温度設定点：第１温度と第２温度を有し得る。

いくつかの態様において、本明細書に開示される任意の方法のステップ（ｃ）は、約２０℃～約５０℃の第１温度（例：２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０℃）で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ（ｃ）は、約２５℃～約４５℃の第１温度で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ（ｃ）は、約３０℃～約４０℃の第１温度で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ（ｃ）は、約３３℃～約３７℃の第１温度で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ（ｃ）は、約３５℃の第１温度で実施される。

いくつかの態様において、本明細書に開示される任意の方法のステップ（ｃ）は、約４０℃～約８０℃の第２温度（例：４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、５１、５２、５３、５４、５５、５６、５７、５８、５９、６０、６１、６２、６３、６４、６５、６６、６７、６８、６９、７０、７１、７２、７３、７４、７５、７６、７７、７８、７９、８０℃）で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ（ｃ）は、約５５℃～約７５℃の第２温度で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ（ｃ）は、約６０℃～約７０℃の第２温度で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ（ｃ）は、約６３℃～約６７℃の第２温度で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ（ｃ）は、約６５℃の第２温度で実施される。

いくつかの態様において、本明細書に開示される任意の方法のステップ（ｄ）は、約１８℃～約７０℃の温度で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ（ｄ）は、約２０℃～約６６℃の温度で実施される。いくつかの態様において、本明細書に記載の方法のステップ（ｄ）は、２つの異なる温度、温度１および温度２で実施される。

いくつかの態様において、本明細書に開示される任意の方法のステップ（ｄ）は、約１７℃～約２５℃の温度１（例：１７、１８、１９、２０、２１、２２、２３、２４、２５℃）で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ（ｄ）は、約１９℃～約２３℃の温度１で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ（ｄ）は、約２０℃～約２２℃の温度１で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ（ｄ）は、約２２℃の温度１で実施される。

いくつかの態様において、本明細書に開示される任意の方法のステップ（ｄ）は、約６０℃～約７０℃の温度２（例：６０、６１、６２、６３、６４、６５、６６、６７、６８、６９、７０℃）で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ（ｄ）は、約６２℃～約６８℃の温度２で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ（ｄ）は、約６４℃～約６６℃の温度２で実施される。いくつかの態様において、本明細書に開示される任意の方法のステップ（ｄ）は、約６５℃の温度２で実施される。

いくつかの態様において、ステップ（ａ）の前に、試料は（ｉ）断片化される；または（ｉｉ）切断およびタグ付けされる（タグメントされる）。いくつかの態様において、断片化は、（ａ）物理的断片化；（ｂ）酵素的断片化；および／または（ｃ）化学的断片化によるものである。いくつかの態様において、断片化は物理的断片化による。いくつかの態様において、物理的断片化は噴霧化による。いくつかの態様において、物理的断片化は音響剪断（acoustic shearing）による。いくつかの態様において、物理的断片化はニードル剪断（needle shearing）による。いくつかの態様において、物理的断片化はフレンチプレッシャーセル（French pressure cell）による。いくつかの態様において、物理的断片化は超音波処理による。いくつかの態様において、物理的断片化は流体力学的剪断による。いくつかの態様において、断片化は酵素的断片化による。いくつかの態様において、酵素的断片化はヌクレアーゼまたはエンドヌクレアーゼによる。いくつかの態様において、酵素的断片化はＤＮａｓｅＩによる。いくつかの態様において、酵素的断片化は制限エンドヌクレアーゼによる。いくつかの態様において、酵素的断片化はトランスポザーゼ（transposase）による。いくつかの態様においては、化学的断片化による。いくつかの態様において、化学的断片化は熱および二価金属カチオン断片化による。

いくつかの態様において、ステップ（ａ）は、試料を、以下からなる群から選択される１つ以上の酵素と接触させることを含む：（１）エンドヌクレアーゼＩＶ（ＥｎｄｏＩＶ）；（２）ホルムアミドピリミジン［ｆａｐｙ］－ＤＮＡグリコシラーゼ（Ｆｐｇ）；（３）ウラシル－ＤＮＡグリコシラーゼ（ＵＤＧ）；（４）Ｔ４ピリミジンＤＮＡグリコシラーゼ（Ｔ４ＰＤＧ）；（５）エンドヌクレアーゼＶＩＩＩ（ＥｎｄｏＶＩＩＩ）、および（６）エキソヌクレアーゼＶＩＩ（ＥｘｏＶＩＩ）。

本明細書で使用され得る用語「グリコシラーゼ」は、核酸（例：ＤＮＡ）の修復に主に関与する酵素を指すことが当業者に一般に知られている技術用語を指す。グリコシラーゼがＤＮＡ修復を助ける主な活性は、塩基切除修復によるものであり、これは損傷ＤＮＡを除去し、エラーのない新しい新鮮なＤＮＡに置き換える（例：損傷塩基（例：病変）を除去または修復する）。グリコシラーゼは、主鎖（例：糖リン酸基）を無傷のまま残しながら、ＤＮＡの損傷した窒素部分と相互作用する。この切除により、損傷塩基の合成と置換（例：新しいＤＮＡの挿入）がその部位において可能となる。例えば、限定されないが、ＤＮＡグリコシラーゼは、Ｎ－グリコシド結合を切断することによって、ウラシル残基をＤＮＡから切除し、これによりＤＮＡ切除修復プロセスが開始される。いくつかの態様において、グリコシラーゼは、ホルムアミドピリミジン［ｆａｐｙ］－ＤＮＡグリコシラーゼ（Ｆｐｇ）；ウラシル－ＤＮＡグリコシラーゼ（ＵＤＧ）；Ｔ４ピリミジンＤＮＡグリコシラーゼ（Ｔ４ＰＤＧ）；またはそれらの組み合わせから選択される。いくつかの態様において、グリコシラーゼは、ホルムアミドピリミジン［ｆａｐｙ］－ＤＮＡグリコシラーゼ（Ｆｐｇ）である。いくつかの態様において、グリコシラーゼは、ウラシル－ＤＮＡグリコシラーゼ（ＵＤＧ）である。いくつかの態様において、グリコシラーゼは、Ｔ４ピリミジンＤＮＡグリコシラーゼ（Ｔ４ＰＤＧ）である。

いくつかの態様において、１つ以上の酵素の活性は、試料上の以下のＤＮＡ改変を触媒する：（１）損傷塩基の切除；および（２）脱塩基部位の切除。いくつかの態様において、１つ以上の酵素の活性は、逐次的または同時である。

いくつかの態様において、１つ以上の酵素は、試料の少なくとも１つの鎖の５’オーバーハングを、１６核酸塩基未満の長さに消化する。いくつかの態様において、１つ以上の酵素は、試料の少なくとも１つの鎖の５’オーバーハングを、８核酸塩基未満の長さに消化する。いくつかの態様において、１つ以上の酵素は、試料の少なくとも１つの鎖の３’オーバーハングを、１６核酸塩基未満の長さに消化する。いくつかの態様において、１つ以上の酵素は、試料の少なくとも１つの鎖の３’オーバーハングを、８核酸塩基未満の長さに消化する。

いくつかの態様において、エンドヌクレアーゼＩＶ（ＥｎｄｏＩＶ）は、脱塩基部位を切断する。いくつかの態様において、ホルムアミドピリミジン［ｆａｐｙ］－ＤＮＡグリコシラーゼは、損傷プリンを切除する。いくつかの態様において、ウラシル－ＤＮＡグリコシラーゼ（ＵＤＧ）は、ウラシルを切除する。いくつかの態様において、Ｔ４ピリミジンＤＮＡグリコシラーゼ（Ｔ４ＰＤＧ）は、シクロブテンピリミジン二量体を切除する。いくつかの態様において、エンドヌクレアーゼＶＩＩＩ（ＥｎｄｏＶＩＩＩ）は、損傷ピリミジンを切除する。いくつかの態様において、ＤＮＡリガーゼは、ＨｉＦｉＴａｑＤＮＡリガーゼである。

いくつかの態様において、本開示の方法のステップ（ｂ）は、ＤＮＡ断片をポリヌクレオチドキナーゼ（Ｐｎｋ）と接触させることを含む。いくつかの態様において、Ｐｎｋは、Ｔ４ポリヌクレオチドキナーゼである。

本開示の任意の方法のいくつかの態様において：（ａ）エンドヌクレアーゼＩＶ（ＥｎｄｏＩＶ）は、配列番号３または任意の既知のエンドヌクレアーゼＩＶ配列に対して少なくとも７０％の同一性（例：少なくとも７０％、少なくとも７１％、少なくとも７２％、少なくとも７３％、少なくとも７４％、少なくとも７５％、少なくとも７６％、少なくとも７７％、少なくとも７８％、少なくとも７９％、少なくとも８０％、少なくとも８１％、少なくとも８２％、少なくとも８３％、少なくとも８４％、少なくとも８５％、少なくとも８６％、少なくとも８７％、少なくとも８８％、少なくとも８９％、少なくとも９０％、少なくとも９１％、少なくとも９２％、少なくとも９３％、少なくとも９４％、少なくとも９５％、少なくとも９５．５％、少なくとも９６％、少なくとも９６．５％、少なくとも９７％、少なくとも９７．５％、少なくとも９８％、少なくとも９８．５％、少なくとも９９％、少なくとも９９．５％、少なくとも９９．６％、少なくとも９９．７％、少なくとも９９．８％、少なくとも９９．９％の同一性）を有するアミノ酸配列を含み；（ｂ）ホルムアミドピリミジン［ｆａｐｙ］－ＤＮＡグリコシラーゼ（Ｆｐｇ）は、配列番号４または任意の既知のホルムアミドピリミジン［ｆａｐｙ］－ＤＮＡグリコシラーゼ配列に対して少なくとも７０％の同一性（例：少なくとも７０％、少なくとも７１％、少なくとも７２％、少なくとも７３％、少なくとも７４％、少なくとも７５％、少なくとも７６％、少なくとも７７％、少なくとも７８％、少なくとも７９％、少なくとも８０％、少なくとも８１％、少なくとも８２％、少なくとも８３％、少なくとも８４％、少なくとも８５％、少なくとも８６％、少なくとも８７％、少なくとも８８％、少なくとも８９％、少なくとも９０％、少なくとも９１％、少なくとも９２％、少なくとも９３％、少なくとも９４％、少なくとも９５％、少なくとも９５．５％、少なくとも９６％、少なくとも９６．５％、少なくとも９７％、少なくとも９７．５％、少なくとも９８％、少なくとも９８．５％、少なくとも９９％、少なくとも９９．５％、少なくとも９９．６％、少なくとも９９．７％、少なくとも９９．８％、少なくとも９９．９％の同一性）を有するアミノ酸配列を含み；（ｃ）ウラシル－ＤＮＡグリコシラーゼ（ＵＤＧ）は、配列番号５～７からなる群から選択されるアミノ酸配列または任意の既知のウラシル－ＤＮＡグリコシラーゼ配列に対して少なくとも７０％の同一性（例：少なくとも７０％、少なくとも７１％、少なくとも７２％、少なくとも７３％、少なくとも７４％、少なくとも７５％、少なくとも７６％、少なくとも７７％、少なくとも７８％、少なくとも７９％、少なくとも８０％、少なくとも８１％、少なくとも８２％、少なくとも８３％、少なくとも８４％、少なくとも８５％、少なくとも８６％、少なくとも８７％、少なくとも８８％、少なくとも８９％、少なくとも９０％、少なくとも９１％、少なくとも９２％、少なくとも９３％、少なくとも９４％、少なくとも９５％、少なくとも９５．５％、少なくとも９６％、少なくとも９６．５％、少なくとも９７％、少なくとも９７．５％、少なくとも９８％、少なくとも９８．５％、少なくとも９９％、少なくとも９９．５％、少なくとも９９．６％、少なくとも９９．７％、少なくとも９９．８％、少なくとも９９．９％の同一性）を有するアミノ酸配列を含み；（ｄ）Ｔ４ピリミジンＤＮＡグリコシラーゼ（Ｔ４ＰＤＧ）は、任意の既知のＴ４ピリミジンＤＮＡグリコシラーゼ配列に対して少なくとも７０％の同一性（例：少なくとも７０％、少なくとも７１％、少なくとも７２％、少なくとも７３％、少なくとも７４％、少なくとも７５％、少なくとも７６％、少なくとも７７％、少なくとも７８％、少なくとも７９％、少なくとも８０％、少なくとも８１％、少なくとも８２％、少なくとも８３％、少なくとも８４％、少なくとも８５％、少なくとも８６％、少なくとも８７％、少なくとも８８％、少なくとも８９％、少なくとも９０％、少なくとも９１％、少なくとも９２％、少なくとも９３％、少なくとも９４％、少なくとも９５％、少なくとも９５．５％、少なくとも９６％、少なくとも９６．５％、少なくとも９７％、少なくとも９７．５％、少なくとも９８％、少なくとも９８．５％、少なくとも９９％、少なくとも９９．５％、少なくとも９９．６％、少なくとも９９．７％、少なくとも９９．８％、少なくとも９９．９％の同一性）を有するアミノ酸配列を含み；および／または（ｅ）エンドヌクレアーゼＶＩＩＩ（ＥｎｄｏＶＩＩＩ）は、配列番号８～９からなる群から選択されるアミノ酸配列または任意の既知のエンドヌクレアーゼＶＩＩＩ配列に対して少なくとも７０％の同一性（例：少なくとも７０％、少なくとも７１％、少なくとも７２％、少なくとも７３％、少なくとも７４％、少なくとも７５％、少なくとも７６％、少なくとも７７％、少なくとも７８％、少なくとも７９％、少なくとも８０％、少なくとも８１％、少なくとも８２％、少なくとも８３％、少なくとも８４％、少なくとも８５％、少なくとも８６％、少なくとも８７％、少なくとも８８％、少なくとも８９％、少なくとも９０％、少なくとも９１％、少なくとも９２％、少なくとも９３％、少なくとも９４％、少なくとも９５％、少なくとも９５．５％、少なくとも９６％、少なくとも９６．５％、少なくとも９７％、少なくとも９７．５％、少なくとも９８％、少なくとも９８．５％、少なくとも９９％、少なくとも９９．５％、少なくとも９９．６％、少なくとも９９．７％、少なくとも９９．８％、少なくとも９９．９％の同一性）を有するアミノ酸配列を含む。

本開示の任意の方法のいくつかの態様において、ポリヌクレオチドキナーゼは、配列番号１０のアミノ酸配列または任意の既知のポリヌクレオチドキナーゼ配列に対して少なくとも７０％の同一性（例：少なくとも７０％、少なくとも７１％、少なくとも７２％、少なくとも７３％、少なくとも７４％、少なくとも７５％、少なくとも７６％、少なくとも７７％、少なくとも７８％、少なくとも７９％、少なくとも８０％、少なくとも８１％、少なくとも８２％、少なくとも８３％、少なくとも８４％、少なくとも８５％、少なくとも８６％、少なくとも８７％、少なくとも８８％、少なくとも８９％、少なくとも９０％、少なくとも９１％、少なくとも９２％、少なくとも９３％、少なくとも９４％、少なくとも９５％、少なくとも９５．５％、少なくとも９６％、少なくとも９６．５％、少なくとも９７％、少なくとも９７．５％、少なくとも９８％、少なくとも９８．５％、少なくとも９９％、少なくとも９９．５％、少なくとも９９．６％、少なくとも９９．７％、少なくとも９９．８％、少なくとも９９．９％の同一性）を有するアミノ酸配列を含む。

本開示の任意の方法のいくつかの態様において：（１）ＤＮＡ依存性ＤＮＡポリメラーゼは、任意の既知のＤＮＡ依存性ＤＮＡポリメラーゼ配列に対して少なくとも７０％の同一性（例：少なくとも７０％、少なくとも７１％、少なくとも７２％、少なくとも７３％、少なくとも７４％、少なくとも７５％、少なくとも７６％、少なくとも７７％、少なくとも７８％、少なくとも７９％、少なくとも８０％、少なくとも８１％、少なくとも８２％、少なくとも８３％、少なくとも８４％、少なくとも８５％、少なくとも８６％、少なくとも８７％、少なくとも８８％、少なくとも８９％、少なくとも９０％、少なくとも９１％、少なくとも９２％、少なくとも９３％、少なくとも９４％、少なくとも９５％、少なくとも９５．５％、少なくとも９６％、少なくとも９６．５％、少なくとも９７％、少なくとも９７．５％、少なくとも９８％、少なくとも９８．５％、少なくとも９９％、少なくとも９９．５％、少なくとも９９．６％、少なくとも９９．７％、少なくとも９９．８％、少なくとも９９．９％の同一性）を有するアミノ酸配列を含み；および／または（２）ＤＮＡリガーゼは、任意の既知のＤＮＡリガーゼ配列に対して少なくとも７０％の同一性（例：少なくとも７０％、少なくとも７１％、少なくとも７２％、少なくとも７３％、少なくとも７４％、少なくとも７５％、少なくとも７６％、少なくとも７７％、少なくとも７８％、少なくとも７９％、少なくとも８０％、少なくとも８１％、少なくとも８２％、少なくとも８３％、少なくとも８４％、少なくとも８５％、少なくとも８６％、少なくとも８７％、少なくとも８８％、少なくとも８９％、少なくとも９０％、少なくとも９１％、少なくとも９２％、少なくとも９３％、少なくとも９４％、少なくとも９５％、少なくとも９５．５％、少なくとも９６％、少なくとも９６．５％、少なくとも９７％、少なくとも９７．５％、少なくとも９８％、少なくとも９８．５％、少なくとも９９％、少なくとも９９．５％、少なくとも９９．６％、少なくとも９９．７％、少なくとも９９．８％、少なくとも９９．９％の同一性）を有するアミノ酸配列を含む。

いくつかの側面において、本開示は、配列決定のための核酸試料調製の間に合成鎖の合成を低減する方法であって、以下を含む方法に関する：（Ａ１）配列決定する核酸を取得すること；（Ａ２）態様１または態様２～５１のいずれか１つに記載の方法を実施すること。

いくつかの態様において、試料は配列決定される。いくつかの態様において、配列決定はサンガーベースの配列決定である。いくつかの態様において、配列決定は、高スループット配列決定（例：次世代配列決定）に基づく。次世代配列決定または「ＮＧＳ」は当技術分野で周知であり、当業者には容易に明らかであろう。例えば、限定されないが、ＮＧＳ配列決定技法にはLife Technologies（商標）およびIllumina（商標）、PacBio、およびOxford Nanoporeからのものが含まれる。いくつかの態様において、配列決定は二重鎖配列決定である。いくつかの態様において、配列決定はコンピュータ上のコンピュータ分析を含む。いくつかの態様において、このコンピュータ分析は、試料配列のトリミングを含む。トリミングは、鎖の少なくとも１つの末端における、所与の断片の配列決定をトリミングすることを含み得る。このトリミングは、少なくとも部分的には、多くの場合本明細書の他の場所で説明されるように、鎖再合成により断片の末端で発生し得る偽変異またはミスマッチによる任意のエラーを、補償または低減するために実施される。いくつかの態様において、トリミングは、少なくとも１つの末端で生じる。いくつかの態様において、トリミングは両方の末端で生じる。いくつかの態様において、配列の少なくとも１つのヌクレオチドがトリミングされる（例：１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、またはそれ以上）。いくつかの態様において、少なくとも１０のヌクレオチドがトリミングされる。いくつかの態様において、少なくとも１２のヌクレオチドがトリミングされる。いくつかの態様において、配列の３０未満のヌクレオチドがトリミングされる（例：３０、２９、２８、２７、２６、２５、２４、２３、２２、２１、２０、１９、１８、１７、１６、１５、１４、１３、１２、１１、１０、９、８、７、６、５、４、３、２、または１）。いくつかの態様において、１５未満のヌクレオチドがトリミングされる。いくつかの態様において、少なくとも１３のヌクレオチドがトリミングされる。

いくつかの側面において、本開示は、以下を含むキットに関する：（ａ）本開示の任意の方法を実施するための試薬；および（ｂ）容器。いくつかの態様において、キットはさらに反応容器を含む。いくつかの態様において、キットの試薬は以下を含む：（ａ）次の１つ以上：エンドヌクレアーゼＩＶ（ＥｎｄｏＩＶ）；ホルムアミドピリミジン［ｆａｐｙ］－ＤＮＡグリコシラーゼ（Ｆｐｇ）；ウラシル－ＤＮＡグリコシラーゼ（ＵＤＧ）；Ｔ４ピリミジンＤＮＡグリコシラーゼ（Ｔ４ＰＤＧ）；および／またはエンドヌクレアーゼＶＩＩＩ（ＥｎｄｏＶＩＩＩ）；および／または、（ｂ）ｄＮＴＰ。いくつかの態様において、キットはさらに、試料を断片化するための試薬および材料を含む。

コンピュータ分析は、任意の適切なアルゴリズム、例えばParsons et al. Clinical Cancer Research, DOI: 10.1158/1078-0432.CCR-19-3005, vol. 26, No. 11, pp. 2556-2564、２０２０年６月発行に記載されており、その全体は参照により本明細書に組み込まれる。

試料
いくつかの態様において、本開示の任意の方法で使用される試料は、ＤＮＡ、ＲＮＡ、またはそれらの組み合わせを含む。いくつかの態様において、試料はＤＮＡを含む。いくつかの態様において、試料はＲＮＡを含む。適切な試料の選択、および本開示の方法の実行は、当業者には容易に明らかであり、過度の実験を必要としないであろう。例えば、限定されないが、試料は、無細胞ＤＮＡ（ｃｆＤＮＡ）および／または生殖系列ＤＮＡを含み得る。いくつかの態様において、試料はｃｆＤＮＡを含む。いくつかの態様において、試料は生殖系列ＤＮＡを含む。

さらに、容易に明らかなように、試料は様々な供給源から生成され得る。試料を構成する核酸は、対象の任意の成分に由来し得る。例えば、限定されないが、試料は、対象を構成する血液、唾液、または他の細胞成分であり得る。いくつかの態様において、試料は、対象から生検によって生成される。いくつかの態様において、生検は液体生検である。いくつかの態様において、生検は腫瘍生検である。

いくつかの態様において、試料はゼロのギャップ（例：０）を含有する。いくつかの態様において、試料は、少なくとも１つのギャップ（例：１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、またはそれ以上のギャップ）を含む。いくつかの態様において、試料は、１つより多くのギャップ（例：２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、またはそれ以上のギャップ）を含む。いくつかの態様において、試料は、１０以下のギャップ（例：１００、９９、９８、９７、９６、９５、９４、９３、９２、９１、９０、８９、８８、８７、８６、８５、８４、８３、８２、８１、８０、７９、７８、７７、７６、７５、７４、７３、７２、７１、７０、６９、６８、６７、６６、６５、６４、６３、６２、６１、６０、５９、５８、５７、５６、５５、５４、５３、５２、５１、５０、４９、４８、４７、４６、４５、４４、４３、４２、４１、４０、３９、３８、３７、３６、３５、３４、３３、３２、３１、３０、２９、２８、２７、２６、２５、２４、２３、２２、２１、２０、１９、１８、１７、１６、１５、１４、１３、１２、１１、１０、９、８、７、６、５、４、３、２、１、または０のギャップ）を含む。いくつかの態様において、試料は、１０以下のギャップ（例：１０、９、８、７、６、５、４、３、２、１、または０のギャップ）を含む。いくつかの態様において、試料は、０～１０１のギャップを含む。いくつかの態様において、試料は０～１１のギャップを含む。いくつかの態様において、試料は１～１０１のギャップを含む。いくつかの態様において、試料は１～１１のギャップを含む。

いくつかの態様において、ギャップは試料の一本鎖領域を含み、ここで少なくとも１つ（例：１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、またはそれ以上）のヌクレオシドは、試料の一本鎖部分の反対側に存在しない。いくつかの態様において、ギャップは、試料の一本鎖領域を含み、ここで、１つより多く（例：２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、またはそれ以上）のヌクレオシドは、二重鎖の一本鎖部分の反対側に存在しない。いくつかの態様において、ギャップは、試料の一本鎖領域を含み、ここで、１００未満（例：１００、９９、９８、９７、９６、９５、９４、９３、９２、９１、９０、８９、８８、８７、８６、８５、８４、８３、８２、８１、８０、７９、７８、７７、７６、７５、７４、７３、７２、７１、７０、６９、６８、６７、６６、６５、６４、６３、６２、６１、６０、５９、５８、５７、５６、５５、５４、５３、５２、５１、５０、４９、４８、４７、４６、４５、４４、４３、４２、４１、４０、３９、３８、３７、３６、３５、３４、３３、３２、３１、３０、２９、２８、２７、２６、２５、２４、２３、２２、２１、２０、１９、１８、１７、１６、１５、１４、１３、１２、１１、１０、９、８、７、６、５、４、３、２、または１）のヌクレオシドは、試料の一本鎖領域の反対側に存在しない。いくつかの態様において、ギャップは試料の一本鎖領域を含み、ここで、１０未満（例：１０、９、８、７、６、５、４、３、２、または１）のヌクレオシドは、試料の一本鎖領域の反対側に存在しない。いくつかの態様において、ギャップは一本鎖領域を含み、ここで１～１０１のヌクレオシドは、試料の一本鎖領域の反対側に存在しない。いくつかの態様において、ギャップは一本鎖領域を含み、ここで１～１１のヌクレオシドは、試料の一本鎖領域の反対側に存在しない。

いくつかの態様において、試料は、試料の少なくとも１つの鎖に少なくとも１つのギャップを含む。いくつかの態様において、試料は、試料の両方の鎖に少なくとも１つのギャップを含む。いくつかの態様において、試料は、試料の少なくとも１つの鎖に１つより多くのギャップを含む。いくつかの態様において、試料は、試料の両方の鎖に１つより多くのギャップを含む。

いくつかの態様において、試料はオーバーハングを含まない。いくつかの態様において、試料はオーバーハングを含む。いくつかの態様において、オーバーハングは、長さが少なくとも１ヌクレオシド（例：１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、５１、５２、５３、５４、５５、５６、５７、５８、５９、６０、６１、６２、６３、６４、６５、６６、６７、６８、６９、７０、７１、７２、７３、７４、７５、７６、７７、７８、７９、８０、８１、８２、８３、８４、８５、８６、８７、８８、８９、９０、９１、９２、９３、９４、９５、９６、９７、９８、９９、１００、１０１、１０２、１０３、１０４、１０５、１０６、１０７、１０８、１０９、１１０、１１１、１１２、１１３、１１４、１１５、１１６、１１７、１１８、１１９、１２０、１２１、１２２、１２３、１２４、１２５、１２６、１２７、１２８、１２９、１３０、１３１、１３２、１３３、１３４、１３５、１３６、１３７、１３８、１３９、１４０、１４１、１４２、１４３、１４４、１４５、１４６、１４７、１４８、１４９、１５０、１５１、１５２、１５３、１５４、１５５、１５６、１５７、１５８、１５９、１６０、１６１、１６２、１６３、１６４、１６５、１６６、１６７、１６８、１６９、１７０、１７１、１７２、１７３、１７４、１７５、１７６、１７７、１７８、１７９、１８０、１８１、１８２、１８３、１８４、１８５、１８６、１８７、１８８、１８９、１９０、１９１、１９２、１９３、１９４、１９５、１９６、１９７、１９８、１９９、２００、２０１、２０２、２０３、２０４、２０５、２０６、２０７、２０８、２０９、２１０、２１１、２１２、２１３、２１４、２１５、２１６、２１７、２１８、２１９、２２０、２２１、２２２、２２３、２２４、２２５、２２６、２２７、２２８、２２９、２３０、２３１、２３２、２３３、２３４、２３５、２３６、２３７、２３８、２３９、２４０、２４１、２４２、２４３、２４４、２４５、２４６、２４７、２４８、２４９、２５０、２５１、２５２、２５３、２５４、２５５、２５６、２５７、２５８、２５９、２６０、２６１、２６２、２６３、２６４、２６５、２６６、２６７、２６８、２６９、２７０、２７１、２７２、２７３、２７４、２７５、２７６、２７７、２７８、２７９、２８０、２８１、２８２、２８３、２８４、２８５、２８６、２８７、２８８、２８９、２９０、２９１、２９２、２９３、２９４、２９５、２９６、２９７、２９８、２９９、３００、３０１、３０２、３０３、３０４、３０５、３０６、３０７、３０８、３０９、３１０、３１１、３１２、３１３、３１４、３１５、３１６、３１７、３１８、３１９、３２０、３２１、３２２、３２３、３２４、３２５、３２６、３２７、３２８、３２９、３３０、３３１、３３２、３３３、３３４、３３５、３３６、３３７、３３８、３３９、３４０、３４１、３４２、３４３、３４４、３４５、３４６、３４７、３４８、３４９、３５０、またはそれ以上のヌクレオシド）である。いくつかの態様において、オーバーハングは、１ヌクレオシドを超える長さである。いくつかの態様において、オーバーハングの長さは、試料の長さからオーバーハングを差し引いた長さより短い（例：試料の全長の５０％未満）。いくつかの態様において、オーバーハングは、長さが３５０ヌクレオシド未満（例：３５０、３４９、３４８、３４７、３４６、３４５、３４４、３４３、３４２、３４１、３４０、３３９、３３８、３３７、３３６、３３５、３３４、３３３、３３２、３３１、３３０、３２９、３２８、３２７、３２６、３２５、３２４、３２３、３２２、３２１、３２０、３１９、３１８、３１７、３１６、３１５、３１４、３１３、３１２、３１１、３１０、３０９、３０８、３０７、３０６、３０５、３０４、３０３、３０２、３０１、３００、２９９、２９８、２９７、２９６、２９５、２９４、２９３、２９２、２９１、２９０、２８９、２８８、２８７、２８６、２８５、２８４、２８３、２８２、２８１、２８０、２７９、２７８、２７７、２７６、２７５、２７４、２７３、２７２、２７１、２７０、２６９、２６８、２６７、２６６、２６５、２６４、２６３、２６２、２６１、２６０、２５９、２５８、２５７、２５６、２５５、２５４、２５３、２５２、２５１、２５０、２４９、２４８、２４７、２４６、２４５、２４４、２４３、２４２、２４１、２４０、２３９、２３８、２３７、２３６、２３５、２３４、２３３、２３２、２３１、２３０、２２９、２２８、２２７、２２６、２２５、２２４、２２３、２２２、２２１、２２０、２１９、２１８、２１７、２１６、２１５、２１４、２１３、２１２、２１１、２１０、２０９、２０８、２０７、２０６、２０５、２０４、２０３、２０２、２０１、２００、１９９、１９８、１９７、１９６、１９５、１９４、１９３、１９２、１９１、１９０、１８９、１８８、１８７、１８６、１８５、１８４、１８３、１８２、１８１、１８０、１７９、１７８、１７７、１７６、１７５、１７４、１７３、１７２、１７１、１７０、１６９、１６８、１６７、１６６、１６５、１６４、１６３、１６２、１６１、１６０、１５９、１５８、１５７、１５６、１５５、１５４、１５３、１５２、１５１、１５０、１４９、１４８、１４７、１４６、１４５、１４４、１４３、１４２、１４１、１４０、１３９、１３８、１３７、１３６、１３５、１３４、１３３、１３２、１３１、１３０、１２９、１２８、１２７、１２６、１２５、１２４、１２３、１２２、１２１、１２０、１１９、１１８、１１７、１１６、１１５、１１４、１１３、１１２、１１１、１１０、１０９、１０８、１０７、１０６、１０５、１０４、１０３、１０２、１０１、１００、９９、９８、９７、９６、９５、９４、９３、９２、９１、９０、８９、８８、８７、８６、８５、８４、８３、８２、８１、８０、７９、７８、７７、７６、７５、７４、７３、７２、７１、７０、６９、６８、６７、６６、６５、６４、６３、６２、６１、６０、５９、５８、５７、５６、５５、５４、５３、５２、５１、５０、４９、４８、４７、４６、４５、４４、４３、４２、４１、４０、３９、３８、３７、３６、３５、３４、３３、３２、３１、３０、２９、２８、２７、２６、２５、２４、２３、２２、２１、２０、１９、１８、１７、１６、１５、１４、１３、１２、１１、１０、９、８、７、６、５、４、３、２、１）である。いくつかの態様において、オーバーハングの長さは１００ヌクレオシド未満である。いくつかの態様において、オーバーハングの長さは０～１００ヌクレオシドである。いくつかの態様において、オーバーハングの長さは１～３５０ヌクレオシドである。いくつかの態様において、オーバーハングの長さは１～１００ヌクレオシドである。いくつかの態様において、オーバーハングの長さは１～５０ヌクレオシドである。

いくつかの態様において、試料は、オーバーハングを含まない。いくつかの態様において、試料は、少なくとも１つ（例：１、２）のオーバーハングを含む。いくつかの態様において、試料は２つのオーバーハングを含む。いくつかの態様において、試料は少なくとも１つの５’オーバーハングを含む。いくつかの態様において、試料は２つの５’オーバーハングを含む。いくつかの態様において、試料は少なくとも１つの３’オーバーハングを含む。いくつかの態様において、試料は２つの３’オーバーハングを含む。いくつかの態様において、試料は５’オーバーハングと３’オーバーハングを含む。

いくつかの態様において、試料はゼロのニック（例：０）を含有する。いくつかの態様において、試料は、少なくとも１つのニック（例：１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、またはそれ以上のニック）を含む。いくつかの態様において、試料は、１つより多くのニック（例：２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、またはそれ以上のニック）を含む。いくつかの態様において、試料は、１０以下のニック（例：１００、９９、９８、９７、９６、９５、９４、９３、９２、９１、９０、８９、８８、８７、８６、８５、８４、８３、８２、８１、８０、７９、７８、７７、７６、７５、７４、７３、７２、７１、７０、６９、６８、６７、６６、６５、６４、６３、６２、６１、６０、５９、５８、５７、５６、５５、５４、５３、５２、５１、５０、４９、４８、４７、４６、４５、４４、４３、４２、４１、４０、３９、３８、３７、３６、３５、３４、３３、３２、３１、３０、２９、２８、２７、２６、２５、２４、２３、２２、２１、２０、１９、１８、１７、１６、１５、１４、１３、１２、１１、１０、９、８、７、６、５、４、３、２、１、または０のニック）を含む。いくつかの態様において、試料は、１０以下のニック（例：１０、９、８、７、６、５、４、３、２、１、または０のニック）を含む。いくつかの態様において、試料は、０～１０１のニックを含む。いくつかの態様において、試料は０～１１のニックを含む。いくつかの態様において、試料は１～１０１のニックを含む。いくつかの態様において、試料は１～１１のニックを含む。

いくつかの態様において、試料は、試料の少なくとも１つの鎖に少なくとも１つのニックを含む。いくつかの態様において、試料は、試料の両方の鎖に少なくとも１つのニックを含む。いくつかの態様において、試料は、試料の少なくとも１本の鎖に１つより多くのニックを含む。いくつかの態様において、試料は、試料の両方の鎖に１つより多くのニックを含む。

いくつかの態様において、試料はゼロの損傷塩基（例：０）を含有する。いくつかの態様において、試料は、少なくとも１つの損傷塩基（例：１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、またはそれ以上の損傷塩基）を含む。いくつかの態様において、試料は、１つより多くの損傷塩基（例：２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、またはそれ以上の損傷塩基）を含む。いくつかの態様において、試料は、１０以下の損傷塩基（例：１００、９９、９８、９７、９６、９５、９４、９３、９２、９１、９０、８９、８８、８７、８６、８５、８４、８３、８２、８１、８０、７９、７８、７７、７６、７５、７４、７３、７２、７１、７０、６９、６８、６７、６６、６５、６４、６３、６２、６１、６０、５９、５８、５７、５６、５５、５４、５３、５２、５１、５０、４９、４８、４７、４６、４５、４４、４３、４２、４１、４０、３９、３８、３７、３６、３５、３４、３３、３２、３１、３０、２９、２８、２７、２６、２５、２４、２３、２２、２１、２０、１９、１８、１７、１６、１５、１４、１３、１２、１１、１０、９、８、７、６、５、４、３、２、１、または０の損傷塩基）を含む。いくつかの態様において、試料は、１０以下の損傷塩基（例：１０、９、８、７、６、５、４、３、２、１、または０の損傷塩基）を含む。いくつかの態様において、試料は、０～１０１の損傷塩基を含む。いくつかの態様において、試料は０～１１の損傷塩基を含む。いくつかの態様において、試料は１～１０１の損傷塩基を含む。いくつかの態様において、試料は１～１１の損傷塩基を含む。

いくつかの態様において、試料は、試料の少なくとも１つの鎖に少なくとも１つの損傷塩基を含む。いくつかの態様において、試料は、試料の両方の鎖に少なくとも１つの損傷塩基を含む。いくつかの態様において、試料は、少なくとも１つの鎖に１つより多くの損傷塩基を含む。いくつかの態様において、試料は、試料の二本鎖部分に損傷塩基を含む。いくつかの態様において、試料は、試料の一本鎖部分に損傷塩基を含む。いくつかの態様において、試料は、試料の一本鎖部分と二本鎖部分の両方に損傷塩基を含む。

いくつかの態様において、試料はゼロのミスマッチ（例：０）を含有する。いくつかの態様において、試料は、少なくとも１つのミスマッチ（例：１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、またはそれ以上のミスマッチ）を含む。いくつかの態様において、試料は、１つより多くのミスマッチ（例：２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、またはそれ以上のミスマッチ）を含む。いくつかの態様において、試料は、１０以下のミスマッチ（例：１００、９９、９８、９７、９６、９５、９４、９３、９２、９１、９０、８９、８８、８７、８６、８５、８４、８３、８２、８１、８０、７９、７８、７７、７６、７５、７４、７３、７２、７１、７０、６９、６８、６７、６６、６５、６４、６３、６２、６１、６０、５９、５８、５７、５６、５５、５４、５３、５２、５１、５０、４９、４８、４７、４６、４５、４４、４３、４２、４１、４０、３９、３８、３７、３６、３５、３４、３３、３２、３１、３０、２９、２８、２７、２６、２５、２４、２３、２２、２１、２０、１９、１８、１７、１６、１５、１４、１３、１２、１１、１０、９、８、７、６、５、４、３、２、１、または０のミスマッチ）を含む。いくつかの態様において、試料は、１０以下のミスマッチ（例：１０、９、８、７、６、５、４、３、２、１、または０のミスマッチ）を含む。いくつかの態様において、試料は、０～１０１のミスマッチを含む。いくつかの態様において、試料は０～１１のミスマッチを含む。いくつかの態様において、試料は１～１０１のミスマッチを含む。いくつかの態様において、試料は１～１１のミスマッチを含む。

用語「同一性パーセント」、「配列同一性」、「同一性％」、「配列同一性％」、および「％同一である」は、本明細書では互換的に使用され得て、２つの配列間（例：核酸またはアミノ酸）の類似性の定量的測度を指す。ヒトと他の種との間のゲノムＤＮＡ配列、イントロンおよびエクソン配列、およびアミノ酸配列の同一性パーセントは、種の種類によって異なり、チンパンジーはすべての種の中で各カテゴリーにおいて、最も高いヒトとの同一性パーセントを有する。

２つの核酸配列の同一性パーセントの計算は、例えば、最適な比較目的のために２つの配列を整列させることによって行うことができる（例：最適アライメントのために第１および第２の核酸配列の一方または両方にギャップを導入することができ、同一でない配列は比較目的では無視することができる）。ある態様において、比較目的で整列された配列の長さは、参照配列の長さの少なくとも３０％、少なくとも４０％、少なくとも５０％、少なくとも６０％、少なくとも７０％、少なくとも８０％、少なくとも９０％、少なくとも９５％、または１００％である。次いで、対応するヌクレオチド位置のヌクレオチドを比較する。第１配列内の位置が、第２配列内の対応する位置と同じヌクレオチドによって占められている場合、分子はその位置で同一である。２つの配列間の同一性パーセントは、配列が共有する同一位置の数の関数であり、２つの配列の最適なアラインメントのために導入すべきギャップの数および各ギャップの長さを考慮する。

配列の比較および２つの配列間の同一性パーセントの決定は、数学的アルゴリズムを用いて達成することができる。例えば、２つのヌクレオチド配列間の同一性パーセントは、以下に記載されているような方法を用いて決定することができる：Computational Molecular Biology, Lesk, A. M., ed., Oxford University Press, New York, 1988；Biocomputing: Informatics and Genome Projects, Smith, D. W., ed., Academic Press, New York, 1993；Sequence Analysis in Molecular Biology, von Heinje, G., Academic Press, 1987；Computer Analysis of Sequence Data, Part I, Griffin, A. M., and Griffin, H. G., eds., Humana Press, New Jersey, 1994；およびSequence Analysis Primer, Gribskov, M. and Devereux, J., eds., M Stockton Press, New York, 1991；これらの各々は、参照により本明細書に組み込まれる。例えば、２つのヌクレオチド配列間の同一性パーセントは、PAM120重み付き残基表（weight residue table）、１２のギャップ長ペナルティおよび４のギャップペナルティを使用するALIGNプログラム（バージョン２．０）に組み込まれている、Meyers and Miller (CABIOS, 1989, 4:11-17)のアルゴリズムを使用して決定することができる。２つのヌクレオチド配列間の同一性パーセントは、代替的に、NWSgapdna.CMPマトリックスを用いるＧＣＧソフトウェアパッケージのＧＡＰプログラムを使用して決定することもできる。配列間の同一性パーセントを決定するために一般に使用される方法としては、参照により本明細書に組み込まれるCarillo, H., and Lipman, D., SIAM J Applied Math., 48:1073 (1988)に開示されたものが挙げられるが、これらに限定されない。同一性を特定するための技法は、公的に入手可能なコンピュータプログラムに体系化されている。２つの配列間の相同性を決定するための例示的なコンピュータソフトウェアとしては、ＧＣＧプログラムパッケージ、Devereux, J., et al., Nucleic Acids Research, 12(1), 387 (1984))、BLASTP、BLASTN、およびFASTA、Atschul, S. F. et al., J. Molec. Biol., 215, 403 (1990)）が挙げられるが、これらに限定されない。

同一性パーセント、またはその範囲（例：少なくとも、それより多く、等）が記載されている場合、特に指定がない限りエンドポイントは含まれるものとし、その範囲（例：少なくとも７０％の同一性）には引用された範囲内のすべての範囲（例：少なくとも７１％、少なくとも７２％、少なくとも７３％、少なくとも７４％、少なくとも７５％、少なくとも７６％、少なくとも７７％、少なくとも７８％、少なくとも７９％、少なくとも８０％、少なくとも８１％、少なくとも８２％、少なくとも８３％、少なくとも８４％、少なくとも８５％、少なくとも８６％、少なくとも８７％、少なくとも８８％、少なくとも８９％、少なくとも９０％、少なくとも９１％、少なくとも９２％、少なくとも９３％、少なくとも９４％、少なくとも９５％、少なくとも９５．５％、少なくとも９６％、少なくとも９６．５％、少なくとも９７％、少なくとも９７．５％、少なくとも９８％、少なくとも９８．５％、少なくとも９９％、少なくとも９９．５％、少なくとも９９．６％、少なくとも９９．７％、少なくとも９９．８％、少なくとも９９．９％の同一性）およびそのすべての増分（例：１パーセントの１０分の１（例：０．１％）、１パーセントの１００分の１（例：０．０１％）など）が含まれるものとする。

本明細書において別段に定義されない限り、本開示に関連して使用される科学用語および技術用語は、当業者（those of ordinary skill in the art）（例：当業者（the skilled artisan））によって一般に理解される意味を有するものとする。用語の意味および範囲は明らかであるが、潜在的な曖昧さがある場合には、本明細書で提供される定義が、任意の辞書または外部の定義より優先される。さらに、文脈により別段の要求がない限り、単数形の用語には複数形が含まれ、複数形の用語には単数形が含まれるものとする。本開示において、別段の記載がない限り、「または」の使用は「および／または」を意味する。さらに、「含むこと」という用語、ならびに「含む」および「含まれる」などの他の形式の使用は、限定的ではない。また、具体的に別段の記載がない限り、「要素」または「構成要素」などの用語は、１つのユニットを含む要素および構成要素と、２つ以上のサブユニットを含む要素および構成要素の両方を包含する。

一般に、本明細書に記載の細胞および組織培養、分子生物学、免疫学、微生物学、遺伝学、ならびにタンパク質および核酸の化学およびハイブリダイゼーションに関連して使用される命名法、およびそれらの技法は、当技術分野でよく知られており、一般に使用されているものである。本開示の方法および技法は、一般に、当技術分野で周知の従来の方法に従って、および、別段の指示がない限り、本開示全体にわたって引用および議論される様々な一般的およびより具体的な参考文献に記載されているように実施される。酵素反応および精製技法は、製造業者の仕様書に従って、当技術分野で一般的に達成されるように、または本明細書に記載のように実施される。本明細書に記載の分析化学、有機合成化学、および医薬品および創薬化学に関連して使用される命名法、ならびにそれらの実験手順および技法は、当技術分野でよく知られ一般的に使用されているものである。標準的な技法は、化学合成、化学分析、医薬品の調製、製剤化、および送達、ならびに対象の処置に使用される。

用語「およそ」または「約」は本明細書で互換的に使用され、１つ以上の興味ある値に適用される場合、記載された基準値に類似する値を指す。ある態様において、用語「およそ」または「約」は、記載された基準値のいずれかの方向の１５％、１４％、１３％、１２％、１１％、１０％、９％、８％、７％、６％、５％、４％、３％、２％、１％、またはそれ未満内（すなわち、これより大きいパーセンテージまたは小さいパーセンテージ）に入る値の範囲を指すが、ただし、別段の記載がない限り、または文脈から明らかでない限りにおいてである（例えば、かかる数値が可能な値の１００％を超える場合）。

例１：二重鎖修復は二重鎖配列決定における偽変異の発見を制限する
次世代配列決定（ＮＧＳ）に基づくさらなる検査が臨床使用に向けて進歩しているため、ＮＧＳの精度を最大化することが不可欠である。これは、臨床検体中の低含量の変異を検出しようとする場合に特に重要であり、例えば、早期がん検出（Chabon et al., Nature, 2020；Corcoran et al., Ann Rev Cancer Bio, 2019）、微小残存病変（「ＭＲＤ」）のモニタリング（Parsons et al., Clinic Cancer Res, 2020; Tie et al., Sci Trans Med, 2016）、アクションが可能な変異または耐性変異の追跡（Parikh et al., Nat Med, 2019）、出生前遺伝子検査の実施（Lo et al., Sci Trans Med, 2010）および微生物またはウイルス感染の検出（Blauwkamp et al., 2019）などのためであり、なぜならばエラーは、不正確な診断および処置につながり得るからである。さらに、高精度のＮＧＳは研究用途でも望まれており、例えば体細胞モザイク現象（Dou et al., Trends in Genetics, 2018）およびクローン性造血の研究（Genovese et al., 2014）、化合物の変異原性の評価（Matsumura et al., 2018）、クラスター化され規則的に間隔のあいた短い回文構造の繰り返し（「ＣＲＩＳＰＲ」）（Anzalone, 2020）等の塩基編集技術の特徴付け、およびＤＮＡのデジタルデータ保存での使用（Ceze et al., Nat Rev Genetics, 2019）などであり、なぜならばエラーは、根拠のない生物学的発見または情報の誤った（デ）コード化につながり得るからである。

ＤＮＡ塩基の損傷は、ＮＧＳにおける偽変異発見の主な原因である（Chen et al., Science, 2017）。シトシンの脱アミノ化、チミン二量体、ピリミジン二量体、８－オキソグアニン、６－Ｏ－メチルグアニン、脱プリン化、および脱ピリミジン化などの病変は、自然発生的に発生する場合と、次のような環境および化学的暴露に反応して発生する場合がある：紫外線（ＵＶ）照射、電離放射線、活性酸素種、および遺伝毒性物質、または試料処理手順、例えばホルマリン固定、凍結と解凍、加熱、音響剪断、および水溶液での長期保存など（Costello et al., Nucleic Acids Res, 2013；Wong et al., BMC Med Genomics, 2014）。修正することなく放置すると、かかる病変は、損傷乗り越え合成が可能なポリメラーゼによってコピーされる場合に塩基対合の変化をもたらし、それによって偽変異の検出につながる可能性がある。これらの問題は、ライブラリー増幅および配列決定で導入される他のエラーと共に、標準的なＮＧＳにおいてエラー率０．１％～１％に寄与する（Salk et al., Nat Rev Genetics, 2018）。

塩基損傷エラーの偶然性のため、多くは、各ＤＮＡ断片の複数コピーを配列決定し、リード間のコンセンサスを必要とすることによって、克服することができる。かかる「コンセンサスベースの」配列決定は、ＤＮＡの各一本鎖からのコンセンサスを必要とする場合は最大１００倍まで、各ＤＮＡ二重鎖の両方のセンス鎖からのコンセンサスを必要とする場合は最大１０００倍まで、エラーを減らすことができる。二重鎖の両方のセンス鎖の配列決定および読み取りを必要とする方法は、「二重鎖配列決定」として知られている（Schmitt et al., PNAS, 2012）。しかし、二重鎖ＤＮＡの主鎖損傷（例：ニック、ギャップ、およびオーバーハング）を修正し、ＮＧＳアダプターのライゲーションを促進するために使用される「末端修復／ｄＡテーリング」（ＥＲ／ＡＴ）のための既存の方法では、アダプターライゲーションの前に各二重鎖の一部が再合成される可能性がある。塩基損傷の存在下で再合成が起こると、損傷乗り越え合成によりエラーが両方の鎖にコピーされ、両方の鎖上の真の変異と区別できなくなる可能性がある。二重鎖配列決定における偽の発見の、この主な原因は、短い５’オーバーハングが埋められることが多い断片末端において最も明確に見られる。しかしこれは、（ｉ）ＥＲ／ＡＴで使用されるＴａｑおよびクレノウポリメラーゼの５’エキソヌクレアーゼ活性および鎖置換活性、および（ｉｉ）鎖再合成の「プライミング部位」として機能し得る様々な主鎖損傷、を考慮すると、さらに深くまで及び得る。

本明細書で提示されるのは、少なくとも鎖再合成を制限することによって塩基損傷エラーが両方の鎖にコピーされる可能性を制限する、二重鎖修復と呼ばれるアプローチである（図１）。ｃｆＤＮＡおよびＦＦＰＥ腫瘍生検の一分子リアルタイム配列決定および遺伝子パネル配列決定の両方を使用して、二重鎖修復が、鎖再合成を最小限に抑えて二重鎖配列決定における偽変異の発見を制限することが示された。

市販の末端修復／ｄＡテーリング（ＥＲ／ＡＴ）キットは広範なＤＮＡ再合成を行う
まず、ＥＲ／ＡＴ方法で再合成された塩基の数を測定するためのアッセイを開発した。この技法は、ｄ６ｍＡＴＰ、ｄ４ｍＣＴＰ、ｄＴＴＰ、およびｄＧＴＰからなるカスタムｄＮＴＰミックスを使用してＥＲ／ＡＴを実施すること、およびｄ６ｍＡＴＰおよびｄ４ｍＣＴＰが組み込まれた場所を検出できるPacBioシーケンサー上で調製されたライブラリーを配列決定すること、を含んでいた（図２Ａ）。このアッセイが、再合成された塩基を、単一ヌクレオチド分解能で確実に検出できることを確認するために、３つの合成オリゴヌクレオチドを調製した：完全二重鎖（ＮＧＳアダプターのｄＡテール付きライゲーションのためのアデノシンオーバーハングを含む）；１０塩基対の５’オーバーハングを有するオリゴヌクレオチド；およびお８０塩基対の５’オーバーハングを有するオリゴヌクレオチド。予想通り、トップ鎖のオーバーハング領域で埋め込みが観察され、市販のＥＲ／ＡＴが５’オーバーハングを埋めることが確認された。さらに、埋め込み塩基はトップ鎖とボトム鎖の両方の３’末端の上流で検出され、Ｔ４ＤＮＡポリメラーゼなどのポリメラーゼが、埋め込みを開始する前に３’末端を噛み返す（例：分解する）可能性があり、それがさらにＤＮＡ重合の程度を増加させたことを示唆している（図２Ｂ）。次に、市販のＥＲ／ＡＴキットがニックまたはギャップ部位の下流のすべての塩基を再合成するかどうかを確認するための試験を実施した。短いオリゴを、８０塩基対の５’オーバーハングを有する合成オリゴヌクレオチドにアニーリングして、同じ位置に１つの人工ニックまたは１ヌクレオチドのギャップを有する完全二重鎖を形成し、これが市販のＥＲ／ＡＴに供されると、ニックまたはギャップ部位の下流の全領域が埋められることを示した（図２Ｂ）。再合成は、トップ鎖とボトム鎖の両方の３’末端の上流でも検出された。

この技法を、５人の健康なドナーからのｃｆＤＮＡに適用した。埋め込みは主に３’末端付近で発生したが、断片のさらに深くまで伸びる可能性もあった（図２Ｃ）。場合によっては、一本鎖の大部分または鎖全体が、市販のキットを使用することによってＥＲ／ＡＴの間に再合成された（図２Ｄ）。全体として、この結果は、市販のＥＲ／ＡＴキットがｃｆＤＮＡの主鎖損傷の修復を試みつつ大規模なＤＮＡ再合成を実施していることを示唆し、これは、配列決定されたほとんどの塩基対が元のｃｆＤＮＡ二重鎖からのものではない可能性があることを意味する。

鎖再合成は、塩基損傷がある場合に最も問題である
１人の健康なドナーからの無細胞ＤＮＡ（ｃｆＤＮＡ）を、異なる濃度のＤＮａｓｅＩ（さらなるニックを誘導するため）および酸化剤ＣｕＣｌ_２／Ｈ_２Ｏ_２に供した。次いで、IDT xGen汎がん遺伝子パネルの標的化二重鎖配列決定を各試料に適用し、最高のエラー率を、ｃｆＤＮＡを最高濃度のＤＮａｓｅＩおよびＣｕＣｌ_２／Ｈ_２Ｏ_２で処理した場合に検出した（図３Ｂ）。同じ濃度のＣｕＣｌ_２／Ｈ_２Ｏ_２では、使用したＤＮａｓｅＩの量に応じて測定されたエラー率が増加した。これにより、より多量のＤＮａｓｅＩによって誘導されるニックからの鎖再合成がより高度に行われると、より多くの塩基損傷エラーが伝播し、二重鎖配列決定エラー率が増加する可能性があることが確認された。最も高いエラー率は、最大濃度のＤＮａｓｅＩおよびＣｕＣｌ_２／Ｈ_２Ｏ_２を使用した二重鎖配列決定で観察された。また、観察された変異は、ＣｕＣｌ_２／Ｈ_２Ｏ_２曝露の予想される変異シグネチャーと一致することが確認された（図４）。

二重鎖修復はＤＮＡ末端修復およびｄＡテーリングの間のＤＮＡ重合を制限する
二重鎖修復は、アダプターライゲーションの前に既存のＥＲ／ＡＴ方法によって導入されるエラーを制限するための、カスタムの方法／キットである（図１、図５）。二重鎖修復は、４つのステップからなる：（１）損傷塩基の切除およびオーバーハングの除去、（２）平滑化および制限された埋め込み、（３）ニックシーリング、および（４）ｄＡテーリング。ステップ１では、ＤＮＡを、エンドヌクレアーゼＩＶ（ＥｎｄｏＩＶ）、ホルムアミドピリミジン［ｆａｐｙ］－ＤＮＡグリコシラーゼ（Ｆｐｇ）、ウラシル－ＤＮＡグリコシラーゼ（ＵＤＧ）、Ｔ４ピリミジンＤＮＡグリコシラーゼ（Ｔ４ＰＤＧ）およびエンドヌクレアーゼＶＩＩＩ（ＥｎｄｏＶＩＩＩ）からなる酵素カクテルで処理する。これらの酵素の同時活性により、ウラシル、８’オキソＧ、酸化ピリミジン、シクロブタンピリミジン二量体および脱塩基部位などの損傷塩基が切除され、その結果、二本鎖領域に１ヌクレオチドのギャップが生じるか、一本鎖領域に鎖破断が生じる。このステップではエキソヌクレアーゼＶＩＩ（ＥｘｏＶＩＩ）を使用して、３’および５’の一本鎖オーバーハングを分解する。ステップ２において、Ｔ４ポリヌクレオチドキナーゼがＤＮＡ末端を（脱）リン酸化し、Ｔ４ＤＮＡポリメラーゼ（３’→５’エキソヌクレアーゼ活性はあるが、５’→３’エキソヌクレアーゼ活性または鎖置換活性は持たない）が、３’オーバーハングを平滑化し、ギャップおよび短い（≦７ｎｔ）残りの５’オーバーハングを埋める。ステップ３では、ニックがＨｉＦｉＴａｑＤＮＡリガーゼによってシールされて、誤った分子間ライゲーションを最小限に抑えるために選択される。ステップ４のｄＡテーリングは、クレノウ断片（ｅｘｏ－）およびＴａｑＤＮＡポリメラーゼを使用し、ＤＮＡ再合成を防ぐためにｄＡＴＰのみの存在下で実施される。市販のＥＲ／ＡＴと比較した二重鎖修復の性能を検証するために、フルオロフォアで標識され、かつ複数のタイプの主鎖および塩基損傷を含有する合成オリゴヌクレオチドを、キャピラリー電気泳動によって分析した（図３Ａ）。

５’オーバーハングを有する合成オリゴ：ｄｓＤＮＡ基質を、３０塩基対の５’オーバーハングおよび他の末端の２つの異なるヌクレアーゼ耐性フルオロフォアと共に調製した（図３Ａ、列ｉ）。市販のＥＲ／ＡＴキットを使用すると、１０１塩基対のｄＡテール付き生成物が検出され、ＤＮＡポリメラーゼが５’オーバーハング全体に相補的な３０塩基対を再合成したことが示唆された。対照的に、二重鎖修復では、３０塩基対の５’オーバーハングがステップ１の後に３塩基対に分解され、３ヌクレオチドのみがステップ２の間に埋められた；これは、７３塩基対のｄＡテール付き生成物により示される。

３’オーバーハングを有する合成オリゴ：ｄｓＤＮＡ基質を３０塩基対の３’オーバーハングと共に調製し、市販のキットが７１塩基対のｄＡテール付き生成物を生成することを観察した；これは、３’オーバーハングが完全に平滑化されており、埋め込みがないことを示唆する（図３Ａ、列ｉｉ）。同様に二重鎖修復では、ｄＡテール付き生成物も７１ｂｐであるため、最初の２つのステップの後に３’オーバーハングが平滑化された。

ニックを有する合成オリゴ：３０塩基対のオリゴを３０塩基対の５’オーバーハング基質にアニーリングして、人工ニックを有するｄｓＤＮＡを作製し、１０１塩基対のｄＡテール付き生成物を市販のＥＲ／ＡＴキットを用いて検出しした；これは、ＤＮＡポリメラーゼが、ニック翻訳または鎖置換によって３０ヌクレオチドを埋めて、１０１塩基対のトップ鎖生成物を作ったことを示唆する（ニックをシールするＤＮＡリガーゼがなかったため；図３Ａ、列ｉｉｉ）。二重鎖修復を使用すると、ステップ２において、Ｔ４ＤＮＡポリメラーゼはニック翻訳活性または鎖置換活性を欠いているため、ニック部位からトップ鎖を伸長できず、ニックはステップ３において、ＨｉＦｉＴａｑＤＮＡリガーゼによって効率的にシールされた。

ギャップ領域に塩基損傷のない合成オリゴ：２９塩基対または２５塩基対のオリゴを、３０塩基対の５’オーバーハングを有するｄｓＤＮＡにアニーリングして、１ヌクレオチドまたは５ヌクレオチドのギャップを有するｄｓＤＮＡを作った；そして、市販キットのＤＮＡポリメラーゼが、ギャップ部位からボトム鎖を通してニック翻訳または鎖置換によってコピーされ、３０ヌクレオチドを埋めて、１０１塩基対のｄＡテール付き生成物を生成したことを観察した（図３Ａ、列ｉｖおよびｖ）。しかしながら二重鎖修復では、ステップ２の間にＴ４ＤＮＡポリメラーゼはさらなる再合成を行わず、１ヌクレオチドまたは５ヌクレオチドのギャップを効率的に埋め（Ｔ４ＤＮＡポリメラーゼが２７ヌクレオチドのギャップを効率的に埋め得ることも観察された（図６））、結果として生じたニックは、ＨｉＦｉＴａｑＤＮＡリガーゼによってステップ３の間に効率的にシールされた。

ギャップ領域に塩基損傷を有する合成オリゴ：２９塩基対のオリゴを３０塩基対の５’オーバーハングを有するｄｓＤＮＡにアニーリングして、１ヌクレオチドのギャップおよびウラシルまたは８’オキソＧ病変をギャップ領域の反対側に有するｄｓＤＮＡを作った（図３Ａ、列ｖｉおよびｖｉｉ）。１０１塩基対のｄＡテール付き生成物が市販のキットで検出され、これは、ＤＮＡポリメラーゼが、塩基損傷エラーを両方の鎖に伝播させ得る塩基損傷を含有するボトム鎖をコピーしたことを示唆した。対照的に二重鎖修復では、７０塩基対の生成物がステップ１の後に検出され、これは、意図した鎖破断が塩基損傷位置で発生し、塩基損傷エラーが両方の鎖にコピーされるのを防止したことを示唆している。ステップ４では、７１塩基対のｄＡテール付き生成物が得られた。

二重鎖修復は実際の臨床試料における二重鎖配列決定エラーを制限する
二重鎖修復が二重鎖配列決定エラーを制限できるかどうかを試験するために、図３Ｂからの最も重度に損傷したｃｆＤＮＡおよびＦＦＰＥｇＤＮＡ試料に対し、二重鎖修復対市販キットを用いてＥＲ／ＡＴを実施し、次いで、IDT xGen汎がんパネルまたはカスタムパネルの標的化配列決定を適用した。二重鎖修復は、損傷したｃｆＤＮＡ試料（１×１０^－６から～５×１０^－８）およびＦＦＰＥｇＤＮＡ試料（６×１０^－５から１×^－６）についてそれぞれ、市販のＥＲ／ＡＴキットと比較して２０倍および６０倍のエラーの減少を示した（図３Ｃ）。最も重度の損傷を受けたｃｆＤＮＡの二重鎖修復による修復のエラー率は、市販のＥＲ／ＡＴを使用して調製された損傷のないｃｆＤＮＡよりもさらに低い。この結果は、二重鎖修復が試料内の塩基損傷エラーの伝播を防止し、二重鎖配列決定の忠実度を向上できることを確認する。

例２：二重鎖修復はＤＮＡ損傷にもかかわらず高精度の配列決定を可能にする
ＤＮＡにおける合成変異のＤＮＡ配列は、遺伝的多様性を推進し^１、遺伝子機能を変化させ^２、細胞の表現型に影響を与え^３、細胞集団をマークし^４、進化の軌跡を定義し^５、疾患および状態を強調し^６、および精密医療と診断の標的を提供する^７。したがって、広範囲の存在量にわたって変異を検出できることが重要である。例えば、低存在量の変異（例：ＶＡＦが０．１～１％未満、「単一二重鎖」の分解能まで）を検出することは、がんの進化^８および薬剤耐性^９の研究、体細胞モザイク現象^１０およびクローン性造血^１１の理解、塩基編集技術の特徴付け^１２、化合物の変異原性の評価^１３、病原性バリアントの発見^１４、ヒト胚発生の研究^１５、微生物またはウイルス感染^１６およびがん^１７、および組織または液体生検などの検体からの臨床的にアクションが可能なゲノム変化^１８の検出などにとって重要である。

次世代配列決定（ＮＧＳ）の進歩にもかかわらず、ＤＮＡ損傷は変異検出を混乱させ、精度を試料品質に依存させるが、これは大きな問題である^１９。ウラシル、チミン二量体、ピリミジン二量体、８－オキソグアニン（８’オキソＧ）、６－Ｏ－メチルグアニン、脱プリン化、および脱ピリミジン化などの病変は、自然発生的に発生する場合と、次のような環境および化学的暴露に反応して発生する場合がある：ＵＶ照射、電離放射線、活性酸素種、および遺伝毒性物質、または試料処理手順、例えばホルマリン固定、凍結と解凍、加熱と熱サイクル、音響剪断、および水溶液での長期保存など。増幅されると損傷乗り越え合成が起こり得て、変異をin vitroで導入する。これらは、試料調製および配列決定における他のエラーと共に、ＮＧＳのエラー率０．１～１％に寄与する^２２。

塩基損傷エラーの偶然性のため、それらのほとんどは、各ＤＮＡ断片の複数コピーをバーコード化および配列決定し、リード間のコンセンサスを必要とすることにより、克服することができる。かかる方法は、ＤＮＡの各一本鎖からのコンセンサスを必要とする場合は最大１００倍、各ＤＮＡ二重鎖の両方のセンス鎖からのコンセンサスを必要とする場合は最大１０，０００倍まで、二重鎖配列決定と呼ばれる技法においてエラーを低減することができる^２３。しかし、配列決定のために剪断された（sheared）ものを含め、ほとんどの二本鎖ＤＮＡ断片には「ギザギザの末端（jagged ends）」があり、これは、配列決定アダプターを両方の鎖にライゲートするために修復する必要がある。「末端修復／ｄＡテーリング」（ＥＲ／ＡＴ）方法は、３’オーバーハングを除去し、５’オーバーハングを埋め、５’末端をリン酸化し（「末端修復」を介して）、および各３’末端に単一のｄＡＭＰを残して（「ｄＡテーリング」を介して）、ｄＴＭＰテール付きアダプターのライゲーションを容易にするように設計される。ＥＲ／ＡＴ方法はそれでも、各二重鎖の一部を再合成し得るポリメラーゼを含む。

再合成が、１つの鎖に限定された増幅可能な病変または変化の存在下で起こる場合、変化した塩基対合は、増幅時に新たに合成された鎖に伝播するであろう。これにより、一方の鎖からの増幅可能な病変または変化が、両方の鎖上の真の変異から識別できなくなる（図７Ａ）。この問題は、短い５’オーバーハングの埋め込みに起因して、各二重鎖の末端（例：最後の約１２ｂｐ）で観察される^２４。しかしかかるエラーは、（ｉ）ＥＲ／ＡＴで使用されるＴａｑおよびクレノウポリメラーゼの５’エキソヌクレアーゼ活性および鎖置換活性^２５、および（ｉｉ）鎖再合成のための「プライミング部位」として作用する、ＤＮＡの様々なニック、ギャップ、およびオーバーハング^２６を考慮すると、さらに深く広がる可能性もある。

本明細書においては、従来のＥＲ／ＡＴをニック、ギャップ、またはオーバーハングを有するＤＮＡに適用すると、各二重鎖の実質的な部分が再合成されることが実証される。さらに示されているのは、鎖再合成を制限する、二重鎖修復と呼ばれる新しいＥＲ／ＡＴ方法である。一分子およびパネル配列決定を使用して、二重鎖修復をｃｆＤＮＡおよびホルマリン固定腫瘍生検などの試料に適用すると、鎖の再合成を最小限に抑え、様々な程度のＤＮＡ損傷にもかかわらず高い精度を回復することが示されている。

例２に関連する方法
二重鎖修復ワークフロー：二重鎖修復は４つのステップからなる。ステップ１では、ＤＭＡを、１×NEBuffer 2中のＥｎｄｏＩＶ（カタログ番号M0304S）、Ｆｐｇ（カタログ番号M0240S）、ＵＤＧ（カタログ番号M0280S）、Ｔ４ＰＤＧ（カタログ番号M0308S）、ＥｎｄｏＶＩＩＩ（カタログ番号M0299S）およびＥｘｏＶＩＩ（カタログ番号M0379S）（すべてNEB製、各０．２μＬを使用）からなる酵素カクテルと共に、０．０５μｇ／μＬのＢＳＡの存在下（総反応量＝２０μＬ）、３７℃で３０分間処理する。ステップ２では、Ｔ４ＰＮＫ（カタログ番号M0201S；NEB；０．２５μＬを使用）、Ｔ４ＤＮＡポリメラーゼ（カタログ番号M0203S；NEB；０．２５μＬを使用）、ＡＴＰ（最終濃度＝０．８ｍＭ）、およびｄＮＴＰミックス（各ｄＮＴＰの最終濃度＝０．５ｍＭ）をステップ１の反応混合物に加え、３７℃でさらに３０分間インキュベートする。ステップ３では、ＨｉＦｉＴａｑリガーゼ（カタログ番号M0647S；NEB；０．５μＬを使用）および１０×ＨｉＦｉＴａｑリガーゼ緩衝液（１．５μＬを使用）をステップ２の反応混合物にスパイクし、４５分かけて３５℃から６５℃まで加熱するサーマルサイクラー上でインキュベートする。得られた生成物を３×Ampureビーズクリーンアップの実施により精製し、１７μＬの１０ｍＭのTris緩衝液で溶出する。ステップ４では、精製された生成物を、１×NEBuffer 2中のクレノウ断片（３’→５’ｅｘｏ－）（カタログ番号M0212L；NEB；１μＬを使用）およびＴａｑＤＮＡポリメラーゼ（カタログ番号M0273S；NEB；０．２μＬを使用）で、０．２ｍＭのｄＡＴＰの存在下（総反応量＝２０μＬ）室温で３０分間、その後６５℃で３０分間処理する。配列決定用の二重鎖修復ライブラリーを調製するには、Ｔ４ＤＮＡリガーゼ（カタログ番号M0202L；NEB；１０００ユニットを使用）、５’－デアデニラーゼ（カタログ番号M0331S；NEB；０．５μＬを使用）、PEG 8000（最終濃度＝１０％（ｗ／ｖ））、およびカスタムのデュアルインデックス二重鎖ＵＭＩアダプター（ＩＤＴ）をステップ４の反応混合物に添加し（総反応量＝５５μＬ）、これを次に室温で１時間インキュベートし、続いて１．２×Ampureビーズクリーンアップを実施し、精製された生成物をＰＣＲで増幅する。

合成オリゴヌクレオチドの鎖再合成のキャピラリー電気泳動による定量化：フルオロフォア標識一本鎖オリゴヌクレオチド（ＩＤＴより；表１）を、低ＴＥ緩衝液（ｐＨ８．０）に再懸濁し、アニーリングして、ニック、ギャップ、またはオーバーハングを有するＤＮＡ二本鎖を形成した。次に２０～２００ｎｇの各二重鎖基質を、従来のＥＲ／ＡＴキット、Kapa Hyper Prepキット、または二重鎖修復のワークフローに通し、各ステップ後の生成物のアリコートをキャピラリー電気泳動分析のためにEton Bioscienceに送付した。返されたデータはPeak Scanner 2ソフトウェアで分析し、再較正した。

キャピラリー電気泳動トレースの再較正のために、合成オリゴヌクレオチドの長さをＩＤＴの質量分析によって確認した（データ示さず）。しかしながら、Peak scanner 2ソフトウェアを使用することによる生の断片分析から報告された対照ピーク位置は、予想される位置とは異なる（表１、図８）；６－ＦＡＭタグ付き分子のピーク位置は一貫して過小評価として表示されるが、一方ATTO 550のピーク位置は過大評価として表示される。
表１：合成オリゴヌクレオチドのＤＮＡ配列。アスタリスク（^＊）は、フルオロフォアをヌクレアーゼによる切断から保護するＣ３スペーサーまたはホスホロチオアート結合の存在を示す。

キャピラリー電気泳動データを解釈するために、ピーク位置の再較正を既知の長さの合成オリゴヌクレオチドのラダーを使用して行った。式１～２は、オリゴヌクレオチドの長さを、線形回帰を通じて生のピーク位置に関連付ける。
ｙ＝１．０３８１ｘ－７．６８１式１
式１．６－ＦＡＭタグ付き鎖の生の断片分析ピーク位置の線形回帰。１００ｂｐ、９０ｂｐ、８０ｂｐ、および７０ｂｐのｓｓＤＮＡ対照内の６－ＦＡＭタグ付きオリゴの、実験的に決定された値（表１、それぞれオリゴｅ、ｄ、ｃ、ｂ）を使用して、実際のオリゴヌクレオチド長（ｘ）を、６－ＦＡＭ基質の断片分析の読み取り値（ｙ）に関連付けるモデルを生成した（図９Ａ）。
ｙ＝０．９６６６ｘ＋５．０３９式２
式２．ATTO-550タグ付き鎖の生の断片分析ピーク位置の線形回帰。１００ｂｐ、９０ｂｐ、８０ｂｐ、および７０ｂｐのｓｓＤＮＡ対照内のATTO-550タグ付きオリゴの、実験的に決定された値（表１、それぞれオリゴｉ、ｈ、ｇ、ｆ）を使用して、実際のオリゴヌクレオチド長（ｘ）を、ATTO-550基質の断片分析の読み取り値（ｙ）に関連付けるモデルを生成した（図９Ｂ）。

臨床検体。すべての患者は、研究目的での血液および／または腫瘍組織の収集および遺伝子データの分析を許可する書面によるインフォームドコンセントを提出した。健康なドナーの血液試料はResearch Blood ComponentsまたはBoston Biosciencesに注文した。転移性乳がん患者は、ＩＲＢ承認の組織分析およびバンキングコホート（Dana-Farber Cancer Institute［DFCI］protocol identifier 05-055）への登録のために、将来を見越して特定した。血漿は、ＥＤＴＡチューブ内の１０～２０ｃｃの全血から採取した。

ｃｆＤＮＡまたはｇＤＮＡ上の鎖再合成のPacBioシーケンサーによる定量化：PacBioのワークフローに従って、多重化ライブラリーをSMRTbell Express鋳型キット２．０（Pacific Biosciences）を用いて調製したが、ただし次の改変を加えた：１）「ＳＳオーバーハングの除去」および「ＤＮＡ損傷修復」ステップはスキップした；２）ＥＲ／ＡＴをKapa Hyper Prepキットまたは二重鎖修復を用いて実施した；３）カスタム緩衝液（５×）を調製した：これは、２５０ｍＭのTris、２ｍＭのｄ^６ｍＡＴＰ、２ｍＭのｄ^４ｍＣＴＰ、２ｍＭのｄＧＴＰ、２ｍＭのｄＴＴＰ、５０ｍＭのＭｇＣｌ_２、５０ｍＭのＤＴＴ、および５ｍＭのＡＴＰ（ｐＨ７．５）からなり、これを用いて、ＥＲ／ＡＴをｄ^６ｍＡＴＰ（Ｎ６－メチル－２’－デオキシアデノシン－５’－三リン酸）、ｄ^４ｍＣＴＰ（Ｎ４－メチル－２’－デオキシシチジン－５’－三リン酸）、ｄＧＴＰ、およびｄＴＴＰ（すべてTriLink Biotechnologies製）と共に実施した；４）１．８×Ampure PBビーズのクリーンアップをヌクレアーゼ処理後に実施した；５）「２回目のAmpure PBビーズ精製」ステップはスキップした。各ライブラリー構築への入力は、５０ｎｇの合成オリゴヌクレオチド、または２０～４０ｎｇのｃｆＤＮＡもしくはｇＤＮＡであった。調製したままの状態のPacBioライブラリーを、試料あたり少なくとも６５，０００のリード数を目標としてSequel IIで配列決定した。

ＣｕＣｌ_２／Ｈ_２Ｏ_２およびＤＮａｓｅＩによるＤＮＡ損傷の誘導：ＤＮＡ損傷を誘導するための条件を、ＣｕＣｌ_２／Ｈ_２Ｏ_２およびＤＮａｓｅＩによって最適化した（図１０Ａ～１０Ｂ、図１１、図１２、表２）。次に２０ｎｇのｃｆＤＮＡを、１×ＤＮａｓｅ１緩衝液中の０、０．２、または２ｍＵのＤＮａｓｅ１（カタログ番号M0303S、NEB）および０、１、または１００μＭのＣｕＣｌ_２／Ｈ_２Ｏ_２（総反応量＝２０μＬ）で１６℃で１時間処理した。次いで４０ｍＭのＥＤＴＡを添加して反応をクエンチし、得られた生成物を、２×Ampureビーズクリーンアップを行って精製した。
表２：ＤＮａｓｅ１処理後のＤＮＡ損失の定量化。入力は２０ｎｇの１００ｂｐのｄｓＤＮＡオリゴであった。^＊低い収率はAmpureビーズのクリーンアップステップの間に大幅な損失が発生したことを示す；^＊＊２番目の生物学的複製の濃度は、Qubitアッセイの検出限界未満である。

ｃｆＤＮＡ試料およびｇＤＮＡ試料の処理：ｃｆＤＮＡは、健康なドナーまたはがん患者の新鮮または保存血漿から以前と同じ方法に従って抽出した^{２４、２７}。ｇＤＮＡは、ＦＦＰＥ腫瘍組織またはバフィーコートから抽出し、以前に記載されているのと同じプロトコルに従って剪断および定量化した^{２４、２７}。次にｃｆＤＮＡまたはｇＤＮＡライブラリーを１０～２０ｎｇのＤＮＡ入力から、Kapa Hyper Prepキットまたはカスタムデュアルインデックス二重鎖ＵＭＩアダプター（ＩＤＴ）を備えた二重鎖修復を用いて構築した。ＩＤＴの汎がんパネルを使用したハイブリッド選択（ＨＳ）は、調製されたライブラリーに対して、xGenユニバーサルブロッカー（ＩＤＴ）を有するxGenハイブリダイゼーションおよび洗浄キットを用いて実施した。ＨＳの２回目のラウンドの後、ライブラリーを増幅、定量化し、HiSeq2500ラピッドラン（１００ｂｐペアエンドラン）またはHiSeqX（１５１ｂｐペアエンドラン）での配列決定のために、部位あたり２００，０００×の標的生深度（targeted raw depth）でプールした。

二重鎖配列決定データの分析およびエラー率の定量化：次いで、生のリードを前述のように二重鎖コンセンサス呼び出しパイプラインを通じて処理した^２４。エラー率は、二重鎖配列決定用に特に調整されたフィルターを適用した後、総塩基に対する非参照塩基の割合を計数することにより算出した^２４。がん患者の真の体細胞バリアントを塩基エラーとして誤って数えることを避けるため、体細胞変異のあるいかなる遺伝子座も、その患者の腫瘍生検の全エクソーム配列決定から除外した。バフィーコートＤＮＡに由来するマッチした正常値も、任意の生殖系列変異をフィルタリングするために使用した。塩基エラー位置の分析では、エラーメトリクス（metrics）収集パイプラインを断片フィルターの終端を無効にして再実行し、ＤＮＡ二重鎖全体にわたるエラーを観察した。

一分子リアルタイム（ＳＭＲＴ）配列決定データからの再合成の推定：初めに、Circular Consensus Sequences（ＣＣＳ）ツール（Pacific Biosciences）を使用して、生のリードからコンセンサスリードを生成した。平均動力学（mean-kinetics）フラグは、改変されたｄＮＴＰを識別するために後で使用される各塩基位置について、他のメトリクスのうちでもinterpulse duration（ＩＰＤ）を出力するためにも使用した。次に、limaツール（Pacific Biosciences）を使用して、同じフローセル上で一緒に配列決定された試料を逆多重化した。次いでこれらのＣＣＳリードを、鎖再合成を推定するための隠れマルコフモデル（ＨＭＭ）への入力として使用した。

次いでＨＭＭを実施して、各二重鎖の３’末端上の再合成量をＳＭＲＴ配列決定データから推定した。ＨＭＭは、元の塩基を有する領域（Ｏ）とＥＲ／ＡＴ中に埋められた塩基を有する領域（Ｆ）をそれぞれ表す、２つの状態で構成される。ＨＭＭは、鎖内の内部位置から始まり３’末端まで続く再合成を推定するように設計された。さらに、ＦからＯへの遷移を許可しない遷移マトリックスを設計した。ＯからＦへの遷移確率ｘは鎖の長さの逆数に等しく、ＯからＯへの遷移確率ｙは１－ｘに等しい。経験的な発光マトリックスの開発のために、合成二重鎖を既知の再合成領域と元の塩基を用いて配列決定した（表１）。PacBioのＳＭＲＴ配列決定は、各位置の塩基およびinterpulse duration（ＩＰＤ）の両方を放出し、次いでこれを収集して、各状態の各塩基のＩＰＤ分布の放出行列を形成する（図１３Ａ～１３Ｃ）。このＨＭＭを使用し、ビタビ（Viterbi）アルゴリズムを各二重鎖ＤＮＡ鎖に適用して、元の塩基と再合成された塩基の最も可能性の高い領域を決定し、再合成された塩基の総数を計算した。

再合成された内部塩基対のフラクションを推定するために、ＨＭＭから推定された再合成の領域を取得し、二重鎖断片のいずれかの末端から１２塩基対を超える再合成塩基対の数を、いずれかの断片末端から１２塩基対を超える塩基対の総数と比較して、算出した。すべての分析について、標準の非改変ｄＮＴＰを用いて対照試料も実行し、バックグラウンド再合成推定値を測定し、そのバックグラウンドを改変ｄＮＴＰを用いた試料から差し引きいた。

新しいＥＲ／ＡＴアプローチとしての二重鎖修復
従来のＥＲ／ＡＴ方法が、増幅可能な病変を含む、ニック、ギャップ、またはオーバーハングを有するＤＮＡ二重鎖の実質的領域を再合成できるかどうかを決定するために、二重鎖オリゴヌクレオチドであって以下を有するもの：（ｉ）５’オーバーハング、（ｉｉ）３’オーバーハング、（ｉｉｉ）ニック、（ｉｖ～ｖ）塩基損傷のない様々な長さのギャップ、または（ｖｉ～ｖｉｉ）塩基損傷のあるギャップ（図７Ｂ、表１）を生成した。トップ鎖およびボトム鎖を異なる色素で標識し、キャピラリー電気泳動を使用してＥＲ／ＡＴ中の断片長の変化を定量化できるようにした（図７Ａ～７Ｂ）。

ライブラリー変換効率を定量化するために、隣接するアダプター領域を標的とするｄｄＰＣＲアッセイを設計した。二重ライゲーションが成功した断片のみがQX200 ddPCR EvaGreen Supermix（Bio-Rad）内で指数関数的に増幅されて、検出された。

従来のＥＲ／ＡＴ方法を適用したところ、実質的な鎖再合成が、３’オーバーハングを有する基質を除くすべての基質で観察された（図７Ｂ、図１４）。例えば、トップ鎖の中央に１つだけのニックがある場合でも、ニック部位の下流の３０塩基は完全に再合成される。これらの結果は、従来のＥＲ／ＡＴ方法が、ニック、ギャップ、またはオーバーハングが存在する場合でも各二重鎖の大部分を再合成できることを確認する。

この問題に対処するために、二重鎖修復と呼ばれる新しいアプローチが考案され、これは慎重かつ段階的な様式でＥＲ／ＡＴを実施して、鎖再合成を制限する（図７Ａ）。二重鎖修復は、エラーをin silicoでトリミングできる断片末端（例：最後の１２ｂｐ）に再合成を「集中」させるように設計された^２４。二重鎖修復は４つのステップで構成される：（１）損傷塩基の切除およびオーバーハングの除去、（２）平滑化および制限された埋め込み、（３）ニックシーリング、および（４）制限されたｄＡテーリング。ステップ１では、ＤＮＡを、塩基切除修復（ＢＥＲ）に関与する酵素、例えばエンドヌクレアーゼＩＶ（ＥｎｄｏＩＶ）、ホルムアミドピリミジン［ｆａｐｙ］－ＤＮＡグリコシラーゼ（Ｆｐｇ）、ウラシル－ＤＮＡグリコシラーゼ（ＵＤＧ）、Ｔ４ピリミジンＤＮＡグリコシラーゼ（Ｔ４ＰＤＧ）、およびエンドヌクレアーゼＶＩＩＩ（ＥｎｄｏＶＩＩＩ）、からなる酵素カクテルで処理する。これらの酵素は、ウラシル、８’オキソＧ、酸化ピリミジン、シクロブタンピリミジン二量体などの損傷塩基を切除し、脱塩基部位を切断し、二本鎖領域に１ｎｔのギャップまたは一本鎖領域に鎖破断を生じる。エキソヌクレアーゼＶＩＩ（ＥｘｏＶＩＩ）もこのステップで使用されて、３’および５’の一本鎖オーバーハングを分解する。次に、ステップ２では、Ｔ４ポリヌクレオチドキナーゼがＤＮＡ末端を（脱）リン酸化し、一方、Ｔ４ＤＮＡポリメラーゼは３’オーバーハングを平滑化し、ＥｘｏＶＩＩ消化後に残る小さなギャップと短い（７ｎｔ以下）５’オーバーハングを埋める。その後、ステップ３でニックがＨｉＦｉＴａｑＤＮＡリガーゼによってシールされる。ステップ４では、制限ｄＡテーリングを、クレノウ断片（ｅｘｏ－）とＴａｑＤＮＡポリメラーゼを使用して、ただしｄＡＴＰのみの存在下で実施し、それらの活性を非鋳型化された伸長に制限する。

前述の合成二重鎖を使用して、二重鎖修復が最小限の再合成でＥＲ／ＡＴを促進することが確認された。まず、各ステップを理想的な緩衝液条件で各ステップ後に３×Ampureビーズクリーンアップを実施することにより試験し、主要生成物を示した（図７Ｂおよび図１４）。各基質について、重要な酵素の活性が関与していることが確認され、一方で存在する他の酵素がそれらの活性を損なわないことが確認された。例えば基質（ｉ）の場合、長い５’オーバーハングはＥｘｏＶＩＩによって大部分が消化され（図１５）、残りの３塩基はＴ４ＤＮＡポリメラーゼによって埋められる（図１４）。基質（ｉｉ）の場合、３’オーバーハングはＥｘｏＶＩＩによって部分的に消化され（図１５）、次いでＴ４ＤＮＡポリメラーゼによって完全に平滑化される（図１４）。基質（ｉｉｉ）の場合、ニックはＨｉＦｉＴａｑＤＮＡリガーゼによってシールされる（図１６）。基質（ｉｖ～ｖ）の場合、ギャップは最初にＴ４ＤＮＡポリメラーゼによって埋められ（図１４および図１６）、その後、生じた「ニック」がＨｉＦｉＴａｑＤＮＡリガーゼによってシールされる。基質（ｖｉ～ｖｉｉ）の場合、損傷塩基が切除され（ウラシルはＵＤＧにより、８’オキソＧはＦｐｇによる；図１７および図１３Ａ～１３Ｃ）、および脱塩基部位が切断されて鎖破断が生じ、したがってステップ２のギャップ充填中の損傷乗り越え合成が回避される。ｄＡテーリングは、ｄＡＴＰが存在する場合にのみ機能することも確認された（図１８～２０）。反応条件が最適化され、ステップ間の複数のAmpureクリーンアップが排除されて、ＤＮＡ損失の低減を支援した（図２１～２２）。これらの結果は、二重鎖修復が、従来のＥＲ／ＡＴと同等のライブラリー変換効率を達成しながら鎖再合成を制限する様式で、ＥＲ／ＡＴを行うことを示唆する（図１０Ａ～１０Ｂ）。

二重鎖修復は臨床検体からのＤＮＡ二重鎖の再合成を制限する
次に、ＥＲ／ＡＴを無細胞ＤＮＡ（ｃｆＤＮＡ）およびホルマリン固定パラフィン包埋（ＦＦＰＥ）腫瘍生検などの臨床試料に適用した場合の、鎖再合成を定量化した。以下を含むアッセイを考案した：ＥＲ／ＡＴを、ｄ^６ｍＡＴＰ、ｄ^４ｍＣＴＰ、ｄＴＴＰ、およびｄＧＴＰを含む改変ｄＮＴＰミックスを使用して実施すること、調製したライブラリーを、ｄ^６ｍＡＴＰおよびｄ^４ｍＣＴＰが組み込まれた場所を検出できるPacBioシーケンサーで配列決定すること^２８、および隠れマルコフモデルを適用して再合成された領域を特定すること（図２３Ａおよび図１１；方法）。その性能は、従来のＥＲ／ＡＴで処理した合成オリゴヌクレオチド（表１）を用いて検証した。予想される領域におけるｄ^６ｍＡＴＰおよびｄ^４ｍＣＴＰの取り込みに対応して、延長されたinterpulse duration（ＩＰＤ）が観察された（図１２、列ｉ）。ほとんどの場合に予想される再合成塩基の推定数も判明した（図１２、列ｉｉ）。興味深いことに、ニックまたはギャップのある基質では、８０ｂｐ５’オーバーハングを有する基質と同じ末端３’ＯＨを有するにもかかわらず、予想よりも長い埋め込みを持つ分子がいくつか見つかった。これは、ポリメラーゼの３’エキソヌクレアーゼ活性によるものである可能性があり、隣接する下流鎖に遭遇した場合に顕著になり得ると考えられる。

次に、上記の再合成定量法を使用して、二重鎖修復と従来のＥＲ／ＡＴとの間の再合成塩基対の差の推定を、それぞれ１００μＭのＣｕＣｌ_２／Ｈ_２Ｏ_２および２ｍＵのＤＮａｓｅ１によって誘導された塩基および主鎖損傷を有する健康なドナーｃｆＤＮＡ試料で試験することにより実施した（「方法」を参照）。二重鎖修復のいくつかのバリエーションも、再合成の制限に対する各ステップの影響を評価するために試験した。この方法を適用して、次のことが推定された：内部（interior）二重鎖塩基対（元の二重鎖ＤＮＡ断片のいずれかの末端から１２塩基対を超える塩基対として定義）の５４％が従来のＥＲ／ＡＴでは再合成されたのに対し、二重鎖修復では３％が再合成された（図２３Ｂ）。注目すべきことに、試験した二重鎖修復プロトコルの各ステップは、内部塩基対再合成の量をさらに低減するのに役立っていた。特に、ステップ１でのＢＥＲのスキップは再合成にほとんど影響を及ぼさないことが観察されたが、一方ステップ１をスキップすると内部再合成フラクションが３％から９％に増加し、これは、５’オーバーハングでの再合成を抑制するにはＥｘｏＶＩＩ処理が必要であることを示唆する。さらに、ステップ２をスキップすると、内部再合成フラクションが９％から１１％にわずかに増加するだけであり、制限された埋め込みの間には再合成が制限されることが確認された。さらに、ステップ３をスキップすると内部再合成フラクションが１１％から３５％に増加し、これは、シールされていないニックがｄＡテーリング中に有意な再合成を引き起こしたことを示唆する。さらに、ステップ４でｄＡＴＰ単独の代わりにｄＮＴＰミックスを使用すると、再合成フラクションが３５％から４７％に増加し、ｄＡテーリング中の鋳型伸長を抑制するには、ｄＡＴＰを単独で使用することが不可欠であることを示唆する。全体として、これらの結果は、再合成を最小限に抑えるためには、二重鎖修復の完全なプロトコルが必要であることを示唆する。

二重鎖修復が臨床試料における再合成をどの程度制限できるかを評価するために、このアッセイを使用して、健康なドナーのｃｆＤＮＡ、がん患者のｃｆＤＮＡ、および腫瘍ＦＦＰＥ生検を含むいくつかの異なる試料タイプにわたる再合成を測定した。ｄ^６ｍＡＴＰとｄ^４ｍＣＴＰが臨床試料中に実際のエピジェネティック改変として存在する可能性があることを考慮して^２９、各患者に対して、すべての標準ｄＮＴＰと従来のＥＲ／ＡＴを使用して対照試料も実行し、任意のバックグラウンドノイズを制御した。平均ＩＰＤを、各ＣＣＳ鎖の鎖位置にわたり、元のＤＮＡ鎖の３’末端からの距離に対して調べた（図２３Ｃ）。すべての試料タイプについて、対照試料のすべての位置で一貫して低い平均ＩＰＤが観察された。対照的に平均ＩＰＤは、従来のＥＲ／ＡＴおよび二重鎖修復の両方について、ＣＣＳ鎖の３’末端に向かって有意に増加した（図２３Ｃ）。さらに、二重鎖修復では高いＩＰＤは３’末端から１２塩基対以内に集中しているが、従来のＥＲ／ＡＴでは鎖のさらに奥まで伸びている。次に、本明細書に記載の再合成定量法を使用して、臨床試料における内部二重鎖塩基対の再合成の量を推定した。再合成された内部塩基対のフラクション（対照試料からのバックグラウンドノイズを差し引いた後；図２４）は、従来のＥＲ／ＡＴの方が、二重鎖修復より、すべての試料タイプにわたってはるかに高い（図２３Ｄ）。特に、従来のＥＲ／ＡＴでは、内部二重鎖塩基対の修復の発生が、健康なｃｆＤＮＡ、がん患者のｃｆＤＮＡ、ＦＦＰＥ腫瘍ｇＤＮＡ試料でそれぞれ平均して８％（範囲７～９％）、１６％（範囲１５～１７％）、および４１％（範囲３２～５７％）であったが、二重鎖修復を使用した場合にこれらは０．１２％（範囲０．００～０．１７％）、０．０３４５％（範囲０．０３～０．０４％）、および５％（範囲０．５～１０％）に減少し、したがって内部塩基対の再合成の６７倍、４６４倍、および８倍の減少に相当することが観察された。これらの結果は、従来のＥＲ／ＡＴが、ｃｆＤＮＡおよびＦＦＰＥ腫瘍生検などの臨床試料で実質的な鎖再合成を誘導し、二重鎖修復がこれを大幅に制限できることを示唆する。

二重鎖修復は誘導されたＤＮＡ損傷を克服し二重鎖配列決定を強化する
ＥＲ／ＡＴにおける鎖再合成は増幅可能な病変または変化が存在する場合に最も問題であるとの推論から、１人の健康なドナー（ＨＤ＿７８）からのｃｆＤＮＡを異なる濃度の酸化剤ＣｕＣｌ_２／Ｈ_２Ｏ_２およびＤＮａｓｅＩに曝露して、ＤＮＡをほとんど分解することなく、塩基および主鎖の損傷を誘導した（図２５～２７、表２）。次いで、従来のＥＲ／ＡＴを適用し、二重鎖配列決定を実施し、各二重鎖の末端から最後の１２ｂｐをトリミングした後に、エラー率を計算した^２４（図２８Ａ、図２９、表４）。
表４：ターゲットパネル配列決定によってプロファイリングされたすべての試料の配列決定メトリクス。
ＣｕＣｌ_２／Ｈ_２Ｏ_２の各濃度において、エラー率はＤＮａｓｅＩの量が増加するにつれて増加する一方、両方の最高濃度では、未処理のｃｆＤＮＡよりも３．６倍高いエラー率（Ｃ．Ｉ．２．８～４．５）が得られることが見出された。予想通り、エラーの最大の増加が観察され、これは、ＣｕＣｌ_２／Ｈ_２Ｏ_２曝露の予想されるＣ→Ａ変異シグネチャーと一致した（１３．９倍、図２９）^３０。これらの結果は、従来のＥＲ／ＡＴでは、配列決定の精度が試料内のＤＮＡ損傷の程度に依存することを示唆する。

誘導された損傷の影響が回復可能かどうかを決定するために、最も重度に損傷した試料に二重鎖修復を適用し、それらを同じ遺伝子パネルで配列決定した。エラー率の、１．２ｅ^－６から３．７ｅ^－７への有意な減少が観察され、これは従来のＥＲ／ＡＴで処理したネイティブｃｆＤＮＡ試料と同様であった（３．２ｅ^－７、図２８Ａ）。実際、誘導されたＣ→Ａエラーの影響はほぼ完全に「救済」されたが（図２９）、他のコンテキストについてはエラー率にほとんど変化はなかった（図２９）。次いで、二重鎖修復をネイティブ（すなわち、損傷していない）ｃｆＤＮＡに適用し、試験したすべての条件の中で最も低いエラー率を見出した（１．０ｅ^－７、図２８Ａ、図２９）。これらの結果は、二重鎖修復が誘導されたＤＮＡ損傷の影響を回復できることを示唆する。

次に、臨床試料の二重鎖配列決定に使用した場合に、二重鎖修復が従来のＥＲ／ＡＴよりも高い精度を提供できるかどうかを決定することが求められた。Ａ１２７遺伝子「汎がん」パネルを３つの試料タイプにわたって適用した（図２８Ｂ）。すべての試料において、二重鎖修復を適用した場合のエラー率が従来のＥＲ／ＡＴと比較して低いことが観察された。特に、エラー率の中央値は、健全なｃｆＤＮＡでは５．８ｅ^－７（範囲３．２ｅ^－７～８．１ｅ^－７）から３．０ｅ^－７（範囲９．２ｅ^－８～３．８ｅ^－７）に、がんｃｆＤＮＡでは１．４ｅ^－６（範囲１．４ｅ^－６～３．８ｅ^－６）から４．３ｅ^－７（範囲３．６ｅ^－７～５．３ｅ^－７）に、およびＦＦＰＥ腫瘍生検では２．８ｅ^－５（範囲２．１ｅ^－５～１．１ｅ^－４）から１．０ｅ^－５（範囲５．２ｅ^－６～１．７ｅ^－５）に減少し、これはそれぞれ、エラー率における中央値の２．５倍（Ｃ．Ｉ．１．６～３．３）、４．０倍（Ｃ．Ｉ．３．４～４．５）、および４．０倍（Ｃ．Ｉ．３．１～４．９）の減少であり、Ｐ４８からのがん患者のｃｆＤＮＡは、エラー率において最大の８．９倍の減少を示した（図２８Ｂ）。さらに、二重鎖配列決定エラー率の最も顕著な減少は、次のコンテキストで生じた：Ｃ→Ｔ（健康なｃｆＤＮＡの場合は中央値３．６倍、Ｃ．Ｉ．２．５～４．１；がんのｃｆＤＮＡの場合は中央値５．７倍、Ｃ．Ｉ．５．３～５．８；ＦＦＰＥ生検の場合は中央値４．１倍、Ｃ．Ｉ．３．１～５．０）、Ｃ→Ａ（健康なｃｆＤＮＡの場合は中央値３．４倍、Ｃ．Ｉ．２．７～３．８；がんのｃｆＤＮＡの場合は中央値３．８倍、Ｃ．Ｉ．３．６～４．０；ＦＦＰＥ生検の場合は中央値１９．０倍、Ｃ．Ｉ．１８．７～１９．３）、Ｃ→Ｇ（健康なｃｆＤＮＡの場合は中央値１．９倍、Ｃ．Ｉ．１．２～２．５；がんのｃｆＤＮＡの場合は中央値１．５倍、Ｃ．Ｉ．１．０～１．９；ＦＦＰＥ生検の場合は中央値６．２倍、Ｃ．Ｉ．５．８～６．６；図３０、表３）。
表３：ターゲットパネル配列決定の変異コンテキスト別のエラー率および倍率変化。３つのがん患者ｃｆＤＮＡ試料と５つのＦＦＰＥ腫瘍生検について、変異コンテキスト別に分類された二重鎖配列決定エラー率。試料は、二重鎖修復および従来のＥＲ／ＡＴで処理した。

注目すべきことに、塩基エラーは断片の末端でより顕著に濃縮されており、二重鎖修復については、合計９，１２２の塩基エラーの３４％（評価された全塩基について正規化した後）がいずれかの二重鎖断片末端からの最初の塩基にあり、これに比べて従来のＥＲ／ＡＴでは、合計３１，１００の塩基エラーのわずか１５％がそうであることが観察された（図２８Ｃ、図１７）。全体として、従来のＥＲ／ＡＴの６８％とは対照的に、二重鎖修復では塩基エラーの７４％が断片の末端から１２ｂｐ以内に集中していると推定された。これらの塩基エラーは、二重鎖断片の末端から１２ｂｐ未満の領域をフィルタリングすることによりin silicoで除去できることは注目に値する。最後に、鎖再合成フラクションと観察されたエラー率との関係を、臨床試料全体で調べた。再合成された内部塩基対のフラクションと二重鎖配列決定のエラー率との間には、全体として強い相関関係が観察された（ピアソンのｒ＝０．８５９；図２８Ｄ）。これらの結果は、二重鎖修復がライブラリー構築中の再合成を制限することにより、臨床試料の二重鎖配列決定において一貫してより高い精度を提供できることを立証する。

本明細書では、既存の「末端修復／ｄＡテーリング」（ＥＲ／ＡＴ）方法は、特に内部ニック、ギャップ、または長い５’オーバーハングがある場合に、各ＤＮＡ二重鎖の大部分を再合成可能であることが示される。これは、両方の鎖からのリードのコンセンサスを必要とする二重鎖配列決定等の技法にとって大きな問題である。ここで紹介するのは、ＥＲ／ＡＴを慎重かつ段階的に実施する二重鎖修復と呼ばれる解決策である。これは、ｃｆＤＮＡおよびＦＦＰＥ腫瘍生検などの検体の、がん遺伝子パネルの二重鎖配列決定において、再合成を８～４６４倍に制限し、誘導されたＤＮＡ損傷の影響を回復し、最大８．９倍高い精度をもたらすことが示されている。二重鎖配列決定の生物医学研究および診断検査における広範な使用を考慮すると、これらの発見は、腫瘍学、感染症、免疫学、出生前医学、法医学、遺伝子工学などの多くの分野に広範な影響を与える可能性がある。

この例は、ＥＲ／ＡＴにおけるこの主要なアキレス腱を特徴付け、ＤＮＡ損傷にもかかわらず高精度のＤＮＡ配列決定を回復するための解決策を提供した。短い５’オーバーハングの埋め込みのために、二重鎖配列データにおいて偽変異が断片末端に蓄積することが認識されているが、偽変異が各ＤＮＡ二重鎖の内部に、ＥＲ／ＡＴの結果としてどの程度現れる可能性があるかは、まだ確立されていない。本明細書に記載の一分子配列決定アッセイは、ＥＲ／ＡＴおよびＤＮＡ修復のメカニズムに対する新たな洞察を提供した。実際、驚いたことには、健康なｃｆＤＮＡ、がん患者のｃｆＤＮＡ、およびＦＦＰＥ腫瘍生検において、各二重鎖の末端から１２ｂｐを超える塩基対のそれぞれ７～９％、１５～１７％、および３２～５７％が、従来のＥＲ／ＡＴ方法を適用すると再合成され得ることが見出された。さらに、様々な塩基および主鎖の損傷の誘導は、従来のＥＲ／ＡＴ方法を適用した場合にいかにしてこの２つが一緒にエラーの「完璧な嵐」を生み出すのかを示した。鎖再合成とエラー率の両方がＤＮａｓｅＩ濃度と共に増加するという、本明細書で示された観察は、液体生検などの診断検査の信頼性が、個人の血流中のヌクレアーゼ活性によって影響を受け得ることを示唆する。臨床検体の品質には大きなばらつきがあることを考えると、これらの発見はこの分野にとって重要な意味を有する。

本明細書に示すように、ＥＲ／ＡＴ方法は「鉛筆と消しゴム」のように機能し、ホスホジエステル主鎖の不連続部の下流の核酸塩基を書き換え、元々１本の鎖に限定されていた病変または変化の誤検出を促進する。一方、二重鎖修復の解決策は、二重鎖ＤＮＡの配列完全性を保存し、かつＤＮＡの遺伝情報の二重性を利用する方法の信頼性を向上させる、最初の既知のアプローチの１つを提供する。
例２における参考文献
以下の各参考文献は、その全体が本明細書に組み込まれる。

例３：二重鎖修復は各ＤＮＡ二重鎖の「元の」核酸塩基組成を最大化する
図１３Ａ～１３Ｃおよび図３１Ａ～３１Ｄに関連して、次の結論が得られる：

最初に、従来のＥＲ／ＡＴ方法は、ニック、ギャップ、および長いオーバーハングが存在する各二重鎖を実質的に再合成できることが確認されている（図１３Ａ）。

ｃｆＤＮＡおよびＦＦＰＥ腫瘍生検中の塩基対の７～５２％より多くが、再合成され得ることが発見された（図１３Ｂ）。

二重鎖修復（例：図１および本明細書に記載）を用いると、再合成が５．５～７．５倍少ないことが確認されている（図１３Ｃ）。

二重鎖修復は、誘導されたＤＮＡ損傷の影響を軽減し（図３１Ａ～３１Ｂ）、二重鎖配列決定にさらに高い精度を付与する（図３１Ｃ～３１Ｄ）ことが見出された。

例４：二重鎖修復の追加の方法
上記実施例に記載の二重鎖修復は、依然として、ＥｘｏＶＩＩ処理後に残るギャップおよび短いオーバーハングの埋め込みの制限を必要とし（図３２Ａ～３２Ｂ）、これにより、両方の鎖にコピーされる塩基損傷エラーが理論的に「ゼロではない」可能性が残される（図３２Ｃ～３２Ｆ）。したがって目的は、次世代の二重鎖修復、例えば「ｖ２」を創出することであり、これは、鎖再合成の必要性を完全に排除し、したがって理論的には両方の鎖へのエラー伝播の可能性を「ゼロ」にし、一方で高い分子回収率を保有するものである。これを達成するための提案を図３３Ａに詳しく示す；これはヌクレアーゼＳ１の使用を伴い、ヌクレアーゼＳ１とは、二重鎖ＤＮＡ中の一本鎖ギャップ領域およびオーバーハングを切断し、二本鎖領域を無傷のままにしつつ、完全に平滑化された二重鎖を生成することが実証された、一本鎖エンドヌクレアーゼである。この機能により、二重鎖修復ｖ２は、損傷塩基の切除、ＥｘｏＶＩＩでの処理、またはＥｘｏＶＩＩ処理後に残ったギャップおよび短い５’オーバーハングを埋める必要性を排除することで、以前のバージョンよりも改善されている。

二重鎖修復ｖ２は、３つのステップからなる：（１）リン酸化およびニックシーリング；（２）オーバーハングおよびギャップの除去；および（３）制限されたｄＡテーリング：図３３Ａ。ステップ１では、Ｔ４ポリヌクレオチドキナーゼおよびＨｉＦｉＴａｑリガーゼを使用して、ＤＮＡが５’リン酸部分と３’ヒドロキシル部分を有し、ニックがシールされていることをそれぞれ確認する。ステップ２では、ヌクレアーゼＳ１が５’および３’オーバーハングを除去すると同時に、長さ１ヌクレオチド程度の小さいギャップ領域を可溶性ｄＮＭＰ（例：デオキシヌクレオシド一リン酸）中に消化し、これらのモチーフの以前の末端で平滑化二重鎖を生成する。注目すべき点は、ヌクレアーゼＳ１消化後に５’リン酸部分と３’ヒドロキシル部分が残されることである。ステップ３では、制限されたｄＡテーリングのために、以前の二重鎖修復方法で利用されていたようにクレノウ断片（ｅｘｏ－）およびＴａｑＤＮＡポリメラーゼにｄＡＴＰのみを補充する（すなわち、ｄＣＴＰ、ｄＧＴＰ、および／またはｄＴＴＰは提供されない）。これにより、３’デオキシアデノシンテールのみが付加できることが保証される。

キャピラリー電気泳動（図３３Ｂ）、ｄｄＰＣＲ（図３３Ｃ）、一分子配列決定（図３２Ａ）、および二重鎖配列決定（図３２Ｃ）アッセイを使用して、二重鎖修復ｖ２、その分子回収率、再合成された塩基の数、および二重鎖配列決定エラー率を、それぞれ市販のＥＲ／ＡＴキットと比較して特徴付ける。各ステップは、キャピラリー電気泳動（ＣＥ）による評価のために、ニック、ギャップ、およびオーバーハングを有する蛍光標識された合成オリゴヌクレオチドを使用して独自に試験され、最初にＣＥトレースから酵素活性および変換効率を定性的に評価する（図３３Ｂ）。意図した性能が確認された後、二重鎖修復ｖ２は可能な限り少ないステップの方法として緩衝液交換を排除し、緩衝液組成と実験条件（例：時間、温度、濃度、および代替酵素）を最適化して、分子回収率を最大化することを目指して定式化される。次に、生殖系列配列が決定されている健康なドナーからのバフィーコート由来のゲノムＤＮＡの様々な入力（例：＜１～１０００ｎｇ）を試験し、様々な方法（例：超音波処理、酵素消化）で異なる挿入サイズの中央値（例：５０～２５０ｂｐ）に剪断する。次に二重鎖修復ｖ２の、再合成された塩基の数、二重鎖配列決定エラー率、および分子回収率を、KAPA（商標）Hyper PrepおよびNEB（商標）Ultra IIキットを使用し、市販のＥＲ／ＡＴと比較して特徴付ける。様々な程度の塩基および主鎖損傷を受けたＤＮＡ（図３２Ｅ）およびホルマリン固定腫瘍生検（図３２Ｂ～３２Ｃ）などの困難な試料も、試料取り扱い条件、例えば、様々な凍結融解サイクル、緩衝液組成、および室温での保管延長の影響を調査するために、試験されるであろう。二重鎖修復ｖ２は、二重鎖修復の性能をさらに改善し、ＦＦＰＥ腫瘍生検を含むほとんどの試料について再合成される塩基の数をゼロに減らし（図３２Ｂ）、したがって二重鎖配列決定精度を最大化する（図３２Ｃ）。これにより、二重鎖配列決定方法で現在必要とされている、各断片の最後の１２ｂｐをトリミングする必要性も制限され、データ出力が向上する可能性がある。将来のＤＮＡ断片化戦略では、例えばオーバーハングの長さを制限するか、または、二本鎖破断箇所でのタグメンテーションまたはライゲーションを介してアダプターを直接付加することができれば、ＥＲ／ＡＴの必要性が制限される可能性がある。ただし、ｃｆＤＮＡなどの自然に断片化された試料タイプでは、常にＥＲ／ＡＴが必要になるであろう。

配列
本開示は、本開示の方法で使用され得る多くの異なる酵素に言及する。かかる酵素は当技術分野で周知であり、New England BioLabs、AMSBIO、およびSigma-Aldrichなどの商業的供給源を含む、任意の適切な供給源から入手することができる。当業者であれば、本明細書に開示される酵素の名前に基づき本明細書に開示される酵素のアイデンティティ、および過度の実験なしで前記酵素を入手する方法を理解するであろう。いかなる意味においても本開示を限定することを意図するものではないが、以下は、本開示の方法において使用され得る酵素アミノ酸配列の例である。本開示は、以下のアミノ酸配列、または本明細書に開示されるアミノ酸配列のいずれかと少なくとも７５％、または少なくとも８０％、または少なくとも８５％、または少なくとも９０％、または少なくとも９５％、または９９％、または最大１００％の配列同一性を有するアミノ酸配列の使用を企図する。
参考文献
以下の各参考文献は、その全体が本明細書に組み込まれる。
追加の態様

態様１．ヌクレオチド損傷または塩基対不一致の増幅による偽変異の伝播を最小限に抑える、配列決定用の核酸試料（試料）を調製する方法であって、ここで試料の少なくとも一部は二本鎖であり、試料を反応容器に添加すること、および：
（ａ）試料を、以下が可能な１つ以上の酵素と接触させること：
（ｉ）１つ以上の損傷塩基を、試料から切除すること；
（ｉｉ）１つ以上の脱塩基部位を切断すること、および得られた末端を、ＤＮＡポリメラーゼによる伸長および／またはＤＮＡリガーゼによるライゲーションに適合するように処理すること；
（ｉｉｉ）５’オーバーハングを消化すること；
（ｂ）試料を、以下の１つ以上と接触させること：
（ｉ）鎖置換および５’エキソヌクレアーゼ活性の両方を欠くが、試料の一本鎖セグメントを埋め、かつ試料の３’オーバーハングを消化することができる、ＤＮＡ依存性ＤＮＡポリメラーゼ；
（ｉｉ）試料の鎖の５’末端をリン酸化することができる酵素；および
（ｃ）試料を、ニックをシーリング可能なＤＮＡリガーゼと接触させること、
を含む、前記方法。

態様２．以下をさらに含む、態様１に記載の方法：
（ｄ）アダプターライゲーション用の試料を調製するステップ、ここで該調製は、以下を含む：
（ｉ）デオキシアデノシン一リン酸（ｄＡＭＰ）を、試料の鎖の３’末端に付加すること（ｄＡテーリング）；または
（ｉｉ）任意に、試料の末端を平滑化すること。

態様３．ｄＡテーリングが、試料を、デオキシアデノシン一リン酸（ｄＡＭＰ）を試料の鎖の３’末端に組み込むことができる酵素と接触させること、および試料をｄＮＴＰと接触させること、を含む、態様２に記載の方法。

態様４．ステップ（ａ）～（ｃ）で使用される酵素および／またはｄＮＴＰが、ｄＡテーリングの前に反応容器から実質的に除去される、態様２または態様３に記載の方法。

態様５．試料と接触するｄＮＴＰが、ｄＡＴＰを実質的に含む、態様２または態様３～４のいずれか１つに記載の方法。

態様６．試料を、方法の任意の後続のステップに進む前に、ステップ（ａ）の１つ以上の酵素と接触させて少なくとも５分間インキュベートする、態様１または態様２～５のいずれか１つに記載の方法。

態様７．試料を、方法の任意の後続のステップに進む前に、ステップ（ａ）の１つ以上の酵素と接触させて少なくとも２５分間インキュベートする、態様１または態様２～６のいずれか１つに記載の方法。

態様８．試料を、方法の任意の後続のステップに進む前に、ステップ（ａ）の１つ以上の酵素と接触させて少なくとも３０分間インキュベートする、態様１または態様２～７のいずれか１つに記載の方法。

態様９．試料を、方法の任意の後続のステップに進む前に、ステップ（ｂ）の１つ以上の酵素と接触させて少なくとも５分間インキュベートする、態様１または態様２～８のいずれか１つに記載の方法。

態様１０．試料を、方法の任意の後続のステップに進む前に、ステップ（ｂ）の１つ以上の酵素と接触させて少なくとも２５分間インキュベートする、態様１または態様２～９のいずれか１つに記載の方法。

態様１１．方法の任意の後続のステップに進む前に、ステップ（ｂ）の１つ以上の酵素と接触させて少なくとも３０分間インキュベートする、態様１または態様２～１０のいずれか１つに記載の方法。

態様１２．試料を、方法の任意の後続のステップに進む前に、ステップ（ｃ）の１つ以上の酵素と接触させて少なくとも１５分間インキュベートする、態様１または態様２～１１のいずれか１つに記載の方法。

態様１３．試料を、方法の任意の後続のステップに進む前に、ステップ（ｃ）の１つ以上の酵素と接触させて少なくとも３０分間インキュベートする、態様１または態様２～１２のいずれか１つに記載の方法。

態様１４．試料を、方法の任意の後続のステップに進む前に、ステップ（ｃ）の１つ以上の酵素と接触させて少なくとも４５分間インキュベートする、態様１または態様２～１３のいずれか１つに記載の方法。

態様１５．試料を、方法の任意の後続のステップに進む前に、ステップ（ｄ）の１つ以上の酵素と接触させて少なくとも４０分間インキュベートする、態様２または態様３～１４のいずれか１つに記載の方法。

態様１６．試料を、方法の任意の後続のステップに進む前に、ステップ（ｄ）の１つ以上の酵素と接触させて少なくとも６０分間インキュベートする、態様２または態様３～１５のいずれか１つに記載の方法。

態様１７．試料を、方法の任意の後続のステップに進む前に、ステップ（ｄ）の１つ以上の酵素と接触させて少なくとも７０分間インキュベートする、態様２または態様３～１６のいずれか１つに記載の方法。

態様１８．ステップ（ａ）が、約３２℃～約４２℃の温度で実施される、態様１または態様２～１７のいずれか１つに記載の方法。

態様１９．ステップ（ａ）が、約３５℃～約３９℃の温度で実施される、態様１または態様２～１８のいずれか１つに記載の方法。

態様２０．ステップ（ｂ）が、約３２℃～約４２℃の温度で実施される、態様１または態様２～１９のいずれか１つに記載の方法。

態様２１．ステップ（ｂ）が、約３５℃～約３９℃の温度で実施される、態様１または態様２～２０のいずれか１つに記載の方法。

態様２２．ステップ（ｃ）が、約３０℃～約７０℃の温度で実施される、態様１または態様２～２１のいずれか１つに記載の方法。

態様２３．ステップ（ｃ）が、約３３℃～約６７℃の温度で実施される、態様１または態様２～２２のいずれか１つに記載の方法。

態様２４．ステップ（ｄ）が、約１８℃～約６９℃の温度で実施される、態様２または態様３～２３のいずれか１つに記載の方法。

態様２５．ステップ（ｄ）が、約２０℃～約６７℃の温度で実施される、態様２または態様３～２４のいずれか１つに記載の方法。

態様２６．ステップ（ａ）の前に、試料が：（ｉ）断片化される；または（ｉｉ）切断およびタグ付けされる（タグメントされる）、態様１または態様２～２５のいずれか１つに記載の方法。

態様２７．断片化が、（ａ）物理的断片化；（ｂ）酵素的断片化；および／または（ｃ）化学的断片化によるものである、態様２７に記載の方法。

態様２８．断片化が、物理的断片化による、態様２６または態様２７に記載の方法。

態様２９．断片化が、酵素的断片化による、態様２６または態様２７に記載の方法。

態様３０．断片化が、化学的断片化による、態様２６または態様２７に記載の方法。

態様３１．ステップ（ａ）が、試料を、以下からなる群から選択される１つ以上の酵素と接触させることを含む、態様１または態様２～３０のいずれか１つに記載の方法：（１）エンドヌクレアーゼＩＶ（ＥｎｄｏＩＶ）；（２）ホルムアミドピリミジン［ｆａｐｙ］－ＤＮＡグリコシラーゼ（Ｆｐｇ）；（３）ウラシル－ＤＮＡグリコシラーゼ（ＵＤＧ）；（４）Ｔ４ピリミジンＤＮＡグリコシラーゼ（Ｔ４ＰＤＧ）；および（５）エンドヌクレアーゼＶＩＩＩ（ＥｎｄｏＶＩＩＩ）；（６）エキソヌクレアーゼＶＩＩ（ＥｘｏＶＩＩ）。

態様３２．１つ以上の酵素の同時活性が、試料上の以下のＤＮＡ改変を触媒する、態様１または態様２～３１のいずれか１つに記載の方法：（１）損傷塩基の切除；および（２）脱塩基部位を切断すること、および得られた末端を、ＤＮＡポリメラーゼによる伸長および／またはＤＮＡリガーゼによるライゲーションに適合するように処理すること。

態様３３．損傷塩基が、ウラシル；８’オキソＧ；酸化ピリミジン；およびシクロブタンピリミジン二量体からなる群から選択される、態様１または態様２～３２のいずれか１つに記載の方法。

態様３４．試料の少なくとも１つの鎖の５’オーバーハングが、少なくとも１０核酸塩基長である、態様１または態様２～３３のいずれか１つに記載の方法。

態様３５．試料の少なくとも１つの鎖の５’オーバーハングが、少なくとも７５核酸塩基長である、態様１または態様２～３４のいずれか１つに記載の方法。

態様３６．試料の少なくとも１つの鎖の３’オーバーハングが、少なくとも１０核酸塩基長である、態様１または態様２～３５のいずれか１つに記載の方法。

態様３７．試料の少なくとも１つの鎖の３’オーバーハングが、少なくとも７５核酸塩基長である、態様１または態様２～３６のいずれか１つに記載の方法。

態様３８．１つ以上の酵素が、試料の少なくとも１つの鎖の５’オーバーハングを１６核酸塩基未満の長さに消化する、態様１または態様２～３７のいずれか１つに記載の方法。

態様３９．１つ以上の酵素が、試料の少なくとも１つの鎖の５’オーバーハングを８核酸塩基未満の長さに消化する、態様１または態様２～３８のいずれか１つに記載の方法。

態様４０．１つ以上の酵素が、試料の少なくとも１つの鎖の３’オーバーハングを１６核酸塩基未満の長さに消化する、態様１または態様２～３９のいずれか１つに記載の方法。

態様４１．１つ以上の酵素が、試料の少なくとも１つの鎖の３’オーバーハングを８核酸塩基未満の長さに消化する、態様１または態様２～４０のいずれか１つに記載の方法。

態様４２．エンドヌクレアーゼＩＶ（ＥｎｄｏＩＶ）が、脱塩基部位を切断する、態様１または態様２～４１のいずれか１つに記載の方法。

態様４３．ホルムアミドピリミジン［ｆａｐｙ］－ＤＮＡグリコシラーゼが、損傷プリンを切除する、態様１または態様２～４１のいずれか１つに記載の方法。

態様４４．ウラシル－ＤＮＡグリコシラーゼ（ＵＤＧ）が、ウラシルを切除する、態様１または態様２～４１のいずれか１つに記載の方法。

態様４５．Ｔ４ピリミジンＤＮＡグリコシラーゼ（Ｔ４ＰＤＧ）が、シクロブタンピリミジン二量体を切除する、態様１または態様２～４１のいずれか１つに記載の方法。

態様４６．エンドヌクレアーゼＶＩＩＩ（ＥｎｄｏＶＩＩＩ）が、損傷ピリミジンを切除する、態様１または態様２～４１のいずれか１つに記載の方法。

態様４７．ＤＮＡリガーゼが、ＨｉＦｉＴａｑＤＮＡリガーゼである、態様１または態様２～４６のいずれか１つに記載の方法。

態様４８．ＤＮＡリガーゼが、ニックシーリング活性を有するが、末端結合活性を欠く、態様１または態様２～４７のいずれか１つに記載の方法。

態様４９．ステップ（ｂ）が、ＤＮＡ断片をポリヌクレオチドキナーゼ（Ｐｎｋ）と接触させることを含む、態様２または態様３～４８のいずれか１つに記載の方法。

態様５０．Ｐｎｋが、Ｔ４ポリヌクレオチドキナーゼである、態様４９に記載の方法。

態様５１．態様３１または態様３２～５０のいずれか１つに記載の方法であって、（ａ）エンドヌクレアーゼＩＶ（ＥｎｄｏＩＶ）が、配列番号３のアミノ酸配列に対して少なくとも７０％の同一性を有するアミノ酸配列を含み；（ｂ）ホルムアミドピリミジン［ｆａｐｙ］－ＤＮＡグリコシラーゼ（Ｆｐｇ）が、配列番号４のアミノ酸配列に対して少なくとも７０％の同一性を有するアミノ酸配列を含み；（ｃ）ウラシル－ＤＮＡグリコシラーゼ（ＵＤＧ）が、配列番号５～７からなる群から選択されるアミノ酸配列に対して少なくとも７０％の同一性を有するアミノ酸配列を含み；（ｄ）Ｔ４ピリミジンＤＮＡグリコシラーゼ（Ｔ４ＰＤＧ）が、任意の既知の配列に対して少なくとも７０％の同一性を有するアミノ酸配列を含み；（ｅ）エンドヌクレアーゼＶＩＩＩ（ＥｎｄｏＶＩＩＩ）が、配列番号８～９からなる群から選択されるアミノ酸配列に対して少なくとも７０％の同一性を有するアミノ酸配列を含み；および／または（ｆ）エキソヌクレアーゼＶＩＩ（ＥｘｏＶＩＩ）が、任意の既知のアミノ酸配列に対して少なくとも７０％の同一性を有するアミノ酸配列を含む、前記方法。

態様５２．ポリヌクレオチドキナーゼが、配列番号８のアミノ酸配列に対して少なくとも７０％の同一性を有するアミノ酸配列を含む、態様４９または態様５０～５１のいずれか１つに記載の方法。

態様５３．態様１または態様２～５２のいずれか１つに記載の方法であって、（１）ＤＮＡ依存性ＤＮＡポリメラーゼが、任意の既知のアミノ酸配列に対して少なくとも７０％の同一性を有するアミノ酸配列を含み；および／または（２）ＤＮＡリガーゼが、配列番号１１～１３からなる群から選択されるアミノ酸配列に対して少なくとも７０％の同一性を有するアミノ酸配列を含む、前記方法。

態様５４．偽変異の検出を軽減する配列決定方法であって、（Ａ１）配列決定する核酸を取得すること；（Ａ２）態様１または態様２～５２のいずれか１つに記載の方法を実施すること；（Ａ３）試料を配列決定すること；および（Ａ４）変異をコンピュータ分析により同定すること、を含む、前記方法。

態様５５．二重鎖配列決定におけるアーチファクトを低減する方法であって、（Ａ１）配列決定する核酸を取得すること；（Ａ２）態様１または態様２～５２のいずれか１つに記載の方法を実施すること；および（Ａ３）試料を二重鎖配列決定すること、を含む、前記方法。

態様５６．配列決定のための核酸試料調製の間の、合成鎖の合成を低減する方法であって、（Ａ１）配列決定する核酸を取得すること；および（Ａ２）態様１または態様２～５２のいずれか１つに記載の方法を実施すること、を含む、前記方法。

態様５７．変異同定の精度を高める方法であって、（Ａ１）配列決定する核酸を取得すること；（Ａ２）態様１または態様２～５２のいずれか１つに記載の方法を実施すること；（Ａ３）試料を二重鎖配列決定すること；および（Ａ４）変異をコンピュータ分析により同定すること、を含む、前記方法。

態様５８．（ａ）態様１～５７のいずれかに記載の方法を実施するための試薬；および（ｂ）容器、を含むキット：

態様５９．反応容器をさらに含む、態様５８に記載のキット。

態様６０．試薬が以下を含む、態様５８または態様５９のいずれか１つに記載のキット：（ａ）エンドヌクレアーゼＩＶ（ＥｎｄｏＩＶ）、ホルムアミドピリミジン［ｆａｐｙ］－ＤＮＡグリコシラーゼ（Ｆｐｇ）；ウラシル－ＤＮＡグリコシラーゼ（ＵＤＧ）；Ｔ４ピリミジンＤＮＡグリコシラーゼ（Ｔ４ＰＤＧ）；および／またはエンドヌクレアーゼＶＩＩＩ（ＥｎｄｏＶＩＩＩ）；エキソヌクレアーゼＶＩＩ（ＥｘｏＶＩＩ）、Ｔ４ポリヌクレアーゼキナーゼ（Ｔ４Ｐｎｋ）、Ｔ４ＤＮＡポリメラーゼ、ＨｉＦｉＴａｑリガーゼ、クレノウ断片、およびＴａｑポリメラーゼの、１つ以上、および／または（ｂ）ｄＮＴＰ。

態様６１．キットがさらに、試料を断片化するための試薬および材料を含む、態様５８または態様５９～６０のいずれか１つに記載のキット。

態様６２．試料の少なくとも一部が二本鎖である核酸試料（試料）を調製する方法であって、試料を反応容器に添加すること、および、（ａ）試料を、以下が可能な１つ以上の酵素と接触させること：（ｉ）試料の鎖の５’末端をリン酸化すること；３’ヒドロキシル部分を試料の鎖の３’末端に付加すること；および（ｉｉ）ニックをシーリングすること；（ｂ）試料を、５’および３’オーバーハングを除去すると共にギャップ領域を消化することができる１つ以上の酵素と接触させて、平滑化二重鎖を生成すること；および（ｃ）デオキシアデノシン一リン酸（ｄＡＭＰ）を、試料の鎖の３’末端に付加すること（ｄＡテーリング）、を含む、前記方法。

態様６３．ステップ（ａ）（１）で使用される酵素が、Ｔ４ポリヌクレオチドキナーゼ、ＨｉＦｉＴａｑリガーゼ、またはそれらの組み合わせを含む、態様６２に記載の方法。

態様６４．ステップ（ｂ）で使用される酵素が、ヌクレアーゼＳ１である、態様６２または態様６３に記載の方法。

本明細書で明示的に記載されている態様に加えて、本開示に開示されている特色のすべては、任意の組み合わせ（例：順列、組み合わせ）で組み合わせられることを理解されたい。本開示に開示されている各要素は、同一、等価、または類似の目的を果たす代替の特色によって置き換えることができる。したがって特に明記しない限り、開示される各特色は、一般的な一連の等価または類似の特色の例にすぎない。

上記の説明から、当業者は、本発明の本質的な特徴を容易に確認することができ、本発明の精神および範囲から逸脱することなく、本発明に様々な変更および改変を加えて、本発明を様々な用途および条件に適応させることができる。したがって、他の態様もまた特許請求の範囲内にある。

均等物および範囲
冠詞「a」、「an」、および「the」などは、逆の指示がない限り、または文脈から明らかでない限り、１またはそれ以上を意味し得る。グループの１つ以上のメンバー間に「または」を含む態様または説明は、逆の指示がない限り、または文脈から明らかでない限り、グループメンバーの１つ、複数、またはすべてが、所与の製品またはプロセスに存在する、使用される、またはその他で関連する場合に、満たされると見なされる。本発明は、グループの正確に１つのメンバーが、所与の製品またはプロセスに存在する、使用される、またはその他で関連する態様を含む。本発明は、グループメンバーの１つより多くまたはすべてが、所与の製品またはプロセスに存在する、使用される、またはその他で関連する態様を含む。

さらに本開示は、列挙された請求項の１つ以上からの１つ以上の限定、要素、条項、および説明用語が別の請求項に導入されるすべての変形、組み合わせ、および順列を包含する。例えば、別の請求項に従属する任意の請求項は、同じ基本請求項に従属する任意の他の請求項に見られる１つ以上の限定を含むように、改変することができる。要素がリストとして提示される場合、例えばマーカッシュグループ形式では、要素の各サブグループも開示され、任意の要素（単数または複数）をグループから削除できる。一般に、本発明または本発明の側面が特定の要素および／または特色を含むとされる場合、開示の特定の態様または開示の側面は、かかる要素および／または特色からなる、または本質的にそれらからなることを理解されたい。簡単にするために、これらの態様は、本明細書では直接的具体的に説明されてはいない。用語「含む（comprising）」および「含有する（containing）」は、オープンであることを意図しており、追加の要素またはステップを含めることを許容することにも留意されたい。範囲が指定されている場合は、エンドポイントも含まれる。さらに、別段の指示がない限り、または文脈および当業者の理解から明らかでない限り、範囲として表わされる値は、本発明の異なる態様において記載された範囲内の任意の特定の値または部分範囲を、文脈上明らかに別段の指示がない限り、範囲の下限の単位の１０分の１までとることができる。

本出願は、様々な発行された特許、公開された特許出願、学術文献、および他の刊行物を参照し、そのすべてが参照により本明細書に組み込まれる。組み込まれた参考文献のいずれかと本明細書との間に矛盾がある場合には、本明細書が優先するものとする。さらに、従来技術に該当する本発明の特定の態様は、任意の１つ以上の態様から明示的に除外することができる。かかる態様は当業者には既知であるとみなされるため、それらは、本明細書に明示的に除外が記載されていなくても、除外することができる。本発明のいかなる特定の態様も、先行技術の存在に関連するか否かにかかわらず、いかなる態様からいかなる理由によっても、除外することができる。

当業者は、日常的な実験のみを使用して、本明細書に記載される特定の態様の多くの均等物を認識するか、確認することができるであろう。本明細書に記載される本態様の範囲は、上記の説明に限定されることを意図するものではなく、むしろ添付の態様に記載される通りである。当業者であれば、以下の態様で定義される本発明の精神または範囲から逸脱することなく、この説明に対する様々な変更および改変を行うことができることを、理解するであろう。

Claims

核酸試料（試料）を調製する方法であって、ここで試料の少なくとも一部は二本鎖であり、試料を反応容器に添加すること、および：
（ａ）試料を、以下が可能な１つ以上の酵素と接触させること：
（ｉ）１つ以上の損傷塩基を、試料から切除すること；
（ｉｉ）１つ以上の脱塩基部位を切断すること、および得られた末端を、ＤＮＡポリメラーゼによる伸長および／またはＤＮＡリガーゼによるライゲーションに適合するように処理すること；
（ｉｉｉ）５’オーバーハングを消化すること；
（ｂ）試料を、以下の１つ以上と接触させること：
（ｉ）鎖置換および５’エキソヌクレアーゼ活性の両方を欠くが、試料の一本鎖セグメントを埋め、かつ試料の３’オーバーハングを消化することができる、ＤＮＡ依存性ＤＮＡポリメラーゼ；
（ｉｉ）試料の鎖の５’末端をリン酸化することができる酵素；および
（ｃ）試料を、ニックをシーリング可能なＤＮＡリガーゼと接触させること、
を含む、前記方法。
以下をさらに含む、請求項１に記載の方法：
（ｄ）アダプターライゲーション用の試料を調製するステップ、ここで該調製は、以下を含む：
（ｉ）デオキシアデノシン一リン酸（ｄＡＭＰ）を、試料の鎖の３’末端に付加すること（ｄＡテーリング）；または
（ｉｉ）任意に、試料の末端をさらに平滑化すること。
ｄＡテーリングが、試料を、デオキシアデノシン一リン酸（ｄＡＭＰ）を試料の鎖の３’末端に組み込むことができる酵素と接触させること、および試料をｄＮＴＰと接触させること、を含む、請求項２に記載の方法。
ステップ（ａ）～（ｃ）で使用される酵素および／またはｄＮＴＰが、ｄＡテーリングの前に反応容器から実質的に除去される、請求項２または請求項３に記載の方法。
試料と接触するｄＮＴＰが、ｄＡＴＰを実質的に含む、請求項２または請求項３～４のいずれか一項に記載の方法。
試料を、方法の任意の後続のステップに進む前に、ステップ（ａ）の１つ以上の酵素と接触させて少なくとも５分間インキュベートする、請求項１または請求項２～５のいずれか一項に記載の方法。
試料を、方法の任意の後続のステップに進む前に、ステップ（ａ）の１つ以上の酵素と接触させて少なくとも２５分間インキュベートする、請求項１または請求項２～６のいずれか一項に記載の方法。
試料を、方法の任意の後続のステップに進む前に、ステップ（ａ）の１つ以上の酵素と接触させて少なくとも３０分間インキュベートする、請求項１または請求項２～７のいずれか一項に記載の方法。
試料を、方法の任意の後続のステップに進む前に、ステップ（ｂ）の１つ以上の酵素と接触させて少なくとも５分間インキュベートする、請求項１または請求項２～８のいずれか一項に記載の方法。
試料を、方法の任意の後続のステップに進む前に、ステップ（ｂ）の１つ以上の酵素と接触させて少なくとも２５分間インキュベートする、請求項１または請求項２～９のいずれか一項に記載の方法。
試料を、方法の任意の後続のステップに進む前に、ステップ（ｂ）の１つ以上の酵素と接触させて少なくとも３０分間インキュベートする、請求項１または請求項２～１０のいずれか一項に記載の方法。
試料を、方法の任意の後続のステップに進む前に、ステップ（ｃ）の１つ以上の酵素と接触させて少なくとも１５分間インキュベートする、請求項１または請求項２～１１のいずれか一項に記載の方法。
試料を、方法の任意の後続のステップに進む前に、ステップ（ｃ）の１つ以上の酵素と接触させて少なくとも３０分間インキュベートする、請求項１または請求項２～１２のいずれか一項に記載の方法。
試料を、方法の任意の後続のステップに進む前に、ステップ（ｃ）の１つ以上の酵素と接触させて少なくとも４５分間インキュベートする、請求項１または請求項２～１３のいずれか一項に記載の方法。
試料を、方法の任意の後続のステップに進む前に、ステップ（ｄ）の１つ以上の酵素と接触させて少なくとも４０分間インキュベートする、請求項２または請求項３～１４のいずれか一項に記載の方法。
試料を、方法の任意の後続のステップに進む前に、ステップ（ｄ）の１つ以上の酵素と接触させて少なくとも６０分間インキュベートする、請求項２または請求項３～１５のいずれか一項に記載の方法。
試料を、方法の任意の後続のステップに進む前に、ステップ（ｄ）の１つ以上の酵素と接触させて少なくとも７０分間インキュベートする、請求項２または請求項３～１６のいずれか一項に記載の方法。
ステップ（ａ）が、約３２℃～約４２℃の温度で実施される、請求項１または請求項２～１７のいずれか一項に記載の方法。
ステップ（ａ）が、約３５℃～約３９℃の温度で実施される、請求項１または請求項２～１８のいずれか一項に記載の方法。
ステップ（ｂ）が、約３２℃～約４２℃の温度で実施される、請求項１または請求項２～１９のいずれか一項に記載の方法。
ステップ（ｂ）が、約３５℃～約３９℃の温度で実施される、請求項１または請求項２～２０のいずれか一項に記載の方法。
ステップ（ｃ）が、約３０℃～約７０℃の温度で実施される、請求項１または請求項２～２１のいずれか一項に記載の方法。
ステップ（ｃ）が、約３３℃～約６７℃の温度で実施される、請求項１または請求項２～２２のいずれか一項に記載の方法。
ステップ（ｄ）が、約１８℃～約６９℃の温度で実施される、請求項２または請求項３～２３のいずれか一項に記載の方法。
ステップ（ｄ）が、約２０℃～約６７℃の温度で実施される、請求項２または請求項３～２４のいずれか一項に記載の方法。
ステップ（ａ）の前に、試料が：
（ｉ）断片化される；または
（ｉｉ）切断およびタグ付けされる（タグメントされる）、
請求項１または請求項２～２５のいずれか一項に記載の方法。
断片化が、
（ａ）物理的断片化；
（ｂ）酵素的断片化；および／または
（ｃ）化学的断片化、
によるものである、請求項２７に記載の方法。
断片化が、物理的断片化による、請求項２６または請求項２７に記載の方法。
断片化が、酵素的断片化による、請求項２６または請求項２７に記載の方法。
断片化が、化学的断片化による、請求項２６または請求項２７に記載の方法。
ステップ（ａ）が、試料を、以下からなる群から選択される１つ以上の酵素と接触させることを含む、請求項１または請求項２～３０のいずれか一項に記載の方法：
（１）エンドヌクレアーゼＩＶ（ＥｎｄｏＩＶ）；
（２）ホルムアミドピリミジン［ｆａｐｙ］－ＤＮＡグリコシラーゼ（Ｆｐｇ）；
（３）ウラシル－ＤＮＡグリコシラーゼ（ＵＤＧ）；
（４）Ｔ４ピリミジンＤＮＡグリコシラーゼ（Ｔ４ＰＤＧ）；および
（５）エンドヌクレアーゼＶＩＩＩ（ＥｎｄｏＶＩＩＩ）；
（６）エキソヌクレアーゼＶＩＩ（ＥｘｏＶＩＩ）。
１つ以上の酵素の同時活性が、試料上の以下のＤＮＡ改変を触媒する、請求項１または請求項２～３１のいずれか一項に記載の方法：
損傷塩基の切除；および
（２）脱塩基部位を切断すること、および得られた末端を、ＤＮＡポリメラーゼによる伸長および／またはＤＮＡリガーゼによるライゲーションに適合するように処理すること。
損傷塩基が、ウラシル；８’オキソＧ；酸化ピリミジン；およびシクロブタンピリミジン二量体からなる群から選択される、請求項１または請求項２～３２のいずれか一項に記載の方法。
試料の少なくとも１つの鎖の５’オーバーハングが、少なくとも１０核酸塩基長である、請求項１または請求項２～３３のいずれか一項に記載の方法。
試料の少なくとも１つの鎖の５’オーバーハングが、少なくとも７５核酸塩基長である、請求項１または請求項２～３４のいずれか一項に記載の方法。
試料の少なくとも１つの鎖の３’オーバーハングが、少なくとも１０核酸塩基長である、請求項１または請求項２～３５のいずれか一項に記載の方法。
試料の少なくとも１つの鎖の３’オーバーハングが、少なくとも７５核酸塩基長である、請求項１または請求項２～３６のいずれか一項に記載の方法。
１つ以上の酵素が、試料の少なくとも１つの鎖の５’オーバーハングを１６核酸塩基未満の長さに消化する、請求項１または請求項２～３７のいずれか一項に記載の方法。
１つ以上の酵素が、試料の少なくとも１つの鎖の５’オーバーハングを８核酸塩基未満の長さに消化する、請求項１または請求項２～３８のいずれか一項に記載の方法。
１つ以上の酵素が、試料の少なくとも１つの鎖の３’オーバーハングを１６核酸塩基未満の長さに消化する、請求項１または請求項２～３９のいずれか一項に記載の方法。
１つ以上の酵素が、試料の少なくとも１つの鎖の３’オーバーハングを８核酸塩基未満の長さに消化する、請求項１または請求項２～４０のいずれか一項に記載の方法。
エンドヌクレアーゼＩＶ（ＥｎｄｏＩＶ）が、脱塩基部位を切断する、請求項１または請求項２～４１のいずれか一項に記載の方法。
ホルムアミドピリミジン［ｆａｐｙ］－ＤＮＡグリコシラーゼが、損傷プリンを切除する、請求項１または請求項２～４１のいずれか一項に記載の方法。
ウラシル－ＤＮＡグリコシラーゼ（ＵＤＧ）が、ウラシルを切除する、請求項１または請求項２～４１のいずれか一項に記載の方法。
Ｔ４ピリミジンＤＮＡグリコシラーゼ（Ｔ４ＰＤＧ）が、シクロブタンピリミジン二量体を切除する、請求項１または請求項２～４１のいずれか一項に記載の方法。
エンドヌクレアーゼＶＩＩＩ（ＥｎｄｏＶＩＩＩ）が、損傷ピリミジンを切除する、請求項１または請求項２～４１のいずれか一項に記載の方法。
ＤＮＡリガーゼが、ＨｉＦｉＴａｑＤＮＡリガーゼである、請求項１または請求項２～４６のいずれか一項に記載の方法。
ＤＮＡリガーゼが、ニックシーリング活性を有するが、末端結合活性を欠く、請求項１または請求項２～４７のいずれか一項に記載の方法。
ステップ（ｂ）が、ＤＮＡ断片をポリヌクレオチドキナーゼ（Ｐｎｋ）と接触させることを含む、請求項２または請求項３～４８のいずれか一項に記載の方法。
Ｐｎｋが、Ｔ４ポリヌクレオチドキナーゼである、請求項４９に記載の方法。
請求項３１または請求項３２～５０のいずれか一項に記載の方法であって、
（ａ）エンドヌクレアーゼＩＶ（ＥｎｄｏＩＶ）が、配列番号３のアミノ酸配列に対して少なくとも７０％の同一性を有するアミノ酸配列を含み；
（ｂ）ホルムアミドピリミジン［ｆａｐｙ］－ＤＮＡグリコシラーゼ（Ｆｐｇ）が、配列番号４のアミノ酸配列に対して少なくとも７０％の同一性を有するアミノ酸配列を含み；
（ｃ）ウラシル－ＤＮＡグリコシラーゼ（ＵＤＧ）が、配列番号５～７からなる群から選択されるアミノ酸配列に対して少なくとも７０％の同一性を有するアミノ酸配列を含み；
（ｄ）Ｔ４ピリミジンＤＮＡグリコシラーゼ（Ｔ４ＰＤＧ）が、任意の既知の配列に対して少なくとも７０％の同一性を有するアミノ酸配列を含み；
（ｅ）エンドヌクレアーゼＶＩＩＩ（ＥｎｄｏＶＩＩＩ）が、配列番号６～７からなる群から選択されるアミノ酸配列に対して少なくとも７０％の同一性を有するアミノ酸配列を含み；および／または
（ｆ）エキソヌクレアーゼＶＩＩ（ＥｘｏＶＩＩ）が、任意の既知のアミノ酸配列に対して少なくとも７０％の同一性を有するアミノ酸配列を含む、
前記方法。
ポリヌクレオチドキナーゼが、配列番号１０のアミノ酸配列に対して少なくとも７０％の同一性を有するアミノ酸配列を含む、請求項４９または請求項５０～５１のいずれか一項に記載の方法。
請求項１または請求項２から５２のいずれか一項に記載の方法であって：
（１）ＤＮＡ依存性ＤＮＡポリメラーゼが、任意の既知のまたは入手可能なアミノ酸配列に対して少なくとも７０％の同一性を有するアミノ酸配列を含み；および／または
（２）ＤＮＡリガーゼが、配列番号１１～１３からなる群から選択されるアミノ酸配列に対して少なくとも７０％の同一性を有するアミノ酸配列を含む、
前記方法。
偽変異の検出を軽減する配列決定方法であって、
（Ａ１）配列決定する核酸を取得すること；
（Ａ２）請求項１または請求項２～５２のいずれか一項に記載の方法を実施すること；
（Ａ３）試料を配列決定すること；および
（Ａ４）変異をコンピュータ分析により同定すること、
を含む、前記方法。
二重鎖配列決定におけるアーチファクトを低減する方法であって、
（Ａ１）配列決定する核酸を取得すること；
（Ａ２）請求項１または請求項２～５２のいずれか一項に記載の方法を実施すること；および
（Ａ３）試料を二重鎖配列決定すること、
を含む、前記方法。
配列決定のための核酸試料調製の間の、合成鎖の合成を低減する方法であって、
（Ａ１）配列決定する核酸を取得すること；および
（Ａ２）請求項１または請求項２～５２のいずれか一項に記載の方法を実施すること、
を含む、前記方法。
変異同定の精度を高める方法であって、
（Ａ１）配列決定する核酸を取得すること；
（Ａ２）請求項１または請求項２～５２のいずれか一項に記載の方法を実施すること；
（Ａ３）試料を二重鎖配列決定すること；および
（Ａ４）変異をコンピュータ分析により同定すること、
を含む、前記方法。
以下を含むキット：
（ａ）請求項１～５７のいずれかに記載の方法を実施するための試薬；および
（ｂ）容器。
反応容器をさらに含む、請求項５８に記載のキット。
試薬が以下を含む、請求項５８または請求項５９のいずれか一項に記載のキット：
（ａ）エンドヌクレアーゼＩＶ（ＥｎｄｏＩＶ）、ホルムアミドピリミジン［ｆａｐｙ］－ＤＮＡグリコシラーゼ（Ｆｐｇ）；ウラシル－ＤＮＡグリコシラーゼ（ＵＤＧ）；Ｔ４ピリミジンＤＮＡグリコシラーゼ（Ｔ４ＰＤＧ）；および／またはエンドヌクレアーゼＶＩＩＩ（ＥｎｄｏＶＩＩＩ）；エキソヌクレアーゼＶＩＩ（ＥｘｏＶＩＩ）、Ｔ４ポリヌクレアーゼキナーゼ（Ｔ４Ｐｎｋ）、Ｔ４ＤＮＡポリメラーゼ、ＨｉＦｉＴａｑリガーゼ、クレノウ断片、およびＴａｑポリメラーゼの、１つ以上、および／または
（ｂ）ｄＮＴＰ。
キットがさらに、試料を断片化するための試薬および材料を含む、請求項５８または請求項５９～６０のいずれか一項に記載のキット。
試料の少なくとも一部が二本鎖である核酸試料（試料）を調製する方法であって、試料を反応容器に添加すること、および、
（ａ）試料を、以下が可能な１つ以上の酵素と接触させること：
（ｉ）試料の鎖の５’末端をリン酸化すること；３’ヒドロキシル部分を試料の鎖の３’末端に付加すること；および
（ｉｉ）ニックをシーリングすること；
（ｂ）試料を、５’および３’オーバーハングを除去すると共にギャップ領域を消化することができる１つ以上の酵素と接触させて、平滑化二重鎖を生成すること；および
（ｃ）デオキシアデノシン一リン酸（ｄＡＭＰ）を、試料の鎖の３’末端に付加すること（ｄＡテーリング）、
を含む、前記方法。
ステップ（ａ）（１）で使用される酵素が、Ｔ４ポリヌクレオチドキナーゼ、ＨｉＦｉＴａｑリガーゼ、またはそれらの組み合わせを含む、請求項６２に記載の方法。
ステップ（ｂ）で使用される酵素が、ヌクレアーゼＳ１である、請求項６２または請求項６３に記載の方法。