JP2019509018A

JP2019509018A - 変異に基づく病気の診断および追跡

Info

Publication number: JP2019509018A
Application number: JP2018534573A
Authority: JP
Inventors: クロードベンオリバー
Original assignee: Grail LLC
Current assignee: Grail LLC
Priority date: 2016-01-22
Filing date: 2017-01-20
Publication date: 2019-04-04
Also published as: EP3405574A4; EP3405574A1; CN108603234A; WO2017127742A1; US20170213008A1; CA3010418A1; AU2023204105A1; JP2022031683A; AU2017209330B2; JP2024009859A; HK1256412A1; AU2017209330A1

Abstract

本発明の態様は、腫瘍、または突然変異、分類シグネチャーを提供することができるように、患者の遺伝的変異を縦断的に追跡することによって患者の健康状態を追跡する方法に関する。縦断的追跡は、微小残存病変（MRD；治療後および／もしくは寛解期の患者内に残存する少数の細胞）ならびに／または早期の治療応答を検出する能力を改善し、その両方が治療決定を導き、患者のさまざまな腫瘍内／腫瘍間反応を見逃すことを防ぐのに役立つことができる。

Description

関連出願の相互参照

本出願は、2016年1月22日に出願された特許文献１の出願日の優先権の利益を主張し、その開示は、その全体が参照により本明細書に援用される。

本発明の態様は、患者の突然変異シグネチャーおよびテロメア特異的縦列反復配列を使用して患者の健康状態を追跡する方法に関する。

がんは、毎年何百万人もの人々が罹患している深刻な病気である。この病気は、ゲノム変化、または突然変異の複雑な系統によって特徴付けられ、腫瘍内および腫瘍間の遺伝的異質性として現れる。例えば、非特許文献１；非特許文献２；非特許文献３；非特許文献４；非特許文献５；および非特許文献６を参照。

いくつかの変化は原因となるものであり、腫瘍進行を促進するが、他の事象は機能的影響をほとんど与えず、パッセンジャー突然変異として知られている。変化の蓄積は、個々の患者における、および患者間の腫瘍内および／または腫瘍間の遺伝的異質性として観察される。その一例は図１で見ることができ、始原腫瘍細胞の系統が示されている。祖先細胞は時間t0で生じ、細胞***中に遺伝的に異なるサブ集団（サブクローン）が生じ、ツリーに新しいブランチを加える。各サブクローンの相対的な集団サイズは、各ブランチの幅によって表される。時間が経つと、3つのサブクローンS（0、1）、S（0、2）、およびS（0、3）が生成し、各々はそれ自身の体細胞変異のセットによって区別される。復帰突然変異が起こらず、組み換えがない場合、突然変異は、ネストされたツリーオブジェクト（例えば、S（0、3）に含まれるS（0、1））として表すことができる。転移S（3、0）は、急速に増殖するサブクローンS（3、0）に由来する。この特定の例では、S（0、2）の細胞数は減少し、S（0、1）の細胞数は安定したままであり、S（0、3）の細胞数は増加する。

しかしながら、体細胞の遺伝的異質性は、腫瘍分類において2つの課題を生み出す：腫瘍は、時間の経過とともに急速に進行し、2+個体において同じ組織に発生するにもかかわらず、腫瘍は異なる予後および治療応答を示し、遺伝的に異なり得る。

KRAS突然変異状態試験などの単一遺伝子座に焦点を当てた遺伝子検査は、チロシンキナーゼ阻害剤を使用するかどうかの判断の情報を与えるなど、治療選択における有用性が実証されている。例えば、非特許文献７を参照。しかしながら、単一遺伝子座試験は、がんの遺伝的異質性を捕捉するには不十分であり、したがって、分類における有用性が限られている。いくつかの研究では、ある時点での多領域配列決定を用いて異質性を評価したが、他の研究では、予め規定した突然変異を時間の経過に伴って追跡した。したがって、患者の遺伝的変異の一部または全部を時間の経過とともにサンプリングすることによって、腫瘍分類シグネチャーを構築する方法を開発する必要がある。

米国仮特許出願第62/286,103号明細書米国特許第7,666,593号明細書米国特許出願公開第2009/0156412号明細書米国特許第7,169,560号明細書米国特許出願公開第2009/0191565号米国特許第6,818,395号米国特許第7,282,337号米国特許出願公開第2002/0164629号明細書米国特許出願公開第2009/0026082号明細書米国特許出願公開第2009/0127589号明細書米国特許出願公開第2010/0035252号明細書米国特許出願公開第2010/0137143号明細書米国特許出願公開第2010/0188073号明細書米国特許出願公開第2010/0197507号明細書米国特許出願公開第2010/0282617号明細書米国特許出願公開第2010/0300559号明細書米国特許出願公開第2010/0300895号明細書米国特許出願公開第2010/0301398号明細書米国特許出願公開第2010/0304982号明細書米国特許第4,683,195号明細書米国特許出願公開第2006/0195269号明細書米国特許第6,925,389号明細書米国特許第6,989,100号明細書米国特許第6,890,763号明細書米国仮特許出願第62/286,110号明細書

Knudson Proc Natl Acad Sci, 68: 820-823 (1971) Gerlinger et al., N Engl J Med, 366: 883-892 (2012) Campbell et al., Proc Natl Acad Sci, 105: 13081-13086 (2008) Robbins et al., Nature Medicine, 19: 747-752 (2013) Murtaza et al., Nature Communications, 6:8760 (Nov 2015) Hong et al., Nature Communications 6:6605 (Apr 2015) Plesec et al., Adv. Anal Pathol. (2009) Maniatis, et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor, N.Y., pp. 280-281, 1982 Mouliere and Rosenfeld, PNAS 112(11): 3178-3179 (Mar 2015) Jiang et al., PNAS (Mar 2015) Mouliere et al., Mol Oncol, 8(5):927-41 (2014) Bettegowda et al, Sci Trans Med, 2014 Newmann et al, Nat Med, 2014 Duncavage et al., J Mol Diagn. 13(3): 325-333 (2011) Newman et al., Nat Med. 20(5): 548-554 (2014) Chirgwin et al., Biochemistry 18:5294-5299 (1979) Sambrook et al., MOLECULAR CLONING--A LABORATORY MANUAL (2ND ED.), Vols. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y. (1989) Genome Analysis: A Laboratory Manual Series (Vols. I-IV), Cold Spring Harbor Laboratory Press PCR Primer: A Laboratory Manual, Cold Spring Harbor Laboratory Press Sambrook, J et al., (2001) Molecular Cloning: A Laboratory Manual, 2nd ed. (Vols. 1-3), Cold Spring Harbor Laboratory Press Sanger et al., Proc Natl. Acad. Sci. U S A, 74(12): 5463 67 (1977) Maxam et al., Proc. Natl. Acad. Sci., 74: 560 564 (1977) Harris T. D. et al. (2008) Science 320:106-109 Braslavsky, et al., PNAS (USA), 100: 3960-3964 (2003) Margulies, M et al. 2005, Nature, 437, 376-380 Soni G V and Meller A. (2007) Clin Chem 53: 1996-2001 Moudrianakis E. N. and Beer M. Proc Natl Acad Sci USA. 1965 March; 53:564-71 Forte VA, et al., The potential for liquid biopsies in the precision medical treatment of breast cancer, Cancer Biology & Medicine. 2016;13(1):19-40. doi:10.28092/j.issn.2095-3941.2016.0007 Sung et al., "Asymmetric Context-Dependent Mutation Patterns Revealed Through Mutation-Accumulation Experiments," Mol. Biol. Evol., Apr 2015 Alexandrov et al., (2013) Signatures of mutational processes in human cancer. Nature, 500(7463), 415-421, http://doi.org/10.1038/nature12477 Venn et al., "Genome-wide cfDNA Sequencing of Melanoma Progression," Polanski and Anderson, "A List of Candidate Cancer Biomarkers for Targeted Proteomics," Biomark Insights, 1:1-48 (2007) Id; and Dawson et al., N Engl J Med 368:1199/1209 (March 2013) Parker & Barnes, Methods in Molecular Biology 106:247 283 (1999) Hod, Biotechniques 13:852 854 (1992) Weis et al., Trends in Genetics 8:263 264 (1992) Ding and Cantor, Proc. Natl. Acad. Sci. USA 100:3059 3064 (2003) Liang and Pardee, Science 257:967 971 (1992) Kawamoto et al., Genome Res. 12:1305 1312 (1999) Oliphant et al., Discovery of Markers for Disease (Supplement to Biotechniques), June 2002 Ferguson et al., Analytical Chemistry 72:5618 (2000) Yang et al., Genome Res. 11:1888 1898 (2001) Fukumura et al., Nucl. Acids. Res. 31(16) e94 (2003) Harlow and Lane, 1988, ANTIBODIES: A LABORATORY MANUAL, Cold Spring Harbor, N.Y. Kononen et al., Nat. Med 4(7):844-7 (1998) Velculescu et al., Science 270:484 487 (1995) Velculescu et al., Cell 88:243 51 (1997) Brenner et al., Nature Biotechnology 18:630 634 (2000) Akincilar et al., Cell Mole Life Sci, 2016 Zhihao Ding et al., Estimating telomere length from whole genome sequence data. Nucl. Acids Res. (14 May 2014) 42 (9): e75 first published online March 7, 2014 doi:10.1093/nar/gku181 Nersisyan L et al., (2015) Computel: Computation of Mean Telomere Length from Whole-Genome Next-Generation Sequencing Data. PLOS ONE 10(4): e0125201. doi: 10.1371/journal.pone.0125201 Lars Feuerbach et al., TelomereHunter: telomere content estimation and characterization from whole genome sequencing data. 2016. bioRxiv 065532; doi: https://doi.org/10.1101/065532 Li et al., Genome Res 20(2): 265-272 (2010) Liu et al., published online at http://arxiv.org/abs/1308.2012 (2013) Markowitz et al. (1995), Inactivation of the type a TGF-sreceptor in colon cancer cells with microsatellite instability, Science 268 (1995): 1336-1338 Gymrek et al., (2012), lobSTR: a short tandem repeat profiler for personal genomes, Genome research 22.6 (2012): 1154-1162 Huang et al., (2013), Highly recurrent TERT promoter mutations in human melanoma, Science 339.6122 (2013): 957-959 McArthur, Grant A., et al. "Safety and efficacy of vemurafenib in BRAF V600E and BRAF V600K mutation-positive melanoma (BRIM-3): extended follow-up of a phase 3, randomised, open-label study." The lancet oncology 15.3 (2014): 323-332

本発明の態様は、腫瘍、または突然変異、分類シグネチャーを提供することができるように、患者の遺伝的変異を縦断的に追跡することによって患者の健康状態を追跡する方法に関する。縦断的追跡は、微小残存病変（MRD；治療後および／もしくは寛解期の患者内に残存する少数の細胞）ならびに／または早期の治療応答を検出する能力を改善し、その両方が治療決定を導き、患者のさまざまな腫瘍内／腫瘍間反応を見逃すことを防ぐのに役立つことができる。本発明のシステムおよび方法は、治療耐性を予測および理解し、宿主免疫応答の標的となり得る新抗原を生成するために、個々の腫瘍および／または患者の遺伝的多様性を同定ならびに追跡することに関する。これらの変化は、腫瘍を分類し、進行および治療有効性を予測するために最終的に使用され得る腫瘍の特異的で基本的なシグネチャーを表す。

本発明の方法によれば、突然変異シグネチャーを、患者の遺伝的変異の一部または全部を時間の経過とともにサンプリングすることによって構築することができる。次いで、これらの縦断的シグネチャーを使用して、患者状態を、既知の健康な個体および病気の個体のシグネチャーの1つ以上のデータベースに対して分類することができる。追加の各患者のシグネチャーおよび健康状態が時間とともに改良されるにつれて、次の患者は、分類データベースの向上した識別能力から利益を得る。

本発明の一実施形態によれば、患者の健康状態は、患者の突然変異シグネチャーを構築することによって追跡することができる。突然変異シグネチャーは、患者の核酸試料中の観察された変異の総数、観察された変異の各々についての配列関係因子、観察された変異の各々の対立遺伝子頻度、核酸ポリマー断片サイズ、推定DNA複製タイミング、クロマチン構造（例えば、オープン対クローズドクロマチン構造）、DNAメチル化状態、突然変異間距離、突然変異の予想される機能的結果、選択の推定値（例えば、患者の非同義突然変異対同義突然変異の比率）、および変異型分類を含む多くの変数から決定される。次いで、患者の突然変異シグネチャーを、既知の健康状態を有する患者の突然変異シグネチャーを含む参照データベースと比較し、患者の診断または治療を決定することができる。変異型分類には、テロメア配列のコピー数の変動、染色体不安定性、転座、逆位、挿入、欠失、ヘテロ接合性の消失、増幅、カタエギス、およびマイクロサテライト不安定性が含まれ得る。

本発明の一態様では、長期にわたる患者の複数の突然変異シグネチャーを参照データベースと比較することによって、患者の縦断的突然変異シグネチャーを決定することができ、この参照データベースは、診断または治療を決定する前の既知の健康状態を有する患者の縦断的突然変異シグネチャーも含む。いくつかの実施形態では、縦断的突然変異シグネチャーは、第1時点からの患者の第1突然変異シグネチャー、および第2時点からの患者の第2突然変異シグネチャーを含む。いくつかの実施形態では、第1時点は治療の前であり、第2時点は治療の後である。いくつかの実施形態では、治療は腫瘍切除手術を含む。いくつかの実施形態では、治療は抗がん治療剤の投与を含む。

本発明の別の態様では、患者の健康状態が取得され、患者の突然変異シグネチャーと共にデータベースに追加される。年齢、性別、人種、民族性、家族病歴（例えば、リンチ症候群、遺伝性BRCA1/2突然変異など）、体重、ボディマス指数、身長、以前のおよび／または重複感染、環境ばく露、および喫煙歴などの患者からの情報を取得することができ、既知の健康状態を有する患者の1つ以上のデータベースと比較することもできる。さらに、タンパク質バイオマーカーレベルなどの遺伝子産物レベルを患者から取得し、既知の健康状態を有する患者の1つ以上のデータベースにおける既知の健康状態を有する患者のレベルと比較することもできる。

患者の核酸から突然変異シグネチャーを決定するために、試料を患者から得ることができる。試料は、例えば、組織試料、体液、細胞試料、または糞便試料を含むことができる。特定の実施形態では、試料は、全血、唾液、涙、汗、痰、または尿などの体液を含む。いくつかの実施形態では、血漿または細胞遊離核酸などの全血の一部のみが使用される。他の実施形態では、試料は、ホルマリン固定パラフィン包埋（FFPE）組織試料、新鮮凍結（FF）組織試料、またはそれらの組み合わせなどの組織試料である。

本発明の方法を使用して、時間をかけて観察された変異からの腫瘍内または腫瘍間の異質性を判定することもできる。さらに、治療有効性も、時間をかけて観察された患者の治療前後の変異を監視することによって判定することができる。このようにして、患者を微小残存病変について監視することができる。

別の実施形態では、患者の健康は、患者から得た核酸についてアッセイを実施してテロメア特異的縦列反復配列を決定する工程、テロメア縦列反復の頻度分布を含むテロメア完全性スコアを作成する工程、2つ以上の時点で患者から得た核酸のテロメア完全性の縦断的軌跡を生成する工程、該縦断的軌跡を、既知の健康状態を有する患者の縦断的軌跡を含む参照データベースと比較する工程、および患者の診断または治療を決定する工程によって追跡することができる。

本発明の一態様では、細胞遊離核酸は、全血、唾液、涙、汗、痰、および尿などの体液から得られる。体液が全血である場合、血漿などの全血の一部分を使用することができる。

本発明の別の態様では、患者の健康状態が取得され、患者の縦断的軌跡と共にデータベースに追加される。年齢、性別、人種、民族性、家族病歴、体重、ボディマス指数、身長、以前のおよび／または重複感染、環境ばく露、および喫煙歴などの患者からの情報を取得することができ、既知の健康状態を有する患者の1つ以上のデータベースと比較することもできる。タンパク質バイオマーカーレベルなどの遺伝子産物レベルを患者から取得し、既知の健康状態を有する患者の1つ以上のデータベースにおける既知の健康状態を有する患者のレベルと比較することもできる。さらに、TERTプロモーター突然変異プロファイルを患者から取得し、既知の健康状態を有する患者の1つ以上のデータベースにおけるTERTプロモーター突然変異プロファイルと比較することができる。

テロメア縦列反復の頻度分布を正規化することもできる。これは、頻度分布を、テロメア特異的縦列反復配列と同じ割合の個々の核酸塩基を有する制御配列と比較することによって行うことができる。頻度分布は、テロメア縦列反復の頻度分布を頻度分布の参照データベースと比較することによっても正規化することができる。

本発明の一態様では、アッセイは、全ゲノム配列決定などの配列決定であり得る。配列決定は、標的PCR増幅または選択可能なオリゴヌクレオチドを使用するハイブリッドキャプチャーなどの標的配列決定でもあり得る。

別の態様では、テロメア特異的縦列反復配列は、テロメア参照配列へのアラインメントまたはk-mer頻度の分析によって同定することができる。

始原腫瘍細胞の系統を経時的に示す。組織生検に対するcfDNAからの全ゲノム配列決定（WGS）の配列被覆率の深度を示すチャートである。転移性メラノーマがん患者（PT0001）からのトリプレット配列関係によって層別化された全ゲノム配列決定（WGS）同定突然変異を示すチャートである。第1および第2パネルは、それぞれ第1時点および第2時点で同定された突然変異を示す。第2時点は、複数の療法計画の後に採取された。第3パネルは、時点間の頻度の相対的変化を示す。切除手術前後の胸部がん患者における有効腫瘍突然変異の対立遺伝子頻度を示すチャートである。転移性メラノーマがん患者の治療期間にわたる、タンパク質コード領域における100個の体細胞突然変異の対立遺伝子頻度を示すチャートである。転移性メラノーマがん患者の治療期間にわたる、タンパク質コード領域における100個の体細胞突然変異の対立遺伝子頻度を示すチャートである。転移性メラノーマがん患者の治療期間にわたる、タンパク質コード領域における100個の体細胞突然変異の対立遺伝子頻度を示すチャートである。転移性メラノーマがん患者の治療期間にわたる、タンパク質コード領域における100個の体細胞突然変異の対立遺伝子頻度を示すチャートである。転移性メラノーマがん患者の治療期間にわたる、タンパク質コード領域における100個の体細胞突然変異の対立遺伝子頻度を示すチャートである。転移性メラノーマがん患者の治療期間にわたる、タンパク質コード領域における100個の体細胞突然変異の対立遺伝子頻度を示すチャートである。転移性メラノーマがん患者の治療期間にわたる、タンパク質コード領域における100個の体細胞突然変異の対立遺伝子頻度を示すチャートである。転移性メラノーマがん患者の治療期間にわたる、タンパク質コード領域における100個の体細胞突然変異の対立遺伝子頻度を示すチャートである。転移性メラノーマがん患者の治療期間にわたる、タンパク質コード領域における100個の体細胞突然変異の対立遺伝子頻度を示すチャートである。転移性メラノーマがん患者の治療期間にわたる、タンパク質コード領域における100個の体細胞突然変異の対立遺伝子頻度を示すチャートである。転移性メラノーマがん患者の治療期間にわたる、タンパク質コード領域における100個の体細胞突然変異の対立遺伝子頻度を示すチャートである。本発明の一実施形態による方法を示すフローチャートである。メラノーマがん患者PT0001からの反復テロメア配列を含むcfDNAからの全ゲノム配列決定読み取り数の経験分布を示すチャートである。本発明の実施形態によるシステムの図である。外科的腫瘍切除前後の結腸直腸がん（CRC）患者において測定された体細胞変異の対立遺伝子頻度を示すグラフである。外科的腫瘍切除前後のCRC患者において測定された体細胞変異の対立遺伝子頻度を示すグラフである。外科的腫瘍切除前後のCRC患者において測定された体細胞変異の対立遺伝子頻度を示すグラフである。右側のツリーは、患者のがん細胞の潜在的な基本的系統を表す：このツリーは、手術中の対立遺伝子頻度軌跡と一致する。異なる患者からのcfDNA配列決定からのマイクロサテライト反復の対立遺伝子頻度を示す棒グラフのコレクションである。がん患者ならびにWGSおよび標的配列決定を使用する合成制御を含む様々な試料タイプについてのcfDNAならびにゲノムDNA配列決定からのマイクロサテライト反復の対立遺伝子頻度を示す棒グラフのコレクションである。抽出されたcfDNAの塩基対における断片サイズを示すバイオアナライザートレースのコレクションである。 PCR増幅前の塩基対におけるcfDNAライブラリー断片サイズを示すバイオアナライザートレースのコレクションである。 8サイクルのPCR増幅後の塩基対におけるcfDNAライブラリー断片サイズを示すバイオアナライザートレースのコレクションである。 12サイクルのPCRおよび洗浄後の塩基対におけるcfDNAライブラリー断片サイズを示すバイオアナライザートレースのコレクションである。患者の疾患進行の経時変化の時間経過表現であり、治療、観察および試料採取時点を示す。テロメラーゼ逆転写酵素（TERT）のコアプロモーターにおけるPT0001からの配列決定読み取りのパイルアップビューのパネルである。4つのパネル（上から下へ）：白血球由来ゲノムDNA配列決定、時点1でのcfDNA配列決定、cfDNA時点2配列決定、および腫瘍生検配列決定。垂直破線の間のAという文字は、既知の活性化C>T変異の突然変異対立遺伝子コピーの逆相補を表す。図１９Ａのデータを要約した表であり、表示の試料についてのchr5：129,250での読み取りカウントを示す。結腸直腸がん患者情報およびcfDNA分析から予測される疾患再発の要約表を提供する。結腸直腸がん患者情報およびcfDNA分析から予測される疾患再発の要約表を提供する。結腸直腸がん患者情報およびcfDNA分析から予測される疾患再発の要約表を提供する。

本発明の方法は、患者のさまざまな腫瘍内／腫瘍間反応を見逃すことを防ぎ、微小残存病変および／または治療応答を検出する能力を改善することが可能となり得るように、複数の体細胞変異を縦断的に追跡することを含む。これは、突然変異シグネチャーもしくはシグネチャーの構築および／または患者から得られた核酸から決定されたテロメア完全性スコアの作成によって達成することができ、両方とも縦断的に追跡することができる。

この方法はまず、例えば、がん関連遺伝子もしくは遺伝子産物を含むと思われる組織または体液などの試料を得ることを含む。試料は、任意の臨床的に許容される方法で採取してもよい。組織は、例えば、皮膚組織、毛髪、爪、子宮内膜組織、鼻腔組織、CNS組織、神経組織、眼組織、肝臓組織、腎臓組織、胎盤組織、乳腺組織、胎盤組織、胃腸組織、筋骨格組織、泌尿生殖器組織、骨髄などの連結細胞および／または細胞外マトリックス物質の塊であり、例えば、ヒトまたは他の哺乳動物に由来し、細胞および／または組織に結合する結合物質および液体物質を含む。組織は、例えば、限定されないが、ホルマリン固定パラフィン包埋（FFPE）および新鮮凍結（FF）組織試料など、当該技術分野で知られている組織試料タイプのいずれか1つとして調製および提供され得る。

体液は、例えば、ヒトまたは他の哺乳動物に由来する液体物質である。そのような体液には、限定するものではないが、粘液、血液、血漿、血清、血清誘導物、胆汁、母体血液、痰、唾液、汗、涙、喀痰、羊水、月経液、尿、および脳脊髄液（CSF）、例えば腰椎または脳室CSFが挙げられる。試料は、細針吸引または生検組織であってもよい。試料は、細胞または生体物質を含有する培地であってもよい。試料は、血餅、例えば、血清が除去された後に全血から得られた血餅であってもよい。試料は、糞便であってもよい。特定の実施形態では、試料は全血で採取される。一態様では、血漿、赤血球、白血球、および血小板などの全血の一部のみが使用される。

試料は、試料が採取された被検体由来の核酸だけでなく、ウイルスDNA／RNAなどの他の種由来の核酸も含むことができる。核酸は、当該技術分野で知られている方法に従って試料から抽出することができる。例えば、その内容全体が参照により本明細書に援用される非特許文献８を参照。特定の実施形態では、細胞遊離核酸が試料から抽出される。

いくつかの実施形態では、細胞遊離DNA（cfDNA）が試料から抽出される。細胞遊離DNAは、いくつかの体液（例えば、血漿、糞便、尿）中に存在する短塩基核由来DNA断片である。例えば、非特許文献９；非特許文献１０；および非特許文献１１を参照。腫瘍由来循環腫瘍DNA（ctDNA）は、いくつかの実施形態では約50%にまで変動するcfDNAの少数集団を構成する。いくつかの実施形態では、ctDNAは、腫瘍ステージおよび腫瘍タイプによって異なる。いくつかの実施形態では、ctDNAは約0.001%〜約30%、例えば約0.01%〜約20%、例えば約0.01%〜約10%まで変動する。ctDNAの共変量は完全には理解されていないが、腫瘍タイプ、腫瘍の大きさ、および腫瘍ステージと正の相関があると思われる。例えば、非特許文献１２；非特許文献１３。cfDNAにおけるctDNAの少数集団に関連する課題にもかかわらず、腫瘍変異は、ctDNAにおいて広範囲のがんにわたって同定されている。例えば、非特許文献１２。さらに、cfDNA対腫瘍生検の分析は侵襲性が低く、分析方法、例えば配列決定は、サブクローン異質性の同定を可能にする。cfDNAの分析は、図２に示すように、組織腫瘍生検よりも均一なゲノムワイド配列決定被覆率も提供する。

血液から核酸を調製する例示的な手順が続く。血液は、10mlのEDTAチューブ（例えば、Becton Dickinsonから入手可能）中に集めることができる。StreckのcfDNAチューブ（Streck社、オマハ、ネブラスカ州）を使用して有核細胞の化学的固定によりコンタミネーションを最小限に抑えることができるが、いくつかの実施形態のように試料を2時間以内に処理すれば、ゲノムDNAからのコンタミネーションはほとんど観察されない。血液試料から始めて、室温で10分間、ブレーキなしで、3000rpmでの遠心分離によって血漿を抽出することができる。次いで、血漿を1.5mlチューブに1mlアリコートで移し、室温で10分間、7000rpmで再度遠心分離してもよい。上清を新しい1.5mlチューブに移すことができる。この段階で、試料を-80℃で保存することができる。特定の実施形態では、血漿は抽出cfDNAを保存するよりも安定であり得るため、後の処理のために、試料を血漿段階で保存することができる。

血漿DNAは、任意の適切な技法を用いて抽出することができる。例えば、いくつかの実施形態では、1つ以上の市販のアッセイ、例えば、Qiagen QIAmp Circulating Nucleic Acidキット（Qiagen N.V.、フェンロー、オランダ）を用いて血漿DNAを抽出することができる。特定の実施形態では、以下の改良溶出戦略を使用することができる。DNAは、Qiagen QIAmp Circulating Nucleic Acidキットを使用して、製造者の指示に従って抽出することができる（カラムあたりの最大血漿量は5mlである）。血液をStreckチューブに集めた血漿からcfDNAを抽出する場合、プロテイナーゼKとの反応時間を30分から60分へと2倍にしてもよい。好ましくは、可能な限り大きな容積を使用すべきである（すなわち、5mL）。様々な実施形態では、二工程溶出を使用して、cfDNA収量を最大にすることができる。第1に、30μlの緩衝液AVEを各カラムについて用い、DNAを溶出させることができる。cfDNA濃度を増加させるために、膜を完全に覆うのに必要な最小量の緩衝液を溶出に使用することができる。少量の緩衝液で希釈を減少させることにより、試料の下流の乾燥を避け、二本鎖DNAの融解または材料の無駄を防ぐことができる。その後、カラムごとに約30μlの緩衝液を溶出することができる。いくつかの実施形態では、第2溶出を用いてDNA収量を増加させることができる。

特定の実施形態では、ゲノム試料を被験体から採取し、その後、対象の遺伝子領域または遺伝子断片を濃縮する。例えば、いくつかの実施形態では、対象のがん関連遺伝子または遺伝子断片を含むヌクレオチドアレイへのハイブリダイゼーションによって、試料を濃縮することができる。いくつかの実施形態では、ハイブリダイゼーションキャプチャーなどの当該技術分野で知られている他の方法を用いて、対象の遺伝子（例えば、がん関連遺伝子）について試料を濃縮することができる。例えば、その内容全体が参照により本明細書に援用されるLapidus（特許文献２）を参照。あるハイブリッドキャプチャー法では、ビオチン化オリゴヌクレオチドおよびストレプトアビジン被覆磁性ビーズの使用を含む溶液ベースハイブリダイゼーション法が使用される。例えば、非特許文献１４；および非特許文献１５を参照。

本発明の方法による試料からの核酸の単離は、当該技術分野で知られている任意の方法に従って行うことができる。例えば、細胞の溶解およびそこに含有されるタンパク質の変性を伴う手順によって、RNAを真核細胞から単離することができる。対象の組織には、配偶子細胞、生殖腺組織、子宮内膜組織、受精した胚、および胎盤が含まれる。RNAは、対象の流体から、そこに含まれるタンパク質の変性を伴う手順によって単離することができる。対象の流体には、上記の流体が含まれる。追加の工程を用いてDNAを除去することができる。細胞溶解は、非イオン性界面活性剤を用いて行い、続いて微量遠心分離によって、核、したがって細胞DNAの大部分を除去することができる。一実施形態では、チオシアン酸グアニジニウム溶解、続いてCsCl遠心分離を使用して、種々のタイプの細胞からRNAを抽出し、RNAをDNAから分離する（非特許文献１６）。ポリ（A）+ RNAは、オリゴdTセルロースでの選択によって選択される（非特許文献１７を参照）。あるいは、RNAのDNAからの分離は、例えば、熱フェノールまたはフェノール／クロロホルム／イソアミルアルコールを用いた有機抽出によって達成することができる。所望であれば、RNAse阻害剤を溶解緩衝液に添加することができる。同様に、特定の細胞型では、タンパク質変性／消化工程をプロトコルに加えることが望ましい場合がある。

核酸が抽出されたら、アッセイをして遺伝的変異を決定することができる。本明細書において交換可能に使用される用語「変異」（「variants」、「variations」）および「突然変異」は、野生型または制御配列とは異なる遺伝子配列を指す。当該技術分野で知られている任意のアッセイを用いて、遺伝的変異の有無を判定することができる。核酸アレイ、増幅プライマー、ハイブリダイゼーションプローブを作製および使用するために採用される方法などの従来の方法を使用することができ、非特許文献１８；非特許文献１９；および非特許文献２０などの標準実験マニュアルで見ることができる。カスタム核酸アレイは、例えば、Affymetrix（サンタクララ、カリフォルニア州）、Applied Biosystems（フォスターシティ、カリフォルニア州）、およびAgilent Technologies（サンタクララ、カリフォルニア州）から市販されている。

本発明のいくつかの実施形態では、核酸中の変異（すなわち、突然変異）を検出するために、核酸を配列決定する。核酸は、複数の遺伝因子に由来する複数の核酸を含むことができる。配列変異を検出する方法は当該技術分野で知られており、当該技術分野で知られている任意の配列決定法、例えば、アンサンブル配列決定（コンセンサス配列決定は、PCR複製物にわたる配列決定／PCRエラーを統合することによって実施される）または単一分子配列決定によって、配列変異を検出することができる。

配列決定は、当該技術分野で知られている任意の方法によって行うことができる。DNA配列決定技術には、標識されたターミネーターまたはプライマーを用いる古典的なジデオキシ配列決定反応（Sanger法）、スラブまたはキャピラリーにおけるゲル分離、可逆的終止標識ヌクレオチドを用いる合成による配列決定、パイロシーケンシング、454配列決定、標識されたオリゴヌクレオチドプローブのライブラリーへの対立遺伝子特異的ハイブリダイゼーション、ライゲーション後の標識されたクローンのライブラリーへの対立遺伝子特異的ハイブリダイゼーションを用いた合成による配列決定、重合工程中の標識されたヌクレオチドの組み込みのリアルタイム監視、ポリニー配列決定、およびSOLiD配列決定が含まれる。分離された分子の配列決定は、ポリメラーゼまたはリガーゼを用いる逐次または単一伸長反応、ならびにプローブのライブラリーでの単一または逐次差次的ハイブリダイゼーションによって、より最近に実証された。

配列決定を実施する従来の方法の1つは、非特許文献２１に記載されているように、連鎖停止反応およびゲル分離によるものである。別の従来の配列決定方法は、核酸断片の化学的分解を伴う。非特許文献２２を参照。ハイブリダイゼーションによる配列決定に基づいた方法も開発されている。例えば、Harrisら（特許文献３）を参照。各参考文献の内容は、参照によりその全体が本明細書に援用される。

提供される本発明の方法において使用され得る配列決定技術には、例えば、Helicos True Single Molecule配列決定（tSMS）（非特許文献２３）が挙げられる。tSMSのさらなる説明は、例えば、Lapidusら（特許文献４）、Lapidusら（特許文献５）、Quakeら（特許文献６）、Harris（特許文献７）、Quakeら（特許文献８）、およびBraslavskyら（非特許文献２４）に示されており、これらの参考文献の各々の内容は、参照によりその全体が本明細書に援用される。

提供される本発明の方法において使用され得るDNA配列決定技術の別の例は、454配列決定（Roche）である（非特許文献２５）。提供される本発明の方法において使用され得るDNA配列決定技術の別の例は、SOLiD技術（Applied Biosystems）である。提供される本発明の方法において使用され得るDNA配列決定技術の別の例は、Ion Torrent配列決定（特許文献９、特許文献１０、特許文献１１、特許文献１２、特許文献１３、特許文献１４、特許文献１５、特許文献１６）、特許文献１７、特許文献１８、および特許文献１９）であり、これらの各々の内容は、参照によりその全体が本明細書に援用される。

いくつかの実施形態では、配列決定技術はIlluminaシーケンシングである。Illumina配列決定は、フォールドバックPCRおよびアンカープライマーを使用する、DNAの固体表面上での増幅に基づいている。ゲノムDNAは断片化され得るか、またはcfDNAの場合には、すでに短い断片のために断片化は必要ない。アダプターを断片の5'および3'末端に連結させる。フローセルチャネルの表面に付着しているDNA断片が伸長され、増幅される。断片は二本鎖になり、二本鎖分子は変性される。固相増幅とそれに続く変性の複数のサイクルは、フローセルの各チャネルにおいて同じ鋳型の一本鎖DNA分子の約1,000コピーの数百万個のクラスターを作り出すことができる。プライマー、DNAポリメラーゼおよび4つのフルオロフォア標識された可逆的に終結するヌクレオチドを使用して、配列決定を行う。ヌクレオチド取り込み後、レーザーを用いてフルオロフォアを励起し、画像を取得し、第1塩基の同一性を記録する。取り込まれた各塩基からの3'ターミネーターおよびフルオロフォアを除去し、取り込み、検出および同定工程を繰り返す。

提供される本発明の方法において使用され得る配列決定技術の別の例には、Pacific Biosciencesの一分子リアルタイム（SMRT）技術が含まれる。提供される本発明の方法において使用され得る配列決定技術のさらに別の例は、ナノアレイ配列決定（非特許文献２６）である。提供される本発明の方法において使用され得る配列決定技法の別の例は、化学感受性電界効果トランジスタ（chemFET）アレイを使用してDNAを配列決定することを伴う（例えば、特許文献９に記載されているように）。提供される本発明の方法において使用され得る配列決定技術の別の例は、電子顕微鏡を使用することを伴う（非特許文献２７）。

試料からの核酸が分解されるか、または最小限の量の核酸しか試料から得られない場合、配列決定に十分な量の核酸を得るために、PCRを核酸に実施することができる（例えば、その内容全体が参照により本明細書に援用される、Mullisらの特許文献２０を参照）。

遺伝的変異の潜在的配列と発生したそれらの配列との組み合わせは、相対的頻度に加えて、本質的に無限の組み合わせを可能にするが、変異を分類する枠組みを確立することにより、突然変異シグネチャーの構築が実用的になる。

いくつかの実施形態では、変異を単一時点で測定し、患者の突然変異シグネチャーを決定する。いくつかの実施形態では、変異を経時的に縦断的に追跡し、患者の縦断的突然変異シグネチャーの生成を容易にする。例えば、いくつかの実施形態では、2つ以上の試料を患者から経時的に収集することができ、収集された試料を使用して患者の縦断的突然変異シグネチャーを生成することができる。いくつかの実施形態では、第1試料は第1時点で収集され、第2試料は第2時点で収集される。研究により、cfDNAは、クリアランスの速度に応じて、約15分〜数時間に及ぶクリアランス時間を有し得ることが示された（非特許文献２８）。したがって、いくつかの実施形態では、第1時点および第2時点は、約30分など、約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、もしくは約24時間、約1、2、3、4、5、10、15、20、25もしくは約30日、または約1、2、3、4、5、6、7、8、9、10、11、もしくは12ヶ月、または約1、1.5、2、2.5、3、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、9.5、10、10.5、11、11.5、12、12.5、13、13.5、14、14.5、15、15.5、16、16.5、17、17.5、18、18.5、19、19.5、20、20.5、21、21.5、22、22.5、23、23.5、24、24.5または約25年など、約15分〜約25年に及ぶ時間の長さによって区切られる。

いくつかの実施形態では、第1時点は治療開始前であり、第2時点は治療開始後である。いくつかの実施形態では、第1時点は治療開始前であり、第2時点は治療完了後である。いくつかの実施形態では、第1時点は腫瘍切除手術前であり、第2時点は腫瘍切除手術後である。いくつかの実施形態では、第1時点は腫瘍切除手術前であり、第2時点は腫瘍切除手術の約5、10、15、20、25、または30日後である。いくつかの実施形態では、第1時点は腫瘍切除手術前であり、第2時点は腫瘍切除の約1、2、3、4、5、6、7、8、9、10、11または12ヶ月後である手術。いくつかの実施形態では、第1時点は腫瘍切除手術前であり、第2時点は腫瘍切除手術の約1、2、3、4、5、6、7、8、9、または約10年後である。

いくつかの実施形態では、治療の適用前後での突然変異シグネチャーの1つ以上の変化を使用して、突然変異シグネチャー分類に従って、治療により良くまたは悪く応答する患者集団を同定することができる。このように、経時的な突然変異シグネチャーの追跡を使用して、治療が無効である患者を同定し、および治療的介入の変化が必要な患者を同定することができる（例えば、異なる治療の適用が必要とされ得る）。

特定の実施形態では、縦断的突然変異シグネチャーは複数の異なる時点を含み、第1時点は治療開始前であり、複数の追加時点は治療後の特定の時間間隔、例えば、治療の約1、2、3、4、5、6、7、8、9、10、11または12ヶ月間後に収集される。いくつかの実施形態では、治療は治癒目的の腫瘍切除手術を含む。いくつかの実施形態では、治療は治療剤の投与を含む。いくつかの実施形態では、治療薬は抗がん治療剤である。

いくつかの実施形態では、縦断的突然変異シグネチャーは複数の異なる時点を含み、第1時点は治癒目的の腫瘍切除手術前であり、複数の追加時点は腫瘍切除術後の特定の時点、例えば、腫瘍切除手術の約1、2、3、4、5、6、7、8、9、10、11もしくは12ヶ月またはそれ以上後に、例えば、腫瘍切除手術の約1、2、3、4、5、6、7、8、9、または10年後に収集される。いくつかの実施形態では、縦断的突然変異シグネチャーは複数の異なる時点を含み、第1時点は抗がん治療剤の投与前であり、複数の追加時点は抗がん治療剤の投与後の特定の時点、例えば、抗がん治療剤の投与の約1、2、3、4、5、6、7、8、9、10、11もしくは12ヶ月またはそれ以上後に、例えば、抗がん治療剤の投与の約1、2、3、4、5、6、7、8、9、10、11もしくは12ヶ月またはそれ以上後に、例えば、抗がん治療剤の投与の約1、2、3、4、5、6、7、8、9、または10年後に収集される。

本方法の態様は、突然変異シグネチャーを経時的に無症候性患者から収集し、がんの早期発見を容易にするおよび／またはがんの発症に関連するリスクレベルを予測することを含む。いくつかの実施形態では、無症候性患者の複数の時点にわたって突然変異シグネチャーが構築される。突然変異シグネチャーを使用して、例えば、特定の遺伝子マーカー（例えば、BRCA生殖細胞系状態および体細胞状態）の状態、および／またはがんの有無（例えば、がんの有無と一致する体細胞突然変異シグネチャー）および／またはがんの分子分類（例えば、生殖細胞系状態決定と合わせた体細胞シグネチャー）を決定することによって、がんまたは疾患リスクを推定することができる。

本発明の実施形態による突然変異シグネチャーの構築に使用される変数には、観察された遺伝的変異または遺伝子変化の総数、変異が発生する配列関係、他の体細胞突然変異または生殖細胞ゲノムと比較した突然変異の発生率、遺伝子変化のタイプ、cfDNA断片の1つ以上の断片化パターン（例えば、cfDNA断片サイズ分布パターン、および／または断片開始点および終了点の位置）、クロマチン構造（例えば、オープン対クローズドクロマチン構造）メチル化状態、ならびに突然変異間距離（例えば、突然変異のクラスタリング）が含まれるが、これらに限定されない。

配列関係は、突然変異の周囲のヌクレオチドを指す。例えば、非特許文献２９を参照。変異が生じる配列関係を含めることにより、同じ置換を有するが異なる配列関係内の突然変異シグネチャーを区別することができる。例えば、UV損傷に関連する遺伝子シグネチャーは、トリプレット関係依存性（例えば、突然変異に対する置換およびヌクレオチド3'および5'）を有するC>T突然変異の増加した数を証明する。非特許文献３０を参照。いくつかの実施形態では、配列関係は、少なくとも1、2、3、4、5、6、7、8、9、10、もしくはそれ以上のヌクレオチドを、突然変異に対して3'および5'位のいずれかまたは両方に含むことができる。いくつかの実施形態では、配列関係は、少なくとも1つのヌクレオチド3'および少なくとも1つのヌクレオチド5'を突然変異に対して含む。いくつかの実施形態では、突然変異シグネチャーは、突然変異が生じる鎖を考慮に入れることができる。例えば、いくつかの実施形態では、突然変異は、非転写鎖に対して転写鎖においてより優勢であり得る。非特許文献３０の6ページを参照。

縦断的軌跡は、配列関係によって層別化された変化の進化として解析することができる。例えば、図３は、標的化可能な体細胞BRAF突然変異V600Rを有する転移性メラノーマ患者に適用された全ゲノム配列決定（WGS）を用いるcfDNA由来の動的メラノーマ突然変異シグネチャーを示す。WGSを用いて、突然変異を同定し、トリプレット関係（N_時点1 = 24377、N_時点2 = 35036）によって層別化した。第1パネルに示されるように、治療過程の前に第1時点で、次いで、第2パネルに示されるように、治療過程の後に第2時点で再度試料を採取し、WGSを用いて分析した（95%Cl、ブートストラッピング）。観察されたプロファイルは、非特許文献３０（本明細書に引用）によって報告されたタイプ2メラノーマと一致し、UV誘発性DNA損傷と適合する。プロファイルは、図３のC>Tカラムに示されるように、豊富なC>T変異を示す。次に、第3パネルに示されるように、時点間の相対的な頻度変化を計算し、星は有意な変化を表す（p<0.05、FET）。ご覧の通り、ベムラフェニブ（BRAFを標的とする）およびイピリムマブ（抗CTLA4チェックポイント阻害剤）での1年間の治療にわたり、メラノーマを明示する患者において、T>C突然変異の系統的かつ一貫した減少が観察される。この突然変異の相対頻度の系統的かつ一貫した変化は、患者におけるサブクローンおよび／または転移の間の潜在的な異なる応答を示唆する。例えば、参照によりその全体が本明細書に組み入れられる、2015年5月12日にロンドンで開催されたBioTrinity 2015会議で発表された非特許文献３１を参照。

さらに、突然変異の発生率は、がんの種類間およびがんの種類内でさえも大きなばらつきがある。例えば、特定の小児がんは、最も少ない変異に関連しており、突然変異を引き起こす慢性的なばく露に関連するがんは、最も多数の突然変異と関連している。例えば、非特許文献３０の221ページを参照。さらに、1つの突然変異の発生率は、ある種のがんにおいて他の体細胞突然変異に関して変動する。本明細書に記載の方法に従い、突然変異の発生率は、変異対立遺伝子頻度によって測定される。頻度または発生率は、その後、他の突然変異または生殖細胞系ゲノムと比較することができる（例えば、循環腫瘍DNA（ctDNA）対細胞遊離DNA（cfDNA）の比）。

変異対立遺伝子頻度は、集団中の特定の遺伝子座における対立遺伝子の相対頻度である。例えば、個体集団全体の対立遺伝子頻度を計算するためには、以下の方程式で表される、倍数性nのN個体の集団におけるi個の色体中の対立遺伝子の全ての出現と、集団全体の染色体コピーの総数の比を計算する：
対立遺伝子頻度= i/（nN）。

個体内の体細胞突然変異対立遺伝子の頻度に関して、頻度は、観察された突然変異対立遺伝子コピー（被除数）を、個体の非突然変異対立遺伝子コピーで割った商として計算される。いくつかの実施形態では、観察された頻度は、倍数性、ノイズ率、および／またはサブクローンの複雑性について補正することができる。

図５Ａ〜Ｋは、治療過程を通しての100個の体細胞突然変異の対立遺伝子頻度軌跡を示す。変異は、PGM（Life Tech）でのcfDNA試料のアンプリコンに基づく配列決定を用いて追跡した。遺伝子座は、階層的クラスタリング（ユークリッド距離）に基づいて、8つのクラスターのうちの1つに割り当てられた。ベムラフェニブ（x軸の上に位置する「治療」行の最初の2つの長方形）およびイピリムマブ（x軸の上に位置する「治療」行の3つめの長方形）の治療サイクルを、図５Ａ〜Ｋに示す。また、CT画像を用いて得られた前血管リンパ節（x軸の上に位置する「前血管LN」列）および気管傍リンパ節（x軸の上に位置する「気管傍LN」行）の腫瘍径も示される。ここで、体細胞突然変異の対立遺伝子頻度を追跡することにより、イピリムマブによる治療が効果がないことを早期に知ることは可能であっただろう。対立遺伝子頻度の増加は、3回目のCT画像スキャンの88日前に検出可能であった。変異対立遺伝子の頻度軌跡は、集約画像化されたリンパ節直径と高度に相関していた（ピアソン相関86%）。

さらに、遺伝的変異のタイプも、腫瘍の分類に寄与することになる。腫瘍を分類するのに使用され得る遺伝的変異の例には、限定されないが、テレモリック配列コピー数の状態（以下でさらに詳細に説明する）、一塩基多型（単数または複数）、染色体不安定性、転座、逆位、挿入、欠失、ヘテロ接合性の消失、増幅、カタエギス（小さいゲノム領域に局在する超変異；非特許文献３０を参照）、およびマイクロサテライト不安定性が含まれる。

観察された遺伝的変異に加えて、分類はまた、根本的なゲノム情報の異なる形質転換を提供する1つ以上の遺伝子産物バイオマーカーの決定を含むこともできる。バイオマーカーは、一般に、生物学的状態の指標として作用する分子を指す。いくつかの実施形態では、遺伝子産物は、RNA分子またはタンパク質であり得る。

本発明の実施形態によるタンパク質バイオマーカーは、発がん、血管形成、発達、分化、増殖、アポトーシス、造血、免疫およびホルモン応答、細胞シグナル伝達、ヌクレオチド機能、加水分解、細胞ホーミング、細胞周期および構造、急性期応答およびホルモン制御に関与するタンパク質を含むことができる。例えば、非特許文献３２を参照。FDAによって承認され、本発明に包含されるがんタンパク質バイオマーカーの例には、限定されないが、CEA（癌胎児性抗原）；Her-2/neu；膀胱腫瘍抗原；サイログロブリン；アルファ-フェトプロテイン；PSA；CA 125；CA19.9；CA 15.3；レプチン、プロラクチン、オステオポンチンおよびIGF-II；CD98、ファシン、sPIgR、および14-3-3η；トロポニンI、およびB型ナトリウム利尿ペプチドが含まれる。非特許文献３３を参照。

当該技術分野で知られている任意のアッセイを用いて、遺伝子産物を分析することができる。特定の実施形態では、アッセイは、遺伝子産物の量を決定し、その決定された量を参照と比較することを含む。一実施形態では、1つ以上のタンパク質バイオマーカーのレベルは、患者の試料から得られる。次いで、患者から得られたレベルは、既知の健康状態を有する患者の患者情報のデータベースと比較される。

遺伝子産物（例えば、RNAまたはタンパク質）のレベルを検出する方法は、当該技術分野で知られている。試料中のmRNA発現の定量化のための、当該技術分野で知られている一般的に使用される方法には、ノーザンブロッティングおよびin situハイブリダイゼーション（非特許文献３４、その内容全体が参照により本明細書に援用される）；RNAse保護アッセイ（非特許文献３５、その内容全体が参照により本明細書に援用される）；逆転写ポリメラーゼ連鎖反応（RT-PCR）などのPCRに基づく方法（非特許文献３６、その内容全体が参照により本明細書に援用される）が含まれるが、これらに限定されるものではない。あるいは、RNA二本鎖、DNA-RNAハイブリッド二本鎖、またはDNA-タンパク質二本鎖を含む特異的二本鎖を認識することができる抗体を使用することができる。遺伝子発現（例えば、RNAまたはタンパク質量）を測定するための当該技術分野で知られている他の方法は、Yeatmanら（特許文献２１）に示されており、その内容全体が参照により本明細書に援用される。

用語「差次的発現遺伝子」または「差次的遺伝子発現」は、正常または対照被験体におけるその発現と比較して、がんなどの疾患に罹患している被験体において発現が高レベルまたは低レベルに活性化される遺伝子を指す。これらの用語はまた、同じ疾患の異なる段階で発現がより高いまたはより低いレベルに活性化される遺伝子を含む。差次的発現遺伝子は、核酸レベルまたはタンパク質レベルで活性化または阻害され得るか、または選択的スプライシングを受けて異なるポリペプチド産物をもたらし得ることも理解される。そのような違いは、例えば、mRNAレベル、表面発現、分泌またはポリペプチドの他の分配の変化によって証明され得る。

差次的遺伝子発現には、2つ以上の遺伝子またはそれらの遺伝子産物間の発現の比較、または2つ以上の遺伝子もしくはそれらの遺伝子産物間の発現の比の比較、または同じ遺伝子の異なって処理された2つの産物の比較さえも含まれ、これらは正常な被験体と不妊症などの疾患に罹患している被験体との間で、または同じ疾患の様々な段階の間で異なる。差次的発現は、遺伝子またはその発現産物における時間的発現パターンまたは細胞発現パターンにおける定量的差異ならびに定性的差異の両方を含む。差次的遺伝子発現（発現の増加および減少）は、正常細胞における発現に対するパーセントまたは倍数変化に基づく。増加は、正常細胞における発現レベルに対して1、5、10、20、30、40、50、60、70、80、90、100、120、140、160、180、または200%の増加であり得る。あるいは、倍数増加は、正常細胞における発現レベルの1、1.5、2、2.5、3、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、9.5、または10倍の増加であり得る。減少は、正常細胞における発現レベルに対して1、5、10、20、30、40、50、55、60、65、70、75、80、82、84、86、88、90、92、94、96、98、99または100%の減少であり得る。

特定の実施形態では、逆転写酵素PCR（RT-PCR）を用いて遺伝子発現を測定する。RT-PCRは、異なる試料集団におけるmRNAレベルを比較して遺伝子発現のパターンを特徴づけるために、密接に関連するmRNAを識別するために、およびRNA構造を分析するために使用できる定量的方法である。

別の実施形態では、MassARRAYに基づく遺伝子発現プロファイリング法を用いて遺伝子発現を測定する。さらなる詳細については、例えば、非特許文献３７を参照。さらなるPCRに基づく技術には、例えば、差次的ディスプレイ（非特許文献３８）；増幅断片長多型（iAFLP）（非特許文献３９）；BeadArray（商標）技術（Illumina、サンディエゴ、カリフォルニア州；非特許文献４０；非特許文献４１）；市販のLuminex100 LabMAPシステムおよび複数の色分けされたマイクロスフェア（Luminex社、オースティン、テキサス州）を遺伝子発現の迅速アッセイで使用する、遺伝子発現の検出用のBeadArray（BADGE）（非特許文献４２）；ならびに高被覆率発現プロファイル（HiCEP）解析（非特許文献４３）に記載されている。これらの各々の内容は、その全体が参照により本明細書に援用される。

特定の実施形態では、差次的遺伝子発現も、マイクロアレイ技術を用いて同定または確認することができる。この方法では、対象のポリヌクレオチド配列（cDNAおよびオリゴヌクレオチドを含む）をマイクロチップ基材上にプレーティングまたは配置する。次いで、配置された配列は、対象の細胞または組織由来の特定のDNAプローブとハイブリダイズされる。マイクロアレイを作製し、遺伝子産物発現（例えば、RNAまたはタンパク質）を決定する方法は、Yeatmanら（特許文献２１）に示されており、その内容は参照によりその全体が本明細書に援用される。

あるいは、タンパク質レベルは、細胞ゲノムによってコードされる複数のタンパク質種に特異的な、固定化された、好ましくはモノクローナルの抗体を結合部位が含む抗体マイクロアレイを構築することによって決定され得る。好ましくは、対象のタンパク質のかなりの部分について抗体が存在する。モノクローナル抗体を作製するための方法はよく知られている（例えば、その全体があらゆる目的のために援用される非特許文献４４を参照）。

あるいは、多くの組織標本におけるマーカー遺伝子の転写物のレベルは、「組織アレイ」（非特許文献４５）を用いて特性評価されてもよい。組織アレイでは、複数の組織試料を同じマイクロアレイ上で評価する。このアレイは、RNAおよびタンパク質レベルのin situ検出を可能にする；連続したセクションで複数の試料を同時に解析することができる。

いくつかの実施形態では、遺伝子発現の連続分析（SAGE）を用いて遺伝子発現を測定する。さらなる詳細については、例えば非特許文献４６；および非特許文献４７を参照（これらの各々の内容は、その全体が参照により本明細書に援用される）。

いくつかの実施形態では、超並列シグネチャー配列決定（MPSS）を用いて遺伝子発現を測定する。例えば、非特許文献４８を参照。

免疫組織化学法も、本発明の遺伝子産物の発現レベルを検出するのに適している。したがって、各マーカーに特異的な抗体（モノクローナルまたはポリクローナル）または抗血清、例えばポリクローナル抗血清を用いて発現を検出する。抗体は、例えば、放射性標識、蛍光標識、ビオチンなどのハプテン標識、または西洋ワサビペルオキシダーゼもしくはアルカリホスファターゼなどの酵素による抗体自体の直接標識によって検出することができる。あるいは、非標識一次抗体は、抗血清、ポリクローナル抗血清または一次抗体に特異的なモノクローナル抗体を含む標識二次抗体と共に使用される。免疫組織化学プロトコルおよびキットは当該技術分野で知られており、市販されている。

特定の実施形態では、プロテオミクス手法を用いて遺伝子発現を測定する。プロテオームは、特定の時点において試料（例えば、組織、有機体または細胞培養物）中に存在するタンパク質の全体を指す。プロテオミクスには、とりわけ、試料中のタンパク質発現の全体的変化（発現プロテオミクスとも呼ばれる）の研究が含まれる。プロテオミクスは、典型的には、以下の工程を含む：（1）試料中の個々のタンパク質の2-Dゲル電気泳動（2-D PAGE）による分離；（2）ゲルから回収された個々のタンパク質の同定、例えば私の質量分析法またはN末端配列決定法；（3）バイオインフォマティクスを使用するデータの解析。プロテオミクス法は、遺伝子発現プロファイリングの他の方法に対する貴重な補充物であり、単独でまたは他の方法と組み合わせて使用され、本発明の予後マーカーの産物を検出することができる。

いくつかの実施形態では、質量分析（MS）分析は、単独でまたは他の方法（例えばイムノアッセイまたはRNA測定アッセイ）と組み合わせて使用され、生体試料中の本明細書に開示の1つ以上のバイオマーカーの存在および／または量を決定することができる。MALDI-TOF MSおよびESI-MSを含むMS分析を利用して生体試料中のバイオマーカーペプチドの存在および量を検出する方法は、当該技術分野で知られている。例えば、さらなる指針として、それらの各々の全体が参照により本明細書に援用される特許文献２２；特許文献２３；および特許文献２４を参照。

本発明の一態様では、本方法は、分類を助ける共変量として使用され得る患者情報の組み込みを含む。組み込まれ得る患者情報の非限定的な例には、以下が含まれる：年齢、性別、人種、民族性、家族病歴、体重、ボディマス指数、身長、以前のおよび／または重複感染（例えば、HPV、HCV、EBVおよびHHV-6）、潜在的な毒素への環境ばく露（単数または複数）（例えば、アスベストばく露、プラスチックからのBPAの摂取など）、アルコール摂取量、喫煙歴、コレステロール値、薬物使用（違法または合法）、睡眠パターン、食事、ストレス、および運動歴。

患者の情報は、当該技術分野で知られている任意の手段によって得ることができる。いくつかの実施形態では、患者情報は、患者が記入したアンケートから得ることができる。情報は、患者の病歴だけでなく、血縁者および他の家族の病歴からも得ることもできる。病歴情報は、電子カルテ、紙の医療記録、アンケートに含まれる病歴に関する一連の質問、またはそれらの組み合わせの分析によって得ることができる。いくつかの実施形態では、患者情報は、患者から採取した試料、患者の性的パートナー、患者の血縁者、またはそれらの組み合わせを分析することによって得ることができる。いくつかの実施形態では、試料は、ヒト組織または体液を含み得る。

いくつかの実施形態では、健康転帰を各患者について評価する。健康転帰には、疾患もしくは障害の1つ以上の診断、ならびに1つ以上の疾患もしくは障害の段階もしくは進行が含まれ得るか、または転帰は、そうでなければ患者が健康であるということであり得る。診断は、典型的には、医師／臨床医によって行われ、症候性、または臨床的、観察、および／または検査結果に基づくことができる。

本発明の方法のいくつかの実施形態によれば、図６に示すように、観察された遺伝子変化、バイオマーカーシグネチャー、患者共変量情報、および健康転帰を含む患者データは、様々な時点で収集することができる。このデータを使用し、患者の変異シグネチャー（例えば、図６に示す「分類シグネチャー」）を生成する。その後、突然変異のシグネチャーを、健康な個体および病気の個体のデータベースと比較し、その個体の健康状態を計算する。

時間をかけて患者を追跡するにつれ、計算された健康状態を、1つ以上のデータベースに従って、または患者の臨床情報に従って改善することができる。これにより、新しい病気シグネチャーを同定し、時間をかけて改善することができる。分類データベースは、追加された患者ごとに、および患者が時間をかけて追跡されるにつれて、1つ以上のデータベースの識別能力が向上するというネットワーク効果から恩恵を受ける。追加の各患者の分類シグネチャーおよび健康状態が経時的に改善されると、その情報を1つ以上のデータベースに入力することができ、分類データベース（単数または複数）の識別力が向上する。

図６に示すように、公開データベースから得られた情報、ならびに患者から直接観察された情報を含むデータベースから得られた情報に基づいて、分類シグネチャーを計算することができる。例えば、公開データベースから得られた情報を最初に使用し、健康な個体および病気の個体の両方の突然変異シグネチャーを決定することができる。これらのシグネチャーは、1つのデータベースに格納されるか、または個々のデータベースに格納され得る。遺伝子データおよび他の患者情報が、観察された、および／または患者から得られた場合（例えば、観察された遺伝的変異、タンパク質バイオマーカーレベル、臨床医が決定した健康転帰、および上記のような患者情報）、突然変異シグネチャーは、本発明の方法の実施形態に従って作製される。情報、データ、および突然変異シグネチャーは、別々の患者データベースまたは複数のデータベースに含めることができる。患者の突然変異シグネチャーを、患者データベース（単数または複数）から引き出し、健康な個体および病気の個体の突然変異シグネチャーのデータベース（単数または複数）と比較することができる。患者を、健康な個体または病気の個体のカテゴリーのいずれかに割り当てることができる。必要に応じて、シグネチャーが公開データベース情報から計算されたか、または患者から直接観察されたかに基づいて、シグネチャーを重み付けすることができる。時間の経過とともに、公開データベースおよび患者情報データベース（単数または複数）からの情報を使用し、健康な個体および病気の個体の突然変異シグネチャーの情報を与える。

いくつかの実施形態では、患者から直接得られた情報は、情報が得られる各時点でデータベース（単数または複数）に入力される。これらの入力を使用して、各時点での突然変異シグネチャーを分析し、ある期間にわたる健康な個体および病気の個体の1つ以上のデータベース（単数または複数）における突然変異シグネチャーと比較することができるように、縦断的軌跡、またはシグネチャーを構築し、患者の縦断的突然変異シグネチャーを決定する。さらに、ある時点の患者からの各観察値（単数または複数）を比較し、病気の個体および健康な個体の1つ以上のデータベースに追加することにより、患者および疾患状態の両方に対する縦断的シグネチャーを時間をかけて改善することができる。

いくつかの実施形態では、患者の計算される健康状態は、患者の突然変異シグネチャーを使用して、ならびにそのシグネチャーと健康な個体および病気の個体の突然変異シグネチャーのデータベース（単数または複数）との比較に基づいて決定することができる。上述したように、健康状態の計算は、医療従事者／臨床医によって様々な時点で決定される際に、患者の健康転帰を組み込むことができる。臨床医が決定した健康転帰、ならびに健康な個体および病気の個体の突然変異シグネチャーのデータベース（単数または複数）との比較の継続の両方が、患者の計算される健康状態を時間の経過と共に改善するのに役立つ。

本発明の方法による突然変異シグネチャーおよび患者の健康状態の改善は、腫瘍内および腫瘍間の異質性を含む疾患プロセスの早期検出、および／またはさもなければ当該技術分野で現在使用されている手段を使用して検出することができない治療後の微小残存病変の同定を可能にする。早期検出は、転移などのより進んだ段階で疾患を検出するのではなく、治癒手術および／または治療の機会を提供する点で重要である。

いくつかの実施形態では、本発明の方法を使用し、個体における老化プロセスを追跡することができる。突然変異は、個体が年をとるにつれて観察される；これらの突然変異は必ずしもガン性発達をもたらさない。患者の遺伝的変異、表現型形質および環境ばく露、バイオマーカーレベル、ならびに医師／臨床医が決定した健康転帰を追跡することにより、老化に関連する縦断的分類シグネチャー（例えば、体細胞負荷スコア）を構築および改善することができる。

上記のように、腫瘍は、部分的に、テロメア配列コピー数の状態などの遺伝子変化のタイプに基づいて分類することができる。テロメア配列コピー数の状態を単独で使用し、患者の診断および／または提案する療法を決定することもでき、またはその状態は、分類シグネチャーに関して上述したように、患者情報、遺伝子産物バイオマーカー、および健康転帰の1つ以上と組み合わせることができる。

テロメアは、染色体の末端を覆い、ゲノムの完全性の維持に重要なDNA配列および関連タンパク質の複雑な構造である。テロメアDNA配列は、生物間で異なる反復DNAモチーフからなる。ヒトでは、テロメアは典型的には3〜18キロベースの（TTAGGG）n縦列反復であり、細胞倍加で徐々に侵食される。テロメア配列の減少は、その細胞の細胞老化につながる。

リボヌクレオチド-タンパク質複合体であり、そのRNA成分を鋳型として使用してTTAGGG反復を染色体の3'DNA末端に付加する逆転写酵素活性を有するテロメラーゼによって、減少は補われる。テロメラーゼは、体細胞では通常発現しないが、幹細胞および不死化細胞に存在する。

テロメラーゼ逆転写酵素機能の再活性化は、腫瘍形成の基本的段階と考えられている（この酵素は、腫瘍細胞の85〜90%で過剰発現する）。例えば、非特許文献４９を参照。代替テロメア伸長などの他の形態のテロメア伸長も、がん患者において観察されている。その結果、テロメア縦列反復コピー数を疾患および老化のバイオマーカーとして使用することに多くの関心が集まっている。

テロメアの調節異常を検出するにはいくつかの方法がある。これらには、ポリメラーゼ連鎖反応（PCR）、制限酵素消化、放射性標識オリゴヌクレオチドのライゲーション、テロメラーゼ活性の直接検出、および免疫組織化学技術の使用が含まれる。近年、ゲノムDNAのWGSからテロメア長を推定する方法が説明されている。例えば、非特許文献５０；非特許文献５１；および非特許文献５２を参照。

しかしながら、上記の手法の全ては、縦断的研究に対して、横断的研究にのみ適用されているという点で限定されている。異なる疾患、障害および老化研究における横断的コホート研究からの文献には、多くの矛盾が存在する。さらに、記載の手法は、末梢血単核細胞（PBMC）からのゲノムDNAにのみ適用されている。そのような手法は、白血球系統におけるテロメア完全性のみを反映する。

対照的に、本発明の実施形態による方法は、時間をかけて患者の細胞遊離核酸（例えば、DNA、RNA）からテロメア長を推定する。テロメア長を推定するために細胞遊離核酸を使用することは、PBMCの使用によって生じるような、特定の集団だけでなく、個体の全組織にわたるコンセンサステロメアの完全性を反映する。

本発明の一実施形態によれば、cfDNAの配列決定から完全性スコアを計算することによって、細胞遊離DNA（cfDNA）からのテロメア完全性を推測する。cfDNAを配列決定する任意の適切な方法を、本発明の実施形態に従って使用することができる。例えば、WGSを用いてcfDNAを配列決定することができる。そのような方法は、PCR増幅バイアスおよびハイブリッドキャプチャーに対するGC含量の強い影響のために好まれ得る。あるいは、テロメア完全性スコアは、特定のテロメア配列（単数または複数）に関して濃縮されたcfDNAの配列決定（別名標的配列決定としても知られている）によって計算することができる。PCR増幅、ハイブリッドキャプチャー、テロメア配列に結合する小分子、G四重鎖シグネチャー、またはテロメア関連タンパク質に対する抗体を用いるChIP-seqを使用して、テロメア配列を濃縮することができる。

いくつかの実施形態では、その両方が参照によりその全体が本明細書に援用される非特許文献５０；および非特許文献５１に記載されているような、様々なアラインメント方法を用いて複数の配列を整列させることができる。特許文献５０および特許文献５１は両方とも、全ゲノム次世代シーケンシング（NGS）を使用して短い読み取りを生成する。特許文献５０では、テロメア長は、式l=t_kscを用いてTelSeqアルゴリズムによって計算され、ここで、lは平均テロメア長であり、t_kはテロメア読み取り量であり、sはGC組成が48%〜52%の全ての読み取りの比であり、cはゲノム長をテロメア端の数で割った定数である。特許文献５０の2ページ。特許文献５１では、短い読み取り値をコンピューターアルゴリズムの入力として使用し、ユーザー定義のテロメア繰り返しパターンと読み取り長に基づいて構築したテロメアインデックスにマッピングする。次に、コンピューターアルゴリズムは、テロメアおよび参照ゲノム被覆率の比、染色体数、および読み取り長さに基づいて、平均テロメア長を計算する。特許文献５１の2〜4ページおよび特許文献５１の図１を参照。

当該技術分野で知られているテロメア配列を同定する他の方法も、本発明の方法を実施する際に使用できることも理解されるべきである。これらには、de-novoアセンブリ法からのk-mer頻度の分析が含まれるが、これに限定されない。例えば、その両方の全体が本明細書に援用される非特許文献５３；および非特許文献５３を参照。上記の方法のいずれかを使用して、テロメア特異的縦列反復について（直接的にまたは間接的に）配列読み取りを調べることができる。

いくつかの実施形態では、テロメア頻度を各個体について正規化することができる。一実施形態では、テロメア特異的縦列反復配列と同じ割合の個々のヌクレオチドを有する制御配列の頻度を使用して、頻度を正規化する。例えば、TTAGGG縦列反復の頻度は、TTAGGG縦列反復において同じA、C、G、およびT比率を有するが、並べ替えられた配列を有する制御配列の頻度を用いて正規化することができる。いくつかの実施形態では、頻度は、決定された頻度分布を頻度分布の参照データベースと比較することによって正規化することができる。それぞれの場合において、対照は、観察されたテロメア頻度と比較することができ、DNAの投入量の変動を考慮することができる基準頻度を提供する。

いくつかの実施形態では、テロメア特異的縦列反復配列が決定されると、完全性スコアを作成することができる。完全性スコアは、反復長さの関数としてテロメア縦列反復配列の頻度分布を含むことができる。上記の分類シグネチャーと同様に、層別化は、配列関係によって、例えば、各染色体アーム上のテロメアに隣接する配列を同定することによって行うことができる。任意の時点におけるこの分布のトポロジー、または時点間のその変化を、同定特徴として使用することができる。図７は、メラノーマがん患者からの反復テロメア配列を含むcfDNAからの全ゲノム配列決定読み取り数の経験的分布を示す。矢印で示される治療中の2つの時点が提示される。各時点について、各配列決定レーンについて読み取り数が計算される。

上記の分類シグネチャーと同様に、各患者のテロメア完全性スコアから縦断的軌跡を構築することもできる。次いで、この軌跡を、既知の健康状態を有する患者の1つ以上のデータベースに含まれる縦断的軌跡と比較して、診断および潜在的な治療を決定することができる。さらに、分類シグネチャーに関して上述したように、患者情報、遺伝子産物バイオマーカー、および健康転帰を完全性スコアと統合することもできる。

患者から得られ、例えば共変量として使用され得る情報には、年齢、性別、人種、民族性、家族病歴、体重、ボディマス指数、身長、以前のおよび／または重複感染（例えば、HPV、HCV、EBVおよびHHV-6）、潜在的な毒素への環境ばく露（例えば、アスベストばく露、プラスチックからのBPAの摂取など）、アルコール摂取量、喫煙歴、コレステロール値、薬物使用（違法または合法）、睡眠パターン、食事、ストレス、および運動歴が含まれ得るが、これらに限定されない。次いで、この情報を、既知の健康状態を有する患者の1つ以上のデータベースと比較することができる。

他の共変量には、投入ヌクレオチド質量およびアッセイダイナミックレンジが含まれ得るが、これらに限定されない。代替的にまたは付加的に、患者のTERTプロモーター突然変異プロファイルなどの患者の遺伝的背景を共変量として含めることができる。

本発明の方法による遺伝子産物バイオマーカーには、タンパク質発現レベルを含むことができる。好ましいタンパク質の例は、テロメラーゼタンパク質である。バイオマーカーのレベルは、上記のように、当該技術分野で知られている任意のアッセイ方法に従って患者から得ることができる。得られたレベルは、既知の健康状態を有する患者のデータベースと比較することができる。

本明細書に記載された本発明の態様は、コンピューターなどの、プロセッサー、例えば中央処理装置、または各装置が過程もしくは方法の少なくとも一部を実行するコンピューティング装置の任意の組み合わせを含む任意のタイプのコンピューティング装置を使用して実行することができる。いくつかの実施形態では、本明細書で説明されるシステムおよび方法は、携帯端末、例えば、スマートタブレット、スマートフォン、またはシステム用に製造された特殊装置で実行されてもよい。

本発明の方法は、ソフトウェア、ハードウェア、ファームウェア、ハード配線、またはこれらの任意の組み合わせを使用して実行することができる。機能を実装する機構は、物理的に様々な位置に配置することもでき、機能の一部が異なる物理的位置に実装されるように分散されることを含む（例えば、ある部屋にある画像化装置と別の部屋または別の建物にあるホストワークステーション、例えば無線または有線接続）。

コンピュータープログラムの実行に適したプロセッサーは、一例として、汎用マイクロプロセッサーおよび専用マイクロプロセッサーの両方、ならびに任意の種類のデジタルコンピューターの任意の1つ以上のプロセッサーを含む。一般に、プロセッサーは、読み出し専用メモリまたはランダムアクセスメモリまたはその両方から命令およびデータを受信する。コンピューターの必須要素は、命令を実行するためのプロセッサーと、命令およびデータを格納するための1つ以上のメモリ装置である。一般に、コンピューターは、磁気、光磁気ディスク、または光ディスクなどのデータを格納するための1つ以上の大容量記憶装置を含むか、またはそれらに動作可能に結合されてデータを受け取り、もしくはそれらにデータを転送するか、またはその両方を行う。コンピュータープログラム命令およびデータを具現化するのに適した情報担体は全ての形態の不揮発性メモリを含み、一例としては、半導体メモリ装置（例えばEPROM、EEPROM、ソリッドステートドライブ（SSD）およびフラッシュメモリ装置）；磁気ディスク（例えば、内蔵ハードディスクまたはリムーバブルディスク）；光磁気ディスク；ならびに光ディスク（例えば、CDおよびDVDディスク）が含まれる。プロセッサーおよびメモリは、専用論理回路によって補完され得るか、専用論理回路に組み込まれ得る。

ユーザーとやりとりをするために、本明細書に記載の主題は、I/O装置、例えば、ユーザーに情報を表示するためのCRT、LCD、LED、または投射装置、ならびにキーボードおよびポインティングデバイス（例えば、マウスもしくはトラックボール）などの入力または出力デバイスを有するコンピューター上で実施することができ、これらによりユーザーはコンピューターに入力することができる。他の種類の装置を使用して、ユーザーとのやりとりを提供することもできる。例えば、ユーザーに提供されるフィードバックは、任意の形態の感覚フィードバック（例えば、視覚フィードバック、聴覚フィードバック、または触覚フィードバック）であってもよく、ユーザーからの入力は、音響、音声、または触覚入力を含む任意の形態で受信することができる。

本明細書に記載の主題は、バックエンドコンポーネント（例えば、データサーバー）、ミドルウェアコンポーネント（例えば、アプリケーションサーバー）、またはフロントエンドコンポーネント（例えば、グラフィカルユーザーインターフェースもしくはユーザーが本明細書に記載の主題の実装とやりとりすることができるウェブブラウザを有するクライアントコンピューター）、またはそのようなバックエンド、ミドルウェア、およびフロントエンドコンポーネントの任意の組み合わせを含むコンピューティングシステムにおいて実施され得る。システムのコンポーネントは、任意の形式または媒体のデジタルデータ通信、例えば、通信ネットワークによってネットワークを介して相互接続することができる。例えば、データの基準セットは遠隔地に格納され、コンピューターはネットワークを介して通信して基準セットにアクセスし、女性被検体から導出されたデータを基準セットと比較する。しかしながら、他の実施形態では、基準セットはコンピューター内にローカルに格納され、コンピューターはCPU内の基準セットにアクセスし、被験体データを基準セットと比較する。通信ネットワークの例には、セルネットワーク（例えば、3Gまたは4G）、ローカルエリアネットワーク（LAN）、およびワイドエリアネットワーク（WAN）、例えばインターネットが含まれる。

本明細書に記載の主題は、情報担体に（例えば、非一時的なコンピューター可読媒体に）有形的に具体化された1つ以上のコンピュータープログラムなどの1つ以上のコンピュータープログラムプロダクトとして実現することができ、データ処理装置（例えば、プログラマブルプロセッサー、コンピューター、または複数のコンピューター）により実行されるか、またはそれらの動作を制御する。コンピュータープログラム（プログラム、ソフトウェア、ソフトウェアアプリケーション、アップ、マクロ、またはコードとしても知られている）は、コンパイル型またはインタプリタ型言語（例えば、C、C++、Perl）を含む任意の形式のプログラミング言語で記述することができ、スタンドアローンプログラムとして、またはコンピューティング環境で使用するのに適したモジュール、コンポーネント、サブルーチン、またはその他のユニットとして、任意の形式で展開できる。本発明のシステムおよび方法は、C、C++、Perl、Java、ActiveX、HTML5、Visual Basic、またはJavaScriptを含むが、これらに限定されない、当該技術分野で知られている任意の適切なプログラミング言語で書かれた命令を含むことができる。

コンピュータープログラムは必ずしもファイルに対応しているとは限らない。プログラムは、他のプログラムまたはデータを保持するファイルもしくはファイルの一部、問題のプログラム専用の単一ファイル、または複数の調整されたファイル（たとえば、1つ以上のモジュールを格納するファイル、サブプログラム、もしくはコードの一部）に格納することができる。コンピュータープログラムは、1つのコンピューター上で、または1つの場所の複数のコンピューター上で、または複数の場所に分散され、通信ネットワークによって相互接続されるコンピューター上で実行することができる。

ファイルは、例えば、ハードドライブ、SSD、CD、または他の有形の非一時的媒体に格納されたデジタルファイルであってもよい。ファイルは、ネットワークを介してある装置から別の装置に送信することができる（例えば、ネットワークインターフェースカード、モデム、無線カードなどを介して、サーバーからクライアントにパケットが送信されるなど）。

本発明によるファイルを書き込むことは、例えば、粒子を（例えば、正味電荷または双極子モーメントを持つものを、読み取り／書き込みヘッドによる磁化のパターンへ）追加、除去、または再配置することによって、有形の非一時的なコンピューター可読媒体を変換することを含み、このパターンは、ユーザーによって望まれる有用な客観的物理現象に関する情報の新しいコロケーションを表す。いくつかの実施形態では、書き込みは、有形の非一時的なコンピューター可読媒体における物質の物理的変形を含む（例えば、特定の光学特性で、光学的な読み取り／書き込み装置が、情報の新規で有用なコロケーションを読み取ることができるように、例えばCD-ROMを焼くこと）。いくつかの実施形態では、ファイルを書き込むことは、NANDフラッシュメモリ装置などの物理的フラッシュメモリ装置を変換し、フローティングゲートトランジスタからなるメモリセルのアレイ内の物理的要素を変換することによって情報を格納することを含む。ファイルを書き込む方法は当該技術分野においてよく知られており、例えば、手動で、またはプログラムによって自動的に、またはソフトウェアからの保存コマンドまたはプログラミング言語からの書き込みコマンドによって呼び出すことができる。

適切なコンピューティング装置は、典型的には、大容量メモリ、少なくとも1つのグラフィカルユーザーインターフェース、少なくとも1つの表示装置を含み、典型的には装置間の通信を含む。大容量メモリは、一種のコンピューター可読媒体、すなわちコンピューター記憶媒体を示す。コンピューター記憶媒体は、コンピューター可読命令、データ構造、プログラムモジュール、または他のデータなどの情報の記憶のための任意の方法または技術で実施される揮発性、不揮発性、取り外し可能、および固定の媒体を含むことができる。コンピューター記憶媒体の例には、RAM、ROM、EEPROM、フラッシュメモリ、または他のメモリ技術、CD-ROM、デジタル多用途ディスク（DVD）または他の光学記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置または他の磁気記憶装置、無線自動識別タグもしくはチップ、または所望の情報を格納するために使用することができ、コンピューティング装置によってアクセスすることができる任意の他の媒体が含まれる。

上述の機能は、ソフトウェア、ハードウェア、ファームウェア、ハード配線、またはこれらの任意の組み合わせを使用して実装することができる。ソフトウェアのいずれも様々な位置に物理的に配置することができ、機能の一部が異なる物理的位置に実装されるように分散されることを含む。

当業者であれば、本発明の方法の実行に必要または最も適していると認識するように、記載の本発明の方法の一部または全部を実施するコンピューターシステム501は、1つ以上のプロセッサー（例えば、中央処理装置（CPU）、グラフィックス処理ユニット（GPU）、またはその両方）、メインメモリおよびスタティックメモリを含み、それらはバスを介して互いに通信する。

図８は、本発明の実施形態によるシステム501の略図を提供する。システム501は、例えば、配列決定機器であってもよい分析装置503を含むことができる。装置503は、配列読み取りデータなどの結果データを得るためのデータ取得モジュール505を含む。装置503は、任意に、それ自体の、例えば専用の分析コンピューター533（入出力機構、1つ以上のプロセッサー、およびメモリを含む）を含むか、または動作可能に結合されてもよい。それに加えて、またはその代わりに、装置503は、ネットワーク509を介してサーバー513またはコンピューター549（例えば、ラップトップ、デスクトップ、もしくはタブレット）に動作可能に結合されてもよい。

コンピューター549は、1つ以上のプロセッサーおよびメモリならびに入力／出力機構を含む。本発明の方法がクライアント／サーバーアーキテクチャを採用する場合、本発明の方法の工程は、プロセッサーおよびメモリのうちの1つ以上を含み、データ、命令などを取得することができる、または結果を、インターフェイスモジュールを介して提供することができる、または結果をファイルとして提供することができるサーバー513を使用して実行されてもよい。サーバー513は、コンピューター549またはターミナル567によってネットワーク509に接続されてもよく、あるいは、サーバー513は、1つ以上のプロセッサーおよびメモリ、ならびに入力／出力機構を含むことができるターミナル567に直接接続されてもよい。

システム501において、各コンピューターは、メモリおよび少なくとも1つの入力／出力（I/O）機構に連結された少なくとも1つのプロセッサーを含むことが好ましい。

プロセッサーは、一般に、シングルコアまたはマルチコアチップなどのチップを含み、中央処理装置（CPU）を提供する。プロセスは、IntelまたはAMDのチップによって提供されてもよい。

メモリは、開示のコンピューターのうちのいずれか1つのプロセッサー（単数または複数）によって実行されると、本明細書に記載の方法または機能の一部もしくは全部を達成することができる1つ以上の命令セット（例えば、ソフトウェア）が格納される1つ以上の機械可読装置を含むことができる。ソフトウェアは、コンピューターシステムによるその実行中に、完全にまたは少なくとも部分的に、メインメモリ内および／またはプロセッサー内に存在することもできる。好ましくは、各コンピューターは、ソリッドステートドライブ、フラッシュドライブ、ディスクドライブ、ハードドライブなどの非一時的メモリを含む。

機械可読装置は、例示的な実施形態では単一の媒体であり得るが、用語「機械可読装置」は、1つ以上の命令セットおよび／またはデータを格納する単一媒体または複数媒体（例えば、集中型または分散型データベース、および／または関連するキャッシュおよびサーバー）を含むと取られるべきである。これらの用語は、機械による実行のための命令のセットを記憶、コード化、または保持することができ、機械に本発明の方法のうちの任意の1つ以上を実行させる任意の媒体（単数または複数）を含むものとする。したがって、これらの用語は、限定されないが、1つ以上のソリッドステートメモリ（例えば、加入者識別モジュール（SIM）カード、セキュアデジタルカード（SDカード）、マイクロSDカード、またはソリッドステートドライブSSD））、光学および磁気媒体、ならびに／または任意の他の有形の記憶媒体（単数または複数）を含むものとする。

本発明のコンピューターは、一般に、1つ以上のI/O装置、例えば、1つ以上のビデオディスプレイユニット（例えば、液晶ディスプレイ（LCD）またはブラウン管（CRT））、
英数字入力装置（例えば、キーボード）、カーソル制御装置（例えば、マウス）、ディスクドライブ装置、信号発生装置（例えば、スピーカ）、タッチスクリーン、加速度計、マイクロフォン、セルラー無線周波数アンテナ、および、例えばネットワークインターフェースカード（NIC）、Wi-Fiカード、またはセルラーモデムであり得るネットワークインターフェースデバイスなどを含む。

ソフトウェアのいずれも様々な位置に物理的に配置することができ、機能の一部が異なる物理的位置に実装されるように分散されることを含む。

さらに、本発明のシステムは、参照データを含むように提供することができる。任意の適切なゲノムデータを、システム内で使用するために保存することができる。例には、限定されないが、以下が含まれる：The Cancer Genome Atlas（TCGA）のがんの主要なタイプおよびサブタイプにおける主要なゲノム変化の包括的、多次元地図；国際がんゲノムコンソーシアム（ICGC）のゲノム異常カタログ；COSMICのがんにおける体細胞突然変異のカタログ；ヒトゲノムおよび他の一般的なモデル生物の最新の構築物；dbSNPの最新参照SNP；1000ゲノムプロジェクトおよびBroad Instituteの至適基準インデル；Illumina、Agilent、Nimblegen、およびIon Torrentのエクソームキャプチャキット注釈；転写注釈；パイプラインで実験するための小さなテストデータ（例えば、新規ユーザー用）。

いくつかの実施形態では、データは、システムに含まれるデータベース580のコンテキスト内で利用可能になる。リレーショナルデータベース、オブジェクト指向データベースなど、任意の適切なデータベース構造を使用することができる。いくつかの実施形態では、参照データは、「not-only SQL」（NoSQL）データベースなどのリレーショナルデータベースに格納される。特定の実施形態では、グラフデータベースが本発明のシステム内に含まれる。データベース580は1つのデータベースに限定されるものではなく；複数のデータベースをシステムに含めることができることも理解されるべきである。例えば、データベース580は、本発明の実施形態による、任意の整数のデータベースをそこに含む、2、3、4、5、6、7、8、9、10、15、20またはそれ以上のデータベースを含むことができる。例えば、1つのデータベースは公開参照データを含むことができ、第2データベースは、観察された遺伝的変異、遺伝子産物バイオマーカーレベル、患者の臨床的に評価された健康転帰および患者情報を含むことができ、第3データベースは健康な個体の変異シグネチャーを含むことができ、第4データベースは病気の個体の変異シグネチャーを含むことができる。別の実施形態では、観察された遺伝的変異、遺伝子産物バイオマーカーレベル、臨床的に評価された健康転帰および患者情報は、それぞれ別個のデータベースに含まれ得る。さらに別の実施形態では、健康な個体および病気の個体の変異シグネチャーは、1つのデータベースに含まれる。そこに含まれるデータに関するデータベースの任意の他の構成も、本明細書に記載の方法によって企図されることが理解されるべきである。

がんは、図１に概略的に示されているように、ゲノム変化の複雑な系統によって特徴付けられる疾患である。体細胞突然変異および体細胞組み換えのプロセスは、腫瘍細胞系統内で遺伝的多様性を生成する。これらの変化は、腫瘍の特異的で基本的なシグネチャー - 分子バーコードを表す。

いくつかの変化は原因となるものであり、腫瘍進行を促進するが、他の事象は機能的影響をほとんど与えず、パッセンジャー突然変異として知られている。変化の蓄積は、個々の患者における、および患者間の腫瘍内および／または腫瘍間の遺伝的異質性として観察される。遺伝的多様性は、治療抵抗性への重要な寄与因子であるが、宿主免疫応答の標的となりうる新抗原を生成することもできる。

体細胞の遺伝的異質性は、腫瘍分類において2つの課題を引き起こす：腫瘍は時間の経過とともに急速に進展する；2つ以上の個体において同じ組織に発生するにもかかわらず、異なる予後および治療応答を有し、遺伝的に異なる可能性がある。図１は、始原腫瘍細胞の系統を示す。祖先細胞は時間t0で生じ、細胞***中に遺伝的に異なるサブ集団（サブクローン）が生じ、ツリーに新しいブランチを加える。各サブクローンの相対的な集団サイズは、各ブランチの幅によって表される。時間が経つと、3つのサブクローンS（0、1）、S（0、2）、およびS（0、3）が生成し、各々はそれ自身の体細胞変異のセットによって区別される。復帰突然変異が起こらず、組み換えがない場合（組み換えはグラフを作る）、突然変異は、ネストされたツリーオブジェクト（例えばS（0、3）に含まれるS（0、1））として表すことができる。転移S（3、0）は、急速に増殖するサブクローンS（3、0）に由来する。S（0、2）の細胞数は減少し、対照的にS（0、1）では安定したままであり、S（0、3）では増加する。その結果、突然変異対立遺伝子の頻度は、サブクローンおよび健常組織内ならびにそれらの間でのその相対頻度の関数となる。バーコードの測定により、複数のサブクローンが生じた後にのみ生じる症状の発現前に腫瘍を検出することができる。

KRASまたはBRAF突然変異状態などの遺伝子検査は、治療選択において有用性を実証しており、例えば、描写された症例（PT0001、BRAF突然変異状態を使用してベムラフェニブ療法を選択した）などの症例において、チロシンキナーゼ阻害剤を使用するかどうかの判断の情報を与える。しかしながら、単一遺伝子座試験は、がんの遺伝的異質性を捕捉するには不十分であり、したがって、分類における有用性が限られている。いくつかの研究では、多領域配列決定を用いて異質性を評価したが、他の研究では、予め規定した突然変異を時間の経過に伴って追跡した。

本発明の態様は、患者の遺伝的変異の一部または全部を時間の経過とともにサンプリグすることによって腫瘍分類シグネチャーを構築する方法を含む。この縦断的シグネチャーを使用して、患者状態を、既知の健康な個体および病気の個体から収集されたシグネチャーのデータベースに対して分類することができる。追加の各患者のシグネチャーおよび健康状態が時間とともに改良されるにつれて、次の患者は、分類データベースの向上した識別能力から利益を得る（図６）。図６では、フローチャートは、仮定の患者の分類バーコードを生成するための観察された遺伝子変化、バイオマーカーシグネチャー、患者情報および健康転帰の変換を示す。いったん決定されると、分類バーコードを使用し、健康な個体および病気の個体のデータベースに従って健康状態を計算する。時間をかけて患者を追跡するにつれ、健康状態を、データベースに従って、および／または患者の臨床情報に従って改善することができる。これにより、新しい病気シグネチャーを同定し、時間をかけて改善することができる。分類データベースは、追加された患者ごとに、および患者が時間をかけて追跡されるにつれて、データベースの識別能力が向上するというネットワーク効果から恩恵を受ける。

実用的な意味では、潜在的な一連の変化とその発生順序の組み合わせの複雑さは、それらの相対的頻度によってさらに度合いを増し、無限である。したがって、抽象的表現の構築、すなわちバーコード軌跡は、以前に観察された症例と対象の患者とを比較することが要求される。

分類に使用され得る変数または特徴の非限定的な例には、以下が含まれる：観察された変異の総数；変異が発生する配列関係（例えば、UV損傷は、トリプレット関係依存性を有するC>T突然変異の増加したシグネチャーを有する（非特許文献３０））；他の体細胞突然変異、または生殖細胞ゲノムに対する突然変異の発生率（例えば、変異対立遺伝子頻度）（例えば、循環腫瘍DNAとcfDNAとの比）；遺伝子変化のタイプ；テロメア配列コピー数の状態；染色体不安定性；転座；逆位；挿入；欠失；ヘテロ接合性の消失；増幅；およびマイクロサテライト不安定性。

これらのゲノム変数は、タンパク質バイオマーカー、例えばCEA、またはRNAシグネチャーと組み合わせることができ、下にあるゲノム情報の異なる形質転換を提供する。観察されたシグネチャー軌跡、患者共変量（例えば、年齢、性別、喫煙歴）、および健康転帰（説明変数）のデータベースから、個体の腫瘍を分類し、その予後を推測し、潜在的な治療介入を推測することができる。

がんは、腫瘍内および腫瘍間の遺伝的異質性として現れる遺伝子異常の系列によって特徴付けられる。この多様性は、治療抵抗性の根底にあると同時に、がん免疫療法のためのネオエピトープ標的のリザーバを生成する。したがって、異質性の尺度を構築することは、患者ケアにおいて重要な有用性を有する。本発明の態様は、患者の異質シグネチャーを同定し、追跡することによって全体的な治療応答を監視する方法を含む。複数の体細胞変異を追跡することは、患者のさまざまな腫瘍内および／または腫瘍間反応を見逃すことを防ぐ助けとなり、微小残存病変または治療応答を検出する能力を改善する（図１０）。例えば、クラスタリングは、周波数領域法および／または時間領域法を用いて達成することができる。腫瘍異質性の臨床的影響は、1つの軌跡のみが追跡される場合、臨床医は部分的な応答を終了することができることである。しかし、描出された場合、患者は、手術後6ヶ月でのフォローアップ時に陰茎、肝臓および肺の転移を呈した。初期分類pT3 N0（0/14）M0 L0 V0 R0（ここで、「pT3」はステージ番号3の病理学的病期分類を示す；「N0」は、陽性リンパ節の数が（試験された14人のうち）ゼロであることを示す；「M0」はゼロ転移を示す；「L0」はリンパ管侵襲ゼロを示す；「R0」は切除後の残存腫瘍がないことを示す）。示された軌跡は、手術時の少なくとも1つの転移と適合し、その存在を実証する。残存腫瘍がなく、陽性リンパ節も転移もない残存腫瘍分類にもかかわらず。

さらに、軌跡は、配列関係によって層別化された変異の進展として分析することができる。図３は、患者からのcfDNAの全ゲノム配列決定（WGS）から得られた動的メラノーマ突然変異シグネチャーを示す。図３は、ベムラフェニブおよびイピリムマブでの1年間の治療期間にわたり、T>C突然変異の系統的かつ一貫した減少が観察されることを示し、患者におけるサブクローンおよび／または転移の間の潜在的な異なる応答を示唆する。図３は、トリプレット関係（N_時点1 = 24377、N_時点2 = 35036）によって層別化されたWGS-同定突然変異を示す。観察されたプロファイルは、非特許文献３０によって報告されたタイプ2プロファイルと一致し、UV誘発性DNA損傷と適合する（豊富なC>T、右上の挿入図を参照）。第1および第2パネルは、突然変異cfDNA WGS（ブートストラッピング、95%CI）を示す。第3パネルは、時点間の頻度の相対的変化を示し、星は有意な変化を表す（p<0.05、FET）。

本発明の態様は、cfDNA由来のテロメアモチーフコピー数を用いてがんを検出する方法を含む。テロメアは、染色体の末端を覆い、ゲノムの完全性の維持に重要なDNA配列および関連タンパク質の複雑な構造である。テロメアDNA配列は、生物間で異なる反復DNAモチーフからなる。ヒトでは、テロメアは典型的には3〜18キロベースの（TTAGGG）n縦列反復であり、細胞倍加で徐々に侵食される。テロメア配列の減少は、その細胞の細胞老化につながる。

リボヌクレオチド-タンパク質複合体であり、そのRNA成分を鋳型として使用してTTAGGG反復を染色体の3'DNA末端に付加する逆転写酵素活性を有するテロメラーゼによって、減少は補われる。テロメラーゼは、体細胞では通常発現しないが、幹細胞および不死化細胞に存在する。テロメラーゼ逆転写酵素機能の再活性化は、腫瘍形成の基本的段階と考えられている（この酵素は腫瘍細胞の85〜90%で過剰発現する）。代替テロメア伸長などの他の形態のテロメア伸長も観察されている。その結果、テロメア縦列反復コピー数を老化および疾患のバイオマーカーとして使用することに多くの関心が寄せられている。

テロメアの調節異常を検出するにはいくつかの方法があり、例えば、PCR、制限酵素消化、放射性標識オリゴヌクレオチドのライゲーション、テロメラーゼ活性の直接検出、および免疫組織化学技術を使用する。近年、ゲノムDNAのWGSからテロメア長を推定する方法が説明されている（非特許文献５０；非特許文献５１、両方とも上に記載）

しかし、上記の手法の全ては、a）横断的研究について記載されており、b）PBMCからのゲノムDNAに適用されており、白血球系統におけるテロメア完全性の反映に過ぎないという制限がある。異なる疾患、障害、および老化研究における横断的コホート研究からの文献には、多くの矛盾がある。cfDNAからのテロメア長の推定は、個体の全組織にわたるコンセンサステロメアの完全性を反映する。本発明の態様は、cfDNAの配列決定から推定テロメア完全性スコアを構築する方法を含む。いくつかの実施形態では、テロメア完全性スコアは、cfDNAの全ゲノム配列決定（WGS）から計算される。PCR増幅バイアスおよびハイブリッドキャプチャーに対するGC含量の強い影響のために、WGSはより正確な結果を提供することができる。いくつかの実施形態では、テロメア完全性スコアは、テロメア配列に関して濃縮されたcfDNAの配列決定（すなわち、標的配列決定）によって計算することができる。PCR増幅、選択可能なオリゴヌクレオチドを使用するハイブリッドキャプチャー（例えばビオチン化）を使用して、テロメア配列および／またはG四重鎖構造に結合する小分子使用して、またはテロメア関連タンパク質に対する抗体を用いるChIP-seqを使用して、テロメア配列を濃縮することができる。

いくつかの実施形態では、両方とも上に記載の特許文献５０または非特許文献５１に説明されているように、テロメア配列は、アラインメントに基づく方法を用いて、または当該技術分野で知られているde-novoアセンブリ法からのk-mer頻度の分析を介して同定することができる。どちらの場合も、テロメア特異的縦列反復について（直接的にまたは間接的に）配列決定読み取りを調べる。TTAGGG縦列反復において同じA、C、G、およびT比率を有するが、並べ替えられた配列を有する制御配列の頻度を用いて、またはゲノム中の特有のホモ接合座を標的とすることによって、テロメア頻度を個体ごとに正規化することができる。これらの対照は基準頻度を提供し、それに対してテロメア頻度を評価することができ、DNAの投入量の変動を考慮する。

本発明の態様は、各患者のテロメア完全性スコアの縦断的軌跡を構築する方法を含む。個体の軌跡を、既知の健康転帰を有する他の個人の参照データベースに対して分類することができる。完全性スコアは、各染色体アーム上のテロメアに隣接する同定配列によって潜在的に層別化された、反復長さの関数としてのテロメア縦列反復の頻度分布を含むことができる。任意の時点におけるこの分布のトポロジー、または時点間のその変化を、同定特徴として使用することができる。

好ましい一実施形態では、主題の方法は、患者の血漿試料からcfDNAを単離し、Illumina配列決定を用いてcfDNAの配列決定を行うことを含む。

（参照による援用）
特許、特許出願、特許刊行物、機関誌、書籍、論文、ウェブコンテンツなどの他の文書への参照および引用は、本開示全体にわたってなされている。そのような文献の全てが、あらゆる目的のためにその全体が参照により本明細書に援用される。

（等価物）
本明細書に示され、記載されたものに加えて、本発明の様々な変更および多くのさらなるそれらの実施形態は、本明細書に引用される科学文献および特許文献への言及を含めて、この文書の全内容から当業者に明らかになるであろう。本明細書の主題は、様々な実施形態およびその等価物において本発明の実施に適合させることができる重要な情報、例示および指針を含む。

以下の実施例は、例示のみを目的として提供され、決して本発明の範囲を限定するものではない。本開示ではいくつかの実施形態が提供されているが、開示のシステムおよび方法は、本開示の主旨または範囲から逸脱することなく多くの他の特定の形態で具体化され得ることを理解されたい。本実施例は、例示的であって限定的ではないと見なされるべきであり、その意図は、本明細書に示される詳細に限定されない。変更、置き換え、および修正の様々な例は、当業者によって確認可能であり、本明細書に開示の主旨および範囲から逸脱することなく行うことができる。

本明細書全体にわたって引用された全ての参考文献は、参照により明示的に本明細書に援用される。

（材料および方法）
下記の実施例では、以下の材料および方法を使用した。

設計：10人の結腸直腸がん患者の血液試料からのcfDNAを手術前後（表１に記載）に、腎がん患者1人（＃004）および乳がん患者1人（＃009）を配列決定した。患者の臨床情報を表１に報告する。

配列決定法：配列決定ライブラリーは、プロトコルSENTRYSEQバージョン1ごとに手術前後の血漿試料から単離した70ngのcfDNAから作製した。プロトコルは7段階からなる：血液からの血漿分離、血漿からのcfDNAの抽出、配列決定ライブラリー調製、品質管理チェック、PCR増幅、標的濃縮、および配列決定。段階が順に説明されている。

血液を10mLのEDTAチューブに集め、ゲノムDNAからのコンタミネーションを最小限に抑えるために、採血の2時間以内に試料を処理して血漿を分離した。遠心分離を用いて血漿を抽出した：最初に、血液を室温で10分間、ブレーキなしで、3000rpmで遠心分離した；次いで、血漿を1.5mLチューブに1mLアリコートで移し、室温で10分間、7000rpmで2回目の回転をかけた。その後、上清を新しい1.5mLチューブに移し、これは-80℃で保存することができる。溶出プロトコルに変更を加え、投入材料からのcfDNA収量を最大にして、Qiagen QIAmp Circulating Nucleic Acidキットを使用して細胞遊離DNAを抽出した。製造者の指示に従ってQiagen QIAmp Circulating Nucleic Acidキットを用い、cfDNAを抽出した（カラムあたりの最大血漿量は5mLである）。血液をStreckチューブに集めた血漿からcfDNAを抽出する場合、プロテイナーゼKとの反応時間を30分から60分へと2倍にした。十分な材料があれば、5mLの最大許容容量を充填した。次いで、プロトコルを二工程溶出に変更し、cfDNA収量を最大にした：第1に、30μlの緩衝液AVEを各カラムについて用い、DNAを溶出させる（公式プロトコル20〜150μL）。使用した緩衝液の量は、膜の完全な被覆を確保しながら溶出において最小化した。これは希釈を制限してcfDNA濃度を最大にし、二本鎖DNAの融解および／または材料の無駄を引き起こし得る試料の下流の乾燥の必要性を避ける。第2に、30μLの緩衝液AVEを各カラムについて溶出した。2回目の溶出は、表１に示すように、DNA収量を増加させる。溶出液中の最終DNA濃度を減少させることにより、追加の溶出のバランスをとる必要がある。その後、溶出を組み合わせる。Qubit DNA HSキットを使用して、抽出したDNAを3連で定量する。IlluminaのTruSeq Nanoキット（部品#15041110 Rev. B）をWGS用に変更する。供給業者が提供するIlluminaのTruSeq Nanoキットを使用してライブラリーを調製した。このキットは全ゲノム配列決定用に設計されているが、試薬の化学量論およびインキュベーション時間を変更し、プロセスを介して正確な配列決定アダプターライゲーション（ライブラリー変換効率）の分子数を増やした。cfDNAは既に断片化されているため（cfDNA集団の平均長は約167塩基であり、断片サイズの分布は個々によって異なる）、試料DNAの断片化（例えば、超音波処理）は行わなかった。cfDNAの無駄を最小限に抑えるため、末端修復前にSPRIビーズ洗浄工程を実施しない。これにより、エタノールがPCRに持ち越される危険性を排除する；エタノールはよく知られたPCRの阻害剤であり、SPRIビーズが亀裂を生じる前に全てのエタノール液滴を除去することは困難である。また、手間が少なくなる。TruSeq Nanoプロトコルで規定されている超音波処理されたゲノムDNA N_g由来の断片と比較して、cfDNA断片N_fの異なる数を考慮するために、係数Aによる試料中の推定DNA断片数に基づいて調整されたIllumina試薬量。末端修復、3'末端アデニル化、およびアダプターライゲーション工程で使用する試薬に適用される調整。集団iにおける分子の数N_iは、集団m_iの質量を、1つのジデオキシリボヌクレオチドの平均分子量（w = 6.5E + 11ng／モル）と各分子の平均塩基数L_iとの積で割り、この値にアボガドロ定数を掛けることによって計算されるN_i = m_i /（w×L_i）×N_A。調整係数Aは、N_fをN_gで割った商である、A = m_f/m_g×L_g/L_f。m_g = 100ngの投入DNAを指定し、L_g = 350塩基の断片長さに特定の超音波処理を行うIllumina TruSeq Nanoキットプロトコル。ペアエンド配列決定のためにライゲーションされた少なくとも2つのY字型Illumina配列決定アダプターを有するcfDNA断片の数を最大にするために、アダプターライゲーション反応時間を16時間に延長し、溶液中の分子の運動エネルギーを、16℃のより低いインキュベーション温度を用いて低下させた。

アダプターライゲーションは「スタッキング」をもたらし、PCR増幅後、複数のスタックされたアダプターは、立体障害を介して分子の各末端上の単一アダプターコピーに変換された。SPRI試料精製ビーズを、試料：ビーズの比が1：1.6、次いで1：1となるように使用して試料を洗浄し、これを最適化して遊離アダプターを除去した。ライブラリー調製の最終段階で、混合物を推奨容量27.5μlに溶出した。これでライブラリー調製工程が完了する。

次に、DNA集団の断片サイズ分布を、Bioanalyzer（または等価な）機器を用いて記録した。配列決定ライブラリーのPCR増幅前後のこの機器からの読み出しは、スタックアダプターが起こり、PCRによって効果的に分解され、「配列決定可能な」分子と呼ばれる、
ペアエンド配列決定と互換性のある分子のより高い収率がもたらされることを示す。断片サイズ測定では、1μlのcfDNAを投入し、ライブラリー調製前後の平均断片長を同定した。配列決定ライブラリー調製前のcfDNA分子長の分布は、平均長さμ_0が約150〜180塩基で、試料分散σ^2である正規分布X_前〜N（μ_前、σ^2）からのサンプリングとして近似することができる。ライブラリー調製後の分子長の分布X_後は、ライゲーションされた配列決定アダプターの数だけシフトした正規分布の重ね合わせとして近似することができ、各配列決定アダプターは固定長Aを持ち、それは通常、Illuminaプラットフォーム（P5およびP7アダプター）では60塩基である。配列決定され得る（配列決定可能な）分子は、cfDNA断片の各末端にライゲーションされた少なくとも1つのアダプターを有し、したがって平均μ_0、+kAを有し、ここでk≧2である。アダプターライゲーションの項で説明したように、ライブラリーをPCR増幅すると、ライゲーションされたアダプターの数kが少なくとも2の場合、配列決定可能な分子が生成される：X_後〜Σ_(k = 0)^4 Y_k×N（（μ_前 + kA）、σ^2）、k∈N_0、ここで、Y_kは、k個のライゲーションされたアダプターを持つ分子の寄与の重みである。P5およびP7 PCRプライマーを用いたPCR増幅の後、集団は、集団μ_前+ 2Aが多数となる。

次に、ライブラリーを定量する。ライブラリーの質量は、Kapa Library Quantification Kit（Kapa Biosystems）を用いて定量する。ライブラリー調製プロセスを通じたライブラリー収量の決定およびプロトコルのその後の工程用の反応量の計算には、定量化が重要である。Kapa HiFi Hotstart増幅（Kapa Biosystems、KR0370-v5.13）を増幅に使用した。GC含量全体にわたって堅固な性能を備えるハイフィディリティPCR酵素を使用する。Kapa HiFi Hotstartなどのハイフィディリティ酵素は、Taqと比べて100倍低いエラー率を示す。重複読み取りのレベルは、必要な配列決定の総量に影響する。シミュレーションエンジンを使用して特定の頻度で変異を検出する最適な過剰増幅係数を評価し、ライブラリー調製中の損失、誘発されたエラー、および呼び出しアルゴリズムの依存性を一緒に組み込んだ。アンサンブル内の基礎となる元の分子に対する読み取りの比は、過剰増幅因子と呼ばれた。1回の配列決定実行で解析できる試料の数を計算するには、次の式が適用される：（試料／実行）=?（読み取り／実行）÷（（＃ゲノム等価物／試料）×（パネルサイズ）×過剰増幅因子））／平均ライブラリー分子長」。これにより、各配列決定実行の効率的な使用が保証され、配列決定で表現されるアンサンブルの十分な読み取りを確実にする。PCR増幅は以下の通りである。所望の冗長性を達成するために必要とされるPCRサイクル数は、前のPCR実行に適合したモデルを用いて計算される。最初に、指数関数的モデルをcfDNAの既知投入量に合わせることにより、PCR効率を計算する。次に、推定されたパラメータを使用して、所望の過剰増幅（元の投入分子あたりの平均PCR複製数）を達成するのに必要な増幅の総数を計算する。20μlの各試料を次の8サイクルPCRに使用した：25μLのKAPA HiFi Mastermix 25uL、2.5uLの10uM順方向プライマー、2.5uLの10uM逆方向プライマー、20uLの鋳型DNA。

試料精製ビーズを1:1.6の比で使用して試料を洗浄し、22μLの容量に溶出した。1ulをBioanalyzerで実行し、3μLを使用し、ライブラリー濃度をqPCRにより3連で定量した。

次に、ハイブリダイゼーションキャプチャーによるプルダウンを行った。突然変異ホットスポットを、がんのタイプにわたって同定し、IDTのプロトコル（DNAプローブハイブリダイゼーションおよびターゲットキャプチャー、バージョン2.0）を使用してハイブリッドキャプチャー性能の決定因子のモデルと組み合わせて、カスタムハイブリッドキャプチャーパネルを設計した。ハイブリッドキャプチャーパネルの性能をさらに最適化するために、ハイブリッドキャプチャープローブの投入配列ライブラリーに対する化学量論比を最適化した。プローブの投入量を制限すると標的プルダウンが減少し、それによって特異性が増加するという仮説の下で、プローブの投入量を減少させた。捕捉は、ハイブリッドキャプチャープローブ濃度に対してかなり堅固であることが観察された。ハイブリッドキャプチャーのインキュベーション時間は、60℃のインキュベーション温度で4〜16時間であった。統合されたバイオインフォマティクスの最適化と反応条件の最適化は、80%の目標速度および1.6の均一性（配列決定された集団の95%に対する読み取りの配列決定深度の最大倍数変化として推定される）と共におよびそれらに対して47%の収率に増加した。各分子は約8コピーで表されているので、一貫した被覆均一性を考慮すると、平均して4コピーがパネルにわたって保持された。

ハイブリッドキャプチャー用のプロトコルを以下に示す：500ngの調製された配列決定ライブラリー、5ugのCot-1 DNAおよび1uLの各ユニバーサルオリゴをspeedvacで乾燥させた。DNAを融解させてしまうため、ライブラリーを乾燥させないことが不可欠である。チューブの内容物を2×7.5ulハイブリダイゼーション緩衝液、3uLハイブリダイゼーション成分および2.5uLヌクレアーゼフリー水に再懸濁する。再懸濁した材料をサーモサイクラー中、95℃で10分間インキュベートした。溶液に、3pmolのLockdown Xgenプローブ（IDT、カリフォルニア州）を加えた。ハイブリダイゼーション反応を60℃で16時間インキュベートした。標的をストレプトアビジンビーズに結合させるためのIDTプロトコルおよび洗浄工程に従った。各試料について、アリコートを採取し、qPCR、続いて20ulのライブラリーの12サイクルのPCRによって定量した（上記と同じ条件）。Agencourt Ampure XPビーズで洗浄を実施した。最終ライブラリーを22uLのIDTEに溶出する。次に1uLをBioanalyzerで実行し、サイズ分布を決定し、P5、P7プライマーを使用してqPCRにより3連で定量した。配列決定。試料を最初に2nMに希釈し、次いで600uL中19pMの最終濃度をHiSeqに投入した。これにより、HiSeq2500で最適なクラスター生成がもたらされる。しかし、所望のクラスター生成が850〜1000K/mm2であり、高速運転では得られない場合には、投入濃度を変えなければならない場合がある。
表１：Qiagen QIAmp Circulating Nucleic Acidキットの2回目の溶出によるcfDNA収量。6人のメラノーマ患者のcfDNA試料。溶出量は両方とも30uLのAVEであった。

このプロトコルは、PCR増幅を適用して元のcfDNA分子の複数のコピーを作製し、続いて標的ゲノム領域のプルダウン捕捉濃縮を利用するハイブリダイゼーションキャプチャー工程を行う。HiSeq2500装置（Illumina、カリフォルニア州）でHTモードにおいて、試料をペアエンド配列決定した。

配列決定データ：手術前後の試料を、「前」または「後」接尾辞を持つ数値試料IDによって識別する。FASTQファイルは、BaseSpaceからダウンロードした。読み取り値は、試料BWA（バージョン0.7.8）を使用して、ヒト参照ゲノム「1000 Genomes Human Reference Genome」、（ビルド37）と整列させた。アラインメントBAMは、Samtools（バージョン1.2）およびPicard（バージョン1.111）を使用して選別、統合、および索引付けした。配列決定要約統計は、Picard（バージョン1.111）を用いて生成した。候補の体細胞変異は、cfDNAのアライメントから呼び出した。9つの試料のリストとそれらの特徴を以下の表２に示す。
表２：試料のリスト。

（実施例１：患者ID番号034のcfDNA体細胞変異頻度軌跡を用いた疾患再発および転移の存在の検出）
結腸直腸がん（CRC）患者ID番号034は、治療目的で手術を受けた。手術前後の血液試料を収集し、その中のcfDNAを上記のように配列決定した。手術前の配列決定データにより、13の検出された体細胞変異が明らかになった。13の検出された体細胞変異全ての対立遺伝子頻度は、手術後の試料では検出不可能なレベルまで減少し、腫瘍の完全切除を示した。結果を図９に示す。図９は、手術前後の体細胞突然変異を含む読み取りの割合の変化を示す。それぞれの円およびつながっている線は、個々の体細胞突然変異を表している。機能的影響を計算的に推定した突然変異を有する遺伝子を同定する。1つの同定された突然変異はTGFBR2にあり、高い機能的影響があった。研究者らは、TGF-β受容体の不活性化が、ヒト結腸がん細胞がTGF-βに対する応答性を失うことになる機構であるかどうかを調べた。例えば、非特許文献５５を参照。結果は、TGFBR2遺伝子が、結腸がん細胞株のサブセットにおいて不活性化されたことを実証しており（「複製エラー陽性」を意味するRER+と呼ばれる）、マイクロサテライト不安定性を示すが、RER（-）細胞では示さない。

（実施例２：患者ID番号020のcfDNA体細胞変異頻度軌跡を用いた疾患再発および転移の存在の検出）
結腸直腸がん（CRC）患者ID番号020は、治癒目的で手術を受けた。手術前後の血液試料を収集し、その中のcfDNAを上記のように配列決定した。手術前配列決定データにより、複数の検出された体細胞変異体が明らかになった。しかし、手術後、検出された体細胞変異の対立遺伝子頻度は、検出不可能なレベルまで低下しなかった（患者034、実施例１とは対照的に）。結果を図１０に示す。図１０は、手術前後の体細胞突然変異を含む読み取りの数の変化を示す。それぞれの円およびつながっている線は、個々の体細胞突然変異を表している。機能的影響を計算的に推定した突然変異を有する遺伝子を同定する。

手術後9ヶ月で、続発性腫瘍が検出された。12ヶ月後、肝臓および肺の転移が検出された。図１０のグラフ上の軌跡は、原発腫瘍および転移がクローン的に均質であることを示し、それらが同じ体細胞変異の同じ対立遺伝子頻度を含むことを意味している。これらの結果は、cfDNA配列分析を使用して、患者内の複数の腫瘍をサンプリングする際に、所与の体細胞突然変異の軌跡を決定することの価値を実証する。この患者にとって、軌跡は残存疾患（微小残存病変）が依然として存在することを示した。

（実施例３：患者ID番号187のcfDNA体細胞変異頻度軌跡を用いた疾患再発および転移の存在の検出）
結腸直腸がん（CRC）患者ID番号187は、治療目的で手術を受けた。手術前後の血液試料を収集し、その中のcfDNAを上記のように配列決定した。患者187は、見逃された転移性結腸直腸がんにおける転移性発生の履歴を反映する手術前後の9つの体細胞変異について多様な軌跡応答を示した。結果を図１１に示す。図１１は、手術前後の体細胞突然変異を含む読み取りの数の変化を示す。それぞれの円およびつながっている線は、個々の体細胞突然変異を表している。機能的影響を計算的に推定した突然変異を有する遺伝子を同定する。

複数の異なる時点での病歴は、図１１の上部パネルに提供される。治療外科医は、治癒目的の手術前に転移を知らなかった。手術前cfDNA試料中の3つの対立遺伝子頻度クラスターは、3つの異なるがん細胞集団の存在を示す。手術後の対立遺伝子頻度の差異変化は、3つのクラスターが3つの異なる腫瘍集団から生じたことを確認した。図１１の右側のパネルのツリーは、時間とともに上から下に向かって進行する患者内のがん細胞の潜在的な基本的系統を表しており、ツリーの最も左の系統は外科的に切除された腫瘍を表している。PXDNLにおける祖先突然変異は、その頻度が中間系統の突然変異の頻度に近づくにつれて同定される。右端の系統は、切除された腫瘍と腫瘍変異を共有せず、そのため手術後も変化せず、残存疾患がまだ存在することを示している。

（実施例４：cfDNA試料中のマイクロサテライト不安定性（MSI））
lobSTRプログラム（非特許文献５６）を使用する、マイクロサテライト不安定性（MSI）を有する患者からのcfDNAの分析は、遺伝子座chr20:3,345,703（図１２、パネルB）における2つより多くの対立遺伝子の証拠を示し、MSIがcfDNAにおいて直接観察され得ることを実証している。対照的に、MSIを有さないがん患者からの試料（陰性対照）は、cfDNAにおけるMSIの証拠を示さない。図１２、パネルAの頻度の差異は、非参照反復要素の異なるハイブリダイゼーションキャプチャー効率によって引き起こすことができる。マイクロサテライト不安定性は、cfDNAの2つより多くの対立遺伝子に存在する短い縦列反復（STR）として同定される。

図１２、パネルAおよびBは、臨床試験を通じてMSIの証拠がない患者（図１２、パネルA）、および臨床試験を通じてMSIを確認した患者（図１２、パネルB）における、chr20:3,3345,703（ヒト参照B37）での（TGC）n反復対立遺伝子頻度の分布を示す。Y軸は、反復数の相対的変化を表す：反復数ゼロは、ヒトゲノム参照において観察されるのと同じ反復数を表し、対してゼロ未満の値は、コピー数の減少（欠失）を表し、ゼロより大きい値は、その遺伝子座における反復コピー数の相対的増加を表す。

図１３は、PCR増幅およびハイブリダイゼーションキャプチャー後の推測されたSTR反復数の増加した分散を例示するデータを示す。提示されたデータは、4つのcfDNA試料および末梢血単核細胞（PBMC）からのゲノムDNA試料からの配列決定データのSTRコピー数から推定される。パネルA：転移性メラノーマ患者からのcfDNAのPCRフリー全ゲノム配列決定（WGS）；パネルB：同じ転移性メラノーマ患者からのPBMCゲノムDNAのPCRフリーWGS；パネルC：健常ドナー"A" DNAに適用されたSENTRYSEQ（30ナノグラムの投入DNA）；パネルD：健常ドナー"B"に適用されたDNASENTRYSEQ（30ナノグラムの投入）；およびパネルE：健常ドナー"A"と健常ドナー"B"との1:1000の混合（20ナノグラムの投入）。

（実施例５：cfDNA断片サイズ分布の分析）
3つの配列決定ライブラリーを、HiSeq 2500装置で、2つのフローセルにまたがって高速ランモードで実行した。ライブラリーは、治療の開始前にがん患者ID番号009、031および045から得たcfDNA試料から調製した。SENTRYSEQライブラリー調製プロトコルでは、70ナノグラムの抽出cfDNAを使用した（上記の材料および方法の項を参照）。Qubit定量によって測定される濃度を、以下の表３に示す：
表３：試料から抽出されたcfDNAの量。

各試料をバイオアナライザー装置にかけ、cfDNAの断片サイズ分布を測定した。結果を図１４、パネルA、B、およびCに示し、塩基対における抽出cfDNAの断片サイズを示すバイオアナライザートレースを提供する。約167bpの特徴的なcfDNAピークが全ての試料に存在する；しかし、患者ID番号009からの試料は、より長い断片長からの寄与を有するように思われ、恐らく白血球ゲノムDNAからのコンタミネーションを示唆する。

末端修復およびA-テーリングを、SENTRYSEQプロトコルに記載されているように行った。アダプターのライゲーションを、16℃で16時間の修飾プロトコルを用いて行った。試料精製ビーズを、1:1.6の試料対ビーズ比、次いで再び1:1の比で用いて試料を洗浄した。次いで、試料を27.5μLの再懸濁緩衝液に溶出させた。各試料の1マイクロリットルをバイオアナライザー装置にかけ、cfDNAの断片サイズ分布を決定した。結果を図１５、パネルA、B、およびCに示し、PCR増幅前のライブラリー断片サイズを示すバイオアナライザートレースを提供する。観察された三峰性分布様式は、アダプタースタッキングと適合する（cfDNA断片長+（4×アダプター長））。

各試料について増幅を行った。各試料の20マイクロリットルを8サイクルPCR反応に用いた。反応成分を以下の表４に示す：
表４：8サイクルPCR反応混合物成分。

PCR反応後、試料精製ビーズを1:1.6の比で用いて試料を洗浄し、22μLの容量に溶出させた。次いで各試料の1マイクロリットルをバイオアナライザー装置にかけ、3μLの各試料を使用して、ライブラリー濃度を定量PCR（qPCR）により3連で定量した。結果を図１６、パネルA、B、およびCに示し、8サイクルのPCR増幅後のライブラリー断片サイズを示す。観察された三峰性分布様式は、断片長+（2×アダプター長）に移行した。これは、立体障害によるPCR中のデイジーチェーンされたy型配列決定アダプターの分解を示し、その結果、分子の各末端に1つのアダプターを有する配列決定適合性分子の大多数が得られる。8サイクルのPCR増幅後の各ライブラリーの濃度を以下の表５に示す：
表５：8サイクルのPCR増幅後のライブラリー濃度。

次いで、各ライブラリーについてプルダウンおよびハイブリダイゼーションを行った。各ライブラリーから500ngのcfDNA、50μgのCot-1 DNA、および1μLの各ユニバーサルオリゴをspeedvacで乾燥させた。各チューブの内容物を、2×7.5μLのハイブリダイゼーション緩衝液、3μLのハイブリダイゼーション成分、および2.5μLのヌクレアーゼフリー水に再懸濁した。再懸濁した材料を95℃で10分間、サーモサイクラーでインキュベートし、3ピコモルのLockdownプローブ（IDT、アイオワ州）を添加した。TCGAおよびCOSMICデータベース内の予想される患者突然変異の数を最大にするパネルセレクターを用いて、クロスフォールド検証および参照配列の唯一性の説明を用いて、200キロベースの標的領域を同定した。パネル最適化法は、グリーディ手法を用いて反復体細胞突然変異を同定する。第1に、体細胞変異呼出しは、外部および／または内部がんゲノムデータセットから得られる。第2に、ゲノム領域は、予測される濃縮性能のモデルに基づいて重み付けされる。第3に、グリーディ最適化は、特定の全パネルサイズおよび／または予め指定された関心領域または変異の制約の下で、観察されたデータにおける予想突然変異の総数を最大にするパネル領域を同定する。第4に、設計されたパネルを、クロスフォールド検証フレームワークで任意に評価し、観察された学習データへの過剰適合の予防を考慮する。これらおよび他の関連技術は、特許文献２５に記載されており、その開示は、参照によりその全体が本明細書に援用される。その後、これらの標的領域を覆うLockdownプローブを並べた。ハイブリダイゼーション混合物を60℃で16時間インキュベートし、次にIDTプロトコルを用いて標的をストレプトアビジンビーズに結合させ、結合していない標的を洗い流した。各試料について、アリコートを採取し、qPCRにより定量した。結果を以下の表６に示す。
表６：プルダウン後のライブラリー濃度。

次いで、各ライブラリーからの20μLの試料に対して、12サイクルのPCRを行った。洗浄は、標準的な手順に従ってAgencourt ampure XPビーズを用いて行った。最終ライブラリーを22μLのIDTEに溶出させ、各ライブラリーからの試料をバイオアナライザーにかけ、cfDNA断片サイズ分布を測定した。試料は、qPCRを用いて3連で定量した。結果を図１７、パネルAおよびBに示し、009および0131ライブラリーのcfDNA断片サイズ分布を示す。qPCRによって測定される最終ライブラリー濃度を以下の表７に示す：
表７：最終ライブラリー濃度。

各ライブラリー試料について配列決定を行った。試料を最初に2nMに希釈し、次いで最終濃度13.5pMに希釈した。次いで、600μLの各試料をHiSeq装置に投入した。望ましいクラスター生成は、高速運転で850〜1000K/mm²であった。観察されたクラスター生成は、両方のフローセルで120K/mm²と非常に低く、結果として運転を中止した。1つのフローセルを用い、および600μLの試料を20μMの濃度で用いて運転を繰り返した。この運転から、観察されたクラスター生成はレーン1およびレーン2でそれぞれ1031K/mm²および926K/mm²であった。これらの結果から、高速運転モードのHiSeq装置において濃度20pMの試料600μLが最適な結果をもたらしたことが判明した。

（実施例６：治療目的で外科的切除を受けている結腸直腸がん患者におけるがん再発の同定）
治癒目的で外科的切除を受けた15人の結腸直腸がん患者について、臨床情報を収集した。3人の患者が、試験期間内に再発を臨床的に確認した。10人の患者に、転移性がんが手術後に認められた。体細胞軌跡追跡を使用し、確認された再発症例および2つの追加の予測がん再発の両方を同定した。患者情報およびcfDNA分析から予測された再発を、図２０Ａ〜Ｃに示す。結果は、本発明の方法による体細胞軌跡追跡を使用して、疾患の再発および／またはMRDを検出できることを実証する。

（実施例７：メラノーマ進行のゲノムワイドcfDNA配列決定）
一人の転移性メラノーマ患者を、疾患進行の過程で追跡した。腫瘍の生検を疾患進行の早期に行い、ホルマリン固定パラフィン包埋（FFPE）試料を分析用に調製した。疾患が進行するにつれて、連続的な血漿収集およびCT画像化を行った。図１８は、患者の疾患進行の時間経過を示し、治療、観察および試料収集の時点を示す。

試料を分析し、cfDNAおよびFFPE試料の推定値を比較した。結果を図２に示す。FFPEブロックは広く使用されており、組織形態を保持するが核酸を損傷する。最も一般的なアーチファクトは、シトシン塩基の脱アミノ化によって引き起こされるC>T塩基置換および鎖切断である。C>Tの塩基置換は、体細胞点突然変異の誤ったシグナルを誘導するが、シトシン塩基の脱アミノ化は、鋳型分子のゲノムワイド被覆の分散を増加させる。この研究の結果は、cfDNA分析と比較して、被覆均一性がFFPE試料調製によって深刻な影響を受けることを示している。例えば、図２は、cfDNA WGSが、FFPE WGSと比較して非常に優れた配列決定均一性を有することを示す。被覆がゲノム全体にわたって完全に均一であれば、トレースは対角線をたどるであろう。対角線からの脱線は、不均一性を示す。

図３は、cfDNA WGSによって得られた動的メラノーマ突然変異シグネチャーを示す。トリプレット関係（N_時点1 = 24377、N_時点2 = 35036）によって層別化されたWGS-同定突然変異を示す。観察されたプロファイルは、非特許文献３０によって報告されたタイプ2プロファイルと一致し、UV誘発性DNA損傷と適合する（豊富なC>T）。第1および第2パネルは、突然変異cfDNA WGS（ブートストラッピング、95%CI）を示す。第3パネルは、時点間の頻度の相対的変化を示し、星は有意な変化を表す（p<0.05、FET）。図３は、メラノーマ突然変異シグネチャーの時間ベースの進行の一例を示す。

図１９は、テロメラーゼ逆転写酵素（TERT）のコアプロモーターにおけるC>T突然変異を活性化する転写を示す。突然変異は、ETS転写因子のコンセンサス結合部位を生成し、非特許文献５７に報告されたように、野生型プロモーター状態に対して2〜4倍増加した転写をもたらす。

図５Ａ〜Ｋは、治療過程を通しての100個の体細胞突然変異の対立遺伝子頻度軌跡を示す。変異は、PGM（Life Tech）でのcfDNA試料のアンプリコンに基づく配列決定によって追跡した。遺伝子座は、10の時点にわたって測定された変異対立遺伝子頻度（VAF）軌跡の階層的クラスタリング（ユークリッド距離）に基づいて、8つのクラスターのうちの1つに割り当てられた。当該技術分野で知られている代替の時系列クラスタリング手法を使用して、任意にクラスタリング手法における変異の機能注解を含むVAF軌跡をクラスタリングすることができる。ベムラフェニブ（x軸の上に位置する「治療」行の最初の2つの長方形）およびイピリムマブ（x軸の上に位置する「治療」行の3つめの長方形）の治療サイクルを、図５Ａ〜Ｋに示す。また、CT画像を用いて得られた前血管リンパ節（x軸の上に位置する「前血管LN」列）および気管傍リンパ節（x軸の上に位置する「気管傍LN」行）の腫瘍径も示される。

図５Ａは、同じチャート上に一緒にプロットされた100個の変異を全て示す。

図５Ｂは、54個の体細胞突然変異を示す。

図５Ｃは、1個の体細胞突然変異を示す（C1orf43）。

図５Ｄは、BRAF V600Rを含む24個の体細胞突然変異を示す。

図５Ｅは、10個の体細胞突然変異を示す。低頻度変異のこの集団は、腫瘍量の増加とともに増加しない。したがって、この集団は、非腫瘍由来の体細胞突然変異を含むと解釈される。偽陽性の結果もこの種の変異を生成する可能性があるが、図示の例では、これらの変異（突然変異）は2つの異なる配列決定技術にわたって検証され、それにより偽陽性結果の結果である可能性を低減する。

図５Ｆは、3個の体細胞突然変異を示す。（ADAMDEC1；CSMDI；BFSP1）。

図５Ｇは、他の100個の追跡された変異（BLACE）の軌跡に関連しない単一の体細胞変異体の軌跡を示す。この変異は、治療中の他の突然変異軌跡を追跡しない。したがって、この変異は非腫瘍由来体細胞変異であると解釈される。

図５Ｈは、4個の体細胞突然変異を示す。これらの体細胞変異は、任意の所与の時点で最も高いVAFを有する傾向がある（CSMD1；PKHD1L1；CSMD3；UNCSD）。

図５Ｉは、2個の体細胞突然変異を示す（ST18；ADAM2）。

図５Ｊは、1個の体細胞突然変異を示す（TRPS1）。

図５Ｋは、単一の臨床的に作用可能な体細胞非同義変異BRAF V600Rドライバー突然変異のVAF軌跡を示す。BRAF V600R突然変異は、BRAF阻害剤であるベムラフェニブに対して感受性があると予測される、非特許文献５８。cfDNAのWGSは、6%VAFで活性化突然変異BRAF V600Rを同定し、PGM装置でのアンプリコン配列決定から推定される5%のVAFと一致した。ベムラフェニブ治療の下で、BRAF V600R突然変異VAFは、アンプリコン配列決定手法を用いて検出不可能なレベルまで低下する。CT画像化は、同じ期間中の腫瘍体積の減少を示す。重要なことに、他の追跡された突然変異は、複数の体細胞変異を追跡することの価値を示す治療中に検出可能なレベルで継続し、治療応答の推定を改善した。これは、患者（変異BRAF V600R）におけるチェックポイント阻害療法に対する応答の欠如を検出することにおいてさらに実証される。

cfDNAからの体細胞突然変異の対立遺伝子頻度を追跡することにより、イピリムマブでの治療がこの患者において効果がないことを早期に知ることは可能であっただろう。対立遺伝子頻度の増加は、3回目のCT画像スキャンの88日前に検出可能である。変異対立遺伝子の頻度軌跡は、集約画像化されたリンパ節直径と高度に相関していた（ピアソン相関86%）。時間経過に伴って複数の対立遺伝子頻度を追跡することにより、主題の方法は、疾患の進行および治療への応答を含むが、これらに限定されない、患者による様々な異なる応答の検出を容易にする。例えば、図５Ａ〜Ｋに示すように、治療に対する応答の減少が患者で観察され、疾患が進行するにつれて体細胞突然変異の総対立遺伝子頻度が増加した。いくつかの実施形態では、腫瘍サイズと総体細胞突然変異の対立遺伝子頻度との間に相関が観察される。したがって、図示された例では、主題の方法は、個々の突然変異ならびに突然変異の総対立遺伝子頻度の両方を、時間をかけて追跡することによって、疾患の進行ならびに治療に対する応答の監視を容易にした。

この例は、cfDNA WGSが、高い系腫瘍量を有する患者に容易に適用可能であり、治療応答および耐性に関連するクローンのゲノム進化の総合評価を可能にすることを実証する。さらに、cfDNAは、FFPE生検からのライブラリーよりも均一なWGSライブラリーをもたらす。

本発明は、その特定の実施形態を参照して説明されたが、本発明の真の主旨および範囲から逸脱することなく、様々な変更がなされてもよく、等価物が置き換えられてもよいことは、当業者には理解されるべきである。さらに、多くの改変を行い、特定の状況、材料、物質の組成、プロセス、プロセス工程または工程に、本発明の目的、主旨および範囲に適合させることができる。そのような改変は全て、添付の特許請求の範囲に含まれるものとする。

Claims

患者の健康状態を追跡する方法であって、
患者の突然変異シグネチャーを構築する工程であって、該突然変異シグネチャーが以下を含む工程：
患者の核酸試料中で観察された変異の総数；
観察された前記変異の各々についての配列関係因子；
観察された変異の各々の対立遺伝子頻度；および
変異型分類；
前記患者の前記突然変異シグネチャーを、既知の健康状態を有する患者の1つ以上のデータベースにおける突然変異シグネチャーと比較する工程；ならびに
前記患者の診断または治療を決定する工程
を含む、方法。
前記患者の複数の突然変異シグネチャーを含む前記患者の縦断的突然変異シグネチャーを時間をかけて決定する工程と、前記患者の縦断的突然変異シグネチャーを、診断または治療を決定する前の既知の健康状態を有する患者の1つ以上のデータベースに含まれる縦断的突然変異シグネチャーと比較する工程とをさらに含む、請求項１に記載の方法。
前記縦断的突然変異シグネチャーが、第1時点からの患者の第1突然変異シグネチャーおよび第2時点からの該患者の第2突然変異シグネチャーを含む、請求項２に記載の方法。
前記第1時点が治療の前であり、前記第2時点が前記治療の後である、請求項３に記載の方法。
前記治療が腫瘍切除手術を含む、請求項４に記載の方法。
前記治療が抗がん治療剤の投与を含む、請求項４に記載の方法。
前記患者の健康状態を取得する工程と、前記患者の前記健康状態および前記突然変異シグネチャーを1つ以上の前記データベースに追加する工程とをさらに含む、請求項１に記載の方法。
前記患者から患者情報を取得する工程と、該患者情報を、既知の健康状態を有する患者の1つ以上の前記データベースに含まれる患者情報と比較する工程とをさらに含み、前記情報が、年齢、性別、人種、民族性、家族病歴、体重、ボディマス指数、身長、以前のおよび／または重複感染、環境ばく露、および喫煙歴のうちの少なくとも1つを含む、請求項１に記載の方法。
前記患者のタンパク質バイオマーカーのレベルを取得する工程と、該タンパク質バイオマーカーの該レベルを、既知の健康状態を有する患者の1つ以上の前記データベースに含まれる前記タンパク質バイオマーカーのレベルと比較する工程とをさらに含む、請求項１に記載の方法。
前記核酸が患者試料から得られる、請求項１に記載の方法。
前記患者試料が、被験体の組織試料、被験体の体液、被験体の細胞試料、または被験体の糞便試料を含む、請求項１に記載の方法。
前記体液が、全血、唾液、涙、汗、痰、または尿から選択される、請求項１１に記載の方法。
前記体液が全血であり、前記患者試料が前記全血の一部を含む、請求項１２に記載の方法。
前記全血の一部が、血漿または細胞遊離核酸を含む、請求項１３に記載の方法。
前記組織試料が、ホルマリン固定パラフィン包埋（FFPE）組織試料、新鮮凍結（FF）組織試料、およびそれらの任意の組み合わせからなる群より選択される、請求項１１に記載の方法。
前記変異型分類が、テロメア配列のコピー数の変動、染色体不安定性、転座、逆位、挿入、欠失、ヘテロ接合性の消失、増幅、カタエギス、マイクロサテライト不安定性、およびそれらの任意の組合せからなる群より選択される、請求項１に記載の方法。
時間をかけて観察された変異からの腫瘍内または腫瘍間の異質性を判定する工程をさらに含む、請求項２に記載の方法。
時間をかけて観察された前記患者の治療前後の変異を監視することによって治療有効性を判定する工程をさらに含む、請求項１７に記載の方法。
監視する前記工程が、微小残存病変を監視する工程を含む、請求項１８に記載の方法。
患者の健康状態を追跡する方法であって、
患者から細胞遊離核酸を得る工程；
細胞遊離核酸についてアッセイを実施し、細胞遊離核酸中のテロメア特異的縦列反復配列を決定する工程；
患者のテロメア完全性スコアを作成する工程であって、前記スコアがテロメア縦列反復の頻度分布を含む工程；
2つ以上の時点で前記患者から得た細胞遊離核酸のテロメア完全性スコアの縦断的軌跡を生成する工程；
前記縦断的軌跡を、既知の健康状態を有する個体の1つ以上のデータベースにおける1つ以上の縦断的軌跡と比較する工程；および
前記患者の診断または治療を決定する工程
を含む、方法。
前記細胞遊離核酸が体液から得られる、請求項２０に記載の方法。
前記体液が、全血、全血の一部、唾液、涙、汗、痰、または尿から選択される、請求項２１に記載の方法。
前記患者の健康状態を取得する工程と、前記患者の前記健康状態および前記縦断的軌跡を1つ以上の前記データベースに追加する工程とをさらに含む、請求項２０に記載の方法。
前記患者のテロメア縦列反復の頻度分布を正規化する工程をさらに含む、請求項２０に記載の方法。
前記患者のテロメア縦列反復の頻度分布を正規化する前記工程が、前記頻度分布を、前記テロメア特異的縦列反復配列と同じ割合の個々の核酸塩基を有する制御配列と比較する工程を含む、請求項２４に記載の方法。
前記患者のテロメア縦列反復の前記頻度分布を正規化する工程が、テロメア縦列反復の前記頻度分布を、1つ以上の前記データベースの1つ以上の頻度分布と比較する工程を含む、請求項２４に記載の方法。
前記患者からの情報を取得する工程と、前記情報を、既知の健康状態を有する患者のデータベースと比較する工程とをさらに含み、前記情報が、患者の民族性、年齢、性別、または環境ばく露のうちの少なくとも1つを含む、請求項２０に記載の方法。
前記患者のテロメラーゼ逆転写酵素（TERT）プロモーター突然変異プロファイルを決定する工程と、前記プロファイルを、既知の健康状態を有する個体の1つ以上の前記データベースに含まれる1つ以上のプロファイルと比較する工程とをさらに含む、請求項２０に記載の方法。
アッセイを実施する工程が、配列決定手順を実施する工程を含む、請求項２０に記載の方法。
前記配列決定手順が全ゲノム配列決定を含む、請求項２９に記載の方法。
前記配列決定手順が標的配列決定を含む、請求項２９に記載の方法。
前記標的配列決定が標的PCR増幅を含む、請求項３１に記載の方法。
前記標的配列決定が、1つ以上の選択可能なオリゴヌクレオチドを使用するハイブリッドキャプチャーを含む、請求項３１に記載の方法。
前記テロメア特異的縦列反復配列が、テロメア参照配列へのアラインメントによって同定される、請求項２０に記載の方法。
前記テロメア特異的縦列反復配列が、k-mer頻度の分析によって同定される、請求項２０に記載の方法。