JP2021528094A - マイクロサテライト不安定性の検出 - Google Patents

マイクロサテライト不安定性の検出 Download PDF

Info

Publication number
JP2021528094A
JP2021528094A JP2020573126A JP2020573126A JP2021528094A JP 2021528094 A JP2021528094 A JP 2021528094A JP 2020573126 A JP2020573126 A JP 2020573126A JP 2020573126 A JP2020573126 A JP 2020573126A JP 2021528094 A JP2021528094 A JP 2021528094A
Authority
JP
Japan
Prior art keywords
microsatellite
locus
rld
loci
sequencing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020573126A
Other languages
English (en)
Inventor
クラス,ダニエル・エム
ラブジョイ,アレクサンダー
パティ,アムリタ
ミレブラヒム,セイード・ハミド
ケイシー,ファーガル
ワーン,ハオ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
F Hoffmann La Roche AG
Original Assignee
F Hoffmann La Roche AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by F Hoffmann La Roche AG filed Critical F Hoffmann La Roche AG
Publication of JP2021528094A publication Critical patent/JP2021528094A/ja
Priority to JP2023089731A priority Critical patent/JP2023109998A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Abstract

MSIを検出するための方法およびシステムが提供される。ヒトゲノムDNAのマイクロサテライト遺伝子座を濃縮する方法も提供される。さらに、MSIを検出するためのオリゴヌクレオチドアレイが提供される。

Description

マイクロサテライト遺伝子座は、長さ1〜6塩基対の反復単位であるショートタンデムリピート(STR)を有するゲノムDNAの領域である。数十万のマイクロサテライト遺伝子座が、ヒトゲノム全体に分散している。マイクロサテライト遺伝子座は、最小反復単位の長さに基づいて分類される。例えば、長さ1〜6塩基対の反復単位を有するマイクロサテライト遺伝子座は、それぞれ「モノヌクレオチド」、「ジヌクレオチド」、「トリヌクレオチド」、「テトラヌクレオチド」、「ペンタヌクレオチド」、および「ヘキサヌクレオチド」反復遺伝子座と呼ばれる。一般に、マイクロサテライト遺伝子座は、単一の反復型(例えば、(GT))からなり、最大100回の反復が可能であるが、複数の反復型を有するマイクロサテライトは、複合マイクロサテライト(例えば、(GT)(CT))として知られている。マイクロサテライト遺伝子座は、塩基置換(不完全マイクロサテライト、例えば、(GT)A(GT))または挿入(翻訳されたマイクロサテライト、例えば、(GT)CCC(GT))を含み得る。
哺乳類種からのゲノムDNAなど、ほとんどの二倍体種の正常なゲノムDNAの各マイクロサテライト遺伝子座は、各遺伝子座にある2つの対立遺伝子からなる。2つの対立遺伝子は、互いに長さが同じでも異なっていてもよく、個体によって異なってもよい。マイクロサテライト対立遺伝子は通常、所定の個体およびその子孫で一定の長さに維持されるが、マイクロサテライトの長さの不安定性は、いくつかの腫瘍タイプで確認されている(Aaltonen et al.、1993、Science 260:812−815;Thibodeau et al.、1993 Science 260:816−819;Peltomaki et al.、1993 Cancer Research 53:5853−5855;Ionov et al.、1993 Nature 363:558−561)。
「マイクロサテライト不安定性」(MSI)と呼ばれる、腫瘍のこのタイプのゲノム不安定性は、遺伝性癌症候群である遺伝性非ポリポーシス結腸直腸癌(HNPCCまたはリンチ症候群)の分子特徴である。MSIの原因には、例えばポリメラーゼのスリッページによってDNA複製中に発生するエラーを元に戻せない、DNAミスマッチ修復(MMR)システムの機能不全が含まれると考えられている(Fishel et al.、1993 Cell 75:1027−38;Leach et al.、1993 Cell 75:215−25;Bronner et al.、1994 Nature 368:258−61;Nicolaides et al.、1994 Nature 371:75−80;Miyaki et al.、1997 Nat Genetics 17:271−2)。マイクロサテライト遺伝子座での1つ以上の反復単位の挿入または削除(例えば、MMRの欠陥による)は、例えば、正常DNAおよび腫瘍DNAサンプルから増幅されたマイクロサテライト遺伝子座に見られる対立遺伝子サイズを比較することによって検出され得る(Thibodeau et al、1993、前掲)。
MSIは、HNPCCの90%超、散発性結腸直腸腫瘍の10〜20%で発見されている(Liu et al.、1996 Nature Med 2:169−174;Thibodeau et al.、1993、supra;Ionov et al.、1993 Nature 363:558−561;Aaltonen et al.、1993 Science 260:812−816;Lothe et al.、1993 Cancer Res.53:5849−5852;およびBoland and Goel、2010Gastroenterology 138:2073−2087)。しかしながら、MSIは、結腸直腸腫瘍に限定されない。MSIは、膵臓癌(Han et al.、1993 Cancer Res 53:5087−5089)、胃癌(Peltomaki et al.、1993 Cancer Res 53:5853−5855;Mironov et al.、1994 Cancer Res 54:41−44)、前立腺癌(Gao et al.、1994 Oncogene 9:2999−3003)、子宮内膜癌(Risinger et al.、1993 Cancer Res 53:5100−5103)、および乳癌(Patel et al.、1994 Oncogene 9:3695−3700)で検出されてきた。
高頻度MSI(MSI−H)状態の結腸直腸腫瘍は、独特の分子病因を有し、腫瘍ゲノムにおける異常な表現型特徴および超変異など、腫瘍の特徴をもたらす。タイル状のMS遺伝子座の40%を超えるMSIが検出された場合、サンプルは、典型的にはMSI−Hとして分類される。いくつかの臨床研究は、高頻度MSI(MSI−H)結腸直腸癌(CRC)患者が、化学療法および免疫療法の両方を含む特定の治療に対して明確に反応し、MSIを有さないCRC患者(例えば、マイクロサテライト安定性(MSS)患者)とは異なる予後を有することを示している(例えば、Popat et al.、J Clin Oncol.2005;23:609−618;Kim et al.J J Clin Oneal.2007;25:767−772;Elsaleh et al.Lancet.2000;355:1745−1750;Storojeva et al.Oneal Rep.2005;14:241−249;Jover et al.Gut.2006;55:848−855;Des Guetz et al.Eur J Cancer.2009;45:1890−1896;Bertagnolli et al.J Clin Oncol.2009;27:1814−1821;Ribic et al.N Engl J Med.2003;349:247−257;およびBenatti et al.Clin Cancer Res.2005;11:8332−8340)を参照されたい)。2017年、FDAは、以前の治療で進行した、切除不能または転移性の、MSI−Hまたはミスマッチ修復不全(dMMR)固形腫瘍の患者に対して、ペムブロリズマブを承認した。組織のタイプまたはや腫瘍部位ではなく、腫瘍の遺伝学に基づいて癌治療薬が承認されたのは、これが初と考えられる。したがって、MSI−H特徴の根底にある分子変化の検出は、CRCおよびその他の腫瘍適応症における新しい診断および治療アプローチの開発に影響を与える。
MSI−H状態を判定するための既存の基準は、1997年の国立癌研究所後援MSIワークショップで推奨された5つのマイクロサテライト遺伝子座(3つのジヌクレオチドおよび2つのモノヌクレオチド反復)を調査する、ベセスダパネル(Berg et al.、J Mol Diagn.2000;2:20−28)、および7つのマイクロサテライト遺伝子座(5つのモノヌクレオチドおよび2つのペンタヌクレオチド反復)を含める、Promega MSI Analysis System(Bacher et al.Dis.Markers 2004.20(4−5):237−50)である。これらの基準内で、2つ以上のMS遺伝子座での不安定性を、MSI−H状態であると判定する。これらの既存の基準には、ポリメラーゼ連鎖反応(PCR)ベースであるという点で限界があり、エレクトロフェログラム出力を手動で分析して、MSIまたはMSSの状態を判定する必要がある。さらに、基準は、無細胞DNA(cfDNA)サンプルではなく、組織サンプルを対象としており、組織サンプルでのMSI遺伝子座の変異対立遺伝子割合は、cfDNAサンプルで見られるものよりも著しく高い。
さらに、最先端技術は、サンプルがMSIであるかどうかの判断を、公知のMSI遺伝子座の小さなセット、および適合する正常なサンプルの存在またはエレクトロフェログラム出力の手動視覚分析のいずれかに依存している。さらに、最先端技術では、cfDNAサンプルに存在する変異対立遺伝子の量が少ないため、循環腫瘍DNA(ctDNA)サンプルのMSI状態を特定できない。
一態様では、本開示は、一般に、マイクロサテライト不安定性(MSI)を検出するための方法に関する。いくつかの実施形態では、MSIを検出するための方法は、ヒトゲノムDNAのサンプルから複数のマイクロサテライト遺伝子座についてシーケンシングリードを検出すること、各マイクロサテライト遺伝子座の反復長分布(RLD)の基準値を決定すること、基準値をマイクロサテライト遺伝子座の閾値と比較すること(各マイクロサテライトは独立した閾値を有する)、閾値を超えるRLD基準値を有するマイクロサテライト遺伝子座の数を定量化すること、および閾値を超えるRLD基準値を有するマイクロサテライト遺伝子座の数を、マイクロサテライト不安定性(MSI)比率閾値と比較することを含む。そのマイクロサテライト遺伝子座の数がMSI比率閾値を超える場合、サンプルからのヒトゲノムDNAはMSIを有する。いくつかの実施形態では、複数のマイクロサテライト遺伝子座は、マイクロサテライト遺伝子座:1〜170からなる群から選択される、少なくとも10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、またはそれ以上のマイクロサテライト遺伝子座である。別の実施形態では、複数のマイクロサテライト遺伝子座は、マイクロサテライト遺伝子座:1〜170(表1)からなる群から選択される、約5〜約160、約10〜約150、約20〜約100、約25〜約80、または約30〜約50のマイクロサテライト遺伝子座である。さらに別の実施形態では、複数のマイクロサテライト遺伝子座は、遺伝子座:1〜170(表1)に対応する。さらに別の実施形態では、複数のマイクロサテライト遺伝子座は、表2の遺伝子座に対応する。一実施形態では、複数のマイクロサテライト遺伝子座は、表2のマイクロサテライト遺伝子座からなる群から選択される少なくとも10、20、30、40、50、またはそれ以上のマイクロサテライト遺伝子座である。一実施形態では、複数のマイクロサテライト遺伝子座は、表2の遺伝子座に対応するマイクロサテライト遺伝子座からなる群から選択される約10〜約50、より好ましくは約20〜約50、最も好ましくは約20〜約40のマイクロサテライト遺伝子座である。いくつかの実施形態では、複数のマイクロサテライト遺伝子座は、表2のマイクロサテライト遺伝子座に対応する。
いくつかの実施形態では、反復長分布(RLD)の基準値は、t統計量である。いくつかの実施形態では、RLDの基準値は、反復単位の平均リード長および目的のマイクロサテライト遺伝子座でのRLDの分散に基づくt統計量を含むことができる。いくつかの実施形態では、t統計量は、試験サンプルのRLDおよび対照RLDに基づいて決定される。
いくつかの実施形態では、シーケンシングリードの検出は、ヒトゲノムDNAからヌクレオチドシーケンシングリードを生成すること、およびシーケンシングリードをマイクロサテライト遺伝子座DNA配列のセットにアラインメントすることによってマイクロサテライト遺伝子座を含むシーケンシングリードを同定することを含む。いくつかの実施形態では、検出は、マイクロサテライト遺伝子座を含むと判定された各シーケンシングリードの反復長の数をカウントすること、それにより、各マイクロサテライト遺伝子座のRLDを生成することをさらに含む。
いくつかの実施形態では、ヌクレオチドシーケンシングリードを生成する前に、マイクロサテライト遺伝子座含有DNAにハイブリダイズするオリゴヌクレオチドプローブにヒトゲノムDNAをハイブリダイズすることによって、ヒトゲノムDNAをマイクロサテライト遺伝子座について濃縮する。いくつかの実施形態では、オリゴヌクレオチドプローブは溶液中にあり、オリゴヌクレオチドプローブは、マイクロサテライト遺伝子座含有DNAにハイブリダイズして、溶液中でハイブリダイゼーション複合体を形成する。別の実施形態では、オリゴヌクレオチドプローブは、個体支持体に結合または付着され、オリゴヌクレオチドプローブは、マイクロサテライト遺伝子座含有DNAにハイブリダイズして、個体支持体上にハイブリダイゼーション複合体を形成する。いくつかの実施形態では、1つ以上のオリゴヌクレオチドプローブは、異種薬剤で標識される。別の実施形態では、オリゴヌクレオチドプローブは、1つ以上の修飾ヌクレオチドを含む。一実施形態では、異種薬剤は、ビオチンまたはストレプトアビジン部分である。別の実施形態では、異種薬剤は、蛍光または化学発光部分である。いくつかの実施形態では、異種薬剤は、少なくとも1つの標識部分および/または少なくとも1つの消光剤部分を含む。
いくつかの実施形態では、方法は、ヒトゲノムDNAを有するサンプルを提供することを含む。いくつかの実施形態では、サンプルは、ヒトゲノムDNA断片を含む。一実施形態では、ヒトゲノムDNAの断片は、機械的、化学的または酵素的手段によって調製される。いくつかの実施形態では、ヒトゲノムDNA断片は、マイクロサテライト遺伝子座を含む。いくつかの実施形態では、ヒトゲノムDNA断片は、オリゴヌクレオチドプローブのプールと接触している。いくつかの実施形態では、オリゴヌクレオチドプローブのプールと接触しているヒトゲノムDNA断片の一部は、オリゴヌクレオチドプローブにハイブリダイズして、ハイブリダイゼーション複合体を形成し、それにより、捕捉されたDNAを生成する。いくつかの実施形態では、捕捉されたDNAは、他の細胞、ポリペプチド、またはポリヌクレオチド成分から単離される。
いくつかの実施形態では、方法は、ゲノムDNA断片を含むサンプルを提供すること、オリゴヌクレオチドプローブのプールをサンプルに接触させること、プールオリゴヌクレオチドプローブとのハイブリダイゼーション複合体中でマイクロサテライト遺伝子座を含むDNA断片を捕捉し、それによって捕捉されたDNAを生成すること、未結合の結合核酸からハイブリダイゼーション複合体を分離すること、ハイブリダイゼーション複合体から捕捉されたDNAを溶出すること、ハイブリダイゼーション複合体から溶出された捕捉されたDNAをシーケンシングすること、シーケンシングリードをマイクロサテライト遺伝子座DNA配列のセットにアラインメントすることにより、マイクロサテライト遺伝子座を含むシーケンシングリードを同定すること、およびマイクロサテライト遺伝子座を含むと判定された各シーケンシングリードの反復長の数をカウントし、それによって各マイクロサテライト遺伝子座のRLDを生成することをさらに含む。いくつかの実施形態では、ゲノムDNA断片は、オリゴヌクレオチドプローブのプールと接触させる前に、アダプターオリゴヌクレオチドに連結される。いくつかの実施形態では、アダプターオリゴヌクレオチドは、1つ以上のバーコード、ユニバーサルプライマー結合部位を含むか、または1つ以上のバーコードおよびユニバーサルプライマー結合部位を含む。いくつかの実施形態では、シーケンシングの前に、捕捉されたDNAは、ユニバーサルプライミング結合部位にハイブリダイズするユニバーサルプライマーで増幅することができる。
いくつかの実施形態では、シーケンシングは、ナノポアベースシーケンシングを含む。別の実施形態では、シーケンシングは、イオンベースシーケンシングを含む。さらに別の実施形態では、シーケンシングは、半導体ベースシーケンシングを含む。
一実施形態では、方法は、ヒトゲノムDNA断片を含むサンプルを提供すること、マイクロサテライト遺伝子座に特異的なオリゴヌクレオチドプライマーを用いてマイクロサテライト遺伝子座を含むDNA断片を増幅し、アンプリコンを生成すること、アンプリコンをシーケンシングすること、シーケンシングリードをマイクロサテライト遺伝子座DNA配列のセットにアラインメントすることにより、マイクロサテライト遺伝子座を含むシーケンシングリードを同定すること、およびマイクロサテライト遺伝子座を含むと判定された各シーケンシングリードの反復長の数をカウントし、それによって各マイクロサテライト遺伝子座のRLDを生成することを含む。
いくつかの実施形態では、サンプルは、組織サンプルまたは血液サンプルである。いくつかの実施形態では、サンプルは、血漿、血清および/または単核末梢細胞などの血液サンプルである。いくつかの実施形態では、サンプルは、無細胞DNA(cfDNA)である。別の実施形態では、サンプルは、循環腫瘍DNA(ctDNA)を含む。いくつかの実施形態では、組織サンプルは、腫瘍サンプルである。別の実施形態では、サンプルは、癌を有するかまたは癌を有することが疑われるヒトから得られる。いくつかの実施形態では、腫瘍サンプルは、結腸直腸癌を有するヒトから得られる。いくつかの実施形態では、ヒトは、HNPCCを有するか、または有することが疑われる。
いくつかの実施形態では、方法は、ヒトがMSIを有する場合、抗体、小分子または他の化合物でヒトを治療することをさらに含む。いくつかの実施形態では、抗体は、ペムブロリズマブである。
別の態様では、本開示は、一般に固体支持体または異種薬剤に連結されたオリゴヌクレオチドのアレイに関する。いくつかの実施形態では、アレイは、遺伝子座:1〜170に対応するマイクロサテライト遺伝子座からなる群から選択されるマイクロサテライト遺伝子座に、少なくとも12(または14、16、18、20)のヌクレオチドの連続配列にわたって相補的なオリゴヌクレオチドのセットを含み、ここで、オリゴヌクレオチドのセットは、遺伝子座:1〜170に対応する様々なマイクロサテライト遺伝子座にそれぞれ相補的である、少なくとも10、20、30、40、または50のオリゴヌクレオチドを含む。いくつかの実施形態では、アレイ内の各オリゴヌクレオチドは、別個の異種薬剤に連結されている。一実施形態では、異種薬剤は、ビオチンである。いくつかの実施形態では、アレイ内のオリゴヌクレオチドのセットは、同一の固体支持体に連結されている。さらに別の実施形態では、アレイ内の各オリゴヌクレオチドは、別個の固体支持体に連結されている。
別の態様では、本開示は、一般に、ヒトゲノムDNAサンプル中のマイクロサテライト遺伝子座を濃縮する方法に関する。いくつかの実施形態では、方法は、ヒトゲノムDNAを、固体支持体または異種薬剤に連結されたオリゴヌクレオチドのアレイにハイブリダイズすることを含む。ここでアレイは、マイクロサテライト遺伝子座:1〜170からなる群から選択されるマイクロサテライト遺伝子座に、少なくとも12(または14、16、18、20)のヌクレオチドの連続配列にわたって相補的なオリゴヌクレオチドのセットを含み、オリゴヌクレオチドのセットは、マイクロサテライト遺伝子座:1〜170に対応する様々なマイクロサテライト遺伝子座にそれぞれ相補的である、少なくとも10、20、30、40、または50のオリゴヌクレオチドを含む。いくつかの実施形態では、方法は、ハイブリダイズしていないゲノムDNAを除去すること、オリゴヌクレオチドのアレイからハイブリダイズしたヒトゲノムDNAを溶出し、それによってマイクロサテライト遺伝子座を濃縮することをさらに含む。
別の態様では、本開示は、一般に、プロセッサおよびプロセッサに連結された非一時的なコンピュータ可読媒体を含む、MSIを検出するための方法に関する。ここで、非一時的なコンピュータ可読媒体は、MSI検出方法を実行するためにプロセッサによって実行可能なコードを含む。いくつかの実施形態では、方法は、プロセッサ;プロセッサに連結された非一時的コンピュータ可読媒体であって、複数のマイクロサテライト遺伝子座についてヒトゲノムDNAからシーケンシングリードを受け取ることを含む方法を実行するためのプロセッサによって実行可能なコードを含む、非一時的コンピュータ可読可能媒体;各マイクロサテライト遺伝子座の反復長分布(RLD)を決定すること;各マイクロサテライト遺伝子座のRLDの基準値を生成すること;独立した閾値を有する各マイクロサテライト遺伝子座の基準値を、マイクロサテライト遺伝子座の閾値と比較すること;検出された、閾値を超えるRLD基準値を有するマイクロサテライト遺伝子座の数を定量化すること;(i)閾値を超えるRLD基準値を有するマイクロサテライト遺伝子座の数を、(ii)遺伝子座セット比率閾値と比較することを含み、その数が遺伝子座セット比率閾値を超える場合、ヒトはマイクロサテライト不安定性を有する。いくつかの実施形態では、方法は、シーケンシングリードをマイクロサテライト遺伝子座DNA配列のセットにアラインメントすることによって、マイクロサテライト遺伝子座を含むシーケンシングリードを同定するための命令、およびマイクロサテライト遺伝子座を含むと決定された各シーケンシングリードの反復長の数をカウントし、それにより、各マイクロサテライト遺伝子座のRLDを生成するための命令をさらに含む。いくつかの実施形態では、RLDの基準値は、t統計量である。いくつかの実施形態では、RLDの基準値は、反復単位の平均リード長および目的のマイクロサテライト遺伝子座でのRLDの分散に基づくt統計量を含むことができる。いくつかの実施形態では、t統計量は、試験サンプルのRLDおよび対照RLDに基づいて決定される。いくつかの実施形態では、方法は、患者のサンプル中の複数のMSI遺伝子座をアッセイして、複数のMSI遺伝子座のRLDを決定するように構成された少なくとも1つのデバイスをさらに含む。
いくつかの実施形態では、コンピュータ可読媒体は、MSI状態に応じて利用可能な治療薬のリストを含むデータベース、RLD基準値が閾値を超えるマイクロサテライト遺伝子座の数を入力し、RLD基準値が閾値を超えるマイクロサテライト遺伝子座の数を遺伝子座セットの比例閾値と比較するための命令、遺伝子座セットの比率閾値との比較がデータベース内の少なくとも1つの治療薬が有効である可能性を示す、治療薬の一覧を含むレポートを作成するための命令を含む、コンピュータ可読プログラムコードを含む。
図1は、Promega MSI Analysis Systemを使用した、MSIまたはMSS細胞株の例示的なエレクトロフェログラムの結果を提供する。図1Aは、MSS細胞株(CCL−228)を使用した5つの異なるMS遺伝子座(NR−21、NR−24、BAT−25、BAT−26およびMONO−27)の分布を示す。MS遺伝子座の分布は、試験サンプル(MSS)と対照サンプル間で一致している。図1Bは、MSI細胞株(CCL−253)を使用した3つのMS遺伝子座(NR−21、BAT−25、およびMONO−27)の分布を示す。MS遺伝子座の分布は、対照サンプルと比較してMSI細胞株で右にシフトしており、MSI細胞株でのMS反復長が小さくなることを示している。 図1は、Promega MSI Analysis Systemを使用した、MSIまたはMSS細胞株の例示的なエレクトロフェログラムの結果を提供する。図1Aは、MSS細胞株(CCL−228)を使用した5つの異なるMS遺伝子座(NR−21、NR−24、BAT−25、BAT−26およびMONO−27)の分布を示す。MS遺伝子座の分布は、試験サンプル(MSS)と対照サンプル間で一致している。図1Bは、MSI細胞株(CCL−253)を使用した3つのMS遺伝子座(NR−21、BAT−25、およびMONO−27)の分布を示す。MS遺伝子座の分布は、対照サンプルと比較してMSI細胞株で右にシフトしており、MSI細胞株でのMS反復長が小さくなることを示している。 図2は、本開示の一実施形態の例示的なワークフローを提供する。 図3は、トレーニングおよび予測工程を含む、マイクロサテライト不安定性コンピュータパイプラインの例示的な工程を含むフローチャートを示す。 図4は、図3のマイクロサテライト不安定性組織のコーラー(caller)成分の、例示的なバイオインフォマティクスワークフローを示す。 図5A〜図5Cは、マイクロサテライト遺伝子座全体にわたるRLDの変動を示すグラフである。図5Aは、一貫したRLDを有する試験サンプルおよび正常サンプルにおける単一のMS遺伝子座のRLDを示す。図5Bは、バックグラウンドサンプルから得られたRLDとは実質的に異なる試験サンプルからのRLDを有するMS遺伝子座を示す。図5Cは、正常サンプル全体にわたるRLD変動を有するMS遺伝子座を示す。 図6Aおよび図6Bは、cfDNA、MSSサンプル、およびMSIサンプルからの63のマイクロサテライト遺伝子座の箱ひげ図、ならびに63のマイクロサテライト遺伝子座における反復単位の平均数の分布を示す。 図6Aおよび図6Bは、cfDNA、MSSサンプル、およびMSIサンプルからの63のマイクロサテライト遺伝子座の箱ひげ図、ならびに63のマイクロサテライト遺伝子座における反復単位の平均数の分布を示す。 図7Aおよび7Bは、cfDNA、MSSサンプル、およびMSIサンプルからの63のマイクロサテライト遺伝子座の箱ひげ図、ならびに63のマイクロサテライト遺伝子座における反復単位の平均数の歪度の分布を示す。 図7Aおよび7Bは、cfDNA、MSSサンプル、およびMSIサンプルからの63のマイクロサテライト遺伝子座の箱ひげ図、ならびに63のマイクロサテライト遺伝子座における反復単位の平均数の歪度の分布を示す。 図8は、本開示の一実施形態による例示的なシステムを示す。 図9は、本開示の一実施形態による、別の例示的なシステムを示す。
I.序文
本開示は、サンプル中のマイクロサテライト不安定性を検出するための方法およびシステムを提供する。サンプルは、場合により、マイクロサテライト遺伝子座:1〜170から選択されるマイクロサテライト遺伝子座の連続配列(例えば、少なくとも12ヌクレオチド)にわたって相補的である、1つ以上のオリゴヌクレオチドプローブと接触させる。場合により、オリゴヌクレオチド捕捉プローブと接触したサンプルは、サンプルを1つ以上のオリゴヌクレオチドプローブにハイブリダイズさせることにより、マイクロサテライト遺伝子座について濃縮される。未結合および/またはハイブリダイズしていないサンプルを除去し、オリゴヌクレオチド捕捉プローブからハイブリダイズするサンプルを溶出し、それにより、マイクロサテライト遺伝子座を有する濃縮されたゲノムDNAを提供する。
本開示は、複数のマイクロサテライト遺伝子座を有するゲノムDNAからのシーケンシングリードを検出すること、独立した閾値を有する各マイクロサテライト遺伝子座の反復長分布の基準値を決定すること、閾値を超えるRLD基準値を有するマイクロサテライト遺伝子座の数を定量化すること、および閾値を超えるマイクロサテライト遺伝子座の数をMSI比率閾値と比較すること(そのマイクロサテライト遺伝子座の数がMSI比率閾値を超える場合、サンプルはMSIとして分類される)を含む、ゲノムDNA中のMSIを検出する方法を提供する。
本明細書に記載の方法およびシステムにより、サンプル中のマイクロサテライト遺伝子座の検出を改善することができる。本明細書に記載の方法およびシステムにより、組織サンプルまたは血漿サンプル中のMSI検出の感度および特異性を改善することができる。
II.定義
本明細書で使用される用語は、特定の実施形態を説明することのみを目的とし、限定することを意図しない。本発明の範囲は、添付の特許請求の範囲によってのみ限定されるからである。別段の定義がない限り、本明細書で使用されるすべての技術用語および科学用語は、本発明が属する技術分野の当業者によって一般的に理解されている意味と同じ意味を有する。本明細書および以下の特許請求の範囲では、反対の意図が明らかでない限り、以下の意味を有すると定義されなければならないいくつかの用語が参照される。場合によっては、一般に理解される意味を有する用語は、明確性および/または容易な参照のために本明細書で定義され、本明細書にそのような定義を含めることは、当技術分野で一般に理解される用語の定義に対する実質的な相違を意味すると解釈されるべきではない。
範囲を含むすべての数値指定、例えば、pH、温度、時間、濃度、および分子量は、必要に応じて0.1または1.0の増分で(+)または(−)変動する近似値である。すべての数値指定は、「約」という用語が常に明示的に記載されてとは限らないが、前に置かれていると理解されるべきである。
単数形「a」、「an」、および「the」は、文脈が別途明確に指示しない限り、複数の指示対象を含む。したがって、例えば、「化合物」への言及は、複数の化合物を含む。
「含む」という用語は、化合物、組成物、および方法が、記載された要素を含むが、他のものを除外しないことを意味することを意図している。化合物、組成物および方法を定義するために使用される場合、「本質的にからなる」とは、特許請求された発明の基本的および新規の特性に実質的に影響を与える、他の要素を除外することを意味するものとする。「からなる」とは、特許請求の範囲で指定されていない要素、行程、または成分を除外することを意味するものとする。これらの用語のそれぞれによって定義される実施形態は、本開示の範囲内にある。
本明細書で使用される場合、「ゲノムDNA」または「gDNA」は、細胞内のまたは細胞からのDNAの全体を指す。ほとんどの生物は、各細胞にゲノムDNAの同一のコピーを含む。gDNAの断片は、本明細書で論じられる通常の細胞条件下での細胞、例えば、無細胞DNAから放出されるか、または本明細書で論じられる、循環腫瘍DNAなどの腫瘍細胞から放出され得る。さらに、gDNAは、市販のキット(例えば、Roche Sequencing Solutions、Pleasanton、CAが販売する、Genomic DNA Extraction Kits(Avenio ctDNA Analysis Kits)、およびThermo Fisherが販売する(PureLink(商標)Genomic DNA purification KitおよびPureLink(商標)Genomic DNA Mini Kit))を使用して、細胞、組織、血液、植物、細菌などから抽出できる。ゲノムDNAは、無傷の全体細胞、リキッドバイオプシー、組織などから分離できる。
本明細書で使用される場合、「無細胞DNA」または「cfDNA」は、対象の血流中を循環する細胞に由来し、細胞内に位置しないゲノムDNAの断片を指す。通常、細胞はアポトーシス、壊死、その他のイベントを起こし、その結果、ゲノムDNA断片が血流に放出される。cfDNAは、母体血中の21トリソミーおよびその他の遺伝的胎児異常の検出、ならびに臓器移植拒絶反応を評価するためのドナー由来cfDNA(dd−cfDNA)の検出など、様々な医療目的で利用されている(Bloom et al.、JASN、(2017)28:2221−2232)。
本明細書で使用される場合、「循環腫瘍DNA」または「ctDNA」は、循環腫瘍細胞内に位置しない、対象の血流中を循環する腫瘍由来DNA断片を指す。循環腫瘍細胞は一般に、原発腫瘍が、血流またはリンパ系に入る細胞を放出する際に発生する。これらの循環腫瘍細胞は、腫瘍細胞が細胞死、アポトーシス、またはその他のイベントを起こすと、それらのゲノムDNAの断片を血流に放出する可能性がある。研究によると、腫瘍DNAは血中に放出され、多様な種類の癌の血漿および血清中に特に高濃度で存在する(Stroun et al.、1989 Oncology 46:318−322)。さらに、血中に放出された腫瘍DNAは、マイクロサテライトDNAの分析によって検出されている(Hibi et al.、1998 Cancer Research 58:1405−1407;Chen et al.、1999 Clinical Cancer Research 5:2297−2303;Kopreski et al.、1999 Clinical Cancer Research 5:1961−1965;Fujiwara et al.、1999 Cancer Research 59:1567−1571)。頭頸部扁平上皮癌(Nawroz et al.、1996 Nature Med 2:1035−1037)および小細胞肺癌(Chen et al.、1996 Nature Med 2:1033−1035)に由来する血漿および血清からの腫瘍DNAにおける、マイクロサテライト不安定性の検出が示されている。
本明細書で使用される場合、「サンプル」は、ヒトまたは非ヒト哺乳類対象から得られた組織または体液を指す。いくつかの実施形態では、サンプルは、血液、血液画分、または血液製剤(例えば、血清、血漿、血小板、赤血球、末梢血単核細胞など);痰または唾液;便、尿、その他の生体液(例えば、リンパ液、唾液、前立腺液、胃液、腸液、腎液、肺液、脳脊髄液など)、組織(例えば、腎臓、肺、肝臓、心臓、脳、神経組織、甲状腺、眼、骨格筋、軟骨、または骨組織)、または培養細胞(例えば、初代培養、外植片、形質転換細胞、または幹細胞)を含む。サンプルには、バイオプシーおよびオートプシーサンプルなどの組織の切片、および、例えば組織学的目的のために採取された凍結切片も含まれ得る。サンプルには、リキッドバイオプシーサンプルを含めることもできる。サンプルは、典型的には、「対象」、すなわち真核生物、最も好ましくは霊長類、例えばチンパンジーまたはヒトなどの哺乳動物、ウシ、イヌ、ネコ、ウマ、ヒツジ、ヤギ、例えばモルモット、ラット、もしくはマウスなどのげっ歯類、ウサギ、または鳥、爬虫類、または魚から得られる。
ここで使用される「マイクロサテライト不安定性」または「(MSI)」は、サンプル(例えば、組織、細胞、または体液)から得られたゲノムDNAの対立遺伝子が、マイクロサテライト遺伝子座でヌクレオチド長が変化する、遺伝的不安定性の形態を指す。例えば、MSIは、健康な組織からのDNAと腫瘍組織からのDNAなど、単一の対象からのゲノムDNAの2つの異なるサンプル(つまり、一致したサンプル)の増幅時に観察され得る。ここで健康な(一致した正常な)サンプルは、1つまたは2つの異なる長さの増幅された対立遺伝子を生成し、腫瘍サンプルは、対立遺伝子の少なくとも1つが同じ遺伝子座にある健康なサンプルの増幅された対立遺伝子とは長さが異なる、増幅された対立遺伝子を生成する。一般に、MSIは、マイクロサテライト遺伝子座に、少なくとも1つの反復単位の挿入または削除として存在する。
本明細書で使用される場合、「マイクロサテライト遺伝子座/遺伝子座(複数)」は、1〜6ヌクレオチド長の、短い反復配列要素を含むゲノムDNAの領域を指す。各反復配列は、マイクロサテライト遺伝子座内で1回以上繰り返され、「反復単位」と呼ばれる。マイクロサテライト遺伝子座は、好ましくは少なくとも4つの反復単位、より好ましくは7つの反復単位、より好ましくは少なくとも10の反復単位、最も好ましくは少なくとも20の反復単位を含む。「遺伝子座」という用語は、当技術分野におけるその通常の意味を与えられており、複数の遺伝子座を指す。本明細書で使用される「遺伝子座」は、個々の遺伝子またはDNA配列の位置を定義する固有の染色***置を指す。本明細書で使用される場合、「マイクロサテライトマーカー」は、マイクロサテライト遺伝子座を含むゲノムDNAの断片を指し、場合により、マイクロサテライト遺伝子座に隣接する左右の核酸配列を含む。
本明細書で使用される場合、「対立遺伝子」は、特定の染色***置(遺伝子座)にある遺伝子またはDNA配列の、いくつかの代替形態のうちの1つを指す。各常染色体遺伝子座で、個体は2つの対立遺伝子を有し、1つは父方の対象から受け継がれ、もう1つは母方の対象から受け継がれている。
本明細書で使用される「増幅する」および「増幅している」およびそれらの派生語は、複数のコピーが核酸遺伝子座、標的核酸配列、またはDNA断片から作製されるプロセスを指す。増幅は、基本的には任意の核酸増幅技術、例えば、これらに限定されないが、ポリメラーゼ連鎖反応(PCR)(Saiki et al.(1985)Science 230:1350〜1354)、逆転写PCR(RT−PCR)(Joyce(2002)、Methods Mol Biol.193:83−92、およびEmrich et al.(2002)、Methods Mol Biol.191:99−108)、リガーゼ連鎖反応(LCR)(Lee(1996)Biologicals 24(3):197−9)、ポリメラーゼリガーゼ連鎖反応(Barany et al.(1991)PCR Methods Appl.1(1):5−16)、Gap−LCR(Abravaya et al.(1995)Nucleic Acids Res.23(4):675−82)、鎖置換増幅(SDA)(Walker(1993)PCR Methods Appl.3(1):1−6)、連結線形増幅(LLA)(Killeen et al.(2003)Clin Chem.49(7):1050−7)、ローリングサークル増幅(RCA)(Nilsson et al.(2002)Nucleic Acids Res.30(14):e66)、転写媒介増幅(TMA)(Emery et al.(2000)J Clin Microbiol 38:2688−2695)、核酸配列ベースの増幅(NASBA)(Mani et al.(1999)J Acquir Immune Defic Syndr 22:208−209 and Berndt et al.(2000)J Virol Methods 89:177−181)、転写ベースの増幅(Kwoh、D.Y、and Kwoh、T.J、American Biotechnology Laboratory、October、1990)自立配列複製(3SR)(Mueller et al.(1997)Histochem Cell Biol 108:431−7)およびデジタルPCR(Dressman et al.(2003)PNAS 15:8817−22)などを使用して達成することができるPCRは、変性、プライマーによるアニーリング、酵素(通常はポリメラーゼ)による伸長のサイクルを使用して、標的DNAまたは核酸配列のコピー数を約10倍以上増幅する手法である。核酸を増幅するためのポリメラーゼ連鎖反応プロセスは、米国特許第4,683,195号および第4,683,202号に記載されており、それらは、プロセスの説明のため、参照により本明細書に組み込まれている。本明細書で使用される「共増幅」は、単一の増幅反応(例えば、多重化増幅)において、同じ反応混合物(例えば、同じ容器、エマルジョンまたは入れ物)内の2つ以上の異なる遺伝子座から複数のコピーが作製されるプロセスを指す。
本明細書で使用される場合、「アンプリコン」は、別の分子をコピーまたは転写することによって作製された分子を指す。アンプリコンを生成することができる例示的なプロセスには、転写、クローニング、またはポリメラーゼ連鎖反応(「PCR」)または他の核酸増幅技術(例えば、鎖置換PCR増幅(SDA)、二重鎖PCR増幅、ローリングサークル増幅など)が含まれる。典型的には、アンプリコンは、選択された核酸配列(例えば、テンプレートDNA、標的核酸またはゲノムDNA断片)のコピーであるか、またはそれに相補的である。
本明細書で使用される場合、「ハイブリダイズする」という用語は、溶液中または固体支持体上の2つ以上の成分間で結合して複合体を形成することを指す。核酸は、互いに結合すると「ハイブリダイズする」。核酸は、水素結合、溶媒排除、塩基スタッキングなど、十分に特徴付けられた様々な物理化学的力によってハイブリダイズする。ハイブリダイゼーションは、完全に相補的な核酸鎖間、またはミスマッチの領域を含む部分的に相補的な核酸鎖間で起こり得る。許容されるミスマッチの程度は、一般に、ハイブリダイゼーション条件を適切に調整することによって制御することができる。核酸化学および分子生物学の当業者は、例えば、核酸の長さおよび塩基対濃度、イオン強度、およびミスマッチ塩基対の発生率を含む多くの変数を考慮することによって、経験的に二重鎖安定性を判定することができる。核酸のハイブリダイゼーションに関する広範なガイドは、Tijssen(1993)Laboratory Techniques in Biochemistry and Molecular Biology−−Hybridization with Nucleic Acid Probes part I chapter 2「Overview of principles of hybridization and the strategy of nucleic acid probe assays」(Elsevier、N.Y)、およびAusubel(Ed.)Current Protocols in Molecular Biology、Volumes I、II、およびIII、(1997)に見出され、それらは各々参照により組み込まれている。Hames and Higgins(1995)Gene Probes 1 IRL Press(Oxford University Press、Oxford、England)(Hames and Higgins 1)、およびHames and Higgins(1995)Gene Probes 2 IRL Press(Oxford University Press、Oxford、England)(Hames and Higgins 2)は、オリゴヌクレオチドを含む、DNAおよびRNAの合成、標識、検出および定量化に関する詳細を提供し、これらは両方とも参照により本明細書に組み込まれる。いくつかの態様では、ハイブリダイゼーションは、プライマーとゲノムDNA断片との間、またはオリゴヌクレオチドプローブとゲノムDNA断片との間で起こり得る。
本明細書で使用される場合、「単形性」は、ただ1つの対立遺伝子パターンが、集団のすべてのメンバーの正常なゲノムDNAに存在することが見出された、ゲノムDNAの遺伝子座を指す。
本明細書で使用される場合、「準単形性」は、ただ1つの対立遺伝子パターンが、集団のほぼすべてのメンバーの正常なゲノムDNAに存在することが見出された、ゲノムDNAの遺伝子座を指す。MONO−11またはMONO−27などの単形性または準単形性遺伝子座が増幅されると、結果として得られる増幅された対立遺伝子のサイズを、一般集団のその遺伝子座で最も頻繁に見られる対立遺伝子サイズと比較できる。一実施形態では、本明細書に開示される方法は、同じ個体からのゲノムDNAの2つのサンプルを増幅することによって対象のMSI腫瘍を検出することができ、ここで得られるサンプルの1つは、正常な非癌性サンプルから、もう1つのサンプルは、癌性(または癌性の疑いのある)サンプルからのものである。
本明細書で使用される場合、「オリゴヌクレオチド」または「プローブ」は、適切な条件下でゲノムDNA(例えば、ヒトゲノムDNA断片)または標的核酸にハイブリダイズすることができる、標識または非標識オリゴヌクレオチド(例えば、少なくとも12、14、16、18、20、またはそれ以上のヌクレオチドのオリゴヌクレオチド)を指す。典型的には、プローブは、ゲノムDNA内に含まれる特定の核酸配列に十分に相補的であり、選択されたハイブリダイゼーション条件下でゲノムDNAと安定したハイブリダイゼーション二重鎖を形成する。十分に厳格なハイブリダイゼーション条件下でプローブを使用して実施されるハイブリダイゼーションアッセイは、核酸配列の変異型または変形など、特定の核酸配列の選択的検出を可能にする。「ハイブリダイズする領域」という用語は、ゲノムDNAまたは標的核酸に厳密にまたは実質的に相補的であり、したがってハイブリダイズするプローブの領域を指す。ハイブリダイズする領域は、オリゴヌクレオチド全体を指すことができるが、プローブは、例えば、プローブ配列を固体支持体などに付着させるための部位を提供するリンカー結合部位として機能する、追加のヌクレオチド配列を含み得る。特定の実施形態では、5’−ヌクレアーゼプローブ、FRETプローブ、分子ビーコンなどのプローブは、1つ以上の標識(例えば、レポーター染料、消光剤部分など)を含む核酸分子に含まれ、サンプル中の標的核酸からのプローブの解離を検出するために利用することができる。いくつかの実施形態では、プローブのハイブリダイズする領域は、標的核酸に対して完全に相補的である。しかしながら、一般に、完全な相補性は必要ではない(すなわち、核酸は互いに部分的に相補的であってもよい)。安定した二重鎖は、限定されたミスマッチの塩基またはアンマッチの塩基を含み得る。ストリンジェンシー条件を修正して、1つ以上の塩基対のミスマッチまたはアンマッチ塩基を伴う安定したハイブリダイゼーション二重鎖を容認することが必要な場合がある。Sambrook et al.、Molecular Cloning:A Laboratory Manual、3rd Ed.、Cold Spring Harbor Laboratory Press、Cold Spring Harbor、N.Y.(2001)は、参照により組み込まれ、適切な修正のためのガイダンスを提供する。二本鎖の安定性は、標的核酸の長さ、標的核酸の塩基組成(例えば、GC含量)およびオリゴヌクレオチドプローブの配列、温度、ならびにイオン条件を含む、多くの変数に依存する。当業者は、一般に、所与のオリゴヌクレオチドプローブの的確な補体が、プローブとして同様に有用であることを認識するであろう。当業者はまた、特定の実施形態では、オリゴヌクレオチドプローブがプライマーとしても使用され得ることを認識するであろう。
本明細書で使用される場合、「プライマー」は、プライマーの3’末端が、DNAポリメラーゼ酵素の存在下で重合の部位として作用することができるように、標的DNA(例えば、ゲノムDNA)の鎖にハイブリダイズする一本鎖オリゴヌクレオチドまたはDNA断片を指す。「プライマー対」は、増幅されるヌクレオチド領域に隣接する、標的DNA分子(例えば、ゲノムDNA断片)の反対側の鎖にハイブリダイズするプライマーの対を指す。典型的には、「プライマー結合部位」は、プライマーまたはプライマー対がハイブリダイズする標的DNAの領域を指す。「遺伝子座特異性」プライマーまたは「標的特異性」プライマーは、記載された遺伝子座またはその相補鎖の一部と、遺伝子座の少なくとも1つの対立遺伝子について特異的にハイブリダイズし、増幅法で使用される条件下では他のDNA配列と効率的にハイブリダイズしないプライマーを指す。逆に、「ユニバーサルプライマー」は、DNAの標的特異性または遺伝子座特異性領域を標的とせずに、サンプル中に存在するDNAの領域のランダムな増幅を最大化するように設計されたプライマーを指す。一般に、ユニバーサルプライマーは、約6〜約12ヌクレオチド長のランダムな核酸配列を含み、選択されたハイブリダイゼーション条件下でゲノムDNA、またはランダムな核酸配列(例えば、アダプターオリゴヌクレオチド)を有する選択された核酸分子内の複数の位置に効率的にハイブリダイズすることを目的とする。
本明細書で使用される場合、2つ以上の核酸配列の状況における「同一」または「パーセント同一性」という用語は、例えば配列比較アルゴリズムの1つを使用して、または目視検査によって測定された最大の一致について、比較またはアラインした場合、同一であるか、または同一のヌクレオチド特定のパーセンテージを有する(すなわち、%同一)2つ以上の配列を指す。配列アラインメントならびにパーセント配列同一性および配列類似性の決定に適した例示的なアルゴリズムは、BLASTプログラムであり、Altschul et al.(1990)「Basic local alignment search tool」J.Mol.Biol.215:403−410、Gish et al.(1993)「Identification of protein coding regions by database similarity search」Nature Genet.3:266−272、Madden et al.(1996)「Applications of network BLAST server」Meth.Enzymol.266:113−141、Altschul et al.(1997)「Gapped BLAST and PSI−BLAST:a new generation of protein database search programs」Nucleic Acids Res.25:3389−3402、およびZhang et al.(1997)「PowerBLAST:A new network BLAST application for interactive or automated sequence analysis and annotation」Genome Res.7:649−656に記載され、これらの各々は、参照によりその全体が本明細書に組み込まれる。
2つの核酸配列間の同一性パーセントは、一般に、様々な方法またはコンピュータプログラムの標準的なデフォルトパラメータを使用して計算される。本明細書で使用される場合、2つの核酸分子間の高度の配列同一性は、典型的には、約90%の同一性〜100%の同一性、例えば、約90%以上の同一性、好ましくは約95%以上の同一性、より好ましくは約98%以上の同一性である。本明細書で使用される場合、2つの核酸分子間の中程度の配列同一性は、典型的には、約80%の同一性〜約85%の同一性、例えば、約80%以上の同一性、好ましくは約85%の同一性である。本明細書で使用される場合、2つの核酸分子間の低度の配列同一性は、典型的には、約50%の同一性〜75%の同一性、例えば、約50%の同一性、好ましくは約60%の同一性、より好ましくは約75%の同一性である。
本明細書で使用される場合、「アレイ」は、これらに限定されないが、ガラスまたはビーズなどの表面上に配置された、またはin−situ合成された複数のオリゴヌクレオチドを指す。DNAアレイは、通常、ランダムまたは順序付けられた方法で表面にスポットされた複数のオリゴヌクレオチドプローブを含む。オリゴヌクレオチドプローブは、高いストリンジェンシー条件下で、サンプルに存在する相補的核酸配列にハイブリダイズする。ハイブリダイゼーションは、フルオロフォアまたは化学発光を含む様々な手段によって、検出および/または定量化することができる。
本明細書で使用される場合、「異種薬剤」は、本来核酸分子との組み合わせでは見られない薬剤を指す。一実施形態では、異種薬剤は、異なる生物に由来し得る(例えば、ヒト由来の核酸分子に付着したヤギまたはマウス由来の抗体)。別の実施形態では、異種薬剤は、これらに限定されないが、FAMまたは32Pなどの標識を含むことができる。この例では、FAMまたは32Pは、核酸分子に人工的に連結、コンジュゲート、結合、付着、またはその他の方法で関連付けられる。さらに別の実施形態では、異種薬剤は、ビオチン(例えば、核酸のビオチン化)を含むことができる。ビオチンは、ストレプトアビジンおよびアビジンに高い親和性および特異性で結合し、これらの相互作用を利用して、ビオチン化核酸分子を他の成分から分離することができる。
本明細書で使用される場合、遺伝子座の「反復長分布」または「RLD」は、遺伝子座を含有するシーケンシングリードの反復単位の分布を指す(例えば、リードまたはエレクトロフェログラムのアラインメントに基づいて決定される)。遺伝子座のRLDは、ヒストグラム(つまり、長さの範囲内の各長さの値)として定義でき、各長さの値は、その特定の長さの反復単位を有するシーケンシングリードの数に対応する。RLDは、マイクロサテライト遺伝子座を含むサンプルから得られたシーケンシングリードの分析によって決定される。マイクロサテライト遺伝子座を含む配列リードは、参照ゲノム(例えば、hg38(Human Genome version 38)、マイクロサテライト遺伝子座に反復単位を欠くサンプル、またはマイクロサテライト遺伝子座に既知の数の反復単位を有するサンプル)に対してアラインされ得る。シーケンシングリードのアラインメントから目的のマイクロサテライト遺伝子座まで、シーケンシングリードに存在する反復単位の数を測定できる。単一分子技術が使用される(または少なくとも完全な配列がマイクロサテライト遺伝子座全体に広がっている)場合、反復単位の数は、特定の遺伝子座にアラインされた後、シーケンシングリードから直ちに測定できる。シーケンシングリードのアラインメント、ゲノムDNA断片の増幅、または他の操作/工程は、シーケンシングリードに1つ以上のエラーを持ち込む可能性があり、それは反復単位として現れ得るか、または参照ゲノムに対するシーケンシングリードのアラインメントに影響を与える得ることは、理解されるだろう。例えば、遺伝子座1のRLD(表1を参照)は、MSS(例えば非癌性)細胞では、約13反復単位〜約22反復単位であることが典型的に確認される。
本明細書で使用される場合、「基準値」は、測定の標準を指す。一実施形態では、RLDの基準値は、例えば、参照RLDとの比較に基づいて決定される。RLDの基準値には、RLDを適切に表すための1つ以上の統計分析を含めることができる。いくつかの実施形態では、RLDの基準値は、スチューデントのt検定またはウィルコクソンの順位検定などのt統計量である。したがって、RLDは、1つ以上の統計値によって表すことができ、第1の遺伝子座のサンプルRLDのこれらの統計値は、参照RLDの対応する統計値と比較することができる。いくつかの実施形態では、基準値は、RLDの要約された統計の1つ以上である。このような統計の例には、平均、変動、歪度、尖度などが含まれる。他の実施形態では、基準値は、試験されたサンプルのRLDと対照RLDとの間の類似性の尺度である。例としては、t統計量、カイ二乗統計量、コルモゴロフ−スミルノフ統計量、カルバック−ライブラー情報量、相関距離、余弦距離、ユークリッド距離、マンハッタン距離などが含まれる。いくつかの実施形態では、t統計量は、試験サンプルのRLDおよび対照RLDに基づいて決定される。一般に、RLDの基準値は、評価中のマイクロサテライト遺伝子座ごとに取得される。そのような距離基準値は、サンプルRLDの生の値と参照RLDとの間の差異または比率、例えば、所定の反復長を有するリードの正規化数に基づいて決定され得る確率間の差異に基づくことができる。ここで正規化は、所定の測定におけるリードの総数を使用できる。正規化の別の例は、例えば、エレクトロフェログラムとして決定されたヒストグラムの総面積に基づくことができる。
本明細書で用いる場合、「ナノポア」は、膜または他のバリア材料に形成されるか、さもなければ提供される、約0.1nm〜約1,000nmの特徴的な幅または直径を有する細孔、チャネル、または通路を指す。ナノポアは、黄色ブドウ球菌由来のα−溶血素などの天然に存在する細孔形成タンパク質、またはα−HL−C46などの非天然の(すなわち、操作された)もしくは天然に存在する、野生型細孔形成タンパク質の変異体もしくは変形から作ることができる。膜は、脂質二重層のような有機膜、または天然に存在しないポリマー材料から作られた合成膜であり得る。ナノポアは、センサ、センシング回路、または例えば相補型金属酸化膜半導体(complementary metal−oxide semiconductor:CMOS)回路もしくは電界効果トランジスタ(field effect transistor:FET)回路のようなセンシング回路に結合された電極に隣接して、または近接して配置することができる。したがって、ナノポアを使用して、目的の核酸配列をシーケンシングすることができる(米国特許公開番号第20100331194号、20140019064号、20150176071号、20160281159号、および20170016048号を参照)。
本明細書で使用される場合、「固体支持体」は、オリゴヌクレオチドプローブなどの化学部分で誘導体化され得るか、そうでなければ化学部分に付着され得る固体材料を指す。例示的な固体支持体には、プレート、ビーズ、マイクロビーズ、チューブ、繊維、ウィスカー、コーム、ハイブリダイゼーションチップ(GeneChip(商標)プローブアレイ(Affymetrix、Inc.、Santa Clara、Calif.,USA)で使用されるものなどのマイクロアレイ基板を含む)、膜、単結晶、セラミック層、自己組織化単分子膜などが含まれる。
「癌」という用語は、異常な細胞の無制御な増殖を特徴とする疾患を指す。この用語には、悪性、良性、軟部組織、または固形として特徴付けられるかどうかにかかわらず、すべての既知の癌および腫瘍性状態、ならびに転移前および転移後の癌を含むすべてのステージおよびグレードの癌が含まれる。様々な種類の癌の例には、胃癌(例えば、胃の癌)、結腸直腸癌、胃腸間質腫瘍、胃腸カルシノイド腫瘍、結腸癌、直腸癌、肛門癌、胆管癌、小腸癌、食道癌などの消化器および消化管癌、乳癌、肺癌、胆嚢癌、肝臓癌、膵臓癌、虫垂癌、前立腺癌、卵巣癌、子宮頸癌、子宮癌、腎臓癌、中枢神経系の癌、皮膚癌(例、黒色腫)、リンパ腫、神経膠腫、絨毛癌、頭頸部癌、骨肉腫、ならびに血液癌が含まれるが、これらに限定されない。本明細書で使用される場合、「腫瘍」は、1つ以上の癌性細胞を含む。いくつかの実施形態では、癌は、結腸直腸癌である。
「薬剤」という用語は、天然または合成のいずれかの任意の分子、例えば、ペプチド、タンパク質、オリゴペプチド(例えば、長さが約5〜約25のアミノ酸、例えば、約5、10、15、20、または25の長さのアミノ酸)、小さな有機分子(例えば約2500ダルトン未満、例えば2000未満、1000未満、または500ダルトン未満の分子量を有する有機分子)、環状ペプチド、ペプチド模倣物、抗体、多糖類、脂質、脂肪酸、阻害性RNA(例えば、siRNA、shRNAまたはsgRNA)、ポリヌクレオチド、オリゴヌクレオチド、アプタマー、および薬物化合物を指す。典型的には、薬剤は、薬剤が投与される対象に対して治療効果を有することを意図している。場合によっては、薬剤には、ペムブロリズマブなどの免疫チェックポイント阻害剤が含まれ得る。
本明細書で使用される場合、「治療」、「治療している」、および「治療する」という用語は、傷害、疾患、または状態の治療または改善におけるなんらかの成功の兆候を指し、あらゆる客観的または主観的パラメータ、例えば症状の軽減、緩和、減弱、または傷害、疾患、もしくは状態を対象にとってより許容可能にすること、衰退または衰弱の速度の低下、衰退の最終点での衰弱の重度の低下、および/または対象の身体的または精神的健康の改善などを含む。
「医薬組成物」という用語は、対象への投与に適した組成物を指す。典型的には、医薬組成物は薬剤を含む。一般に、医薬組成物は無菌であり、好ましくは、対象において望ましくない反応を誘発し得る汚染物質を含まない。医薬組成物は、経口、静脈内、頬側、直腸、非経口、腹腔内、皮内、気管内、筋肉内、皮下、吸入などを含む多様な投与経路によってそれを必要とする対象に投与するために設計することができる。
薬剤(例えば、癌を治療する薬剤)の「治療量」または「治療有効量」は、対象における癌の症状の重症度を予防、緩和、軽減、または低減する薬剤の量である。
「投与する」、「投与される」、または「投与している」という用語は、生物学的作用の所望の部位に薬剤を送達する方法を指す。これらの方法には、局所送達、非経口送達、静脈内送達、皮内送達、筋肉内送達、結腸送達、直腸送達、または腹腔内送達が含まれるが、これらに限定されない。本明細書に記載の薬剤および方法とともに任意選択で使用される投与技術には、例えば、Goodman and Gilman、The Pharmacological Basis of Therapeutics、current ed.;Pergamon;およびRemington’s、Pharmaceutical Sciences(current edition)、Mack Publishing Co.、Easton、PAにて論じられているものを含む。
III.検出方法
一態様では、サンプルおよび/または対象におけるMSIを検出する方法が提供される。いくつかの実施形態では、記載された方法は、癌を有するかまたは癌を有することが疑われる対象におけるMSIの検出に関する。別の態様では、方法は、サンプルにおける、MSI腫瘍に関連するマイクロサテライト遺伝子座のセットを検出することに関する。本明細書に開示される方法は、特にゲノムDNA断片の存在量が少ない場合(例えば、ctDNA)に、対象からのサンプル中のゲノムDNA断片の、例えば、NGSによる同定および/または定量化を提供する。記載された方法は、臨床サンプル(例えば、患者サンプル)のマイクロサテライト遺伝子座の正確な検出および定量化を保証する。これは、ゲノムDNA断片が不正確に正規化または定量化された場合、悪影響を受ける可能性がある。さらに、本明細書で提供される方法は、場合により固体支持体に付着され得るオリゴヌクレオチドプローブの使用を通じて(例えば、選択的濃縮)、マイクロサテライト遺伝子座を有するゲノムDNA断片の収量を増加させるために使用され得る。
本明細書に記載されるように、サンプル中の複数のマイクロサテライト遺伝子座を検出することで、所定の閾値と比較して、サンプルが得られた対象におけるMSIを予測できることが見出された。一般に、この方法は、複数のマイクロサテライト遺伝子座について、ヒトゲノムDNAからのシーケンシングリードを検出することを含む。サンプル中のMSIを検出するための例示的なワークフローを、図2に示す。図2のワークフロー内のいくつかの工程は、例えば、サンプルが前以って精製され、シーケンシングのために準備されている場合、省略および/または反復され得ることは、容易に明らかであろう。
いくつかの実施形態では、サンプルは、血液サンプル、無細胞DNA、または組織サンプルである。一実施形態では、サンプルは、採血またはリキッドバイオプシーである。いくつかの実施形態では、サンプルは、腫瘍組織サンプルである。いくつかの実施形態では、対象はヒトであり、ヒトは癌を有することが疑われているか、または癌を有する。一実施形態において、癌は結腸直腸癌である。いくつかの実施形態では、対象は、癌を治療するために使用される1つ以上の治療薬で治療される。一実施形態では、治療薬はペムブロリズマブである。
一態様では、本開示は、一般に、MSIを検出するための方法に関する。方法は、(1)ヒトゲノムDNAからのシーケンシングリードを複数のマイクロサテライト遺伝子座について検出すること、(2)各マイクロサテライト遺伝子座の反復長分布(RLD)の基準値を決定すること、(3)基準値を、各自独立した閾値を有するマイクロサテライト遺伝子座の閾値と比較すること、(4)閾値を超えるRLD基準値を有するマイクロサテライト遺伝子座の数を定量化すること、および(5)閾値を超えるRLD基準値を有するマイクロサテライト遺伝子座の数をマイクロサテライト不安定性(MSI)比率閾値と比較すること(そのマイクロサテライト遺伝子座の数がMSI比例閾値を超えていれば、ヒトはマイクロサテライト不安定性を有する)を含む。
いくつかの実施形態では、検出は、ゲノムDNAからヌクレオチドシーケンシングリードを生成すること、およびマイクロサテライト遺伝子座を含むシーケンシングリードを、シーケンシングリードをマイクロサテライト遺伝子座DNA配列のセットにアラインメントすることによって同定すること、およびマイクロサテライト遺伝子座を含むと決定された各シーケンシングリードの反復長の数をカウントし、それによって各マイクロサテライト遺伝子座のRLDを生成することを含む。
一実施形態では、ヌクレオチドシーケンシングリードを生成する前に、マイクロサテライト遺伝子座含有DNAにハイブリダイズするオリゴヌクレオチドプローブにゲノムDNAをハイブリダイズすることによって、ゲノムDNAをマイクロサテライト遺伝子座について濃縮する。いくつかの実施形態では、濃縮されたゲノムDNAを洗浄して、未結合または非特異性核酸を除去する。
一実施形態では、RLDの基準値は、t統計量である。いくつかの実施形態では、RLDの基準値は、反復単位の平均リード長および目的のマイクロサテライト遺伝子座でのRLDの分散に基づくt統計量を含むことができる。いくつかの実施形態では、t統計量は、試験サンプルのRLDおよび対照RLDに基づいて決定される。
一実施形態では、複数のマイクロサテライト遺伝子座は、マイクロサテライト遺伝子座のセットを含み、マイクロサテライト遺伝子座のセットは、遺伝子座:1〜170に対応するマイクロサテライト遺伝子座の群から選択される(表1を参照)。いくつかの実施形態では、マイクロサテライト遺伝子座のセットは、マイクロサテライト遺伝子座:1〜64に対応するマイクロサテライト遺伝子座の群に対応する、少なくとも58のマイクロサテライト遺伝子座から選択される。いくつかの実施形態では、マイクロサテライト遺伝子座のセットは、表2のマイクロサテライト遺伝子座(すなわち、表1の遺伝子座1〜4、6〜9、11〜21、23、25〜29、31〜48および50〜64)を含む。別の実施形態では、マイクロサテライト遺伝子座のセットは、遺伝子座:1〜64に対応するマイクロサテライト遺伝子座の群から選択される、10以上のマイクロサテライト遺伝子座から選択される。いくつかの実施形態では、マイクロサテライト遺伝子座のセットは、遺伝子座:1〜170に対応するマイクロサテライト遺伝子座の群から選択される、少なくとも10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、またはそれ以上のマイクロサテライト遺伝子座である。別の実施形態では、マイクロサテライト遺伝子座のセットは、遺伝子座:1〜64に対応するマイクロサテライト遺伝子座の群から選択される、少なくとも10、20、30、40、または50のマイクロサテライト遺伝子座である。一実施形態では、複数のマイクロサテライト遺伝子座は、表2に対応するマイクロサテライト遺伝子座の群である。
いくつかの実施形態では、複数のマイクロサテライト遺伝子座は、ヒトゲノムの1つ以上の染色体に存在するゲノム座標から選択される。別の実施形態では、複数のマイクロサテライト遺伝子座は、human genome38(hg38)に記載されているマイクロサテライト遺伝子座の、以下のゲノム座標の1つ以上から選択される。
Figure 2021528094
Figure 2021528094
Figure 2021528094
Figure 2021528094
Figure 2021528094
Figure 2021528094
いくつかの実施形態では、複数のマイクロサテライト遺伝子座は、モノ、ジ、トリ、テトラ、ペンタ、またはヘキサヌクレオチドの反復単位を含む。一実施形態では、複数のマイクロサテライト遺伝子座は、モノ、ジ、および/またはトリヌクレオチドの反復単位を含む(例えば、(A17)、(T14)、(AC21)、(TG20)(TCT))。いくつかの実施形態では、シーケンシングリードが細胞の代用である場合、シーケンシングリードから決定される反復単位長は、約2〜約100の反復単位、約5〜約80の反復単位、約10〜約60の反復単位、および約15〜約40の反復単位であろう。
いくつかの実施形態では、方法は、(1)ヒトゲノムDNA断片を含むサンプルを提供すること、(2)オリゴヌクレオチドプローブのプールをサンプルに接触させること、(3)プールオリゴヌクレオチドプローブとのハイブリダイゼーション複合体において、マイクロサテライト遺伝子座を含むDNA断片を捕捉し、それにより捕捉されたDNAを生成すること、(4)ハイブリダイゼーション複合体を未結合核酸から分離すること、(5)ハイブリダイゼーション複合体から捕捉されたDNAを溶出すること、(6)ハイブリダイゼーション複合体から溶出された、捕捉されたDNAをシーケンシングすること、(7)シーケンシングリードをマイクロサテライト遺伝子座DNA配列のセットにアラインメントすることにより、マイクロサテライト遺伝子座を含むシーケンシングリードを同定すること、および(8)マイクロサテライト遺伝子座を含むと判定された各シーケンシングリードの反復長の数をカウントし、それによって各マイクロサテライト遺伝子座のRLDを生成することを含む。
いくつかの実施形態では、オリゴヌクレオチドプローブのプールをサンプルと接触させる前に、アダプターオリゴヌクレオチドをヒトゲノム断片に連結、付着、または結合させる。一実施形態では、アダプターオリゴヌクレオチドは、1つ以上のバーコード、ユニバーサルプライマー結合部位を含むか、または1つ以上のバーコードおよびユニバーサルプライマー結合部位を含む。いくつかの実施形態では、アダプターオリゴヌクレオチドは、ゲノムDNA断片の3’および5’末端の両方に連結されて、平滑末端二本鎖ゲノムDNA断片を形成する。ユニバーサルプライマー結合部位を有するアダプターオリゴヌクレオチドを後続の増幅工程で使用して、ゲノムDNA断片にライゲーションされたアダプター配列を増幅することができる。
いくつかの実施形態では、シーケンシングの前に、捕捉されたDNAは、アダプターオリゴヌクレオチドに存在するユニバーサルプライマー結合部位にハイブリダイズするユニバーサルプライマーで増幅される。
いくつかの実施形態では、シーケンシングは、ナノポアベースシーケンシングである。
別の実施形態では、方法は、(1)ヒトゲノムDNA断片を含むサンプルを提供すること、(2)オリゴヌクレオチドプローブのプールをサンプルと接触させるマイクロサテライト遺伝子座に特異的なオリゴヌクレオチドプライマーを用いて、マイクロサテライト遺伝子座を含むDNA断片を増幅して、アンプリコンを生成すること、(3)アンプリコンをシーケンシングすること、(4)シーケンシングリードをマイクロサテライト遺伝子座DNA配列のセットにアラインメントすることにより、マイクロサテライト遺伝子座を含むシーケンシングリードを同定すること、および(5)マイクロサテライト遺伝子座を含むと判定された各シーケンシングリードの反復長の数をカウントし、それによって各マイクロサテライト遺伝子座のRLDを生成することを含む。
DNA抽出
一般に、DNA抽出の任意の方法を使用して、本発明で使用するためのゲノムDNAまたはゲノムDNA断片を単離することができる。好ましい実施形態では、ゲノムDNAは、溶液ベースまたは固相ベースのDNA抽出技術を使用して、組織、細胞、リキッドバイオプシーサンプル、血液または血漿サンプルから抽出される。ゲノムDNA抽出には、洗浄剤ベースの細胞溶解、核タンパク質の変性、および場合により汚染物質の除去が含まれ得る。例えば、溶液ベースのDNA抽出法は、これらに限定されないが、塩析法または有機溶媒/カオトロープ法を含むことができ、一方、固相DNA抽出法は、これらに限定されないが、シリカ樹脂法、陰イオン交換法、または磁気ビーズを含むことができる(例えば、Chacon−Cortes and Griffiths J.Biorepository Sci App Med.、(2014)2:1−9を参照されたい)。
通常、DNAは、工程または操作のプロセスを通してサンプルから抽出される。
一般に、サンプルは溶解剤で処理され、サンプルに存在する無傷の細胞を溶解する。溶解した細胞から放出されたDNAは、固体支持体、カラム、または膜に結合でき、そこで1つ以上の洗浄工程を経て、汚染物質および/またはタンパク質などの非DNA成分をサンプルから除去できる。最後に、結合したDNAを固体支持体、カラム、または膜から解放し、さらなる処理の準備ができるまで適切なバッファー中に保存することができる。
いくつかの実施形態では、ゲノムDNAは、例えば、超音波処理、噴霧化、酵素、または音響剪断法によって、より小さなゲノムDNA断片へと剪断、または分解され得る。
いくつかの実施形態では、サンプルが血液サンプル(例えば、末梢または全血採取)である場合、サンプルは、赤血球および白血球の溶解工程、続いて放出されたゲノムDNAの固体支持体への結合、適切な洗浄バッファーによる固体支持体の洗浄、および固体支持体からの結合ゲノムDNAの、適切な溶液への溶出を経ることができる。
いくつかの実施形態にでは、サンプルが循環腫瘍DNA(ctDNA)(例えば、血漿サンプルまたはリキッドバイオプシーサンプル)を含む場合、ctDNAを精製および/または濃縮して、元のサンプルに存在する少量のctDNAを増幅することができる。AVENIO cfDNA分離キットおよびAVENIO ctDNA濃縮キット(Roche Sequencing Solutions、Pleasanton,CA)など、他の細胞またはサンプル成分からctDNAを分離、精製、および/または濃縮するための様々な市販キットが存在する。
核酸ライブラリの調製
ゲノムDNA(例えば、cfDNAおよびctDNA)が得られると、ゲノムDNAは、一般に、1つ以上の追加の処理工程に供されて、シーケンシングの前に任意選択で濃縮される核酸分子のライブラリを生成する。
核酸分子のシーケンシングライブラリは、本明細書で提供される方法、組成物およびシステム、または当技術分野で知られている任意の適切な方法を使用して、サンプルから生成することができる。次世代シーケンシング用のサンプル調製のための、様々な市販キットが存在する(例えば、AVENIO ctDNA Targeted Panel、カタログ番号:08061068001(Roche Sequencing Solutions、Pleasanton,CA);Ion Ampliseq Library Kit 2.0、ThermoFisher Scientific、カタログ番号:4475345)。一実施形態では、シーケンシングライブラリは、本明細書に開示されるかまたは当技術分野で知られているシーケンシングシステムのいずれかと互換性のある、複数の標的核酸(例えば、ゲノムDNA断片)を含む。いくつかの実施形態では、サンプルから生成されたシーケンシングライブラリは、Illuminaシーケンシングプラットフォーム(例えば、HiSeqまたはMiSeq)で使用するために調製される。場合により、シーケンシングライブラリで使用するために調製されたゲノムDNA断片は、下流の分析または分類を助けるために、ゲノムDNA断片の一端または両端に付加された1つ以上のオリゴヌクレオチドアダプターを含み得る。場合により、シーケンシングライブラリのゲノムDNA断片は、例えば、第1のサンプルからのゲノムDNA断片の1つのセットを第2のサンプルから調製されたゲノムDNA断片から区別するためにバーコードを含み得る(例えば、2つの異なる供給源からのサンプル、または同じ供給源の癌性組織および隣接する健康なサンプル(すなわち、一致した正常なサンプル))。
シーケンシングライブラリを調製するための工程は、サンプルからのゲノムDNAを取得すること(例えば、単離または抽出)、ゲノムDNAを断片化すること、オリゴヌクレオチドアダプターライゲーション(例えば、DNA断片の末端修復および3’末端のポリアデニル化)のためにゲノムDNAを調製すること、ゲノムDNA断片の一端または両端へオリゴヌクレオチドアダプターをライゲーションすること、ライゲーションされたゲノムDNA断片を精製すること、ライゲーションされたゲノムDNA断片を1つ以上のプライマーを使用して増幅し、それによってゲノムDNA断片のアンプリコンを形成すること、アンプリコンをハイブリダイズして、捕捉されたDNAを生成すること、捕捉されたDNAを他の非結合核酸から分離すること、溶出されたDNAを増幅すること、および溶出されたDNAをシーケンシングのために保存することのうち、1つ以上を含み得る。
他の実施形態では、シーケンシングライブラリを調製するための工程は、ライゲーションされたオリゴヌクレオチドアダプターゲノムDNA断片を濃縮すること、1つ以上のプライマーを使用して、濃縮された、ライゲーションされたオリゴヌクレオチドアダプターゲノムDNA断片を増幅し、それによりゲノムDNA断片のアンプリコンを形成して、シーケンシングプラットフォーム上のアンプリコンをシーケンシングすることのうち、1つ以上を含み得る。
いくつかの実施形態では、ゲノムDNAは、DNA研磨、末端修復、およびAテーリングのうちの1つ以上を経る。例えば、ゲノムDNAが超音波処理によって調製される場合、断片化されたゲノムDNAは、5’リン酸および3’ヒドロキシル基を有する平滑末端ゲノムDNA断片に変換され得る(例えば、T4 PNK、KlenowおよびT4 DNAポリメラーゼを使用)。様々な市販キット、例えば、限定されないが、NEB Next Ultra II DNA Library Prep Kit for Illumina(New England BioLabs、カタログ番号:E7645S)などが、ゲノムDNAの処理に利用できる。いくつかの実施形態では、ゲノムDNAを処理して、二本鎖平滑末端ゲノムDNA断片を得る。好ましい実施形態では、平滑末端ゲノムDNA断片は、平滑末端オリゴヌクレオチドアダプターライゲーションに使用することができる。
いくつかの実施形態では、ゲノムDNAは、二本鎖ゲノムDNA断片が得られるように、DNA研磨、末端修復、およびAテールの付加に供される。好ましい実施形態では、ゲノムDNAの処理は、処理されたゲノムDNA断片の5’および/または3’末端への1つ以上のアダプターオリゴヌクレオチドのライゲーションの前に、平滑末端二本鎖核酸分子をもたらす。
アダプターオリゴヌクレオチド
特定の実施形態では、ゲノムDNA断片(例えば、場合により二本鎖核酸構造を有する、目的の核酸分子)は、アダプターオリゴヌクレオチドに付着される。いくつかの実施形態では、アダプターオリゴヌクレオチドは、オーバーハングまたは平滑末端を含むように設計することができる。好ましい実施形態では、アダプターオリゴヌクレオチドは、ゲノムDNA断片にライゲーションされた場合に、目的の平滑末端二本鎖核酸分子を作成するように設計されている。一実施形態では、アダプターオリゴヌクレオチドは、ユニバーサル配列を含む。本明細書で使用される場合、「ユニバーサル配列」は、例えば、ライゲーションまたは本明細書に開示される他の方法によって、ユニバーサル配列が複数のゲノムDNA断片に付着するように、ゲノムDNA断片に付着することができる配列を指す。したがって、ユニバーサル配列は、それが付着している多様なゲノムDNA断片に「共通」である。本明細書に開示されるように、ユニバーサル配列は、複数のサンプルを同時に分析するために特に有用である。ユニバーサル配列の例は、ユニバーサルプライマーおよびユニバーサルプライミング部位である。ユニバーサルプライミング部位は、適切なプライマー(例えば、ユニバーサルプライマー)がハイブリダイズすることができ、かつユニバーサルプライマーに付着したゲノムDNA断片に相補的な核酸配列の合成用のプライミング部位として利用することができる、「共通のプライミング部位」を含む。オリゴヌクレオチドアダプターライゲーションの実施のための例示的なワークフローおよびキットには、AVENIO ctDNA Library Prep Kit(Roche Sequencing Solutions、Pleasanton,CA)が含まれる。いくつかの実施形態では、1つ以上のオリゴヌクレオチドアダプターを含むゲノムDNAは、ライゲーションされていないゲノムDNA断片から精製または単離される。
増幅
いくつかの実施形態では、ゲノムDNA断片は、場合により、ライゲーションされたアダプターオリゴヌクレオチドを含み、シーケンシングの前に増幅される。ゲノムDNA断片の増幅は、目的の核酸の開始濃度または量が少ない場合、例えば、ctDNAまたはリキッドバイオプシーサンプルの場合に特に有用である。いくつかの実施形態では、増幅を以下に論じられる「濃縮」または「捕捉プロセス」と組み合わせて、目的の核酸分子を選択的に結合させることができる。このように、濃縮の目的は、サンプルから目的の核酸を濃縮することである。
目的の核酸分子に相補的な配列(例えば、ゲノムDNA断片)、または場合によりプライマー結合部位(例えば、アダプターオリゴヌクレオチドのユニバーサルプライマー結合部位)を有するプライマーは、アニーリング、伸長、および変性工程の繰り返しが可能な条件下で、反応混合物としてのゲノムDNA断片とともにインキュベートされる。変性は、通常95℃を超える温度で発生し、アニーリング温度は、ゲノムDNA断片の様々な側面、例えば、限定はされないが、長さ、GC含量、および増幅反応のイオン強度などに基づいて決定される。
いくつかの実施形態では、本明細書に記載の方法は、シーケンシングの前に(例えば、シーケンシングリードを取得する前に)ゲノムDNA断片を増幅することを含む。いくつかの実施形態では、増幅は、ゲノムDNA断片を1つ以上のプライマー(例えば、ユニバーサルプライマーまたは標的特異性プライマー)と接触させること、およびゲノムDNA断片を増幅してアンプリコンを生成することを含む。いくつかの実施形態では、方法は、増幅反応(例えば、RT−PCR)によって生成された核酸増幅産物(例えば、アンプリコン)を検出することを含む。いくつかの実施形態では、増幅は、PCRを含む。いくつかの実施形態では、ゲノムDNAは、溶液中またはエマルジョンなどの微小液滴中で、クローンとして増幅される。いくつかの実施形態では、ゲノムDNAは、ゲノムDNA断片に存在する核酸配列に対して相補的、または実質的に相補的(例えば、85%超)である核酸配列を有するプライマーによって増幅される。いくつかの実施形態では、ゲノムDNA断片は、ゲノムDNA断片中のプライマー結合部位(例えば、アダプターオリゴヌクレオチド中のユニバーサルプライマー部位)に相補的な配列を有するプライマーによって増幅される。いくつかの態様では、増幅工程は、ゲノムDNA断片の増幅がない場合に、本明細書に記載のMSI検出方法の実行を可能にするような、任意の工程である。例えば、対象からのサンプルを処理して、末端修復された、3’Aテールを有するゲノムDNA断片を取得して、目的の5’リン酸化平滑末端二本鎖核酸分子を作成することができる。これに対して、アダプターオリゴヌクレオチドは、核酸分子の一端または両端にライゲーションされ、それにより、ユニバーサルプライマー結合部位を有する二本鎖核酸分子を形成する。続いて、ユニバーサルプライマー結合部位を有する核酸分子をサンプルから濃縮し(例えば、捕捉プローブを使用して)、変性して、以下に記載するようなシーケンシングの準備ができた一本鎖核酸分子を形成することができる。この例では、ゲノムDNA断片の増幅は必要でない。
いくつかの実施形態では、ゲノムDNA断片の第2の増幅は、シーケンシングの前に起こる。一実施形態では、ゲノムDNA断片の第1の増幅は、選択的濃縮の前に起こり(例えば、以下で論じる、アダプターオリゴヌクレオチドのユニバーサルプライマー結合部位に相補的な捕捉プローブを使用して)、第2の増幅は、選択的濃縮の産物で起こる。さらに別の実施形態では、ゲノムDNA断片の増幅は、シーケンシングの前に起こる。別の実施形態では、ゲノムDNA断片の増幅は、選択的濃縮およびシーケンシングの両方に先立って起こる。
核酸捕捉
本開示のいくつかの実施形態は、目的の核酸分子(例えば、ゲノムDNA断片、アンプリコンおよびPCR産物)を、反応混合物から選択的に濃縮するための方法に関する。いくつかの実施形態では、目的の核酸分子の選択的濃縮は、オリゴヌクレオチドプローブ(例えば、捕捉プローブ)のプールを利用する。いくつかの実施形態では、オリゴヌクレオチドプローブのプールは、溶液中で遊離状態で利用できる。別の実施形態では、オリゴヌクレオチドプローブのプールは、1つ以上の固体支持体に付着され得る。一実施形態では、方法は、ヒトゲノムDNAサンプル中のマイクロサテライト遺伝子座を濃縮することに関する。
いくつかの実施形態では、ヒトゲノムDNAサンプル中のマイクロサテライト遺伝子座を濃縮する方法は、(1)ヒトゲノムDNAをオリゴヌクレオチドプローブのアレイにハイブリダイズさせること、(2)ハイブリダイズしていないゲノムDNAを除去すること、(3)ハイブリダイズしたゲノムDNAをオリゴヌクレオチドプローブのアレイから溶出し、それによってマイクロサテライト遺伝子座を濃縮することを含む。一実施形態では、オリゴヌクレオチドプローブは、固体支持体または異種薬剤に連結されている。
別の実施形態では、アレイは、遺伝子座:1〜170(表1を参照)に対応するマイクロサテライト遺伝子座からなる群から選択されるマイクロサテライト遺伝子座に、少なくとも12、14、16、18、または20ヌクレオチドの連続配列にわたって相補的なオリゴヌクレオチドプローブのセットを含む。一実施形態では、オリゴヌクレオチドプローブのセットは、遺伝子座:1〜64に対応する種々のマイクロサテライト遺伝子座にそれぞれ相補的である、少なくとも10、20、30、40、または50のオリゴヌクレオチドプローブを含む。一実施形態では、オリゴヌクレオチドプローブのセットは、表2の遺伝子座に対応する種々のマイクロサテライト遺伝子座にそれぞれ相補的である、少なくとも10、20、30、40、または50のオリゴヌクレオチドプローブを含む。
いくつかの実施形態では、オリゴヌクレオチドプローブは、溶液中で遊離している。別の実施形態では、オリゴヌクレオチドプローブは、異種薬剤に連結されている。一実施形態では、異種薬剤は、ビオチンである。別の実施形態では、オリゴヌクレオチドプローブは、同じ固体支持体に連結されている。さらに別の実施形態では、オリゴヌクレオチドプローブは、別個の固体支持体に連結されている。
一実施形態では、オリゴヌクレオチドプローブは、修飾ヌクレオチドを含むことができる。いくつかの実施形態では、オリゴヌクレオチドプローブは、目的の核酸分子の一部(例えば、ゲノムDNA断片、アンプリコンまたは関連するPCR産物)に相補的であるハイブリダイゼーション領域を含み得る。特定の実施形態では、ハイブリダイゼーション領域は、少なくとも約5ヌクレオチド、少なくとも約10ヌクレオチド、少なくとも約15ヌクレオチド、少なくとも約20ヌクレオチド、少なくとも約25ヌクレオチド、少なくとも約30ヌクレオチド、少なくとも約35ヌクレオチド、少なくとも約40ヌクレオチド、少なくとも約45ヌクレオチド、少なくとも約50ヌクレオチド、少なくとも約55ヌクレオチド、少なくとも約60ヌクレオチド、少なくとも約65ヌクレオチド、少なくとも約70ヌクレオチド、少なくとも約75ヌクレオチド、少なくとも約80ヌクレオチド、少なくとも約85ヌクレオチド、少なくとも約90ヌクレオチド、少なくとも約95ヌクレオチド、および少なくとも約100ヌクレオチドを含み得る。別の実施形態では、ハイブリダイゼーション領域は、長さが約6〜約50、約8〜約40、約10〜約30ヌクレオチドである。さらに別の実施形態では、ハイブリダイゼーション領域は、長さが少なくとも5、8、10または12ヌクレオチドであり、目的の核酸に少なくとも70%相補的である。一実施形態では、ゲノムDNAは、マイクロサテライト遺伝子座含有DNAにハイブリダイズするオリゴヌクレオチドプローブにゲノムDNAをハイブリダイズすることによって、マイクロサテライト遺伝子座について濃縮される。
いくつかの実施形態では、オリゴヌクレオチドプローブのハイブリダイゼーション領域は、目的の核酸分子に対する少なくとも約70%、80%、85%、90%、95%、96%、97%、98%、99%の相補性を含み得る。いくつかの実施形態では、ハイブリダイゼーション領域は、目的の核酸分子の一部(例えば、ゲノムDNA断片)に100%相補的である核酸配列を含む。
異種薬剤は、核酸を検出するために、本明細書に記載の方法で使用することができる。必要な感度、必要な特異性、オリゴヌクレオチドプローブへの結合の容易さ、安定性要件、ならびに利用可能な機器および廃棄の規定に応じて異種薬剤を選択することにより、多種多様な異種薬剤を使用することができる。適切な異種薬剤には、放射性核種、蛍光染料(例えば、フルオレセイン、フルオレセインイソチオシアネート(FITC)、Oregon Green(商標)、ローダミン、Texas red、テトラロジミンイソチオシアネート(TRITC)、Cy3、Cy3.5、Cy5、Cy5.5、JOE、VIC、TET、HEX、FAM、R6G、R110、TAMRA、SYBR−Green、EtBr、およびROXなど)、蛍光マーカー(例えば、緑色蛍光タンパク質(GFP)、フィコエリトリンなど)、比色標識、化学発光標識、生物発光標識、抗体、抗原、ハプテン、酵素(例えば、ルシフェラーゼ、セイヨウワサビペルオキシダーゼ、アルカリホスファターゼなど)、ナノ粒子、ジゴキシゲニン、金属などが含まれるが、これらに限定されない。
オリゴヌクレオチドプローブのゲノムDNAへの特異的結合は、直接的または間接的に検出できる。直接標識には、オリゴヌクレオチドプローブに付着した蛍光または発光タグ、金属、染料、放射性核種などが含まれる。リン32(32P)で標識されたオリゴヌクレオチドプローブが使用され得る。ゲノムDNAに特異的な化学発光オリゴヌクレオチドを使用した、化学発光アッセイが使用され得る。蛍光色素で標識されたオリゴヌクレオチドプローブも、好適である。蛍光色素の例には、DAPI、フルオレセイン、ヘキスト33258、R−フィコシアニン、B−フィコエリトリン、R−フィコエリトリン、ローダミン、Texas red、およびリサミンが含まれるが、これらに限定されない。間接標識には、セイヨウワサビペルオキシダーゼ(HRP)、アルカリホスファターゼ(AP)、β−ガラクトシダーゼ、ウレアーゼなど、当技術分野で周知の様々な酵素が含まれる。セイヨウワサビペルオキシダーゼ検出システムは、例えば、450nmで検出可能な過酸化水素の存在下で可溶性生成物をもたらす、発色基質テトラメチルベンジジン(TMB)を用いて使用することができる。アルカリホスファターゼ検出システムは、例えば、405nmで容易に検出可能な可溶性生成物をもたらす、発色基質のp−ニトロフェニルホスフェートともに使用することができる。同様に、β−ガラクトシダーゼ検出システムは、410nmで検出可能な可溶性生成物をもたらす発色基質、o−ニトロフェニル−β−D−ガラクトピラノシド(ONPG)とともに使用できる。ウレアーゼ検出システムは、尿素ブロモクレゾールパープル(Sigma Immunochemicals;St.Louis,MO)などの基質とともに使用できる。
直接または間接標識からの信号は、例えば、発色基質から色を検出する分光光度計、125I検出用のガンマカウンターなど、放射線を検出する放射線カウンター、または特定の波長の光の存在下で蛍光を検出する蛍光光度計を用いて分析できる。酵素結合オリゴヌクレオチドプローブの検出については、EMAX Microplate Reader(Molecular Devices;Menlo Park、CA)などの分光光度計を製造者の指示に従って使用して、定量分析を行うことができる。必要に応じて、アッセイを自動化するか、ロボットで実行することができ、複数のサンプルからの信号を同時に検出することができる。いくつかの実施形態では、信号の量は、自動化されたハイコンテントイメージングシステムを使用して定量化することができる。ハイコンテントイメージングシステムは、市販されている(例えば、ImageXpress、Molecular Devices Inc.、Sunnyvale,CA)。
上記のように、オリゴヌクレオチドプローブは、親和性タグを含むことができる。親和性タグは、ハイブリダイゼーション領域にハイブリダイズした核酸分子の分離に役立つ。本明細書で使用される場合、「親和性タグ」という用語および文法上の同等物は、多成分複合体の成分を指すことができ、ここで多成分複合体の成分は、互いと特異的に相互作用するかまたは互いに結合する。例えば、親和性タグには、ストレプトアビジンに結合できるビオチンを含めることができる。多成分親和性タグ複合体の他の例には、リガンドおよびそれらの受容体、例えば、アビジン−ビオチン、ストレプトアビジン−ビオチン、およびビオチン、ストレプトアビジン、またはアビジンの誘導体、例えば、これらに限定されないが、2−イミノビオチン、デスチオビオチン、NeutrAvidin(Molecular Probes、Eugene、Oreg.)、CaptAvidin(Molecular Probes)など;結合タンパク質/ペプチド、例えば、マルトース−マルトース結合タンパク質(MBP)、カルシウム−カルシウム結合タンパク質/ペプチド(CBP);抗原抗体、例えばc−MYC、HA VSV−G、HSV、V5、およびFLAG Tag(商標)を含むエピトープタグ、ならびにそれらに対応する抗エピトープ抗体;ハプテン、例えば、ジニトロフェニルおよびジゴキシゲニン、ならびにそれらの対応する抗体;アプタマーおよびそれらに対応する標的;フルオロフォアおよび抗フルオロフォア抗体;その他が含まれる。
上記のように、オリゴヌクレオチドプローブは、レポーター部分を含むことができる。本明細書で使用される場合、「レポーター部分」という用語および文法上の同等物は、任意の識別可能なタグ、標識、または基を指すことができる。当業者は、異なる種のレポーター部分を個別に、または1つ以上の異なるレポーター部分と組み合わせて、本明細書に記載の方法で使用できることを理解するであろう。特定の実施形態では、レポーター部分は、信号を放出することができる。信号の例は、蛍光、化学発光、生物発光、リン光、放射性、熱量測定、または電気化学発光の信号である。例示的なレポーター部分には、フルオロフォア、放射性同位体、色原体、酵素、エピトープタグを含む抗原、量子ドットなどの半導体ナノ結晶(米国特許第6,544,732号を参照)、重金属、染料、リン光基、化学発光基、電気化学検出部分、結合タンパク質、蛍光体、希土類キレート、遷移金属キレート、近赤外染料、電気化学発光標識、ならびに質量分析計と互換性のあるレポーター部分、例えば質量タグ、電荷タグ、および同位体などが含まれる。本明細書に記載の方法で使用できるさらなるレポーター部分には、蛍光染料(例えば、フルオレセインイソチオシアネート、Texas red、ローダミンなど)、放射性標識(例えば、H、125I、35S、14C、32Pなど)、酵素(例えば、セイヨウワサビペルオキシダーゼ、アルカリホスファターゼなど)、スペクトル熱量測定標識、例えばコロイド金または着色ガラスまたはプラスチック(例えば、ポリスチレン、ポリプロピレン、ラテックスなど)ビーズ、磁気標識、電気標識、熱標識、および質量タグなどのスペクトル標識が含まれる。レポーター部分には、酵素(セイヨウワサビペルオキシダーゼなど)および磁気粒子も含まれる。これらの、およびその他の例示的なレポーター部分は、参照により本明細書に組み込まれる、Richard HauglandによるMolecular Probes Handbookの第6版に記載されている。
いくつかの実施形態では、オリゴヌクレオチドプローブを基板と関連付けることができる。基板の例には、微小球体、平面、カラムなどが含まれる。本明細書中の「微小球体」または「ビーズ」または「粒子」または文法的同等物とは、小さな離散粒子を意味する。基板の組成は、用途によって異なる。適切な組成物には、ペプチド、核酸および有機部分の合成に使用されるもの、例えば、これらに限定されないが、プラスチック、セラミック、ガラス、ポリスチレン、メチルスチレン、アクリルポリマー、常磁性材料、トリアゾル、カーボングラファイト、二酸化チタン、ラテックスまたはSepharoseなどの架橋デキストラン、セルロース、ナイロン、架橋ミセルが含まれ、テフロンはすべて使用できる。ビーズは、球形である必要はなく、不規則な粒子が使用されてもよい。さらに、微小球体は、サイズが一貫している必要はない。好ましい実施形態では、1つ以上のオリゴヌクレオチドプローブは、平均粒径の変動が10%未満であるビーズに結びついている(例えば、結合、ライゲーション、またはコンジュゲート)。いくつかの実施形態では、基板は、金属組成物、例えば、鉄を含むことができ、磁気特性も含むことができる。1つの例示的な実施形態は、ストレプトアビジンでコーティングされた磁気ビーズを含むオリゴヌクレオチドプローブを含む(Ito et al.、(1992)PNAS 89:495〜498)。さらに、ビーズは多孔性であり得るため、オリゴヌクレオチドプローブとの会合に利用可能なビーズの表面積が増加する。通常、ビーズのサイズは、ナノメートル、すなわち1nm〜999nm、ミリメートル、すなわち1mm〜9mm、ミクロン、すなわち0.1μm〜約990μmの範囲である。
特定の実施形態では、オリゴヌクレオチドプローブは、切断可能な部分、例えば、切断可能なリンカーを含むことができる。切断可能な部分は、光分解的、化学的、熱的、または酵素的に切断されるような方法で切断され得る官能基を含むことができる。例えば、米国特許第5,721,099号、米国特許公開第20040166529号および20100022761号、ならびにGreene et al.,PROTECTIVE GROUPS IN ORGANIC SYNTHESIS,2nd ed.Wiley,1991を参照されたい。
いくつかの実施形態では、1つ以上のオリゴヌクレオチドプローブ(例えば、オリゴヌクレオチドプローブのプール)は、オリゴヌクレオチドプローブと目的の核酸との間でハイブリダイゼーション複合体が形成されるように、目的の核酸(例えば、ゲノムDNA断片、アンプリコンまたは関連するPCR産物)と接触させることができ、それにより、マイクロサテライト遺伝子座を含む捕捉されたDNAを生成する。いくつかの実施形態では、ハイブリダイゼーション複合体は、オリゴヌクレオチドプローブのプールと接触させる前に、目的の核酸を変性させることによって形成され得る。好ましい実施形態では、ハイブリダイズした目的の核酸およびオリゴヌクレオチドプローブのプール(例えば、ハイブリダイゼーション複合体)は、ハイブリダイズしていない核酸、未結合の核酸、および非特異的に結合した核酸から分離される。
いくつかの実施形態では、核酸濃縮は、オリゴヌクレオチドプローブを結合部分と結合させることを含み得る。結合部分は、親和性タグと結合することができ、そのような親和性タグのリガンドを含むことができる。結合部分は、基板に付着し得る。いくつかの実施形態では、核酸濃縮は、ハイブリダイズした核酸およびオリゴヌクレオチドプローブからハイブリダイズしていない核酸を除去することを含み得る。除去する方法は、例えば、洗浄を含み得る。核酸を洗浄する方法は、当技術分野でよく知られている。そのような方法は、核酸をオリゴヌクレオチドプローブにハイブリダイズさせることを含む方法に適用することができる。様々なハイブリダイゼーションおよび洗浄条件、例えば、高、中、および低ストリンジェンシー条件を使用することができる。例えば、Maniatis et al.、Molecular Cloning:A Laboratory Manual,2d Edition,1989、およびShort Protocols in Molecular Biology,ed.Ausubel,et alを参照されたい。厳格な条件は、配列に依存し得るものを含み、様々な状況によって異なる。核酸のハイブリダイゼーションに関する広範な指針は、Tijssen、Techniques in Biochemistry and Molecular Biology−Hybridization with Nucleic Acid Probes、「Overview of principles of hybridization and the strategy of nucleic acid assays」(1993)にて見出され、その開示は、参照により全体が本明細書に組み込まれる。一般に、厳格な条件は、定義されたイオン強度およびpHにおける特定の配列の熱融点(T)よりも、約5〜10℃低くなるように選択され得る。Tmは、オリゴヌクレオチドプローブの50%が目的の核酸にハイブリダイズする温度(定義されたイオン強度、pH、および核酸濃度の下で)である。厳格な条件には、塩濃度が約1.0Mナトリウムイオン未満、例えば、pH7.0〜8.3で約0.01M〜1.0Mナトリウムイオン濃度(または他の塩)であること、温度が短いプローブ(例えば、10〜50ヌクレオチド)のTよりも少なくとも約3℃低いこと、長いプローブ(例えば、50ヌクレオチド超)のTよりも少なくとも約6℃低いことが含まれる。
いくつかの実施形態では、捕捉されたDNA(例えば、ハイブリダイズした核酸分子および対応するハイブリダイズしたオリゴヌクレオチドプローブ)は、非特異的核酸および未結合核酸の除去の後、ハイブリダイゼーション複合体から放出され得る。理解されるように、ハイブリダイズしたオリゴヌクレオチドプローブから核酸分子を分離する方法は、核酸分子とオリゴヌクレオチドプローブとの間の結合のタイプに応じて変化するであろう。いくつかの実施形態では、核酸分子は、例えば、反応混合物の温度を上昇させることによって、核酸分子を変性させることによって、オリゴヌクレオチドプローブから分離され得る。いくつかの実施形態では、核酸分子は、切断可能なリンカーを切断することによって、オリゴヌクレオチドプローブの少なくとも一部から分離され得る。いくつかの実施形態では、核酸分子は、オリゴヌクレオチドプローブの少なくとも一部を消化することによってオリゴヌクレオチドプローブの少なくとも一部から分離され得、例えば、RNAオリゴヌクレオチドプローブは、RNAseで消化され得る。いくつかの実施形態では、核酸分子は、反応混合物のイオン強度を調節することによって、オリゴヌクレオチドプローブから分離され得る。
いくつかの実施形態では、1つ以上のオリゴヌクレオチドプローブに関連する、目的の核酸分子の濃縮は、1つ以上の濃縮ラウンドを含むことができる。一実施形態では、濃縮方法は、(1)目的の核酸分子を変性させ、標識オリゴヌクレオチドプローブを目的の核酸分子にハイブリダイズさせること(例えば、ゲノムDNA断片にハイブリダイズしたビオチン標識プローブ)、(2)標識オリゴヌクレオチドプローブおよび目的のハイブリダイズした核酸分子を固体支持体、例えば磁気ストレプトアビジンビーズに結合すること、(3)固体支持体を洗浄して、結合していない核酸を除去すること、および(4)目的の濃縮された核酸分子を固体支持体から溶出することを含み得る。濃縮の2回目のラウンドでは、目的の濃縮された核酸分子は、工程(1)〜(4)を経ることができる。
いくつかの実施形態では、溶出されたDNAは、シーケンシングなどのさらなる処理のために、適切なバッファー中に保存される。この時点で、濃縮された核酸分子は、「シーケンシングライブラリ」と呼ばれてもよい。いくつかの実施形態では、シーケンシングライブラリは、シーケンシングの前に、他のシーケンシングライブラリとともに定量化および/またはプールされる。
シーケンシング
上に示したように、調製された目的の核酸分子(例えば、シーケンシングライブラリ)は、複数のマイクロサテライト遺伝子座のシーケンシングリードを決定するための手順の一部として、シーケンシングアッセイを使用してシーケンシングされる。多くのシーケンシング技術またはシーケンシングアッセイのいずれかを利用できる。本明細書で使用される「次世代シーケンシング(NGS)」という用語は、クローンで増幅された分子および単一の核酸分子の超並列シーケンシングを可能にするシーケンシング方法を指す。
本明細書に開示される方法での使用に適した配列アッセイの非限定的な例には、ナノポアシーケンシング(米国特許公開番号2013/0244340、2013/0264207、2014/0134616、2015/0119259および2015/0337366)、サンガーシーケンシング、キャピラリーアレイシーケンシング、熱サイクルシーケンシング(Sears et al.、Biotechniques、13:626−633(1992))、固相シーケンシング(Zimmerman et al.、Methods Mol.Cell Biol.、3:39−42(1992))、マトリックス支援レーザー脱離/イオン化飛行時間型質量分析(MALDI−TOF/MS;Fu et al.、Nature Biotech.、16:381−384(1998))などの質量分析によるシーケンシング、ハイブリダイゼーションによるシーケンシング(Drmanac et al.、Nature Biotech.、16:54−58(1998)、限定されないが、合成によるシーケンシング(例えば、HiSeq(商標)、MiSeq(商標)、またはGenome Analyzer、各々Illuminaより入手可能)を含むNGS法、ライゲーションによるシーケンシング(例えば、SOLiD(商標)、Life Technologiesなど)、イオン半導体シーケンシング(例えば、Ion Torrent(商標)、Life Technologiesなど)、SMRT(登録商標)シーケンシング(Pacific Biosciences)、およびパイロシーケンス(例えば、454(商標)シーケンス、Roche Applied Science)が含まれる。例えば、参照により本明細書に組み込まれる、Liu et al.、J.Biomed Biotechnol、2012、2012:251364を参照されたい。
市販のシーケンシング技術には、Affymetrix Inc.(Sunnyvale、Calif.)のハイブリダイゼーションによるシーケンシングプラットフォーム、Illumina/Solexa(San Diego、Calif.)およびHelicos Biosciences(Cambridge、Mass.)の合成によるシーケンシングプラットフォーム、Applied Biosystems(Foster City、Calif.)のライゲーションによるシーケンスプラットフォームが含まれる。他のシーケンシング技術には、Ion Torrent技術(ThermoFisher Scientific)、およびナノポアシーケンシング(Roche Sequencing Solutions、Santa Clara、Cal.のGenia Technology)およびOxford Nanopore Technologies(Oxford,United Kingdom)が含まれるが、これらに限定されない。
別の非限定的な実施形態では、本明細書に記載の方法は、ナノポアシーケンシングを使用してゲノムDNAのシーケンシングリードを取得することを含む(例えば、Soni GV and Meller A.Clin Chem 53:1996−2001(2007)に記載されたように)。ナノポアシーケンシングDNA分析技術は、例えばOxford Nanopore Technologies(Oxford,United Kingdom)およびSequenom(San Diego,CA)など、多くの企業から入手できる。ナノポアシーケンシングは、DNAの単一分子がナノポアを通過するときに直接シーケンシングされる、単一分子シーケンシング技術である。ナノポアは小さな穴で、典型的に直径1ナノメートルオーダーである。ナノポアを導電性流体に浸し、その両端に電位(電圧)を印加すると、ナノポアを通じたイオンの伝導により、わずかな電流が生じる。流れる電流の量は、ナノポアのサイズおよび形状に影響される。DNA分子がナノポアを通過すると、DNA分子の各ヌクレオチドがナノポアを様々な程度で塞ぎ、ナノポアを流れる電流の大きさを様々な程度で変化させる。したがって、DNA分子のナノポア通過時の、この電流変化は、合成されたDNA配列に組み込まれたヌクレオチドに相関関係を与える。一実施形態では、ナノポアシーケンシングは、Roche Sequencing Solutions(Santa Clara,CA)のGenia技術を使用して実施することができる。Genia技術は、基板チップ上の各ウェル、例えば、例えば数十万または数百万のウェルにつき、脂質二重層中のタンパク質ナノポアを使用する。ウェルには、ポリメラーゼおよびDNAテンプレートが含まれ、ポリメラーゼによる重合によって、ヌクレオチドがDNAテンプレートに付加される。アデニン(A)、チミン(T)、シトシン(C)およびグアニン(G)に対応する4つのヌクレオチドに、固有のタグが付着される。ヌクレオチドが(触媒作用によって)DNAテンプレートに付加されると、タグはナノポアにねじ込まれ、組み込まれた特定のヌクレオチドに対応する固有の信号(つまり電流)が生じる。具体的には、交流(AC)信号がナノポア全体に印加され、それにより、タグがナノポアに何度も出入りし、プロセス中にデータが複数回取得される(例えば、米国特許第2015/0119259号、米国特許第2016/0178577号および米国特許第2017/0254797号を参照)。
通常、ナノポアシーケンシング(合成によるナノポアシーケンシング)は、DNAポリメラーゼまたは他の鎖延長酵素を使用してテンプレート核酸に相補的なDNA鎖を合成すること、および各ヌクレオチドの同一性を、それが成長中の鎖に付加されると同時に決定し、それによってテンプレート配列を決定することを含む。付加された各ヌクレオチドは、鎖の合成時にポリメラーゼ活性部位に隣接して位置するナノポアを通る電流の流れを経時的に監視することによって検出される。正確な信号を取得するには、ポリメラーゼ活性部位をナノポアの近くに適切に配置すること、およびナノポアに入ることができる、付加された各ヌクレオチドにタグを使用すること、およびナノポアを流れる電流に識別可能な変化を与えることが必要である。正確なナノポアシーケンシングを提供するために、タグはナノポアに入り、十分な時間そこに存在し(すなわち「滞留時間」)、ナノポアに存在している間、タグに関連する特定のヌクレオチドを他のタグ付けされたヌクレオチドから明確に区別できるように、ナノポアを通る電流の、十分に検出可能で識別可能な妨害(すなわち、「電流の妨害」)を与える必要がある。
別の非限定的な実施形態では、本明細書に記載の方法は、化学感受性電界効果トランジスタ(chemFET)アレイを使用してゲノムDNAの配列リードを取得することを含む(例えば、米国特許出願公開第2009/0026082号に記載されているように)。この技術の一例では、目的の核酸分子を反応チャンバーに入れることができ、核酸分子は、ポリメラーゼの存在下でシーケンシングプライマーにハイブリダイズされる。シーケンシングプライマーの3’末端に1つ以上の三リン酸が組み込まれていることは、chemFETによって電流の変化として識別され得る。
別の実施形態では、半導体技術と非標識シーケンシング化学とを組み合わせたIon Torrent(商標)シーケンシング使用して、化学的にエンドコードされた情報(A、C、G、T)を半導体チップ上のデジタル情報(0、1)に直接翻訳することができる。Ion Torrentは、微細加工されたウェルの高密度アレイを使用して、シーケンシングプライマーの3’末端へのヌクレオチドの大規模な並列取り込みを実行し、組み込まれる各ヌクレオチドの水素イオンを同時に放出する。各ウェルは目的の単一の核酸分子を保持し、ウェルの下にはイオン感応性層(ISFET)およびイオンセンサーがある。シーケンシングプライマーの3’末端にヌクレオチドが組み込まれると、水素イオンが放出され、溶液のpHのわずかな変化が生じる。これは、イオンセンサーで検出できる。Ion Torrentシーケンサーは、続いて各ヌクレオチドを大量にチップに流入させ、その後組み込まれなかったヌクレオチドを除去するための洗浄工程が続く。チップへの印加中にヌクレオチドが組み込まれなかった場合、電圧の変化および組み込まれたヌクレオチドの記録はない。
使用されるシーケンシングアッセイに適した、任意の検出方法を使用することができる。いくつかの実施形態では、シーケンシングアッセイは、検出方法において標識を使用することができる。本明細書で使用される「標識」という用語は、分光学的、光化学的、生化学的、免疫化学的、化学的、または他の物理的手段によって検出可能な組成物を指す。例えば、有用な標識には、蛍光染料、発光剤、放射性同位元素(例えば、32P、H)、電子密度の高い試薬、酵素、ビオチン、ジゴキシゲニン、またはハプテンおよびタンパク質、または、例えば、放射性標識をオリゴヌクレオチドへ組み込むことによって検出可能にされ得る他の存在物が含まれる。例示的な検出方法には、放射性検出(例えば、32P)、光吸収検出、例えば、UV−可視吸収検出、発光検出、例えば、蛍光または化学発光が含まれる。例えば、ゲノムDNA断片は、使用するシーケンシングプラットフォームおよび方法に応じて、標識された各ゲノムDNA断片、アンプリコン、または関連するPCR産物のすべてまたは一部を同時にまたは順次スキャンすることにより、シーケンスプラットフォームを使用して検出できる。放射性信号(例えば、32P)の場合、ホスホイメージャーデバイスを使用できる(Johnston et al.、1990;Drmanac et al.、1992;1993)。別の実施形態では、ゲノムDNA断片は、無標識であり得、それらの生成は、DNA合成中の各ヌクレオチドの組み込み中の水素イオンの放出によって検出され得る(すなわち、Ion Torrentシーケンシングならびに、例えば、米国特許第9,139,874号、9,309,557号および9,657,281号)。別の実施形態では、シーケンシングアッセイは、これらに限定されないが、米国特許第8,852,864号、8,968,540号、9,121,059号、9,279,153号、および9,542,527号に開示されているシーケンシング法などのナノポアシーケンシングを含むことができる。
いくつかの実施形態では、利用される任意の検出方法の信号を手動または適切なコンピュータによる方法によって測定および/または分析して、好ましくはシーケンシングリードに変換されるシーケンシングデータを提供することができる。いくつかの実施形態では、コンピュータによる方法を使用して、コンピュータシステムを介してシーケンシングリードを翻訳することができる。
本明細書に記載の方法のいくつかの実施形態では、シーケンシングアッセイから得られるシーケンシングリードは、約20ヌクレオチド、約25ヌクレオチド、約30ヌクレオチド、約35ヌクレオチド、約40ヌクレオチド、約45ヌクレオチド、約50ヌクレオチド、約55ヌクレオチド、約60ヌクレオチド、約65ヌクレオチド、約70ヌクレオチド、約75ヌクレオチド、約80ヌクレオチド、約85ヌクレオチド、約90ヌクレオチド、約95ヌクレオチド、約100ヌクレオチド、約120ヌクレオチド、約150ヌクレオチド、約200ヌクレオチド、約250ヌクレオチド、約300ヌクレオチド、約350ヌクレオチド、約400ヌクレオチド、約450ヌクレオチド、または約500ヌクレオチドの長さを含む。いくつかの実施形態では、シーケンシングアッセイから得られたシーケンシングリードは、約20bp、約25bp、約30bp、約35bp、約40bp、約45bp、約50bp、約55bp、約60bp、約65bp、約70bp、約75bp、約80bp、約85bp、約90bp、約95bp、約100bp、約110bp、約120bp、約130、約140bp、約150bp、約200bp、約250bp、約300bp、約350bp、約400bp、約450bp、または約500bpを含む。いくつかの実施形態では、シーケンシングリードは、単一のシーケンシング反応で識別される少なくとも10以上のヌクレオチドを含む。そのため、各シーケンシング反応が完了している必要はなく、各シーケンシングリードが明確である必要もない。
任意の適切な方法、計算、または閾値を使用して、シーケンシングリードのアラインメントがマイクロサテライト遺伝子座とアラインするかどうかを決定することができる(例えば、Li et al.、Bioinformatics、(2009)25(14):1754−1760)。好ましくは、各シーケンシングリードからの少なくとも8、10、20、30、40、50、またはそれ以上の連続ヌクレオチドが、対応するマイクロサテライト遺伝子座とアラインする。一実施形態では、各シーケンシングリードは、目的のマイクロサテライト遺伝子座に対応する10以上の連続ヌクレオチドを含む。いくつかの実施形態では、シーケンシングリードは、目的のゲノム、遺伝子、またはドメイン(例えば、染色体の領域、染色体全体、エキソン、イントロンなど)にわたって重複(タイル)し得る。いくつかの実施形態では、シーケンシングリードは、少なくとも1%、5%、10%、20%、25%、30%、40%、50%、60%、70%、75%、80%、またはそれ以上のゲノムを含む。別の実施形態では、シーケンシングリードは、評価中のマイクロサテライト遺伝子座のセットの1つ、複数、またはすべてにアラインする。
一実施形態では、シーケンシングリードは、ワールドワイドウェブhttp://hgdownload.cse.ucsc.edu/golden/path/hg19/bigzips/で入手可能なGRCh37/hg19配列、またはワールドワイドウェブhttp://hgdownload.cse.ucsc.edu/golden/path/hg38/bigzips/で入手可能なGRCh38/hg38などの参照ゲノムにマッピングすることができる。公開配列情報の他の情報源には、GenBank、dbEST、dbSTS、EMBL(the European Molecular Biology Laboratory)、およびDDBJ(日本のDNAデータバンク)が含まれる。
多くのコンピュータアルゴリズム、例えば、これらに限定されないが、BLAST(Altschul et al.、1990)、BLITZ(MPsrch)(Sturrock&Collins、1993)、FASTA(Person&Lipman、1988)、BOWTIE(Langmead et al.、Genome Biology 10:R25.1−R25.10[2009])、またはELAND(Illumina、Inc.、San Diego、Calif.、USA)が、本明細書に記載されるシーケンシングリードなどのヌクレオチド配列をアラインするために利用できる。
サンプル中に通常存在するゲノムDNA断片の量から明らかなように、シーケンシングアッセイごとに複数のシーケンシングリードが取得される。いくつかの実施形態では、少なくとも約3×10のシーケンシングリード、少なくとも約5×10のシーケンシングリード、少なくとも約8×10のシーケンシングリード、少なくとも約10×10のシーケンシングリード、少なくとも約15×10のシーケンシングリード、少なくとも約20x10のシーケンシングリード、少なくとも約30x10のシーケンシングリード、少なくとも約40x10のシーケンシングリード、または少なくとも約50x10のシーケンシングリードが得られる。いくつかの実施形態では、シーケンシングリードは、シーケンシングリードあたり約20〜約500のヌクレオチドを含む。一実施形態では、各シーケンシングリードまたは全シーケンシングリードの一部(例えば、約10%以上)は、参照ゲノムにマッピングされる。別の実施形態では、参照ゲノムにマッピングされたシーケンシングリードは保持され、さらなる処理(例えば、RLDの基準値を決定するため)に利用される一方、参照ゲノムおよび/またはマイクロサテライト遺伝子座にマッピングまたはアラインしないシーケンシングリードは破棄される。
分析
いくつかの実施形態では、シーケンシング反応またはアッセイから得られたデータは、サンプルから得られたシーケンシングリードを表すヌクレオチド配列の形態である。いくつかの実施形態では、シーケンシングアッセイは、100万〜1000億、5000万〜100億、および1億〜10億のシーケンシングリードを生成する。いくつかの実施形態では、シーケンシングリード(例えば、生データ)を改良して、質の悪いまたは低品質のシーケンシングリードを除去することができる。いくつかの実施形態では、シーケンシングアッセイは、マイクロサテライト遺伝子座あたり100を超えるシーケンシングリードおよび100万未満のシーケンシングリードを提供する。別の実施形態では、シーケンシングリードを重複排除して、シーケンシングデータから重複リードを除去することができる。別の実施形態では、シーケンシングリードを改良して、アダプターオリゴヌクレオチド、ユニバーサルプライマー結合部位、および/またはバーコード配列をシーケンシングリードから除去することができる。いくつかの実施形態では、シーケンシングリードは、これらに限定されないが、FASTAおよびFASTQ形式などの適切なバイオインフォマティクス形式で保存することができる。本明細書に開示される、マイクロサテライト不安定性を検出する方法によって得られたシーケンシングリードを処理するための例示的なワークフローが、図4に提供される。
シーケンシングリードが生成された後、マイクロサテライト遺伝子座を含むシーケンシングリードが識別される(例えば、シーケンシングリードを参照ゲノムまたは既知のマイクロサテライト遺伝子座のセットにアラインメントすることによって)。典型的には、マイクロサテライト遺伝子座でシーケンシングリードで検出された反復単位の数を決定(例えば、カウント)することができ、それにより、評価中の各マイクロサテライト遺伝子座のシーケンシングリード全体の反復長分布(RLD)を生成する。
シーケンシングリードは、マイクロサテライト遺伝子座にアラインされているため、シーケンシングリードの反復単位の数を決定できる。例えば、「GT」のジヌクレオチド反復を有するマイクロサテライト遺伝子座は、最初のシーケンシングリードでGTとして確認され、2番目のシーケンシングリードでGTとして確認され、3番目のシーケンシングリードでGTとして確認され、4番目のシーケンシングリードでGTとして確認され得る。シーケンシングリード内のマイクロサテライト遺伝子座の反復単位長を決定するための、任意の方法を使用することができる。好ましい方法では、反復単位長の決定は、コンピュータによる分析(例えば、ソフトウェア分析またはアルゴリズム)によって実行される。
典型的には、MSSまたは正常(非癌性細胞)でのマイクロサテライト遺伝子座中の反復単位長の数は、安定しており、一貫している(例えば、図1Aおよび図1Bを参照のこと)。しかしながら、個々のマイクロサテライト遺伝子座の反復単位長の数は、異なる細胞間で変動し得る。いくつかの細胞は、同じタイプの細胞(例えば、健康な非癌性細胞)に関して同一の反復単位長を有するマイクロサテライト遺伝子座を含む一方、他の細胞(例えば、CRC細胞)は、より短いまたはより長い反復単位長を有するマイクロサテライト遺伝子座を含み得る。いくつかの実施形態では、シーケンシングリードが細胞の代用である場合、シーケンシングリードから決定される反復単位長は、約2〜約100の反復単位、約5〜約80の反復単位、約10〜約60の反復単位、および約15〜約40の反復単位であろう。
マイクロサテライト遺伝子座のRLDが生成されると、RLDの基準値を決定できる。いくつかの実施形態では、RLDの基準値は、t統計量である。一実施形態では、RLDの基準値は、これらに限定されないが、スチューデントのt検定またはウィルコクソンの順位検定などのt統計量である。別の実施形態では、RLDの基準値は、所与のマイクロサテライト遺伝子座の平均リード長に基づいて決定される。さらに別の実施形態では、RLDの基準値は、所与のマイクロサテライト遺伝子座のシーケンシングリード間のRLDの歪度に基づいて決定される。いくつかの実施形態では、RLDの基準値は、平均リード長およびRLDの分散に基づいて決定されるt統計量である。別の実施形態では、評価中の各マイクロサテライト遺伝子座のRLDの基準値は、試験サンプル(例えば、CRCを有すると疑われるサンプルからのctDNA)と正常なバックグラウンドサンプル(例えば、参照サンプルまたは一致した健康なサンプル)との間の2サンプルt検定に基づく。いくつかの実施形態では、t統計量は、試験サンプルのRLDおよび対照RLDに基づいて決定される。いくつかの実施形態では、RLDの基準値は、一致するサンプルがない場合に、例えば、評価中の各マイクロサテライト遺伝子座のRLD基準値が既知である、既知のサンプルまたは参照サンプルを参照することによって決定される。いくつかの実施形態では、RLDの基準値は、評価中のマイクロサテライトのRLDを、所与のマイクロサテライト遺伝子座について事前に計算されたバックグラウンドRLDと比較することによって決定される。
したがって、1つ以上の統計値は、サンプルRLDおよび事前に計算された正常なバックグラウンドRLDについて決定することができ、統計値は、例えば、t統計量として比較することができる。他の実施形態では、2つのRLDの生の値を比較して、例えば、距離を決定することができる。
他の実施形態では、基準値は、試験されたサンプルのRLDと対照RLDとの間の類似性の尺度である。距離基準値には、カルバック−ライブラー情報量、相関距離、余弦距離、ユークリッド距離、マンハッタン距離、およびコルモゴロフ−スミルノフ統計量などが含まれるが、これらに限定されない。距離基準値は、2つのRLD間の類似性を評価するために使用できる。例えば、2つのRLDの各長さでの値(カウント)間の差異を、例えば数値ベクトルの差異としてとることができ、ここで、各ベクトルは、所与の反復長を有するリードの数のカウントの配列である。
いくつかの実施形態では、単一のマイクロサテライト遺伝子座にわたる一貫性のないRLDは、2つのRLD間の類似性を測定するために、距離基準値を使用してフィルタにかけることができる。距離基準値は、ペアワイズ距離、例えば、RLDのペアの各RLDの対応する値の差異または比率を使用して決定できる。例えば、第1のRLDは、リードが第1の長さである第1の確率を有することができ(例えば、第1の長さを有するリードの正規化されたカウントから決定されるように)、第2のRLDは、リードが第1の長さである第2の確率を有することができる。
いくつかの実施形態では、マイクロサテライト遺伝子座は、確認されたRLDからのペアワイズ距離の過半数が、試験された任意の距離基準値より「長い」場合、一貫性のないRLDを有すると見なされる。本明細書で使用されるように、RLDがすべてのマイクロサテライト遺伝子座のすべてのサンプルのペアからの中央値プラス2標準偏差距離よりも大きい場合、RLDは「長い」。いくつかの実施形態では、外れ値の影響を低減するために、平均ではなく中央値を使用してRLDが測定される。
いくつかの実施形態では、所与のマイクロサテライト遺伝子座の一貫性のないサンプルをフィルタにかける場合、2つのRLD間の類似性を測定するためにユークリッド距離が好ましい場合がある。一実施形態では、正常なバックグラウンドサンプルまでのユークリッド距離が、すべてのマイクロサテライト遺伝子座のすべてのサンプルからの中央値プラス2標準偏差距離よりも大きい場合、サンプルは、他のサンプルと比較して一貫性がないと見なされる。
一実施形態では、MSIを有するサンプルは、MSSサンプルで確認された同じマイクロサテライト遺伝子座のRLDとは異なる、1つ以上のマイクロサテライト遺伝子座のRLDを含む。一実施形態では、MSIサンプルは、MSSサンプル内の同じマイクロサテライト遺伝子座のRLDと比較して、より長い、かつ/またはより大きな歪度を有する平均リード長を有するRLDを含み得る。例えば、図1Aおよび1Bは、マイクロサテライト遺伝子座NR−21が、MSS細胞株におけるNR−21のRLDと比較して、MSI細胞株においてより大きなリード長および歪度を有することが確認されることを実証している。
いくつかの実施形態では、基準値は、所与のマイクロサテライト遺伝子座のRLDを、対応するマイクロサテライト遺伝子座の事前に計算された正常なバックグラウンドRLDと比較することによって調製される。場合によっては、事前に計算された正常なバックグラウンドは、正常なサンプルのセットに基づいている。次に、基準値を、対応するマイクロサテライト遺伝子座の閾値と比較する。場合によっては、閾値を選択して、トレーニングセットの真陽性率と偽陽性率の差異を最大化する。いくつかの実施形態では、各マイクロサテライト遺伝子座は、計算されたRLD基準値が比較される、独自の独立した閾値を有する。いくつかの実施形態では、閾値は、MSSサンプルで通常確認される反復長分布を含む。いくつかの実施形態では、閾値は、正常な一致したサンプルの反復長分布を含む。いくつかの実施形態では、閾値は、MSS細胞株から得られたRLD基準値を含む。いくつかの実施形態では、閾値は、マイクロサテライト遺伝子座がMSIとして識別される値である。いくつかの実施形態では、RLD基準値が対応するマイクロサテライト遺伝子座の閾値を超える場合、評価中のマイクロサテライト遺伝子座は、MSIとして識別される。
いくつかの実施形態では、サンプルから得られた1つ以上のマイクロサテライト遺伝子座のRLD基準値が、対応するマイクロサテライト遺伝子座の閾値と比較される。一実施形態では、対応するマイクロサテライト遺伝子座の閾値を超えるRLD基準値を有する、サンプル中のマイクロサテライト遺伝子座が識別される(例えば、MONO−27、NR−21およびBAT−25)。別の実施形態では、サンプルからのマイクロサテライト遺伝子座のRLD基準値が、対応するマイクロサテライト遺伝子座の閾値と比較され、対応する閾値を超えるマイクロサテライト遺伝子座の数が定量化される(例えば、評価された64のマイクロサテライト遺伝子座のセット(例えば、遺伝子座:1〜64に対応するマイクロサテライト遺伝子座)からの、58のマイクロサテライト遺伝子座が、対応するマイクロサテライト遺伝子座閾値を超えるRLD基準値を有する)。
いくつかの実施形態では、対応する閾値を超えるRLD基準値を有するマイクロサテライト遺伝子座の数(例えば、合計64のマイクロサテライト遺伝子座のうちの58のマイクロサテライト遺伝子座)が、マイクロサテライト不安定性比率閾値(MSI−PT)と比較される。一実施形態では、対応する閾値よりも大きいRLD基準値を有するマイクロサテライト遺伝子座の数(例えば、58のマイクロサテライト遺伝子座)がMSI−PTを超える場合、サンプルが得られた対象は、マイクロサテライト不安定(MSI)として分類される。別の実施形態では、対応する閾値よりも大きいRLD基準値を有するマイクロサテライト遺伝子座の数(例えば、58のマイクロサテライト遺伝子座)がMSI−PT以下である場合、サンプルが得られた対象は、マイクロサテライト安定(MSS)として分類される。
マイクロサテライト不安定性比率閾値(MSI−PT)は、評価されたマイクロサテライト遺伝子座の総数の小部分またはパーセントを表す。MSI−PT閾値は、事前に定義された値または範囲であり得る。いくつかの実施形態では、MSI−PTは、少なくとも35%より大きい。MSI−PTの目的は、サンプルをMSSまたはMSI状態に正確に分離または区別することである。一実施形態では、MSI−PTは、少なくとも約40%、50%、60%、70%、75%、またはそれ以上である。上記の例では、64のマイクロサテライト遺伝子座のプールからの58のマイクロサテライト遺伝子座が、RLD基準値が対応するマイクロサテライト遺伝子座の閾値を超えていると決定される。そのため、58のマイクロサテライト遺伝子座は、MSI遺伝子座であると決定され、残りの6のマイクロサテライト遺伝子座は、MSSであると決定される。さらに、58のマイクロサテライト遺伝子座/64のマイクロサテライト遺伝子座は、複数のマイクロサテライト遺伝子座の90%がMSIとして分類されることに等しい。90%はMSI−PTの35%よりも大きいため、サンプルはMSIとして分類される。いくつかの実施形態では、サンプルが35%未満のMSI−PTを有する場合、サンプルはMSSとして分類される。
参照値
一実施形態では、マイクロサテライト遺伝子座がMSIであるかどうかを決定するために、マイクロサテライト遺伝子座を含むシーケンシングリードが閾値と比較される。次に、評価されたマイクロサテライト遺伝子座の総数と比較されたMSI遺伝子座の量が、MSI−PTと比較される。様々な方法を使用してMSI−PTを決定できる。
一実施形態では、MSI−PTは、マイクロサテライト遺伝子座(例えば、遺伝子座:1〜170)の参照値に対応し、癌を有さないことが分かっている対象(例えば、健康な対象)の集団からのマイクロサテライト遺伝子座のレベルを評価することによって決定される。非限定的な例として、一実施形態では、対象の集団(例えば、10、20、50、100、200、500またはそれ以上の対象)は癌を有さないことが分かっており、各対象からのサンプルが、各サンプルのマイクロサテライト遺伝子座のレベルについて分析される。
別の実施形態では、MSI−PTは、マイクロサテライト遺伝子座(例えば、マイクロサテライト遺伝子座:1〜170)の参照値に対応し、癌を有する対象の集団(例えば、結腸直腸癌)からのサンプル中のマイクロサテライト遺伝子座のレベルを評価することによって決定される。
別の非限定的な例では、対象の集団(例えば、10、20、50、100、200、500またはそれ以上の対象)は結腸直腸癌を有し、各対象からのサンプルが、マイクロサテライト遺伝子座(例えば、マイクロサテライト遺伝子座:1〜170)について分析される。いくつかの実施形態では、対象の集団は、年齢、性別、人種、または他の基準などの、患者の1つ以上の特徴によれば、調査中の対象と一致する。いくつかの実施形態では、参照値は、調査中の対象のMSIを検出するために使用されるサンプルと同じタイプの、対象の集団からのサンプル(例えば、血漿または結腸直腸組織サンプルを含むサンプル)を使用して確立される。
参照値は、任意の適切な方法を使用して決定することができる(例えば、対象からサンプルを収集し、マイクロサテライト遺伝子座レベルを決定する)。そのような決定を行う際に、専門家によって標準的な統計的方法が採用され得ることが理解されるであろう。例えば、Marcello Pagano et al.によるPrinciples of Biostatistics(Brook Cole;2000)、およびBernard RosnerによるFundamentals of Biostatistic(Duxbury Press,5th Ed,1999)を参照されたい。
別の実施形態では、調査中の対象からのサンプルの特定のマイクロサテライト遺伝子座(例えば、遺伝子座:1)の閾値は、マイクロサテライト遺伝子座がMSIであるかどうかを決定するために、対照サンプル(例えば、一致する健康なサンプル)と比較することができる。いくつかの実施形態では、対照サンプルは、癌の臨床症状を全く示さない対象からのサンプルである。いくつかの実施形態では、対照サンプルは、癌(例えば、結腸直腸癌)を有すると臨床的に診断された対象からのサンプルである。いくつかの実施形態では、対照サンプルが得られる対象は、調査中の対象と同じ年齢、またはほぼ同じ年齢、かつ/または同じ性別である。
対象およびサンプル
いくつかの実施形態では、サンプルは、個体のヒト対象(すなわち、癌について評価されているヒト対象)からのものである。いくつかの実施形態では、対象は成人である。いくつかの実施形態では、対象は小児である。いくつかの実施形態では、対象は、癌と診断されたヒトである。いくつかの実施形態では、対象は、癌を有することが疑われるヒトである。場合によっては、対象はイヌ、ネコ、ウマ、ヒツジ、マウス、ラット、ウサギ、サル、またはヒトである。
いくつかの実施形態では、対象からのサンプルは、全血(例えば、採血)、血清、血漿、唾液、尿、脳脊髄液、または組織サンプル(例えば、結腸バイオプシー)を含む。いくつかの実施形態では、サンプルは、腫瘍から得られた細胞を含む。いくつかの実施形態では、サンプルは、結腸組織サンプルである。いくつかの実施形態では、サンプルは、無細胞DNAサンプルである。さらに別の実施形態では、サンプルは、循環腫瘍DNA(ctDNA)サンプルである。好ましい実施形態では、サンプルは、対象からのゲノムDNAを含む。いくつかの実施形態では、ゲノムDNAは、個体の対象、好ましくは哺乳動物に由来する。いくつかの態様では、サンプルは、対象からの、ゲノムDNAを含む任意の組織、細胞、または生体液を含み得る。いくつかの実施形態では、サンプルは、血液サンプルである。別の実施形態では、サンプルは、腫瘍から得られた組織サンプルである。
いくつかの実施形態では、サンプルは、ホルマリンで固定され、パラフィンに埋め込まれた組織サンプル(FFPE)である。バイオプシーからの組織サンプルは、通常、長期保存のためにFFPEに保存される。ホルマリンは、組織サンプル内に破壊が困難であり得る架橋を形成し、場合により、DNA収量の低下をもたらす。ホルマリン固定パラフィン包埋サンプルに関連する別の問題は、多くの場合、より長い核酸断片の増幅である。FFPEサンプルからのDNAを多重増幅反応に使用すると、断片サイズが大きくなり、ピーク高さが大幅に低下することが多い。本発明のマイクロサテライト不安定性法は、FFPE組織サンプルからのゲノムDNAを増幅および分析するように好ましく設計されている。一実施形態では、MSIを検出するために本明細書に開示される方法は、対象の腫瘍からの少なくとも1つのゲノムDNA断片を含む。別の実施形態では、本明細書に開示される方法は、MSIを検出するために、健康な組織からの一致したサンプルを必要としない。
IV.コンピュータシステム
一態様では、本開示は、マイクロサテライト不安定性を検出するためのシステムに関する。一実施形態では、システムは、プロセッサ、およびプロセッサに連結された非一時的なコンピュータ可読媒体を含み、非一時的なコンピュータ可読媒体は、方法を実行するためのプロセッサによって実行可能なコードを含む。ここで方法は、(1)ヒトゲノムDNAから複数のマイクロサテライト遺伝子座のシーケンシングリードを受け取ること、(2)各マイクロサテライト遺伝子座について反復長分布(RLD)を決定すること、(3)各マイクロサテライト遺伝子座についてRLDの基準値を生成すること、(4)独立した閾値を有する各マイクロサテライト遺伝子座の基準値を、マイクロサテライト遺伝子座の閾値と比較すること、(5)検出された、閾値を超えるRLD基準値を有するマイクロサテライト遺伝子座の数を定量化すること、および(6)(i)閾値を超えるRLD基準値を有するマイクロサテライト遺伝子座の数を、(ii)遺伝子座セットの比率閾値と比較することを含み、そのマイクロサテライト遺伝子座の数が遺伝子座セットの比率閾値を超える場合、システムは、ヒトからのサンプルをMSIとして分類する。いくつかの実施形態では、閾値を超えるマイクロサテライト遺伝子座の数が、遺伝子座セットの比率閾値よりも少ない場合、システムは、ヒトからのサンプルをMSSとして分類する。いくつかの実施形態では、システムは、1つ以上のサンプルのMSI状態を同時に決定することができる。好ましい実施形態では、システムは、2つ以上の対象からの2つ以上のサンプルのMSI状態を同時に決定することができる。
一実施形態では、システムは、サンプル中の複数のMSI遺伝子座をアッセイして、複数のMSI遺伝子座のRLDを決定するように構成された少なくとも1つのデバイスをさらに含む。いくつかの実施形態では、各マイクロサテライト遺伝子座のRLDの基準値は、スチューデントのt検定またはウィルコクソンの順位検定などのt統計量を含むことができる。いくつかの実施形態では、遺伝子座のt統計量は、その遺伝子座の平均リード長およびRLDの分散に基づいて決定される。いくつかの実施形態では、t統計量は、試験サンプルのRLDおよび対照RLDに基づいて決定される。
いくつかの実施形態では、様々な記憶デバイスの集合を含み得るコンピュータ可読媒体は、MSI状態に応じて利用可能な治療薬のリストを含むデータベース、閾値を超えるRLD基準値を有するマイクロサテライト遺伝子座の数を入力するための命令、および閾値を超えるRLD基準値を有するマイクロサテライト遺伝子座の数を遺伝子座セットの比率閾値と比較する機能を含む。いくつかの実施形態では、コンピュータ可読媒体は、遺伝子座セットの比率閾値との比較がデータベース内の少なくとも1つの治療薬の見込みある利益を示す、治療薬のリストを含むレポートを生成するための命令を有する、コンピュータ可読コードをさらに含む。いくつかの実施形態では、少なくとも1つの治療薬の見込みある利益は、MSIと診断されたヒト対象における、1つ以上の既知のまたは文書化された治癒的、肯定的、または改善的な反応を含む。いくつかの実施形態では、少なくとも1つの治療薬は、抗体、小分子、化学療法剤、またはそれらの組み合わせである。一実施形態では、少なくとも1つの治療薬は、ペムブロリズマブである。
いくつかの実施形態では、システムは、シーケンシングリードをマイクロサテライト遺伝子座DNA配列のセットにアラインメントすることによって、マイクロサテライト遺伝子座を含むシーケンシングリードを識別するための命令、およびマイクロサテライト遺伝子座を含むと決定された各シーケンシングリードの反復長の数をカウントし、それにより、各マイクロサテライト遺伝子座のRLDを生成するための命令をさらに含む。
コンピュータシステム(およびコンピュータシステムの個々の動作コンポーネントのコンポーネント)の従来のデータネットワーキング、アプリケーション開発、および他の機能的側面は、本明細書では詳細に説明されていないが、本開示の一部と見なされる。さらに、本明細書に含まれる様々な図に示される接続線は、例示的な機能的関係および/または様々な要素間の物理的接続を表すことを意図している。コンピュータシステムには、多くの代替または追加の機能的関係または物理的接続が存在し得ることに注意するべきである。
本明細書で論じられる様々なコンピュータシステムコンポーネントは、ホストサーバ、またはデジタルデータを処理するためのプロセッサを含む他のコンピューティングシステム;プロセッサに連結された、デジタルデータを格納するためのメモリ;プロセッサに連結された、デジタルデータを入力するための入力デジタイザ;メモリに格納され、プロセッサによりアクセス可能な、プロセッサによるデジタルデータの処理を指示するためのアプリケーションプログラム;プロセッサおよびメモリに連結され、プロセッサで処理されたデジタルデータから得られた情報を表示するためのディスプレイデバイス;および複数のデータベースのうちの1つ以上を含み得る。
本明細書で使用される様々なデータベースには、家族歴、人口統計学および環境データなどの患者データ、生物学的サンプルデータ、過去の治療およびプロトコルデータ、患者の臨床データ、生物学的サンプルの分子プロファイリングデータ、治療薬および/または治験薬に関するデータ、遺伝子ライブラリ、疾患ライブラリ、薬物ライブラリ、患者追跡データ、ファイル管理データ、財務管理データ、請求データ、および/またはシステムの操作に有用な同様のデータが含まれ得る。
当業者が理解するように、コンピュータシステムは、オペレーティングシステム(例えば、Windows NT、95/98/2000、OS2、UNIX、Linux、Solaris、MacOSなど)、ならびに様々な従来のサポートソフトウェア、およびコンピュータに典型的に関連付けられているドライバを含み得る。コンピュータシステムは、任意の適切なパーソナルコンピュータ、ネットワークコンピュータ、ワークステーション、ミニコンピュータ、メインフレームなどを含み得る。コンピュータシステムは、ネットワークにアクセスできる家庭、医療またはビジネス環境に置くことができる。例示的な実施形態では、アクセスは、市販のウェブブラウザソフトウェアパッケージによるネットワークまたはインターネットを介する。
本明細書で使用される場合、「ネットワーク」という用語は、そのハードウェアおよびソフトウェアコンポーネントの両方を組み込んだ、任意の電子通信手段を含むものとする。ユーザと他の当事者との間の通信は、例えば、電話ネットワーク、エクストラネット、イントラネット、インターネット、POI(point of interaction)デバイス、パーソナルデジタルアシスタント、携帯電話、キオスク、オンライン通信、衛星通信、オフライン通信、無線通信、トランスポンダー通信、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、ネットワークまたは接続デバイス、キーボード、マウス、および/または任意の適切な通信もしくはデータ入力様式など、任意の適切な通信チャネルを介して達成することができる。インターネットに関連して利用されるプロトコル、規格、およびアプリケーションソフトウェアに関する特定の情報は、一般に当業者に知られており、したがって、本明細書で詳述する必要はない。例えば、Dilip Naik、Internet Standards and Protocols(1998)、多数の作成者によるJava 2 complete(Sybex 1999)、およびDeborah Ray and Eric Ray,Mastering html 4.0(1997)を参照されたい。
様々なコンピュータシステムコンポーネントは、独立して、個別に、または集合的に、データリンクを介して適切にネットワークに接続され得る。さらに、システムは、本明細書に記載の同様の機能を有する、任意のネットワークを通した任意の商品、サービス、または情報(例えば、シーケンシングリードまたはシーケンシングデータ)の使用、販売、または配布を企図する。
本明細書で使用される場合、「送信」は、ネットワーク接続を通して、あるシステムコンポーネントから別のシステムコンポーネントに電子データを送ることを含み得る。さらに、本明細書で使用される場合、「データ」は、デジタルまたは任意の他の形態のコマンド、クエリ、ファイル、記憶用のデータなどの包括的情報を含み得る。
本明細書で言及されるコンピュータシステムのいずれも、任意の適切な数のサブシステムを利用することができる。そのようなサブシステムの例は、図8に示されている。いくつかの実施形態では、コンピュータシステム10は、サブシステムがコンピュータ装置のコンポーネントであり得る、単一のコンピュータ装置を含む。他の実施形態では、コンピュータシステムは、それぞれがサブシステムであり、内部コンポーネントを備えた複数のコンピュータ装置を含むことができる。
図8に示されるサブシステムは、システムバス75を介して相互接続されている。プリンタ74、キーボード78、記憶デバイス79、ディスプレイアダプタ82に接続されたモニタ76などの追加のサブシステムが示されている。周辺機器および入力/出力(I/O)デバイスは、I/Oコントローラ71に接続されており、シリアルポート77など、当技術分野で知られているいくつかの手段でコンピュータシステムに接続することができる。例えば、シリアルポート77または外部インターフェース81(例えば、イーサネット、Wi−Fiなど)を使用して、コンピュータシステム10を、インターネット、マウス入力デバイス、またはスキャナなどの広域ネットワークに接続することができる。システムバス75を介した相互接続により、中央処理装置73は、各サブシステムと通信し、システムメモリ72または記憶デバイス79(例えば、固定ディスク)からの命令の実行、ならびにサブシステム間の情報の交換を制御することができる。システムメモリ72および/または記憶デバイス79は、コンピュータ可読媒体を具体化することができる。本明細書に記載されている値のいずれも、あるコンポーネントから別のコンポーネントに出力することができ、ユーザに出力することができる。
コンピュータシステムは、例えば、外部インターフェース81または内部インターフェースによって一緒に接続された、複数の同じコンポーネントまたはサブシステムを含むことができる。いくつかの実施形態では、コンピュータシステム、サブシステム、または装置は、ネットワークを通して通信することができる。このような場合、1台のコンピュータをクライアントと見なし、別のコンピュータをサーバと見なすことができ、それぞれが、同じコンピュータシステムの一部であることができる。クライアントおよびサーバには、それぞれ複数のシステム、サブシステム、またはコンポーネントを含めることができる。
本発明の実施形態のいずれも、ハードウェア(例えば、特定用途向け集積回路またはフィールドプログラマブルゲートアレイ)を使用して、かつ/または一般的にプログラマブルプロセッサをモジュール式または一体化方式で備えたコンピュータソフトウェアを使用して、制御ロジックの形態で実装できることを理解されたい。本明細書で使用する場合、プロセッサは、同じ集積チップ上のマルチコアプロセッサ、または単一の回路基板上の、もしくはネットワーク化された複数の処理ユニットを含む。本明細書で提供される開示および教示に基づいて、当業者は、ハードウェアおよびハードウェアとソフトウェアとの組み合わせを使用して、本発明の実施形態を実施するための他の手段および/または方法を知り、理解するであろう。
本出願に記載されているソフトウェアコンポーネントまたは機能のいずれも、例えば従来の、またはオブジェクト指向の技術を使用して、Java、C++またはPerlなどの任意の適切なコンピュータ言語を使用してプロセッサで実行される、ソフトウェアコードとして実装できる。ソフトウェアコードは、記憶および/または送信のためにコンピュータ可読媒体に一連の命令またはコマンドとして保存することができ、適切な媒体には、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、ハードドライブもしくはフロッピーディスクなどの磁気媒体、またはコンパクトディスク(CD)もしくはDVD(デジタル多用途ディスク)などの光学媒体、フラッシュメモリなどが含まれる。コンピュータ可読媒体は、そのような記憶デバイスまたは送信デバイスの任意の組み合わせであり得る。コンピュータ実行可能命令は、適切なコンピュータ言語またはいくつかの言語の組み合わせで書かれ得る。コンピュータによる基本的な生物学的方法は、例えば、Setubal and Meidanis et al.,Introduction to Computational Biology Methods(PWS Publishing Company,Boston,1997);Salzberg,Searles,Kasif,(Ed.),Computational Methods in Molecular Biology,(Elsevier,Amsterdam,1998);Rashidi and Buehler,Bioinformatics Basics:Application in Biological Science and Medicine(CRC Press,London,2000)およびOuelette and Bzevanis Bioinformatics:A Practical Guide for Analysis of Gene and Proteins(Wiley&Sons,Inc.,2.sup.nd ed.,2001)に記載されている。例えば、米国特許第6,420,108号を参照されたい。
そのようなプログラムはまた、インターネットを含む様々なプロトコルに準拠する有線、光、および/または無線ネットワークを介した送信に適合された搬送波信号を使用して符号化および送信され得る。したがって、本発明の実施形態によるコンピュータ可読媒体は、そのようなプログラムで符号化されたデータ信号を使用して作成することができる。プログラムコードで符号化されたコンピュータ可読媒体は、互換性のあるデバイスと一緒にパッケージ化されるか、または他のデバイスとは別に提供され得る(例えば、インターネットダウンロードを介して)。そのようなコンピュータ可読媒体は、単一のコンピュータプログラム製品(例えば、ハードドライブ、CD、またはコンピュータシステム全体)上またはその内部に存在し得、システムまたはネットワーク内の異なるコンピュータプログラム製品上またはその内部に存在し得る。コンピュータシステムは、本明細書に記載の結果のいずれかをユーザに提供するためのモニタ、プリンタ、または他の適切なディスプレイを含み得る。
本明細書に記載の方法のいずれも、工程を実行するように構成することができる1つ以上のプロセッサを含むコンピュータシステムを使用して、全体的または部分的に実行することができる。したがって、実施形態は、本明細書に記載の方法のいずれかの工程を実行するように構成された、各工程または工程の各集団を実行する種々のコンポーネントを潜在的に備える、コンピュータシステムに関することができる。番号付きの工程として提示されているが、本明細書の方法の工程は、同時にまたは異なる順序で実行することができる。さらに、これらの工程の一部は、他の方法からの他の工程の一部とともに使用することができる。また、工程のすべてまたは一部は、任意選択であり得る。さらに、いずれかの方法の任意の工程は、モジュール、回路、またはこれらの工程を実行するための他の手段を使用して実行することができる。
当業者によって理解されるように、コンピュータシステムは、既存のシステム、アドオン製品、アップグレードされたソフトウェア、スタンドアロンシステム、分散システム、方法、データ処理システム、データ処理のためのデバイス、および/またはコンピュータプログラム製品のカスタマイゼーションとして具体化され得る。したがって、コンピュータシステムは、完全なソフトウェアの具体化、完全なハードウェアの具体化、またはソフトウェアおよびハードウェアの両方の態様を組み合わせた具体化の形態をとることができる。
図9は、各マイクロサテライト遺伝子座および遺伝子座セットのRLDの基準値またはMSI−PTを利用する、対象からのサンプル中のMSIを検出するためのシステム40の例示的な実施形態のブロック図を示す。システム40は、ユーザインターフェース12、データを処理するためのプロセッサ16を含むホストサーバ14、プロセッサに接続されたメモリ18、メモリ18に格納され、データの処理を指示するためにプロセッサ16によってアクセス可能なアプリケーションプログラム20、プロセッサ16、複数の内部データベース22および外部データベース24、ならびに有線または無線通信ネットワーク26(インターネットなど)とのインターフェースを含む。システム10はまた、ユーザインターフェース12から受信されたデータからデジタルデータを入力するためにプロセッサ16に接続された、入力デジタイザ28を含み得る。ユーザインターフェース12は、システム10にデータを入力するための、およびプロセッサ16によって処理されたデータから導出された情報を表示するための入力デバイス30およびディスプレイ32を含む。ユーザインターフェース12はまた、MSIの試験結果および試験結果に基づいて提案された治療薬を含み得るレポートなど、プロセッサ16によって処理されたデータから導出された情報を印刷するためのプリンタ34を含み得る。内部データベース22は、これらに限定されないが、患者サンプル/標本情報および追跡、臨床データ、患者データ、ファイル管理、研究プロトコル、および患者試験結果を含み得る。外部データベース24は、これらに限定されないが、薬物ライブラリ、疾患ライブラリ、ならびにNCBI、PubMed、UniGene、OMIM、GO、TIGR、GenBank、KEGGおよびBiocartaなどの公的および私的データベースを含み得る。
さらに、本開示は、米国公報第20020183936号に示されるように、インターネットなどのネットワークを介してMSIなどの遺伝子情報を提供するための方法を含む実施形態に関する。例えば、本明細書に開示される1つ以上の方法は、ある場所、例えば、都市、州、国、または大陸で実施することができ、結果は、別の都市、州、国、または大陸に送信することができる。治療の選択は、第2の場所で全体的または部分的に行うことができる。本発明の方法は、異なる場所間でのMSI情報の送信を含む。
V.治療方法
別の態様では、MSIを有すると診断された対象(例えば、結腸直腸癌)を治療する方法が提供される。いくつかの実施形態では、記載の方法は、癌に関する。いくつかの実施形態では、方法は、癌の進行を遅らせるかまたは逆行させることによって対象を治療することを含む。
いくつかの実施形態では、方法は、対象がMSIを有するかどうかの判定を含む。いくつかの実施形態では、方法は、対象からのサンプル中の複数のマイクロサテライト遺伝子座のRLD基準値を決定すること、RLD基準値を複数のマイクロサテライト遺伝子座の閾値と比較すること、閾値を超えるRLD基準値を有するマイクロサテライト遺伝子座の数を定量化すること、閾値を超えるRLD基準値を有するマイクロサテライト遺伝子座の数をMSI比率閾値と比較すること(そのマイクロサテライト遺伝子座の数がMSI比率閾値を超える場合、対象はMSIを有する)、および対象に1つ以上の薬剤を投与することを含む。いくつかの実施形態では、RLDの基準値は、各マイクロサテライト遺伝子座のサンプルRLDを決定し、各マイクロサテライト遺伝子座について事前に計算されたバックグラウンドRLDと比較して、評価中の各マイクロサテライト遺伝子座のRLDの基準値を生成することによって調製される。
本明細書に記載の薬剤は、例えば、静脈内、髄腔内、脊髄内、腹腔内、筋肉内、鼻腔内、皮下、経口、局所、および/または吸入によって投与することができる。
薬剤は、剤形と適合する方法で、治療的に有効であるような量で投与される。「治療有効量」という用語は、投与される薬剤(例えば、本明細書に記載の化合物または医薬組成物)の、疾患、障害、または状態をある程度治療する、例えば、疾患の症状の1つ以上または対象が発症するリスクのある症状を軽減するための量を指す。いくつかの実施形態では、1日あたり約0.01mg/kg〜約500mg/kg、または約0.1mg/kg〜約200mg/kg、または約1mg/kg〜約100mg/kg、または約10mg/kg〜約50mg/kgの用量で使用できる。しかしながら、投薬量は、患者の条件、治療される状態の重症度、および使用される治療薬に応じて変えることができる。投与量は、特定の患者において特定の化合物の投与に伴う有害な副作用の存在、性質、および程度によっても決定される。特定の状況に適した投与量の決定は、専門家の技能の範囲内である。多くの場合、治療は、化合物の最適用量未満の、より少ない用量で開始される。その後、状況下で最適な効果が得られるまで、投与量を少しずつ増やす。便宜上、必要に応じて、1日の総投与量を分けて、小分けして1日中に投与することができる。
いくつかの実施形態では、本明細書に開示される方法は、対象がMSIと診断された場合に、対象を薬剤で治療することを含む。一実施形態では、薬剤はペムブロリズマブである。
いくつかの実施形態では、対象は癌を有するか、または癌を有することが疑われる。いくつかの実施形態では、MSIを有する対象は、結腸直腸癌(CRC)を有するか、または有することが疑われる。したがって、いくつかの実施形態では、本明細書に開示される方法は、既知のCRC薬剤、外科手術、化学療法、および/または放射線療法で対象を治療することを含む。一実施形態では、CRCを有する対象の治療は、外科手術、放射線療法、薬剤、およびそれらの組み合わせからなる群から選択される。
いくつかの実施形態では、結腸および/または直腸癌を治療する方法は、結腸および/または直腸癌について食品医薬品局(FDA)によって承認された1つ以上の薬剤を含む。いくつかの実施形態では、1つ以上の薬剤は、以下のリストから選択される。一実施形態では、CRCの治療は、治療量のMDG007(MacroGenics)を、それを必要とするヒトに投与することを含む。
いくつかの実施形態では、結腸癌の治療のために承認された薬剤には以下が含まれるが、これらに限定されない。
アバスチン(ベバシズマブ)
ベバシズマブ
カンプトサール(イリノテカン塩酸塩)
カペシタビン
セツキシマブ
サイラムザ(ラムシルマブ)
エロキサチン(オキサリプラチン)
エルビタックス(セツキシマブ)
5−FU(フルオロウラシル注射)
フルオロウラシル注射
イリノテカン塩酸塩
ロイコボリンカルシウム
ロンサーフ(トリフルリジンおよびチピラシル塩酸塩)
ニボルマブ
オプジーボ(ニボルマブ)
オキサリプラチン
パニツムマブ
ラムシルマブ
レゴラフェニブ
スティバルガ(レゴラフェニブ)
トリフルリジンおよびチピラシル塩酸塩
ベクチビックス(パニツムマブ)
ウェルコボリン(ロイコボリンカルシウム)
ゼローダ(カペシタビン)
ザルトラップ(Ziv−アフリベルセプト)
Ziv−アフリベルセプト
別の実施形態では、結腸癌の治療のために承認された薬剤の組み合わせには以下が含まれるが、これらに限定されない。
Capox;
Folfiri;
Folfiri−ベバシズマブ;
Folfiri−セツキシマブ;
Folfox;
Fu−Lv;
Xeliri;
Xelox;
いくつかの実施形態では、直腸癌の治療のために承認された薬剤には、以下が含まれるが、これらに限定されない:
アバスチン(ベバシズマブ);
ベバシズマブ;
カンプトサール(イリノテカン塩酸塩);
カペシタビン;
セツキシマブ;
サイラムザ(ラムシルマブ);
エロキサチン(オキサリプラチン);
エルビタックス(セツキシマブ);
5−FU(フルオロウラシル注射);
イリノテカン塩酸塩;
ロイコボリンカルシウム;
ロンサーフ(トリフルリジンおよびチピラシル塩酸塩);
ニボルマブ
オプジーボ(ニボルマブ);
オキサリプラチン;
パニツムマブ;
ラムシルマブ;
レゴラフェニブ;
スティバルガ(レゴラフェニブ);
トリフルリジンおよびチピラシル塩酸塩;
ベクチビックス(パニツムマブ);
ウェルコボリン(ロイコボリンカルシウム);
ゼローダ(カペシタビン);
ザルトラップ(Ziv−アフリベルセプト);および
Ziv−アフリベルセプト
いくつかの実施形態では、直腸癌の治療のために承認された薬剤の組み合わせには以下が含まれるが、これらに限定されない:
Capox;
Folfiri;
Folfiri−ベバシズマブ;
Folfiri−セツキシマブ;
Folfox;
Fu−Lv;
Xeliri;および
Xelox
いくつかの実施形態では、対象は、対象が有する、または有すると疑われる癌のタイプに特異的または反応的である、1つ以上の薬剤で治療される。
VI.キット
本開示はまた、本発明の方法を実施するための、本明細書に記載のプライマー、アダプターオリゴヌクレオチド、オリゴヌクレオチドプローブを含むキットを提供する。いくつかの実施形態では、オリゴヌクレオチドプローブは溶液中で提供されるが、他の実施形態では、それらは固体支持体に付着して提供される。好ましくは、プライマーおよびアダプターオリゴヌクレオチドは、既知の濃度で溶液中に提供される。キットには、ゲノムDNA断片の増幅、アダプターオリゴヌクレオチドのゲノムDNA断片へのライゲーション、オリゴヌクレオチドプローブのゲノムDNA断片へのハイブリダイズ、およびゲノムDNA断片およびアンプリコンからのオリゴヌクレオチドプローブの分離の検出に関する説明も含まれる。
特定の実施形態では、キットは、ゲノムDNA断片の取得、ゲノムDNAの増幅、オリゴヌクレオチドプローブのゲノムDNAへの結合、および少なくとも1つの条件(例えば、融解曲線分析の一部としての温度条件)の変更のうちの、1つ以上に関する説明書も含む。さらに、キットは、場合により、例えば、ヌクレオチド、ヌクレオチド類似体、酵素、塩、バッファー、共同因子などから選択される1つ以上の構成要素を含む。いくつかの実施形態では、キットはまた、増幅プロセス、シーケンシングプロセス、および/またはそれらの試薬の、正および/または負の制御として作用する核酸分子を含む。典型的には、キットはまた、プライマー、アダプターオリゴヌクレオチドおよびオリゴヌクレオチドプローブの梱包用の少なくとも1つの容器、説明書、および/または1つ以上の他の構成要素を含む。
実施例1−反復長分布の決定
マイクロサテライト遺伝子座は、左側配列、多数の反復単位、および右側配列からなる。マイクロサテライト遺伝子座の例を以下に示す。
(左側ヌクレオチド配列)−(GT)24−(右側ヌクレオチド配列)
サンプルは、一般に様々な反復単位長を含有すると仮定する。反復長分布は、次のように定義できる。R、ここでSはサンプル、Lは遺伝子座、Rは反復長分布である。
したがって、Rは、次のように表すことができる。
=<n、n、…n>、
ここで、nは、i個の反復単位の存在を裏付けるリードの数である。特定の遺伝子座Lの場合、Rは、集団内の健康な個体にとって準単形である。不安定性が存在する場合、Rの平均は、正常なバックグラウンドサンプルから大幅にシフトする。
このシフトは、PCRスタッターによって引き起こされるシフトよりも規模が大きいことが確認されているため、検出可能である。
図1Aおよび図1Bは、MSS(図1A)またはMSI(図1B)細胞株における、マイクロサテライト遺伝子座の断片分布を示すエレクトロフェログラムである。エレクトロフェログラムの太線は、内部対照を示し、明色の線は、試験サンプルを示す。図1A(MSS細胞株)見られるように、MSS試験サンプルおよび内部対照は、同様の断片サイズ分布で移動するように見える。
対照的に、3つすべてのマイクロサテライト遺伝子座のMSI細胞株サンプルは、内部対照と比較して、より小さな断片サイズで移動する(つまり、MSI試験サンプルの移動パターンを左にシフトする)ことが確認された。そのため、MSIサンプルは、反復長分布に基づいてMSSサンプルと区別できる。
実施例2−64のマイクロサテライト遺伝子座における反復単位の平均数の分布
この実施例では、64のマイクロサテライト遺伝子座のセットを、結腸直腸癌および子宮内膜癌から評価した。7人の健康な正常な対象、4つのMSS細胞株および4つのMSI細胞株からの無細胞DNAサンプルを評価した。15のサンプルそれぞれについて、Rを計算した。
箱ひげ図は、15のサンプルにわたる遺伝子座あたりの反復単位の平均数に対して生成され、サンプルタイプ(例えば、cfDNA、不安定な細胞株または安定した細胞株)ごとに分けられた。反復長分布の平均は、各遺伝子座および細胞タイプに対して与えられる。
図6Aおよび図6Bは、一連の63のプロットを示し、各プロットは、固有のマイクロサテライト遺伝子座に対応する。cfDNAサンプルでは、遺伝子座あたりの反復単位の数は安定しており、58/63遺伝子座で保たれている。さらに、これらの58の遺伝子座の平均反復単位数の分布は、完全に重複しているか、またはMSS細胞株からのサンプルの平均反復単位数の分布に極めて近似している。このように、このデータは、試験サンプルに対する参照として使用できるMSSサンプルを表す、バックグラウンド信号を計算できることを実証する。さらに、MSI細胞株の反復単位の平均数の分布は重複しておらず、cfDNA/MSSサンプルとは大幅に異なることが確認された。
実施例3−反復長分布の構成要素としての歪度
実施例2と同様に、同じ64の遺伝子座を、反復単位の平均数の歪度について評価した。7人の健康な正常な対象、4つのMSS細胞株および4つのMSI細胞株からの無細胞DNAサンプルを評価した。15のサンプルのそれぞれについて、歪度を計算した。
箱ひげ図は、15のサンプルにわたる遺伝子座あたりの反復単位の平均数の歪度対して生成され、サンプルタイプ(例えば、cfDNA、不安定な細胞株または安定した細胞株)ごとに分けられた。
図7Aおよび図7Bは、一連の64のプロットを示し、各プロットは、固有のマイクロサテライト遺伝子座に対応する。cfDNAサンプルでは、遺伝子座あたりの反復単位の平均数の歪度は安定しており、約37のマイクロサテライト遺伝子座で保たれている。
このように、このデータは、試験サンプルに対する参照として使用できるMSSサンプルを表す、バックグラウンド信号を計算できることを実証する。さらに、MSI細胞株の反復単位平均数の歪度の分布は重複しておらず、cfDNA/MSSサンプルとは大幅に異なることが確認された。
実施例4−MSI検出の計算プロセス
サンプル内のマイクロサテライト不安定性の検出は、マイクロサテライト遺伝子座のセットについて取得されたMSI比率閾値に基づく。ここで、サンプルをシーケンシングするか、または1つ以上のマイクロサテライト遺伝子座を含むサンプルについてのシーケンシングリードを取得する(例えば、シーケンシングデータファイルまたはデータベースから)。マイクロサテライト遺伝子座を含む各DNA断片のRLDが決定される。次に、マイクロサテライト遺伝子座ごとにRLD基準値を決定する。RLD基準値は、閾値(例えば、同じマイクロサテライト遺伝子座の正常なバックグラウンドサンプル、または事前に計算された正常なバックグラウンドRLD)と比較し、対応するマイクロサテライト遺伝子座の閾値を超えるマイクロサテライト遺伝子座の数が決定される。
次に、閾値を超えるRLD基準値を有するマイクロサテライト遺伝子座の量を、MSI比率閾値(例えば、35%)と比較する。RLD基準値が閾値を超えるマイクロサテライト遺伝子座の量が、MSI−PTより多い場合、サンプルはMSIとして分類する。上記の工程をコンピュータシステムを使用して実行し、サンプル内のMSIまたはMSSの状態を決定することができる。そのようなコンピュータプロセスの例示的なワークフローが図3に示され、本明細書では、「MSIコーラー(caller)パイプライン」と呼ばれる。MSIコーラー(caller)パイプラインは、4つの主要な段階で機能する。
第1に、msisensor(Niu et al.2013)を使用して、シーケンシングリードアラインメントから得られたRLDを要約する(経路a)。
第2に、健康なドナーからの正常な無細胞DNAサンプルのセット内の、保全されたRLDを示すマイクロサテライト遺伝子座のセットを選択する(経路b)。
第3に、マイクロサテライト遺伝子座ごとに2値化された分類子を習得して、既知のマイクロサテライトの安定性状態を有するトレーニングサンプルのセットからMSI状態を識別する(経路c)。
第4に、試験サンプルが適用されると、コンピュータプロセスは、サンプルがMSIであるかMSSであるかを決定する(経路d)。
マイクロサテライト遺伝子座パネル
例示的なMSI検出パネルには、本明細書でマイクロサテライト遺伝子座1〜64と呼ばれる64のマイクロサテライト遺伝子座が含まれた(表1を参照)。これらのマイクロサテライト遺伝子座は、結腸直腸癌、子宮内膜癌、および前立腺癌に関するマイクロサテライト安定性状態の情報を提供することが知られている。初期のマイクロサテライトパネルを、その後170遺伝子座のサイズに拡張した(表1、マイクロサテライト遺伝子座:1〜170を参照)。
msisensorからのRLD要約
上記のコンピュータパイプラインは、「msisensor」を使用して、BAM形式のリードアラインメントファイルでRLDを計算する。この工程には通常、msisensor用にコンパイルされた実行可能コード、含まれているマイクロサテライトマーカーの位置を定義するマイクロサテライトパネルファイル、およびシーケンシングリードアラインメントのBAMファイルを含む。Msisensorは、シーケンシングリードアラインメントに基づいて、含まれるマイクロサテライト遺伝子座のRLDを要約したRLDファイルを出力する。
正常なサンプルからのバックグラウンド構築
MSIコーラー(caller)パイプラインには、事前に計算された「正常な」RLD値を含めることができる。これは、マイクロサテライト遺伝子座がマイクロサテライト安定(MSS)サンプル全体で一貫したRLDを含む場合に、特にうまく機能する(例えば、図5A)。反復長の変動は、主にシーケンシング中のPCRスタッターの副作用であり、正常なサンプルのセットから抽出できると判断した。したがって、本発明者らは、所与のマイクロサテライト遺伝子座の事前に計算された正常なバックグラウンドRLDを表すために、一連の正常なサンプル(図6Aおよび6Bおよび図7Aおよび7BのCFDNA)から平均RLDを計算した。
しかしながら、ヘテロ接合性およびホモ接合性レベルでの可変反復長(例えば、図5C)は、PCRスタッターではなく、実際の生殖細胞変異によって引き起こされ得るため、下流の分析から除外されるべきである。さらに、標準とは大幅に異なるマイクロサテライト遺伝子座(例えば、図5B)は、マイノリティグループからの生殖細胞変異を意味する可能性があるため、バックグラウンドから除外するべきである。
マイクロサテライト遺伝子座全体で一貫性のないRLDは、距離基準値を使用してフィルタにかけ、2つのRLD間の類似性を測定できる。マイクロサテライト遺伝子座は、RLDからのペアワイズ距離の過半数が、試験されたいずれの距離基準値よりも「長い」場合、一貫性のないRLDを有すると見なされる。本明細書で使用されるように、RLDがすべてのマイクロサテライト遺伝子座のすべてのサンプルのペアからの中央値プラス2標準偏差距離よりも大きい場合、RLDは、長い。場合によっては、平均よりも中央値を使用して、外れ値の影響を減らす。
様々な距離基準値を使用して、2つのRLD間の類似性を評価できる。例えば、カルバック−ライブラー情報量、相関距離、余弦距離、ユークリッド距離、マンハッタン距離、およびコルモゴロフ−スミルノフ統計量などの距離基準値を使用して、2つのRLD間の類似性を評価できる。
所与のマイクロサテライト遺伝子座の一貫性のないサンプルをフィルタにかける場合、2つのRLD間の類似性を測定するのに、ユークリッド距離が好ましい場合がある。正常なバックグラウンドサンプルまでのユークリッド距離が、すべての場所のすべてのサンプルからの中央値プラス2標準偏差距離よりも大きい場合、サンプルは、他のサンプルと比較して一貫性がないと見なされる。
MSIコーラー(caller)
MSIコーラー(caller)パイプラインによるMSIの予測は、定義された閾値(つまり、MSI−PT)よりも大きい、評価中のMSI遺伝子座のパーセンテージまたは割合によって決定される。分類子のトレーニング工程は、トレーニングサンプルのセットからこれらの閾値を学習し、MSIコーラー(caller)は、これらの閾値を使用してサンプルをMSIまたはMSSとして分類する。t統計量は以下のように計算される。
Figure 2021528094
ここで、μfおよびS は、サンプルRLDの平均および分散であり、一方、μbおよびS は、バックグラウンドRLDの平均および分散であり、nは、特定のマイクロサテライト遺伝子座を含有するサンプル中のリードの総数である。一態様では、最大ユーデン指数は、真陽性率と偽陽性率との間の差異を最大化するように選択される。
正常なRLDバックグラウンドサンプルは、健康な非癌性サンプルのcfDNAから調製される。上記の距離基準値を使用してサンプルをフィルタにかけ、サンプル間のRLD変動を減らすことができる(データは表示せず)。
結論
本発明者らは、組織サンプルのMSI状態の検出を可能にする、コンピュータパイプラインを作成した。既存のマイクロサテライト不安定性検出パネルを5から170に拡張し、NGSを使用してすべてのマーカーからのMSI状態を同時に、大規模に監視した。健康なサンプルから反復長分布の共通のバックグラウンドを抽出することにより、一致する正常なサンプルの要件を排除した。一致する正常組織サンプルの採取時に発生する、別の形態の侵襲手術および関連するリスクを排除するので、一致する正常組織サンプルの不存在は、MSI検出における重要な進歩を意味する。また、採血から得られた血漿サンプルでのシーケンシングベースのアッセイおよびバイオインフォマティクスのワークフローを試験し、血漿サンプルを使用してサンプルをMSIまたはMSSとして分類できることを発見した。これらの発見は、採血を使用してMSIを検出できる、および/または治療レジメンの前、最中、および後にMSI状態を監視できるという点で、別の重要な進歩を意味する。大規模な臨床コホートに適用する場合、35%のMSIスコア閾値を、サンプルのMSS/MSI表示を決定するためのガイダンスとして使用できる。
ここに示すシーケンシングベースのアッセイおよびバイオインフォマティクスのワークフローは、循環腫瘍DNA(ctDNA)の含有量が少ないサンプルでも、FFPE組織サンプルおよび血漿中のMSI検出に堅牢な分析性能を提供する。

Claims (15)

  1. マイクロサテライト不安定性を検出するための方法であって、
    ヒトのヒトゲノムDNAからのシーケンシングリードを複数のマイクロサテライト遺伝子座について検出することと、
    各マイクロサテライト遺伝子座の反復長分布(RLD)の基準値を決定することと、
    前記基準値を、前記マイクロサテライト遺伝子座であって、各々が独立した閾値を有するマイクロサテライト遺伝子座の閾値と比較することと、
    前記閾値を超えるRLD基準値を有するマイクロサテライト遺伝子座の数を定量化することと、
    前記閾値を超えるRLD基準値を有する前記マイクロサテライト遺伝子座の数を、マイクロサテライト不安定性(MSI)比率閾値と比較することとを含み、前記数が前記MSI比率閾値を超える場合に、ヒトがマイクロサテライト不安定性を有する、方法。
  2. 前記複数のマイクロサテライト遺伝子座が、マイクロサテライト遺伝子座:1−170からなる群から選択される、少なくとも10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、または160のマイクロサテライト遺伝子座である、請求項1に記載の方法。
  3. 前記複数のマイクロサテライト遺伝子座が、マイクロサテライト遺伝子座:1−64からなる群から選択される少なくとも58のマイクロサテライト遺伝子座である、請求項1に記載の方法。
  4. 前記複数のマイクロサテライト遺伝子座が、表2のマイクロサテライト遺伝子座に対応する、請求項1に記載の方法。
  5. RLDの前記基準値が、一致する正常なサンプルの不存在下で決定される、請求項1に記載の方法。
  6. 前記閾値が、(i)MSSサンプル中の前記マイクロサテライト遺伝子座の前記反復長分布、(ii)一致した正常なサンプルにおける前記マイクロサテライト遺伝子座の前記反復長分布、(iii)事前に計算された正常なバックグラウンドでの前記マイクロサテライト遺伝子座の前記反復長分布、(iv)MSS細胞株から得られた前記マイクロサテライト遺伝子座の前記反復長分布、または(iv)前記マイクロサテライト遺伝子座が、MSIとして識別されるRLD基準値によって決定されている、請求項1に記載の方法。
  7. マイクロサテライト遺伝子座の前記基準値が、ヒトの前記マイクロサテライト遺伝子座についてのRLDの1つ以上の統計値、および参照RLDの1つ以上の統計値を使用して決定されるt統計量である、請求項1に記載の方法。
  8. 前記t統計量が、RLDにおける平均リード長および分散に基づいて決定される、請求項7に記載の方法。
  9. 前記検出が、ゲノムDNAからヌクレオチドシーケンシングリードを生成することと、およびマイクロサテライト遺伝子座を含むシーケンシングリードを、前記シーケンシングリードをマイクロサテライト遺伝子座DNA配列のセットにアラインメントすることによって同定することと、マイクロサテライト遺伝子座を含むと決定された各シーケンシングリードの反復長の数をカウントし、それによって各マイクロサテライト遺伝子座のRLDを生成することとを含む、請求項1に記載の方法。
  10. ヌクレオチドシーケンシングリードを生成する前に、前記ヒトゲノムDNAをマイクロサテライト遺伝子座含有DNAにハイブリダイズするオリゴヌクレオチドプローブにハイブリダイズすることによって、前記ヒトゲノムDNAが、マイクロサテライト遺伝子座について濃縮される、請求項9に記載の方法。
  11. 請求項1に記載の方法であって、
    ヒトゲノムDNA断片を含むサンプルを提供することと、
    オリゴヌクレオチドプローブのプールを前記サンプルに接触させることと、
    前記プールオリゴヌクレオチドプローブとのハイブリダイゼーション複合体中の、マイクロサテライト遺伝子座を含むDNA断片を捕捉し、それによって捕捉されたDNAを生成することと、
    前記ハイブリダイゼーション複合体を未結合核酸から分離することと、
    前記捕捉されたDNAを前記ハイブリダイゼーション複合体から溶出することと、
    前記ハイブリダイゼーション複合体から溶出された、前記捕捉されたDNAをシーケンシングすることと、
    マイクロサテライト遺伝子座を含むシーケンシングリードを、前記シーケンシングリードをマイクロサテライト遺伝子座DNA配列のセットにアラインメントすることにより同定することと、
    マイクロサテライト遺伝子座を含むと決定された各シーケンシングリードの反復長の数をカウントし、それによって各マイクロサテライト遺伝子座のRLDを生成することとを含む方法。
  12. 請求項1に記載の方法であって、
    ヒトゲノムDNA断片を含むサンプルを提供することと、
    マイクロサテライト遺伝子座に特異的なオリゴヌクレオチドプライマーを用いてマイクロサテライト遺伝子座を含むDNA断片を増幅し、アンプリコンを生成することと、
    前記アンプリコンをシーケンシングすることと、
    マイクロサテライト遺伝子座を含むシーケンシングリードを、前記シーケンシングリードをマイクロサテライト遺伝子座DNA配列のセットにアラインメントすることにより同定することと、
    マイクロサテライト遺伝子座を含むと決定された各シーケンシングリードの反復長の数をカウントし、それによって各マイクロサテライト遺伝子座のRLDを生成することとを含む方法。
  13. マイクロサテライト不安定性を検出するためのシステムであって、
    プロセッサと、
    前記プロセッサに連結された非一時的なコンピュータ可読媒体とを含み、前記非一時的なコンピュータ読み取り可能媒体が、
    ヒトゲノムDNAから複数のマイクロサテライト遺伝子座についてシーケンシングリードを受け取ることと、
    各マイクロサテライト遺伝子座の反復長分布(RLD)を決定することと、
    各マイクロサテライト遺伝子座について前記RLDの基準値を生成することと、
    各マイクロサテライト遺伝子座の前記基準値を、前記マイクロサテライト遺伝子座の閾値と比較することであって、各マイクロサテライトは独立した閾値を有する、比較することと、
    検出された、前記閾値を超えるRLD基準値を有する遺伝子座の数を定量化することと、
    (i)前記閾値を超えるRLD基準値を有するマイクロサテライト遺伝子座の数を、(ii)遺伝子座セットの比率閾値と比較することとを含む方法を実施するための、前記プロセッサによって実行可能なコードを含み、前記数が前記遺伝子座セットの比率閾値を超える場合、ヒトがマイクロサテライト不安定性を有する、システム。
  14. 固体支持体または異種薬剤に連結されたオリゴヌクレオチドのアレイであって、遺伝子座:1−170に対応するマイクロサテライト遺伝子座からなる群から選択されるマイクロサテライト遺伝子座に、少なくとも12、14、16、18、または20ヌクレオチドの連続配列にわたって相補的なオリゴヌクレオチドのセットを含み、前記セットが、マイクロサテライト遺伝子座遺伝子座:1−170に対応する、種々のマイクロサテライト遺伝子座にそれぞれ相補的である、少なくとも10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、または340のオリゴヌクレオチドを含む、オリゴヌクレオチドのアレイ。
  15. ヒトゲノムDNAサンプル中のマイクロサテライト遺伝子座を濃縮する方法であって、
    前記ヒトゲノムDNAを、請求項14に記載のオリゴヌクレオチドのアレイにハイブリダイズさせることと、
    ハイブリダイズしていないゲノムDNAを除去することと、
    前記オリゴヌクレオチドのアレイからハイブリダイズしたゲノムDNAを溶出し、それによってマイクロサテライト遺伝子座を濃縮することとを含む方法。
JP2020573126A 2018-06-29 2019-06-28 マイクロサテライト不安定性の検出 Pending JP2021528094A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023089731A JP2023109998A (ja) 2018-06-29 2023-05-31 マイクロサテライト不安定性の検出

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862692510P 2018-06-29 2018-06-29
US62/692,510 2018-06-29
PCT/EP2019/067371 WO2020002621A2 (en) 2018-06-29 2019-06-28 Detection of microsatellite instability

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2023089731A Division JP2023109998A (ja) 2018-06-29 2023-05-31 マイクロサテライト不安定性の検出

Publications (1)

Publication Number Publication Date
JP2021528094A true JP2021528094A (ja) 2021-10-21

Family

ID=67145787

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2020573126A Pending JP2021528094A (ja) 2018-06-29 2019-06-28 マイクロサテライト不安定性の検出
JP2023089731A Pending JP2023109998A (ja) 2018-06-29 2023-05-31 マイクロサテライト不安定性の検出

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2023089731A Pending JP2023109998A (ja) 2018-06-29 2023-05-31 マイクロサテライト不安定性の検出

Country Status (5)

Country Link
US (1) US20210375391A1 (ja)
EP (1) EP3815092A2 (ja)
JP (2) JP2021528094A (ja)
CN (1) CN112639983A (ja)
WO (1) WO2020002621A2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3863019A1 (en) * 2020-02-07 2021-08-11 Sophia Genetics S.A. Methods for detecting and characterizing microsatellite instability with high throughput sequencing
WO2022124575A1 (ko) * 2020-12-07 2022-06-16 (주)디엑솜 현미부수체 지역의 서열 길이의 변동계수를 이용한 현미부수체 불안정성 진단방법
WO2023283495A1 (en) * 2021-07-09 2023-01-12 The Brigham And Women's Hospital, Inc. Crispr-based protein barcoding and surface assembly
CN113488105B (zh) * 2021-09-08 2022-01-18 臻和(北京)生物科技有限公司 基于扩增子二代测序msi检测的微卫星位点、其筛选方法及应用
CN114220483B (zh) * 2021-12-03 2022-11-15 广州达安临床检验中心有限公司 用于微卫星稳定性状态检测的标志物、应用、方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5856097A (en) * 1992-03-04 1999-01-05 The Regents Of The University Of California Comparative genomic hybridization (CGH)

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US5721099A (en) 1992-10-01 1998-02-24 Trustees Of Columbia University In The City Of New York Complex combinatorial chemical libraries encoded with tags
US6420108B2 (en) 1998-02-09 2002-07-16 Affymetrix, Inc. Computer-aided display for comparative gene expression
US6322980B1 (en) 1999-04-30 2001-11-27 Aclara Biosciences, Inc. Single nucleotide detection using degradation of a fluorescent sequence
US6544732B1 (en) 1999-05-20 2003-04-08 Illumina, Inc. Encoding and decoding of array sensors utilizing nanocrystals
US20020183936A1 (en) 2001-01-24 2002-12-05 Affymetrix, Inc. Method, system, and computer software for providing a genomic web portal
US20070037185A1 (en) * 2005-05-11 2007-02-15 The Board Of Regents Of The University Of Texas System Estimating allele frequencies by small pool PCR
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
WO2009092035A2 (en) 2008-01-17 2009-07-23 Sequenom, Inc. Methods and compositions for the analysis of biological molecules
JP2011515102A (ja) 2008-03-28 2011-05-19 パシフィック バイオサイエンシーズ オブ カリフォルニア, インコーポレイテッド 核酸シーケンシング用組成物及び方法
US7923562B2 (en) 2008-06-16 2011-04-12 The Board Of Trustees Of The Leland Stanford Junior University Photocleavable linker methods and compositions
WO2010042514A1 (en) 2008-10-06 2010-04-15 Arizona Board Of Regents Nanopore and carbon nanotube based dna sequencer and a serial recognition elements
EP2218794A1 (en) * 2009-02-13 2010-08-18 Alphagenics International SA Detection of instability in regions of genomic DNA containing simple tandem repeats
WO2010117470A2 (en) 2009-04-10 2010-10-14 Pacific Biosciences Of California, Inc. Nanopore sequencing devices and methods
US9309557B2 (en) 2010-12-17 2016-04-12 Life Technologies Corporation Nucleic acid amplification
EP2483680A4 (en) 2009-09-30 2014-01-01 Quantapore Inc ULTRASOUND SEQUENCING OF BIOLOGICAL POLYMERS WITH THE HELP OF A MARKED NANOPORE
CN103282518B (zh) 2010-12-17 2016-11-16 纽约哥伦比亚大学理事会 使用经修饰的核苷酸和纳米孔检测的dna边合成边测序
US8845880B2 (en) 2010-12-22 2014-09-30 Genia Technologies, Inc. Nanopore-based single DNA molecule characterization, identification and isolation using speed bumps
EP3901955A1 (en) 2011-01-05 2021-10-27 The Chinese University Of Hong Kong Noninvasive prenatal genotyping of fetal sex chromosomes
WO2013019361A1 (en) 2011-07-07 2013-02-07 Life Technologies Corporation Sequencing methods
AU2012288629B2 (en) 2011-07-25 2017-02-02 Oxford Nanopore Technologies Limited Hairpin loop method for double strand polynucleotide sequencing using transmembrane pores
CN107828877A (zh) 2012-01-20 2018-03-23 吉尼亚科技公司 基于纳米孔的分子检测与测序
EP3540077B1 (en) 2012-02-16 2021-01-27 Genia Technologies, Inc. Methods for creating bilayers for use with nanopore sensors
EP2864502B1 (en) 2012-06-20 2019-10-23 The Trustees of Columbia University in the City of New York Nucleic acid sequencing by nanopore detection of tag molecules
US9605309B2 (en) 2012-11-09 2017-03-28 Genia Technologies, Inc. Nucleic acid sequencing using tags
US9759711B2 (en) 2013-02-05 2017-09-12 Genia Technologies, Inc. Nanopore arrays
WO2015048763A1 (en) 2013-09-30 2015-04-02 Life Technologies Corporation Polymerase compositions, methods of making and using same
CN106414765A (zh) 2013-12-20 2017-02-15 Illumina公司 在片段化的基因组dna样品中保留基因组连接信息
US9557294B2 (en) 2014-12-19 2017-01-31 Genia Technologies, Inc. Nanopore-based sequencing with varying voltage stimulus
AU2016264102A1 (en) 2015-05-18 2017-12-21 Karius, Inc. Compositions and methods for enriching populations of nucleic acids
CA2999403A1 (en) * 2015-09-22 2017-03-30 Biocartis Nv Improved detection of short homopolymeric repeats
GB201614474D0 (en) * 2016-08-24 2016-10-05 Univ Of Newcastle Upon Tyne The Methods of identifying microsatellite instability
CN106755501B (zh) * 2017-01-25 2020-11-17 广州燃石医学检验所有限公司 一种基于二代测序的同时检测微卫星位点稳定性和基因组变化的方法
CN107475375B (zh) * 2017-08-01 2018-08-24 南京世和基因生物技术有限公司 一种用于与微卫星不稳定性相关微卫星位点进行杂交的dna探针库、检测方法和试剂盒
CN107513565B (zh) * 2017-09-06 2018-08-24 南京世和基因生物技术有限公司 一种微卫星不稳定位点组合、检测试剂盒及其应用

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5856097A (en) * 1992-03-04 1999-01-05 The Regents Of The University Of California Comparative genomic hybridization (CGH)

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
MOLECULAR DIAGNOSTICS AND GENETICS, vol. 60, no. 9, JPN6022007852, 2014, pages 1192 - 1199, ISSN: 0004980201 *
ONCOTARGET, vol. 8, no. 5, JPN6022007854, 2017, pages 7452 - 7463, ISSN: 0004980199 *
THE JOURNAL OF MOLECULAR DIAGNOSTICS, vol. 20, no. 2, JPN6022007853, March 2018 (2018-03-01), pages 225 - 231, ISSN: 0004980200 *

Also Published As

Publication number Publication date
JP2023109998A (ja) 2023-08-08
EP3815092A2 (en) 2021-05-05
WO2020002621A2 (en) 2020-01-02
US20210375391A1 (en) 2021-12-02
WO2020002621A3 (en) 2020-07-30
CN112639983A (zh) 2021-04-09

Similar Documents

Publication Publication Date Title
JP6700333B2 (ja) ヘテロ接合性の消失(loss of heterozygosity)を評価するための方法および材料
JP6830094B2 (ja) 染色体異常を検出するための核酸及び方法
EP3117011B1 (en) Methods and processes for non-invasive assessment of genetic variations
JP2021528094A (ja) マイクロサテライト不安定性の検出
KR101718940B1 (ko) 알츠하이머성 치매 또는 경도인지장애를 위한 후생유전학 조기진단용 조성물
US11396678B2 (en) Breast and ovarian cancer methylation markers and uses thereof
US20190300964A1 (en) Colon cancer methylation markers and uses thereof
CN101679971A (zh) 青光眼恶化风险的判定方法
US20170321270A1 (en) Noninvasive prenatal diagnostic methods
EP3775274B1 (en) Detection method of somatic genetic anomalies, combination of capture probes and kit of detection
EP3976822A1 (en) Methods and systems for improving patient monitoring after surgery
WO2017112738A1 (en) Methods for measuring microsatellite instability
EP3431610A1 (en) Methods and devices for nucleic acid-based real-time determination of disease states
WO2015048852A1 (en) Kits and methods for diagnosis, screening, treatment and disease monitoring
US20120078527A1 (en) Kit and method for predicting sensitivity of gastric cancer patient to anti-cancer agent
CA3151627A1 (en) Use of simultaneous marker detection for assessing difuse glioma and responsiveness to treatment
TWI674320B (zh) 用以預斷吉特曼症候群的方法及套組
JP2021536232A (ja) 試料間の汚染を検出するための方法およびシステム
US20240002953A1 (en) Method for detecting polynucleotide variations
KR20120031734A (ko) 급성 골수성 백혈병 환자의 시타라빈 민감성을 예측하기 위한 키트 및 방법
WO2023058522A1 (ja) 構造多型の分析方法、プライマー対セット及びプライマー対セットの設計方法
WO2023284736A1 (en) Biomarkers for colorectal cancer treatment
WO2023109876A1 (en) Biomarkers for colorectal cancer treatment
US20230290439A1 (en) A Deep Learning Framework to Identify Pathogenic Non-Coding Somatic Mutations From Personal Cancer Genomes
WO2014182726A2 (en) Genetic markers for macular degeneration disorder treatment

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220301

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220329

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220803

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221019

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230202