JP2015512655A - 免疫レパートリ分析におけるサンプル混入の検出および定量化 - Google Patents

免疫レパートリ分析におけるサンプル混入の検出および定量化 Download PDF

Info

Publication number
JP2015512655A
JP2015512655A JP2015505861A JP2015505861A JP2015512655A JP 2015512655 A JP2015512655 A JP 2015512655A JP 2015505861 A JP2015505861 A JP 2015505861A JP 2015505861 A JP2015505861 A JP 2015505861A JP 2015512655 A JP2015512655 A JP 2015512655A
Authority
JP
Japan
Prior art keywords
nucleic acid
sequence
reconstituted
region
cells
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015505861A
Other languages
English (en)
Inventor
アズベリー、トーマス
カールトン、ビクトリア
ファハム、マレク
マセビッツ、スティーブン
ムーアヘッド、マーティン
ウィリス、トーマス
ジェン、ジャンビャオ
Original Assignee
シーケンタ インコーポレイテッド
シーケンタ インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US13/834,794 external-priority patent/US9528160B2/en
Priority claimed from US13/835,093 external-priority patent/US9506119B2/en
Application filed by シーケンタ インコーポレイテッド, シーケンタ インコーポレイテッド filed Critical シーケンタ インコーポレイテッド
Publication of JP2015512655A publication Critical patent/JP2015512655A/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6848Nucleic acid amplification reactions characterised by the means for preventing contamination or increasing the specificity or sensitivity of an amplification reaction

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本発明は、配列に基づいたクロノタイププロファイルを生成するために使用される、T細胞およびB細胞の少なくとも一方を含有する個人の組織サンプルにおいて核酸混入を検出し、かつ定量化するための方法に関する。一態様において、本発明は、対象とする個人由来の核酸を、対象としない個人のものと区別することができる内因性または外因性核酸タグの存在およびレベルの少なくとも一方を測定することによって実行される。内因性タグは、縦列型反復配列、まれなクロノタイプ、またはその他同種のものなどの遺伝的個性マーカを含み、外因性タグは、配列リードからクロノタイプ配列を決定するために用いられる配列タグを含む。

Description

本発明は、免疫レパートリ分析において、混入核酸を検出し、かつ定量化するための方法に関する。
DNAシークエンシングの塩基当たりの費用が低下し、シークエンシング技術が、より信頼できるものになり、より便利になったため、大規模DNAシークエンシングを使用する診断および予後応用法が、ますます開発されている(たとえば、特許文献1;非特許文献1;非特許文献2;非特許文献3;非特許文献4;非特許文献5)。特に、T細胞もしくはB細胞の受容体などの免疫分子またはそれらの構成成分をコードする核酸のプロファイルは、生物の健康または疾患の状態について豊富な情報を含有し、診断または予後指標のようなプロファイルの使用が、種々様々の状態について提唱されてきた(たとえば、特許文献1(上記引用);非特許文献2(上記引用);非特許文献3(上記引用))。さらに、そのような配列に基づくプロファイルは、増幅したCDRコード領域のサイズ分布、マイクロアレイによる配列サンプリング、PCRアンプリコンからのハイブリダイゼーション反応速度曲線に基づくアプローチまたは他のアプローチよりも非常に高い感度であり有る(たとえば特許文献2;非特許文献6;非特許文献7;非特許文献8;非特許文献9)。
しかしながら、増幅ステップを用いる他のDNAに基づくアッセイでのように、混入または相互混入DNAの存在は、免疫レパートリシークエンシングを用いるアッセイにおける有効な検出限界を低下させ得る。混入DNAの源は、アッセイ試薬、機器、オペレータ操作、エアロゾル、およびその他同種のものを含む(たとえば、非特許文献10;非特許文献11)。
癌の微小残存病変(MRD:minimal residual disease)の検出は、そのような混入によって影響を与えられる。多くの癌で治療された患者は、多くの場合、癌に関係するMRDを保持する。すなわち、たとえ、患者が、臨床上の測定値によって、治療に応じた、疾患の完全寛解を有し得るとしても、どういうわけか破壊を免れた、ごく一部分の癌細胞が残っていることもある。この残存している集団のタイプおよびサイズは、患者の継続的な治療のための重要な予後因子となる(たとえば、非特許文献12;非特許文献13)。したがって、MRDの測定がより高感度であるほど、次の治療の過程が成功する可能性は高くなるであろう(たとえば、非特許文献14)。フローサイトメトリ、インサイツハイブリダイゼーション、細胞遺伝学、核酸マーカの増幅、およびその他同種のものに基づく技術を含む、この集団を評価するためのいくつかの技術が、開発されてきた(たとえば、非特許文献15;非特許文献16など)。再構成免疫受容体のセグメント(つまりクロノタイプ)をコードする核酸のPCRおよび配列に基づく分析は、白血病およびリンパ腫におけるMRDを評価するのに特に有用である。なぜなら、そのようなセグメント(本明細書において「クロノタイプ」と呼ばれる)は、関連する癌細胞についての分子タグとして果たし得るユニークな配列を典型的に有するためである(たとえば、非特許文献6(上記引用);特許文献3など)。しかしながら、そのような技術の感度は、他の個人からの交差混入の存在によってなお制限されている。
米国特許出願公開第2010/0151471号明細書 米国特許第5,418,134号明細書 米国特許出願公開第2011/0207134号明細書
フリーマン(Freeman)ら、ゲノムリサーチ(Genome Research)、第19巻:p.1817〜1824(2009年) ボイド(Boyd)ら、サイエンストランスレーショナル医学(Sci.Transl.Med.)、第1巻(12):12ra23(2009年) ヒー(He)ら、オンコターゲット(Oncotarget)(2011年3月8日) パロマキ(Palomaki)ら、遺伝医学(Genet.Med.)、第14巻(3):p.296〜305(2012年) コールマン(Kohlmann)ら、オンコロジーセミナー(Semin.Oncol)、第39巻(1):p.26〜36(2012年) ヴァン・ドンゲン(van Dongen)ら、白血病(Leukemia)、第17巻:p.2257〜2317(2003年) オーグル(Ogle)ら、核酸リサーチ、第31巻:el39(2003年) ワング(Wang)ら、BMCゲノミクス(BMC Genomics)、第8巻:p.329(2007年) バウム(Baum)ら、ネイチャーメソッド(Nature Methods)、第3巻(11):p.895〜901(2006年) アーバン(Urban)ら、法科学技術学会誌(J.Forensic Sci.)、第45巻(6):p.1307〜1311(2000年) イニス(Innis)ら編、PCRプロトコール(PCR Protocols)(アカデミックプレス(Academic Press)、1990年)のクォック(Kwok)、p142〜145 カンパナ(Campana)、北米臨床血液オンコロジー(Hematol.Oncol.Clin.North Am.)、第23巻(5):p.1083〜1098(2009年) ブシサノ(Buccisano)ら、血液、第119巻(2):p.332〜341(2012年) スツクツェパンスキ(Szczepanski)ら、臨床血液学ベストプラクティスリサーチ(Best Pract.Res.Clin.Haematol)、第15巻(1):p.37〜57(2002年) ブシサノ(Buccisano)ら、オンコロジーの現在の見解(Current Opinion in Oncology)、第21巻:p.582〜588(2009年) ヴァン・ドンゲン(van Dongen)ら、白血病(Leukemia)、第17巻(12):p.2257〜2317(2003年)
配列に基づく診断および予後応用法の潜在的な影響力を考慮すると、特に、多くの患者サンプルが処理される環境で免疫レパートリシークエンシングを使用するアッセイにおいて、サンプル混入を好都合に検出し、かつ定量化する、利用可能な方法があれば、非常に望ましいであろう。
本発明は、免疫レパートリ分析において、混入核酸を検出し、かつ定量化するための方法に関する。本発明は、多くの手段および応用法(適用法)において例証され、これらの
いくつかについては、下記および本明細書の全体を通して概説される。
一態様において、本発明は、個人のT細胞およびB細胞の少なくとも一方を含む組織サンプルのクロノタイププロファイルにおいて混入のレベルを決定するための方法であって、(a)個人由来の組織サンプルを得るステップであって、組織サンプルが、個人由来の核酸および場合により1人以上の(1人または複数の)他の個人由来の核酸を含み、核酸が、T細胞およびB細胞の少なくとも一方由来の再構成核酸ならびに非再構成核酸を含むステップ、(b)組織サンプルの核酸からクロノタイププロファイルを生成するステップ、(c)遺伝子マーカからの個人および1人以上の他の個人の遺伝子同定に基づいて、1人以上の他の個人および個人由来の核酸の割合を得るために、組織サンプル由来の核酸の1つ以上の遺伝子座の遺伝子マーカをシークエンシングするステップであって、遺伝子マーカが、再構成核酸および非再構成核酸の両方に存在する遺伝子座に存在するステップ、ならびに(d)組織サンプルの核酸において存在する1人以上の他の個人由来の核酸の割合として、クロノタイププロファイルにおける混入核酸のレベルを決定するステップを含む方法に関する。
他の態様において、上記の方法は、(i)前記組織サンプルにおける前記核酸の総量を測定するステップ、(ii)前記組織サンプルにおける前記再構成核酸の総量を測定するステップ、(iii)前記個人由来のおよび前記1人以上の他の個人由来の前記非再構成核酸の割合を得るために、前記非再構成核酸において存在し、前記再構成核酸に存在しない、核酸の削除可能なセグメントにおける1つ以上の(1つまたは複数の)遺伝子座の遺伝子マーカをシークエンシングするステップ、ならびに(iv)前記組織サンプルの前記核酸における混入再構成核酸のレベルから、前記クロノタイププロファイルにおける混入核酸の前記レベルを決定するステップであって、混入再構成核酸のレベルが、核酸の総量、前記再構成核酸の総量、前記個人および前記1人以上の他の個人由来の前記核酸の前記割合、ならびに前記個人および前記1人以上の他の個人の前記非再構成核酸の割合から決定されるステップをさらに含む。
さらなる態様において、本発明は、個人のT細胞およびB細胞の少なくとも一方を含む組織サンプルのクロノタイププロファイルにおける、相互に関連のあるクロノタイプの検出限界を決定するための方法であって、(a)個人から組織サンプルを得るステップであって、組織サンプルが、個人由来の核酸および場合により1人以上の他の個人由来の核酸を含み、核酸が、T細胞およびB細胞の少なくとも一方由来の再構成核酸ならびに非再構成核酸を含むステップ、(b)組織サンプルの核酸からクロノタイププロファイルを生成するステップ、(c)遺伝子マーカからの個人および1人以上の他の個人の遺伝子同定に基づいて、1人以上の他の個人および個人由来の核酸の割合を得るために、組織サンプル由来の核酸の1つ以上の遺伝子座の遺伝子マーカをシークエンシングするステップであって、遺伝子マーカが、再構成核酸および非再構成核酸の両方に存在する遺伝子座に存在するステップ、ならびに(d)個人の1つ以上の遺伝子座の任意の対立遺伝子のレベルに対して次に高い、前記遺伝子マーカのいずれかの対立遺伝子のレベルとして検出限界を決定するステップを含む方法に関する。
本発明の上記に特徴づけられる態様および他の態様は、多くの示される手段および応用法において例証され、これらのいくつかについて、図に示され、続く請求項の部において特徴づけられる。しかしながら、上記の概要は、本発明のそれぞれ示される実施形態またはすべての手段について記載することを意図するものではない。
本発明の新規な特色は、添付の請求項において詳細に記載される。本発明の特色および利点についてのよりよい理解は、本発明の原理が利用されている、例証となる実施形態について記載する以下の詳細な説明および添付の図面に対する参照によって得られる。
本発明において使用される遺伝子マーカを増幅するための典型的な手法を示す図である。 患者核酸および1人以上の他の患者由来のキャリーオーバ(carry over)DNAなどの混入核酸を含む、サンプル中の核酸を示す図である。 特定の座の遺伝子マーカの対立遺伝子の間の配列リードの分布を示す図である。 患者の非再構成核酸(P)および再構成核酸(P)ならびに1人以上の他の患者由来のキャリーオーバDNAなどの非再構成核酸(C)および再構成核酸(C)混入核酸を含むサンプル中のDNAを示す図である。 核酸分子に対してユニークな配列タグを付加するためのサンプリングによる標識の例を示す図である。 核酸分子に対してユニークな配列タグを付加するためのサンプリングによる標識の例を示す図である。 IgH転写物およびその内部の天然の変異性の源を示す図である。 TCRβ遺伝子を増幅するための2段階PCR手法を示す図である。 TCRβ遺伝子を増幅するための2段階PCR手法を示す図である。 TCRβ遺伝子を増幅するための2段階PCR手法を示す図である。 図2CのPCR産物のヌクレオチド配列を決定するための詳細を示す図である。 図2CのPCR産物のヌクレオチド配列を決定するための他の実施形態の詳細を示す図である。 単一の反応においてIgH鎖から3つのシークエンシング鋳型を生成するためのPCR手法を示す図である。 3つの別々の反応においてIgH鎖から3つのシークエンシング鋳型を生成し、その後、結果として生じるアンプリコンが、P5およびP7プライマー結合部位を追加するために第2のPCRのために組み合わせられるPCR手法を示す図である。 3つの別々の反応においてIgH鎖から3つのシークエンシング鋳型を生成し、その後、結果として生じるアンプリコンが、P5およびP7プライマー結合部位を追加するために第2のPCRのために組み合わせられるPCR手法を示す図である。 IgH鎖について生成された配列リードの位置を示す図である。 NDN領域においてベースコールを改善するためのVおよびJ領域のコドン構造の使用を示す図である。 同じ配列タグと関連する配列リードからのクロノタイプの配列を決定するためのステップの1つの手段を示す図である。
本発明の実施は、他に指示されない限り、当技術分野の技術の範囲内にある分子生物学(組換え技術を含む)、バイオインフォマティクス、細胞生物学、および生化学についての従来の技術および説明を用いてもよい。そのような従来の技術は、血球のサンプリングおよび分析、核酸シークエンシングおよび分析、ならびにその他同種のものを含むが、これらに限定されない。適した技術の詳細な例説は、下記の本明細書における例に対する参照によってなすことができる。しかしながら、もちろん、他の等価な従来の手順もまた、使用することができる。そのような従来の技術および説明は、ゲノム分析:実験マニュアルシリーズ(Genome Analysis:A Laboratory Manual Series)(第I〜IV巻);PCRプライマー:実験マニュアル(PCR Primer:A Laboratory Manual);および分子クローニング:実験マニュアル(Molecular Cloning:A Laboratory Manual)(すべてコールドスプリングハーバー研究所出版局(Cold Spring
Harbor Laboratory Press)などの標準の実験マニュアルにおいて見つけることができる。
本発明は、クロノタイププロファイルを生成するために使用される個人の組織サンプルにおける核酸混入を検出し、かつ定量化するための方法に関する。特に、関心のある核酸混入は、患者から患者へのまたはアッセイオペレータから患者へのキャリーオーバ混入などの、他の個人から生じるものであり、1人以上の他の個人由来のクロノタイプを含有するDNAが、測定が意図される個人のDNAと不適切に混合される。そのようなキャリーオーバ混入の存在は、白血病などの癌と関連するクロノタイプなどの、非常に医学的関心のあるクロノタイプの存在または数量について偽の推定をもたらし得る。
一実施形態において、他の個人由来の核酸混入が、関心のある個人、つまり、測定またはアッセイが意図される個人と異なる遺伝的個性を有するDNAの量または割合を測定することによって決定されてもよい。組織サンプル中の核酸の遺伝的個性は、参照によって組み込まれる、以下の参考文献において開示されるような、ショートタンデムリピート(縦列型反復配列)、一塩基多型、およびその他同種のものに基づく従来の遺伝子同定アッセイによって決定されてもよい:キャスキー(Caskey)ら、米国特許第5,364,759号明細書;ウェバー(Weber)米国特許第5,075,217号明細書;シューメイカー(Shumaker)ら、ヒト突然変異(Human Mutation)、第7巻:p.346〜354(1996年);ソブリノ(Sobrino)ら、国際法医科学(Forensic Sci.Int.)、第154巻(2〜3):p.181〜194(2005年);マーク(Mark)、自然科学(Naturvissenschaften)、第84巻:p.181〜188(1997年)など。図1Aにおいて示されるように、典型的に、ゲノムDNA中の遺伝子マーカは、多型領域(170)を有し、多型領域(170)は、それぞれ、ゲノム上の遺伝子マーカ(170)を位置づけるために使用されてもよく、また、増幅および分析のためにプライマー結合部位を提供してもよい上流および下流フランキング領域(172)および(174)と共に、SNPまたはSTRを含有していてもよい。一実施形態において、上流および下流プライマー(176)および(180)が、それぞれ、免疫細胞由来の再構成核酸と共に、2段階PCRにおいて遺伝子マーカ(170)を増幅するために使用されてもよい(図2A〜2Bおよび4B〜4Cにおいて示されるように)。そのような実施形態において、プライマー(176)および(180)は、テール(178)および(182)をそれぞれ有し、これらは、2段階PCRの第2の段階において再構成核酸を増幅するために使用されるプライマーとして、同じプライマーを遺伝子マーカ(170)の増幅において使用するのを可能にする配列を有する。テールはまた、遺伝子マーカの座を同定するバーコードまたはタグを含有してもよい(たとえば、図1Aに関して座1、2、3などに由来するとしてそれを同定するために)。下記に記載されるように、可能な程度まで、プライマー(176)および(180)のポジションおよび長さは、それらのアニーリングおよび融解温度が、再構成核酸を増幅するために使用されるもの(たとえば図2Aの(212))とおよそ同じとなるように、また、結果として生じるアンプリコンが、再構成核酸分子のアンプリコンとおよそ同じ長さおよびGC含量を有するように選択される。
例示的な実施形態は、図1Bにおいて示される。その図において、組織サンプルから抽出された核酸(100)は、患者などの関心のある個人(102)および他の個人、すなわち混入核酸(104)の両方に由来するゲノムまたはゲノムのフラグメントを示す垂直線(101)として示される。個人はすべて、部位1、2、3、および4に遺伝子マーカを有し、関心のある個人については値S、S、S、およびS(108)を有し、混入DNAについては値S’、S’、S’、およびS’(110)を有し、もちろん、混入が1を超える他の個人由来のものである場合、それぞれの遺伝子座に1を超える値を含んでいてもよい。いかなる場合も、下記に言及されるように、関心のある個人に
ついての値は、組織サンプル中に存在し得る他の個人のものと区別され得る。これらのマーカに基づく関心のある個人の遺伝的個性が、あらかじめ知られていない場合、それは、アッセイにおいて生成される情報から決定されてもよい。関心のある個人のDNAが、大部分の核酸、たとえば80パーセント、90パーセント、95パーセントなどあろうと仮定すると、遺伝子マーカの様々な対立遺伝子に対応する配列リードの分布は、遺伝子マーカ座1について図1Cにおいて示されるように、関心のある個人に対応する対立遺伝子、つまり、大多数の対立遺伝子に偏るであろう。座1について、遺伝子マーカ、Sが、6つの対立遺伝子、S1A、S1B、S1C、S1D、S1E、およびS1Fを有するとする。最も大きな数の配列リード(152)を有する対立遺伝子、S1Cは、関心のある個人の対立遺伝子に相当するであろう。S1Cの配列リード(150)のうちのいくつかは、他の個人によるものであってもよく、いくつかは、他の対立遺伝子、たとえば(154)の中に分布してもよい。他の遺伝子座由来の配列リードの独立した数から、連立一次方程式を立て、関心のある個人および他の個人由来の核酸の割合の推定値を得るために解かれてもよい(たとえば、2つの未知数は、x=関心のある個人由来の遺伝子マーカの全配列リードの割合およびx=他の個人由来の遺伝子マーカの全配列リードの割合としてもよい)。それぞれの遺伝子マーカについての様々な対立遺伝子の間の配列リードの分布は、関心のある個人の特徴である対立遺伝子を同定するために使用され得る。クロノタイププロファイル測定の最大感度についての基準(たとえば、白血病クローンなどの相互に関連のあるクロノタイプの検出のための)は、図1Cにおいて線(155)によって示されるように、最大の非患者対立遺伝子の値によって提供される。対立遺伝子、S1Dを有する単一の混入ゲノムがあると仮定されている場合、S1Dよりも大きな値を有するいかなるクロノタイプも、患者クロノタイプの正確な測定になるであろう。S1D対立遺伝子未満のレベルのクロノタイププロファイルにおいて存在するいかなるクロノタイプについても、クロノタイプが患者から生じたものではない可能性がある。
一態様において、本発明は、個人のT細胞およびB細胞の少なくとも一方を含む組織サンプルのクロノタイププロファイルにおける、相互に関連のあるクロノタイプの検出限界を決定するための方法であって、(a)個人から組織サンプルを得るステップであって、組織サンプルが、個人由来のおよび場合により1人以上の他の個人由来の核酸を含み、核酸が、T細胞およびB細胞の少なくとも一方由来の再構成核酸ならびに非再構成核酸を含むステップ、(b)組織サンプルの核酸からクロノタイププロファイルを生成するステップ、(c)遺伝子マーカからの個人および1人以上の他の個人の遺伝子同定に基づいて、1人以上の他の個人および個人由来の核酸の割合を得るために、組織サンプル由来の核酸の1つ以上の遺伝子座の遺伝子マーカをシークエンシングするステップであって、遺伝子マーカが、再構成核酸および非再構成核酸の両方に存在する遺伝子座に存在するステップ、ならびに(d)個人の1つ以上の遺伝子座の任意の対立遺伝子のレベルに対して次に高い、前記遺伝子マーカのいずれかの対立遺伝子のレベルとして検出限界を決定するステップを含む方法に関する。
いくつかの状況において、全血またはPBMCなどの組織サンプルにおける細胞型の比(したがって非再構成DNAに対する再構成DNAの比)は、たとえば癌化学療法などの療法を受けている患者由来のサンプルおよび健康な個人などの他の個人由来の混入の間で著しく異なり得る。そのような場合、さらなる測定により、混入細胞または核酸を含み得る組織サンプルから様々な細胞に由来する核酸の様々な割合を決定することができる。この実施形態において、核酸のそのような割合は、患者(または関心のある個人)非再構成(P)、患者再構成(P)、混入物非再構成(C)、および混入物再構成(C)と呼ばれてもよい。本発明の本態様は、組織サンプル由来の核酸の組成物について図式により表示する図1Dにおいて示される。2つのバンド(120)および(122)は、それぞれ、患者(または関心のある個人)由来の核酸および混入核酸を示す。混入核酸に対する患者核酸の例示的な割合は、およそ90:10であってもよい。それぞれのバンドは
、再構成核酸(P(124)およびC(128))ならびに非再構成核酸(P(126)およびC(130))にさらに分けられる。上記に言及されるように、いくつかの状況下で、比P/Pは、比C/Cと非常に異なり得る。それぞれのバンドにおいて、遺伝子マーカ遺伝子座、S〜Sは、混入核酸に対する患者核酸の比を決定するために利用可能であり、これは、(P+P)/(C+C)=Rstr1であり、ここで、Rstr1は、他の個人由来の遺伝子マーカの配列リードに対する、患者核酸由来の遺伝子マーカの配列リードの比、つまり、上記からx/xである。
組織サンプルにおける全核酸の量または濃度は、再構成および非再構成核酸の両方に共通の「ハウスキーピング遺伝子」、たとえばGAPDHなどの核酸セグメント(「共通セグメント」と本明細書において呼ばれる)の量を、そのようなセグメントまたは遺伝子についての1つ以上の内部標準と比較することによって決定されてもよい。1つ以上の内部標準は、たとえば1または2段階PCRでのプロセシング前に組織サンプル由来の核酸に対して既知量または既知濃度で追加される。そのような全核酸内部標準を使用して、組織サンプル中の全核酸についての値、W;すなわち値、W=P+P+C+Cが得られてもよい。同様に、組織サンプル中の再構成核酸の総量または総濃度は、クロノタイプについての配列リードの量を、プロセシング前に組織サンプル由来の核酸に追加される1つ以上の再構成配列内部標準、たとえばV(D)J内部標準についての配列リードの量と比較することによって決定されてもよい。一実施形態において、特に長さおよび組成に関して分析されている免疫レパートリを代表する再構成配列内部標準のセットが、用いられる。他の実施形態において、そのような1つ以上の再構成配列内部標準の数が、1〜10で変動してもよい。そのような内部標準を使用して、値、W=C+Pが、決定されてもよい。
非再構成核酸の割合または量は、体細胞組換えプロセス、つまりTCRおよび/またはBCRが構築されるV(D)J再構成の間に通常切り取られる核酸のセグメントを測定することによって決定されてもよい。本明細書において「削除可能なセグメント」と呼ばれるそのようなセグメントは、それぞれ患者および混入核酸について、ボックス(132)および(134)によって図1Dにおいて示される。1つ以上のそのようなセグメントは、線(133)および(135)によって示されるように再構成核酸から削除され、ボックス(132)および(134)が存在しないことを示す。TCRおよびBCRの両方についてのV(D)J再構成の間に、少なくとも2つのセグメント:V領域遺伝子を含有するゲノムのストレッチとD領域遺伝子を含有するゲノムのストレッチとの間の第1の削除されるセグメントならびにD領域遺伝子を含有するゲノムのストレッチとJ領域遺伝子を含有するゲノムのストレッチとの間の第2の削除されるセグメントが常に削除され、失われる。これらのセグメントの配列は、NCBI Genome Browser(http://www.ncbi.nlm.nih.gov/map)、カリフォルニア大学、サンタクルーズ(UCSC)Genome Browser(http://genome.ucsc.edu/cgi−bin/h)、または同様のアトラスなどの公的に利用可能なゲノムアトラスから容易に得られる。たとえば、ヒトBCRをコードするV、D、およびJ遺伝子は、ゲノム領域14q32.33にまたはその近くに見つけられる;J遺伝子とD遺伝子との間の第1の削除されるセグメントは、ヒトゲノムのNCBIアトラスの染色体14上の座標−106,335K〜−106,345K内に位置する配列を有し、D遺伝子とV遺伝子との間の第2の削除されるセグメントは、ヒトゲノムのNCBIアトラスの染色体14上の座標−106,406K〜−106,385Kに位置する配列を有する。同様の削除可能なセグメントは、7q32−35の染色体7上に位置するヒトTCRβ鎖をコードするV、D、およびJ遺伝子について存在する。たとえばホッジス(Hodges)ら、臨床病理学会誌(J.Clin.Pathol)、第56巻:p.1〜11(2003年)。本発明の一態様において、存在する非再構成核酸、すなわち、第1および第2の削除されるセグメントをなお有する核酸の割合および/または量が、少なく
とも2つの方法で決定されてもよい。削除されるセグメント中に位置する多型遺伝子マーカを使用して、患者(または関心のある個人)および混入核酸由来の非再構成核酸の相対量を比較してもよい。すなわち、比P/C=Rstr2は、非再構成核酸由来の遺伝子マーカの配列リードから計算されてもよい。その代わりに、内部標準を使用して、非再構成配列の全数が数えられてもよい。第1のおよび/または第2の削除されるセグメントについてのそのような内部標準は、より十分に下記に議論されるように、従来の技術を使用して、上記のNCBI配列から容易に構成される。全核酸に関して、そのような測定は、数量、P+C=Wの決定を可能にし、ここで、Wが、非再構成核酸の全数または全濃度である。
上記の測定および関係は、以下の表において概説されてもよい。
再構成核酸の測定は、2つの異なる方法で行われてもよい;すなわち、それは、再構成配列内部標準を使用して直接測定されてもよく、値Nr=Wpが得られる、また、それは、全核酸および全非再構成核酸を使用して間接的に測定されてもよく、値Nr=Wg−Wxが得られる。本明細書において「ダーク再構成」と呼ばれる数量、z=(Nr−Nr)/Nrは、アッセイにおいて決定されない再構成核酸の測定値を提供する。
クロノタイプ混入を検出し、かつ定量化するための配列タグ
本発明の一態様において、混入クロノタイプが、遺伝的個性マーカの代わりとして配列タグを使用することによって検出され、かつ定量化されてもよい。本態様において、患者サンプル中のそれぞれのクロノタイプが、下記により十分に記載されるように、配列タグによって決定され、標識される。クロノタイプの形態をしているキャリーオーバ混入の存在は、クロノタイプが、作業中のサンプルまたは他のサンプルから生じたかどうかを決定するために、配列タグを使用することによって検出されてもよい。これは、それぞれの患者サンプルから決定される配列タグの記録を維持することによって達成され、次いで、次の測定が行われる場合は常に、作業中の測定の配列タグが、前の測定のものと比較される。クロノタイプと関連する配列タグのそのような記録は、それぞれの測定からの多くのタグならびに従来のアルゴリズムを使用する電子記録の検索および比較の容易性のために、大容量記憶装置上に電子記録として好都合に維持される。マッチが見つかった場合、最も可能性の高い原因は、キャリーオーバ混入である、ただし、測定に用いられる配列タグの集団が、十分に大きいことを条件とする。上記に議論されるサンプリングによって標識するためのクロノタイプ集団に対する配列タグ集団のサイズの同様な例示的な比は、キャリーオーバ混入の検出に適用可能である。一実施形態において、そのような比が、100:1以上であり、他の実施形態において、そのような比が、1000:1以上である。
配列タグを使用するクロノタイプの決定
いくつかの実施形態において、本発明は、速やかにかつ効率的にクロノタイププロファイルを決定するために、T細胞受容体(TCR:T cell receptor)またはB細胞受容体(BCR:B cell receptor)またはその定められたフラグメントなどの免疫分子のレパートリから配列データを得、かつ分析するためのステップ
を含む。配列データは、典型的に、免疫分子を分析するために使用されるDNAシークエンサからの配列リード、つまりベースコールの配列の大きな集合体および関連するクオリティースコアを含む。クロノタイププロファイルの構成における重要な課題は、抽出ステップ、シークエンシング化学、増幅化学、およびその他同種のものなどの、真の差異を含有する配列リードを、非生物学的な源由来のエラーを含有するものから、速やかにかつ正確に区別することである。本発明の一態様は、そのようなコンジュゲートの配列リードが同じもとのクロノタイプに由来するかどうかを決定するのを補助するために、サンプル中のそれぞれのクロノタイプに対してユニークな配列タグを付加するステップを含む。本発明の一態様に従って、配列タグが、タグ−分子コンジュゲートを形成するために、体細胞組換え核酸分子に対して付加され、そのようなコンジュゲートのそれぞれの再構成核酸が、ユニークな配列タグを有する。通常、そのような付加は、核酸分子がT細胞および/またはB細胞を含有するサンプルから抽出された後に、行われる。好ましくは、そのようなユニークな配列タグは、ハミング距離またはその他同種のものなどの、配列についての従来の距離測定値によって決定されるように、互いに、可能な限り、非常に異なる。タグ−分子コンジュゲート中の配列タグの間の距離を最大限にすることによって、シークエンシングおよび増幅のエラーの率が高いとしても、コンジュゲートの配列タグは、異なるコンジュゲートの任意の他のタグ配列のものに対してよりも、その原型となるタグ配列に対してはるかに類似したままである。たとえば、16塩基長配列タグが用いられ、クロノタイプのセット上のそれぞれのそのようなタグが、クロノタイプ上のあらゆる他の配列タグから、少なくとも50パーセントまたは8ヌクレオチドのハミング距離を有する場合、配列タグのミスリード(および関係ない配列タグを有するクロノタイプの配列リードの不正確なグルーピング)のために、あるそのようなタグを他のものに変換するのに、少なくとも8つのシークエンシングまたは増幅のエラーが、必要であろう。一実施形態において、配列タグが、タグ−分子コンジュゲートを形成するための再構成核酸分子に対する付加後に、タグ−分子コンジュゲートのタグの間のハミング距離が、そのような配列タグの全長の少なくとも25パーセントの数となるように、選択される。(すなわち、それぞれの配列タグは、そのヌクレオチドの少なくとも25パーセントにおいて、あらゆる他のそのようなタグと配列が異なる);他の実施形態において、そのような配列タグの間のハミング距離が、そのような配列タグの全長の少なくとも50パーセントの数である。
一態様において、クロノタイププロファイルが、(a)T細胞および/またはB細胞を含む個人からサンプルを得るステップ、(b)タグ−分子コンジュゲートを形成するために、T細胞受容体遺伝子またはT細胞および/もしくはB細胞の免疫グロブリン遺伝子の再構成核酸の分子に対して配列タグを付加するステップであって、実質的に、タグ−分子コンジュゲートのすべての分子が、ユニークな配列タグを有するステップ、(c)タグ−分子コンジュゲートを増幅するステップ、(d)タグ−分子コンジュゲートをシークエンシングするステップ、ならびに(e)レパートリの同じクロノタイプに対応する配列リードを決定するために、同様の配列タグの配列リードをアライメントするステップによって決定される。B細胞またはT細胞を含有するサンプルは、下記により十分に記載されるように、従来の技術を使用して得られる。配列タグを付加するステップにおいて、好ましくは、配列タグは、ある配列タグを他のものに変換する多数のシークエンシングまたは増幅のエラーの可能性さえ、0に近くなるように、ユニークなだけではなく、互いに十分に異なっている。配列タグを付加した後に、タグ−分子コンジュゲートの増幅は、ほとんどのシークエンシング技術に必要であるが、単一分子のシークエンシング技術が用いられる場合は常に、増幅ステップは、任意選択である。単一の分子シークエンシング技術は、単一分子リアルタイム(SMRT:single molecule real−time)シークエンシング、ナノポアシークエンシング、またはその他同種のものを含むが、これらに限定されない。たとえば米国特許第7,313,308号明細書;米国特許第8,153,375号明細書;米国特許第7,907,800号明細書;米国特許第7,960,116号明細書;米国特許第8,137,569号明細書;マンラオ(Manrao)
ら、ネイチャーバイオテクノロジー(Nature Biotechnology)、第4巻(8):p.2685〜2693(2012年)など。
いくつかの実施形態において、配列タグが、たとえば参照によって本明細書において組み込まれるブレナー(Brenner)ら、米国特許第5,846,719号明細書;ブレナー(Brenner)ら、米国特許第7,537,897号明細書;マチェビッツ(Macevicz)、国際公開第2005/111242号などによって開示されるように、サンプリングによって標識することによってサンプルの再構成核酸分子に対して付加される。サンプリングによって標識する際に、標識される(またはユニークにタグをつけられる)ことになっている集団のポリヌクレオチドは、非常に大きな集団の配列タグをサンプリングする(付加、連結、またはその他同種のものによって)ために使用される。すなわち、ポリヌクレオチドの集団がKメンバー(同じポリヌクレオチドの複製を含む)を有し、配列タグの集団がNメンバーを有する場合、N>>Kとなる。一実施形態において、本発明で使用される配列タグの集団のサイズが、サンプル中のクロノタイプの集団のサイズの少なくとも10倍であり、他の実施形態において、本発明で使用される配列タグの集団のサイズが、サンプル中のクロノタイプの集団のサイズの少なくとも100倍であり、他の実施形態において、本発明で使用される配列タグの集団のサイズが、サンプル中のクロノタイプの集団のサイズの少なくとも1000倍である。他の実施形態において、配列タグ集団のサイズが、サンプル中の実質的にすべてのクロノタイプが、そのようなクロノタイプが、たとえば、ライゲーション反応、増幅反応、またはその他同種ものなどの付加反応において、そのような配列タグ集団と組み合わせられる場合は常に、ユニークな配列タグを有するように、選択される。いくつかの実施形態において、実質的にすべてのクロノタイプが、そのようなクロノタイプの少なくとも90パーセントがユニークな配列タグを有するであろうということを意味し、他の実施形態において、実質的にすべてのクロノタイプが、そのようなクロノタイプの少なくとも99パーセントがユニークな配列タグを有するであろうということを意味し、他の実施形態において、実質的にすべてのクロノタイプが、そのようなクロノタイプの少なくとも99.9パーセントがユニークな配列タグを有するであろうということを意味する。多くの組織サンプルまたは生検材料において、T細胞またはB細胞の数は、最大で100万細胞または約100万細胞であろう、したがって、そのようなサンプルを用いる本発明のいくつかの実施形態において、サンプリングによって標識するのに用いられるユニークな配列タグの数は、少なくとも10または他の実施形態において少なくとも10である。
最大で100万のクロノタイプがサンプリングによって標識される実施形態において、配列タグの大きなセットが、たとえば、参照によって組み込まれるチャーチ(Church)、米国特許第5,149,625号明細書において開示されるように、合成反応のそれぞれの追加ステップで4つのヌクレオチド前駆物質すべての混合物を反応させることによって、コンビナトリアル合成によって効率的に産生されてもよい。結果は、“N...N”の構造を有する配列タグのセットであり、それぞれのN=A、C、G、またはTであり、kがタグ中のヌクレオチドの数である。そのようなコンビナトリアル合成によって作製される配列タグのセット中の配列タグの数は、4である。したがって、少なくとも14のkまたは約14〜18の範囲のkを有するそのような配列タグのセットは、サンプリングによって標識することによって分子の10メンバー集団に対して配列タグを付加するのに適切である。上記の構造を有する配列タグのセットは、本発明の方法を実行する間に問題またはエラーを招き得る多くの配列を含む。たとえば、配列タグの上記のコンビナトリアルに合成されたセットは、合成時解読(sequencing−by−synthesis)アプローチなどのいくつかのシークエンシングアプローチが、ある長さ以上で正確に決定するのが難しいホモポリマーセグメントを有する多くのメンバータグを含む。したがって、本発明は、シークエンシングなどの特定の方法のステップに効率的な構造を有する、コンビナトリアルに合成された配列タグを含む。たとえば、合成時解
読化学にとって効率的ないくつかの配列タグ構造は、4つの天然のヌクレオチドを、コンビナトリアル合成において交互に使用される、共通の要素をもたないサブセットに分け、それによって、所定の長さ以上のホモポリマーセグメントを防ぐことによって作製されてもよい。たとえば、zをAまたはC、xをGまたはTとすると、
[(z)(z)...(z)][(x)(x)...(x)]...
の配列タグ構造が得られ、
ここで、iおよびjが、同じであっても、異なっていてもよいが、任意のホモポリマーセグメントのサイズを制限するように選択される。一実施形態において、iおよびjが、1〜6の範囲にある。そのような実施形態において、配列タグが、12〜36ヌクレオチドの範囲の長さを有していてもよく、他の実施形態において、そのような配列タグが、12〜24ヌクレオチドの範囲の長さを有していてもよい。他の実施形態において、ヌクレオチドの他の対合が、使用されてもよく、たとえば、zが、AもしくはTであり、xが、GもしくはCであるまたはzが、AもしくはGであり、xが、TもしくはCである。その代わりに、z’を、4つの天然のヌクレオチドのうちの3つの任意の組み合わせとし、x’を、z’ではない任意のヌクレオチドとする(たとえば、z’が、A、C、またはGであり、x’が、Tである)。これにより、以下のような配列タグ構造が得られる:
[(z’)(z’)...(z’)]x’[(z’)(z’)...(z’)]x’...
ここで、iが、上記のように選択され、x’の存在が、任意の望まれないホモポリマーを終結させるために句読点としての役割を果たす。
様々な異なる付加反応が、サンプル中の実質的にすべてのクロノタイプに対してユニークなタグを付加するために使用されてもよい。一実施形態において、そのような付加は、配列タグの集団またはライブラリーと、再構成核酸分子(さらにはクロノタイプ配列を含む)を含有するサンプルとを、分子の2つの集団のメンバーがランダムに組み合わさり、たとえば共有結合で関連するまたは連結することができるように、組み合わせることによって達成される。そのようなタグ付加反応において、クロノタイプ配列は、直鎖一本鎖または二本鎖ポリヌクレオチドを含み、配列タグは、PCRプライマーなどの増幅プライマー、ライゲーションアダプター、環状化可能な(circularizable)プローブ、プラスミド、またはその他同種のものなどの試薬によって運ばれる。配列タグ集団を運ぶことができるいくつかのそのような試薬は、参照によって本明細書において組み込まれるマチェビッツ(Macevicz)、米国特許第8,137,936号明細書;ファハム(Faham)ら、米国特許第7,862,999号明細書;ランデグレン(Landegren)ら、米国特許第8,053,188号明細書;アンラウ(Unrau)および ドゥーガー(Deugau)、遺伝子(Gene)、第145巻:p.163〜169(1994年);チャーチ(Church)、米国特許第5,149,625号明細書;ならびにその他同種のものにおいて開示される。
図1Eおよび1Fは、配列タグの集団(T、T、T...T、Tj+1...T、Tk+1...Tn−1、T)が、プライマー(1100)の中に組み込まれるPCRを含む付加反応を示す。配列タグの集団は、再構成核酸分子(1102)よりもずっと大きなサイズを有する。配列タグは、核酸分子に対してプライマーをアニールし、PCRの第1のサイクルにおいてDNAポリメラーゼによりプライマーを伸長させることによって、再構成核酸分子に対して付加される。図は、再構成核酸分子が、たとえばV領域(1108)におけるそれらの共通のプライマー結合領域(1104)を介してプライマーにランダムにアニールすることによって、配列タグの全集団のごく一部分を選択するまたはサンプリングする方法を示す。プライマー(したがって配列タグ)が再構成核酸配列分子とランダムに組み合わさるので、同じ配列タグが異なる核酸分子に付加され得るわずかな可能性があるが、しかしながら、本明細書において教示されるように、配列タグの集団が大きな場合、そのような可能性は、無視してよいほどに小さくなり、実質的にすべて
の再構成核酸分子が、ユニークな配列タグを付加するであろう。フォワードおよびリバースプライマー対の他方のプライマー(1106)は、C領域(1110)にアニールし、アニーリング、伸長、および融解の複数のサイクルの後に、アンプリコン(1112)が形成され、それによって、集団(1102)のクロノタイプを含むV(D)J領域に対してユニークな配列タグを付加する。すなわち、アンプリコン(1112)は、付加反応由来のタグ−分子コンジュゲートを含む。
そのような免疫分子は、典型的に、比較的長さが短い(たとえば通常300bp未満)、非常に類似するポリヌクレオチドの非常に大きなセット(たとえば>1000、しかし、より通常では、100,000〜1,000,000またはそれ以上)を含む免疫レパートリを形成する。本発明の一態様において、発明者らは、これらの特徴が、それらが同じもとの配列に由来するかどうかを決定するために、非常に類似するクロノタイプの配列リードを効率的に比較するために、非常に相違する配列タグの使用を可能にしたことを認識し、十分に理解した。
免疫レパートリの複雑さは、たとえばアースティラ(Arstila)ら、サイエンス、第286巻:p.958〜961(1999年)およびウォーレン(Warren)ら(上記に引用)においてよく知られている。図1Gは、本発明のいくつかの実施形態に従って、クロノタイププロファイルが由来するIgH分子(1120)の典型的な転写物を示す図である。天然の配列変異性の源は、ゲノムによって運ばれる大きなセット由来のC、D、J、およびVセグメントのモジュールの再構成、いわゆる「NDN」領域を産生するDセグメントの末端部へのヌクレオチド追加および欠失、ならびに、概略的に曲線(1128)によって示される相対頻度で転写物(1122)の全長にわたって置換がランダムになされる体細胞超変異、を含む。本発明の一態様において、そのようなIgHおよびTCRの転写物の複雑な集団が、増幅され、シークエンシングされる。一態様において、IgH分子についての一方または両方の操作が、V領域における異なる部位にアニールする多くのプライマーの使用によって実行される(下記により十分に記載される)。これは、比較的高いエラーレートを有するシークエンシング化学が用いられる場合またはそのような配列変異性をあらかじめ知るのが困難であるもしくは不可能である場合、特に有利である。後者の場合において、たとえ1つ以上のプライマー結合部位が、(たとえば)1つ以上の体細胞変異によって引き起こされたミスマッチのために作動不能であってもまたは実質的に作動不能であっても、配列リードの増幅または生成のためのプライマー伸長は起こる。プロモータP(1122)から出発して、曲線(1128)によって示される相対頻度は、リーダー部位(1124)を通って、転写物のV(D)J領域(1126)にわたって最大値まで上昇し、その後、それは約0まで減少する。本発明の一態様において、再構成B細胞核酸のセグメントが、たとえばファハム(Faham)およびウィリス(Willis)、米国特許出願公開第2011/0207134号明細書において開示されるように、鋳型のネステッドセットを生成するために、複数のフォワードプライマーまたは複数のリバースプライマーによるPCRによって増幅される。そのようなセット由来の鋳型は、別々のアンプリコンを形成するために表面上でさらに増幅されてもよい(たとえばcBot機器、イルミナ(Illumina)、サンディエゴ、カリフォルニア州を使用するブリッジPCRによって)。同じネステッドセット由来の鋳型は、それらの共通の末端部で生成された配列リードによって互いに関連し得る。鋳型のネステッドセットは、同時に、配列の全長にわたって、高い平均クオリティースコアを維持しながら、相対的高エラー率を有するシークエンシング化学が、他の場合に可能であるよりも長い配列を分析するために使用されるのを可能にする。ネステッドセットはまた、少なくとも1つの配列リードが、たとえそれが体細胞超変異を受けていたとしても、V領域から得られることを保証する。
IgH分子中の体細胞変異は、塩基の変化がシークエンシングもしくは増幅エラーによ
るかまたは天然の突然変異プロセスによるかを決定する困難さのために、配列リードデータからクロノタイプを再構築する際に困難さを高める。IgHをコードするすべての核酸が別個でユニークな配列タグを収容するので、本発明に従う配列タグの使用は、そのような問題を非常に軽減する。図5において示されるように、本発明に従う配列リード(500)は、それぞれ、配列タグのコピー(502)およびクロノタイプのコピー(504)を含む。クロノタイプ部分におけるそれぞれのポジションのヌクレオチドを比較することができるように、同じ配列タグを有する配列リードがすべて集められる。したがって、たとえIgHコード配列が、たった一塩基異なっていても、それらは、別個の配列タグを収容し、サンプル中の密接に関係するIgHコード核酸は、クロノタイプ決定プロセスにおいて互いに比較されないであろう。上記に言及されるように、配列タグにおけるエラーは深刻ではない。なぜなら、クロノタイプと関連する配列タグの配列は配列スペースにおいて非常に異なっているので、ある配列タグが配列スペースにおいて任意の他の配列タグに近くなることなく膨大な数の塩基変化が維持され得るからである。
配列リードデータからのクロノタイプの構成は、異なる方法が異なる期待リード長およびデータクオリティーを有するので、そのようなデータを生成するために使用されるシークエンシング方法に部分的に依存する。あるアプローチにおいて、ソレクサ(Solexa)シークエンサが、分析のための配列リードデータを生成するために用いられる。一実施形態において、少なくとも100万の鋳型分子を産生するために、少なくとも0.5〜1.0×10リンパ球を提供するサンプルが得られ、これは、任意選択の増幅後に、鋳型分子の対応する100万以上のクローン集団(またはクラスター)を産生してもよい。ソレクサ(Solexa)アプローチを含むほとんどの高処理シークエンシングアプローチについて、クラスターレベルでのそのような余分なサンプリングは、配列決定の正確さを増加させるためにそれぞれの鋳型配列がかなり冗長に決定されるので、望ましい。ソレクサ(Solexa)に基づく手段については、好ましくは、それぞれの独立した鋳型の配列が、10回以上決定される。異なる期待リード長およびデータクオリティーを有する他のシークエンシングアプローチについては、様々なレベルの冗長性が、配列決定の同等の精度のために使用されてもよい。当業者らは、上記のパラメーター、たとえばサンプルサイズ、冗長性、およびその他同種のものが、特定の応用法に関係する設計の選択肢であることを認識する。
図2A〜2Cは、2段階PCRにおいて再構成核酸分子に対してユニークな配列タグを付加する例示的なステップを示す。T細胞またはB細胞を含有するサンプル由来の再構成核酸分子(250)の集団は、PCR混合物中でフォワードおよびリバースプライマー(202)および(262)と組み合わせられる。プライマー(262)は、それぞれ、3つの領域を含む:標的アニーリング領域(263)(この例説においてV領域(206)である);配列タグ(264);および2段階PCRの第2の段階のためのプライマー結合領域(265)。この例説において、プライマー(262)は、V領域配列の多様性を捕らえるための標的アニーリング領域の混合物を含む。したがって、すべての異なるプライマーは、配列タグ領域と共に調製される。その代わりに、配列タグエレメントは、第2のPCR段階の間に、プライマー結合領域と共にC領域プライマー(202)に対して付加されてもよい。示されるように、再構成核酸分子(250)は、定常またはC領域(203)、J領域(210)、D領域(208)、およびV領域(206)を含み、これは、TCRまたは免疫グロブリンのCDR3領域をコードするV(D)Jセグメントに相当し得る。数サイクル、たとえば4〜10サイクルの後に、それぞれのメンバーポリヌクレオチドが配列タグ(270)を含む第1段階アンプリコン(266)が、産生される。第2段階PCRにおいて、アンプリコン(266)のポリヌクレオチドは、ソレクサ(Solexa)/イルミナ(Illumina)シークエンサにおいてブリッジPCRを使用するクラスター形成のためのプライマー結合部位(224)および(223)をさらに追加する、新しいフォワードおよびリバースプライマーP5(222)およびP7(220
)により再増幅される。プライマーP7はまた、1回のシークエンシングの実行におけるサンプルの任意選択の多重化のための第2の配列タグ(221)を含む。第2のPCR後に、アンプリコン(280)が産生され、組み込まれたP5およびP7配列によりブリッジPCRが実行されてもよい。
さらなる配列タグ
いくつかの実施形態において、本発明は、増幅およびシークエンシング前に、「モザイクタグ」を含んでいてもよいユニークな配列タグにより、ゲノムDNAのフラグメントなどの核酸を標識するための方法を使用する。そのような配列タグは、増幅およびシークエンシングのエラーを同定するのに有用である。モザイクタグは、先行技術の全くランダムな配列タグで起こり得る不適切なアニーリング、プライミング、ヘアピン形成、またはその他同種のものによる、シークエンシングおよび増幅の人工物を最小限にする。一態様において、モザイクタグが、交互の定常領域および可変領域を含む配列タグであり、それぞれの定常領域が、モザイクタグ中にポジションを有し、ヌクレオチドの所定の配列を含み、それぞれの可変領域が、モザイクタグ中にポジションを有し、所定の数のランダムに選択されたヌクレオチドを含む。例説によって、22塩基長モザイクタグは、以下の形態を有していてもよい。
9つの定常および可変領域があり、領域1(ヌクレオチド1〜3)、3(ヌクレオチド9)、5(ヌクレオチド12〜14)、7(ヌクレオチド18〜19)、および9(ヌクレオチド21〜22)は、可変(二重線を引いたヌクレオチド)であり、領域2(ヌクレオチド4〜8)、4(ヌクレオチド10〜11)、6(ヌクレオチド15〜17)、および8(ヌクレオチド20)は、定常である。Nは、A、C、G、またはTのセットからランダムに選択されたヌクレオチドを示し、したがって、この例のモザイクタグの数は、411=4,194,304タグとなり、bは、示されたポジションでの所定のヌクレオチドを示す。いくつかの実施形態において、bの配列、「***bbbbbbb***bbb****」が、サンプルを構成する、生物のゲノムにおける完全なマッチを有する可能性を最小限にするように選択される。
一態様において、本発明の方法の特定の実施形態のモザイクタグについて、同じポジションを有するすべての定常領域が、同じ長さを有し、同じポジションを有するすべての可変領域が、同じ長さを有する。これは、モザイクタグが、従来の化学および機器により、部分的なコンビナトリアル合成を使用して合成されるのを可能にする。
一態様において、モザイクタグが、10〜100ヌクレオチドまたは12〜80ヌクレオチドまたは15〜60ヌクレオチドを含む。いくつかの実施形態において、モザイクタ
グが、ランダムに選択されたヌクレオチドを有する、少なくとも8つのヌクレオチドのポジションを含み、他の実施形態において、モザイクタグが少なくとも15のヌクレオチド長を有する場合は常に、それらは、ランダムに選択されたヌクレオチドを有する、少なくとも12のヌクレオチドのポジションを含む。他の態様において、7ヌクレオチド超の長さを有するモザイクタグ内の可変領域が、なくてもよい。
他の態様において、モザイクタグが、以下のステップにおいて使用されてもよい:(i)サンプル中の核酸からDNA鋳型を調製するステップ;(ii)多様なタグ−鋳型コンジュゲートを形成するためにDNA鋳型をサンプリングすることによって標識するステップであって、タグ−鋳型コンジュゲートの実質的にすべてのDNA鋳型が、交互の定常領域および可変領域を含むユニークなモザイクタグを有し、それぞれの定常領域が、モザイクタグ中にポジションおよび所定の配列の1〜10ヌクレオチドの長さを有し、それぞれの可変領域が、モザイクタグ中のポジションおよび1〜10のランダムに選択されたヌクレオチドの長さを有し、同じポジションを有する定常領域が、同じ長さを有し、同じポジションを有する可変領域が、同じ長さを有するステップ、(iii)多様なタグ−鋳型コンジュゲートを増幅するステップ、(iv)増幅されたそれぞれのタグ−鋳型コンジュゲートについて複数の配列リードを生成するステップ、ならびに(v)同一のモザイクタグを有するそれぞれの複数の配列リードのそれぞれのヌクレオチドのポジションでコンセンサスヌクレオチドを決定することによって、核酸のそれぞれのヌクレオチド配列を決定するステップ。他の態様において、モザイクタグが、以下のステップにおいて使用されてもよい:(a)サンプル中の核酸から一本鎖DNA鋳型を調製するステップ、(ii)タグ−鋳型コンジュゲートを形成するために一本鎖DNA鋳型をサンプリングすることによって標識するステップであって、タグ−鋳型コンジュゲートの実質的にすべての一本鎖DNA鋳型が、少なくとも15ヌクレオチドの長さを有し、以下の形態を有するユニークな配列タグ(すなわちモザイクタグ)を有し、
[(N...NKj)(b...bLj)]
ここでそれぞれのN(i=1、2、...K)が、A、C、G、およびTからなる群からランダムに選択されるヌクレオチドであり、Kが、M以下であるそれぞれのjについて、1〜10の範囲の整数であり(すなわち領域N...NKjは可変領域である)、それぞれのb(i=1、2、...L)は、ヌクレオチドであり、Lが、M以下であるそれぞれのjについて、1〜10の範囲の整数であり、すべての配列タグが、(i)すべてのjについての同じKjを有し、(ii)すべてのjについて同じ配列b...bLjを有し(すなわち領域b...bLjは、定常領域である)、Mが、2以上の整数であるステップ、(c)タグ−鋳型コンジュゲートを増幅するステップ、(d)増幅されたそれぞれのタグ−鋳型コンジュゲートについて複数の配列リードを生成するステップ、ならびに(e)同一の配列タグを有するそれぞれの複数の配列リードのそれぞれのヌクレオチドのポジションでコンセンサスヌクレオチドを決定することによって、核酸のそれぞれのヌクレオチド配列を決定するステップ。いくつかの実施形態において、複数の配列リードが、少なくとも10であり、他の実施形態において、複数の配列リードが、少なくとも10であり、さらに他の実施形態において、複数の配列リードが、少なくとも10であり、いくつかの実施形態において、上記の配列タグの全長が、15〜80ヌクレオチドの範囲にある。
配列タグを使用する配列リード由来のクロノタイプの決定
本発明の一態様に従って、サンプルのクロノタイプが、それらの配列タグに基づいて配列リードを最初にグルーピングすることによって決定される。そのようなグルーピングは、従来の配列アラインメント法によって達成されてもよい。アライメント法を選択するための手引きは、参照によって組み込まれるバツォグロウ(Batzoglou)、バイオインフォマティクスにおけるブリーフィング(Briefings in Bio informatics)、第6巻:p.6〜22(2005年)において入手可能である。
配列リードがユニークな配列タグに対応するグループに集められた後、次いで、関連するクロノタイプの配列は、サンプル由来のクロノタイプの配列を決定するために分析されてもよい。図5は、ユニークな配列タグにより関連するクロノタイプの配列を決定するための例示的なアライメントおよび方法を示す。この例において、11の配列リード(500)が、それらのそれぞれの配列タグ(502)を介してアライメントされ、その後、1、2、3、4、...、nと示される配列リードのクロノタイプ部分のそれぞれのポジションのヌクレオチドが、比較される。たとえば、ポジション6(506)のヌクレオチドは、t、t、g、t、t、t、t、t、t、c、tである;すなわち、9つのベースコールはtであり、1つは「g」(508)であり、1つは「c」(510)である。一実施形態において、あるポジションでのクロノタイプ配列の正確なベースコールが、任意の大多数の塩基が一致するものとなる。ポジション6(506)の例において、ベースコールは、それが、そのポジションで大多数の配列リードにおけるヌクレオチドであるので、「t」となる。他の実施形態において、配列リードのベースコールのクオリティースコア、隣接する塩基の一致、またはその他同種のものなどの他の因子が、クロノタイプ配列についての正確なベースコールを決定するために考慮に入れられてもよい。
一旦クロノタイプが上記に記載されるように決定されると、サンプルのそれぞれの異なるクロノタイプの存在量または度数を含むクロノタイププロファイルが、構築されてもよい。
サンプル
クロノタイププロファイルは、種々様々の組織中に存在する免疫細胞のサンプルから得られる。関心のある免疫細胞は、T細胞および/またはB細胞を含む。T細胞(Tリンパ球)は、たとえば、T細胞受容体(TCR)を発現する細胞を含む。B細胞(Bリンパ球)は、たとえば、B細胞受容体(BCR)を発現する細胞を含む。T細胞は、細胞表面マーカによって区別されてもよいヘルパーT細胞(エフェクターT細胞またはTh細胞)、細胞障害性T細胞(CTL:cytotoxic T cell)、記憶T細胞、および調節性T細胞を含む。一態様において、T細胞のサンプルが、少なくとも1,000のT細胞を含むが、より典型的には、サンプルが、少なくとも10,000のT細胞、より典型的には、少なくとも100,000のT細胞を含む。他の態様において、サンプルが1000〜1,000,000細胞の範囲の多くのT細胞を含む。免疫細胞のサンプルはまた、B細胞を含んでいてもよい。B細胞は、たとえば、血漿B細胞、記憶B細胞、B1細胞、B2細胞、辺縁層B細胞、および濾胞B細胞を含む。B細胞は、免疫グロブリンを発現することができる(抗体またはB細胞受容体とも呼ばれる)。上記のように、一態様において、B細胞のサンプルが、少なくとも1,000のB細胞を含むが、より典型的には、サンプルが、少なくとも10,000のB細胞、より典型的には、少なくとも100,000のB細胞を含む。他の態様において、サンプルが、1000〜1,000,000のB細胞の範囲の多くのB細胞を含む。
本発明の方法において使用されるサンプル(「組織サンプル」と呼ばれることもある)は、たとえば、腫瘍組織、血液および血漿、リンパ液、脳および脊髄を囲む脳脊髄液、骨関節を囲む滑液、ならびにその他同種を含む様々な組織に由来し得る。一実施形態において、サンプルが、血液サンプルである。血液サンプルは、約0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1.0、1.5、2.0、2.5、3.0、3.5、4.0、4.5、または5.0mLとすることができる。サンプルは、腫瘍生検材料とすることができる。生検材料は、たとえば、脳、肝臓、肺、心臓、結腸、腎臓、または骨髄の腫瘍に由来し得る。当業者らによって使用される任意の生検技術は、対象からサンプルを単離するために使用することができる。たとえば、生検は、全身麻酔が使用されるオープンバイオプシとすることができる。生検は、オープンバイオプシよりも小さな切断がなされるクローズドバイオプシ(closed biopsy)とすること
ができる。生検は、組織の一部が摘出されるコアまたは切開バイオプシーとすることができる。生検は、全病変を摘出するための試みがなされる切除バイオプシーとすることができる。生検は、組織または液体のサンプルが針で摘出される細針吸引バイオプシーとすることができる。
サンプルまたは組織サンプルは、核酸、たとえばDNA(たとえばゲノムDNA)またはRNA(たとえばメッセンジャーRNA)を含む。核酸は、たとえば循環系から抽出される無細胞DNAまたはRNAとすることができる。ウラソフ(Vlassov)ら、現代分子医学(Curr.Mol.Med.)、第10巻:p.142〜165(2010年);スワラップ(Swarup)ら、FEBSレター(FEBS Lett.)、第581巻:p.795〜799(2007年)。本発明の方法において、分析することができる対象由来のRNAまたはDNAの量は、広く変動する。たとえば、キャリブレーション試験(つまり、ある疾患について相互に関連のあるクロノタイプを決定する最初の測定)については、単細胞のDNAまたはRNAで十分となり得る。クロノタイププロファイルを生成するためには、個人の免疫受容体レパートリの有用なレプリゼンテーション(representation)を得るために、十分な核酸がサンプル中になければならない。より詳細には、ゲノムDNAからクロノタイププロファイルを生成するために、T細胞またはB細胞由来の少なくとも1ngの全DNA(つまり約300の二倍体ゲノム等価物)が、サンプルから抽出され、他の実施形態において、少なくとも2ngの全DNA(つまり約600の二倍体ゲノム等価物)が、サンプルから抽出され、他の実施形態において、少なくとも3ngの全DNA(つまり約900の二倍体ゲノム等価物)が、サンプルから抽出される。当業者は、サンプルにおけるリンパ球の割合が減少するにつれて、約1000を超える独立したクロノタイプを含有するクロノタイププロファイルを生成するために、前述の最小限の量のDNAは増加しなければならないことを認識するであろう。RNAからクロノタイププロファイルを生成するために、一実施形態において、十分な量のRNAが、別個のTCR、BCR、またはそのフラグメントをコードする少なくとも1000の転写物が得られるように抽出される。この限界に相当するRNAの量は、サンプル中のリンパ球の割合、リンパ球の発生段階、およびその他同種のものに依存して、サンプルによって広く変動する。一実施形態において、少なくとも100ngのRNAが、クロノタイププロファイルを生成するために、B細胞および/またはT細胞を含有する組織サンプルから抽出され、他の一実施形態において、少なくとも500ngのRNAが、クロノタイププロファイルを生成するために、B細胞および/またはT細胞を含有する組織サンプルから抽出される。本発明の方法において使用されるRNAは、組織サンプルから抽出される全RNAまたは組織サンプルからもしくは組織サンプルから抽出される全RNAから直接抽出されるポリA RNAであってもよい。上記の核酸抽出は、たとえばインビトロジェン(Invitrogen)(カールズバッド、カリフォルニア州)、キアゲン(Qiagen)(サンディエゴ、カリフォルニア州)、または同様のベンダーの市販で入手可能なキットを使用して実行されてもよい。RNAを抽出するための手引きは、リートケ(Liedtke)ら、PCRの方法および応用法(PCR Methods and Applications)、第4巻:p.185〜187(1994年)および同様の参考文献において見つけられる。
下記により十分に議論されるように(定義)、リンパ球を含有するサンプルは、別個のクロノタイプを有する実質的にすべてのT細胞またはB細胞がそれに関して示され、それによってレパートリ(用語が本明細書において使用されるように)を形成するのに、十分に大きい。一実施形態において、99パーセントの可能性で、0.001パーセント以上の頻度で存在する集団のすべてのクロノタイプを含有するサンプルが、採取される。一実施形態において、99パーセントの可能性で、0.0001パーセント以上の頻度で存在する集団のすべてのクロノタイプを含有するサンプルが、採取される。一実施形態において、B細胞またはT細胞のサンプルが、少なくとも50万の細胞を含み、他の実施形態に
おいて、そのようなサンプルが、少なくとも100万の細胞を含む。
臨床研究サンプルまたはその他同種のものなどのサンプルが採取される物質の源が乏しい場合は常に、物質由来のDNAは、全ゲノム増幅(WGA:whole genome
amplification)、多重置換増幅(MDA:multiple displacement amplification)、または同様の技術などの偏りのない技術によって増幅されてもよい。たとえばホーキンス(Hawkins)ら、カレントオピニオンインバイオテクノロジー(Curr.Opin.Biotech.)、第13巻:p.65〜67(2002年);ディーン(Dean)ら、ゲノムリサーチ(Genome Research)、第11巻:p.1095〜1099(2001年);ワング(Wang)ら、核酸リサーチ(Nucleic Acids Research)、第32巻:e76(2004年);ホソノ(Hosono)ら、ゲノムリサーチ(Genome Research)、第13巻:p.954〜964(2003年)など。
特に関心のある血液サンプルは、従来の技術を使用して得られてもよい。たとえばイニス(Innis)ら編、PCRプロトコール(PCR Protocols)(アカデミックプレス(Academic Press)、1990年)など。たとえば、白血球は、従来の技術、たとえばRosetteSepキット(ステムセルテクノロジーズ(Stem Cell Technologies)、バンクーバー、カナダ)を使用して、血液サンプルから分離されてもよい。同様に、末梢血単核細胞(PBMC:peripheral blood mononuclear cell)などの全血の他の画分は、市販で入手可能なキットを使用して、本発明の方法による使用のために単離されてもよい。たとえばミルテニーバイオテク(Miltenyi Biotec)、オーバーン、カリフォルニア州)またはその他同種のもの。血液サンプルは、100μL〜10mLの容積の範囲にわたってもよく、一態様において、血液サンプル容積が、100μL〜2mLの範囲にある。次いで、DNAおよび/またはRNAは、本発明の方法における使用のために従来の技術、たとえばDNeasy Blood & Tissue Kit(キアゲン(Qiagen)、バレンシア、カリフォルニア州)を使用して、そのような血液サンプルから抽出されてもよい。任意選択で、白血球のサブセット、たとえばリンパ球は、従来の技術、たとえば蛍光活性化セルソータ(FACS)(ベクトンディッキンソン(Becton Dickinson)、サンノゼ、カリフォルニア州)、磁気活性化セルソータ(MACS:magnetically activated cell sorting)(ミルテニーバイオテク(Miltenyi Biotec)、オーバーン、カリフォルニア州)、またはその他同種のものを使用して、さらに単離されてもよい。
いくつかの実施形態において、再構成核酸が、それぞれの個人の適応免疫細胞のDNAおよびそれらの関連するRNA転写物中に存在し、RNAまたはDNAが、提供される本発明の方法においてシークエンシングすることができる。T細胞受容体もしくは免疫グロブリン分子またはその一部分をコードするT細胞またはB細胞由来の再構成配列は、クロノタイプと呼ばれる。DNAまたはRNAは、T細胞受容体(TCR)遺伝子または抗体をコードする免疫グロブリン(Ig)遺伝子由来の配列に相当し得る。たとえば、DNAおよびRNAは、TCRのα、β、γ、またはδ鎖をコードする配列に相当し得る。大多数のT細胞において、TCRは、α鎖およびβ鎖からなるヘテロダイマーである。TCRα鎖は、VJ再構成によって生成され、β鎖受容体は、V(D)J再構成によって生成される。TCRβ鎖については、ヒトにおいて、48のVセグメント、2つのDセグメント、および13のJセグメントがある。2つのジャンクションのそれぞれで、いくつかの塩基が、欠失され、他のものが追加され得る(NおよびPヌクレオチドと呼ばれる)。少数のT細胞において、TCRは、γおよびδデルタ鎖からなる。TCRγ鎖は、VJ再構成によって生成され、TCRδ鎖は、V(D)J再構成によって生成される(その全体が参照によって本明細書において組み込まれるケネス・マーフィー(Kenneth Mur
phy)、ポール・トラバース(Paul Travers)、およびマーク・ウォルポート(Mark Walport)、ジェーンウェーの免疫学(Janeway’s Immunology)第7版、ガーランドサイエンス(Garland Science)、2007年)。
本発明の方法において分析されるDNAおよびRNAは、定常領域(α、δ、ε、γ、もしくはμ)を有する重鎖免疫グロブリン(IgH)または定常領域λもしくはκを有する軽鎖免疫グロブリン(IgKもしくはIgL)をコードする配列に相当し得る。それぞれの抗体は、2つの同一の軽鎖および2つの同一の重鎖を有する。それぞれの鎖は、定常(C)および可変領域から構成される。重鎖については、可変領域は、可変(V)、多様性(D)、および連結(J)セグメントから構成される。これらのセグメントのそれぞれのタイプをコードするいくつかの別個の配列が、ゲノム中に存在する。特異的なVDJ再構成事象が、B細胞の発生の間に起こり、特異的な重鎖を生成するようにその細胞を特徴づける。軽鎖における多様性は、D領域がないこと以外、類似する様式で生成され、そのため、VJ再構成しかない。体細胞変異が、多くの場合、再構成の部位のすぐ近くで起こり、いくつかのヌクレオチドの追加または欠失を引き起こして、B細胞によって生成される重鎖および軽鎖の多様性をさらに増加させる。次いで、B細胞によって生成される抗体についての可能性のある多様性により、異なる重鎖および軽鎖が産生される。重鎖および軽鎖の可変領域は、抗原認識(または結合)領域または部位を形成するために寄与する。これに加えて、多様性は、特異的な応答がいくつかのエピトープに対して開始された後に起こり得る体細胞超変異のプロセスである。
本発明に従って、プライマーは、リンパ球から抽出される再構成核酸のサブセットのアンプリコンを生成するために選択されてもよい。そのようなサブセットは、「体細胞再編成領域」と本明細書において呼ばれてもよい。体細胞再編成領域は、発生中のまたは完全に発生したリンパ球由来の核酸を含んでいてもよく、発生中のリンパ球は、免疫遺伝子の再編成が、完全なV(D)J領域を有する分子の形成を完了していない細胞である。例示的な不完全な体細胞再編成領域は、不完全IgH分子(D−J領域のみを含有する分子など)、不完全TCRδ分子(D−J領域のみを含有する分子など)、および不活性IgK(たとえばKde−V領域を含む)を含む。
細胞の適切なサンプリングは、「クロノタイプ」および「レパートリ」の定義においてさらに下記に記載されるように、レパートリデータを解釈する重要な側面である。たとえば、1,000の細胞から始めると、どれだけのシークエンシングリードが得られるかにかかわらず、アッセイが反応する最低頻度が生成される。したがって、本発明の一態様は、インプット免疫受容体分子の数を定量化するための方法の開発である。これは、TCRβおよびIgHの配列について実行された。いずれの場合も、異なる配列をすべて増幅することができるプライマーの同じセットが、使用される。コピーの絶対数を得るために、マルチプレックスのプライマーによるリアルタイムPCRは、既知数の免疫受容体コピーを有する標準物質と共に実行される。このリアルタイムPCR測定は、続いてシークエンシングされる増幅反応から行うことができるまたは同じサンプルの別々の一定分量に対して行うことができる。DNAの場合には、再編成免疫受容体分子の絶対数は、細胞の数に容易に変換することができる(いくつかの細胞が、評価される特定の免疫受容体の2つの再編成コピーを有し、他の細胞は1つ有するので、2倍以内)。cDNAの場合には、リアルタイムサンプルにおける再編成分子の測定される全数は、同じサンプルの他の増幅反応において使用されるこれらの分子の全数を特定するために推定することができる。そのうえ、この方法は、RNAの単位量(1μgとする)において再編成免疫受容体分子の数を特定し、cDNA合成の特異的な効率を仮定するために、RNAの総量を決定する方法と組み合わせられてもよい。cDNAの総量が測定される場合、cDNA合成の効率は、考慮する必要はない。細胞の数もまた知られている場合、細胞当たり再編成免疫受容体コ
ピーは、計算することができる。細胞の数が知られていない場合、特定のタイプの細胞が通常同等の量のRNAを生成するので、全RNAからそれを推定することができる。したがって、1μg当たりの再編成免疫受容体分子のコピーから、細胞当たりのこれらの分子の数を推定することができる。
シークエンシングのために処理される反応と別々のリアルタイムPCRをする欠点の1つは、異なる酵素、インプットDNA、および他の条件が利用され得るので、他の反応と、リアルタイムPCRにおいて異なる阻害効果があるかもしれないということである。シークエンシングのためのリアルタイムPCRの産物の処理は、この問題を改善するであろう。しかしながら、リアルタイムPCRを使用する際の低コピー数は、少数のコピー、阻害効果、または反応における他の最適以下の条件によるものとなり得る。
cDNAまたはゲノムDNAに対する1つ以上の内部標準の既知量は、未知量のcDNAまたはゲノムDNAサンプルの絶対量または絶対濃度を決定するためにアッセイ反応に対して追加することができる。内部標準の分子の数を数え、それを同じサンプルの配列の残りと比較することによって、最初のcDNAサンプルにおける再編成免疫受容体分子の数を推定することができる(分子を数えるためのそのような技術は、よく知られている。たとえば参照によって本明細書において組み込まれるブレナー(Brenner)ら、米国特許第7,537,897号明細書)。
核酸集団の増幅
核酸の標的集団、特に再構成免疫分子のアンプリコンは、様々な増幅技術によって生成されてもよい。本発明の一態様において、マルチプレックスPCRが、T細胞受容体もしくはその一部分またはB細胞受容体もしくはその一部分などの再構成免疫分子の混合物のメンバーを増幅するために使用される。そのような免疫分子のマルチプレックスPCRを実行するための手引きは、参照によって組み込まれる、以下の参考文献において見つけられる:モーリー(Morley)、米国特許第5,296,351号明細書;ゴースキ(Gorski)、米国特許第5,837,447号明細書;ダウ(Dau)、米国特許第6,087,096号明細書;ヴォン・ドンゲン(Von Dongen)ら、米国特許出願公開第2006/0234234号明細書;欧州特許第1544308B1号明細書など。本発明のいくつかの実施形態において、クロノタイププロファイルを生成するためのステップが、(a)T細胞受容体遺伝子の一部分および/またはB細胞受容体遺伝子の一部分を増幅するステップならびに(b)結果として生じるアンプリコンの核酸をシークエンシングするステップを含む。他のところで説明されるように、シークエンシングされたアンプリコン核酸の数は、応用法によって変動してもよい。たとえば、白血病患者がさらに寛解しているかどうかを決定するためのクロノタイププロファイルは、任意の腫瘍クローンの検出限界が非常に低くなるのように大きくなるであろう。いくつかの実施形態において、シークエンシングされるアンプリコン核酸の数が、少なくとも1000であり、他の実施形態において、シークエンシングされるアンプリコン核酸の数が、少なくとも10であり、他の実施形態において、シークエンシングされるアンプリコン核酸の数が、少なくとも10である。そのような生成ステップはまた、配列リードをクロノタイプに合体させる、クロノタイプを列挙するまたは表にする、クロノタイプの頻度分布を形成する、クロノタイプの関係するサブセットを同定する、クロノタイプ頻度情報を表示する、およびその他同種のもののさらなるステップを含んでいてもよい。
ゲノムからのDNAの増幅(またはRNAを逆転写することによるcDNAの形態をした核酸の増幅)の後に、個々の核酸分子は、単離し、任意選択で再増幅し、次いで、個々にシークエンシングすることができる。例示的な増幅プロトコールは、参照によって組み込まれるヴァン・ドンゲン(van Dongen)ら、白血病(Leukemia)、第17巻:p.2257〜2317(2003年)またはヴァン・ドンゲン(van D
ongen)ら、米国特許出願公開第2006/0234234号明細書において見つけられてもよい。簡潔に言えば、例示的なプロトコールは、以下のとおりである:反応バッファー:ABIバッファーIIまたはABIゴールドバッファー(ライフテクノロジーズ(Life Technologies)、サンディエゴ、カリフォルニア州);50μl最終反応容積;100ngサンプルDNA;10pmolのそれぞれのプライマー(下記に記載されるように増幅のバランスをとるために調節にかける);200μΜ最終濃度のdNTP;1.5mM最終濃度のMgCl(標的配列およびポリメラーゼに依存して最適化にかける);Taqポリメラーゼ(1〜2U/チューブ);サイクリング条件:95℃で7分間、あらかじめ活性化する;60℃でのアニーリング;サイクリング時間:30秒間の変性;30秒間のアニーリング;30秒間の伸長。本発明の方法において増幅のために使用することができるポリメラーゼは、市販で入手可能であり、たとえば、Taqポリメラーゼ、AccuPrimeポリメラーゼ、またはPfuを含む。使用するためのポリメラーゼの選択は、忠実度または効率が好ましいかどうかに基づくものとすることができる。
リアルタイムPCR、picogreen染色、ナノフルイディック(nanofluidic)電気泳動(たとえばLabChip)、またはUV吸収測定は、機能的な量の増幅可能な物質を判断する最初のステップにおいて使用することができる。
一態様において、出発集団における配列の相対量が、実質的に増幅された集団またはアンプリコンと同じとなるように、マルチプレックス増幅が、実行される。すなわち、マルチプレックス増幅は、サンプル集団のメンバー配列の間で最小限の増幅バイアスで実行される。一実施形態において、そのような相対量が、アンプリコン中のそれぞれの相対量が、出発サンプルにおけるその値の5倍以内にある場合、実質的に同じである。他の実施形態において、そのような相対量が、アンプリコン中のそれぞれの相対量が、出発サンプルにおけるその値の2倍以内にある場合、実質的に同じである。下記により十分に議論されるように、PCRにおける増幅バイアスは、任意のサンプルのバイアスがない増幅をもたらすPCRプライマーのセットが所定のレパートリについて選択され得るように、従来の技術を使用して、検出され、修正されてもよい。
TCRまたはBCR配列に基づく多くのレパートリに関して、マルチプレックス増幅は、任意選択で、Vセグメントをすべて使用する。反応は、異なるVセグメントプライマーによって増幅される配列の相対的存在量を維持する増幅を得ることを試みるために最適化される。プライマーのいくつかは、相関しており、よって、プライマーの多くは、「クロストークし」、それと完全にマッチしない鋳型を増幅し得る。条件は、どのプライマーがそれを増幅したかに関係なく、それぞれの鋳型が類似する様式で増幅され得るように最適化される。言いかえれば、2つの鋳型がある場合、1,000倍の増幅後に、両方の鋳型を、およそ1,000倍、増幅することができ、鋳型のうちの1つについて、増幅された産物の半分がクロストークのために異なるプライマーを運んだことは重要ではない。シークエンシングデータの次の分析において、プライマー配列は、分析から排除され、よって、鋳型が等しく増幅される限り、どのプライマーが増幅において使用されるかは重要ではない。
一実施形態において、増幅バイアスが、2段階増幅を実行することによって回避されてもよく(ファハム(Faham)およびウィリス(Willis)、上記に引用において記載されるように)、少数の増幅サイクルが、標的配列と非相補的なテールを有するプライマーを使用して、第1または一次段階において実行される。テールは、そのような部位が、単一のフォワードプライマーおよび単一のリバースプライマーを使用する第2段階の増幅において使用され、それによって増幅バイアスの主要な原因を排除するために、一次アンプリコンの配列の末端部に対して追加されるプライマー結合部位を含む。好ましくは
、一次PCRは、異なるプライマーによる示差的な増幅を最小限にするために、十分に少数のサイクル(たとえば5〜10)を有するであろう。第2の増幅は、プライマーの1つのペアにより行われ、よって、示差的な増幅の問題は、最小限となる。一次PCRの1パーセントは、二次PCRに直接使用される。2つの増幅の間に使用される35サイクル(100倍希釈ステップを伴わない約28サイクルと等価)は、サイクルの内訳が1回の一次サイクルおよび34回の二次サイクルまたは25回の一次サイクルおよび10回の二次サイクルかどうかに関係なく、強い増幅を示すのに十分であった。たとえ理想的に一次PCRにおける1サイクルだけを行うことが増幅バイアスを減少させ得るとしても、他に考慮すべきことがある。これについての一態様は、レプリゼンテーションである。これは、出発インプット量が最終的に得られるリードの数に対して過剰でない場合、役割を果たす。たとえば、1,000,000のリードが得られ、1,000,000のインプット分子から出発する場合、100,000分子からわずかなレプリゼンテーションを二次増幅に使用すると、もとのサンプルにおける異なる種の相対的存在量を推定する精度を下げるであろう。2ステップの間の100倍希釈は、一次PCR増幅が100分子よりもかなり多く生成しない限り、レプリゼンテーションが低下することを意味する。これは、最低8サイクル(256倍)であるが、より無理なく10サイクル(約1,000倍)が、使用されてもよいことを示す。その代わりとなるのは、一次PCRの1%超を二次に使用することであるが、一次PCRにおいて使用されるプライマーの濃度が高いために、これらのプライマーが増幅に干渉せず、また、配列の間の増幅バイアスを悪化させないことを保証するために、大きな希釈係数が使用され得る。他の代わりとなるのは、そのより小さな希釈を可能にするために、一次PCR由来のプライマーを排除するために精製または酵素ステップを追加することである。この例において、一次PCRを、10サイクルとし、第2のPCRを、25サイクルとした。
内部標準を使用する配列存在量の測定
上記に言及されるように、様々な内部標準は、サンプル中の関心のある分析物の絶対量を推定するために、方法の増幅反応に対して追加されてもよい。PCRを用いる実施形態については、内部標準を設計し、調製するための手引きは、ロシェモレキュラーバイオケミカルズアプリケーションノート(Roche Molecular Biochemicals Application Note)LC 11/2000または同様の参考文献において見つけられてもよい。簡潔に言えば、内部標準について設計目標は、定量化されている標的分子と同じ増幅効率を有する化合物を提供することである。そのような目標は、以下の特性を含む内部標準を選択することによって達成されてもよい:(a)標的分子に対して相同的(同じ長さおよびGC含量を有することを含む);(b)標的分子と同じプライマー結合部位;(c)十分に定義された源由来の(たとえば直線化されたプラスミドDNA、精製PCR産物、合成DNA、またはその他同種のもの);(d)容易に検出可能(たとえばシークエンシングエラーの存在下においてでさえ容易に識別可能な別個の配列);(e)非常に正確な濃度で反応の中に導入される。
本発明で使用される内部標準は、(a)サンプル中の全核酸(またはより正確には、増幅反応の出発物質における全核酸もしくは全数のゲノム等価物)を定量化するための内部標準;サンプル中の全再構成核酸についての内部標準;および(c)サンプル中の全非再構成核酸についての内部標準を含むが、これらに限定されない。一実施形態において、内部標準が、クロノタイプを増幅するために使用されるプライマーと同じ融解およびアニーリング温度を有するプライマーと共に設計される。他の実施形態において、そのようなプライマーが、内部標準の第2の段階の増幅のためのプライマーが、クロノタイプを増幅するために使用されるものと同一となるように2段階増幅のために設計される。たとえば、図2Aおよび2Bを参照すると、第1の増幅段階については、示される実施形態についての内部標準のプライマーは、プライマー(202)およびプライマー(212)のうちの1つ(またはいくつか)と同じであってもよく、第2の増幅段階については、内部標準の
プライマーは、プライマー(222)およびプライマー(220)と同じであってもよい。
クロノタイプについての配列リードの生成
核酸をシークエンシングするための任意のハイスループット技術は、本発明の方法において使用することができる。好ましくは、そのような技術は、それから少なくとも1000のクロノタイプを決定することができる、好ましくは、少なくとも10,000〜1,000,000のクロノタイプを決定することができる多くの配列データを対費用効果の高い方式で生成する能力を有する。DNAシークエンシング技術は、標識ターミネータまたはプライマーを使用する古典的なジデオキシシークエンシング反応(サンガー法)およびスラブまたはキャピラリー中でのゲル分離、可逆的終結標識ヌクレオチドを使用する合成によるシークエンシング、パイロシークエンシング、454シークエンシング、標識オリゴヌクレオチドプローブのライブラリーに対する対立遺伝子特異的ハイブリダイゼーション、標識クローンのライブラリーに対する対立遺伝子特異的ハイブリダイゼーションを使用する合成によるシークエンシング、その後に続くライゲーション、重合ステップの間の標識ヌクレオチドの組み込みのリアルタイムモニタリング、ポロニーシークエンシング(polony sequencing)、ならびにSOLiDシークエンシングを含む。分離された分子のシークエンシングは、ポリメラーゼまたはリガーゼを使用する順次または単一の伸長反応およびプローブのライブラリーとの単一または順次のディファレンシャルハイブリダイゼーションによって、より最近になって実証された。これらの反応は、並行して多くのクローン配列に対して実行され、並行して1億を超える配列の現在の商用応用法における実証を含む。これらのシークエンシングアプローチは、したがって、T細胞受容体(TCR)および/またはB細胞受容体(BCR)のレパートリを研究するために使用することができる。本発明の一態様において、それらが並行してシークエンシングされる固体表面上で個々の分子を空間的に単離するためのステップを含む、シークエンシングのハイスループット方法が、用いられる。そのような固体表面は、非多孔性表面(ソレクサ(Solexa)シークエンシング、たとえばベントレー(Bentley)ら、ネイチャー(Nature)、第456巻:p.53〜59(2008年)もしくは全ゲノム解析シークエンシング(Complete Genomics sequencing)、たとえばドルマナック(Drmanac)ら、サイエンス(Science)、第327巻:p.78〜81(2010年)においてなど)、ビーズまたは粒子結合鋳型を含んでいてもよいウェルのアレイ(454、たとえばマルグリース(Margulies)ら、ネイチャー(Nature)、第437巻:p.376〜380(2005年)またはIon Torrentシークエンシング、米国特許出願公開第2010/0137143号明細書もしくは米国特許出願公開第2010/0304982号明細書によるなど)、微細加工膜(SMRTシークエンシング、たとえばイード(Eid)ら、サイエンス(Science)、第323巻:p.133〜138(2009年)によるなど)、またはビーズアレイ(SOLiDシークエンシングもしくはポロニーシークエンシング、たとえばキム(Kim)ら、サイエンス(Science)、第316巻:p.1481〜1414(2007年)によるなど)を含んでいてもよい。他の態様において、そのような方法は、それらが固体表面上で空間的に単離される前にまたはされた後に、単離された分子を増幅するステップを含む。事前の増幅は、エマルションPCRなどのエマルションベースの増幅またはローリングサークル増幅を含んでいてもよい。特に関心があるのは、ソレクサ(Solexa)ベースのシークエンシングであり、個々の鋳型分子は、固体表面上で空間的に単離され、その後、それらは、ブリッジPCRによって並行して増幅され、別々のクローン集団またはクラスターを形成し、次いで、ベントレー(Bentley)ら(上記に引用)およびメーカーの説明書(たとえばTruSeq(商標)サンプル調製キットおよびデータシート(Sample Preparation Kit and Data Sheet)、イルミナ(Illumina,Inc.)、サンディエゴ、カリフォルニア州、2010年);さらに、参照によって組み込まれる以下の参考文献
:米国特許第6,090,592号明細書;米国特許第6,300,070号明細書;米国特許第7,115,400号明細書;および欧州特許第0972081B1号明細書において記載されるように、シークエンシングされる。一実施形態において、固体表面上に配置され、増幅される個々の分子が、1cm当たり少なくとも10クラスターの密度で、または1cm当たり少なくとも5×10の密度で、または1cm当たり少なくとも10のクラスターの密度でクラスターを形成する。一実施形態において、比較的高いエラー率を有するシークエンシング化学が、用いられる。そのような実施形態において、そのような化学によって産生される平均クオリティースコアが、配列リード長についての単調減少関数である。一実施形態において、そのような減少が、配列リードの0.5パーセントが、ポジション1〜75において少なくとも1つのエラーを有する、配列リードの1パーセントが、ポジション76〜100において少なくとも1つのエラーを有する、および配列リードの2パーセントが、ポジション101〜125において少なくとも1つのエラーを有することに相当する。
一態様において、個人の配列に基づくクロノタイププロファイルが、以下のステップを使用して得られる:(a)個人のT細胞および/またはB細胞から核酸サンプルを得るステップ、(b)そのような核酸サンプルに由来する個々の分子を空間的に単離するステップであって、個々の分子が、サンプル中の核酸から生成される少なくとも1つの鋳型を含み、鋳型が、体細胞再編成領域またはその一部分を含み、それぞれの個々の分子が、少なくとも1つの配列リードを産生することができるステップ、(c)前記空間的に単離された個々の分子をシークエンシングするステップ、ならびに(d)クロノタイププロファイルを生成するために核酸サンプル由来の核酸分子の異なる配列の存在量を決定するステップ。一実施形態において、それぞれの体細胞再編成領域が、V領域およびJ領域を含む。他の実施形態において、シークエンシングのステップが、少なくとも1つのフォワード配列リードおよび少なくとも1つのリバース配列リードを産生するために、空間的に単離された個々の分子のそれぞれを双方向にシークエンシングするステップを含む。さらに、後者の実施形態に対して、少なくとも1つのフォワード配列リードおよび少なくとも1つのリバース配列リードが、そのようなオーバーラップ領域の塩基が、そのような配列リード間の逆相補的関係によって決定されるようなオーバーラップ領域を有する。さらに他の実施形態において、それぞれの体細胞再編成領域が、V領域およびJ領域を含み、シークエンシングのステップが、J領域中のあるポジションから出発し、その関連するV領域の方向に伸長する、1つ以上のそのフォワード配列リードおよび少なくとも1つのリバース配列リードの由来の個々の核酸分子のそれぞれの配列を決定するステップをさらに含む。他の実施形態において、個々の分子が、完全IgH分子、不完全IgH分子、完全IgK完全、IgK不活性分子、TCRβ分子、TCRγ分子、完全TCRδ分子、および不完全TCRδ分子からなる群から選択される核酸を含む。他の実施形態において、シークエンシングのステップが、単調減少クオリティースコアを有する配列リードを生成するステップを含む。さらに、後者の実施形態に対して、単調減少クオリティースコアが、配列リードが以下のものに等しいエラー率を有するようなものである:配列リードの0.2パーセントが、塩基ポジション1〜50において少なくとも1つのエラーを含有する、配列リードの0.2〜1.0パーセントが、ポジション51〜75において少なくとも1つのエラーを含有する、配列リードの0.5〜1.5パーセントが、ポジション76〜100において少なくとも1つのエラーを含有する。他の実施形態において、上記の方法は、以下のステップを含む:(a)個人のT細胞および/またはB細胞から核酸サンプルを得るステップ、(b)そのような核酸サンプルに由来する個々の分子を空間的に単離するステップであって、個々の分子が、それぞれ、サンプル中の核酸から生成され、それぞれ、体細胞再編成領域またはその一部分を含有する、鋳型のネステッドセットを含み、それぞれのネステッドセットが、それぞれ、同じ方向に伸長し、それぞれ、ネステッドセットが生成される核酸上の異なるポジションから出発する複数の配列リードを産生することができるステップ、(c)前記空間的に単離された個々の分子をシークエンシングするステップ、な
らびに(d)クロノタイププロファイルを生成するために核酸サンプル由来の核酸分子の異なる配列の存在量を決定するステップ。一実施形態において、シークエンシングのステップが、ネステッドセットのそれぞれについて複数の配列リードを産生するステップを含む。他の実施形態において、それぞれの体細胞再編成領域が、V領域およびJ領域を含み、それぞれの複数の配列リードが、V領域における異なるポジションから出発し、その関連するJ領域の方向に伸長する。
一態様において、個人由来のそれぞれのサンプルについて、本発明の方法において使用されるシークエンシング技術が、実行当たり少なくとも1000クロノタイプの配列を生成し、他の態様において、そのような技術が、実行当たり少なくとも10,000クロノタイプの配列を生成し、他の態様において、そのような技術が、実行当たり少なくとも100,000クロノタイプの配列を生成し、他の態様において、そのような技術が、実行当たり少なくとも500,000クロノタイプの配列を生成し、他の態様において、そのような技術が、実行当たり少なくとも1,000,000クロノタイプの配列を生成する。さらに他の態様において、そのような技術が、個々のサンプル当たり実行当たり100,000〜1,000,000クロノタイプの配列を生成する。
提供される本発明の方法において使用されるシークエンシング技術は、リード当たり約30bp、約40bp、約50bp、約60bp、約70bp、約80bp、約90bp、約100bp、約110bp、約120bp、リード当たり約150bp、約200bp、約250bp、約300bp、約350bp、約400bp、約450bp、約500bp、約550bp、または約600bpを生成することができる。
配列タグを有していない配列データからのクロノタイプ決定
配列リードデータからのクロノタイプの構成は、異なる方法が異なる期待リード長およびデータクオリティーを有するので、そのようなデータを生成するために使用されるシークエンシング方法に部分的に依存する。あるアプローチにおいて、ソレクサ(Solexa)シークエンサが、分析のための配列リードデータを生成するために用いられる(ファハム(Faham)およびウィリス(Willis)、上記に引用において記載されるように)。一実施形態において、少なくとも100万の鋳型分子を産生するために、少なくとも0.5〜1.0×10リンパ球を提供するサンプルが、得られ、これは、任意選択の増幅後に、鋳型分子の対応する100万以上のクローン集団(またはクラスター)を産生してもよい。ソレクサ(Solexa)アプローチを含むほとんどの高処理シークエンシングアプローチについて、クラスターレベルでのそのような余分なサンプリングは、配列決定の正確さを増加させるためにそれぞれの鋳型配列がかなり冗長に決定されるので、望ましい。ソレクサ(Solexa)に基づく手段については、好ましくは、それぞれの独立した鋳型の配列が、10回以上決定される。異なる期待リード長およびデータクオリティーを有する他のシークエンシングアプローチについては、様々なレベルの冗長性が、配列決定の同等の精度のために使用されてもよい。当業者らは、上記のパラメーター、たとえばサンプルサイズ、冗長性、およびその他同種のものが、特定の応用法に関係する設計の選択肢であることを認識する。
本発明の一態様において、クロノタイプの配列(IgH、TCRα、TCRβ、TCRγ、TCRδ、および/またはIgLκ(IgK)に由来するものを含むが、これらに限定されない)が、たとえば選択される鎖のV(D)J領域に沿って、1つ以上の配列リード由来の情報を組み合わせることによって決定されてもよい。他の態様において、クロノタイプの配列が、複数の配列リード由来の情報を組み合わせることによって決定される。そのような複数の配列リードは、センス鎖に沿った1つ以上の配列リード(つまり「フォワード」配列リード)およびその相補鎖に沿った1つ以上の配列リード(つまり「リバース」配列リード)を含んでいてもよい。複数の配列リードが、同じ鎖に沿って生成される
場合、別々の鋳型は、配列リードの異なるポジションについて選択されたプライマーによりサンプル分子を増幅することによって最初に生成される。この概念は、プライマー(404、406、および408)が、単一の反応においてアンプリコン(それぞれ410、412、および414)を生成するために用いられる図4Aにおいて示される。そのような増幅は、同じ反応または別々の反応において実行されてもよい。一態様において、PCRが用いられる場合は常に、別々の増幅反応は、別々の鋳型の生成のために使用され、これらは、さらには、組み合わせられ、同じ鎖に沿った複数の配列リードを生成するために使用される。この後者のアプローチは、複数の鋳型の等しい増幅を保証するためにプライマー濃度(および/または他の反応パラメーター)のバランスをとる必要性を回避するのに好ましい(本明細書において「バランスのとれた増幅」または「不偏増幅」と呼ばれることもある)。別々の反応における鋳型の生成は、図4B〜4Cにおいて示される。そこで、IgH(400)を含有するサンプルは、3つの部分(470、472、および474)に分けられ、これらは、アンプリコン(それぞれ420、422、および424)を産生するために、J領域プライマー(401)およびV領域プライマー(それぞれ404、406、および408)を使用する別々のPCRに対して追加される。後者のアンプリコンは、次いで、ブリッジPCRおよびイルミナ(Illumina)GAシークエンサまたは同様の機器でのシークエンシングのための鋳型(482)を調製するためにP5およびP7プライマーを使用する二次PCR(480)において組み合わせられる(478)。
本発明の配列リードは、用いられているシークエンシング技術に部分的に依存して、種々様々の長さを有していてもよい。たとえば、いくつかの技術について、たとえば、(i)鋳型あたりの配列リードの数および長さならびに(ii)シークエンシング操作の費用および期間など、いくつかのトレードオフが、その手段において生じてもよい。一実施形態において、配列リードが、20〜400ヌクレオチドの範囲にあり、他の実施形態において、配列リードが、30〜200ヌクレオチドの範囲にあり、さらに他の実施形態において、配列リードが、30〜120ヌクレオチドの範囲にある。一実施形態において、1〜4の配列リードが、それぞれのクロノタイプの配列を決定するために生成され、他の実施形態において、2〜4の配列リードが、それぞれのクロノタイプの配列を決定するために生成され、他の実施形態において、2〜3の配列リードが、それぞれのクロノタイプの配列を決定するために生成される。前述の実施形態において、所定の数が、異なる個人由来のサンプルを同定するために使用される配列リードを除外する。下記に記載される実施形態において使用される様々な配列リードの長さはまた、リードによって捕らえられることが試みられる情報に基づいて変動してもよい、たとえば、配列リードの出発位置および長さは、NDN領域およびそのヌクレオチド配列の長さを提供するように設計されてもよく、したがって、全NDN領域をまたがる配列リードが、選択される。他の態様において、一緒に(別々にではなく)Dおよび/またはNDN領域を包含する1つ以上の配列リードで十分である。
本発明の他の態様において、クロノタイプの配列が、部分的に、1つ以上のV領域参照配列および1つ以上のJ領域参照配列に対して配列リードをアライメントし、部分的に、非常に多様なNDN領域においてなどのように参照配列に対してアライメントせずに塩基決定することによって、決定される。様々なアライメントアルゴリズムが、配列リードおよび参照配列に適用されてもよい。たとえば、アライメント法を選択するための手引きは、参照によって組み込まれるバツォグロウ(Batzoglou)、バイオインフォマティクスにおけるブリーフィング(Briefings in Bio informatics)、第6巻:p.6〜22(2005年)において入手可能である。一態様において、VリードまたはCリード(上記に言及される)が、VおよびJ領域参照配列に対してアライメントされる場合は常に、木探索アルゴリズムが、たとえばガスフィールド(Gusfield)(上記に引用)およびコルメン(Cormen)ら、アルゴリズム入門(
Introduction to Algorithms)、第3版(MITプレス(The MIT Press)、2009年)において一般に記載されるように用いられる。
他の態様において、少なくとも1つのフォワードリードの末端部および少なくとも1つのリバースリードの末端部が、オーバーラップ領域(たとえば図3Aにおける308)においてオーバーラップし、リードの塩基が、互いに逆相補的関係にある。したがって、たとえば、オーバーラップ領域におけるフォワードリードが「5’−acgttgc」である場合、逆相補的関係にあるリバースリードは、同じオーバーラップ領域内で「5’−gcaacgt」となる。一態様において、そのようなオーバーラップ領域内の塩基が、そのような逆相補的関係から、少なくとも部分的に決定される。すなわち、予期されるオーバーラップ領域におけるベースコール(または関係するクオリティースコア)の確度は、それが、2つの配列リード間の逆相補的関係を維持するまたはそれと一貫している場合、増加する。一態様において、TCRβおよびIgH鎖のクロノタイプ(図3Aにおいて示される)が、そのJ領域で出発し、その関連するV領域の方向に伸長する少なくとも1つの配列リード(「Cリード」(304)と本明細書において呼ばれる)およびそのV領域で出発し、その関連するJ領域の方向に伸長する少なくとも1つの配列リード(「Vリード」(306)と本明細書において呼ばれる)によって決定される。オーバーラップ領域(308)は、図3Aにおいて示されるように、NDN領域(315)を包含してもしなくてもよい。オーバーラップ領域(308)は、全体的にJ領域に、全体的にNDN領域に、全体的にV領域にあっても、J領域−NDN領域の境界もしくはV領域−NDN領域の境界または両方のそのような境界を包含してもよい(図3Aにおいて示される)。典型的に、そのような配列リードは、合成時解読反応においてポリメラーゼによりシークエンシングプライマー、たとえば図3Aにおける(302)および(310)を伸長させることによって生成される。たとえばメッツガー(Metzger)、ネイチャーレビュー遺伝学(Nature Reviews Genetics)、第11巻:p.31〜46(2010年);フラー(Fuller)ら、ネイチャーバイオテクノロジー(Nature Biotechnology)、第27巻:p.1013〜1023(2009年)。プライマー(302)および(310)についての結合部位は、あらかじめ決定されており、それらは、配列リードの最初のアライメントおよび分析のための出発点または基準点を提供することができる。一実施形態において、たとえば図3Aおよび3Bにおいて示されるように、Cリードが、それがTCRβまたはIgH鎖のDおよび/またはNDN領域を包含するように位置し、隣接するV領域の一部分を含む。一態様において、V領域におけるVリードおよびCリードのオーバーラップが、互いにリードをアライメントするために使用される。他の実施形態において、配列リードのそのようなアライメントが、たとえばTCRβ鎖では必要ではなく、Vリードが、クロノタイプの特定のV領域を同定する長さしかなくてもよい。この後者の態様は、図3Bにおいて示される。配列リード(330)は、オーバーラップする他の配列ありまたはなしで、V領域を同定するために使用され、他の配列リード(332)は、NDN領域を横断し、その配列を決定するために使用される。V領域中に伸長する配列リード(332)の一部分(334)は、クロノタイプを決定するために、配列リード(332)の配列情報を配列リード(330)と関連させるために使用される。ソレクサ(Solexa)シークエンシング方法のような塩基ごとのアプローチなどのいくつかのシークエンシング方法については、シークエンシング実行時間および試薬費用は、分析におけるシークエンシングサイクルの数を最小限にすることによって低下する。任意選択で、図3Aにおいて示されるように、アンプリコン(300)は、異なる生物学的サンプル、たとえば異なる患者から生じるクロノタイプを区別するためにサンプルタグ(312)と共に産生される。サンプルタグ(312)は、タグ(312)をまたがる配列リードを産生するために、プライマー結合領域(316)に対してプライマーをアニールし、それ(314)を伸長させることによって同定されてもよく、これから、サンプルタグ(312)は、解読される。
IgH鎖は、少なくとも2つの因子のためにTCRβ鎖よりも分析するのが困難となる:i)体細胞変異の存在が、マッピングまたはアライメントをより困難にする、およびii)NDN領域がより大きく、多くの場合、Vセグメント〜Cリードの部分をマッピングすることができない。本発明の一態様において、この問題が、好ましくは、プライマー結合部位がオーバーラップせず、間隔を置くようにV領域に沿って異なる位置に位置する、Vリードを生成するための複数のプライマーセットを、NDN領域に隣接する少なくとも1つのプライマー結合部位、たとえば一実施形態においてV−NDNジャンクション由来の5〜50塩基または他の実施形態においてV−NDNジャンクション由来の10〜50塩基と共に使用することによって克服される。複数のプライマーセットの冗長性は、体細胞変異によって影響を受ける結合部位を有する1つまたは2つのプライマーの失敗によりクロノタイプを検出しないというリスクを最小限にする。そのうえ、NDN領域に隣接する少なくとも1つのプライマー結合部位の存在は、VリードがCリードとオーバーラップし、よって、Cリードの長さを有効に伸長させる可能性を高くする。これは、すべてのサイズのNDN領域をまたぎ、また、NDN領域の両側の実質的に全V領域および全J領域をマッピングすることができる一続きの配列の生成を可能にする。そのような手法を実行するための実施形態は、図4Aおよび4Dにおいて示される。図4Aにおいて、IgH鎖を含むサンプル(400)は、J領域プライマー(401)の単一のセットおよびV領域(402)プライマーの複数(示される3つ)のセット(404、406、408)により鎖を増幅し、すべて、同じNDN領域を含み、V領域(402)の順に大きな部分(411、413、415)を包含する、異なる長さを有する複数のネステッドアンプリコン(たとえば410、412、414)を産生することによって、それぞれの鎖について複数のアンプリコンを生成することによってシークエンシングされる。ネステッドセットのメンバーは、それらのそれぞれのNDN、J、および/またはC領域の同一性(または実質的な同一性)を確認することによって、シークエンシングの後に一緒にグルーピングされてもよく、それによって、そうでなければ限定されたリード長および/または配列クオリティーを有するシークエンシングプラットフォームについての場合よりも、長いV(D)Jセグメントの再構築を可能にする。一実施形態において、複数のプライマーセットが、2〜5の範囲の数であってもよい。他の実施形態において、複数が2〜3であり、さらに他の実施形態では、複数が3である。複数のプライマーの濃度およびポジションは、広く変動してもよい。V領域プライマーの濃度は、同じであってもなくてもよい。一実施形態において、NDN領域に最も近いプライマーが、たとえば、NDN領域を含有するアンプリコンが結果として生じるアンプリコン中に示されることを確実にするために、複数の他のプライマーよりも高い濃度を有する。複数の3つのプライマーが用いられる特定の実施形態において、60:20:20の濃度比が、使用される。NDN領域(444)に隣接する1つ以上のプライマー(たとえば図4Dにおける435および437)は、J領域プライマー(432)によって生成される配列リード(442)とオーバーラップする、1つ以上の配列リード(たとえば434および436)を生成するために使用され、それによって、オーバーラップ領域(440)におけるベースコールのクオリティーを改善してもよい。複数のプライマー由来の配列リードは、隣接する下流のプライマー結合部位および/または隣接する下流の配列リードとオーバーラップしてもしなくてもよい。一実施形態において、NDN領域に近い配列リード(たとえば436および438)が、クロノタイプと関連する特定のV領域を同定するために使用されてもよい。そのような複数のプライマーは、プライマー結合部位のうちの1つが免疫グロブリン発生の間に超突然変異した場合の不完全な増幅または増幅の失敗の可能性を低下させる。それはまた、V領域の超突然変異によって導入された多様性がクロノタイプ配列において捕らえられる可能性をも増加させる。二次PCRは、たとえばアンプリコン(420、422、および424)を産生するために示されるようにP5(401)およびP7(404、406、408)プライマーで増幅することによって、シークエンシングのためのネステッドアンプリコンを調製するために実行されてもよく、これらは、固体表面上で単一の分子として分布させて
もよく、ここで、それらは、ブリッジPCRまたは同様の技術によってさらに増幅される。
図4Eにおいて示されるように、NDN領域(特にIgH鎖の)におけるベースコールは、フランキングJ領域およびV領域のコドン構造を使用することによって改善することができる(本明細書において使用されるように、「コドン構造」は、NDN領域の外側、たとえばV領域、J領域、またはその他同種のもののTCRまたはBCR転写物または遺伝子のセグメントの天然のリーディングフレームのコドンを意味する)。そこで、図4Bのアンプリコンの拡大図であるアンプリコン(450)は、上のCリード(442)および隣接するVリード(434)ならびに下のV領域(430)およびJ領域(446)のコドン構造(452および454)の相対的なポジションと共に示される。本発明の本態様に従って、コドン構造(452および454)が、VおよびJ参照配列に対する従来のアライメントによって同定された後に、NDN領域(456)における塩基は、配列リード(434)および(442)を使用して、J領域(446)からV領域(430)に向かっておよび反対方向ではV領域(430)からJ領域(446)に向かって移動しながら、一度に1つの塩基がコールされる(または同定される)。通常の生物学的な条件下で、V領域からNDN領域を通ってJ領域までインフレームコドンを有する再構成TCRまたはIgH配列のみが、タンパク質として発現される。すなわち、体細胞性に生成された変異体のうちで、発現されるのは、J領域およびV領域コドンフレームが互いにインフレームであり、NDN領域を通してインフレームのままであるもののみである(ここで、VおよびJ領域の正確なフレームは、参照配列から決定される)。フレームからずれた(out−of−frame)配列が、1つ以上の低クオリティーベースコールに基づいて同定された場合、対応するクロノタイプは、再評価のためにまたは疾患関連性の異常の可能性としてフラグを立てられる。同定された配列がインフレームであり、ハイクオリティーベースコールに基づく場合、対応するクロノタイプが正確にコールされたという高い信頼がある。したがって、一態様において、本発明は、双方向配列リードからV(D)Jに基づくクロノタイプを決定するための方法であって、(a)J領域配列リードおよびV領域配列リードがオーバーラップ領域においてオーバーラップするとともに、J領域およびV領域がそれぞれコドン構造を有するように、J領域において始まってNDN領域中に伸長する少なくとも1つのJ領域配列リードと、V領域において始まってNDN領域に向かって伸長する少なくとも1つのV領域配列リードとを生成するステップ;(b)NDN領域中に伸長したJ領域のコドン構造が、NDN領域に向かって伸長したV領域のコドン構造とインフレームにあるかどうかを決定するステップを含む方法を含む。さらなる実施形態において、生成するステップは、V領域において始まり、J領域配列リードおよびV領域配列リードが、オーバーラップ領域においてオーバーラップするように、NDN領域を通ってJ領域まで伸長する少なくとも1つのV領域配列リードを生成するステップを含む。
体細胞超変異。一実施形態において、体細胞超変異を受けたIgHに基づくクロノタイプが、以下のように決定される。体細胞変異は、参照配列(関連するセグメント、通常V、J、またはC)の対応する塩基と異なるとともに、統計的に有意な数のリードに存在する、シークエンシングされた塩基として定義される。一実施形態において、Cリードが、VセグメントについてのVリードも同様に、マッピングされたJセグメントを基準にして、体細胞変異を見つけるために使用されてもよい。JまたはVセグメントに対して直接マッピングされるまたはNDN境界までのクロノタイプ伸長の内側にある数本のCおよびVリードのみが、使用される。このように、NDN領域は、回避され、以前にクロノタイプ決定のために使用された同じ「配列情報」は、突然変異を見つけるために使用されない(実際に単に異なる再構成NDN領域であるヌクレオチドを突然変異として誤って分類しないようにするため)。それぞれのセグメントタイプについて、マッピングされたセグメント(主な対立遺伝子)は、骨格として使用され、リードマッピングフェーズの間にこの対立遺伝子に対してマッピングされたすべてのリードについて考慮される。少なくとも1つ
のリードがマッピングされた参照配列のそれぞれのポジションは、体細胞変異について分析される。一実施形態において、妥当な突然変異として非参照塩基を認める判定基準が、以下のものを含む:1)所定の突然変異塩基を有する少なくともN個のリード、2)少なくともN/Mリードの所定の割合(Mは、この塩基のポジションでマッピングされたリードの全数である)、ならびに3)二項分布、突然変異塩基でのN個のリードの平均Qスコアおよび非突然変異塩基を有するリードの数(M−N)に基づく統計的なカット。好ましくは、上記のパラメーターは、クロノタイプ当たりの突然変異の偽発見率が、1000のうちの1未満、より好ましくは10000のうちの1未満となるように、選択される。
本発明のキット
本発明は、本発明の方法を実行するための物質および試薬を含むキットを含む。一実施形態において、本発明のキットが、組織サンプル中の再構成核酸の総量または濃度を決定するためのプライマーおよび再構成配列内部標準を含む。他の実施形態において、本発明のキットが、(a)組織サンプル中の再構成核酸の総量または濃度を決定するためのプライマーおよび再構成配列内部標準ならびに(b)組織サンプル中の全核酸の総量または濃度を決定するためのプライマーおよび全核酸内部標準を含む。後者の実施形態の一態様において、そのような全核酸内部標準が、恒常的にかつ普遍的に発現されるハウスキーピング遺伝子からなる群から選択されまたはそれに由来し、さらなるそのような態様において、そのような全核酸内部標準が、以下の遺伝子からなる群から選択されるまたはそれに由来する:GAPDH、β−ミクログロブリン、18SリボソームRNA、およびβ−アクチン。他の実施形態において、本発明のキットが、(a)組織サンプル中の再構成核酸の総量または濃度を決定するためのプライマーおよび再構成配列内部標準、(b)組織サンプル中の全核酸の総量または濃度を決定するためのプライマーおよび全核酸内部標準、ならびに(c)組織サンプル中の非再構成核酸の総量または濃度を決定するためのプライマーならびに第1および/または第2の削除されるセグメントの内部標準を含む。さらに他の実施形態において、本発明のキットが、(a)組織サンプル中の再構成核酸の総量または濃度を決定するためのプライマーおよび再構成配列内部標準、(b)組織サンプル中の全核酸の総量または濃度を決定するためのプライマーおよび全核酸内部標準、(c)組織サンプル中の非再構成核酸の総量または濃度を決定するためのプライマーならびに第1および/または第2の削除されるセグメントの内部標準、ならびに(d)再構成核酸および非再構成核酸の両方に位置する1つ以上の遺伝子座の遺伝子マーカの対立遺伝子の値を決定するためのプライマーを含む。さらに他の実施形態において、本発明のキットが、(a)組織サンプル中の再構成核酸の総量または濃度を決定するためのプライマーおよび再構成配列内部標準、(b)組織サンプル中の全核酸の総量または濃度を決定するためのプライマーおよび全核酸内部標準、(c)非再構成核酸において存在し、かつ再構成核酸において存在しない1つ以上の遺伝子座の遺伝子マーカの対立遺伝子の値を決定するためのプライマー、ならびに(d)再構成核酸および非再構成核酸の両方に位置する1つ以上の遺伝子座の遺伝子マーカの対立遺伝子の値を決定するためのプライマーを含む。
さらに、上記の実施形態のすべてに関して、遺伝子マーカを増幅するためのキットのプライマーが、1つ以上の遺伝子マーカについて、上流フランキング領域に対して特異的な少なくとも1つのフォワードプライマーおよび下流フランキング領域に対して特異的な少なくとも1つのリバースプライマーを含んでいてもよい。同様に、さらに、上記の実施形態のすべてに関して、キットのプライマーが、フォワードプライマーおよびリバースプライマーのペアのセットを含んでいてもよく、それぞれのフォワードプライマーがテールを有し、それぞれのリバースプライマーが、テールを有する。本明細書において使用されるように、「テール」は、2段階増幅反応の第2段階において、プライマー結合部位として果たすプライマーの一部分を意味する。好ましくは、テールは、増幅されている核酸中の配列、特に、フランキング領域のまたはその近くの配列に対して相補的ではない。さらなる実施形態において、ペアのフォワードプライマーのすべてのテールのプライマー結合部
位が、同じ配列を有し、ペアのリバースプライマーのすべてのテールのプライマー結合部位が、同じ配列を有する。さらなる実施形態において、フォワードおよびリバースプライマーのペアのテールのプライマー結合部位の配列が、異なる。
本発明が、いくつかの特定の実施形態例に関して記載されたが、当業者らは、多くの変更が本発明の精神および範囲から逸脱することなく、本発明に対してなされてもよいことを認識するであろう。本発明は、上記に議論されるものに加えて、様々な手段および他の主題に対して適用可能である。
定義
本明細書において他に明確に定義されない限り、本明細書において使用される核酸化学、生化学、遺伝学、および分子生物学の用語および記号は、当分野における標準的な論文およびテキストに従う。たとえばコーンバーグ(Kornberg)およびベイカー(Baker)、DNA複製(DNA Replication)、第2版(W.H.フリーマン(W.H.Freeman)、ニューヨーク、1992年);レインガー(Lehninger)、生化学(Biochemistry)、第2版(ワース出版(Worth
Publishers)、ニューヨーク、1975年);ストラッチャン(Strachan)およびリード(Read)、ヒト分子遺伝学(Human Molecular
Genetics)、第2版(ワイリーリス(Wiley−Liss)、ニューヨーク、1999年);アッバース(Abbas)ら、細胞および分子免疫学(Cellular and Molecular Immunology)、第6版(サンダース(Saunders)、2007年)。
「アライメントする」は、どの参照配列または参照配列のどの一部分が配列距離測定値に基づいて最も近いかを決定するために、配列リードなどの試験配列を1つ以上の参照配列と比較するための方法を意味する。ヌクレオチド配列をアライメントするための例示的な方法は、スミス・ウォーターマンアルゴリズムである。距離測定値は、ハミング距離、レーベンシュタイン距離、またはその他同種のものを含んでいてもよい。距離測定値は、比較されている配列のヌクレオチドのクオリティー値に関係する構成成分を含んでいてもよい。
「アンプリコン」は、ポリヌクレオチド増幅反応の産物、すなわち、1つ以上の出発配列から複製される、一本鎖または二本鎖であってもよいポリヌクレオチドのクローンの集団を意味する。1つ以上の出発配列は、同じ配列の1つ以上のコピーであっても、異なる配列の混合物であってもよい。好ましくは、アンプリコンは、単一の出発配列の増幅によって形成される。アンプリコンは、その産物が1つ以上の出発または標的核酸の複製を含む、様々な増幅反応によって産生されてもよい。一態様において、アンプリコンを産生する増幅反応は、反応物の塩基対が、ヌクレオチドまたはオリゴヌクレオチドのいずれでも、反応産物の生成に必要とされる鋳型ポリヌクレオチド中の相補体(complement)を有するという点で、「鋳型駆動型」である。一態様において、鋳型駆動型反応が、核酸ポリメラーゼによるプライマー伸長または核酸リガーゼによるオリゴヌクレオチドライゲーションである。そのような反応は、参照によって本明細書において組み込まれる以下の参考文献において開示されるポリメラーゼ連鎖反応(PCR)、直鎖ポリメラーゼ反応、核酸配列ベースの増幅(NASBA:nucleic acid sequence
based amplification)、ローリングサークル増幅、およびその他同種のものを含むが、これらに限定されない:マリス(Mullis)ら、米国特許第4,683,195号明細書;米国特許第4,965,188号明細書;米国特許第4,683,202号明細書;米国特許第4,800,159号明細書(PCR);ゲルファント(Gelfand)ら、米国特許第5,210,015号明細書(「taqman」プローブによるリアルタイムPCR);ウイットワー(Wittwer)ら、米国特許第6
,174,670号明細書;カシャン(Kacian)ら、米国特許第5,399,491号明細書(「NASBA」);リサルディ(Lizardi)、米国特許第5,854,033号明細書;アオノ(Aono)ら、日本特許出願公開第4−262799号公報(ローリングサークル増幅)など。一態様において、本発明のアンプリコンが、PCRによって産生される。増幅反応が進行する中で、反応産物の測定を可能にする検出化学が利用可能な場合、増幅反応は、「リアルタイム」増幅、たとえば下記に記載される「リアルタイムPCR」またはレオーネ(Leone)ら、核酸リサーチ(Nucleic Acids Research)、第26巻:p.2150〜2155(1998年)などにおいて記載される「リアルタイムNASBA」であってもよい。本明細書において使用されるように、用語「増幅」は、増幅反応を実行することを意味する。「反応混合物」は、反応を実行するための必要な反応物をすべて含有する溶液を意味し、これは、反応の間に選択されるレベルのpHを維持するための緩衝剤、塩、補助因子、捕捉剤、およびその他同種のものを含むが、これらに限定されない。
本明細書において使用される「クロナリティー」は、レパートリのクロノタイプの間のクロノタイプ存在量の分布が単一のまたは少数のクロノタイプに偏る程度についての測定値を意味する。概略的に、クロナリティーは、クロノタイプ多様性の逆の測定値である。多くの測定値または統計は、本発明に従ってクロナリティー測定値に使用されてもよい種数個体数関係について記載する生態学から入手可能である。たとえば第17章および第18章、ピールー(Pielou)、数理生態学入門(An Introduction to Mathematical Ecology)、(ワイリー−インターサイエンス(Wiley−Interscience)、1969年)。一態様において、本発明により使用されるクロナリティー測定値が、クロノタイププロファイルの関数であり(すなわち、検出される別個のクロノタイプの数およびそれらの存在量)、クロノタイププロファイルが測定された後に、クロナリティーは、それから計算され、単一の数が得られてもよい。あるクロナリティー測定値は、シンプソンの測定値であり、これは、単純に、2つのランダムに得られたクロノタイプが同じである確率である。他のクロナリティー測定値は、ピールー(Pielou)(上記に引用)において開示される情報に基づく測定値およびマッキントッシュの多様性指数を含む。
「クロノタイプ」は、免疫受容体またはその一部分をコードするリンパ球の再構成ヌクレオチド配列を意味する。より詳細には、クロノタイプは、T細胞受容体(TCR)もしくはB細胞受容体(BCR)をコードするT細胞もしくはB細胞の再構成ヌクレオチド配列またはその一部分を意味する。様々な実施形態において、クロノタイプが、IgHのVDJ再編成、IgHのDJ再編成、IgKのVJ再編成、IgLのVJ再編成、TCRβのVDJ再編成、TCRβのDJ再編成、TCRαのVJ再編成、TCRγのVJ再編成、TCRδのVDJ再編成、TCRδのVD再編成、Kde−V再編成、またはその他同種のもののすべてまたは一部分をコードしてもよい。クロノタイプはまた、Bcll−IgHまたはBcll−IgHなどの免疫受容体遺伝子を含む転座切断点領域をコードしてもよい。一態様において、クロノタイプが、それらが由来する免疫分子の多様性を示すまたは反映するのに十分に長い配列を有し、それゆえ、クロノタイプが、長さにおいて広く変動してもよい。いくつかの実施形態において、クロノタイプが、25〜400ヌクレオチドの範囲の長さを有し、他の実施形態において、クロノタイプが、25〜200ヌクレオチドの範囲の長さを有する。
「クロノタイププロファイル」は、リンパ球の集団に由来する別個のクロノタイプおよびそれらの相対的存在量についてのリストを意味する。典型的に、リンパ球の集団は、組織サンプルから得られる。用語「クロノタイププロファイル」は、以下のものなどの参考文献において記載される免疫「レパートリ」の免疫学の概念に関係するが、それもよりも一般的である:アースティラ(Arstila)ら、サイエンス(Science)、第
286巻:p.958〜961(1999年);ヤッサイ(Yassai)ら、免疫遺伝学(Immunogenetics)、第61巻:p.493〜502(2009年);ケドツェルスカ(Kedzierska)ら、分子免疫学(Mol.Immunol)、第45巻(3):p.607〜618(2008年)など。用語「クロノタイププロファイル」は、リンパ球の選択されるサブセット(たとえば組織浸潤リンパ球、免疫表現性サブセット、もしくはその他同種のもの)に由来してもよいまたは完全な免疫受容体と比較して多様性が低下した免疫受容体の一部分をコードしてもよい再編成免疫受容体コード核酸の種々様々のリストおよび存在量を含む。いくつかの実施形態において、クロノタイププロファイルが、少なくとも10の別個のクロノタイプを含んでいてもよく、他の実施形態において、クロノタイププロファイルが、少なくとも10の別個のクロノタイプを含んでいてもよく、他の実施形態において、クロノタイププロファイルが、少なくとも10の別個のクロノタイプを含んでいてもよく、他の実施形態において、クロノタイププロファイルが、少なくとも10の別個のクロノタイプを含んでいてもよい。そのような実施形態において、そのようなクロノタイププロファイルが、別個のクロノタイプのそれぞれの存在量または相対的頻度をさらに含んでいてもよい。一態様において、クロノタイププロファイルが、個人のリンパ球の集団における、それぞれ、T細胞受容体(TCR)もしくはB細胞受容体(BCR)をコードする別個の再構成ヌクレオチド配列(それらの存在量と共に)またはそのフラグメントのセットのヌクレオチド配列が、集団の実質的にすべてのリンパ球について、別個のリンパ球またはそれらのクローン亜集団と一対一の対応を有する。一態様において、クロノタイプを特定する核酸セグメントが、それらの多様性(つまりセットにおける別個の核酸配列の数)が、個人における実質的にすべてのT細胞もしくはB細胞またはそのクローンが、そのようなレパートリのユニークな核酸配列を運ぶように十分に大きくなるように、選択される。すなわち、好ましくは、サンプルのそれぞれ異なるクローンは、異なるクロノタイプを有する。本発明の他の態様において、レパートリに対応するリンパ球の集団は、循環B細胞であっても、循環T細胞であっても、前述の集団のいずれかの亜集団であってもよく、CD4+T細胞もしくはCD8+T細胞もしくは細胞表面マーカによって特定される他の亜集団などを含むが、これらに限定されない。そのような亜集団は、特定の組織、たとえば骨髄もしくはリンパ節もしくはその他同種のもの由来のサンプルを採取することによってまたは1つ以上の細胞表面マーカ、サイズ、形態、もしくはその他同種のものに基づいて、サンプル(末梢血など)由来の細胞をソートするもしくは濃縮することによって、得られてもよい。さらに他の態様において、レパートリに対応するリンパ球の集団が、腫瘍組織、感染組織、またはその他同種のものなどの疾患組織に由来してもよい。一実施形態において、ヒトTCRβ鎖またはそのフラグメントを含むクロノタイププロファイルが、0.1×10〜1.8×10の範囲もしくは0.5×10〜1.5×10の範囲のまたは0.8×10〜1.2×10の範囲の、多くの別個のヌクレオチド配列を含む。他の実施形態において、ヒトIgH鎖またはそのフラグメントを含むクロノタイププロファイルが、0.1×10〜1.8×10の範囲もしくは0.5×10〜1.5×10の範囲のまたは0.8×10〜1.2×10の範囲の多くの別個のヌクレオチド配列を含む。特定の実施形態において、本発明のクロノタイププロファイルが、IgH鎖のV(D)J領域の実質的にすべてのセグメントをコードするヌクレオチド配列のセットを含む。一態様において、本明細書において使用される「実質的にすべて」が、0.001パーセント以上の相対的存在量を有するすべてのセグメントを意味するまたは他の態様において、本明細書において使用される「実質的にすべて」が、0.0001パーセント以上の相対的存在量を有するすべてのセグメントを意味する。他の特定の実施形態において、本発明のクロノタイププロファイルが、TCRβ鎖のV(D)J領域の実質的にすべてのセグメントをコードするヌクレオチド配列のセットを含む。他の実施形態において、本発明のクロノタイププロファイルが、25〜200ヌクレオチドの範囲の長さを有し、TCRβ鎖のV、D、およびJ領域のセグメントを含むヌクレオチド配列のセットを含む。他の実施形態において、本発明のクロノタイププロファイルが、25〜200ヌクレオチドの範囲の長さを有し、IgH鎖
のV、D、およびJ領域のセグメントを含むヌクレオチド配列のセットを含む。他の実施形態において、本発明のクロノタイププロファイルが、別個のIgH鎖を発現するリンパ球の数と実質的に等価な、多くのヌクレオチド配列を含む。他の実施形態において、本発明のクロノタイププロファイルが、別個のTCRβ鎖を発現するリンパ球の数と実質的に等価な、多くの別個のヌクレオチド配列を含む。さらに他の実施形態において、「実質的に等価な」が、99パーセントの確率で、クロノタイププロファイルが、0.001パーセント以上の頻度で個人の集団のすべてのリンパ球によって運ばれるまたは発現されるIgHもしくはTCRβをコードするヌクレオチド配列またはその一部分を含むであろうということを意味する。さらに他の実施形態において、「実質的に等価な」が、99パーセントの確率で、ヌクレオチド配列のレパートリが、0.0001パーセント以上の頻度で存在するすべてのリンパ球によって運ばれるまたは発現されるIgHもしくはTCRβをコードするヌクレオチド配列またはその一部分を含むであろうということを意味する。いくつかの実施形態において、クロノタイププロファイルが、10〜10のリンパ球を含むサンプルに由来する。そのような数のリンパ球は、1〜10mLの末梢血サンプルから得られてもよい。
「合体させる」は、配列差異を有する2つの候補クロノタイプを、そのような差異が実験的または測定エラーによるものであり、真の生物学的差異によるものではないことを決定することによって、同一であると見なすことを意味する。一態様において、より高い頻度の候補クロノタイプの配列が、より低い頻度の候補クロノタイプの配列と比較され、所定の判定基準が満たされる場合、より低い頻度の候補クロノタイプの数が、より高い頻度の候補クロノタイプの数に追加され、より低い頻度の候補クロノタイプは、その後、無視される。すなわち、より低い頻度の候補クロノタイプと関連するリード数は、より高い頻度の候補クロノタイプのものに追加される。
「相補性決定領域」(CDR:complementarity determining region)は、分子が抗原のコンホメーションを補完し、それによって、分子の特異性および特異的な抗原との接触を決定する、免疫グロブリン(つまり抗体)またはT細胞受容体の領域を意味する。T細胞受容体および免疫グロブリンは、それぞれ、3つのCDRを有する:CDR1およびCDR2は、可変(V)ドメインにおいて見つけられ、CDR3は、いくつかのV、すべての多様(D)(重鎖のみ)およびジョイント(J)、ならびにいくつかの定常(C)ドメインを含む。
本明細書において使用される「混入」は、1個人の組織サンプルにおける他の個人由来の核酸の存在を意味する。一態様において、「混入」は、患者のクロノタイププロファイルの解釈に影響し得る、患者から生じるものではない核酸の存在を意味する。
「遺伝子同定」は、個人および個人の1つ以上の遺伝子座由来の遺伝子マーカの値(または状態)のセットの間のユニークな一致を意味する。
「遺伝子マーカ」は、個人を同定するために使用されてもよい、遺伝子座でのDNAの多型セグメントを意味する。遺伝子マーカは、その配列または隣接する配列もしくはフランキング配列によって同定されてもよい。典型的に、遺伝子マーカは、集団の異なる個人において複数の配列または値を有することができる。例示的な遺伝子マーカは、縦列型反復配列(STR:short tandem repeat)、一塩基多型(SNP:single nucleotide polymorphism)、およびその他同種のものを含むが、これらに限定されない。DNAの多型セグメントは、ゲノムDNAであっても、逆転写RNAであってもよい。一実施形態において、多型セグメントが、ゲノムDNAである。一実施形態において、本発明で使用される遺伝子マーカが、従来の技術を使用して増幅およびシークエンシングによって同定される。他の実施形態において、遺伝子マーカが、クロノタイププロファイルを生成するためのプロセスの間に、免疫分子と一緒
に増幅され、シークエンシングされる。
「内部標準」は、サンプル中の標的ポリヌクレオチドの絶対的または相対的な定量化を可能にするために、1つ以上の標的ポリヌクレオチドと同じ反応で処理される核酸配列を意味する。一態様において、反応が、PCRなどの増幅反応である。内部標準は、内因性または外因性であってもよい。すなわち、内部標準は、サンプル中に天然に存在しても反応前にサンプルに対して追加されてもよい。一態様において、1つ以上の外因性の内部標準配列が、サンプル中のその対応する標的ポリヌクレオチドの数量を決定するために増幅された配列が比較されてもよいキャリブレーションを提供するために、所定の濃度で反応混合物に対して追加されてもよい。外因性の内部標準の数、配列、長さ、および他の特徴の選択は、当業者についてのごく普通の設計の選択肢である。本明細書において「参照配列」とも呼ばれる内因性の内部標準は、一定の、細胞周期非依存性のレベルの転写を示す、最小限に調節される遺伝子に対応する、サンプルに対して天然の配列である。たとえばセルベイ(Selvey)ら、分子細胞プローブ(Mol.Cell Probes)、第15巻:p.307〜311(2001年)。例示的な内部標準は、以下の遺伝子由来の配列を含むが、これらに限定されない:GAPDH、β−ミクログロブリン、18SリボソームRNA、およびβ−アクチン。
「キット」は、本発明の方法を実行するための物質または試薬をデリバリーするための任意のデリバリーシステムを指す。本発明の方法との関連において、そのようなデリバリーシステムは、ある位置から他の位置への、反応試薬(たとえば、適切な容器中のプライマー、酵素、内部標準など)の保存、輸送、もしくはデリバリーを可能にするおよび/または物質(たとえばバッファー、アッセイを実行するための書面の説明書など)を支持するシステムを含む。たとえば、キットは、関連する反応試薬を含有するおよび/または物質を支持する1つ以上の密閉箱(たとえばボックス)を含む。そのような内容物は、意図されるレシピエントに対して一緒にまたは別々にデリバリーされてもよい。たとえば、第1の容器は、アッセイにおいて使用される酵素を含有してもよく、第2の容器は、プライマーを含有する。
「リンパ系新生物」は、悪性または非悪性であってもよいリンパ球の正常でない増殖を意味する。リンパの癌は、悪性リンパ系新生物である。リンパ系新生物は、濾胞性リンパ腫、慢性リンパ性白血病(CLL)、急性リンパ性白血病(ALL)、ヘアリー細胞白血病、リンパ腫、多発性骨髄腫、移植後リンパ増殖症候群、マントル細胞リンパ腫(MCL)、びまん性大細胞型B細胞リンパ腫(DLBCL)、T細胞リンパ腫、またはその他同種のものを含むが、これらに限定されないリンパ増殖症候群の結果であるまたはそれと関連する。たとえばジャフィ(Jaffe)ら、血液(Blood)、第112巻:p.4384〜4399(2008年);スウェルドロフ(Swerdlow)ら、造血組織およびリンパ組織の腫瘍のWHO分類(WHO Classification of Tumours of Haematopoietic and Lymphoid Tissues)(第4版)(IARC出版(IARC Press)、2008年)。
「微小残存病変」は、治療の後に残っている癌細胞を意味する。用語は、リンパ腫および白血病の治療に関して最も頻繁に使用される。
参照配列および他の配列(「比較配列」)の比較に関して使用される「相同的パーセント」、「同一パーセント」、または同様の用語は、2つの配列の間の最適なアライメントにおいて、比較配列が、示されるパーセンテージに等価な多くのサブユニットポジションにおいて参照配列と同一であることを意味し、サブユニットは、ポリヌクレオチド比較のためのヌクレオチドまたはポリペプチド比較のためのアミノ酸である。本明細書において使用されるように、比較されている配列の「最適なアライメント」は、サブユニットの間のマッチを最大限にし、アライメントを構成する際に用いられるギャップの数を最小限に
するアライメントである。同一性パーセントは、ニードルマン(Needleman)およびワンチ(Wunsch)、分子生物学(J.Mol.Biol)、第48巻:p.443〜453(1970年)(ウィスコンシン配列分析パッケージの「GAP」プログラム、遺伝子コンピュータグループ、マディソン、ウィスコンシン州)などによって記載されるものなどのアルゴリズムの市販で入手可能な手段により決定されてもよい。アライメントを構成し、類似性のパーセンテージ同一性または他の測定値を計算するための当技術分野における他のソフトウェアパッケージは、スミス(Smith)およびウォーターマン(Waterman)、応用数学における進歩(Advances in Applied Mathematics)、第2巻:p.482〜489(1981年)(ウィスコンシン配列分析パッケージ、遺伝子コンピュータグループ、マディソン、ウィスコンシン州)のアルゴリズムに基づく「BestFit」プログラムを含む。言いかえれば、たとえば、参照ヌクレオチド配列に対して少なくとも95パーセント同一なヌクレオチド配列を有するポリヌクレオチドを得るためには、参照配列におけるヌクレオチドの5パーセントまでが、欠失されても他のヌクレオチドと置換されてもよいまたは参照配列におけるヌクレオチドの全数の5パーセントまでの多くのヌクレオチドが、参照配列に挿入されてもよい。
「ポリメラーゼ連鎖反応」または「PCR」は、DNAの相補鎖の同時のプライマー伸長による、特異的なDNA配列のインビトロ増幅のための反応を意味する。言いかえれば、PCRは、プライマー結合部位によって挟まれた標的核酸の複数のコピーまたは複製を作製するための反応であり、そのような反応は、以下のステップの1つ以上の反復を含む:(i)標的核酸を変性させるステップ、(ii)プライマー結合部位に対してプライマーをアニールするステップ、および(iii)ヌクレオシド三リン酸の存在下において核酸ポリメラーゼによってプライマーを伸長させるステップ。通常、反応は、サーマルサイクラー機器においてそれぞれのステップに最適化された様々な温度で循環される。特定の温度、それぞれのステップの期間、およびステップの間の変化率は、たとえば参考文献:マクファーソン(McPherson)ら編、PCR:実践的アプローチおよびPCR2:実践的アプローチ(PCR:A Practical Approach and PCR2:A Practical Approach)(IRL出版(IRL Press)、オックスフォード、それぞれ1991年および1995年)によって例証される、当業者らによく知られている多くの因子に依存する。たとえばTaq DNAポリメラーゼを使用する従来のPCRにおいて、二本鎖標的核酸は、90℃を超える温度で変性し、プライマーは、50〜75℃の範囲の温度でアニールし、プライマーは、72〜78℃の範囲の温度で伸長させてもよい。用語「PCR」は、RT−PCR、リアルタイムPCR、ネステッドPCR、定量PCR、多重PCR、およびその他同種のものを含むが、これらに限定されない、反応の派生的な形態を包含する。用いられるPCRの特定の構成は、応用法についての文脈から当業者によって識別可能である。反応容積は、数百ナノリットル、たとえば200nLから、数百μL、たとえば200μLの範囲にわたる。「逆転写PCR」または「RT−PCR」は、標的RNAを、次いで増幅される相補的な一本鎖DNAに変換する逆転写反応が先行するPCRである。たとえば参照によって本明細書において組み込まれるテコット(Tecott)ら、米国特許第5,168,038号明細書。「リアルタイムPCR」は、反応が進む中で反応産物、つまりアンプリコンの量がモニターされるPCRを意味する。反応産物をモニターするために使用される検出化学において主として異なるリアルタイムPCRの多くの形態がある。たとえば参照によって本明細書において組み込まれるゲルファント(Gelfand)ら、米国特許第5,210,015号明細書(「taqman」);Wittwerら、米国特許第6,174,670号明細書および米国特許第6,569,627号明細書(挿入色素);チャギ(Tyagi)ら、米国特許第5,925,517号明細書(モレキュラービーコン)。リアルタイムPCRについての検出化学は、参照によって本明細書において組み込まれるマッカイ(Mackay)ら、核酸リサーチ(Nucleic Acids Research)第
30巻:p.1292〜1305(2002値)において概説される。「ネステッドPCR」は、第1のPCRのアンプリコンが、少なくとも1つが第1のアンプリコンの内部の位置に対して結合するプライマーの新しいセットを使用する第2のPCRについてのサンプルになる2段階PCRを意味する。本明細書において使用されるように、ネステッド増幅反応に関する「最初のプライマー」は、第1のアンプリコンを生成するために使用されるプライマーを意味し、「二次プライマー」は、第2のまたはネステッドアンプリコンを生成するために使用される1つ以上のプライマーを意味する。「多重PCR」は、複数の標的配列(または単一の標的配列および1つ以上の参照配列)が同じ反応混合物中で同時に実行されるPCRを意味する。たとえばバーナード(Bernard)ら、分析生化学(Anal.Biochem.)、第273巻:p.221〜228(1999年)(2色リアルタイムPCR)。通常、プライマーの別個のセットが、増幅されているそれぞれの配列に用いられる。典型的に、マルチプレックスPCRにおける標的配列の数は、2〜50または2〜40または2〜30の範囲にある。「定量PCR」は、サンプルまたは検体中の1つ以上の特異的な標的配列の存在量を測定するために設計されたPCRを意味する。定量PCRは、そのような標的配列の絶対的な定量化および相対的な定量化の両方を含む。定量測定値は、標的配列と別々にまたは一緒にアッセイされてもよい1つ以上の参照配列または内部標準を使用して生成される。参照配列は、サンプルまたは検体に対して内因性また外因性であってもよく、後者の場合において、1つ以上の競合的な鋳型を含んでいてもよい。典型的な内因性の参照配列は、以下の遺伝子の転写セグメントを含む:β−アクチン、GAPDH、β−ミクログロブリン、リボソームRNA、およびその他同種のもの。参照によって組み込まれる以下の参考文献において例証されるように、定量PCRについての技術は、当業者らによく知られている:フリーマン(Freeman)ら、バイオ技術(Biotechniques)、第26巻:p.112〜126(1999年);ベッカー−アンドレ(Becker−Andre)ら、核酸リサーチ(Nucleic Acids Research)、第17巻:p.9437〜9447(1989年);ジマーマン(Zimmerman)ら、バイオ技術(Biotechniques)、第21巻:p.268〜279(1996年);ディビアッコ(Diviacco)ら、遺伝子(Gene)、第122巻:p.3013〜3020(1992年);ベッカー−アンドレ(Becker−Andre)ら、核酸リサーチ(Nucleic Acids Research)、第17巻:p.9437〜9446(1989年)など。
「ポリヌクレオチド」は、ヌクレオチド単量体の線状高分子を指し、DNAまたはRNAであってもよい。ポリヌクレオチドを構成する単量体は、ワトソン−クリック型の塩基対合、塩基スタッキング、フーグスティーンもしくは逆フーグスティーン型の塩基対合、またはその他同種のものなどの、通常のパターンの単量体間相互作用を介して、天然のポリヌクレオチドに対して特異的に結合することができる。そのような単量体およびそれらのヌクレオシド間連結は、天然に存在しても、そのアナログ、たとえば天然に存在するもしくは天然に存在しないアナログであってもよい。天然に存在しないアナログは、PNA、ホスホロチオエートヌクレオシド間連結、フルオロフォアまたはハプテンなどの標識の付加を可能にする連結基を含有する塩基、およびその他同種のものを含んでいてもよい。ポリヌクレオチドは、ホスホジエステル連結によって連結される4つの天然のヌクレオシド(たとえばDNAについてのデオキシアデノシン、デオキシシチジン、デオキシグアノシン、デオキシチミジンまたはRNAについてのそれらのリボース対応物)を含んでいてもよい。しかしながら、それらはまた、たとえば修飾された塩基、糖、またはヌクレオシド間連結を含む非天然ヌクレオチドアナログを含んでいてもよい。酵素が、活性のために特異的なオリゴヌクレオチドまたはポリヌクレオチド基質の必要性を有する場合(たとえば一本鎖DNA、RNA/DNA二重鎖、またはその他同種のもの)、オリゴヌクレオチドまたはポリヌクレオチド基質についての適切な組成物の選択は、とりわけ、サムブルック(Sambrook)ら、分子クローニング(MOLECULAR CLONING)、第2版(コールドスプリングハーバー研究所(Cold Spring Harbor
Laboratory)、ニューヨーク、1989年)、および同様の参考文献などの論文からの手引きと共に、当業者の知識の範囲内に十分にあることが当業者らに明らかである。本明細書において使用されるように、用語「オリゴヌクレオチド」は、たとえば3〜60の単量体ユニットを有するまたはいくつかの実施形態において、12〜60単量体ユニットを有するより小さなポリヌクレオチドを指す。様々な実施形態において、ポリヌクレオチドまたはオリゴヌクレオチドが、「ATGCCTG」などの文字(大文字または小文字)の配列によって示されてもよく、ヌクレオチドは、左から右に5’→3’の順であり、他に示されないまたは文脈から明白でない限り、「A」は、デオキシアデノシンを示し、「C」は、デオキシシチジンを示し、「G」は、デオキシグアノシンを示し、「T」はチミジンを示し、「I」はデオキシイノシンを示し、「U」はウリジンを示すことが理解されるであろう。
「プライマー」は、ポリヌクレオチド鋳型との二重鎖の形成に際して、核酸合成の開始のポイントとして作用し、鋳型に沿ってその3’末端部から伸長することができ、伸長二重鎖が形成される、天然のまたは合成のオリゴヌクレオチドを意味する。プライマーの伸長は、DNAまたはRNAポリメラーゼなどの核酸ポリメラーゼにより通常実行される。伸長プロセスにおいて追加されるヌクレオチドの配列は、鋳型ポリヌクレオチドの配列によって決定される。通常、プライマーは、DNAポリメラーゼによって伸長される。プライマーは、通常14〜40のヌクレオチドの範囲または18〜36ヌクレオチドの範囲の長さを有する。プライマーは、様々な核酸増幅反応、たとえば、単一のプライマーを使用する線形増幅反応または2つ以上のプライマーを用いるポリメラーゼ連鎖反応において用いられる。特定の応用法のためにプライマーの長さおよび配列を選択するための手引きは、参照によって組み込まれる以下の参考文献によって証明されるように、当業者らに対してよく知られている:ディーフェンバハ(Dieffenbach)編、PCRプライマー:実験マニュアル(PCR Primer:A Laboratory Manual)、第2版(コールドスプリングハーバー出版局(Cold Spring Harbor Press)、ニューヨーク、2003年)。
「クオリティースコア」は、特定の配列位置での塩基割り当てが正確である確率についての測定値を意味する。様々な方法は、様々なシークエンシング化学、検出系、ベースコールアルゴリズムなどの結果としてコールされた塩基についてなどの、特定の状況についてクオリティースコアを計算するために、当業者らによく知られている。一般に、クオリティースコア値は、正確なベースコールの確率に単調に関係する。たとえば、10のクオリティースコアまたはQは、塩基が正確にコールされるという見込みが90パーセントあることを意味してもよく、20のQは、塩基が正確にコールされるという見込みが99パーセントあることを意味してもよい、などである。いくつかのシークエンシングプラットフォーム、特に、合成時解読化学を使用するものについて、平均クオリティースコアは、配列リード長に応じて減少し、配列リードの初めのクオリティースコアは、配列リードの末端部よりも高く、そのような減少は、不完全な伸長、キャリーフォワード(carry
forward)伸長、鋳型の損失、ポリメラーゼの損失、キャッピングの失敗、脱保護の失敗、およびその他同種のものなどの現象による。
「配列リード」は、シークエンシング技術によって生成された配列またはデータのストリームから決定されるヌクレオチドの配列を意味し、この決定は、たとえばその技術と関連するベースコールソフトウェア、たとえばDNAシークエンシングプラットフォームの民間のプロバイダーのベースコールソフトウェアによってなされる。配列リードは、通常、配列におけるそれぞれのヌクレオチドについてのクオリティースコアを含む。典型的に、配列リードは、たとえばDNAポリメラーゼまたはDNAリガーゼにより鋳型核酸に沿ってプライマーを伸長させることによって生成される。データは、そのような伸長と関連する、光学的、化学的(たとえばpHの変化)、または電気的シグナルなどのシグナルを
記録することによって生成される。そのような最初のデータは、配列リードに変換される。
「配列タグ」(もしくは「タグ」)または「バーコード」は、ポリヌクレオチドまたは鋳型分子に付加され反応または一連の反応においてポリヌクレオチドまたは鋳型を同定するおよび/または追跡するために使用されるオリゴヌクレオチドを意味する。配列タグは、ポリヌクレオチドもしくは鋳型の3’末端部もしくは5’末端部に付加されても、「タグつきポリヌクレオチド」もしくは「タグつき鋳型」もしくは「タグつきポリヌクレオチドコンジュゲート」、「タグ−分子コンジュゲート」、またはその他同種のものと本明細書において呼ばれることもある直鎖コンジュゲートを形成するためにそのようなポリヌクレオチドもしくは鋳型の内部に挿入されてもよい。配列タグは、サイズおよび組成が広く変動してもよく、参照によって本明細書において組み込まれる以下の参考文献は、特定の実施形態について適切な配列タグのセットを選択するための手引きを提供する:ブレナー(Brenner)、米国特許第5,635,400号明細書;ブレナー(Brenner)およびマチェビッツ(Macevicz)、米国特許第7,537,897号明細書;ブレナー(Brenner)ら、米国科学アカデミー紀要(Proc.Natl.Acad.Sci.)、第97巻:p.1665〜1670(2000年);チャーチ(Church)ら、欧州特許出願公開第0 303 459号明細書;シューメーカー(Shoemaker)ら、ネイチャー遺伝学(Nature Genetics)、第14巻:p.450〜456(1996年);モーリス(Morris)ら、欧州特許出願公開第0799897A1号明細書;ウォレス(Wallace)、米国特許第5,981,179号明細書など。配列タグの長さおよび組成は、広く変動し得、特定の長さおよび/または組成の選択は、限定を伴うことなく、たとえばハイブリダイゼーション反応を介してまたはシークエンシングなどの酵素反応を介して、タグが読み取り値を生成するためにどのように使用されるか;それらが、たとえば蛍光色素またはその他同種のものにより標識されるかどうか;ポリヌクレオチドのセットを明確に同定するために必要とされる識別が可能なオリゴヌクレオチドタグの数およびその他同種のもの、ならびに信頼できる同定、たとえばクロスハイブリダイゼーションまたはシークエンシングエラー由来の誤同定がないことを保証するためにセットのタグがどれくらい異ならなければならないか、を含むいくつかの因子に依存する。一態様において、配列タグが、それぞれ、2〜36ヌクレオチドまたは4〜30ヌクレオチドまたは8〜20ヌクレオチドまたは6〜10ヌクレオチドの範囲内の長さをそれぞれ有する。一態様において、セットのそれぞれの配列タグが、少なくとも2つの塩基、同じセットのすべての他のタグと異なるユニークなヌクレオチド配列を有する配列タグのセットが、使用され、他の態様において、セットのそれぞれのタグの配列が、少なくとも3塩基、同じセットのすべての他のタグと異なる配列タグのセットが、使用される。
「配列木」は、ヌクレオチド配列を示すための木データ構造を意味する。一態様において、本発明の木データ構造が、循環または循環経路を含まないノードおよびエッジを含む根付き有向木である。本発明の木データ構造のノードからエッジは、通常順序づけられる。ノードおよび/またはエッジは、値を含有してもそれと関連してもよい構造である。木におけるそれぞれのノードは、0以上の子ノードを有し、慣例により、木においてその下に示される。子を有するノードは、子の親ノードと呼ばれる。ノードは、多くても1つの親を有する。いかなる子も有していないノードは、葉ノードと呼ばれる。木における一番上のノードは、根ノードと呼ばれる。一番上のノードである場合、根ノードは、親を有さないであろう。それは、木に対する操作が一般に始まるノードである(いくつかのアルゴリズムは葉ノードから始まり、根で終了に達する)。エッジまたはリンクに従ってそれから他のすべてのノードに到達することができる。
「縦列型反復配列」または「STR」または「マイクロサテライト」は、短い(たとえ
ば1〜5ヌクレオチド)、縦列に反復する配列モチーフを含む遺伝子マーカを指す。マイクロサテライトは、リピートモチーフ散在(repeat−motif interspersion)または「不可解な単純配列(cryptically simple sequence)」を含有してもよい(タウツ,D.(Tautz,D.)ら(1986年)ネイチャー(Nature)第322巻(6080):p.652〜656)。そのようなリピートモチーフ散在は、マイクロサテライトが、縦列に反復する配列モチーフと同じ長さを有するが、異なるリピート配列を有する1つ以上の散在したリピートを含有する、単純なリピートモチーフ散在を含む(アイヒラー,E.E.(Eichler,E.E.)ら(1994年)ネイチャージェネティクス(Nat.Genet.)第8巻:p.88〜94;アイヒラー,E.E.(Eichler,E.E.)(1996年)ヒト分子遺伝学(Hum.Mol.Genet.)第5巻:p.319〜330)。たとえば、縦列に反復する配列モチーフがTGCCである場合、単純なリピートモチーフ散在は、以下のように現われてもよく:TGCC(TCTG)(TGCC)、散在したリピート「TCTG」は、TGCC縦列反復配列モチーフのリピートを中断する。リピートモチーフ散在はまた、より複雑なリピートモチーフ散在を含み、リピートモチーフ散在は、縦列反復配列モチーフと同じ長さをしていない。たとえば、縦列反復配列モチーフが、TGCCである場合、複雑なリピートモチーフ散在は、以下のように現われてもよく:<$1
HIL>TGC(TGCC)縦列反復配列モチーフは、TGおよびTGCによって中断される。他のより複雑なリピートモチーフ散在は、同じマイクロサテライトにおける単純なリピートモチーフ散在および複雑なリピートモチーフ散在の組み合わせを含む。たとえば、そのような複雑な配列リピートモチーフ散在は、以下のように現われてもよく:(TGCC)(TCTG)(TGCC)TG(TGCC)TGC(TGCC)TGCCC(TGCC)、散在したリピートの両方の形態が、縦列に反復する配列モチーフ、TGCCを中断する。散在したリピートを有するおよび有していないマイクロサテライトは、本明細書において使用される用語「マイクロサテライト」または「STR」によって包含される。

Claims (22)

  1. 微小残存病変についてモニターされている患者においてキャリーオーバ混入を決定するための方法であって、
    以下の(i)−(v)のステップにより前記患者のクロノタイププロファイルを定期的に測定することによって、微小残存病変について前記患者をモニターするステップ:
    (i)T細胞およびB細胞の少なくとも一方を含む、個人由来のサンプルを得るステップ、
    (ii)タグ−分子コンジュゲートを形成するために、T細胞受容体遺伝子または前記T細胞およびB細胞の少なくとも一方の免疫グロブリン遺伝子の再構成核酸の分子に対して配列タグを付加するステップであって、前記タグ−分子コンジュゲートの実質的にすべての分子が、ユニークな配列タグを有するステップ、
    (iii)前記タグ−分子コンジュゲートを増幅するステップ、
    (iv)前記タグ−分子コンジュゲートをシークエンシングするステップ、
    (v)同等の配列タグによってアライメントされた配列リードからクロノタイプを決定するとともに、そのようなクロノタイプからクロノタイププロファイルを生成するステップ;ならびに
    クロノタイププロファイルのそれぞれの測定についての配列タグのヌクレオチド配列を記録するステップ;ならびに
    任意の前のクロノタイププロファイル由来の配列タグの存在、不在、およびレベルの少なくとも1つによって、次のクロノタイププロファイルにおいてキャリーオーバ混入を決定するステップ
    を含む、方法。
  2. アライメントする前記ステップが、前記同等の配列タグの前記クロノタイプのそれぞれのヌクレオチドポジションでの大多数のヌクレオチドを決定することによって、前記タグ−分子コンジュゲートのそれぞれの前記クロノタイプのそれぞれのヌクレオチド配列を決定するステップをさらに含む、請求項1に記載の方法。
  3. 前記付加するステップが、再構成核酸の前記分子をサンプリングすることによって標識するステップを含む、請求項1に記載の方法。
  4. 前記付加するステップが、再構成核酸の前記分子の少なくとも100倍の濃度で前記配列タグが存在するような反応混合物中で実行される、請求項3に記載の方法。
  5. 前記配列タグが、再構成核酸の前記分子に特異的なプライマーの中に組み込まれる、請求項4に記載の方法。
  6. 前記クロノタイプが、それぞれ、免疫受容体または免疫受容体構成成分のセグメントをコードする25〜400ヌクレオチド配列であり、前記免疫受容体または免疫受容体構成成分は、IgHのVDJ再編成、IgHのDJ再編成、IgKのVJ再編成、IgLのVJ再編成、TCRβのVDJ再編成、TCRβのDJ再編成、TCRαのVJ再編成、TCRγのVJ再編成、TCRδのVDJ再編成、およびTCRδのVD再編成からなる群から選択される、請求項1に記載の方法。
  7. 個人のT細胞およびB細胞の少なくとも一方を含む組織サンプルのクロノタイププロファイルにおいて混入のレベルを決定するための方法であって、
    個人由来の組織サンプルを得るステップであって、前記組織サンプルが、前記個人由来の核酸および場合により1人以上の他の個人由来の核酸を含み、前記核酸が、T細胞およびB細胞の少なくとも一方由来の再構成核酸、ならびに非再構成核酸を含むステップ、
    前記組織サンプルの核酸からクロノタイププロファイルを生成するステップ、
    遺伝子マーカからの前記個人および前記1人以上の他の個人の遺伝子同定に基づいて、前記1人以上の他の個人および前記個人由来の核酸の割合を得るために、前記組織サンプル由来の前記核酸の1つ以上の遺伝子座の前記遺伝子マーカをシークエンシングするステップであって、前記遺伝子マーカが、前記再構成核酸および前記非再構成核酸の両方にある遺伝子座に存在するステップ、ならびに
    前記クロノタイププロファイルにおける混入核酸のレベルを、前記組織サンプルの前記核酸中に存在する前記1人以上の他の個人由来の核酸の割合として決定するステップ、
    を含む方法。
  8. 前記割合が、前記個人を同定する1つ以上の前記遺伝子マーカの配列リードおよび前記1人以上の他の個人の1つ以上の前記遺伝子マーカの配列リードの数から決定される、請求項7に記載の方法。
  9. 最も大きな数の配列リードを有する遺伝子座の前記遺伝子マーカが、前記個人と同定され、それぞれの遺伝子座の残りの遺伝子マーカが、前記1人以上の他の個人由来の核酸と同定される、請求項7に記載の方法。
  10. 混入の前記レベルが、他の座で前記個人と同定された遺伝子マーカの配列リードの最も小さな数によって割った、ある座での相互混入核酸と同定された遺伝子マーカの配列リードの最も大きな数に対して比例する、請求項9に記載の方法。
  11. 前記組織サンプルにおける前記核酸の総量を測定するステップ、
    前記組織サンプルにおける前記再構成核酸の総量を測定するステップ、
    前記個人由来のおよび前記1人以上の他の個人由来の前記非再構成核酸の割合を得るために、前記非再構成核酸において存在し、前記再構成核酸に存在しない、核酸の削除可能なセグメントにおける1つ以上の遺伝子座の遺伝子マーカをシークエンシングするステップ、ならびに
    前記組織サンプルの前記核酸における混入再構成核酸のレベルから、前記クロノタイププロファイルにおける前記混入核酸レベルを決定するステップであって、前記混入再構成核酸のレベルが、核酸の総量、前記再構成核酸の総量、前記個人および前記1人以上の他の個人由来の前記核酸の前記割合、ならびに前記個人および前記1人以上の他の個人の前記非再構成核酸の割合から決定されるステップ、
    をさらに含む、請求項7に記載の方法。
  12. 前記削除可能なセグメントが、V(D)J組換えの間に削除される核酸のセグメントである、請求項11に記載の方法。
  13. 前記核酸が、ヒトB細胞由来の再構成核酸を含み、前記削除可能なセグメントが、染色体14上のD領域コード遺伝子とV領域コード遺伝子との間の領域を含む、請求項12に記載の方法。
  14. 前記核酸が、ヒトT細胞由来の再構成核酸を含み、前記削除可能なセグメントが、染色体11上のD領域コード遺伝子とV領域コード遺伝子との間の領域を含む、請求項12に記載の方法。
  15. 前記核酸の前記総量を測定する前記ステップが、前記核酸の共通セグメントの数を1つ以上の内部標準の数と比較することができるように、全核酸についての1つ以上の内部標準の既知量を前記組織サンプル由来の前記核酸と組み合わせるステップを含む、請求項11に記載の方法。
  16. 前記共通セグメントが、GAPDH、β−ミクログロブリン、18SリボソームRNA、およびβ−アクチンからなる群から選択される遺伝子の一部分を含む、請求項15に記載の方法。
  17. 前記核酸の前記総量を測定する前記ステップが、前記クロノタイププロファイルのクロノタイプの数を、再構成核酸についての1つ以上の内部標準の数と比較することができるように、再構成核酸についての1つ以上の内部標準の既知量を前記組織サンプル由来の前記核酸と組み合わせるステップを含む、請求項11に記載の方法。
  18. 前記クロノタイプのそれぞれが、V(D)Jコード領域の一部分の配列を含み、前記測定するステップが、PCRにおいて、同一セットのプライマーを使用して、前記組織サンプル由来の前記核酸および再構成核酸についての前記1つ以上の内部標準を増幅するステップを含む、請求項17に記載の方法。
  19. 前記組織サンプルにおける前記核酸の総量を測定するステップ、
    前記組織サンプルにおける前記再構成核酸の総量を測定するステップ、
    前記組織サンプルにおける前記非再構成核酸の総量を測定するステップ、ならびに
    前記組織サンプルの前記核酸における混入再構成核酸のレベルから、前記クロノタイププロファイルにおける前記混入核酸レベルを決定するステップであって、前記混入再構成核酸のレベルが、核酸の総量、前記再構成核酸の総量、前記個人および前記1人以上の他の個人由来の前記核酸の前記割合、ならびに前記再構成核酸の総量から決定されるステップ、
    をさらに含む、請求項7に記載の方法。
  20. 前記非再構成核酸の前記総量が、非再構成核酸において存在し、再構成核酸において存在しない削除可能なセグメントの数を前記1つ以上の内部標準の数と比較することができるように、非再構成核酸についての1つ以上の内部標準の既知量を前記組織サンプル由来の前記核酸と組み合わせることを含む、請求項19に記載の方法。
  21. 前記核酸が、ヒトB細胞由来の再構成核酸を含み、前記削除可能なセグメントが、染色体14上のD領域コード遺伝子とV領域コード遺伝子との間の領域を含む、請求項20に記載の方法。
  22. 前記核酸が、ヒトT細胞由来の再構成核酸を含み、前記削除可能なセグメントが、染色体11上のD領域コード遺伝子とV領域コード遺伝子との間の領域を含む、請求項20に記載の方法。
JP2015505861A 2012-04-13 2013-04-09 免疫レパートリ分析におけるサンプル混入の検出および定量化 Pending JP2015512655A (ja)

Applications Claiming Priority (13)

Application Number Priority Date Filing Date Title
US201261624002P 2012-04-13 2012-04-13
US61/624,002 2012-04-13
US201261658317P 2012-06-11 2012-06-11
US61/658,317 2012-06-11
US201261738277P 2012-12-17 2012-12-17
US61/738,277 2012-12-17
US201361768269P 2013-02-22 2013-02-22
US61/768,269 2013-02-22
US13/834,794 US9528160B2 (en) 2008-11-07 2013-03-15 Rare clonotypes and uses thereof
US13/834,794 2013-03-15
US13/835,093 2013-03-15
US13/835,093 US9506119B2 (en) 2008-11-07 2013-03-15 Method of sequence determination using sequence tags
PCT/US2013/035857 WO2013155119A1 (en) 2012-04-13 2013-04-09 Detection and quantitation of sample contamination in immune repertoire analysis

Publications (1)

Publication Number Publication Date
JP2015512655A true JP2015512655A (ja) 2015-04-30

Family

ID=49328112

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015505861A Pending JP2015512655A (ja) 2012-04-13 2013-04-09 免疫レパートリ分析におけるサンプル混入の検出および定量化

Country Status (7)

Country Link
EP (1) EP2836611A4 (ja)
JP (1) JP2015512655A (ja)
CN (1) CN104395481A (ja)
AU (1) AU2013246050B2 (ja)
CA (1) CA2869481A1 (ja)
SG (1) SG11201406538VA (ja)
WO (1) WO2013155119A1 (ja)

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2364368B1 (en) 2008-11-07 2014-01-15 Sequenta, Inc. Methods of monitoring conditions by sequence analysis
US8748103B2 (en) 2008-11-07 2014-06-10 Sequenta, Inc. Monitoring health and disease status using clonotype profiles
US9528160B2 (en) 2008-11-07 2016-12-27 Adaptive Biotechnolgies Corp. Rare clonotypes and uses thereof
US9394567B2 (en) 2008-11-07 2016-07-19 Adaptive Biotechnologies Corporation Detection and quantification of sample contamination in immune repertoire analysis
US9506119B2 (en) 2008-11-07 2016-11-29 Adaptive Biotechnologies Corp. Method of sequence determination using sequence tags
US8628927B2 (en) 2008-11-07 2014-01-14 Sequenta, Inc. Monitoring health and disease status using clonotype profiles
US9365901B2 (en) 2008-11-07 2016-06-14 Adaptive Biotechnologies Corp. Monitoring immunoglobulin heavy chain evolution in B-cell acute lymphoblastic leukemia
DK2387627T3 (en) 2009-01-15 2016-07-04 Adaptive Biotechnologies Corp Adaptive immunity profiling and methods for producing monoclonal antibodies
EP2446052B1 (en) 2009-06-25 2018-08-08 Fred Hutchinson Cancer Research Center Method of measuring adaptive immunity
US9043160B1 (en) 2009-11-09 2015-05-26 Sequenta, Inc. Method of determining clonotypes and clonotype profiles
GB201106254D0 (en) 2011-04-13 2011-05-25 Frisen Jonas Method and product
US10385475B2 (en) 2011-09-12 2019-08-20 Adaptive Biotechnologies Corp. Random array sequencing of low-complexity libraries
US9279159B2 (en) 2011-10-21 2016-03-08 Adaptive Biotechnologies Corporation Quantification of adaptive immune cell genomes in a complex mixture of cells
CA2858070C (en) 2011-12-09 2018-07-10 Adaptive Biotechnologies Corporation Diagnosis of lymphoid malignancies and minimal residual disease detection
US9499865B2 (en) 2011-12-13 2016-11-22 Adaptive Biotechnologies Corp. Detection and measurement of tissue-infiltrating lymphocytes
DK2823060T3 (en) 2012-03-05 2018-05-28 Adaptive Biotechnologies Corp Determination of associated immune receptor chains from frequency-matched subunits
ES2582554T3 (es) 2012-05-08 2016-09-13 Adaptive Biotechnologies Corporation Composiciones y método para medir y calibrar el sesgo de la amplificación en reacciones de PCR multiplexadas
DK2904111T3 (en) 2012-10-01 2018-03-12 Adaptive Biotechnologies Corp Immune competence evaluation of adaptive immune receptor diversity and clonality characterization
US9879313B2 (en) 2013-06-25 2018-01-30 Prognosys Biosciences, Inc. Methods and systems for determining spatial patterns of biological targets in a sample
US9708657B2 (en) * 2013-07-01 2017-07-18 Adaptive Biotechnologies Corp. Method for generating clonotype profiles using sequence tags
AU2015227054A1 (en) 2014-03-05 2016-09-22 Adaptive Biotechnologies Corporation Methods using randomer-containing synthetic molecules
US10066265B2 (en) 2014-04-01 2018-09-04 Adaptive Biotechnologies Corp. Determining antigen-specific t-cells
EP3132059B1 (en) 2014-04-17 2020-01-08 Adaptive Biotechnologies Corporation Quantification of adaptive immune cell genomes in a complex mixture of cells
ES2784343T3 (es) 2014-10-29 2020-09-24 Adaptive Biotechnologies Corp Detección simultánea altamente multiplexada de ácidos nucleicos que codifican heterodímeros de receptores inmunes adaptativos emparejados de muchas muestras
US10246701B2 (en) 2014-11-14 2019-04-02 Adaptive Biotechnologies Corp. Multiplexed digital quantitation of rearranged lymphoid receptors in a complex mixture
AU2015353581A1 (en) 2014-11-25 2017-06-15 Adaptive Biotechnologies Corporation Characterization of adaptive immune response to vaccination or infection using immune repertoire sequencing
EP3262196B1 (en) 2015-02-24 2020-12-09 Adaptive Biotechnologies Corp. Method for determining hla status using immune repertoire sequencing
EP3277294B1 (en) 2015-04-01 2024-05-15 Adaptive Biotechnologies Corp. Method of identifying human compatible t cell receptors specific for an antigenic target
EP4119677B1 (en) 2015-04-10 2023-06-28 Spatial Transcriptomics AB Spatially distinguished, multiplex nucleic acid analysis of biological specimens
CN105095687B (zh) * 2015-06-26 2018-10-26 南方科技大学 一种免疫组库数据分析方法及终端
EP4282979A3 (en) * 2015-09-01 2024-02-28 The Regents of the University of California Modular polypeptide libraries and methods of making and using same
WO2017079593A1 (en) * 2015-11-04 2017-05-11 Atreca, Inc. Combinatorial sets of nucleic acid barcodes for analysis of nucleic acids associated with single cells
CN105740650B (zh) * 2016-03-02 2019-04-05 广西作物遗传改良生物技术重点开放实验室 一种快速准确鉴定高通量基因组数据污染源的方法
US10428325B1 (en) 2016-09-21 2019-10-01 Adaptive Biotechnologies Corporation Identification of antigen-specific B cell receptors
EP3676399B1 (en) 2017-09-01 2022-05-11 Life Technologies Corporation Compositions and methods for immune repertoire sequencing
US11254980B1 (en) 2017-11-29 2022-02-22 Adaptive Biotechnologies Corporation Methods of profiling targeted polynucleotides while mitigating sequencing depth requirements
JP2022501005A (ja) * 2018-09-26 2022-01-06 ザ ユニバーシティ オブ ノース カロライナ アット チャペル ヒルThe University Of North Carolina At Chapel Hill アッセイを改善する為の化合物、組成物、及び方法
JP2022515002A (ja) * 2018-12-17 2022-02-17 イルミナ インコーポレイテッド 配列決定用ライブラリーを調製するための方法および手段
WO2020243579A1 (en) 2019-05-30 2020-12-03 10X Genomics, Inc. Methods of detecting spatial heterogeneity of a biological sample
CN110970091B (zh) * 2019-12-20 2023-05-23 北京优迅医学检验实验室有限公司 标签质控的方法及装置
CN111304309A (zh) * 2020-03-06 2020-06-19 上海韦翰斯生物医药科技有限公司 一种测序平台标签序列污染的检测方法
CN116249785A (zh) 2020-06-02 2023-06-09 10X基因组学有限公司 用于抗原-受体的空间转录组学
AU2021283174A1 (en) 2020-06-02 2023-01-05 10X Genomics, Inc. Nucleic acid library methods
EP4162074B1 (en) 2020-06-08 2024-04-24 10X Genomics, Inc. Methods of determining a surgical margin and methods of use thereof

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU753732B2 (en) * 1997-10-23 2002-10-24 Genzyme Corporation Methods for detecting contamination in molecular diagnostics using PCR
EP1598429A1 (en) * 2004-05-19 2005-11-23 Amplion Ltd. Detection of amplicon contamination during PCR exhibiting two different annealing temperatures
US7537897B2 (en) * 2006-01-23 2009-05-26 Population Genetics Technologies, Ltd. Molecular counting
ES2546848T3 (es) * 2006-03-10 2015-09-29 Epigenomics Ag Un método para identificar una muestra biológica para el análisis de la metilación
EP2364368B1 (en) * 2008-11-07 2014-01-15 Sequenta, Inc. Methods of monitoring conditions by sequence analysis
US8748103B2 (en) * 2008-11-07 2014-06-10 Sequenta, Inc. Monitoring health and disease status using clonotype profiles
ES2593614T3 (es) * 2010-05-06 2016-12-12 Adaptive Biotechnologies Corporation Monitorización de estados de salud y enfermedad usando perfiles de clonotipos
ES2615733T3 (es) * 2010-12-16 2017-06-08 Gigagen, Inc. Métodos para el análisis masivo paralelo de ácidos nucleicos en células individuales

Also Published As

Publication number Publication date
AU2013246050B2 (en) 2017-03-16
AU2013246050A1 (en) 2014-10-23
SG11201406538VA (en) 2014-11-27
CN104395481A (zh) 2015-03-04
EP2836611A1 (en) 2015-02-18
WO2013155119A1 (en) 2013-10-17
EP2836611A4 (en) 2015-12-30
CA2869481A1 (en) 2013-10-17

Similar Documents

Publication Publication Date Title
AU2013246050B2 (en) Detection and quantitation of sample contamination in immune repertoire analysis
AU2020210279B2 (en) Large-scale biomolecular analysis with sequence tags
US9394567B2 (en) Detection and quantification of sample contamination in immune repertoire analysis
JP6343563B2 (ja) 組織浸潤リンパ球の検出および測定方法
US9506119B2 (en) Method of sequence determination using sequence tags
JP6085249B2 (ja) 複雑なアンプリコンの配列解析
JP6513035B2 (ja) 希少クロノタイプおよびその用途
JP2015519081A (ja) 配列タグを用いた配列決定法
JP2015504661A (ja) 免疫レパートリー解析による、濾胞性リンパ腫からびまん性大細胞型b細胞リンパ腫への形質転換のモニタリング

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150107

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20151202

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20151117

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160222

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20160222