JP2013531983A

JP2013531983A - 多重生物検出のための核酸ならびにその使用および製造方法

Info

Publication number: JP2013531983A
Application number: JP2013514408A
Authority: JP
Inventors: ダイアモンド，リサ; クム，ヨッヒェン; ロルフ，フィリップ，アレクサンダー
Original assignee: Pathogenica inc
Current assignee: Pathogenica inc
Priority date: 2010-06-11
Filing date: 2011-06-10
Publication date: 2013-08-15
Also published as: US20130261196A1; AU2011265205A1; EP2580354A2; SG186987A1; WO2011156795A3; WO2011156795A2; EP2580354A4

Abstract

本発明は、複数の標的生物から１つまたは複数の対象の配列を大量に多重捕獲することができる環状化「捕獲」プローブを含む線状核酸プローブの混合物を提供する。本発明によって提供される方法は、一般的な病原体などの１つまたは複数の対象の生物の迅速、正確、かつ経済的な検出を可能にする。
【選択図】図２５

Description

本発明は、病原体を含む対象の生物を多重検出するための核酸プローブのセットと、本プローブの製造および使用方法とに関する。

配列決定技術の進歩は、塩基配列決定コストにおける急激な低下を促進し続けている。しかしながら、Ｕ．Ｓ．ＮａｔｉｏｎａｌＨｕｍａｎＧｅｎｏｍｅＲｅｓｅａｒｃｈＩｎｓｔｉｔｕｔｅ（ＮＨＧＲＩ）によって提案された＄１，０００のパーソナルゲノム基準は、依然として捉えどころのないままである。さらに、患者の完全なゲノムでも、患者の現在の病状（進行中の感染など）への洞察をほとんどあるいは全く提供しない。そして、感染症は、ウイルス、細菌、古細菌、真菌、およびその他の真核生物（単細胞および多細胞の両方）を含む様々な種類の病原体によって発生され得るが、その多くは多大な苦労がなければ培養できないか、あるいは全く培養することができず、適切な臨床的介入の検出および選択が妨げられる。

患者のミクロビオーム（患者の中および上に存在する全ての微生物の集合（例えば、ＦｒｉｅｄｒｉｃｈＭＪ、ＪＡＭＡ３００（７）：７７７−８（２００８）を参照））は、患者の現在の病状を明らかにすると共に、介護者がその将来の疾患、感染、または臨床的合併症のリスクを予測するのに役立つことができる。しかしながら、人体の単一の微小環境においても観察され得る微生物多様性によって明示されるように、ミクロビオームは極めて複雑である。例えば、Ｈｙｍａｎｅｔａｌ．，ＰＮＡＳ１０２（２２）：７９５２−７（２００５）（ヒト膣上皮における微生物多様性を研究）を参照されたい。生物検出のために現存するモダリティは、通常、高価で時間のかかる単一病原体アッセイに限定されるので、患者サンプルなどの複雑なサンプル中の生物を検出するのにはあまり適していない。

さらに、病原体検出のための核酸プローブを設計するための現存のプラットフォームは、ＤＮＡの単一の短い領域（数百または数千の塩基長）を入力として必要とする。従って、これらのプラットフォームは、生物を検出および区別するために１６ＳリボソームＤＮＡ領域などの非常に限られたゲノム領域の選択を提供し、従って、最も広い可能な配列の範囲から最適なプライマー候補を同定することができない。加えて、現存の試験は、多くの場合、単一の標的病原体の単一の標的座位だけを調べることに基づいているので、これらの試験は、多くの場合、特定の生物の密接に関連した種または株の変異体（これらの病原性、抗生物質に対する感受性、または毒素の産生（介護者の決定に著しく影響を与える因子）はかなり異なり得る）を区別することができない。

現存のアッセイが複雑なサンプル混合物中の対象の生物を検出することの難しさと、プライマー設計のための現存のプラットフォームが最も広い可能な配列の範囲から最適なプライマー候補を同定できないこととを考慮すると、培養を必要とせずに複雑な混合物中の複数の生物を検出する迅速な多重アッセイに対する必要性が存在する。

本発明の実施形態は、培養を必要とすることなく当業者が複雑な混合物中の複数の生物を同時に検出できるようにする最適化核酸プローブ、ならびにその製造および使用方法を含む。本発明は、少なくとも部分的に、全ゲノムなどの大きいクエリー配列のセットから配列を迅速に同定することができるプロセスの発見に基づく。配列は、従来の診断法と比較してアッセイ時間およびコストを著しく削減する多重診断アッセイにおいて使用することができる。本発明の核酸および方法は、当業者が感染性病原体の種を同定し、さらに例えば抗生物質耐性に関連する領域の配列に基づいて密接に関連した株を区別することもできるようにする。

本発明の方法のさらなる利点は、例えば、宿主遺伝子型同定のために、感染性病原体の検出と並行して特異的な宿主座位を調べる能力である。有利に、本発明の方法は、さらに多重化され、集中研究室、病院、および／または診断施設による多数のサンプルのハイスループット処理のためにマイクロプレートなどの自動システムにおいて使用され得る。さらに、本発明の混合物および方法は、給水、食料品、および農業サンプルのモニタリングなどの様々な種類の付加的な用途において使用することができる。

従って、本発明の態様は、対象の領域を環状化捕獲（ｃｉｒｃｕｌａｒｉｚｉｎｇｃａｐｔｕｒｅ）することができる複数の核酸プローブを含む混合物を提供する。いくつかの実施形態では、混合物中のプローブはそれぞれ、少なくとも１つの標的生物の中のゲノム中の第１および第２の標的配列とそれぞれ特異的にハイブリッド形成する第１および第２の相同プローブ配列（骨格配列によって分離される）を含む。いくつかの実施形態では、第１および第２の相同プローブ配列は標的配列に対して相補的でないが、標的核酸、例えば、ｍｉｃｒｏＲＮＡの５’および３’末端に連結し、リン酸化またはアデニル化５’末端および遊離３’ヒドロキシル基などの核酸連結酵素との適合性のための適切な化学基を有する。いくつかの実施形態では、第１および第２の標的配列は、少なくとも２つのヌクレオチドの対象の領域によって分離される。特定の実施形態では、これらは、少なくとも５、６、７、８、９、１０、１２、１４、１８、２０、２５、３０、５０、７５、１００、１５０、２００、３００、４００、６００、１２００、１５００、２５００、またはそれ以上のヌクレオチドによって分離される。いくつかの実施形態では、第１および第２の標的配列は、５、６、７、８、９、１０、１２、１４、１８、２０、２５、３０、５０、７５、１００、１５０、２００、３００、４００、６００、１２００、１５００、または２５００以下のヌクレオチドによって分離される。

いくつかの実施形態では、混合物中の相同プローブ配列は、そのそれぞれの標的生物のゲノム中の標的配列と特異的にハイブリッド形成するが、所定の配列決定された生物セット（排除セット）のゲノム中のいかなる配列とも特異的にハイブリッド形成しない。捕獲標的と直接ハイブリッド形成しないプローブに関する実施形態では、「相同プローブ配列」は、特に、定義されたゲノムセット、すなわち排除セット内のいかなる配列とも実質的にハイブリッド形成しないように設計される。被験者からの生物サンプルの場合、排除セットは、宿主のゲノムを含む。特定の実施形態では、排除セットは、複数のウイルス、真核生物、原核生物、および古細菌のゲノムも含む。より特定の実施形態では、排除セット中の複数のウイルス、真核生物、原核生物、および古細菌のゲノムは、共生、非毒性（ｎｏｎ−ｖｉｒｕｌｅｎｔ）、または非病原性の生物からの配列決定されたゲノムを含んでいてもよい。さらにより特定の実施形態では、混合物中の全てのプローブに対する排除セットは、例えば、宿主ゲノムおよび共生、非毒性、または非病原性の生物を含む、配列決定されたゲノムの共通のサブセットを共有する。一般に、混合物中の各プローブが、混合物中のいかなる他のプローブの標的配列とも特異的にハイブリッド形成しないように、排除セットは混合物のプローブ間で異なる。

１つの態様では、本発明は、相同プローブ配列をそれぞれが含む複数の核酸プローブを包含し、相同プローブ配列は、実質的に二次構造を有さず、単一ヌクレオチドの長いストリングを含有せず（例えば、７、６、５、４、３、または２未満の連続した同一塩基を有する）、少なくとも約８塩基（例えば、８、１０、１２、１４、１６、１８、２０、２２、２４、２５、２６、２７、２８、３０、または３２塩基の長さ）であり、そして５０〜７２℃の範囲のＴ_ｍ（例えば、約５３、５４、５５、５６、５７、５８、５９、６０、６１、または６２℃）を有する。いくつかの実施形態では、第１および第２の相同プローブ配列はほぼ同じ長さであり、同じＴ_ｍを有する。他の実施形態では、第１および第２の相同プローブ配列の長さおよびＴ_ｍは異なる。各プローブ中の相同プローブ配列は、標的生物のゲノムにおいて特定の閾値回数未満で発生する（例えば、２０、１０、５、４、３、または２回未満）ように選択されてもよい。

特定のプローブに対する標的生物は、任意の生物でよい。特定の実施形態では、ウイルス、細菌、真菌、古細菌、または真核生物（単細胞および多細胞真核生物を含む）であり得る。特定の実施形態では、標的生物は病原体である。

本発明の混合物は、例えば、１０、２０、３０、４０、５０、１００、２００、４００、５００、１０００、２０００、３０００、４０００、５０００、１００００、２００００、４００００、８００００またはそれ以上の多数のプローブを含むことができる。混合物は、多数の異なる標的生物、例えば、少なくとも１０、２０、４０、６０、８０、１００、１５０、２００、２５０、またはそれ以上の異なる標的生物に向けられた１つまたは複数のプローブを含むことができる。いくつかの実施形態では、複数の標的生物に対する１つまたは複数のプローブを含む混合物は、標的生物に対してただ１つのプローブを含有する。他の実施形態では、混合物は、標的生物に対して２つ以上のプローブ、例えば、標的生物に対して約２、３、４、５、６、７、８、９、または１０のプローブを含有する。患者の試験サンプルと共に使用するために設計された実施形態などの特定の実施形態では、混合物はさらに、宿主の遺伝子型同定などの用途のために、宿主ゲノムと特異的にハイブリッド形成する相同プローブ配列を有するプローブを含む。いくつかの実施形態では、本発明の混合物はさらにサンプル内部較正標準を含む。

本発明によって提供される混合物中のプローブの骨格配列は、検出可能な部分およびプライマー結合配列を含むことができる。いくつかの実施形態では、プローブの骨格配列は、第２のプライマーを含む。特定の実施形態では、検出可能な部分はバーコードである。特定の実施形態では、骨格はさらに、制限エンドヌクレアーゼ認識配列などの切断部位を含む。特定の実施形態では、骨格は、例えば、脱塩基フラン部分などを含む非ワトソン−クリックヌクレオチドを含有する。

別の態様では、本発明は、本発明によって提供されるプローブの混合物と、使用説明書とを含むキットを提供する。特定の実施形態では、キットは、サンプルを得るための試薬（例えば、スワブ）、および／またはＤＮＡを抽出するための試薬、および／または対象の領域を捕獲するための酵素（ポリメラーゼおよび／またはリガーゼなど）を含むこともできる。

別の態様では、本発明は、少なくとも１つの標的生物を含有する疑いがあるサンプルを本発明のプローブの混合物の何れかと接触させ、少なくとも１つの標的生物の対象の領域を捕獲（例えば、重合および／または連結によって）して環状化プローブを形成し、捕獲された対象の領域を検出し、それにより、１つまたは複数の標的生物の存在を検出することによって、１つまたは複数の標的生物の存在を検出するための方法を提供する。特定の実施形態では、捕獲された対象の領域は、複数の増幅産物を形成するために増幅され得る（例えば、ＰＣＲによって）。特定の実施形態では、サンプルは、対象の領域のプローブ環状化捕獲の後に線状核酸を除去するために、ヌクレアーゼにより処理される。いくつかの実施形態では、環状化プローブは、例えば、ヌクレアーゼ処理によって線状化される。他の実施形態では、環状化プローブ分子は、当該技術分野において既知の任意の手段によって、増幅されずに直接配列決定される。特定の実施形態では、環状化プローブは、分子のポリメラーゼ媒介性の伸長を刺激して、元の環状プローブの少なくとも１つ〜１００万またはそれ以上もの鎖状体化（ｃｏｎｃａｔｅｍｅｒｉｚｅｄ）コピーを含む、環状化プローブの配列に相補的な配列を生成するオリゴヌクレオチドによって接触される。特定の実施形態では、環状化プローブ分子は、二次捕獲オリゴヌクレオチド捕獲プローブによって、反応溶液から濃縮される。二次捕獲オリゴヌクレオチド捕獲プローブは、ビオチン分子などの捕獲されるように設計された部分と、環状化プローブの少なくとも６つのヌクレオチドとハイブリッド形成するように設計された核酸配列とを含むことができる。環状化プローブの少なくとも６つのヌクレオチドとハイブリッド形成するように設計された核酸配列は、ポリメラーゼ伸長捕獲産物の１、２、４、８、１６、３２またはそれ以上のヌクレオチドを含み得る。特定の実施形態では、プローブおよび／または捕獲された対象の領域は、ポリメラーゼ依存性配列決定（ジデオキシ配列決定、ピロシーケンス、および合成による配列決定を含む）またはリガーゼベースの配列決定（例えば、ポロニー配列決定）などの、当該技術分野において既知の任意の手段によって配列決定される。特定の実施形態では、サンプルは生物サンプルである。より特定の実施形態では、生物サンプルは、ヒトなどの哺乳類に由来する。

いくつかの実施形態では、１つまたは複数の標的生物の存在の検出方法は、例えば、１つまたは複数のグラフ表示を提供することによって医師の意思決定を容易にするために、結果をフォーマットするステップをさらに含む。

従って、別の態様では、本発明は、病原体に感染した疑いのある被験者の治療方法を提供し、本方法は、本発明の方法によって少なくとも１つの標的生物（例えば、病原体）を検出することと、検出された少なくとも１つの生物に基づいて適切な治療処置を施すこととを含む。

本発明のさらなる態様は、本発明によって提供されるプローブの混合物の製造方法を提供する。本方法は、基準ゲノムおよび排除ゲノムセットを提供することを含む。基準ゲノムの配列は、約１８〜５０ヌクレオチドのｎ−ｍｅｒストリングにスライスされる（インシリコで）。スライスされたｎ−ｍｅｒストリングは、重複（ｒｅｄｕｎｄａｎｔ）配列、二次構造を有する配列、反復配列（例えば、４つを超える連続した同一ヌクレオチドを有するストリング）、および所定範囲以外（例えば、５０〜７２℃以外）のＴ_ｍを有する配列を排除するようにスクリーニングされる。スクリーニングされたｎ−ｍｅｒは、さらに、ゲノムの排除セット内のゲノム中の配列と特異的にハイブリッド形成するｎ−ｍｅｒ（例えば、２５−ｍｅｒなどのｎ−ｍｅｒにおいてペアワイズアライメントが２０のうちの１９の一致を含有する場合）、あるいは、標的生物のゲノムにおいて指定の回数よりも多く発生するｎ−ｍｅｒを排除することによって、相同プローブ配列を同定するようにスクリーニングされる。特定の実施形態では、相同プローブ配列は、標的生物のゲノムにおいて１回だけ発生する。一本鎖ゲノムを有する標的生物の場合、相同プローブ配列は、標的生物のゲノムの補体において１回だけ発生し得る。標的生物の配列決定された変異体が利用可能である（例えば、同じ種、属、または血清型）１つの実施形態では、相同プローブ配列は、追加の配列決定された変異体のゲノムと特異的にハイブリッド形成するようにフィルタリングされ、関連生物をグループ化するプローブをもたらす。代替の実施形態では、相同プローブ配列は、配列決定された変異体のゲノム（例えば、配列決定された変異体は排除セットの一部である）と特異的にハイブリッド形成しないようにフィルタリングされ、関連生物を区別するプローブをもたらし得る。これらのフィルタプロセスは、特定の混合物によって検出される各標的生物に対して繰り返される。いくつかの実施形態では、候補相同プローブ配列は、混合物中の他のプローブと特異的にハイブリッド形成し得るものを排除するようにスクリーニングされる。

各標的生物に対して、相同プローブ配列は、例えば、特定のサイズの対象の領域を捕獲するように、あるいは特定の実施形態では、所定の対象の領域（薬物耐性、毒性、または毒素産生に関連する領域など）を捕獲するように、あるいは被験者の遺伝子型同定の場合には被験者のゲノム中の座位を捕獲するように設計されたプローブに結合される。対象の領域は、指示された人による入力、統計的方法、配列データマイニング、文献データマイニング、またはこれらの組み合わせによって定義され得る。

本発明のさらなる目的および利点は、一部は以下の記載において説明され、一部は記載から明らかであるか、あるいは本発明の実施によって分かるであろう。本発明の目的および利点は、特許請求の範囲において特に指摘される要素および組み合わせによって実現および達成されるであろう。

上記の一般的な記載および以下の詳細な記載がいずれも単に例示的および説明的なだけであって、特許請求されるように、本発明を限定するものでないことは理解されるべきである。

本明細書に組み込まれてその一部を構成する添付図面は本発明のいくつかの実施形態を示しており、記載と共に本発明の原理を説明するのに役立つ。

図１は、本発明によって提供される１つの例示的なプローブの概略図である。図２Ａ、図２Ｂ、および図２Ｃは、対象の領域を捕獲するための本明細書に記載されるようなプローブの３つの代替的な使用方法の略図である。図３は、本明細書に記載されるようなプローブを用いる、小さい核酸クローニングのための例示的な戦略を示す。図４は、ＰＣＲ増幅のために従来のプライマー対を用いる、本発明の特定の方法の図解である。図５は、治療および診断方法を含む、本発明によって提供される方法の例示的なフローチャートを示す。図６は、医師の意思決定を通知するようにフォーマットされた、可能性のあるアッセイ結果の説明的な表示である。図７は、プローブ設計のための方法の例示的な実施形態のフローチャートである。図８は、融解温度（Ｔ_ｍ）の関数として、二本鎖型で存在する相同プローブ配列の集団の割合のプロットを示す。図９は、特定の融解温度における読取りカウントによって決定されるように、プローブの効率に対する融解温度の効果を示す。図１０は、特定の融解温度における読取りカウントによって決定されるように、プローブの効率に対する融解温度の効果を示す。図１１は、特に、配列決定結果を処理、分析、および出力するための方法の例示的な実施形態のフローチャートである。図１２は、分析を実行し、配列決定データをフォーマットするためのシステムアーキテクチャの例示的な実施形態の略図である。図１３は、部分Ａおよび部分Ｂを含む図１３は、配列決定装置からの生ＦＡＳＴＱデータの処理および基準ゲノムに対する定量化のための例示的なワークフローを示す。図１４は、次世代配列決定読取りから得られた配列の例示的なアライメントを示す。図１５は、サンプル中の株を同定するための、基準株のデータベースに対する配列読取りアライメントの使用の概略図である。図１６は、次世代配列決定による正確な多型モデリングおよび検出の方法を示す。図１７は、３４６のプローブおよび高リスクＨＰＶ株のセット（ＨＰＶ１６、１８、３１、３３、３５、３９、４５、５１、５２、５６、５８、５９）を用いるＨＰＶ株検出のシミュレーションにおいて、どのＨＰＶプローブ（ｘ軸）がどのＨＰＶ株（ｙ軸）を検出するかのマトリックスを示す。白色領域は、対応する株を検出するプローブを示す。図１８は、標的ＨＰＶ株ゲノムに対する２０のＨＰＶプローブ群の標的マトリックスを示す。図１９は、２７の特異的ＨＰＶプローブのそれぞれによって同定されたＳＮＰの数およびタイプを示すように拡張された標的マトリックスを示す。図２０は、ＰＣＲ増幅されたＨＰＶプローブ環状化捕獲反応のアガロースゲルで分解されたサンプルを示す。図２１は、環状化捕獲反応産物および既知の細菌ゲノム配列のアライメントを示す。図２２は、ＰＣＲ増幅された細菌または細菌遺伝子検出プローブ環状化捕獲反応のアガロースゲルで分解されたサンプルを示す。図２３は、ＰＣＲ増幅された環状化プローブの観察されたＳａｎｇｅｒ配列決定読取りと、ゲノムのスタフィロコッカス・アウレウス（Ｓｔａｐｈｙｌｏｃｏｃｃｕｓａｕｒｅｕｓ）配列とのアライメントを示す。図２４は、５つの個々の分子反転プローブを用いてＲＮＡから逆転写されたｃＤＮＡの検出、ならびに通常のＳａｎｇｅｒ（Ｎ）または次世代配列決定（Ｔ、テールド（ｔａｉｌｅｄ）プライマー）（１９８、２５６、２９２、２９３、および４６２で示されるプローブ）のための増幅を示す。図２５は、４つの***症患者サンプルにおいてプローブにより検出された異なる感染性種の割合を示す。図２６は、種々の数の（ｉ）ＰＣＲサイクル、（ｉｉ）ギャップ充填および連結のための様々な長さの時間、ならびに（ｉｉｉ）様々なハイブリダイゼーション温度を用いて実施される比較的な環状化捕獲プロトコルを示す。

１．プローブ
本発明の１つの態様は、複雑なサンプル中の１つまたは複数の生物の高感度で迅速かつ非常に特異的な検出に適した環状化「捕獲」プローブの混合物を提供する。「プローブ」は、骨格配列によって分離された２つの相同プローブ配列を含む線状の非分枝ポリ核酸を指し、ここで、第１の相同プローブ配列は核酸の第１の末端にあり、第２の相同プローブ配列は核酸の第２の末端にあり、プローブは、少なくとも２ヌクレオチドの対象の領域を環状化捕獲することができる。「環状化捕獲」は、対象の領域に相補的な配列を取り込むことによって環状になるプローブを指す。単純な分子反転プローブ（ＭＩＰ）および関連の捕獲プローブなどの環状化プローブの基本的な設計原理は当該技術分野において知られており、例えば、Ｎｉｌｓｓｏｎｅｔａｌ．，Ｓｃｉｅｎｃｅ，２６５：２０８５−８８（１９９４）、Ｈａｒｄｅｎｂｏｌｅｔａｌ．，ＧｅｎｏｍｅＲｅｓ．，１５：２６９−７５（２００５）、Ａｋｈａｒａｓｅｔａｌ．，ＰＬＯＳＯｎｅ，９：ｅ９１５（２００７）、Ｐｏｒｅｃｃａｅｔａｌ．，ＮａｔｕｒｅＭｅｔｈｏｄｓ，４：９３１−３６（２００７）、Ｄｅｎｇｅｔａｌ．，Ｎａｔ．Ｂｉｏｔｅｃｈｎｏｌ．，２７（４）：３５３−６０（２００９）、米国特許第７，７００，３２３号明細書および同第６，８５８，４１２号明細書、ならびに国際公開第１９９９／０４９０７９号パンフレットおよび同第１９９５／０２２６２３号パンフレットに記載されている。

本発明の特定の態様は２つの相同プローブ配列を含むプローブを包含し、これらはそれぞれ、少なくとも２つのヌクレオチドを含む対象の領域に隣接する標的生物のゲノム中の異なる標的配列と特異的にハイブリッド形成し得る。プローブは、さらに、検出可能な部分およびプライマーを含有する骨格配列を、相同プローブ配列の間に含むことができる。通常、プローブの３’端部の相同プローブ配列は、Ｈ１（または伸長アーム）と呼ばれ、プローブの５’端部の相同プローブ配列は、Ｈ２（連結またはアンカーアーム）と呼ばれる。対象のゲノム中の標的部位とのハイブリダイゼーションの際、プローブ／標的二本鎖は、プローブにおける少なくとも２つのヌクレオチドのポリメラーゼ依存性取込み（伸長アームにおける）、および／またはプローブのリガーゼ依存性の環状化（ポリメラーゼ伸長プローブの環状化、または対象の領域に架かる連結ポリヌクレオチドの配列依存性連結のずれかによる）のために適切な基質である。

「捕獲反応」は、試験サンプルと接触される１つまたは複数のプローブが対象の領域の環状化捕獲を受けたプロセスを指し、プローブ中の第１および第２の相同プローブ配列は、プローブの第１の標的配列と第２の標的配列との間の対象の領域を捕獲するために、試験サンプル中のそのそれぞれの標的配列と特異的にハイブリッド形成されている。「捕獲反応産物」は、試験サンプルによる捕獲反応を完了することによって産生される核酸の混合物を指す。「増幅反応」は、捕獲反応産物を増幅するプロセスを指す。「増幅反応産物」は、捕獲反応産物による増幅反応を完了することによって産生される核酸の混合物を指す。

いくつかの実施形態では、第１および第２の相同プローブ配列は、標的配列に対して相補的でないが、標的核酸、例えば、小さいＲＮＡおよびｍｉｃｒｏＲＮＡの５’および３’末端に連結し、リン酸化またはアデニル化５’末端および遊離３’ヒドロキシル基などの核酸連結酵素との適合性のための適切な化学基を有する。小さい核酸クローニングのための例示的な戦略は図３に示される。いくつかの実施形態では、アデニル化５’端部および遊離３’−ＯＨを有するプローブは、一段階で、適合性の連結端部を含有する小さいＲＮＡ断片とほぼ同時に連結する（図３（ｉ））。さらなる実施形態では、プローブは、小さい標的核酸を二段階プロセスで捕獲することができ、アデニル化５’端部およびブロックされた３’端部（例えば、ジデオキシヌクレオチドブロック端部）を有するプローブが、標的の小さいＲＮＡと連結され得る（図３（ｉｉ）、（ｉｉ）の２つのプローブ図のうちの最初の図）。これは、誘導されるリボヌクレアーゼＨ２消化によって最初にプローブ内のＲＮＡ塩基を除去し、続いて、ここでは３’−ＯＨ−末端であるプローブを小さいＲＮＡにほぼ同時に連結させることによって起こり得る。代替の二段階プロセスでは、プローブは５’−アデニル化プローブ部位に連結され、次にプローブのブロックされた３’端部がリボヌクレアーゼＨ２によって消化されて、連結のための遊離３’−ＯＨが生成され得る（図３（ｉｉ）、（ｉｉ）の２つのプローブ図のうちの２番目の図）。

１．１相同プローブ配列
「相同プローブ配列」は、対象の生物のゲノム中に存在する標的配列と特異的にハイブリッド形成する本発明によって提供されるプローブの一部である。「相同プローブ配列」、「プローブアーム」、「ホーマー（ｈｏｍｅｒ）」および「プローブ相同性領域」という用語はそれぞれ、標的ゲノム配列と特異的にハイブリッド形成し得る相同プローブ配列を指し、本明細書では交換可能に使用される。「標的配列」は、対象の生物のゲノム中の核酸の一本鎖における核酸配列を指す。いくつかの実施形態では、プローブ中の相同プローブ配列は、それぞれ、少なくとも８、１０、１２、１４、１６、１８、２０、２２、２４、２６、２８、３０、３２、３４、３６、３８、４０、４５、５０、５５、６０、６５、７０、８０、９０、１００、１１０、１２０、またはそれ以上のヌクレオチドの長さである。特定の実施形態では、相同プローブ配列は、１８〜５０、１８〜３６、２０〜３２、または２２〜２８ヌクレオチドの長さである。より特定の実施形態では、相同プローブ配列は２２〜２８ヌクレオチドの長さである。特定の実施形態では、プローブ中の２つの相同プローブ配列は同じ長さであり、他の実施形態では、これらは異なる長さである。特定の実施形態では、プローブの相同プローブ配列は長さが異なるが、１０、９、８、７、６、５、４、３、または２ヌクレオチド未満だけ異なる。

いくつかの実施形態では、相同プローブ配列は、長く続く連続した同一ヌクレオチドを含有しない。いくつかの実施形態では、相同プローブ配列は、１０、９、８、７、６、５、４、または３つ未満の連続した同一ヌクレオチドを含有する。より特定の実施形態では、これらは６つ未満の連続した同一ヌクレオチドを含有し、より特定の実施形態では、これらは４つ未満の連続した同一ヌクレオチドを含有する。

相同プローブ配列は、ヘアピンなどの二次構造を実質的に有しないこともある。ｎが７であるときに、相同プローブ配列の逆補体のｎ−ｍｅｒが少なくとも５塩基離れた相同プローブ配列中のｎ−ｍｅｒに対して完全に相補的でない場合に、相同プローブ配列は「二次構造を実質的に有しない」。いくつかの実施形態では、ｎは、１５、１４、１３、１２、１１、１０、９、８、６、５、４、または３である。特定の実施形態では、ｎは３〜７である。いくつかの実施形態では、配列の融解温度（Ｔ_ｍ）で０．２５μＭの濃度において、５０ｍＭのＮａ^＋を含有しＭｇ^＋＋を含有しない水溶液中の分子の３０％未満が安定な分子内ヘアピンまたは分子間二量体である（ここで、溶液は他の配列を含まない）場合に、配列、例えば、相同プローブ配列、骨格配列、またはプローブは、二次構造を実質的に有しない。いくつかの実施形態では、配列のＴ_ｍよりも１５、１０、８、６、４、または２℃低い温度で０．２５μＭのＤＮＡ濃度において、５０ｍＭのＮａ^＋を含有しＭｇ^＋＋を含有しないときに分子の３０％未満が安定な分子内ヘアピンまたは分子間二量体である（ここで、溶液は他の配列を含まない）場合に、配列は二次構造を実質的に有しない。いくつかの実施形態では、０．５ｍＭのＭｇ^＋＋の存在下、配列のＴ_ｍよりも１５、０、８、６、４、または２℃低い温度で０．２５μＭのＤＮＡ濃度において、５０ｍＭのＮａ^＋および０．５ｍＭのＭｇ^＋＋を含有するときに分子の３０％未満が安定な分子内ヘアピンまたは分子間二量体である場合に、配列は二次構造を実質的に有しない。二次構造を検出する他の方法は当該技術分野において知られており、本発明において使用することができ、例えば、Ｚｕｋｅｒ，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．，３１：３４０６−１５（２００３）、Ｍａｔｈｅｗｓｅｔａｌ．，Ｊ．Ｍｏｌ．Ｂｉｏｌ．，２８８：９１１−９４０（１９９９）、Ｈｉｌｂｅｒｓ．ｅｔａｌ．，Ａｎａｌ．Ｃｈｅｍ３２７：７０（１９８７）、Ｓｅｒｒａｅｔａｌ．，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．，２１：３８４５−３８４９（１９９３）、およびＶａｌｌｏｎｅｅｔａｌ．，Ｂｉｏｐｏｌｙｍｅｒｓ．，５０：４２５−４４２（１９９９）に記載されている。

いくつかの実施形態では、相同プローブ配列は、０．５ｍＭのＭｇ^＋＋の存在下、５０〜７２℃、例えば、約５０、５２、５４、５６、５７、５８、５９、６０、６１、６２、６３、６４、６５、６６、６７、６８、６９、７０、７１、または７２℃の融解温度（Ｔ_ｍ）を有するように設計される。特定の実施形態では、Ｔ_ｍは、０．５ｍＭのＭｇ^＋＋の存在下、５０〜６５℃である。いくつかの実施形態では、Ｔ_ｍは、Ｍｇ^＋＋の非存在下、３８〜７２℃である。特定の実施形態では、プローブ中の相同プローブ配列はほぼ同じＴ_ｍを有し、他の実施形態では、これらは異なるＴ_ｍを有するが、互いに１０、９、８、７、６、５、４、３、２、または１℃の違いである。特定の実施形態では、第１の相同プローブ配列（すなわち、プローブ中の最も５’側）は第２の相同プローブ配列よりも低いＴ_ｍを有し、他の実施形態では、第２の相同プローブ配列よりも高いＴ_ｍを有する。

「融解温度」（「Ｔ_ｍ」）は、溶液中のＤＮＡ分子の５０％がその相補的配列との二本鎖としてハイブリッド形成され、半分が解離されている温度を指す。他に記載されない限り、Ｔ_ｍは、Ｍｇ^＋＋を含有せずに、０．２５μＭのＤＮＡ濃度および５０ｍＭのナトリウム濃度で決定される。Ｔ_ｍは、経験的な測定または推定を含む当業者に知られている様々な方法によって決定され得る。特定の実施形態では、Ｔ_ｍは、配列中のＧおよびＣヌクレオチドの数または割合をカウントすることによって推定される。特定の実施形態では、相同プローブ配列中のＧおよびＣヌクレオチドの数は、配列中のヌクレオチドの３０〜６０％の間、例えば約３０、３５、４０、４５、５０、または５５％などである。より特定の実施形態では、相同プローブ配列中のＧおよびＣヌクレオチドの数は、相同プローブ配列中のヌクレオチドの３８〜４４％である。

特定の実施形態では、隣接するヌクレオチド間の塩基スタッキングの説明となるＴ_ｍの最近傍推定値が使用される。最近傍計算は、例えば、Ｂｒｅｓｌａｕｅｒｅｔａｌ．，ＰＮＡＳ，８３：３７４６−３７５０（１９８６）に記載されており、ＳａｎｔａＬｕｃｉａ，ＰＮＡＳ，９５（４）：１４６０−６５（１９９８）において概説されており（いくつかの経験的な最近傍研究が概説され、特に、表２においてＤＮＡ／ＤＮＡ二本鎖のためのΔＨおよびΔＳマスターテーブルが提供される）、これは、参照によって本明細書中に援用される。

相同プローブ配列は、標的生物のゲノム中の標的配列と特異的にハイブリッド形成するように設計されてもよい。「ハイブリッド形成する」という用語は、ワトソン−クリック塩基対形成（ＡとＴまたはＵ、およびＧとＣ）による核酸間の配列特異的相互作用を指す。「特異的にハイブリッド形成する」は、核酸が標的配列に対する完全補体のＴ_ｍよりも８℃以下だけ低いＴ_ｍで標的配列とハイブリッド形成することを意味する。特定の実施形態では、配列は、標的配列に対する完全補体のＴ_ｍよりも７、６、５、４、３、２、または１℃以下だけ低いＴ_ｍで標的配列と特異的にハイブリッド形成する。いくつかの実施形態では、配列は、標的配列に対する完全補体である場合に、標的配列と特異的にハイブリッド形成する。他の実施形態では、配列は、標的配列の完全補体と約９９、９８、９７、９６、９５、９４、９３、９２、９１、９０、８５、８０、７５、７０、または６５％同一である場合に、標的配列と特異的にハイブリッド形成する。いくつかの実施形態では、相同プローブ配列は標的配列と特異的にハイブリッド形成するが、ミスマッチ、例えば、約１８、２０、２２、２４、２５、２６、２８、３０、３５、４０、または４５の連続塩基のウインドウ内に約１、２、３、４、５、またはそれ以上のミスマッチを含有する。

特定の実施形態では、プローブは、標的ゲノムのＤＮＡまたはＲＮＡ成分に付加されているか、あるいはＤＮＡまたはＲＮＡ成分に相補的な配列に付加されている核酸配列とハイブリッド形成し得る。このような付加された核酸配列には、例えば、連結により付加されたオリゴヌクレオチドアダプター、あるいはポリメラーゼまたはヌクレオチド末端トランスフェラーゼ活性によって生成されるポリヌクレオチドラン（例えば、「ＡＡＡＡＡ」または「ＣＣＣＣＣ」）が含まれる。

さらに特定の実施形態では、ブリッジ核酸が使用されてもよく、ここで、ブリッジ核酸の少なくとも第１の部分は捕獲プローブとハイブリッド形成することができ、ブリッジ核酸の少なくとも第２の部分（第１の部分と重複してもよい）は、同時または順次、標的核酸とハイブリッド形成することができ、これにより、捕獲プローブの標的への連結の効率が高められる。

特定の実施形態では、ａ）プローブ中の両方の相同プローブ配列が、そのそれぞれの標的配列と、相同プローブ配列の全長にわたって少なくとも６０、６５、７０、７５、８０、８５、９０、９５、または１００％正しい対形成でハイブリッド形成する場合、ｂ）第１の相同プローブ配列が、Ｈ１の３’端部（第２の相同プローブ配列の最も３’側）の８、７、６、５、４、３、または２つ塩基において１００％正しい対形成でハイブリッド形成する場合、そしてｃ）第２の相同プローブ配列が、Ｈ２の５’端部（相同プローブ配列の最も５’側）の最初の８、７、６、５、４、３、または２つの塩基とハイブリッド形成する場合に、プローブは特異的にハイブリッド形成する。さらにより特定の実施形態では、ａ）プローブ中の両方の相同プローブ配列が、そのそれぞれの標的配列と、相同プローブ配列の全長にわたって少なくとも８０％正しい対形成でハイブリッド形成する場合、ｂ）第１の相同プローブ配列が、Ｈ１の３’端部の最初の６つの塩基と１００％正しい対形成でハイブリッド形成する場合、そしてｃ）第２の相同プローブ配列が、Ｈ２の５’端部の最初の６つの塩基と１００％正しい対形成でハイブリッド形成する場合に、プローブは特異的にハイブリッド形成する。

２つの配列（例えば、相同プローブ配列および標的配列の補体）間の相同性は、ペアワイズアライメント、ドット−マトリックス、およびダイナミックプログラミングを含む当該技術分野において既知の任意の方法によって決定することができ、特定の実施形態では、ＦＡＳＴＡ（ＬｉｐｍａｎａｎｄＰｅａｒｓｏｎ，Ｓｃｉｅｎｃｅ，２２７：１４３５−４１（１９８５）およびＬｉｐｍａｎａｎｄＰｅａｒｓｏｎ，ＰＮＡＳ，８５：２４４４−４８（１９９８））、ＢＬＡＳＴ（ＭｃＧｉｎｎｉｓ＆Ｍａｄｄｅｎ，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．，３２：Ｗ２０−Ｗ２５（２００４）（現在のＢＬＡＳＴ参考文献、特にＭｅｇａＢｌａｓｔについて記載）、Ｚｈａｎｇｅｔａｌ．，Ｊ．Ｃｏｍｐｕｔ．Ｂｉｏｌ．，７（１−２）：２０３−１４（２０００）（ＭｅｇａＢｌａｓｔにおいて実行される「欲張りアルゴリズム（ｇｒｅｅｄｙａｌｇｏｒｉｔｈｍ）」について記載）、Ａｌｔｓｃｈｕｌｅｔａｌ．，Ｊ．Ｍｏｌ．Ｂｉｏｌ．，２１５：４０３−４１０（１９９０）（最初のＢＬＡＳＴ刊行物））、Ｎｅｅｄｌｅｍａｎ−Ｗｕｎｓｃｈ（ＮｅｅｄｌｅｍａｎａｎｄＷｕｎｓｃｈ，Ｊ．Ｍｏｌｅｃ．Ｂｉｏ．，４８（３）：４４３−５３（１９７０））、Ｓｅｌｌｅｒｓ（Ｓｅｌｌｅｒｓ，Ｂｕｌｌ．Ｍａｔｈ．Ｂｉｏｌ．，４６：５０１−１４（１９８４））、およびＳｍｉｔｈ−Ｗａｔｅｒｍａｎ（ＳｍｉｔｈａｎｄＷａｔｅｒｍａｎ，Ｊ．Ｍｏｌｅｃ．Ｂｉｏ．，１４７：１９５−１９７（１９８１））、ならびに他のアルゴリズム（Ｇｅｒｈａｒｄｅｔａｌ．，ＧｅｎｏｍｅＲｅｓ．，１４（１０Ｂ）：２１２１−２７（２００４）に記載されるものを含む）によって決定することができ、これらは参照によって本明細書中に援用される。特定の実施形態では、本発明によって提供される方法は、１つまたは複数の注釈付きのゲノムに対するＭｅｇａＢＬＡＳＴにより配列の候補セットをスクリーニングすることを含む。

いくつかの実施形態では、配列は、ストリンフェントなハイブリダイゼーション条件下で標的配列とハイブリッド形成する場合に「特異的にハイブリッド形成する」。「ストリンフェントなハイブリダイゼーション条件」は、６５℃において６×ＳＳＣおよび１％ＳＤＳ中で核酸をハイブリッド形成し、まず約４２℃において０．ｌ×ＳＳＣ中約２０％（ｖ／ｖ）のホルムアミドで１０分間洗浄し、続いて６５℃において０．２×ＳＳＣおよび０．１％ＳＤＳで洗浄することを指す。特定の実施形態では、代替のハイブリダイゼーション条件は、約５５、５６、５７、５８、５９、６０、６１、６２、６３、６４、６６、６７、６８、６９、または７０℃の異なるハイブリダイゼーションおよび／または洗浄温度、あるいは参照によって本明細書中にＳａｍｂｒｏｏｋａｎｄＲｕｓｓｅｌｌ，ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ，ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙＰｒｅｓｓ，３ｒｄｅｄｉｔｉｏｎ（２００１）に開示されるような他のハイブリダイゼーション条件を含むことができる。特定の実施形態では、ハイブリダイゼーション温度は６０℃よりも高く、例えば、６０〜６５℃である。

相同プローブ配列は、特定の生物のゲノム中、あるいは特定の実施形態では、密接に関連した生物の群のゲノム中の標的配列と特異的にハイブリッド形成するように選択され得る。従って、いくつかの実施形態では、相同プローブ配列は、配列決定されたゲノムの排除セット中に含有される配列と特異的にハイブリッド形成しない。「排除セット」は、相同プローブ配列が特異的にハイブリッド形成しない所定の配列決定されたゲノムのセットを指す。捕獲標的に直接ハイブリッド形成しないプローブを包含する実施形態では、相同プローブ配列は、特に、排除セット内のいかなる配列とも実質的にハイブリッド形成しないように設計される。いくつかの実施形態では、相同プローブ配列は、排除セット内の配列に対して、約１５、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３５、または４０の連続塩基のウインドウ内に少なくとも１、２、３、４、５、６、７、８、９、または１０のミスマッチを含有する。より特定の実施形態では、プローブ中の相同プローブ配列はそれぞれ、排除セット中のいかなる配列に対しても、２０塩基中に少なくとも１つのミスマッチを有する。

「生物」は、ウイルス、細菌、古細菌、および真核生物（植物界、真菌、原生生物、および動物を含む）を含む、ゲノムを有する任意の生物である。

「配列決定された生物」は、他の生物と区別することができるようにそのゲノムの十分な部分が配列決定されている生物である。「配列決定されたゲノム」または「配列決定された生物のゲノム」は、配列決定された生物のゲノムのヌクレオチド配列である。いくつかの実施形態では、配列決定された生物は、完全または部分的に配列決定されている（例えば、ショットガンまたはｃＤＮＡ配列決定、ライブラリ配列決定、ＢＡＣまたはＹＡＣ配列決定によって）。特定の実施形態では、生物のゲノムは、少なくとも５、１０、２０、３０、４０、５０、６０、７０、８０、９０、９５、または９９％が配列決定されている。配列決定されたゲノムは、様々なレベルの包含範囲、例えば約０．１、０．５、０．８、１、２、３、４、５、１０、２０×、またはそれ以上の包含範囲で配列決定されていてもよい。いくつかの実施形態では、病原体などの対象の生物のゲノムサイズは、少なくとも１、５、１０、５０、１００、２００、３００、４００、５００、６００、７００、８００、９００、１０００、２０００、５０００、１００００、２００００、５００００、１０００００万塩基またはそれ以上であり得る。特定の実施形態では、標的ゲノムは、少なくとも１〜１０００万塩基である。

特定の実施形態では、排除セットは、試験サンプルが得られる被験生物のゲノムを含む。特定の実施形態では、排除セットはヒトゲノムを含む。より特定の実施形態では、排除セットはさらに、共通のヒトミクロフローラまたは共生生物のゲノムを含む。さらにより特定の実施形態では、排除セットはさらに、混合物中の他のプローブの標的生物のゲノム、例えば、パネルを含む（例えば、任意の所与の標的生物に対して混合物中のただ１つのプローブが特異的にハイブリッド形成するように）。いくつかの実施形態では、排除セットは、複数のウイルス、真核生物、原核生物、および古細菌のゲノムを含んでいてもよい。より特定の実施形態では、排除セット中の複数のウイルス、真核生物、原核生物、および古細菌のゲノムはさらに、共生生物、非毒性生物、または非病原性生物から配列決定されたゲノムを含んでいてもよい。さらにより特定の実施形態では、排除セットはさらに、配列決定された病原体を含む標的生物以外の生物の配列決定されたゲノムを含む。いくつかの実施形態では、混合物中の全てのプローブに対する排除セットは、例えば、宿主ゲノムおよび共生、非毒性、または非病原性生物を含む、配列決定されたゲノムに共通のサブセットを共有する。さらなる実施形態では、混合物中の各プローブが混合物中の任意の他のプローブの標的領域または相同プローブ配列のいずれかと特異的にハイブリッド形成しないように、排除セットは混合物中のプローブ間で異なる。

本発明によって提供されるプローブは、対象の生物のゲノム中の第１および第２の標的配列と特異的にハイブリッド形成する第１および第２の相同プローブ配列を含むことができる。第１および第２の標的配列は、少なくとも２、３、４、５、６、７、８、９、１０、１５、２０、３０、４０、５０、６０、８０、１００、１２５、１５０、２００、２５０、３００、３５０、４００、５００、６００、７００、８００、９００、１０００、１２００、１４００、１６００、１８００、または２０００ヌクレオチドを含む対象の領域によって分離される。「対象の領域」は、プローブ中の相同プローブ配列の２つの標的配列の最も近い末端間の配列を指す。特定の実施形態では、特定の標的領域は、人による入力またはコンピュータによるデータマイニング（統計的配列および／または文献データマイニングを含む）に基づいて選択され得る。ある特定の実施形態では、１つまたは複数の対象の領域は、密接に関連した生物の間（例えば、同一属の種の間、同一種の亜種の間、または同一種もしくは同一亜種の株の間）で多形性である。より特定の実施形態では、多型は、薬物耐性、毒素産生、または他の毒性因子に関連する。さらにより特定の実施形態では、対象の領域は、例えば、Ａｒｎｏｌｄ，ＭｅｔｈｏｄｓＭｏｌＢｉｏｌ．，６４２：２１７−２３（２０１０）（Ｍ．ツベルクローシス（Ｍ．ｔｕｂｅｒｃｕｌｏｓｉｓ）の多剤耐性（ＭＤＲ）株においてリファンピシン感受性に関連するＲＮＡポリメラーゼＢ遺伝子について考察）、Ｋｕｒｔｅｔａｌ．，Ｊ．ＣｌｉｎＭｉｃｒｏｂｉｏｌ．，４７：５７７−８５（２００９）（メチシリン耐性に関連するＳ．アウレウス（Ｓ．ａｕｒｅｕｓ）の遺伝子型同定領域）、Ａｋｈｒａｓｅｔａｌ，ＰＬＯＳＯＮＥ，２（９）ｅ９１５（２００７）（シプロフロキサシンへの耐性に関連するＮ．ゴノリーア（Ｎ．ｇｏｎｏｒｒｈｏｅａｅ）からの領域について記載）、およびＰｏｕｒｍａｎｄｅｔａｌ．，ＰＬｏＳＯｎｅ．，１（１）：ｅ９５．（２００６）（赤血球凝集素遺伝子における切断部位、グリコシル化部位、ノイラミニダーゼにおけるオセルタミビル耐性部位を同定するＨ５Ｎ１ウイルスのための迅速アッセイについて記載）に開示されるものうちの１つまたは複数を含む。

本発明によって提供されるプローブ中の第１および第２の相同プローブ配列は、ポリメラーゼ連鎖反応（ＰＣＲ）において使用して、対象の生物から対象の領域を特異的に増幅するための一対の従来のプライマー対として使用するために容易に適合させることができる。「従来のプライマー対」は一対の線状核酸プライマーを指し、その各メンバーは、本発明によって提供されるプローブ中の２つの相同プローブ配列のうちの１つに対応する配列を含み、少なくとも２つのヌクレオチドを含む対象の領域を指数関数的に増幅することができる。これらの従来のプライマー対は本発明によって包含され、本発明の一部である。従って、本発明によって提供される従来のプライマー対は、相同プローブ配列に対して上記で提供された同じ基準（例えば、長さ、Ｔ_ｍ、ハイブリダイゼーション特異性、および介在する対象の領域の長さを含む）によって特徴付けられる。対象の領域に相補的な配列を環状化捕獲することができる本発明によって提供されるプローブとは対照的に、従来のプライマー対は、互いに向かい合うその３’端部によって方向付けられて、指数関数的な増幅を容易にする。図４は、従来のプライマー対を用いる本発明の特定の方法の図解である。特定の実施形態では、従来のプライマー対は、バーコード配列を含む。いくつかの実施形態では、従来のプライマー対は、例えば、アダプタマー（ａｄａｐｔａｍｅｒ）プライマーとハイブリッド形成する配列を含む普遍的配列を含む。

本発明によって提供されるプローブおよび従来のプライマー対は、天然に存在する従来のヌクレオチドＡ、Ｃ、Ｇ、Ｔ、およびＵ（デオキシリボース型および／またはリボース型）と、２’Ｏ−メチル修飾ヌクレオチド（Ｄｕｎｌａｐｅｔａｌ，Ｂｉｏｃｈｅｍｉｓｔｒｙ．１０（１３）：２５８１−７（１９７１））、ＩｓｏｄＣもしくはＩｓｏｄＧなどの人工的な塩基対、または標準的なワトソン−クリック水素結合を形成しない脱塩基フラン（ｄＳｐａｃｅｒなど）（Ｃｈａｋｒａｖｏｒｔｙ，ｅｔａｌ．ＭｅｔｈｏｄｓＭｏｌＢｉｏｌ．６３４：１７５−８５（２０１０））、ビオチン化ヌクレオチド、アデニル化ヌクレオチド、ブロッキング基（光切断可能なブロッキング基を含む）を含むヌクレオチド、およびロックド核酸（ＬＮＡ、ポリ核酸において増強された塩基スタッキング相互作用を提供する修飾リボヌクレオチド、例えば、Ｌｅｖｉｎｅｔａｌ．ＮｕｃｌｅｉｃＡｃｉｄＲｅｓ．３４（２０）：１４２（２００６）を参照されたい）などの修飾ヌクレオチドと、ペプチド核酸骨格とを含むことができる。特定の実施形態では、本発明によって提供されるプローブの５’または３’相同プローブ配列は、そのそれぞれの末端にＰＣ−ビオチンなどの光切断可能なブロッキング基を含む。より特定の実施形態では、本発明によって提供されるプローブは、その５’末端に、連結を光活性化までブロックするための光切断可能なブロッキング基を含む。他の特定の実施形態では、本発明によって提供されるプローブは、その３’末端に、ポリメラーゼ依存性伸長またはｎ−ｍｅｒオリゴヌクレオチド連結を光活性化までブロックするための光切断可能なブロッキング基を含む。

他の実施形態では、本発明によって提供されるプローブの最も５’側のヌクレオチドは、連結および／またはハイブリダイゼーション効率を改善するために、アデニル化ヌクレオチドを含む。他の実施形態では、相同プローブ領域は、ハイブリダイゼーションおよび／または連結効率を改善するために、あるいはポリメラーゼ媒介性のストランド置換またはヌクレアーゼ開裂などの酵素活性への耐性を提供するために、１つまたは複数の２’Ｏメチル、ＩｓｏｄＣもしくはＩｓｏｄＧなどの人工的な塩基対、または脱塩基フラン（ｄＳｐａｃｅｒなど）、あるいは２’Ｏメチル、脱塩基フラン、またはＬＮＡヌクレオチド、例えば、１、２、３、４、５、６、７、８、９、１０、またはそれ以上のＬＮＡ、あるいは１０、２０、３０、４０、５０、６０、７０、８０、９０、または１００％の２’Ｏメチル、脱塩基フラン、またはＬＮＡヌクレオチドを含む。例えば、Ｈｏｇｒｅｆｅｅｔａｌ，ＪＢｉｏｌ．Ｃｈｅｍ．２６５（１０）：５５６１−５５６６（１９９０）を参照されたい。より特定の実施形態では、５’相同プローブ領域の５’端部（例えば、Ｈ２、連結アーム）は少なくとも１つのＬＮＡを含み、さらにより特定の実施形態では、５’末端ヌクレオチドはＬＮＡである。

１．２骨格配列
本発明によって提供されるプローブは、第１の相同プローブ配列と第２の相同プローブ配列との間に、検出可能な部分および１つまたは複数のプライマー結合配列を含み得るプローブ骨格配列を含む。骨格配列は、少なくとも１５、２０、２５、３０、３５、４０、４５、５０、７０、９０、１００、１２、１４０、１５０、１６０、１８０、２００、４００塩基、またはそれ以上の塩基であり得る。より特定の実施形態では、骨格は第２のプライマーを含む。各骨格プライマーは、例えば、混合物中の全ての環状化プローブを増幅するために使用することができる１つまたは複数の普遍的配列を含むことができる。いくつかの実施形態では、プライマーは、特異的プローブまたはプローブのセットの同定および／または増幅のためのバーコードなどのプローブ特異的配列を含有してもよい。いくつかの実施形態では、骨格配列は、１つまたは複数の非ワトソン−クリックヌクレオチドを含む。さらなる実施形態では、骨格は、ハイブリダイゼーション反応においてより大きい反応性または不活性を付与するため、ポリメラーゼ媒介のストランド置換またはヌクレアーゼ開裂などの酵素活性への耐性を提供するため、誤った増幅事象の阻害剤としての機能を果たすため、あるいはＰＣＲプライマーまたはビオチン化捕獲プローブなどのトランス作用性核酸オリゴヌクレオチドのための標的部位の役割を果たすために、１つまたは複数の２Ｏ’メチルヌクレオチド残基、ＩｓｏｄＣもしくはＩｓｏｄＧなどの人工的な塩基対、または脱塩基フラン（ｄＳｐａｃｅｒなど）、あるいは２Ｏ’メチル、脱塩基フラン、またはＬＮＡヌクレオチド、例えば、１、２、３、４、５、６、７、８、９、１０、またはそれ以上のＬＮＡ、あるいは１０、２０、３０、４０、５０、６０、７０、８０、９０、または１００％の２Ｏ’メチル、脱塩基フラン、またはＬＮＡヌクレオチドを含む。

「バーコード」という用語は、分子または関連分子の種類を独自に同定するヌクレオチド配列を指すために使用される。本発明のプローブにおいて使用するための適切なバーコード配列は、例えば、米国特許第５，４４５，９３４号明細書（Ｆｏｄｏｒｅｔａｌ．）および米国特許第５，６３５，４００号明細書（Ｂｒｅｎｎｅｒ）に記載されるｎ−ｍｅｒのアレイなどの、カスタマイズまたは既製された核酸アレイに対応する配列を含むことができる。特定の実施形態では、ｎ−ｍｅｒバーコードは、少なくとも３、４、５、６、７、８、９、１０、１２、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、３０、３５、４０、５０、６０、７０、８０、９０、１００、２００、３００、４００または５００ヌクレオチド、例えば、１８〜２０、２１、２２、２３、２４、または２５ヌクレオチドであり得る。特定の実施形態では、バーコードは、このバーコードが不注意に誤った別のものとして読み取られるのを可能にするために、１、２、３、４または５よりも多い配列決定エラーを要求するように設計された配列を含む。

バーコード配列を生成するために、各バーコードサイズＫに対して、パールスクリプトを用いて４つのＤＮＡヌクレオチド、Ａ、Ｔ、Ｇ、Ｃから４^Ｋランダムバーコードが生成され得る。このバーコードのセットは、４つのヌクレオチドの変動を用いてＫの長さの配列に対して可能な独特の配列の組み合わせの総数を表す。次に、１つのヌクレオチドが１００％の長さを含む（例えば、ＴＴＴＴＴＴ）場合のバーコードは、場合により、パターンマッチングパールスクリプトを用いて除去される。さらに、フィルタリングステップは、３よりも多いヌクレオチドのラン（ｒｕｎ）、例えばＴＧＧＧＧＴ、またはただ１つのヌクレオチドによって中断されるラン、例えばＧＧＧＴＧＧを含有するバーコードの除去を含むことができる。セルフハイブリダイゼーションにより二次構造を形成する傾向のあるパリンドロームまたは逆方向反復を含有するバーコードは、このような自己相補性を同定するように設計されたパールスクリプトを用いてフィルタリングされ得る。

患者からのサンプルを試験するために使用されるプローブの混合物中で利用され得るバーコードの選択は、プール内のバーコード配列中の各位置における５％よりも多く、５０％以下の特定のヌクレオチドの表示を提供し得るバーコードの組み合わせを選択することを含み得る。これは、パールスクリプトを用いて指定された条件が満たされるまで、プールされたセットにバーコードをランダムに付加および除去することによって達成される。バーコードプール内に逆補体配列も存在する場合のバーコードも排除され得る。

適切なバーコード配列は、例示的な３−ｍｅｒ、４−ｍｅｒ、５−ｍｅｒ、６−ｍｅｒ、７−ｍｅｒ、８−ｍｅｒ、９−ｍｅｒ、および１０−ｍｅｒバーコードを説明する配列表１に記載されるようなバーコード配列を含む。表１において「１ヌクレオチド距離」ｎ−ｍｅｒとして示される配列は、互いに少なくとも１の配列距離を有する、説明的な配列であり、ここで、「距離」は、同じカテゴリーの配列のそれぞれの間の配列決定の相違の最小数を指す。「２ヌクレオチド距離」配列は、互いに少なくとも２ヌクレオチドの「距離」を有する。

特定の実施形態では、本発明によって提供されるプローブにおいて使用されるバーコードは、ＡＦＦＹＭＥＴＲＩＸ（商標）によるＴａｇ３またはＴａｇ４バーコードアレイ上のものに相当する。バーコードシステムのさらなる考察は、Ｆｒａｎｋ，ＢＭＣＢｉｏｉｎｆｏｒｍａｔｉｃｓ，１０：３６２（２００９、１３頁）、Ｐｉｅｒｃｅｅｔａｌ．，ＮａｔｕｒｅＭｅｔｈｏｄｓ，３：６０１−０３（２００６）（ウェブ補足を含む）、およびＰｉｅｒｃｅｅｔａｌ．，ＮａｔｕｒｅＰｒｏｔｏｃｏｌｓ，２：２９５８−７４（２００７）において見出すことができる。

いくつかの実施形態では、骨格は、１つまたは複数のサンプル核酸特異的バーコード、例えば、１つまたは複数の患者特異的バーコードを含む。特定の実施形態では、１つの患者サンプルにつき２つ以上のバーコードが割り当てられ、各患者の複製サンプルが同じ配列決定反応において実施されることが可能になる。サンプル核酸特異的バーコードを用いることによって、本出願において記載されるような多重反応と、特異的バーコードの定義されたレパートリーを使用しない試験サンプル間の相互汚染との両方を検出することが可能である。特定の実施形態では、骨格は、時間バーコード、例えば、特定の期間を指定するバーコードを含むこともできる。時間バーコードを用いることにより、異なる日のラン間で、配列決定装置などのアッセイ装置におけるキャリーオーバーまたは汚染を検出することが可能である。より特定の実施形態では、サンプルおよび／または時間バーコードを使用して、サンプルおよび／または日の間の相互汚染を自動的に検出し、例えば、装置のオペレータに配列決定装置などのサンプル処理システムを浄化および／または除染するように指示することができる。

特定の実施形態では、バーコード配列は、プライマー結合配列でもある。いくつかの実施形態では、骨格プライマーは、普遍的プライマーおよびプローブ特異的配列の両方を含む。いくつかの実施形態では、普遍的配列はプローブ特異的領域の内側（すなわち、３’）であり、他の実施形態では、普遍的配列は外側（すなわち、プローブ特異的領域に対して５’）である。いくつかの実施形態では、普遍的配列およびプローブ特異的配列は隣接している。他の実施形態では、これらは、少なくとも１、２、３、４、５、６、７、８、９、１０、１５、２０、２５、３０、４０、もしくは５０、またはそれ以上のヌクレオチドによって分離されている。

特定の実施形態では、骨格配列中の普遍的プライマー配列は、より長い「アダプタマー」プライマーのためのハイブリッド形成の鋳型の役割を果たす。「アダプタマープライマー」は、捕獲反応産物の増幅を容易にするために捕獲反応産物中の普遍的プライマー配列とハイブリッド形成するプライマーであり、さらに、サンプル特異的バーコード配列、例えば、アダプタマープライマーの普遍的プライマーハイブリッド形成領域の５’側の配列を含む。アダプタマープライマーを使用して、例えば、増幅反応産物にサンプル特異的バーコードを取り込んで、捕獲反応および増幅反応を完了した後に、サンプルのさらなる多重化を可能にすることができる。サンプル特異的バーコードの付加により、例えば、配列決定による検出の前に、多重捕獲および／または増幅反応産物がプールされることが可能になる。より特定の実施形態では、アダプタマープライマーはさらに、配列決定プライマーとハイブリッド形成する普遍的配列を含む。

検出可能な部分は、骨格配列に関連していてもよい。蛍光（例えば、量子ドット、小分子、または蛍光タンパク質）標識、化学標識またはタンパク質ベースの標識などの直接標識の場合のように、ポリヌクレオチド配列に結合されていてもよい。あるいは、修飾ヌクレオチドなどの核酸標識、またはバーコードなどのプローブ特異的配列の場合のように、検出可能な部分は、ポリヌクレオチド配列内に取り込まれていてもよい。量子ドットは当該技術分野において知られており、例えば、国際公開第０３／００３０１５号パンフレットに記載されている。量子ドットを生体分子にカップリングさせる手段は、例えば、Ｍｅｄｎｉｔｚｅｔａｌ．，ＮａｔｕｒｅＭａｔｅｒｉａｌｓ４：２３５−４６（２００５）、ならびに米国特許出願公開第２００６／００６８５０６号明細書および同第２００８／００８７８４３号明細書（それぞれ、２００６年５月３０日および２００８年４月１７日に公開）において概説されているように、当該技術分野において知られている。

２プローブ混合物
２．１プローブおよび較正標準
本発明は、部分的に、標的生物（または、例えば、種、属、または血清型によって関連される生物の群）のゲノム中の標的配列に特異的にハイブリッド形成することができ、そして排除セット中のいかなる配列、例えば、少なくとも１つの非ハイブリッド形成ゲノム（宿主ゲノムおよび／または標的生物と異なる生物の所定のセット、例えば、病原性生物を含むが標的生物または標的生物群は含まない配列決定された細菌、ウイルス、真核生物、および古細菌生物の注釈付きのデータベースなど）とも特異的にハイブリッド形成しないプローブの集合を提供することに基づく。

本発明の態様は、患者からの生物サンプル中の病原体の検出など、試験サンプルの多重分析のためのプローブの混合物を提供する。本発明によって提供される混合物は、少なくとも２、３、４、５、６、７、８、９、１０、２０、３０、４０、６０、８０、１００、２００、２５０、５００、１０００、２０００、４０００、８０００、１００００、２００００、３００００、４００００、５００００、６００００、７００００、８００００、９００００、または１０００００のプローブを含む。いくつかの実施形態では、混合物は、特定の生物から複数の配列を捕獲するように設計される。特定の実施形態では、混合物は、少なくとも２、３、４、５、６、７、８、９、１０、１５、２０、３０、４０、６０、８０、１００、１５０、２００、２５０、３００、４００、５００、１０００、２０００、４０００、８０００、１００００、１５０００、または２００００の異なる標的生物のそれぞれに対して少なくとも１つの配列を捕獲することができる。特定の実施形態では、混合物は、表４、６、８、１０、１１のいずれか１つからの少なくとも１、２、３、４、５、６、７、８、９、１０、１５、２０、２５、３０、３５、４０、４５、５０、６０、６５、７０、７５、または８０の相同プローブ配列、あるいは特定の配列、ｍｔｂ−３７ｒｖ−ｉｎｈａ−ｐｒ−０１−Ｈ１、ｍｔｂ−Ｈ３７Ｒｖ−ｒｐｏＢ−ｐｒ−０１−Ｈ１、ｍｔｂ−Ｈ３７Ｒｖ−ｒｐｏＢ−ｐｒ−０１−Ｈ２、ｍｔｂ−Ｈ３７Ｒｖ−ｒｐｏＢ−ｐｒ−０２−Ｈ１、ｍｔｂ−Ｈ３７Ｒｖ−ｒｐｏＢ−ｐｒ−０２−Ｈ２、またはｍｔｂ−３７ｒｖ−ｉｎｈａ−ｐｒ−０１−Ｈ２、およびこれらの組み合わせを含む。特定の実施形態では、混合物は、表４、６、８、１０、および１１の何れかに記載される相同プローブ配列対を含む、少なくとも１、２、３、４、５、６、７、８、９、１０、１５、２０、２５、３０、３５、４０、４５、５０、６０、６５、７０、７５、または８０のプローブを含む。

混合物中のプローブは、通常、同様のバルク特性（相同プローブ配列の長さ、相同プローブ配列のＴ_ｍ、および捕獲される対象の領域の長さ、ならびに二次構造の欠如など）を有するか、あるいは同様の値の範囲内に含まれるであろう。いくつかの実施形態では、プローブの混合物中の相同プローブ配列のＴ_ｍは、互いに、１０、９、８、７、６、５、４、３、２、または１℃の違いであり、特定の実施形態では、同じＴ_ｍを有する。いくつかの実施形態では、プローブの混合物中の相同プローブ配列は全て、互いに、１０、９、８、７、６、５、４、３、２、または１ヌクレオチドの長さの違いであり、特定の実施形態では、これらは同じ長さである。プローブの標的配列間の対象の領域の長さは、混合物中の全てのプローブに共通でもよいし、２〜２０、２０〜１００、２０〜２００、４０〜３００、１００〜３００ヌクレオチドなどの範囲の値にわたって異なっていてもよい。特定の実施形態では、対象の領域は、互いに、１００、９０、８０、７０、６０、５０、４０、３０、２０、または１０ヌクレオチドの長さの違いである。より特定の実施形態では、対象の領域は同じ長さである。バーコードの長さも異なり得るが、一般には、互いに２５、２０、１５、１０、または５ヌクレオチドの違いである。特定の実施形態では、バーコードは同じ長さを有する。

いくつかの実施形態では、本発明によって提供される混合物は、以下にさらに記載されるように、異なる試験サンプルからの捕獲反応産物および増幅反応産物を含む。簡単に言うと、異なる捕獲反応産物および／または増幅反応産物は、検出の前に、すなわち同時検出のために、結合および多重化され得る。これは、試験サンプルを同定するバーコード配列を用いて達成される。例えば、試験サンプルＡからの捕獲反応産物は、サンプルＡ特異的バーコードを含み、サンプルＢからの捕獲反応産物サンプルＢ特異的バーコードを含み得る。サンプルＡおよびサンプルＢからの捕獲反応産物が配列決定のために結合される場合、サンプルＡ捕獲反応産物中の全ての配列は、サンプルＡ特異的バーコード配列の存在
によって同定される。

特定の実施形態では、本発明の混合物は、サンプル内部較正核酸（ＳＩＣ）を含有する。特定の実施形態では、既知の量の１つまたは複数のＳＩＣが、本発明によって提供される混合物中に含まれる。特定の実施形態では、少なくとも１、２、３、４、５、６、７、８、１０、１５、２０、２５、または３０の異なるＳＩＣが混合物中に含まれる。特定の実施形態では、約４つの異なるＳＩＣが混合物中に存在する。いくつかの実施形態では、ＳＩＣは、病原性ＤＮＡ標的に特徴的なヌクレオチド組成を有し、品質管理のため、例えば、個々の試験サンプルの処理および配列決定ステップのための較正曲線の再構築を可能にする特定のモル量で存在する。特定の実施形態では、ＳＩＣは、混合物中約１０％（モル量）の核酸、例えば、混合物中２、４、６、８、１０、１２、１４、１６、１８、または２０％（モル濃度）の核酸を構成する。特定の実施形態では、異なるＳＩＣは、例えば、１、２、３、４、５、６、７、８、９、１０、２０、５０、１００、２００、５００、１０００、５０００、１００００、５００００、または１０００００倍の、最も薄いＳＩＣから最も濃いＳＩＣまでの濃度範囲にわたる希釈系列で、２、３、４、５、６、７、８、９、１０、２０、３０、４０、または５０段階において異なる濃度で存在する。特定の実施形態では、ＳＩＣは、５、２５、１００、および２５０コピー／ｍｌの濃度で、サンプル（例えば、プローブの混合物および試験サンプル、捕獲反応、捕獲反応産物、増幅反応、または増幅反応産物）中に存在する。所定濃度のＳＩＣを検出する（例えば、ＳＩＣに向けられたプローブを用いることにより）ことによって、当業者は、試験サンプル中の対象の生物の濃度を推定することができる。特定の実施形態では、これは、捕獲された配列が検出される頻度を、核酸が得られたサンプルの容積に相関させることによって達成される。従って、単位容積当たりの生物カウント（例えば、血液または尿などの液体サンプルについてはコピー／ｍＬ）を、検出される各生物に対して推定することができる。

特定の実施形態では、ＳＩＣおよびＳＩＣに向けられるプローブの濃度は、捕獲反応産物および／または増幅反応産物中で検出されるＳＩＣの配列が、混合物中の配列の約２、４、６、８、１０、１２、１４、１６、１８、２０、２５、または３０％を構成するように、経験的に調整される。特定の実施形態では、ＳＩＣは、配列読取りの１０〜２０％を構成する。特定の実施形態では、配列決定反応におけるＳＩＣ配列読取りの数は、予め定義されたパラメータ内でサンプル処理が発生することを保証するために、定量的に評価される。特定の実施形態では、予め定義されたパラメータには、以下のうちの１つまたは複数が含まれる：特定のランの間に配列決定される全てのサンプルに対する２つの標準偏差内での再現性、信頼性のある配列決定データのために経験的に決定された基準（例えば、塩基要求の信頼性、エラースコア、標的生物当たりの各プローブの全配列決定読取りの組成率）、配列決定ランにおいて約１５％以下のＧＣまたはＡＵリッチＳＩＣの偏差。多重配列決定のためのプーリングを可能にするために患者サンプルがバーコード化される実施形態において、サンプル中のＳＩＣのＤＮＡは、独特なサンプル、例えば、特定の患者サンプルに相当する同じバーコードも含むであろう。

より特定の実施形態では、ＳＩＣは、上記で定義されたような対象の領域を含むことができ、ここで、対象の領域は、対象の領域に異種の配列をさらに含むように修飾されている。より特定の実施形態では、ＳＩＣ中の対象の領域に異種の配列は、少なくとも１、２、３、４、５、６、７、８、９、１０、１５、２０、２５、３０、４０の近接する塩基、またはそれ以上である。修飾された対象の領域を含むＳＩＣを用いることによって、単一のプローブは、サンプル内の対象の生物と、定量化および検証のための内部対照を提供するＳＩＣとを両方とも検出するために使用することができる。従って、試験サンプル中で検出されるＳＩＣ配列および対象の生物からの対象の領域は、例えば、配列決定または配列特異的定量ＰＣＲによって、対象の領域に異種の配列を検出することによって区別することができる。

２．２サンプル
いくつかの実施形態では、本発明の混合物は、サンプル核酸を含有する。核酸は、生物サンプルなどの任意の試験サンプルから得ることができる。試験サンプルから得られる核酸は、少なくとも１、２、３、４、５、１０、２０、３０、４０、５０、６０、７０、８０、８５、９０、９５、９６、９７、９８、９９重量％の有機物などの、様々な純度を有することができる。特定の実施形態では、サンプル核酸は、試験サンプルから抽出される。いくつかの実施形態では、サンプル核酸はさらに処理されて、例えば、メチル化状態の検出を可能にすることができる。ゲノム全域わたるメチル化部位の検出の概説については、Ｄｅｎｇ（２００９）（メチル化部位を位置付けるために、ＣｐＧアイランドのＭＩＰ捕獲および重硫酸塩配列決定について記載）を参照されたい。

試験サンプルは任意の源に由来し、食料品サンプル（安全性試験、タギング、およびトラッキング）、農業サンプル（例えば、土壌サンプル、病原体検出および／またはＧＭ作物の検出のため）、薬物ロット（例えば、小分子と、血液供給を含む生物学とのロットリリースアッセイのため）、水サンプル（給水の生物多様性の分析、農業、商業、政府、病院、工業、研究室、軍隊、家庭、または家畜の給水の安全性試験（例えば、生物テロ防御）、ならびに水泳または水浴びのための安全性試験を含む）、表面のスワブもしくは抽出物、空気品質のモニタリング、または患者サンプルなどの生物サンプルを含み得る。

患者は、ヒト、または家畜、飼いならされた動物、および野生動物などの動物を含むことができる。いくつかの実施形態では、動物は、トリ、ウシ、イヌ、ウマ、ネコ、ヒツジ、魚類／魚、ブタ、霊長類、齧歯類、または有蹄動物である。患者は、成人、若者、胎児、または胎芽を含む任意の発達段階であり得る。特定の実施形態では、患者は哺乳類であり、より特定の実施形態ではヒトである。

被験者または患者からの生物サンプルは、全細胞、組織、もしくは臓器、または３つの始原的な胚葉（外胚葉、中胚葉もしくは内胚葉）のいずれかに由来する組織を含むバイオプシーを含み得る。例示的な細胞または組織源には、皮膚、心臓、骨格筋、平滑筋、腎臓、肝臓、肺、骨、膵臓、中枢神経組織、末梢神経組織、循環組織、リンパ系組織、腸、脾臓、甲状腺、結合組織、または生殖腺が含まれる。試験サンプルは、入手してすぐにアッセイされてもよいし、あるいは、混合、化学処理、固定化／保存、凍結、または培養によって処理されてもよい。生物サンプルは、血液、胸水、乳、初乳、リンパ液、血清、血漿、尿、脳脊髄液、滑液、唾液、***、涙、および糞便も含む。その他のサンプルは、スワブ、洗液（ｗａｓｈ）、洗浄液（ｌａｖａｇｅ）、排出物、または吸引液（鼻、経口、鼻咽頭の、中咽頭、食道、胃、直腸、または膣の、スワブ、洗液、洗浄液（ｒａｖａｇｅ）、排出物、または吸引液など）、およびこれらの組み合わせ（前述のバイオプシー材料の何れかとの組み合わせを含む）を含む。

２．３パネル
特定の実施形態では、本発明の混合物は、特定の苦痛（例えば、呼吸器、血液、***症）またはサンプルタイプ（例えば、バイオプシー、水、食料品、または農業）のために、一般的な病原体などの生物のパネルを検出するように設計されたプローブを含む。「パネル」は本発明によって提供される混合物を指し、特定の苦痛またはサンプルタイプと間連される１つまたは複数の病原体に向けられた複数のプローブを含む。特定の実施形態では、本発明の混合物は、多重パネルを含有する。特定の病原体に向けられるプローブを含むパネルは、本出願の教示に従うことにより、ルーチン的な技能だけを用いて製造することができる。いくつかの実施形態では、本発明によって提供されるパネルは、米国特許出願公開第２０１０／００９８６８０号明細書（特に、段落１６０、参照によって本明細書中に援用される）に記載されるものなどの複数の病原体に関する。特定の実施形態では、パネルは、米国特許出願公開第２０１０／００９８６８０号明細書の段落１６０に記載される少なくとも１、２、３、４、５、０、１５、２０、２５、３０、３５、４０、または５０の病原体のそれぞれに向けられる少なくとも１つのプローブを含有する。

いくつかの実施形態では、パネルは脳脊髄液（ＣＳＦ）パネルであり、ナイセリア・メニンギティディス（Ｎｅｉｓｓｅｒｉａｍｅｎｉｎｇｉｔｉｄｅｓ）（例えば、ゲノム受入番号ＮＣ＿００８７６７、ＮＣ＿０１０１２０、ＮＣ＿００３１１６、ＮＣ＿００３１１２、ＮＣ＿０１３０１６、またはＮＣ＿００４７５８、特定の実施形態では、ｃｔｒＡ遺伝子に向けられたプローブを含む）、ＨＨＶ６（ヒトヘルペスウイルス６、例えば、ゲノム受入番号ＮＣ＿００１６６４またはＮＣ＿０００８９８、特定の実施形態では、メジャーカプシドタンパク質遺伝子に向けられたプローブを含む）、ＪＣＶ（ＪＣポリオーマウイルス、例えば、ゲノム受入番号ＮＣ＿００１６９９．１、特定の実施形態では、ラージＴ抗原遺伝子に向けられたプローブを含む）、ＢＫＶ（ＢＫポリオーマウイルス、例えば、ゲノム受入番号ＮＣ＿００１５３８、特定の実施形態では、調節領域に向けられたプローブを含む）、ＨＳＶ１（ヒトヘルペスウイルス１、例えば、ゲノム受入番号ＮＣ＿００１８０６またはＸ１４１１２、特定の実施形態では、ｇＤ遺伝子（Ｘ１４１１２における位置１３８３３３〜１４１０４８）に向けられたプローブを含む）、ＨＳＶ２（ヒトヘルペスウイルス２、例えば、ゲノム受入番号ＮＣ＿００１７９８またはＺ８６０９９、特定の実施形態では、ｇＧ遺伝子（Ｚ８６０９９における位置１３７８７８〜１３９９７７）に向けられたプローブを含む）、ストレプトコッカス・ニューモニエ（Ｓｔｒｅｐｔｏｃｏｃｃｕｓｐｎｅｕｍｏｎｉａｅ）（例えば、ゲノム受入番号ＮＣ＿０１２４６９、ＮＣ＿０１２４６８、ＮＣ＿０１２４６７、ＮＣ＿００８５３３、ＮＣ＿０１２４６６、ＮＣ＿０１０３８０、またはＮＣ＿０１１０７２、特定の実施形態では、ｐｌｙ遺伝子に向けられたプローブを含む）、ヘモフィルス・インフルエンザエ（Ｈａｅｍｏｐｈｉｌｕｓｉｎｆｌｕｅｎｚａｅ）（例えば、ゲノム受入番号ＮＣ＿００７１４６、ＮＣ＿０００９０７、ＮＣ＿００９５６６、ＮＺ＿ＡＡＺＥ００００００００、ＮＺ＿ＡＡＺＪ００００００００、ＮＣ＿００９５６７、またはＤＱ１１５３７５、特定の実施形態では、ｂｅｘＡ遺伝子に向けられたプローブを含む）に向けられたプローブを含む。特定の実施形態では、本発明によって提供されるパネルは、これらの生物のうちの１、２、３、４、５、６、７、または８全てのそれぞれに対して、より特定の実施形態では、生物の例示的な遺伝子に対して１つまたは複数のプローブを含む。

いくつかの実施形態では、パネルは髄膜炎パネルであり、Ｂ群連鎖球菌、エシェリキア・コリ（Ｅｓｃｈｅｒｉｃｈｉａｃｏｌｉ）、リステリア・モノサイトゲネス（Ｌｉｓｔｅｒｉａｍｏｎｏｃｙｔｏｇｅｎｅｓ）、ナイセリア・メニンギティディス（Ｎｅｉｓｓｅｒｉａｍｅｎｉｎｇｉｔｉｄｅｓ）、ストレプトコッカス・ニューモニエ（Ｓｔｒｅｐｔｏｃｏｃｃｕｓｐｎｅｕｍｏｎｉａｅ）（血清型６、９、１４、１８および２３）、ヘモフィルス・インフルエンザエ（Ｈａｅｍｏｐｈｉｌｕｓｉｎｆｌｕｅｎｚａｅ）Ｂ型、ブドウ球菌、シュードモナス、マイコバクテリウム・ツベルクローシス（Ｍｙｃｏｂａｃｔｅｒｉｕｍｔｕｂｅｒｃｕｌｏｓｉｓ）、トレポネーマ・パリダム（Ｔｒｅｐｏｎｅｍａｐａｌｌｉｄｕｍ）、ボレリア・ブルグドルフェリ（Ｂｏｒｒｅｌｉａｂｕｒｇｄｏｒｆｅｒｉ）、クリプトコッカス・ネオフォルマンス（Ｃｒｙｐｔｏｃｏｃｃｕｓｎｅｏｆｏｒｍａｎｓ）、ネグレリア・フォーレリ（Ｎａｅｇｌｅｒｉａｆｏｗｌｅｒｉ）、エンテロウイルス、単純疱疹ウイルス１型および２型、水痘帯状疱疹ウイルス、流行性耳下腺炎ウイルス、ＨＩＶ、ＬＣＭＶ、アンギオストロンギルス・カントネンシス（Ａｎｇｉｏｓｔｒｏｎｇｙｌｕｓｃａｎｔｏｎｅｎｓｉｓ）、ナソトーマ・スピニゲルム（Ｇｎａｔｈｏｓｔｏｍａｓｐｉｎｉｇｅｒｕｍ）、結核、梅毒、クリプトコッカス症、およびコクシジオイデス症のうちの１つまたは複数に向けられた１つまたは複数のプローブを含む。特定の実施形態では、パネルは、これらの生物のうちの１、２、３、４、５、６、７、８、９、１０、１５、２０、２５、３０、または３１の生物に向けられたプローブを含む。

いくつかの実施形態では、パネルは***症（ＵＴＩ）パネルであり、Ｓ．サプロフィチカス（Ｓ．ｓａｐｒｏｐｈｙｔｉｃｕｓ）（ＡＴＣＣ１５３０５）（例えば、ゲノム受入番号ＡＰ００８９３４またはＡＰ００８９３５、特定の実施形態では、ｇｙｒＢ遺伝子に向けられたプローブを含む）、エンテロコッカス・フェカリス（Ｅｎｔｅｒｏｃｏｃｃｕｓｆａｅｃａｌｉｓ）（ＭＭＨ５９４）（例えば、ゲノム受入番号ＡＦ０３４７７９、特定の実施形態では、ｅｓｐ遺伝子に向けられたプローブを含む、例えば、参照される）、大腸菌（Ｅ．ｃｏｌｉ）（ＣＦＴ０７３）（例えば、ゲノム受入番号ＮＣ＿００４４３１．１、特定の実施形態では、ｆｉｍＨ遺伝子に向けられたプローブを含む）、大腸菌（Ｅ．ｃｏｌｉ）（ＩＡＩ３９）（例えば、ゲノム受入番号ＮＣ＿０１７５０．１、特定の実施形態では、ｐａｐＧ遺伝子に向けられたプローブを含む）、大腸菌（Ｅ．ｃｏｌｉ）（ＣＦＴ０７３）（例えば、ゲノム受入番号ＮＣ＿００４４３１．１、特定の実施形態では、ｐａｐＸ遺伝子に向けられたプローブを含む）、ウレアプラズマ・ウレアリチカム（Ｕｒｅａｐｌａｓｍａｕｒｅａｌｙｔｉｃｕｍ）（血清型１０ｓｔｒ．ＡＴＣＣ３３６９９）（例えば、ゲノム受入番号ＵＵＲ１０＿００７８、特定の実施形態では、ｈｌｙ遺伝子に向けられたプローブを含む）、ウレアプラズマ・パルバム（Ｕｒｅａｐｌａｓｍａｐａｒｖｕｍ）（血清型３ｓｔｒ．ＡＴＣＣ２７８１５）（例えば、ゲノム受入番号ＣＰ０００９４２、特定の実施形態では、ｈｌｙ遺伝子に向けられたプローブを含む）、エンテロコッカス・フェシウム（Ｅｎｔｅｒｏｃｏｃｃｕｓｆａｅｃｉｕｍ）（ＣＶ１３３）（例えば、ゲノム受入番号ＡＦ５４４４００、特定の実施形態では、ｈｙｌ（ｅｆｍ）遺伝子に向けられたプローブを含む）、およびエンテロコッカス・フェシウム（Ｅｎｔｅｒｏｃｏｃｃｕｓｆａｅｃｉｕｍ）（例えば、ゲノム受入番号ＡＦ０３４７７９、特定の実施形態では、ｅｓｐ遺伝子に向けられたプローブを含む）に向けられたプローブを含む。特定の実施形態では、本発明によって提供される核酸プローブの混合物は、これらの生物のうちの１、２、３、４、５、６、７、８、または９全てのそれぞれに対して、より特定の実施形態では、生物の例示的な遺伝子に対して１つまたは複数のプローブを含む。

いくつかの実施形態では、パネルは、エシェリキア・コリ（Ｅｓｃｈｅｒｉｃｈｉａｃｏｌｉ）、スタフィロコッカス・サプロフィチカス（Ｓｔａｐｈｙｌｏｃｏｃｃｕｓｓａｐｒｏｐｈｙｔｉｃｕｓ）、プロテウス種、クレブシエラ種、エンテロコッカス種、カンジダ・アルビカンス（Ｃａｎｄｉｄａａｌｂｉｃａｎｓ）、ウレアプラズマ、およびマイコプラズマ種を含む１つまたは複数の生物に対する１つまたは複数のプライマーを含む、代替のＵＴＩパネルである。特定の実施形態では、本発明によって提供される核酸プローブの混合物は、これらの生物のうちの１、２、３、４、５、６、７、または８全てのそれぞれに対する１つまたは複数のプローブを含む。

さらに別の実施形態では、ＵＴＩパネルは、大腸菌（Ｅ．ｃｏｌｉ）に向けられた１つまたは複数のプローブを含む。より特定の実施形態では、パネルはさらに、クレブシエラ種、セラチア種、シトロバクター種、およびエンテロバクター種などのその他の腸内細菌科、シュードモナス・エルジノーサ（Ｐｓｅｕｄｏｍｏｎａｓａｅｒｕｇｉｎｏｓａ）などの非発酵菌、ならびにコアグラーゼ陰性ブドウ球菌およびエンテロコッカス種を含むグラム陽性球菌に向けられた１つまたは複数のプローブを含む。さらにより特定の実施形態では、パネルはさらに、カンジダ・アルビカンス（Ｃａｎｄｉｄａａｌｂｉｃａｎｓ）などのカンジダに向けられた１つまたは複数のプローブを含む。特定の実施形態では、本発明によって提供される核酸プローブの混合物は、これらの生物のうちの１、２、３、４、５、６、７、８、９、１０、または１１のそれぞれに対する１つまたは複数のプローブを含む。

いくつかの実施形態では、パネルは、大腸菌（Ｅ．ｃｏｌｉ）、クラミジア、マイコプラズマ、スタフィロコッカス・サプロフィチカス（Ｓｔａｐｈｙｌｏｃｏｃｃｕｓｓａｐｒｏｐｈｙｔｉｃｕｓ）、およびスタフィロコッカス・エピデルミデス（Ｓｔａｐｈｙｌｏｃｏｃｃｕｓｅｐｉｄｅｒｍｉｄｉｓ）に向けられた１つまたは複数のプローブを含むＵＴＩパネルである。特定の実施形態では、本発明によって提供される核酸プローブの混合物は、これらの生物のうちの１、２、３、４、または５のそれぞれに対する１つまたは複数のプローブを含む。

特定の実施形態では、パネルは呼吸器パネルであり、スタフィロコッカス・アウレウス（Ｓｔａｐｈｙｌｏｃｏｃｃｕｓａｕｒｅｕｓ）、シュードモナス・エルジノーサ（Ｐｓｅｕｄｏｍｏｎａｓａｅｒｕｇｉｎｏｓａ）、クレブシエラ・ニューモニエ（Ｋｌｅｂｓｉｅｌｌａｐｎｅｕｍｏｎｉａｅ）、ヘモフィルス・インフルエンザエ（Ｈａｅｍｏｐｈｉｌｕｓｉｎｆｌｕｅｎｚａｅ）、ブランハメラ（モラクセラ）カタラーリス（Ｂｒａｎｈａｍｅｌｌａ（Ｍｏｒａｘｅｌｌａ）ｃａｔａｒｒｈａｌｉｓ）、ストレプトコッカス・ピオゲネス（Ｓｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓ）（Ａ群）、コリネバクテリウム・ジフテリエ（Ｃｏｒｙｎｅｂａｃｔｅｒｉｕｍｄｉｐｈｔｈｅｒｉａｅ）、ＳＡＲＳ−ＣｏＶ、ボルダテラ・パータシス（Ｂｏｒｄａｔｅｌｌａｐｅｒｔｕｓｓｉｓ）、インフルエンザウイルス（Ａ、Ｂ、Ｃ型）、ライノウイルス、コロナウイルス、エンテロウイルス、アデノウイルス、呼吸器多核体ウイルス（ＲＳＶ）、パラインフルエンザウイルス、流行性耳下腺炎ウイルス、レジオネラ・ニューモフィラ（Ｌｅｇｉｏｎｅｌｌａｐｎｅｕｍｏｐｈｉｌａ）、シュードモナス・エルジノーサ（Ｐｓｅｕｄｏｍｏｎａｓａｅｒｕｇｉｎｏｓａ）、バークホルデリア・セパシア（Ｂｕｒｋｈｏｌｄｅｒｉａｃｅｐａｃｉａ）、マイコプラズマ・ニューモニエ（Ｍｙｃｏｐｌａｓｍａｐｎｅｕｍｏｎｉａｅ）、マイコバクテリウム・ツベルクローシス（Ｍｙｃｏｂａｃｔｅｒｉｕｍｔｕｂｅｒｃｕｌｏｓｉｓ）、クラミジア・ニューモニエ（Ｃｈｌａｍｙｄｉａｐｎｅｕｍｏｎｉａｅ）、マイコバクテリウム・アビウムイントラセルラーレ複合体（Ｍｙｃｏｂａｃｔｅｒｉｕｍａｖｉｕｍｉｎｔｒａｃｅｌｌｕｌａｒｅｃｏｍｐｌｅｘ）（ＭＡＣ）、カンジダ・アルビカンス（Ｃａｎｄｉｄａａｌｂｉｃａｎｓ）、コクシジオイデス・イミチス（Ｃｏｃｃｉｄｉｏｉｄｅｓｉｍｍｉｔｉｓ）、ヒストプラズマ・カプスラーツム（Ｈｉｓｔｏｐｌａｓｍａｃａｐｓｕｌａｔｕｍ）、ブラストミセス・デルマチチジス（Ｂｌａｓｔｏｍｙｃｅｓｄｅｒｍａｔｉｔｉｄｉｓ）、クリプトコッカス・ネオフォルマンス（Ｃｒｙｐｔｏｃｏｃｃｕｓｎｅｏｆｏｒｍａｎｓ）、およびアスペルギルス・フミガータス（Ａｓｐｅｒｇｉｌｌｕｓｆｕｍｉｇａｔｅｓ）に向けられた１つまたは複数のプローブを含む。特定の実施形態では、本発明によって提供されるパネルは、これらの生物のうちの１、２、３、４、５、６、７、８、９、１０、１５、２０、２５、３０または３３のそれぞれに対する１つまたは複数のプローブを含む。

いくつかの実施形態では、パネルは呼吸器パネルであり、インフルエンザＡ（亜型Ｈ１、Ｈ３、Ｈ５およびＨ７を含む）、インフルエンザＢ、パラインフルエンザ（２型）、呼吸器多核体ウイルス、およびアデノウイルスを含む１つまたは複数の病原体に向けられた１つまたは複数のプローブを含有する。

特定の実施形態では、パネルは呼吸器パネルであり、ストレプトコッカス・ニューモニエ（Ｓｔｒｅｐｔｏｃｏｃｃｕｓｐｎｅｕｍｏｎｉａｅ）、マイコプラズマ・ニューモニエ（Ｍｙｃｏｐｌａｓｍａｐｎｅｕｍｏｎｉａｅ）、ヘモフィルス・インフルエンザエ（Ｈａｅｍｏｐｈｉｌｕｓｉｎｆｌｕｅｎｚａｅ）、クラミドフィラ・ニューモニエ（Ｃｈｌａｍｙｄｏｐｈｉｌａｐｎｅｕｍｏｎｉａｅ）、およびレジオネラ種、レジオネラ・ニューモフィラ（Ｌｅｇｉｏｎｅｌｌａｐｎｅｕｍｏｐｈｉｌａ）、ＳＡＲＳウイルス、Ｈ１Ｎ１、Ｈ５Ｎ１、グラム陰性桿菌、モラクセラ・カタラーリス（Ｍｏｒａｘｅｌｌａｃａｔａｒｒｈａｌｉｓ）、スタフィロコッカス・アウレウス（Ｓｔａｐｈｙｌｏｃｏｃｃｕｓａｕｒｅｕｓ）、結核、および呼吸器多核体ウイルス（ＲＳＶ）を含む１つまたは複数の病原体に向けられた１つまたは複数のプローブを含有する。特定の実施形態では、本発明によって提供されるパネルは、これらの生物うちの１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、または１４のそれぞれに対する１つまたは複数のプローブを含む。

いくつかの実施形態では、パネルは、ジフテリア、エプスタイン−バーウイルス（ＥＢＶ）、シャーガス、ＨＩＶ、ウエストナイルウイルス、マラリア、梅毒、デング熱、バベシア、異種指向性マウス白血病ウイルス関連ウイルス（ＸＭＲＶ）、Ｂ型肝炎、Ｃ型肝炎、ウイルス性出血熱（エボラおよびマールブルグウイルスを含む）のうちの１つまたは複数に向けられた１つまたは複数のプローブを含む血液パネルである。特定の実施形態では、本発明によって提供されるパネルは、これらの生物のうちの１、２、３、４、５、６、７、８、９、１０、１２、１３、または１４のそれぞれに対する１つまたは複数のプローブを含む。より特定の実施形態では、血液パネルは、ＨＩＶ、Ｂ型肝炎、Ｃ型肝炎、およびトリパノソーマ・クルージ（Ｔｒｙｐａｎｏｓｏｍａｃｒｕｚｉ）（シャーガス）のそれぞれに対する１つまたは複数のプローブを含む。さらなる実施形態では、血液パネルは、ＨＩＶ、Ｂ型肝炎、Ｃ型肝炎、およびトリパノソーマ・クルージ（Ｔｒｙｐａｎｏｓｏｍａｃｒｕｚｉ）（シャーガス）病原体、ならびにＨＬＡ、Ｋｉｒ、ＡＢＯおよびＲｈ式血液マーカー座位などのヒト宿主ゲノム配列のそれぞれに向けられた１つまたは複数のプローブを含む。

いくつかの実施形態では、パネルは、参照によって本明細書中に援用される米国特許出願公開第２００９／０２９１８５４号明細書の段落２６および２７で開示されるものを含む１つまたは複数の病原体に向けられた１つまたは複数のプローブを含有する血液パネルである。特定の実施形態では、本発明によって提供されるパネルは、これらの生物のうちの１、２、３、４、５、６、７、８、９、１０、１５、２０、２５、または３０のそれぞれに対する１つまたは複数のプローブを含む。

いくつかの実施形態では、パネルは敗血症パネルであり、大腸菌（Ｅ．ｃｏｌｉ）、クレブシエラ、プロテウス、エンテロバクター種、シュードモナス・エルジノーサ（Ｐｓｅｕｄｏｍｏｎａｓａｅｒｕｇｉｎｏｓａ）、ナイセリア・メニンギティディス（Ｎｅｉｓｓｅｒｉａｍｅｎｉｎｇｉｔｉｄｉｓ）およびバクテロイデスのような主にグラム陰性の細菌、ならびにスタフィロコッカス・アウレウス（Ｓｔａｐｈｙｌｏｃｏｃｃｕｓａｕｒｅｕｓ）、ストレプトコッカス・ニューモニエ（Ｓｔｒｅｐｔｏｃｏｃｃｕｓｐｎｅｕｍｏｎｉａｅ）および他の連鎖球菌のような一般的なグラム陽性細菌を含む１つまたは複数の病原体に向けられた１つまたは複数のプローブを含む。特定の実施形態では、本発明によって提供されるパネルは、これらの生物のうちの１、２、３、４、５、６、７、８、９、または１０のそれぞれに対する１つまたは複数のプローブを含む。

いくつかの実施形態では、パネルは水、土壌、または農業パネルであり、例えば、Ｇ．ランブリア（Ｇ．ｌａｍｂｌｉａ）、クリプトスポリジウム、サルモネラ、赤痢菌、カンピロバクター、カンジダ、大腸菌（Ｅ．ｃｏｌｉ）、エルシニア、エロモナス、または他の小さい寄生生物に向けられた１つまたは複数のプローブを含む。特定の実施形態では、パネルは、水および／または土壌中の一般的な汚染物質であるジアルジアおよび／またはクリプトスポリジウムに対する１つまたは複数のプローブを含む。特定の実施形態では、本発明によって提供されるパネルは、これらの生物のうちの１、２、３、４、５、６、７、８、９、１０、または１１のそれぞれに対する１つまたは複数のプローブを含む。

いくつかの実施形態では、パネルは食料品または農業パネルであり、エシェリキア・コリ（Ｅｓｃｈｅｒｉｃｈｉａｃｏｌｉ）、サルモネラ、シゲラ・ソネイ（Ｓｈｉｇｅｌｌａｓｏｎｎｅｉ）、カンピロバクター、リステリア（例えば、リステリア・モノサイトゲネス（Ｌｉｓｔｅｒｉａｍｏｎｏｃｙｔｏｇｅｎｅｓ））、エルシニア・エンテロコリチカ（Ｙｅｒｓｉｎｉａｅｎｔｅｒｏｃｏｌｉｔｉｃａ）、エルシニア・シュードツベルクロシス（Ｙｅｒｓｉｎｉａｐｓｅｕｄｏｔｕｂｅｒｃｕｌｏｓｉｓ）、ビブリオ・コレラ（Ｖｉｂｒｉｏｃｈｏｌｅｒａ）、およびクロストリジウム（例えば、Ｃ．ボツリヌム（Ｃ．ｂｏｔｕｌｉｎｕｍ））のうちの１つまたは複数に向けられた１つまたは複数のプローブを含む。特定の実施形態では、食料品または農業パネルは、エシェリキア・コリ（Ｅｓｃｈｅｒｉｃｈｉａｃｏｌｉ）Ｏ１５７：Ｈ７、腸管出血性のエシェリキア・コリ（Ｅｓｃｈｅｒｉｃｈｉａｃｏｌｉ）（ＥＨＥＣ）、腸内毒素原性エシェリキア・コリ（Ｅｓｃｈｅｒｉｃｈｉａｃｏｌｉ）（ＥＴＥＣ）、腸管侵入性エシェリキア・コリ（Ｅｓｃｈｅｒｉｃｈｉａｃｏｌｉ）（ＥＩＥＣ）、腸管病原性エシェリキア・コリ（Ｅｓｃｈｅｒｉｃｈｉａｃｏｌｉ）（ＥＰＥＣ）、サルモネラ、リステリア、エルシニア、カンピロバクター、クロストリジウム種、およびブドウ球菌種に向けられた１つまたは複数のプライマーを含む。特定の実施形態では、農業または食料品パネルは、キシレラ・ファスティディオーサ（Ｘｙｌｅｌｌａｆａｓｔｉｄｉｏｓａ）およびキサントモナス・アクソノポディス（Ｘａｎｔｈｏｍｏｎａｓａｘｏｎｏｐｏｄｉｓ）などの一般的な柑橘類汚染物質に対する１つまたは複数のプローブを含有する。特定の実施形態では、本発明によって提供されるパネルは、これらの生物のうちの１、２、３、４、５、６、７、８、９、１０、１５、２０、またはそれ以上のそれぞれに対する１つまたは複数のプローブを含む。

真菌パネルは、いくつかの実施形態では、参照によって本明細書中に援用される米国特許出願公開第２０１０／０１２９８２１号明細書の段落１６２および１８０ならびに表１および２に記載される１つまたは複数の真菌に向けられた少なくとも１つのプローブを含む。特定の実施形態では、本発明によって提供されるパネルは、これらの生物のうちの１、２、３、４、５、６、７、８、９、１０、１５、２０、２５、または３０のそれぞれに対する１つまたは複数のプローブを含む。特定の実施形態では、真菌パネルは、アスペルギルスおよび／またはカンジダ・アルビカンス（Ｃａｎｄｉｄａａｌｂｉｃａｎｓ）に向けられた１つまたは複数のプローブを含む。

いくつかの実施形態では、本発明によって提供されるパネルは、本明細書中で記載されるような複数の病原体に向けられたプローブ、ならびにＨＬＡ、Ｋｉｒ、ＡＢＯおよびＲｈ式血液マーカー座位などの特定のヒトゲノム配列に向けられたプローブを含み、同じサンプルにおける遺伝子型同定および病原体検出を可能にする。

いくつかの実施形態では、パネルは、被験者の遺伝子型同定のための被験者パネルである。特定の実施形態では、被験者パネルは、少なくとも１、２、３、４、５、６、７、８、９、１０、２０、４０、８０、１００、２００、４００、８００、１０００、５０００、または１００００の被験者座位のためのプローブを含む。特定の実施形態では、パネルは、哺乳類被験者に対するものである。より特定の実施形態では、哺乳類はヒトである。いくつかの実施形態では、パネルは、遺伝性の遺伝子異常、および／または疾患のリスクの増大に関連する遺伝子型を検出するための出生前または新生児パネルである。特定の実施形態では、パネルは、キラー細胞免疫グロブリン様受容体（ＫＩＲ）座位タイピングのため、そして、サイトカインＳＮＰ、例えば、以下のＳＮＰのうちの１つまたは複数を検出するためのプローブを含む：−１７４におけるＩＬ−６：Ｃ／Ｇ、−３０８におけるＴＮＦ−α：Ｇ／Ａ、−２３８におけるＧ／Ａ、−１０８２におけるＩＬ−１０：Ｇ／Ａ、−８１９Ｃ／Ｔ、−５９２におけるＣ／Ａ。いくつかの実施形態では、パネルは遺伝子型ＨＬＡマーカーに対するプローブを含み、特定の実施形態では、クラスＩ（Ａ−Ｈ）およびクラスＩＩのＨＬＡマーカーのそれぞれに対する少なくとも１つのプローブを含む。他の実施形態では、パネルは、米国特許出願公開第２０１０／０１３７４２６号明細書の段落２５、５７、および５８、米国特許出願公開第２００９／０３０５２８４号明細書の段落６および７、米国特許出願公開第２０１０／０１４４８３６号明細書の段落２７に記載される遺伝子のうちの１つまたは複数、米国特許出願公開第２０１０／０１４３９４９号明細書の表１に記載されるマーカーのいずれか、あるいは米国特許出願公開第２０１０／００９３５５８号明細書の段落１４の遺伝子のいずれかに向けられたプローブを含む（これらは全て、参照によって本明細書中に援用される）。いくつかの実施形態では、パネルは、機能獲得型「癌遺伝子」（ＡＢＬ１、ＢＣＬ１、ＢＣＬ２、ＢＣＬ６、ＣＢＦＡ２、ＣＢＬ、ＣＳＦ１Ｒ、ＥＲＢＡ、ＥＲＢＢ、ＥＢＲＢ２、ＥＴＳ１、ＥＴＳ１、ＥＴＶ６、ＦＧＲ、ＦＯＳ、ＦＹＮ、ＨＣＲ、ＨＲＡＳ、ＪＵＮ、ＫＲＡＳ、ＬＣＫ、ＬＹＮ、ＭＤＭ２、ＭＬＬ、ＭＭＴＶ−ＰｙＶＴ、ＭＭＴＶｎｅｕ、ＭＹＢ、ＭＹＣ、ＭＹＣＬ１、ＭＹＣＮ、ＮＲＡＳ、ＰＩＭ１、ＰＭＬ、ＲＥＴ、ＳＲＣ、ＴＡＬ１、ＴＣＬ３、およびＹＥＳなど）、および／または機能喪失型の腫瘍抑制遺伝子（ＡＰＣ、ＢＲＣＡ１、ＢＲＣＡ２、ＭＡＤＨ４、ＭＣＣ、ＮＦ１、ＮＦ２、ＲＢ１、Ｐ５３、およびＷＴ１など）に向けられたプローブを含む。いくつかの実施形態では、パネルは、ＨＬＡ、Ｋｉｒおよびサイトカイン遺伝子座に向けられたプローブを含む。特定の実施形態では、本発明によって提供されるパネルは、これらのマーカーのうちの１、２、３、４、５、６、７、８、９、１０、１５、２０、３０、またはそれ以上のそれぞれに対する１つまたは複数のプローブを含む。

本発明によって提供される追加のパネルは、ウイルス、細菌、古細菌、原生動物、および真核生物、ならびに組み合わせに向けられたプローブを含む。特定の実施形態では、パネルは、約１、２、３、４、５、６、７、８、９、１０、１５、２０、２５、３０または３５のウイルス、約１、２、３、４、５、６、７、８、９、１０、１５、２０、２５、３０または３５の細菌、および約１、２、３、４、５、６、７、８、９、１０、１５、２０、２５、３０または３５の真核生物のそれぞれに対する少なくとも１つのプローブを含有する。特定の実施形態では、真核生物に向けられたパネル中のプローブは、少なくとも１、２、３、４、５、６、７、８、９、または１０の真菌に対するプローブを含む。特定の実施形態では、パネルはさらに、１、２、３、４、５、６、７、８、９、または１０の古細菌のそれぞれに対する少なくとも１つのプローブを含むことができる。

本発明のパネルを用いて検出することができる例示的なウイルス分類群には、アデノウイルス科、アロヘルペスウイルス科、アネロウイルス、アレナウイルス科、アルテリウイルス科、アスコウイルス科、アスファウイルス科、アストロウイルス科、バキュロウイルス科、バルナウイルス科、ベニウイルス、ビコウダウイルス科（Ｂｉｃａｕｄａｖｉｒｉｄａｅ）、ビルナウイルス科、ボルナウイルス科、ブロモウイルス科、ブニヤウイルス科、カリシウイルス科、カウドウイルス目、カリモウイルス科、チェラウイルス（Ｃｈｅｒａｖｉｒｕｓ）、クリソウイルス科、サーコウイルス科、クロステロウイルス科、コモウイルス科、コロナウイルス科、コルチコウイルス科、シストウイルス科、デルタウイルス、ジシストロウイルス科、エンドルナウイルス、フィロウイルス科、フラビウイルス科、フレキシウイルス科、フロウイルス（Ｆｕｒｏｖｉｒｕｓ）、フセロウイルス科、ジェミニウイルス科、グローブロウイルス科（Ｇｌｏｂｕｌｏｖｉｒｉｄａｅ）、ヘパドナウイルス科、ヘペウイルス科、ヘルペスウイルス目、ヘルペスウイルス科、ホルデイウイルス、ハイポウイルス科、イデオウイルス、イフラウイルス（Ｉｆｌａｖｉｒｕｓ）、イノウイルス科、イリドウイルス科、レビウイルス科、リポスリクスウイルス科、ルテオウイルス科、マラコヘルペスウイルス科、マルナウイルス科（Ｍａｒｎａｖｉｒｉｄａｅ）、ミクロウイルス科、ミミウイルス科、モノネガウイルス目、ミオウイルス科、ナノウイルス科、ナルナウイルス科、ニドウイルス目、ニマウイルス科、ノダウイルス科、オフィオウイルス、オルトミクソウイルス科、ウルミアウイルス、パピローマウイルス科、パラミクソウイルス科、パルティティウイルス科、パルボウイルス科、ペクルウイルス、フィコドナウイルス科、ピコルナウイルス目、ピコルナウイルス科、プラズマウイルス科、ポドウイルス科、ポリドナウイルス科、ポリオーマウイルス科、ポモウイルス、ポティウイルス科、ポックスウイルス科、レオウイルス科、レトロウイルス科、ラブドウイルス科、ロニウイルス科、ルディウイルス科、サドワウイルス、サルタープロウイルス（Ｓａｌｔｅｒｐｒｏｖｉｒｕｓ）、セキウイルス科、シホウイルス科、ソベモウイルス、テクティウイルス科、テヌイウイルス、テトラウイルス科、トバモウイルス、トブラウイルス、トガウイルス科、トンブスウイルス科、トティウイルス科、ティモウイルス科、およびアンブラウイルスが含まれる。非ＤＮＡおよび／または一本鎖ウイルスは、当業者に既知の手段によって、例えば逆転写によって、本発明で使用するために容易に適応されるであろう。特定の実施形態では、本発明の混合物は、少なくとも１、２、４、６、８、１０、１５、２０、３０、５０、１００、１５０、２００、２５０、３００、または４００種類のウイルスを検出するために１つまたは複数のプローブを含む。

本発明によって提供されるパネルを用いて検出することができる例示的な細菌の種類には、ファーミキューテス門（例えば、バチルス目、ラクトバチルス目、クロストリジウム）、バクテロイデス門／緑色硫黄細菌門、アクチンバクテリア（Ａｃｔｉｎｂａｃｔｅｒｉａ）、シアノバクテリア門、スピロヘータ目、クラミジア、アルファプロテオバクテリア（例えば、根粒菌、リケッチア）、ベータプロテオバクテリア（例えば、ボルデテラ、ナイセリア、バークホルデリア）、ガンマプロテオバクテリア（例えば、パスツレラ、キサントモナス、シュードモナス、腸内細菌、ビブリオ）、ならびにイプシロンおよびデルタプロテオバクテリアが含まれる。特定の実施形態では、本発明の混合物は、少なくとも１、２、４、６、８、１０、１５、２０、３０、５０、１００、１５０、２００、２５０、３００、または４００種類の細菌を検出するために、１つまたは複数のプローブを含む。

本発明によって提供されるパネルを用いて検出することができる例示的な古細菌の種類には、サーモコッカス目、サーモプラズマ目、メタノサルシナ目、メタノミクロビウム目、メタノコッカス目、メタノバクテリウム目、メタノピュルス目、ハロバクテリウム目、アーケオグロブス目、ナノアーケオタ門、およびクレンアーケオタ門（例えば、サーモプロテウス目、スルフォロブス目、およびデスルフロコッカス目）が含まれる。特定の実施形態では、本発明の混合物は、少なくとも１、２、４、６、８、１０、１５、２０、３０、５０、００、１５０、２００、２５０、３００、または４００種類の古細菌を検出するために、１つまたは複数のプローブを含む。

本発明によって提供されるパネルを用いて検出することができる例示的な真核生物には、線形動物門、吸虫綱、ディプロモナス目、アピコンプレックス門、エンタメオビダエ（Ｅｎｔａｍｅｏｂｉｄａｅ）、キネトプラスト目、ディクティオステリダ（Ｄｉｃｔｙｏｓｔｅｌｌｉｄａ）、ストラメノパイル、真菌（例えば、微胞子虫門、バシドマイコタ（Ｂａｓｉｄｏｍｙｃｏｔａ）、接合菌門、および子嚢菌門（例えば、シゾサッカロミケス綱、サッカロミケス亜門、およびチャワンタケ亜門））が含まれる。特定の実施形態では、本発明の混合物は、少なくとも１、２、４、６、８、１０、１５、２０、３０、５０、１００、１５０、２００、２５０、３００、または４００種類の真核生物を検出するために、１つまたは複数のプローブを含む。

３本発明の例示的な方法
３．１プローブ設計
本発明によって提供されるプローブおよび混合物は、以下の実施例および本出願の一般的な教示によって、当業者により製造することができる。プローブの設計プロセス（プローブ設計「パイプライン」とも呼ばれる）は、入力として、プローブが設計され得るゲノムＤＮＡ配列のセットおよび標的生物の特定の株のセットを採る。ゲノムＤＮＡ配列は、全ゲノム、特定の遺伝子、または１つまたは複数の株におけるゲノム座標であり得る。あるいは、パイプラインは、入力として、ゲノム、遺伝子、または座標のセットを採り、いくつかの基準に基づいて標的に対する領域のセットを選択するであろう。パイプラインは、入力ゲノム、遺伝子、または相同プローブ配列セットにおける標的領域の座標と、既知のゲノムより大きいセットとの間で異なる領域などの基準を使用することができる。

特定の実施形態では、対象の生物の標的ゲノムの配列が提供され、標的ゲノム内の長さｎ（ｎ−ｍｅｒ）を有する連続したヌクレオチドの全ての可能なストリングが列挙され（本明細書では、標的ゲノムの「スライス」とも呼ばれる）、ここで、ｎは１８、２０、２２、２４、２６、２８、３０、３２、３４、３６、３８、４０、４５、５０、５５、６０、６５、７０、８０、９０、１００、１１０、１２０またはそれ以上である。特定の実施形態では、ｎは１８〜５０、１８〜３６、２０〜３２、または２２〜２８ヌクレオチドである。さらに特定の実施形態では、ｎは１８〜２６ヌクレオチドである。より特定の実施形態では、ｎは２２〜２８、例えば、２５ヌクレオチドである。いくつかの実施形態では、長さｎのゲノムセグメントは、ほぼ１〜ｎの間であるオフセットを有する。特定の実施形態では、オフセットは１である。

特定の実施形態では、列挙されたｎ−ｍｅｒは、そのゲノム位置を同定するために注釈付きである。いくつかの実施形態では、ｎ−ｍｅｒは、より迅速なスクリーニングを容易にするために、ゲノムの注釈を用いずにストリングに転換される。

パイプラインは、ｎ−ｍｅｒの適合性に従って、連結側のプローブ相同性領域（連結側ホーマー）として、そして伸長側プローブ相同性領域（伸長側ホーマー）として、それぞれのｎ−ｍｅｒに対する第１のスコアを生成し得る。ｎ−ｍｅｒに対するスコアは、融解温度、一般的な配列組成、特定の位置における配列組成、およびｎ−ｍｅｒがそれ自体であるいは骨格配列とヘアピンを形成する傾向などの特徴に基づくことができる。

パイプラインはｎ−ｍｅｒをフィルタリングして、実質的に同じまたは正確に同じ配列のものを除去することができる（すなわち、「複製（ｄｕｐｌｉｃａｔｅ）スクリーン」）。連結側ホーマー候補のセットを生成するために、長さｘ（ここで、ｘは、長さｎのゲノムセグメントの列挙において使用される最小のｎである（上記のとおり））の同一の接尾語を有するｎ−ｍｅｒが考慮され、最高スコアを有するものが保持され得るが、ここで、スコアは、上記のように、連結側ホーマーとしてのｎ−ｍｅｒの適合性に基づいている。伸長側ホーマー候補のセットを生成するために、長さｘの同一の接頭語を有するｎ−ｍｅｒが考慮され、最高スコアを有するものが保持され得る。

いくつかの実施形態では、ｎ−ｍｅｒのスコアリングは、相同プローブ配列として使用するのに適していないｎ−ｍｅｒを除去するための一連のスクリーンとして実施することができる。スクリーンは、複製および実質的に複製の配列を除去し、指定のＴ_ｍ範囲の外側の配列を除去し（「Ｔ_ｍスクリーン」、例えば５０〜７２℃の外側）、多過ぎる反復ヌクレオチドを有するストリングを有する配列を除去し（「反復スクリーン」、例えば、４つ以上の連続した同一ヌクレオチド）、そしてセルフハイブリッド形成する可能性がある配列を除去する（「ヘアピンスクリーン」、例えば、自己二量体化またはヘアピンを形成）ことを含む。これらのスクリーンは、相同プローブ配列について本出願で記載されるパラメータのいずれかを適用させるように調整することができる。スクリーンは、例えば、以下の表の実施形態のいずれかによって、任意の順序で実施することができる。

候補ホーマー（またはそのサブセット、ここで、サブセットは上記のように生成されたスコアに基づいて選択され得る）は、標的生物の様々な株からのゲノムのセットに対して、そして既知のゲノムの一般的なデータベースに対してアライメントされる。１）ホーマーが一致する株の数と、２）ホーマーに隣接する配列決定される期待伸長領域内の、これらの株の間の単一ヌクレオチド多型（ＳＮＰ）の数（すなわち、配列決定された伸長産物の期待読取り長さを仮定して、ホーマーが明らかにすることを期待されるＳＮＰの数）とを考慮に入れる第２のスコアが各ホーマーに割り当てられる。

第２の（またはスクリーニングされた）ｎ−ｍｅｒは、例えば、被験者のゲノム（生物サンプルの場合）および対象の生物以外の生物（ウイルス、細菌、古細菌、真菌、および他の真核生物を含む）の配列決定されたゲノムを含むゲノムの排除セット内のゲノム中の配列と特異的にハイブリッド形成するものを排除するためにフィルタリングされる。特定の実施形態では、ゲノムの排除セットは、標的生物以外の共生生物、非病原性生物、および病原性生物を含む。特定の実施形態では、スクリーニングされたｎ−ｍｅｒは、排除セット内の任意の配列に対して、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３５、４０、または４５ヌクレオチドのウインドウ内に１、２、３、４、５、６、７、８、９、または１０未満のミスマッチを含有する場合には排除される。特定の実施形態では、スクリーニングされたｎ−ｍｅｒは、少なくとも２２ヌクレオチド（例えば、２５ヌクレオチド）のウインドウ内に少なくとも１９または２０の一致を含有する場合には除去される。候補ｎ−ｍｅｒは、配列比較のために当該技術分野において知られている任意の手段によって、排除セットに対してスクリーニングすることができる。特定の実施形態では、候補ｎ−ｍｅｒは、ＭｅｇａＢＬＡＳＴによって、排除セットに対してスクリーニングされる。いくつかの実施形態では、スクリーニングされたｎ−ｍｅｒは、ゲノム注釈（標的生物のゲノム中のこれらの位置など）を含有するようにフォーマットされ、他の実施形態では、これらはさらに、ゲノム注釈のないストリングとしてスクリーニングされる。

特定の実施形態では、スクリーニングされたｎ−ｍｅｒは、これらが少なくとも１つの追加のハイブリッド形成ゲノム中の配列と特異的にハイブリッド形成することを保証するためにさらにスクリーニングされる。いくつかの実施形態では、追加のハイブリッド形成ゲノムは、標的生物の追加の配列決定されたゲノムである。特定の実施形態では、追加のハイブリッド形成ゲノムは密接に関連しているが、例えば、同じ属または血清型に属する別個の種である。いくつかの実施形態では、スクリーニングされたｎ−ｍｅｒは、ゲノムの排除セットと特異的にハイブリッド形成するものを排除するためのスクリーニングの前に、これらが追加のハイブリッド形成ゲノムと特異的にハイブリッド形成することを保証するためにスクリーングされ、他の実施形態では、これらは後でスクリーニングされる。特定の実施形態では、スクリーニングされたｎ−ｍｅｒは、ゲノムの排除セット内の配列と特異的にハイブリッド形成する配列を排除するためにスクリーニングされる前に、まず、これらが少なくとも１つの追加のハイブリッド形成ゲノムと特異的にハイブリッド形成することを保証するためにスクリーニングされる。

いくつかの実施形態では、スクリーニングされたｎ−ｍｅｒは、さらに、標的生物のゲノムにおいて特定の反復閾値未満、例えば、２０、１９、１８、１７、１６、１５、１０、９、８、７、６、５、４、３、または２回未満などでこれらが標的生物のゲノム中で発生することを保証するためにスクリーニングされる。特定の実施形態では、スクリーニングされたｎ−ｍｅｒは、標的生物のゲノムにおいて正確に１回発生する。

スクリーニングされたｎ−ｍｅｒが、特異的ハイブリダイゼーションの所望のパターン（すなわち、標的生物のゲノムと特異的にハイブリッド形成し、排除セットと特異的にハイブリッド形成しない）を保証するためにさらにスクリーニングされたら、連結側ホーマーおよび伸長側ホーマー候補は、候補プローブへ構築され得る。候補ホーマーの対は、人による事前選択またはコンピュータによる方法により選択される所定の対象の領域を捕獲するように選択され得る。他の実施形態では、候補相同プローブ配列の対は、所定長さの領域、例えば、少なくとも２、３、４、５、６、７、８、９、１０、１５、２０、３０、４０、５０、６０、８０、１００、１２５、１５０、２００、２５０、３００、３５０、４００、５００、６００、７００、８００、９００、１０００、１２００、１４００、１６００、１８００、または２０００ヌクレオチドの領域を捕獲するように選択される。いくつかの実施形態では、ホーマー対は、特定の標的生物株に対して決定される最大伸長距離の範囲内である。

候補プローブのためのスコアは、１）プローブの結合が期待される株の各対の間で観察されるＳＮＰまたは挿入欠失（挿入または欠失またはこれらの組み合わせ）の数を、選択された最大値に至るまで計算し、２）（１）からの値の合計を生成して、プローブが明らかにし得るＳＮＰまたは挿入欠失の総数をもたらし、３）プローブが機能する確率の推定値を、（２）からの合計に掛け合わせることによって生成することができる。このプロトコルはプローブの最終スコアである。プローブが機能する確率は、以下の何れかを考慮し得る：
ｉ）連結ホーマーの配列
ｉｉ）伸長ホーマーの配列
ｉｉｉ）プローブ骨格の配列、
ｉｖ）２つのホーマー間の伸長領域の配列、
ｖ）２つのホーマーＴ_ｍ、
ｖｉ）プローブがそれ自体でヘアピンを形成する傾向、
ｖｉｉ）伸長領域の配列組成、
ｖｉｉｉ）伸長領域の特定の部分、ｎ−ｍｅｒ、またはこれらの組み合わせの配列組成、および
ｉｘ）伸長領域の長さ。

あるいは、プローブのスコアは、別の特定のゲノムセットを排除しながら、特定のゲノムセットまたは単一のゲノムのみとハイブリッド形成する、あるいはハイブリッド形成するのが好ましいプローブに対してスコアがより高いように生成され得る。

いくつかの実施形態では、候補プローブのスコアは全ての対象の株の間で観察されるＳＮＰの合計を含まないが、代わりに、観察されるＳＮＰの数および特に選択された値のより小さい数の合計を含む。

いくつかの実施形態では、プローブは、最終プローブのセット（「出力セット」）に順次付加される。上記のように計算された最高の候補プローブスコアを有するプローブをまず選択することができる。その時点で、全ての残存する候補プローブのスコアは、予め選択されたプローブにより区別されない株の間のＳＮＰを明らかにするプローブがより高くスコア化され、予め選択されたプローブにより区別される株の間を区別するＳＮＰを明らかにするプローブがより低くスコア化されるように再計算される。いくつかの実施形態では、残存する候補プローブのスコアは、これらが出力セットのために既に選択されたプローブとクロスハイブリッド形成する傾向を反映するように更新され得る。

全ての可能なプローブのサブセットであり得るスコア化されたプローブのセットがあれば、株ＡおよびＢ（ここで、Ａは株Ｓ１、Ｓ２、Ｓ３などのセット中にあり、Ｂは別の株のセット中にある）の全ての対が、少なくともある最小数のＳＮＰ、挿入欠失、またはその両方によって区別されることが期待されるまで、プローブスコアが減少する順にプローブを選択することによって、プローブは、最終プローブ出力セット中への含有について選択され得る。

いくつかの実施形態では、全ての可能なプローブのサブセットであり得るスコア化されたプローブがあれば、１）最高スコアを有するプローブを選択し、２）既に選択されたプローブによって明らかにされたＳＮＰまたは挿入欠失の数を、まだ考慮中のプローブによって明らかにされた数から差し引くことにより、残存するプローブのスコアを再計算することによって、プローブは、最終プローブ出力セット中への含有について選択され得る。このようにして、既に選択された全てのプローブがあれば、プローブのスコアは、どのくらいの新しい情報をプローブが提供するかを反映するように更新され得る。

ホーマーのプローブへの構築は、検出可能な部分およびプライマーなどの骨格配列の挿入を含み得る。

特定の実施形態では、構築されたプローブの混合物は、二次構造を形成する可能性のある配列、または混合物中の他のプローブと特異的にハイブリッド形成する配列を排除するために、さらにスクリーニングされる。

選択されたプローブのセットがあれば、プローブ選択ソフトウェアは、特定の標的生物株セットの中でプローブが明らかにするＳＮＰまたは挿入欠失の数に基づいた評価を提供することができる。ソフトウェアは、この情報を２Ｄグリッドの画像として表示することができ、一方の軸は株または種であり、他方の軸は特定のプローブの伸長領域における位置であり、そのグリッドエントリーの色は、その位置におけるその株／種の遺伝子型を示す。ソフトウェアは、この情報をツリーとして表示することができ、ここで、ツリー中の各ノードはプローブに相当する。ノードからのエッジのセットは、そのプローブおよびツリー中の全ての上位（ａｎｃｅｓｔｏｒ）プローブによって観察されるＳＮＰまたは挿入欠失に従って区別することができないゲノムのセットに相当し得る。

選択されたプローブのセットがあれば、ソフトウェアは、各プローブがハイブリッド形成すると期待される株の数に基づいた評価も提供することができる。ソフトウェアは、この情報を２Ｄグリッドの画像として表示することができ、一方の軸はゲノムであり、他方の軸はプローブであり、交差点における色はプローブがゲノムとハイブリッド形成し得るかどうかを示すか、あるいは色は、ハイブリダイゼーションの確率または可能性を示すことができる。

さらなる実施形態では、プローブは、これらが株のセット間でいくつのＳＮＰを明らかにするかに基づかないが、標的座位のリストに基づいて選択することができ、それぞれの座位は、単一のゲノム中の単一のヌクレオチドである。標的座位のセットは、１つまたは複数の基準ゲノム中の座位の塩基セットから誘導され、全ての関連ゲノム中の標的座位の完全セットは、基準ゲノムを互いのゲノムとアライメントさせることによって、塩基セットから誘導され得る。この方法は、例えば、薬物耐性突然変異が病原体の基準株において記載されており、その病原体の株または単離ゲノムのセットにおいてこれらの突然変異を検出し得るプローブが設計される場合に適用可能である。

標的座位のリストに基づいてプローブを選択するこのような方法では、ｎ−ｍｅｒは上記のように生成され得る。これらの方法では、プローブが機能する確率も上記のように計算され得る。しかしながら、このような方法では、プローブがランク付けおよび／または選択される最終スコアは、通常、プローブが機能する確率と、プローブの伸長領域（または、伸長領域の期待される配列決定読取り）に含まれ得る標的座位の数との積に基づいている。従って、プローブは、多数の対象の株に対して、情報的価値のある産物（産物が標的座位を含有することを意味する）を生成すると期待される場合に高くスコア化され、多くの株において産物を生成しない場合、あるいはその産物が対象の座位を含有しない場合に低くスコア化され得る。

いくつかの実施形態では、本明細書において記載される方法のいずれかによって生成される最終プローブは、相同プローブ配列（プローブアーム）があるゲノムセットの何れかに対してもはや完全に一致しないように修飾されてもよい。このゲノムセットは、プローブが設計されるゲノムセットであってもなくてもよく、そしてプローブがスコア化されるゲノムセットであってもなくてもよい。このような実施形態では、プローブをスコア化するために使用されるパラメータは、不完全な一致を相殺するように変更され得る。例えば、本方法では、通常よりも高い融解温度を有するプローブアームが選択されていてもよく、そしてプローブアームおよびゲノム間の不完全な一致の融解温度が通常の範囲内であるように、プローブアーム中のどの１つまたは複数のヌクレオチドに修飾するかが選択されていてもよい。

特定の実施形態では、上記の方法は、少なくとも１０、９、８、７、６、５、４、３、または２メガベースの標的ゲノムにおいて、シングルコアＰｅｎｔｉｕｍＸｅｏｎ２．５ｇｈｚプロセッサを用いて１６、１４、１２、１０、８、６、もしくは４日間、または７２、４８、３６、２４、１２、１０、８、６、もしくは４時間かからない。

一般に、プローブは、上記のように特定の標的生物に対して作成される。特定の実施形態では、複数の生物に向けられたプローブを含む混合物、例えばパネルは、プローブクロスハイブリダイゼーションを最小限にするか排除するため、例えば、混合物中の１つまたは複数の相同プローブ配列またはプローブ骨格配列と特異的にハイブリッド形成するプローブを排除するために、パネルにより検出される各標的生物に対する候補プローブを互いにスクリーニングすることによって、例えばペアワイズ比較によって編集される。

図７は、本発明によって提供されるプローブおよび混合物の製造方法の例示的な実行のフローチャートである。図７は、例えば、例えば標的ゲノムの提供１０、およびｎ−ｍｅｒのセットへのスライシングの実施１００を示す。ｎ−ｍｅｒは、一連のスクリーン２５０（例えば、ヘアピン（２５３）、Ｔ_ｍ（２５４）、反復（２５２）および複製（２５１）スクリーン）を含むプロセス２００によってスクリーニングされる。次にｎ−ｍｅｒは、排除セット２０および１つまたは複数の追加のハイブリッド形成ゲノム３０に対する特異的ハイブリダイゼーションの所望のパターンについて、プロセス３００によってスクリーニングされ、ここで、排除セット２０および追加のハイブリッド形成ゲノム３０はデータベースから得られる。例えば、プロセスは、少なくとも１つの追加のハイブリッド形成ゲノムに対するハイブリダイゼーションについてのフィルタリング３３０、２未満の反復閾値（例えば、１つの標的ゲノムにつき１ヒット）についてのフィルタリング３４０、被験者（例えば、ヒト）ゲノムに対するフィルタリング３５０、および排除セットに対するフィルタリング３６０を含んでいてもよい。スクリーニングされたｎ−ｍｅｒは、注釈がなければ、ゲノム中のその位置を決定するために標的ゲノムに注釈が付けられてもよい（３７０）。プローブは、フィルタ４２５によって対象の領域を捕獲するように対をフィルタリング（４２０）するプロセス４００において構築され、例えば、フィルタ４２５−１によって、指定の対象の領域の長さを有するように、そして骨格配列４０を含むようにフィルタリングされる。プローブは、二次構造を排除するためにフィルタリングされる（４５０）。プローブの混合物（例えば、パネル）はプロセス５００によって作成され、フィルタリング（５５０）されて、混合物中の他のプローブ５０に対する特異的ハイブリダイゼーションが排除される。本出願の教示に従って当業者により実験的検証６００が実施されてもよい。

上記で同定されるコンポーネントのそれぞれのうちの１つだけが上記図面に示されているが、当業者は、これらのコンポーネントがいずれもいくつでも提供され得ることを理解するであろう。さらに、当業者は、開示されるシステムのそれぞれの１つまたは複数のコンポーネントが、図中に示される別のコンポーネントに結合され得る、または取り込まれ得ることを認識するであろう。図中に示されるコンポーネントの１つまたは複数は、１つまたは複数のコンピューティングシステムにおいてソフトウェアで実行され得る。例えば、これらは、プロセッサにより実行されたときにコンピュータに方法のステップを実施させるコンピュータ可読指令の１つまたは複数のコンピュータユニットを含み得る１つまたは複数のアプリケーションを含むことができる。コンピュータ可読指令は、メモリまたはディスクなどのコンピュータ可読媒体上に保存され得る。このような媒体は、通常、非一時的な保存を提供する。あるいは、図中に示されるコンポーネントの１つまたは複数は、例えば、専用コンピュータまたは汎用コンピュータなどのハードウェアコンポーネントまたはハードウェアおよびソフトウェアの組み合わせであってもよい。コンピュータまたはコンピュータシステムは、内部または外部データベースも含むことができる。コンピュータまたはコンピュータシステムのコンポーネントは、ローカルバスインターフェースによって接続されていてもよい。

当業者は、上記の段階が別個のソフトウェアモジュールで具体化されてもよいことを理解するであろう。開示されるコンポーネントは別々のユニットとして上記で説明されているが、当業者は、１つまたは複数のユニットにより提供される機能性が結合されてもよいことを認識するであろう。当業者により理解されるように、ユニットの１つまたは複数は任意的なものであり、特定の実施形態における実行から除外されてもよい。

３．１．１ホーマーおよび構築プローブのスコアリングのための例示的なアルゴリズム
上記の方法を含むプローブ設計の方法は、ホーマーのスコアリングおよび完成プローブのスコアリングのための方法を含むことができ、ここで、スコアはプローブが機能する確率に相当する。

ホーマーおよびプローブのスコアリングアルゴリズムの中核は融解温度に基づくことができる。ある温度において二本鎖型で存在し得る核酸分子の集団の割合を説明するために、一般に、ロジスティック関数が使用される。Ｔが実験温度であり、Ｔ_ｍが核酸の融解温度であり、そしてｓが二本鎖型から解離型への移行の勾配を説明するパラメータであるとすると、
ｐ（Ｔ，ｓ）＝１／（１＋ｅ＾−（Ｔ_ｍ−Ｔ）／ｓ）
は、二本鎖型で存在する集団の割合である（図８においてＴ_ｍの関数で示される）。いくつかの実施形態では、分子反転プローブが、標的配列を上手く増幅する見込みが高いことを反映するスコアを有するために、いくつかのことが発生しなければならない：
１）プローブの開始アームは、標的核酸とハイブリッド形成しなければならない、
２）ポリメラーゼは、伸長を開始しなければならない、
３）プローブの連結アームは、標的核酸とハイブリッド形成しなければならない、
４）伸長は、伸長アームと連結アームの間の鋳型配列全体を交差しなければならない、そして
５）リガーゼは、伸長産物を連結アームに連結させなければならない。

いくつかの実施形態では、上記の事象（１）および（３）は、プローブアームの融解温度に基づいたロジスティック関数を用いて説明することができる。事象（２）および（５）は、開始および連結部位を直接包囲するヌクレオチドに関して説明することができる（例えば、それぞれ、プローブアームの端部の２つの核酸および伸長ロジスティック関数領域の端部の２つの核酸によって説明することができる）。事象（４）は、伸長領域のジヌクレオチド組成によって説明される。

事象（１）および（３）は同一の式およびパラメータを用いて計算されてもよいし、あるいは別々に計算されてもよい。Ｔ_ｍは、プローブアームの融解温度であるとされてもよい。プローブアームがハイブリッド形成する確率は、
Ｐ_{ｈｙｂＯｎＴａｒｇｅｔ}＝（ｐ（Ｔ，ｓ）／（ｐ（Ｔ，ｓ）＋ｓｕｍ_{ｏｔｈｅｒ（ｐ＿ｏｔｈｅｒ（Ｔ，ｓ））}））^＊ｐ（Ｔ，ｓ）
で説明することができ、式中、ｓｕｍ_{ｏｔｈｅｒ（ｐ＿ｏｔｈｅｒ（Ｔ，ｓ））}は、プローブアームのゲノムへの意図されない一致またはオフターゲットの一致の融解温度に対するロジスティック関数の合計である。従って、モデルは、全ての部位にわたるハイブリダイゼーションに対する意図される部位へのハイブリダイゼーションの比率に、正しい部位において利用可能である場合にプローブアームがハイブリッド形成する確率を乗じたものとして、プローブアームがハイブリッド形成する確率を説明することができる。

ゲノムへのプローブアームの各一致のための融解温度（オンターゲットの一致およびいくらかのオフターゲット、すなわち不完全な一致）は、プローブアームとオフターゲット結合部位との間のミスマッチ、ハイブリダイゼーション混合物中のプローブ核酸の濃度、およびハイブリダイゼーション混合物中の様々なイオン（例えば、Ｎａ^＋、Ｍｇ^＋＋、Ｋ^＋、Ｔｒｉｓ）の濃度を考慮に入れることができる標準的な融解温度計算機を用いて計算することができる。

モデルは、オフターゲットの一致の合計が、プローブアーム配列のゲノム配列への不正確なアライメントによって決定されるオフターゲットの一致と、プローブアームのＴ_ｍによって予測されるオフターゲットの一致の一般的なセットとの両方を含むようにさらに伸長され得る。例えば、予測されるオフターゲットの一致のセットの合計は、３０℃からＴ_ｍ−ｋ（ここで、ｋ＝１０℃である）までのｔ（プローブアームの融解温度）のそれぞれの値において、予測されるオフターゲットの一致の数が
ａ＾（Ｔ_ｍ−ｔ）
（式中、ａは、１．４の値を有する定数である）に等しくなるように生成され得る。ｔのそれぞれの値において、プローブアームのゲノムまたはゲノムセットへのオフターゲットの一致または不完全な一致の数は、上記の式に従って予測される。オフターゲットの一致の数は、ｔが減少するにつれて指数関数的に増大すると推定される。すなわち、オフターゲットの一致の数は、オンターゲットの一致およびオフターゲットの一致（または一致の類）間の融解温度の差が増大するにつれて指数関数的に増大し得る。これは、プローブアームと、ゲノム中のオフターゲット部位との間の一致がより短くなるので、期待される挙動であり得る。従って、融解温度は低下し、このような一致の数はより大きくなり得る。特定の融解温度における読取りカウントによって決定されるような、プローブの効率に対する融解温度の効果は、連結および伸長プローブアーム（ホーマー）のそれぞれに対して、図９および１０においてそれぞれ示される（図１０の「開始ホーマーは」伸長プローブアームを指し、両方の図中の上側の円の弧は、その値を中心とするＴ_ｍのビン（ｂｉｎ）に対する平均配列読取りカウントを示し、両方の図中の中央の円の弧は［すなわち、底部の円のフラットな線ではない］はサンプル標準偏差を示す）。

事象（４）の成功した伸長の確率は、伸長領域におけるジヌクレオチド配列を横切る伸長確率の積で説明され得る。各ジヌクレオチドには、ポリメラーゼがそれを上手く取り込む確率を割り当てることができ、伸長領域を交差するポリメラーゼの確率は、伸長領域を横切るこれらの確率の積であり得る。

ＭＩＰ（分子反転プローブ）産物配列決定読取りの公的なデータベースは、例えば、Ｐｏｒｒｅｃａｅｔａｌ．ＮａｔＭｅｔｈｏｄｓ．Ｎｏｖ；４（１）：９３１−６（２００７）による“Ｍｕｌｔｉｐｌｅｘａｍｐｌｉｆｉｃａｔｉｏｎｏｆｌａｒｇｅｓｅｔｓｏｆｈｕｍａｎｅｘｏｎｓ”、およびＤｅｎｇｅｔａｌ．，ＮａｔＢｉｏｔｅｃｈｎｏｌ．２７（４）：３５３−６０（２００９）による“ＴａｒｇｅｔｅｄｂｉｓｕｌｆｉｔｅｓｅｑｕｅｎｃｉｎｇｒｅｖｅａｌｓｃｈａｎｇｅｓｉｎＤＮＡｍｅｔｈｙｌａｔｉｏｎａｓｓｏｃｉａｔｅｄｗｉｔｈｎｕｃｌｅａｒｒｅｐｒｏｇｒａｍｍｉｎｇを含む、上記のモデルのパラメータを知るために使用することができる。

３．２プローブ捕獲および検出
本発明は、試験サンプル中の１つまたは複数の対象の生物の存在の検出方法を提供する。特定の実施形態では、方法は、上記のように、捕獲反応において上記のプローブを含む混合物を上記の試験サンプルのいずれかと接触させるステップを含む。特定の実施形態では、プローブを含む混合物は、ポリメラーゼ酵素およびヌクレオチド三リン酸（ＮＴＰ）と共に、試験サンプルから抽出された核酸と接触され、混合物中の少なくとも１つの相同プローブ配列のポリメラーゼ依存性伸長によって、少なくとも１つの対象の領域を捕獲する。特定の実施形態では、相同プローブ配列のポリメラーゼ依存性伸長の後に、伸長された（すなわち、ポリメラーゼによって）相同プローブ配列の末端が他の相同プローブ配列の末端に連結され、対象の生物のゲノムからの対象の領域を含有する環状化プローブが生成される。いくつかの実施形態では、連結反応は、標的アームが標的とハイブリッド形成される間に発生する。他の実施形態では、標的アームは、他のプローブ分子に対するトランス連結よりも自己連結を好む反応条件下の溶液（例えば、希釈連結溶液）中で、標的から解離されて連結される。実例については、図２（Ａ）または図２（Ｃ）を参照されたい。

図２（Ｃ）は、本発明によって提供される方法の１つの特定の実施形態を図解する。簡単に言うと、対象の生物中の標的配列に対するプローブのハイブリダイゼーションの後、ポリメラーゼ媒介性の標的−配列指向性の、３’相同プローブ配列に対するヌクレオチドの付加が行われ、プローブの５’相同プローブ配列における妨害物のために終端する。連結反応は、末端の３’ヌクレオチドをアームＨ２の５’ヌクレオチドに結合させる。

サンプルは、一本鎖ＤＮＡを消化するためにエンドヌクレアーゼで処理される。プローブ骨格に相補的なプライマーは、配列決定のためにＭＩＰをｄｓＤＮＡに増幅する。サンプル反応産物または増幅反応産物の多重化のために、この段階の増幅プライマーはサンプル特異的ヌクレオチドバーコード配列を含有することができ、例えば、これらはアダプタマープライマーである。独特のプライマーバーコード分子配列は、そのため、各試験サンプルを同定する。例えば、１００プローブのパネルは、５０の個々の試験サンプルと接触される。配列読取りにおいて検出される相同プローブ配列は、対象の生物、例えば、特定の病原体または株を同定する。各試験サンプルの増幅反応は、１つの独特のプローブセットを用いて行われる。増幅プライマー内の各バーコードは、患者に対する識別子の機能を果たすために使用することができ、例えば、バーコードを含有する。従って、５０対の増幅プライマー（増幅反応産物のそれぞれに対して１つ）および１つの１００プローブのパネル（例えば、１００の対象の生物に対する）が、５０サンプルの多重アッセイのために必要とされる。

図２（Ａ）は、代替の実施形態を図解する。いくつかの実施形態では、各試験サンプルは、独特のプローブセット、例えばパネルと接触される。各試験サンプルについての増幅反応産物がプールされる。各試験サンプルは、独特のプローブセットと接触されるので、相同プローブ配列および捕獲配列は、標的生物および試験サンプルの両方を同定する。いくつかの実施形態では、プローブ認識配列をさらに含む従来のプライマー対（すなわち、相同プローブ配列を含む）は、増幅アーチファクトを低減するために少ないサイクル数（１０未満）を用いて、対象の領域を増幅するためにサンプル核酸と接触される。次に、従来のプライマー対増幅産物のプローブ認識配列に向けられたプローブが適用される。ポリメラーゼ伸長および連結は、従来のプライマー対の相同プローブ配列および介在する対象の領域を捕獲する。独特のバーコード化プローブ配列は、サンプル（例えば、患者）の多重化を可能にする。配列読取りは、相同プローブ配列（対象の生物を同定する）およびバーコード（サンプル、例えば患者に関連する）を含むであろう。１００プローブパネルおよび５０試験サンプルの例では、対象の生物はそれぞれ、対象の生物、例えば病原体を同定する一対の相同プローブ配列を有する。試験サンプルは、独特のプローブセットと接触されるであろう。プローブ骨格内の各バーコードは、サンプル識別子の機能を果たすために使用され得る。従って、この説明的な実施形態では、それぞれに１００プローブを有する５０セットのプローブが使用される。

本発明によって提供される方法で使用するためのポリメラーゼには、Ｔａｑポリメラーゼ（Ｌａｗｙｅｒｅｔａｌ．，Ｊ．Ｂｉｏｌ．Ｃｈｅｍ．，２６４：６４２７−６４３７（１９８９）、Ｇｅｎｂａｎｋ受入：Ｐ１９８２１）、Ｌａｗｙｅｒｅｔａｌ．，ＰＣＲＭｅｔｈ．Ａｐｐｌ．，２：２７５−２８７（１９９３）に記載される５’→３’ヌクレアーゼ欠損「Ｓｔｏｆｆｅｌ」断片を含む）、ＰＨＵＳＩＯＮ（商標）高忠実度（ｈｉｇｈｆｉｄｅｌｉｔｙ）組換えポリメラーゼ（ＮＥＢ）、およびパイロコッカス・フリオサス（Ｐｙｒｏｃｏｃｃｕｓｆｕｒｉｏｓｕｓ）（Ｐｆｕ）ポリメラーゼ（例えば、米国特許第５，５４５，５５２号明細書を参照）、ならびにＴｏｐｏＴａｑおよびＰｆｕＣ２などのらせん−ヘアピン−らせんドメインを含むポリメラーゼ（Ｐａｖｌｏｖｅｔａｌ．，ＰＮＡＳ，９９：１３５１０−１５（２００２））が含まれる。より特定の実施形態では、ポリメラーゼは、ＴａｑポリメラーゼのＳｔｏｆｆｅｌ断片（３’→５’プルーフリーディング活性がさらに欠如している）などの５’→３’ヌクレアーゼ欠損である。５’→３’エキソヌクレアーゼ活性が欠如したポリメラーゼは、例えば、スクリーニングまたは合理的設計の方法に基づいて、当該技術分野において知られている手段によって生成することができる。例えば、ポリメラーゼ変異体は、ＴａｑのＳｔｏｆｆｅｌ断片への１つまたは複数のポリメラーゼの配列アライメントに基づいて、および／または、解かれたポリメラーゼ構造に配列を「通すこと（ｔｈｒｅａｄｉｎｇ）」によって設計することができる（例えば、ＭＭＤＢＩＤ５６５３０、８１８８４および８１８８５）。

特定の実施形態では、本発明の方法において使用するためのポリメラーゼは、Ｐｆｕ、Ｔ４ＤＮＡポリメラーゼ、またはＴ７ＤＮＡポリメラーゼなどの非置換ポリメラーゼである。他の実施形態では、本発明によって提供される方法で使用するためのポリメラーゼは等温増幅に適切なポリメラーゼであり、捕獲および／または増幅反応は、例えば、金属イオン濃度を調節することによって、ならびに／あるいは、特定のポリメラーゼおよび／または追加の酵素、例えば、ヘリカーゼまたはニッキング酵素（プライマー生成ＲＣＡおよびＥＸＰＡＲなど）を用いることによって等温的に実施される。例えば、米国特許第６，５６６，１０３号明細書、Ｍｕｒａｋａｍｉｅｔａｌ．，Ｎｕｃｌ．Ａｃｉｄ．Ｒｅｓ．，３７（３）ｅ１９（２００９）、Ｔａｎｅｔａｌ．，Ｂｉｏｃｈｅｍｉｓｔｒｙ，４７：９９８７−９９（２００８）、Ｖｉｎｃｅｎｔｅｔａｌ．，ＥＭＢＯＲｅｐ．，５（８）：７９５−８００（２００４）を参照されたい。等温増幅において使用するためのポリメラーゼとしては、例えば、Ｂｓｔ、Ｂｓｕおよびｐｈｉ２９ＤＮＡポリメラーゼ、および大腸菌（Ｅ．ｃｏｌｉ）ＤＮＡポリメラーゼＩが挙げられる。

他の実施形態では、プローブの混合物は、上記のように、捕獲反応において、試験サンプルから抽出された核酸、リガーゼ酵素、およびｎ−ｍｅｒオリゴヌクレオチドのプールと接触される。実例については、図２（Ｂ）を参照されたい。特定の実施形態では、ｎ−ｍｅｒオリゴヌクレオチドは、少なくとも２、３、４、５、６、７、８、９、１０、１２、１４、１６、１８、２０、２２、２４または２５ヌクレオチドの長さである。より特定の実施形態では、これらはランダムな六量体である。他の実施形態では、これらは、相同プローブ配列とハイブリッド形成する第１および第２の標的配列間の対象の領域の長さのポリヌクレオチドである。いくつかの実施形態では、ｎ−ｍｅｒオリゴヌクレオチドは、１、２、３、４、５、６、７、８、９、もしくは１０のロックド核酸（ＬＮＡ）、または１０、２０、３０、４０、５０、６０、７０、８０、９０、もしくは１００％のＬＮＡを含有する。

リガーゼ酵素は、ｎ−ｍｅｒオリゴヌクレオチドを本発明によって提供されるプローブに連結させて、対象の生物からの対象の領域を含有する環状化プローブを生成する。プローブ骨格に相補的なプライマーは、配列決定のために、プローブをｄｓＤＮＡに増幅する。いくつかの実施形態では、例えば多重化のために、増幅プライマーはアダプタマープライマーであり、サンプル識別バーコード配列を含有する。独特のバーコード配列は、そのため、各試験サンプルを多重に同定する。各病原体は、配列読取り内の相同プローブ配列および連結されたｎ−ｍｅｒの独特の組み合わせによって同定される。より特定の実施形態では、ｎ−ｍｅｒオリゴヌクレオチドは、１つまたは複数（例えば、１、２、３、４、５、６、または７）のロックド核酸を含む７−ｍｅｒであり、相同プローブ配列は１０または１２塩基であり、７塩基の対象の領域によって分離される標的配列と特異的にハイブリッド形成する。

本発明の方法において使用するためのリガーゼは、Ｔ４、Ｔ７、および熱安定性リガーゼ、例えば、Ｔａｑリガーゼ（Ｔａｋａｈａｓｈｉｅｔａｌ．，Ｊ．Ｂｉｏｌ．Ｃｈｅｍ．，２５９：１００４１−４７（１９８４）、および国際公開第９１／１７２３９号パンフレットに記載される）、およびＡＭＰＬＩＧＡＳＥ（商標）などを含む。

特定の他の実施形態では、本発明によって提供される従来のＰＣＲプライマーの対（従来のプライマー対）を含む混合物は、対象の生物中の２つの標的領域間の対象の領域を増幅するために、サンプル核酸と接触される。特定の実施形態では、限定された数の増幅ステップが実施される。特定の実施形態では、２５、２０、１５、１０、９、８、７、６、５、４、３、または２回未満の増幅サイクルが実施される。特定の実施形態では、従来のプライマー対の混合物は、対象の領域を増幅するために、試験サンプルから抽出された核酸、ポリメラーゼ、およびヌクレオチド三リン酸と接触される。この方法の実例は図３に示される。従来のプライマー対の多数の組み合わせを使用して、同じサンプルチューブ内で、あるいはプーリングのために別々に、反応を多重化することができる、いくつかの実施形態では、従来のプライマー対中の普遍的プローブ認識配列（例えば、バーコード）に結合するプライマーは、ヌクレオチドバーコード、および次世代ＤＮＡ配列決定技術プライマーのための認識部位を導入する。

本発明の一部として、従来のプライマー対は、様々な追加の方法において使用することができる。例えば、いくつかの実施形態では、従来のプライマー対は、少なくとも１つの標的核酸を含有する疑いがあるサンプル核酸と接触され得る。特定の実施形態では、対象の領域をサンプル核酸から直接増幅するためにＰＣＲが使用され得る。他の実施形態では、捕獲反応産物、例えば、１つまたは複数の環状化プローブを増幅するために、従来のプライマー対が使用され得る。他の実施形態では、対象の領域を含有する疑いがあるサンプル核酸は、従来のプライマー対を用いて増幅され、次に、環状化捕獲のために本発明によって提供されるプローブと接触される。いくつかの実施形態では、従来のプライマー対は、サンプル核酸、およびビオチン化ヌクレオチドなどの修飾ヌクレオチドと接触される。ビオチン化ヌクレオチドなどの修飾ヌクレオチドを用いるいくつかの実施形態では、次に、得られた捕獲または増幅反応産物は、例えば、ステプトアビジン（ｓｔｅｐｔａｖｉｄｉｎ）基質によるアフィニティ捕獲によって、次の処理、例えば、本発明によって提供されるプローブを用いる環状化捕獲のために単離することができる。さらなる実施形態では、単一の従来のプライマーは、サンプル核酸中の対象の領域の線状増幅のために使用され、次に、環状化捕獲のために、本発明によって提供されるプローブと接触され得る、他の実施形態では、５’ビオチン部分を含有する単一の従来のプライマーは標的配列を増幅するために使用されてから、例えば、本発明によって提供される特異的な従来のプライマー対を用いる直接配列決定によって、あるいはランダムな六量体プライミングによって、配列決定のためにストレプトアビジン捕獲を用いてサンプルから濃縮されてもよいし、あるいは、本発明によって提供されるプローブを用いる環状化捕獲のために使用されてもよい。

特定の実施形態では、捕獲反応を含む方法は、さらに、捕獲反応産物を１つまたは複数のエキソヌクレアーゼと接触させて、線状核酸を除去するステップを含む。特定の実施形態では、エキソヌクレアーゼは、ｅｘｏＩ、ｅｘｏＩＩＩ、ｅｘｏＶＩＩ、およびｅｘｏＶのうちの少なくとも１つを含む。さらに特定の組み合わせでは、エキソヌクレアーゼは、１００：１、５０：１、２５：１、１０：１、５：１、２：１、１：１、１：２、１：５、１：１０、１：２５、１：５０、または１：１００（単位対単位）までのエキソヌクレアーゼＩおよびエキソヌクレアーゼＩＩＩの混合物である。

特定の実施形態では、本発明の方法はさらに、捕獲反応産物を増幅反応において増幅するステップを含む。核酸を増幅する多数の方法は当該技術分野において知られており、ポリメラーゼ連鎖反応（例えば、米国特許第４，６８３，１９５号明細書および同第４，６８３，２０２号明細書、ならびにＭｃＰｈｅｒｓｏｎａｎｄＭｏｌｌｅｒ，ＰＣＲ（ｔｈｅｂａＳＩＣｓ），Ｔａｙｌｏｒ＆Ｆｒａｎｃｉｓ；２ｅｄｉｔｉｏｎ（Ｍａｒｃｈ３０，２００６）を参照）、ＯＬＡ（オリゴヌクレオチド連結増幅）（例えば、米国特許第５，１８５，２４３号明細書、同第５，６７９，５２４号明細書、および同第５，５７３，９０７号明細書を参照）、ローリング−サークル増幅（「ＲＣＡ」、Ｂａｎｅｒｅｔａｌ．，Ｎｕｃ．ＡｃｉｄｓＲｅｓ．，２６：５０７３−７８（１９９８）、Ｂａｒａｎｙ，ＰＮＡＳ，８８：１８９−９３（１９９１）、およびＬｉｚａｒｄｉｅｔａｌ．，Ｎａｔ．Ｇｅｎｅｔ．１９：２２５−３２（１９９８）に記載）、およびストランド置換増幅（ＳＤＡ、米国特許第５，４５５，１６６号明細書および同第５，１３０，２３８号明細書に記載）を含む。特定の実施形態では、増幅は、ＲＣＡなどの線状増幅である。より特定の実施形態では、捕獲反応産物（例えば、環状化プローブ）はＲＣＡにおける鋳型として使用され、長い線状の反復ｓｓＤＮＡ産物を生成する。いくつかの実施形態では、ＲＣＡ反応は、サンプルを、ビオチン化ヌクレオチド、ＬＮＡヌクレオチド、またはＩｓｏｄＣもしくはＩｓｏｄＧなどの人工的な塩基対、または脱塩基フラン（ｄＳｐａｃｅｒなど）などの修飾ヌクレオチドと接触させて、アフィニティ濃縮および精製を容易にすることを含むことができる。特定の実施形態では、線状反復ｓｓＤＮＡを含む増幅反応産物は、本発明によって提供される従来のプライマーと接触されて、長さ２、３、４、５、６、７、１０、１５、２０、３０、４０、５０、７５、１００、５００ヌクレオチドを有する二本鎖ＤＮＡの短い伸長を生成することができる。特定の実施形態では、伸長の長さは、このポリメラーゼの延長の最適温度における伸長ステップの時間（例えば、３７、４２、４５、６８、７２、７４℃を含む温度で５、１０、１５、２０、４０、６０秒）によって調節され得る。他の実施形態では、伸長の長さは、さらなる延長が防止されたヌクレオチド類似体、例えば、ジデオキシシトシン（ｄｉｄｅｏｘｙＣｙｔｏｓｉｎｅ）、または３’修飾、例えばビオチン、またはアミノ基で終結されるは炭素スペーサーを有するヌクレオチドを反応中で混合することによって調節される。追加の特定の実施形態では、プライマーは、線状反復ｓｓＤＮＡのＲＣＡ増幅反応産物と接触され、単一のＰＣＲサイクルのためのポリメラーゼによって伸長されて、ＲＣＡ産物の反復単位に対する相補的配列を含有する短い一本鎖ＤＮＡを生成する。より特定の実施形態では、線状反復ｓｓＤＮＡのＲＣＡ増幅反応産物と接触されたプライマーは、制限酵素切断部位を含むｄｓＤＮＡ領域を生成する。従って、特定の実施形態では、プライマーが線状反復ｓｓＤＮＡのＲＣＡ増幅反応産物とハイブリッド形成して二本鎖ＤＮＡ領域を形成する場合、増幅反応産物は、制限酵素と接触されてより短い断片を生成する。

特定の実施形態では、増幅反応はアダプタマープライマーを使用する。いくつかの実施形態では、増幅反応は、サンプル特異的プライマー、すなわちサンプルを同定するプローブ中に存在する配列とハイブリッド形成するプライマーを使用する。特定の実施形態では、増幅アーチファクトを回避するために、少数の増幅サイクル、例えば、２５、２０、１５、１０、９、８、７、６、５回未満のサイクルが使用される。

特定の実施形態では、本発明によって提供される方法は、サンプル核酸、捕獲反応産物または増幅反応産物を、ビオチン分子などの捕獲されるように設計された部分、およびサンプル核酸、捕獲反応産物、または増幅反応産物とハイブリッド形成することができる核酸配列を含む二次捕獲オリゴヌクレオチド捕獲プローブと接触させるステップを含むことができる。このようなオリゴヌクレオチド（ビオチン化オリゴヌクレオチドなど）は、アフィニティ精製を用いてその標的核酸を濃縮するために使用され得る。いくつかの実施形態では、ビオチン化オリゴヌクレオチドは、捕獲された配列（すなわち、それは対象の領域に対して相補的である）、相同プローブ配列、または骨格配列（例えば、バーコード配列など）と特異的にハイブリッド形成し得る。特定の実施形態では、ビオチン化プローブは、好熱性または中温性ポリメラーゼを用いて、サンプル核酸、捕獲反応産物または増幅反応産物上で伸長され得る。より特定の実施形態では、方法は、ビオチン：ストレプトアビジン相互作用を用いる特定の捕獲反応産物の濃縮のために、捕獲反応産物をビオチン化オリゴヌクレオチドと接触させることを含む。

本発明の方法によって捕獲される配列は、例えば、アレイハイブリダイゼーションまたは直接配列決定を含む手段によって検出することができる。いくつかの実施形態では、捕獲された配列は、増幅することなく配列決定によって検出され得る。多数の配列決定方法は当該技術分野において知られており、本発明の方法において使用することができ、例えば、米国特許第６，９４６，２４９号明細書およびＭｅｔｚｋｅｒ，Ｎａｔ．Ｒｅｖｉｅｗｓ，Ｇｅｎｅｔｉｃｓ，１１：３１−４６（２０１０）、Ａｎｓｏｒｇｅ，Ｎａｔ．Ｂｉｏｔｅｃｈｎｏｌ．，２５（４）：１９５−２０３（２００９）、ＳｈｅｎｄｕｒｅａｎｄＪｉ，Ｎａｔ．Ｂｉｏｔｅｃｈｎｏｌ．，２６（１０）：１１３５−４５（２００８）、Ｓｈｅｎｄｕｒｅｅｔａｌ．，Ｎａｔ．Ｒｅｖ．Ｇｅｎｅｔ．５：３３５−４４（２００４）において概説される。いくつかの実施形態では、配列決定方は、ＤＮＡポリメラーゼまたはＤＮＡリガーゼのいずれかの特異性に依存しており、例えば、ピロシーケンス、塩基伸長配列決定（単一の塩基の段階的伸長）、合成による多塩基配列決定（例えば、末端標識ヌクレオチドによる配列決定を含む）、およびゆらぎ（ｗｏｂｂｌｅ）配列決定（連結に基づく）が含まれる。伸長配列決定は、例えば、米国特許第５，３０２，５０９号明細書で開示される。末端リン酸標識ヌクレオチドおよびその使用方法の例示的な実施形態は、例えば、米国特許第７，３６１，４６６号明細書、米国特許出願公開第２００７／０１４１５９８号明細書（２００７年６月２１日に公開）、およびＥｉｄｅｔａｌ．，Ｓｃｉｅｎｃｅ，３２３：１３３−１３８（２００９）に記載されている。リガーゼに基づく配列決定方法は、例えば、米国特許第５，７５０，３４１号明細書、ＰＣＴ公報国際公開第０６／０７３５０４号パンフレット、およびＳｈｅｎｄｕｒｅｅｔａｌ．，Ｓｃｉｅｎｃｅ，３０９：１７２８−１７３２（２００５）に開示されている。特定の実施形態では、本発明によって提供される方法で使用される配列決定技術は、Ｓａｎｇｅｒ配列決定、微量電気泳動配列決定、ナノポア配列決定、ハイブリダイゼーションによる配列決定（例えば、アレイベースの配列決定）、単一分子のリアルタイム観察、および環状アレイ配列決定を含み、例えば、ピロシーケンス（例えば、４５４ＳＥＱＵＥＮＣＩＮＧ（登録商標）、例えば、Ｍａｒｇｕｌｉｅｓｅｔａｌ．，Ｎａｔｕｒｅ，４３７：３７６−３８０（２００５）を参照）、ＩＬＬＵＭＩＮＡ（登録商標）またはＳＯＬＥＸＡ（登録商標）配列決定（例えば、Ｔｕｒｃａｔｔｉｅｔａｌ．，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．，３６、ｅ２５（２００８）を参照、また、米国特許第７，５９８，０３５号明細書、同第７，２８２，３７０号明細書、同第７，２３２，６５６号明細書、および同第７，１１５，４００号明細書も参照）、ポロニー配列決定（例えば、ＳＯＬｉＤ（商標）、Ｓｈｅｎｄｕｒｅｅｔａｌ．２００５を参照）、および合成による配列決定（例えば、ＨＥＬＩＣＯＳ（登録商標）、例えば、Ｈａｒｒｉｓｅｔａｌ．，Ｓｃｉｅｎｃｅ，３２０：１０６−１０９（２００８）を参照）が含まれる。

特定の実施形態では、捕獲プローブは、特定の配列決定技術による配列決定のための処理を容易にする配列を含有し、例えば、合成による配列決定のためのアンカー部位、配列決定反応の開始のためのプライマー部位、または特定の増幅産物の配列決定のためにオリゴヌクレオチドアダプターの連結を改善するための開裂を可能にする制限酵素部位としての役割を果たすことができる配列を含有する。いくつかの実施形態では、環状化捕獲プローブは、捕獲プローブのポリメラーゼ媒介性の伸長を刺激して、元の環状プローブの少なくとも１つ〜１００万またはそれ以上の鎖状体化コピーを含む、環状化プローブの配列に相補的な配列を生成するオリゴヌクレオチドによって接触される。

本発明によって提供される混合物および方法は、任意の適切な検出手段（上記のものを含むがこれらに限定されない）と共に使用するために容易に適合させることができる。、ＩＬＬＵＭＩＮＡ（登録商標）またはＳＯＬＥＸＡ（登録商標）配列決定を用いる特定の実施形態では、より短い相同プローブ配列が、本発明によって提供されるプローブ、および従来のプライマー対において使用され得る。より特定の実施形態では、相同プローブ配列は、約８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、または２０塩基であろう。より特定の実施形態では、プローブまたは従来のプライマー対の標的配列間の対象の領域は、約２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、２０、２５、３０、３５、４０、４５、または５０塩基である。さらにより特定の実施形態では、本発明によって提供されるプローブは、ポリメラーゼ依存性の合成および連結によって、あるいは約２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、２０、２５、３０、３５、４０、４５、または５０塩基のｎ−ｍｅｒオリゴヌクレオチドの連結によって環状化され得る。さらにより特定の実施形態では、対象の領域は約７塩基であり、相同プローブ配列は１０または１２塩基である。さらなる実施形態では、ロックド核酸を含む７−ｍｅｒオリゴヌクレオチドが本発明によって提供されるプローブによって連結され、さらにより特定の実施形態では、７−ｍｅｒオリゴヌクレオチドは、少なくとも１、２、３、４、５、６、または７のロックド核酸（ＬＮＡ）を含む。

他の実施形態では、捕獲または増幅反応産物は、例えば、Ｂｉｎｌａｄｅｎｅｔａｌ，ＰＬｏＳＯｎｅ．２（２）：ｅ１９７（２００７）に開示されるような合成によるエマルジョン滴（ｅｍｕｌｓｉｏｎｄｒｏｐｌｅｔ）配列決定によって配列決定することができる。特定の実施形態では、エマルジョンＰＣＲおよび合成による配列決定のために捕獲されたＤＮＡのエマルジョンを容易にするために、捕獲産物はＲＣＡにより増幅されて、単一ＤＮＡ分子内により高いコピー数の捕獲産物を生成し得る。例えば、Ｄｒｍａｎａｃｅｔａｌ，Ｓｃｉｅｎｃｅ３２７（５９６１）：７８−８１（２０１０）を参照されたい。

特定の実施形態では、異なるサンプルを含有する捕獲反応産物および／または増幅反応産物は、検出の前に結合される。特定の実施形態では、捕獲および／または増幅反応産物は、検出の前に組み合わせ的にプールされ、例えば、個々の捕獲反応産物および／または増幅反応産物のＭｘＮアレイは行および列によってプールされ、プールが検出される。行および列プールからの結果は、次に、デコンボリューションされて、個々のサンプルの結果を提供することができる。より高次元のアレイおよびプールが同様に使用されてもよい。他の実施形態では、捕獲反応産物および／または増幅反応産物は、識別バーコード配列を含有する。特定の実施形態では、増幅プライマーは、サンプル特異的バーコード配列を含有する。従って、捕獲反応産物および／または増幅反応産物のプール中に含有される配列のサンプル源は、そのバーコード配列によって同定される。

本発明によって提供される方法は、特定の標的増幅産物または増幅産物セットなどの、捕獲反応産物または増幅反応産物中の特定の核酸を直接検出することを含んでいてもよい。従って、いくつかの実施形態では、本発明の混合物は、特殊化したプローブセットを含み、例えば、５’→３’エキソヌクレアーゼ活性を有するＤＮＡポリメラーゼによって放出される検出可能なレポーターおよび失活剤部分を含有するハイブリッド形成可能なプローブを使用するＴＡＱＭＡＮ（商標）（米国特許第５，５３８，８４８号明細書）、反対の末端にレポーターおよび消光部分を有するヘアピンプローブを使用する分子ビーコン（米国特許第５，９２５，５１７号明細書）、蛍光ドナーおよびアクセプター部分をそれぞれ有する一対の隣接するプライマーを使用する蛍光共鳴エネルギー移動（ＦＲＥＴ）プライマー（米国特許第６，１７４，６７０号明細書）、および、標的に結合されたときにだけ蛍光を発する単一の短いプローブであるＬＩＧＨＴＵＰ（商標）（米国特許第６，３２９，１４４号明細書）が含まれる。同様に、ＳＣＯＲＰＩＯＮ（商標）（米国特許第６，３２６，１４５号明細書）およびＳＩＭＰＬＥＰＲＯＢＥＳ（商標）（米国特許第６，６３５，４２７号明細書）は、単一のレポーター／色素プローブを使用する。増幅産物検出プローブは、使用される特定の検出モダリティに従って、そして上記の特許において考察されるように設計される。特定の実施形態では、特定の捕獲反応産物または増幅反応産物を検出するための定量的なリアルタイムＰＣＲアッセイは、ＩＬＬＵＭＩＮＡ（登録商標）ＥＣＯリアルタイムＰＣＲシステム（商標）において実施され得る。

特定の実施形態では、本発明の方法は、試験サンプル中の対象の生物の濃度を推定するために、サンプル内部較正核酸（ＳＩＣ）の使用を含む。これは、対象の生物からの配列の頻度をＳＩＣの既知の濃度に対して較正することによって行われ、試験サンプル中の対象の生物の推定濃度が提供される。より特定の実施形態では、対象の生物の推定濃度は、病状および／またはおそらく臨床診断に関連する基準濃度の対象の生物のデータベースと比較される。

いくつかの実施形態では、本発明の方法はさらに、結果をフォーマットして医師の意思決定を通知するステップを含む。「結果」は標的生物の検出の成果を指し、例えば、バイナリ（例えば、＋／−）検出および濃度の推定値を含み、特に、捕獲反応産物または増幅反応産物の配列決定の結果に基づくことができる。特定の実施形態では、フォーマッティングは、場合により統計的信頼区間を含む試験サンプル中の生物濃度の推定値を提示することを含む。より特定の実施形態では、フォーマッティングはさらに、結果のカラーコーディングを含む。特定の実施形態では、フォーマッティングは、例えば、入院、生菌治療（ｐｒｏｂｉｏｔｉｃｔｒｅａｔｍｅｎｔ）、抗生物質治療、および化学療法を含む、治療的介入のための勧告を含む。いくつかの実施形態では、フォーマッティングは、以下のうちの１つまたは複数を含む：査読された医学文献および経験的に定義されたサンプル結果のデータベース統計への言及。結果の例示的なフォーマットは図６に示される。

図１１は、特に、配列決定結果の処理、分析、および出力のための方法の例示的な実施形態のフローチャートである。

３．３配列分析
生の配列データの変換は３段階で生じることができ、すなわち、（１）生の装置データの処理およびアライメントされた配列決定読取りへの変換、（２）読取りデータの統計的解釈、および（３）出力の提供およびアーカイブへの保存である。

生の装置読出しからの生データの、病原体ゲノム中の位置に関連する配列情報への処理は、少なくとも２つの以下のステップを含み得る：
１．配列読出し（「読取り」）およびアライメントの前またはアライメント中のいずれかの関連の品質スコアファイルを統合するステップであって、配列決定プラットフォームが、エラーを捕獲し、読取り長さを有する配列の低下を同定するために品質スコアを作成するステップ、
２．病原体ゲノムの読取りをアライメント／位置付けするステップ。

いくつかの実施形態では、統計的分析および解釈は次に、全てのゲノムに対する全ての統計的に優位なヒットの説明に入り、場合により、病原体の耐性座位または独特の識別子などの対象の領域によるヒットを細分類する。

サンプル内に存在する生物の定量的な分析をもたらすために、配列決定装置からの生ＦＡＳＴＱデータの処理、および基準ゲノムに対する定量化を示す例示的なワークフローは、図１２に示される。

次世代配列決定読取りから得られる配列の例示的なアライメントは図１４に示される。個々に示されるように、配列決定読取りは、プローブアーム領域を通してほぼ完全に一致する標的ゲノムＤＮＡとアライメントされ得る。ポリメラーゼ伸長領域におけるアライメントは、この領域内の配列の変化を明らかにすることができ、これらの増幅産物配列を異なる株に割り当てることが可能になる。

サンプル中の株を同定するための、基準株のデータベースに対する配列読取りアライメントの使用の略図は図１５に示される。いくつかの読取りは、１つまたは複数の株の間で共通の領域に位置付けることができる。この略図では、ほとんどの読取りは株Ａ、Ｂ、ＣおよびＤにアライメントし、共通である。対照的に、他の読取りは、特定の株（例えば、株Ｄにのみアライメントする読取りのサブセット）に独特であり得る。いくつかの実施形態では、サンプル中に存在するそれぞれの独特の病原体の割合の定量的な推定値を提供するために、定量的モデルが使用されて、共通の読取りおよび独特の読取りの分布を予測する。

いくつかの実施形態では、図１６に示されるように、正確な多型モデリングおよび次世代配列決定による検出が実施される。３’プローブアーム、ポリメラーゼ伸長部位（矢印）、およびポリメラーゼ伸長領域の一部が上部に示される。下側のプロットは、配列読取りに沿って各ヌクレオチドにおいて、期待される標的配列と、配列読取りとの間で観察されるミスマッチを示す。ポリメラーゼ伸長領域を横切るミスマッチの頻度のモデリングは、バックグラウンドの配列決定エラーおよびノイズの結果ではない多型の正確な同定を可能にし得る。

統計的分析は、一般に、全ての病原体に対するヒット密度などの簡単な要約統計量を含み、ここで、ヒット密度は、配列のウインドウ内のヒット数を高品質の読取り数によって除したものである。これは、病原体配列中の配列座標によって、あるいは「対象の領域」ＩＤおよびその中心からの距離の組み合わせによって記録することができる。さらに、分類方法論を用いて、サンプルの病原体への正確な割り当てを提供することができる。利用可能なツールボックスは、最大尤度およびベイズアプローチ、線形判別に基づく方法論、ならびにニューラルネットワークアプローチを含む。このアプローチは、このようなアプローチのいずれか１つまたは組み合わせを用いることができる。同様または関連の問題において立証済みの実績がある既知の方法は、隠れマルコフモデル（ＨＭＭ）、ＰａｒｚｅｎＷｉｎｄｏｗｓ、多変数回帰（ＬＯＥＳＳ回帰を含む）、およびサポートベクターマシン（ＳＶＭ）である。いくつかの実施形態では、開示される方法は、最大の特異性および感度を達成するために基準データセットに対して評価されるこれらのアプローチのうちの１つまたは複数を用いる。最終的な分析は、本発明のシステムにおいて多数のサンプルを実行することと、「最も信頼できる（ｇｏｌｄｓｔａｎｄａｒｄ）」基準とに依存する。このことから、次に、これらのデータの特徴、アッセイを調べ、固定分析アルゴリズムを実行することができる。これらのアルゴリズムは正確には固定されているのではなく、入力データに適合される。この従来の分析は、本発明のシステムのライフサイクルに対して、数回実行される。上記のように実施される統計的解釈は、パワフルなコンピュータサービスにおける従来の分析に依存している。初期分析は分析および解釈についてのアルゴリズム方法を生成し、次に、これを本発明のシステムに配備することができる。

従って、いくつかの実施形態では、プローブセットを用いる捕獲反応に従う配列決定およびその後の分析の目標は、サンプル中にそのＤＮＡが存在する生物または株のセットを決定することである。いくつかの実施形態では、さらなる目標は、サンプル中のこれらの生物または株の相対量を決定することである。

分析方法は、配列決定読取り中のエラーの確率のためのモデル、および生物の関連株の間で生じる突然変異のためのモデルに依存し得る。これらのモデルの最も簡単な型は、等しい確率を有するように全てのエラーまたは変化を処理する。ここで、その確率はデータから得られてもよいし、研究者の最良の推測に基づいて選択されてもよい。いくつかの実施形態では、より進歩したモデルは、同じ機械、サンプル調製、および分析ソフトウェアを用いて、既知の鋳型材料の配列決定データセットから異なるタイプのエラーの確率を学習することができる。その他の進歩したモデルは、遺伝子もしくはゲノムの公的なデータベース、遺伝子もしくはゲノムの私的なデータベース、または配列決定読取りの構築されていない集合もしくは部分的に構築された集合からの既知の株のセットに基づいて、突然変異の確率を学習することができる。

既知のゲノムのデータベースと、反応で使用されるプローブのセットとに基づいて、期待される読取り配列のセットが計算される。期待される読取り配列はそれぞれ、１つのプローブおよび１つのゲノムから得ることができ、従って、期待される読取り配列の数はゲノムの数とプローブの数の積であり得る。

反応から配列決定読取りのセット（または読み取りの対）が得られると、読取りは、期待される読取りのセットに対してアライメントされ得る。配列決定エラーのためのモデルを用いて、方法は、期待されるそれぞれの産物から得られる読取り（または読取りの対）確率を計算し得る。次に、方法は、選択される最低の確率、例えば、１、．０１、または．００１よりも高度に読取りがアライメントされる、期待される全ての産物からの生物／株の結合として、サンプル中に存在し得る全ての生物または株のセットを算出する。

いくつかの実施形態では、分析方法はさらに、
１）期待される読取りのそれぞれにアライメントする各読取りの確率と、
２）サンプル中の各生物または株を観察する事前確率（このタイプの確率について、各生物または株は同様に確からしい）と、
３）存在し得る生物または株の数の事前確率（このタイプの確率の最も簡単な形では、生物または株のそれぞれの数は同様に確からしいかもしれない。別の形では、生物または株の数の確率は、ディリクレ分布を可能にし得る。）と
が与えられれば、割合または存在量が、観察される配列決定読取りのセットの実際の発生の確率を最小限にするように、各生物または株の相対的な割合または存在量を決定する。

いくつかの実施形態では、分析方法は、「混合物モデル」によって、生物の相対的な割合または存在量を決定する。いくつかの実施形態では、モデルにおける隠れ変数は、生物または株の割合または存在量、および期待される読取りへの配列決定読取りの割り当てである（ここで、観察される読取りはそれぞれ、単一の期待される読取りに割り当てられる）。Ｅｘｐｅｃｔａｔｉｏｎ−Ｍａｘｉｍｉｚａｔｉｏｎ、ＧｉｂｂｓＳａｍｐｌｉｎｇ、およびＭｅｔｒｏｐｏｌｉｓ−Ｈａｓｔｉｎｇｓを含む様々な方法を使用してこれらの隠れ変数の値を見出すことができ、隠れ変数および隠れ変数におけるプライア（ｐｒｉｏｒｓ）が与えられれば、データの確率が最大にされる。

さらなる実施形態では、方法は、突然変異の確率を用いることにより、既知の生物の未知の株も混合物モデルに取り込む。このような実施形態では、未知の株のゲノムは、既知のすべてのゲノムに対して１つまたは複数のミスマッチを含有する、観察された読取りに基づいて生成される。これまで未知のゲノムは、既知のゲノムと同じ確率で混合物に付加され得る。

いくつかの実施形態は、多重試験も補正する。どれか１つの技術に関して限定されずに、目的は、偽陽性および偽陰性を排除することである。ＦＰＲおよびＦＤＲ（ｆａｌｓｅｄｉｓｃｏｖｅｒｙｒａｔｅ）は、任意のシステムに適合することができるので、最も有望な補正の１つである。いくつかの実施形態では、追加の事例が試験されるにつれて時間とともに閾値は更新される。

例示的な実施形態は、サンプルを（１）有意なヒット、（２）不確定なヒット、（３）ヒットの欠如または病原体が見当たらない、あるいは（４）低サンプル品質またはデータエラーに分類する。

結果の出力は、（１）会社のサーバーに対して、（２）例えば、病院システム、電子医療記録（ＥＭＲ）システム、または他のＨＬ７またはｘｍｌ対応の保存システムに寄託するため、現存する健康記録のフレームワークで使用するめに、ｘｍｌおよびＨＬ７フォーマットに対して、ならびに／または（３）医師にとって使いやすいグラフィックおよびテキストフォーマット、例えば、グラフ、表、概要テキスト、および可能な注釈付、基準情報にリンクするウェブフォーマットに対して、並行して生じることができる。出力フォーマットは任意であり、例えば、簡単なテキスト、スプレッドシートデータ、バイナリデータオブジェクト、暗号化および／または圧縮ファイルである。完全な記録は、独特の識別子により診断テストにリンクされたこれらの全てまたはいくつかを含むことができる。これらはコヒーレントオブジェクトに構築されてもよいし、あるいは独特の識別子の検索により構築されてもよい。

図９は、配列決定データの分析およびフォーマッティングを実行するためのシステムアーキテクチャの例示的な実施形態の略図である。このシステムアーキテクチャは、配列決定分析（サーバー）、統計的測定の計算（計算）および出力またはディスプレイ機能（インターフェース）の分離を含む。このようなアーキテクチャの多数の実施形態が存在する。どの特定の物理的な実現に限定されることなく、好ましい実施形態は、これらの主要な構成要素を分析ワークフローおよびアーキテクチャに含む。

３．４例示的なプロトコル
プローブ、捕獲反応産物、および増幅反応産物の製造および使用方法は当該技術分野において知られており、本発明において使用され得る。例示的な方法は、例えば、Ｄｅｎｇｅｔａｌ．２００９、およびＬｉｅｔａｌ，ＧｅｎｏｍｅＲｅｓ．，１９（９）１６０６−１５（２００９）に開示されている。

例えば、本発明の混合物は捕獲反応（捕獲反応産物を形成するため）、増幅反応（増幅反応産物を形成するため）、および捕獲および／または増幅反応産物の配列決定のために、本質的にこれらの参考文献に記載されるように処理することができる。これらおよび他の参考文献において開示される方法は単に例示的ものであり、決して本発明を限定するものではない。例えば、Ｄｅｎｇらは、ＱｉａｇｅｎＤＮｅａｓｙカラムを用いて線維芽細胞、ｉＰＳまたはｈＥＳ細胞の凍結したペレットからゲノムＤＮＡを抽出し、これらをＺｙｍｏＤＮＡＭｅｔｈｙｌａｔｉｏｎＧｏｌｄＫｉｔ（ＺｙｍｏＲｅｓｅａｒｃｈ）により重亜硫酸塩で変換した。本発明の方法では、例えば、ＤＮＡのメチル化を研究するために重硫酸変換が使用され得るが、必ずしも必須ではない。Ｄｅｎｇらは、パドロック（ｐａｄｌｏｃｋ）プローブ（６０ｎＭ）および２００ｎｇの重亜硫酸塩されたゲノムＤＮＡを結合させ、１０μｌの１×ＡｍｐｌｉｇａｓｅＢｕｆｆｅｒ（Ｅｐｉｃｅｎｔｒｅ）中で混合し、９５℃で１０分間変性させてから、５５℃で１８時間ハイブリッド形成させ、その後、１μｌのギャップ充填混合物（１×Ａｍｐｌｉｇａｓｅ緩衝液中、２００μＭのｄＮＴＰ、２ＵのＡｍｐｌｉＴａｑＳｔｏｆｆｅｌＦｒａｇｍｅｎｔ（ＡＢＩ）および０．５単位のＡｍｐｌｉｇａｓｅ（Ｅｐｉｃｅｎｔｒｅ））を反応に添加した。環状化のために、反応を５５℃で４時間の後、９５℃で１分間および５５℃で４時間を５サイクル、インキュベートした。環状化の後に線状ＤＮＡを消化するために、２μｌのエキソヌクレアーゼ混合物（１０Ｕ／μｌのエキソヌクレアーゼＩおよび１００Ｕ／μｌのエキソヌクレアーゼＩＩＩ、ＵＳＢを含有する）を反応に添加し、反応を３７℃で２時間インキュベートしてから、９５℃で５分間不活性化した。

捕獲された配列を増幅するために、Ｄｅｎｇらは、２００ｎＭのＡｍｐＦ６．２−ＳｏＬプライマー、２００ｎＭのＡｍｐＲ６．２−ＳｏＬプライマー、０．４×ＳｙｂｒＧｒｅｅｎＩおよび５０μｌのｉＰｒｏｏｆＨｉｇｈ− ＦｉｄｅｌｉｔｙＭａｓｔｅｒＭｉｘ（Ｂｉｏ−Ｒａｄ）を有する１００μｌの反応中のＰＣＲによって、９８℃で３０秒間、８サイクルの８℃で１０秒間、５８℃で２０秒間、７２℃で２０秒間、１４サイクルの９８℃で１０秒間、７２℃で２０秒間および７２℃で３分間、１０−μｌの環状化産物を増幅した。６％のＰＡＧＥ（６％のＴＢＥゲル、Ｉｎｖｉｔｒｏｇｅｎ）により、期待されるサイズ範囲（３４４〜３９４ｂｐ）の増幅産物を精製した。

次に、Ｄｅｎｇらは、精製ＰＣＲ産物を同じ鋳型ＤＮＡにおいて等モル比で４つのプローブセットと共にプールし、４−μｌの鋳型（１０〜１５ｎｇ／μｌ）、２００μＭのｄＮＴＰ、２０μＭのｄＵＴＰ、２００ｎＭのＡｍｐＦ６．３プライマー、２００ｎＭｍｐＡｍｐＲ６．３プライマー、０．４×ＳｙｂｒＧｒｅｅｎＩおよび２００μｌの２×ＴａｑＭａｓｔｅｒＭｉｘ（ＮＥＢ）を有する４×１００μｌの反応中で、９４℃で３分間、８サイクルの９４℃で４５秒間、５５℃で４５秒間、７２℃で４５秒間および７２℃で３分間、これらを再増幅した。Ｄｅｎｇらは、ＰＣＲ増幅産物をＱｉａｑｕｉｃｋカラムにより精製し、１×ＮＥＢ緩衝液中４、Ｍｍｅｌ：約３．６ｎｍｏｌｅの精製ＰＣＲ増幅産物、１６単位のＭｍｅｌ（２Ｕ／μｌ、ＮＥＢ）、１００μＭのＳＡＭにより３７℃で１時間これらを消化した。Ｄｅｎｇらは、消化物を再度カラム精製し、３ＵのＵＳＥＲ酵素（１Ｕ／μｌ）により３７℃で２時間消化してから、１０単位のＳ１ヌクレアーゼ（１０Ｕ／μｌ、Ｉｎｖｉｔｒｏｇｅｎ）により、１×Ｓ１ヌクレアーゼ緩衝液中、３７℃で１０分間消化した。Ｄｅｎｇらは、断片化ＤＮＡをカラムにより精製し、２．５μｌの１０×緩衝液、２．５μｌのｄＮＴＰ混合物（それぞれ、２．５ｍＭ）、２．５μｌのＡＴＰ（１０ｍＭ）、１μｌの末端修復酵素混合物（Ｅｐｉｃｅｎｔｒｅ）、および１５μｌのＤＮＡを含有する２５−μｌの反応中、２５℃で４５分間、ＤＮＡを末端修復した。約１００〜５００ｎｇの末端修復ＤＮＡを、１μｌのＱｕｉｃｋＬｉｇａｓｅを有する３０μｌの１×ＱｕｉｃｋＬｉｇａｓｅ緩衝液（ＮＥＢ）中、２５℃で１５分間６０μＭのＳｏｌｅｘａ配列決定アダプターにより消化した。Ｄｅｎｇらは、６％ＰＡＧＥにより１５０〜１７５ｂｐのサイズの連結産物をサイズ選択し、５μｌの鋳型、２００ｎＭのＳｏｌｅｘａＰＣＲプライマー、０．８×ＳｙｂｒＧｒｅｅｎＩおよび５０μｌのｉＰｒｏｏｆＨｉｇｈ−ＦｉｄｅｌｉｔｙＭａｓｔｅｒＭｉｘ（Ｂｉｏ−Ｒａｄ）を有する１００μｌの反応中、９８℃で３０秒間、１２サイクルの９８℃で１０秒間、６５℃で２０秒間、７２℃で２０および７２℃で３分間、ＰＣＲによりこれらを増幅した。Ｄｅｎｇらは、ＱｉａｑｕｉｃｋＰＣＲ精製カラムによりＰＣＲ増幅産物を精製し、ＩｌｌｕｍｉｎａＧｅｎｏｍｅＡｎａｌｙｚｅｒにおいてこれらを配列決定した。

Ｌｉらは、以下の方法を使用した。Ｌｉらは、１５μｌの反応中で１×Ａｍｐｌｉｇａｓｅ緩衝液（Ｅｐｉｃｅｎｔｒｅ）、５００ｎｇ（０．２５ａｍｏｌ）のゲノムＤＮＡ（例えば、試験サンプルＤＮＡ）、および４８ｎｇ（１．３２ｐｍｏｌ）のプローブ（各プローブ対ｇＤＮＡのモル比＝１００：１、他の比率の場合はそれに応じて数値が変化する）を混合し、９５℃で１０分間、０．１℃／秒で６０℃まで勾配させて変性さてから、６０℃で２４時間ハイブリッド形成した。次に、２μＬのギャップ充填および密封混合物（Ａｍｐｌｉｇａｓｅ保存緩衝液［Ｅｐｉｃｅｎｔｒｅ］中、５．４μＭのｄＮＴＰ［１００×、１×、１０×、１０００×、および１０，０００×の場合はそれに応じて数値が変化する］、２単位のＴａｑＳｔｏｆｆｅｌ断片［ＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓ］、および２．５単位のＡｍｐｌｉｇａｓｅ［Ｅｐｉｃｅｎｔｒｅ］）を添加し、反応を６０℃で１５分間、１時間、１日間、２日間、または５日間インキュベートした。またＬｉらは、反応のサイクリングも試みた：６０℃で１日後、我々は１０サイクルの９５℃で２分の後、６０℃で２時間を適用した。線状ＤＮＡを除去するために、Ｌｉらはインキュベーション温度を３７℃に下げ、すぐに２μＬのエキソヌクレアーゼＩ（２０単位／μＬ）および２μＬのエキソヌクレアーゼＩＩＩ（２００単位／μＬ）（いずれもＵＳＢから）を添加し、３７℃で２時間の後、９４℃で５分間、反応をインキュベートした。

次に、Ｌｉらは、５０μＬの２×ｉＱＳＹＢＲＧｒｅｅｎｓｕｐｅｒｍｉｘ（Ｂｉｏ−Ｒａｄ）、１０μＬの環鋳型（上から）、および４０ｐｍｏｌの順方向および逆方向プライマーのそれぞれ（ＩＤＴ）を有する２つの１００−μＬのＰＣＲ反応によって環を増幅した。ＰＣＲプログラムは、９６℃で３分、３サイクルの９５℃で３０秒間、６０℃で３０秒間、および７２℃で３０秒間、ならびに１０サイクルの９５℃で３０分間、７２℃で１分間、および７２℃で５分間であった。所望のＰＣＲ産物をゲル精製し、定量化した。各サンプルについて、Ｌｉらは、ＩｌｌｕｍｉｎａＧｅｎｏｍｅＡｎａｌｙｚｅｒバージョン１および更新バージョン２の両方によって、カスタムプライマーにより１０〜２０ｆｍｏｌのＤＮＡを配列決定した。

上記の記載は実例のために提示された。これは包括的ではなく、本発明を、開示される詳細な形態または実施形態に限定しない。本発明の修正および適応は、本明細書の考察および開示される実施形態の実施から当業者には明らかであろう。例えば、記載される実行は、ソフトウェア、ハードウェア、またはハードウェアおよびソフトウェアの組み合わせにおいて実行され得る。ハードウェアの例には、パーソナルコンピュータ、サーバー、ラップトップ、メインフレーム、およびマイクロプロセッサなどの計算または処理システムが含まれる。さらに、当業者は、図面に示されるレコードおよびフィールドが追加のフィールドを有していてもより少ないフィールドを有していてもよく、図面に示されるものとは異なったフィールドを構成し得ることを認識するであろう。本明細書および実施例は単に例示的なものであると考えられることが意図され、本発明の真の範囲および趣旨は以下の特許請求の範囲によって示される。

「約」、「少なくとも」、「未満」、および「よりも多い」などの本出願においていくつかのパラメータを説明する数値範囲の全てについて、記載は必ずしも列挙される値によって拘束される範囲を包含しなくてもよいことは理解されるべきである。従って、例えば、少なくとも１、２、３、４、または５という記載は、特に１〜２、１〜３、１〜４、１〜５、２〜３、２〜４、２〜５、３〜４、３〜５、および４〜５などの範囲も説明する。

本明細書中で引用される全ての特許、出願、または非特許文献および基準配列情報などのその他の参考文献については、全ての目的および列挙される問題のために参照によってその全体が本明細書中に援用されることが理解されるべきである。参照によって本明細書中に援用される文献と本出願との間に矛盾が存在する場合には、本出願が支配するであろう。本出願で開示される基準遺伝子配列に関連するＧｅｎｅｌＤまたは受入番号などの全ての情報（例えば、ゲノム座位、ゲノム配列、機能注釈、対立遺伝子変異体、および基準ｍＲＮＡ（例えば、エクソン境界を含む）およびタンパク質配列（保存ドメイン構造など）を含む）は、参照によってその全体が本明細書中に援用される。

実施例１：プローブ生成プロセス
多数の異なる病原性生物（細菌、ウイルス、真菌および他の生物など）を同時に検出および同定することができる多重診断アッセイにおいて使用することができるＤＮＡオリゴヌクレオチドプローブの設計のための方法が、本明細書において提供される。これは、所与の生物に対して瞬時に非常に特異的であり、臨床的対象の特定の領域を捕獲することができ、そして同一プール内の他の生物の核酸または他のプローブのいずれともクロスハイブリッド形成しないであろうプローブのプールの生成によって達成される。全ゲノム（またはゲノムの群）または特定の対象の領域（例えば、薬物耐性を付与する突然変異、薬物感受性、毒性、病原性、ヒトの伝播性の増大、および診断または臨床関連の他の特徴などの特定の特徴を反映する領域）のいずれかから、ＤＮＡ（またはＲＮＡ）の候補相同性領域が選択される。これらの相同性領域は、特定の生物、株、亜株または血清型を同定するために使用することができる。

ＤＮＡの特定の短い領域（通常、数千塩基以下の長さである）を予め選択することに限定されている現存のプライマー設計方法とは対照的に、本発明に従って、全ゲノムまたはゲノム群から始めることによってプライマーを設計した。これにより、特異性、Ｔ_ｍ、および他のプローブの特徴に対する特定の基準を満たす核酸配列の最も広い可能な範囲から、最適な候補プローブの同定および検証が可能になる。

通常、本方法によって提供されるプローブは、標的生物のゲノムの領域を捕獲するように設計された２つの相同プローブ配列（本明細書では、「ホーマー」とも呼ばれる）を含む。プローブの相同プローブ配列が、特定の標的とハイブリッド形成する場合、ギャップが充填されて環状産物が生成され、これは次に、配列決定するかあるいはアレイとハイブリッド形成させて、最終結果を得ることが可能である。プローブ「骨格」は２つの相同プローブ配列を接続させ、種々のリンカー、ＤＮＡバーコード、増幅部位、および／または制限部位を含む。構築された構造は、完成プローブである。本発明によって提供される例示的なプローブの概略図は図１に示される。

この実施例は、本明細書において記載されるような、２つの一般的な病原体：ストレプトコッカス・ニューモニエ（Ｓｔｒｅｐｔｏｃｏｃｃｕｓｐｎｅｕｍｏｎｉａ）およびサルモネラ・エンテリカ（Ｓａｌｍｏｎｅｌｌａｅｎｔｅｒｉｃａ）に対して極めて特異的な捕獲プローブの生成を説明する。

ストレプトコッカス・ニューモニエ（Ｓｔｒｅｐｔｏｃｏｃｃｕｓｐｎｅｕｍｏｎｉａｅ）について、標的ゲノム（ｇｉ２２１２３０９４８ｒｅｆＮＣ＿０１１９００．１ストレプトコッカス・ニューモニエ（Ｓｔｒｅｐｔｏｃｏｃｃｕｓｐｎｅｕｍｏｎｉａｅ）ＡＴＣＣ７００６６９、完全ゲノム）を、以下の表１に示される１０の追加のＳ．ニューモニエ（Ｓ．ｐｎｅｕｍｏｎｉａｅ）ゲノムと共に、ＮＣＢＩからダウンロードした。

サルモネラ・エンテリカ（Ｓａｌｍｏｎｅｌｌａｅｎｔｅｒｉｃａ）について、ｇｉ２９１４０５４３ｒｅｆＮＣ＿００４６３１．１サルモネラ・エンテリカ亜種エンテリカ血清型ティフィ（Ｓａｌｍｏｎｅｌｌａｅｎｔｅｒｉｃａｓｕｂｓｐ．ｅｎｔｅｒｉｃａｓｅｒｏｖａｒＴｙｐｈｉ）株Ｔｙ２の完全ゲノムを、最初の単一初期標的ゲノムとしてダウンロードした。さらに、表２に示される１４のＳ．エンテリカ（Ｓ．ｅｎｔｅｒｉｃａ）ゲノムをダウンロードした。

次に、初期標的ゲノムをＤＮＡの全ての可能な２５−塩基ストリング（２５−ｍｅｒ）にスライスした。Ｓ．ニューモニエ（Ｓ．ｐｎｅｕｍｏｎｉａｅ）の例では、初期標的ゲノムは、約２，２５３，０００塩基の長さであり、それぞれ２５塩基の２，２２１，２９０ストリングを含有するファイルを作成した。Ｓ．エンテリカ（Ｓ．ｅｎｔｅｒｉｃａ）の例では、このファイルは４，７９１，９３６のストリングを含有した。

次に、２５−ｍｅｒストリングのリストに一連のフィルタを適用したが、これは、ＦＡＳＴＡファイルまたは他のフォーマットの場合よりも著しく速い。全ての複製配列および多過ぎる単一の反復（５以上）を有するいかなる配列も排除した。Ｓ．エンテリカ（Ｓ．ｅｎｔｅｒｉｃａ）の場合、これらの初期フィルタを適用した後４，２９５，８１８の候補配列が残存した。

次に、セルフハイブリッド形成する可能性のあるプローブを同定するために非常に大きい候補セットの大規模の高速処理を可能するため、ＤＮＡのインシリコのストリング表示に基づいて、ヘアピンを形成する可能性のある（すなわち、セルフハイブリッド形成する可能性のある）全ての配列を排除した。ヘアピン／二量体化検索は、自己相補的であり得るオリゴヌクレオチド内の領域を探す。プローブ中のＮ個の塩基のセットが、プローブからＤ塩基離れた距離で同じプローブ中のＮ個の相補的な塩基と一致することを必要とする検索基準を確立した。これらの実行において、プローブ配列に由来する長さＮを有する全ての可能な候補部分配列（ｓｕｂｓｅｑｕｅｎｃｅ）の逆補体をまず構築する、Ｒｕｂｙプログラミング言語で作成したスクリプトを用いた。次にスクリプトは、正確な一致についてプローブを検索し、一致が見出され、第１の配列の終わりと第２の配列の初めとの距離がＤ塩基よりも遠く離れている場合に、ヘアピンを報告する。検索およびマッチングは、この状況で結果を非常に迅速に送達することができるストリング処理機能を用いて配列のアレイおよび／またはハッシュにおいて実施される。この例では、Ｎは３よりも大きく７未満であり、Ｄは５よりも大きい。

Ｓ．ニューモニエ（Ｓ．ｐｎｅｕｍｏｎｉａ）からの候補２５−ｍｅｒに対して、正確に１３であるグアニジンおよびシトシン塩基の合計を有することに基づいて、約５９℃のＴ_ｍにより２５−ｍｅｒを同定した。Ｓ．エンテリカ（Ｓ．ｅｎｔｅｒｉｃａ）については、標的Ｔ_ｍの選択は、以下に考察されるように、後の段階で実施した。このより早い段階でのこのスクリーンの実施は実質的に効率を高めることが後で分かった。

これらのフィルタを適用した後、サルモネラ・エンテリカ（Ｓａｌｍｏｎｅｌｌａｅｎｔｅｒｉｃａ）から１，１７５，６３１の候補配列が残った。次のステップのために、ストリングファイルをＦＡＳＴＡ−フォーマット化ファイルに変換した。

次に、ＮＣＢＩのＭｅｇａＢＬＡＳＴバージョン２．２．１０（他に記載されない限り、実施例におけるＢＬＡＳＴに対するいかなる参照［すなわち、ｂｌａｓｔ、ｂｌａｓｔｅｄ、ＢＬＡＳＴｅｄなど］も、ＭｅｇａＢＬＡＳＴを指す）を用いて、全ての候補２５−ｍｅｒを、Ｓ．ニューモニエ（Ｓ．ｐｎｅｕｍｏｎｉａｅ）およびＳ．エンテリカ（Ｓ．ｅｎｔｅｒｉｃａ）についてそれぞれ表１および２に記載される同一生物の全ての標的ゲノムと比較した。その標的生物のゲノムの全てにおいて正確な一致を持たないいかなる候補２５−ｍｅｒも廃棄した。Ｓ．エンテリカ（Ｓ．ｅｎｔｅｒｉｃａ）の場合、４２，９０７の候補２５−ｍｅｒがこのステップの後に残った。次に、各標的ゲノムに対する各２５−ｍｅｒのヒットの数を決定し、この例では、ゲノムにおいて正確に１回発生したものだけを保持した。

ヒトゲノムとのハイブリダイゼーションを回避するために、候補２５−ｍｅｒを、個々の染色体によってＮＣＢＩからダウンロードしたヒトゲノムに対してＢＬＡＳＴした。この研究で使用した配列は表３に示される。ヒトゲノム中の配列と２０の連続した塩基のうち１９を共有する候補２５−ｍｅｒを廃棄した。サルモネラ・エンテリカ（Ｓａｌｍｏｎｅｌｌａｅｎｔｅｒｉｃａ）の場合、このステップの後に４２，４８５の候補２５−ｍｅｒが残った。

ヒトゲノムとの類似性を有する２５−ｍｅｒを排除した後、残存する２５−ｍｅｒを、２５，９９１の微生物および３，６０２のウイルスゲノムのＮＣＢＩデータベースに対してＢＬＡＳＴした。これらのゲノムのいずれかにおける配列に対して２０の連続塩基のうち少なくとも１９を共有する２５−ｍｅｒを排除した。このフィルタを適用した後、Ｓ．エンテリカ（Ｓ．ｅｎｔｅｒｉｃａ）に対する２，２４５の候補２５−ｍｅｒが残った。

Ｓ．エンテリカ（Ｓ．ｅｎｔｅｒｉｃａ）に対して、約５９℃のＴ_ｍの選択（正確に１３であるグアニジンおよびシトシン塩基の合計を有する配列のみを選択することによる）をこの段階で実施し、１，１１６の候補２５−ｍｅｒが残った。

次に、各生物に対して残存した候補２５−ｍｅｒを、その本来の標的ゲノムに対してＢＬＡＳＴして、ゲノム中のその開始位置および停止位置（すなわち、そのゲノム座標）を決定した。この情報を用いて、固定距離によって分離された２５−ｍｅｒの対を選択した。Ｓ．エンテリカ（Ｓ．ｅｎｔｅｒｉｃａ）の場合、正確に１００塩基の標的長さ（第１の２５−ｍｅｒのスタートから第２の２５−ｍｅｒのエンドまで）に及ぶプローブ対を選択して、１８のこのような候補プローブ対が得られた。Ｓ．ニューモニエ（Ｓ．ｐｎｅｕｍｏｎｉａｅ）の場合、１００、２００、３００、４００および５００塩基の長さを有する配列を標的とするために、全部で５８のプローブを設計した。Ｓ．ニューモニエ（Ｓ．ｐｎｅｕｍｏｎｉａｅ）のためのプローブ中に含有される２５−ｍｅｒは、プローブのゲノム位置および標的長さを示す表４に示される。

次に、一般的なリンカー
ＡＧＡＴＣＧＧＡＡＧＡＧＣＧＴＣＧＴＧＴＡＧＧＧＡＡＡＧＣＴＧＡＧＣＡＡＡＴＧＴＴＡＴＣＧＡＧＧＴＣ（配列番号７）を用いて２５−ｍｅｒ対を完成プローブに構築した。Ｓ．ニューモニエ（Ｓ．ｐｎｅｕｍｏｎｉａｅ）のために構築されたプローブは表５に示される。Ｓ．エンテリカ（Ｓ．ｅｎｔｅｒｉｃａ）のために構築された相同プローブ配列の対は、相同プローブ配列の各対に対するゲノム位置情報を含む表６に示される。

さらなる実施形態では、プローブ構築の前に、候補２５−ｍｅｒは、混合物中の全ての他の候補２５−ｍｅｒおよび／または構築プローブに対してＢＬＡＳＴされ、混合物中の他の任意の配列（例えば、相同プローブ配列、骨格、または構築プローブ）とクロスハイブリッド形成し得るものが排除される。一実施形態では、混合物中の他のプローブ配列（例えば、骨格または相同プローブ配列）中に含有される２０の連続した塩基のうち１９を含有する２５−ｍｅｒが排除される。

フィルタリングされたらすぐに、２５−ｍｅｒは、２つの２５−ｍｅｒおよび骨格（様々なリンカー、ＤＮＡバーコード、普遍的増幅プライマー、および必要に応じて他の配列を含むことができる）を含む候補プローブに構築される。次に、構築されたプローブは、可能なクロスハイブリダイゼーションのための代替または追加のスクリーンとして、プール中の全ての他の構築プローブに対してＢＬＡＳＴされ得る。ヘアピンおよび／またはセルフハイブリダイゼーションのための最終分析が実施される。次に、検証された構築プローブは、有用なプローブのデータベースに追加される。プローブまたはプローブ混合物（例えば、プローブパネル）の生成プロセスにおける例示的な実行のフローチャートは図７に示される。

実施例２：Ｍ．ツベルクローシス（Ｍ．ｔｕｂｅｒｃｕｌｏｓｉｓ）特異的プローブの生成
特異的なプローブは、本質的に、Ｓ．ニューモニエ（Ｓ．ｐｎｅｕｍｏｎｉａｅ）について実施例１で説明される通りに製造した。簡単に言うと、標的ゲノム（ｇｉ５７１１６６８１ＮＣ＿０００９６２．２マイコバクテリウム・ツベルクローシス（Ｍｙｃｏｂａｃｔｅｒｉｕｍｔｕｂｅｒｃｕｌｏｓｉｓ）Ｈ３７Ｒｖ、完全ゲノム）を２５−ｍｅｒにスライスし、これを４０％のＣＧ含量を有する（その後、固定Ｔ_ｍ）ようにフィルタリングして、実施例１に記載されるように、複製配列、二次構造を有する配列、および同一ヌクレオチドの４つよりも多い連続した反復を有する配列を排除した。また、表７のＭ．ツベルクローシス（Ｍ．ｔｕｂｅｒｃｕｌｏｓｉｓ）ゲノムと特異的にハイブリッド形成する配列を選択するように２５−ｍｅｒをスクリーニングした。

実施例１の場合と同様にヒトゲノムに対して２５−ｍｅｒをスクリーニングして、ヒトＤＮＡと特異的にハイブリッド形成する可能性のあるものを排除した。実施例１と同じ微生物およびウイルスゲノムのＮＣＢＩデータベースに対して特異的にハイブリッド形成しないようにプローブ配列をスクリーニングした。１００ヌクレオチドの長さの標的領域を捕獲するように、２５−ｍｅｒを対でプローブに構築した。Ｍ．ツベルクローシス（Ｍ．ｔｕｂｅｒｃｕｌｏｓｉｓ）プローブ配列対およびそのゲノム位置は表８に記載される。

さらに、Ｍ．ツベルクローシス（Ｍ．ｔｕｂｅｒｃｕｌｏｓｉｓ）感染の主要な第１線治療の２つであるリファンピシンおよびイソニアジドへの耐性を付与する突然変異が発生していることが示される遺伝子に焦点を合わせて、Ｍ．ツベルクローシス（Ｍ．ｔｕｂｅｒｃｕｌｏｓｉｓ）ゲノムの特定の領域に対してプローブ配列を生成した。

これらのプローブは特異性について実施例１に記載されるようにスクリーニングしたが、この場合は、特定のＴ_ｍに限定しなかった。特に、リファンピシン耐性突然変異が集中されるＭ．ツベルクローシス（Ｍ．ｔｕｂｅｒｃｕｌｏｓｉｓ）ｒｐｏＢ遺伝子の特定の８１塩基領域を捕獲するように設計した。この領域を捕獲するように設計された２つのプローブ配列対は次の通りである：
＞ｍｔｂ−Ｈ３７Ｒｖ−ｒｐｏＢ−ｐｒ−０１−Ｈ１：ＧＧＴＣＧＣＣＧＣＧＡＴＣＡＡＧＧＡＧＴＴＣＴＴＣ（配列番号２５４）
＞ｍｔｂ−Ｈ３７Ｒｖ−ｒｐｏＢ−ｐｒ−０１−Ｈ２：ＣＡＴＣＧＡＡＡＣＧＣＣＧＴＡＣＣＧＣＡＡＧＧＴＧ（配列番号２５５）
＞ｍｔｂ−Ｈ３７Ｒｖ−ｒｐｏＢ−ｐｒ−０２−Ｈ１：ＧＴＴＣＡＴＣＧＡＡＡＣＧＣＣＧＴＡＣＣＧＣＡＡＧ（配列番号２５６）
＞ｍｔｂ−Ｈ３７Ｒｖ−ｒｐｏＢ−ｐｒ−０２−Ｈ２：ＡＣＣＣＡＧＧＡＣＧＴＧＧＡＧＧＣＧＡＴＣＡＣＡＣ（配列番号２５７）。

イソニアジド耐性突然変異が発生するＭ．ツベルクローシス（Ｍ．ｔｕｂｅｒｃｕｌｏｓｉｓ）ｉｎｈＡ遺伝子に特異的なプローブを同様に同定した。この領域を捕獲するように設計された一対のプローブ配列は次の通りである：
＞ｍｔｂ−３７ｒｖ−ｉｎｈａ−ｐｒ−０１−Ｈ１：ＴＣＧＡＡＣＴＣＧＡＣＧＴＧＣＡＡＡＡＣＧＡＧＧＡ（配列番号２５８）
＞ｍｔｂ−３７ｒｖ−ｉｎｈａ−ｐｒ−０１−Ｈ２：ＧＧＣＧＴＡＴＴＣＧＴＡＴＧＣＴＴＣＧＡＴＧＧＣＣ（配列番号２５９）

実施例３：Ｃ．ディフィシル（Ｃ．ｄｉｆｆｉｃｉｌｅ）毒素Ａ遺伝子に向けられたプローブの生成
クロストリジウム・ディフィシル（Ｃｌｏｓｔｒｉｄｉｕｍｄｉｆｆｉｃｉｌｅ）の毒素Ａ遺伝子に特異的なプローブは、本質的に、Ｓ．ニューモニエ（Ｓ．ｐｎｅｕｍｏｎｉａｅ）について実施例１で説明される通りに製造した。簡単に言うと、標的病原体（クロストリジウム・ディフィシル（Ｃｌｏｓｔｒｉｄｉｕｍｄｉｆｆｉｃｉｌｅ）６３０）の標的領域（ｇｉ１１５２４９００３：７９５８４３−８０３９７５クロストリジウム・ディフィシル（Ｃｌｏｓｔｒｉｄｉｕｍｄｉｆｆｉｃｉｌｅ）６３０−ｔｃｄＡ遺伝子）を実施例１で説明されるように２５−ｍｅｒにスライスし、複製配列、二次構造を有する配列、または同一ヌクレオチドの４つよりも多い連続した反復を有する配列を排除した。この場合、固定ＣＧまたは固定Ｔ_ｍにつてはスクリーニングしなかった。また、以下のＣ．ディフィシル（Ｃ．ｄｉｆｆｉｃｉｌｅ）毒素Ａ遺伝子配列と特異的にハイブリッド形成するように、プローブ配列をスクリーニングした：ｇｉ２６０６８１７６９：７１８４７４−７２６６０６クロストリジウム・ディフィシル（Ｃｌｏｓｔｒｉｄｉｕｍｄｉｆｆｉｃｉｌｅ）ＣＤ１９６、完全ゲノム；ｇｉ２６０６８５３７５：７１５９９５−７２４１２７クロストリジウム・ディフィシル（Ｃｌｏｓｔｒｉｄｉｕｍｄｉｆｆｉｃｉｌｅ）Ｒ２０２９１、ｔｃｄＡ遺伝子；およびｇｉ１４４９２５ｇｂＭ３０３０７．１ＣＬＯＴＯＸＡＣＤＣ．ディフィシル（Ｃ．ｄｉｆｆｉｃｉｌｅ）毒素Ａ遺伝子、完全ｃｄｓ。実施例１の場合と同様にヒトゲノムに対して２５−ｍｅｒをスクリーニングして、ヒトＤＮＡとクロスハイブリッド形成する可能性のあるものを排除した。実施例１と同じ微生物およびウイルスゲノムのＮＣＢＩデータベースに対して特異的にハイブリッド形成しないようにプローブ配列をスクリーニングした。１００〜２００ヌクレオチドの長さの標的領域を捕獲するようにプローブ配列対を構築した。クロストリジウム・ディフィシル（Ｃｌｏｓｔｒｉｄｉｕｍｄｉｆｆｉｃｉｌｅ）毒素Ａプローブのための対は、各プローブ配列対に対するゲノム位置情報を含む以下の表１１に記載される。

実施例４：ＨＩＶ中の薬物耐性突然変異を検出するためのプローブの生成
この実施例は、ＨＩＶ−１の存在を検出し、薬物耐性突然変異を検出し得るプローブの選択方法を提供する。ＨＩＶＲＴ、プロテアーゼ、融合、およびインテグラーゼ遺伝子における６５の薬物耐性座位のリストをまず作成した。これらの座位は、スタンフォード大学のＨＩＶＤｒｕｇＲｅｓｔｉｓｔａｎｃｅＤａｔａｂａｓｅおよび以下のウェブサイトの表から得た：
ｈｔｔｐ：／／ｈｉｖｄｂ．ｓｔａｎｆｏｒｄ．ｅｄｕ／ｃｇｉ−ｂｉｎ／ＮＲＴＩＲｅｓｉＮｏｔｅ．ｃｇｉ
ｈｔｔｐ：／／ｈｉｖｄｂ．ｓｔａｎｆｏｒｄ．ｅｄｕ／ｃｇｉ−ｂｉｎ／ＮＮＲＴＩＲｅｓｉＮｏｔｅ．ｃｇｉ
ｈｔｔｐ：／／ｈｉｖｄｂ．ｓｔａｎｆｏｒｄ．ｅｄｕ／ｃｇｉ−ｂｉｎ／ＰＩＲｅｓｉＮｏｔｅ．ｃｇｉ
ｈｔｔｐ：／／ｈｉｖｄｂ．ｓｔａｎｆｏｒｄ．ｅｄｕ／ｃｇｉ−ｂｉｎ／ＦＩＲｅｓｉＮｏｔｅ．ｃｇｉ
ｈｔｔｐ：／／ｈｉｖｄｂ．ｓｔａｎｆｏｒｄ．ｅｄｕ／ｃｇｉ−ｂｉｎ／ＩＮＩＲｅｓｉＮｏｔｅ．ｃｇｉ。

また、１５２２のＨＩＶゲノム配列のセットは、ＮＣＢＩからダウンロードした。ＢｉｏＰｅｒｌｍｏｄｕｌｅＢｉｏ：：Ｔｏｏｌｓ：：ｄｐＡｌｉｇｎを用いて、１５２２のゲノム配列のそれぞれにおける各耐性突然変異の位置を決定した。それぞれのゲノムについて、３つのフレーム全ておよび両方のオリエンテーションに対して、各遺伝子をアライメントさせて、最良のアライメントを決定した。次に、耐性突然変異の位置をコンセンサス配列からゲノム配列へ位置付けた。

プローブ設計パイプラインへの入力として、１５２２のＨＩＶゲノム配列のうちの１００をランダムに選択した。候補プローブ配列（プローブアーム）のセットを生成するために、２０〜３０の長さを有し、１００の入力配列のいずれかにおける任意の５０塩基の耐性突然変異内で発生する全てのｎ−ｍｅｒのリストを作成した。これらのｎ−ｍｅｒは、耐性突然変異の少なくとも１つを明らかにできる配列決定読取りを生成し得る候補プローブ配列である場合に選択した。３を超える長さを有するホモポリマーランおよび特定の他のあまり望ましくない（ｕｎｄｅｒｄｅｓｉｒａｂｌｅ）配列（例えばプローブのマイクロアレイ合成中に使用され得る酵素に関連する制限部位）を含有するｎ−ｍｅｒである場合に、複製をｎ−ｍｅｒのリストから除去した。候補プローブ配列をさらにフィルタリングして、１００の入力ＨＩＶ株のうちの２０またはそれ以上において存在するものだけを保持した。

次に、プローブ設計ソフトウェアは、各ｎ−ｍｅｒに対して、連結側プローブアームおよび伸長側プローブアームとしてのその望ましさを説明する２つのスコアを生成した。スコアは本明細書において記載されるように生成し、望ましいプローブアームの融解温度の分布を通常よりも２度高くなるように選択した。各候補プローブアームがスコア化されたらすぐに、長さ２０の共通の接頭語を共有するセットから最良候補が選択され、ここで、最良候補は、連結側プローブアームとしてのスコアおよび開始側プローブアームとしてのスコアの最高合計によって同定した。不十分にスコア化された候補プローブアーム（すなわち、機能する期待確率が．２５未満であったもの）をさらなる考察から捨て去った。このプロセスにより、様々な長さ（２０〜３０ヌクレオチド）を有する候補プローブアームを調べて、最良の融解温度および他の特徴を有するものを見出すという目標が達成された。

次に、残存するプローブアームをそれぞれ、ヒトゲノム配列（ＧｅｎｏｍｅＲｅｆｅｒｅｎｃｅＣｏｎｓｏｒｔｉｕｍによって生成された２００９年２月のヒト基準配列［ＧＲＣｈ３７／ｈｇ１９］、ｈｔｔｐ：／／ｇｅｎｏｍｅ．ｕｃｓｃ．ｅｄｕ／ｃｇｉ−ｂｉｎ／ｈｇＧａｔｅｗａｙで入手可能）と、短い読取りアライメントプログラムＢｏｗｔｉｅ（ｈｔｔｐ：／／ｂｏｗｔｉｅ−ｂｉｏ．ｓｏｕｒｃｅｆｏｒｇｅ．ｎｅｔ／ｉｎｄｅｘ．ｓｈｔｍｌで入手可能）を使用する、米国特許第６，２５２，０５９号明細書で提示される配列との、２つの排除データベースに対してアライメントさせた。１または０個のミスマッチでいずれかのデータベースと一致するいかなる候補プローブアームも廃棄した。次に、残存する候補プローブアームを、Ｂｏｗｔｉｅを用いて１００のＨＩＶ標的ゲノムとアライメントさせた。

次に、プローブ捕獲領域によって包含される耐性突然変異部位の標的リストを準備した。リストは、各株に位置付けされるように全ての既知の耐性突然変異に対して１つのエントリーを含有する（すなわち、６５^＊１００＝６５００エントリー）。次に、少なくとも２つのプローブアームの配列決定読取りがリスト上の各エントリー（すなわち、各株における各突然変異部位）を含むようにプローブアームを選択するように、プローブアーム選択プロセスを設計した。

各候補プローブアームに対して、プローブアームが連結側プローブアームおよび開始側プローブアームとして使用される場合に、プローブアームの配列読取りによって包含され得る６５００のリストにおける耐性突然変異部位の数を決定した。これは、各ゲノムに対する候補プローブアームのＢｏｗｔｉｅアライメントを調べ、プローブアームの位置の固定距離（５０塩基）内の耐性突然変異部位の数をカウントすることによって行った。このステップは、候補プローブアームが良好に一致するＨＩＶ株の数を考慮に入れる。

１００のＨＩＶ標的株を任意の順序で処理して、その株において互いに８５〜２５０塩基の範囲内で発生する候補プローブアーム配列に基づいて、各株に対する候補完成プローブ（すなわち、完成プローブに構築するためのプローブアーム配列の対）を生成した。プローブが機能する期待確率が．５よりも大きい場合にだけ、各候補プローブを保持した。次に、このプローブからの配列決定読取りによって包含され得る耐性突然変異のリスト（６５００の中から）を完成した。これは、包含範囲リスト（ｃｏｖｅｒａｇｅｌｉｓｔ）を表す。この計算は、プローブを形成するために結合される２つの候補プローブアームからのリストを結合し、候補プローブアームが３００塩基以内であり、そのゲノムにおける正しいオリエンテーションにある場合にだけ、ゲノムのエントリーが保持される。

各プローブに対する包含範囲リストの合計に基づいて候補プローブをソートし、最高の合計を有するプローブ、すなわち、最大数の耐性突然変異を包含するプローブを選択した。

２つのプローブによって既に包含されている耐性突然変異を反映するように、残存する候補プローブに対する包含範囲リストを更新した。包含されていないどの耐性突然変異も包含しないプローブを考察から除去した。

このプローブ選択プロセスの実施において、プローブが全く残らないか、あるいは全ての耐性突然変異が２つのプローブによって包含されていれば、プロセスは中止され得る。プローブが残っていれば、候補リストは各プローブに対する包含範囲リストの合計に基づいて再度ソートされ、最高の合計を有するプローブ、すなわち、最大数の耐性突然変異を包含するリストからのプローブが選択され得る。

いくつかの場合には、選択された全てのプローブのプローブアームに突然変異を導入した。突然変異は、プローブアームが１５２２のＨＩＶゲノムのいずれかと１９塩基対よりも多く一致しなくなるまで骨格側から開始して、捕獲側に向かって機能させて、プローブアーム内の各位置におけるバリエーションを試みることによって発生させた。プローブアームにおけるこのような全てのバリエーションの融解温度を計算し、１．５度に最も近い融解温度の低下を起こすバリエーション（Ｍｅｌｔｉｎｇ５．０．３（ｈｔｔｐ：／／ｗｗｗ．ｅｂｉ．ａｃ．ｕｋ／ｃｏｍｐｎｅｕｒ−ｓｒｖ／ｍｅｌｔｉｎｇ／ｍｅｌｔｉｎｇ５−ｄｏｃ／ｍｅｌｔｉｎｇ．ｈｔｍｌで入手可能）によって計算されるように、オリジナルプローブアームおよび突然変異プローブアームの不完全な二本鎖に基づく）を新しいプローブアームとして保持した。従って、初期パラメータにおける所望の融解温度を上昇させ、ミスマッチを有するより低い融解温度の達成を試みることによって、最終プローブアームは、実験条件下で非突然変異プローブと同様に挙動し得る。

次に、Ｂｏｗｔｉｅにより１５２２の全てのＨＩＶゲノムに対して突然変異プローブアームをアライメントさせ、１５２２のうちのいくつが少なくとも１つのプローブによって捕獲され得るか、そして１５２２の株を横切る６５の耐性突然変異のうちのいくつが捕獲されるかを決定した（理論上は１５２２^＊６５、すなわち全部で９８９３０の座位が存在するが、全ての耐性突然変異が全ての株に対して位置付けされ得るわけではないので８６，９０５の座位が同定可能であった）。この分析に基づいて、標的株のセットを増加させ、３２３株に対してプロセスを繰り返した。オリジナルの１００株に、最初のラウンドにおいて少数のプローブでしか捕獲されないかどのプローブでも捕獲されなかった新しい２２３株を加えたものを使用した。初期パラメータに対する唯一の変化は、最初の２０ではなく、７以上の株において見出される候補プローブアームを保持したことであった。

プローブ設計プロセスの最終ステップは、４６７の予備的なプローブ配列をフィルタリングして、プール中の他のプローブとクロスハイブリッド形成またはクロスプライム（ｃｒｏｓｓ−ｐｒｉｍｅ）し得るプローブを除去することであった。このフィルタリングはプローブの互いに対するアライメントおよびそれ自体のアライメントに基づき、その後、アライメントされた領域において融解温度を計算して、実験条件下で二本鎖が形成する尤度を決定した。このフィルタリングにより、ヘアピンを形成する可能性があるために３４プローブが除去され、他のプローブとクロスプライムする可能性があるために５６プローブが除去されて、３７６プローブが残された。これらの３７６のプローブは、１５２２株のうちの１３８４に対して少なくとも１つのプローブを含有する。いくつかのプローブは２０００を超える株を捕獲するが、多くの捕獲はただ１つまたは数個である。これは通常、多数の株において耐性突然変異を捕獲したプローブがまず選択され、１つまたはいくつかの株に特異的なプローブが最後に選択されるような、プローブが選択される順序を反映する。

実施例５：ＨＰＶの株を区別するプローブの生成
この実施例は、ヒト乳頭腫ウイルスの配列決定された２８８株（１３７の別個の種類からなり、いくつかの種類は多数の分離株または株を有する）の公的に利用可能なゲノムを検出および区別し得るプローブの選択方法を提供する。プローブ選択プロセスの目標は、これらのプローブによって捕獲される対象の領域からの配列読取りが、株の任意の対の間で少なくとも７つのＳＮＰまたは小さい挿入欠失を明らかにし得るようにプローブを選択することである。

プローブ設計パイプラインは、２８８株全てからの長さ１８〜２６の全てのｎ−ｍｅｒのリストを生成することにより開始される。次に、３よりも大きい長さを有するホモポリマーストレッチを含有するか、あるいは特定の制限酵素部位を含有するｎ−ｍｅｒを廃棄した（特定の酵素は、マイクロアレイ上で合成されたプローブを処理するために使用されるので、プローブ配列中のこのような部位は、いくつかの実施形態では、全てのプローブが全ての可能な合成オプションと適合性であることを保証することが可能でないかもしれない）。次に、ＨＩＶ特異的ｎ−ｍｅｒについて実施例４で記載されたように、連結側プローブアームおよび開始側プローブアームとしてのその望ましさに従って、残存する９，８２５，９４６のｎ−ｍｅｒのそれぞれをスコア化した。実施例４の場合と同様に、１８−塩基接頭語が与えられた最高スコアリングのプローブを保持した。方法はさらに、プローブをフィルタリングして、ヒトゲノムに対して完全または１塩基対ミスマッチを有するものを除去し、プローブ選択で使用するために７１５，５３３が残った。

各軸に沿って２８８のＨＰＶ株のそれぞれを用いて四角いマトリックスを構築した（しかし、マトリックスの上半分のみを使用して、各ペアワイズ結果を四角いマトリックス中に１回だけ示す）。マトリックス中の各エントリーは、選択されるプローブからの期待される読取りとともに方法が包含しようとするＳＮＰまたは小さい挿入欠失の数を示した。従って、このマトリックスは所望のＳＮＰのマトリックスであり、すなわち、マトリックスは、株の任意の対の間で完成プローブセットがいくつの差異を明らかにするように選択されるかを示した。この場合、全てのエントリーを７に設定した（または「初期化した」）。他のプローブ設計タスクはマトリックスを異なって初期化し得る。例えば、２つの株が臨床的に同一であると考察されると、マトリックスは、これらの株に対してゼロエントリーを有するかもしれず、これらを区別する必要がないことが示される。特定の株がより高い包含範囲を必要とする場合には、これらの株に対応するエントリーはより高い値を含有し得る。

各ｎ−ｍｅｒのプローブアームとしての有用性を決定するために、プローブ選択方法を用いて、ｎ−ｍｅｒによって株の間でいくつのＳＮＰが明らかにされるかを決定した。従って、Ｂｏｗｔｉｅを用いて２８８株のセットに対してｎ−ｍｅｒをアライメントさせ、各ｎ−ｍｅｒのアライメントにおいて１つのミスマッチを可能にした。各ｎ−ｍｅｒおよびｎ−ｍｅｒがアライメントされる株の各対（順序依存性の形で）について、このｎ−ｍｅｒが連結側プローブアームとして使用される場合には、ｎ−ｍｅｒの下流側の２つの領域のアライメントを実施して、各領域を通して配列決定読取りから観察され得るＳＮＰおよび小さい挿入欠失の数を決定した。アライメントにおいて使用される隣接領域の長さは期待される配列決定読取り長さに依存し、この場合には、５０塩基の隣接領域が使用される。ｎ−ｍｅｒの５０塩基上流側のアライメントも実施して、ｎ−ｍｅｒを開始側プローブアームとして使用する場合に検出され得るＳＮＰおよび小さい挿入欠失の数を決定した。従って、各ｎ−ｍｅｒに対して、株の対の間で観察される差異の２つのマトリックスを計算した。一方は、連結側プローブアームとしてのｎ−ｍｅｒに対するマトリックスであり、他方は、開始側プローブアームとしてのｎ−ｍｅｒに対するマトリックスである。１つのｎ−ｍｅｒに対するアライメントの一例は以下に示されるが、ここで、アスタリスクはその位置における１００％の同一性を示し、株は左側に示される。

このｎ−ｍｅｒは、株ＦＭ９５５８４１とＭ３２３０５との間にはＳＮＰが３つあり、Ｍ２２９６１とＮＣ＿００１５３１との間にはなく、ＦＭ９５５８３８とＤ９０２５２との間には６つあることを明らかにした。

一対のｎ−ｍｅｒを含有するプローブを構築するために、全ての２８８ＨＰＶ株を任意の順序で処理し、互いに３００塩基の範囲内にあるｎ−ｍｅｒを結合することによって、各株に対してプローブを生成した。以下の値（１）および（２）に基づいて、各候補プローブをスコア化した：
（１）プローブが機能する確率、および
（２）プローブにより株間で明らかにされ得るＳＮＰまたは小さい挿入欠失の期待数（プローブにより株間で明らかにされ得るＳＮＰまたは小さい挿入欠失の期待数は、２つのプローブアームに対して観察されるＳＮＰ／挿入欠失マトリックスを合計することによって得た。プローブが機能しない（例えば、プローブアームが遠く離れすぎているか、または誤ったストランドオリエンテーションにある）株に相当する値をゼロに設定した。さらに、マトリックス中の最大値を、３または標的マトリックス中の対応するエントリーの値の小さい方の値に設定した。最終的なプローブの数は、このマトリックス中の全てのエントリーにわたる合計であった。）。
プローブの最終スコアは、値（１）と（２）の積であった。

次に、最高スコアを有するプローブを選択し、次に、プローブの観察されたＳＮＰ／挿入欠失マトリックス値を、所望の標的マトリックスから差し引いた（結果における負の値をゼロに設定した）。次に、残存するプローブに対するスコアを更新した。残存するプローブは選択されたプローブによって既に包含されている株の間の差異を検出し得るので、スコアはこのプロセスの間に低下するだけであり得る。このようにして（すなわち、プローブを選択し、残存する候補プローブを再スコア化する）、標的マトリックスが全てゼロを含有する（選択されたプローブが、株の各対の間で、少なくとも７つのＳＮＰまたは挿入欠失を明らかし得ることを意味する）まで、あるいは、残存する候補プローブがどれも非ゼロスコアを有さなくなる（残存する候補プローブがどれも、まだ検出されていない株の間の差異を明らかにしないことを意味する）まで、プローブ選択を続けた。

この反復プローブ選択プロセスにより、５４８のプローブを選択した。実施例４と同様に、ヘアピン、クロスプライミング（ｃｒｏｓｓ−ｐｒｉｍｉｎｇ）、およびクロスハイブリダイゼーションについてのプローブのフィルタリングにより、３４６のプローブが残った。

これらの３４６のプローブおよび高リスクＨＰＶ株のセット（ＨＰＶ１６、１８、３１、３３、３５、３９、４５、５１、５２、５６、５８、５９）を用いてＨＰＶ株の検出のシミュレーションが実施される場合、７３のプローブが産物を生成することが期待された。図１７は、シミュレーションにおいてどのプローブ（ｘ軸）がどの株（ｙ軸）に対して機能したかのマトリックスを示し、白色ブロックは期待された産物を示し、そして黒色ブロックはプローブがその株から産物を生成しなかったことを示す。

実施例６：臨床サンプルにおけるＨＰＶ株の検出
図１８は、標的ＨＰＶ株ゲノムに対する２０の特異的ＨＰＶプローブの群のための標的マトリックスを示す。プローブはプロットのｘ軸を横切って表され、株はｙ軸に沿って表される。白色領域は、表示される対応する株のゲノムに結合することが予想されるプローブを示し、黒色領域は、対応する株に結合することが予想されないプローブを示す。

図１９は、標的マトリックスを示す。２７の特異的ＨＰＶプローブのそれぞれによって同定されるＳＮＰの数および種類を示すように拡張される。異なるグレースケールシェーディングは、Ｔ、Ｃ、Ｇ、またはＡのそれぞれに対する任意の特定の塩基変化、あるいは挿入欠失の存在Ｇｒａｙ＝Ｉｎｄｅｌを示し、黒色は、その位置でその株からの読取りがないことを示す。個々のプローブはｘ軸に沿って示され、各プローブは、１つよりも多いＳＮＰを捕獲する場合には、１つの列または多数の列に分割される。

本明細書において記載されるような方法を用いて、図２０に示されるゲル中の特定のサンプルに対するレーン番号によって示されるように、ＨＰＶ１６指向性プローブ（ＮＣ００１５２６＿４００５、ＮＣ００１５２６＿３９９９、またはＮＣ００１５２６＿７２９９）またはＨＰＶ１８指向性プローブ（ＡＹ２６２２８２＿７１７４、ＡＹ２６２２８２＿３３０９、またはＡＹ２６２２８２＿１４５０）を、ＨＰＶ１６および１８のいずれかを含有する臨床サンプル（ＴｈｉｎＰｒｅｐ）からのＤＮＡと結合させた。ハイブリダイゼーションならびにそれに続くギャップ充填ポリメラーゼ伸長および連結（環状化捕獲）の後、ＰＣＲを実施して、環状化プローブを検出した。いくつかのサンプル（レーン１〜３および１１〜１３で示される）において、期待サイズ（２５０ｎｔ）のＰＣＲ増幅産物を検出した。ＨＰＶ１６指向性プローブはＨＰＶ１６を検出し、ＨＰＶ１８指向性プローブはＨＰＶ１８を検出したが、ＨＰＶ１６は検出しなかった。

図２１は、上記の図２０に対応するサンプル中で生成される増幅産物のＳａｎｇｅｒ配列決定のアライメントの一例を示す。ＨＰＶ１６およびＨＰＶ１８基準ゲノムに対して配列をアライメントさせ、ポリメラーゼ伸長領域によって捕獲された配列を示した。

実施例７：臨床サンプルにおける細菌ＤＮＡの検出
本明細書に記載されるような環状化捕獲において単一のＳ．サプロフィチカス（Ｓ．ｓａｐｒｏｐｈｙｔｉｃｕｓ）指向性プローブを用いて、***症（ＵＴＩ）の患者からの臨床サンプル中でスタフィロコッカス・サプロフィチカス（Ｓｔａｐｈｙｌｏｃｏｃｃｕｓｓａｐｒｏｐｈｙｔｉｃｕｓ）ゲノムＤＮＡを検出した（図２２Ａ）。また、単一プローブ（「１９３」プローブ）またはＭｅｃＡ遺伝子領域に向けられたプローブを含むプールされたプローブ混合物（「ＡｌｌＭｅｃＡプローブプール」）のいずれかを用いて、細菌臨床分離株中においてもＳ．サプロフィチカス（Ｓ．ｓａｐｒｏｐｈｙｔｉｃｕｓ）ＤＮＡを検出した（図２２Ｂ）（全てのサンプルにおいて、期待されるサイズのバンドが見られる；臨床分離株はＮＹ３５６、ＧＡ１５、およびＣＡ１０５）で示される）。

基準スタフィロコッカス・サプロフィチカス（Ｓｔａｐｈｙｌｏｃｏｃｃｕｓｓａｐｒｏｐｈｙｔｉｃｕｓ）株からのゲノムＤＮＡとの、ＰＣＲ増幅された環状化プローブの観察された配列決定読取りのアライメントにおいて観察されるように、順方向および逆方向のＳａｎｇｅｒ配列決定によって、図２２Ａのスタフィロコッカス・サプロフィチカス（Ｓｔａｐｈｙｌｏｃｏｃｃｕｓｓａｐｒｏｐｈｙｔｉｃｕｓ）指向性プローブを用いる標的ｇＤＮＡのポリメラーゼ伸長および捕獲が示された。

また、Ｓａｎｇｅｒ配列決定によって、スタフィロコッカス・アウレウス（Ｓｔａｐｈｙｌｏｃｏｃｃｕｓａｕｒｅｕｓ）指向性プローブと結合させたときに、ゲノムスタフィロコッカス・アウレウス（Ｓｔａｐｈｙｌｏｃｏｃｃｕｓａｕｒｅｕｓ）配列との、ＰＣＲ増幅された環状化プローブの観察された配列決定読取りのアライメントにおいて示されるように、スタフィロコッカス・アウレウス（Ｓｔａｐｈｙｌｏｃｏｃｃｕｓａｕｒｅｕｓ）標的ｇＤＮＡのポリメラーゼ伸長および捕獲も示された（図２３）。

実施例８：臨床サンプルにおけるウイルスＤＮＡの検出
また、培養インフルエンザウイルスから単離したＲＮＡから逆転写されたｃＤＮＡは、５つの個々の分子反転プローブを用いて検出し、通常のＳａｎｇｅｒ（Ｎ）または次世代配列決定（Ｔ、テールドプライマー）のための増幅は、図２４に示される（プローブは１９８、２５６、２９２、２９３、および４６２で示される；Ｓ．ｓａｐはスタフィロコッカス・サプロフィチカス（Ｓｔａｐｈｙｌｏｃｏｃｃｕｓｓａｐｒｏｐｈｙｔｉｃｕｓ）ゲノムＤＮＡ対照を示す）。

実施例９：臨床ＵＴＩサンプルにおける細菌ＤＮＡの多重検出
***症における役割を有する可能性のある生物に向けられた６０の完成プローブのプールを、３ｎＭの全核酸濃度で調製した（等モル比の各プローブを含有する）。

プローブプールを、約４μｌの３３の個々の臨床***症（ＵＴＩ）サンプルおよび４つの対照サンプルと２４時間ハイブリッド形成させた。１マイクロリットルあたり０．１ｐｇ〜１００ｎｇの可変量のｄｓＤＮＡを含有するようにｐｉｃｏｇｒｅｅｎにより各臨床サンプを定量化した。

ポリメラーゼギャップ充填、連結、および消化反応を実施し、プローブの普遍的骨格とハイブリッド形成する３’位置と、Ｉｌｌｕｍｉｎａフローセル（ＩｌｌｕｍｕｎｉａＩｎｃ．，ＳａｎＤｉｅｇｏ，ＣＡ）とのハイブリダイゼーションのために必要とされるアダプター配列を含有する５’テールとを含有する普遍的プライマーにより、任意の環状化産物を増幅した。非ハイブリッド形成６−ヌクレオチドバーコード挿入断片を含有する個々の３’プライマーを用いて、独特のＤＮＡ配列タグにより個々の臨床サンプルからの増幅産物を標識化して、このサンプルからの配列読取りの部分配列の同定を可能にした。

期待されるサイズの増幅産物は、２％アガロースゲルにおいて分解した後に切除した。配列決定のための調製において過剰のアガロースおよび塩から増幅産物を精製した。３７サンプルのそれぞれを６−ヌクレオチドバーコードによりバーコード化することにより、全てのサンプルをＩｌｌｕｍｉｎａＧＡＩＩ装置における単一の配列決定ランへ多重化した。この分析中に含まれていない追加のサンプル（および異なるバーコード）により、これらのサンプルをさらに多重化した。配列決定ランは、およそ３３００万の読取りを生じた。

６０のＵＴＩプローブのためのプローブアームをゲノムおよび部分ゲノムの大きい集合とアライメントさせた。各プローブに対する各一致について、左側プローブアーム、伸長領域、右側プローブアーム、および６−ヌクレオチドバーコードと右側プローブアームとの間の２１−ヌクレオチドの骨格配列からなる「期待される読取り」を構築した。これらの１０，８８６の期待される読取りからＢｏｗｔｉｅデータベースを構築した。

読取りをアライメントするために、Ｉｌｌｕｍｉｎａ塩基呼び出しソフトウェアによって生成されるＦＡＳＴＱファイルをまず別々のファイル（各バーコードに対して１つ）に分割した。各バーコード（読取りの最初の６つのヌクレオチド）を既知のすべてのバーコードと比較した。読取りのバーコード部分が、任意の他のバーコードに対する一致よりも優れているバーコードに対して単一の一致を有していれば、読取りをバーコードに割り当てた。バーコードに対する一致の品質は、配列決定読取りおよび期待されるバーコードがミスマッチする位置における塩基品質の合計であり、従って、高品質の一致は少ない合計（理想的にはゼロ）を有し、読取りからバーコードへのマッチングは、配列決定読取りの品質の説明となる。

実験において使用される３７のバーコードのそれぞれは、１つのバーコード当たり１１，２４５〜４，８７４，８８５の読取りの範囲で、少なくとも１つの読取りをもたらした。各バーコードに対する読取りは、コマンドラインオプション「−ｐ８−ｑ−−ｔｒｉｍ５６−−ｓｏｌｅｘａ１．３−ｑｕａｌｓ−ｅ２００−−ｂｅｓｔ−ｓｔｒａｔａ−ｍ２０−ｋ２０」を有するＢｏｗｔｉｅバージョン０．１２．７を用いて、プローブデータベースに対して別々にアライメントさせた。従って、Ｂｏｗｔｉｅアライナー（ａｌｉｇｎｅｒ）は、期待される読取りに対する配列決定読取りのヒットだけを戻したが、これは、最良の一致品質を有した（すなわち、いくつかの期待される読取りが同じ数のミスマッチを有する配列決定読取りと一致すれば、読取りは両方とも出力に含有された）。しかしながら、もう１つのミスマッチを有する別の期待される読取りは、その一致が、最良品質を有するものほど良好ではなかったので含有されていないであろう。さらなる詳細については、Ｂｏｗｔｉｅの「−−ｂｅｓｔ−ｓｔｒａｔａ」のドキュメンテーションを参照されたい。それぞれのｂｏｗｔｉｅアライメントは分析スクリプトに送り込まれた。各読取りに対して、スクリプトは、読取りがもっともらしく得られる株のセットを決定した（すなわち、読取りが最良の品質で一致する、期待される読取りに対応する株のセット）。この株のセットは、Ｇｅｎｂａｎｋ受入番号のセット、例えば、「ＡＣＬＥ０１００００８０、ＧＧ６６８５７８、ＮＣ＿０１０５５４」で書くこともできるし、あるいはこれらの受入番号に相当する株のセットで書くこともできる。例えば、「ＡＣＬＥ０１００００８０、ＧＧ６６８５７８、ＮＣ＿０１０５５４」は、３つのプロテウス・ミラビリス（Ｐｒｏｔｅｕｓｍｉｒａｂｉｌｉｓ）株であった。異なる読取りは、プロテウス・ミラビリス（Ｐｒｏｔｅｕｓｍｉｒａｂｉｌｉｓ）およびプロテウス・ペンネリ（Ｐｒｏｔｅｕｓｐｅｎｎｅｒｉ）の両方を含む「ＡＢＶＰ０１００００２５、ＡＣＬＥ０１００００８０、ＧＧ６６１９９６、ＧＧ６６８５７８、ＮＣ＿０１０５５４」からの期待される読取りに対して、同様に十分に位置付けすることができる。例えば、分析スクリプトは以下を報告し得る：
２３６−プロテウス・ミラビリス（Ｐｒｏｔｅｕｓｍｉｒａｂｉｌｉｓ）（ＡＣＬＥ０１００００８０、ＧＧ６６８５７８、ＮＣ＿０１０５５４）
１−プロテウス・ペンネリ（Ｐｒｏｔｅｕｓｐｅｎｎｅｒｉ）、プロテウス・ミラビリス（Ｐｒｏｔｅｕｓｍｉｒａｂｉｌｉｓ）（ＡＢＶＰ０１００００２５、ＡＣＬＥ０１００００８０、ＧＧ６６１９９６、ＧＧ６６８５７８、ＮＣ＿０１０５５４）。
これにより、２３６の読取りがＰ．ミラビリス（Ｐ．ｍｉｒａｂｉｌｉｓ）から期待される産物に位置し、そして１つの読取りがＰ．ミラビリス（Ｐ．ｍｉｒａｂｉｌｉｓ）またはＰ．ペンネリ（Ｐ．ｐｅｎｎｅｒｉ）から期待される産物に位置することが示される。従って、これらの結果は、第２のラインからの単一の読取りが、Ｐ．ペンネリ（Ｐ．ｐｅｎｎｅｒｉ）による同時感染というよりも、実際にＰ．ミラビリス（Ｐ．ｍｉｒａｂｉｌｉｓ）に由来した可能性がより高いので、Ｐ．ミラビリス（Ｐ．ｍｉｒａｂｉｌｉｓ）の存在を示すと解釈した。

３７の異なるサンプルからの結果は、様々な異なる生物による感染を示す。例えば、分析スクリプトにより、サンプル♯７について以下が報告された：
２−アグレガチバクター・アフロフィルス（Ａｇｇｒｅｇａｔｉｂａｃｔｅｒａｐｈｒｏｐｈｉｌｕｓ）、プロテウス・ペンネリ（Ｐｒｏｔｅｕｓｐｅｎｎｅｒｉ）、プロテウス・ミラビリス（Ｐｒｏｔｅｕｓｍｉｒａｂｉｌｉｓ）（ＡＢＶＰ０１００００２５、ＡＣＬＥ０１００００８０、ＧＧ６６１９９６、ＧＧ６６８５７８、ＮＣ＿０１０５５４、ＮＣ＿０１２９１３）
３２４−カンジダ・アルビカンス（Ｃａｎｄｉｄａａｌｂｉｃａｎｓ）（ＡＪ２５１８５８）
６−クレブシエラ・ニューモニエ（Ｋｌｅｂｓｉｅｌｌａｐｎｅｕｍｏｎｉａｅ）（ＡＣＺＤ０１００００１２、ＥＵ６８２５０５、ＧＧ７０３５２５、ＮＣ＿００９６４８、ＮＣ＿０１１２８３、ＮＣ＿０１２７３１）
３０１０９−クレブシエラ・ニューモニエ（Ｋｌｅｂｓｉｅｌｌａｐｎｅｕｍｏｎｉａｅ）（ＡＣＺＤ０１００００１２、ＥＵ６８２５０５、ＧＧ７０３５２５、ＮＣ＿００９６４８、ＮＣ＿０１２７３１）
５−クレブシエラ・ニューモニエ（Ｋｌｅｂｓｉｅｌｌａｐｎｅｕｍｏｎｉａｅ）（ＡＣＺＤ０１００００１３、ＥＵ６８２５０５、ＧＧ７０３５２５、ＮＣ＿００９６４８、ＮＣ＿０１２７３１）
７−クレブシエラ・ニューモニエ（Ｋｌｅｂｓｉｅｌｌａｐｎｅｕｍｏｎｉａｅ）、エシェリキア・コリ（Ｅｓｃｈｅｒｉｃｈｉａｃｏｌｉ）（ＡＣＺＤ０１００００１２、ＥＵ６８２５０５、ＧＧ７０３５２５、ＮＣ＿００９６４８、ＮＣ＿０１０３７８、ＮＣ＿０１２７３１、ＮＣ＿０１３５０３）
２−クレブシエラ・ニューモニエ（Ｋｌｅｂｓｉｅｌｌａｐｎｅｕｍｏｎｉａｅ）、エシェリキア・コリ（Ｅｓｃｈｅｒｉｃｈｉａｃｏｌｉ）、クレブシエラ・バリイコーラ（Ｋｌｅｂｓｉｅｌｌａｖａｒｉｉｃｏｌａ）（ＡＣＺＤ０１００００１２、ＥＵ６８２５０５、ＧＧ７０３５２５、ＮＣ＿００９６４８、ＮＣ＿０１０３７８、ＮＣ＿０１１２８３、ＮＣ＿０１２７３１、ＮＣ＿０１３５０３、ＮＣ＿０１３８５０）
３０−クレブシエラ・ニューモニエ（Ｋｌｅｂｓｉｅｌｌａｐｎｅｕｍｏｎｉａｅ）、エシェリキア・コリ（Ｅｓｃｈｅｒｉｃｈｉａｃｏｌｉ）、クレブシエラ・バリイコーラ（Ｋｌｅｂｓｉｅｌｌａｖａｒｉｉｃｏｌａ）、シトロバクター・コセリ（Ｃｉｔｒｏｂａｃｔｅｒｋｏｓｅｒｉ）（ＡＣＺＤ０１００００１２、ＥＵ６８２５０５、ＧＧ７０３５２５、ＮＣ＿００９６４８、ＮＣ＿００９７９２、ＮＣ＿０１０３７８、ＮＣ＿０１１２８３、ＮＣ＿０１２７３１、ＮＣ＿０１３５０３、ＮＣ＿０１３８５０）
４−クレブシエラ・ニューモニエ（Ｋｌｅｂｓｉｅｌｌａｐｎｅｕｍｏｎｉａｅ）、クレブシエラ・バリイコーラ（Ｋｌｅｂｓｉｅｌｌａｖａｒｉｉｃｏｌａ）（ＡＣＺＤ０１００００１２、ＥＵ６８２５０５、ＧＧ７０３５２５、ＮＣ＿００９６４８、ＮＣ＿０１１２８３、ＮＣ＿０１２７３１、ＮＣ＿０１３８５０）
６５６−クレブシエラ・ニューモニエ（Ｋｌｅｂｓｉｅｌｌａｐｎｅｕｍｏｎｉａｅ）、クレブシエラ・バリイコーラ（Ｋｌｅｂｓｉｅｌｌａｖａｒｉｉｃｏｌａ）（ＡＣＺＤ０１００００１３、ＥＵ６８２５０５、ＧＧ７０３５２５、ＮＣ＿００９６４８、ＮＣ＿０１１２８３、ＮＣ＿０１２７３１、ＮＣ＿０１３８５０）
２−ラクトバチルス・ヘルベティカス（Ｌａｃｔｏｂａｃｉｌｌｕｓｈｅｌｖｅｔｉｃｕｓ）、ラクトバチルス・デルブリュッキ（Ｌａｃｔｏｂａｃｉｌｌｕｓｄｅｌｂｒｕｅｃｋｉｉ）（ＡＣＬＭ０１００００１７、ＡＥＡＴ０１００００８３、ＣＰ０００１５６、ＣＰ００２４２９、ＧＧ７００７５３、ＮＣ＿００８０５４、ＮＣ＿００８５２９、ＮＣ＿０１００８０、ＮＣ＿０１４７２７）
５４９−プロテウス・ミラビリス（Ｐｒｏｔｅｕｓｍｉｒａｂｉｌｉｓ）（ＡＣＬＥ０１００００８０、ＧＧ６６８５７８、ＮＣ＿０１０５５４）
２７−プロテウス・ペンネリ（Ｐｒｏｔｅｕｓｐｅｎｎｅｒｉ）、プロテウス・ミラビリス（Ｐｒｏｔｅｕｓｍｉｒａｂｉｌｉｓ）（ＡＢＶＰ０１００００２５、ＡＣＬＥ０１００００８０、ＧＧ６６１９９６、ＧＧ６６８５７８、ＮＣ＿０１０５５４）
７−プロビデンシア・レットゲリ（Ｐｒｏｖｉｄｅｎｃｉａｒｅｔｔｇｅｒｉ）、プロビデンシア・アルカリファシエンス（Ｐｒｏｖｉｄｅｎｃｉａａｌｃａｌｉｆａｃｉｅｎｓ）、プロテウス・ペンネリ（Ｐｒｏｔｅｕｓｐｅｎｎｅｒｉ）、プロテウス・ミラビリス（Ｐｒｏｔｅｕｓｍｉｒａｂｉｌｉｓ）、プロビデンシア・ルスティジアニ（Ｐｒｏｖｉｄｅｎｃｉａｒｕｓｔｉｇｉａｎｉｉ）（ＡＢＶＰ０１００００２５、ＡＢＸＶ０２００００４３、ＡＢＸＷ０１０００００４、ＡＣＣＩ０２００００６７、ＡＣＬＥ０１００００８０、ＧＧ６６１９９６、ＧＧ６６８５７８、ＧＧ７０３８２０、ＧＧ７０５２６５、ＮＣ＿０１０５５４）
７６−スタフィロコッカス・サプロフィチカス（Ｓｔａｐｈｙｌｏｃｏｃｃｕｓｓａｐｒｏｐｈｙｔｉｃｕｓ）（ＡＦ１４４０８８、ＡＰ００８９３４、ＮＣ＿００７３５０）
３１０−ウレアプラズマ・パルバム（Ｕｒｅａｐｌａｓｍａｐａｒｖｕｍ）（ＣＰ０００９４２、ＮＣ＿００２１６２、ＮＣ＿０１０５０３）
２５−ウレアプラズマ・ウレアリチカム（Ｕｒｅａｐｌａｓｍａｕｒｅａｌｙｔｉｃｕｍ）（ＣＰ００１１８４、ＮＣ＿０１１３７４）
５−ウレアプラズマ・ウレアリチカム（Ｕｒｅａｐｌａｓｍａｕｒｅａｌｙｔｉｃｕｍ）、ウレアプラズマ・パルバム（Ｕｒｅａｐｌａｓｍａｐａｒｖｕｍ）（ＣＰ０００９４２、ＣＰ００１１８４、ＮＣ＿００２１６２、ＮＣ＿０１０５０３、ＮＣ＿０１１３７４）。

この分析報告における読取りの大部分は、***症の既知の一般的な原因であるクレブシエラ・ニューモニエ（Ｋｌｅｂｓｉｅｌｌａｐｎｅｕｍｏｎｉａｅ）に由来した。またデータは、カンジダ・アルビカンス（Ｃａｎｄｉｄａａｌｂｉｃａｎｓ）およびウレアプラズマ・パルバム（Ｕｒｅａｐｌａｓｍａｐａｒｖｕｍ）を含む他の既知の***源（ｉｎｆｅｃｔａｎｔ）の低レベルの存在も示す。

カンジダ・アルビカンス（Ｃａｎｄｉｄａａｌｂｉｃａｎｓ）ゲノムＤＮＡのサンプルの結果は、恐らく、ＤＮＡを生成するために使用される細胞培養物の低汚染（．１％未満、読取りカウントに基づく）、あるいは他のサンプルからの読取りがこのサンプルのためのバーコードを含有するように見せる配列決定エラーのいずれかによる、Ｃ．アルビカンス（Ｃ．ａｌｂｉｃａｎｓ）からの２９３，３８４の読取り、ならびにクレブシエラおよびプロテウスからの数百の読取りを示した。

この配列決定ランから***症サンプルの４つにおいて検出された異なる感染性種の割合は図２５に示される。異なる主要な感染症は、プロテウス、クレブシエラ、およびウレアプラズマ感染症であると同定された。

実施例１０：環状化捕獲反応方法
環状化捕獲プロトコルは、特定のプローブおよび標的ＤＮＡサンプルに対して、最適なＰＣＲサイクル数を決定するために種々のＰＣＲサイクル数を用いて実施され得る（図２５（ｉ））。

またプロトコルは、ギャップ充填および連結のために種々の長さの時間を用いて実施され得る。場合によっては、ギャップ充填は、わずか１５分のインキュベーションの後に完了する（図２５（ｉｉ））。

プローブハイブリダイゼーションは、特定のプローブに対して最適ハイブリダイゼーション温度を決定するために、若干異なる温度で実施され得る。例えば、７２℃または６８℃のいずれかにおいて、１０分という短い時間のハイブリダイゼーションの後に、実質的に環状化された産物が生成される（図２５（ｉｉｉ）、インキュベーション時間（分）は各レーンに対して示される）。

本明細書は、本明細書内で引用される参考文献の教示を鑑みて最も十分に理解される。本明細書内の実施形態は本発明の実施形態の実例を提供するものであって、本発明の範囲を限定すると解釈されてはならない。当業者は、多くの他の実施形態が本発明によって包含されることを容易に認識する。本開示において引用される全ての刊行物、特許出願、および特許は、参照によってその全体が援用される。参照によって援用される資料が本明細書と矛盾するまたは一致しない範囲では、本明細書がこのようないかなる資料にも優先するであろう。本明細書における任意の参考文献の引用は、このような参考文献が本発明の先行技術であることの承認ではない。

他に記載されない限り、特許請求の範囲を含む本明細書中で使用される成分、反応条件などの量を表す全ての数は、全ての場合において、「約」という用語で修飾されていると理解されるべきである。従って、反することが他に記載されない限り、数値パラメータは近似値であり、本発明が獲得しようとする所望の特性に応じて異なり得る。最低でも、そして特許請求の範囲に対する均等論の適用を制限する試みとしてではなく、各数値パラメータは、有効数字の数および通常のラウンディング（ｒｏｕｎｄｉｎｇ）アプローチを鑑みて解釈されるべきである。本明細書における異なる量の有効数字を有する一連の数の記述は、より小さい有効数字が与えらえた数がより大きい有効数字が与えらえた数と同じ精度を有することを暗示すると解釈されてはならない。

「ａ」または「ａｎ」という語の使用は、特許請求の範囲および／または本明細書において「ｃｏｍｐｒｉｓｉｎｇ」という用語と併用される場合、「１つ」を意味することができるが、「１つまたは複数」、「少なくとも１つ」、および「１つまたは１つよりも多い」という意味とも矛盾しない。特許請求の範囲における「ｏｒ」という用語の使用は、代替のみを指すことが明確に示されない限り「および／または」を意味するために使用される、すなわち、代替は互いに排他的であるが、本開示は、代替のみ、そして「および／または」を指すという定義を指示する。

他に記載されない限り、一連の要素に先行する「少なくとも」という用語は、一連の要素の全てを指すと理解されるべきである。当業者は、本明細書中に記載される特定の実施形態に対する多数の均等物を認識するか、あるいは単なるルーチン実験を用いて確かめることができるであろう。このような均等物は、特許請求の範囲によって包含されることが意図される。

他に定義されない限り、本明細書において使用される全ての技術および科学用語は、本発明が属する分野の当業者によって一般的に理解されるのと同じ意味を有する。本明細書中に記載されるものと類似または均等の任意の方法および材料を本発明の実施または試験において使用することができる。

本明細書において考察される刊行物は、本出願の出願日よりも前のその開示についてのみ提供される。本明細書中のものはどれも、本発明が従来の発明によるこのような刊行物に先行する権利がないという承認として解釈されてはならない。さらに、提供される刊行物の日付は実際の公開日とは異なる可能性があり、独立して確認される必要があることもある。

本発明の他の実施形態は、本明細書の考察および本明細書中に開示される実施形態の実行から当業者に明らかであろう。本明細書および実施例は単に例示的なものであると考えられることが意図され、本発明の真の範囲および趣旨は以下の特許請求の範囲によって示される。

Claims

被験者の中の少なくとも１つの標的生物を検出するための複数のプローブを含む混合物において、各プローブが、
ａ．第１の末端において、前記少なくとも１つの標的生物のゲノム中に存在する第１の標的配列と特異的にハイブリッド形成する第１の相同プローブ配列と、
ｂ．第２の末端において、前記少なくとも１つの標的生物のゲノム中に存在する第２の標的配列と特異的にハイブリッド形成する第２の相同プローブ配列と、
ｃ．前記第１の末端と前記第２の末端との間の、検出可能な部分およびプライマーを含む骨格配列と
を含み、前記第１の標的配列および前記第２の標的配列が、少なくとも２つのヌクレオチドを含む対象の領域によって分離されおり、各プローブ中の前記第１および第２の相同プローブ配列のそれぞれが、
ｉ．前記標的生物と特異的にハイブリッド形成し、
ｉｉ．５０〜７２℃の範囲のＴ_ｍを有し、
ｉｉｉ．（ａ）前記混合物中の他のいかなる相同プローブ配列、（ｂ）いかなる骨格配列、（ｃ）前記被験者のゲノム中に存在するいかなるヌクレオチド配列、または（ｄ）前記標的生物以外の所定の配列決定された生物セットのゲノム中に存在するいかなるヌクレオチド配列とも特異的にハイブリッド形成せず、
ｉｖ．前記少なくとも１つの標的ゲノムにおいて反復閾値未満で発生し、前記反復閾値が２０であり、そして
ｖ．４つを超える連続した同一ヌクレオチドを含有せず、実質的に二次構造を有しない
ことを特徴とする混合物。
請求項１に記載の混合物において、各プローブ中の前記第１および第２の相同プローブ配列のそれぞれが、前記対象の領域に隣接する前記対象の生物の配列決定された変異体のゲノムと特異的にハイブリッド形成することを特徴とする混合物。
請求項１に記載の混合物において、前記反復閾値が２であることを特徴とする混合物。
請求項１に記載の混合物において、前記対象の領域が、前記標的生物の配列決定された変異体の間で多形性であることを特徴とする混合物。
請求項４に記載の混合物において、前記対象の領域が、毒素産生または抗生物質耐性に関連することを特徴とする混合物。
請求項１に記載の混合物において、前記少なくとも１つの標的生物が病原体を含むことを特徴とする混合物。
請求項１に記載の混合物において、前記少なくとも１つの標的生物が細菌を含むことを特徴とする混合物。
請求項１に記載の混合物において、前記少なくとも１つの標的生物がウイルスを含むことを特徴とする混合物。
請求項１に記載の混合物において、前記少なくとも１つの標的生物が真菌を含むことを特徴とする混合物。
請求項１に記載の混合物において、前記少なくとも１つの標的生物が古細菌を含むことを特徴とする混合物。
請求項１に記載の混合物において、前記少なくとも１つの標的生物が真核生物を含むことを特徴とする混合物。
請求項１に記載の混合物において、前記骨格が切断部位をさらに含むことを特徴とする混合物。
請求項１２に記載の混合物において、前記切断部位が、制限エンドヌクレアーゼ認識部位であることを特徴とする混合物。
請求項１に記載の混合物において、前記骨格が第２のプライマーをさらに含むことを特徴とする混合物。
請求項１に記載の混合物において、前記検出可能な部分がバーコード配列であることを特徴とする混合物。
請求項１に記載の混合物において、前記混合物が、少なくとも４、１０、１５、２０、３０、４０、６０、８０、１００、１５０、２００、２５０、３００、４００、５００、１０００、２０００、４０００、８０００、１００００、１５０００、または２００００の異なる標的生物に対して少なくとも１つのプローブを含むことを特徴とする混合物。
請求項１に記載の混合物において、前記混合物が、少なくとも１０、２０、３０、４０、６０、８０、１００、２００、２５０、５００、１０００、２０００、４０００、８０００、１００００、２００００、３００００、４００００、５００００、６００００、７００００、８００００、９００００、または１０００００のプローブを含むことを特徴とする混合物。
請求項１に記載の混合物において、前記混合物がさらに、少なくとも１つの被験者特異的プローブを含むことを特徴とする混合物。
請求項１に記載の混合物において、前記被験者が哺乳類であることを特徴とする混合物。
請求項１９に記載の混合物において、前記被験者がヒトであることを特徴とする混合物。
請求項１乃至２０の何れか１項に記載の混合物において、各プローブの前記相同プローブ配列が、１８〜５０のヌクレオチドであることを特徴とする混合物。
請求項１乃至２０の何れか１項に記載の混合物において、各プローブの前記相同プローブ配列が、１８〜３６のヌクレオチドであることを特徴とする混合物。
請求項１乃至２０の何れか１項に記載の混合物において、各プローブの前記相同プローブ配列が、２０〜３２のヌクレオチドであることを特徴とする混合物。
請求項２１に記載の混合物において、前記第１および第２の相同プローブ配列が、２２〜２８のヌクレオチドであることを特徴とする混合物。
請求項１乃至２０の何れか１項に記載の混合物において、各プローブの前記第１および第２の相同プローブ配列が、５０〜６５℃のＴ_ｍを有することを特徴とする混合物。
請求項１乃至２０の何れか１項に記載の混合物において、各プローブの前記第１および第２の相同プローブ配列が、同一のＴ_ｍを有することを特徴とする混合物。
請求項１乃至２０の何れか１項に記載の混合物において、前記第１の相同プローブ配列が、前記第２の相同プローブ配列よりも低いＴ_ｍを有することを特徴とする混合物。
請求項１乃至２０の何れか１項に記載の混合物において、前記第１の相同プローブ配列が、前記第２の相同プローブ配列よりも高いＴ_ｍを有することを特徴とする混合物。
請求項１に記載の混合物において、試験サンプルから抽出された核酸をさらに含むことを特徴とする混合物。
請求項２９に記載の混合物において、前記抽出された核酸が、生物サンプルに由来することを特徴とする混合物。
請求項３０に記載の混合物において、前記生物サンプルが患者に由来することを特徴とする混合物。
請求項３１に記載の混合物において、前記患者が哺乳類であることを特徴とする混合物。
請求項３２に記載の混合物において、前記哺乳類がヒトであることを特徴とする混合物。
請求項１に記載の混合物において、少なくとも１つのサンプル内部較正標準核酸をさらに含むことを特徴とする混合物。
請求項３４に記載の混合物において、前記サンプル内部較正標準核酸と特異的にハイブリッド形成する少なくとも１つのプローブをさらに含むことを特徴とする混合物。
請求項３４に記載の混合物において、試験サンプルから抽出された核酸をさらに含むことを特徴とする混合物。
請求項１乃至３６の何れか１項に記載の混合物において、前記混合物が、表４、５、６、８、または９のいずれか１つからの少なくとも１つの相同プローブ配列を含むことを特徴とする混合物。
請求項１に記載の混合物において、前記対象の領域が、少なくとも２、４、８、１０、２０、４０、６０、８０、１００、１２５、１５０、２００、２５０、３００、３５０、４００、５００、６００、７００、８００、９００、１０００、１２００、１４００、１６００、１８００、または２０００のヌクレオチドであることを特徴とする混合物。
請求項１乃至３８の何れか１項に記載の混合物と、使用説明書とを含むことを特徴とするキット。
請求項３９に記載のキットにおいて、ＤＮＡ抽出のための試薬をさらに含むことを特徴とするキット。
１つまたは複数の標的生物の存在を検出する方法において、
ａ）標的生物を含有する疑いがある試験サンプルを、請求項１乃至３８の何れか１項に記載の混合物と接触させるステップと、
ｂ）第１および第２の標的配列とハイブリッド形成して環状化プローブを形成する少なくとも１つのプローブによって、対象の領域を捕獲するステップと、
ｃ）前記捕獲された対象の領域を検出し、それにより、１つまたは複数の標的生物の存在を検出するステップと
を含むことを特徴とする方法。
請求項４１に記載の方法において、前記対象の領域が、相同プローブ配列のポリメラーゼ依存性伸長によって捕獲されることを特徴とする方法。
請求項４１に記載の方法において、前記対象の領域が、結合オリゴヌクレオチドの配列特異的連結によって捕獲されることを特徴とする方法。
請求項４１に記載の方法において、前記環状化プローブを増幅して、前記捕獲された対象の領域を含有する複数の増幅産物を形成するステップをさらに含むことを特徴とする方法。
請求項４１に記載の方法において、ステップ（ｂ）とステップ（ｃ）との間に、ヌクレアーゼ処理をして線状核酸を除去するステップをさらに含むことを特徴とする方法。
請求項４１に記載の方法において、部位特異的エンドヌクレアーゼによる切断によって前記環状化プローブを線状化するステップをさらに含むことを特徴とする方法。
請求項４１乃至４６の何れか１項に記載の方法において、前記対象の領域を配列決定するステップをさらに含むことを特徴とする方法。
請求項４７に記載の方法において、前記配列決定が、ジデオキシ配列決定であることを特徴とする方法。
請求項４７に記載の方法において、前記捕獲された対象の領域の配列を、既知のゲノムの配列または既知の突然変異のデータベースと比較するステップをさらに含むことを特徴とする方法。
請求項４７乃至４９の何れか１項に記載の方法において、前記標的生物が、対象の配列を有する任意の標的生物であることを特徴とする方法。
請求項５０に記載の方法において、前記対象の配列が、遺伝子、座位、１つまたは複数の単一ヌクレオチド多型（ＳＮＰ）を含有する配列、および１つまたは複数の挿入、欠失、または挿入欠失を含有する配列から選択されることを特徴とする方法。
請求項４７に記載の方法において、既知のゲノムの配列および配列決定エラーのモデルに関して、前記捕獲された対象の領域の配列を分析して、前記サンプル中に存在する種々の生物の割合または存在量を推定するステップをさらに含むことを特徴とする方法。
請求項４１に記載の方法において、前記環状化プローブが、ハイブリダイゼーションによって検出されることを特徴とする方法。
請求項５３に記載の方法において、前記ハイブリダイゼーションが、前記環状化プローブと特異的にハイブリッド形成する少なくとも１つの特徴を含むマイクロアレイに対するものであることを特徴とする方法。
請求項４１に記載の方法において、前記試験サンプルが、哺乳類被験者から得られることを特徴とする方法。
請求項５５に記載の方法において、前記哺乳類がヒトであることを特徴とする方法。
請求項５５に記載の方法において、前記試験サンプルがバイオプシーであることを特徴とする方法。
請求項４１乃至５７の何れか１項に記載の方法において、サンプル内部較正標準を前記試験サンプルに添加するステップをさらに含むことを特徴とする方法。
請求項５８に記載の方法において、前記サンプル内部較正標準と特異的にハイブリッド形成するプローブを添加するステップと、前記サンプル内部較正標準を検出するステップとをさらに含むことを特徴とする方法。
請求項４１乃至５９の何れか１項に記載の方法において、結果をフォーマットして、医師の意思決定を通知するステップをさらに含むことを特徴とする方法。
請求項６０に記載の方法において、前記フォーマッティングが、対象の生物の推定量を提供することを含むことを特徴とする方法。
請求項６１に記載の方法において、前記フォーマッティングが、対象の生物の量をカラーコーディングすることを含むことを特徴とする方法。
請求項６０乃至６２の何れか１項に記載の方法において、前記フォーマットされた結果が、前記検出された少なくとも１つの標的生物に基づいた治療的勧告を含むことを特徴とする方法。
請求項４１乃至５７の何れか１項に記載の方法を含む、病原体に感染した被験者の治療方法において、少なくとも１つの病原体の存在を検出するステップと、前記検出された少なくとも１つの病原体に基づいて前記被験者に適切な予防を施すステップとをさらに含むことを特徴とする方法。
請求項１に記載の混合物の製造方法において、
ａ）対象の生物のための少なくとも１つの基準ゲノム、少なくとも１つの非ハイブリッド形成ゲノム、および場合により、前記基準ゲノムと同一でない少なくとも１つのハイブリッド形成ゲノムを提供するステップと、
ｂ）前記基準ゲノムをｎ−ｍｅｒへスライスするステップであって、ｎが１８〜５０の範囲であるステップと、
ｃ）前記スライスされた基準ゲノムからスクリーニングされたｎ−ｍｅｒのセットを同定するステップであって、前記スクリーニングされたｎ−ｍｅｒのセットが、
ｉ）非反復性であり、
ｉｉ）実質的に二次構造を有しないｎ−ｍｅｒからなり、
ｉｉｉ）４つを超える連続した同一ヌクレオチドを含有するｎ−ｍｅｒを有さず、
ｉｖ）５０〜７２℃の範囲のＴ_ｍを有するｎ−ｍｅｒからなるステップと、
ｄ）相同プローブ配列のセットを同定するステップであって、前記相同プローブ配列が、スクリーニングされたｎ−ｍｅｒからなり、
ｉ）前記ｎ−ｍｅｒが、いかなる非ハイブリッド形成ゲノムとも特異的にハイブリッド形成せず、
ｉｉ）前記ｎ−ｍｅｒが、前記基準ゲノムおよび場合により少なくとも１つのハイブリッド形成ゲノムにおいて１〜２０回発生するステップと、
ｅ）第１の相同プローブ配列および第２の相同プローブ配列を含む複数のプローブを構築するステップであって、
ｉ）前記第１および第２の相同プローブ配列がそれぞれ、前記対象の生物のゲノム中の第１および第２の標的配列と特異的にハイブリッド形成し、前記第１および第２の標的配列が少なくとも２つのヌクレオチドを含む対象の領域によって分離されており、
ｉｉ）前記複数のプローブが、互いに特異的にハイブリッド形成せず、そして
ｉｉｉ）前記複数のプローブが、実質的に二次構造を有しないステップと
を含むことを特徴とする方法。
請求項６５に記載の方法において、２つ以上の基準ゲノムが提供され、少なくとも１つのプローブが、前記基準ゲノムの少なくとも１つとハイブリッド形成することを特徴とする方法。
請求項６６に記載の方法において、構築された各プローブが、対象の領域のゲノム配列のセット内の既知の配列の対の間で明らかにされたＳＮＰの総数に基づいてスコア化されることを特徴とする方法。
請求項６７に記載の方法において、前記混合物中の前記プローブが、対象の領域のゲノム配列のセット内の既知の配列間に存在するＳＮＰの閾値数に基づいて選択されることを特徴とする方法。
請求項６６に記載の方法において、構築された各プローブが、前記プローブによって捕獲される対象の標的座位の総数に基づいてスコア化されることを特徴とする方法。
請求項６９に記載の方法において、前記混合物中のプローブの数が、特定の数の対象の標的座位を捕獲するプローブの閾値数に基づいて選択されることを特徴とする方法。
請求項６５乃至７０の何れか１項に記載の方法において、相同プローブ配列が、排除ゲノムのセットに対して指定の長さよりも長い完全な一致を含有しないように各プローブが変更され、前記変更されたプローブが、１つまたは複数の標的ゲノムとハイブリッド形成した後にまだ環状化し得ることを特徴とする方法。
請求項６５乃至７２の何れか１項に記載の方法において、前記ｎ−ｍｅｒが、少なくとも閾値回数の基準ゲノムセットにおけるその発生に基づいて選択されることを特徴とする方法。
請求項６５乃至７２の何れか１項に記載の方法において、追加の対象の生物のそれぞれの数ｍに対して、ステップ（ａ）〜（ｅ）を繰り返すことをさらに含むことを特徴とする方法。
請求項７３に記載の方法において、ｍが４、１０、１５、２０、３０、４０、６０、８０、１００、１５０、２００、２５０、３００、４００、５００、１０００、２０００、４０００、８０００、１００００、１５０００、または２００００よりも大きいことを特徴とする方法。
請求項６５に記載の方法において、前記少なくとも１つの非ハイブリッド形成ゲノムが、ヒトゲノムを含むことを特徴とする方法。
請求項６５に記載の方法において、前記少なくとも１つの非ハイブリッド形成ゲノムが、前記標的生物以外の所定の配列決定された生物セットを含むことを特徴とする方法。
請求項６５に記載の方法において、前記少なくとも１つのハイブリッド形成ゲノムが、前記基準ゲノムの同じ種、株、亜株、または血清型の配列決定された変異体を含むことを特徴とする方法。
請求項６５乃至７５の何れか１項に記載の方法において、前記ゲノムのｎ−ｍｅｒへのスライシングが、１とｎの間のオフセットを有することを特徴とする方法。
請求項６４に記載の方法において、ｎが１８〜３５のヌクレオチドであることを特徴とする方法。
請求項７９に記載の方法において、ｎが２０〜３２のヌクレオチドであることを特徴とする方法。
請求項８０に記載の方法において、ｎが２２〜２８のヌクレオチドであることを特徴とする方法。
請求項６５乃至８１の何れか１項に記載の方法において、前記方法が、少なくとも１０、９、８、７、６、５、４、３、または２メガベースの標的ゲノムにおいて、シングルコアＰｅｎｔｉｕｍＸｅｏｎ２．５ｇｈｚプロセッサを用いて１６、１４、１２、１０、８、６、もしくは４日間、または７２、４８、３６、２４、１２、１０、８、６、もしくは４時間かからないことを特徴とする方法。
１つまたは複数の対象の生物を検出するための、請求項１乃至３８の何れか１項に記載の混合物。
１つまたは複数の対象の生物を検出するための、請求項１乃至３８の何れか１項に記載の混合物の使用。