JP2023519919A

JP2023519919A - 病原体を検出するためのアッセイ

Info

Publication number: JP2023519919A
Application number: JP2022558526A
Authority: JP
Inventors: エフ．サントス，カルロス; ジェー．ステーツ，デビッド; ピー．フェルドマン，ジョナサン; ディー．モラン，ジョスエ
Original assignee: オングストロームバイオ，インコーポレイテッド
Priority date: 2020-03-24
Filing date: 2021-03-24
Publication date: 2023-05-15
Also published as: US20240240267A1; WO2021191829A1; CA3173190A1; EP4127233A1

Abstract

病原体感染の決定因子である標的核酸を同定するための組成物及び方法が本明細書で提供される。本明細書で提供される多重化された方法は、いくつかの異なる生物学的試料から、１つ又は複数の病原性感染を示すＩｇＧ及びＩｇＭ免疫グロブリンなどの標的タンパク質を同時に検出する。核酸試料中の配列変異体を検出するための方法も本明細書で提供される。

Description

関連出願の相互参照
本出願は、２０２０年３月２４日に出願された米国仮出願第６２／９９４，１７３号に対する優先権の利益を主張する。前述の出願の全内容は、参照により本明細書に組み込まれる。

配列表
本出願は、ＡＳＣＩＩ形式で電子的に提出された配列表を含み、その全体が参照により本明細書に組み込まれる。２０２１年３月２２日に作成されたＡＳＣＩＩコピーの名前はＡ１０９９２２＿１０１０ＷＯ＿ＳＬ．ｔｘｔであり、サイズは５８，１７７バイトである。

試料、例えば生物学的試料（例えば、血液試料、経口試料、経鼻試料、又は組織試料）中の病原体、例えばコロナウイルス（例えば、２２９Ｅ、ＮＬ６３、ＯＣ４３、ＨＫＵ１、ＭＥＲＳ－ＣｏＶ、ＳＡＲＳ－ＣｏＶ及びＳＡＲＳ－ＣｏＶ－２）及び／又は他のウイルス、例えばインフルエンザウイルス（例えば、インフルエンザウイルスＡ、インフルエンザウイルスＢ、インフルエンザウイルスＣ及びインフルエンザウイルスＤ）、細菌（例えば、マイコバクテリウム、連鎖球菌、緑膿菌、赤痢菌、カンピロバクター、クラミジア及びサルモネラ）を検出するためのアレイ及び方法が本明細書で提供される。

疾患の早期検出は、疾患の制御及び治療を成功させるために重要であることが多い。正確で高速かつ低コストの血液分析、感染診断、病原体検出、又は他の生物学的若しくは化学的分析物検出を提供することは、医療提供者及び危険な対応チームにとって依然として大きな課題である。

適例は、ヒト及び家畜において高度に流行性の疾患を引き起こす大きなエンベロープＲＮＡウイルスであるコロナウイルスによって引き起こされるウイルス感染症などの感染症の診断である。コロナウイルスは、呼吸分泌物のエアロゾルによって、糞便－経口経路によって、及び機械的伝染によって伝染される。多くの場合、ウイルスに感染した患者は無症候性であり、他の場合、感染は軽度の自己限定性疾患（古典的な「風邪」又は胃の不調）を引き起こし、まれな神経学的合併症があり得る。新規ＳＡＲＳ－ＣｏＶ－２（ＣＯＶＩＤ－１９）ウイルスは、下気道の肺細胞に局在するようであり、選択された患者集団において死をもたらす重度の呼吸器合併症を引き起こす。

ＳＡＲＳ－ＣｏＶ－２では、高い感染性と病原性とが致命的に組み合わされ、大部分の患者が不定であるが長期間無症状であることと相まって、世界中の医療システムを圧倒している。中国、イラン、スペイン、及びイタリアからの報告は、局所的な集団発生の初期数週間で疾患の拡散を制御することができないことが、急性呼吸窮迫又は他の生命を脅かす症状に対する集中治療を必要とする患者の急増につながり、それが局所的な地域の医療システムの収容能力を急速に圧倒し、死亡率を急上昇させ得ることを示している。ＣＯＶＩＤ－１９の集団発生は、世界保健機関によって国際的に懸念される公衆衛生上の緊急事態であると宣言されており、人々の生活、家庭及び地域社会に大きな影響を与えている。したがって、ＣＯＶＩＤ－１９及び日和見感染症を早期に診断する能力は、より効果的な治療決定及び患者の転帰の改善につながるはずである。さらに、中和抗体の集団産生の検出は、特定の病原体に対する集団の健康リスクの特定につながり得る。

高度な分析物検出システムが利用可能であるが、それらはかさばり、高価であり、較正、動作及び維持のために広範囲の訓練を必要とする。迅速な診断試験は、試験あたりのコストが低く、操作が簡単であり、必要な機器が最小限であるか又は全くないという利点を提供することができるが、著しい制約もある。迅速な診断試験は、単一の分析物について単一の試料のみを試験するように構成されることが多いため、共同感染試験をサポートするために複数のデバイスが必要であり、これは極端に高価で非実用的であり得る。

患者の臨床試料中の病原体又は感染の決定因子を正確かつ効率的に検出及び識別することができる、大規模に並行した迅速な診断試験の開発が必要とされている。

本明細書に記載の組成物及び方法は、複数の試料からの病原体の同時迅速検出に有用である。本開示はまた、核酸試料中の配列変異体を検出する方法を提供する。本明細書に記載の組成物、アレイ、システム及び方法は、ＰＣＲ又は近接ライゲーションアッセイの単純さを組み合わせて、複数のアンプリコンの並行シーケンシングを用いて独自にバーコード化されたアンプリコンを生成し、生物学的試料から１つ又は複数の分析物（例えば、ポリヌクレオチド及び／又はタンパク質）の存在又は非存在を識別することに加えて、ソース識別情報を提供することができる。

一態様では、本開示は、少なくとも１つの標的核酸を同定する方法を提供する。方法は、ａ）複数の対象から複数の生物学的試料を得る工程、ｂ）生物学的試料の各々から全核酸を得る工程、ｃ）複数のアンプリコンを産生するために増幅混合物を使用して複数のポリヌクレオチドを増幅に供する工程、ｄ）複数のアンプリコンの各々を検出する工程、及びｅ）複数のアンプリコンのカテゴリーを決定する工程を含む。
いくつかの実施形態において、複数のポリヌクレオチドはＲＮＡ分子を含み、工程ｂ）は、工程ｃ）における増幅を行う前に、ＲＮＡから逆転写されたｃＤＮＡを得ること、又はＲＮＡからｃＤＮＡを逆転写することをさらに含む。特定の実施形態において、工程ｂ）における複数のポリヌクレオチドはＲＮＡ分子を含み、工程ｂ）において逆転写酵素を添加して、工程ｃ）における増幅に供される複数のｃＤＮＡを得る。いくつかの実施形態において、工程ｂ）における複数のポリヌクレオチドはＤＮＡ分子をさらに含む。

本明細書に記載される方法の多くの実施形態では、標的核酸は、ＲＮＡウイルス、ＤＮＡウイルス、真菌、寄生生物及び細菌からなる群から選択される１つ又は複数の病原体を含む試料から得られる。いくつかの実施形態において、病原体は、アシネトバクター・バウマンニ（Ａｃｉｎｅｔｏｂａｃｔｅｒｂａｕｍａｎｎｉｉ）、アデノウイルス、アフリカ馬疫ウイルス、アフリカ豚コレラウイルス、ズビニ鉤虫（Ａｎｃｌｏｓｔｏｍａｄｕｏｄｅｎａｌｅ）、回虫、黄色アスペルギルス、アスペルギルス・フミガーツス（Ａｓｐｅｒｇｉｌｌｕｓｆｕｍｉｇａｔｕｓ）、アスペルギルス・ニガー（Ａｓｐｅｒｇｉｌｌｕｓｎｉｇｅｒ）、アスペルギルス・オリゼ（Ａｓｐｅｒｇｉｌｌｕｓｏｒｙｚａｅ）、鳥インフルエンザウイルス、炭疽菌、炭疽菌パスツール株、セレウス菌、ウシ流産菌、ブルセラ・メリテンシス（Ｂｒｕｃｅｌｌａｍｅｌｉｔｅｎｓｉｓ）、ブルセラ・スイス（Ｂｒｕｃｅｌｌａｓｕｉｓ）、鼻疽菌、類鼻疽菌、カンジダ・アルビカンス（Ｃａｎｄｉｄａａｌｂｉｃａｎｓ）、カンジダ・ドゥブリニエンシス（Ｃａｎｄｉｄａｄｕｂｌｉｎｉｅｎｓｉｓ）、カンジダ・グラブラタ（Ｃａｎｄｉｄａｇｌａｂｒａｔａ）、カンジダ・クルセイ（Ｃａｎｄｉｄａｋｒｕｓｅｉ）、カンジダ・トロピカリス（Ｃａｎｄｉｄａｔｒｏｐｉｃａｌｉｓ）、クラミジア・ニューモニエ（Ｃｈｌａｍｙｄｉａｐｎｅｕｍｏｎｅａｅ）、クラミジア・トラコマチス（Ｃｈｌａｍｙｄｉａｔｒａｃｈｏｍａｔｏｕｓ）、豚熱ウイルス、クロストリジウム・ディフィシール（Ｃｌｏｓｔｒｉｄｉｕｍｄｉｆｆｉｃｉｌｅ）、コクシジオイデス・イミティス（Ｃｏｃｃｉｄｉｏｉｄｅｓｉｍｍｉｔｉｓ）、コクシジオイデス・ポサダシ（Ｃｏｃｃｉｄｉｏｉｄｅｓｐｏｓａｄａｓｉｉ）、ＣｏＶ－２２９Ｅ、ＣｏＶ－ＨＫＵ１、ＣｏＶ－ＮＬ６３、ＣｏＶ－ＯＣ４３、コクサッキーウイルスＡ、コクサッキーウイルスＢ、コクシエラ・バーネッティ（Ｃｏｘｉｅｌｌａｂｕｒｎｅｔｉｉ）、クリミア・コンゴ出血熱、サイトメガロウイルス、デングウイルス、メジナ虫、東部馬脳炎、エボラウイルス、い粒条虫、多包条虫、エンテロバクター・クロアカ、エンテロコッカス・フェシウム（Ｅｎｔｅｒｏｃｏｃｃｕｓｆａｅｃｉｕｍ）、エンテロウイルス、エプスタイン・バール・ウイルス、大腸菌、巨大肝蛭、肝蛭、***ウイルス、野兎病菌、山羊痘ウイルス、ヘモフィルス属インフルエンザ、ヘリコバクターピロリ、ヘンドラウイルス、Ａ型肝炎ウイルス、Ｂ型肝炎ウイルス、Ｃ型肝炎ウイルス、ヒストプラスマ・カプスラーツム（Ｈｉｓｔｏｐｌａｓｍａｃａｐｓｕｌａｔｕｍ）、ズボアジ型ヒストプラスマ症（Ｈｉｓｔｏｐｌａｓｍａｄｕｂｏｉｓｉｉ）、ヒトヘルペスウイルスＨＨＶ６、ヒトヘルペスウイルスＨＨＶ７、ヒトヘルペスウイルスＨＨＶ８、ヒトヘルペスウイルスＨＳＶ１、ヒトヘルペスウイルスＨＳＶ２、ヒト免疫不全ウイルス、ヒトパピローマウイルス、インフルエンザウイルスＡ型、インフルエンザウイルスＢ型、クレブシェラ肺炎桿菌、キャサヌール森林病ウイルス、ラッサ熱ウイルス、レジオネラ・ニューモフィラ菌、リーシュマニア・プロマスティゴート（Ｌｅｉｓｈｍａｎｉａｐｒｏｍａｓｔｉｇｏｔｅｓ）、Ｌｕｊｏウイルス、ランピースキン病ウイルス、マールブルグウイルス、麻疹ウイルス、メチシリン耐性黄色ブドウ球菌、サル痘ウイルス、ムンプスウイルス、マイコバクテリウム・アブセッサス（Ｍｙｃｏｂａｃｔｅｒｉｕｍａｂｓｃｅｓｓｕｓ）、マイコバクテリウム・アビウム（Ｍｙｃｏｂａｃｔｅｒｉｕｍａｖｉｕｍ）、マイコバクテリウム・ボビス（Ｍｙｃｏｂａｃｔｅｒｉｕｍｂｏｖｉｓ）、マイコバクテリウム・カヌッティイ（Ｍｙｃｏｂａｃｔｅｒｉｕｍｃａｎｅｔｔｉｉ）、マイコバクテリウム・レプレ（Ｍｙｃｏｂａｃｔｅｒｉｕｍｌｅｐｒａｅ）、ヒト結核菌、マイコバクテリウム・ウルセランス（Ｍｙｃｏｂａｃｔｅｒｉｕｍｕｌｃｅｒａｎｓ）、マイコプラズマ・カプリコルム（Ｍｙｃｏｐｌａｓｍａｃａｐｒｉｃｏｌｕｍ）、マイコプラズマ・ミコイデス（Ｍｙｃｏｐｌａｓｍａｍｙｃｏｉｄｅｓ）、マイコプラズマ・ニューモニア（Ｍｙｃｏｐｌａｓｍａｐｎｅｕｍｏｎｅａｅ）、アメリカ十二指腸虫、淋病、ニューカッスル病ウイルス、ニパウイルス、ノルカジア属ｂｅｉｊｉｎｇｅｎｓｉｓ、ノルカジア属ｃｙｒｉａｃｉｇｅｏｒｇｉｃａ、ノルカジア属ｆａｒｃｉｎｉｃａ、ノロウイルスＧＩ、ノロウイルスＧＩＩ、ノーウォークウイルス、オムスク出血熱ウイルス、回旋糸状虫、発癌性ヒトパピローマウイルス、パラインフルエンザウイルス、寄生生物、マルネッフェイ型ペニシリウム症（Ｐｅｎｉｃｉｌｌｉｏｓｉｓｍａｍｅｆｆｅｉ）、小反芻獣疫ウイルス、ニューモシスチス・イロベチイ（Ｐｎｅｕｍｏｃｙｓｔｉｓｊｉｒｏｖｅｃｉｉ）、ポリオーマウイルス、プロテウス・ミラビリス（Ｐｒｏｔｅｕｓｍｉｒａｂｉｌｉｓ）、緑膿菌、狂犬病ウイルス、８つの遺伝子断片すべてのコーディング領域の任意の部分を含有する、１９１８年のパンデミックインフルエンザウイルスの再構築された複製コンピテント形態、呼吸器合胞体ウイルス、ライノウイルス、発疹チフスリケッチア、リフトバレー熱ウイルス、牛疫ウイルス、ロタウイルスＡ、ロタウイルスＢ、ロタウイルスＣ、ロタウイルスＧ２、風疹ウイルス、ＳＡＲＳ関連コロナウイルス（ＳＡＲＳ－ＣｏＶ）、ＳＡＲＳ－ＣｏＶ－１、ＳＡＲＳ－ＣｏＶ－２、ビルハルツ住血吸虫、日本住血吸虫、マンソン住血吸虫、羊痘ウイルス、南米出血熱ウイルスチャパレ、南米出血熱ウイルスグアナリト、南米出血熱ウイルスフニン、南米出血熱ウイルスマチュポ、南米出血熱ウイルスサビア、黄色ブドウ球菌、スタフィロコッカス・サプロフィティカス（Ｓｔａｐｈｙｌｏｃｏｃｃｕｓｓａｐｒｏｐｈｙｔｉｃｕｓ）、肺炎レンサ球菌、豚水疱病ウイルス、有鉤条虫、ダニ媒介性脳炎複合（ｆｌａｖｉ）ウイルス極東亜型、ダニ媒介性脳炎複合（ｆｌａｖｉ）ウイルスシベリア亜型、タバコモザイク病ウイルス、トルクテノウイルス、鞭虫、ブルーストリパノソーマ（Ｔｒｙｐａｎｏｓｏｍａｂｒｕｃｅｉ）、トリパノソーマ・クルージ（Ｔｒｙｐａｎｏｓｏｍａｃｒｕｚｉ）、大痘瘡ウイルス（天然痘ウイルス）、小痘瘡ウイルス（アラストリム）、ベネズエラ馬脳炎ウイルス、バンクロフト糸状虫、ペスト菌、又は前述の群の病原体と特徴的な核酸配列を共有する、別の潜在的に新規若しくは特性決定されていない病原体からなる群から選択される。一実施形態では、病原体はＲＮＡウイルスである。特定の実施形態では、ＲＮＡウイルスはＳＡＲＳ－ＣｏＶ－２である。

本明細書に記載される方法の多くの実施形態では、試料は、血液、粘液、唾液、汗、涙、体腔に蓄積する流体、尿、***液、膣分泌物、脳脊髄液、リンパ液、糞便、痰、分解液、嘔吐物、汗、母乳、血清及び血漿からなる群から選択される。一実施形態において、試料は唾液である。

方法の一実施形態では、複数のポリヌクレオチドを増幅混合物を用いて増幅に供して、複数のアンプリコンを産生する。本明細書に記載される方法の多くの実施形態では、増幅はポリメラーゼ連鎖反応増幅である。いくつかの実施形態では、増幅はローリングサークル増幅である。方法の一実施形態では、増幅混合物は、複数のプライマー、フォワードプライマー及びリバースプライマーを含む。一実施形態では、本明細書に記載の方法は、フォワードプライマー及びリバースプライマーの固有のセットを含む増幅混合物を使用したｃＤＮＡの増幅を提供する。いくつかの実施形態において、プライマーは、複数のｃＤＮＡの各々に相補的なヌクレオチドのセットと、少なくとも１つの固有のヌクレオチドバーコード配列とを含む。いくつかの実施形態において、複数のプライマーは、少なくとも９６個の異なるバーコード化プライマーを含む。いくつかの実施形態では、方法は、特定の対象から得られた生物学的試料を識別する第１の固有のバーコード配列を含む。

本明細書中に記載される方法の多くの実施形態において、アダプター配列の対は、第１の固有のバーコード配列及びその逆相補体を第２の固有のバーコード配列及びその逆相補体から分離する。本明細書中に記載される方法の多くの実施形態において、アダプター配列の対は、第１の固有のバーコード配列及びその逆相補体に隣接する。

本明細書中に記載される方法の多くの実施形態において、検出することは、アダプター配列の対並びに第１の固有のバーコード配列及びその逆相補体を含む複数のアンプリコンをシーケンシングすることを含む。本明細書中に記載される方法の多くの他の実施形態において、検出することは、アダプター配列の対、第１の固有のバーコード配列及びその逆相補体、並びに第２の固有のバーコード配列及びその逆相補体を含む複数のアンプリコンをシーケンシングすることを含む。本明細書中に記載される方法の実施形態において、検出することは、一連のプログラムを用いてシーケンシングデータファイルを読み取ることによって行われる。一実施形態では、一連のプログラムは、ＨＭＭＥＲ／Ｉｎｆｅｒｎａｌアラインメントを含む。一実施形態において、シーケンシングデータファイルはＦＡＳＴＡ／ＦＡＳＴＱフォーマットファイルである。

多くの実施形態において、方法は、標的核酸である少なくとも１つの陽性対照試料をシーケンシングすることをさらに含む。いくつかの実施形態において、方法は、バクテリオファージＭＳ２である少なくとも１つの陽性対照試料をシーケンシングすることをさらに含む。いくつかの実施形態において、方法は、ＭＳ２鋳型核酸である少なくとも１つの陽性対照試料をシーケンシングすることをさらに含む。いくつかの実施形態において、方法は、ＲＮＡｓｅＰ又は別の非病原体遺伝子である少なくとも１つの陽性対照試料をシーケンシングすることをさらに含む。いくつかの実施形態において、方法は、ヒトハウスキーピング遺伝子ＧＡＰＤＨ又はβ－アクチン由来の核酸である少なくとも１つの陽性対照試料をシーケンシングすることをさらに含む。

多くの実施形態では、方法は、２つ以上の標的核酸を同定することを含む。いくつかの実施形態では、２つ以上の標的核酸は、単一の病原体の病原性決定因子であるか、又は病原性決定因子をエンコードする。一実施形態では、２つ以上の標的核酸は、ウイルスの病原性決定因子であるか、又は病原性決定因子をエンコードする。一実施形態では、ウイルスはＳＡＲＳ－ＣｏＶ－２である。いくつかの実施形態では、病原性決定因子は、スパイクタンパク質（Ｓ）、受容体結合ドメイン（ＲＢＤ）、Ｓ１タンパク質、Ｓ２タンパク質、Ｅ遺伝子、Ｓ遺伝子、Ｏｒｆｌａｂ遺伝子、Ｎ末端スパイクタンパク質ドメイン、全タンパク質（Ｓ１＋Ｓ２）、及びヌクレオカプシド（Ｎ）タンパク質からなる群から選択される。

いくつかの実施形態では、２つ以上の標的核酸は、ＲＮＡウイルス、ＤＮＡウイルス、真菌、寄生生物及び細菌からなる群から選択される少なくとも２つの異なる病原体の病原性決定因子であるか、又は病原性決定因子をエンコードする。一実施形態では、２つの異なるＲＮＡウイルスは、ＳＡＲＳ－ＣｏＶ－２及びインフルエンザである。

別の態様では、本開示は、多数の試料から少なくとも１つの標的タンパク質を検出するためのアレイのマルチプレックスを提供する。一実施形態では、マルチプレックスアレイは、複数の独自に標識されたビーズに結合した複数の捕捉剤を含み、独自に標識されたビーズの各々が複数の固有の捕捉剤を含む。本明細書に記載の実施形態では、マルチプレックスアレイは、少なくとも１つのビーズに結合するように設計された少なくとも１つの第１のオリゴヌクレオチド配列と、第２のオリゴヌクレオチド配列とコンジュゲートした少なくとも１つの二次抗体と、環状アンプリコン中の少なくとも１つの固有のヌクレオチドバーコード配列とを含む。本明細書に記載されるアレイの多くの実施形態では、ビーズは、少なくとも１つの標的タンパク質に特異的に結合する抗原でコーティングされる。本明細書に記載されるアレイのいくつかの実施形態では、第２のオリゴヌクレオチド配列は、第２のオリゴヌクレオチド配列が第１のオリゴヌクレオチド配列に近接している場合に増幅されて環状アンプリコンを形成するように設計される。いくつかの実施形態において、第１のオリゴヌクレオチド配列、又は第２のオリゴヌクレオチド配列、又はその両方は、少なくとも１つの固有のバーコード配列を含む。いくつかの実施形態において、第１のオリゴヌクレオチド配列は、ビーズ上にコーティングされたポリペプチドに共有結合している。いくつかの実施形態では、アレイのマルチプレックスは、抗体又は抗体断片に共有結合した第１のオリゴヌクレオチド配列を含み、抗体又は抗体断片はビーズ上にコーティングされたポリペプチドに結合する。一実施形態では、マルチプレックスアレイは、環状アンプリコン中に少なくとも９６個の異なるバーコード配列を含む。

一態様では、本開示は、複数の生物学的試料における少なくとも１つの感染のための方法を提供する。方法は、少なくとも１つの標的タンパク質が少なくとも１つのビーズの固有の捕捉剤に結合するのに十分な条件下で、本明細書に記載のアレイのマルチプレックスにおいて複数の生物学的試料を複数のビーズと共にインキュベートする第１の工程を含む。方法の第２の工程において。ビーズを洗浄して、固有の捕捉剤に結合しないタンパク質を除去する。次の工程は、複数の標的タンパク質に結合した二次抗体の数に対応する複数の複合体が形成されるように、複数の二次抗体のそれぞれが少なくとも１つの標的タンパク質と複合体を形成する条件下で、ビーズを複数の二次抗体とインキュベートすることを含む。次の工程では、ビーズを再度洗浄して、複合体を形成しない二次抗体を除去する。第６の工程では、環状アンプリコンを形成するように第１オリゴヌクレオチド配列のそれぞれに対して第２オリゴヌクレオチド配列のそれぞれをハイブリダイゼーションさせる条件下で、複数の複合体の数に対応して複数のアンプリコンが生成されるように、複数の複合体をインキュベートする。方法の第７の工程は、複数の環状アンプリコンを増幅に供することを含む。第８の工程では、ビーズをアレイにプールし、複数のアンプリコンを固有のバーコード化アンプリコンのハイスループットシーケンシングによって同時に検出する。最後の工程では、複数のアンプリコンのカテゴリーが決定される。標的増幅領域由来のポリヌクレオチドを含む複数のアンプリコンのそれぞれのカテゴリーを決定することは、対応する生物学的試料における感染を示す。

いくつかの実施形態では、本明細書に記載の方法は、１つ又は複数の試料中の病原性決定因子（例えば、細菌、真菌、寄生虫及び／又はウイルス感染）の同定に使用される。他の実施形態では、本方法は、１つ以上の病原性感染を示すＩｇＧ及びＩｇＭ免疫グロブリンなどの標的タンパク質を同時に検出する。くつかの実施形態において、本明細書中に記載される方法によって検出される抗体又は抗体断片は、アシネトバクター・バウマンニ（Ａｃｉｎｅｔｏｂａｃｔｅｒｂａｕｍａｎｎｉｉ）、アデノウイルス、アフリカ馬疫ウイルス、アフリカ豚コレラウイルス、ズビニ鉤虫（Ａｎｃｌｏｓｔｏｍａｄｕｏｄｅｎａｌｅ）、回虫、黄色アスペルギルス、アスペルギルス・フミガーツス（Ａｓｐｅｒｇｉｌｌｕｓｆｕｍｉｇａｔｕｓ）、アスペルギルス・ニガー（Ａｓｐｅｒｇｉｌｌｕｓｎｉｇｅｒ）、アスペルギルス・オリゼ（Ａｓｐｅｒｇｉｌｌｕｓｏｒｙｚａｅ）、鳥インフルエンザウイルス、炭疽菌、炭疽菌パスツール株、ＢａｃｉｌｌｕｓｃｅｒｅｕｓＢｉｏｖａｒａｎｔｈｒａｃｉｓ、ウシ流産菌、ブルセラ・メリテンシス（Ｂｒｕｃｅｌｌａｍｅｌｉｔｅｎｓｉｓ）、ブルセラ・スイス（Ｂｒｕｃｅｌｌａｓｕｉｓ）、鼻疽菌、類鼻疽菌、カンジダ・アルビカンス（Ｃａｎｄｉｄａａｌｂｉｃａｎｓ）、カンジダ・ドゥブリニエンシス（Ｃａｎｄｉｄａｄｕｂｌｉｎｉｅｎｓｉｓ）、カンジダ・グラブラタ（Ｃａｎｄｉｄａｇｌａｂｒａｔａ）、カンジダ・クルセイ（Ｃａｎｄｉｄａｋｒｕｓｅｉ）、カンジダ・トロピカリス（Ｃａｎｄｉｄａｔｒｏｐｉｃａｌｉｓ）、クラミジア・ニューモニエ（Ｃｈｌａｍｙｄｉａｐｎｅｕｍｏｎｅａｅ）、クラミジア・トラコマチス（Ｃｈｌａｍｙｄｉａｔｒａｃｈｏｍａｔｏｕｓ）、豚熱ウイルス、クロストリジウム・ディフィシール（Ｃｌｏｓｔｒｉｄｉｕｍｄｉｆｆｉｃｉｌｅ）、コクシジオイデス・イミティス（Ｃｏｃｃｉｄｉｏｉｄｅｓｉｍｍｉｔｉｓ）、コクシジオイデス・ポサダシ（Ｃｏｃｃｉｄｉｏｉｄｅｓｐｏｓａｄａｓｉｉ）、ＣｏＶ－２２９Ｅ、ＣｏＶ－ＨＫＵ１、ＣｏＶ－ＮＬ６３、ＣｏＶ－ＯＣ４３、コクサッキーウイルスＡ、コクサッキーウイルスＢ、コクシエラ・バーネッティ（Ｃｏｘｉｅｌｌａｂｕｒｎｅｔｉｉ）、クリミア・コンゴ出血熱、サイトメガロウイルス、デングウイルス、メジナ虫、東部馬脳炎、エボラウイルス、い粒条虫、多包条虫、エンテロバクター・クロアカ、エンテロコッカス・フェシウム（Ｅｎｔｅｒｏｃｏｃｃｕｓｆａｅｃｉｕｍ）、エンテロウイルス、エプスタイン・バール・ウイルス、大腸菌、巨大肝蛭、肝蛭、***ウイルス、野兎病菌、山羊痘ウイルス、ヘモフィルス属インフルエンザ、ヘリコバクターピロリ、ヘンドラウイルス、Ａ型肝炎ウイルス、Ｂ型肝炎ウイルス、Ｃ型肝炎ウイルス、ヒストプラスマ・カプスラーツム（Ｈｉｓｔｏｐｌａｓｍａｃａｐｓｕｌａｔｕｍ）、ズボアジ型ヒストプラスマ症（Ｈｉｓｔｏｐｌａｓｍａｄｕｂｏｉｓｉｉ）、ヒトヘルペスウイルスＨＨＶ６、ヒトヘルペスウイルスＨＨＶ７、ヒトヘルペスウイルスＨＨＶ８、ヒトヘルペスウイルスＨＳＶ１、ヒトヘルペスウイルスＨＳＶ２、ヒト免疫不全ウイルス、ヒトパピローマウイルス、インフルエンザウイルスＡ型、インフルエンザウイルスＢ型、クレブシェラ肺炎桿菌、キャサヌール森林病ウイルス、ラッサ熱ウイルス、レジオネラ・ニューモフィラ菌、リーシュマニア・プロマスティゴート（Ｌｅｉｓｈｍａｎｉａｐｒｏｍａｓｔｉｇｏｔｅｓ）、Ｌｕｊｏウイルス、ランピースキン病ウイルス、マールブルグウイルス、麻疹ウイルス、メチシリン耐性黄色ブドウ球菌、サル痘ウイルス、ムンプスウイルス、マイコバクテリウム・アブセッサス（Ｍｙｃｏｂａｃｔｅｒｉｕｍａｂｓｃｅｓｓｕｓ）、マイコバクテリウム・アビウム（Ｍｙｃｏｂａｃｔｅｒｉｕｍａｖｉｕｍ）、マイコバクテリウム・ボビス（Ｍｙｃｏｂａｃｔｅｒｉｕｍｂｏｖｉｓ）、マイコバクテリウム・カヌッティイ（Ｍｙｃｏｂａｃｔｅｒｉｕｍｃａｎｅｔｔｉｉ）、マイコバクテリウム・レプレ（Ｍｙｃｏｂａｃｔｅｒｉｕｍｌｅｐｒａｅ）、ヒト結核菌、マイコバクテリウム・ウルセランス（Ｍｙｃｏｂａｃｔｅｒｉｕｍｕｌｃｅｒａｎｓ）、マイコプラズマ・カプリコルム（Ｍｙｃｏｐｌａｓｍａｃａｐｒｉｃｏｌｕｍ）、マイコプラズマ・ミコイデス（Ｍｙｃｏｐｌａｓｍａｍｙｃｏｉｄｅｓ）、マイコプラズマ・ニューモニア（Ｍｙｃｏｐｌａｓｍａｐｎｅｕｍｏｎｅａｅ）、アメリカ十二指腸虫、淋病、ニューカッスル病ウイルス、ニパウイルス、ノルカジア属ｂｅｉｊｉｎｇｅｎｓｉｓ、ノルカジア属ｃｙｒｉａｃｉｇｅｏｒｇｉｃａ、ノルカジア属ｆａｒｃｉｎｉｃａ、ノロウイルスＧＩ、ノロウイルスＧＩＩ、ノーウォークウイルス、オムスク出血熱ウイルス、回旋糸状虫、発癌性ヒトパピローマウイルス、パラインフルエンザウイルス、寄生生物、マルネッフェイ型ペニシリウム症（Ｐｅｎｉｃｉｌｌｉｏｓｉｓｍａｍｅｆｆｅｉ）、小反芻獣疫ウイルス、ニューモシスチス・イロベチイ（Ｐｎｅｕｍｏｃｙｓｔｉｓｊｉｒｏｖｅｃｉｉ）、ポリオーマウイルス、プロテウス・ミラビリス（Ｐｒｏｔｅｕｓｍｉｒａｂｉｌｉｓ）、緑膿菌、狂犬病ウイルス、８つの遺伝子断片すべてのコーディング領域の任意の部分を含有する、１９１８年のパンデミックインフルエンザウイルスの再構築された複製コンピテント形態、呼吸器合胞体ウイルス、ライノウイルス、発疹チフスリケッチア、リフトバレー熱ウイルス、牛疫ウイルス、ロタウイルスＡ、ロタウイルスＢ、ロタウイルスＣ、ロタウイルスＧ２、風疹ウイルス、ＳＡＲＳ関連コロナウイルス（ＳＡＲＳ－ＣｏＶ）、ＳＡＲＳ－ＣｏＶ－１、ＳＡＲＳ－ＣｏＶ－２、ビルハルツ住血吸虫、日本住血吸虫、マンソン住血吸虫、羊痘ウイルス、南米出血熱ウイルスチャパレ、南米出血熱ウイルスグアナリト、南米出血熱ウイルスフニン、南米出血熱ウイルスマチュポ、南米出血熱ウイルスサビア、黄色ブドウ球菌、スタフィロコッカス・サプロフィティカス（Ｓｔａｐｈｙｌｏｃｏｃｃｕｓｓａｐｒｏｐｈｙｔｉｃｕｓ）、肺炎レンサ球菌、豚水疱病ウイルス、有鉤条虫、ダニ媒介性脳炎複合（ｆｌａｖｉ）ウイルス極東亜型、ダニ媒介性脳炎複合（ｆｌａｖｉ）ウイルスシベリア亜型、タバコモザイク病ウイルス、トルクテノウイルス、鞭虫、ブルーストリパノソーマ（Ｔｒｙｐａｎｏｓｏｍａｂｒｕｃｅｉ）、トリパノソーマ・クルージ（Ｔｒｙｐａｎｏｓｏｍａｃｒｕｚｉ）、大痘瘡ウイルス（天然痘ウイルス）、小痘瘡ウイルス（アラストリム）、ベネズエラ馬脳炎ウイルス、バンクロフト糸状虫、ペスト菌を含む病原体、又は前述の群の病原体と特徴的な核酸配列を共有する、別の潜在的に新規若しくは特性決定されていない病原体由来の１つ以上の抗原と特異的に結合する。

一実施形態では、抗体又は抗体断片は、ＳＡＲ－ＣｏＶ－２由来の抗原に特異的に結合する。いくつかの実施形態では、抗体又は抗体断片は、スパイクタンパク質（Ｓ）、受容体結合ドメイン（ＲＢＤ）、Ｓ１タンパク質、Ｓ２タンパク質、Ｅ遺伝子、Ｓ遺伝子、Ｏｒｆｌａｂ遺伝子、Ｎ末端スパイクタンパク質ドメイン、全タンパク質（Ｓ１＋Ｓ２）、及びヌクレオカプシド（Ｎ）タンパク質からなる群から選択される抗原に特異的に結合する。

本明細書に記載される方法の多くの実施形態では、試料は、血液、粘液、唾液、汗、涙、体腔に蓄積する流体、尿、***液、膣分泌物、脳脊髄液、リンパ液、糞便、痰、分解液、嘔吐物、汗、母乳、血清及び血漿からなる群から選択される。一実施形態において、試料は唾液である。一実施形態において、試料は血液である。

別の態様では、本開示は、核酸試料中の配列変異体を検出する方法を提供する。第１の工程は、増幅混合物を用いて核酸の試料と増幅反応を行い、複数のアンプリコンを産生することを含む。第２の工程は、配列変異を検出することであり、複数のアンプリコンを検出すること、及び場合により定量することを含む。本方法の第３の工程は、複数のアンプリコンのカテゴリーを決定する工程を含む。本方法の第４の工程は、配列変異の検出に関する。本明細書に記載される方法の多くの実施形態では、増幅混合物は、核酸試料、複数のプライマー、第１の固有のバーコード配列及びその逆相補体、並びにアダプター配列の第１の対を含む。いくつかの実施形態において、複数のプライマーの各々は、それらが結合するポリヌクレオチドの各々に相補的なヌクレオチドのセットを含む。いくつかの実施形態において、第１の固有のバーコード配列及びその逆相補体は、特定の対象から得られた試料を同定する。いくつかの実施形態において、アダプター配列の対は、第１の固有のバーコード配列及びその逆相補体に隣接する。いくつかの実施形態において、複数のアンプリコンは標的増幅領域又は対照領域からのポリヌクレオチドを含む。

本明細書中に記載される方法の多くの実施形態において、第２の工程は、アダプター配列の第１の対並びに第１の固有のバーコード配列及びその逆相補体を含む複数のアンプリコンの各々をシーケンシングすることを含む。いくつかの実施形態において、第２の工程は、アダプター配列の第１の対、第１の固有のバーコード配列及びその逆相補体、第２の固有のバーコード配列及びその逆相補体を含む複数のアンプリコンの各々をシーケンシングすることを含む。一実施形態において、アダプター配列の第１の対は、第１の固有のバーコード配列及びその逆相補体を第２の固有のバーコード配列及びその逆相補体から分離する。

本明細書中に記載される方法の多くの実施形態において、第２の工程における検出は、一連のプログラムを用いてシーケンシングデータファイルを読み取ることによって行われる。いくつかの実施形態において、シーケンシングデータファイルはＦＡＳＴＡ／ＦＡＳＴＱフォーマットである。いくつかの実施形態では、一連のプログラムは、ＨＭＭＥＲ／Ｉｎｆｅｒｎａｌアラインメントエンジンを含む。

本明細書中に記載される方法の多くの実施形態において、第４の工程における検出は、１つ以上の参照配列との配列アラインメント（例えば、多重配列アラインメント）を行うことを含む。いくつかの実施形態において、配列アラインメントは、ＨＭＭプロファイル隠れマルコフモデル（ＨＭＭ）エンジン、共分散モデル（ＣＭ）エンジン又はそれらの組み合わせによって行われる。

いくつかの実施形態において、方法は、配列変異体を感染の診断又は予後と相関させることを含む。いくつかの実施形態では、感染は、ＲＮＡウイルス、ＤＮＡウイルス、真菌、寄生生物及び細菌からなる群から選択される１つ又は複数の病原体によって引き起こされる。いくつかの実施形態において、病原体は、アシネトバクター・バウマンニ（Ａｃｉｎｅｔｏｂａｃｔｅｒｂａｕｍａｎｎｉｉ）、アデノウイルス、アフリカ馬疫ウイルス、アフリカ豚コレラウイルス、ズビニ鉤虫（Ａｎｃｌｏｓｔｏｍａｄｕｏｄｅｎａｌｅ）、回虫、黄色アスペルギルス、アスペルギルス・フミガーツス（Ａｓｐｅｒｇｉｌｌｕｓｆｕｍｉｇａｔｕｓ）、アスペルギルス・ニガー（Ａｓｐｅｒｇｉｌｌｕｓｎｉｇｅｒ）、アスペルギルス・オリゼ（Ａｓｐｅｒｇｉｌｌｕｓｏｒｙｚａｅ）、鳥インフルエンザウイルス、炭疽菌、炭疽菌パスツール株、ＢａｃｉｌｌｕｓｃｅｒｅｕｓＢｉｏｖａｒａｎｔｈｒａｃｉｓ、ウシ流産菌、ブルセラ・メリテンシス（Ｂｒｕｃｅｌｌａｍｅｌｉｔｅｎｓｉｓ）、ブルセラ・スイス（Ｂｒｕｃｅｌｌａｓｕｉｓ）、鼻疽菌、類鼻疽菌、カンジダ・アルビカンス（Ｃａｎｄｉｄａａｌｂｉｃａｎｓ）、カンジダ・ドゥブリニエンシス（Ｃａｎｄｉｄａｄｕｂｌｉｎｉｅｎｓｉｓ）、カンジダ・グラブラタ（Ｃａｎｄｉｄａｇｌａｂｒａｔａ）、カンジダ・クルセイ（Ｃａｎｄｉｄａｋｒｕｓｅｉ）、カンジダ・トロピカリス（Ｃａｎｄｉｄａｔｒｏｐｉｃａｌｉｓ）、クラミジア・ニューモニエ（Ｃｈｌａｍｙｄｉａｐｎｅｕｍｏｎｅａｅ）、クラミジア・トラコマチス（Ｃｈｌａｍｙｄｉａｔｒａｃｈｏｍａｔｏｕｓ）、豚熱ウイルス、クロストリジウム・ディフィシール（Ｃｌｏｓｔｒｉｄｉｕｍｄｉｆｆｉｃｉｌｅ）、コクシジオイデス・イミティス（Ｃｏｃｃｉｄｉｏｉｄｅｓｉｍｍｉｔｉｓ）、コクシジオイデス・ポサダシ（Ｃｏｃｃｉｄｉｏｉｄｅｓｐｏｓａｄａｓｉｉ）、ＣｏＶ－２２９Ｅ、ＣｏＶ－ＨＫＵ１、ＣｏＶ－ＮＬ６３、ＣｏＶ－ＯＣ４３、コクサッキーウイルスＡ、コクサッキーウイルスＢ、コクシエラ・バーネッティ（Ｃｏｘｉｅｌｌａｂｕｒｎｅｔｉｉ）、クリミア・コンゴ出血熱、サイトメガロウイルス、デングウイルス、メジナ虫、東部馬脳炎、エボラウイルス、い粒条虫、多包条虫、エンテロバクター・クロアカ、エンテロコッカス・フェシウム（Ｅｎｔｅｒｏｃｏｃｃｕｓｆａｅｃｉｕｍ）、エンテロウイルス、エプスタイン・バール・ウイルス、大腸菌、巨大肝蛭、肝蛭、***ウイルス、野兎病菌、山羊痘ウイルス、ヘモフィルス属インフルエンザ、ヘリコバクターピロリ、ヘンドラウイルス、Ａ型肝炎ウイルス、Ｂ型肝炎ウイルス、Ｃ型肝炎ウイルス、ヒストプラスマ・カプスラーツム（Ｈｉｓｔｏｐｌａｓｍａｃａｐｓｕｌａｔｕｍ）、ズボアジ型ヒストプラスマ症（Ｈｉｓｔｏｐｌａｓｍａｄｕｂｏｉｓｉｉ）、ヒトヘルペスウイルスＨＨＶ６、ヒトヘルペスウイルスＨＨＶ７、ヒトヘルペスウイルスＨＨＶ８、ヒトヘルペスウイルスＨＳＶ１、ヒトヘルペスウイルスＨＳＶ２、ヒト免疫不全ウイルス、ヒトパピローマウイルス、インフルエンザウイルスＡ型、インフルエンザウイルスＢ型、クレブシェラ肺炎桿菌、キャサヌール森林病ウイルス、ラッサ熱ウイルス、レジオネラ・ニューモフィラ菌、リーシュマニア・プロマスティゴート（Ｌｅｉｓｈｍａｎｉａｐｒｏｍａｓｔｉｇｏｔｅｓ）、Ｌｕｊｏウイルス、ランピースキン病ウイルス、マールブルグウイルス、麻疹ウイルス、メチシリン耐性黄色ブドウ球菌、サル痘ウイルス、ムンプスウイルス、マイコバクテリウム・アブセッサス（Ｍｙｃｏｂａｃｔｅｒｉｕｍａｂｓｃｅｓｓｕｓ）、マイコバクテリウム・アビウム（Ｍｙｃｏｂａｃｔｅｒｉｕｍａｖｉｕｍ）、マイコバクテリウム・ボビス（Ｍｙｃｏｂａｃｔｅｒｉｕｍｂｏｖｉｓ）、マイコバクテリウム・カヌッティイ（Ｍｙｃｏｂａｃｔｅｒｉｕｍｃａｎｅｔｔｉｉ）、マイコバクテリウム・レプレ（Ｍｙｃｏｂａｃｔｅｒｉｕｍｌｅｐｒａｅ）、ヒト結核菌、マイコバクテリウム・ウルセランス（Ｍｙｃｏｂａｃｔｅｒｉｕｍｕｌｃｅｒａｎｓ）、マイコプラズマ・カプリコルム（Ｍｙｃｏｐｌａｓｍａｃａｐｒｉｃｏｌｕｍ）、マイコプラズマ・ミコイデス（Ｍｙｃｏｐｌａｓｍａｍｙｃｏｉｄｅｓ）、マイコプラズマ・ニューモニア（Ｍｙｃｏｐｌａｓｍａｐｎｅｕｍｏｎｅａｅ）、アメリカ十二指腸虫、淋病、ニューカッスル病ウイルス、ニパウイルス、ノルカジア属ｂｅｉｊｉｎｇｅｎｓｉｓ、ノルカジア属ｃｙｒｉａｃｉｇｅｏｒｇｉｃａ、ノルカジア属ｆａｒｃｉｎｉｃａ、ノロウイルスＧＩ、ノロウイルスＧＩＩ、ノーウォークウイルス、オムスク出血熱ウイルス、回旋糸状虫、発癌性ヒトパピローマウイルス、パラインフルエンザウイルス、寄生生物、マルネッフェイ型ペニシリウム症（Ｐｅｎｉｃｉｌｌｉｏｓｉｓｍａｍｅｆｆｅｉ）、小反芻獣疫ウイルス、ニューモシスチス・イロベチイ（Ｐｎｅｕｍｏｃｙｓｔｉｓｊｉｒｏｖｅｃｉｉ）、ポリオーマウイルス、プロテウス・ミラビリス（Ｐｒｏｔｅｕｓｍｉｒａｂｉｌｉｓ）、緑膿菌、狂犬病ウイルス、８つの遺伝子断片すべてのコーディング領域の任意の部分を含有する、１９１８年のパンデミックインフルエンザウイルスの再構築された複製コンピテント形態、呼吸器合胞体ウイルス、ライノウイルス、発疹チフスリケッチア、リフトバレー熱ウイルス、牛疫ウイルス、ロタウイルスＡ、ロタウイルスＢ、ロタウイルスＣ、ロタウイルスＧ２、風疹ウイルス、ＳＡＲＳ関連コロナウイルス（ＳＡＲＳ－ＣｏＶ）、ＳＡＲＳ－ＣｏＶ－１、ＳＡＲＳ－ＣｏＶ－２、ビルハルツ住血吸虫、日本住血吸虫、マンソン住血吸虫、羊痘ウイルス、南米出血熱ウイルスチャパレ、南米出血熱ウイルスグアナリト、南米出血熱ウイルスフニン、南米出血熱ウイルスマチュポ、南米出血熱ウイルスサビア、黄色ブドウ球菌、スタフィロコッカス・サプロフィティカス（Ｓｔａｐｈｙｌｏｃｏｃｃｕｓｓａｐｒｏｐｈｙｔｉｃｕｓ）、肺炎レンサ球菌、豚水疱病ウイルス、有鉤条虫、ダニ媒介性脳炎複合（ｆｌａｖｉ）ウイルス極東亜型、ダニ媒介性脳炎複合（ｆｌａｖｉ）ウイルスシベリア亜型、タバコモザイク病ウイルス、トルクテノウイルス、鞭虫、ブルーストリパノソーマ（Ｔｒｙｐａｎｏｓｏｍａｂｒｕｃｅｉ）、トリパノソーマ・クルージ（Ｔｒｙｐａｎｏｓｏｍａｃｒｕｚｉ）、大痘瘡ウイルス（天然痘ウイルス）、小痘瘡ウイルス（アラストリム）、ベネズエラ馬脳炎ウイルス、バンクロフト糸状虫、ペスト菌、又は前述の群の病原体と特徴的な核酸配列を共有する、別の潜在的に新規若しくは特性決定されていない病原体からなる群から選択される。

一実施形態では、病原体はＳＡＲＳ－ＣｏＶ－２である。いくつかの実施形態では、配列変異体は、スパイクタンパク質（Ｓ）、受容体結合ドメイン（ＲＢＤ）、Ｓ１タンパク質、Ｓ２タンパク質、Ｅ遺伝子、Ｓ遺伝子、Ｏｒｆｌａｂ遺伝子、Ｎ末端スパイクタンパク質ドメイン、全タンパク質（Ｓ１＋Ｓ２）、及びヌクレオカプシド（Ｎ）タンパク質からなる群から選択される抗原をエンコードする領域にある。いくつかの実施形態では、配列変異体は、Ｔ９５Ｉ、Ｄ２５３Ｇ、Ｌ４５２Ｒ、Ｅ４８４Ｋ、Ｓ４７７Ｎ、Ｎ５０１ＹＤ６１４Ｇ及びＡ７０１Ｖからなる群より選択される変異を含む。

本明細書中に記載される方法の多くの実施形態において、複数のアンプリコンの検出は、複数のアンプリコンのプールされた配列データセットを得ること、ベースコールを行うこと、複数のアンプリコンの配列データを予め定義されたアノテーション付きＨＭＭ又はＣＭ遺伝子モデルにアラインメントすること、ＨＭＭ／ＣＭアラインメントの各々に階級（例えば、確率スコア又はビットスコア）を割り当てること、配列データをフィルタリングして位置アノテーション付き配列アラインメントを得ること、各アンプリコン内のバーコード並びにアンプリコンの配列内のバーコード及びアダプターの位置を決定することを含む。本明細書に記載の方法のすべての実施形態において、前述の工程は、適切にプログラムされたコンピュータを使用して実行される。本明細書に記載の方法のいくつかの実施形態では、高精度ＯＮＴＧＰＵに基づくベースコーラーでベースコールが実行され、生のＦＡＳＴＡ／ＦＡＳＴＱファイルが生成される。これらの実施形態では、生ファイルは、プロファイルＨＭＭエンジン及び／又はＣＭエンジンによってアラインメントされる。いくつかの実施形態では、ＨＭＭエンジンは、複数の配列アラインメントをもたらすＨＭＭＥＲソフトウェアプログラムを含む。いくつかの実施形態では、ＨＭＭＥＲプログラム及び／又はＣＭエンジンは、バーコード、標的増幅領域、プライマー、及びアダプターからなる群から選択される１つ又は複数の配列特徴についてヌクレオチドごとのアノテーションを割り当てる。一実施形態において、複数の配列アラインメントは、第１の固有のバーコード配列及びその逆相補体のためのアノテーションを含む。

本明細書中に記載される方法の多くの実施形態において、フィルタリングは、合格スコア又は不合格スコアを配列アラインメントに割り当てることを含む。これらの実施形態では、配列アラインメントは、参照バーコード化配列のセットに対して最小レーベンシュタイン距離スコアに合格する場合、及びアラインメントの最小ビットスコア閾値を合格する場合、合格スコアが割り当てられる。いくつかの実施形態において、合格スコアを有する配列アラインメントは、中央データベースに記憶される。いくつかの実施形態では、合格スコアを有する配列アラインメントは、試料中の病原体負荷の直接的な定量的表示に対応する。

方法の多くの実施形態において、データベースは、試料コレクションチューブに割り当てられた固有のバーコードの情報、少なくとも９６個の固有のウェルバーコードのセットの情報、少なくとも９６個の固有のプレートバーコードのセットの情報、複数のアンプリコンからの配列データのセットの情報及びレポートを含む。一実施形態では、レポートは、各対象のソース識別情報及び対象が標的タンパク質の存在について陽性であるか陰性であるかに関する情報を含む。一実施形態では、レポートは、対応する対象、又は診療所若しくは医師に提供される。

さらに別の態様では、本開示はアンプリコンを含む組成物を提供する。本明細書に記載される多くの実施形態では、アンプリコンは、第１の固有のバーコード配列及びその逆相補体、標的特異的プライマーの対、標的増幅領域及びアダプター配列の第１の対を含む。いくつかの実施形態において、標的特異的プライマーの対はフォワードプライマーとリバースプライマーとから構成され、それぞれが標的増幅領域（例えば、ウイルスゲノムの領域）内のプライミング部位に相補的な配列を有する。多くの実施形態において、フォワードプライマー及びリバースプライマーの各々は、標的増幅領域に隣接し、次に第１の固有のヌクレオチドバーコード配列及びその逆相補体に隣接し、第１の固有のバーコード配列及びその逆相補体は、アダプター配列の第１の対に隣接する。いくつかの実施形態において、アンプリコンは、第２の固有のバーコード配列及びその逆相補体並びにアダプター配列の第２の対をさらに含み、ここで第２の固有のバーコード配列及びその逆相補体並びにアダプター配列の第２の対は、アンプリコンにライゲーションされている。一実施形態では、アダプター配列の第１の対はアダプター配列の第２の対に隣接し、アダプター配列の第２の対は第２の固有のバーコード配列及びその逆相補体に隣接する。

いくつかの実施形態において、標的増幅領域は、遺伝子又はタンパク質をエンコードする病原体のゲノム領域から増幅され、病原体は、アシネトバクター・バウマンニ（Ａｃｉｎｅｔｏｂａｃｔｅｒｂａｕｍａｎｎｉｉ）、アデノウイルス、アフリカ馬疫ウイルス、アフリカ豚コレラウイルス、ズビニ鉤虫（Ａｎｃｌｏｓｔｏｍａｄｕｏｄｅｎａｌｅ）、回虫、黄色アスペルギルス、アスペルギルス・フミガーツス（Ａｓｐｅｒｇｉｌｌｕｓｆｕｍｉｇａｔｕｓ）、アスペルギルス・ニガー（Ａｓｐｅｒｇｉｌｌｕｓｎｉｇｅｒ）、アスペルギルス・オリゼ（Ａｓｐｅｒｇｉｌｌｕｓｏｒｙｚａｅ）、鳥インフルエンザウイルス、炭疽菌、炭疽菌パスツール株、ＢａｃｉｌｌｕｓｃｅｒｅｕｓＢｉｏｖａｒａｎｔｈｒａｃｉｓ、ウシ流産菌、ブルセラ・メリテンシス（Ｂｒｕｃｅｌｌａｍｅｌｉｔｅｎｓｉｓ）、ブルセラ・スイス（Ｂｒｕｃｅｌｌａｓｕｉｓ）、鼻疽菌、類鼻疽菌、カンジダ・アルビカンス（Ｃａｎｄｉｄａａｌｂｉｃａｎｓ）、カンジダ・ドゥブリニエンシス（Ｃａｎｄｉｄａｄｕｂｌｉｎｉｅｎｓｉｓ）、カンジダ・グラブラタ（Ｃａｎｄｉｄａｇｌａｂｒａｔａ）、カンジダ・クルセイ（Ｃａｎｄｉｄａｋｒｕｓｅｉ）、カンジダ・トロピカリス（Ｃａｎｄｉｄａｔｒｏｐｉｃａｌｉｓ）、クラミジア・ニューモニエ（Ｃｈｌａｍｙｄｉａｐｎｅｕｍｏｎｅａｅ）、クラミジア・トラコマチス（Ｃｈｌａｍｙｄｉａｔｒａｃｈｏｍａｔｏｕｓ）、豚熱ウイルス、クロストリジウム・ディフィシール（Ｃｌｏｓｔｒｉｄｉｕｍｄｉｆｆｉｃｉｌｅ）、コクシジオイデス・イミティス（Ｃｏｃｃｉｄｉｏｉｄｅｓｉｍｍｉｔｉｓ）、コクシジオイデス・ポサダシ（Ｃｏｃｃｉｄｉｏｉｄｅｓｐｏｓａｄａｓｉｉ）、ＣｏＶ－２２９Ｅ、ＣｏＶ－ＨＫＵ１、ＣｏＶ－ＮＬ６３、ＣｏＶ－ＯＣ４３、コクサッキーウイルスＡ、コクサッキーウイルスＢ、コクシエラ・バーネッティ（Ｃｏｘｉｅｌｌａｂｕｒｎｅｔｉｉ）、クリミア・コンゴ出血熱、サイトメガロウイルス、デングウイルス、メジナ虫、東部馬脳炎、エボラウイルス、い粒条虫、多包条虫、エンテロバクター・クロアカ、エンテロコッカス・フェシウム（Ｅｎｔｅｒｏｃｏｃｃｕｓｆａｅｃｉｕｍ）、エンテロウイルス、エプスタイン・バール・ウイルス、大腸菌、巨大肝蛭、肝蛭、***ウイルス、野兎病菌、山羊痘ウイルス、ヘモフィルス属インフルエンザ、ヘリコバクターピロリ、ヘンドラウイルス、Ａ型肝炎ウイルス、Ｂ型肝炎ウイルス、Ｃ型肝炎ウイルス、ヒストプラスマ・カプスラーツム（Ｈｉｓｔｏｐｌａｓｍａｃａｐｓｕｌａｔｕｍ）、ズボアジ型ヒストプラスマ症（Ｈｉｓｔｏｐｌａｓｍａｄｕｂｏｉｓｉｉ）、ヒトヘルペスウイルスＨＨＶ６、ヒトヘルペスウイルスＨＨＶ７、ヒトヘルペスウイルスＨＨＶ８、ヒトヘルペスウイルスＨＳＶ１、ヒトヘルペスウイルスＨＳＶ２、ヒト免疫不全ウイルス、ヒトパピローマウイルス、インフルエンザウイルスＡ型、インフルエンザウイルスＢ型、クレブシェラ肺炎桿菌、キャサヌール森林病ウイルス、ラッサ熱ウイルス、レジオネラ・ニューモフィラ菌、リーシュマニア・プロマスティゴート（Ｌｅｉｓｈｍａｎｉａｐｒｏｍａｓｔｉｇｏｔｅｓ）、Ｌｕｊｏウイルス、ランピースキン病ウイルス、マールブルグウイルス、麻疹ウイルス、メチシリン耐性黄色ブドウ球菌、サル痘ウイルス、ムンプスウイルス、マイコバクテリウム・アブセッサス（Ｍｙｃｏｂａｃｔｅｒｉｕｍａｂｓｃｅｓｓｕｓ）、マイコバクテリウム・アビウム（Ｍｙｃｏｂａｃｔｅｒｉｕｍａｖｉｕｍ）、マイコバクテリウム・ボビス（Ｍｙｃｏｂａｃｔｅｒｉｕｍｂｏｖｉｓ）、マイコバクテリウム・カヌッティイ（Ｍｙｃｏｂａｃｔｅｒｉｕｍｃａｎｅｔｔｉｉ）、マイコバクテリウム・レプレ（Ｍｙｃｏｂａｃｔｅｒｉｕｍｌｅｐｒａｅ）、ヒト結核菌、マイコバクテリウム・ウルセランス（Ｍｙｃｏｂａｃｔｅｒｉｕｍｕｌｃｅｒａｎｓ）、マイコプラズマ・カプリコルム（Ｍｙｃｏｐｌａｓｍａｃａｐｒｉｃｏｌｕｍ）、マイコプラズマ・ミコイデス（Ｍｙｃｏｐｌａｓｍａｍｙｃｏｉｄｅｓ）、マイコプラズマ・ニューモニア（Ｍｙｃｏｐｌａｓｍａｐｎｅｕｍｏｎｅａｅ）、アメリカ十二指腸虫、淋病、ニューカッスル病ウイルス、ニパウイルス、ノルカジア属ｂｅｉｊｉｎｇｅｎｓｉｓ、ノルカジア属ｃｙｒｉａｃｉｇｅｏｒｇｉｃａ、ノルカジア属ｆａｒｃｉｎｉｃａ、ノロウイルスＧＩ、ノロウイルスＧＩＩ、ノーウォークウイルス、オムスク出血熱ウイルス、回旋糸状虫、発癌性ヒトパピローマウイルス、パラインフルエンザウイルス、寄生生物、マルネッフェイ型ペニシリウム症（Ｐｅｎｉｃｉｌｌｉｏｓｉｓｍａｍｅｆｆｅｉ）、小反芻獣疫ウイルス、ニューモシスチス・イロベチイ（Ｐｎｅｕｍｏｃｙｓｔｉｓｊｉｒｏｖｅｃｉｉ）、ポリオーマウイルス、プロテウス・ミラビリス（Ｐｒｏｔｅｕｓｍｉｒａｂｉｌｉｓ）、緑膿菌、狂犬病ウイルス、８つの遺伝子断片すべてのコーディング領域の任意の部分を含有する、１９１８年のパンデミックインフルエンザウイルスの再構築された複製コンピテント形態、呼吸器合胞体ウイルス、ライノウイルス、発疹チフスリケッチア、リフトバレー熱ウイルス、牛疫ウイルス、ロタウイルスＡ、ロタウイルスＢ、ロタウイルスＣ、ロタウイルスＧ２、風疹ウイルス、ＳＡＲＳ関連コロナウイルス（ＳＡＲＳ－ＣｏＶ）、ＳＡＲＳ－ＣｏＶ－１、ＳＡＲＳ－ＣｏＶ－２、ビルハルツ住血吸虫、日本住血吸虫、
マンソン住血吸虫、羊痘ウイルス、南米出血熱ウイルスチャパレ、南米出血熱ウイルスグアナリト、南米出血熱ウイルスフニン、南米出血熱ウイルスマチュポ、南米出血熱ウイルスサビア、黄色ブドウ球菌、スタフィロコッカス・サプロフィティカス（Ｓｔａｐｈｙｌｏｃｏｃｃｕｓｓａｐｒｏｐｈｙｔｉｃｕｓ）、肺炎レンサ球菌、豚水疱病ウイルス、有鉤条虫、ダニ媒介性脳炎複合（ｆｌａｖｉ）ウイルス極東亜型、ダニ媒介性脳炎複合（ｆｌａｖｉ）ウイルスシベリア亜型、タバコモザイク病ウイルス、トルクテノウイルス、鞭虫、ブルーストリパノソーマ（Ｔｒｙｐａｎｏｓｏｍａｂｒｕｃｅｉ）、トリパノソーマ・クルージ（Ｔｒｙｐａｎｏｓｏｍａｃｒｕｚｉ）、大痘瘡ウイルス（天然痘ウイルス）、小痘瘡ウイルス（アラストリム）、ベネズエラ馬脳炎ウイルス、バンクロフト糸状虫、ペスト菌、又は前述の群の病原体と特徴的な核酸配列を共有する、別の潜在的に新規若しくは特性決定されていない病原体からなる群から選択される。

一実施形態では、病原体はＳＡＲＳ－ＣｏＶ－２である。いくつかの実施形態では、配列変異体は、スパイクタンパク質（Ｓ）、受容体結合ドメイン（ＲＢＤ）、Ｓ１タンパク質、Ｓ２タンパク質、Ｅ遺伝子、Ｓ遺伝子、Ｏｒｆｌａｂ遺伝子、Ｎ末端スパイクタンパク質ドメイン、全タンパク質（Ｓ１＋Ｓ２）、及びヌクレオカプシド（Ｎ）タンパク質からなる群から選択される抗原をエンコードする領域にある。一実施形態では、標的増幅領域は、Ｓタンパク質をエンコードする領域から増幅される。一実施形態では、標的増幅領域は、Ｓタンパク質のＲＢＤをエンコードする領域から増幅される。一実施形態では、標的増幅領域は、Ｎタンパク質をエンコードする領域から増幅される。

いくつかの実施形態において、固有のバーコード配列及びそれらの逆相補体は、他のすべてのバーコードからの最大レーベンシュタイン距離を有する。いくつかの実施形態では、固有のバーコード配列は、配列番号２３－１１８に示されるポリヌクレオチド配列のいずれか１つを含む。いくつかの実施形態において、標的特異的プライマーの対は、フォワードプライマー：ＧＡＣＣＣＣＡＡＡＡＴＣＡＧＣＧＡＡＡＴ（配列番号３）及びリバースプライマー：ＴＣＴＧＧＴＴＡＣＴＧＣＣＡＧＴＴＧＡＡＴＣＴＧ（配列番号４）フォワードプライマー：ＴＴＡＣＡＡＡＣＡＴＴＧＧＣＣＧＣＡＡＡ（配列番号５）及びリバースプライマー：ＧＣＧＣＧＡＣＡＴＴＣＣＧＡＡＧＡＡ（配列番号６）；フォワードプライマー：ＧＧＧＡＧＣＣＴＴＧＡＡＴＡＣＡＣＣＡＡＡＡ（配列番号７）及びリバースプライマー：ＴＧＴＡＧＣＡＣＧＡＴＴＧＣＡＧＣＡＴＴＧ（配列番号８）；フォワードプライマー：ＧＴＧＡＲＡＴＧＧＴＣＡＴＧＴＧＴＧＧＣＧＧ（配列番号９）及びリバースプライマー：ＣＡＲＡＴＧＴＴＡＡＡＳＡＣＡＣＴＡＴＴＡＧＣＡＴＡ（配列番号１０）；フォワードプライマー：ＡＣＡＧＧＴＡＣＧＴＴＡＡＴＡＧＴＴＡＡＴＡＧＣＧＴ（配列番号１１）及びリバースプライマー：ＡＴＡＴＴＧＣＡＧＣＡＧＴＡＣＧＣＡＣＡＣＡ（配列番号１２）；フォワードプライマー：ＣＣＣＴＧＴＧＧＧＴＴＴＴＡＣＡＣＴＴＡＡ（配列番号１３）及びリバースプライマー：ＡＣＧＡＴＴＧＴＧＣＡＴＣＡＧＣＴＧＡ（配列番号１４）；フォワードプライマー：ＧＴＡＣＴＣＡＴＴＣＧＴＴＴＣＧＧＡＡＧＡＧ（配列番号１５）及びリバースプライマー：ＣＣＡＧＡＡＧＡＴＣＡＧＧＡＡＣＴＣＴＡＧＡ（配列番号１６）；フォワードプライマー：ＧＧＧＧＡＡＣＴＴＣＴＣＣＴＧＣＴＡＧＡＡＴ（配列番号１７）及びリバースプライマー：ＣＡＧＡＣＡＴＴＴＴＧＣＴＣＴＣＡＡＧＣＴＧ（配列番号１８）；フォワードプライマー：ＡＧＡＴＴＴＧＧＡＣＣＴＧＣＧＡＧＣＧ（配列番号１９）及びリバースプライマー：ＧＡＧＣＧＧＣＴＧＴＣＴＣＣＡＣＡＡＧＴ（配列番号２０）からなるフォワードプライマー及びリバースプライマーの群から選択される。

いくつかの実施形態において、アダプター配列の第１の対及びアダプター配列の第２の対は同一であり、１０～１５ヌクレオチドを含む。一実施形態では、アダプター配列の対は１０ヌクレオチドを含む。一実施形態では、アダプター配列の対は、ＡＣＡＣＴＧＡＣＧＡＣＡＴＧＧＴＴＣＴＡＣＡ（配列番号２１）及びＴＡＣＧＧＴＡＧＣＡＧＡＧＡＣＴＴＧＧＴＣＴ（配列番号２２）に示すポリヌクレオチド配列を含む。

病原体由来の少なくとも１つの標的核酸の存在を検出及び／又は同定するための逆転写酵素アッセイの概要である。

１つ又は複数の生物学的試料から少なくとも１つの少なくとも１つの標的タンパク質の存在を検出及び／又は同定するための血清学的アッセイの概要である。

バイオインフォマティクスパイプラインの概略図である。図３は、配列番号１３３を開示する。

各患者の試料に固有のバーコード化配列にライゲーションされた核酸塩基長約２０のプライマーを使用して、ＳＡＲＳ－Ｃｏｖ２ゲノム中の標的Ｎ１タンパク質の増幅によって生成された例示的なアンプリコンを示す。図４は、出現順に配列番号１３４～１５１をそれぞれ開示している。

固有のバーコード配列、アダプター配列及び標的増幅領域についてのアノテーションを含む例示的なアラインメントファイルである。図５Ａは、ＳＡＲＳ－Ｃｏｖ２ゲノムからの例示的な標的Ｅ－Ｇｕｅｌｐｈタンパク質の配列標識及びスコアリングデータを示す（それぞれ配列番号１５２～１５５、出現順）。固有のバーコード配列、アダプター配列及び標的増幅領域についてのアノテーションを含む例示的なアラインメントファイルである。図５Ｂは、ＳＡＲＳ－Ｃｏｖ２ゲノムからの例示的な標的ＲＮＡｓｅＰの配列標識及びスコアリングデータを示す（それぞれ配列番号１５６～１５９、出現順）。

ＳＡＲＳ－ＣｏＶ－２遺伝子標的からの多重化ＰＣＲ及びシーケンシングの結果を示し、優れた増幅及び高いアラインメントスコアを実証している。

複数のシーケンシング実施にわたって得られた再現性の高い多重化ＰＣＲ及びシーケンシング結果を示す。

本明細書に記載の組成物及び方法は、複数の試料からの病原体の同時迅速検出に有用である。本開示は、単一の反応において、固有の検出可能なヌクレオチドバーコード配列を含有する数百以上の標的特異的プライマーを使用して、１つ又は複数の試料中の特異的分析物（例えば、ウイルス粒子、病原体由来の病原性決定因子に対する抗体）の存在を検出する、マルチプレックスアッセイを提供する。本開示はまた、核酸試料中の配列変異体を検出する方法を提供する。本明細書に記載の組成物、アレイ、システム及び方法は、ＰＣＲ又は近接ライゲーションアッセイの単純さを組み合わせて、複数のアンプリコンの並行シーケンシングを用いて独自にバーコード化されたアンプリコンを生成し、生物学的試料から１つ又は複数の分析物（例えば、ポリヌクレオチド及び／又はタンパク質）の存在又は非存在を識別することに加えて、ソース識別情報を提供することができる。

Ｉ．定義
「アンプリコン」という用語は、ＰＣＲ反応の核酸産物を指す。本明細書で提供されるアンプリコンは、目的の配列（例えば、ウイルス配列）に隣接するバーコード配列を含む。アンプリコンは、二本鎖又は一本鎖であり得、二本鎖増幅産物を変性することによって得られた分離構成要素鎖を含み得る。ある特定の実施形態において、１つの増幅サイクルのアンプリコンは、後続の増幅サイクルにおける鋳型として機能し得る。

「分析物」という用語は、本明細書に記載の方法によって検出又はアッセイされる物質を指す。典型的な分析物には、これらに限定されないが、ペプチド、タンパク質（例えば、抗体、抗体の断片、ｓｃＦｖ）、核酸、有機及び無機分子を含む小分子、ウイルス及び他の微生物、細胞他、並びにそれらの断片及び産物が、いずれの分析物も特異的結合対相互作用に関与できる任意の物質又は実体であるように含まれ得、例えば、そのためのエピトープ（すなわち、付着部位）、結合メンバー又は受容体（抗体など）を開発することができる。

本明細書で使用される場合、「結合ドメイン」という用語は、抗体、抗体誘導体、ペプチド、タンパク質又は核酸アプタマーの群から選択される部分を指す。「抗体」という用語は、認識された免疫グロブリン遺伝子の全部又は一部によって実質的にエンコードされる１つ以上のポリペプチドからなるタンパク質を指す。認識されている免疫グロブリン遺伝子には、例えばヒトでは、カッパ（κ）、ラムダ（ｌ）及び重鎖遺伝子座が含まれ、これらは共に無数の可変領域遺伝子を含み、定常領域遺伝子はミュー（μ）、デルタ（δ）、ガンマ（γ）、シグマ（ε）及びアルファ（α）であり、それぞれＩｇＭ、ＩｇＤ、ＩｇＧ、ＩｇＥ及びＩｇＡアイソタイプをエンコードする。本明細書における抗体は、完全長抗体及び抗体断片を含むことを意味し、任意の生物由来の天然抗体、設計された抗体、又は実験、治療、若しくは以下でさらに定義される他の目的のために組換え生成された抗体を指し得る。抗体断片は当技術分野で公知であり、これらに限定されないが、抗体のＦａｂ、Ｆａｂ’、Ｆ（ａｂ’）２、Ｆｖ、ｓｃＦｖ、又は他の抗原結合部分列を含み、全抗体又は組換えＤＮＡ技術を使用してデノボで合成されるもののいずれかの修飾によって産生される。抗体はモノクローナル又はポリクローナルであり得、細胞に対して他の特異的活性を有し得る（例えば、アンタゴニスト、アゴニスト、中和抗体、阻害抗体又は刺激抗体）。

「増幅」という用語は、核酸配列のコピー数が線形又は対数様式のいずれかで増加するように、「複製」が環状プロセスで繰り返されるプロセスを指す。そのような複製プロセスには、例えば、ローリングサークル増幅（ＲＣＡ）、ポリメラーゼ連鎖反応（ＰＣＲ）が含まれ得るが、これらに限定されない。ＤＮＡポリメラーゼによって駆動されるＲＣＡは、Ｌｉｚａｒｄｉｅｔａｌ．，ＮａｔｕｒｅＧｅｎｅｔ．１９：２２５－２３２（１９９８）；米国特許第５，８５４，０３３号及び６，１４３，４９５号；ＰＣＴ出願番号ＷＯ９７／１９１９３）に記載されたように、等温条件下で線形又は幾何学キネティクスのいずれかを有する環状オリゴヌクレオチドプローブを増幅することができ、すべての参考文献は、その全体が組み込まれる。いくつかの実施形態では、ＲＣＡは、標的配列にハイブリダイズしたプローブ分子の環状化、及びそれに続く、米国特許第５，８５４，０３３号及び６，１４３，４９５号；ＰＣＴ出願番号ＷＯ９７／１９１９３号に記載の環状プローブのローリングサークル増幅を含む。米国特許第５，８５４，０３３号及び６，１４３，４９５号；ＰＣＴ出願番号ＷＯ９７／１９１９３、並びにＤｅａｎｅｔａｌ．，ＧｅｎｏｍｅＲｅｓｅａｒｃｈ１１：１０９５－１０９９（２００１）に記載の通り、増幅産物の非常に高い収率をローリングサークル増幅を用いて得ることができる。本明細書で提供される参考文献は、その全体が組み込まれる。「アンプリコン」とは、目的のポリヌクレオチドの増幅中に生成されるポリヌクレオチドを意味する。一例では、ポリメラーゼ連鎖反応中にアンプリコンが生成される。

本明細書で使用される場合、「生物学的試料」は、対象（又は動物）から単離された組織又は体液の試料を指し、本開示の文脈では、一般に、病原体（例えば、ウイルスＲＮＡ）、ウイルス粒子（例えば、ＳＡＲＳ－ＣｏＶ－２ウイルスのウイルス粒子）及び／又は１つ以上の病原性抗原と特異的に結合する抗体若しくはその断片からの核酸を含有すると疑われる試料を指す。試料は、任意の処理の後、インビトロアッセイで分析することができる。対象となる典型的な試料には、呼吸分泌物（例えば、鼻腔、肺などの体液又は組織から得られた試料）、血液、血漿、血清、血球、糞便、尿、涙、唾液、乳、器官、生検、並びに腸管及び気道の分泌物が含まれるが、必ずしもこれらに限定されない。試料はまた、インビトロ細胞培養成分、例えば、これらに限定されないが、培養培地中の細胞及び組織の成長から生じる馴化培地、例えば組換え細胞、並びに細胞成分の試料を含む。

本明細書で使用される場合、「バーコード配列」、又は「検出可能なバーコード配列」、又は「分子タグ」、又は「バーコード標識」、又はそれらの文法的等価物は、ソース識別子として作用することができ、かつ／又はヌクレオチド配列（例えば、ＤＮＡ、ＲＮＡ）の認識を促進することができる部分（例えば、３～１５ヌクレオチドのヌクレオチド配列）を意味する。特定の実施形態では、各オリジナルＤＮＡ又はＲＮＡ分子は、固有の配列バーコードに結合され、そのような配列は、本明細書に記載のアッセイの完了後に固有のソース配列又は固有の配列のセットまで追跡することができる。異なるバーコードを有する配列リードはオリジナル分子が異なることを表すが、同じバーコードを有する配列リードは１つのオリジナル分子からのＰＣＲ複製の結果であることが一般に理解される。標的定量化はまた、全リードカウントが不均一増幅によって標的に対してよりゆがみやすいので、全リードの数をカウントするのではなく、リード中の固有の分子バーコードの数をカウントすることによって達成され得る。「固有のバーコード」、「別個のバーコード」、又はそれらの文法的等価物とは、第１のバーコードが、その検出特性（例えば、固有の配列）又はその強度／濃度／絶対量のいずれかによって、検出アッセイにおいて第２のバーコード（又は他のすべてのバーコード）と識別され得ることを意味する。

本明細書を通して、略語は、ヌクレオチド（塩基とも呼ばれる）を指すために使用され、複数のヌクレオチドを指す略語を含む。本明細書で使用される場合、Ｇ＝グアニン、Ａ＝アデニン、Ｔ＝チミン、Ｃ＝シトシン、及びＵ＝ウラシルである。ヌクレオチドは、全体を通して小文字又は大文字を使用して称され得る。

２つのヌクレオチド配列は、それらの分子が塩基対構成相同性を共有する場合、互いに「相補的」である。「相補的」ヌクレオチド配列は、特異性と組み合わされて、適切なハイブリダイゼーション条件下で安定な二重鎖を形成する。例えば、２つの配列は、逆平行センスにおいて第１の配列の一部分が第２の配列の一部分に結合することができる場合、相補的であり、ここで各配列の３’末端は他の配列の５’末端に結合し、次いで１つの配列の各Ａ、Ｔ（Ｕ）、Ｇ及びＣは他の配列のＴ（Ｕ）、Ａ、Ｃ及びＧにそれぞれアラインメントされる。ＲＮＡ配列は、相補的なＧ＝Ｕ又はＵ＝Ｇ塩基対も含み得る。したがって、２つの配列は、本開示下で「相補的」であるために完全な相同性を有する必要はない。通常、ヌクレオチドの少なくとも約８５％（好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％）が分子の定義された長さにわたって塩基対構成を共有する場合、２つの配列は十分に相補的である。

本明細書で使用される「レーベンシュタイン距離スコア」という用語は、他のすべてのバーコードとの最大レーベンシュタイン距離を各バーコードに割り当て、レーベンシュタイン距離を降順にソートするスコアである。本明細書で使用される場合、「レーベンシュタイン距離」という用語は、２つの配列間の差異の程度に相当する。例えば、第１バーコード配列と第２バーコード配列との間のレーベンシュタイン距離は、第１バーコード配列を第２バーコード配列に変更するために必要な単一ヌクレオチド変化の数に相当する。レーベンシュタイン距離は平均化することができる。いくつかの実施形態では、接合部は、平均２つ以上の接合部距離を有するように設計される。いくつかの実施形態では、最大レーベンシュタイン距離をもたらすバーコード配列の設計が選択される。

用語「核酸」には、ＤＮＡ、ＲＮＡ（二本鎖又は一本鎖）、類似体（例えば、ＰＮＡ分子又はＬＮＡ分子）及びそれらの誘導体が含まれる。本明細書で使用される「リボ核酸」及び「ＲＮＡ」という用語は、リボヌクレオチドから構成されるポリマーを意味する。本明細書で使用される「デオキシリボ核酸」及び「ＤＮＡ」という用語は、デオキシリボヌクレオチドから構成されるポリマーを意味する。「ｍＲＮＡ」という用語は、メッセンジャーＲＮＡを意味する。
「オリゴヌクレオチド」は、一般に、約１０～１００ヌクレオチド長のヌクレオチド多量体を指し、「ポリヌクレオチド」は、任意の数のヌクレオチドを有するヌクレオチド多量体を含む。したがって、「核酸」という用語は、ポリヌクレオチドの従来の骨格が非天然発生又は合成の骨格で置き換えられたポリマー、及び従来の塩基の１つ以上がワトソン・クリック型水素結合相互作用に関与することができる基（天然又は合成）で置き換えられた核酸（又は合成若しくは天然の類似体）を含む。ポリヌクレオチドは、一本鎖又は複数本鎖の構成を含み、一本以上の鎖は、別の鎖と完全に一直線に並んでいても、又はそうでなくてもよい。「ヌクレオチド」は、核酸のサブユニットを指し、ホスフェート基、５炭素糖及び窒素含有塩基、並びにポリマー形態で（ポリヌクレオチドとして）、天然に存在するポリヌクレオチドと、２つの天然に存在するポリヌクレオチドのものと類似する配列特異的な様式でハイブリダイズすることができる、そのようなサブユニットの機能的類似体（合成又は天然を問わず）を有する。特に明記しない限り、「ポリヌクレオチド」、「オリゴヌクレオチド」、「核酸」及び「核酸分子」という用語の間の長さの意図した区別はなく、これらの用語は互換的に使用される。これらの用語は、分子の一次構造のみを指す。したがって、これらの用語には、例えば、３’－デオキシ－２’、５’－ＤＮＡ、オリゴデオキシリボヌクレオチドＮ３’ Ｐ５’ホスホラミデート、２’－Ｏ－アルキル置換ＲＮＡ、二本鎖及び一本鎖ＤＮＡ、並びに二本鎖及び一本鎖ＲＮＡ、ＤＮＡ：ＲＮＡハイブリッド、並びにＰＮＡとＤＮＡ又はＲＮＡとの間のハイブリッドが含まれ、また、公知のタイプの修飾、例えば、当技術分野で公知の標識、メチル化、「キャップ」、１つ以上の天然に存在するヌクレオチドの類似体による置換、ヌクレオチド間修飾、例えば、非荷電結合を含むもの（例えば、メチルホスホネート、ホスホトリエステル、ホスホルアミデート、カルバメートなど）、負荷電結合を含むもの（例えば、ホスホロチオエート、ホスホロジチオエートなど）、及び正荷電結合を含むもの（例えば、アミノアルキルホスホルアミデート、アミノアルキルホスホトリエステル）、ペンダント部分を含むもの、例えば、タンパク質（ヌクレアーゼ、毒素、抗体、シグナルペプチド、ポリ－Ｌ－リジンなどを含む）、インターカレータを含むもの（例えば、アクリジン、ソラレンなど）、キレート剤を含むもの（例えば、金属、放射性金属、ホウ素、酸化金属など）、アルキル化剤を含むもの、修飾された結合を含むもの（例えば、アルファアノマー核酸など）、並びにポリヌクレオチド又はオリゴヌクレオチドの非修飾形態が含まれる、特に、ＤＮＡはデオキシリボ核酸である。

「マルチプレックス」又は「多重化」という用語は、単一の反応に組み合わされた複数の試料の同時検出を指す。複数の固有のバーコード配列で多重化すると、１つの実験においていくつかの試料の個別化された検出及びソース識別が可能になる。本明細書で使用される「マルチプレックスＰＣＲ」という用語は、同じ反応容器内の２つ以上の標的核酸の同時増幅及び検出を提供するアッセイを指す。各増幅反応は、別個のプライマー対を使用してプライミングされる。いくつかの実施形態において、各プライマー対の少なくとも１つのプライマーは、検出可能な部分で標識される。いくつかの実施形態において、マルチプレックス反応は、各標的核酸に対する特異的プローブをさらに含み得る。いくつかの実施形態において、特異的プローブは、種々の検出可能な部分で検出可能に標識される。

本明細書で使用される「プライマー」又は「オリゴヌクレオチドプライマー」という用語は、プライマー伸長産物の合成が誘導される条件下、例えばヌクレオチド及び重合誘導剤、例えばＤＮＡ又はＲＮＡポリメラーゼの存在下、適切な温度、ｐＨ、金属濃度及び塩濃度に置かれた場合に、相補的核酸鎖の合成を開始するように作用するオリゴヌクレオチドを指す。プライマーは、一般に、プライマー伸長産物の合成におけるそれらの使用に適合する長さであり、通常は８～１００ヌクレオチド長の範囲、例えば１０～７５、１５～６０、１５～４０、１８～３０、２０～４０、２１～５０、２２～４５、２５～４０など、より典型的には１８～４０、２０～３５、２１～３０ヌクレオチド長の範囲、及び記載された範囲の間の任意の長さである。典型的なプライマーは、１０～５０ヌクレオチド長、例えば１５～４５、１８～４０、２０～３０、２１～２５などの範囲、及び記載した範囲の間の任意の長さであり得る。いくつかの実施形態では、プライマーは通常、約１０、１２、１５、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３５、４０、４５、５０、５５、６０、６５又は７０ヌクレオチド長以下である。

「プライマー」という用語は、ポリヌクレオチド、一般に、典型的には約１２～約３５ヌクレオチド長である「標的」結合部分を含むオリゴヌクレオチドであって、典型的なストリンジェンシー条件下で標的核酸隣接配列又は対応する増幅産物のプライマー結合部位と選択的にハイブリダイズするように設計され、対応するポリヌクレオチド鋳型に相補的であるヌクレオチド配列を、その３’末端から合成するための開始点として役立つオリゴヌクレオチドを指す。

プライマーは、通常、増幅の最大効率のために一本鎖であるが、代わりに二本鎖であってもよい。二本鎖の場合、プライマーは、通常、伸長産物を調製するために使用される前に、まずその鎖を分離するように処理される。この変性工程は、典型的には熱によって行われるが、代わりにアルカリを使用して実施し、続いて中和してもよい。したがって、「プライマー」は鋳型に相補的であり、水素結合又は鋳型とのハイブリダイゼーションによって複合体化して、ポリメラーゼによる合成開始のためのプライマー／鋳型複合体をもたらし、これはＤＮＡ合成の過程で、鋳型に相補的なその３’末端で連結される共有結合塩基の付加によって伸長される。

「フォワード」及び「リバース」という用語は、プライマー対のプライマーに関して使用される場合、ポリヌクレオチド配列上のプライマーの相対的な配向を示す。例えば、「リバース」プライマーは、典型的には、鋳型ポリヌクレオチドの「３’末端」における、又はその近くの下流プライマー結合部位と、右から左に向かって５’から３’の向きでアニーリングするように設計される。対応する「フォワードプライマー」は、ポリヌクレオチドの「５’末端」における、又はその近くの上流プライマー結合部位の相補体と、左から右への５’から３’の「フォワード」配向でアニーリングするように設計される。本明細書に記載の「プライマー対」は、フォワードプライマー及び対応するリバースプライマーを含む。

本明細書で使用される「プローブ」という用語は、特定の核酸配列上の相補的プローブ結合部位、例えばアンプリコンと配列特異的にハイブリダイズするように設計された部分を含むポリヌクレオチドを指す。本明細書に記載のプローブ及びプライマーの配列特異的部分は、標的核酸及び所望のアンプリコン中の相補的配列への特異的アニーリングを可能にするのに十分な長さである。

「ハイブリダイズする」及び「ハイブリダイゼーション」という用語は、ワトソン・クリック塩基対合を介して複合体を形成するのに十分に相補的なヌクレオチド配列間の複合体の形成を指す。プライマーが標的（鋳型）と「ハイブリダイズする」場合、そのような複合体（又はハイブリッド）は、ＤＮＡ合成を開始するために、例えばＤＮＡポリメラーゼによって必要とされるプライミング機能を果たすのに十分に安定である。

「ハイブリダイゼーションを可能にする条件」という語句は、プライマーがその相補的結合パートナーに優先的にハイブリダイズするか、又は特異的に結合し、他の配列とはより低い程度であるか、又は全くしない条件を指す。ハイブリダイゼーションを可能にする条件の一例は、５０℃以上、０．１ｘＳＳＣ（１５ｍＭ塩化ナトリウム／１．５ｍＭクエン酸ナトリウム）でのハイブリダイゼーションである。ストリンジェントなハイブリダイゼーション条件の別の例は、５０％ホルムアミド、５ｘＳＳＣ（１５０ｍＭＮａＣｌ、１５ｍＭクエン酸三ナトリウム）、５０ｍＭリン酸ナトリウム（ｐＨ７．６）、５×デンハルト溶液、１０％デキストラン硫酸、及び２０ｍｇ／ｍｌの変性断片化サケ***ＤＮＡの溶液中、４２℃で一晩インキュベーションすること、続いてフィルターを約６５℃の０．１ｘＳＳＣ中で洗浄することである。いくつかの実施形態では、ハイブリダイゼーションさせる条件は、上記の代表的な条件と少なくとも同程度にストリンジェントであるストリンジェントなハイブリダイゼーション条件であり、ここで条件は、それらが上記の特定の条件の少なくとも約８０％程度でストリンジェント、典型的には少なくとも約９０％程度でストリンジェントである場合、少なくとも同程度にストリンジェントであるとみなされる。他のストリンジェントなハイブリダイゼーション条件は当技術分野で公知であり、本明細書に記載されるこの特定の実施形態の核酸を同定するために使用することもできる。

「結合する」又は「結合された」とは、分子が目的の標的に優先的に結合するか、又は他の分子よりも大きな親和性で標的に結合することを意味する。例えば、抗原でコーティングされたビーズは、特異的結合抗体に結合し、いかなる免疫グロブリン分子にも結合しない。

「同定する」という用語は、任意の形態の測定を含み、検出される分析物の存在、非存在又は量を決定することを含む。一実施形態では、分析物は、ＣＯＶＩＤ１９ポリヌクレオチド又は他のＲＮＡウイルスポリヌクレオチドである。「決定する」、「検出する」、「測定する」、「評価する」、「査定する」及び「アッセイする」という用語は互換的に使用され、定量的及び定性的決定を含む。同定は、相対的又は絶対的であってもよい。「ａを同定する」は、存在する何かの量を測定すること、及び／又は存在するか否かを判定することを含む。本明細書で使用される場合、「決定する」、「測定する」、及び「査定する」及び「アッセイする」という用語は互換的に使用され、定量的及び定性的決定の両方を含む。

本明細書で使用される「ハイスループットシーケンシング」「ハイスループット、大規模並行シーケンシング」、「第３世代シーケンシング」、又は「ナノポアシーケンシング」という用語は、クローン増幅分子の、及び単一核酸分子の複数のシーケンシング反応を並行して発生させることができるシーケンシング方法を指す。これにより、スループット及びデータの収率を向上させることができる。これらの方法は、次世代シーケンシング（ＮＧＳ）方法としても当技術分野で公知である。ＮＧＳ法には、例えば、可逆的色素ターミネーターを使用した合成によるシーケンシング、ライゲーションによるシーケンシング、及びナノポアシーケンシングが含まれる。一般的に使用されるＮＧＳプラットフォームの非限定的な例としては、ｍｉＲＮＡＢｅａｄＡｒｒａｙ（Ｉｌｌｕｍｉｎａ，Ｉｎｃ．）、Ｒｏｃｈｅ４５４ＴＭＧＳＦＬＸＴＭ－Ｔｉｔａｎｉｕｍ（ＲｏｃｈｅＤｉａｇｎｏｓｔｉｃｓ）、ＡＢＩＳＯＬｉＤＴＭＳｙｓｔｅｍ（ＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓ，ＦｏｓｔｅｒＣｉｔｙ，ＣＡ）、及びＨｅｌｉＳｃｏｐｅ（商標）（ＨｅｌｉｃｅｓＢｉｏｓｃｉｅｎｃｅｓＣｏｒｐ．，ＣａｍｂｒｉｄｇｅＭＡ）、及びオックスフォードナノポアシーケンサーが挙げられる。

本明細書で使用される「リード」という用語は、一般に、単一の核酸鋳型分子、又は鋳型核酸分子の複数の実質的に同一のコピーの集団から得られた配列組成物を含むデータを指す。

「逆転写酵素」とは、プライミングされた一本鎖ＲＮＡ鋳型鎖を、デオキシリボヌクレオチド及び許容的反応媒体、例えば、これらに限定されないが、緩衝液（ｐＨ７．０－９．０）、ナトリウム及び／又はカリウムイオン及びマグネシウムイオンの存在下で相補的ＤＮＡ鎖へと複製する酵素を意味する。当業者に明らかなように、許容的反応媒体の濃度及びｐＨ範囲は、特定の逆転写酵素に関して変動し得る。当技術分野で周知の適切な「逆転写酵素」の例は、ＭｍＬＶ逆転写酵素及びその市販の誘導体「ＳｕｐｅｒｓｃｒｉｐｔＩ、ＩＩ及びＩＩＩ」（ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ）、「ＭａｘｉＳｃｒｉｐｔ」（Ｆｅｒｍｅｎｔａｓ）、ＲＳＶ逆転写酵素及びその市販の誘導体「ＯｍｎｉＳｃｒｉｐｔ」（Ｑｉａｇｅｎ）、ＡＭＶ逆転写酵素及びその市販の誘導体「Ｔｈｅｒｍｏｓｃｒｉｐｔ」（Ｓｉｇｍａ－Ａｌｄｒｉｃｈ）であるが、これらに限定されない。

本明細書で使用される「コロナウイルス」は、コロナウイルス科の属を指す。コロナウイルスは、大型の、エンベロープを有するプラス鎖ＲＮＡウイルスであり、組換えの頻度が高くなる独特の機構によって複製する。

用語「ＣＯＶＩＤ１９」は、「Ｗｕｈａｎ－ｈｕ－１」、「重症急性呼吸器症候群コロナウイルス２分離株、ＳＡＲＳ－ＣｏＶ－２」とも呼ばれ、ウイルスの科、すなわち、コロナウイルス科に属するウイルス、コロナウイルス研究グループ（ｄｅＧｒｏｏｔ２０１３）の命名法に従うベータコロナウイルス属のグループＩＶ（（＋）ｓｓＲＮＡ）ウイルスを指す。

「中東呼吸器症候群コロナウイルス」という用語は、本明細書ではＭＥＲＳとも略され、コロナウイルス研究グループ（ｄｅＧｒｏｏｔ２０１３）の命名法に従うベータコロナウイルス属のグループＩＶ（（＋）ｓｓＲＮＡ）ウイルスである。このウイルスは、Ｚａｋｉｅｔａｌ．（２０１２）、Ｂｅｒｍｉｎｇｈａｍｅｔａｌ．（２０１２）、ｖａｎＢｏｈｅｅｍｅｎｅｔａｌ．（２０１２）及びＭｕｌｌｅｒｅｔａｌ．
２０１２によって、ヒトコロナウイルスＥＭＣとして２０１２年に初めて記載された。ヒトベータコロナウイルス２ｃＥＭＣ／２０１２の完全ゲノムは、ＧｅｎＢａｎｋ受入れ番号ＪＸ８６９０５９．２で寄託されている

用語「重症急性呼吸器症候群コロナウイルス、ＳＡＲＳ－ＣｏＶ」は、ウイルスの科、すなわち、コロナウイルス科に属するウイルス、コロナウイルス研究グループ（ｄｅＧｒｏｏｔ２０１３）の命名法に従うベータコロナウイルス属のグループＩＶ（（＋）ｓｓＲＮＡ）ウイルスを指す。ＳＡＲＳ－ＣｏＶゲノムＲＮＡは、「２９，７００塩基対長であり、１４のオープンリーディングフレーム（ｏｒｆ）を有し、他のコロナウイルスに類似するレプリカーゼ、スパイク、膜、エンベロープ及びヌクレオカプシド（Ｎ）、並びにいくつかの他の独特なタンパク質をエンコードする（Ｍａｒｒａｅｔａｌ，２００３；Ｒｏｔａｅｔａｌ，２００３）。ＳＡＲＳ－ＣｏＶゲノム長ＲＮＡは、５０ｋＤａ－ヌクレオカプシドタンパク質（Ｎ）によってパッケージングされている可能性が高い［８］。他のコロナウイルスと同様に、ビリオンは、約１４０ｋＤａのスパイク糖タンパク質（Ｓ）、２３ｋＤａの膜糖タンパク質（Ｍ）及び約１０ｋＤａのタンパク質（Ｅ）を含むいくつかのウイルス構造タンパク質を含む。

ＩＩ．アンプリコン
一態様では、本開示はアンプリコンを含む組成物を提供する。本明細書に記載される多くの実施形態では、アンプリコンは、第１の固有のバーコード配列及びその逆相補体、標的特異的プライマーの対、標的増幅領域及びアダプター配列の第１の対を含む。標的特異的プライマーの対はフォワードプライマーとリバースプライマーとから構成され、それぞれが標的増幅領域（例えば、ウイルスゲノムの領域）内のプライミング部位に相補的な配列を有する。多くの実施形態において、フォワードプライマー及びリバースプライマーの各々は、標的増幅領域に隣接し、次に第１の固有のヌクレオチドバーコード配列及びその逆相補体に隣接し、第１の固有のバーコード配列及びその逆相補体は、アダプター配列の第１の対に隣接する。本明細書においてアダプター配列又はアダプターとも呼ばれるスペーサー配列は、典型的には、定義された長さ（例えば、１０ヌクレオチド）の保存された配列を含む。５’から３’への例示的なアンプリコン構造は、［フォワード＿アダプター］－［第１の固有のバーコード配列］－［フォワードプライマー］－［標的増幅領域］－［リバースプライマー］－［第１の固有のバーコード（リバース補完）］－［リバース＿アダプター］である。いくつかの実施形態では、固有のバーコードの第２のセット、第２の固有のバーコード配列及びその逆相補体はライゲーションすることができる。５’から３’へのバーコードの第２のセットを有する例示的なアンプリコン構造は、［第２の固有のバーコード配列］－［第２のフォワード＿アダプター］－［第１のフォワード＿アダプター］－［第１の固有のバーコード配列］－［フォワードプライマー］－［標的増幅領域］－［リバースプライマー］－［第１の固有のバーコード（リバース補完）］－［第１のリバース＿アダプター］－［第２のリバース＿アダプター］－［第２の固有のバーコード（リバース補完）］である。ＳＡＲＳ－Ｃｏｖ－２ＰＣＲ標的－Ｎ１遺伝子についての例示的なバーコード化フォワード及びリバースプライマー配列を以下に示す。
バーコード化フォワードプライマー－ＴＡＡＣＴＴＧＧＴＣＧＡＣＣＣＣＡＡＡＡＴＣＡＧＣＧＡＡＡＴ（配列番号１）
バーコード化リバースプライマー－ＧＴＣＴＡＡＧＴＴＧＡＣＣＧＴＣＡＴＴＧＧＴＣＴＡＴＴＧＡＡＣＣＡＧ（配列番号２）

本明細書中に提供される開示では、少なくとも１つのプライマーが使用され得る（例えば、対象からの試料をシーケンシングするために、又はライブラリーを調製するために）。いくつかの実施形態において、１つのプライマーを使用してもよい。いくつかの実施形態において、２つ以上のプライマーを使用してもよい。例えば、１、２、３、４、５、６、７、８、９、又は１０のプライマーを使用することができる。いくつかの実施形態では、１０を超えるプライマーを使用することができる。例えば、第１、第２、第３、第４、第５、第６、第７、第８、第９及び／又は第１０のプライマーを使用することができる。いくつかの実施形態において、プライマーは、所望の配列を含むことができる。いくつかの実施形態において、プライマーは、２つ以上の所望の配列を含むことができる。例えば、所望の配列は、予め決定された配列、相補的配列、既知の配列、結合配列、ユニバーサル配列、又は検出配列であり得る。いくつかの実施形態において、予め決定された配列はユニバーサル配列であり得る。

いくつかの実施形態では、ポリヌクレオチド（例えば、標的配列又は標的増幅領域内の配列）を、所望の配列を含有する少なくとも１つのプライマーと接触させることができる。いくつかの実施形態では、プライマーは、限定されないが、ポリヌクレオチドにハイブリダイズ又はアニーリングされ得る。例えば、所望の配列（例えば、所定の標的配列）を有するプライマーを使用して、酵素を使用してポリヌクレオチドを増幅することができる。例えば、酵素はポリメラーゼ（例えば、Ｔａｑポリメラーゼ）であり得る。いくつかの実施形態では、所定の配列を含有するプライマーは、ポリヌクレオチドの３’末端又は５’末端にアニーリング又はハイブリダイズされ得る。いくつかの実施形態では、２つ以上の所定の配列が、ポリヌクレオチドにアニーリング又はハイブリダイズされ得る。例えば、第１の所定の配列は、ポリヌクレオチドの一端にアニーリング又はハイブリダイズされ得、第２の所定の配列は、ポリヌクレオチドの他端にアニーリング又はハイブリダイズされ得る。いくつかの実施形態では、第１の所定の配列は、第２の所定の配列に相補的であり得る。いくつかの実施形態では、第１の所定の配列は、第２の所定の配列に逆相補的であり得る。いくつかの実施形態では、第１の所定の配列は、第２の所定の配列に相補的でなくてもよい。

本明細書で提供される組成物及び方法において有用である非限定的な例示的プライマー対は、フォワードプライマー：ＧＡＣＣＣＣＡＡＡＡＴＣＡＧＣＧＡＡＡＴ（配列番号３）及びリバースプライマー：ＴＣＴＧＧＴＴＡＣＴＧＣＣＡＧＴＴＧＡＡＴＣＴＧ（配列番号４）；フォワードプライマー：ＴＴＡＣＡＡＡＣＡＴＴＧＧＣＣＧＣＡＡＡ（配列番号５）及びリバースプライマー：ＧＣＧＣＧＡＣＡＴＴＣＣＧＡＡＧＡＡ（配列番号６）；フォワードプライマー：ＧＧＧＡＧＣＣＴＴＧＡＡＴＡＣＡＣＣＡＡＡＡ（配列番号７）及びリバースプライマー：ＴＧＴＡＧＣＡＣＧＡＴＴＧＣＡＧＣＡＴＴＧ（配列番号８）；フォワードプライマー：ＧＴＧＡＲＡＴＧＧＴＣＡＴＧＴＧＴＧＧＣＧＧ（配列番号９）及びリバースプライマー：ＣＡＲＡＴＧＴＴＡＡＡＳＡＣＡＣＴＡＴＴＡＧＣＡＴＡ（配列番号１０）；フォワードプライマー：ＡＣＡＧＧＴＡＣＧＴＴＡＡＴＡＧＴＴＡＡＴＡＧＣＧＴ（配列番号１１）及びリバースプライマー：ＡＴＡＴＴＧＣＡＧＣＡＧＴＡＣＧＣＡＣＡＣＡ（配列番号１２）；フォワードプライマー：ＣＣＣＴＧＴＧＧＧＴＴＴＴＡＣＡＣＴＴＡＡ（配列番号１３）及びリバースプライマー：ＡＣＧＡＴＴＧＴＧＣＡＴＣＡＧＣＴＧＡ（配列番号１４）；フォワードプライマー：ＧＴＡＣＴＣＡＴＴＣＧＴＴＴＣＧＧＡＡＧＡＧ（ＳＥＱＩＤＮＯ．：１５）及びリバースプライマー：ＣＣＡＧＡＡＧＡＴＣＡＧＧＡＡＣＴＣＴＡＧＡ（配列番号１６）；フォワードプライマー：ＧＧＧＧＡＡＣＴＴＣＴＣＣＴＧＣＴＡＧＡＡＴ（配列番号１７）及びリバースプライマー：ＣＡＧＡＣＡＴＴＴＴＧＣＴＣＴＣＡＡＧＣＴＧ（配列番号１８）；及びフォワードプライマー：ＡＧＡＴＴＴＧＧＡＣＣＴＧＣＧＡＧＣＧ（配列番号１９）及びリバースプライマー：ＧＡＧＣＧＧＣＴＧＴＣＴＣＣＡＣＡＡＧＴ（配列番号２０）を含む。

いくつかの実施形態では、第１の固有のバーコード配列及びその逆相補体を用いた単一段階バーコード化手順が使用される。そのような実施形態では、第１の固有のバーコード及びその逆相補体並びにアダプター配列の第１の対は、増幅プロセスで使用されるプライマーによって導入される。これらの実施形態では、アダプター配列の第１の対は、少なくとも１０～１５ヌクレオチドを有する不変配列を有する。一実施形態では、不変アダプター配列は１０ヌクレオチドを有する。特定の実施形態では、不変アダプター配列は、ＡＣＡＣＴＧＡＣＧＡＣＡＴＧＧＴＴＣＴＡＣＡ（配列番号２１）及びＴＡＣＧＧＴＡＧＣＡＧＡＧＡＣＴＴＧＧＴＣＴ（配列番号２２）に示すポリヌクレオチド配列を含む。他の不変アダプター配列を生成し、本開示の範囲内に含めることができる。別の実施形態では、第１の固有のバーコード配列及び第２の固有の逆相補体を用いた単一段階バーコード化手順が使用される。そのような実施形態では、第１の固有のバーコード、第２の固有の逆相補体及びアダプター配列の第１の対は、増幅プロセスで使用されるプライマーによって導入される。

他の実施形態では、第１の固有のバーコード配列及びその逆相補体、並びに第２の固有のバーコード配列及びその逆相補体を用いる２段階バーコード化手順が使用される。そのような実施形態では、第１の固有のバーコード配列及びその逆相補体、並びにアダプター配列（例えば、アダプター配列の第１の対）は、増幅プロセスで使用されるプライマーによって導入される。バーコードの第２のセット（例えば、段階１のプレートからプールされた試料を追跡するために使用されるバーコード、第２の固有のバーコード配列）をアンプリコンの末端にライゲーションする。結果として、不変アダプター配列は、２つのバーコードの間に位置することになる。これにより、２つのバーコードを互いに直接隣接させることに起因し得るアンビギュイティが回避される。いくつかの実施形態では、２つの異なる内側バーコード配列を用いる２段階バーコード化手順が使用される。いくつかの他の実施形態では、２つの異なる外側バーコード配列を用いる２段階バーコード化手順が使用される。さらに別の実施形態では、２つの異なる内側バーコード配列及び２つの異なる外側バーコード配列を用いる２段階バーコード化手順が使用される。異なる内側バーコード及び外側バーコードを用いるいくつかの実施形態では、すべての４つの（２つの内側及び２つの外側）バーコードが異なる。

以下で詳細に説明するように、２段階バーコード手順が使用される場合、隠れマルコフモデル（ＨＭＭ）又は共分散モデル（ＣＭ）を生成するために使用される配列は、不変スペーサー配列の両側に、配列リードの統計的モデルに対するアラインメントがバーコードの両方のセットに正しくアノテーションを付けるように、アンビギュイティ配列を組み込む。代替案は、使用される第２段階バーコードのそれぞれについてＨＭＭ又はＣＭモデルを作成し、これらのモデルの一方の質を使用して第２段階バーコードの同一性を割り当てることである。２段階バーコード化を用いる多くの実施形態では、アダプター配列の２つの対、アダプター配列の第１の対及びアダプター配列の第２の対が存在する。いくつかの実施形態では、アダプター配列の第１の対及び第２の対は、少なくとも１０～１５ヌクレオチドを有する不変配列と同一である。一実施形態では、不変アダプター配列は１０ヌクレオチドを有する。特定の実施形態では、不変アダプター配列は、ＡＣＡＣＴＧＡＣＧＡＣＡＴＧＧＴＴＣＴＡＣＡ（配列番号２１）及びＴＡＣＧＧＴＡＧＣＡＧＡＧＡＣＴＴＧＧＴＣＴ（配列番号２２）に示すポリヌクレオチド配列を含む。他の不変アダプター配列を生成し、本開示の範囲内に含めることができる。

多くの実施形態において、不変アダプター配列は各プライマーの５’末端にある。結果として、各アンプリコン配列は、５’末端において、フォワード鎖プライマーからのアダプター配列のコピーで始まり、３’末端において、リバース鎖プライマーに由来するアダプターの逆相補配列を有する。理論に束縛されることを望むものではないが、これらのアダプター配列は２つの目的を果たす。第１に、それらは、長いリードを構成アンプリコン配列にセグメント化するのを助け、第２に、それらは、以下に記載されるＨＭＭ又はＣＭアラインメントにおける固有のバーコード配列の位置を固定し、固有のバーコード配列の位置を確実にアノテーションすることを可能にする。

いくつかの実施形態では、外側バーコード（例えば、プレート／バッチ識別子）は、典型的にはライゲーション反応を使用して、バーコード化アンプリコンに付加される。ライゲーションされた外側バーコードは、第２のＰＣＲ段階に基づく増幅に固有の交差増幅を回避する。内側バーコードは、いくつかの事例では、少なくとも９６ウェルを有するプレート内の複数の別個の試料からの特定の試料にアノテーションを付けるための、患者又はウェル固有のバーコードである。外側バーコードは、特定のバッチを示すことができ、又はプレートの複数のバッチを有する別個のプレートに複数の別個の試料がある場合、プレート識別子とすることができる。バーコード配列及びプライマーは、二次構造相互作用についてスクリーニングされた非常に大きな検証済みＩＤＴバーコードライブラリーから選択され、高度に最適化されたエラー耐性バーコード設計をもたらす。バーコード配列を含む本明細書で提供される組成物及び方法の実施形態では、レーベンシュタイン距離（ＬＤ）バーコード最適化を行って、シーケンシングエラー耐性及び最大識別可能性を確保する。まず、候補バーコードのセットから、すべてのバーコードと１つおきのバーコードとの間のレーベンシュタイン距離が計算される。次いで、各バーコードに他のすべてのバーコードに対する最大レーベンシュタイン距離を割り当て、レーベンシュタイン距離の降順でソートすることによって、バーコードをランク付けする。次に、ランク付けされたリストからのバーコード候補を含むグループから所望の数の、それらを他のバーコードから分離する最大ＬＤを有するバーコードが選択される（例えば、９６、又は３８４）。

非限定的な例示的バーコード配列を表１に提供する。表１の９６個のバーコード配列（３０００＋総バーコード内から選択された）は、最大レーベンシュタイン距離で分離されている。
いくつかの実施形態において、最大レーベンシュタイン距離で分離されたバーコード配列の３８４個が選択される。バーコード配列の選択はアルゴリズム的に行われ、選択サイズに応じて異なる結果をもたらす。本明細書で提供される方法及び組成物の多くの実施形態において、選択されるバーコード配列の数は、プライマーが構築されるバーコードプールのサイズに基づく。

非限定的な例示的外側バーコード配列を表２に提供する。表２の例示的なバーコード配列は、最大レーベンシュタイン距離で分離されている。

バーコード及びバーコード化プライマーは、任意の生物、例えば、これらに限定されないが、ヒト、哺乳動物、さらには植物に特異的にすることができる。バーコードは、ヒト病原体（例えば、Ｓａｒ－ＣｏＶ－２）及びあらゆる種類の重要な獣医学的疾患の病原体（例えば、ウシ下痢、ヨーネ病、豚インフルエンザなど）についてアノテーションするように特に設計することができる。バーコードは、動物が各試料に標識され、適切にバーコードプライミングされている限り、群内の感染動物の個々の検出を容易にすることができる。

本明細書に記載される多くの実施形態では、標的増幅領域は、遺伝子又はタンパク質をエンコードする病原体のゲノム領域から増幅される。病原体は、アシネトバクター・バウマンニ（Ａｃｉｎｅｔｏｂａｃｔｅｒｂａｕｍａｎｎｉｉ）、アデノウイルス、アフリカ馬疫ウイルス、アフリカ豚コレラウイルス、ズビニ鉤虫（Ａｎｃｌｏｓｔｏｍａｄｕｏｄｅｎａｌｅ）、回虫、黄色アスペルギルス、アスペルギルス・フミガーツス（Ａｓｐｅｒｇｉｌｌｕｓｆｕｍｉｇａｔｕｓ）、アスペルギルス・ニガー（Ａｓｐｅｒｇｉｌｌｕｓｎｉｇｅｒ）、アスペルギルス・オリゼ（Ａｓｐｅｒｇｉｌｌｕｓｏｒｙｚａｅ）、鳥インフルエンザウイルス、炭疽菌、炭疽菌パスツール株、ＢａｃｉｌｌｕｓｃｅｒｅｕｓＢｉｏｖａｒａｎｔｈｒａｃｉｓ、ウシ流産菌、ブルセラ・メリテンシス（Ｂｒｕｃｅｌｌａｍｅｌｉｔｅｎｓｉｓ）、ブルセラ・スイス（Ｂｒｕｃｅｌｌａｓｕｉｓ）、鼻疽菌、類鼻疽菌、カンジダ・アルビカンス（Ｃａｎｄｉｄａａｌｂｉｃａｎｓ）、カンジダ・ドゥブリニエンシス（Ｃａｎｄｉｄａｄｕｂｌｉｎｉｅｎｓｉｓ）、カンジダ・グラブラタ（Ｃａｎｄｉｄａｇｌａｂｒａｔａ）、カンジダ・クルセイ（Ｃａｎｄｉｄａｋｒｕｓｅｉ）、カンジダ・トロピカリス（Ｃａｎｄｉｄａｔｒｏｐｉｃａｌｉｓ）、クラミジア・ニューモニエ（Ｃｈｌａｍｙｄｉａｐｎｅｕｍｏｎｅａｅ）、クラミジア・トラコマチス（Ｃｈｌａｍｙｄｉａｔｒａｃｈｏｍａｔｏｕｓ）、豚熱ウイルス、クロストリジウム・ディフィシール（Ｃｌｏｓｔｒｉｄｉｕｍｄｉｆｆｉｃｉｌｅ）、コクシジオイデス・イミティス（Ｃｏｃｃｉｄｉｏｉｄｅｓｉｍｍｉｔｉｓ）、コクシジオイデス・ポサダシ（Ｃｏｃｃｉｄｉｏｉｄｅｓｐｏｓａｄａｓｉｉ）、ＣｏＶ－２２９Ｅ、ＣｏＶ－ＨＫＵ１、ＣｏＶ－ＮＬ６３、ＣｏＶ－ＯＣ４３、コクサッキーウイルスＡ、コクサッキーウイルスＢ、コクシエラ・バーネッティ（Ｃｏｘｉｅｌｌａｂｕｒｎｅｔｉｉ）、クリミア・コンゴ出血熱、サイトメガロウイルス、デングウイルス、メジナ虫、東部馬脳炎、エボラウイルス、い粒条虫、多包条虫、エンテロバクター・クロアカ、エンテロコッカス・フェシウム（Ｅｎｔｅｒｏｃｏｃｃｕｓｆａｅｃｉｕｍ）、エンテロウイルス、エプスタイン・バール・ウイルス、大腸菌、巨大肝蛭、肝蛭、***ウイルス、野兎病菌、山羊痘ウイルス、ヘモフィルス属インフルエンザ、ヘリコバクターピロリ、ヘンドラウイルス、Ａ型肝炎ウイルス、Ｂ型肝炎ウイルス、Ｃ型肝炎ウイルス、ヒストプラスマ・カプスラーツム（Ｈｉｓｔｏｐｌａｓｍａｃａｐｓｕｌａｔｕｍ）、ズボアジ型ヒストプラスマ症（Ｈｉｓｔｏｐｌａｓｍａｄｕｂｏｉｓｉｉ）、ヒトヘルペスウイルスＨＨＶ６、ヒトヘルペスウイルスＨＨＶ７、ヒトヘルペスウイルスＨＨＶ８、ヒトヘルペスウイルスＨＳＶ１、ヒトヘルペスウイルスＨＳＶ２、ヒト免疫不全ウイルス、ヒトパピローマウイルス、インフルエンザウイルスＡ型、インフルエンザウイルスＢ型、クレブシェラ肺炎桿菌、キャサヌール森林病ウイルス、ラッサ熱ウイルス、レジオネラ・ニューモフィラ菌、リーシュマニア・プロマスティゴート（Ｌｅｉｓｈｍａｎｉａｐｒｏｍａｓｔｉｇｏｔｅｓ）、Ｌｕｊｏウイルス、ランピースキン病ウイルス、マールブルグウイルス、麻疹ウイルス、メチシリン耐性黄色ブドウ球菌、サル痘ウイルス、ムンプスウイルス、マイコバクテリウム・アブセッサス（Ｍｙｃｏｂａｃｔｅｒｉｕｍａｂｓｃｅｓｓｕｓ）、マイコバクテリウム・アビウム（Ｍｙｃｏｂａｃｔｅｒｉｕｍａｖｉｕｍ）、マイコバクテリウム・ボビス（Ｍｙｃｏｂａｃｔｅｒｉｕｍｂｏｖｉｓ）、マイコバクテリウム・カヌッティイ（Ｍｙｃｏｂａｃｔｅｒｉｕｍｃａｎｅｔｔｉｉ）、マイコバクテリウム・レプレ（Ｍｙｃｏｂａｃｔｅｒｉｕｍｌｅｐｒａｅ）、ヒト結核菌、マイコバクテリウム・ウルセランス（Ｍｙｃｏｂａｃｔｅｒｉｕｍｕｌｃｅｒａｎｓ）、マイコプラズマ・カプリコルム（Ｍｙｃｏｐｌａｓｍａｃａｐｒｉｃｏｌｕｍ）、マイコプラズマ・ミコイデス（Ｍｙｃｏｐｌａｓｍａｍｙｃｏｉｄｅｓ）、マイコプラズマ・ニューモニア（Ｍｙｃｏｐｌａｓｍａｐｎｅｕｍｏｎｅａｅ）、アメリカ十二指腸虫、淋病、ニューカッスル病ウイルス、ニパウイルス、ノルカジア属ｂｅｉｊｉｎｇｅｎｓｉｓ、ノルカジア属ｃｙｒｉａｃｉｇｅｏｒｇｉｃａ、ノルカジア属ｆａｒｃｉｎｉｃａ、ノロウイルスＧＩ、ノロウイルスＧＩＩ、ノーウォークウイルス、オムスク出血熱ウイルス、回旋糸状虫、発癌性ヒトパピローマウイルス、パラインフルエンザウイルス、寄生生物、マルネッフェイ型ペニシリウム症（Ｐｅｎｉｃｉｌｌｉｏｓｉｓｍａｍｅｆｆｅｉ）、小反芻獣疫ウイルス、ニューモシスチス・イロベチイ（Ｐｎｅｕｍｏｃｙｓｔｉｓｊｉｒｏｖｅｃｉｉ）、ポリオーマウイルス、プロテウス・ミラビリス（Ｐｒｏｔｅｕｓｍｉｒａｂｉｌｉｓ）、緑膿菌、狂犬病ウイルス、８つの遺伝子断片すべてのコーディング領域の任意の部分を含有する、１９１８年のパンデミックインフルエンザウイルスの再構築された複製コンピテント形態、呼吸器合胞体ウイルス、ライノウイルス、発疹チフスリケッチア、リフトバレー熱ウイルス、牛疫ウイルス、ロタウイルスＡ、ロタウイルスＢ、ロタウイルスＣ、ロタウイルスＧ２、風疹ウイルス、ＳＡＲＳ関連コロナウイルス（ＳＡＲＳ－ＣｏＶ）、ＳＡＲＳ－ＣｏＶ－１、ＳＡＲＳ－ＣｏＶ－２、ビルハルツ住血吸虫、日本住血吸虫、マンソン住血吸虫、羊痘ウイルス、南米出血熱ウイルスチャパレ、南米出血熱ウイルスグアナリト、南米出血熱ウイルスフニン、南米出血熱ウイルスマチュポ、南米出血熱ウイルスサビア、黄色ブドウ球菌、スタフィロコッカス・サプロフィティカス（Ｓｔａｐｈｙｌｏｃｏｃｃｕｓｓａｐｒｏｐｈｙｔｉｃｕｓ）、肺炎レンサ球菌、豚水疱病ウイルス、有鉤条虫、ダニ媒介性脳炎複合（ｆｌａｖｉ）ウイルス極東亜型、ダニ媒介性脳炎複合（ｆｌａｖｉ）ウイルスシベリア亜型、タバコモザイク病ウイルス、トルクテノウイルス、鞭虫、ブルーストリパノソーマ（Ｔｒｙｐａｎｏｓｏｍａｂｒｕｃｅｉ）、トリパノソーマ・クルージ（Ｔｒｙｐａｎｏｓｏｍａｃｒｕｚｉ）、大痘瘡ウイルス（天然痘ウイルス）、小痘瘡ウイルス（アラストリム）、ベネズエラ馬脳炎ウイルス、バンクロフト糸状虫、ペスト菌、及び上記の病原体のいずれか１つと特徴的な核酸配列を共有する病原体、又は前述の群の病原体と特徴的な核酸配列を共有する、別の潜在的に新規若しくは特性決定されていない病原体からなる群から選択される。

一実施形態では、標的増幅領域は、ＳＡＲＳ－ＣｏＶ－２の特定のウイルスゲノム領域に相当する。標的増幅領域が増幅されるタンパク質をエンコードするゲノム領域の非限定的な例は、スパイクタンパク質（Ｓ）、受容体結合ドメイン（ＲＢＤ）、Ｓ１タンパク質、Ｓ２タンパク質、Ｅ遺伝子、Ｓ遺伝子、Ｏｒｆｌａｂ遺伝子、Ｎ末端スパイクタンパク質ドメイン、全タンパク質（Ｓ１＋Ｓ２）、及びヌクレオカプシド（Ｎ）タンパク質からなる群から選択される抗原をエンコードする領域を含む。一実施形態では、標的増幅領域は、Ｓタンパク質をエンコードする領域から増幅される。別の実施形態では、標的増幅領域は、Ｓタンパク質のＲＢＤをエンコードする領域から増幅される。さらに別の実施形態では、標的増幅領域は、Ｎタンパク質をエンコードする領域から増幅される。

本明細書で提供されるアンプリコン構築物では、さらなるスペーサー配列（例えば、アダプター配列）がバーコードの外側に適用され得（例えば、バーコード配列の第１のセットに隣接する）、これらのスペーサー配列は、後のアンプリコン領域アノテーション（プロファイル隠れマルコフモデル又は共分散モデルアラインメントアルゴリズムによる関心領域のヌクレオチドごとのアノテーション）に重要である。いくつかの実施形態では、アンプリコンは２つのスペーサー配列のみを含む。他の実施形態では、アンプリコンは少なくとも４つ以上のスペーサー配列を含んでいた。いくつかの実施形態において、アダプター配列を含めて、複数のアンプリコンのそれぞれに第２の固有のバーコード配列を付加できるようにした。いくつかの例において、アダプター配列は配列読み取り中にマーカーとして作用して、バーコード配列の末端及び／又は次のバーコード配列の開始をシグナル伝達する。本明細書中に記載される実施形態の多くにおいて、スペーサー配列は保存されている。特定の実施形態では、バーコード化アンプリコン中のすべてのスペーサー配列は同一の配列であった。いくつかの実施形態において、アダプター配列は少なくとも１０ヌクレオチドを含む。いくつかの他の実施形態において、アダプター配列は１０～１５ヌクレオチドを含む。一実施形態において、アダプター配列は１０ヌクレオチドを含む。

ＩＩＩ．シーケンシング、ＨＭＭ及びＣＭエンジン
本明細書に記載される組成物及び方法の多くの実施形態では、ハイスループットシーケンシングが使用される。いくつかの実施形態では、ハイスループットシーケンシングを使用して、アンプリコン中の固有のバーコードを検出する。いくつかの他の実施形態では、ハイスループットシーケンシングを使用して、アンプリコンの標的増幅領域内の配列変異体を検出する。当技術分野で公知の任意のハイスループットシーケンシングプラットフォームを使用して、本明細書に記載のように調製されたシーケンシングライブラリーをシーケンシングすることができる（Ｍｙｌｌｙｋａｎｇａｓｅｔａｌ．，Ｂｉｏｉｎｆｏｒｍａｔｉｃｓｆｒａ・ＨｉｇｈＴｈｒｏｕｇｈｐｕｔＳｅｑｕｅｎｃｉｎｇ，Ｒｏｄｒｉｇｕｅｚ－Ｅｚｐｅｌｅｔａｅｔａｌ．（ｅｄｓ．），ＳｐｒｉｎｇｅｒＳｃｉｅｎｃｅ＋ＢｕｓｉｎｅｓｓＭｅｄｉａ，ＬＬＣ，２０１２，１１－２５頁を参照）。例示的なハイスループットＤＮＡシーケンシングシステムは、オックスフォードナノポアプラットフォーム（ＭｉｎｌＯＮ及びＰｒｏｍｅｔｈｌＯＮ機器を含む）、４５４ＬｉｆｅＳｃｉｅｎｃｅｓによって最初に開発され、後にＲｏｃｈｅ（Ｂａｓｅｌ，Ｓｗｉｔｚｅｒｌａｎｄ）によって取得されたＧＳＦＬＸシーケンシングシステム、Ｓｏｌｅｘａによって開発され、後にｌｌｌｕｍｉｎａＩｎｃ．（ＳａｎＤｉｅｇｏ，ＣＡ）によって取得されたＧｅｎｏｍｅＡｎａｌｙｚｅｒ（Ｂｅｎｔｌｅｙ，ＣｕｒｒＯｐｉｎＧｅｎｅｔＤｅｖ１６：５４５－５２，２００６；Ｂｅｎｔｌｅｙｅｔａｌ．，Ｎａｔｕｒｅ４５６：５３－５９，２００８を参照）、ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ（ＦｏｓｔｅｒＣｉｔｙ，ＣＡ）によるＳＯＬｉＤ配列システム（Ｓｍｉｔｈｅｔａｌ．，ＮｕｃｌｅｉｃＡｃｉｄＲｅｓ３８：ｅ１４２，２０１０；Ｖａｌｏｕｅｖｅｔａｌ．，ＧｅｎｏｍｅＲｅｓ１８：１０５１－６３，２００８を参照）、ＣｏｍｐｌｅｔｅＧｅｎｏｍｉｃｓによって開発され、ＢＧＩによって取得されたＣＧＡ（Ｄｒｍａｎａｃｅｔａｌ．，Ｓｃｉｅｎｃｅ３２７：７８－８１，２０１０を参照）、ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓ（ＭｅｎｌｏＰａｒｋ，ＣＡ）によって開発されたＰａｃＢｉｏＲＳシーケンシング技術（Ｅｉｄｅｔａｌ．，Ｓｃｉｅｎｃｅ３２３：１３３－８，２００９を参照）、及びＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓＣｏｒｐｏｒａｔｉｏｎによって開発されたＩｏｎＴｏｒｒｅｎｔ（米国特許出願公開第２００９／００２６０８２号；２０１０／０１３７１４３号；及び２０１０／０２８２６１７号を参照）を含むが、これらに限定されない。本明細書に記載の方法で使用されるオックスフォードナノポアＤＮＡシーケンシングシステムは、通常に長さが２５０ｂｐ超えるアンプリコンを迅速かつ正確に読み取るのにより適している。Ｉｌｌｕｍｉｎａシーケンシングシステムは、比較的短いリードをもたらす長い処理時間及び合成によるシーケンシングのため、オックスフォードナノポアＤＮＡシーケンシングシステム（例えば、ＯＮＴＭｉｎｌＯＮ又はＧｒｉｄｌＯＮ）と比較して本明細書に記載の方法に適していない可能性がある。

本明細書に記載の方法に適用される非限定的な例示的バイオインフォマティクスパイプラインの概要を図３に示す。バイオインフォマティクスパイプラインの工程１において、プールされたライブラリー調製物からのＰＣＲアンプリコンをＯＮＴＭｉｎｌＯＮ又はＧｒｉｄｌＯＮでシーケンシングして、生のＯＮＴＦＡＳＴＳシーケンシング出力ファイルを得る。次の工程では、高精度ＯＮＴＧＰＵに基づくベースコーラーが生のＦＡＳＴＡ／ＦＡＳＴＱファイルをもたらす。次の工程は、ＦＡＳＴＡ／ＦＡＳＴＱファイルを、統計的パターン分類アルゴリズムを適用するＨＭＭＥＲ３及びＣＭ配列アラインメント及びアノテーションエンジンに供して、ａ）複製配列リードに基づいて尤度を最大化すること、及び／又はｂ）全ゲノム多重配列アラインメントに基づいて文脈依存アラインメントモデルパラメータを使用することによってコンセンサス配列を生成する。最終的なフィルタリング工程において、二重バーコードを含むリードは、参照バーコード候補に対する最小レーベンシュタイン距離スコアに合格しなければならない。合格リードは、完全な標的配列アノテーション、モデルフィット、ビットスコア、バーコード位置、バーコード距離、及び他のメトリックと共に中央データベースに記憶される。

複数のアンプリコンの配列リードを提供するための様々な方法は、単一の分子を繰り返しシーケンシングすること、又は各々が関心領域の少なくとも一部を含む複数の分子をシーケンシングすることを含む。複数のアンプリコンの複数の配列リードのアラインメントは、一般に、例えば参照配列を使用するか又はデノボアセンブリルーチンを使用する、複数の配列アラインメントアルゴリズムを１つ以上含む。ある特定の実施形態において、コンセンサス配列を決定する方法を、所与の複数のバーコード配列リードのために反復して、例えば、リードの種々のサブセットを方法の種々の反復のために使用して適用した。そのようなサブセットは、様々な基準、例えば、様々なストリンジェントな品質閾値によって選択することができる。組み合わされた標的＋リンカー＋バーコード化プライマーは、リード品質及びコール精度の両方を改善し、ナノポアシーケンシングのロングリード能力を完全に利用する完全長のエラー耐性アンプリコンをもたらす。

本明細書中に記載される組成物及び方法の多くの実施形態において、バーコードの識別及び複数の配列の中からの各アンプリコンからの回収は、１つ以上の尤度モデル、エラーモデル、確率的グラフモデル（例えば、全経路確率的アラインメント）を適用する統計的パターン分類アルゴリズムの使用を必要とする。プロファイル隠れマルコフモデルアライナー（ＨＭＭＥＲ）及び場合により共分散モデル（Ｉｎｆｅｒｎａｌ）をバイオインフォマティクスツールとして使用して、各アンプリコンからの効率的なバーコード識別及び回収を可能にした。ＨＭＭＥＲ及びＣＭは、所与の特徴の一部であることの最大尤度を有するあらゆるヌクレオチド（挿入、置換及び欠失のようなシーケンサーのエラーに満ちたノイズの多い配列リードにおいてさえ）の標識を容易にする。例えば、バーコード領域は明確に定義され、確率的アライナーは、機器から出てくる配列内の各文字に「領域」アノテーションを割り当てる。これにより、別個のプライマーの同定が可能になり、さらに、誤って形成されたアンプリコン（例えばプライマー－二量体対）の同定も可能になる。ＨＭＭＥＲは、検索データベースとは無関係に、所与のアラインメントが一致する長さを与えられる尤度に対応するビットスコアを割り当てる。これらのスコアは、各試料のアンプリコンをそれらの品質によってランク付けするのに重要であり、ナノポア機器のシーケンシングエラーの克服を可能にする。これらのアルゴリズムは、試料を逆多重化することができる能力にとって重要である。本明細書で提供されるアンプリコン配列は、プロファイルＨＭＭ及びＣＭによる最適な計算的アノテーション及びスコアリングのために設計された。

プロファイル隠れマルコフモデル（略してｐＨＭＭ又はＨＭＭ）又は共分散モデル（ＣＭ）アラインメントエンジンなどの統計的モデルを本明細書に記載の方法で使用して、（１）ロングリードをそれらの構成アンプリコン配列にセグメント化し、（２）予め定義された配列モデルと一致する高品質のマッチングシーケンサー由来アンプリコン配列を同定し、（３）アンプリコン配列を、予め定義された配列モデルに対するそれらのアラインメント（一致としても知られる）の正確さ（「品質」）に従ってランク付けし、（４）予め定義された配列モデルの対応する（予めアノテーションされた）特徴に従ってアンプリコン内の内部人工配列ドメイン又は特徴を同定した。

本明細書中に記載される方法の多くの実施形態において、複数のアンプリコンの検出は、複数のアンプリコンのプールされた配列データセットを得ること、ベースコールを行うこと、複数のアンプリコンの配列データを予め定義されたアノテーション付きＨＭＭ又はＣＭ遺伝子モデルにアラインメントすること、ＨＭＭ／ＣＭアラインメントの各々に階級（例えば、確率スコア又はビットスコア）を割り当てること、配列データをフィルタリングして位置アノテーション付き配列アラインメントを得ること、各アンプリコン内のバーコード並びにアンプリコンの配列内のバーコード及びアダプターの位置を決定することを含む。本明細書に記載の方法のすべての実施形態において、前述の工程は、適切にプログラムされたコンピュータを使用して実行される。本明細書に記載の方法のいくつかの実施形態では、高精度ＯＮＴＧＰＵに基づくベースコーラーでベースコールが実行され、生のＦＡＳＴＡ／ＦＡＳＴＱファイルが生成される。これらの実施形態では、生ファイルは、プロファイルＨＭＭエンジン及び／又はＣＭエンジンによってアラインメントされる。ＨＭＭエンジンは、複数の配列アラインメントをもたらすＨＭＭＥＲソフトウェアプログラムを含む。ＨＭＭＥＲプログラムは、計算網羅的ＣＭエンジンと比較して動作がかなり速いが、いずれのプログラムも、バーコード、標的増幅領域、プライマー、及びアダプターからなる群から選択される１つ又は複数の配列特徴についてヌクレオチドごとのアノテーションを割り当てる。
固有のバーコード配列、アダプター配列及び標的増幅領域についてのアノテーションを含む例示的なアラインメントファイルを図５Ａ－図５Ｂに示す。

本明細書中に記載される方法の多くの実施形態において、フィルタリングは、合格スコア又は不合格スコアを配列アラインメントに割り当てることを含む。配列アラインメントは、参照バーコード化配列のセットに対して最小レーベンシュタイン距離スコアに合格する場合、及びアラインメントの最小ビットスコア閾値を合格する場合、合格スコアが割り当てられる。合格スコアを有する配列アラインメントは、典型的には中央データベースに記憶される。多くの場合、合格スコアを有する配列アラインメントは、試料中の病原体負荷の直接的な定量的表示に対応する。本明細書に記載のデータベースは、一般に、試料コレクションチューブに割り当てられた固有のバーコードの情報、少なくとも９６個の固有のウェルバーコードのセットの情報、少なくとも９６個の固有のプレートバーコードのセットの情報、複数のアンプリコンからの配列データのセットの情報及びレポートを有する。レポートは、各対象のソース識別情報及び対象が標的タンパク質の存在について陽性であるか陰性であるかに関する情報を含む。レポートは、対応する対象、又は診療所若しくは医師に提供することができる。

本明細書に記載される方法の多くの実施形態では、ナノポアシーケンシングのためのライブラリー調製の過程で、複数のアンプリコンを含有する高分子量コンカテマーをもたらす１つ又は複数のライゲーション工程が存在し得る。ナノポア装置は、時には数万ヌクレオチド長まで及び、多くの個々のアンプリコンを含むこれらのコンカテマーを単一の長いリードとして読み取る。シーケンサーはまた、このプールの一部でもある個々のライゲーションされていないアンプリコンを読み取る。ＨＭＭ又はＣＭ統計的モデルを使用して、これらのリードを、個々に分析されるそれらの構成アンプリコン配列へとセグメント化する。本明細書中に記載される方法の多くの実施形態において、プライマー設計は、各プライマーの５’末端に不変アダプター又はスペーサー配列を含む。結果として、各アンプリコン配列は、５’末端において、フォワード鎖プライマーからのスペーサー配列のコピーで始まり、３’末端において、リバース鎖プライマーに由来するスペーサーの逆相補配列を有する。これらのアダプター又はスペーサー配列は２つの目的を果たす。第１に、それらは、長いリードを構成アンプリコン配列にセグメント化するのを助け、第２に、それらは、ＨＭＭ又はＣＭアラインメントにおけるバーコード配列の位置を固定し、バーコード配列の位置を確実にアノテーションすることを可能にする。

アラインメントエンジン（ＨＭＭについてはｈｍｍｅｒ［Ｓ．Ｒ．Ｅｄｄｙ、「ＰｒｏｆｉｌｅＨｉｄｄｅｎＭａｒｋｏｖＭｏｄｅｌｓ」、ＢｉｏｉｎｆｏｒｍａｔｉｃｓＲｅｖｉｅｗ，Ｖｏｌ．１４，ｎｏ９，１９９８，７５５－７６３頁を参照のこと］、又はＣＭについてはＩｎｆｅｒｎａｌ［Ｎａｗｒｏｃｋｉ２００９］に基づく）は、標的の配列及びアノテーションを含むファイルを読み取る。本明細書に記載される方法の例示的な実施形態では、標的は、ＳＡＲＳ－ＣｏＶ－２遺伝子Ｎ及びＥ遺伝子、ヒト遺伝子ＲＮＡｓｅＰ、ベータ－アクチンの様々な領域、並びにバクテリオファージＭＳ２の領域から選択され、かつ／又はＴＭ３は対照として使用される。

特定の実施形態では、統計的パターン分類アルゴリズムは、動的ベイジアンネットワーク、例えば、プロファイル隠れマルコフモデル（プロファイルＨＭＭ）、共分散モデル（ＣＭ）を適用する。
簡潔には、バーコード位置を有する予め定義されたＨＭＭ／ＣＭ遺伝子モデル（１遺伝子＝１ＨＭＭ／ＣＭ）に、モデルごと、ヌクレオチドごとにアノテーションを付けた。ＨＭＭ／ＣＭエンジンは、すべてのリードをモデルに対してアラインメントし、次いで、確率ビットスコアを各アラインメントに割り当て、遺伝子ごとに最小ビットスコアでフィルタリングする。ＨＭＭ／ＣＭエンジンは、配列特徴についてヌクレオチドごとのアノテーションを割り当て、各リード内の正確なバーコード、リンカー、プライマー、及びウイルス遺伝子セグメントの同定及びアノテーションを可能にする。次いで、アラインメントエンジンは、提供されたモデル配列のそれぞれについて内部統計モデルを構築し、次いで、これらのモデルとの一致を求めて実行されたナノポアシーケンシングの全出力を検索する。それによって同定された各候補アラインメントについて、ソフトウェアは、ナノポアリード識別子、一致したＨＭＭ／ＣＭモデル、得られたアラインメント（ギャップ、欠失、置換などを含む）、確率スコア、ビットスコア（確率スコアに関連するが、標的データベース検索サイズとは無関係である）、及び生のナノポア配列リード内のモデル一致の位置を含む他の詳細などを示すレポートを出力する。数十万～数百万のそのようなアラインメント（したがって、候補アンプリコン配列）が、通常の動作で生成される。レポートは、バーコード領域を識別し、アンプリコンバーコードとして所与のアラインメントにおける実際の塩基を抽出するスクリプトのセットと共に読み取られるので、特定の記号（例えば、出力ファイル内の「＞」及び「＜」文字で示される。）によるバーコード領域のアノテーションは重要である。同様のプロセスは、目的のさらなるバーコード又は他の配列特徴に対して行われる。
以下に、ＨＭＭ／ＣＭ用の配列モデルのいくつかの例示的な定義を示す。

示されている例示的なファイルは、Ｓｔｏｃｋｈｏｌｍ形式ファイルであり、ＳＡＲＳ－ＣｏＶ－２遺伝子Ｎ、Ｅ．ヒト遺伝子ＲＮＡｓｅＰ、及び／又は対照として使用されるＴＭ３の様々な領域由来の例示的な標的Ｎｌ＿ｃｄｃ、Ｎ２＿ｃｄｃ、Ｅ－Ｇｕｅｌｐｈ、Ｎ－ＡＭＰＤについての配列及びアノテーションを含む。ボックスで囲まれた領域は、例示的なアノテーションされたスペーサー又はアダプター、バーコード位置、ウイルスプライマー及び鋳型に対応する。一致したコンセンサス「ＳＳ＿ｃｏｎｓ」配列内の「＞」記号は、ＨＭＭ／ＣＭエンジンによって遂行され、バーコードである塩基を容易に識別し、そうでない塩基を無視できるように出力レポート内でアラインメントされる。

図５Ａ及び図５Ｂは、それぞれ、ＳＡＲＳ－ＣｏＶ－２遺伝子Ｎ、Ｅ、ヒト遺伝子ＲＮＡｓｅＰの特定の領域であるＥ－Ｇｕｅｌｐｈ及びＲＮＡｓｅＰについての例示的なアラインメントレポートを示す。図５Ａ及び図５Ｂの各図には、（上から下に向かって）コンセンサス（「モデル」）配列、使用される遺伝子モデル、遺伝子モデルとの一致、ナノポアシーケンサーからの実際のリードデータ（「６７ｆ２１．．」及び「４６２２９．．．」で始まる行）、及びモデル配列（ｍｏｄｅｌ－ｔｏ－ｓｅｑｕｅｎｃｅ）一致の様々な位置（モデル内の位置及びナノポアリード内の位置）を表す積層アラインメントがある。各アラインメントの上部にも与えられるスコアもあり、スコアビット、Ｅ値（ナノポアリードの検索データベースに対するこのアラインメント品質の一致の統計的有意性）などを表すスコアを含む。
このレポートを解析して、ナノポア動作から生じる数十万又は数百万のナノポアリードの各々についてこれらのデータの包括的な集計を生成し、次いで標識された特徴（ここでは、２つのバーコード、すなわち単一のバーコード及びその逆相補体が示されているが、他の任意の数も可能である）を抽出して、それらを中央データベースに保存した。したがって、診断リードを判定するプロセスは、合格する一致アラインメントの総数及びそれらの陽性のバーコード及びそれらの対照をカウントすることにすぎない。陰性患者は、病原体鋳型を欠くので増幅を発生させず、よってそれらのバーコードは、反応化学の調製において鋳型汚染が起こるまれな場合であっても、アンプリコン混合物中に存在しないか、又は実際の陽性と比較して非常に低いレベルで存在し得る。

上に示されたＨＭＭ／ＣＭ用配列モデルの例示的な定義において、各アンプリコン（例えば、Ｎ１＿ｃｄｃ、Ｎ２＿ｃｄｃ、Ｅ－Ｇｕｅｌｐｈ、Ｎ－ＡＭＰＤ、ＲＮＡｓｅＰ、ＴＭ３又はインフルエンザ若しくは他のウイルス遺伝子）のカテゴリーは、アンプリコン配列に最も高いスコアリング一致を与えるＨＭＭ又はＣＭモデルを選択することによって決定された。

不変のアダプター配列又はスペーサー配列が必須であるのは、それらが統計的ＨＭＭモデル又はＣＭモデルのスペーサー領域へのアラインメントを固定し、したがって配列中のバーコードヌクレオチドの明瞭なアノテーションを可能にするからである。配列モデル定義におけるバーコードは、それらの組成が本質的に高度に可変であるので、結局、「Ｎ」又はワイルドカード塩基として列挙される。固定スペーサーは、アライナーが一致を確信的に割り当てることができる領域を与え、次いで、アラインメントが実行される際の反復的な洗練のプロセスによって、バーコード領域が識別され、アノテーションされる。したがって、バーコードはアンプリコンにある程度「内在」するべきである。本明細書に記載のアダプター／スペーサーは約２２ｂｐ長であり、これは可変数であり得る。バーコードがアンプリコン配列の５’末端又は３’末端に直接隣接していることは好ましくない。

２段階バーコード化手順が使用される場合、１つのバーコード及び不変スペーサーは、増幅プロセスにおいて使用されるプライマーによって導入される。バーコードの第２のセット（例えば、段階１のプレートからプールされた試料を追跡するために使用されるバーコード）をアンプリコンの末端にライゲーションする。結果として、不変スペーサー配列は、２つのバーコードの間に位置することになる。これにより、２つのバーコードを互いに直接隣接させることに起因し得るアンビギュイティが回避される。２段階バーコード手順が使用される場合、ＨＭＭ又はＣＭモデルを生成するために使用される配列は、不変スペーサー配列の両側に、配列リードの統計的モデルに対するアラインメントがバーコードの両方のセットに正しくアノテーションを付けるように、アンビギュイティ配列を組み込む。代替案は、使用される第２段階バーコードのそれぞれについてＨＭＭ又はＣＭモデルを作成し、これらのモデルの一方の質を使用して第２段階バーコードの同一性を割り当てることである。

多重シーケンシングのプロファイルを表すための統計モデルの使用は、当業者に公知である。例えば、Ｓ．Ｒ．Ｅｄｄｙ、「ＰｒｏｆｉｌｅＨｉｄｄｅｎＭａｒｋｏｖＭｏｄｅｌｓ」、ＢｉｏｉｎｆｏｒｍａｔｉｃｓＲｅｖｉｅｗ，Ｖｏｌ．１４，ｎｏ９，１９９８，７５５－７６３頁を参照されたい。ＨＭＭＥＲ（ＪａｎｅｌｉａＦａｒｍＲｅｓｅａｒｃｈＣａｍｐｕｓ，Ａｓｈｂｕｍ，Ｖａ．）から入手可能なユーザガイドに従って、ＨＭＭＥＲソフトウェアパッケージを使用して核酸配列を分析した。ＨＭＭＥＲソフトウェアプログラムの出力は、入力配列を特徴付けるプロファイルＨＭＭである。ユーザガイドに記載されているように、プロファイルＨＭＭは、複数の配列アラインメントの統計モデルである。それらは、アラインメントの各カラムがどの程度保存されているか、及び各位置でどの核酸残基が最も生じやすいかに関する位置特異的情報を捕捉する。ＨＭＭＥＲソフトウェアプログラムの出力は、参照バーコード候補に対する最小レーベンシュタイン距離スコアを合格しなければならない二重バーコードを有する配列リードを含む。リードにはまた、最小ビットスコアフィルターでリードごとのアラインメントスコア（予め定義された遺伝子ごと）が割り当てられる。合格リードは、完全な標的配列アノテーション、モデルフィット、ビットスコア、バーコード位置、バーコード距離、及び他のメトリックと共に中央データベースに記憶される。ある特定の実施形態において、コンセンサス配列を決定することは、連続する位置の複数のセットの同定（例えば、異なるセットに対して異なる閾値を使用する）、及び連続する位置の複数のセットのための複数のコンセンサス配列の生成を必要とする。生成された複数のコンセンサス配列は、例えば確率に基づいてランク付けされ、クエリー配列をアラインメント及びスコア付けする前に、プロファイルＨＭＭの確率パラメータを加法的対数オッズスコアに変換することによって確率スコア（例えば、ビットスコア）が与えられ得る（Ｂａｒｒｅｔｔｅｔａｌ．，１９９７を参照のこと）。

本明細書で提供されるほとんどの実施形態では、アルゴリズムはコンピュータ実装方法である。それらの実施形態では、アルゴリズム及び／又は結果（例えば、生成されたコンセンサスバーコード化アンプリコン配列）は、コンピュータ可読媒体に記憶され、かつ／又はスクリーン又は紙の印刷物に表示される。完全な配列情報は、アンプリコンの合格及び不合格のためにＰｏｓｔｇｒｅＳＱＬＡＷＳデータベースに記憶された。
バーコード一致（内側の患者ごとのバーコード及び外側のプレートごとのバーコード）を記憶させて、リードを元のＰＣＲ反応に割り当てた。ＨＭＭ／ＣＭスコア、モデルフィット、及び生のＦＡＳＴＡファイル内の位置を保存した。配列及びアラインメント／一致表で、ＬＩＭＳ情報（プレート、バッチなど）の相互参照が可能になる。特定の態様では、結果をさらに分析して、個人に診断若しくは予後を提供するか、又は医療専門家に疾患の治療に有用な情報を提供する。

ＩＶ．標的核酸を同定するための方法
一態様では、本開示は、少なくとも１つの標的核酸を同定する方法を提供する。方法は、複数の対象から複数の生物学的試料を得る工程、生物学的試料の各々から全核酸を得る工程、複数のアンプリコンを産生するために増幅混合物を使用して複数のポリヌクレオチドを増幅に供する工程、複数のアンプリコンの各々を検出する工程、及び複数のアンプリコンのカテゴリーを決定する工程を含む。

いくつかの実施形態では、複数の対象からの生物学的試料はポリヌクレオチドを含み、すなわち、核酸（例えば、ＤＮＡ又はＲＮＡ）は対象から得られ、本明細書に記載の方法を使用して処理（溶解、増幅、及び／又は精製）され、核酸はシーケンシングされる。核酸は、当技術分野で公知の方法によって得ることができる。一般に、核酸は様々な技術、例えば、内容が参照によりその全体が本明細書に組み込まれるｍａｎｉｔｉｓｅｔａｌ，ｍｏｌｅｃｕｌａｒｃｌｏｎｉｎｇ：ａｇｕｉｄｅｔｏｔｈｅＬａｂｏｒａｔｏｒｙ（ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ），ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒ，Ｎ．Ｙ．，Ｎ．２８０－２８１，（１９８２）に記載されるものによって生物学的試料から抽出することができる。

いくつかの実施形態では、複数の対象からの生物学的試料はＤＮＡのみを含む。他の実施形態では、複数の対象からの生物学的試料はＲＮＡのみを含む。方法の多くの実施形態では、複数の対象からの生物学的試料は、ＤＮＡとＲＮＡとの混合物を含む。複数の対象からの生物学的試料が対象試料（例えば、血液試料）から収集されたＲＮＡ、例えばｍＲＮＡを含む実施形態では、ＲＮＡから逆転写されたｃＤＮＡを得るか、又はＲＮＡからｃＤＮＡを逆転写するさらなる処理工程が必要である。ＤＮＡ／ＲＮＡ抽出のための一般的な方法は当技術分野で周知であり、Ｏｓｅｂｉａ（Ａｕｓｕｂｅｌ）ｅｔａｌ、ＣｕｒｒｅｎｔＰｒｏｔｏｃｏｌｓｏｆＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ、ＪｏｈｎＷｉｌｅｙａｎｄＳｏｎｓ（１９９７）を含む、分子生物学の標準的な教科書に開示されている。パラフィン包埋された組織からＲＮＡを抽出するための方法は、例えば、Ｒｕｐｐ（Ｒｕｐｐ）ａｎｄＲｏｃｋｅｒ（Ｌｏｃｋｅｒ），ｌａｂｏｒａｔｏｒｙｉｎｖｅｓｔｍｅｎｔｓ（ＬａｂＩｎｖｅｓｔ．）５６：Ａ６７（１９８７）、及びＤｅａｎｄｅｒｌｅｙ（ＤｅＡｎｄｒｅｓ）ｅｔａｌ，ＢｉｏＴｅｃｈｎｉｑｕｅｓ１８：４２０４４（１９９５）に開示されている。これらの参考文献のそれぞれの内容は、その全体が参照により本明細書に組み込まれる。特に、ＲＮＡ単離は、Ｑｉａｇｅｎなどの商業的製造業者からの精製キット、緩衝液セット及びプロテアーゼを製造業者の説明書に従って使用して実施することができる。例えば、ＱｉａｇｅｎのＲＮｅａｓｙミニカラムを使用して、培養中の細胞からすべてのＲＮＡを単離することができる。他の市販のＲＮＡ単離キットとしては、ＭＡＳＴＥＲＰＵＲＥＣｏｍｐｌｅｔｅＤＮＡ及びＲＮＡ精製キット（ＭＡＳＴＥＲＰＵＲＥＣｏｍｐｌｅｔｅＤＮＡａｎｄＲＮＡｐｕｒｉｆｉｃａｔｉｏｎＫｉｔ）（ＥＰＩＣＥＮＴＲＥ，Ｍａｄｉｓｏｎ，Ｗｉｓ．）及びパラフィンブロックＲＮＡ単離キット（ＰａｒａｆｆｉｎＢｌｏｃｋＲＮＡＩｓｏｌａｔｉｏｎＫｉｔ）（Ａｍｂｉｏｎ，Ｉｎｃ．））が挙げられる。全ＲＮＡを、ＲＮＡＳｔａｔ－６０（Ｔｅｌ－Ｔｅｓｔ）を使用して組織試料から単離することができる。腫瘍から調製されたＲＮＡは、例えば塩化セシウム密度勾配遠心分離によって単離することができる。ＲＮＡから逆転写されたｃＤＮＡを得るため、又はＲＮＡからｃＤＮＡを逆転写するための方法及びキットは当技術分野で周知であり、例えば米国特許出願第５６４１８６４Ａ号に開示されており、その内容はその全体が本明細書に組み込まれる。

一実施形態では、方法は、生物学的試料の各々から全ＲＮＡを得ること、生物学的試料の各々から全ＲＮＡを逆転写して複数のｃＤＮＡを得ること；フォワードプライマー及びリバースプライマーの固有のセットを使用してｃＤＮＡを増幅することを含み、ここでプライマーは、複数のｃＤＮＡの各々に相補的なヌクレオチドのセットを含む。別の実施形態では、方法は、生物学的試料の各々から全ＤＮＡを得ること；フォワードプライマー及びリバースプライマーの固有のセットを使用してＤＮＡを増幅することを含み、ここでプライマーは、複数のＤＮＡの各々に相補的なヌクレオチドのセットを含む。いくつかの実施形態では、超ハイスループットＰＣＲ自動装置を使用して、核酸試料（例えば、ＤＮＡ及びｃＤＮＡ）を増幅して複数のアンプリコンを産生する。

方法の一実施形態では、複数のポリヌクレオチドを増幅混合物を用いてＰＣＲ増幅に供して、複数のアンプリコンを産生する。方法の一実施形態では、増幅混合物は、複数のプライマー、フォワードプライマー及びリバースプライマーを含む。プライマーは、それらが結合するポリヌクレオチドの各々に相補的なヌクレオチドのセットを含む。一実施形態では、本明細書に記載の方法は、フォワードプライマー及びリバースプライマーの固有のセットを含む増幅混合物を使用したｃＤＮＡの増幅を提供する。プライマーは、複数のｃＤＮＡの各々に相補的なヌクレオチドのセットと、少なくとも１つの固有のヌクレオチドバーコード配列とを含む。プライマー配列は、１１～３５ヌクレオチド長、例えば１５～２５ヌクレオチド長であり得る。本明細書中に記載される方法において使用するための例示的なプライマー配列を、配列番号３～２０に提供する。

いくつかの実施形態では、単一のプライマーを使用して、試料中のすべてのＲＮＡ分子を増幅することができる。例えば、プライマーは、ポリ（ｄＴ）又はランダムな配列で構成されるＲＮＡ補体部分、部分的にランダムな配列、及び／又は２種類以上のヌクレオチドと塩基対を形成することができるヌクレオチドを含むことができる。ｃＤＮＡプライマーのＲＮＡ補体は、任意のＲＮＡ配列をそれが相補的であるもの、例えばすべてのｍＲＮＡ（ポリ（ｄＴ）が使用される場合）又は一般的なすべてのＲＮＡ分子（一般的な配列が使用される場合）にハイブリダイズする。このようにして、試料中のすべてのＲＮＡ分子を逆転写することができる。他の実施形態では、プライマーは、例えば、ランダムな配列で構成されるｃＤＮＡ補体部分、部分的にランダムな配列、及び／又は２種類以上のヌクレオチドと塩基対を形成することができるヌクレオチドを含むことができる。

いくつかの実施形態では、単一のローリングサークル増幅プライマーを使用して、試料中のすべてのＲＮＡ分子を増幅することができる。例えば、ローリングサークルプライマーは、ｃＤＮＡ分子中の多くの配列に対して相補的にする、ランダム配列を有することができる。他の実施形態では、一対のローリングサークル増幅プライマーは、ｃＤＮＡ鋳型中の配列に相補的な相補部分を有することができ、したがってこれらの２つのオリゴヌクレオチドのみによる指数関数的ローリングサークル増幅が可能になる。

いくつかの実施形態では、複数の環状化ｃＤＮＡ分子が鋳型になることができ、次いでローリングサークル増幅によって増幅され得る。ローリングサークル増幅は、それぞれが少なくとも１つの環状化ｃＤＮＡ鋳型に相補的であるプライマーセットによってプライミングすることができる。いくつかの例では、プライマーの相補的部分はｃＤＮＡ配列に相補的であり得る。そのような場合、ローリングサークル増幅プライマーは、１つ又は少数のｃＤＮＡ鋳型に特異的であり得る。ローリングサークル増幅プライマーは、ランダムな配列を有することができる。

一実施形態では、方法は、複数のアンプリコンを得るための標的核酸鋳型のＰＣＲ増幅を含む。本明細書に記載の方法では、標的核酸鋳型は標的増幅領域とも呼ばれる。方法は、標的ｃＤＮＡ鋳型を増幅して複数のアンプリコンを得ることを含む。いくつかの実施形態では、方法は、伸長されていないフォワードプライマー及びリバースプライマー（すなわち、「未使用」プライマー）の固有のセットを複数のアンプリコンから分離することをさらに含む。増幅／伸長される標的核酸を含有する核酸試料は、目的の核酸を含有する任意の試料から当業者に公知の方法によって調製され得る。加えて、ＱＩＡａｍｐＤＮＡｍｉｎｉｋｉｔ、ＱＩＡａｍｐＦＦＰＥＴｉｓｓｕｅｋｉｔ、及びＰＡＸｇｅｎｅＤＮＡｋｉｔを含む、多くの核酸調製用キットが市販されており、使用することができる。例示的な試料には、ヒト由来の試料、例えば、血液、スワブ、体液、又は上記の試料から得られた材料及び画分、又は任意の細胞が含まれるがこれらに限定されない。いくつかの実施形態では、試料は、血液、粘液、唾液、汗、涙、体腔に蓄積する流体、尿、***液、膣分泌物、脳脊髄液、リンパ液、糞便、痰、分解液、嘔吐物、汗、母乳、血清及び血漿からなる群から選択される。特定の実施形態では、試料は唾液である。

標的核酸は、感染、疾患若しくは障害を伴うこと及び／又はそれらを示すことが知られているものである。本明細書に記載の標的核酸又は標的増幅領域は、これらに限定されないが、ＲＮＡウイルス、ＤＮＡウイルス、真菌及び細菌を含む１つ以上の病原体を含む試料から得ることができる。感染、疾患又は障害には、これらに限定されないが、様々なウイルス感染、細菌感染及び他の病原体によって引き起こされる疾患が含まれ得、標的核酸は、ＲＮＡウイルス、ＤＮＡウイルス、真菌及び細菌からなる群から選択される１つ以上の病原体を含む試料から得られる。

本明細書中に記載される方法のいくつかの実施形態において、標的核酸は、アシネトバクター・バウマンニ（Ａｃｉｎｅｔｏｂａｃｔｅｒｂａｕｍａｎｎｉｉ）、アデノウイルス、アフリカ馬疫ウイルス、アフリカ豚コレラウイルス、ズビニ鉤虫（Ａｎｃｌｏｓｔｏｍａｄｕｏｄｅｎａｌｅ）、回虫、黄色アスペルギルス、アスペルギルス・フミガーツス（Ａｓｐｅｒｇｉｌｌｕｓｆｕｍｉｇａｔｕｓ）、アスペルギルス・ニガー（Ａｓｐｅｒｇｉｌｌｕｓｎｉｇｅｒ）、アスペルギルス・オリゼ（Ａｓｐｅｒｇｉｌｌｕｓｏｒｙｚａｅ）、鳥インフルエンザウイルス、炭疽菌、炭疽菌パスツール株、ＢａｃｉｌｌｕｓｃｅｒｅｕｓＢｉｏｖａｒａｎｔｈｒａｃｉｓ、ウシ流産菌、ブルセラ・メリテンシス（Ｂｒｕｃｅｌｌａｍｅｌｉｔｅｎｓｉｓ）、ブルセラ・スイス（Ｂｒｕｃｅｌｌａｓｕｉｓ）、鼻疽菌、類鼻疽菌、カンジダ・アルビカンス（Ｃａｎｄｉｄａａｌｂｉｃａｎｓ）、カンジダ・ドゥブリニエンシス（Ｃａｎｄｉｄａｄｕｂｌｉｎｉｅｎｓｉｓ）、カンジダ・グラブラタ（Ｃａｎｄｉｄａｇｌａｂｒａｔａ）、カンジダ・クルセイ（Ｃａｎｄｉｄａｋｒｕｓｅｉ）、カンジダ・トロピカリス（Ｃａｎｄｉｄａｔｒｏｐｉｃａｌｉｓ）、クラミジア・ニューモニエ（Ｃｈｌａｍｙｄｉａｐｎｅｕｍｏｎｅａｅ）、クラミジア・トラコマチス（Ｃｈｌａｍｙｄｉａｔｒａｃｈｏｍａｔｏｕｓ）、豚熱ウイルス、クロストリジウム・ディフィシール（Ｃｌｏｓｔｒｉｄｉｕｍｄｉｆｆｉｃｉｌｅ）、コクシジオイデス・イミティス（Ｃｏｃｃｉｄｉｏｉｄｅｓｉｍｍｉｔｉｓ）、コクシジオイデス・ポサダシ（Ｃｏｃｃｉｄｉｏｉｄｅｓｐｏｓａｄａｓｉｉ）、ＣｏＶ－２２９Ｅ、ＣｏＶ－ＨＫＵ１、ＣｏＶ－ＮＬ６３、ＣｏＶ－ＯＣ４３、コクサッキーウイルスＡ、コクサッキーウイルスＢ、コクシエラ・バーネッティ（Ｃｏｘｉｅｌｌａｂｕｒｎｅｔｉｉ）、クリミア・コンゴ出血熱、サイトメガロウイルス、デングウイルス、メジナ虫、東部馬脳炎、エボラウイルス、い粒条虫、多包条虫、エンテロバクター・クロアカ、エンテロコッカス・フェシウム（Ｅｎｔｅｒｏｃｏｃｃｕｓｆａｅｃｉｕｍ）、エンテロウイルス、エプスタイン・バール・ウイルス、大腸菌、巨大肝蛭、肝蛭、***ウイルス、野兎病菌、山羊痘ウイルス、ヘモフィルス属インフルエンザ、ヘリコバクターピロリ、ヘンドラウイルス、Ａ型肝炎ウイルス、Ｂ型肝炎ウイルス、Ｃ型肝炎ウイルス、ヒストプラスマ・カプスラーツム（Ｈｉｓｔｏｐｌａｓｍａｃａｐｓｕｌａｔｕｍ）、ズボアジ型ヒストプラスマ症（Ｈｉｓｔｏｐｌａｓｍａｄｕｂｏｉｓｉｉ）、ヒトヘルペスウイルスＨＨＶ６、ヒトヘルペスウイルスＨＨＶ７、ヒトヘルペスウイルスＨＨＶ８、ヒトヘルペスウイルスＨＳＶ１、ヒトヘルペスウイルスＨＳＶ２、ヒト免疫不全ウイルス、ヒトパピローマウイルス、インフルエンザウイルスＡ型、インフルエンザウイルスＢ型、クレブシェラ肺炎桿菌、キャサヌール森林病ウイルス、ラッサ熱ウイルス、レジオネラ・ニューモフィラ菌、リーシュマニア・プロマスティゴート（Ｌｅｉｓｈｍａｎｉａｐｒｏｍａｓｔｉｇｏｔｅｓ）、Ｌｕｊｏウイルス、ランピースキン病ウイルス、マールブルグウイルス、麻疹ウイルス、メチシリン耐性黄色ブドウ球菌、サル痘ウイルス、ムンプスウイルス、マイコバクテリウム・アブセッサス（Ｍｙｃｏｂａｃｔｅｒｉｕｍａｂｓｃｅｓｓｕｓ）、マイコバクテリウム・アビウム（Ｍｙｃｏｂａｃｔｅｒｉｕｍａｖｉｕｍ）、マイコバクテリウム・ボビス（Ｍｙｃｏｂａｃｔｅｒｉｕｍｂｏｖｉｓ）、マイコバクテリウム・カヌッティイ（Ｍｙｃｏｂａｃｔｅｒｉｕｍｃａｎｅｔｔｉｉ）、マイコバクテリウム・レプレ（Ｍｙｃｏｂａｃｔｅｒｉｕｍｌｅｐｒａｅ）、ヒト結核菌、マイコバクテリウム・ウルセランス（Ｍｙｃｏｂａｃｔｅｒｉｕｍｕｌｃｅｒａｎｓ）、マイコプラズマ・カプリコルム（Ｍｙｃｏｐｌａｓｍａｃａｐｒｉｃｏｌｕｍ）、マイコプラズマ・ミコイデス（Ｍｙｃｏｐｌａｓｍａｍｙｃｏｉｄｅｓ）、マイコプラズマ・ニューモニア（Ｍｙｃｏｐｌａｓｍａｐｎｅｕｍｏｎｅａｅ）、アメリカ十二指腸虫、淋病、ニューカッスル病ウイルス、ニパウイルス、ノルカジア属ｂｅｉｊｉｎｇｅｎｓｉｓ、ノルカジア属ｃｙｒｉａｃｉｇｅｏｒｇｉｃａ、ノルカジア属ｆａｒｃｉｎｉｃａ、ノロウイルスＧＩ、ノロウイルスＧＩＩ、ノーウォークウイルス、オムスク出血熱ウイルス、回旋糸状虫、発癌性ヒトパピローマウイルス、パラインフルエンザウイルス、寄生生物、マルネッフェイ型ペニシリウム症（Ｐｅｎｉｃｉｌｌｉｏｓｉｓｍａｍｅｆｆｅｉ）、小反芻獣疫ウイルス、ニューモシスチス・イロベチイ（Ｐｎｅｕｍｏｃｙｓｔｉｓｊｉｒｏｖｅｃｉｉ）、ポリオーマウイルス、プロテウス・ミラビリス（Ｐｒｏｔｅｕｓｍｉｒａｂｉｌｉｓ）、緑膿菌、狂犬病ウイルス、８つの遺伝子断片すべてのコーディング領域の任意の部分を含有する、１９１８年のパンデミックインフルエンザウイルスの再構築された複製コンピテント形態、呼吸器合胞体ウイルス、ライノウイルス、発疹チフスリケッチア、リフトバレー熱ウイルス、牛疫ウイルス、ロタウイルスＡ、ロタウイルスＢ、ロタウイルスＣ、ロタウイルスＧ２、風疹ウイルス、ＳＡＲＳ関連コロナウイルス（ＳＡＲＳ－ＣｏＶ）、ＳＡＲＳ－ＣｏＶ－１、ＳＡＲＳ－ＣｏＶ－２、ビルハルツ住血吸虫、日本住血吸虫、マンソン住血吸虫、羊痘ウイルス、南米出血熱ウイルスチャパレ、南米出血熱ウイルスグアナリト、南米出血熱ウイルスフニン、南米出血熱ウイルスマチュポ、南米出血熱ウイルスサビア、黄色ブドウ球菌、スタフィロコッカス・サプロフィティカス（Ｓｔａｐｈｙｌｏｃｏｃｃｕｓｓａｐｒｏｐｈｙｔｉｃｕｓ）、肺炎レンサ球菌、豚水疱病ウイルス、有鉤条虫、ダニ媒介性脳炎複合（ｆｌａｖｉ）ウイルス極東亜型、ダニ媒介性脳炎複合（ｆｌａｖｉ）ウイルスシベリア亜型、タバコモザイク病ウイルス、トルクテノウイルス、鞭虫、ブルーストリパノソーマ（Ｔｒｙｐａｎｏｓｏｍａｂｒｕｃｅｉ）、トリパノソーマ・クルージ（Ｔｒｙｐａｎｏｓｏｍａｃｒｕｚｉ）、大痘瘡ウイルス（天然痘ウイルス）、小痘瘡ウイルス（アラストリム）、ベネズエラ馬脳炎ウイルス、バンクロフト糸状虫、ペスト菌、及び上記の病原体のいずれか１つと特徴的な核酸配列を共有する病原体、又は前述の群の病原体と特徴的な核酸配列を共有する、別の潜在的に新規若しくは特性決定されていない病原体からなる非限定的な群から選択される１つ以上の病原体を含む試料から得られる。一実施形態では、標的核酸は、ＳＡＲＳ－ＣｏＶ－２を含む唾液試料から得られる。

方法の多くの実施形態では、少なくとも１つの固有のバーコード配列及びその逆相補体がそれぞれフォワードプライマー及びリバースプライマーのそれぞれに導入され、増幅後に各アンプリコンを固有に同定する。フォワード及び／又はリバースプライマーは、バーコード配列と呼ばれる固有のヌクレオチド配列を含む。この配列は、特定の標的核酸を独自に同定する。バーコード配列の長さは、３～２０ヌクレオチド長、例えば５～１５ヌクレオチド長であり得る。本明細書に記載の方法で使用するための非限定的な例示的バーコード配列を表１に提供する。本明細書に記載されるように、表１の例示的配列は、最大レーベンシュタイン距離で分離された３０００＋総バーコード内から選択される。いくつかの実施形態において、最大レーベンシュタイン距離で分離されたバーコード配列の３８４個が選択される。バーコード配列の選択はアルゴリズム的に行われ、選択サイズに応じて異なる結果をもたらす。本明細書で提供される方法及び組成物の実施形態において、選択されるバーコード配列の数は、プライマーが構築されるバーコードプールのサイズに基づく。

いくつかの実施形態では、バーコード配列は完全にランダムであってもよく、すなわち、Ａ、Ｔ、Ｇ、及びＣのいずれか１つがバーコード配列の任意の位置にあってもよい。ランダムバーコードは合成するのに経済的である。他の実施形態では、バーコード配列は、合成的に個別に合成され（例えば、ＴｗｉｓｔＢｉｏ）、それにより、異なるバーコードオリゴが確実にそれぞれ独立して合成される。本明細書中に記載される実施形態において、バーコードは、フォワードプライマー配列及びリバースプライマー配列の一部である。例示的なバーコード化プライマー配列を配列番号１及び２に提供する。例えば、バーコード化一致フォワード及びリバースプライマーのセットは、プライミングされたウイルス配列の５’末端及び３’末端の両方に同じ（又はフォワード／リバース補完された）バーコードを有するバーコード化アンプリコンを生成する。ウイルス配列は、プライマー自体を含む。特定の実施形態では、バーコード配列は、準定義されているか、又は完全に定義されている。
そのような配列を使用することにより、バーコードエラーを軽減することができる。しかしながら、そうすること、特に高度なマルチプレックスＰＣＲにおいて多くの異なるプライマーのために完全に定義されたバーコード配列を使用することは、場合によっては法外に高い費用がかかることがある。

方法のいくつかの実施形態では、第１の固有のバーコード及びその逆相補体並びに本明細書では内側バーコードとも呼ばれるアダプター配列の第１の対は、増幅プロセスで使用されるプライマー（本明細書ではバーコード化プライマーとも呼ばれる）によって導入される。方法のいくつかの実施形態では、第２の固有のバーコード配列及びその逆相補体は、本明細書では外側バーコードとも呼ばれ（例えば、プレート／バッチ識別子）、典型的にはライゲーション反応を用いて、バーコード化アンプリコンに付加される。ライゲーションされた外側バーコードは、第２のＰＣＲ段階に基づく増幅に固有の交差増幅を回避する。ライゲーション（ＤＮＡリガーゼ酵素を使用）工程は、第１のバーコード化アンプリコンの両端に、「外側」バーコードを含有するＤＮＡ断片の第２のセットを付加する。ライゲーションにより、バーコードのコンビナトリアルアセンブリが可能になり、大規模マルチプレックス（例えば、３８４の内側バーコード×３８４の外側バーコード＝１４７４５６の固有の二重バーコード化アンプリコン）が可能になる。内側バーコードは、いくつかの事例では、少なくとも９６ウェルを有するプレート内の複数の別個の試料からの特定の試料にアノテーションを付けるための、患者又はウェル固有のバーコードである。外側バーコードは、特定のバッチを示すことができ、又はプレートの複数のバッチを有する別個のプレートに複数の別個の試料がある場合、プレート識別子とすることができる。バーコード配列及びプライマーは、二次構造相互作用についてスクリーニングされた非常に大きな検証済みＩＤＴバーコードライブラリーから選択され、高度に最適化されたエラー耐性バーコード設計をもたらす。

バーコード化プライマーの伸長は、核酸試料中のすべてのプライマー及び標的核酸を反応緩衝液中のＤＮＡポリメラーゼと組み合わせることによって実施され得る。好ましくは、バーコード化プライマーによる標的核酸へのアニーリング及び／又はバーコード化プライマーの伸長を、高温、例えば５０℃～７５℃、例えば５５℃、６０℃、６５℃、７０℃又は７２℃で行って、標的核酸とバーコード化プライマーとの間のアニーリング特異性を高める。核酸試料中の標的核酸は、典型的には、バーコード化プライマーでアニーリングする前に、例えば高温（例えば、９５℃又は９８℃）でインキュベートすることによって最初に変性される。標的核酸の変性、プライマーアニーリング及びプライマー伸長は、サーマルサイクラーで行われ得る。

ホットスタートＤＮＡポリメラーゼが使用される特定の実施形態では、ＤＮＡポリメラーゼ活性化は、サーマルサイクラーでの標的核酸変性と同時に行うこともできる。好ましくは、バーコード化プライマー伸長に使用されるＤＮＡポリメラーゼは熱安定性である。例示的なＤＮＡポリメラーゼとしては、Ｔａｑポリメラーゼ（Ｔｈｅｒｍｕｓａｑｕａｔｉｃｕｓ製）、Ｔｆｉポリメラーゼ（Ｔｈｅｒｍｕｓｆｉｌｉｆｏｒｍｉｓ製）、Ｂｓｔポリメラーゼ（Ｂａｃｉｌｌｕｓｓｔｅａｒｏｔｈｅｒｍｏｐｈｉｌｕｓ製）、Ｐｆｕポリメラーゼ（Ｐｙｒｏｃｏｃｃｕｓｆｕｒｉｏｓｕｓ製）、Ｔｔｈポリメラーゼ（Ｔｈｅｒｍｕｓｔｈｅｒｍｏｐｈｉｌｕｓ製）、Ｐｏｗポリメラーゼ（Ｐｙｒｏｃｏｃｃｕｓｗｏｅｓｅｉ製）、Ｔｌｉポリメラーゼ（Ｔｈｅｒｍｏｃｏｃｃｕｓｌｉｔｏｒａｌｉｓ製）、Ｕｌｔｉｍａポリメラーゼ（Ｔｈｅｒｍｏｔｏｇａｍａｒｉｔｉｍａ製）、ＫＯＤポリメラーゼ（ＫＯＤホットスタートポリメラーゼ（ＥＭＤＢｉｏｓｃｉｅｎｃｅｓ製）、ＤｅｅｐＶｅｎｔ（商標）ＤＮＡポリメラーゼ（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ製）、Ｐｌａｔｉｎｕｍ（商標）ＴａｑＤＮＡＰｏｌｙｍｅｒａｓｅＨｉｇｈＦｉｄｅｌｉｔｙ（Ｉｎｖｉｔｒｏｇｅｎ製）が挙げられる。

方法のいくつかの実施形態では、フォワードプライマー及びリバースプライマーは、アダプター配列の１つ以上の対を含む。他の実施形態では、アダプター配列は、プライミングされた標的増幅領域配列の５’末端及び３’末端の両方にあるバーコード配列にライゲーションされる。本明細書中に記載される実施形態の多くにおいて、アダプター配列はスペーサー配列の機能を提供する。いくつかの例において、アダプター配列は配列読み取り中にマーカーとして作用して、バーコード配列の末端及び／又は次のバーコード配列の開始をシグナル伝達する。本明細書に記載されるいくつかの実施形態では、アダプター配列はユニバーサル配列を含み得る。特定の実施形態において、アダプター配列は保存された配列である。方法のいくつかの実施形態において、アダプター配列は少なくとも１０ヌクレオチドを含む。方法のいくつかの他の実施形態において、アダプター配列は１０～１５ヌクレオチドを含む。方法の一実施形態において、アダプター配列は１０ヌクレオチドを含む。非限定的な例示的アダプター配列は、配列番号２１及び２２に提供されている。本明細書に記載される方法のいくつかの実施形態では、第１の固有のバーコード配列及びその逆相補体を用いた単一段階バーコード化が使用される。そのような実施形態では、第１の固有のバーコード及びその逆相補体並びにアダプター配列の第１の対は、増幅プロセスで使用されるプライマーによって導入される。本明細書に記載される方法の他の実施形態では、第１の固有のバーコード配列及びその逆相補体、並びに第２の固有のバーコード配列及びその逆相補体を用いる２段階バーコード化が使用される。そのような実施形態では、１つのバーコード（例えば、第１の固有のバーコード配列）及びアダプター配列（例えば、アダプター配列の第１の対）は、増幅プロセスで使用されるプライマーによって導入される。バーコードの第２のセット（例えば、段階１のプレートからプールされた試料を追跡するために使用されるバーコード、第２の固有のバーコード配列）をアンプリコンの末端にライゲーションする。結果として、不変アダプター配列は、２つのバーコードの間に位置することになる。他のアダプター配列を生成し、本開示の範囲内に含めることができる。

プライマーのユニバーサルプライマー配列は、さらなる増幅に使用され得る配列である。いくつか様々な増幅戦略が当業者に知られている。すべての増幅技術は開始についてプライマーに依存しており、このプライマーはバーコードを組み込むように操作することができる。好ましくは、この配列は、核酸試料中の目的の標的核酸又は他の核酸と有意な相同性を有さない（すなわち、その全長にわたって５０％未満の配列同一性を有する）。上述のように、複数のプライマーを使用して、異なる標的核酸に異なるバーコードを割り当てる。いくつかの実施形態では、標的核酸は単一の病原体に由来するが、他の実施形態では、標的核酸は少なくとも２つの異なる病原体に由来する。複数のプライマーのうち、ユニバーサルプライマー配列は同一であり得るが、プライマーの標的特異的配列（すなわち、標的ヌクレオチド配列に相補的な配列）は異なる。異なるプライマーの配列における同じユニバーサル配列は、単一のプライマーを使用したアンプリコンのその後の増幅を可能にする。

本明細書中に記載される方法のいくつかの実施形態において、５’アダプター領域配列及び／又は試料識別領域（例えば、固有のバーコードヌクレオチド配列）が、例えば、逆転写中に、単一の試料に由来するすべてのｃＤＮＡに付加される。いくつかの態様では、３’特異的プライマーを使用して、単一試料中の任意のポリヌクレオチドを増幅することができる。いくつかの態様では、５’可変領域、例えばウイルス粒子からの一本鎖ＲＮＡを有するポリヌクレオチドが増幅され、複数の縮重した５’プライマーが目的の特定の領域を増幅する必要はない。プライマーはまた、ＩｇＧ、ＩｇＭ、ＩｇＤ、ＩｇＡ、ＩｇＥ、ＴＣＲ鎖、及び他の目的の遺伝子に特異的であり得る。

いくつかの実施形態では、アダプター領域は、２、３、４、５、６、７、８、９、１０又はそれ以上のＧを含む。いくつかの態様では、ｃＤＮＡは、その３’末端に１、２、３、４、５、６、７、８、９、１０又はそれ以上のＣを含む。いくつかの実施形態において、アダプター領域は、ｃＤＮＡの５’末端に結合する。他の実施形態において、アダプター領域は、ｃＤＮＡの３’末端に結合する。さらに別の実施形態において、アダプター領域は、ｃＤＮＡの５’及び３’末端に結合する。アダプター領域を結合する方法は、これらに限定されないが、５’隣接アダプター領域配列を有するプライマーを用いたＰＣＲの実施、粘着性及び平滑末端のライゲーション、ヌクレオチドの鋳型スイッチング介在付加、又はポリヌクレオチドを、ヌクレオチドの５’末端、３’末端若しくは５’末端及び３’末端に共有結合的に付着させる他の方法を含む、種々の方法が存在する。これらの方法は、分子生物学で一般的に使用される酵素の特性を利用することができる。ＰＣＲは、例えば、好熱性ＤＮＡポリメラーゼを使用することができる。相補的又は実質的に相補的な粘着性末端は、オーバーハングした末端を残す制限酵素でのｄｓＤＮＡ切断によって、又はＴｄＴ（末端トランスフェラーゼ）などの酵素の３’テーリング活性によって生成される。次いで、Ｔ４リガーゼなどのリガーゼを使用して、粘着性末端及び平滑末端を相補的アダプター領域とライゲーションすることができる。アダプターを平滑末端核酸にライゲーションする方法は当技術分野で公知であり、本明細書で提供されるＰＣＲの増幅産物からシーケンシングライブラリーを生成する際に使用され得る。例示的な方法には、ＳａｍｂｒｏｏｋＪａｎｄＲｕｓｓｅｌｌＤＷ，ｅｄｉｔｏｒｓ．（２００１）ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ．３ｒｄｅｄ．ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒ，ＮＹ：ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙ，ＱＩＡＧＥＮＧＥＮＥＲＥＡＤ（商標）ＬｉｂｒａｒｙＰｒｅｐ（Ｌ）Ｈａｎｄｂｏｏｋ、及び米国特許出願公開第２０１０／０１９７５０９号、２０１３／０００５６１３号に記載されるものが含まれる。一実施形態では、本明細書に記載の方法は、場合により、複数の増幅プライマーを使用したｃＤＮＡの増幅を提供する。

本明細書中に記載される方法の一実施形態において、固有のバーコード化プライマーの数は、少なくとも５０、少なくとも１００、少なくとも３００、少なくとも５００、少なくとも７５０又は少なくとも１０００である。単一の反応におけるそのような固有のバーコード化プライマーを使用すると、比較的多数の標的核酸の分析、例えば複数の試料からのポリヌクレオチドの並行シーケンシング分析が可能になる。個々の標的核酸又はアンプリコンについて、バーコード化プライマーがＤＮＡのプラススタンド又はマイナススタンドにアニーリングするかどうかをランダムに選択することができる。例えば、同じ個体からの異なるウイルス標的を多重化する場合、多重化は２程度と少なくても、又は１０００程度と多くてもよい。

一実施形態では、本明細書に記載の方法は、場合によりアンプリコンから未使用のプライマー（すなわち、伸長されていないバーコード化プライマー）を分離する工程を含む。未使用のプライマーの除去は、「バーコードリサンプリング」問題、すなわち同じＤＮＡ鋳型が複数の分子バーコードに関連するリスクを最小限に抑える。そのような問題は、分子バーコード化の利益を無効にするであろう。未使用のプライマーの分離は、サイズ選択精製によって行うことができる。アンプリコンは、ビーズ又はシリカカラムベースのサイズ選択システム、例えばＡｇｅｎｃｏｕｒｔＡＭＰｕｒｅＸＰシステム及びＧｅｎｅＲｅａｄＳｉｚｅＳｅｌｅｃｔｉｏｎシステムを使用して非伸長プライマーから精製され得る。必要に応じて、そのようなシステムによる２回以上の精製を使用することができる。あるいは、エキソヌクレアーゼ酵素（例えば、ＴｈｅｒｍｏＦｉｓｈｅｒ製ＥｘｏＳＡＰ－ＩＴ（商標））による一本鎖ＤＮＡクリーンアップ工程を本明細書に記載の方法に組み込むことができる。「バーコードリサンプリング」の問題を回避する１つのさらなる方法は、２つのＰＣＲ工程は実施しないが、１つのＰＣＲ工程を実施して第１のプライマーを作製し、次いで第２の外側バーコードをライゲーションすることである（増幅なし）。１つの実施形態において、本明細書中に記載される方法は、アンプリコンのさらなる増幅をさらに含み得る。さらなる増幅は、上記のユニバーサルプライマーの対の存在下で行うことができる。

本明細書に記載の方法は、複数のアンプリコンのそれぞれについての検出工程を含む。多くの実施形態において、検出は、アンプリコンのそれぞれにおける固有のバーコードの配列を読み取ることによって行われる。方法のいくつかの実施形態では、少なくとも１つの陽性対照試料をシーケンシングし、ここで陽性対照試料は標的核酸を含む。本明細書に記載される方法の実施形態では、ハイスループットシーケンシングを使用して、アンプリコン中の固有のバーコードを検出する。当技術分野で公知の任意のハイスループットシーケンシングプラットフォームを使用して、本明細書に記載のように調製されたシーケンシングライブラリーをシーケンシングすることができる（Ｍｙｌｌｙｋａｎｇａｓｅｔａｌ．，Ｂｉｏｉｎｆｏｒｍａｔｉｃｓｆｏｒ・ＨｉｇｈＴｈｒｏｕｇｈｐｕｔＳｅｑｕｅｎｃｉｎｇ，Ｒｏｄｒｉｇｕｅｚ－Ｅｚｐｅｌｅｔａｅｔａｌ．（ｅｄｓ．），ＳｐｒｉｎｇｅｒＳｃｉｅｎｃｅ＋ＢｕｓｉｎｅｓｓＭｅｄｉａ，ＬＬＣ，２０１２，１１－２５頁を参照）。例示的なハイスループットＤＮＡシーケンシングシステムは、オックスフォードナノポアプラットフォーム（ＭｉｎｌＯＮ及びＰｒｏｍｅｔｈｌＯＮ機器を含む）、４５４ＬｉｆｅＳｃｉｅｎｃｅｓによって最初に開発され、後にＲｏｃｈｅ（Ｂａｓｅｌ，Ｓｗｉｔｚｅｒｌａｎｄ）によって取得されたＧＳＦＬＸシーケンシングシステム、Ｓｏｌｅｘａによって開発され、後にｌｌｌｕｍｉｎａＩｎｃ．（ＳａｎＤｉｅｇｏ，ＣＡ）によって取得されたＧｅｎｏｍｅＡｎａｌｙｚｅｒ（Ｂｅｎｔｌｅｙ，ＣｕｒｒＯｐｉｎＧｅｎｅｔＤｅｖ１６：５４５－５２，２００６；Ｂｅｎｔｌｅｙｅｔａｌ．，Ｎａｔｕｒｅ４５６：５３－５９，２００８を参照）、ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ（ＦｏｓｔｅｒＣｉｔｙ，ＣＡ）によるＳＯＬｉＤ配列システム（Ｓｍｉｔｈｅｔａｌ．，ＮｕｃｌｅｉｃＡｃｉｄＲｅｓ３８：ｅ１４２，２０１０；Ｖａｌｏｕｅｖｅｔａｌ．，ＧｅｎｏｍｅＲｅｓ１８：１０５１－６３，２００８を参照）、ＣｏｍｐｌｅｔｅＧｅｎｏｍｉｃｓによって開発され、ＢＧＩによって取得されたＣＧＡ（Ｄｒｍａｎａｃｅｔａｌ．，Ｓｃｉｅｎｃｅ３２７：７８－８１，２０１０を参照）、ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓ（ＭｅｎｌｏＰａｒｋ，ＣＡ）によって開発されたＰａｃＢｉｏＲＳシーケンシング技術（Ｅｉｄｅｔａｌ．，Ｓｃｉｅｎｃｅ３２３：１３３－８，２００９を参照）、及びＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓＣｏｒｐｏｒａｔｉｏｎによって開発されたＩｏｎＴｏｒｒｅｎｔ（米国特許出願公開第２００９／００２６０８２号；２０１０／０１３７１４３号；及び２０１０／０２８２６１７号を参照）を含むが、これらに限定されない。本明細書に記載の方法で使用されるオックスフォードナノポアＤＮＡシーケンシングシステムは、通常に長さが２５０ｂｐ超えるアンプリコンを迅速かつ正確に読み取るのにより適している。Ｉｌｌｕｍｉｎａシーケンシングシステムは、比較的短いリードをもたらす、長い処理時間及び合成によるシーケンシングのため、オックスフォードナノポアＤＮＡシーケンシングシステムと比較して本明細書に記載の方法に適していない可能性がある。

方法のいくつかの実施形態において、検出することは、アダプター配列の対並びに第１の固有のバーコード配列及びその逆相補体を含む複数のアンプリコンの各々をシーケンシングすることを含む。方法の他の実施形態において、検出することは、アダプター配列の対、第１の固有のバーコード配列及びその逆相補体、並びに第２の固有のバーコード配列及びその逆相補体を含む複数のアンプリコンの各々をシーケンシングすることを含む。多くの実施形態において、検出することは、ソフトウェアプログラムでシーケンシングデータファイルを読み取ることによって行われる。シーケンシングデータファイルは、ＦＡＳＴＡ／ＦＡＳＴＱフォーマットであるか、又はＳｔｏｃｋｈｏｌｍフォーマットである。

いくつかの実施形態では、方法は、１つの標的核酸を同定する。いくつかの実施形態では、方法は、同じ病原体から２つ以上の標的核酸を同定する。いくつかの実施形態では、方法は、同じタイプの２つの異なる病原体（例えば、ウイルス性病原体）から２つ以上の標的核酸を同定する。いくつかの実施形態では、方法は、異なるタイプの２つの異なる病原体（例えば、ウイルス性及び細菌性病原体）から２つ以上の標的核酸を同定する。多くの実施形態では、方法は、複数のアンプリコンのカテゴリーを決定する工程を含む。本明細書中に記載される方法における重要な工程は、アンプリコンインサートの配列分析である。方法の多くの実施形態では、所与の試料について、同一のバーコードが陽性対照について、及び試験されている複数の目的の標的核酸のそれぞれについて使用される。アンプリコンがカウントされる場合、アンプリコンをどのように分類及びカウントするかを決定するのはインサートの配列（例えば、標的増幅領域）である。例えば、標的増幅領域配列がアンプリコンに存在する場合、アンプリコンはヒットとして分類され、カウントされる。標的増幅領域配列がアンプリコンに存在しない場合、それは対照として分類及びカウントされ得る。したがって、インサートの配列（例えば、標的増幅領域）は、病原性決定因子の配列変異体を認識し、新規変異体を、それらの存在に関する事前の知識を有することなく発見する手段でもある。本明細書に記載される方法の多くの実施形態では、標的増幅領域由来のポリヌクレオチドを含む複数のアンプリコンのそれぞれのカテゴリーを決定することは、対応する対象が標的核酸を有することを示す。

いくつかの実施形態では、本明細書に記載の方法は、少なくとも９６ウェル、少なくとも３８４ウェル、少なくとも１５３６ウェル、又はそれ以上のウェルを有するプレート内の複数の別個の試料に適用される。さらなる態様では、本明細書に記載の方法は、それぞれ少なくとも９６ウェルを有する少なくとも１、２、３、４、５、６、７、８、１０、１５、２０、３０、３８４又はそれ以上のプレート中の別個の試料に適用される。他の態様では、本明細書に記載の方法は、それぞれ少なくとも３８４ウェルを有する少なくとも１、２、３、４、５、６、７、８、１０、１５、２０、３０、３８４又はそれ以上のプレート中の別個の試料に適用される。

Ｖ．核酸試料中の配列変異体を検出する方法
本明細書に記載の方法は、核酸試料中の１つ以上の配列変異体を検出することができる。配列変異体は、参照配列（例えば、健康なヒト由来の核酸試料、又はＳＡＲＳ－Ｃｏｖ－２感染を有することが疑われる患者由来の核酸試料も）に対する任意の変異であり得る。配列変異は、単一のヌクレオチド又は複数のヌクレオチド（例えば、２、３、４、５、６、７、８、９、１０又はそれ以上のヌクレオチド）の突然変異、挿入又は欠失からなり得る。配列変異体が２つ以上のヌクレオチドの相違を含む場合、相違するヌクレオチドは互いに連続していても不連続であってもよい。配列変異体の型の非限定的な例としては、ゲノムに生じるランダム変異、一塩基多型（ＳＮＰ）、欠失／挿入多型（ＤＩＰ）、レトロトランスポゾンに基づく挿入多型、及び配列特異的増幅多型が挙げられる。本明細書で使用される方法は、任意の配列変異体を検出することができる。例えば、ポリヌクレオチド配列中の点変異を検出するための開示は、インデル又は欠失の検出にも適用可能であり得る。

本明細書で提供される方法を使用して、生物学的試料から得られた核酸試料から配列変異体を検出する。いくつかの実施形態では、得られた情報を使用して、対象から得られた核酸試料中に存在する突然変異を同定することができる。

試料由来のポリヌクレオチドは、これらに限定されないが、ＤＮＡ、ＲＮＡ、リボソームＲＮＡ（ｒＲＮＡ）、転移ＲＮＡ（ｔＲＮＡ）、マイクロＲＮＡ（ｍｉＲＮＡ）、メッセンジャーＲＮＡ（ｍＲＮＡ）、これらのいずれかの断片、又はこれらのいずれか２つ以上の組み合わせを含む、様々なポリヌクレオチドのいずれかであり得る。いくつかの実施形態では、試料はＤＮＡを含む。いくつかの実施形態では、試料はゲノムＤＮＡを含む。いくつかの実施形態では、試料は、プラスミドＤＮＡ、細菌人工染色体、オリゴヌクレオチドタグ、又はそれらの組み合わせを含む。いくつかの実施形態では、試料は、増幅、例えば、これらに限定されないが、ポリメラーゼ連鎖反応（ＰＣＲ）、逆転写、及びそれらの組み合わせを含む、プライマーとＤＮＡポリメラーゼとの任意の適切な組み合わせを使用したプライマー伸長反応によって生成されたＤＮＡを含む。いくつかの実施形態では、試料はＲＮＡを含む。いくつかの実施形態では、試料はＲＮＡ、例えば、対象試料（例えば、血液試料）から収集されたｍＲＮＡを含むことができる。ＲＮＡ抽出のための一般的な方法は、当技術分野で周知である。特に、ＲＮＡ単離は、Ｑｉａｇｅｎなどの商業的製造業者からの精製キット、緩衝液セット及びプロテアーゼを製造業者の説明書に従って使用して実施することができる。プライマー伸長反応用の鋳型がＲＮＡである場合、逆転写の産物は相補的ＤＮＡ（ｃＤＮＡ）と呼ばれる。いくつかの実施形態では、試料はＤＮＡ及びＲＮＡの混合物を含む。ＤＮＡとＲＮＡとの混合物を含む試料の場合（例えば、同時感染では）、逆転写酵素（ＲＴ）はＤＮＡ分子に付加され、ＤＮＡ分子に対して不活性であり、ＲＮＡ分子に逆転写する。いくつかの実施形態では、試料、すなわち、核酸（例えば、ＤＮＡ又はＲＮＡ）は対象から得られ、本明細書に記載の方法を使用して処理（溶解、増幅、及び／又は精製）され、核酸はシーケンシングされる。

本開示の一態様は、核酸試料中の配列変異体を検出する方法に関する。第１の工程は、増幅混合物を用いて核酸の試料と増幅反応を行い、複数のアンプリコンを産生することを含む。核酸の試料は、感染の決定因子である標的核酸を有すると疑われる複数の対象から得られた複数のポリヌクレオチドを含む。本明細書に記載される多くの実施形態では、標的核酸は、本明細書では標的増幅領域と呼ばれる病原体のゲノム領域内に含まれる。本明細書に記載される実施形態では、増幅混合物は、複数のプライマー、少なくとも１つの固有のバーコード配列（例えば、第１の固有のバーコード配列及びその逆相補体）、及び少なくとも１つのアダプター配列の対を含む。いくつかの実施形態において、複数のプライマーの各々は、標的増幅領域中のヌクレオチドに相補的なヌクレオチドのセットを含む。固有のバーコード配列は、特定の対象から得られた生物学的試料を同定する。アダプター配列の対は、多くの場合、プライマーをブロックして、複数のアンプリコンのそれぞれに第２の固有のバーコード配列を付加することを可能にする。いくつかの実施形態において、核酸の試料はＲＮＡ分子を含み、第１の工程は、増幅反応を行う前にＲＮＡから逆転写されたｃＤＮＡを得ること、又はＲＮＡからｃＤＮＡを逆転写することをさらに含む。

配列変異を検出する方法の第２の工程は、複数のアンプリコンを検出すること、及び場合により定量することを含む。方法の多くの実施形態では、検出工程は、単一の機器上で複数のアンプリコンの実質的に同一のコピーの核酸配列を並行して決定することを含む。本明細書に記載される方法の実施形態では、ハイスループットシーケンシングを使用して、アンプリコン中の固有のバーコードを検出する。当技術分野で公知の任意のハイスループットシーケンシングプラットフォームを使用して、本明細書に記載されるように調製されたシーケンシングライブラリーをシーケンシングすることができる。例示的なハイスループットシーケンシングシステムは、オックスフォードナノポアプラットフォーム（ＭｉｎｌＯＮ及びＰｒｏｍｅｔｈｌＯＮ機器を含む）、４５４ＬｉｆｅＳｃｉｅｎｃｅｓによって最初に開発され、後にＲｏｃｈｅ（Ｂａｓｅｌ，Ｓｗｉｔｚｅｒｌａｎｄ）によって取得されたＧＳＦＬＸシーケンシングシステム、Ｓｏｌｅｘａによって開発され、後にｌｌｌｕｍｉｎａＩｎｃ．（ＳａｎＤｉｅｇｏ，ＣＡ）によって取得されたＧｅｎｏｍｅＡｎａｌｙｚｅｒ、ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ（ＦｏｓｔｅｒＣｉｔｙ，ＣＡ）によるＳＯＬｉＤ配列システム、ＣｏｍｐｌｅｔｅＧｅｎｏｍｉｃｓによって開発され、ＢＧＩによって取得されたＣＧＡ、ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓ（ＭｅｎｌｏＰａｒｋ，ＣＡ）によって開発されたＰａｃＢｉｏＲＳシーケンシング技術、及びＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓＣｏｒｐｏｒａｔｉｏｎによって開発されたＩｏｎＴｏｒｒｅｎｔを含むがこれらに限定されない。本明細書に記載の方法で使用されるオックスフォードナノポアＤＮＡシーケンシングシステムは、通常に長さが２５０ｂｐ超えるアンプリコンを迅速かつ正確に読み取るのにより適している。

本方法の第３の工程は、複数のアンプリコンのカテゴリーを決定する工程を含む。前述のように、これはアンプリコンインサートの配列分析に向けられた重要な工程である。アンプリコンがカウントされる場合、アンプリコンをどのように分類及びカウントするかを決定するのはインサートの配列（例えば、標的増幅領域）である。インサートの配列（例えば、標的増幅領域）は、病原性決定因子の配列変異体を認識し、新規変異体を、それらの存在に関する事前の知識を有することなく発見する手段である。本明細書に記載される方法の多くの実施形態では、標的増幅領域由来のポリヌクレオチドを含む複数のアンプリコンのそれぞれのカテゴリーを決定することは、対応する対象が標的核酸の特定の変異体を有することを示す。

本方法の第４の工程は、配列変異の検出に関する。配列変異体は、複数のアンプリコンに対してシーケンシング反応を同時に実行して、配列変異体（例えば、ウイルスゲノムに対応する標的増幅領域における点変異）に対応する複数の核酸配列を決定することによる、本明細書に記載の方法において検出される。複数の配列アラインメントを行うための、シーケンシングデータを使用する様々なシーケンシング方法及びアルゴリズムは当技術分野で公知であり、本明細書に記載されている。当技術分野で公知の任意のハイスループットシーケンシングプラットフォームを使用して、本明細書に記載されるように調製されたシーケンシングライブラリーをシーケンシングすることができる。例示的なハイスループットＤＮＡシーケンシングシステムとしては、限定されないが、ＭｉｎｌＯＮ及びＰｒｏｍｅｔｈｌＯＮ機器を含むオックスフォードナノポアプラットフォーム、ＧＳＦＬＸシーケンシングシステム、ＧｅｎｏｍｅＡｎａｌｙｚｅｒ、ＳＯＬＩＤ配列システム、ＣＧＡ、ＰａｃＢｉｏＲＳシーケンシング技術及びＩｏｎＴｏｒｒｅｎｔが挙げられる。本明細書に記載の方法で使用されるオックスフォードナノポアＤＮＡシーケンシングシステム（例えば、ＯＮＴＭｉｎｌＯＮ又はＧｒｉｄｌＯＮ）は、通常に長さが２５０ｂｐ超えるアンプリコンを迅速かつ正確に読み取るのにより適している。

配列比較のために、典型的には、１つの配列が参照配列として機能し、それと試験配列が比較される。配列比較アルゴリズムを使用する場合、試験配列及び参照配列をコンピュータに入力し、必要に応じてサブシーケンス座標を指定し、配列アルゴリズムプログラムパラメータを指定する。デフォルトのプログラムパラメータを使用することも、代替パラメータを指定することもできる。次いで、配列比較アルゴリズムは、プログラムパラメータに基づいて、参照配列に対する試験配列の配列同一性パーセントを計算する。比較のための配列のアラインメント方法は、当技術分野で周知である。比較のための配列の最適なアラインメントは、例えば、Ｓｍｉｔｈ－Ｗａｔｅｒｍａｎの局地的相同性アルゴリズム、（１９７０）Ａｄｖ．Ａｐｐｌ．Ｍａｔｈ．２：４８２ｃによって、Ｎｅｅｄｌｅｍａｎ－Ｗｕｎｓｃｈの相同性アラインメントアルゴリズム、（１９７０）Ｊ．Ｍｏｌ．Ｂｉｏｌ．４８：４４３によって、Ｐｅａｒｓｏｎ－Ｌｉｐｍａｎの類似性探索法、（１９８８）Ｐｒｏｃ．Ｎａｔ’ｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ８５：２４４４によって、これらのアルゴリズムをコンピュータ化することによって（ＧＡＰ、ＢＥＳＴＦＩＴ、ＦＡＳＴＡ、及びＴＦＡＳＴＡ（ｔｈｅＷｉｓｃｏｎｓｉｎＧｅｎｅｔｉｃｓＳｏｆｔｗａｒｅＰａｃｋａｇｅ，ＧｅｎｅｔｉｃｓＣｏｍｐｕｔｅｒＧｒｏｕｐ，５７５ＳｃｉｅｎｃｅＤｒ．，Ｍａｄｉｓｏｎ，Ｗｉｓ．））、又は手動アラインメント及び目視検査によって（例えば、Ｂｒｅｎｔｅｔａｌ．，（２００３）ＣｕｒｒｅｎｔＰｒｏｔｏｃｏｌｓｉｎＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙを参照されたい）、実施され得る。方法のいくつかの実施形態では、プールされたライブラリー調製物からのＰＣＲアンプリコンをＯＮＴＭｉｎｌＯＮ又はＧｒｉｄｌＯＮでシーケンシングして、生のＯＮＴＦＡＳＴＳシーケンシング出力ファイルを得た。これらの実施形態では、出力ファイルを高精度ＯＮＴＧＰＵに基づくベースコーラーに供して、生のＦＡＳＴＡ／ＦＡＳＴＱファイル又はＳｔｏｃｋｈｏｌｍフォーマットファイルを得た。生のファイルをＨＭＭＥＲ３及びＣＭ配列アラインメント及びアノテーションエンジンで実行した。ＨＭＭ／ＣＭエンジンは、統計的パターン分類アルゴリズムを適用して、ａ）複製配列リードに基づいて尤度を最大化すること、及び／又はｂ）全ゲノム多重配列アラインメントに基づいて文脈依存アラインメントモデルパラメータを使用することによってコンセンサス配列を生成する。

ＳＡＲＳ－ＣｏＶ－２を有すると疑われる患者から得られた試料における配列変異を決定するための非限定的な例示的ワークフローは、シーケンサーがライゲーションされていない個々のアンプリコンを読み取ることから始まる。多くの場合、陽性試料から１００～１０^５の深度カバレッジが得られる。ＨＭＭ又はＣＭ統計的モデルを使用して、これらのリードを、個々に分析されるそれらの構成アンプリコン配列へとセグメント化する。ＨＭＭはアンプリコン特徴をアラインメントし、アノテーションする。次に、患者／バッチＩＤを、バーコード領域を逆多重化することによって取得する。介在領域上でＨＭＭ又はＣＭソフトウェアを使用して複数の配列アラインメントを行い、高精度コンセンサス配列を得る。次いで、配列アラインメントをＧｅｎｂａｎｋ／ＧＩＳＡＩＤＳＡＲＳ－ＣｏＶ－２参照にマッピングする。アラインメントは、予め定義された目的のＳＺＲＢＤタンパク質参照残基を試料由来の配列と比較して、新規変異体残基を記録する。新規変異体の記録を、集中化変異体監視データベースに提出すること、及び／又は抗体／ワクチン回避リスクのアノテーション付きの各患者の最終レポートと共に提供することができる。

シーケンシング後、配列変異体が生じる頻度はまた、異なる対象集団から得られた複数の核酸試料からの配列を分析することによって決定され得る。一例として、１０００００配列が決定され、９９０００配列が「ｇａｕ」を読み取り、１０００配列が「ｇｃｕ」を読み取る場合、アスパルテートをエンコードする「ｇａｕ」配列は、その位置のアラニンをエンコードする「ｇｃｕ」変異体の１０％に対して、９０％の頻度を有すると言われる可能性がある。いくつかの実施形態において、本明細書中に記載される方法は、読み取られた配列の１０％未満、５％未満又は２％未満において生じる配列変異を検出し得る。他の実施形態において、方法は、読み取られた配列の１％未満、０．５％未満又は０．２％未満において生じる配列変異を検出し得る。検出感度の典型的な範囲は、０．１％～１００％、０．１％～５０％、０．１％～１０％、例えば０．２％～５％であり得る。

本明細書に記載されるＰＣＲベースの方法の１つの利点は、この方法には変異の事前知識が必要とされないことである。方法は核酸シーケンシングに基づくので、プライマーを使用して増幅する１つの位置のすべての変異が検出される。さらに、シーケンシングのためのクローニングは必要ない。核酸試料は、クローニング、サブクローニング及びクローニングされた核酸の培養を必要とせずに、一連の工程で増幅及びシーケンシングされる。配列変異の検出のための上記の態様は特に有用である。例えば、一実施形態では、本明細書に記載される方法は、患者試料中の様々な変異ＳＡＲＳ－ＣｏＶ－２株を検出することができる。本明細書中に記載される方法によって検出され得る変異ＳＡＲＳ－ＣｏＶ－２株の非限定的な例としては、スパイクタンパク質、受容体結合ドメイン及び／又はヌクレオカプシドタンパク質をエンコードするポリヌクレオチド中にＴ９５Ｉ、Ｄ２５３Ｇ、Ｌ４５２ＲｍＥ４８４Ｋ、Ｓ４７７Ｎ、Ｎ５０１ＹＤ６１４Ｇ及びＡ７０１Ｖ点変異を有するＳＡＲＳ－ＣｏＶ－２変異体が挙げられる。いくつかの実施形態の方法では、核酸試料は、検出可能な力価のウイルスを含むＳＡＲＳ－ＣｏＶ－２ＲＮＡソース（例えば、ＳＡＲＳ－ＣｏＶ－２に感染したヒト患者）に由来し得る。本明細書に記載の方法の典型的な実施形態では、ソースはヒト対象からの試料を含み得、それは、薬物／血漿／ワクチン治療レジメンを受けた可能性がある、又はないＳＡＲＳ－ＣｏＶ－２感染患者（すなわち、患者は「ドラッグナイーブ」であってもなくてもよい）から収集した組織又は体液試料を含む。変異は、疾患症状の重症度、死亡率の増加、蔓延の増加、及び／又は治療法に対する既知の耐性若しくは新たに特定された耐性と相関し得る。本明細書中に記載される方法はまた、ワクチン接種プログラムの有効性を決定するか、又は治療的利益がほとんどない１つ以上の薬物、薬物クラス若しくは薬物組み合わせの回避を含み得る治療レジメンを変更するために利用され得る、試料集団中の各変異体の頻度の測定を提供する。

記載される方法の他の用途には、配列変異体の集団研究が含まれ、核酸試料を生物の集団から収集し、１つの実験で組み合わせて分析してウイルスゲノムの特定の領域における配列変異頻度を決定することができる。生物の集団は、例えば、ヒトの集団、家畜の集団などを含み得る。これらの集団研究は、ウイルスゲノムにおける変異についての「ホットスポット」を示すことができ、そのような情報は、薬物及び／又はワクチンの設計において貴重であり得る。

ＶＩ．アレイのマルチプレックス及び感染の同定におけるその使用
一態様では、本開示は、多様な試料から少なくとも１つの標的タンパク質を検出するためのアレイのマルチプレックスを提供する。マルチプレックスアレイは、複数の独自に標識されたビーズに結合した複数の捕捉剤を含む。独自に標識されたビーズの各々は、複数の固有の捕捉剤と、少なくとも１つのビーズに結合するように設計された少なくとも１つの第１のオリゴヌクレオチド配列と、第２のオリゴヌクレオチド配列とコンジュゲートした少なくとも１つの二次抗体と、環状アンプリコン中の少なくとも１つの固有のヌクレオチドバーコード配列とを含む。本明細書に記載されるアレイの多くの実施形態では、ビーズは、少なくとも１つの標的タンパク質に特異的に結合する抗原でコーティングされる。本明細書に記載されるアレイのいくつかの実施形態では、第２のオリゴヌクレオチド配列は、第２のオリゴヌクレオチド配列が第１のオリゴヌクレオチド配列に近接している場合に増幅されて環状アンプリコンを形成するように設計される。いくつかの実施形態において、第１のオリゴヌクレオチド配列、又は第２のオリゴヌクレオチド配列、又はその両方は、少なくとも１つの固有のバーコード配列を含む。いくつかの実施形態において、第１のオリゴヌクレオチド配列は、ビーズ上にコーティングされたポリペプチドに共有結合している。いくつかの実施形態では、アレイのマルチプレックスは、抗体又は抗体断片に共有結合した第１のオリゴヌクレオチド配列を含み、抗体又は抗体断片はビーズ上にコーティングされたポリペプチドに結合する。

いくつかの実施形態では、アレイのマルチプレックスは、第１のオリゴヌクレオチド配列又は第２のオリゴヌクレオチド配列、又はそれらの組み合わせ中に少なくとも９６個の異なるバーコード配列を含む。
いくつかの他の実施形態では、アレイのマルチプレックスは、第１のオリゴヌクレオチド配列又は第２のオリゴヌクレオチド配列、又はそれらの組み合わせ中に少なくとも３８４個の異なるバーコード配列を含む。いくつかの実施形態では、アレイのマルチプレックスは、環状アンプリコン中に少なくとも９６個の異なるバーコード配列を含む。

上述したように、主題の方法を実施するのに有用なシステムも提供される。例えば、いくつかの実施形態では、主題の方法を実施するためのシステムは、少なくとも１つのセット又は近接プローブ；少なくとも１対の非対称コネクタの；及び核酸リガーゼを含み得る。さらに、システム構成要素を用いて実施されるプロトコルで必要とされる又は所望される追加の試薬が存在してもよく、その追加の試薬には、補充核酸の対、一本鎖結合タンパク質、及びＰＣＲ増幅試薬（例えば、ヌクレオチド、緩衝液、カチオンなど）、ＮＧＳシーケンシング試薬などが含まれるが、これらに限定されない。

一態様では、本開示は、複数の生物学的試料における少なくとも１つの感染のための方法を提供する。方法は、少なくとも１つの標的タンパク質が少なくとも１つのビーズの固有の捕捉剤に結合するのに十分な条件下で、本明細書に記載のアレイのマルチプレックスにおいて複数の生物学的試料を複数のビーズと共にインキュベートする第１の工程を含む。方法の第２の工程において。ビーズを洗浄して、固有の捕捉剤に結合しないタンパク質を除去する。次の工程は、複数の標的タンパク質に結合した二次抗体の数に対応する複数の複合体が形成されるように、複数の二次抗体のそれぞれが少なくとも１つの標的タンパク質と複合体を形成する条件下で、ビーズを複数の二次抗体とインキュベートすることを含む。次の工程では、ビーズを再度洗浄して、複合体を形成しない二次抗体を除去する。第６の工程では、環状アンプリコンを形成するように第１オリゴヌクレオチド配列のそれぞれに対して第２オリゴヌクレオチド配列のそれぞれをハイブリダイゼーションさせる条件下で、複数の複合体の数に対応して複数のアンプリコンが生成されるように、複数の複合体をインキュベートする。方法の第７の工程は、複数の環状アンプリコンを増幅に供することを含む。第８の工程では、ビーズをアレイにプールし、複数のアンプリコンを固有のバーコード化アンプリコンのハイスループットシーケンシングによって同時に検出する。最後の工程では、複数のアンプリコンのカテゴリーが決定される。前述のように、標的増幅領域由来のポリヌクレオチドを含む複数のアンプリコンのそれぞれのカテゴリーを決定することは、対応する生物学的試料における感染を示す。

いくつかの実施形態では、本明細書に記載の方法は、１つ又は複数の試料中の病原性決定因子（例えば、細菌及び／又はウイルス感染）の同定に使用される。他の実施形態では、本方法は、１つ以上の病原性感染を示すＩｇＧ及びＩｇＭ免疫グロブリンなどの標的タンパク質を同時に検出する。本明細書中に記載される方法によって検出される抗体又は抗体断片は、アシネトバクター・バウマンニ（Ａｃｉｎｅｔｏｂａｃｔｅｒｂａｕｍａｎｎｉｉ）、アデノウイルス、アフリカ馬疫ウイルス、アフリカ豚コレラウイルス、ズビニ鉤虫（Ａｎｃｌｏｓｔｏｍａｄｕｏｄｅｎａｌｅ）、回虫、黄色アスペルギルス、アスペルギルス・フミガーツス（Ａｓｐｅｒｇｉｌｌｕｓｆｕｍｉｇａｔｕｓ）、アスペルギルス・ニガー（Ａｓｐｅｒｇｉｌｌｕｓｎｉｇｅｒ）、アスペルギルス・オリゼ（Ａｓｐｅｒｇｉｌｌｕｓｏｒｙｚａｅ）、鳥インフルエンザウイルス、炭疽菌、炭疽菌パスツール株、ＢａｃｉｌｌｕｓｃｅｒｅｕｓＢｉｏｖａｒａｎｔｈｒａｃｉｓ、ウシ流産菌、ブルセラ・メリテンシス（Ｂｒｕｃｅｌｌａｍｅｌｉｔｅｎｓｉｓ）、ブルセラ・スイス（Ｂｒｕｃｅｌｌａｓｕｉｓ）、鼻疽菌、類鼻疽菌、カンジダ・アルビカンス（Ｃａｎｄｉｄａａｌｂｉｃａｎｓ）、カンジダ・ドゥブリニエンシス（Ｃａｎｄｉｄａｄｕｂｌｉｎｉｅｎｓｉｓ）、カンジダ・グラブラタ（Ｃａｎｄｉｄａｇｌａｂｒａｔａ）、カンジダ・クルセイ（Ｃａｎｄｉｄａｋｒｕｓｅｉ）、カンジダ・トロピカリス（Ｃａｎｄｉｄａｔｒｏｐｉｃａｌｉｓ）、クラミジア・ニューモニエ（Ｃｈｌａｍｙｄｉａｐｎｅｕｍｏｎｅａｅ）、クラミジア・トラコマチス（Ｃｈｌａｍｙｄｉａｔｒａｃｈｏｍａｔｏｕｓ）、豚熱ウイルス、クロストリジウム・ディフィシール（Ｃｌｏｓｔｒｉｄｉｕｍｄｉｆｆｉｃｉｌｅ）、コクシジオイデス・イミティス（Ｃｏｃｃｉｄｉｏｉｄｅｓｉｍｍｉｔｉｓ）、コクシジオイデス・ポサダシ（Ｃｏｃｃｉｄｉｏｉｄｅｓｐｏｓａｄａｓｉｉ）、ＣｏＶ－２２９Ｅ、ＣｏＶ－ＨＫＵ１、ＣｏＶ－ＮＬ６３、ＣｏＶ－ＯＣ４３、コクサッキーウイルスＡ、コクサッキーウイルスＢ、コクシエラ・バーネッティ（Ｃｏｘｉｅｌｌａｂｕｒｎｅｔｉｉ）、クリミア・コンゴ出血熱、サイトメガロウイルス、デングウイルス、メジナ虫、東部馬脳炎、エボラウイルス、い粒条虫、多包条虫、エンテロバクター・クロアカ、エンテロコッカス・フェシウム（Ｅｎｔｅｒｏｃｏｃｃｕｓｆａｅｃｉｕｍ）、エンテロウイルス、エプスタイン・バール・ウイルス、大腸菌、巨大肝蛭、肝蛭、***ウイルス、野兎病菌、山羊痘ウイルス、ヘモフィルス属インフルエンザ、ヘリコバクターピロリ、ヘンドラウイルス、Ａ型肝炎ウイルス、Ｂ型肝炎ウイルス、Ｃ型肝炎ウイルス、ヒストプラスマ・カプスラーツム（Ｈｉｓｔｏｐｌａｓｍａｃａｐｓｕｌａｔｕｍ）、ズボアジ型ヒストプラスマ症（Ｈｉｓｔｏｐｌａｓｍａｄｕｂｏｉｓｉｉ）、ヒトヘルペスウイルスＨＨＶ６、ヒトヘルペスウイルスＨＨＶ７、ヒトヘルペスウイルスＨＨＶ８、ヒトヘルペスウイルスＨＳＶ１、ヒトヘルペスウイルスＨＳＶ２、ヒト免疫不全ウイルス、ヒトパピローマウイルス、インフルエンザウイルスＡ型、インフルエンザウイルスＢ型、クレブシェラ肺炎桿菌、キャサヌール森林病ウイルス、ラッサ熱ウイルス、レジオネラ・ニューモフィラ菌、リーシュマニア・プロマスティゴート（Ｌｅｉｓｈｍａｎｉａｐｒｏｍａｓｔｉｇｏｔｅｓ）、Ｌｕｊｏウイルス、ランピースキン病ウイルス、マールブルグウイルス、麻疹ウイルス、メチシリン耐性黄色ブドウ球菌、サル痘ウイルス、ムンプスウイルス、マイコバクテリウム・アブセッサス（Ｍｙｃｏｂａｃｔｅｒｉｕｍａｂｓｃｅｓｓｕｓ）、マイコバクテリウム・アビウム（Ｍｙｃｏｂａｃｔｅｒｉｕｍａｖｉｕｍ）、マイコバクテリウム・ボビス（Ｍｙｃｏｂａｃｔｅｒｉｕｍｂｏｖｉｓ）、マイコバクテリウム・カヌッティイ（Ｍｙｃｏｂａｃｔｅｒｉｕｍｃａｎｅｔｔｉｉ）、マイコバクテリウム・レプレ（Ｍｙｃｏｂａｃｔｅｒｉｕｍｌｅｐｒａｅ）、ヒト結核菌、マイコバクテリウム・ウルセランス（Ｍｙｃｏｂａｃｔｅｒｉｕｍｕｌｃｅｒａｎｓ）、マイコプラズマ・カプリコルム（Ｍｙｃｏｐｌａｓｍａｃａｐｒｉｃｏｌｕｍ）、マイコプラズマ・ミコイデス（Ｍｙｃｏｐｌａｓｍａｍｙｃｏｉｄｅｓ）、マイコプラズマ・ニューモニア（Ｍｙｃｏｐｌａｓｍａｐｎｅｕｍｏｎｅａｅ）、アメリカ十二指腸虫、淋病、ニューカッスル病ウイルス、ニパウイルス、ノルカジア属ｂｅｉｊｉｎｇｅｎｓｉｓ、ノルカジア属ｃｙｒｉａｃｉｇｅｏｒｇｉｃａ、ノルカジア属ｆａｒｃｉｎｉｃａ、ノロウイルスＧＩ、ノロウイルスＧＩＩ、ノーウォークウイルス、オムスク出血熱ウイルス、回旋糸状虫、発癌性ヒトパピローマウイルス、パラインフルエンザウイルス、寄生生物、マルネッフェイ型ペニシリウム症（Ｐｅｎｉｃｉｌｌｉｏｓｉｓｍａｒｎｅｆｆｅｉ）、小反芻獣疫ウイルス、ニューモシスチス・イロベチイ（Ｐｎｅｕｍｏｃｙｓｔｉｓｊｉｒｏｖｅｃｉｉ）、ポリオーマウイルス、プロテウス・ミラビリス（Ｐｒｏｔｅｕｓｍｉｒａｂｉｌｉｓ）、緑膿菌、狂犬病ウイルス、８つの遺伝子断片すべてのコーディング領域の任意の部分を含有する、１９１８年のパンデミックインフルエンザウイルスの再構築された複製コンピテント形態、呼吸器合胞体ウイルス、ライノウイルス、発疹チフスリケッチア、リフトバレー熱ウイルス、牛疫ウイルス、ロタウイルスＡ、ロタウイルスＢ、ロタウイルスＣ、ロタウイルスＧ２、風疹ウイルス、ＳＡＲＳ関連コロナウイルス（ＳＡＲＳ－ＣｏＶ）、ＳＡＲＳ－ＣｏＶ－１、ＳＡＲＳ－ＣｏＶ－２、ビルハルツ住血吸虫、日本住血吸虫、マンソン住血吸虫、羊痘ウイルス、南米出血熱ウイルスチャパレ、南米出血熱ウイルスグアナリト、南米出血熱ウイルスフニン、南米出血熱ウイルスマチュポ、南米出血熱ウイルスサビア、黄色ブドウ球菌、スタフィロコッカス・サプロフィティカス（Ｓｔａｐｈｙｌｏｃｏｃｃｕｓｓａｐｒｏｐｈｙｔｉｃｕｓ）、肺炎レンサ球菌、豚水疱病ウイルス、有鉤条虫、ダニ媒介性脳炎複合（ｆｌａｖｉ）ウイルス極東亜型、ダニ媒介性脳炎複合（ｆｌａｖｉ）ウイルスシベリア亜型、タバコモザイク病ウイルス、トルクテノウイルス、鞭虫、ブルーストリパノソーマ（Ｔｒｙｐａｎｏｓｏｍａｂｍｃｅｉ）、トリパノソーマ・クルージ（Ｔｒｙｐａｎｏｓｏｍａｃｒｕｚｉ）、大痘瘡ウイルス（天然痘ウイルス）、小痘瘡ウイルス（アラストリム）、ベネズエラ馬脳炎ウイルス、バンクロフト糸状虫、ペスト菌、及び上記の病原体のいずれか１つと特徴的な核酸配列を共有する病原体、又は前述の群の病原体と特徴的な核酸配列を共有する、別の潜在的に新規若しくは特性決定されていない病原体を含む病原体からの１つ以上の抗体に特異的に結合する。

いくつかの実施形態では、本明細書に記載の方法は、１つ又は複数の試料における１つ又は複数のＲＮＡウイルスによって引き起こされる感染の同定に使用される。特定の実施形態では、本明細書に記載の方法は、１人又は複数の患者から得られた１つ又は複数の生物学的試料中のウイルス感染（例えば、ＳＡＲＳ－ＣｏＶ－２感染）の同定に使用される。ＳＡＲＳ－ＣｏＶ－２を診断し、識別することは臨床的に困難である。ＳＡＲＳ－ＣｏＶ－２感染が疑われる症例では、迅速で信頼性の高い大規模並行診断が必要である。本開示は、そのようなアッセイを提供する。アッセイは、少なくとも部分的には、ＳＡＲＳ－ＣｏＶ－２ウイルスポリヌクレオチドが、固有のバーコード配列を試料ソース識別子として使用するＳＡＲＳ－ＣｏＶ－２ウイルスポリヌクレオチド用の１段階又は２段階リアルタイム逆転写増幅アッセイで検出（例えば、シーケンシング）され得るという発見に基づく。本明細書に提供されるアッセイは、スパイクタンパク質（Ｓ）、受容体結合ドメイン（ＲＢＤ）、Ｓ１タンパク質、Ｓ２タンパク質、Ｅ遺伝子、Ｓ遺伝子、Ｏｒｆｌａｂ遺伝子、Ｎ末端スパイクタンパク質ドメイン、全タンパク質（Ｓ１＋Ｓ２）、及びヌクレオカプシド（Ｎ）タンパク質からなる群から選択される１つ以上のＳＡＲＳ－ＣｏＶ－２抗原に特異的に結合する、本明細書に記載される方法で検出される抗体又は抗体断片を検出することができる。本明細書で提供される方法は、ＳＡＲＳ－ＣｏＶ－２感染を有するか又は有する疑いがある１人又は複数の患者から得られた複数の試料からのＳＡＲＳ－ＣｏＶ－２ウイルスポリヌクレオチドの同時検出を可能にする。

いくつかの実施形態において、本明細書中に記載される方法は、重要な獣医学的疾患（例えば、ウシ下痢、ヨーネ病、豚インフルエンザなど）の病原体の同定のために使用される。本明細書中に記載される方法は、動物が各試料に標識され、適切にバーコードプライミングされている限り、群内の感染動物を個々に検出を容易にすることができる。

いくつかの実施形態では、本明細書に記載の方法は、１つ又は複数の試料における１つ又は複数の標的核酸の同定に使用される。いくつかの他の実施形態では、本明細書に記載の方法は、１つの試料における２つ以上の標的核酸の同定に使用される。特定の実施形態では、２つ以上の標的核酸は、単一の病原体の病原性決定因子であるか、又は病原性決定因子をエンコードする。特定の実施形態では、２つ以上の標的核酸は、単一のＲＮＡウイルス（例えば、ＳＡＲＳ－ＣｏＶ－２）の病原性決定因子であるか、又は病原性決定因子をエンコードする。他の実施形態では、２つ以上の標的核酸は、２つ以上のＲＮＡウイルス（例えば、ＳＡＲＳ－ＣｏＶ－２及びインフルエンザＡウイルス）の病原性決定因子であるか、又は病原性決定因子をエンコードする。別の実施形態では、２つ以上の標的核酸は、１つ以上のＲＮＡウイルス（例えば、ＳＡＲＳ－ＣｏＶ－２、インフルエンザＡウイルス）及び１つ以上の細菌性病原体（例えばマイコバクテリウム、レンサ球菌、緑膿菌、赤痢菌、カンピロバクター、クラミジア及びサルモネラ）の病原性決定因子であるか、又は病原性決定因子をエンコードする。特に明記しない限り、「アミノ酸配列をエンコードするヌクレオチド配列」は、互いに縮重バージョンであり、同じアミノ酸配列をエンコードするすべてのヌクレオチド配列を含む。タンパク質又はＲＮＡをエンコードするヌクレオチド配列という語句はまた、タンパク質をエンコードするヌクレオチド配列が、一部のバージョンで１つ以上のイントロンを含み得る程度にイントロンを含み得る。

ＶＩＩ．標的タンパク質血清学的アッセイを同定するためのシステム及び方法
本明細書に記載の血清学的アッセイは、試料中の分析物を検出するための近接ライゲーションアッセイ（ＰＬＡ）である。このアッセイは、「近接プローブ」の原理を「分子バーコード化」及びマルチプレックス増幅と組み合わせて、複数の生物学的試料中の１つ又は複数の分析物の存在の大規模並行分析を容易にする。ＰＬＡは、分析物が複数の（すなわち、２つ以上、一般的には２つ、３つ又は４つ）プローブの同時結合によって検出されるアッセイであり、プローブは分析物への結合によって近接されると、検出可能な、好ましくは増幅可能な核酸検出産物（例えば、環状アンプリコン）を形成し、それによって前記分析物を検出することができる。核酸検出産物（例えば、環状アンプリコン）は、当業者に公知の方法によって検出及びシーケンシングすることができる。本明細書に記載のアッセイでは、近接プローブは、プローブの分析物結合ドメイン（又は部分）に連結された核酸ドメイン（又は部分）を含み、アンプリコンの産生は、核酸部分、及び／又は他のプローブによって担持されるさらなる官能性部分の間の相互作用を伴う。したがって、アンプリコン産生は、プローブ間の相互作用に依存し（より具体的には、それらによって担持される核酸又は他の官能性部分／ドメインによる）、したがって、必要な２つの（又はそれ以上）プローブの両方が分析物に結合した場合にのみ起こり、それによって検出システムへの特異性の改善をもたらす。

近接プローブベースの検出アッセイ、特に近接ライゲーションアッセイによって、試料中の１つ以上の分析物を、そのような分析物の存在を容易に検出可能又は定量可能な核酸ベースのシグナルに変換することによって、高感度な、迅速かつ便利な検出又は定量が可能になる。

当技術分野の近接プローブは、一般に対で使用され、それぞれ、標的分析物に特異性を有する分析物結合ドメイン、及び官能性ドメイン、例えばそれに結合した核酸ドメインからなる。分析物結合ドメインは、例えば、核酸「アプタマー」（Ｆｒｅｄｒｉｋｓｓｏｎｅｔａｌ（２００２）ＮａｔＢｉｏｔｅｃｈ２０：４７３－４７７）であり得るか、又はモノクローナル若しくはポリクローナル抗体などのタンパク質性であり得る（Ｇｕｌｌｂｅｒｇｅｔａｌ（２００４）ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ１０１：８４２０－８４２４）。各近接プローブ対のそれぞれの分析物結合ドメインは、分析物上の同じ又は異なる結合部位のいずれかに対して特異性を有し得る。本明細書に記載のアッセイにおける分析物は、典型的には、対象由来の生物学的試料（例えば、血液）中に存在する抗体又は抗体の断片である。いくつかの例では、対象は感染（例えば、ウイルス感染又は細菌感染）を有し、感染を引き起こす特定の病原体に特異的な循環抗体（例えば、中和抗体）を有し得る。近接プローブ対は、両方が同じ分析物分子（相互作用する分子の複合体であり得る）上のそれぞれの部位に結合すると、すなわちプローブが標的分析物に同時に結合すると互いに近接し、この場合、官能性ドメイン（例えば核酸ドメイン）は、直接的又は間接的に相互作用することができる。例えば、近接している場合の近接プローブの核酸ドメインは、付加された１つ以上のオリゴヌクレオチドの互いのライゲーション（１つ以上の近接プローブの核酸ドメインであり得る）、例えば、付加された直鎖オリゴヌクレオチドを環状化するための分子内ライゲーションを鋳型化し得る。様々なそのようなアッセイフォーマットが国際公開第０１／６１０３７号に記載されている。
それによって生成された環状アンプリコンは、試料中の分析物の有無を報告するのに役立ち、例えばリアルタイム定量ＰＣＲ（ｑ－ＰＣＲ）によって定性的又は定量的に検出することができる。

上述のように、固有のバーコード化配列を使用すると、単一の実験からの試料のプールから各試料のソースを追跡することが容易になる。「多重化」は、単一の反応に組み合わされた複数の試料の同時検出を容易にする。複数の固有のバーコード配列と多重化すると、１つの実験においていくつかの試料の検出及びソース識別が可能になる。

一態様では、本開示は、複数の生物学的試料における少なくとも１つの感染を同定するための方法を提供する。方法は、複数の対象から複数の生物学的試料を得ることと、複数の独自に標識されたビーズに結合した複数の捕捉剤を含むアレイを提供することとを含む。独自に標識されたビーズの各々は、複数の固有の捕捉剤を含む。アレイは、少なくとも１つのビーズに結合するように設計された少なくとも１つの第１のオリゴヌクレオチド配列をさらに含む。いくつかの実施形態では、複数の第１のヌクレオチド配列は、少なくとも１つの標的タンパク質（例えば、ビーズ上にコーティングされたＣＯＶＩＤ－１９のＳタンパク質抗原に特異的に結合する生物学的試料からの抗体）に特異的に結合する抗原（例えば、ＣＯＶＩＤ－１９のＳタンパク質抗原）でコーティングされた複数のビーズに結合する。アレイは、第２のオリゴヌクレオチド配列とコンジュゲートした少なくとも１つの二次抗体をさらに含む。第２のオリゴヌクレオチド配列が第１のオリゴヌクレオチド配列に近接している場合、独自にバーコード化された環状ヌクレオチド鋳型は、増幅されて環状アンプリコンを形成するように設計される。いくつかの実施形態では、第１及び第２のヌクレオチド配列は、固有のバーコード配列を含む。いくつかの実施形態では、第１及び第２のヌクレオチド配列は、第１及び第２のヌクレオチド配列のそれぞれに２つ以上の固有のバーコードを付加することを可能にするスペーサー配列（例えば、アダプター配列）を含む。

いくつかの実施形態では、アレイは、少なくとも９６ウェル、少なくとも３８４ウェル、少なくとも１５３６ウェル、又はそれ以上のウェルを有する１つ又は複数のプレートを含むマルチプレックスアレイである。いくつかの実施形態では、第１及び第２のヌクレオチド配列は、第１のオリゴヌクレオチド配列又は第２のオリゴヌクレオチド配列、又はそれらの組み合わせ中に少なくとも３８４個の異なるバーコード配列を含む。特定の実施形態では、アレイは、環状アンプリコン中に少なくとも３８４個の固有のバーコード配列を含む。本明細書中に記載されるすべての実施形態において、複数のビーズは、独自に標識されたビーズの各々が複数の固有の捕捉剤（例えば、ＣＯＶＩＤ－１９のＳタンパク質抗原）を含むように、独自に標識される。本明細書に記載される方法の多くの実施形態では、ビーズは少なくとも２つの近接プローブと共にインキュベートされる。第１の近接プローブは、少なくとも１つのビーズに結合した固有の捕捉剤に結合するように設計されたポリペプチドにコンジュゲートされた第１のオリゴヌクレオチド配列を含む。特定の実施形態では、第１のオリゴヌクレオチド配列は、ビーズ上にコーティングされた捕捉剤との直接共有結合相互作用によってコンジュゲートされる。他の特定の実施形態において、第１のオリゴヌクレオチド配列は、ビーズ上にコーティングされた捕捉剤との共有結合相互作用を通して、例えば、抗体、ｓｃＦｖドメインを含む、結合ドメインなどの別のポリペプチドによって媒介されて、ビーズ上の抗原へコンジュゲートされる。第２の近接プローブは、標的タンパク質（例えば、ＣＯＶＩＤ１９のＳタンパク質に対する抗体）に特異的に結合する（例えば、少なくとも約１０^－４Ｍ、通常は少なくとも約１０^－８Ｍ以上、例えば１０^－１０Ｍ以上の結合親和性で）抗体にコンジュゲートされた第２のオリゴヌクレオチド配列を含む。標的タンパク質を含む試料とのインキュベーション時に、２つの近接プローブを、それらが鋳型環状ＤＮＡにハイブリダイズするように近接させる。次いで、環状ＤＮＡ鋳型を増幅して、下流シーケンシングによって検出される環状アンプリコンを生成する。本明細書に記載の方法の実施形態では、環状ＤＮＡ鋳型は個別にバーコード化され、検出器のための近接ライゲーション配列も含む。アンプリコンの検出は、特定の対象から得られた対応する試料が標的タンパク質を有することを示す。

近接プローブは、核酸の尾状又はタグ付き親和性リガンド、例えば、タグ又は尾部核酸（すなわち、核酸ドメイン）にコンジュゲートされた親和性リガンド（すなわち、検体結合ドメイン）を含むコンジュゲート分子であり、２つの構成要素は、一般に（必ずしもそうとは限らないが）、例えば直接又は連結基を介して互いに共有結合している。代表的な実施形態では、「尾状」親和性リガンドは、直接又は連結基を介してタグ核酸に共有結合した親和性リガンドで構成され、連結基は、切断可能、例えば酵素的に切断可能（例えば、制限エンドヌクレアーゼ認識部位を含み得る）、光不安定、その他であってもなくてもよい。特定の実施形態では、核酸尾状親和性リガンド又は近接プローブの親和性リガンド（すなわち、分析物結合する）ドメイン、部分又は構成要素は、標的分析物に対して高い結合親和性を有するｓｃＦＶ分子である。高い結合親和性とは、少なくとも約１０^－４Ｍ、通常少なくとも約１０^－８Ｍ以上、例えば１０^－１０Ｍ以上の結合親和性を意味する。親和性リガンドは、タグ付き親和性リガンドとして存在する場合に標的タンパク質に対して必要な結合親和性を示す限り、様々な異なる種類の分子のいずれかであり得る。特定の実施形態では、親和性リガンドは、その標的分析物に対して中程度又はさらには低い、例えば約１０^－４Ｍ未満の親和性を有するリガンドである。

本明細書中に記載される方法の多くの実施形態において、親和性リガンドは、結合ドメイン（例えば、抗体、並びにその結合断片及び模倣物）である。抗体が親和性リガンドである場合、それらは、特異性が異なる抗体の異種集団がそれぞれ同じタグ核酸でタグ付けされるようなポリクローナル組成物、又は標的タンパク質に対して同じ特異性を有する同一の抗体の同種集団がそれぞれ同じタグ核酸でタグ付けされるモノクローナル組成物に由来し得る。したがって、親和性リガンドは、モノクローナル及びポリクローナル抗体のいずれかであり得る。さらに他の実施形態では、親和性リガンドは、抗体結合断片又は模倣物であり、これらの断片及び模倣物は、標的タンパク質に対して必要な結合親和性を有する。例えば、Ｆｖ、Ｆ（ａｂ）及びＦａｂなどの抗体断片は、無傷のタンパク質の切断、例えば、プロテアーゼ又は化学切断によって調製され得る。また、組換え生成された抗体断片、例えば一本鎖抗体又はｓｃＦｖも対象であり、そのような組換え生成された抗体断片は、上記抗体の結合特性を保持する。そのような組換え生成された抗体断片は、一般に、対象抗体の結合特性を保持するように、少なくとも対象抗体のＶＨドメイン及びＶＬドメインを含む。本開示のこれらの組換え生成された抗体断片又は模倣物は、任意の好都合な方法論、例えば、米国特許第５，８５１，８２９及び５，９６５，３７１号に開示されている方法論を用いて容易に調製され得る。それらの開示は、参照により本明細書に組み込まれている。

重要なことに、親和性リガンドは、その標的タンパク質に対する親和性リガンドのための結合親和性を実質的に消失させることなく、核酸尾部に共有結合することができるドメイン又は部分を含むものである。

本明細書中に記載される方法の多くの実施形態において、固有のバーコード配列は、環状プラスミドのそれぞれに導入される。これにより、増幅後の効率的な検出が可能になり、タンパク質試料をバーコード化オリゴで個別に標識する必要がなくなり、面倒で時間のかかるプロセスが回避される。他の実施形態では、固有のバーコード配列が近接プローブの各々に導入される。バーコード配列は、ソース識別（例えば、試料ＩＤ、患者ＩＤ、アレイ内の試料のウェル又はプレート位置）を容易にする固有のヌクレオチド配列である。バーコード配列の長さは、３～２０ヌクレオチド長、例えば５～１５ヌクレオチド長であり得る。いくつかの実施形態では、バーコード配列は完全にランダムであってもよく、すなわち、Ａ、Ｔ、Ｇ、及びＣのいずれか１つがバーコード配列の任意の位置にあってもよい。例示的な一実施形態では、固有のＤＮＡバーコードは、一連の２つのＰＣＲ工程において液体処理システムを指揮するコンピュータアルゴリズムによって割り当てられる。他の実施形態では、バーコード配列は、準定義されているか、又は完全に定義されている。例示的な実施形態では、対象情報はデータベースに登録され、対象には独自にバーコード化された（身体的）試料コレクションチューブが与えられる。ロボットは、プロセス全体を通して試料の独自の識別を可能にする、化学的性質の固有のバーコードＤＮＡ配列を割り当てる。この場合、バイアルバーコードは患者と一致し、固有のＤＮＡバーコードプライマーの組み合わせがバイアルのＩＤに独自に割り当てられる。３８４のプライマーの１つの「ウェルバーコード」セット（セットＡ）をマイクロウェルプレート（対象ごとに１つのウェル、例えば３８４ウェルプレート）中の各対象ウェルに割り当て、次いで、３８４のプライマーの第２のセット（セットＢ）がプレートの産物を増幅する（プレートごとに１つの「プレート」バーコードプライマー）。このように、合計して患者からの１４７０００の固有の試料になる３８４×３８４の固有の組み合わせを処理することができる。これらの割り当ての各々は、デコンボリューションのために追跡され記憶される。

いくつかの実施形態では、近接プローブは、標的鋳型環状ＤＮＡに相補的な１つ又は複数のアダプター領域を含む。鋳型環状ＤＮＡはまた、増幅中に保持され、ハイスループットシーケンシング工程中のアンプリコンのソース識別を容易にする固有のバーコード情報を有する。例示的な実施形態において、固有のＤＮＡバーコードは、コンピュータアルゴリズムによって、アレイの各ウェルに付加された鋳型環状ＤＮＡの各々に割り当てられる。
３８４個の固有の環状アンプリコンは、セットＡを表し、次いで、それらは、セットＢからのさらなる３８４個のフォワード及びリバースの一つをアルゴリズム的に付加することによって増幅される。

本明細書に記載される方法のいくつかの実施形態では、アンプリコンは、シーケンシングによって検出される。配列データの生成は、典型的にはハイスループットＤＮＡシーケンシングシステム、例えばＤＮＡ鋳型の大規模並行シーケンシングを利用する次世代シーケンシング（ＮＧＳ）システムを使用して行われる。核酸配列データを生成するための例示的なＮＧＳシーケンシングプラットフォームは、これらに限定されないが、オックスフォードナノポアシーケンサー（例えば、ＭｉｎｌＯＮＭｋｌＣ、Ｆｌｏｎｇｌｅ、Ｍｉｎｉｏｎ、Ｇｒｉｄｌｏｎ及び／又はＰｒｏｍｅｔｈｌＯＮを含むナノポアデバイス）、Ｉｌｌｕｍｉｎａの合成技術によるシーケンシング（例えば、ＩｌｌｕｍｉｎａＭｉＳｅｑ又はＨｉＳｅｑＳｙｓｔｅｍ）、ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓのＩｏｎＴｏｒｒｅｎｔ半導体シーケンシング技術（例えば、ＩｏｎＴｏｒｒｅｎｔＰＧＭ又はＰｒｏｔｏｎｓｙｓｔｅｍ）、ｔｈｅＲｏｃｈｅ（４５４ＬｉｆｅＳｃｉｅｎｃｅｓ）ＧＳシリーズ及びＱｉａｇｅｎ（ＩｎｔｅｌｌｉｇｅｎｔＢｉｏＳｙｓｔｅｍｓ）ＧｅｎｅＲｅａｄｅｒシーケンシングプラットフォームが含まれる。本方法のいくつかの実施形態では、バーコード化アンプリコンをプールして「ライブラリー」を作成し、ハイブリダイゼーション反応混合物に添加し、６５℃で１２時間インキュベートした。ＩｌｌｕｍｉｎａＭｉＳｅｑ（商標）（Ｉｌｌｕｍｉｎａ，ＳａｎＤｉｅｇｏ，ＣＡ）又はＩｏｎＴｏｒｒｅｎｔ（商標）ＰｅｒｓｏｎａｌＧｅｎｅＭａｃｈｉｎｅ（ＰＧＭ）（ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ，ＧｒａｎｄＩｓｌａｎｄ，ＮＹ）シーケンシングプラットフォームのいずれかに必要なさらなる配列（例えば、アダプター）を、融合プライマーを使用して５’及び３’アダプターに加えた。ＤＮＡライブラリーを半分に二分割した。一方の半分を、５’及び３’アダプターに相補的な部分を有し、ＭｉＳｅｑシーケンシングのためのさらなる配列を追加する融合プライマーで増幅し、他方の半分を、ＰＧＭシーケンシングのためのさらなる配列を追加するプライマーのセットで増幅した。

例示的な実施形態では、アンプリコンはシーケンシングされ、シーケンシングファイルは、（ａ）それぞれが独自にタグ付けされた、複数の対象からの標的分析物（例えば、ＣＯＶＩＤ１９特異的抗体、ＳＡＲＳ特異的抗体、インフルエンザ特異的抗体）を含む試料の各々のための二重バーコード化アンプリコン、及び（ｂ）ＰＣＲ反応が適切に実行されたことを確認する陽性対照配列（合成又は天然）のための二重バーコード化アンプリコンを含む。次いでアッセイ結果は、各患者を独自に識別する二重バーコードの組み合わせについて配列ファイルをスキャンするアルゴリズムによって読み取られる。例えば、ファイル内のジョイント配列（アダプター、その他を含む）を検出すると、アルゴリズムは対象を陽性同定し、それらを中央データベースに「陽性」として登録することができる。患者が陽性対照のみを有し、アンプリコン（例えば、ＣＯＶＩＤ１９特異的抗体、ＳＡＲＳ特異的抗体、インフルエンザ特異的抗体）を有さない場合、それらには「陰性」結果が割り当てられる。いくつかの実施形態では、報告システムは、結果を患者、医師、又は診療所などに転送することができる。

本明細書で提供される方法は、一般に、種々の患者集団及び／又は１つ若しくは複数の病原性変異体を有する同じ患者から得られた複数の配列データから、バーコード化アンプリコンのコンセンサス配列を決定するための堅牢で柔軟な方法及びシステムに関する。生体分子配列決定のための技術及び方法は、必ずしも完全な配列データを生成するとは限らない。例えば、ＤＮＡシーケンシングデータが１００％の精度ですべての塩基を一義的に同定しない場合が多く、これは、シーケンシングデータが単一の合格又は「リード」から生成される場合に特に当てはまる。特定の実施形態では、この方法は、任意の１合格配列分析システムよりも正確に、核酸配列を最終コンセンサス配列のセットに同化させるためのアルゴリズムを含む。特定の実施形態において、この方法は、配列情報をＰＣＲアンプリコンから生のＯＮＴＦＡＳＴＳシーケンシング出力ファイルに変換し、それを次いで、高精度ＯＮＴＧＰＵに基づくベースコーラーによって生のＦＡＳＴＡ／ＦＡＳＴＱファイルに変換するアルゴリズムを含む。この方法は、ＦＡＳＴＡ／ＦＡＳＴＱファイルをＨＭＭＥＲ３及びＣＭ配列アラインメント及びアノテーションエンジンに供して、参照バーコード候補に対する最小レーベンシュタイン距離スコアを合格する二重バーコードを有する配列リードを得るアルゴリズムをさらに含む。本明細書に記載される方法のこれらの合格リードは、完全な標的配列アノテーション、モデルフィット、ビットスコア、バーコード位置、バーコード距離、及び他のメトリックと共に中央データベースに記憶される。

特定の実施形態では、本明細書に記載の方法は、複数の試料からの標的分析物の同時同定を可能にする多重化近接ライゲーションアッセイを含む。アッセイのオリゴヌクレオチド成分（例えば、環状アンプリコンのバーコード、プローブオリゴのバーコード）のバーコードを修飾することによって、この設定は、いくつかの患者試料からの標的分析物の同時検出を可能にする。例えば、３８４×３８４の固有の組み合わせのマルチプレックスアレイは、１４７０００個の別個の患者試料中の標的分析物（例えば、ＣＯＶＩＤ１９のＳタンパク質に対するＩｇＧ又はＩｇＭ免疫グロブリン）の存在を定量的及び定性的に同時に評価することができる。本開示の関連する態様では、本明細書に記載の血清学的アッセイ方法は、例えば、病原体感染の決定因子である２つ以上の標的分析物を検出するためのマルチプレックス設定において特に有用である。この方法は、コンビナトリアル様式で使用され得る。例えば、それは、それぞれＣＯＶＩＤ１９及びインフルエンザ感染の決定因子である少なくとも２つの標的抗体を検出するために使用され得る。そのような実施形態において、固有のバーコードを有する環状ＤＮＡ鋳型及び／又は固有のバーコードを有する近接プローブの対が、標的抗体の各々について提供される場合がある。特定の実施形態では、環状断片は、識別バーコード（例えば、患者識別バーコード）及び疾患型バーコードを有するが、プローブオリゴからのアダプターは、標的に応じて異なる。

したがって、固有のバーコードを有する検出可能な環状ＤＮＡアンプリコンは、同じ標的抗体に結合した近接プローブの各対から同様の様式で作製され得る。「バーコード」は、シーケンシングに基づいてデコードされる。アッセイ結果は、各患者からの各試料を独自に識別する固有のバーコードについて配列ファイルをスキャンするアルゴリズムによって読み取ることができる。各標的抗体に対応する固有のアンプリコンを検出すると、アルゴリズムは対象を陽性同定し、それらを感染それぞれについて中央データベースに「陽性」として登録することができる。患者が陽性対照を有し、任意の標的抗体に対応するアンプリコンを有さない場合、それらには「陰性」結果が割り当てられる。

以下の実施例は、本明細書に記載される組成物及び方法がどのように使用され、作製され、評価され得るかの説明を当業者に提供するために記載され、本開示の純粋に例示的なものであることを意図し、本発明者らが本発明とみなすものの範囲を限定することを意図しない。

実施例１：別個の病原体に対する増幅プライマーの同定及びスクリーニング
別個の病原体に対するプライマーの設計では、プライマーの選択は、別個の、かつ各病原体に固有のゲノム領域に対して行われる。上記で選択されたプライマーを用いた増幅によって産生された得られたアンプリコンは、それらの別個の病原体の各々のためのゲノム配列を有する。ＨＭＭモデルは、病原体配列及びそれらのバーコードのそれぞれについて定義され、アラインメントにおいて、病原体配列に最も密接に一致する（例えば、最も高いビットスコアを有するアラインメント）モデルは、オリジナル試料にどの病原体が存在したかを示す。これらのプライマーは、本明細書に記載されるようにバーコード化（例えば、１段階又は２段階バーコード化）することができる。バーコード配列及びプライマーは、二次構造相互作用についてスクリーニングされた非常に大きな検証済みＩＤＴバーコードライブラリーから選択され、高度に最適化されたエラー耐性バーコード設計をもたらす。非限定的な例示的バーコード配列を表１に提供する。表１に提供される９６個のバーコード配列（３０００＋総バーコード内から選択された）は、最大レーベンシュタイン距離で分離されている。本明細書に記載される方法は、最大レーベンシュタイン距離で分離された３８４個のバーコード配列を使用することができる。バーコード配列の選択はアルゴリズム的に行われ、選択サイズに応じて異なる結果をもたらす。本明細書で提供される方法及び組成物の実施形態において、選択されるバーコード配列の数は、プライマーが構築されるバーコードプールのサイズに基づく。シーケンシングの際に、これらのバーコードを識別し、シーケンシングされた各アンプリコンに患者の同一性を割り当てるために使用することもできる。

実施例２：アンプリコン設計
アンプリコン設計は、プライマーの５’末端のそれぞれにバーコード化配列及びスペーサー（アダプター）配列を用いて合成された病原体特異的フォワードプライマー及びリバースプライマーから始まる。病原体のゲノムの存在下で増幅すると、これはアンプリコンプールをもたらし、そこでＤＮＡの各鎖はスペーサー（アダプター）及びバーコードを含む。スペーサーは、ＨＭＭ／ＣＭアラインメントエンジンがバーコードを正確に識別し、最終配列内の別個のバーコードを分析することができるために不可欠である。アダプター配列の非限定的な例は、本明細書において、ＡＣＡＣＴＧＡＣＧＡＣＡＴＧＧＴＴＣＴＡＣＡ（配列番号２１）及びＴＡＣＧＧＴＡＧＣＡＧＡＧＡＣＴＴＧＧＴＣＴ（配列番号２２）に記載のポリヌクレオチド配列で提供される。

実施例３：配列変異体の分析
病原性変異体は、アンプリコンを形成するために使用されるプライマーが、各変異体に特異的なホールマーク変異を有することが知られているゲノム領域（例えば、ＳＡＲＳ－ＣｏＶ－２スパイクタンパク質の受容体結合ドメイン）に及ぶ場合、容易に同定され得る。病原体試料のシーケンシングにおいて、鋳型配列（例えば、非バーコード、非スペーサー）を、最高スコアリングのアンプリコンで参照ゲノムデータベースに対してアラインメントすることができる。次いで、配列類似性又は同一性によって、鋳型配列に対する先に記載された配列の近接一致の判定を行うことができる。あるいは、各患者由来の鋳型配列の多重配列アラインメントを実施してコンセンサス配列を生成することができる。患者あたり数百から数万のアンプリコン配列が頻繁に得られ、時折シーケンサーのエラーがあっても、非常に堅牢なコンセンサス配列が可能になる。次いで、コンセンサス配列を、ゲノム又はタンパク質参照データベース（例えば、Ｇｅｎｂａｎｋ又は特注の参照ゲノムデータベース）中の配列にアラインメントすることができる。

実施例４：ＳＡＲＳ－ＣｏＶ－２ウイルス検出
Ａ．プライマー設計及びバーコード化アンプリコンの生成
高度にコンピュータ的に最適化されたアンプリコン（モチーフ、バーコード、スペーサー、及び明確に定義されたウイルスインサート）を生成しながらスループットを最大化するように設計されたＰＣＲプライマー及びライゲーション反応。
ＳＡＲＳ－ＣｏＶ－２への曝露が知られた、又は疑われる患者からの生物学的試料（例えば、血液、唾液又は粘液）を得た。例示的な標的ゲノムとして、ＳＡＲＳ－Ｃｏｖ－２ゲノムを選択した。Ｅ－Ｇｕｅｌｐｈ、Ｎ＿ＨＫＵ、Ｎ２、Ｏｒｆｌａｂタンパク質をエンコードするヌクレオチドに対応する約７～１２の核酸塩基長の固有配列セグメントを同定した。発生頻度及び選択比の値を決定した。ほとんどの場合、プライマーは、その対応するゲノム配列セグメント（例えば、Ｅ－Ｇｕｅｌｐｈ、Ｎ＿ＨＫＵ、Ｎ２、Ｏｒｆｌａｂタンパク質をエンコードするヌクレオチドに対応するセグメント）に対して１００％の相補性でハイブリダイズするように設計された。少数の他の場合では、縮重プライマーを調製した。プライマーの縮重塩基は、標的内でアンビギュイティを有する位置と相補的な位置に生じる。標準的なｑＰＣＲプライマーは、プローブハイブリダイゼーションのためにＤＮＡの小セグメントを増幅する。図４に示すように、ｑＰＣＲアンプリコンは患者ごとに同一である。

図４は、各患者の試料に固有のバーコード化配列にライゲーションされた核酸塩基長約２０のプライマーを使用して、ＳＡＲＳ－Ｃｏｖ２ゲノム中の標的Ｎ１タンパク質の増幅によって生成された例示的なアンプリコンを示す。図４に示されるように、各標的配列は同一であるが、配列の末端における固有のバーコードは個々の患者試料を互いから識別し、試料ＩＤを保持しながらの試料プーリングを可能にする。

Ｂ．マルチプレックスＰＣＲ及びシーケンシング
図５Ａは、ＳＡＲＳ－Ｃｏｖ２ゲノムからの例示的な標的Ｅ－Ｇｕｅｌｐｈタンパク質の配列標識及びスコアリングデータを示す。プールされたライブラリー調製物からのＰＣＲアンプリコンをＯＮＴＭｉｎｌＯＮ又はＧｒｉｄｉＯＮでシーケンシングして、生のＯＮＴＦＡＳＴＳシーケンシング出力ファイルを得た。出力ファイルを高精度ＯＮＴＧＰＵに基づくベースコーラーに供して、生のＦＡＳＴＡ／ＦＡＳＴＱファイルを得た。ＦＡＳＴＡ／ＦＡＳＴＱファイルをＨＭＭＥＲ３及びＣＭ配列アラインメント及びアノテーションエンジンで実行した。ＨＭＭ／ＣＭエンジンは、統計的パターン分類アルゴリズムを適用して、ａ）複製配列リードに基づいて尤度を最大化すること、及び／又はｂ）全ゲノム多重配列アラインメントに基づいて文脈依存アラインメントモデルパラメータを使用することによってコンセンサス配列を生成する。図５Ａは、ビットスコア並びにバーコード及びウイルスインサート領域のアラインメントを示す。

ＳＡＲＳ－ＣｏＶ－２ウイルス検出アッセイに使用するための、広範囲のＳＡＲＳ－ＣｏＶ－２遺伝子標的（例えば、Ｅ－Ｇｕｅｌｐｈ、Ｎ－ＨＫＵ）及び対照（例えば、ＴＭＥ）の両方を評価した。複数のＰＣＲマスター混合物を評価した。すべての標的が適切なＰＣＲ増幅を示し、より長い遺伝子及びＮＥＢマスター混合物（選択されたＬｕｎａ－Ｔａｑ）において優位であった。図６は、ＳＡＲＳＧｏＶ－２遺伝子標的からの多重化ＰＣＲ及びシーケンシング結果を示す。結果は、優れた増幅及び高いアラインメントスコアを実証する。比較的控えめなスコアカットオフであっても、多数の高スコアリングリードが得られた。図７及び表３に示すように、複数のシーケンシング実施にわたって、ほぼ同一の交差実行配列回復を伴う高い再現性が得られた。

実施例４：ＳＡＲＳ－ＣｏＶ２に曝露された患者からのポイントオブケアデータ
生物学的試料（例えば、血液、唾液又は粘液）は、ＳＡＲＳ－ＣｏＶ－２への曝露が知られた、又は疑われる７人の患者から得られた。特異的な標的特異的プライマーを、Ｅ－Ｇｕｅｌｐｈ、Ｎ＿ＨＫＵ、Ｎ２、Ｏｒｆｌａｂタンパク質をエンコードするヌクレオチドに１００％の相補性でハイブリダイズするように設計した。ＰＣＲアンプリコンは、各患者の試料に固有のバーコード化配列にライゲーションされた核酸塩基長約２０のプライマーを使用して、ＳＡＲＳ－Ｃｏｖ２ゲノム中の標的タンパク質Ｅ－Ｇｕｅｌｐｈ、Ｎ＿ＨＫＵ、Ｎ２、Ｏｒｆｌａｂタンパク質の増幅によって生成された。ｑＰＣＲは、７人中３人の患者が陰性であることを示した。本明細書に記載の大規模並行診断法を使用して、すべてのｑＰＣＲ陰性試料について高品質のリードを得た。結果を表４に要約する。

他の実施形態
本明細書で言及されるすべての刊行物、特許、及び特許出願は、あたかも各独立した刊行物又は特許出願が参照により組み込まれることが具体的かつ個別に示されているのと同程度に、参照により本明細書に組み込まれる。

本開示は、その特定の実施形態に関連して説明されてきたが、さらなる修正が可能であり、本開示は、一般に、本開示の原理に従う、本開示が関係する技術分野内の既知の又は慣習的な実施に含まれ、本明細書で上述した本質的な特徴に適用することができ、特許請求の範囲内に従う本開示からの逸脱を含む、本開示の任意の変形、使用、又は順応を包含することを意図していることが理解されよう。

他の実施形態は、特許請求の範囲内である。

Claims

少なくとも１つの標的核酸を同定するための方法であって、
ａ）複数の対象から複数の生物学的試料を得る工程；
ｂ）複数のポリヌクレオチドを含む全核酸を、前記生物学的試料の各々から得る工程；
ｃ）前記複数のポリヌクレオチドを増幅混合物を使用する増幅に供して、複数のアンプリコンを産生する工程であって、前記増幅混合物が、複数のプライマーと、第１の固有のバーコード配列及びその逆相補体と、少なくとも１対のアダプター配列とを含み、前記複数のプライマーの各々が、それらが結合する前記ポリヌクレオチドの各々に相補的なヌクレオチドのセットを含み、前記第１の固有のバーコード配列が、前記特定の対象から得られた前記生物学的試料を識別し、前記アダプター配列の対が、前記第１の固有のバーコード配列及びその逆相補体に隣接し、前記複数のアンプリコンの各々が、標的増幅領域又は対照領域由来のポリヌクレオチドを含む、工程；
ｄ）前記複数のアンプリコンの各々を検出する工程；及び
ｅ）前記複数のアンプリコンのカテゴリーを決定する工程；
を含み、
前記標的増幅領域からの前記ポリヌクレオチドを含む前記複数のアンプリコンの各々の前記カテゴリーを決定することが、前記対応する対象が前記標的核酸を有することを示し、
工程ｂ）は、前記複数のポリヌクレオチドがＲＮＡ分子を含む場合、工程ｃ）における増幅を実施する前に、前記ＲＮＡから逆転写されたｃＤＮＡを得ること、又は前記ＲＮＡからｃＤＮＡを逆転写することをさらに含む、方法。
工程ｂ）における前記複数のポリヌクレオチドがＲＮＡ分子を含み、工程ｂ）において逆転写酵素を添加して、工程ｃ）における増幅に供される複数のｃＤＮＡを得る、請求項１に記載の方法。
工程ｂ）における前記複数のポリヌクレオチドがＤＮＡ分子をさらに含む、請求項２に記載の方法。
前記標的核酸が、ＲＮＡウイルス、ＤＮＡウイルス、真菌、寄生生物及び細菌からなる群から選択される１つ又は複数の病原体を含む試料から得られる、請求項１に記載の方法。
前記病原体が、アシネトバクター・バウマンニ（Ａｃｉｎｅｔｏｂａｃｔｅｒｂａｕｍａｎｎｉｉ）、アデノウイルス、アフリカ馬疫ウイルス、アフリカ豚コレラウイルス、ズビニ鉤虫（Ａｎｃｌｏｓｔｏｍａｄｕｏｄｅｎａｌｅ）、回虫、黄色アスペルギルス、アスペルギルス・フミガーツス（Ａｓｐｅｒｇｉｌｌｕｓｆｕｍｉｇａｔｕｓ）、アスペルギルス・ニガー（Ａｓｐｅｒｇｉｌｌｕｓｎｉｇｅｒ）、アスペルギルス・オリゼ（Ａｓｐｅｒｇｉｌｌｕｓｏｒｙｚａｅ）、鳥インフルエンザウイルス、炭疽菌、炭疽菌パスツール株、セレウス菌、ウシ流産菌、ブルセラ・メリテンシス（Ｂｒｕｃｅｌｌａｍｅｌｉｔｅｎｓｉｓ）、ブルセラ・スイス（Ｂｒｕｃｅｌｌａｓｕｉｓ）、鼻疽菌、類鼻疽菌、カンジダ・アルビカンス（Ｃａｎｄｉｄａａｌｂｉｃａｎｓ）、カンジダ・ドゥブリニエンシス（Ｃａｎｄｉｄａｄｕｂｌｉｎｉｅｎｓｉｓ）、カンジダ・グラブラタ（Ｃａｎｄｉｄａｇｌａｂｒａｔａ）、カンジダ・クルセイ（Ｃａｎｄｉｄａｋｒｕｓｅｉ）、カンジダ・トロピカリス（Ｃａｎｄｉｄａｔｒｏｐｉｃａｌｉｓ）、クラミジア・ニューモニエ（Ｃｈｌａｍｙｄｉａｐｎｅｕｍｏｎｅａｅ）、クラミジア・トラコマチス（Ｃｈｌａｍｙｄｉａｔｒａｃｈｏｍａｔｏｕｓ）、豚熱ウイルス、クロストリジウム・ディフィシール（Ｃｌｏｓｔｒｉｄｉｕｍｄｉｆｆｉｃｉｌｅ）、コクシジオイデス・イミティス（Ｃｏｃｃｉｄｉｏｉｄｅｓｉｍｍｉｔｉｓ）、コクシジオイデス・ポサダシ（Ｃｏｃｃｉｄｉｏｉｄｅｓｐｏｓａｄａｓｉｉ）、ＣｏＶ－２２９Ｅ、ＣｏＶ－ＨＫＵ１、ＣｏＶ－ＮＬ６３、ＣｏＶ－ＯＣ４３、コクサッキーウイルスＡ、コクサッキーウイルスＢ、コクシエラ・バーネッティ（Ｃｏｘｉｅｌｌａｂｕｒｎｅｔｉｉ）、クリミア・コンゴ出血熱、サイトメガロウイルス、デングウイルス、メジナ虫、東部馬脳炎、エボラウイルス、い粒条虫、多包条虫、エンテロバクター・クロアカ、エンテロコッカス・フェシウム（Ｅｎｔｅｒｏｃｏｃｃｕｓｆａｅｃｉｕｍ）、エンテロウイルス、エプスタイン・バール・ウイルス、大腸菌、巨大肝蛭、肝蛭、***ウイルス、野兎病菌、山羊痘ウイルス、ヘモフィルス属インフルエンザ、ヘリコバクターピロリ、ヘンドラウイルス、Ａ型肝炎ウイルス、Ｂ型肝炎ウイルス、Ｃ型肝炎ウイルス、ヒストプラスマ・カプスラーツム（Ｈｉｓｔｏｐｌａｓｍａｃａｐｓｕｌａｔｕｍ）、ズボアジ型ヒストプラスマ症（Ｈｉｓｔｏｐｌａｓｍａｄｕｂｏｉｓｉｉ）、ヒトヘルペスウイルスＨＨＶ６、ヒトヘルペスウイルスＨＨＶ７、ヒトヘルペスウイルスＨＨＶ８、ヒトヘルペスウイルスＨＳＶ１、ヒトヘルペスウイルスＨＳＶ２、ヒト免疫不全ウイルス、ヒトパピローマウイルス、インフルエンザウイルスＡ型、インフルエンザウイルスＢ型、クレブシェラ肺炎桿菌、キャサヌール森林病ウイルス、ラッサ熱ウイルス、レジオネラ・ニューモフィラ菌、リーシュマニア・プロマスティゴート（Ｌｅｉｓｈｍａｎｉａｐｒｏｍａｓｔｉｇｏｔｅｓ）、Ｌｕｊｏウイルス、ランピースキン病ウイルス、マールブルグウイルス、麻疹ウイルス、メチシリン耐性黄色ブドウ球菌、サル痘ウイルス、ムンプスウイルス、マイコバクテリウム・アブセッサス（Ｍｙｃｏｂａｃｔｅｒｉｕｍａｂｓｃｅｓｓｕｓ）、マイコバクテリウム・アビウム（Ｍｙｃｏｂａｃｔｅｒｉｕｍａｖｉｕｍ）、マイコバクテリウム・ボビス（Ｍｙｃｏｂａｃｔｅｒｉｕｍｂｏｖｉｓ）、マイコバクテリウム・カヌッティイ（Ｍｙｃｏｂａｃｔｅｒｉｕｍｃａｎｅｔｔｉｉ）、マイコバクテリウム・レプレ（Ｍｙｃｏｂａｃｔｅｒｉｕｍｌｅｐｒａｅ）、ヒト結核菌、マイコバクテリウム・ウルセランス（Ｍｙｃｏｂａｃｔｅｒｉｕｍｕｌｃｅｒａｎｓ）、マイコプラズマ・カプリコルム（Ｍｙｃｏｐｌａｓｍａｃａｐｒｉｃｏｌｕｍ）、マイコプラズマ・ミコイデス（Ｍｙｃｏｐｌａｓｍａｍｙｃｏｉｄｅｓ）、マイコプラズマ・ニューモニア（Ｍｙｃｏｐｌａｓｍａｐｎｅｕｍｏｎｅａｅ）、アメリカ十二指腸虫、淋病、ニューカッスル病ウイルス、ニパウイルス、ノルカジア属ｂｅｉｊｉｎｇｅｎｓｉｓ、ノルカジア属ｃｙｒｉａｃｉｇｅｏｒｇｉｃａ、ノルカジア属ｆａｒｃｉｎｉｃａ、ノロウイルスＧＩ、ノロウイルスＧＩＩ、ノーウォークウイルス、オムスク出血熱ウイルス、回旋糸状虫、発癌性ヒトパピローマウイルス、パラインフルエンザウイルス、寄生生物、マルネッフェイ型ペニシリウム症（Ｐｅｎｉｃｉｌｌｉｏｓｉｓｍａｍｅｆｆｅｉ）、小反芻獣疫ウイルス（Ｐｅｓｔｅｄｅｓｐｅｒｉｌｓｒｕｍｉｎａｎｔｓｖｉｒｕｓ）、ニューモシスチス・イロベチイ（Ｐｎｅｕｍｏｃｙｓｔｉｓｊｉｒｏｖｅｃｉｉ）、ポリオーマウイルス、プロテウス・ミラビリス（Ｐｒｏｔｅｕｓｍｉｒａｂｉｌｉｓ）、緑膿菌、狂犬病ウイルス、８つの遺伝子断片すべてのコーディング領域の任意の部分を含有する、１９１８年のパンデミックインフルエンザウイルスの再構築された複製コンピテント形態、呼吸器合胞体ウイルス、ライノウイルス、発疹チフスリケッチア、リフトバレー熱ウイルス、牛疫ウイルス、ロタウイルスＡ、ロタウイルスＢ、ロタウイルスＣ、ロタウイルスＧ２、風疹ウイルス、ＳＡＲＳ関連コロナウイルス（ＳＡＲＳ－ＣｏＶ）、ＳＡＲＳ－ＣｏＶ－１、ＳＡＲＳ－ＣｏＶ－２、ビルハルツ住血吸虫、日本住血吸虫、マンソン住血吸虫、羊痘ウイルス、南米出血熱ウイルスチャパレ、南米出血熱ウイルスグアナリト、南米出血熱ウイルスフニン、南米出血熱ウイルスマチュポ、南米出血熱ウイルスサビア、黄色ブドウ球菌、スタフィロコッカス・サプロフィティカス（Ｓｔａｐｈｙｌｏｃｏｃｃｕｓｓａｐｒｏｐｈｙｔｉｃｕｓ）、肺炎レンサ球菌、豚水疱病ウイルス、有鉤条虫、ダニ媒介性脳炎複合（ｆｌａｖｉ）ウイルス極東亜型、ダニ媒介性脳炎複合（ｆｌａｖｉ）ウイルスシベリア亜型、タバコモザイク病ウイルス、トルクテノウイルス、鞭虫、ブルーストリパノソーマ（Ｔｒｙｐａｎｏｓｏｍａｂｍｃｅｉ）、トリパノソーマ・クルージ（Ｔｒｙｐａｎｏｓｏｍａｃｒｕｚｉ）、大痘瘡ウイルス（天然痘ウイルス）、小痘瘡ウイルス（アラストリム）、ベネズエラ馬脳炎ウイルス、バンクロフト糸状虫、ペスト菌、及び上記の病原体のいずれか１つと特徴的な核酸配列を共有する病原体からなる群から選択される、請求項４に記載の方法。
前記アダプター配列の対が、前記第１の固有のバーコード配列及びその逆相補体を第２の固有のバーコード配列及びその逆相補体から分離する、請求項１に記載の方法。
前記試料が、血液、粘液、唾液、汗、涙、体腔に蓄積する流体、尿、***液、膣分泌物、脳脊髄液、リンパ液、糞便、痰、分解液、嘔吐物、汗、母乳、血清及び血漿からなる群から選択される、請求項１～６のいずれか一項に記載の方法。
前記ＲＮＡウイルスがＳＡＲＳ－ＣｏＶ－２である、請求項６に記載の方法。
前記試料が唾液である、請求項７に記載の方法。
検出することが、前記アダプター配列の対並びに前記第１の固有のバーコード配列及びその逆相補体を含む前記複数のアンプリコンをシーケンシングすることを含む、請求項１に記載の方法。
検出することが、前記アダプター配列の対、前記第１の固有のバーコード配列及びその逆相補体、並びに前記第２の固有のバーコード配列及びその逆相補体を含む前記複数のアンプリコンをシーケンシングすることを含む、請求項６に記載の方法。
前記検出することが、一連のプログラムを用いてシーケンシングデータファイルを読み取ることによって行われる、請求項１０又は１１に記載の方法。
前記シーケンシングデータファイルがＦＡＳＴＡ／ＦＡＳＴＱフォーマットファイルである、請求項１２に記載の方法。
前記一連のプログラムが、ＨＭＭＥＲ／Ｉｎｆｅｒｎａｌアラインメントエンジンを含む、請求項１２に記載の方法。
少なくとも１つの陽性対照試料をシーケンシングすることをさらに含み、前記陽性対照試料が前記標的核酸を含む、請求項１０～１４のいずれか一項に記載の方法。
少なくとも１つの陽性対照試料をシーケンシングすることをさらに含み、前記陽性対照試料がバクテリオファージＭＳ２である、請求項１０～１４のいずれか一項に記載の方法。
少なくとも１つの陽性対照試料をシーケンシングすることをさらに含み、前記陽性対照試料がＭＳ２鋳型核酸である、請求項１０～１４のいずれか一項に記載の方法。
少なくとも１つの陽性対照試料をシーケンシングすることをさらに含み、前記陽性対照試料がＲＮＡｓｅＰ又は別の非病原体遺伝子である、請求項１０～１４のいずれか一項に記載の方法。
少なくとも１つの陽性対照試料をシーケンシングすることをさらに含み、前記陽性対照試料が、ヒトハウスキーピング遺伝子ＧＡＰＤＨ又はベータアクチン由来の核酸である、請求項１０～１４のいずれか一項に記載の方法。
前記複数のプライマーが、少なくとも９６個の異なるバーコード化プライマーを含む、請求項１～１７のいずれか一項に記載の方法。
２つ以上の標的核酸を同定することを含む、請求項１～１７のいずれか一項に記載の方法。
前記２つ以上の標的核酸が、単一の病原体の病原性決定因子であるか、又は病原性決定因子をエンコードする、請求項２１に記載の方法。
前記２つ以上の標的核酸が、ウイルスの病原性決定因子であるか、又は病原性決定因子をエンコードする、請求項２２に記載の方法。
前記ウイルスがＳＡＲＳ－ＣｏＶ－２である、請求項２３に記載の方法。
前記病原性決定因子が、スパイクタンパク質（Ｓ）、受容体結合ドメイン（ＲＢＤ）、Ｓ１タンパク質、Ｓ２タンパク質、Ｅ遺伝子、Ｓ遺伝子、Ｏｒｆｌａｂ遺伝子、Ｎ末端スパイクタンパク質ドメイン、全タンパク質（Ｓ１＋Ｓ２）、及びヌクレオカプシド（Ｎ）タンパク質からなる群から選択される、請求項２４に記載の方法。
前記２つ以上の標的核酸が、ＲＮＡウイルス、ＤＮＡウイルス、真菌、寄生生物及び細菌からなる群から選択される少なくとも２つの異なる病原体の病原性決定因子であるか、又は病原性決定因子をエンコードする、請求項２２に記載の方法。
前記２つの異なるＲＮＡウイルスが、ＳＡＲＳ－ＣｏＶ－２及びインフルエンザである、請求項２６に記載の方法。
前記増幅がローリングサークル増幅である、請求項１～２７のいずれか一項に記載の方法。
前記増幅がポリメラーゼ連鎖反応増幅である、請求項１～２７のいずれか一項に記載の方法。
複数の試料から少なくとも１つの標的タンパク質を検出するためのアレイのマルチプレックスであって、前記アレイが、
ａ．各々が複数の固有の捕捉剤を含む、独自に標識された複数のビーズに結合した複数の捕捉剤；
ｂ．少なくとも１つのビーズに結合するように設計され、前記ビーズが、少なくとも１つの標的タンパク質に特異的に結合する抗原でコーティングされている、少なくとも１つの第１のオリゴヌクレオチド配列；
ｃ．第２のオリゴヌクレオチド配列とコンジュゲートされ、前記第２のオリゴヌクレオチド配列が、前記第２のオリゴヌクレオチド配列が前記第１のオリゴヌクレオチド配列に近接している場合に増幅されて、環状アンプリコンを形成するように設計されている、少なくとも１つの二次抗体；及び
ｄ．前記環状アンプリコン中の少なくとも１つの固有のヌクレオチドバーコード配列を含む、アレイのマルチプレックス。
前記第１のオリゴヌクレオチド配列、又は前記第２のオリゴヌクレオチド配列、又はその両方が少なくとも１つの固有のバーコード配列を含む、請求項３０に記載のアレイのマルチプレックス。
アレイが、前記第１のオリゴヌクレオチド配列又は前記第２のオリゴヌクレオチド配列、又はそれらの組み合わせ中に少なくとも３８４個の異なるバーコード配列を含む、請求項３１に記載のアレイのマルチプレックス。
アレイが、前記環状アンプリコン中に少なくとも９６個の異なるバーコード配列を含む、請求項３０に記載のアレイのマルチプレックス。
前記第１のオリゴヌクレオチド配列が、前記ビーズ上にコーティングされたポリペプチドに共有結合している、請求項３０に記載のアレイのマルチプレックス。
前記第１のオリゴヌクレオチド配列が、抗体又は抗体断片に共有結合し、前記抗体又は前記抗体断片が、前記ビーズ上にコーティングされたポリペプチドに結合する、請求項３０に記載のアレイのマルチプレックス。
複数の生物学的試料において少なくとも１つの感染を同定するための方法であって、
ａ．請求項３０に記載のマルチプレックスアレイを提供する工程；
ｂ．複数の生物学的試料を複数のビーズと共に、少なくとも１つの標的タンパク質が少なくとも１つの前記ビーズの前記固有の捕捉剤と結合するのに十分な条件下でインキュベートする工程；
ｃ．前記ビーズを洗浄して、前記固有の捕捉剤と結合しないあらゆるタンパク質を除去する工程；
ｄ．前記ビーズを複数の二次抗体と共に、前記複数の二次抗体の各々が少なくとも１つの標的タンパク質と複合体を形成する条件、及び複数の複合体が、前記複数の標的タンパク質に結合する前記二次抗体の数に対応して形成される条件下でインキュベートする工程
ｅ．前記ビーズを洗浄して、前記複合体を形成しないあらゆる二次抗体を除去する工程；
ｆ．前記複数の複合体を、前記第２のオリゴヌクレオチド配列の各々を、環状アンプリコンを形成するように前記第１のオリゴヌクレオチド配列の各々にハイブリダイゼーションさせる条件、複数のアンプリコンが前記複数の複合体の数に対応して生成される条件、及び前記複数のアンプリコンの各々が、標的増幅領域又は対照領域由来のポリヌクレオチド、固有のバーコード配列及びその逆相補体、並びにアダプター配列の第１の対を含む条件下でインキュベートする工程；
ｇ．前記複数のアンプリコンを増幅に供する工程；
ｈ．前記ビーズを前記アレイ中にプールし、ハイスループットシーケンシングによって前記複数のアンプリコンを同時に検出する工程；及び
ｉ．前記複数のアンプリコンのカテゴリーを決定する工程を含み；
前記標的増幅領域由来の前記ポリヌクレオチドを含む前記複数のアンプリコンの各々のカテゴリーを決定することが、対応する生物学的試料における感染を示す、方法。
前記複数の試料からの前記試料のそれぞれが、前記インキュベーション工程ｂの前に独自にバーコード化される、請求項３６に記載の方法。
前記マルチプレックスアレイが、前記第１のオリゴヌクレオチド配列又は前記第２のオリゴヌクレオチド配列、又はそれらの組み合わせ中に少なくとも９６個の異なるバーコード配列を含む、請求項３７に記載の方法。
アレイが、前記複数の環状アンプリコン中に少なくとも９６個の異なるバーコード配列を含む、請求項３７に記載の方法。
前記標的タンパク質が抗体又は抗体断片である、請求項３６に記載の方法。
前記抗体がＩｇＭ抗体である、請求項４０に記載の方法。
前記抗体がＩｇＧ抗体である、請求項４０に記載の方法。
前記抗体又は前記抗体断片が、細菌、ＲＮＡウイルス及びＤＮＡウイルスからなる群の抗原に特異的に結合する、請求項４０に記載の方法。
前記抗体又は前記抗体断片が、アシネトバクター・バウマンニ（Ａｃｉｎｅｔｏｂａｃｔｅｒｂａｕｍａｎｎｉｉ）、アデノウイルス、アフリカ馬疫ウイルス、アフリカ豚コレラウイルス、ズビニ鉤虫（Ａｎｃｌｏｓｔｏｍａｄｕｏｄｅｎａｌｅ）、回虫、黄色アスペルギルス、アスペルギルス・フミガーツス（Ａｓｐｅｒｇｉｌｌｕｓｆｕｍｉｇａｔｕｓ）、アスペルギルス・ニガー（Ａｓｐｅｒｇｉｌｌｕｓｎｉｇｅｒ）、アスペルギルス・オリゼ（Ａｓｐｅｒｇｉｌｌｕｓｏｒｙｚａｅ）、鳥インフルエンザウイルス、炭疽菌、炭疽菌パスツール株、セレウス菌、ウシ流産菌、ブルセラ・メリテンシス（Ｂｒｕｃｅｌｌａｍｅｌｉｔｅｎｓｉｓ）、ブルセラ・スイス（Ｂｒｕｃｅｌｌａｓｕｉｓ）、鼻疽菌、類鼻疽菌、カンジダ・アルビカンス（Ｃａｎｄｉｄａａｌｂｉｃａｎｓ）、カンジダ・ドゥブリニエンシス（Ｃａｎｄｉｄａｄｕｂｌｉｎｉｅｎｓｉｓ）、カンジダ・グラブラタ（Ｃａｎｄｉｄａｇｌａｂｒａｔａ）、カンジダ・クルセイ（Ｃａｎｄｉｄａｋｒｕｓｅｉ）、カンジダ・トロピカリス（Ｃａｎｄｉｄａｔｒｏｐｉｃａｌｉｓ）、クラミジア・ニューモニエ（Ｃｈｌａｍｙｄｉａｐｎｅｕｍｏｎｅａｅ）、クラミジア・トラコマチス（Ｃｈｌａｍｙｄｉａｔｒａｃｈｏｍａｔｏｕｓ）、豚熱ウイルス、クロストリジウム・ディフィシール（Ｃｌｏｓｔｒｉｄｉｕｍｄｉｆｆｉｃｉｌｅ）、コクシジオイデス・イミティス（Ｃｏｃｃｉｄｉｏｉｄｅｓｉｍｍｉｔｉｓ）、コクシジオイデス・ポサダシ（Ｃｏｃｃｉｄｉｏｉｄｅｓｐｏｓａｄａｓｉｉ）、ＣｏＶ－２２９Ｅ、ＣｏＶ－ＨＫＵ１、ＣｏＶ－ＮＬ６３、ＣｏＶ－ＯＣ４３、コクサッキーウイルスＡ、コクサッキーウイルスＢ、コクシエラ・バーネッティ（Ｃｏｘｉｅｌｌａｂｕｒｎｅｔｉｉ）、クリミア・コンゴ出血熱、サイトメガロウイルス、デングウイルス、メジナ虫、東部馬脳炎、エボラウイルス、い粒条虫、多包条虫、エンテロバクター・クロアカ、エンテロコッカス・フェシウム（Ｅｎｔｅｒｏｃｏｃｃｕｓｆａｅｃｉｕｍ）、エンテロウイルス、エプスタイン・バール・ウイルス、大腸菌、巨大肝蛭、肝蛭、***ウイルス、野兎病菌、山羊痘ウイルス、ヘモフィルス属インフルエンザ、ヘリコバクターピロリ、ヘンドラウイルス、Ａ型肝炎ウイルス、Ｂ型肝炎ウイルス、Ｃ型肝炎ウイルス、ヒストプラスマ・カプスラーツム（Ｈｉｓｔｏｐｌａｓｍａｃａｐｓｕｌａｔｕｍ）、ズボアジ型ヒストプラスマ症（Ｈｉｓｔｏｐｌａｓｍａｄｕｂｏｉｓｉｉ）、ヒトヘルペスウイルスＨＨＶ６、ヒトヘルペスウイルスＨＨＶ７、ヒトヘルペスウイルスＨＨＶ８、ヒトヘルペスウイルスＨＳＶ１、ヒトヘルペスウイルスＨＳＶ２、ヒト免疫不全ウイルス、ヒトパピローマウイルス、インフルエンザウイルスＡ型、インフルエンザウイルスＢ型、クレブシェラ肺炎桿菌、キャサヌール森林病ウイルス、ラッサ熱ウイルス、レジオネラ・ニューモフィラ菌、リーシュマニア・プロマスティゴート（Ｌｅｉｓｈｍａｎｉａｐｒｏｍａｓｔｉｇｏｔｅｓ）、Ｌｕｊｏウイルス、ランピースキン病ウイルス、マールブルグウイルス、麻疹ウイルス、メチシリン耐性黄色ブドウ球菌、サル痘ウイルス、ムンプスウイルス、マイコバクテリウム・アブセッサス（Ｍｙｃｏｂａｃｔｅｒｉｕｍａｂｓｃｅｓｓｕｓ）、マイコバクテリウム・アビウム（Ｍｙｃｏｂａｃｔｅｒｉｕｍａｖｉｕｍ）、マイコバクテリウム・ボビス（Ｍｙｃｏｂａｃｔｅｒｉｕｍｂｏｖｉｓ）、マイコバクテリウム・カヌッティイ（Ｍｙｃｏｂａｃｔｅｒｉｕｍｃａｎｅｔｔｉｉ）、マイコバクテリウム・レプレ（Ｍｙｃｏｂａｃｔｅｒｉｕｍｌｅｐｒａｅ）、ヒト結核菌、マイコバクテリウム・ウルセランス（Ｍｙｃｏｂａｃｔｅｒｉｕｍｕｌｃｅｒａｎｓ）、マイコプラズマ・カプリコルム（Ｍｙｃｏｐｌａｓｍａｃａｐｒｉｃｏｌｕｍ）、マイコプラズマ・ミコイデス（Ｍｙｃｏｐｌａｓｍａｍｙｃｏｉｄｅｓ）、マイコプラズマ・ニューモニア（Ｍｙｃｏｐｌａｓｍａｐｎｅｕｍｏｎｅａｅ）、アメリカ十二指腸虫、淋病、ニューカッスル病ウイルス、ニパウイルス、ノルカジア属ｂｅｉｊｉｎｇｅｎｓｉｓ、ノルカジア属ｃｙｒｉａｃｉｇｅｏｒｇｉｃａ、ノルカジア属ｆａｒｃｉｎｉｃａ、ノロウイルスＧＩ、ノロウイルスＧＩＩ、ノーウォークウイルス、オムスク出血熱ウイルス、回旋糸状虫、発癌性ヒトパピローマウイルス、パラインフルエンザウイルス、寄生生物、マルネッフェイ型ペニシリウム症（Ｐｅｎｉｃｉｌｌｉｏｓｉｓｍａｍｅｆｆｅｉ）、小反芻獣疫ウイルス、ニューモシスチス・イロベチイ（Ｐｎｅｕｍｏｃｙｓｔｉｓｊｉｒｏｖｅｃｉｉ）、ポリオーマウイルス、プロテウス・ミラビリス（Ｐｒｏｔｅｕｓｍｉｒａｂｉｌｉｓ）、緑膿菌、狂犬病ウイルス、８つの遺伝子断片すべてのコーディング領域の任意の部分を含有する、１９１８年のパンデミックインフルエンザウイルスの再構築された複製コンピテント形態、呼吸器合胞体ウイルス、ライノウイルス、発疹チフスリケッチア、リフトバレー熱ウイルス、牛疫ウイルス、ロタウイルスＡ、ロタウイルスＢ、ロタウイルスＣ、ロタウイルスＧ２、風疹ウイルス、ＳＡＲＳ関連コロナウイルス（ＳＡＲＳ－ＣｏＶ）、ＳＡＲＳ－ＣｏＶ－１、ＳＡＲＳ－ＣｏＶ－２、ビルハルツ住血吸虫、日本住血吸虫、マンソン住血吸虫、羊痘ウイルス、南米出血熱ウイルスチャパレ、南米出血熱ウイルスグアナリト、南米出血熱ウイルスフニン、南米出血熱ウイルスマチュポ、南米出血熱ウイルスサビア、黄色ブドウ球菌、スタフィロコッカス・サプロフィティカス（Ｓｔａｐｈｙｌｏｃｏｃｃｕｓｓａｐｒｏｐｈｙｔｉｃｕｓ）、肺炎レンサ球菌、豚水疱病ウイルス、有鉤条虫、ダニ媒介性脳炎複合（ｆｌａｖｉ）ウイルス極東亜型、ダニ媒介性脳炎複合（ｆｌａｖｉ）ウイルスシベリア亜型、タバコモザイク病ウイルス、トルクテノウイルス、鞭虫、ブルーストリパノソーマ（Ｔｒｙｐａｎｏｓｏｍａｂｍｃｅｉ）、トリパノソーマ・クルージ（Ｔｒｙｐａｎｏｓｏｍａｃｒｕｚｉ）、大痘瘡ウイルス（天然痘ウイルス）、小痘瘡ウイルス（アラストリム）、ベネズエラ馬脳炎ウイルス、バンクロフト糸状虫、ペスト菌、及び上記の病原体のいずれか１つと特徴的な核酸配列を共有する病原体からなる群から選択される病原体由来の抗原に特異的に結合する、請求項４３に記載の方法。
前記抗体又は前記抗体断片が、ＳＡＲ－ＣｏＶ－２由来の抗原に特異的に結合する、請求項４４に記載の方法。
前記抗体又は前記抗体断片が、Ｓタンパク質、Ｓタンパク質のＲＢＤ、Ｓ１タンパク質、Ｓ２タンパク質、Ｅ遺伝子、Ｓ遺伝子、Ｏｒｆｌａｂ遺伝子、Ｎ末端スパイクタンパク質ドメイン、全タンパク質（Ｓ１＋Ｓ２）、及びＮタンパク質からなる群から選択される抗原に特異的に結合する、請求項４４に記載の方法。
前記試料が、血液、粘液、唾液、汗、涙、体腔に蓄積する流体、尿、***液、膣分泌物、脳脊髄液、リンパ液、糞便、痰、分解液、嘔吐物、汗、母乳、血清及び血漿からなる群から選択される、請求項３６～４７のいずれか一項に記載の方法。
前記試料が血液である、請求項４７に記載の方法。
前記試料が唾液である、請求項４７に記載の方法。
核酸試料中の配列変異体を検出するための方法であって、
ａ．増幅混合物で増幅反応を実行して、複数のアンプリコンを産生する工程であって、前記増幅混合物が、前記核酸試料と、複数のプライマーと、第１の固有のバーコード配列及びその逆相補体と、アダプター配列の第１の対とを含み、前記複数のプライマーの各々が、それらが結合する前記ポリヌクレオチドの各々に相補的なヌクレオチドのセットを含み、前記第１の固有のバーコード配列及びその逆相補体が、特定の対象から得られた前記試料を同定し、前記アダプター配列の対が、前記第１の固有のバーコード配列及びその逆相補体に隣接し、前記複数のアンプリコンの各々が、標的増幅領域又は対照領域由来のポリヌクレオチドを含む、工程；
ｂ．前記複数のアンプリコンを検出、及び場合により定量する工程；
ｃ．前記複数のアンプリコンのカテゴリーを決定する工程；及び
ｄ．工程ｃからの前記複数のアンプリコンにおいて１つ以上の配列変異体を検出する工程を含み、
前記核酸の試料がＲＮＡ分子を含む場合、工程ａ）は、前記増幅反応を行う前に前記ＲＮＡから逆転写されたｃＤＮＡを得ること、又は前記ＲＮＡからｃＤＮＡを逆転写することをさらに含む、方法。
工程ｂにおいて検出することが、前記アダプター配列の第１の対並びに前記第１の固有のバーコード配列及びその逆相補体を含む前記複数のアンプリコンの各々をシーケンシングすることを含む、請求項５０に記載の方法。
前記アダプター配列の第１の対が、前記第１の固有のバーコード配列及びその逆相補体を第２の固有のバーコード配列及びその逆相補体から分離する、請求項５０に記載の方法。
工程ｂにおいて検出することが、前記アダプター配列の第１の対、前記第１の固有のバーコード配列及びその逆相補体、前記第２の固有のバーコード配列及びその逆相補体を含む前記複数のアンプリコンの各々をシーケンシングすることを含む、請求項５２に記載の方法。
工程ｂにおいて検出することが、アダプター配列の第２の対をシーケンシングすることをさらに含む、請求項５２に記載の方法。
前記工程ｂにおいて検出することが、一連のプログラムを用いてシーケンシングデータファイルを読み取ることによって行われる、請求項５０～５４のいずれか一項に記載の方法。
前記シーケンシングデータファイルがＦＡＳＴＡ／ＦＡＳＴＱフォーマットである、請求項５５に記載の方法。
前記一連のプログラムが、ＨＭＭＥＲ／Ｉｎｆｅｒｎａｌアラインメントエンジンを含む、請求項５５に記載の方法。
工程ｄにおける前記検出することが、１つ以上の参照配列との多重配列アラインメントを行うことを含む、請求項５０～５４のいずれか一項に記載の方法。
前記配列アラインメントが、ＨＭＭプロファイル隠れマルコフモデル（ＨＭＭ）エンジン、共分散モデル（ＣＭ）エンジン又はそれらの組み合わせによって行われる、請求項５８に記載の方法。
前記配列変異体を感染の診断又は予後と相関させることをさらに含む、請求項５０に記載の方法。
前記感染が、ＲＮＡウイルス、ＤＮＡウイルス、真菌、寄生生物及び細菌からなる群から選択される１つ又は複数の病原体によって引き起こされる、請求項６０に記載の方法。
前記病原体が、アシネトバクター・バウマンニ（Ａｃｉｎｅｔｏｂａｃｔｅｒｂａｕｍａｎｎｉｉ）、アデノウイルス、アフリカ馬疫ウイルス、アフリカ豚コレラウイルス、ズビニ鉤虫（Ａｎｃｌｏｓｔｏｍａｄｕｏｄｅｎａｌｅ）、回虫、黄色アスペルギルス、アスペルギルス・フミガーツス（Ａｓｐｅｒｇｉｌｌｕｓｆｕｍｉｇａｔｕｓ）、アスペルギルス・ニガー（Ａｓｐｅｒｇｉｌｌｕｓｎｉｇｅｒ）、アスペルギルス・オリゼ（Ａｓｐｅｒｇｉｌｌｕｓｏｒｙｚａｅ）、鳥インフルエンザウイルス、炭疽菌、炭疽菌パスツール株、セレウス菌、ウシ流産菌、ブルセラ・メリテンシス（Ｂｒｕｃｅｌｌａｍｅｌｉｔｅｎｓｉｓ）、ブルセラ・スイス（Ｂｒｕｃｅｌｌａｓｕｉｓ）、鼻疽菌、類鼻疽菌、カンジダ・アルビカンス（Ｃａｎｄｉｄａａｌｂｉｃａｎｓ）、カンジダ・ドゥブリニエンシス（Ｃａｎｄｉｄａｄｕｂｌｉｎｉｅｎｓｉｓ）、カンジダ・グラブラタ（Ｃａｎｄｉｄａｇｌａｂｒａｔａ）、カンジダ・クルセイ（Ｃａｎｄｉｄａｋｒｕｓｅｉ）、カンジダ・トロピカリス（Ｃａｎｄｉｄａｔｒｏｐｉｃａｌｉｓ）、クラミジア・ニューモニエ（Ｃｈｌａｍｙｄｉａｐｎｅｕｍｏｎｅａｅ）、クラミジア・トラコマチス（Ｃｈｌａｍｙｄｉａｔｒａｃｈｏｍａｔｏｕｓ）、豚熱ウイルス、クロストリジウム・ディフィシール（Ｃｌｏｓｔｒｉｄｉｕｍｄｉｆｆｉｃｉｌｅ）、コクシジオイデス・イミティス（Ｃｏｃｃｉｄｉｏｉｄｅｓｉｍｍｉｔｉｓ）、コクシジオイデス・ポサダシ（Ｃｏｃｃｉｄｉｏｉｄｅｓｐｏｓａｄａｓｉｉ）、ＣｏＶ－２２９Ｅ、ＣｏＶ－ＨＫＵ１、ＣｏＶ－ＮＬ６３、ＣｏＶ－ＯＣ４３、コクサッキーウイルスＡ、コクサッキーウイルスＢ、コクシエラ・バーネッティ（Ｃｏｘｉｅｌｌａｂｕｒｎｅｔｉｉ）、クリミア・コンゴ出血熱、サイトメガロウイルス、デングウイルス、メジナ虫、東部馬脳炎、エボラウイルス、い粒条虫、多包条虫、エンテロバクター・クロアカ、エンテロコッカス・フェシウム（Ｅｎｔｅｒｏｃｏｃｃｕｓｆａｅｃｉｕｍ）、エンテロウイルス、エプスタイン・バール・ウイルス、大腸菌、巨大肝蛭、肝蛭、***ウイルス、野兎病菌、山羊痘ウイルス、ヘモフィルス属インフルエンザ、ヘリコバクターピロリ、ヘンドラウイルス、Ａ型肝炎ウイルス、Ｂ型肝炎ウイルス、Ｃ型肝炎ウイルス、ヒストプラスマ・カプスラーツム（Ｈｉｓｔｏｐｌａｓｍａｃａｐｓｕｌａｔｕｍ）、ズボアジ型ヒストプラスマ症（Ｈｉｓｔｏｐｌａｓｍａｄｕｂｏｉｓｉｉ）、ヒトヘルペスウイルスＨＨＶ６、ヒトヘルペスウイルスＨＨＶ７、ヒトヘルペスウイルスＨＨＶ８、ヒトヘルペスウイルスＨＳＶ１、ヒトヘルペスウイルスＨＳＶ２、ヒト免疫不全ウイルス、ヒトパピローマウイルス、インフルエンザウイルスＡ型、インフルエンザウイルスＢ型、クレブシェラ肺炎桿菌、キャサヌール森林病ウイルス、ラッサ熱ウイルス、レジオネラ・ニューモフィラ菌、リーシュマニア・プロマスティゴート（Ｌｅｉｓｈｍａｎｉａｐｒｏｍａｓｔｉｇｏｔｅｓ）、Ｌｕｊｏウイルス、ランピースキン病ウイルス、マールブルグウイルス、麻疹ウイルス、メチシリン耐性黄色ブドウ球菌、サル痘ウイルス、ムンプスウイルス、マイコバクテリウム・アブセッサス（Ｍｙｃｏｂａｃｔｅｒｉｕｍａｂｓｃｅｓｓｕｓ）、マイコバクテリウム・アビウム（Ｍｙｃｏｂａｃｔｅｒｉｕｍａｖｉｕｍ）、マイコバクテリウム・ボビス（Ｍｙｃｏｂａｃｔｅｒｉｕｍｂｏｖｉｓ）、マイコバクテリウム・カヌッティイ（Ｍｙｃｏｂａｃｔｅｒｉｕｍｃａｎｅｔｔｉｉ）、マイコバクテリウム・レプレ（Ｍｙｃｏｂａｃｔｅｒｉｕｍｌｅｐｒａｅ）、ヒト結核菌、マイコバクテリウム・ウルセランス（Ｍｙｃｏｂａｃｔｅｒｉｕｍｕｌｃｅｒａｎｓ）、マイコプラズマ・カプリコルム（Ｍｙｃｏｐｌａｓｍａｃａｐｒｉｃｏｌｕｍ）、マイコプラズマ・ミコイデス（Ｍｙｃｏｐｌａｓｍａｍｙｃｏｉｄｅｓ）、マイコプラズマ・ニューモニア（Ｍｙｃｏｐｌａｓｍａｐｎｅｕｍｏｎｅａｅ）、アメリカ十二指腸虫、淋病、ニューカッスル病ウイルス、ニパウイルス、ノルカジア属ｂｅｉｊｉｎｇｅｎｓｉｓ、ノルカジア属ｃｙｒｉａｃｉｇｅｏｒｇｉｃａ、ノルカジア属ｆａｒｃｉｎｉｃａ、ノロウイルスＧＩ、ノロウイルスＧＩＩ、ノーウォークウイルス、オムスク出血熱ウイルス、回旋糸状虫、発癌性ヒトパピローマウイルス、パラインフルエンザウイルス、寄生生物、マルネッフェイ型ペニシリウム症（Ｐｅｎｉｃｉｌｌｉｏｓｉｓｍａｍｅｆｆｅｉ）、小反芻獣疫ウイルス、ニューモシスチス・イロベチイ（Ｐｎｅｕｍｏｃｙｓｔｉｓｊｉｒｏｖｅｃｉｉ）、ポリオーマウイルス、プロテウス・ミラビリス（Ｐｒｏｔｅｕｓｍｉｒａｂｉｌｉｓ）、緑膿菌、狂犬病ウイルス、８つの遺伝子断片すべてのコーディング領域の任意の部分を含有する、１９１８年のパンデミックインフルエンザウイルスの再構築された複製コンピテント形態、呼吸器合胞体ウイルス、ライノウイルス、発疹チフスリケッチア、リフトバレー熱ウイルス、牛疫ウイルス、ロタウイルスＡ、ロタウイルスＢ、ロタウイルスＣ、ロタウイルスＧ２、風疹ウイルス、ＳＡＲＳ関連コロナウイルス（ＳＡＲＳ－ＣｏＶ）、ＳＡＲＳ－ＣｏＶ－１、ＳＡＲＳ－ＣｏＶ－２、ビルハルツ住血吸虫、日本住血吸虫、マンソン住血吸虫、羊痘ウイルス、南米出血熱ウイルスチャパレ、南米出血熱ウイルスグアナリト、南米出血熱ウイルスフニン、南米出血熱ウイルスマチュポ、南米出血熱ウイルスサビア、黄色ブドウ球菌、スタフィロコッカス・サプロフィティカス（Ｓｔａｐｈｙｌｏｃｏｃｃｕｓｓａｐｒｏｐｈｙｔｉｃｕｓ）、肺炎レンサ球菌、豚水疱病ウイルス、有鉤条虫、ダニ媒介性脳炎複合（ｆｌａｖｉ）ウイルス極東亜型、ダニ媒介性脳炎複合（ｆｌａｖｉ）ウイルスシベリア亜型、タバコモザイク病ウイルス、トルクテノウイルス、鞭虫、ブルーストリパノソーマ（Ｔｒｙｐａｎｏｓｏｍａｂｍｃｅｉ）、トリパノソーマ・クルージ（Ｔｒｙｐａｎｏｓｏｍａｃｒｕｚｉ）、大痘瘡ウイルス（天然痘ウイルス）、小痘瘡ウイルス（アラストリム）、ベネズエラ馬脳炎ウイルス、バンクロフト糸状虫、ペスト菌、及び上記の病原体のいずれか１つと特徴的な核酸配列を共有する病原体からなる群から選択される、請求項６１に記載の方法。
病原体がＳＡＲ－ＣｏＶ－２である、請求項６２に記載の方法。
前記配列変異体が、Ｓタンパク質、Ｓタンパク質のＲＢＤ、Ｓ１タンパク質、Ｓ２タンパク質、Ｅ遺伝子、Ｓ遺伝子、Ｏｒｆｌａｂ遺伝子、Ｎ末端スパイクタンパク質ドメイン、全タンパク質（Ｓ１＋Ｓ２）、及びＮタンパク質からなる群から選択される抗原をエンコードする領域にある、請求項６３に記載の方法。
前記配列変異体が、Ｔ９５Ｉ、Ｄ２５３Ｇ、Ｌ４５２Ｒ、Ｅ４８４Ｋ、Ｓ４７７Ｎ、Ｎ５０１ＹＤ６１４Ｇ及びＡ７０１Ｖからなる群より選択される変異を含む、請求項６４に記載の方法。
前記複数のアンプリコンを検出することが、
ａ．前記複数のアンプリコンのプールされた配列データセットを得る工程であって、各アンプリコン上の各固有のバーコード配列及びその逆相補体が単一の試料に固有であり、第１の単一試料からの各アンプリコンの前記固有のバーコード配列及びその逆相補体が、前記複数のアンプリコン中の他のアンプリコンの前記固有のバーコード配列及びそれらの逆相補体とは異なる、工程；
ｂ．ベースコールを実行する工程；
ｃ．前記複数のアンプリコンの配列データを、予め定義されたアノテーション付きＨＭＭ又はＣＭ遺伝子モデルにアラインメントする工程；
ｄ．前記ＨＭＭ／ＣＭアラインメントの各々にランクを割り当てる工程であって、前記ランクが確率スコア又はビットスコアである、工程；
ｅ．前記配列データをフィルタリングして、各アンプリコン内の前記バーコード並びに前記アンプリコンの配列内の前記バーコード及び前記アダプターの位置を示す、位置的にアノテーションされた配列アラインメントを得る工程；及び
ｆ．適切にプログラムされたコンピュータを使用して少なくとも工程ｂ、ｃ、ｄ、及びｅを実行する工程を含む、請求項１、３６又は５０のいずれか一項に記載の方法。
前記ベースコールが、高精度ＯＮＴＧＰＵに基づくベースコーラーで実行される、請求項６６に記載の方法。
前記ベースコールが生のＦＡＳＴＡ／ＦＡＳＴＱファイルをもたらす、請求項６６に記載の方法。
前記アラインメントが、プロファイルＨＭＭエンジン、ＣＭエンジン、又はそれらの組み合わせによって実行される、請求項６６に記載の方法。
前記ＨＭＭエンジン、前記ＣＭエンジン又はこれらの組み合わせが、前記バーコード、前記標的増幅領域、前記プライマー、及び前記アダプターからなる群から選択される１つ又は複数の配列特徴についてヌクレオチドごとのアノテーションを割り当てる、請求項６９に記載の方法。
前記ＨＭＭエンジンが、複数の配列アラインメントをもたらすＨＭＭＥＲソフトウェアプログラムを含む、請求項６９に記載の方法。
前記複数の配列アラインメントが、前記第１の固有のバーコード配列及びその逆相補体のためのアノテーションを含む、請求項７１に記載の方法。
前記フィルタリングが、前記第１の固有のバーコード配列及びその逆相補体を有する前記配列アラインメントに合格スコア又は不合格スコアを割り当てることを含み、前記第１の固有のバーコード配列及びその逆相補体を有する前記複数の配列アラインメントには、それらが参照バーコード化配列のセットに対する最小レーベンシュタイン距離スコアを合格する場合、及びそれらがアラインメントについての最小ビットスコア閾値を合格する場合、合格スコアが割り当てられる、請求項７２に記載の方法。
前記複数の配列アラインメントが、ヌクレオチドごとに二重バーコードについてのアノテーションを含み、前記二重バーコードが、第１の固有のバーコード配列及びその逆相補体と、第２の固有のバーコード配列及びその逆相補体とを含む、請求項７１に記載の方法。
前記ＨＭＭＥＲソフトウェアプログラムが、前記アダプター配列の第１の対についてのアノテーションを有する配列アラインメントをもたらす、請求項７１に記載の方法。
前記フィルタリングが、前記二重バーコードを有する前記配列アラインメントに合格スコア又は不合格スコアを割り当てることを含み、前記二重バーコードを有する前記複数の配列アラインメントには、それらが参照バーコード化配列のセットに対する最小レーベンシュタイン距離スコアを合格する場合、及びそれらがアラインメントについての最小ビットスコア閾値を合格する場合、合格スコアが割り当てられる、請求項７４に記載の方法。
前記合格スコアを有する前記配列アラインメントが中央データベースに記憶される、請求項７３又は７６のいずれか一項に記載の方法。
前記合格スコアを有する前記配列アラインメントが、前記試料中の病原体負荷の直接的な定量的表示に対応する、請求項７７に記載の方法。
前記データベースが、
試料コレクションチューブに割り当てられた固有のバーコードの情報；
各固有のバーコードが各試料に割り当てられている、少なくとも９６個の固有のウェルバーコードのセットの情報；
各固有のバーコードが固有のプレートに割り当てられている、少なくとも９６個の固有のプレートバーコードのセットの情報；
前記複数のアンプリコンからのシーケンシングデータを含む配列データのセットの情報；及び
各試料のソース識別情報、及び前記試料が前記標的タンパク質の存在について陽性であるか陰性であるかに関する情報を含むレポートを含む、請求項７７に記載の方法。
前記レポートを対応する対象、又は診療所又は医師に提供することをさらに含み、前記試料が対象から得られる、請求項７９に記載の方法。
アンプリコンを含む組成物であって、前記アンプリコンが、第１の固有のバーコード配列及びその逆相補体、標的特異的プライマーの対、標的増幅領域及びアダプター配列の第１の対を含み、前記標的特異的プライマーの対がフォワードプライマー及びリバースプライマーで構成され、それぞれが前記標的増幅領域内の前記プライミング部位に相補的な配列を有し、前記フォワードプライマー及び前記リバースプライマーのそれぞれが前記標的増幅領域に隣接し、前記標的特異的プライマーが前記第１の固有のバーコード配列及びその逆相補体に隣接し、前記第１の固有のバーコード配列及びその逆相補体が前記アダプター配列の第１の対に隣接する、組成物。
第２の固有のバーコード配列及びその逆相補体並びにアダプター配列の第２の対をさらに含み、前記第２の固有のバーコード配列及びその逆相補体並びに前記アダプター配列の第２の対が、前記アンプリコンにライゲーションされている、請求項８１に記載の組成物。
アダプター配列の第１の対が前記アダプター配列の第２の対に隣接し、前記アダプター配列の第２の対が前記第２の固有のバーコード配列及びその逆相補体に隣接する、請求項８２に記載の組成物。
前記標的増幅領域が、遺伝子又はタンパク質についてエンコードする病原体のゲノム領域から増幅され、前記病原体が、アシネトバクター・バウマンニ（Ａｃｉｎｅｔｏｂａｃｔｅｒｂａｕｍａｎｎｉｉ）、アデノウイルス、アフリカ馬疫ウイルス、アフリカ豚コレラウイルス、ズビニ鉤虫（Ａｎｃｌｏｓｔｏｍａｄｕｏｄｅｎａｌｅ）、回虫、黄色アスペルギルス、アスペルギルス・フミガーツス（Ａｓｐｅｒｇｉｌｌｕｓｆｕｍｉｇａｔｕｓ）、アスペルギルス・ニガー（Ａｓｐｅｒｇｉｌｌｕｓｎｉｇｅｒ）、アスペルギルス・オリゼ（Ａｓｐｅｒｇｉｌｌｕｓｏｒｙｚａｅ）、鳥インフルエンザウイルス、炭疽菌、炭疽菌パスツール株、セレウス菌、ウシ流産菌、ブルセラ・メリテンシス（Ｂｒｕｃｅｌｌａｍｅｌｉｔｅｎｓｉｓ）、ブルセラ・スイス（Ｂｒｕｃｅｌｌａｓｕｉｓ）、鼻疽菌、類鼻疽菌、カンジダ・アルビカンス（Ｃａｎｄｉｄａａｌｂｉｃａｎｓ）、カンジダ・ドゥブリニエンシス（Ｃａｎｄｉｄａｄｕｂｌｉｎｉｅｎｓｉｓ）、カンジダ・グラブラタ（Ｃａｎｄｉｄａｇｌａｂｒａｔａ）、カンジダ・クルセイ（Ｃａｎｄｉｄａｋｒｕｓｅｉ）、カンジダ・トロピカリス（Ｃａｎｄｉｄａｔｒｏｐｉｃａｌｉｓ）、クラミジア・ニューモニエ（Ｃｈｌａｍｙｄｉａｐｎｅｕｍｏｎｅａｅ）、クラミジア・トラコマチス（Ｃｈｌａｍｙｄｉａｔｒａｃｈｏｍａｔｏｕｓ）、豚熱ウイルス、クロストリジウム・ディフィシール（Ｃｌｏｓｔｒｉｄｉｕｍｄｉｆｆｉｃｉｌｅ）、コクシジオイデス・イミティス（Ｃｏｃｃｉｄｉｏｉｄｅｓｉｍｍｉｔｉｓ）、コクシジオイデス・ポサダシ（Ｃｏｃｃｉｄｉｏｉｄｅｓｐｏｓａｄａｓｉｉ）、ＣｏＶ－２２９Ｅ、ＣｏＶ－ＨＫＵ１、ＣｏＶ－ＮＬ６３、ＣｏＶ－ＯＣ４３、コクサッキーウイルスＡ、コクサッキーウイルスＢ、コクシエラ・バーネッティ（Ｃｏｘｉｅｌｌａｂｕｒｎｅｔｉｉ）、クリミア・コンゴ出血熱、サイトメガロウイルス、デングウイルス、メジナ虫、東部馬脳炎、エボラウイルス、い粒条虫、多包条虫、エンテロバクター・クロアカ、エンテロコッカス・フェシウム（Ｅｎｔｅｒｏｃｏｃｃｕｓｆａｅｃｉｕｍ）、エンテロウイルス、エプスタイン・バール・ウイルス、大腸菌、巨大肝蛭、肝蛭、***ウイルス、野兎病菌、山羊痘ウイルス、ヘモフィルス属インフルエンザ、ヘリコバクターピロリ、ヘンドラウイルス、Ａ型肝炎ウイルス、Ｂ型肝炎ウイルス、Ｃ型肝炎ウイルス、ヒストプラスマ・カプスラーツム（Ｈｉｓｔｏｐｌａｓｍａｃａｐｓｕｌａｔｕｍ）、ズボアジ型ヒストプラスマ症（Ｈｉｓｔｏｐｌａｓｍａｄｕｂｏｉｓｉｉ）、ヒトヘルペスウイルスＨＨＶ６、ヒトヘルペスウイルスＨＨＶ７、ヒトヘルペスウイルスＨＨＶ８、ヒトヘルペスウイルスＨＳＶ１、ヒトヘルペスウイルスＨＳＶ２、ヒト免疫不全ウイルス、ヒトパピローマウイルス、インフルエンザウイルスＡ型、インフルエンザウイルスＢ型、クレブシェラ肺炎桿菌、キャサヌール森林病ウイルス、ラッサ熱ウイルス、レジオネラ・ニューモフィラ菌、リーシュマニア・プロマスティゴート（Ｌｅｉｓｈｍａｎｉａｐｒｏｍａｓｔｉｇｏｔｅｓ）、Ｌｕｊｏウイルス、ランピースキン病ウイルス、マールブルグウイルス、麻疹ウイルス、メチシリン耐性黄色ブドウ球菌、サル痘ウイルス、ムンプスウイルス、マイコバクテリウム・アブセッサス（Ｍｙｃｏｂａｃｔｅｒｉｕｍａｂｓｃｅｓｓｕｓ）、マイコバクテリウム・アビウム（Ｍｙｃｏｂａｃｔｅｒｉｕｍａｖｉｕｍ）、マイコバクテリウム・ボビス（Ｍｙｃｏｂａｃｔｅｒｉｕｍｂｏｖｉｓ）、マイコバクテリウム・カヌッティイ（Ｍｙｃｏｂａｃｔｅｒｉｕｍｃａｎｅｔｔｉｉ）、マイコバクテリウム・レプレ（Ｍｙｃｏｂａｃｔｅｒｉｕｍｌｅｐｒａｅ）、ヒト結核菌、マイコバクテリウム・ウルセランス（Ｍｙｃｏｂａｃｔｅｒｉｕｍｕｌｃｅｒａｎｓ）、マイコプラズマ・カプリコルム（Ｍｙｃｏｐｌａｓｍａｃａｐｒｉｃｏｌｕｍ）、マイコプラズマ・ミコイデス（Ｍｙｃｏｐｌａｓｍａｍｙｃｏｉｄｅｓ）、マイコプラズマ・ニューモニア（Ｍｙｃｏｐｌａｓｍａｐｎｅｕｍｏｎｅａｅ）、アメリカ十二指腸虫、淋病、ニューカッスル病ウイルス、ニパウイルス、ノルカジア属ｂｅｉｊｉｎｇｅｎｓｉｓ、ノルカジア属ｃｙｒｉａｃｉｇｅｏｒｇｉｃａ、ノルカジア属ｆａｒｃｉｎｉｃａ、ノロウイルスＧＩ、ノロウイルスＧＩＩ、ノーウォークウイルス、オムスク出血熱ウイルス、回旋糸状虫、発癌性ヒトパピローマウイルス、パラインフルエンザウイルス、寄生生物、マルネッフェイ型ペニシリウム症（Ｐｅｎｉｃｉｌｌｉｏｓｉｓｍａｍｅｆｆｅｉ）、小反芻獣疫ウイルス、ニューモシスチス・イロベチイ（Ｐｎｅｕｍｏｃｙｓｔｉｓｊｉｒｏｖｅｃｉｉ）、ポリオーマウイルス、プロテウス・ミラビリス（Ｐｒｏｔｅｕｓｍｉｒａｂｉｌｉｓ）、緑膿菌、狂犬病ウイルス、８つの遺伝子断片すべてのコーディング領域の任意の部分を含有する、１９１８年のパンデミックインフルエンザウイルスの再構築された複製コンピテント形態、呼吸器合胞体ウイルス、ライノウイルス、発疹チフスリケッチア、リフトバレー熱ウイルス、牛疫ウイルス、ロタウイルスＡ、ロタウイルスＢ、ロタウイルスＣ、ロタウイルスＧ２、風疹ウイルス、ＳＡＲＳ関連コロナウイルス（ＳＡＲＳ－ＣｏＶ）、ＳＡＲＳ－ＣｏＶ－１、ＳＡＲＳ－ＣｏＶ－２、ビルハルツ住血吸虫、日本住血吸虫、マンソン住血吸虫、羊痘ウイルス、南米出血熱ウイルスチャパレ、南米出血熱ウイルスグアナリト、南米出血熱ウイルスフニン、南米出血熱ウイルスマチュポ、南米出血熱ウイルスサビア、黄色ブドウ球菌、スタフィロコッカス・サプロフィティカス（Ｓｔａｐｈｙｌｏｃｏｃｃｕｓｓａｐｒｏｐｈｙｔｉｃｕｓ）、肺炎レンサ球菌、豚水疱病ウイルス、有鉤条虫、ダニ媒介性脳炎複合（ｆｌａｖｉ）ウイルス極東亜型、ダニ媒介性脳炎複合（ｆｌａｖｉ）ウイルスシベリア亜型、タバコモザイク病ウイルス、トルクテノウイルス、鞭虫、ブルーストリパノソーマ（Ｔｒｙｐａｎｏｓｏｍａｂｒｕｃｅｉ）、トリパノソーマ・クルージ（Ｔｒｙｐａｎｏｓｏｍａｃｒｕｚｉ）、大痘瘡ウイルス（天然痘ウイルス）、小痘瘡ウイルス（アラストリム）、ベネズエラ馬脳炎ウイルス、バンクロフト糸状虫、ペスト菌、及び上記の病原体のいずれか１つと特徴的な核酸配列を共有する病原体からなる群から選択される、請求項８１～８３のいずれか一項に記載の組成物。
前記病原体がＳＡＲＳ－ＣｏＶ－２である、請求項８４に記載の組成物。
前記標的増幅領域が、Ｓタンパク質、Ｓタンパク質のＲＢＤ、Ｓ１タンパク質、Ｓ２タンパク質、Ｅ遺伝子、Ｓ遺伝子、Ｏｒｆｌａｂ遺伝子、Ｎ末端スパイクタンパク質ドメイン、全タンパク質（Ｓ１＋Ｓ２）、及びＮタンパク質からなる群から選択されるタンパク質についてエンコードするゲノム領域から増幅される、請求項８５に記載の組成物。
前記標的増幅領域が、前記Ｓタンパク質をエンコードする領域から増幅される、請求項８６に記載の組成物。
前記標的増幅領域が、前記Ｓタンパク質の前記ＲＢＤをエンコードする領域から増幅される、請求項８６に記載の組成物。
前記標的増幅領域が、前記Ｎタンパク質をエンコードする領域から増幅される、請求項８６に記載の組成物。
前記固有のバーコード配列及びそれらの逆相補体が、他のすべてのバーコードからの最大レーベンシュタイン距離を有する、請求項８１～８９のいずれか一項に記載の組成物。
前記固有のバーコード配列が、配列番号２３－１１８に示される前記ポリヌクレオチド配列のいずれか１つを含む、請求項９０に記載の組成物。
前記標的特異的プライマーの対が、
フォワードプライマー：ＧＡＣＣＣＣＡＡＡＡＴＣＡＧＣＧＡＡＡＴ（配列番号３）及びリバースプライマー：ＴＣＴＧＧＴＴＡＣＴＧＣＣＡＧＴＴＧＡＡＴＣＴＧ（配列番号４）；
フォワードプライマー：ＴＴＡＣＡＡＡＣＡＴＴＧＧＣＣＧＣＡＡＡ（配列番号５）及びリバースプライマー：ＧＣＧＣＧＡＣＡＴＴＣＣＧＡＡＧＡＡ（配列番号６）；
フォワードプライマー：ＧＧＧＡＧＣＣＴＴＧＡＡＴＡＣＡＣＣＡＡＡＡ（配列番号７）及びリバースプライマー：ＴＧＴＡＧＣＡＣＧＡＴＴＧＣＡＧＣＡＴＴＧ（配列番号８）；
フォワードプライマー：ＧＴＧＡＲＡＴＧＧＴＣＡＴＧＴＧＴＧＧＣＧＧ（配列番号９）及びリバースプライマー：ＣＡＲＡＴＧＴＴＡＡＡＳＡＣＡＣＴＡＴＴＡＧＣＡＴＡ（配列番号１０）；
フォワードプライマー：ＡＣＡＧＧＴＡＣＧＴＴＡＡＴＡＧＴＴＡＡＴＡＧＣＧＴ（配列番号１１）及びリバースプライマー：ＡＴＡＴＴＧＣＡＧＣＡＧＴＡＣＧＣＡＣＡＣＡ（配列番号１２）；
フォワードプライマー：ＣＣＣＴＧＴＧＧＧＴＴＴＴＡＣＡＣＴＴＡＡ（配列番号１３）及びリバースプライマー：ＡＣＧＡＴＴＧＴＧＣＡＴＣＡＧＣＴＧＡ（配列番号１４）；
フォワードプライマー：ＧＴＡＣＴＣＡＴＴＣＧＴＴＴＣＧＧＡＡＧＡＧ（配列番号１５）及びリバースプライマー：ＣＣＡＧＡＡＧＡＴＣＡＧＧＡＡＣＴＣＴＡＧＡ（配列番号１６）；
フォワードプライマー：ＧＧＧＧＡＡＣＴＴＣＴＣＣＴＧＣＴＡＧＡＡＴ（配列番号１７）及びリバースプライマー：ＣＡＧＡＣＡＴＴＴＴＧＣＴＣＴＣＡＡＧＣＴＧ（配列番号１８）；並びに
フォワードプライマー：ＡＧＡＴＴＴＧＧＡＣＣＴＧＣＧＡＧＣＧ（配列番号１９）及びリバースプライマー：ＧＡＧＣＧＧＣＴＧＴＣＴＣＣＡＣＡＡＧＴ（配列番号２０）からなるフォワードプライマー及びリバースプライマーの群から選択される、請求項８５～８９のいずれか一項に記載の組成物。
前記アダプター配列の第１の対及び前記アダプター配列の第２の対が同一であり、１０～１５ヌクレオチドを含む、請求項８１～８３のいずれか一項に記載の組成物。
前記アダプター配列の対が１０ヌクレオチドを含む、請求項９３に記載の組成物。
前記アダプター配列の対が、ＡＣＡＣＴＧＡＣＧＡＣＡＴＧＧＴＴＣＴＡＣＡ（配列番号２１）及びＴＡＣＧＧＴＡＧＣＡＧＡＧＡＣＴＴＧＧＴＣＴ（配列番号２２）に示すポリヌクレオチド配列を含む、請求項９４に記載の組成物。