JP2023519919A - 病原体を検出するためのアッセイ - Google Patents

病原体を検出するためのアッセイ Download PDF

Info

Publication number
JP2023519919A
JP2023519919A JP2022558526A JP2022558526A JP2023519919A JP 2023519919 A JP2023519919 A JP 2023519919A JP 2022558526 A JP2022558526 A JP 2022558526A JP 2022558526 A JP2022558526 A JP 2022558526A JP 2023519919 A JP2023519919 A JP 2023519919A
Authority
JP
Japan
Prior art keywords
virus
sequence
sequences
cov
amplicons
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022558526A
Other languages
English (en)
Inventor
エフ. サントス,カルロス
ジェー. ステーツ,デビッド
ピー. フェルドマン,ジョナサン
ディー. モラン,ジョスエ
Original Assignee
オングストローム バイオ,インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by オングストローム バイオ,インコーポレイテッド filed Critical オングストローム バイオ,インコーポレイテッド
Publication of JP2023519919A publication Critical patent/JP2023519919A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • C12Q1/701Specific hybridization probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/80ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/166Oligonucleotides used as internal standards, controls or normalisation probes
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Virology (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

病原体感染の決定因子である標的核酸を同定するための組成物及び方法が本明細書で提供される。本明細書で提供される多重化された方法は、いくつかの異なる生物学的試料から、1つ又は複数の病原性感染を示すIgG及びIgM免疫グロブリンなどの標的タンパク質を同時に検出する。核酸試料中の配列変異体を検出するための方法も本明細書で提供される。

Description

関連出願の相互参照
本出願は、2020年3月24日に出願された米国仮出願第62/994,173号に対する優先権の利益を主張する。前述の出願の全内容は、参照により本明細書に組み込まれる。
配列表
本出願は、ASCII形式で電子的に提出された配列表を含み、その全体が参照により本明細書に組み込まれる。2021年3月22日に作成されたASCIIコピーの名前はA109922_1010WO_SL.txtであり、サイズは58,177バイトである。
試料、例えば生物学的試料(例えば、血液試料、経口試料、経鼻試料、又は組織試料)中の病原体、例えばコロナウイルス(例えば、229E、NL63、OC43、HKU1、MERS-CoV、SARS-CoV及びSARS-CoV-2)及び/又は他のウイルス、例えばインフルエンザウイルス(例えば、インフルエンザウイルスA、インフルエンザウイルスB、インフルエンザウイルスC及びインフルエンザウイルスD)、細菌(例えば、マイコバクテリウム、連鎖球菌、緑膿菌、赤痢菌、カンピロバクター、クラミジア及びサルモネラ)を検出するためのアレイ及び方法が本明細書で提供される。
疾患の早期検出は、疾患の制御及び治療を成功させるために重要であることが多い。正確で高速かつ低コストの血液分析、感染診断、病原体検出、又は他の生物学的若しくは化学的分析物検出を提供することは、医療提供者及び危険な対応チームにとって依然として大きな課題である。
適例は、ヒト及び家畜において高度に流行性の疾患を引き起こす大きなエンベロープRNAウイルスであるコロナウイルスによって引き起こされるウイルス感染症などの感染症の診断である。コロナウイルスは、呼吸分泌物のエアロゾルによって、糞便-経口経路によって、及び機械的伝染によって伝染される。多くの場合、ウイルスに感染した患者は無症候性であり、他の場合、感染は軽度の自己限定性疾患(古典的な「風邪」又は胃の不調)を引き起こし、まれな神経学的合併症があり得る。新規SARS-CoV-2(COVID-19)ウイルスは、下気道の肺細胞に局在するようであり、選択された患者集団において死をもたらす重度の呼吸器合併症を引き起こす。
SARS-CoV-2では、高い感染性と病原性とが致命的に組み合わされ、大部分の患者が不定であるが長期間無症状であることと相まって、世界中の医療システムを圧倒している。中国、イラン、スペイン、及びイタリアからの報告は、局所的な集団発生の初期数週間で疾患の拡散を制御することができないことが、急性呼吸窮迫又は他の生命を脅かす症状に対する集中治療を必要とする患者の急増につながり、それが局所的な地域の医療システムの収容能力を急速に圧倒し、死亡率を急上昇させ得ることを示している。COVID-19の集団発生は、世界保健機関によって国際的に懸念される公衆衛生上の緊急事態であると宣言されており、人々の生活、家庭及び地域社会に大きな影響を与えている。したがって、COVID-19及び日和見感染症を早期に診断する能力は、より効果的な治療決定及び患者の転帰の改善につながるはずである。さらに、中和抗体の集団産生の検出は、特定の病原体に対する集団の健康リスクの特定につながり得る。
高度な分析物検出システムが利用可能であるが、それらはかさばり、高価であり、較正、動作及び維持のために広範囲の訓練を必要とする。迅速な診断試験は、試験あたりのコストが低く、操作が簡単であり、必要な機器が最小限であるか又は全くないという利点を提供することができるが、著しい制約もある。迅速な診断試験は、単一の分析物について単一の試料のみを試験するように構成されることが多いため、共同感染試験をサポートするために複数のデバイスが必要であり、これは極端に高価で非実用的であり得る。
患者の臨床試料中の病原体又は感染の決定因子を正確かつ効率的に検出及び識別することができる、大規模に並行した迅速な診断試験の開発が必要とされている。
本明細書に記載の組成物及び方法は、複数の試料からの病原体の同時迅速検出に有用である。本開示はまた、核酸試料中の配列変異体を検出する方法を提供する。本明細書に記載の組成物、アレイ、システム及び方法は、PCR又は近接ライゲーションアッセイの単純さを組み合わせて、複数のアンプリコンの並行シーケンシングを用いて独自にバーコード化されたアンプリコンを生成し、生物学的試料から1つ又は複数の分析物(例えば、ポリヌクレオチド及び/又はタンパク質)の存在又は非存在を識別することに加えて、ソース識別情報を提供することができる。
一態様では、本開示は、少なくとも1つの標的核酸を同定する方法を提供する。方法は、a)複数の対象から複数の生物学的試料を得る工程、b)生物学的試料の各々から全核酸を得る工程、c)複数のアンプリコンを産生するために増幅混合物を使用して複数のポリヌクレオチドを増幅に供する工程、d)複数のアンプリコンの各々を検出する工程、及びe)複数のアンプリコンのカテゴリーを決定する工程を含む。
いくつかの実施形態において、複数のポリヌクレオチドはRNA分子を含み、工程b)は、工程c)における増幅を行う前に、RNAから逆転写されたcDNAを得ること、又はRNAからcDNAを逆転写することをさらに含む。特定の実施形態において、工程b)における複数のポリヌクレオチドはRNA分子を含み、工程b)において逆転写酵素を添加して、工程c)における増幅に供される複数のcDNAを得る。いくつかの実施形態において、工程b)における複数のポリヌクレオチドはDNA分子をさらに含む。
本明細書に記載される方法の多くの実施形態では、標的核酸は、RNAウイルス、DNAウイルス、真菌、寄生生物及び細菌からなる群から選択される1つ又は複数の病原体を含む試料から得られる。いくつかの実施形態において、病原体は、アシネトバクター・バウマンニ(Acinetobacter baumannii)、アデノウイルス、アフリカ馬疫ウイルス、アフリカ豚コレラウイルス、ズビニ鉤虫(Anclostoma duodenale)、回虫、黄色アスペルギルス、アスペルギルス・フミガーツス(Aspergillus fumigatus)、アスペルギルス・ニガー(Aspergillus niger)、アスペルギルス・オリゼ(Aspergillus oryzae)、鳥インフルエンザウイルス、炭疽菌、炭疽菌パスツール株、セレウス菌、ウシ流産菌、ブルセラ・メリテンシス(Brucella melitensis)、ブルセラ・スイス(Brucella suis)、鼻疽菌、類鼻疽菌、カンジダ・アルビカンス(Candida albicans)、カンジダ・ドゥブリニエンシス(Candida dubliniensis)、カンジダ・グラブラタ(Candida glabrata)、カンジダ・クルセイ(Candida krusei)、カンジダ・トロピカリス(Candida tropicalis)、クラミジア・ニューモニエ(Chlamydia pneumoneae)、クラミジア・トラコマチス(Chlamydia trachomatous)、豚熱ウイルス、クロストリジウム・ディフィシール(Clostridium difficile)、コクシジオイデス・イミティス(Coccidioides immitis)、コクシジオイデス・ポサダシ(Coccidioides posadasii)、CoV-229E、CoV-HKU1、CoV-NL63、CoV-OC43、コクサッキーウイルスA、コクサッキーウイルスB、コクシエラ・バーネッティ(Coxiella burnetii)、クリミア・コンゴ出血熱、サイトメガロウイルス、デングウイルス、メジナ虫、東部馬脳炎、エボラウイルス、い粒条虫、多包条虫、エンテロバクター・クロアカ、エンテロコッカス・フェシウム(Enterococcus faecium)、エンテロウイルス、エプスタイン・バール・ウイルス、大腸菌、巨大肝蛭、肝蛭、***ウイルス、野兎病菌、山羊痘ウイルス、ヘモフィルス属インフルエンザ、ヘリコバクターピロリ、ヘンドラウイルス、A型肝炎ウイルス、B型肝炎ウイルス、C型肝炎ウイルス、ヒストプラスマ・カプスラーツム(Histoplasma capsulatum)、ズボアジ型ヒストプラスマ症(Histoplasma duboisii)、ヒトヘルペスウイルスHHV6、ヒトヘルペスウイルスHHV7、ヒトヘルペスウイルスHHV8、ヒトヘルペスウイルスHSV1、ヒトヘルペスウイルスHSV2、ヒト免疫不全ウイルス、ヒトパピローマウイルス、インフルエンザウイルスA型、インフルエンザウイルスB型、クレブシェラ肺炎桿菌、キャサヌール森林病ウイルス、ラッサ熱ウイルス、レジオネラ・ニューモフィラ菌、リーシュマニア・プロマスティゴート(Leishmania promastigotes)、Lujoウイルス、ランピースキン病ウイルス、マールブルグウイルス、麻疹ウイルス、メチシリン耐性黄色ブドウ球菌、サル痘ウイルス、ムンプスウイルス、マイコバクテリウム・アブセッサス(Mycobacterium abscessus)、マイコバクテリウム・アビウム(Mycobacterium avium)、マイコバクテリウム・ボビス(Mycobacterium bovis)、マイコバクテリウム・カヌッティイ(Mycobacterium canettii)、マイコバクテリウム・レプレ(Mycobacterium leprae)、ヒト結核菌、マイコバクテリウム・ウルセランス(Mycobacterium ulcerans)、マイコプラズマ・カプリコルム(Mycoplasma capricolum)、マイコプラズマ・ミコイデス(Mycoplasma mycoides)、マイコプラズマ・ニューモニア(Mycoplasma pneumoneae)、アメリカ十二指腸虫、淋病、ニューカッスル病ウイルス、ニパウイルス、ノルカジア属beijingensis、ノルカジア属cyriacigeorgica、ノルカジア属farcinica、ノロウイルスGI、ノロウイルスGII、ノーウォークウイルス、オムスク出血熱ウイルス、回旋糸状虫、発癌性ヒトパピローマウイルス、パラインフルエンザウイルス、寄生生物、マルネッフェイ型ペニシリウム症(Penicilliosis mameffei)、小反芻獣疫ウイルス、ニューモシスチス・イロベチイ(Pneumocystis jirovecii)、ポリオーマウイルス、プロテウス・ミラビリス(Proteus mirabilis)、緑膿菌、狂犬病ウイルス、8つの遺伝子断片すべてのコーディング領域の任意の部分を含有する、1918年のパンデミックインフルエンザウイルスの再構築された複製コンピテント形態、呼吸器合胞体ウイルス、ライノウイルス、発疹チフスリケッチア、リフトバレー熱ウイルス、牛疫ウイルス、ロタウイルスA、ロタウイルスB、ロタウイルスC、ロタウイルスG2、風疹ウイルス、SARS関連コロナウイルス(SARS-CoV)、SARS-CoV-1、SARS-CoV-2、ビルハルツ住血吸虫、日本住血吸虫、マンソン住血吸虫、羊痘ウイルス、南米出血熱ウイルスチャパレ、南米出血熱ウイルスグアナリト、南米出血熱ウイルスフニン、南米出血熱ウイルスマチュポ、南米出血熱ウイルスサビア、黄色ブドウ球菌、スタフィロコッカス・サプロフィティカス(Staphylococcus saprophyticus)、肺炎レンサ球菌、豚水疱病ウイルス、有鉤条虫、ダニ媒介性脳炎複合(flavi)ウイルス極東亜型、ダニ媒介性脳炎複合(flavi)ウイルスシベリア亜型、タバコモザイク病ウイルス、トルクテノウイルス、鞭虫、ブルーストリパノソーマ(Trypanosoma brucei)、トリパノソーマ・クルージ(Trypanosoma cruzi)、大痘瘡ウイルス(天然痘ウイルス)、小痘瘡ウイルス(アラストリム)、ベネズエラ馬脳炎ウイルス、バンクロフト糸状虫、ペスト菌、又は前述の群の病原体と特徴的な核酸配列を共有する、別の潜在的に新規若しくは特性決定されていない病原体からなる群から選択される。一実施形態では、病原体はRNAウイルスである。特定の実施形態では、RNAウイルスはSARS-CoV-2である。
本明細書に記載される方法の多くの実施形態では、試料は、血液、粘液、唾液、汗、涙、体腔に蓄積する流体、尿、***液、膣分泌物、脳脊髄液、リンパ液、糞便、痰、分解液、嘔吐物、汗、母乳、血清及び血漿からなる群から選択される。一実施形態において、試料は唾液である。
方法の一実施形態では、複数のポリヌクレオチドを増幅混合物を用いて増幅に供して、複数のアンプリコンを産生する。本明細書に記載される方法の多くの実施形態では、増幅はポリメラーゼ連鎖反応増幅である。いくつかの実施形態では、増幅はローリングサークル増幅である。方法の一実施形態では、増幅混合物は、複数のプライマー、フォワードプライマー及びリバースプライマーを含む。一実施形態では、本明細書に記載の方法は、フォワードプライマー及びリバースプライマーの固有のセットを含む増幅混合物を使用したcDNAの増幅を提供する。いくつかの実施形態において、プライマーは、複数のcDNAの各々に相補的なヌクレオチドのセットと、少なくとも1つの固有のヌクレオチドバーコード配列とを含む。いくつかの実施形態において、複数のプライマーは、少なくとも96個の異なるバーコード化プライマーを含む。いくつかの実施形態では、方法は、特定の対象から得られた生物学的試料を識別する第1の固有のバーコード配列を含む。
本明細書中に記載される方法の多くの実施形態において、アダプター配列の対は、第1の固有のバーコード配列及びその逆相補体を第2の固有のバーコード配列及びその逆相補体から分離する。本明細書中に記載される方法の多くの実施形態において、アダプター配列の対は、第1の固有のバーコード配列及びその逆相補体に隣接する。
本明細書中に記載される方法の多くの実施形態において、検出することは、アダプター配列の対並びに第1の固有のバーコード配列及びその逆相補体を含む複数のアンプリコンをシーケンシングすることを含む。本明細書中に記載される方法の多くの他の実施形態において、検出することは、アダプター配列の対、第1の固有のバーコード配列及びその逆相補体、並びに第2の固有のバーコード配列及びその逆相補体を含む複数のアンプリコンをシーケンシングすることを含む。本明細書中に記載される方法の実施形態において、検出することは、一連のプログラムを用いてシーケンシングデータファイルを読み取ることによって行われる。一実施形態では、一連のプログラムは、HMMER/Infernalアラインメントを含む。一実施形態において、シーケンシングデータファイルはFASTA/FASTQフォーマットファイルである。
多くの実施形態において、方法は、標的核酸である少なくとも1つの陽性対照試料をシーケンシングすることをさらに含む。いくつかの実施形態において、方法は、バクテリオファージMS2である少なくとも1つの陽性対照試料をシーケンシングすることをさらに含む。いくつかの実施形態において、方法は、MS2鋳型核酸である少なくとも1つの陽性対照試料をシーケンシングすることをさらに含む。いくつかの実施形態において、方法は、RNAseP又は別の非病原体遺伝子である少なくとも1つの陽性対照試料をシーケンシングすることをさらに含む。いくつかの実施形態において、方法は、ヒトハウスキーピング遺伝子GAPDH又はβ-アクチン由来の核酸である少なくとも1つの陽性対照試料をシーケンシングすることをさらに含む。
多くの実施形態では、方法は、2つ以上の標的核酸を同定することを含む。いくつかの実施形態では、2つ以上の標的核酸は、単一の病原体の病原性決定因子であるか、又は病原性決定因子をエンコードする。一実施形態では、2つ以上の標的核酸は、ウイルスの病原性決定因子であるか、又は病原性決定因子をエンコードする。一実施形態では、ウイルスはSARS-CoV-2である。いくつかの実施形態では、病原性決定因子は、スパイクタンパク質(S)、受容体結合ドメイン(RBD)、S1タンパク質、S2タンパク質、E遺伝子、S遺伝子、Orflab遺伝子、N末端スパイクタンパク質ドメイン、全タンパク質(S1+S2)、及びヌクレオカプシド(N)タンパク質からなる群から選択される。
いくつかの実施形態では、2つ以上の標的核酸は、RNAウイルス、DNAウイルス、真菌、寄生生物及び細菌からなる群から選択される少なくとも2つの異なる病原体の病原性決定因子であるか、又は病原性決定因子をエンコードする。一実施形態では、2つの異なるRNAウイルスは、SARS-CoV-2及びインフルエンザである。
別の態様では、本開示は、多数の試料から少なくとも1つの標的タンパク質を検出するためのアレイのマルチプレックスを提供する。一実施形態では、マルチプレックスアレイは、複数の独自に標識されたビーズに結合した複数の捕捉剤を含み、独自に標識されたビーズの各々が複数の固有の捕捉剤を含む。本明細書に記載の実施形態では、マルチプレックスアレイは、少なくとも1つのビーズに結合するように設計された少なくとも1つの第1のオリゴヌクレオチド配列と、第2のオリゴヌクレオチド配列とコンジュゲートした少なくとも1つの二次抗体と、環状アンプリコン中の少なくとも1つの固有のヌクレオチドバーコード配列とを含む。本明細書に記載されるアレイの多くの実施形態では、ビーズは、少なくとも1つの標的タンパク質に特異的に結合する抗原でコーティングされる。本明細書に記載されるアレイのいくつかの実施形態では、第2のオリゴヌクレオチド配列は、第2のオリゴヌクレオチド配列が第1のオリゴヌクレオチド配列に近接している場合に増幅されて環状アンプリコンを形成するように設計される。いくつかの実施形態において、第1のオリゴヌクレオチド配列、又は第2のオリゴヌクレオチド配列、又はその両方は、少なくとも1つの固有のバーコード配列を含む。いくつかの実施形態において、第1のオリゴヌクレオチド配列は、ビーズ上にコーティングされたポリペプチドに共有結合している。いくつかの実施形態では、アレイのマルチプレックスは、抗体又は抗体断片に共有結合した第1のオリゴヌクレオチド配列を含み、抗体又は抗体断片はビーズ上にコーティングされたポリペプチドに結合する。一実施形態では、マルチプレックスアレイは、環状アンプリコン中に少なくとも96個の異なるバーコード配列を含む。
一態様では、本開示は、複数の生物学的試料における少なくとも1つの感染のための方法を提供する。方法は、少なくとも1つの標的タンパク質が少なくとも1つのビーズの固有の捕捉剤に結合するのに十分な条件下で、本明細書に記載のアレイのマルチプレックスにおいて複数の生物学的試料を複数のビーズと共にインキュベートする第1の工程を含む。方法の第2の工程において。ビーズを洗浄して、固有の捕捉剤に結合しないタンパク質を除去する。次の工程は、複数の標的タンパク質に結合した二次抗体の数に対応する複数の複合体が形成されるように、複数の二次抗体のそれぞれが少なくとも1つの標的タンパク質と複合体を形成する条件下で、ビーズを複数の二次抗体とインキュベートすることを含む。次の工程では、ビーズを再度洗浄して、複合体を形成しない二次抗体を除去する。第6の工程では、環状アンプリコンを形成するように第1オリゴヌクレオチド配列のそれぞれに対して第2オリゴヌクレオチド配列のそれぞれをハイブリダイゼーションさせる条件下で、複数の複合体の数に対応して複数のアンプリコンが生成されるように、複数の複合体をインキュベートする。方法の第7の工程は、複数の環状アンプリコンを増幅に供することを含む。第8の工程では、ビーズをアレイにプールし、複数のアンプリコンを固有のバーコード化アンプリコンのハイスループットシーケンシングによって同時に検出する。最後の工程では、複数のアンプリコンのカテゴリーが決定される。標的増幅領域由来のポリヌクレオチドを含む複数のアンプリコンのそれぞれのカテゴリーを決定することは、対応する生物学的試料における感染を示す。
いくつかの実施形態では、本明細書に記載の方法は、1つ又は複数の試料中の病原性決定因子(例えば、細菌、真菌、寄生虫及び/又はウイルス感染)の同定に使用される。他の実施形態では、本方法は、1つ以上の病原性感染を示すIgG及びIgM免疫グロブリンなどの標的タンパク質を同時に検出する。くつかの実施形態において、本明細書中に記載される方法によって検出される抗体又は抗体断片は、アシネトバクター・バウマンニ(Acinetobacter baumannii)、アデノウイルス、アフリカ馬疫ウイルス、アフリカ豚コレラウイルス、ズビニ鉤虫(Anclostoma duodenale)、回虫、黄色アスペルギルス、アスペルギルス・フミガーツス(Aspergillus fumigatus)、アスペルギルス・ニガー(Aspergillus niger)、アスペルギルス・オリゼ(Aspergillus oryzae)、鳥インフルエンザウイルス、炭疽菌、炭疽菌パスツール株、Bacillus cereus Biovar anthracis、ウシ流産菌、ブルセラ・メリテンシス(Brucella melitensis)、ブルセラ・スイス(Brucella suis)、鼻疽菌、類鼻疽菌、カンジダ・アルビカンス(Candida albicans)、カンジダ・ドゥブリニエンシス(Candida dubliniensis)、カンジダ・グラブラタ(Candida glabrata)、カンジダ・クルセイ(Candida krusei)、カンジダ・トロピカリス(Candida tropicalis)、クラミジア・ニューモニエ(Chlamydia pneumoneae)、クラミジア・トラコマチス(Chlamydia trachomatous)、豚熱ウイルス、クロストリジウム・ディフィシール(Clostridium difficile)、コクシジオイデス・イミティス(Coccidioides immitis)、コクシジオイデス・ポサダシ(Coccidioides posadasii)、CoV-229E、CoV-HKU1、CoV-NL63、CoV-OC43、コクサッキーウイルスA、コクサッキーウイルスB、コクシエラ・バーネッティ(Coxiella burnetii)、クリミア・コンゴ出血熱、サイトメガロウイルス、デングウイルス、メジナ虫、東部馬脳炎、エボラウイルス、い粒条虫、多包条虫、エンテロバクター・クロアカ、エンテロコッカス・フェシウム(Enterococcus faecium)、エンテロウイルス、エプスタイン・バール・ウイルス、大腸菌、巨大肝蛭、肝蛭、***ウイルス、野兎病菌、山羊痘ウイルス、ヘモフィルス属インフルエンザ、ヘリコバクターピロリ、ヘンドラウイルス、A型肝炎ウイルス、B型肝炎ウイルス、C型肝炎ウイルス、ヒストプラスマ・カプスラーツム(Histoplasma capsulatum)、ズボアジ型ヒストプラスマ症(Histoplasma duboisii)、ヒトヘルペスウイルスHHV6、ヒトヘルペスウイルスHHV7、ヒトヘルペスウイルスHHV8、ヒトヘルペスウイルスHSV1、ヒトヘルペスウイルスHSV2、ヒト免疫不全ウイルス、ヒトパピローマウイルス、インフルエンザウイルスA型、インフルエンザウイルスB型、クレブシェラ肺炎桿菌、キャサヌール森林病ウイルス、ラッサ熱ウイルス、レジオネラ・ニューモフィラ菌、リーシュマニア・プロマスティゴート(Leishmania promastigotes)、Lujoウイルス、ランピースキン病ウイルス、マールブルグウイルス、麻疹ウイルス、メチシリン耐性黄色ブドウ球菌、サル痘ウイルス、ムンプスウイルス、マイコバクテリウム・アブセッサス(Mycobacterium abscessus)、マイコバクテリウム・アビウム(Mycobacterium avium)、マイコバクテリウム・ボビス(Mycobacterium bovis)、マイコバクテリウム・カヌッティイ(Mycobacterium canettii)、マイコバクテリウム・レプレ(Mycobacterium leprae)、ヒト結核菌、マイコバクテリウム・ウルセランス(Mycobacterium ulcerans)、マイコプラズマ・カプリコルム(Mycoplasma capricolum)、マイコプラズマ・ミコイデス(Mycoplasma mycoides)、マイコプラズマ・ニューモニア(Mycoplasma pneumoneae)、アメリカ十二指腸虫、淋病、ニューカッスル病ウイルス、ニパウイルス、ノルカジア属beijingensis、ノルカジア属cyriacigeorgica、ノルカジア属farcinica、ノロウイルスGI、ノロウイルスGII、ノーウォークウイルス、オムスク出血熱ウイルス、回旋糸状虫、発癌性ヒトパピローマウイルス、パラインフルエンザウイルス、寄生生物、マルネッフェイ型ペニシリウム症(Penicilliosis mameffei)、小反芻獣疫ウイルス、ニューモシスチス・イロベチイ(Pneumocystis jirovecii)、ポリオーマウイルス、プロテウス・ミラビリス(Proteus mirabilis)、緑膿菌、狂犬病ウイルス、8つの遺伝子断片すべてのコーディング領域の任意の部分を含有する、1918年のパンデミックインフルエンザウイルスの再構築された複製コンピテント形態、呼吸器合胞体ウイルス、ライノウイルス、発疹チフスリケッチア、リフトバレー熱ウイルス、牛疫ウイルス、ロタウイルスA、ロタウイルスB、ロタウイルスC、ロタウイルスG2、風疹ウイルス、SARS関連コロナウイルス(SARS-CoV)、SARS-CoV-1、SARS-CoV-2、ビルハルツ住血吸虫、日本住血吸虫、マンソン住血吸虫、羊痘ウイルス、南米出血熱ウイルスチャパレ、南米出血熱ウイルスグアナリト、南米出血熱ウイルスフニン、南米出血熱ウイルスマチュポ、南米出血熱ウイルスサビア、黄色ブドウ球菌、スタフィロコッカス・サプロフィティカス(Staphylococcus saprophyticus)、肺炎レンサ球菌、豚水疱病ウイルス、有鉤条虫、ダニ媒介性脳炎複合(flavi)ウイルス極東亜型、ダニ媒介性脳炎複合(flavi)ウイルスシベリア亜型、タバコモザイク病ウイルス、トルクテノウイルス、鞭虫、ブルーストリパノソーマ(Trypanosoma brucei)、トリパノソーマ・クルージ(Trypanosoma cruzi)、大痘瘡ウイルス(天然痘ウイルス)、小痘瘡ウイルス(アラストリム)、ベネズエラ馬脳炎ウイルス、バンクロフト糸状虫、ペスト菌を含む病原体、又は前述の群の病原体と特徴的な核酸配列を共有する、別の潜在的に新規若しくは特性決定されていない病原体由来の1つ以上の抗原と特異的に結合する。
一実施形態では、抗体又は抗体断片は、SAR-CoV-2由来の抗原に特異的に結合する。いくつかの実施形態では、抗体又は抗体断片は、スパイクタンパク質(S)、受容体結合ドメイン(RBD)、S1タンパク質、S2タンパク質、E遺伝子、S遺伝子、Orflab遺伝子、N末端スパイクタンパク質ドメイン、全タンパク質(S1+S2)、及びヌクレオカプシド(N)タンパク質からなる群から選択される抗原に特異的に結合する。
本明細書に記載される方法の多くの実施形態では、試料は、血液、粘液、唾液、汗、涙、体腔に蓄積する流体、尿、***液、膣分泌物、脳脊髄液、リンパ液、糞便、痰、分解液、嘔吐物、汗、母乳、血清及び血漿からなる群から選択される。一実施形態において、試料は唾液である。一実施形態において、試料は血液である。
別の態様では、本開示は、核酸試料中の配列変異体を検出する方法を提供する。第1の工程は、増幅混合物を用いて核酸の試料と増幅反応を行い、複数のアンプリコンを産生することを含む。第2の工程は、配列変異を検出することであり、複数のアンプリコンを検出すること、及び場合により定量することを含む。本方法の第3の工程は、複数のアンプリコンのカテゴリーを決定する工程を含む。本方法の第4の工程は、配列変異の検出に関する。本明細書に記載される方法の多くの実施形態では、増幅混合物は、核酸試料、複数のプライマー、第1の固有のバーコード配列及びその逆相補体、並びにアダプター配列の第1の対を含む。いくつかの実施形態において、複数のプライマーの各々は、それらが結合するポリヌクレオチドの各々に相補的なヌクレオチドのセットを含む。いくつかの実施形態において、第1の固有のバーコード配列及びその逆相補体は、特定の対象から得られた試料を同定する。いくつかの実施形態において、アダプター配列の対は、第1の固有のバーコード配列及びその逆相補体に隣接する。いくつかの実施形態において、複数のアンプリコンは標的増幅領域又は対照領域からのポリヌクレオチドを含む。
本明細書中に記載される方法の多くの実施形態において、第2の工程は、アダプター配列の第1の対並びに第1の固有のバーコード配列及びその逆相補体を含む複数のアンプリコンの各々をシーケンシングすることを含む。いくつかの実施形態において、第2の工程は、アダプター配列の第1の対、第1の固有のバーコード配列及びその逆相補体、第2の固有のバーコード配列及びその逆相補体を含む複数のアンプリコンの各々をシーケンシングすることを含む。一実施形態において、アダプター配列の第1の対は、第1の固有のバーコード配列及びその逆相補体を第2の固有のバーコード配列及びその逆相補体から分離する。
本明細書中に記載される方法の多くの実施形態において、第2の工程における検出は、一連のプログラムを用いてシーケンシングデータファイルを読み取ることによって行われる。いくつかの実施形態において、シーケンシングデータファイルはFASTA/FASTQフォーマットである。いくつかの実施形態では、一連のプログラムは、HMMER/Infernalアラインメントエンジンを含む。
本明細書中に記載される方法の多くの実施形態において、第4の工程における検出は、1つ以上の参照配列との配列アラインメント(例えば、多重配列アラインメント)を行うことを含む。いくつかの実施形態において、配列アラインメントは、HMMプロファイル隠れマルコフモデル(HMM)エンジン、共分散モデル(CM)エンジン又はそれらの組み合わせによって行われる。
いくつかの実施形態において、方法は、配列変異体を感染の診断又は予後と相関させることを含む。いくつかの実施形態では、感染は、RNAウイルス、DNAウイルス、真菌、寄生生物及び細菌からなる群から選択される1つ又は複数の病原体によって引き起こされる。いくつかの実施形態において、病原体は、アシネトバクター・バウマンニ(Acinetobacter baumannii)、アデノウイルス、アフリカ馬疫ウイルス、アフリカ豚コレラウイルス、ズビニ鉤虫(Anclostoma duodenale)、回虫、黄色アスペルギルス、アスペルギルス・フミガーツス(Aspergillus fumigatus)、アスペルギルス・ニガー(Aspergillus niger)、アスペルギルス・オリゼ(Aspergillus oryzae)、鳥インフルエンザウイルス、炭疽菌、炭疽菌パスツール株、Bacillus cereus Biovar anthracis、ウシ流産菌、ブルセラ・メリテンシス(Brucella melitensis)、ブルセラ・スイス(Brucella suis)、鼻疽菌、類鼻疽菌、カンジダ・アルビカンス(Candida albicans)、カンジダ・ドゥブリニエンシス(Candida dubliniensis)、カンジダ・グラブラタ(Candida glabrata)、カンジダ・クルセイ(Candida krusei)、カンジダ・トロピカリス(Candida tropicalis)、クラミジア・ニューモニエ(Chlamydia pneumoneae)、クラミジア・トラコマチス(Chlamydia trachomatous)、豚熱ウイルス、クロストリジウム・ディフィシール(Clostridium difficile)、コクシジオイデス・イミティス(Coccidioides immitis)、コクシジオイデス・ポサダシ(Coccidioides posadasii)、CoV-229E、CoV-HKU1、CoV-NL63、CoV-OC43、コクサッキーウイルスA、コクサッキーウイルスB、コクシエラ・バーネッティ(Coxiella burnetii)、クリミア・コンゴ出血熱、サイトメガロウイルス、デングウイルス、メジナ虫、東部馬脳炎、エボラウイルス、い粒条虫、多包条虫、エンテロバクター・クロアカ、エンテロコッカス・フェシウム(Enterococcus faecium)、エンテロウイルス、エプスタイン・バール・ウイルス、大腸菌、巨大肝蛭、肝蛭、***ウイルス、野兎病菌、山羊痘ウイルス、ヘモフィルス属インフルエンザ、ヘリコバクターピロリ、ヘンドラウイルス、A型肝炎ウイルス、B型肝炎ウイルス、C型肝炎ウイルス、ヒストプラスマ・カプスラーツム(Histoplasma capsulatum)、ズボアジ型ヒストプラスマ症(Histoplasma duboisii)、ヒトヘルペスウイルスHHV6、ヒトヘルペスウイルスHHV7、ヒトヘルペスウイルスHHV8、ヒトヘルペスウイルスHSV1、ヒトヘルペスウイルスHSV2、ヒト免疫不全ウイルス、ヒトパピローマウイルス、インフルエンザウイルスA型、インフルエンザウイルスB型、クレブシェラ肺炎桿菌、キャサヌール森林病ウイルス、ラッサ熱ウイルス、レジオネラ・ニューモフィラ菌、リーシュマニア・プロマスティゴート(Leishmania promastigotes)、Lujoウイルス、ランピースキン病ウイルス、マールブルグウイルス、麻疹ウイルス、メチシリン耐性黄色ブドウ球菌、サル痘ウイルス、ムンプスウイルス、マイコバクテリウム・アブセッサス(Mycobacterium abscessus)、マイコバクテリウム・アビウム(Mycobacterium avium)、マイコバクテリウム・ボビス(Mycobacterium bovis)、マイコバクテリウム・カヌッティイ(Mycobacterium canettii)、マイコバクテリウム・レプレ(Mycobacterium leprae)、ヒト結核菌、マイコバクテリウム・ウルセランス(Mycobacterium ulcerans)、マイコプラズマ・カプリコルム(Mycoplasma capricolum)、マイコプラズマ・ミコイデス(Mycoplasma mycoides)、マイコプラズマ・ニューモニア(Mycoplasma pneumoneae)、アメリカ十二指腸虫、淋病、ニューカッスル病ウイルス、ニパウイルス、ノルカジア属beijingensis、ノルカジア属cyriacigeorgica、ノルカジア属farcinica、ノロウイルスGI、ノロウイルスGII、ノーウォークウイルス、オムスク出血熱ウイルス、回旋糸状虫、発癌性ヒトパピローマウイルス、パラインフルエンザウイルス、寄生生物、マルネッフェイ型ペニシリウム症(Penicilliosis mameffei)、小反芻獣疫ウイルス、ニューモシスチス・イロベチイ(Pneumocystis jirovecii)、ポリオーマウイルス、プロテウス・ミラビリス(Proteus mirabilis)、緑膿菌、狂犬病ウイルス、8つの遺伝子断片すべてのコーディング領域の任意の部分を含有する、1918年のパンデミックインフルエンザウイルスの再構築された複製コンピテント形態、呼吸器合胞体ウイルス、ライノウイルス、発疹チフスリケッチア、リフトバレー熱ウイルス、牛疫ウイルス、ロタウイルスA、ロタウイルスB、ロタウイルスC、ロタウイルスG2、風疹ウイルス、SARS関連コロナウイルス(SARS-CoV)、SARS-CoV-1、SARS-CoV-2、ビルハルツ住血吸虫、日本住血吸虫、マンソン住血吸虫、羊痘ウイルス、南米出血熱ウイルスチャパレ、南米出血熱ウイルスグアナリト、南米出血熱ウイルスフニン、南米出血熱ウイルスマチュポ、南米出血熱ウイルスサビア、黄色ブドウ球菌、スタフィロコッカス・サプロフィティカス(Staphylococcus saprophyticus)、肺炎レンサ球菌、豚水疱病ウイルス、有鉤条虫、ダニ媒介性脳炎複合(flavi)ウイルス極東亜型、ダニ媒介性脳炎複合(flavi)ウイルスシベリア亜型、タバコモザイク病ウイルス、トルクテノウイルス、鞭虫、ブルーストリパノソーマ(Trypanosoma brucei)、トリパノソーマ・クルージ(Trypanosoma cruzi)、大痘瘡ウイルス(天然痘ウイルス)、小痘瘡ウイルス(アラストリム)、ベネズエラ馬脳炎ウイルス、バンクロフト糸状虫、ペスト菌、又は前述の群の病原体と特徴的な核酸配列を共有する、別の潜在的に新規若しくは特性決定されていない病原体からなる群から選択される。
一実施形態では、病原体はSARS-CoV-2である。いくつかの実施形態では、配列変異体は、スパイクタンパク質(S)、受容体結合ドメイン(RBD)、S1タンパク質、S2タンパク質、E遺伝子、S遺伝子、Orflab遺伝子、N末端スパイクタンパク質ドメイン、全タンパク質(S1+S2)、及びヌクレオカプシド(N)タンパク質からなる群から選択される抗原をエンコードする領域にある。いくつかの実施形態では、配列変異体は、T95I、D253G、L452R、E484K、S477N、N501Y D614G及びA701Vからなる群より選択される変異を含む。
本明細書中に記載される方法の多くの実施形態において、複数のアンプリコンの検出は、複数のアンプリコンのプールされた配列データセットを得ること、ベースコールを行うこと、複数のアンプリコンの配列データを予め定義されたアノテーション付きHMM又はCM遺伝子モデルにアラインメントすること、HMM/CMアラインメントの各々に階級(例えば、確率スコア又はビットスコア)を割り当てること、配列データをフィルタリングして位置アノテーション付き配列アラインメントを得ること、各アンプリコン内のバーコード並びにアンプリコンの配列内のバーコード及びアダプターの位置を決定することを含む。本明細書に記載の方法のすべての実施形態において、前述の工程は、適切にプログラムされたコンピュータを使用して実行される。本明細書に記載の方法のいくつかの実施形態では、高精度ONT GPUに基づくベースコーラーでベースコールが実行され、生のFASTA/FASTQファイルが生成される。これらの実施形態では、生ファイルは、プロファイルHMMエンジン及び/又はCMエンジンによってアラインメントされる。いくつかの実施形態では、HMMエンジンは、複数の配列アラインメントをもたらすHMMERソフトウェアプログラムを含む。いくつかの実施形態では、HMMERプログラム及び/又はCMエンジンは、バーコード、標的増幅領域、プライマー、及びアダプターからなる群から選択される1つ又は複数の配列特徴についてヌクレオチドごとのアノテーションを割り当てる。一実施形態において、複数の配列アラインメントは、第1の固有のバーコード配列及びその逆相補体のためのアノテーションを含む。
本明細書中に記載される方法の多くの実施形態において、フィルタリングは、合格スコア又は不合格スコアを配列アラインメントに割り当てることを含む。これらの実施形態では、配列アラインメントは、参照バーコード化配列のセットに対して最小レーベンシュタイン距離スコアに合格する場合、及びアラインメントの最小ビットスコア閾値を合格する場合、合格スコアが割り当てられる。いくつかの実施形態において、合格スコアを有する配列アラインメントは、中央データベースに記憶される。いくつかの実施形態では、合格スコアを有する配列アラインメントは、試料中の病原体負荷の直接的な定量的表示に対応する。
方法の多くの実施形態において、データベースは、試料コレクションチューブに割り当てられた固有のバーコードの情報、少なくとも96個の固有のウェルバーコードのセットの情報、少なくとも96個の固有のプレートバーコードのセットの情報、複数のアンプリコンからの配列データのセットの情報及びレポートを含む。一実施形態では、レポートは、各対象のソース識別情報及び対象が標的タンパク質の存在について陽性であるか陰性であるかに関する情報を含む。一実施形態では、レポートは、対応する対象、又は診療所若しくは医師に提供される。
さらに別の態様では、本開示はアンプリコンを含む組成物を提供する。本明細書に記載される多くの実施形態では、アンプリコンは、第1の固有のバーコード配列及びその逆相補体、標的特異的プライマーの対、標的増幅領域及びアダプター配列の第1の対を含む。いくつかの実施形態において、標的特異的プライマーの対はフォワードプライマーとリバースプライマーとから構成され、それぞれが標的増幅領域(例えば、ウイルスゲノムの領域)内のプライミング部位に相補的な配列を有する。多くの実施形態において、フォワードプライマー及びリバースプライマーの各々は、標的増幅領域に隣接し、次に第1の固有のヌクレオチドバーコード配列及びその逆相補体に隣接し、第1の固有のバーコード配列及びその逆相補体は、アダプター配列の第1の対に隣接する。いくつかの実施形態において、アンプリコンは、第2の固有のバーコード配列及びその逆相補体並びにアダプター配列の第2の対をさらに含み、ここで第2の固有のバーコード配列及びその逆相補体並びにアダプター配列の第2の対は、アンプリコンにライゲーションされている。一実施形態では、アダプター配列の第1の対はアダプター配列の第2の対に隣接し、アダプター配列の第2の対は第2の固有のバーコード配列及びその逆相補体に隣接する。
いくつかの実施形態において、標的増幅領域は、遺伝子又はタンパク質をエンコードする病原体のゲノム領域から増幅され、病原体は、アシネトバクター・バウマンニ(Acinetobacter baumannii)、アデノウイルス、アフリカ馬疫ウイルス、アフリカ豚コレラウイルス、ズビニ鉤虫(Anclostoma duodenale)、回虫、黄色アスペルギルス、アスペルギルス・フミガーツス(Aspergillus fumigatus)、アスペルギルス・ニガー(Aspergillus niger)、アスペルギルス・オリゼ(Aspergillus oryzae)、鳥インフルエンザウイルス、炭疽菌、炭疽菌パスツール株、Bacillus cereus Biovar anthracis、ウシ流産菌、ブルセラ・メリテンシス(Brucella melitensis)、ブルセラ・スイス(Brucella suis)、鼻疽菌、類鼻疽菌、カンジダ・アルビカンス(Candida albicans)、カンジダ・ドゥブリニエンシス(Candida dubliniensis)、カンジダ・グラブラタ(Candida glabrata)、カンジダ・クルセイ(Candida krusei)、カンジダ・トロピカリス(Candida tropicalis)、クラミジア・ニューモニエ(Chlamydia pneumoneae)、クラミジア・トラコマチス(Chlamydia trachomatous)、豚熱ウイルス、クロストリジウム・ディフィシール(Clostridium difficile)、コクシジオイデス・イミティス(Coccidioides immitis)、コクシジオイデス・ポサダシ(Coccidioides posadasii)、CoV-229E、CoV-HKU1、CoV-NL63、CoV-OC43、コクサッキーウイルスA、コクサッキーウイルスB、コクシエラ・バーネッティ(Coxiella burnetii)、クリミア・コンゴ出血熱、サイトメガロウイルス、デングウイルス、メジナ虫、東部馬脳炎、エボラウイルス、い粒条虫、多包条虫、エンテロバクター・クロアカ、エンテロコッカス・フェシウム(Enterococcus faecium)、エンテロウイルス、エプスタイン・バール・ウイルス、大腸菌、巨大肝蛭、肝蛭、***ウイルス、野兎病菌、山羊痘ウイルス、ヘモフィルス属インフルエンザ、ヘリコバクターピロリ、ヘンドラウイルス、A型肝炎ウイルス、B型肝炎ウイルス、C型肝炎ウイルス、ヒストプラスマ・カプスラーツム(Histoplasma capsulatum)、ズボアジ型ヒストプラスマ症(Histoplasma duboisii)、ヒトヘルペスウイルスHHV6、ヒトヘルペスウイルスHHV7、ヒトヘルペスウイルスHHV8、ヒトヘルペスウイルスHSV1、ヒトヘルペスウイルスHSV2、ヒト免疫不全ウイルス、ヒトパピローマウイルス、インフルエンザウイルスA型、インフルエンザウイルスB型、クレブシェラ肺炎桿菌、キャサヌール森林病ウイルス、ラッサ熱ウイルス、レジオネラ・ニューモフィラ菌、リーシュマニア・プロマスティゴート(Leishmania promastigotes)、Lujoウイルス、ランピースキン病ウイルス、マールブルグウイルス、麻疹ウイルス、メチシリン耐性黄色ブドウ球菌、サル痘ウイルス、ムンプスウイルス、マイコバクテリウム・アブセッサス(Mycobacterium abscessus)、マイコバクテリウム・アビウム(Mycobacterium avium)、マイコバクテリウム・ボビス(Mycobacterium bovis)、マイコバクテリウム・カヌッティイ(Mycobacterium canettii)、マイコバクテリウム・レプレ(Mycobacterium leprae)、ヒト結核菌、マイコバクテリウム・ウルセランス(Mycobacterium ulcerans)、マイコプラズマ・カプリコルム(Mycoplasma capricolum)、マイコプラズマ・ミコイデス(Mycoplasma mycoides)、マイコプラズマ・ニューモニア(Mycoplasma pneumoneae)、アメリカ十二指腸虫、淋病、ニューカッスル病ウイルス、ニパウイルス、ノルカジア属beijingensis、ノルカジア属cyriacigeorgica、ノルカジア属farcinica、ノロウイルスGI、ノロウイルスGII、ノーウォークウイルス、オムスク出血熱ウイルス、回旋糸状虫、発癌性ヒトパピローマウイルス、パラインフルエンザウイルス、寄生生物、マルネッフェイ型ペニシリウム症(Penicilliosis mameffei)、小反芻獣疫ウイルス、ニューモシスチス・イロベチイ(Pneumocystis jirovecii)、ポリオーマウイルス、プロテウス・ミラビリス(Proteus mirabilis)、緑膿菌、狂犬病ウイルス、8つの遺伝子断片すべてのコーディング領域の任意の部分を含有する、1918年のパンデミックインフルエンザウイルスの再構築された複製コンピテント形態、呼吸器合胞体ウイルス、ライノウイルス、発疹チフスリケッチア、リフトバレー熱ウイルス、牛疫ウイルス、ロタウイルスA、ロタウイルスB、ロタウイルスC、ロタウイルスG2、風疹ウイルス、SARS関連コロナウイルス(SARS-CoV)、SARS-CoV-1、SARS-CoV-2、ビルハルツ住血吸虫、日本住血吸虫、
マンソン住血吸虫、羊痘ウイルス、南米出血熱ウイルスチャパレ、南米出血熱ウイルスグアナリト、南米出血熱ウイルスフニン、南米出血熱ウイルスマチュポ、南米出血熱ウイルスサビア、黄色ブドウ球菌、スタフィロコッカス・サプロフィティカス(Staphylococcus saprophyticus)、肺炎レンサ球菌、豚水疱病ウイルス、有鉤条虫、ダニ媒介性脳炎複合(flavi)ウイルス極東亜型、ダニ媒介性脳炎複合(flavi)ウイルスシベリア亜型、タバコモザイク病ウイルス、トルクテノウイルス、鞭虫、ブルーストリパノソーマ(Trypanosoma brucei)、トリパノソーマ・クルージ(Trypanosoma cruzi)、大痘瘡ウイルス(天然痘ウイルス)、小痘瘡ウイルス(アラストリム)、ベネズエラ馬脳炎ウイルス、バンクロフト糸状虫、ペスト菌、又は前述の群の病原体と特徴的な核酸配列を共有する、別の潜在的に新規若しくは特性決定されていない病原体からなる群から選択される。
一実施形態では、病原体はSARS-CoV-2である。いくつかの実施形態では、配列変異体は、スパイクタンパク質(S)、受容体結合ドメイン(RBD)、S1タンパク質、S2タンパク質、E遺伝子、S遺伝子、Orflab遺伝子、N末端スパイクタンパク質ドメイン、全タンパク質(S1+S2)、及びヌクレオカプシド(N)タンパク質からなる群から選択される抗原をエンコードする領域にある。一実施形態では、標的増幅領域は、Sタンパク質をエンコードする領域から増幅される。一実施形態では、標的増幅領域は、Sタンパク質のRBDをエンコードする領域から増幅される。一実施形態では、標的増幅領域は、Nタンパク質をエンコードする領域から増幅される。
いくつかの実施形態において、固有のバーコード配列及びそれらの逆相補体は、他のすべてのバーコードからの最大レーベンシュタイン距離を有する。いくつかの実施形態では、固有のバーコード配列は、配列番号23-118に示されるポリヌクレオチド配列のいずれか1つを含む。いくつかの実施形態において、標的特異的プライマーの対は、フォワードプライマー:GACCCCAAAATCAGCGAAAT(配列番号3)及びリバースプライマー:TCTGGTTACTGCCAGTTGAATCTG(配列番号4)フォワードプライマー:TTACAAACATTGGCCGCAAA(配列番号5)及びリバースプライマー:GCGCGACATTCCGAAGAA(配列番号6);フォワードプライマー:GGGAGCCTTGAATACACCAAAA(配列番号7)及びリバースプライマー:TGTAGCACGATTGCAGCATTG(配列番号8);フォワードプライマー:GTGARATGGTCATGTGTGGCGG(配列番号9)及びリバースプライマー:CARATGTTAAASACACTATTAGCATA(配列番号10);フォワードプライマー:ACAGGTACGTTAATAGTTAATAGCGT(配列番号11)及びリバースプライマー:ATATTGCAGCAGTACGCACACA(配列番号12);フォワードプライマー:CCCTGTGGGTTTT AC ACTT A A(配列番号13)及びリバースプライマー:ACGATTGTGCATCAGCTGA(配列番号14);フォワードプライマー:GTACTCATTCGTTTCGGAAGAG(配列番号15)及びリバースプライマー:CCAGAAGATCAGGAACTCTAGA(配列番号16);フォワードプライマー:GGGG A ACTTCTCCTGCT AG A AT(配列番号17)及びリバースプライマー:CAGACATTTTGCTCTCAAGCTG(配列番号18);フォワードプライマー:AGATTTGGACCTGCGAGCG(配列番号19)及びリバースプライマー:GAGCGGCTGTCTCCACAAGT(配列番号20)からなるフォワードプライマー及びリバースプライマーの群から選択される。
いくつかの実施形態において、アダプター配列の第1の対及びアダプター配列の第2の対は同一であり、10~15ヌクレオチドを含む。一実施形態では、アダプター配列の対は10ヌクレオチドを含む。一実施形態では、アダプター配列の対は、ACACTGACGACATGGTTCTACA(配列番号21)及びTACGGTAGCAGAGACTTGGTCT(配列番号22)に示すポリヌクレオチド配列を含む。
病原体由来の少なくとも1つの標的核酸の存在を検出及び/又は同定するための逆転写酵素アッセイの概要である。
1つ又は複数の生物学的試料から少なくとも1つの少なくとも1つの標的タンパク質の存在を検出及び/又は同定するための血清学的アッセイの概要である。
バイオインフォマティクスパイプラインの概略図である。図3は、配列番号133を開示する。
各患者の試料に固有のバーコード化配列にライゲーションされた核酸塩基長約20のプライマーを使用して、SARS-Cov2ゲノム中の標的N1タンパク質の増幅によって生成された例示的なアンプリコンを示す。図4は、出現順に配列番号134~151をそれぞれ開示している。
固有のバーコード配列、アダプター配列及び標的増幅領域についてのアノテーションを含む例示的なアラインメントファイルである。図5Aは、SARS-Cov2ゲノムからの例示的な標的E-Guelphタンパク質の配列標識及びスコアリングデータを示す(それぞれ配列番号152~155、出現順)。 固有のバーコード配列、アダプター配列及び標的増幅領域についてのアノテーションを含む例示的なアラインメントファイルである。図5Bは、SARS-Cov2ゲノムからの例示的な標的RNAsePの配列標識及びスコアリングデータを示す(それぞれ配列番号156~159、出現順)。
SARS-CoV-2遺伝子標的からの多重化PCR及びシーケンシングの結果を示し、優れた増幅及び高いアラインメントスコアを実証している。
複数のシーケンシング実施にわたって得られた再現性の高い多重化PCR及びシーケンシング結果を示す。
本明細書に記載の組成物及び方法は、複数の試料からの病原体の同時迅速検出に有用である。本開示は、単一の反応において、固有の検出可能なヌクレオチドバーコード配列を含有する数百以上の標的特異的プライマーを使用して、1つ又は複数の試料中の特異的分析物(例えば、ウイルス粒子、病原体由来の病原性決定因子に対する抗体)の存在を検出する、マルチプレックスアッセイを提供する。本開示はまた、核酸試料中の配列変異体を検出する方法を提供する。本明細書に記載の組成物、アレイ、システム及び方法は、PCR又は近接ライゲーションアッセイの単純さを組み合わせて、複数のアンプリコンの並行シーケンシングを用いて独自にバーコード化されたアンプリコンを生成し、生物学的試料から1つ又は複数の分析物(例えば、ポリヌクレオチド及び/又はタンパク質)の存在又は非存在を識別することに加えて、ソース識別情報を提供することができる。
I.定義
「アンプリコン」という用語は、PCR反応の核酸産物を指す。本明細書で提供されるアンプリコンは、目的の配列(例えば、ウイルス配列)に隣接するバーコード配列を含む。アンプリコンは、二本鎖又は一本鎖であり得、二本鎖増幅産物を変性することによって得られた分離構成要素鎖を含み得る。ある特定の実施形態において、1つの増幅サイクルのアンプリコンは、後続の増幅サイクルにおける鋳型として機能し得る。
「分析物」という用語は、本明細書に記載の方法によって検出又はアッセイされる物質を指す。典型的な分析物には、これらに限定されないが、ペプチド、タンパク質(例えば、抗体、抗体の断片、scFv)、核酸、有機及び無機分子を含む小分子、ウイルス及び他の微生物、細胞他、並びにそれらの断片及び産物が、いずれの分析物も特異的結合対相互作用に関与できる任意の物質又は実体であるように含まれ得、例えば、そのためのエピトープ(すなわち、付着部位)、結合メンバー又は受容体(抗体など)を開発することができる。
本明細書で使用される場合、「結合ドメイン」という用語は、抗体、抗体誘導体、ペプチド、タンパク質又は核酸アプタマーの群から選択される部分を指す。「抗体」という用語は、認識された免疫グロブリン遺伝子の全部又は一部によって実質的にエンコードされる1つ以上のポリペプチドからなるタンパク質を指す。認識されている免疫グロブリン遺伝子には、例えばヒトでは、カッパ(κ)、ラムダ(l)及び重鎖遺伝子座が含まれ、これらは共に無数の可変領域遺伝子を含み、定常領域遺伝子はミュー(μ)、デルタ(δ)、ガンマ(γ)、シグマ(ε)及びアルファ(α)であり、それぞれIgM、IgD、IgG、IgE及びIgAアイソタイプをエンコードする。本明細書における抗体は、完全長抗体及び抗体断片を含むことを意味し、任意の生物由来の天然抗体、設計された抗体、又は実験、治療、若しくは以下でさらに定義される他の目的のために組換え生成された抗体を指し得る。抗体断片は当技術分野で公知であり、これらに限定されないが、抗体のFab、Fab’、F(ab’)2、Fv、scFv、又は他の抗原結合部分列を含み、全抗体又は組換えDNA技術を使用してデノボで合成されるもののいずれかの修飾によって産生される。抗体はモノクローナル又はポリクローナルであり得、細胞に対して他の特異的活性を有し得る(例えば、アンタゴニスト、アゴニスト、中和抗体、阻害抗体又は刺激抗体)。
「増幅」という用語は、核酸配列のコピー数が線形又は対数様式のいずれかで増加するように、「複製」が環状プロセスで繰り返されるプロセスを指す。そのような複製プロセスには、例えば、ローリングサークル増幅(RCA)、ポリメラーゼ連鎖反応(PCR)が含まれ得るが、これらに限定されない。DNAポリメラーゼによって駆動されるRCAは、Lizardi et al.,Nature Genet.19:225-232(1998);米国特許第5,854,033号及び6,143,495号;PCT出願番号WO97/19193)に記載されたように、等温条件下で線形又は幾何学キネティクスのいずれかを有する環状オリゴヌクレオチドプローブを増幅することができ、すべての参考文献は、その全体が組み込まれる。いくつかの実施形態では、RCAは、標的配列にハイブリダイズしたプローブ分子の環状化、及びそれに続く、米国特許第5,854,033号及び6,143,495号;PCT出願番号WO97/19193号に記載の環状プローブのローリングサークル増幅を含む。米国特許第5,854,033号及び6,143,495号;PCT出願番号WO97/19193、並びにDean et al.,Genome Research11:1095-1099(2001)に記載の通り、増幅産物の非常に高い収率をローリングサークル増幅を用いて得ることができる。本明細書で提供される参考文献は、その全体が組み込まれる。「アンプリコン」とは、目的のポリヌクレオチドの増幅中に生成されるポリヌクレオチドを意味する。一例では、ポリメラーゼ連鎖反応中にアンプリコンが生成される。
本明細書で使用される場合、「生物学的試料」は、対象(又は動物)から単離された組織又は体液の試料を指し、本開示の文脈では、一般に、病原体(例えば、ウイルスRNA)、ウイルス粒子(例えば、SARS-CoV-2ウイルスのウイルス粒子)及び/又は1つ以上の病原性抗原と特異的に結合する抗体若しくはその断片からの核酸を含有すると疑われる試料を指す。試料は、任意の処理の後、インビトロアッセイで分析することができる。対象となる典型的な試料には、呼吸分泌物(例えば、鼻腔、肺などの体液又は組織から得られた試料)、血液、血漿、血清、血球、糞便、尿、涙、唾液、乳、器官、生検、並びに腸管及び気道の分泌物が含まれるが、必ずしもこれらに限定されない。試料はまた、インビトロ細胞培養成分、例えば、これらに限定されないが、培養培地中の細胞及び組織の成長から生じる馴化培地、例えば組換え細胞、並びに細胞成分の試料を含む。
本明細書で使用される場合、「バーコード配列」、又は「検出可能なバーコード配列」、又は「分子タグ」、又は「バーコード標識」、又はそれらの文法的等価物は、ソース識別子として作用することができ、かつ/又はヌクレオチド配列(例えば、DNA、RNA)の認識を促進することができる部分(例えば、3~15ヌクレオチドのヌクレオチド配列)を意味する。特定の実施形態では、各オリジナルDNA又はRNA分子は、固有の配列バーコードに結合され、そのような配列は、本明細書に記載のアッセイの完了後に固有のソース配列又は固有の配列のセットまで追跡することができる。異なるバーコードを有する配列リードはオリジナル分子が異なることを表すが、同じバーコードを有する配列リードは1つのオリジナル分子からのPCR複製の結果であることが一般に理解される。標的定量化はまた、全リードカウントが不均一増幅によって標的に対してよりゆがみやすいので、全リードの数をカウントするのではなく、リード中の固有の分子バーコードの数をカウントすることによって達成され得る。「固有のバーコード」、「別個のバーコード」、又はそれらの文法的等価物とは、第1のバーコードが、その検出特性(例えば、固有の配列)又はその強度/濃度/絶対量のいずれかによって、検出アッセイにおいて第2のバーコード(又は他のすべてのバーコード)と識別され得ることを意味する。
本明細書を通して、略語は、ヌクレオチド(塩基とも呼ばれる)を指すために使用され、複数のヌクレオチドを指す略語を含む。本明細書で使用される場合、G=グアニン、A=アデニン、T=チミン、C=シトシン、及びU=ウラシルである。ヌクレオチドは、全体を通して小文字又は大文字を使用して称され得る。
2つのヌクレオチド配列は、それらの分子が塩基対構成相同性を共有する場合、互いに「相補的」である。「相補的」ヌクレオチド配列は、特異性と組み合わされて、適切なハイブリダイゼーション条件下で安定な二重鎖を形成する。例えば、2つの配列は、逆平行センスにおいて第1の配列の一部分が第2の配列の一部分に結合することができる場合、相補的であり、ここで各配列の3’末端は他の配列の5’末端に結合し、次いで1つの配列の各A、T(U)、G及びCは他の配列のT(U)、A、C及びGにそれぞれアラインメントされる。RNA配列は、相補的なG=U又はU=G塩基対も含み得る。したがって、2つの配列は、本開示下で「相補的」であるために完全な相同性を有する必要はない。通常、ヌクレオチドの少なくとも約85%(好ましくは少なくとも約90%、最も好ましくは少なくとも約95%)が分子の定義された長さにわたって塩基対構成を共有する場合、2つの配列は十分に相補的である。
本明細書で使用される「レーベンシュタイン距離スコア」という用語は、他のすべてのバーコードとの最大レーベンシュタイン距離を各バーコードに割り当て、レーベンシュタイン距離を降順にソートするスコアである。本明細書で使用される場合、「レーベンシュタイン距離」という用語は、2つの配列間の差異の程度に相当する。例えば、第1バーコード配列と第2バーコード配列との間のレーベンシュタイン距離は、第1バーコード配列を第2バーコード配列に変更するために必要な単一ヌクレオチド変化の数に相当する。レーベンシュタイン距離は平均化することができる。いくつかの実施形態では、接合部は、平均2つ以上の接合部距離を有するように設計される。いくつかの実施形態では、最大レーベンシュタイン距離をもたらすバーコード配列の設計が選択される。
用語「核酸」には、DNA、RNA(二本鎖又は一本鎖)、類似体(例えば、PNA分子又はLNA分子)及びそれらの誘導体が含まれる。本明細書で使用される「リボ核酸」及び「RNA」という用語は、リボヌクレオチドから構成されるポリマーを意味する。本明細書で使用される「デオキシリボ核酸」及び「DNA」という用語は、デオキシリボヌクレオチドから構成されるポリマーを意味する。「mRNA」という用語は、メッセンジャーRNAを意味する。
「オリゴヌクレオチド」は、一般に、約10~100ヌクレオチド長のヌクレオチド多量体を指し、「ポリヌクレオチド」は、任意の数のヌクレオチドを有するヌクレオチド多量体を含む。したがって、「核酸」という用語は、ポリヌクレオチドの従来の骨格が非天然発生又は合成の骨格で置き換えられたポリマー、及び従来の塩基の1つ以上がワトソン・クリック型水素結合相互作用に関与することができる基(天然又は合成)で置き換えられた核酸(又は合成若しくは天然の類似体)を含む。ポリヌクレオチドは、一本鎖又は複数本鎖の構成を含み、一本以上の鎖は、別の鎖と完全に一直線に並んでいても、又はそうでなくてもよい。「ヌクレオチド」は、核酸のサブユニットを指し、ホスフェート基、5炭素糖及び窒素含有塩基、並びにポリマー形態で(ポリヌクレオチドとして)、天然に存在するポリヌクレオチドと、2つの天然に存在するポリヌクレオチドのものと類似する配列特異的な様式でハイブリダイズすることができる、そのようなサブユニットの機能的類似体(合成又は天然を問わず)を有する。特に明記しない限り、「ポリヌクレオチド」、「オリゴヌクレオチド」、「核酸」及び「核酸分子」という用語の間の長さの意図した区別はなく、これらの用語は互換的に使用される。これらの用語は、分子の一次構造のみを指す。したがって、これらの用語には、例えば、3’-デオキシ-2’、5’-DNA、オリゴデオキシリボヌクレオチドN3’ P5’ホスホラミデート、2’-O-アルキル置換RNA、二本鎖及び一本鎖DNA、並びに二本鎖及び一本鎖RNA、DNA:RNAハイブリッド、並びにPNAとDNA又はRNAとの間のハイブリッドが含まれ、また、公知のタイプの修飾、例えば、当技術分野で公知の標識、メチル化、「キャップ」、1つ以上の天然に存在するヌクレオチドの類似体による置換、ヌクレオチド間修飾、例えば、非荷電結合を含むもの(例えば、メチルホスホネート、ホスホトリエステル、ホスホルアミデート、カルバメートなど)、負荷電結合を含むもの(例えば、ホスホロチオエート、ホスホロジチオエートなど)、及び正荷電結合を含むもの(例えば、アミノアルキルホスホルアミデート、アミノアルキルホスホトリエステル)、ペンダント部分を含むもの、例えば、タンパク質(ヌクレアーゼ、毒素、抗体、シグナルペプチド、ポリ-L-リジンなどを含む)、インターカレータを含むもの(例えば、アクリジン、ソラレンなど)、キレート剤を含むもの(例えば、金属、放射性金属、ホウ素、酸化金属など)、アルキル化剤を含むもの、修飾された結合を含むもの(例えば、アルファアノマー核酸など)、並びにポリヌクレオチド又はオリゴヌクレオチドの非修飾形態が含まれる、特に、DNAはデオキシリボ核酸である。
「マルチプレックス」又は「多重化」という用語は、単一の反応に組み合わされた複数の試料の同時検出を指す。複数の固有のバーコード配列で多重化すると、1つの実験においていくつかの試料の個別化された検出及びソース識別が可能になる。本明細書で使用される「マルチプレックスPCR」という用語は、同じ反応容器内の2つ以上の標的核酸の同時増幅及び検出を提供するアッセイを指す。各増幅反応は、別個のプライマー対を使用してプライミングされる。いくつかの実施形態において、各プライマー対の少なくとも1つのプライマーは、検出可能な部分で標識される。いくつかの実施形態において、マルチプレックス反応は、各標的核酸に対する特異的プローブをさらに含み得る。いくつかの実施形態において、特異的プローブは、種々の検出可能な部分で検出可能に標識される。
本明細書で使用される「プライマー」又は「オリゴヌクレオチドプライマー」という用語は、プライマー伸長産物の合成が誘導される条件下、例えばヌクレオチド及び重合誘導剤、例えばDNA又はRNAポリメラーゼの存在下、適切な温度、pH、金属濃度及び塩濃度に置かれた場合に、相補的核酸鎖の合成を開始するように作用するオリゴヌクレオチドを指す。プライマーは、一般に、プライマー伸長産物の合成におけるそれらの使用に適合する長さであり、通常は8~100ヌクレオチド長の範囲、例えば10~75、15~60、15~40、18~30、20~40、21~50、22~45、25~40など、より典型的には18~40、20~35、21~30ヌクレオチド長の範囲、及び記載された範囲の間の任意の長さである。典型的なプライマーは、10~50ヌクレオチド長、例えば15~45、18~40、20~30、21~25などの範囲、及び記載した範囲の間の任意の長さであり得る。いくつかの実施形態では、プライマーは通常、約10、12、15、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65又は70ヌクレオチド長以下である。
「プライマー」という用語は、ポリヌクレオチド、一般に、典型的には約12~約35ヌクレオチド長である「標的」結合部分を含むオリゴヌクレオチドであって、典型的なストリンジェンシー条件下で標的核酸隣接配列又は対応する増幅産物のプライマー結合部位と選択的にハイブリダイズするように設計され、対応するポリヌクレオチド鋳型に相補的であるヌクレオチド配列を、その3’末端から合成するための開始点として役立つオリゴヌクレオチドを指す。
プライマーは、通常、増幅の最大効率のために一本鎖であるが、代わりに二本鎖であってもよい。二本鎖の場合、プライマーは、通常、伸長産物を調製するために使用される前に、まずその鎖を分離するように処理される。この変性工程は、典型的には熱によって行われるが、代わりにアルカリを使用して実施し、続いて中和してもよい。したがって、「プライマー」は鋳型に相補的であり、水素結合又は鋳型とのハイブリダイゼーションによって複合体化して、ポリメラーゼによる合成開始のためのプライマー/鋳型複合体をもたらし、これはDNA合成の過程で、鋳型に相補的なその3’末端で連結される共有結合塩基の付加によって伸長される。
「フォワード」及び「リバース」という用語は、プライマー対のプライマーに関して使用される場合、ポリヌクレオチド配列上のプライマーの相対的な配向を示す。例えば、「リバース」プライマーは、典型的には、鋳型ポリヌクレオチドの「3’末端」における、又はその近くの下流プライマー結合部位と、右から左に向かって5’から3’の向きでアニーリングするように設計される。対応する「フォワードプライマー」は、ポリヌクレオチドの「5’末端」における、又はその近くの上流プライマー結合部位の相補体と、左から右への5’から3’の「フォワード」配向でアニーリングするように設計される。本明細書に記載の「プライマー対」は、フォワードプライマー及び対応するリバースプライマーを含む。
本明細書で使用される「プローブ」という用語は、特定の核酸配列上の相補的プローブ結合部位、例えばアンプリコンと配列特異的にハイブリダイズするように設計された部分を含むポリヌクレオチドを指す。本明細書に記載のプローブ及びプライマーの配列特異的部分は、標的核酸及び所望のアンプリコン中の相補的配列への特異的アニーリングを可能にするのに十分な長さである。
「ハイブリダイズする」及び「ハイブリダイゼーション」という用語は、ワトソン・クリック塩基対合を介して複合体を形成するのに十分に相補的なヌクレオチド配列間の複合体の形成を指す。プライマーが標的(鋳型)と「ハイブリダイズする」場合、そのような複合体(又はハイブリッド)は、DNA合成を開始するために、例えばDNAポリメラーゼによって必要とされるプライミング機能を果たすのに十分に安定である。
「ハイブリダイゼーションを可能にする条件」という語句は、プライマーがその相補的結合パートナーに優先的にハイブリダイズするか、又は特異的に結合し、他の配列とはより低い程度であるか、又は全くしない条件を指す。ハイブリダイゼーションを可能にする条件の一例は、50℃以上、0.1xSSC(15mM塩化ナトリウム/1.5mMクエン酸ナトリウム)でのハイブリダイゼーションである。ストリンジェントなハイブリダイゼーション条件の別の例は、50%ホルムアミド、5xSSC(150mM NaCl、15mMクエン酸三ナトリウム)、50mMリン酸ナトリウム(pH7.6)、5×デンハルト溶液、10%デキストラン硫酸、及び20mg/mlの変性断片化サケ***DNAの溶液中、42℃で一晩インキュベーションすること、続いてフィルターを約65℃の0.1xSSC中で洗浄することである。いくつかの実施形態では、ハイブリダイゼーションさせる条件は、上記の代表的な条件と少なくとも同程度にストリンジェントであるストリンジェントなハイブリダイゼーション条件であり、ここで条件は、それらが上記の特定の条件の少なくとも約80%程度でストリンジェント、典型的には少なくとも約90%程度でストリンジェントである場合、少なくとも同程度にストリンジェントであるとみなされる。他のストリンジェントなハイブリダイゼーション条件は当技術分野で公知であり、本明細書に記載されるこの特定の実施形態の核酸を同定するために使用することもできる。
「結合する」又は「結合された」とは、分子が目的の標的に優先的に結合するか、又は他の分子よりも大きな親和性で標的に結合することを意味する。例えば、抗原でコーティングされたビーズは、特異的結合抗体に結合し、いかなる免疫グロブリン分子にも結合しない。
「同定する」という用語は、任意の形態の測定を含み、検出される分析物の存在、非存在又は量を決定することを含む。一実施形態では、分析物は、COVID 19ポリヌクレオチド又は他のRNAウイルスポリヌクレオチドである。「決定する」、「検出する」、「測定する」、「評価する」、「査定する」及び「アッセイする」という用語は互換的に使用され、定量的及び定性的決定を含む。同定は、相対的又は絶対的であってもよい。「aを同定する」は、存在する何かの量を測定すること、及び/又は存在するか否かを判定することを含む。本明細書で使用される場合、「決定する」、「測定する」、及び「査定する」及び「アッセイする」という用語は互換的に使用され、定量的及び定性的決定の両方を含む。
本明細書で使用される「ハイスループットシーケンシング」「ハイスループット、大規模並行シーケンシング」、「第3世代シーケンシング」、又は「ナノポアシーケンシング」という用語は、クローン増幅分子の、及び単一核酸分子の複数のシーケンシング反応を並行して発生させることができるシーケンシング方法を指す。これにより、スループット及びデータの収率を向上させることができる。これらの方法は、次世代シーケンシング(NGS)方法としても当技術分野で公知である。NGS法には、例えば、可逆的色素ターミネーターを使用した合成によるシーケンシング、ライゲーションによるシーケンシング、及びナノポアシーケンシングが含まれる。一般的に使用されるNGSプラットフォームの非限定的な例としては、miRNA BeadArray(Illumina,Inc.)、Roche 454 TM GS FLXTM-Titanium(Roche Diagnostics)、ABI SOLiDTM System(Applied Biosystems,Foster City,CA)、及びHeliScope(商標)(Helices Biosciences Corp.,Cambridge MA)、及びオックスフォードナノポアシーケンサーが挙げられる。
本明細書で使用される「リード」という用語は、一般に、単一の核酸鋳型分子、又は鋳型核酸分子の複数の実質的に同一のコピーの集団から得られた配列組成物を含むデータを指す。
「逆転写酵素」とは、プライミングされた一本鎖RNA鋳型鎖を、デオキシリボヌクレオチド及び許容的反応媒体、例えば、これらに限定されないが、緩衝液(pH7.0-9.0)、ナトリウム及び/又はカリウムイオン及びマグネシウムイオンの存在下で相補的DNA鎖へと複製する酵素を意味する。当業者に明らかなように、許容的反応媒体の濃度及びpH範囲は、特定の逆転写酵素に関して変動し得る。当技術分野で周知の適切な「逆転写酵素」の例は、MmLV逆転写酵素及びその市販の誘導体「Superscript I、II及びIII」(Life Technologies)、「MaxiScript」(Fermentas)、RSV逆転写酵素及びその市販の誘導体「OmniScript」(Qiagen)、AMV逆転写酵素及びその市販の誘導体「Thermoscript」(Sigma-Aldrich)であるが、これらに限定されない。
本明細書で使用される「コロナウイルス」は、コロナウイルス科の属を指す。コロナウイルスは、大型の、エンベロープを有するプラス鎖RNAウイルスであり、組換えの頻度が高くなる独特の機構によって複製する。
用語「COVID 19」は、「Wuhan-hu-1」、「重症急性呼吸器症候群コロナウイルス2分離株、SARS-CoV-2」とも呼ばれ、ウイルスの科、すなわち、コロナウイルス科に属するウイルス、コロナウイルス研究グループ(de Groot 2013)の命名法に従うベータコロナウイルス属のグループIV((+)ssRNA)ウイルスを指す。
「中東呼吸器症候群コロナウイルス」という用語は、本明細書ではMERSとも略され、コロナウイルス研究グループ(de Groot 2013)の命名法に従うベータコロナウイルス属のグループIV((+)ssRNA)ウイルスである。このウイルスは、Zaki et al.(2012)、Bermingham et al.(2012)、van Boheemen et al.(2012)及びMuller et al.
2012によって、ヒトコロナウイルスEMCとして2012年に初めて記載された。ヒトベータコロナウイルス2c EMC/2012の完全ゲノムは、GenBank受入れ番号JX869059.2で寄託されている
用語「重症急性呼吸器症候群コロナウイルス、SARS-CoV」は、ウイルスの科、すなわち、コロナウイルス科に属するウイルス、コロナウイルス研究グループ(de Groot 2013)の命名法に従うベータコロナウイルス属のグループIV((+)ssRNA)ウイルスを指す。SARS-CoVゲノムRNAは、「29,700塩基対長であり、14のオープンリーディングフレーム(orf)を有し、他のコロナウイルスに類似するレプリカーゼ、スパイク、膜、エンベロープ及びヌクレオカプシド(N)、並びにいくつかの他の独特なタンパク質をエンコードする(Marra et al,2003;Rota et al,2003)。SARS-CoVゲノム長RNAは、50kDa-ヌクレオカプシドタンパク質(N)によってパッケージングされている可能性が高い[8]。他のコロナウイルスと同様に、ビリオンは、約140kDaのスパイク糖タンパク質(S)、23kDaの膜糖タンパク質(M)及び約10kDaのタンパク質(E)を含むいくつかのウイルス構造タンパク質を含む。
II.アンプリコン
一態様では、本開示はアンプリコンを含む組成物を提供する。本明細書に記載される多くの実施形態では、アンプリコンは、第1の固有のバーコード配列及びその逆相補体、標的特異的プライマーの対、標的増幅領域及びアダプター配列の第1の対を含む。標的特異的プライマーの対はフォワードプライマーとリバースプライマーとから構成され、それぞれが標的増幅領域(例えば、ウイルスゲノムの領域)内のプライミング部位に相補的な配列を有する。多くの実施形態において、フォワードプライマー及びリバースプライマーの各々は、標的増幅領域に隣接し、次に第1の固有のヌクレオチドバーコード配列及びその逆相補体に隣接し、第1の固有のバーコード配列及びその逆相補体は、アダプター配列の第1の対に隣接する。本明細書においてアダプター配列又はアダプターとも呼ばれるスペーサー配列は、典型的には、定義された長さ(例えば、10ヌクレオチド)の保存された配列を含む。5’から3’への例示的なアンプリコン構造は、[フォワード_アダプター]-[第1の固有のバーコード配列]-[フォワードプライマー]-[標的増幅領域]-[リバースプライマー]-[第1の固有のバーコード(リバース補完)]-[リバース_アダプター]である。いくつかの実施形態では、固有のバーコードの第2のセット、第2の固有のバーコード配列及びその逆相補体はライゲーションすることができる。5’から3’へのバーコードの第2のセットを有する例示的なアンプリコン構造は、[第2の固有のバーコード配列]-[第2のフォワード_アダプター]-[第1のフォワード_アダプター]-[第1の固有のバーコード配列]-[フォワードプライマー]-[標的増幅領域]-[リバースプライマー]-[第1の固有のバーコード(リバース補完)]-[第1のリバース_アダプター]-[第2のリバース_アダプター]-[第2の固有のバーコード(リバース補完)]である。SARS-Cov-2 PCR標的-N1遺伝子についての例示的なバーコード化フォワード及びリバースプライマー配列を以下に示す。
バーコード化フォワードプライマー-TAACTTGGTCGACCCCAAAATCAGCGAAAT(配列番号1)
バーコード化リバースプライマー-GTCTAAGTTGACCGTCATTGGTCTATTGAACCAG(配列番号2)
本明細書中に提供される開示では、少なくとも1つのプライマーが使用され得る(例えば、対象からの試料をシーケンシングするために、又はライブラリーを調製するために)。いくつかの実施形態において、1つのプライマーを使用してもよい。いくつかの実施形態において、2つ以上のプライマーを使用してもよい。例えば、1、2、3、4、5、6、7、8、9、又は10のプライマーを使用することができる。いくつかの実施形態では、10を超えるプライマーを使用することができる。例えば、第1、第2、第3、第4、第5、第6、第7、第8、第9及び/又は第10のプライマーを使用することができる。いくつかの実施形態において、プライマーは、所望の配列を含むことができる。いくつかの実施形態において、プライマーは、2つ以上の所望の配列を含むことができる。例えば、所望の配列は、予め決定された配列、相補的配列、既知の配列、結合配列、ユニバーサル配列、又は検出配列であり得る。いくつかの実施形態において、予め決定された配列はユニバーサル配列であり得る。
いくつかの実施形態では、ポリヌクレオチド(例えば、標的配列又は標的増幅領域内の配列)を、所望の配列を含有する少なくとも1つのプライマーと接触させることができる。いくつかの実施形態では、プライマーは、限定されないが、ポリヌクレオチドにハイブリダイズ又はアニーリングされ得る。例えば、所望の配列(例えば、所定の標的配列)を有するプライマーを使用して、酵素を使用してポリヌクレオチドを増幅することができる。例えば、酵素はポリメラーゼ(例えば、Taqポリメラーゼ)であり得る。いくつかの実施形態では、所定の配列を含有するプライマーは、ポリヌクレオチドの3’末端又は5’末端にアニーリング又はハイブリダイズされ得る。いくつかの実施形態では、2つ以上の所定の配列が、ポリヌクレオチドにアニーリング又はハイブリダイズされ得る。例えば、第1の所定の配列は、ポリヌクレオチドの一端にアニーリング又はハイブリダイズされ得、第2の所定の配列は、ポリヌクレオチドの他端にアニーリング又はハイブリダイズされ得る。いくつかの実施形態では、第1の所定の配列は、第2の所定の配列に相補的であり得る。いくつかの実施形態では、第1の所定の配列は、第2の所定の配列に逆相補的であり得る。いくつかの実施形態では、第1の所定の配列は、第2の所定の配列に相補的でなくてもよい。
本明細書で提供される組成物及び方法において有用である非限定的な例示的プライマー対は、フォワードプライマー:GACCCCAAAATCAGCGAAAT(配列番号3)及びリバースプライマー:TCTGGTTACTGCCAGTTGAATCTG(配列番号4);フォワードプライマー:TTACAAACATTGGCCGCAAA(配列番号5)及びリバースプライマー:GCGCGACATTCCGAAGAA(配列番号6);フォワードプライマー:GGGAGCCTTGAATACACCAAAA(配列番号7)及びリバースプライマー:TGTAGCACGATTGCAGCATTG(配列番号8);フォワードプライマー:GTGARATGGTCATGTGTGGCGG(配列番号9)及びリバースプライマー:C AR ATGTT A A AS AC ACT ATT AGC AT A(配列番号10);フォワードプライマー:ACAGGTACGTTAATAGTTAATAGCGT(配列番号11)及びリバースプライマー:ATATTGCAGCAGTACGCACACA(配列番号12);フォワードプライマー:CCCTGTGGGTTTTACACTTAA(配列番号13)及びリバースプライマー:ACGATTGTGCATCAGCTGA(配列番号14);フォワードプライマー:GTACTCATTCGTTTCGGAAGAG(SEQ ID NO.:15)及びリバースプライマー:CCAGAAGATCAGGAACTCTAGA(配列番号16);フォワードプライマー:GGGGAACTTCTCCTGCTAGAAT(配列番号17)及びリバースプライマー:CAGACATTTTGCTCTCAAGCTG(配列番号18);及びフォワードプライマー:AGATTTGGACCTGCGAGCG(配列番号19)及びリバースプライマー:GAGCGGCTGTCTCCACAAGT(配列番号20)を含む。
いくつかの実施形態では、第1の固有のバーコード配列及びその逆相補体を用いた単一段階バーコード化手順が使用される。そのような実施形態では、第1の固有のバーコード及びその逆相補体並びにアダプター配列の第1の対は、増幅プロセスで使用されるプライマーによって導入される。これらの実施形態では、アダプター配列の第1の対は、少なくとも10~15ヌクレオチドを有する不変配列を有する。一実施形態では、不変アダプター配列は10ヌクレオチドを有する。特定の実施形態では、不変アダプター配列は、ACACTGACGACATGGTTCTACA(配列番号21)及びTACGGTAGCAGAGACTTGGTCT(配列番号22)に示すポリヌクレオチド配列を含む。他の不変アダプター配列を生成し、本開示の範囲内に含めることができる。別の実施形態では、第1の固有のバーコード配列及び第2の固有の逆相補体を用いた単一段階バーコード化手順が使用される。そのような実施形態では、第1の固有のバーコード、第2の固有の逆相補体及びアダプター配列の第1の対は、増幅プロセスで使用されるプライマーによって導入される。
他の実施形態では、第1の固有のバーコード配列及びその逆相補体、並びに第2の固有のバーコード配列及びその逆相補体を用いる2段階バーコード化手順が使用される。そのような実施形態では、第1の固有のバーコード配列及びその逆相補体、並びにアダプター配列(例えば、アダプター配列の第1の対)は、増幅プロセスで使用されるプライマーによって導入される。バーコードの第2のセット(例えば、段階1のプレートからプールされた試料を追跡するために使用されるバーコード、第2の固有のバーコード配列)をアンプリコンの末端にライゲーションする。結果として、不変アダプター配列は、2つのバーコードの間に位置することになる。これにより、2つのバーコードを互いに直接隣接させることに起因し得るアンビギュイティが回避される。いくつかの実施形態では、2つの異なる内側バーコード配列を用いる2段階バーコード化手順が使用される。いくつかの他の実施形態では、2つの異なる外側バーコード配列を用いる2段階バーコード化手順が使用される。さらに別の実施形態では、2つの異なる内側バーコード配列及び2つの異なる外側バーコード配列を用いる2段階バーコード化手順が使用される。異なる内側バーコード及び外側バーコードを用いるいくつかの実施形態では、すべての4つの(2つの内側及び2つの外側)バーコードが異なる。
以下で詳細に説明するように、2段階バーコード手順が使用される場合、隠れマルコフモデル(HMM)又は共分散モデル(CM)を生成するために使用される配列は、不変スペーサー配列の両側に、配列リードの統計的モデルに対するアラインメントがバーコードの両方のセットに正しくアノテーションを付けるように、アンビギュイティ配列を組み込む。代替案は、使用される第2段階バーコードのそれぞれについてHMM又はCMモデルを作成し、これらのモデルの一方の質を使用して第2段階バーコードの同一性を割り当てることである。2段階バーコード化を用いる多くの実施形態では、アダプター配列の2つの対、アダプター配列の第1の対及びアダプター配列の第2の対が存在する。いくつかの実施形態では、アダプター配列の第1の対及び第2の対は、少なくとも10~15ヌクレオチドを有する不変配列と同一である。一実施形態では、不変アダプター配列は10ヌクレオチドを有する。特定の実施形態では、不変アダプター配列は、ACACTGACGACATGGTTCTACA(配列番号21)及びTACGGTAGCAGAGACTTGGTCT(配列番号22)に示すポリヌクレオチド配列を含む。他の不変アダプター配列を生成し、本開示の範囲内に含めることができる。
多くの実施形態において、不変アダプター配列は各プライマーの5’末端にある。結果として、各アンプリコン配列は、5’末端において、フォワード鎖プライマーからのアダプター配列のコピーで始まり、3’末端において、リバース鎖プライマーに由来するアダプターの逆相補配列を有する。理論に束縛されることを望むものではないが、これらのアダプター配列は2つの目的を果たす。第1に、それらは、長いリードを構成アンプリコン配列にセグメント化するのを助け、第2に、それらは、以下に記載されるHMM又はCMアラインメントにおける固有のバーコード配列の位置を固定し、固有のバーコード配列の位置を確実にアノテーションすることを可能にする。
いくつかの実施形態では、外側バーコード(例えば、プレート/バッチ識別子)は、典型的にはライゲーション反応を使用して、バーコード化アンプリコンに付加される。ライゲーションされた外側バーコードは、第2のPCR段階に基づく増幅に固有の交差増幅を回避する。内側バーコードは、いくつかの事例では、少なくとも96ウェルを有するプレート内の複数の別個の試料からの特定の試料にアノテーションを付けるための、患者又はウェル固有のバーコードである。外側バーコードは、特定のバッチを示すことができ、又はプレートの複数のバッチを有する別個のプレートに複数の別個の試料がある場合、プレート識別子とすることができる。バーコード配列及びプライマーは、二次構造相互作用についてスクリーニングされた非常に大きな検証済みIDTバーコードライブラリーから選択され、高度に最適化されたエラー耐性バーコード設計をもたらす。バーコード配列を含む本明細書で提供される組成物及び方法の実施形態では、レーベンシュタイン距離(LD)バーコード最適化を行って、シーケンシングエラー耐性及び最大識別可能性を確保する。まず、候補バーコードのセットから、すべてのバーコードと1つおきのバーコードとの間のレーベンシュタイン距離が計算される。次いで、各バーコードに他のすべてのバーコードに対する最大レーベンシュタイン距離を割り当て、レーベンシュタイン距離の降順でソートすることによって、バーコードをランク付けする。次に、ランク付けされたリストからのバーコード候補を含むグループから所望の数の、それらを他のバーコードから分離する最大LDを有するバーコードが選択される(例えば、96、又は384)。
非限定的な例示的バーコード配列を表1に提供する。表1の96個のバーコード配列(3000+総バーコード内から選択された)は、最大レーベンシュタイン距離で分離されている。
いくつかの実施形態において、最大レーベンシュタイン距離で分離されたバーコード配列の384個が選択される。バーコード配列の選択はアルゴリズム的に行われ、選択サイズに応じて異なる結果をもたらす。本明細書で提供される方法及び組成物の多くの実施形態において、選択されるバーコード配列の数は、プライマーが構築されるバーコードプールのサイズに基づく。
Figure 2023519919000001
非限定的な例示的外側バーコード配列を表2に提供する。表2の例示的なバーコード配列は、最大レーベンシュタイン距離で分離されている。
Figure 2023519919000002
バーコード及びバーコード化プライマーは、任意の生物、例えば、これらに限定されないが、ヒト、哺乳動物、さらには植物に特異的にすることができる。バーコードは、ヒト病原体(例えば、Sar-CoV-2)及びあらゆる種類の重要な獣医学的疾患の病原体(例えば、ウシ下痢、ヨーネ病、豚インフルエンザなど)についてアノテーションするように特に設計することができる。バーコードは、動物が各試料に標識され、適切にバーコードプライミングされている限り、群内の感染動物の個々の検出を容易にすることができる。
本明細書に記載される多くの実施形態では、標的増幅領域は、遺伝子又はタンパク質をエンコードする病原体のゲノム領域から増幅される。病原体は、アシネトバクター・バウマンニ(Acinetobacter baumannii)、アデノウイルス、アフリカ馬疫ウイルス、アフリカ豚コレラウイルス、ズビニ鉤虫(Anclostoma duodenale)、回虫、黄色アスペルギルス、アスペルギルス・フミガーツス(Aspergillus fumigatus)、アスペルギルス・ニガー(Aspergillus niger)、アスペルギルス・オリゼ(Aspergillus oryzae)、鳥インフルエンザウイルス、炭疽菌、炭疽菌パスツール株、Bacillus cereus Biovar anthracis、ウシ流産菌、ブルセラ・メリテンシス(Brucella melitensis)、ブルセラ・スイス(Brucella suis)、鼻疽菌、類鼻疽菌、カンジダ・アルビカンス(Candida albicans)、カンジダ・ドゥブリニエンシス(Candida dubliniensis)、カンジダ・グラブラタ(Candida glabrata)、カンジダ・クルセイ(Candida krusei)、カンジダ・トロピカリス(Candida tropicalis)、クラミジア・ニューモニエ(Chlamydia pneumoneae)、クラミジア・トラコマチス(Chlamydia trachomatous)、豚熱ウイルス、クロストリジウム・ディフィシール(Clostridium difficile)、コクシジオイデス・イミティス(Coccidioides immitis)、コクシジオイデス・ポサダシ(Coccidioides posadasii)、CoV-229E、CoV-HKU1、CoV-NL63、CoV-OC43、コクサッキーウイルスA、コクサッキーウイルスB、コクシエラ・バーネッティ(Coxiella burnetii)、クリミア・コンゴ出血熱、サイトメガロウイルス、デングウイルス、メジナ虫、東部馬脳炎、エボラウイルス、い粒条虫、多包条虫、エンテロバクター・クロアカ、エンテロコッカス・フェシウム(Enterococcus faecium)、エンテロウイルス、エプスタイン・バール・ウイルス、大腸菌、巨大肝蛭、肝蛭、***ウイルス、野兎病菌、山羊痘ウイルス、ヘモフィルス属インフルエンザ、ヘリコバクターピロリ、ヘンドラウイルス、A型肝炎ウイルス、B型肝炎ウイルス、C型肝炎ウイルス、ヒストプラスマ・カプスラーツム(Histoplasma capsulatum)、ズボアジ型ヒストプラスマ症(Histoplasma duboisii)、ヒトヘルペスウイルスHHV6、ヒトヘルペスウイルスHHV7、ヒトヘルペスウイルスHHV8、ヒトヘルペスウイルスHSV1、ヒトヘルペスウイルスHSV2、ヒト免疫不全ウイルス、ヒトパピローマウイルス、インフルエンザウイルスA型、インフルエンザウイルスB型、クレブシェラ肺炎桿菌、キャサヌール森林病ウイルス、ラッサ熱ウイルス、レジオネラ・ニューモフィラ菌、リーシュマニア・プロマスティゴート(Leishmania promastigotes)、Lujoウイルス、ランピースキン病ウイルス、マールブルグウイルス、麻疹ウイルス、メチシリン耐性黄色ブドウ球菌、サル痘ウイルス、ムンプスウイルス、マイコバクテリウム・アブセッサス(Mycobacterium abscessus)、マイコバクテリウム・アビウム(Mycobacterium avium)、マイコバクテリウム・ボビス(Mycobacterium bovis)、マイコバクテリウム・カヌッティイ(Mycobacterium canettii)、マイコバクテリウム・レプレ(Mycobacterium leprae)、ヒト結核菌、マイコバクテリウム・ウルセランス(Mycobacterium ulcerans)、マイコプラズマ・カプリコルム(Mycoplasma capricolum)、マイコプラズマ・ミコイデス(Mycoplasma mycoides)、マイコプラズマ・ニューモニア(Mycoplasma pneumoneae)、アメリカ十二指腸虫、淋病、ニューカッスル病ウイルス、ニパウイルス、ノルカジア属beijingensis、ノルカジア属cyriacigeorgica、ノルカジア属farcinica、ノロウイルスGI、ノロウイルスGII、ノーウォークウイルス、オムスク出血熱ウイルス、回旋糸状虫、発癌性ヒトパピローマウイルス、パラインフルエンザウイルス、寄生生物、マルネッフェイ型ペニシリウム症(Penicilliosis mameffei)、小反芻獣疫ウイルス、ニューモシスチス・イロベチイ(Pneumocystis jirovecii)、ポリオーマウイルス、プロテウス・ミラビリス(Proteus mirabilis)、緑膿菌、狂犬病ウイルス、8つの遺伝子断片すべてのコーディング領域の任意の部分を含有する、1918年のパンデミックインフルエンザウイルスの再構築された複製コンピテント形態、呼吸器合胞体ウイルス、ライノウイルス、発疹チフスリケッチア、リフトバレー熱ウイルス、牛疫ウイルス、ロタウイルスA、ロタウイルスB、ロタウイルスC、ロタウイルスG2、風疹ウイルス、SARS関連コロナウイルス(SARS-CoV)、SARS-CoV-1、SARS-CoV-2、ビルハルツ住血吸虫、日本住血吸虫、マンソン住血吸虫、羊痘ウイルス、南米出血熱ウイルスチャパレ、南米出血熱ウイルスグアナリト、南米出血熱ウイルスフニン、南米出血熱ウイルスマチュポ、南米出血熱ウイルスサビア、黄色ブドウ球菌、スタフィロコッカス・サプロフィティカス(Staphylococcus saprophyticus)、肺炎レンサ球菌、豚水疱病ウイルス、有鉤条虫、ダニ媒介性脳炎複合(flavi)ウイルス極東亜型、ダニ媒介性脳炎複合(flavi)ウイルスシベリア亜型、タバコモザイク病ウイルス、トルクテノウイルス、鞭虫、ブルーストリパノソーマ(Trypanosoma brucei)、トリパノソーマ・クルージ(Trypanosoma cruzi)、大痘瘡ウイルス(天然痘ウイルス)、小痘瘡ウイルス(アラストリム)、ベネズエラ馬脳炎ウイルス、バンクロフト糸状虫、ペスト菌、及び上記の病原体のいずれか1つと特徴的な核酸配列を共有する病原体、又は前述の群の病原体と特徴的な核酸配列を共有する、別の潜在的に新規若しくは特性決定されていない病原体からなる群から選択される。
一実施形態では、標的増幅領域は、SARS-CoV-2の特定のウイルスゲノム領域に相当する。標的増幅領域が増幅されるタンパク質をエンコードするゲノム領域の非限定的な例は、スパイクタンパク質(S)、受容体結合ドメイン(RBD)、S1タンパク質、S2タンパク質、E遺伝子、S遺伝子、Orflab遺伝子、N末端スパイクタンパク質ドメイン、全タンパク質(S1+S2)、及びヌクレオカプシド(N)タンパク質からなる群から選択される抗原をエンコードする領域を含む。一実施形態では、標的増幅領域は、Sタンパク質をエンコードする領域から増幅される。別の実施形態では、標的増幅領域は、Sタンパク質のRBDをエンコードする領域から増幅される。さらに別の実施形態では、標的増幅領域は、Nタンパク質をエンコードする領域から増幅される。
本明細書で提供されるアンプリコン構築物では、さらなるスペーサー配列(例えば、アダプター配列)がバーコードの外側に適用され得(例えば、バーコード配列の第1のセットに隣接する)、これらのスペーサー配列は、後のアンプリコン領域アノテーション(プロファイル隠れマルコフモデル又は共分散モデルアラインメントアルゴリズムによる関心領域のヌクレオチドごとのアノテーション)に重要である。いくつかの実施形態では、アンプリコンは2つのスペーサー配列のみを含む。他の実施形態では、アンプリコンは少なくとも4つ以上のスペーサー配列を含んでいた。いくつかの実施形態において、アダプター配列を含めて、複数のアンプリコンのそれぞれに第2の固有のバーコード配列を付加できるようにした。いくつかの例において、アダプター配列は配列読み取り中にマーカーとして作用して、バーコード配列の末端及び/又は次のバーコード配列の開始をシグナル伝達する。本明細書中に記載される実施形態の多くにおいて、スペーサー配列は保存されている。特定の実施形態では、バーコード化アンプリコン中のすべてのスペーサー配列は同一の配列であった。いくつかの実施形態において、アダプター配列は少なくとも10ヌクレオチドを含む。いくつかの他の実施形態において、アダプター配列は10~15ヌクレオチドを含む。一実施形態において、アダプター配列は10ヌクレオチドを含む。
III.シーケンシング、HMM及びCMエンジン
本明細書に記載される組成物及び方法の多くの実施形態では、ハイスループットシーケンシングが使用される。いくつかの実施形態では、ハイスループットシーケンシングを使用して、アンプリコン中の固有のバーコードを検出する。いくつかの他の実施形態では、ハイスループットシーケンシングを使用して、アンプリコンの標的増幅領域内の配列変異体を検出する。当技術分野で公知の任意のハイスループットシーケンシングプラットフォームを使用して、本明細書に記載のように調製されたシーケンシングライブラリーをシーケンシングすることができる(Myllykangas et al.,Bioinformatics fra・High Throughput Sequencing,Rodriguez-Ezpeleta et al.(eds.),Springer Science+Business Media,LLC,2012,11-25頁を参照)。例示的なハイスループットDNAシーケンシングシステムは、オックスフォードナノポアプラットフォーム(MinlON及びPromethlON機器を含む)、454 Life Sciencesによって最初に開発され、後にRoche(Basel,Switzerland)によって取得されたGS FLXシーケンシングシステム、Solexaによって開発され、後にlllumina Inc.(San Diego,CA)によって取得されたGenome Analyzer(Bentley,Curr Opin Genet Dev 16:545-52,2006;Bentley et al.,Nature 456:53-59,2008を参照)、Life Technologies(Foster City,CA)によるSOLiD配列システム(Smith et al.,Nucleic Acid Res 38:e 142,201 0;Valouev et al.,Genome Res 18:1051-63,2008を参照)、Complete Genomicsによって開発され、BGIによって取得されたCGA(Drmanac et al.,Science 327:78-81,201 0を参照)、Pacific Biosciences(Menlo Park,CA)によって開発されたPacBio RSシーケンシング技術(Eid et al.,Science 323:133-8,2009を参照)、及びLife Technologies Corporationによって開発されたIon Torrent(米国特許出願公開第2009/0026082号;2010/01 37143号;及び2010/0282617号を参照)を含むが、これらに限定されない。本明細書に記載の方法で使用されるオックスフォードナノポアDNAシーケンシングシステムは、通常に長さが250bp超えるアンプリコンを迅速かつ正確に読み取るのにより適している。Illuminaシーケンシングシステムは、比較的短いリードをもたらす長い処理時間及び合成によるシーケンシングのため、オックスフォードナノポアDNAシーケンシングシステム(例えば、ONT MinlON又はGridlON)と比較して本明細書に記載の方法に適していない可能性がある。
本明細書に記載の方法に適用される非限定的な例示的バイオインフォマティクスパイプラインの概要を図3に示す。バイオインフォマティクスパイプラインの工程1において、プールされたライブラリー調製物からのPCRアンプリコンをONT MinlON又はGridlONでシーケンシングして、生のONT FASTSシーケンシング出力ファイルを得る。次の工程では、高精度ONT GPUに基づくベースコーラーが生のFASTA/FASTQファイルをもたらす。次の工程は、FASTA/FASTQファイルを、統計的パターン分類アルゴリズムを適用するHMMER3及びCM配列アラインメント及びアノテーションエンジンに供して、a)複製配列リードに基づいて尤度を最大化すること、及び/又はb)全ゲノム多重配列アラインメントに基づいて文脈依存アラインメントモデルパラメータを使用することによってコンセンサス配列を生成する。最終的なフィルタリング工程において、二重バーコードを含むリードは、参照バーコード候補に対する最小レーベンシュタイン距離スコアに合格しなければならない。合格リードは、完全な標的配列アノテーション、モデルフィット、ビットスコア、バーコード位置、バーコード距離、及び他のメトリックと共に中央データベースに記憶される。
複数のアンプリコンの配列リードを提供するための様々な方法は、単一の分子を繰り返しシーケンシングすること、又は各々が関心領域の少なくとも一部を含む複数の分子をシーケンシングすることを含む。複数のアンプリコンの複数の配列リードのアラインメントは、一般に、例えば参照配列を使用するか又はデノボアセンブリルーチンを使用する、複数の配列アラインメントアルゴリズムを1つ以上含む。ある特定の実施形態において、コンセンサス配列を決定する方法を、所与の複数のバーコード配列リードのために反復して、例えば、リードの種々のサブセットを方法の種々の反復のために使用して適用した。そのようなサブセットは、様々な基準、例えば、様々なストリンジェントな品質閾値によって選択することができる。組み合わされた標的+リンカー+バーコード化プライマーは、リード品質及びコール精度の両方を改善し、ナノポアシーケンシングのロングリード能力を完全に利用する完全長のエラー耐性アンプリコンをもたらす。
本明細書中に記載される組成物及び方法の多くの実施形態において、バーコードの識別及び複数の配列の中からの各アンプリコンからの回収は、1つ以上の尤度モデル、エラーモデル、確率的グラフモデル(例えば、全経路確率的アラインメント)を適用する統計的パターン分類アルゴリズムの使用を必要とする。プロファイル隠れマルコフモデルアライナー(HMMER)及び場合により共分散モデル(Infernal)をバイオインフォマティクスツールとして使用して、各アンプリコンからの効率的なバーコード識別及び回収を可能にした。HMMER及びCMは、所与の特徴の一部であることの最大尤度を有するあらゆるヌクレオチド(挿入、置換及び欠失のようなシーケンサーのエラーに満ちたノイズの多い配列リードにおいてさえ)の標識を容易にする。例えば、バーコード領域は明確に定義され、確率的アライナーは、機器から出てくる配列内の各文字に「領域」アノテーションを割り当てる。これにより、別個のプライマーの同定が可能になり、さらに、誤って形成されたアンプリコン(例えばプライマー-二量体対)の同定も可能になる。HMMERは、検索データベースとは無関係に、所与のアラインメントが一致する長さを与えられる尤度に対応するビットスコアを割り当てる。これらのスコアは、各試料のアンプリコンをそれらの品質によってランク付けするのに重要であり、ナノポア機器のシーケンシングエラーの克服を可能にする。これらのアルゴリズムは、試料を逆多重化することができる能力にとって重要である。本明細書で提供されるアンプリコン配列は、プロファイルHMM及びCMによる最適な計算的アノテーション及びスコアリングのために設計された。
プロファイル隠れマルコフモデル(略してpHMM又はHMM)又は共分散モデル(CM)アラインメントエンジンなどの統計的モデルを本明細書に記載の方法で使用して、(1)ロングリードをそれらの構成アンプリコン配列にセグメント化し、(2)予め定義された配列モデルと一致する高品質のマッチングシーケンサー由来アンプリコン配列を同定し、(3)アンプリコン配列を、予め定義された配列モデルに対するそれらのアラインメント(一致としても知られる)の正確さ(「品質」)に従ってランク付けし、(4)予め定義された配列モデルの対応する(予めアノテーションされた)特徴に従ってアンプリコン内の内部人工配列ドメイン又は特徴を同定した。
本明細書中に記載される方法の多くの実施形態において、複数のアンプリコンの検出は、複数のアンプリコンのプールされた配列データセットを得ること、ベースコールを行うこと、複数のアンプリコンの配列データを予め定義されたアノテーション付きHMM又はCM遺伝子モデルにアラインメントすること、HMM/CMアラインメントの各々に階級(例えば、確率スコア又はビットスコア)を割り当てること、配列データをフィルタリングして位置アノテーション付き配列アラインメントを得ること、各アンプリコン内のバーコード並びにアンプリコンの配列内のバーコード及びアダプターの位置を決定することを含む。本明細書に記載の方法のすべての実施形態において、前述の工程は、適切にプログラムされたコンピュータを使用して実行される。本明細書に記載の方法のいくつかの実施形態では、高精度ONT GPUに基づくベースコーラーでベースコールが実行され、生のFASTA/FASTQファイルが生成される。これらの実施形態では、生ファイルは、プロファイルHMMエンジン及び/又はCMエンジンによってアラインメントされる。HMMエンジンは、複数の配列アラインメントをもたらすHMMERソフトウェアプログラムを含む。HMMERプログラムは、計算網羅的CMエンジンと比較して動作がかなり速いが、いずれのプログラムも、バーコード、標的増幅領域、プライマー、及びアダプターからなる群から選択される1つ又は複数の配列特徴についてヌクレオチドごとのアノテーションを割り当てる。
固有のバーコード配列、アダプター配列及び標的増幅領域についてのアノテーションを含む例示的なアラインメントファイルを図5A-図5Bに示す。
本明細書中に記載される方法の多くの実施形態において、フィルタリングは、合格スコア又は不合格スコアを配列アラインメントに割り当てることを含む。配列アラインメントは、参照バーコード化配列のセットに対して最小レーベンシュタイン距離スコアに合格する場合、及びアラインメントの最小ビットスコア閾値を合格する場合、合格スコアが割り当てられる。合格スコアを有する配列アラインメントは、典型的には中央データベースに記憶される。多くの場合、合格スコアを有する配列アラインメントは、試料中の病原体負荷の直接的な定量的表示に対応する。本明細書に記載のデータベースは、一般に、試料コレクションチューブに割り当てられた固有のバーコードの情報、少なくとも96個の固有のウェルバーコードのセットの情報、少なくとも96個の固有のプレートバーコードのセットの情報、複数のアンプリコンからの配列データのセットの情報及びレポートを有する。レポートは、各対象のソース識別情報及び対象が標的タンパク質の存在について陽性であるか陰性であるかに関する情報を含む。レポートは、対応する対象、又は診療所若しくは医師に提供することができる。
本明細書に記載される方法の多くの実施形態では、ナノポアシーケンシングのためのライブラリー調製の過程で、複数のアンプリコンを含有する高分子量コンカテマーをもたらす1つ又は複数のライゲーション工程が存在し得る。ナノポア装置は、時には数万ヌクレオチド長まで及び、多くの個々のアンプリコンを含むこれらのコンカテマーを単一の長いリードとして読み取る。シーケンサーはまた、このプールの一部でもある個々のライゲーションされていないアンプリコンを読み取る。HMM又はCM統計的モデルを使用して、これらのリードを、個々に分析されるそれらの構成アンプリコン配列へとセグメント化する。本明細書中に記載される方法の多くの実施形態において、プライマー設計は、各プライマーの5’末端に不変アダプター又はスペーサー配列を含む。結果として、各アンプリコン配列は、5’末端において、フォワード鎖プライマーからのスペーサー配列のコピーで始まり、3’末端において、リバース鎖プライマーに由来するスペーサーの逆相補配列を有する。これらのアダプター又はスペーサー配列は2つの目的を果たす。第1に、それらは、長いリードを構成アンプリコン配列にセグメント化するのを助け、第2に、それらは、HMM又はCMアラインメントにおけるバーコード配列の位置を固定し、バーコード配列の位置を確実にアノテーションすることを可能にする。
アラインメントエンジン(HMMについてはhmmer[S.R.Eddy、「Profile Hidden Markov Models」、Bioinformatics Review,Vol.14,no 9,1998,755-763頁を参照のこと]、又はCMについてはInfernal[Nawrocki 2009]に基づく)は、標的の配列及びアノテーションを含むファイルを読み取る。本明細書に記載される方法の例示的な実施形態では、標的は、SARS-CoV-2遺伝子N及びE遺伝子、ヒト遺伝子RNAseP、ベータ-アクチンの様々な領域、並びにバクテリオファージMS2の領域から選択され、かつ/又はTM3は対照として使用される。
特定の実施形態では、統計的パターン分類アルゴリズムは、動的ベイジアンネットワーク、例えば、プロファイル隠れマルコフモデル(プロファイルHMM)、共分散モデル(CM)を適用する。
簡潔には、バーコード位置を有する予め定義されたHMM/CM遺伝子モデル(1遺伝子=1HMM/CM)に、モデルごと、ヌクレオチドごとにアノテーションを付けた。HMM/CMエンジンは、すべてのリードをモデルに対してアラインメントし、次いで、確率ビットスコアを各アラインメントに割り当て、遺伝子ごとに最小ビットスコアでフィルタリングする。HMM/CMエンジンは、配列特徴についてヌクレオチドごとのアノテーションを割り当て、各リード内の正確なバーコード、リンカー、プライマー、及びウイルス遺伝子セグメントの同定及びアノテーションを可能にする。次いで、アラインメントエンジンは、提供されたモデル配列のそれぞれについて内部統計モデルを構築し、次いで、これらのモデルとの一致を求めて実行されたナノポアシーケンシングの全出力を検索する。それによって同定された各候補アラインメントについて、ソフトウェアは、ナノポアリード識別子、一致したHMM/CMモデル、得られたアラインメント(ギャップ、欠失、置換などを含む)、確率スコア、ビットスコア(確率スコアに関連するが、標的データベース検索サイズとは無関係である)、及び生のナノポア配列リード内のモデル一致の位置を含む他の詳細などを示すレポートを出力する。数十万~数百万のそのようなアラインメント(したがって、候補アンプリコン配列)が、通常の動作で生成される。レポートは、バーコード領域を識別し、アンプリコンバーコードとして所与のアラインメントにおける実際の塩基を抽出するスクリプトのセットと共に読み取られるので、特定の記号(例えば、出力ファイル内の「>」及び「<」文字で示される。)によるバーコード領域のアノテーションは重要である。同様のプロセスは、目的のさらなるバーコード又は他の配列特徴に対して行われる。
以下に、HMM/CM用の配列モデルのいくつかの例示的な定義を示す。
Figure 2023519919000003
Figure 2023519919000004
Figure 2023519919000005
示されている例示的なファイルは、Stockholm形式ファイルであり、SARS-CoV-2遺伝子N、E.ヒト遺伝子RNAseP、及び/又は対照として使用されるTM3の様々な領域由来の例示的な標的Nl_cdc、N2_cdc、E-Guelph、N-AMPDについての配列及びアノテーションを含む。ボックスで囲まれた領域は、例示的なアノテーションされたスペーサー又はアダプター、バーコード位置、ウイルスプライマー及び鋳型に対応する。一致したコンセンサス「SS_cons」配列内の「>」記号は、HMM/CMエンジンによって遂行され、バーコードである塩基を容易に識別し、そうでない塩基を無視できるように出力レポート内でアラインメントされる。
図5A及び図5Bは、それぞれ、SARS-CoV-2遺伝子N、E、ヒト遺伝子RNAsePの特定の領域であるE-Guelph及びRNAsePについての例示的なアラインメントレポートを示す。図5A及び図5Bの各図には、(上から下に向かって)コンセンサス(「モデル」)配列、使用される遺伝子モデル、遺伝子モデルとの一致、ナノポアシーケンサーからの実際のリードデータ(「67f21..」及び「46229...」で始まる行)、及びモデル配列(model-to-sequence)一致の様々な位置(モデル内の位置及びナノポアリード内の位置)を表す積層アラインメントがある。各アラインメントの上部にも与えられるスコアもあり、スコアビット、E値(ナノポアリードの検索データベースに対するこのアラインメント品質の一致の統計的有意性)などを表すスコアを含む。
このレポートを解析して、ナノポア動作から生じる数十万又は数百万のナノポアリードの各々についてこれらのデータの包括的な集計を生成し、次いで標識された特徴(ここでは、2つのバーコード、すなわち単一のバーコード及びその逆相補体が示されているが、他の任意の数も可能である)を抽出して、それらを中央データベースに保存した。したがって、診断リードを判定するプロセスは、合格する一致アラインメントの総数及びそれらの陽性のバーコード及びそれらの対照をカウントすることにすぎない。陰性患者は、病原体鋳型を欠くので増幅を発生させず、よってそれらのバーコードは、反応化学の調製において鋳型汚染が起こるまれな場合であっても、アンプリコン混合物中に存在しないか、又は実際の陽性と比較して非常に低いレベルで存在し得る。
上に示されたHMM/CM用配列モデルの例示的な定義において、各アンプリコン(例えば、N1_cdc、N2_cdc、E-Guelph、N-AMPD、RNAseP、TM3又はインフルエンザ若しくは他のウイルス遺伝子)のカテゴリーは、アンプリコン配列に最も高いスコアリング一致を与えるHMM又はCMモデルを選択することによって決定された。
不変のアダプター配列又はスペーサー配列が必須であるのは、それらが統計的HMMモデル又はCMモデルのスペーサー領域へのアラインメントを固定し、したがって配列中のバーコードヌクレオチドの明瞭なアノテーションを可能にするからである。配列モデル定義におけるバーコードは、それらの組成が本質的に高度に可変であるので、結局、「N」又はワイルドカード塩基として列挙される。固定スペーサーは、アライナーが一致を確信的に割り当てることができる領域を与え、次いで、アラインメントが実行される際の反復的な洗練のプロセスによって、バーコード領域が識別され、アノテーションされる。したがって、バーコードはアンプリコンにある程度「内在」するべきである。本明細書に記載のアダプター/スペーサーは約22bp長であり、これは可変数であり得る。バーコードがアンプリコン配列の5’末端又は3’末端に直接隣接していることは好ましくない。
2段階バーコード化手順が使用される場合、1つのバーコード及び不変スペーサーは、増幅プロセスにおいて使用されるプライマーによって導入される。バーコードの第2のセット(例えば、段階1のプレートからプールされた試料を追跡するために使用されるバーコード)をアンプリコンの末端にライゲーションする。結果として、不変スペーサー配列は、2つのバーコードの間に位置することになる。これにより、2つのバーコードを互いに直接隣接させることに起因し得るアンビギュイティが回避される。2段階バーコード手順が使用される場合、HMM又はCMモデルを生成するために使用される配列は、不変スペーサー配列の両側に、配列リードの統計的モデルに対するアラインメントがバーコードの両方のセットに正しくアノテーションを付けるように、アンビギュイティ配列を組み込む。代替案は、使用される第2段階バーコードのそれぞれについてHMM又はCMモデルを作成し、これらのモデルの一方の質を使用して第2段階バーコードの同一性を割り当てることである。
多重シーケンシングのプロファイルを表すための統計モデルの使用は、当業者に公知である。例えば、S.R.Eddy、「Profile Hidden Markov Models」、Bioinformatics Review,Vol.14,no 9,1998,755-763頁を参照されたい。HMMER(Janelia Farm Research Campus,Ashbum,Va.)から入手可能なユーザガイドに従って、HMMERソフトウェアパッケージを使用して核酸配列を分析した。HMMERソフトウェアプログラムの出力は、入力配列を特徴付けるプロファイルHMMである。ユーザガイドに記載されているように、プロファイルHMMは、複数の配列アラインメントの統計モデルである。それらは、アラインメントの各カラムがどの程度保存されているか、及び各位置でどの核酸残基が最も生じやすいかに関する位置特異的情報を捕捉する。HMMERソフトウェアプログラムの出力は、参照バーコード候補に対する最小レーベンシュタイン距離スコアを合格しなければならない二重バーコードを有する配列リードを含む。リードにはまた、最小ビットスコアフィルターでリードごとのアラインメントスコア(予め定義された遺伝子ごと)が割り当てられる。合格リードは、完全な標的配列アノテーション、モデルフィット、ビットスコア、バーコード位置、バーコード距離、及び他のメトリックと共に中央データベースに記憶される。ある特定の実施形態において、コンセンサス配列を決定することは、連続する位置の複数のセットの同定(例えば、異なるセットに対して異なる閾値を使用する)、及び連続する位置の複数のセットのための複数のコンセンサス配列の生成を必要とする。生成された複数のコンセンサス配列は、例えば確率に基づいてランク付けされ、クエリー配列をアラインメント及びスコア付けする前に、プロファイルHMMの確率パラメータを加法的対数オッズスコアに変換することによって確率スコア(例えば、ビットスコア)が与えられ得る(Barrett et al.,1997を参照のこと)。
本明細書で提供されるほとんどの実施形態では、アルゴリズムはコンピュータ実装方法である。それらの実施形態では、アルゴリズム及び/又は結果(例えば、生成されたコンセンサスバーコード化アンプリコン配列)は、コンピュータ可読媒体に記憶され、かつ/又はスクリーン又は紙の印刷物に表示される。完全な配列情報は、アンプリコンの合格及び不合格のためにPostgreSQL AWSデータベースに記憶された。
バーコード一致(内側の患者ごとのバーコード及び外側のプレートごとのバーコード)を記憶させて、リードを元のPCR反応に割り当てた。HMM/CMスコア、モデルフィット、及び生のFASTAファイル内の位置を保存した。配列及びアラインメント/一致表で、LIMS情報(プレート、バッチなど)の相互参照が可能になる。特定の態様では、結果をさらに分析して、個人に診断若しくは予後を提供するか、又は医療専門家に疾患の治療に有用な情報を提供する。
IV.標的核酸を同定するための方法
一態様では、本開示は、少なくとも1つの標的核酸を同定する方法を提供する。方法は、複数の対象から複数の生物学的試料を得る工程、生物学的試料の各々から全核酸を得る工程、複数のアンプリコンを産生するために増幅混合物を使用して複数のポリヌクレオチドを増幅に供する工程、複数のアンプリコンの各々を検出する工程、及び複数のアンプリコンのカテゴリーを決定する工程を含む。
いくつかの実施形態では、複数の対象からの生物学的試料はポリヌクレオチドを含み、すなわち、核酸(例えば、DNA又はRNA)は対象から得られ、本明細書に記載の方法を使用して処理(溶解、増幅、及び/又は精製)され、核酸はシーケンシングされる。核酸は、当技術分野で公知の方法によって得ることができる。一般に、核酸は様々な技術、例えば、内容が参照によりその全体が本明細書に組み込まれるmanitis et al,molecular cloning:a guide to the Laboratory(Molecular Cloning:A Laboratory Manual),Cold Spring Harbor,N.Y.,N.280-281,(1982)に記載されるものによって生物学的試料から抽出することができる。
いくつかの実施形態では、複数の対象からの生物学的試料はDNAのみを含む。他の実施形態では、複数の対象からの生物学的試料はRNAのみを含む。方法の多くの実施形態では、複数の対象からの生物学的試料は、DNAとRNAとの混合物を含む。複数の対象からの生物学的試料が対象試料(例えば、血液試料)から収集されたRNA、例えばmRNAを含む実施形態では、RNAから逆転写されたcDNAを得るか、又はRNAからcDNAを逆転写するさらなる処理工程が必要である。DNA/RNA抽出のための一般的な方法は当技術分野で周知であり、Osebia(Ausubel)et al、Current Protocols of Molecular Biology、John Wiley and Sons(1997)を含む、分子生物学の標準的な教科書に開示されている。パラフィン包埋された組織からRNAを抽出するための方法は、例えば、Rupp(Rupp)and Rocker(Locker),laboratory investments(LabInvest.)56:A67(1987)、及びDeanderley(De Andres)et al,BioTechniques 18:42044(1995)に開示されている。これらの参考文献のそれぞれの内容は、その全体が参照により本明細書に組み込まれる。特に、RNA単離は、Qiagenなどの商業的製造業者からの精製キット、緩衝液セット及びプロテアーゼを製造業者の説明書に従って使用して実施することができる。例えば、QiagenのRNeasyミニカラムを使用して、培養中の細胞からすべてのRNAを単離することができる。他の市販のRNA単離キットとしては、MASTERPURE Complete DNA及びRNA精製キット(MASTERPURE Complete DNA and RNA purification Kit)(EPICENTRE,Madison,Wis.)及びパラフィンブロックRNA単離キット(Paraffin Block RNA Isolation Kit)(Ambion,Inc.))が挙げられる。全RNAを、RNA Stat-60(Tel-Test)を使用して組織試料から単離することができる。腫瘍から調製されたRNAは、例えば塩化セシウム密度勾配遠心分離によって単離することができる。RNAから逆転写されたcDNAを得るため、又はRNAからcDNAを逆転写するための方法及びキットは当技術分野で周知であり、例えば米国特許出願第5641864A号に開示されており、その内容はその全体が本明細書に組み込まれる。
一実施形態では、方法は、生物学的試料の各々から全RNAを得ること、生物学的試料の各々から全RNAを逆転写して複数のcDNAを得ること;フォワードプライマー及びリバースプライマーの固有のセットを使用してcDNAを増幅することを含み、ここでプライマーは、複数のcDNAの各々に相補的なヌクレオチドのセットを含む。別の実施形態では、方法は、生物学的試料の各々から全DNAを得ること;フォワードプライマー及びリバースプライマーの固有のセットを使用してDNAを増幅することを含み、ここでプライマーは、複数のDNAの各々に相補的なヌクレオチドのセットを含む。いくつかの実施形態では、超ハイスループットPCR自動装置を使用して、核酸試料(例えば、DNA及びcDNA)を増幅して複数のアンプリコンを産生する。
方法の一実施形態では、複数のポリヌクレオチドを増幅混合物を用いてPCR増幅に供して、複数のアンプリコンを産生する。方法の一実施形態では、増幅混合物は、複数のプライマー、フォワードプライマー及びリバースプライマーを含む。プライマーは、それらが結合するポリヌクレオチドの各々に相補的なヌクレオチドのセットを含む。一実施形態では、本明細書に記載の方法は、フォワードプライマー及びリバースプライマーの固有のセットを含む増幅混合物を使用したcDNAの増幅を提供する。プライマーは、複数のcDNAの各々に相補的なヌクレオチドのセットと、少なくとも1つの固有のヌクレオチドバーコード配列とを含む。プライマー配列は、11~35ヌクレオチド長、例えば15~25ヌクレオチド長であり得る。本明細書中に記載される方法において使用するための例示的なプライマー配列を、配列番号3~20に提供する。
いくつかの実施形態では、単一のプライマーを使用して、試料中のすべてのRNA分子を増幅することができる。例えば、プライマーは、ポリ(dT)又はランダムな配列で構成されるRNA補体部分、部分的にランダムな配列、及び/又は2種類以上のヌクレオチドと塩基対を形成することができるヌクレオチドを含むことができる。cDNAプライマーのRNA補体は、任意のRNA配列をそれが相補的であるもの、例えばすべてのmRNA(ポリ(dT)が使用される場合)又は一般的なすべてのRNA分子(一般的な配列が使用される場合)にハイブリダイズする。このようにして、試料中のすべてのRNA分子を逆転写することができる。他の実施形態では、プライマーは、例えば、ランダムな配列で構成されるcDNA補体部分、部分的にランダムな配列、及び/又は2種類以上のヌクレオチドと塩基対を形成することができるヌクレオチドを含むことができる。
いくつかの実施形態では、単一のローリングサークル増幅プライマーを使用して、試料中のすべてのRNA分子を増幅することができる。例えば、ローリングサークルプライマーは、cDNA分子中の多くの配列に対して相補的にする、ランダム配列を有することができる。他の実施形態では、一対のローリングサークル増幅プライマーは、cDNA鋳型中の配列に相補的な相補部分を有することができ、したがってこれらの2つのオリゴヌクレオチドのみによる指数関数的ローリングサークル増幅が可能になる。
いくつかの実施形態では、複数の環状化cDNA分子が鋳型になることができ、次いでローリングサークル増幅によって増幅され得る。ローリングサークル増幅は、それぞれが少なくとも1つの環状化cDNA鋳型に相補的であるプライマーセットによってプライミングすることができる。いくつかの例では、プライマーの相補的部分はcDNA配列に相補的であり得る。そのような場合、ローリングサークル増幅プライマーは、1つ又は少数のcDNA鋳型に特異的であり得る。ローリングサークル増幅プライマーは、ランダムな配列を有することができる。
一実施形態では、方法は、複数のアンプリコンを得るための標的核酸鋳型のPCR増幅を含む。本明細書に記載の方法では、標的核酸鋳型は標的増幅領域とも呼ばれる。方法は、標的cDNA鋳型を増幅して複数のアンプリコンを得ることを含む。いくつかの実施形態では、方法は、伸長されていないフォワードプライマー及びリバースプライマー(すなわち、「未使用」プライマー)の固有のセットを複数のアンプリコンから分離することをさらに含む。増幅/伸長される標的核酸を含有する核酸試料は、目的の核酸を含有する任意の試料から当業者に公知の方法によって調製され得る。加えて、QIAamp DNA mini kit、QIAamp FFPE Tissue kit、及びPAXgene DNA kitを含む、多くの核酸調製用キットが市販されており、使用することができる。例示的な試料には、ヒト由来の試料、例えば、血液、スワブ、体液、又は上記の試料から得られた材料及び画分、又は任意の細胞が含まれるがこれらに限定されない。いくつかの実施形態では、試料は、血液、粘液、唾液、汗、涙、体腔に蓄積する流体、尿、***液、膣分泌物、脳脊髄液、リンパ液、糞便、痰、分解液、嘔吐物、汗、母乳、血清及び血漿からなる群から選択される。特定の実施形態では、試料は唾液である。
標的核酸は、感染、疾患若しくは障害を伴うこと及び/又はそれらを示すことが知られているものである。本明細書に記載の標的核酸又は標的増幅領域は、これらに限定されないが、RNAウイルス、DNAウイルス、真菌及び細菌を含む1つ以上の病原体を含む試料から得ることができる。感染、疾患又は障害には、これらに限定されないが、様々なウイルス感染、細菌感染及び他の病原体によって引き起こされる疾患が含まれ得、標的核酸は、RNAウイルス、DNAウイルス、真菌及び細菌からなる群から選択される1つ以上の病原体を含む試料から得られる。
本明細書中に記載される方法のいくつかの実施形態において、標的核酸は、アシネトバクター・バウマンニ(Acinetobacter baumannii)、アデノウイルス、アフリカ馬疫ウイルス、アフリカ豚コレラウイルス、ズビニ鉤虫(Anclostoma duodenale)、回虫、黄色アスペルギルス、アスペルギルス・フミガーツス(Aspergillus fumigatus)、アスペルギルス・ニガー(Aspergillus niger)、アスペルギルス・オリゼ(Aspergillus oryzae)、鳥インフルエンザウイルス、炭疽菌、炭疽菌パスツール株、Bacillus cereus Biovar anthracis、ウシ流産菌、ブルセラ・メリテンシス(Brucella melitensis)、ブルセラ・スイス(Brucella suis)、鼻疽菌、類鼻疽菌、カンジダ・アルビカンス(Candida albicans)、カンジダ・ドゥブリニエンシス(Candida dubliniensis)、カンジダ・グラブラタ(Candida glabrata)、カンジダ・クルセイ(Candida krusei)、カンジダ・トロピカリス(Candida tropicalis)、クラミジア・ニューモニエ(Chlamydia pneumoneae)、クラミジア・トラコマチス(Chlamydia trachomatous)、豚熱ウイルス、クロストリジウム・ディフィシール(Clostridium difficile)、コクシジオイデス・イミティス(Coccidioides immitis)、コクシジオイデス・ポサダシ(Coccidioides posadasii)、CoV-229E、CoV-HKU1、CoV-NL63、CoV-OC43、コクサッキーウイルスA、コクサッキーウイルスB、コクシエラ・バーネッティ(Coxiella burnetii)、クリミア・コンゴ出血熱、サイトメガロウイルス、デングウイルス、メジナ虫、東部馬脳炎、エボラウイルス、い粒条虫、多包条虫、エンテロバクター・クロアカ、エンテロコッカス・フェシウム(Enterococcus faecium)、エンテロウイルス、エプスタイン・バール・ウイルス、大腸菌、巨大肝蛭、肝蛭、***ウイルス、野兎病菌、山羊痘ウイルス、ヘモフィルス属インフルエンザ、ヘリコバクターピロリ、ヘンドラウイルス、A型肝炎ウイルス、B型肝炎ウイルス、C型肝炎ウイルス、ヒストプラスマ・カプスラーツム(Histoplasma capsulatum)、ズボアジ型ヒストプラスマ症(Histoplasma duboisii)、ヒトヘルペスウイルスHHV6、ヒトヘルペスウイルスHHV7、ヒトヘルペスウイルスHHV8、ヒトヘルペスウイルスHSV1、ヒトヘルペスウイルスHSV2、ヒト免疫不全ウイルス、ヒトパピローマウイルス、インフルエンザウイルスA型、インフルエンザウイルスB型、クレブシェラ肺炎桿菌、キャサヌール森林病ウイルス、ラッサ熱ウイルス、レジオネラ・ニューモフィラ菌、リーシュマニア・プロマスティゴート(Leishmania promastigotes)、Lujoウイルス、ランピースキン病ウイルス、マールブルグウイルス、麻疹ウイルス、メチシリン耐性黄色ブドウ球菌、サル痘ウイルス、ムンプスウイルス、マイコバクテリウム・アブセッサス(Mycobacterium abscessus)、マイコバクテリウム・アビウム(Mycobacterium avium)、マイコバクテリウム・ボビス(Mycobacterium bovis)、マイコバクテリウム・カヌッティイ(Mycobacterium canettii)、マイコバクテリウム・レプレ(Mycobacterium leprae)、ヒト結核菌、マイコバクテリウム・ウルセランス(Mycobacterium ulcerans)、マイコプラズマ・カプリコルム(Mycoplasma capricolum)、マイコプラズマ・ミコイデス(Mycoplasma mycoides)、マイコプラズマ・ニューモニア(Mycoplasma pneumoneae)、アメリカ十二指腸虫、淋病、ニューカッスル病ウイルス、ニパウイルス、ノルカジア属beijingensis、ノルカジア属cyriacigeorgica、ノルカジア属farcinica、ノロウイルスGI、ノロウイルスGII、ノーウォークウイルス、オムスク出血熱ウイルス、回旋糸状虫、発癌性ヒトパピローマウイルス、パラインフルエンザウイルス、寄生生物、マルネッフェイ型ペニシリウム症(Penicilliosis mameffei)、小反芻獣疫ウイルス、ニューモシスチス・イロベチイ(Pneumocystis jirovecii)、ポリオーマウイルス、プロテウス・ミラビリス(Proteus mirabilis)、緑膿菌、狂犬病ウイルス、8つの遺伝子断片すべてのコーディング領域の任意の部分を含有する、1918年のパンデミックインフルエンザウイルスの再構築された複製コンピテント形態、呼吸器合胞体ウイルス、ライノウイルス、発疹チフスリケッチア、リフトバレー熱ウイルス、牛疫ウイルス、ロタウイルスA、ロタウイルスB、ロタウイルスC、ロタウイルスG2、風疹ウイルス、SARS関連コロナウイルス(SARS-CoV)、SARS-CoV-1、SARS-CoV-2、ビルハルツ住血吸虫、日本住血吸虫、マンソン住血吸虫、羊痘ウイルス、南米出血熱ウイルスチャパレ、南米出血熱ウイルスグアナリト、南米出血熱ウイルスフニン、南米出血熱ウイルスマチュポ、南米出血熱ウイルスサビア、黄色ブドウ球菌、スタフィロコッカス・サプロフィティカス(Staphylococcus saprophyticus)、肺炎レンサ球菌、豚水疱病ウイルス、有鉤条虫、ダニ媒介性脳炎複合(flavi)ウイルス極東亜型、ダニ媒介性脳炎複合(flavi)ウイルスシベリア亜型、タバコモザイク病ウイルス、トルクテノウイルス、鞭虫、ブルーストリパノソーマ(Trypanosoma brucei)、トリパノソーマ・クルージ(Trypanosoma cruzi)、大痘瘡ウイルス(天然痘ウイルス)、小痘瘡ウイルス(アラストリム)、ベネズエラ馬脳炎ウイルス、バンクロフト糸状虫、ペスト菌、及び上記の病原体のいずれか1つと特徴的な核酸配列を共有する病原体、又は前述の群の病原体と特徴的な核酸配列を共有する、別の潜在的に新規若しくは特性決定されていない病原体からなる非限定的な群から選択される1つ以上の病原体を含む試料から得られる。一実施形態では、標的核酸は、SARS-CoV-2を含む唾液試料から得られる。
方法の多くの実施形態では、少なくとも1つの固有のバーコード配列及びその逆相補体がそれぞれフォワードプライマー及びリバースプライマーのそれぞれに導入され、増幅後に各アンプリコンを固有に同定する。フォワード及び/又はリバースプライマーは、バーコード配列と呼ばれる固有のヌクレオチド配列を含む。この配列は、特定の標的核酸を独自に同定する。バーコード配列の長さは、3~20ヌクレオチド長、例えば5~15ヌクレオチド長であり得る。本明細書に記載の方法で使用するための非限定的な例示的バーコード配列を表1に提供する。本明細書に記載されるように、表1の例示的配列は、最大レーベンシュタイン距離で分離された3000+総バーコード内から選択される。いくつかの実施形態において、最大レーベンシュタイン距離で分離されたバーコード配列の384個が選択される。バーコード配列の選択はアルゴリズム的に行われ、選択サイズに応じて異なる結果をもたらす。本明細書で提供される方法及び組成物の実施形態において、選択されるバーコード配列の数は、プライマーが構築されるバーコードプールのサイズに基づく。
いくつかの実施形態では、バーコード配列は完全にランダムであってもよく、すなわち、A、T、G、及びCのいずれか1つがバーコード配列の任意の位置にあってもよい。ランダムバーコードは合成するのに経済的である。他の実施形態では、バーコード配列は、合成的に個別に合成され(例えば、Twist Bio)、それにより、異なるバーコードオリゴが確実にそれぞれ独立して合成される。本明細書中に記載される実施形態において、バーコードは、フォワードプライマー配列及びリバースプライマー配列の一部である。例示的なバーコード化プライマー配列を配列番号1及び2に提供する。例えば、バーコード化一致フォワード及びリバースプライマーのセットは、プライミングされたウイルス配列の5’末端及び3’末端の両方に同じ(又はフォワード/リバース補完された)バーコードを有するバーコード化アンプリコンを生成する。ウイルス配列は、プライマー自体を含む。特定の実施形態では、バーコード配列は、準定義されているか、又は完全に定義されている。
そのような配列を使用することにより、バーコードエラーを軽減することができる。しかしながら、そうすること、特に高度なマルチプレックスPCRにおいて多くの異なるプライマーのために完全に定義されたバーコード配列を使用することは、場合によっては法外に高い費用がかかることがある。
方法のいくつかの実施形態では、第1の固有のバーコード及びその逆相補体並びに本明細書では内側バーコードとも呼ばれるアダプター配列の第1の対は、増幅プロセスで使用されるプライマー(本明細書ではバーコード化プライマーとも呼ばれる)によって導入される。方法のいくつかの実施形態では、第2の固有のバーコード配列及びその逆相補体は、本明細書では外側バーコードとも呼ばれ(例えば、プレート/バッチ識別子)、典型的にはライゲーション反応を用いて、バーコード化アンプリコンに付加される。ライゲーションされた外側バーコードは、第2のPCR段階に基づく増幅に固有の交差増幅を回避する。ライゲーション(DNAリガーゼ酵素を使用)工程は、第1のバーコード化アンプリコンの両端に、「外側」バーコードを含有するDNA断片の第2のセットを付加する。ライゲーションにより、バーコードのコンビナトリアルアセンブリが可能になり、大規模マルチプレックス(例えば、384の内側バーコード×384の外側バーコード=147456の固有の二重バーコード化アンプリコン)が可能になる。内側バーコードは、いくつかの事例では、少なくとも96ウェルを有するプレート内の複数の別個の試料からの特定の試料にアノテーションを付けるための、患者又はウェル固有のバーコードである。外側バーコードは、特定のバッチを示すことができ、又はプレートの複数のバッチを有する別個のプレートに複数の別個の試料がある場合、プレート識別子とすることができる。バーコード配列及びプライマーは、二次構造相互作用についてスクリーニングされた非常に大きな検証済みIDTバーコードライブラリーから選択され、高度に最適化されたエラー耐性バーコード設計をもたらす。
バーコード化プライマーの伸長は、核酸試料中のすべてのプライマー及び標的核酸を反応緩衝液中のDNAポリメラーゼと組み合わせることによって実施され得る。好ましくは、バーコード化プライマーによる標的核酸へのアニーリング及び/又はバーコード化プライマーの伸長を、高温、例えば50℃~75℃、例えば55℃、60℃、65℃、70℃又は72℃で行って、標的核酸とバーコード化プライマーとの間のアニーリング特異性を高める。核酸試料中の標的核酸は、典型的には、バーコード化プライマーでアニーリングする前に、例えば高温(例えば、95℃又は98℃)でインキュベートすることによって最初に変性される。標的核酸の変性、プライマーアニーリング及びプライマー伸長は、サーマルサイクラーで行われ得る。
ホットスタートDNAポリメラーゼが使用される特定の実施形態では、DNAポリメラーゼ活性化は、サーマルサイクラーでの標的核酸変性と同時に行うこともできる。好ましくは、バーコード化プライマー伸長に使用されるDNAポリメラーゼは熱安定性である。例示的なDNAポリメラーゼとしては、Taqポリメラーゼ(Thermus aquaticus製)、Tfiポリメラーゼ(Thermus filiformis製)、Bstポリメラーゼ(Bacillus stearothermophilus製)、Pfuポリメラーゼ(Pyrococcus furiosus製)、Tthポリメラーゼ(Thermus thermophilus製)、Powポリメラーゼ(Pyrococcus woesei製)、Tliポリメラーゼ(Thermococcus litoralis製)、Ultimaポリメラーゼ(Thermotoga maritima製)、KODポリメラーゼ(KOD ホットスタートポリメラーゼ(EMD Biosciences製)、Deep Vent(商標)DNAポリメラーゼ(New England Biolabs製)、Platinum(商標)Taq DNA Polymerase High Fidelity(Invitrogen製)が挙げられる。
方法のいくつかの実施形態では、フォワードプライマー及びリバースプライマーは、アダプター配列の1つ以上の対を含む。他の実施形態では、アダプター配列は、プライミングされた標的増幅領域配列の5’末端及び3’末端の両方にあるバーコード配列にライゲーションされる。本明細書中に記載される実施形態の多くにおいて、アダプター配列はスペーサー配列の機能を提供する。いくつかの例において、アダプター配列は配列読み取り中にマーカーとして作用して、バーコード配列の末端及び/又は次のバーコード配列の開始をシグナル伝達する。本明細書に記載されるいくつかの実施形態では、アダプター配列はユニバーサル配列を含み得る。特定の実施形態において、アダプター配列は保存された配列である。方法のいくつかの実施形態において、アダプター配列は少なくとも10ヌクレオチドを含む。方法のいくつかの他の実施形態において、アダプター配列は10~15ヌクレオチドを含む。方法の一実施形態において、アダプター配列は10ヌクレオチドを含む。非限定的な例示的アダプター配列は、配列番号21及び22に提供されている。本明細書に記載される方法のいくつかの実施形態では、第1の固有のバーコード配列及びその逆相補体を用いた単一段階バーコード化が使用される。そのような実施形態では、第1の固有のバーコード及びその逆相補体並びにアダプター配列の第1の対は、増幅プロセスで使用されるプライマーによって導入される。本明細書に記載される方法の他の実施形態では、第1の固有のバーコード配列及びその逆相補体、並びに第2の固有のバーコード配列及びその逆相補体を用いる2段階バーコード化が使用される。そのような実施形態では、1つのバーコード(例えば、第1の固有のバーコード配列)及びアダプター配列(例えば、アダプター配列の第1の対)は、増幅プロセスで使用されるプライマーによって導入される。バーコードの第2のセット(例えば、段階1のプレートからプールされた試料を追跡するために使用されるバーコード、第2の固有のバーコード配列)をアンプリコンの末端にライゲーションする。結果として、不変アダプター配列は、2つのバーコードの間に位置することになる。他のアダプター配列を生成し、本開示の範囲内に含めることができる。
プライマーのユニバーサルプライマー配列は、さらなる増幅に使用され得る配列である。いくつか様々な増幅戦略が当業者に知られている。すべての増幅技術は開始についてプライマーに依存しており、このプライマーはバーコードを組み込むように操作することができる。好ましくは、この配列は、核酸試料中の目的の標的核酸又は他の核酸と有意な相同性を有さない(すなわち、その全長にわたって50%未満の配列同一性を有する)。上述のように、複数のプライマーを使用して、異なる標的核酸に異なるバーコードを割り当てる。いくつかの実施形態では、標的核酸は単一の病原体に由来するが、他の実施形態では、標的核酸は少なくとも2つの異なる病原体に由来する。複数のプライマーのうち、ユニバーサルプライマー配列は同一であり得るが、プライマーの標的特異的配列(すなわち、標的ヌクレオチド配列に相補的な配列)は異なる。異なるプライマーの配列における同じユニバーサル配列は、単一のプライマーを使用したアンプリコンのその後の増幅を可能にする。
本明細書中に記載される方法のいくつかの実施形態において、5’アダプター領域配列及び/又は試料識別領域(例えば、固有のバーコードヌクレオチド配列)が、例えば、逆転写中に、単一の試料に由来するすべてのcDNAに付加される。いくつかの態様では、3’特異的プライマーを使用して、単一試料中の任意のポリヌクレオチドを増幅することができる。いくつかの態様では、5’可変領域、例えばウイルス粒子からの一本鎖RNAを有するポリヌクレオチドが増幅され、複数の縮重した5’プライマーが目的の特定の領域を増幅する必要はない。プライマーはまた、IgG、IgM、IgD、IgA、IgE、TCR鎖、及び他の目的の遺伝子に特異的であり得る。
いくつかの実施形態では、アダプター領域は、2、3、4、5、6、7、8、9、10又はそれ以上のGを含む。いくつかの態様では、cDNAは、その3’末端に1、2、3、4、5、6、7、8、9、10又はそれ以上のCを含む。いくつかの実施形態において、アダプター領域は、cDNAの5’末端に結合する。他の実施形態において、アダプター領域は、cDNAの3’末端に結合する。さらに別の実施形態において、アダプター領域は、cDNAの5’及び3’末端に結合する。アダプター領域を結合する方法は、これらに限定されないが、5’隣接アダプター領域配列を有するプライマーを用いたPCRの実施、粘着性及び平滑末端のライゲーション、ヌクレオチドの鋳型スイッチング介在付加、又はポリヌクレオチドを、ヌクレオチドの5’末端、3’末端若しくは5’末端及び3’末端に共有結合的に付着させる他の方法を含む、種々の方法が存在する。これらの方法は、分子生物学で一般的に使用される酵素の特性を利用することができる。PCRは、例えば、好熱性DNAポリメラーゼを使用することができる。相補的又は実質的に相補的な粘着性末端は、オーバーハングした末端を残す制限酵素でのdsDNA切断によって、又はTdT(末端トランスフェラーゼ)などの酵素の3’テーリング活性によって生成される。次いで、T4リガーゼなどのリガーゼを使用して、粘着性末端及び平滑末端を相補的アダプター領域とライゲーションすることができる。アダプターを平滑末端核酸にライゲーションする方法は当技術分野で公知であり、本明細書で提供されるPCRの増幅産物からシーケンシングライブラリーを生成する際に使用され得る。例示的な方法には、Sambrook J and Russell DW,editors.(2001)Molecular Cloning:A Laboratory Manual.3rd ed.Cold Spring Harbor,NY:Cold Spring Harbor Laboratory,QIAGEN GENEREAD(商標)Library Prep(L)Handbook、及び米国特許出願公開第2010/0197509号、201 3/0005613号に記載されるものが含まれる。一実施形態では、本明細書に記載の方法は、場合により、複数の増幅プライマーを使用したcDNAの増幅を提供する。
本明細書中に記載される方法の一実施形態において、固有のバーコード化プライマーの数は、少なくとも50、少なくとも100、少なくとも300、少なくとも500、少なくとも750又は少なくとも1000である。単一の反応におけるそのような固有のバーコード化プライマーを使用すると、比較的多数の標的核酸の分析、例えば複数の試料からのポリヌクレオチドの並行シーケンシング分析が可能になる。個々の標的核酸又はアンプリコンについて、バーコード化プライマーがDNAのプラススタンド又はマイナススタンドにアニーリングするかどうかをランダムに選択することができる。例えば、同じ個体からの異なるウイルス標的を多重化する場合、多重化は2程度と少なくても、又は1000程度と多くてもよい。
一実施形態では、本明細書に記載の方法は、場合によりアンプリコンから未使用のプライマー(すなわち、伸長されていないバーコード化プライマー)を分離する工程を含む。未使用のプライマーの除去は、「バーコードリサンプリング」問題、すなわち同じDNA鋳型が複数の分子バーコードに関連するリスクを最小限に抑える。そのような問題は、分子バーコード化の利益を無効にするであろう。未使用のプライマーの分離は、サイズ選択精製によって行うことができる。アンプリコンは、ビーズ又はシリカカラムベースのサイズ選択システム、例えばAgencourt AMPure XPシステム及びGeneRead Size Selectionシステムを使用して非伸長プライマーから精製され得る。必要に応じて、そのようなシステムによる2回以上の精製を使用することができる。あるいは、エキソヌクレアーゼ酵素(例えば、ThermoFisher製ExoSAP-IT(商標))による一本鎖DNAクリーンアップ工程を本明細書に記載の方法に組み込むことができる。「バーコードリサンプリング」の問題を回避する1つのさらなる方法は、2つのPCR工程は実施しないが、1つのPCR工程を実施して第1のプライマーを作製し、次いで第2の外側バーコードをライゲーションすることである(増幅なし)。1つの実施形態において、本明細書中に記載される方法は、アンプリコンのさらなる増幅をさらに含み得る。さらなる増幅は、上記のユニバーサルプライマーの対の存在下で行うことができる。
本明細書に記載の方法は、複数のアンプリコンのそれぞれについての検出工程を含む。多くの実施形態において、検出は、アンプリコンのそれぞれにおける固有のバーコードの配列を読み取ることによって行われる。方法のいくつかの実施形態では、少なくとも1つの陽性対照試料をシーケンシングし、ここで陽性対照試料は標的核酸を含む。本明細書に記載される方法の実施形態では、ハイスループットシーケンシングを使用して、アンプリコン中の固有のバーコードを検出する。当技術分野で公知の任意のハイスループットシーケンシングプラットフォームを使用して、本明細書に記載のように調製されたシーケンシングライブラリーをシーケンシングすることができる(Myllykangas et al.,Bioinformatics for・High Throughput Sequencing,Rodriguez-Ezpeleta et al.(eds.),Springer Science+Business Media,LLC,2012,11-25頁を参照)。例示的なハイスループットDNAシーケンシングシステムは、オックスフォードナノポアプラットフォーム(MinlON及びPromethlON機器を含む)、454 Life Sciencesによって最初に開発され、後にRoche(Basel,Switzerland)によって取得されたGS FLXシーケンシングシステム、Solexaによって開発され、後にlllumina Inc.(San Diego,CA)によって取得されたGenome Analyzer(Bentley,Curr Opin Genet Dev 16:545-52,2006;Bentley et al.,Nature 456:53-59,2008を参照)、Life Technologies(Foster City,CA)によるSOLiD配列システム(Smith et al.,Nucleic Acid Res 38:e 142,2010;Valouev et al.,Genome Res 18:1051-63,2008を参照)、Complete Genomicsによって開発され、BGIによって取得されたCGA(Drmanac et al.,Science 327:78-81,2010を参照)、Pacific Biosciences(Menlo Park,CA)によって開発されたPacBio RSシーケンシング技術(Eid et al.,Science 323:133-8,2009を参照)、及びLife Technologies Corporationによって開発されたIon Torrent(米国特許出願公開第2009/0026082号;2010/01 37143号;及び2010/0282617号を参照)を含むが、これらに限定されない。本明細書に記載の方法で使用されるオックスフォードナノポアDNAシーケンシングシステムは、通常に長さが250bp超えるアンプリコンを迅速かつ正確に読み取るのにより適している。Illuminaシーケンシングシステムは、比較的短いリードをもたらす、長い処理時間及び合成によるシーケンシングのため、オックスフォードナノポアDNAシーケンシングシステムと比較して本明細書に記載の方法に適していない可能性がある。
方法のいくつかの実施形態において、検出することは、アダプター配列の対並びに第1の固有のバーコード配列及びその逆相補体を含む複数のアンプリコンの各々をシーケンシングすることを含む。方法の他の実施形態において、検出することは、アダプター配列の対、第1の固有のバーコード配列及びその逆相補体、並びに第2の固有のバーコード配列及びその逆相補体を含む複数のアンプリコンの各々をシーケンシングすることを含む。多くの実施形態において、検出することは、ソフトウェアプログラムでシーケンシングデータファイルを読み取ることによって行われる。シーケンシングデータファイルは、FASTA/FASTQフォーマットであるか、又はStockholmフォーマットである。
いくつかの実施形態では、方法は、1つの標的核酸を同定する。いくつかの実施形態では、方法は、同じ病原体から2つ以上の標的核酸を同定する。いくつかの実施形態では、方法は、同じタイプの2つの異なる病原体(例えば、ウイルス性病原体)から2つ以上の標的核酸を同定する。いくつかの実施形態では、方法は、異なるタイプの2つの異なる病原体(例えば、ウイルス性及び細菌性病原体)から2つ以上の標的核酸を同定する。多くの実施形態では、方法は、複数のアンプリコンのカテゴリーを決定する工程を含む。本明細書中に記載される方法における重要な工程は、アンプリコンインサートの配列分析である。方法の多くの実施形態では、所与の試料について、同一のバーコードが陽性対照について、及び試験されている複数の目的の標的核酸のそれぞれについて使用される。アンプリコンがカウントされる場合、アンプリコンをどのように分類及びカウントするかを決定するのはインサートの配列(例えば、標的増幅領域)である。例えば、標的増幅領域配列がアンプリコンに存在する場合、アンプリコンはヒットとして分類され、カウントされる。標的増幅領域配列がアンプリコンに存在しない場合、それは対照として分類及びカウントされ得る。したがって、インサートの配列(例えば、標的増幅領域)は、病原性決定因子の配列変異体を認識し、新規変異体を、それらの存在に関する事前の知識を有することなく発見する手段でもある。本明細書に記載される方法の多くの実施形態では、標的増幅領域由来のポリヌクレオチドを含む複数のアンプリコンのそれぞれのカテゴリーを決定することは、対応する対象が標的核酸を有することを示す。
いくつかの実施形態では、本明細書に記載の方法は、少なくとも96ウェル、少なくとも384ウェル、少なくとも1536ウェル、又はそれ以上のウェルを有するプレート内の複数の別個の試料に適用される。さらなる態様では、本明細書に記載の方法は、それぞれ少なくとも96ウェルを有する少なくとも1、2、3、4、5、6、7、8、10、15、20、30、384又はそれ以上のプレート中の別個の試料に適用される。他の態様では、本明細書に記載の方法は、それぞれ少なくとも384ウェルを有する少なくとも1、2、3、4、5、6、7、8、10、15、20、30、384又はそれ以上のプレート中の別個の試料に適用される。
V.核酸試料中の配列変異体を検出する方法
本明細書に記載の方法は、核酸試料中の1つ以上の配列変異体を検出することができる。配列変異体は、参照配列(例えば、健康なヒト由来の核酸試料、又はSARS-Cov-2感染を有することが疑われる患者由来の核酸試料も)に対する任意の変異であり得る。配列変異は、単一のヌクレオチド又は複数のヌクレオチド(例えば、2、3、4、5、6、7、8、9、10又はそれ以上のヌクレオチド)の突然変異、挿入又は欠失からなり得る。配列変異体が2つ以上のヌクレオチドの相違を含む場合、相違するヌクレオチドは互いに連続していても不連続であってもよい。配列変異体の型の非限定的な例としては、ゲノムに生じるランダム変異、一塩基多型(SNP)、欠失/挿入多型(DIP)、レトロトランスポゾンに基づく挿入多型、及び配列特異的増幅多型が挙げられる。本明細書で使用される方法は、任意の配列変異体を検出することができる。例えば、ポリヌクレオチド配列中の点変異を検出するための開示は、インデル又は欠失の検出にも適用可能であり得る。
本明細書で提供される方法を使用して、生物学的試料から得られた核酸試料から配列変異体を検出する。いくつかの実施形態では、得られた情報を使用して、対象から得られた核酸試料中に存在する突然変異を同定することができる。
試料由来のポリヌクレオチドは、これらに限定されないが、DNA、RNA、リボソームRNA(rRNA)、転移RNA(tRNA)、マイクロRNA(miRNA)、メッセンジャーRNA(mRNA)、これらのいずれかの断片、又はこれらのいずれか2つ以上の組み合わせを含む、様々なポリヌクレオチドのいずれかであり得る。いくつかの実施形態では、試料はDNAを含む。いくつかの実施形態では、試料はゲノムDNAを含む。いくつかの実施形態では、試料は、プラスミドDNA、細菌人工染色体、オリゴヌクレオチドタグ、又はそれらの組み合わせを含む。いくつかの実施形態では、試料は、増幅、例えば、これらに限定されないが、ポリメラーゼ連鎖反応(PCR)、逆転写、及びそれらの組み合わせを含む、プライマーとDNAポリメラーゼとの任意の適切な組み合わせを使用したプライマー伸長反応によって生成されたDNAを含む。いくつかの実施形態では、試料はRNAを含む。いくつかの実施形態では、試料はRNA、例えば、対象試料(例えば、血液試料)から収集されたmRNAを含むことができる。RNA抽出のための一般的な方法は、当技術分野で周知である。特に、RNA単離は、Qiagenなどの商業的製造業者からの精製キット、緩衝液セット及びプロテアーゼを製造業者の説明書に従って使用して実施することができる。プライマー伸長反応用の鋳型がRNAである場合、逆転写の産物は相補的DNA(cDNA)と呼ばれる。いくつかの実施形態では、試料はDNA及びRNAの混合物を含む。DNAとRNAとの混合物を含む試料の場合(例えば、同時感染では)、逆転写酵素(RT)はDNA分子に付加され、DNA分子に対して不活性であり、RNA分子に逆転写する。いくつかの実施形態では、試料、すなわち、核酸(例えば、DNA又はRNA)は対象から得られ、本明細書に記載の方法を使用して処理(溶解、増幅、及び/又は精製)され、核酸はシーケンシングされる。
本開示の一態様は、核酸試料中の配列変異体を検出する方法に関する。第1の工程は、増幅混合物を用いて核酸の試料と増幅反応を行い、複数のアンプリコンを産生することを含む。核酸の試料は、感染の決定因子である標的核酸を有すると疑われる複数の対象から得られた複数のポリヌクレオチドを含む。本明細書に記載される多くの実施形態では、標的核酸は、本明細書では標的増幅領域と呼ばれる病原体のゲノム領域内に含まれる。本明細書に記載される実施形態では、増幅混合物は、複数のプライマー、少なくとも1つの固有のバーコード配列(例えば、第1の固有のバーコード配列及びその逆相補体)、及び少なくとも1つのアダプター配列の対を含む。いくつかの実施形態において、複数のプライマーの各々は、標的増幅領域中のヌクレオチドに相補的なヌクレオチドのセットを含む。固有のバーコード配列は、特定の対象から得られた生物学的試料を同定する。アダプター配列の対は、多くの場合、プライマーをブロックして、複数のアンプリコンのそれぞれに第2の固有のバーコード配列を付加することを可能にする。いくつかの実施形態において、核酸の試料はRNA分子を含み、第1の工程は、増幅反応を行う前にRNAから逆転写されたcDNAを得ること、又はRNAからcDNAを逆転写することをさらに含む。
配列変異を検出する方法の第2の工程は、複数のアンプリコンを検出すること、及び場合により定量することを含む。方法の多くの実施形態では、検出工程は、単一の機器上で複数のアンプリコンの実質的に同一のコピーの核酸配列を並行して決定することを含む。本明細書に記載される方法の実施形態では、ハイスループットシーケンシングを使用して、アンプリコン中の固有のバーコードを検出する。当技術分野で公知の任意のハイスループットシーケンシングプラットフォームを使用して、本明細書に記載されるように調製されたシーケンシングライブラリーをシーケンシングすることができる。例示的なハイスループットシーケンシングシステムは、オックスフォードナノポアプラットフォーム(MinlON及びPromethlON機器を含む)、454 Life Sciencesによって最初に開発され、後にRoche(Basel,Switzerland)によって取得されたGS FLXシーケンシングシステム、Solexaによって開発され、後にlllumina Inc.(San Diego,CA)によって取得されたGenome Analyzer、Life Technologies(Foster City,CA)によるSOLiD配列システム、Complete Genomicsによって開発され、BGIによって取得されたCGA、Pacific Biosciences(Menlo Park,CA)によって開発されたPacBio RSシーケンシング技術、及びLife Technologies Corporationによって開発されたIon Torrentを含むがこれらに限定されない。本明細書に記載の方法で使用されるオックスフォードナノポアDNAシーケンシングシステムは、通常に長さが250bp超えるアンプリコンを迅速かつ正確に読み取るのにより適している。
本方法の第3の工程は、複数のアンプリコンのカテゴリーを決定する工程を含む。前述のように、これはアンプリコンインサートの配列分析に向けられた重要な工程である。アンプリコンがカウントされる場合、アンプリコンをどのように分類及びカウントするかを決定するのはインサートの配列(例えば、標的増幅領域)である。インサートの配列(例えば、標的増幅領域)は、病原性決定因子の配列変異体を認識し、新規変異体を、それらの存在に関する事前の知識を有することなく発見する手段である。本明細書に記載される方法の多くの実施形態では、標的増幅領域由来のポリヌクレオチドを含む複数のアンプリコンのそれぞれのカテゴリーを決定することは、対応する対象が標的核酸の特定の変異体を有することを示す。
本方法の第4の工程は、配列変異の検出に関する。配列変異体は、複数のアンプリコンに対してシーケンシング反応を同時に実行して、配列変異体(例えば、ウイルスゲノムに対応する標的増幅領域における点変異)に対応する複数の核酸配列を決定することによる、本明細書に記載の方法において検出される。複数の配列アラインメントを行うための、シーケンシングデータを使用する様々なシーケンシング方法及びアルゴリズムは当技術分野で公知であり、本明細書に記載されている。当技術分野で公知の任意のハイスループットシーケンシングプラットフォームを使用して、本明細書に記載されるように調製されたシーケンシングライブラリーをシーケンシングすることができる。例示的なハイスループットDNAシーケンシングシステムとしては、限定されないが、MinlON及びPromethlON機器を含むオックスフォードナノポアプラットフォーム、GS FLXシーケンシングシステム、Genome Analyzer、SOLID配列システム、CGA、PacBio RSシーケンシング技術及びIon Torrentが挙げられる。本明細書に記載の方法で使用されるオックスフォードナノポアDNAシーケンシングシステム(例えば、ONT MinlON又はGridlON)は、通常に長さが250bp超えるアンプリコンを迅速かつ正確に読み取るのにより適している。
配列比較のために、典型的には、1つの配列が参照配列として機能し、それと試験配列が比較される。配列比較アルゴリズムを使用する場合、試験配列及び参照配列をコンピュータに入力し、必要に応じてサブシーケンス座標を指定し、配列アルゴリズムプログラムパラメータを指定する。デフォルトのプログラムパラメータを使用することも、代替パラメータを指定することもできる。次いで、配列比較アルゴリズムは、プログラムパラメータに基づいて、参照配列に対する試験配列の配列同一性パーセントを計算する。比較のための配列のアラインメント方法は、当技術分野で周知である。比較のための配列の最適なアラインメントは、例えば、Smith-Watermanの局地的相同性アルゴリズム、(1970)Adv.Appl.Math.2:482cによって、Needleman-Wunschの相同性アラインメントアルゴリズム、(1970)J.Mol.Biol.48:443によって、Pearson-Lipmanの類似性探索法、(1988)Proc.Nat’l.Acad.Sci.USA 85:2444によって、これらのアルゴリズムをコンピュータ化することによって(GAP、BESTFIT、FAST A、及びTFASTA(the Wisconsin Genetics Software Package,Genetics Computer Group,575 Science Dr.,Madison,Wis.))、又は手動アラインメント及び目視検査によって(例えば、Brent et al.,(2003)Current Protocols in Molecular Biologyを参照されたい)、実施され得る。方法のいくつかの実施形態では、プールされたライブラリー調製物からのPCRアンプリコンをONT MinlON又はGridlONでシーケンシングして、生のONT FASTSシーケンシング出力ファイルを得た。これらの実施形態では、出力ファイルを高精度ONT GPUに基づくベースコーラーに供して、生のFASTA/FASTQファイル又はStockholmフォーマットファイルを得た。生のファイルをHMMER3及びCM配列アラインメント及びアノテーションエンジンで実行した。HMM/CMエンジンは、統計的パターン分類アルゴリズムを適用して、a)複製配列リードに基づいて尤度を最大化すること、及び/又はb)全ゲノム多重配列アラインメントに基づいて文脈依存アラインメントモデルパラメータを使用することによってコンセンサス配列を生成する。
SARS-CoV-2を有すると疑われる患者から得られた試料における配列変異を決定するための非限定的な例示的ワークフローは、シーケンサーがライゲーションされていない個々のアンプリコンを読み取ることから始まる。多くの場合、陽性試料から100~10の深度カバレッジが得られる。HMM又はCM統計的モデルを使用して、これらのリードを、個々に分析されるそれらの構成アンプリコン配列へとセグメント化する。HMMはアンプリコン特徴をアラインメントし、アノテーションする。次に、患者/バッチIDを、バーコード領域を逆多重化することによって取得する。介在領域上でHMM又はCMソフトウェアを使用して複数の配列アラインメントを行い、高精度コンセンサス配列を得る。次いで、配列アラインメントをGenbank/GISAID SARS-CoV-2参照にマッピングする。アラインメントは、予め定義された目的のSZRBDタンパク質参照残基を試料由来の配列と比較して、新規変異体残基を記録する。新規変異体の記録を、集中化変異体監視データベースに提出すること、及び/又は抗体/ワクチン回避リスクのアノテーション付きの各患者の最終レポートと共に提供することができる。
シーケンシング後、配列変異体が生じる頻度はまた、異なる対象集団から得られた複数の核酸試料からの配列を分析することによって決定され得る。一例として、100000配列が決定され、99000配列が「gau」を読み取り、1000配列が「gcu」を読み取る場合、アスパルテートをエンコードする「gau」配列は、その位置のアラニンをエンコードする「gcu」変異体の10%に対して、90%の頻度を有すると言われる可能性がある。いくつかの実施形態において、本明細書中に記載される方法は、読み取られた配列の10%未満、5%未満又は2%未満において生じる配列変異を検出し得る。他の実施形態において、方法は、読み取られた配列の1%未満、0.5%未満又は0.2%未満において生じる配列変異を検出し得る。検出感度の典型的な範囲は、0.1%~100%、0.1%~50%、0.1%~10%、例えば0.2%~5%であり得る。
本明細書に記載されるPCRベースの方法の1つの利点は、この方法には変異の事前知識が必要とされないことである。方法は核酸シーケンシングに基づくので、プライマーを使用して増幅する1つの位置のすべての変異が検出される。さらに、シーケンシングのためのクローニングは必要ない。核酸試料は、クローニング、サブクローニング及びクローニングされた核酸の培養を必要とせずに、一連の工程で増幅及びシーケンシングされる。配列変異の検出のための上記の態様は特に有用である。例えば、一実施形態では、本明細書に記載される方法は、患者試料中の様々な変異SARS-CoV-2株を検出することができる。本明細書中に記載される方法によって検出され得る変異SARS-CoV-2株の非限定的な例としては、スパイクタンパク質、受容体結合ドメイン及び/又はヌクレオカプシドタンパク質をエンコードするポリヌクレオチド中にT95I、D253G、L452Rm E484K、S477N、N501Y D614G及びA701V点変異を有するSARS-CoV-2変異体が挙げられる。いくつかの実施形態の方法では、核酸試料は、検出可能な力価のウイルスを含むSARS-CoV-2 RNAソース(例えば、SARS-CoV-2に感染したヒト患者)に由来し得る。本明細書に記載の方法の典型的な実施形態では、ソースはヒト対象からの試料を含み得、それは、薬物/血漿/ワクチン治療レジメンを受けた可能性がある、又はないSARS-CoV-2感染患者(すなわち、患者は「ドラッグナイーブ」であってもなくてもよい)から収集した組織又は体液試料を含む。変異は、疾患症状の重症度、死亡率の増加、蔓延の増加、及び/又は治療法に対する既知の耐性若しくは新たに特定された耐性と相関し得る。本明細書中に記載される方法はまた、ワクチン接種プログラムの有効性を決定するか、又は治療的利益がほとんどない1つ以上の薬物、薬物クラス若しくは薬物組み合わせの回避を含み得る治療レジメンを変更するために利用され得る、試料集団中の各変異体の頻度の測定を提供する。
記載される方法の他の用途には、配列変異体の集団研究が含まれ、核酸試料を生物の集団から収集し、1つの実験で組み合わせて分析してウイルスゲノムの特定の領域における配列変異頻度を決定することができる。生物の集団は、例えば、ヒトの集団、家畜の集団などを含み得る。これらの集団研究は、ウイルスゲノムにおける変異についての「ホットスポット」を示すことができ、そのような情報は、薬物及び/又はワクチンの設計において貴重であり得る。
VI.アレイのマルチプレックス及び感染の同定におけるその使用
一態様では、本開示は、多様な試料から少なくとも1つの標的タンパク質を検出するためのアレイのマルチプレックスを提供する。マルチプレックスアレイは、複数の独自に標識されたビーズに結合した複数の捕捉剤を含む。独自に標識されたビーズの各々は、複数の固有の捕捉剤と、少なくとも1つのビーズに結合するように設計された少なくとも1つの第1のオリゴヌクレオチド配列と、第2のオリゴヌクレオチド配列とコンジュゲートした少なくとも1つの二次抗体と、環状アンプリコン中の少なくとも1つの固有のヌクレオチドバーコード配列とを含む。本明細書に記載されるアレイの多くの実施形態では、ビーズは、少なくとも1つの標的タンパク質に特異的に結合する抗原でコーティングされる。本明細書に記載されるアレイのいくつかの実施形態では、第2のオリゴヌクレオチド配列は、第2のオリゴヌクレオチド配列が第1のオリゴヌクレオチド配列に近接している場合に増幅されて環状アンプリコンを形成するように設計される。いくつかの実施形態において、第1のオリゴヌクレオチド配列、又は第2のオリゴヌクレオチド配列、又はその両方は、少なくとも1つの固有のバーコード配列を含む。いくつかの実施形態において、第1のオリゴヌクレオチド配列は、ビーズ上にコーティングされたポリペプチドに共有結合している。いくつかの実施形態では、アレイのマルチプレックスは、抗体又は抗体断片に共有結合した第1のオリゴヌクレオチド配列を含み、抗体又は抗体断片はビーズ上にコーティングされたポリペプチドに結合する。
いくつかの実施形態では、アレイのマルチプレックスは、第1のオリゴヌクレオチド配列又は第2のオリゴヌクレオチド配列、又はそれらの組み合わせ中に少なくとも96個の異なるバーコード配列を含む。
いくつかの他の実施形態では、アレイのマルチプレックスは、第1のオリゴヌクレオチド配列又は第2のオリゴヌクレオチド配列、又はそれらの組み合わせ中に少なくとも384個の異なるバーコード配列を含む。いくつかの実施形態では、アレイのマルチプレックスは、環状アンプリコン中に少なくとも96個の異なるバーコード配列を含む。
上述したように、主題の方法を実施するのに有用なシステムも提供される。例えば、いくつかの実施形態では、主題の方法を実施するためのシステムは、少なくとも1つのセット又は近接プローブ;少なくとも1対の非対称コネクタの;及び核酸リガーゼを含み得る。さらに、システム構成要素を用いて実施されるプロトコルで必要とされる又は所望される追加の試薬が存在してもよく、その追加の試薬には、補充核酸の対、一本鎖結合タンパク質、及びPCR増幅試薬(例えば、ヌクレオチド、緩衝液、カチオンなど)、NGSシーケンシング試薬などが含まれるが、これらに限定されない。
一態様では、本開示は、複数の生物学的試料における少なくとも1つの感染のための方法を提供する。方法は、少なくとも1つの標的タンパク質が少なくとも1つのビーズの固有の捕捉剤に結合するのに十分な条件下で、本明細書に記載のアレイのマルチプレックスにおいて複数の生物学的試料を複数のビーズと共にインキュベートする第1の工程を含む。方法の第2の工程において。ビーズを洗浄して、固有の捕捉剤に結合しないタンパク質を除去する。次の工程は、複数の標的タンパク質に結合した二次抗体の数に対応する複数の複合体が形成されるように、複数の二次抗体のそれぞれが少なくとも1つの標的タンパク質と複合体を形成する条件下で、ビーズを複数の二次抗体とインキュベートすることを含む。次の工程では、ビーズを再度洗浄して、複合体を形成しない二次抗体を除去する。第6の工程では、環状アンプリコンを形成するように第1オリゴヌクレオチド配列のそれぞれに対して第2オリゴヌクレオチド配列のそれぞれをハイブリダイゼーションさせる条件下で、複数の複合体の数に対応して複数のアンプリコンが生成されるように、複数の複合体をインキュベートする。方法の第7の工程は、複数の環状アンプリコンを増幅に供することを含む。第8の工程では、ビーズをアレイにプールし、複数のアンプリコンを固有のバーコード化アンプリコンのハイスループットシーケンシングによって同時に検出する。最後の工程では、複数のアンプリコンのカテゴリーが決定される。前述のように、標的増幅領域由来のポリヌクレオチドを含む複数のアンプリコンのそれぞれのカテゴリーを決定することは、対応する生物学的試料における感染を示す。
いくつかの実施形態では、本明細書に記載の方法は、1つ又は複数の試料中の病原性決定因子(例えば、細菌及び/又はウイルス感染)の同定に使用される。他の実施形態では、本方法は、1つ以上の病原性感染を示すIgG及びIgM免疫グロブリンなどの標的タンパク質を同時に検出する。本明細書中に記載される方法によって検出される抗体又は抗体断片は、アシネトバクター・バウマンニ(Acinetobacter baumannii)、アデノウイルス、アフリカ馬疫ウイルス、アフリカ豚コレラウイルス、ズビニ鉤虫(Anclostoma duodenale)、回虫、黄色アスペルギルス、アスペルギルス・フミガーツス(Aspergillus fumigatus)、アスペルギルス・ニガー(Aspergillus niger)、アスペルギルス・オリゼ(Aspergillus oryzae)、鳥インフルエンザウイルス、炭疽菌、炭疽菌パスツール株、Bacillus cereus Biovar anthracis、ウシ流産菌、ブルセラ・メリテンシス(Brucella melitensis)、ブルセラ・スイス(Brucella suis)、鼻疽菌、類鼻疽菌、カンジダ・アルビカンス(Candida albicans)、カンジダ・ドゥブリニエンシス(Candida dubliniensis)、カンジダ・グラブラタ(Candida glabrata)、カンジダ・クルセイ(Candida krusei)、カンジダ・トロピカリス(Candida tropicalis)、クラミジア・ニューモニエ(Chlamydia pneumoneae)、クラミジア・トラコマチス(Chlamydia trachomatous)、豚熱ウイルス、クロストリジウム・ディフィシール(Clostridium difficile)、コクシジオイデス・イミティス(Coccidioides immitis)、コクシジオイデス・ポサダシ(Coccidioides posadasii)、CoV-229E、CoV-HKU1、CoV-NL63、CoV-OC43、コクサッキーウイルスA、コクサッキーウイルスB、コクシエラ・バーネッティ(Coxiella burnetii)、クリミア・コンゴ出血熱、サイトメガロウイルス、デングウイルス、メジナ虫、東部馬脳炎、エボラウイルス、い粒条虫、多包条虫、エンテロバクター・クロアカ、エンテロコッカス・フェシウム(Enterococcus faecium)、エンテロウイルス、エプスタイン・バール・ウイルス、大腸菌、巨大肝蛭、肝蛭、***ウイルス、野兎病菌、山羊痘ウイルス、ヘモフィルス属インフルエンザ、ヘリコバクターピロリ、ヘンドラウイルス、A型肝炎ウイルス、B型肝炎ウイルス、C型肝炎ウイルス、ヒストプラスマ・カプスラーツム(Histoplasma capsulatum)、ズボアジ型ヒストプラスマ症(Histoplasma duboisii)、ヒトヘルペスウイルスHHV6、ヒトヘルペスウイルスHHV7、ヒトヘルペスウイルスHHV8、ヒトヘルペスウイルスHSV1、ヒトヘルペスウイルスHSV2、ヒト免疫不全ウイルス、ヒトパピローマウイルス、インフルエンザウイルスA型、インフルエンザウイルスB型、クレブシェラ肺炎桿菌、キャサヌール森林病ウイルス、ラッサ熱ウイルス、レジオネラ・ニューモフィラ菌、リーシュマニア・プロマスティゴート(Leishmania promastigotes)、Lujoウイルス、ランピースキン病ウイルス、マールブルグウイルス、麻疹ウイルス、メチシリン耐性黄色ブドウ球菌、サル痘ウイルス、ムンプスウイルス、マイコバクテリウム・アブセッサス(Mycobacterium abscessus)、マイコバクテリウム・アビウム(Mycobacterium avium)、マイコバクテリウム・ボビス(Mycobacterium bovis)、マイコバクテリウム・カヌッティイ(Mycobacterium canettii)、マイコバクテリウム・レプレ(Mycobacterium leprae)、ヒト結核菌、マイコバクテリウム・ウルセランス(Mycobacterium ulcerans)、マイコプラズマ・カプリコルム(Mycoplasma capricolum)、マイコプラズマ・ミコイデス(Mycoplasma mycoides)、マイコプラズマ・ニューモニア(Mycoplasma pneumoneae)、アメリカ十二指腸虫、淋病、ニューカッスル病ウイルス、ニパウイルス、ノルカジア属beijingensis、ノルカジア属cyriacigeorgica、ノルカジア属farcinica、ノロウイルスGI、ノロウイルスGII、ノーウォークウイルス、オムスク出血熱ウイルス、回旋糸状虫、発癌性ヒトパピローマウイルス、パラインフルエンザウイルス、寄生生物、マルネッフェイ型ペニシリウム症(Penicilliosis marneffei)、小反芻獣疫ウイルス、ニューモシスチス・イロベチイ(Pneumocystis jirovecii)、ポリオーマウイルス、プロテウス・ミラビリス(Proteus mirabilis)、緑膿菌、狂犬病ウイルス、8つの遺伝子断片すべてのコーディング領域の任意の部分を含有する、1918年のパンデミックインフルエンザウイルスの再構築された複製コンピテント形態、呼吸器合胞体ウイルス、ライノウイルス、発疹チフスリケッチア、リフトバレー熱ウイルス、牛疫ウイルス、ロタウイルスA、ロタウイルスB、ロタウイルスC、ロタウイルスG2、風疹ウイルス、SARS関連コロナウイルス(SARS-CoV)、SARS-CoV-1、SARS-CoV-2、ビルハルツ住血吸虫、日本住血吸虫、マンソン住血吸虫、羊痘ウイルス、南米出血熱ウイルスチャパレ、南米出血熱ウイルスグアナリト、南米出血熱ウイルスフニン、南米出血熱ウイルスマチュポ、南米出血熱ウイルスサビア、黄色ブドウ球菌、スタフィロコッカス・サプロフィティカス(Staphylococcus saprophyticus)、肺炎レンサ球菌、豚水疱病ウイルス、有鉤条虫、ダニ媒介性脳炎複合(flavi)ウイルス極東亜型、ダニ媒介性脳炎複合(flavi)ウイルスシベリア亜型、タバコモザイク病ウイルス、トルクテノウイルス、鞭虫、ブルーストリパノソーマ(Trypanosoma bmcei)、トリパノソーマ・クルージ(Trypanosoma cruzi)、大痘瘡ウイルス(天然痘ウイルス)、小痘瘡ウイルス(アラストリム)、ベネズエラ馬脳炎ウイルス、バンクロフト糸状虫、ペスト菌、及び上記の病原体のいずれか1つと特徴的な核酸配列を共有する病原体、又は前述の群の病原体と特徴的な核酸配列を共有する、別の潜在的に新規若しくは特性決定されていない病原体を含む病原体からの1つ以上の抗体に特異的に結合する。
いくつかの実施形態では、本明細書に記載の方法は、1つ又は複数の試料における1つ又は複数のRNAウイルスによって引き起こされる感染の同定に使用される。特定の実施形態では、本明細書に記載の方法は、1人又は複数の患者から得られた1つ又は複数の生物学的試料中のウイルス感染(例えば、SARS-CoV-2感染)の同定に使用される。SARS-CoV-2を診断し、識別することは臨床的に困難である。SARS-CoV-2感染が疑われる症例では、迅速で信頼性の高い大規模並行診断が必要である。本開示は、そのようなアッセイを提供する。アッセイは、少なくとも部分的には、SARS-CoV-2ウイルスポリヌクレオチドが、固有のバーコード配列を試料ソース識別子として使用するSARS-CoV-2ウイルスポリヌクレオチド用の1段階又は2段階リアルタイム逆転写増幅アッセイで検出(例えば、シーケンシング)され得るという発見に基づく。本明細書に提供されるアッセイは、スパイクタンパク質(S)、受容体結合ドメイン(RBD)、S1タンパク質、S2タンパク質、E遺伝子、S遺伝子、Orflab遺伝子、N末端スパイクタンパク質ドメイン、全タンパク質(S1+S2)、及びヌクレオカプシド(N)タンパク質からなる群から選択される1つ以上のSARS-CoV-2抗原に特異的に結合する、本明細書に記載される方法で検出される抗体又は抗体断片を検出することができる。本明細書で提供される方法は、SARS-CoV-2感染を有するか又は有する疑いがある1人又は複数の患者から得られた複数の試料からのSARS-CoV-2ウイルスポリヌクレオチドの同時検出を可能にする。
いくつかの実施形態において、本明細書中に記載される方法は、重要な獣医学的疾患(例えば、ウシ下痢、ヨーネ病、豚インフルエンザなど)の病原体の同定のために使用される。本明細書中に記載される方法は、動物が各試料に標識され、適切にバーコードプライミングされている限り、群内の感染動物を個々に検出を容易にすることができる。
いくつかの実施形態では、本明細書に記載の方法は、1つ又は複数の試料における1つ又は複数の標的核酸の同定に使用される。いくつかの他の実施形態では、本明細書に記載の方法は、1つの試料における2つ以上の標的核酸の同定に使用される。特定の実施形態では、2つ以上の標的核酸は、単一の病原体の病原性決定因子であるか、又は病原性決定因子をエンコードする。特定の実施形態では、2つ以上の標的核酸は、単一のRNAウイルス(例えば、SARS-CoV-2)の病原性決定因子であるか、又は病原性決定因子をエンコードする。他の実施形態では、2つ以上の標的核酸は、2つ以上のRNAウイルス(例えば、SARS-CoV-2及びインフルエンザAウイルス)の病原性決定因子であるか、又は病原性決定因子をエンコードする。別の実施形態では、2つ以上の標的核酸は、1つ以上のRNAウイルス(例えば、SARS-CoV-2、インフルエンザAウイルス)及び1つ以上の細菌性病原体(例えばマイコバクテリウム、レンサ球菌、緑膿菌、赤痢菌、カンピロバクター、クラミジア及びサルモネラ)の病原性決定因子であるか、又は病原性決定因子をエンコードする。特に明記しない限り、「アミノ酸配列をエンコードするヌクレオチド配列」は、互いに縮重バージョンであり、同じアミノ酸配列をエンコードするすべてのヌクレオチド配列を含む。タンパク質又はRNAをエンコードするヌクレオチド配列という語句はまた、タンパク質をエンコードするヌクレオチド配列が、一部のバージョンで1つ以上のイントロンを含み得る程度にイントロンを含み得る。
VII.標的タンパク質血清学的アッセイを同定するためのシステム及び方法
本明細書に記載の血清学的アッセイは、試料中の分析物を検出するための近接ライゲーションアッセイ(PLA)である。このアッセイは、「近接プローブ」の原理を「分子バーコード化」及びマルチプレックス増幅と組み合わせて、複数の生物学的試料中の1つ又は複数の分析物の存在の大規模並行分析を容易にする。PLAは、分析物が複数の(すなわち、2つ以上、一般的には2つ、3つ又は4つ)プローブの同時結合によって検出されるアッセイであり、プローブは分析物への結合によって近接されると、検出可能な、好ましくは増幅可能な核酸検出産物(例えば、環状アンプリコン)を形成し、それによって前記分析物を検出することができる。核酸検出産物(例えば、環状アンプリコン)は、当業者に公知の方法によって検出及びシーケンシングすることができる。本明細書に記載のアッセイでは、近接プローブは、プローブの分析物結合ドメイン(又は部分)に連結された核酸ドメイン(又は部分)を含み、アンプリコンの産生は、核酸部分、及び/又は他のプローブによって担持されるさらなる官能性部分の間の相互作用を伴う。したがって、アンプリコン産生は、プローブ間の相互作用に依存し(より具体的には、それらによって担持される核酸又は他の官能性部分/ドメインによる)、したがって、必要な2つの(又はそれ以上)プローブの両方が分析物に結合した場合にのみ起こり、それによって検出システムへの特異性の改善をもたらす。
近接プローブベースの検出アッセイ、特に近接ライゲーションアッセイによって、試料中の1つ以上の分析物を、そのような分析物の存在を容易に検出可能又は定量可能な核酸ベースのシグナルに変換することによって、高感度な、迅速かつ便利な検出又は定量が可能になる。
当技術分野の近接プローブは、一般に対で使用され、それぞれ、標的分析物に特異性を有する分析物結合ドメイン、及び官能性ドメイン、例えばそれに結合した核酸ドメインからなる。分析物結合ドメインは、例えば、核酸「アプタマー」(Fredriksson et al(2002)Nat Biotech 20:473-477)であり得るか、又はモノクローナル若しくはポリクローナル抗体などのタンパク質性であり得る(Gullberg et al(2004)Proc Natl Acad Sci USA 101:8420-8424)。各近接プローブ対のそれぞれの分析物結合ドメインは、分析物上の同じ又は異なる結合部位のいずれかに対して特異性を有し得る。本明細書に記載のアッセイにおける分析物は、典型的には、対象由来の生物学的試料(例えば、血液)中に存在する抗体又は抗体の断片である。いくつかの例では、対象は感染(例えば、ウイルス感染又は細菌感染)を有し、感染を引き起こす特定の病原体に特異的な循環抗体(例えば、中和抗体)を有し得る。近接プローブ対は、両方が同じ分析物分子(相互作用する分子の複合体であり得る)上のそれぞれの部位に結合すると、すなわちプローブが標的分析物に同時に結合すると互いに近接し、この場合、官能性ドメイン(例えば核酸ドメイン)は、直接的又は間接的に相互作用することができる。例えば、近接している場合の近接プローブの核酸ドメインは、付加された1つ以上のオリゴヌクレオチドの互いのライゲーション(1つ以上の近接プローブの核酸ドメインであり得る)、例えば、付加された直鎖オリゴヌクレオチドを環状化するための分子内ライゲーションを鋳型化し得る。様々なそのようなアッセイフォーマットが国際公開第01/61037号に記載されている。
それによって生成された環状アンプリコンは、試料中の分析物の有無を報告するのに役立ち、例えばリアルタイム定量PCR(q-PCR)によって定性的又は定量的に検出することができる。
上述のように、固有のバーコード化配列を使用すると、単一の実験からの試料のプールから各試料のソースを追跡することが容易になる。「多重化」は、単一の反応に組み合わされた複数の試料の同時検出を容易にする。複数の固有のバーコード配列と多重化すると、1つの実験においていくつかの試料の検出及びソース識別が可能になる。
一態様では、本開示は、複数の生物学的試料における少なくとも1つの感染を同定するための方法を提供する。方法は、複数の対象から複数の生物学的試料を得ることと、複数の独自に標識されたビーズに結合した複数の捕捉剤を含むアレイを提供することとを含む。独自に標識されたビーズの各々は、複数の固有の捕捉剤を含む。アレイは、少なくとも1つのビーズに結合するように設計された少なくとも1つの第1のオリゴヌクレオチド配列をさらに含む。いくつかの実施形態では、複数の第1のヌクレオチド配列は、少なくとも1つの標的タンパク質(例えば、ビーズ上にコーティングされたCOVID-19のSタンパク質抗原に特異的に結合する生物学的試料からの抗体)に特異的に結合する抗原(例えば、COVID-19のSタンパク質抗原)でコーティングされた複数のビーズに結合する。アレイは、第2のオリゴヌクレオチド配列とコンジュゲートした少なくとも1つの二次抗体をさらに含む。第2のオリゴヌクレオチド配列が第1のオリゴヌクレオチド配列に近接している場合、独自にバーコード化された環状ヌクレオチド鋳型は、増幅されて環状アンプリコンを形成するように設計される。いくつかの実施形態では、第1及び第2のヌクレオチド配列は、固有のバーコード配列を含む。いくつかの実施形態では、第1及び第2のヌクレオチド配列は、第1及び第2のヌクレオチド配列のそれぞれに2つ以上の固有のバーコードを付加することを可能にするスペーサー配列(例えば、アダプター配列)を含む。
いくつかの実施形態では、アレイは、少なくとも96ウェル、少なくとも384ウェル、少なくとも1536ウェル、又はそれ以上のウェルを有する1つ又は複数のプレートを含むマルチプレックスアレイである。いくつかの実施形態では、第1及び第2のヌクレオチド配列は、第1のオリゴヌクレオチド配列又は第2のオリゴヌクレオチド配列、又はそれらの組み合わせ中に少なくとも384個の異なるバーコード配列を含む。特定の実施形態では、アレイは、環状アンプリコン中に少なくとも384個の固有のバーコード配列を含む。本明細書中に記載されるすべての実施形態において、複数のビーズは、独自に標識されたビーズの各々が複数の固有の捕捉剤(例えば、COVID-19のSタンパク質抗原)を含むように、独自に標識される。本明細書に記載される方法の多くの実施形態では、ビーズは少なくとも2つの近接プローブと共にインキュベートされる。第1の近接プローブは、少なくとも1つのビーズに結合した固有の捕捉剤に結合するように設計されたポリペプチドにコンジュゲートされた第1のオリゴヌクレオチド配列を含む。特定の実施形態では、第1のオリゴヌクレオチド配列は、ビーズ上にコーティングされた捕捉剤との直接共有結合相互作用によってコンジュゲートされる。他の特定の実施形態において、第1のオリゴヌクレオチド配列は、ビーズ上にコーティングされた捕捉剤との共有結合相互作用を通して、例えば、抗体、scFvドメインを含む、結合ドメインなどの別のポリペプチドによって媒介されて、ビーズ上の抗原へコンジュゲートされる。第2の近接プローブは、標的タンパク質(例えば、COVID 19のSタンパク質に対する抗体)に特異的に結合する(例えば、少なくとも約10-4M、通常は少なくとも約10-8M以上、例えば10-10M以上の結合親和性で)抗体にコンジュゲートされた第2のオリゴヌクレオチド配列を含む。標的タンパク質を含む試料とのインキュベーション時に、2つの近接プローブを、それらが鋳型環状DNAにハイブリダイズするように近接させる。次いで、環状DNA鋳型を増幅して、下流シーケンシングによって検出される環状アンプリコンを生成する。本明細書に記載の方法の実施形態では、環状DNA鋳型は個別にバーコード化され、検出器のための近接ライゲーション配列も含む。アンプリコンの検出は、特定の対象から得られた対応する試料が標的タンパク質を有することを示す。
近接プローブは、核酸の尾状又はタグ付き親和性リガンド、例えば、タグ又は尾部核酸(すなわち、核酸ドメイン)にコンジュゲートされた親和性リガンド(すなわち、検体結合ドメイン)を含むコンジュゲート分子であり、2つの構成要素は、一般に(必ずしもそうとは限らないが)、例えば直接又は連結基を介して互いに共有結合している。代表的な実施形態では、「尾状」親和性リガンドは、直接又は連結基を介してタグ核酸に共有結合した親和性リガンドで構成され、連結基は、切断可能、例えば酵素的に切断可能(例えば、制限エンドヌクレアーゼ認識部位を含み得る)、光不安定、その他であってもなくてもよい。特定の実施形態では、核酸尾状親和性リガンド又は近接プローブの親和性リガンド(すなわち、分析物結合する)ドメイン、部分又は構成要素は、標的分析物に対して高い結合親和性を有するscFV分子である。高い結合親和性とは、少なくとも約10-4M、通常少なくとも約10-8M以上、例えば10-10M以上の結合親和性を意味する。親和性リガンドは、タグ付き親和性リガンドとして存在する場合に標的タンパク質に対して必要な結合親和性を示す限り、様々な異なる種類の分子のいずれかであり得る。特定の実施形態では、親和性リガンドは、その標的分析物に対して中程度又はさらには低い、例えば約10-4M未満の親和性を有するリガンドである。
本明細書中に記載される方法の多くの実施形態において、親和性リガンドは、結合ドメイン(例えば、抗体、並びにその結合断片及び模倣物)である。抗体が親和性リガンドである場合、それらは、特異性が異なる抗体の異種集団がそれぞれ同じタグ核酸でタグ付けされるようなポリクローナル組成物、又は標的タンパク質に対して同じ特異性を有する同一の抗体の同種集団がそれぞれ同じタグ核酸でタグ付けされるモノクローナル組成物に由来し得る。したがって、親和性リガンドは、モノクローナル及びポリクローナル抗体のいずれかであり得る。さらに他の実施形態では、親和性リガンドは、抗体結合断片又は模倣物であり、これらの断片及び模倣物は、標的タンパク質に対して必要な結合親和性を有する。例えば、Fv、F(ab)及びFabなどの抗体断片は、無傷のタンパク質の切断、例えば、プロテアーゼ又は化学切断によって調製され得る。また、組換え生成された抗体断片、例えば一本鎖抗体又はscFvも対象であり、そのような組換え生成された抗体断片は、上記抗体の結合特性を保持する。そのような組換え生成された抗体断片は、一般に、対象抗体の結合特性を保持するように、少なくとも対象抗体のVHドメイン及びVLドメインを含む。本開示のこれらの組換え生成された抗体断片又は模倣物は、任意の好都合な方法論、例えば、米国特許第5,851,829及び5,965,371号に開示されている方法論を用いて容易に調製され得る。それらの開示は、参照により本明細書に組み込まれている。
重要なことに、親和性リガンドは、その標的タンパク質に対する親和性リガンドのための結合親和性を実質的に消失させることなく、核酸尾部に共有結合することができるドメイン又は部分を含むものである。
本明細書中に記載される方法の多くの実施形態において、固有のバーコード配列は、環状プラスミドのそれぞれに導入される。これにより、増幅後の効率的な検出が可能になり、タンパク質試料をバーコード化オリゴで個別に標識する必要がなくなり、面倒で時間のかかるプロセスが回避される。他の実施形態では、固有のバーコード配列が近接プローブの各々に導入される。バーコード配列は、ソース識別(例えば、試料ID、患者ID、アレイ内の試料のウェル又はプレート位置)を容易にする固有のヌクレオチド配列である。バーコード配列の長さは、3~20ヌクレオチド長、例えば5~15ヌクレオチド長であり得る。いくつかの実施形態では、バーコード配列は完全にランダムであってもよく、すなわち、A、T、G、及びCのいずれか1つがバーコード配列の任意の位置にあってもよい。例示的な一実施形態では、固有のDNAバーコードは、一連の2つのPCR工程において液体処理システムを指揮するコンピュータアルゴリズムによって割り当てられる。他の実施形態では、バーコード配列は、準定義されているか、又は完全に定義されている。例示的な実施形態では、対象情報はデータベースに登録され、対象には独自にバーコード化された(身体的)試料コレクションチューブが与えられる。ロボットは、プロセス全体を通して試料の独自の識別を可能にする、化学的性質の固有のバーコードDNA配列を割り当てる。この場合、バイアルバーコードは患者と一致し、固有のDNAバーコードプライマーの組み合わせがバイアルのIDに独自に割り当てられる。384のプライマーの1つの「ウェルバーコード」セット(セットA)をマイクロウェルプレート(対象ごとに1つのウェル、例えば384ウェルプレート)中の各対象ウェルに割り当て、次いで、384のプライマーの第2のセット(セットB)がプレートの産物を増幅する(プレートごとに1つの「プレート」バーコードプライマー)。このように、合計して患者からの147000の固有の試料になる384×384の固有の組み合わせを処理することができる。これらの割り当ての各々は、デコンボリューションのために追跡され記憶される。
いくつかの実施形態では、近接プローブは、標的鋳型環状DNAに相補的な1つ又は複数のアダプター領域を含む。鋳型環状DNAはまた、増幅中に保持され、ハイスループットシーケンシング工程中のアンプリコンのソース識別を容易にする固有のバーコード情報を有する。例示的な実施形態において、固有のDNAバーコードは、コンピュータアルゴリズムによって、アレイの各ウェルに付加された鋳型環状DNAの各々に割り当てられる。
384個の固有の環状アンプリコンは、セットAを表し、次いで、それらは、セットBからのさらなる384個のフォワード及びリバースの一つをアルゴリズム的に付加することによって増幅される。
本明細書に記載される方法のいくつかの実施形態では、アンプリコンは、シーケンシングによって検出される。配列データの生成は、典型的にはハイスループットDNAシーケンシングシステム、例えばDNA鋳型の大規模並行シーケンシングを利用する次世代シーケンシング(NGS)システムを使用して行われる。核酸配列データを生成するための例示的なNGSシーケンシングプラットフォームは、これらに限定されないが、オックスフォードナノポアシーケンサー(例えば、MinlON MklC、Flongle、Minion、Gridlon及び/又はPromethlONを含むナノポアデバイス)、Illuminaの合成技術によるシーケンシング(例えば、Illumina MiSeq又はHiSeq System)、Life TechnologiesのIon Torrent半導体シーケンシング技術(例えば、Ion Torrent PGM又はProton system)、the Roche(454 Life Sciences)GSシリーズ及びQiagen(Intelligent BioSystems)Gene Readerシーケンシングプラットフォームが含まれる。本方法のいくつかの実施形態では、バーコード化アンプリコンをプールして「ライブラリー」を作成し、ハイブリダイゼーション反応混合物に添加し、65℃で12時間インキュベートした。Illumina MiSeq(商標)(Illumina,San Diego,CA)又はIon Torrent(商標)Personal Gene Machine(PGM)(Life Technologies,Grand Island,NY)シーケンシングプラットフォームのいずれかに必要なさらなる配列(例えば、アダプター)を、融合プライマーを使用して5’及び3’アダプターに加えた。DNAライブラリーを半分に二分割した。一方の半分を、5’及び3’アダプターに相補的な部分を有し、MiSeqシーケンシングのためのさらなる配列を追加する融合プライマーで増幅し、他方の半分を、PGMシーケンシングのためのさらなる配列を追加するプライマーのセットで増幅した。
例示的な実施形態では、アンプリコンはシーケンシングされ、シーケンシングファイルは、(a)それぞれが独自にタグ付けされた、複数の対象からの標的分析物(例えば、COVID 19特異的抗体、SARS特異的抗体、インフルエンザ特異的抗体)を含む試料の各々のための二重バーコード化アンプリコン、及び(b)PCR反応が適切に実行されたことを確認する陽性対照配列(合成又は天然)のための二重バーコード化アンプリコンを含む。次いでアッセイ結果は、各患者を独自に識別する二重バーコードの組み合わせについて配列ファイルをスキャンするアルゴリズムによって読み取られる。例えば、ファイル内のジョイント配列(アダプター、その他を含む)を検出すると、アルゴリズムは対象を陽性同定し、それらを中央データベースに「陽性」として登録することができる。患者が陽性対照のみを有し、アンプリコン(例えば、COVID 19特異的抗体、SARS特異的抗体、インフルエンザ特異的抗体)を有さない場合、それらには「陰性」結果が割り当てられる。いくつかの実施形態では、報告システムは、結果を患者、医師、又は診療所などに転送することができる。
本明細書で提供される方法は、一般に、種々の患者集団及び/又は1つ若しくは複数の病原性変異体を有する同じ患者から得られた複数の配列データから、バーコード化アンプリコンのコンセンサス配列を決定するための堅牢で柔軟な方法及びシステムに関する。生体分子配列決定のための技術及び方法は、必ずしも完全な配列データを生成するとは限らない。例えば、DNAシーケンシングデータが100%の精度ですべての塩基を一義的に同定しない場合が多く、これは、シーケンシングデータが単一の合格又は「リード」から生成される場合に特に当てはまる。特定の実施形態では、この方法は、任意の1合格配列分析システムよりも正確に、核酸配列を最終コンセンサス配列のセットに同化させるためのアルゴリズムを含む。特定の実施形態において、この方法は、配列情報をPCRアンプリコンから生のONT FASTSシーケンシング出力ファイルに変換し、それを次いで、高精度ONT GPUに基づくベースコーラーによって生のFASTA/FASTQファイルに変換するアルゴリズムを含む。この方法は、FASTA/FASTQファイルをHMMER3及びCM配列アラインメント及びアノテーションエンジンに供して、参照バーコード候補に対する最小レーベンシュタイン距離スコアを合格する二重バーコードを有する配列リードを得るアルゴリズムをさらに含む。本明細書に記載される方法のこれらの合格リードは、完全な標的配列アノテーション、モデルフィット、ビットスコア、バーコード位置、バーコード距離、及び他のメトリックと共に中央データベースに記憶される。
特定の実施形態では、本明細書に記載の方法は、複数の試料からの標的分析物の同時同定を可能にする多重化近接ライゲーションアッセイを含む。アッセイのオリゴヌクレオチド成分(例えば、環状アンプリコンのバーコード、プローブオリゴのバーコード)のバーコードを修飾することによって、この設定は、いくつかの患者試料からの標的分析物の同時検出を可能にする。例えば、384×384の固有の組み合わせのマルチプレックスアレイは、147000個の別個の患者試料中の標的分析物(例えば、COVID 19のSタンパク質に対するIgG又はIgM免疫グロブリン)の存在を定量的及び定性的に同時に評価することができる。本開示の関連する態様では、本明細書に記載の血清学的アッセイ方法は、例えば、病原体感染の決定因子である2つ以上の標的分析物を検出するためのマルチプレックス設定において特に有用である。この方法は、コンビナトリアル様式で使用され得る。例えば、それは、それぞれCOVID 19及びインフルエンザ感染の決定因子である少なくとも2つの標的抗体を検出するために使用され得る。そのような実施形態において、固有のバーコードを有する環状DNA鋳型及び/又は固有のバーコードを有する近接プローブの対が、標的抗体の各々について提供される場合がある。特定の実施形態では、環状断片は、識別バーコード(例えば、患者識別バーコード)及び疾患型バーコードを有するが、プローブオリゴからのアダプターは、標的に応じて異なる。
したがって、固有のバーコードを有する検出可能な環状DNAアンプリコンは、同じ標的抗体に結合した近接プローブの各対から同様の様式で作製され得る。「バーコード」は、シーケンシングに基づいてデコードされる。アッセイ結果は、各患者からの各試料を独自に識別する固有のバーコードについて配列ファイルをスキャンするアルゴリズムによって読み取ることができる。各標的抗体に対応する固有のアンプリコンを検出すると、アルゴリズムは対象を陽性同定し、それらを感染それぞれについて中央データベースに「陽性」として登録することができる。患者が陽性対照を有し、任意の標的抗体に対応するアンプリコンを有さない場合、それらには「陰性」結果が割り当てられる。
以下の実施例は、本明細書に記載される組成物及び方法がどのように使用され、作製され、評価され得るかの説明を当業者に提供するために記載され、本開示の純粋に例示的なものであることを意図し、本発明者らが本発明とみなすものの範囲を限定することを意図しない。
実施例1:別個の病原体に対する増幅プライマーの同定及びスクリーニング
別個の病原体に対するプライマーの設計では、プライマーの選択は、別個の、かつ各病原体に固有のゲノム領域に対して行われる。上記で選択されたプライマーを用いた増幅によって産生された得られたアンプリコンは、それらの別個の病原体の各々のためのゲノム配列を有する。HMMモデルは、病原体配列及びそれらのバーコードのそれぞれについて定義され、アラインメントにおいて、病原体配列に最も密接に一致する(例えば、最も高いビットスコアを有するアラインメント)モデルは、オリジナル試料にどの病原体が存在したかを示す。これらのプライマーは、本明細書に記載されるようにバーコード化(例えば、1段階又は2段階バーコード化)することができる。バーコード配列及びプライマーは、二次構造相互作用についてスクリーニングされた非常に大きな検証済みIDTバーコードライブラリーから選択され、高度に最適化されたエラー耐性バーコード設計をもたらす。非限定的な例示的バーコード配列を表1に提供する。表1に提供される96個のバーコード配列(3000+総バーコード内から選択された)は、最大レーベンシュタイン距離で分離されている。本明細書に記載される方法は、最大レーベンシュタイン距離で分離された384個のバーコード配列を使用することができる。バーコード配列の選択はアルゴリズム的に行われ、選択サイズに応じて異なる結果をもたらす。本明細書で提供される方法及び組成物の実施形態において、選択されるバーコード配列の数は、プライマーが構築されるバーコードプールのサイズに基づく。シーケンシングの際に、これらのバーコードを識別し、シーケンシングされた各アンプリコンに患者の同一性を割り当てるために使用することもできる。
実施例2:アンプリコン設計
アンプリコン設計は、プライマーの5’末端のそれぞれにバーコード化配列及びスペーサー(アダプター)配列を用いて合成された病原体特異的フォワードプライマー及びリバースプライマーから始まる。病原体のゲノムの存在下で増幅すると、これはアンプリコンプールをもたらし、そこでDNAの各鎖はスペーサー(アダプター)及びバーコードを含む。スペーサーは、HMM/CMアラインメントエンジンがバーコードを正確に識別し、最終配列内の別個のバーコードを分析することができるために不可欠である。アダプター配列の非限定的な例は、本明細書において、ACACTGACGACATGGTTCTACA(配列番号21)及びT ACGGT AGC AGAGACTTGGT CT(配列番号22)に記載のポリヌクレオチド配列で提供される。
実施例3:配列変異体の分析
病原性変異体は、アンプリコンを形成するために使用されるプライマーが、各変異体に特異的なホールマーク変異を有することが知られているゲノム領域(例えば、SARS-CoV-2スパイクタンパク質の受容体結合ドメイン)に及ぶ場合、容易に同定され得る。病原体試料のシーケンシングにおいて、鋳型配列(例えば、非バーコード、非スペーサー)を、最高スコアリングのアンプリコンで参照ゲノムデータベースに対してアラインメントすることができる。次いで、配列類似性又は同一性によって、鋳型配列に対する先に記載された配列の近接一致の判定を行うことができる。あるいは、各患者由来の鋳型配列の多重配列アラインメントを実施してコンセンサス配列を生成することができる。患者あたり数百から数万のアンプリコン配列が頻繁に得られ、時折シーケンサーのエラーがあっても、非常に堅牢なコンセンサス配列が可能になる。次いで、コンセンサス配列を、ゲノム又はタンパク質参照データベース(例えば、Genbank又は特注の参照ゲノムデータベース)中の配列にアラインメントすることができる。
実施例4:SARS-CoV-2ウイルス検出
A.プライマー設計及びバーコード化アンプリコンの生成
高度にコンピュータ的に最適化されたアンプリコン(モチーフ、バーコード、スペーサー、及び明確に定義されたウイルスインサート)を生成しながらスループットを最大化するように設計されたPCRプライマー及びライゲーション反応。
SARS-CoV-2への曝露が知られた、又は疑われる患者からの生物学的試料(例えば、血液、唾液又は粘液)を得た。例示的な標的ゲノムとして、SARS-Cov-2ゲノムを選択した。E-Guelph、N_HKU、N2、Orflabタンパク質をエンコードするヌクレオチドに対応する約7~12の核酸塩基長の固有配列セグメントを同定した。発生頻度及び選択比の値を決定した。ほとんどの場合、プライマーは、その対応するゲノム配列セグメント(例えば、E-Guelph、N_HKU、N2、Orflabタンパク質をエンコードするヌクレオチドに対応するセグメント)に対して100%の相補性でハイブリダイズするように設計された。少数の他の場合では、縮重プライマーを調製した。プライマーの縮重塩基は、標的内でアンビギュイティを有する位置と相補的な位置に生じる。標準的なqPCRプライマーは、プローブハイブリダイゼーションのためにDNAの小セグメントを増幅する。図4に示すように、qPCRアンプリコンは患者ごとに同一である。
図4は、各患者の試料に固有のバーコード化配列にライゲーションされた核酸塩基長約20のプライマーを使用して、SARS-Cov2ゲノム中の標的N1タンパク質の増幅によって生成された例示的なアンプリコンを示す。図4に示されるように、各標的配列は同一であるが、配列の末端における固有のバーコードは個々の患者試料を互いから識別し、試料IDを保持しながらの試料プーリングを可能にする。
B.マルチプレックスPCR及びシーケンシング
図5Aは、SARS-Cov2ゲノムからの例示的な標的E-Guelphタンパク質の配列標識及びスコアリングデータを示す。プールされたライブラリー調製物からのPCRアンプリコンをONT MinlON又はGridiONでシーケンシングして、生のONT FASTSシーケンシング出力ファイルを得た。出力ファイルを高精度ONT GPUに基づくベースコーラーに供して、生のFASTA/FASTQファイルを得た。FASTA/FASTQファイルをHMMER3及びCM配列アラインメント及びアノテーションエンジンで実行した。HMM/CMエンジンは、統計的パターン分類アルゴリズムを適用して、a)複製配列リードに基づいて尤度を最大化すること、及び/又はb)全ゲノム多重配列アラインメントに基づいて文脈依存アラインメントモデルパラメータを使用することによってコンセンサス配列を生成する。図5Aは、ビットスコア並びにバーコード及びウイルスインサート領域のアラインメントを示す。
SARS-CoV-2ウイルス検出アッセイに使用するための、広範囲のSARS-CoV-2遺伝子標的(例えば、E-Guelph、N-HKU)及び対照(例えば、TME)の両方を評価した。複数のPCRマスター混合物を評価した。すべての標的が適切なPCR増幅を示し、より長い遺伝子及びNEBマスター混合物(選択されたLuna-Taq)において優位であった。図6は、SARSGoV-2遺伝子標的からの多重化PCR及びシーケンシング結果を示す。結果は、優れた増幅及び高いアラインメントスコアを実証する。比較的控えめなスコアカットオフであっても、多数の高スコアリングリードが得られた。図7及び表3に示すように、複数のシーケンシング実施にわたって、ほぼ同一の交差実行配列回復を伴う高い再現性が得られた。
Figure 2023519919000006
実施例4:SARS-CoV2に曝露された患者からのポイントオブケアデータ
生物学的試料(例えば、血液、唾液又は粘液)は、SARS-CoV-2への曝露が知られた、又は疑われる7人の患者から得られた。特異的な標的特異的プライマーを、E-Guelph、N_HKU、N2、Orflabタンパク質をエンコードするヌクレオチドに100%の相補性でハイブリダイズするように設計した。PCRアンプリコンは、各患者の試料に固有のバーコード化配列にライゲーションされた核酸塩基長約20のプライマーを使用して、SARS-Cov2ゲノム中の標的タンパク質E-Guelph、N_HKU、N2、Orflabタンパク質の増幅によって生成された。qPCRは、7人中3人の患者が陰性であることを示した。本明細書に記載の大規模並行診断法を使用して、すべてのqPCR陰性試料について高品質のリードを得た。結果を表4に要約する。
Figure 2023519919000007
他の実施形態
本明細書で言及されるすべての刊行物、特許、及び特許出願は、あたかも各独立した刊行物又は特許出願が参照により組み込まれることが具体的かつ個別に示されているのと同程度に、参照により本明細書に組み込まれる。
本開示は、その特定の実施形態に関連して説明されてきたが、さらなる修正が可能であり、本開示は、一般に、本開示の原理に従う、本開示が関係する技術分野内の既知の又は慣習的な実施に含まれ、本明細書で上述した本質的な特徴に適用することができ、特許請求の範囲内に従う本開示からの逸脱を含む、本開示の任意の変形、使用、又は順応を包含することを意図していることが理解されよう。
他の実施形態は、特許請求の範囲内である。

Claims (95)

  1. 少なくとも1つの標的核酸を同定するための方法であって、
    a)複数の対象から複数の生物学的試料を得る工程;
    b)複数のポリヌクレオチドを含む全核酸を、前記生物学的試料の各々から得る工程;
    c)前記複数のポリヌクレオチドを増幅混合物を使用する増幅に供して、複数のアンプリコンを産生する工程であって、前記増幅混合物が、複数のプライマーと、第1の固有のバーコード配列及びその逆相補体と、少なくとも1対のアダプター配列とを含み、前記複数のプライマーの各々が、それらが結合する前記ポリヌクレオチドの各々に相補的なヌクレオチドのセットを含み、前記第1の固有のバーコード配列が、前記特定の対象から得られた前記生物学的試料を識別し、前記アダプター配列の対が、前記第1の固有のバーコード配列及びその逆相補体に隣接し、前記複数のアンプリコンの各々が、標的増幅領域又は対照領域由来のポリヌクレオチドを含む、工程;
    d)前記複数のアンプリコンの各々を検出する工程;及び
    e)前記複数のアンプリコンのカテゴリーを決定する工程;
    を含み、
    前記標的増幅領域からの前記ポリヌクレオチドを含む前記複数のアンプリコンの各々の前記カテゴリーを決定することが、前記対応する対象が前記標的核酸を有することを示し、
    工程b)は、前記複数のポリヌクレオチドがRNA分子を含む場合、工程c)における増幅を実施する前に、前記RNAから逆転写されたcDNAを得ること、又は前記RNAからcDNAを逆転写することをさらに含む、方法。
  2. 工程b)における前記複数のポリヌクレオチドがRNA分子を含み、工程b)において逆転写酵素を添加して、工程c)における増幅に供される複数のcDNAを得る、請求項1に記載の方法。
  3. 工程b)における前記複数のポリヌクレオチドがDNA分子をさらに含む、請求項2に記載の方法。
  4. 前記標的核酸が、RNAウイルス、DNAウイルス、真菌、寄生生物及び細菌からなる群から選択される1つ又は複数の病原体を含む試料から得られる、請求項1に記載の方法。
  5. 前記病原体が、アシネトバクター・バウマンニ(Acinetobacter baumannii)、アデノウイルス、アフリカ馬疫ウイルス、アフリカ豚コレラウイルス、ズビニ鉤虫(Anclostoma duodenale)、回虫、黄色アスペルギルス、アスペルギルス・フミガーツス(Aspergillus fumigatus)、アスペルギルス・ニガー(Aspergillus niger)、アスペルギルス・オリゼ(Aspergillus oryzae)、鳥インフルエンザウイルス、炭疽菌、炭疽菌パスツール株、セレウス菌、ウシ流産菌、ブルセラ・メリテンシス(Brucella melitensis)、ブルセラ・スイス(Brucella suis)、鼻疽菌、類鼻疽菌、カンジダ・アルビカンス(Candida albicans)、カンジダ・ドゥブリニエンシス(Candida dubliniensis)、カンジダ・グラブラタ(Candida glabrata)、カンジダ・クルセイ(Candida krusei)、カンジダ・トロピカリス(Candida tropicalis)、クラミジア・ニューモニエ(Chlamydia pneumoneae)、クラミジア・トラコマチス(Chlamydia trachomatous)、豚熱ウイルス、クロストリジウム・ディフィシール(Clostridium difficile)、コクシジオイデス・イミティス(Coccidioides immitis)、コクシジオイデス・ポサダシ(Coccidioides posadasii)、CoV-229E、CoV-HKU1、CoV-NL63、CoV-OC43、コクサッキーウイルスA、コクサッキーウイルスB、コクシエラ・バーネッティ(Coxiella burnetii)、クリミア・コンゴ出血熱、サイトメガロウイルス、デングウイルス、メジナ虫、東部馬脳炎、エボラウイルス、い粒条虫、多包条虫、エンテロバクター・クロアカ、エンテロコッカス・フェシウム(Enterococcus faecium)、エンテロウイルス、エプスタイン・バール・ウイルス、大腸菌、巨大肝蛭、肝蛭、***ウイルス、野兎病菌、山羊痘ウイルス、ヘモフィルス属インフルエンザ、ヘリコバクターピロリ、ヘンドラウイルス、A型肝炎ウイルス、B型肝炎ウイルス、C型肝炎ウイルス、ヒストプラスマ・カプスラーツム(Histoplasma capsulatum)、ズボアジ型ヒストプラスマ症(Histoplasma duboisii)、ヒトヘルペスウイルスHHV6、ヒトヘルペスウイルスHHV7、ヒトヘルペスウイルスHHV8、ヒトヘルペスウイルスHSV1、ヒトヘルペスウイルスHSV2、ヒト免疫不全ウイルス、ヒトパピローマウイルス、インフルエンザウイルスA型、インフルエンザウイルスB型、クレブシェラ肺炎桿菌、キャサヌール森林病ウイルス、ラッサ熱ウイルス、レジオネラ・ニューモフィラ菌、リーシュマニア・プロマスティゴート(Leishmania promastigotes)、Lujoウイルス、ランピースキン病ウイルス、マールブルグウイルス、麻疹ウイルス、メチシリン耐性黄色ブドウ球菌、サル痘ウイルス、ムンプスウイルス、マイコバクテリウム・アブセッサス(Mycobacterium abscessus)、マイコバクテリウム・アビウム(Mycobacterium avium)、マイコバクテリウム・ボビス(Mycobacterium bovis)、マイコバクテリウム・カヌッティイ(Mycobacterium canettii)、マイコバクテリウム・レプレ(Mycobacterium leprae)、ヒト結核菌、マイコバクテリウム・ウルセランス(Mycobacterium ulcerans)、マイコプラズマ・カプリコルム(Mycoplasma capricolum)、マイコプラズマ・ミコイデス(Mycoplasma mycoides)、マイコプラズマ・ニューモニア(Mycoplasma pneumoneae)、アメリカ十二指腸虫、淋病、ニューカッスル病ウイルス、ニパウイルス、ノルカジア属beijingensis、ノルカジア属cyriacigeorgica、ノルカジア属farcinica、ノロウイルスGI、ノロウイルスGII、ノーウォークウイルス、オムスク出血熱ウイルス、回旋糸状虫、発癌性ヒトパピローマウイルス、パラインフルエンザウイルス、寄生生物、マルネッフェイ型ペニシリウム症(Penicilliosis mameffei)、小反芻獣疫ウイルス(Peste des perils ruminants virus)、ニューモシスチス・イロベチイ(Pneumocystis jirovecii)、ポリオーマウイルス、プロテウス・ミラビリス(Proteus mirabilis)、緑膿菌、狂犬病ウイルス、8つの遺伝子断片すべてのコーディング領域の任意の部分を含有する、1918年のパンデミックインフルエンザウイルスの再構築された複製コンピテント形態、呼吸器合胞体ウイルス、ライノウイルス、発疹チフスリケッチア、リフトバレー熱ウイルス、牛疫ウイルス、ロタウイルスA、ロタウイルスB、ロタウイルスC、ロタウイルスG2、風疹ウイルス、SARS関連コロナウイルス(SARS-CoV)、SARS-CoV-1、SARS-CoV-2、ビルハルツ住血吸虫、日本住血吸虫、マンソン住血吸虫、羊痘ウイルス、南米出血熱ウイルスチャパレ、南米出血熱ウイルスグアナリト、南米出血熱ウイルスフニン、南米出血熱ウイルスマチュポ、南米出血熱ウイルスサビア、黄色ブドウ球菌、スタフィロコッカス・サプロフィティカス(Staphylococcus saprophyticus)、肺炎レンサ球菌、豚水疱病ウイルス、有鉤条虫、ダニ媒介性脳炎複合(flavi)ウイルス極東亜型、ダニ媒介性脳炎複合(flavi)ウイルスシベリア亜型、タバコモザイク病ウイルス、トルクテノウイルス、鞭虫、ブルーストリパノソーマ(Trypanosoma bmcei)、トリパノソーマ・クルージ(Trypanosoma cruzi)、大痘瘡ウイルス(天然痘ウイルス)、小痘瘡ウイルス(アラストリム)、ベネズエラ馬脳炎ウイルス、バンクロフト糸状虫、ペスト菌、及び上記の病原体のいずれか1つと特徴的な核酸配列を共有する病原体からなる群から選択される、請求項4に記載の方法。
  6. 前記アダプター配列の対が、前記第1の固有のバーコード配列及びその逆相補体を第2の固有のバーコード配列及びその逆相補体から分離する、請求項1に記載の方法。
  7. 前記試料が、血液、粘液、唾液、汗、涙、体腔に蓄積する流体、尿、***液、膣分泌物、脳脊髄液、リンパ液、糞便、痰、分解液、嘔吐物、汗、母乳、血清及び血漿からなる群から選択される、請求項1~6のいずれか一項に記載の方法。
  8. 前記RNAウイルスがSARS-CoV-2である、請求項6に記載の方法。
  9. 前記試料が唾液である、請求項7に記載の方法。
  10. 検出することが、前記アダプター配列の対並びに前記第1の固有のバーコード配列及びその逆相補体を含む前記複数のアンプリコンをシーケンシングすることを含む、請求項1に記載の方法。
  11. 検出することが、前記アダプター配列の対、前記第1の固有のバーコード配列及びその逆相補体、並びに前記第2の固有のバーコード配列及びその逆相補体を含む前記複数のアンプリコンをシーケンシングすることを含む、請求項6に記載の方法。
  12. 前記検出することが、一連のプログラムを用いてシーケンシングデータファイルを読み取ることによって行われる、請求項10又は11に記載の方法。
  13. 前記シーケンシングデータファイルがFASTA/FASTQフォーマットファイルである、請求項12に記載の方法。
  14. 前記一連のプログラムが、HMMER/Infernalアラインメントエンジンを含む、請求項12に記載の方法。
  15. 少なくとも1つの陽性対照試料をシーケンシングすることをさらに含み、前記陽性対照試料が前記標的核酸を含む、請求項10~14のいずれか一項に記載の方法。
  16. 少なくとも1つの陽性対照試料をシーケンシングすることをさらに含み、前記陽性対照試料がバクテリオファージMS2である、請求項10~14のいずれか一項に記載の方法。
  17. 少なくとも1つの陽性対照試料をシーケンシングすることをさらに含み、前記陽性対照試料がMS2鋳型核酸である、請求項10~14のいずれか一項に記載の方法。
  18. 少なくとも1つの陽性対照試料をシーケンシングすることをさらに含み、前記陽性対照試料がRNAseP又は別の非病原体遺伝子である、請求項10~14のいずれか一項に記載の方法。
  19. 少なくとも1つの陽性対照試料をシーケンシングすることをさらに含み、前記陽性対照試料が、ヒトハウスキーピング遺伝子GAPDH又はベータアクチン由来の核酸である、請求項10~14のいずれか一項に記載の方法。
  20. 前記複数のプライマーが、少なくとも96個の異なるバーコード化プライマーを含む、請求項1~17のいずれか一項に記載の方法。
  21. 2つ以上の標的核酸を同定することを含む、請求項1~17のいずれか一項に記載の方法。
  22. 前記2つ以上の標的核酸が、単一の病原体の病原性決定因子であるか、又は病原性決定因子をエンコードする、請求項21に記載の方法。
  23. 前記2つ以上の標的核酸が、ウイルスの病原性決定因子であるか、又は病原性決定因子をエンコードする、請求項22に記載の方法。
  24. 前記ウイルスがSARS-CoV-2である、請求項23に記載の方法。
  25. 前記病原性決定因子が、スパイクタンパク質(S)、受容体結合ドメイン(RBD)、S1タンパク質、S2タンパク質、E遺伝子、S遺伝子、Orflab遺伝子、N末端スパイクタンパク質ドメイン、全タンパク質(S1+S2)、及びヌクレオカプシド(N)タンパク質からなる群から選択される、請求項24に記載の方法。
  26. 前記2つ以上の標的核酸が、RNAウイルス、DNAウイルス、真菌、寄生生物及び細菌からなる群から選択される少なくとも2つの異なる病原体の病原性決定因子であるか、又は病原性決定因子をエンコードする、請求項22に記載の方法。
  27. 前記2つの異なるRNAウイルスが、SARS-CoV-2及びインフルエンザである、請求項26に記載の方法。
  28. 前記増幅がローリングサークル増幅である、請求項1~27のいずれか一項に記載の方法。
  29. 前記増幅がポリメラーゼ連鎖反応増幅である、請求項1~27のいずれか一項に記載の方法。
  30. 複数の試料から少なくとも1つの標的タンパク質を検出するためのアレイのマルチプレックスであって、前記アレイが、
    a.各々が複数の固有の捕捉剤を含む、独自に標識された複数のビーズに結合した複数の捕捉剤;
    b.少なくとも1つのビーズに結合するように設計され、前記ビーズが、少なくとも1つの標的タンパク質に特異的に結合する抗原でコーティングされている、少なくとも1つの第1のオリゴヌクレオチド配列;
    c.第2のオリゴヌクレオチド配列とコンジュゲートされ、前記第2のオリゴヌクレオチド配列が、前記第2のオリゴヌクレオチド配列が前記第1のオリゴヌクレオチド配列に近接している場合に増幅されて、環状アンプリコンを形成するように設計されている、少なくとも1つの二次抗体;及び
    d.前記環状アンプリコン中の少なくとも1つの固有のヌクレオチドバーコード配列を含む、アレイのマルチプレックス。
  31. 前記第1のオリゴヌクレオチド配列、又は前記第2のオリゴヌクレオチド配列、又はその両方が少なくとも1つの固有のバーコード配列を含む、請求項30に記載のアレイのマルチプレックス。
  32. アレイが、前記第1のオリゴヌクレオチド配列又は前記第2のオリゴヌクレオチド配列、又はそれらの組み合わせ中に少なくとも384個の異なるバーコード配列を含む、請求項31に記載のアレイのマルチプレックス。
  33. アレイが、前記環状アンプリコン中に少なくとも96個の異なるバーコード配列を含む、請求項30に記載のアレイのマルチプレックス。
  34. 前記第1のオリゴヌクレオチド配列が、前記ビーズ上にコーティングされたポリペプチドに共有結合している、請求項30に記載のアレイのマルチプレックス。
  35. 前記第1のオリゴヌクレオチド配列が、抗体又は抗体断片に共有結合し、前記抗体又は前記抗体断片が、前記ビーズ上にコーティングされたポリペプチドに結合する、請求項30に記載のアレイのマルチプレックス。
  36. 複数の生物学的試料において少なくとも1つの感染を同定するための方法であって、
    a.請求項30に記載のマルチプレックスアレイを提供する工程;
    b.複数の生物学的試料を複数のビーズと共に、少なくとも1つの標的タンパク質が少なくとも1つの前記ビーズの前記固有の捕捉剤と結合するのに十分な条件下でインキュベートする工程;
    c.前記ビーズを洗浄して、前記固有の捕捉剤と結合しないあらゆるタンパク質を除去する工程;
    d.前記ビーズを複数の二次抗体と共に、前記複数の二次抗体の各々が少なくとも1つの標的タンパク質と複合体を形成する条件、及び複数の複合体が、前記複数の標的タンパク質に結合する前記二次抗体の数に対応して形成される条件下でインキュベートする工程
    e.前記ビーズを洗浄して、前記複合体を形成しないあらゆる二次抗体を除去する工程;
    f.前記複数の複合体を、前記第2のオリゴヌクレオチド配列の各々を、環状アンプリコンを形成するように前記第1のオリゴヌクレオチド配列の各々にハイブリダイゼーションさせる条件、複数のアンプリコンが前記複数の複合体の数に対応して生成される条件、及び前記複数のアンプリコンの各々が、標的増幅領域又は対照領域由来のポリヌクレオチド、固有のバーコード配列及びその逆相補体、並びにアダプター配列の第1の対を含む条件下でインキュベートする工程;
    g.前記複数のアンプリコンを増幅に供する工程;
    h.前記ビーズを前記アレイ中にプールし、ハイスループットシーケンシングによって前記複数のアンプリコンを同時に検出する工程;及び
    i.前記複数のアンプリコンのカテゴリーを決定する工程を含み;
    前記標的増幅領域由来の前記ポリヌクレオチドを含む前記複数のアンプリコンの各々のカテゴリーを決定することが、対応する生物学的試料における感染を示す、方法。
  37. 前記複数の試料からの前記試料のそれぞれが、前記インキュベーション工程bの前に独自にバーコード化される、請求項36に記載の方法。
  38. 前記マルチプレックスアレイが、前記第1のオリゴヌクレオチド配列又は前記第2のオリゴヌクレオチド配列、又はそれらの組み合わせ中に少なくとも96個の異なるバーコード配列を含む、請求項37に記載の方法。
  39. アレイが、前記複数の環状アンプリコン中に少なくとも96個の異なるバーコード配列を含む、請求項37に記載の方法。
  40. 前記標的タンパク質が抗体又は抗体断片である、請求項36に記載の方法。
  41. 前記抗体がIgM抗体である、請求項40に記載の方法。
  42. 前記抗体がIgG抗体である、請求項40に記載の方法。
  43. 前記抗体又は前記抗体断片が、細菌、RNAウイルス及びDNAウイルスからなる群の抗原に特異的に結合する、請求項40に記載の方法。
  44. 前記抗体又は前記抗体断片が、アシネトバクター・バウマンニ(Acinetobacter baumannii)、アデノウイルス、アフリカ馬疫ウイルス、アフリカ豚コレラウイルス、ズビニ鉤虫(Anclostoma duodenale)、回虫、黄色アスペルギルス、アスペルギルス・フミガーツス(Aspergillus fumigatus)、アスペルギルス・ニガー(Aspergillus niger)、アスペルギルス・オリゼ(Aspergillus oryzae)、鳥インフルエンザウイルス、炭疽菌、炭疽菌パスツール株、セレウス菌、ウシ流産菌、ブルセラ・メリテンシス(Brucella melitensis)、ブルセラ・スイス(Brucella suis)、鼻疽菌、類鼻疽菌、カンジダ・アルビカンス(Candida albicans)、カンジダ・ドゥブリニエンシス(Candida dubliniensis)、カンジダ・グラブラタ(Candida glabrata)、カンジダ・クルセイ(Candida krusei)、カンジダ・トロピカリス(Candida tropicalis)、クラミジア・ニューモニエ(Chlamydia pneumoneae)、クラミジア・トラコマチス(Chlamydia trachomatous)、豚熱ウイルス、クロストリジウム・ディフィシール(Clostridium difficile)、コクシジオイデス・イミティス(Coccidioides immitis)、コクシジオイデス・ポサダシ(Coccidioides posadasii)、CoV-229E、CoV-HKU1、CoV-NL63、CoV-OC43、コクサッキーウイルスA、コクサッキーウイルスB、コクシエラ・バーネッティ(Coxiella burnetii)、クリミア・コンゴ出血熱、サイトメガロウイルス、デングウイルス、メジナ虫、東部馬脳炎、エボラウイルス、い粒条虫、多包条虫、エンテロバクター・クロアカ、エンテロコッカス・フェシウム(Enterococcus faecium)、エンテロウイルス、エプスタイン・バール・ウイルス、大腸菌、巨大肝蛭、肝蛭、***ウイルス、野兎病菌、山羊痘ウイルス、ヘモフィルス属インフルエンザ、ヘリコバクターピロリ、ヘンドラウイルス、A型肝炎ウイルス、B型肝炎ウイルス、C型肝炎ウイルス、ヒストプラスマ・カプスラーツム(Histoplasma capsulatum)、ズボアジ型ヒストプラスマ症(Histoplasma duboisii)、ヒトヘルペスウイルスHHV6、ヒトヘルペスウイルスHHV7、ヒトヘルペスウイルスHHV8、ヒトヘルペスウイルスHSV1、ヒトヘルペスウイルスHSV2、ヒト免疫不全ウイルス、ヒトパピローマウイルス、インフルエンザウイルスA型、インフルエンザウイルスB型、クレブシェラ肺炎桿菌、キャサヌール森林病ウイルス、ラッサ熱ウイルス、レジオネラ・ニューモフィラ菌、リーシュマニア・プロマスティゴート(Leishmania promastigotes)、Lujoウイルス、ランピースキン病ウイルス、マールブルグウイルス、麻疹ウイルス、メチシリン耐性黄色ブドウ球菌、サル痘ウイルス、ムンプスウイルス、マイコバクテリウム・アブセッサス(Mycobacterium abscessus)、マイコバクテリウム・アビウム(Mycobacterium avium)、マイコバクテリウム・ボビス(Mycobacterium bovis)、マイコバクテリウム・カヌッティイ(Mycobacterium canettii)、マイコバクテリウム・レプレ(Mycobacterium leprae)、ヒト結核菌、マイコバクテリウム・ウルセランス(Mycobacterium ulcerans)、マイコプラズマ・カプリコルム(Mycoplasma capricolum)、マイコプラズマ・ミコイデス(Mycoplasma mycoides)、マイコプラズマ・ニューモニア(Mycoplasma pneumoneae)、アメリカ十二指腸虫、淋病、ニューカッスル病ウイルス、ニパウイルス、ノルカジア属beijingensis、ノルカジア属cyriacigeorgica、ノルカジア属farcinica、ノロウイルスGI、ノロウイルスGII、ノーウォークウイルス、オムスク出血熱ウイルス、回旋糸状虫、発癌性ヒトパピローマウイルス、パラインフルエンザウイルス、寄生生物、マルネッフェイ型ペニシリウム症(Penicilliosis mameffei)、小反芻獣疫ウイルス、ニューモシスチス・イロベチイ(Pneumocystis jirovecii)、ポリオーマウイルス、プロテウス・ミラビリス(Proteus mirabilis)、緑膿菌、狂犬病ウイルス、8つの遺伝子断片すべてのコーディング領域の任意の部分を含有する、1918年のパンデミックインフルエンザウイルスの再構築された複製コンピテント形態、呼吸器合胞体ウイルス、ライノウイルス、発疹チフスリケッチア、リフトバレー熱ウイルス、牛疫ウイルス、ロタウイルスA、ロタウイルスB、ロタウイルスC、ロタウイルスG2、風疹ウイルス、SARS関連コロナウイルス(SARS-CoV)、SARS-CoV-1、SARS-CoV-2、ビルハルツ住血吸虫、日本住血吸虫、マンソン住血吸虫、羊痘ウイルス、南米出血熱ウイルスチャパレ、南米出血熱ウイルスグアナリト、南米出血熱ウイルスフニン、南米出血熱ウイルスマチュポ、南米出血熱ウイルスサビア、黄色ブドウ球菌、スタフィロコッカス・サプロフィティカス(Staphylococcus saprophyticus)、肺炎レンサ球菌、豚水疱病ウイルス、有鉤条虫、ダニ媒介性脳炎複合(flavi)ウイルス極東亜型、ダニ媒介性脳炎複合(flavi)ウイルスシベリア亜型、タバコモザイク病ウイルス、トルクテノウイルス、鞭虫、ブルーストリパノソーマ(Trypanosoma bmcei)、トリパノソーマ・クルージ(Trypanosoma cruzi)、大痘瘡ウイルス(天然痘ウイルス)、小痘瘡ウイルス(アラストリム)、ベネズエラ馬脳炎ウイルス、バンクロフト糸状虫、ペスト菌、及び上記の病原体のいずれか1つと特徴的な核酸配列を共有する病原体からなる群から選択される病原体由来の抗原に特異的に結合する、請求項43に記載の方法。
  45. 前記抗体又は前記抗体断片が、SAR-CoV-2由来の抗原に特異的に結合する、請求項44に記載の方法。
  46. 前記抗体又は前記抗体断片が、Sタンパク質、Sタンパク質のRBD、S1タンパク質、S2タンパク質、E遺伝子、S遺伝子、Orflab遺伝子、N末端スパイクタンパク質ドメイン、全タンパク質(S1+S2)、及びNタンパク質からなる群から選択される抗原に特異的に結合する、請求項44に記載の方法。
  47. 前記試料が、血液、粘液、唾液、汗、涙、体腔に蓄積する流体、尿、***液、膣分泌物、脳脊髄液、リンパ液、糞便、痰、分解液、嘔吐物、汗、母乳、血清及び血漿からなる群から選択される、請求項36~47のいずれか一項に記載の方法。
  48. 前記試料が血液である、請求項47に記載の方法。
  49. 前記試料が唾液である、請求項47に記載の方法。
  50. 核酸試料中の配列変異体を検出するための方法であって、
    a.増幅混合物で増幅反応を実行して、複数のアンプリコンを産生する工程であって、前記増幅混合物が、前記核酸試料と、複数のプライマーと、第1の固有のバーコード配列及びその逆相補体と、アダプター配列の第1の対とを含み、前記複数のプライマーの各々が、それらが結合する前記ポリヌクレオチドの各々に相補的なヌクレオチドのセットを含み、前記第1の固有のバーコード配列及びその逆相補体が、特定の対象から得られた前記試料を同定し、前記アダプター配列の対が、前記第1の固有のバーコード配列及びその逆相補体に隣接し、前記複数のアンプリコンの各々が、標的増幅領域又は対照領域由来のポリヌクレオチドを含む、工程;
    b.前記複数のアンプリコンを検出、及び場合により定量する工程;
    c.前記複数のアンプリコンのカテゴリーを決定する工程;及び
    d.工程cからの前記複数のアンプリコンにおいて1つ以上の配列変異体を検出する工程を含み、
    前記核酸の試料がRNA分子を含む場合、工程a)は、前記増幅反応を行う前に前記RNAから逆転写されたcDNAを得ること、又は前記RNAからcDNAを逆転写することをさらに含む、方法。
  51. 工程bにおいて検出することが、前記アダプター配列の第1の対並びに前記第1の固有のバーコード配列及びその逆相補体を含む前記複数のアンプリコンの各々をシーケンシングすることを含む、請求項50に記載の方法。
  52. 前記アダプター配列の第1の対が、前記第1の固有のバーコード配列及びその逆相補体を第2の固有のバーコード配列及びその逆相補体から分離する、請求項50に記載の方法。
  53. 工程bにおいて検出することが、前記アダプター配列の第1の対、前記第1の固有のバーコード配列及びその逆相補体、前記第2の固有のバーコード配列及びその逆相補体を含む前記複数のアンプリコンの各々をシーケンシングすることを含む、請求項52に記載の方法。
  54. 工程bにおいて検出することが、アダプター配列の第2の対をシーケンシングすることをさらに含む、請求項52に記載の方法。
  55. 前記工程bにおいて検出することが、一連のプログラムを用いてシーケンシングデータファイルを読み取ることによって行われる、請求項50~54のいずれか一項に記載の方法。
  56. 前記シーケンシングデータファイルがFASTA/FASTQフォーマットである、請求項55に記載の方法。
  57. 前記一連のプログラムが、HMMER/Infernalアラインメントエンジンを含む、請求項55に記載の方法。
  58. 工程dにおける前記検出することが、1つ以上の参照配列との多重配列アラインメントを行うことを含む、請求項50~54のいずれか一項に記載の方法。
  59. 前記配列アラインメントが、HMMプロファイル隠れマルコフモデル(HMM)エンジン、共分散モデル(CM)エンジン又はそれらの組み合わせによって行われる、請求項58に記載の方法。
  60. 前記配列変異体を感染の診断又は予後と相関させることをさらに含む、請求項50に記載の方法。
  61. 前記感染が、RNAウイルス、DNAウイルス、真菌、寄生生物及び細菌からなる群から選択される1つ又は複数の病原体によって引き起こされる、請求項60に記載の方法。
  62. 前記病原体が、アシネトバクター・バウマンニ(Acinetobacter baumannii)、アデノウイルス、アフリカ馬疫ウイルス、アフリカ豚コレラウイルス、ズビニ鉤虫(Anclostoma duodenale)、回虫、黄色アスペルギルス、アスペルギルス・フミガーツス(Aspergillus fumigatus)、アスペルギルス・ニガー(Aspergillus niger)、アスペルギルス・オリゼ(Aspergillus oryzae)、鳥インフルエンザウイルス、炭疽菌、炭疽菌パスツール株、セレウス菌、ウシ流産菌、ブルセラ・メリテンシス(Brucella melitensis)、ブルセラ・スイス(Brucella suis)、鼻疽菌、類鼻疽菌、カンジダ・アルビカンス(Candida albicans)、カンジダ・ドゥブリニエンシス(Candida dubliniensis)、カンジダ・グラブラタ(Candida glabrata)、カンジダ・クルセイ(Candida krusei)、カンジダ・トロピカリス(Candida tropicalis)、クラミジア・ニューモニエ(Chlamydia pneumoneae)、クラミジア・トラコマチス(Chlamydia trachomatous)、豚熱ウイルス、クロストリジウム・ディフィシール(Clostridium difficile)、コクシジオイデス・イミティス(Coccidioides immitis)、コクシジオイデス・ポサダシ(Coccidioides posadasii)、CoV-229E、CoV-HKU1、CoV-NL63、CoV-OC43、コクサッキーウイルスA、コクサッキーウイルスB、コクシエラ・バーネッティ(Coxiella burnetii)、クリミア・コンゴ出血熱、サイトメガロウイルス、デングウイルス、メジナ虫、東部馬脳炎、エボラウイルス、い粒条虫、多包条虫、エンテロバクター・クロアカ、エンテロコッカス・フェシウム(Enterococcus faecium)、エンテロウイルス、エプスタイン・バール・ウイルス、大腸菌、巨大肝蛭、肝蛭、***ウイルス、野兎病菌、山羊痘ウイルス、ヘモフィルス属インフルエンザ、ヘリコバクターピロリ、ヘンドラウイルス、A型肝炎ウイルス、B型肝炎ウイルス、C型肝炎ウイルス、ヒストプラスマ・カプスラーツム(Histoplasma capsulatum)、ズボアジ型ヒストプラスマ症(Histoplasma duboisii)、ヒトヘルペスウイルスHHV6、ヒトヘルペスウイルスHHV7、ヒトヘルペスウイルスHHV8、ヒトヘルペスウイルスHSV1、ヒトヘルペスウイルスHSV2、ヒト免疫不全ウイルス、ヒトパピローマウイルス、インフルエンザウイルスA型、インフルエンザウイルスB型、クレブシェラ肺炎桿菌、キャサヌール森林病ウイルス、ラッサ熱ウイルス、レジオネラ・ニューモフィラ菌、リーシュマニア・プロマスティゴート(Leishmania promastigotes)、Lujoウイルス、ランピースキン病ウイルス、マールブルグウイルス、麻疹ウイルス、メチシリン耐性黄色ブドウ球菌、サル痘ウイルス、ムンプスウイルス、マイコバクテリウム・アブセッサス(Mycobacterium abscessus)、マイコバクテリウム・アビウム(Mycobacterium avium)、マイコバクテリウム・ボビス(Mycobacterium bovis)、マイコバクテリウム・カヌッティイ(Mycobacterium canettii)、マイコバクテリウム・レプレ(Mycobacterium leprae)、ヒト結核菌、マイコバクテリウム・ウルセランス(Mycobacterium ulcerans)、マイコプラズマ・カプリコルム(Mycoplasma capricolum)、マイコプラズマ・ミコイデス(Mycoplasma mycoides)、マイコプラズマ・ニューモニア(Mycoplasma pneumoneae)、アメリカ十二指腸虫、淋病、ニューカッスル病ウイルス、ニパウイルス、ノルカジア属beijingensis、ノルカジア属cyriacigeorgica、ノルカジア属farcinica、ノロウイルスGI、ノロウイルスGII、ノーウォークウイルス、オムスク出血熱ウイルス、回旋糸状虫、発癌性ヒトパピローマウイルス、パラインフルエンザウイルス、寄生生物、マルネッフェイ型ペニシリウム症(Penicilliosis mameffei)、小反芻獣疫ウイルス、ニューモシスチス・イロベチイ(Pneumocystis jirovecii)、ポリオーマウイルス、プロテウス・ミラビリス(Proteus mirabilis)、緑膿菌、狂犬病ウイルス、8つの遺伝子断片すべてのコーディング領域の任意の部分を含有する、1918年のパンデミックインフルエンザウイルスの再構築された複製コンピテント形態、呼吸器合胞体ウイルス、ライノウイルス、発疹チフスリケッチア、リフトバレー熱ウイルス、牛疫ウイルス、ロタウイルスA、ロタウイルスB、ロタウイルスC、ロタウイルスG2、風疹ウイルス、SARS関連コロナウイルス(SARS-CoV)、SARS-CoV-1、SARS-CoV-2、ビルハルツ住血吸虫、日本住血吸虫、マンソン住血吸虫、羊痘ウイルス、南米出血熱ウイルスチャパレ、南米出血熱ウイルスグアナリト、南米出血熱ウイルスフニン、南米出血熱ウイルスマチュポ、南米出血熱ウイルスサビア、黄色ブドウ球菌、スタフィロコッカス・サプロフィティカス(Staphylococcus saprophyticus)、肺炎レンサ球菌、豚水疱病ウイルス、有鉤条虫、ダニ媒介性脳炎複合(flavi)ウイルス極東亜型、ダニ媒介性脳炎複合(flavi)ウイルスシベリア亜型、タバコモザイク病ウイルス、トルクテノウイルス、鞭虫、ブルーストリパノソーマ(Trypanosoma bmcei)、トリパノソーマ・クルージ(Trypanosoma cruzi)、大痘瘡ウイルス(天然痘ウイルス)、小痘瘡ウイルス(アラストリム)、ベネズエラ馬脳炎ウイルス、バンクロフト糸状虫、ペスト菌、及び上記の病原体のいずれか1つと特徴的な核酸配列を共有する病原体からなる群から選択される、請求項61に記載の方法。
  63. 病原体がSAR-CoV-2である、請求項62に記載の方法。
  64. 前記配列変異体が、Sタンパク質、Sタンパク質のRBD、S1タンパク質、S2タンパク質、E遺伝子、S遺伝子、Orflab遺伝子、N末端スパイクタンパク質ドメイン、全タンパク質(S1+S2)、及びNタンパク質からなる群から選択される抗原をエンコードする領域にある、請求項63に記載の方法。
  65. 前記配列変異体が、T95I、D253G、L452R、E484K、S477N、N501Y D614G及びA701Vからなる群より選択される変異を含む、請求項64に記載の方法。
  66. 前記複数のアンプリコンを検出することが、
    a.前記複数のアンプリコンのプールされた配列データセットを得る工程であって、各アンプリコン上の各固有のバーコード配列及びその逆相補体が単一の試料に固有であり、第1の単一試料からの各アンプリコンの前記固有のバーコード配列及びその逆相補体が、前記複数のアンプリコン中の他のアンプリコンの前記固有のバーコード配列及びそれらの逆相補体とは異なる、工程;
    b.ベースコールを実行する工程;
    c.前記複数のアンプリコンの配列データを、予め定義されたアノテーション付きHMM又はCM遺伝子モデルにアラインメントする工程;
    d.前記HMM/CMアラインメントの各々にランクを割り当てる工程であって、前記ランクが確率スコア又はビットスコアである、工程;
    e.前記配列データをフィルタリングして、各アンプリコン内の前記バーコード並びに前記アンプリコンの配列内の前記バーコード及び前記アダプターの位置を示す、位置的にアノテーションされた配列アラインメントを得る工程;及び
    f.適切にプログラムされたコンピュータを使用して少なくとも工程b、c、d、及びeを実行する工程を含む、請求項1、36又は50のいずれか一項に記載の方法。
  67. 前記ベースコールが、高精度ONT GPUに基づくベースコーラーで実行される、請求項66に記載の方法。
  68. 前記ベースコールが生のFASTA/FASTQファイルをもたらす、請求項66に記載の方法。
  69. 前記アラインメントが、プロファイルHMMエンジン、CMエンジン、又はそれらの組み合わせによって実行される、請求項66に記載の方法。
  70. 前記HMMエンジン、前記CMエンジン又はこれらの組み合わせが、前記バーコード、前記標的増幅領域、前記プライマー、及び前記アダプターからなる群から選択される1つ又は複数の配列特徴についてヌクレオチドごとのアノテーションを割り当てる、請求項69に記載の方法。
  71. 前記HMMエンジンが、複数の配列アラインメントをもたらすHMMERソフトウェアプログラムを含む、請求項69に記載の方法。
  72. 前記複数の配列アラインメントが、前記第1の固有のバーコード配列及びその逆相補体のためのアノテーションを含む、請求項71に記載の方法。
  73. 前記フィルタリングが、前記第1の固有のバーコード配列及びその逆相補体を有する前記配列アラインメントに合格スコア又は不合格スコアを割り当てることを含み、前記第1の固有のバーコード配列及びその逆相補体を有する前記複数の配列アラインメントには、それらが参照バーコード化配列のセットに対する最小レーベンシュタイン距離スコアを合格する場合、及びそれらがアラインメントについての最小ビットスコア閾値を合格する場合、合格スコアが割り当てられる、請求項72に記載の方法。
  74. 前記複数の配列アラインメントが、ヌクレオチドごとに二重バーコードについてのアノテーションを含み、前記二重バーコードが、第1の固有のバーコード配列及びその逆相補体と、第2の固有のバーコード配列及びその逆相補体とを含む、請求項71に記載の方法。
  75. 前記HMMERソフトウェアプログラムが、前記アダプター配列の第1の対についてのアノテーションを有する配列アラインメントをもたらす、請求項71に記載の方法。
  76. 前記フィルタリングが、前記二重バーコードを有する前記配列アラインメントに合格スコア又は不合格スコアを割り当てることを含み、前記二重バーコードを有する前記複数の配列アラインメントには、それらが参照バーコード化配列のセットに対する最小レーベンシュタイン距離スコアを合格する場合、及びそれらがアラインメントについての最小ビットスコア閾値を合格する場合、合格スコアが割り当てられる、請求項74に記載の方法。
  77. 前記合格スコアを有する前記配列アラインメントが中央データベースに記憶される、請求項73又は76のいずれか一項に記載の方法。
  78. 前記合格スコアを有する前記配列アラインメントが、前記試料中の病原体負荷の直接的な定量的表示に対応する、請求項77に記載の方法。
  79. 前記データベースが、
    試料コレクションチューブに割り当てられた固有のバーコードの情報;
    各固有のバーコードが各試料に割り当てられている、少なくとも96個の固有のウェルバーコードのセットの情報;
    各固有のバーコードが固有のプレートに割り当てられている、少なくとも96個の固有のプレートバーコードのセットの情報;
    前記複数のアンプリコンからのシーケンシングデータを含む配列データのセットの情報;及び
    各試料のソース識別情報、及び前記試料が前記標的タンパク質の存在について陽性であるか陰性であるかに関する情報を含むレポートを含む、請求項77に記載の方法。
  80. 前記レポートを対応する対象、又は診療所又は医師に提供することをさらに含み、前記試料が対象から得られる、請求項79に記載の方法。
  81. アンプリコンを含む組成物であって、前記アンプリコンが、第1の固有のバーコード配列及びその逆相補体、標的特異的プライマーの対、標的増幅領域及びアダプター配列の第1の対を含み、前記標的特異的プライマーの対がフォワードプライマー及びリバースプライマーで構成され、それぞれが前記標的増幅領域内の前記プライミング部位に相補的な配列を有し、前記フォワードプライマー及び前記リバースプライマーのそれぞれが前記標的増幅領域に隣接し、前記標的特異的プライマーが前記第1の固有のバーコード配列及びその逆相補体に隣接し、前記第1の固有のバーコード配列及びその逆相補体が前記アダプター配列の第1の対に隣接する、組成物。
  82. 第2の固有のバーコード配列及びその逆相補体並びにアダプター配列の第2の対をさらに含み、前記第2の固有のバーコード配列及びその逆相補体並びに前記アダプター配列の第2の対が、前記アンプリコンにライゲーションされている、請求項81に記載の組成物。
  83. アダプター配列の第1の対が前記アダプター配列の第2の対に隣接し、前記アダプター配列の第2の対が前記第2の固有のバーコード配列及びその逆相補体に隣接する、請求項82に記載の組成物。
  84. 前記標的増幅領域が、遺伝子又はタンパク質についてエンコードする病原体のゲノム領域から増幅され、前記病原体が、アシネトバクター・バウマンニ(Acinetobacter baumannii)、アデノウイルス、アフリカ馬疫ウイルス、アフリカ豚コレラウイルス、ズビニ鉤虫(Anclostoma duodenale)、回虫、黄色アスペルギルス、アスペルギルス・フミガーツス(Aspergillus fumigatus)、アスペルギルス・ニガー(Aspergillus niger)、アスペルギルス・オリゼ(Aspergillus oryzae)、鳥インフルエンザウイルス、炭疽菌、炭疽菌パスツール株、セレウス菌、ウシ流産菌、ブルセラ・メリテンシス(Brucella melitensis)、ブルセラ・スイス(Brucella suis)、鼻疽菌、類鼻疽菌、カンジダ・アルビカンス(Candida albicans)、カンジダ・ドゥブリニエンシス(Candida dubliniensis)、カンジダ・グラブラタ(Candida glabrata)、カンジダ・クルセイ(Candida krusei)、カンジダ・トロピカリス(Candida tropicalis)、クラミジア・ニューモニエ(Chlamydia pneumoneae)、クラミジア・トラコマチス(Chlamydia trachomatous)、豚熱ウイルス、クロストリジウム・ディフィシール(Clostridium difficile)、コクシジオイデス・イミティス(Coccidioides immitis)、コクシジオイデス・ポサダシ(Coccidioides posadasii)、CoV-229E、CoV-HKU1、CoV-NL63、CoV-OC43、コクサッキーウイルスA、コクサッキーウイルスB、コクシエラ・バーネッティ(Coxiella burnetii)、クリミア・コンゴ出血熱、サイトメガロウイルス、デングウイルス、メジナ虫、東部馬脳炎、エボラウイルス、い粒条虫、多包条虫、エンテロバクター・クロアカ、エンテロコッカス・フェシウム(Enterococcus faecium)、エンテロウイルス、エプスタイン・バール・ウイルス、大腸菌、巨大肝蛭、肝蛭、***ウイルス、野兎病菌、山羊痘ウイルス、ヘモフィルス属インフルエンザ、ヘリコバクターピロリ、ヘンドラウイルス、A型肝炎ウイルス、B型肝炎ウイルス、C型肝炎ウイルス、ヒストプラスマ・カプスラーツム(Histoplasma capsulatum)、ズボアジ型ヒストプラスマ症(Histoplasma duboisii)、ヒトヘルペスウイルスHHV6、ヒトヘルペスウイルスHHV7、ヒトヘルペスウイルスHHV8、ヒトヘルペスウイルスHSV1、ヒトヘルペスウイルスHSV2、ヒト免疫不全ウイルス、ヒトパピローマウイルス、インフルエンザウイルスA型、インフルエンザウイルスB型、クレブシェラ肺炎桿菌、キャサヌール森林病ウイルス、ラッサ熱ウイルス、レジオネラ・ニューモフィラ菌、リーシュマニア・プロマスティゴート(Leishmania promastigotes)、Lujoウイルス、ランピースキン病ウイルス、マールブルグウイルス、麻疹ウイルス、メチシリン耐性黄色ブドウ球菌、サル痘ウイルス、ムンプスウイルス、マイコバクテリウム・アブセッサス(Mycobacterium abscessus)、マイコバクテリウム・アビウム(Mycobacterium avium)、マイコバクテリウム・ボビス(Mycobacterium bovis)、マイコバクテリウム・カヌッティイ(Mycobacterium canettii)、マイコバクテリウム・レプレ(Mycobacterium leprae)、ヒト結核菌、マイコバクテリウム・ウルセランス(Mycobacterium ulcerans)、マイコプラズマ・カプリコルム(Mycoplasma capricolum)、マイコプラズマ・ミコイデス(Mycoplasma mycoides)、マイコプラズマ・ニューモニア(Mycoplasma pneumoneae)、アメリカ十二指腸虫、淋病、ニューカッスル病ウイルス、ニパウイルス、ノルカジア属beijingensis、ノルカジア属cyriacigeorgica、ノルカジア属farcinica、ノロウイルスGI、ノロウイルスGII、ノーウォークウイルス、オムスク出血熱ウイルス、回旋糸状虫、発癌性ヒトパピローマウイルス、パラインフルエンザウイルス、寄生生物、マルネッフェイ型ペニシリウム症(Penicilliosis mameffei)、小反芻獣疫ウイルス、ニューモシスチス・イロベチイ(Pneumocystis jirovecii)、ポリオーマウイルス、プロテウス・ミラビリス(Proteus mirabilis)、緑膿菌、狂犬病ウイルス、8つの遺伝子断片すべてのコーディング領域の任意の部分を含有する、1918年のパンデミックインフルエンザウイルスの再構築された複製コンピテント形態、呼吸器合胞体ウイルス、ライノウイルス、発疹チフスリケッチア、リフトバレー熱ウイルス、牛疫ウイルス、ロタウイルスA、ロタウイルスB、ロタウイルスC、ロタウイルスG2、風疹ウイルス、SARS関連コロナウイルス(SARS-CoV)、SARS-CoV-1、SARS-CoV-2、ビルハルツ住血吸虫、日本住血吸虫、マンソン住血吸虫、羊痘ウイルス、南米出血熱ウイルスチャパレ、南米出血熱ウイルスグアナリト、南米出血熱ウイルスフニン、南米出血熱ウイルスマチュポ、南米出血熱ウイルスサビア、黄色ブドウ球菌、スタフィロコッカス・サプロフィティカス(Staphylococcus saprophyticus)、肺炎レンサ球菌、豚水疱病ウイルス、有鉤条虫、ダニ媒介性脳炎複合(flavi)ウイルス極東亜型、ダニ媒介性脳炎複合(flavi)ウイルスシベリア亜型、タバコモザイク病ウイルス、トルクテノウイルス、鞭虫、ブルーストリパノソーマ(Trypanosoma brucei)、トリパノソーマ・クルージ(Trypanosoma cruzi)、大痘瘡ウイルス(天然痘ウイルス)、小痘瘡ウイルス(アラストリム)、ベネズエラ馬脳炎ウイルス、バンクロフト糸状虫、ペスト菌、及び上記の病原体のいずれか1つと特徴的な核酸配列を共有する病原体からなる群から選択される、請求項81~83のいずれか一項に記載の組成物。
  85. 前記病原体がSARS-CoV-2である、請求項84に記載の組成物。
  86. 前記標的増幅領域が、Sタンパク質、Sタンパク質のRBD、S1タンパク質、S2タンパク質、E遺伝子、S遺伝子、Orflab遺伝子、N末端スパイクタンパク質ドメイン、全タンパク質(S1+S2)、及びNタンパク質からなる群から選択されるタンパク質についてエンコードするゲノム領域から増幅される、請求項85に記載の組成物。
  87. 前記標的増幅領域が、前記Sタンパク質をエンコードする領域から増幅される、請求項86に記載の組成物。
  88. 前記標的増幅領域が、前記Sタンパク質の前記RBDをエンコードする領域から増幅される、請求項86に記載の組成物。
  89. 前記標的増幅領域が、前記Nタンパク質をエンコードする領域から増幅される、請求項86に記載の組成物。
  90. 前記固有のバーコード配列及びそれらの逆相補体が、他のすべてのバーコードからの最大レーベンシュタイン距離を有する、請求項81~89のいずれか一項に記載の組成物。
  91. 前記固有のバーコード配列が、配列番号23-118に示される前記ポリヌクレオチド配列のいずれか1つを含む、請求項90に記載の組成物。
  92. 前記標的特異的プライマーの対が、
    フォワードプライマー:GACCCCAAAATCAGCGAAAT(配列番号3)及びリバースプライマー:TCTGGTTACTGCCAGTTGAATCTG(配列番号4);
    フォワードプライマー:TTACAAACATTGGCCGCAAA(配列番号5)及びリバースプライマー:GCGCGACATTCCGAAGAA(配列番号6);
    フォワードプライマー:GGGAGCCTTGAATACACCAAAA(配列番号7)及びリバースプライマー:TGTAGCACGATTGCAGCATTG(配列番号8);
    フォワードプライマー:GTGARATGGTCATGTGTGGCGG(配列番号9)及びリバースプライマー:CARATGTTAAASACACTATTAGCATA(配列番号10);
    フォワードプライマー:ACAGGTACGTTAATAGTTAATAGCGT(配列番号11)及びリバースプライマー:ATATTGCAGCAGTACGCACACA(配列番号12);
    フォワードプライマー:CCCTGTGGGTTTTACACTTAA(配列番号13)及びリバースプライマー:ACGATTGTGCATCAGCTGA(配列番号14);
    フォワードプライマー:GTACTCATTCGTTTCGGAAGAG(配列番号15)及びリバースプライマー:CCAGAAGATCAGGAACTCTAGA(配列番号16);
    フォワードプライマー:GGGGAACTTCTCCTGCTAGAAT(配列番号17)及びリバースプライマー:CAGACATTTTGCTCTCAAGCTG(配列番号18);並びに
    フォワードプライマー:AGATTTGGACCTGCGAGCG(配列番号19)及びリバースプライマー:GAGCGGCTGTCTCCACAAGT(配列番号20)からなるフォワードプライマー及びリバースプライマーの群から選択される、請求項85~89のいずれか一項に記載の組成物。
  93. 前記アダプター配列の第1の対及び前記アダプター配列の第2の対が同一であり、10~15ヌクレオチドを含む、請求項81~83のいずれか一項に記載の組成物。
  94. 前記アダプター配列の対が10ヌクレオチドを含む、請求項93に記載の組成物。
  95. 前記アダプター配列の対が、ACACTGACGACATGGTTCTACA(配列番号21)及びTACGGTAGCAGAGACTTGGTCT(配列番号22)に示すポリヌクレオチド配列を含む、請求項94に記載の組成物。

JP2022558526A 2020-03-24 2021-03-24 病原体を検出するためのアッセイ Pending JP2023519919A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202062994173P 2020-03-24 2020-03-24
US62/994,173 2020-03-24
PCT/IB2021/052463 WO2021191829A1 (en) 2020-03-24 2021-03-24 Assays for detecting pathogens

Publications (1)

Publication Number Publication Date
JP2023519919A true JP2023519919A (ja) 2023-05-15

Family

ID=77890210

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022558526A Pending JP2023519919A (ja) 2020-03-24 2021-03-24 病原体を検出するためのアッセイ

Country Status (5)

Country Link
US (1) US20240240267A1 (ja)
EP (1) EP4127233A1 (ja)
JP (1) JP2023519919A (ja)
CA (1) CA3173190A1 (ja)
WO (1) WO2021191829A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230183823A1 (en) * 2020-04-30 2023-06-15 The Trustees Of Indiana University Methods to detect a virus in a biological sample
CN114351261B (zh) * 2022-02-28 2023-12-15 江苏先声医学诊断有限公司 基于纳米孔测序平台的呼吸道样本难检病原微生物的检测方法
CN117447601B (zh) * 2023-12-22 2024-03-08 北京索莱宝科技有限公司 猪IgM的抗体、抗体组合物及其应用

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040157220A1 (en) * 2003-02-10 2004-08-12 Purnima Kurnool Methods and apparatus for sample tracking
CA2867293C (en) * 2012-03-13 2020-09-01 Abhijit Ajit PATEL Measurement of nucleic acid variants using highly-multiplexed error-suppressed deep sequencing
WO2013188471A2 (en) * 2012-06-11 2013-12-19 Sequenta, Inc. Method of sequence determination using sequence tags
US10691775B2 (en) * 2013-01-17 2020-06-23 Edico Genome, Corp. Bioinformatics systems, apparatuses, and methods executed on an integrated circuit processing platform
US10233490B2 (en) * 2014-11-21 2019-03-19 Metabiotech Corporation Methods for assembling and reading nucleic acid sequences from mixed populations
NZ759895A (en) * 2017-06-07 2023-05-26 Illumina Inc Single cell whole genome libraries for methylation sequencing

Also Published As

Publication number Publication date
US20240240267A1 (en) 2024-07-18
WO2021191829A1 (en) 2021-09-30
CA3173190A1 (en) 2021-09-30
EP4127233A1 (en) 2023-02-08

Similar Documents

Publication Publication Date Title
US11866777B2 (en) Error suppression in sequenced DNA fragments using redundant reads with unique molecular indices (UMIS)
US11898198B2 (en) Universal short adapters with variable length non-random unique molecular identifiers
JP2022088566A (ja) 不均一分子長を有するユニーク分子インデックスセットの生成およびエラー補正のための方法およびシステム
US20130261196A1 (en) Nucleic Acids For Multiplex Organism Detection and Methods Of Use And Making The Same
JP2023519919A (ja) 病原体を検出するためのアッセイ
JP6265891B2 (ja) ヌクレオチド配列データの提供
US20080228406A1 (en) System and method for fungal identification
WO2021250617A1 (en) A rapid multiplex rpa based nanopore sequencing method for real-time detection and sequencing of multiple viral pathogens
US20220356535A1 (en) Pathogen diagnostic test
US20200208140A1 (en) Methods of making and using tandem, twin barcode molecules
KR20220021674A (ko) 중증열성혈소판감소증후군 바이러스 검출용 프라이머 세트 및 이를 이용한 진단용 키트

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221206