JP2023519919A - 病原体を検出するためのアッセイ - Google Patents
病原体を検出するためのアッセイ Download PDFInfo
- Publication number
- JP2023519919A JP2023519919A JP2022558526A JP2022558526A JP2023519919A JP 2023519919 A JP2023519919 A JP 2023519919A JP 2022558526 A JP2022558526 A JP 2022558526A JP 2022558526 A JP2022558526 A JP 2022558526A JP 2023519919 A JP2023519919 A JP 2023519919A
- Authority
- JP
- Japan
- Prior art keywords
- virus
- sequence
- sequences
- cov
- amplicons
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 244000052769 pathogen Species 0.000 title claims abstract description 92
- 238000003556 assay Methods 0.000 title description 24
- 238000000034 method Methods 0.000 claims abstract description 302
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 162
- 239000000523 sample Substances 0.000 claims abstract description 153
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 142
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 142
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 142
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 91
- 239000000203 mixture Substances 0.000 claims abstract description 57
- 230000001717 pathogenic effect Effects 0.000 claims abstract description 54
- 239000012472 biological sample Substances 0.000 claims abstract description 40
- 208000015181 infectious disease Diseases 0.000 claims abstract description 27
- 108091093088 Amplicon Proteins 0.000 claims description 229
- 230000002441 reversible effect Effects 0.000 claims description 156
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 139
- 230000003321 amplification Effects 0.000 claims description 137
- 241000700605 Viruses Species 0.000 claims description 136
- 230000000295 complement effect Effects 0.000 claims description 124
- 238000012163 sequencing technique Methods 0.000 claims description 94
- 239000002773 nucleotide Substances 0.000 claims description 92
- 125000003729 nucleotide group Chemical group 0.000 claims description 88
- 102000040430 polynucleotide Human genes 0.000 claims description 71
- 108091033319 polynucleotide Proteins 0.000 claims description 71
- 239000002157 polynucleotide Substances 0.000 claims description 71
- 108091034117 Oligonucleotide Proteins 0.000 claims description 67
- 241000282414 Homo sapiens Species 0.000 claims description 66
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 62
- 241001529453 unidentified herpesvirus Species 0.000 claims description 55
- 208000003829 American Hemorrhagic Fever Diseases 0.000 claims description 53
- 241001678559 COVID-19 virus Species 0.000 claims description 50
- 239000011324 bead Substances 0.000 claims description 49
- 108020004414 DNA Proteins 0.000 claims description 46
- 230000027455 binding Effects 0.000 claims description 44
- 108020004635 Complementary DNA Proteins 0.000 claims description 35
- 239000002299 complementary DNA Substances 0.000 claims description 33
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 28
- 241000606161 Chlamydia Species 0.000 claims description 24
- 238000002864 sequence alignment Methods 0.000 claims description 24
- 241000711573 Coronaviridae Species 0.000 claims description 23
- 238000006243 chemical reaction Methods 0.000 claims description 23
- 241000709661 Enterovirus Species 0.000 claims description 22
- 241000701806 Human papillomavirus Species 0.000 claims description 22
- 241000191967 Staphylococcus aureus Species 0.000 claims description 22
- 241000193738 Bacillus anthracis Species 0.000 claims description 21
- 102000008394 Immunoglobulin Fragments Human genes 0.000 claims description 21
- 108010021625 Immunoglobulin Fragments Proteins 0.000 claims description 21
- 239000013641 positive control Substances 0.000 claims description 21
- 208000004006 Tick-borne encephalitis Diseases 0.000 claims description 20
- 239000003795 chemical substances by application Substances 0.000 claims description 20
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 20
- 241001493065 dsRNA viruses Species 0.000 claims description 20
- 241000712461 unidentified influenza virus Species 0.000 claims description 20
- 239000000427 antigen Substances 0.000 claims description 19
- 108091007433 antigens Proteins 0.000 claims description 19
- 102000036639 antigens Human genes 0.000 claims description 19
- 208000001203 Smallpox Diseases 0.000 claims description 18
- 101710198474 Spike protein Proteins 0.000 claims description 18
- 241000700647 Variola virus Species 0.000 claims description 18
- 238000003491 array Methods 0.000 claims description 18
- 229940065181 bacillus anthracis Drugs 0.000 claims description 18
- 201000010099 disease Diseases 0.000 claims description 18
- 230000001018 virulence Effects 0.000 claims description 18
- 102100031673 Corneodesmosin Human genes 0.000 claims description 17
- 101710139375 Corneodesmosin Proteins 0.000 claims description 17
- 229940096437 Protein S Drugs 0.000 claims description 17
- 238000012165 high-throughput sequencing Methods 0.000 claims description 17
- 244000045947 parasite Species 0.000 claims description 17
- 230000035772 mutation Effects 0.000 claims description 16
- 201000003176 Severe Acute Respiratory Syndrome Diseases 0.000 claims description 15
- 238000002887 multiple sequence alignment Methods 0.000 claims description 15
- 241000228245 Aspergillus niger Species 0.000 claims description 14
- 241000242722 Cestoda Species 0.000 claims description 14
- 241000242711 Fasciola hepatica Species 0.000 claims description 14
- 210000004369 blood Anatomy 0.000 claims description 14
- 239000008280 blood Substances 0.000 claims description 14
- 208000006275 fascioliasis Diseases 0.000 claims description 14
- 210000003296 saliva Anatomy 0.000 claims description 14
- 241000712431 Influenza A virus Species 0.000 claims description 13
- 241000223109 Trypanosoma cruzi Species 0.000 claims description 13
- 238000005096 rolling process Methods 0.000 claims description 13
- 241000228212 Aspergillus Species 0.000 claims description 12
- 241000222178 Candida tropicalis Species 0.000 claims description 12
- 241000223205 Coccidioides immitis Species 0.000 claims description 12
- 241000186359 Mycobacterium Species 0.000 claims description 12
- 241001508003 Mycobacterium abscessus Species 0.000 claims description 12
- 241000589517 Pseudomonas aeruginosa Species 0.000 claims description 12
- 241000315672 SARS coronavirus Species 0.000 claims description 12
- 241001147691 Staphylococcus saprophyticus Species 0.000 claims description 12
- 241000222126 [Candida] glabrata Species 0.000 claims description 12
- 208000032343 candida glabrata infection Diseases 0.000 claims description 12
- 241000588626 Acinetobacter baumannii Species 0.000 claims description 11
- 241000120516 African horse sickness virus Species 0.000 claims description 11
- 241000701386 African swine fever virus Species 0.000 claims description 11
- 241001225321 Aspergillus fumigatus Species 0.000 claims description 11
- 240000006439 Aspergillus oryzae Species 0.000 claims description 11
- 235000002247 Aspergillus oryzae Nutrition 0.000 claims description 11
- 241000711404 Avian avulavirus 1 Species 0.000 claims description 11
- 241000193830 Bacillus <bacterium> Species 0.000 claims description 11
- 241000894006 Bacteria Species 0.000 claims description 11
- 241000283690 Bos taurus Species 0.000 claims description 11
- 241001148106 Brucella melitensis Species 0.000 claims description 11
- 241000244203 Caenorhabditis elegans Species 0.000 claims description 11
- 241000222122 Candida albicans Species 0.000 claims description 11
- 241000144583 Candida dubliniensis Species 0.000 claims description 11
- 241000710777 Classical swine fever virus Species 0.000 claims description 11
- 108091026890 Coding region Proteins 0.000 claims description 11
- 241000606678 Coxiella burnetii Species 0.000 claims description 11
- 241000725619 Dengue virus Species 0.000 claims description 11
- 241001319090 Dracunculus medinensis Species 0.000 claims description 11
- 208000006825 Eastern Equine Encephalomyelitis Diseases 0.000 claims description 11
- 201000005804 Eastern equine encephalitis Diseases 0.000 claims description 11
- 241001115402 Ebolavirus Species 0.000 claims description 11
- 206010014587 Encephalitis eastern equine Diseases 0.000 claims description 11
- 241000194031 Enterococcus faecium Species 0.000 claims description 11
- 241000588724 Escherichia coli Species 0.000 claims description 11
- 241000710198 Foot-and-mouth disease virus Species 0.000 claims description 11
- 241001112691 Goatpox virus Species 0.000 claims description 11
- 206010018612 Gonorrhoea Diseases 0.000 claims description 11
- 241000590002 Helicobacter pylori Species 0.000 claims description 11
- 241000893570 Hendra henipavirus Species 0.000 claims description 11
- 241000711549 Hepacivirus C Species 0.000 claims description 11
- 241000700721 Hepatitis B virus Species 0.000 claims description 11
- 241000709721 Hepatovirus A Species 0.000 claims description 11
- 241000228404 Histoplasma capsulatum Species 0.000 claims description 11
- 241001354006 Histoplasma capsulatum var. duboisii Species 0.000 claims description 11
- 241000700588 Human alphaherpesvirus 1 Species 0.000 claims description 11
- 241000701074 Human alphaherpesvirus 2 Species 0.000 claims description 11
- 241001502974 Human gammaherpesvirus 8 Species 0.000 claims description 11
- 241000701027 Human herpesvirus 6 Species 0.000 claims description 11
- 241000725303 Human immunodeficiency virus Species 0.000 claims description 11
- 241000713196 Influenza B virus Species 0.000 claims description 11
- 241000588747 Klebsiella pneumoniae Species 0.000 claims description 11
- 241001466978 Kyasanur forest disease virus Species 0.000 claims description 11
- 206010023927 Lassa fever Diseases 0.000 claims description 11
- 241000589242 Legionella pneumophila Species 0.000 claims description 11
- 241000222722 Leishmania <genus> Species 0.000 claims description 11
- 241001573276 Lujo mammarenavirus Species 0.000 claims description 11
- 241000609846 Lumpy skin disease virus Species 0.000 claims description 11
- 241001115401 Marburgvirus Species 0.000 claims description 11
- 241000712079 Measles morbillivirus Species 0.000 claims description 11
- 241000002163 Mesapamea fractilinea Species 0.000 claims description 11
- RJQXTJLFIWVMTO-TYNCELHUSA-N Methicillin Chemical compound COC1=CC=CC(OC)=C1C(=O)N[C@@H]1C(=O)N2[C@@H](C(O)=O)C(C)(C)S[C@@H]21 RJQXTJLFIWVMTO-TYNCELHUSA-N 0.000 claims description 11
- 241000700627 Monkeypox virus Species 0.000 claims description 11
- 241000711386 Mumps virus Species 0.000 claims description 11
- 241000186366 Mycobacterium bovis Species 0.000 claims description 11
- 241000187917 Mycobacterium ulcerans Species 0.000 claims description 11
- 241000204025 Mycoplasma capricolum Species 0.000 claims description 11
- 241000202936 Mycoplasma mycoides Species 0.000 claims description 11
- 241000532183 Norovirus GI Species 0.000 claims description 11
- 241000532184 Norovirus GII Species 0.000 claims description 11
- 241000714209 Norwalk virus Species 0.000 claims description 11
- 241000725177 Omsk hemorrhagic fever virus Species 0.000 claims description 11
- 208000002606 Paramyxoviridae Infections Diseases 0.000 claims description 11
- 206010064458 Penicilliosis Diseases 0.000 claims description 11
- 241000235645 Pichia kudriavzevii Species 0.000 claims description 11
- 241000142787 Pneumocystis jirovecii Species 0.000 claims description 11
- 241000725643 Respiratory syncytial virus Species 0.000 claims description 11
- 241000606701 Rickettsia Species 0.000 claims description 11
- 241000713124 Rift Valley fever virus Species 0.000 claims description 11
- 241000711897 Rinderpest morbillivirus Species 0.000 claims description 11
- 241001245603 Rotavirus G2 Species 0.000 claims description 11
- 241000710799 Rubella virus Species 0.000 claims description 11
- 241000736032 Sabia <angiosperm> Species 0.000 claims description 11
- 241000242678 Schistosoma Species 0.000 claims description 11
- 241000242677 Schistosoma japonicum Species 0.000 claims description 11
- 241000242680 Schistosoma mansoni Species 0.000 claims description 11
- 241000193998 Streptococcus pneumoniae Species 0.000 claims description 11
- 208000034784 Tularaemia Diseases 0.000 claims description 11
- 241000710959 Venezuelan equine encephalitis virus Species 0.000 claims description 11
- 241000607479 Yersinia pestis Species 0.000 claims description 11
- 229940091771 aspergillus fumigatus Drugs 0.000 claims description 11
- 229940095731 candida albicans Drugs 0.000 claims description 11
- 208000028104 epidemic louse-borne typhus Diseases 0.000 claims description 11
- 229940037467 helicobacter pylori Drugs 0.000 claims description 11
- 229940115932 legionella pneumophila Drugs 0.000 claims description 11
- 229960003085 meticillin Drugs 0.000 claims description 11
- 231100000590 oncogenic Toxicity 0.000 claims description 11
- 230000002246 oncogenic effect Effects 0.000 claims description 11
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 11
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 11
- 229940031000 streptococcus pneumoniae Drugs 0.000 claims description 11
- 206010061393 typhus Diseases 0.000 claims description 11
- 241000701161 unidentified adenovirus Species 0.000 claims description 11
- 201000000627 variola minor Diseases 0.000 claims description 11
- 208000014016 variola minor infection Diseases 0.000 claims description 11
- 241001148111 Brucella suis Species 0.000 claims description 10
- 241000193163 Clostridioides difficile Species 0.000 claims description 10
- 241000709687 Coxsackievirus Species 0.000 claims description 10
- 201000003075 Crimean-Congo hemorrhagic fever Diseases 0.000 claims description 10
- 101150013191 E gene Proteins 0.000 claims description 10
- 241000588697 Enterobacter cloacae Species 0.000 claims description 10
- 241000988559 Enterovirus A Species 0.000 claims description 10
- 241000606768 Haemophilus influenzae Species 0.000 claims description 10
- 241001109669 Human coronavirus HKU1 Species 0.000 claims description 10
- 241000701044 Human gammaherpesvirus 4 Species 0.000 claims description 10
- 241000186367 Mycobacterium avium Species 0.000 claims description 10
- 241000186362 Mycobacterium leprae Species 0.000 claims description 10
- 241000187479 Mycobacterium tuberculosis Species 0.000 claims description 10
- 101001028244 Onchocerca volvulus Fatty-acid and retinol-binding protein 1 Proteins 0.000 claims description 10
- 241001505332 Polyomavirus sp. Species 0.000 claims description 10
- 241000588770 Proteus mirabilis Species 0.000 claims description 10
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 claims description 10
- 241000711798 Rabies lyssavirus Species 0.000 claims description 10
- 241001137860 Rotavirus A Species 0.000 claims description 10
- 241001137861 Rotavirus B Species 0.000 claims description 10
- 241001506005 Rotavirus C Species 0.000 claims description 10
- 241000282849 Ruminantia Species 0.000 claims description 10
- 101150010882 S gene Proteins 0.000 claims description 10
- 229940038698 brucella melitensis Drugs 0.000 claims description 10
- 210000001198 duodenum Anatomy 0.000 claims description 10
- 239000012530 fluid Substances 0.000 claims description 10
- 108020003175 receptors Proteins 0.000 claims description 10
- 102000005962 receptors Human genes 0.000 claims description 10
- 210000004243 sweat Anatomy 0.000 claims description 10
- 241000722910 Burkholderia mallei Species 0.000 claims description 9
- 208000000307 Crimean Hemorrhagic Fever Diseases 0.000 claims description 9
- 241000701022 Cytomegalovirus Species 0.000 claims description 9
- 241000450599 DNA viruses Species 0.000 claims description 9
- 241000233866 Fungi Species 0.000 claims description 9
- 241000526636 Nipah henipavirus Species 0.000 claims description 9
- 241000700665 Sheeppox virus Species 0.000 claims description 9
- 241000709710 Swine vesicular disease virus Species 0.000 claims description 9
- 241000244157 Taenia solium Species 0.000 claims description 9
- 208000001786 gonorrhea Diseases 0.000 claims description 9
- 229920001184 polypeptide Polymers 0.000 claims description 9
- 230000010076 replication Effects 0.000 claims description 9
- 241001312372 Mycobacterium canettii Species 0.000 claims description 8
- 241000723873 Tobacco mosaic virus Species 0.000 claims description 8
- 241000223105 Trypanosoma brucei Species 0.000 claims description 8
- 238000001914 filtration Methods 0.000 claims description 8
- 210000002381 plasma Anatomy 0.000 claims description 8
- 241000193755 Bacillus cereus Species 0.000 claims description 7
- 238000012408 PCR amplification Methods 0.000 claims description 7
- 206010022000 influenza Diseases 0.000 claims description 7
- 210000003097 mucus Anatomy 0.000 claims description 7
- 201000006266 variola major Diseases 0.000 claims description 7
- 206010069748 Burkholderia pseudomallei infection Diseases 0.000 claims description 6
- 241000223203 Coccidioides Species 0.000 claims description 6
- 241000202934 Mycoplasma pneumoniae Species 0.000 claims description 6
- 101710141454 Nucleoprotein Proteins 0.000 claims description 6
- 238000003745 diagnosis Methods 0.000 claims description 6
- 210000003608 fece Anatomy 0.000 claims description 6
- 201000004015 melioidosis Diseases 0.000 claims description 6
- 210000002966 serum Anatomy 0.000 claims description 6
- 210000001138 tear Anatomy 0.000 claims description 6
- 210000002700 urine Anatomy 0.000 claims description 6
- 241001522757 Coccidioides posadasii Species 0.000 claims description 5
- 241000204031 Mycoplasma Species 0.000 claims description 5
- 206010036790 Productive cough Diseases 0.000 claims description 5
- 241000244155 Taenia Species 0.000 claims description 5
- 241000519618 Variola minor virus Species 0.000 claims description 5
- 210000001175 cerebrospinal fluid Anatomy 0.000 claims description 5
- 210000003756 cervix mucus Anatomy 0.000 claims description 5
- 235000020256 human milk Nutrition 0.000 claims description 5
- 210000004251 human milk Anatomy 0.000 claims description 5
- 210000004185 liver Anatomy 0.000 claims description 5
- 210000002751 lymph Anatomy 0.000 claims description 5
- 210000003802 sputum Anatomy 0.000 claims description 5
- 208000024794 sputum Diseases 0.000 claims description 5
- 210000004916 vomit Anatomy 0.000 claims description 5
- 230000008673 vomiting Effects 0.000 claims description 5
- 241000223104 Trypanosoma Species 0.000 claims description 4
- 229940047650 haemophilus influenzae Drugs 0.000 claims description 4
- 230000037452 priming Effects 0.000 claims description 4
- 102000007469 Actins Human genes 0.000 claims description 3
- 108010085238 Actins Proteins 0.000 claims description 3
- 241000709744 Enterobacterio phage MS2 Species 0.000 claims description 3
- 241000208125 Nicotiana Species 0.000 claims description 3
- 235000002637 Nicotiana tabacum Nutrition 0.000 claims description 3
- 241000702670 Rotavirus Species 0.000 claims description 3
- 102220590684 Spindlin-1_T95I_mutation Human genes 0.000 claims description 3
- 238000011534 incubation Methods 0.000 claims description 3
- 238000004393 prognosis Methods 0.000 claims description 3
- 238000005406 washing Methods 0.000 claims description 3
- 108700039887 Essential Genes Proteins 0.000 claims description 2
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 claims description 2
- 241000545744 Hirudinea Species 0.000 claims description 2
- 241000191940 Staphylococcus Species 0.000 claims description 2
- 241000282898 Sus scrofa Species 0.000 claims description 2
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 claims description 2
- 238000011176 pooling Methods 0.000 claims description 2
- 241000935974 Paralichthys dentatus Species 0.000 claims 6
- 208000019423 liver disease Diseases 0.000 claims 3
- 241001647372 Chlamydia pneumoniae Species 0.000 claims 2
- 241000244163 Echinococcus multilocularis Species 0.000 claims 2
- 238000000354 decomposition reaction Methods 0.000 claims 2
- 241000238876 Acari Species 0.000 claims 1
- 208000003495 Coccidiosis Diseases 0.000 claims 1
- 241000606790 Haemophilus Species 0.000 claims 1
- 206010061192 Haemorrhagic fever Diseases 0.000 claims 1
- 102100034343 Integrase Human genes 0.000 claims 1
- 206010023076 Isosporiasis Diseases 0.000 claims 1
- 241001529801 Tick-borne flavivirus Species 0.000 claims 1
- 206010014599 encephalitis Diseases 0.000 claims 1
- 244000059546 zoonotic virus Species 0.000 claims 1
- 108060003951 Immunoglobulin Proteins 0.000 abstract description 5
- 102000018358 immunoglobulin Human genes 0.000 abstract description 5
- 229940072221 immunoglobulins Drugs 0.000 abstract description 4
- 235000018102 proteins Nutrition 0.000 description 47
- 238000001514 detection method Methods 0.000 description 34
- 238000003752 polymerase chain reaction Methods 0.000 description 31
- 238000010804 cDNA synthesis Methods 0.000 description 29
- 125000006850 spacer group Chemical group 0.000 description 27
- 239000012491 analyte Substances 0.000 description 26
- 239000002585 base Substances 0.000 description 24
- 230000003612 virological effect Effects 0.000 description 22
- 238000004422 calculation algorithm Methods 0.000 description 20
- 208000025721 COVID-19 Diseases 0.000 description 17
- 239000003446 ligand Substances 0.000 description 16
- 230000008569 process Effects 0.000 description 16
- 238000005516 engineering process Methods 0.000 description 15
- 108091035707 Consensus sequence Proteins 0.000 description 13
- 238000009396 hybridization Methods 0.000 description 12
- 238000001712 DNA sequencing Methods 0.000 description 11
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 11
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 11
- 241000008910 Severe acute respiratory syndrome-related coronavirus Species 0.000 description 11
- 229920006068 Minlon® Polymers 0.000 description 10
- 239000012634 fragment Substances 0.000 description 10
- 102100031780 Endonuclease Human genes 0.000 description 9
- 230000015572 biosynthetic process Effects 0.000 description 9
- 238000013461 design Methods 0.000 description 9
- 230000003993 interaction Effects 0.000 description 9
- 108020004638 Circular DNA Proteins 0.000 description 8
- 108090001074 Nucleocapsid Proteins Proteins 0.000 description 8
- 238000007481 next generation sequencing Methods 0.000 description 8
- 238000013179 statistical model Methods 0.000 description 8
- 238000003786 synthesis reaction Methods 0.000 description 8
- -1 antibodies Proteins 0.000 description 7
- 210000004027 cell Anatomy 0.000 description 7
- 150000002500 ions Chemical class 0.000 description 7
- 108020004999 messenger RNA Proteins 0.000 description 7
- 239000013610 patient sample Substances 0.000 description 7
- 238000010384 proximity ligation assay Methods 0.000 description 7
- 210000001519 tissue Anatomy 0.000 description 7
- 241001465754 Metazoa Species 0.000 description 6
- 208000036142 Viral infection Diseases 0.000 description 6
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 6
- 230000008901 benefit Effects 0.000 description 6
- 239000003814 drug Substances 0.000 description 6
- 238000002360 preparation method Methods 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 102000053602 DNA Human genes 0.000 description 5
- 102000004190 Enzymes Human genes 0.000 description 5
- 108090000790 Enzymes Proteins 0.000 description 5
- 238000011529 RT qPCR Methods 0.000 description 5
- 238000000137 annealing Methods 0.000 description 5
- 238000007635 classification algorithm Methods 0.000 description 5
- 239000000470 constituent Substances 0.000 description 5
- 238000012217 deletion Methods 0.000 description 5
- 230000037430 deletion Effects 0.000 description 5
- 229940079593 drug Drugs 0.000 description 5
- 238000007672 fourth generation sequencing Methods 0.000 description 5
- 125000005647 linker group Chemical group 0.000 description 5
- 238000000746 purification Methods 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 230000009385 viral infection Effects 0.000 description 5
- 241000523910 Bacillus cereus biovar anthracis Species 0.000 description 4
- 208000035143 Bacterial infection Diseases 0.000 description 4
- 238000002123 RNA extraction Methods 0.000 description 4
- 208000037847 SARS-CoV-2-infection Diseases 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 208000022362 bacterial infectious disease Diseases 0.000 description 4
- 239000000872 buffer Substances 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 239000002245 particle Substances 0.000 description 4
- 102000054765 polymorphisms of proteins Human genes 0.000 description 4
- 230000000241 respiratory effect Effects 0.000 description 4
- 238000010839 reverse transcription Methods 0.000 description 4
- 230000000405 serological effect Effects 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 3
- 241000008904 Betacoronavirus Species 0.000 description 3
- 241000282412 Homo Species 0.000 description 3
- 102000003960 Ligases Human genes 0.000 description 3
- 108090000364 Ligases Proteins 0.000 description 3
- 108700011259 MicroRNAs Proteins 0.000 description 3
- 108091005804 Peptidases Proteins 0.000 description 3
- 239000004365 Protease Substances 0.000 description 3
- 238000012300 Sequence Analysis Methods 0.000 description 3
- 108010006785 Taq Polymerase Proteins 0.000 description 3
- 241000726423 Variola major virus Species 0.000 description 3
- 244000052616 bacterial pathogen Species 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 238000004925 denaturation Methods 0.000 description 3
- 230000036425 denaturation Effects 0.000 description 3
- 230000036541 health Effects 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 238000007403 mPCR Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 239000002679 microRNA Substances 0.000 description 3
- 238000010369 molecular cloning Methods 0.000 description 3
- 230000003472 neutralizing effect Effects 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000012124 rapid diagnostic test Methods 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 230000028327 secretion Effects 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 238000011282 treatment Methods 0.000 description 3
- 229960005486 vaccine Drugs 0.000 description 3
- 206010069747 Burkholderia mallei infection Diseases 0.000 description 2
- 241000589876 Campylobacter Species 0.000 description 2
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 2
- 208000003322 Coinfection Diseases 0.000 description 2
- 108091028732 Concatemer Proteins 0.000 description 2
- 108010008286 DNA nucleotidylexotransferase Proteins 0.000 description 2
- 230000006820 DNA synthesis Effects 0.000 description 2
- 102100029764 DNA-directed DNA/RNA polymerase mu Human genes 0.000 description 2
- 206010012735 Diarrhoea Diseases 0.000 description 2
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 2
- 201000003641 Glanders Diseases 0.000 description 2
- 208000032843 Hemorrhage Diseases 0.000 description 2
- 108700005091 Immunoglobulin Genes Proteins 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- 241000127282 Middle East respiratory syndrome-related coronavirus Species 0.000 description 2
- 102000035195 Peptidases Human genes 0.000 description 2
- 238000010802 RNA extraction kit Methods 0.000 description 2
- 238000012952 Resampling Methods 0.000 description 2
- 241000607142 Salmonella Species 0.000 description 2
- 241000607768 Shigella Species 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- 241000194017 Streptococcus Species 0.000 description 2
- 108020004566 Transfer RNA Proteins 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical group O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 108700005077 Viral Genes Proteins 0.000 description 2
- DZBUGLKDJFMEHC-UHFFFAOYSA-N acridine Chemical compound C1=CC=CC2=CC3=CC=CC=C3N=C21 DZBUGLKDJFMEHC-UHFFFAOYSA-N 0.000 description 2
- 150000001413 amino acids Chemical group 0.000 description 2
- 206010064097 avian influenza Diseases 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 210000001124 body fluid Anatomy 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 108091036078 conserved sequence Proteins 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 230000034994 death Effects 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 208000035475 disorder Diseases 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000007429 general method Methods 0.000 description 2
- 244000144980 herd Species 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- 239000001257 hydrogen Substances 0.000 description 2
- 230000001976 improved effect Effects 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 239000006166 lysate Substances 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 239000013612 plasmid Substances 0.000 description 2
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Chemical compound [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 2
- ZCCUUQDIBDJBTK-UHFFFAOYSA-N psoralen Chemical compound C1=C2OC(=O)C=CC2=CC2=C1OC=C2 ZCCUUQDIBDJBTK-UHFFFAOYSA-N 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 239000012429 reaction media Substances 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 108020004418 ribosomal RNA Proteins 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 239000001509 sodium citrate Substances 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 230000009870 specific binding Effects 0.000 description 2
- 201000010740 swine influenza Diseases 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical group CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 238000011269 treatment regimen Methods 0.000 description 2
- 244000052613 viral pathogen Species 0.000 description 2
- 101150084750 1 gene Proteins 0.000 description 1
- VXGRJERITKFWPL-UHFFFAOYSA-N 4',5'-Dihydropsoralen Natural products C1=C2OC(=O)C=CC2=CC2=C1OCC2 VXGRJERITKFWPL-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 241001465677 Ancylostomatoidea Species 0.000 description 1
- 208000031295 Animal disease Diseases 0.000 description 1
- 108091023037 Aptamer Proteins 0.000 description 1
- 101001007348 Arachis hypogaea Galactose-binding lectin Proteins 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 240000001082 Bambusa multiplex Species 0.000 description 1
- ZOXJGFHDIHLPTG-UHFFFAOYSA-N Boron Chemical compound [B] ZOXJGFHDIHLPTG-UHFFFAOYSA-N 0.000 description 1
- 241000589562 Brucella Species 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 241000193403 Clostridium Species 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 241000244160 Echinococcus Species 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241000588914 Enterobacter Species 0.000 description 1
- 241000963676 Equine coronavirus Species 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 241000710831 Flavivirus Species 0.000 description 1
- 206010017533 Fungal infection Diseases 0.000 description 1
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 1
- 101710114810 Glycoprotein Proteins 0.000 description 1
- UYTPUPDQBNUYGX-UHFFFAOYSA-N Guanine Natural products O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 1
- 241000228402 Histoplasma Species 0.000 description 1
- 201000002563 Histoplasmosis Diseases 0.000 description 1
- 244000309467 Human Coronavirus Species 0.000 description 1
- 241000419562 Human betacoronavirus 2c EMC/2012 Species 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 241001500351 Influenzavirus A Species 0.000 description 1
- 241001500350 Influenzavirus B Species 0.000 description 1
- 241001500343 Influenzavirus C Species 0.000 description 1
- 241000401052 Influenzavirus D Species 0.000 description 1
- 241000580063 Ipomopsis rubra Species 0.000 description 1
- 201000008225 Klebsiella pneumonia Diseases 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- JLVVSXFLKOJNIY-UHFFFAOYSA-N Magnesium ion Chemical compound [Mg+2] JLVVSXFLKOJNIY-UHFFFAOYSA-N 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 108010090054 Membrane Glycoproteins Proteins 0.000 description 1
- 102000012750 Membrane Glycoproteins Human genes 0.000 description 1
- 208000025370 Middle East respiratory syndrome Diseases 0.000 description 1
- 208000001572 Mycoplasma Pneumonia Diseases 0.000 description 1
- 201000008235 Mycoplasma pneumoniae pneumonia Diseases 0.000 description 1
- 208000031888 Mycoses Diseases 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 208000012902 Nervous system disease Diseases 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 241000902235 Oides Species 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 208000001388 Opportunistic Infections Diseases 0.000 description 1
- 208000030852 Parasitic disease Diseases 0.000 description 1
- 206010035717 Pneumonia klebsiella Diseases 0.000 description 1
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 206010037660 Pyrexia Diseases 0.000 description 1
- 241000205160 Pyrococcus Species 0.000 description 1
- 241000205156 Pyrococcus furiosus Species 0.000 description 1
- 206010038687 Respiratory distress Diseases 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 101000629318 Severe acute respiratory syndrome coronavirus 2 Spike glycoprotein Proteins 0.000 description 1
- 101710167605 Spike glycoprotein Proteins 0.000 description 1
- 241000205180 Thermococcus litoralis Species 0.000 description 1
- 241000204666 Thermotoga maritima Species 0.000 description 1
- 241000589498 Thermus filiformis Species 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 1
- 108010001244 Tli polymerase Proteins 0.000 description 1
- 241000960387 Torque teno virus Species 0.000 description 1
- 241001489151 Trichuris Species 0.000 description 1
- 108010020713 Tth polymerase Proteins 0.000 description 1
- 244000172533 Viola sororia Species 0.000 description 1
- 108020000999 Viral RNA Proteins 0.000 description 1
- 108010087302 Viral Structural Proteins Proteins 0.000 description 1
- 206010000059 abdominal discomfort Diseases 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000001154 acute effect Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 239000000443 aerosol Substances 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 239000000556 agonist Substances 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 239000003513 alkali Substances 0.000 description 1
- 239000002168 alkylating agent Substances 0.000 description 1
- 229940100198 alkylating agent Drugs 0.000 description 1
- 229940024606 amino acid Drugs 0.000 description 1
- 235000001014 amino acid Nutrition 0.000 description 1
- 239000005557 antagonist Substances 0.000 description 1
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 1
- 229940009098 aspartate Drugs 0.000 description 1
- 238000002820 assay format Methods 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 230000000740 bleeding effect Effects 0.000 description 1
- 238000004159 blood analysis Methods 0.000 description 1
- 229910052796 boron Inorganic materials 0.000 description 1
- 244000309464 bull Species 0.000 description 1
- AIYUHDOJVYHVIT-UHFFFAOYSA-M caesium chloride Chemical compound [Cl-].[Cs+] AIYUHDOJVYHVIT-UHFFFAOYSA-M 0.000 description 1
- 150000004657 carbamic acid derivatives Chemical class 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000002738 chelating agent Substances 0.000 description 1
- 230000001886 ciliary effect Effects 0.000 description 1
- 210000003555 cloaca Anatomy 0.000 description 1
- 239000003636 conditioned culture medium Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000002498 deadly effect Effects 0.000 description 1
- 238000000432 density-gradient centrifugation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 229960000633 dextran sulfate Drugs 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- NAGJZTKCGNOGPW-UHFFFAOYSA-N dithiophosphoric acid Chemical class OP(O)(S)=S NAGJZTKCGNOGPW-UHFFFAOYSA-N 0.000 description 1
- 239000000890 drug combination Substances 0.000 description 1
- 230000002183 duodenal effect Effects 0.000 description 1
- 244000309457 enveloped RNA virus Species 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- IVSXFFJGASXYCL-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=NC=N[C]21 IVSXFFJGASXYCL-UHFFFAOYSA-N 0.000 description 1
- 244000052637 human pathogen Species 0.000 description 1
- 238000000099 in vitro assay Methods 0.000 description 1
- 238000012606 in vitro cell culture Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000000968 intestinal effect Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 238000004989 laser desorption mass spectroscopy Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 210000005265 lung cell Anatomy 0.000 description 1
- 108010026228 mRNA guanylyltransferase Proteins 0.000 description 1
- 229910001425 magnesium ion Inorganic materials 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000009347 mechanical transmission Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- YACKEPLHDIMKIO-UHFFFAOYSA-N methylphosphonic acid Chemical class CP(O)(O)=O YACKEPLHDIMKIO-UHFFFAOYSA-N 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 210000003928 nasal cavity Anatomy 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 1
- 108091008104 nucleic acid aptamers Proteins 0.000 description 1
- 229940124276 oligodeoxyribonucleotide Drugs 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 239000012188 paraffin wax Substances 0.000 description 1
- 230000003071 parasitic effect Effects 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- PTMHPRAIXMAOOB-UHFFFAOYSA-L phosphoramidate Chemical compound NP([O-])([O-])=O PTMHPRAIXMAOOB-UHFFFAOYSA-L 0.000 description 1
- 150000008298 phosphoramidates Chemical class 0.000 description 1
- 229910052697 platinum Inorganic materials 0.000 description 1
- 229920000729 poly(L-lysine) polymer Polymers 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 239000011591 potassium Substances 0.000 description 1
- 229910001414 potassium ion Inorganic materials 0.000 description 1
- 230000005180 public health Effects 0.000 description 1
- 239000011535 reaction buffer Substances 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 210000002345 respiratory system Anatomy 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000002976 reverse transcriptase assay Methods 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 230000022676 rumination Effects 0.000 description 1
- 208000015212 rumination disease Diseases 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000013515 script Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000007841 sequencing by ligation Methods 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 229910000162 sodium phosphate Inorganic materials 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- ZFXYFBGIUFBOJW-UHFFFAOYSA-N theophylline Chemical compound O=C1N(C)C(=O)N(C)C2=C1NC=N2 ZFXYFBGIUFBOJW-UHFFFAOYSA-N 0.000 description 1
- 238000007671 third-generation sequencing Methods 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 239000010936 titanium Substances 0.000 description 1
- 229910052719 titanium Inorganic materials 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- 108700012359 toxins Proteins 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- HRXKRNGNAMMEHJ-UHFFFAOYSA-K trisodium citrate Chemical compound [Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O HRXKRNGNAMMEHJ-UHFFFAOYSA-K 0.000 description 1
- 229940038773 trisodium citrate Drugs 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 210000002845 virion Anatomy 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 206010048282 zoonosis Diseases 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6888—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/70—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
- C12Q1/701—Specific hybridization probes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/80—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/166—Oligonucleotides used as internal standards, controls or normalisation probes
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Physics & Mathematics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Analytical Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Virology (AREA)
- Pathology (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
病原体感染の決定因子である標的核酸を同定するための組成物及び方法が本明細書で提供される。本明細書で提供される多重化された方法は、いくつかの異なる生物学的試料から、1つ又は複数の病原性感染を示すIgG及びIgM免疫グロブリンなどの標的タンパク質を同時に検出する。核酸試料中の配列変異体を検出するための方法も本明細書で提供される。
Description
関連出願の相互参照
本出願は、2020年3月24日に出願された米国仮出願第62/994,173号に対する優先権の利益を主張する。前述の出願の全内容は、参照により本明細書に組み込まれる。
本出願は、2020年3月24日に出願された米国仮出願第62/994,173号に対する優先権の利益を主張する。前述の出願の全内容は、参照により本明細書に組み込まれる。
配列表
本出願は、ASCII形式で電子的に提出された配列表を含み、その全体が参照により本明細書に組み込まれる。2021年3月22日に作成されたASCIIコピーの名前はA109922_1010WO_SL.txtであり、サイズは58,177バイトである。
本出願は、ASCII形式で電子的に提出された配列表を含み、その全体が参照により本明細書に組み込まれる。2021年3月22日に作成されたASCIIコピーの名前はA109922_1010WO_SL.txtであり、サイズは58,177バイトである。
試料、例えば生物学的試料(例えば、血液試料、経口試料、経鼻試料、又は組織試料)中の病原体、例えばコロナウイルス(例えば、229E、NL63、OC43、HKU1、MERS-CoV、SARS-CoV及びSARS-CoV-2)及び/又は他のウイルス、例えばインフルエンザウイルス(例えば、インフルエンザウイルスA、インフルエンザウイルスB、インフルエンザウイルスC及びインフルエンザウイルスD)、細菌(例えば、マイコバクテリウム、連鎖球菌、緑膿菌、赤痢菌、カンピロバクター、クラミジア及びサルモネラ)を検出するためのアレイ及び方法が本明細書で提供される。
疾患の早期検出は、疾患の制御及び治療を成功させるために重要であることが多い。正確で高速かつ低コストの血液分析、感染診断、病原体検出、又は他の生物学的若しくは化学的分析物検出を提供することは、医療提供者及び危険な対応チームにとって依然として大きな課題である。
適例は、ヒト及び家畜において高度に流行性の疾患を引き起こす大きなエンベロープRNAウイルスであるコロナウイルスによって引き起こされるウイルス感染症などの感染症の診断である。コロナウイルスは、呼吸分泌物のエアロゾルによって、糞便-経口経路によって、及び機械的伝染によって伝染される。多くの場合、ウイルスに感染した患者は無症候性であり、他の場合、感染は軽度の自己限定性疾患(古典的な「風邪」又は胃の不調)を引き起こし、まれな神経学的合併症があり得る。新規SARS-CoV-2(COVID-19)ウイルスは、下気道の肺細胞に局在するようであり、選択された患者集団において死をもたらす重度の呼吸器合併症を引き起こす。
SARS-CoV-2では、高い感染性と病原性とが致命的に組み合わされ、大部分の患者が不定であるが長期間無症状であることと相まって、世界中の医療システムを圧倒している。中国、イラン、スペイン、及びイタリアからの報告は、局所的な集団発生の初期数週間で疾患の拡散を制御することができないことが、急性呼吸窮迫又は他の生命を脅かす症状に対する集中治療を必要とする患者の急増につながり、それが局所的な地域の医療システムの収容能力を急速に圧倒し、死亡率を急上昇させ得ることを示している。COVID-19の集団発生は、世界保健機関によって国際的に懸念される公衆衛生上の緊急事態であると宣言されており、人々の生活、家庭及び地域社会に大きな影響を与えている。したがって、COVID-19及び日和見感染症を早期に診断する能力は、より効果的な治療決定及び患者の転帰の改善につながるはずである。さらに、中和抗体の集団産生の検出は、特定の病原体に対する集団の健康リスクの特定につながり得る。
高度な分析物検出システムが利用可能であるが、それらはかさばり、高価であり、較正、動作及び維持のために広範囲の訓練を必要とする。迅速な診断試験は、試験あたりのコストが低く、操作が簡単であり、必要な機器が最小限であるか又は全くないという利点を提供することができるが、著しい制約もある。迅速な診断試験は、単一の分析物について単一の試料のみを試験するように構成されることが多いため、共同感染試験をサポートするために複数のデバイスが必要であり、これは極端に高価で非実用的であり得る。
患者の臨床試料中の病原体又は感染の決定因子を正確かつ効率的に検出及び識別することができる、大規模に並行した迅速な診断試験の開発が必要とされている。
本明細書に記載の組成物及び方法は、複数の試料からの病原体の同時迅速検出に有用である。本開示はまた、核酸試料中の配列変異体を検出する方法を提供する。本明細書に記載の組成物、アレイ、システム及び方法は、PCR又は近接ライゲーションアッセイの単純さを組み合わせて、複数のアンプリコンの並行シーケンシングを用いて独自にバーコード化されたアンプリコンを生成し、生物学的試料から1つ又は複数の分析物(例えば、ポリヌクレオチド及び/又はタンパク質)の存在又は非存在を識別することに加えて、ソース識別情報を提供することができる。
一態様では、本開示は、少なくとも1つの標的核酸を同定する方法を提供する。方法は、a)複数の対象から複数の生物学的試料を得る工程、b)生物学的試料の各々から全核酸を得る工程、c)複数のアンプリコンを産生するために増幅混合物を使用して複数のポリヌクレオチドを増幅に供する工程、d)複数のアンプリコンの各々を検出する工程、及びe)複数のアンプリコンのカテゴリーを決定する工程を含む。
いくつかの実施形態において、複数のポリヌクレオチドはRNA分子を含み、工程b)は、工程c)における増幅を行う前に、RNAから逆転写されたcDNAを得ること、又はRNAからcDNAを逆転写することをさらに含む。特定の実施形態において、工程b)における複数のポリヌクレオチドはRNA分子を含み、工程b)において逆転写酵素を添加して、工程c)における増幅に供される複数のcDNAを得る。いくつかの実施形態において、工程b)における複数のポリヌクレオチドはDNA分子をさらに含む。
いくつかの実施形態において、複数のポリヌクレオチドはRNA分子を含み、工程b)は、工程c)における増幅を行う前に、RNAから逆転写されたcDNAを得ること、又はRNAからcDNAを逆転写することをさらに含む。特定の実施形態において、工程b)における複数のポリヌクレオチドはRNA分子を含み、工程b)において逆転写酵素を添加して、工程c)における増幅に供される複数のcDNAを得る。いくつかの実施形態において、工程b)における複数のポリヌクレオチドはDNA分子をさらに含む。
本明細書に記載される方法の多くの実施形態では、標的核酸は、RNAウイルス、DNAウイルス、真菌、寄生生物及び細菌からなる群から選択される1つ又は複数の病原体を含む試料から得られる。いくつかの実施形態において、病原体は、アシネトバクター・バウマンニ(Acinetobacter baumannii)、アデノウイルス、アフリカ馬疫ウイルス、アフリカ豚コレラウイルス、ズビニ鉤虫(Anclostoma duodenale)、回虫、黄色アスペルギルス、アスペルギルス・フミガーツス(Aspergillus fumigatus)、アスペルギルス・ニガー(Aspergillus niger)、アスペルギルス・オリゼ(Aspergillus oryzae)、鳥インフルエンザウイルス、炭疽菌、炭疽菌パスツール株、セレウス菌、ウシ流産菌、ブルセラ・メリテンシス(Brucella melitensis)、ブルセラ・スイス(Brucella suis)、鼻疽菌、類鼻疽菌、カンジダ・アルビカンス(Candida albicans)、カンジダ・ドゥブリニエンシス(Candida dubliniensis)、カンジダ・グラブラタ(Candida glabrata)、カンジダ・クルセイ(Candida krusei)、カンジダ・トロピカリス(Candida tropicalis)、クラミジア・ニューモニエ(Chlamydia pneumoneae)、クラミジア・トラコマチス(Chlamydia trachomatous)、豚熱ウイルス、クロストリジウム・ディフィシール(Clostridium difficile)、コクシジオイデス・イミティス(Coccidioides immitis)、コクシジオイデス・ポサダシ(Coccidioides posadasii)、CoV-229E、CoV-HKU1、CoV-NL63、CoV-OC43、コクサッキーウイルスA、コクサッキーウイルスB、コクシエラ・バーネッティ(Coxiella burnetii)、クリミア・コンゴ出血熱、サイトメガロウイルス、デングウイルス、メジナ虫、東部馬脳炎、エボラウイルス、い粒条虫、多包条虫、エンテロバクター・クロアカ、エンテロコッカス・フェシウム(Enterococcus faecium)、エンテロウイルス、エプスタイン・バール・ウイルス、大腸菌、巨大肝蛭、肝蛭、***ウイルス、野兎病菌、山羊痘ウイルス、ヘモフィルス属インフルエンザ、ヘリコバクターピロリ、ヘンドラウイルス、A型肝炎ウイルス、B型肝炎ウイルス、C型肝炎ウイルス、ヒストプラスマ・カプスラーツム(Histoplasma capsulatum)、ズボアジ型ヒストプラスマ症(Histoplasma duboisii)、ヒトヘルペスウイルスHHV6、ヒトヘルペスウイルスHHV7、ヒトヘルペスウイルスHHV8、ヒトヘルペスウイルスHSV1、ヒトヘルペスウイルスHSV2、ヒト免疫不全ウイルス、ヒトパピローマウイルス、インフルエンザウイルスA型、インフルエンザウイルスB型、クレブシェラ肺炎桿菌、キャサヌール森林病ウイルス、ラッサ熱ウイルス、レジオネラ・ニューモフィラ菌、リーシュマニア・プロマスティゴート(Leishmania promastigotes)、Lujoウイルス、ランピースキン病ウイルス、マールブルグウイルス、麻疹ウイルス、メチシリン耐性黄色ブドウ球菌、サル痘ウイルス、ムンプスウイルス、マイコバクテリウム・アブセッサス(Mycobacterium abscessus)、マイコバクテリウム・アビウム(Mycobacterium avium)、マイコバクテリウム・ボビス(Mycobacterium bovis)、マイコバクテリウム・カヌッティイ(Mycobacterium canettii)、マイコバクテリウム・レプレ(Mycobacterium leprae)、ヒト結核菌、マイコバクテリウム・ウルセランス(Mycobacterium ulcerans)、マイコプラズマ・カプリコルム(Mycoplasma capricolum)、マイコプラズマ・ミコイデス(Mycoplasma mycoides)、マイコプラズマ・ニューモニア(Mycoplasma pneumoneae)、アメリカ十二指腸虫、淋病、ニューカッスル病ウイルス、ニパウイルス、ノルカジア属beijingensis、ノルカジア属cyriacigeorgica、ノルカジア属farcinica、ノロウイルスGI、ノロウイルスGII、ノーウォークウイルス、オムスク出血熱ウイルス、回旋糸状虫、発癌性ヒトパピローマウイルス、パラインフルエンザウイルス、寄生生物、マルネッフェイ型ペニシリウム症(Penicilliosis mameffei)、小反芻獣疫ウイルス、ニューモシスチス・イロベチイ(Pneumocystis jirovecii)、ポリオーマウイルス、プロテウス・ミラビリス(Proteus mirabilis)、緑膿菌、狂犬病ウイルス、8つの遺伝子断片すべてのコーディング領域の任意の部分を含有する、1918年のパンデミックインフルエンザウイルスの再構築された複製コンピテント形態、呼吸器合胞体ウイルス、ライノウイルス、発疹チフスリケッチア、リフトバレー熱ウイルス、牛疫ウイルス、ロタウイルスA、ロタウイルスB、ロタウイルスC、ロタウイルスG2、風疹ウイルス、SARS関連コロナウイルス(SARS-CoV)、SARS-CoV-1、SARS-CoV-2、ビルハルツ住血吸虫、日本住血吸虫、マンソン住血吸虫、羊痘ウイルス、南米出血熱ウイルスチャパレ、南米出血熱ウイルスグアナリト、南米出血熱ウイルスフニン、南米出血熱ウイルスマチュポ、南米出血熱ウイルスサビア、黄色ブドウ球菌、スタフィロコッカス・サプロフィティカス(Staphylococcus saprophyticus)、肺炎レンサ球菌、豚水疱病ウイルス、有鉤条虫、ダニ媒介性脳炎複合(flavi)ウイルス極東亜型、ダニ媒介性脳炎複合(flavi)ウイルスシベリア亜型、タバコモザイク病ウイルス、トルクテノウイルス、鞭虫、ブルーストリパノソーマ(Trypanosoma brucei)、トリパノソーマ・クルージ(Trypanosoma cruzi)、大痘瘡ウイルス(天然痘ウイルス)、小痘瘡ウイルス(アラストリム)、ベネズエラ馬脳炎ウイルス、バンクロフト糸状虫、ペスト菌、又は前述の群の病原体と特徴的な核酸配列を共有する、別の潜在的に新規若しくは特性決定されていない病原体からなる群から選択される。一実施形態では、病原体はRNAウイルスである。特定の実施形態では、RNAウイルスはSARS-CoV-2である。
本明細書に記載される方法の多くの実施形態では、試料は、血液、粘液、唾液、汗、涙、体腔に蓄積する流体、尿、***液、膣分泌物、脳脊髄液、リンパ液、糞便、痰、分解液、嘔吐物、汗、母乳、血清及び血漿からなる群から選択される。一実施形態において、試料は唾液である。
方法の一実施形態では、複数のポリヌクレオチドを増幅混合物を用いて増幅に供して、複数のアンプリコンを産生する。本明細書に記載される方法の多くの実施形態では、増幅はポリメラーゼ連鎖反応増幅である。いくつかの実施形態では、増幅はローリングサークル増幅である。方法の一実施形態では、増幅混合物は、複数のプライマー、フォワードプライマー及びリバースプライマーを含む。一実施形態では、本明細書に記載の方法は、フォワードプライマー及びリバースプライマーの固有のセットを含む増幅混合物を使用したcDNAの増幅を提供する。いくつかの実施形態において、プライマーは、複数のcDNAの各々に相補的なヌクレオチドのセットと、少なくとも1つの固有のヌクレオチドバーコード配列とを含む。いくつかの実施形態において、複数のプライマーは、少なくとも96個の異なるバーコード化プライマーを含む。いくつかの実施形態では、方法は、特定の対象から得られた生物学的試料を識別する第1の固有のバーコード配列を含む。
本明細書中に記載される方法の多くの実施形態において、アダプター配列の対は、第1の固有のバーコード配列及びその逆相補体を第2の固有のバーコード配列及びその逆相補体から分離する。本明細書中に記載される方法の多くの実施形態において、アダプター配列の対は、第1の固有のバーコード配列及びその逆相補体に隣接する。
本明細書中に記載される方法の多くの実施形態において、検出することは、アダプター配列の対並びに第1の固有のバーコード配列及びその逆相補体を含む複数のアンプリコンをシーケンシングすることを含む。本明細書中に記載される方法の多くの他の実施形態において、検出することは、アダプター配列の対、第1の固有のバーコード配列及びその逆相補体、並びに第2の固有のバーコード配列及びその逆相補体を含む複数のアンプリコンをシーケンシングすることを含む。本明細書中に記載される方法の実施形態において、検出することは、一連のプログラムを用いてシーケンシングデータファイルを読み取ることによって行われる。一実施形態では、一連のプログラムは、HMMER/Infernalアラインメントを含む。一実施形態において、シーケンシングデータファイルはFASTA/FASTQフォーマットファイルである。
多くの実施形態において、方法は、標的核酸である少なくとも1つの陽性対照試料をシーケンシングすることをさらに含む。いくつかの実施形態において、方法は、バクテリオファージMS2である少なくとも1つの陽性対照試料をシーケンシングすることをさらに含む。いくつかの実施形態において、方法は、MS2鋳型核酸である少なくとも1つの陽性対照試料をシーケンシングすることをさらに含む。いくつかの実施形態において、方法は、RNAseP又は別の非病原体遺伝子である少なくとも1つの陽性対照試料をシーケンシングすることをさらに含む。いくつかの実施形態において、方法は、ヒトハウスキーピング遺伝子GAPDH又はβ-アクチン由来の核酸である少なくとも1つの陽性対照試料をシーケンシングすることをさらに含む。
多くの実施形態では、方法は、2つ以上の標的核酸を同定することを含む。いくつかの実施形態では、2つ以上の標的核酸は、単一の病原体の病原性決定因子であるか、又は病原性決定因子をエンコードする。一実施形態では、2つ以上の標的核酸は、ウイルスの病原性決定因子であるか、又は病原性決定因子をエンコードする。一実施形態では、ウイルスはSARS-CoV-2である。いくつかの実施形態では、病原性決定因子は、スパイクタンパク質(S)、受容体結合ドメイン(RBD)、S1タンパク質、S2タンパク質、E遺伝子、S遺伝子、Orflab遺伝子、N末端スパイクタンパク質ドメイン、全タンパク質(S1+S2)、及びヌクレオカプシド(N)タンパク質からなる群から選択される。
いくつかの実施形態では、2つ以上の標的核酸は、RNAウイルス、DNAウイルス、真菌、寄生生物及び細菌からなる群から選択される少なくとも2つの異なる病原体の病原性決定因子であるか、又は病原性決定因子をエンコードする。一実施形態では、2つの異なるRNAウイルスは、SARS-CoV-2及びインフルエンザである。
別の態様では、本開示は、多数の試料から少なくとも1つの標的タンパク質を検出するためのアレイのマルチプレックスを提供する。一実施形態では、マルチプレックスアレイは、複数の独自に標識されたビーズに結合した複数の捕捉剤を含み、独自に標識されたビーズの各々が複数の固有の捕捉剤を含む。本明細書に記載の実施形態では、マルチプレックスアレイは、少なくとも1つのビーズに結合するように設計された少なくとも1つの第1のオリゴヌクレオチド配列と、第2のオリゴヌクレオチド配列とコンジュゲートした少なくとも1つの二次抗体と、環状アンプリコン中の少なくとも1つの固有のヌクレオチドバーコード配列とを含む。本明細書に記載されるアレイの多くの実施形態では、ビーズは、少なくとも1つの標的タンパク質に特異的に結合する抗原でコーティングされる。本明細書に記載されるアレイのいくつかの実施形態では、第2のオリゴヌクレオチド配列は、第2のオリゴヌクレオチド配列が第1のオリゴヌクレオチド配列に近接している場合に増幅されて環状アンプリコンを形成するように設計される。いくつかの実施形態において、第1のオリゴヌクレオチド配列、又は第2のオリゴヌクレオチド配列、又はその両方は、少なくとも1つの固有のバーコード配列を含む。いくつかの実施形態において、第1のオリゴヌクレオチド配列は、ビーズ上にコーティングされたポリペプチドに共有結合している。いくつかの実施形態では、アレイのマルチプレックスは、抗体又は抗体断片に共有結合した第1のオリゴヌクレオチド配列を含み、抗体又は抗体断片はビーズ上にコーティングされたポリペプチドに結合する。一実施形態では、マルチプレックスアレイは、環状アンプリコン中に少なくとも96個の異なるバーコード配列を含む。
一態様では、本開示は、複数の生物学的試料における少なくとも1つの感染のための方法を提供する。方法は、少なくとも1つの標的タンパク質が少なくとも1つのビーズの固有の捕捉剤に結合するのに十分な条件下で、本明細書に記載のアレイのマルチプレックスにおいて複数の生物学的試料を複数のビーズと共にインキュベートする第1の工程を含む。方法の第2の工程において。ビーズを洗浄して、固有の捕捉剤に結合しないタンパク質を除去する。次の工程は、複数の標的タンパク質に結合した二次抗体の数に対応する複数の複合体が形成されるように、複数の二次抗体のそれぞれが少なくとも1つの標的タンパク質と複合体を形成する条件下で、ビーズを複数の二次抗体とインキュベートすることを含む。次の工程では、ビーズを再度洗浄して、複合体を形成しない二次抗体を除去する。第6の工程では、環状アンプリコンを形成するように第1オリゴヌクレオチド配列のそれぞれに対して第2オリゴヌクレオチド配列のそれぞれをハイブリダイゼーションさせる条件下で、複数の複合体の数に対応して複数のアンプリコンが生成されるように、複数の複合体をインキュベートする。方法の第7の工程は、複数の環状アンプリコンを増幅に供することを含む。第8の工程では、ビーズをアレイにプールし、複数のアンプリコンを固有のバーコード化アンプリコンのハイスループットシーケンシングによって同時に検出する。最後の工程では、複数のアンプリコンのカテゴリーが決定される。標的増幅領域由来のポリヌクレオチドを含む複数のアンプリコンのそれぞれのカテゴリーを決定することは、対応する生物学的試料における感染を示す。
いくつかの実施形態では、本明細書に記載の方法は、1つ又は複数の試料中の病原性決定因子(例えば、細菌、真菌、寄生虫及び/又はウイルス感染)の同定に使用される。他の実施形態では、本方法は、1つ以上の病原性感染を示すIgG及びIgM免疫グロブリンなどの標的タンパク質を同時に検出する。くつかの実施形態において、本明細書中に記載される方法によって検出される抗体又は抗体断片は、アシネトバクター・バウマンニ(Acinetobacter baumannii)、アデノウイルス、アフリカ馬疫ウイルス、アフリカ豚コレラウイルス、ズビニ鉤虫(Anclostoma duodenale)、回虫、黄色アスペルギルス、アスペルギルス・フミガーツス(Aspergillus fumigatus)、アスペルギルス・ニガー(Aspergillus niger)、アスペルギルス・オリゼ(Aspergillus oryzae)、鳥インフルエンザウイルス、炭疽菌、炭疽菌パスツール株、Bacillus cereus Biovar anthracis、ウシ流産菌、ブルセラ・メリテンシス(Brucella melitensis)、ブルセラ・スイス(Brucella suis)、鼻疽菌、類鼻疽菌、カンジダ・アルビカンス(Candida albicans)、カンジダ・ドゥブリニエンシス(Candida dubliniensis)、カンジダ・グラブラタ(Candida glabrata)、カンジダ・クルセイ(Candida krusei)、カンジダ・トロピカリス(Candida tropicalis)、クラミジア・ニューモニエ(Chlamydia pneumoneae)、クラミジア・トラコマチス(Chlamydia trachomatous)、豚熱ウイルス、クロストリジウム・ディフィシール(Clostridium difficile)、コクシジオイデス・イミティス(Coccidioides immitis)、コクシジオイデス・ポサダシ(Coccidioides posadasii)、CoV-229E、CoV-HKU1、CoV-NL63、CoV-OC43、コクサッキーウイルスA、コクサッキーウイルスB、コクシエラ・バーネッティ(Coxiella burnetii)、クリミア・コンゴ出血熱、サイトメガロウイルス、デングウイルス、メジナ虫、東部馬脳炎、エボラウイルス、い粒条虫、多包条虫、エンテロバクター・クロアカ、エンテロコッカス・フェシウム(Enterococcus faecium)、エンテロウイルス、エプスタイン・バール・ウイルス、大腸菌、巨大肝蛭、肝蛭、***ウイルス、野兎病菌、山羊痘ウイルス、ヘモフィルス属インフルエンザ、ヘリコバクターピロリ、ヘンドラウイルス、A型肝炎ウイルス、B型肝炎ウイルス、C型肝炎ウイルス、ヒストプラスマ・カプスラーツム(Histoplasma capsulatum)、ズボアジ型ヒストプラスマ症(Histoplasma duboisii)、ヒトヘルペスウイルスHHV6、ヒトヘルペスウイルスHHV7、ヒトヘルペスウイルスHHV8、ヒトヘルペスウイルスHSV1、ヒトヘルペスウイルスHSV2、ヒト免疫不全ウイルス、ヒトパピローマウイルス、インフルエンザウイルスA型、インフルエンザウイルスB型、クレブシェラ肺炎桿菌、キャサヌール森林病ウイルス、ラッサ熱ウイルス、レジオネラ・ニューモフィラ菌、リーシュマニア・プロマスティゴート(Leishmania promastigotes)、Lujoウイルス、ランピースキン病ウイルス、マールブルグウイルス、麻疹ウイルス、メチシリン耐性黄色ブドウ球菌、サル痘ウイルス、ムンプスウイルス、マイコバクテリウム・アブセッサス(Mycobacterium abscessus)、マイコバクテリウム・アビウム(Mycobacterium avium)、マイコバクテリウム・ボビス(Mycobacterium bovis)、マイコバクテリウム・カヌッティイ(Mycobacterium canettii)、マイコバクテリウム・レプレ(Mycobacterium leprae)、ヒト結核菌、マイコバクテリウム・ウルセランス(Mycobacterium ulcerans)、マイコプラズマ・カプリコルム(Mycoplasma capricolum)、マイコプラズマ・ミコイデス(Mycoplasma mycoides)、マイコプラズマ・ニューモニア(Mycoplasma pneumoneae)、アメリカ十二指腸虫、淋病、ニューカッスル病ウイルス、ニパウイルス、ノルカジア属beijingensis、ノルカジア属cyriacigeorgica、ノルカジア属farcinica、ノロウイルスGI、ノロウイルスGII、ノーウォークウイルス、オムスク出血熱ウイルス、回旋糸状虫、発癌性ヒトパピローマウイルス、パラインフルエンザウイルス、寄生生物、マルネッフェイ型ペニシリウム症(Penicilliosis mameffei)、小反芻獣疫ウイルス、ニューモシスチス・イロベチイ(Pneumocystis jirovecii)、ポリオーマウイルス、プロテウス・ミラビリス(Proteus mirabilis)、緑膿菌、狂犬病ウイルス、8つの遺伝子断片すべてのコーディング領域の任意の部分を含有する、1918年のパンデミックインフルエンザウイルスの再構築された複製コンピテント形態、呼吸器合胞体ウイルス、ライノウイルス、発疹チフスリケッチア、リフトバレー熱ウイルス、牛疫ウイルス、ロタウイルスA、ロタウイルスB、ロタウイルスC、ロタウイルスG2、風疹ウイルス、SARS関連コロナウイルス(SARS-CoV)、SARS-CoV-1、SARS-CoV-2、ビルハルツ住血吸虫、日本住血吸虫、マンソン住血吸虫、羊痘ウイルス、南米出血熱ウイルスチャパレ、南米出血熱ウイルスグアナリト、南米出血熱ウイルスフニン、南米出血熱ウイルスマチュポ、南米出血熱ウイルスサビア、黄色ブドウ球菌、スタフィロコッカス・サプロフィティカス(Staphylococcus saprophyticus)、肺炎レンサ球菌、豚水疱病ウイルス、有鉤条虫、ダニ媒介性脳炎複合(flavi)ウイルス極東亜型、ダニ媒介性脳炎複合(flavi)ウイルスシベリア亜型、タバコモザイク病ウイルス、トルクテノウイルス、鞭虫、ブルーストリパノソーマ(Trypanosoma brucei)、トリパノソーマ・クルージ(Trypanosoma cruzi)、大痘瘡ウイルス(天然痘ウイルス)、小痘瘡ウイルス(アラストリム)、ベネズエラ馬脳炎ウイルス、バンクロフト糸状虫、ペスト菌を含む病原体、又は前述の群の病原体と特徴的な核酸配列を共有する、別の潜在的に新規若しくは特性決定されていない病原体由来の1つ以上の抗原と特異的に結合する。
一実施形態では、抗体又は抗体断片は、SAR-CoV-2由来の抗原に特異的に結合する。いくつかの実施形態では、抗体又は抗体断片は、スパイクタンパク質(S)、受容体結合ドメイン(RBD)、S1タンパク質、S2タンパク質、E遺伝子、S遺伝子、Orflab遺伝子、N末端スパイクタンパク質ドメイン、全タンパク質(S1+S2)、及びヌクレオカプシド(N)タンパク質からなる群から選択される抗原に特異的に結合する。
本明細書に記載される方法の多くの実施形態では、試料は、血液、粘液、唾液、汗、涙、体腔に蓄積する流体、尿、***液、膣分泌物、脳脊髄液、リンパ液、糞便、痰、分解液、嘔吐物、汗、母乳、血清及び血漿からなる群から選択される。一実施形態において、試料は唾液である。一実施形態において、試料は血液である。
別の態様では、本開示は、核酸試料中の配列変異体を検出する方法を提供する。第1の工程は、増幅混合物を用いて核酸の試料と増幅反応を行い、複数のアンプリコンを産生することを含む。第2の工程は、配列変異を検出することであり、複数のアンプリコンを検出すること、及び場合により定量することを含む。本方法の第3の工程は、複数のアンプリコンのカテゴリーを決定する工程を含む。本方法の第4の工程は、配列変異の検出に関する。本明細書に記載される方法の多くの実施形態では、増幅混合物は、核酸試料、複数のプライマー、第1の固有のバーコード配列及びその逆相補体、並びにアダプター配列の第1の対を含む。いくつかの実施形態において、複数のプライマーの各々は、それらが結合するポリヌクレオチドの各々に相補的なヌクレオチドのセットを含む。いくつかの実施形態において、第1の固有のバーコード配列及びその逆相補体は、特定の対象から得られた試料を同定する。いくつかの実施形態において、アダプター配列の対は、第1の固有のバーコード配列及びその逆相補体に隣接する。いくつかの実施形態において、複数のアンプリコンは標的増幅領域又は対照領域からのポリヌクレオチドを含む。
本明細書中に記載される方法の多くの実施形態において、第2の工程は、アダプター配列の第1の対並びに第1の固有のバーコード配列及びその逆相補体を含む複数のアンプリコンの各々をシーケンシングすることを含む。いくつかの実施形態において、第2の工程は、アダプター配列の第1の対、第1の固有のバーコード配列及びその逆相補体、第2の固有のバーコード配列及びその逆相補体を含む複数のアンプリコンの各々をシーケンシングすることを含む。一実施形態において、アダプター配列の第1の対は、第1の固有のバーコード配列及びその逆相補体を第2の固有のバーコード配列及びその逆相補体から分離する。
本明細書中に記載される方法の多くの実施形態において、第2の工程における検出は、一連のプログラムを用いてシーケンシングデータファイルを読み取ることによって行われる。いくつかの実施形態において、シーケンシングデータファイルはFASTA/FASTQフォーマットである。いくつかの実施形態では、一連のプログラムは、HMMER/Infernalアラインメントエンジンを含む。
本明細書中に記載される方法の多くの実施形態において、第4の工程における検出は、1つ以上の参照配列との配列アラインメント(例えば、多重配列アラインメント)を行うことを含む。いくつかの実施形態において、配列アラインメントは、HMMプロファイル隠れマルコフモデル(HMM)エンジン、共分散モデル(CM)エンジン又はそれらの組み合わせによって行われる。
いくつかの実施形態において、方法は、配列変異体を感染の診断又は予後と相関させることを含む。いくつかの実施形態では、感染は、RNAウイルス、DNAウイルス、真菌、寄生生物及び細菌からなる群から選択される1つ又は複数の病原体によって引き起こされる。いくつかの実施形態において、病原体は、アシネトバクター・バウマンニ(Acinetobacter baumannii)、アデノウイルス、アフリカ馬疫ウイルス、アフリカ豚コレラウイルス、ズビニ鉤虫(Anclostoma duodenale)、回虫、黄色アスペルギルス、アスペルギルス・フミガーツス(Aspergillus fumigatus)、アスペルギルス・ニガー(Aspergillus niger)、アスペルギルス・オリゼ(Aspergillus oryzae)、鳥インフルエンザウイルス、炭疽菌、炭疽菌パスツール株、Bacillus cereus Biovar anthracis、ウシ流産菌、ブルセラ・メリテンシス(Brucella melitensis)、ブルセラ・スイス(Brucella suis)、鼻疽菌、類鼻疽菌、カンジダ・アルビカンス(Candida albicans)、カンジダ・ドゥブリニエンシス(Candida dubliniensis)、カンジダ・グラブラタ(Candida glabrata)、カンジダ・クルセイ(Candida krusei)、カンジダ・トロピカリス(Candida tropicalis)、クラミジア・ニューモニエ(Chlamydia pneumoneae)、クラミジア・トラコマチス(Chlamydia trachomatous)、豚熱ウイルス、クロストリジウム・ディフィシール(Clostridium difficile)、コクシジオイデス・イミティス(Coccidioides immitis)、コクシジオイデス・ポサダシ(Coccidioides posadasii)、CoV-229E、CoV-HKU1、CoV-NL63、CoV-OC43、コクサッキーウイルスA、コクサッキーウイルスB、コクシエラ・バーネッティ(Coxiella burnetii)、クリミア・コンゴ出血熱、サイトメガロウイルス、デングウイルス、メジナ虫、東部馬脳炎、エボラウイルス、い粒条虫、多包条虫、エンテロバクター・クロアカ、エンテロコッカス・フェシウム(Enterococcus faecium)、エンテロウイルス、エプスタイン・バール・ウイルス、大腸菌、巨大肝蛭、肝蛭、***ウイルス、野兎病菌、山羊痘ウイルス、ヘモフィルス属インフルエンザ、ヘリコバクターピロリ、ヘンドラウイルス、A型肝炎ウイルス、B型肝炎ウイルス、C型肝炎ウイルス、ヒストプラスマ・カプスラーツム(Histoplasma capsulatum)、ズボアジ型ヒストプラスマ症(Histoplasma duboisii)、ヒトヘルペスウイルスHHV6、ヒトヘルペスウイルスHHV7、ヒトヘルペスウイルスHHV8、ヒトヘルペスウイルスHSV1、ヒトヘルペスウイルスHSV2、ヒト免疫不全ウイルス、ヒトパピローマウイルス、インフルエンザウイルスA型、インフルエンザウイルスB型、クレブシェラ肺炎桿菌、キャサヌール森林病ウイルス、ラッサ熱ウイルス、レジオネラ・ニューモフィラ菌、リーシュマニア・プロマスティゴート(Leishmania promastigotes)、Lujoウイルス、ランピースキン病ウイルス、マールブルグウイルス、麻疹ウイルス、メチシリン耐性黄色ブドウ球菌、サル痘ウイルス、ムンプスウイルス、マイコバクテリウム・アブセッサス(Mycobacterium abscessus)、マイコバクテリウム・アビウム(Mycobacterium avium)、マイコバクテリウム・ボビス(Mycobacterium bovis)、マイコバクテリウム・カヌッティイ(Mycobacterium canettii)、マイコバクテリウム・レプレ(Mycobacterium leprae)、ヒト結核菌、マイコバクテリウム・ウルセランス(Mycobacterium ulcerans)、マイコプラズマ・カプリコルム(Mycoplasma capricolum)、マイコプラズマ・ミコイデス(Mycoplasma mycoides)、マイコプラズマ・ニューモニア(Mycoplasma pneumoneae)、アメリカ十二指腸虫、淋病、ニューカッスル病ウイルス、ニパウイルス、ノルカジア属beijingensis、ノルカジア属cyriacigeorgica、ノルカジア属farcinica、ノロウイルスGI、ノロウイルスGII、ノーウォークウイルス、オムスク出血熱ウイルス、回旋糸状虫、発癌性ヒトパピローマウイルス、パラインフルエンザウイルス、寄生生物、マルネッフェイ型ペニシリウム症(Penicilliosis mameffei)、小反芻獣疫ウイルス、ニューモシスチス・イロベチイ(Pneumocystis jirovecii)、ポリオーマウイルス、プロテウス・ミラビリス(Proteus mirabilis)、緑膿菌、狂犬病ウイルス、8つの遺伝子断片すべてのコーディング領域の任意の部分を含有する、1918年のパンデミックインフルエンザウイルスの再構築された複製コンピテント形態、呼吸器合胞体ウイルス、ライノウイルス、発疹チフスリケッチア、リフトバレー熱ウイルス、牛疫ウイルス、ロタウイルスA、ロタウイルスB、ロタウイルスC、ロタウイルスG2、風疹ウイルス、SARS関連コロナウイルス(SARS-CoV)、SARS-CoV-1、SARS-CoV-2、ビルハルツ住血吸虫、日本住血吸虫、マンソン住血吸虫、羊痘ウイルス、南米出血熱ウイルスチャパレ、南米出血熱ウイルスグアナリト、南米出血熱ウイルスフニン、南米出血熱ウイルスマチュポ、南米出血熱ウイルスサビア、黄色ブドウ球菌、スタフィロコッカス・サプロフィティカス(Staphylococcus saprophyticus)、肺炎レンサ球菌、豚水疱病ウイルス、有鉤条虫、ダニ媒介性脳炎複合(flavi)ウイルス極東亜型、ダニ媒介性脳炎複合(flavi)ウイルスシベリア亜型、タバコモザイク病ウイルス、トルクテノウイルス、鞭虫、ブルーストリパノソーマ(Trypanosoma brucei)、トリパノソーマ・クルージ(Trypanosoma cruzi)、大痘瘡ウイルス(天然痘ウイルス)、小痘瘡ウイルス(アラストリム)、ベネズエラ馬脳炎ウイルス、バンクロフト糸状虫、ペスト菌、又は前述の群の病原体と特徴的な核酸配列を共有する、別の潜在的に新規若しくは特性決定されていない病原体からなる群から選択される。
一実施形態では、病原体はSARS-CoV-2である。いくつかの実施形態では、配列変異体は、スパイクタンパク質(S)、受容体結合ドメイン(RBD)、S1タンパク質、S2タンパク質、E遺伝子、S遺伝子、Orflab遺伝子、N末端スパイクタンパク質ドメイン、全タンパク質(S1+S2)、及びヌクレオカプシド(N)タンパク質からなる群から選択される抗原をエンコードする領域にある。いくつかの実施形態では、配列変異体は、T95I、D253G、L452R、E484K、S477N、N501Y D614G及びA701Vからなる群より選択される変異を含む。
本明細書中に記載される方法の多くの実施形態において、複数のアンプリコンの検出は、複数のアンプリコンのプールされた配列データセットを得ること、ベースコールを行うこと、複数のアンプリコンの配列データを予め定義されたアノテーション付きHMM又はCM遺伝子モデルにアラインメントすること、HMM/CMアラインメントの各々に階級(例えば、確率スコア又はビットスコア)を割り当てること、配列データをフィルタリングして位置アノテーション付き配列アラインメントを得ること、各アンプリコン内のバーコード並びにアンプリコンの配列内のバーコード及びアダプターの位置を決定することを含む。本明細書に記載の方法のすべての実施形態において、前述の工程は、適切にプログラムされたコンピュータを使用して実行される。本明細書に記載の方法のいくつかの実施形態では、高精度ONT GPUに基づくベースコーラーでベースコールが実行され、生のFASTA/FASTQファイルが生成される。これらの実施形態では、生ファイルは、プロファイルHMMエンジン及び/又はCMエンジンによってアラインメントされる。いくつかの実施形態では、HMMエンジンは、複数の配列アラインメントをもたらすHMMERソフトウェアプログラムを含む。いくつかの実施形態では、HMMERプログラム及び/又はCMエンジンは、バーコード、標的増幅領域、プライマー、及びアダプターからなる群から選択される1つ又は複数の配列特徴についてヌクレオチドごとのアノテーションを割り当てる。一実施形態において、複数の配列アラインメントは、第1の固有のバーコード配列及びその逆相補体のためのアノテーションを含む。
本明細書中に記載される方法の多くの実施形態において、フィルタリングは、合格スコア又は不合格スコアを配列アラインメントに割り当てることを含む。これらの実施形態では、配列アラインメントは、参照バーコード化配列のセットに対して最小レーベンシュタイン距離スコアに合格する場合、及びアラインメントの最小ビットスコア閾値を合格する場合、合格スコアが割り当てられる。いくつかの実施形態において、合格スコアを有する配列アラインメントは、中央データベースに記憶される。いくつかの実施形態では、合格スコアを有する配列アラインメントは、試料中の病原体負荷の直接的な定量的表示に対応する。
方法の多くの実施形態において、データベースは、試料コレクションチューブに割り当てられた固有のバーコードの情報、少なくとも96個の固有のウェルバーコードのセットの情報、少なくとも96個の固有のプレートバーコードのセットの情報、複数のアンプリコンからの配列データのセットの情報及びレポートを含む。一実施形態では、レポートは、各対象のソース識別情報及び対象が標的タンパク質の存在について陽性であるか陰性であるかに関する情報を含む。一実施形態では、レポートは、対応する対象、又は診療所若しくは医師に提供される。
さらに別の態様では、本開示はアンプリコンを含む組成物を提供する。本明細書に記載される多くの実施形態では、アンプリコンは、第1の固有のバーコード配列及びその逆相補体、標的特異的プライマーの対、標的増幅領域及びアダプター配列の第1の対を含む。いくつかの実施形態において、標的特異的プライマーの対はフォワードプライマーとリバースプライマーとから構成され、それぞれが標的増幅領域(例えば、ウイルスゲノムの領域)内のプライミング部位に相補的な配列を有する。多くの実施形態において、フォワードプライマー及びリバースプライマーの各々は、標的増幅領域に隣接し、次に第1の固有のヌクレオチドバーコード配列及びその逆相補体に隣接し、第1の固有のバーコード配列及びその逆相補体は、アダプター配列の第1の対に隣接する。いくつかの実施形態において、アンプリコンは、第2の固有のバーコード配列及びその逆相補体並びにアダプター配列の第2の対をさらに含み、ここで第2の固有のバーコード配列及びその逆相補体並びにアダプター配列の第2の対は、アンプリコンにライゲーションされている。一実施形態では、アダプター配列の第1の対はアダプター配列の第2の対に隣接し、アダプター配列の第2の対は第2の固有のバーコード配列及びその逆相補体に隣接する。
いくつかの実施形態において、標的増幅領域は、遺伝子又はタンパク質をエンコードする病原体のゲノム領域から増幅され、病原体は、アシネトバクター・バウマンニ(Acinetobacter baumannii)、アデノウイルス、アフリカ馬疫ウイルス、アフリカ豚コレラウイルス、ズビニ鉤虫(Anclostoma duodenale)、回虫、黄色アスペルギルス、アスペルギルス・フミガーツス(Aspergillus fumigatus)、アスペルギルス・ニガー(Aspergillus niger)、アスペルギルス・オリゼ(Aspergillus oryzae)、鳥インフルエンザウイルス、炭疽菌、炭疽菌パスツール株、Bacillus cereus Biovar anthracis、ウシ流産菌、ブルセラ・メリテンシス(Brucella melitensis)、ブルセラ・スイス(Brucella suis)、鼻疽菌、類鼻疽菌、カンジダ・アルビカンス(Candida albicans)、カンジダ・ドゥブリニエンシス(Candida dubliniensis)、カンジダ・グラブラタ(Candida glabrata)、カンジダ・クルセイ(Candida krusei)、カンジダ・トロピカリス(Candida tropicalis)、クラミジア・ニューモニエ(Chlamydia pneumoneae)、クラミジア・トラコマチス(Chlamydia trachomatous)、豚熱ウイルス、クロストリジウム・ディフィシール(Clostridium difficile)、コクシジオイデス・イミティス(Coccidioides immitis)、コクシジオイデス・ポサダシ(Coccidioides posadasii)、CoV-229E、CoV-HKU1、CoV-NL63、CoV-OC43、コクサッキーウイルスA、コクサッキーウイルスB、コクシエラ・バーネッティ(Coxiella burnetii)、クリミア・コンゴ出血熱、サイトメガロウイルス、デングウイルス、メジナ虫、東部馬脳炎、エボラウイルス、い粒条虫、多包条虫、エンテロバクター・クロアカ、エンテロコッカス・フェシウム(Enterococcus faecium)、エンテロウイルス、エプスタイン・バール・ウイルス、大腸菌、巨大肝蛭、肝蛭、***ウイルス、野兎病菌、山羊痘ウイルス、ヘモフィルス属インフルエンザ、ヘリコバクターピロリ、ヘンドラウイルス、A型肝炎ウイルス、B型肝炎ウイルス、C型肝炎ウイルス、ヒストプラスマ・カプスラーツム(Histoplasma capsulatum)、ズボアジ型ヒストプラスマ症(Histoplasma duboisii)、ヒトヘルペスウイルスHHV6、ヒトヘルペスウイルスHHV7、ヒトヘルペスウイルスHHV8、ヒトヘルペスウイルスHSV1、ヒトヘルペスウイルスHSV2、ヒト免疫不全ウイルス、ヒトパピローマウイルス、インフルエンザウイルスA型、インフルエンザウイルスB型、クレブシェラ肺炎桿菌、キャサヌール森林病ウイルス、ラッサ熱ウイルス、レジオネラ・ニューモフィラ菌、リーシュマニア・プロマスティゴート(Leishmania promastigotes)、Lujoウイルス、ランピースキン病ウイルス、マールブルグウイルス、麻疹ウイルス、メチシリン耐性黄色ブドウ球菌、サル痘ウイルス、ムンプスウイルス、マイコバクテリウム・アブセッサス(Mycobacterium abscessus)、マイコバクテリウム・アビウム(Mycobacterium avium)、マイコバクテリウム・ボビス(Mycobacterium bovis)、マイコバクテリウム・カヌッティイ(Mycobacterium canettii)、マイコバクテリウム・レプレ(Mycobacterium leprae)、ヒト結核菌、マイコバクテリウム・ウルセランス(Mycobacterium ulcerans)、マイコプラズマ・カプリコルム(Mycoplasma capricolum)、マイコプラズマ・ミコイデス(Mycoplasma mycoides)、マイコプラズマ・ニューモニア(Mycoplasma pneumoneae)、アメリカ十二指腸虫、淋病、ニューカッスル病ウイルス、ニパウイルス、ノルカジア属beijingensis、ノルカジア属cyriacigeorgica、ノルカジア属farcinica、ノロウイルスGI、ノロウイルスGII、ノーウォークウイルス、オムスク出血熱ウイルス、回旋糸状虫、発癌性ヒトパピローマウイルス、パラインフルエンザウイルス、寄生生物、マルネッフェイ型ペニシリウム症(Penicilliosis mameffei)、小反芻獣疫ウイルス、ニューモシスチス・イロベチイ(Pneumocystis jirovecii)、ポリオーマウイルス、プロテウス・ミラビリス(Proteus mirabilis)、緑膿菌、狂犬病ウイルス、8つの遺伝子断片すべてのコーディング領域の任意の部分を含有する、1918年のパンデミックインフルエンザウイルスの再構築された複製コンピテント形態、呼吸器合胞体ウイルス、ライノウイルス、発疹チフスリケッチア、リフトバレー熱ウイルス、牛疫ウイルス、ロタウイルスA、ロタウイルスB、ロタウイルスC、ロタウイルスG2、風疹ウイルス、SARS関連コロナウイルス(SARS-CoV)、SARS-CoV-1、SARS-CoV-2、ビルハルツ住血吸虫、日本住血吸虫、
マンソン住血吸虫、羊痘ウイルス、南米出血熱ウイルスチャパレ、南米出血熱ウイルスグアナリト、南米出血熱ウイルスフニン、南米出血熱ウイルスマチュポ、南米出血熱ウイルスサビア、黄色ブドウ球菌、スタフィロコッカス・サプロフィティカス(Staphylococcus saprophyticus)、肺炎レンサ球菌、豚水疱病ウイルス、有鉤条虫、ダニ媒介性脳炎複合(flavi)ウイルス極東亜型、ダニ媒介性脳炎複合(flavi)ウイルスシベリア亜型、タバコモザイク病ウイルス、トルクテノウイルス、鞭虫、ブルーストリパノソーマ(Trypanosoma brucei)、トリパノソーマ・クルージ(Trypanosoma cruzi)、大痘瘡ウイルス(天然痘ウイルス)、小痘瘡ウイルス(アラストリム)、ベネズエラ馬脳炎ウイルス、バンクロフト糸状虫、ペスト菌、又は前述の群の病原体と特徴的な核酸配列を共有する、別の潜在的に新規若しくは特性決定されていない病原体からなる群から選択される。
マンソン住血吸虫、羊痘ウイルス、南米出血熱ウイルスチャパレ、南米出血熱ウイルスグアナリト、南米出血熱ウイルスフニン、南米出血熱ウイルスマチュポ、南米出血熱ウイルスサビア、黄色ブドウ球菌、スタフィロコッカス・サプロフィティカス(Staphylococcus saprophyticus)、肺炎レンサ球菌、豚水疱病ウイルス、有鉤条虫、ダニ媒介性脳炎複合(flavi)ウイルス極東亜型、ダニ媒介性脳炎複合(flavi)ウイルスシベリア亜型、タバコモザイク病ウイルス、トルクテノウイルス、鞭虫、ブルーストリパノソーマ(Trypanosoma brucei)、トリパノソーマ・クルージ(Trypanosoma cruzi)、大痘瘡ウイルス(天然痘ウイルス)、小痘瘡ウイルス(アラストリム)、ベネズエラ馬脳炎ウイルス、バンクロフト糸状虫、ペスト菌、又は前述の群の病原体と特徴的な核酸配列を共有する、別の潜在的に新規若しくは特性決定されていない病原体からなる群から選択される。
一実施形態では、病原体はSARS-CoV-2である。いくつかの実施形態では、配列変異体は、スパイクタンパク質(S)、受容体結合ドメイン(RBD)、S1タンパク質、S2タンパク質、E遺伝子、S遺伝子、Orflab遺伝子、N末端スパイクタンパク質ドメイン、全タンパク質(S1+S2)、及びヌクレオカプシド(N)タンパク質からなる群から選択される抗原をエンコードする領域にある。一実施形態では、標的増幅領域は、Sタンパク質をエンコードする領域から増幅される。一実施形態では、標的増幅領域は、Sタンパク質のRBDをエンコードする領域から増幅される。一実施形態では、標的増幅領域は、Nタンパク質をエンコードする領域から増幅される。
いくつかの実施形態において、固有のバーコード配列及びそれらの逆相補体は、他のすべてのバーコードからの最大レーベンシュタイン距離を有する。いくつかの実施形態では、固有のバーコード配列は、配列番号23-118に示されるポリヌクレオチド配列のいずれか1つを含む。いくつかの実施形態において、標的特異的プライマーの対は、フォワードプライマー:GACCCCAAAATCAGCGAAAT(配列番号3)及びリバースプライマー:TCTGGTTACTGCCAGTTGAATCTG(配列番号4)フォワードプライマー:TTACAAACATTGGCCGCAAA(配列番号5)及びリバースプライマー:GCGCGACATTCCGAAGAA(配列番号6);フォワードプライマー:GGGAGCCTTGAATACACCAAAA(配列番号7)及びリバースプライマー:TGTAGCACGATTGCAGCATTG(配列番号8);フォワードプライマー:GTGARATGGTCATGTGTGGCGG(配列番号9)及びリバースプライマー:CARATGTTAAASACACTATTAGCATA(配列番号10);フォワードプライマー:ACAGGTACGTTAATAGTTAATAGCGT(配列番号11)及びリバースプライマー:ATATTGCAGCAGTACGCACACA(配列番号12);フォワードプライマー:CCCTGTGGGTTTT AC ACTT A A(配列番号13)及びリバースプライマー:ACGATTGTGCATCAGCTGA(配列番号14);フォワードプライマー:GTACTCATTCGTTTCGGAAGAG(配列番号15)及びリバースプライマー:CCAGAAGATCAGGAACTCTAGA(配列番号16);フォワードプライマー:GGGG A ACTTCTCCTGCT AG A AT(配列番号17)及びリバースプライマー:CAGACATTTTGCTCTCAAGCTG(配列番号18);フォワードプライマー:AGATTTGGACCTGCGAGCG(配列番号19)及びリバースプライマー:GAGCGGCTGTCTCCACAAGT(配列番号20)からなるフォワードプライマー及びリバースプライマーの群から選択される。
いくつかの実施形態において、アダプター配列の第1の対及びアダプター配列の第2の対は同一であり、10~15ヌクレオチドを含む。一実施形態では、アダプター配列の対は10ヌクレオチドを含む。一実施形態では、アダプター配列の対は、ACACTGACGACATGGTTCTACA(配列番号21)及びTACGGTAGCAGAGACTTGGTCT(配列番号22)に示すポリヌクレオチド配列を含む。
本明細書に記載の組成物及び方法は、複数の試料からの病原体の同時迅速検出に有用である。本開示は、単一の反応において、固有の検出可能なヌクレオチドバーコード配列を含有する数百以上の標的特異的プライマーを使用して、1つ又は複数の試料中の特異的分析物(例えば、ウイルス粒子、病原体由来の病原性決定因子に対する抗体)の存在を検出する、マルチプレックスアッセイを提供する。本開示はまた、核酸試料中の配列変異体を検出する方法を提供する。本明細書に記載の組成物、アレイ、システム及び方法は、PCR又は近接ライゲーションアッセイの単純さを組み合わせて、複数のアンプリコンの並行シーケンシングを用いて独自にバーコード化されたアンプリコンを生成し、生物学的試料から1つ又は複数の分析物(例えば、ポリヌクレオチド及び/又はタンパク質)の存在又は非存在を識別することに加えて、ソース識別情報を提供することができる。
I.定義
「アンプリコン」という用語は、PCR反応の核酸産物を指す。本明細書で提供されるアンプリコンは、目的の配列(例えば、ウイルス配列)に隣接するバーコード配列を含む。アンプリコンは、二本鎖又は一本鎖であり得、二本鎖増幅産物を変性することによって得られた分離構成要素鎖を含み得る。ある特定の実施形態において、1つの増幅サイクルのアンプリコンは、後続の増幅サイクルにおける鋳型として機能し得る。
「アンプリコン」という用語は、PCR反応の核酸産物を指す。本明細書で提供されるアンプリコンは、目的の配列(例えば、ウイルス配列)に隣接するバーコード配列を含む。アンプリコンは、二本鎖又は一本鎖であり得、二本鎖増幅産物を変性することによって得られた分離構成要素鎖を含み得る。ある特定の実施形態において、1つの増幅サイクルのアンプリコンは、後続の増幅サイクルにおける鋳型として機能し得る。
「分析物」という用語は、本明細書に記載の方法によって検出又はアッセイされる物質を指す。典型的な分析物には、これらに限定されないが、ペプチド、タンパク質(例えば、抗体、抗体の断片、scFv)、核酸、有機及び無機分子を含む小分子、ウイルス及び他の微生物、細胞他、並びにそれらの断片及び産物が、いずれの分析物も特異的結合対相互作用に関与できる任意の物質又は実体であるように含まれ得、例えば、そのためのエピトープ(すなわち、付着部位)、結合メンバー又は受容体(抗体など)を開発することができる。
本明細書で使用される場合、「結合ドメイン」という用語は、抗体、抗体誘導体、ペプチド、タンパク質又は核酸アプタマーの群から選択される部分を指す。「抗体」という用語は、認識された免疫グロブリン遺伝子の全部又は一部によって実質的にエンコードされる1つ以上のポリペプチドからなるタンパク質を指す。認識されている免疫グロブリン遺伝子には、例えばヒトでは、カッパ(κ)、ラムダ(l)及び重鎖遺伝子座が含まれ、これらは共に無数の可変領域遺伝子を含み、定常領域遺伝子はミュー(μ)、デルタ(δ)、ガンマ(γ)、シグマ(ε)及びアルファ(α)であり、それぞれIgM、IgD、IgG、IgE及びIgAアイソタイプをエンコードする。本明細書における抗体は、完全長抗体及び抗体断片を含むことを意味し、任意の生物由来の天然抗体、設計された抗体、又は実験、治療、若しくは以下でさらに定義される他の目的のために組換え生成された抗体を指し得る。抗体断片は当技術分野で公知であり、これらに限定されないが、抗体のFab、Fab’、F(ab’)2、Fv、scFv、又は他の抗原結合部分列を含み、全抗体又は組換えDNA技術を使用してデノボで合成されるもののいずれかの修飾によって産生される。抗体はモノクローナル又はポリクローナルであり得、細胞に対して他の特異的活性を有し得る(例えば、アンタゴニスト、アゴニスト、中和抗体、阻害抗体又は刺激抗体)。
「増幅」という用語は、核酸配列のコピー数が線形又は対数様式のいずれかで増加するように、「複製」が環状プロセスで繰り返されるプロセスを指す。そのような複製プロセスには、例えば、ローリングサークル増幅(RCA)、ポリメラーゼ連鎖反応(PCR)が含まれ得るが、これらに限定されない。DNAポリメラーゼによって駆動されるRCAは、Lizardi et al.,Nature Genet.19:225-232(1998);米国特許第5,854,033号及び6,143,495号;PCT出願番号WO97/19193)に記載されたように、等温条件下で線形又は幾何学キネティクスのいずれかを有する環状オリゴヌクレオチドプローブを増幅することができ、すべての参考文献は、その全体が組み込まれる。いくつかの実施形態では、RCAは、標的配列にハイブリダイズしたプローブ分子の環状化、及びそれに続く、米国特許第5,854,033号及び6,143,495号;PCT出願番号WO97/19193号に記載の環状プローブのローリングサークル増幅を含む。米国特許第5,854,033号及び6,143,495号;PCT出願番号WO97/19193、並びにDean et al.,Genome Research11:1095-1099(2001)に記載の通り、増幅産物の非常に高い収率をローリングサークル増幅を用いて得ることができる。本明細書で提供される参考文献は、その全体が組み込まれる。「アンプリコン」とは、目的のポリヌクレオチドの増幅中に生成されるポリヌクレオチドを意味する。一例では、ポリメラーゼ連鎖反応中にアンプリコンが生成される。
本明細書で使用される場合、「生物学的試料」は、対象(又は動物)から単離された組織又は体液の試料を指し、本開示の文脈では、一般に、病原体(例えば、ウイルスRNA)、ウイルス粒子(例えば、SARS-CoV-2ウイルスのウイルス粒子)及び/又は1つ以上の病原性抗原と特異的に結合する抗体若しくはその断片からの核酸を含有すると疑われる試料を指す。試料は、任意の処理の後、インビトロアッセイで分析することができる。対象となる典型的な試料には、呼吸分泌物(例えば、鼻腔、肺などの体液又は組織から得られた試料)、血液、血漿、血清、血球、糞便、尿、涙、唾液、乳、器官、生検、並びに腸管及び気道の分泌物が含まれるが、必ずしもこれらに限定されない。試料はまた、インビトロ細胞培養成分、例えば、これらに限定されないが、培養培地中の細胞及び組織の成長から生じる馴化培地、例えば組換え細胞、並びに細胞成分の試料を含む。
本明細書で使用される場合、「バーコード配列」、又は「検出可能なバーコード配列」、又は「分子タグ」、又は「バーコード標識」、又はそれらの文法的等価物は、ソース識別子として作用することができ、かつ/又はヌクレオチド配列(例えば、DNA、RNA)の認識を促進することができる部分(例えば、3~15ヌクレオチドのヌクレオチド配列)を意味する。特定の実施形態では、各オリジナルDNA又はRNA分子は、固有の配列バーコードに結合され、そのような配列は、本明細書に記載のアッセイの完了後に固有のソース配列又は固有の配列のセットまで追跡することができる。異なるバーコードを有する配列リードはオリジナル分子が異なることを表すが、同じバーコードを有する配列リードは1つのオリジナル分子からのPCR複製の結果であることが一般に理解される。標的定量化はまた、全リードカウントが不均一増幅によって標的に対してよりゆがみやすいので、全リードの数をカウントするのではなく、リード中の固有の分子バーコードの数をカウントすることによって達成され得る。「固有のバーコード」、「別個のバーコード」、又はそれらの文法的等価物とは、第1のバーコードが、その検出特性(例えば、固有の配列)又はその強度/濃度/絶対量のいずれかによって、検出アッセイにおいて第2のバーコード(又は他のすべてのバーコード)と識別され得ることを意味する。
本明細書を通して、略語は、ヌクレオチド(塩基とも呼ばれる)を指すために使用され、複数のヌクレオチドを指す略語を含む。本明細書で使用される場合、G=グアニン、A=アデニン、T=チミン、C=シトシン、及びU=ウラシルである。ヌクレオチドは、全体を通して小文字又は大文字を使用して称され得る。
2つのヌクレオチド配列は、それらの分子が塩基対構成相同性を共有する場合、互いに「相補的」である。「相補的」ヌクレオチド配列は、特異性と組み合わされて、適切なハイブリダイゼーション条件下で安定な二重鎖を形成する。例えば、2つの配列は、逆平行センスにおいて第1の配列の一部分が第2の配列の一部分に結合することができる場合、相補的であり、ここで各配列の3’末端は他の配列の5’末端に結合し、次いで1つの配列の各A、T(U)、G及びCは他の配列のT(U)、A、C及びGにそれぞれアラインメントされる。RNA配列は、相補的なG=U又はU=G塩基対も含み得る。したがって、2つの配列は、本開示下で「相補的」であるために完全な相同性を有する必要はない。通常、ヌクレオチドの少なくとも約85%(好ましくは少なくとも約90%、最も好ましくは少なくとも約95%)が分子の定義された長さにわたって塩基対構成を共有する場合、2つの配列は十分に相補的である。
本明細書で使用される「レーベンシュタイン距離スコア」という用語は、他のすべてのバーコードとの最大レーベンシュタイン距離を各バーコードに割り当て、レーベンシュタイン距離を降順にソートするスコアである。本明細書で使用される場合、「レーベンシュタイン距離」という用語は、2つの配列間の差異の程度に相当する。例えば、第1バーコード配列と第2バーコード配列との間のレーベンシュタイン距離は、第1バーコード配列を第2バーコード配列に変更するために必要な単一ヌクレオチド変化の数に相当する。レーベンシュタイン距離は平均化することができる。いくつかの実施形態では、接合部は、平均2つ以上の接合部距離を有するように設計される。いくつかの実施形態では、最大レーベンシュタイン距離をもたらすバーコード配列の設計が選択される。
用語「核酸」には、DNA、RNA(二本鎖又は一本鎖)、類似体(例えば、PNA分子又はLNA分子)及びそれらの誘導体が含まれる。本明細書で使用される「リボ核酸」及び「RNA」という用語は、リボヌクレオチドから構成されるポリマーを意味する。本明細書で使用される「デオキシリボ核酸」及び「DNA」という用語は、デオキシリボヌクレオチドから構成されるポリマーを意味する。「mRNA」という用語は、メッセンジャーRNAを意味する。
「オリゴヌクレオチド」は、一般に、約10~100ヌクレオチド長のヌクレオチド多量体を指し、「ポリヌクレオチド」は、任意の数のヌクレオチドを有するヌクレオチド多量体を含む。したがって、「核酸」という用語は、ポリヌクレオチドの従来の骨格が非天然発生又は合成の骨格で置き換えられたポリマー、及び従来の塩基の1つ以上がワトソン・クリック型水素結合相互作用に関与することができる基(天然又は合成)で置き換えられた核酸(又は合成若しくは天然の類似体)を含む。ポリヌクレオチドは、一本鎖又は複数本鎖の構成を含み、一本以上の鎖は、別の鎖と完全に一直線に並んでいても、又はそうでなくてもよい。「ヌクレオチド」は、核酸のサブユニットを指し、ホスフェート基、5炭素糖及び窒素含有塩基、並びにポリマー形態で(ポリヌクレオチドとして)、天然に存在するポリヌクレオチドと、2つの天然に存在するポリヌクレオチドのものと類似する配列特異的な様式でハイブリダイズすることができる、そのようなサブユニットの機能的類似体(合成又は天然を問わず)を有する。特に明記しない限り、「ポリヌクレオチド」、「オリゴヌクレオチド」、「核酸」及び「核酸分子」という用語の間の長さの意図した区別はなく、これらの用語は互換的に使用される。これらの用語は、分子の一次構造のみを指す。したがって、これらの用語には、例えば、3’-デオキシ-2’、5’-DNA、オリゴデオキシリボヌクレオチドN3’ P5’ホスホラミデート、2’-O-アルキル置換RNA、二本鎖及び一本鎖DNA、並びに二本鎖及び一本鎖RNA、DNA:RNAハイブリッド、並びにPNAとDNA又はRNAとの間のハイブリッドが含まれ、また、公知のタイプの修飾、例えば、当技術分野で公知の標識、メチル化、「キャップ」、1つ以上の天然に存在するヌクレオチドの類似体による置換、ヌクレオチド間修飾、例えば、非荷電結合を含むもの(例えば、メチルホスホネート、ホスホトリエステル、ホスホルアミデート、カルバメートなど)、負荷電結合を含むもの(例えば、ホスホロチオエート、ホスホロジチオエートなど)、及び正荷電結合を含むもの(例えば、アミノアルキルホスホルアミデート、アミノアルキルホスホトリエステル)、ペンダント部分を含むもの、例えば、タンパク質(ヌクレアーゼ、毒素、抗体、シグナルペプチド、ポリ-L-リジンなどを含む)、インターカレータを含むもの(例えば、アクリジン、ソラレンなど)、キレート剤を含むもの(例えば、金属、放射性金属、ホウ素、酸化金属など)、アルキル化剤を含むもの、修飾された結合を含むもの(例えば、アルファアノマー核酸など)、並びにポリヌクレオチド又はオリゴヌクレオチドの非修飾形態が含まれる、特に、DNAはデオキシリボ核酸である。
「オリゴヌクレオチド」は、一般に、約10~100ヌクレオチド長のヌクレオチド多量体を指し、「ポリヌクレオチド」は、任意の数のヌクレオチドを有するヌクレオチド多量体を含む。したがって、「核酸」という用語は、ポリヌクレオチドの従来の骨格が非天然発生又は合成の骨格で置き換えられたポリマー、及び従来の塩基の1つ以上がワトソン・クリック型水素結合相互作用に関与することができる基(天然又は合成)で置き換えられた核酸(又は合成若しくは天然の類似体)を含む。ポリヌクレオチドは、一本鎖又は複数本鎖の構成を含み、一本以上の鎖は、別の鎖と完全に一直線に並んでいても、又はそうでなくてもよい。「ヌクレオチド」は、核酸のサブユニットを指し、ホスフェート基、5炭素糖及び窒素含有塩基、並びにポリマー形態で(ポリヌクレオチドとして)、天然に存在するポリヌクレオチドと、2つの天然に存在するポリヌクレオチドのものと類似する配列特異的な様式でハイブリダイズすることができる、そのようなサブユニットの機能的類似体(合成又は天然を問わず)を有する。特に明記しない限り、「ポリヌクレオチド」、「オリゴヌクレオチド」、「核酸」及び「核酸分子」という用語の間の長さの意図した区別はなく、これらの用語は互換的に使用される。これらの用語は、分子の一次構造のみを指す。したがって、これらの用語には、例えば、3’-デオキシ-2’、5’-DNA、オリゴデオキシリボヌクレオチドN3’ P5’ホスホラミデート、2’-O-アルキル置換RNA、二本鎖及び一本鎖DNA、並びに二本鎖及び一本鎖RNA、DNA:RNAハイブリッド、並びにPNAとDNA又はRNAとの間のハイブリッドが含まれ、また、公知のタイプの修飾、例えば、当技術分野で公知の標識、メチル化、「キャップ」、1つ以上の天然に存在するヌクレオチドの類似体による置換、ヌクレオチド間修飾、例えば、非荷電結合を含むもの(例えば、メチルホスホネート、ホスホトリエステル、ホスホルアミデート、カルバメートなど)、負荷電結合を含むもの(例えば、ホスホロチオエート、ホスホロジチオエートなど)、及び正荷電結合を含むもの(例えば、アミノアルキルホスホルアミデート、アミノアルキルホスホトリエステル)、ペンダント部分を含むもの、例えば、タンパク質(ヌクレアーゼ、毒素、抗体、シグナルペプチド、ポリ-L-リジンなどを含む)、インターカレータを含むもの(例えば、アクリジン、ソラレンなど)、キレート剤を含むもの(例えば、金属、放射性金属、ホウ素、酸化金属など)、アルキル化剤を含むもの、修飾された結合を含むもの(例えば、アルファアノマー核酸など)、並びにポリヌクレオチド又はオリゴヌクレオチドの非修飾形態が含まれる、特に、DNAはデオキシリボ核酸である。
「マルチプレックス」又は「多重化」という用語は、単一の反応に組み合わされた複数の試料の同時検出を指す。複数の固有のバーコード配列で多重化すると、1つの実験においていくつかの試料の個別化された検出及びソース識別が可能になる。本明細書で使用される「マルチプレックスPCR」という用語は、同じ反応容器内の2つ以上の標的核酸の同時増幅及び検出を提供するアッセイを指す。各増幅反応は、別個のプライマー対を使用してプライミングされる。いくつかの実施形態において、各プライマー対の少なくとも1つのプライマーは、検出可能な部分で標識される。いくつかの実施形態において、マルチプレックス反応は、各標的核酸に対する特異的プローブをさらに含み得る。いくつかの実施形態において、特異的プローブは、種々の検出可能な部分で検出可能に標識される。
本明細書で使用される「プライマー」又は「オリゴヌクレオチドプライマー」という用語は、プライマー伸長産物の合成が誘導される条件下、例えばヌクレオチド及び重合誘導剤、例えばDNA又はRNAポリメラーゼの存在下、適切な温度、pH、金属濃度及び塩濃度に置かれた場合に、相補的核酸鎖の合成を開始するように作用するオリゴヌクレオチドを指す。プライマーは、一般に、プライマー伸長産物の合成におけるそれらの使用に適合する長さであり、通常は8~100ヌクレオチド長の範囲、例えば10~75、15~60、15~40、18~30、20~40、21~50、22~45、25~40など、より典型的には18~40、20~35、21~30ヌクレオチド長の範囲、及び記載された範囲の間の任意の長さである。典型的なプライマーは、10~50ヌクレオチド長、例えば15~45、18~40、20~30、21~25などの範囲、及び記載した範囲の間の任意の長さであり得る。いくつかの実施形態では、プライマーは通常、約10、12、15、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65又は70ヌクレオチド長以下である。
「プライマー」という用語は、ポリヌクレオチド、一般に、典型的には約12~約35ヌクレオチド長である「標的」結合部分を含むオリゴヌクレオチドであって、典型的なストリンジェンシー条件下で標的核酸隣接配列又は対応する増幅産物のプライマー結合部位と選択的にハイブリダイズするように設計され、対応するポリヌクレオチド鋳型に相補的であるヌクレオチド配列を、その3’末端から合成するための開始点として役立つオリゴヌクレオチドを指す。
プライマーは、通常、増幅の最大効率のために一本鎖であるが、代わりに二本鎖であってもよい。二本鎖の場合、プライマーは、通常、伸長産物を調製するために使用される前に、まずその鎖を分離するように処理される。この変性工程は、典型的には熱によって行われるが、代わりにアルカリを使用して実施し、続いて中和してもよい。したがって、「プライマー」は鋳型に相補的であり、水素結合又は鋳型とのハイブリダイゼーションによって複合体化して、ポリメラーゼによる合成開始のためのプライマー/鋳型複合体をもたらし、これはDNA合成の過程で、鋳型に相補的なその3’末端で連結される共有結合塩基の付加によって伸長される。
「フォワード」及び「リバース」という用語は、プライマー対のプライマーに関して使用される場合、ポリヌクレオチド配列上のプライマーの相対的な配向を示す。例えば、「リバース」プライマーは、典型的には、鋳型ポリヌクレオチドの「3’末端」における、又はその近くの下流プライマー結合部位と、右から左に向かって5’から3’の向きでアニーリングするように設計される。対応する「フォワードプライマー」は、ポリヌクレオチドの「5’末端」における、又はその近くの上流プライマー結合部位の相補体と、左から右への5’から3’の「フォワード」配向でアニーリングするように設計される。本明細書に記載の「プライマー対」は、フォワードプライマー及び対応するリバースプライマーを含む。
本明細書で使用される「プローブ」という用語は、特定の核酸配列上の相補的プローブ結合部位、例えばアンプリコンと配列特異的にハイブリダイズするように設計された部分を含むポリヌクレオチドを指す。本明細書に記載のプローブ及びプライマーの配列特異的部分は、標的核酸及び所望のアンプリコン中の相補的配列への特異的アニーリングを可能にするのに十分な長さである。
「ハイブリダイズする」及び「ハイブリダイゼーション」という用語は、ワトソン・クリック塩基対合を介して複合体を形成するのに十分に相補的なヌクレオチド配列間の複合体の形成を指す。プライマーが標的(鋳型)と「ハイブリダイズする」場合、そのような複合体(又はハイブリッド)は、DNA合成を開始するために、例えばDNAポリメラーゼによって必要とされるプライミング機能を果たすのに十分に安定である。
「ハイブリダイゼーションを可能にする条件」という語句は、プライマーがその相補的結合パートナーに優先的にハイブリダイズするか、又は特異的に結合し、他の配列とはより低い程度であるか、又は全くしない条件を指す。ハイブリダイゼーションを可能にする条件の一例は、50℃以上、0.1xSSC(15mM塩化ナトリウム/1.5mMクエン酸ナトリウム)でのハイブリダイゼーションである。ストリンジェントなハイブリダイゼーション条件の別の例は、50%ホルムアミド、5xSSC(150mM NaCl、15mMクエン酸三ナトリウム)、50mMリン酸ナトリウム(pH7.6)、5×デンハルト溶液、10%デキストラン硫酸、及び20mg/mlの変性断片化サケ***DNAの溶液中、42℃で一晩インキュベーションすること、続いてフィルターを約65℃の0.1xSSC中で洗浄することである。いくつかの実施形態では、ハイブリダイゼーションさせる条件は、上記の代表的な条件と少なくとも同程度にストリンジェントであるストリンジェントなハイブリダイゼーション条件であり、ここで条件は、それらが上記の特定の条件の少なくとも約80%程度でストリンジェント、典型的には少なくとも約90%程度でストリンジェントである場合、少なくとも同程度にストリンジェントであるとみなされる。他のストリンジェントなハイブリダイゼーション条件は当技術分野で公知であり、本明細書に記載されるこの特定の実施形態の核酸を同定するために使用することもできる。
「結合する」又は「結合された」とは、分子が目的の標的に優先的に結合するか、又は他の分子よりも大きな親和性で標的に結合することを意味する。例えば、抗原でコーティングされたビーズは、特異的結合抗体に結合し、いかなる免疫グロブリン分子にも結合しない。
「同定する」という用語は、任意の形態の測定を含み、検出される分析物の存在、非存在又は量を決定することを含む。一実施形態では、分析物は、COVID 19ポリヌクレオチド又は他のRNAウイルスポリヌクレオチドである。「決定する」、「検出する」、「測定する」、「評価する」、「査定する」及び「アッセイする」という用語は互換的に使用され、定量的及び定性的決定を含む。同定は、相対的又は絶対的であってもよい。「aを同定する」は、存在する何かの量を測定すること、及び/又は存在するか否かを判定することを含む。本明細書で使用される場合、「決定する」、「測定する」、及び「査定する」及び「アッセイする」という用語は互換的に使用され、定量的及び定性的決定の両方を含む。
本明細書で使用される「ハイスループットシーケンシング」「ハイスループット、大規模並行シーケンシング」、「第3世代シーケンシング」、又は「ナノポアシーケンシング」という用語は、クローン増幅分子の、及び単一核酸分子の複数のシーケンシング反応を並行して発生させることができるシーケンシング方法を指す。これにより、スループット及びデータの収率を向上させることができる。これらの方法は、次世代シーケンシング(NGS)方法としても当技術分野で公知である。NGS法には、例えば、可逆的色素ターミネーターを使用した合成によるシーケンシング、ライゲーションによるシーケンシング、及びナノポアシーケンシングが含まれる。一般的に使用されるNGSプラットフォームの非限定的な例としては、miRNA BeadArray(Illumina,Inc.)、Roche 454 TM GS FLXTM-Titanium(Roche Diagnostics)、ABI SOLiDTM System(Applied Biosystems,Foster City,CA)、及びHeliScope(商標)(Helices Biosciences Corp.,Cambridge MA)、及びオックスフォードナノポアシーケンサーが挙げられる。
本明細書で使用される「リード」という用語は、一般に、単一の核酸鋳型分子、又は鋳型核酸分子の複数の実質的に同一のコピーの集団から得られた配列組成物を含むデータを指す。
「逆転写酵素」とは、プライミングされた一本鎖RNA鋳型鎖を、デオキシリボヌクレオチド及び許容的反応媒体、例えば、これらに限定されないが、緩衝液(pH7.0-9.0)、ナトリウム及び/又はカリウムイオン及びマグネシウムイオンの存在下で相補的DNA鎖へと複製する酵素を意味する。当業者に明らかなように、許容的反応媒体の濃度及びpH範囲は、特定の逆転写酵素に関して変動し得る。当技術分野で周知の適切な「逆転写酵素」の例は、MmLV逆転写酵素及びその市販の誘導体「Superscript I、II及びIII」(Life Technologies)、「MaxiScript」(Fermentas)、RSV逆転写酵素及びその市販の誘導体「OmniScript」(Qiagen)、AMV逆転写酵素及びその市販の誘導体「Thermoscript」(Sigma-Aldrich)であるが、これらに限定されない。
本明細書で使用される「コロナウイルス」は、コロナウイルス科の属を指す。コロナウイルスは、大型の、エンベロープを有するプラス鎖RNAウイルスであり、組換えの頻度が高くなる独特の機構によって複製する。
用語「COVID 19」は、「Wuhan-hu-1」、「重症急性呼吸器症候群コロナウイルス2分離株、SARS-CoV-2」とも呼ばれ、ウイルスの科、すなわち、コロナウイルス科に属するウイルス、コロナウイルス研究グループ(de Groot 2013)の命名法に従うベータコロナウイルス属のグループIV((+)ssRNA)ウイルスを指す。
「中東呼吸器症候群コロナウイルス」という用語は、本明細書ではMERSとも略され、コロナウイルス研究グループ(de Groot 2013)の命名法に従うベータコロナウイルス属のグループIV((+)ssRNA)ウイルスである。このウイルスは、Zaki et al.(2012)、Bermingham et al.(2012)、van Boheemen et al.(2012)及びMuller et al.
2012によって、ヒトコロナウイルスEMCとして2012年に初めて記載された。ヒトベータコロナウイルス2c EMC/2012の完全ゲノムは、GenBank受入れ番号JX869059.2で寄託されている
2012によって、ヒトコロナウイルスEMCとして2012年に初めて記載された。ヒトベータコロナウイルス2c EMC/2012の完全ゲノムは、GenBank受入れ番号JX869059.2で寄託されている
用語「重症急性呼吸器症候群コロナウイルス、SARS-CoV」は、ウイルスの科、すなわち、コロナウイルス科に属するウイルス、コロナウイルス研究グループ(de Groot 2013)の命名法に従うベータコロナウイルス属のグループIV((+)ssRNA)ウイルスを指す。SARS-CoVゲノムRNAは、「29,700塩基対長であり、14のオープンリーディングフレーム(orf)を有し、他のコロナウイルスに類似するレプリカーゼ、スパイク、膜、エンベロープ及びヌクレオカプシド(N)、並びにいくつかの他の独特なタンパク質をエンコードする(Marra et al,2003;Rota et al,2003)。SARS-CoVゲノム長RNAは、50kDa-ヌクレオカプシドタンパク質(N)によってパッケージングされている可能性が高い[8]。他のコロナウイルスと同様に、ビリオンは、約140kDaのスパイク糖タンパク質(S)、23kDaの膜糖タンパク質(M)及び約10kDaのタンパク質(E)を含むいくつかのウイルス構造タンパク質を含む。
II.アンプリコン
一態様では、本開示はアンプリコンを含む組成物を提供する。本明細書に記載される多くの実施形態では、アンプリコンは、第1の固有のバーコード配列及びその逆相補体、標的特異的プライマーの対、標的増幅領域及びアダプター配列の第1の対を含む。標的特異的プライマーの対はフォワードプライマーとリバースプライマーとから構成され、それぞれが標的増幅領域(例えば、ウイルスゲノムの領域)内のプライミング部位に相補的な配列を有する。多くの実施形態において、フォワードプライマー及びリバースプライマーの各々は、標的増幅領域に隣接し、次に第1の固有のヌクレオチドバーコード配列及びその逆相補体に隣接し、第1の固有のバーコード配列及びその逆相補体は、アダプター配列の第1の対に隣接する。本明細書においてアダプター配列又はアダプターとも呼ばれるスペーサー配列は、典型的には、定義された長さ(例えば、10ヌクレオチド)の保存された配列を含む。5’から3’への例示的なアンプリコン構造は、[フォワード_アダプター]-[第1の固有のバーコード配列]-[フォワードプライマー]-[標的増幅領域]-[リバースプライマー]-[第1の固有のバーコード(リバース補完)]-[リバース_アダプター]である。いくつかの実施形態では、固有のバーコードの第2のセット、第2の固有のバーコード配列及びその逆相補体はライゲーションすることができる。5’から3’へのバーコードの第2のセットを有する例示的なアンプリコン構造は、[第2の固有のバーコード配列]-[第2のフォワード_アダプター]-[第1のフォワード_アダプター]-[第1の固有のバーコード配列]-[フォワードプライマー]-[標的増幅領域]-[リバースプライマー]-[第1の固有のバーコード(リバース補完)]-[第1のリバース_アダプター]-[第2のリバース_アダプター]-[第2の固有のバーコード(リバース補完)]である。SARS-Cov-2 PCR標的-N1遺伝子についての例示的なバーコード化フォワード及びリバースプライマー配列を以下に示す。
バーコード化フォワードプライマー-TAACTTGGTCGACCCCAAAATCAGCGAAAT(配列番号1)
バーコード化リバースプライマー-GTCTAAGTTGACCGTCATTGGTCTATTGAACCAG(配列番号2)
一態様では、本開示はアンプリコンを含む組成物を提供する。本明細書に記載される多くの実施形態では、アンプリコンは、第1の固有のバーコード配列及びその逆相補体、標的特異的プライマーの対、標的増幅領域及びアダプター配列の第1の対を含む。標的特異的プライマーの対はフォワードプライマーとリバースプライマーとから構成され、それぞれが標的増幅領域(例えば、ウイルスゲノムの領域)内のプライミング部位に相補的な配列を有する。多くの実施形態において、フォワードプライマー及びリバースプライマーの各々は、標的増幅領域に隣接し、次に第1の固有のヌクレオチドバーコード配列及びその逆相補体に隣接し、第1の固有のバーコード配列及びその逆相補体は、アダプター配列の第1の対に隣接する。本明細書においてアダプター配列又はアダプターとも呼ばれるスペーサー配列は、典型的には、定義された長さ(例えば、10ヌクレオチド)の保存された配列を含む。5’から3’への例示的なアンプリコン構造は、[フォワード_アダプター]-[第1の固有のバーコード配列]-[フォワードプライマー]-[標的増幅領域]-[リバースプライマー]-[第1の固有のバーコード(リバース補完)]-[リバース_アダプター]である。いくつかの実施形態では、固有のバーコードの第2のセット、第2の固有のバーコード配列及びその逆相補体はライゲーションすることができる。5’から3’へのバーコードの第2のセットを有する例示的なアンプリコン構造は、[第2の固有のバーコード配列]-[第2のフォワード_アダプター]-[第1のフォワード_アダプター]-[第1の固有のバーコード配列]-[フォワードプライマー]-[標的増幅領域]-[リバースプライマー]-[第1の固有のバーコード(リバース補完)]-[第1のリバース_アダプター]-[第2のリバース_アダプター]-[第2の固有のバーコード(リバース補完)]である。SARS-Cov-2 PCR標的-N1遺伝子についての例示的なバーコード化フォワード及びリバースプライマー配列を以下に示す。
バーコード化フォワードプライマー-TAACTTGGTCGACCCCAAAATCAGCGAAAT(配列番号1)
バーコード化リバースプライマー-GTCTAAGTTGACCGTCATTGGTCTATTGAACCAG(配列番号2)
本明細書中に提供される開示では、少なくとも1つのプライマーが使用され得る(例えば、対象からの試料をシーケンシングするために、又はライブラリーを調製するために)。いくつかの実施形態において、1つのプライマーを使用してもよい。いくつかの実施形態において、2つ以上のプライマーを使用してもよい。例えば、1、2、3、4、5、6、7、8、9、又は10のプライマーを使用することができる。いくつかの実施形態では、10を超えるプライマーを使用することができる。例えば、第1、第2、第3、第4、第5、第6、第7、第8、第9及び/又は第10のプライマーを使用することができる。いくつかの実施形態において、プライマーは、所望の配列を含むことができる。いくつかの実施形態において、プライマーは、2つ以上の所望の配列を含むことができる。例えば、所望の配列は、予め決定された配列、相補的配列、既知の配列、結合配列、ユニバーサル配列、又は検出配列であり得る。いくつかの実施形態において、予め決定された配列はユニバーサル配列であり得る。
いくつかの実施形態では、ポリヌクレオチド(例えば、標的配列又は標的増幅領域内の配列)を、所望の配列を含有する少なくとも1つのプライマーと接触させることができる。いくつかの実施形態では、プライマーは、限定されないが、ポリヌクレオチドにハイブリダイズ又はアニーリングされ得る。例えば、所望の配列(例えば、所定の標的配列)を有するプライマーを使用して、酵素を使用してポリヌクレオチドを増幅することができる。例えば、酵素はポリメラーゼ(例えば、Taqポリメラーゼ)であり得る。いくつかの実施形態では、所定の配列を含有するプライマーは、ポリヌクレオチドの3’末端又は5’末端にアニーリング又はハイブリダイズされ得る。いくつかの実施形態では、2つ以上の所定の配列が、ポリヌクレオチドにアニーリング又はハイブリダイズされ得る。例えば、第1の所定の配列は、ポリヌクレオチドの一端にアニーリング又はハイブリダイズされ得、第2の所定の配列は、ポリヌクレオチドの他端にアニーリング又はハイブリダイズされ得る。いくつかの実施形態では、第1の所定の配列は、第2の所定の配列に相補的であり得る。いくつかの実施形態では、第1の所定の配列は、第2の所定の配列に逆相補的であり得る。いくつかの実施形態では、第1の所定の配列は、第2の所定の配列に相補的でなくてもよい。
本明細書で提供される組成物及び方法において有用である非限定的な例示的プライマー対は、フォワードプライマー:GACCCCAAAATCAGCGAAAT(配列番号3)及びリバースプライマー:TCTGGTTACTGCCAGTTGAATCTG(配列番号4);フォワードプライマー:TTACAAACATTGGCCGCAAA(配列番号5)及びリバースプライマー:GCGCGACATTCCGAAGAA(配列番号6);フォワードプライマー:GGGAGCCTTGAATACACCAAAA(配列番号7)及びリバースプライマー:TGTAGCACGATTGCAGCATTG(配列番号8);フォワードプライマー:GTGARATGGTCATGTGTGGCGG(配列番号9)及びリバースプライマー:C AR ATGTT A A AS AC ACT ATT AGC AT A(配列番号10);フォワードプライマー:ACAGGTACGTTAATAGTTAATAGCGT(配列番号11)及びリバースプライマー:ATATTGCAGCAGTACGCACACA(配列番号12);フォワードプライマー:CCCTGTGGGTTTTACACTTAA(配列番号13)及びリバースプライマー:ACGATTGTGCATCAGCTGA(配列番号14);フォワードプライマー:GTACTCATTCGTTTCGGAAGAG(SEQ ID NO.:15)及びリバースプライマー:CCAGAAGATCAGGAACTCTAGA(配列番号16);フォワードプライマー:GGGGAACTTCTCCTGCTAGAAT(配列番号17)及びリバースプライマー:CAGACATTTTGCTCTCAAGCTG(配列番号18);及びフォワードプライマー:AGATTTGGACCTGCGAGCG(配列番号19)及びリバースプライマー:GAGCGGCTGTCTCCACAAGT(配列番号20)を含む。
いくつかの実施形態では、第1の固有のバーコード配列及びその逆相補体を用いた単一段階バーコード化手順が使用される。そのような実施形態では、第1の固有のバーコード及びその逆相補体並びにアダプター配列の第1の対は、増幅プロセスで使用されるプライマーによって導入される。これらの実施形態では、アダプター配列の第1の対は、少なくとも10~15ヌクレオチドを有する不変配列を有する。一実施形態では、不変アダプター配列は10ヌクレオチドを有する。特定の実施形態では、不変アダプター配列は、ACACTGACGACATGGTTCTACA(配列番号21)及びTACGGTAGCAGAGACTTGGTCT(配列番号22)に示すポリヌクレオチド配列を含む。他の不変アダプター配列を生成し、本開示の範囲内に含めることができる。別の実施形態では、第1の固有のバーコード配列及び第2の固有の逆相補体を用いた単一段階バーコード化手順が使用される。そのような実施形態では、第1の固有のバーコード、第2の固有の逆相補体及びアダプター配列の第1の対は、増幅プロセスで使用されるプライマーによって導入される。
他の実施形態では、第1の固有のバーコード配列及びその逆相補体、並びに第2の固有のバーコード配列及びその逆相補体を用いる2段階バーコード化手順が使用される。そのような実施形態では、第1の固有のバーコード配列及びその逆相補体、並びにアダプター配列(例えば、アダプター配列の第1の対)は、増幅プロセスで使用されるプライマーによって導入される。バーコードの第2のセット(例えば、段階1のプレートからプールされた試料を追跡するために使用されるバーコード、第2の固有のバーコード配列)をアンプリコンの末端にライゲーションする。結果として、不変アダプター配列は、2つのバーコードの間に位置することになる。これにより、2つのバーコードを互いに直接隣接させることに起因し得るアンビギュイティが回避される。いくつかの実施形態では、2つの異なる内側バーコード配列を用いる2段階バーコード化手順が使用される。いくつかの他の実施形態では、2つの異なる外側バーコード配列を用いる2段階バーコード化手順が使用される。さらに別の実施形態では、2つの異なる内側バーコード配列及び2つの異なる外側バーコード配列を用いる2段階バーコード化手順が使用される。異なる内側バーコード及び外側バーコードを用いるいくつかの実施形態では、すべての4つの(2つの内側及び2つの外側)バーコードが異なる。
以下で詳細に説明するように、2段階バーコード手順が使用される場合、隠れマルコフモデル(HMM)又は共分散モデル(CM)を生成するために使用される配列は、不変スペーサー配列の両側に、配列リードの統計的モデルに対するアラインメントがバーコードの両方のセットに正しくアノテーションを付けるように、アンビギュイティ配列を組み込む。代替案は、使用される第2段階バーコードのそれぞれについてHMM又はCMモデルを作成し、これらのモデルの一方の質を使用して第2段階バーコードの同一性を割り当てることである。2段階バーコード化を用いる多くの実施形態では、アダプター配列の2つの対、アダプター配列の第1の対及びアダプター配列の第2の対が存在する。いくつかの実施形態では、アダプター配列の第1の対及び第2の対は、少なくとも10~15ヌクレオチドを有する不変配列と同一である。一実施形態では、不変アダプター配列は10ヌクレオチドを有する。特定の実施形態では、不変アダプター配列は、ACACTGACGACATGGTTCTACA(配列番号21)及びTACGGTAGCAGAGACTTGGTCT(配列番号22)に示すポリヌクレオチド配列を含む。他の不変アダプター配列を生成し、本開示の範囲内に含めることができる。
多くの実施形態において、不変アダプター配列は各プライマーの5’末端にある。結果として、各アンプリコン配列は、5’末端において、フォワード鎖プライマーからのアダプター配列のコピーで始まり、3’末端において、リバース鎖プライマーに由来するアダプターの逆相補配列を有する。理論に束縛されることを望むものではないが、これらのアダプター配列は2つの目的を果たす。第1に、それらは、長いリードを構成アンプリコン配列にセグメント化するのを助け、第2に、それらは、以下に記載されるHMM又はCMアラインメントにおける固有のバーコード配列の位置を固定し、固有のバーコード配列の位置を確実にアノテーションすることを可能にする。
いくつかの実施形態では、外側バーコード(例えば、プレート/バッチ識別子)は、典型的にはライゲーション反応を使用して、バーコード化アンプリコンに付加される。ライゲーションされた外側バーコードは、第2のPCR段階に基づく増幅に固有の交差増幅を回避する。内側バーコードは、いくつかの事例では、少なくとも96ウェルを有するプレート内の複数の別個の試料からの特定の試料にアノテーションを付けるための、患者又はウェル固有のバーコードである。外側バーコードは、特定のバッチを示すことができ、又はプレートの複数のバッチを有する別個のプレートに複数の別個の試料がある場合、プレート識別子とすることができる。バーコード配列及びプライマーは、二次構造相互作用についてスクリーニングされた非常に大きな検証済みIDTバーコードライブラリーから選択され、高度に最適化されたエラー耐性バーコード設計をもたらす。バーコード配列を含む本明細書で提供される組成物及び方法の実施形態では、レーベンシュタイン距離(LD)バーコード最適化を行って、シーケンシングエラー耐性及び最大識別可能性を確保する。まず、候補バーコードのセットから、すべてのバーコードと1つおきのバーコードとの間のレーベンシュタイン距離が計算される。次いで、各バーコードに他のすべてのバーコードに対する最大レーベンシュタイン距離を割り当て、レーベンシュタイン距離の降順でソートすることによって、バーコードをランク付けする。次に、ランク付けされたリストからのバーコード候補を含むグループから所望の数の、それらを他のバーコードから分離する最大LDを有するバーコードが選択される(例えば、96、又は384)。
非限定的な例示的バーコード配列を表1に提供する。表1の96個のバーコード配列(3000+総バーコード内から選択された)は、最大レーベンシュタイン距離で分離されている。
いくつかの実施形態において、最大レーベンシュタイン距離で分離されたバーコード配列の384個が選択される。バーコード配列の選択はアルゴリズム的に行われ、選択サイズに応じて異なる結果をもたらす。本明細書で提供される方法及び組成物の多くの実施形態において、選択されるバーコード配列の数は、プライマーが構築されるバーコードプールのサイズに基づく。
いくつかの実施形態において、最大レーベンシュタイン距離で分離されたバーコード配列の384個が選択される。バーコード配列の選択はアルゴリズム的に行われ、選択サイズに応じて異なる結果をもたらす。本明細書で提供される方法及び組成物の多くの実施形態において、選択されるバーコード配列の数は、プライマーが構築されるバーコードプールのサイズに基づく。
バーコード及びバーコード化プライマーは、任意の生物、例えば、これらに限定されないが、ヒト、哺乳動物、さらには植物に特異的にすることができる。バーコードは、ヒト病原体(例えば、Sar-CoV-2)及びあらゆる種類の重要な獣医学的疾患の病原体(例えば、ウシ下痢、ヨーネ病、豚インフルエンザなど)についてアノテーションするように特に設計することができる。バーコードは、動物が各試料に標識され、適切にバーコードプライミングされている限り、群内の感染動物の個々の検出を容易にすることができる。
本明細書に記載される多くの実施形態では、標的増幅領域は、遺伝子又はタンパク質をエンコードする病原体のゲノム領域から増幅される。病原体は、アシネトバクター・バウマンニ(Acinetobacter baumannii)、アデノウイルス、アフリカ馬疫ウイルス、アフリカ豚コレラウイルス、ズビニ鉤虫(Anclostoma duodenale)、回虫、黄色アスペルギルス、アスペルギルス・フミガーツス(Aspergillus fumigatus)、アスペルギルス・ニガー(Aspergillus niger)、アスペルギルス・オリゼ(Aspergillus oryzae)、鳥インフルエンザウイルス、炭疽菌、炭疽菌パスツール株、Bacillus cereus Biovar anthracis、ウシ流産菌、ブルセラ・メリテンシス(Brucella melitensis)、ブルセラ・スイス(Brucella suis)、鼻疽菌、類鼻疽菌、カンジダ・アルビカンス(Candida albicans)、カンジダ・ドゥブリニエンシス(Candida dubliniensis)、カンジダ・グラブラタ(Candida glabrata)、カンジダ・クルセイ(Candida krusei)、カンジダ・トロピカリス(Candida tropicalis)、クラミジア・ニューモニエ(Chlamydia pneumoneae)、クラミジア・トラコマチス(Chlamydia trachomatous)、豚熱ウイルス、クロストリジウム・ディフィシール(Clostridium difficile)、コクシジオイデス・イミティス(Coccidioides immitis)、コクシジオイデス・ポサダシ(Coccidioides posadasii)、CoV-229E、CoV-HKU1、CoV-NL63、CoV-OC43、コクサッキーウイルスA、コクサッキーウイルスB、コクシエラ・バーネッティ(Coxiella burnetii)、クリミア・コンゴ出血熱、サイトメガロウイルス、デングウイルス、メジナ虫、東部馬脳炎、エボラウイルス、い粒条虫、多包条虫、エンテロバクター・クロアカ、エンテロコッカス・フェシウム(Enterococcus faecium)、エンテロウイルス、エプスタイン・バール・ウイルス、大腸菌、巨大肝蛭、肝蛭、***ウイルス、野兎病菌、山羊痘ウイルス、ヘモフィルス属インフルエンザ、ヘリコバクターピロリ、ヘンドラウイルス、A型肝炎ウイルス、B型肝炎ウイルス、C型肝炎ウイルス、ヒストプラスマ・カプスラーツム(Histoplasma capsulatum)、ズボアジ型ヒストプラスマ症(Histoplasma duboisii)、ヒトヘルペスウイルスHHV6、ヒトヘルペスウイルスHHV7、ヒトヘルペスウイルスHHV8、ヒトヘルペスウイルスHSV1、ヒトヘルペスウイルスHSV2、ヒト免疫不全ウイルス、ヒトパピローマウイルス、インフルエンザウイルスA型、インフルエンザウイルスB型、クレブシェラ肺炎桿菌、キャサヌール森林病ウイルス、ラッサ熱ウイルス、レジオネラ・ニューモフィラ菌、リーシュマニア・プロマスティゴート(Leishmania promastigotes)、Lujoウイルス、ランピースキン病ウイルス、マールブルグウイルス、麻疹ウイルス、メチシリン耐性黄色ブドウ球菌、サル痘ウイルス、ムンプスウイルス、マイコバクテリウム・アブセッサス(Mycobacterium abscessus)、マイコバクテリウム・アビウム(Mycobacterium avium)、マイコバクテリウム・ボビス(Mycobacterium bovis)、マイコバクテリウム・カヌッティイ(Mycobacterium canettii)、マイコバクテリウム・レプレ(Mycobacterium leprae)、ヒト結核菌、マイコバクテリウム・ウルセランス(Mycobacterium ulcerans)、マイコプラズマ・カプリコルム(Mycoplasma capricolum)、マイコプラズマ・ミコイデス(Mycoplasma mycoides)、マイコプラズマ・ニューモニア(Mycoplasma pneumoneae)、アメリカ十二指腸虫、淋病、ニューカッスル病ウイルス、ニパウイルス、ノルカジア属beijingensis、ノルカジア属cyriacigeorgica、ノルカジア属farcinica、ノロウイルスGI、ノロウイルスGII、ノーウォークウイルス、オムスク出血熱ウイルス、回旋糸状虫、発癌性ヒトパピローマウイルス、パラインフルエンザウイルス、寄生生物、マルネッフェイ型ペニシリウム症(Penicilliosis mameffei)、小反芻獣疫ウイルス、ニューモシスチス・イロベチイ(Pneumocystis jirovecii)、ポリオーマウイルス、プロテウス・ミラビリス(Proteus mirabilis)、緑膿菌、狂犬病ウイルス、8つの遺伝子断片すべてのコーディング領域の任意の部分を含有する、1918年のパンデミックインフルエンザウイルスの再構築された複製コンピテント形態、呼吸器合胞体ウイルス、ライノウイルス、発疹チフスリケッチア、リフトバレー熱ウイルス、牛疫ウイルス、ロタウイルスA、ロタウイルスB、ロタウイルスC、ロタウイルスG2、風疹ウイルス、SARS関連コロナウイルス(SARS-CoV)、SARS-CoV-1、SARS-CoV-2、ビルハルツ住血吸虫、日本住血吸虫、マンソン住血吸虫、羊痘ウイルス、南米出血熱ウイルスチャパレ、南米出血熱ウイルスグアナリト、南米出血熱ウイルスフニン、南米出血熱ウイルスマチュポ、南米出血熱ウイルスサビア、黄色ブドウ球菌、スタフィロコッカス・サプロフィティカス(Staphylococcus saprophyticus)、肺炎レンサ球菌、豚水疱病ウイルス、有鉤条虫、ダニ媒介性脳炎複合(flavi)ウイルス極東亜型、ダニ媒介性脳炎複合(flavi)ウイルスシベリア亜型、タバコモザイク病ウイルス、トルクテノウイルス、鞭虫、ブルーストリパノソーマ(Trypanosoma brucei)、トリパノソーマ・クルージ(Trypanosoma cruzi)、大痘瘡ウイルス(天然痘ウイルス)、小痘瘡ウイルス(アラストリム)、ベネズエラ馬脳炎ウイルス、バンクロフト糸状虫、ペスト菌、及び上記の病原体のいずれか1つと特徴的な核酸配列を共有する病原体、又は前述の群の病原体と特徴的な核酸配列を共有する、別の潜在的に新規若しくは特性決定されていない病原体からなる群から選択される。
一実施形態では、標的増幅領域は、SARS-CoV-2の特定のウイルスゲノム領域に相当する。標的増幅領域が増幅されるタンパク質をエンコードするゲノム領域の非限定的な例は、スパイクタンパク質(S)、受容体結合ドメイン(RBD)、S1タンパク質、S2タンパク質、E遺伝子、S遺伝子、Orflab遺伝子、N末端スパイクタンパク質ドメイン、全タンパク質(S1+S2)、及びヌクレオカプシド(N)タンパク質からなる群から選択される抗原をエンコードする領域を含む。一実施形態では、標的増幅領域は、Sタンパク質をエンコードする領域から増幅される。別の実施形態では、標的増幅領域は、Sタンパク質のRBDをエンコードする領域から増幅される。さらに別の実施形態では、標的増幅領域は、Nタンパク質をエンコードする領域から増幅される。
本明細書で提供されるアンプリコン構築物では、さらなるスペーサー配列(例えば、アダプター配列)がバーコードの外側に適用され得(例えば、バーコード配列の第1のセットに隣接する)、これらのスペーサー配列は、後のアンプリコン領域アノテーション(プロファイル隠れマルコフモデル又は共分散モデルアラインメントアルゴリズムによる関心領域のヌクレオチドごとのアノテーション)に重要である。いくつかの実施形態では、アンプリコンは2つのスペーサー配列のみを含む。他の実施形態では、アンプリコンは少なくとも4つ以上のスペーサー配列を含んでいた。いくつかの実施形態において、アダプター配列を含めて、複数のアンプリコンのそれぞれに第2の固有のバーコード配列を付加できるようにした。いくつかの例において、アダプター配列は配列読み取り中にマーカーとして作用して、バーコード配列の末端及び/又は次のバーコード配列の開始をシグナル伝達する。本明細書中に記載される実施形態の多くにおいて、スペーサー配列は保存されている。特定の実施形態では、バーコード化アンプリコン中のすべてのスペーサー配列は同一の配列であった。いくつかの実施形態において、アダプター配列は少なくとも10ヌクレオチドを含む。いくつかの他の実施形態において、アダプター配列は10~15ヌクレオチドを含む。一実施形態において、アダプター配列は10ヌクレオチドを含む。
III.シーケンシング、HMM及びCMエンジン
本明細書に記載される組成物及び方法の多くの実施形態では、ハイスループットシーケンシングが使用される。いくつかの実施形態では、ハイスループットシーケンシングを使用して、アンプリコン中の固有のバーコードを検出する。いくつかの他の実施形態では、ハイスループットシーケンシングを使用して、アンプリコンの標的増幅領域内の配列変異体を検出する。当技術分野で公知の任意のハイスループットシーケンシングプラットフォームを使用して、本明細書に記載のように調製されたシーケンシングライブラリーをシーケンシングすることができる(Myllykangas et al.,Bioinformatics fra・High Throughput Sequencing,Rodriguez-Ezpeleta et al.(eds.),Springer Science+Business Media,LLC,2012,11-25頁を参照)。例示的なハイスループットDNAシーケンシングシステムは、オックスフォードナノポアプラットフォーム(MinlON及びPromethlON機器を含む)、454 Life Sciencesによって最初に開発され、後にRoche(Basel,Switzerland)によって取得されたGS FLXシーケンシングシステム、Solexaによって開発され、後にlllumina Inc.(San Diego,CA)によって取得されたGenome Analyzer(Bentley,Curr Opin Genet Dev 16:545-52,2006;Bentley et al.,Nature 456:53-59,2008を参照)、Life Technologies(Foster City,CA)によるSOLiD配列システム(Smith et al.,Nucleic Acid Res 38:e 142,201 0;Valouev et al.,Genome Res 18:1051-63,2008を参照)、Complete Genomicsによって開発され、BGIによって取得されたCGA(Drmanac et al.,Science 327:78-81,201 0を参照)、Pacific Biosciences(Menlo Park,CA)によって開発されたPacBio RSシーケンシング技術(Eid et al.,Science 323:133-8,2009を参照)、及びLife Technologies Corporationによって開発されたIon Torrent(米国特許出願公開第2009/0026082号;2010/01 37143号;及び2010/0282617号を参照)を含むが、これらに限定されない。本明細書に記載の方法で使用されるオックスフォードナノポアDNAシーケンシングシステムは、通常に長さが250bp超えるアンプリコンを迅速かつ正確に読み取るのにより適している。Illuminaシーケンシングシステムは、比較的短いリードをもたらす長い処理時間及び合成によるシーケンシングのため、オックスフォードナノポアDNAシーケンシングシステム(例えば、ONT MinlON又はGridlON)と比較して本明細書に記載の方法に適していない可能性がある。
本明細書に記載される組成物及び方法の多くの実施形態では、ハイスループットシーケンシングが使用される。いくつかの実施形態では、ハイスループットシーケンシングを使用して、アンプリコン中の固有のバーコードを検出する。いくつかの他の実施形態では、ハイスループットシーケンシングを使用して、アンプリコンの標的増幅領域内の配列変異体を検出する。当技術分野で公知の任意のハイスループットシーケンシングプラットフォームを使用して、本明細書に記載のように調製されたシーケンシングライブラリーをシーケンシングすることができる(Myllykangas et al.,Bioinformatics fra・High Throughput Sequencing,Rodriguez-Ezpeleta et al.(eds.),Springer Science+Business Media,LLC,2012,11-25頁を参照)。例示的なハイスループットDNAシーケンシングシステムは、オックスフォードナノポアプラットフォーム(MinlON及びPromethlON機器を含む)、454 Life Sciencesによって最初に開発され、後にRoche(Basel,Switzerland)によって取得されたGS FLXシーケンシングシステム、Solexaによって開発され、後にlllumina Inc.(San Diego,CA)によって取得されたGenome Analyzer(Bentley,Curr Opin Genet Dev 16:545-52,2006;Bentley et al.,Nature 456:53-59,2008を参照)、Life Technologies(Foster City,CA)によるSOLiD配列システム(Smith et al.,Nucleic Acid Res 38:e 142,201 0;Valouev et al.,Genome Res 18:1051-63,2008を参照)、Complete Genomicsによって開発され、BGIによって取得されたCGA(Drmanac et al.,Science 327:78-81,201 0を参照)、Pacific Biosciences(Menlo Park,CA)によって開発されたPacBio RSシーケンシング技術(Eid et al.,Science 323:133-8,2009を参照)、及びLife Technologies Corporationによって開発されたIon Torrent(米国特許出願公開第2009/0026082号;2010/01 37143号;及び2010/0282617号を参照)を含むが、これらに限定されない。本明細書に記載の方法で使用されるオックスフォードナノポアDNAシーケンシングシステムは、通常に長さが250bp超えるアンプリコンを迅速かつ正確に読み取るのにより適している。Illuminaシーケンシングシステムは、比較的短いリードをもたらす長い処理時間及び合成によるシーケンシングのため、オックスフォードナノポアDNAシーケンシングシステム(例えば、ONT MinlON又はGridlON)と比較して本明細書に記載の方法に適していない可能性がある。
本明細書に記載の方法に適用される非限定的な例示的バイオインフォマティクスパイプラインの概要を図3に示す。バイオインフォマティクスパイプラインの工程1において、プールされたライブラリー調製物からのPCRアンプリコンをONT MinlON又はGridlONでシーケンシングして、生のONT FASTSシーケンシング出力ファイルを得る。次の工程では、高精度ONT GPUに基づくベースコーラーが生のFASTA/FASTQファイルをもたらす。次の工程は、FASTA/FASTQファイルを、統計的パターン分類アルゴリズムを適用するHMMER3及びCM配列アラインメント及びアノテーションエンジンに供して、a)複製配列リードに基づいて尤度を最大化すること、及び/又はb)全ゲノム多重配列アラインメントに基づいて文脈依存アラインメントモデルパラメータを使用することによってコンセンサス配列を生成する。最終的なフィルタリング工程において、二重バーコードを含むリードは、参照バーコード候補に対する最小レーベンシュタイン距離スコアに合格しなければならない。合格リードは、完全な標的配列アノテーション、モデルフィット、ビットスコア、バーコード位置、バーコード距離、及び他のメトリックと共に中央データベースに記憶される。
複数のアンプリコンの配列リードを提供するための様々な方法は、単一の分子を繰り返しシーケンシングすること、又は各々が関心領域の少なくとも一部を含む複数の分子をシーケンシングすることを含む。複数のアンプリコンの複数の配列リードのアラインメントは、一般に、例えば参照配列を使用するか又はデノボアセンブリルーチンを使用する、複数の配列アラインメントアルゴリズムを1つ以上含む。ある特定の実施形態において、コンセンサス配列を決定する方法を、所与の複数のバーコード配列リードのために反復して、例えば、リードの種々のサブセットを方法の種々の反復のために使用して適用した。そのようなサブセットは、様々な基準、例えば、様々なストリンジェントな品質閾値によって選択することができる。組み合わされた標的+リンカー+バーコード化プライマーは、リード品質及びコール精度の両方を改善し、ナノポアシーケンシングのロングリード能力を完全に利用する完全長のエラー耐性アンプリコンをもたらす。
本明細書中に記載される組成物及び方法の多くの実施形態において、バーコードの識別及び複数の配列の中からの各アンプリコンからの回収は、1つ以上の尤度モデル、エラーモデル、確率的グラフモデル(例えば、全経路確率的アラインメント)を適用する統計的パターン分類アルゴリズムの使用を必要とする。プロファイル隠れマルコフモデルアライナー(HMMER)及び場合により共分散モデル(Infernal)をバイオインフォマティクスツールとして使用して、各アンプリコンからの効率的なバーコード識別及び回収を可能にした。HMMER及びCMは、所与の特徴の一部であることの最大尤度を有するあらゆるヌクレオチド(挿入、置換及び欠失のようなシーケンサーのエラーに満ちたノイズの多い配列リードにおいてさえ)の標識を容易にする。例えば、バーコード領域は明確に定義され、確率的アライナーは、機器から出てくる配列内の各文字に「領域」アノテーションを割り当てる。これにより、別個のプライマーの同定が可能になり、さらに、誤って形成されたアンプリコン(例えばプライマー-二量体対)の同定も可能になる。HMMERは、検索データベースとは無関係に、所与のアラインメントが一致する長さを与えられる尤度に対応するビットスコアを割り当てる。これらのスコアは、各試料のアンプリコンをそれらの品質によってランク付けするのに重要であり、ナノポア機器のシーケンシングエラーの克服を可能にする。これらのアルゴリズムは、試料を逆多重化することができる能力にとって重要である。本明細書で提供されるアンプリコン配列は、プロファイルHMM及びCMによる最適な計算的アノテーション及びスコアリングのために設計された。
プロファイル隠れマルコフモデル(略してpHMM又はHMM)又は共分散モデル(CM)アラインメントエンジンなどの統計的モデルを本明細書に記載の方法で使用して、(1)ロングリードをそれらの構成アンプリコン配列にセグメント化し、(2)予め定義された配列モデルと一致する高品質のマッチングシーケンサー由来アンプリコン配列を同定し、(3)アンプリコン配列を、予め定義された配列モデルに対するそれらのアラインメント(一致としても知られる)の正確さ(「品質」)に従ってランク付けし、(4)予め定義された配列モデルの対応する(予めアノテーションされた)特徴に従ってアンプリコン内の内部人工配列ドメイン又は特徴を同定した。
本明細書中に記載される方法の多くの実施形態において、複数のアンプリコンの検出は、複数のアンプリコンのプールされた配列データセットを得ること、ベースコールを行うこと、複数のアンプリコンの配列データを予め定義されたアノテーション付きHMM又はCM遺伝子モデルにアラインメントすること、HMM/CMアラインメントの各々に階級(例えば、確率スコア又はビットスコア)を割り当てること、配列データをフィルタリングして位置アノテーション付き配列アラインメントを得ること、各アンプリコン内のバーコード並びにアンプリコンの配列内のバーコード及びアダプターの位置を決定することを含む。本明細書に記載の方法のすべての実施形態において、前述の工程は、適切にプログラムされたコンピュータを使用して実行される。本明細書に記載の方法のいくつかの実施形態では、高精度ONT GPUに基づくベースコーラーでベースコールが実行され、生のFASTA/FASTQファイルが生成される。これらの実施形態では、生ファイルは、プロファイルHMMエンジン及び/又はCMエンジンによってアラインメントされる。HMMエンジンは、複数の配列アラインメントをもたらすHMMERソフトウェアプログラムを含む。HMMERプログラムは、計算網羅的CMエンジンと比較して動作がかなり速いが、いずれのプログラムも、バーコード、標的増幅領域、プライマー、及びアダプターからなる群から選択される1つ又は複数の配列特徴についてヌクレオチドごとのアノテーションを割り当てる。
固有のバーコード配列、アダプター配列及び標的増幅領域についてのアノテーションを含む例示的なアラインメントファイルを図5A-図5Bに示す。
固有のバーコード配列、アダプター配列及び標的増幅領域についてのアノテーションを含む例示的なアラインメントファイルを図5A-図5Bに示す。
本明細書中に記載される方法の多くの実施形態において、フィルタリングは、合格スコア又は不合格スコアを配列アラインメントに割り当てることを含む。配列アラインメントは、参照バーコード化配列のセットに対して最小レーベンシュタイン距離スコアに合格する場合、及びアラインメントの最小ビットスコア閾値を合格する場合、合格スコアが割り当てられる。合格スコアを有する配列アラインメントは、典型的には中央データベースに記憶される。多くの場合、合格スコアを有する配列アラインメントは、試料中の病原体負荷の直接的な定量的表示に対応する。本明細書に記載のデータベースは、一般に、試料コレクションチューブに割り当てられた固有のバーコードの情報、少なくとも96個の固有のウェルバーコードのセットの情報、少なくとも96個の固有のプレートバーコードのセットの情報、複数のアンプリコンからの配列データのセットの情報及びレポートを有する。レポートは、各対象のソース識別情報及び対象が標的タンパク質の存在について陽性であるか陰性であるかに関する情報を含む。レポートは、対応する対象、又は診療所若しくは医師に提供することができる。
本明細書に記載される方法の多くの実施形態では、ナノポアシーケンシングのためのライブラリー調製の過程で、複数のアンプリコンを含有する高分子量コンカテマーをもたらす1つ又は複数のライゲーション工程が存在し得る。ナノポア装置は、時には数万ヌクレオチド長まで及び、多くの個々のアンプリコンを含むこれらのコンカテマーを単一の長いリードとして読み取る。シーケンサーはまた、このプールの一部でもある個々のライゲーションされていないアンプリコンを読み取る。HMM又はCM統計的モデルを使用して、これらのリードを、個々に分析されるそれらの構成アンプリコン配列へとセグメント化する。本明細書中に記載される方法の多くの実施形態において、プライマー設計は、各プライマーの5’末端に不変アダプター又はスペーサー配列を含む。結果として、各アンプリコン配列は、5’末端において、フォワード鎖プライマーからのスペーサー配列のコピーで始まり、3’末端において、リバース鎖プライマーに由来するスペーサーの逆相補配列を有する。これらのアダプター又はスペーサー配列は2つの目的を果たす。第1に、それらは、長いリードを構成アンプリコン配列にセグメント化するのを助け、第2に、それらは、HMM又はCMアラインメントにおけるバーコード配列の位置を固定し、バーコード配列の位置を確実にアノテーションすることを可能にする。
アラインメントエンジン(HMMについてはhmmer[S.R.Eddy、「Profile Hidden Markov Models」、Bioinformatics Review,Vol.14,no 9,1998,755-763頁を参照のこと]、又はCMについてはInfernal[Nawrocki 2009]に基づく)は、標的の配列及びアノテーションを含むファイルを読み取る。本明細書に記載される方法の例示的な実施形態では、標的は、SARS-CoV-2遺伝子N及びE遺伝子、ヒト遺伝子RNAseP、ベータ-アクチンの様々な領域、並びにバクテリオファージMS2の領域から選択され、かつ/又はTM3は対照として使用される。
特定の実施形態では、統計的パターン分類アルゴリズムは、動的ベイジアンネットワーク、例えば、プロファイル隠れマルコフモデル(プロファイルHMM)、共分散モデル(CM)を適用する。
簡潔には、バーコード位置を有する予め定義されたHMM/CM遺伝子モデル(1遺伝子=1HMM/CM)に、モデルごと、ヌクレオチドごとにアノテーションを付けた。HMM/CMエンジンは、すべてのリードをモデルに対してアラインメントし、次いで、確率ビットスコアを各アラインメントに割り当て、遺伝子ごとに最小ビットスコアでフィルタリングする。HMM/CMエンジンは、配列特徴についてヌクレオチドごとのアノテーションを割り当て、各リード内の正確なバーコード、リンカー、プライマー、及びウイルス遺伝子セグメントの同定及びアノテーションを可能にする。次いで、アラインメントエンジンは、提供されたモデル配列のそれぞれについて内部統計モデルを構築し、次いで、これらのモデルとの一致を求めて実行されたナノポアシーケンシングの全出力を検索する。それによって同定された各候補アラインメントについて、ソフトウェアは、ナノポアリード識別子、一致したHMM/CMモデル、得られたアラインメント(ギャップ、欠失、置換などを含む)、確率スコア、ビットスコア(確率スコアに関連するが、標的データベース検索サイズとは無関係である)、及び生のナノポア配列リード内のモデル一致の位置を含む他の詳細などを示すレポートを出力する。数十万~数百万のそのようなアラインメント(したがって、候補アンプリコン配列)が、通常の動作で生成される。レポートは、バーコード領域を識別し、アンプリコンバーコードとして所与のアラインメントにおける実際の塩基を抽出するスクリプトのセットと共に読み取られるので、特定の記号(例えば、出力ファイル内の「>」及び「<」文字で示される。)によるバーコード領域のアノテーションは重要である。同様のプロセスは、目的のさらなるバーコード又は他の配列特徴に対して行われる。
以下に、HMM/CM用の配列モデルのいくつかの例示的な定義を示す。
簡潔には、バーコード位置を有する予め定義されたHMM/CM遺伝子モデル(1遺伝子=1HMM/CM)に、モデルごと、ヌクレオチドごとにアノテーションを付けた。HMM/CMエンジンは、すべてのリードをモデルに対してアラインメントし、次いで、確率ビットスコアを各アラインメントに割り当て、遺伝子ごとに最小ビットスコアでフィルタリングする。HMM/CMエンジンは、配列特徴についてヌクレオチドごとのアノテーションを割り当て、各リード内の正確なバーコード、リンカー、プライマー、及びウイルス遺伝子セグメントの同定及びアノテーションを可能にする。次いで、アラインメントエンジンは、提供されたモデル配列のそれぞれについて内部統計モデルを構築し、次いで、これらのモデルとの一致を求めて実行されたナノポアシーケンシングの全出力を検索する。それによって同定された各候補アラインメントについて、ソフトウェアは、ナノポアリード識別子、一致したHMM/CMモデル、得られたアラインメント(ギャップ、欠失、置換などを含む)、確率スコア、ビットスコア(確率スコアに関連するが、標的データベース検索サイズとは無関係である)、及び生のナノポア配列リード内のモデル一致の位置を含む他の詳細などを示すレポートを出力する。数十万~数百万のそのようなアラインメント(したがって、候補アンプリコン配列)が、通常の動作で生成される。レポートは、バーコード領域を識別し、アンプリコンバーコードとして所与のアラインメントにおける実際の塩基を抽出するスクリプトのセットと共に読み取られるので、特定の記号(例えば、出力ファイル内の「>」及び「<」文字で示される。)によるバーコード領域のアノテーションは重要である。同様のプロセスは、目的のさらなるバーコード又は他の配列特徴に対して行われる。
以下に、HMM/CM用の配列モデルのいくつかの例示的な定義を示す。
示されている例示的なファイルは、Stockholm形式ファイルであり、SARS-CoV-2遺伝子N、E.ヒト遺伝子RNAseP、及び/又は対照として使用されるTM3の様々な領域由来の例示的な標的Nl_cdc、N2_cdc、E-Guelph、N-AMPDについての配列及びアノテーションを含む。ボックスで囲まれた領域は、例示的なアノテーションされたスペーサー又はアダプター、バーコード位置、ウイルスプライマー及び鋳型に対応する。一致したコンセンサス「SS_cons」配列内の「>」記号は、HMM/CMエンジンによって遂行され、バーコードである塩基を容易に識別し、そうでない塩基を無視できるように出力レポート内でアラインメントされる。
図5A及び図5Bは、それぞれ、SARS-CoV-2遺伝子N、E、ヒト遺伝子RNAsePの特定の領域であるE-Guelph及びRNAsePについての例示的なアラインメントレポートを示す。図5A及び図5Bの各図には、(上から下に向かって)コンセンサス(「モデル」)配列、使用される遺伝子モデル、遺伝子モデルとの一致、ナノポアシーケンサーからの実際のリードデータ(「67f21..」及び「46229...」で始まる行)、及びモデル配列(model-to-sequence)一致の様々な位置(モデル内の位置及びナノポアリード内の位置)を表す積層アラインメントがある。各アラインメントの上部にも与えられるスコアもあり、スコアビット、E値(ナノポアリードの検索データベースに対するこのアラインメント品質の一致の統計的有意性)などを表すスコアを含む。
このレポートを解析して、ナノポア動作から生じる数十万又は数百万のナノポアリードの各々についてこれらのデータの包括的な集計を生成し、次いで標識された特徴(ここでは、2つのバーコード、すなわち単一のバーコード及びその逆相補体が示されているが、他の任意の数も可能である)を抽出して、それらを中央データベースに保存した。したがって、診断リードを判定するプロセスは、合格する一致アラインメントの総数及びそれらの陽性のバーコード及びそれらの対照をカウントすることにすぎない。陰性患者は、病原体鋳型を欠くので増幅を発生させず、よってそれらのバーコードは、反応化学の調製において鋳型汚染が起こるまれな場合であっても、アンプリコン混合物中に存在しないか、又は実際の陽性と比較して非常に低いレベルで存在し得る。
このレポートを解析して、ナノポア動作から生じる数十万又は数百万のナノポアリードの各々についてこれらのデータの包括的な集計を生成し、次いで標識された特徴(ここでは、2つのバーコード、すなわち単一のバーコード及びその逆相補体が示されているが、他の任意の数も可能である)を抽出して、それらを中央データベースに保存した。したがって、診断リードを判定するプロセスは、合格する一致アラインメントの総数及びそれらの陽性のバーコード及びそれらの対照をカウントすることにすぎない。陰性患者は、病原体鋳型を欠くので増幅を発生させず、よってそれらのバーコードは、反応化学の調製において鋳型汚染が起こるまれな場合であっても、アンプリコン混合物中に存在しないか、又は実際の陽性と比較して非常に低いレベルで存在し得る。
上に示されたHMM/CM用配列モデルの例示的な定義において、各アンプリコン(例えば、N1_cdc、N2_cdc、E-Guelph、N-AMPD、RNAseP、TM3又はインフルエンザ若しくは他のウイルス遺伝子)のカテゴリーは、アンプリコン配列に最も高いスコアリング一致を与えるHMM又はCMモデルを選択することによって決定された。
不変のアダプター配列又はスペーサー配列が必須であるのは、それらが統計的HMMモデル又はCMモデルのスペーサー領域へのアラインメントを固定し、したがって配列中のバーコードヌクレオチドの明瞭なアノテーションを可能にするからである。配列モデル定義におけるバーコードは、それらの組成が本質的に高度に可変であるので、結局、「N」又はワイルドカード塩基として列挙される。固定スペーサーは、アライナーが一致を確信的に割り当てることができる領域を与え、次いで、アラインメントが実行される際の反復的な洗練のプロセスによって、バーコード領域が識別され、アノテーションされる。したがって、バーコードはアンプリコンにある程度「内在」するべきである。本明細書に記載のアダプター/スペーサーは約22bp長であり、これは可変数であり得る。バーコードがアンプリコン配列の5’末端又は3’末端に直接隣接していることは好ましくない。
2段階バーコード化手順が使用される場合、1つのバーコード及び不変スペーサーは、増幅プロセスにおいて使用されるプライマーによって導入される。バーコードの第2のセット(例えば、段階1のプレートからプールされた試料を追跡するために使用されるバーコード)をアンプリコンの末端にライゲーションする。結果として、不変スペーサー配列は、2つのバーコードの間に位置することになる。これにより、2つのバーコードを互いに直接隣接させることに起因し得るアンビギュイティが回避される。2段階バーコード手順が使用される場合、HMM又はCMモデルを生成するために使用される配列は、不変スペーサー配列の両側に、配列リードの統計的モデルに対するアラインメントがバーコードの両方のセットに正しくアノテーションを付けるように、アンビギュイティ配列を組み込む。代替案は、使用される第2段階バーコードのそれぞれについてHMM又はCMモデルを作成し、これらのモデルの一方の質を使用して第2段階バーコードの同一性を割り当てることである。
多重シーケンシングのプロファイルを表すための統計モデルの使用は、当業者に公知である。例えば、S.R.Eddy、「Profile Hidden Markov Models」、Bioinformatics Review,Vol.14,no 9,1998,755-763頁を参照されたい。HMMER(Janelia Farm Research Campus,Ashbum,Va.)から入手可能なユーザガイドに従って、HMMERソフトウェアパッケージを使用して核酸配列を分析した。HMMERソフトウェアプログラムの出力は、入力配列を特徴付けるプロファイルHMMである。ユーザガイドに記載されているように、プロファイルHMMは、複数の配列アラインメントの統計モデルである。それらは、アラインメントの各カラムがどの程度保存されているか、及び各位置でどの核酸残基が最も生じやすいかに関する位置特異的情報を捕捉する。HMMERソフトウェアプログラムの出力は、参照バーコード候補に対する最小レーベンシュタイン距離スコアを合格しなければならない二重バーコードを有する配列リードを含む。リードにはまた、最小ビットスコアフィルターでリードごとのアラインメントスコア(予め定義された遺伝子ごと)が割り当てられる。合格リードは、完全な標的配列アノテーション、モデルフィット、ビットスコア、バーコード位置、バーコード距離、及び他のメトリックと共に中央データベースに記憶される。ある特定の実施形態において、コンセンサス配列を決定することは、連続する位置の複数のセットの同定(例えば、異なるセットに対して異なる閾値を使用する)、及び連続する位置の複数のセットのための複数のコンセンサス配列の生成を必要とする。生成された複数のコンセンサス配列は、例えば確率に基づいてランク付けされ、クエリー配列をアラインメント及びスコア付けする前に、プロファイルHMMの確率パラメータを加法的対数オッズスコアに変換することによって確率スコア(例えば、ビットスコア)が与えられ得る(Barrett et al.,1997を参照のこと)。
本明細書で提供されるほとんどの実施形態では、アルゴリズムはコンピュータ実装方法である。それらの実施形態では、アルゴリズム及び/又は結果(例えば、生成されたコンセンサスバーコード化アンプリコン配列)は、コンピュータ可読媒体に記憶され、かつ/又はスクリーン又は紙の印刷物に表示される。完全な配列情報は、アンプリコンの合格及び不合格のためにPostgreSQL AWSデータベースに記憶された。
バーコード一致(内側の患者ごとのバーコード及び外側のプレートごとのバーコード)を記憶させて、リードを元のPCR反応に割り当てた。HMM/CMスコア、モデルフィット、及び生のFASTAファイル内の位置を保存した。配列及びアラインメント/一致表で、LIMS情報(プレート、バッチなど)の相互参照が可能になる。特定の態様では、結果をさらに分析して、個人に診断若しくは予後を提供するか、又は医療専門家に疾患の治療に有用な情報を提供する。
バーコード一致(内側の患者ごとのバーコード及び外側のプレートごとのバーコード)を記憶させて、リードを元のPCR反応に割り当てた。HMM/CMスコア、モデルフィット、及び生のFASTAファイル内の位置を保存した。配列及びアラインメント/一致表で、LIMS情報(プレート、バッチなど)の相互参照が可能になる。特定の態様では、結果をさらに分析して、個人に診断若しくは予後を提供するか、又は医療専門家に疾患の治療に有用な情報を提供する。
IV.標的核酸を同定するための方法
一態様では、本開示は、少なくとも1つの標的核酸を同定する方法を提供する。方法は、複数の対象から複数の生物学的試料を得る工程、生物学的試料の各々から全核酸を得る工程、複数のアンプリコンを産生するために増幅混合物を使用して複数のポリヌクレオチドを増幅に供する工程、複数のアンプリコンの各々を検出する工程、及び複数のアンプリコンのカテゴリーを決定する工程を含む。
一態様では、本開示は、少なくとも1つの標的核酸を同定する方法を提供する。方法は、複数の対象から複数の生物学的試料を得る工程、生物学的試料の各々から全核酸を得る工程、複数のアンプリコンを産生するために増幅混合物を使用して複数のポリヌクレオチドを増幅に供する工程、複数のアンプリコンの各々を検出する工程、及び複数のアンプリコンのカテゴリーを決定する工程を含む。
いくつかの実施形態では、複数の対象からの生物学的試料はポリヌクレオチドを含み、すなわち、核酸(例えば、DNA又はRNA)は対象から得られ、本明細書に記載の方法を使用して処理(溶解、増幅、及び/又は精製)され、核酸はシーケンシングされる。核酸は、当技術分野で公知の方法によって得ることができる。一般に、核酸は様々な技術、例えば、内容が参照によりその全体が本明細書に組み込まれるmanitis et al,molecular cloning:a guide to the Laboratory(Molecular Cloning:A Laboratory Manual),Cold Spring Harbor,N.Y.,N.280-281,(1982)に記載されるものによって生物学的試料から抽出することができる。
いくつかの実施形態では、複数の対象からの生物学的試料はDNAのみを含む。他の実施形態では、複数の対象からの生物学的試料はRNAのみを含む。方法の多くの実施形態では、複数の対象からの生物学的試料は、DNAとRNAとの混合物を含む。複数の対象からの生物学的試料が対象試料(例えば、血液試料)から収集されたRNA、例えばmRNAを含む実施形態では、RNAから逆転写されたcDNAを得るか、又はRNAからcDNAを逆転写するさらなる処理工程が必要である。DNA/RNA抽出のための一般的な方法は当技術分野で周知であり、Osebia(Ausubel)et al、Current Protocols of Molecular Biology、John Wiley and Sons(1997)を含む、分子生物学の標準的な教科書に開示されている。パラフィン包埋された組織からRNAを抽出するための方法は、例えば、Rupp(Rupp)and Rocker(Locker),laboratory investments(LabInvest.)56:A67(1987)、及びDeanderley(De Andres)et al,BioTechniques 18:42044(1995)に開示されている。これらの参考文献のそれぞれの内容は、その全体が参照により本明細書に組み込まれる。特に、RNA単離は、Qiagenなどの商業的製造業者からの精製キット、緩衝液セット及びプロテアーゼを製造業者の説明書に従って使用して実施することができる。例えば、QiagenのRNeasyミニカラムを使用して、培養中の細胞からすべてのRNAを単離することができる。他の市販のRNA単離キットとしては、MASTERPURE Complete DNA及びRNA精製キット(MASTERPURE Complete DNA and RNA purification Kit)(EPICENTRE,Madison,Wis.)及びパラフィンブロックRNA単離キット(Paraffin Block RNA Isolation Kit)(Ambion,Inc.))が挙げられる。全RNAを、RNA Stat-60(Tel-Test)を使用して組織試料から単離することができる。腫瘍から調製されたRNAは、例えば塩化セシウム密度勾配遠心分離によって単離することができる。RNAから逆転写されたcDNAを得るため、又はRNAからcDNAを逆転写するための方法及びキットは当技術分野で周知であり、例えば米国特許出願第5641864A号に開示されており、その内容はその全体が本明細書に組み込まれる。
一実施形態では、方法は、生物学的試料の各々から全RNAを得ること、生物学的試料の各々から全RNAを逆転写して複数のcDNAを得ること;フォワードプライマー及びリバースプライマーの固有のセットを使用してcDNAを増幅することを含み、ここでプライマーは、複数のcDNAの各々に相補的なヌクレオチドのセットを含む。別の実施形態では、方法は、生物学的試料の各々から全DNAを得ること;フォワードプライマー及びリバースプライマーの固有のセットを使用してDNAを増幅することを含み、ここでプライマーは、複数のDNAの各々に相補的なヌクレオチドのセットを含む。いくつかの実施形態では、超ハイスループットPCR自動装置を使用して、核酸試料(例えば、DNA及びcDNA)を増幅して複数のアンプリコンを産生する。
方法の一実施形態では、複数のポリヌクレオチドを増幅混合物を用いてPCR増幅に供して、複数のアンプリコンを産生する。方法の一実施形態では、増幅混合物は、複数のプライマー、フォワードプライマー及びリバースプライマーを含む。プライマーは、それらが結合するポリヌクレオチドの各々に相補的なヌクレオチドのセットを含む。一実施形態では、本明細書に記載の方法は、フォワードプライマー及びリバースプライマーの固有のセットを含む増幅混合物を使用したcDNAの増幅を提供する。プライマーは、複数のcDNAの各々に相補的なヌクレオチドのセットと、少なくとも1つの固有のヌクレオチドバーコード配列とを含む。プライマー配列は、11~35ヌクレオチド長、例えば15~25ヌクレオチド長であり得る。本明細書中に記載される方法において使用するための例示的なプライマー配列を、配列番号3~20に提供する。
いくつかの実施形態では、単一のプライマーを使用して、試料中のすべてのRNA分子を増幅することができる。例えば、プライマーは、ポリ(dT)又はランダムな配列で構成されるRNA補体部分、部分的にランダムな配列、及び/又は2種類以上のヌクレオチドと塩基対を形成することができるヌクレオチドを含むことができる。cDNAプライマーのRNA補体は、任意のRNA配列をそれが相補的であるもの、例えばすべてのmRNA(ポリ(dT)が使用される場合)又は一般的なすべてのRNA分子(一般的な配列が使用される場合)にハイブリダイズする。このようにして、試料中のすべてのRNA分子を逆転写することができる。他の実施形態では、プライマーは、例えば、ランダムな配列で構成されるcDNA補体部分、部分的にランダムな配列、及び/又は2種類以上のヌクレオチドと塩基対を形成することができるヌクレオチドを含むことができる。
いくつかの実施形態では、単一のローリングサークル増幅プライマーを使用して、試料中のすべてのRNA分子を増幅することができる。例えば、ローリングサークルプライマーは、cDNA分子中の多くの配列に対して相補的にする、ランダム配列を有することができる。他の実施形態では、一対のローリングサークル増幅プライマーは、cDNA鋳型中の配列に相補的な相補部分を有することができ、したがってこれらの2つのオリゴヌクレオチドのみによる指数関数的ローリングサークル増幅が可能になる。
いくつかの実施形態では、複数の環状化cDNA分子が鋳型になることができ、次いでローリングサークル増幅によって増幅され得る。ローリングサークル増幅は、それぞれが少なくとも1つの環状化cDNA鋳型に相補的であるプライマーセットによってプライミングすることができる。いくつかの例では、プライマーの相補的部分はcDNA配列に相補的であり得る。そのような場合、ローリングサークル増幅プライマーは、1つ又は少数のcDNA鋳型に特異的であり得る。ローリングサークル増幅プライマーは、ランダムな配列を有することができる。
一実施形態では、方法は、複数のアンプリコンを得るための標的核酸鋳型のPCR増幅を含む。本明細書に記載の方法では、標的核酸鋳型は標的増幅領域とも呼ばれる。方法は、標的cDNA鋳型を増幅して複数のアンプリコンを得ることを含む。いくつかの実施形態では、方法は、伸長されていないフォワードプライマー及びリバースプライマー(すなわち、「未使用」プライマー)の固有のセットを複数のアンプリコンから分離することをさらに含む。増幅/伸長される標的核酸を含有する核酸試料は、目的の核酸を含有する任意の試料から当業者に公知の方法によって調製され得る。加えて、QIAamp DNA mini kit、QIAamp FFPE Tissue kit、及びPAXgene DNA kitを含む、多くの核酸調製用キットが市販されており、使用することができる。例示的な試料には、ヒト由来の試料、例えば、血液、スワブ、体液、又は上記の試料から得られた材料及び画分、又は任意の細胞が含まれるがこれらに限定されない。いくつかの実施形態では、試料は、血液、粘液、唾液、汗、涙、体腔に蓄積する流体、尿、***液、膣分泌物、脳脊髄液、リンパ液、糞便、痰、分解液、嘔吐物、汗、母乳、血清及び血漿からなる群から選択される。特定の実施形態では、試料は唾液である。
標的核酸は、感染、疾患若しくは障害を伴うこと及び/又はそれらを示すことが知られているものである。本明細書に記載の標的核酸又は標的増幅領域は、これらに限定されないが、RNAウイルス、DNAウイルス、真菌及び細菌を含む1つ以上の病原体を含む試料から得ることができる。感染、疾患又は障害には、これらに限定されないが、様々なウイルス感染、細菌感染及び他の病原体によって引き起こされる疾患が含まれ得、標的核酸は、RNAウイルス、DNAウイルス、真菌及び細菌からなる群から選択される1つ以上の病原体を含む試料から得られる。
本明細書中に記載される方法のいくつかの実施形態において、標的核酸は、アシネトバクター・バウマンニ(Acinetobacter baumannii)、アデノウイルス、アフリカ馬疫ウイルス、アフリカ豚コレラウイルス、ズビニ鉤虫(Anclostoma duodenale)、回虫、黄色アスペルギルス、アスペルギルス・フミガーツス(Aspergillus fumigatus)、アスペルギルス・ニガー(Aspergillus niger)、アスペルギルス・オリゼ(Aspergillus oryzae)、鳥インフルエンザウイルス、炭疽菌、炭疽菌パスツール株、Bacillus cereus Biovar anthracis、ウシ流産菌、ブルセラ・メリテンシス(Brucella melitensis)、ブルセラ・スイス(Brucella suis)、鼻疽菌、類鼻疽菌、カンジダ・アルビカンス(Candida albicans)、カンジダ・ドゥブリニエンシス(Candida dubliniensis)、カンジダ・グラブラタ(Candida glabrata)、カンジダ・クルセイ(Candida krusei)、カンジダ・トロピカリス(Candida tropicalis)、クラミジア・ニューモニエ(Chlamydia pneumoneae)、クラミジア・トラコマチス(Chlamydia trachomatous)、豚熱ウイルス、クロストリジウム・ディフィシール(Clostridium difficile)、コクシジオイデス・イミティス(Coccidioides immitis)、コクシジオイデス・ポサダシ(Coccidioides posadasii)、CoV-229E、CoV-HKU1、CoV-NL63、CoV-OC43、コクサッキーウイルスA、コクサッキーウイルスB、コクシエラ・バーネッティ(Coxiella burnetii)、クリミア・コンゴ出血熱、サイトメガロウイルス、デングウイルス、メジナ虫、東部馬脳炎、エボラウイルス、い粒条虫、多包条虫、エンテロバクター・クロアカ、エンテロコッカス・フェシウム(Enterococcus faecium)、エンテロウイルス、エプスタイン・バール・ウイルス、大腸菌、巨大肝蛭、肝蛭、***ウイルス、野兎病菌、山羊痘ウイルス、ヘモフィルス属インフルエンザ、ヘリコバクターピロリ、ヘンドラウイルス、A型肝炎ウイルス、B型肝炎ウイルス、C型肝炎ウイルス、ヒストプラスマ・カプスラーツム(Histoplasma capsulatum)、ズボアジ型ヒストプラスマ症(Histoplasma duboisii)、ヒトヘルペスウイルスHHV6、ヒトヘルペスウイルスHHV7、ヒトヘルペスウイルスHHV8、ヒトヘルペスウイルスHSV1、ヒトヘルペスウイルスHSV2、ヒト免疫不全ウイルス、ヒトパピローマウイルス、インフルエンザウイルスA型、インフルエンザウイルスB型、クレブシェラ肺炎桿菌、キャサヌール森林病ウイルス、ラッサ熱ウイルス、レジオネラ・ニューモフィラ菌、リーシュマニア・プロマスティゴート(Leishmania promastigotes)、Lujoウイルス、ランピースキン病ウイルス、マールブルグウイルス、麻疹ウイルス、メチシリン耐性黄色ブドウ球菌、サル痘ウイルス、ムンプスウイルス、マイコバクテリウム・アブセッサス(Mycobacterium abscessus)、マイコバクテリウム・アビウム(Mycobacterium avium)、マイコバクテリウム・ボビス(Mycobacterium bovis)、マイコバクテリウム・カヌッティイ(Mycobacterium canettii)、マイコバクテリウム・レプレ(Mycobacterium leprae)、ヒト結核菌、マイコバクテリウム・ウルセランス(Mycobacterium ulcerans)、マイコプラズマ・カプリコルム(Mycoplasma capricolum)、マイコプラズマ・ミコイデス(Mycoplasma mycoides)、マイコプラズマ・ニューモニア(Mycoplasma pneumoneae)、アメリカ十二指腸虫、淋病、ニューカッスル病ウイルス、ニパウイルス、ノルカジア属beijingensis、ノルカジア属cyriacigeorgica、ノルカジア属farcinica、ノロウイルスGI、ノロウイルスGII、ノーウォークウイルス、オムスク出血熱ウイルス、回旋糸状虫、発癌性ヒトパピローマウイルス、パラインフルエンザウイルス、寄生生物、マルネッフェイ型ペニシリウム症(Penicilliosis mameffei)、小反芻獣疫ウイルス、ニューモシスチス・イロベチイ(Pneumocystis jirovecii)、ポリオーマウイルス、プロテウス・ミラビリス(Proteus mirabilis)、緑膿菌、狂犬病ウイルス、8つの遺伝子断片すべてのコーディング領域の任意の部分を含有する、1918年のパンデミックインフルエンザウイルスの再構築された複製コンピテント形態、呼吸器合胞体ウイルス、ライノウイルス、発疹チフスリケッチア、リフトバレー熱ウイルス、牛疫ウイルス、ロタウイルスA、ロタウイルスB、ロタウイルスC、ロタウイルスG2、風疹ウイルス、SARS関連コロナウイルス(SARS-CoV)、SARS-CoV-1、SARS-CoV-2、ビルハルツ住血吸虫、日本住血吸虫、マンソン住血吸虫、羊痘ウイルス、南米出血熱ウイルスチャパレ、南米出血熱ウイルスグアナリト、南米出血熱ウイルスフニン、南米出血熱ウイルスマチュポ、南米出血熱ウイルスサビア、黄色ブドウ球菌、スタフィロコッカス・サプロフィティカス(Staphylococcus saprophyticus)、肺炎レンサ球菌、豚水疱病ウイルス、有鉤条虫、ダニ媒介性脳炎複合(flavi)ウイルス極東亜型、ダニ媒介性脳炎複合(flavi)ウイルスシベリア亜型、タバコモザイク病ウイルス、トルクテノウイルス、鞭虫、ブルーストリパノソーマ(Trypanosoma brucei)、トリパノソーマ・クルージ(Trypanosoma cruzi)、大痘瘡ウイルス(天然痘ウイルス)、小痘瘡ウイルス(アラストリム)、ベネズエラ馬脳炎ウイルス、バンクロフト糸状虫、ペスト菌、及び上記の病原体のいずれか1つと特徴的な核酸配列を共有する病原体、又は前述の群の病原体と特徴的な核酸配列を共有する、別の潜在的に新規若しくは特性決定されていない病原体からなる非限定的な群から選択される1つ以上の病原体を含む試料から得られる。一実施形態では、標的核酸は、SARS-CoV-2を含む唾液試料から得られる。
方法の多くの実施形態では、少なくとも1つの固有のバーコード配列及びその逆相補体がそれぞれフォワードプライマー及びリバースプライマーのそれぞれに導入され、増幅後に各アンプリコンを固有に同定する。フォワード及び/又はリバースプライマーは、バーコード配列と呼ばれる固有のヌクレオチド配列を含む。この配列は、特定の標的核酸を独自に同定する。バーコード配列の長さは、3~20ヌクレオチド長、例えば5~15ヌクレオチド長であり得る。本明細書に記載の方法で使用するための非限定的な例示的バーコード配列を表1に提供する。本明細書に記載されるように、表1の例示的配列は、最大レーベンシュタイン距離で分離された3000+総バーコード内から選択される。いくつかの実施形態において、最大レーベンシュタイン距離で分離されたバーコード配列の384個が選択される。バーコード配列の選択はアルゴリズム的に行われ、選択サイズに応じて異なる結果をもたらす。本明細書で提供される方法及び組成物の実施形態において、選択されるバーコード配列の数は、プライマーが構築されるバーコードプールのサイズに基づく。
いくつかの実施形態では、バーコード配列は完全にランダムであってもよく、すなわち、A、T、G、及びCのいずれか1つがバーコード配列の任意の位置にあってもよい。ランダムバーコードは合成するのに経済的である。他の実施形態では、バーコード配列は、合成的に個別に合成され(例えば、Twist Bio)、それにより、異なるバーコードオリゴが確実にそれぞれ独立して合成される。本明細書中に記載される実施形態において、バーコードは、フォワードプライマー配列及びリバースプライマー配列の一部である。例示的なバーコード化プライマー配列を配列番号1及び2に提供する。例えば、バーコード化一致フォワード及びリバースプライマーのセットは、プライミングされたウイルス配列の5’末端及び3’末端の両方に同じ(又はフォワード/リバース補完された)バーコードを有するバーコード化アンプリコンを生成する。ウイルス配列は、プライマー自体を含む。特定の実施形態では、バーコード配列は、準定義されているか、又は完全に定義されている。
そのような配列を使用することにより、バーコードエラーを軽減することができる。しかしながら、そうすること、特に高度なマルチプレックスPCRにおいて多くの異なるプライマーのために完全に定義されたバーコード配列を使用することは、場合によっては法外に高い費用がかかることがある。
そのような配列を使用することにより、バーコードエラーを軽減することができる。しかしながら、そうすること、特に高度なマルチプレックスPCRにおいて多くの異なるプライマーのために完全に定義されたバーコード配列を使用することは、場合によっては法外に高い費用がかかることがある。
方法のいくつかの実施形態では、第1の固有のバーコード及びその逆相補体並びに本明細書では内側バーコードとも呼ばれるアダプター配列の第1の対は、増幅プロセスで使用されるプライマー(本明細書ではバーコード化プライマーとも呼ばれる)によって導入される。方法のいくつかの実施形態では、第2の固有のバーコード配列及びその逆相補体は、本明細書では外側バーコードとも呼ばれ(例えば、プレート/バッチ識別子)、典型的にはライゲーション反応を用いて、バーコード化アンプリコンに付加される。ライゲーションされた外側バーコードは、第2のPCR段階に基づく増幅に固有の交差増幅を回避する。ライゲーション(DNAリガーゼ酵素を使用)工程は、第1のバーコード化アンプリコンの両端に、「外側」バーコードを含有するDNA断片の第2のセットを付加する。ライゲーションにより、バーコードのコンビナトリアルアセンブリが可能になり、大規模マルチプレックス(例えば、384の内側バーコード×384の外側バーコード=147456の固有の二重バーコード化アンプリコン)が可能になる。内側バーコードは、いくつかの事例では、少なくとも96ウェルを有するプレート内の複数の別個の試料からの特定の試料にアノテーションを付けるための、患者又はウェル固有のバーコードである。外側バーコードは、特定のバッチを示すことができ、又はプレートの複数のバッチを有する別個のプレートに複数の別個の試料がある場合、プレート識別子とすることができる。バーコード配列及びプライマーは、二次構造相互作用についてスクリーニングされた非常に大きな検証済みIDTバーコードライブラリーから選択され、高度に最適化されたエラー耐性バーコード設計をもたらす。
バーコード化プライマーの伸長は、核酸試料中のすべてのプライマー及び標的核酸を反応緩衝液中のDNAポリメラーゼと組み合わせることによって実施され得る。好ましくは、バーコード化プライマーによる標的核酸へのアニーリング及び/又はバーコード化プライマーの伸長を、高温、例えば50℃~75℃、例えば55℃、60℃、65℃、70℃又は72℃で行って、標的核酸とバーコード化プライマーとの間のアニーリング特異性を高める。核酸試料中の標的核酸は、典型的には、バーコード化プライマーでアニーリングする前に、例えば高温(例えば、95℃又は98℃)でインキュベートすることによって最初に変性される。標的核酸の変性、プライマーアニーリング及びプライマー伸長は、サーマルサイクラーで行われ得る。
ホットスタートDNAポリメラーゼが使用される特定の実施形態では、DNAポリメラーゼ活性化は、サーマルサイクラーでの標的核酸変性と同時に行うこともできる。好ましくは、バーコード化プライマー伸長に使用されるDNAポリメラーゼは熱安定性である。例示的なDNAポリメラーゼとしては、Taqポリメラーゼ(Thermus aquaticus製)、Tfiポリメラーゼ(Thermus filiformis製)、Bstポリメラーゼ(Bacillus stearothermophilus製)、Pfuポリメラーゼ(Pyrococcus furiosus製)、Tthポリメラーゼ(Thermus thermophilus製)、Powポリメラーゼ(Pyrococcus woesei製)、Tliポリメラーゼ(Thermococcus litoralis製)、Ultimaポリメラーゼ(Thermotoga maritima製)、KODポリメラーゼ(KOD ホットスタートポリメラーゼ(EMD Biosciences製)、Deep Vent(商標)DNAポリメラーゼ(New England Biolabs製)、Platinum(商標)Taq DNA Polymerase High Fidelity(Invitrogen製)が挙げられる。
方法のいくつかの実施形態では、フォワードプライマー及びリバースプライマーは、アダプター配列の1つ以上の対を含む。他の実施形態では、アダプター配列は、プライミングされた標的増幅領域配列の5’末端及び3’末端の両方にあるバーコード配列にライゲーションされる。本明細書中に記載される実施形態の多くにおいて、アダプター配列はスペーサー配列の機能を提供する。いくつかの例において、アダプター配列は配列読み取り中にマーカーとして作用して、バーコード配列の末端及び/又は次のバーコード配列の開始をシグナル伝達する。本明細書に記載されるいくつかの実施形態では、アダプター配列はユニバーサル配列を含み得る。特定の実施形態において、アダプター配列は保存された配列である。方法のいくつかの実施形態において、アダプター配列は少なくとも10ヌクレオチドを含む。方法のいくつかの他の実施形態において、アダプター配列は10~15ヌクレオチドを含む。方法の一実施形態において、アダプター配列は10ヌクレオチドを含む。非限定的な例示的アダプター配列は、配列番号21及び22に提供されている。本明細書に記載される方法のいくつかの実施形態では、第1の固有のバーコード配列及びその逆相補体を用いた単一段階バーコード化が使用される。そのような実施形態では、第1の固有のバーコード及びその逆相補体並びにアダプター配列の第1の対は、増幅プロセスで使用されるプライマーによって導入される。本明細書に記載される方法の他の実施形態では、第1の固有のバーコード配列及びその逆相補体、並びに第2の固有のバーコード配列及びその逆相補体を用いる2段階バーコード化が使用される。そのような実施形態では、1つのバーコード(例えば、第1の固有のバーコード配列)及びアダプター配列(例えば、アダプター配列の第1の対)は、増幅プロセスで使用されるプライマーによって導入される。バーコードの第2のセット(例えば、段階1のプレートからプールされた試料を追跡するために使用されるバーコード、第2の固有のバーコード配列)をアンプリコンの末端にライゲーションする。結果として、不変アダプター配列は、2つのバーコードの間に位置することになる。他のアダプター配列を生成し、本開示の範囲内に含めることができる。
プライマーのユニバーサルプライマー配列は、さらなる増幅に使用され得る配列である。いくつか様々な増幅戦略が当業者に知られている。すべての増幅技術は開始についてプライマーに依存しており、このプライマーはバーコードを組み込むように操作することができる。好ましくは、この配列は、核酸試料中の目的の標的核酸又は他の核酸と有意な相同性を有さない(すなわち、その全長にわたって50%未満の配列同一性を有する)。上述のように、複数のプライマーを使用して、異なる標的核酸に異なるバーコードを割り当てる。いくつかの実施形態では、標的核酸は単一の病原体に由来するが、他の実施形態では、標的核酸は少なくとも2つの異なる病原体に由来する。複数のプライマーのうち、ユニバーサルプライマー配列は同一であり得るが、プライマーの標的特異的配列(すなわち、標的ヌクレオチド配列に相補的な配列)は異なる。異なるプライマーの配列における同じユニバーサル配列は、単一のプライマーを使用したアンプリコンのその後の増幅を可能にする。
本明細書中に記載される方法のいくつかの実施形態において、5’アダプター領域配列及び/又は試料識別領域(例えば、固有のバーコードヌクレオチド配列)が、例えば、逆転写中に、単一の試料に由来するすべてのcDNAに付加される。いくつかの態様では、3’特異的プライマーを使用して、単一試料中の任意のポリヌクレオチドを増幅することができる。いくつかの態様では、5’可変領域、例えばウイルス粒子からの一本鎖RNAを有するポリヌクレオチドが増幅され、複数の縮重した5’プライマーが目的の特定の領域を増幅する必要はない。プライマーはまた、IgG、IgM、IgD、IgA、IgE、TCR鎖、及び他の目的の遺伝子に特異的であり得る。
いくつかの実施形態では、アダプター領域は、2、3、4、5、6、7、8、9、10又はそれ以上のGを含む。いくつかの態様では、cDNAは、その3’末端に1、2、3、4、5、6、7、8、9、10又はそれ以上のCを含む。いくつかの実施形態において、アダプター領域は、cDNAの5’末端に結合する。他の実施形態において、アダプター領域は、cDNAの3’末端に結合する。さらに別の実施形態において、アダプター領域は、cDNAの5’及び3’末端に結合する。アダプター領域を結合する方法は、これらに限定されないが、5’隣接アダプター領域配列を有するプライマーを用いたPCRの実施、粘着性及び平滑末端のライゲーション、ヌクレオチドの鋳型スイッチング介在付加、又はポリヌクレオチドを、ヌクレオチドの5’末端、3’末端若しくは5’末端及び3’末端に共有結合的に付着させる他の方法を含む、種々の方法が存在する。これらの方法は、分子生物学で一般的に使用される酵素の特性を利用することができる。PCRは、例えば、好熱性DNAポリメラーゼを使用することができる。相補的又は実質的に相補的な粘着性末端は、オーバーハングした末端を残す制限酵素でのdsDNA切断によって、又はTdT(末端トランスフェラーゼ)などの酵素の3’テーリング活性によって生成される。次いで、T4リガーゼなどのリガーゼを使用して、粘着性末端及び平滑末端を相補的アダプター領域とライゲーションすることができる。アダプターを平滑末端核酸にライゲーションする方法は当技術分野で公知であり、本明細書で提供されるPCRの増幅産物からシーケンシングライブラリーを生成する際に使用され得る。例示的な方法には、Sambrook J and Russell DW,editors.(2001)Molecular Cloning:A Laboratory Manual.3rd ed.Cold Spring Harbor,NY:Cold Spring Harbor Laboratory,QIAGEN GENEREAD(商標)Library Prep(L)Handbook、及び米国特許出願公開第2010/0197509号、201 3/0005613号に記載されるものが含まれる。一実施形態では、本明細書に記載の方法は、場合により、複数の増幅プライマーを使用したcDNAの増幅を提供する。
本明細書中に記載される方法の一実施形態において、固有のバーコード化プライマーの数は、少なくとも50、少なくとも100、少なくとも300、少なくとも500、少なくとも750又は少なくとも1000である。単一の反応におけるそのような固有のバーコード化プライマーを使用すると、比較的多数の標的核酸の分析、例えば複数の試料からのポリヌクレオチドの並行シーケンシング分析が可能になる。個々の標的核酸又はアンプリコンについて、バーコード化プライマーがDNAのプラススタンド又はマイナススタンドにアニーリングするかどうかをランダムに選択することができる。例えば、同じ個体からの異なるウイルス標的を多重化する場合、多重化は2程度と少なくても、又は1000程度と多くてもよい。
一実施形態では、本明細書に記載の方法は、場合によりアンプリコンから未使用のプライマー(すなわち、伸長されていないバーコード化プライマー)を分離する工程を含む。未使用のプライマーの除去は、「バーコードリサンプリング」問題、すなわち同じDNA鋳型が複数の分子バーコードに関連するリスクを最小限に抑える。そのような問題は、分子バーコード化の利益を無効にするであろう。未使用のプライマーの分離は、サイズ選択精製によって行うことができる。アンプリコンは、ビーズ又はシリカカラムベースのサイズ選択システム、例えばAgencourt AMPure XPシステム及びGeneRead Size Selectionシステムを使用して非伸長プライマーから精製され得る。必要に応じて、そのようなシステムによる2回以上の精製を使用することができる。あるいは、エキソヌクレアーゼ酵素(例えば、ThermoFisher製ExoSAP-IT(商標))による一本鎖DNAクリーンアップ工程を本明細書に記載の方法に組み込むことができる。「バーコードリサンプリング」の問題を回避する1つのさらなる方法は、2つのPCR工程は実施しないが、1つのPCR工程を実施して第1のプライマーを作製し、次いで第2の外側バーコードをライゲーションすることである(増幅なし)。1つの実施形態において、本明細書中に記載される方法は、アンプリコンのさらなる増幅をさらに含み得る。さらなる増幅は、上記のユニバーサルプライマーの対の存在下で行うことができる。
本明細書に記載の方法は、複数のアンプリコンのそれぞれについての検出工程を含む。多くの実施形態において、検出は、アンプリコンのそれぞれにおける固有のバーコードの配列を読み取ることによって行われる。方法のいくつかの実施形態では、少なくとも1つの陽性対照試料をシーケンシングし、ここで陽性対照試料は標的核酸を含む。本明細書に記載される方法の実施形態では、ハイスループットシーケンシングを使用して、アンプリコン中の固有のバーコードを検出する。当技術分野で公知の任意のハイスループットシーケンシングプラットフォームを使用して、本明細書に記載のように調製されたシーケンシングライブラリーをシーケンシングすることができる(Myllykangas et al.,Bioinformatics for・High Throughput Sequencing,Rodriguez-Ezpeleta et al.(eds.),Springer Science+Business Media,LLC,2012,11-25頁を参照)。例示的なハイスループットDNAシーケンシングシステムは、オックスフォードナノポアプラットフォーム(MinlON及びPromethlON機器を含む)、454 Life Sciencesによって最初に開発され、後にRoche(Basel,Switzerland)によって取得されたGS FLXシーケンシングシステム、Solexaによって開発され、後にlllumina Inc.(San Diego,CA)によって取得されたGenome Analyzer(Bentley,Curr Opin Genet Dev 16:545-52,2006;Bentley et al.,Nature 456:53-59,2008を参照)、Life Technologies(Foster City,CA)によるSOLiD配列システム(Smith et al.,Nucleic Acid Res 38:e 142,2010;Valouev et al.,Genome Res 18:1051-63,2008を参照)、Complete Genomicsによって開発され、BGIによって取得されたCGA(Drmanac et al.,Science 327:78-81,2010を参照)、Pacific Biosciences(Menlo Park,CA)によって開発されたPacBio RSシーケンシング技術(Eid et al.,Science 323:133-8,2009を参照)、及びLife Technologies Corporationによって開発されたIon Torrent(米国特許出願公開第2009/0026082号;2010/01 37143号;及び2010/0282617号を参照)を含むが、これらに限定されない。本明細書に記載の方法で使用されるオックスフォードナノポアDNAシーケンシングシステムは、通常に長さが250bp超えるアンプリコンを迅速かつ正確に読み取るのにより適している。Illuminaシーケンシングシステムは、比較的短いリードをもたらす、長い処理時間及び合成によるシーケンシングのため、オックスフォードナノポアDNAシーケンシングシステムと比較して本明細書に記載の方法に適していない可能性がある。
方法のいくつかの実施形態において、検出することは、アダプター配列の対並びに第1の固有のバーコード配列及びその逆相補体を含む複数のアンプリコンの各々をシーケンシングすることを含む。方法の他の実施形態において、検出することは、アダプター配列の対、第1の固有のバーコード配列及びその逆相補体、並びに第2の固有のバーコード配列及びその逆相補体を含む複数のアンプリコンの各々をシーケンシングすることを含む。多くの実施形態において、検出することは、ソフトウェアプログラムでシーケンシングデータファイルを読み取ることによって行われる。シーケンシングデータファイルは、FASTA/FASTQフォーマットであるか、又はStockholmフォーマットである。
いくつかの実施形態では、方法は、1つの標的核酸を同定する。いくつかの実施形態では、方法は、同じ病原体から2つ以上の標的核酸を同定する。いくつかの実施形態では、方法は、同じタイプの2つの異なる病原体(例えば、ウイルス性病原体)から2つ以上の標的核酸を同定する。いくつかの実施形態では、方法は、異なるタイプの2つの異なる病原体(例えば、ウイルス性及び細菌性病原体)から2つ以上の標的核酸を同定する。多くの実施形態では、方法は、複数のアンプリコンのカテゴリーを決定する工程を含む。本明細書中に記載される方法における重要な工程は、アンプリコンインサートの配列分析である。方法の多くの実施形態では、所与の試料について、同一のバーコードが陽性対照について、及び試験されている複数の目的の標的核酸のそれぞれについて使用される。アンプリコンがカウントされる場合、アンプリコンをどのように分類及びカウントするかを決定するのはインサートの配列(例えば、標的増幅領域)である。例えば、標的増幅領域配列がアンプリコンに存在する場合、アンプリコンはヒットとして分類され、カウントされる。標的増幅領域配列がアンプリコンに存在しない場合、それは対照として分類及びカウントされ得る。したがって、インサートの配列(例えば、標的増幅領域)は、病原性決定因子の配列変異体を認識し、新規変異体を、それらの存在に関する事前の知識を有することなく発見する手段でもある。本明細書に記載される方法の多くの実施形態では、標的増幅領域由来のポリヌクレオチドを含む複数のアンプリコンのそれぞれのカテゴリーを決定することは、対応する対象が標的核酸を有することを示す。
いくつかの実施形態では、本明細書に記載の方法は、少なくとも96ウェル、少なくとも384ウェル、少なくとも1536ウェル、又はそれ以上のウェルを有するプレート内の複数の別個の試料に適用される。さらなる態様では、本明細書に記載の方法は、それぞれ少なくとも96ウェルを有する少なくとも1、2、3、4、5、6、7、8、10、15、20、30、384又はそれ以上のプレート中の別個の試料に適用される。他の態様では、本明細書に記載の方法は、それぞれ少なくとも384ウェルを有する少なくとも1、2、3、4、5、6、7、8、10、15、20、30、384又はそれ以上のプレート中の別個の試料に適用される。
V.核酸試料中の配列変異体を検出する方法
本明細書に記載の方法は、核酸試料中の1つ以上の配列変異体を検出することができる。配列変異体は、参照配列(例えば、健康なヒト由来の核酸試料、又はSARS-Cov-2感染を有することが疑われる患者由来の核酸試料も)に対する任意の変異であり得る。配列変異は、単一のヌクレオチド又は複数のヌクレオチド(例えば、2、3、4、5、6、7、8、9、10又はそれ以上のヌクレオチド)の突然変異、挿入又は欠失からなり得る。配列変異体が2つ以上のヌクレオチドの相違を含む場合、相違するヌクレオチドは互いに連続していても不連続であってもよい。配列変異体の型の非限定的な例としては、ゲノムに生じるランダム変異、一塩基多型(SNP)、欠失/挿入多型(DIP)、レトロトランスポゾンに基づく挿入多型、及び配列特異的増幅多型が挙げられる。本明細書で使用される方法は、任意の配列変異体を検出することができる。例えば、ポリヌクレオチド配列中の点変異を検出するための開示は、インデル又は欠失の検出にも適用可能であり得る。
本明細書に記載の方法は、核酸試料中の1つ以上の配列変異体を検出することができる。配列変異体は、参照配列(例えば、健康なヒト由来の核酸試料、又はSARS-Cov-2感染を有することが疑われる患者由来の核酸試料も)に対する任意の変異であり得る。配列変異は、単一のヌクレオチド又は複数のヌクレオチド(例えば、2、3、4、5、6、7、8、9、10又はそれ以上のヌクレオチド)の突然変異、挿入又は欠失からなり得る。配列変異体が2つ以上のヌクレオチドの相違を含む場合、相違するヌクレオチドは互いに連続していても不連続であってもよい。配列変異体の型の非限定的な例としては、ゲノムに生じるランダム変異、一塩基多型(SNP)、欠失/挿入多型(DIP)、レトロトランスポゾンに基づく挿入多型、及び配列特異的増幅多型が挙げられる。本明細書で使用される方法は、任意の配列変異体を検出することができる。例えば、ポリヌクレオチド配列中の点変異を検出するための開示は、インデル又は欠失の検出にも適用可能であり得る。
本明細書で提供される方法を使用して、生物学的試料から得られた核酸試料から配列変異体を検出する。いくつかの実施形態では、得られた情報を使用して、対象から得られた核酸試料中に存在する突然変異を同定することができる。
試料由来のポリヌクレオチドは、これらに限定されないが、DNA、RNA、リボソームRNA(rRNA)、転移RNA(tRNA)、マイクロRNA(miRNA)、メッセンジャーRNA(mRNA)、これらのいずれかの断片、又はこれらのいずれか2つ以上の組み合わせを含む、様々なポリヌクレオチドのいずれかであり得る。いくつかの実施形態では、試料はDNAを含む。いくつかの実施形態では、試料はゲノムDNAを含む。いくつかの実施形態では、試料は、プラスミドDNA、細菌人工染色体、オリゴヌクレオチドタグ、又はそれらの組み合わせを含む。いくつかの実施形態では、試料は、増幅、例えば、これらに限定されないが、ポリメラーゼ連鎖反応(PCR)、逆転写、及びそれらの組み合わせを含む、プライマーとDNAポリメラーゼとの任意の適切な組み合わせを使用したプライマー伸長反応によって生成されたDNAを含む。いくつかの実施形態では、試料はRNAを含む。いくつかの実施形態では、試料はRNA、例えば、対象試料(例えば、血液試料)から収集されたmRNAを含むことができる。RNA抽出のための一般的な方法は、当技術分野で周知である。特に、RNA単離は、Qiagenなどの商業的製造業者からの精製キット、緩衝液セット及びプロテアーゼを製造業者の説明書に従って使用して実施することができる。プライマー伸長反応用の鋳型がRNAである場合、逆転写の産物は相補的DNA(cDNA)と呼ばれる。いくつかの実施形態では、試料はDNA及びRNAの混合物を含む。DNAとRNAとの混合物を含む試料の場合(例えば、同時感染では)、逆転写酵素(RT)はDNA分子に付加され、DNA分子に対して不活性であり、RNA分子に逆転写する。いくつかの実施形態では、試料、すなわち、核酸(例えば、DNA又はRNA)は対象から得られ、本明細書に記載の方法を使用して処理(溶解、増幅、及び/又は精製)され、核酸はシーケンシングされる。
本開示の一態様は、核酸試料中の配列変異体を検出する方法に関する。第1の工程は、増幅混合物を用いて核酸の試料と増幅反応を行い、複数のアンプリコンを産生することを含む。核酸の試料は、感染の決定因子である標的核酸を有すると疑われる複数の対象から得られた複数のポリヌクレオチドを含む。本明細書に記載される多くの実施形態では、標的核酸は、本明細書では標的増幅領域と呼ばれる病原体のゲノム領域内に含まれる。本明細書に記載される実施形態では、増幅混合物は、複数のプライマー、少なくとも1つの固有のバーコード配列(例えば、第1の固有のバーコード配列及びその逆相補体)、及び少なくとも1つのアダプター配列の対を含む。いくつかの実施形態において、複数のプライマーの各々は、標的増幅領域中のヌクレオチドに相補的なヌクレオチドのセットを含む。固有のバーコード配列は、特定の対象から得られた生物学的試料を同定する。アダプター配列の対は、多くの場合、プライマーをブロックして、複数のアンプリコンのそれぞれに第2の固有のバーコード配列を付加することを可能にする。いくつかの実施形態において、核酸の試料はRNA分子を含み、第1の工程は、増幅反応を行う前にRNAから逆転写されたcDNAを得ること、又はRNAからcDNAを逆転写することをさらに含む。
配列変異を検出する方法の第2の工程は、複数のアンプリコンを検出すること、及び場合により定量することを含む。方法の多くの実施形態では、検出工程は、単一の機器上で複数のアンプリコンの実質的に同一のコピーの核酸配列を並行して決定することを含む。本明細書に記載される方法の実施形態では、ハイスループットシーケンシングを使用して、アンプリコン中の固有のバーコードを検出する。当技術分野で公知の任意のハイスループットシーケンシングプラットフォームを使用して、本明細書に記載されるように調製されたシーケンシングライブラリーをシーケンシングすることができる。例示的なハイスループットシーケンシングシステムは、オックスフォードナノポアプラットフォーム(MinlON及びPromethlON機器を含む)、454 Life Sciencesによって最初に開発され、後にRoche(Basel,Switzerland)によって取得されたGS FLXシーケンシングシステム、Solexaによって開発され、後にlllumina Inc.(San Diego,CA)によって取得されたGenome Analyzer、Life Technologies(Foster City,CA)によるSOLiD配列システム、Complete Genomicsによって開発され、BGIによって取得されたCGA、Pacific Biosciences(Menlo Park,CA)によって開発されたPacBio RSシーケンシング技術、及びLife Technologies Corporationによって開発されたIon Torrentを含むがこれらに限定されない。本明細書に記載の方法で使用されるオックスフォードナノポアDNAシーケンシングシステムは、通常に長さが250bp超えるアンプリコンを迅速かつ正確に読み取るのにより適している。
本方法の第3の工程は、複数のアンプリコンのカテゴリーを決定する工程を含む。前述のように、これはアンプリコンインサートの配列分析に向けられた重要な工程である。アンプリコンがカウントされる場合、アンプリコンをどのように分類及びカウントするかを決定するのはインサートの配列(例えば、標的増幅領域)である。インサートの配列(例えば、標的増幅領域)は、病原性決定因子の配列変異体を認識し、新規変異体を、それらの存在に関する事前の知識を有することなく発見する手段である。本明細書に記載される方法の多くの実施形態では、標的増幅領域由来のポリヌクレオチドを含む複数のアンプリコンのそれぞれのカテゴリーを決定することは、対応する対象が標的核酸の特定の変異体を有することを示す。
本方法の第4の工程は、配列変異の検出に関する。配列変異体は、複数のアンプリコンに対してシーケンシング反応を同時に実行して、配列変異体(例えば、ウイルスゲノムに対応する標的増幅領域における点変異)に対応する複数の核酸配列を決定することによる、本明細書に記載の方法において検出される。複数の配列アラインメントを行うための、シーケンシングデータを使用する様々なシーケンシング方法及びアルゴリズムは当技術分野で公知であり、本明細書に記載されている。当技術分野で公知の任意のハイスループットシーケンシングプラットフォームを使用して、本明細書に記載されるように調製されたシーケンシングライブラリーをシーケンシングすることができる。例示的なハイスループットDNAシーケンシングシステムとしては、限定されないが、MinlON及びPromethlON機器を含むオックスフォードナノポアプラットフォーム、GS FLXシーケンシングシステム、Genome Analyzer、SOLID配列システム、CGA、PacBio RSシーケンシング技術及びIon Torrentが挙げられる。本明細書に記載の方法で使用されるオックスフォードナノポアDNAシーケンシングシステム(例えば、ONT MinlON又はGridlON)は、通常に長さが250bp超えるアンプリコンを迅速かつ正確に読み取るのにより適している。
配列比較のために、典型的には、1つの配列が参照配列として機能し、それと試験配列が比較される。配列比較アルゴリズムを使用する場合、試験配列及び参照配列をコンピュータに入力し、必要に応じてサブシーケンス座標を指定し、配列アルゴリズムプログラムパラメータを指定する。デフォルトのプログラムパラメータを使用することも、代替パラメータを指定することもできる。次いで、配列比較アルゴリズムは、プログラムパラメータに基づいて、参照配列に対する試験配列の配列同一性パーセントを計算する。比較のための配列のアラインメント方法は、当技術分野で周知である。比較のための配列の最適なアラインメントは、例えば、Smith-Watermanの局地的相同性アルゴリズム、(1970)Adv.Appl.Math.2:482cによって、Needleman-Wunschの相同性アラインメントアルゴリズム、(1970)J.Mol.Biol.48:443によって、Pearson-Lipmanの類似性探索法、(1988)Proc.Nat’l.Acad.Sci.USA 85:2444によって、これらのアルゴリズムをコンピュータ化することによって(GAP、BESTFIT、FAST A、及びTFASTA(the Wisconsin Genetics Software Package,Genetics Computer Group,575 Science Dr.,Madison,Wis.))、又は手動アラインメント及び目視検査によって(例えば、Brent et al.,(2003)Current Protocols in Molecular Biologyを参照されたい)、実施され得る。方法のいくつかの実施形態では、プールされたライブラリー調製物からのPCRアンプリコンをONT MinlON又はGridlONでシーケンシングして、生のONT FASTSシーケンシング出力ファイルを得た。これらの実施形態では、出力ファイルを高精度ONT GPUに基づくベースコーラーに供して、生のFASTA/FASTQファイル又はStockholmフォーマットファイルを得た。生のファイルをHMMER3及びCM配列アラインメント及びアノテーションエンジンで実行した。HMM/CMエンジンは、統計的パターン分類アルゴリズムを適用して、a)複製配列リードに基づいて尤度を最大化すること、及び/又はb)全ゲノム多重配列アラインメントに基づいて文脈依存アラインメントモデルパラメータを使用することによってコンセンサス配列を生成する。
SARS-CoV-2を有すると疑われる患者から得られた試料における配列変異を決定するための非限定的な例示的ワークフローは、シーケンサーがライゲーションされていない個々のアンプリコンを読み取ることから始まる。多くの場合、陽性試料から100~105の深度カバレッジが得られる。HMM又はCM統計的モデルを使用して、これらのリードを、個々に分析されるそれらの構成アンプリコン配列へとセグメント化する。HMMはアンプリコン特徴をアラインメントし、アノテーションする。次に、患者/バッチIDを、バーコード領域を逆多重化することによって取得する。介在領域上でHMM又はCMソフトウェアを使用して複数の配列アラインメントを行い、高精度コンセンサス配列を得る。次いで、配列アラインメントをGenbank/GISAID SARS-CoV-2参照にマッピングする。アラインメントは、予め定義された目的のSZRBDタンパク質参照残基を試料由来の配列と比較して、新規変異体残基を記録する。新規変異体の記録を、集中化変異体監視データベースに提出すること、及び/又は抗体/ワクチン回避リスクのアノテーション付きの各患者の最終レポートと共に提供することができる。
シーケンシング後、配列変異体が生じる頻度はまた、異なる対象集団から得られた複数の核酸試料からの配列を分析することによって決定され得る。一例として、100000配列が決定され、99000配列が「gau」を読み取り、1000配列が「gcu」を読み取る場合、アスパルテートをエンコードする「gau」配列は、その位置のアラニンをエンコードする「gcu」変異体の10%に対して、90%の頻度を有すると言われる可能性がある。いくつかの実施形態において、本明細書中に記載される方法は、読み取られた配列の10%未満、5%未満又は2%未満において生じる配列変異を検出し得る。他の実施形態において、方法は、読み取られた配列の1%未満、0.5%未満又は0.2%未満において生じる配列変異を検出し得る。検出感度の典型的な範囲は、0.1%~100%、0.1%~50%、0.1%~10%、例えば0.2%~5%であり得る。
本明細書に記載されるPCRベースの方法の1つの利点は、この方法には変異の事前知識が必要とされないことである。方法は核酸シーケンシングに基づくので、プライマーを使用して増幅する1つの位置のすべての変異が検出される。さらに、シーケンシングのためのクローニングは必要ない。核酸試料は、クローニング、サブクローニング及びクローニングされた核酸の培養を必要とせずに、一連の工程で増幅及びシーケンシングされる。配列変異の検出のための上記の態様は特に有用である。例えば、一実施形態では、本明細書に記載される方法は、患者試料中の様々な変異SARS-CoV-2株を検出することができる。本明細書中に記載される方法によって検出され得る変異SARS-CoV-2株の非限定的な例としては、スパイクタンパク質、受容体結合ドメイン及び/又はヌクレオカプシドタンパク質をエンコードするポリヌクレオチド中にT95I、D253G、L452Rm E484K、S477N、N501Y D614G及びA701V点変異を有するSARS-CoV-2変異体が挙げられる。いくつかの実施形態の方法では、核酸試料は、検出可能な力価のウイルスを含むSARS-CoV-2 RNAソース(例えば、SARS-CoV-2に感染したヒト患者)に由来し得る。本明細書に記載の方法の典型的な実施形態では、ソースはヒト対象からの試料を含み得、それは、薬物/血漿/ワクチン治療レジメンを受けた可能性がある、又はないSARS-CoV-2感染患者(すなわち、患者は「ドラッグナイーブ」であってもなくてもよい)から収集した組織又は体液試料を含む。変異は、疾患症状の重症度、死亡率の増加、蔓延の増加、及び/又は治療法に対する既知の耐性若しくは新たに特定された耐性と相関し得る。本明細書中に記載される方法はまた、ワクチン接種プログラムの有効性を決定するか、又は治療的利益がほとんどない1つ以上の薬物、薬物クラス若しくは薬物組み合わせの回避を含み得る治療レジメンを変更するために利用され得る、試料集団中の各変異体の頻度の測定を提供する。
記載される方法の他の用途には、配列変異体の集団研究が含まれ、核酸試料を生物の集団から収集し、1つの実験で組み合わせて分析してウイルスゲノムの特定の領域における配列変異頻度を決定することができる。生物の集団は、例えば、ヒトの集団、家畜の集団などを含み得る。これらの集団研究は、ウイルスゲノムにおける変異についての「ホットスポット」を示すことができ、そのような情報は、薬物及び/又はワクチンの設計において貴重であり得る。
VI.アレイのマルチプレックス及び感染の同定におけるその使用
一態様では、本開示は、多様な試料から少なくとも1つの標的タンパク質を検出するためのアレイのマルチプレックスを提供する。マルチプレックスアレイは、複数の独自に標識されたビーズに結合した複数の捕捉剤を含む。独自に標識されたビーズの各々は、複数の固有の捕捉剤と、少なくとも1つのビーズに結合するように設計された少なくとも1つの第1のオリゴヌクレオチド配列と、第2のオリゴヌクレオチド配列とコンジュゲートした少なくとも1つの二次抗体と、環状アンプリコン中の少なくとも1つの固有のヌクレオチドバーコード配列とを含む。本明細書に記載されるアレイの多くの実施形態では、ビーズは、少なくとも1つの標的タンパク質に特異的に結合する抗原でコーティングされる。本明細書に記載されるアレイのいくつかの実施形態では、第2のオリゴヌクレオチド配列は、第2のオリゴヌクレオチド配列が第1のオリゴヌクレオチド配列に近接している場合に増幅されて環状アンプリコンを形成するように設計される。いくつかの実施形態において、第1のオリゴヌクレオチド配列、又は第2のオリゴヌクレオチド配列、又はその両方は、少なくとも1つの固有のバーコード配列を含む。いくつかの実施形態において、第1のオリゴヌクレオチド配列は、ビーズ上にコーティングされたポリペプチドに共有結合している。いくつかの実施形態では、アレイのマルチプレックスは、抗体又は抗体断片に共有結合した第1のオリゴヌクレオチド配列を含み、抗体又は抗体断片はビーズ上にコーティングされたポリペプチドに結合する。
一態様では、本開示は、多様な試料から少なくとも1つの標的タンパク質を検出するためのアレイのマルチプレックスを提供する。マルチプレックスアレイは、複数の独自に標識されたビーズに結合した複数の捕捉剤を含む。独自に標識されたビーズの各々は、複数の固有の捕捉剤と、少なくとも1つのビーズに結合するように設計された少なくとも1つの第1のオリゴヌクレオチド配列と、第2のオリゴヌクレオチド配列とコンジュゲートした少なくとも1つの二次抗体と、環状アンプリコン中の少なくとも1つの固有のヌクレオチドバーコード配列とを含む。本明細書に記載されるアレイの多くの実施形態では、ビーズは、少なくとも1つの標的タンパク質に特異的に結合する抗原でコーティングされる。本明細書に記載されるアレイのいくつかの実施形態では、第2のオリゴヌクレオチド配列は、第2のオリゴヌクレオチド配列が第1のオリゴヌクレオチド配列に近接している場合に増幅されて環状アンプリコンを形成するように設計される。いくつかの実施形態において、第1のオリゴヌクレオチド配列、又は第2のオリゴヌクレオチド配列、又はその両方は、少なくとも1つの固有のバーコード配列を含む。いくつかの実施形態において、第1のオリゴヌクレオチド配列は、ビーズ上にコーティングされたポリペプチドに共有結合している。いくつかの実施形態では、アレイのマルチプレックスは、抗体又は抗体断片に共有結合した第1のオリゴヌクレオチド配列を含み、抗体又は抗体断片はビーズ上にコーティングされたポリペプチドに結合する。
いくつかの実施形態では、アレイのマルチプレックスは、第1のオリゴヌクレオチド配列又は第2のオリゴヌクレオチド配列、又はそれらの組み合わせ中に少なくとも96個の異なるバーコード配列を含む。
いくつかの他の実施形態では、アレイのマルチプレックスは、第1のオリゴヌクレオチド配列又は第2のオリゴヌクレオチド配列、又はそれらの組み合わせ中に少なくとも384個の異なるバーコード配列を含む。いくつかの実施形態では、アレイのマルチプレックスは、環状アンプリコン中に少なくとも96個の異なるバーコード配列を含む。
いくつかの他の実施形態では、アレイのマルチプレックスは、第1のオリゴヌクレオチド配列又は第2のオリゴヌクレオチド配列、又はそれらの組み合わせ中に少なくとも384個の異なるバーコード配列を含む。いくつかの実施形態では、アレイのマルチプレックスは、環状アンプリコン中に少なくとも96個の異なるバーコード配列を含む。
上述したように、主題の方法を実施するのに有用なシステムも提供される。例えば、いくつかの実施形態では、主題の方法を実施するためのシステムは、少なくとも1つのセット又は近接プローブ;少なくとも1対の非対称コネクタの;及び核酸リガーゼを含み得る。さらに、システム構成要素を用いて実施されるプロトコルで必要とされる又は所望される追加の試薬が存在してもよく、その追加の試薬には、補充核酸の対、一本鎖結合タンパク質、及びPCR増幅試薬(例えば、ヌクレオチド、緩衝液、カチオンなど)、NGSシーケンシング試薬などが含まれるが、これらに限定されない。
一態様では、本開示は、複数の生物学的試料における少なくとも1つの感染のための方法を提供する。方法は、少なくとも1つの標的タンパク質が少なくとも1つのビーズの固有の捕捉剤に結合するのに十分な条件下で、本明細書に記載のアレイのマルチプレックスにおいて複数の生物学的試料を複数のビーズと共にインキュベートする第1の工程を含む。方法の第2の工程において。ビーズを洗浄して、固有の捕捉剤に結合しないタンパク質を除去する。次の工程は、複数の標的タンパク質に結合した二次抗体の数に対応する複数の複合体が形成されるように、複数の二次抗体のそれぞれが少なくとも1つの標的タンパク質と複合体を形成する条件下で、ビーズを複数の二次抗体とインキュベートすることを含む。次の工程では、ビーズを再度洗浄して、複合体を形成しない二次抗体を除去する。第6の工程では、環状アンプリコンを形成するように第1オリゴヌクレオチド配列のそれぞれに対して第2オリゴヌクレオチド配列のそれぞれをハイブリダイゼーションさせる条件下で、複数の複合体の数に対応して複数のアンプリコンが生成されるように、複数の複合体をインキュベートする。方法の第7の工程は、複数の環状アンプリコンを増幅に供することを含む。第8の工程では、ビーズをアレイにプールし、複数のアンプリコンを固有のバーコード化アンプリコンのハイスループットシーケンシングによって同時に検出する。最後の工程では、複数のアンプリコンのカテゴリーが決定される。前述のように、標的増幅領域由来のポリヌクレオチドを含む複数のアンプリコンのそれぞれのカテゴリーを決定することは、対応する生物学的試料における感染を示す。
いくつかの実施形態では、本明細書に記載の方法は、1つ又は複数の試料中の病原性決定因子(例えば、細菌及び/又はウイルス感染)の同定に使用される。他の実施形態では、本方法は、1つ以上の病原性感染を示すIgG及びIgM免疫グロブリンなどの標的タンパク質を同時に検出する。本明細書中に記載される方法によって検出される抗体又は抗体断片は、アシネトバクター・バウマンニ(Acinetobacter baumannii)、アデノウイルス、アフリカ馬疫ウイルス、アフリカ豚コレラウイルス、ズビニ鉤虫(Anclostoma duodenale)、回虫、黄色アスペルギルス、アスペルギルス・フミガーツス(Aspergillus fumigatus)、アスペルギルス・ニガー(Aspergillus niger)、アスペルギルス・オリゼ(Aspergillus oryzae)、鳥インフルエンザウイルス、炭疽菌、炭疽菌パスツール株、Bacillus cereus Biovar anthracis、ウシ流産菌、ブルセラ・メリテンシス(Brucella melitensis)、ブルセラ・スイス(Brucella suis)、鼻疽菌、類鼻疽菌、カンジダ・アルビカンス(Candida albicans)、カンジダ・ドゥブリニエンシス(Candida dubliniensis)、カンジダ・グラブラタ(Candida glabrata)、カンジダ・クルセイ(Candida krusei)、カンジダ・トロピカリス(Candida tropicalis)、クラミジア・ニューモニエ(Chlamydia pneumoneae)、クラミジア・トラコマチス(Chlamydia trachomatous)、豚熱ウイルス、クロストリジウム・ディフィシール(Clostridium difficile)、コクシジオイデス・イミティス(Coccidioides immitis)、コクシジオイデス・ポサダシ(Coccidioides posadasii)、CoV-229E、CoV-HKU1、CoV-NL63、CoV-OC43、コクサッキーウイルスA、コクサッキーウイルスB、コクシエラ・バーネッティ(Coxiella burnetii)、クリミア・コンゴ出血熱、サイトメガロウイルス、デングウイルス、メジナ虫、東部馬脳炎、エボラウイルス、い粒条虫、多包条虫、エンテロバクター・クロアカ、エンテロコッカス・フェシウム(Enterococcus faecium)、エンテロウイルス、エプスタイン・バール・ウイルス、大腸菌、巨大肝蛭、肝蛭、***ウイルス、野兎病菌、山羊痘ウイルス、ヘモフィルス属インフルエンザ、ヘリコバクターピロリ、ヘンドラウイルス、A型肝炎ウイルス、B型肝炎ウイルス、C型肝炎ウイルス、ヒストプラスマ・カプスラーツム(Histoplasma capsulatum)、ズボアジ型ヒストプラスマ症(Histoplasma duboisii)、ヒトヘルペスウイルスHHV6、ヒトヘルペスウイルスHHV7、ヒトヘルペスウイルスHHV8、ヒトヘルペスウイルスHSV1、ヒトヘルペスウイルスHSV2、ヒト免疫不全ウイルス、ヒトパピローマウイルス、インフルエンザウイルスA型、インフルエンザウイルスB型、クレブシェラ肺炎桿菌、キャサヌール森林病ウイルス、ラッサ熱ウイルス、レジオネラ・ニューモフィラ菌、リーシュマニア・プロマスティゴート(Leishmania promastigotes)、Lujoウイルス、ランピースキン病ウイルス、マールブルグウイルス、麻疹ウイルス、メチシリン耐性黄色ブドウ球菌、サル痘ウイルス、ムンプスウイルス、マイコバクテリウム・アブセッサス(Mycobacterium abscessus)、マイコバクテリウム・アビウム(Mycobacterium avium)、マイコバクテリウム・ボビス(Mycobacterium bovis)、マイコバクテリウム・カヌッティイ(Mycobacterium canettii)、マイコバクテリウム・レプレ(Mycobacterium leprae)、ヒト結核菌、マイコバクテリウム・ウルセランス(Mycobacterium ulcerans)、マイコプラズマ・カプリコルム(Mycoplasma capricolum)、マイコプラズマ・ミコイデス(Mycoplasma mycoides)、マイコプラズマ・ニューモニア(Mycoplasma pneumoneae)、アメリカ十二指腸虫、淋病、ニューカッスル病ウイルス、ニパウイルス、ノルカジア属beijingensis、ノルカジア属cyriacigeorgica、ノルカジア属farcinica、ノロウイルスGI、ノロウイルスGII、ノーウォークウイルス、オムスク出血熱ウイルス、回旋糸状虫、発癌性ヒトパピローマウイルス、パラインフルエンザウイルス、寄生生物、マルネッフェイ型ペニシリウム症(Penicilliosis marneffei)、小反芻獣疫ウイルス、ニューモシスチス・イロベチイ(Pneumocystis jirovecii)、ポリオーマウイルス、プロテウス・ミラビリス(Proteus mirabilis)、緑膿菌、狂犬病ウイルス、8つの遺伝子断片すべてのコーディング領域の任意の部分を含有する、1918年のパンデミックインフルエンザウイルスの再構築された複製コンピテント形態、呼吸器合胞体ウイルス、ライノウイルス、発疹チフスリケッチア、リフトバレー熱ウイルス、牛疫ウイルス、ロタウイルスA、ロタウイルスB、ロタウイルスC、ロタウイルスG2、風疹ウイルス、SARS関連コロナウイルス(SARS-CoV)、SARS-CoV-1、SARS-CoV-2、ビルハルツ住血吸虫、日本住血吸虫、マンソン住血吸虫、羊痘ウイルス、南米出血熱ウイルスチャパレ、南米出血熱ウイルスグアナリト、南米出血熱ウイルスフニン、南米出血熱ウイルスマチュポ、南米出血熱ウイルスサビア、黄色ブドウ球菌、スタフィロコッカス・サプロフィティカス(Staphylococcus saprophyticus)、肺炎レンサ球菌、豚水疱病ウイルス、有鉤条虫、ダニ媒介性脳炎複合(flavi)ウイルス極東亜型、ダニ媒介性脳炎複合(flavi)ウイルスシベリア亜型、タバコモザイク病ウイルス、トルクテノウイルス、鞭虫、ブルーストリパノソーマ(Trypanosoma bmcei)、トリパノソーマ・クルージ(Trypanosoma cruzi)、大痘瘡ウイルス(天然痘ウイルス)、小痘瘡ウイルス(アラストリム)、ベネズエラ馬脳炎ウイルス、バンクロフト糸状虫、ペスト菌、及び上記の病原体のいずれか1つと特徴的な核酸配列を共有する病原体、又は前述の群の病原体と特徴的な核酸配列を共有する、別の潜在的に新規若しくは特性決定されていない病原体を含む病原体からの1つ以上の抗体に特異的に結合する。
いくつかの実施形態では、本明細書に記載の方法は、1つ又は複数の試料における1つ又は複数のRNAウイルスによって引き起こされる感染の同定に使用される。特定の実施形態では、本明細書に記載の方法は、1人又は複数の患者から得られた1つ又は複数の生物学的試料中のウイルス感染(例えば、SARS-CoV-2感染)の同定に使用される。SARS-CoV-2を診断し、識別することは臨床的に困難である。SARS-CoV-2感染が疑われる症例では、迅速で信頼性の高い大規模並行診断が必要である。本開示は、そのようなアッセイを提供する。アッセイは、少なくとも部分的には、SARS-CoV-2ウイルスポリヌクレオチドが、固有のバーコード配列を試料ソース識別子として使用するSARS-CoV-2ウイルスポリヌクレオチド用の1段階又は2段階リアルタイム逆転写増幅アッセイで検出(例えば、シーケンシング)され得るという発見に基づく。本明細書に提供されるアッセイは、スパイクタンパク質(S)、受容体結合ドメイン(RBD)、S1タンパク質、S2タンパク質、E遺伝子、S遺伝子、Orflab遺伝子、N末端スパイクタンパク質ドメイン、全タンパク質(S1+S2)、及びヌクレオカプシド(N)タンパク質からなる群から選択される1つ以上のSARS-CoV-2抗原に特異的に結合する、本明細書に記載される方法で検出される抗体又は抗体断片を検出することができる。本明細書で提供される方法は、SARS-CoV-2感染を有するか又は有する疑いがある1人又は複数の患者から得られた複数の試料からのSARS-CoV-2ウイルスポリヌクレオチドの同時検出を可能にする。
いくつかの実施形態において、本明細書中に記載される方法は、重要な獣医学的疾患(例えば、ウシ下痢、ヨーネ病、豚インフルエンザなど)の病原体の同定のために使用される。本明細書中に記載される方法は、動物が各試料に標識され、適切にバーコードプライミングされている限り、群内の感染動物を個々に検出を容易にすることができる。
いくつかの実施形態では、本明細書に記載の方法は、1つ又は複数の試料における1つ又は複数の標的核酸の同定に使用される。いくつかの他の実施形態では、本明細書に記載の方法は、1つの試料における2つ以上の標的核酸の同定に使用される。特定の実施形態では、2つ以上の標的核酸は、単一の病原体の病原性決定因子であるか、又は病原性決定因子をエンコードする。特定の実施形態では、2つ以上の標的核酸は、単一のRNAウイルス(例えば、SARS-CoV-2)の病原性決定因子であるか、又は病原性決定因子をエンコードする。他の実施形態では、2つ以上の標的核酸は、2つ以上のRNAウイルス(例えば、SARS-CoV-2及びインフルエンザAウイルス)の病原性決定因子であるか、又は病原性決定因子をエンコードする。別の実施形態では、2つ以上の標的核酸は、1つ以上のRNAウイルス(例えば、SARS-CoV-2、インフルエンザAウイルス)及び1つ以上の細菌性病原体(例えばマイコバクテリウム、レンサ球菌、緑膿菌、赤痢菌、カンピロバクター、クラミジア及びサルモネラ)の病原性決定因子であるか、又は病原性決定因子をエンコードする。特に明記しない限り、「アミノ酸配列をエンコードするヌクレオチド配列」は、互いに縮重バージョンであり、同じアミノ酸配列をエンコードするすべてのヌクレオチド配列を含む。タンパク質又はRNAをエンコードするヌクレオチド配列という語句はまた、タンパク質をエンコードするヌクレオチド配列が、一部のバージョンで1つ以上のイントロンを含み得る程度にイントロンを含み得る。
VII.標的タンパク質血清学的アッセイを同定するためのシステム及び方法
本明細書に記載の血清学的アッセイは、試料中の分析物を検出するための近接ライゲーションアッセイ(PLA)である。このアッセイは、「近接プローブ」の原理を「分子バーコード化」及びマルチプレックス増幅と組み合わせて、複数の生物学的試料中の1つ又は複数の分析物の存在の大規模並行分析を容易にする。PLAは、分析物が複数の(すなわち、2つ以上、一般的には2つ、3つ又は4つ)プローブの同時結合によって検出されるアッセイであり、プローブは分析物への結合によって近接されると、検出可能な、好ましくは増幅可能な核酸検出産物(例えば、環状アンプリコン)を形成し、それによって前記分析物を検出することができる。核酸検出産物(例えば、環状アンプリコン)は、当業者に公知の方法によって検出及びシーケンシングすることができる。本明細書に記載のアッセイでは、近接プローブは、プローブの分析物結合ドメイン(又は部分)に連結された核酸ドメイン(又は部分)を含み、アンプリコンの産生は、核酸部分、及び/又は他のプローブによって担持されるさらなる官能性部分の間の相互作用を伴う。したがって、アンプリコン産生は、プローブ間の相互作用に依存し(より具体的には、それらによって担持される核酸又は他の官能性部分/ドメインによる)、したがって、必要な2つの(又はそれ以上)プローブの両方が分析物に結合した場合にのみ起こり、それによって検出システムへの特異性の改善をもたらす。
本明細書に記載の血清学的アッセイは、試料中の分析物を検出するための近接ライゲーションアッセイ(PLA)である。このアッセイは、「近接プローブ」の原理を「分子バーコード化」及びマルチプレックス増幅と組み合わせて、複数の生物学的試料中の1つ又は複数の分析物の存在の大規模並行分析を容易にする。PLAは、分析物が複数の(すなわち、2つ以上、一般的には2つ、3つ又は4つ)プローブの同時結合によって検出されるアッセイであり、プローブは分析物への結合によって近接されると、検出可能な、好ましくは増幅可能な核酸検出産物(例えば、環状アンプリコン)を形成し、それによって前記分析物を検出することができる。核酸検出産物(例えば、環状アンプリコン)は、当業者に公知の方法によって検出及びシーケンシングすることができる。本明細書に記載のアッセイでは、近接プローブは、プローブの分析物結合ドメイン(又は部分)に連結された核酸ドメイン(又は部分)を含み、アンプリコンの産生は、核酸部分、及び/又は他のプローブによって担持されるさらなる官能性部分の間の相互作用を伴う。したがって、アンプリコン産生は、プローブ間の相互作用に依存し(より具体的には、それらによって担持される核酸又は他の官能性部分/ドメインによる)、したがって、必要な2つの(又はそれ以上)プローブの両方が分析物に結合した場合にのみ起こり、それによって検出システムへの特異性の改善をもたらす。
近接プローブベースの検出アッセイ、特に近接ライゲーションアッセイによって、試料中の1つ以上の分析物を、そのような分析物の存在を容易に検出可能又は定量可能な核酸ベースのシグナルに変換することによって、高感度な、迅速かつ便利な検出又は定量が可能になる。
当技術分野の近接プローブは、一般に対で使用され、それぞれ、標的分析物に特異性を有する分析物結合ドメイン、及び官能性ドメイン、例えばそれに結合した核酸ドメインからなる。分析物結合ドメインは、例えば、核酸「アプタマー」(Fredriksson et al(2002)Nat Biotech 20:473-477)であり得るか、又はモノクローナル若しくはポリクローナル抗体などのタンパク質性であり得る(Gullberg et al(2004)Proc Natl Acad Sci USA 101:8420-8424)。各近接プローブ対のそれぞれの分析物結合ドメインは、分析物上の同じ又は異なる結合部位のいずれかに対して特異性を有し得る。本明細書に記載のアッセイにおける分析物は、典型的には、対象由来の生物学的試料(例えば、血液)中に存在する抗体又は抗体の断片である。いくつかの例では、対象は感染(例えば、ウイルス感染又は細菌感染)を有し、感染を引き起こす特定の病原体に特異的な循環抗体(例えば、中和抗体)を有し得る。近接プローブ対は、両方が同じ分析物分子(相互作用する分子の複合体であり得る)上のそれぞれの部位に結合すると、すなわちプローブが標的分析物に同時に結合すると互いに近接し、この場合、官能性ドメイン(例えば核酸ドメイン)は、直接的又は間接的に相互作用することができる。例えば、近接している場合の近接プローブの核酸ドメインは、付加された1つ以上のオリゴヌクレオチドの互いのライゲーション(1つ以上の近接プローブの核酸ドメインであり得る)、例えば、付加された直鎖オリゴヌクレオチドを環状化するための分子内ライゲーションを鋳型化し得る。様々なそのようなアッセイフォーマットが国際公開第01/61037号に記載されている。
それによって生成された環状アンプリコンは、試料中の分析物の有無を報告するのに役立ち、例えばリアルタイム定量PCR(q-PCR)によって定性的又は定量的に検出することができる。
それによって生成された環状アンプリコンは、試料中の分析物の有無を報告するのに役立ち、例えばリアルタイム定量PCR(q-PCR)によって定性的又は定量的に検出することができる。
上述のように、固有のバーコード化配列を使用すると、単一の実験からの試料のプールから各試料のソースを追跡することが容易になる。「多重化」は、単一の反応に組み合わされた複数の試料の同時検出を容易にする。複数の固有のバーコード配列と多重化すると、1つの実験においていくつかの試料の検出及びソース識別が可能になる。
一態様では、本開示は、複数の生物学的試料における少なくとも1つの感染を同定するための方法を提供する。方法は、複数の対象から複数の生物学的試料を得ることと、複数の独自に標識されたビーズに結合した複数の捕捉剤を含むアレイを提供することとを含む。独自に標識されたビーズの各々は、複数の固有の捕捉剤を含む。アレイは、少なくとも1つのビーズに結合するように設計された少なくとも1つの第1のオリゴヌクレオチド配列をさらに含む。いくつかの実施形態では、複数の第1のヌクレオチド配列は、少なくとも1つの標的タンパク質(例えば、ビーズ上にコーティングされたCOVID-19のSタンパク質抗原に特異的に結合する生物学的試料からの抗体)に特異的に結合する抗原(例えば、COVID-19のSタンパク質抗原)でコーティングされた複数のビーズに結合する。アレイは、第2のオリゴヌクレオチド配列とコンジュゲートした少なくとも1つの二次抗体をさらに含む。第2のオリゴヌクレオチド配列が第1のオリゴヌクレオチド配列に近接している場合、独自にバーコード化された環状ヌクレオチド鋳型は、増幅されて環状アンプリコンを形成するように設計される。いくつかの実施形態では、第1及び第2のヌクレオチド配列は、固有のバーコード配列を含む。いくつかの実施形態では、第1及び第2のヌクレオチド配列は、第1及び第2のヌクレオチド配列のそれぞれに2つ以上の固有のバーコードを付加することを可能にするスペーサー配列(例えば、アダプター配列)を含む。
いくつかの実施形態では、アレイは、少なくとも96ウェル、少なくとも384ウェル、少なくとも1536ウェル、又はそれ以上のウェルを有する1つ又は複数のプレートを含むマルチプレックスアレイである。いくつかの実施形態では、第1及び第2のヌクレオチド配列は、第1のオリゴヌクレオチド配列又は第2のオリゴヌクレオチド配列、又はそれらの組み合わせ中に少なくとも384個の異なるバーコード配列を含む。特定の実施形態では、アレイは、環状アンプリコン中に少なくとも384個の固有のバーコード配列を含む。本明細書中に記載されるすべての実施形態において、複数のビーズは、独自に標識されたビーズの各々が複数の固有の捕捉剤(例えば、COVID-19のSタンパク質抗原)を含むように、独自に標識される。本明細書に記載される方法の多くの実施形態では、ビーズは少なくとも2つの近接プローブと共にインキュベートされる。第1の近接プローブは、少なくとも1つのビーズに結合した固有の捕捉剤に結合するように設計されたポリペプチドにコンジュゲートされた第1のオリゴヌクレオチド配列を含む。特定の実施形態では、第1のオリゴヌクレオチド配列は、ビーズ上にコーティングされた捕捉剤との直接共有結合相互作用によってコンジュゲートされる。他の特定の実施形態において、第1のオリゴヌクレオチド配列は、ビーズ上にコーティングされた捕捉剤との共有結合相互作用を通して、例えば、抗体、scFvドメインを含む、結合ドメインなどの別のポリペプチドによって媒介されて、ビーズ上の抗原へコンジュゲートされる。第2の近接プローブは、標的タンパク質(例えば、COVID 19のSタンパク質に対する抗体)に特異的に結合する(例えば、少なくとも約10-4M、通常は少なくとも約10-8M以上、例えば10-10M以上の結合親和性で)抗体にコンジュゲートされた第2のオリゴヌクレオチド配列を含む。標的タンパク質を含む試料とのインキュベーション時に、2つの近接プローブを、それらが鋳型環状DNAにハイブリダイズするように近接させる。次いで、環状DNA鋳型を増幅して、下流シーケンシングによって検出される環状アンプリコンを生成する。本明細書に記載の方法の実施形態では、環状DNA鋳型は個別にバーコード化され、検出器のための近接ライゲーション配列も含む。アンプリコンの検出は、特定の対象から得られた対応する試料が標的タンパク質を有することを示す。
近接プローブは、核酸の尾状又はタグ付き親和性リガンド、例えば、タグ又は尾部核酸(すなわち、核酸ドメイン)にコンジュゲートされた親和性リガンド(すなわち、検体結合ドメイン)を含むコンジュゲート分子であり、2つの構成要素は、一般に(必ずしもそうとは限らないが)、例えば直接又は連結基を介して互いに共有結合している。代表的な実施形態では、「尾状」親和性リガンドは、直接又は連結基を介してタグ核酸に共有結合した親和性リガンドで構成され、連結基は、切断可能、例えば酵素的に切断可能(例えば、制限エンドヌクレアーゼ認識部位を含み得る)、光不安定、その他であってもなくてもよい。特定の実施形態では、核酸尾状親和性リガンド又は近接プローブの親和性リガンド(すなわち、分析物結合する)ドメイン、部分又は構成要素は、標的分析物に対して高い結合親和性を有するscFV分子である。高い結合親和性とは、少なくとも約10-4M、通常少なくとも約10-8M以上、例えば10-10M以上の結合親和性を意味する。親和性リガンドは、タグ付き親和性リガンドとして存在する場合に標的タンパク質に対して必要な結合親和性を示す限り、様々な異なる種類の分子のいずれかであり得る。特定の実施形態では、親和性リガンドは、その標的分析物に対して中程度又はさらには低い、例えば約10-4M未満の親和性を有するリガンドである。
本明細書中に記載される方法の多くの実施形態において、親和性リガンドは、結合ドメイン(例えば、抗体、並びにその結合断片及び模倣物)である。抗体が親和性リガンドである場合、それらは、特異性が異なる抗体の異種集団がそれぞれ同じタグ核酸でタグ付けされるようなポリクローナル組成物、又は標的タンパク質に対して同じ特異性を有する同一の抗体の同種集団がそれぞれ同じタグ核酸でタグ付けされるモノクローナル組成物に由来し得る。したがって、親和性リガンドは、モノクローナル及びポリクローナル抗体のいずれかであり得る。さらに他の実施形態では、親和性リガンドは、抗体結合断片又は模倣物であり、これらの断片及び模倣物は、標的タンパク質に対して必要な結合親和性を有する。例えば、Fv、F(ab)及びFabなどの抗体断片は、無傷のタンパク質の切断、例えば、プロテアーゼ又は化学切断によって調製され得る。また、組換え生成された抗体断片、例えば一本鎖抗体又はscFvも対象であり、そのような組換え生成された抗体断片は、上記抗体の結合特性を保持する。そのような組換え生成された抗体断片は、一般に、対象抗体の結合特性を保持するように、少なくとも対象抗体のVHドメイン及びVLドメインを含む。本開示のこれらの組換え生成された抗体断片又は模倣物は、任意の好都合な方法論、例えば、米国特許第5,851,829及び5,965,371号に開示されている方法論を用いて容易に調製され得る。それらの開示は、参照により本明細書に組み込まれている。
重要なことに、親和性リガンドは、その標的タンパク質に対する親和性リガンドのための結合親和性を実質的に消失させることなく、核酸尾部に共有結合することができるドメイン又は部分を含むものである。
本明細書中に記載される方法の多くの実施形態において、固有のバーコード配列は、環状プラスミドのそれぞれに導入される。これにより、増幅後の効率的な検出が可能になり、タンパク質試料をバーコード化オリゴで個別に標識する必要がなくなり、面倒で時間のかかるプロセスが回避される。他の実施形態では、固有のバーコード配列が近接プローブの各々に導入される。バーコード配列は、ソース識別(例えば、試料ID、患者ID、アレイ内の試料のウェル又はプレート位置)を容易にする固有のヌクレオチド配列である。バーコード配列の長さは、3~20ヌクレオチド長、例えば5~15ヌクレオチド長であり得る。いくつかの実施形態では、バーコード配列は完全にランダムであってもよく、すなわち、A、T、G、及びCのいずれか1つがバーコード配列の任意の位置にあってもよい。例示的な一実施形態では、固有のDNAバーコードは、一連の2つのPCR工程において液体処理システムを指揮するコンピュータアルゴリズムによって割り当てられる。他の実施形態では、バーコード配列は、準定義されているか、又は完全に定義されている。例示的な実施形態では、対象情報はデータベースに登録され、対象には独自にバーコード化された(身体的)試料コレクションチューブが与えられる。ロボットは、プロセス全体を通して試料の独自の識別を可能にする、化学的性質の固有のバーコードDNA配列を割り当てる。この場合、バイアルバーコードは患者と一致し、固有のDNAバーコードプライマーの組み合わせがバイアルのIDに独自に割り当てられる。384のプライマーの1つの「ウェルバーコード」セット(セットA)をマイクロウェルプレート(対象ごとに1つのウェル、例えば384ウェルプレート)中の各対象ウェルに割り当て、次いで、384のプライマーの第2のセット(セットB)がプレートの産物を増幅する(プレートごとに1つの「プレート」バーコードプライマー)。このように、合計して患者からの147000の固有の試料になる384×384の固有の組み合わせを処理することができる。これらの割り当ての各々は、デコンボリューションのために追跡され記憶される。
いくつかの実施形態では、近接プローブは、標的鋳型環状DNAに相補的な1つ又は複数のアダプター領域を含む。鋳型環状DNAはまた、増幅中に保持され、ハイスループットシーケンシング工程中のアンプリコンのソース識別を容易にする固有のバーコード情報を有する。例示的な実施形態において、固有のDNAバーコードは、コンピュータアルゴリズムによって、アレイの各ウェルに付加された鋳型環状DNAの各々に割り当てられる。
384個の固有の環状アンプリコンは、セットAを表し、次いで、それらは、セットBからのさらなる384個のフォワード及びリバースの一つをアルゴリズム的に付加することによって増幅される。
384個の固有の環状アンプリコンは、セットAを表し、次いで、それらは、セットBからのさらなる384個のフォワード及びリバースの一つをアルゴリズム的に付加することによって増幅される。
本明細書に記載される方法のいくつかの実施形態では、アンプリコンは、シーケンシングによって検出される。配列データの生成は、典型的にはハイスループットDNAシーケンシングシステム、例えばDNA鋳型の大規模並行シーケンシングを利用する次世代シーケンシング(NGS)システムを使用して行われる。核酸配列データを生成するための例示的なNGSシーケンシングプラットフォームは、これらに限定されないが、オックスフォードナノポアシーケンサー(例えば、MinlON MklC、Flongle、Minion、Gridlon及び/又はPromethlONを含むナノポアデバイス)、Illuminaの合成技術によるシーケンシング(例えば、Illumina MiSeq又はHiSeq System)、Life TechnologiesのIon Torrent半導体シーケンシング技術(例えば、Ion Torrent PGM又はProton system)、the Roche(454 Life Sciences)GSシリーズ及びQiagen(Intelligent BioSystems)Gene Readerシーケンシングプラットフォームが含まれる。本方法のいくつかの実施形態では、バーコード化アンプリコンをプールして「ライブラリー」を作成し、ハイブリダイゼーション反応混合物に添加し、65℃で12時間インキュベートした。Illumina MiSeq(商標)(Illumina,San Diego,CA)又はIon Torrent(商標)Personal Gene Machine(PGM)(Life Technologies,Grand Island,NY)シーケンシングプラットフォームのいずれかに必要なさらなる配列(例えば、アダプター)を、融合プライマーを使用して5’及び3’アダプターに加えた。DNAライブラリーを半分に二分割した。一方の半分を、5’及び3’アダプターに相補的な部分を有し、MiSeqシーケンシングのためのさらなる配列を追加する融合プライマーで増幅し、他方の半分を、PGMシーケンシングのためのさらなる配列を追加するプライマーのセットで増幅した。
例示的な実施形態では、アンプリコンはシーケンシングされ、シーケンシングファイルは、(a)それぞれが独自にタグ付けされた、複数の対象からの標的分析物(例えば、COVID 19特異的抗体、SARS特異的抗体、インフルエンザ特異的抗体)を含む試料の各々のための二重バーコード化アンプリコン、及び(b)PCR反応が適切に実行されたことを確認する陽性対照配列(合成又は天然)のための二重バーコード化アンプリコンを含む。次いでアッセイ結果は、各患者を独自に識別する二重バーコードの組み合わせについて配列ファイルをスキャンするアルゴリズムによって読み取られる。例えば、ファイル内のジョイント配列(アダプター、その他を含む)を検出すると、アルゴリズムは対象を陽性同定し、それらを中央データベースに「陽性」として登録することができる。患者が陽性対照のみを有し、アンプリコン(例えば、COVID 19特異的抗体、SARS特異的抗体、インフルエンザ特異的抗体)を有さない場合、それらには「陰性」結果が割り当てられる。いくつかの実施形態では、報告システムは、結果を患者、医師、又は診療所などに転送することができる。
本明細書で提供される方法は、一般に、種々の患者集団及び/又は1つ若しくは複数の病原性変異体を有する同じ患者から得られた複数の配列データから、バーコード化アンプリコンのコンセンサス配列を決定するための堅牢で柔軟な方法及びシステムに関する。生体分子配列決定のための技術及び方法は、必ずしも完全な配列データを生成するとは限らない。例えば、DNAシーケンシングデータが100%の精度ですべての塩基を一義的に同定しない場合が多く、これは、シーケンシングデータが単一の合格又は「リード」から生成される場合に特に当てはまる。特定の実施形態では、この方法は、任意の1合格配列分析システムよりも正確に、核酸配列を最終コンセンサス配列のセットに同化させるためのアルゴリズムを含む。特定の実施形態において、この方法は、配列情報をPCRアンプリコンから生のONT FASTSシーケンシング出力ファイルに変換し、それを次いで、高精度ONT GPUに基づくベースコーラーによって生のFASTA/FASTQファイルに変換するアルゴリズムを含む。この方法は、FASTA/FASTQファイルをHMMER3及びCM配列アラインメント及びアノテーションエンジンに供して、参照バーコード候補に対する最小レーベンシュタイン距離スコアを合格する二重バーコードを有する配列リードを得るアルゴリズムをさらに含む。本明細書に記載される方法のこれらの合格リードは、完全な標的配列アノテーション、モデルフィット、ビットスコア、バーコード位置、バーコード距離、及び他のメトリックと共に中央データベースに記憶される。
特定の実施形態では、本明細書に記載の方法は、複数の試料からの標的分析物の同時同定を可能にする多重化近接ライゲーションアッセイを含む。アッセイのオリゴヌクレオチド成分(例えば、環状アンプリコンのバーコード、プローブオリゴのバーコード)のバーコードを修飾することによって、この設定は、いくつかの患者試料からの標的分析物の同時検出を可能にする。例えば、384×384の固有の組み合わせのマルチプレックスアレイは、147000個の別個の患者試料中の標的分析物(例えば、COVID 19のSタンパク質に対するIgG又はIgM免疫グロブリン)の存在を定量的及び定性的に同時に評価することができる。本開示の関連する態様では、本明細書に記載の血清学的アッセイ方法は、例えば、病原体感染の決定因子である2つ以上の標的分析物を検出するためのマルチプレックス設定において特に有用である。この方法は、コンビナトリアル様式で使用され得る。例えば、それは、それぞれCOVID 19及びインフルエンザ感染の決定因子である少なくとも2つの標的抗体を検出するために使用され得る。そのような実施形態において、固有のバーコードを有する環状DNA鋳型及び/又は固有のバーコードを有する近接プローブの対が、標的抗体の各々について提供される場合がある。特定の実施形態では、環状断片は、識別バーコード(例えば、患者識別バーコード)及び疾患型バーコードを有するが、プローブオリゴからのアダプターは、標的に応じて異なる。
したがって、固有のバーコードを有する検出可能な環状DNAアンプリコンは、同じ標的抗体に結合した近接プローブの各対から同様の様式で作製され得る。「バーコード」は、シーケンシングに基づいてデコードされる。アッセイ結果は、各患者からの各試料を独自に識別する固有のバーコードについて配列ファイルをスキャンするアルゴリズムによって読み取ることができる。各標的抗体に対応する固有のアンプリコンを検出すると、アルゴリズムは対象を陽性同定し、それらを感染それぞれについて中央データベースに「陽性」として登録することができる。患者が陽性対照を有し、任意の標的抗体に対応するアンプリコンを有さない場合、それらには「陰性」結果が割り当てられる。
以下の実施例は、本明細書に記載される組成物及び方法がどのように使用され、作製され、評価され得るかの説明を当業者に提供するために記載され、本開示の純粋に例示的なものであることを意図し、本発明者らが本発明とみなすものの範囲を限定することを意図しない。
実施例1:別個の病原体に対する増幅プライマーの同定及びスクリーニング
別個の病原体に対するプライマーの設計では、プライマーの選択は、別個の、かつ各病原体に固有のゲノム領域に対して行われる。上記で選択されたプライマーを用いた増幅によって産生された得られたアンプリコンは、それらの別個の病原体の各々のためのゲノム配列を有する。HMMモデルは、病原体配列及びそれらのバーコードのそれぞれについて定義され、アラインメントにおいて、病原体配列に最も密接に一致する(例えば、最も高いビットスコアを有するアラインメント)モデルは、オリジナル試料にどの病原体が存在したかを示す。これらのプライマーは、本明細書に記載されるようにバーコード化(例えば、1段階又は2段階バーコード化)することができる。バーコード配列及びプライマーは、二次構造相互作用についてスクリーニングされた非常に大きな検証済みIDTバーコードライブラリーから選択され、高度に最適化されたエラー耐性バーコード設計をもたらす。非限定的な例示的バーコード配列を表1に提供する。表1に提供される96個のバーコード配列(3000+総バーコード内から選択された)は、最大レーベンシュタイン距離で分離されている。本明細書に記載される方法は、最大レーベンシュタイン距離で分離された384個のバーコード配列を使用することができる。バーコード配列の選択はアルゴリズム的に行われ、選択サイズに応じて異なる結果をもたらす。本明細書で提供される方法及び組成物の実施形態において、選択されるバーコード配列の数は、プライマーが構築されるバーコードプールのサイズに基づく。シーケンシングの際に、これらのバーコードを識別し、シーケンシングされた各アンプリコンに患者の同一性を割り当てるために使用することもできる。
別個の病原体に対するプライマーの設計では、プライマーの選択は、別個の、かつ各病原体に固有のゲノム領域に対して行われる。上記で選択されたプライマーを用いた増幅によって産生された得られたアンプリコンは、それらの別個の病原体の各々のためのゲノム配列を有する。HMMモデルは、病原体配列及びそれらのバーコードのそれぞれについて定義され、アラインメントにおいて、病原体配列に最も密接に一致する(例えば、最も高いビットスコアを有するアラインメント)モデルは、オリジナル試料にどの病原体が存在したかを示す。これらのプライマーは、本明細書に記載されるようにバーコード化(例えば、1段階又は2段階バーコード化)することができる。バーコード配列及びプライマーは、二次構造相互作用についてスクリーニングされた非常に大きな検証済みIDTバーコードライブラリーから選択され、高度に最適化されたエラー耐性バーコード設計をもたらす。非限定的な例示的バーコード配列を表1に提供する。表1に提供される96個のバーコード配列(3000+総バーコード内から選択された)は、最大レーベンシュタイン距離で分離されている。本明細書に記載される方法は、最大レーベンシュタイン距離で分離された384個のバーコード配列を使用することができる。バーコード配列の選択はアルゴリズム的に行われ、選択サイズに応じて異なる結果をもたらす。本明細書で提供される方法及び組成物の実施形態において、選択されるバーコード配列の数は、プライマーが構築されるバーコードプールのサイズに基づく。シーケンシングの際に、これらのバーコードを識別し、シーケンシングされた各アンプリコンに患者の同一性を割り当てるために使用することもできる。
実施例2:アンプリコン設計
アンプリコン設計は、プライマーの5’末端のそれぞれにバーコード化配列及びスペーサー(アダプター)配列を用いて合成された病原体特異的フォワードプライマー及びリバースプライマーから始まる。病原体のゲノムの存在下で増幅すると、これはアンプリコンプールをもたらし、そこでDNAの各鎖はスペーサー(アダプター)及びバーコードを含む。スペーサーは、HMM/CMアラインメントエンジンがバーコードを正確に識別し、最終配列内の別個のバーコードを分析することができるために不可欠である。アダプター配列の非限定的な例は、本明細書において、ACACTGACGACATGGTTCTACA(配列番号21)及びT ACGGT AGC AGAGACTTGGT CT(配列番号22)に記載のポリヌクレオチド配列で提供される。
アンプリコン設計は、プライマーの5’末端のそれぞれにバーコード化配列及びスペーサー(アダプター)配列を用いて合成された病原体特異的フォワードプライマー及びリバースプライマーから始まる。病原体のゲノムの存在下で増幅すると、これはアンプリコンプールをもたらし、そこでDNAの各鎖はスペーサー(アダプター)及びバーコードを含む。スペーサーは、HMM/CMアラインメントエンジンがバーコードを正確に識別し、最終配列内の別個のバーコードを分析することができるために不可欠である。アダプター配列の非限定的な例は、本明細書において、ACACTGACGACATGGTTCTACA(配列番号21)及びT ACGGT AGC AGAGACTTGGT CT(配列番号22)に記載のポリヌクレオチド配列で提供される。
実施例3:配列変異体の分析
病原性変異体は、アンプリコンを形成するために使用されるプライマーが、各変異体に特異的なホールマーク変異を有することが知られているゲノム領域(例えば、SARS-CoV-2スパイクタンパク質の受容体結合ドメイン)に及ぶ場合、容易に同定され得る。病原体試料のシーケンシングにおいて、鋳型配列(例えば、非バーコード、非スペーサー)を、最高スコアリングのアンプリコンで参照ゲノムデータベースに対してアラインメントすることができる。次いで、配列類似性又は同一性によって、鋳型配列に対する先に記載された配列の近接一致の判定を行うことができる。あるいは、各患者由来の鋳型配列の多重配列アラインメントを実施してコンセンサス配列を生成することができる。患者あたり数百から数万のアンプリコン配列が頻繁に得られ、時折シーケンサーのエラーがあっても、非常に堅牢なコンセンサス配列が可能になる。次いで、コンセンサス配列を、ゲノム又はタンパク質参照データベース(例えば、Genbank又は特注の参照ゲノムデータベース)中の配列にアラインメントすることができる。
病原性変異体は、アンプリコンを形成するために使用されるプライマーが、各変異体に特異的なホールマーク変異を有することが知られているゲノム領域(例えば、SARS-CoV-2スパイクタンパク質の受容体結合ドメイン)に及ぶ場合、容易に同定され得る。病原体試料のシーケンシングにおいて、鋳型配列(例えば、非バーコード、非スペーサー)を、最高スコアリングのアンプリコンで参照ゲノムデータベースに対してアラインメントすることができる。次いで、配列類似性又は同一性によって、鋳型配列に対する先に記載された配列の近接一致の判定を行うことができる。あるいは、各患者由来の鋳型配列の多重配列アラインメントを実施してコンセンサス配列を生成することができる。患者あたり数百から数万のアンプリコン配列が頻繁に得られ、時折シーケンサーのエラーがあっても、非常に堅牢なコンセンサス配列が可能になる。次いで、コンセンサス配列を、ゲノム又はタンパク質参照データベース(例えば、Genbank又は特注の参照ゲノムデータベース)中の配列にアラインメントすることができる。
実施例4:SARS-CoV-2ウイルス検出
A.プライマー設計及びバーコード化アンプリコンの生成
高度にコンピュータ的に最適化されたアンプリコン(モチーフ、バーコード、スペーサー、及び明確に定義されたウイルスインサート)を生成しながらスループットを最大化するように設計されたPCRプライマー及びライゲーション反応。
SARS-CoV-2への曝露が知られた、又は疑われる患者からの生物学的試料(例えば、血液、唾液又は粘液)を得た。例示的な標的ゲノムとして、SARS-Cov-2ゲノムを選択した。E-Guelph、N_HKU、N2、Orflabタンパク質をエンコードするヌクレオチドに対応する約7~12の核酸塩基長の固有配列セグメントを同定した。発生頻度及び選択比の値を決定した。ほとんどの場合、プライマーは、その対応するゲノム配列セグメント(例えば、E-Guelph、N_HKU、N2、Orflabタンパク質をエンコードするヌクレオチドに対応するセグメント)に対して100%の相補性でハイブリダイズするように設計された。少数の他の場合では、縮重プライマーを調製した。プライマーの縮重塩基は、標的内でアンビギュイティを有する位置と相補的な位置に生じる。標準的なqPCRプライマーは、プローブハイブリダイゼーションのためにDNAの小セグメントを増幅する。図4に示すように、qPCRアンプリコンは患者ごとに同一である。
A.プライマー設計及びバーコード化アンプリコンの生成
高度にコンピュータ的に最適化されたアンプリコン(モチーフ、バーコード、スペーサー、及び明確に定義されたウイルスインサート)を生成しながらスループットを最大化するように設計されたPCRプライマー及びライゲーション反応。
SARS-CoV-2への曝露が知られた、又は疑われる患者からの生物学的試料(例えば、血液、唾液又は粘液)を得た。例示的な標的ゲノムとして、SARS-Cov-2ゲノムを選択した。E-Guelph、N_HKU、N2、Orflabタンパク質をエンコードするヌクレオチドに対応する約7~12の核酸塩基長の固有配列セグメントを同定した。発生頻度及び選択比の値を決定した。ほとんどの場合、プライマーは、その対応するゲノム配列セグメント(例えば、E-Guelph、N_HKU、N2、Orflabタンパク質をエンコードするヌクレオチドに対応するセグメント)に対して100%の相補性でハイブリダイズするように設計された。少数の他の場合では、縮重プライマーを調製した。プライマーの縮重塩基は、標的内でアンビギュイティを有する位置と相補的な位置に生じる。標準的なqPCRプライマーは、プローブハイブリダイゼーションのためにDNAの小セグメントを増幅する。図4に示すように、qPCRアンプリコンは患者ごとに同一である。
図4は、各患者の試料に固有のバーコード化配列にライゲーションされた核酸塩基長約20のプライマーを使用して、SARS-Cov2ゲノム中の標的N1タンパク質の増幅によって生成された例示的なアンプリコンを示す。図4に示されるように、各標的配列は同一であるが、配列の末端における固有のバーコードは個々の患者試料を互いから識別し、試料IDを保持しながらの試料プーリングを可能にする。
B.マルチプレックスPCR及びシーケンシング
図5Aは、SARS-Cov2ゲノムからの例示的な標的E-Guelphタンパク質の配列標識及びスコアリングデータを示す。プールされたライブラリー調製物からのPCRアンプリコンをONT MinlON又はGridiONでシーケンシングして、生のONT FASTSシーケンシング出力ファイルを得た。出力ファイルを高精度ONT GPUに基づくベースコーラーに供して、生のFASTA/FASTQファイルを得た。FASTA/FASTQファイルをHMMER3及びCM配列アラインメント及びアノテーションエンジンで実行した。HMM/CMエンジンは、統計的パターン分類アルゴリズムを適用して、a)複製配列リードに基づいて尤度を最大化すること、及び/又はb)全ゲノム多重配列アラインメントに基づいて文脈依存アラインメントモデルパラメータを使用することによってコンセンサス配列を生成する。図5Aは、ビットスコア並びにバーコード及びウイルスインサート領域のアラインメントを示す。
図5Aは、SARS-Cov2ゲノムからの例示的な標的E-Guelphタンパク質の配列標識及びスコアリングデータを示す。プールされたライブラリー調製物からのPCRアンプリコンをONT MinlON又はGridiONでシーケンシングして、生のONT FASTSシーケンシング出力ファイルを得た。出力ファイルを高精度ONT GPUに基づくベースコーラーに供して、生のFASTA/FASTQファイルを得た。FASTA/FASTQファイルをHMMER3及びCM配列アラインメント及びアノテーションエンジンで実行した。HMM/CMエンジンは、統計的パターン分類アルゴリズムを適用して、a)複製配列リードに基づいて尤度を最大化すること、及び/又はb)全ゲノム多重配列アラインメントに基づいて文脈依存アラインメントモデルパラメータを使用することによってコンセンサス配列を生成する。図5Aは、ビットスコア並びにバーコード及びウイルスインサート領域のアラインメントを示す。
SARS-CoV-2ウイルス検出アッセイに使用するための、広範囲のSARS-CoV-2遺伝子標的(例えば、E-Guelph、N-HKU)及び対照(例えば、TME)の両方を評価した。複数のPCRマスター混合物を評価した。すべての標的が適切なPCR増幅を示し、より長い遺伝子及びNEBマスター混合物(選択されたLuna-Taq)において優位であった。図6は、SARSGoV-2遺伝子標的からの多重化PCR及びシーケンシング結果を示す。結果は、優れた増幅及び高いアラインメントスコアを実証する。比較的控えめなスコアカットオフであっても、多数の高スコアリングリードが得られた。図7及び表3に示すように、複数のシーケンシング実施にわたって、ほぼ同一の交差実行配列回復を伴う高い再現性が得られた。
実施例4:SARS-CoV2に曝露された患者からのポイントオブケアデータ
生物学的試料(例えば、血液、唾液又は粘液)は、SARS-CoV-2への曝露が知られた、又は疑われる7人の患者から得られた。特異的な標的特異的プライマーを、E-Guelph、N_HKU、N2、Orflabタンパク質をエンコードするヌクレオチドに100%の相補性でハイブリダイズするように設計した。PCRアンプリコンは、各患者の試料に固有のバーコード化配列にライゲーションされた核酸塩基長約20のプライマーを使用して、SARS-Cov2ゲノム中の標的タンパク質E-Guelph、N_HKU、N2、Orflabタンパク質の増幅によって生成された。qPCRは、7人中3人の患者が陰性であることを示した。本明細書に記載の大規模並行診断法を使用して、すべてのqPCR陰性試料について高品質のリードを得た。結果を表4に要約する。
生物学的試料(例えば、血液、唾液又は粘液)は、SARS-CoV-2への曝露が知られた、又は疑われる7人の患者から得られた。特異的な標的特異的プライマーを、E-Guelph、N_HKU、N2、Orflabタンパク質をエンコードするヌクレオチドに100%の相補性でハイブリダイズするように設計した。PCRアンプリコンは、各患者の試料に固有のバーコード化配列にライゲーションされた核酸塩基長約20のプライマーを使用して、SARS-Cov2ゲノム中の標的タンパク質E-Guelph、N_HKU、N2、Orflabタンパク質の増幅によって生成された。qPCRは、7人中3人の患者が陰性であることを示した。本明細書に記載の大規模並行診断法を使用して、すべてのqPCR陰性試料について高品質のリードを得た。結果を表4に要約する。
他の実施形態
本明細書で言及されるすべての刊行物、特許、及び特許出願は、あたかも各独立した刊行物又は特許出願が参照により組み込まれることが具体的かつ個別に示されているのと同程度に、参照により本明細書に組み込まれる。
本明細書で言及されるすべての刊行物、特許、及び特許出願は、あたかも各独立した刊行物又は特許出願が参照により組み込まれることが具体的かつ個別に示されているのと同程度に、参照により本明細書に組み込まれる。
本開示は、その特定の実施形態に関連して説明されてきたが、さらなる修正が可能であり、本開示は、一般に、本開示の原理に従う、本開示が関係する技術分野内の既知の又は慣習的な実施に含まれ、本明細書で上述した本質的な特徴に適用することができ、特許請求の範囲内に従う本開示からの逸脱を含む、本開示の任意の変形、使用、又は順応を包含することを意図していることが理解されよう。
他の実施形態は、特許請求の範囲内である。
Claims (95)
- 少なくとも1つの標的核酸を同定するための方法であって、
a)複数の対象から複数の生物学的試料を得る工程;
b)複数のポリヌクレオチドを含む全核酸を、前記生物学的試料の各々から得る工程;
c)前記複数のポリヌクレオチドを増幅混合物を使用する増幅に供して、複数のアンプリコンを産生する工程であって、前記増幅混合物が、複数のプライマーと、第1の固有のバーコード配列及びその逆相補体と、少なくとも1対のアダプター配列とを含み、前記複数のプライマーの各々が、それらが結合する前記ポリヌクレオチドの各々に相補的なヌクレオチドのセットを含み、前記第1の固有のバーコード配列が、前記特定の対象から得られた前記生物学的試料を識別し、前記アダプター配列の対が、前記第1の固有のバーコード配列及びその逆相補体に隣接し、前記複数のアンプリコンの各々が、標的増幅領域又は対照領域由来のポリヌクレオチドを含む、工程;
d)前記複数のアンプリコンの各々を検出する工程;及び
e)前記複数のアンプリコンのカテゴリーを決定する工程;
を含み、
前記標的増幅領域からの前記ポリヌクレオチドを含む前記複数のアンプリコンの各々の前記カテゴリーを決定することが、前記対応する対象が前記標的核酸を有することを示し、
工程b)は、前記複数のポリヌクレオチドがRNA分子を含む場合、工程c)における増幅を実施する前に、前記RNAから逆転写されたcDNAを得ること、又は前記RNAからcDNAを逆転写することをさらに含む、方法。 - 工程b)における前記複数のポリヌクレオチドがRNA分子を含み、工程b)において逆転写酵素を添加して、工程c)における増幅に供される複数のcDNAを得る、請求項1に記載の方法。
- 工程b)における前記複数のポリヌクレオチドがDNA分子をさらに含む、請求項2に記載の方法。
- 前記標的核酸が、RNAウイルス、DNAウイルス、真菌、寄生生物及び細菌からなる群から選択される1つ又は複数の病原体を含む試料から得られる、請求項1に記載の方法。
- 前記病原体が、アシネトバクター・バウマンニ(Acinetobacter baumannii)、アデノウイルス、アフリカ馬疫ウイルス、アフリカ豚コレラウイルス、ズビニ鉤虫(Anclostoma duodenale)、回虫、黄色アスペルギルス、アスペルギルス・フミガーツス(Aspergillus fumigatus)、アスペルギルス・ニガー(Aspergillus niger)、アスペルギルス・オリゼ(Aspergillus oryzae)、鳥インフルエンザウイルス、炭疽菌、炭疽菌パスツール株、セレウス菌、ウシ流産菌、ブルセラ・メリテンシス(Brucella melitensis)、ブルセラ・スイス(Brucella suis)、鼻疽菌、類鼻疽菌、カンジダ・アルビカンス(Candida albicans)、カンジダ・ドゥブリニエンシス(Candida dubliniensis)、カンジダ・グラブラタ(Candida glabrata)、カンジダ・クルセイ(Candida krusei)、カンジダ・トロピカリス(Candida tropicalis)、クラミジア・ニューモニエ(Chlamydia pneumoneae)、クラミジア・トラコマチス(Chlamydia trachomatous)、豚熱ウイルス、クロストリジウム・ディフィシール(Clostridium difficile)、コクシジオイデス・イミティス(Coccidioides immitis)、コクシジオイデス・ポサダシ(Coccidioides posadasii)、CoV-229E、CoV-HKU1、CoV-NL63、CoV-OC43、コクサッキーウイルスA、コクサッキーウイルスB、コクシエラ・バーネッティ(Coxiella burnetii)、クリミア・コンゴ出血熱、サイトメガロウイルス、デングウイルス、メジナ虫、東部馬脳炎、エボラウイルス、い粒条虫、多包条虫、エンテロバクター・クロアカ、エンテロコッカス・フェシウム(Enterococcus faecium)、エンテロウイルス、エプスタイン・バール・ウイルス、大腸菌、巨大肝蛭、肝蛭、***ウイルス、野兎病菌、山羊痘ウイルス、ヘモフィルス属インフルエンザ、ヘリコバクターピロリ、ヘンドラウイルス、A型肝炎ウイルス、B型肝炎ウイルス、C型肝炎ウイルス、ヒストプラスマ・カプスラーツム(Histoplasma capsulatum)、ズボアジ型ヒストプラスマ症(Histoplasma duboisii)、ヒトヘルペスウイルスHHV6、ヒトヘルペスウイルスHHV7、ヒトヘルペスウイルスHHV8、ヒトヘルペスウイルスHSV1、ヒトヘルペスウイルスHSV2、ヒト免疫不全ウイルス、ヒトパピローマウイルス、インフルエンザウイルスA型、インフルエンザウイルスB型、クレブシェラ肺炎桿菌、キャサヌール森林病ウイルス、ラッサ熱ウイルス、レジオネラ・ニューモフィラ菌、リーシュマニア・プロマスティゴート(Leishmania promastigotes)、Lujoウイルス、ランピースキン病ウイルス、マールブルグウイルス、麻疹ウイルス、メチシリン耐性黄色ブドウ球菌、サル痘ウイルス、ムンプスウイルス、マイコバクテリウム・アブセッサス(Mycobacterium abscessus)、マイコバクテリウム・アビウム(Mycobacterium avium)、マイコバクテリウム・ボビス(Mycobacterium bovis)、マイコバクテリウム・カヌッティイ(Mycobacterium canettii)、マイコバクテリウム・レプレ(Mycobacterium leprae)、ヒト結核菌、マイコバクテリウム・ウルセランス(Mycobacterium ulcerans)、マイコプラズマ・カプリコルム(Mycoplasma capricolum)、マイコプラズマ・ミコイデス(Mycoplasma mycoides)、マイコプラズマ・ニューモニア(Mycoplasma pneumoneae)、アメリカ十二指腸虫、淋病、ニューカッスル病ウイルス、ニパウイルス、ノルカジア属beijingensis、ノルカジア属cyriacigeorgica、ノルカジア属farcinica、ノロウイルスGI、ノロウイルスGII、ノーウォークウイルス、オムスク出血熱ウイルス、回旋糸状虫、発癌性ヒトパピローマウイルス、パラインフルエンザウイルス、寄生生物、マルネッフェイ型ペニシリウム症(Penicilliosis mameffei)、小反芻獣疫ウイルス(Peste des perils ruminants virus)、ニューモシスチス・イロベチイ(Pneumocystis jirovecii)、ポリオーマウイルス、プロテウス・ミラビリス(Proteus mirabilis)、緑膿菌、狂犬病ウイルス、8つの遺伝子断片すべてのコーディング領域の任意の部分を含有する、1918年のパンデミックインフルエンザウイルスの再構築された複製コンピテント形態、呼吸器合胞体ウイルス、ライノウイルス、発疹チフスリケッチア、リフトバレー熱ウイルス、牛疫ウイルス、ロタウイルスA、ロタウイルスB、ロタウイルスC、ロタウイルスG2、風疹ウイルス、SARS関連コロナウイルス(SARS-CoV)、SARS-CoV-1、SARS-CoV-2、ビルハルツ住血吸虫、日本住血吸虫、マンソン住血吸虫、羊痘ウイルス、南米出血熱ウイルスチャパレ、南米出血熱ウイルスグアナリト、南米出血熱ウイルスフニン、南米出血熱ウイルスマチュポ、南米出血熱ウイルスサビア、黄色ブドウ球菌、スタフィロコッカス・サプロフィティカス(Staphylococcus saprophyticus)、肺炎レンサ球菌、豚水疱病ウイルス、有鉤条虫、ダニ媒介性脳炎複合(flavi)ウイルス極東亜型、ダニ媒介性脳炎複合(flavi)ウイルスシベリア亜型、タバコモザイク病ウイルス、トルクテノウイルス、鞭虫、ブルーストリパノソーマ(Trypanosoma bmcei)、トリパノソーマ・クルージ(Trypanosoma cruzi)、大痘瘡ウイルス(天然痘ウイルス)、小痘瘡ウイルス(アラストリム)、ベネズエラ馬脳炎ウイルス、バンクロフト糸状虫、ペスト菌、及び上記の病原体のいずれか1つと特徴的な核酸配列を共有する病原体からなる群から選択される、請求項4に記載の方法。
- 前記アダプター配列の対が、前記第1の固有のバーコード配列及びその逆相補体を第2の固有のバーコード配列及びその逆相補体から分離する、請求項1に記載の方法。
- 前記試料が、血液、粘液、唾液、汗、涙、体腔に蓄積する流体、尿、***液、膣分泌物、脳脊髄液、リンパ液、糞便、痰、分解液、嘔吐物、汗、母乳、血清及び血漿からなる群から選択される、請求項1~6のいずれか一項に記載の方法。
- 前記RNAウイルスがSARS-CoV-2である、請求項6に記載の方法。
- 前記試料が唾液である、請求項7に記載の方法。
- 検出することが、前記アダプター配列の対並びに前記第1の固有のバーコード配列及びその逆相補体を含む前記複数のアンプリコンをシーケンシングすることを含む、請求項1に記載の方法。
- 検出することが、前記アダプター配列の対、前記第1の固有のバーコード配列及びその逆相補体、並びに前記第2の固有のバーコード配列及びその逆相補体を含む前記複数のアンプリコンをシーケンシングすることを含む、請求項6に記載の方法。
- 前記検出することが、一連のプログラムを用いてシーケンシングデータファイルを読み取ることによって行われる、請求項10又は11に記載の方法。
- 前記シーケンシングデータファイルがFASTA/FASTQフォーマットファイルである、請求項12に記載の方法。
- 前記一連のプログラムが、HMMER/Infernalアラインメントエンジンを含む、請求項12に記載の方法。
- 少なくとも1つの陽性対照試料をシーケンシングすることをさらに含み、前記陽性対照試料が前記標的核酸を含む、請求項10~14のいずれか一項に記載の方法。
- 少なくとも1つの陽性対照試料をシーケンシングすることをさらに含み、前記陽性対照試料がバクテリオファージMS2である、請求項10~14のいずれか一項に記載の方法。
- 少なくとも1つの陽性対照試料をシーケンシングすることをさらに含み、前記陽性対照試料がMS2鋳型核酸である、請求項10~14のいずれか一項に記載の方法。
- 少なくとも1つの陽性対照試料をシーケンシングすることをさらに含み、前記陽性対照試料がRNAseP又は別の非病原体遺伝子である、請求項10~14のいずれか一項に記載の方法。
- 少なくとも1つの陽性対照試料をシーケンシングすることをさらに含み、前記陽性対照試料が、ヒトハウスキーピング遺伝子GAPDH又はベータアクチン由来の核酸である、請求項10~14のいずれか一項に記載の方法。
- 前記複数のプライマーが、少なくとも96個の異なるバーコード化プライマーを含む、請求項1~17のいずれか一項に記載の方法。
- 2つ以上の標的核酸を同定することを含む、請求項1~17のいずれか一項に記載の方法。
- 前記2つ以上の標的核酸が、単一の病原体の病原性決定因子であるか、又は病原性決定因子をエンコードする、請求項21に記載の方法。
- 前記2つ以上の標的核酸が、ウイルスの病原性決定因子であるか、又は病原性決定因子をエンコードする、請求項22に記載の方法。
- 前記ウイルスがSARS-CoV-2である、請求項23に記載の方法。
- 前記病原性決定因子が、スパイクタンパク質(S)、受容体結合ドメイン(RBD)、S1タンパク質、S2タンパク質、E遺伝子、S遺伝子、Orflab遺伝子、N末端スパイクタンパク質ドメイン、全タンパク質(S1+S2)、及びヌクレオカプシド(N)タンパク質からなる群から選択される、請求項24に記載の方法。
- 前記2つ以上の標的核酸が、RNAウイルス、DNAウイルス、真菌、寄生生物及び細菌からなる群から選択される少なくとも2つの異なる病原体の病原性決定因子であるか、又は病原性決定因子をエンコードする、請求項22に記載の方法。
- 前記2つの異なるRNAウイルスが、SARS-CoV-2及びインフルエンザである、請求項26に記載の方法。
- 前記増幅がローリングサークル増幅である、請求項1~27のいずれか一項に記載の方法。
- 前記増幅がポリメラーゼ連鎖反応増幅である、請求項1~27のいずれか一項に記載の方法。
- 複数の試料から少なくとも1つの標的タンパク質を検出するためのアレイのマルチプレックスであって、前記アレイが、
a.各々が複数の固有の捕捉剤を含む、独自に標識された複数のビーズに結合した複数の捕捉剤;
b.少なくとも1つのビーズに結合するように設計され、前記ビーズが、少なくとも1つの標的タンパク質に特異的に結合する抗原でコーティングされている、少なくとも1つの第1のオリゴヌクレオチド配列;
c.第2のオリゴヌクレオチド配列とコンジュゲートされ、前記第2のオリゴヌクレオチド配列が、前記第2のオリゴヌクレオチド配列が前記第1のオリゴヌクレオチド配列に近接している場合に増幅されて、環状アンプリコンを形成するように設計されている、少なくとも1つの二次抗体;及び
d.前記環状アンプリコン中の少なくとも1つの固有のヌクレオチドバーコード配列を含む、アレイのマルチプレックス。 - 前記第1のオリゴヌクレオチド配列、又は前記第2のオリゴヌクレオチド配列、又はその両方が少なくとも1つの固有のバーコード配列を含む、請求項30に記載のアレイのマルチプレックス。
- アレイが、前記第1のオリゴヌクレオチド配列又は前記第2のオリゴヌクレオチド配列、又はそれらの組み合わせ中に少なくとも384個の異なるバーコード配列を含む、請求項31に記載のアレイのマルチプレックス。
- アレイが、前記環状アンプリコン中に少なくとも96個の異なるバーコード配列を含む、請求項30に記載のアレイのマルチプレックス。
- 前記第1のオリゴヌクレオチド配列が、前記ビーズ上にコーティングされたポリペプチドに共有結合している、請求項30に記載のアレイのマルチプレックス。
- 前記第1のオリゴヌクレオチド配列が、抗体又は抗体断片に共有結合し、前記抗体又は前記抗体断片が、前記ビーズ上にコーティングされたポリペプチドに結合する、請求項30に記載のアレイのマルチプレックス。
- 複数の生物学的試料において少なくとも1つの感染を同定するための方法であって、
a.請求項30に記載のマルチプレックスアレイを提供する工程;
b.複数の生物学的試料を複数のビーズと共に、少なくとも1つの標的タンパク質が少なくとも1つの前記ビーズの前記固有の捕捉剤と結合するのに十分な条件下でインキュベートする工程;
c.前記ビーズを洗浄して、前記固有の捕捉剤と結合しないあらゆるタンパク質を除去する工程;
d.前記ビーズを複数の二次抗体と共に、前記複数の二次抗体の各々が少なくとも1つの標的タンパク質と複合体を形成する条件、及び複数の複合体が、前記複数の標的タンパク質に結合する前記二次抗体の数に対応して形成される条件下でインキュベートする工程
e.前記ビーズを洗浄して、前記複合体を形成しないあらゆる二次抗体を除去する工程;
f.前記複数の複合体を、前記第2のオリゴヌクレオチド配列の各々を、環状アンプリコンを形成するように前記第1のオリゴヌクレオチド配列の各々にハイブリダイゼーションさせる条件、複数のアンプリコンが前記複数の複合体の数に対応して生成される条件、及び前記複数のアンプリコンの各々が、標的増幅領域又は対照領域由来のポリヌクレオチド、固有のバーコード配列及びその逆相補体、並びにアダプター配列の第1の対を含む条件下でインキュベートする工程;
g.前記複数のアンプリコンを増幅に供する工程;
h.前記ビーズを前記アレイ中にプールし、ハイスループットシーケンシングによって前記複数のアンプリコンを同時に検出する工程;及び
i.前記複数のアンプリコンのカテゴリーを決定する工程を含み;
前記標的増幅領域由来の前記ポリヌクレオチドを含む前記複数のアンプリコンの各々のカテゴリーを決定することが、対応する生物学的試料における感染を示す、方法。 - 前記複数の試料からの前記試料のそれぞれが、前記インキュベーション工程bの前に独自にバーコード化される、請求項36に記載の方法。
- 前記マルチプレックスアレイが、前記第1のオリゴヌクレオチド配列又は前記第2のオリゴヌクレオチド配列、又はそれらの組み合わせ中に少なくとも96個の異なるバーコード配列を含む、請求項37に記載の方法。
- アレイが、前記複数の環状アンプリコン中に少なくとも96個の異なるバーコード配列を含む、請求項37に記載の方法。
- 前記標的タンパク質が抗体又は抗体断片である、請求項36に記載の方法。
- 前記抗体がIgM抗体である、請求項40に記載の方法。
- 前記抗体がIgG抗体である、請求項40に記載の方法。
- 前記抗体又は前記抗体断片が、細菌、RNAウイルス及びDNAウイルスからなる群の抗原に特異的に結合する、請求項40に記載の方法。
- 前記抗体又は前記抗体断片が、アシネトバクター・バウマンニ(Acinetobacter baumannii)、アデノウイルス、アフリカ馬疫ウイルス、アフリカ豚コレラウイルス、ズビニ鉤虫(Anclostoma duodenale)、回虫、黄色アスペルギルス、アスペルギルス・フミガーツス(Aspergillus fumigatus)、アスペルギルス・ニガー(Aspergillus niger)、アスペルギルス・オリゼ(Aspergillus oryzae)、鳥インフルエンザウイルス、炭疽菌、炭疽菌パスツール株、セレウス菌、ウシ流産菌、ブルセラ・メリテンシス(Brucella melitensis)、ブルセラ・スイス(Brucella suis)、鼻疽菌、類鼻疽菌、カンジダ・アルビカンス(Candida albicans)、カンジダ・ドゥブリニエンシス(Candida dubliniensis)、カンジダ・グラブラタ(Candida glabrata)、カンジダ・クルセイ(Candida krusei)、カンジダ・トロピカリス(Candida tropicalis)、クラミジア・ニューモニエ(Chlamydia pneumoneae)、クラミジア・トラコマチス(Chlamydia trachomatous)、豚熱ウイルス、クロストリジウム・ディフィシール(Clostridium difficile)、コクシジオイデス・イミティス(Coccidioides immitis)、コクシジオイデス・ポサダシ(Coccidioides posadasii)、CoV-229E、CoV-HKU1、CoV-NL63、CoV-OC43、コクサッキーウイルスA、コクサッキーウイルスB、コクシエラ・バーネッティ(Coxiella burnetii)、クリミア・コンゴ出血熱、サイトメガロウイルス、デングウイルス、メジナ虫、東部馬脳炎、エボラウイルス、い粒条虫、多包条虫、エンテロバクター・クロアカ、エンテロコッカス・フェシウム(Enterococcus faecium)、エンテロウイルス、エプスタイン・バール・ウイルス、大腸菌、巨大肝蛭、肝蛭、***ウイルス、野兎病菌、山羊痘ウイルス、ヘモフィルス属インフルエンザ、ヘリコバクターピロリ、ヘンドラウイルス、A型肝炎ウイルス、B型肝炎ウイルス、C型肝炎ウイルス、ヒストプラスマ・カプスラーツム(Histoplasma capsulatum)、ズボアジ型ヒストプラスマ症(Histoplasma duboisii)、ヒトヘルペスウイルスHHV6、ヒトヘルペスウイルスHHV7、ヒトヘルペスウイルスHHV8、ヒトヘルペスウイルスHSV1、ヒトヘルペスウイルスHSV2、ヒト免疫不全ウイルス、ヒトパピローマウイルス、インフルエンザウイルスA型、インフルエンザウイルスB型、クレブシェラ肺炎桿菌、キャサヌール森林病ウイルス、ラッサ熱ウイルス、レジオネラ・ニューモフィラ菌、リーシュマニア・プロマスティゴート(Leishmania promastigotes)、Lujoウイルス、ランピースキン病ウイルス、マールブルグウイルス、麻疹ウイルス、メチシリン耐性黄色ブドウ球菌、サル痘ウイルス、ムンプスウイルス、マイコバクテリウム・アブセッサス(Mycobacterium abscessus)、マイコバクテリウム・アビウム(Mycobacterium avium)、マイコバクテリウム・ボビス(Mycobacterium bovis)、マイコバクテリウム・カヌッティイ(Mycobacterium canettii)、マイコバクテリウム・レプレ(Mycobacterium leprae)、ヒト結核菌、マイコバクテリウム・ウルセランス(Mycobacterium ulcerans)、マイコプラズマ・カプリコルム(Mycoplasma capricolum)、マイコプラズマ・ミコイデス(Mycoplasma mycoides)、マイコプラズマ・ニューモニア(Mycoplasma pneumoneae)、アメリカ十二指腸虫、淋病、ニューカッスル病ウイルス、ニパウイルス、ノルカジア属beijingensis、ノルカジア属cyriacigeorgica、ノルカジア属farcinica、ノロウイルスGI、ノロウイルスGII、ノーウォークウイルス、オムスク出血熱ウイルス、回旋糸状虫、発癌性ヒトパピローマウイルス、パラインフルエンザウイルス、寄生生物、マルネッフェイ型ペニシリウム症(Penicilliosis mameffei)、小反芻獣疫ウイルス、ニューモシスチス・イロベチイ(Pneumocystis jirovecii)、ポリオーマウイルス、プロテウス・ミラビリス(Proteus mirabilis)、緑膿菌、狂犬病ウイルス、8つの遺伝子断片すべてのコーディング領域の任意の部分を含有する、1918年のパンデミックインフルエンザウイルスの再構築された複製コンピテント形態、呼吸器合胞体ウイルス、ライノウイルス、発疹チフスリケッチア、リフトバレー熱ウイルス、牛疫ウイルス、ロタウイルスA、ロタウイルスB、ロタウイルスC、ロタウイルスG2、風疹ウイルス、SARS関連コロナウイルス(SARS-CoV)、SARS-CoV-1、SARS-CoV-2、ビルハルツ住血吸虫、日本住血吸虫、マンソン住血吸虫、羊痘ウイルス、南米出血熱ウイルスチャパレ、南米出血熱ウイルスグアナリト、南米出血熱ウイルスフニン、南米出血熱ウイルスマチュポ、南米出血熱ウイルスサビア、黄色ブドウ球菌、スタフィロコッカス・サプロフィティカス(Staphylococcus saprophyticus)、肺炎レンサ球菌、豚水疱病ウイルス、有鉤条虫、ダニ媒介性脳炎複合(flavi)ウイルス極東亜型、ダニ媒介性脳炎複合(flavi)ウイルスシベリア亜型、タバコモザイク病ウイルス、トルクテノウイルス、鞭虫、ブルーストリパノソーマ(Trypanosoma bmcei)、トリパノソーマ・クルージ(Trypanosoma cruzi)、大痘瘡ウイルス(天然痘ウイルス)、小痘瘡ウイルス(アラストリム)、ベネズエラ馬脳炎ウイルス、バンクロフト糸状虫、ペスト菌、及び上記の病原体のいずれか1つと特徴的な核酸配列を共有する病原体からなる群から選択される病原体由来の抗原に特異的に結合する、請求項43に記載の方法。
- 前記抗体又は前記抗体断片が、SAR-CoV-2由来の抗原に特異的に結合する、請求項44に記載の方法。
- 前記抗体又は前記抗体断片が、Sタンパク質、Sタンパク質のRBD、S1タンパク質、S2タンパク質、E遺伝子、S遺伝子、Orflab遺伝子、N末端スパイクタンパク質ドメイン、全タンパク質(S1+S2)、及びNタンパク質からなる群から選択される抗原に特異的に結合する、請求項44に記載の方法。
- 前記試料が、血液、粘液、唾液、汗、涙、体腔に蓄積する流体、尿、***液、膣分泌物、脳脊髄液、リンパ液、糞便、痰、分解液、嘔吐物、汗、母乳、血清及び血漿からなる群から選択される、請求項36~47のいずれか一項に記載の方法。
- 前記試料が血液である、請求項47に記載の方法。
- 前記試料が唾液である、請求項47に記載の方法。
- 核酸試料中の配列変異体を検出するための方法であって、
a.増幅混合物で増幅反応を実行して、複数のアンプリコンを産生する工程であって、前記増幅混合物が、前記核酸試料と、複数のプライマーと、第1の固有のバーコード配列及びその逆相補体と、アダプター配列の第1の対とを含み、前記複数のプライマーの各々が、それらが結合する前記ポリヌクレオチドの各々に相補的なヌクレオチドのセットを含み、前記第1の固有のバーコード配列及びその逆相補体が、特定の対象から得られた前記試料を同定し、前記アダプター配列の対が、前記第1の固有のバーコード配列及びその逆相補体に隣接し、前記複数のアンプリコンの各々が、標的増幅領域又は対照領域由来のポリヌクレオチドを含む、工程;
b.前記複数のアンプリコンを検出、及び場合により定量する工程;
c.前記複数のアンプリコンのカテゴリーを決定する工程;及び
d.工程cからの前記複数のアンプリコンにおいて1つ以上の配列変異体を検出する工程を含み、
前記核酸の試料がRNA分子を含む場合、工程a)は、前記増幅反応を行う前に前記RNAから逆転写されたcDNAを得ること、又は前記RNAからcDNAを逆転写することをさらに含む、方法。 - 工程bにおいて検出することが、前記アダプター配列の第1の対並びに前記第1の固有のバーコード配列及びその逆相補体を含む前記複数のアンプリコンの各々をシーケンシングすることを含む、請求項50に記載の方法。
- 前記アダプター配列の第1の対が、前記第1の固有のバーコード配列及びその逆相補体を第2の固有のバーコード配列及びその逆相補体から分離する、請求項50に記載の方法。
- 工程bにおいて検出することが、前記アダプター配列の第1の対、前記第1の固有のバーコード配列及びその逆相補体、前記第2の固有のバーコード配列及びその逆相補体を含む前記複数のアンプリコンの各々をシーケンシングすることを含む、請求項52に記載の方法。
- 工程bにおいて検出することが、アダプター配列の第2の対をシーケンシングすることをさらに含む、請求項52に記載の方法。
- 前記工程bにおいて検出することが、一連のプログラムを用いてシーケンシングデータファイルを読み取ることによって行われる、請求項50~54のいずれか一項に記載の方法。
- 前記シーケンシングデータファイルがFASTA/FASTQフォーマットである、請求項55に記載の方法。
- 前記一連のプログラムが、HMMER/Infernalアラインメントエンジンを含む、請求項55に記載の方法。
- 工程dにおける前記検出することが、1つ以上の参照配列との多重配列アラインメントを行うことを含む、請求項50~54のいずれか一項に記載の方法。
- 前記配列アラインメントが、HMMプロファイル隠れマルコフモデル(HMM)エンジン、共分散モデル(CM)エンジン又はそれらの組み合わせによって行われる、請求項58に記載の方法。
- 前記配列変異体を感染の診断又は予後と相関させることをさらに含む、請求項50に記載の方法。
- 前記感染が、RNAウイルス、DNAウイルス、真菌、寄生生物及び細菌からなる群から選択される1つ又は複数の病原体によって引き起こされる、請求項60に記載の方法。
- 前記病原体が、アシネトバクター・バウマンニ(Acinetobacter baumannii)、アデノウイルス、アフリカ馬疫ウイルス、アフリカ豚コレラウイルス、ズビニ鉤虫(Anclostoma duodenale)、回虫、黄色アスペルギルス、アスペルギルス・フミガーツス(Aspergillus fumigatus)、アスペルギルス・ニガー(Aspergillus niger)、アスペルギルス・オリゼ(Aspergillus oryzae)、鳥インフルエンザウイルス、炭疽菌、炭疽菌パスツール株、セレウス菌、ウシ流産菌、ブルセラ・メリテンシス(Brucella melitensis)、ブルセラ・スイス(Brucella suis)、鼻疽菌、類鼻疽菌、カンジダ・アルビカンス(Candida albicans)、カンジダ・ドゥブリニエンシス(Candida dubliniensis)、カンジダ・グラブラタ(Candida glabrata)、カンジダ・クルセイ(Candida krusei)、カンジダ・トロピカリス(Candida tropicalis)、クラミジア・ニューモニエ(Chlamydia pneumoneae)、クラミジア・トラコマチス(Chlamydia trachomatous)、豚熱ウイルス、クロストリジウム・ディフィシール(Clostridium difficile)、コクシジオイデス・イミティス(Coccidioides immitis)、コクシジオイデス・ポサダシ(Coccidioides posadasii)、CoV-229E、CoV-HKU1、CoV-NL63、CoV-OC43、コクサッキーウイルスA、コクサッキーウイルスB、コクシエラ・バーネッティ(Coxiella burnetii)、クリミア・コンゴ出血熱、サイトメガロウイルス、デングウイルス、メジナ虫、東部馬脳炎、エボラウイルス、い粒条虫、多包条虫、エンテロバクター・クロアカ、エンテロコッカス・フェシウム(Enterococcus faecium)、エンテロウイルス、エプスタイン・バール・ウイルス、大腸菌、巨大肝蛭、肝蛭、***ウイルス、野兎病菌、山羊痘ウイルス、ヘモフィルス属インフルエンザ、ヘリコバクターピロリ、ヘンドラウイルス、A型肝炎ウイルス、B型肝炎ウイルス、C型肝炎ウイルス、ヒストプラスマ・カプスラーツム(Histoplasma capsulatum)、ズボアジ型ヒストプラスマ症(Histoplasma duboisii)、ヒトヘルペスウイルスHHV6、ヒトヘルペスウイルスHHV7、ヒトヘルペスウイルスHHV8、ヒトヘルペスウイルスHSV1、ヒトヘルペスウイルスHSV2、ヒト免疫不全ウイルス、ヒトパピローマウイルス、インフルエンザウイルスA型、インフルエンザウイルスB型、クレブシェラ肺炎桿菌、キャサヌール森林病ウイルス、ラッサ熱ウイルス、レジオネラ・ニューモフィラ菌、リーシュマニア・プロマスティゴート(Leishmania promastigotes)、Lujoウイルス、ランピースキン病ウイルス、マールブルグウイルス、麻疹ウイルス、メチシリン耐性黄色ブドウ球菌、サル痘ウイルス、ムンプスウイルス、マイコバクテリウム・アブセッサス(Mycobacterium abscessus)、マイコバクテリウム・アビウム(Mycobacterium avium)、マイコバクテリウム・ボビス(Mycobacterium bovis)、マイコバクテリウム・カヌッティイ(Mycobacterium canettii)、マイコバクテリウム・レプレ(Mycobacterium leprae)、ヒト結核菌、マイコバクテリウム・ウルセランス(Mycobacterium ulcerans)、マイコプラズマ・カプリコルム(Mycoplasma capricolum)、マイコプラズマ・ミコイデス(Mycoplasma mycoides)、マイコプラズマ・ニューモニア(Mycoplasma pneumoneae)、アメリカ十二指腸虫、淋病、ニューカッスル病ウイルス、ニパウイルス、ノルカジア属beijingensis、ノルカジア属cyriacigeorgica、ノルカジア属farcinica、ノロウイルスGI、ノロウイルスGII、ノーウォークウイルス、オムスク出血熱ウイルス、回旋糸状虫、発癌性ヒトパピローマウイルス、パラインフルエンザウイルス、寄生生物、マルネッフェイ型ペニシリウム症(Penicilliosis mameffei)、小反芻獣疫ウイルス、ニューモシスチス・イロベチイ(Pneumocystis jirovecii)、ポリオーマウイルス、プロテウス・ミラビリス(Proteus mirabilis)、緑膿菌、狂犬病ウイルス、8つの遺伝子断片すべてのコーディング領域の任意の部分を含有する、1918年のパンデミックインフルエンザウイルスの再構築された複製コンピテント形態、呼吸器合胞体ウイルス、ライノウイルス、発疹チフスリケッチア、リフトバレー熱ウイルス、牛疫ウイルス、ロタウイルスA、ロタウイルスB、ロタウイルスC、ロタウイルスG2、風疹ウイルス、SARS関連コロナウイルス(SARS-CoV)、SARS-CoV-1、SARS-CoV-2、ビルハルツ住血吸虫、日本住血吸虫、マンソン住血吸虫、羊痘ウイルス、南米出血熱ウイルスチャパレ、南米出血熱ウイルスグアナリト、南米出血熱ウイルスフニン、南米出血熱ウイルスマチュポ、南米出血熱ウイルスサビア、黄色ブドウ球菌、スタフィロコッカス・サプロフィティカス(Staphylococcus saprophyticus)、肺炎レンサ球菌、豚水疱病ウイルス、有鉤条虫、ダニ媒介性脳炎複合(flavi)ウイルス極東亜型、ダニ媒介性脳炎複合(flavi)ウイルスシベリア亜型、タバコモザイク病ウイルス、トルクテノウイルス、鞭虫、ブルーストリパノソーマ(Trypanosoma bmcei)、トリパノソーマ・クルージ(Trypanosoma cruzi)、大痘瘡ウイルス(天然痘ウイルス)、小痘瘡ウイルス(アラストリム)、ベネズエラ馬脳炎ウイルス、バンクロフト糸状虫、ペスト菌、及び上記の病原体のいずれか1つと特徴的な核酸配列を共有する病原体からなる群から選択される、請求項61に記載の方法。
- 病原体がSAR-CoV-2である、請求項62に記載の方法。
- 前記配列変異体が、Sタンパク質、Sタンパク質のRBD、S1タンパク質、S2タンパク質、E遺伝子、S遺伝子、Orflab遺伝子、N末端スパイクタンパク質ドメイン、全タンパク質(S1+S2)、及びNタンパク質からなる群から選択される抗原をエンコードする領域にある、請求項63に記載の方法。
- 前記配列変異体が、T95I、D253G、L452R、E484K、S477N、N501Y D614G及びA701Vからなる群より選択される変異を含む、請求項64に記載の方法。
- 前記複数のアンプリコンを検出することが、
a.前記複数のアンプリコンのプールされた配列データセットを得る工程であって、各アンプリコン上の各固有のバーコード配列及びその逆相補体が単一の試料に固有であり、第1の単一試料からの各アンプリコンの前記固有のバーコード配列及びその逆相補体が、前記複数のアンプリコン中の他のアンプリコンの前記固有のバーコード配列及びそれらの逆相補体とは異なる、工程;
b.ベースコールを実行する工程;
c.前記複数のアンプリコンの配列データを、予め定義されたアノテーション付きHMM又はCM遺伝子モデルにアラインメントする工程;
d.前記HMM/CMアラインメントの各々にランクを割り当てる工程であって、前記ランクが確率スコア又はビットスコアである、工程;
e.前記配列データをフィルタリングして、各アンプリコン内の前記バーコード並びに前記アンプリコンの配列内の前記バーコード及び前記アダプターの位置を示す、位置的にアノテーションされた配列アラインメントを得る工程;及び
f.適切にプログラムされたコンピュータを使用して少なくとも工程b、c、d、及びeを実行する工程を含む、請求項1、36又は50のいずれか一項に記載の方法。 - 前記ベースコールが、高精度ONT GPUに基づくベースコーラーで実行される、請求項66に記載の方法。
- 前記ベースコールが生のFASTA/FASTQファイルをもたらす、請求項66に記載の方法。
- 前記アラインメントが、プロファイルHMMエンジン、CMエンジン、又はそれらの組み合わせによって実行される、請求項66に記載の方法。
- 前記HMMエンジン、前記CMエンジン又はこれらの組み合わせが、前記バーコード、前記標的増幅領域、前記プライマー、及び前記アダプターからなる群から選択される1つ又は複数の配列特徴についてヌクレオチドごとのアノテーションを割り当てる、請求項69に記載の方法。
- 前記HMMエンジンが、複数の配列アラインメントをもたらすHMMERソフトウェアプログラムを含む、請求項69に記載の方法。
- 前記複数の配列アラインメントが、前記第1の固有のバーコード配列及びその逆相補体のためのアノテーションを含む、請求項71に記載の方法。
- 前記フィルタリングが、前記第1の固有のバーコード配列及びその逆相補体を有する前記配列アラインメントに合格スコア又は不合格スコアを割り当てることを含み、前記第1の固有のバーコード配列及びその逆相補体を有する前記複数の配列アラインメントには、それらが参照バーコード化配列のセットに対する最小レーベンシュタイン距離スコアを合格する場合、及びそれらがアラインメントについての最小ビットスコア閾値を合格する場合、合格スコアが割り当てられる、請求項72に記載の方法。
- 前記複数の配列アラインメントが、ヌクレオチドごとに二重バーコードについてのアノテーションを含み、前記二重バーコードが、第1の固有のバーコード配列及びその逆相補体と、第2の固有のバーコード配列及びその逆相補体とを含む、請求項71に記載の方法。
- 前記HMMERソフトウェアプログラムが、前記アダプター配列の第1の対についてのアノテーションを有する配列アラインメントをもたらす、請求項71に記載の方法。
- 前記フィルタリングが、前記二重バーコードを有する前記配列アラインメントに合格スコア又は不合格スコアを割り当てることを含み、前記二重バーコードを有する前記複数の配列アラインメントには、それらが参照バーコード化配列のセットに対する最小レーベンシュタイン距離スコアを合格する場合、及びそれらがアラインメントについての最小ビットスコア閾値を合格する場合、合格スコアが割り当てられる、請求項74に記載の方法。
- 前記合格スコアを有する前記配列アラインメントが中央データベースに記憶される、請求項73又は76のいずれか一項に記載の方法。
- 前記合格スコアを有する前記配列アラインメントが、前記試料中の病原体負荷の直接的な定量的表示に対応する、請求項77に記載の方法。
- 前記データベースが、
試料コレクションチューブに割り当てられた固有のバーコードの情報;
各固有のバーコードが各試料に割り当てられている、少なくとも96個の固有のウェルバーコードのセットの情報;
各固有のバーコードが固有のプレートに割り当てられている、少なくとも96個の固有のプレートバーコードのセットの情報;
前記複数のアンプリコンからのシーケンシングデータを含む配列データのセットの情報;及び
各試料のソース識別情報、及び前記試料が前記標的タンパク質の存在について陽性であるか陰性であるかに関する情報を含むレポートを含む、請求項77に記載の方法。 - 前記レポートを対応する対象、又は診療所又は医師に提供することをさらに含み、前記試料が対象から得られる、請求項79に記載の方法。
- アンプリコンを含む組成物であって、前記アンプリコンが、第1の固有のバーコード配列及びその逆相補体、標的特異的プライマーの対、標的増幅領域及びアダプター配列の第1の対を含み、前記標的特異的プライマーの対がフォワードプライマー及びリバースプライマーで構成され、それぞれが前記標的増幅領域内の前記プライミング部位に相補的な配列を有し、前記フォワードプライマー及び前記リバースプライマーのそれぞれが前記標的増幅領域に隣接し、前記標的特異的プライマーが前記第1の固有のバーコード配列及びその逆相補体に隣接し、前記第1の固有のバーコード配列及びその逆相補体が前記アダプター配列の第1の対に隣接する、組成物。
- 第2の固有のバーコード配列及びその逆相補体並びにアダプター配列の第2の対をさらに含み、前記第2の固有のバーコード配列及びその逆相補体並びに前記アダプター配列の第2の対が、前記アンプリコンにライゲーションされている、請求項81に記載の組成物。
- アダプター配列の第1の対が前記アダプター配列の第2の対に隣接し、前記アダプター配列の第2の対が前記第2の固有のバーコード配列及びその逆相補体に隣接する、請求項82に記載の組成物。
- 前記標的増幅領域が、遺伝子又はタンパク質についてエンコードする病原体のゲノム領域から増幅され、前記病原体が、アシネトバクター・バウマンニ(Acinetobacter baumannii)、アデノウイルス、アフリカ馬疫ウイルス、アフリカ豚コレラウイルス、ズビニ鉤虫(Anclostoma duodenale)、回虫、黄色アスペルギルス、アスペルギルス・フミガーツス(Aspergillus fumigatus)、アスペルギルス・ニガー(Aspergillus niger)、アスペルギルス・オリゼ(Aspergillus oryzae)、鳥インフルエンザウイルス、炭疽菌、炭疽菌パスツール株、セレウス菌、ウシ流産菌、ブルセラ・メリテンシス(Brucella melitensis)、ブルセラ・スイス(Brucella suis)、鼻疽菌、類鼻疽菌、カンジダ・アルビカンス(Candida albicans)、カンジダ・ドゥブリニエンシス(Candida dubliniensis)、カンジダ・グラブラタ(Candida glabrata)、カンジダ・クルセイ(Candida krusei)、カンジダ・トロピカリス(Candida tropicalis)、クラミジア・ニューモニエ(Chlamydia pneumoneae)、クラミジア・トラコマチス(Chlamydia trachomatous)、豚熱ウイルス、クロストリジウム・ディフィシール(Clostridium difficile)、コクシジオイデス・イミティス(Coccidioides immitis)、コクシジオイデス・ポサダシ(Coccidioides posadasii)、CoV-229E、CoV-HKU1、CoV-NL63、CoV-OC43、コクサッキーウイルスA、コクサッキーウイルスB、コクシエラ・バーネッティ(Coxiella burnetii)、クリミア・コンゴ出血熱、サイトメガロウイルス、デングウイルス、メジナ虫、東部馬脳炎、エボラウイルス、い粒条虫、多包条虫、エンテロバクター・クロアカ、エンテロコッカス・フェシウム(Enterococcus faecium)、エンテロウイルス、エプスタイン・バール・ウイルス、大腸菌、巨大肝蛭、肝蛭、***ウイルス、野兎病菌、山羊痘ウイルス、ヘモフィルス属インフルエンザ、ヘリコバクターピロリ、ヘンドラウイルス、A型肝炎ウイルス、B型肝炎ウイルス、C型肝炎ウイルス、ヒストプラスマ・カプスラーツム(Histoplasma capsulatum)、ズボアジ型ヒストプラスマ症(Histoplasma duboisii)、ヒトヘルペスウイルスHHV6、ヒトヘルペスウイルスHHV7、ヒトヘルペスウイルスHHV8、ヒトヘルペスウイルスHSV1、ヒトヘルペスウイルスHSV2、ヒト免疫不全ウイルス、ヒトパピローマウイルス、インフルエンザウイルスA型、インフルエンザウイルスB型、クレブシェラ肺炎桿菌、キャサヌール森林病ウイルス、ラッサ熱ウイルス、レジオネラ・ニューモフィラ菌、リーシュマニア・プロマスティゴート(Leishmania promastigotes)、Lujoウイルス、ランピースキン病ウイルス、マールブルグウイルス、麻疹ウイルス、メチシリン耐性黄色ブドウ球菌、サル痘ウイルス、ムンプスウイルス、マイコバクテリウム・アブセッサス(Mycobacterium abscessus)、マイコバクテリウム・アビウム(Mycobacterium avium)、マイコバクテリウム・ボビス(Mycobacterium bovis)、マイコバクテリウム・カヌッティイ(Mycobacterium canettii)、マイコバクテリウム・レプレ(Mycobacterium leprae)、ヒト結核菌、マイコバクテリウム・ウルセランス(Mycobacterium ulcerans)、マイコプラズマ・カプリコルム(Mycoplasma capricolum)、マイコプラズマ・ミコイデス(Mycoplasma mycoides)、マイコプラズマ・ニューモニア(Mycoplasma pneumoneae)、アメリカ十二指腸虫、淋病、ニューカッスル病ウイルス、ニパウイルス、ノルカジア属beijingensis、ノルカジア属cyriacigeorgica、ノルカジア属farcinica、ノロウイルスGI、ノロウイルスGII、ノーウォークウイルス、オムスク出血熱ウイルス、回旋糸状虫、発癌性ヒトパピローマウイルス、パラインフルエンザウイルス、寄生生物、マルネッフェイ型ペニシリウム症(Penicilliosis mameffei)、小反芻獣疫ウイルス、ニューモシスチス・イロベチイ(Pneumocystis jirovecii)、ポリオーマウイルス、プロテウス・ミラビリス(Proteus mirabilis)、緑膿菌、狂犬病ウイルス、8つの遺伝子断片すべてのコーディング領域の任意の部分を含有する、1918年のパンデミックインフルエンザウイルスの再構築された複製コンピテント形態、呼吸器合胞体ウイルス、ライノウイルス、発疹チフスリケッチア、リフトバレー熱ウイルス、牛疫ウイルス、ロタウイルスA、ロタウイルスB、ロタウイルスC、ロタウイルスG2、風疹ウイルス、SARS関連コロナウイルス(SARS-CoV)、SARS-CoV-1、SARS-CoV-2、ビルハルツ住血吸虫、日本住血吸虫、マンソン住血吸虫、羊痘ウイルス、南米出血熱ウイルスチャパレ、南米出血熱ウイルスグアナリト、南米出血熱ウイルスフニン、南米出血熱ウイルスマチュポ、南米出血熱ウイルスサビア、黄色ブドウ球菌、スタフィロコッカス・サプロフィティカス(Staphylococcus saprophyticus)、肺炎レンサ球菌、豚水疱病ウイルス、有鉤条虫、ダニ媒介性脳炎複合(flavi)ウイルス極東亜型、ダニ媒介性脳炎複合(flavi)ウイルスシベリア亜型、タバコモザイク病ウイルス、トルクテノウイルス、鞭虫、ブルーストリパノソーマ(Trypanosoma brucei)、トリパノソーマ・クルージ(Trypanosoma cruzi)、大痘瘡ウイルス(天然痘ウイルス)、小痘瘡ウイルス(アラストリム)、ベネズエラ馬脳炎ウイルス、バンクロフト糸状虫、ペスト菌、及び上記の病原体のいずれか1つと特徴的な核酸配列を共有する病原体からなる群から選択される、請求項81~83のいずれか一項に記載の組成物。
- 前記病原体がSARS-CoV-2である、請求項84に記載の組成物。
- 前記標的増幅領域が、Sタンパク質、Sタンパク質のRBD、S1タンパク質、S2タンパク質、E遺伝子、S遺伝子、Orflab遺伝子、N末端スパイクタンパク質ドメイン、全タンパク質(S1+S2)、及びNタンパク質からなる群から選択されるタンパク質についてエンコードするゲノム領域から増幅される、請求項85に記載の組成物。
- 前記標的増幅領域が、前記Sタンパク質をエンコードする領域から増幅される、請求項86に記載の組成物。
- 前記標的増幅領域が、前記Sタンパク質の前記RBDをエンコードする領域から増幅される、請求項86に記載の組成物。
- 前記標的増幅領域が、前記Nタンパク質をエンコードする領域から増幅される、請求項86に記載の組成物。
- 前記固有のバーコード配列及びそれらの逆相補体が、他のすべてのバーコードからの最大レーベンシュタイン距離を有する、請求項81~89のいずれか一項に記載の組成物。
- 前記固有のバーコード配列が、配列番号23-118に示される前記ポリヌクレオチド配列のいずれか1つを含む、請求項90に記載の組成物。
- 前記標的特異的プライマーの対が、
フォワードプライマー:GACCCCAAAATCAGCGAAAT(配列番号3)及びリバースプライマー:TCTGGTTACTGCCAGTTGAATCTG(配列番号4);
フォワードプライマー:TTACAAACATTGGCCGCAAA(配列番号5)及びリバースプライマー:GCGCGACATTCCGAAGAA(配列番号6);
フォワードプライマー:GGGAGCCTTGAATACACCAAAA(配列番号7)及びリバースプライマー:TGTAGCACGATTGCAGCATTG(配列番号8);
フォワードプライマー:GTGARATGGTCATGTGTGGCGG(配列番号9)及びリバースプライマー:CARATGTTAAASACACTATTAGCATA(配列番号10);
フォワードプライマー:ACAGGTACGTTAATAGTTAATAGCGT(配列番号11)及びリバースプライマー:ATATTGCAGCAGTACGCACACA(配列番号12);
フォワードプライマー:CCCTGTGGGTTTTACACTTAA(配列番号13)及びリバースプライマー:ACGATTGTGCATCAGCTGA(配列番号14);
フォワードプライマー:GTACTCATTCGTTTCGGAAGAG(配列番号15)及びリバースプライマー:CCAGAAGATCAGGAACTCTAGA(配列番号16);
フォワードプライマー:GGGGAACTTCTCCTGCTAGAAT(配列番号17)及びリバースプライマー:CAGACATTTTGCTCTCAAGCTG(配列番号18);並びに
フォワードプライマー:AGATTTGGACCTGCGAGCG(配列番号19)及びリバースプライマー:GAGCGGCTGTCTCCACAAGT(配列番号20)からなるフォワードプライマー及びリバースプライマーの群から選択される、請求項85~89のいずれか一項に記載の組成物。 - 前記アダプター配列の第1の対及び前記アダプター配列の第2の対が同一であり、10~15ヌクレオチドを含む、請求項81~83のいずれか一項に記載の組成物。
- 前記アダプター配列の対が10ヌクレオチドを含む、請求項93に記載の組成物。
- 前記アダプター配列の対が、ACACTGACGACATGGTTCTACA(配列番号21)及びTACGGTAGCAGAGACTTGGTCT(配列番号22)に示すポリヌクレオチド配列を含む、請求項94に記載の組成物。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202062994173P | 2020-03-24 | 2020-03-24 | |
US62/994,173 | 2020-03-24 | ||
PCT/IB2021/052463 WO2021191829A1 (en) | 2020-03-24 | 2021-03-24 | Assays for detecting pathogens |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023519919A true JP2023519919A (ja) | 2023-05-15 |
Family
ID=77890210
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022558526A Pending JP2023519919A (ja) | 2020-03-24 | 2021-03-24 | 病原体を検出するためのアッセイ |
Country Status (5)
Country | Link |
---|---|
US (1) | US20240240267A1 (ja) |
EP (1) | EP4127233A1 (ja) |
JP (1) | JP2023519919A (ja) |
CA (1) | CA3173190A1 (ja) |
WO (1) | WO2021191829A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230183823A1 (en) * | 2020-04-30 | 2023-06-15 | The Trustees Of Indiana University | Methods to detect a virus in a biological sample |
CN114351261B (zh) * | 2022-02-28 | 2023-12-15 | 江苏先声医学诊断有限公司 | 基于纳米孔测序平台的呼吸道样本难检病原微生物的检测方法 |
CN117447601B (zh) * | 2023-12-22 | 2024-03-08 | 北京索莱宝科技有限公司 | 猪IgM的抗体、抗体组合物及其应用 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040157220A1 (en) * | 2003-02-10 | 2004-08-12 | Purnima Kurnool | Methods and apparatus for sample tracking |
CA2867293C (en) * | 2012-03-13 | 2020-09-01 | Abhijit Ajit PATEL | Measurement of nucleic acid variants using highly-multiplexed error-suppressed deep sequencing |
WO2013188471A2 (en) * | 2012-06-11 | 2013-12-19 | Sequenta, Inc. | Method of sequence determination using sequence tags |
US10691775B2 (en) * | 2013-01-17 | 2020-06-23 | Edico Genome, Corp. | Bioinformatics systems, apparatuses, and methods executed on an integrated circuit processing platform |
US10233490B2 (en) * | 2014-11-21 | 2019-03-19 | Metabiotech Corporation | Methods for assembling and reading nucleic acid sequences from mixed populations |
NZ759895A (en) * | 2017-06-07 | 2023-05-26 | Illumina Inc | Single cell whole genome libraries for methylation sequencing |
-
2021
- 2021-03-24 EP EP21775520.6A patent/EP4127233A1/en active Pending
- 2021-03-24 JP JP2022558526A patent/JP2023519919A/ja active Pending
- 2021-03-24 US US17/907,083 patent/US20240240267A1/en active Pending
- 2021-03-24 CA CA3173190A patent/CA3173190A1/en active Pending
- 2021-03-24 WO PCT/IB2021/052463 patent/WO2021191829A1/en unknown
Also Published As
Publication number | Publication date |
---|---|
US20240240267A1 (en) | 2024-07-18 |
WO2021191829A1 (en) | 2021-09-30 |
CA3173190A1 (en) | 2021-09-30 |
EP4127233A1 (en) | 2023-02-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11866777B2 (en) | Error suppression in sequenced DNA fragments using redundant reads with unique molecular indices (UMIS) | |
US11898198B2 (en) | Universal short adapters with variable length non-random unique molecular identifiers | |
JP2022088566A (ja) | 不均一分子長を有するユニーク分子インデックスセットの生成およびエラー補正のための方法およびシステム | |
US20130261196A1 (en) | Nucleic Acids For Multiplex Organism Detection and Methods Of Use And Making The Same | |
JP2023519919A (ja) | 病原体を検出するためのアッセイ | |
JP6265891B2 (ja) | ヌクレオチド配列データの提供 | |
US20080228406A1 (en) | System and method for fungal identification | |
WO2021250617A1 (en) | A rapid multiplex rpa based nanopore sequencing method for real-time detection and sequencing of multiple viral pathogens | |
US20220356535A1 (en) | Pathogen diagnostic test | |
US20200208140A1 (en) | Methods of making and using tandem, twin barcode molecules | |
KR20220021674A (ko) | 중증열성혈소판감소증후군 바이러스 검출용 프라이머 세트 및 이를 이용한 진단용 키트 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221206 |