CN117551746A - 一种检测目标核酸及其邻近区域核酸序列的方法 - Google Patents
一种检测目标核酸及其邻近区域核酸序列的方法 Download PDFInfo
- Publication number
- CN117551746A CN117551746A CN202311635240.4A CN202311635240A CN117551746A CN 117551746 A CN117551746 A CN 117551746A CN 202311635240 A CN202311635240 A CN 202311635240A CN 117551746 A CN117551746 A CN 117551746A
- Authority
- CN
- China
- Prior art keywords
- sequencing
- target gene
- virus
- sequence
- cas9
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 150000007523 nucleic acids Chemical class 0.000 title claims abstract description 20
- 238000000034 method Methods 0.000 title claims abstract description 17
- 102000039446 nucleic acids Human genes 0.000 title claims abstract description 14
- 108020004707 nucleic acids Proteins 0.000 title claims abstract description 14
- 108091028043 Nucleic acid sequence Proteins 0.000 title abstract description 6
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 121
- 238000012163 sequencing technique Methods 0.000 claims abstract description 74
- 238000007672 fourth generation sequencing Methods 0.000 claims abstract description 24
- 238000001514 detection method Methods 0.000 claims abstract description 16
- 238000011144 upstream manufacturing Methods 0.000 claims abstract description 7
- 238000012300 Sequence Analysis Methods 0.000 claims abstract description 3
- 239000003153 chemical reaction reagent Substances 0.000 claims description 33
- 229940079593 drug Drugs 0.000 claims description 33
- 239000003814 drug Substances 0.000 claims description 33
- 108020004414 DNA Proteins 0.000 claims description 25
- 238000005516 engineering process Methods 0.000 claims description 23
- 239000000203 mixture Substances 0.000 claims description 23
- 241000894006 Bacteria Species 0.000 claims description 21
- 102000004169 proteins and genes Human genes 0.000 claims description 20
- 241000894007 species Species 0.000 claims description 20
- 108091033409 CRISPR Proteins 0.000 claims description 17
- 108091027544 Subgenomic mRNA Proteins 0.000 claims description 15
- 241000700605 Viruses Species 0.000 claims description 15
- 206010059866 Drug resistance Diseases 0.000 claims description 14
- 238000003776 cleavage reaction Methods 0.000 claims description 11
- 230000007017 scission Effects 0.000 claims description 11
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 11
- 238000000746 purification Methods 0.000 claims description 10
- 241000589517 Pseudomonas aeruginosa Species 0.000 claims description 8
- 230000000694 effects Effects 0.000 claims description 8
- 241000588626 Acinetobacter baumannii Species 0.000 claims description 7
- 241000588724 Escherichia coli Species 0.000 claims description 7
- 241000282414 Homo sapiens Species 0.000 claims description 7
- 241000588747 Klebsiella pneumoniae Species 0.000 claims description 7
- 241000606161 Chlamydia Species 0.000 claims description 6
- 241000204031 Mycoplasma Species 0.000 claims description 6
- 241000700584 Simplexvirus Species 0.000 claims description 6
- 244000061456 Solanum tuberosum Species 0.000 claims description 6
- 235000002595 Solanum tuberosum Nutrition 0.000 claims description 6
- 241000589970 Spirochaetales Species 0.000 claims description 6
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 claims description 6
- 210000001124 body fluid Anatomy 0.000 claims description 6
- 239000010839 body fluid Substances 0.000 claims description 6
- 238000007671 third-generation sequencing Methods 0.000 claims description 6
- 241000206602 Eukaryota Species 0.000 claims description 5
- 241001465754 Metazoa Species 0.000 claims description 5
- 241000191940 Staphylococcus Species 0.000 claims description 4
- 210000004027 cell Anatomy 0.000 claims description 4
- 230000030609 dephosphorylation Effects 0.000 claims description 4
- 238000006209 dephosphorylation reaction Methods 0.000 claims description 4
- 241000589291 Acinetobacter Species 0.000 claims description 3
- 241000186361 Actinobacteria <class> Species 0.000 claims description 3
- 241000589158 Agrobacterium Species 0.000 claims description 3
- 241000219194 Arabidopsis Species 0.000 claims description 3
- 241000203069 Archaea Species 0.000 claims description 3
- 241000193830 Bacillus <bacterium> Species 0.000 claims description 3
- 241000589968 Borrelia Species 0.000 claims description 3
- 241000283690 Bos taurus Species 0.000 claims description 3
- 241000282693 Cercopithecidae Species 0.000 claims description 3
- 241000193403 Clostridium Species 0.000 claims description 3
- 244000205754 Colocasia esculenta Species 0.000 claims description 3
- 235000006481 Colocasia esculenta Nutrition 0.000 claims description 3
- 240000004270 Colocasia esculenta var. antiquorum Species 0.000 claims description 3
- 241000711573 Coronaviridae Species 0.000 claims description 3
- 241000192700 Cyanobacteria Species 0.000 claims description 3
- 241000701022 Cytomegalovirus Species 0.000 claims description 3
- 235000002723 Dioscorea alata Nutrition 0.000 claims description 3
- 235000007056 Dioscorea composita Nutrition 0.000 claims description 3
- 235000009723 Dioscorea convolvulacea Nutrition 0.000 claims description 3
- 235000005362 Dioscorea floribunda Nutrition 0.000 claims description 3
- 235000004868 Dioscorea macrostachya Nutrition 0.000 claims description 3
- 235000005361 Dioscorea nummularia Nutrition 0.000 claims description 3
- 235000005360 Dioscorea spiculiflora Nutrition 0.000 claims description 3
- 241000257465 Echinoidea Species 0.000 claims description 3
- 241000283073 Equus caballus Species 0.000 claims description 3
- 241000588698 Erwinia Species 0.000 claims description 3
- 241000588722 Escherichia Species 0.000 claims description 3
- 241000192125 Firmicutes Species 0.000 claims description 3
- 241000287828 Gallus gallus Species 0.000 claims description 3
- 241000589989 Helicobacter Species 0.000 claims description 3
- 240000005979 Hordeum vulgare Species 0.000 claims description 3
- 235000007340 Hordeum vulgare Nutrition 0.000 claims description 3
- 244000017020 Ipomoea batatas Species 0.000 claims description 3
- 235000002678 Ipomoea batatas Nutrition 0.000 claims description 3
- 235000006350 Ipomoea batatas var. batatas Nutrition 0.000 claims description 3
- 241000588748 Klebsiella Species 0.000 claims description 3
- 241000589248 Legionella Species 0.000 claims description 3
- 208000007764 Legionnaires' Disease Diseases 0.000 claims description 3
- 208000016604 Lyme disease Diseases 0.000 claims description 3
- 240000003183 Manihot esculenta Species 0.000 claims description 3
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 claims description 3
- 241000711386 Mumps virus Species 0.000 claims description 3
- 241000699666 Mus <mouse, genus> Species 0.000 claims description 3
- 241000186359 Mycobacterium Species 0.000 claims description 3
- 241000588653 Neisseria Species 0.000 claims description 3
- 241000150452 Orthohantavirus Species 0.000 claims description 3
- 240000007594 Oryza sativa Species 0.000 claims description 3
- 235000007164 Oryza sativa Nutrition 0.000 claims description 3
- 241001494479 Pecora Species 0.000 claims description 3
- 241000589516 Pseudomonas Species 0.000 claims description 3
- 241000725643 Respiratory syncytial virus Species 0.000 claims description 3
- 241000589180 Rhizobium Species 0.000 claims description 3
- 241000606701 Rickettsia Species 0.000 claims description 3
- 241000711897 Rinderpest morbillivirus Species 0.000 claims description 3
- 241000607142 Salmonella Species 0.000 claims description 3
- 241000607720 Serratia Species 0.000 claims description 3
- 241000352057 Solanum vernei Species 0.000 claims description 3
- 235000004976 Solanum vernei Nutrition 0.000 claims description 3
- 240000006394 Sorghum bicolor Species 0.000 claims description 3
- 235000011684 Sorghum saccharatum Nutrition 0.000 claims description 3
- 241000194017 Streptococcus Species 0.000 claims description 3
- 241000187747 Streptomyces Species 0.000 claims description 3
- 241000282898 Sus scrofa Species 0.000 claims description 3
- 235000021307 Triticum Nutrition 0.000 claims description 3
- 240000008042 Zea mays Species 0.000 claims description 3
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 claims description 3
- 235000002017 Zea mays subsp mays Nutrition 0.000 claims description 3
- 239000003795 chemical substances by application Substances 0.000 claims description 3
- 235000005822 corn Nutrition 0.000 claims description 3
- 235000004879 dioscorea Nutrition 0.000 claims description 3
- 230000007613 environmental effect Effects 0.000 claims description 3
- 239000012530 fluid Substances 0.000 claims description 3
- 208000006454 hepatitis Diseases 0.000 claims description 3
- 231100000283 hepatitis Toxicity 0.000 claims description 3
- 210000002381 plasma Anatomy 0.000 claims description 3
- 238000002360 preparation method Methods 0.000 claims description 3
- 235000009566 rice Nutrition 0.000 claims description 3
- 210000002966 serum Anatomy 0.000 claims description 3
- 241000701161 unidentified adenovirus Species 0.000 claims description 3
- 241000712461 unidentified influenza virus Species 0.000 claims description 3
- 206010036790 Productive cough Diseases 0.000 claims description 2
- 239000003570 air Substances 0.000 claims description 2
- 210000004381 amniotic fluid Anatomy 0.000 claims description 2
- 210000004369 blood Anatomy 0.000 claims description 2
- 239000008280 blood Substances 0.000 claims description 2
- 210000000481 breast Anatomy 0.000 claims description 2
- 210000001175 cerebrospinal fluid Anatomy 0.000 claims description 2
- 210000002751 lymph Anatomy 0.000 claims description 2
- 210000004910 pleural fluid Anatomy 0.000 claims description 2
- 210000003296 saliva Anatomy 0.000 claims description 2
- 210000000582 semen Anatomy 0.000 claims description 2
- 239000010865 sewage Substances 0.000 claims description 2
- 239000002689 soil Substances 0.000 claims description 2
- 210000003802 sputum Anatomy 0.000 claims description 2
- 208000024794 sputum Diseases 0.000 claims description 2
- 210000001138 tear Anatomy 0.000 claims description 2
- 210000001519 tissue Anatomy 0.000 claims description 2
- 210000002700 urine Anatomy 0.000 claims description 2
- 241000209140 Triticum Species 0.000 claims 2
- 241001386813 Kraken Species 0.000 claims 1
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 abstract description 8
- 230000008901 benefit Effects 0.000 abstract description 5
- 238000009412 basement excavation Methods 0.000 abstract 1
- 239000000523 sample Substances 0.000 description 26
- 239000011324 bead Substances 0.000 description 14
- 238000006243 chemical reaction Methods 0.000 description 10
- 238000002156 mixing Methods 0.000 description 10
- 102000053602 DNA Human genes 0.000 description 8
- 238000013518 transcription Methods 0.000 description 8
- 230000035897 transcription Effects 0.000 description 8
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 7
- 238000000338 in vitro Methods 0.000 description 7
- 239000000047 product Substances 0.000 description 7
- 239000000243 solution Substances 0.000 description 7
- 238000012360 testing method Methods 0.000 description 6
- 230000003321 amplification Effects 0.000 description 5
- 239000007853 buffer solution Substances 0.000 description 5
- 238000013461 design Methods 0.000 description 5
- 238000003745 diagnosis Methods 0.000 description 5
- 238000003199 nucleic acid amplification method Methods 0.000 description 5
- 238000007792 addition Methods 0.000 description 4
- 239000000872 buffer Substances 0.000 description 4
- 239000012634 fragment Substances 0.000 description 4
- 208000015181 infectious disease Diseases 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- 238000010257 thawing Methods 0.000 description 4
- 108010006785 Taq Polymerase Proteins 0.000 description 3
- 238000007664 blowing Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000009396 hybridization Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 244000000010 microbial pathogen Species 0.000 description 3
- 239000011148 porous material Substances 0.000 description 3
- 239000002096 quantum dot Substances 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 239000006228 supernatant Substances 0.000 description 3
- 230000008685 targeting Effects 0.000 description 3
- 238000012070 whole genome sequencing analysis Methods 0.000 description 3
- 241001232615 Acinetobacter baumannii ATCC 19606 = CIP 70.34 = JCM 6841 Species 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 108010053770 Deoxyribonucleases Proteins 0.000 description 2
- 102000016911 Deoxyribonucleases Human genes 0.000 description 2
- 101100310856 Drosophila melanogaster spri gene Proteins 0.000 description 2
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 2
- 108020005004 Guide RNA Proteins 0.000 description 2
- 102000007462 Molecular Motor Proteins Human genes 0.000 description 2
- 108010085191 Molecular Motor Proteins Proteins 0.000 description 2
- 102100030569 Nuclear receptor corepressor 2 Human genes 0.000 description 2
- 101710153660 Nuclear receptor corepressor 2 Proteins 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- 102000045595 Phosphoprotein Phosphatases Human genes 0.000 description 2
- 108700019535 Phosphoprotein Phosphatases Proteins 0.000 description 2
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 2
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 2
- 241000193996 Streptococcus pyogenes Species 0.000 description 2
- 244000052616 bacterial pathogen Species 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 2
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 239000013024 dilution buffer Substances 0.000 description 2
- 238000001035 drying Methods 0.000 description 2
- 238000001962 electrophoresis Methods 0.000 description 2
- 239000012149 elution buffer Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 229920001519 homopolymer Polymers 0.000 description 2
- 230000002458 infectious effect Effects 0.000 description 2
- 239000007791 liquid phase Substances 0.000 description 2
- 238000011068 loading method Methods 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 239000002773 nucleotide Substances 0.000 description 2
- 125000003729 nucleotide group Chemical group 0.000 description 2
- 244000052769 pathogen Species 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 239000011535 reaction buffer Substances 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 125000006850 spacer group Chemical group 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000001847 surface plasmon resonance imaging Methods 0.000 description 2
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- 101100385358 Alicyclobacillus acidoterrestris (strain ATCC 49025 / DSM 3922 / CIP 106132 / NCIMB 13137 / GD3B) cas12b gene Proteins 0.000 description 1
- 101710092462 Alpha-hemolysin Proteins 0.000 description 1
- 238000010354 CRISPR gene editing Methods 0.000 description 1
- 101710172824 CRISPR-associated endonuclease Cas9 Proteins 0.000 description 1
- 238000010453 CRISPR/Cas method Methods 0.000 description 1
- 108700004991 Cas12a Proteins 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 241000025053 Escherichia coli DSM 30083 = JCM 1649 = ATCC 11775 Species 0.000 description 1
- 241001056120 Klebsiella pneumoniae ATCC 43816 Species 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 238000000585 Mann–Whitney U test Methods 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 241000276427 Poecilia reticulata Species 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 241000191967 Staphylococcus aureus Species 0.000 description 1
- 101710137500 T7 RNA polymerase Proteins 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 150000001413 amino acids Chemical class 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000027455 binding Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 101150038500 cas9 gene Proteins 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Health & Medical Sciences (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- Genetics & Genomics (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明属于生物技术领域,具体涉及一种检测目标核酸及其邻近区域核酸序列的方法。具体地,本发明通过CRISPR‑Cas9靶向靶基因序列的中间位置,通过连接纳米孔测序接头,从靶基因的中间向两侧延伸,同时获取靶基因序列和靶基因两侧的序列信息,在提升靶基因有效检出的同时可以利用长读长测序检测的优势,直接获取靶基因物理位置邻近核酸的序列信息,实现靶基因的物种注释、上下游序列解析等重要功能信息的挖掘。
Description
技术领域
本发明属于生物技术领域,具体涉及一种检测目标核酸及其邻近区域核酸序列的方法。
背景技术
随着测序技术的发展,二代测序在基因诊断和病原微生物检测方面有着广泛的应用。对临床样本核酸进行全基因组测序(WGS)可以提供全面的遗传信息,但是包含关键诊疗信息的变异区域或者样本中的病原菌及其耐药基因核酸通常只占整体核酸的很小一部分(<1%)。因此,相比于高成本和高解析难度的WGS,靶向测序有着更高的性价比,可避免测序信息浪费,提高临床的普及性。同时,靶向测序可以为关键位点提供更高的测序深度和覆盖度,从而提高诊断的准确性。目前已有的靶向测序技术有探针杂交捕获技术和靶向PCR技术。探针杂交捕获技术虽然探针设计简单,但有着实验操作复杂、实验周期长、成本高等缺点。靶向PCR技术由于引物集设计复杂,通常检测通量较低。值得注意的是,目标核酸序列的上下游序列中通常包含着重要的遗传信息,可用于融合基因的检测或者耐药基因物种的注释等。但现有的靶向测序技术通常无法获取或仅能获取很少邻近序列的信息。靶向PCR技术只检测用于设计引物的目标序列,无法获取相邻序列信息;而常用的探针杂交捕获流程,受限于与二代测序技术的读长较短,也仅能检测较短的相邻序列信息。
为了解决二代测序的不足,三代长读长测序应运而生。目前主要的三代测序方法是来自于美国太平洋生物科学公司的单分子实时测序技术(Single Molec ule Real Timesequencing,SMRT)和牛津生物公司的纳米孔测序技术(Oxfor d Nanopore Technoligies,ONT)。纳米孔测序的概念最早可以追溯至20世纪80年代,目前的纳米孔测序技术主要包括两个部分:纳米孔蛋白和分子马达蛋白。第一个被用于纳米孔测序的纳米孔蛋白为alpha-hemolysin,其内部直径为1.4至2.4纳米;随后,另外一个具有相似内部直径(1.2纳米)的蛋白MspA也被证实可以用于纳米孔测序。分子马达蛋白的作用则主要是将双链DNA或者RNA-DNA杂合体解链为单链分子,使得待测序的DNA或RNA分子穿过纳米孔蛋白。测序过程中,由于纳米孔蛋白(pore)所在的薄膜两侧的电压不一样,DNA、RNA或者蛋白质分子通过pore时便会产生电流,不同碱基由于其结构的差异在经过通道时引起的电流变化不一样从而会被区分开来。
这种方法具有许多优点,包括高通量、实时测序、长读长、低成本和不需要PCR扩增等。纳米孔测序技术在许多领域都有广泛的应用,包括基因组学研究、病原体检测、生物学研究以及临床诊断等。它已经在快速测序、实时监测DNA复制和转录等方面取得了显著的进展,使科学家能够更深入地理解基因组和DNA的功能。由于其独特的优势,纳米孔测序技术在生命科学领域具有重要的潜力。
发明内容
本发明通过CRISPR-Cas9靶向靶基因序列的中间位置,连接纳米孔测序接头,从靶基因的中间向两侧延伸,同时获取靶基因序列和靶基因两侧的序列信息,在提升靶基因有效检出的同时可以利用长读长测序检测的优势,直接获取靶基因物理位置邻近核酸的序列信息,实现靶基因的物种注释、上下游序列解析等重要功能信息的挖掘。
第一方面,本发明提供了一种检测目标核酸及其邻近区域核酸序列的方法,所述测序方法包括在文库制备前对待测样本进行去磷酸化、切割和加A的步骤;
所述切割所使用的试剂是一个或多个Cas-sgRNA复合物,所述sgRNA是X-Y的转录产物,其中,X取自靶基因,Y的转录产物与Cas蛋白结合;
所述方法还包括对文库纯化后上机测序的步骤。
优选地,所述靶基因可以是任意基因,可以来源于任意一种生物,例如真核生物、原核生物、病毒。
优选地,所述真核生物包括人、鼠、猴、牛、羊、猪、马、鸡、拟南芥、马铃薯、甘薯、紫薯、山药、芋类、木薯、菊薯、水稻、小麦、大麦、玉米、高粱。
优选地,所述原核生物包括细菌、放线菌、古细菌、螺旋体、衣原体、支原体、立克次氏体和蓝细菌。
优选地,所述病毒包括腺病毒、肝炎病毒、流感病毒、水痘病毒、Ⅰ型单纯疱疹病毒、Ⅱ型单纯疱疹病毒、牛瘟病毒、呼吸道合胞病毒、巨细胞病毒、海胆病毒、虫媒病毒、汉坦病毒、腮腺炎病毒、新型冠状病毒。
优选地,所述细菌包括革兰氏阴性菌、革兰氏阳性菌。
优选地,所述细菌包括埃希氏菌属、芽孢杆菌属、沙雷氏菌属、沙门氏菌属、葡萄球菌属、链球菌属、梭菌属、衣原体属、奈瑟球菌属、螺旋体虫属、支原体属、疏螺旋体属、军团菌属、假单胞菌属、分枝杆菌、螺杆菌属、欧文氏菌属、土壤杆菌属、根瘤菌属和链霉菌属、不动杆菌属、克雷伯氏菌属。
优选地,所述细菌包括鲍曼不动杆菌(Acinetobacter baumannii)、肺炎克雷伯菌(Klebsiella pneumoniae)、大肠杆菌(Escherichia coli)、铜绿假单胞菌(Pseudomonasaeruginosa)
优选地,所述待测样本可以是任意样本,可以来源于任何生物,也可以是环境样本,如采集自医院、养殖场和污水处理厂的空气、水体、土壤或设施表面的样本。
优选地,当所述待测样本来自于动物时,所述待测样本包括来源于动物的一个或更多个细胞、组织或体液的样品。“体液”可以包括但不限于血液、血清、血浆、唾液、脑脊髓液、胸膜液、眼泪、乳腺导管液、淋巴、痰、尿液、羊水或***。样品可以包括是“无细胞(acellular)”的体液。“无细胞体液”包括小于约1%(w/w)的全细胞材料。血浆或血清是无细胞体液的实例。样品可以包括天然或合成来源的样本(specimen,即制成是无细胞的细胞样品)。所述动物包括人。
具体地,所述Cas-sgRNA复合物中Cas是指Cas蛋白,所述的Cas蛋白可以根据结构特征(如结构域)进行下位分类,如Cas12家族包括Cas12a(又名Cpf1)、Cas12b、Cas12c、Cas12i等。还以根据其来源不同而分类为来源于酿脓链球菌(Streptococcus pyogenes)的SpCas9、来源于葡萄球菌(Staphylococcus aureus)的SaCas9。
本发明所述的Cas蛋白可以是野生型或其突变体,所述的突变体的突变类型包括氨基酸的替换、取代或缺失,所述的突变体可以改变也可以不改变Cas蛋白的酶切活性。本领域技术人员所知,现有技术中已报到的多种具有核酸切割活性的Cas蛋白,该公知蛋白或其改造后的变体均可以实现本发明的功能,本文通过引用方式将其纳入保护范围。
优选地,所述Cas是Cas9蛋白。
如发明所述序列Y与Cas蛋白需搭配使用,当选择Cas蛋白后本领域技术人员可以选择相适应的Y序列。
优选地,所述Y的序列如SEQ ID NO.1所示。
优选地,在野生型的靶基因中,X之后的序列为NGG/NG。
优选地,所述X的长度是12-25nt(bp)。
优选地,所述X的长度是19或20nt。
优选地,所述X取自靶基因的任意位置,例如位于全长的10%、20%、30%、40%、50%、60%、70%、80%、90%的位置。
优选地,所述X取自靶基因的中间部位。更具体地,取自靶基因长度10-90%的位置,20-80%、30-70%、40-60%、45%-55%。具体地,例如靶基因长度为1000bp,在第100-120bp的位置取X即认为是在10%长度的位置取X,在第900-920bp的位置取X即认为是在90%长度的位置取X。
优选地,在每个靶基因中设计两个或以上的X,更优选地是在一个具体的靶基因的中间部位选取两个相近的X,例如相差1-500bp,1-400bp,1-300bp,1-200bp,1-100bp,1-50bp,1-40bp,1-30bp,1-20bp,1-10bp或更近。
优选地,所述X的方向是相反或相同的。
更优选地,所述每个靶基因中设计两个X;两个X之间相距1-55bp;最优选地,相距10bp。
最优选地,所述X的序列如SEQ ID NO.8-35所示。
在选择SEQ ID NO.8-35的组合X作为时,所述对靶基因及其上下游序列进行靶向测序的高灵敏度测序方法也可以称为对靶基因进行物种注释的高灵敏度(高检出)测序方法、病原微生物耐药基因检测方法,为了同时获取耐药基因序列及其相邻序列,我们选取了最靠近耐药基因中间位置的两条sgRNA。这样的设计一方面可以更好地处理可能出现的单条sgRNA活性不足或者sgRNA结合位点存在突变的情况,保证Cas9-sgRNA复合物对目标序列的有效切割;另一方面两条sgRNA的切口间隔控制在1-55bp(大多数为10bp),避免其他组合方式的切割造成目标序列碎片化,不能被纳米孔测序,从而造成序列信息丢失。
本发明具体实施例中通过CRISPR-Cas9靶向耐药基因序列的中间位置,通过连接纳米孔测序接头,从耐药基因的中间向两侧延伸,同时获取耐药基因序列和耐药基因两侧的序列信息,在提升耐药基因有效检出的同时可以利用长读长测序检测的优势,直接获取与耐药基因物理位置关联的物种信息,实现耐药基因的物种注释,为临床感染提供更多的诊疗信息以鉴定感染病原菌并指导用药决策。
如本文中所使用的,术语“指导RNA(single guide RNA,sgRNA)”、“成熟crRNA”、“指导序列”可互换地使用并且具有本领域技术人员通常理解的含义。一般而言,指导RNA基本上由同向重复序列和引导序列(在内源性CRISPR***背景下也称为间隔序列(spacer))组成。在某些情况下,X是与靶序列具有足够互补性从而与所述靶序列杂交并引导CRISPR/Cas复合物与所述靶序列的特异性结合的任何多核苷酸序列。在一个实施方式中,当最佳比对时,引导序列与其相应靶序列之间的互补程度为至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、或至少99%。确定最佳比对在本领域的普通技术人员的能力范围内。例如,存在公开和可商购的比对算法和程序,诸如但不限于ClustalW、史密斯-沃特曼算法(Smith-Waterman)、Bowtie、Geneious、Biopython以及SeqMan。本领域技术人员根据常规技术则可以排除低质量sgRNA(考虑GC含量、均聚物、双核甘酸重复、发夹结构、人基因组脱靶等因素)。
更优选地,所述上机测序是通过三代测序进行的。
更优选地,所述上机测序是通过的纳米孔测序技术进行的。
更优选地,所述上机测序是通过的ONT纳米孔测序技术进行的。
优选地,所述测序的设备包括MinION、GridION和PromethION。
术语“三代测序”也称为“单分子测序技术”,DNA测序时,不需要经过PCR扩增,实现了对每一条DNA分子的单独测序。主要分为两大技术阵营:第一大阵营是单分子荧光测序,代表性的技术为美国螺旋生物(Helicos)的SMS技术和美国太平洋生物(PacificBioscience)的SMRT技术。脱氧核苷酸用荧光标记,显微镜可以实时记录荧光的强度变化。当荧光标记的脱氧核苷酸被掺入DNA链的时候,它的荧光就同时能在DNA链上探测到。当它与DNA链形成化学键的时候,它的荧光基团就被DNA聚合酶切除,荧光消失。这种荧光标记的脱氧核苷酸不会影响DNA聚合酶的活性,并且在荧光被切除之后,合成的DNA链和天然的DNA链完全一样。第二大阵营为纳米孔测序,代表性的公司为英国牛津纳米孔公司。新型纳米孔测序法(nanopore sequencing)是采用电泳技术,借助电泳驱动单个分子逐一通过纳米孔来实现测序的。由于纳米孔的直径非常细小,仅允许单个核酸聚合物通过,而ATCG单个碱基的带电性质不一样,通过电信号的差异就能检测出通过的碱基类别,从而实现测序。
或者,所述一种对待测基因及其上下游序列进行靶向测序的高灵敏度测序方法也可以称为制备三代测序文库的方法。
具体地,本发明所述磷酸化、加A是本领域常规方法即可实现的。
本发明所述“靶基因”也可称为“目的基因”,也即需要被检出并进行邻近上下游序列注释的基因,本发明所提供的方法不对靶基因做任何限制,人工序列或自然存在的任意序列皆可以作为靶基因。本发明具体实施例中以多个菌种的耐药基因为靶基因进行了验证。
本发明所述“文库”即核酸片段的集合,本发明中对待测样本进行去磷酸化、切割和加A的步骤后获得的产物即可称为文库,优选地,进行纯化后即可进行测序。
另一方面,本发明提供了一组序列组合物,所述序列是X-Y的转录产物,其中,X取自靶基因,Y的转录产物与Cas蛋白结合。
另一方面,本发明提供了一种试剂组合物,所述试剂组合物中包括Cas-sgRNA复合物和以下任意一种或多种试剂的组合:去磷酸化试剂、DNA末端加A试剂、接头连接试剂和测序所需试剂。
优选地,所述测序所需试剂是三代测序所需试剂。
优选地,所述测序所需试剂是纳米孔测序技术所需试剂。
优选地,所述测序所需试剂是ONT纳米孔测序技术所需试剂。
本发明所述试剂组合物可以包装为试剂盒的形式,其中还可以包含使用以上试剂所需要的器材,如试管等容器、摆放容器所需支架等。
另一方面,本发明提供了Cas蛋白、前述序列组合物、试剂组合物在提高靶基因检出比例中的应用,在测序中检出可物种注释的结果中的应用。
更具体地,在检测鲍曼不动杆菌(Acinetobacter baumannii)、肺炎克雷伯菌(Klebsiella pneumoniae)、大肠杆菌(Escherichia coli)、铜绿假单胞菌(Pseudomonasaeruginosa)中任意一种或多种菌株的耐药基因中的应用。该应用为临床感染提供更多的诊疗信息以鉴定感染病原菌并指导用药决策。
附图说明
图1是技术原理图。
图2是正常纳米孔文库和CRISPR-Cas9靶向纳米孔文库产生的数据中耐药基因reads占比。
图3是正常纳米孔文库和CRISPR-Cas9靶向纳米孔文库产生的数据中比对到每个耐药基因上的reads数。
具体实施方式
下面结合实施例对本发明做进一步的说明,以下所述,仅是对本发明的较佳实施例而已,并非对本发明做其他形式的限制,任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更为同等变化的等效实施例。凡是未脱离本发明方案内容,依据本发明的技术实质对以下实施例所做的任何简单修改或等同变化,均落在本发明的保护范围内。
实施例1、病原微生物耐药基因检测
宏基因测序检测临床样本中的耐药基因的缺点:1)耐药基因只占样本总DNA很少一部分(<1%),这使得其在宏基因组测序中很难被捕获到,尤其是对于人源细胞背景含量高的临床样本。2)耐药基因可以通过水平基因转移的方式在多个物种间传播,从而导致基于二代短读长测序平台获取的耐药基因片段,无法从中直接获取耐药基因与物种的关联信息。
本发明通过CRISPR-Cas9靶向捕获临床中重要或常见的耐药基因,并进行纳米孔长读长测序,可有效提升对耐药基因的检出,并可根据耐药基因两侧的序列信息确定耐药基因的物种来源,为临床提供更多的诊疗信息。
1、实验材料
样本:鲍曼不动杆菌ATCC 19606、肺炎克雷伯菌Klebsiella pneumoniae ATCC43816、大肠杆菌Escherichia coli ATCC 11775、铜绿假单胞菌Pseudomonas aeruginosaATCC 27853。
试剂:微生物基因组提取试剂盒、Cas9核酸酶(spCas9)、GridION测序芯片(R9.4)、牛津纳米孔连接测序试剂盒、芯片清洗试剂盒、快速磷酸酶、PCR mix、Taq DNA聚合酶、T7体外转录试剂盒、RNA纯化试剂盒等。
2、实验方法
步骤1:为实验菌株中待测试的14个耐药基因设计sgRNA序列
首先,根据PAM(NGG)序列寻找耐药基因上所有可能的sgRNA,排除低质量sgRNA(考虑GC含量、均聚物、双核甘酸重复、发夹结构、人基因组脱靶等因素)后,然后选择最靠近耐药基因序列中间位置的两个sgRNA(靠近中间位置的设计使得Cas9-sgRNA复合物切割后的序列即含有耐药基因的序列,又向耐药基因两侧延伸以包含更多菌株特异性序列的信息;选择两个sgRNA以增加Cas9-sgRNA复合物切割的效率)。所有的耐药基因的sgRNA共同组成sgRNA库。
步骤2:用于体外转录的sgRNA模板链的制备
根据上述sgRNA序列设计用于体外转录的sgRNA引物。通过PCR合成体外转录用使用的模板DNA。其中模板序列为:
AAAAGCACCGACTCGGTGCCACTTTTTCAAGTTGATAACGGACTAGCCTTATTTTAACTTGCTATTTCTAGCTCTAAAAC(SEQ ID NO.2)。
正向引物序列为:
TTCTAATACGACTCACTATAGNNNNNNNNNNNNNNNNNNNNGTTTTAGAGCTAGA(SEQ ID NO.3),其中N代表sgRNA的序列。
反向引物序列为:AAAAGCACCGACTCGGTGCC(SEQ ID NO.4)。
扩增体系如表1,扩增条件如表2。
表1、扩增体系
成分 | 50μl的反应体系 |
PCR Mix | 12.5μl |
10μM正向引物 | 2.5μl |
10μM反向引物 | 2.5μl |
1μM模板DNA | 2μl |
无核酸酶水 | 18μl |
表2、扩增条件
步骤3:PCR产物进行磁珠纯化
反应结束后对PCR产物进行磁珠纯化,纯化步骤如下:取90μl AMPure XP磁珠置于PCR产物中,充分混匀后静置5min。将PCR管置于磁力架中分离磁珠和液体,待溶液澄清后(约3min),小心移除上清。保持PCR管始终置于磁力架中,加入200μl无核酸酶水新鲜配制的80%乙醇漂洗磁珠,室温孵育30sec后,小心移除上清。重复漂洗一次。用10μl移液器吸干净残留液体。保持PCR管始终置于磁力架中,室温下开盖干燥磁珠。加入22μl无核酸酶水,吹打至充分混匀,室温静置5min。将PCR管短暂离心并置于磁力架中静置,待溶液澄清后(约5min),小心移取20μl上清至新PCR管中。用Qubit测定回收产物浓度。
步骤4:sgRNA的体外转录
利用T7体外转录试剂盒进行sgRNA的体外转录,步骤如下:清理试验台,防止核糖核酸酶的污染。按顺序向PCR管中添加如下试剂:10μl的NTP Buffer Mix、1μg上一步骤纯化的sgRNA模板DNA,2μl T7 RNA聚合酶Mix,用水补足30μl。反应条件为:37℃,16h。DNA酶处理去除DNA模板。
反应结束后去除模板DNA:每30μl反应加20μl无核酸酶水,再加2μl的DNA酶,混合,37℃孵育15min。
以S000855_1为例,TTTTCTAAGACTTGGTCGAA(SEQ ID NO.8)出自目标基因组,其在目标基因组中之后的三个核苷酸为NGG,其扩展的正向引物是:TTCTAATACGACTCACTATAGTTTTCTAAGACTTGGTCGAAGTTTTAGAGCTAGA(SEQ ID NO.6),扩增产物为TTCTAATACGACTCACTATAGTTTTCTAAGACTTGGTCGAAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTT(SEQ ID NO.5-4-1),转录产物是:GUUUUCUAAGACUUGGUCGAAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU(SEQ ID NO.7)。
步骤5:RNA的纯化
使用RNA纯化试剂盒纯化RNA,利用Qubit测定sgRNA的浓度。
步骤6:Cas9-sgRNA复合物的组装
按照表3体系混合各组分。上述体系在室温(25℃)孵育30min完整组装,组装好的RNP可在4℃保存一周,或者在-80℃保存一个月。
表3、Cas9-sgRNA复合物混合体系
组分 | 用量 |
无核酸酶水 | 6.4μl |
反应缓冲液 | 2μl |
sgRNA | 10μl |
HiFi Cas9(6.2μM) | 1.6μl |
步骤7:提取微生物基因组,制备模拟样本
使用微生物基因组提取试剂盒提取A.baumannii ATCC 19606、K.pneumoniaeATCC 43816、E.coli ATCC 11775和P.aeruginosa ATCC 27853菌株基因组。等质量混合后制成待测模拟样本。
步骤8:模拟样本基因组去磷酸化
准备1μg溶于无核酸酶水中的DNA,根据浓度加无核酸酶水至24μl,轻弹管壁混匀。瞬离;吹打混匀磷酸酶,平衡至室温;在0.2ml薄壁PCR管中混匀表4所示试剂。
表4、去磷酸化试剂
组分或操作 | 用量 |
反应缓冲液 | 3μl |
模拟样本DNA | 24μl |
磷酸酶 | 3μl |
总体积 | 30μl |
轻弹混匀并瞬离,在PCR仪上进行如下孵育:37℃,10minutes;80℃,2minutes,实现去磷酸化和失活磷酸酶。
步骤9:模拟样本基因组切割及加A
涡旋混匀dATP,置于冰上,瞬离Taq聚合酶,置于冰上。向上步骤反应管中添加1μldATP、1μl Taq聚合酶和10μl Cas9-sgRNA复合物,轻弹混匀并瞬离后在37℃下孵育45min以完成Cas9-sgRNA复合物的切割。然后72℃反应5min,以实现在切割后的DNA末端上添加A。
步骤10:接头连接与文库纯化
轻弹混匀并瞬离测序接头F和快速T4 DNA连接酶,置于冰上;于室温下解冻连接缓冲液,解冻后轻微离心,并用移液枪吹打混匀,该缓冲液的黏度较高,涡旋振荡会很难混匀,解冻并混匀后,立即置于冰上;将上步骤PCR管中的反应液小心地转移至1.5ml离心管中;在一个新的1.5ml离心管中混匀下述试剂:
表5、接头连接体系
组分 | 用量 |
连接缓冲液 | 20μl |
无核酸酶水 | 3μl |
T4连接酶 | 10μl |
接头混合液 | 5μl |
总体积 | 38μl |
轻弹混匀并瞬离后,先添加20μl上述混合液至DNA文库样本中,轻弹混匀,然后立马添加剩余的18μl混合液,轻弹混匀并瞬离;室温下反应15min。涡旋混匀洗脱缓冲液和SPRI稀释缓冲液并瞬离,置于冰上;在室温下解冻短片段缓冲液,涡旋振荡混合后瞬离,置于冰上;向反应液中添加80μlSPRI稀释缓冲液,轻弹混匀;重悬磁珠,添加80μl磁珠,轻弹混匀,室温孵育10min,期间轻柔颠倒;轻微瞬离,置于磁力架上待磁珠和液相分离,保持离心管在磁力架上不动,用移液枪吸去清液;保持试管在磁力架上不动,以200μl短片段缓冲液洗涤磁珠,用移液枪将短片段缓冲液吸走并弃掉;重复上述步骤;将离心管轻微离心后置于磁力架上,用移液枪吸走残留的短片段缓冲液,让磁珠在空气中干燥约5min,但不要干至表面开裂;将离心管从磁力架上移开。将磁珠重悬于15μl洗脱缓冲液中;轻微离心,然后在室温下孵育10分钟。将试管静置于磁力架上,直到磁珠和液相分离,且洗脱液澄清无色,此时,DNA文库溶解于洗脱液中。将此14μl洗脱液转移至一支新的1.5ml离心管管中,取1μl用于Qubit定量。
步骤11:上机测序
按照牛津纳米孔芯片激活操作说明激活测序芯片(Oxford NanoporeTechnoligies,FLO-MIN106D)。配置上机文库:混合37.5μl的纳米孔基因测序缓冲液和25.5μl的纳米孔基因测序芯片上样磁珠,然后添加12μl上步骤制备的测序文库。按照牛津纳米孔上机操作说明在GridION测序仪进行上机测序,通过软件MinKNOW获取测序数据,获得约2G数据量后停止测序。
步骤12:下机数据分析
利用Guppy高精度碱基识别模式完成碱基识别,获得fastq文件。利用porechop软件去除接头序列,然后利用fastcat进行片段长度和reads质量过滤后获得用于后续分析的质控后fastq文件。利用minimap2进行耐药基因的比对和注释,统计耐药基因reads占比。利用kraken2进行物种注释,统计耐药基因实现物种注释的比例和情况。
3、实验结果
基因组DNA末端去掉磷酸基团后,使得双链DNA钝化无法与接头连接;而Cas9-sgRNA复合物可通过sgRNA的引导特异性切割目标DNA序列,产生新的活性末端。因此,在接头连接环节,只有目标的耐药基因序列可以和测序接头连接,从而可通过纳米孔实现测序。
从图2中可以看出,相比于正常纳米孔测序,CRISPR-Cas9靶向纳米孔策略可以有效提升耐药基因reads在总的下机数据中的占比,提升了87.5倍。
从图3可以看出,相比于正常纳米孔测序,CRISPR-Cas9靶向纳米孔测序中比对到每个耐药基因的reads均得到显著提升(Mann–Whitney U test:P<0.05),平均提高了82.6(±35.2)倍。
表6、比对到耐药基因上的reads实现物种注释结果
A:物种注释工具为kraken2;实现物种注释是指kraken2给出与物种与耐药基因来源菌株物种一致;
B:耐药基因sul2可位于质粒上,因此该基因的正确物种注释需要较长片段,实现物种注释的reads比例较低。
Claims (10)
1.一种检测目标核酸及其邻近区域核酸序列的方法,所述测序方法包括在文库制备时对待测样本进行去磷酸化、切割和加A处理的步骤;
所述切割所使用的试剂是一个或多个Cas-sgRNA复合物,所述sgRNA是X-Y的转录产物,其中,X取自靶基因,Y的转录产物与Cas蛋白结合;
优选地,在靶基因中取2个及以上的X,所述取自同一个靶基因的X之间相差1-500bp;
优选地,所述取自同一个靶基因的X之间相差1-400bp,1-300bp,1-200bp,1-100bp,1-55bp,1-50bp,1-40bp,1-30bp,1-20bp,1-10bp或更近;
最优选地,所述取自同一个靶基因的X之间相差1-55bp;
优选地,所述方法还包括对文库纯化后测序的步骤。
2.如权利要求1所述测序方法,所述测序是通过三代测序进行的;
优选地,所述测序是通过的纳米孔测序技术进行的;
优选地,所述测序是通过的ONT纳米孔测序技术进行的;
优选地,所述测序的芯片包括MinION、GridION或PromethION。
3.如权利要求1所述测序方法,所述Cas蛋白包括Cas9、Cas12;
优选地,所述Cas9蛋白包括SpCas9、SaCas9;
优选地,所述Cas9蛋白是SpCas9;
优选地,所述Cas9蛋白包括保留酶切活性的突变型Cas9。
4.如权利要求1所述测序方法,所述Y的序列如SEQ ID NO.1所示。
5.如权利要求1所述测序方法,所述靶基因来源真核生物、原核生物、病毒;
优选地,所述真核生物包括人、鼠、猴、牛、羊、猪、马、鸡、拟南芥、马铃薯、甘薯、紫薯、山药、芋类、木薯、菊薯、水稻、小麦、大麦、玉米、高粱;
优选地,所述原核生物包括细菌、放线菌、古细菌、螺旋体、衣原体、支原体、立克次氏体和蓝细菌;
优选地,所述病毒包括腺病毒、肝炎病毒、流感病毒、水痘病毒、Ⅰ型单纯疱疹病毒、Ⅱ型单纯疱疹病毒、牛瘟病毒、呼吸道合胞病毒、巨细胞病毒、海胆病毒、虫媒病毒、汉坦病毒、腮腺炎病毒、新型冠状病毒;
优选地,所述细菌包括革兰氏阴性菌、革兰氏阳性菌;
优选地,所述细菌包括埃希氏菌属、芽孢杆菌属、沙雷氏菌属、沙门氏菌属、葡萄球菌属、链球菌属、梭菌属、衣原体属、奈瑟球菌属、螺旋体虫属、支原体属、疏螺旋体属、军团菌属、假单胞菌属、分枝杆菌、螺杆菌属、欧文氏菌属、土壤杆菌属、根瘤菌属和链霉菌属、不动杆菌属、克雷伯氏菌属;
优选地,所述细菌包括鲍曼不动杆菌、肺炎克雷伯菌、大肠杆菌或铜绿假单胞菌。
6.如权利要求1所述测序方法,所述待测样本包括来源于动物的一个或更多个细胞、组织或体液的样本,所述待测样本还包括环境样本;
优选地,所述体液包括血液、血清、血浆、唾液、脑脊髓液、胸膜液、眼泪、乳腺导管液、淋巴、痰、尿液、羊水或***;
优选地,所述动物包括人;
优选地,所述环境样本包括采集自医院、养殖场和污水处理厂的空气、水体、土壤或设施表面的样本;
优选地,所述待测样本通过预处理提取核酸后进行测序。
7.如权利要求1所述测序方法,在每个靶基因中涉及两个或以上的X;
优选地,所述X的方向是相反或相同的;
优选地,所述X取自靶基因长度10-90%的位置;
优选地,所述X的长度是12-25nt;
优选地,所述X的长度是19或20nt;
优选地,所述X的序列如SEQ ID NO.8-35所示;
优选地,所述物种注释是通过kraken2实现的。
8.一种试剂组合物,所述试剂组合物中包括Cas-sgRNA复合物和以下任意一种或多种试剂的组合:去磷酸化试剂、DNA末端加A试剂、接头连接试剂和测序所需试剂;
所述sgRNA是X-Y的转录产物,其中,X取自靶基因,Y的转录产物与Cas蛋白结合;
优选地,所述X的长度是12-25nt;
优选地,所述X的长度是19或20nt;
最优选地,所述X的序列如SEQ ID NO.8-35所示;
优选地,所述Y的序列如SEQ ID NO.1所示;
优选地,所述测序所需试剂是三代测序所需试剂;
优选地,所述测序所需试剂是纳米孔测序技术所需试剂;
优选地,所述测序所需试剂是ONT纳米孔测序技术所需试剂。
9.如权利要求8所述试剂组合物,所述靶基因来源真核生物、原核生物、病毒;
优选地,所述真核生物包括人、鼠、猴、牛、羊、猪、马、鸡、拟南芥、马铃薯、甘薯、紫薯、山药、芋类、木薯、菊薯、水稻、小麦、大麦、玉米、高粱;
优选地,所述原核生物包括细菌、放线菌、古细菌、螺旋体、衣原体、支原体、立克次氏体和蓝细菌;
优选地,所述病毒包括腺病毒、肝炎病毒、流感病毒、水痘病毒、Ⅰ型单纯疱疹病毒、Ⅱ型单纯疱疹病毒、牛瘟病毒、呼吸道合胞病毒、巨细胞病毒、海胆病毒、虫媒病毒、汉坦病毒、腮腺炎病毒、新型冠状病毒;
优选地,所述细菌包括革兰氏阴性菌、革兰氏阳性菌;
优选地,所述细菌包括埃希氏菌属、芽孢杆菌属、沙雷氏菌属、沙门氏菌属、葡萄球菌属、链球菌属、梭菌属、衣原体属、奈瑟球菌属、螺旋体虫属、支原体属、疏螺旋体属、军团菌属、假单胞菌属、分枝杆菌、螺杆菌属、欧文氏菌属、土壤杆菌属、根瘤菌属和链霉菌属、不动杆菌属、克雷伯氏菌属;
优选地,所述细菌包括鲍曼不动杆菌、肺炎克雷伯菌、大肠杆菌或铜绿假单胞菌;
优选地,所述Cas蛋白是Cas9;
优选地,所述Cas9蛋白是SpCas9;
优选地,所述Cas9蛋白包括保留酶切活性的突变型Cas9。
10.Cas蛋白或权利要求8所述试剂组合物的以下任意一种或多种应用:
1)提高靶基因检出比例、
2)对靶基因进行物种注释、上下游序列解析、
3)提高耐药基因检出能力;
优选地,所述耐药基因包括鲍曼不动杆菌、肺炎克雷伯菌、大肠杆菌、铜绿假单胞菌的耐药基因;
优选地,所述Cas包括Cas9、Cas12;
优选地,所述Cas9蛋白包括SpCas9、SaCas9;
优选地,所述Cas9蛋白是SpCas9;
优选地,所述Cas9蛋白包括保留酶切活性的突变型Cas9。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311635240.4A CN117551746A (zh) | 2023-12-01 | 2023-12-01 | 一种检测目标核酸及其邻近区域核酸序列的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311635240.4A CN117551746A (zh) | 2023-12-01 | 2023-12-01 | 一种检测目标核酸及其邻近区域核酸序列的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117551746A true CN117551746A (zh) | 2024-02-13 |
Family
ID=89810837
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311635240.4A Pending CN117551746A (zh) | 2023-12-01 | 2023-12-01 | 一种检测目标核酸及其邻近区域核酸序列的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117551746A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015206737A (ja) * | 2014-04-23 | 2015-11-19 | 株式会社日立ハイテクノロジーズ | 分析装置 |
US20180298421A1 (en) * | 2014-12-20 | 2018-10-18 | Identifygenomics, Llc | Compositions and methods for targeted depletion, enrichment, and partitioning of nucleic acids using crispr/cas system proteins |
CN109971842A (zh) * | 2019-02-15 | 2019-07-05 | 成都美杰赛尔生物科技有限公司 | 一种检测CRISPR-Cas9脱靶效应的方法 |
CN113166798A (zh) * | 2018-11-28 | 2021-07-23 | 主基因有限公司 | 通过核酸内切酶保护的靶向富集 |
CN114836540A (zh) * | 2022-05-16 | 2022-08-02 | 赣南医学院 | 一种用于检测bcr/-abl1融合基因的试剂盒及其使用方法 |
CN115232866A (zh) * | 2022-08-08 | 2022-10-25 | 南方医科大学皮肤病医院(广东省皮肤病医院、广东省皮肤性病防治中心、中国麻风防治研究中心) | 一种基于纳米孔测序靶向富集细菌16S rRNA基因的测序方法 |
CN115961008A (zh) * | 2023-02-14 | 2023-04-14 | 赣南医学院 | 用于直接检测多个样本中bcr-abl1融合基因启动子甲基化的试剂盒及使用方法 |
CN116287162A (zh) * | 2023-02-14 | 2023-06-23 | 赣南医学院 | 检测bcr-abl1融合基因及其酪氨酸激酶区突变和启动子甲基化的试剂盒及使用方法 |
-
2023
- 2023-12-01 CN CN202311635240.4A patent/CN117551746A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015206737A (ja) * | 2014-04-23 | 2015-11-19 | 株式会社日立ハイテクノロジーズ | 分析装置 |
US20180298421A1 (en) * | 2014-12-20 | 2018-10-18 | Identifygenomics, Llc | Compositions and methods for targeted depletion, enrichment, and partitioning of nucleic acids using crispr/cas system proteins |
CN113166798A (zh) * | 2018-11-28 | 2021-07-23 | 主基因有限公司 | 通过核酸内切酶保护的靶向富集 |
CN109971842A (zh) * | 2019-02-15 | 2019-07-05 | 成都美杰赛尔生物科技有限公司 | 一种检测CRISPR-Cas9脱靶效应的方法 |
CN114836540A (zh) * | 2022-05-16 | 2022-08-02 | 赣南医学院 | 一种用于检测bcr/-abl1融合基因的试剂盒及其使用方法 |
CN115232866A (zh) * | 2022-08-08 | 2022-10-25 | 南方医科大学皮肤病医院(广东省皮肤病医院、广东省皮肤性病防治中心、中国麻风防治研究中心) | 一种基于纳米孔测序靶向富集细菌16S rRNA基因的测序方法 |
CN115961008A (zh) * | 2023-02-14 | 2023-04-14 | 赣南医学院 | 用于直接检测多个样本中bcr-abl1融合基因启动子甲基化的试剂盒及使用方法 |
CN116287162A (zh) * | 2023-02-14 | 2023-06-23 | 赣南医学院 | 检测bcr-abl1融合基因及其酪氨酸激酶区突变和启动子甲基化的试剂盒及使用方法 |
Non-Patent Citations (2)
Title |
---|
GILPATRICK T等: "IVT generation of guideRNAs for Cas9-enrichment nanopore sequencing", BIORXIV, 7 February 2023 (2023-02-07), pages 1 - 11 * |
GILPATRICK T等: "Targeted nanopore sequencing with Cas9-guided adapter ligation", NAT BIOTECHNOL, vol. 38, no. 4, 30 April 2020 (2020-04-30), pages 433 - 438, XP055853454, DOI: 10.1038/s41587-020-0407-5 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11591650B2 (en) | Massively multiplexed RNA sequencing | |
AU2017381296B2 (en) | Reagents and methods for the analysis of linked nucleic acids | |
US10570448B2 (en) | Compositions and methods for identification of a duplicate sequencing read | |
JP6324962B2 (ja) | 標的rna枯渇化組成物を調製するための方法およびキット | |
JP6739339B2 (ja) | カバーされた配列変換dnaおよび検出方法 | |
US20230056763A1 (en) | Methods of targeted sequencing | |
US20160362680A1 (en) | Compositions and methods for negative selection of non-desired nucleic acid sequences | |
CN111801427B (zh) | 用于单分子的单链环状dna模板的产生 | |
CA3200519A1 (en) | Methods and systems for detecting pathogenic microbes in a patient | |
WO2012083845A1 (zh) | 用于除去测序文库中载体片段的方法及其用途 | |
CN117551746A (zh) | 一种检测目标核酸及其邻近区域核酸序列的方法 | |
CN115029345A (zh) | 基于crispr的核酸检测试剂盒及其应用 | |
WO2024119481A1 (zh) | 一种快速制备多重pcr测序文库的方法及其应用 | |
US20220380755A1 (en) | De-novo k-mer associations between molecular states | |
US20210172012A1 (en) | Preparation of dna sequencing libraries for detection of dna pathogens in plasma | |
CN118127187A (zh) | 一种基于靶向测序的呼吸道病原微生物检测试剂盒及其应用 | |
CN117222737A (zh) | 用于测序文库制备的方法和组合物 | |
CN118006746A (zh) | 基于CRISPR-dCas9的DNA靶向捕获测序方法、***和设备 | |
CN117947195A (zh) | 用于检测沙门氏菌的一步法CRISPR/Cas12b检测试剂盒及方法 | |
CN115279918A (zh) | 用于测序的新型核酸模板结构 | |
CN115175985A (zh) | 从未经处理的生物样本中提取单链dna和rna并测序的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |