TW202334421A - 包含靶向ciita之rna引導之組合物及其用途 - Google Patents
包含靶向ciita之rna引導之組合物及其用途 Download PDFInfo
- Publication number
- TW202334421A TW202334421A TW111142267A TW111142267A TW202334421A TW 202334421 A TW202334421 A TW 202334421A TW 111142267 A TW111142267 A TW 111142267A TW 111142267 A TW111142267 A TW 111142267A TW 202334421 A TW202334421 A TW 202334421A
- Authority
- TW
- Taiwan
- Prior art keywords
- nucleotide
- sequence
- seq
- nucleotides
- ciita
- Prior art date
Links
- 239000000203 mixture Substances 0.000 title claims abstract description 164
- 230000008685 targeting Effects 0.000 title abstract description 14
- 101100382123 Mus musculus Ciita gene Proteins 0.000 title 1
- 238000000034 method Methods 0.000 claims abstract description 117
- 102100026371 MHC class II transactivator Human genes 0.000 claims abstract description 100
- 101100382122 Homo sapiens CIITA gene Proteins 0.000 claims abstract description 62
- 108700002010 MHC class II transactivator Proteins 0.000 claims abstract description 7
- 125000003729 nucleotide group Chemical group 0.000 claims description 1940
- 239000002773 nucleotide Substances 0.000 claims description 1939
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 289
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 279
- 229920001184 polypeptide Polymers 0.000 claims description 273
- 210000004027 cell Anatomy 0.000 claims description 201
- 125000006850 spacer group Chemical group 0.000 claims description 125
- 238000012217 deletion Methods 0.000 claims description 117
- 230000037430 deletion Effects 0.000 claims description 117
- 230000000295 complement effect Effects 0.000 claims description 87
- 150000007523 nucleic acids Chemical class 0.000 claims description 81
- 102000039446 nucleic acids Human genes 0.000 claims description 64
- 108020004707 nucleic acids Proteins 0.000 claims description 64
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 61
- 239000013598 vector Substances 0.000 claims description 52
- GDPJWJXLKPPEKK-SJAYXVESSA-N dT4 Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C(NC(=O)C(C)=C2)=O)CO)[C@@H](O)C1 GDPJWJXLKPPEKK-SJAYXVESSA-N 0.000 claims description 40
- 230000035772 mutation Effects 0.000 claims description 37
- 238000006467 substitution reaction Methods 0.000 claims description 33
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 23
- 102000004389 Ribonucleoproteins Human genes 0.000 claims description 22
- 108010081734 Ribonucleoproteins Proteins 0.000 claims description 22
- 239000002253 acid Substances 0.000 claims description 22
- 102000040430 polynucleotide Human genes 0.000 claims description 20
- 108091033319 polynucleotide Proteins 0.000 claims description 20
- 108020004999 messenger RNA Proteins 0.000 claims description 18
- 239000002777 nucleoside Substances 0.000 claims description 18
- 150000003833 nucleoside derivatives Chemical class 0.000 claims description 15
- 210000001744 T-lymphocyte Anatomy 0.000 claims description 12
- 239000008194 pharmaceutical composition Substances 0.000 claims description 11
- 210000000130 stem cell Anatomy 0.000 claims description 10
- 238000000338 in vitro Methods 0.000 claims description 8
- 239000013604 expression vector Substances 0.000 claims description 6
- 210000004962 mammalian cell Anatomy 0.000 claims description 6
- 210000004102 animal cell Anatomy 0.000 claims description 4
- 201000010099 disease Diseases 0.000 claims description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 4
- 210000005260 human cell Anatomy 0.000 claims description 4
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 3
- 238000004519 manufacturing process Methods 0.000 claims description 3
- 108700028369 Alleles Proteins 0.000 claims description 2
- 150000001412 amines Chemical class 0.000 claims description 2
- 229920002477 rna polymer Polymers 0.000 description 254
- 101000983747 Homo sapiens MHC class II transactivator Proteins 0.000 description 96
- 229940024606 amino acid Drugs 0.000 description 44
- 150000001413 amino acids Chemical class 0.000 description 44
- 108090000623 proteins and genes Proteins 0.000 description 37
- 230000002441 reversible effect Effects 0.000 description 34
- 102000053602 DNA Human genes 0.000 description 26
- 108020004414 DNA Proteins 0.000 description 26
- 230000004048 modification Effects 0.000 description 26
- 238000012986 modification Methods 0.000 description 26
- 238000003780 insertion Methods 0.000 description 23
- 230000037431 insertion Effects 0.000 description 23
- 239000000872 buffer Substances 0.000 description 21
- 238000010362 genome editing Methods 0.000 description 18
- 108091028043 Nucleic acid sequence Proteins 0.000 description 17
- 101710163270 Nuclease Proteins 0.000 description 15
- 108010029485 Protein Isoforms Proteins 0.000 description 15
- 102000001708 Protein Isoforms Human genes 0.000 description 15
- 239000002299 complementary DNA Substances 0.000 description 15
- -1 system Substances 0.000 description 15
- 229910019142 PO4 Inorganic materials 0.000 description 12
- 230000000694 effects Effects 0.000 description 12
- 238000004520 electroporation Methods 0.000 description 12
- 235000021317 phosphate Nutrition 0.000 description 12
- 238000006243 chemical reaction Methods 0.000 description 10
- 239000013612 plasmid Substances 0.000 description 10
- 230000002255 enzymatic effect Effects 0.000 description 9
- 239000010452 phosphate Substances 0.000 description 9
- 239000013603 viral vector Substances 0.000 description 9
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 8
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 8
- 238000009472 formulation Methods 0.000 description 8
- 150000002632 lipids Chemical class 0.000 description 8
- 238000007481 next generation sequencing Methods 0.000 description 8
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 8
- 230000000536 complexating effect Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 239000002105 nanoparticle Substances 0.000 description 7
- 150000004713 phosphodiesters Chemical class 0.000 description 7
- 241000726103 Atta Species 0.000 description 6
- 102100031780 Endonuclease Human genes 0.000 description 6
- 108010042407 Endonucleases Proteins 0.000 description 6
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 6
- 125000000539 amino acid group Chemical group 0.000 description 6
- 239000012636 effector Substances 0.000 description 6
- 210000002865 immune cell Anatomy 0.000 description 6
- 125000003835 nucleoside group Chemical group 0.000 description 6
- 239000002157 polynucleotide Substances 0.000 description 6
- 238000002864 sequence alignment Methods 0.000 description 6
- 235000000346 sugar Nutrition 0.000 description 6
- 238000001890 transfection Methods 0.000 description 6
- 239000002609 medium Substances 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- 238000013518 transcription Methods 0.000 description 5
- 230000035897 transcription Effects 0.000 description 5
- 238000011144 upstream manufacturing Methods 0.000 description 5
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 5
- 239000013607 AAV vector Substances 0.000 description 4
- 241000894006 Bacteria Species 0.000 description 4
- 108091026890 Coding region Proteins 0.000 description 4
- 230000026279 RNA modification Effects 0.000 description 4
- 239000002245 particle Substances 0.000 description 4
- 125000004437 phosphorous atom Chemical group 0.000 description 4
- 210000002706 plastid Anatomy 0.000 description 4
- 150000003839 salts Chemical class 0.000 description 4
- 239000011780 sodium chloride Substances 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 229940113082 thymine Drugs 0.000 description 4
- 229940035893 uracil Drugs 0.000 description 4
- 108091033409 CRISPR Proteins 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- OOFLZRMKTMLSMH-UHFFFAOYSA-N H4atta Chemical compound OC(=O)CN(CC(O)=O)CC1=CC=CC(C=2N=C(C=C(C=2)C=2C3=CC=CC=C3C=C3C=CC=CC3=2)C=2N=C(CN(CC(O)=O)CC(O)=O)C=CC=2)=N1 OOFLZRMKTMLSMH-UHFFFAOYSA-N 0.000 description 3
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 3
- 229930010555 Inosine Natural products 0.000 description 3
- 108010002350 Interleukin-2 Proteins 0.000 description 3
- 108010066154 Nuclear Export Signals Proteins 0.000 description 3
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 3
- DLRVVLDZNNYCBX-UHFFFAOYSA-N Polydextrose Polymers OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(O)O1 DLRVVLDZNNYCBX-UHFFFAOYSA-N 0.000 description 3
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 3
- 229960000643 adenine Drugs 0.000 description 3
- 210000001789 adipocyte Anatomy 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000027455 binding Effects 0.000 description 3
- 239000001506 calcium phosphate Substances 0.000 description 3
- 229910000389 calcium phosphate Inorganic materials 0.000 description 3
- 235000011010 calcium phosphates Nutrition 0.000 description 3
- 239000000969 carrier Substances 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 231100000433 cytotoxic Toxicity 0.000 description 3
- 230000001472 cytotoxic effect Effects 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 229940029575 guanosine Drugs 0.000 description 3
- 238000009396 hybridization Methods 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 208000015181 infectious disease Diseases 0.000 description 3
- 229960003786 inosine Drugs 0.000 description 3
- 239000002502 liposome Substances 0.000 description 3
- 210000004698 lymphocyte Anatomy 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 210000002569 neuron Anatomy 0.000 description 3
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 3
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 230000001124 posttranscriptional effect Effects 0.000 description 3
- 229940096913 pseudoisocytidine Drugs 0.000 description 3
- 239000000523 sample Substances 0.000 description 3
- 239000000725 suspension Substances 0.000 description 3
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 3
- 210000003171 tumor-infiltrating lymphocyte Anatomy 0.000 description 3
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 2
- NMUSYJAQQFHJEW-UHFFFAOYSA-N 5-Azacytidine Natural products O=C1N=C(N)N=CN1C1C(O)C(O)C(CO)O1 NMUSYJAQQFHJEW-UHFFFAOYSA-N 0.000 description 2
- NMUSYJAQQFHJEW-KVTDHHQDSA-N 5-azacytidine Chemical compound O=C1N=C(N)N=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NMUSYJAQQFHJEW-KVTDHHQDSA-N 0.000 description 2
- QXDXBKZJFLRLCM-UAKXSSHOSA-N 5-hydroxyuridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(O)=C1 QXDXBKZJFLRLCM-UAKXSSHOSA-N 0.000 description 2
- HCGHYQLFMPXSDU-UHFFFAOYSA-N 7-methyladenine Chemical compound C1=NC(N)=C2N(C)C=NC2=N1 HCGHYQLFMPXSDU-UHFFFAOYSA-N 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 2
- 241000244203 Caenorhabditis elegans Species 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- 108700010070 Codon Usage Proteins 0.000 description 2
- UHDGCWIWMRVCDJ-CCXZUQQUSA-N Cytarabine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@@H](O)[C@H](O)[C@@H](CO)O1 UHDGCWIWMRVCDJ-CCXZUQQUSA-N 0.000 description 2
- 238000007400 DNA extraction Methods 0.000 description 2
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- FLFGNMFWNBOBGE-FNNZEKJRSA-N Elacytarabine Chemical compound O[C@H]1[C@H](O)[C@@H](COC(=O)CCCCCCC/C=C/CCCCCCCC)O[C@H]1N1C(=O)N=C(N)C=C1 FLFGNMFWNBOBGE-FNNZEKJRSA-N 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- 108700024394 Exon Proteins 0.000 description 2
- 108091093094 Glycol nucleic acid Proteins 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 2
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 2
- 229930182816 L-glutamine Natural products 0.000 description 2
- 241001529936 Murinae Species 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- 229920001100 Polydextrose Polymers 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 2
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 2
- 241000193996 Streptococcus pyogenes Species 0.000 description 2
- 241000194020 Streptococcus thermophilus Species 0.000 description 2
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 2
- 108091046915 Threose nucleic acid Proteins 0.000 description 2
- 150000007513 acids Chemical class 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 229960005305 adenosine Drugs 0.000 description 2
- 229960002756 azacitidine Drugs 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 229920006317 cationic polymer Polymers 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- WDDPHFBMKLOVOX-AYQXTPAHSA-N clofarabine Chemical compound C1=NC=2C(N)=NC(Cl)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@@H]1F WDDPHFBMKLOVOX-AYQXTPAHSA-N 0.000 description 2
- 229960000928 clofarabine Drugs 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 239000000412 dendrimer Substances 0.000 description 2
- 229920000736 dendritic polymer Polymers 0.000 description 2
- 239000003085 diluting agent Substances 0.000 description 2
- 239000002270 dispersing agent Substances 0.000 description 2
- 238000010494 dissociation reaction Methods 0.000 description 2
- 230000005593 dissociations Effects 0.000 description 2
- NAGJZTKCGNOGPW-UHFFFAOYSA-N dithiophosphoric acid Chemical class OP(O)(S)=S NAGJZTKCGNOGPW-UHFFFAOYSA-N 0.000 description 2
- 239000000839 emulsion Substances 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 2
- 239000011536 extraction buffer Substances 0.000 description 2
- 238000001125 extrusion Methods 0.000 description 2
- GIUYCYHIANZCFB-FJFJXFQQSA-N fludarabine phosphate Chemical compound C1=NC=2C(N)=NC(F)=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@@H]1O GIUYCYHIANZCFB-FJFJXFQQSA-N 0.000 description 2
- 230000037433 frameshift Effects 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 210000000987 immune system Anatomy 0.000 description 2
- 239000004615 ingredient Substances 0.000 description 2
- 239000007972 injectable composition Substances 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 210000002540 macrophage Anatomy 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- GLVAUDGFNGKCSF-UHFFFAOYSA-N mercaptopurine Chemical compound S=C1NC=NC2=C1NC=N2 GLVAUDGFNGKCSF-UHFFFAOYSA-N 0.000 description 2
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 2
- 238000000520 microinjection Methods 0.000 description 2
- 210000001616 monocyte Anatomy 0.000 description 2
- 210000000440 neutrophil Anatomy 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000007911 parenteral administration Methods 0.000 description 2
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 description 2
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 2
- 239000001259 polydextrose Substances 0.000 description 2
- 229940035035 polydextrose Drugs 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 210000001938 protoplast Anatomy 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 239000002904 solvent Substances 0.000 description 2
- 150000008163 sugars Chemical class 0.000 description 2
- 229910052717 sulfur Inorganic materials 0.000 description 2
- 239000011593 sulfur Substances 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 239000000375 suspending agent Substances 0.000 description 2
- 238000013268 sustained release Methods 0.000 description 2
- 239000012730 sustained-release form Substances 0.000 description 2
- 229960003080 taurine Drugs 0.000 description 2
- 238000003151 transfection method Methods 0.000 description 2
- 239000003981 vehicle Substances 0.000 description 2
- 230000035899 viability Effects 0.000 description 2
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 2
- YZSZLBRBVWAXFW-LNYQSQCFSA-N (2R,3R,4S,5R)-2-(2-amino-6-hydroxy-6-methoxy-3H-purin-9-yl)-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound COC1(O)NC(N)=NC2=C1N=CN2[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O YZSZLBRBVWAXFW-LNYQSQCFSA-N 0.000 description 1
- MXYRZDAGKTVQIL-IOSLPCCCSA-N (2r,3r,4s,5r)-2-(6-aminopurin-9-yl)-5-(hydroxymethyl)-2-methyloxolane-3,4-diol Chemical compound C1=NC2=C(N)N=CN=C2N1[C@]1(C)O[C@H](CO)[C@@H](O)[C@H]1O MXYRZDAGKTVQIL-IOSLPCCCSA-N 0.000 description 1
- YLCCMFLPRRFRJT-VPCXQMTMSA-N 1-[(2R,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)-2-methyloxolan-2-yl]-4-sulfanylidenepyrimidin-2-one Chemical compound C[C@@]1([C@H](O)[C@H](O)[C@@H](CO)O1)N1C(=O)NC(=S)C=C1 YLCCMFLPRRFRJT-VPCXQMTMSA-N 0.000 description 1
- NOLVLJWEGBKCIN-VPCXQMTMSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)-2-methyloxolan-2-yl]-2-sulfanylidenepyrimidin-4-one Chemical compound C1=CC(=O)NC(=S)N1[C@]1(C)O[C@H](CO)[C@@H](O)[C@H]1O NOLVLJWEGBKCIN-VPCXQMTMSA-N 0.000 description 1
- KYEKLQMDNZPEFU-KVTDHHQDSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1,3,5-triazine-2,4-dione Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)N=C1 KYEKLQMDNZPEFU-KVTDHHQDSA-N 0.000 description 1
- UTQUILVPBZEHTK-ZOQUXTDFSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-3-methylpyrimidine-2,4-dione Chemical compound O=C1N(C)C(=O)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 UTQUILVPBZEHTK-ZOQUXTDFSA-N 0.000 description 1
- GFYLSDSUCHVORB-IOSLPCCCSA-N 1-methyladenosine Chemical compound C1=NC=2C(=N)N(C)C=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O GFYLSDSUCHVORB-IOSLPCCCSA-N 0.000 description 1
- UTAIYTHAJQNQDW-KQYNXXCUSA-N 1-methylguanosine Chemical compound C1=NC=2C(=O)N(C)C(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O UTAIYTHAJQNQDW-KQYNXXCUSA-N 0.000 description 1
- WJNGQIYEQLPJMN-IOSLPCCCSA-N 1-methylinosine Chemical compound C1=NC=2C(=O)N(C)C=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O WJNGQIYEQLPJMN-IOSLPCCCSA-N 0.000 description 1
- UVBYMVOUBXYSFV-XUTVFYLZSA-N 1-methylpseudouridine Chemical compound O=C1NC(=O)N(C)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 UVBYMVOUBXYSFV-XUTVFYLZSA-N 0.000 description 1
- UVBYMVOUBXYSFV-UHFFFAOYSA-N 1-methylpseudouridine Natural products O=C1NC(=O)N(C)C=C1C1C(O)C(O)C(CO)O1 UVBYMVOUBXYSFV-UHFFFAOYSA-N 0.000 description 1
- JCNGYIGHEUKAHK-DWJKKKFUSA-N 2-Thio-1-methyl-1-deazapseudouridine Chemical compound CC1C=C(C(=O)NC1=S)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O JCNGYIGHEUKAHK-DWJKKKFUSA-N 0.000 description 1
- BVLGKOVALHRKNM-XUTVFYLZSA-N 2-Thio-1-methylpseudouridine Chemical compound CN1C=C(C(=O)NC1=S)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O BVLGKOVALHRKNM-XUTVFYLZSA-N 0.000 description 1
- MPDKOGQMQLSNOF-GBNDHIKLSA-N 2-amino-5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1h-pyrimidin-6-one Chemical compound O=C1NC(N)=NC=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 MPDKOGQMQLSNOF-GBNDHIKLSA-N 0.000 description 1
- JRYMOPZHXMVHTA-DAGMQNCNSA-N 2-amino-7-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1h-pyrrolo[2,3-d]pyrimidin-4-one Chemical compound C1=CC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O JRYMOPZHXMVHTA-DAGMQNCNSA-N 0.000 description 1
- OTDJAMXESTUWLO-UUOKFMHZSA-N 2-amino-9-[(2R,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)-2-oxolanyl]-3H-purine-6-thione Chemical compound C12=NC(N)=NC(S)=C2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OTDJAMXESTUWLO-UUOKFMHZSA-N 0.000 description 1
- IBKZHHCJWDWGAJ-FJGDRVTGSA-N 2-amino-9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1-methylpurine-6-thione Chemical compound C1=NC=2C(=S)N(C)C(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O IBKZHHCJWDWGAJ-FJGDRVTGSA-N 0.000 description 1
- MWBWWFOAEOYUST-UHFFFAOYSA-N 2-aminopurine Chemical compound NC1=NC=C2N=CNC2=N1 MWBWWFOAEOYUST-UHFFFAOYSA-N 0.000 description 1
- BFSVOASYOCHEOV-UHFFFAOYSA-N 2-diethylaminoethanol Chemical compound CCN(CC)CCO BFSVOASYOCHEOV-UHFFFAOYSA-N 0.000 description 1
- RLZMYTZDQAVNIN-ZOQUXTDFSA-N 2-methoxy-4-thio-uridine Chemical compound COC1=NC(=S)C=CN1[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O RLZMYTZDQAVNIN-ZOQUXTDFSA-N 0.000 description 1
- QCPQCJVQJKOKMS-VLSMUFELSA-N 2-methoxy-5-methyl-cytidine Chemical compound CC(C(N)=N1)=CN([C@@H]([C@@H]2O)O[C@H](CO)[C@H]2O)C1OC QCPQCJVQJKOKMS-VLSMUFELSA-N 0.000 description 1
- STISOQJGVFEOFJ-MEVVYUPBSA-N 2-methoxy-cytidine Chemical compound COC(N([C@@H]([C@@H]1O)O[C@H](CO)[C@H]1O)C=C1)N=C1N STISOQJGVFEOFJ-MEVVYUPBSA-N 0.000 description 1
- WBVPJIKOWUQTSD-ZOQUXTDFSA-N 2-methoxyuridine Chemical compound COC1=NC(=O)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 WBVPJIKOWUQTSD-ZOQUXTDFSA-N 0.000 description 1
- FXGXEFXCWDTSQK-UHFFFAOYSA-N 2-methylsulfanyl-7h-purin-6-amine Chemical compound CSC1=NC(N)=C2NC=NC2=N1 FXGXEFXCWDTSQK-UHFFFAOYSA-N 0.000 description 1
- QEWSGVMSLPHELX-UHFFFAOYSA-N 2-methylthio-N6-(cis-hydroxyisopentenyl) adenosine Chemical compound C12=NC(SC)=NC(NCC=C(C)CO)=C2N=CN1C1OC(CO)C(O)C1O QEWSGVMSLPHELX-UHFFFAOYSA-N 0.000 description 1
- JUMHLCXWYQVTLL-KVTDHHQDSA-N 2-thio-5-aza-uridine Chemical compound [C@@H]1([C@H](O)[C@H](O)[C@@H](CO)O1)N1C(=S)NC(=O)N=C1 JUMHLCXWYQVTLL-KVTDHHQDSA-N 0.000 description 1
- GJTBSTBJLVYKAU-XVFCMESISA-N 2-thiouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=S)NC(=O)C=C1 GJTBSTBJLVYKAU-XVFCMESISA-N 0.000 description 1
- RDPUKVRQKWBSPK-UHFFFAOYSA-N 3-Methylcytidine Natural products O=C1N(C)C(=N)C=CN1C1C(O)C(O)C(CO)O1 RDPUKVRQKWBSPK-UHFFFAOYSA-N 0.000 description 1
- UTQUILVPBZEHTK-UHFFFAOYSA-N 3-Methyluridine Natural products O=C1N(C)C(=O)C=CN1C1C(O)C(O)C(CO)O1 UTQUILVPBZEHTK-UHFFFAOYSA-N 0.000 description 1
- RDPUKVRQKWBSPK-ZOQUXTDFSA-N 3-methylcytidine Chemical compound O=C1N(C)C(=N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 RDPUKVRQKWBSPK-ZOQUXTDFSA-N 0.000 description 1
- ZSIINYPBPQCZKU-BQNZPOLKSA-O 4-Methoxy-1-methylpseudoisocytidine Chemical compound C[N+](CC1[C@H]([C@H]2O)O[C@@H](CO)[C@@H]2O)=C(N)N=C1OC ZSIINYPBPQCZKU-BQNZPOLKSA-O 0.000 description 1
- FGFVODMBKZRMMW-XUTVFYLZSA-N 4-Methoxy-2-thiopseudouridine Chemical compound COC1=C(C=NC(=S)N1)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O FGFVODMBKZRMMW-XUTVFYLZSA-N 0.000 description 1
- HOCJTJWYMOSXMU-XUTVFYLZSA-N 4-Methoxypseudouridine Chemical compound COC1=C(C=NC(=O)N1)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O HOCJTJWYMOSXMU-XUTVFYLZSA-N 0.000 description 1
- VTGBLFNEDHVUQA-XUTVFYLZSA-N 4-Thio-1-methyl-pseudouridine Chemical compound S=C1NC(=O)N(C)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 VTGBLFNEDHVUQA-XUTVFYLZSA-N 0.000 description 1
- DMUQOPXCCOBPID-XUTVFYLZSA-N 4-Thio-1-methylpseudoisocytidine Chemical compound CN1C=C(C(=S)N=C1N)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O DMUQOPXCCOBPID-XUTVFYLZSA-N 0.000 description 1
- DUJGMZAICVPCBJ-VDAHYXPESA-N 4-amino-1-[(1r,4r,5s)-4,5-dihydroxy-3-(hydroxymethyl)cyclopent-2-en-1-yl]pyrimidin-2-one Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)C(CO)=C1 DUJGMZAICVPCBJ-VDAHYXPESA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- OZHIJZYBTCTDQC-JXOAFFINSA-N 4-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-methylpyrimidine-2-thione Chemical compound S=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 OZHIJZYBTCTDQC-JXOAFFINSA-N 0.000 description 1
- GCNTZFIIOFTKIY-UHFFFAOYSA-N 4-hydroxypyridine Chemical compound OC1=CC=NC=C1 GCNTZFIIOFTKIY-UHFFFAOYSA-N 0.000 description 1
- LOICBOXHPCURMU-UHFFFAOYSA-N 4-methoxy-pseudoisocytidine Chemical compound COC1NC(N)=NC=C1C(C1O)OC(CO)C1O LOICBOXHPCURMU-UHFFFAOYSA-N 0.000 description 1
- SJVVKUMXGIKAAI-UHFFFAOYSA-N 4-thio-pseudoisocytidine Chemical compound NC(N1)=NC=C(C(C2O)OC(CO)C2O)C1=S SJVVKUMXGIKAAI-UHFFFAOYSA-N 0.000 description 1
- FAWQJBLSWXIJLA-VPCXQMTMSA-N 5-(carboxymethyl)uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(CC(O)=O)=C1 FAWQJBLSWXIJLA-VPCXQMTMSA-N 0.000 description 1
- NFEXJLMYXXIWPI-JXOAFFINSA-N 5-Hydroxymethylcytidine Chemical compound C1=C(CO)C(N)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NFEXJLMYXXIWPI-JXOAFFINSA-N 0.000 description 1
- ZAYHVCMSTBRABG-UHFFFAOYSA-N 5-Methylcytidine Natural products O=C1N=C(N)C(C)=CN1C1C(O)C(O)C(CO)O1 ZAYHVCMSTBRABG-UHFFFAOYSA-N 0.000 description 1
- YGQPDXVAXCRTCZ-BPCTXRNPSA-N 5-[(2S,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)-2-methyloxolan-2-yl]-2,4-dioxopyrimidine-1-carboxylic acid Chemical compound C(=O)(O)N1C=C([C@]2([C@H](O)[C@H](O)[C@@H](CO)O2)C)C(NC1=O)=O YGQPDXVAXCRTCZ-BPCTXRNPSA-N 0.000 description 1
- ITGWEVGJUSMCEA-KYXWUPHJSA-N 5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1-prop-1-ynylpyrimidine-2,4-dione Chemical compound O=C1NC(=O)N(C#CC)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ITGWEVGJUSMCEA-KYXWUPHJSA-N 0.000 description 1
- DDHOXEOVAJVODV-GBNDHIKLSA-N 5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-sulfanylidene-1h-pyrimidin-4-one Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=S)NC1=O DDHOXEOVAJVODV-GBNDHIKLSA-N 0.000 description 1
- BNAWMJKJLNJZFU-GBNDHIKLSA-N 5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-4-sulfanylidene-1h-pyrimidin-2-one Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=S BNAWMJKJLNJZFU-GBNDHIKLSA-N 0.000 description 1
- XAUDJQYHKZQPEU-KVQBGUIXSA-N 5-aza-2'-deoxycytidine Chemical compound O=C1N=C(N)N=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 XAUDJQYHKZQPEU-KVQBGUIXSA-N 0.000 description 1
- OSLBPVOJTCDNEF-DBRKOABJSA-N 5-aza-zebularine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)N=CN=C1 OSLBPVOJTCDNEF-DBRKOABJSA-N 0.000 description 1
- DHMYGZIEILLVNR-UHFFFAOYSA-N 5-fluoro-1-(oxolan-2-yl)pyrimidine-2,4-dione;1h-pyrimidine-2,4-dione Chemical compound O=C1C=CNC(=O)N1.O=C1NC(=O)C(F)=CN1C1OCCC1 DHMYGZIEILLVNR-UHFFFAOYSA-N 0.000 description 1
- ZAYHVCMSTBRABG-JXOAFFINSA-N 5-methylcytidine Chemical compound O=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZAYHVCMSTBRABG-JXOAFFINSA-N 0.000 description 1
- CBNRZZNSRJQZNT-IOSLPCCCSA-O 6-thio-7-deaza-guanosine Chemical compound CC1=C[NH+]([C@@H]([C@@H]2O)O[C@H](CO)[C@H]2O)C(NC(N)=N2)=C1C2=S CBNRZZNSRJQZNT-IOSLPCCCSA-O 0.000 description 1
- RFHIWBUKNJIBSE-KQYNXXCUSA-O 6-thio-7-methyl-guanosine Chemical compound C1=2NC(N)=NC(=S)C=2N(C)C=[N+]1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O RFHIWBUKNJIBSE-KQYNXXCUSA-O 0.000 description 1
- MJJUWOIBPREHRU-MWKIOEHESA-N 7-Deaza-8-azaguanosine Chemical compound NC=1NC(C2=C(N=1)N(N=C2)[C@H]1[C@H](O)[C@H](O)[C@H](O1)CO)=O MJJUWOIBPREHRU-MWKIOEHESA-N 0.000 description 1
- OGHAROSJZRTIOK-KQYNXXCUSA-O 7-methylguanosine Chemical compound C1=2N=C(N)NC(=O)C=2[N+](C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OGHAROSJZRTIOK-KQYNXXCUSA-O 0.000 description 1
- VJNXUFOTKNTNPG-IOSLPCCCSA-O 7-methylinosine Chemical compound C1=2NC=NC(=O)C=2N(C)C=[N+]1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VJNXUFOTKNTNPG-IOSLPCCCSA-O 0.000 description 1
- ABXGJJVKZAAEDH-IOSLPCCCSA-N 9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-(dimethylamino)-3h-purine-6-thione Chemical compound C1=NC=2C(=S)NC(N(C)C)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O ABXGJJVKZAAEDH-IOSLPCCCSA-N 0.000 description 1
- ADPMAYFIIFNDMT-KQYNXXCUSA-N 9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-(methylamino)-3h-purine-6-thione Chemical compound C1=NC=2C(=S)NC(NC)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O ADPMAYFIIFNDMT-KQYNXXCUSA-N 0.000 description 1
- MSSXOMSJDRHRMC-UHFFFAOYSA-N 9H-purine-2,6-diamine Chemical compound NC1=NC(N)=C2NC=NC2=N1 MSSXOMSJDRHRMC-UHFFFAOYSA-N 0.000 description 1
- 101000860090 Acidaminococcus sp. (strain BV3L6) CRISPR-associated endonuclease Cas12a Proteins 0.000 description 1
- 241001655883 Adeno-associated virus - 1 Species 0.000 description 1
- 241000702423 Adeno-associated virus - 2 Species 0.000 description 1
- 241000202702 Adeno-associated virus - 3 Species 0.000 description 1
- 241000580270 Adeno-associated virus - 4 Species 0.000 description 1
- 241001634120 Adeno-associated virus - 5 Species 0.000 description 1
- 241000972680 Adeno-associated virus - 6 Species 0.000 description 1
- 241001164823 Adeno-associated virus - 7 Species 0.000 description 1
- 241001164825 Adeno-associated virus - 8 Species 0.000 description 1
- 241000649046 Adeno-associated virus 11 Species 0.000 description 1
- 241000649047 Adeno-associated virus 12 Species 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 239000000592 Artificial Cell Substances 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- ZXPLPIVCTNFHBZ-RDNIYVIKSA-N CC#CC([C@@H]([C@@H]1O)O[C@H](CO)[C@H]1O)(C=NC(N1)=O)C1=O Chemical compound CC#CC([C@@H]([C@@H]1O)O[C@H](CO)[C@H]1O)(C=NC(N1)=O)C1=O ZXPLPIVCTNFHBZ-RDNIYVIKSA-N 0.000 description 1
- 108091079001 CRISPR RNA Proteins 0.000 description 1
- 238000010453 CRISPR/Cas method Methods 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- ZAMOUSCENKQFHK-UHFFFAOYSA-N Chlorine atom Chemical compound [Cl] ZAMOUSCENKQFHK-UHFFFAOYSA-N 0.000 description 1
- PTOAARAWEBMLNO-KVQBGUIXSA-N Cladribine Chemical compound C1=NC=2C(N)=NC(Cl)=NC=2N1[C@H]1C[C@H](O)[C@@H](CO)O1 PTOAARAWEBMLNO-KVQBGUIXSA-N 0.000 description 1
- 241000252212 Danio rerio Species 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- YKWUPFSEFXSGRT-JWMKEVCDSA-N Dihydropseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1C(=O)NC(=O)NC1 YKWUPFSEFXSGRT-JWMKEVCDSA-N 0.000 description 1
- GZDFHIJNHHMENY-UHFFFAOYSA-N Dimethyl dicarbonate Chemical compound COC(=O)OC(=O)OC GZDFHIJNHHMENY-UHFFFAOYSA-N 0.000 description 1
- 102100029791 Double-stranded RNA-specific adenosine deaminase Human genes 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- PXGOKWXKJXAPGV-UHFFFAOYSA-N Fluorine Chemical compound FF PXGOKWXKJXAPGV-UHFFFAOYSA-N 0.000 description 1
- GHASVSINZRGABV-UHFFFAOYSA-N Fluorouracil Chemical compound FC1=CNC(=O)NC1=O GHASVSINZRGABV-UHFFFAOYSA-N 0.000 description 1
- 101000860092 Francisella tularensis subsp. novicida (strain U112) CRISPR-associated endonuclease Cas12a Proteins 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 1
- 208000017604 Hodgkin disease Diseases 0.000 description 1
- 208000021519 Hodgkin lymphoma Diseases 0.000 description 1
- 208000010747 Hodgkins lymphoma Diseases 0.000 description 1
- 101000865408 Homo sapiens Double-stranded RNA-specific adenosine deaminase Proteins 0.000 description 1
- 101001057504 Homo sapiens Interferon-stimulated gene 20 kDa protein Proteins 0.000 description 1
- 101001055144 Homo sapiens Interleukin-2 receptor subunit alpha Proteins 0.000 description 1
- 101000914514 Homo sapiens T-cell-specific surface glycoprotein CD28 Proteins 0.000 description 1
- 102100027268 Interferon-stimulated gene 20 kDa protein Human genes 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 108700018351 Major Histocompatibility Complex Proteins 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- RSPURTUNRHNVGF-IOSLPCCCSA-N N(2),N(2)-dimethylguanosine Chemical compound C1=NC=2C(=O)NC(N(C)C)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O RSPURTUNRHNVGF-IOSLPCCCSA-N 0.000 description 1
- SLEHROROQDYRAW-KQYNXXCUSA-N N(2)-methylguanosine Chemical compound C1=NC=2C(=O)NC(NC)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O SLEHROROQDYRAW-KQYNXXCUSA-N 0.000 description 1
- NIDVTARKFBZMOT-PEBGCTIMSA-N N(4)-acetylcytidine Chemical compound O=C1N=C(NC(=O)C)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NIDVTARKFBZMOT-PEBGCTIMSA-N 0.000 description 1
- WVGPGNPCZPYCLK-WOUKDFQISA-N N(6),N(6)-dimethyladenosine Chemical compound C1=NC=2C(N(C)C)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O WVGPGNPCZPYCLK-WOUKDFQISA-N 0.000 description 1
- USVMJSALORZVDV-SDBHATRESA-N N(6)-(Delta(2)-isopentenyl)adenosine Chemical compound C1=NC=2C(NCC=C(C)C)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O USVMJSALORZVDV-SDBHATRESA-N 0.000 description 1
- VQAYFKKCNSOZKM-IOSLPCCCSA-N N(6)-methyladenosine Chemical compound C1=NC=2C(NC)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VQAYFKKCNSOZKM-IOSLPCCCSA-N 0.000 description 1
- WVGPGNPCZPYCLK-UHFFFAOYSA-N N-Dimethyladenosine Natural products C1=NC=2C(N(C)C)=NC=NC=2N1C1OC(CO)C(O)C1O WVGPGNPCZPYCLK-UHFFFAOYSA-N 0.000 description 1
- LZCNWAXLJWBRJE-ZOQUXTDFSA-N N4-Methylcytidine Chemical compound O=C1N=C(NC)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 LZCNWAXLJWBRJE-ZOQUXTDFSA-N 0.000 description 1
- GOSWTRUMMSCNCW-UHFFFAOYSA-N N6-(cis-hydroxyisopentenyl)adenosine Chemical compound C1=NC=2C(NCC=C(CO)C)=NC=NC=2N1C1OC(CO)C(O)C1O GOSWTRUMMSCNCW-UHFFFAOYSA-N 0.000 description 1
- VQAYFKKCNSOZKM-UHFFFAOYSA-N NSC 29409 Natural products C1=NC=2C(NC)=NC=NC=2N1C1OC(CO)C(O)C1O VQAYFKKCNSOZKM-UHFFFAOYSA-N 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 241000009328 Perro Species 0.000 description 1
- ABLZXFCXXLZCGV-UHFFFAOYSA-N Phosphorous acid Chemical class OP(O)=O ABLZXFCXXLZCGV-UHFFFAOYSA-N 0.000 description 1
- 229920002873 Polyethylenimine Polymers 0.000 description 1
- 229930185560 Pseudouridine Natural products 0.000 description 1
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 238000010357 RNA editing Methods 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 241000235343 Saccharomycetales Species 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 102100027213 T-cell-specific surface glycoprotein CD28 Human genes 0.000 description 1
- XOAAWQZATWQOTB-UHFFFAOYSA-N Taurine Natural products NCCS(O)(=O)=O XOAAWQZATWQOTB-UHFFFAOYSA-N 0.000 description 1
- WFWLQNSHRPWKFK-UHFFFAOYSA-N Tegafur Chemical compound O=C1NC(=O)C(F)=CN1C1OCCC1 WFWLQNSHRPWKFK-UHFFFAOYSA-N 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 108020000999 Viral RNA Proteins 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- JCZSFCLRSONYLH-UHFFFAOYSA-N Wyosine Natural products N=1C(C)=CN(C(C=2N=C3)=O)C=1N(C)C=2N3C1OC(CO)C(O)C1O JCZSFCLRSONYLH-UHFFFAOYSA-N 0.000 description 1
- 241000269368 Xenopus laevis Species 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 125000000217 alkyl group Chemical group 0.000 description 1
- 125000005600 alkyl phosphonate group Chemical group 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 239000008135 aqueous vehicle Substances 0.000 description 1
- 230000006217 arginine-methylation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 125000004429 atom Chemical group 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 210000003651 basophil Anatomy 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 1
- 230000001588 bifunctional effect Effects 0.000 description 1
- 229920002988 biodegradable polymer Polymers 0.000 description 1
- 239000004621 biodegradable polymer Substances 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 210000001772 blood platelet Anatomy 0.000 description 1
- 210000000746 body region Anatomy 0.000 description 1
- 229910000085 borane Inorganic materials 0.000 description 1
- 210000004413 cardiac myocyte Anatomy 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 230000009920 chelation Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 1
- 239000000460 chlorine Substances 0.000 description 1
- 229910052801 chlorine Inorganic materials 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 230000008711 chromosomal rearrangement Effects 0.000 description 1
- 229960002436 cladribine Drugs 0.000 description 1
- 238000003501 co-culture Methods 0.000 description 1
- 238000010668 complexation reaction Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 229960000684 cytarabine Drugs 0.000 description 1
- 230000003013 cytotoxicity Effects 0.000 description 1
- 231100000135 cytotoxicity Toxicity 0.000 description 1
- 229960003603 decitabine Drugs 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- ZPTBLXKRQACLCR-XVFCMESISA-N dihydrouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)CC1 ZPTBLXKRQACLCR-XVFCMESISA-N 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 235000010300 dimethyl dicarbonate Nutrition 0.000 description 1
- 239000002552 dosage form Substances 0.000 description 1
- 230000005782 double-strand break Effects 0.000 description 1
- 239000003937 drug carrier Substances 0.000 description 1
- 210000003979 eosinophil Anatomy 0.000 description 1
- 210000001339 epidermal cell Anatomy 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 210000003743 erythrocyte Anatomy 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 210000001808 exosome Anatomy 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000000684 flow cytometry Methods 0.000 description 1
- 229960000390 fludarabine Drugs 0.000 description 1
- 229960005304 fludarabine phosphate Drugs 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 229910052731 fluorine Inorganic materials 0.000 description 1
- 239000011737 fluorine Substances 0.000 description 1
- 229960002949 fluorouracil Drugs 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 238000001641 gel filtration chromatography Methods 0.000 description 1
- 229960005277 gemcitabine Drugs 0.000 description 1
- SDUQYLNIPVEERB-QPPQHZFASA-N gemcitabine Chemical compound O=C1N=C(N)C=CN1[C@H]1C(F)(F)[C@H](O)[C@@H](CO)O1 SDUQYLNIPVEERB-QPPQHZFASA-N 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 229960002989 glutamic acid Drugs 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 125000005843 halogen group Chemical group 0.000 description 1
- 210000003494 hepatocyte Anatomy 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 238000003018 immunoassay Methods 0.000 description 1
- 238000002513 implantation Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 210000005007 innate immune system Anatomy 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000000968 intestinal effect Effects 0.000 description 1
- 238000001990 intravenous administration Methods 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 239000003456 ion exchange resin Substances 0.000 description 1
- 229920003303 ion-exchange polymer Polymers 0.000 description 1
- 238000011005 laboratory method Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 210000005229 liver cell Anatomy 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 230000006216 lysine-methylation Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 229960001428 mercaptopurine Drugs 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000010172 mouse model Methods 0.000 description 1
- 210000000663 muscle cell Anatomy 0.000 description 1
- 210000000107 myocyte Anatomy 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 230000009635 nitrosylation Effects 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 239000000346 nonvolatile oil Substances 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- 230000009437 off-target effect Effects 0.000 description 1
- 210000000287 oocyte Anatomy 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 210000000963 osteoblast Anatomy 0.000 description 1
- 210000002997 osteoclast Anatomy 0.000 description 1
- 210000004409 osteocyte Anatomy 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 125000004430 oxygen atom Chemical group O* 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- XRBCRPZXSCBRTK-UHFFFAOYSA-N phosphonous acid Chemical class OPO XRBCRPZXSCBRTK-UHFFFAOYSA-N 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 210000001778 pluripotent stem cell Anatomy 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 235000013856 polydextrose Nutrition 0.000 description 1
- 229920002704 polyhistidine Polymers 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 230000002335 preservative effect Effects 0.000 description 1
- 201000006037 primary mediastinal B-cell lymphoma Diseases 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 1
- 230000002685 pulmonary effect Effects 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
- 239000002718 pyrimidine nucleoside Substances 0.000 description 1
- 150000003230 pyrimidines Chemical class 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 238000003127 radioimmunoassay Methods 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000002342 ribonucleoside Substances 0.000 description 1
- DWRXFEITVBNRMK-JXOAFFINSA-N ribothymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 DWRXFEITVBNRMK-JXOAFFINSA-N 0.000 description 1
- JRPHGDYSKGJTKZ-UHFFFAOYSA-N selenophosphoric acid Chemical compound OP(O)([SeH])=O JRPHGDYSKGJTKZ-UHFFFAOYSA-N 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000005783 single-strand break Effects 0.000 description 1
- 210000002363 skeletal muscle cell Anatomy 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 239000008223 sterile water Substances 0.000 description 1
- 125000001424 substituent group Chemical group 0.000 description 1
- 125000000547 substituted alkyl group Chemical group 0.000 description 1
- 208000011580 syndromic disease Diseases 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- GFFXZLZWLOBBLO-ASKVSEFXSA-N tezacitabine Chemical compound O=C1N=C(N)C=CN1[C@H]1C(=C/F)/[C@H](O)[C@@H](CO)O1 GFFXZLZWLOBBLO-ASKVSEFXSA-N 0.000 description 1
- 229950006410 tezacitabine Drugs 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 125000003396 thiol group Chemical group [H]S* 0.000 description 1
- 150000003573 thiols Chemical class 0.000 description 1
- 239000005450 thionucleoside Substances 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
- 210000003014 totipotent stem cell Anatomy 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- UORVGPXVDQYIDP-UHFFFAOYSA-N trihydridoboron Substances B UORVGPXVDQYIDP-UHFFFAOYSA-N 0.000 description 1
- RXRGZNYSEHTMHC-BQBZGAKWSA-N troxacitabine Chemical compound O=C1N=C(N)C=CN1[C@H]1O[C@@H](CO)OC1 RXRGZNYSEHTMHC-BQBZGAKWSA-N 0.000 description 1
- 229950010147 troxacitabine Drugs 0.000 description 1
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 210000002444 unipotent stem cell Anatomy 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 238000009736 wetting Methods 0.000 description 1
- 239000000080 wetting agent Substances 0.000 description 1
- QAOHCFGKCWTBGC-QHOAOGIMSA-N wybutosine Chemical compound C1=NC=2C(=O)N3C(CC[C@H](NC(=O)OC)C(=O)OC)=C(C)N=C3N(C)C=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O QAOHCFGKCWTBGC-QHOAOGIMSA-N 0.000 description 1
- QAOHCFGKCWTBGC-UHFFFAOYSA-N wybutosine Natural products C1=NC=2C(=O)N3C(CCC(NC(=O)OC)C(=O)OC)=C(C)N=C3N(C)C=2N1C1OC(CO)C(O)C1O QAOHCFGKCWTBGC-UHFFFAOYSA-N 0.000 description 1
- JCZSFCLRSONYLH-QYVSTXNMSA-N wyosin Chemical compound N=1C(C)=CN(C(C=2N=C3)=O)C=1N(C)C=2N3[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O JCZSFCLRSONYLH-QYVSTXNMSA-N 0.000 description 1
- RPQZTTQVRYEKCR-WCTZXXKLSA-N zebularine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)N=CC=C1 RPQZTTQVRYEKCR-WCTZXXKLSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Organic Chemistry (AREA)
- Molecular Biology (AREA)
- Chemical & Material Sciences (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Zoology (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Cell Biology (AREA)
- Mycology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Abstract
本發明係關於包含靶向CIITA之RNA引導之組合物、用於表徵該等組合物之方法、包含該等組合物之細胞及使用該等組合物之方法。
Description
成簇性規律間隔短迴文重複序列(Clustered Regularly Interspaced Short Palindromic Repeat;CRISPR)及CRISPR相關(Cas)基因統稱為CRISPR-Cas或CRISPR/Cas系統,為古菌(archaea)及細菌中保護特定物種抵禦外來基因元件之後天性免疫系統。
在上述背景下,本發明提供優於先前技術之某些優點及進展。儘管本文揭示之本發明不限於特定優點或功能性,但本發明提供一種包含RNA引導之組合物,其中該RNA引導包含(i)與CIITA基因內之目標序列實質上互補的間隔子序列及(ii)正向重複序列;其中該目標序列與包含序列5'-NTTN-3'之原間隔序列相鄰模體(protospacer adjacent motif;PAM)相鄰。
本發明至少部分地係基於用於基因編輯II類主要組織相容複合體反式活化因子(Class II Major Histocompatibility Complex Transactivator;CIITA)基因之系統的發展。該系統可包含Cas12i CRISPR核酸酶多肽(例如Cas12i2 CRISPR核酸酶多肽)及介導在CIITA基因內之遺傳位點由CRISPR核酸酶多肽裂解的RNA引導。如本文所報導,本文揭示之基因編輯系統已達成以高編輯效率成功編輯CIITA基因。
因此,本文提供用於編輯CIITA基因之基因編輯系統、包含此類之醫藥組合物或套組、使用基因編輯系統以產生基改細胞之方法以及由此產生之所得細胞。本文亦提供本文揭示之基因編輯系統、包含此類之醫藥組合物及套組及/或由此產生之基改細胞之用途,其用於治療個體。
在一些態樣中,本發明特徵為用於基因編輯CIITA基因之系統,其包含(i)Cas12i多肽或編碼Cas12i多肽之第一核酸,及(ii) RNA引導或編碼RNA引導之核酸。RNA引導包含對CIITA基因內之目標序列具有特異性之間隔子序列,該目標序列與包含5'-NTTN-3'之模體的原間隔序列相鄰模體(PAM)相鄰,該模體位於目標序列之非目標股的5'。
在一些態樣中,本發明特徵為包含RNA引導之組合物,其中該RNA引導包含:(i)特異性結合CIITA基因內之目標序列的間隔子序列,其中目標序列包含SEQ ID NO: 1163-1177中之任一者;及(ii)正向重複序列。
在一些態樣中,本發明特徵為包含RNA引導之組合物,其中該RNA引導包含:(i)特異性結合CIITA基因內之目標序列的間隔子序列,其中目標序列包含SEQ ID NO: 1163、1166、1167、1173或1175中之任一者;及(ii)正向重複序列。
在一些態樣中,本發明特徵為包含RNA引導之組合物,其中該RNA引導包含:(i)與SEQ ID NO: 1207-1221中之任一者之序列至少90%一致的間隔子序列;及(ii)正向重複序列。
在一些態樣中,本發明特徵為包含RNA引導之組合物,其中該RNA引導包含:(i)與SEQ ID NO: 1207、1210、1211、1217或1219中之任一者之序列至少90%一致的間隔子序列;及(ii)正向重複序列。
在組合物之一個態樣中,目標序列係在以下內:CIITA基因之外顯子1、外顯子2、外顯子3、外顯子4、外顯子5、外顯子6、外顯子7、外顯子8、外顯子9、外顯子10、外顯子11、外顯子12、外顯子13、外顯子14、外顯子15、外顯子16、外顯子17、外顯子18、外顯子19、外顯子20、外顯子21、外顯子22、內含子1、內含子2、內含子3、內含子4、內含子5、內含子6、內含子7、內含子8、內含子9、內含子10、內含子11、內含子12、內含子13、內含子14、內含子15、內含子16、內含子17、內含子18、內含子19、內含子20或內含子21。
在組合物之另一態樣中,CIITA基因包含www.ncbi.nlm.nih.gov/gene/4261中所闡述之序列(其截至2021年11月5日,以引用的方式併入本文中)、其反向互補序列、其變體或其變體之反向互補序列。
在一些實施例中,間隔子序列之長度在15-30個核苷酸之間或在20-30個核苷酸之間。在一些實施例中,正向重複序列之長度在15-40或23-36個核苷酸之間。在一些實施例中,正向重複序列為Cas12i1正向重複序列、Cas12i2正向重複序列、Cas12i3正向重複序列或Cas12i4正向重複序列。
在組合物之另一態樣中,間隔子序列包含:a.與SEQ ID NO: 472-932或1018-1102中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸16;b.與SEQ ID NO: 472-932或1018-1102中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸17;c.與SEQ ID NO: 472-932或1018-1102中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸18;d.與SEQ ID NO: 472-932或1018-1102中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸19;e.與SEQ ID NO: 472-932或1018-1102中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸20;f.與SEQ ID NO: 472-932中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸21;g.與SEQ ID NO: 472-932中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸22;h.與SEQ ID NO: 472-932中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸23;i.與SEQ ID NO: 472-932中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸24;j.與SEQ ID NO: 472-932中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸25;k.與SEQ ID NO: 472-932中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸26;l.與SEQ ID NO: 472-932中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸27;m.與SEQ ID NO: 472-932中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸28;n.與SEQ ID NO: 472-932中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸29;或o.與SEQ ID NO: 472-932中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸30。
在一些實施例中,間隔子序列包含:a.與SEQ ID NO: 752、815、802、821及824中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸16;b.與SEQ ID NO: 752、815、802、821及824中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸17;c.與SEQ ID NO: 752、815、802、821及824中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸18;d.與SEQ ID NO: 752、815、802、821及824中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸19;或e.與SEQ ID NO: 752、815、802、821及824中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸20。在一些實施例中,間隔子序列包含:a. SEQ ID NO: 752、815、802、821及824中之任一者的核苷酸1至核苷酸16;b. SEQ ID NO: 752、815、802、821及824中之任一者的核苷酸1至核苷酸17;c. SEQ ID NO: 752、815、802、821及824中之任一者的核苷酸1至核苷酸18;d. SEQ ID NO: 752、815、802、821及824中之任一者的核苷酸1至核苷酸19;或e. SEQ ID NO: 752、815、802、821及824中之任一者的核苷酸1至核苷酸20。
在組合物之另一態樣中,間隔子序列包含:a. SEQ ID NO: 472-932或1018-1102中之任一者的核苷酸1至核苷酸16;b. SEQ ID NO: 472-932或1018-1102中之任一者的核苷酸1至核苷酸17;c. SEQ ID NO: 472-932或1018-1102中之任一者的核苷酸1至核苷酸18;d. SEQ ID NO: 472-932或1018-1102中之任一者的核苷酸1至核苷酸19;e. SEQ ID NO: 472-932或1018-1102中之任一者的核苷酸1至核苷酸20;f. SEQ ID NO: 472-932中之任一者的核苷酸1至核苷酸21;g. SEQ ID NO: 472-932中之任一者的核苷酸1至核苷酸22;h. SEQ ID NO: 472-932中之任一者的核苷酸1至核苷酸23;i. SEQ ID NO: 472-932中之任一者的核苷酸1至核苷酸24;j. SEQ ID NO: 472-932中之任一者的核苷酸1至核苷酸25;k. SEQ ID NO: 472-932中之任一者的核苷酸1至核苷酸26;l. SEQ ID NO: 472-932中之任一者的核苷酸1至核苷酸27;m. SEQ ID NO: 472-932中之任一者的核苷酸1至核苷酸28;n. SEQ ID NO: 472-932中之任一者的核苷酸1至核苷酸29;或o. SEQ ID NO: 472-932中之任一者的核苷酸1至核苷酸30。
在組合物之另一態樣中,正向重複序列包含:a.與SEQ ID NO: 1-8中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸36;b.與SEQ ID NO: 1-8中之任一者之序列至少90%一致之序列的核苷酸2至核苷酸36;c.與SEQ ID NO: 1-8中之任一者之序列至少90%一致之序列的核苷酸3至核苷酸36;d.與SEQ ID NO: 1-8中之任一者之序列至少90%一致之序列的核苷酸4至核苷酸36;e.與SEQ ID NO: 1-8中之任一者之序列至少90%一致之序列的核苷酸5至核苷酸36;f.與SEQ ID NO: 1-8中之任一者之序列至少90%一致之序列的核苷酸6至核苷酸36;g.與SEQ ID NO: 1-8中之任一者之序列至少90%一致之序列的核苷酸7至核苷酸36;h.與SEQ ID NO: 1-8中之任一者之序列至少90%一致之序列的核苷酸8至核苷酸36;i.與SEQ ID NO: 1-8中之任一者之序列至少90%一致之序列的核苷酸9至核苷酸36;j.與SEQ ID NO: 1-8中之任一者之序列至少90%一致之序列的核苷酸10至核苷酸36;k.與SEQ ID NO: 1-8中之任一者之序列至少90%一致之序列的核苷酸11至核苷酸36;l.與SEQ ID NO: 1-8中之任一者之序列至少90%一致之序列的核苷酸12至核苷酸36;m.與SEQ ID NO: 1-8中之任一者之序列至少90%一致之序列的核苷酸13至核苷酸36;n.與SEQ ID NO: 1-8中之任一者之序列至少90%一致之序列的核苷酸14至核苷酸36;o.與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸1至核苷酸34;p.與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸2至核苷酸34;q.與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸3至核苷酸34;r.與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸4至核苷酸34;s.與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸5至核苷酸34;t.與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸6至核苷酸34;u.與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸7至核苷酸34;v.與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸8至核苷酸34;w.與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸9至核苷酸34;x.與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸10至核苷酸34;y.與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸11至核苷酸34;z.與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸12至核苷酸34;或aa.與SEQ ID NO: 10之序列或其部分至少90%一致之序列。
在組合物之另一態樣中,正向重複序列包含:a. SEQ ID NO: 1-8中之任一者之核苷酸1至核苷酸36;b. SEQ ID NO: 1-8中之任一者之核苷酸2至核苷酸36;c. SEQ ID NO: 1-8中之任一者之核苷酸3至核苷酸36;d. SEQ ID NO: 1-8中之任一者之核苷酸4至核苷酸36;e. SEQ ID NO: 1-8中之任一者之核苷酸5至核苷酸36;f. SEQ ID NO: 1-8中之任一者之核苷酸6至核苷酸36;g. SEQ ID NO: 1-8中之任一者之核苷酸7至核苷酸36;h. SEQ ID NO: 1-8中之任一者之核苷酸8至核苷酸36;i. SEQ ID NO: 1-8中之任一者之核苷酸9至核苷酸36;j. SEQ ID NO: 1-8中之任一者之核苷酸10至核苷酸36;k. SEQ ID NO: 1-8中之任一者之核苷酸11至核苷酸36;l. SEQ ID NO: 1-8中之任一者之核苷酸12至核苷酸36;m. SEQ ID NO: 1-8中之任一者之核苷酸13至核苷酸36;n. SEQ ID NO: 1-8中之任一者之核苷酸14至核苷酸36;o. SEQ ID NO: 9之核苷酸1至核苷酸34;p. SEQ ID NO: 9之核苷酸2至核苷酸34;q. SEQ ID NO: 9之核苷酸3至核苷酸34;r. SEQ ID NO: 9之核苷酸4至核苷酸34;s. SEQ ID NO: 9之核苷酸5至核苷酸34;t. SEQ ID NO: 9之核苷酸6至核苷酸34;u. SEQ ID NO: 9之核苷酸7至核苷酸34;v. SEQ ID NO: 9之核苷酸8至核苷酸34;w. SEQ ID NO: 9之核苷酸9至核苷酸34;x. SEQ ID NO: 9之核苷酸10至核苷酸34;y. SEQ ID NO: 9之核苷酸11至核苷酸34;z. SEQ ID NO: 9之核苷酸12至核苷酸34;或aa. SEQ ID NO: 10或其部分。
在組合物之另一態樣中,正向重複序列包含:a.與SEQ ID NO: 1133-1151中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸36;b.與SEQ ID NO: 1133-1151中之任一者之序列至少90%一致之序列的核苷酸2至核苷酸36;c.與SEQ ID NO: 1133-1151中之任一者之序列至少90%一致之序列的核苷酸3至核苷酸36;d.與SEQ ID NO: 1133-1151中之任一者之序列至少90%一致之序列的核苷酸4至核苷酸36;e.與SEQ ID NO: 1133-1151中之任一者之序列至少90%一致之序列的核苷酸5至核苷酸36;f.與SEQ ID NO: 1133-1151中之任一者之序列至少90%一致之序列的核苷酸6至核苷酸36;g.與SEQ ID NO: 1133-1151中之任一者之序列至少90%一致之序列的核苷酸7至核苷酸36;h.與SEQ ID NO: 1133-1151中之任一者之序列至少90%一致之序列的核苷酸8至核苷酸36;i.與SEQ ID NO: 1133-1151中之任一者之序列至少90%一致之序列的核苷酸9至核苷酸36;j.與SEQ ID NO: 1133-1151中之任一者之序列至少90%一致之序列的核苷酸10至核苷酸36;k.與SEQ ID NO: 1133-1151中之任一者之序列至少90%一致之序列的核苷酸11至核苷酸36;l.與SEQ ID NO: 1133-1151中之任一者之序列至少90%一致之序列的核苷酸12至核苷酸36;m.與SEQ ID NO: 1133-1151中之任一者之序列至少90%一致之序列的核苷酸13至核苷酸36;n.與SEQ ID NO: 1133-1151中之任一者之序列至少90%一致之序列的核苷酸14至核苷酸36;或o.與SEQ ID NO: 1133-1151中之任一者之序列或其部分至少90%一致的序列。
在組合物之另一態樣中,正向重複序列包含:a. SEQ ID NO: 1133-1151中之任一者的核苷酸1至核苷酸36;b. SEQ ID NO: 1133-1151中之任一者的核苷酸2至核苷酸36;c. SEQ ID NO: 1133-1151中之任一者的核苷酸3至核苷酸36;d. SEQ ID NO: 1133-1151中之任一者的核苷酸4至核苷酸36;e. SEQ ID NO: 1133-1151中之任一者的核苷酸5至核苷酸36;f. SEQ ID NO: 1133-1151中之任一者的核苷酸6至核苷酸36;g. SEQ ID NO: 1133-1151中之任一者的核苷酸7至核苷酸36;h. SEQ ID NO: 1133-1151中之任一者的核苷酸8至核苷酸36;i. SEQ ID NO: 1133-1151中之任一者的核苷酸9至核苷酸36;j. SEQ ID NO: 1133-1151中之任一者的核苷酸10至核苷酸36;k. SEQ ID NO: 1133-1151中之任一者的核苷酸11至核苷酸36;l. SEQ ID NO: 1133-1151中之任一者的核苷酸12至核苷酸36;m. SEQ ID NO: 1133-1151中之任一者的核苷酸13至核苷酸36;n. SEQ ID NO: 1133-1151中之任一者的核苷酸14至核苷酸36;或o. SEQ ID NO: 1133-1151中之任一者或其部分。
在組合物之另一態樣中,正向重複序列包含:a.與SEQ ID NO: 1152至少90%一致之序列的核苷酸1至核苷酸36;b.與SEQ ID NO: 1152至少90%一致之序列的核苷酸2至核苷酸36;c.與SEQ ID NO: 1152至少90%一致之序列的核苷酸3至核苷酸36;d.與SEQ ID NO: 1152至少90%一致之序列的核苷酸4至核苷酸36;e.與SEQ ID NO: 1152至少90%一致之序列的核苷酸5至核苷酸36;f.與SEQ ID NO: 1152至少90%一致之序列的核苷酸6至核苷酸36;g.與SEQ ID NO: 1152至少90%一致之序列的核苷酸7至核苷酸36;h.與SEQ ID NO: 1152至少90%一致之序列的核苷酸8至核苷酸36;i.與SEQ ID NO: 1152至少90%一致之序列的核苷酸9至核苷酸36;j.與SEQ ID NO: 1152至少90%一致之序列的核苷酸10至核苷酸36;k.與SEQ ID NO: 1152至少90%一致之序列的核苷酸11至核苷酸36;l.與SEQ ID NO: 1152至少90%一致之序列的核苷酸12至核苷酸36;m.與SEQ ID NO: 1152至少90%一致之序列的核苷酸13至核苷酸36;n.與SEQ ID NO: 1152至少90%一致之序列的核苷酸14至核苷酸36;或o.與SEQ ID NO: 1153或SEQ ID NO: 1154之序列或其部分至少90%一致的序列。
在組合物之另一態樣中,正向重複序列包含:a. SEQ ID NO: 1152之核苷酸1至核苷酸36;b. SEQ ID NO: 1152之核苷酸2至核苷酸36;c. SEQ ID NO: 1152之核苷酸3至核苷酸36;d. SEQ ID NO: 1152之核苷酸4至核苷酸36;e. SEQ ID NO: 1152之核苷酸5至核苷酸36;f. SEQ ID NO: 1152之核苷酸6至核苷酸36;g. SEQ ID NO: 1152之核苷酸7至核苷酸36;h. SEQ ID NO: 1152之核苷酸8至核苷酸36;i. SEQ ID NO: 1152之核苷酸9至核苷酸36;j. SEQ ID NO: 1152之核苷酸10至核苷酸36;k. SEQ ID NO: 1152之核苷酸11至核苷酸36;l. SEQ ID NO: 1152之核苷酸12至核苷酸36;m. SEQ ID NO: 1152之核苷酸13至核苷酸36;n. SEQ ID NO: 1152之核苷酸14至核苷酸36;或o. SEQ ID NO: 1153或SEQ ID NO: 1154或其部分。
在組合物之另一態樣中,正向重複序列包含:a.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸1至核苷酸36;b.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸2至核苷酸36;c.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸3至核苷酸36;d.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸4至核苷酸36;e.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸5至核苷酸36;f.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸6至核苷酸36;g.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸7至核苷酸36;h.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸8至核苷酸36;i.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸9至核苷酸36;j.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸10至核苷酸36;k.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸11至核苷酸36;l.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸12至核苷酸36;m.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸13至核苷酸36;n.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸14至核苷酸36;o.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸15至核苷酸36;或p.與SEQ ID NO: 1157之序列或其部分至少90%一致之序列。
在組合物之另一態樣中,正向重複序列包含:a. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸1至核苷酸36;b. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸2至核苷酸36;c. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸3至核苷酸36;d. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸4至核苷酸36;e. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸5至核苷酸36;f. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸6至核苷酸36;g. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸7至核苷酸36;h. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸8至核苷酸36;i. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸9至核苷酸36;j. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸10至核苷酸36;k. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸11至核苷酸36;l. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸12至核苷酸36;m. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸13至核苷酸36;n. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸14至核苷酸36;o. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸15至核苷酸36;或p. SEQ ID NO: 1157或其部分。
在組合物之另一態樣中,間隔子序列與SEQ ID NO: 11-471或933-1017中之任一者之序列的互補序列實質上互補。
在組合物之另一態樣中,PAM包含序列5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'。
在一些實施例中,目標序列與包含序列5'-NTTN-3'之原間隔序列相鄰模體(PAM)相鄰,其中N為任何核苷酸。在一些實施例中,目標序列緊鄰PAM序列。
在一些實施例中,PAM包含序列5'-CTTT-3',且目標序列包含SEQ ID NO: 1163。在一些實施例中,PAM包含序列5'-CTTT-3',且間隔子序列與SEQ ID NO: 1207之序列至少90%一致。在一些實施例中,PAM包含序列5'-CTTC-3',且目標序列包含SEQ ID NO: 1166、1167、1173或1175中之任一者。在一些實施例中,PAM包含序列5'-CTTC-3',且間隔子序列與SEQ ID NO: 1210、1211、1217或1219之序列至少90%一致。
在組合物之另一態樣中,RNA引導具有與SEQ ID NO: 1178-1192中之任一者之序列至少90%一致的序列。
在組合物之另一態樣中,RNA引導具有SEQ ID NO: 1178-1192中之任一者的序列。
在組合物之另一態樣中,組合物進一步包含Cas12i多肽或編碼Cas12i多肽之聚核糖核苷酸。
在組合物之另一態樣中,Cas12i多肽為:a. Cas12i2多肽,其包含與SEQ ID NO: 1104、SEQ ID NO: 1127、SEQ ID NO: 1128、SEQ ID NO: 1129、SEQ ID NO: 1130或SEQ ID NO: 1131之序列至少90%一致的序列;b. Cas12i4多肽,其包含與SEQ ID NO: 1158、SEQ ID NO: 1159或SEQ ID NO: 1160之序列至少90%一致的序列;c. Cas12i1多肽,其包含與SEQ ID NO: 1161之序列至少90%一致的序列;或d. Cas12i3多肽,其包含與SEQ ID NO: 1162之序列至少90%一致的序列。
在組合物之另一態樣中,Cas12i多肽為:a. Cas12i2多肽,其包含SEQ ID NO: 1104、SEQ ID NO: 1127、SEQ ID NO: 1128、SEQ ID NO: 1129、SEQ ID NO: 1130或SEQ ID NO: 1131之序列;b. Cas12i4多肽,其包含SEQ ID NO: 1158、SEQ ID NO: 1159或SEQ ID NO: 1160之序列;c. Cas12i1多肽,其包含SEQ ID NO: 1161之序列;或d. Cas12i3多肽,其包含SEQ ID NO: 1162之序列。
在一些實施例中,Cas12i多肽包含相對於SEQ ID NO: 1104之一或多個突變。在一些實施例中,Cas12i多肽包含相對於SEQ ID NO: 1104之一或多個突變。在一些實施例中,Cas12i多肽中之一或多個突變係在SEQ ID NO: 1104之位置D581、G624、F626、P868、I926、V1030、E1035及/或S1046。在一些實施例中,該一或多個突變為胺基酸取代,其中視情況該等胺基酸取代選自D581R、G624R、F626R、P868T、I926R、V1030G、E1035R、S1046G或其組合。在一些實施例中,Cas12i多肽包含:(i)在SEQ ID NO: 1104之位置D581、D911、I926及V1030的突變,其視情況為D581R、D911R、I926R及V1030G之胺基酸取代;(ii)在SEQ ID NO: 1104之位置D581、I926及V1030的突變,其視情況為D581R、I926R及V1030G之胺基酸取代;(iii)在SEQ ID NO: 1104之位置D581、I926、V1030及S1046的突變,其視情況為D581R、I926R、V1030G及S1046G之胺基酸取代;(iv)在SEQ ID NO: 1104之位置D581、G624、F626、I926、V1030、E1035及S1046的突變,其視情況為D581R、G624R、F626R、I926R、V1030G、E1035R及S1046G之胺基酸取代;或(v)在SEQ ID NO: 1104之位置D581、G624、F626、P868、I926、V1030、E1035及S1046的突變,其視情況為D581R、G624R、F626R、P868T、I926R、V1030G、E1035R及S1046G之胺基酸取代。
在組合物之另一態樣中,RNA引導及Cas12i多肽形成核糖核蛋白複合物。
在一些實施例中,組合物包含編碼Cas12i多肽之聚核糖核苷酸,其中視情況聚核糖核苷酸為信使RNA (mRNA)。
在組合物之另一態樣中,核糖核蛋白複合物結合目標核酸。
在組合物之另一態樣中,組合物存在於細胞內。
在組合物之另一態樣中,RNA引導及Cas12i多肽編碼於載體,例如表現載體中。在組合物之另一態樣中,RNA引導及Cas12i多肽編碼於單一載體中,或RNA引導編碼於第一載體中且Cas12i多肽編碼於第二載體中。
本發明進一步提供一種載體系統,其包含編碼本文揭示之RNA引導及Cas12i多肽之一或多種載體。在一實施例中,載體系統包含編碼本文揭示之RNA引導的第一載體及編碼Cas12i多肽的第二載體。載體可為表現載體。
在一些態樣中,本發明提供一種系統,其包含:(i)本文所描述之RNA引導或編碼RNA引導之核酸,及(ii) Cas12i多肽或編碼Cas12i多肽之核酸。在該系統之一些實施例中,Cas12i多肽為包含與以下之序列至少90%一致之序列的Cas12i2多肽:SEQ ID NO: 1104、SEQ ID NO: 1127、SEQ ID NO: 1128、SEQ ID NO: 1129、SEQ ID NO: 1130或SEQ ID NO: 1131。在該系統之一些實施例中,Cas12i多肽包含相對於SEQ ID NO: 1104之一或多個突變。在一些實施例中,Cas12i多肽中之一或多個突變係在SEQ ID NO: 1104之位置D581、G624、F626、P868、I926、V1030、E1035及/或S1046。在一些實施例中,該一或多個突變為胺基酸取代,其中視情況該等胺基酸取代選自D581R、G624R、F626R、P868T、I926R、V1030G、E1035R、S1046G或其組合。在一些實施例中,Cas12i多肽包含:(i)在SEQ ID NO: 1104之位置D581、D911、I926及V1030的突變,其視情況為D581R、D911R、I926R及V1030G之胺基酸取代;(ii)在SEQ ID NO: 1104之位置D581、I926及V1030的突變,其視情況為D581R、I926R及V1030G之胺基酸取代;(iii)在SEQ ID NO: 1104之位置D581、I926、V1030及S1046的突變,其視情況為D581R、I926R、V1030G及S1046G之胺基酸取代;(iv)在SEQ ID NO: 1104之位置D581、G624、F626、I926、V1030、E1035及S1046的突變,其視情況為D581R、G624R、F626R、I926R、V1030G、E1035R及S1046G之胺基酸取代;或(v)在SEQ ID NO: 1104之位置D581、G624、F626、P868、I926、V1030、E1035及S1046的突變,其視情況為D581R、G624R、F626R、P868T、I926R、V1030G、E1035R及S1046G之胺基酸取代。在一些實施例中,Cas12i多肽為Cas12i1多肽、Cas12i2多肽、Cas12i3多肽或Cas12i4多肽。
在一些態樣中,本發明提供一種系統,其包含含有本文所描述之組合物或系統的醫藥組合物。
本發明進一步提供一種包含RNA引導及Cas12i多肽之組合物,其中RNA引導包含(i)與CIITA基因內之目標序列實質上互補的間隔子序列及(ii)正向重複序列。
在組合物之一個態樣中,目標序列係在以下內:CIITA基因之外顯子1、外顯子2、外顯子3、外顯子4、外顯子5、外顯子6、外顯子7、外顯子8、外顯子9、外顯子10、外顯子11、外顯子12、外顯子13、外顯子14、外顯子15、外顯子16、外顯子17、外顯子18、外顯子19、外顯子20、外顯子21、外顯子22、內含子1、內含子2、內含子3、內含子4、內含子5、內含子6、內含子7、內含子8、內含子9、內含子10、內含子11、內含子12、內含子13、內含子14、內含子15、內含子16、內含子17、內含子18、內含子19、內含子20或內含子21。
在組合物之另一態樣中,CIITA基因包含在www.ncbi.nlm.nih.gov/gene/4261處闡述之序列、其反向互補序列、其變體或其變體之反向互補序列。
在組合物之另一態樣中,間隔子序列包含:a.與SEQ ID NO: 472-932或1018-1102中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸16;b.與SEQ ID NO: 472-932或1018-1102中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸17;c.與SEQ ID NO: 472-932或1018-1102中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸18;d.與SEQ ID NO: 472-932或1018-1102中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸19;e.與SEQ ID NO: 472-932或1018-1102中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸20;f.與SEQ ID NO: 472-932中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸21;g.與SEQ ID NO: 472-932中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸22;h.與SEQ ID NO: 472-932中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸23;i.與SEQ ID NO: 472-932中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸24;j.與SEQ ID NO: 472-932中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸25;k.與SEQ ID NO: 472-932中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸26;l.與SEQ ID NO: 472-932中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸27;m.與SEQ ID NO: 472-932中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸28;n.與SEQ ID NO: 472-932中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸29;或o.與SEQ ID NO: 472-932中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸30。
在組合物之另一態樣中,間隔子序列包含:a. SEQ ID NO: 472-932或1018-1102中之任一者的核苷酸1至核苷酸16;b. SEQ ID NO: 472-932或1018-1102中之任一者的核苷酸1至核苷酸17;c. SEQ ID NO: 472-932或1018-1102中之任一者的核苷酸1至核苷酸18;d. SEQ ID NO: 472-932或1018-1102中之任一者的核苷酸1至核苷酸19;e. SEQ ID NO: 472-932或1018-1102中之任一者的核苷酸1至核苷酸20;f. SEQ ID NO: 472-932中之任一者的核苷酸1至核苷酸21;g. SEQ ID NO: 472-932中之任一者的核苷酸1至核苷酸22;h. SEQ ID NO: 472-932中之任一者的核苷酸1至核苷酸23;i. SEQ ID NO: 472-932中之任一者的核苷酸1至核苷酸24;j. SEQ ID NO: 472-932中之任一者的核苷酸1至核苷酸25;k. SEQ ID NO: 472-932中之任一者的核苷酸1至核苷酸26;l. SEQ ID NO: 472-932中之任一者的核苷酸1至核苷酸27;m. SEQ ID NO: 472-932中之任一者的核苷酸1至核苷酸28;n. SEQ ID NO: 472-932中之任一者的核苷酸1至核苷酸29;或o. SEQ ID NO: 472-932中之任一者的核苷酸1至核苷酸30。
在組合物之另一態樣中,正向重複序列包含:a.與SEQ ID NO: 1-8中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸36;b.與SEQ ID NO: 1-8中之任一者之序列至少90%一致之序列的核苷酸2至核苷酸36;c.與SEQ ID NO: 1-8中之任一者之序列至少90%一致之序列的核苷酸3至核苷酸36;d.與SEQ ID NO: 1-8中之任一者之序列至少90%一致之序列的核苷酸4至核苷酸36;e.與SEQ ID NO: 1-8中之任一者之序列至少90%一致之序列的核苷酸5至核苷酸36;f.與SEQ ID NO: 1-8中之任一者之序列至少90%一致之序列的核苷酸6至核苷酸36;g.與SEQ ID NO: 1-8中之任一者之序列至少90%一致之序列的核苷酸7至核苷酸36;h.與SEQ ID NO: 1-8中之任一者之序列至少90%一致之序列的核苷酸8至核苷酸36;i.與SEQ ID NO: 1-8中之任一者之序列至少90%一致之序列的核苷酸9至核苷酸36;j.與SEQ ID NO: 1-8中之任一者之序列至少90%一致之序列的核苷酸10至核苷酸36;k.與SEQ ID NO: 1-8中之任一者之序列至少90%一致之序列的核苷酸11至核苷酸36;l.與SEQ ID NO: 1-8中之任一者之序列至少90%一致之序列的核苷酸12至核苷酸36;m.與SEQ ID NO: 1-8中之任一者之序列至少90%一致之序列的核苷酸13至核苷酸36;n.與SEQ ID NO: 1-8中之任一者之序列至少90%一致之序列的核苷酸14至核苷酸36;o.與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸1至核苷酸34;p.與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸2至核苷酸34;q.與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸3至核苷酸34;r.與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸4至核苷酸34;s.與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸5至核苷酸34;t.與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸6至核苷酸34;u.與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸7至核苷酸34;v.與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸8至核苷酸34;w.與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸9至核苷酸34;x.與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸10至核苷酸34;y.與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸11至核苷酸34;z.與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸12至核苷酸34;或aa.與SEQ ID NO: 10之序列或其部分至少90%一致之序列。
在組合物之另一態樣中,正向重複序列包含:a. SEQ ID NO: 1-8中之任一者之核苷酸1至核苷酸36;b. SEQ ID NO: 1-8中之任一者之核苷酸2至核苷酸36;c. SEQ ID NO: 1-8中之任一者之核苷酸3至核苷酸36;d. SEQ ID NO: 1-8中之任一者之核苷酸4至核苷酸36;e. SEQ ID NO: 1-8中之任一者之核苷酸5至核苷酸36;f. SEQ ID NO: 1-8中之任一者之核苷酸6至核苷酸36;g. SEQ ID NO: 1-8中之任一者之核苷酸7至核苷酸36;h. SEQ ID NO: 1-8中之任一者之核苷酸8至核苷酸36;i. SEQ ID NO: 1-8中之任一者之核苷酸9至核苷酸36;j. SEQ ID NO: 1-8中之任一者之核苷酸10至核苷酸36;k. SEQ ID NO: 1-8中之任一者之核苷酸11至核苷酸36;l. SEQ ID NO: 1-8中之任一者之核苷酸12至核苷酸36;m. SEQ ID NO: 1-8中之任一者之核苷酸13至核苷酸36;n. SEQ ID NO: 1-8中之任一者之核苷酸14至核苷酸36;o. SEQ ID NO: 9之核苷酸1至核苷酸34;p. SEQ ID NO: 9之核苷酸2至核苷酸34;q. SEQ ID NO: 9之核苷酸3至核苷酸34;r. SEQ ID NO: 9之核苷酸4至核苷酸34;s. SEQ ID NO: 9之核苷酸5至核苷酸34;t. SEQ ID NO: 9之核苷酸6至核苷酸34;u. SEQ ID NO: 9之核苷酸7至核苷酸34;v. SEQ ID NO: 9之核苷酸8至核苷酸34;w. SEQ ID NO: 9之核苷酸9至核苷酸34;x. SEQ ID NO: 9之核苷酸10至核苷酸34;y. SEQ ID NO: 9之核苷酸11至核苷酸34;z. SEQ ID NO: 9之核苷酸12至核苷酸34;或aa. SEQ ID NO: 10或其部分。
在組合物之另一態樣中,正向重複序列包含:a.與SEQ ID NO: 1133-1151中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸36;b.與SEQ ID NO: 1133-1151中之任一者之序列至少90%一致之序列的核苷酸2至核苷酸36;c.與SEQ ID NO: 1133-1151中之任一者之序列至少90%一致之序列的核苷酸3至核苷酸36;d.與SEQ ID NO: 1133-1151中之任一者之序列至少90%一致之序列的核苷酸4至核苷酸36;e.與SEQ ID NO: 1133-1151中之任一者之序列至少90%一致之序列的核苷酸5至核苷酸36;f.與SEQ ID NO: 1133-1151中之任一者之序列至少90%一致之序列的核苷酸6至核苷酸36;g.與SEQ ID NO: 1133-1151中之任一者之序列至少90%一致之序列的核苷酸7至核苷酸36;h.與SEQ ID NO: 1133-1151中之任一者之序列至少90%一致之序列的核苷酸8至核苷酸36;i.與SEQ ID NO: 1133-1151中之任一者之序列至少90%一致之序列的核苷酸9至核苷酸36;j.與SEQ ID NO: 1133-1151中之任一者之序列至少90%一致之序列的核苷酸10至核苷酸36;k.與SEQ ID NO: 1133-1151中之任一者之序列至少90%一致之序列的核苷酸11至核苷酸36;l.與SEQ ID NO: 1133-1151中之任一者之序列至少90%一致之序列的核苷酸12至核苷酸36;m.與SEQ ID NO: 1133-1151中之任一者之序列至少90%一致之序列的核苷酸13至核苷酸36;n.與SEQ ID NO: 1133-1151中之任一者之序列至少90%一致之序列的核苷酸14至核苷酸36;或o.與SEQ ID NO: 1133-1151中之任一者之序列或其部分至少90%一致的序列。
在組合物之另一態樣中,正向重複序列包含:a. SEQ ID NO: 1133-1151中之任一者的核苷酸1至核苷酸36;b. SEQ ID NO: 1133-1151中之任一者的核苷酸2至核苷酸36;c. SEQ ID NO: 1133-1151中之任一者的核苷酸3至核苷酸36;d. SEQ ID NO: 1133-1151中之任一者的核苷酸4至核苷酸36;e. SEQ ID NO: 1133-1151中之任一者的核苷酸5至核苷酸36;f. SEQ ID NO: 1133-1151中之任一者的核苷酸6至核苷酸36;g. SEQ ID NO: 1133-1151中之任一者的核苷酸7至核苷酸36;h. SEQ ID NO: 1133-1151中之任一者的核苷酸8至核苷酸36;i. SEQ ID NO: 1133-1151中之任一者的核苷酸9至核苷酸36;j. SEQ ID NO: 1133-1151中之任一者的核苷酸10至核苷酸36;k. SEQ ID NO: 1133-1151中之任一者的核苷酸11至核苷酸36;l. SEQ ID NO: 1133-1151中之任一者的核苷酸12至核苷酸36;m. SEQ ID NO: 1133-1151中之任一者的核苷酸13至核苷酸36;n. SEQ ID NO: 1133-1151中之任一者的核苷酸14至核苷酸36;或o. SEQ ID NO: 1133-1151中之任一者或其部分。
在組合物之另一態樣中,正向重複序列包含:a.與SEQ ID NO: 1152至少90%一致之序列的核苷酸1至核苷酸36;b.與SEQ ID NO: 1152至少90%一致之序列的核苷酸2至核苷酸36;c.與SEQ ID NO: 1152至少90%一致之序列的核苷酸3至核苷酸36;d.與SEQ ID NO: 1152至少90%一致之序列的核苷酸4至核苷酸36;e.與SEQ ID NO: 1152至少90%一致之序列的核苷酸5至核苷酸36;f.與SEQ ID NO: 1152至少90%一致之序列的核苷酸6至核苷酸36;g.與SEQ ID NO: 1152至少90%一致之序列的核苷酸7至核苷酸36;h.與SEQ ID NO: 1152至少90%一致之序列的核苷酸8至核苷酸36;i.與SEQ ID NO: 1152至少90%一致之序列的核苷酸9至核苷酸36;j.與SEQ ID NO: 1152至少90%一致之序列的核苷酸10至核苷酸36;k.與SEQ ID NO: 1152至少90%一致之序列的核苷酸11至核苷酸36;l.與SEQ ID NO: 1152至少90%一致之序列的核苷酸12至核苷酸36;m.與SEQ ID NO: 1152至少90%一致之序列的核苷酸13至核苷酸36;n.與SEQ ID NO: 1152至少90%一致之序列的核苷酸14至核苷酸36;或o.與SEQ ID NO: 1153或SEQ ID NO: 1154之序列或其部分至少90%一致的序列。
在組合物之另一態樣中,正向重複序列包含:a. SEQ ID NO: 1152之核苷酸1至核苷酸36;b. SEQ ID NO: 1152之核苷酸2至核苷酸36;c. SEQ ID NO: 1152之核苷酸3至核苷酸36;d. SEQ ID NO: 1152之核苷酸4至核苷酸36;e. SEQ ID NO: 1152之核苷酸5至核苷酸36;f. SEQ ID NO: 1152之核苷酸6至核苷酸36;g. SEQ ID NO: 1152之核苷酸7至核苷酸36;h. SEQ ID NO: 1152之核苷酸8至核苷酸36;i. SEQ ID NO: 1152之核苷酸9至核苷酸36;j. SEQ ID NO: 1152之核苷酸10至核苷酸36;k. SEQ ID NO: 1152之核苷酸11至核苷酸36;l. SEQ ID NO: 1152之核苷酸12至核苷酸36;m. SEQ ID NO: 1152之核苷酸13至核苷酸36;n. SEQ ID NO: 1152之核苷酸14至核苷酸36;或o. SEQ ID NO: 1153或SEQ ID NO: 1154或其部分。
在組合物之另一態樣中,正向重複序列包含:a.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸1至核苷酸36;b.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸2至核苷酸36;c.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸3至核苷酸36;d.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸4至核苷酸36;e.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸5至核苷酸36;f.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸6至核苷酸36;g.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸7至核苷酸36;h.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸8至核苷酸36;i.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸9至核苷酸36;j.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸10至核苷酸36;k.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸11至核苷酸36;l.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸12至核苷酸36;m.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸13至核苷酸36;n.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸14至核苷酸36;o.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸15至核苷酸36;或p.與SEQ ID NO: 1157之序列或其部分至少90%一致之序列。
在組合物之另一態樣中,正向重複序列包含:a. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸1至核苷酸36;b. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸2至核苷酸36;c. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸3至核苷酸36;d. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸4至核苷酸36;e. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸5至核苷酸36;f. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸6至核苷酸36;g. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸7至核苷酸36;h. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸8至核苷酸36;i. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸9至核苷酸36;j. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸10至核苷酸36;k. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸11至核苷酸36;l. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸12至核苷酸36;m. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸13至核苷酸36;n. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸14至核苷酸36;o. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸15至核苷酸36;或p. SEQ ID NO: 1157或其部分。
在組合物之另一態樣中,間隔子序列與SEQ ID NO: 11-471或933-1017中之任一者之序列的互補序列實質上互補。
在組合物之另一態樣中,目標序列與包含序列5'-NTTN-3'之原間隔序列相鄰模體(PAM)相鄰。
在組合物之另一態樣中,PAM包含序列5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'。
在組合物之另一態樣中,目標序列緊鄰PAM序列。
在組合物之另一態樣中,目標序列係在PAM序列之1、2、3、4或5個核苷酸內。
在組合物之另一態樣中,Cas12i多肽為:a. Cas12i2多肽,其包含與SEQ ID NO: 1104、SEQ ID NO: 1127、SEQ ID NO: 1128、SEQ ID NO: 1129、SEQ ID NO: 1130或SEQ ID NO: 1131之序列至少90%一致的序列;b. Cas12i4多肽,其包含與SEQ ID NO: 1158、SEQ ID NO: 1159或SEQ ID NO: 1160之序列至少90%一致的序列;c. Cas12i1多肽,其包含與SEQ ID NO: 1161之序列至少90%一致的序列;或d. Cas12i3多肽,其包含與SEQ ID NO: 1162之序列至少90%一致的序列。
在組合物之另一態樣中,Cas12i多肽為:a. Cas12i2多肽,其包含SEQ ID NO: 1104、SEQ ID NO: 1127、SEQ ID NO: 1128、SEQ ID NO: 1129、SEQ ID NO: 1130或SEQ ID NO: 1131之序列;b. Cas12i4多肽,其包含SEQ ID NO: 1158、SEQ ID NO: 1159或SEQ ID NO: 1160之序列;c. Cas12i1多肽,其包含SEQ ID NO: 1161之序列;或d. Cas12i3多肽,其包含SEQ ID NO: 1162之序列。
在組合物之另一態樣中,RNA引導及Cas12i多肽形成核糖核蛋白複合物。
在組合物之另一態樣中,核糖核蛋白複合物結合目標核酸。
在組合物之另一態樣中,組合物存在於細胞內。
在組合物之另一態樣中,RNA引導及Cas12i多肽編碼於載體,例如表現載體中。在組合物之另一態樣中,RNA引導及Cas12i多肽編碼於單一載體中,或RNA引導編碼於第一載體中且Cas12i多肽編碼於第二載體中。
本發明進一步提供一種載體系統,其包含編碼本文揭示之RNA引導及Cas12i多肽之一或多種載體。在一實施例中,載體系統包含編碼本文揭示之RNA引導的第一載體及編碼Cas12i多肽的第二載體。載體可為表現載體。
本發明又進一步提供一種RNA引導,其包含(i)與CIITA基因內之目標序列實質上互補的間隔子序列及(ii)正向重複序列。
在RNA引導之一個態樣中,目標序列係在以下內:CIITA基因之外顯子1、外顯子2、外顯子3、外顯子4、外顯子5、外顯子6、外顯子7、外顯子8、外顯子9、外顯子10、外顯子11、外顯子12、外顯子13、外顯子14、外顯子15、外顯子16、外顯子17、外顯子18、外顯子19、外顯子20、外顯子21、外顯子22、內含子1、內含子2、內含子3、內含子4、內含子5、內含子6、內含子7、內含子8、內含子9、內含子10、內含子11、內含子12、內含子13、內含子14、內含子15、內含子16、內含子17、內含子18、內含子19、內含子20或內含子21。
在RNA引導之另一態樣中,CIITA基因包含在www.ncbi.nlm.nih.gov/gene/4261處闡述之序列、其反向互補序列、其變體或其變體之反向互補序列。
在RNA引導之另一態樣中,間隔子序列包含:a.與SEQ ID NO: 472-932或1018-1102中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸16;b.與SEQ ID NO: 472-932或1018-1102中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸17;c.與SEQ ID NO: 472-932或1018-1102中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸18;d.與SEQ ID NO: 472-932或1018-1102中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸19;e.與SEQ ID NO: 472-932或1018-1102中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸20;f.與SEQ ID NO: 472-932中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸21;g.與SEQ ID NO: 472-932中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸22;h.與SEQ ID NO: 472-932中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸23;i.與SEQ ID NO: 472-932中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸24;j.與SEQ ID NO: 472-932中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸25;k.與SEQ ID NO: 472-932中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸26;l.與SEQ ID NO: 472-932中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸27;m.與SEQ ID NO: 472-932中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸28;n.與SEQ ID NO: 472-932中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸29;或o.與SEQ ID NO: 472-932中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸30。
在RNA引導之另一態樣中,間隔子序列包含:a. SEQ ID NO: 472-932或1018-1102中之任一者的核苷酸1至核苷酸16;b. SEQ ID NO: 472-932或1018-1102中之任一者的核苷酸1至核苷酸17;c. SEQ ID NO: 472-932或1018-1102中之任一者的核苷酸1至核苷酸18;d. SEQ ID NO: 472-932或1018-1102中之任一者的核苷酸1至核苷酸19;e. SEQ ID NO: 472-932或1018-1102中之任一者的核苷酸1至核苷酸20;f. SEQ ID NO: 472-932中之任一者的核苷酸1至核苷酸21;g. SEQ ID NO: 472-932中之任一者的核苷酸1至核苷酸22;h. SEQ ID NO: 472-932中之任一者的核苷酸1至核苷酸23;i. SEQ ID NO: 472-932中之任一者的核苷酸1至核苷酸24;j. SEQ ID NO: 472-932中之任一者的核苷酸1至核苷酸25;k. SEQ ID NO: 472-932中之任一者的核苷酸1至核苷酸26;l. SEQ ID NO: 472-932中之任一者的核苷酸1至核苷酸27;m. SEQ ID NO: 472-932中之任一者的核苷酸1至核苷酸28;n. SEQ ID NO: 472-932中之任一者的核苷酸1至核苷酸29;或o. SEQ ID NO: 472-932中之任一者的核苷酸1至核苷酸30。
在RNA引導之另一態樣中,正向重複序列包含:a.與SEQ ID NO: 1-8中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸36;b.與SEQ ID NO: 1-8中之任一者之序列至少90%一致之序列的核苷酸2至核苷酸36;c.與SEQ ID NO: 1-8中之任一者之序列至少90%一致之序列的核苷酸3至核苷酸36;d.與SEQ ID NO: 1-8中之任一者之序列至少90%一致之序列的核苷酸4至核苷酸36;e.與SEQ ID NO: 1-8中之任一者之序列至少90%一致之序列的核苷酸5至核苷酸36;f.與SEQ ID NO: 1-8中之任一者之序列至少90%一致之序列的核苷酸6至核苷酸36;g.與SEQ ID NO: 1-8中之任一者之序列至少90%一致之序列的核苷酸7至核苷酸36;h.與SEQ ID NO: 1-8中之任一者之序列至少90%一致之序列的核苷酸8至核苷酸36;i.與SEQ ID NO: 1-8中之任一者之序列至少90%一致之序列的核苷酸9至核苷酸36;j.與SEQ ID NO: 1-8中之任一者之序列至少90%一致之序列的核苷酸10至核苷酸36;k.與SEQ ID NO: 1-8中之任一者之序列至少90%一致之序列的核苷酸11至核苷酸36;l.與SEQ ID NO: 1-8中之任一者之序列至少90%一致之序列的核苷酸12至核苷酸36;m.與SEQ ID NO: 1-8中之任一者之序列至少90%一致之序列的核苷酸13至核苷酸36;n.與SEQ ID NO: 1-8中之任一者之序列至少90%一致之序列的核苷酸14至核苷酸36;o.與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸1至核苷酸34;p.與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸2至核苷酸34;q.與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸3至核苷酸34;r.與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸4至核苷酸34;s.與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸5至核苷酸34;t.與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸6至核苷酸34;u.與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸7至核苷酸34;v.與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸8至核苷酸34;w.與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸9至核苷酸34;x.與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸10至核苷酸34;y.與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸11至核苷酸34;z.與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸12至核苷酸34;或aa.與SEQ ID NO: 10之序列或其部分至少90%一致之序列。
在RNA引導之另一態樣中,正向重複序列包含:a. SEQ ID NO: 1-8中之任一者之核苷酸1至核苷酸36;b. SEQ ID NO: 1-8中之任一者之核苷酸2至核苷酸36;c. SEQ ID NO: 1-8中之任一者之核苷酸3至核苷酸36;d. SEQ ID NO: 1-8中之任一者之核苷酸4至核苷酸36;e. SEQ ID NO: 1-8中之任一者之核苷酸5至核苷酸36;f. SEQ ID NO: 1-8中之任一者之核苷酸6至核苷酸36;g. SEQ ID NO: 1-8中之任一者之核苷酸7至核苷酸36;h. SEQ ID NO: 1-8中之任一者之核苷酸8至核苷酸36;i. SEQ ID NO: 1-8中之任一者之核苷酸9至核苷酸36;j. SEQ ID NO: 1-8中之任一者之核苷酸10至核苷酸36;k. SEQ ID NO: 1-8中之任一者之核苷酸11至核苷酸36;l. SEQ ID NO: 1-8中之任一者之核苷酸12至核苷酸36;m. SEQ ID NO: 1-8中之任一者之核苷酸13至核苷酸36;n. SEQ ID NO: 1-8中之任一者之核苷酸14至核苷酸36;o. SEQ ID NO: 9之核苷酸1至核苷酸34;p. SEQ ID NO: 9之核苷酸2至核苷酸34;q. SEQ ID NO: 9之核苷酸3至核苷酸34;r. SEQ ID NO: 9之核苷酸4至核苷酸34;s. SEQ ID NO: 9之核苷酸5至核苷酸34;t. SEQ ID NO: 9之核苷酸6至核苷酸34;u. SEQ ID NO: 9之核苷酸7至核苷酸34;v. SEQ ID NO: 9之核苷酸8至核苷酸34;w. SEQ ID NO: 9之核苷酸9至核苷酸34;x. SEQ ID NO: 9之核苷酸10至核苷酸34;y. SEQ ID NO: 9之核苷酸11至核苷酸34;z. SEQ ID NO: 9之核苷酸12至核苷酸34;或aa. SEQ ID NO: 10或其部分。
在RNA引導之另一態樣中,正向重複序列包含:a.與SEQ ID NO: 1133-1151中之任一者之序列至少90%一致之序列的核苷酸1至核苷酸36;b.與SEQ ID NO: 1133-1151中之任一者之序列至少90%一致之序列的核苷酸2至核苷酸36;c.與SEQ ID NO: 1133-1151中之任一者之序列至少90%一致之序列的核苷酸3至核苷酸36;d.與SEQ ID NO: 1133-1151中之任一者之序列至少90%一致之序列的核苷酸4至核苷酸36;e.與SEQ ID NO: 1133-1151中之任一者之序列至少90%一致之序列的核苷酸5至核苷酸36;f.與SEQ ID NO: 1133-1151中之任一者之序列至少90%一致之序列的核苷酸6至核苷酸36;g.與SEQ ID NO: 1133-1151中之任一者之序列至少90%一致之序列的核苷酸7至核苷酸36;h.與SEQ ID NO: 1133-1151中之任一者之序列至少90%一致之序列的核苷酸8至核苷酸36;i.與SEQ ID NO: 1133-1151中之任一者之序列至少90%一致之序列的核苷酸9至核苷酸36;j.與SEQ ID NO: 1133-1151中之任一者之序列至少90%一致之序列的核苷酸10至核苷酸36;k.與SEQ ID NO: 1133-1151中之任一者之序列至少90%一致之序列的核苷酸11至核苷酸36;l.與SEQ ID NO: 1133-1151中之任一者之序列至少90%一致之序列的核苷酸12至核苷酸36;m.與SEQ ID NO: 1133-1151中之任一者之序列至少90%一致之序列的核苷酸13至核苷酸36;n.與SEQ ID NO: 1133-1151中之任一者之序列至少90%一致之序列的核苷酸14至核苷酸36;或o.與SEQ ID NO: 1133-1151中之任一者之序列或其部分至少90%一致的序列。
在RNA引導之另一態樣中,正向重複序列包含:a. SEQ ID NO: 1133-1151中之任一者的核苷酸1至核苷酸36;b. SEQ ID NO: 1133-1151中之任一者的核苷酸2至核苷酸36;c. SEQ ID NO: 1133-1151中之任一者的核苷酸3至核苷酸36;d. SEQ ID NO: 1133-1151中之任一者的核苷酸4至核苷酸36;e. SEQ ID NO: 1133-1151中之任一者的核苷酸5至核苷酸36;f. SEQ ID NO: 1133-1151中之任一者的核苷酸6至核苷酸36;g. SEQ ID NO: 1133-1151中之任一者的核苷酸7至核苷酸36;h. SEQ ID NO: 1133-1151中之任一者的核苷酸8至核苷酸36;i. SEQ ID NO: 1133-1151中之任一者的核苷酸9至核苷酸36;j. SEQ ID NO: 1133-1151中之任一者的核苷酸10至核苷酸36;k. SEQ ID NO: 1133-1151中之任一者的核苷酸11至核苷酸36;l. SEQ ID NO: 1133-1151中之任一者的核苷酸12至核苷酸36;m. SEQ ID NO: 1133-1151中之任一者的核苷酸13至核苷酸36;n. SEQ ID NO: 1133-1151中之任一者的核苷酸14至核苷酸36;或o. SEQ ID NO: 1133-1151中之任一者或其部分。
在RNA引導之另一態樣中,正向重複序列包含:a.與SEQ ID NO: 1152至少90%一致之序列的核苷酸1至核苷酸36;b.與SEQ ID NO: 1152至少90%一致之序列的核苷酸2至核苷酸36;c.與SEQ ID NO: 1152至少90%一致之序列的核苷酸3至核苷酸36;d.與SEQ ID NO: 1152至少90%一致之序列的核苷酸4至核苷酸36;e.與SEQ ID NO: 1152至少90%一致之序列的核苷酸5至核苷酸36;f.與SEQ ID NO: 1152至少90%一致之序列的核苷酸6至核苷酸36;g.與SEQ ID NO: 1152至少90%一致之序列的核苷酸7至核苷酸36;h.與SEQ ID NO: 1152至少90%一致之序列的核苷酸8至核苷酸36;i.與SEQ ID NO: 1152至少90%一致之序列的核苷酸9至核苷酸36;j.與SEQ ID NO: 1152至少90%一致之序列的核苷酸10至核苷酸36;k.與SEQ ID NO: 1152至少90%一致之序列的核苷酸11至核苷酸36;l.與SEQ ID NO: 1152至少90%一致之序列的核苷酸12至核苷酸36;m.與SEQ ID NO: 1152至少90%一致之序列的核苷酸13至核苷酸36;n.與SEQ ID NO: 1152至少90%一致之序列的核苷酸14至核苷酸36;或o.與SEQ ID NO: 1153或SEQ ID NO: 1154之序列或其部分至少90%一致的序列。
在RNA引導之另一態樣中,正向重複序列包含:a. SEQ ID NO: 1152之核苷酸1至核苷酸36;b. SEQ ID NO: 1152之核苷酸2至核苷酸36;c. SEQ ID NO: 1152之核苷酸3至核苷酸36;d. SEQ ID NO: 1152之核苷酸4至核苷酸36;e. SEQ ID NO: 1152之核苷酸5至核苷酸36;f. SEQ ID NO: 1152之核苷酸6至核苷酸36;g. SEQ ID NO: 1152之核苷酸7至核苷酸36;h. SEQ ID NO: 1152之核苷酸8至核苷酸36;i. SEQ ID NO: 1152之核苷酸9至核苷酸36;j. SEQ ID NO: 1152之核苷酸10至核苷酸36;k. SEQ ID NO: 1152之核苷酸11至核苷酸36;l. SEQ ID NO: 1152之核苷酸12至核苷酸36;m. SEQ ID NO: 1152之核苷酸13至核苷酸36;n. SEQ ID NO: 1152之核苷酸14至核苷酸36;或o. SEQ ID NO: 1153或SEQ ID NO: 1154或其部分。
在RNA引導之另一態樣中,正向重複序列包含:a.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸1至核苷酸36;b.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸2至核苷酸36;c.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸3至核苷酸36;d.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸4至核苷酸36;e.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸5至核苷酸36;f.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸6至核苷酸36;g.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸7至核苷酸36;h.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸8至核苷酸36;i.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸9至核苷酸36;j.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸10至核苷酸36;k.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸11至核苷酸36;l.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸12至核苷酸36;m.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸13至核苷酸36;n.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸14至核苷酸36;o.與SEQ ID NO: 1155或SEQ ID NO: 1156之序列至少90%一致之序列的核苷酸15至核苷酸36;或p.與SEQ ID NO: 1157之序列或其部分至少90%一致之序列。
在RNA引導之另一態樣中,正向重複序列包含:a. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸1至核苷酸36;b. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸2至核苷酸36;c. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸3至核苷酸36;d. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸4至核苷酸36;e. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸5至核苷酸36;f. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸6至核苷酸36;g. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸7至核苷酸36;h. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸8至核苷酸36;i. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸9至核苷酸36;j. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸10至核苷酸36;k. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸11至核苷酸36;l. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸12至核苷酸36;m. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸13至核苷酸36;n. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸14至核苷酸36;o. SEQ ID NO: 1155或SEQ ID NO: 1156之核苷酸15至核苷酸36;或p. SEQ ID NO: 1157或其部分。
在RNA引導之另一態樣中,間隔子序列與SEQ ID NO: 11-471或933-1017中之任一者之序列的互補序列實質上互補。
在RNA引導之另一態樣中,目標序列與包含序列5'-NTTN-3'之原間隔序列相鄰模體(PAM)相鄰,其中N為任何核苷酸。
在RNA引導之另一態樣中,PAM包含序列5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'。
在RNA引導之另一態樣中,目標序列緊鄰PAM序列。
在RNA引導之另一態樣中,目標序列係在PAM序列之1、2、3、4或5個核苷酸內。
在RNA引導之另一態樣中,RNA引導具有與SEQ ID NO: 1178-1192中之任一者之序列至少90%一致的序列。
在RNA引導之另一態樣中,RNA引導具有SEQ ID NO: 1178-1192中之任一者的序列。
本發明又進一步提供編碼如本文所描述之RNA引導之核酸。
本發明又進一步提供包含此類如本文所描述之RNA引導之載體。
本發明又進一步提供一種細胞,其包含如本文所描述之組合物、RNA引導、核酸或載體。
在細胞之一個態樣中,細胞為真核細胞、動物細胞、哺乳動物細胞、人類細胞、原代細胞、細胞株、幹細胞或T細胞。
包含經破壞CIITA基因之細胞亦在本發明之範疇內,其可藉由使宿主細胞與本文揭示之系統接觸以基因編輯宿主細胞中之CIITA基因而產生。本文亦提供一種細胞群體,其中群體中之複數個宿主細胞包含經破壞CIITA基因,其藉由使細胞群體與本文揭示之系統接觸以基因編輯群體中之複數個細胞的CIITA基因產生。細胞群體亦可包含在CIITA基因中無編輯之細胞。
本發明又進一步提供一種套組,其包含如本文所描述之組合物、RNA引導、核酸或載體。
本發明又進一步提供一種編輯CIITA序列之方法,該方法包含使CIITA序列與如本文所描述之組合物或RNA引導接觸。在一實施例中,該方法係在活體外進行。在一實施例中,該方法係離體進行。
本發明又進一步提供一種使Cas12i多肽及RNA引導與目標序列結合之方法,該方法包含使目標序列與本文所描述之組合物、系統、載體或載體系統接觸。在一些實施例中,組合物包含編碼Cas12i多肽之聚核糖核苷酸,且接觸引起細胞中Cas12i多肽之產生。
在該方法之一個態樣中,CIITA序列係在細胞中。在一些實施例中,活體外培養細胞。在一些實施例中,接觸步驟係藉由向包含宿主細胞之個體投與系統進行。在一些實施例中,該方法包含使細胞與如本文所描述之組合物、系統或RNA引導接觸。在一些實施例中,活體外培養宿主細胞。在一些實施例中,接觸步驟係藉由向包含宿主細胞之個體投與用於編輯CIITA基因之系統進行。
在該方法之另一態樣中,組合物或RNA引導誘導CIITA序列中之缺失。
在該方法之另一態樣中,缺失與5'-NTTN-3'序列相鄰,其中N為任何核苷酸。
在該方法之另一態樣中,缺失在5'-NTTN-3'序列下游。
在該方法之另一態樣中,缺失之長度長達約40個核苷酸。在該方法之另一態樣中,缺失之長度長達約50個核苷酸。
在該方法之另一態樣中,缺失之長度為約4個核苷酸至40個核苷酸。
在該方法之另一態樣中,缺失之長度為約4個核苷酸至25個核苷酸。
在該方法之另一態樣中,缺失之長度為約10個核苷酸至25個核苷酸。
在該方法之另一態樣中,缺失之長度為約10個核苷酸至15個核苷酸。
在該方法之另一態樣中,缺失在5'-NTTN-3'序列之約5個核苷酸至約15個核苷酸內開始。
在該方法之另一態樣中,缺失在5'-NTTN-3'序列之約5個核苷酸至約10個核苷酸內開始。
在該方法之另一態樣中,缺失在5'-NTTN-3'序列之約10個核苷酸至約15個核苷酸內開始。
在該方法之另一態樣中,缺失在5'-NTTN-3'序列下游之約5個核苷酸至約15個核苷酸內開始。
在該方法之另一態樣中,缺失在5'-NTTN-3'序列下游之約5個核苷酸至約10個核苷酸內開始。
在該方法之另一態樣中,缺失在5'-NTTN-3'序列下游之約10個核苷酸至約15個核苷酸內開始。
在該方法之另一態樣中,缺失在5'-NTTN-3'序列之約20個核苷酸至約30個核苷酸內結束。
在該方法之另一態樣中,缺失在5'-NTTN-3'序列之約20個核苷酸至約25個核苷酸內結束。
在該方法之另一態樣中,缺失在5'-NTTN-3'序列之約25個核苷酸至約30個核苷酸內結束。
在該方法之另一態樣中,缺失在5'-NTTN-3'序列下游之約20個核苷酸至約30個核苷酸內結束。
在該方法之另一態樣中,缺失在5'-NTTN-3'序列下游之約20個核苷酸至約25個核苷酸內結束。
在該方法之另一態樣中,缺失在5'-NTTN-3'序列下游之約25個核苷酸至約30個核苷酸內結束。
在該方法之另一態樣中,缺失在5'-NTTN-3'序列下游之約5個核苷酸至約15個核苷酸內開始,且在5'-NTTN-3'序列下游之約20個核苷酸至約30個核苷酸內結束。
在該方法之另一態樣中,缺失在5'-NTTN-3'序列下游之約5個核苷酸至約15個核苷酸內開始,且在5'-NTTN-3'序列下游之約20個核苷酸至約25個核苷酸內結束。
在該方法之另一態樣中,缺失在5'-NTTN-3'序列下游之約5個核苷酸至約15個核苷酸內開始,且在5'-NTTN-3'序列下游之約25個核苷酸至約30個核苷酸內結束。
在該方法之另一態樣中,缺失在5'-NTTN-3'序列下游之約5個核苷酸至約10個核苷酸內開始,且在5'-NTTN-3'序列下游之約20個核苷酸至約30個核苷酸內結束。
在該方法之另一態樣中,缺失在5'-NTTN-3'序列下游之約5個核苷酸至約10個核苷酸內開始,且在5'-NTTN-3'序列下游之約20個核苷酸至約25個核苷酸內結束。
在該方法之另一態樣中,缺失在5'-NTTN-3'序列下游之約5個核苷酸至約10個核苷酸內開始,且在5'-NTTN-3'序列下游之約25個核苷酸至約30個核苷酸內結束。
在該方法之另一態樣中,缺失在5'-NTTN-3'序列下游之約10個核苷酸至約15個核苷酸內開始,且在5'-NTTN-3'序列下游之約20個核苷酸至約30個核苷酸內結束。
在該方法之另一態樣中,缺失在5'-NTTN-3'序列下游之約10個核苷酸至約15個核苷酸內開始,且在5'-NTTN-3'序列下游之約20個核苷酸至約25個核苷酸內結束。
在該方法之另一態樣中,缺失在5'-NTTN-3'序列下游之約10個核苷酸至約15個核苷酸內開始,且在5'-NTTN-3'序列下游之約25個核苷酸至約30個核苷酸內結束。
在該方法之另一態樣中,5'-NTTN-3'序列為5'-CTTT-3'、5'-CTTC-3'、5'-GTTT-3'、5'-GTTC-3'、5'-TTTC-3'、5'-GTTA-3'或5'-GTTG-3'。
在該方法之另一態樣中,缺失與CIITA序列中之突變重疊。
在該方法之另一態樣中,缺失與CIITA序列中之***重疊。
在該方法之另一態樣中,缺失移除CIITA序列或其部分之重複擴增。
在該方法之另一態樣中,缺失破壞CIITA序列之一個或兩個等位基因。
在本文所描述之組合物、RNA引導、核酸、載體、細胞、套組或方法之另一態樣中,RNA引導包含SEQ ID NO: 1178-1192中之任一者之序列。
本發明又進一步提供一種治療個體之疾病或病狀之方法,該方法包含向個體投與本文所描述之組合物、RNA引導或細胞。
在本文所描述之組合物、RNA引導、細胞、套組或方法之另一態樣中,RNA引導及/或編碼Cas12i多肽之聚核糖核苷酸包含於脂質奈米粒子內。
在組合物、細胞、套組或方法之另一態樣中,RNA引導及編碼Cas12i多肽之聚核糖核苷酸包含於同一脂質奈米粒子內。
在組合物、細胞、套組或方法之另一態樣中,RNA引導及編碼Cas12i多肽之聚核糖核苷酸包含於單獨脂質奈米粒子內。
定義 關於特定實施例描述本發明,但本發明不受其限制,而僅藉由申請專利範圍限制。除非另外指示,否則如下文所闡述之術語一般應按其常識來理解。
如本文所用,術語「活性」係指生物活性。在一些實施例中,活性包括酶活性,例如效應子之催化能力。舉例而言,活性可包括核酸酶活性。
如本文所用,術語「CIITA」係指「II類主要組織相容複合體反式活化因子(Class II Major Histocompatibility Complex Transactivator)」。CIITA為II類主要組織相容複合體基因轉錄之正調節因子。CIITA基因中之突變引起裸淋巴球症候群,其中免疫系統嚴重受損且無法有效對抗感染。另外,基因之染色體重排涉及霍奇金氏淋巴瘤(Hodgkin lymphoma)及原發性縱隔B細胞淋巴瘤之發病機制。CIITA基因序列之實例提供在www.ncbi.nlm.nih.gov/gene/4261處,其截至2021年11月5日,以引用的方式併入本文中。應理解,視其指示為如表5A及5B中所闡述之「+」或「-」而定,本文所描述之間隔子序列可靶向此序列或其反向互補序列。表5A及表5B中列出之目標序列係在CIITA基因之非目標股上。關於CIITA同功型之cDNA序列,亦參見本文中之表8。
如本文所用,術語「Cas12i多肽」(在本文中亦稱為Cas12i)係指與由RNA引導指定之目標核酸上之目標序列結合的多肽,其中多肽與野生型Cas12i多肽具有至少一些胺基酸序列同源性。在一些實施例中,Cas12i多肽與美國專利第10,808,245號(其以全文引用之方式併入本文中)之SEQ ID NO: 1-5及11-18中之任一者包含至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性。在一些實施例中,Cas12i多肽與對應於本申請案之SEQ ID NO: 1161、1104、1162及1158之美國專利第10,808,245號之SEQ ID NO: 3 (Cas12i1)、SEQ ID NO: 5 (Cas12i2)、SEQ ID NO: 14 (Cas12i3)或SEQ ID NO: 16 (Cas12i4)中之任一者包含至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性。在一些實施例中,本發明之Cas12i多肽為如PCT/US2021/025257中所描述之Cas12i1多肽或Cas12i2多肽。在一些實施例中,Cas12i多肽裂解目標核酸(例如呈切口或雙股斷裂形式)。
如本文所用,術語「複合物」係指兩種或更多種分子成組。在一些實施例中,複合物包含彼此相互作用(例如彼此結合、彼此接觸、彼此黏著)之多肽及核酸分子。如本文所用,術語「複合物」可指RNA引導及多肽(例如Cas12i多肽)成組。如本文所用,術語「複合物」可指RNA引導、多肽及目標序列成組。如本文所用,術語「複合物」可指靶向CIITA之RNA引導及Cas12i多肽成組。
如本文所用,術語「原間隔序列相鄰模體」或「PAM」係指與結合包含RNA引導(例如靶向CIITA之RNA引導)及Cas12i多肽之複合物之目標序列(例如CIITA目標序列)相鄰的DNA序列。舉例而言,PAM可與雙股目標序列之非目標股相鄰。在雙股目標之情況下,RNA引導與目標之第一股(例如目標股或間隔子互補股)結合,且如本文所描述之PAM序列存在於第二互補股(例如非目標股或非間隔子互補股)中。
如本文所用,術語「相鄰」包括其中包含RNA引導及Cas12i多肽之複合物之RNA引導與緊鄰PAM之目標序列特異性結合(bind)、相互作用或結合(associate)的情形。舉例而言,RNA引導可與雙股目標序列之目標股結合。在此類情況下,目標序列與PAM之間無核苷酸。術語「相鄰」亦包括RNA引導所結合之目標序列與PAM之間存在少量(例如1、2、3、4或5個)核苷酸的情形。在一些實施例中,如本文所描述之PAM序列存在於非目標股(例如非間隔子互補股)中。在此類情況下,術語「相鄰」包括如本文所描述為緊鄰非目標股中之一序列(或在少量,例如1、2、3、4或5個核苷酸內)的PAM序列。
如本文所用,術語「RNA引導(RNA guide)」係指促進本文所描述之多肽(例如Cas12i多肽)靶向目標序列(例如CIITA基因之序列)的任何RNA分子。RNA引導可設計成包括與特定核酸序列(例如CIITA核酸序列)互補之序列。RNA引導可包含DNA靶向序列(亦即,間隔子序列)及正向重複(direct repeat;DR)序列。術語「crRNA」在本文中亦用於指RNA引導。
在一些實施例中,間隔子序列與目標序列互補。舉例而言,間隔子序列可與雙股目標序列之目標股互補。如本文所用,術語「互補」係指第一核酸分子(諸如RNA引導)之核鹼基與第二核酸分子(諸如目標序列)之核鹼基鹼基配對的能力。兩個互補核酸分子能夠在適當溫度及溶液離子強度條件下非共價結合。在一些實施例中,第一核酸分子(例如RNA引導之間隔子序列)包含與第二核酸(例如目標序列)之100%互補性。在一些實施例中,若第一核酸分子與第二核酸包含至少約80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%互補性,則第一核酸分子(例如RNA引導之間隔子序列)與第二核酸分子(例如目標序列)互補。如本文所用,術語「實質上互補」係指與目標序列具有某一程度之互補性的聚核苷酸(例如RNA引導之間隔子序列)。在一些實施例中,互補性程度使得聚核苷酸可以足夠允許與聚核苷酸複合之效應子多肽(例如Cas12i)作用(例如裂解)於目標序列之親和力與目標序列雜交。在一些實施例中,與目標序列實質上互補之間隔子序列與目標序列具有小於100%之互補性。在一些實施例中,與目標序列實質上互補之間隔子序列與目標序列具有至少約80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%互補性。在一些實施例中,具有與目標序列實質上互補之間隔子序列的RNA引導與目標序列具有100%互補性。
如本文所用,術語「目標」及「目標序列」係指與RNA引導特異性結合之核酸序列。在一些實施例中,RNA引導之DNA靶向序列(例如間隔子)與目標序列結合。舉例而言,間隔子可結合雙股目標序列之目標股。在雙股目標之情況下,RNA引導與目標之第一股(亦即,目標股或間隔子互補股)結合,且如本文所描述之PAM序列存在於第二互補股(亦即,非目標股或非間隔子互補股)中。在一些實施例中,目標股(亦即,間隔子互補股)包含5'-NAAN-3'序列。在一些實施例中,目標序列為CIITA基因序列內之序列,包括但不限於www.ncbi.nlm.nih.gov/gene/4261處闡述之序列或其反向互補序列。
如本文所用,術語「上游」及「下游」係指核酸分子中單一核酸(例如DNA)序列內之相對位置。「上游」及「下游」分別係指其中RNA轉錄發生之5'至3'方向。當第一序列之3'端出現在第二序列之5'端前時,第一序列在第二序列上游。當第一序列之5'端出現在第二序列之3'端後時,第一序列在第二序列下游。在一些實施例中,5'-NTTN-3'序列在本文所描述之***或缺失(indel)上游,且Cas12i誘導之***或缺失在5'-NTTN-3'序列下游。
相關申請案之交互參考 本申請案根據35 U.S.C. § 119(e)主張2021年11月5日申請之美國臨時申請案63/276,229及2021年12月28日申請之美國臨時申請案第63/294,121號之權益,該等案中之各者之內容以全文引用的方式併入本文中。
本發明係關於一種能夠與CIITA結合之RNA引導及其使用方法。在一些態樣中,本文描述一種包含具有一或多個特性之RNA引導的組合物。在一些態樣中,描述一種產生RNA引導之方法。在一些態樣中,描述一種遞送包含RNA引導之組合物之方法。
組合物 在一些態樣中,本文所描述之本發明包含含有靶向CIITA之RNA引導的組合物。在一些實施例中,RNA引導由正向重複組分及間隔子組分構成。在一些實施例中,RNA引導結合Cas12i多肽。在一些實施例中,間隔子組分與CIITA目標序列實質上互補,其中CIITA目標序列與如本文所描述之5'-NTTN-3' PAM序列相鄰。在雙股目標之情況下,RNA引導與目標之第一股(亦即,目標股或間隔子互補股)結合,且如本文所描述之PAM序列存在於第二互補股(亦即,非目標股或非間隔子互補股)中。
在一些實施例中,本文所描述之本發明包含含有複合物之組合物,其中複合物包含靶向CIITA之RNA引導。在一些實施例中,本發明包含複合物,該複合物包含RNA引導及Cas12i多肽。在一些實施例中,RNA引導及Cas12i多肽以約1:1之莫耳比彼此結合。在一些實施例中,包含RNA引導及Cas12i多肽之複合物與CIITA目標序列結合。在一些實施例中,包含靶向CIITA之RNA引導及Cas12i多肽之複合物以約1:1之莫耳比與CIITA目標序列結合。在一些實施例中,複合物包含可裂解CIITA目標序列之酶活性,諸如核酸酶活性。單獨或一起之RNA引導、Cas12i多肽及CIITA目標序列不會天然存在。在一些實施例中,複合物中之RNA引導包含本文所描述之正向重複及/或間隔子序列。在一些實施例中,RNA引導之序列與SEQ ID NO: 1178-1192中之任一者之序列具有至少90%一致性(例如至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%一致性)。在一些實施例中,RNA引導具有SEQ ID NO: 1178-1192中之任一者之序列。
本文所揭示之組合物之使用具有優於其他已知核酸酶系統之彼等者的優點。Cas12i多肽小於其他核酸酶。舉例而言,Cas12i2之長度為1,054個胺基酸,而化膿性葡萄球菌(
S. pyogenes) Cas9 (SpCas9)之長度為1,368個胺基酸,嗜熱鏈球菌(
S. thermophilus) Cas9 (StCas9)之長度為1,128個胺基酸,FnCpf1之長度為1,300個胺基酸,AsCpf1之長度為1,307個胺基酸,且LbCpf1之長度為1,246個胺基酸。不需要反式活化CRISPR RNA (tracrRNA)之Cas12i RNA引導亦小於Cas9 RNA引導。較小Cas12i多肽及RNA引導大小有益於遞送。相較於包含SpCas9多肽之組合物,包含Cas12i多肽之組合物亦展現降低的脫靶活性。參見PCT/US2021/025257,其以全文引用的方式併入本文中。此外,由包含Cas12i多肽之組合物誘導的***或缺失不同於由包含SpCas9多肽之組合物誘導的***或缺失。舉例而言,SpCas9多肽主要誘導長度為1個核苷酸之***及缺失。然而,Cas12i多肽誘導在干擾基因(諸如CIITA)之較大部分方面可能有益的較大缺失。
RNA引導 在一些實施例中,本文所描述之組合物包含靶向CIITA基因或CIITA基因之一部分的RNA引導。在一些實施例中,本文所描述之組合物包含兩個或更多個(例如2、3、4、5、6、7、8、9或更多個)靶向CIITA之RNA引導。
RNA引導可將如本文所描述之Cas12i多肽導引至CIITA目標序列。兩個或更多個RNA引導可使如本文所描述之兩個或更多個單獨Cas12i多肽(例如具有相同或不同序列之Cas12i多肽)靶向兩個或更多個(例如2、3、4、5、6、7、8、9或更多個) CIITA目標序列。
閱讀以下的特定種類之RNA引導之實例的熟習此項技術者應理解,在一些實施例中,RNA引導具有CIITA目標特異性。亦即,在一些實施例中,RNA引導與一或多個CIITA目標序列(例如在細胞內)特異性結合,且不與非靶向的序列(例如相同細胞內之非特異性DNA或隨機序列)特異性結合。
在一些實施例中,在5'至3'方向提及序列,RNA引導包含正向重複序列,隨後間隔子序列。在一些實施例中,在5'至3'方向提及序列,RNA引導包含間隔子序列,隨後正向重複序列。在一些實施例中,在5'至3'方向提及序列,RNA引導包含第一正向重複序列,隨後間隔子序列及第二正向重複序列。在一些實施例中,此類RNA引導之第一及第二正向重複相同。在一些實施例中,此類RNA引導之第一及第二正向重複不同。
在一些實施例中,RNA引導之間隔子序列及正向重複序列存在於同一RNA分子內。在一些實施例中,間隔子及正向重複序列彼此直接連接。在一些實施例中,短連接子存在於間隔子與正向重複序列之間,例如長度為1、2或3個核苷酸之RNA連接子。在一些實施例中,RNA引導之間隔子序列及正向重複序列存在於藉由鹼基配對相互作用彼此接合之單獨分子中。
關於RNA引導之例示性正向重複及間隔子組分之其他資訊提供如下。
正向重複 在一些實施例中,RNA引導包含正向重複序列。在一些實施例中,RNA引導之正向重複序列之長度在12-100、13-75、14-50或15-40個核苷酸之間(例如15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40個核苷酸)。在一些實施例中,正向重複序列之長度為至少23 nt。
在一些實施例中,正向重複序列為或包含表1之序列或表1之序列之一部分。正向重複序列可包含SEQ ID NO: 1、2、3、4、5、6、7或8中之任一者之核苷酸1至核苷酸36。正向重複序列可包含SEQ ID NO: 1、2、3、4、5、6、7或8中之任一者之核苷酸2至核苷酸36。正向重複序列可包含SEQ ID NO: 1、2、3、4、5、6、7或8中之任一者之核苷酸3至核苷酸36。正向重複序列可包含SEQ ID NO: 1、2、3、4、5、6、7或8中之任一者之核苷酸4至核苷酸36。正向重複序列可包含SEQ ID NO: 1、2、3、4、5、6、7或8中之任一者之核苷酸5至核苷酸36。正向重複序列可包含SEQ ID NO: 1、2、3、4、5、6、7或8中之任一者之核苷酸6至核苷酸36。正向重複序列可包含SEQ ID NO: 1、2、3、4、5、6、7或8中之任一者之核苷酸7至核苷酸36。正向重複序列可包含SEQ ID NO: 1、2、3、4、5、6、7或8中之任一者之核苷酸8至核苷酸36。正向重複序列可包含SEQ ID NO: 1、2、3、4、5、6、7或8中之任一者之核苷酸9至核苷酸36。正向重複序列可包含SEQ ID NO: 1、2、3、4、5、6、7或8中之任一者之核苷酸10至核苷酸36。正向重複序列可包含SEQ ID NO: 1、2、3、4、5、6、7或8中之任一者之核苷酸11至核苷酸36。正向重複序列可包含SEQ ID NO: 1、2、3、4、5、6、7或8中之任一者之核苷酸12至核苷酸36。正向重複序列可包含SEQ ID NO: 1、2、3、4、5、6、7或8中之任一者之核苷酸13至核苷酸36。正向重複序列可包含SEQ ID NO: 1、2、3、4、5、6、7或8中之任一者之核苷酸14至核苷酸36。正向重複序列可包含SEQ ID NO: 9之核苷酸1至核苷酸34。正向重複序列可包含SEQ ID NO: 9之核苷酸2至核苷酸34。正向重複序列可包含SEQ ID NO: 9之核苷酸3至核苷酸34。正向重複序列可包含SEQ ID NO: 9之核苷酸4至核苷酸34。正向重複序列可包含SEQ ID NO: 9之核苷酸5至核苷酸34。正向重複序列可包含SEQ ID NO: 9之核苷酸6至核苷酸34。正向重複序列可包含SEQ ID NO: 9之核苷酸7至核苷酸34。正向重複序列可包含SEQ ID NO: 9之核苷酸8至核苷酸34。正向重複序列可包含SEQ ID NO: 9之核苷酸9至核苷酸34。正向重複序列可包含SEQ ID NO: 9之核苷酸10至核苷酸34。正向重複序列可包含SEQ ID NO: 9之核苷酸11至核苷酸34。正向重複序列可包含SEQ ID NO: 9之核苷酸12至核苷酸34。在一些實施例中,正向重複序列闡述於SEQ ID NO: 10中。在一些實施例中,正向重複序列包含SEQ ID NO: 10中所闡述之序列之一部分。
在一些實施例中,正向重複序列具有或包含與表1之序列或表1之序列之一部分包含至少90%一致性(例如至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%一致性)的序列。正向重複序列可具有或包含與包含SEQ ID NO: 1、2、3、4、5、6、7或8中之任一者之核苷酸1至核苷酸36之序列具有至少90%一致性的序列。正向重複序列可具有或包含與包含SEQ ID NO: 1、2、3、4、5、6、7或8中之任一者之核苷酸2至核苷酸36。正向重複序列可具有或包含與包含SEQ ID NO: 1、2、3、4、5、6、7或8中之任一者之核苷酸3至核苷酸36。正向重複序列可具有或包含與包含SEQ ID NO: 1、2、3、4、5、6、7或8中之任一者之核苷酸4至核苷酸36。正向重複序列可具有或包含與包含SEQ ID NO: 1、2、3、4、5、6、7或8中之任一者之核苷酸5至核苷酸36。正向重複序列可具有或包含與包含SEQ ID NO: 1、2、3、4、5、6、7或8中之任一者之核苷酸6至核苷酸36。正向重複序列可具有或包含與包含SEQ ID NO: 1、2、3、4、5、6、7或8中之任一者之核苷酸7至核苷酸36。正向重複序列可具有或包含與包含SEQ ID NO: 1、2、3、4、5、6、7或8中之任一者之核苷酸8至核苷酸36。正向重複序列可具有或包含與包含SEQ ID NO: 1、2、3、4、5、6、7或8中之任一者之核苷酸9至核苷酸36。正向重複序列可具有或包含與包含SEQ ID NO: 1、2、3、4、5、6、7或8中之任一者之核苷酸10至核苷酸36。正向重複序列可具有或包含與包含SEQ ID NO: 1、2、3、4、5、6、7或8中之任一者之核苷酸11至核苷酸36。正向重複序列可具有或包含與包含SEQ ID NO: 1、2、3、4、5、6、7或8中之任一者之核苷酸12至核苷酸36。正向重複序列可具有或包含與包含SEQ ID NO: 1、2、3、4、5、6、7或8中之任一者之核苷酸13至核苷酸36。正向重複序列可具有或包含與包含SEQ ID NO: 1、2、3、4、5、6、7或8中之任一者之核苷酸14至核苷酸36。正向重複序列可具有或包含與包含SEQ ID NO: 9之核苷酸1至核苷酸34之序列具有至少90%一致性的序列。正向重複序列可具有或包含與包含SEQ ID NO: 9之核苷酸2至核苷酸34。正向重複序列可具有或包含與包含SEQ ID NO: 9之核苷酸3至核苷酸34。正向重複序列可具有或包含與包含SEQ ID NO: 9之核苷酸4至核苷酸34。正向重複序列可具有或包含與包含SEQ ID NO: 9之核苷酸5至核苷酸34。正向重複序列可具有或包含與包含SEQ ID NO: 9之核苷酸6至核苷酸34。正向重複序列可具有或包含與包含SEQ ID NO: 9之核苷酸7至核苷酸34。正向重複序列可具有或包含與包含SEQ ID NO: 9之核苷酸8至核苷酸34。正向重複序列可具有或包含與包含SEQ ID NO: 9之核苷酸9至核苷酸34。正向重複序列可具有或包含與包含SEQ ID NO: 9之核苷酸10至核苷酸34。正向重複序列可具有或包含與包含SEQ ID NO: 9之核苷酸11至核苷酸34。正向重複序列可具有或包含與包含SEQ ID NO: 9之核苷酸12至核苷酸34。在一些實施例中,正向重複序列與SEQ ID NO: 10具有至少90%一致性(例如至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%一致性)。在一些實施例中,正向重複序列與SEQ ID NO: 10中所闡述之序列之一部分具有至少90%一致性。
在一些實施例中,包含Cas12i2多肽以及包含SEQ ID NO: 10之正向重複及間隔子長度為20個核苷酸之RNA引導的組合物能夠將***或缺失引入CIITA目標序列中。
在一些實施例中,包含Cas12i2多肽以及包含SEQ ID NO: 10之正向重複及間隔子長度為20個核苷酸之RNA引導的組合物能夠將***或缺失引入CIITA目標序列中。參見例如實例1,其中在藉由RNP將RNA引導及SEQ ID NO: 1128之Cas12i2多肽遞送至HEK293T細胞之後,量測在多個CIITA目標序列處的***或缺失***或缺失;及實例2,其中在藉由RNP將RNA引導及SEQ ID NO: 1128之Cas12i2多肽遞送至T細胞之後,量測CIITA目標序列中的***或缺失。
在一些實施例中,正向重複序列為或包含與SEQ ID NO: 1-10中之任一者之反向互補序列至少90%一致的序列。在一些實施例中,正向重複序列為或包含SEQ ID NO: 1-10中之任一者之反向互補序列。
表1. Cas12i2正向重複序列
序列識別符 | 正向重複序列 |
SEQ ID NO: 1 | GUUGCAAAACCCAAGAAAUCCGUCUUUCAUUGACGG |
SEQ ID NO: 2 | AAUAGCGGCCCUAAGAAAUCCGUCUUUCAUUGACGG |
SEQ ID NO: 3 | AUUGGAACUGGCGAGAAAUCCGUCUUUCAUUGACGG |
SEQ ID NO: 4 | CCAGCAACACCUAAGAAAUCCGUCUUUCAUUGACGG |
SEQ ID NO: 5 | CGGCGCUCGAAUAGGAAAUCCGUCUUUCAUUGACGG |
SEQ ID NO: 6 | GUGGCAACACCUAAGAAAUCCGUCUUUCAUUGACGG |
SEQ ID NO: 7 | GUUGCAACACCUAAGAAAUCCGUCUUUCAUUGACGG |
SEQ ID NO: 8 | GUUGCAAUGCCUAAGAAAUCCGUCUUUCAUUGACGG |
SEQ ID NO: 9 | GCAACACCUAAGAAAUCCGUCUUUCAUUGACGGG |
SEQ ID NO: 10 | AGAAAUCCGUCUUUCAUUGACGG |
在一些實施例中,正向重複序列為表2之序列或表2之序列之一部分。正向重複序列可包含以下中之任一者之核苷酸1至核苷酸36:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。正向重複序列可包含以下中之任一者之核苷酸2至核苷酸36:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。正向重複序列可包含以下中之任一者之核苷酸3至核苷酸36:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。正向重複序列可包含以下中之任一者之核苷酸4至核苷酸36:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。正向重複序列可包含以下中之任一者之核苷酸5至核苷酸36:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。正向重複序列可包含以下中之任一者之核苷酸6至核苷酸36:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。正向重複序列可包含以下中之任一者之核苷酸7至核苷酸36:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。正向重複序列可包含以下中之任一者之核苷酸8至核苷酸36:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。正向重複序列可包含以下中之任一者之核苷酸9至核苷酸36:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。正向重複序列可包含以下中之任一者之核苷酸10至核苷酸36:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。正向重複序列可包含以下中之任一者之核苷酸11至核苷酸36:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。正向重複序列可包含以下中之任一者之核苷酸12至核苷酸36:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。正向重複序列可包含以下中之任一者之核苷酸13至核苷酸36:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。正向重複序列可包含以下中之任一者之核苷酸14至核苷酸36:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。
在一些實施例中,正向重複序列與表2之序列或表2之序列之一部分具有至少95%一致性(例如至少95%、96%、97%、98%或99%一致性)。正向重複序列與包含以下中之任一者之核苷酸1至核苷酸36之序列可具有至少95%一致性:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。正向重複序列與包含以下中之任一者之核苷酸2至核苷酸36之序列可具有至少95%一致性:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。正向重複序列與包含以下中之任一者之核苷酸3至核苷酸36之序列可具有至少95%一致性:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。正向重複序列與包含以下中之任一者之核苷酸4至核苷酸36之序列可具有至少95%一致性:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。正向重複序列與包含以下中之任一者之核苷酸5至核苷酸36之序列可具有至少95%一致性:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。正向重複序列與包含以下中之任一者之核苷酸6至核苷酸36之序列可具有至少95%一致性:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。正向重複序列與包含以下中之任一者之核苷酸7至核苷酸36之序列可具有至少95%一致性:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。正向重複序列與包含以下中之任一者之核苷酸8至核苷酸36之序列可具有至少95%一致性:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。正向重複序列與包含以下中之任一者之核苷酸9至核苷酸36之序列可具有至少95%一致性:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。正向重複序列與包含以下中之任一者之核苷酸10至核苷酸36之序列可具有至少95%一致性:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。正向重複序列與包含以下中之任一者之核苷酸11至核苷酸36之序列可具有至少95%一致性:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。正向重複序列與包含以下中之任一者之核苷酸12至核苷酸36之序列可具有至少95%一致性:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。正向重複序列與包含以下中之任一者之核苷酸13至核苷酸36之序列可具有至少95%一致性:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。
在一些實施例中,正向重複序列與表2之序列或表2之序列之一部分具有至少90%一致性(例如至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%一致性)。正向重複序列與包含以下中之任一者之核苷酸1至核苷酸36之序列可具有至少90%一致性:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。正向重複序列與包含以下中之任一者之核苷酸2至核苷酸36之序列可具有至少90%一致性:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。正向重複序列與包含以下中之任一者之核苷酸3至核苷酸36之序列可具有至少90%一致性:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。正向重複序列與包含以下中之任一者之核苷酸4至核苷酸36之序列可具有至少90%一致性:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。正向重複序列與包含以下中之任一者之核苷酸5至核苷酸36之序列可具有至少90%一致性:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。正向重複序列與包含以下中之任一者之核苷酸6至核苷酸36之序列可具有至少90%一致性:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。正向重複序列與包含以下中之任一者之核苷酸7至核苷酸36之序列可具有至少90%一致性:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。正向重複序列與包含以下中之任一者之核苷酸8至核苷酸36之序列可具有至少90%一致性:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。正向重複序列與包含以下中之任一者之核苷酸9至核苷酸36之序列可具有至少90%一致性:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。正向重複序列與包含以下中之任一者之核苷酸10至核苷酸36之序列可具有至少90%一致性:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。正向重複序列與包含以下中之任一者之核苷酸11至核苷酸36之序列可具有至少90%一致性:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。正向重複序列與包含以下中之任一者之核苷酸12至核苷酸36之序列可具有至少90%一致性:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。正向重複序列與包含以下中之任一者之核苷酸13至核苷酸36之序列可具有至少90%一致性:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。
在一些實施例中,正向重複序列與以下中之任一者之反向互補序列至少90%一致:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。在一些實施例中,正向重複序列與以下中之任一者之反向互補序列至少95%一致:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。在一些實施例中,正向重複序列為以下中之任一者之反向互補序列:SEQ ID NO: 1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150或1151。
在一些實施例中,正向重複序列與SEQ ID NO: 1133-1151中之任一者或SEQ ID NO: 1133-1151中之任一者之一部分至少90%一致。在一些實施例中,正向重複序列與SEQ ID NO: 1133-1151中之任一者或SEQ ID NO: 1133-1151中之任一者之一部分至少95%一致。在一些實施例中,正向重複序列與SEQ ID NO: 1133-1151中之任一者或SEQ ID NO: 1133-1151中之任一者之一部分100%一致。
表2. Cas12i4正向重複序列
序列識別符 | 正向重複序列 |
SEQ ID NO: 1133 | UCUCAACGAUAGUCAGACAUGUGUCCUCAGUGACAC |
SEQ ID NO: 1134 | UUUUAACAACACUCAGGCAUGUGUCCACAGUGACAC |
SEQ ID NO: 1135 | UUGAACGGAUACUCAGACAUGUGUUUCCAGUGACAC |
SEQ ID NO: 1136 | UGCCCUCAAUAGUCAGAUGUGUGUCCACAGUGACAC |
SEQ ID NO: 1137 | UCUCAAUGAUACUUAGAUACGUGUCCUCAGUGACAC |
SEQ ID NO: 1138 | UCUCAAUGAUACUCAGACAUGUGUCCCCAGUGACAC |
SEQ ID NO: 1139 | UCUCAAUGAUACUAAGACAUGUGUCCUCAGUGACAC |
SEQ ID NO: 1140 | UCUCAACUAUACUCAGACAUGUGUCCUCAGUGACAC |
SEQ ID NO: 1141 | UCUCAACGAUACUCAGACAUGUGUCCUCAGUGACAC |
SEQ ID NO: 1142 | UCUCAACGAUACUAAGAUAUGUGUCCUCAGCGACAC |
SEQ ID NO: 1143 | UCUCAACGAUACUAAGAUAUGUGUCCCCAGUGACAC |
SEQ ID NO: 1144 | UCUCAACGAUACUAAGAUAUGUGUCCACAGUGACAC |
SEQ ID NO: 1145 | UCUCAACAAUACUCAGACAUGUGUCCCCAGUGACAC |
SEQ ID NO: 1146 | UCUCAACAAUACUAAGGCAUGUGUCCCCAGUGACCC |
SEQ ID NO: 1147 | UCUCAAAGAUACUCAGACACGUGUCCCCAGUGACAC |
SEQ ID NO: 1148 | UCUCAAAAAUACUCAGACAUGUGUCCUCAGUGACAC |
SEQ ID NO: 1149 | GCGAAACAACAGUCAGACAUGUGUCCCCAGUGACAC |
SEQ ID NO: 1150 | CCUCAACGAUAUUAAGACAUGUGUCCGCAGUGACAC |
SEQ ID NO: 1151 | AGACAUGUGUCCUCAGUGACAC |
在一些實施例中,正向重複序列為表3之序列或表3之序列之一部分。在一些實施例中,正向重複序列與表3之序列或表3之序列之一部分具有至少95%一致性(例如至少95%、96%、97%、98%或99%一致性)。在一些實施例中,正向重複序列與表3之序列或表3之序列之一部分具有至少90%一致性(例如至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%一致性)。在一些實施例中,正向重複序列與SEQ ID NO: 1152-1154中之任一者之反向互補序列至少90%一致。在一些實施例中,正向重複序列與SEQ ID NO: 1152-1154中之任一者之反向互補序列至少95%一致。在一些實施例中,正向重複序列為SEQ ID NO: 1152-1154中之任一者之反向互補序列。
表3. Cas12i1正向重複序列
序列識別符 | 正向重複序列 |
SEQ ID NO: 1152 | GUUGGAAUGACUAAUUUUUGUGCCCACCGUUGGCAC |
SEQ ID NO: 1153 | AAUUUUUGUGCCCAUCGUUGGCAC |
SEQ ID NO: 1154 | AUUUUUGUGCCCAUCGUUGGCAC |
在一些實施例中,正向重複序列為表4之序列或表4之序列之一部分。在一些實施例中,正向重複序列與表4之序列或表4之序列之一部分具有至少95%一致性(例如至少95%、96%、97%、98%或99%一致性)。在一些實施例中,正向重複序列與表4之序列或表4之序列之一部分具有至少90%一致性(例如至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%一致性)。在一些實施例中,正向重複序列與SEQ ID NO: 1155-1157中之任一者之反向互補序列至少90%一致。在一些實施例中,正向重複序列與SEQ ID NO: 1155-1157中之任一者之反向互補序列至少95%一致。在一些實施例中,正向重複序列為SEQ ID NO: 1155-1157中之任一者之反向互補序列。
表4. Cas12i3正向重複序列
序列識別符 | 正向重複序列 |
SEQ ID NO: 1155 | CUAGCAAUGACCUAAUAGUGUGUCCUUAGUUGACAU |
SEQ ID NO: 1156 | CCUACAAUACCUAAGAAAUCCGUCCUAAGUUGACGG |
SEQ ID NO: 1157 | AUAGUGUGUCCUUAGUUGACAU |
在一些實施例中,本文所描述之正向重複序列包含尿嘧啶(U)。在一些實施例中,本文所描述之正向重複序列包含胸腺嘧啶(T)。在一些實施例中,根據表1-4之正向重複序列包含在表1-4中指示為尿嘧啶之一或多個位置中包含胸腺嘧啶的序列。
間隔子序列 在一些實施例中,RNA引導包含DNA靶向序列或間隔子序列。在一些實施例中,RNA引導之間隔子序列之長度在12-100、13-75、14-50或15-30個核苷酸之間(例如15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30個核苷酸),且與特定目標序列互補。在一些實施例中,間隔子序列設計成與例如基因體基因座之特定DNA股互補。
在一些實施例中,RNA引導間隔子序列與目標序列之互補股實質上相同。在一些實施例中,RNA引導包含與參考核酸序列(例如目標序列)之互補股具有至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約91%、至少約92%、至少約93%、至少約94%、至少約95%、至少約96%、至少約97%、至少約98%、至少約99%或至少約99.5%序列一致性之序列。兩個此類核酸之間的一致性百分比可藉由檢測兩個最佳比對之核酸序列或藉由使用軟體程式或演算法(例如BLAST、ALIGN、CLUSTAL)使用標準參數手動確定。
在一些實施例中,RNA引導包含長度在12-100、13-75、14-50或15-30個核苷酸之間(例如15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30個核苷酸)且與目標序列至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互補的間隔子序列。在一些實施例中,RNA引導包含與目標DNA序列至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互補之序列。在一些實施例中,RNA引導包含與目標基因體序列至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互補之序列。在一些實施例中,RNA引導包含長度長達50且與目標序列至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互補的序列,例如RNA序列。在一些實施例中,RNA引導包含與目標DNA序列至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互補之序列。在一些實施例中,RNA引導包含與目標基因體序列至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互補之序列。
在一些實施例中,間隔子序列為或包含表5A或表5B之序列、或表5A或表5B之序列之一部分。表5A及表5B中列出之目標序列係在CIITA序列之非目標股上。應理解,SEQ ID NO: 472-932或1018-1102之指示應視為等效於在以下範圍中之所有SEQ ID NO的清單:SEQ ID NO: 472、473、474、475、476、477、478、479、480、481、482、483、484、485、486、487、488、489、490、491、492、493、494、495、496、497、498、499、500、501、502、503、504、505、506、507、508、509、510、511、512、513、514、515、516、517、518、519、520、521、522、523、524、525、526、527、528、529、530、531、532、533、534、535、536、537、538、539、540、541、542、543、544、545、546、547、548、549、550、551、552、553、554、555、556、557、558、559、560、561、562、563、564、565、566、567、568、569、570、571、572、573、574、575、576、577、578、579、580、581、582、583、584、585、586、587、588、589、590、591、592、593、594、595、596、597、598、599、600、601、602、603、604、605、606、607、608、609、610、611、612、613、614、615、616、617、618、619、620、621、622、623、624、625、626、627、628、629、630、631、632、633、634、635、636、637、638、639、640、641、642、643、644、645、646、647、648、649、650、651、652、653、654、655、656、657、658、659、660、661、662、663、664、665、666、667、668、669、670、671、672、673、674、675、676、677、678、679、680、681、682、683、684、685、686、687、688、689、690、691、692、693、694、695、696、697、698、699、700、701、702、703、704、705、706、707、708、709、710、711、712、713、714、715、716、717、718、719、720、721、722、723、724、725、726、727、728、729、730、731、732、733、734、735、736、737、738、739、740、741、742、743、744、745、746、747、748、749、750、751、752、753、754、755、756、757、758、759、760、761、762、763、764、765、766、767、768、769、770、771、772、773、774、775,776、777、778、779、780、781、782、783、784、785、786、787、788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、805、806、807、808、809、811、812、813、814、815、816、817、818、819、820、821、822、823、824、825、826、827、828、829、830、831、832、833、834、835、836、837、838、839、840、841、842、843、844、845、846、847、848、849、850、851、852、853、854、855、856、857、858、859、860、861、862、863、864、865、866、867、868、869、870、871、872、873、874、875、876、877、878、879、880、881、882、883、884、885、886、887、888、889、890、891、892、893、894、895、896、897、898、899、900、901、902、903、904、905、906、907、908、909、910、911、912、913、914、915、916、917、918、919、920、921、922、923、924、925、926、927、928、929、930、931或932,或1018、1019、1020、1021、1022、1023、1024、1025、1026、1027、1028、1029、1030、1031、1032、1033、1034、1035、1036、1037、1038、1039、1040、1041、1042、1043、1044、1045、1046、1047、1048、1049、1050、1051、1052、1053、1054、1055、1056、1057、1058、1059、1060、1061、1062、1063、1064、1065、1066、1067、1068、1069、1070、1071、1072、1073、1074、1075、1076、1077、1078、1079、1080、1081、1082、1083、1084、1085、1086、1087、1088、1089、1090、1091、1092、1093、1094、1095、1096、1097、1098、1099、1100、1101或1102。
間隔子序列可包含SEQ ID NO: 472-932或1018-1102中之任一者之核苷酸1至核苷酸16。間隔子序列可包含SEQ ID NO: 472-932或1018-1102中之任一者之核苷酸1至核苷酸17。間隔子序列可包含SEQ ID NO: 472-932或1018-1102中之任一者之核苷酸1至核苷酸18。間隔子序列可包含SEQ ID NO: 472-932或1018-1102中之任一者之核苷酸1至核苷酸19。間隔子序列可包含SEQ ID NO: 472-932或1018-1102中之任一者之核苷酸1至核苷酸20。間隔子序列可包含SEQ ID NO: 472-932中之任一者之核苷酸1至核苷酸21。間隔子序列可包含SEQ ID NO: 472-932中之任一者之核苷酸1至核苷酸22。間隔子序列可包含SEQ ID NO: 472-932中之任一者之核苷酸1至核苷酸23。間隔子序列可包含SEQ ID NO: 472-932中之任一者之核苷酸1至核苷酸24。間隔子序列可包含SEQ ID NO: 472-932中之任一者之核苷酸1至核苷酸25。間隔子序列可包含SEQ ID NO: 472-932中之任一者之核苷酸1至核苷酸26。間隔子序列可包含SEQ ID NO: 472-932中之任一者之核苷酸1至核苷酸27。間隔子序列可包含SEQ ID NO: 472-932中之任一者之核苷酸1至核苷酸28。間隔子序列可包含SEQ ID NO: 472-932中之任一者之核苷酸1至核苷酸29。間隔子序列可包含SEQ ID NO: 472-932中之任一者之核苷酸1至核苷酸30。
在一些實施例中,間隔子序列具有或包含與表5A或表5B之序列、或表5A或表5B之序列之一部分具有至少90%一致性(例如至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%一致性)的序列。間隔子序列可具有或包含與包含SEQ ID NO: 472-932或1018-1102中之任一者之核苷酸1至核苷酸16之序列具有至少90%一致性的序列。間隔子序列可具有或包含與包含SEQ ID NO: 472-932或1018-1102中之任一者之核苷酸1至核苷酸17之序列具有至少90%一致性的序列。間隔子序列可具有或包含與包含SEQ ID NO: 472-932或1018-1102中之任一者之核苷酸1至核苷酸18之序列具有至少90%一致性的序列。間隔子序列可具有或包含與包含SEQ ID NO: 472-932或1018-1102中之任一者之核苷酸1至核苷酸19之序列具有至少90%一致性的序列。間隔子序列可具有或包含與包含SEQ ID NO: 472-932或1018-1102中之任一者之核苷酸1至核苷酸20之序列具有至少90%一致性的序列。間隔子序列可具有或包含與包含SEQ ID NO: 472-932中之任一者之核苷酸1至核苷酸21之序列具有至少90%一致性的序列。間隔子序列可具有或包含與包含SEQ ID NO: 472-932中之任一者之核苷酸1至核苷酸22。間隔子序列可具有或包含與包含SEQ ID NO: 472-932中之任一者之核苷酸1至核苷酸23。間隔子序列可具有或包含與包含SEQ ID NO: 472-932中之任一者之核苷酸1至核苷酸24。間隔子序列可具有或包含與包含SEQ ID NO: 472-932中之任一者之核苷酸1至核苷酸25。間隔子序列可具有或包含與包含SEQ ID NO: 472-932中之任一者之核苷酸1至核苷酸26。間隔子序列可具有或包含與包含SEQ ID NO: 472-932中之任一者之核苷酸1至核苷酸27。間隔子序列可具有或包含與包含SEQ ID NO: 472-932中之任一者之核苷酸1至核苷酸28。間隔子序列可具有或包含與包含SEQ ID NO: 472-932中之任一者之核苷酸1至核苷酸29。間隔子序列可具有或包含與包含SEQ ID NO: 472-932中之任一者之核苷酸1至核苷酸30。
表5A及5B.目標序列及間隔子序列
表 5A - 目標序列及間隔子序列 - CIITA 外顯子
表 5B - 目標序列及間隔子序列 - CITTA 內含子
CIITA 外顯子 | 股 | PAM | SEQ ID NO | 目標序列 | SEQ ID NO | 間隔子序列 |
CIITA_外顯子1 | - | ATTC | 11 | CCTGGAGAGGAGGTCCTCCTTCAGCAGGTT | 472 | CCUGGAGAGGAGGUCCUCCUUCAGCAGGUU |
CIITA_外顯子1 | - | GTTC | 12 | ATGGCAGCCCTTGGAGTCAGGGCAGCTGCC | 473 | AUGGCAGCCCUUGGAGUCAGGGCAGCUGCC |
CIITA_外顯子1 | - | GTTG | 13 | TTCATGGCAGCCCTTGGAGTCAGGGCAGCT | 474 | UUCAUGGCAGCCCUUGGAGUCAGGGCAGCU |
CIITA_外顯子1 | - | ATTC | 14 | TCACCTGAGTCAGGATGGCCTGGAAGTTGT | 475 | UCACCUGAGUCAGGAUGGCCUGGAAGUUGU |
CIITA_外顯子1 | - | GTTG | 15 | TCCAAGAGGGCCTGCACCAGGCTGGGCTGA | 476 | UCCAAGAGGGCCUGCACCAGGCUGGGCUGA |
CIITA_外顯子1 | - | CTTC | 16 | AGCAGGTTGTCCAAGAGGGCCTGCACCAGG | 477 | AGCAGGUUGUCCAAGAGGGCCUGCACCAGG |
CIITA_外顯子1 | + | CTTT | 17 | TAATCAAGGAGAAATGACAGACTGTAGACA | 478 | UAAUCAAGGAGAAAUGACAGACUGUAGACA |
CIITA_外顯子1 | - | CTTG | 18 | GAGTCAGGGCAGCTGCCCTGGCCAGTGCCT | 479 | GAGUCAGGGCAGCUGCCCUGGCCAGUGCCU |
CIITA_外顯子1 | + | TTTT | 19 | AATCAAGGAGAAATGACAGACTGTAGACAG | 480 | AAUCAAGGAGAAAUGACAGACUGUAGACAG |
CIITA_外顯子1 | - | ATTT | 20 | CTCCTTGATTAAAAGTGATGCCAACTTACC | 481 | CUCCUUGAUUAAAAGUGAUGCCAACUUACC |
CIITA_外顯子1 | - | TTTC | 21 | TCCTTGATTAAAAGTGATGCCAACTTACCA | 482 | UCCUUGAUUAAAAGUGAUGCCAACUUACCA |
CIITA_外顯子1 | - | CTTG | 22 | ATTAAAAGTGATGCCAACTTACCACCATGG | 483 | AUUAAAAGUGAUGCCAACUUACCACCAUGG |
CIITA_外顯子1 | - | ATTA | 23 | AAAGTGATGCCAACTTACCACCATGGTCAC | 484 | AAAGUGAUGCCAACUUACCACCAUGGUCAC |
CIITA_外顯子1 | - | CTTA | 24 | CCACCATGGTCACTGTGGCCGGGGCCCCTC | 485 | CCACCAUGGUCACUGUGGCCGGGGCCCCUC |
CIITA_外顯子1 | - | CTTT | 25 | CTCTAGTAGGGTCAAAGAGATCTTCCTGGC | 486 | CUCUAGUAGGGUCAAAGAGAUCUUCCUGGC |
CIITA_外顯子1 | + | TTTA | 26 | ATCAAGGAGAAATGACAGACTGTAGACAGC | 487 | AUCAAGGAGAAAUGACAGACUGUAGACAGC |
CIITA_外顯子1 | - | TTTC | 27 | TCTAGTAGGGTCAAAGAGATCTTCCTGGCC | 488 | UCUAGUAGGGUCAAAGAGAUCUUCCUGGCC |
CIITA_外顯子1 | - | CTTC | 28 | CTGGCCAGAGCCTCACTATCAGGCTCATGG | 489 | CUGGCCAGAGCCUCACUAUCAGGCUCAUGG |
CIITA_外顯子1 | + | TTTG | 29 | GCCCTCCTGGGGTGGGCCCGGAGTGGGCTG | 490 | GCCCUCCUGGGGUGGGCCCGGAGUGGGCUG |
CIITA_外顯子1 | + | GTTT | 30 | TGGATGCTGCATGCTGGGTGAGCGGAGATT | 491 | UGGAUGCUGCAUGCUGGGUGAGCGGAGAUU |
CIITA_外顯子1 | + | TTTT | 31 | GGATGCTGCATGCTGGGTGAGCGGAGATTC | 492 | GGAUGCUGCAUGCUGGGUGAGCGGAGAUUC |
CIITA_外顯子1 | + | TTTG | 32 | GATGCTGCATGCTGGGTGAGCGGAGATTCC | 493 | GAUGCUGCAUGCUGGGUGAGCGGAGAUUCC |
CIITA_外顯子1 | + | ATTC | 33 | CAGGCACTGGCCAGGGCAGCTGCCCTGACT | 494 | CAGGCACUGGCCAGGGCAGCUGCCCUGACU |
CIITA_外顯子1 | + | CTTC | 34 | CAGGCCATCCTGACTCAGGTGAGAATGCTG | 495 | CAGGCCAUCCUGACUCAGGUGAGAAUGCUG |
CIITA_外顯子1 | + | CTTG | 35 | GACAACCTGCTGAAGGAGGACCTCCTCTCC | 496 | GACAACCUGCUGAAGGAGGACCUCCUCUCC |
CIITA_外顯子1 | + | CTTT | 36 | GACCCTACTAGAGAAAGGAGACCTGGATTT | 497 | GACCCUACUAGAGAAAGGAGACCUGGAUUU |
CIITA_外顯子1 | + | TTTG | 37 | ACCCTACTAGAGAAAGGAGACCTGGATTTG | 498 | ACCCUACUAGAGAAAGGAGACCUGGAUUUG |
CIITA_外顯子1 | + | GTTG | 38 | GCATCACTTTTAATCAAGGAGAAATGACAG | 499 | GCAUCACUUUUAAUCAAGGAGAAAUGACAG |
CIITA_外顯子1 | + | ATTT | 39 | GGCCCTCCTGGGGTGGGCCCGGAGTGGGCT | 500 | GGCCCUCCUGGGGUGGGCCCGGAGUGGGCU |
CIITA_外顯子10 | - | TTTG | 40 | CTCGGGAGGTCAGGGCAGGTTCAGGCATGC | 501 | CUCGGGAGGUCAGGGCAGGUUCAGGCAUGC |
CIITA_外顯子10 | + | CTTC | 41 | GCTCCATCAGCCACTGACCTGCCCAGCATG | 502 | GCUCCAUCAGCCACUGACCUGCCCAGCAUG |
CIITA_外顯子10 | + | ATTC | 42 | ACTGTCCACGGCCTCCCAACATCTCCAGAC | 503 | ACUGUCCACGGCCUCCCAACAUCUCCAGAC |
CIITA_外顯子10 | + | ATTC | 43 | TCACACCACTCTCCACCCCCAATGTAGGTG | 504 | UCACACCACUCUCCACCCCCAAUGUAGGUG |
CIITA_外顯子10 | + | GTTA | 44 | TTCTCACACCACTCTCCACCCCCAATGTAG | 505 | UUCUCACACCACUCUCCACCCCCAAUGUAG |
CIITA_外顯子10 | - | ATTG | 45 | GGGGTGGAGAGTGGTGTGAGAATAACCAGG | 506 | GGGGUGGAGAGUGGUGUGAGAAUAACCAGG |
CIITA_外顯子10 | - | CTTG | 46 | GCTGGCCTGGGGCACCTCACCTACATTGGG | 507 | GCUGGCCUGGGGCACCUCACCUACAUUGGG |
CIITA_外顯子10 | - | GTTG | 47 | GGAGGCCGTGGACAGTGAATCCACTGGGAG | 508 | GGAGGCCGUGGACAGUGAAUCCACUGGGAG |
CIITA_外顯子10 | - | CTTA | 48 | CCTGTCATGTTTGCTCGGGAGGTCAGGGCA | 509 | CCUGUCAUGUUUGCUCGGGAGGUCAGGGCA |
CIITA_外顯子10 | - | GTTT | 49 | GCTCGGGAGGTCAGGGCAGGTTCAGGCATG | 510 | GCUCGGGAGGUCAGGGCAGGUUCAGGCAUG |
CIITA_外顯子10 | - | GTTC | 50 | AGGCATGCTGGGCAGGTCAGTGGCTGATGG | 511 | AGGCAUGCUGGGCAGGUCAGUGGCUGAUGG |
CIITA_外顯子10 | - | CTTC | 51 | TAGTACCTCTCACAGGCCCTAAGGGTCCTT | 512 | UAGUACCUCUCACAGGCCCUAAGGGUCCUU |
CIITA_外顯子10 | + | CTTA | 52 | GGGCCTGTGAGAGGTACTAGAAGCAGGATC | 513 | GGGCCUGUGAGAGGUACUAGAAGCAGGAUC |
CIITA_外顯子11 | + | CTTC | 53 | TCCATCTCCAGAGCACAAGACGTCCCCCAC | 514 | UCCAUCUCCAGAGCACAAGACGUCCCCCAC |
CIITA_外顯子11 | + | CTTC | 54 | CAAAATGGCCTGGTGAGTGATGCGGGATCT | 515 | CAAAAUGGCCUGGUGAGUGAUGCGGGAUCU |
CIITA_外顯子11 | - | CTTC | 55 | CATCTCCACCACCCAGGGCAGAGAGATCCC | 516 | CAUCUCCACCACCCAGGGCAGAGAGAUCCC |
CIITA_外顯子11 | - | ATTT | 56 | TGGAAGCTTGTTGGAGACCTCTCCAGCTGC | 517 | UGGAAGCUUGUUGGAGACCUCUCCAGCUGC |
CIITA_外顯子11 | - | TTTT | 57 | GGAAGCTTGTTGGAGACCTCTCCAGCTGCC | 518 | GGAAGCUUGUUGGAGACCUCUCCAGCUGCC |
CIITA_外顯子11 | - | CTTG | 58 | TTGGAGACCTCTCCAGCTGCCGGGCATTGG | 519 | UUGGAGACCUCUCCAGCUGCCGGGCAUUGG |
CIITA_外顯子11 | - | TTTG | 59 | GAAGCTTGTTGGAGACCTCTCCAGCTGCCG | 520 | GAAGCUUGUUGGAGACCUCUCCAGCUGCCG |
CIITA_外顯子11 | - | ATTG | 60 | GGTGGGGGACGTCTTGTGCTCTGGAGATGG | 521 | GGUGGGGGACGUCUUGUGCUCUGGAGAUGG |
CIITA_外顯子11 | - | CTTG | 61 | TGCTCTGGAGATGGAGAAGCAGGTGCCAGA | 522 | UGCUCUGGAGAUGGAGAAGCAGGUGCCAGA |
CIITA_外顯子11 | - | GTTG | 62 | GAGACCTCTCCAGCTGCCGGGCATTGGGTG | 523 | GAGACCUCUCCAGCUGCCGGGCAUUGGGUG |
CIITA_外顯子12 | + | GTTC | 63 | TGCTCATCCTAGACGGCTTCGAGGAGCTGG | 524 | UGCUCAUCCUAGACGGCUUCGAGGAGCUGG |
CIITA_外顯子12 | + | GTTT | 64 | TCAGCCACATCTTGAAGAGACCTGACCGCG | 525 | UCAGCCACAUCUUGAAGAGACCUGACCGCG |
CIITA_外顯子12 | + | CTTC | 65 | TCCCTGGGCCCACAGCCACTCGTGGCGGCC | 526 | UCCCUGGGCCCACAGCCACUCGUGGCGGCC |
CIITA_外顯子12 | + | CTTG | 66 | AACCGTCCGGGGGATGCCTATGGCCTGCAG | 527 | AACCGUCCGGGGGAUGCCUAUGGCCUGCAG |
CIITA_外顯子12 | - | CTTT | 67 | GATGTCTGCGGCCCAGCTCCCAGGCCAGCT | 528 | GAUGUCUGCGGCCCAGCUCCCAGGCCAGCU |
CIITA_外顯子12 | + | TTTT | 68 | CAGCCACATCTTGAAGAGACCTGACCGCGT | 529 | CAGCCACAUCUUGAAGAGACCUGACCGCGU |
CIITA_外顯子12 | + | TTTC | 69 | AGCCACATCTTGAAGAGACCTGACCGCGTT | 530 | AGCCACAUCUUGAAGAGACCUGACCGCGUU |
CIITA_外顯子12 | + | CTTG | 70 | AAGAGACCTGACCGCGTTCTGCTCATCCTA | 531 | AAGAGACCUGACCGCGUUCUGCUCAUCCUA |
CIITA_外顯子12 | + | CTTC | 71 | TCCATGGAGCAGGCCCAGGCATACGTGATG | 532 | UCCAUGGAGCAGGCCCAGGCAUACGUGAUG |
CIITA_外顯子12 | + | CTTC | 72 | GAGGAGCTGGAAGCGCAAGATGGCTTCCTG | 533 | GAGGAGCUGGAAGCGCAAGAUGGCUUCCUG |
CIITA_外顯子12 | + | CTTT | 73 | TCCAGAAGAAGCTGCTCCGAGGTTGCACCC | 534 | UCCAGAAGAAGCUGCUCCGAGGUUGCACCC |
CIITA_外顯子12 | + | TTTG | 74 | AGCTGTCCGGCTTCTCCATGGAGCAGGCCC | 535 | AGCUGUCCGGCUUCUCCAUGGAGCAGGCCC |
CIITA_外顯子12 | + | ATTT | 75 | GAGCTGTCCGGCTTCTCCATGGAGCAGGCC | 536 | GAGCUGUCCGGCUUCUCCAUGGAGCAGGCC |
CIITA_外顯子12 | + | GTTG | 76 | CACCCTCCTCCTCACAGCCCGGCCCCGGGG | 537 | CACCCUCCUCCUCACAGCCCGGCCCCGGGG |
CIITA_外顯子12 | + | TTTC | 77 | CAGAAGAAGCTGCTCCGAGGTTGCACCCTC | 538 | CAGAAGAAGCUGCUCCGAGGUUGCACCCUC |
CIITA_外顯子12 | + | TTTT | 78 | CCAGAAGAAGCTGCTCCGAGGTTGCACCCT | 539 | CCAGAAGAAGCUGCUCCGAGGUUGCACCCU |
CIITA_外顯子12 | + | CTTT | 79 | GAGAGCTCAGGGATGACAGAGCACCAAGAC | 540 | GAGAGCUCAGGGAUGACAGAGCACCAAGAC |
CIITA_外顯子12 | + | TTTG | 80 | AGAGCTCAGGGATGACAGAGCACCAAGACA | 541 | AGAGCUCAGGGAUGACAGAGCACCAAGACA |
CIITA_外顯子12 | + | CTTC | 81 | TTCTCAGTCACAGCCACAGCCCTACTTTGT | 542 | UUCUCAGUCACAGCCACAGCCCUACUUUGU |
CIITA_外顯子12 | + | CTTC | 82 | TCAGTCACAGCCACAGCCCTACTTTGTGCC | 543 | UCAGUCACAGCCACAGCCCUACUUUGUGCC |
CIITA_外顯子12 | + | CTTT | 83 | GTGCCGGGCAGTGTGCCAGCTCTCAGAGGC | 544 | GUGCCGGGCAGUGUGCCAGCUCUCAGAGGC |
CIITA_外顯子12 | + | TTTG | 84 | TGCCGGGCAGTGTGCCAGCTCTCAGAGGCC | 545 | UGCCGGGCAGUGUGCCAGCUCUCAGAGGCC |
CIITA_外顯子12 | + | CTTG | 85 | GGGAGGACGCCAAGCTGCCCTCCACGCTCA | 546 | GGGAGGACGCCAAGCUGCCCUCCACGCUCA |
CIITA_外顯子12 | + | GTTC | 86 | CCATCCGCAGACGTGAGGACCTGGGCGATG | 547 | CCAUCCGCAGACGUGAGGACCUGGGCGAUG |
CIITA_外顯子12 | + | CTTA | 87 | GTCCAACACCCACCGCGGGCCGCAGAGTCC | 548 | GUCCAACACCCACCGCGGGCCGCAGAGUCC |
CIITA_外顯子12 | + | CTTC | 88 | CCCAGCTTCCTCCTGCAATGCTTCCTGGGG | 549 | CCCAGCUUCCUCCUGCAAUGCUUCCUGGGG |
CIITA_外顯子12 | + | CTTC | 89 | CTCCTGCAATGCTTCCTGGGGGCCCTGTGG | 550 | CUCCUGCAAUGCUUCCUGGGGGCCCUGUGG |
CIITA_外顯子12 | + | CTTC | 90 | CTGGGGGCCCTGTGGCTGGCTCTGAGTGGC | 551 | CUGGGGGCCCUGUGGCUGGCUCUGAGUGGC |
CIITA_外顯子12 | + | CTTC | 91 | CTGCACAGCACGTGCGGACCGGCACCGGCG | 552 | CUGCACAGCACGUGCGGACCGGCACCGGCG |
CIITA_外顯子12 | + | ATTG | 92 | CTTGAACCGTCCGGGGGATGCCTATGGCCT | 553 | CUUGAACCGUCCGGGGGAUGCCUAUGGCCU |
CIITA_外顯子12 | + | TTTG | 93 | GCAGCACGTGGTACAGGAGCTCCCCGGCCG | 554 | GCAGCACGUGGUACAGGAGCUCCCCGGCCG |
CIITA_外顯子12 | + | CTTT | 94 | CTGGCTGGGCTGATCTTCCAGCCTCCCGCC | 555 | CUGGCUGGGCUGAUCUUCCAGCCUCCCGCC |
CIITA_外顯子12 | - | CTTG | 95 | CCCAGTACATGTGCATCAGGAGGCGTGAGG | 556 | CCCAGUACAUGUGCAUCAGGAGGCGUGAGG |
CIITA_外顯子12 | - | ATTC | 96 | CAGCCTCCTCGGCCTCGTGGGCGCAGTGCA | 557 | CAGCCUCCUCGGCCUCGUGGGCGCAGUGCA |
CIITA_外顯子12 | - | CTTC | 97 | AGGTACCTCGCAAGCACCTTCTGCTTCCTG | 558 | AGGUACCUCGCAAGCACCUUCUGCUUCCUG |
CIITA_外顯子12 | - | CTTC | 98 | TGCTTCCTGTCCACCGAGGCAGCCGCCGAT | 559 | UGCUUCCUGUCCACCGAGGCAGCCGCCGAU |
CIITA_外顯子12 | - | CTTC | 99 | CTGTCCACCGAGGCAGCCGCCGATGGCCCG | 560 | CUGUCCACCGAGGCAGCCGCCGAUGGCCCG |
CIITA_外顯子12 | - | GTTG | 100 | TCATAGGGCCTCTTCTTCCTTGGGGTCAAT | 561 | UCAUAGGGCCUCUUCUUCCUUGGGGUCAAU |
CIITA_外顯子12 | - | CTTC | 101 | TTCCTTGGGGTCAATGCTAGGTACTGCGGG | 562 | UUCCUUGGGGUCAAUGCUAGGUACUGCGGG |
CIITA_外顯子12 | - | CTTC | 102 | CTTGGGGTCAATGCTAGGTACTGCGGGAGC | 563 | CUUGGGGUCAAUGCUAGGUACUGCGGGAGC |
CIITA_外顯子12 | - | CTTG | 103 | GGGTCAATGCTAGGTACTGCGGGAGCTCCT | 564 | GGGUCAAUGCUAGGUACUGCGGGAGCUCCU |
CIITA_外顯子12 | - | CTTG | 104 | TCCTTGATTTCGCCACTCAGAGCCAGCCAC | 565 | UCCUUGAUUUCGCCACUCAGAGCCAGCCAC |
CIITA_外顯子12 | - | CTTG | 105 | ATTTCGCCACTCAGAGCCAGCCACAGGGCC | 566 | AUUUCGCCACUCAGAGCCAGCCACAGGGCC |
CIITA_外顯子12 | - | ATTT | 106 | CGCCACTCAGAGCCAGCCACAGGGCCCCCA | 567 | CGCCACUCAGAGCCAGCCACAGGGCCCCCA |
CIITA_外顯子12 | - | TTTC | 107 | GCCACTCAGAGCCAGCCACAGGGCCCCCAG | 568 | GCCACUCAGAGCCAGCCACAGGGCCCCCAG |
CIITA_外顯子12 | - | ATTG | 108 | CAGGAGGAAGCTGGGGAAGGCCAGCTCGGA | 569 | CAGGAGGAAGCUGGGGAAGGCCAGCUCGGA |
CIITA_外顯子12 | - | GTTG | 109 | GACTAAGCCTTTGGCCATCGCCCAGGTCCT | 570 | GACUAAGCCUUUGGCCAUCGCCCAGGUCCU |
CIITA_外顯子12 | - | CTTG | 110 | GCCCGCCGCCTCCAAGGCCTTGCCCAGTAC | 571 | GCCCGCCGCCUCCAAGGCCUUGCCCAGUAC |
CIITA_外顯子12 | + | ATTG | 111 | ACCCCAAGGAAGAAGAGGCCCTATGACAAC | 572 | ACCCCAAGGAAGAAGAGGCCCUAUGACAAC |
CIITA_外顯子12 | - | CTTC | 112 | CCCAAGCCCCTCACCCCACCTGAAACGGGT | 573 | CCCAAGCCCCUCACCCCACCUGAAACGGGU |
CIITA_外顯子12 | + | CTTG | 113 | GGGAAGAGACATCCTTGTGTTGGGCATTAA | 574 | GGGAAGAGACAUCCUUGUGUUGGGCAUUAA |
CIITA_外顯子12 | + | TTTC | 114 | TGGCTGGGCTGATCTTCCAGCCTCCCGCCC | 575 | UGGCUGGGCUGAUCUUCCAGCCUCCCGCCC |
CIITA_外顯子12 | + | CTTC | 115 | CAGCCTCCCGCCCGCTGCCTGGGAGCCCTA | 576 | CAGCCUCCCGCCCGCUGCCUGGGAGCCCUA |
CIITA_外顯子12 | + | CTTG | 116 | CGAGGTACCTGAAGCGGCTGCAGCCGGGGA | 577 | CGAGGUACCUGAAGCGGCUGCAGCCGGGGA |
CIITA_外顯子12 | + | ATTT | 117 | GGCAGCACGTGGTACAGGAGCTCCCCGGCC | 578 | GGCAGCACGUGGUACAGGAGCUCCCCGGCC |
CIITA_外顯子12 | + | CTTC | 118 | TCTGTCCCCTGCCATTGCTTGAACCGTCCG | 579 | UCUGUCCCCUGCCAUUGCUUGAACCGUCCG |
CIITA_外顯子12 | + | CTTT | 119 | TCTGGGCACCCGCCTCACGCCTCCTGATGC | 580 | UCUGGGCACCCGCCUCACGCCUCCUGAUGC |
CIITA_外顯子12 | + | TTTT | 120 | CTGGGCACCCGCCTCACGCCTCCTGATGCA | 581 | CUGGGCACCCGCCUCACGCCUCCUGAUGCA |
CIITA_外顯子12 | + | TTTC | 121 | TGGGCACCCGCCTCACGCCTCCTGATGCAC | 582 | UGGGCACCCGCCUCACGCCUCCUGAUGCAC |
CIITA_外顯子12 | + | CTTG | 122 | GAGGCGGCGGGCCAAGACTTCTCCCTGGAC | 583 | GAGGCGGCGGGCCAAGACUUCUCCCUGGAC |
CIITA_外顯子12 | + | CTTC | 123 | TCCCTGGACCTCCGCAGCACTGGCATTTGC | 584 | UCCCUGGACCUCCGCAGCACUGGCAUUUGC |
CIITA_外顯子12 | + | ATTT | 124 | GCCCCTCTGGATTGGGGAGCCTCGTGGGAC | 585 | GCCCCUCUGGAUUGGGGAGCCUCGUGGGAC |
CIITA_外顯子12 | + | TTTG | 125 | CCCCTCTGGATTGGGGAGCCTCGTGGGACT | 586 | CCCCUCUGGAUUGGGGAGCCUCGUGGGACU |
CIITA_外顯子12 | + | ATTG | 126 | GGGAGCCTCGTGGGACTCAGCTGTGTCACC | 587 | GGGAGCCUCGUGGGACUCAGCUGUGUCACC |
CIITA_外顯子12 | + | GTTT | 127 | CAGGTGGGGTGAGGGGCTTGGGGAAGAGAC | 588 | CAGGUGGGGUGAGGGGCUUGGGGAAGAGAC |
CIITA_外顯子12 | + | TTTC | 128 | AGGTGGGGTGAGGGGCTTGGGGAAGAGACA | 589 | AGGUGGGGUGAGGGGCUUGGGGAAGAGACA |
CIITA_外顯子12 | - | GTTA | 129 | ATGCCCAACACAAGGATGTCTCTTCCCCAA | 590 | AUGCCCAACACAAGGAUGUCUCUUCCCCAA |
CIITA_外顯子12 | + | TTTG | 130 | TCTTCTCTGTCCCCTGCCATTGCTTGAACC | 591 | UCUUCUCUGUCCCCUGCCAUUGCUUGAACC |
CIITA_外顯子12 | - | TTTG | 131 | GCCATCGCCCAGGTCCTCACGTCTGCGGAT | 592 | GCCAUCGCCCAGGUCCUCACGUCUGCGGAU |
CIITA_外顯子12 | + | CTTC | 132 | CCCAGTACGACTTTGTCTTCTCTGTCCCCT | 593 | CCCAGUACGACUUUGUCUUCUCUGUCCCCU |
CIITA_外顯子12 | - | CTTG | 133 | GCCAGCTCTGCCAGGGCCCCGGGGGGGCTG | 594 | GCCAGCUCUGCCAGGGCCCCGGGGGGGCUG |
CIITA_外顯子12 | - | CTTG | 134 | GCGTCCTCCCCAAGCTCCAGCAGGGCCTCT | 595 | GCGUCCUCCCCAAGCUCCAGCAGGGCCUCU |
CIITA_外顯子12 | + | CTTT | 135 | GTCTTCTCTGTCCCCTGCCATTGCTTGAAC | 596 | GUCUUCUCUGUCCCCUGCCAUUGCUUGAAC |
CIITA_外顯子12 | - | CTTG | 136 | CTCAGGCTCTGGACCAGGCGGCCCCGGGGC | 597 | CUCAGGCUCUGGACCAGGCGGCCCCGGGGC |
CIITA_外顯子12 | - | CTTC | 137 | TTCTGGAAAAGGCCGGCCAGCAGCCCCCGG | 598 | UUCUGGAAAAGGCCGGCCAGCAGCCCCCGG |
CIITA_外顯子12 | - | CTTC | 138 | TGGAAAAGGCCGGCCAGCAGCCCCCGGAGG | 599 | UGGAAAAGGCCGGCCAGCAGCCCCCGGAGG |
CIITA_外顯子12 | - | CTTG | 139 | CGCTTCCAGCTCCTCGAAGCCGTCTAGGAT | 600 | CGCUUCCAGCUCCUCGAAGCCGUCUAGGAU |
CIITA_外顯子12 | - | CTTC | 140 | CAGCTCCTCGAAGCCGTCTAGGATGAGCAG | 601 | CAGCUCCUCGAAGCCGUCUAGGAUGAGCAG |
CIITA_外顯子12 | - | TTTG | 141 | ATGTCTGCGGCCCAGCTCCCAGGCCAGCTT | 602 | AUGUCUGCGGCCCAGCUCCCAGGCCAGCUU |
CIITA_外顯子12 | - | CTTC | 142 | AAGATGTGGCTGAAAACCTCATCGGCCGCC | 603 | AAGAUGUGGCUGAAAACCUCAUCGGCCGCC |
CIITA_外顯子12 | - | CTTG | 143 | CCCTGACCAGCTTTGCCCAGCACAGCAATC | 604 | CCCUGACCAGCUUUGCCCAGCACAGCAAUC |
CIITA_外顯子12 | - | CTTT | 144 | GCCCAGCACAGCAATCACTCGTGTCTCACG | 605 | GCCCAGCACAGCAAUCACUCGUGUCUCACG |
CIITA_外顯子12 | - | TTTG | 145 | CCCAGCACAGCAATCACTCGTGTCTCACGC | 606 | CCCAGCACAGCAAUCACUCGUGUCUCACGC |
CIITA_外顯子12 | - | CTTG | 146 | GCAGCCAACAGCACCTCAGCCAGGCCTCCT | 607 | GCAGCCAACAGCACCUCAGCCAGGCCUCCU |
CIITA_外顯子12 | - | CTTG | 147 | GGCCAGCTGCCGTTCTGCCCAGTCCGGGGT | 608 | GGCCAGCUGCCGUUCUGCCCAGUCCGGGGU |
CIITA_外顯子12 | - | GTTC | 148 | TGCCCAGTCCGGGGTGGCCAGTTCCCGCTC | 609 | UGCCCAGUCCGGGGUGGCCAGUUCCCGCUC |
CIITA_外顯子12 | - | GTTC | 149 | CCGCTCCAGGCTCTTGCTGCTGCTCCTCTC | 610 | CCGCUCCAGGCUCUUGCUGCUGCUCCUCUC |
CIITA_外顯子12 | - | CTTG | 150 | CTGCTGCTCCTCTCCAGCCTGGCCTGCACC | 611 | CUGCUGCUCCUCUCCAGCCUGGCCUGCACC |
CIITA_外顯子12 | - | GTTC | 151 | AAGCAATGGCAGGGGACAGAGAAGACAAAG | 612 | AAGCAAUGGCAGGGGACAGAGAAGACAAAG |
CIITA_外顯子12 | - | CTTT | 152 | GGCCATCGCCCAGGTCCTCACGTCTGCGGA | 613 | GGCCAUCGCCCAGGUCCUCACGUCUGCGGA |
CIITA_外顯子12 | - | CTTG | 153 | GTGCTCTGTCATCCCTGAGCTCTCAAAGTA | 614 | GUGCUCUGUCAUCCCUGAGCUCUCAAAGUA |
CIITA_外顯子12 | + | GTTC | 154 | TACCGCTCACTGCAGGACACGTATGGTGCC | 615 | UACCGCUCACUGCAGGACACGUAUGGUGCC |
CIITA_外顯子12 | + | CTTG | 155 | TGGCCGGCTTCCCCAGTACGACTTTGTCTT | 616 | UGGCCGGCUUCCCCAGUACGACUUUGUCUU |
CIITA_外顯子12 | + | ATTG | 156 | GGCTGGGGCAGTGAGCCGGGCCTGGGCTTG | 617 | GGCUGGGGCAGUGAGCCGGGCCUGGGCUUG |
CIITA_外顯子12 | + | ATTG | 157 | CTGTGCTGGGCAAAGCTGGTCAGGGCAAGA | 618 | CUGUGCUGGGCAAAGCUGGUCAGGGCAAGA |
CIITA_外顯子12 | + | GTTG | 158 | GCTGCCAAGGAGCACCGGCGGCCGCGTGAG | 619 | GCUGCCAAGGAGCACCGGCGGCCGCGUGAG |
CIITA_外顯子12 | + | TTTG | 159 | CAGAGCCGGTGGAGCAGTTCTACCGCTCAC | 620 | CAGAGCCGGUGGAGCAGUUCUACCGCUCAC |
CIITA_外顯子12 | + | CTTT | 160 | GCAGAGCCGGTGGAGCAGTTCTACCGCTCA | 621 | GCAGAGCCGGUGGAGCAGUUCUACCGCUCA |
CIITA_外顯子13 | + | GTTC | 161 | ACCATCGAGCCTTTCAAAGCCAAGTCCCTG | 622 | ACCAUCGAGCCUUUCAAAGCCAAGUCCCUG |
CIITA_外顯子13 | - | CTTA | 162 | ATGGAAGGGCAGCTCCATGAAGGGTCCTCC | 623 | AUGGAAGGGCAGCUCCAUGAAGGGUCCUCC |
CIITA_外顯子13 | - | CTTG | 163 | GTCTCCCCATGCTGCTGCAGGGACTCCCAC | 624 | GUCUCCCCAUGCUGCUGCAGGGACUCCCAC |
CIITA_外顯子13 | - | CTTC | 164 | TCCTCTGCTGCCTGAAGTAGCTTGGTCTCC | 625 | UCCUCUGCUGCCUGAAGUAGCUUGGUCUCC |
CIITA_外顯子13 | - | TTTG | 165 | AAAGGCTCGATGGTGAACTTCTCCTCTGCT | 626 | AAAGGCUCGAUGGUGAACUUCUCCUCUGCU |
CIITA_外顯子13 | - | CTTT | 166 | GAAAGGCTCGATGGTGAACTTCTCCTCTGC | 627 | GAAAGGCUCGAUGGUGAACUUCUCCUCUGC |
CIITA_外顯子13 | - | CTTG | 167 | GCTTTGAAAGGCTCGATGGTGAACTTCTCC | 628 | GCUUUGAAAGGCUCGAUGGUGAACUUCUCC |
CIITA_外顯子13 | + | CTTC | 168 | AGGCAGCAGAGGAGAAGTTCACCATCGAGC | 629 | AGGCAGCAGAGGAGAAGUUCACCAUCGAGC |
CIITA_外顯子13 | - | CTTC | 169 | CACATCCTTCAGGGACTTGGCTTTGAAAGG | 630 | CACAUCCUUCAGGGACUUGGCUUUGAAAGG |
CIITA_外顯子13 | - | CTTC | 170 | AGGGACTTGGCTTTGAAAGGCTCGATGGTG | 631 | AGGGACUUGGCUUUGAAAGGCUCGAUGGUG |
CIITA_外顯子13 | + | CTTG | 171 | AGCGACACGGTGGCGCTGTGGGAGTCCCTG | 632 | AGCGACACGGUGGCGCUGUGGGAGUCCCUG |
CIITA_外顯子13 | + | CTTT | 172 | CAAAGCCAAGTCCCTGAAGGATGTGGAAGA | 633 | CAAAGCCAAGUCCCUGAAGGAUGUGGAAGA |
CIITA_外顯子13 | + | CTTC | 173 | CATTAAGGTCTAGCCTGGTCACCGTGCCTG | 634 | CAUUAAGGUCUAGCCUGGUCACCGUGCCUG |
CIITA_外顯子13 | + | CTTC | 174 | ATGGAGCTGCCCTTCCATTAAGGTCTAGCC | 635 | AUGGAGCUGCCCUUCCAUUAAGGUCUAGCC |
CIITA_外顯子13 | + | TTTA | 175 | ATAGGTAGGAGGACCCTTCATGGAGCTGCC | 636 | AUAGGUAGGAGGACCCUUCAUGGAGCUGCC |
CIITA_外顯子13 | + | ATTA | 176 | AGGTCTAGCCTGGTCACCGTGCCTGGGTCT | 637 | AGGUCUAGCCUGGUCACCGUGCCUGGGUCU |
CIITA_外顯子13 | + | ATTT | 177 | TAATAGGTAGGAGGACCCTTCATGGAGCTG | 638 | UAAUAGGUAGGAGGACCCUUCAUGGAGCUG |
CIITA_外顯子13 | + | TTTC | 178 | AAAGCCAAGTCCCTGAAGGATGTGGAAGAC | 639 | AAAGCCAAGUCCCUGAAGGAUGUGGAAGAC |
CIITA_外顯子13 | + | CTTG | 179 | TGCAGACTCAGAGGTGAGAGGAGAGGCGGA | 640 | UGCAGACUCAGAGGUGAGAGGAGAGGCGGA |
CIITA_外顯子13 | - | CTTT | 180 | CCCAGGTCTTCCACATCCTTCAGGGACTTG | 641 | CCCAGGUCUUCCACAUCCUUCAGGGACUUG |
CIITA_外顯子13 | - | TTTC | 181 | CCAGGTCTTCCACATCCTTCAGGGACTTGG | 642 | CCAGGUCUUCCACAUCCUUCAGGGACUUGG |
CIITA_外顯子13 | + | TTTT | 182 | AATAGGTAGGAGGACCCTTCATGGAGCTGC | 643 | AAUAGGUAGGAGGACCCUUCAUGGAGCUGC |
CIITA_外顯子14 | + | ATTG | 183 | CCTGTTCTCTCCAGGACGAGAAGTTCCTCG | 644 | CCUGUUCUCUCCAGGACGAGAAGUUCCUCG |
CIITA_外顯子14 | + | GTTC | 184 | TCTCCAGGACGAGAAGTTCCTCGGAAGACA | 645 | UCUCCAGGACGAGAAGUUCCUCGGAAGACA |
CIITA_外顯子14 | + | GTTC | 185 | CTCGGAAGACACAGCTGGGGAGCTCCCTGC | 646 | CUCGGAAGACACAGCUGGGGAGCUCCCUGC |
CIITA_外顯子14 | + | GTTC | 186 | GGGACCTAAAGAAACTGGAGTTTGCGTAAG | 647 | GGGACCUAAAGAAACUGGAGUUUGCGUAAG |
CIITA_外顯子14 | + | GTTT | 187 | GCGTAAGCAAAGGGGTGGATTGTCTTGTGG | 648 | GCGUAAGCAAAGGGGUGGAUUGUCUUGUGG |
CIITA_外顯子14 | + | TTTG | 188 | CGTAAGCAAAGGGGTGGATTGTCTTGTGGG | 649 | CGUAAGCAAAGGGGUGGAUUGUCUUGUGGG |
CIITA_外顯子14 | + | ATTG | 189 | TCTTGTGGGTCTGCGCAAGGTTTCCCCTGC | 650 | UCUUGUGGGUCUGCGCAAGGUUUCCCCUGC |
CIITA_外顯子14 | - | TTTG | 190 | CTTACGCAAACTCCAGTTTCTTTAGGTCCC | 651 | CUUACGCAAACUCCAGUUUCUUUAGGUCCC |
CIITA_外顯子14 | - | CTTT | 191 | GCTTACGCAAACTCCAGTTTCTTTAGGTCC | 652 | GCUUACGCAAACUCCAGUUUCUUUAGGUCC |
CIITA_外顯子14 | - | CTTA | 192 | CGCAAACTCCAGTTTCTTTAGGTCCCGAAC | 653 | CGCAAACUCCAGUUUCUUUAGGUCCCGAAC |
CIITA_外顯子14 | - | GTTT | 193 | CTTTAGGTCCCGAACAGCAGGGAGCTCCCC | 654 | CUUUAGGUCCCGAACAGCAGGGAGCUCCCC |
CIITA_外顯子14 | - | TTTC | 194 | TTTAGGTCCCGAACAGCAGGGAGCTCCCCA | 655 | UUUAGGUCCCGAACAGCAGGGAGCUCCCCA |
CIITA_外顯子14 | - | TTTA | 195 | GGTCCCGAACAGCAGGGAGCTCCCCAGCTG | 656 | GGUCCCGAACAGCAGGGAGCUCCCCAGCUG |
CIITA_外顯子14 | - | CTTC | 196 | CGAGGAACTTCTCGTCCTGGAGAGAACAGG | 657 | CGAGGAACUUCUCGUCCUGGAGAGAACAGG |
CIITA_外顯子14 | - | CTTC | 197 | TCGTCCTGGAGAGAACAGGCAATGTTAGGG | 658 | UCGUCCUGGAGAGAACAGGCAAUGUUAGGG |
CIITA_外顯子14 | - | CTTG | 198 | CGCAGACCCACAAGACAATCCACCCCTTTG | 659 | CGCAGACCCACAAGACAAUCCACCCCUUUG |
CIITA_外顯子14 | - | CTTT | 199 | AGGTCCCGAACAGCAGGGAGCTCCCCAGCT | 660 | AGGUCCCGAACAGCAGGGAGCUCCCCAGCU |
CIITA_外顯子15 | + | CTTA | 200 | CCCTTGCTCTTTGCCTCCTAGGCTGGGCCC | 661 | CCCUUGCUCUUUGCCUCCUAGGCUGGGCCC |
CIITA_外顯子15 | + | TTTG | 201 | CCTCCTAGGCTGGGCCCTGTCTCAGGCCCC | 662 | CCUCCUAGGCUGGGCCCUGUCUCAGGCCCC |
CIITA_外顯子15 | - | TTTG | 202 | GGGAAAGCCTGGGGGCCTGAGACAGGGCCC | 663 | GGGAAAGCCUGGGGGCCUGAGACAGGGCCC |
CIITA_外顯子15 | - | GTTT | 203 | GGGGAAAGCCTGGGGGCCTGAGACAGGGCC | 664 | GGGGAAAGCCUGGGGGCCUGAGACAGGGCC |
CIITA_外顯子15 | - | GTTG | 204 | AGAGGAAGGGGTCCCAGAGTCTATACTCAC | 665 | AGAGGAAGGGGUCCCAGAGUCUAUACUCAC |
CIITA_外顯子15 | + | TTTC | 205 | CTCCCTGCAGCATCTGGAGTGAGTATAGAC | 666 | CUCCCUGCAGCAUCUGGAGUGAGUAUAGAC |
CIITA_外顯子15 | + | TTTT | 206 | CCTCCCTGCAGCATCTGGAGTGAGTATAGA | 667 | CCUCCCUGCAGCAUCUGGAGUGAGUAUAGA |
CIITA_外顯子15 | + | CTTT | 207 | TCCTCCCTGCAGCATCTGGAGTGAGTATAG | 668 | UCCUCCCUGCAGCAUCUGGAGUGAGUAUAG |
CIITA_外顯子15 | + | TTTC | 208 | CCCAAACTGGTGCGGATCCTCACGGCCTTT | 669 | CCCAAACUGGUGCGGAUCCUCACGGCCUUU |
CIITA_外顯子15 | + | CTTT | 209 | CCCCAAACTGGTGCGGATCCTCACGGCCTT | 670 | CCCCAAACUGGUGCGGAUCCUCACGGCCUU |
CIITA_外顯子15 | + | CTTT | 210 | GCCTCCTAGGCTGGGCCCTGTCTCAGGCCC | 671 | GCCUCCUAGGCUGGGCCCUGUCUCAGGCCC |
CIITA_外顯子15 | + | CTTG | 211 | CTCTTTGCCTCCTAGGCTGGGCCCTGTCTC | 672 | CUCUUUGCCUCCUAGGCUGGGCCCUGUCUC |
CIITA_外顯子16 | - | GTTC | 212 | TCACTCAGCGCATCCAGGCTGCAGGTGGAA | 673 | UCACUCAGCGCAUCCAGGCUGCAGGUGGAA |
CIITA_外顯子16 | + | CTTC | 213 | CCCCAGCTGAAGTCCTTGGAAACCCTCAAG | 674 | CCCCAGCUGAAGUCCUUGGAAACCCUCAAG |
CIITA_外顯子16 | - | CTTG | 214 | TTCTCACTCAGCGCATCCAGGCTGCAGGTG | 675 | UUCUCACUCAGCGCAUCCAGGCUGCAGGUG |
CIITA_外顯子16 | - | CTTC | 215 | AGCTGGGGGAAGGTGGCTGAGAGCTGCGAG | 676 | AGCUGGGGGAAGGUGGCUGAGAGCUGCGAG |
CIITA_外顯子16 | + | ATTC | 216 | CACCTGCAGCCTGGATGCGCTGAGTGAGAA | 677 | CACCUGCAGCCUGGAUGCGCUGAGUGAGAA |
CIITA_外顯子16 | - | GTTT | 217 | CCAAGGACTTCAGCTGGGGGAAGGTGGCTG | 678 | CCAAGGACUUCAGCUGGGGGAAGGUGGCUG |
CIITA_外顯子16 | - | CTTG | 218 | AGGGTTTCCAAGGACTTCAGCTGGGGGAAG | 679 | AGGGUUUCCAAGGACUUCAGCUGGGGGAAG |
CIITA_外顯子16 | - | TTTC | 219 | CAAGGACTTCAGCTGGGGGAAGGTGGCTGA | 680 | CAAGGACUUCAGCUGGGGGAAGGUGGCUGA |
CIITA_外顯子16 | - | TTTG | 220 | GGGGCCCGATTCAGCAGGAAGGGCAGGCCC | 681 | GGGGCCCGAUUCAGCAGGAAGGGCAGGCCC |
CIITA_外顯子16 | - | CTTT | 221 | GGGGGCCCGATTCAGCAGGAAGGGCAGGCC | 682 | GGGGGCCCGAUUCAGCAGGAAGGGCAGGCC |
CIITA_外顯子16 | + | CTTG | 222 | GAAACCCTCAAGTGAGTGAGCTGGGCCTGC | 683 | GAAACCCUCAAGUGAGUGAGCUGGGCCUGC |
CIITA_外顯子16 | - | ATTC | 223 | AGCAGGAAGGGCAGGCCCAGCTCACTCACT | 684 | AGCAGGAAGGGCAGGCCCAGCUCACUCACU |
CIITA_外顯子17 | + | ATTT | 224 | AAATTTGTTTTTTTAGACAAGGGCTCGCTG | 685 | AAAUUUGUUUUUUUAGACAAGGGCUCGCUG |
CIITA_外顯子17 | + | CTTT | 225 | TTCAAAATTAATTTAAATTTGTTTTTTTAG | 686 | UUCAAAAUUAAUUUAAAUUUGUUUUUUUAG |
CIITA_外顯子17 | + | TTTT | 226 | TCAAAATTAATTTAAATTTGTTTTTTTAGA | 687 | UCAAAAUUAAUUUAAAUUUGUUUUUUUAGA |
CIITA_外顯子17 | + | TTTT | 227 | CAAAATTAATTTAAATTTGTTTTTTTAGAC | 688 | CAAAAUUAAUUUAAAUUUGUUUUUUUAGAC |
CIITA_外顯子17 | + | TTTC | 228 | AAAATTAATTTAAATTTGTTTTTTTAGACA | 689 | AAAAUUAAUUUAAAUUUGUUUUUUUAGACA |
CIITA_外顯子17 | + | ATTA | 229 | ATTTAAATTTGTTTTTTTAGACAAGGGCTC | 690 | AUUUAAAUUUGUUUUUUUAGACAAGGGCUC |
CIITA_外顯子17 | + | TTTA | 230 | AATTTGTTTTTTTAGACAAGGGCTCGCTGT | 691 | AAUUUGUUUUUUUAGACAAGGGCUCGCUGU |
CIITA_外顯子17 | + | GTTT | 231 | TTTTAGACAAGGGCTCGCTGTGTCACCCAG | 692 | UUUUAGACAAGGGCUCGCUGUGUCACCCAG |
CIITA_外顯子17 | + | TTTG | 232 | TTTTTTTAGACAAGGGCTCGCTGTGTCACC | 693 | UUUUUUUAGACAAGGGCUCGCUGUGUCACC |
CIITA_外顯子17 | - | TTTA | 233 | AATTAATTTTGAAAAAGTCAGCCGGACTTT | 694 | AAUUAAUUUUGAAAAAGUCAGCCGGACUUU |
CIITA_外顯子17 | - | ATTT | 234 | AAATTAATTTTGAAAAAGTCAGCCGGACTT | 695 | AAAUUAAUUUUGAAAAAGUCAGCCGGACUU |
CIITA_外顯子17 | - | CTTG | 235 | TCTAAAAAAACAAATTTAAATTAATTTTGA | 696 | UCUAAAAAAACAAAUUUAAAUUAAUUUUGA |
CIITA_外顯子17 | - | ATTC | 236 | TAGCCTGGGTGACACAGCGAGCCCTTGTCT | 697 | UAGCCUGGGUGACACAGCGAGCCCUUGUCU |
CIITA_外顯子17 | + | ATTT | 237 | GTTTTTTTAGACAAGGGCTCGCTGTGTCAC | 698 | GUUUUUUUAGACAAGGGCUCGCUGUGUCAC |
CIITA_外顯子17 | - | CTTG | 238 | AGGCCAGGAGTTCAAGGCTGCAGAGGTATG | 699 | AGGCCAGGAGUUCAAGGCUGCAGAGGUAUG |
CIITA_外顯子17 | - | ATTC | 239 | CTTGAGGCCAGGAGTTCAAGGCTGCAGAGG | 700 | CUUGAGGCCAGGAGUUCAAGGCUGCAGAGG |
CIITA_外顯子17 | - | TTTG | 240 | GGAAGCGGAGGTGAGGAGATTCCTTGAGGC | 701 | GGAAGCGGAGGUGAGGAGAUUCCUUGAGGC |
CIITA_外顯子17 | - | GTTC | 241 | AAGGCTGCAGAGGTATGATCATAGCACTAT | 702 | AAGGCUGCAGAGGUAUGAUCAUAGCACUAU |
CIITA_外顯子17 | + | CTTG | 242 | AACTCCTGGCCTCAAGGAATCTCCTCACCT | 703 | AACUCCUGGCCUCAAGGAAUCUCCUCACCU |
CIITA_外顯子17 | + | TTTA | 243 | GACAAGGGCTCGCTGTGTCACCCAGGCTAG | 704 | GACAAGGGCUCGCUGUGUCACCCAGGCUAG |
CIITA_外顯子17 | + | TTTT | 244 | AGACAAGGGCTCGCTGTGTCACCCAGGCTA | 705 | AGACAAGGGCUCGCUGUGUCACCCAGGCUA |
CIITA_外顯子17 | + | TTTT | 245 | TAGACAAGGGCTCGCTGTGTCACCCAGGCT | 706 | UAGACAAGGGCUCGCUGUGUCACCCAGGCU |
CIITA_外顯子17 | + | TTTT | 246 | TTAGACAAGGGCTCGCTGTGTCACCCAGGC | 707 | UUAGACAAGGGCUCGCUGUGUCACCCAGGC |
CIITA_外顯子17 | + | TTTT | 247 | TTTAGACAAGGGCTCGCTGTGTCACCCAGG | 708 | UUUAGACAAGGGCUCGCUGUGUCACCCAGG |
CIITA_外顯子17 | - | CTTT | 248 | GGGAAGCGGAGGTGAGGAGATTCCTTGAGG | 709 | GGGAAGCGGAGGUGAGGAGAUUCCUUGAGG |
CIITA_外顯子18 | - | GTTG | 249 | TTCTGGGACAGACTGCGGGGACACAGTGAG | 710 | UUCUGGGACAGACUGCGGGGACACAGUGAG |
CIITA_外顯子18 | + | GTTT | 250 | GGTCCTGAGCCCTCCCCCTCACTGTGTCCC | 711 | GGUCCUGAGCCCUCCCCCUCACUGUGUCCC |
CIITA_外顯子18 | + | TTTG | 251 | GTCCTGAGCCCTCCCCCTCACTGTGTCCCC | 712 | GUCCUGAGCCCUCCCCCUCACUGUGUCCCC |
CIITA_外顯子18 | + | CTTC | 252 | GCTCGCTGCATCCCTGCTCAGGCTAAGGTG | 713 | GCUCGCUGCAUCCCUGCUCAGGCUAAGGUG |
CIITA_外顯子18 | - | CTTA | 253 | GCCTGAGCAGGGATGCAGCGAGCGAAGGCA | 714 | GCCUGAGCAGGGAUGCAGCGAGCGAAGGCA |
CIITA_外顯子18 | - | GTTT | 254 | GTAGGCACCCAGGTCAGTGATGTTGTTCTG | 715 | GUAGGCACCCAGGUCAGUGAUGUUGUUCUG |
CIITA_外顯子18 | - | TTTG | 255 | TAGGCACCCAGGTCAGTGATGTTGTTCTGG | 716 | UAGGCACCCAGGUCAGUGAUGUUGUUCUGG |
CIITA_外顯子18 | - | GTTC | 256 | TGGGACAGACTGCGGGGACACAGTGAGGGG | 717 | UGGGACAGACUGCGGGGACACAGUGAGGGG |
CIITA_外顯子19 | + | TTTC | 257 | CGGAACCTAGGGGTGGTGGCTTCTGGAAGG | 718 | CGGAACCUAGGGGUGGUGGCUUCUGGAAGG |
CIITA_外顯子19 | + | CTTT | 258 | TTCCGGAACCTAGGGGTGGTGGCTTCTGGA | 719 | UUCCGGAACCUAGGGGUGGUGGCUUCUGGA |
CIITA_外顯子19 | + | CTTC | 259 | TGGTAGGCCTTGGCATAGCACCTCTTGCTT | 720 | UGGUAGGCCUUGGCAUAGCACCUCUUGCUU |
CIITA_外顯子19 | + | CTTG | 260 | GCATAGCACCTCTTGCTTTTGAGTGACTTC | 721 | GCAUAGCACCUCUUGCUUUUGAGUGACUUC |
CIITA_外顯子19 | + | CTTG | 261 | CTTTTGAGTGACTTCCATCCAGGCCCTGGT | 722 | CUUUUGAGUGACUUCCAUCCAGGCCCUGGU |
CIITA_外顯子19 | + | CTTT | 262 | TGAGTGACTTCCATCCAGGCCCTGGTGTGG | 723 | UGAGUGACUUCCAUCCAGGCCCUGGUGUGG |
CIITA_外顯子19 | + | TTTT | 263 | GAGTGACTTCCATCCAGGCCCTGGTGTGGT | 724 | GAGUGACUUCCAUCCAGGCCCUGGUGUGGU |
CIITA_外顯子19 | + | TTTG | 264 | AGTGACTTCCATCCAGGCCCTGGTGTGGTC | 725 | AGUGACUUCCAUCCAGGCCCUGGUGUGGUC |
CIITA_外顯子19 | - | ATTA | 265 | CCTCTGGGACCACACCAGGGCCTGGATGGA | 726 | CCUCUGGGACCACACCAGGGCCUGGAUGGA |
CIITA_外顯子19 | + | TTTC | 266 | ACTGCCACCTTCTGGTAGGCCTTGGCATAG | 727 | ACUGCCACCUUCUGGUAGGCCUUGGCAUAG |
CIITA_外顯子19 | - | GTTA | 267 | GCCTTCCAGAAGCCACCACCCCTAGGTTCC | 728 | GCCUUCCAGAAGCCACCACCCCUAGGUUCC |
CIITA_外顯子19 | - | GTTC | 268 | CGGAAAAAGCCTGGTCCCGCCATCCCTGGG | 729 | CGGAAAAAGCCUGGUCCCGCCAUCCCUGGG |
CIITA_外顯子19 | + | TTTC | 269 | CCCCAGGGATGGCGGGACCAGGCTTTTTCC | 730 | CCCCAGGGAUGGCGGGACCAGGCUUUUUCC |
CIITA_外顯子19 | + | TTTT | 270 | CCCCCAGGGATGGCGGGACCAGGCTTTTTC | 731 | CCCCCAGGGAUGGCGGGACCAGGCUUUUUC |
CIITA_外顯子19 | + | CTTT | 271 | TCCCCCAGGGATGGCGGGACCAGGCTTTTT | 732 | UCCCCCAGGGAUGGCGGGACCAGGCUUUUU |
CIITA_外顯子19 | + | ATTG | 272 | CTCCTTTTCCCCCAGGGATGGCGGGACCAG | 733 | CUCCUUUUCCCCCAGGGAUGGCGGGACCAG |
CIITA_外顯子19 | + | GTTA | 273 | TGCAATAAATATTGCTCCTTTTCCCCCAGG | 734 | UGCAAUAAAUAUUGCUCCUUUUCCCCCAGG |
CIITA_外顯子19 | + | GTTC | 274 | TGTTATGCAATAAATATTGCTCCTTTTCCC | 735 | UGUUAUGCAAUAAAUAUUGCUCCUUUUCCC |
CIITA_外顯子19 | - | CTTC | 275 | CAGAAGCCACCACCCCTAGGTTCCGGAAAA | 736 | CAGAAGCCACCACCCCUAGGUUCCGGAAAA |
CIITA_外顯子19 | + | GTTT | 276 | CACTGCCACCTTCTGGTAGGCCTTGGCATA | 737 | CACUGCCACCUUCUGGUAGGCCUUGGCAUA |
CIITA_外顯子19 | + | CTTC | 277 | CATCCAGGCCCTGGTGTGGTCCCAGAGGTA | 738 | CAUCCAGGCCCUGGUGUGGUCCCAGAGGUA |
CIITA_外顯子19 | + | CTTG | 278 | TCACTTACATGCCGGTCAGTGTTTCACTGC | 739 | UCACUUACAUGCCGGUCAGUGUUUCACUGC |
CIITA_外顯子19 | + | CTTA | 279 | CATGCCGGTCAGTGTTTCACTGCCACCTTC | 740 | CAUGCCGGUCAGUGUUUCACUGCCACCUUC |
CIITA_外顯子19 | + | CTTC | 280 | TGGAAGGCTAACCACGTACGTCAGCTTTTG | 741 | UGGAAGGCUAACCACGUACGUCAGCUUUUG |
CIITA_外顯子19 | + | CTTT | 281 | TGCCGGCCTTGTCACTTACATGCCGGTCAG | 742 | UGCCGGCCUUGUCACUUACAUGCCGGUCAG |
CIITA_外顯子19 | + | TTTT | 282 | GCCGGCCTTGTCACTTACATGCCGGTCAGT | 743 | GCCGGCCUUGUCACUUACAUGCCGGUCAGU |
CIITA_外顯子19 | + | TTTT | 283 | CCGGAACCTAGGGGTGGTGGCTTCTGGAAG | 744 | CCGGAACCUAGGGGUGGUGGCUUCUGGAAG |
CIITA_外顯子19 | + | TTTT | 284 | TCCGGAACCTAGGGGTGGTGGCTTCTGGAA | 745 | UCCGGAACCUAGGGGUGGUGGCUUCUGGAA |
CIITA_外顯子19 | + | TTTG | 285 | CCGGCCTTGTCACTTACATGCCGGTCAGTG | 746 | CCGGCCUUGUCACUUACAUGCCGGUCAGUG |
CIITA_外顯子2 | - | ATTG | 286 | TGTAGGAATCCCAGCCAGGCAGCAGCTCCC | 747 | UGUAGGAAUCCCAGCCAGGCAGCAGCUCCC |
CIITA_外顯子2 | - | CTTG | 287 | GGGCTCTGACAGGTAGGACCCAGCAGGGCG | 748 | GGGCUCUGACAGGUAGGACCCAGCAGGGCG |
CIITA_外顯子2 | - | TTTA | 288 | CCTTGGGGCTCTGACAGGTAGGACCCAGCA | 749 | CCUUGGGGCUCUGACAGGUAGGACCCAGCA |
CIITA_外顯子2 | - | TTTT | 289 | ACCTTGGGGCTCTGACAGGTAGGACCCAGC | 750 | ACCUUGGGGCUCUGACAGGUAGGACCCAGC |
CIITA_外顯子2 | - | TTTT | 290 | TACCTTGGGGCTCTGACAGGTAGGACCCAG | 751 | UACCUUGGGGCUCUGACAGGUAGGACCCAG |
CIITA_外顯子2 | - | CTTT | 291 | TTACCTTGGGGCTCTGACAGGTAGGACCCA | 752 | UUACCUUGGGGCUCUGACAGGUAGGACCCA |
CIITA_外顯子2 | - | TTTC | 292 | CCGGCCTTTTTACCTTGGGGCTCTGACAGG | 753 | CCGGCCUUUUUACCUUGGGGCUCUGACAGG |
CIITA_外顯子2 | - | CTTT | 293 | CCCGGCCTTTTTACCTTGGGGCTCTGACAG | 754 | CCCGGCCUUUUUACCUUGGGGCUCUGACAG |
CIITA_外顯子2 | + | GTTG | 294 | CCTGGCTCCACGCCCTGCTGGGTCCTACCT | 755 | CCUGGCUCCACGCCCUGCUGGGUCCUACCU |
CIITA_外顯子2 | + | ATTC | 295 | CTACACAATGCGTTGCCTGGCTCCACGCCC | 756 | CUACACAAUGCGUUGCCUGGCUCCACGCCC |
CIITA_外顯子2 | - | ATTA | 296 | AGATGCTTTCCCGGCCTTTTTACCTTGGGG | 757 | AGAUGCUUUCCCGGCCUUUUUACCUUGGGG |
CIITA_外顯子20 | - | ATTG | 297 | TACAAGCTGTCGGAAACAGAGGCCAGGGGG | 758 | UACAAGCUGUCGGAAACAGAGGCCAGGGGG |
CIITA_外顯子20 | - | GTTA | 298 | TTGTACAAGCTGTCGGAAACAGAGGCCAGG | 759 | UUGUACAAGCUGUCGGAAACAGAGGCCAGG |
CIITA_外顯子20 | + | CTTC | 299 | CGGACATGGTGTCCCTCCGGGTGATGGAGT | 760 | CGGACAUGGUGUCCCUCCGGGUGAUGGAGU |
CIITA_外顯子20 | + | CTTG | 300 | GCTCGTGTGCTTCCGGACATGGTGTCCCTC | 761 | GCUCGUGUGCUUCCGGACAUGGUGUCCCUC |
CIITA_外顯子20 | + | CTTG | 301 | TACAATAACTGCATCTGCGACGTGGGAGCC | 762 | UACAAUAACUGCAUCUGCGACGUGGGAGCC |
CIITA_外顯子20 | + | TTTC | 302 | CGACAGCTTGTACAATAACTGCATCTGCGA | 763 | CGACAGCUUGUACAAUAACUGCAUCUGCGA |
CIITA_外顯子20 | + | GTTT | 303 | CCGACAGCTTGTACAATAACTGCATCTGCG | 764 | CCGACAGCUUGUACAAUAACUGCAUCUGCG |
CIITA_外顯子21 | - | GTTG | 304 | TTCTCCACCCACCAGGGTTGCCTGGACTTA | 765 | UUCUCCACCCACCAGGGUUGCCUGGACUUA |
CIITA_外顯子21 | + | GTTT | 305 | CTCTTGCCAGCGTCCAGTACAACAAGTTCA | 766 | CUCUUGCCAGCGUCCAGUACAACAAGUUCA |
CIITA_外顯子21 | - | GTTG | 306 | CCTGGACTTACGCCAGCGTCTCCACATGAG | 767 | CCUGGACUUACGCCAGCGUCUCCACAUGAG |
CIITA_外顯子21 | - | CTTA | 307 | CGCCAGCGTCTCCACATGAGGACACCTCCG | 768 | CGCCAGCGUCUCCACAUGAGGACACCUCCG |
CIITA_外顯子21 | - | CTTG | 308 | TTGTACTGGACGCTGGCAAGAGAAACTCAC | 769 | UUGUACUGGACGCUGGCAAGAGAAACUCAC |
CIITA_外顯子21 | - | GTTG | 309 | TACTGGACGCTGGCAAGAGAAACTCACCTT | 770 | UACUGGACGCUGGCAAGAGAAACUCACCUU |
CIITA_外顯子21 | + | CTTG | 310 | CCAGCGTCCAGTACAACAAGTTCACGGCTG | 771 | CCAGCGUCCAGUACAACAAGUUCACGGCUG |
CIITA_外顯子21 | + | GTTC | 311 | ACGGCTGCCGGGGCCCAGCAGCTCGCTGCC | 772 | ACGGCUGCCGGGGCCCAGCAGCUCGCUGCC |
CIITA_外顯子21 | + | TTTC | 312 | TCTTGCCAGCGTCCAGTACAACAAGTTCAC | 773 | UCUUGCCAGCGUCCAGUACAACAAGUUCAC |
CIITA_外顯子21 | - | GTTC | 313 | TCCACCCACCAGGGTTGCCTGGACTTACGC | 774 | UCCACCCACCAGGGUUGCCUGGACUUACGC |
CIITA_外顯子21 | + | CTTC | 314 | GGAGGTGTCCTCATGTGGAGACGCTGGCGT | 775 | GGAGGUGUCCUCAUGUGGAGACGCUGGCGU |
CIITA_外顯子22 | - | GTTG | 315 | CAGGTGTTCCTGGACACTGAATGGGATGGT | 776 | CAGGUGUUCCUGGACACUGAAUGGGAUGGU |
CIITA_外顯子22 | - | GTTC | 316 | CTGGACACTGAATGGGATGGTGGGCGTCCA | 777 | CUGGACACUGAAUGGGAUGGUGGGCGUCCA |
CIITA_外顯子22 | - | GTTG | 317 | TTGCAGGTGTTCCTGGACACTGAATGGGAT | 778 | UUGCAGGUGUUCCUGGACACUGAAUGGGAU |
CIITA_外顯子22 | - | GTTA | 318 | CCCTGTCCAGAGCACAGCTGGGATCATCTC | 779 | CCCUGUCCAGAGCACAGCUGGGAUCAUCUC |
CIITA_外顯子22 | + | ATTC | 319 | ACGGATCAGCCTGAGATGATCCCAGCTGTG | 780 | ACGGAUCAGCCUGAGAUGAUCCCAGCUGUG |
CIITA_外顯子22 | + | ATTC | 320 | AGTGTCCAGGAACACCTGCAACAACAGGAT | 781 | AGUGUCCAGGAACACCUGCAACAACAGGAU |
CIITA_外顯子22 | + | CTTG | 321 | CAGGATGTGGACGCCCACCATCCCATTCAG | 782 | CAGGAUGUGGACGCCCACCAUCCCAUUCAG |
CIITA_外顯子3 | + | CTTG | 322 | CCGCGGCCCCAGAGCTGGCGGGAGGGAGAG | 783 | CCGCGGCCCCAGAGCUGGCGGGAGGGAGAG |
CIITA_外顯子3 | - | GTTC | 323 | CCCGGGCTCCCGCGCGCGCTGCTGGTGGCC | 784 | CCCGGGCUCCCGCGCGCGCUGCUGGUGGCC |
CIITA_外顯子3 | - | TTTG | 324 | GTCACCTACCGCTGTTCCCCGGGCTCCCGC | 785 | GUCACCUACCGCUGUUCCCCGGGCUCCCGC |
CIITA_外顯子3 | - | CTTT | 325 | GGTCACCTACCGCTGTTCCCCGGGCTCCCG | 786 | GGUCACCUACCGCUGUUCCCCGGGCUCCCG |
CIITA_外顯子3 | - | CTTA | 326 | GGGGTTACAGAGGAGACTTTGGTCACCTAC | 787 | GGGGUUACAGAGGAGACUUUGGUCACCUAC |
CIITA_外顯子3 | - | ATTC | 327 | TCAGCCCGACCTTAGGGGTTACAGAGGAGA | 788 | UCAGCCCGACCUUAGGGGUUACAGAGGAGA |
CIITA_外顯子3 | - | GTTA | 328 | CAGAGGAGACTTTGGTCACCTACCGCTGTT | 789 | CAGAGGAGACUUUGGUCACCUACCGCUGUU |
CIITA_外顯子4 | + | CTTT | 329 | CCAGAAATTTCCTTCTTCATCCAAGGGACT | 790 | CCAGAAAUUUCCUUCUUCAUCCAAGGGACU |
CIITA_外顯子4 | + | CTTC | 330 | TTCATCCAAGGGACTTTTCCTCCCAGAACC | 791 | UUCAUCCAAGGGACUUUUCCUCCCAGAACC |
CIITA_外顯子4 | + | TTTC | 331 | CTTCTTCATCCAAGGGACTTTTCCTCCCAG | 792 | CUUCUUCAUCCAAGGGACUUUUCCUCCCAG |
CIITA_外顯子4 | + | ATTT | 332 | CCTTCTTCATCCAAGGGACTTTTCCTCCCA | 793 | CCUUCUUCAUCCAAGGGACUUUUCCUCCCA |
CIITA_外顯子4 | + | TTTC | 333 | CAGAAATTTCCTTCTTCATCCAAGGGACTT | 794 | CAGAAAUUUCCUUCUUCAUCCAAGGGACUU |
CIITA_外顯子4 | + | GTTC | 334 | CCCACCAGCCCTCTTTCCAGAAATTTCCTT | 795 | CCCACCAGCCCUCUUUCCAGAAAUUUCCUU |
CIITA_外顯子4 | + | CTTC | 335 | CGGTATCCCCCACCCCTCAGCTTGCTGTAG | 796 | CGGUAUCCCCCACCCCUCAGCUUGCUGUAG |
CIITA_外顯子4 | + | CTTG | 336 | CTGTAGAGACGGCAATCAGGGGAAATTCTG | 797 | CUGUAGAGACGGCAAUCAGGGGAAAUUCUG |
CIITA_外顯子4 | + | CTTC | 337 | ATCCAAGGGACTTTTCCTCCCAGAACCCGA | 798 | AUCCAAGGGACUUUUCCUCCCAGAACCCGA |
CIITA_外顯子4 | + | ATTG | 338 | AGCTCTACTCAGGTGGGCCCTCCTCCCTCT | 799 | AGCUCUACUCAGGUGGGCCCUCCUCCCUCU |
CIITA_外顯子4 | + | CTTC | 339 | TATGACCAGATGGACCTGGCTGGAGAAGAA | 800 | UAUGACCAGAUGGACCUGGCUGGAGAAGAA |
CIITA_外顯子4 | + | CTTA | 340 | ACAGCGATGCTGACCCCCTGTGCCTCTACC | 801 | ACAGCGAUGCUGACCCCCUGUGCCUCUACC |
CIITA_外顯子4 | + | CTTC | 341 | TTAACAGCGATGCTGACCCCCTGTGCCTCT | 802 | UUAACAGCGAUGCUGACCCCCUGUGCCUCU |
CIITA_外顯子4 | + | GTTG | 342 | GGGCCCCTAGAAGGTGGCTACCTGGAGCTT | 803 | GGGCCCCUAGAAGGUGGCUACCUGGAGCUU |
CIITA_外顯子4 | + | CTTC | 343 | CCTCCCAGGCAGCTCACAGTGTGCCACCAT | 804 | CCUCCCAGGCAGCUCACAGUGUGCCACCAU |
CIITA_外顯子4 | + | ATTG | 344 | TCTTCCCTCCCAGGCAGCTCACAGTGTGCC | 805 | UCUUCCCUCCCAGGCAGCUCACAGUGUGCC |
CIITA_外顯子4 | + | TTTC | 345 | CAACACCCTGTGAGGTGACTGAGCATTGTC | 806 | CAACACCCUGUGAGGUGACUGAGCAUUGUC |
CIITA_外顯子4 | + | CTTT | 346 | CCAACACCCTGTGAGGTGACTGAGCATTGT | 807 | CCAACACCCUGUGAGGUGACUGAGCAUUGU |
CIITA_外顯子4 | + | ATTC | 347 | TGGTCCCTGCCCTCCCGTCAGCACCACGGA | 808 | UGGUCCCUGCCCUCCCGUCAGCACCACGGA |
CIITA_外顯子4 | + | CTTT | 348 | TCCTCCCAGAACCCGACACAGACACCATCA | 809 | UCCUCCCAGAACCCGACACAGACACCAUCA |
CIITA_外顯子4 | - | ATTG | 349 | CCGTCTCTACAGCAAGCTGAGGGGTGGGGG | 810 | CCGUCUCUACAGCAAGCUGAGGGGUGGGGG |
CIITA_外顯子4 | + | TTTC | 350 | CTCCCAGAACCCGACACAGACACCATCAAC | 811 | CUCCCAGAACCCGACACAGACACCAUCAAC |
CIITA_外顯子4 | - | CTTC | 351 | TTCTCCAGCCAGGTCCATCTGGTCATAGAA | 812 | UUCUCCAGCCAGGUCCAUCUGGUCAUAGAA |
CIITA_外顯子4 | - | CTTC | 352 | TCCAGCCAGGTCCATCTGGTCATAGAAGTG | 813 | UCCAGCCAGGUCCAUCUGGUCAUAGAAGUG |
CIITA_外顯子4 | - | GTTA | 353 | AGAAGCTCCAGGTAGCCACCTTCTAGGGGC | 814 | AGAAGCUCCAGGUAGCCACCUUCUAGGGGC |
CIITA_外顯子4 | - | CTTC | 354 | TAGGGGCCCCAACTCCATGGTGGCACACTG | 815 | UAGGGGCCCCAACUCCAUGGUGGCACACUG |
CIITA_外顯子4 | - | TTTC | 355 | TGGAAAGAGGGCTGGTGGGGAACGAGGGAG | 816 | UGGAAAGAGGGCUGGUGGGGAACGAGGGAG |
CIITA_外顯子4 | - | ATTT | 356 | CTGGAAAGAGGGCTGGTGGGGAACGAGGGA | 817 | CUGGAAAGAGGGCUGGUGGGGAACGAGGGA |
CIITA_外顯子4 | - | CTTG | 357 | GATGAAGAAGGAAATTTCTGGAAAGAGGGC | 818 | GAUGAAGAAGGAAAUUUCUGGAAAGAGGGC |
CIITA_外顯子4 | - | GTTC | 358 | TGGGAGGAAAAGTCCCTTGGATGAAGAAGG | 819 | UGGGAGGAAAAGUCCCUUGGAUGAAGAAGG |
CIITA_外顯子4 | - | GTTG | 359 | ATGGTGTCTGTGTCGGGTTCTGGGAGGAAA | 820 | AUGGUGUCUGUGUCGGGUUCUGGGAGGAAA |
CIITA_外顯子4 | - | CTTC | 360 | CATGTCACACAACAGCCTGCTGAACTGGTC | 821 | CAUGUCACACAACAGCCUGCUGAACUGGUC |
CIITA_外顯子4 | - | CTTC | 361 | ATCACCTTCCATGTCACACAACAGCCTGCT | 822 | AUCACCUUCCAUGUCACACAACAGCCUGCU |
CIITA_外顯子4 | - | ATTG | 362 | GCATAAGCCTCCCTGGTCTCTTCATCACCT | 823 | GCAUAAGCCUCCCUGGUCUCUUCAUCACCU |
CIITA_外顯子4 | - | CTTC | 363 | CTCACCGATATTGGCATAAGCCTCCCTGGT | 824 | CUCACCGAUAUUGGCAUAAGCCUCCCUGGU |
CIITA_外顯子4 | - | TTTC | 364 | TGGGCTCAGGTGCTTCCTCACCGATATTGG | 825 | UGGGCUCAGGUGCUUCCUCACCGAUAUUGG |
CIITA_外顯子4 | - | TTTT | 365 | CTGGGCTCAGGTGCTTCCTCACCGATATTG | 826 | CUGGGCUCAGGUGCUUCCUCACCGAUAUUG |
CIITA_外顯子4 | - | CTTT | 366 | TCTGGGCTCAGGTGCTTCCTCACCGATATT | 827 | UCUGGGCUCAGGUGCUUCCUCACCGAUAUU |
CIITA_外顯子4 | - | ATTG | 367 | TCCTTTTCTGGGCTCAGGTGCTTCCTCACC | 828 | UCCUUUUCUGGGCUCAGGUGCUUCCUCACC |
CIITA_外顯子4 | - | CTTG | 368 | ATTGTCCTTTTCTGGGCTCAGGTGCTTCCT | 829 | AUUGUCCUUUUCUGGGCUCAGGUGCUUCCU |
CIITA_外顯子4 | - | CTTG | 369 | CCCTTGATTGTCCTTTTCTGGGCTCAGGTG | 830 | CCCUUGAUUGUCCUUUUCUGGGCUCAGGUG |
CIITA_外顯子4 | + | CTTA | 370 | TGCCAATATCGGTGAGGAAGCACCTGAGCC | 831 | UGCCAAUAUCGGUGAGGAAGCACCUGAGCC |
CIITA_外顯子4 | + | GTTG | 371 | TGTGACATGGAAGGTGATGAAGAGACCAGG | 832 | UGUGACAUGGAAGGUGAUGAAGAGACCAGG |
CIITA_外顯子4 | + | GTTC | 372 | AGCAGGCTGTTGTGTGACATGGAAGGTGAT | 833 | AGCAGGCUGUUGUGUGACAUGGAAGGUGAU |
CIITA_外顯子4 | - | ATTT | 373 | CCCCTGATTGCCGTCTCTACAGCAAGCTGA | 834 | CCCCUGAUUGCCGUCUCUACAGCAAGCUGA |
CIITA_外顯子4 | + | TTTT | 374 | CCTCCCAGAACCCGACACAGACACCATCAA | 835 | CCUCCCAGAACCCGACACAGACACCAUCAA |
CIITA_外顯子4 | - | TTTC | 375 | CCCTGATTGCCGTCTCTACAGCAAGCTGAG | 836 | CCCUGAUUGCCGUCUCUACAGCAAGCUGAG |
CIITA_外顯子5 | + | GTTA | 376 | GACCTTGTTGATTGACTGCGCTTTTCCTTG | 837 | GACCUUGUUGAUUGACUGCGCUUUUCCUUG |
CIITA_外顯子5 | + | ATTT | 377 | TCAGTAAGTTTGTGGTGGGTGGGGAGGTCT | 838 | UCAGUAAGUUUGUGGUGGGUGGGGAGGUCU |
CIITA_外顯子5 | - | CTTA | 378 | CTGAAAATGTCCTTGCTCAGGCCCTCCAGC | 839 | CUGAAAAUGUCCUUGCUCAGGCCCUCCAGC |
CIITA_外顯子5 | + | TTTG | 379 | TGGTGGGTGGGGAGGTCTTGGCTCAGCCTG | 840 | UGGUGGGUGGGGAGGUCUUGGCUCAGCCUG |
CIITA_外顯子5 | + | GTTT | 380 | GTGGTGGGTGGGGAGGTCTTGGCTCAGCCT | 841 | GUGGUGGGUGGGGAGGUCUUGGCUCAGCCU |
CIITA_外顯子5 | + | TTTC | 381 | AGTAAGTTTGTGGTGGGTGGGGAGGTCTTG | 842 | AGUAAGUUUGUGGUGGGUGGGGAGGUCUUG |
CIITA_外顯子5 | + | TTTT | 382 | CAGTAAGTTTGTGGTGGGTGGGGAGGTCTT | 843 | CAGUAAGUUUGUGGUGGGUGGGGAGGUCUU |
CIITA_外顯子5 | + | CTTC | 383 | AGTTAGACCTTGTTGATTGACTGCGCTTTT | 844 | AGUUAGACCUUGUUGAUUGACUGCGCUUUU |
CIITA_外顯子5 | - | CTTG | 384 | CTCAGGCCCTCCAGCTGGGAGTCCTGGAAG | 845 | CUCAGGCCCUCCAGCUGGGAGUCCUGGAAG |
CIITA_外顯子5 | + | CTTC | 385 | CAGGACTCCCAGCTGGAGGGCCTGAGCAAG | 846 | CAGGACUCCCAGCUGGAGGGCCUGAGCAAG |
CIITA_外顯子5 | + | TTTC | 386 | CTTGTCTGGGCAGCGGAACTGGACCAGTAT | 847 | CUUGUCUGGGCAGCGGAACUGGACCAGUAU |
CIITA_外顯子5 | + | TTTT | 387 | CCTTGTCTGGGCAGCGGAACTGGACCAGTA | 848 | CCUUGUCUGGGCAGCGGAACUGGACCAGUA |
CIITA_外顯子5 | + | CTTT | 388 | TCCTTGTCTGGGCAGCGGAACTGGACCAGT | 849 | UCCUUGUCUGGGCAGCGGAACUGGACCAGU |
CIITA_外顯子5 | + | ATTG | 389 | ACTGCGCTTTTCCTTGTCTGGGCAGCGGAA | 850 | ACUGCGCUUUUCCUUGUCUGGGCAGCGGAA |
CIITA_外顯子5 | + | GTTG | 390 | ATTGACTGCGCTTTTCCTTGTCTGGGCAGC | 851 | AUUGACUGCGCUUUUCCUUGUCUGGGCAGC |
CIITA_外顯子5 | + | CTTG | 391 | TTGATTGACTGCGCTTTTCCTTGTCTGGGC | 852 | UUGAUUGACUGCGCUUUUCCUUGUCUGGGC |
CIITA_外顯子5 | + | CTTG | 392 | TCTGGGCAGCGGAACTGGACCAGTATGTCT | 853 | UCUGGGCAGCGGAACUGGACCAGUAUGUCU |
CIITA_外顯子5 | - | GTTC | 393 | CGCTGCCCAGACAAGGAAAAGCGCAGTCAA | 854 | CGCUGCCCAGACAAGGAAAAGCGCAGUCAA |
CIITA_外顯子6 | - | CTTT | 394 | GAGAAAAACCAGAGACCAACTCACACAATC | 855 | GAGAAAAACCAGAGACCAACUCACACAAUC |
CIITA_外顯子6 | + | CTTG | 395 | GGCTTTCATTGATTGTGTGAGTTGGTCTCT | 856 | GGCUUUCAUUGAUUGUGUGAGUUGGUCUCU |
CIITA_外顯子6 | - | TTTG | 396 | AGAAAAACCAGAGACCAACTCACACAATCA | 857 | AGAAAAACCAGAGACCAACUCACACAAUCA |
CIITA_外顯子6 | + | TTTC | 397 | ATTGATTGTGTGAGTTGGTCTCTGGTTTTT | 858 | AUUGAUUGUGUGAGUUGGUCUCUGGUUUUU |
CIITA_外顯子6 | + | CTTT | 398 | CATTGATTGTGTGAGTTGGTCTCTGGTTTT | 859 | CAUUGAUUGUGUGAGUUGGUCUCUGGUUUU |
CIITA_外顯子6 | + | ATTG | 399 | TGTGAGTTGGTCTCTGGTTTTTCTCAAAGT | 860 | UGUGAGUUGGUCUCUGGUUUUUCUCAAAGU |
CIITA_外顯子6 | + | GTTG | 400 | GTCTCTGGTTTTTCTCAAAGTAGAGCACAT | 861 | GUCUCUGGUUUUUCUCAAAGUAGAGCACAU |
CIITA_外顯子6 | + | GTTT | 401 | TTCTCAAAGTAGAGCACATAGGACCAGATG | 862 | UUCUCAAAGUAGAGCACAUAGGACCAGAUG |
CIITA_外顯子6 | + | TTTT | 402 | TCTCAAAGTAGAGCACATAGGACCAGATGA | 863 | UCUCAAAGUAGAGCACAUAGGACCAGAUGA |
CIITA_外顯子6 | + | ATTG | 403 | ATTGTGTGAGTTGGTCTCTGGTTTTTCTCA | 864 | AUUGUGUGAGUUGGUCUCUGGUUUUUCUCA |
CIITA_外顯子6 | + | TTTT | 404 | CTCAAAGTAGAGCACATAGGACCAGATGAA | 865 | CUCAAAGUAGAGCACAUAGGACCAGAUGAA |
CIITA_外顯子6 | + | GTTG | 405 | GGCAGAAAAGTCAGAAAAGACGTGAGTGAG | 866 | GGCAGAAAAGUCAGAAAAGACGUGAGUGAG |
CIITA_外顯子6 | - | GTTG | 406 | GATCAGGGAGGGGCTCACTCACGTCTTTTC | 867 | GAUCAGGGAGGGGCUCACUCACGUCUUUUC |
CIITA_外顯子6 | + | TTTC | 407 | TCAAAGTAGAGCACATAGGACCAGATGAAG | 868 | UCAAAGUAGAGCACAUAGGACCAGAUGAAG |
CIITA_外顯子6 | - | TTTT | 408 | CTGACTTTTCTGCCCAACTTCTGCTGGCAT | 869 | CUGACUUUUCUGCCCAACUUCUGCUGGCAU |
CIITA_外顯子6 | - | TTTC | 409 | TGACTTTTCTGCCCAACTTCTGCTGGCATC | 870 | UGACUUUUCUGCCCAACUUCUGCUGGCAUC |
CIITA_外顯子6 | - | CTTT | 410 | TCTGCCCAACTTCTGCTGGCATCTCCATAC | 871 | UCUGCCCAACUUCUGCUGGCAUCUCCAUAC |
CIITA_外顯子6 | - | TTTT | 411 | CTGCCCAACTTCTGCTGGCATCTCCATACT | 872 | CUGCCCAACUUCUGCUGGCAUCUCCAUACU |
CIITA_外顯子6 | - | TTTC | 412 | TGCCCAACTTCTGCTGGCATCTCCATACTC | 873 | UGCCCAACUUCUGCUGGCAUCUCCAUACUC |
CIITA_外顯子6 | - | CTTC | 413 | TGCTGGCATCTCCATACTCTCACCGATCAC | 874 | UGCUGGCAUCUCCAUACUCUCACCGAUCAC |
CIITA_外顯子6 | - | CTTC | 414 | ATCTGGTCCTATGTGCTCTACTTTGAGAAA | 875 | AUCUGGUCCUAUGUGCUCUACUUUGAGAAA |
CIITA_外顯子6 | - | CTTT | 415 | TCTGACTTTTCTGCCCAACTTCTGCTGGCA | 876 | UCUGACUUUUCUGCCCAACUUCUGCUGGCA |
CIITA_外顯子7 | - | CTTC | 416 | AGGTCTGCCGGAAGCTCCTCTGGGAAGGCT | 877 | AGGUCUGCCGGAAGCUCCUCUGGGAAGGCU |
CIITA_外顯子7 | + | CTTC | 417 | CCAGAGGAGCTTCCGGCAGACCTGAAGCAC | 878 | CCAGAGGAGCUUCCGGCAGACCUGAAGCAC |
CIITA_外顯子7 | + | TTTC | 418 | TCTGCAGCCTTCCCAGAGGAGCTTCCGGCA | 879 | UCUGCAGCCUUCCCAGAGGAGCUUCCGGCA |
CIITA_外顯子7 | - | CTTC | 419 | CAGTGCTTCAGGTCTGCCGGAAGCTCCTCT | 880 | CAGUGCUUCAGGUCUGCCGGAAGCUCCUCU |
CIITA_外顯子7 | + | GTTT | 420 | TCTCTGCAGCCTTCCCAGAGGAGCTTCCGG | 881 | UCUCUGCAGCCUUCCCAGAGGAGCUUCCGG |
CIITA_外顯子7 | + | CTTG | 421 | GGACATCCTCTCCCTGGGGCAGCTGATCAC | 882 | GGACAUCCUCUCCCUGGGGCAGCUGAUCAC |
CIITA_外顯子7 | - | CTTC | 422 | CCAACCCCAGCCCACCTGCCCTGCACACCT | 883 | CCAACCCCAGCCCACCUGCCCUGCACACCU |
CIITA_外顯子7 | + | TTTT | 423 | CTCTGCAGCCTTCCCAGAGGAGCTTCCGGC | 884 | CUCUGCAGCCUUCCCAGAGGAGCUUCCGGC |
CIITA_外顯子7 | + | CTTC | 424 | CGGCAGACCTGAAGCACTGGAAGCCAGGTG | 885 | CGGCAGACCUGAAGCACUGGAAGCCAGGUG |
CIITA_外顯子8 | - | GTTG | 425 | AACAGCGCAGGCAGTGGCAGGCAGGGCAGG | 886 | AACAGCGCAGGCAGUGGCAGGCAGGGCAGG |
CIITA_外顯子8 | - | TTTT | 426 | CTCCAGGCGCATCTGGCCGGAGGCTGGCTC | 887 | CUCCAGGCGCAUCUGGCCGGAGGCUGGCUC |
CIITA_外顯子8 | - | GTTT | 427 | TCTCCAGGCGCATCTGGCCGGAGGCTGGCT | 888 | UCUCCAGGCGCAUCUGGCCGGAGGCUGGCU |
CIITA_外顯子8 | + | CTTG | 428 | GAGAGAGTGGGCTTTCTCCCTCTTGGGAGG | 889 | GAGAGAGUGGGCUUUCUCCCUCUUGGGAGG |
CIITA_外顯子8 | + | GTTA | 429 | GGGGGCTTGGAGAGAGTGGGCTTTCTCCCT | 890 | GGGGGCUUGGAGAGAGUGGGCUUUCUCCCU |
CIITA_外顯子8 | + | ATTC | 430 | CCAGTATGTTAGGGGGCTTGGAGAGAGTGG | 891 | CCAGUAUGUUAGGGGGCUUGGAGAGAGUGG |
CIITA_外顯子8 | + | GTTC | 431 | AACCAGGAGCCAGCCTCCGGCCAGATGCGC | 892 | AACCAGGAGCCAGCCUCCGGCCAGAUGCGC |
CIITA_外顯子8 | + | CTTC | 432 | CTCACAGCTGAGCCCCCCACTGTGGTGACT | 893 | CUCACAGCUGAGCCCCCCACUGUGGUGACU |
CIITA_外顯子8 | - | TTTC | 433 | TCCAGGCGCATCTGGCCGGAGGCTGGCTCC | 894 | UCCAGGCGCAUCUGGCCGGAGGCUGGCUCC |
CIITA_外顯子9 | + | CTTT | 434 | GTCTCTTGCAGTGCCTTTCTCCAGTTCCTC | 895 | GUCUCUUGCAGUGCCUUUCUCCAGUUCCUC |
CIITA_外顯子9 | + | TTTG | 435 | TCTCTTGCAGTGCCTTTCTCCAGTTCCTCG | 896 | UCUCUUGCAGUGCCUUUCUCCAGUUCCUCG |
CIITA_外顯子9 | + | CTTG | 436 | CAGTGCCTTTCTCCAGTTCCTCGTTGAGCT | 897 | CAGUGCCUUUCUCCAGUUCCUCGUUGAGCU |
CIITA_外顯子9 | + | CTTT | 437 | CTCCAGTTCCTCGTTGAGCTGCCTGAATCT | 898 | CUCCAGUUCCUCGUUGAGCUGCCUGAAUCU |
CIITA_外顯子9 | + | TTTC | 438 | TCCAGTTCCTCGTTGAGCTGCCTGAATCTC | 899 | UCCAGUUCCUCGUUGAGCUGCCUGAAUCUC |
CIITA_外顯子9 | + | GTTC | 439 | CTCGTTGAGCTGCCTGAATCTCCCTGAGGG | 900 | CUCGUUGAGCUGCCUGAAUCUCCCUGAGGG |
CIITA_外顯子9 | + | ATTC | 440 | ATCTACCATGGTGAGTGCGGGGCCTGGCTC | 901 | AUCUACCAUGGUGAGUGCGGGGCCUGGCUC |
CIITA_外顯子9 | + | GTTT | 441 | GTCCCCACCATCTCCACTCTGCCCCATGGG | 902 | GUCCCCACCAUCUCCACUCUGCCCCAUGGG |
CIITA_外顯子9 | + | TTTG | 442 | TCCCCACCATCTCCACTCTGCCCCATGGGC | 903 | UCCCCACCAUCUCCACUCUGCCCCAUGGGC |
CIITA_外顯子9 | - | GTTC | 443 | CAGCCTCAGAGATTTGCCAGAGCCCATGGG | 904 | CAGCCUCAGAGAUUUGCCAGAGCCCAUGGG |
CIITA_外顯子9 | - | ATTT | 444 | GCCAGAGCCCATGGGGCAGAGTGGAGATGG | 905 | GCCAGAGCCCAUGGGGCAGAGUGGAGAUGG |
CIITA_外顯子9 | - | ATTC | 445 | AGGCAGCTCAACGAGGAACTGGAGAAAGGC | 906 | AGGCAGCUCAACGAGGAACUGGAGAAAGGC |
CIITA_外顯子9 | + | GTTG | 446 | AGCTGCCTGAATCTCCCTGAGGGACCCATC | 907 | AGCUGCCUGAAUCUCCCUGAGGGACCCAUC |
CIITA_外顯子9 | - | TTTG | 447 | CCAGAGCCCATGGGGCAGAGTGGAGATGGT | 908 | CCAGAGCCCAUGGGGCAGAGUGGAGAUGGU |
CIITA_外顯子11 | - | ATTT | 448 | AGGGTGAGGGTTACCCCTGGG | 909 | AGGGUGAGGGUUACCCCUGGG |
CIITA_外顯子11 | - | TTTA | 449 | GGGTGAGGGTTACCCCTGGG | 910 | GGGUGAGGGUUACCCCUGGG |
CIITA_外顯子13 | + | GTTC | 450 | ACGCCATGCAGGTTGAGGAC | 911 | ACGCCAUGCAGGUUGAGGAC |
CIITA_外顯子14 | + | CTTG | 451 | TGGGTCTGCGCAAGGTTTCCCCTGC | 912 | UGGGUCUGCGCAAGGUUUCCCCUGC |
CIITA_外顯子14 | - | GTTA | 452 | GGGGGAGCAGGCACTGCTGTCACTGAGC | 913 | GGGGGAGCAGGCACUGCUGUCACUGAGC |
CIITA_外顯子15 | + | CTTC | 453 | CTCTCAACATCTGGGTGCAGTGCT | 914 | CUCUCAACAUCUGGGUGCAGUGCU |
CIITA_外顯子16 | + | CTTC | 454 | CTGCTGAATCGGGCCCCCAAAGTCCG | 915 | CUGCUGAAUCGGGCCCCCAAAGUCCG |
CIITA_外顯子17 | - | ATTA | 455 | ATTTTGAAAAAGTCAGCCGGACTTTGGG | 916 | AUUUUGAAAAAGUCAGCCGGACUUUGGG |
CIITA_外顯子17 | - | ATTT | 456 | TGAAAAAGTCAGCCGGACTTTGGG | 917 | UGAAAAAGUCAGCCGGACUUUGGG |
CIITA_外顯子17 | - | TTTT | 457 | GAAAAAGTCAGCCGGACTTTGGG | 918 | GAAAAAGUCAGCCGGACUUUGGG |
CIITA_外顯子17 | - | TTTG | 458 | AAAAAGTCAGCCGGACTTTGGG | 919 | AAAAAGUCAGCCGGACUUUGGG |
CIITA_外顯子19 | - | ATTG | 459 | CATAACAGAACCTGGCATTGTGA | 920 | CAUAACAGAACCUGGCAUUGUGA |
CIITA_外顯子19 | - | ATTT | 460 | ATTGCATAACAGAACCTGGCATTGTGA | 921 | AUUGCAUAACAGAACCUGGCAUUGUGA |
CIITA_外顯子19 | - | TTTA | 461 | TTGCATAACAGAACCTGGCATTGTGA | 922 | UUGCAUAACAGAACCUGGCAUUGUGA |
CIITA_外顯子2 | + | CTTA | 462 | ATTTAGCGTGCAGTCTCAGCTGGTC | 923 | AUUUAGCGUGCAGUCUCAGCUGGUC |
CIITA_外顯子2 | + | ATTT | 463 | AGCGTGCAGTCTCAGCTGGTC | 924 | AGCGUGCAGUCUCAGCUGGUC |
CIITA_外顯子2 | + | TTTA | 464 | GCGTGCAGTCTCAGCTGGTC | 925 | GCGUGCAGUCUCAGCUGGUC |
CIITA_外顯子21 | - | CTTG | 465 | GGGCCTGGCCCTTGGGACTCCCCAGCTC | 926 | GGGCCUGGCCCUUGGGACUCCCCAGCUC |
CIITA_外顯子3 | - | GTTC | 466 | TTTTTCCCTTTCACTTTCTTTCTG | 927 | UUUUUCCCUUUCACUUUCUUUCUG |
CIITA_外顯子3 | - | CTTT | 467 | TTCCCTTTCACTTTCTTTCTG | 928 | UUCCCUUUCACUUUCUUUCUG |
CIITA_外顯子3 | - | TTTT | 468 | TCCCTTTCACTTTCTTTCTG | 929 | UCCCUUUCACUUUCUUUCUG |
CIITA_外顯子5 | + | CTTG | 469 | GCTCAGCCTGCATTTCCTGCC | 930 | GCUCAGCCUGCAUUUCCUGCC |
CIITA_外顯子7 | + | GTTG | 470 | GGAAGGGTGGATGCCTTGGGGAG | 931 | GGAAGGGUGGAUGCCUUGGGGAG |
CIITA_外顯子8 | - | GTTA | 471 | GAGACTGGGTGCTTGGAGGGGCCTTCC | 932 | GAGACUGGGUGCUUGGAGGGGCCUUCC |
ref_id | 股 | PAM | Seq id no | 目標 | Seq id no | 間隔子 |
內含子 | - | ATTG | 933 | TGTAGGAATCCCAGCCAGGC | 1018 | UGUAGGAAUCCCAGCCAGGC |
內含子 | + | ATTC | 934 | ACTCCTCTCATCCCCAGCCC | 1019 | ACUCCUCUCAUCCCCAGCCC |
內含子 | + | GTTG | 935 | TTGTAGGTGTCAATTTTCTG | 1020 | UUGUAGGUGUCAAUUUUCUG |
內含子 | + | GTTG | 936 | TAGGTGTCAATTTTCTGCCT | 1021 | UAGGUGUCAAUUUUCUGCCU |
內含子 | + | ATTT | 937 | TCTGCCTCTTTCCAACACCC | 1022 | UCUGCCUCUUUCCAACACCC |
內含子 | + | TTTT | 938 | CTGCCTCTTTCCAACACCCT | 1023 | CUGCCUCUUUCCAACACCCU |
內含子 | + | TTTC | 939 | TGCCTCTTTCCAACACCCTG | 1024 | UGCCUCUUUCCAACACCCUG |
內含子 | + | CTTT | 940 | CCAACACCCTGTGAGGTGAC | 1025 | CCAACACCCUGUGAGGUGAC |
內含子 | + | TTTC | 941 | CAACACCCTGTGAGGTGACT | 1026 | CAACACCCUGUGAGGUGACU |
內含子 | + | ATTG | 942 | AGCTCTACTCAGGTGGGCCC | 1027 | AGCUCUACUCAGGUGGGCCC |
內含子 | + | CTTC | 943 | CGGTATCCCCCACCCCTCAG | 1028 | CGGUAUCCCCCACCCCUCAG |
內含子 | + | CTTG | 944 | CTGTAGAGACGGCAATCAGG | 1029 | CUGUAGAGACGGCAAUCAGG |
內含子 | + | ATTC | 945 | TGGTCCCTGCCCTCCCGTCA | 1030 | UGGUCCCUGCCCUCCCGUCA |
內含子 | + | GTTC | 946 | CCCACCAGCCCTCTTTCCAG | 1031 | CCCACCAGCCCUCUUUCCAG |
內含子 | + | CTTT | 947 | CCAGAAATTTCCTTCTTCAT | 1032 | CCAGAAAUUUCCUUCUUCAU |
內含子 | + | TTTC | 948 | CAGAAATTTCCTTCTTCATC | 1033 | CAGAAAUUUCCUUCUUCAUC |
內含子 | + | ATTT | 949 | CCTTCTTCATCCAAGGGACT | 1034 | CCUUCUUCAUCCAAGGGACU |
內含子 | + | TTTC | 950 | CTTCTTCATCCAAGGGACTT | 1035 | CUUCUUCAUCCAAGGGACUU |
內含子 | + | CTTC | 951 | TTCATCCAAGGGACTTTTCC | 1036 | UUCAUCCAAGGGACUUUUCC |
內含子 | + | CTTA | 952 | TGCCAATATCGGTGAGGAAG | 1037 | UGCCAAUAUCGGUGAGGAAG |
內含子 | + | GTTC | 953 | TTTGCTGCCACTTGTCAATA | 1038 | UUUGCUGCCACUUGUCAAUA |
內含子 | + | CTTT | 954 | GCTGCCACTTGTCAATATCA | 1039 | GCUGCCACUUGUCAAUAUCA |
內含子 | + | TTTG | 955 | CTGCCACTTGTCAATATCAC | 1040 | CUGCCACUUGUCAAUAUCAC |
內含子 | + | CTTG | 956 | TCAATATCACCCATTCATCA | 1041 | UCAAUAUCACCCAUUCAUCA |
內含子 | + | ATTC | 957 | ATCATGAGCCACGTCAGTCC | 1042 | AUCAUGAGCCACGUCAGUCC |
內含子 | + | ATTG | 958 | CAAGGGGGATGCGGAGCAAT | 1043 | CAAGGGGGAUGCGGAGCAAU |
內含子 | - | CTTC | 959 | CCTGGAGTCTCCGTTCCTCC | 1044 | CCUGGAGUCUCCGUUCCUCC |
內含子 | - | GTTC | 960 | CTCCAGCCATTGCTCCGCAT | 1045 | CUCCAGCCAUUGCUCCGCAU |
內含子 | - | ATTG | 961 | CTCCGCATCCCCCTTGCAAT | 1046 | CUCCGCAUCCCCCUUGCAAU |
內含子 | - | CTTG | 962 | CAATGATTTCTGTGGGAGGG | 1047 | CAAUGAUUUCUGUGGGAGGG |
內含子 | - | ATTT | 963 | CTGTGGGAGGGGACTGACGT | 1048 | CUGUGGGAGGGGACUGACGU |
內含子 | - | TTTC | 964 | TGTGGGAGGGGACTGACGTG | 1049 | UGUGGGAGGGGACUGACGUG |
內含子 | - | ATTG | 965 | ACAAGTGGCAGCAAAGAACT | 1050 | ACAAGUGGCAGCAAAGAACU |
內含子 | - | CTTG | 966 | CCCTTGATTGTCCTTTTCTG | 1051 | CCCUUGAUUGUCCUUUUCUG |
內含子 | - | CTTG | 967 | ATTGTCCTTTTCTGGGCTCA | 1052 | AUUGUCCUUUUCUGGGCUCA |
內含子 | - | ATTG | 968 | TCCTTTTCTGGGCTCAGGTG | 1053 | UCCUUUUCUGGGCUCAGGUG |
內含子 | - | CTTT | 969 | TCTGGGCTCAGGTGCTTCCT | 1054 | UCUGGGCUCAGGUGCUUCCU |
內含子 | - | GTTG | 970 | ATGGTGTCTGTGTCGGGTTC | 1055 | AUGGUGUCUGUGUCGGGUUC |
內含子 | - | GTTC | 971 | TGGGAGGAAAAGTCCCTTGG | 1056 | UGGGAGGAAAAGUCCCUUGG |
內含子 | - | CTTG | 972 | GATGAAGAAGGAAATTTCTG | 1057 | GAUGAAGAAGGAAAUUUCUG |
內含子 | - | ATTT | 973 | CTGGAAAGAGGGCTGGTGGG | 1058 | CUGGAAAGAGGGCUGGUGGG |
內含子 | - | TTTC | 974 | TGGAAAGAGGGCTGGTGGGG | 1059 | UGGAAAGAGGGCUGGUGGGG |
內含子 | - | ATTT | 975 | CCCCTGATTGCCGTCTCTAC | 1060 | CCCCUGAUUGCCGUCUCUAC |
內含子 | - | TTTC | 976 | CCCTGATTGCCGTCTCTACA | 1061 | CCCUGAUUGCCGUCUCUACA |
內含子 | - | ATTG | 977 | CCGTCTCTACAGCAAGCTGA | 1062 | CCGUCUCUACAGCAAGCUGA |
內含子 | - | GTTG | 978 | GAAAGAGGCAGAAAATTGAC | 1063 | GAAAGAGGCAGAAAAUUGAC |
內含子 | - | ATTG | 979 | ACACCTACAACAACTCCCAG | 1064 | ACACCUACAACAACUCCCAG |
內含子 | + | ATTT | 980 | TCAGTAAGTTTGTGGTGGGT | 1065 | UCAGUAAGUUUGUGGUGGGU |
內含子 | + | TTTT | 981 | CAGTAAGTTTGTGGTGGGTG | 1066 | CAGUAAGUUUGUGGUGGGUG |
內含子 | + | TTTC | 982 | AGTAAGTTTGTGGTGGGTGG | 1067 | AGUAAGUUUGUGGUGGGUGG |
內含子 | - | GTTC | 983 | CGCTGCCCAGACAAGGAAAA | 1068 | CGCUGCCCAGACAAGGAAAA |
內含子 | + | GTTG | 984 | GGCAGAAAAGTCAGAAAAGA | 1069 | GGCAGAAAAGUCAGAAAAGA |
內含子 | - | CTTC | 985 | ATCTGGTCCTATGTGCTCTA | 1070 | AUCUGGUCCUAUGUGCUCUA |
內含子 | + | ATTC | 986 | CCAGTATGTTAGGGGGCTTG | 1071 | CCAGUAUGUUAGGGGGCUUG |
內含子 | + | GTTA | 987 | GGGGGCTTGGAGAGAGTGGG | 1072 | GGGGGCUUGGAGAGAGUGGG |
內含子 | + | CTTG | 988 | GAGAGAGTGGGCTTTCTCCC | 1073 | GAGAGAGUGGGCUUUCUCCC |
內含子 | - | GTTA | 989 | GAGACTGGGTGCTTGGAGGG | 1074 | GAGACUGGGUGCUUGGAGGG |
內含子 | - | CTTG | 990 | GAGGGGCCTTCCTGGGATGG | 1075 | GAGGGGCCUUCCUGGGAUGG |
內含子 | + | ATTC | 991 | ATCTACCATGGTGAGTGCGG | 1076 | AUCUACCAUGGUGAGUGCGG |
內含子 | - | CTTG | 992 | GCTGGCCTGGGGCACCTCAC | 1077 | GCUGGCCUGGGGCACCUCAC |
內含子 | + | CTTC | 993 | CAAAATGGCCTGGTGAGTGA | 1078 | CAAAAUGGCCUGGUGAGUGA |
內含子 | - | ATTG | 994 | GGTGGGGGACGTCTTGTGCT | 1079 | GGUGGGGGACGUCUUGUGCU |
內含子 | - | CTTG | 995 | TGCTCTGGAGATGGAGAAGC | 1080 | UGCUCUGGAGAUGGAGAAGC |
內含子 | + | GTTT | 996 | CAGGTGGGGTGAGGGGCTTG | 1081 | CAGGUGGGGUGAGGGGCUUG |
內含子 | + | TTTC | 997 | AGGTGGGGTGAGGGGCTTGG | 1082 | AGGUGGGGUGAGGGGCUUGG |
內含子 | + | CTTG | 998 | GGGAAGAGACATCCTTGTGT | 1083 | GGGAAGAGACAUCCUUGUGU |
內含子 | - | GTTA | 999 | ATGCCCAACACAAGGATGTC | 1084 | AUGCCCAACACAAGGAUGUC |
內含子 | + | CTTG | 1000 | TGCAGACTCAGAGGTGAGAG | 1085 | UGCAGACUCAGAGGUGAGAG |
內含子 | + | GTTT | 1001 | GCGTAAGCAAAGGGGTGGAT | 1086 | GCGUAAGCAAAGGGGUGGAU |
內含子 | + | TTTG | 1002 | CGTAAGCAAAGGGGTGGATT | 1087 | CGUAAGCAAAGGGGUGGAUU |
內含子 | - | CTTC | 1003 | CGAGGAACTTCTCGTCCTGG | 1088 | CGAGGAACUUCUCGUCCUGG |
內含子 | - | CTTC | 1004 | TCGTCCTGGAGAGAACAGGC | 1089 | UCGUCCUGGAGAGAACAGGC |
內含子 | + | CTTT | 1005 | TCCTCCCTGCAGCATCTGGA | 1090 | UCCUCCCUGCAGCAUCUGGA |
內含子 | + | TTTT | 1006 | CCTCCCTGCAGCATCTGGAG | 1091 | CCUCCCUGCAGCAUCUGGAG |
內含子 | + | TTTC | 1007 | CTCCCTGCAGCATCTGGAGT | 1092 | CUCCCUGCAGCAUCUGGAGU |
內含子 | + | CTTG | 1008 | GAAACCCTCAAGTGAGTGAG | 1093 | GAAACCCUCAAGUGAGUGAG |
內含子 | - | CTTG | 1009 | TTCTCACTCAGCGCATCCAG | 1094 | UUCUCACUCAGCGCAUCCAG |
內含子 | - | GTTC | 1010 | TCACTCAGCGCATCCAGGCT | 1095 | UCACUCAGCGCAUCCAGGCU |
內含子 | - | GTTG | 1011 | TTCTGGGACAGACTGCGGGG | 1096 | UUCUGGGACAGACUGCGGGG |
內含子 | - | GTTC | 1012 | TGGGACAGACTGCGGGGACA | 1097 | UGGGACAGACUGCGGGGACA |
內含子 | - | GTTA | 1013 | TTGTACAAGCTGTCGGAAAC | 1098 | UUGUACAAGCUGUCGGAAAC |
內含子 | - | ATTG | 1014 | TACAAGCTGTCGGAAACAGA | 1099 | UACAAGCUGUCGGAAACAGA |
內含子 | - | CTTG | 1015 | TTGTACTGGACGCTGGCAAG | 1100 | UUGUACUGGACGCUGGCAAG |
內含子 | - | GTTG | 1016 | TACTGGACGCTGGCAAGAGA | 1101 | UACUGGACGCUGGCAAGAGA |
內含子 | + | ATTC | 1017 | ACGGATCAGCCTGAGATGAT | 1102 | ACGGAUCAGCCUGAGAUGAU |
本發明包括上文所列之正向重複及間隔子之所有組合,與本文中之揭示內容一致。
在一些實施例中,本文所描述之間隔子序列包含尿嘧啶(U)。在一些實施例中,本文所描述之間隔子序列包含胸腺嘧啶(T)。在一些實施例中,根據表5A或表5B之間隔子序列包含在表5A或表5B中指示為尿嘧啶之一或多個位置中包含胸腺嘧啶的序列。
例示性 RNA 引導本發明包括RNA引導,其包含本文所描述(例如如上表5A及5B中所闡述)之正向重複及間隔子之任何及所有組合。在一些實施例中,RNA引導之序列與SEQ ID NO: 1178-1192中之任一者之序列具有至少90%一致性(例如至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%一致性)。在一些實施例中,RNA引導具有SEQ ID NO: 1178-1192中之任一者之序列。
修飾 RNA引導可包括關於參考序列,尤其親本聚核糖核苷酸之一或多個共價修飾,其包括於本發明之範疇內。
例示性修飾可包括對糖、核鹼基、核苷間鍵聯(例如連接磷酸酯/磷酸二酯鍵聯/磷酸二酯主鏈)之任何修飾,及其任何組合。以下詳細描述本文提供之一些示例性修飾。
RNA引導可包括任何適用修飾,諸如對糖、核鹼基或核苷間鍵聯(例如連接磷酸酯/磷酸二酯鍵聯/磷酸二酯主鏈)之修飾。嘧啶核鹼基之一或多個原子可經視情況經取代之胺基、視情況經取代之硫醇、視情況經取代之烷基(例如甲基或乙基)或鹵基(例如氯或氟)置換或取代。在某些實施例中,修飾(例如一或多個修飾)存在於糖及核苷間鍵聯中之各者中。修飾可為核糖核酸(RNA)修飾成去氧核糖核酸(DNA)、蘇糖核酸(TNA)、二醇核酸(GNA)、肽核酸(PNA)、鎖核酸(LNA)或其混合物。本文描述了額外修飾。
在一些實施例中,修飾可包括化學或細胞誘導之修飾。舉例而言,胞內RNA修飾之一些非限制性實例由Lewis及Pan描述於「RNA modifications and structures cooperate to guide RNA-protein interactions」, Nat Reviews Mol Cell Biol, 2017, 18:202-210中。
不同糖修飾、核苷酸修飾及/或核苷間鍵聯(例如主鏈結構)可存在於序列中之多個位置。一般熟習此項技術者將瞭解,核苷酸類似物或其他修飾可位於序列之任何位置,以使得實質上不減少序列之功能。序列可包括約1%至約100%經修飾核苷酸(相對於總核苷酸含量,或相對於一或多種類型之核苷酸,亦即A、G、U或C中之任何一或多者)或任何中間百分比(例如1%至20%、1%至25%、1%至50%、1%至60%、1%至70%、1%至80%、1%至90%、1%至95%、10%至20%、10%至25%、10%至50%、10%至60%、10%至70%、10%至80%、10%至90%、10%至95%、10%至100%、20%至25%、20%至50%、20%至60%、20%至70%、20%至80%、20%至90%、20%至95%、20%至100%、50%至60%、50%至70%、50%至80%、50%至90%、50%至95%、50%至100%、70%至80%、70%至90%、70%至95%、70%至100%、80%至90%、80%至95%、80%至100%、90%至95%、90%至100%及95%至100%)。
在一些實施例中,序列之一或多個核糖核苷酸處的糖修飾(例如在2'位置或4'位置)或糖置換以及主鏈修飾可包括磷酸二酯鍵聯之修飾或置換。序列之特定實例包括但不限於包括經修飾之主鏈或無天然核苷間鍵聯(諸如核苷間修飾),包括磷酸二酯鍵聯之修飾或置換的序列。具有經修飾之主鏈的序列尤其包括主鏈中不具有磷原子的彼等者。出於本申請案之目的,且如此項技術中有時提及,在核苷間主鏈中不具有磷原子之經修飾之RNA亦可視為寡核苷。在特定實施例中,序列將包括在其核苷間主鏈中具有磷原子之核糖核苷酸。
經修飾之序列主鏈可包括例如硫代磷酸酯;對掌性硫代磷酸酯;二硫代磷酸酯;磷酸三酯;胺基烷基磷酸三酯;甲基及其他烷基膦酸酯,諸如3'-伸烷基膦酸酯及對掌性膦酸酯;亞膦酸酯;胺基磷酸酯,諸如具有正常3'-5'鍵聯之3'-胺基胺基磷酸酯及胺基烷基胺基磷酸酯、硫代胺基磷酸酯、硫羰基烷基膦酸酯、硫羰基烷基磷酸三酯及硼烷磷酸酯、其2'-5'連接之類似物及具有反向極性之胺基磷酸酯,其中相鄰的核苷單元對以3'-5'至5'-3'或2'-5'至5'-2'連接。亦包括各種鹽、混合鹽及游離酸形式。在一些實施例中,序列可帶負電或帶正電。
可併入序列中之經修飾之核苷酸可在核苷間鍵聯(例如磷酸酯主鏈)上進行修飾。在本文中,在聚核苷酸主鏈之上下文中,片語「磷酸酯」及「磷酸二酯」可互換使用。主鏈磷酸酯基團可藉由用不同的取代基置換一或多個氧原子來修飾。此外,經修飾之核苷及核苷酸可包括用如本文所描述之另一核苷間鍵聯成批置換未經修飾之磷酸酯部分。經修飾之磷酸酯基團之實例包括但不限於硫代磷酸酯、硒代磷酸酯、硼烷磷酸酯(boranophosphate)、硼烷磷酸酯(boranophosphate ester)、氫膦酸酯、胺基磷酸酯、二胺基磷酸酯、烷基或芳基膦酸酯及磷酸三酯。二硫代磷酸酯之兩個非連接氧均經硫置換。磷酸酯連接子亦可藉由用氮(橋聯胺基磷酸酯)、硫(橋聯硫代磷酸酯)及碳(橋聯亞甲基-膦酸酯)置換連接氧而修飾。
提供經α-硫基取代之磷酸酯部分以經由非天然硫代磷酸酯主鏈鍵聯賦予RNA及DNA聚合物穩定性。硫代磷酸酯DNA及RNA具有增加的核酸酶抗性,及隨後在細胞環境中具有更長的半衰期。
在具體實施例中,經修飾之核苷包括α-硫基-核苷(例如5'-O-(1-硫代磷酸酯)-腺苷、5'-O-(1-硫代磷酸酯)-胞苷(a-硫基-胞苷)、5'-O-(1-硫代磷酸酯)-鳥苷、5'-O-(1-硫代磷酸酯)-尿苷或5'-O-(1-硫代磷酸酯)-假尿苷)。
本文中描述可根據本發明採用的其他核苷間鍵聯,包括不含磷原子之核苷間鍵聯。
在一些實施例中,序列可包括一或多個細胞毒性核苷。舉例而言,細胞毒性核苷可併入序列中,諸如雙功能修飾。細胞毒性核苷可包括但不限於腺苷阿糖、5-氮雜胞苷、4'-硫基-阿糖胞苷、環戊烯基胞嘧啶、克拉屈濱(cladribine)、氯法拉濱(clofarabine)、阿糖胞苷、阿糖胞嘧啶、1-(2-C-氰基-2-去氧-β-D-阿糖-呋喃戊醣基)-胞嘧啶、地西他濱(decitabine)、5-氟尿嘧啶、氟達拉濱(fludarabine)、氟尿苷、吉西他濱(gemcitabine)、喃氟啶(tegafur)及尿嘧啶之組合、喃氟啶((RS)-5-氟-1-(四氫呋喃-2-基)嘧啶-2,4(1H,3H)-二酮)、曲沙他濱(troxacitabine)、替紮他濱(tezacitabine)、2'-去氧-2'-亞甲基胞嘧啶核苷(DMDC)及6-巰基嘌呤。額外實例包括磷酸氟達拉濱、N4-二十二烷醯基-1-β-D-阿糖呋喃胞嘧啶、N4-十八基-1-β-D-阿糖呋喃胞嘧啶、N4-軟脂醯基-1-(2-C-氰基-2-去氧-β-D-阿糖-呋喃戊醣基)胞嘧啶及P-4055 (阿糖胞苷5'-反油酸酯)。
在一些實施例中,序列包括一或多個轉錄後修飾(例如加帽、裂解、聚腺苷酸化、剪接、聚A序列、甲基化、醯化、磷酸化、離胺酸及精胺酸殘基之甲基化、乙醯化及硫醇基及酪胺酸殘基之亞硝基化等)。一或多個轉錄後修飾可為任何轉錄後修飾,諸如已在RNA中鑑別出之超過一百個不同的核苷修飾中之任一者(Rozenski, J, Crain, P及McCloskey, J. (1999). The RNA Modification Database: 1999年更新. Nucl Acids Res 27: 196-197)。在一些實施例中,第一經分離之核酸包含信使RNA (mRNA)。在一些實施例中,mRNA包含至少一個選自由以下組成之群的核苷:吡啶-4-酮核糖核苷、5-氮雜-尿苷、2-硫基-5-氮雜-尿苷、2-硫代尿苷、4-硫基-假尿苷、2-硫基-假尿苷、5-羥基尿苷、3-甲基尿苷、5-羧基甲基-尿苷、1-羧基甲基-假尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸甲基尿苷、1-牛磺酸甲基-假尿苷、5-牛磺酸甲基-2-硫基-尿苷、1-牛磺酸甲基-4-硫基-尿苷、5-甲基-尿苷、1-甲基-假尿苷、4-硫基-1-甲基-假尿苷、2-硫基-1-甲基-假尿苷、1-甲基-1-去氮-假尿苷、2-硫基-1-甲基-1-去氮-假尿苷、二氫尿苷、二氫假尿苷、2-硫基-二氫尿苷、2-硫基-二氫假尿苷、2-甲氧基尿苷、2-甲氧基-4-硫基-尿苷、4-甲氧基-假尿苷及4-甲氧基-2-硫基-假尿苷。在一些實施例中,mRNA包含至少一個選自由以下組成之群的核苷:5-氮雜-胞苷、假異胞苷、3-甲基-胞苷、N4-乙醯基胞苷、5-甲醯基胞苷、N4-甲基胞啶、5-羥甲基胞苷、1-甲基-假異胞苷、吡咯并-胞苷、吡咯并-假異胞苷、2-硫基-胞苷、2-硫基-5-甲基-胞苷、4-硫基-假異胞苷、4-硫基-1-甲基-假異胞苷、4-硫基-1-甲基-1-去氮-假異胞苷、1-甲基-1-去氮-假異胞苷、澤布拉林(zebularine)、5-氮雜-澤布拉林、5-甲基-澤布拉林、5-氮雜-2-硫基-澤布拉林、2-硫基-澤布拉林、2-甲氧基-胞苷、2-甲氧基-5-甲基-胞苷、4-甲氧基-假異胞苷及4-甲氧基-1-甲基-假異胞苷。在一些實施例中,mRNA包含至少一個選自由以下組成之群的核苷:2-胺基嘌呤、2,6-二胺基嘌呤、7-去氮-腺嘌呤、7-去氮-8-氮雜-腺嘌呤、7-去氮-2-胺基嘌呤、7-去氮-8-氮雜-2-胺基嘌呤、7-去氮-2,6-二胺基嘌呤、7-去氮-8-氮雜-2,6-二胺基嘌呤、1-甲基腺苷、N6-甲基腺苷、N6-異戊烯基腺苷、N6-(順式-羥基異戊烯基)腺苷、2-甲硫基-N6-(順式-羥基異戊烯基)腺苷、N6-甘胺醯基胺甲醯基腺苷、N6-蘇胺醯基胺甲醯基腺苷、2-甲硫基-N6-蘇胺醯基胺甲醯基腺苷、N6,N6-二甲基腺苷、7-甲基腺嘌呤、2-甲硫基-腺嘌呤及2-甲氧基-腺嘌呤。在一些實施例中,mRNA包含至少一個選自由以下組成之群的核苷:肌苷、1-甲基-肌苷、懷俄苷(wyosine)、懷俄丁苷(wybutosine)、7-去氮-鳥苷、7-去氮-8-氮雜-鳥苷、6-硫基-鳥苷、6-硫基-7-去氮-鳥苷、6-硫基-7-去氮-8-氮雜-鳥苷、7-甲基-鳥苷、6-硫基-7-甲基-鳥苷、7-甲基肌苷、6-甲氧基-鳥苷、1-甲基鳥苷、N2-甲基鳥苷、N2,N2-二甲基鳥苷、8-側氧基-鳥苷、7-甲基-8-側氧基-鳥苷、1-甲基-6-硫基-鳥苷、N2-甲基-6-硫基-鳥苷及N2,N2-二甲基-6-硫基-鳥苷。
序列可沿分子之整個長度均勻修飾或可不均勻修飾。舉例而言,一或多種或所有類型之核苷酸(例如天然存在之核苷酸、嘌呤或嘧啶,或A、G、U、C、I、pU中之任一或多個或所有)可在序列中或在其給定預定序列區中均勻修飾或可不均勻修飾。在一些實施例中,序列包括假尿苷。在一些實施例中,序列包括肌苷,其可幫助免疫系統將序列表徵為內源性RNA與病毒RNA。肌苷之併入亦可介導改善之RNA穩定性/降低之降解。參見例如Yu, Z.等人. (2015) RNA editing by ADAR1 marks dsRNA as 「self」. Cell Res. 25, 1283-1284,其以全文引用之方式併入本文中。
Cas12i多肽 在一些實施例中,本發明之組合物包括如PCT/US2019/022375中所描述之Cas12i多肽。
在一些實施例中,本發明之組合物包括本文所描述之Cas12i2多肽(例如包含SEQ ID NO: 1104及/或由SEQ ID NO: 1103編碼之多肽)。在一些實施例中,Cas12i2多肽包含至少一個RuvC域。
編碼本文所描述之Cas12i2多肽之核酸序列可與參考核酸序列,例如SEQ ID NO: 1103實質上相同。在一些實施例中,Cas12i2多肽係由包含與參考核酸序列,例如SEQ ID NO: 1103具有至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約91%、至少約92%、至少約93%、至少約94%、至少約95%、至少約96%、至少約97%、至少約98%、至少約99%或至少約99.5%序列一致性之序列的核酸編碼。兩個此類核酸之間的一致性百分比可藉由檢測兩個最佳比對之核酸序列或藉由使用軟體程式或演算法(例如BLAST、ALIGN、CLUSTAL)使用標準參數手動確定。兩個核酸序列實質上相同之一個指示為該等核酸分子在嚴格溫度及離子強度條件(例如在中等至高嚴格度之範圍內)下與另一者之互補序列雜交。參見例如Tijssen, 「Hybridization with Nucleic Acid Probes. Part I. Theory and Nucleic Acid Preparation」 (Laboratory Techniques in Biochemistry and Molecular Biology,第24卷)。
在一些實施例中,Cas12i多肽為包含與SEQ ID NO: 1104至少95%一致之胺基酸序列且包含相對於SEQ ID NO: 1104之一或多個突變的Cas12i2多肽。在一些實施例中,Cas12i2多肽中之一或多個突變係在SEQ ID NO: 1104之位置D581、G624、F626、P868、I926、V1030、E1035及/或S1046。在一些實施例中,一或多個突變為胺基酸取代,其視情況為D581R、G624R、F626R、P868T、I926R、V1030G、E1035R、S1046G或其組合。
在一些實施例中,Cas12i2多肽在位置D581、D911、I926及V1030包含突變(例如D581R、D911R、I926R及V1030G之胺基酸取代)。在一些實施例中,Cas12i2多肽在位置D581、I926及V1030包含突變(例如D581R、I926R及V1030G之胺基酸取代)。在一些實施例中,Cas12i2多肽在位置D581、I926、V1030及S1046包含突變(例如D581R、I926R、V1030G及S1046G之胺基酸取代)。在一些實施例中,Cas12i2多肽在位置D581、G624、F626、I926、V1030、E1035及S1046包含突變(例如D581R、G624R、F626R、I926R、V1030G、E1035R及S1046G之胺基酸取代)。在一些實施例中,Cas12i2多肽在位置D581、G624、F626、P868、I926、V1030、E1035及S1046包含突變(例如D581R、G624R、F626R、P868T、I926R、V1030G、E1035R及S1046G之胺基酸取代)。
在一些實施例中,Cas12i2多肽係由與參考核酸序列,例如SEQ ID NO: 1103具有至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約91%、至少約92%、至少約93%、至少約94%、至少約95%、至少約96%、至少約97%、至少約98%、至少約99%或更高序列一致性而非100%序列一致性之核酸序列編碼。
在一些實施例中,本發明之Cas12i2多肽包含與SEQ ID NO: 1104具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致性之多肽序列。
在一些實施例中,本發明描述與一或多個參考多肽具有指定程度之胺基酸序列一致性之Cas12i2多肽,例如與SEQ ID NO: 1104之胺基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或甚至至少99%而非100%序列一致性。同源性或一致性可如本文所描述,藉由胺基酸序列比對,例如使用諸如BLAST、ALIGN或CLUSTAL之程式來確定。
亦提供一種本發明之Cas12i2多肽,其具有酶活性,例如核酸酶或核酸內切酶活性,且當使用先前所描述之比對方法中之任一者比對時,包含與SEQ ID NO: 1104之胺基酸序列相差50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1或0個胺基酸殘基的胺基酸序列。
在一些實施例中,Cas12i2多肽包含具有SEQ ID NO: 1127、SEQ ID NO: 1128、SEQ ID NO: 1129、SEQ ID NO: 1130或SEQ ID NO: 1131之序列的多肽。
在一些實施例中,本發明之Cas12i2多肽包含與SEQ ID NO: 1127、SEQ ID NO: 1128、SEQ ID NO: 1129、SEQ ID NO: 1130或SEQ ID NO: 1131具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致性之多肽序列。在一些實施例中,與SEQ ID NO: 1127、SEQ ID NO: 1128、SEQ ID NO: 1129、SEQ ID NO: 1130或SEQ ID NO: 1131具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致性之Cas12i2多肽維持區分多肽與其各別親本/參考序列之胺基酸變化(或此等變化中之至少1、2、3個等)。在一些實施例中,本發明之Cas12i2多肽包含與SEQ ID NO: 1127、SEQ ID NO: 1128、SEQ ID NO: 1129、SEQ ID NO: 1130或SEQ ID NO: 1131具有至少95%一致性之多肽序列。在一些實施例中,與SEQ ID NO: 1127、SEQ ID NO: 1128、SEQ ID NO: 1129、SEQ ID NO: 1130或SEQ ID NO: 1131具有至少95%一致性之Cas12i2多肽維持區分多肽與其各別親本/參考序列之胺基酸變化(或此等變化中之至少1、2、3個等)。
在一些實施例中,本發明描述一種與一或多個參考多肽具有指定程度之胺基酸序列一致性之Cas12i2多肽,例如與SEQ ID NO: 1127、SEQ ID NO: 1128、SEQ ID NO: 1129、SEQ ID NO: 1130或SEQ ID NO: 1131之胺基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或甚至至少99%而非100%序列一致性。同源性或一致性可如本文所描述,藉由胺基酸序列比對,例如使用諸如BLAST、ALIGN或CLUSTAL之程式來確定。
亦提供一種本發明之Cas12i2多肽,其具有酶活性,例如核酸酶或核酸內切酶活性,且當使用先前所描述之比對方法中之任一者比對時,包含與SEQ ID NO: 1127、SEQ ID NO: 1128、SEQ ID NO: 1129、SEQ ID NO: 1130或SEQ ID NO: 1131之胺基酸序列相差50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1或0個胺基酸殘基的胺基酸序列。
在一些實施例中,本發明之組合物包括本文所描述之Cas12i4多肽(例如包含SEQ ID NO: 1158及/或由SEQ ID NO: 1132編碼之多肽)。在一些實施例中,Cas12i4多肽包含至少一個RuvC域。
編碼本文所描述之Cas12i4多肽之核酸序列可與參考核酸序列,例如SEQ ID NO: 1132實質上相同。在一些實施例中,Cas12i4多肽係由包含與參考核酸序列,例如SEQ ID NO: 1132具有至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約91%、至少約92%、至少約93%、至少約94%、至少約95%、至少約96%、至少約97%、至少約98%、至少約99%或至少約99.5%序列一致性之序列的核酸編碼。兩個此類核酸之間的一致性百分比可藉由檢測兩個最佳比對之核酸序列或藉由使用軟體程式或演算法(例如BLAST、ALIGN、CLUSTAL)使用標準參數手動確定。兩個核酸序列實質上相同之一個指示為該等核酸分子在嚴格溫度及離子強度條件(例如在中等至高嚴格度之範圍內)下與另一者之互補序列雜交。
在一些實施例中,Cas12i4多肽係由與參考核酸序列,例如SEQ ID NO: 1132具有至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約91%、至少約92%、至少約93%、至少約94%、至少約95%、至少約96%、至少約97%、至少約98%、至少約99%或更高序列一致性而非100%序列一致性之核酸序列編碼。
在一些實施例中,本發明之Cas12i4多肽包含與SEQ ID NO: 1158具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致性之多肽序列。
在一些實施例中,本發明描述與一或多個參考多肽具有指定程度之胺基酸序列一致性之Cas12i4多肽,例如與SEQ ID NO: 1158之胺基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或甚至至少99%而非100%序列一致性。同源性或一致性可如本文所描述,藉由胺基酸序列比對,例如使用諸如BLAST、ALIGN或CLUSTAL之程式來確定。
亦提供一種本發明之Cas12i4多肽,其具有酶活性,例如核酸酶或核酸內切酶活性,且當使用先前所描述之比對方法中之任一者比對時,包含與SEQ ID NO: 1158之胺基酸序列相差50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1或0個胺基酸殘基的胺基酸序列。
在一些實施例中,Cas12i4多肽包含具有SEQ ID NO: 1159或SEQ ID NO: 1160之序列的多肽。
在一些實施例中,本發明之Cas12i4多肽包含與SEQ ID NO: 1159或SEQ ID NO: 1160具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致性之多肽序列。在一些實施例中,與SEQ ID NO: 1159或SEQ ID NO: 1160具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致性之Cas12i4多肽維持區分多肽與其各別親本/參考序列之胺基酸變化(或此等變化中之至少1、2、3個等)。
在一些實施例中,本發明描述與一或多個參考多肽具有指定程度之胺基酸序列一致性之Cas12i4多肽,例如與SEQ ID NO: 1159或SEQ ID NO: 1160之胺基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或甚至至少99%而非100%序列一致性。同源性或一致性可如本文所描述,藉由胺基酸序列比對,例如使用諸如BLAST、ALIGN或CLUSTAL之程式來確定。
亦提供一種本發明之Cas12i4多肽,其具有酶活性,例如核酸酶或核酸內切酶活性,且當使用先前所描述之比對方法中之任一者比對時,包含與SEQ ID NO: 1159或SEQ ID NO: 1160之胺基酸序列相差50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1或0個胺基酸殘基的胺基酸序列。
在一些實施例中,本發明之組合物包括本文所描述之Cas12i1多肽(例如包含SEQ ID NO: 1161之多肽)。在一些實施例中,Cas12i1多肽包含至少一個RuvC域。
在一些實施例中,本發明之Cas12i1多肽包含與SEQ ID NO: 1161具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致性之多肽序列。
在一些實施例中,本發明描述與一或多個參考多肽具有指定程度之胺基酸序列一致性之Cas12i1多肽,例如與SEQ ID NO: 1161之胺基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或甚至至少99%而非100%序列一致性。同源性或一致性可如本文所描述,藉由胺基酸序列比對,例如使用諸如BLAST、ALIGN或CLUSTAL之程式來確定。
亦提供一種本發明之Cas12i1多肽,其具有酶活性,例如核酸酶或核酸內切酶活性,且當使用先前所描述之比對方法中之任一者比對時,包含與SEQ ID NO: 1161之胺基酸序列相差50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1或0個胺基酸殘基的胺基酸序列。
在一些實施例中,本發明之組合物包括本文所描述之Cas12i3多肽(例如包含SEQ ID NO: 1162之多肽)。在一些實施例中,Cas12i3多肽包含至少一個RuvC域。
在一些實施例中,本發明之Cas12i3多肽包含與SEQ ID NO: 1162具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致性之多肽序列。
在一些實施例中,本發明描述與一或多個參考多肽具有指定程度之胺基酸序列一致性之Cas12i3多肽,例如與SEQ ID NO: 1162之胺基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或甚至至少99%而非100%序列一致性。同源性或一致性可如本文所描述,藉由胺基酸序列比對,例如使用諸如BLAST、ALIGN或CLUSTAL之程式來確定。
亦提供一種本發明之Cas12i3多肽,其具有酶活性,例如核酸酶或核酸內切酶活性,且當使用先前所描述之比對方法中之任一者比對時,包含與SEQ ID NO: 1162之胺基酸序列相差50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1或0個胺基酸殘基的胺基酸序列。
雖然本文所描述之變化可為一或多個胺基酸變化,但Cas12i多肽之變化亦可為實質性的,諸如作為胺基端及/或羧基端延伸部分之多肽融合。舉例而言,Cas12i多肽可含有額外肽,例如一或多種肽。額外肽之實例可包括用於進行標記之抗原決定基肽,諸如聚組胺酸標籤(His標籤)、Myc及FLAG。在一些實施例中,本文所描述之Cas12i多肽可與諸如螢光蛋白(例如綠色螢光蛋白(GFP)或黃色螢光蛋白(YFP))之可偵測部分融合。
在一些實施例中,Cas12i多肽包含至少一種(例如兩種、三種、四種、五種、六種或更多種)核定位訊號(nuclear localization signal;NLS)。在一些實施例中,Cas12i多肽包含至少一種(例如兩種、三種、四種、五種、六種或更多種)核輸出訊號(nuclear export signal;NES)。在一些實施例中,Cas12i多肽包含至少一種(例如兩種、三種、四種、五種、六種或更多種) NLS及至少一種(例如兩種、三種、四種、五種、六種或更多種) NES。
在一些實施例中,本文所描述之Cas12i多肽可為自身失活的。參見,Epstein等人,「Engineering a Self-Inactivating CRISPR System for AAV Vectors」, Mol. Ther., 24 (2016): S50,其以全文引用之方式併入本文中。
在一些實施例中,編碼本文所描述之Cas12i多肽之核苷酸序列可經密碼子最佳化以用於特定宿主細胞或生物體中。舉例而言,核酸可經密碼子最佳化以用於任何非人類真核生物,包括小鼠、大鼠、兔、狗、家畜或非人類靈長類動物。密碼子使用表可容易獲得,例如可在www.kazusa.orjp/codon/獲得的「密碼子使用資料庫(Codon Usage Database)」,且此等表可以多種方式調適。參見Nakamura等人. Nucl. Acids Res. 28:292 (2000),其以全文引用的方式併入本文中。亦可利用電腦演算法(諸如Gene Forge (Aptagen; Jacobus, PA)),對特定序列進行密碼子最佳化,以在特定宿主細胞中表現。
目標序列 應理解,通常,目標序列為雙股的,且間隔子序列可藉助於與目標序列之第一股(亦即,目標股或間隔子互補股)實質上互補且雜交之間隔子序列與目標序列結合。目標序列可宜藉由提供目標股或非目標股之序列描述。更一般而言,核酸可藉由與雙股目標序列之任一股雜交而與雙股目標序列結合。
在一些實施例中,目標序列在CIITA基因或CIITA基因之基因座內。在一些實施例中,CIITA基因為哺乳動物基因。在一些實施例中,CIITA基因為人類基因。舉例而言,在一些實施例中,目標序列在www.ncbi.nlm.nih.gov/gene/4261之序列或其反向互補序列內。在一些實施例中,目標序列在www.ncbi.nlm.nih.gov/gene/4261 (或其反向互補序列)之CIITA基因之外顯子內,例如在SEQ ID NO: 1105、1106、1107、1108、1109、1110、1111、1112、1113、1114、1115、1116、1117、1118、1119、1120、1121、1122、1123、1124、1125或1126之序列(或其反向互補序列)內。www.ncbi.nlm.nih.gov/gene/4261 (及其反向互補序列)之CIITA基因之外顯子內之目標序列闡述於表5A中。在一些實施例中,目標序列在www.ncbi.nlm.nih.gov/gene/4261 (或其反向互補序列)之CIITA基因之內含子內。www.ncbi.nlm.nih.gov/gene/4261 (或其反向互補序列)之CIITA基因之內含子內之目標序列闡述於表5B中。在一些實施例中,目標序列在www.ncbi.nlm.nih.gov/gene/4261或其反向互補序列之CIITA基因序列之變體(例如多型性變體)內。在一些實施例中,CIITA基因序列為www.ncbi.nlm.nih.gov/gene/4261之序列或其反向互補序列的同源物。舉例而言,在一些實施例中,CIITA基因序列為非人類CIITA序列。在一些實施例中,CIITA基因序列為SEQ ID NO: 1193-1206中之任一者中闡述之編碼序列。在一些實施例中,CIITA基因序列為SEQ ID NO: 1193-1206中之任一者中闡述之編碼序列的同源物。
在一些實施例中,目標序列與5'-NTTN-3' PAM序列相鄰,其中N為任何核苷酸。5'-NTTN-3'序列可緊鄰目標序列或例如在目標序列之少量(例如1、2、3、4或5個)核苷酸內。在一些實施例中,5'-NTTN-3'序列為5'-NTTY-3'、5'-NTTC-3'、5'-NTTT-3'、5'-NTTA-3'、5'-NTTB-3'、5'-NTTG-3'、5'-CTTY-3'、5'-DTTR'3'、5'-CTTR-3'、5'-DTTT-3'、5'-ATTN-3'或5'-GTTN-3',其中Y為C或T,B為除了A以外之任何核苷酸,D為除了C以外之任何核苷酸,且R為A或G。在一些實施例中,5'-NTTN-3'序列為5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'。
在一些實施例中,目標序列為單股的(例如單股DNA)。在一些實施例中,目標序列為雙股的(例如雙股DNA)。在一些實施例中,目標序列包含單股及雙股區兩者。在一些實施例中,目標序列為線性的。在一些實施例中,目標序列為環狀的。在一些實施例中,目標序列包含一或多個經修飾之核苷酸,諸如甲基化核苷酸、受損核苷酸或核苷酸類似物。在一些實施例中,目標序列未經修飾。在一些實施例中,RNA引導與雙股目標序列之第一股(例如目標股或間隔子互補股)結合,且5'-NTTN-3' PAM序列存在於第二互補股(例如非目標股或非間隔子互補股)中。在一些實施例中,RNA引導與目標股(例如間隔子互補股)上之5'-NAAN-3'序列相鄰。
在一些實施例中,目標序列存在於細胞中。在一些實施例中,目標序列存在於細胞之核中。在一些實施例中,目標序列對於細胞而言為內源性的。在一些實施例中,目標序列為基因體DNA。在一些實施例中,目標序列為染色體DNA。在一些實施例中,目標序列為蛋白質編碼基因或其功能區域(諸如編碼區),或調節元件(諸如啟動子、強化子、5'或3'非轉譯區)等。在一些實施例中,目標序列為質體。
在一些實施例中,目標序列存在於目標序列之可容易接近區域中。在一些實施例中,目標序列在目標基因之外顯子中。在一些實施例中,目標序列跨越目標基因之外顯子-內含子接合點。在一些實施例中,目標序列存在於非編碼區,諸如基因之調節區中。在一些實施例中,其中目標序列對於二細胞而言為外源性的,目標序列包含未發現於細胞之基因體中之序列。
在一些實施例中,目標序列對於細胞而言為外源性的。在一些實施例中,目標序列為水平移轉的質體。在一些實施例中,目標序列整合於細胞之基因體中。在一些實施例中,目標序列未整合於細胞之基因體中。在一些實施例中,目標序列為細胞中之質體。在一些實施例中,目標序列存在於染色體外陣列中。
在一些實施例中,目標序列為經分離之核酸,諸如經分離之DNA或經分離之RNA。在一些實施例中,目標序列存在於無細胞環境中。在一些實施例中,目標序列為經分離之載體,諸如質體。在一些實施例中,目標序列為超純質體。
目標序列為與RNA引導雜交之CIITA基因的基因座。在一些實施例中,細胞僅具有目標序列之一個複本。在一些實施例中,細胞具有目標序列之超過一個複本,諸如至少約2、3、4、5、10、100或更多個複本中之任一者。在一些實施例中,細胞恰好具有目標序列之兩個複本。
在一些實施例中,選擇CIITA目標序列以使用以下標準中之一或多者由Cas12i多肽及RNA引導編輯。首先,在一些實施例中,選擇在CIITA編碼序列5'端附近之目標序列。舉例而言,在一些實施例中,RNA引導設計成靶向外顯子1 (SEQ ID NO: 1105)或外顯子2 (SEQ ID NO: 1106)中之序列。首先,在一些實施例中,選擇與5'-CTTY-3' PAM序列相鄰之目標序列。舉例而言,在一些實施例中,RNA引導設計成靶向與5'-CTTT-3'或5'-CTTC-3'序列相鄰之序列。再者,在一些實施例中,選擇與其他基因體序列具有低序列相似性之目標序列。舉例而言,對於各目標序列而言,潛在非目標位點可藉由搜尋與PAM序列相鄰之其他基因體序列且計算目標序列與PAM相鄰序列之間的Levenshtein距離來鑑別。Levenshtein距離(例如編輯距離)對應於將一個序列變成另一序列(例如將潛在非目標基因座之序列變成中靶基因座之序列)所需的最小編輯(例如***、缺失或取代)數。在此分析之後,針對不會具有Levenshtein距離為0或1之潛在脫靶序列之目標序列來設計RNA引導。
產生 本發明包括用於產生RNA引導之方法、用於產生多肽之方法及用於使RNA引導及Cas12i多肽複合之方法。
RNA引導 在一些實施例中,藉由活體外轉錄DNA模板製備RNA引導。因此,舉例而言,在一些實施例中,藉由活體外轉錄編碼RNA引導之DNA模板,使用上游啟動子序列(例如T7聚合酶啟動子序列),產生RNA引導。在一些實施例中,DNA模板編碼多個RNA引導,或活體外轉錄反應包括多個不同DNA模板,各自編碼不同RNA引導。在一些實施例中,使用化學合成方法製備RNA引導。在一些實施例中,藉由在用包括編碼RNA引導之序列之質體轉染之細胞中表現RNA引導序列製備RNA引導。在一些實施例中,質體編碼多個不同RNA引導。在一些實施例中,多個不同質體(各自編碼不同RNA引導)經轉染至細胞中。在一些實施例中,自編碼RNA引導且亦編碼Cas12i多肽之質體表現RNA引導。在一些實施例中,自表現RNA引導而非Cas12i多肽之質體表現RNA引導。在一些實施例中,RNA引導購自市售供應商。在一些實施例中,使用一或多個例如如上文所描述之經修飾之核苷酸合成RNA引導。
Cas12i多肽 在一些實施例中,本發明之Cas12i多肽可藉由如下來製備:(a)培養產生本發明之Cas12i多肽之細菌,分離Cas12i多肽,視情況純化Cas12i多肽,及使Cas12i多肽與RNA引導複合。Cas12i多肽亦可藉由(b)已知之基因工程改造技術來製備,特定言之,藉由自細菌分離編碼本發明之Cas12i多肽之基因,構築重組表現載體,且接著將載體轉移至表現RNA引導之適當宿主細胞中以在宿主細胞中表現與RNA引導複合之重組蛋白。或者,Cas12i多肽可藉由(c)活體外聯合轉錄-轉譯系統及接著與RNA引導複合來製備。
在一些實施例中,宿主細胞用於表現Cas12i多肽。宿主細胞不受特別限制,且可較佳使用各種已知細胞。宿主細胞之特定實例包括細菌,諸如大腸桿菌(
E. coli)、酵母(出芽酵母、釀酒酵母(
Saccharomyces cerevisiae)及裂變酵母、粟酒裂殖酵母(
Schizosaccharomyces pombe))、線蟲(秀麗隱桿線蟲(
Caenorhabditis elegans))、非洲爪蟾(
Xenopus laevis)卵母細胞及動物細胞(例如CHO細胞、COS細胞及HEK293細胞)。用於將上文描述之表現載體轉移至宿主細胞中之方法,亦即轉型方法,不受特別限制,且可使用諸如電穿孔、磷酸鈣法、脂質體法及DEAE聚葡萄糖法之已知方法。
在用表現載體轉型宿主之後,可培養、培育或飼養宿主細胞以產生Cas12i多肽。在Cas12i多肽表現之後,可收集宿主細胞,且根據習知方法(例如過濾、離心、細胞破碎、凝膠過濾層析、離子交換層析等)自培養物等純化出Cas12i多肽。
在一些實施例中,用於Cas12i多肽表現之方法包含轉譯Cas12i多肽之至少5個胺基酸、至少10個胺基酸、至少15個胺基酸、至少20個胺基酸、至少50個胺基酸、至少100個胺基酸、至少150個胺基酸、至少200個胺基酸、至少250個胺基酸、至少300個胺基酸、至少400個胺基酸、至少500個胺基酸、至少600個胺基酸、至少700個胺基酸、至少800個胺基酸、至少900個胺基酸或至少1000個胺基酸。在一些實施例中,用於蛋白質表現之方法包含轉譯Cas12i多肽之約5個胺基酸、約10個胺基酸、約15個胺基酸、約20個胺基酸、約50個胺基酸、約100個胺基酸、約150個胺基酸、約200個胺基酸、約250個胺基酸、約300個胺基酸、約400個胺基酸、約500個胺基酸、約600個胺基酸、約700個胺基酸、約800個胺基酸、約900個胺基酸、約1000個胺基酸或更多。
可使用多種方法測定宿主細胞中Cas12i多肽之產生含量。此類方法包括但不限於例如利用對Cas12i多肽具有特異性之多株或單株抗體或如本文別處所描述之標記標籤的方法。例示性方法包括但不限於酶聯免疫吸附分析(enzyme-linked immunosorbent assay;ELISA)、放射免疫分析(MA)、螢光免疫分析(FIA)及螢光激活細胞分選(fluorescent activated cell sorting;FACS)。此等及其他分析為此項技術中所熟知(參見例如Maddox等人, J. Exp. Med. 158:1211 [1983])。
本發明提供在細胞中活體內表現Cas12i多肽之方法,其包含向其中聚核糖核苷酸編碼Cas12i多肽之宿主細胞提供編碼Cas12i多肽之聚核糖核苷酸,在細胞中表現Cas12i多肽,及自細胞獲得Cas12i多肽。
複合 在一些實施例中,靶向CIITA之RNA引導與Cas12i多肽複合以形成核糖核蛋白。在一些實施例中,RNA引導及Cas12i多肽之複合在低於約以下中之任一者之溫度下進行:20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃或55℃。在一些實施例中,RNA引導在約37℃下在至少約以下中之任一者之培養期內不會與Cas12i多肽解離:10 min、15 min、20 min、25 min、30 min、35 min、40 min、45 min、50 min、55 min、1小時、2小時、3小時、4小時或更多小時。
在一些實施例中,RNA引導及Cas12i多肽在複合緩衝液中複合。在一些實施例中,Cas12i多肽儲存於用複合緩衝液置換之緩衝液中以與RNA引導形成複合物。在一些實施例中,將Cas12i多肽儲存於複合緩衝液中。
在一些實施例中,複合緩衝液之pH在約7.3至8.6範圍內。在一個實施例中,複合緩衝液之pH為約7.3。在一個實施例中,複合緩衝液之pH為約7.4。在一個實施例中,複合緩衝液之pH為約7.5。在一個實施例中,複合緩衝液之pH為約7.6。在一個實施例中,複合緩衝液之pH為約7.7。在一個實施例中,複合緩衝液之pH為約7.8。在一個實施例中,複合緩衝液之pH為約7.9。在一個實施例中,複合緩衝液之pH為約8.0。在一個實施例中,複合緩衝液之pH為約8.1。在一個實施例中,複合緩衝液之pH為約8.2。在一個實施例中,複合緩衝液之pH為約8.3。在一個實施例中,複合緩衝液之pH為約8.4。在一個實施例中,複合緩衝液之pH為約8.5。在一個實施例中,複合緩衝液之pH為約8.6。
在一些實施例中,Cas12i多肽可在如本文所描述進行純化之前在宿主細胞中過度表現且與RNA引導複合。在一些實施例中,將編碼Cas12i多肽之mRNA或DNA引入細胞中,以使得Cas12i多肽在細胞中表現。在一些實施例中,亦將RNA引導引入細胞中,無論係與單一mRNA或DNA構築體同時、單獨或依序引入,以使得在細胞中形成核糖核蛋白複合物。
遞送 可調配本文所描述之組合物或複合物,例如包括載劑,諸如載劑及/或聚合物載劑,例如脂質體,且藉由已知方法遞送至細胞(例如原核、真核、植物、哺乳動物等)。此類方法包括但不限於轉染(例如脂質介導、陽離子聚合物、磷酸鈣、樹枝狀聚合物);電穿孔或破壞膜之其他方法(例如核轉染)、病毒遞送(例如慢病毒、逆轉錄病毒、腺病毒、腺相關病毒(adeno-associated virus;AAV))、顯微注射、微彈轟擊(「基因槍」)、fugene、直接音波裝載、細胞擠壓、光學轉染、原生質體融合、刺穿感染、磁轉染、胞外體介導之輸送、脂質奈米粒子介導之轉移及其任何組合。
在一些實施例中,編碼RNA引導之核酸可位於病毒載體中。在一些實施例中,編碼Cas12i (例如Cas12i2)多肽之核酸可位於病毒載體中。在一些實施例中,病毒載體包含編碼Cas12i多肽之核酸及編碼RNA引導之核酸兩者。
在一些實施例中,本文所描述之系統中之任一者可包含:編碼Cas12i多肽之核酸,其位於第一載體中;及編碼RNA引導之核酸,其位於第二載體上。在一些實施例中,第一及/或第二載體為病毒載體。在一些特定實例中,第一及第二載體為相同類型之載體。在其他實例中,第一及第二載體為不同類型之載體。
在一些實施例中,該方法包含將一或多種核酸(例如編碼Cas12i多肽、RNA引導、供體DNA等之核酸)、其一或多個轉錄本及/或預先形成之RNA引導/Cas12i多肽複合物遞送至細胞中,其中形成三元複合物。在一些實施例中,RNA引導及編碼Cas12i多肽之RNA係於單一組合物中一起遞送。在一些實施例中,RNA引導及編碼Cas12i多肽之RNA係於單獨組合物中遞送。在一些實施例中,於單獨組合物中遞送之RNA引導及編碼Cas12i多肽之RNA係使用相同遞送技術遞送。在一些實施例中,於單獨組合物中遞送之RNA引導及編碼Cas12i多肽之RNA係使用不同遞送技術遞送。例示性胞內遞送方法包括但不限於:病毒(諸如AAV)或病毒樣藥劑;基於化學物質之轉染方法,諸如使用磷酸鈣、樹枝狀聚合物、脂質體、脂質奈米粒子或陽離子聚合物(例如DEAE-聚葡萄糖或聚伸乙亞胺)之彼等轉染方法;非化學方法,諸如顯微注射、電穿孔、細胞擠壓、聲致穿孔、光學轉染、刺穿感染、原生質體融合、細菌結合、遞送質體或轉位子;基於粒子之方法,諸如使用基因槍、磁轉染或磁體輔助之轉染、粒子轟擊;及雜交法,諸如核轉染。在一些實施例中,脂質奈米粒子包含編碼Cas12i多肽之mRNA、RNA引導或編碼Cas12i多肽及RNA引導之mRNA。在一些實施例中,編碼Cas12i多肽之mRNA為SEQ ID NO: 1103或SEQ ID NO: 1132或其變體中闡述之核苷酸序列之轉錄本。在一些實施例中,本申請案進一步提供藉由此類方法產生之細胞,及包含此類細胞或由此類細胞產生之生物體(諸如動物、植物或真菌)。
在一些實施例中,Cas12i組分及RNA引導組分係在一起遞送。舉例而言,在一些實施例中,Cas12i組分及RNA引導組分一起封裝在單一AAV粒子中。在另一實例中,在一些實施例中,Cas12i組分及RNA引導組分經由脂質奈米粒子(LNP)一起遞送。在一些實施例中,單獨地遞送Cas12i組分及RNA引導組分。舉例而言,在一些實施例中,Cas12i組分及RNA引導封裝至單獨AAV粒子中。在另一實例中,在一些實施例中,藉由第一遞送機制遞送Cas12i組分,且藉由第二遞送機制遞送RNA引導。
在一些實施例中,本文所描述之系統中之任一者可包含一或多個LNP,其中LNP包含Cas12i多肽(例如Cas12i2多肽)或編碼Cas12i多肽之核酸、RNA引導或編碼RNA引導之核酸,或兩者。
在一些實施例中,本文所描述之系統可包含LNP,其中LNP包含Cas12i多肽或編碼Cas12i多肽之核酸,及包含編碼RNA引導之核酸之病毒載體。在一些實施例中,病毒載體為AAV載體。在其他實施例中,本文所描述之系統可包含:LNP,其包含RNA引導或編碼RNA引導之核酸;及病毒載體,其包含編碼Cas12i多肽之核酸。在一些實施例中,病毒載體為AAV載體。
在一些實施例中,本文揭示之基因編輯系統可包含如本文所揭示之Cas12i多肽。在一些實施例中,基因編輯系統可包含編碼Cas12i多肽之核酸。舉例而言,基因編輯系統可包含編碼Cas12i多肽之載體(例如病毒載體,諸如AAV載體,諸如AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAVrh10、AAV11及AAV12)。或者,基因編輯系統可包含編碼Cas12i多肽之mRNA分子。在一些情況下,mRNA分子可經密碼子最佳化。
細胞 本文所描述之組合物或複合物可遞送至多種細胞中。在一些實施例中,細胞為經分離之細胞。在一些實施例中,細胞處於細胞培養或兩種或更多種細胞類型之共培養中。在一些實施例中,細胞為離體的。在一些實施例中,自活生物體獲得細胞,且維持於細胞培養物中。在一些實施例中,細胞為單細胞生物體。
在一些實施例中,細胞為原核細胞。在一些實施例中,細胞為細菌細胞或來源於細菌細胞。在一些實施例中,細胞為古菌細胞或來源於古菌細胞。
在一些實施例中,細胞為真核細胞。在一些實施例中,細胞為植物細胞或來源於植物細胞。在一些實施例中,細胞為真菌細胞或來源於真菌細胞。在一些實施例中,細胞為動物細胞或來源於動物細胞。在一些實施例中,細胞為無脊椎動物細胞或來源於無脊椎動物細胞。在一些實施例中,細胞為脊椎動物細胞或來源於脊椎動物細胞。在一些實施例中,細胞為哺乳動物細胞或來源於哺乳動物細胞。在一些實施例中,細胞為人類細胞。在一些實施例中,細胞為斑馬魚細胞。在一些實施例中,細胞為嚙齒動物細胞。在一些實施例中,細胞以合成方式製成,有時稱為人工細胞。
在一些實施例中,細胞來源於細胞株。用於組織培養之廣泛多種細胞株為此項技術中已知的。細胞株之實例包括但不限於293T、MF7、K562、希拉(HeLa)、CHO及其基因轉殖變種。細胞株可自熟習此項技術者已知之多種來源(參見例如美國菌種中心(American Type Culture Collection;ATCC) (Manassas, Va.))獲得。在一些實施例中,細胞為永生或永生化細胞。
在一些實施例中,細胞為原代細胞。在一些實施例中,細胞為幹細胞,諸如全潛能幹細胞(例如全能)、富潛能幹細胞、多潛能幹細胞、寡能幹細胞或單能幹細胞。在一些實施例中,細胞為誘導性富潛能幹細胞(iPSC)或來源於iPSC。在一些實施例中,細胞為分化細胞。舉例而言,在一些實施例中,分化細胞為肌肉細胞(例如肌細胞)、脂肪細胞(fat cell) (例如脂肪細胞(adipocyte))、骨骼細胞(例如骨母細胞、骨細胞、破骨細胞)、血球(例如單核球、淋巴球、嗜中性球、嗜酸血球、嗜鹼性球、巨噬細胞、紅血球或血小板)、神經細胞(例如神經元)、上皮細胞、免疫細胞(例如淋巴球、嗜中性球、單核球或巨噬細胞)、肝細胞(liver cell) (例如肝細胞(hepatocyte))、纖維母細胞或生殖細胞。在一些實施例中,細胞為終末分化細胞。舉例而言,在一些實施例中,終末分化細胞為神經元細胞、脂肪細胞、心肌細胞、骨骼肌細胞、表皮細胞或腸細胞。在一些實施例中,細胞為免疫細胞。在一些實施例中,免疫細胞為T細胞。在一些實施例中,免疫細胞為B細胞。在一些實施例中,免疫細胞為自然殺手(Natural Killer;NK)細胞。在一些實施例中,免疫細胞為腫瘤浸潤淋巴球(Tumor Infiltrating Lymphocyte;TIL)。在一些實施例中,細胞為哺乳動物細胞,例如人類細胞或鼠類細胞。在一些實施例中,鼠類細胞來源於野生型小鼠、免疫抑制小鼠或疾病特異性小鼠模型。在一些實施例中,細胞為活性組織、器官或生物體內之細胞。
方法及治療應用 本發明亦提供修飾CIITA基因內之目標序列之方法。在一些實施例中,方法包含將靶向CIITA之RNA引導及Cas12i多肽引入細胞中。靶向CIITA之RNA引導及Cas12i多肽可作為核糖核蛋白複合物引入細胞中。靶向CIITA之RNA引導及Cas12i多肽可引入核酸載體上。Cas12i多肽可作為mRNA引入。RNA引導可直接引入細胞中。
在一些實施例中,CIITA基因之序列具有www.ncbi.nlm.nih.gov/gene/4261 (或其反向互補序列)。在一些實施例中,目標序列在CIITA基因之外顯子中,諸如具有以下中之任一者中闡述之序列的外顯子:SEQ ID NO: 1105、1106、1107、1108、1109、1110、1111、1112、1113、1114、1115、1116、1117、1118、1119、1120、1121、1122、1123、1124、1125或1126 (或其反向互補序列)。在一些實施例中,目標序列在CIITA基因之內含子(例如www.ncbi.nlm.nih.gov/gene/4261之序列或其反向互補序列之內含子)中。在其他實施例中,CIITA基因之序列為www.ncbi.nlm.nih.gov/gene/4261之序列(或其反向互補序列)的變體或www.ncbi.nlm.nih.gov/gene/4261之序列(或其反向互補序列)的同源物。舉例而言,在一些實施例中,目標序列為www.ncbi.nlm.nih.gov/gene/4261 (或其反向互補序列)之CIITA序列的多型性變體或CIITA基因的非人類形式。
在一些實施例中,如本文所揭示之RNA引導設計成與同5'-NTTN-3' PAM序列相鄰之目標序列互補。5'-NTTN-3'序列可緊鄰目標序列或例如在目標序列之少數(例如1、2、3、4或5個)核苷酸內。在一些實施例中,5'-NTTN-3'序列為5'-NTTY-3'、5'-NTTC-3'、5'-NTTT-3'、5'-NTTA-3'、5'-NTTB-3'、5'-NTTG-3'、5'-CTTY-3'、5'-DTTR'3'、5'-CTTR-3'、5'-DTTT-3'、5'-ATTN-3'或5'-GTTN-3',其中Y為C或T,B為除了A以外之任何核苷酸,D為除了C以外之任何核苷酸,且R為A或G。在一些實施例中,5'-NTTN-3'序列為5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'。在一些實施例中,RNA引導設計成與雙股目標序列之第一股(例如目標股或間隔子互補股)結合,且5'-NTTN-3' PAM序列存在於第二互補股(例如非目標股或非間隔子互補股)中。在一些實施例中,RNA引導與目標股(例如間隔子互補股)上之5'-NAAN-3'序列相鄰。
在一些實施例中,Cas12i多肽具有酶活性(例如核酸酶活性)。在一些實施例中,Cas12i多肽在細胞中誘導一或多個DNA雙股斷裂。在一些實施例中,Cas12i多肽在細胞中誘導一或多個DNA單股斷裂。在一些實施例中,Cas12i多肽在細胞中誘導一或多個DNA切口。在一些實施例中,DNA斷裂及/或切口引起形成一或多個***或缺失(例如一或多個缺失)。
在一些實施例中,本文揭示之RNA引導與Cas12i多肽形成複合物,且將Cas12i多肽導引至與5'-NTTN-3'序列相鄰之目標序列。在一些實施例中,複合物誘導與5'-NTTN-3'序列相鄰之缺失(例如核苷酸缺失或DNA缺失)。在一些實施例中,複合物誘導與以下相鄰之缺失:5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列。在一些實施例中,複合物誘導與富T/C序列相鄰之缺失。
在一些實施例中,缺失在5'-NTTN-3'序列下游。在一些實施例中,缺失在以下各者之下游:5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列。在一些實施例中,缺失在富T/C序列下游。
在一些實施例中,缺失改變CIITA基因之表現。在一些實施例中,缺失改變CIITA基因之功能。在一些實施例中,缺失會失活CIITA基因。在一些實施例中,缺失為框移缺失。在一些實施例中,缺失為非框移缺失。在一些實施例中,缺失引起細胞毒性或細胞死亡(例如細胞凋亡)。
在一些實施例中,缺失在5'-NTTN-3'序列之約5至約15個核苷酸(例如約3、4、5、6、7、8、9、10、11、12、13、14、15、16或17個核苷酸)內開始。在一些實施例中,缺失在以下各者之約5至約15個核苷酸(例如約3、4、5、6、7、8、9、10、11、12、13、14、15、16或17個核苷酸)內開始:5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列。在一些實施例中,缺失在富T/C序列之約5至約15個核苷酸(例如約3、4、5、6、7、8、9、10、11、12、13、14、15、16或17個核苷酸)內開始。
在一些實施例中,缺失在5'-NTTN-3'序列下游之約5至約15個核苷酸(例如約3、4、5、6、7、8、9、10、11、12、13、14、15、16或17個核苷酸)內開始。在一些實施例中,缺失在以下各者下游之約5至約15個核苷酸(例如約3、4、5、6、7、8、9、10、11、12、13、14、15、16或17個核苷酸)內開始:5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列。在一些實施例中,缺失在富T/C序列下游之約5至約15個核苷酸(例如約3、4、5、6、7、8、9、10、11、12、13、14、15、16或17個核苷酸)內開始。
在一些實施例中,缺失在5'-NTTN-3'序列之約5至約10個核苷酸(例如約3、4、5、6、7、8、9、10、11或12個核苷酸)內開始。在一些實施例中,缺失在以下各者之約5至約10個核苷酸(例如約3、4、5、6、7、8、9、10、11或12個核苷酸)內開始:5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列。在一些實施例中,缺失在富T/C序列之約5至約10個核苷酸(例如約3、4、5、6、7、8、9、10、11或12個核苷酸)內開始。
在一些實施例中,缺失在5'-NTTN-3'序列下游之約5至約10個核苷酸(例如約3、4、5、6、7、8、9、10、11或12個核苷酸)內開始。在一些實施例中,缺失在以下各者下游之約5至約10個核苷酸(例如約3、4、5、6、7、8、9、10、11或12個核苷酸)內開始:5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列。在一些實施例中,缺失在富T/C序列下游之約5至約10個核苷酸(例如約3、4、5、6、7、8、9、10、11或12個核苷酸)內開始。
在一些實施例中,缺失在5'-NTTN-3'序列之約10至約15個核苷酸(例如約8、9、10、11、12、13、14、15、16或17個核苷酸)內開始。在一些實施例中,缺失在以下各者之約10至約15個核苷酸(例如約8、9、10、11、12、13、14、15、16或17個核苷酸)內開始:5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列。在一些實施例中,缺失在富T/C序列之約10至約15個核苷酸(例如約8、9、10、11、12、13、14、15、16或17個核苷酸)內開始。
在一些實施例中,缺失在5'-NTTN-3'序列下游之約10至約15個核苷酸(例如約8、9、10、11、12、13、14、15、16或17個核苷酸)內開始。在一些實施例中,缺失在以下各者下游之約10至約15個核苷酸(例如約8、9、10、11、12、13、14、15、16或17個核苷酸)內開始:5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列。在一些實施例中,缺失在富T/C序列下游之約10至約15個核苷酸(例如約8、9、10、11、12、13、14、15、16或17個核苷酸)內開始。
在一些實施例中,缺失在5'-NTTN-3'序列之約20至約30個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束。在一些實施例中,缺失在以下之約20至約30個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束:5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列。在一些實施例中,缺失在富T/C序列之約20至約30個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束。
在一些實施例中,缺失在5'-NTTN-3'序列下游之約20至約30個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束。在一些實施例中,缺失在以下各者下游之約20至約30個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束:5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列。在一些實施例中,缺失在富T/C序列下游之約20至約30個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束。
在一些實施例中,缺失在5'-NTTN-3'序列之約20至約25個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27或28個核苷酸)內結束。在一些實施例中,缺失在以下之約20至約25個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27或28個核苷酸)內結束:5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列。在一些實施例中,缺失在富T/C序列之約20至約25個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27或28個核苷酸)內結束。
在一些實施例中,缺失在5'-NTTN-3'序列下游之約20至約25個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27或28個核苷酸)內結束。在一些實施例中,缺失在以下各者下游之約20至約25個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27或28個核苷酸)內結束:5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列。在一些實施例中,缺失在富T/C序列下游之約20至約25個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27或28個核苷酸)內結束。
在一些實施例中,缺失在5'-NTTN-3'序列之約25至約30個核苷酸(例如約22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束。在一些實施例中,缺失在以下之約25至約30個核苷酸(例如約22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束:5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列。在一些實施例中,缺失在富T/C序列之約25至約30個核苷酸(例如約22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束。
在一些實施例中,缺失在5'-NTTN-3'序列下游之約25至約30個核苷酸(例如約22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束。在一些實施例中,缺失在以下各者下游之約25至約30個核苷酸(例如約22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束:5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列。在一些實施例中,缺失在富T/C序列下游之約25至約30個核苷酸(例如約22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束。
在一些實施例中,缺失在5'-NTTN-3'序列之約5至約15個核苷酸(例如約3、4、5、6、7、8、9、10、11、12、13、14、15、16或17個核苷酸)內開始,且在約20至約30個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束。在一些實施例中,缺失在以下各者之約5至約15個核苷酸(例如約3、4、5、6、7、8、9、10、11、12、13、14、15、16或17個核苷酸)內開始,且在約20至約30個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束:5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列。在一些實施例中,缺失在富T/C序列之約5至約15個核苷酸(例如約3、4、5、6、7、8、9、10、11、12、13、14、15、16或17個核苷酸)內開始,且在約20至約30個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束。
在一些實施例中,缺失在5'-NTTN-3'序列下游之約5至約15個核苷酸(例如約3、4、5、6、7、8、9、10、11、12、13、14、15、16或17個核苷酸)內開始,且在5'-NTTN-3'序列下游之約20至約30個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束。在一些實施例中,缺失在以下各者下游之約5至約15個核苷酸(例如約3、4、5、6、7、8、9、10、11、12、13、14、15、16或17個核苷酸)內開始:5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列;且在以下各者下游之約20至約30個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束:5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列。在一些實施例中,缺失在富T/C序列下游之約5至約15個核苷酸(例如約3、4、5、6、7、8、9、10、11、12、13、14、15、16或17個核苷酸)內開始,且在富T/C序列下游之約20至約30個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束。
在一些實施例中,缺失在5'-NTTN-3'序列之約5至約15個核苷酸(例如約3、4、5、6、7、8、9、10、11、12、13、14、15、16或17個核苷酸)內開始,且在約20至約25個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27或28個核苷酸)內結束。在一些實施例中,缺失在以下之約5至約15個核苷酸(例如約3、4、5、6、7、8、9、10、11、12、13、14、15、16或17個核苷酸)內開始,且在約20至約25個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27或28個核苷酸)內結束:5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列。在一些實施例中,缺失在富T/C序列之約5至約15個核苷酸(例如約3、4、5、6、7、8、9、10、11、12、13、14、15、16或17個核苷酸)內開始,且在約20至約25個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27或28個核苷酸)內結束。
在一些實施例中,缺失在5'-NTTN-3'序列下游之約5至約15個核苷酸(例如約3、4、5、6、7、8、9、10、11、12、13、14、15、16或17個核苷酸)內開始,且在5'-NTTN-3'序列下游之約20至約25個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27或28個核苷酸)內結束。在一些實施例中,缺失在以下各者下游之約5至約15個核苷酸(例如約3、4、5、6、7、8、9、10、11、12、13、14、15、16或17個核苷酸)內開始:5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列;且在以下各者下游之約20至約25個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27或28個核苷酸)內結束:5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列。在一些實施例中,缺失在富T/C序列下游之約5至約15個核苷酸(例如約3、4、5、6、7、8、9、10、11、12、13、14、15、16或17個核苷酸)內開始,且在富T/C序列下游之約20至約25個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27或28個核苷酸)內結束。
在一些實施例中,缺失在5'-NTTN-3'序列之約5至約15個核苷酸(例如約3、4、5、6、7、8、9、10、11、12、13、14、15、16或17個核苷酸)內開始,且在約25至約30個核苷酸(例如約22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束。在一些實施例中,缺失在以下之約5至約15個核苷酸(例如約3、4、5、6、7、8、9、10、11、12、13、14、15、16或17個核苷酸)內開始,且在約25至約30個核苷酸(例如約22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束:5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列。在一些實施例中,缺失在富T/C序列之約5至約15個核苷酸(例如約3、4、5、6、7、8、9、10、11、12、13、14、15、16或17個核苷酸)內開始,且在約25至約30個核苷酸(例如約22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束。
在一些實施例中,缺失在5'-NTTN-3'序列下游之約5至約15個核苷酸(例如約3、4、5、6、7、8、9、10、11、12、13、14、15、16或17個核苷酸)內開始,且在5'-NTTN-3'序列下游之約25至約30個核苷酸(例如約22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束。在一些實施例中,缺失在以下各者下游之約5至約15個核苷酸(例如約3、4、5、6、7、8、9、10、11、12、13、14、15、16或17個核苷酸)內開始:5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列;且在以下各者下游之約25至約30個核苷酸(例如約22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束:5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列。在一些實施例中,缺失在富T/C序列下游之約5至約15個核苷酸(例如約3、4、5、6、7、8、9、10、11、12、13、14、15、16或17個核苷酸)內開始,且在富T/C序列下游之約25至約30個核苷酸(例如約22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束。
在一些實施例中,缺失在5'-NTTN-3'序列之約5至約10個核苷酸(例如約3、4、5、6、7、8、9、10、11或12個核苷酸)內開始,且在約20至約30個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束。在一些實施例中,缺失在以下之約5至約10個核苷酸(例如約3、4、5、6、7、8、9、10、11或12個核苷酸)內開始,且在約20至約30個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束:5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列。在一些實施例中,缺失在富T/C序列之約5至約10個核苷酸(例如約3、4、5、6、7、8、9、10、11或12個核苷酸)內開始,且在約20至約30個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束。
在一些實施例中,缺失在5'-NTTN-3'序列下游之約5至約10個核苷酸(例如約3、4、5、6、7、8、9、10、11或12個核苷酸)內開始,且在5'-NTTN-3'序列下游之約20至約30個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束。在一些實施例中,缺失在以下各者下游之約5至約10個核苷酸(例如約3、4、5、6、7、8、9、10、11或12個核苷酸)內開始:5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列;且在以下各者下游之約20至約30個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束:5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列。在一些實施例中,缺失在富T/C序列下游之約5至約10個核苷酸(例如約3、4、5、6、7、8、9、10、11或12個核苷酸)內開始,且在富T/C序列下游之約20至約30個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束。
在一些實施例中,缺失在5'-NTTN-3'序列之約5至約10個核苷酸(例如約3、4、5、6、7、8、9、10、11或12個核苷酸)內開始,且在約20至約25個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27或28個核苷酸)內結束。在一些實施例中,缺失在以下之約5至約10個核苷酸(例如約3、4、5、6、7、8、9、10、11或12個核苷酸)內開始,且在約20至約25個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27或28個核苷酸)內結束:5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列。在一些實施例中,缺失在富T/C序列之約5至約10個核苷酸(例如約3、4、5、6、7、8、9、10、11或12個核苷酸)內開始,且在約20至約25個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27或28個核苷酸)內結束。
在一些實施例中,缺失在5'-NTTN-3'序列下游之約5至約10個核苷酸(例如約3、4、5、6、7、8、9、10、11或12個核苷酸)內開始,且在5'-NTTN-3'序列下游之約20至約25個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27或28個核苷酸)內結束。在一些實施例中,缺失在以下各者下游之約5至約10個核苷酸(例如約3、4、5、6、7、8、9、10、11或12個核苷酸)內開始:5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列;且在以下各者下游之約20至約25個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27或28個核苷酸)內結束:5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列。在一些實施例中,缺失在富T/C序列下游之約5至約10個核苷酸(例如約3、4、5、6、7、8、9、10、11或12個核苷酸)內開始,且在富T/C序列下游之約20至約25個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27或28個核苷酸)內結束。
在一些實施例中,缺失在5'-NTTN-3'序列之約5至約10個核苷酸(例如約3、4、5、6、7、8、9、10、11或12個核苷酸)內開始,且在約25至約30個核苷酸(例如約22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束。在一些實施例中,缺失在富T/C序列之約5至約10個核苷酸(例如約3、4、5、6、7、8、9、10、11或12個核苷酸)內開始,且在約25至約30個核苷酸(例如約22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束。
在一些實施例中,缺失在5'-NTTN-3'序列下游之約5至約10個核苷酸(例如約3、4、5、6、7、8、9、10、11或12個核苷酸)內開始,且在5'-NTTN-3'序列下游之約25至約30個核苷酸(例如約22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束。在一些實施例中,缺失在以下各者下游之約5至約10個核苷酸(例如約3、4、5、6、7、8、9、10、11或12個核苷酸)內開始:5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列;且在以下各者下游之約25至約30個核苷酸(例如約22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束:5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列。在一些實施例中,缺失在富T/C序列下游之約5至約10個核苷酸(例如約3、4、5、6、7、8、9、10、11或12個核苷酸)內開始,且在富T/C序列下游之約25至約30個核苷酸(例如約22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束。
在一些實施例中,缺失在5'-NTTN-3'序列之約10至約15個核苷酸(例如約8、9、10、11、12、13、14、15、16或17個核苷酸)內開始,且在約20至約30個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束。在一些實施例中,缺失在以下之約10至約15個核苷酸(例如約8、9、10、11、12、13、14、15、16或17個核苷酸)內開始,且在約20至約30個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束:5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列。在一些實施例中,缺失在富T/C序列之約10至約15個核苷酸(例如約8、9、10、11、12、13、14、15、16或17個核苷酸)內開始,且在約20至約30個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束。
在一些實施例中,缺失在5'-NTTN-3'序列下游之約10至約15個核苷酸(例如約8、9、10、11、12、13、14、15、16或17個核苷酸)內開始,且在5'-NTTN-3'序列下游之約20至約30個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束。在一些實施例中,缺失在以下各者下游之約10至約15個核苷酸(例如約8、9、10、11、12、13、14、15、16或17個核苷酸)內開始:5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列;且在以下各者下游之約20至約30個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束:5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列。在一些實施例中,缺失在富T/C序列下游之約10至約15個核苷酸(例如約8、9、10、11、12、13、14、15、16或17個核苷酸)內開始,且在富T/C序列下游之約20至約30個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束。
在一些實施例中,缺失在5'-NTTN-3'序列之約10至約15個核苷酸(例如約8、9、10、11、12、13、14、15、16或17個核苷酸)內開始,且在約20至約25個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27或28個核苷酸)內結束。在一些實施例中,缺失在以下之約10至約15個核苷酸(例如約8、9、10、11、12、13、14、15、16或17個核苷酸)內開始,且在約20至約25個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27或28個核苷酸)內結束:5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列。在一些實施例中,缺失在富T/C序列之約10至約15個核苷酸(例如約8、9、10、11、12、13、14、15、16或17個核苷酸)內開始,且在約20至約25個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27或28個核苷酸)內結束。
在一些實施例中,缺失在5'-NTTN-3'序列下游之約10至約15個核苷酸(例如約8、9、10、11、12、13、14、15、16或17個核苷酸)內開始,且在5'-NTTN-3'序列下游之約20至約25個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27或28個核苷酸)內結束。在一些實施例中,缺失在以下各者下游之約10至約15個核苷酸(例如約8、9、10、11、12、13、14、15、16或17個核苷酸)內開始:5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列;且在以下各者下游之約20至約25個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27或28個核苷酸)內結束:5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列。在一些實施例中,缺失在富T/C序列下游之約10至約15個核苷酸(例如約8、9、10、11、12、13、14、15、16或17個核苷酸)內開始,且在富T/C序列下游之約20至約25個核苷酸(例如約17、18、19、20、21、22、23、24、25、26、27或28個核苷酸)內結束。
在一些實施例中,缺失在5'-NTTN-3'序列之約10至約15個核苷酸(例如約8、9、10、11、12、13、14、15、16或17個核苷酸)內開始,且在約25至約30個核苷酸(例如約22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束。在一些實施例中,缺失在以下之約10至約15個核苷酸(例如約8、9、10、11、12、13、14、15、16或17個核苷酸)內開始,且在約25至約30個核苷酸(例如約22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束:5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列。在一些實施例中,缺失在富T/C序列之約10至約15個核苷酸(例如約8、9、10、11、12、13、14、15、16或17個核苷酸)內開始,且在約25至約30個核苷酸(例如約22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束。
在一些實施例中,缺失在5'-NTTN-3'序列下游之約10至約15個核苷酸(例如約8、9、10、11、12、13、14、15、16或17個核苷酸)內開始,且在5'-NTTN-3'序列下游之約25至約30個核苷酸(例如約22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束。在一些實施例中,缺失在以下各者下游之約10至約15個核苷酸(例如約8、9、10、11、12、13、14、15、16或17個核苷酸)內開始:5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列;且在以下各者下游之約25至約30個核苷酸(例如約22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束:5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'序列。在一些實施例中,缺失在富T/C序列下游之約10至約15個核苷酸(例如約8、9、10、11、12、13、14、15、16或17個核苷酸)內開始,且在富T/C序列下游之約25至約30個核苷酸(例如約22、23、24、25、26、27、28、29、30、31、32或33個核苷酸)內結束。
在一些實施例中,缺失之長度長達約50個核苷酸(例如約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50個核苷酸)。在一些實施例中,缺失之長度長達約40個核苷酸(例如約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44或45個核苷酸)。在一些實施例中,缺失之長度在約4個核苷酸至約40個核苷酸之間(例如約3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44或45個核苷酸)。在一些實施例中,缺失之長度在約4個核苷酸至約25個核苷酸之間(例如約3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27或28個核苷酸)。在一些實施例中,缺失之長度在約10個核苷酸至約25個核苷酸之間(例如約7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27或28個核苷酸)。在一些實施例中,缺失之長度在約10個核苷酸至約15個核苷酸之間(例如約7、8、9、10、11、12、13、14、15、16或17個核苷酸)。
在一些實施例中,本文所描述之方法用於工程改造在CIITA基因中包含如本文所描述之缺失的細胞。在一些實施例中,使用包含如本文所描述之Cas12i酶及包含如本文所描述之正向重複與間隔子之RNA引導的複合物進行該等方法。在一些實施例中,RNA引導之序列與SEQ ID NO: 1178-1192中之任一者之序列具有至少90%一致性(例如至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%一致性)。在一些實施例中,RNA引導具有SEQ ID NO: 1178-1192中之任一者之序列。
在一些實施例中,靶向CIITA之RNA引導編碼於質體中。在一些實施例中,靶向CIITA之RNA引導為合成或經純化之RNA。在一些實施例中,Cas12i多肽編碼於質體中。在一些實施例中,Cas12i多肽係由RNA編碼,該RNA為合成或經純化的。
療法中可使用本文揭示之組合物、載體、核酸、RNA引導及細胞。治療個體之疾病或病狀之方法中可使用本文揭示之組合物、載體、核酸、RNA引導及細胞。此項技術中已知之任何合適的遞送或投與方法可用於遞送本文揭示之組合物、載體、核酸、RNA引導及細胞。此類方法可涉及使目標序列與本文揭示之組合物、載體、核酸或RNA引導接觸。此類方法可涉及編輯如本文所揭示之CIITA序列之方法。在一些實施例中,使用本文揭示之RNA引導進行工程改造之細胞用於離體基因療法。
在一些實施例中,使用本文揭示之基因編輯系統中之任一者產生之經修飾細胞可向需要治療之個體(例如人類患者)投與。經修飾細胞可包含本文所描述之取代、***及/或缺失。在一些情況下,經修飾細胞可為包含具有不同類型之基因編輯之細胞的非均質群體。在一些情況下,經修飾細胞可包含實質上均質細胞群體,例如整個群體中至少80%之細胞在CIITA基因中包含一個特定基因編輯。在一些實施例中,細胞可懸浮於合適的培養基中。
在一些態樣中,本文提供一種包含基因編輯系統或其組分之組合物。此類組合物可為醫藥組合物。適用的醫藥組合物可以適合於以下之調配物形式製備、封裝或出售:經口、經直腸、經***、非經腸、局部、經肺、鼻內、病灶內、經頰、經眼、靜脈內、器官內部或另外投與途徑。本發明之醫藥組合物可以散裝、以單一單位劑量或以複數個單一單位劑量形式製備、封裝或出售。如本文所用,「單位劑量」為將向個體投與之醫藥組合物(例如基因編輯系統或其組分)之個別量,或適宜分數之此類劑量,諸如此類劑量之二分之一或三分之一。
在一些實施例中,可向有需要之個體投與如本文所描述之包含基因編輯系統或其組分之醫藥組合物。在一些情況下,可將基因編輯系統或其組分遞送至特定細胞或組織中,其中基因編輯系統可用以基因修飾此類細胞中之CIITA基因。
適合於非經腸投與之醫藥組合物之調配物可包含活性劑(例如基因編輯系統或其組分,或經修飾細胞)與醫藥學上可接受之載劑(諸如無菌水或無菌等張鹽水)之組合。此類調配物可以適合於以推注投與或連續投與之形式製備、封裝或出售。一些可注射調配物可以單位劑型形式製備、封裝或出售,諸如以含有防腐劑的安瓿或多劑量容器形式。用於非經腸投與之一些調配物包括但不限於於油性或水性媒劑中的懸浮液、溶液、乳液;糊劑;及可植入持續釋放型或可生物降解型調配物。一些調配物可進一步包含一或多種額外成分,包括但不限於懸浮劑、穩定劑或分散劑。
醫藥組合物可呈無菌可注射水性或油性懸浮液或溶液形式。除系統或細胞以外,此懸浮液或溶液可包含額外成分,諸如本文所描述之分散劑、潤濕劑或懸浮劑。此類無菌可注射調配物可使用無毒非經腸可接受之稀釋劑或溶劑(諸如水或鹽水)製備。其他可接受之稀釋劑及溶劑包括但不限於林格氏溶液(Ringer's solution)、等張氯化鈉溶液,及不揮發性油,諸如合成單或二甘油酯。適用的其他非經腸可投與之調配物包括可包含呈封裝、脂質體製劑形式或呈可生物降解聚合物系統之組分之細胞的彼等者。用於持續釋放或植入的一些組合物可包含醫藥學上可接受之聚合物或疏水性物質,諸如乳液、離子交換樹脂、微溶性聚合物或微溶性鹽。
套組 本發明亦提供可用於例如進行本文所描述之方法的套組或系統。在一些實施例中,套組或系統包括RNA引導及Cas12i多肽。在一些實施例中,套組或系統包括編碼此類Cas12i多肽之聚核苷酸,且視情況聚核苷酸包含在例如如本文所描述之載體內。在一些實施例中,套組或系統包括編碼本文揭示之RNA引導之聚核苷酸。Cas12i多肽及RNA引導(例如作為核糖核蛋白)可封裝在套組或系統內之同一或其他容器內,或封裝在單獨小瓶或其他容器中,其內容物可在使用之前混合。套組或系統另外可視情況包括緩衝液及/或RNA引導與Cas12i多肽之使用說明書。
在一些實施例中,套組可適用於研究目的。舉例而言,在一些實施例中,套組可能適用於研究基因功能。
本文所引用之所有參考文獻及公開案均以引用的方式併入本文中。
實例
實例1 -靶向HEK293T細胞中之哺乳動物基因
此實例描述使用藉由電穿孔引入哺乳動物細胞中之經純化之變異Cas12i2效應子及RNA引導,對多CIITA目標序列之***或缺失評定。
設計Cas12i2 RNA引導(crRNA)且自Integrated DNA Technologies (IDT)訂購。藉由平鋪(tiling)5'-CTTC-3'、5'-CTTT-3'及5'-GTTC-3' PAM序列之CIITA之編碼外顯子選擇目標序列,且設計用於PAM序列下游之20-bp目標序列的間隔子序列。
表6. crRNA及目標序列。在表6中,藉由提供目標序列之非目標股之序列描述雙股目標序列。
目標 | 外顯子 | PAM | 目標序列 | 間隔子序列 | crRNA序列 |
T1 | 外顯子1 | CTTT | TTACCTTGGGGCTCTGACAG (SEQ ID NO: 1163) | UUACCUUGGGGCUCUGACAG (SEQ ID NO: 1207) | AGAAAUCCGUCUUUCAUUGACGGUUACCUUGGGGCUCUGACAG (SEQ ID NO: 1178) |
T2 | 外顯子1 | CTTT | CCCGGCCTTTTTACCTTGGG (SEQ ID NO: 1164) | CCCGGCCUUUUUACCUUGGG (SEQ ID NO: 1208) | AGAAAUCCGUCUUUCAUUGACGGCCCGGCCUUUUUACCUUGGG (SEQ ID NO: 1179) |
T3 | 外顯子2 | CTTC | CCTCCCAGGCAGCTCACAGT (SEQ ID NO: 1165) | CCUCCCAGGCAGCUCACAGU (SEQ ID NO: 1209) | AGAAAUCCGUCUUUCAUUGACGGCCUCCCAGGCAGCUCACAGU (SEQ ID NO: 1180) |
T4 | 外顯子2 | CTTC | TAGGGGCCCCAACTCCATGG (SEQ ID NO: 1166) | UAGGGGCCCCAACUCCAUGG (SEQ ID NO: 1210) | AGAAAUCCGUCUUUCAUUGACGGUAGGGGCCCCAACUCCAUGG (SEQ ID NO: 1181) |
T5 | 外顯子2 | CTTC | TTAACAGCGATGCTGACCCC (SEQ ID NO: 1167) | UUAACAGCGAUGCUGACCCC (SEQ ID NO: 1211) | AGAAAUCCGUCUUUCAUUGACGGUUAACAGCGAUGCUGACCCC (SEQ ID NO: 1182) |
T6 | 外顯子2 | CTTC | TATGACCAGATGGACCTGGC (SEQ ID NO: 1168) | UAUGACCAGAUGGACCUGGC (SEQ ID NO: 1212) | AGAAAUCCGUCUUUCAUUGACGGUAUGACCAGAUGGACCUGGC (SEQ ID NO: 1183) |
T8 | 外顯子2 | CTTC | TCCAGCCAGGTCCATCTGGT (SEQ ID NO: 1169) | UCCAGCCAGGUCCAUCUGGU (SEQ ID NO: 1213) | AGAAAUCCGUCUUUCAUUGACGGUCCAGCCAGGUCCAUCUGGU (SEQ ID NO: 1184) |
T9 | 外顯子2 | CTTC | TTCTCCAGCCAGGTCCATCT (SEQ ID NO: 1170) | UUCUCCAGCCAGGUCCAUCU (SEQ ID NO: 1214) | AGAAAUCCGUCUUUCAUUGACGGUUCUCCAGCCAGGUCCAUCU (SEQ ID NO: 1185) |
T10 | 外顯子3 | CTTT | TCCTCCCAGAACCCGACACA (SEQ ID NO: 1171) | UCCUCCCAGAACCCGACACA (SEQ ID NO: 1215) | AGAAAUCCGUCUUUCAUUGACGGUCCUCCCAGAACCCGACACA (SEQ ID NO: 1186) |
T11 | 外顯子3 | GTTC | AGCAGGCTGTTGTGTGACAT (SEQ ID NO: 1172) | AGCAGGCUGUUGUGUGACAU (SEQ ID NO: 1216) | AGAAAUCCGUCUUUCAUUGACGGAGCAGGCUGUUGUGUGACAU (SEQ ID NO: 1187) |
T12 | 外顯子3 | CTTC | CATGTCACACAACAGCCTGC (SEQ ID NO: 1173) | CAUGUCACACAACAGCCUGC (SEQ ID NO: 1217) | AGAAAUCCGUCUUUCAUUGACGGCAUGUCACACAACAGCCUGC (SEQ ID NO: 1188) |
T13 | 外顯子3 | CTTC | ATCACCTTCCATGTCACACA (SEQ ID NO: 1174) | AUCACCUUCCAUGUCACACA (SEQ ID NO: 1218) | AGAAAUCCGUCUUUCAUUGACGGAUCACCUUCCAUGUCACACA (SEQ ID NO: 1189) |
T14 | 外顯子3 | CTTC | CTCACCGATATTGGCATAAG (SEQ ID NO: 1175) | CUCACCGAUAUUGGCAUAAG (SEQ ID NO: 1219) | AGAAAUCCGUCUUUCAUUGACGGCUCACCGAUAUUGGCAUAAG (SEQ ID NO: 1190) |
T15 | 外顯子4 | CTTT | TCCTTGTCTGGGCAGCGGAA (SEQ ID NO: 1176) | UCCUUGUCUGGGCAGCGGAA (SEQ ID NO: 1220) | AGAAAUCCGUCUUUCAUUGACGGUCCUUGUCUGGGCAGCGGAA (SEQ ID NO: 1191) |
T16 | 外顯子4 | CTTC | CAGGACTCCCAGCTGGAGGG (SEQ ID NO: 1177) | CAGGACUCCCAGCUGGAGGG (SEQ ID NO: 1221) | AGAAAUCCGUCUUUCAUUGACGGCAGGACUCCCAGCUGGAGGG (SEQ ID NO: 1192) |
藉由以1:1 (效應子:crRNA)體積比(2.5:1 crRNA:效應子莫耳比),將經純化之Cas12i2多肽(400 µM)與crRNA (1 mM於250 mM NaCl中)混合來進行Cas12i2 RNP複合反應。在冰上培育複合物30-60 min。
在培育期間,使用TRYPLE
TM(重組細胞解離酶;ThermoFisher)收取HEK293T細胞且計數。細胞用PBS洗滌一次且以16,480個細胞/µL之濃度再懸浮於SF緩衝液+補充劑(SF CELL LINE 4D-NUCLEOFECTOR
TMX套組;Lonza #V4XC-2032)中。以3e5個細胞/反應將再懸浮的細胞分配至Lonza 16孔NUCLEOCUVETTE®帶(strip)中。以10 µM (Cas12i2)之最終濃度將複合的Cas12i2 RNP添加至各反應中,且接著以4 µM之最終濃度添加轉染增強劑寡聚物。各電穿孔反應之最終體積為20 µL。非靶向引導用作陰性對照。
該等帶使用電穿孔裝置(程式CM-130,Lonza 4D-NUCLEOFECTOR
TM)電穿孔。緊接在電穿孔之後,將80 µL預溫熱的DMEM + 10% FBS添加至各孔中且藉由移液輕輕地混合。對於各技術重複培養盤而言,將10 µL (30,000個細胞)之稀釋的核轉染細胞塗鋪至具有含有100 µL DMEM + 10% FBS之孔的預溫熱96孔盤中。在37℃與5% CO
2下培育編輯培養盤3天。
在3天之後,使用TRYPLE
TM(重組細胞解離酶;ThermoFisher)收取各孔且轉移至96孔TWIN.TEC® PCR培養盤(Eppendorf)中。拂去培養基且將細胞再懸浮於20 µL QUICKEXTRACT
TM(DNA萃取緩衝液;Lucigen)中。接著,在PCR機器中在65℃下15 min、68℃下15 min、98℃下10 min循環樣品。接著將樣品冷凍在-20℃下。
藉由數輪PCR製備用於下一代定序(Next Generation Sequencing;NGS)的樣品。第一輪(PCR I)用於擴增側接目標位點之基因體區域及添加NGS轉接子。第二輪(PCR II)用於添加NGS索引(index)。接著將反應物合併,藉由管柱純化純化,且在螢光計(Qubit)上定量。使用150循環NGS儀(NEXTSEQ
TMv2.5)中或高輸出套組(Illumina)進行定序操作,且在NGS儀(NEXTSEQ
TM550;Illumina)上運行。
對於NGS分析而言,***或缺失映射函數使用樣品之fastq檔案、擴增子參考序列及正向引子序列。對於各讀段而言,kmer掃描演算法用於計算讀段與參考序列之間的編輯操作(匹配、錯配、***、缺失)。為了移除一些樣品中存在之少量引子二聚體,需要各讀段之前30 nt匹配參考,且其中亦濾除超過一半之定位核苷酸錯配的讀段。至多50,000個穿過彼等過濾器之讀段用於分析,且若讀段含有***或缺失(insertion or deletion),則其視為***或缺失讀段(indel read)。***或缺失%計算為含有***或缺失之讀段之數目除以所分析讀段(穿過過濾器之讀段,至多50,000)之數目。穿過過濾器之讀段之最小數目的QC標準為10,000。
如
圖 1中所示,十五個測試RNA引導中之各者誘導CIITA目標序列中之***或缺失。因此,RNA引導及SEQ ID NO: 1128之變異Cas12i2能夠編輯HEK293T細胞中外顯子1、外顯子2、外顯子3及外顯子4中之CIITA目標。
實例2 -編輯T細胞中之CIITA
此實例描述使用藉由電穿孔引入哺乳動物細胞中之變異Cas12i2核糖核蛋白(RNP),對多個CIITA目標序列之***或缺失評定。
將來自個別供體之冷凍的人類周邊血液單核細胞(Peripheral Blood Mononuclear Cell;PBMC)復蘇且使用自動化細胞計數器計數。使用EASYSEP
TM人類T細胞分離套組(StemCell Technologies)分離CD3+ T細胞。在分離之後,收集樣品且進行CD3及活/死(LIVE/DEAD)染料染色(ThermoFisher)以分別用於表面表現及存活力之流式細胞分析技術分析。調整細胞密度至1e6個細胞/毫升,且細胞用抗CD3:CD28抗體於IMMUNOCULT
TM-XF T細胞擴增培養基(Stemcell Technologies) + IL-2 + L-麩醯胺酸中之混合液刺激3天。
藉由以1:1 (效應子:RNA引導)體積比(2.5:1 RNA引導:效應子莫耳比),將經純化之變異Cas12i2 (400 µM;SEQ ID NO: 1128)與RNA引導(1 mM於250 mM NaCl中;參見表7中之序列)混合進行Cas12i2 RNP複合反應。對於「僅效應子」對照而言,以與RNA引導相同的體積比,將變異Cas12i2與250 mM NaCl混合。在冰上培育複合物30-60 min。
表7.用於RNP轉染之RNA引導序列
目標 | 外顯子 | PAM | 目標序列 | crRNA序列 |
T1 | 外顯子1 | CTTT | TTACCTTGGGGCTCTGACAG (SEQ ID NO: 1163) | AGAAAUCCGUCUUUCAUUGACGGUUACCUUGGGGCUCUGACAG (SEQ ID NO: 1178) |
T4 | 外顯子2 | CTTC | TAGGGGCCCCAACTCCATGG (SEQ ID NO: 1166) | AGAAAUCCGUCUUUCAUUGACGGUAGGGGCCCCAACUCCAUGG (SEQ ID NO: 1181) |
T5 | 外顯子2 | CTTC | TTAACAGCGATGCTGACCCC (SEQ ID NO: 1167) | AGAAAUCCGUCUUUCAUUGACGGUUAACAGCGAUGCUGACCCC (SEQ ID NO: 1182) |
T12 | 外顯子3 | CTTC | CATGTCACACAACAGCCTGC (SEQ ID NO: 1173) | AGAAAUCCGUCUUUCAUUGACGGCAUGUCACACAACAGCCUGC (SEQ ID NO: 1188) |
T14 | 外顯子3 | CTTT | CTCACCGATATTGGCATAAG (SEQ ID NO: 1175) | AGAAAUCCGUCUUUCAUUGACGGCUCACCGAUAUUGGCAUAAG (SEQ ID NO: 1190) |
在培育期間,自燒瓶移出T細胞且計數。1e6個細胞用CD25螢光抗體及活/死染料染色以分別評定活化效率及存活力。對於電穿孔而言,細胞用PBS洗滌一次且以10,873個細胞/µL之濃度再懸浮於P3緩衝液+補充劑(P3 PRIMARY CELL 4D-NUCLEOFECTOR
TMX套組;Lonza #V4XP-3032)中。以2e5個細胞/反應,將再懸浮細胞分配至Lonza 16孔NUCLEOCUVETTE®帶中。以10 µM (Cas12i2)之最終濃度將複合的Cas12i2 RNP添加至各反應中。各電穿孔反應之最終體積為20 µL。
該等帶使用電穿孔裝置(程式EO-115,Lonza 4D-NUCLEOFECTOR
TM)電穿孔。緊接在電穿孔之後,將40 µL預溫熱IMMUNOCULT
TM-XF (Stemcell Technologies) + IL-2 + L-麩醯胺酸添加至各孔中且藉由移液輕輕地混合。對於各技術重複培養盤而言,將15 µL (50,000個細胞)之稀釋的核轉染細胞塗鋪至具有含有IMMUNOCULT
TM-XF (Stemcell Technologies) + IL-2 + L-麩醯胺酸之孔的預溫熱96孔盤中。在37℃與5% CO
2下培育編輯培養盤7天,其中在3天時進行培養基更換。
在3天(在培養基更換期間)或7天之後,將各孔轉移至96孔TWIN.TEC® PCR培養盤(Eppendorf)且離心(pelleted)。拂去培養基且將細胞再懸浮於20 µL DNA萃取緩衝液(QUICKEXTRACT
TM;Lucigen)中。接著,在PCR機器中在65℃下15 min、68℃下15 min、98℃下10 min循環樣品。接著將樣品冷凍在-20℃下。
如實例1中所描述製備及分析用於NGS之樣品。如
圖 2中所示,所測試之RNA引導中之各者在T細胞中誘導CIITA目標序列中之***或缺失。因此,RNA引導及作為RNP遞送之SEQ ID NO: 1128的變異Cas12i2能夠在T細胞中編輯外顯子1、外顯子2及外顯子3中之CIITA目標。
表8. Cas12i及目標序列
編碼Cas12i2之核苷酸序列- SEQ ID NO: 1103 | atgagcagcg cgatcaaaag ctacaagagc gttctgcgtc cgaacgagcg taagaaccaa 60 ctgctgaaaa gcaccattca gtgcctggaa gacggtagcg cgttcttttt caagatgctg 120 caaggcctgt ttggtggcat caccccggag attgttcgtt tcagcaccga acaggagaaa 180 cagcaacagg atatcgcgct gtggtgcgcg gttaactggt tccgtccggt gagccaagac 240 agcctgaccc acaccattgc gagcgataac ctggtggaga agtttgagga atactatggt 300 ggcaccgcga gcgacgcgat caaacagtac ttcagcgcga gcattggcga aagctactat 360 tggaacgact gccgtcaaca gtactatgat ctgtgccgtg agctgggtgt tgaggtgagc 420 gacctgaccc atgatctgga gatcctgtgc cgtgaaaagt gcctggcggt tgcgaccgag 480 agcaaccaga acaacagcat cattagcgtt ctgtttggca ccggcgaaaa agaggaccgt 540 agcgtgaaac tgcgtatcac caagaaaatt ctggaggcga tcagcaacct gaaagaaatc 600 ccgaagaacg ttgcgccgat tcaagagatc attctgaacg tggcgaaagc gaccaaggaa 660 accttccgtc aggtgtatgc gggtaacctg ggtgcgccga gcaccctgga gaaatttatc 720 gcgaaggacg gccaaaaaga gttcgatctg aagaaactgc agaccgacct gaagaaagtt 780 attcgtggta aaagcaagga gcgtgattgg tgctgccagg aagagctgcg tagctacgtg 840 gagcaaaaca ccatccagta tgacctgtgg gcgtggggcg aaatgttcaa caaagcgcac 900 accgcgctga aaatcaagag cacccgtaac tacaactttg cgaagcaacg tctggaacag 960 ttcaaagaga ttcagagcct gaacaacctg ctggttgtga agaagctgaa cgactttttc 1020 gatagcgaat ttttcagcgg cgaggaaacc tacaccatct gcgttcacca tctgggtggc 1080 aaggacctga gcaaactgta taaggcgtgg gaggatgatc cggcggaccc ggaaaacgcg 1140 attgtggttc tgtgcgacga tctgaaaaac aactttaaga aagagccgat ccgtaacatt 1200 ctgcgttaca tcttcaccat tcgtcaagaa tgcagcgcgc aggacatcct ggcggcggcg 1260 aagtacaacc aacagctgga tcgttataaa agccaaaagg cgaacccgag cgttctgggt 1320 aaccagggct ttacctggac caacgcggtg atcctgccgg agaaggcgca gcgtaacgac 1380 cgtccgaaca gcctggatct gcgtatttgg ctgtacctga aactgcgtca cccggacggt 1440 cgttggaaga aacaccatat cccgttctac gatacccgtt tcttccaaga aatttatgcg 1500 gcgggcaaca gcccggttga cacctgccag tttcgtaccc cgcgtttcgg ttatcacctg 1560 ccgaaactga ccgatcagac cgcgatccgt gttaacaaga aacatgtgaa agcggcgaag 1620 accgaggcgc gtattcgtct ggcgatccaa cagggcaccc tgccggtgag caacctgaag 1680 atcaccgaaa ttagcgcgac catcaacagc aaaggtcaag tgcgtattcc ggttaagttt 1740 gacgtgggtc gtcaaaaagg caccctgcag atcggtgacc gtttctgcgg ctacgatcaa 1800 aaccagaccg cgagccacgc gtatagcctg tgggaagtgg ttaaagaggg tcaataccat 1860 aaagagctgg gctgctttgt tcgtttcatc agcagcggtg acatcgtgag cattaccgag 1920 aaccgtggca accaatttga tcagctgagc tatgaaggtc tggcgtaccc gcaatatgcg 1980 gactggcgta agaaagcgag caagttcgtg agcctgtggc agatcaccaa gaaaaacaag 2040 aaaaaggaaa tcgtgaccgt tgaagcgaaa gagaagtttg acgcgatctg caagtaccag 2100 ccgcgtctgt ataaattcaa caaggagtac gcgtatctgc tgcgtgatat tgttcgtggc 2160 aaaagcctgg tggaactgca acagattcgt caagagatct ttcgtttcat tgaacaggac 2220 tgcggtgtta cccgtctggg cagcctgagc ctgagcaccc tggaaaccgt gaaagcggtt 2280 aagggtatca tttacagcta ttttagcacc gcgctgaacg cgagcaagaa caacccgatc 2340 agcgacgaac agcgtaaaga gtttgatccg gaactgttcg cgctgctgga aaagctggag 2400 ctgattcgta cccgtaaaaa gaaacaaaaa gtggaacgta tcgcgaacag cctgattcag 2460 acctgcctgg agaacaacat caagttcatt cgtggtgaag gcgacctgag caccaccaac 2520 aacgcgacca agaaaaaggc gaacagccgt agcatggatt ggttggcgcg tggtgttttt 2580 aacaaaatcc gtcaactggc gccgatgcac aacattaccc tgttcggttg cggcagcctg 2640 tacaccagcc accaggaccc gctggtgcat cgtaacccgg ataaagcgat gaagtgccgt 2700 tgggcggcga tcccggttaa ggacattggc gattgggtgc tgcgtaagct gagccaaaac 2760 ctgcgtgcga aaaacatcgg caccggcgag tactatcacc aaggtgttaa agagttcctg 2820 agccattatg aactgcagga cctggaggaa gagctgctga agtggcgtag cgatcgtaaa 2880 agcaacattc cgtgctgggt gctgcagaac cgtctggcgg agaagctggg caacaaagaa 2940 gcggtggttt acatcccggt tcgtggtggc cgtatttatt ttgcgaccca caaggtggcg 3000 accggtgcgg tgagcatcgt tttcgaccaa aaacaagtgt gggtttgcaa cgcggatcat 3060 gttgcggcgg cgaacatcgc gctgaccgtg aagggtattg gcgaacaaag cagcgacgaa 3120 gagaacccgg atggtagccg tatcaaactg cagctgacca gc 3162 |
Cas12i2胺基酸序列- SEQ ID NO: 1104 | MSSAIKSYKSVLRPNERKNQLLKSTIQCLEDGSAFFFKMLQGLFGGITPEIVRFSTEQEK QQQDIALWCAVNWFRPVSQDSLTHTIASDNLVEKFEEYYGGTASDAIKQYFSASIGESYY WNDCRQQYYDLCRELGVEVSDLTHDLEILCREKCLAVATESNQNNSIISVLFGTGEKEDR SVKLRITKKILEAISNLKEIPKNVAPIQEIILNVAKATKETFRQVYAGNLGAPSTLEKFI AKDGQKEFDLKKLQTDLKKVIRGKSKERDWCCQEELRSYVEQNTIQYDLWAWGEMFNKAH TALKIKSTRNYNFAKQRLEQFKEIQSLNNLLVVKKLNDFFDSEFFSGEETYTICVHHLGG KDLSKLYKAWEDDPADPENAIVVLCDDLKNNFKKEPIRNILRYIFTIRQECSAQDILAAA KYNQQLDRYKSQKANPSVLGNQGFTWTNAVILPEKAQRNDRPNSLDLRIWLYLKLRHPDG RWKKHHIPFYDTRFFQEIYAAGNSPVDTCQFRTPRFGYHLPKLTDQTAIRVNKKHVKAAK TEARIRLAIQQGTLPVSNLKITEISATINSKGQVRIPVKFDVGRQKGTLQIGDRFCGYDQ NQTASHAYSLWEVVKEGQYHKELGCFVRFISSGDIVSITENRGNQFDQLSYEGLAYPQYA DWRKKASKFVSLWQITKKNKKKEIVTVEAKEKFDAICKYQPRLYKFNKEYAYLLRDIVRG KSLVELQQIRQEIFRFIEQDCGVTRLGSLSLSTLETVKAVKGIIYSYFSTALNASKNNPI SDEQRKEFDPELFALLEKLELIRTRKKKQKVERIANSLIQTCLENNIKFIRGEGDLSTTN NATKKKANSRSMDWLARGVFNKIRQLAPMHNITLFGCGSLYTSHQDPLVHRNPDKAMKCR WAAIPVKDIGDWVLRKLSQNLRAKNIGTGEYYHQGVKEFLSHYELQDLEEELLKWRSDRK SNIPCWVLQNRLAEKLGNKEAVVYIPVRGGRIYFATHKVATGAVSIVFDQKQVWVCNADH VAAANIALTVKGIGEQSSDEENPDGSRIKLQLTS |
CIITA -外顯子1 - SEQ ID NO: 1105 | TTCATGTTTTGGATGCTGCATGCTGGGTGAGCGGAGATTCCAGGCACTGGCCAGGGCAGCTGCCCTGACTCCAAGGGCTGCCATGAACAACTTCCAGGCCATCCTGACTCAGGTGAGAATGCTGCTCTCCAGCCATCAGCCCAGCCTGGTGCAGGCCCTCTTGGACAACCTGCTGAAGGAGGACCTCCTCTCCAGGGAATACCACTGCACTCTGCTCCATGAGCCTGATAGTGAGGCTCTGGCCAGGAAGATCTCTTTGACCCTACTAGAGAAAGGAGACCTGGATTTGGCCCTCCTGGGGTGGGCCCGGAGTGGGCTGCAGCCCCCAGCAGCCGAGAGGGGCCCCGGCCACAGTGACCATGGTGGTAAGTTGGCATCACTTTTAATCAAGGAGAAATGACAGACTGTAGACAGC |
CIITA -外顯子2 - SEQ ID NO: 1106 | GAGGGGCTGCCAGACTCCGGGAGCTGCTGCCTGGCTGGGATTCCTACACAATGCGTTGCCTGGCTCCACGCCCTGCTGGGTCCTACCTGTCAGAGCCCCAAGGTAAAAAGGCCGGGAAAGCATCTTAATTTAGCGTGCAGTCTCAGCTGGTC |
CIITA -外顯子3 - SEQ ID NO: 1107 | CAGAAAGAAAGTGAAAGGGAAAAAGAACTGCGGGGAGGCGGGGAGGTAGGATGACCAGCGGACGAGCTGCCACAGACTTGCCGCGGCCCCAGAGCTGGCGGGAGGGAGAGGCCACCAGCAGCGCGCGCGGGAGCCCGGGGAACAGCGGTAGGTGACCAAAGTCTCCTCTGTAACCCCTAAGGTCGGGCTGAGAATCG |
CIITA -外顯子4 - SEQ ID NO: 1108 | GCCTCTTTCCAACACCCTGTGAGGTGACTGAGCATTGTCTTCCCTCCCAGGCAGCTCACAGTGTGCCACCATGGAGTTGGGGCCCCTAGAAGGTGGCTACCTGGAGCTTCTTAACAGCGATGCTGACCCCCTGTGCCTCTACCACTTCTATGACCAGATGGACCTGGCTGGAGAAGAAGAGATTGAGCTCTACTCAGGTGGGCCCTCCTCCCTCTGGTCTCTTCCGGTATCCCCCACCCCTCAGCTTGCTGTAGAGACGGCAATCAGGGGAAATTCTGGTCCCTGCCCTCCCGTCAGCACCACGGACAGCTCCCACGTCTGTGGGACGCTCTCTGCAGATGGGGATGATCTCCCAGCCCTGCCCCGCCTCTCCCTCGTTCCCCACCAGCCCTCTTTCCAGAAATTTCCTTCTTCATCCAAGGGACTTTTCCTCCCAGAACCCGACACAGACACCATCAACTGCGACCAGTTCAGCAGGCTGTTGTGTGACATGGAAGGTGATGAAGAGACCAGGGAGGCTTATGCCAATATCGGTGAGGAAGCACCTGAGCCCAGAAAAGGACAATCAAGGGCAAGAGTTCTT |
CIITA -外顯子5 - SEQ ID NO: 1109 | GCCTTCAGTTAGACCTTGTTGATTGACTGCGCTTTTCCTTGTCTGGGCAGCGGAACTGGACCAGTATGTCTTCCAGGACTCCCAGCTGGAGGGCCTGAGCAAGGACATTTTCAGTAAGTTTGTGGTGGGTGGGGAGGTCTTGGCTCAGCCTGCATTTCCTGCC |
CIITA -外顯子6 - SEQ ID NO: 1110 | ACCTTGGGCTTTCATTGATTGTGTGAGTTGGTCTCTGGTTTTTCTCAAAGTAGAGCACATAGGACCAGATGAAGTGATCGGTGAGAGTATGGAGATGCCAGCAGAAGTTGGGCAGAAAAGTCAGAAAAGACGTGAGTGAGCCCCTCCCTGATCCAACCTAGCCTTGCTTGAGACCTGGCCT |
CIITA -外顯子7 - SEQ ID NO: 1111 | GCTTGGGACATCCTCTCCCTGGGGCAGCTGATCACATGTTTTCTCTGCAGCCTTCCCAGAGGAGCTTCCGGCAGACCTGAAGCACTGGAAGCCAGGTGTGCAGGGCAGGTGGGCTGGGGTTGGGAAGGGTGGATGCCTTGGGGAG |
CIITA -外顯子8 - SEQ ID NO: 1112 | GGAAGGCCCCTCCAAGCACCCAGTCTCTAACACAGCCCACTTCCTCACAGCTGAGCCCCCCACTGTGGTGACTGGCAGTCTCCTAGTGGGACCAGTGAGCGACTGCTCCACCCTGCCCTGCCTGCCACTGCCTGCGCTGTTCAACCAGGAGCCAGCCTCCGGCCAGATGCGCCTGGAGAAAACCGACCAGATTCCCAGTATGTTAGGGGGCTTGGAGAGAGTGGGCTTTCTCCCTCTTGGGAGGTGG |
CIITA -外顯子9 - SEQ ID NO: 1113 | AAACACAGGTGCTATGCAAGATCCCACCTCACTGCCTTTGTCTCTTGCAGTGCCTTTCTCCAGTTCCTCGTTGAGCTGCCTGAATCTCCCTGAGGGACCCATCCAGTTTGTCCCCACCATCTCCACTCTGCCCCATGGGCTCTGGCAAATCTCTGAGGCTGGAACAGGGGTCTCCAGTATATTCATCTACCATGGTGAGTGCGGGGCCTGGCTCCCCGACCACCTCTCCCTCCTACCTGACTGC |
CIITA -外顯子10 - SEQ ID NO: 1114 | CTGGAATCAATACCTGGTTATTCTCACACCACTCTCCACCCCCAATGTAGGTGAGGTGCCCCAGGCCAGCCAAGTACCCCCTCCCAGTGGATTCACTGTCCACGGCCTCCCAACATCTCCAGACCGGCCAGGCTCCACCAGCCCCTTCGCTCCATCAGCCACTGACCTGCCCAGCATGCCTGAACCTGCCCTGACCTCCCGAGCAAACATGACAGGTAAGGACCCTTAGGGCCTGTGAGAGGTACTAGAAGCAGGATCGAGGCCC |
CIITA -外顯子11 - SEQ ID NO: 1115 | CCCAGGGGTAACCCTCACCCTAAATCTGGCACCTGCTTCTCCATCTCCAGAGCACAAGACGTCCCCCACCCAATGCCCGGCAGCTGGAGAGGTCTCCAACAAGCTTCCAAAATGGCCTGGTGAGTGATGCGGGATCTCTCTGCCCTGGGTGGTGGAGATGGAAGCCCAT |
CIITA -外顯子12 - SEQ ID NO: 1116 | GGCCCTGCCTCTCACATACCCCCACCCTGACACGCCCCTGGCCTTTGCAGAGCCGGTGGAGCAGTTCTACCGCTCACTGCAGGACACGTATGGTGCCGAGCCCGCAGGCCCGGATGGCATCCTAGTGGAGGTGGATCTGGTGCAGGCCAGGCTGGAGAGGAGCAGCAGCAAGAGCCTGGAGCGGGAACTGGCCACCCCGGACTGGGCAGAACGGCAGCTGGCCCAAGGAGGCCTGGCTGAGGTGCTGTTGGCTGCCAAGGAGCACCGGCGGCCGCGTGAGACACGAGTGATTGCTGTGCTGGGCAAAGCTGGTCAGGGCAAGAGCTATTGGGCTGGGGCAGTGAGCCGGGCCTGGGCTTGTGGCCGGCTTCCCCAGTACGACTTTGTCTTCTCTGTCCCCTGCCATTGCTTGAACCGTCCGGGGGATGCCTATGGCCTGCAGGATCTGCTCTTCTCCCTGGGCCCACAGCCACTCGTGGCGGCCGATGAGGTTTTCAGCCACATCTTGAAGAGACCTGACCGCGTTCTGCTCATCCTAGACGGCTTCGAGGAGCTGGAAGCGCAAGATGGCTTCCTGCACAGCACGTGCGGACCGGCACCGGCGGAGCCCTGCTCCCTCCGGGGGCTGCTGGCCGGCCTTTTCCAGAAGAAGCTGCTCCGAGGTTGCACCCTCCTCCTCACAGCCCGGCCCCGGGGCCGCCTGGTCCAGAGCCTGAGCAAGGCCGACGCCCTATTTGAGCTGTCCGGCTTCTCCATGGAGCAGGCCCAGGCATACGTGATGCGCTACTTTGAGAGCTCAGGGATGACAGAGCACCAAGACAGAGCCCTGACGCTCCTCCGGGACCGGCCACTTCTTCTCAGTCACAGCCACAGCCCTACTTTGTGCCGGGCAGTGTGCCAGCTCTCAGAGGCCCTGCTGGAGCTTGGGGAGGACGCCAAGCTGCCCTCCACGCTCACGGGACTCTATGTCGGCCTGCTGGGCCGTGCAGCCCTCGACAGCCCCCCCGGGGCCCTGGCAGAGCTGGCCAAGCTGGCCTGGGAGCTGGGCCGCAGACATCAAAGTACCCTACAGGAGGACCAGTTCCCATCCGCAGACGTGAGGACCTGGGCGATGGCCAAAGGCTTAGTCCAACACCCACCGCGGGCCGCAGAGTCCGAGCTGGCCTTCCCCAGCTTCCTCCTGCAATGCTTCCTGGGGGCCCTGTGGCTGGCTCTGAGTGGCGAAATCAAGGACAAGGAGCTCCCGCAGTACCTAGCATTGACCCCAAGGAAGAAGAGGCCCTATGACAACTGGCTGGAGGGCGTGCCACGCTTTCTGGCTGGGCTGATCTTCCAGCCTCCCGCCCGCTGCCTGGGAGCCCTACTCGGGCCATCGGCGGCTGCCTCGGTGGACAGGAAGCAGAAGGTGCTTGCGAGGTACCTGAAGCGGCTGCAGCCGGGGACACTGCGGGCGCGGCAGCTGCTGGAGCTGCTGCACTGCGCCCACGAGGCCGAGGAGGCTGGAATTTGGCAGCACGTGGTACAGGAGCTCCCCGGCCGCCTCTCTTTTCTGGGCACCCGCCTCACGCCTCCTGATGCACATGTACTGGGCAAGGCCTTGGAGGCGGCGGGCCAAGACTTCTCCCTGGACCTCCGCAGCACTGGCATTTGCCCCTCTGGATTGGGGAGCCTCGTGGGACTCAGCTGTGTCACCCGTTTCAGGTGGGGTGAGGGGCTTGGGGAAGAGACATCCTTGTGTTGGGCATTAACTG |
CIITA -外顯子13 - SEQ ID NO: 1117 | AGTATTTTAATAGGTAGGAGGACCCTTCATGGAGCTGCCCTTCCATTAAGGTCTAGCCTGGTCACCGTGCCTGGGTCTGAGGCCCTCCCTCCACAGGGCTGCCTTGAGCGACACGGTGGCGCTGTGGGAGTCCCTGCAGCAGCATGGGGAGACCAAGCTACTTCAGGCAGCAGAGGAGAAGTTCACCATCGAGCCTTTCAAAGCCAAGTCCCTGAAGGATGTGGAAGACCTGGGAAAGCTTGTGCAGACTCAGAGGTGAGAGGAGAGGCGGATGGGAGGTGGTTCACGCCATGCAGGTTGAGGAC |
CIITA -外顯子14 - SEQ ID NO: 1118 | GCTCAGTGACAGCAGTGCCTGCTCCCCCTAACATTGCCTGTTCTCTCCAGGACGAGAAGTTCCTCGGAAGACACAGCTGGGGAGCTCCCTGCTGTTCGGGACCTAAAGAAACTGGAGTTTGCGTAAGCAAAGGGGTGGATTGTCTTGTGGGTCTGCGCAAGGTTTCCCCTGC |
CIITA -外顯子15 - SEQ ID NO: 1119 | AGGGGCTGTGACTGTGACTGGAGGTCTTACCCTTGCTCTTTGCCTCCTAGGCTGGGCCCTGTCTCAGGCCCCCAGGCTTTCCCCAAACTGGTGCGGATCCTCACGGCCTTTTCCTCCCTGCAGCATCTGGAGTGAGTATAGACTCTGGGACCCCTTCCTCTCAACATCTGGGTGCAGTGCT |
CIITA -外顯子16 - SEQ ID NO: 1120 | AGATGGCCCCAGGACGCTAGCTGATGGCCCCCATCTGATTCCACCTGCAGCCTGGATGCGCTGAGTGAGAACAAGATCGGGGACGAGGGTGTCTCGCAGCTCTCAGCCACCTTCCCCCAGCTGAAGTCCTTGGAAACCCTCAAGTGAGTGAGCTGGGCCTGCCCTTCCTGCTGAATCGGGCCCCCAAAGTCCG |
CIITA -外顯子17 - SEQ ID NO: 1121 | CCCAAAGTCCGGCTGACTTTTTCAAAATTAATTTAAATTTGTTTTTTTAGACAAGGGCTCGCTGTGTCACCCAGGCTAGAATATAGTGCTATGATCATACCTCTGCAGCCTTGAACTCCTGGCCTCAAGGAATCTCCTCACCTCCGCTTCCCAAAGTGCTGGGA |
CIITA -外顯子18 - SEQ ID NO: 1122 | GAGGCATGCAAGTTTGGTCCTGAGCCCTCCCCCTCACTGTGTCCCCGCAGTCTGTCCCAGAACAACATCACTGACCTGGGTGCCTACAAACTCGCCGAGGCCCTGCCTTCGCTCGCTGCATCCCTGCTCAGGCTAAGGTGAGTGGGGCCCCGGATACCGGTCAGGTGCTGAGCTGGGGGGCTGCAGA |
CIITA -外顯子19 - SEQ ID NO: 1123 | TCACAATGCCAGGTTCTGTTATGCAATAAATATTGCTCCTTTTCCCCCAGGGATGGCGGGACCAGGCTTTTTCCGGAACCTAGGGGTGGTGGCTTCTGGAAGGCTAACCACGTACGTCAGCTTTTGCCGGCCTTGTCACTTACATGCCGGTCAGTGTTTCACTGCCACCTTCTGGTAGGCCTTGGCATAGCACCTCTTGCTTTTGAGTGACTTCCATCCAGGCCCTGGTGTGGTCCCAGAGGTAATGAGCGGACTGAGCT |
CIITA -外顯子20 - SEQ ID NO: 1124 | TGACCATGCACAGGCCTCCAATCCCTCCCCCTGGCCTCTGTTTCCGACAGCTTGTACAATAACTGCATCTGCGACGTGGGAGCCGAGAGCTTGGCTCGTGTGCTTCCGGACATGGTGTCCCTCCGGGTGATGGAGTGAGTGTGGGAGTCTGGGCGGTGGGTGGCTCAGCCCGGGGTGGGAGACA |
CIITA -外顯子21 - SEQ ID NO: 1125 | GAGCTGGGGAGTCCCAAGGGCCAGGCCCCAAGGTGAGTTTCTCTTGCCAGCGTCCAGTACAACAAGTTCACGGCTGCCGGGGCCCAGCAGCTCGCTGCCAGCCTTCGGAGGTGTCCTCATGTGGAGACGCTGGCGTAAGTCCAGGCAACCCTGGTGGGTGGAGAACAACTCACTCCCCAGGCGT |
CIITA -外顯子22 - SEQ ID NO: 1126 | GGCCGCCCTCTCTCCTCTAACCTGGCTCTGAGTCCCATCCCCCCTTGCAGGATGTGGACGCCCACCATCCCATTCAGTGTCCAGGAACACCTGCAACAACAGGATTCACGGATCAGCCTGAGATGATCCCAGCTGTGCTCTGGACAGGGTAACCAGGGTGGGCTTGGGAGGGGAGA |
SEQ ID NO: 1127 (PCT/US2021/025257之SEQ ID NO: 3之變異Cas12i2) | MSSAIKSYKS VLRPNERKNQ LLKSTIQCLE DGSAFFFKML QGLFGGITPE IVRFSTEQEK QQQDIALWCA VNWFRPVSQD SLTHTIASDN LVEKFEEYYG GTASDAIKQY FSASIGESYY WNDCRQQYYD LCRELGVEVS DLTHDLEILC REKCLAVATE SNQNNSIISV LFGTGEKEDR SVKLRITKKI LEAISNLKEI PKNVAPIQEI ILNVAKATKE TFRQVYAGNL GAPSTLEKFI AKDGQKEFDL KKLQTDLKKV IRGKSKERDW CCQEELRSYV EQNTIQYDLW AWGEMFNKAH TALKIKSTRN YNFAKQRLEQ FKEIQSLNNL LVVKKLNDFF DSEFFSGEET YTICVHHLGG KDLSKLYKAW EDDPADPENA IVVLCDDLKN NFKKEPIRNI LRYIFTIRQE CSAQDILAAA KYNQQLDRYK SQKANPSVLG NQGFTWTNAV ILPEKAQRND RPNSLDLRIW LYLKLRHPDG RWKKHHIPFY DTRFFQEIYA AGNSPVDTCQ FRTPRFGYHL PKLTDQTAIR VNKKHVKAAK TEARIRLAIQ QGTLPVSNLK ITEISATINS KGQVRIPVKF RVGRQKGTLQ IGDRFCGYDQ NQTASHAYSL WEVVKEGQYH KELGCFVRFI SSGDIVSITE NRGNQFDQLS YEGLAYPQYA DWRKKASKFV SLWQITKKNK KKEIVTVEAK EKFDAICKYQ PRLYKFNKEY AYLLRDIVRG KSLVELQQIR QEIFRFIEQD CGVTRLGSLS LSTLETVKAV KGIIYSYFST ALNASKNNPI SDEQRKEFDP ELFALLEKLE LIRTRKKKQK VERIANSLIQ TCLENNIKFI RGEGDLSTTN NATKKKANSR SMDWLARGVF NKIRQLAPMH NITLFGCGSL YTSHQDPLVH RNPDKAMKCR WAAIPVKDIG RWVLRKLSQN LRAKNRGTGE YYHQGVKEFL SHYELQDLEE ELLKWRSDRK SNIPCWVLQN RLAEKLGNKE AVVYIPVRGG RIYFATHKVA TGAVSIVFDQ KQVWVCNADH VAAANIALTG KGIGEQSSDE ENPDGSRIKL QLTS |
SEQ ID NO: 1128 (PCT/US2021/025257之SEQ ID NO: 4之變異Cas12i2) | MSSAIKSYKS VLRPNERKNQ LLKSTIQCLE DGSAFFFKML QGLFGGITPE IVRFSTEQEK QQQDIALWCA VNWFRPVSQD SLTHTIASDN LVEKFEEYYG GTASDAIKQY FSASIGESYY WNDCRQQYYD LCRELGVEVS DLTHDLEILC REKCLAVATE SNQNNSIISV LFGTGEKEDR SVKLRITKKI LEAISNLKEI PKNVAPIQEI ILNVAKATKE TFRQVYAGNL GAPSTLEKFI AKDGQKEFDL KKLQTDLKKV IRGKSKERDW CCQEELRSYV EQNTIQYDLW AWGEMFNKAH TALKIKSTRN YNFAKQRLEQ FKEIQSLNNL LVVKKLNDFF DSEFFSGEET YTICVHHLGG KDLSKLYKAW EDDPADPENA IVVLCDDLKN NFKKEPIRNI LRYIFTIRQE CSAQDILAAA KYNQQLDRYK SQKANPSVLG NQGFTWTNAV ILPEKAQRND RPNSLDLRIW LYLKLRHPDG RWKKHHIPFY DTRFFQEIYA AGNSPVDTCQ FRTPRFGYHL PKLTDQTAIR VNKKHVKAAK TEARIRLAIQ QGTLPVSNLK ITEISATINS KGQVRIPVKF RVGRQKGTLQ IGDRFCGYDQ NQTASHAYSL WEVVKEGQYH KELGCFVRFI SSGDIVSITE NRGNQFDQLS YEGLAYPQYA DWRKKASKFV SLWQITKKNK KKEIVTVEAK EKFDAICKYQ PRLYKFNKEY AYLLRDIVRG KSLVELQQIR QEIFRFIEQD CGVTRLGSLS LSTLETVKAV KGIIYSYFST ALNASKNNPI SDEQRKEFDP ELFALLEKLE LIRTRKKKQK VERIANSLIQ TCLENNIKFI RGEGDLSTTN NATKKKANSR SMDWLARGVF NKIRQLAPMH NITLFGCGSL YTSHQDPLVH RNPDKAMKCR WAAIPVKDIG DWVLRKLSQN LRAKNRGTGE YYHQGVKEFL SHYELQDLEE ELLKWRSDRK SNIPCWVLQN RLAEKLGNKE AVVYIPVRGG RIYFATHKVA TGAVSIVFDQ KQVWVCNADH VAAANIALTG KGIGEQSSDE ENPDGSRIKL QLTS |
SEQ ID NO: 1129 ( PCT/US2021/025257之SEQ ID NO: 5之變異Cas12i2) | MSSAIKSYKS VLRPNERKNQ LLKSTIQCLE DGSAFFFKML QGLFGGITPE IVRFSTEQEK QQQDIALWCA VNWFRPVSQD SLTHTIASDN LVEKFEEYYG GTASDAIKQY FSASIGESYY WNDCRQQYYD LCRELGVEVS DLTHDLEILC REKCLAVATE SNQNNSIISV LFGTGEKEDR SVKLRITKKI LEAISNLKEI PKNVAPIQEI ILNVAKATKE TFRQVYAGNL GAPSTLEKFI AKDGQKEFDL KKLQTDLKKV IRGKSKERDW CCQEELRSYV EQNTIQYDLW AWGEMFNKAH TALKIKSTRN YNFAKQRLEQ FKEIQSLNNL LVVKKLNDFF DSEFFSGEET YTICVHHLGG KDLSKLYKAW EDDPADPENA IVVLCDDLKN NFKKEPIRNI LRYIFTIRQE CSAQDILAAA KYNQQLDRYK SQKANPSVLG NQGFTWTNAV ILPEKAQRND RPNSLDLRIW LYLKLRHPDG RWKKHHIPFY DTRFFQEIYA AGNSPVDTCQ FRTPRFGYHL PKLTDQTAIR VNKKHVKAAK TEARIRLAIQ QGTLPVSNLK ITEISATINS KGQVRIPVKF RVGRQKGTLQ IGDRFCGYDQ NQTASHAYSL WEVVKEGQYH KELGCFVRFI SSGDIVSITE NRGNQFDQLS YEGLAYPQYA DWRKKASKFV SLWQITKKNK KKEIVTVEAK EKFDAICKYQ PRLYKFNKEY AYLLRDIVRG KSLVELQQIR QEIFRFIEQD CGVTRLGSLS LSTLETVKAV KGIIYSYFST ALNASKNNPI SDEQRKEFDP ELFALLEKLE LIRTRKKKQK VERIANSLIQ TCLENNIKFI RGEGDLSTTN NATKKKANSR SMDWLARGVF NKIRQLAPMH NITLFGCGSL YTSHQDPLVH RNPDKAMKCR WAAIPVKDIG DWVLRKLSQN LRAKNRGTGE YYHQGVKEFL SHYELQDLEE ELLKWRSDRK SNIPCWVLQN RLAEKLGNKE AVVYIPVRGG RIYFATHKVA TGAVSIVFDQ KQVWVCNADH VAAANIALTG KGIGEQSSDE ENPDGGRIKL QLTS |
SEQ ID NO: 1130 ( PCT/US2021/025257之SEQ ID NO: 495之變異Cas12i2) | MSSAIKSYKS VLRPNERKNQ LLKSTIQCLE DGSAFFFKML QGLFGGITPE IVRFSTEQEK QQQDIALWCA VNWFRPVSQD SLTHTIASDN LVEKFEEYYG GTASDAIKQY FSASIGESYY WNDCRQQYYD LCRELGVEVS DLTHDLEILC REKCLAVATE SNQNNSIISV LFGTGEKEDR SVKLRITKKI LEAISNLKEI PKNVAPIQEI ILNVAKATKE TFRQVYAGNL GAPSTLEKFI AKDGQKEFDL KKLQTDLKKV IRGKSKERDW CCQEELRSYV EQNTIQYDLW AWGEMFNKAH TALKIKSTRN YNFAKQRLEQ FKEIQSLNNL LVVKKLNDFF DSEFFSGEET YTICVHHLGG KDLSKLYKAW EDDPADPENA IVVLCDDLKN NFKKEPIRNI LRYIFTIRQE CSAQDILAAA KYNQQLDRYK SQKANPSVLG NQGFTWTNAV ILPEKAQRND RPNSLDLRIW LYLKLRHPDG RWKKHHIPFY DTRFFQEIYA AGNSPVDTCQ FRTPRFGYHL PKLTDQTAIR VNKKHVKAAK TEARIRLAIQ QGTLPVSNLK ITEISATINS KGQVRIPVKF RVGRQKGTLQ IGDRFCGYDQ NQTASHAYSL WEVVKEGQYH KELRCRVRFI SSGDIVSITE NRGNQFDQLS YEGLAYPQYA DWRKKASKFV SLWQITKKNK KKEIVTVEAK EKFDAICKYQ PRLYKFNKEY AYLLRDIVRG KSLVELQQIR QEIFRFIEQD CGVTRLGSLS LSTLETVKAV KGIIYSYFST ALNASKNNPI SDEQRKEFDP ELFALLEKLE LIRTRKKKQK VERIANSLIQ TCLENNIKFI RGEGDLSTTN NATKKKANSR SMDWLARGVF NKIRQLAPMH NITLFGCGSL YTSHQDPLVH RNPDKAMKCR WAAIPVKDIG DWVLRKLSQN LRAKNRGTGE YYHQGVKEFL SHYELQDLEE ELLKWRSDRK SNIPCWVLQN RLAEKLGNKE AVVYIPVRGG RIYFATHKVA TGAVSIVFDQ KQVWVCNADH VAAANIALTG KGIGRQSSDE ENPDGGRIKL QLTS |
SEQ ID NO: 1131 ( PCT/US2021/025257之SEQ ID NO: 496之變異Cas12i2) | MSSAIKSYKS VLRPNERKNQ LLKSTIQCLE DGSAFFFKML QGLFGGITPE IVRFSTEQEK QQQDIALWCA VNWFRPVSQD SLTHTIASDN LVEKFEEYYG GTASDAIKQY FSASIGESYY WNDCRQQYYD LCRELGVEVS DLTHDLEILC REKCLAVATE SNQNNSIISV LFGTGEKEDR SVKLRITKKI LEAISNLKEI PKNVAPIQEI ILNVAKATKE TFRQVYAGNL GAPSTLEKFI AKDGQKEFDL KKLQTDLKKV IRGKSKERDW CCQEELRSYV EQNTIQYDLW AWGEMFNKAH TALKIKSTRN YNFAKQRLEQ FKEIQSLNNL LVVKKLNDFF DSEFFSGEET YTICVHHLGG KDLSKLYKAW EDDPADPENA IVVLCDDLKN NFKKEPIRNI LRYIFTIRQE CSAQDILAAA KYNQQLDRYK SQKANPSVLG NQGFTWTNAV ILPEKAQRND RPNSLDLRIW LYLKLRHPDG RWKKHHIPFY DTRFFQEIYA AGNSPVDTCQ FRTPRFGYHL PKLTDQTAIR VNKKHVKAAK TEARIRLAIQ QGTLPVSNLK ITEISATINS KGQVRIPVKF RVGRQKGTLQ IGDRFCGYDQ NQTASHAYSL WEVVKEGQYH KELRCRVRFI SSGDIVSITE NRGNQFDQLS YEGLAYPQYA DWRKKASKFV SLWQITKKNK KKEIVTVEAK EKFDAICKYQ PRLYKFNKEY AYLLRDIVRG KSLVELQQIR QEIFRFIEQD CGVTRLGSLS LSTLETVKAV KGIIYSYFST ALNASKNNPI SDEQRKEFDP ELFALLEKLE LIRTRKKKQK VERIANSLIQ TCLENNIKFI RGEGDLSTTN NATKKKANSR SMDWLARGVF NKIRQLATMH NITLFGCGSL YTSHQDPLVH RNPDKAMKCR WAAIPVKDIG DWVLRKLSQN LRAKNRGTGE YYHQGVKEFL SHYELQDLEE ELLKWRSDRK SNIPCWVLQN RLAEKLGNKE AVVYIPVRGG RIYFATHKVA TGAVSIVFDQ KQVWVCNADH VAAANIALTG KGIGRQSSDE ENPDGGRIKL QLTS |
SEQ ID NO: 1132 (編碼Cas12i4之核苷酸序列) | ATGGCTTCCATCTCTAGGCCATACGGCACCAAGCTGCGACCGGACGCACGGAAGAAGGAGATGCTCGATAAGTTCTTTAATACACTGACTAAGGGTCAGCGCGTGTTCGCAGACCTGGCCCTGTGCATCTATGGCTCCCTGACCCTGGAGATGGCCAAGTCTCTGGAGCCAGAAAGTGATTCAGAACTGGTGTGCGCTATTGGGTGGTTTCGGCTGGTGGACAAGACCATCTGGTCCAAGGATGGCATCAAGCAGGAGAATCTGGTGAAACAGTACGAAGCCTATTCCGGAAAGGAGGCTTCTGAAGTGGTCAAAACATACCTGAACAGCCCCAGCTCCGACAAGTACGTGTGGATCGATTGCAGGCAGAAATTCCTGAGGTTTCAGCGCGAGCTCGGCACTCGCAACCTGTCCGAGGACTTCGAATGTATGCTCTTTGAACAGTACATTAGACTGACCAAGGGCGAGATCGAAGGGTATGCCGCTATTTCAAATATGTTCGGAAACGGCGAGAAGGAAGACCGGAGCAAGAAAAGAATGTACGCTACACGGATGAAAGATTGGCTGGAGGCAAACGAAAATATCACTTGGGAGCAGTATAGAGAGGCCCTGAAGAACCAGCTGAATGCTAAAAACCTGGAGCAGGTTGTGGCCAATTACAAGGGGAACGCTGGCGGGGCAGACCCCTTCTTTAAGTATAGCTTCTCCAAAGAGGGAATGGTGAGCAAGAAAGAACATGCACAGCAGCTCGACAAGTTCAAAACCGTCCTGAAGAACAAAGCCCGGGACCTGAATTTTCCAAACAAGGAGAAGCTGAAGCAGTACCTGGAGGCCGAAATCGGCATTCCGGTCGACGCTAACGTGTACTCCCAGATGTTCTCTAACGGGGTGAGTGAGGTCCAGCCTAAGACCACACGGAATATGTCTTTTAGTAACGAGAAACTGGATCTGCTCACTGAACTGAAGGACCTGAACAAGGGCGATGGGTTCGAGTACGCCAGAGAAGTGCTGAACGGGTTCTTTGACTCCGAGCTCCACACTACCGAGGATAAGTTTAATATCACCTCTAGGTACCTGGGAGGCGACAAATCAAACCGCCTGAGCAAACTCTATAAGATCTGGAAGAAAGAGGGTGTGGACTGCGAGGAAGGCATTCAGCAGTTCTGTGAAGCCGTCAAAGATAAGATGGGCCAGATCCCCATTCGAAATGTGCTGAAGTACCTGTGGCAGTTCCGGGAGACAGTCAGTGCCGAGGATTTTGAAGCAGCCGCTAAGGCTAACCATCTGGAGGAAAAGATCAGCCGGGTGAAAGCCCACCCAATCGTGATTAGCAATAGGTACTGGGCTTTTGGGACTTCCGCACTGGTGGGAAACATTATGCCCGCAGACAAGAGGCATCAGGGAGAGTATGCCGGTCAGAATTTCAAAATGTGGCTGGAGGCTGAACTGCACTACGATGGCAAGAAAGCAAAGCACCATCTGCCTTTTTATAACGCCCGCTTCTTTGAGGAAGTGTACTGCTATCACCCCTCTGTCGCCGAGATCACTCCTTTCAAAACCAAGCAGTTTGGCTGTGAAATCGGGAAGGACATTCCAGATTACGTGAGCGTCGCTCTGAAGGACAATCCGTATAAGAAAGCAACCAAACGAATCCTGCGTGCAATCTACAATCCCGTCGCCAACACAACTGGCGTTGATAAGACCACAAACTGCAGCTTCATGATCAAACGCGAGAATGACGAATATAAGCTGGTCATCAACCGAAAAATTTCCGTGGATCGGCCTAAGAGAATCGAAGTGGGCAGGACAATTATGGGGTACGACCGCAATCAGACAGCTAGCGATACTTATTGGATTGGCCGGCTGGTGCCACCTGGAACCCGGGGCGCATACCGCATCGGAGAGTGGAGCGTCCAGTATATTAAGTCCGGGCCTGTCCTGTCTAGTACTCAGGGAGTTAACAATTCCACTACCGACCAGCTGGTGTACAACGGCATGCCATCAAGCTCCGAGCGGTTCAAGGCCTGGAAGAAAGCCAGAATGGCTTTTATCCGAAAACTCATTCGTCAGCTGAATGACGAGGGACTGGAATCTAAGGGTCAGGATTATATCCCCGAGAACCCTTCTAGTTTCGATGTGCGGGGCGAAACCCTGTACGTCTTTAACAGTAATTATCTGAAGGCCCTGGTGAGCAAACACAGAAAGGCCAAGAAACCTGTTGAGGGGATCCTGGACGAGATTGAAGCCTGGACATCTAAAGACAAGGATTCATGCAGCCTGATGCGGCTGAGCAGCCTGAGCGATGCTTCCATGCAGGGAATCGCCAGCCTGAAGAGTCTGATTAACAGCTACTTCAACAAGAATGGCTGTAAAACCATCGAGGACAAAGAAAAGTTTAATCCCGTGCTGTATGCCAAGCTGGTTGAGGTGGAACAGCGGAGAACAAACAAGCGGTCTGAGAAAGTGGGAAGAATCGCAGGTAGTCTGGAGCAGCTGGCCCTGCTGAACGGGGTTGAGGTGGTCATCGGCGAAGCTGACCTGGGGGAGGTCGAAAAAGGAAAGAGTAAGAAACAGAATTCACGGAACATGGATTGGTGCGCAAAGCAGGTGGCACAGCGGCTGGAGTACAAACTGGCCTTCCATGGAATCGGTTACTTTGGAGTGAACCCCATGTATACCAGCCACCAGGACCCTTTCGAACATAGGCGCGTGGCTGATCACATCGTCATGCGAGCACGTTTTGAGGAAGTCAACGTGGAGAACATTGCCGAATGGCACGTGCGAAATTTCTCAAACTACCTGCGTGCAGACAGCGGCACTGGGCTGTACTATAAGCAGGCCACCATGGACTTCCTGAAACATTACGGTCTGGAGGAACACGCTGAGGGCCTGGAAAATAAGAAAATCAAGTTCTATGACTTTAGAAAGATCCTGGAGGATAAAAACCTGACAAGCGTGATCATTCCAAAGAGGGGCGGGCGCATCTACATGGCCACCAACCCAGTGACATCCGACTCTACCCCGATTACATACGCCGGCAAGACTTATAATAGGTGTAACGCTGATGAGGTGGCAGCCGCTAATATCGTTATTTCTGTGCTGGCTCCCCGCAGTAAGAAAAACGAGGAACAGGACGATATCCCTCTGATTACCAAGAAAGCCGAGAGTAAGTCACCACCGAAAGACCGGAAGAGATCAAAAACAAGCCAGCTGCCTCAGAAA |
SEQ ID NO: 1158 (美國專利第10,808,245號之SEQ ID NO: 14之Cas12i4胺基酸序列) | MASISRPYGTKLRPDARKKEMLDKFFNTLTKGQRVFADLALCIYGSLTLEMAKSLEPESDSELVCAIGWFRLVDKTIWSKDGIKQENLVKQYEAYSGKEASEVVKTYLNSPSSDKYVWIDCRQKFLRFQRELGTRNLSEDFECMLFEQYIRLTKGEIEGYAAISNMFGNGEKEDRSKKRMYATRMKDWLEANENITWEQYREALKNQLNAKNLEQVVANYKGNAGGADPFFKYSFSKEGMVSKKEHAQQLDKFKTVLKNKARDLNFPNKEKLKQYLEAEIGIPVDANVYSQMFSNGVSEVQPKTTRNMSFSNEKLDLLTELKDLNKGDGFEYAREVLNGFFDSELHTTEDKFNITSRYLGGDKSNRLSKLYKIWKKEGVDCEEGIQQFCEAVKDKMGQIPIRNVLKYLWQFRETVSAEDFEAAAKANHLEEKISRVKAHPIVISNRYWAFGTSALVGNIMPADKRHQGEYAGQNFKMWLEAELHYDGKKAKHHLPFYNARFFEEVYCYHPSVAEITPFKTKQFGCEIGKDIPDYVSVALKDNPYKKATKRILRAIYNPVANTTGVDKTTNCSFMIKRENDEYKLVINRKISVDRPKRIEVGRTIMGYDRNQTASDTYWIGRLVPPGTRGAYRIGEWSVQYIKSGPVLSSTQGVNNSTTDQLVYNGMPSSSERFKAWKKARMAFIRKLIRQLNDEGLESKGQDYIPENPSSFDVRGETLYVFNSNYLKALVSKHRKAKKPVEGILDEIEAWTSKDKDSCSLMRLSSLSDASMQGIASLKSLINSYFNKNGCKTIEDKEKFNPVLYAKLVEVEQRRTNKRSEKVGRIAGSLEQLALLNGVEVVIGEADLGEVEKGKSKKQNSRNMDWCAKQVAQRLEYKLAFHGIGYFGVNPMYTSHQDPFEHRRVADHIVMRARFEEVNVENIAEWHVRNFSNYLRADSGTGLYYKQATMDFLKHYGLEEHAEGLENKKIKFYDFRKILEDKNLTSVIIPKRGGRIYMATNPVTSDSTPITYAGKTYNRCNADEVAAANIVISVLAPRSKKNEEQDDIPLITKKAESKSPPKDRKRSKTSQLPQK |
SEQ ID NO: 1159 (變異Cas12i4) | MASISRPYGT KLRPDARKKE MLDKFFNTLT KGQRVFADLA LCIYGSLTLE MAKSLEPESD SELVCAIGWF RLVDKTIWSK DGIKQENLVK QYEAYSGKEA SEVVKTYLNS PSSDKYVWID CRQKFLRFQR ELGTRNLSED FECMLFEQYI RLTKGEIEGY AAISNMFGNG EKEDRSKKRM YATRMKDWLE ANENITWEQY REALKNQLNA KNLEQVVANY KGNAGGADPF FKYSFSKEGM VSKKEHAQQL DKFKTVLKNK ARDLNFPNKE KLKQYLEAEI GIPVDANVYS QMFSNGVSEV QPKTTRNMSF SNEKLDLLTE LKDLNKGDGF EYAREVLNGF FDSELHTTED KFNITSRYLG GDKSNRLSKL YKIWKKEGVD CEEGIQQFCE AVKDKMGQIP IRNVLKYLWQ FRETVSAEDF EAAAKANHLE EKISRVKAHP IVISNRYWAF GTSALVGNIM PADKRHQGEY AGQNFKMWLE AELHYDGKKA KHHLPFYNAR FFEEVYCYHP SVAEITPFKT KQFGCEIGKD IPDYVSVALK DNPYKKATKR ILRAIYNPVA NTTGVDKTTN CSFMIKREND EYKLVINRKI SRDRPKRIEV GRTIMGYDRN QTASDTYWIG RLVPPGTRGA YRIGEWSVQY IKSGPVLSST QGVNNSTTDQ LVYNGMPSSS ERFKAWKKAR MAFIRKLIRQ LNDEGLESKG QDYIPENPSS FDVRGETLYV FNSNYLKALV SKHRKAKKPV EGILDEIEAW TSKDKDSCSL MRLSSLSDAS MQGIASLKSL INSYFNKNGC KTIEDKEKFN PVLYAKLVEV EQRRTNKRSE KVGRIAGSLE QLALLNGVEV VIGEADLGEV EKGKSKKQNS RNMDWCAKQV AQRLEYKLAF HGIGYFGVNP MYTSHQDPFE HRRVADHIVM RARFEEVNVE NIAEWHVRNF SNYLRADSGT GLYYKQATMD FLKHYGLEEH AEGLENKKIK FYDFRKILED KNLTSVIIPK RGGRIYMATN PVTSDSTPIT YAGKTYNRCN ADEVAAANIV ISVLAPRSKK NREQDDIPLI TKKAESKSPP KDRKRSKTSQ LPQK |
SEQ ID NO: 1160 (變異Cas12i4) | MASISRPYGT KLRPDARKKE MLDKFFNTLT KGQRVFADLA LCIYGSLTLE MAKSLEPESD SELVCAIGWF RLVDKTIWSK DGIKQENLVK QYEAYSGKEA SEVVKTYLNS PSSDKYVWID CRQKFLRFQR ELGTRNLSED FECMLFEQYI RLTKGEIEGY AAISNMFGNG EKEDRSKKRM YATRMKDWLE ANENITWEQY REALKNQLNA KNLEQVVANY KGNAGGADPF FKYSFSKEGM VSKKEHAQQL DKFKTVLKNK ARDLNFPNKE KLKQYLEAEI GIPVDANVYS QMFSNGVSEV QPKTTRNMSF SNEKLDLLTE LKDLNKGDGF EYAREVLNGF FDSELHTTED KFNITSRYLG GDKSNRLSKL YKIWKKEGVD CEEGIQQFCE AVKDKMGQIP IRNVLKYLWQ FRETVSAEDF EAAAKANHLE EKISRVKAHP IVISNRYWAF GTSALVGNIM PADKRHQGEY AGQNFKMWLR AELHYDGKKA KHHLPFYNAR FFEEVYCYHP SVAEITPFKT KQFGCEIGKD IPDYVSVALK DNPYKKATKR ILRAIYNPVA NTTRVDKTTN CSFMIKREND EYKLVINRKI SRDRPKRIEV GRTIMGYDRN QTASDTYWIG RLVPPGTRGA YRIGEWSVQY IKSGPVLSST QGVNNSTTDQ LVYNGMPSSS ERFKAWKKAR MAFIRKLIRQ LNDEGLESKG QDYIPENPSS FDVRGETLYV FNSNYLKALV SKHRKAKKPV EGILDEIEAW TSKDKDSCSL MRLSSLSDAS MQGIASLKSL INSYFNKNGC KTIEDKEKFN PVLYAKLVEV EQRRTNKRSE KVGRIAGSLE QLALLNGVEV VIGEADLGEV EKGKSKKQNS RNMDWCAKQV AQRLEYKLAF HGIGYFGVNP MYTSHQDPFE HRRVADHIVM RARFEEVNVE NIAEWHVRNF SNYLRADSGT GLYYKQATMD FLKHYGLEEH AEGLENKKIK FYDFRKILED KNLTSVIIPK RGGRIYMATN PVTSDSTPIT YAGKTYNRCN ADEVAAANIV ISVLAPRSKK NREQDDIPLI TKKAESKSPP KDRKRSKTSQ LPQK |
SEQ ID NO: 1161 (美國專利第10,808,245號之SEQ ID NO: 3之Cas12i1) | MSNKEKNASETRKAYTTKMIPRSHDRMKLLGNFMDYLMDGTPIFFELWNQFGGGIDRDIISGTANKDKISDDLLLAVNWFKVMPINSKPQGVSPSNLANLFQQYSGSEPDIQAQEYFASNFDTEKHQWKDMRVEYERLLAELQLSRSDMHHDLKLMYKEKCIGLSLSTAHYITSVMFGTGAKNNRQTKHQFYSKVIQLLEESTQINSVEQLASIILKAGDCDSYRKLRIRCSRKGATPSILKIVQDYELGTNHDDEVNVPSLIANLKEKLGRFEYECEWKCMEKIKAFLASKVGPYYLGSYSAMLENALSPIKGMTTKNCKFVLKQIDAKNDIKYENEPFGKIVEGFFDSPYFESDTNVKWVLHPHHIGESNIKTLWEDLNAIHSKYEEDIASLSEDKKEKRIKVYQGDVCQTINTYCEEVGKEAKTPLVQLLRYLYSRKDDIAVDKIIDGITFLSKKHKVEKQKINPVIQKYPSFNFGNNSKLLGKIISPKDKLKHNLKCNRNQVDNYIWIEIKVLNTKTMRWEKHHYALSSTRFLEEVYYPATSENPPDALAARFRTKTNGYEGKPALSAEQIEQIRSAPVGLRKVKKRQMRLEAARQQNLLPRYTWGKDFNINICKRGNNFEVTLATKVKKKKEKNYKVVLGYDANIVRKNTYAAIEAHANGDGVIDYNDLPVKPIESGFVTVESQVRDKSYDQLSYNGVKLLYCKPHVESRRSFLEKYRNGTMKDNRGNNIQIDFMKDFEAIADDETSLYYFNMKYCKLLQSSIRNHSSQAKEYREEIFELLRDGKLSVLKLSSLSNLSFVMFKVAKSLIGTYFGHLLKKPKNSKSDVKAPPITDEDKQKADPEMFALRLALEEKRLNKVKSKKEVIANKIVAKALELRDKYGPVLIKGENISDTTKKGKKSSTNSFLMDWLARGVANKVKEMVMMHQGLEFVEVNPNFTSHQDPFVHKNPENTFRARYSRCTPSELTEKNRKEILSFLSDKPSKRPTNAYYNEGAMAFLATYGLKKNDVLGVSLEKFKQIMANILHQRSEDQLLFPSRGGMFYLATYKLDADATSVNWNGKQFWVCNADLVAAYNVGLVDIQKDFKKK |
SEQ ID NO: 1162 (美國專利第10,808,245號之SEQ ID NO: 14之Cas12i3) | MSISNNNILPYNPKLLPDDRKHKMLVDTFNQLDLIRNNLHDMIIALYGALKYDNIKQFASKEKPHISADALCSINWFRLVKTNERKPAIESNQIISKFIQYSGHTPDKYALSHITGNHEPSHKWIDCREYAINYARIMHLSFSQFQDLATACLNCKILILNGTLTSSWAWGANSALFGGSDKENFSVKAKILNSFIENLKDEMNTTKFQVVEKVCQQIGSSDAADLFDLYRSTVKDGNRGPATGRNPKVMNLFSQDGEISSEQREDFIESFQKVMQEKNSKQIIPHLDKLKYHLVKQSGLYDIYSWAAAIKNANSTIVASNSSNLNTILNKTEKQQTFEELRKDEKIVACSKILLSVNDTLPEDLHYNPSTSNLGKNLDVFFDLLNENSVHTIENKEEKNKIVKECVNQYMEECKGLNKPPMPVLLTFISDYAHKHQAQDFLSAAKMNFIDLKIKSIKVVPTVHGSSPYTWISNLSKKNKDGKMIRTPNSSLIGWIIPPEEIHDQKFAGQNPIIWAVLRVYCNNKWEMHHFPFSDSRFFTEVYAYKPNLPYLPGGENRSKRFGYRHSTNLSNESRQILLDKSKYAKANKSVLRCMENMTHNVVFDPKTSLNIRIKTDKNNSPVLDDKGRITFVMQINHRILEKYNNTKIEIGDRILAYDQNQSENHTYAILQRTEEGSHAHQFNGWYVRVLETGKVTSIVQGLSGPIDQLNYDGMPVTSHKFNCWQADRSAFVSQFASLKISETETFDEAYQAINAQGAYTWNLFYLRILRKALRVCHMENINQFREEILAISKNRLSPMSLGSLSQNSLKMIRAFKSIINCYMSRMSFVDELQKKEGDLELHTIMRLTDNKLNDKRVEKINRASSFLTNKAHSMGCKMIVGESDLPVADSKTSKKQNVDRMDWCARALSHKVEYACKLMGLAYRGIPAYMSSHQDPLVHLVESKRSVLRPRFVVADKSDVKQHHLDNLRRMLNSKTKVGTAVYYREAVELMCEELGIHKTDMAKGKVSLSDFVDKFIGEKAIFPQRGGRFYMSTKRLTTGAKLICYSGSDVWLSDADEIAAINIGMFVVCDQTGAFKKKKKEKLDDEECDILPFRPM |
CIITA同功型X1 cDNA SEQ ID NO: 1193 | ATGCTGGGTGAGCGGAGATTCCAGGCACTGGCCAGGGCAGCTGCCCTGACTCCAAGGGCTGCCATGAACAACTTCCAGGCCATCCTGACTCAGGTGAGAATGCTGCTCTCCAGCCATCAGCCCAGCCTGGTGCAGGCCCTCTTGGACAACCTGCTGAAGGAGGACCTCCTCTCCAGGGAATACCACTGCACTCTGCTCCATGAGCCTGATAGTGAGGCTCTGGCCAGGAAGATCTCTTTGACCCTACTAGAGAAAGGAGACCTGGATTTGGCCCTCCTGGGGTGGGCCCGGAGTGGGCTGCAGCCCCCAGCAGCCGAGAGGGGCCCCGGCCACAGTGACCATGGTGGCAGCTCACAGTGTGCCACCATGGAGTTGGGGCCCCTAGAAGGTGGCTACCTGGAGCTTCTTAACAGCGATGCTGACCCCCTGTGCCTCTACCACTTCTATGACCAGATGGACCTGGCTGGAGAAGAAGAGATTGAGCTCTACTCAGAACCCGACACAGACACCATCAACTGCGACCAGTTCAGCAGGCTGTTGTGTGACATGGAAGGTGATGAAGAGACCAGGGAGGCTTATGCCAATATCGCGGAACTGGACCAGTATGTCTTCCAGGACTCCCAGCTGGAGGGCCTGAGCAAGGACATTTTCATAGAGCACATAGGACCAGATGAAGTGATCGGTGAGAGTATGGAGATGCCAGCAGAAGTTGGGCAGAAAAGTCAGAAAAGACCCTTCCCAGAGGAGCTTCCGGCAGACCTGAAGCACTGGAAGCCAGCTGAGCCCCCCACTGTGGTGACTGGCAGTCTCCTAGTGGGACCAGTGAGCGACTGCTCCACCCTGCCCTGCCTGCCACTGCCTGCGCTGTTCAACCAGGAGCCAGCCTCCGGCCAGATGCGCCTGGAGAAAACCGACCAGATTCCCATGCCTTTCTCCAGTTCCTCGTTGAGCTGCCTGAATCTCCCTGAGGGACCCATCCAGTTTGTCCCCACCATCTCCACTCTGCCCCATGGGCTCTGGCAAATCTCTGAGGCTGGAACAGGGGTCTCCAGTATATTCATCTACCATGGTGAGGTGCCCCAGGCCAGCCAAGTACCCCCTCCCAGTGGATTCACTGTCCACGGCCTCCCAACATCTCCAGACCGGCCAGGCTCCACCAGCCCCTTCGCTCCATCAGCCACTGACCTGCCCAGCATGCCTGAACCTGCCCTGACCTCCCGAGCAAACATGACAGAGCACAAGACGTCCCCCACCCAATGCCCGGCAGCTGGAGAGGTCTCCAACAAGCTTCCAAAATGGCCTGAGCCGGTGGAGCAGTTCTACCGCTCACTGCAGGACACGTATGGTGCCGAGCCCGCAGGCCCGGATGGCATCCTAGTGGAGGTGGATCTGGTGCAGGCCAGGCTGGAGAGGAGCAGCAGCAAGAGCCTGGAGCGGGAACTGGCCACCCCGGACTGGGCAGAACGGCAGCTGGCCCAAGGAGGCCTGGCTGAGGTGCTGTTGGCTGCCAAGGAGCACCGGCGGCCGCGTGAGACACGAGTGATTGCTGTGCTGGGCAAAGCTGGTCAGGGCAAGAGCTATTGGGCTGGGGCAGTGAGCCGGGCCTGGGCTTGTGGCCGGCTTCCCCAGTACGACTTTGTCTTCTCTGTCCCCTGCCATTGCTTGAACCGTCCGGGGGATGCCTATGGCCTGCAGGATCTGCTCTTCTCCCTGGGCCCACAGCCACTCGTGGCGGCCGATGAGGTTTTCAGCCACATCTTGAAGAGACCTGACCGCGTTCTGCTCATCCTAGACGGCTTCGAGGAGCTGGAAGCGCAAGATGGCTTCCTGCACAGCACGTGCGGACCGGCACCGGCGGAGCCCTGCTCCCTCCGGGGGCTGCTGGCCGGCCTTTTCCAGAAGAAGCTGCTCCGAGGTTGCACCCTCCTCCTCACAGCCCGGCCCCGGGGCCGCCTGGTCCAGAGCCTGAGCAAGGCCGACGCCCTATTTGAGCTGTCCGGCTTCTCCATGGAGCAGGCCCAGGCATACGTGATGCGCTACTTTGAGAGCTCAGGGATGACAGAGCACCAAGACAGAGCCCTGACGCTCCTCCGGGACCGGCCACTTCTTCTCAGTCACAGCCACAGCCCTACTTTGTGCCGGGCAGTGTGCCAGCTCTCAGAGGCCCTGCTGGAGCTTGGGGAGGACGCCAAGCTGCCCTCCACGCTCACGGGACTCTATGTCGGCCTGCTGGGCCGTGCAGCCCTCGACAGCCCCCCCGGGGCCCTGGCAGAGCTGGCCAAGCTGGCCTGGGAGCTGGGCCGCAGACATCAAAGTACCCTACAGGAGGACCAGTTCCCATCCGCAGACGTGAGGACCTGGGCGATGGCCAAAGGCTTAGTCCAACACCCACCGCGGGCCGCAGAGTCCGAGCTGGCCTTCCCCAGCTTCCTCCTGCAATGCTTCCTGGGGGCCCTGTGGCTGGCTCTGAGTGGCGAAATCAAGGACAAGGAGCTCCCGCAGTACCTAGCATTGACCCCAAGGAAGAAGAGGCCCTATGACAACTGGCTGGAGGGCGTGCCACGCTTTCTGGCTGGGCTGATCTTCCAGCCTCCCGCCCGCTGCCTGGGAGCCCTACTCGGGCCATCGGCGGCTGCCTCGGTGGACAGGAAGCAGAAGGTGCTTGCGAGGTACCTGAAGCGGCTGCAGCCGGGGACACTGCGGGCGCGGCAGCTGCTGGAGCTGCTGCACTGCGCCCACGAGGCCGAGGAGGCTGGAATTTGGCAGCACGTGGTACAGGAGCTCCCCGGCCGCCTCTCTTTTCTGGGCACCCGCCTCACGCCTCCTGATGCACATGTACTGGGCAAGGCCTTGGAGGCGGCGGGCCAAGACTTCTCCCTGGACCTCCGCAGCACTGGCATTTGCCCCTCTGGATTGGGGAGCCTCGTGGGACTCAGCTGTGTCACCCGTTTCAGGGCTGCCTTGAGCGACACGGTGGCGCTGTGGGAGTCCCTGCAGCAGCATGGGGAGACCAAGCTACTTCAGGCAGCAGAGGAGAAGTTCACCATCGAGCCTTTCAAAGCCAAGTCCCTGAAGGATGTGGAAGACCTGGGAAAGCTTGTGCAGACTCAGAGGACGAGAAGTTCCTCGGAAGACACAGCTGGGGAGCTCCCTGCTGTTCGGGACCTAAAGAAACTGGAGTTTGCGCTGGGCCCTGTCTCAGGCCCCCAGGCTTTCCCCAAACTGGTGCGGATCCTCACGGCCTTTTCCTCCCTGCAGCATCTGGACCTGGATGCGCTGAGTGAGAACAAGATCGGGGACGAGGGTGTCTCGCAGCTCTCAGCCACCTTCCCCCAGCTGAAGTCCTTGGAAACCCTCAATCTGTCCCAGAACAACATCACTGACCTGGGTGCCTACAAACTCGCCGAGGCCCTGCCTTCGCTCGCTGCATCCCTGCTCAGGCTAAGCTTGTACAATAACTGCATCTGCGACGTGGGAGCCGAGAGCTTGGCTCGTGTGCTTCCGGACATGGTGTCCCTCCGGGTGATGGACGTCCAGTACAACAAGTTCACGGCTGCCGGGGCCCAGCAGCTCGCTGCCAGCCTTCGGAGGTGTCCTCATGTGGAGACGCTGGCGATGTGGACGCCCACCATCCCATTCAGTGTCCAGGAACACCTGCAACAACAGGATTCACGGATCAGCCTGAGATGA |
CIITA同功型X3 cDNA SEQ ID NO: 1194 | ATGCTGGGTGAGCGGAGATTCCAGGCACTGGCCAGGGCAGCTGCCCTGACTCCAAGGGCTGCCATGAACAACTTCCAGGCCATCCTGACTCAGGTGAGAATGCTGCTCTCCAGCCATCAGCCCAGCCTGGTGCAGGCCCTCTTGGACAACCTGCTGAAGGAGGACCTCCTCTCCAGGGAATACCACTGCACTCTGCTCCATGAGCCTGATAGTGAGGCTCTGGCCAGGAAGATCTCTTTGACCCTACTAGAGAAAGGAGACCTGGATTTGGCCCTCCTGGGGTGGGCCCGGAGTGGGCTGCAGCCCCCAGCAGCCGAGAGGGGCCCCGGCCACAGTGACCATGGTGGCAGCTCACAGTGTGCCACCATGGAGTTGGGGCCCCTAGAAGGTGGCTACCTGGAGCTTCTTAACAGCGATGCTGACCCCCTGTGCCTCTACCACTTCTATGACCAGATGGACCTGGCTGGAGAAGAAGAGATTGAGCTCTACTCAGAACCCGACACAGACACCATCAACTGCGACCAGTTCAGCAGGCTGTTGTGTGACATGGAAGGTGATGAAGAGACCAGGGAGGCTTATGCCAATATCGCGGAACTGGACCAGTATGTCTTCCAGGACTCCCAGCTGGAGGGCCTGAGCAAGGACATTTTCATAGAGCACATAGGACCAGATGAAGTGATCGGTGAGAGTATGGAGATGCCAGCAGAAGTTGGGCAGAAAAGTCAGAAAAGACCCTTCCCAGAGGAGCTTCCGGCAGACCTGAAGCACTGGAAGCCAGCTGAGCCCCCCACTGTGGTGACTGGCAGTCTCCTAGTGGGACCAGTGAGCGACTGCTCCACCCTGCCCTGCCTGCCACTGCCTGCGCTGTTCAACCAGGAGCCAGCCTCCGGCCAGATGCGCCTGGAGAAAACCGACCAGATTCCCATGCCTTTCTCCAGTTCCTCGTTGAGCTGCCTGAATCTCCCTGAGGGACCCATCCAGTTTGTCCCCACCATCTCCACTCTGCCCCATGGGCTCTGGCAAATCTCTGAGGCTGGAACAGGGGTCTCCAGTATATTCATCTACCATGGTGAGGTGCCCCAGGCCAGCCAAGTACCCCCTCCCAGTGGATTCACTGTCCACGGCCTCCCAACATCTCCAGACCGGCCAGGCTCCACCAGCCCCTTCGCTCCATCAGCCACTGACCTGCCCAGCATGCCTGAACCTGCCCTGACCTCCCGAGCAAACATGACAGAGCACAAGACGTCCCCCACCCAATGCCCGGCAGCTGGAGAGGTCTCCAACAAGCTTCCAAAATGGCCTGAGCCGGTGGAGCAGTTCTACCGCTCACTGCAGGACACGTATGGTGCCGAGCCCGCAGGCCCGGATGGCATCCTAGTGGAGGTGGATCTGGTGCAGGCCAGGCTGGAGAGGAGCAGCAGCAAGAGCCTGGAGCGGGAACTGGCCACCCCGGACTGGGCAGAACGGCAGCTGGCCCAAGGAGGCCTGGCTGAGGTGCTGTTGGCTGCCAAGGAGCACCGGCGGCCGCGTGAGACACGAGTGATTGCTGTGCTGGGCAAAGCTGGTCAGGGCAAGAGCTATTGGGCTGGGGCAGTGAGCCGGGCCTGGGCTTGTGGCCGGCTTCCCCAGTACGACTTTGTCTTCTCTGTCCCCTGCCATTGCTTGAACCGTCCGGGGGATGCCTATGGCCTGCAGGATCTGCTCTTCTCCCTGGGCCCACAGCCACTCGTGGCGGCCGATGAGGTTTTCAGCCACATCTTGAAGAGACCTGACCGCGTTCTGCTCATCCTAGACGGCTTCGAGGAGCTGGAAGCGCAAGATGGCTTCCTGCACAGCACGTGCGGACCGGCACCGGCGGAGCCCTGCTCCCTCCGGGGGCTGCTGGCCGGCCTTTTCCAGAAGAAGCTGCTCCGAGGTTGCACCCTCCTCCTCACAGCCCGGCCCCGGGGCCGCCTGGTCCAGAGCCTGAGCAAGGCCGACGCCCTATTTGAGCTGTCCGGCTTCTCCATGGAGCAGGCCCAGGCATACGTGATGCGCTACTTTGAGAGCTCAGGGATGACAGAGCACCAAGACAGAGCCCTGACGCTCCTCCGGGACCGGCCACTTCTTCTCAGTCACAGCCACAGCCCTACTTTGTGCCGGGCAGTGTGCCAGCTCTCAGAGGCCCTGCTGGAGCTTGGGGAGGACGCCAAGCTGCCCTCCACGCTCACGGGACTCTATGTCGGCCTGCTGGGCCGTGCAGCCCTCGACAGCCCCCCCGGGGCCCTGGCAGAGCTGGCCAAGCTGGCCTGGGAGCTGGGCCGCAGACATCAAAGTACCCTACAGGAGGACCAGTTCCCATCCGCAGACGTGAGGACCTGGGCGATGGCCAAAGGCTTAGTCCAACACCCACCGCGGGCCGCAGAGTCCGAGCTGGCCTTCCCCAGCTTCCTCCTGCAATGCTTCCTGGGGGCCCTGTGGCTGGCTCTGAGTGGCGAAATCAAGGACAAGGAGCTCCCGCAGTACCTAGCATTGACCCCAAGGAAGAAGAGGCCCTATGACAACTGGCTGGAGGGCGTGCCACGCTTTCTGGCTGGGCTGATCTTCCAGCCTCCCGCCCGCTGCCTGGGAGCCCTACTCGGGCCATCGGCGGCTGCCTCGGTGGACAGGAAGCAGAAGGTGCTTGCGAGGTACCTGAAGCGGCTGCAGCCGGGGACACTGCGGGCGCGGCAGCTGCTGGAGCTGCTGCACTGCGCCCACGAGGCCGAGGAGGCTGGAATTTGGCAGCACGTGGTACAGGAGCTCCCCGGCCGCCTCTCTTTTCTGGGCACCCGCCTCACGCCTCCTGATGCACATGTACTGGGCAAGGCCTTGGAGGCGGCGGGCCAAGACTTCTCCCTGGACCTCCGCAGCACTGGCATTTGCCCCTCTGGATTGGGGAGCCTCGTGGGACTCAGCTGTGTCACCCGTTTCAGGGCTGCCTTGAGCGACACGGTGGCGCTGTGGGAGTCCCTGCAGCAGCATGGGGAGACCAAGCTACTTCAGGCAGCAGAGGAGAAGTTCACCATCGAGCCTTTCAAAGCCAAGTCCCTGAAGGATGTGGAAGACCTGGGAAAGCTTGTGCAGACTCAGAGGACGAGAAGTTCCTCGGAAGACACAGCTGGGGAGCTCCCTGCTGTTCGGGACCTAAAGAAACTGGAGTTTGCGCTGGGCCCTGTCTCAGGCCCCCAGGCTTTCCCCAAACTGGTGCGGATCCTCACGGCCTTTTCCTCCCTGCAGCATCTGGACCTGGATGCGCTGAGTGAGAACAAGATCGGGGACGAGGGTGTCTCGCAGCTCTCAGCCACCTTCCCCCAGCTGAAGTCCTTGGAAACCCTCAATCTGTCCCAGAACAACATCACTGACCTGGGTGCCTACAAACTCGCCGAGGCCCTGCCTTCGCTCGCTGCATCCCTGCTCAGGCTAAGGGATGGCGGGACCAGGCTTTTTCCGGAACCTAGGGGTGGTGGCTTCTGGAAGGCTAACCACGTACGTCAGCTTTTGCCGGCCTTGTCACTTACATGCCGGTCAGTGTTTCACTGCCACCTTCTGGTAGGCCTTGGCATAGCACCTCTTGCTTTTGAGTGA |
CIITA同功型X9 cDNA SEQ ID NO: 1195 | ATGCTGGGTGAGCGGAGATTCCAGGCACTGGCCAGGGCAGCTGCCCTGACTCCAAGGGCTGCCATGAACAACTTCCAGGCCATCCTGACTCAGGTGAGAATGCTGCTCTCCAGCCATCAGCCCAGCCTGGTGCAGGCCCTCTTGGACAACCTGCTGAAGGAGGACCTCCTCTCCAGGGAATACCACTGCACTCTGCTCCATGAGCCTGATAGTGAGGCTCTGGCCAGGAAGATCTCTTTGACCCTACTAGAGAAAGGAGACCTGGATTTGGCCCTCCTGGGGTGGGCCCGGAGTGGGCTGCAGCCCCCAGCAGCCGAGAGGGGCCCCGGCCACAGTGACCATGGTGGCAGCTCACAGTGTGCCACCATGGAGTTGGGGCCCCTAGAAGGTGGCTACCTGGAGCTTCTTAACAGCGATGCTGACCCCCTGTGCCTCTACCACTTCTATGACCAGATGGACCTGGCTGGAGAAGAAGAGATTGAGCTCTACTCAGAACCCGACACAGACACCATCAACTGCGACCAGTTCAGCAGGCTGTTGTGTGACATGGAAGGTGATGAAGAGACCAGGGAGGCTTATGCCAATATCGCGGAACTGGACCAGTATGTCTTCCAGGACTCCCAGCTGGAGGGCCTGAGCAAGGACATTTTCATAGAGCACATAGGACCAGATGAAGTGATCGGTGAGAGTATGGAGATGCCAGCAGAAGTTGGGCAGAAAAGTCAGAAAAGACCCTTCCCAGAGGAGCTTCCGGCAGACCTGAAGCACTGGAAGCCAGCTGAGCCCCCCACTGTGGTGACTGGCAGTCTCCTAGTGGGACCAGTGAGCGACTGCTCCACCCTGCCCTGCCTGCCACTGCCTGCGCTGTTCAACCAGGAGCCAGCCTCCGGCCAGATGCGCCTGGAGAAAACCGACCAGATTCCCATGCCTTTCTCCAGTTCCTCGTTGAGCTGCCTGAATCTCCCTGAGGGACCCATCCAGTTTGTCCCCACCATCTCCACTCTGCCCCATGGGCTCTGGCAAATCTCTGAGGCTGGAACAGGGGTCTCCAGTATATTCATCTACCATGGTGAGGTGCCCCAGGCCAGCCAAGTACCCCCTCCCAGTGGATTCACTGTCCACGGCCTCCCAACATCTCCAGACCGGCCAGGCTCCACCAGCCCCTTCGCTCCATCAGCCACTGACCTGCCCAGCATGCCTGAACCTGCCCTGACCTCCCGAGCAAACATGACAGAGCACAAGACGTCCCCCACCCAATGCCCGGCAGCTGGAGAGGTCTCCAACAAGCTTCCAAAATGGCCTGAGCCGGTGGAGCAGTTCTACCGCTCACTGCAGGACACGTATGGTGCCGAGCCCGCAGGCCCGGATGGCATCCTAGTGGAGGTGGATCTGGTGCAGGCCAGGCTGGAGAGGAGCAGCAGCAAGAGCCTGGAGCGGGAACTGGCCACCCCGGACTGGGCAGAACGGCAGCTGGCCCAAGGAGGCCTGGCTGAGGTGCTGTTGGCTGCCAAGGAGCACCGGCGGCCGCGTGAGACACGAGTGATTGCTGTGCTGGGCAAAGCTGGTCAGGGCAAGAGCTATTGGGCTGGGGCAGTGAGCCGGGCCTGGGCTTGTGGCCGGCTTCCCCAGTACGACTTTGTCTTCTCTGTCCCCTGCCATTGCTTGAACCGTCCGGGGGATGCCTATGGCCTGCAGGATCTGCTCTTCTCCCTGGGCCCACAGCCACTCGTGGCGGCCGATGAGGTTTTCAGCCACATCTTGAAGAGACCTGACCGCGTTCTGCTCATCCTAGACGGCTTCGAGGAGCTGGAAGCGCAAGATGGCTTCCTGCACAGCACGTGCGGACCGGCACCGGCGGAGCCCTGCTCCCTCCGGGGGCTGCTGGCCGGCCTTTTCCAGAAGAAGCTGCTCCGAGGTTGCACCCTCCTCCTCACAGCCCGGCCCCGGGGCCGCCTGGTCCAGAGCCTGAGCAAGGCCGACGCCCTATTTGAGCTGTCCGGCTTCTCCATGGAGCAGGCCCAGGCATACGTGATGCGCTACTTTGAGAGCTCAGGGATGACAGAGCACCAAGACAGAGCCCTGACGCTCCTCCGGGACCGGCCACTTCTTCTCAGTCACAGCCACAGCCCTACTTTGTGCCGGGCAGTGTGCCAGCTCTCAGAGGCCCTGCTGGAGCTTGGGGAGGACGCCAAGCTGCCCTCCACGCTCACGGGACTCTATGTCGGCCTGCTGGGCCGTGCAGCCCTCGACAGCCCCCCCGGGGCCCTGGCAGAGCTGGCCAAGCTGGCCTGGGAGCTGGGCCGCAGACATCAAAGTACCCTACAGGAGGACCAGTTCCCATCCGCAGACGTGAGGACCTGGGCGATGGCCAAAGGCTTAGTCCAACACCCACCGCGGGCCGCAGAGTCCGAGCTGGCCTTCCCCAGCTTCCTCCTGCAATGCTTCCTGGGGGCCCTGTGGCTGGCTCTGAGTGGCGAAATCAAGGACAAGGAGCTCCCGCAGTACCTAGCATTGACCCCAAGGAAGAAGAGGCCCTATGACAACTGGCTGGAGGGCGTGCCACGCTTTCTGGCTGGGCTGATCTTCCAGCCTCCCGCCCGCTGCCTGGGAGCCCTACTCGGGCCATCGGCGGCTGCCTCGGTGGACAGGAAGCAGAAGGTGCTTGCGAGGTACCTGAAGCGGCTGCAGCCGGGGACACTGCGGGCGCGGCAGCTGCTGGAGCTGCTGCACTGCGCCCACGAGGCCGAGGAGGCTGGAATTTGGCAGCACGTGGTACAGGAGCTCCCCGGCCGCCTCTCTTTTCTGGGCACCCGCCTCACGCCTCCTGATGCACATGTACTGGGCAAGGCCTTGGAGGCGGCGGGCCAAGACTTCTCCCTGGACCTCCGCAGCACTGGCATTTGCCCCTCTGGATTGGGGAGCCTCGTGGGACTCAGCTGTGTCACCCGTTTCAGGGCTGCCTTGAGCGACACGGTGGCGCTGTGGGAGTCCCTGCAGCAGCATGGGGAGACCAAGCTACTTCAGGCAGCAGAGGAGAAGTTCACCATCGAGCCTTTCAAAGCCAAGTCCCTGAAGGATGTGGAAGACCTGGGAAAGCTTGTGCAGACTCAGAGGACGAGAAGTTCCTCGGAAGACACAGCTGGGGAGCTCCCTGCTGTTCGGGACCTAAAGAAACTGGAGTTTGCGCTGGGCCCTGTCTCAGGCCCCCAGGCTTTCCCCAAACTGGTGCGGATCCTCACGGCCTTTTCCTCCCTGCAGCATCTGGACCTGGATGCGCTGAGTGAGAACAAGATCGGGGACGAGGGTGTCTCGCAGCTCTCAGCCACCTTCCCCCAGCTGAAGTCCTTGGAAACCCTCAAACAAGGGCTCGCTGTGTCACCCAGGCTAGAATATAGTGCTATGATCATACCTCTGCAGCCTTGA |
CIITA同功型X5 cDNA SEQ ID NO: 1196 | ATGCTGCTCTCCAGCCATCAGCCCAGCCTGGTGCAGGCCCTCTTGGACAACCTGCTGAAGGAGGACCTCCTCTCCAGGGAATACCACTGCACTCTGCTCCATGAGCCTGATAGTGAGGCTCTGGCCAGGAAGATCTCTTTGACCCTACTAGAGAAAGGAGACCTGGATTTGGCCCTCCTGGGGTGGGCCCGGAGTGGGCTGCAGCCCCCAGCAGCCGAGAGGGGCCCCGGCCACAGTGACCATGGTGGCAGCTCACAGTGTGCCACCATGGAGTTGGGGCCCCTAGAAGGTGGCTACCTGGAGCTTCTTAACAGCGATGCTGACCCCCTGTGCCTCTACCACTTCTATGACCAGATGGACCTGGCTGGAGAAGAAGAGATTGAGCTCTACTCAGAACCCGACACAGACACCATCAACTGCGACCAGTTCAGCAGGCTGTTGTGTGACATGGAAGGTGATGAAGAGACCAGGGAGGCTTATGCCAATATCGCGGAACTGGACCAGTATGTCTTCCAGGACTCCCAGCTGGAGGGCCTGAGCAAGGACATTTTCATAGAGCACATAGGACCAGATGAAGTGATCGGTGAGAGTATGGAGATGCCAGCAGAAGTTGGGCAGAAAAGTCAGAAAAGACCCTTCCCAGAGGAGCTTCCGGCAGACCTGAAGCACTGGAAGCCAGTGCCTTTCTCCAGTTCCTCGTTGAGCTGCCTGAATCTCCCTGAGGGACCCATCCAGTTTGTCCCCACCATCTCCACTCTGCCCCATGGGCTCTGGCAAATCTCTGAGGCTGGAACAGGGGTCTCCAGTATATTCATCTACCATGGTGAGGTGCCCCAGGCCAGCCAAGTACCCCCTCCCAGTGGATTCACTGTCCACGGCCTCCCAACATCTCCAGACCGGCCAGGCTCCACCAGCCCCTTCGCTCCATCAGCCACTGACCTGCCCAGCATGCCTGAACCTGCCCTGACCTCCCGAGCAAACATGACAGAGCACAAGACGTCCCCCACCCAATGCCCGGCAGCTGGAGAGGTCTCCAACAAGCTTCCAAAATGGCCTGAGCCGGTGGAGCAGTTCTACCGCTCACTGCAGGACACGTATGGTGCCGAGCCCGCAGGCCCGGATGGCATCCTAGTGGAGGTGGATCTGGTGCAGGCCAGGCTGGAGAGGAGCAGCAGCAAGAGCCTGGAGCGGGAACTGGCCACCCCGGACTGGGCAGAACGGCAGCTGGCCCAAGGAGGCCTGGCTGAGGTGCTGTTGGCTGCCAAGGAGCACCGGCGGCCGCGTGAGACACGAGTGATTGCTGTGCTGGGCAAAGCTGGTCAGGGCAAGAGCTATTGGGCTGGGGCAGTGAGCCGGGCCTGGGCTTGTGGCCGGCTTCCCCAGTACGACTTTGTCTTCTCTGTCCCCTGCCATTGCTTGAACCGTCCGGGGGATGCCTATGGCCTGCAGGATCTGCTCTTCTCCCTGGGCCCACAGCCACTCGTGGCGGCCGATGAGGTTTTCAGCCACATCTTGAAGAGACCTGACCGCGTTCTGCTCATCCTAGACGGCTTCGAGGAGCTGGAAGCGCAAGATGGCTTCCTGCACAGCACGTGCGGACCGGCACCGGCGGAGCCCTGCTCCCTCCGGGGGCTGCTGGCCGGCCTTTTCCAGAAGAAGCTGCTCCGAGGTTGCACCCTCCTCCTCACAGCCCGGCCCCGGGGCCGCCTGGTCCAGAGCCTGAGCAAGGCCGACGCCCTATTTGAGCTGTCCGGCTTCTCCATGGAGCAGGCCCAGGCATACGTGATGCGCTACTTTGAGAGCTCAGGGATGACAGAGCACCAAGACAGAGCCCTGACGCTCCTCCGGGACCGGCCACTTCTTCTCAGTCACAGCCACAGCCCTACTTTGTGCCGGGCAGTGTGCCAGCTCTCAGAGGCCCTGCTGGAGCTTGGGGAGGACGCCAAGCTGCCCTCCACGCTCACGGGACTCTATGTCGGCCTGCTGGGCCGTGCAGCCCTCGACAGCCCCCCCGGGGCCCTGGCAGAGCTGGCCAAGCTGGCCTGGGAGCTGGGCCGCAGACATCAAAGTACCCTACAGGAGGACCAGTTCCCATCCGCAGACGTGAGGACCTGGGCGATGGCCAAAGGCTTAGTCCAACACCCACCGCGGGCCGCAGAGTCCGAGCTGGCCTTCCCCAGCTTCCTCCTGCAATGCTTCCTGGGGGCCCTGTGGCTGGCTCTGAGTGGCGAAATCAAGGACAAGGAGCTCCCGCAGTACCTAGCATTGACCCCAAGGAAGAAGAGGCCCTATGACAACTGGCTGGAGGGCGTGCCACGCTTTCTGGCTGGGCTGATCTTCCAGCCTCCCGCCCGCTGCCTGGGAGCCCTACTCGGGCCATCGGCGGCTGCCTCGGTGGACAGGAAGCAGAAGGTGCTTGCGAGGTACCTGAAGCGGCTGCAGCCGGGGACACTGCGGGCGCGGCAGCTGCTGGAGCTGCTGCACTGCGCCCACGAGGCCGAGGAGGCTGGAATTTGGCAGCACGTGGTACAGGAGCTCCCCGGCCGCCTCTCTTTTCTGGGCACCCGCCTCACGCCTCCTGATGCACATGTACTGGGCAAGGCCTTGGAGGCGGCGGGCCAAGACTTCTCCCTGGACCTCCGCAGCACTGGCATTTGCCCCTCTGGATTGGGGAGCCTCGTGGGACTCAGCTGTGTCACCCGTTTCAGGGCTGCCTTGAGCGACACGGTGGCGCTGTGGGAGTCCCTGCAGCAGCATGGGGAGACCAAGCTACTTCAGGCAGCAGAGGAGAAGTTCACCATCGAGCCTTTCAAAGCCAAGTCCCTGAAGGATGTGGAAGACCTGGGAAAGCTTGTGCAGACTCAGAGGACGAGAAGTTCCTCGGAAGACACAGCTGGGGAGCTCCCTGCTGTTCGGGACCTAAAGAAACTGGAGTTTGCGCTGGGCCCTGTCTCAGGCCCCCAGGCTTTCCCCAAACTGGTGCGGATCCTCACGGCCTTTTCCTCCCTGCAGCATCTGGACCTGGATGCGCTGAGTGAGAACAAGATCGGGGACGAGGGTGTCTCGCAGCTCTCAGCCACCTTCCCCCAGCTGAAGTCCTTGGAAACCCTCAATCTGTCCCAGAACAACATCACTGACCTGGGTGCCTACAAACTCGCCGAGGCCCTGCCTTCGCTCGCTGCATCCCTGCTCAGGCTAAGCTTGTACAATAACTGCATCTGCGACGTGGGAGCCGAGAGCTTGGCTCGTGTGCTTCCGGACATGGTGTCCCTCCGGGTGATGGACGTCCAGTACAACAAGTTCACGGCTGCCGGGGCCCAGCAGCTCGCTGCCAGCCTTCGGAGGTGTCCTCATGTGGAGACGCTGGCGATGTGGACGCCCACCATCCCATTCAGTGTCCAGGAACACCTGCAACAACAGGATTCACGGATCAGCCTGAGATGA |
CIITA同功型X7 cDNA SEQ ID NO: 1197 | ATGCTGCTCTCCAGCCATCAGCCCAGCCTGGTGCAGGCCCTCTTGGACAACCTGCTGAAGGAGGACCTCCTCTCCAGGGAATACCACTGCACTCTGCTCCATGAGCCTGATAGTGAGGCTCTGGCCAGGAAGATCTCTTTGACCCTACTAGAGAAAGGAGACCTGGATTTGGCCCTCCTGGGGTGGGCCCGGAGTGGGCTGCAGCCCCCAGCAGCCGAGAGGGGCCCCGGCCACAGTGACCATGGTGGCAGCTCACAGTGTGCCACCATGGAGTTGGGGCCCCTAGAAGGTGGCTACCTGGAGCTTCTTAACAGCGATGCTGACCCCCTGTGCCTCTACCACTTCTATGACCAGATGGACCTGGCTGGAGAAGAAGAGATTGAGCTCTACTCAGAACCCGACACAGACACCATCAACTGCGACCAGTTCAGCAGGCTGTTGTGTGACATGGAAGGTGATGAAGAGACCAGGGAGGCTTATGCCAATATCGCGGAACTGGACCAGTATGTCTTCCAGGACTCCCAGCTGGAGGGCCTGAGCAAGGACATTTTCAAGCACATAGGACCAGATGAAGTGATCGGTGAGAGTATGGAGATGCCAGCAGAAGTTGGGCAGAAAAGTCAGAAAAGACCCTTCCCAGAGGAGCTTCCGGCAGACCTGAAGCACTGGAAGCCAGTGCCTTTCTCCAGTTCCTCGTTGAGCTGCCTGAATCTCCCTGAGGGACCCATCCAGTTTGTCCCCACCATCTCCACTCTGCCCCATGGGCTCTGGCAAATCTCTGAGGCTGGAACAGGGGTCTCCAGTATATTCATCTACCATGGTGAGGTGCCCCAGGCCAGCCAAGTACCCCCTCCCAGTGGATTCACTGTCCACGGCCTCCCAACATCTCCAGACCGGCCAGGCTCCACCAGCCCCTTCGCTCCATCAGCCACTGACCTGCCCAGCATGCCTGAACCTGCCCTGACCTCCCGAGCAAACATGACAGAGCACAAGACGTCCCCCACCCAATGCCCGGCAGCTGGAGAGGTCTCCAACAAGCTTCCAAAATGGCCTGAGCCGGTGGAGCAGTTCTACCGCTCACTGCAGGACACGTATGGTGCCGAGCCCGCAGGCCCGGATGGCATCCTAGTGGAGGTGGATCTGGTGCAGGCCAGGCTGGAGAGGAGCAGCAGCAAGAGCCTGGAGCGGGAACTGGCCACCCCGGACTGGGCAGAACGGCAGCTGGCCCAAGGAGGCCTGGCTGAGGTGCTGTTGGCTGCCAAGGAGCACCGGCGGCCGCGTGAGACACGAGTGATTGCTGTGCTGGGCAAAGCTGGTCAGGGCAAGAGCTATTGGGCTGGGGCAGTGAGCCGGGCCTGGGCTTGTGGCCGGCTTCCCCAGTACGACTTTGTCTTCTCTGTCCCCTGCCATTGCTTGAACCGTCCGGGGGATGCCTATGGCCTGCAGGATCTGCTCTTCTCCCTGGGCCCACAGCCACTCGTGGCGGCCGATGAGGTTTTCAGCCACATCTTGAAGAGACCTGACCGCGTTCTGCTCATCCTAGACGGCTTCGAGGAGCTGGAAGCGCAAGATGGCTTCCTGCACAGCACGTGCGGACCGGCACCGGCGGAGCCCTGCTCCCTCCGGGGGCTGCTGGCCGGCCTTTTCCAGAAGAAGCTGCTCCGAGGTTGCACCCTCCTCCTCACAGCCCGGCCCCGGGGCCGCCTGGTCCAGAGCCTGAGCAAGGCCGACGCCCTATTTGAGCTGTCCGGCTTCTCCATGGAGCAGGCCCAGGCATACGTGATGCGCTACTTTGAGAGCTCAGGGATGACAGAGCACCAAGACAGAGCCCTGACGCTCCTCCGGGACCGGCCACTTCTTCTCAGTCACAGCCACAGCCCTACTTTGTGCCGGGCAGTGTGCCAGCTCTCAGAGGCCCTGCTGGAGCTTGGGGAGGACGCCAAGCTGCCCTCCACGCTCACGGGACTCTATGTCGGCCTGCTGGGCCGTGCAGCCCTCGACAGCCCCCCCGGGGCCCTGGCAGAGCTGGCCAAGCTGGCCTGGGAGCTGGGCCGCAGACATCAAAGTACCCTACAGGAGGACCAGTTCCCATCCGCAGACGTGAGGACCTGGGCGATGGCCAAAGGCTTAGTCCAACACCCACCGCGGGCCGCAGAGTCCGAGCTGGCCTTCCCCAGCTTCCTCCTGCAATGCTTCCTGGGGGCCCTGTGGCTGGCTCTGAGTGGCGAAATCAAGGACAAGGAGCTCCCGCAGTACCTAGCATTGACCCCAAGGAAGAAGAGGCCCTATGACAACTGGCTGGAGGGCGTGCCACGCTTTCTGGCTGGGCTGATCTTCCAGCCTCCCGCCCGCTGCCTGGGAGCCCTACTCGGGCCATCGGCGGCTGCCTCGGTGGACAGGAAGCAGAAGGTGCTTGCGAGGTACCTGAAGCGGCTGCAGCCGGGGACACTGCGGGCGCGGCAGCTGCTGGAGCTGCTGCACTGCGCCCACGAGGCCGAGGAGGCTGGAATTTGGCAGCACGTGGTACAGGAGCTCCCCGGCCGCCTCTCTTTTCTGGGCACCCGCCTCACGCCTCCTGATGCACATGTACTGGGCAAGGCCTTGGAGGCGGCGGGCCAAGACTTCTCCCTGGACCTCCGCAGCACTGGCATTTGCCCCTCTGGATTGGGGAGCCTCGTGGGACTCAGCTGTGTCACCCGTTTCAGGGCTGCCTTGAGCGACACGGTGGCGCTGTGGGAGTCCCTGCAGCAGCATGGGGAGACCAAGCTACTTCAGGCAGCAGAGGAGAAGTTCACCATCGAGCCTTTCAAAGCCAAGTCCCTGAAGGATGTGGAAGACCTGGGAAAGCTTGTGCAGACTCAGAGGACGAGAAGTTCCTCGGAAGACACAGCTGGGGAGCTCCCTGCTGTTCGGGACCTAAAGAAACTGGAGTTTGCGCTGGGCCCTGTCTCAGGCCCCCAGGCTTTCCCCAAACTGGTGCGGATCCTCACGGCCTTTTCCTCCCTGCAGCATCTGGACCTGGATGCGCTGAGTGAGAACAAGATCGGGGACGAGGGTGTCTCGCAGCTCTCAGCCACCTTCCCCCAGCTGAAGTCCTTGGAAACCCTCAATCTGTCCCAGAACAACATCACTGACCTGGGTGCCTACAAACTCGCCGAGGCCCTGCCTTCGCTCGCTGCATCCCTGCTCAGGCTAAGCTTGTACAATAACTGCATCTGCGACGTGGGAGCCGAGAGCTTGGCTCGTGTGCTTCCGGACATGGTGTCCCTCCGGGTGATGGACGTCCAGTACAACAAGTTCACGGCTGCCGGGGCCCAGCAGCTCGCTGCCAGCCTTCGGAGGTGTCCTCATGTGGAGACGCTGGCGATGTGGACGCCCACCATCCCATTCAGTGTCCAGGAACACCTGCAACAACAGGATTCACGGATCAGCCTGAGATGA |
CIITA同功型X2 cDNA SEQ ID NO: 1198 | ATGCGTTGCCTGGCTCCACGCCCTGCTGGGTCCTACCTGTCAGAGCCCCAAGGCAGCTCACAGTGTGCCACCATGGAGTTGGGGCCCCTAGAAGGTGGCTACCTGGAGCTTCTTAACAGCGATGCTGACCCCCTGTGCCTCTACCACTTCTATGACCAGATGGACCTGGCTGGAGAAGAAGAGATTGAGCTCTACTCAGGTGGGCCCTCCTCCCTCTGGTCTCTTCCGGTATCCCCCACCCCTCAGCTTGCTGTAGAGACGGCAATCAGGGGAAATTCTGGTCCCTGCCCTCCCGTCAGCACCACGGACAGCTCCCACGTCTGTGGGACGCTCTCTGCAGATGGGGATGATCTCCCAGCCCTGCCCCGCCTCTCCCTCGTTCCCCACCAGCCCTCTTTCCAGAAATTTCCTTCTTCATCCAAGGGACTTTTCCTCCCAGAACCCGACACAGACACCATCAACTGCGACCAGTTCAGCAGGCTGTTGTGTGACATGGAAGGTGATGAAGAGACCAGGGAGGCTTATGCCAATATCGCGGAACTGGACCAGTATGTCTTCCAGGACTCCCAGCTGGAGGGCCTGAGCAAGGACATTTTCATAGAGCACATAGGACCAGATGAAGTGATCGGTGAGAGTATGGAGATGCCAGCAGAAGTTGGGCAGAAAAGTCAGAAAAGACCCTTCCCAGAGGAGCTTCCGGCAGACCTGAAGCACTGGAAGCCAGCTGAGCCCCCCACTGTGGTGACTGGCAGTCTCCTAGTGGGACCAGTGAGCGACTGCTCCACCCTGCCCTGCCTGCCACTGCCTGCGCTGTTCAACCAGGAGCCAGCCTCCGGCCAGATGCGCCTGGAGAAAACCGACCAGATTCCCATGCCTTTCTCCAGTTCCTCGTTGAGCTGCCTGAATCTCCCTGAGGGACCCATCCAGTTTGTCCCCACCATCTCCACTCTGCCCCATGGGCTCTGGCAAATCTCTGAGGCTGGAACAGGGGTCTCCAGTATATTCATCTACCATGGTGAGGTGCCCCAGGCCAGCCAAGTACCCCCTCCCAGTGGATTCACTGTCCACGGCCTCCCAACATCTCCAGACCGGCCAGGCTCCACCAGCCCCTTCGCTCCATCAGCCACTGACCTGCCCAGCATGCCTGAACCTGCCCTGACCTCCCGAGCAAACATGACAGAGCACAAGACGTCCCCCACCCAATGCCCGGCAGCTGGAGAGGTCTCCAACAAGCTTCCAAAATGGCCTGAGCCGGTGGAGCAGTTCTACCGCTCACTGCAGGACACGTATGGTGCCGAGCCCGCAGGCCCGGATGGCATCCTAGTGGAGGTGGATCTGGTGCAGGCCAGGCTGGAGAGGAGCAGCAGCAAGAGCCTGGAGCGGGAACTGGCCACCCCGGACTGGGCAGAACGGCAGCTGGCCCAAGGAGGCCTGGCTGAGGTGCTGTTGGCTGCCAAGGAGCACCGGCGGCCGCGTGAGACACGAGTGATTGCTGTGCTGGGCAAAGCTGGTCAGGGCAAGAGCTATTGGGCTGGGGCAGTGAGCCGGGCCTGGGCTTGTGGCCGGCTTCCCCAGTACGACTTTGTCTTCTCTGTCCCCTGCCATTGCTTGAACCGTCCGGGGGATGCCTATGGCCTGCAGGATCTGCTCTTCTCCCTGGGCCCACAGCCACTCGTGGCGGCCGATGAGGTTTTCAGCCACATCTTGAAGAGACCTGACCGCGTTCTGCTCATCCTAGACGGCTTCGAGGAGCTGGAAGCGCAAGATGGCTTCCTGCACAGCACGTGCGGACCGGCACCGGCGGAGCCCTGCTCCCTCCGGGGGCTGCTGGCCGGCCTTTTCCAGAAGAAGCTGCTCCGAGGTTGCACCCTCCTCCTCACAGCCCGGCCCCGGGGCCGCCTGGTCCAGAGCCTGAGCAAGGCCGACGCCCTATTTGAGCTGTCCGGCTTCTCCATGGAGCAGGCCCAGGCATACGTGATGCGCTACTTTGAGAGCTCAGGGATGACAGAGCACCAAGACAGAGCCCTGACGCTCCTCCGGGACCGGCCACTTCTTCTCAGTCACAGCCACAGCCCTACTTTGTGCCGGGCAGTGTGCCAGCTCTCAGAGGCCCTGCTGGAGCTTGGGGAGGACGCCAAGCTGCCCTCCACGCTCACGGGACTCTATGTCGGCCTGCTGGGCCGTGCAGCCCTCGACAGCCCCCCCGGGGCCCTGGCAGAGCTGGCCAAGCTGGCCTGGGAGCTGGGCCGCAGACATCAAAGTACCCTACAGGAGGACCAGTTCCCATCCGCAGACGTGAGGACCTGGGCGATGGCCAAAGGCTTAGTCCAACACCCACCGCGGGCCGCAGAGTCCGAGCTGGCCTTCCCCAGCTTCCTCCTGCAATGCTTCCTGGGGGCCCTGTGGCTGGCTCTGAGTGGCGAAATCAAGGACAAGGAGCTCCCGCAGTACCTAGCATTGACCCCAAGGAAGAAGAGGCCCTATGACAACTGGCTGGAGGGCGTGCCACGCTTTCTGGCTGGGCTGATCTTCCAGCCTCCCGCCCGCTGCCTGGGAGCCCTACTCGGGCCATCGGCGGCTGCCTCGGTGGACAGGAAGCAGAAGGTGCTTGCGAGGTACCTGAAGCGGCTGCAGCCGGGGACACTGCGGGCGCGGCAGCTGCTGGAGCTGCTGCACTGCGCCCACGAGGCCGAGGAGGCTGGAATTTGGCAGCACGTGGTACAGGAGCTCCCCGGCCGCCTCTCTTTTCTGGGCACCCGCCTCACGCCTCCTGATGCACATGTACTGGGCAAGGCCTTGGAGGCGGCGGGCCAAGACTTCTCCCTGGACCTCCGCAGCACTGGCATTTGCCCCTCTGGATTGGGGAGCCTCGTGGGACTCAGCTGTGTCACCCGTTTCAGGGCTGCCTTGAGCGACACGGTGGCGCTGTGGGAGTCCCTGCAGCAGCATGGGGAGACCAAGCTACTTCAGGCAGCAGAGGAGAAGTTCACCATCGAGCCTTTCAAAGCCAAGTCCCTGAAGGATGTGGAAGACCTGGGAAAGCTTGTGCAGACTCAGAGGACGAGAAGTTCCTCGGAAGACACAGCTGGGGAGCTCCCTGCTGTTCGGGACCTAAAGAAACTGGAGTTTGCGCTGGGCCCTGTCTCAGGCCCCCAGGCTTTCCCCAAACTGGTGCGGATCCTCACGGCCTTTTCCTCCCTGCAGCATCTGGACCTGGATGCGCTGAGTGAGAACAAGATCGGGGACGAGGGTGTCTCGCAGCTCTCAGCCACCTTCCCCCAGCTGAAGTCCTTGGAAACCCTCAATCTGTCCCAGAACAACATCACTGACCTGGGTGCCTACAAACTCGCCGAGGCCCTGCCTTCGCTCGCTGCATCCCTGCTCAGGCTAAGCTTGTACAATAACTGCATCTGCGACGTGGGAGCCGAGAGCTTGGCTCGTGTGCTTCCGGACATGGTGTCCCTCCGGGTGATGGACGTCCAGTACAACAAGTTCACGGCTGCCGGGGCCCAGCAGCTCGCTGCCAGCCTTCGGAGGTGTCCTCATGTGGAGACGCTGGCGATGTGGACGCCCACCATCCCATTCAGTGTCCAGGAACACCTGCAACAACAGGATTCACGGATCAGCCTGAGATGA |
CIITA同功型X4 cDNA SEQ ID NO: 1199 | ATGCGTTGCCTGGCTCCACGCCCTGCTGGGTCCTACCTGTCAGAGCCCCAAGGCAGCTCACAGTGTGCCACCATGGAGTTGGGGCCCCTAGAAGGTGGCTACCTGGAGCTTCTTAACAGCGATGCTGACCCCCTGTGCCTCTACCACTTCTATGACCAGATGGACCTGGCTGGAGAAGAAGAGATTGAGCTCTACTCAGGTGGGCCCTCCTCCCTCTGGTCTCTTCCGGTATCCCCCACCCCTCAGCTTGCTGTAGAGACGGCAATCAGGGGAAATTCTGGTCCCTGCCCTCCCGTCAGCACCACGGACAGCTCCCACGTCTGTGGGACGCTCTCTGCAGATGGGGATGATCTCCCAGCCCTGCCCCGCCTCTCCCTCGTTCCCCACCAGCCCTCTTTCCAGAAATTTCCTTCTTCATCCAAGGGACTTTTCCTCCCAGAACCCGACACAGACACCATCAACTGCGACCAGTTCAGCAGGCTGTTGTGTGACATGGAAGGTGATGAAGAGACCAGGGAGGCTTATGCCAATATCGCGGAACTGGACCAGTATGTCTTCCAGGACTCCCAGCTGGAGGGCCTGAGCAAGGACATTTTCATAGAGCACATAGGACCAGATGAAGTGATCGGTGAGAGTATGGAGATGCCAGCAGAAGTTGGGCAGAAAAGTCAGAAAAGACCCTTCCCAGAGGAGCTTCCGGCAGACCTGAAGCACTGGAAGCCAGTGCCTTTCTCCAGTTCCTCGTTGAGCTGCCTGAATCTCCCTGAGGGACCCATCCAGTTTGTCCCCACCATCTCCACTCTGCCCCATGGGCTCTGGCAAATCTCTGAGGCTGGAACAGGGGTCTCCAGTATATTCATCTACCATGGTGAGGTGCCCCAGGCCAGCCAAGTACCCCCTCCCAGTGGATTCACTGTCCACGGCCTCCCAACATCTCCAGACCGGCCAGGCTCCACCAGCCCCTTCGCTCCATCAGCCACTGACCTGCCCAGCATGCCTGAACCTGCCCTGACCTCCCGAGCAAACATGACAGAGCACAAGACGTCCCCCACCCAATGCCCGGCAGCTGGAGAGGTCTCCAACAAGCTTCCAAAATGGCCTGAGCCGGTGGAGCAGTTCTACCGCTCACTGCAGGACACGTATGGTGCCGAGCCCGCAGGCCCGGATGGCATCCTAGTGGAGGTGGATCTGGTGCAGGCCAGGCTGGAGAGGAGCAGCAGCAAGAGCCTGGAGCGGGAACTGGCCACCCCGGACTGGGCAGAACGGCAGCTGGCCCAAGGAGGCCTGGCTGAGGTGCTGTTGGCTGCCAAGGAGCACCGGCGGCCGCGTGAGACACGAGTGATTGCTGTGCTGGGCAAAGCTGGTCAGGGCAAGAGCTATTGGGCTGGGGCAGTGAGCCGGGCCTGGGCTTGTGGCCGGCTTCCCCAGTACGACTTTGTCTTCTCTGTCCCCTGCCATTGCTTGAACCGTCCGGGGGATGCCTATGGCCTGCAGGATCTGCTCTTCTCCCTGGGCCCACAGCCACTCGTGGCGGCCGATGAGGTTTTCAGCCACATCTTGAAGAGACCTGACCGCGTTCTGCTCATCCTAGACGGCTTCGAGGAGCTGGAAGCGCAAGATGGCTTCCTGCACAGCACGTGCGGACCGGCACCGGCGGAGCCCTGCTCCCTCCGGGGGCTGCTGGCCGGCCTTTTCCAGAAGAAGCTGCTCCGAGGTTGCACCCTCCTCCTCACAGCCCGGCCCCGGGGCCGCCTGGTCCAGAGCCTGAGCAAGGCCGACGCCCTATTTGAGCTGTCCGGCTTCTCCATGGAGCAGGCCCAGGCATACGTGATGCGCTACTTTGAGAGCTCAGGGATGACAGAGCACCAAGACAGAGCCCTGACGCTCCTCCGGGACCGGCCACTTCTTCTCAGTCACAGCCACAGCCCTACTTTGTGCCGGGCAGTGTGCCAGCTCTCAGAGGCCCTGCTGGAGCTTGGGGAGGACGCCAAGCTGCCCTCCACGCTCACGGGACTCTATGTCGGCCTGCTGGGCCGTGCAGCCCTCGACAGCCCCCCCGGGGCCCTGGCAGAGCTGGCCAAGCTGGCCTGGGAGCTGGGCCGCAGACATCAAAGTACCCTACAGGAGGACCAGTTCCCATCCGCAGACGTGAGGACCTGGGCGATGGCCAAAGGCTTAGTCCAACACCCACCGCGGGCCGCAGAGTCCGAGCTGGCCTTCCCCAGCTTCCTCCTGCAATGCTTCCTGGGGGCCCTGTGGCTGGCTCTGAGTGGCGAAATCAAGGACAAGGAGCTCCCGCAGTACCTAGCATTGACCCCAAGGAAGAAGAGGCCCTATGACAACTGGCTGGAGGGCGTGCCACGCTTTCTGGCTGGGCTGATCTTCCAGCCTCCCGCCCGCTGCCTGGGAGCCCTACTCGGGCCATCGGCGGCTGCCTCGGTGGACAGGAAGCAGAAGGTGCTTGCGAGGTACCTGAAGCGGCTGCAGCCGGGGACACTGCGGGCGCGGCAGCTGCTGGAGCTGCTGCACTGCGCCCACGAGGCCGAGGAGGCTGGAATTTGGCAGCACGTGGTACAGGAGCTCCCCGGCCGCCTCTCTTTTCTGGGCACCCGCCTCACGCCTCCTGATGCACATGTACTGGGCAAGGCCTTGGAGGCGGCGGGCCAAGACTTCTCCCTGGACCTCCGCAGCACTGGCATTTGCCCCTCTGGATTGGGGAGCCTCGTGGGACTCAGCTGTGTCACCCGTTTCAGGGCTGCCTTGAGCGACACGGTGGCGCTGTGGGAGTCCCTGCAGCAGCATGGGGAGACCAAGCTACTTCAGGCAGCAGAGGAGAAGTTCACCATCGAGCCTTTCAAAGCCAAGTCCCTGAAGGATGTGGAAGACCTGGGAAAGCTTGTGCAGACTCAGAGGACGAGAAGTTCCTCGGAAGACACAGCTGGGGAGCTCCCTGCTGTTCGGGACCTAAAGAAACTGGAGTTTGCGCTGGGCCCTGTCTCAGGCCCCCAGGCTTTCCCCAAACTGGTGCGGATCCTCACGGCCTTTTCCTCCCTGCAGCATCTGGACCTGGATGCGCTGAGTGAGAACAAGATCGGGGACGAGGGTGTCTCGCAGCTCTCAGCCACCTTCCCCCAGCTGAAGTCCTTGGAAACCCTCAATCTGTCCCAGAACAACATCACTGACCTGGGTGCCTACAAACTCGCCGAGGCCCTGCCTTCGCTCGCTGCATCCCTGCTCAGGCTAAGCTTGTACAATAACTGCATCTGCGACGTGGGAGCCGAGAGCTTGGCTCGTGTGCTTCCGGACATGGTGTCCCTCCGGGTGATGGACGTCCAGTACAACAAGTTCACGGCTGCCGGGGCCCAGCAGCTCGCTGCCAGCCTTCGGAGGTGTCCTCATGTGGAGACGCTGGCGATGTGGACGCCCACCATCCCATTCAGTGTCCAGGAACACCTGCAACAACAGGATTCACGGATCAGCCTGAGATGA |
CIITA同功型1 cDNA SEQ ID NO: 1200 | ATGCGTTGCCTGGCTCCACGCCCTGCTGGGTCCTACCTGTCAGAGCCCCAAGGCAGCTCACAGTGTGCCACCATGGAGTTGGGGCCCCTAGAAGGTGGCTACCTGGAGCTTCTTAACAGCGATGCTGACCCCCTGTGCCTCTACCACTTCTATGACCAGATGGACCTGGCTGGAGAAGAAGAGATTGAGCTCTACTCAGAACCCGACACAGACACCATCAACTGCGACCAGTTCAGCAGGCTGTTGTGTGACATGGAAGGTGATGAAGAGACCAGGGAGGCTTATGCCAATATCGCGGAACTGGACCAGTATGTCTTCCAGGACTCCCAGCTGGAGGGCCTGAGCAAGGACATTTTCATAGAGCACATAGGACCAGATGAAGTGATCGGTGAGAGTATGGAGATGCCAGCAGAAGTTGGGCAGAAAAGTCAGAAAAGACCCTTCCCAGAGGAGCTTCCGGCAGACCTGAAGCACTGGAAGCCAGCTGAGCCCCCCACTGTGGTGACTGGCAGTCTCCTAGTGGGACCAGTGAGCGACTGCTCCACCCTGCCCTGCCTGCCACTGCCTGCGCTGTTCAACCAGGAGCCAGCCTCCGGCCAGATGCGCCTGGAGAAAACCGACCAGATTCCCATGCCTTTCTCCAGTTCCTCGTTGAGCTGCCTGAATCTCCCTGAGGGACCCATCCAGTTTGTCCCCACCATCTCCACTCTGCCCCATGGGCTCTGGCAAATCTCTGAGGCTGGAACAGGGGTCTCCAGTATATTCATCTACCATGGTGAGGTGCCCCAGGCCAGCCAAGTACCCCCTCCCAGTGGATTCACTGTCCACGGCCTCCCAACATCTCCAGACCGGCCAGGCTCCACCAGCCCCTTCGCTCCATCAGCCACTGACCTGCCCAGCATGCCTGAACCTGCCCTGACCTCCCGAGCAAACATGACAGAGCACAAGACGTCCCCCACCCAATGCCCGGCAGCTGGAGAGGTCTCCAACAAGCTTCCAAAATGGCCTGAGCCGGTGGAGCAGTTCTACCGCTCACTGCAGGACACGTATGGTGCCGAGCCCGCAGGCCCGGATGGCATCCTAGTGGAGGTGGATCTGGTGCAGGCCAGGCTGGAGAGGAGCAGCAGCAAGAGCCTGGAGCGGGAACTGGCCACCCCGGACTGGGCAGAACGGCAGCTGGCCCAAGGAGGCCTGGCTGAGGTGCTGTTGGCTGCCAAGGAGCACCGGCGGCCGCGTGAGACACGAGTGATTGCTGTGCTGGGCAAAGCTGGTCAGGGCAAGAGCTATTGGGCTGGGGCAGTGAGCCGGGCCTGGGCTTGTGGCCGGCTTCCCCAGTACGACTTTGTCTTCTCTGTCCCCTGCCATTGCTTGAACCGTCCGGGGGATGCCTATGGCCTGCAGGATCTGCTCTTCTCCCTGGGCCCACAGCCACTCGTGGCGGCCGATGAGGTTTTCAGCCACATCTTGAAGAGACCTGACCGCGTTCTGCTCATCCTAGACGGCTTCGAGGAGCTGGAAGCGCAAGATGGCTTCCTGCACAGCACGTGCGGACCGGCACCGGCGGAGCCCTGCTCCCTCCGGGGGCTGCTGGCCGGCCTTTTCCAGAAGAAGCTGCTCCGAGGTTGCACCCTCCTCCTCACAGCCCGGCCCCGGGGCCGCCTGGTCCAGAGCCTGAGCAAGGCCGACGCCCTATTTGAGCTGTCCGGCTTCTCCATGGAGCAGGCCCAGGCATACGTGATGCGCTACTTTGAGAGCTCAGGGATGACAGAGCACCAAGACAGAGCCCTGACGCTCCTCCGGGACCGGCCACTTCTTCTCAGTCACAGCCACAGCCCTACTTTGTGCCGGGCAGTGTGCCAGCTCTCAGAGGCCCTGCTGGAGCTTGGGGAGGACGCCAAGCTGCCCTCCACGCTCACGGGACTCTATGTCGGCCTGCTGGGCCGTGCAGCCCTCGACAGCCCCCCCGGGGCCCTGGCAGAGCTGGCCAAGCTGGCCTGGGAGCTGGGCCGCAGACATCAAAGTACCCTACAGGAGGACCAGTTCCCATCCGCAGACGTGAGGACCTGGGCGATGGCCAAAGGCTTAGTCCAACACCCACCGCGGGCCGCAGAGTCCGAGCTGGCCTTCCCCAGCTTCCTCCTGCAATGCTTCCTGGGGGCCCTGTGGCTGGCTCTGAGTGGCGAAATCAAGGACAAGGAGCTCCCGCAGTACCTAGCATTGACCCCAAGGAAGAAGAGGCCCTATGACAACTGGCTGGAGGGCGTGCCACGCTTTCTGGCTGGGCTGATCTTCCAGCCTCCCGCCCGCTGCCTGGGAGCCCTACTCGGGCCATCGGCGGCTGCCTCGGTGGACAGGAAGCAGAAGGTGCTTGCGAGGTACCTGAAGCGGCTGCAGCCGGGGACACTGCGGGCGCGGCAGCTGCTGGAGCTGCTGCACTGCGCCCACGAGGCCGAGGAGGCTGGAATTTGGCAGCACGTGGTACAGGAGCTCCCCGGCCGCCTCTCTTTTCTGGGCACCCGCCTCACGCCTCCTGATGCACATGTACTGGGCAAGGCCTTGGAGGCGGCGGGCCAAGACTTCTCCCTGGACCTCCGCAGCACTGGCATTTGCCCCTCTGGATTGGGGAGCCTCGTGGGACTCAGCTGTGTCACCCGTTTCAGGGCTGCCTTGAGCGACACGGTGGCGCTGTGGGAGTCCCTGCAGCAGCATGGGGAGACCAAGCTACTTCAGGCAGCAGAGGAGAAGTTCACCATCGAGCCTTTCAAAGCCAAGTCCCTGAAGGATGTGGAAGACCTGGGAAAGCTTGTGCAGACTCAGAGGACGAGAAGTTCCTCGGAAGACACAGCTGGGGAGCTCCCTGCTGTTCGGGACCTAAAGAAACTGGAGTTTGCGCTGGGCCCTGTCTCAGGCCCCCAGGCTTTCCCCAAACTGGTGCGGATCCTCACGGCCTTTTCCTCCCTGCAGCATCTGGACCTGGATGCGCTGAGTGAGAACAAGATCGGGGACGAGGGTGTCTCGCAGCTCTCAGCCACCTTCCCCCAGCTGAAGTCCTTGGAAACCCTCAATCTGTCCCAGAACAACATCACTGACCTGGGTGCCTACAAACTCGCCGAGGCCCTGCCTTCGCTCGCTGCATCCCTGCTCAGGCTAAGCTTGTACAATAACTGCATCTGCGACGTGGGAGCCGAGAGCTTGGCTCGTGTGCTTCCGGACATGGTGTCCCTCCGGGTGATGGACGTCCAGTACAACAAGTTCACGGCTGCCGGGGCCCAGCAGCTCGCTGCCAGCCTTCGGAGGTGTCCTCATGTGGAGACGCTGGCGATGTGGACGCCCACCATCCCATTCAGTGTCCAGGAACACCTGCAACAACAGGATTCACGGATCAGCCTGAGATGA |
CIITA同功型4 cDNA SEQ ID NO: 1201 | ATGCGTTGCCTGGCTCCACGCCCTGCTGGGTCCTACCTGTCAGAGCCCCAAGGCAGCTCACAGTGTGCCACCATGGAGTTGGGGCCCCTAGAAGGTGGCTACCTGGAGCTTCTTAACAGCGATGCTGACCCCCTGTGCCTCTACCACTTCTATGACCAGATGGACCTGGCTGGAGAAGAAGAGATTGAGCTCTACTCAGAACCCGACACAGACACCATCAACTGCGACCAGTTCAGCAGGCTGTTGTGTGACATGGAAGGTGATGAAGAGACCAGGGAGGCTTATGCCAATATCGCGGAACTGGACCAGTATGTCTTCCAGGACTCCCAGCTGGAGGGCCTGAGCAAGGACATTTTCATAGAGCACATAGGACCAGATGAAGTGATCGGTGAGAGTATGGAGATGCCAGCAGAAGTTGGGCAGAAAAGTCAGAAAAGACCCTTCCCAGAGGAGCTTCCGGCAGACCTGAAGCACTGGAAGCCAGTGCCTTTCTCCAGTTCCTCGTTGAGCTGCCTGAATCTCCCTGAGGGACCCATCCAGTTTGTCCCCACCATCTCCACTCTGCCCCATGGGCTCTGGCAAATCTCTGAGGCTGGAACAGGGGTCTCCAGTATATTCATCTACCATGGTGAGGTGCCCCAGGCCAGCCAAGTACCCCCTCCCAGTGGATTCACTGTCCACGGCCTCCCAACATCTCCAGACCGGCCAGGCTCCACCAGCCCCTTCGCTCCATCAGCCACTGACCTGCCCAGCATGCCTGAACCTGCCCTGACCTCCCGAGCAAACATGACAGAGCACAAGACGTCCCCCACCCAATGCCCGGCAGCTGGAGAGGTCTCCAACAAGCTTCCAAAATGGCCTGAGCCGGTGGAGCAGTTCTACCGCTCACTGCAGGACACGTATGGTGCCGAGCCCGCAGGCCCGGATGGCATCCTAGTGGAGGTGGATCTGGTGCAGGCCAGGCTGGAGAGGAGCAGCAGCAAGAGCCTGGAGCGGGAACTGGCCACCCCGGACTGGGCAGAACGGCAGCTGGCCCAAGGAGGCCTGGCTGAGGTGCTGTTGGCTGCCAAGGAGCACCGGCGGCCGCGTGAGACACGAGTGATTGCTGTGCTGGGCAAAGCTGGTCAGGGCAAGAGCTATTGGGCTGGGGCAGTGAGCCGGGCCTGGGCTTGTGGCCGGCTTCCCCAGTACGACTTTGTCTTCTCTGTCCCCTGCCATTGCTTGAACCGTCCGGGGGATGCCTATGGCCTGCAGGATCTGCTCTTCTCCCTGGGCCCACAGCCACTCGTGGCGGCCGATGAGGTTTTCAGCCACATCTTGAAGAGACCTGACCGCGTTCTGCTCATCCTAGACGGCTTCGAGGAGCTGGAAGCGCAAGATGGCTTCCTGCACAGCACGTGCGGACCGGCACCGGCGGAGCCCTGCTCCCTCCGGGGGCTGCTGGCCGGCCTTTTCCAGAAGAAGCTGCTCCGAGGTTGCACCCTCCTCCTCACAGCCCGGCCCCGGGGCCGCCTGGTCCAGAGCCTGAGCAAGGCCGACGCCCTATTTGAGCTGTCCGGCTTCTCCATGGAGCAGGCCCAGGCATACGTGATGCGCTACTTTGAGAGCTCAGGGATGACAGAGCACCAAGACAGAGCCCTGACGCTCCTCCGGGACCGGCCACTTCTTCTCAGTCACAGCCACAGCCCTACTTTGTGCCGGGCAGTGTGCCAGCTCTCAGAGGCCCTGCTGGAGCTTGGGGAGGACGCCAAGCTGCCCTCCACGCTCACGGGACTCTATGTCGGCCTGCTGGGCCGTGCAGCCCTCGACAGCCCCCCCGGGGCCCTGGCAGAGCTGGCCAAGCTGGCCTGGGAGCTGGGCCGCAGACATCAAAGTACCCTACAGGAGGACCAGTTCCCATCCGCAGACGTGAGGACCTGGGCGATGGCCAAAGGCTTAGTCCAACACCCACCGCGGGCCGCAGAGTCCGAGCTGGCCTTCCCCAGCTTCCTCCTGCAATGCTTCCTGGGGGCCCTGTGGCTGGCTCTGAGTGGCGAAATCAAGGACAAGGAGCTCCCGCAGTACCTAGCATTGACCCCAAGGAAGAAGAGGCCCTATGACAACTGGCTGGAGGGCGTGCCACGCTTTCTGGCTGGGCTGATCTTCCAGCCTCCCGCCCGCTGCCTGGGAGCCCTACTCGGGCCATCGGCGGCTGCCTCGGTGGACAGGAAGCAGAAGGTGCTTGCGAGGTACCTGAAGCGGCTGCAGCCGGGGACACTGCGGGCGCGGCAGCTGCTGGAGCTGCTGCACTGCGCCCACGAGGCCGAGGAGGCTGGAATTTGGCAGCACGTGGTACAGGAGCTCCCCGGCCGCCTCTCTTTTCTGGGCACCCGCCTCACGCCTCCTGATGCACATGTACTGGGCAAGGCCTTGGAGGCGGCGGGCCAAGACTTCTCCCTGGACCTCCGCAGCACTGGCATTTGCCCCTCTGGATTGGGGAGCCTCGTGGGACTCAGCTGTGTCACCCGTTTCAGGGCTGCCTTGAGCGACACGGTGGCGCTGTGGGAGTCCCTGCAGCAGCATGGGGAGACCAAGCTACTTCAGGCAGCAGAGGAGAAGTTCACCATCGAGCCTTTCAAAGCCAAGTCCCTGAAGGATGTGGAAGACCTGGGAAAGCTTGTGCAGACTCAGAGGACGAGAAGTTCCTCGGAAGACACAGCTGGGGAGCTCCCTGCTGTTCGGGACCTAAAGAAACTGGAGTTTGCGCTGGGCCCTGTCTCAGGCCCCCAGGCTTTCCCCAAACTGGTGCGGATCCTCACGGCCTTTTCCTCCCTGCAGCATCTGGACCTGGATGCGCTGAGTGAGAACAAGATCGGGGACGAGGGTGTCTCGCAGCTCTCAGCCACCTTCCCCCAGCTGAAGTCCTTGGAAACCCTCAATCTGTCCCAGAACAACATCACTGACCTGGGTGCCTACAAACTCGCCGAGGCCCTGCCTTCGCTCGCTGCATCCCTGCTCAGGCTAAGCTTGTACAATAACTGCATCTGCGACGTGGGAGCCGAGAGCTTGGCTCGTGTGCTTCCGGACATGGTGTCCCTCCGGGTGATGGACGTCCAGTACAACAAGTTCACGGCTGCCGGGGCCCAGCAGCTCGCTGCCAGCCTTCGGAGGTGTCCTCATGTGGAGACGCTGGCGATGTGGACGCCCACCATCCCATTCAGTGTCCAGGAACACCTGCAACAACAGGATTCACGGATCAGCCTGAGATGA |
CIITA同功型2 cDNA SEQ ID NO: 1202 | ATGCGTTGCCTGGCTCCACGCCCTGCTGGGTCCTACCTGTCAGAGCCCCAAGGCAGCTCACAGTGTGCCACCATGGAGTTGGGGCCCCTAGAAGGTGGCTACCTGGAGCTTCTTAACAGCGATGCTGACCCCCTGTGCCTCTACCACTTCTATGACCAGATGGACCTGGCTGGAGAAGAAGAGATTGAGCTCTACTCAGAACCCGACACAGACACCATCAACTGCGACCAGTTCAGCAGGCTGTTGTGTGACATGGAAGGTGATGAAGAGACCAGGGAGGCTTATGCCAATATCGCGGAACTGGACCAGTATGTCTTCCAGGACTCCCAGCTGGAGGGCCTGAGCAAGGACATTTTCAAGCACATAGGACCAGATGAAGTGATCGGTGAGAGTATGGAGATGCCAGCAGAAGTTGGGCAGAAAAGTCAGAAAAGACCCTTCCCAGAGGAGCTTCCGGCAGACCTGAAGCACTGGAAGCCAGCTGAGCCCCCCACTGTGGTGACTGGCAGTCTCCTAGTGGGACCAGTGAGCGACTGCTCCACCCTGCCCTGCCTGCCACTGCCTGCGCTGTTCAACCAGGAGCCAGCCTCCGGCCAGATGCGCCTGGAGAAAACCGACCAGATTCCCATGCCTTTCTCCAGTTCCTCGTTGAGCTGCCTGAATCTCCCTGAGGGACCCATCCAGTTTGTCCCCACCATCTCCACTCTGCCCCATGGGCTCTGGCAAATCTCTGAGGCTGGAACAGGGGTCTCCAGTATATTCATCTACCATGGTGAGGTGCCCCAGGCCAGCCAAGTACCCCCTCCCAGTGGATTCACTGTCCACGGCCTCCCAACATCTCCAGACCGGCCAGGCTCCACCAGCCCCTTCGCTCCATCAGCCACTGACCTGCCCAGCATGCCTGAACCTGCCCTGACCTCCCGAGCAAACATGACAGAGCACAAGACGTCCCCCACCCAATGCCCGGCAGCTGGAGAGGTCTCCAACAAGCTTCCAAAATGGCCTGAGCCGGTGGAGCAGTTCTACCGCTCACTGCAGGACACGTATGGTGCCGAGCCCGCAGGCCCGGATGGCATCCTAGTGGAGGTGGATCTGGTGCAGGCCAGGCTGGAGAGGAGCAGCAGCAAGAGCCTGGAGCGGGAACTGGCCACCCCGGACTGGGCAGAACGGCAGCTGGCCCAAGGAGGCCTGGCTGAGGTGCTGTTGGCTGCCAAGGAGCACCGGCGGCCGCGTGAGACACGAGTGATTGCTGTGCTGGGCAAAGCTGGTCAGGGCAAGAGCTATTGGGCTGGGGCAGTGAGCCGGGCCTGGGCTTGTGGCCGGCTTCCCCAGTACGACTTTGTCTTCTCTGTCCCCTGCCATTGCTTGAACCGTCCGGGGGATGCCTATGGCCTGCAGGATCTGCTCTTCTCCCTGGGCCCACAGCCACTCGTGGCGGCCGATGAGGTTTTCAGCCACATCTTGAAGAGACCTGACCGCGTTCTGCTCATCCTAGACGGCTTCGAGGAGCTGGAAGCGCAAGATGGCTTCCTGCACAGCACGTGCGGACCGGCACCGGCGGAGCCCTGCTCCCTCCGGGGGCTGCTGGCCGGCCTTTTCCAGAAGAAGCTGCTCCGAGGTTGCACCCTCCTCCTCACAGCCCGGCCCCGGGGCCGCCTGGTCCAGAGCCTGAGCAAGGCCGACGCCCTATTTGAGCTGTCCGGCTTCTCCATGGAGCAGGCCCAGGCATACGTGATGCGCTACTTTGAGAGCTCAGGGATGACAGAGCACCAAGACAGAGCCCTGACGCTCCTCCGGGACCGGCCACTTCTTCTCAGTCACAGCCACAGCCCTACTTTGTGCCGGGCAGTGTGCCAGCTCTCAGAGGCCCTGCTGGAGCTTGGGGAGGACGCCAAGCTGCCCTCCACGCTCACGGGACTCTATGTCGGCCTGCTGGGCCGTGCAGCCCTCGACAGCCCCCCCGGGGCCCTGGCAGAGCTGGCCAAGCTGGCCTGGGAGCTGGGCCGCAGACATCAAAGTACCCTACAGGAGGACCAGTTCCCATCCGCAGACGTGAGGACCTGGGCGATGGCCAAAGGCTTAGTCCAACACCCACCGCGGGCCGCAGAGTCCGAGCTGGCCTTCCCCAGCTTCCTCCTGCAATGCTTCCTGGGGGCCCTGTGGCTGGCTCTGAGTGGCGAAATCAAGGACAAGGAGCTCCCGCAGTACCTAGCATTGACCCCAAGGAAGAAGAGGCCCTATGACAACTGGCTGGAGGGCGTGCCACGCTTTCTGGCTGGGCTGATCTTCCAGCCTCCCGCCCGCTGCCTGGGAGCCCTACTCGGGCCATCGGCGGCTGCCTCGGTGGACAGGAAGCAGAAGGTGCTTGCGAGGTACCTGAAGCGGCTGCAGCCGGGGACACTGCGGGCGCGGCAGCTGCTGGAGCTGCTGCACTGCGCCCACGAGGCCGAGGAGGCTGGAATTTGGCAGCACGTGGTACAGGAGCTCCCCGGCCGCCTCTCTTTTCTGGGCACCCGCCTCACGCCTCCTGATGCACATGTACTGGGCAAGGCCTTGGAGGCGGCGGGCCAAGACTTCTCCCTGGACCTCCGCAGCACTGGCATTTGCCCCTCTGGATTGGGGAGCCTCGTGGGACTCAGCTGTGTCACCCGTTTCAGGGCTGCCTTGAGCGACACGGTGGCGCTGTGGGAGTCCCTGCAGCAGCATGGGGAGACCAAGCTACTTCAGGCAGCAGAGGAGAAGTTCACCATCGAGCCTTTCAAAGCCAAGTCCCTGAAGGATGTGGAAGACCTGGGAAAGCTTGTGCAGACTCAGAGGACGAGAAGTTCCTCGGAAGACACAGCTGGGGAGCTCCCTGCTGTTCGGGACCTAAAGAAACTGGAGTTTGCGCTGGGCCCTGTCTCAGGCCCCCAGGCTTTCCCCAAACTGGTGCGGATCCTCACGGCCTTTTCCTCCCTGCAGCATCTGGACCTGGATGCGCTGAGTGAGAACAAGATCGGGGACGAGGGTGTCTCGCAGCTCTCAGCCACCTTCCCCCAGCTGAAGTCCTTGGAAACCCTCAATCTGTCCCAGAACAACATCACTGACCTGGGTGCCTACAAACTCGCCGAGGCCCTGCCTTCGCTCGCTGCATCCCTGCTCAGGCTAAGCTTGTACAATAACTGCATCTGCGACGTGGGAGCCGAGAGCTTGGCTCGTGTGCTTCCGGACATGGTGTCCCTCCGGGTGATGGACGTCCAGTACAACAAGTTCACGGCTGCCGGGGCCCAGCAGCTCGCTGCCAGCCTTCGGAGGTGTCCTCATGTGGAGACGCTGGCGATGTGGACGCCCACCATCCCATTCAGTGTCCAGGAACACCTGCAACAACAGGATTCACGGATCAGCCTGAGATGA |
CIITA同功型5 cDNA SEQ ID NO: 1203 | ATGCGTTGCCTGGCTCCACGCCCTGCTGGGTCCTACCTGTCAGAGCCCCAAGGCAGCTCACAGTGTGCCACCATGGAGTTGGGGCCCCTAGAAGGTGGCTACCTGGAGCTTCTTAACAGCGATGCTGACCCCCTGTGCCTCTACCACTTCTATGACCAGATGGACCTGGCTGGAGAAGAAGAGATTGAGCTCTACTCAGAACCCGACACAGACACCATCAACTGCGACCAGTTCAGCAGGCTGTTGTGTGACATGGAAGGTGATGAAGAGACCAGGGAGGCTTATGCCAATATCGCGGAACTGGACCAGTATGTCTTCCAGGACTCCCAGCTGGAGGGCCTGAGCAAGGACATTTTCAAGCACATAGGACCAGATGAAGTGATCGGTGAGAGTATGGAGATGCCAGCAGAAGTTGGGCAGAAAAGTCAGAAAAGACCCTTCCCAGAGGAGCTTCCGGCAGACCTGAAGCACTGGAAGCCAGTGCCTTTCTCCAGTTCCTCGTTGAGCTGCCTGAATCTCCCTGAGGGACCCATCCAGTTTGTCCCCACCATCTCCACTCTGCCCCATGGGCTCTGGCAAATCTCTGAGGCTGGAACAGGGGTCTCCAGTATATTCATCTACCATGGTGAGGTGCCCCAGGCCAGCCAAGTACCCCCTCCCAGTGGATTCACTGTCCACGGCCTCCCAACATCTCCAGACCGGCCAGGCTCCACCAGCCCCTTCGCTCCATCAGCCACTGACCTGCCCAGCATGCCTGAACCTGCCCTGACCTCCCGAGCAAACATGACAGAGCACAAGACGTCCCCCACCCAATGCCCGGCAGCTGGAGAGGTCTCCAACAAGCTTCCAAAATGGCCTGAGCCGGTGGAGCAGTTCTACCGCTCACTGCAGGACACGTATGGTGCCGAGCCCGCAGGCCCGGATGGCATCCTAGTGGAGGTGGATCTGGTGCAGGCCAGGCTGGAGAGGAGCAGCAGCAAGAGCCTGGAGCGGGAACTGGCCACCCCGGACTGGGCAGAACGGCAGCTGGCCCAAGGAGGCCTGGCTGAGGTGCTGTTGGCTGCCAAGGAGCACCGGCGGCCGCGTGAGACACGAGTGATTGCTGTGCTGGGCAAAGCTGGTCAGGGCAAGAGCTATTGGGCTGGGGCAGTGAGCCGGGCCTGGGCTTGTGGCCGGCTTCCCCAGTACGACTTTGTCTTCTCTGTCCCCTGCCATTGCTTGAACCGTCCGGGGGATGCCTATGGCCTGCAGGATCTGCTCTTCTCCCTGGGCCCACAGCCACTCGTGGCGGCCGATGAGGTTTTCAGCCACATCTTGAAGAGACCTGACCGCGTTCTGCTCATCCTAGACGGCTTCGAGGAGCTGGAAGCGCAAGATGGCTTCCTGCACAGCACGTGCGGACCGGCACCGGCGGAGCCCTGCTCCCTCCGGGGGCTGCTGGCCGGCCTTTTCCAGAAGAAGCTGCTCCGAGGTTGCACCCTCCTCCTCACAGCCCGGCCCCGGGGCCGCCTGGTCCAGAGCCTGAGCAAGGCCGACGCCCTATTTGAGCTGTCCGGCTTCTCCATGGAGCAGGCCCAGGCATACGTGATGCGCTACTTTGAGAGCTCAGGGATGACAGAGCACCAAGACAGAGCCCTGACGCTCCTCCGGGACCGGCCACTTCTTCTCAGTCACAGCCACAGCCCTACTTTGTGCCGGGCAGTGTGCCAGCTCTCAGAGGCCCTGCTGGAGCTTGGGGAGGACGCCAAGCTGCCCTCCACGCTCACGGGACTCTATGTCGGCCTGCTGGGCCGTGCAGCCCTCGACAGCCCCCCCGGGGCCCTGGCAGAGCTGGCCAAGCTGGCCTGGGAGCTGGGCCGCAGACATCAAAGTACCCTACAGGAGGACCAGTTCCCATCCGCAGACGTGAGGACCTGGGCGATGGCCAAAGGCTTAGTCCAACACCCACCGCGGGCCGCAGAGTCCGAGCTGGCCTTCCCCAGCTTCCTCCTGCAATGCTTCCTGGGGGCCCTGTGGCTGGCTCTGAGTGGCGAAATCAAGGACAAGGAGCTCCCGCAGTACCTAGCATTGACCCCAAGGAAGAAGAGGCCCTATGACAACTGGCTGGAGGGCGTGCCACGCTTTCTGGCTGGGCTGATCTTCCAGCCTCCCGCCCGCTGCCTGGGAGCCCTACTCGGGCCATCGGCGGCTGCCTCGGTGGACAGGAAGCAGAAGGTGCTTGCGAGGTACCTGAAGCGGCTGCAGCCGGGGACACTGCGGGCGCGGCAGCTGCTGGAGCTGCTGCACTGCGCCCACGAGGCCGAGGAGGCTGGAATTTGGCAGCACGTGGTACAGGAGCTCCCCGGCCGCCTCTCTTTTCTGGGCACCCGCCTCACGCCTCCTGATGCACATGTACTGGGCAAGGCCTTGGAGGCGGCGGGCCAAGACTTCTCCCTGGACCTCCGCAGCACTGGCATTTGCCCCTCTGGATTGGGGAGCCTCGTGGGACTCAGCTGTGTCACCCGTTTCAGGGCTGCCTTGAGCGACACGGTGGCGCTGTGGGAGTCCCTGCAGCAGCATGGGGAGACCAAGCTACTTCAGGCAGCAGAGGAGAAGTTCACCATCGAGCCTTTCAAAGCCAAGTCCCTGAAGGATGTGGAAGACCTGGGAAAGCTTGTGCAGACTCAGAGGACGAGAAGTTCCTCGGAAGACACAGCTGGGGAGCTCCCTGCTGTTCGGGACCTAAAGAAACTGGAGTTTGCGCTGGGCCCTGTCTCAGGCCCCCAGGCTTTCCCCAAACTGGTGCGGATCCTCACGGCCTTTTCCTCCCTGCAGCATCTGGACCTGGATGCGCTGAGTGAGAACAAGATCGGGGACGAGGGTGTCTCGCAGCTCTCAGCCACCTTCCCCCAGCTGAAGTCCTTGGAAACCCTCAATCTGTCCCAGAACAACATCACTGACCTGGGTGCCTACAAACTCGCCGAGGCCCTGCCTTCGCTCGCTGCATCCCTGCTCAGGCTAAGCTTGTACAATAACTGCATCTGCGACGTGGGAGCCGAGAGCTTGGCTCGTGTGCTTCCGGACATGGTGTCCCTCCGGGTGATGGACGTCCAGTACAACAAGTTCACGGCTGCCGGGGCCCAGCAGCTCGCTGCCAGCCTTCGGAGGTGTCCTCATGTGGAGACGCTGGCGATGTGGACGCCCACCATCCCATTCAGTGTCCAGGAACACCTGCAACAACAGGATTCACGGATCAGCCTGAGATGA |
CIITA同功型3 cDNA SEQ ID NO: 1204 | ATGCGTTGCCTGGCTCCACGCCCTGCTGGGTCCTACCTGTCAGAGCCCCAAGGCAGCTCACAGTGTGCCACCATGGAGTTGGGGCCCCTAGAAGGTGGCTACCTGGAGCTTCTTAACAGCGATGCTGACCCCCTGTGCCTCTACCACTTCTATGACCAGATGGACCTGGCTGGAGAAGAAGAGATTGAGCTCTACTCAGAACCCGACACAGACACCATCAACTGCGACCAGTTCAGCAGGCTGTTGTGTGACATGGAAGGTGATGAAGAGACCAGGGAGGCTTATGCCAATATCGCGGAACTGGACCAGTATGTCTTCCAGGACTCCCAGCTGGAGGGCCTGAGCAAGGACATTTTCAAGCACATAGGACCAGATGAAGTGATCGGTGAGAGTATGGAGATGCCAGCAGAAGTTGGGCAGAAAAGTCAGAAAAGACCCTTCCCAGAGGAGCTTCCGGCAGACCTGAAGCACTGGAAGCCAGTGCCTTTCTCCAGTTCCTCGTTGAGCTGCCTGAATCTCCCTGAGGGACCCATCCAGTTTGTCCCCACCATCTCCACTCTGCCCCATGGGCTCTGGCAAATCTCTGAGGCTGGAACAGGGGTCTCCAGTATATTCATCTACCATGGTGAGGTGCCCCAGGCCAGCCAAGTACCCCCTCCCAGTGGATTCACTGTCCACGGCCTCCCAACATCTCCAGACCGGCCAGGCTCCACCAGCCCCTTCGCTCCATCAGCCACTGACCTGCCCAGCATGCCTGAACCTGCCCTGACCTCCCGAGCAAACATGACAGAGCACAAGACGTCCCCCACCCAATGCCCGGCAGCTGGAGAGGTCTCCAACAAGCTTCCAAAATGGCCTGGTCTAGCCTGGTCACCGTGCCTGGGTCTGAGGCCCTCCCTCCACAGGGCTGCCTTGAGCGACACGGTGGCGCTGTGGGAGTCCCTGCAGCAGCATGGGGAGACCAAGCTACTTCAGGCAGCAGAGGAGAAGTTCACCATCGAGCCTTTCAAAGCCAAGTCCCTGAAGGATGTGGAAGACCTGGGAAAGCTTGTGCAGACTCAGAGGACGAGAAGTTCCTCGGAAGACACAGCTGGGGAGCTCCCTGCTGTTCGGGACCTAAAGAAACTGGAGTTTGCGCTGGGCCCTGTCTCAGGCCCCCAGGCTTTCCCCAAACTGGTGCGGATCCTCACGGCCTTTTCCTCCCTGCAGCATCTGGACCTGGATGCGCTGAGTGAGAACAAGATCGGGGACGAGGGTGTCTCGCAGCTCTCAGCCACCTTCCCCCAGCTGAAGTCCTTGGAAACCCTCAATCTGTCCCAGAACAACATCACTGACCTGGGTGCCTACAAACTCGCCGAGGCCCTGCCTTCGCTCGCTGCATCCCTGCTCAGGCTAAGCTTGTACAATAACTGCATCTGCGACGTGGGAGCCGAGAGCTTGGCTCGTGTGCTTCCGGACATGGTGTCCCTCCGGGTGATGGACGTCCAGTACAACAAGTTCACGGCTGCCGGGGCCCAGCAGCTCGCTGCCAGCCTTCGGAGGTGTCCTCATGTGGAGACGCTGGCGATGTGGACGCCCACCATCCCATTCAGTGTCCAGGAACACCTGCAACAACAGGATTCACGGATCAGCCTGAGATGA |
CIITA同功型X8 cDNA SEQ ID NO: 1205 | ATGACCAGCGGACGAGCTGCCACAGACTTGCCGCGGCCCCAGAGCTGGCGGGAGGGAGAGGCCACCAGCAGCGCGCGCGGGAGCCCGGGGAACAGCGGCAGCTCACAGTGTGCCACCATGGAGTTGGGGCCCCTAGAAGGTGGCTACCTGGAGCTTCTTAACAGCGATGCTGACCCCCTGTGCCTCTACCACTTCTATGACCAGATGGACCTGGCTGGAGAAGAAGAGATTGAGCTCTACTCAGAACCCGACACAGACACCATCAACTGCGACCAGTTCAGCAGGCTGTTGTGTGACATGGAAGGTGATGAAGAGACCAGGGAGGCTTATGCCAATATCGCGGAACTGGACCAGTATGTCTTCCAGGACTCCCAGCTGGAGGGCCTGAGCAAGGACATTTTCAAGCACATAGGACCAGATGAAGTGATCGGTGAGAGTATGGAGATGCCAGCAGAAGTTGGGCAGAAAAGTCAGAAAAGACCCTTCCCAGAGGAGCTTCCGGCAGACCTGAAGCACTGGAAGCCAGCTGAGCCCCCCACTGTGGTGACTGGCAGTCTCCTAGTGGGACCAGTGAGCGACTGCTCCACCCTGCCCTGCCTGCCACTGCCTGCGCTGTTCAACCAGGAGCCAGCCTCCGGCCAGATGCGCCTGGAGAAAACCGACCAGATTCCCATGCCTTTCTCCAGTTCCTCGTTGAGCTGCCTGAATCTCCCTGAGGGACCCATCCAGTTTGTCCCCACCATCTCCACTCTGCCCCATGGGCTCTGGCAAATCTCTGAGGCTGGAACAGGGGTCTCCAGTATATTCATCTACCATGGTGAGGTGCCCCAGGCCAGCCAAGTACCCCCTCCCAGTGGATTCACTGTCCACGGCCTCCCAACATCTCCAGACCGGCCAGGCTCCACCAGCCCCTTCGCTCCATCAGCCACTGACCTGCCCAGCATGCCTGAACCTGCCCTGACCTCCCGAGCAAACATGACAGAGCACAAGACGTCCCCCACCCAATGCCCGGCAGCTGGAGAGGTCTCCAACAAGCTTCCAAAATGGCCTGAGCCGGTGGAGCAGTTCTACCGCTCACTGCAGGACACGTATGGTGCCGAGCCCGCAGGCCCGGATGGCATCCTAGTGGAGGTGGATCTGGTGCAGGCCAGGCTGGAGAGGAGCAGCAGCAAGAGCCTGGAGCGGGAACTGGCCACCCCGGACTGGGCAGAACGGCAGCTGGCCCAAGGAGGCCTGGCTGAGGTGCTGTTGGCTGCCAAGGAGCACCGGCGGCCGCGTGAGACACGAGTGATTGCTGTGCTGGGCAAAGCTGGTCAGGGCAAGAGCTATTGGGCTGGGGCAGTGAGCCGGGCCTGGGCTTGTGGCCGGCTTCCCCAGTACGACTTTGTCTTCTCTGTCCCCTGCCATTGCTTGAACCGTCCGGGGGATGCCTATGGCCTGCAGGATCTGCTCTTCTCCCTGGGCCCACAGCCACTCGTGGCGGCCGATGAGGTTTTCAGCCACATCTTGAAGAGACCTGACCGCGTTCTGCTCATCCTAGACGGCTTCGAGGAGCTGGAAGCGCAAGATGGCTTCCTGCACAGCACGTGCGGACCGGCACCGGCGGAGCCCTGCTCCCTCCGGGGGCTGCTGGCCGGCCTTTTCCAGAAGAAGCTGCTCCGAGGTTGCACCCTCCTCCTCACAGCCCGGCCCCGGGGCCGCCTGGTCCAGAGCCTGAGCAAGGCCGACGCCCTATTTGAGCTGTCCGGCTTCTCCATGGAGCAGGCCCAGGCATACGTGATGCGCTACTTTGAGAGCTCAGGGATGACAGAGCACCAAGACAGAGCCCTGACGCTCCTCCGGGACCGGCCACTTCTTCTCAGTCACAGCCACAGCCCTACTTTGTGCCGGGCAGTGTGCCAGCTCTCAGAGGCCCTGCTGGAGCTTGGGGAGGACGCCAAGCTGCCCTCCACGCTCACGGGACTCTATGTCGGCCTGCTGGGCCGTGCAGCCCTCGACAGCCCCCCCGGGGCCCTGGCAGAGCTGGCCAAGCTGGCCTGGGAGCTGGGCCGCAGACATCAAAGTACCCTACAGGAGGACCAGTTCCCATCCGCAGACGTGAGGACCTGGGCGATGGCCAAAGGCTTAGTCCAACACCCACCGCGGGCCGCAGAGTCCGAGCTGGCCTTCCCCAGCTTCCTCCTGCAATGCTTCCTGGGGGCCCTGTGGCTGGCTCTGAGTGGCGAAATCAAGGACAAGGAGCTCCCGCAGTACCTAGCATTGACCCCAAGGAAGAAGAGGCCCTATGACAACTGGCTGGAGGGCGTGCCACGCTTTCTGGCTGGGCTGATCTTCCAGCCTCCCGCCCGCTGCCTGGGAGCCCTACTCGGGCCATCGGCGGCTGCCTCGGTGGACAGGAAGCAGAAGGTGCTTGCGAGGTACCTGAAGCGGCTGCAGCCGGGGACACTGCGGGCGCGGCAGCTGCTGGAGCTGCTGCACTGCGCCCACGAGGCCGAGGAGGCTGGAATTTGGCAGCACGTGGTACAGGAGCTCCCCGGCCGCCTCTCTTTTCTGGGCACCCGCCTCACGCCTCCTGATGCACATGTACTGGGCAAGGCCTTGGAGGCGGCGGGCCAAGACTTCTCCCTGGACCTCCGCAGCACTGGCATTTGCCCCTCTGGATTGGGGAGCCTCGTGGGACTCAGCTGTGTCACCCGTTTCAGGGCTGCCTTGAGCGACACGGTGGCGCTGTGGGAGTCCCTGCAGCAGCATGGGGAGACCAAGCTACTTCAGGCAGCAGAGGAGAAGTTCACCATCGAGCCTTTCAAAGCCAAGTCCCTGAAGGATGTGGAAGACCTGGGAAAGCTTGTGCAGACTCAGAGGACGAGAAGTTCCTCGGAAGACACAGCTGGGGAGCTCCCTGCTGTTCGGGACCTAAAGAAACTGGAGTTTGCGCTGGGCCCTGTCTCAGGCCCCCAGGCTTTCCCCAAACTGGTGCGGATCCTCACGGCCTTTTCCTCCCTGCAGCATCTGGACCTGGATGCGCTGAGTGAGAACAAGATCGGGGACGAGGGTGTCTCGCAGCTCTCAGCCACCTTCCCCCAGCTGAAGTCCTTGGAAACCCTCAATCTGTCCCAGAACAACATCACTGACCTGGGTGCCTACAAACTCGCCGAGGCCCTGCCTTCGCTCGCTGCATCCCTGCTCAGGCTAAGCTTGTACAATAACTGCATCTGCGACGTGGGAGCCGAGAGCTTGGCTCGTGTGCTTCCGGACATGGTGTCCCTCCGGGTGATGGACGTCCAGTACAACAAGTTCACGGCTGCCGGGGCCCAGCAGCTCGCTGCCAGCCTTCGGAGGTGTCCTCATGTGGAGACGCTGGCGATGTGGACGCCCACCATCCCATTCAGTGTCCAGGAACACCTGCAACAACAGGATTCACGGATCAGCCTGAGATGA |
CIITA同功型6 cDNA SEQ ID NO: 1206 | ATGGAGTTGGGGCCCCTAGAAGGTGGCTACCTGGAGCTTCTTAACAGCGATGCTGACCCCCTGTGCCTCTACCACTTCTATGACCAGATGGACCTGGCTGGAGAAGAAGAGATTGAGCTCTACTCAGAACCCGACACAGACACCATCAACTGCGACCAGTTCAGCAGGCTGTTGTGTGACATGGAAGGTGATGAAGAGACCAGGGAGGCTTATGCCAATATCGCGGAACTGGACCAGTATGTCTTCCAGGACTCCCAGCTGGAGGGCCTGAGCAAGGACATTTTCATAGAGCACATAGGACCAGATGAAGTGATCGGTGAGAGTATGGAGATGCCAGCAGAAGTTGGGCAGAAAAGTCAGAAAAGACCCTTCCCAGAGGAGCTTCCGGCAGACCTGAAGCACTGGAAGCCAGCTGAGCCCCCCACTGTGGTGACTGGCAGTCTCCTAGTGGGACCAGTGAGCGACTGCTCCACCCTGCCCTGCCTGCCACTGCCTGCGCTGTTCAACCAGGAGCCAGCCTCCGGCCAGATGCGCCTGGAGAAAACCGACCAGATTCCCATGCCTTTCTCCAGTTCCTCGTTGAGCTGCCTGAATCTCCCTGAGGGACCCATCCAGTTTGTCCCCACCATCTCCACTCTGCCCCATGGGCTCTGGCAAATCTCTGAGGCTGGAACAGGGGTCTCCAGTATATTCATCTACCATGGTGAGGTGCCCCAGGCCAGCCAAGTACCCCCTCCCAGTGGATTCACTGTCCACGGCCTCCCAACATCTCCAGACCGGCCAGGCTCCACCAGCCCCTTCGCTCCATCAGCCACTGACCTGCCCAGCATGCCTGAACCTGCCCTGACCTCCCGAGCAAACATGACAGAGCACAAGACGTCCCCCACCCAATGCCCGGCAGCTGGAGAGGTCTCCAACAAGCTTCCAAAATGGCCTGAGCCGGTGGAGCAGTTCTACCGCTCACTGCAGGACACGTATGGTGCCGAGCCCGCAGGCCCGGATGGCATCCTAGTGGAGGTGGATCTGGTGCAGGCCAGGCTGGAGAGGAGCAGCAGCAAGAGCCTGGAGCGGGAACTGGCCACCCCGGACTGGGCAGAACGGCAGCTGGCCCAAGGAGGCCTGGCTGAGGTGCTGTTGGCTGCCAAGGAGCACCGGCGGCCGCGTGAGACACGAGTGATTGCTGTGCTGGGCAAAGCTGGTCAGGGCAAGAGCTATTGGGCTGGGGCAGTGAGCCGGGCCTGGGCTTGTGGCCGGCTTCCCCAGTACGACTTTGTCTTCTCTGTCCCCTGCCATTGCTTGAACCGTCCGGGGGATGCCTATGGCCTGCAGGATCTGCTCTTCTCCCTGGGCCCACAGCCACTCGTGGCGGCCGATGAGGTTTTCAGCCACATCTTGAAGAGACCTGACCGCGTTCTGCTCATCCTAGACGGCTTCGAGGAGCTGGAAGCGCAAGATGGCTTCCTGCACAGCACGTGCGGACCGGCACCGGCGGAGCCCTGCTCCCTCCGGGGGCTGCTGGCCGGCCTTTTCCAGAAGAAGCTGCTCCGAGGTTGCACCCTCCTCCTCACAGCCCGGCCCCGGGGCCGCCTGGTCCAGAGCCTGAGCAAGGCCGACGCCCTATTTGAGCTGTCCGGCTTCTCCATGGAGCAGGCCCAGGCATACGTGATGCGCTACTTTGAGAGCTCAGGGATGACAGAGCACCAAGACAGAGCCCTGACGCTCCTCCGGGACCGGCCACTTCTTCTCAGTCACAGCCACAGCCCTACTTTGTGCCGGGCAGTGTGCCAGCTCTCAGAGGCCCTGCTGGAGCTTGGGGAGGACGCCAAGCTGCCCTCCACGCTCACGGGACTCTATGTCGGCCTGCTGGGCCGTGCAGCCCTCGACAGCCCCCCCGGGGCCCTGGCAGAGCTGGCCAAGCTGGCCTGGGAGCTGGGCCGCAGACATCAAAGTACCCTACAGGAGGACCAGTTCCCATCCGCAGACGTGAGGACCTGGGCGATGGCCAAAGGCTTAGTCCAACACCCACCGCGGGCCGCAGAGTCCGAGCTGGCCTTCCCCAGCTTCCTCCTGCAATGCTTCCTGGGGGCCCTGTGGCTGGCTCTGAGTGGCGAAATCAAGGACAAGGAGCTCCCGCAGTACCTAGCATTGACCCCAAGGAAGAAGAGGCCCTATGACAACTGGCTGGAGGGCGTGCCACGCTTTCTGGCTGGGCTGATCTTCCAGCCTCCCGCCCGCTGCCTGGGAGCCCTACTCGGGCCATCGGCGGCTGCCTCGGTGGACAGGAAGCAGAAGGTGCTTGCGAGGTACCTGAAGCGGCTGCAGCCGGGGACACTGCGGGCGCGGCAGCTGCTGGAGCTGCTGCACTGCGCCCACGAGGCCGAGGAGGCTGGAATTTGGCAGCACGTGGTACAGGAGCTCCCCGGCCGCCTCTCTTTTCTGGGCACCCGCCTCACGCCTCCTGATGCACATGTACTGGGCAAGGCCTTGGAGGCGGCGGGCCAAGACTTCTCCCTGGACCTCCGCAGCACTGGCATTTGCCCCTCTGGATTGGGGAGCCTCGTGGGACTCAGCTGTGTCACCCGTTTCAGGGCTGCCTTGAGCGACACGGTGGCGCTGTGGGAGTCCCTGCAGCAGCATGGGGAGACCAAGCTACTTCAGGCAGCAGAGGAGAAGTTCACCATCGAGCCTTTCAAAGCCAAGTCCCTGAAGGATGTGGAAGACCTGGGAAAGCTTGTGCAGACTCAGAGGACGAGAAGTTCCTCGGAAGACACAGCTGGGGAGCTCCCTGCTGTTCGGGACCTAAAGAAACTGGAGTTTGCGCTGGGCCCTGTCTCAGGCCCCCAGGCTTTCCCCAAACTGGTGCGGATCCTCACGGCCTTTTCCTCCCTGCAGCATCTGGACCTGGATGCGCTGAGTGAGAACAAGATCGGGGACGAGGGTGTCTCGCAGCTCTCAGCCACCTTCCCCCAGCTGAAGTCCTTGGAAACCCTCAATCTGTCCCAGAACAACATCACTGACCTGGGTGCCTACAAACTCGCCGAGGCCCTGCCTTCGCTCGCTGCATCCCTGCTCAGGCTAAGCTTGTACAATAACTGCATCTGCGACGTGGGAGCCGAGAGCTTGGCTCGTGTGCTTCCGGACATGGTGTCCCTCCGGGTGATGGACGTCCAGTACAACAAGTTCACGGCTGCCGGGGCCCAGCAGCTCGCTGCCAGCCTTCGGAGGTGTCCTCATGTGGAGACGCTGGCGATGTGGACGCCCACCATCCCATTCAGTGTCCAGGAACACCTGCAACAACAGGATTCACGGATCAGCCTGAGATGA |
圖 1顯示使用Cas12i2,十五個CIITA目標序列(T1-T16)中誘導之原始***或缺失之百分比(%)。如實例1中進一步詳述,HEK293T細胞用Cas12i2質體以及靶向CIITA之RNA引導轉染,導致外顯子1、外顯子2、外顯子3及外顯子4中CIITA目標之編輯。
圖 2顯示使用變異Cas12i2核糖核蛋白(RNP),若干CIITA目標序列(T1、T4、T5、T12及T14)中誘導之原始***或缺失之百分比(%)。如實例2中進一步詳述,T細胞用靶向CIITA之Cas12i2 RNP轉染,導致外顯子1、外顯子2及外顯子3中CIITA目標之編輯。
TW202334421A_111142267_SEQL.xml
Claims (61)
- 一種包含RNA引導之組合物,其中該RNA引導包含: (i)特異性結合CIITA基因內之目標序列之間隔子序列,其中該目標序列包含SEQ ID NO: 1163、1166、1167、1173、1175、1164、1165、1168至1172、1174、1176或1177中之任一者;及 (ii)正向重複序列。
- 如請求項1之組合物,其中該目標序列包含SEQ ID NO: 1163、1166、1167、1173或1175中之任一者。
- 如請求項1或2之組合物,其中該間隔子序列與SEQ ID NO: 1207至1221中任一者之序列至少90%一致。
- 如前述請求項中任一項之組合物,其中該間隔子序列與SEQ ID NO: 1207、1210、1211、1217或1219中任一者之序列至少90%一致。
- 如前述請求項中任一項之組合物,其中該間隔子序列之長度介於15至30個核苷酸之間或介於20至30個核苷酸之間。
- 如前述請求項中任一項之組合物,其中該間隔子序列包含: a. 與SEQ ID NO: 752、815、802、821及824中任一者之序列至少90%一致之序列的核苷酸1至核苷酸16; b. 與SEQ ID NO: 752、815、802、821及824中任一者之序列至少90%一致之序列的核苷酸1至核苷酸17; c. 與SEQ ID NO: 752、815、802、821及824中任一者之序列至少90%一致之序列的核苷酸1至核苷酸18; d. 與SEQ ID NO: 752、815、802、821及824中任一者之序列至少90%一致之序列的核苷酸1至核苷酸19;或 e. 與SEQ ID NO: 752、815、802、821及824中任一者之序列至少90%一致之序列的核苷酸1至核苷酸20。
- 如前述請求項中任一項之組合物,其中該間隔子序列包含: a. SEQ ID NO: 752、815、802、821及824中任一者之核苷酸1至核苷酸16; b. SEQ ID NO: 752、815、802、821及824中任一者之核苷酸1至核苷酸17; c. SEQ ID NO: 752、815、802、821及824中任一者之核苷酸1至核苷酸18; d. SEQ ID NO: 752、815、802、821及824中任一者之核苷酸1至核苷酸19;或 e. SEQ ID NO: 752、815、802、821及824中任一者之核苷酸1至核苷酸20。
- 如前述請求項中任一項之組合物,其中該正向重複序列具有介於15至40或23至36個核苷酸之間的長度。
- 如前述請求項中任一項之組合物,其中該正向重複序列為Cas12i1正向重複序列、Cas12i2正向重複序列、Cas12i3正向重複序列或Cas12i4正向重複序列。
- 如前述請求項中任一項之組合物,其中該正向重複序列包含: a. 與SEQ ID NO: 1至8中任一者之序列至少90%一致之序列的核苷酸1至核苷酸36; b. 與SEQ ID NO: 1至8中之任一者之序列至少90%一致之序列的核苷酸2至核苷酸36; c. 與SEQ ID NO: 1至8中之任一者之序列至少90%一致之序列的核苷酸3至核苷酸36; d. 與SEQ ID NO: 1至8中之任一者之序列至少90%一致之序列的核苷酸4至核苷酸36; e. 與SEQ ID NO: 1至8中之任一者之序列至少90%一致之序列的核苷酸5至核苷酸36; f. 與SEQ ID NO: 1至8中之任一者之序列至少90%一致之序列的核苷酸6至核苷酸36; g. 與SEQ ID NO: 1至8中之任一者之序列至少90%一致之序列的核苷酸7至核苷酸36; h. 與SEQ ID NO: 1至8中之任一者之序列至少90%一致之序列的核苷酸8至核苷酸36; i. 與SEQ ID NO: 1至8中之任一者之序列至少90%一致之序列的核苷酸9至核苷酸36; j. 與SEQ ID NO: 1至8中之任一者之序列至少90%一致之序列的核苷酸10至核苷酸36; k. 與SEQ ID NO: 1至8中之任一者之序列至少90%一致之序列的核苷酸11至核苷酸36; l. 與SEQ ID NO: 1至8中之任一者之序列至少90%一致之序列的核苷酸12至核苷酸36; m. 與SEQ ID NO: 1至8中之任一者之序列至少90%一致之序列的核苷酸13至核苷酸36; n. 與SEQ ID NO: 1至8中之任一者之序列至少90%一致之序列的核苷酸14至核苷酸36; o. 與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸1至核苷酸34; p. 與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸2至核苷酸34; q. 與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸3至核苷酸34; r. 與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸4至核苷酸34; s. 與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸5至核苷酸34; t. 與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸6至核苷酸34; u. 與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸7至核苷酸34; v. 與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸8至核苷酸34; w. 與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸9至核苷酸34; x. 與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸10至核苷酸34; y. 與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸11至核苷酸34; z. 與SEQ ID NO: 9之序列至少90%一致之序列的核苷酸12至核苷酸34;或 aa. 與SEQ ID NO: 10之序列或其部分至少90%一致之序列。
- 如前述請求項中任一項之組合物,其中該正向重複序列包含: a. SEQ ID NO: 1至8中之任一者之核苷酸1至核苷酸36; b. SEQ ID NO: 1至8中之任一者之核苷酸2至核苷酸36; c. SEQ ID NO: 1至8中之任一者之核苷酸3至核苷酸36; d. SEQ ID NO: 1至8中之任一者之核苷酸4至核苷酸36; e. SEQ ID NO: 1至8中之任一者之核苷酸5至核苷酸36; f. SEQ ID NO: 1至8中之任一者之核苷酸6至核苷酸36; g. SEQ ID NO: 1至8中之任一者之核苷酸7至核苷酸36; h. SEQ ID NO: 1至8中之任一者之核苷酸8至核苷酸36; i. SEQ ID NO: 1至8中之任一者之核苷酸9至核苷酸36; j. SEQ ID NO: 1至8中之任一者之核苷酸10至核苷酸36; k. SEQ ID NO: 1至8中之任一者之核苷酸11至核苷酸36; l. SEQ ID NO: 1至8中之任一者之核苷酸12至核苷酸36; m. SEQ ID NO: 1至8中之任一者之核苷酸13至核苷酸36; n. SEQ ID NO: 1至8中之任一者之核苷酸14至核苷酸36; o. SEQ ID NO: 9之核苷酸1至核苷酸34; p. SEQ ID NO: 9之核苷酸2至核苷酸34; q. SEQ ID NO: 9之核苷酸3至核苷酸34; r. SEQ ID NO: 9之核苷酸4至核苷酸34; s. SEQ ID NO: 9之核苷酸5至核苷酸34; t. SEQ ID NO: 9之核苷酸6至核苷酸34; u. SEQ ID NO: 9之核苷酸7至核苷酸34; v. SEQ ID NO: 9之核苷酸8至核苷酸34; w. SEQ ID NO: 9之核苷酸9至核苷酸34; x. SEQ ID NO: 9之核苷酸10至核苷酸34; y. SEQ ID NO: 9之核苷酸11至核苷酸34; z. SEQ ID NO: 9之核苷酸12至核苷酸34;或 aa. SEQ ID NO: 10或其部分。
- 如前述請求項中任一項之組合物,其中該目標序列與包含序列5'-NTTN-3'之原間隔序列相鄰模體(protospacer adjacent motif;PAM)相鄰,其中N為任何核苷酸。
- 如請求項12之組合物,其中該目標序列緊鄰該PAM序列。
- 如請求項12之組合物,其中該PAM包含序列5'-ATTA-3'、5'-ATTT-3'、5'-ATTG-3'、5'-ATTC-3'、5'-TTTA-3'、5'-TTTT-3'、5'-TTTG-3'、5'-TTTC-3'、5'-GTTA-3'、5'-GTTT-3'、5'-GTTG-3'、5'-GTTC-3'、5'-CTTA-3'、5'-CTTT-3'、5'-CTTG-3'或5'-CTTC-3'。
- 如請求項12至14中任一項之組合物,其中該PAM包含序列5'-CTTT-3',且該目標序列包含SEQ ID NO: 1163。
- 如請求項12至15中任一項之組合物,其中該PAM包含序列5'-CTTT-3',且該間隔子序列與SEQ ID NO: 1207之序列至少90%一致。
- 如請求項12至16中任一項之組合物,其中該PAM包含序列5'-CTTC-3',且該目標序列包含SEQ ID NO: 1166、1167、1173或1175中之任一者。
- 如請求項12至14或17中任一項之組合物,其中該PAM包含序列5'-CTTC-3',且該間隔子序列與SEQ ID NO: 1210、1211、1217或1219之序列至少90%一致。
- 如前述請求項中任一項之組合物,其中該RNA引導具有與SEQ ID NO: 1178至1192中任一者之序列至少90%一致的序列。
- 如請求項19之組合物,其中該RNA引導具有SEQ ID NO: 1178至1192中任一者的序列。
- 如前述請求項中任一項之組合物,其中該組合物進一步包含Cas12i多肽或編碼Cas12i多肽之聚核糖核苷酸。
- 如請求項21之組合物,其中該Cas12i多肽為Cas12i1多肽、Cas12i2多肽、Cas12i3多肽或Cas12i4多肽。
- 如請求項21或22之組合物,其中該Cas12i多肽為包含與以下之序列至少90%一致之序列的Cas12i2多肽:SEQ ID NO: 1104、SEQ ID NO: 1127、SEQ ID NO: 1128、SEQ ID NO: 1129、SEQ ID NO: 1130或SEQ ID NO: 1131。
- 如請求項21至23中任一項之組合物,其中該Cas12i多肽包含相對於SEQ ID NO: 1104之一或多個突變。
- 如請求項24之組合物,其中該Cas12i多肽中之該一或多個突變係在SEQ ID NO: 1104之位置D581、G624、F626、P868、I926、V1030、E1035及/或S1046。
- 如請求項24或25之組合物,其中該一或多個突變為胺基酸取代,其中視情況該胺基酸取代選自D581R、G624R、F626R、P868T、I926R、V1030G、E1035R、S1046G或其組合。
- 如請求項24至26中任一項之組合物,其中該Cas12i多肽包含: (i)在SEQ ID NO: 1104之位置D581、D911、I926及V1030之突變,其視情況為D581R、D911R、I926R及V1030G之胺基酸取代; (ii)在SEQ ID NO: 1104之位置D581、I926及V1030之突變,其視情況為D581R、I926R及V1030G之胺基酸取代; (iii)在SEQ ID NO: 1104之位置D581、I926、V1030及S1046之突變,其視情況為D581R、I926R、V1030G及S1046G之胺基酸取代; (iv)在SEQ ID NO: 1104之位置D581、G624、F626、I926、V1030、E1035及S1046之突變,其視情況為D581R、G624R、F626R、I926R、V1030G、E1035R及S1046G之胺基酸取代;或 (v)在SEQ ID NO: 1104之位置D581、G624、F626、P868、I926、V1030、E1035及S1046之突變,其視情況為D581R、G624R、F626R、P868T、I926R、V1030G、E1035R及S1046G之胺基酸取代。
- 如請求項21至27中任一項之組合物,其中該RNA引導及該Cas12i多肽形成核糖核蛋白複合物。
- 如請求項28之組合物,其中該核糖核蛋白複合物結合目標核酸。
- 如請求項21至27中任一項之組合物,其包含編碼該Cas12i多肽之該聚核糖核苷酸,其中視情況該聚核糖核苷酸為信使RNA (mRNA)。
- 如請求項21至30中任一項之組合物,其中該組合物存在於細胞內。
- 如請求項21至24中任一項之組合物,其中該RNA引導及該Cas12i多肽係於載體(例如表現載體)中編碼。
- 如請求項32之組合物,其中該RNA引導及該Cas12i多肽係於單一載體中編碼,或該RNA引導於第一載體中編碼而該Cas12i多肽係於第二載體中編碼。
- 一種核酸,其編碼如前述請求項中任一項中所定義之RNA引導。
- 一種載體,其包含如請求項34之核酸。
- 一種系統,其包含:(i)如請求項1至33中任一項中所定義之RNA引導或編碼該RNA引導之核酸,及(ii)Cas12i多肽或編碼該Cas12i多肽之核酸。
- 一種載體系統,其包含一或多種載體,該等載體編碼(i)如請求項1至33中任一項中所定義之RNA引導及(ii)Cas12i多肽,視情況其中該載體系統包含編碼該RNA引導的第一載體及編碼該Cas12i多肽的第二載體。
- 一種醫藥組合物,其包含如前述請求項中任一項之組合物或系統。
- 一種細胞,其包含如請求項1至33中任一項中所定義之組合物或RNA引導、如請求項34之核酸、如請求項35之載體、如請求項36之系統或如請求項37之載體系統。
- 如請求項39之細胞,其中該細胞為真核細胞、動物細胞、哺乳動物細胞、人類細胞、原代細胞、細胞株、幹細胞或T細胞。
- 一種套組,其包含如請求項1至33中任一項之組合物或RNA引導、如請求項34之核酸、如請求項35之載體、如請求項36之系統或如請求項37之載體系統。
- 一種使Cas12i多肽及RNA引導與目標序列結合之方法,該方法包含使該目標序列與如請求項1至33中任一項之組合物、如請求項35之載體、如請求項36之系統或如請求項37之載體系統接觸。
- 如請求項42之方法,其中該組合物包含編碼該Cas12i多肽之該聚核糖核苷酸,且該接觸在該細胞中引起該Cas12i多肽之產生。
- 一種編輯CIITA序列之方法,該方法包含使CIITA序列與如請求項1至33中任一項之組合物或RNA引導接觸。
- 如請求項44之方法,其中該CIITA序列係在細胞中。
- 如請求項45之方法,其中該細胞係在活體外培養。
- 如請求項45或46之方法,其中該接觸步驟係藉由向包含該宿主細胞之個體投與該系統進行。
- 如請求項42至47中任一項之方法,其中該組合物或該RNA引導誘導該CIITA序列中之缺失。
- 如請求項48之方法,其中該缺失與5'-NTTN-3'序列相鄰,其中N為任何核苷酸。
- 如請求項48或49之方法,其中該缺失在該5'-NTTN-3'序列下游。
- 如請求項48至50中任一項之方法,其中該缺失長度長達約50個核苷酸。
- 如請求項48至51中任一項之方法,其中該缺失長度長達約40個核苷酸。
- 如請求項48至52中任一項之方法,其中該缺失長度為約4個核苷酸至40個核苷酸、長度為約4個核苷酸至25個核苷酸、長度為約10個核苷酸至25個核苷酸或長度為約10個核苷酸至15個核苷酸。
- 如請求項48至53中任一項之方法,其中該缺失在以下內開始:該5'-NTTN-3'序列之約5個核苷酸至約15個核苷酸、該5'-NTTN-3'序列之約5個核苷酸至約10個核苷酸、該5'-NTTN-3'序列之約10個核苷酸至約15個核苷酸、該5'-NTTN-3'序列下游之約5個核苷酸至約15個核苷酸、該5'-NTTN-3'序列下游之約5個核苷酸至約10個核苷酸或該5'-NTTN-3'序列下游之約10個核苷酸至約15個核苷酸。
- 如請求項48至54中任一項之方法,其中該缺失在以下內結束:該5'-NTTN-3'序列之約20個核苷酸至約30個核苷酸、該5'-NTTN-3'序列之約20個核苷酸至約25個核苷酸、該5'-NTTN-3'序列之約25個核苷酸至約30個核苷酸、該5'-NTTN-3'序列下游之約20個核苷酸至約30個核苷酸、該5'-NTTN-3'序列下游之約20個核苷酸至約25個核苷酸或該5'-NTTN-3'序列下游之約25個核苷酸至約30個核苷酸。
- 如請求項48至55中任一項之方法,其中該缺失在該5'-NTTN-3'序列下游之5個核苷酸至約15個核苷酸內開始且在該5'-NTTN-3'序列下游之約20個核苷酸至約30個核苷酸內結束、在該5'-NTTN-3'序列下游之約5個核苷酸至約15個核苷酸內開始且在該5'-NTTN-3'序列下游之約20個核苷酸至約25個核苷酸內結束、在該5'-NTTN-3'序列下游之約5個核苷酸至約15個核苷酸內開始且在該5'-NTTN-3'序列下游之約25個核苷酸至約30個核苷酸內結束、在該5'-NTTN-3'序列下游之約5個核苷酸至約10個核苷酸內開始且在該5'-NTTN-3'序列下游之約20個核苷酸至約30個核苷酸內結束、在該5'-NTTN-3'序列下游之約5個核苷酸至約10個核苷酸內開始且在該5'-NTTN-3'序列下游之約20個核苷酸至約25個核苷酸內結束、在該5'-NTTN-3'序列下游之約5個核苷酸至約10個核苷酸內開始且在該5'-NTTN-3'序列下游之約25個核苷酸至約30個核苷酸內結束、在該5'-NTTN-3'序列下游之約10個核苷酸至約15個核苷酸內開始且在該5'-NTTN-3'序列下游之約20個核苷酸至約30個核苷酸內結束、在該5'-NTTN-3'序列下游之約10個核苷酸至約15個核苷酸內開始且在該5'-NTTN-3'序列下游之約20個核苷酸至約25個核苷酸內結束、或在該5'-NTTN-3'序列下游之約10個核苷酸至約15個核苷酸內開始且在該5'-NTTN-3'序列下游之約25個核苷酸至約30個核苷酸內結束。
- 如請求項48至56中任一項之方法,其中該5'-NTTN-3'序列為5'-CTTT-3'、5'-CTTC-3'、5'-GTTT-3'、5'-GTTC-3'、5'-TTTC-3'、5'-GTTA-3'或5'-GTTG-3'。
- 如請求項48至57中任一項之方法,其中該缺失破壞該CIITA序列之一個或兩個等位基因。
- 一種治療個體之疾病或病狀之方法,該方法包含向該個體投與如請求項1至33中任一項之組合物或RNA引導或如請求項39或40之細胞。
- 一種包含RNA引導之組合物,其中該RNA引導包含(i)與CIITA基因內之目標序列實質上互補的間隔子序列及(ii)正向重複序列;其中該目標序列與包含序列5'-NTTN-3'之原間隔序列相鄰模體(PAM)相鄰。
- 一種RNA引導,其包含(i)與CIITA基因內之目標序列實質上互補之間隔子序列及(ii)正向重複序列。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163276229P | 2021-11-05 | 2021-11-05 | |
US63/276,229 | 2021-11-05 | ||
US202163294121P | 2021-12-28 | 2021-12-28 | |
US63/294,121 | 2021-12-28 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW202334421A true TW202334421A (zh) | 2023-09-01 |
Family
ID=86242120
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW111142267A TW202334421A (zh) | 2021-11-05 | 2022-11-04 | 包含靶向ciita之rna引導之組合物及其用途 |
Country Status (2)
Country | Link |
---|---|
TW (1) | TW202334421A (zh) |
WO (1) | WO2023081377A2 (zh) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA3166430A1 (en) * | 2020-02-05 | 2021-08-12 | Ryan T. Gill | Compositions and methods for targeting, editing or modifying human genes |
IL296791A (en) * | 2020-03-31 | 2022-11-01 | Arbor Biotechnologies Inc | Preparations containing a polypeptide variant of cas12i2 and uses thereof |
WO2023039534A2 (en) * | 2021-09-10 | 2023-03-16 | Arbor Biotechnologies, Inc. | Compositions comprising a cas12i polypeptide and uses thereof |
-
2022
- 2022-11-04 TW TW111142267A patent/TW202334421A/zh unknown
- 2022-11-04 WO PCT/US2022/048989 patent/WO2023081377A2/en unknown
Also Published As
Publication number | Publication date |
---|---|
WO2023081377A2 (en) | 2023-05-11 |
WO2023081377A3 (en) | 2023-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TW202317761A (zh) | 包含靶向運甲狀腺素蛋白(ttr)的rna指導物的基因編輯系統及其用途 | |
US20230203539A1 (en) | Gene editing systems comprising an rna guide targeting stathmin 2 (stmn2) and uses thereof | |
US20230407343A1 (en) | Compositions comprising an rna guide targeting pdcd1 and uses thereof | |
TW202334421A (zh) | 包含靶向ciita之rna引導之組合物及其用途 | |
US11821012B2 (en) | Gene editing systems comprising an RNA guide targeting hydroxyacid oxidase 1 (HAO1) and uses thereof | |
US11939607B2 (en) | Gene editing systems comprising an RNA guide targeting lactate dehydrogenase a (LDHA) and uses thereof | |
US20230399639A1 (en) | Compositions comprising an rna guide targeting b2m and uses thereof | |
US20230416732A1 (en) | Compositions comprising an rna guide targeting bcl11a and uses thereof | |
WO2023137451A1 (en) | Compositions comprising an rna guide targeting cd38 and uses thereof | |
CN117813382A (zh) | 包括靶向stathmin 2(stmn2)的rna向导的基因编辑***和其用途 | |
WO2023018856A1 (en) | Gene editing systems comprising an rna guide targeting polypyrimidine tract binding protein 1 (ptbp1) and uses thereof | |
JP2023548588A (ja) | Tracを標的とするrnaガイドを含む組成物及びその使用 | |
WO2022140340A1 (en) | Compositions comprising an rna guide targeting dmd and uses thereof | |
CN116670275A (zh) | 包含靶向pdcd1的rna指导物的组合物及其用途 | |
EP4158020A2 (en) | Compositions comprising a cas12i2 polypeptide and uses thereof | |
CN116648505A (zh) | 包含靶向b2m的rna指导物的组合物及其用途 | |
CN117897485A (zh) | 包括靶向羟基酸氧化酶1(hao1)的rna向导的基因编辑***和其用途 |