TW202317761A - 包含靶向運甲狀腺素蛋白(ttr)的rna指導物的基因編輯系統及其用途 - Google Patents
包含靶向運甲狀腺素蛋白(ttr)的rna指導物的基因編輯系統及其用途 Download PDFInfo
- Publication number
- TW202317761A TW202317761A TW111120920A TW111120920A TW202317761A TW 202317761 A TW202317761 A TW 202317761A TW 111120920 A TW111120920 A TW 111120920A TW 111120920 A TW111120920 A TW 111120920A TW 202317761 A TW202317761 A TW 202317761A
- Authority
- TW
- Taiwan
- Prior art keywords
- seq
- nucleotides
- sequence
- gene
- ttr
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/70—Carbohydrates; Sugars; Derivatives thereof
- A61K31/7088—Compounds having three or more nucleosides or nucleotides
- A61K31/7105—Natural ribonucleic acids, i.e. containing only riboses attached to adenine, guanine, cytosine or uracil and having 3'-5' phosphodiester links
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/43—Enzymes; Proenzymes; Derivatives thereof
- A61K38/46—Hydrolases (3)
- A61K38/465—Hydrolases (3) acting on ester bonds (3.1), e.g. lipases, ribonucleases
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2320/00—Applications; Uses
- C12N2320/30—Special therapeutic applications
- C12N2320/34—Allele or polymorphism specific uses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14311—Parvovirus, e.g. minute virus of mice
- C12N2750/14341—Use of virus, viral particle or viral elements as a vector
- C12N2750/14343—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/80—Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- Organic Chemistry (AREA)
- Biomedical Technology (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Animal Behavior & Ethology (AREA)
- Epidemiology (AREA)
- Pharmacology & Pharmacy (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Immunology (AREA)
- Gastroenterology & Hepatology (AREA)
- Virology (AREA)
- Cell Biology (AREA)
- Mycology (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
揭露了一種用於運甲狀腺素蛋白(TTR)基因的基因編輯的系統,該系統包含 (i) Cas12i2多肽或編碼該Cas12i2多肽的第一核酸;以及 (ii) RNA指導物或編碼該RNA指導物的第二核酸,其中該RNA指導物包含對TTR基因內的靶序列具有特異性的間隔子序列。本文還提供了用於使用本文揭露的基因編輯系統編輯TTR基因和/或用於治療與TTR基因相關的疾病之方法。
Description
相關申請的交叉引用。本申請根據35 U.S.C. § 119(e)要求2021年6月4日提交的美國臨時申請案號63/197,036、2021年9月22日提交的美國臨時申請案號63/247,080、以及2022年3月21日提交的美國臨時申請案號63/321,960的權益,每個文獻的內容藉由援引以其全文併入本文。
序列表。本申請含有已以ASCII格式以電子方式提交且特此藉由援引以其全文併入的序列表。所述ASCII副本創建於2022年6月3日,命名為116928-0034-0002WO00_SEQ.txt,並且大小為203,161位元組。
本發明係關於一種包含靶向運甲狀腺素蛋白(TTR)的RNA指導物的基因編輯系統及其用途。
規律間隔重複短迴文序列簇(CRISPR)和CRISPR相關(Cas)基因(統稱為CRISPR-Cas或CRISPR/Cas系統)係古細菌和細菌中針對外來遺傳元件而防禦特定物種的適應性免疫系統。
本揭露內容至少部分基於用於運甲狀腺素蛋白(TTR)基因的基因編輯的系統的開發。該系統涉及Cas12i CRISPR核酸酶多肽(例如Cas12i2多肽或Cas12i4多肽)和指導RNA(gRNA),該指導RNA介導Cas12i CRISPR核酸酶多肽在TTR基因內的基因位點處的切割。該系統可以進一步涉及模板核酸,可經由同源重組在TTR基因內的基因位點處摻入該模板核酸,進而在該基因位點處將一或多個修飾引入該TTR基因。如本文所報告,本文揭露的基因編輯系統已經實現了TTR基因的成功編輯,具有高編輯效率和準確性。
不受理論的束縛,本文揭露的基因編輯系統可以進一步展現出一或多種以下有利特徵。與SpCas9和Cas12a相比,Cas12i效應子更小(1033至1093 aa),這種特徵連同它們的短成熟crRNA(40-43 nt)在遞送和合成成本方面係較佳的。與Cas9切割誘導的小缺失和+1***相比,Cas12i切割導致較大的缺失。Cas12i PAM序列也不同於Cas9的那些。因此,與Cas9相比,Cas12i多肽和RNA指導物可以破壞目的基因位點的較大部分和不同部分。使用基於標籤化的標籤整合位點定序(TTISS)的無偏方法,與Cas12i2相比,針對SpCas9鑒定出了更多潛在的脫靶位點,該等位點具有更多數目的獨特整合事件。參見 WO/2021/202800。因此,Cas12i2可以比Cas9更有特異性。
因此,本文提供了用於編輯TTR基因的基因編輯系統、包含該等基因編輯系統的藥物組成物或套組(kit)、使用該等基因編輯系統產生經基因修飾的細胞之方法、以及由此產生的所得細胞。本文還提供了本文揭露的基因編輯系統、包含該等基因編輯系統的藥物組成物和套組、和/或由此產生的經基因修飾的細胞用於治療受試者的澱粉樣變運甲狀腺素蛋白(ATTR)之用途。
在一些方面,本揭露內容的特點在於一種用於運甲狀腺素蛋白(TTR)基因的基因編輯的基因編輯系統,該基因編輯系統包含 (i) Cas12i多肽或編碼該Cas12i2多肽的第一核酸,和 (ii) RNA指導物或編碼該RNA指導物的第二核酸。RNA指導物包含對TTR基因內的靶序列具有特異性的間隔子序列,該靶序列與包含5'-TTN-3'模體的原型間隔子相鄰模體(PAM)相鄰,該PAM位於該靶序列的5'。
在一些實施方式中,Cas12i多肽可為Cas12i2多肽。在其他實施方式中,Cas12i多肽可為Cas12i4多肽。
在一些實施方式中,Cas12i多肽係Cas12i2多肽,其包含與SEQ ID NO: 222具有至少95%同一性的胺基酸序列並且相對於SEQ ID NO: 222包含一或多個突變。在一些實施方式中,Cas12i2多肽中的一或多個突變在SEQ ID NO: 222的位置D581、G624、F626、P868、I926、V1030、E1035、和/或S1046處。例如,該一或多個突變係胺基酸取代,例如,D581R、G624R、F626R、P868T、I926R、V1030G、E1035R、S1046G、或其組合。
在一個實例中,Cas12i2多肽在位置D581、D911、I926、和V1030處包含突變(例如,胺基酸取代D581R、D911R、I926R、和V1030G)。在另一實例中,Cas12i2多肽在位置D581、I926、和V1030處包含突變(例如,胺基酸取代D581R、I926R、和V1030G)。在又另一實例中,Cas12i2多肽在位置D581、I926、V1030、和S1046處包含突變(例如,胺基酸取代D581R、I926R、V1030G、和S1046G)。在仍另一實例中,Cas12i2多肽在位置D581、G624、F626、I926、V1030、E1035、和S1046處包含突變(例如,胺基酸取代D581R、G624R、F626R、I926R、V1030G、E1035R、和S1046G)。在另一實例中,Cas12i2多肽在位置D581、G624、F626、P868、I926、V1030、E1035、和S1046處包含突變(例如,胺基酸取代D581R、G624R、F626R、P868T、I926R、V1030G、E1035R、和S1046G)。
用於在本文揭露的任何基因編輯系統中使用的示例性Cas12i2多肽可以包含SEQ ID NO: 223-227中任一個的胺基酸序列。在一個實例中,用於在本文揭露的任何基因編輯系統中使用的示例性Cas12i2多肽包含SEQ ID NO: 224的胺基酸序列。在另一實例中,用於在本文揭露的任何基因編輯系統中使用的示例性Cas12i2多肽包含SEQ ID NO: 227的胺基酸序列。
在一些實施方式中,基因編輯系統可以包含編碼Cas12i多肽(例如,Cas12i2多肽)的第一核酸。在一些情況下,第一核酸位於第一載體(例如,病毒載體,如腺相關病毒載體或AAV載體)中。在一些情況下,第一核酸係信使RNA(mRNA)。在一些情況下,Cas12i多肽的編碼序列經密碼子優化。
在一些實施方式中,靶序列在TTR基因的外顯子2、外顯子3或外顯子4內。在一些實例中,靶序列包含:(i) GACCATCAGAGGACACTTGG(SEQ ID NO: 329)、(ii) TAGATGCTGTCCGAGGCAGT(SEQ ID NO: 330)、(iii) CTGAACACATGCACGGCCAC(SEQ ID NO: 332)、(iv) GGCAACTTA CCCAGAGGCAA(SEQ ID NO: 333)、(v) TTTGGCAACTTACCCAGAGG(SEQ ID NO: 334)、(vi) CACACCTTATAGGAAAACCA(SEQ ID NO: 335)、(vii) GTATATCCCTTCTACAAATT(SEQ ID NO: 337)、(viii) CAGTAAGA TTTGGTGTCTAT(SEQ ID NO: 338)、或 (ix) CACCACGGCTGTCGTCACCA(SEQ ID NO: 271)。
在一些實施方式中,間隔子序列的長度可為20-30個核苷酸。在一些實例中,間隔子序列的長度係20個核苷酸。在一些實例中,間隔子序列包含:(i) GACCAUCAGAGGACACUUGG(SEQ ID NO: 410)、(ii) UAGAUGCUGUCCGAGGCAGU(SEQ ID NO: 411)、(iii) CUGAACACAU GCACGGCCAC(SEQ ID NO: 412)、(iv) GGCAACUUACCCAGAGGCAA(SEQ ID NO: 413)、(v) UUUGGCAACUUACCCAGAGG(SEQ ID NO: 414)、(vi) CACACCUUAUAGGAAAACCA(SEQ ID NO: 415)、(vii) GUAUAUCCCUU CUACAAAUU(SEQ ID NO: 416)、(viii) CAGUAAGAUUUGGUGUCUAU(SEQ ID NO: 417)、或 (ix) CACCACGGCUGUCGUCACCA(SEQ ID NO: 418)。
在一些實施方式中,RNA指導物(gRNA)包含間隔子和直接重複序列。在一些實例中,直接重複序列的長度係23-36個核苷酸。在一個實例中,直接重複序列與SEQ ID NO: 1-10中的任一個或其長度為至少23個核苷酸的片段具有至少90%的同一性。在一些特定的實例中,直接重複序列係SEQ ID NO: 1-10中的任一個、或其長度為至少23個核苷酸的片段。作為非限制性實例,直接重複序列係5’-AGAAAUCCGUCUUUCAUUGACGG-3’(SEQ ID NO: 10)。
在特定的實例中,RNA指導物包含以下的核苷酸序列:(i) AGAAAUCCGUCUUUCAUUGACGGGACCAUCAGAGGACACUUGG(SEQ ID NO: 347)、(ii) AGAAAUCCGUCUUUCAUUGACGGUAGAUGCUGUCCGAGG CAGU(SEQ ID NO: 348)、(iii) AGAAAUCCGUCUUUCAUUGACGGCUGAACA CAUGCACGGCCAC(SEQ ID NO: 350)、(iv) AGAAAUCCGUCUUUCAUUGAC GGGGCAACUUACCCAGAGGCAA(SEQ ID NO: 351)、(v) AGAAAUCCGUC UUUCAUUGACGGUUUGGCAACUUACCCAGAGG(SEQ ID NO: 352)、(vi) AGAAAUCCGUCUUUCAUUGACGGCACACCUUAUAGGAAAAC CA(SEQ ID NO: 353)、(vii) AGAAAUCCGUCUUUCAUUGACGGGUAUAUCCCUUCUAC AAAUU(SEQ ID NO: 355)、(viii) AGAAAUCCGUCUUUCAUUGACGGCAG UAAGAUUU GGUGUCUAU(SEQ ID NO: 356)、或 (ix) AGAAAUCCGUC UUUCAUUGACGGCACCACG GCUGUCGUCACCA(SEQ ID NO: 358)。在一些實例中,RNA指導物可以包含一或多個修飾,例如,包含SEQ ID NO: 277的經修飾的核苷酸序列。
在一些實施方式中,該系統可以包含編碼RNA指導物的第二核酸。在一些實例中,編碼RNA指導物的核酸可以位於病毒載體中。在一些實例中,病毒載體包含編碼Cas12i多肽(例如,Cas12i2多肽)的第一核酸和編碼RNA指導物的第二核酸兩者。
在一些實施方式中,本文所述之任何系統可以包含編碼Cas12i多肽(例如,Cas12i2多肽)的第一核酸和編碼RNA指導物的第二核酸,該第一核酸位於第一載體中,該第二核酸位於第二載體上。在一些實例中,第一載體和/或第二載體係病毒載體。在一些特定的實例中,第一載體和第二載體係相同的載體。在其他實例中,第一載體和第二載體係不同的載體。
本文揭露的任何基因編輯系統可以進一步包含 (iii) 模板DNA,該模板DNA包含 (a) 與TTR基因中的第一位點同源的第一區段,該第一位點在用於基因編輯的TTR基因靶位點的上游,(b) 與第二位點同源的第二區段,該第二位點在用於基因編輯的TTR基因靶位點的下游,和 (c) 供體區,該供體區與用於基因編輯的TTR基因靶位點同源並包含至少一個相對於用於基因編輯的TTR基因靶位點的核苷酸變化;並且其中該供體區的側翼係該第一區段和該第二區段。在一些實施方式中,用於基因編輯的TTR基因靶位點包含靶序列、PAM、或其組合。模板化的DNA位於病毒載體(例如AAV載體)中。
在一些實施方式中,用於基因編輯的TTR基因靶位點包含與疾病相關的突變,並且其中供體區包含修復該突變的序列。與疾病相關的示例性突變可導致相對於SEQ ID NO: 257的TTR序列的胺基酸殘基取代V30M、V122I、T60A、L58H、或I84S。
在其他實施方式中,供體區包含相對於用於基因編輯的TTR基因靶位點的保護性突變。例如,保護性突變導致相對於SEQ ID NO: 257的TTR序列的胺基酸殘基取代T119M。
在一些實施方式中,基因編輯系統可以包含一或多個脂質奈米顆粒(LNP),該一或多個LNP涵蓋 (i)、(ii)、或兩者,以及視需要 (iii)。在一些實例中,基因編輯系統可以包含LNP,該LNP涵蓋 (i),並且其中該系統包含病毒載體,該病毒載體包含編碼RNA指導物的第二核酸;視需要其中該病毒載體係AAV載體。在其他實例中,基因編輯系統可以包含LNP,該LNP涵蓋 (ii),並且其中該系統包含病毒載體,該病毒載體包含編碼Cas12i多肽(例如,Cas12i2多肽)的第一核酸;視需要其中該病毒載體係AAV載體。
在其他方面,本揭露內容提供了一種用於運甲狀腺素蛋白(TTR)基因的基因編輯的基因編輯系統,該基因編輯系統包含 (i) Cas12i多肽(例如,Cas12i2或Cas12i4多肽)或編碼該Cas12i多肽的第一核酸、(ii) RNA指導物或編碼該RNA指導物的第二核酸。RNA指導物可以包含對TTR基因的外顯子2、外顯子3、或外顯子4內的靶序列具有特異性的間隔子序列。靶序列與包含5'-TTN-3'模體的原型間隔子相鄰模體(PAM)相鄰,該PAM位於該靶序列的5'。任何靶序列和/或間隔子序列均可用於該基因編輯系統。
在一些實施方式中,本文提供了一種用於運甲狀腺素蛋白(TTR)基因的基因編輯的基因編輯系統,該基因編輯系統包含 (i) 如本文揭露的Cas12i多肽(例如,Cas12i2多肽或Cas12i4多肽)或編碼該Cas12i多肽的第一核酸;(ii) 如本文揭露的RNA指導物或編碼該RNA指導物的第二核酸,其中該RNA指導物包含對TTR基因內的靶序列具有特異性的間隔子序列,該靶序列與包含5'-TTN-3'模體的原型間隔子相鄰模體(PAM)相鄰,該PAM位於該靶序列的5';以及 (iii) 如本文揭露的模板DNA,該模板DNA包含 (a) 與TTR基因中的第一位點同源的第一區段,該第一位點在用於基因編輯的TTR基因靶位點的上游,(b) 與第二位點同源的第二區段,該第二位點在用於基因編輯的TTR基因靶位點的下游,和 (c) 供體區,該供體區與用於基因編輯的TTR基因靶位點同源並包含至少一個相對於用於基因編輯的TTR基因靶位點的核苷酸變化;並且其中該供體區的側翼係該第一區段和該第二區段。在一些實例中,模板DNA中的供體區包含修復與疾病相關的TTR基因靶位點中的突變的序列、包含保護性突變、或其組合。
在一些方面,本揭露內容還提供了一種包含本文揭露的任何基因編輯系統的藥物組成物、或包含該基因編輯系統的組分的套組。
在一些方面,本揭露內容提供了一種用於編輯細胞中的運甲狀腺素蛋白(TTR)基因之方法,該方法包括使宿主細胞與本文揭露的用於編輯TTR基因的任何基因編輯系統接觸,以對該宿主細胞中的TTR基因進行基因編輯。在一些情況下,宿主細胞在體外培養。在其他情況下,接觸步驟藉由以下進行:向包含宿主細胞的受試者投與用於編輯TTR基因的系統。
此外,本文提供了一種包含經突變的運甲狀腺素蛋白(TTR)基因的細胞,其中該細胞視需要藉由以下產生:使宿主細胞與本文揭露的基因編輯系統接觸以對該宿主細胞中的TTR基因進行基因編輯,從而使該TTR基因突變。在一些情況下,細胞包含經破壞的TTR基因。在其他情況下,細胞包含經修飾的TTR基因,該經修飾的TTR基因相對於野生型對應細胞表現經突變的TTR。
此外,本揭露內容的特點在於一種用於治療受試者的澱粉樣變運甲狀腺素蛋白(ATTR)的方法,該方法包括向有需要的受試者投與本文揭露的用於編輯運甲狀腺素蛋白(TTR)基因的任何基因編輯系統或由該基因編輯系統產生的經修飾的細胞。在一些實施方式中,受試者係患有遺傳性ATTR(hATTR)或野生型ATTR類澱粉變性的人患者。
本文還提供了用於在受試者的ATTR治療中使用的本文揭露的任何基因編輯系統、包含該等基因編輯系統的藥物組成物或套組、或由該基因編輯系統產生的經基因修飾的細胞,以及本文揭露的基因編輯系統、包含該等基因編輯系統的藥物組成物或套組、或由該基因編輯系統產生的經基因修飾的細胞用於製造藥物之用途,該藥物用於治療受試者的ATTR。
此外,本揭露內容提供了一種RNA指導物,該RNA指導物包含 (i) 對運甲狀腺素蛋白(TTR)基因中的靶序列具有特異性的間隔子序列,其中該靶序列與包含5’-TTN-3’模體的原型間隔子相鄰模體(PAM)相鄰,該PAM位於該靶序列的5’;以及 (ii) 直接重複序列。在一些實施方式中,該間隔子序列的長度係20-30個核苷酸,視需要長度係20個核苷酸。可替代地或額外地,該直接重複序列的長度係23-36個核苷酸,視需要長度係23個核苷酸。
在一些實施方式中,靶序列在TTR基因的外顯子2、外顯子3或外顯子4內。在一些實例中,靶序列包含SEQ ID NO: 329、330、332-335、337、338、或271的核苷酸序列。在一些實例中,間隔子序列如SEQ ID NO: 410-418中任一個所闡述。
在一些實施方式中,本文揭露的任何RNA指導物中的直接重複序列與SEQ ID NO: 1-10中的任一個或其長度為至少23個核苷酸的片段具有至少90%的同一性。在一些實例中,直接重複序列係SEQ ID NO: 1-10中的任一個、或其長度為至少23個核苷酸的片段。在一個實例中,直接重複序列係SEQ ID NO: 10。在特定的實例中,RNA指導物可以包含SEQ ID NO: 347、348、350-353、355、356、或358中任一個的核苷酸序列。在一些情況下,RNA指導物可以包含一或多個修飾。在一個實例中,RNA指導物係包含SEQ ID NO: 277的經修飾的RNA分子。
本揭露內容之一或多個實施方式的細節在以下描述中闡述。根據以下附圖和幾個實施方式的詳細描述以及從所附請求項,本揭露內容之其他特徵或優點將顯而易見。
本揭露內容關於一種用於運甲狀腺素蛋白(TTR)基因的基因編輯的系統,該系統包含 (i) Cas12i多肽或編碼該Cas12i2多肽的第一核酸;以及 (ii) RNA指導物或編碼該RNA指導物的第二核酸,其中該RNA指導物包含對TTR基因內的靶序列具有特異性的間隔子序列,該靶序列與包含5'-TTN-3'模體的原型間隔子相鄰模體(PAM)相鄰,該PAM位於該靶序列的5'。本揭露內容還提供了一種包含這種系統的藥物組成物或套組及其用途。本文進一步揭露了一種用於編輯細胞中的TTR基因之方法、一種如此產生的包含經破壞的TTR基因的細胞、一種治療受試者的澱粉樣變運甲狀腺素蛋白(ATTR)之方法、和一種RNA指導物、及其用途,該RNA指導物包含 (i) 對TTR基因中的靶序列具有特異性的間隔子序列,其中該靶序列與包含5'-TTN-3'模體的原型間隔子相鄰模體(PAM)相鄰,該PAM位於該靶序列的5';以及 (ii) 直接重複序列。
用於在本文揭露的基因編輯系統中使用的Cas12i多肽可為Cas12i2多肽,例如,野生型Cas12i多肽或其變體,如本文揭露的那些。在一些實例中,Cas12i2多肽包含與SEQ ID NO: 222具有至少95%同一性的胺基酸序列並且相對於SEQ ID NO: 222包含一或多個突變。在其他實例中,Cas12i多肽可為也在本文中揭露的Cas12i4多肽。
定義
本揭露內容將相對於特定實施方式並參考某些附圖進行描述,但本揭露內容不限於此,而僅由請求項來限定。除非另有說明,否則下文闡述的術語通常應以其常見意義來理解。
如本文所用,術語「活性」係指生物活性。在一些實施方式中,活性包括酶活性,例如Cas12i多肽的催化能力。例如,活性可以包括核酸酶活性。
如本文所用,術語「TTR」係指「運甲狀腺素蛋白」。TTR係血清和腦脊液中的一種轉運蛋白,其攜帶甲狀腺激素甲狀腺素(T4)和與視黃醇(維生素A)結合的視黃醇結合蛋白。TTR錯誤折疊和聚集與澱粉樣病、老年系統性澱粉樣變性、家族性澱粉樣多發性神經病變、和家族性澱粉樣心肌病相關。如本文所闡述的SEQ ID NO: 228提供了TTR基因序列之實例。如本文所闡述的SEQ ID NO: 258提供了TTR編碼序列之實例。
如本文所用,術語「Cas12i多肽」(本文也稱為Cas12i)係指與RNA指導物指定的靶核酸上的靶序列結合的多肽,其中該多肽與野生型Cas12i多肽具有至少一些胺基酸序列同源性。在一些實施方式中,Cas12i多肽與美國專利案號10,808,245的SEQ ID NO: 1-5和11-18中任一個包含至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性,出於本文引用的主題和目的,將該文獻藉由援引併入。在一些實施方式中,Cas12i多肽與本申請之SEQ ID NO: 8、2、11和9中任一個包含至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一些實施方式中,本揭露內容之Cas12i多肽係如 WO/2021/202800中所述之Cas12i2多肽,出於本文引用的主題和目的,將該文獻的相關揭露內容藉由援引併入。在一些實施方式中,Cas12i多肽切割靶核酸(例如,作為切口或雙股斷裂)。
如本文所用,術語「相鄰」係指一個核苷酸或胺基酸序列緊鄰另一個核苷酸或胺基酸序列。在一些實施方式中,如果沒有核苷酸將一個核苷酸序列與另一個核苷酸序列分隔,則這兩個序列相鄰(即,緊鄰)。在一些實施方式中,如果少量核苷酸(例如,約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20個核苷酸)將一個核苷酸序列與另一個核苷酸序列分隔,則這兩個序列相鄰。在一些實施方式中,如果第一序列與第二序列相隔約5、6、7、8、9、10、11、12、13、14或15個核苷酸,則這兩個序列相鄰。在一些實施方式中,如果第一序列與第二序列相隔最多2個核苷酸、最多5個核苷酸、最多8個核苷酸、最多10個核苷酸、最多12個核苷酸或最多15個核苷酸,則這兩個序列相鄰。在一些實施方式中,如果第一序列與第二序列相隔2-5個核苷酸、4-6個核苷酸、4-8個核苷酸、4-10個核苷酸、6-8個核苷酸、6-10個核苷酸、6-12個核苷酸、8-10個核苷酸、8-12個核苷酸、10-12個核苷酸、10-15個核苷酸或12-15個核苷酸,則這兩個序列相鄰。
如本文所用,術語「複合物」係指兩個或更多個分子的組化。在一些實施方式中,複合物包含彼此相互作用(例如,結合、接觸、黏附)的多肽和核酸分子。例如,術語「複合物」可以指RNA指導物和多肽(例如,Cas12i多肽)的組化。可替代地,術語「複合物」可以指RNA指導物、多肽、和靶序列的互補區的組化。如本文所用,術語「複合物」可以指靶向TTR的RNA指導物和Cas12i多肽的組化。
如本文所用,術語「同源臂」係指與靶核酸具有同源性的模板核酸的一部分。在一些實施方式中,模板核酸可以包含一個或兩個同源臂。在一些實施方式中,同源臂與靶核酸的對應區域具有基本同一性或完全同一性。在一些實施方式中,同源臂係單股DNA或雙股DNA。在一些實施方式中,與使用缺乏同源臂的在其他方面類似的模板核酸相比,使用包含同源臂的模板核酸導致將更高水平的序列差異摻入靶核酸中。
如本文所用,術語「左同源臂」係指所在位置導致以下的同源臂:i) 同源臂的多個核苷酸與一部分靶位點同源,該部分靶位點在切割位點與靶位點的近PAM端之間;ii) 同源臂的多個核苷酸與一部分靶核酸同源,該部分靶核酸在從切割位點起的靶位點的遠PAM端的相反側;或i) 和ii) 兩者。
如本文所用,術語「右同源臂」係指所在位置導致以下的同源臂:i) 同源臂的多個核苷酸與一部分靶位點同源,該部分靶位點在切割位點與靶位點的遠PAM端之間;ii) 同源臂的多個核苷酸與一部分靶核酸同源,該部分靶核酸在從靶位點的遠PAM端起的切割位點的相反側;或i) 和ii) 兩者。
如本文所用,術語「原型間隔子相鄰模體」或「PAM」係指與靶序列(例如,TTR靶序列)相鄰的DNA序列,包含RNA指導物(例如,靶向TTR的RNA指導物)和Cas12i多肽的複合物與該靶序列結合。在雙鏈DNA分子中,含有PAM模體的鏈稱為「PAM鏈」,並且互補鏈稱為「非PAM股」。RNA指導物與非PAM股中與本文揭露的靶序列互補的位點結合。
在一些實施方式中,PAM股係編碼(例如,正義)股。在其他實施方式中,PAM股係非編碼(例如,反義股)的。由於RNA指導物經由鹼基配對與非PAM股結合,因此非PAM股也稱為靶股,而PAM股也稱為非靶股。
如本文所用,術語「靶序列」係指與PAM模體(在PAM股上)相鄰的DNA片段。靶序列的互補區在非PAM股上。靶序列可以緊鄰PAM模體。可替代地,靶序列和PAM可以由小的序列區段(例如,最多5個核苷酸,例如最多4、3、2或1個核苷酸)分隔。靶序列可以位於PAM模體的3’端或PAM模體的5’端,這取決於識別該PAM模體的CRISPR核酸酶,這係本領域已知的。例如,針對Cas12i多肽(例如,Cas12i2多肽,如本文揭露的那些),靶序列位於PAM模體的3'端。在一些實施方式中,靶序列係TTR基因序列內的序列,包括但不限於SEQ ID NO: 228或SEQ ID NO: 258中闡述的序列。
如本文所用,術語「間隔子」或「間隔子序列」係RNA指導物中的一部分,其係靶序列(DNA序列)的RNA等同物。間隔子含有能夠經由鹼基配對在與靶序列(在PAM股中)互補的位點處與非PAM股結合的序列。這種間隔子也稱為對靶序列具有特異性。在一些情況下,除了RNA-DNA序列差異外,間隔子可以與靶序列具有至少75%的同一性(例如,至少80%、至少85%、至少90%、至少95%、至少98%、或至少99%)。在一些情況下,除了RNA-DNA序列差異外,間隔子可以與靶序列具有100%同一性。
如本文所用,術語「RNA指導物」或「RNA指導物序列」係指促進本文所述之多肽(例如,Cas12i多肽)靶向靶序列(例如,TTR基因的序列)的任何RNA分子或經修飾的RNA分子。例如,RNA指導物可為被設計成與特定的核酸序列(靶序列,如具有TTR基因的靶序列)互補的分子。RNA指導物可以包含間隔子序列和直接重複(DR)序列。在一些情況下,RNA指導物可為經修飾的RNA分子,該經修飾的RNA分子例如在包含在RNA指導物中的DNA結合序列(其結合與靶序列互補的序列)中包含一或多個去氧核糖核苷酸。在一些實例中,DNA結合序列可以含有DNA序列或DNA/RNA雜交序列。術語CRISPR RNA(crRNA)、前crRNA和成熟crRNA在本文中也用於指RNA指導物。
如本文所用,術語「互補的」係指第一多核苷酸(例如,RNA指導物的間隔子序列)與第二多核苷酸(例如,靶序列的互補序列)具有一定水平的互補性,使得該第一多核苷酸和該第二多核苷酸可以經由鹼基配對形成雙股複合物,以允許與該第一多核苷酸複合的效應子多肽作用於(例如,切割)該第二多核苷酸。在一些實施方式中,第一多核苷酸可以與第二多核苷酸基本上互補,即,與該第二多核苷酸具有至少約80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的互補性。在一些實施方式中,第一多核苷酸與第二多核苷酸完全互補,即,與該第二多核苷酸具有100%的互補性。
使用如在Karlin和Altschul Proc. Natl. Acad. Sci. USA [美國國家科學院院刊] 90:5873-77, 1993中改良的Karlin和Altschul Proc. Natl. Acad. Sci. USA [美國國家科學院院刊] 87:2264-68, 1990的演算法確定兩個核酸或兩個胺基酸序列的「同一性百分比」(又稱為序列同一性)。這種演算法被併入Altschul等人 J. Mol. Biol. [分子生物學雜誌] 215:403-10, 1990的NBLAST和XBLAST程式(版本2.0)中。BLAST核苷酸搜索可以用NBLAST程式(評分 = 100,字長為-12)進行以獲得與本揭露內容之核酸分子同源的核苷酸序列。BLAST蛋白質搜索可以用XBLAST程式(評分 = 50,字長 = 3)進行以獲得與本揭露內容之蛋白分子同源的胺基酸序列。在兩個序列之間存在空位的情況下,可以如Altschul等人, Nucleic Acids Res. [核酸研究] 25(17):3389-3402, 1997中所述利用空位BLAST。當利用BLAST和空位BLAST程式時,可以使用相應程式(例如,XBLAST和NBLAST)的默認參數。
如本文所用,術語「模板核酸」、「模板DNA」、「供體」、「供體核酸」係指包含可與Cas12i多肽和RNA指導物一起使用以修飾靶核酸(例如,TTR基因靶位點)從而使其具有模板核酸的一些或全部序列的核酸序列的核酸分子。在一些實施方式中,靶核酸序列的修飾在一或多個切割位點處或附近。在一些實施方式中,模板核酸係單股核酸。在一些實施方式中,模板核酸係雙股核酸。在一些實施方式中,使用HDR時,模板DNA指導對靶核酸的修飾。
如本文所用,術語「編輯」係指引入靶核酸中(例如,在HAO1基因內)的一或多個修飾。編輯可為一或多個取代、一或多個***、一或多個缺失、或其組合。如本文所用,術語「取代」係指相對於參考序列,不同的一或多個核苷酸對一或多個核苷酸的替代。如本文所用,術語「***」係指相對於參考序列,核酸序列中的一或多個核苷酸的增加。如本文所用,術語「缺失」係指相對於參考序列,核酸序列中的一或多個核苷酸的丟失。
在如何製作包含缺失的序列方面,沒有暗示特定的方法。例如,可以從單個核苷酸直接合成包含缺失的序列。在其他實施方式中,藉由提供參考序列然後改變該參考序列來製造缺失。核酸序列可以在生物的基因組中。核酸序列可以在細胞中。核酸序列可為DNA序列。缺失可為框移突變或非框移突變。本文所述之缺失係指最多數個千鹼基的缺失。
如本文所用,術語「上游」和「下游」係指核酸分子中單個核酸(例如,DNA)序列內的相對位置。「上游」和「下游」分別涉及發生RNA轉錄的5'至3'方向。當第一序列的3'端出現在第二序列的5'端之前時,該第一序列在該第二序列的上游。當第一序列的5'端出現在第二序列的3'端之後時,該第一序列在該第二序列的下游。在一些實施方式中,5'-NTTN-3'或5'-TTN-3'序列在本文所述之***缺失的上游,並且Cas12i誘導的***缺失在5'-NTTN-3'或5'-TTN-3'序列的下游。
I. 基因編輯系統
在一些方面,本揭露內容提供了包含靶向TTR基因的RNA指導物的基因編輯系統。這種基因編輯系統可用於編輯TTR靶基因例如以破壞TTR基因。
運甲狀腺素蛋白「TTR」係血清和腦脊液中的一種轉運蛋白,其攜帶甲狀腺激素甲狀腺素(T4)和與維生素A。TTR錯誤折疊和聚集與澱粉樣病、老年系統性類澱粉變性、家族性澱粉樣多發性神經病變、和家族性澱粉樣心肌病相關。因此,此處揭露的靶向TTR基因的基因編輯系統可用於治療需要治療的受試者的澱粉樣病。
在一些實施方式中,RNA指導物由直接重複組分和間隔子序列構成。在一些實施方式中,RNA指導物與Cas12i多肽結合。在一些實施方式中,間隔子序列對TTR靶序列具有特異性,其中該TTR靶序列與如本文所述之5'-NTTN-3'或5'-TTN-3' PAM序列相鄰。在雙股靶標的情況下,RNA指導物與靶標的第一股(即,非PAM股)結合,並且如本文所述之PAM序列存在於第二互補股(即,PAM股)中。
在一些實施方式中,本揭露內容提供了包含複合物的組成物,其中該複合物包含靶向TTR的RNA指導物。在一些實施方式中,本揭露內容包含一種複合物,該複合物包含RNA指導物和Cas12i多肽。在一些實施方式中,RNA指導物和Cas12i多肽以約1 : 1的莫耳比彼此結合。在一些實施方式中,包含RNA指導物和Cas12i多肽的複合物與TTR基因內的靶序列的互補區結合。在一些實施方式中,包含靶向TTR的RNA指導物和Cas12i多肽的複合物與TTR基因內的靶序列的互補區以約1 : 1的莫耳比結合。在一些實施方式中,複合物包含可以切割TTR靶序列和/或互補序列的酶活性,如核酸酶活性。RNA指導物、Cas12i多肽、和TTR靶序列的互補區(無論是單獨還是一起)不是天然存在的。在一些實施方式中,複合物中的RNA指導物包含本文所述之直接重複序列和/或間隔子序列。在一些實施方式中,RNA指導物的序列與SEQ ID NO: 345-362中任一個的序列具有至少90%的同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性)。在一些實施方式中,RNA指導物具有SEQ ID NO: 345-362中任一個的序列。
在一些實施方式中,本揭露內容包含組成物,該等組成物包含如本文所述之RNA指導物和/或編碼如本文所述之Cas12i多肽的RNA。在一些實施方式中,RNA指導物和編碼Cas12i多肽的RNA一起被包含在相同的組成物中。在一些實施方式中,RNA指導物和編碼Cas12i多肽的RNA被包含在分開的組成物中。在一些實施方式中,RNA指導物包含本文所述之直接重複序列和/或間隔子序列。在一些實施方式中,RNA指導物的序列與SEQ ID NO: 345-362中任一個的序列具有至少90%的同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性)。在一些實施方式中,RNA指導物具有SEQ ID NO: 345-362中任一個的序列。
在一些實施方式中,本揭露內容之組成物進一步包含模板DNA。在一些實施方式中,組成物包含Cas12i多肽、RNA指導物、和模板DNA。在一些實施方式中,模板DNA包含同源臂(例如,左同源臂和/或右同源臂)。在一些實施方式中,同源臂與靶核酸的對應區域(例如,靶核酸的靶股或非靶股)具有至少80%、85%、90%、95%、99%、或100%的同一性。在一些實施方式中,相對於包含TTR靶序列的靶核酸序列,模板DNA包含序列差異。在一些實施方式中,序列差異係多型性。在一些實施方式中,多型性係與疾病(例如,遺傳性ATTR類澱粉變性(hATTR)、家族性澱粉樣多發性神經病變(FAP)或老年系統性類澱粉變性(SSA))相關的突變。在一些實施方式中,序列差異係保護性突變。在一些實施方式中,使用模板DNA通過同源定向修復(HDR),與疾病相關的突變被糾正(例如,突變的TTR靶序列被糾正為野生型TTR序列)。在一些實施方式中,通過HDR並使用模板DNA,將保護性突變引入到突變TTR靶序列中。在一些實施方式中,使用模板DNA通過HDR糾正突變相關疾病,並將保護性突變引入到TTR靶序列中。
本文揭露的基因編輯系統的使用具有優於其他已知的核酸酶系統的那些的優點。Cas12i多肽比其他核酸酶小。例如,Cas12i2的長度為1,054個胺基酸,而化釀膿鏈球菌(
S. pyogenes)Cas9(SpCas9)的長度為1,368個胺基酸,嗜熱鏈球菌(
S. thermophilus)Cas9(StCas9)的長度為1,128個胺基酸,FnCpf1的長度為1,300個胺基酸,AsCpf1的長度為1,307個胺基酸,並且LbCpf1的長度為1,246個胺基酸。不需要反式激活的CRISPR RNA(tracrRNA)的Cas12i RNA指導物也比Cas9 RNA指導物小。較小的Cas12i多肽和RNA指導物大小有利於遞送。與包含SpCas9多肽的組成物相比,包含Cas12i多肽的組成物還表現出降低的脫靶活性。參見WO/2021/202800,出於本文引用的主題和目的將該文獻的相關揭露內容藉由援引併入。此外,由包含Cas12i多肽的組成物誘導的***缺失不同於由包含SpCas9多肽的組成物誘導的***缺失。例如,SpCas9多肽主要誘導長度為1個核苷酸的***和缺失。然而,Cas12i多肽誘導較大的缺失,這可有利於破壞基因(如TTR)的較大部分。
本文還提供了一種用於TTR基因的基因編輯的系統,該系統包含 (i) Cas12i多肽(例如,Cas12i2多肽)或編碼該Cas12i多肽(例如,Cas12i2多肽包含與SEQ ID NO: 222具有至少95%同一性的胺基酸序列,該胺基酸序列相對於SEQ ID NO: 222可以包含一或多個突變)的第一核酸;以及 (ii) RNA指導物或編碼該RNA指導物的第二核酸,其中該RNA指導物包含對TTR基因內(例如,該TTR基因的外顯子2、外顯子3或外顯子4內)的靶序列具有特異性的間隔子序列,該靶序列與包含5’-TTN-3’(5’-NTTN-3’)模體的原型間隔子相鄰模體(PAM)相鄰,該PAM位於該靶序列的5’。
A. RNA 指導物
在一些實施方式中,本文所述之基因編輯系統包含靶向TTR基因(例如,靶向TTR基因的外顯子2、外顯子3或外顯子4)的RNA指導物。在一些實施方式中,本文所述之基因編輯系統可以包含兩個或更多個(例如,2、3、4、5、6、7、8、9、或更多個)靶向TTR的RNA指導物。
RNA指導物可以將如本文所述之基因編輯系統中含有的Cas12i多肽引導至HAO1靶序列。兩個或更多個RNA指導物可以將兩個或更多個如本文所述之單獨的Cas12i多肽(例如,具有相同或不同序列的Cas12i多肽)引導至兩個或更多個(例如,2、3、4、5、6、7、8、9、或更多個)TTR靶序列。閱讀以下特定種類的RNA指導物之實例的熟悉該項技術者將理解,在一些實施方式中,RNA指導物具有TTR靶特異性。也就是說,在一些實施方式中,RNA指導物與一或多個TTR靶序列(例如,在細胞內)特異性結合,並且不與非靶向的序列(例如,相同細胞內的非特異性DNA或隨機序列)結合。
在一些實施方式中,RNA指導物包含間隔子序列、隨後是直接重複序列,指的是從5'至3'方向的序列。在一些實施方式中,RNA指導物包含第一直接重複序列、隨後是間隔子序列、和第二直接重複序列,指的是從5'至3'方向的序列。在一些實施方式中,這種RNA指導物的第一直接重複序列和第二直接重複序列相同。在一些實施方式中,這種RNA指導物的第一直接重複序列和第二直接重複序列不同。
在一些實施方式中,RNA指導物的間隔子序列和一或多個直接重複序列存在於相同的RNA分子內。在一些實施方式中,間隔子序列和直接重複序列彼此直接連接。在一些實施方式中,在間隔子序列和直接重複序列之間存在短連接子,例如長度為1、2、或3個核苷酸的RNA連接子。在一些實施方式中,RNA指導物的間隔子序列和一或多個直接重複序列存在於單獨的分子中,它們藉由鹼基配對相互作用彼此連接。
關於RNA指導物的示例性直接重複組分和間隔子組分的額外資訊提供如下。
(i). 直接重複序列
在一些實施方式中,RNA指導物包含直接重複序列。在一些實施方式中,RNA指導物的直接重複序列的長度介於12-100、13-75、14-50、或15-40個核苷酸之間(例如,15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、或40個核苷酸)。
在一些實施方式中,直接重複序列係表1的序列或表1的序列的一部分。直接重複序列可以包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸1至核苷酸36。直接重複序列可以包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸2至核苷酸36。直接重複序列可以包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸3至核苷酸36。直接重複序列可以包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸4至核苷酸36。直接重複序列可以包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸5至核苷酸36。直接重複序列可以包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸6至核苷酸36。直接重複序列可以包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸7至核苷酸36。直接重複序列可以包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸8至核苷酸36。直接重複序列可以包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸9至核苷酸36。直接重複序列可以包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸10至核苷酸36。直接重複序列可以包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸11至核苷酸36。直接重複序列可以包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸12至核苷酸36。直接重複序列可以包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸13至核苷酸36。直接重複序列可以包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸14至核苷酸36。直接重複序列可以包含SEQ ID NO: 9的核苷酸1至核苷酸34。直接重複序列可以包含SEQ ID NO: 9的核苷酸2至核苷酸34。直接重複序列可以包含SEQ ID NO: 9的核苷酸3至核苷酸34。直接重複序列可以包含SEQ ID NO: 9的核苷酸4至核苷酸34。直接重複序列可以包含SEQ ID NO: 9的核苷酸5至核苷酸34。直接重複序列可以包含SEQ ID NO: 9的核苷酸6至核苷酸34。直接重複序列可以包含SEQ ID NO: 9的核苷酸7至核苷酸34。直接重複序列可以包含SEQ ID NO: 9的核苷酸8至核苷酸34。直接重複序列可以包含SEQ ID NO: 9的核苷酸9至核苷酸34。直接重複序列可以包含SEQ ID NO: 9的核苷酸10至核苷酸34。直接重複序列可以包含SEQ ID NO: 9的核苷酸11至核苷酸34。直接重複序列可以包含SEQ ID NO: 9的核苷酸12至核苷酸34。在一些實施方式中,直接重複序列在SEQ ID NO: 10中闡述。在一些實施方式中,直接重複序列包含在SEQ ID NO: 10中闡述的序列的一部分。
在一些實施方式中,直接重複序列與表1的序列或表1的序列的一部分具有至少90%的同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性)。直接重複序列可以與包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸1至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸2至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸3至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸4至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸5至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸6至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸7至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸8至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸9至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸10至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸11至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸12至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸13至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸14至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 9的核苷酸1至核苷酸34的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 9的核苷酸2至核苷酸34的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 9的核苷酸3至核苷酸34的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 9的核苷酸4至核苷酸34的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 9的核苷酸5至核苷酸34的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 9的核苷酸6至核苷酸34的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 9的核苷酸7至核苷酸34的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 9的核苷酸8至核苷酸34的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 9的核苷酸9至核苷酸34的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 9的核苷酸10至核苷酸34的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 9的核苷酸11至核苷酸34的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 9的核苷酸12至核苷酸34的序列具有至少90%的同一性。在一些實施方式中,直接重複序列與SEQ ID NO: 10具有至少90%的同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性)。在一些實施方式中,直接重複序列與在SEQ ID NO: 10中闡述的序列的一部分具有至少90%的同一性。
在一些實施方式中,包含本文所述之Cas12i2多肽和RNA指導物的組成物能夠將***缺失引入到TTR靶序列中。參見例如,實例1,其中在藉由RNP將RNA指導物和Cas12i2多肽遞送至HEK293T細胞後,在六個TTR靶序列處測量到***缺失;實例2,其中經由HDR和使用包含RNA指導物和Cas12i2多肽的RNP在HEK293T細胞的TTR靶位點內引入了取代;實例3,其中使用引入到HEK293細胞中的Cas12i2藉由RNP對TTR基因進行了基因組編輯;實例4,其中使用引入到HepG2細胞中的Cas12i2藉由RNP對TTR基因進行了基因組編輯;以及實例5,其中使用引入到原代肝細胞中的Cas12i2藉由RNP對TTR基因進行了基因組編輯。
在一些實施方式中,直接重複序列與SEQ ID NO: 1-10(參見表1)中任一個的反向互補序列具有至少90%的同一性。在一些實施方式中,直接重複序列係SEQ ID NO: 1-10中任一個的反向互補序列。
[
表 1]
. Cas12i2 直接重複序列
序列識別字 | 直接重複序列 |
SEQ ID NO: 1 | GUUGCAAAACCCAAGAAAUCCGUCUUUCAUUGACGG |
SEQ ID NO: 2 | AAUAGCGGCCCUAAGAAAUCCGUCUUUCAUUGACGG |
SEQ ID NO: 3 | AUUGGAACUGGCGAGAAAUCCGUCUUUCAUUGACGG |
SEQ ID NO: 4 | CCAGCAACACCUAAGAAAUCCGUCUUUCAUUGACGG |
SEQ ID NO: 5 | CGGCGCUCGAAUAGGAAAUCCGUCUUUCAUUGACGG |
SEQ ID NO: 6 | GUGGCAACACCUAAGAAAUCCGUCUUUCAUUGACGG |
SEQ ID NO: 7 | GUUGCAACACCUAAGAAAUCCGUCUUUCAUUGACGG |
SEQ ID NO: 8 | GUUGCAAUGCCUAAGAAAUCCGUCUUUCAUUGACGG |
SEQ ID NO: 9 | GCAACACCUAAGAAAUCCGUCUUUCAUUGACGGG |
SEQ ID NO: 10 | AGAAAUCCGUCUUUCAUUGACGG |
在一些實施方式中,直接重複序列係表2的序列或表2的序列的一部分。直接重複序列可以包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸1至核苷酸36。直接重複序列可以包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸2至核苷酸36。直接重複序列可以包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸3至核苷酸36。直接重複序列可以包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸4至核苷酸36。直接重複序列可以包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸5至核苷酸36。直接重複序列可以包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸6至核苷酸36。直接重複序列可以包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸7至核苷酸36。直接重複序列可以包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸8至核苷酸36。直接重複序列可以包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸9至核苷酸36。直接重複序列可以包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸10至核苷酸36。直接重複序列可以包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸11至核苷酸36。直接重複序列可以包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸12至核苷酸36。直接重複序列可以包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸13至核苷酸36。直接重複序列可以包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸14至核苷酸36。
在一些實施方式中,直接重複序列與表2的序列或表2的序列的一部分具有至少95%的同一性(例如,至少95%、96%、97%、98%、或99%的同一性)。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸1至核苷酸36的序列具有至少95%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸2至核苷酸36的序列具有至少95%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸3至核苷酸36的序列具有至少95%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸4至核苷酸36的序列具有至少95%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸5至核苷酸36的序列具有至少95%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸6至核苷酸36的序列具有至少95%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸7至核苷酸36的序列具有至少95%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸8至核苷酸36的序列具有至少95%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸9至核苷酸36的序列具有至少95%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸10至核苷酸36的序列具有至少95%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸11至核苷酸36的序列具有至少95%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸12至核苷酸36的序列具有至少95%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸13至核苷酸36的序列具有至少95%的同一性。
在一些實施方式中,直接重複序列與表2的序列或表2的序列的一部分具有至少90%的同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性)。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸1至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸2至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸3至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸4至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸5至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸6至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸7至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸8至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸9至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸10至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸11至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸12至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸13至核苷酸36的序列具有至少90%的同一性。
在一些實施方式中,直接重複序列與SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的反向互補序列具有至少90%的同一性。在一些實施方式中,直接重複序列與SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的反向互補序列具有至少95%的同一性。在一些實施方式中,直接重複序列係SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的反向互補序列。
在一些實施方式中,直接重複序列與SEQ ID NO: 251或SEQ ID NO: 251的一部分具有至少90%的同一性。在一些實施方式中,直接重複序列與SEQ ID NO: 251或SEQ ID NO: 251的一部分具有至少95%的同一性。在一些實施方式中,直接重複序列與SEQ ID NO: 251或SEQ ID NO: 251的一部分具有100%的同一性。
[
表 2]
. Cas12i4 直接重複序列
序列識別字 | 直接重複序列 |
SEQ ID NO: 233 | UCUCAACGAUAGUCAGACAUGUGUCCUCAGUGACAC |
SEQ ID NO: 234 | UUUUAACAACACUCAGGCAUGUGUCCACAGUGACAC |
SEQ ID NO: 235 | UUGAACGGAUACUCAGACAUGUGUUUCCAGUGACAC |
SEQ ID NO: 236 | UGCCCUCAAUAGUCAGAUGUGUGUCCACAGUGACAC |
SEQ ID NO: 237 | UCUCAAUGAUACUUAGAUACGUGUCCUCAGUGACAC |
SEQ ID NO: 238 | UCUCAAUGAUACUCAGACAUGUGUCCCCAGUGACAC |
SEQ ID NO: 239 | UCUCAAUGAUACUAAGACAUGUGUCCUCAGUGACAC |
SEQ ID NO: 240 | UCUCAACUAUACUCAGACAUGUGUCCUCAGUGACAC |
SEQ ID NO: 241 | UCUCAACGAUACUCAGACAUGUGUCCUCAGUGACAC |
SEQ ID NO: 242 | UCUCAACGAUACUAAGAUAUGUGUCCUCAGCGACAC |
SEQ ID NO: 243 | UCUCAACGAUACUAAGAUAUGUGUCCCCAGUGACAC |
SEQ ID NO: 244 | UCUCAACGAUACUAAGAUAUGUGUCCACAGUGACAC |
SEQ ID NO: 245 | UCUCAACAAUACUCAGACAUGUGUCCCCAGUGACAC |
SEQ ID NO: 246 | UCUCAACAAUACUAAGGCAUGUGUCCCCAGUGACCC |
SEQ ID NO: 247 | UCUCAAAGAUACUCAGACACGUGUCCCCAGUGACAC |
SEQ ID NO: 248 | UCUCAAAAAUACUCAGACAUGUGUCCUCAGUGACAC |
SEQ ID NO: 249 | GCGAAACAACAGUCAGACAUGUGUCCCCAGUGACAC |
SEQ ID NO: 250 | CCUCAACGAUAUUAAGACAUGUGUCCGCAGUGACAC |
SEQ ID NO: 251 | AGACAUGUGUCCUCAGUGACAC |
在一些實施方式中,直接重複序列係表3的序列或表3的序列的一部分。在一些實施方式中,直接重複序列與表3的序列或表3的序列的一部分具有至少95%的同一性(例如,至少95%、96%、97%、98%、或99%的同一性)。在一些實施方式中,直接重複序列與表3的序列或表3的序列的一部分具有至少90%的同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性)。在一些實施方式中,直接重複序列與SEQ ID NO: 259-261中任一個的反向互補序列具有至少90%的同一性。在一些實施方式中,直接重複序列與SEQ ID NO: 259-261中任一個的反向互補序列具有至少95%的同一性。在一些實施方式中,直接重複序列係SEQ ID NO: 259-261中任一個的反向互補序列。
[
表 3]
. Cas12i1 直接重複序列
序列識別字 | 直接重複序列 |
SEQ ID NO: 259 | GUUGGAAUGACUAAUUUUUGUGCCCACCGUUGGCAC |
SEQ ID NO: 260 | AAUUUUUGUGCCCAUCGUUGGCAC |
SEQ ID NO: 261 | AUUUUUGUGCCCAUCGUUGGCAC |
在一些實施方式中,直接重複序列係表4的序列或表4的序列的一部分。在一些實施方式中,直接重複序列與表4的序列或表4的序列的一部分具有至少95%的同一性(例如,至少95%、96%、97%、98%、或99%的同一性)。在一些實施方式中,直接重複序列與表4的序列或表4的序列的一部分具有至少90%的同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性)。在一些實施方式中,直接重複序列與SEQ ID NO: 262-264中任一個的反向互補序列具有至少90%的同一性。在一些實施方式中,直接重複序列與SEQ ID NO: 262-264中任一個的反向互補序列具有至少95%的同一性。在一些實施方式中,直接重複序列係SEQ ID NO: 262-264中任一個的反向互補序列。[
表 4]
. Cas12i3 直接重複序列。
序列識別字 | 直接重複序列 |
SEQ ID NO: 262 | CUAGCAAUGACCUAAUAGUGUGUCCUUAGUUGACAU |
SEQ ID NO: 263 | CCUACAAUACCUAAGAAAUCCGUCCUAAGUUGACGG |
SEQ ID NO: 264 | AUAGUGUGUCCUUAGUUGACAU |
在一些實施方式中,本文所述之直接重複序列包含尿嘧啶(U)。在一些實施方式中,本文所述之直接重複序列包含胸腺嘧啶(T)。在一些實施方式中,根據表1-4的直接重複序列包含這樣的序列,該序列在表1-4中指示為尿嘧啶的一或多個位置中包含胸腺嘧啶。
(ii). 間隔子序列
在一些實施方式中,RNA指導物包含靶向DNA的間隔子序列。在一些實施方式中,RNA指導物的間隔子序列的長度介於12-100、13-75、14-50、或15-30個核苷酸之間(例如,15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、或30個核苷酸)並且與非PAM股序列互補。在一些實施方式中,間隔子序列被設計為與例如基因組基因座的特定DNA股互補。
在一些實施方式中,RNA指導物間隔子序列與靶序列的互補股基本上相同。在一些實施方式中,RNA指導物包含與參考核酸序列(例如靶序列)的互補股具有至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約91%、至少約92%、至少約93%、至少約94%、至少約95%、至少約96%、至少約97%、至少約98%、至少約99%、或至少約99.5%序列同一性的序列。可以藉由檢查兩個最佳比對的核酸序列或藉由使用軟體程式或演算法(例如,BLAST、ALIGN、CLUSTAL)使用標準參數人工確定兩個此類核酸之間的同一性百分比。
在一些實施方式中,RNA指導物包含間隔子序列,該間隔子序列的長度介於12-100、13-75、14-50、或15-30個核苷酸之間(例如,15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、或30個核苷酸),並且該間隔子序列與非PAM股上與靶序列互補的區域具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%的互補性。在一些實施方式中,RNA指導物包含與靶DNA序列具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互補性的序列。在一些實施方式中,RNA指導物包含與靶基因組序列具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互補性的序列。在一些實施方式中,RNA指導物包含長度為最多50的序列(例如,RNA序列),並且該序列與非PAM股上與靶序列互補的區域具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%的互補性。在一些實施方式中,RNA指導物包含與靶DNA序列具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互補性的序列。在一些實施方式中,RNA指導物包含與靶基因組序列具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互補性的序列。
在一些實施方式中,間隔子序列係表5的序列或表5的序列的一部分。應當理解,SEQ ID NO: 116-220的指示應被視為等同於SEQ ID NO: 116-220的列表,其中每個介於其中的數字都存在於清單中,該等數字即116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、和220。
間隔子序列可以包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸16。間隔子序列可以包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸17。間隔子序列可以包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸18。間隔子序列可以包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸19。間隔子序列可以包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸20。間隔子序列可以包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸21。間隔子序列可以包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸22。間隔子序列可以包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸23。間隔子序列可以包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸24。間隔子序列可以包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸25。間隔子序列可以包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸26。間隔子序列可以包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸27。間隔子序列可以包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸28。間隔子序列可以包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸29。間隔子序列可以包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸30。
在一些實施方式中,間隔子序列與表5的序列或表5的序列的一部分具有至少90%的同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性)。間隔子序列可以與包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸16的序列具有至少90%的同一性。間隔子序列可以與包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸17的序列具有至少90%的同一性。間隔子序列可以與包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸18的序列具有至少90%的同一性。間隔子序列可以與包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸19的序列具有至少90%的同一性。間隔子序列可以與包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸20的序列具有至少90%的同一性。間隔子序列可以與包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸21的序列具有至少90%的同一性。間隔子序列可以與包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸22的序列具有至少90%的同一性。間隔子序列可以與包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸23的序列具有至少90%的同一性。間隔子序列可以與包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸24的序列具有至少90%的同一性。間隔子序列可以與包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸25的序列具有至少90%的同一性。間隔子序列可以與包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸26的序列具有至少90%的同一性。間隔子序列可以與包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸27的序列具有至少90%的同一性。間隔子序列可以與包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸28的序列具有至少90%的同一性。間隔子序列可以與包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸29的序列具有至少90%的同一性。間隔子序列可以與包含116-220中任一個的核苷酸1至核苷酸30的序列具有至少90%的同一性。
[
表 5]
. 靶序列和間隔子序列
* 三個3'核苷酸代表5'-TTN-3'模體。
TTR | 股 | PAM* | SEQ ID NO | 靶序列 | SEQ ID NO | 間隔子序列 |
TTR_外顯子1 | + | ATTC | 11 | TTGGCAGGATGGCTTCTCATCGTCTGCTCC | 116 | UUGGCAGGAUGGCUUCUCAUCGUCUGCUCC |
TTR_外顯子1 | + | CTTC | 12 | TCATCGTCTGCTCCTCCTCTGCCTTGCTGG | 117 | UCAUCGUCUGCUCCUCCUCUGCCUUGCUGG |
TTR_外顯子1 | + | CTTG | 13 | CTGGACTGGTATTTGTGTCTGAGGCTGGCC | 118 | CUGGACUGGUAUUUGUGUCUGAGGCUGGCC |
TTR_外顯子1 | + | ATTT | 14 | GTGTCTGAGGCTGGCCCTACGGTGAGTGTT | 119 | GUGUCUGAGGCUGGCCCUACGGUGAGUGUU |
TTR_外顯子1 | + | TTTG | 15 | TGTCTGAGGCTGGCCCTACGGTGAGTGTTT | 120 | UGUCUGAGGCUGGCCCUACGGUGAGUGUUU |
TTR_外顯子1 | + | GTTT | 16 | CTGTGACATCCCATTCCTACATTTAAGATT | 121 | CUGUGACAUCCCAUUCCUACAUUUAAGAUU |
TTR_外顯子1 | + | TTTC | 17 | TGTGACATCCCATTCCTACATTTAAGATTC | 122 | UGUGACAUCCCAUUCCUACAUUUAAGAUUC |
TTR_外顯子1 | - | ATTT | 18 | AGCGTGAATCTTAAATGTAGGAATGGGATG | 123 | AGCGUGAAUCUUAAAUGUAGGAAUGGGAUG |
TTR_外顯子1 | - | TTTA | 19 | GCGTGAATCTTAAATGTAGGAATGGGATGT | 124 | GCGUGAAUCUUAAAUGUAGGAAUGGGAUGU |
TTR_外顯子1 | - | CTTA | 20 | AATGTAGGAATGGGATGTCACAGAAACACT | 125 | AAUGUAGGAAUGGGAUGUCACAGAAACACU |
TTR_外顯子1 | + | CTTG | 21 | GCAGGATGGCTTCTCATCGTCTGCTCCTCC | 126 | GCAGGAUGGCUUCUCAUCGUCUGCUCCUCC |
TTR_外顯子1 | + | ATTC | 22 | CTACATTTAAGATTCACGCTAAAT | 127 | CUACAUUUAAGAUUCACGCUAAAU |
TTR_外顯子2 | - | CTTG | 23 | GATTCACCGGTGCCCTGGGTGTAGAGAAGA | 128 | GAUUCACCGGUGCCCUGGGUGUAGAGAAGA |
TTR_外顯子2 | + | ATTT | 24 | TGTTAACTTCTCACGTGTCTTCTCTACACC | 129 | UGUUAACUUCUCACGUGUCUUCUCUACACC |
TTR_外顯子2 | + | TTTT | 25 | GTTAACTTCTCACGTGTCTTCTCTACACCC | 130 | GUUAACUUCUCACGUGUCUUCUCUACACCC |
TTR_外顯子2 | + | TTTG | 26 | TTAACTTCTCACGTGTCTTCTCTACACCCA | 131 | UUAACUUCUCACGUGUCUUCUCUACACCCA |
TTR_外顯子2 | + | CTTC | 27 | TCACGTGTCTTCTCTACACCCAGGGCACCG | 132 | UCACGUGUCUUCUCUACACCCAGGGCACCG |
TTR_外顯子2 | - | ATTC | 28 | ACCGGTGCCCTGGGTGTAGAGAAGACACGT | 133 | ACCGGUGCCCUGGGUGUAGAGAAGACACGU |
TTR_外顯子2 | + | GTTC | 29 | TAGATGCTGTCCGAGGCAGTCCTGCCATCA | 134 | UAGAUGCUGUCCGAGGCAGUCCUGCCAUCA |
TTR_外顯子2 | - | TTTG | 30 | ACCATCAGAGGACACTTGGATTCACCGGTG | 135 | ACCAUCAGAGGACACUUGGAUUCACCGGUG |
TTR_外顯子2 | - | CTTT | 31 | GACCATCAGAGGACACTTGGATTCACCGGT | 136 | GACCAUCAGAGGACACUUGGAUUCACCGGU |
TTR_外顯子2 | - | ATTG | 32 | ATGGCAGGACTGCCTCGGACAGCATCTAGA | 137 | AUGGCAGGACUGCCUCGGACAGCAUCUAGA |
TTR_外顯子2 | - | TTTC | 33 | TGAACACATGCACGGCCACATTGATGGCAG | 138 | UGAACACAUGCACGGCCACAUUGAUGGCAG |
TTR_外顯子2 | - | CTTT | 34 | CTGAACACATGCACGGCCACATTGATGGCA | 139 | CUGAACACAUGCACGGCCACAUUGAUGGCA |
TTR_外顯子2 | - | CTTA | 35 | CCCAGAGGCAAATGGCTCCCAGGTGTCATC | 140 | CCCAGAGGCAAAUGGCUCCCAGGUGUCAUC |
TTR_外顯子2 | - | TTTG | 36 | GCAACTTACCCAGAGGCAAATGGCTCCCAG | 141 | GCAACUUACCCAGAGGCAAAUGGCUCCCAG |
TTR_外顯子2 | + | CTTC | 37 | TCTACACCCAGGGCACCGGTGAATCCAAGT | 142 | UCUACACCCAGGGCACCGGUGAAUCCAAGU |
TTR_外顯子2 | - | CTTT | 38 | GGCAACTTACCCAGAGGCAAATGGCTCCCA | 143 | GGCAACUUACCCAGAGGCAAAUGGCUCCCA |
TTR_外顯子2 | + | GTTG | 39 | CCAAAGAACCCTCCCACAGGACTTGGTTTT | 144 | CCAAAGAACCCUCCCACAGGACUUGGUUUU |
TTR_外顯子2 | + | TTTG | 40 | CCTCTGGGTAAGTTGCCAAAGAACCCTCCC | 145 | CCUCUGGGUAAGUUGCCAAAGAACCCUCCC |
TTR_外顯子2 | + | ATTT | 41 | GCCTCTGGGTAAGTTGCCAAAGAACCCTCC | 146 | GCCUCUGGGUAAGUUGCCAAAGAACCCUCC |
TTR_外顯子2 | + | GTTC | 42 | AGAAAGGCTGCTGATGACACCTGGGAGCCA | 147 | AGAAAGGCUGCUGAUGACACCUGGGAGCCA |
TTR_外顯子2 | - | GTTC | 43 | TTTGGCAACTTACCCAGAGGCAAATGGCTC | 148 | UUUGGCAACUUACCCAGAGGCAAAUGGCUC |
TTR_外顯子2 | + | GTTA | 44 | ACTTCTCACGTGTCTTCTCTACACCCAGGG | 149 | ACUUCUCACGUGUCUUCUCUACACCCAGGG |
TTR_外顯子2 | - | GTTA | 45 | ACAAAATTGATCAGAGTGAA | 150 | ACAAAAUUGAUCAGAGUGAA |
TTR_外顯子3 | + | CTTG | 46 | GCATCTCCCCATTCCATGAGCATGCAGAGG | 151 | GCAUCUCCCCAUUCCAUGAGCAUGCAGAGG |
TTR_外顯子3 | + | CTTA | 47 | CTGGAAGGCACTTGGCATCTCCCCATTCCA | 152 | CUGGAAGGCACUUGGCAUCUCCCCAUUCCA |
TTR_外顯子3 | + | TTTG | 48 | TAGAAGGGATATACAAAGTGGAAATAGACA | 153 | UAGAAGGGAUAUACAAAGUGGAAAUAGACA |
TTR_外顯子3 | - | CTTC | 49 | TACAAATTCCTCCTCAGTTGTGAGCCCATG | 154 | UACAAAUUCCUCCUCAGUUGUGAGCCCAUG |
TTR_外顯子3 | + | CTTC | 50 | GAGGGTTGTTTTGGTTTTGGTTTTTGCTTT | 155 | GAGGGUUGUUUUGGUUUUGGUUUUUGCUUU |
TTR_外顯子3 | - | CTTC | 51 | CAGTAAGATTTGGTGTCTATTTCCACTTTG | 156 | CAGUAAGAUUUGGUGUCUAUUUCCACUUUG |
TTR_外顯子3 | - | ATTT | 52 | GGTGTCTATTTCCACTTTGTATATCCCTTC | 157 | GGUGUCUAUUUCCACUUUGUAUAUCCCUUC |
TTR_外顯子3 | - | TTTG | 53 | GTGTCTATTTCCACTTTGTATATCCCTTCT | 158 | GUGUCUAUUUCCACUUUGUAUAUCCCUUCU |
TTR_外顯子3 | - | ATTT | 54 | CCACTTTGTATATCCCTTCTACAAATTCCT | 159 | CCACUUUGUAUAUCCCUUCUACAAAUUCCU |
TTR_外顯子3 | - | TTTC | 55 | CACTTTGTATATCCCTTCTACAAATTCCTC | 160 | CACUUUGUAUAUCCCUUCUACAAAUUCCUC |
TTR_外顯子3 | - | CTTT | 56 | GTATATCCCTTCTACAAATTCCTCCTCAGT | 161 | GUAUAUCCCUUCUACAAAUUCCUCCUCAGU |
TTR_外顯子3 | - | TTTG | 57 | TATATCCCTTCTACAAATTCCTCCTCAGTT | 162 | UAUAUCCCUUCUACAAAUUCCUCCUCAGUU |
TTR_外顯子3 | + | ATTT | 58 | GTAGAAGGGATATACAAAGTGGAAATAGAC | 163 | GUAGAAGGGAUAUACAAAGUGGAAAUAGAC |
TTR_外顯子3 | - | ATTC | 59 | CTCCTCAGTTGTGAGCCCATGCAGCTCTCC | 164 | CUCCUCAGUUGUGAGCCCAUGCAGCUCUCC |
TTR_外顯子3 | - | GTTG | 60 | TGAGCCCATGCAGCTCTCCAGACTCACTGG | 165 | UGAGCCCAUGCAGCUCUCCAGACUCACUGG |
TTR_外顯子3 | - | GTTT | 61 | TCCTATAAGGTGTGAAAGTCTGGATTAAGT | 166 | UCCUAUAAGGUGUGAAAGUCUGGAUUAAGU |
TTR_外顯子3 | - | TTTT | 62 | CCTATAAGGTGTGAAAGTCTGGATTAAGTT | 167 | CCUAUAAGGUGUGAAAGUCUGGAUUAAGUU |
TTR_外顯子3 | - | TTTC | 63 | CTATAAGGTGTGAAAGTCTGGATTAAGTTA | 168 | CUAUAAGGUGUGAAAGUCUGGAUUAAGUUA |
TTR_外顯子3 | + | ATTC | 64 | CATGAGCATGCAGAGGTGAGTATACAGACC | 169 | CAUGAGCAUGCAGAGGUGAGUAUACAGACC |
TTR_外顯子3 | + | CTTA | 65 | TAGGAAAACCAGTGAGTCTGGAGAGCTGCA | 170 | UAGGAAAACCAGUGAGUCUGGAGAGCUGCA |
TTR_外顯子3 | + | ATTT | 66 | GTTTCCTCCATGCGTAACTTAATCCAGACT | 171 | GUUUCCUCCAUGCGUAACUUAAUCCAGACU |
TTR_外顯子3 | + | CTTT | 67 | CACACCTTATAGGAAAACCAGTGAGTCTGG | 172 | CACACCUUAUAGGAAAACCAGUGAGUCUGG |
TTR_外顯子3 | + | CTTA | 68 | ATCCAGACTTTCACACCTTATAGGAAAACC | 173 | AUCCAGACUUUCACACCUUAUAGGAAAACC |
TTR_外顯子3 | + | TTTC | 69 | CTCCATGCGTAACTTAATCCAGACTTTCAC | 174 | CUCCAUGCGUAACUUAAUCCAGACUUUCAC |
TTR_外顯子3 | + | GTTT | 70 | CCTCCATGCGTAACTTAATCCAGACTTTCA | 175 | CCUCCAUGCGUAACUUAAUCCAGACUUUCA |
TTR_外顯子3 | + | TTTG | 71 | TTTCCTCCATGCGTAACTTAATCCAGACTT | 176 | UUUCCUCCAUGCGUAACUUAAUCCAGACUU |
TTR_外顯子3 | + | TTTC | 72 | ACACCTTATAGGAAAACCAGTGAGTCTGGA | 177 | ACACCUUAUAGGAAAACCAGUGAGUCUGGA |
TTR_外顯子3 | + | GTTG | 73 | TTTTGGTTTTGGTTTTTGCTTTTG | 178 | UUUUGGUUUUGGUUUUUGCUUUUG |
TTR_外顯子3 | + | GTTT | 74 | TGGTTTTGGTTTTTGCTTTTG | 179 | UGGUUUUGGUUUUUGCUUUUG |
TTR_外顯子3 | + | TTTT | 75 | GGTTTTGGTTTTTGCTTTTG | 180 | GGUUUUGGUUUUUGCUUUUG |
TTR_外顯子3 | - | ATTA | 76 | AGTTACGCATGGAGGAAACAAATGG | 181 | AGUUACGCAUGGAGGAAACAAAUGG |
TTR_外顯子3 | - | GTTA | 77 | CGCATGGAGGAAACAAATGG | 182 | CGCAUGGAGGAAACAAAUGG |
TTR_外顯子4 | + | TTTA | 78 | CTAAAGCAGTGTTTTCACCTCATATGCTAT | 183 | CUAAAGCAGUGUUUUCACCUCAUAUGCUAU |
TTR_外顯子4 | + | TTTT | 79 | ACTAAAGCAGTGTTTTCACCTCATATGCTA | 184 | ACUAAAGCAGUGUUUUCACCUCAUAUGCUA |
TTR_外顯子4 | + | TTTT | 80 | TACTAAAGCAGTGTTTTCACCTCATATGCT | 185 | UACUAAAGCAGUGUUUUCACCUCAUAUGCU |
TTR_外顯子4 | + | ATTT | 81 | TTACTAAAGCAGTGTTTTCACCTCATATGC | 186 | UUACUAAAGCAGUGUUUUCACCUCAUAUGC |
TTR_外顯子4 | + | ATTC | 82 | CATTTTTACTAAAGCAGTGTTTTCACCTCA | 187 | CAUUUUUACUAAAGCAGUGUUUUCACCUCA |
TTR_外顯子4 | + | TTTC | 83 | ATGTAACCAAGAGTATTCCATTTTTACTAA | 188 | AUGUAACCAAGAGUAUUCCAUUUUUACUAA |
TTR_外顯子4 | + | ATTT | 84 | CATGTAACCAAGAGTATTCCATTTTTACTA | 189 | CAUGUAACCAAGAGUAUUCCAUUUUUACUA |
TTR_外顯子4 | + | ATTC | 85 | CACCACGGCTGTCGTCACCAATCCCAAGGA | 190 | CACCACGGCUGUCGUCACCAAUCCCAAGGA |
TTR_外顯子4 | + | GTTT | 86 | TCACCTCATATGCTATGTTAGAAGTCCAGG | 191 | UCACCUCAUAUGCUAUGUUAGAAGUCCAGG |
TTR_外顯子4 | + | ATTG | 87 | CCGCCCTGCTGAGCCCCTACTCCTATTCCA | 192 | CCGCCCUGCUGAGCCCCUACUCCUAUUCCA |
TTR_外顯子4 | + | ATTC | 88 | ACAGCCAACGACTCCGGCCCCCGCCGCTAC | 193 | ACAGCCAACGACUCCGGCCCCCGCCGCUAC |
TTR_外顯子4 | + | CTTC | 89 | TCTCATAGGTGGTATTCACAGCCAACGACT | 194 | UCUCAUAGGUGGUAUUCACAGCCAACGACU |
TTR_外顯子4 | + | TTTC | 90 | GGGCTCTGGTGGAAATGGATCTGTCTGTCT | 195 | GGGCUCUGGUGGAAAUGGAUCUGUCUGUCU |
TTR_外顯子4 | + | TTTT | 91 | CGGGCTCTGGTGGAAATGGATCTGTCTGTC | 196 | CGGGCUCUGGUGGAAAUGGAUCUGUCUGUC |
TTR_外顯子4 | + | TTTT | 92 | TCGGGCTCTGGTGGAAATGGATCTGTCTGT | 197 | UCGGGCUCUGGUGGAAAUGGAUCUGUCUGU |
TTR_外顯子4 | + | CTTC | 93 | TCCTCCAGTGGACCTGAAGGACGAGGGATG | 198 | UCCUCCAGUGGACCUGAAGGACGAGGGAUG |
TTR_外顯子4 | + | TTTT | 94 | CACCTCATATGCTATGTTAGAAGTCCAGGC | 199 | CACCUCAUAUGCUAUGUUAGAAGUCCAGGC |
TTR_外顯子4 | - | CTTT | 95 | CACAGGAATGTTTTATTGTCTCTGCCTGGA | 200 | CACAGGAAUGUUUUAUUGUCUCUGCCUGGA |
TTR_外顯子4 | + | GTTA | 96 | GAAGTCCAGGCAGAGACAATAAAACATTCC | 201 | GAAGUCCAGGCAGAGACAAUAAAACAUUCC |
TTR_外顯子4 | - | GTTG | 97 | GCTGTGAATACCACCTATGAGAGAAGACAG | 202 | GCUGUGAAUACCACCUAUGAGAGAAGACAG |
TTR_外顯子4 | - | ATTG | 98 | GTGACGACAGCCGTGGTGGAATAGGAGTAG | 203 | GUGACGACAGCCGUGGUGGAAUAGGAGUAG |
TTR_外顯子4 | - | CTTG | 99 | GGATTGGTGACGACAGCCGTGGTGGAATAG | 204 | GGAUUGGUGACGACAGCCGUGGUGGAAUAG |
TTR_外顯子4 | - | ATTC | 100 | CTTGGGATTGGTGACGACAGCCGTGGTGGA | 205 | CUUGGGAUUGGUGACGACAGCCGUGGUGGA |
TTR_外顯子4 | - | CTTC | 101 | AGGTCCACTGGAGGAGAAGTCCCTCATTCC | 206 | AGGUCCACUGGAGGAGAAGUCCCUCAUUCC |
TTR_外顯子4 | - | GTTA | 102 | CATGAAATCCCATCCCTCGTCCTTCAGGTC | 207 | CAUGAAAUCCCAUCCCUCGUCCUUCAGGUC |
TTR_外顯子4 | - | CTTG | 103 | GTTACATGAAATCCCATCCCTCGTCCTTCA | 208 | GUUACAUGAAAUCCCAUCCCUCGUCCUUCA |
TTR_外顯子4 | - | TTTA | 104 | GTAAAAATGGAATACTCTTGGTTACATGAA | 209 | GUAAAAAUGGAAUACUCUUGGUUACAUGAA |
TTR_外顯子4 | - | CTTT | 105 | AGTAAAAATGGAATACTCTTGGTTACATGA | 210 | AGUAAAAAUGGAAUACUCUUGGUUACAUGA |
TTR_外顯子4 | - | CTTC | 106 | TAACATAGCATATGAGGTGAAAACACTGCT | 211 | UAACAUAGCAUAUGAGGUGAAAACACUGCU |
TTR_外顯子4 | - | ATTG | 107 | TCTCTGCCTGGACTTCTAACATAGCATATG | 212 | UCUCUGCCUGGACUUCUAACAUAGCAUAUG |
TTR_外顯子4 | - | TTTA | 108 | TTGTCTCTGCCTGGACTTCTAACATAGCAT | 213 | UUGUCUCUGCCUGGACUUCUAACAUAGCAU |
TTR_外顯子4 | - | TTTT | 109 | ATTGTCTCTGCCTGGACTTCTAACATAGCA | 214 | AUUGUCUCUGCCUGGACUUCUAACAUAGCA |
TTR_外顯子4 | - | GTTT | 110 | TATTGTCTCTGCCTGGACTTCTAACATAGC | 215 | UAUUGUCUCUGCCUGGACUUCUAACAUAGC |
TTR_外顯子4 | - | TTTC | 111 | ACAGGAATGTTTTATTGTCTCTGCCTGGAC | 216 | ACAGGAAUGUUUUAUUGUCUCUGCCUGGAC |
TTR_外顯子4 | + | TTTC | 112 | ACCTCATATGCTATGTTAGAAGTCCAGGCA | 217 | ACCUCAUAUGCUAUGUUAGAAGUCCAGGCA |
TTR_外顯子4 | + | GTTT | 113 | TTCGGGCTCTGGTGGAAATGGATCTGTCTG | 218 | UUCGGGCUCUGGUGGAAAUGGAUCUGUCUG |
TTR_外顯子4 | - | ATTT | 114 | CCACCAGAGCCCGAAAAACGTG | 219 | CCACCAGAGCCCGAAAAACGUG |
TTR_外顯子4 | - | TTTC | 115 | CACCAGAGCCCGAAAAACGTG | 220 | CACCAGAGCCCGAAAAACGUG |
本揭露內容包括與本文本揭露內容一致的、以上列出的直接重複序列和間隔子序列的所有組合。
在一些實施方式中,本文所述之間隔子序列包含尿嘧啶(U)。在一些實施方式中,本文所述之間隔子序列包含胸腺嘧啶(T)。在一些實施方式中,根據表5的間隔子序列包含這樣的序列,該序列在表5中指示為尿嘧啶的一或多個(例如,所有)位置中包含胸腺嘧啶。
本揭露內容包括包含本文所述之直接重複序列和間隔子(例如,如在以上表5中闡述)的任何和所有組合的RNA指導物。在一些實施方式中,RNA指導物與SEQ ID NO: 273-278或345-362中的任一個具有至少90%的同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性)。在一些實施方式中,RNA指導物與SEQ ID NO: 273-278和345-362中的任一個具有至少95%的同一性(例如,至少95%、96%、97%、98%、或99%的同一性)。在一些實施方式中,RNA指導物具有SEQ ID NO: 273-278和345-362中任一個闡述的序列。
B. 模板 DNA
如本文揭露的基因編輯系統可以進一步包含模板DNA,可以將該模板DNA的一部分經由例如同源重組摻入TTR基因內的基因位點中,引起在TTR基因位點處如所希望的基因編輯,例如,靶TTR基因中的突變的糾正或保護性突變的引入。在一些情況下,待摻入TTR基因的模板DNA的部分可以經密碼子優化。
在一些實施方式中,模板DNA係單股核酸。在一些實施方式中,模板DNA係雙股核酸。在一些實施方式中,模板DNA係DNA、RNA或DNA/RNA雜交分子。在一些實施方式中,模板DNA係單股寡DNA核苷酸(ssODN)模板DNA或包含ssODN。在一些實施方式中,模板DNA係雙股寡DNA核苷酸(dsODN)模板DNA或包含dsODN。在一些實施方式中,模板DNA係線性的。在一些實施方式中,模板DNA係環狀的(例如,質體)。在一些實施方式中,模板DNA係外源核酸分子,例如,對於靶細胞係外源的。在一些實施方式中,模板DNA係染色分體(例如,姊妹染色分體)。在一些實施方式中,模板DNA由病毒遞送。
在一些實施方式中,模板DNA和TTR靶核酸的序列不相同。在一些實施方式中,模板DNA包含一或多個與靶核酸異源的(例如,非同源的)核苷酸。在一些實施方式中,模板DNA包含一或多個(例如,相對於靶核酸的一個、兩個、三個、四個、五個或更多個序列差異)。在一些實施方式中,模板DNA相對於靶核酸包含***、缺失、多型性、倒置、或重排。***可以包含限制性位點或可選擇標記。在一些實施方式中,使用模板DNA藉由HDR修復靶核酸中的斷裂(例如,由Cas12i多肽誘導的斷裂)。照此,模板DNA的使用可以藉由HDR在靶核酸中產生***、缺失或取代。在一些實施方式中,***可以包含基因(例如,野生型基因)、或其一部分。在一些實施方式中,***可以包含如與靶核酸(例如,細胞的靶基因組)相比的基因或其一部分的缺失。
當然應當理解,將來自模板DNA的序列差異摻入到靶核酸中不要求將來自模板DNA的一或多個核苷酸物理***到靶核酸中。相反,作為實例,模板DNA可以用作DNA合成的模板,使得將模板DNA的資訊內容摻入到靶核酸中,而不將模板DNA的核苷酸物理摻入到靶核酸中。例如,不希望受理論的束縛,可以將模板DNA用於靶核酸的同源定向修復(HDR)。
在一些實施方式中,模板DNA包含供體區,該供體區包含在5'同源臂與3'同源臂之間的一或多個核苷酸(例如,***序列)。在一些實施方式中,模板DNA包含5'同源臂下游的供體區(例如,***序列)。在一些實施方式中,模板DNA包含3'同源臂上游的供體區(例如,***序列)。在一些實施方式中,模板DNA包含足夠的同源性以允許HDR。在一些實施方式中,模板DNA的5'同源臂和/或3'同源臂將與靶核酸具有至少50%的序列同一性。在某些實施方式中,存在至少60%、70%、80%、90%、95%、98%、99%、或100%的序列同一性。
在一些實施方式中,5'同源臂和/或5'同源臂可以與希望進行基因編輯的TTR基因靶位點的上游和/或下游同源。側翼為一或多個同源臂的供體區可以經由例如同源重組摻入TTR基因靶位點中,從而將由該供體區編碼的編輯引入到TTR基因靶位點中。
在一些實施方式中,單股模板DNA包含供體區(例如,***序列),該供體區的長度為1個核苷酸至約200個核苷酸,例如,1個核苷酸至5個核苷酸、5個核苷酸至10個核苷酸、10個核苷酸至15個核苷酸、15個核苷酸至20個核苷酸、20個核苷酸至25個核苷酸、25個核苷酸至30個核苷酸、30個核苷酸至35個核苷酸、35個核苷酸至40個核苷酸、40個核苷酸至45個核苷酸、45個核苷酸至50個核苷酸、50個核苷酸至55個核苷酸、55個核苷酸至60個核苷酸、60個核苷酸至65個核苷酸、65個核苷酸至70個核苷酸、70個核苷酸至75個核苷酸、75個核苷酸至80個核苷酸、80個核苷酸至85個核苷酸、85個核苷酸至90個核苷酸、90個核苷酸至95個核苷酸、95個核苷酸至100個核苷酸、100個核苷酸至105個核苷酸、105個核苷酸至110個核苷酸、110個核苷酸至115個核苷酸、115個核苷酸至120個核苷酸、120個核苷酸至125個核苷酸、125個核苷酸至130個核苷酸、130個核苷酸至135個核苷酸、135個核苷酸至140個核苷酸、140個核苷酸至145個核苷酸、145個核苷酸至150個核苷酸、150個核苷酸至155個核苷酸、155個核苷酸至160個核苷酸、160個核苷酸至165個核苷酸、165個核苷酸至170個核苷酸、170個核苷酸至175個核苷酸、175個核苷酸至180個核苷酸、180個核苷酸至185個核苷酸、185個核苷酸至190個核苷酸、190個核苷酸至195個核苷酸、或195個核苷酸至200個核苷酸。
在一些實施方式中,雙股模板DNA包含長度多達約10,000個鹼基對(10 kb)的供體區(例如,***序列)。例如,在一些實施方式中,雙股模板DNA包含供體區(例如,***物),該供體區的長度為1個鹼基對、約10個鹼基對、約20個鹼基對、約30個鹼基對、約40個鹼基對、約50個鹼基對、約60個鹼基對、約70個鹼基對、約80個鹼基對、約90個鹼基對、約100個鹼基對、約200個鹼基對、約300個鹼基對、約400個鹼基對、約500個鹼基對、約600個鹼基對、約700個鹼基對、約800個鹼基對、約900個鹼基對、約1 kb、約1.1 kb、約1.2 kb、約1.3 kb、約1.4 kb、約1.5 kb、約1.6 kb、約1.7 kb、約1.8 kb、約1.9 kb、約2 kb、約2.1 kb、約2.2 kb、約2.3 kb、約2.4 kb、約2.5 kb、約2.6 kb、約2.7 kb、約2.8 kb、約2.9 kb、3 kb、約3.1 kb、約3.2 kb、約3.3 kb、約3.4 kb、約3.5 kb、約3.6 kb、約3.7 kb、約3.8 kb、約3.9 kb、約4 kb、約4.1 kb、約4.2 kb、約4.3 kb、約4.4 kb、約4.5 kb、約4.6 kb、約4.7 kb、約4.8 kb、約4.9 kb、約5 kb、約5.1 kb、約5.2 kb、約5.3 kb、約5.4 kb、約5.5 kb、約5.6 kb、約5.7 kb、約5.8 kb、約5.9 kb、約6 kb、約6.1 kb、約6.2 kb、約6.3 kb、約6.4 kb、約6.5 kb、約6.6 kb、約6.7 kb、約6.8 kb、約6.9 kb、約7 kb、約7.1 kb、約7.2 kb、約7.3 kb、約7.4 kb、約7.5 kb、約7.6 kb、約7.7 kb、約7.8 kb、約7.9 kb、約8 kb、約8.1 kb、約8.2 kb、約8.3 kb、約8.4 kb、約8.5 kb、約8.6 kb、約8.7 kb、約8.8 kb、約8.9 kb、約9 kb、約9.1 kb、約9.2 kb、約9.3 kb、約9.4 kb、約9.5 kb、約9.6 kb、約9.7 kb、約9.8 kb、約9.9 kb、或約10 kb。
在一些實施方式中,模板DNA包含一個或兩個側翼同源臂。在一些實施方式中,模板DNA包含5'同源臂(例如,左同源臂)。在一些實施方式中,模板DNA包含3'同源臂(例如,右同源臂)。在一些實施方式中,模板DNA包含5'同源臂和3’同源臂。
在一些實施方式中,單股模板DNA包含5'同源臂(例如,左同源臂),該同源臂的長度為約20個核苷酸至約200個核苷酸,例如,20個核苷酸至25個核苷酸、25個核苷酸至30個核苷酸、30個核苷酸至35個核苷酸、35個核苷酸至40個核苷酸、40個核苷酸至45個核苷酸、45個核苷酸至50個核苷酸、50個核苷酸至55個核苷酸、55個核苷酸至60個核苷酸、60個核苷酸至65個核苷酸、65個核苷酸至70個核苷酸、70個核苷酸至75個核苷酸、75個核苷酸至80個核苷酸、80個核苷酸至85個核苷酸、85個核苷酸至90個核苷酸、90個核苷酸至95個核苷酸、95個核苷酸至100個核苷酸、100個核苷酸至105個核苷酸、105個核苷酸至110個核苷酸、110個核苷酸至115個核苷酸、115個核苷酸至120個核苷酸、120個核苷酸至125個核苷酸、125個核苷酸至130個核苷酸、130個核苷酸至135個核苷酸、135個核苷酸至140個核苷酸、140個核苷酸至145個核苷酸、145個核苷酸至150個核苷酸、150個核苷酸至155個核苷酸、155個核苷酸至160個核苷酸、160個核苷酸至165個核苷酸、165個核苷酸至170個核苷酸、170個核苷酸至175個核苷酸、175個核苷酸至180個核苷酸、180個核苷酸至185個核苷酸、185個核苷酸至190個核苷酸、190個核苷酸至195個核苷酸、或195個核苷酸至200個核苷酸。在一些實施方式中,單股模板DNA包含5'同源臂(例如,左同源臂),該同源臂的長度為約200個核苷酸至約500個核苷酸,例如,200個核苷酸至210個核苷酸、210個核苷酸至220個核苷酸、220個核苷酸至230個核苷酸、230個核苷酸至240個核苷酸、240個核苷酸至250個核苷酸、250個核苷酸至260個核苷酸、260個核苷酸至270個核苷酸、270個核苷酸至280個核苷酸、280個核苷酸至290個核苷酸、290個核苷酸至300個核苷酸、300個核苷酸至310個核苷酸、310個核苷酸至320個核苷酸、320個核苷酸至330個核苷酸、330個核苷酸至340個核苷酸、340個核苷酸至350個核苷酸、350個核苷酸至360個核苷酸、360個核苷酸至370個核苷酸、370個核苷酸至380個核苷酸、380個核苷酸至390個核苷酸、390個核苷酸至400個核苷酸、400個核苷酸至410個核苷酸、410個核苷酸至420個核苷酸、420個核苷酸至430個核苷酸、430個核苷酸至440個核苷酸、440個核苷酸至450個核苷酸、450個核苷酸至460個核苷酸、460個核苷酸至470個核苷酸、470個核苷酸至480個核苷酸、480個核苷酸至490個核苷酸、或490個核苷酸至500個核苷酸。
在一些實施方式中,單股模板DNA包含3'同源臂(例如,右同源臂),該同源臂的長度為約20個核苷酸至約200個核苷酸,例如,20個核苷酸至25個核苷酸、25個核苷酸至30個核苷酸、30個核苷酸至35個核苷酸、35個核苷酸至40個核苷酸、40個核苷酸至45個核苷酸、45個核苷酸至50個核苷酸、50個核苷酸至55個核苷酸、55個核苷酸至60個核苷酸、60個核苷酸至65個核苷酸、65個核苷酸至70個核苷酸、70個核苷酸至75個核苷酸、75個核苷酸至80個核苷酸、80個核苷酸至85個核苷酸、85個核苷酸至90個核苷酸、90個核苷酸至95個核苷酸、95個核苷酸至100個核苷酸、100個核苷酸至105個核苷酸、105個核苷酸至110個核苷酸、110個核苷酸至115個核苷酸、115個核苷酸至120個核苷酸、120個核苷酸至125個核苷酸、125個核苷酸至130個核苷酸、130個核苷酸至135個核苷酸、135個核苷酸至140個核苷酸、140個核苷酸至145個核苷酸、145個核苷酸至150個核苷酸、150個核苷酸至155個核苷酸、155個核苷酸至160個核苷酸、160個核苷酸至165個核苷酸、165個核苷酸至170個核苷酸、170個核苷酸至175個核苷酸、175個核苷酸至180個核苷酸、180個核苷酸至185個核苷酸、185個核苷酸至190個核苷酸、190個核苷酸至195個核苷酸、或195個核苷酸至200個核苷酸。在一些實施方式中,單股模板DNA包含3'同源臂(例如,右同源臂),該同源臂的長度為約200個核苷酸至約500個核苷酸,例如,200個核苷酸至210個核苷酸、210個核苷酸至220個核苷酸、220個核苷酸至230個核苷酸、230個核苷酸至240個核苷酸、240個核苷酸至250個核苷酸、250個核苷酸至260個核苷酸、260個核苷酸至270個核苷酸、270個核苷酸至280個核苷酸、280個核苷酸至290個核苷酸、290個核苷酸至300個核苷酸、300個核苷酸至310個核苷酸、310個核苷酸至320個核苷酸、320個核苷酸至330個核苷酸、330個核苷酸至340個核苷酸、340個核苷酸至350個核苷酸、350個核苷酸至360個核苷酸、360個核苷酸至370個核苷酸、370個核苷酸至380個核苷酸、380個核苷酸至390個核苷酸、390個核苷酸至400個核苷酸、400個核苷酸至410個核苷酸、410個核苷酸至420個核苷酸、420個核苷酸至430個核苷酸、430個核苷酸至440個核苷酸、440個核苷酸至450個核苷酸、450個核苷酸至460個核苷酸、460個核苷酸至470個核苷酸、470個核苷酸至480個核苷酸、480個核苷酸至490個核苷酸、或490個核苷酸至500個核苷酸。
在一些實施方式中,雙股模板DNA包含5'同源臂(例如,左同源臂),該同源臂的長度為約20個鹼基對至約200個鹼基對,例如,20個鹼基對至25個鹼基對、25個鹼基對至30個鹼基對、30個鹼基對至35個鹼基對、35個鹼基對至40個鹼基對、40個鹼基對至45個鹼基對、45個鹼基對至50個鹼基對、50個鹼基對至55個鹼基對、55個鹼基對至60個鹼基對、60個鹼基對至65個鹼基對、65個鹼基對至70個鹼基對、70個鹼基對至75個鹼基對、75個鹼基對至80個鹼基對、80個鹼基對至85個鹼基對、85個鹼基對至90個鹼基對、90個鹼基對至95個鹼基對、95個鹼基對至100個鹼基對、100個鹼基對至105個鹼基對、105個鹼基對至110個鹼基對、110個鹼基對至115個鹼基對、115個鹼基對至120個鹼基對、120個鹼基對至125個鹼基對、125個鹼基對至130個鹼基對、130個鹼基對至135個鹼基對、135個鹼基對至140個鹼基對、140個鹼基對至145個鹼基對、145個鹼基對至150個鹼基對、150個鹼基對至155個鹼基對、155個鹼基對至160個鹼基對、160個鹼基對至165個鹼基對、165個鹼基對至170個鹼基對、170個鹼基對至175個鹼基對、175個鹼基對至180個鹼基對、180個鹼基對至185個鹼基對、185個鹼基對至190個鹼基對、190個鹼基對至195個鹼基對、或195個鹼基對至200個鹼基對。在一些實施方式中,雙股模板DNA包含5'同源臂(例如,左同源臂),該同源臂的長度為約200個鹼基對至約500個鹼基對,例如,200個鹼基對至210個鹼基對、210個鹼基對至220個鹼基對、220個鹼基對至230個鹼基對、230個鹼基對至240個鹼基對、240個鹼基對至250個鹼基對、250個鹼基對至260個鹼基對、260個鹼基對至270個鹼基對、270個鹼基對至280個鹼基對、280個鹼基對至290個鹼基對、290個鹼基對至300個鹼基對、300個鹼基對至310個鹼基對、310個鹼基對至320個鹼基對、320個鹼基對至330個鹼基對、330個鹼基對至340個鹼基對、340個鹼基對至350個鹼基對、350個鹼基對至360個鹼基對、360個鹼基對至370個鹼基對、370個鹼基對至380個鹼基對、380個鹼基對至390個鹼基對、390個鹼基對至400個鹼基對、400個鹼基對至410個鹼基對、410個鹼基對至420個鹼基對、420個鹼基對至430個鹼基對、430個鹼基對至440個鹼基對、440個鹼基對至450個鹼基對、450個鹼基對至460個鹼基對、460個鹼基對至470個鹼基對、470個鹼基對至480個鹼基對、480個鹼基對至490個鹼基對、或490個鹼基對至500個鹼基對。在一些實施方式中,雙股模板DNA包含5'同源臂,該同源臂的長度為至少500個鹼基對,例如,500個鹼基對至550個鹼基對、550個鹼基對至600個鹼基對、600個鹼基對至650個鹼基對、650個鹼基對至700個鹼基對、700個鹼基對至750個鹼基對、750個鹼基對至800個鹼基對、800個鹼基對至850個鹼基對、850個鹼基對至900個鹼基對、900個鹼基對至950個鹼基對、或950個鹼基對至1,000個鹼基對(1 kb)。
在一些實施方式中,雙股模板DNA包含3'同源臂(例如,右同源臂),該同源臂的長度為約20個鹼基對至約200個鹼基對,例如,20個鹼基對至25個鹼基對、25個鹼基對至30個鹼基對、30個鹼基對至35個鹼基對、35個鹼基對至40個鹼基對、40個鹼基對至45個鹼基對、45個鹼基對至50個鹼基對、50個鹼基對至55個鹼基對、55個鹼基對至60個鹼基對、60個鹼基對至65個鹼基對、65個鹼基對至70個鹼基對、70個鹼基對至75個鹼基對、75個鹼基對至80個鹼基對、80個鹼基對至85個鹼基對、85個鹼基對至90個鹼基對、90個鹼基對至95個鹼基對、95個鹼基對至100個鹼基對、100個鹼基對至105個鹼基對、105個鹼基對至110個鹼基對、110個鹼基對至115個鹼基對、115個鹼基對至120個鹼基對、120個鹼基對至125個鹼基對、125個鹼基對至130個鹼基對、130個鹼基對至135個鹼基對、135個鹼基對至140個鹼基對、140個鹼基對至145個鹼基對、145個鹼基對至150個鹼基對、150個鹼基對至155個鹼基對、155個鹼基對至160個鹼基對、160個鹼基對至165個鹼基對、165個鹼基對至170個鹼基對、170個鹼基對至175個鹼基對、175個鹼基對至180個鹼基對、180個鹼基對至185個鹼基對、185個鹼基對至190個鹼基對、190個鹼基對至195個鹼基對、或195個鹼基對至200個鹼基對。在一些實施方式中,雙股模板DNA包含3'同源臂(例如,右同源臂),該同源臂的長度為約200個鹼基對至約500個鹼基對,例如,200個鹼基對至210個鹼基對、210個鹼基對至220個鹼基對、220個鹼基對至230個鹼基對、230個鹼基對至240個鹼基對、240個鹼基對至250個鹼基對、250個鹼基對至260個鹼基對、260個鹼基對至270個鹼基對、270個鹼基對至280個鹼基對、280個鹼基對至290個鹼基對、290個鹼基對至300個鹼基對、300個鹼基對至310個鹼基對、310個鹼基對至320個鹼基對、320個鹼基對至330個鹼基對、330個鹼基對至340個鹼基對、340個鹼基對至350個鹼基對、350個鹼基對至360個鹼基對、360個鹼基對至370個鹼基對、370個鹼基對至380個鹼基對、380個鹼基對至390個鹼基對、390個鹼基對至400個鹼基對、400個鹼基對至410個鹼基對、410個鹼基對至420個鹼基對、420個鹼基對至430個鹼基對、430個鹼基對至440個鹼基對、440個鹼基對至450個鹼基對、450個鹼基對至460個鹼基對、460個鹼基對至470個鹼基對、470個鹼基對至480個鹼基對、480個鹼基對至490個鹼基對、或490個鹼基對至500個鹼基對。在一些實施方式中,雙股模板DNA包含3'同源臂(例如,右同源臂),該同源臂的長度為至少500個鹼基對,例如,500個鹼基對至550個鹼基對、550個鹼基對至600個鹼基對、600個鹼基對至650個鹼基對、650個鹼基對至700個鹼基對、700個鹼基對至750個鹼基對、750個鹼基對至800個鹼基對、800個鹼基對至850個鹼基對、850個鹼基對至900個鹼基對、900個鹼基對至950個鹼基對、或950個鹼基對至1,000個鹼基對(1 kb)。
在一些實施方式中,雙股模板DNA包含正義股5'同源臂(例如,左同源臂),該同源臂的長度為約20個鹼基對至約200個鹼基對,例如,20個鹼基對至25個鹼基對、25個鹼基對至30個鹼基對、30個鹼基對至35個鹼基對、35個鹼基對至40個鹼基對、40個鹼基對至45個鹼基對、45個鹼基對至50個鹼基對、50個鹼基對至55個鹼基對、55個鹼基對至60個鹼基對、60個鹼基對至65個鹼基對、65個鹼基對至70個鹼基對、70個鹼基對至75個鹼基對、75個鹼基對至80個鹼基對、80個鹼基對至85個鹼基對、85個鹼基對至90個鹼基對、90個鹼基對至95個鹼基對、95個鹼基對至100個鹼基對、100個鹼基對至105個鹼基對、105個鹼基對至110個鹼基對、110個鹼基對至115個鹼基對、115個鹼基對至120個鹼基對、120個鹼基對至125個鹼基對、125個鹼基對至130個鹼基對、130個鹼基對至135個鹼基對、135個鹼基對至140個鹼基對、140個鹼基對至145個鹼基對、145個鹼基對至150個鹼基對、150個鹼基對至155個鹼基對、155個鹼基對至160個鹼基對、160個鹼基對至165個鹼基對、165個鹼基對至170個鹼基對、170個鹼基對至175個鹼基對、175個鹼基對至180個鹼基對、180個鹼基對至185個鹼基對、185個鹼基對至190個鹼基對、190個鹼基對至195個鹼基對、或195個鹼基對至200個鹼基對。在一些實施方式中,雙股模板DNA包含正義股5'同源臂(例如,左同源臂),該同源臂的長度為約200個鹼基對至約500個鹼基對,例如,200個鹼基對至210個鹼基對、210個鹼基對至220個鹼基對、220個鹼基對至230個鹼基對、230個鹼基對至240個鹼基對、240個鹼基對至250個鹼基對、250個鹼基對至260個鹼基對、260個鹼基對至270個鹼基對、270個鹼基對至280個鹼基對、280個鹼基對至290個鹼基對、290個鹼基對至300個鹼基對、300個鹼基對至310個鹼基對、310個鹼基對至320個鹼基對、320個鹼基對至330個鹼基對、330個鹼基對至340個鹼基對、340個鹼基對至350個鹼基對、350個鹼基對至360個鹼基對、360個鹼基對至370個鹼基對、370個鹼基對至380個鹼基對、380個鹼基對至390個鹼基對、390個鹼基對至400個鹼基對、400個鹼基對至410個鹼基對、410個鹼基對至420個鹼基對、420個鹼基對至430個鹼基對、430個鹼基對至440個鹼基對、440個鹼基對至450個鹼基對、450個鹼基對至460個鹼基對、460個鹼基對至470個鹼基對、470個鹼基對至480個鹼基對、480個鹼基對至490個鹼基對、或490個鹼基對至500個鹼基對。在一些實施方式中,雙股模板DNA包含正義股5'同源臂,該同源臂的長度為至少500個鹼基對,例如,500個鹼基對至550個鹼基對、550個鹼基對至600個鹼基對、600個鹼基對至650個鹼基對、650個鹼基對至700個鹼基對、700個鹼基對至750個鹼基對、750個鹼基對至800個鹼基對、800個鹼基對至850個鹼基對、850個鹼基對至900個鹼基對、900個鹼基對至950個鹼基對、或950個鹼基對至1,000個鹼基對(1 kb)。
在一些實施方式中,雙股模板DNA包含正義股3'同源臂(例如,右同源臂),該同源臂的長度為約20個鹼基對至約200個鹼基對,例如,20個鹼基對至25個鹼基對、25個鹼基對至30個鹼基對、30個鹼基對至35個鹼基對、35個鹼基對至40個鹼基對、40個鹼基對至45個鹼基對、45個鹼基對至50個鹼基對、50個鹼基對至55個鹼基對、55個鹼基對至60個鹼基對、60個鹼基對至65個鹼基對、65個鹼基對至70個鹼基對、70個鹼基對至75個鹼基對、75個鹼基對至80個鹼基對、80個鹼基對至85個鹼基對、85個鹼基對至90個鹼基對、90個鹼基對至95個鹼基對、95個鹼基對至100個鹼基對、100個鹼基對至105個鹼基對、105個鹼基對至110個鹼基對、110個鹼基對至115個鹼基對、115個鹼基對至120個鹼基對、120個鹼基對至125個鹼基對、125個鹼基對至130個鹼基對、130個鹼基對至135個鹼基對、135個鹼基對至140個鹼基對、140個鹼基對至145個鹼基對、145個鹼基對至150個鹼基對、150個鹼基對至155個鹼基對、155個鹼基對至160個鹼基對、160個鹼基對至165個鹼基對、165個鹼基對至170個鹼基對、170個鹼基對至175個鹼基對、175個鹼基對至180個鹼基對、180個鹼基對至185個鹼基對、185個鹼基對至190個鹼基對、190個鹼基對至195個鹼基對、或195個鹼基對至200個鹼基對。在一些實施方式中,雙股模板DNA包含正義股3'同源臂(例如,右同源臂),該同源臂的長度為約200個鹼基對至約500個鹼基對,例如,200個鹼基對至210個鹼基對、210個鹼基對至220個鹼基對、220個鹼基對至230個鹼基對、230個鹼基對至240個鹼基對、240個鹼基對至250個鹼基對、250個鹼基對至260個鹼基對、260個鹼基對至270個鹼基對、270個鹼基對至280個鹼基對、280個鹼基對至290個鹼基對、290個鹼基對至300個鹼基對、300個鹼基對至310個鹼基對、310個鹼基對至320個鹼基對、320個鹼基對至330個鹼基對、330個鹼基對至340個鹼基對、340個鹼基對至350個鹼基對、350個鹼基對至360個鹼基對、360個鹼基對至370個鹼基對、370個鹼基對至380個鹼基對、380個鹼基對至390個鹼基對、390個鹼基對至400個鹼基對、400個鹼基對至410個鹼基對、410個鹼基對至420個鹼基對、420個鹼基對至430個鹼基對、430個鹼基對至440個鹼基對、440個鹼基對至450個鹼基對、450個鹼基對至460個鹼基對、460個鹼基對至470個鹼基對、470個鹼基對至480個鹼基對、480個鹼基對至490個鹼基對、或490個鹼基對至500個鹼基對。在一些實施方式中,雙股模板DNA包含正義股3'同源臂,該同源臂的長度為至少500個鹼基對,例如,500個鹼基對至550個鹼基對、550個鹼基對至600個鹼基對、600個鹼基對至650個鹼基對、650個鹼基對至700個鹼基對、700個鹼基對至750個鹼基對、750個鹼基對至800個鹼基對、800個鹼基對至850個鹼基對、850個鹼基對至900個鹼基對、900個鹼基對至950個鹼基對、或950個鹼基對至1,000個鹼基對(1 kb)。
在一些實施方式中,雙股模板DNA包含正義股5'同源臂(例如,左同源臂)和正義股3'同源臂(例如,右同源臂),該5'同源臂的長度為約20個鹼基對至約200個鹼基對,例如,20個鹼基對至25個鹼基對、25個鹼基對至30個鹼基對、30個鹼基對至35個鹼基對、35個鹼基對至40個鹼基對、40個鹼基對至45個鹼基對、45個鹼基對至50個鹼基對、50個鹼基對至55個鹼基對、55個鹼基對至60個鹼基對、60個鹼基對至65個鹼基對、65個鹼基對至70個鹼基對、70個鹼基對至75個鹼基對、75個鹼基對至80個鹼基對、80個鹼基對至85個鹼基對、85個鹼基對至90個鹼基對、90個鹼基對至95個鹼基對、95個鹼基對至100個鹼基對、100個鹼基對至105個鹼基對、105個鹼基對至110個鹼基對、110個鹼基對至115個鹼基對、115個鹼基對至120個鹼基對、120個鹼基對至125個鹼基對、125個鹼基對至130個鹼基對、130個鹼基對至135個鹼基對、135個鹼基對至140個鹼基對、140個鹼基對至145個鹼基對、145個鹼基對至150個鹼基對、150個鹼基對至155個鹼基對、155個鹼基對至160個鹼基對、160個鹼基對至165個鹼基對、165個鹼基對至170個鹼基對、170個鹼基對至175個鹼基對、175個鹼基對至180個鹼基對、180個鹼基對至185個鹼基對、185個鹼基對至190個鹼基對、190個鹼基對至195個鹼基對、或195個鹼基對至200個鹼基對,該3'同源臂的長度為約20個鹼基對至約200個鹼基對,例如,20個鹼基對至25個鹼基對、25個鹼基對至30個鹼基對、30個鹼基對至35個鹼基對、35個鹼基對至40個鹼基對、40個鹼基對至45個鹼基對、45個鹼基對至50個鹼基對、50個鹼基對至55個鹼基對、55個鹼基對至60個鹼基對、60個鹼基對至65個鹼基對、65個鹼基對至70個鹼基對、70個鹼基對至75個鹼基對、75個鹼基對至80個鹼基對、80個鹼基對至85個鹼基對、85個鹼基對至90個鹼基對、90個鹼基對至95個鹼基對、95個鹼基對至100個鹼基對、100個鹼基對至105個鹼基對、105個鹼基對至110個鹼基對、110個鹼基對至115個鹼基對、115個鹼基對至120個鹼基對、120個鹼基對至125個鹼基對、125個鹼基對至130個鹼基對、130個鹼基對至135個鹼基對、135個鹼基對至140個鹼基對、140個鹼基對至145個鹼基對、145個鹼基對至150個鹼基對、150個鹼基對至155個鹼基對、155個鹼基對至160個鹼基對、160個鹼基對至165個鹼基對、165個鹼基對至170個鹼基對、170個鹼基對至175個鹼基對、175個鹼基對至180個鹼基對、180個鹼基對至185個鹼基對、185個鹼基對至190個鹼基對、190個鹼基對至195個鹼基對、或195個鹼基對至200個鹼基對。在一些實施方式中,雙股模板DNA包含正義股5'同源臂(例如,左同源臂)和正義股3'同源臂(例如,右同源臂),該5'同源臂的長度為約200個鹼基對至約500個鹼基對,例如,200個鹼基對至210個鹼基對、210個鹼基對至220個鹼基對、220個鹼基對至230個鹼基對、230個鹼基對至240個鹼基對、240個鹼基對至250個鹼基對、250個鹼基對至260個鹼基對、260個鹼基對至270個鹼基對、270個鹼基對至280個鹼基對、280個鹼基對至290個鹼基對、290個鹼基對至300個鹼基對、300個鹼基對至310個鹼基對、310個鹼基對至320個鹼基對、320個鹼基對至330個鹼基對、330個鹼基對至340個鹼基對、340個鹼基對至350個鹼基對、350個鹼基對至360個鹼基對、360個鹼基對至370個鹼基對、370個鹼基對至380個鹼基對、380個鹼基對至390個鹼基對、390個鹼基對至400個鹼基對、400個鹼基對至410個鹼基對、410個鹼基對至420個鹼基對、420個鹼基對至430個鹼基對、430個鹼基對至440個鹼基對、440個鹼基對至450個鹼基對、450個鹼基對至460個鹼基對、460個鹼基對至470個鹼基對、470個鹼基對至480個鹼基對、480個鹼基對至490個鹼基對、或490個鹼基對至500個鹼基對,該3'同源臂的長度為約200個鹼基對至約500個鹼基對,例如,200個鹼基對至210個鹼基對、210個鹼基對至220個鹼基對、220個鹼基對至230個鹼基對、230個鹼基對至240個鹼基對、240個鹼基對至250個鹼基對、250個鹼基對至260個鹼基對、260個鹼基對至270個鹼基對、270個鹼基對至280個鹼基對、280個鹼基對至290個鹼基對、290個鹼基對至300個鹼基對、300個鹼基對至310個鹼基對、310個鹼基對至320個鹼基對、320個鹼基對至330個鹼基對、330個鹼基對至340個鹼基對、340個鹼基對至350個鹼基對、350個鹼基對至360個鹼基對、360個鹼基對至370個鹼基對、370個鹼基對至380個鹼基對、380個鹼基對至390個鹼基對、390個鹼基對至400個鹼基對、400個鹼基對至410個鹼基對、410個鹼基對至420個鹼基對、420個鹼基對至430個鹼基對、430個鹼基對至440個鹼基對、440個鹼基對至450個鹼基對、450個鹼基對至460個鹼基對、460個鹼基對至470個鹼基對、470個鹼基對至480個鹼基對、480個鹼基對至490個鹼基對、或490個鹼基對至500個鹼基對。在一些實施方式中,雙股模板DNA包含正義股5'同源臂(例如,左同源臂)和正義股3'同源臂(例如,右同源臂),該5'同源臂的長度為至少500個鹼基對,例如,500個鹼基對至550個鹼基對、550個鹼基對至600個鹼基對、600個鹼基對至650個鹼基對、650個鹼基對至700個鹼基對、700個鹼基對至750個鹼基對、750個鹼基對至800個鹼基對、800個鹼基對至850個鹼基對、850個鹼基對至900個鹼基對、900個鹼基對至950個鹼基對、或950個鹼基對至1,000個鹼基對(1 kb),該3'同源臂的長度為至少500個鹼基對,例如,500個鹼基對至550個鹼基對、550個鹼基對至600個鹼基對、600個鹼基對至650個鹼基對、650個鹼基對至700個鹼基對、700個鹼基對至750個鹼基對、750個鹼基對至800個鹼基對、800個鹼基對至850個鹼基對、850個鹼基對至900個鹼基對、900個鹼基對至950個鹼基對、或950個鹼基對至1,000個鹼基對(1 kb)。
在一些實施方式中,模板DNA包含長度相同的5’同源臂(例如,左同源臂)和3’同源臂(例如,右同源臂)。在一些實施方式中,模板DNA包含長度不同的5’同源臂(例如,左同源臂)和3’同源臂(例如,右同源臂)。在一些實施方式中,5'同源臂的長度係3’同源臂的約10%、15%、20%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95% 96%、97%、98%、或99%,但不是100%。在一些實施方式中,3'同源臂的長度係5’同源臂的約10%、15%、20%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95% 96%、97%、98%、或99%,但不是100%。
在一些實施方式中,模板DNA包含兩個長度類似的同源臂(例如,長度類似的右同源臂和左同源臂)。例如,在一些實施方式中,5'同源臂(例如,左同源臂)的長度係3’同源臂(例如,右同源臂)的至少約70%(例如,約70%、71%、72%、73%、74%、75%、76%、77%、78%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%)。在一些實施方式中,5'同源臂(例如,左同源臂)的長度係3’同源臂(例如,右同源臂)的至少約75%(例如,約75%、76%、77%、78%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%)。在一些實施方式中,5'同源臂(例如,左同源臂)的長度係3’同源臂(例如,右同源臂)的至少約80%(例如,約80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%)。在一些實施方式中,5'同源臂(例如,左同源臂)的長度係3’同源臂(例如,右同源臂)的至少約85%(例如,約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%)。在一些實施方式中,5'同源臂(例如,左同源臂)的長度係3’同源臂(例如,右同源臂)的至少約90%(例如,約90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%)。在一些實施方式中,5'同源臂(例如,左同源臂)的長度係3’同源臂(例如,右同源臂)的至少約95%(例如,約95%、96%、97%、98%、或99%)。在一些實施方式中,3'同源臂(例如,右同源臂)的長度係5’同源臂(例如,左同源臂)的至少約70%(例如,約70%、71%、72%、73%、74%、75%、76%、77%、78%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%)。在一些實施方式中,3'同源臂(例如,右同源臂)的長度係5’同源臂(例如,左同源臂)的至少約75%(例如,約75%、76%、77%、78%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%)。在一些實施方式中,3'同源臂(例如,右同源臂)的長度係5’同源臂(例如,左同源臂)的至少約80%(例如,約80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%)。在一些實施方式中,3'同源臂(例如,右同源臂)的長度係5’同源臂(例如,左同源臂)的至少約85%(例如,約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%)。在一些實施方式中,3'同源臂(例如,右同源臂)的長度係5’同源臂(例如,左同源臂)的至少約90%(例如,約90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%)。在一些實施方式中,3'同源臂(例如,右同源臂)的長度係5’同源臂(例如,左同源臂)的至少約95%(例如,約95%、96%、97%、98%、或99%)。
在一些實施方式中,模板DNA包含5’同源臂但不包含3’同源臂。在一些實施方式中,模板DNA包含3’同源臂但不包含5’同源臂。
在一些實施方式中,***序列位於PAM股上5'-NTTN-3'序列上游的TTR靶核酸的對應區域內。例如,***序列位於5'-NTTN-3'序列的上游約20個核苷酸內,例如,5'-NTTN-3'序列的上游1個核苷酸、2個核苷酸、3個核苷酸、4個核苷酸、5個核苷酸、6個核苷酸、7個核苷酸、8個核苷酸、9個核苷酸、10個核苷酸、11個核苷酸、12個核苷酸、13個核苷酸、14個核苷酸、15個核苷酸、16個核苷酸、17個核苷酸、18個核苷酸、19個核苷酸、或20個核苷酸。
在一些實施方式中,***序列位於PAM股上5'-NTTN-3'序列下游的TTR靶核酸的對應區域內。例如,***序列可以位於5'-NTTN-3'序列的下游約60個核苷酸內,例如,5'-NTTN-3'序列的下游1個核苷酸、2個核苷酸、3個核苷酸、4個核苷酸、5個核苷酸、6個核苷酸、7個核苷酸、8個核苷酸、9個核苷酸、10個核苷酸、11個核苷酸、12個核苷酸、13個核苷酸、14個核苷酸、15個核苷酸、16個核苷酸、17個核苷酸、18個核苷酸、19個核苷酸、20個核苷酸、25個核苷酸、30個核苷酸、35個核苷酸、40個核苷酸、45個核苷酸、50個核苷酸、55個核苷酸、或60個核苷酸內。
在一些實施方式中,本文所述之模板DNA用於糾正與疾病相關的TTR突變。在一些實施方式中,突變係V30M、V122I、T60A、L58H、或I84S,並且疾病係hATTR、FAP、或SSA。在一些實施方式中,突變V30M、V122I、T60A、L58H、或I84S參考經翻譯後切割的SEQ ID NO: 257的TTR序列。在一些實施方式中,相對於SEQ ID NO: 256的全長TTR序列,該等突變被稱為V50M、V142I、T80A、L78H、和I104S。
在一些實施方式中,靶序列編碼V30M突變,並且模板DNA包含編碼M30V突變的***序列。在一些實施方式中,靶序列包含在SEQ ID NO: 258的TTR編碼序列中的148G>A突變。在一些實施方式中,模板DNA包含在SEQ ID NO: 258的TTR編碼序列的對應區域中的148A>G突變。
在一些實施方式中,靶序列編碼V122I突變,並且模板DNA包含編碼I122V突變的***序列。在一些實施方式中,靶序列包含在SEQ ID NO: 258的TTR編碼序列中的424G>A突變。在一些實施方式中,模板DNA包含在SEQ ID NO: 258的TTR編碼序列的對應區域中的424A>G突變。
在一些實施方式中,靶序列編碼T60A突變,並且模板DNA包含編碼A60T突變的***序列。在一些實施方式中,靶序列包含在SEQ ID NO: 258的TTR編碼序列中的238A>G突變。在一些實施方式中,模板DNA包含在SEQ ID NO: 258的TTR編碼序列的對應區域中的238G>A突變。
在一些實施方式中,靶序列編碼L58H突變,並且模板DNA包含編碼H58L突變的***序列。在一些實施方式中,靶序列包含在SEQ ID NO: 258的TTR編碼序列中的233T>A突變。在一些實施方式中,模板DNA包含在SEQ ID NO: 258的TTR編碼序列的對應區域中的233A>T突變。
在一些實施方式中,靶序列編碼I84S突變,並且模板DNA包含編碼S84I突變的***序列。在一些實施方式中,靶序列包含在SEQ ID NO: 258的TTR編碼序列中的311T>G突變。在一些實施方式中,模板DNA包含在SEQ ID NO: 258的TTR編碼序列的對應區域中的311G>T突變。
在一些實施方式中,本文所述之模板DNA用於引入與疾病相關的保護性突變。在一些實施方式中,突變係T119M,並且疾病係hATTR。在一些實施方式中,突變係T119M,並且疾病係野生型ATTR類澱粉變性。在一些實施方式中,T119M突變參考經翻譯後切割的SEQ ID NO: 257的TTR序列。在一些實施方式中,相對於SEQ ID NO: 256的全長TTR序列,T119M突變被稱為T139M。在一些實施方式中,靶序列編碼T119殘基,並且模板DNA包含編碼T119M突變的***序列。在一些實施方式中,靶序列包含在SEQ ID NO: 258的TTR編碼序列的416位置中的C。在一些實施方式中,模板DNA包含在SEQ ID NO: 258的TTR編碼序列的對應區域中的416C>T突變。
在一些實施方式中,模板DNA與SEQ ID NO: 287-294或SEQ ID NO: 303-310中的任一個、或SEQ ID NO: 287-294或SEQ ID NO: 303-310中任一個的一部分具有至少90%(例如,90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%)的同一性。在一些實施方式中,模板DNA與SEQ ID NO: 287-294或SEQ ID NO: 303-310中的任一個、或SEQ ID NO: 287-294或SEQ ID NO: 303-310中任一個的一部分具有至少95%(例如,95%、96%、97%、98%、99%、或100%)的同一性。在一些實施方式中,模板DNA包含SEQ ID NO: 287-294或SEQ ID NO: 303-310中的任一個、或SEQ ID NO: 287-294或SEQ ID NO: 303-310中任一個的一部分的序列。在一些實施方式中,模板DNA包含SEQ ID NO: 287-294或SEQ ID NO: 303-310中任一個的供體區,並且進一步具有左同源臂。在一些實施方式中,模板DNA包含SEQ ID NO: 287-294或SEQ ID NO: 303-310中任一個的供體區,並且進一步具有右同源臂。在一些實施方式中,模板DNA包含SEQ ID NO: 287-294或SEQ ID NO: 303-310中任一個的供體區,並且進一步具有左同源臂和右同源臂。在一些實施方式中,模板DNA包含SEQ ID NO: 287-294或SEQ ID NO: 303-310中任一個的供體區,並且進一步包含長度為約40至約50個核苷酸的同源臂。在一些實施方式中,模板DNA包含SEQ ID NO: 287-294或SEQ ID NO: 303-310中任一個的供體區,並且進一步包含長度小於約40至約50個核苷酸的同源臂。在一些實施方式中,模板DNA包含SEQ ID NO: 287-294或SEQ ID NO: 303-310中任一個的供體區,並且進一步包含長度大於約40至約50個核苷酸的同源臂。
C. 核酸修飾
RNA指導物或模板DNA可以包括相對於參考序列、特別是親本多核糖核苷酸的一或多個共價修飾,該一或多個共價修飾包括在本揭露內容之範圍內。
示例性修飾可以包括對糖、核鹼基、核苷間鍵(例如,對連接的磷酸酯/對磷酸二酯鍵/對磷酸二酯骨架)、及其任何組合的任何修飾。下面詳細描述本文提供的一些示例性修飾。
RNA指導物或模板DNA可以包括如對糖、核鹼基、或核苷間鍵(例如,對連接的磷酸酯/對磷酸二酯鍵/對磷酸二酯骨架)的任何有用的修飾。嘧啶核鹼基的一或多個原子可以被視需要取代的胺基、視需要取代的硫醇、視需要取代的烷基(例如甲基或乙基)或鹵代(例如氯代或氟代)替代或取代。在某些實施方式中,修飾(例如,一或多個修飾)存在於糖和核苷間鍵中的每一個中。修飾可為對核糖核酸(RNA)到去氧核糖核酸(DNA)、蘇糖核酸(TNA)、乙二醇核酸(GNA)、肽核酸(PNA)、鎖核酸(LNA)或其雜交體的修飾。本文描述了額外的修飾。
在一些實施方式中,修飾可以包括化學或細胞誘導的修飾。例如,Lewis和Pan在來自Nat Reviews Mol Cell Biol [自然評論分子細胞生物學], 2017, 18:202-210的「RNA modifications and structures cooperate to guide RNA-protein interactions [與指導RNA-蛋白質相互作用配合的RNA修飾和結構]」中描述了細胞內RNA修飾的一些非限制性實例。
不同的糖修飾、核苷酸修飾、和/或核苷間鍵(例如,骨架結構)可以存在於序列的各個位置。熟悉該項技術者將理解,核苷酸類似物或其他的一或多種修飾可以位於序列的任何一或多個位置,使得該序列的功能基本上不降低。序列可以包括約1%至約100%的經修飾的核苷酸(相對於總核苷酸含量,或相對於一或多種類型的核苷酸(即A、G、U或C中的任何一或多種))或任何中間百分比(例如,從1%至20%>、從1%至25%、從1%至50%、從1%至60%、從1%至70%、從1%至80%、從1%至90%、從1%至95%、從10%至20%、從10%至25%、從10%至50%、從10%至60%、從10%至70%、從10%至80%、從10%至90%、從10%至95%、從10%至100%、從20%至25%、從20%至50%、從20%至60%、從20%至70%、從20%至80%、從20%至90%、從20%至95%、從20%至100%、從50%至60%、從50%至70%、從50%至80%、從50%至90%、從50%至95%、從50%至100%、從70%至80%、從70%至90%、從70%至95%、從70%至100%、從80%至90%、從80%至95%、從80%至100%、從90%至95%、從90%至100%、以及從95%至100%)。
在一些實施方式中,序列的一或多個核糖核苷酸的糖修飾(例如,在2'位置或4'位置)或糖替代以及骨架修飾包括磷酸二酯鍵的修飾或替代。序列之特定實例包括但不限於包括經修飾的骨架或非天然核苷間鍵(例如核苷間修飾,包括磷酸二酯鍵的修飾或替代)的序列。具有經修飾的骨架的序列包括骨架中不具有磷原子的那些等。出於本申請之目的,並且如本領域中有時提及的,在其核苷間骨架中不具有磷原子的經修飾的RNA也可以被認為是寡核苷。在特定的實施方式中,序列將包括在其核苷間骨架中具有磷原子的核糖核苷酸。
經修飾的序列主鏈可以包括,例如,硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、胺基烷基磷酸三酯、甲基和其他烷基膦酸酯(如3’-伸烷基膦酸酯和手性膦酸酯)、亞膦酸酯、胺基磷酸酯(如3’-胺基胺基磷酸酯和胺基烷基胺基磷酸酯)、硫羰胺基磷酸酯(thionophosphoramidate)、硫羰烷基膦酸酯、硫羰烷基磷酸三酯、和具有正常3’-5’連接的硼酸磷酸酯、該等酯的2’-5’連接的類似物,以及具有相反極性的那些,其中相鄰的核苷單元對3’-5’連接至5’-3’或2’-5’連接至5’-2’。還包括各種鹽、混合鹽和游離酸形式。在一些實施方式中,序列可以帶負電荷或帶正電荷。
可摻入該序列中的經修飾的核苷酸可以在核苷間鍵(例如,磷酸酯骨架)上經修飾。在本文中,在多核苷酸骨架之上下文中,短語「磷酸酯」和「磷酸二酯」可互換地使用。可以藉由用不同的取代基替代一或多個氧原子來修飾骨架磷酸酯基團。此外,經修飾的核苷和核苷酸可以包括用如本文所述之另一核苷間鍵對未經修飾的磷酸酯部分進行整體替代。經修飾的磷酸酯基團之實例包括但不限於硫代磷酸酯、亞磷酸硒酸酯、硼酸磷酸酯(boranophosphates/boranophosphate ester)、氫膦酸酯、胺基磷酸酯、二胺基磷酸酯、烷基或芳基膦酸酯和磷酸三酯。二硫代磷酸酯的兩個非連接氧都被硫替代。也可以藉由用氮(橋連的胺基磷酸酯)、硫(橋連的硫代磷酸酯)和碳(橋連的亞甲基膦酸酯)替代連接氧來修飾磷酸酯連接子。
提供α-硫代取代的磷酸酯部分以通過非天然硫代磷酸酯骨架連接賦予RNA和DNA聚合物穩定性。硫代磷酸酯DNA和RNA具有增強的核酸酶抗性,並因此在細胞環境中具有更長的半衰期。
在一些實施方式中,模板DNA包含一或多個核苷間修飾(例如,硫代磷酸酯修飾)。在一些實施方式中,左同源臂包含一或多個核苷間修飾(例如,硫代磷酸酯修飾)。在一些實施方式中,右同源臂包含一或多個核苷間修飾(例如,硫代磷酸酯修飾)。在一些實施方式中,左同源臂包含一或多個核苷間修飾(例如,硫代磷酸酯修飾),並且右同源臂包含一或多個核苷間修飾(例如,硫代磷酸酯修飾)。在一些實施方式中,左同源臂包含兩個核苷間修飾(例如,硫代磷酸酯修飾),並且右同源臂包含兩個核苷間修飾(例如,硫代磷酸酯修飾)。在一些實施方式中,硫代磷酸酯修飾在左同源臂的5'端和右同源臂的3'端。在一些實施方式中,左同源臂在右同源臂的5'並且該左同源臂包含在該左同源臂的5'端處的兩個硫代磷酸酯修飾,該右同源臂包含在該右同源臂的3'端處的兩個硫代磷酸酯修飾。在一些實施方式中,模板DNA係包含第一股和第二股的雙股DNA,其中該第一股包含在該第一股的5'端處的至少一個(例如,2個)硫代磷酸酯修飾或在該第一股的3'端處的至少一個(例如,2個)硫代磷酸酯修飾、或兩者。在一些實施方式中,第二股包含在該第二股的5'端處的至少一個(例如,2個)硫代磷酸酯修飾或在該第二股的3'端處的至少一個(例如,2個)硫代磷酸酯修飾、或兩者。
在特定的實施方式中,經修飾的核苷包括α-硫代-核苷(例如,5'-O-(1-硫代磷酸)-腺苷、5'-O-(1-硫代磷酸)-胞苷(a-硫代-胞苷)、5'-O-(1-硫代磷酸)-鳥苷、5'-O-(1-硫代磷酸)-尿苷、或5'-O-(1-硫代磷酸)-假尿苷)。
本文描述了可根據本揭露內容採用的其他核苷間鍵,包括不含有磷原子的核苷間鍵。
在一些實施方式中,序列可以包括一或多個細胞毒性核苷。例如,可以將細胞毒性核苷併入序列中,如雙功能修飾。細胞毒性核苷可以包括但不限於阿糖腺苷、5-氮雜胞苷、4'-硫代阿糖胞苷、環戊烯基胞嘧啶、克拉屈濱、氯法拉濱、阿糖胞苷、胞嘧啶***糖苷、1-(2-C-氰基-2-去氧-β-D-***-戊呋喃糖基)-胞嘧啶、地西他濱、5-氟尿嘧啶、氟達拉濱、氟尿苷、吉西他濱、替加氟和尿嘧啶的組合、替加氟((RS)-5-氟-1-(四氫呋喃-2-基)嘧啶-2,4(1H,3H)-二酮)、曲沙他濱、替紮西他濱、2'-去氧-2'-亞甲基胞苷(DMDC)和6-巰基嘌呤。其他實例包括氟達拉濱磷酸酯、N4-山崳醯基-1-β-D-***戊呋喃糖基胞嘧啶、N4-十八烷基-1-β-D-***戊呋喃糖基胞嘧啶、N4-棕櫚醯基-1-(2-C-氰基-2-去氧-β-D-***-戊呋喃糖基)胞嘧啶和P-4055(阿糖胞苷5’-反油酸酯)。
在一些實施方式中,序列包括一或多個轉錄後修飾(例如,加帽、切割、聚腺苷酸化、剪接、聚A序列、甲基化、醯化、磷酸化、離胺酸和精胺酸殘基的甲基化、乙醯化、以及硫醇基團和酪胺酸殘基的亞硝基化等)。該一或多個轉錄後修飾可為任何轉錄後修飾,如已經在RNA中鑒定出的多於一百種不同的核苷修飾中的任一種(Rozenski, J, Crain, P, 和McCloskey, J. (1999).The RNA Modification Database: 1999 update [RNA修飾資料庫:1999年更新].Nucl Acids Res [核酸研究] 27: 196-197)。在一些實施方式中,第一分離的核酸包含信使RNA(mRNA)。在一些實施方式中,mRNA包含至少一種選自下群組的核苷,該群組由以下組成:吡啶-4-酮核糖核苷、5-氮雜-尿苷、2-硫代-5-氮雜-尿苷、2-硫尿苷、4-硫代-假尿苷、2-硫代-假尿苷、5-羥基尿苷、3-甲基尿苷、5-羧基甲基-尿苷、1-羧基甲基-假尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸基甲基尿苷、1-牛磺酸基甲基-假尿苷、5-牛磺酸基甲基-2-硫代-尿苷、1-牛磺酸基甲基-4-硫代-尿苷、5-甲基-尿苷、1-甲基-假尿苷、4-硫代-1-甲基-假尿苷、2-硫代-1-甲基-假尿苷、1-甲基-1-去氮-假尿苷、2-硫代-1-甲基-1-去氮-假尿苷、二氫尿苷、二氫假尿苷、2-硫代-二氫尿苷、2-硫代-二氫假尿苷、2-甲氧基尿苷、2-甲氧基-4-硫代-尿苷、4-甲氧基-假尿苷和4-甲氧基-2-硫代-假尿苷。在一些實施方式中,mRNA包含至少一種選自下群組的核苷,該群組由以下組成:5-氮雜-胞苷、假異胞苷、3-甲基-胞苷、N4-乙醯基胞苷、5-甲醯基胞苷、N4-甲基胞苷、5-羥基甲基胞苷、1-甲基-假異胞苷、吡咯并-胞苷、吡咯并-假異胞苷、2-硫代-胞苷、2-硫代-5-甲基-胞苷、4-硫代-假異胞苷、4-硫代-1-甲基-假異胞苷、4-硫代-1-甲基-1-去氮-假異胞苷、1-甲基-1-去氮-假異胞苷、折布拉林(zebularine)、5-氮雜-折布拉林、5-甲基-折布拉林、5-氮雜-2-硫代-折布拉林、2-硫代-折布拉林、2-甲氧基-胞苷、2-甲氧基-5-甲基-胞苷、4-甲氧基-假異胞苷和4-甲氧基-1-甲基-假異胞苷。在一些實施方式中,mRNA包含至少一種選自下群組的核苷,該群組由以下組成:2-胺基嘌呤、2,6-二胺基嘌呤、7-去氮-腺嘌呤、7-去氮-8-氮雜-腺嘌呤、7-去氮-2-胺基嘌呤、7-去氮-8-氮雜-2-胺基嘌呤、7-去氮-2,6-二胺基嘌呤、7-去氮-8-氮雜-2,6-二胺基嘌呤、1-甲基腺苷、N6-甲基腺苷、N6-異戊烯基腺苷、N6-(順式-羥基異戊烯基)腺苷、2-甲基硫代-N6-(順式-羥基異戊烯基)腺苷、N6-甘胺醯胺甲醯基腺苷、N6-蘇胺醯胺甲醯基腺苷、2-甲基硫代-N6-蘇胺醯胺甲醯基腺苷、N6,N6-二甲基腺苷、7-甲基腺嘌呤、2-甲基硫代-腺嘌呤和2-甲氧基-腺嘌呤。在一些實施方式中,mRNA包含至少一種選自下群組的核苷,該群組由以下組成:肌苷、1-甲基-肌苷、懷俄苷、懷丁苷、7-去氮-鳥苷、7-去氮-8-氮雜-鳥苷、6-硫代-鳥苷、6-硫代-7-去氮-鳥苷、6-硫代-7-去氮-8-氮雜-鳥苷、7-甲基-鳥苷、6-硫代-7-甲基-鳥苷、7-甲基肌苷、6-甲氧基-鳥苷、1-甲基鳥苷、N2-甲基鳥苷、N2,N2-二甲基鳥苷、8-側氧基-鳥苷、7-甲基-8-側氧基-鳥苷、1-甲基-6-硫代-鳥苷、N2-甲基-6-硫代-鳥苷、和N2,N2-二甲基-6-硫代-鳥苷。
序列沿著分子的整個長度可以被或者可以不被均一地修飾。例如,一或多種或所有類型的核苷酸(例如,天然存在的核苷酸、嘌呤或嘧啶,或A、G、U、C、I、pU中的任一或多種或全部)在序列中,或在其給定的預定序列區域中可以被或可以不被均一地修飾。在一些實施方式中,序列包括假尿苷。在一些實施方式中,序列包括肌苷,該肌苷可以説明免疫系統將序列相對於病毒RNA表徵為內源性。肌苷的摻入還可以介導改善的RNA穩定性/減少降解。參見例如,Yu, Z.等人 (2015) RNA editing by ADAR1 marks dsRNA as 「self」 [ADAR1進行的RNA編輯將dsRNA標記為「自我」].Cell Res [細胞研究]. 25, 1283-1284,將該文獻藉由援引以其全文併入。
當本文揭露的基因編輯系統包含編碼本文揭露的Cas12i多肽的核酸(例如,mRNA分子)時,在適用的情況下,這樣的核酸分子可以含有本文揭露的任何修飾。
D. Cas12i 多肽
在一些實施方式中,本揭露內容之組成物或系統包括如WO/2019/178427中所述之Cas12i多肽,出於本文引用的主題和目的將該文獻的相關揭露內容藉由援引併入。
在一些實施方式中,本揭露內容之基因編輯系統 包含本文所述之Cas12i2多肽(例如,包含SEQ ID NO: 222和/或由SEQ ID NO: 221(或其T被U替代的版本)編碼的多肽)。在一些實施方式中,Cas12i2多肽包含至少一個RuvC結構域。在一些實施方式中,本揭露內容之基因編輯系統 包含編碼Cas12i多肽的核酸分子(例如,DNA分子或多核糖核苷酸分子)。
編碼本文所述之Cas12i2多肽的核酸序列可以與參考核酸序列(例如,SEQ ID NO: 221(或其T被U替代的版本))基本上相同。在一些實施方式中,Cas12i2多肽由核酸編碼,該核酸包含與參考核酸序列(例如,SEQ ID NO: 221(或其T被U替代的版本))具有至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約91%、至少約92%、至少約93%、至少約94%、至少約95%、至少約96%、至少約97%、至少約98%、至少約99%、或至少約99.5%序列同一性的序列。可以藉由檢查兩個最佳比對的核酸序列或藉由使用軟體程式或演算法(例如,BLAST、ALIGN、CLUSTAL)使用標準參數人工確定兩個此類核酸之間的同一性百分比。兩個核酸序列基本上相同的一個指示係核酸分子在溫度和離子強度的嚴格條件下(例如,在中至高嚴格度的範圍內)與另一核酸分子的互補序列雜交。參見例如,Tijssen, 「Hybridization with Nucleic Acid Probes.Part I. Theory and Nucleic Acid Preparation [與核酸探針雜交.第I部分.理論和核酸製備]」(Laboratory Techniques in Biochemistry and Molecular Biology [生物化學和分子生物學實驗室技術],第24卷)。
在一些實施方式中,Cas12i2多肽由核酸序列編碼,該核酸序列與參考核酸序列(例如,SEQ ID NO: 221(或其T被U替代的版本))具有至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約91%、至少約92%、至少約93%、至少約94%、至少約95%、至少約96%、至少約97%、至少約98%、至少約99%、或更高的序列同一性,但不是100%序列同一性。
在一些實施方式中,本揭露內容之Cas12i2多肽包含與SEQ ID NO: 222具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的多肽序列。
在一些實施方式中,本揭露內容描述了Cas12i2多肽,該Cas12i2多肽與一或多個參考多肽具有指定程度的胺基酸序列同一性,例如,與SEQ ID NO: 222的胺基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%,至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或甚至至少99%但不是100%的序列同一性。同源性或同一性可以例如使用如本文所述之程式(如BLAST、ALIGN或CLUSTAL)藉由胺基酸序列比對來確定。
還提供了本揭露內容之Cas12i2多肽,該Cas12i2多肽具有酶活性(例如,核酸酶或內切核酸酶活性),並且當使用任何先前描述的比對方法比對時,包含與SEQ ID NO: 222的胺基酸序列差異50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、或0個胺基酸殘基的胺基酸序列。
在一些實施方式中,Cas12i2多肽相對於SEQ ID NO: 222可以含有一或多個突變,例如在位置D581、G624、F626、P868、I926、V1030、E1035、S1046、或其任何組合處。在一些情況下,一或多個突變係胺基酸取代,例如,D581R、G624R、F626R、P868T、I926R、V1030G、E1035R、S1046G、或其組合。
在一些實施方式中,Cas12i2多肽包含具有 SEQ ID NO: 223、SEQ ID NO: 224、SEQ ID NO: 225、SEQ ID NO: 226、或SEQ ID NO: 227的序列的多肽。在一些實例中,Cas12i2多肽在位置D581、D911、I926、和V1030處含有突變。這種Cas12i2多肽可以含有胺基酸取代D581R、D911R、I926R、和V1030G(例如,SEQ ID NO: 223)。在一些實例中,Cas12i2多肽在位置D581、I926、和V1030處含有突變。這種Cas12i2多肽可以含有胺基酸取代D581R、I926R、和V1030G(例如,SEQ ID NO: 224)。在一些實例中,Cas12i2多肽可以在位置D581、I926、V1030、和S1046處含有突變。這種Cas12i2多肽可以含有胺基酸取代D581R、I926R、V1030G、和S1046G(例如,SEQ ID NO: 225)。在一些實例中,Cas12i2多肽可以在位置D581、G624、F626、I926、V1030、E1035、和S1046處含有突變。這種Cas12i2多肽可以含有胺基酸取代D581R、G624R、F626R、I926R、V1030G、E1035R、和S1046G(例如,SEQ ID NO: 226)。在一些實例中,Cas12i2多肽可以在位置D581、G624、F626、P868、I926、V1030、E1035、和S1046處含有突變。這種Cas12i2多肽可以含有胺基酸取代D581R、G624R、F626R、P868T、I926R、V1030G、E1035R、和S1046G(例如,SEQ ID NO: 227)。
在一些實施方式中,本揭露內容之Cas12i2多肽包含與SEQ ID NO: 223、SEQ ID NO: 224、SEQ ID NO: 225、SEQ ID NO: 226、或SEQ ID NO: 227具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的多肽序列。在一些實施方式中,與SEQ ID NO: 223、SEQ ID NO: 224、SEQ ID NO: 225、SEQ ID NO: 226、或SEQ ID NO: 227具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的Cas12i2多肽保持將該多肽與其相應的親本/參考序列區分開的胺基酸變化(或該等變化中的至少1、2、3個等)。
在一些實施方式中,本揭露內容描述了Cas12i2多肽,該Cas12i2多肽與一或多個參考多肽具有指定程度的胺基酸序列同一性,例如,與SEQ ID NO: 223、SEQ ID NO: 224、SEQ ID NO: 225、SEQ ID NO: 226、或SEQ ID NO: 227的胺基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%,至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或甚至至少99%但不是100%的序列同一性。同源性或同一性可以例如使用如本文所述之程式(如BLAST、ALIGN或CLUSTAL)藉由胺基酸序列比對來確定。
還提供了本揭露內容之Cas12i2多肽,該Cas12i2多肽具有酶活性(例如,核酸酶或內切核酸酶活性),並且當使用任何先前描述的比對方法比對時,包含與SEQ ID NO: 223、SEQ ID NO: 224、SEQ ID NO: 225、SEQ ID NO: 226、或SEQ ID NO: 227的胺基酸序列差異50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、或0個胺基酸殘基的胺基酸序列。
在一些實施方式中,本揭露內容之組成物包括本文所述之Cas12i4多肽(例如,包含SEQ ID NO: 253和/或由SEQ ID NO: 252(或其T被U替代的版本)編碼的多肽)。在一些實施方式中,Cas12i4多肽包含至少一個RuvC結構域。
編碼本文所述之Cas12i4多肽的核酸序列可以與參考核酸序列(例如,SEQ ID NO: 252(或其T被U替代的版本))基本上相同。在一些實施方式中,Cas12i4多肽由核酸編碼,該核酸包含與參考核酸序列(例如,SEQ ID NO: 252(或其T被U替代的版本))具有至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約91%、至少約92%、至少約93%、至少約94%、至少約95%、至少約96%、至少約97%、至少約98%、至少約99%、或至少約99.5%序列同一性的序列。可以藉由檢查兩個最佳比對的核酸序列或藉由使用軟體程式或演算法(例如,BLAST、ALIGN、CLUSTAL)使用標準參數人工確定兩個此類核酸之間的同一性百分比。兩個核酸序列基本上相同的一個指示係核酸分子在溫度和離子強度的嚴格條件下(例如,在中至高嚴格度的範圍內)與另一核酸分子的互補序列雜交。
在一些實施方式中,Cas12i4多肽由核酸序列編碼,該核酸序列與參考核酸序列(例如,SEQ ID NO: 252(或其T被U替代的版本))具有至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約91%、至少約92%、至少約93%、至少約94%、至少約95%、至少約96%、至少約97%、至少約98%、至少約99%、或更高的序列同一性,但不是100%序列同一性。
在一些實施方式中,本揭露內容之Cas12i4多肽包含與SEQ ID NO: 253具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的多肽序列。
在一些實施方式中,本揭露內容描述了Cas12i4多肽,該Cas12i4多肽與一或多個參考多肽具有指定程度的胺基酸序列同一性,例如,與SEQ ID NO: 253的胺基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%,至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或甚至至少99%但不是100%的序列同一性。同源性或同一性可以例如使用如本文所述之程式(如BLAST、ALIGN或CLUSTAL)藉由胺基酸序列比對來確定。
還提供了本揭露內容之Cas12i4多肽,該Cas12i4多肽具有酶活性(例如,核酸酶或內切核酸酶活性),並且當使用任何先前描述的比對方法比對時,包含與SEQ ID NO: 253的胺基酸序列差異50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、或0個胺基酸殘基的胺基酸序列。
在一些實施方式中,Cas12i4多肽包含具有SEQ ID NO: 254或SEQ ID NO: 255的序列的多肽。
在一些實施方式中,本揭露內容之Cas12i4多肽包含與SEQ ID NO: 254或SEQ ID NO: 255具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的多肽序列。在一些實施方式中,與SEQ ID NO: 254或SEQ ID NO: 255具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的Cas12i4多肽保持將該多肽與其相應的親本/參考序列區分開的胺基酸變化(或該等變化中的至少1、2、3個等)。
在一些實施方式中,本揭露內容描述了Cas12i4多肽,該Cas12i4多肽與一或多個參考多肽具有指定程度的胺基酸序列同一性,例如,與SEQ ID NO: 254或SEQ ID NO: 255的胺基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%,至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或甚至至少99%但不是100%的序列同一性。同源性或同一性可以例如使用如本文所述之程式(如BLAST、ALIGN或CLUSTAL)藉由胺基酸序列比對來確定。
還提供了本揭露內容之Cas12i4多肽,該Cas12i4多肽具有酶活性(例如,核酸酶或內切核酸酶活性),並且當使用任何先前描述的比對方法比對時,包含與SEQ ID NO: 254或SEQ ID NO: 255的胺基酸序列差異50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、或0個胺基酸殘基的胺基酸序列。
在一些實施方式中,本揭露內容之組成物包括本文所述之Cas12i1多肽(例如,包含SEQ ID NO: 265的多肽)。在一些實施方式中,Cas12i4多肽包含至少一個RuvC結構域。
在一些實施方式中,本揭露內容之Cas12i1多肽包含與SEQ ID NO: 265具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的多肽序列。
在一些實施方式中,本揭露內容描述了Cas12i1多肽,該Cas12i1多肽與一或多個參考多肽具有指定程度的胺基酸序列同一性,例如,與SEQ ID NO: 265的胺基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%,至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或甚至至少99%但不是100%的序列同一性。同源性或同一性可以例如使用如本文所述之程式(如BLAST、ALIGN或CLUSTAL)藉由胺基酸序列比對來確定。
還提供了本揭露內容之Cas12i1多肽,該Cas12i1多肽具有酶活性(例如,核酸酶或內切核酸酶活性),並且當使用任何先前描述的比對方法比對時,包含與SEQ ID NO: 265的胺基酸序列差異50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、或0個胺基酸殘基的胺基酸序列。
在一些實施方式中,本揭露內容之組成物包括本文所述之Cas12i3多肽(例如,包含SEQ ID NO: 266的多肽)。在一些實施方式中,Cas12i4多肽包含至少一個RuvC結構域。
在一些實施方式中,本揭露內容之Cas12i3多肽包含與SEQ ID NO: 266具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的多肽序列。
在一些實施方式中,本揭露內容描述了Cas12i3多肽,該Cas12i3多肽與一或多個參考多肽具有指定程度的胺基酸序列同一性,例如與SEQ ID NO: 266的胺基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%,至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或甚至至少99%但不是100%的序列同一性。同源性或同一性可以例如使用如本文所述之程式(如BLAST、ALIGN或CLUSTAL)藉由胺基酸序列比對來確定。
還提供了本揭露內容之Cas12i3多肽,該Cas12i3多肽具有酶活性(例如,核酸酶或內切核酸酶活性),並且當使用任何先前描述的比對方法比對時,包含與SEQ ID NO: 266的胺基酸序列差異50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、或0個胺基酸殘基的胺基酸序列。
儘管本文所述之變化可為一或多個胺基酸的變化,但Cas12i多肽的變化也可為實質性的,例如作為胺基和/或羧基末端延伸的多肽融合。例如,Cas12i多肽可以含有額外的肽,例如,一或多個肽。額外的肽之實例可以包括用於標記的表位肽,如多組胺酸標籤(His標籤)、Myc和FLAG。在一些實施方式中,可以將本文所述之Cas12i多肽與可檢測部分融合,如螢光蛋白(例如,綠色螢光蛋白(GFP)或黃色螢光蛋白(YFP))。
在一些實施方式中,Cas12i多肽包含至少一個(例如,兩個、三個、四個、五個、六個或更多個)核定位訊號(NLS)。在一些實施方式中,Cas12i多肽包含至少一個(例如,兩個、三個、四個、五個、六個或更多個)出核訊號(NES)。在一些實施方式中,Cas12i多肽包含至少一個(例如,兩個、三個、四個、五個、六個或更多)NLS和至少一個(例如,兩個、三個、四個、五個、六個或更多個)NES。
在一些實施方式中,本文所述之Cas12i多肽可為自我滅活的。參見Epstein等人, 「Engineering a Self-Inactivating CRISPR System for AAV Vectors [改造用於AAV載體的自我滅活的CRISPR系統],」 Mol. Ther. [分子療法], 24 (2016): S50,將該文獻藉由援引以其全文併入。
在一些實施方式中,編碼本文所述之Cas12i多肽的核苷酸序列可以經密碼子優化以用於特定的宿主細胞或生物。例如,核酸可以經密碼子優化以用於任何非人真核生物(包括小鼠、大鼠、兔、狗、家畜或非人靈長類動物)。密碼子使用表係易於獲得的,例如在kazusa.orjp/codon/的萬維網站上可獲得的「密碼子使用數據庫(Codon Usage Database)」中,並且該等表可以按多種方式進行改編。參見Nakamura等人
Nucl. Acids Res.[核酸研究] 28:292 (2000),將其藉由援引以其全文併入本文。用於密碼子優化特定序列以在特定宿主細胞中表現的電腦演算法也是可得的,如基因製造(Gene Forge)(Aptagen公司;賓夕法尼亞州雅各斯(Jacobus, PA))。在一些實例中,編碼如本文揭露的Cas12i多肽(如Cas12i2多肽)的核酸可為mRNA分子,其可為經密碼子優化的。
示例性Cas12i多肽序列和相應的核苷酸序列列於
表 6中。
[
表 6]
. Cas12i 和 TTR 序列
SEQ ID NO: | 序列 | 描述 |
221 | ATGAGCAGCGCGATCAAAAGCTACAAGAGCGTTCTGCGTCCGAACGAGCGTAAGAACCAACTGCTGAAAAGCACCATTCAGTGCCTGGAAGACGGTAGCGCGTTCTTTTTCAAGATGCTGCAAGGCCTGTTTGGTGGCATCACCCCGGAGATTGTTCGTTTCAGCACCGAACAGGAGAAACAGCAACAGGATATCGCGCTGTGGTGCGCGGTTAACTGGTTCCGTCCGGTGAGCCAAGACAGCCTGACCCACACCATTGCGAGCGATAACCTGGTGGAGAAGTTTGAGGAATACTATGGTGGCACCGCGAGCGACGCGATCAAACAGTACTTCAGCGCGAGCATTGGCGAAAGCTACTATTGGAACGACTGCCGTCAACAGTACTATGATCTGTGCCGTGAGCTGGGTGTTGAGGTGAGCGACCTGACCCATGATCTGGAGATCCTGTGCCGTGAAAAGTGCCTGGCGGTTGCGACCGAGAGCAACCAGAACAACAGCATCATTAGCGTTCTGTTTGGCACCGGCGAAAAAGAGGACCGTAGCGTGAAACTGCGTATCACCAAGAAAATTCTGGAGGCGATCAGCAACCTGAAAGAAATCCCGAAGAACGTTGCGCCGATTCAAGAGATCATTCTGAACGTGGCGAAAGCGACCAAGGAAACCTTCCGTCAGGTGTATGCGGGTAACCTGGGTGCGCCGAGCACCCTGGAGAAATTTATCGCGAAGGACGGCCAAAAAGAGTTCGATCTGAAGAAACTGCAGACCGACCTGAAGAAAGTTATTCGTGGTAAAAGCAAGGAGCGTGATTGGTGCTGCCAGGAAGAGCTGCGTAGCTACGTGGAGCAAAACACCATCCAGTATGACCTGTGGGCGTGGGGCGAAATGTTCAACAAAGCGCACACCGCGCTGAAAATCAAGAGCACCCGTAACTACAACTTTGCGAAGCAACGTCTGGAACAGTTCAAAGAGATTCAGAGCCTGAACAACCTGCTGGTTGTGAAGAAGCTGAACGACTTTTTCGATAGCGAATTTTTCAGCGGCGAGGAAACCTACACCATCTGCGTTCACCATCTGGGTGGCAAGGACCTGAGCAAACTGTATAAGGCGTGGGAGGATGATCCGGCGGACCCGGAAAACGCGATTGTGGTTCTGTGCGACGATCTGAAAAACAACTTTAAGAAAGAGCCGATCCGTAACATTCTGCGTTACATCTTCACCATTCGTCAAGAATGCAGCGCGCAGGACATCCTGGCGGCGGCGAAGTACAACCAACAGCTGGATCGTTATAAAAGCCAAAAGGCGAACCCGAGCGTTCTGGGTAACCAGGGCTTTACCTGGACCAACGCGGTGATCCTGCCGGAGAAGGCGCAGCGTAACGACCGTCCGAACAGCCTGGATCTGCGTATTTGGCTGTACCTGAAACTGCGTCACCCGGACGGTCGTTGGAAGAAACACCATATCCCGTTCTACGATACCCGTTTCTTCCAAGAAATTTATGCGGCGGGCAACAGCCCGGTTGACACCTGCCAGTTTCGTACCCCGCGTTTCGGTTATCACCTGCCGAAACTGACCGATCAGACCGCGATCCGTGTTAACAAGAAACATGTGAAAGCGGCGAAGACCGAGGCGCGTATTCGTCTGGCGATCCAACAGGGCACCCTGCCGGTGAGCAACCTGAAGATCACCGAAATTAGCGCGACCATCAACAGCAAAGGTCAAGTGCGTATTCCGGTTAAGTTTGACGTGGGTCGTCAAAAAGGCACCCTGCAGATCGGTGACCGTTTCTGCGGCTACGATCAAAACCAGACCGCGAGCCACGCGTATAGCCTGTGGGAAGTGGTTAAAGAGGGTCAATACCATAAAGAGCTGGGCTGCTTTGTTCGTTTCATCAGCAGCGGTGACATCGTGAGCATTACCGAGAACCGTGGCAACCAATTTGATCAGCTGAGCTATGAAGGTCTGGCGTACCCGCAATATGCGGACTGGCGTAAGAAAGCGAGCAAGTTCGTGAGCCTGTGGCAGATCACCAAGAAAAACAAGAAAAAGGAAATCGTGACCGTTGAAGCGAAAGAGAAGTTTGACGCGATCTGCAAGTACCAGCCGCGTCTGTATAAATTCAACAAGGAGTACGCGTATCTGCTGCGTGATATTGTTCGTGGCAAAAGCCTGGTGGAACTGCAACAGATTCGTCAAGAGATCTTTCGTTTCATTGAACAGGACTGCGGTGTTACCCGTCTGGGCAGCCTGAGCCTGAGCACCCTGGAAACCGTGAAAGCGGTTAAGGGTATCATTTACAGCTATTTTAGCACCGCGCTGAACGCGAGCAAGAACAACCCGATCAGCGACGAACAGCGTAAAGAGTTTGATCCGGAACTGTTCGCGCTGCTGGAAAAGCTGGAGCTGATTCGTACCCGTAAAAAGAAACAAAAAGTGGAACGTATCGCGAACAGCCTGATTCAGACCTGCCTGGAGAACAACATCAAGTTCATTCGTGGTGAAGGCGACCTGAGCACCACCAACAACGCGACCAAGAAAAAGGCGAACAGCCGTAGCATGGATTGGTTGGCGCGTGGTGTTTTTAACAAAATCCGTCAACTGGCGCCGATGCACAACATTACCCTGTTCGGTTGCGGCAGCCTGTACACCAGCCACCAGGACCCGCTGGTGCATCGTAACCCGGATAAAGCGATGAAGTGCCGTTGGGCGGCGATCCCGGTTAAGGACATTGGCGATTGGGTGCTGCGTAAGCTGAGCCAAAACCTGCGTGCGAAAAACATCGGCACCGGCGAGTACTATCACCAAGGTGTTAAAGAGTTCCTGAGCCATTATGAACTGCAGGACCTGGAGGAAGAGCTGCTGAAGTGGCGTAGCGATCGTAAAAGCAACATTCCGTGCTGGGTGCTGCAGAACCGTCTGGCGGAGAAGCTGGGCAACAAAGAAGCGGTGGTTTACATCCCGGTTCGTGGTGGCCGTATTTATTTTGCGACCCACAAGGTGGCGACCGGTGCGGTGAGCATCGTTTTCGACCAAAAACAAGTGTGGGTTTGCAACGCGGATCATGTTGCGGCGGCGAACATCGCGCTGACCGTGAAGGGTATTGGCGAACAAAGCAGCGACGAAGAGAACCCGGATGGTAGCCGTATCAAACTGCAGCTGACCAGC | 編碼Cas12i2的核苷酸序列 |
222 | MSSAIKSYKSVLRPNERKNQLLKSTIQCLEDGSAFFFKMLQGLFGGITPEIVRFSTEQEKQQQDIALWCAVNWFRPVSQDSLTHTIASDNLVEKFEEYYGGTASDAIKQYFSASIGESYYWNDCRQQYYDLCRELGVEVSDLTHDLEILCREKCLAVATESNQNNSIISVLFGTGEKEDRSVKLRITKKILEAISNLKEIPKNVAPIQEIILNVAKATKETFRQVYAGNLGAPSTLEKFIAKDGQKEFDLKKLQTDLKKVIRGKSKERDWCCQEELRSYVEQNTIQYDLWAWGEMFNKAHTALKIKSTRNYNFAKQRLEQFKEIQSLNNLLVVKKLNDFFDSEFFSGEETYTICVHHLGGKDLSKLYKAWEDDPADPENAIVVLCDDLKNNFKKEPIRNILRYIFTIRQECSAQDILAAAKYNQQLDRYKSQKANPSVLGNQGFTWTNAVILPEKAQRNDRPNSLDLRIWLYLKLRHPDGRWKKHHIPFYDTRFFQEIYAAGNSPVDTCQFRTPRFGYHLPKLTDQTAIRVNKKHVKAAKTEARIRLAIQQGTLPVSNLKITEISATINSKGQVRIPVKFDVGRQKGTLQIGDRFCGYDQNQTASHAYSLWEVVKEGQYHKELGCFVRFISSGDIVSITENRGNQFDQLSYEGLAYPQYADWRKKASKFVSLWQITKKNKKKEIVTVEAKEKFDAICKYQPRLYKFNKEYAYLLRDIVRGKSLVELQQIRQEIFRFIEQDCGVTRLGSLSLSTLETVKAVKGIIYSYFSTALNASKNNPISDEQRKEFDPELFALLEKLELIRTRKKKQKVERIANSLIQTCLENNIKFIRGEGDLSTTNNATKKKANSRSMDWLARGVFNKIRQLAPMHNITLFGCGSLYTSHQDPLVHRNPDKAMKCRWAAIPVKDIGDWVLRKLSQNLRAKNIGTGEYYHQGVKEFLSHYELQDLEEELLKWRSDRKSNIPCWVLQNRLAEKLGNKEAVVYIPVRGGRIYFATHKVATGAVSIVFDQKQVWVCNADHVAAANIALTVKGIGEQSSDEENPDGSRIKLQLTS | Cas12i2胺基酸序列 |
223 | MSSAIKSYKS VLRPNERKNQ LLKSTIQCLE DGSAFFFKML QGLFGGITPE IVRFSTEQEK QQQDIALWCA VNWFRPVSQD SLTHTIASDN LVEKFEEYYG GTASDAIKQY FSASIGESYY WNDCRQQYYD LCRELGVEVS DLTHDLEILC REKCLAVATE SNQNNSIISV LFGTGEKEDR SVKLRITKKI LEAISNLKEI PKNVAPIQEI ILNVAKATKE TFRQVYAGNL GAPSTLEKFI AKDGQKEFDL KKLQTDLKKV IRGKSKERDW CCQEELRSYV EQNTIQYDLW AWGEMFNKAH TALKIKSTRN YNFAKQRLEQ FKEIQSLNNL LVVKKLNDFF DSEFFSGEET YTICVHHLGG KDLSKLYKAW EDDPADPENA IVVLCDDLKN NFKKEPIRNI LRYIFTIRQE CSAQDILAAA KYNQQLDRYK SQKANPSVLG NQGFTWTNAV ILPEKAQRND RPNSLDLRIW LYLKLRHPDG RWKKHHIPFY DTRFFQEIYA AGNSPVDTCQ FRTPRFGYHL PKLTDQTAIR VNKKHVKAAK TEARIRLAIQ QGTLPVSNLK ITEISATINS KGQVRIPVKF RVGRQKGTLQ IGDRFCGYDQ NQTASHAYSL WEVVKEGQYH KELGCFVRFI SSGDIVSITE NRGNQFDQLS YEGLAYPQYA DWRKKASKFV SLWQITKKNK KKEIVTVEAK EKFDAICKYQ PRLYKFNKEY AYLLRDIVRG KSLVELQQIR QEIFRFIEQD CGVTRLGSLS LSTLETVKAV KGIIYSYFST ALNASKNNPI SDEQRKEFDP ELFALLEKLE LIRTRKKKQK VERIANSLIQ TCLENNIKFI RGEGDLSTTN NATKKKANSR SMDWLARGVF NKIRQLAPMH NITLFGCGSL YTSHQDPLVH RNPDKAMKCR WAAIPVKDIG RWVLRKLSQN LRAKNRGTGE YYHQGVKEFL SHYELQDLEE ELLKWRSDRK SNIPCWVLQN RLAEKLGNKE AVVYIPVRGG RIYFATHKVA TGAVSIVFDQ KQVWVCNADH VAAANIALTG KGIGEQSSDE ENPDGSRIKL QLTS | PCT/US2021/025257的SEQ ID NO: 3的變體Cas12i2 |
224 | MSSAIKSYKS VLRPNERKNQ LLKSTIQCLE DGSAFFFKML QGLFGGITPE IVRFSTEQEK QQQDIALWCA VNWFRPVSQD SLTHTIASDN LVEKFEEYYG GTASDAIKQY FSASIGESYY WNDCRQQYYD LCRELGVEVS DLTHDLEILC REKCLAVATE SNQNNSIISV LFGTGEKEDR SVKLRITKKI LEAISNLKEI PKNVAPIQEI ILNVAKATKE TFRQVYAGNL GAPSTLEKFI AKDGQKEFDL KKLQTDLKKV IRGKSKERDW CCQEELRSYV EQNTIQYDLW AWGEMFNKAH TALKIKSTRN YNFAKQRLEQ FKEIQSLNNL LVVKKLNDFF DSEFFSGEET YTICVHHLGG KDLSKLYKAW EDDPADPENA IVVLCDDLKN NFKKEPIRNI LRYIFTIRQE CSAQDILAAA KYNQQLDRYK SQKANPSVLG NQGFTWTNAV ILPEKAQRND RPNSLDLRIW LYLKLRHPDG RWKKHHIPFY DTRFFQEIYA AGNSPVDTCQ FRTPRFGYHL PKLTDQTAIR VNKKHVKAAK TEARIRLAIQ QGTLPVSNLK ITEISATINS KGQVRIPVKF RVGRQKGTLQ IGDRFCGYDQ NQTASHAYSL WEVVKEGQYH KELGCFVRFI SSGDIVSITE NRGNQFDQLS YEGLAYPQYA DWRKKASKFV SLWQITKKNK KKEIVTVEAK EKFDAICKYQ PRLYKFNKEY AYLLRDIVRG KSLVELQQIR QEIFRFIEQD CGVTRLGSLS LSTLETVKAV KGIIYSYFST ALNASKNNPI SDEQRKEFDP ELFALLEKLE LIRTRKKKQK VERIANSLIQ TCLENNIKFI RGEGDLSTTN NATKKKANSR SMDWLARGVF NKIRQLAPMH NITLFGCGSL YTSHQDPLVH RNPDKAMKCR WAAIPVKDIG DWVLRKLSQN LRAKNRGTGE YYHQGVKEFL SHYELQDLEE ELLKWRSDRK SNIPCWVLQN RLAEKLGNKE AVVYIPVRGG RIYFATHKVA TGAVSIVFDQ KQVWVCNADH VAAANIALTG KGIGEQSSDE ENPDGSRIKL QLTS | PCT/US2021/025257的SEQ ID NO: 4的變體Cas12i2 |
225 | MSSAIKSYKS VLRPNERKNQ LLKSTIQCLE DGSAFFFKML QGLFGGITPE IVRFSTEQEK QQQDIALWCA VNWFRPVSQD SLTHTIASDN LVEKFEEYYG GTASDAIKQY FSASIGESYY WNDCRQQYYD LCRELGVEVS DLTHDLEILC REKCLAVATE SNQNNSIISV LFGTGEKEDR SVKLRITKKI LEAISNLKEI PKNVAPIQEI ILNVAKATKE TFRQVYAGNL GAPSTLEKFI AKDGQKEFDL KKLQTDLKKV IRGKSKERDW CCQEELRSYV EQNTIQYDLW AWGEMFNKAH TALKIKSTRN YNFAKQRLEQ FKEIQSLNNL LVVKKLNDFF DSEFFSGEET YTICVHHLGG KDLSKLYKAW EDDPADPENA IVVLCDDLKN NFKKEPIRNI LRYIFTIRQE CSAQDILAAA KYNQQLDRYK SQKANPSVLG NQGFTWTNAV ILPEKAQRND RPNSLDLRIW LYLKLRHPDG RWKKHHIPFY DTRFFQEIYA AGNSPVDTCQ FRTPRFGYHL PKLTDQTAIR VNKKHVKAAK TEARIRLAIQ QGTLPVSNLK ITEISATINS KGQVRIPVKF RVGRQKGTLQ IGDRFCGYDQ NQTASHAYSL WEVVKEGQYH KELGCFVRFI SSGDIVSITE NRGNQFDQLS YEGLAYPQYA DWRKKASKFV SLWQITKKNK KKEIVTVEAK EKFDAICKYQ PRLYKFNKEY AYLLRDIVRG KSLVELQQIR QEIFRFIEQD CGVTRLGSLS LSTLETVKAV KGIIYSYFST ALNASKNNPI SDEQRKEFDP ELFALLEKLE LIRTRKKKQK VERIANSLIQ TCLENNIKFI RGEGDLSTTN NATKKKANSR SMDWLARGVF NKIRQLAPMH NITLFGCGSL YTSHQDPLVH RNPDKAMKCR WAAIPVKDIG DWVLRKLSQN LRAKNRGTGE YYHQGVKEFL SHYELQDLEE ELLKWRSDRK SNIPCWVLQN RLAEKLGNKE AVVYIPVRGG RIYFATHKVA TGAVSIVFDQ KQVWVCNADH VAAANIALTG KGIGEQSSDE ENPDGGRIKL QLTS | PCT/US2021/025257的SEQ ID NO: 5的變體Cas12i2 |
226 | MSSAIKSYKS VLRPNERKNQ LLKSTIQCLE DGSAFFFKML QGLFGGITPE IVRFSTEQEK QQQDIALWCA VNWFRPVSQD SLTHTIASDN LVEKFEEYYG GTASDAIKQY FSASIGESYY WNDCRQQYYD LCRELGVEVS DLTHDLEILC REKCLAVATE SNQNNSIISV LFGTGEKEDR SVKLRITKKI LEAISNLKEI PKNVAPIQEI ILNVAKATKE TFRQVYAGNL GAPSTLEKFI AKDGQKEFDL KKLQTDLKKV IRGKSKERDW CCQEELRSYV EQNTIQYDLW AWGEMFNKAH TALKIKSTRN YNFAKQRLEQ FKEIQSLNNL LVVKKLNDFF DSEFFSGEET YTICVHHLGG KDLSKLYKAW EDDPADPENA IVVLCDDLKN NFKKEPIRNI LRYIFTIRQE CSAQDILAAA KYNQQLDRYK SQKANPSVLG NQGFTWTNAV ILPEKAQRND RPNSLDLRIW LYLKLRHPDG RWKKHHIPFY DTRFFQEIYA AGNSPVDTCQ FRTPRFGYHL PKLTDQTAIR VNKKHVKAAK TEARIRLAIQ QGTLPVSNLK ITEISATINS KGQVRIPVKF RVGRQKGTLQ IGDRFCGYDQ NQTASHAYSL WEVVKEGQYH KELRCRVRFI SSGDIVSITE NRGNQFDQLS YEGLAYPQYA DWRKKASKFV SLWQITKKNK KKEIVTVEAK EKFDAICKYQ PRLYKFNKEY AYLLRDIVRG KSLVELQQIR QEIFRFIEQD CGVTRLGSLS LSTLETVKAV KGIIYSYFST ALNASKNNPI SDEQRKEFDP ELFALLEKLE LIRTRKKKQK VERIANSLIQ TCLENNIKFI RGEGDLSTTN NATKKKANSR SMDWLARGVF NKIRQLAPMH NITLFGCGSL YTSHQDPLVH RNPDKAMKCR WAAIPVKDIG DWVLRKLSQN LRAKNRGTGE YYHQGVKEFL SHYELQDLEE ELLKWRSDRK SNIPCWVLQN RLAEKLGNKE AVVYIPVRGG RIYFATHKVA TGAVSIVFDQ KQVWVCNADH VAAANIALTG KGIGRQSSDE ENPDGGRIKL QLTS | PCT/US2021/025257的SEQ ID NO: 495的變體Cas12i2 |
227 | MSSAIKSYKS VLRPNERKNQ LLKSTIQCLE DGSAFFFKML QGLFGGITPE IVRFSTEQEK QQQDIALWCA VNWFRPVSQD SLTHTIASDN LVEKFEEYYG GTASDAIKQY FSASIGESYY WNDCRQQYYD LCRELGVEVS DLTHDLEILC REKCLAVATE SNQNNSIISV LFGTGEKEDR SVKLRITKKI LEAISNLKEI PKNVAPIQEI ILNVAKATKE TFRQVYAGNL GAPSTLEKFI AKDGQKEFDL KKLQTDLKKV IRGKSKERDW CCQEELRSYV EQNTIQYDLW AWGEMFNKAH TALKIKSTRN YNFAKQRLEQ FKEIQSLNNL LVVKKLNDFF DSEFFSGEET YTICVHHLGG KDLSKLYKAW EDDPADPENA IVVLCDDLKN NFKKEPIRNI LRYIFTIRQE CSAQDILAAA KYNQQLDRYK SQKANPSVLG NQGFTWTNAV ILPEKAQRND RPNSLDLRIW LYLKLRHPDG RWKKHHIPFY DTRFFQEIYA AGNSPVDTCQ FRTPRFGYHL PKLTDQTAIR VNKKHVKAAK TEARIRLAIQ QGTLPVSNLK ITEISATINS KGQVRIPVKF RVGRQKGTLQ IGDRFCGYDQ NQTASHAYSL WEVVKEGQYH KELRCRVRFI SSGDIVSITE NRGNQFDQLS YEGLAYPQYA DWRKKASKFV SLWQITKKNK KKEIVTVEAK EKFDAICKYQ PRLYKFNKEY AYLLRDIVRG KSLVELQQIR QEIFRFIEQD CGVTRLGSLS LSTLETVKAV KGIIYSYFST ALNASKNNPI SDEQRKEFDP ELFALLEKLE LIRTRKKKQK VERIANSLIQ TCLENNIKFI RGEGDLSTTN NATKKKANSR SMDWLARGVF NKIRQLATMH NITLFGCGSL YTSHQDPLVH RNPDKAMKCR WAAIPVKDIG DWVLRKLSQN LRAKNRGTGE YYHQGVKEFL SHYELQDLEE ELLKWRSDRK SNIPCWVLQN RLAEKLGNKE AVVYIPVRGG RIYFATHKVA TGAVSIVFDQ KQVWVCNADH VAAANIALTG KGIGRQSSDE ENPDGGRIKL QLTS | PCT/US2021/025257的SEQ ID NO: 496的變體Cas12i2 |
252 | ATGGCTTCCATCTCTAGGCCATACGGCACCAAGCTGCGACCGGACGCACGGAAGAAGGAGATGCTCGATAAGTTCTTTAATACACTGACTAAGGGTCAGCGCGTGTTCGCAGACCTGGCCCTGTGCATCTATGGCTCCCTGACCCTGGAGATGGCCAAGTCTCTGGAGCCAGAAAGTGATTCAGAACTGGTGTGCGCTATTGGGTGGTTTCGGCTGGTGGACAAGACCATCTGGTCCAAGGATGGCATCAAGCAGGAGAATCTGGTGAAACAGTACGAAGCCTATTCCGGAAAGGAGGCTTCTGAAGTGGTCAAAACATACCTGAACAGCCCCAGCTCCGACAAGTACGTGTGGATCGATTGCAGGCAGAAATTCCTGAGGTTTCAGCGCGAGCTCGGCACTCGCAACCTGTCCGAGGACTTCGAATGTATGCTCTTTGAACAGTACATTAGACTGACCAAGGGCGAGATCGAAGGGTATGCCGCTATTTCAAATATGTTCGGAAACGGCGAGAAGGAAGACCGGAGCAAGAAAAGAATGTACGCTACACGGATGAAAGATTGGCTGGAGGCAAACGAAAATATCACTTGGGAGCAGTATAGAGAGGCCCTGAAGAACCAGCTGAATGCTAAAAACCTGGAGCAGGTTGTGGCCAATTACAAGGGGAACGCTGGCGGGGCAGACCCCTTCTTTAAGTATAGCTTCTCCAAAGAGGGAATGGTGAGCAAGAAAGAACATGCACAGCAGCTCGACAAGTTCAAAACCGTCCTGAAGAACAAAGCCCGGGACCTGAATTTTCCAAACAAGGAGAAGCTGAAGCAGTACCTGGAGGCCGAAATCGGCATTCCGGTCGACGCTAACGTGTACTCCCAGATGTTCTCTAACGGGGTGAGTGAGGTCCAGCCTAAGACCACACGGAATATGTCTTTTAGTAACGAGAAACTGGATCTGCTCACTGAACTGAAGGACCTGAACAAGGGCGATGGGTTCGAGTACGCCAGAGAAGTGCTGAACGGGTTCTTTGACTCCGAGCTCCACACTACCGAGGATAAGTTTAATATCACCTCTAGGTACCTGGGAGGCGACAAATCAAACCGCCTGAGCAAACTCTATAAGATCTGGAAGAAAGAGGGTGTGGACTGCGAGGAAGGCATTCAGCAGTTCTGTGAAGCCGTCAAAGATAAGATGGGCCAGATCCCCATTCGAAATGTGCTGAAGTACCTGTGGCAGTTCCGGGAGACAGTCAGTGCCGAGGATTTTGAAGCAGCCGCTAAGGCTAACCATCTGGAGGAAAAGATCAGCCGGGTGAAAGCCCACCCAATCGTGATTAGCAATAGGTACTGGGCTTTTGGGACTTCCGCACTGGTGGGAAACATTATGCCCGCAGACAAGAGGCATCAGGGAGAGTATGCCGGTCAGAATTTCAAAATGTGGCTGGAGGCTGAACTGCACTACGATGGCAAGAAAGCAAAGCACCATCTGCCTTTTTATAACGCCCGCTTCTTTGAGGAAGTGTACTGCTATCACCCCTCTGTCGCCGAGATCACTCCTTTCAAAACCAAGCAGTTTGGCTGTGAAATCGGGAAGGACATTCCAGATTACGTGAGCGTCGCTCTGAAGGACAATCCGTATAAGAAAGCAACCAAACGAATCCTGCGTGCAATCTACAATCCCGTCGCCAACACAACTGGCGTTGATAAGACCACAAACTGCAGCTTCATGATCAAACGCGAGAATGACGAATATAAGCTGGTCATCAACCGAAAAATTTCCGTGGATCGGCCTAAGAGAATCGAAGTGGGCAGGACAATTATGGGGTACGACCGCAATCAGACAGCTAGCGATACTTATTGGATTGGCCGGCTGGTGCCACCTGGAACCCGGGGCGCATACCGCATCGGAGAGTGGAGCGTCCAGTATATTAAGTCCGGGCCTGTCCTGTCTAGTACTCAGGGAGTTAACAATTCCACTACCGACCAGCTGGTGTACAACGGCATGCCATCAAGCTCCGAGCGGTTCAAGGCCTGGAAGAAAGCCAGAATGGCTTTTATCCGAAAACTCATTCGTCAGCTGAATGACGAGGGACTGGAATCTAAGGGTCAGGATTATATCCCCGAGAACCCTTCTAGTTTCGATGTGCGGGGCGAAACCCTGTACGTCTTTAACAGTAATTATCTGAAGGCCCTGGTGAGCAAACACAGAAAGGCCAAGAAACCTGTTGAGGGGATCCTGGACGAGATTGAAGCCTGGACATCTAAAGACAAGGATTCATGCAGCCTGATGCGGCTGAGCAGCCTGAGCGATGCTTCCATGCAGGGAATCGCCAGCCTGAAGAGTCTGATTAACAGCTACTTCAACAAGAATGGCTGTAAAACCATCGAGGACAAAGAAAAGTTTAATCCCGTGCTGTATGCCAAGCTGGTTGAGGTGGAACAGCGGAGAACAAACAAGCGGTCTGAGAAAGTGGGAAGAATCGCAGGTAGTCTGGAGCAGCTGGCCCTGCTGAACGGGGTTGAGGTGGTCATCGGCGAAGCTGACCTGGGGGAGGTCGAAAAAGGAAAGAGTAAGAAACAGAATTCACGGAACATGGATTGGTGCGCAAAGCAGGTGGCACAGCGGCTGGAGTACAAACTGGCCTTCCATGGAATCGGTTACTTTGGAGTGAACCCCATGTATACCAGCCACCAGGACCCTTTCGAACATAGGCGCGTGGCTGATCACATCGTCATGCGAGCACGTTTTGAGGAAGTCAACGTGGAGAACATTGCCGAATGGCACGTGCGAAATTTCTCAAACTACCTGCGTGCAGACAGCGGCACTGGGCTGTACTATAAGCAGGCCACCATGGACTTCCTGAAACATTACGGTCTGGAGGAACACGCTGAGGGCCTGGAAAATAAGAAAATCAAGTTCTATGACTTTAGAAAGATCCTGGAGGATAAAAACCTGACAAGCGTGATCATTCCAAAGAGGGGCGGGCGCATCTACATGGCCACCAACCCAGTGACATCCGACTCTACCCCGATTACATACGCCGGCAAGACTTATAATAGGTGTAACGCTGATGAGGTGGCAGCCGCTAATATCGTTATTTCTGTGCTGGCTCCCCGCAGTAAGAAAAACGAGGAACAGGACGATATCCCTCTGATTACCAAGAAAGCCGAGAGTAAGTCACCACCGAAAGACCGGAAGAGATCAAAAACAAGCCAGCTGCCTCAGAAA | 編碼Cas12i4的核苷酸序列 |
253 | MASISRPYGTKLRPDARKKEMLDKFFNTLTKGQRVFADLALCIYGSLTLEMAKSLEPESDSELVCAIGWFRLVDKTIWSKDGIKQENLVKQYEAYSGKEASEVVKTYLNSPSSDKYVWIDCRQKFLRFQRELGTRNLSEDFECMLFEQYIRLTKGEIEGYAAISNMFGNGEKEDRSKKRMYATRMKDWLEANENITWEQYREALKNQLNAKNLEQVVANYKGNAGGADPFFKYSFSKEGMVSKKEHAQQLDKFKTVLKNKARDLNFPNKEKLKQYLEAEIGIPVDANVYSQMFSNGVSEVQPKTTRNMSFSNEKLDLLTELKDLNKGDGFEYAREVLNGFFDSELHTTEDKFNITSRYLGGDKSNRLSKLYKIWKKEGVDCEEGIQQFCEAVKDKMGQIPIRNVLKYLWQFRETVSAEDFEAAAKANHLEEKISRVKAHPIVISNRYWAFGTSALVGNIMPADKRHQGEYAGQNFKMWLEAELHYDGKKAKHHLPFYNARFFEEVYCYHPSVAEITPFKTKQFGCEIGKDIPDYVSVALKDNPYKKATKRILRAIYNPVANTTGVDKTTNCSFMIKRENDEYKLVINRKISVDRPKRIEVGRTIMGYDRNQTASDTYWIGRLVPPGTRGAYRIGEWSVQYIKSGPVLSSTQGVNNSTTDQLVYNGMPSSSERFKAWKKARMAFIRKLIRQLNDEGLESKGQDYIPENPSSFDVRGETLYVFNSNYLKALVSKHRKAKKPVEGILDEIEAWTSKDKDSCSLMRLSSLSDASMQGIASLKSLINSYFNKNGCKTIEDKEKFNPVLYAKLVEVEQRRTNKRSEKVGRIAGSLEQLALLNGVEVVIGEADLGEVEKGKSKKQNSRNMDWCAKQVAQRLEYKLAFHGIGYFGVNPMYTSHQDPFEHRRVADHIVMRARFEEVNVENIAEWHVRNFSNYLRADSGTGLYYKQATMDFLKHYGLEEHAEGLENKKIKFYDFRKILEDKNLTSVIIPKRGGRIYMATNPVTSDSTPITYAGKTYNRCNADEVAAANIVISVLAPRSKKNEEQDDIPLITKKAESKSPPKDRKRSKTSQLPQK | Cas12i4胺基酸序列 |
254 | MASISRPYGT KLRPDARKKE MLDKFFNTLT KGQRVFADLA LCIYGSLTLE MAKSLEPESD SELVCAIGWF RLVDKTIWSK DGIKQENLVK QYEAYSGKEA SEVVKTYLNS PSSDKYVWID CRQKFLRFQR ELGTRNLSED FECMLFEQYI RLTKGEIEGY AAISNMFGNG EKEDRSKKRM YATRMKDWLE ANENITWEQY REALKNQLNA KNLEQVVANY KGNAGGADPF FKYSFSKEGM VSKKEHAQQL DKFKTVLKNK ARDLNFPNKE KLKQYLEAEI GIPVDANVYS QMFSNGVSEV QPKTTRNMSF SNEKLDLLTE LKDLNKGDGF EYAREVLNGF FDSELHTTED KFNITSRYLG GDKSNRLSKL YKIWKKEGVD CEEGIQQFCE AVKDKMGQIP IRNVLKYLWQ FRETVSAEDF EAAAKANHLE EKISRVKAHP IVISNRYWAF GTSALVGNIM PADKRHQGEY AGQNFKMWLE AELHYDGKKA KHHLPFYNAR FFEEVYCYHP SVAEITPFKT KQFGCEIGKD IPDYVSVALK DNPYKKATKR ILRAIYNPVA NTTGVDKTTN CSFMIKREND EYKLVINRKI SRDRPKRIEV GRTIMGYDRN QTASDTYWIG RLVPPGTRGA YRIGEWSVQY IKSGPVLSST QGVNNSTTDQ LVYNGMPSSS ERFKAWKKAR MAFIRKLIRQ LNDEGLESKG QDYIPENPSS FDVRGETLYV FNSNYLKALV SKHRKAKKPV EGILDEIEAW TSKDKDSCSL MRLSSLSDAS MQGIASLKSL INSYFNKNGC KTIEDKEKFN PVLYAKLVEV EQRRTNKRSE KVGRIAGSLE QLALLNGVEV VIGEADLGEV EKGKSKKQNS RNMDWCAKQV AQRLEYKLAF HGIGYFGVNP MYTSHQDPFE HRRVADHIVM RARFEEVNVE NIAEWHVRNF SNYLRADSGT GLYYKQATMD FLKHYGLEEH AEGLENKKIK FYDFRKILED KNLTSVIIPK RGGRIYMATN PVTSDSTPIT YAGKTYNRCN ADEVAAANIV ISVLAPRSKK NREQDDIPLI TKKAESKSPP KDRKRSKTSQ LPQK | 變體Cas12i4 A |
255 | MASISRPYGT KLRPDARKKE MLDKFFNTLT KGQRVFADLA LCIYGSLTLE MAKSLEPESD SELVCAIGWF RLVDKTIWSK DGIKQENLVK QYEAYSGKEA SEVVKTYLNS PSSDKYVWID CRQKFLRFQR ELGTRNLSED FECMLFEQYI RLTKGEIEGY AAISNMFGNG EKEDRSKKRM YATRMKDWLE ANENITWEQY REALKNQLNA KNLEQVVANY KGNAGGADPF FKYSFSKEGM VSKKEHAQQL DKFKTVLKNK ARDLNFPNKE KLKQYLEAEI GIPVDANVYS QMFSNGVSEV QPKTTRNMSF SNEKLDLLTE LKDLNKGDGF EYAREVLNGF FDSELHTTED KFNITSRYLG GDKSNRLSKL YKIWKKEGVD CEEGIQQFCE AVKDKMGQIP IRNVLKYLWQ FRETVSAEDF EAAAKANHLE EKISRVKAHP IVISNRYWAF GTSALVGNIM PADKRHQGEY AGQNFKMWLR AELHYDGKKA KHHLPFYNAR FFEEVYCYHP SVAEITPFKT KQFGCEIGKD IPDYVSVALK DNPYKKATKR ILRAIYNPVA NTTRVDKTTN CSFMIKREND EYKLVINRKI SRDRPKRIEV GRTIMGYDRN QTASDTYWIG RLVPPGTRGA YRIGEWSVQY IKSGPVLSST QGVNNSTTDQ LVYNGMPSSS ERFKAWKKAR MAFIRKLIRQ LNDEGLESKG QDYIPENPSS FDVRGETLYV FNSNYLKALV SKHRKAKKPV EGILDEIEAW TSKDKDSCSL MRLSSLSDAS MQGIASLKSL INSYFNKNGC KTIEDKEKFN PVLYAKLVEV EQRRTNKRSE KVGRIAGSLE QLALLNGVEV VIGEADLGEV EKGKSKKQNS RNMDWCAKQV AQRLEYKLAF HGIGYFGVNP MYTSHQDPFE HRRVADHIVM RARFEEVNVE NIAEWHVRNF SNYLRADSGT GLYYKQATMD FLKHYGLEEH AEGLENKKIK FYDFRKILED KNLTSVIIPK RGGRIYMATN PVTSDSTPIT YAGKTYNRCN ADEVAAANIV ISVLAPRSKK NREQDDIPLI TKKAESKSPP KDRKRSKTSQ LPQK | 變體Cas12i4 B |
265 | MSNKEKNASETRKAYTTKMIPRSHDRMKLLGNFMDYLMDGTPIFFELWNQFGGGIDRDIISGTANKDKISDDLLLAVNWFKVMPINSKPQGVSPSNLANLFQQYSGSEPDIQAQEYFASNFDTEKHQWKDMRVEYERLLAELQLSRSDMHHDLKLMYKEKCIGLSLSTAHYITSVMFGTGAKNNRQTKHQFYSKVIQLLEESTQINSVEQLASIILKAGDCDSYRKLRIRCSRKGATPSILKIVQDYELGTNHDDEVNVPSLIANLKEKLGRFEYECEWKCMEKIKAFLASKVGPYYLGSYSAMLENALSPIKGMTTKNCKFVLKQIDAKNDIKYENEPFGKIVEGFFDSPYFESDTNVKWVLHPHHIGESNIKTLWEDLNAIHSKYEEDIASLSEDKKEKRIKVYQGDVCQTINTYCEEVGKEAKTPLVQLLRYLYSRKDDIAVDKIIDGITFLSKKHKVEKQKINPVIQKYPSFNFGNNSKLLGKIISPKDKLKHNLKCNRNQVDNYIWIEIKVLNTKTMRWEKHHYALSSTRFLEEVYYPATSENPPDALAARFRTKTNGYEGKPALSAEQIEQIRSAPVGLRKVKKRQMRLEAARQQNLLPRYTWGKDFNINICKRGNNFEVTLATKVKKKKEKNYKVVLGYDANIVRKNTYAAIEAHANGDGVIDYNDLPVKPIESGFVTVESQVRDKSYDQLSYNGVKLLYCKPHVESRRSFLEKYRNGTMKDNRGNNIQIDFMKDFEAIADDETSLYYFNMKYCKLLQSSIRNHSSQAKEYREEIFELLRDGKLSVLKLSSLSNLSFVMFKVAKSLIGTYFGHLLKKPKNSKSDVKAPPITDEDKQKADPEMFALRLALEEKRLNKVKSKKEVIANKIVAKALELRDKYGPVLIKGENISDTTKKGKKSSTNSFLMDWLARGVANKVKEMVMMHQGLEFVEVNPNFTSHQDPFVHKNPENTFRARYSRCTPSELTEKNRKEILSFLSDKPSKRPTNAYYNEGAMAFLATYGLKKNDVLGVSLEKFKQIMANILHQRSEDQLLFPSRGGMFYLATYKLDADATSVNWNGKQFWVCNADLVAAYNVGLVDIQKDFKKK | Cas12i1(美國專利案號10,808,245中的SEQ ID NO: 3) |
266 | MSISNNNILPYNPKLLPDDRKHKMLVDTFNQLDLIRNNLHDMIIALYGALKYDNIKQFASKEKPHISADALCSINWFRLVKTNERKPAIESNQIISKFIQYSGHTPDKYALSHITGNHEPSHKWIDCREYAINYARIMHLSFSQFQDLATACLNCKILILNGTLTSSWAWGANSALFGGSDKENFSVKAKILNSFIENLKDEMNTTKFQVVEKVCQQIGSSDAADLFDLYRSTVKDGNRGPATGRNPKVMNLFSQDGEISSEQREDFIESFQKVMQEKNSKQIIPHLDKLKYHLVKQSGLYDIYSWAAAIKNANSTIVASNSSNLNTILNKTEKQQTFEELRKDEKIVACSKILLSVNDTLPEDLHYNPSTSNLGKNLDVFFDLLNENSVHTIENKEEKNKIVKECVNQYMEECKGLNKPPMPVLLTFISDYAHKHQAQDFLSAAKMNFIDLKIKSIKVVPTVHGSSPYTWISNLSKKNKDGKMIRTPNSSLIGWIIPPEEIHDQKFAGQNPIIWAVLRVYCNNKWEMHHFPFSDSRFFTEVYAYKPNLPYLPGGENRSKRFGYRHSTNLSNESRQILLDKSKYAKANKSVLRCMENMTHNVVFDPKTSLNIRIKTDKNNSPVLDDKGRITFVMQINHRILEKYNNTKIEIGDRILAYDQNQSENHTYAILQRTEEGSHAHQFNGWYVRVLETGKVTSIVQGLSGPIDQLNYDGMPVTSHKFNCWQADRSAFVSQFASLKISETETFDEAYQAINAQGAYTWNLFYLRILRKALRVCHMENINQFREEILAISKNRLSPMSLGSLSQNSLKMIRAFKSIINCYMSRMSFVDELQKKEGDLELHTIMRLTDNKLNDKRVEKINRASSFLTNKAHSMGCKMIVGESDLPVADSKTSKKQNVDRMDWCARALSHKVEYACKLMGLAYRGIPAYMSSHQDPLVHLVESKRSVLRPRFVVADKSDVKQHHLDNLRRMLNSKTKVGTAVYYREAVELMCEELGIHKTDMAKGKVSLSDFVDKFIGEKAIFPQRGGRFYMSTKRLTTGAKLICYSGSDVWLSDADEIAAINIGMFVVCDQTGAFKKKKKEKLDDEECDILPFRPM | Cas12i3(美國專利案號10,808,245中的SEQ ID NO: 14) |
228 | ACAGAAGTCCACTCATTCTTGGCAGGATGGCTTCTCATCGTCTGCTCCTCCTCTGCCTTGCTGGACTGGTATTTGTGTCTGAGGCTGGCCCTACGGTGAGTGTTTCTGTGACATCCCATTCCTACATTTAAGATTCACGCTAAATGAAGTAGAAGTGACTCCTTCCAGCTTTGCCAACCAGCTTTTATTACTAGGGCAAGGGTACCCAGCATCTATTTTTAATATAATTAATTCAAACTTCAAAAAGAATGAAGTTCCACTGAGCTTACTGAGCTGGGACTTGAACTCTGAGCATTCTACCTCATTGCTTTGGTGCATTAGGTTTGTAATATCTGGTACCTCTGTTTCCTCAGATAGATGATAGAAATAAAGATATGATATTAAGGAAGCTGTTAATACTGAATTTTCAGAAAAGTATCCCTCCATAAAATGTATTTGGGGGACAAACTGCAGGAGATTATATTCTGGCCCTATAGTTATTCAAAACGTATTTATTGATTAATCTTTAAAAGGCTTAGTGAACAATATTCTAGTCAGATATCTAATTCTTAAATCCTCTAGAAGAATTAACTAATACTATAAAATGGGTCTGGATGTAGTTCTGACATTATTTTATAACAACTGGTAAGAGGGAGTGACTATAGCAACAACTAAAATGATCTCAGGAAAACCTGTTTGGCCCTATGTATGGTACATTACATCTTTTCAGTAATTCCACTCAAATGGAGACTTTTAACAAAGCAACTGTTCTCAGGGGACCTATTTTCTCCCTTAAAATTCATTATACACATCCCTGGTTGATAGCAGTGTGTCTGGAGGCAGAAACCATTCTTGCTTTGGAAACAATTACGTCTGTGTTATACTGAGTAGGGAAGCTCATTAATTGTCGACACTTACGTTCCTGATAATGGGATCAGTGTGTAATTCTTGTTTCGCTCCAGATTTCTAATACCACAAAGAATAAATCCTTTCACTCTGATCAATTTTGTTAACTTCTCACGTGTCTTCTCTACACCCAGGGCACCGGTGAATCCAAGTGTCCTCTGATGGTCAAAGTTCTAGATGCTGTCCGAGGCAGTCCTGCCATCAATGTGGCCGTGCATGTGTTCAGAAAGGCTGCTGATGACACCTGGGAGCCATTTGCCTCTGGGTAAGTTGCCAAAGAACCCTCCCACAGGACTTGGTTTTATCTTCCCGTTTGCCCCTCACTTGGTAGAGAGAGGCTCACATCATCTGCTAAAGAATTTACAAGTAGATTGAAAAACGTAGGCAGAGGTCAAGTATGCCCTCTGAAGGATGCCCTCTTTTTGTTTTGCTTAGCTAGGAAGTGACCAGGAACCTGAGCATCATTTAGGGGCAGACAGTAGAGAAAAGAAGGAATCAGAACTCCTCTCCTCTAGCTGTGGTTTGCAACCCTTTTGGGTCACAGAACACTTTATGTAGGTGATGAAAAGTAAACATTCTATGCCCAGAAAAAATGCACAGATACACACACATACAAAATCATATATGTGATTTTAGGAGTTTCACAGATTCCCTGGTGTCCCTGGGTAACACCAAAGCTAAGTGTCCTTGTCTTAGAATTTTAGGAAAAGGTATAATGTGTATTAACCCATTAACAAAAGGAAAGGAATTCAGAAATATTATTAACCAGGCATCTGTCTGTAGTTAATATGGATCACCCAAAACCCAAGGCTTTTGCCTAATGAACACTTTGGGGCACCTACTGTGTGCAAGGCTGGGGGCTGTCAAGCTCAGTTAAAAAAAAAAAGATAGAAGAGATGGATCCATGAGGCAAAGTACAGCCCCAGGCTAATCCCACGATCACCCGACTTCATGTCCAAGAGTGGCTTCTCACCTTCATTAGCCAGTTCACAATTTTCATGGAGTTTTTCTACCTGCACTAGCAAAAACTTCAAGGAAAATACATATTAATAAATCTAAGCAAAGTGACCAGAAGACAGAGCAATCAGGAGACCCTTTGCATCCAGCAGAAGAGGAACTGCTAAGTATTTACATCTCCACAGAGAAGAATTTCTGTTGGGTTTTAATTGAACCCCAAGAACCACATGATTCTTCAACCATTATTGGGAAGATCATTTTCTTAGGTCTGGTTTTAACTGGCTTTTTATTTGGGAATTCATTTATGTTTATATAAAATGCCAAGCATAACATGAAAAGTGGTTACAGGACTATTCTAAGGGAGAGACAGAATGGACACCAAAAATATTCCAATGTTCTTGTGAATCTTTTCCTTGCACCAGGACAAAAAAAAAAAGAAGTGAAAAGAAGAAAGGAGGAGGGGCATAATCAGAGTCAGTAAAGACAACTGCTATTTTTATCTATCGTAGCTGTTGCAGTCAAATGGGAAGCAATTTCCAACATTCAACTATGGAGCTGGTACTTACATGGAAATAGAAGTTGCCTAGTGTTTGTTGCTGGCAAAGAGTTATCAGAGAGGTTAAATATATAAAAGGGAAAAGAGTCAGATACAGGTTCTTCTTCCTACTTTAGGTTTTCCACTGTGTGTGCAAATGATACTCCCTGGTGGTGTGCAGATGCCTCAAAGCTATCCTCACACCACAAGGGAGAGGAGCGAGATCCTGCTGTCCTGGAGAAGTGCAGAGTTAGAACAGCTGTGGCCACTTGCATCCAATCATCAATCTTGAATCACAGGGACTCTTTCTTAAGTAAACATTATACCTGGCCGGGCACGGTGGCTCACGCCTGTAATCCCAGCACTTTGGGATGCCAAAGTGGGCATATCATCTGAGGTCAGGAGTTCAAGACCAGCCTGGCCAACATGGCAAAACTCCGTCTTTATGAAAAATACAAAAATTAGCCAGGCATGGTGGCAGGCGCCTGTAATCCCAGCTAATTGGGAGGCTGAGGCTGGAGAATCCCTTGAATCTAGGAGGCAGAGGTTGCAGTGAGCTGAGATCGTGCCATTGCACTCCAGCCTGGGTGACAAGAGTAAAACTCTGTCTCAAAAAAAAAAAATTATACCTACATTCTCTTCTTATCAGAGAAAAAAATCTACAGTGAGCTTTTCAAAAAGTTTTTACAAACTTTTTGCCATTTAATTTCAGTTAGGAGTTTTCCCTACTTCTGACTTAGTTGAGGGGAAATGTTCATAACATGTTTATAACATGTTTATGTGTGTTAGTTGGTGGGGGTGTATTACTTTGCCATGCCATTTGTTTCCTCCATGCGTAACTTAATCCAGACTTTCACACCTTATAGGAAAACCAGTGAGTCTGGAGAGCTGCATGGGCTCACAACTGAGGAGGAATTTGTAGAAGGGATATACAAAGTGGAAATAGACACCAAATCTTACTGGAAGGCACTTGGCATCTCCCCATTCCATGAGCATGCAGAGGTGAGTATACAGACCTTCGAGGGTTGTTTTGGTTTTGGTTTTTGCTTTTGGCATTCCAGGAAATGCACAGTTTTACTCAGTGTACCACAGAAATGTCCTAAGGAAGGTGATGAATGACCAAAGGTTCCCTTTCCTATTATACAAGAAAAAATTCACAACACTCTGAGAAGCAAATTTCTTTTTGACTTTGATGAAAATCCACTTAGTAACATGACTTGAACTTACATGAAACTACTCATAGTCTATTCATTCCACTTTATATGAATATTGATGTATCTGCTGTTGAAATAATAGTTTATGAGGCAGCCCTCCAGACCCCACGTAGAGTGTATGTAACAAGAGATGCACCATTTTATTTCTCGAAAACCCGTAACATTCTTCATTCCAAAACACATCTGGCTTCTCGGAGGTCTGGACAAGTGATTCTTGGCAACACATACCTATAGAGACAATAAAATCAAAGTAATAATGGCAACACAATAGATAACATTTACCAAGCATACACCATGTGGCAGACACAATTATAAGTGTTTTCCATATTTAACCTACTTAATCCTCAGGAATAAGCCACTGAGGTCAGTCCTATTATTATCCCCATCTTATAGATGAAGAAAATGAGGCACCAGGAAGTCAAATAACTTGTCAAAGGTCACAAGACTAGGAAATACACAAGTAGAAATGTTTACAATTAAGGCCCAGGCTGGGTTTGCCCTCAGTTCTGCTATGCCTCGCATTATGCCCCAGGAAACTTTTTCCCTTGTGAAAGCCAAGCTTAAAAAAAGAAAAGCCACATTTGTAACGTGCTCTGTTCCCCTGCCTATGGTGAGGATCTTCAAACAGTTATACATGGACCCAGTCCCCCTGCCTTCTCCTTAATTTCTTAAGTCATTTGAAACAGATGGCTGTCATGGAAATAGAATCCAGACATGTTGGTCAGAGTTAAAGATCAACTAATTCCATCAAAAATAGCTCGGCATGAAAGGGAACTATTCTCTGGCTTAGTCATGGATGAGACTTTCAATTGCTATAAAGTGGTTCCTTTATTAGACAATGTTACCAGGGAAACAACAGGGGTTTGTTTGACTTCTGGGGCCCACAAGTCAACAAGAGAGCCCCATCTACCAAGGAGCATGTCCCTGACTACCCCTCAGCCAGCAGCAAGACATGGACCCCAGTCAGGGCAGGAGCAGGGTTTCGGCGGCGCCCAGCACAAGACATTGCCCCTAGAGTCTCAGCCCCTACCCTCGAGTAATAGATCTGCCTACCTGAGACTGTTGTTTGCCCAAGAGCTGGGTCTCAGCCTGATGGGAACCATATAAAAAGGTTCACTGACATACTGCCCACATGTTGTTCTCTTTCATTAGATCTTAGCTTCCTTGTCTGCTCTTCATTCTTGCAGTATTCATTCAACAAACATTAAAAAAAAAAAAAAGCATTCTATGTGTGGAACACTCTGCTAGATGCTGTGGATTTAGAAATGAAAATACATCCCGACCCTTGGAATGGAAGGGAAAGGACTGAAGTAAGACAGATTAAGCAGGACCGTCAGCCCAGCTTGAAGCCCAGATAAATACGGAGAACAAGAGAGAGCGAGTAGTGAGAGATGAGTCCCAATGCCTCACTTTGGTGACGGGTGCGTGGTGGGCTTCATGCAGCTTCTTCTGATAAATGCCTCCTTCAGAACTGGTCAACTCTACCTTGGCCAGTGACCCAGGTGGTCATAGTAGATTTACCAAGGGAAAATGGAAACTTTTATTAGGAGCTCTTAGGCCTCTTCACTTCATGGATTTTTTTTTCCTTTTTTTTTGAGATGGAGTTTTGCCCTGTCACCCAGGCTGGAATGCAGTGGTGCAATCTCAGCTCACTGCAACCTCCGCCTCCCAGGTTCAAGCAATTCTCCTGCCTCAGCCTCCCGAGTAGCTGGGACTACAGGTGTGCGCCACCACACCAGGCTAATTTTTGTATTTTTTGTAAAGACAGGTTTTCACCACGTTGGCCAGGCTGGTCTGAACTCCAGACCTCAGGTGATTCACCTGTCTCAGCCTCCCAAAGTGCTGGGATTACAGGTGTGAGCCACCGTGCCCGGCTACTTCATGGATTTTTGATTACAGATTATGCCTCTTACAATTTTTAAGAAGAATCAAGTGGGCTGAAGGTCAATGTCACCATAAGACAAAAGACATTTTTATTAGTTGATTCTAGGGAATTGGCCTTAAGGGGAGCCCTTTCTTCCTAAGAGATTCTTAGGTGATTCTCACTTCCTCTTGCCCCAGTATTATTTTTGTTTTTGGTATGGCTCACTCAGATCCTTTTTTCCTCCTATCCCTAAGTAATCCGGGTTTCTTTTTCCCATATTTAGAACAAAATGTATTTATGCAGAGTGTGTCCAAACCTCAACCCAAGGCCTGTATACAAAATAAATCAAATTAAACACATCTTTACTGTCTTCTACCTCTTTCCTGACCTCAATATATCCCAACTTGCCTCACTCTGAGAACCAAGGCTGTCCCAGCACCTGAGTCGCAGATATTCTACTGATTTGACAGAACTGTGTGACTATCTGGAACAGCATTTTGATCCACAATTTGCCCAGTTACAAAGCTTAAATGAGCTCTAGTGCATGCATATATATTTCAAAATTCCACCATGATCTTCCACACTCTGTATTGTAAATAGAGCCCTGTAATGCTTTTACTTCGTATTTCATTGCTTGTTATACATAAAAATATACTTTTCTTCTTCATGTTAGAAAATGCAAAGAATAGGAGGGTGGGGGAATCTCTGGGCTTGGAGACAGGAGACTTGCCTTCCTACTATGGTTCCATCAGAATGTAGACTGGGACAATACAATAATTCAAGTCTGGTTTGCTCATCTGTAAATTGGGAAGAATGTTTCCAGCTCCAGAATGCTAAATCTCTAAGTCTGTGGTTGGCAGCCACTATTGCAGCAGCTCTTCAATGACTCAATGCAGTTTTGCATTCTCCCTACCTTTTTTTTCTAAAACCAATAAAATAGATACAGCCTTTAGGCTTTCTGGGATTTCCCTTAGTCAAGCTAGGGTCATCCTGACTTTCGGCGTGAATTTGCAAAACAAGACCTGACTCTGTACTCCTGCTCTAAGGACTGTGCATGGTTCCAAAGGCTTAGCTTGCCAGCATATTTGAGCTTTTTCCTTCTGTTCAAACTGTTCCAAAATATAAAAGAATAAAATTAATTAAGTTGGCACTGGACTTCCGGTGGTCAGTCATGTGTGTCATCTGTCACGTTTTTCGGGCTCTGGTGGAAATGGATCTGTCTGTCTTCTCTCATAGGTGGTATTCACAGCCAACGACTCCGGCCCCCGCCGCTACACCATTGCCGCCCTGCTGAGCCCCTACTCCTATTCCACCACGGCTGTCGTCACCAATCCCAAGGAATGAGGGACTTCTCCTCCAGTGGACCTGAAGGACGAGGGATGGGATTTCATGTAACCAAGAGTATTCCATTTTTACTAAAGCAGTGTTTTCACCTCATATGCTATGTTAGAAGTCCAGGCAGAGACAATAAAACATTCCTGTGAAAGGCA | TTR |
229 | ACAGAAGTCCACTCATTCTTGGCAGGATGGCTTCTCATCGTCTGCTCCTCCTCTGCCTTGCTGGACTGGTATTTGTGTCTGAGGCTGGCCCTACGGTGAGTGTTTCTGTGACATCCCATTCCTACATTTAAGATTCACGCTAAAT | TTR外顯子1 |
230 | TTCACTCTGATCAATTTTGTTAACTTCTCACGTGTCTTCTCTACACCCAGGGCACCGGTGAATCCAAGTGTCCTCTGATGGTCAAAGTTCTAGATGCTGTCCGAGGCAGTCCTGCCATCAATGTGGCCGTGCATGTGTTCAGAAAGGCTGCTGATGACACCTGGGAGCCATTTGCCTCTGGGTAAGTTGCCAAAGAACCCTCCCACAGGACTTGGTTTTATCTTCCCGTTT | TTR外顯子2 |
231 | CCATTTGTTTCCTCCATGCGTAACTTAATCCAGACTTTCACACCTTATAGGAAAACCAGTGAGTCTGGAGAGCTGCATGGGCTCACAACTGAGGAGGAATTTGTAGAAGGGATATACAAAGTGGAAATAGACACCAAATCTTACTGGAAGGCACTTGGCATCTCCCCATTCCATGAGCATGCAGAGGTGAGTATACAGACCTTCGAGGGTTGTTTTGGTTTTGGTTTTTGCTTTTG | TTR外顯子3 |
232 | CACGTTTTTCGGGCTCTGGTGGAAATGGATCTGTCTGTCTTCTCTCATAGGTGGTATTCACAGCCAACGACTCCGGCCCCCGCCGCTACACCATTGCCGCCCTGCTGAGCCCCTACTCCTATTCCACCACGGCTGTCGTCACCAATCCCAAGGAATGAGGGACTTCTCCTCCAGTGGACCTGAAGGACGAGGGATGGGATTTCATGTAACCAAGAGTATTCCATTTTTACTAAAGCAGTGTTTTCACCTCATATGCTATGTTAGAAGTCCAGGCAGAGACAATAAAACATTCCTGTGAAAGGCA | TTR外顯子4 |
256 | MASHRLLLLCLAGLVFVSEAGPTGTGESKCPLMVKVLDAVRGSPAINVAVHVFRKAADDTWEPFASGKTSESGELHGLTTEEEFVEGIYKVEIDTKSYWKALGISPFHEHAEVVFTANDSGPRRYTIAALLSPYSYSTTAVVTNPKE | TTR(全蛋白質序列) |
257 | GPTGTGESKCPLMVKVLDAVRGSPAINVA VHVFRKAADDTWEPFASGKTSESGELHGLTTEEEFVEGIYKVEIDTKSYWKALGISPFHEHAEVVFTANDSGPRRYTIAALLSPYSYST TA VVTNPKE | TTR(經翻譯後切割的序列) V30、T119、和V122以粗體顯示 |
258 | ATGGCTTCTCATCGTCTGCTCCTCCTCTGCCTTGCTGGACTGGTATTTGTGTCTGAGGCTGGCCCTACGGGCACCGGTGAATCCAAGTGTCCTCTGATGGTCAAAGTTCTAGATGCTGTCCGAGGCAGTCCTGCCATCAATGTGGCCGTGCATGTGTTCAGAAAGGCTGCTGATGACACCTGGGAGCCATTTGCCTCTGGGAAAACCAGTGAGTCTGGAGAGCTGCATGGGCTCACAACTGAGGAGGAATTTGTAGAAGGGATATACAAAGTGGAAATAGACACCAAATCTTACTGGAAGGCACTTGGCATCTCCCCATTCCATGAGCATGCAGAGGTGGTATTCACAGCCAACGACTCCGGCCCCCGCCGCTACACCATTGCCGCCCTGCTGAGCCCCTACTCCTATTCCACCACGGCTGTCGTCACCAATCCCAAGGAATGA | TTR編碼序列 |
在一些實施方式中,本文揭露的基因編輯系統可以包含如本文揭露的Cas12i多肽。在其他實施方式中,基因編輯系統可以包含編碼Cas12i多肽的核酸。例如,基因編輯系統可以包含編碼Cas12i多肽的載體(例如病毒載體,如AAV載體,如AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11和AAV12)。可替代地,基因編輯系統可以包含編碼Cas12i多肽的mRNA分子。在一些情況下,mRNA分子可為經密碼子優化的。
II. 基因編輯系統組分的製備
本揭露內容提供了用於產生本文揭露的基因編輯系統的組分(例如,RNA指導物)之方法、用於產生Cas12i多肽之方法、以及用於將RNA指導物和Cas12i多肽複合之方法。
A. RNA 指導物
在一些實施方式中,藉由DNA分子的體外轉錄來製備RNA指導物。因此,例如,在一些實施方式中,藉由使用上游啟動子序列(例如,T7聚合酶啟動子序列)在體外轉錄編碼RNA指導物的DNA分子來產生RNA指導物。在一些實施方式中,DNA分子編碼多個RNA指導物,或者體外轉錄反應包括多個不同的DNA分子,每個DNA分子編碼不同的RNA指導物。在一些實施方式中,使用化學合成方法製備RNA指導物。在一些實施方式中,藉由在用包括編碼RNA指導物的序列的質體轉染的細胞中表現RNA指導物序列來製備RNA指導物。在一些實施方式中,質體編碼多個不同的RNA指導物。在一些實施方式中,將各自編碼不同的RNA指導物的多個不同的質體轉染到細胞中。在一些實施方式中,從編碼RNA指導物並且還編碼Cas12i多肽的質體表現該RNA指導物。在一些實施方式中,從表現RNA指導物但不表現Cas12i多肽的質體表現該RNA指導物。在一些實施方式中,RNA指導物從商業供應商購買。在一些實施方式中,使用一或多個經修飾的核苷酸(例如,如上所述)合成RNA指導物。
B. 模板 DNA
在一些實施方式中,使用化學合成方法製備模板DNA。在一些實施方式中,藉由寡核苷酸合成或基於退火的寡核苷酸連接來製備模板DNA。在一些實施方式中,將模板DNA合成為單股寡DNA核苷酸(ssODN)。在一些實施方式中,將模板DNA合成為雙股寡DNA核苷酸(dsODN)。在一些實施方式中,在用包括模板DNA序列的質體轉染的細胞中製備模板DNA。在一些實施方式中,質體包含不同的模板DNA序列。在一些實施方式中,將各自包含不同的模板DNA的多個不同的質體轉染到細胞中。在一些實施方式中,包含模板DNA的質體進一步編碼RNA指導和/或Cas12i多肽。在一些實施方式中,模板DNA從商業供應商購買。在一些實施方式中,使用一或多個經修飾的核苷酸(例如,如上所述)合成模板DNA。
C. Cas12i 多肽
在一些實施方式中,本揭露內容之Cas12i多肽可以藉由以下製備:(a) 培養產生本揭露內容之Cas12i多肽的細菌,分離該Cas12i多肽,視需要純化該Cas12i多肽,並將該Cas12i多肽與RNA指導物複合。Cas12i多肽也可以藉由 (b) 已知的基因工程技術製備,特別地,藉由以下製備:從細菌中分離編碼本揭露內容之Cas12i多肽的基因,構建重組表現載體,然後將載體轉移到合適的宿主細胞中,該宿主細胞表現RNA指導物,用於在宿主細胞中表現與RNA指導物複合的重組蛋白。可替代地,Cas12i多肽可以藉由 (c) 體外偶合的轉錄-翻譯系統製備,然後與RNA指導物複合。
在一些實施方式中,宿主細胞用於表現Cas12i多肽。對宿主細胞沒有特別的限制,並且可以較佳的是使用各種已知的細胞。宿主細胞之特定實例包括細菌,例如大腸桿菌(E. coli)、酵母(出芽酵母(budding yeast)、釀酒酵母(Saccharomyces cerevisiae)和裂殖酵母(fission yeast)、粟酒裂殖酵母(Schizosaccharomyces pombe))、線蟲(秀麗隱桿線蟲(Caenorhabditis elegans))、非洲爪蟾(Xenopus laevis)卵母細胞和動物細胞(例如,CHO細胞、COS細胞和HEK293細胞)。用於將上述表現載體轉移到宿主細胞內之方法(即轉化法)沒有特別的限制,並且可以使用已知的方法,如電穿孔、磷酸鈣法、脂質體法和DEAE葡聚糖法。
在用表現載體轉化宿主後,可以培養、培育或繁殖宿主細胞以產生Cas12i多肽。在Cas12i多肽表現後,可以根據常規方法(例如,過濾、離心、細胞破壞、凝膠過濾層析、離子交換層析等)收集宿主細胞並從培養物中純化Cas12i多肽等。
在一些實施方式中,用於Cas12i多肽表現之方法包括翻譯該Cas12i多肽的至少5個胺基酸、至少10個胺基酸、至少15個胺基酸、至少20個胺基酸、至少50個胺基酸、至少100個胺基酸、至少150個胺基酸、至少200個胺基酸、至少250個胺基酸、至少300個胺基酸、至少400個胺基酸、至少500個胺基酸、至少600個胺基酸、至少700個胺基酸、至少800個胺基酸、至少900個胺基酸、或至少1000個胺基酸。在一些實施方式中,用於蛋白質表現之方法包括翻譯Cas12i多肽的約5個胺基酸、約10個胺基酸、約15個胺基酸、約20個胺基酸、約50個胺基酸、約100個胺基酸、約150個胺基酸、約200個胺基酸、約250個胺基酸、約300個胺基酸、約400個胺基酸、約500個胺基酸、約600個胺基酸、約700個胺基酸、約800個胺基酸、約900個胺基酸、約1000個胺基酸或更多。
可以使用多種方法來確定宿主細胞中Cas12i多肽的產生水平。這樣的方法包括但不限於例如利用對Cas12i多肽具有特異性的多株或單株抗體或如本文別處所述之標記標籤的方法。示例性方法包括但不限於酶聯免疫吸附測定(ELISA)、放射免疫測定(MA)、螢光免疫測定(FIA)、和螢光激活細胞分選(FACS)。該等和其他測定係本領域熟知的(參見例如,Maddox等人, J. Exp. Med. [實驗醫學雜誌] 158:1211 [1983])。
本揭露內容提供了在細胞中體內表現Cas12i多肽之方法,該等方法包括向宿主細胞提供編碼該Cas12i多肽的多核糖核苷酸(其中該多核糖核苷酸編碼該Cas12i多肽);在該細胞中表現該Cas12i多肽;以及從該細胞中獲得該Cas12i多肽。
本揭露內容進一步提供了在細胞中體內表現Cas12i多肽之方法,該等方法包括向宿主細胞提供編碼該Cas12i多肽的多核糖核苷酸(其中該多核糖核苷酸編碼該Cas12i多肽);以及在該細胞中表現該Cas12i多肽。在一些實施方式中,將編碼Cas12i多肽的多核糖核苷酸與RNA指導物一起遞送至細胞,並且一旦在該細胞中表現,該Cas12i多肽和該RNA指導物就形成複合物。在一些實施方式中,編碼Cas12i多肽的多核糖核苷酸和RNA指導物在單一的組成物內被遞送至細胞。在一些實施方式中,編碼Cas12i多肽的多核糖核苷酸和RNA指導物被包含在分開的組成物內。在一些實施方式中,宿主細胞存在於受試者(例如,人患者)中。
D. 複合物
在一些實施方式中,靶向TTR的RNA指導物與Cas12i多肽複合以形成核糖核蛋白(RNP)。在一些實施方式中,RNA指導物和Cas12i多肽的複合發生在低於約以下中任一個的溫度下:20°C、21°C、22°C、23°C、24°C、25°C、26°C、27°C、28°C、29°C、30°C、31°C、32°C、33°C、34°C、35°C、36°C、37°C、38°C、39°C、40°C、41°C、42°C、43°C、44°C、45°C、50°C、或55°C。在一些實施方式中,在約37°C下在至少約以下中的任一個的孵育時間段內,RNA指導物不會從Cas12i多肽解離:10 min、15 min、20 min、25 min、30 min、35 min、40 min、45 min、50 min、55 min、1 hr、2 hr、3 hr、4 hr、或更多個小時。
在一些實施方式中,RNA指導物和Cas12i多肽在複合緩衝液中複合。在一些實施方式中,將Cas12i多肽儲存在被複合緩衝液替代的緩衝液中以與RNA指導物形成複合物。在一些實施方式中,將Cas12i多肽儲存在複合緩衝液中。
在一些實施方式中,複合緩衝液的pH範圍為約7.3至8.6。在一個實施方式中,複合緩衝液的pH為約7.3。在一個實施方式中,複合緩衝液的pH為約7.4。在一個實施方式中,複合緩衝液的pH為約7.5。在一個實施方式中,複合緩衝液的pH為約7.6。在一個實施方式中,複合緩衝液的pH為約7.7。在一個實施方式中,複合緩衝液的pH為約7.8。在一個實施方式中,複合緩衝液的pH為約7.9。在一個實施方式中,複合緩衝液的pH為約8.0。在一個實施方式中,複合緩衝液的pH為約8.1。在一個實施方式中,複合緩衝液的pH為約8.2。在一個實施方式中,複合緩衝液的pH為約8.3。在一個實施方式中,複合緩衝液的pH為約8.4。在一個實施方式中,複合緩衝液的pH為約8.5。在一個實施方式中,複合緩衝液的pH為約8.6。
在一些實施方式中,在如本文所述純化之前,可以使Cas12i多肽在宿主細胞中過表現並與RNA指導物複合。在一些實施方式中,將編碼Cas12i多肽的mRNA或DNA引入細胞中,使得該Cas12i多肽在細胞中表現。在一些實施方式中,從單個mRNA或DNA構建體將RNA指導物也引入細胞中(無論是同時、分開、還是依次),使得在細胞中形成RNP複合物。
在一些實施方式中,模板DNA與Cas12i多肽結合。在一些實施方式中,模板DNA與Cas12i多肽共價結合。在一些實施方式中,模板DNA與Cas12i多肽非共價結合。在一些實施方式中,模板DNA與RNP結合。在一些實施方式中,模板DNA與RNP共價結合。在一些實施方式中,模板DNA與RNP非共價結合。
III. 基因編輯方法
本揭露內容還提供了修飾TTR基因內的靶序列之方法或將突變引入TTR基因之方法。在一些實施方式中,該等方法包括將靶向TTR的RNA指導物、Cas12i多肽、和模板DNA引入細胞中。可以將靶向TTR的RNA指導物和Cas12i多肽作為核糖核蛋白複合物引入細胞中。可以將靶向TTR的RNA指導物、模板DNA、和Cas12i多肽引入到核酸載體上。可以將Cas12i多肽作為mRNA引入。可以將RNA指導物和模板DNA直接引入細胞中。
本文揭露的任何基因編輯系統均可用於對TTR基因進行基因改造。基因編輯系統可以包含指導RNA、Cas12i2多肽、和模板DNA。指導RNA包含對TTR基因中的靶序列具有特異性(例如,對該TTR基因的外顯子2、外顯子3或外顯子4中的區域具有特異性)的間隔子序列。
A. 靶序列
在一些實施方式中,如本文揭露的RNA指導物被設計成與靶序列互補,該靶序列與5'-TTN-3' PAM序列或5'-NTTN-3' PAM序列相鄰。
在一些實施方式中,靶序列在TTR基因或TTR基因的基因座(例如,外顯子2、外顯子3或外顯子4)內,RNA指導物可以經由鹼基配對與其結合。在一些實施方式中,細胞僅具有靶序列的一個拷貝。在一些實施方式中,細胞具有靶序列的多於一個拷貝,如至少約2、3、4、5、10、100或更多個拷貝中的任一個。
在一些實施方式中,TTR基因係哺乳動物基因。在一些實施方式中,TTR基因係人基因。例如,在一些實施方式中,靶序列在序列SEQ ID NO: 228(或其反向互補序列)或SEQ ID NO: 258(或其反向互補序列)內。在一些實施方式中,靶序列在SEQ ID NO: 228(或其反向互補序列)或SEQ ID NO: 258(或其反向互補序列)闡述的TTR基因的外顯子內,例如,在SEQ ID NO: 229、230、231、或232的序列(或其中任一個的反向互補序列)內。SEQ ID NO: 228的TTR基因的外顯子區域內的靶序列在表6中闡述。在一些實施方式中,靶序列在SEQ ID NO: 228(或其反向互補序列)闡述的TTR基因的內含子內。在一些實施方式中,靶序列在SEQ ID NO: 228(或其反向互補序列)或SEQ ID NO: 258(或其反向互補序列)闡述的TTR基因序列的變體(例如,多型性變體)內。在一些實施方式中,TTR基因序列係在SEQ ID NO: 228(或其反向互補序列)或SEQ ID NO: 258(或其反向互補序列)中闡述的序列的同源物。在一些實施方式中,TTR基因序列係非人TTR序列。
在一些實施方式中,靶序列與5'-NTTN-3' PAM序列相鄰,其中N係任何核苷酸。5'-NTTN-3'序列可以緊鄰靶序列,或者例如在靶序列的少量(例如,1、2、3、4、或5個)核苷酸內。在一些實施方式中,5'-NTTN-3'序列係5’-NTTY-3’、5’-NTTC-3’、5’-NTTT-3’、5’-NTTA-3’、5’-NTTB-3’、5’-NTTG-3’、5’-CTTY-3’、5’-DTTR’3’、5’-CTTR-3’、5’-DTTT-3’、5’-ATTN-3’、或5’-GTTN-3’,其中Y係C或T,B係除A之外的任何核苷酸,D係除C之外的任何核苷酸,並且R係A或G。在一些實施方式中,5'-NTTN-3'序列係5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。PAM序列可以在靶序列的5'。
在一些實施方式中,靶序列係單股的(例如,單股DNA)。在一些實施方式中,靶序列係雙股的(例如,雙股DNA)。在一些實施方式中,靶序列包含單股區和雙股區兩者。在一些實施方式中,靶序列係線性的。在一些實施方式中,靶序列係環狀的。在一些實施方式中,靶序列包含一或多個經修飾的核苷酸,如甲基化的核苷酸、受損的核苷酸、或核苷酸類似物。在一些實施方式中,靶序列未經修飾。在一些實施方式中,RNA指導物與雙股靶序列的第一股(例如,靶股或間隔子互補股)結合,並且5'-NTTN-3' PAM序列存在於第二互補股(例如,非靶股或非間隔子互補股)。在一些實施方式中,RNA指導物在靶股(例如,間隔子互補股)上的5'-NAAN-3'序列附近結合。
5'-NTTN-3'序列可以緊鄰靶序列,或者例如在靶序列的少量(例如,1、2、3、4、或5個)核苷酸內。在一些實施方式中,5'-NTTN-3'序列係5’-NTTY-3’、5’-NTTC-3’、5’-NTTT-3’、5’-NTTA-3’、5’-NTTB-3’、5’-NTTG-3’、5’-CTTY-3’、5’-DTTR-3’、5’-CTTR-3’、5’-DTTT-3’、5’-ATTN-3’、或5’-GTTN-3’,其中Y係C或T,B係除A之外的任何核苷酸,D係除C之外的任何核苷酸,並且R係A或G。在一些實施方式中,5'-NTTN-3'序列係5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,RNA指導物被設計成與雙股靶核酸的第一股(即,非PAM股)結合,並且5'-NTTN-3' PAM序列存在於第二互補股(即,PAM股)中。在一些實施方式中,RNA指導物與非PAM股上的區域結合,該區域與PAM股上的靶序列互補,該靶序列與5'-NAAN-3'序列相鄰。
在一些實施方式中,靶序列存在於細胞中。在一些實施方式中,靶序列存在於細胞的核中。在一些實施方式中,靶序列對於細胞係內源的。在一些實施方式中,靶序列係基因組DNA。在一些實施方式中,靶序列係染色體DNA。在一些實施方式中,靶序列係編碼蛋白質的基因或其功能區如編碼區、或調節元件,如啟動子、強化子、5'或3'非翻譯區等。
在一些實施方式中,靶序列存在於靶序列的易於接近的區域中。在一些實施方式中,靶序列係靶基因的外顯子。在一些實施方式中,靶序列跨靶基因的外顯子-內含子接點。在一些實施方式中,靶序列存在於非編碼區(如基因的調節區)中。
B. 基因編輯
在一些實施方式中,Cas12i多肽具有酶活性(例如,核酸酶活性)。在一些實施方式中,Cas12i多肽在細胞中誘導一或多個DNA雙股斷裂。在一些實施方式中,Cas12i多肽在細胞中誘導一或多個DNA單股斷裂。在一些實施方式中,Cas12i多肽在細胞中誘導一或多個DNA切口。在一些實施方式中,DNA斷裂和/或切口導致形成一或多個***缺失(例如,一或多個缺失)。
在一些實施方式中,本文揭露的RNA指導物與Cas12i多肽形成複合物並將該Cas12i多肽引導至與5'-NTTN-3'序列相鄰的靶序列。在一些實施方式中,該複合物誘導與5'-NTTN-3'序列相鄰的缺失(例如,核苷酸缺失或DNA缺失)。在一些實施方式中,該複合物誘導與以下序列相鄰的缺失:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,該複合物誘導與富含T/C的序列相鄰的缺失。
在一些實施方式中,缺失在5'-NTTN-3'序列的下游。在一些實施方式中,缺失在以下序列的下游:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失在富含T/C的序列的下游。
在一些實施方式中,缺失改變TTR基因的表現。在一些實施方式中,缺失改變TTR基因的功能。在一些實施方式中,缺失使TTR基因失活。在一些實施方式中,缺失係框移缺失。在一些實施方式中,缺失係非框移缺失。在一些實施方式中,缺失導致細胞毒性或細胞死亡(例如,細胞凋亡)。
在一些實施方式中,缺失始於5'-NTTN-3'序列的約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內。在一些實施方式中,缺失始於以下序列的約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的下游約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內。在一些實施方式中,缺失始於以下序列的下游約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的下游約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內。在一些實施方式中,缺失始於以下序列的約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的下游約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內。在一些實施方式中,缺失始於以下序列的下游約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的下游約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內。在一些實施方式中,缺失始於以下序列的約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的下游約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內。在一些實施方式中,缺失始於以下序列的下游約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的下游約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內。
在一些實施方式中,缺失終於5'-NTTN-3'序列的約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。在一些實施方式中,缺失終於以下序列的約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失終於富含T/C的序列的約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。
在一些實施方式中,缺失終於5'-NTTN-3'序列的下游約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。在一些實施方式中,缺失終於以下序列的下游約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失終於富含T/C的序列的下游約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。
在一些實施方式中,缺失終於5'-NTTN-3'序列的約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內。在一些實施方式中,缺失終於以下序列的約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失終於富含T/C的序列的約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內。
在一些實施方式中,缺失終於5'-NTTN-3'序列的下游約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內。在一些實施方式中,缺失終於以下序列的下游約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失終於富含T/C的序列的下游約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內。
在一些實施方式中,缺失終於5'-NTTN-3'序列的約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。在一些實施方式中,缺失終於以下序列的約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失終於富含T/C的序列的約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。
在一些實施方式中,缺失終於5'-NTTN-3'序列的下游約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。在一些實施方式中,缺失終於以下序列的下游約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失終於富含T/C的序列的下游約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該5'-NTTN-3'序列的約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。在一些實施方式中,缺失始於以下序列的約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於以下序列的約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該富含T/C的序列的約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的下游約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該5'-NTTN-3'序列的下游約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。在一些實施方式中,缺失始於以下序列的下游約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,並且終於以下序列的下游約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的下游約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該富含T/C的序列的下游約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該5'-NTTN-3'序列的約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內。在一些實施方式中,缺失始於以下序列的約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於以下序列的約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該富含T/C的序列的約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的下游約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該5'-NTTN-3'序列的下游約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內。在一些實施方式中,缺失始於以下序列的下游約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,並且終於以下序列的下游約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的下游約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該富含T/C的序列的下游約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該5'-NTTN-3'序列的約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。在一些實施方式中,缺失始於以下序列的約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於以下序列的約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該富含T/C的序列的約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的下游約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該5'-NTTN-3'序列的下游約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。在一些實施方式中,缺失始於以下序列的下游約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,並且終於以下序列的下游約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的下游約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該富含T/C的序列的下游約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內,並且終於該5'-NTTN-3'序列的約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。在一些實施方式中,缺失始於以下序列的約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內,並且終於以下序列的約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內,並且終於該富含T/C的序列的約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的下游約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內,並且終於該5'-NTTN-3'序列的下游約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。在一些實施方式中,缺失始於以下序列的下游約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,並且終於以下序列的下游約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的下游約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內,並且終於該富含T/C的序列的下游約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內,並且終於該5'-NTTN-3'序列的約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內。在一些實施方式中,缺失始於以下序列的約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內,並且終於該序列的約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的約5至約10個核苷酸內,並且終於該富含T/C的序列的約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的下游約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內,並且終於該5'-NTTN-3'序列的下游約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內。在一些實施方式中,缺失始於以下序列的下游約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,並且終於以下序列的下游約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的下游約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內,並且終於該富含T/C的序列的下游約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內,並且終於該5'-NTTN-3'序列的約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。在一些實施方式中,缺失始於富含T/C的序列的約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內,並且終於該富含T/C的序列的約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的下游約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內,並且終於該5'-NTTN-3'序列的下游約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。在一些實施方式中,缺失始於以下序列的下游約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,並且終於以下序列的下游約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的下游約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內,並且終於該富含T/C的序列的下游約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該5'-NTTN-3'序列的約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。在一些實施方式中,缺失始於以下序列的約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於以下序列的約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該富含T/C的序列的約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的下游約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該5'-NTTN-3'序列的下游約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。在一些實施方式中,缺失始於以下序列的下游約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,並且終於以下序列的下游約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的下游約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該富含T/C的序列的下游約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該5'-NTTN-3'序列的約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內。在一些實施方式中,缺失始於以下序列的約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於以下序列的約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該富含T/C的序列的約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的下游約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該5'-NTTN-3'序列的下游約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內。在一些實施方式中,缺失始於以下序列的下游約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,並且終於以下序列的下游約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的下游約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該富含T/C的序列的下游約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該5'-NTTN-3'序列的約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。在一些實施方式中,缺失始於以下序列的約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於以下序列的約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該富含T/C的序列的約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的下游約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該5'-NTTN-3'序列的下游約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。在一些實施方式中,缺失始於以下序列的下游約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,並且終於以下序列的下游約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的下游約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該富含T/C的序列的下游約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。
在一些實施方式中,缺失的長度多達約50個核苷酸(例如,約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、或55個核苷酸)。在一些實施方式中,缺失的長度多達約40個核苷酸(例如,約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、或45個核苷酸)。在一些實施方式中,缺失的長度為約4個核苷酸至約40個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、或45個核苷酸)。在一些實施方式中,缺失的長度為約4個核苷酸至約25個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)。在一些實施方式中,缺失的長度為約10個核苷酸至約25個核苷酸(例如,約7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)。在一些實施方式中,缺失的長度為約10個核苷酸至約15個核苷酸(例如,約7、8、9、10、11、12、13、14、15、16、或17個核苷酸)。
在一些實施方式中,本文所述之兩個或更多個RNA指導物用於引入長度大於40個核苷酸的缺失。在一些實施方式中,本文所述之兩個或更多個RNA指導物用於引入至少約41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、16、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、或400個核苷酸的缺失。在一些實施方式中,本文所述之兩個或更多個RNA指導物用於缺失TTR基因或SEQ ID NO: 228的全部或一部分。在一些實施方式中,本文所述之兩個或更多個RNA指導物用於缺失SEQ ID NO: 258的TTR編碼序列的全部或一部分。
在一些實施方式中,本文所述之方法用於改造在TTR基因中包含如本文所述之缺失的細胞。在一些實施方式中,該等方法使用包含如本文所述之Cas12i酶和RNA指導物的複合物來實施,該RNA指導物包含如本文所述之直接重複序列和間隔子序列。在一些實施方式中,RNA指導物的序列與SEQ ID NO: 345-362中任一個的序列具有至少90%的同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性)。在一些實施方式中,RNA指導物具有SEQ ID NO: 345-362中任一個的序列。
在一些實施方式中,靶向TTR的RNA指導物被編碼在質體中。在一些實施方式中,靶向TTR的RNA指導物係合成的或純化的RNA。在一些實施方式中,Cas12i多肽被編碼在質體中。在一些實施方式中,Cas12i多肽由合成的或純化的RNA編碼。
在一些實施方式中,本文所述之模板DNA用於糾正與疾病相關的突變。在一些實施方式中,突變係V30M、V122I、T60A、L58H、或I84S,並且疾病係hATTR、FAP、或SSA。在一些實施方式中,突變V30M、V122I、T60A、L58H、或I84S參考經翻譯後切割的SEQ ID NO: 257的TTR序列。當使用全長TTR序列(SEQ ID NO: 256)作為參考序列時,相對於SEQ ID NO: 256的全長TTR序列,該等突變被稱為V50M、V142I、T80A、L78H、和I104S。
在一些實施方式中,本文所述之模板DNA用於引入與疾病相關的保護性突變。在一些實施方式中,突變係T119M,並且疾病係hATTR。在一些實施方式中,突變係T119M,並且疾病係野生型ATTR類澱粉變性。在一些實施方式中,T119M突變參考經翻譯後切割的SEQ ID NO: 257的TTR序列。在一些實施方式中,相對於SEQ ID NO: 256的全長TTR序列,T119M突變被稱為T139M。
在一些實施方式中,本文所述之模板DNA用於糾正與疾病相關的突變並且引入保護性突變。在一些實施方式中,與疾病相關的突變係V30M、V122I、T60A、L58H、或I84S,並且疾病係(hATTR)。在一些實施方式中,保護性突變係T119M。在一些實施方式中,疾病係hATTR或野生型ATTR類澱粉變性。例如,在一些實施方式中,本文所述之模板DNA用於糾正V30M突變並且引入T119M突變。在一些實施方式中,本文所述之模板DNA用於糾正V122I突變並且引入T119M突變。在一些實施方式中,本文所述之模板DNA用於糾正T60A突變並且引入T119M突變。在一些實施方式中,本文所述之模板DNA用於糾正L58H突變並且引入T119M突變。在一些實施方式中,本文所述之模板DNA用於糾正I84S突變並且引入T119M突變。
在一些實施方式中,將***序列(例如,包含相對於靶核酸的序列差異的供體區)摻入靶區域(例如,RNA指導物結合的靶核酸區域)內的靶核酸中。在一些實施方式中,將***序列摻入靶區域外側的靶核酸中。在一些實施方式中,使用單股模板DNA藉由HDR將***序列摻入靶核酸的非靶股中。
在一些實施方式中,將突變摻入5’-NTTN-3’序列上游的靶核酸中。例如,將突變摻入5'-NTTN-3'序列的上游約20個核苷酸內,例如,5'-NTTN-3'序列的上游1個核苷酸、2個核苷酸、3個核苷酸、4個核苷酸、5個核苷酸、6個核苷酸、7個核苷酸、8個核苷酸、9個核苷酸、10個核苷酸、11個核苷酸、12個核苷酸、13個核苷酸、14個核苷酸、15個核苷酸、16個核苷酸、17個核苷酸、18個核苷酸、19個核苷酸、或20個核苷酸內。
在一些實施方式中,將突變摻入5’-NTTN-3’序列下游的靶核酸中。例如,可以將突變摻入5'-NTTN-3'序列的下游約60個核苷酸內,例如,5'-NTTN-3'序列的下游1個核苷酸、2個核苷酸、3個核苷酸、4個核苷酸、5個核苷酸、6個核苷酸、7個核苷酸、8個核苷酸、9個核苷酸、10個核苷酸、11個核苷酸、12個核苷酸、13個核苷酸、14個核苷酸、15個核苷酸、16個核苷酸、17個核苷酸、18個核苷酸、19個核苷酸、20個核苷酸、25個核苷酸、30個核苷酸、35個核苷酸、40個核苷酸、45個核苷酸、50個核苷酸、55個核苷酸、或60個核苷酸內。
在一些實施方式中,將本文所述之組成物引入多個細胞中。在一些實施方式中,至少約10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、或100%的細胞包含本文所述之缺失。在一些實施方式中,至少約1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、或25%的細胞包含野生型TTR基因(例如,一或多個以下突變被糾正:V30M、V122I、T60A、L58H、和I84S)。
在一些實施方式中,至少約10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、或100%的細胞包含本文所述之缺失。在一些實施方式中,至少約1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、或25%的細胞包含T119M突變。
在一些實施方式中,至少約10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、或100%的細胞包含本文所述之缺失。在一些實施方式中,至少約1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、或25%的細胞包含野生型TTR基因(例如,一或多個以下突變被糾正:V30M、V122I、T60A、L58H、和I84S)以及T119M突變。
在一些實施方式中,靶向TTR的RNA指導物被編碼在質體中。在一些實施方式中,靶向TTR的RNA指導物係合成的或純化的RNA。在一些實施方式中,Cas12i多肽被編碼在質體中。在一些實施方式中,Cas12i多肽由合成的或純化的RNA編碼。
C. 遞送
本文揭露的任何基因編輯系統的組分可以配製成例如包括運載體,如運載體和/或聚合物運載體(例如脂質體),並藉由已知的方法遞送至細胞(例如,原核、真核、植物、哺乳動物的細胞等)。這樣的方法包括但不限於轉染(例如,脂質介導的陽離子聚合物、磷酸鈣、樹枝狀聚合物);電穿孔或其他膜破壞方法(例如,核轉染)、病毒遞送(例如,慢病毒、反轉錄病毒、腺病毒、腺相關病毒(AAV))、顯微注射、微彈轟擊(「基因槍」)、fugene、直接聲載入、細胞擠壓、光轉染、原生質體融合、刺穿感染、磁轉染、胞泌體介導的轉移、脂質奈米顆粒介導的轉移、及其任何組合。
在一些實施方式中,該方法包括將一或多種核酸(例如,編碼Cas12i多肽、RNA指導物、模板DNA等的核酸)、其一或多種轉錄物、和/或預形成的RNA指導物/Cas12i多肽複合物遞送至細胞,在該細胞中形成三元複合物。在一些實施方式中,將RNA指導物和編碼Cas12i多肽的RNA在單個組成物中一起遞送。在一些實施方式中,將RNA指導物和編碼Cas12i多肽的RNA在分開的組成物中遞送。在一些實施方式中,使用相同的遞送技術遞送以分開的組成物遞送的RNA指導物和編碼Cas12i多肽的RNA。在一些實施方式中,使用不同的遞送技術遞送以分開的組成物遞送的RNA指導物和編碼Cas12i多肽的RNA。
在一些實施方式中,將Cas12i組分和RNA指導物組分一起遞送。例如,將Cas12i組分和RNA指導物組分一起包裝在單個AAV顆粒中。在另一實例中,將Cas12i組分和RNA指導物組分經由脂質奈米顆粒(LNP)一起遞送。在一些實施方式中,將Cas12i組分和RNA指導物組分分開遞送。例如,將Cas12i組分和RNA指導物組分包裝在分開的AAV顆粒中。在另一實例中,將Cas12i組分藉由第一遞送機制遞送,並將RNA指導物組分藉由第二遞送機制遞送。
示例性細胞內遞送方法包括但不限於:病毒(如AAV)、或病毒樣劑;基於化學的轉染方法,如使用磷酸鈣、樹枝狀聚合物、脂質體、或陽離子聚合物(例如,DEAE-葡聚糖或聚乙烯亞胺)的那些;非化學方法,如顯微注射、電穿孔、細胞擠壓、聲孔效應、光轉染、刺穿感染、原生質體融合、細菌軛合、質體或轉座子的遞送;基於粒子的方法,如使用基因槍、磁轉染或磁輔助轉染、粒子轟擊;以及混合方法,如核轉染。在一些實施方式中,脂質奈米顆粒包含編碼Cas12i多肽的mRNA、RNA指導物,或編碼Cas12i多肽和RNA指導物的mRNA。在一些實施方式中,編碼Cas12i多肽的mRNA係SEQ ID NO: 221或SEQ ID NO: 255闡述的核苷酸序列或其變體的轉錄物。在一些實施方式中,本申請進一步提供了藉由此類方法產生的細胞,以及包含此類細胞的或由此類細胞產生的生物(例如,動物、植物或真菌)。
D. 經基因修飾的細胞
可以將本文揭露的任何基因編輯系統遞送至多種細胞。在一些實施方式中,細胞係分離的細胞。在一些實施方式中,細胞在細胞培養物中或在兩種或更多種細胞類型的共培養物中。在一些實施方式中,細胞係離體的。在一些實施方式中,細胞獲自活的生物並維持在細胞培養物中。在一些實施方式中,細胞係單細胞生物。
在一些實施方式中,細胞係原核細胞。在一些實施方式中,細胞係細菌細胞或來源於細菌細胞。在一些實施方式中,細胞係古細菌細胞或來源於古細菌細胞。
在一些實施方式中,細胞係真核細胞。在一些實施方式中,細胞係植物細胞或來源於植物細胞。在一些實施方式中,細胞係真菌細胞或來源於真菌細胞。在一些實施方式中,細胞係動物細胞或來源於動物細胞。在一些實施方式中,細胞係無脊椎動物細胞或來源於無脊椎動物細胞。在一些實施方式中,細胞係脊椎動物細胞或來源於脊椎動物細胞。在一些實施方式中,細胞係哺乳動物細胞或來源於哺乳動物細胞。在一些實施方式中,細胞係人細胞。在一些實施方式中,細胞係斑馬魚細胞。在一些實施方式中,細胞係齧齒動物細胞。在一些實施方式中,細胞係合成製備的,有時稱為人工細胞。
在一些實施方式中,細胞來源於細胞系。用於組織培養的多種多樣的細胞系係本領域已知的。細胞系之實例包括但不限於293T、MF7、K562、HeLa、CHO、及其轉基因品種。細胞系可從熟悉該項技術者已知的多種來源獲得(參見例如,美國典型培養物保藏中心(ATCC)(維吉尼亞州馬納薩斯(Manassas, Va.)))。在一些實施方式中,細胞係永生或永生化細胞。
在一些實施方式中,細胞係原代細胞。在一些實施方式中,細胞係幹細胞,如全能幹細胞(例如,萬能)、富潛能幹細胞、多潛能幹細胞、寡潛能幹細胞或單潛能幹細胞。在一些實施方式中,細胞係誘導多能幹細胞(iPSC)或來源於iPSC。在一些實施方式中,細胞係分化細胞。例如,在一些實施方式中,分化細胞係肌肉細胞(例如,肌細胞)、脂肪細胞(例如,脂細胞)、骨細胞(bone cell)(例如,成骨細胞、骨細胞(osteocyte)、破骨細胞)、血細胞(例如,單核細胞、淋巴球、嗜中性球、嗜酸性球、嗜鹼性球、巨噬細胞、紅血球或血小板)、神經細胞(例如,神經元)、上皮細胞、免疫細胞(例如,淋巴球、嗜中性球、單核細胞或巨噬細胞)、肝臟細胞(例如,肝細胞)、成纖維細胞、或性細胞。在一些實施方式中,細胞係終末分化細胞。例如,在一些實施方式中,終末分化細胞係神經元細胞、脂細胞、心肌細胞、骨骼肌細胞、表皮細胞或腸道細胞。在一些實施方式中,細胞係免疫細胞。在一些實施方式中,免疫細胞係T細胞。在一些實施方式中,免疫細胞係B細胞。在一些實施方式中,免疫細胞係自然殺手(NK)細胞。在一些實施方式中,免疫細胞係腫瘤浸潤性淋巴球(TIL)。在一些實施方式中,細胞係哺乳動物細胞(例如,人細胞或鼠類細胞)。在一些實施方式中,鼠類細胞來源於野生型小鼠、免疫抑制小鼠或疾病特異性小鼠模型。在一些實施方式中,細胞係活組織、器官、或生物內的細胞。
使用本文揭露的任何基因編輯系統產生的任何經基因修飾的細胞也在本揭露內容之範圍內。這樣的經修飾的細胞可以包含經破壞的TTR基因。
本文揭露的任何基因編輯系統、包含該等基因編輯系統的組成物、載體、核酸、RNA指導物和細胞可用於療法中。本文揭露的基因編輯系統、組成物、載體、核酸、RNA指導物和細胞可用於治療受試者的疾病或病症之方法中。本領域已知的任何合適的遞送或投與方法可用於遞送本文揭露的組成物、載體、核酸、RNA指導物和細胞。這樣的方法可以涉及使靶序列與本文揭露的組成物、載體、核酸或RNA指導物接觸。這樣的方法可以涉及編輯如本文揭露的TTR序列的方法。在一些實施方式中,使用本文揭露的RNA指導物改造的細胞用於離體基因療法。
IV. 治療性應用
使用如本文揭露的這種基因編輯系統產生的任何基因編輯系統或經修飾的細胞可用於治療與TTR基因相關的疾病,例如澱粉樣變運甲狀腺素蛋白(ATTR)。在一些情況下,ATTR係遺傳性ATTR(hATTR)或野生型ATTR類澱粉變性。
hATTR類澱粉變性(也稱為運甲狀腺素蛋白家族性澱粉樣多發性神經病變(TTR-FAP)或家族性澱粉樣心肌病(TTR-FAC))係一種全身性障礙,其特徵在於錯誤折疊的運甲狀腺素蛋白(TTR)蛋白的細胞外沈積。正常情況下,TTR係由4個單鏈單體組成的四聚體。TTR基因突變被認為使蛋白質不穩定並導致四聚體解離成單體,該等單體聚集成澱粉樣原纖維。然後該等澱粉樣原纖維積聚在全身的多個器官中。
hATTR類澱粉變性係一種具有可變外顯率的體染色體顯性疾病。澱粉樣沈積或症狀性疾病典型地發生在30至70歲(取決於突變)的成年人中。已鑒定出超過120種澱粉樣變TTR突變。一些導致hATTR疾病的SNP/與hATTR疾病相關的SNP顯示在下表7中。DNA突變的位置係相對於SEQ ID NO: 258的TTR編碼序列。胺基酸突變的位置係相對於經翻譯後切割的SEQ ID NO: 257的TTR蛋白序列(頂部突變)或SEQ ID NO: 256的全長TTR蛋白序列(括弧中的底部突變)。
[
表 7]
. 導致 hATTR 疾病的 SNP/ 與 hATTR 疾病相關的 SNP
DNA 突變 | 胺基酸突變 | 發病年齡 | 病程 | 位置 | 公佈的病例 |
無 | WT | 80 | 晚發型心臟受累 | 全世界 | 80歲以上的人約25% |
c. 148G>A | V30M (V50M) | 30-60 | 出現多發性神經病變和自主神經機能異常,然後全身受累 | 全世界 | > 400 |
c. 424G>A | V122I (V142I) | 60多歲 | 晚發型心臟類澱粉變性 | 非裔美國人 | 大多數係常見的變體 |
c. 238G>A | T60A (T80A) | 50多歲 | 晚發型心臟類澱粉變性伴一些神經受累 | 阿帕拉契山脈,愛爾蘭 | > 40 |
c. 233T>A | L58H (L78H) | 40多歲 | 通常出現CTS,並在二十年內緩慢進展 | 馬里蘭(Maryland),德國 | > 50 |
c. 311T>A | I84S (I104S) | 20-30 | 30歲時CTS,40-50多歲時玻璃體混濁,然後心臟受累 | 印第安那州(Indiana),瑞士 | > 30 |
T119M突變被認為是非澱粉樣變的,並且穩定hATTR患者的TTR四聚體。參見例如Batista等人, Gene Therapy [基因療法] 21: 1041-50 (2014) 以及Yee等人, Nature Communications [自然通信] 10: 925 (2019)。因此,T119M被認為是一種保護性突變。可以引入T119M突變來治療具有澱粉樣變TTR突變的受試者的hATTR或治療具有野生型ATTR類澱粉變性的患者。
在一些實施方式中,本文提供了一種用於治療如本文揭露的靶疾病(例如澱粉樣變運甲狀腺素蛋白(ATTR),如hATTR)之方法,該方法包括向需要治療的受試者(例如,人患者)投與本文揭露的任何基因編輯系統。可以將基因編輯系統遞送至需要基因編輯的特定組織或特定類型的細胞。基因編輯系統可以包含含有該等組分中的一或多種的LNP、編碼該等組分中的一或多種的一或多種載體(例如,病毒載體)、或其組合。可以配製基因編輯系統的組分以形成藥物組成物,該藥物組成物可以進一步包含一或多種藥學上可接受的運載體。
在一些實施方式中,可以將使用本文揭露的任何基因編輯系統產生的經修飾細胞投與於需要治療的受試者(例如,人患者)。經修飾的細胞可以包含本文所述之取代、***和/或缺失。在一些實例中,經修飾的細胞可以包括由CRISPR核酸酶、反轉錄酶多肽和編輯模板RNA(例如,RNA指導物和RT供體RNA)修飾的細胞系。在一些情況下,經修飾的細胞可為包含具有不同類型基因編輯的細胞的異質群體。可替代地,經修飾的細胞可以包含含有TTR基因的一種特定基因編輯的基本上同質的細胞群(例如,整個群體中至少80%的細胞)。在一些實例中,可以使細胞懸浮於合適的培養基中。
在一些實施方式中,本文提供了一種包含基因編輯系統或其組分的組成物。這種組成物可為藥物組成物。可以將有用的藥物組成物以適合於口服、直腸、***、腸胃外、局部、肺、鼻內、病灶內、口腔、眼部、靜脈內、器官內或另外投與途徑的配製物製備、包裝或銷售。本揭露內容之藥物組成物可以作為單一單位劑量或作為多個單一單位劑量批量製備、包裝或銷售。如本文所用,「單位劑量」係將向受試者投與的藥物組成物(例如,基因編輯系統或其組分)的離散量、或這種劑量的方便的分數,例如,這種劑量的二分之一或三分之一。
適合於腸胃外投與的藥物組成物的配製物可以包含活性劑(例如,基因編輯系統或其組分或經修飾的細胞)與藥學上可接受的運載體(如無菌水或無菌等滲鹽水)的組合。這種配製物可以以適合於推注投與或連續投與的形式製備、包裝或銷售。一些可注射配製物可以以單位劑型(如在安瓿中或在含有防腐劑的多劑量容器中)製備、包裝或銷售。一些用於腸胃外投與的配製物包括但不限於懸浮液、溶液、油性或水性媒介物中的乳液、糊劑以及可植入的持續釋放或生物可降解配製物。一些配製物可以進一步包含一或多種額外的成分,包括但不限於懸浮劑、穩定劑或分散劑。
藥物組成物可為無菌可注射的水性或油性懸浮液或溶液的形式。這種懸浮液或溶液可以根據已知技術來配製,並且除了細胞之外還可以包含其他成分,例如本文所述之分散劑、潤濕劑或懸浮劑。這種無菌可注射配製物可以使用無毒的腸胃外可接受的稀釋劑或溶劑(如水或鹽水)來製備。其他可接受的稀釋劑以及溶劑包括但不限於林格溶液、等滲氯化鈉溶液以及固定油諸如合成的甘油單酯或甘油二酯。其他有用的腸胃外投與的配製物包括以下配製物,該等配製物可以包含在脂質體配製物或作為生物可降解聚合物系統的組分的呈包裝形式的細胞。一些用於持續釋放或植入的組成物可以包含藥學上可接受的聚合物或疏水材料,例如乳液、離子交換樹脂、微溶聚合物或微溶鹽。
V. 套組及其用途
本揭露內容還提供了可用以例如實施本文所述之用於對TTR基因進行基因修飾的方法的套組。在一些實施方式中,套組包括RNA指導物和Cas12i多肽。在一些實施方式中,套組包括RNA指導物、模板DNA、和Cas12i多肽。在一些實施方式中,套組包括編碼這種Cas12i多肽的多核苷酸,並且視需要,該多核苷酸被包含在例如如本文所述之載體內。在一些實施方式中,該套組包括編碼本文揭露的RNA指導物的多核苷酸。可以將Cas12i多肽(或編碼該Cas12i多肽的多核苷酸)和RNA指導物(例如,作為核糖核蛋白)包裝在套組內的相同容器或其他容器內,或者可以包裝在內容物可以在使用前混合的分開的小瓶或其他容器中。
可以將Cas12i多肽、RNA指導物、和模板DNA包裝在套組內的相同容器或其他容器內,或者可以包裝在內容物可以在使用前混合的分開的小瓶或其他容器中。視需要,套組還可以額外地包括緩衝液和/或RNA指導物、模板DNA、和Cas12i多肽的使用說明。
本文引用的所有參考文獻和出版物特此藉由援引併入。
額外的實施方式
下面提供了額外的實施方式,它們也在本揭露內容之範圍內。
實施方式1:一種包含RNA指導物的組成物,其中該RNA指導物包含 (i) 與TTR基因內的靶核酸的靶序列基本上互補或完全互補的間隔子序列,以及 (ii) 直接重複序列;其中該靶序列與包含序列5'-NTTN-3'的原型間隔子相鄰模體(PAM)相鄰。
在實施方式1中,TTR基因可以包含SEQ ID NO: 228的序列、SEQ ID NO: 228的反向互補序列、SEQ ID NO: 228的變體、SEQ ID NO: 228的變體的反向互補序列、SEQ ID NO: 258的序列、SEQ ID NO: 258的反向互補序列、SEQ ID NO: 258的變體、或SEQ ID NO: 258的變體的反向互補序列。在一些實例中,靶序列在TTR基因的外顯子1、外顯子2、外顯子3或外顯子4內。
在實施方式1中,間隔子序列包含:
a. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸16;
b. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸17;
c. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸18;
d. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸19;
e. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸20;
f. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸21;
g. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸22;
h. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸23;
i. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸24;
j. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸25;
k. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸26;
l. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸27;
m. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸28;
n. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸29;或
o. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸30。
在一些實例中,間隔子序列可以包含:
a. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸16;
b. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸17;
c. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸18;
d. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸19;
e. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸20;
f. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸21;
g. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸22;
h. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸23;
i. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸24;
j. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸25;
k. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸26;
l. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸27;
m. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸28;
n. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸29;或
o. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸30。
在實施方式1中,直接重複序列可以包含:
a. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;
b. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;
c. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;
d. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;
e. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;
f. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;
g. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;
h. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;
i. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;
j. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;
k. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;
l. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;
m. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;
n. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;
o. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸1至核苷酸34;
p. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸2至核苷酸34;
q. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸3至核苷酸34;
r. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸4至核苷酸34;
s. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸5至核苷酸34;
t. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸6至核苷酸34;
u. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸7至核苷酸34;
v. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸8至核苷酸34;
w. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸9至核苷酸34;
x. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸10至核苷酸34;
y. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸11至核苷酸34;
z. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸12至核苷酸34;或
(aa) 與SEQ ID NO: 10的序列或其一部分具有至少90%同一性的序列。
在一些實例中,直接重複序列可以包含:
a. SEQ ID NO: 1-8中任一個的核苷酸1至核苷酸36;
b. SEQ ID NO: 1-8中任一個的核苷酸2至核苷酸36;
c. SEQ ID NO: 1-8中任一個的核苷酸3至核苷酸36;
d. SEQ ID NO: 1-8中任一個的核苷酸4至核苷酸36;
e. SEQ ID NO: 1-8中任一個的核苷酸5至核苷酸36;
f. SEQ ID NO: 1-8中任一個的核苷酸6至核苷酸36;
g. SEQ ID NO: 1-8中任一個的核苷酸7至核苷酸36;
h. SEQ ID NO: 1-8中任一個的核苷酸8至核苷酸36;
i. SEQ ID NO: 1-8中任一個的核苷酸9至核苷酸36;
j. SEQ ID NO: 1-8中任一個的核苷酸10至核苷酸36;
k. SEQ ID NO: 1-8中任一個的核苷酸11至核苷酸36;
l. SEQ ID NO: 1-8中任一個的核苷酸12至核苷酸36;
m. SEQ ID NO: 1-8中任一個的核苷酸13至核苷酸36;
n. SEQ ID NO: 1-8中任一個的核苷酸14至核苷酸36;
o. SEQ ID NO: 9的核苷酸1至核苷酸34;
p. SEQ ID NO: 9的核苷酸2至核苷酸34;
q. SEQ ID NO: 9的核苷酸3至核苷酸34;
r. SEQ ID NO: 9的核苷酸4至核苷酸34;
s. SEQ ID NO: 9的核苷酸5至核苷酸34;
t. SEQ ID NO: 9的核苷酸6至核苷酸34;
u. SEQ ID NO: 9的核苷酸7至核苷酸34;
v. SEQ ID NO: 9的核苷酸8至核苷酸34;
w. SEQ ID NO: 9的核苷酸9至核苷酸34;
x. SEQ ID NO: 9的核苷酸10至核苷酸34;
y. SEQ ID NO: 9的核苷酸11至核苷酸34;
z. SEQ ID NO: 9的核苷酸12至核苷酸34;或
aa. SEQ ID NO: 10或其一部分。
在實施方式1的任何組成物中,直接重複序列可以包含:
a. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;
b. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;
c. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;
d. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;
e. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;
f. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;
g. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;
h. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;
i. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;
j. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;
k. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;
l. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;
m. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;
n. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;或
o. 與SEQ ID NO: 251的序列或其一部分具有至少90%同一性的序列。
在一些實例中,直接重複序列可以包含:
a. SEQ ID NO: 233-250中任一個的核苷酸1至核苷酸36;
b. SEQ ID NO: 233-250中任一個的核苷酸2至核苷酸36;
c. SEQ ID NO: 233-250中任一個的核苷酸3至核苷酸36;
d. SEQ ID NO: 233-250中任一個的核苷酸4至核苷酸36;
e. SEQ ID NO: 233-250中任一個的核苷酸5至核苷酸36;
f. SEQ ID NO: 233-250中任一個的核苷酸6至核苷酸36;
g. SEQ ID NO: 233-250中任一個的核苷酸7至核苷酸36;
h. SEQ ID NO: 233-250中任一個的核苷酸8至核苷酸36;
i. SEQ ID NO: 233-250中任一個的核苷酸9至核苷酸36;
j. SEQ ID NO: 233-250中任一個的核苷酸10至核苷酸36;
k. SEQ ID NO: 233-250中任一個的核苷酸11至核苷酸36;
l. SEQ ID NO: 233-250中任一個的核苷酸12至核苷酸36;
m. SEQ ID NO: 233-250中任一個的核苷酸13至核苷酸36;
n. SEQ ID NO: 233-250中任一個的核苷酸14至核苷酸36;或
o. SEQ ID NO: 251或其一部分。
在其他實例中,直接重複序列可以包含:
a. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸1至核苷酸36;
b. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸2至核苷酸36;
c. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸3至核苷酸36;
d. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸4至核苷酸36;
e. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸5至核苷酸36;
f. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸6至核苷酸36;
g. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸7至核苷酸36;
h. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸8至核苷酸36;
i. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸9至核苷酸36;
j. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸10至核苷酸36;
k. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸11至核苷酸36;
l. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸12至核苷酸36;
m. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸13至核苷酸36;
n. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸14至核苷酸36;或
o. 與SEQ ID NO: 260或SEQ ID NO: 261的序列或其一部分具有至少90%同一性的序列。
在仍其他實例中,直接重複序列可以包含:
a. SEQ ID NO: 259的核苷酸1至核苷酸36;
b. SEQ ID NO: 259的核苷酸2至核苷酸36;
c. SEQ ID NO: 259的核苷酸3至核苷酸36;
d. SEQ ID NO: 259的核苷酸4至核苷酸36;
e. SEQ ID NO: 259的核苷酸5至核苷酸36;
f. SEQ ID NO: 259的核苷酸6至核苷酸36;
g. SEQ ID NO: 259的核苷酸7至核苷酸36;
h. SEQ ID NO: 259的核苷酸8至核苷酸36;
i. SEQ ID NO: 259的核苷酸9至核苷酸36;
j. SEQ ID NO: 259的核苷酸10至核苷酸36;
k. SEQ ID NO: 259的核苷酸11至核苷酸36;
l. SEQ ID NO: 259的核苷酸12至核苷酸36;
m. SEQ ID NO: 259的核苷酸13至核苷酸36;
n. SEQ ID NO: 259的核苷酸14至核苷酸36;或
o. SEQ ID NO: 260或SEQ ID NO: 261或其一部分。
在其他實例中,直接重複序列可以包含:
a. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;
b. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;
c. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;
d. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;
e. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;
f. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;
g. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;
h. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;
i. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;
j. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;
k. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;
l. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;
m. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;
n. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;
o. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸15至核苷酸36;或
p. 與SEQ ID NO: 264的序列或其一部分具有至少90%同一性的序列。
在一些實例中,直接重複序列可以包含:
a. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸1至核苷酸36;
b. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸2至核苷酸36;
c. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸3至核苷酸36;
d. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸4至核苷酸36;
e. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸5至核苷酸36;
f. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸6至核苷酸36;
g. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸7至核苷酸36;
h. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸8至核苷酸36;
i. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸9至核苷酸36;
j. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸10至核苷酸36;
k. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸11至核苷酸36;
l. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸12至核苷酸36;
m. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸13至核苷酸36;
n. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸14至核苷酸36;
o. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸15至核苷酸36;或p. SEQ ID NO: 264或其一部分。
在實施方式1的任何組成物中,間隔子序列與SEQ ID NO: 11-115中任一個的序列的互補序列基本上互補或完全互補。
在實施方式1的任何組成物中,PAM包含序列:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。
在一些實例中,靶序列緊鄰PAM序列。
在實施方式1的任何組成物中,RNA指導物具有如下序列,該序列與SEQ ID NO: 273-278或345-362中任一個的序列具有至少90%的同一性。在一些實例中,RNA指導物具有SEQ ID NO: 273-278或345-362中任一個的序列。
實施方式2:實施方式1的組成物可以進一步包含Cas12i多肽或編碼Cas12i多肽的多核糖核苷酸。在一些實例中,Cas12i多肽可為:
a. Cas12i2多肽,該Cas12i2多肽包含與SEQ ID NO: 222、SEQ ID NO: 223、SEQ ID NO: 224、SEQ ID NO: 225、SEQ ID NO: 226、或SEQ ID NO: 227的序列具有至少90%同一性的序列;
b. Cas12i4多肽,該Cas12i4多肽包含與SEQ ID NO: 253、SEQ ID NO: 254、或SEQ ID NO: 255的序列具有至少90%同一性的序列;
c. Cas12i1多肽,該Cas12i1多肽包含與SEQ ID NO: 265的序列具有至少90%同一性的序列;或
d. Cas12i3多肽,該Cas12i3多肽包含與SEQ ID NO: 266的序列具有至少90%同一性的序列。
在一些實例中,Cas12i多肽係:
a. Cas12i2多肽,該Cas12i2多肽包含SEQ ID NO: 222、SEQ ID NO: 223、SEQ ID NO: 224、SEQ ID NO: 225、SEQ ID NO: 226、或SEQ ID NO: 227的序列;
b. Cas12i4多肽,該Cas12i4多肽包含SEQ ID NO: 253、SEQ ID NO: 254、或SEQ ID NO: 255的序列;
c. Cas12i1多肽,該Cas12i1多肽包含SEQ ID NO: 265的序列;或
d. Cas12i3多肽,該Cas12i3多肽包含SEQ ID NO: 266的序列。
在一些實例中,RNA指導物和Cas12i多肽形成核糖核蛋白複合物。例如,核糖核蛋白複合物與靶核酸結合。
實施方式3:實施方式1或實施方式2的組成物可以進一步包含模板DNA,該模板DNA可以包含供體區,該供體區包含相對於靶核酸的第一序列差異。在一些情況下,模板DNA包含同源臂(例如,左同源臂和/或右同源臂)。在一些實例中,模板DNA係人DNA。
在一些實例中,模板DNA係雙股的。例如,雙股模板DNA的兩條股彼此基本上互補或完全互補。在其他實例中,模板DNA係單股的。在一些情況下,模板DNA係單股的,並且左同源臂或右同源臂各自獨立地與非靶股(PAM股)的對應區域具有至少80%、85%、90%、95%、99%、或100%的同一性。
在一些特定的實例中,模板DNA係單股的並且相對於靶股具有反向互補性。在一些情況下,模板DNA係單股的,並且左同源臂或右同源臂各自獨立地與靶股的對應區域具有至少80%、85%、90%、95%、99%、或100%的同一性。在其他情況下,模板DNA係單股的並且相對於非靶股具有反向互補性。
實施方式4:在實施方式1-3中任一個的任何組成物中,靶核酸包含與疾病相關的突變。例如,靶核酸包含具有與疾病相關的突變的TTR基因,並且模板DNA包含該TTR基因的野生型等位基因、或其與該突變對應的部分。
在一些實例中,模板DNA包含與靶核酸中的突變序列對應的野生型序列。在一些實例中,模板DNA不包含與疾病相關的突變。在一些實例中,模板DNA包含與疾病相關的突變。在特定的實例中,與疾病相關的突變係相對於SEQ ID NO: 257的TTR序列的V30M、V122I、T60A、L58H、或I84S。
在一些實例中,模板DNA包含與疾病相關的保護性突變。例如,模板DNA包含與疾病相關的突變或保護性突變。在特定的實例中,保護性突變係相對於SEQ ID NO: 257的TTR序列的T119M。
實施方式5:在實施方式1-4中任一個的任何組成物中,疾病係遺傳性ATTR(hATTR)或野生型ATTR類澱粉變性。
在一些實例中,模板DNA包含左同源臂但不包含右同源臂。在其他實例中,模板DNA包含右同源臂但不包含左同源臂。可替代地,模板DNA包含右同源臂和左同源臂。
在一些實例中,左同源臂與右同源臂長度相同或長度大致相同。在一些實例中,左同源臂的長度為約10-30、20-40、30-50、40-60、50-80、70-100、90-150、140-200、190-250、240-300、290-350、340-400、390-450、或440-500個核苷酸。在其他實例中,左同源臂的長度為約20-200個(例如,約20-25、25-30、30-35、35-40、40-45、45-50、50-55、55-60、60-65、65-70、70-75、75-80、80-85、85-90、90-95、95-100、100-105、105-110、110-115、115-120、120-125、125-130、130-135、135-140、140-145、145-150、150-155、155-160、160-165、165-170、170-175、175-180、180-185、185-190、190-195、或195-200個核苷酸)、約200-500個(例如,約200-210、210-220、220-230、230-240、240-250、250-260、260-270、270-280、280-290、290-300、300-310、310-320、320-330、330-340、340-350、350-360、360-370、370-380、380-390、390-400、400-410、410-420、420-430、430-440、440-450、450-460、460-470、470-480、480-490、或490-500個)核苷酸。
可替代地或額外地,右同源臂的長度為約10-30、20-40、30-50、40-60、60-80、80-100、100-150、150-200、200-250、250-300、300-350、350-400、400-450、或450-500個核苷酸。例如,右同源臂的長度為約20-200個(例如,約20-25、25-30、30-35、35-40、40-45、45-50、50-55、55-60、60-65、65-70、70-75、75-80、80-85、85-90、90-95、95-100、100-105、105-110、110-115、115-120、120-125、125-130、130-135、135-140、140-145、145-150、150-155、155-160、160-165、165-170、170-175、175-180、180-185、185-190、190-195、或195-200個核苷酸)、約200-500個(例如,約200-210、210-220、220-230、230-240、240-250、250-260、260-270、270-280、280-290、290-300、300-310、310-320、320-330、330-340、340-350、350-360、360-370、370-380、380-390、390-400、400-410、410-420、420-430、430-440、440-450、450-460、460-470、470-480、480-490、或490-500個)核苷酸。
實施方式6:在實施方式1-5中任一個的組成物中,供體區包含的第一序列差異位於靶序列的對應區域內。
在一些實例中,供體區包含的第一序列差異位於靶序列上游或下游10個核苷酸的對應區域內。在一些實例中,供體區包含的第一序列差異位於靶序列上游或下游5個核苷酸的對應區域內。在一些實例中,第一序列差異包含相對於靶核酸的取代。在一些實例中,第一序列差異包含沈默突變(例如,對密碼子的第三位置的、不改變由該密碼子編碼的胺基酸的突變)。在一些實例中,第一序列差異包含相對於靶核酸的多型性。
實施方式7:在實施方式1-6中任一個的組成物中,供體序列進一步包含相對於靶核酸的第二序列差異。
實施方式8:在實施方式1-7中任一個的組成物中,供體區包含的第二序列差異位於與靶序列對應的區域內。
在一些實例中,供體區包含的第二序列差異位於靶序列上游或下游10個核苷酸的對應區域內。在一些實例中,供體區包含的第二序列差異位於靶序列上游或下游5個核苷酸的對應區域內。在一些實例中,第二序列差異係取代。
實施方式9:在實施方式1-8中任一個的組成物中,供體區進一步包含相對於靶核酸的第三序列差異以及視需要的第四序列差異。
實施方式10:在實施方式1-9中任一個的組成物中,模板DNA包含一或多個核苷間修飾(例如,硫代磷酸酯修飾)。
在一些實例中,左同源臂包含一或多個核苷間修飾(例如,硫代磷酸酯修飾)。在一些實例中,右同源臂包含一或多個核苷間修飾(例如,硫代磷酸酯修飾)。可替代地,左同源臂包含一或多個核苷間修飾(例如,硫代磷酸酯修飾),並且右同源臂包含一或多個核苷間修飾(例如,硫代磷酸酯修飾)。在一些實例中,左同源臂包含兩個核苷間修飾(例如,硫代磷酸酯修飾),並且右同源臂包含兩個核苷間修飾(例如,硫代磷酸酯修飾)。
在一些特定的實例中,硫代磷酸酯修飾在左同源臂的5'端和右同源臂的3'端。在其他特定的實例中,左同源臂在右同源臂的5'並且該左同源臂包含在該左同源臂的5'端處的兩個硫代磷酸酯修飾,該右同源臂包含在該右同源臂的3'端處的兩個硫代磷酸酯修飾。
實施方式11:在實施方式1-10中任一個的組成物中,模板DNA係包含第一股和第二股的雙股DNA,其中該第一股包含在該第一股的5'端處的至少一個(例如,2個)硫代磷酸酯修飾或在該第一股的3'端處的至少一個(例如,2個)硫代磷酸酯修飾、或兩者。
在一些實例中,第二股包含在該第二股的5'端處的至少一個(例如,2個)硫代磷酸酯修飾或在該第二股的3'端處的至少一個(例如,2個)硫代磷酸酯修飾、或兩者。
實施方式12:實施方式1-11中任一個的組成物存在於細胞內。
實施方式13:在實施方式1-12中任一個的組成物中,RNA指導物和Cas12i多肽被編碼在載體(例如,表現載體)中。在一些實例中,RNA指導物和Cas12i多肽被編碼在單一載體中,或者該RNA指導物被編碼在第一載體中並且該Cas12i多肽被編碼在第二載體中。
實施方式14:在實施方式1-13中任一個的組成物中,模板DNA在載體中。
實施方式15,一種RNA指導物,該RNA指導物包含 (i) 與TTR基因內的靶序列基本上互補或完全互補的間隔子序列,以及 (ii) 直接重複序列。在一些實例中,靶序列在TTR基因的外顯子1、外顯子2、外顯子3或外顯子4內。在一些實例中,TTR基因包含SEQ ID NO: 228的序列、SEQ ID NO: 228的反向互補序列、SEQ ID NO: 228的變體、SEQ ID NO: 228的變體的反向互補序列、SEQ ID NO: 258的序列、SEQ ID NO: 258的反向互補序列、SEQ ID NO: 258的變體、或SEQ ID NO: 258的變體的反向互補序列。
在實施方式15中,間隔子序列可以包含:a. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸16;b. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸17;c. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸18;d. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸19;e. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸20;f. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸21;g. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸22;h. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸23;i. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸24;j. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸25;k. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸26;l. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸27;m. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸28;n. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸29;或o. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸30。
在一些實例中,間隔子序列可以包含:a. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸16;b. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸17;c. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸18;d. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸19;e. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸20;f. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸21;g. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸22;h. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸23;i. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸24;j. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸25;k. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸26;l. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸27;m. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸28;n. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸29;或o. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸30。
在實施方式15中,直接重複序列包含:a. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;b. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;c. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;d. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;e. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;f. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;g. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;h. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;i. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;j. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;k. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;l. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;m. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;n. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;o. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸1至核苷酸34;p. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸2至核苷酸34;q. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸3至核苷酸34;r. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸4至核苷酸34;s. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸5至核苷酸34;t. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸6至核苷酸34;u. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸7至核苷酸34;v. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸8至核苷酸34;w. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸9至核苷酸34;x. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸10至核苷酸34;y. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸11至核苷酸34;z. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸12至核苷酸34;或aa. 與SEQ ID NO: 10的序列或其一部分具有至少90%同一性的序列。
在一些實例中,直接重複序列可以包含:a. SEQ ID NO: 1-8中任一個的核苷酸1至核苷酸36;b. SEQ ID NO: 1-8中任一個的核苷酸2至核苷酸36;c. SEQ ID NO: 1-8中任一個的核苷酸3至核苷酸36;d. SEQ ID NO: 1-8中任一個的核苷酸4至核苷酸36;e. SEQ ID NO: 1-8中任一個的核苷酸5至核苷酸36;f. SEQ ID NO: 1-8中任一個的核苷酸6至核苷酸36;g. SEQ ID NO: 1-8中任一個的核苷酸7至核苷酸36;h. SEQ ID NO: 1-8中任一個的核苷酸8至核苷酸36;i. SEQ ID NO: 1-8中任一個的核苷酸9至核苷酸36;j. SEQ ID NO: 1-8中任一個的核苷酸10至核苷酸36;k. SEQ ID NO: 1-8中任一個的核苷酸11至核苷酸36;l. SEQ ID NO: 1-8中任一個的核苷酸12至核苷酸36;m. SEQ ID NO: 1-8中任一個的核苷酸13至核苷酸36;n. SEQ ID NO: 1-8中任一個的核苷酸14至核苷酸36;o. SEQ ID NO: 9的核苷酸1至核苷酸34;p. SEQ ID NO: 9的核苷酸2至核苷酸34;q. SEQ ID NO: 9的核苷酸3至核苷酸34;r. SEQ ID NO: 9的核苷酸4至核苷酸34;s. SEQ ID NO: 9的核苷酸5至核苷酸34;t. SEQ ID NO: 9的核苷酸6至核苷酸34;u. SEQ ID NO: 9的核苷酸7至核苷酸34;v. SEQ ID NO: 9的核苷酸8至核苷酸34;w. SEQ ID NO: 9的核苷酸9至核苷酸34;x. SEQ ID NO: 9的核苷酸10至核苷酸34;y. SEQ ID NO: 9的核苷酸11至核苷酸34;z. SEQ ID NO: 9的核苷酸12至核苷酸34;或aa.SEQ ID NO: 10或其一部分。
在一些實例中,直接重複序列包含:a. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;b. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;c. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;d. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;e. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;f. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;g. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;h. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;i. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;j. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;k. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;l. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;m. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;n. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;或o. 與SEQ ID NO: 251的序列或其一部分具有至少90%同一性的序列。
在一些實例中,直接重複序列包含:a. SEQ ID NO: 233-250中任一個的核苷酸1至核苷酸36;b. SEQ ID NO: 233-250中任一個的核苷酸2至核苷酸36;c. SEQ ID NO: 233-250中任一個的核苷酸3至核苷酸36;d. SEQ ID NO: 233-250中任一個的核苷酸4至核苷酸36;e. SEQ ID NO: 233-250中任一個的核苷酸5至核苷酸36;f. SEQ ID NO: 233-250中任一個的核苷酸6至核苷酸36;g. SEQ ID NO: 233-250中任一個的核苷酸7至核苷酸36;h. SEQ ID NO: 233-250中任一個的核苷酸8至核苷酸36;i. SEQ ID NO: 233-250中任一個的核苷酸9至核苷酸36;j. SEQ ID NO: 233-250中任一個的核苷酸10至核苷酸36;k. SEQ ID NO: 233-250中任一個的核苷酸11至核苷酸36;l. SEQ ID NO: 233-250中任一個的核苷酸12至核苷酸36;m. SEQ ID NO: 233-250中任一個的核苷酸13至核苷酸36;n. SEQ ID NO: 233-250中任一個的核苷酸14至核苷酸36;或o. SEQ ID NO: 251或其一部分。
在一些實例中,直接重複序列包含:a. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸1至核苷酸36;b. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸2至核苷酸36;c. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸3至核苷酸36;d. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸4至核苷酸36;e. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸5至核苷酸36;f. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸6至核苷酸36;g. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸7至核苷酸36;h. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸8至核苷酸36;i. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸9至核苷酸36;j. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸10至核苷酸36;k. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸11至核苷酸36;l. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸12至核苷酸36;m. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸13至核苷酸36;n. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸14至核苷酸36;或o. 與SEQ ID NO: 260或SEQ ID NO: 261的序列或其一部分具有至少90%同一性的序列。
在一些實例中,直接重複序列包含:a. SEQ ID NO: 259的核苷酸1至核苷酸36;b. SEQ ID NO: 259的核苷酸2至核苷酸36;c. SEQ ID NO: 259的核苷酸3至核苷酸36;d. SEQ ID NO: 259的核苷酸4至核苷酸36;e. SEQ ID NO: 259的核苷酸5至核苷酸36;f. SEQ ID NO: 259的核苷酸6至核苷酸36;g. SEQ ID NO: 259的核苷酸7至核苷酸36;h. SEQ ID NO: 259的核苷酸8至核苷酸36;i. SEQ ID NO: 259的核苷酸9至核苷酸36;j. SEQ ID NO: 259的核苷酸10至核苷酸36;k. SEQ ID NO: 259的核苷酸11至核苷酸36;l. SEQ ID NO: 259的核苷酸12至核苷酸36;m. SEQ ID NO: 259的核苷酸13至核苷酸36;n. SEQ ID NO: 259的核苷酸14至核苷酸36;或o. SEQ ID NO: 260或SEQ ID NO: 261或其一部分。
在一些實例中,直接重複序列包含:a. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;b. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;c. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;d. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;e. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;f. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;g. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;h. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;i. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;j. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;k. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;l. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;m. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;n. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;o. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸15至核苷酸36;或p. 與SEQ ID NO: 264的序列或其一部分具有至少90%同一性的序列。
在一些實例中,直接重複序列包含:a. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸1至核苷酸36;b. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸2至核苷酸36;c. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸3至核苷酸36;d. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸4至核苷酸36;e. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸5至核苷酸36;f. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸6至核苷酸36;g. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸7至核苷酸36;h. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸8至核苷酸36;i. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸9至核苷酸36;j. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸10至核苷酸36;k. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸11至核苷酸36;l. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸12至核苷酸36;m. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸13至核苷酸36;n. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸14至核苷酸36;o. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸15至核苷酸36;或p. SEQ ID NO: 264或其一部分。
在實施方式15中,間隔子序列與SEQ ID NO: 11-115中任一個的序列的互補序列基本上互補或完全互補。
在實施方式15中,靶序列與包含序列5'-NTTN-3'的原型間隔子相鄰模體(PAM)相鄰,其中N係任何核苷酸。在一些實例中,PAM包含序列5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。
在一些實例中,靶序列緊鄰PAM序列。
在特定的實例中,RNA指導物具有如下序列,該序列與SEQ ID NO: 273-278或345-362中任一個的序列具有至少90%的同一性。例如,RNA指導物具有SEQ ID NO: 273-278或345-362中任一個的序列。
實施方式16:一種核酸,該核酸編碼如本文所述之(例如,實施方式15中闡述的)RNA指導物。
實施方式17:一種載體,該載體包含如本文所述之(例如,實施方式16中闡述的)核酸。
實施方式18:一種載體系統,該載體系統包含一或多個載體,該一或多個載體編碼 (i) 如本文所述之RNA指導物,以及 (ii) Cas12i多肽,視需要其中該載體系統包含編碼該RNA指導物的第一載體和編碼該Cas12i多肽的第二載體。
實施方式19:一種細胞,該細胞包含如本文所述之組成物、RNA指導物、核酸、載體、或載體系統。在一些實例中,細胞係真核細胞、動物細胞、哺乳動物細胞、人細胞、原代細胞、細胞系、幹細胞、或T細胞。在特定的實例中,細胞係肝臟細胞(例如,肝細胞)。
實施方式20:一種套組,該套組包含本文所述之組成物、RNA指導物、核酸、載體、或載體系統。
實施方式21:一種編輯TTR序列之方法,該方法包括使TTR序列與如本文所述之組成物或RNA指導物接觸,其中視需要該方法在體內、體外、或離體進行。在一些實例中,TTR序列在細胞中。在一些實例中,組成物或RNA指導物誘導TTR序列的缺失。
在一些實例中,缺失與5'-NTTN-3'序列相鄰,其中N係任何核苷酸。例如,缺失在5'-NTTN-3'序列的下游。在一些情況下,缺失的長度係多達約50個核苷酸。在一些情況下,缺失的長度係多達約40個核苷酸。在一些情況下,缺失的長度係約4個核苷酸至40個核苷酸。在一些情況下,缺失的長度係約4個核苷酸至25個核苷酸。在一些特定的實例中,缺失的長度係約10個核苷酸至25個核苷酸。在其他特定的實例中,缺失的長度係約10個核苷酸至15個核苷酸。
在一些實例中,缺失始於5'-NTTN-3'序列的約5個核苷酸至約15個核苷酸內。在一些情況下,缺失始於5'-NTTN-3'序列的約5個核苷酸至約10個核苷酸內。在一些情況下,缺失始於5'-NTTN-3'序列的約10個核苷酸至約15個核苷酸內。在一些情況下,缺失始於5'-NTTN-3'序列的下游約5個核苷酸至約15個核苷酸內。在一些情況下,缺失始於5'-NTTN-3'序列的下游約5個核苷酸至約10個核苷酸內。在一些情況下,缺失始於5'-NTTN-3'序列的下游約10個核苷酸至約15個核苷酸內。
在一些實例中,缺失終於5'-NTTN-3'序列的約20個核苷酸至約30個核苷酸內。在一些情況下,缺失終於5'-NTTN-3'序列的約20個核苷酸至約25個核苷酸內。在一些情況下,缺失終於5'-NTTN-3'序列的約25個核苷酸至約30個核苷酸內。在一些情況下,缺失終於5'-NTTN-3'序列的下游約20個核苷酸至約30個核苷酸內。在一些情況下,缺失終於5'-NTTN-3'序列的下游約20個核苷酸至約25個核苷酸內。在一些情況下,缺失終於5'-NTTN-3'序列的下游約25個核苷酸至約30個核苷酸內。
在一些特定的實例中,缺失始於5'-NTTN-3'序列的下游約5個核苷酸至約15個核苷酸內,並且終於該5'-NTTN-3'序列的下游約20個核苷酸至約30個核苷酸內。在其他特定的實例中,缺失始於5'-NTTN-3'序列的下游約5個核苷酸至約15個核苷酸內,並且終於該5'-NTTN-3'序列的下游約20個核苷酸至約25個核苷酸內。在又其他特定的實例中,缺失始於5'-NTTN-3'序列的下游約5個核苷酸至約15個核苷酸內,並且終於該5'-NTTN-3'序列的下游約25個核苷酸至約30個核苷酸內。可替代地,缺失始於5'-NTTN-3'序列的下游約5個核苷酸至約10個核苷酸內,並且終於該5'-NTTN-3'序列的下游約20個核苷酸至約30個核苷酸內。在仍其他實例中,缺失始於5'-NTTN-3'序列的下游約5個核苷酸至約10個核苷酸內,並且終於該5'-NTTN-3'序列的下游約20個核苷酸至約25個核苷酸內。在其他情況下,缺失始於5'-NTTN-3'序列的下游約5個核苷酸至約10個核苷酸內,並且終於該5'-NTTN-3'序列的下游約25個核苷酸至約30個核苷酸內。在其他情況下,缺失始於5'-NTTN-3'序列的下游約10個核苷酸至約15個核苷酸內,並且終於該5'-NTTN-3'序列的下游約20個核苷酸至約30個核苷酸內。在又其他情況下,缺失始於5'-NTTN-3'序列的下游約10個核苷酸至約15個核苷酸內,並且終於該5'-NTTN-3'序列的下游約20個核苷酸至約25個核苷酸內。在又其他情況下,缺失始於5'-NTTN-3'序列的下游約10個核苷酸至約15個核苷酸內,並且終於該5'-NTTN-3'序列的下游約25個核苷酸至約30個核苷酸內。
在實施方式21的方法中,5'-NTTN-3'序列係5’-CTTT-3’、5’-CTTC-3’、5’-GTTT-3’、5’-GTTC-3’、5’-TTTC-3’、5’-GTTA-3’、或5’-GTTG-3’。
在一些實例中,缺失與基因中的突變重疊。在一些實例中,缺失破壞基因的一個或兩個等位基因。
在實施方式22的方法中,該方法將第一序列差異引入到靶核酸中。在一些實例中,供體區包含的第一序列差異位於靶序列內。在一些實例中,第一序列差異位於靶序列的上游或下游10個核苷酸內。在一些實例中,第一序列差異位於靶序列的上游或下游5個核苷酸內。在一些實例中,第一序列差異包含相對於靶核酸的取代。
在一些實例中,第一序列差異包含沈默突變(例如,對密碼子的第三位置的、不改變由該密碼子編碼的胺基酸的突變)。在一些實例中,第一序列差異包含相對於靶核酸的多型性。
在實施方式22的方法中,該方法將第二序列差異引入到靶核酸中。在一些實例中,第二序列差異位於靶序列內。在一些實例中,第二序列差異位於靶序列的上游或下游10個核苷酸內。在一些實例中,第二序列差異位於靶序列的上游或下游5個核苷酸內。在一些實例中,第二序列差異係取代。
在實施方式22的方法中,該方法進一步將第三序列差異以及視需要的第四序列差異引入到靶核酸中。
實施方式22的任何方法糾正與疾病相關的突變。在一些實例中,該方法引入保護性突變。在一些實例中,該方法糾正與疾病相關的突變並引入保護性突變。在一些情況下,疾病係hATTR或野生型ATTR類澱粉變性。在一些實例中,與疾病相關的突變係相對於SEQ ID NO: 257的TTR序列的V30M、V122I、T60A、L58H、或I84S。在一些實例中,保護性突變係相對於SEQ ID NO: 257的TTR序列的T119M。
實施方式22的任何方法都可以降低細胞中的TTR表現。可替代地,該方法可以穩定細胞中的TTR。在一些實例中,該方法減少細胞中澱粉樣原纖維的聚集。
在實施方式22的任何方法中,細胞係肝臟細胞(例如,肝細胞)。在一些實例中,細胞駐留在hATTR或野生型ATTR類澱粉變性患者中。
實施方式23:一種本文所述之組成物、RNA指導物、核酸、載體、載體系統、細胞、套組、或方法,RNA指導物包含SEQ ID NO: 273-278或345-362中任一個的序列。
實施方式24:一種治療受試者的澱粉樣病、老年系統性類澱粉變性、家族性澱粉樣多發性神經病變、或家族性澱粉樣心肌病之方法,該方法包括向該受試者投與本文所述之組成物、RNA指導物、或細胞。
實施方式25:一種本文所述之組成物、細胞、套組、或方法,RNA指導物和/或編碼Cas12i多肽的多核糖核苷酸被包含在脂質奈米顆粒內。
實施方式26:一種本文所述之組成物、細胞、套組、或方法,RNA指導物和編碼Cas12i多肽的多核糖核苷酸被包含在相同的脂質奈米顆粒內。
實施方式27:一種本文所述之組成物、細胞、套組、或方法,RNA指導物和編碼Cas12i多肽的多核糖核苷酸被包含在分開的脂質奈米顆粒內。
實施方式28:一種RNA指導物,該RNA指導物包含 (i) 與TTR基因內的靶序列互補的間隔子序列,以及 (ii) 直接重複序列,其中該靶序列係SEQ ID NO: 267-272或327-344中任一個的序列或其反向互補序列。在一些實例中,RNA指導物包含直接重複序列,該直接重複序列可為本文揭露的任何直接重複序列。在實施方式28的任何RNA指導物中,RNA指導物的前三個核苷酸中的每一個包含2'-
O-甲基硫代磷酸酯修飾。可替代地或額外地,RNA指導物的最後四個核苷酸中的每一個包含2'-
O-甲基硫代磷酸酯修飾。在特定的實例中,RNA指導物的倒數第二個、倒數第三個、以及倒數第四個核苷酸中的每一個包含2'-
O-甲基硫代磷酸酯修飾,並且其中該RNA指導物的最後一個核苷酸未經修飾。
通用技術
除非另外指明,否則本揭露內容之實踐將採用分子生物學(包括重組技術)、微生物學、細胞生物學、生物化學和免疫學的常規技術,該等常規技術在本領域的技術範圍內。這樣的技術在文獻中得到充分的解釋,該等文獻如
Molecular Cloning: A Laboratory Manual[分子選殖:實驗室手冊]
,第二版 (Sambrook等人, 1989) 冷泉港出版社(Cold Spring Harbor Press);
Oligonucleotide Synthesis[寡核苷酸合成] (M. J. Gait編輯 1984);
Methods in Molecular Biology[分子生物學方法], 胡瑪納出版社(Humana Press);
Cell Biology: A Laboratory Notebook[細胞生物學:實驗室筆記本] (J. E. Cellis編輯, 1989) 學術出版社(Academic Press);Animal Cell Culture [動物細胞培養] (R. I. Freshney編輯 1987);Introduction to Cell and Tissue Culture [細胞和組織培養簡介] (J. P. Mather和P. E. Roberts, 1998) 普萊南出版社(Plenum Press);Cell and Tissue Culture: Laboratory Procedures [細胞和組織培養:實驗室程序] (A. Doyle, J. B. Griffiths和D. G. Newell編輯1993-8) J. 威利父子公司(Wiley and Sons);Methods in Enzymology [酶學方法] (學術出版社公司(Academic Press, Inc.));Handbook of Experimental Immunology [實驗免疫學手冊] (D. M. Weir和C.C.Blackwell編輯): Gene Transfer Vectors for Mammalian Cells [哺乳動物細胞的基因轉移載體] (J. M. Miller和M. P. Calos編輯, 1987);Current Protocols in Molecular Biology [當前分子生物學方案] (F. M. Ausubel等人編輯1987);PCR: The Polymerase Chain Reaction [PCR:聚合酶鏈反應], (Mullis等人, 編輯1994);Current Protocols in Immunology [當前免疫學方案] (J. E. Coligan等人, 編輯, 1991);Short Protocols in Molecular Biology [精編分子生物學實驗指南] (威利父子公司(Wiley and Sons), 1999);Immunobiology [免疫生物學] (C.A. Janeway和P. Travers, 1997);Antibodies [抗體] (P. Finch, 1997);Antibodies: a practice approach [抗體:實踐方法] (D. Catty.編輯, IRL出版社(IRL Press), 1988-1989);Monoclonal antibodies: a practical approach [單株抗體:實踐方法] (P. Shepherd和C.Dean編輯, 牛津大學出版社(Oxford University Press), 2000);Using antibodies: a laboratory manual [使用抗體:實驗室手冊] (E. Harlow和D. Lane (冷泉港實驗室出版社(Cold Spring Harbor Laboratory Press), 1999);The Antibodies [抗體] (M. Zanetti和J. D. Capra編輯硬木學術出版社(Harwood Academic Publishers), 1995);
DNA Cloning: A practical Approach[DNA選殖:實踐方法]
,第I和II卷 (D.N.Glover編輯 1985);
Nucleic Acid Hybridization[核酸雜交] (B.D.Hames和S.J.Higgins編輯(1985));
Transcription and Translation[轉錄和翻譯] (B.D.Hames和S.J.Higgins編輯(1984));
Animal Cell Culture[動物細胞培養] (R.I.Freshney編輯 (1986));
Immobilized Cells and Enzymes[固定化細胞和酶] (IRL出版社(lRL Press), (1986));以及B. Perbal,
A practical Guide To Molecular Cloning[分子選殖實用指南] (1984); F.M.Ausubel等人 (編輯)。
在無進一步詳述的情況下,認為熟悉該項技術者可以基於以上描述最大程度地利用本揭露內容。因此,以下特定的實施方式應解釋為僅僅是說明性的,並且不以任何方式限制本揭露內容之其餘部分。出於本文引用的目的或主題,將本文引用的所有出版物藉由援引併入。
實例
提供以下實例以進一步展示本揭露內容之一些實施方式,但並不旨在限制本揭露內容之範圍;藉由它們的示例性性質可以理解,可以可替代地使用熟悉該項技術者已知的其他程序、方法或技術。
實例 1 - 哺乳動物細胞中運甲狀腺素蛋白( TTR )靶位點的編輯
本實例描述了使用引入到HEK293T細胞中的Cas12i2將***缺失引入到TTR中。
Cas12i2 RNA指導物(crRNA)由綜合DNA技術公司(Integrated DNA Technologies)(IDT)設計,並訂購自該公司。將crRNA在250 mM NaCl中重懸至1 mM的最終濃度。序列顯示在表8中。
[
表 8]
. 靶序列和 crRNA 序列
*:TTN 3-nt PAM模體呈粗體。
TS係指「頂股」,BS係指「底股」
指導物識別字 | PAM* | 靶股 | 靶序列(在非 PAM 股上) | crRNA 序列 |
Cas12i2_TTR_ V30M_1 | T TTC | TS | TGAACACATGCACGGCCACA(SEQ ID NO: 267) | rArGrArArArUrCrCrGrUrCrUrUrUrCrArUrUrGrArCrGrGrUrGrArArCrArCrArUrGrCrArCrGrGrCrCrArCrA(SEQ ID NO: 273) |
Cas12i2_TTR_ V30M_2 | C TTT | TS | CTGAACACATGCACGGCCAC(SEQ ID NO: 268) | rArGrArArArUrCrCrGrUrCrUrUrUrCrArUrUrGrArCrGrGrCrUrGrArArCrArCrArUrGrCrArCrGrGrCrCrArC(SEQ ID NO: 274) |
Cas12i2_TTR_ V122I_1 | A TTC | BS | CACCACGGCTGTCGTCACCA(SEQ ID NO: 269) | rArGrArArArUrCrCrGrUrCrUrUrUrCrArUrUrGrArCrGrGrCrArCrCrArCrGrGrCrUrGrUrCrGrUrCrArCrCrA(SEQ ID NO: 275) |
Cas12i2_TTR_ V122I_3 | C TTG | TS | GGATTGGTGACGACAGCCGT(SEQ ID NO: 270) | rArGrArArArUrCrCrGrUrCrUrUrUrCrArUrUrGrArCrGrGrGrGrArUrUrGrGrUrGrArCrGrArCrArGrCrCrGrU(SEQ ID NO: 276) |
Cas12i2_TTR _T119M_1 | A TTC | BS | CACCACGGCTGTCGTCACCA(SEQ ID NO: 271) | rArGrArArArUrCrCrGrUrCrUrUrUrCrArUrUrGrArCrGrGrCrArCrCrArCrGrGrCrUrGrUrCrGrUrCrArCrCrA(SEQ ID NO: 277) |
Cas12i2_TTR_T119M_2 | C TTG | TS | GGATTGGTGACGACAGCCGT(SEQ ID NO: 272) | rArGrArArArUrCrCrGrUrCrUrUrUrCrArUrUrGrArCrGrGrGrGrArUrUrGrGrUrGrArCrGrArCrArGrCrCrGrU(SEQ ID NO: 278) |
Cas12i2 RNP複合反應係藉由以下進行的:將純化的Cas12i2多肽(400 µM)與crRNA(在250 mM NaCl中1 mM)以1 : 1(Cas12i2多肽 : crRNA)的體積比(2.5 : 1的crRNA : Cas12i2莫耳比)混合。將複合反應在冰上孵育30-60 min。
孵育期間,使用TRYPLE
TM(重組細胞解離酶;賽默飛世爾公司(ThermoFisher))收穫HEK293T細胞並計數。將細胞用PBS洗滌一次並重懸於SF緩衝液 + 補充劑(SF細胞系4D-NUCLEOFECTOR
TMX套組S;龍沙公司(Lonza)編號V4XC-2032)中,濃度為16,480個細胞/µL。以3e5個細胞/反應液將重懸的細胞分配到龍沙公司的16孔NUCLEOCUVETTE®條中。將複合的Cas12i2 RNP以10 µM的最終濃度添加到每個反應液中。使用非靶向性指導物作為陰性對照。
使用電穿孔裝置(程式CM-130,龍沙公司4D-NUCLEOFECTOR
TM)對該等條進行電穿孔。電穿孔後,立即將80 µL預熱的DMEM + 10% FBS添加到每個孔中,並藉由吸移輕輕混合。對於每個技術平行樣本板,將10 µL(30,000個細胞)稀釋的核轉染的細胞鋪板到預熱的96孔板中,孔中含有100 µL DMEM + 10% FBS。將編輯板在37°C和5% CO
2下孵育3天。
3天後,使用TRYPLE
TM(重組細胞解離酶;賽默飛世爾公司)對孔進行收穫並轉移至96孔TWIN.TEC® PCR板(Eppendorf)PCR板。拂掉培養基,並將細胞重懸於20 µL的QUICKEXTRACT
TM(DNA提取緩衝液;盧西根公司(Lucigen))中。然後在PCR機器中使樣本在65°C下循環15 min、在68°C下循環15 min、在98°C下循環10 min。然後將樣本在-20°C冷凍。
藉由多輪PCR製備用於下一代定序(NGS)的樣本。第一輪(PCR I)用於擴增靶位點側翼的基因組區域並添加NGS銜接子。第二輪(PCR II)用於添加NGS index。然後將反應液彙集,藉由柱純化進行純化,並在螢光計(Qubit)上定量。使用150循環NGS儀器(NEXTSEQ
TMv2.5)中或高輸出套組(依諾米那公司(Illumina))運行定序,並在NGS儀器(NEXTSEQ
TM550;依諾米那公司)上運行。
對於NGS分析,***缺失映射功能使用樣本的fastq檔、擴增子參考序列、和正向引物序列。對於每個讀段,使用kmer掃描演算法來計算讀段與參考序列之間的編輯操作(匹配、錯配、***、缺失)。為了去除一些樣本中存在的少量引物二聚體,每個讀段的前30 nt需要與參考匹配,並且超過一半的映射核苷酸為錯配的讀段也被濾除。通過該等過濾器的多達50,000個讀段用於分析,並且如果讀段含有***或缺失,則將其計為***缺失讀數。***缺失%計算為含有***缺失的讀段數目除以分析的讀段數目(藉由過濾器的讀段多達50,000個)。通過過濾器的最小讀段數目的QC標準係10,000。
圖 1顯示了針對使用的每個RNA指導物都觀察到了***缺失活性。因此,Cas12i2能夠在已知攜帶與疾病相關的突變的區域中編輯TTR靶核酸的多個區域。
實例 2 - HDR 介導的 TTR 靶位點的編輯
本實例描述了使用引入到HEK293T細胞中的Cas12i2經由HDR引入在TTR靶位點內的取代。
Cas12i2 RNA指導物(crRNA)由綜合DNA技術公司(IDT)設計,並訂購自該公司。將crRNA在250 mM NaCl中重懸至1 mM的最終濃度。序列顯示在上表8中。
還由IDT設計並從IDT訂購了單股寡聚物供體(ssODN),並在水中重懸至100 µM的最終濃度。序列顯示在下
表 9中。ssODN被設計為在靶序列/指導物序列兩側具有40 bp或50 bp的同源臂,並且與靶DNA序列相比包含至少一個SNP修飾。前兩個鹼基經硫代磷酸酯修飾,並且最後3個鹼基中的2個鹼基經硫代磷酸酯修飾;最後一個鹼基未經修飾。引入了三個錯義突變(V30M、T119M、V122I),***或不***防止RNA指導物重新靶向的額外的沈默突變。每個錯義突變根據TTR前20個殘基的翻譯後蛋白質切割之後的胺基酸殘基編號。因此,作為實例,V50M被稱為V30M,因為前20個胺基酸在翻譯後被切割。
圖 2係描繪在Cas12i2_TTR_HDR_T119M_2靶序列內引入40 bp同源臂和各種SNP的ssODN的示意圖。每個ssODN內引入的SNP在下面指示,而不是對應的核苷酸序列。
Cas12i2 RNP複合反應係藉由以下進行的:將純化的Cas12i2多肽(400 µM)與crRNA(在250 mM NaCl中1 mM)以1 : 1(Cas12i2多肽 : crRNA)的體積比(2.5 : 1的crRNA : Cas12i2多肽莫耳比)混合。將複合反應在冰上孵育30-60 min。
孵育期間,使用TRYPLE
TM(重組細胞解離酶;賽默飛世爾公司)收穫HEK293T細胞並計數。將細胞用PBS洗滌一次並重懸於SF緩衝液 + 補充劑(SF細胞系4D-NUCLEOFECTOR
TMX套組S;龍沙公司(Lonza)編號V4XC-2032)中,濃度為16,480個細胞/µL。以3e5個細胞/反應液將重懸的細胞分配到龍沙公司的16孔NUCLEOCUVETTE®條中。將複合的Cas12i2 RNP以10 µM的最終濃度添加到每個反應液中,然後添加4 µM最終濃度的ssODN供體序列。每個電穿孔反應液的最終體積為20 µL。使用非靶向性指導物作為陰性對照。
使用電穿孔裝置(程式CM-130,龍沙公司4D-NUCLEOFECTOR
TM)對該等條進行電穿孔。電穿孔後,立即將80 µL預熱的DMEM + 10% FBS添加到每個孔中,並藉由吸移輕輕混合。對於每個技術平行樣本板,將10 µL(30,000個細胞)稀釋的核轉染的細胞鋪板到預熱的96孔板中,孔中含有100 µL DMEM + 10% FBS。將編輯板在37°C和5% CO
2下孵育3天。
3天後,使用TRYPLE
TM(重組細胞解離酶;賽默飛世爾公司)對孔進行收穫並轉移至96孔TWIN.TEC® PCR板(Eppendorf)PCR板。拂掉培養基,並將細胞重懸於20 µL的DNA QUICKEXTRACT
TM(DNA提取緩衝液;盧西根公司(Lucigen))中。然後在PCR機器中使樣本在65°C下循環15 min、在68°C下循環15 min、在98°C下循環10 min。然後將樣本在-20°C冷凍。
藉由多輪PCR製備用於下一代定序(NGS)的樣本。第一輪(PCR I)用於擴增靶位點側翼的基因組區域並添加NGS銜接子。第二輪(PCR II)用於添加NGS index。然後將反應液彙集,藉由柱純化進行純化,並在螢光計(Qubit)上定量。使用150循環NGS儀器(NEXTSEQ
TMv2.5)中或高輸出套組(依諾米那公司(Illumina))運行定序,並在NGS儀器(NEXTSEQ
TM550;依諾米那公司)上運行。
[
表 9]
. ssODN 序列
ssODN 識別字 | 指導物識別字 | 待糾正的 SNP | SNP 在靶標內的位置 | 沈默突變的位置 | 總錯配數 | 同源臂長度 | ssODN 股 | ssODN 序列 |
ssODN_40_TTR_HDR_V30M_1_13-14-17 | Cas12i2_TTR_HDR_V30M_1 | V30M(V50M)c.148G>A | 13 | 14、17 | 3 | 40 | BS | CCAGAGGCAAATGGCTCCCAGGTGTCATCAGCAGCCTTTCTGAACACATGCATAGCTACATTGATGGCAGGACTGCCTCGGACAGCATCTAGAACTTTGA(SEQ ID NO: 279) |
ssODN_40_TTR_HDR_V30M_1_13-14-17-20 | Cas12i2_TTR_HDR_V30M_1 | V30M(V50M)c.148G>A | 13 | 14、17、20 | 4 | 40 | BS | CCAGAGGCAAATGGCTCCCAGGTGTCATCAGCAGCCTTTCTGAACACATGCATAGCTACGTTGATGGCAGGACTGCCTCGGACAGCATCTAGAACTTTGA(SEQ ID NO: 280) |
ssODN_40_TTR_HDR_V30M_1_13SNP | Cas12i2_TTR_HDR_V30M_1 | V30M(V50M)c.148G>A | 13 | N/A | 1 | 40 | BS | CCAGAGGCAAATGGCTCCCAGGTGTCATCAGCAGCCTTTCTGAACACATGCATGGCCACATTGATGGCAGGACTGCCTCGGACAGCATCTAGAACTTTGA(SEQ ID NO: 281) |
ssODN_40_TTR_HDR_V30M_1_平鋪 | Cas12i2_TTR_HDR_V30M_1 | V30M(V50M)c.148G>A | 13 | 1、2、5、8、 14、17、20 | 8 | 40 | BS | CCAGAGGCAAATGGCTCCCAGGTGTCATCAGCAGCCTTTCGAAATACGTGCATAGCTACGTTGATGGCAGGACTGCCTCGGACAGCATCTAGAACTTTGA(SEQ ID NO: 282) |
ssODN_40_TTR_HDR_V30M_2_2-3-6-9-14-15-18 | Cas12i2_TTR_HDR_V30M_2 | V30M(V50M)c.148G>A | 14 | 2、3、6、9、 15,18 | 7 | 40 | BS | CCCAGAGGCAAATGGCTCCCAGGTGTCATCAGCAGCCTTTCGAAATACGTGCATAGCTACATTGATGGCAGGACTGCCTCGGACAGCATCTAGAACTTTG(SEQ ID NO: 283) |
ssODN_40_TTR_HDR_V30M_2_14-15-18 | Cas12i2_TTR_HDR_V30M_2 | V30M(V50M)c.148G>A | 14 | 15,18 | 3 | 40 | BS | CCCAGAGGCAAATGGCTCCCAGGTGTCATCAGCAGCCTTTCTGAACACATGCATAGCTACATTGATGGCAGGACTGCCTCGGACAGCATCTAGAACTTTG(SEQ ID NO: 284) |
ssODN_40_TTR_HDR_V30M_2_14SNP | Cas12i2_TTR_HDR_V30M_2 | V30M(V50M)c.148G>A | 14 | N/A | 1 | 40 | BS | CCCAGAGGCAAATGGCTCCCAGGTGTCATCAGCAGCCTTTCTGAACACATGCATGGCCACATTGATGGCAGGACTGCCTCGGACAGCATCTAGAACTTTG(SEQ ID NO: 285) |
ssODN_40_TTR_HDR_V30M_2_平鋪 | Cas12i2_TTR_HDR_V30M_2 | V30M(V50M)c.148G>A | 14 | -1、2、3、6、9、15、18 | 8 | 40 | BS | CCCAGAGGCAAATGGCTCCCAGGTGTCATCAGCAGCCTTCCGAAATACGTGCATAGCTACATTGATGGCAGGACTGCCTCGGACAGCATCTAGAACTTTG(SEQ ID NO: 286) |
ssODN_40_TTR_HDR_T119M_1_--2—1-1-4-6 | Cas12i2_TTR_HDR_T119M_1 | T119M(T139M)c.416C>T | 6 | -2、-1、1、4 | 5 | 40 | TS | GCTACACCATTGCCGCCCTGCTGAGCCCCTACTCCTATAGTACTATGGCTGTCGTCACCAATCCCAAGGAATGAGGGACTTCTCCTCCAGTGGACCTGAA(SEQ ID NO: 287) |
ssODN_40_TTR_HDR_T119M_1_6-13-16-19 | Cas12i2_TTR_HDR_T119M_1 | T119M(T139M)c.416C>T | 6 | 13、16、19 | 4 | 40 | TS | GCTACACCATTGCCGCCCTGCTGAGCCCCTACTCCTATTCCACCATGGCTGTTGTTACTAATCCCAAGGAATGAGGGACTTCTCCTCCAGTGGACCTGAA(SEQ ID NO: 288) |
ssODN_40_TTR_HDR_T119M_1_6SNP | Cas12i2_TTR_HDR_T119M_1 | T119M(T139M)c.416C>T | 6 | N/A | 1 | 40 | TS | GCTACACCATTGCCGCCCTGCTGAGCCCCTACTCCTATTCCACCATGGCTGTCGTCACCAATCCCAAGGAATGAGGGACTTCTCCTCCAGTGGACCTGAA(SEQ ID NO: 289) |
ssODN_40_TTR_HDR_T119M_1_平鋪 | Cas12i2_TTR_HDR_T119M_1 | T119M(T139M)c.416C>T | 6 | -2、-1、1、4、10、13、16、19 | 9 | 40 | TS | GCTACACCATTGCCGCCCTGCTGAGCCCCTACTCCTATAGTACTATGGCCGTTGTTACTAATCCCAAGGAATGAGGGACTTCTCCTCCAGTGGACCTGAA(SEQ ID NO: 290) |
ssODN_40_TTR_HDR_T119M_2_3-6-19 | Cas12i2_TTR_HDR_T119M_2 | T119M(T139M)c.416C>T | 19 | 3,6 | 3 | 40 | BS | GTCCTTCAGGTCCACTGGAGGAGAAGTCCCTCATTCCTTGGGGTTAGTGACGACAGCCATGGTGGAATAGGAGTAGGGGCTCAGCAGGGCGGCAATGGTG(SEQ ID NO: 291) |
ssODN_40_TTR_HDR_T119M_2_12-15-19 | Cas12i2_TTR_HDR_T119M_2 | T119M(T139M)c.416C>T | 19 | 12,15 | 3 | 40 | BS | GTCCTTCAGGTCCACTGGAGGAGAAGTCCCTCATTCCTTGGGATTGGTGACAACGGCCATGGTGGAATAGGAGTAGGGGCTCAGCAGGGCGGCAATGGTG(SEQ ID NO: 292) |
ssODN_40_TTR_HDR_T119M_2_19SNP | Cas12i2_TTR_HDR_T119M_2 | T119M(T139M)c.416C>T | 19 | N/A | 1 | 40 | BS | GTCCTTCAGGTCCACTGGAGGAGAAGTCCCTCATTCCTTGGGATTGGTGACGACAGCCATGGTGGAATAGGAGTAGGGGCTCAGCAGGGCGGCAATGGTG(SEQ ID NO: 293) |
ssODN_40_TTR_HDR_T119M_2_平鋪 | Cas12i2_TTR_HDR_T119M_2 | T119M(T139M)c.416C>T | 19 | 3、6、9、12、 15 | 6 | 40 | BS | GTCCTTCAGGTCCACTGGAGGAGAAGTCCCTCATTCCTTGGGGTTAGTAACAACGGCCATGGTGGAATAGGAGTAGGGGCTCAGCAGGGCGGCAATGGTG(SEQ ID NO: 294) |
ssODN_40_TTR_HDR_V122I_1_1-4-7-10-13-14-19 | Cas12i2_TTR_HDR_V122I_1 | V122I(V142I)c.424G>A | 14 | 1、4、7、10、 13,19 | 7 | 40 | TS | GCTACACCATTGCCGCCCTGCTGAGCCCCTACTCCTATTCTACTACAGCCGTTATCACTAATCCCAAGGAATGAGGGACTTCTCCTCCAGTGGACCTGAA(SEQ ID NO: 295) |
ssODN_40_TTR_HDR_V122I_1_13-14-19 | Cas12i2_TTR_HDR_V122I_1 | V122I(V142I)c.424G>A | 14 | 13,19 | 3 | 40 | TS | GCTACACCATTGCCGCCCTGCTGAGCCCCTACTCCTATTCCACCACGGCTGTTATCACTAATCCCAAGGAATGAGGGACTTCTCCTCCAGTGGACCTGAA(SEQ ID NO: 296) |
ssODN_40_TTR_HDR_V122I_1_14SNP | Cas12i2_TTR_HDR_V122I_1 | V122I(V142I)c.424G>A | 14 | N/A | 1 | 40 | TS | GCTACACCATTGCCGCCCTGCTGAGCCCCTACTCCTATTCCACCACGGCTGTCATCACCAATCCCAAGGAATGAGGGACTTCTCCTCCAGTGGACCTGAA(SEQ ID NO: 297) |
ssODN_40_TTR_HDR_V122I_1_平鋪 | Cas12i2_TTR_HDR_V122I_1 | V122I(V142I)c.424G>A | 14 | -2、-1、1、4、7、 10、13、19 | 9 | 40 | TS | GCTACACCATTGCCGCCCTGCTGAGCCCCTACTCCTATAGTACTACAGCCGTTATCACTAATCCCAAGGAATGAGGGACTTCTCCTCCAGTGGACCTGAA(SEQ ID NO: 298) |
ssODN_40_TTR_HDR_V122I_3_11-12-15 | Cas12i2_TTR_HDR_V122I_3 | V122I(V142I)c.424G>A | 11 | 12,15 | 3 | 40 | BS | GTCCTTCAGGTCCACTGGAGGAGAAGTCCCTCATTCCTTGGGATTGGTGATAACGGCCGTGGTGGAATAGGAGTAGGGGCTCAGCAGGGCGGCAATGGTG(SEQ ID NO: 299) |
ssODN_40_TTR_HDR_V122I_3_11-12-15-18 | Cas12i2_TTR_HDR_V122I_3 | V122I(V142I)c.424G>A | 11 | 12、15、18 | 4 | 40 | BS | GTCCTTCAGGTCCACTGGAGGAGAAGTCCCTCATTCCTTGGGATTGGTGATAACGGCTGTGGTGGAATAGGAGTAGGGGCTCAGCAGGGCGGCAATGGTG(SEQ ID NO: 300) |
ssODN_40_TTR_HDR_V122I_3_11SNP | Cas12i2_TTR_HDR_V122I_3 | V122I(V142I)c.424G>A | 11 | N/A | 1 | 40 | BS | GTCCTTCAGGTCCACTGGAGGAGAAGTCCCTCATTCCTTGGGATTGGTGATGACAGCCGTGGTGGAATAGGAGTAGGGGCTCAGCAGGGCGGCAATGGTG(SEQ ID NO: 301) |
ssODN_40_TTR_HDR_V122I_3_平鋪 | Cas12i2_TTR_HDR_V122I_3 | V122I(V142I)c.424G>A | 11 | 3、6、12、15、18 | 6 | 40 | BS | GTCCTTCAGGTCCACTGGAGGAGAAGTCCCTCATTCCTTGGGGTTAGTGATAACGGCTGTGGTGGAATAGGAGTAGGGGCTCAGCAGGGCGGCAATGGTG(SEQ ID NO: 302) |
ssODN_50_TTR_HDR_T119M_1_--2—1-1-4-6 | Cas12i2_TTR_HDR_T119M_1 | T119M(T139M)c.416C>T | 6 | -2、-1、1、4 | 5 | 50 | TS | GGCCCCCGCCGCTACACCATTGCCGCCCTGCTGAGCCCCTACTCCTATAGTACTATGGCTGTCGTCACCAATCCCAAGGAATGAGGGACTTCTCCTCCAGTGGACCTGAAGGACGAGGGA(SEQ ID NO: 303) |
ssODN_50_TTR_HDR_T119M_1_6-13-16-19 | Cas12i2_TTR_HDR_T119M_1 | T119M(T139M)c.416C>T | 6 | 13、16、19 | 4 | 50 | TS | GGCCCCCGCCGCTACACCATTGCCGCCCTGCTGAGCCCCTACTCCTATTCCACCATGGCTGTTGTTACTAATCCCAAGGAATGAGGGACTTCTCCTCCAGTGGACCTGAAGGACGAGGGA(SEQ ID NO: 304) |
ssODN_50_TTR_HDR_T119M_1_6SNP | Cas12i2_TTR_HDR_T119M_1 | T119M(T139M)c.416C>T | 6 | N/A | 1 | 50 | TS | GGCCCCCGCCGCTACACCATTGCCGCCCTGCTGAGCCCCTACTCCTATTCCACCATGGCTGTCGTCACCAATCCCAAGGAATGAGGGACTTCTCCTCCAGTGGACCTGAAGGACGAGGGA(SEQ ID NO: 305) |
ssODN_50_TTR_HDR_T119M_1_平鋪 | Cas12i2_TTR_HDR_T119M_1 | T119M(T139M)c.416C>T | 6 | -2、-1、1、4、10、 13、16、19 | 9 | 50 | TS | GGCCCCCGCCGCTACACCATTGCCGCCCTGCTGAGCCCCTACTCCTATAGTACTATGGCCGTTGTTACTAATCCCAAGGAATGAGGGACTTCTCCTCCAGTGGACCTGAAGGACGAGGGA(SEQ ID NO: 306) |
ssODN_50_TTR_HDR_T119M_2_3-6-19 | Cas12i2_TTR_HDR_T119M_2 | T119M(T139M)c.416C>T | 19 | 3,6 | 3 | 50 | BS | CCCATCCCTCGTCCTTCAGGTCCACTGGAGGAGAAGTCCCTCATTCCTTGGGGTTAGTGACGACAGCCATGGTGGAATAGGAGTAGGGGCTCAGCAGGGCGGCAATGGTGTAGCGGCGGG(SEQ ID NO: 307) |
ssODN_50_TTR_HDR_T119M_2_12-15-19 | Cas12i2_TTR_HDR_T119M_2 | T119M(T139M)c.416C>T | 19 | 12,15 | 3 | 50 | BS | CCCATCCCTCGTCCTTCAGGTCCACTGGAGGAGAAGTCCCTCATTCCTTGGGATTGGTGACAACGGCCATGGTGGAATAGGAGTAGGGGCTCAGCAGGGCGGCAATGGTGTAGCGGCGGG(SEQ ID NO: 308) |
ssODN_50_TTR_HDR_T119M_2_19SNP | Cas12i2_TTR_HDR_T119M_2 | T119M(T139M)c.416C>T | 19 | N/A | 1 | 50 | BS | CCCATCCCTCGTCCTTCAGGTCCACTGGAGGAGAAGTCCCTCATTCCTTGGGATTGGTGACGACAGCCATGGTGGAATAGGAGTAGGGGCTCAGCAGGGCGGCAATGGTGTAGCGGCGGG(SEQ ID NO: 309) |
ssODN_50_TTR_HDR_T119M_2_平鋪 | Cas12i2_TTR_HDR_T119M_2 | T119M(T139M)c.416C>T | 19 | 3、6、9、12、 15 | 6 | 50 | BS | CCCATCCCTCGTCCTTCAGGTCCACTGGAGGAGAAGTCCCTCATTCCTTGGGGTTAGTAACAACGGCCATGGTGGAATAGGAGTAGGGGCTCAGCAGGGCGGCAATGGTGTAGCGGCGGG(SEQ ID NO: 310) |
ssODN_50_TTR_HDR_V30M_1_13-14-17 | Cas12i2_TTR_HDR_V30M_1 | V30M(V50M)c.148G>A | 13 | 14,17 | 3 | 50 | BS | GGCAACTTACCCAGAGGCAAATGGCTCCCAGGTGTCATCAGCAGCCTTTCTGAACACATGCATAGCTACATTGATGGCAGGACTGCCTCGGACAGCATCTAGAACTTTGACCATCAGAGG(SEQ ID NO: 311) |
ssODN_50_TTR_HDR_V30M_1_13-14-17-20 | Cas12i2_TTR_HDR_V30M_1 | V30M(V50M)c.148G>A | 13 | 14、17、20 | 4 | 50 | BS | GGCAACTTACCCAGAGGCAAATGGCTCCCAGGTGTCATCAGCAGCCTTTCTGAACACATGCATAGCTACGTTGATGGCAGGACTGCCTCGGACAGCATCTAGAACTTTGACCATCAGAGG(SEQ ID NO: 312) |
ssODN_50_TTR_HDR_V30M_1_13SNP | Cas12i2_TTR_HDR_V30M_1 | V30M(V50M)c.148G>A | 13 | N/A | 1 | 50 | BS | GGCAACTTACCCAGAGGCAAATGGCTCCCAGGTGTCATCAGCAGCCTTTCTGAACACATGCATGGCCACATTGATGGCAGGACTGCCTCGGACAGCATCTAGAACTTTGACCATCAGAGG(SEQ ID NO: 313) |
ssODN_50_TTR_HDR_V30M_1_平鋪 | Cas12i2_TTR_HDR_V30M_1 | V30M(V50M)c.148G>A | 13 | 1、2、5、8、 14、17、20 | 8 | 50 | BS | GGCAACTTACCCAGAGGCAAATGGCTCCCAGGTGTCATCAGCAGCCTTTCGAAATACGTGCATAGCTACGTTGATGGCAGGACTGCCTCGGACAGCATCTAGAACTTTGACCATCAGAGG(SEQ ID NO: 314) |
ssODN_50_TTR_HDR_V30M_2_2-3-6-9-14-15-18 | Cas12i2_TTR_HDR_V30M_2 | V30M(V50M)c.148G>A | 14 | 2、3、6、9、 15,18 | 7 | 50 | BS | TGGCAACTTACCCAGAGGCAAATGGCTCCCAGGTGTCATCAGCAGCCTTTCGAAATACGTGCATAGCTACATTGATGGCAGGACTGCCTCGGACAGCATCTAGAACTTTGACCATCAGAG(SEQ ID NO: 315) |
ssODN_50_TTR_HDR_V30M_2_14-15-18 | Cas12i2_TTR_HDR_V30M_2 | V30M(V50M)c.148G>A | 14 | 15,18 | 3 | 50 | BS | TGGCAACTTACCCAGAGGCAAATGGCTCCCAGGTGTCATCAGCAGCCTTTCTGAACACATGCATAGCTACATTGATGGCAGGACTGCCTCGGACAGCATCTAGAACTTTGACCATCAGAG(SEQ ID NO: 316) |
ssODN_50_TTR_HDR_V30M_2_14SNP | Cas12i2_TTR_HDR_V30M_2 | V30M(V50M)c.148G>A | 14 | N/A | 1 | 50 | BS | TGGCAACTTACCCAGAGGCAAATGGCTCCCAGGTGTCATCAGCAGCCTTTCTGAACACATGCATGGCCACATTGATGGCAGGACTGCCTCGGACAGCATCTAGAACTTTGACCATCAGAG(SEQ ID NO: 317) |
ssODN_50_TTR_HDR_V30M_2_平鋪 | Cas12i2_TTR_HDR_V30M_2 | V30M(V50M)c.148G>A | 14 | -1、2、3、6、9、15、18 | 8 | 50 | BS | TGGCAACTTACCCAGAGGCAAATGGCTCCCAGGTGTCATCAGCAGCCTTCCGAAATACGTGCATAGCTACATTGATGGCAGGACTGCCTCGGACAGCATCTAGAACTTTGACCATCAGAG(SEQ ID NO: 318) |
ssODN_50_TTR_HDR_V122I_1_1-4-7-10-13-14-19 | Cas12i2_TTR_HDR_V122I_1 | V122I(V142I)c.424G>A | 14 | 1、4、7、10、 13,19 | 7 | 50 | TS | GGCCCCCGCCGCTACACCATTGCCGCCCTGCTGAGCCCCTACTCCTATTCTACTACAGCCGTTATCACTAATCCCAAGGAATGAGGGACTTCTCCTCCAGTGGACCTGAAGGACGAGGGA(SEQ ID NO: 319) |
ssODN_50_TTR_HDR_V122I_1_13-14-19 | Cas12i2_TTR_HDR_V122I_1 | V122I(V142I)c.424G>A | 14 | 13,19 | 3 | 50 | TS | GGCCCCCGCCGCTACACCATTGCCGCCCTGCTGAGCCCCTACTCCTATTCCACCACGGCTGTTATCACTAATCCCAAGGAATGAGGGACTTCTCCTCCAGTGGACCTGAAGGACGAGGGA(SEQ ID NO: 320) |
ssODN_50_TTR_HDR_V122I_1_14SNP | Cas12i2_TTR_HDR_V122I_1 | V122I(V142I)c.424G>A | 14 | N/A | 1 | 50 | TS | GGCCCCCGCCGCTACACCATTGCCGCCCTGCTGAGCCCCTACTCCTATTCCACCACGGCTGTCATCACCAATCCCAAGGAATGAGGGACTTCTCCTCCAGTGGACCTGAAGGACGAGGGA(SEQ ID NO: 321) |
ssODN_50_TTR_HDR_V122I_1_tiled | Cas12i2_TTR_HDR_V122I_1 | V122I(V142I)c.424G>A | 14 | -2、-1、1、4、7、 10、13、19 | 9 | 50 | TS | GGCCCCCGCCGCTACACCATTGCCGCCCTGCTGAGCCCCTACTCCTATAGTACTACAGCCGTTATCACTAATCCCAAGGAATGAGGGACTTCTCCTCCAGTGGACCTGAAGGACGAGGGA(SEQ ID NO: 322) |
ssODN_50_TTR_HDR_V122I_3_11-12-15 | Cas12i2_TTR_HDR_V122I_3 | V122I(V142I)c.424G>A | 11 | 12,15 | 3 | 50 | BS | CCCATCCCTCGTCCTTCAGGTCCACTGGAGGAGAAGTCCCTCATTCCTTGGGATTGGTGATAACGGCCGTGGTGGAATAGGAGTAGGGGCTCAGCAGGGCGGCAATGGTGTAGCGGCGGG(SEQ ID NO: 323) |
ssODN_50_TTR_HDR_V122I_3_11-12-15-18 | Cas12i2_TTR_HDR_V122I_3 | V122I(V142I)c.424G>A | 11 | 12、15、18 | 4 | 50 | BS | CCCATCCCTCGTCCTTCAGGTCCACTGGAGGAGAAGTCCCTCATTCCTTGGGATTGGTGATAACGGCTGTGGTGGAATAGGAGTAGGGGCTCAGCAGGGCGGCAATGGTGTAGCGGCGGG(SEQ ID NO: 324) |
ssODN_50_TTR_HDR_V122I_3_11SNP | Cas12i2_TTR_HDR_V122I_3 | V122I(V142I)c.424G>A | 11 | N/A | 1 | 50 | BS | CCCATCCCTCGTCCTTCAGGTCCACTGGAGGAGAAGTCCCTCATTCCTTGGGATTGGTGATGACAGCCGTGGTGGAATAGGAGTAGGGGCTCAGCAGGGCGGCAATGGTGTAGCGGCGGG(SEQ ID NO: 325) |
ssODN_50_TTR_HDR_V122I_3_tiled | Cas12i2_TTR_HDR_V122I_3 | V122I(V142I)c.424G>A | 11 | 3、6、12、15、18 | 6 | 50 | BS | CCCATCCCTCGTCCTTCAGGTCCACTGGAGGAGAAGTCCCTCATTCCTTGGGGTTAGTGATAACGGCTGTGGTGGAATAGGAGTAGGGGCTCAGCAGGGCGGCAATGGTGTAGCGGCGGG(SEQ ID NO: 326) |
對於NGS分析,***缺失映射功能使用樣本的fastq檔、擴增子參考序列、和正向引物序列。對於每個讀段,使用kmer掃描演算法來計算讀段與參考序列之間的編輯操作(匹配、錯配、***、缺失)。為了去除一些樣本中存在的少量引物二聚體,每個讀段的前30 nt需要與參考匹配,並且超過一半的映射核苷酸為錯配的讀段也被濾除。通過該等過濾器的多達50,000個讀段用於分析,並且如果讀段含有***或缺失,則將其計為***缺失讀數。***缺失%計算為含有***缺失的讀段數目除以分析的讀段數目(藉由過濾器的讀段多達50,000個)。完全HDR整合%計算為含有整個整合的ssODN序列的讀段數目除以分析的讀段數目(藉由過濾器的讀段多達50,000個)。部分HDR整合%計算為含有與指導物序列重疊的20 bp ssODN序列的讀段數目除以分析的讀段數目(藉由過濾器的讀段多達50,000個)。總編輯%藉由將***缺失%與完全HDR整合%相加來計算。總之,完全HDR整合%代表整個ssODN供體被整合到正確的基因組位置的讀段數目,而部分HDR整合%代表含有與指導物序列重疊的20 bp ssODN序列(即含有SNP的區域)的任何讀段(有或沒有***缺失)。通過過濾器的最小讀段數目的QC標準係10,000。
圖 2顯示了用Cas12i2進行RNP轉染後在HEK293T細胞中V30M基因座處的HDR模板化取代的效率。
圖 3顯示了用Cas12i2進行RNP轉染後在HEK293T細胞中V122I基因座處的HDR模板化取代的效率。
圖 4顯示了用Cas12i2進行RNP轉染後在HEK293T細胞中T119M基因座處的HDR模板化取代的效率。黑色條反映在一個生物平行樣本中測量的平均完全HDR整合編輯%,淺灰色條反映平均部分SNP整合編輯%,並且中灰色條代表總編輯%(上述)。誤差條代表三個技術平行樣本的平均值。
如
圖 2、
圖 3、和
圖 4所顯示,觀察到了包含至少三個SNP的ssODN供體完全整合的顯著水平。單個SNP ssODN供體樣本中較低的完全HDR整合%可能是由於RNA指導物的重新靶向水平較高。
本實例顯示了可以用Cas12i2經由HDR將SNP引入到TTR靶位點內。例如,可以將與疾病相關的保護性SNP(例如,T119M)引入到TTR基因中。此外,可以使用這種方法糾正與疾病相關的SNP(例如,V30M和V122I)。
實例 3 - HEK293T 細胞中 Cas12i2 介導的 TTR 靶位點的編輯
本實例描述了使用引入到HEK293T細胞中的Cas12i2藉由RNP對TTR基因進行基因組編輯。
Cas12i2 RNA指導物(crRNA)由綜合DNA技術公司(IDT)設計,並訂購自該公司。將crRNA在250 mM NaCl中重懸至1 mM的最終濃度。靶標和RNA指導物序列顯示在
表 10中。
[
表 10]
. TTR 靶標和 RNA 指導物序列
*:TTN 3-nt PAM模體呈粗體。
靶標 | PAM 序列 * | 靶序列 | crRNA 序列 |
E1T1 | C TTC | TCATCGTCTGCTCCTCCTCT(SEQ ID NO: 327) | AGAAAUCCGUCUUUCAUUGACGGUCAUCGUCUGCUCCUCCUCU(SEQ ID NO: 345) |
E2T1 | C TTC | TCTACACCCAGGGCACCGGT(SEQ ID NO: 328) | AGAAAUCCGUCUUUCAUUGACGGUCUACACCCAGGGCACCGGU(SEQ ID NO: 346) |
E2T2 | C TTT | GACCATCAGAGGACACTTGG(SEQ ID NO: 329) | AGAAAUCCGUCUUUCAUUGACGGGACCAUCAGAGGACACUUGG(SEQ ID NO: 347) |
E2T3 | G TTC | TAGATGCTGTCCGAGGCAGT(SEQ ID NO: 330) | AGAAAUCCGUCUUUCAUUGACGGUAGAUGCUGUCCGAGGCAGU(SEQ ID NO: 348) |
E2T4 | G TTC | AGAAAGGCTGCTGATGACAC(SEQ ID NO: 331) | AGAAAUCCGUCUUUCAUUGACGGAGAAAGGCUGCUGAUGACAC(SEQ ID NO: 349) |
E2T5 | C TTT | CTGAACACATGCACGGCCAC(SEQ ID NO: 332) | AGAAAUCCGUCUUUCAUUGACGGCUGAACACAUGCACGGCCAC(SEQ ID NO: 350) |
E2T6 | C TTT | GGCAACTTACCCAGAGGCAA(SEQ ID NO: 333) | AGAAAUCCGUCUUUCAUUGACGGGGCAACUUACCCAGAGGCAA(SEQ ID NO: 351) |
E2T7 | G TTC | TTTGGCAACTTACCCAGAGG(SEQ ID NO: 334) | AGAAAUCCGUCUUUCAUUGACGGUUUGGCAACUUACCCAGAGG(SEQ ID NO: 352) |
E3T1 | C TTT | CACACCTTATAGGAAAACCA(SEQ ID NO: 335) | AGAAAUCCGUCUUUCAUUGACGGCACACCUUAUAGGAAAACCA(SEQ ID NO: 353) |
E3T2 | C TTC | TACAAATTCCTCCTCAGTTG(SEQ ID NO: 336) | AGAAAUCCGUCUUUCAUUGACGGUACAAAUUCCUCCUCAGUUG(SEQ ID NO: 354) |
E3T3 | C TTT | GTATATCCCTTCTACAAATT(SEQ ID NO: 337) | AGAAAUCCGUCUUUCAUUGACGGGUAUAUCCCUUCUACAAAUU(SEQ ID NO: 355) |
E3T4 | C TTC | CAGTAAGATTTGGTGTCTAT(SEQ ID NO: 338) | AGAAAUCCGUCUUUCAUUGACGGCAGUAAGAUUUGGUGUCUAU(SEQ ID NO: 356) |
E4T1 | A TTG | CCGCCCTGCTGAGCCCCTAC(SEQ ID NO: 339) | AGAAAUCCGUCUUUCAUUGACGGCCGCCCUGCUGAGCCCCUAC(SEQ ID NO: 357) |
E4T2 | A TTC | CACCACGGCTGTCGTCACCA(SEQ ID NO: 340) | AGAAAUCCGUCUUUCAUUGACGGCACCACGGCUGUCGUCACCA(SEQ ID NO: 358) |
E4T3 | A TTG | GTGACGACAGCCGTGGTGGA(SEQ ID NO: 341) | AGAAAUCCGUCUUUCAUUGACGGGUGACGACAGCCGUGGUGGA(SEQ ID NO: 359) |
E4T4 | C TTG | GGATTGGTGACGACAGCCGT(SEQ ID NO: 342) | AGAAAUCCGUCUUUCAUUGACGGGGAUUGGUGACGACAGCCGU(SEQ ID NO: 360) |
E4T5 | A TTC | CTTGGGATTGGTGACGACAG(SEQ ID NO: 343) | AGAAAUCCGUCUUUCAUUGACGGCUUGGGAUUGGUGACGACAG(SEQ ID NO: 361) |
E4T6 | C TTC | AGGTCCACTGGAGGAGAAGT(SEQ ID NO: 344) | AGAAAUCCGUCUUUCAUUGACGGAGGUCCACUGGAGGAGAAGU(SEQ ID NO: 362) |
Cas12i2 RNP複合反應係藉由以下進行的:將純化的Cas12i2多肽(400 µM)與crRNA(在250 mM NaCl中1 mM)以1 : 1(Cas12i2多肽 : crRNA)的體積比(2.5 : 1的crRNA : Cas12i2多肽莫耳比)混合。將複合反應在冰上孵育30-60 min。
孵育期間,使用TRYPLE
TM(重組細胞解離酶;賽默飛世爾公司)收穫HEK293T細胞並計數。將細胞用PBS洗滌一次並重懸於SF緩衝液 + 補充劑(SF細胞系4D-NUCLEOFECTOR
TMX套組S;龍沙公司(Lonza)編號V4XC-2032)中,濃度為16,480個細胞/µL。以3e5個細胞/反應液將重懸的細胞分配到龍沙公司的16孔NUCLEOCUVETTE®條中。將複合的Cas12i2 RNP以10 µM的最終濃度添加到每個反應液中。使用非靶向性指導物作為陰性對照。
使用電穿孔裝置(程式CM-130,龍沙公司4D-NUCLEOFECTOR
TM)對該等條進行電穿孔。電穿孔後,立即將80 µL預熱的DMEM + 10% FBS添加到每個孔中,並藉由吸移輕輕混合。對於每個技術平行樣本板,將10 µL(30,000個細胞)稀釋的核轉染的細胞鋪板到預熱的96孔板中,孔中含有100 µL DMEM + 10% FBS。將編輯板在37°C和5% CO
2下孵育3天。
3天後,使用TRYPLE
TM(重組細胞解離酶;賽默飛世爾公司)對孔進行收穫並轉移至96孔TWIN.TEC® PCR板(Eppendorf)PCR板。拂掉培養基,並將細胞重懸於20 µL的QUICKEXTRACT
TM(DNA提取緩衝液;盧西根公司(Lucigen))中。然後在PCR機器中使樣本在65°C下循環15 min、在68°C下循環15 min、在98°C下循環10 min。然後將樣本在-20°C冷凍。
藉由多輪PCR製備用於下一代定序(NGS)的樣本。第一輪(PCR I)用於擴增靶位點側翼的基因組區域並添加NGS銜接子。第二輪(PCR II)用於添加NGS index。然後將反應液彙集,藉由柱純化進行純化,並在螢光計(Qubit)上定量。使用150循環NGS儀器(NEXTSEQ
TMv2.5)中或高輸出套組(依諾米那公司(Illumina))運行定序,並在NGS儀器(NEXTSEQ
TM550;依諾米那公司)上運行。
對於NGS分析,***缺失映射功能使用樣本的fastq檔、擴增子參考序列、和正向引物序列。對於每個讀段,使用kmer掃描演算法來計算讀段與參考序列之間的編輯操作(匹配、錯配、***、缺失)。為了去除一些樣本中存在的少量引物二聚體,每個讀段的前30 nt需要與參考匹配,並且超過一半的映射核苷酸為錯配的讀段也被濾除。通過該等過濾器的多達50,000個讀段用於分析,並且如果讀段含有***或缺失,則將其計為***缺失讀數。***缺失%計算為含有***缺失的讀段數目除以分析的讀段數目(藉由過濾器的讀段多達50,000個)。通過過濾器的最小讀段數目的QC標準係10,000。
圖 6顯示了RNP遞送後HEK293T細胞中的TTR中的***缺失。誤差條代表一個生物平行樣本中三個技術平行樣本的平均值。遞送後,在18個測試的TTR靶序列中的每一個中檢測到***缺失。在14個RNA指導物(E2T3、E3T3、和E4T6)的至少40%的NGS讀段中檢測到***缺失。在3個RNA指導物(E2T3、E3T3、和E4T6)的至少80%的NGS讀段中檢測到***缺失。
因此,本實例顯示了在哺乳動物細胞(如HEK293T細胞)中,Cas12i2 RNP可以靶向TTR的外顯子1、外顯子2、外顯子3、和外顯子4。
實例 4 - HepG2 細胞中 Cas12i2 介導的 TTR 靶位點的編輯
本實例描述了使用引入到HepG2細胞中的Cas12i2藉由RNP對TTR基因進行基因組編輯。
Cas12i2 RNP複合反應係藉由以下進行的:將純化的Cas12i2多肽與表8的靶向TTR的crRNA以2.5 : 1的crRNA : Cas12i2莫耳比混合。將複合反應在冰上孵育30-60 min。
使用TRYPLE
TM(重組細胞解離酶;賽默飛世爾公司)收穫HepG2細胞並計數。將細胞用PBS洗滌一次並重懸於SF緩衝液 + 補充劑(SF細胞系4D-NUCLEOFECTOR
TMX套組S;龍沙公司(Lonza)編號V4XC-2032)中,濃度為13,889個細胞/µL。以2.5e5個細胞/反應液將重懸的細胞分配到龍沙公司的16孔NUCLEOCUVETTE®條中。在沒有轉染增強寡聚物的情況下,將複合的Cas12i2 RNP以20 µM(Cas12i2)的最終濃度添加到每個反應液中。每個電穿孔反應液的最終體積為20 µL。使用非靶向性指導物作為陰性對照。
使用電穿孔裝置(程式DJ-100,龍沙公司4D-NUCLEOFECTOR
TM)對該等條進行電穿孔。電穿孔後,立即將80 µL預熱的EMEM + 10% FBS添加到每個孔中,並藉由吸移輕輕混合。對於每個技術平行樣本板,將10 µL(25,000個細胞)稀釋的核轉染的細胞鋪板到預熱的96孔板中,孔中含有100 µL EMEM + 10% FBS。將編輯板在37°C和5% CO
2下孵育3天。
3天後,使用TRYPLE
TM(重組細胞解離酶;賽默飛世爾公司)對孔進行收穫並轉移至96孔TWIN.TEC® PCR板(Eppendorf)。拂掉培養基,並將細胞重懸於20 µL的QUICKEXTRACT
TM(DNA提取緩衝液;盧西根公司)中。然後在PCR機器中使樣本在65°C下循環15 min、在68°C下循環15 min、在98°C下循環10 min。然後如實例1所述將樣本在-20°C冷凍並藉由NGS分析。
圖 7顯示了在RNP遞送後在HepG2細胞中的TTR靶位點中包含***缺失的NGS讀段的百分比。誤差條代表一個生物平行樣本中三個技術平行樣本的平均值。遞送後,在18個測試的TTR靶位點中的17個中檢測到***缺失。在6個RNA指導物(E1T1、E2T1、E2T3、E2T5、E3T3、和E3T4)的至少80%的NGS讀段中檢測到***缺失。
因此,本實例顯示了在哺乳動物細胞(如HepG2細胞)中,Cas12i2 RNP可以靶向TTR的外顯子1、外顯子2、外顯子3、和外顯子4。
實例 5 - 原代肝細胞中 Cas12i2 介導的 TTR 靶位點的編輯
本實例描述了使用引入到原代肝細胞中的Cas12i2藉由RNP對TTR的基因組編輯。
Cas12i2 RNP複合反應如實例3中所述使用14個被鑒定為在HepG2細胞中具有活性的RNA指導物進行。
將來自人供體的原代肝細胞在37°C水浴中迅速從液氮中解凍。將細胞添加到預熱的肝細胞回收培養基(賽默飛世爾公司,CM7000)並以100 g離心10分鐘。將細胞沈澱重懸於適當體積的肝細胞鋪板培養基(對威廉斯氏培養基E(Williams’ Medium E,賽默飛世爾公司A1217601)補充肝細胞鋪板補充包(Hepatocyte Plating Supplement Pack)(含血清),賽默飛世爾公司CM3000)中。使用INCUCYTE®一次性血細胞計數器(飛世爾科技公司(Fisher Scientific),22-600-100)對細胞進行台盼藍活力計數。然後將細胞在PBS中洗滌並重懸於P3緩衝液 + 補充劑(P3原代細胞4D-NUCLEOFECTOR
TMX套組S;龍沙公司,VXP-3032)中,濃度為約7,500個細胞/µL。以150,000個細胞/反應液將重懸的細胞分配到龍沙公司的16孔NUCLEOCUVETTE®條中。將複合的Cas12i2 RNP以20 µM(Cas12i2)的最終濃度添加到每個反應液中,然後添加4 µM最終濃度的轉染增強寡聚物。每個電穿孔反應液的最終體積為20 µL。使用非靶向性指導物作為陰性對照。
使用電穿孔裝置(程式DS-150,龍沙公司4D-NUCLEOFECTOR
TM)對該等條進行電穿孔。電穿孔後,立即將45 µL預熱的肝細胞鋪板培養基添加到每個孔中,並藉由吸移輕輕混合。對於每個技術平行樣本板,將65 µL(150,000個細胞)稀釋的核轉染的細胞鋪板到預熱的膠原包被的96孔板(賽默飛世爾公司)中,孔中含有60 µL的肝細胞鋪板培養基。然後將細胞在37°C的培養箱中孵育。4小時後細胞附著後,將培養基更換為肝細胞維持培養基(對威廉斯氏培養基E(賽默飛世爾公司A1217601)補充威廉斯氏E培養基細胞維持混合物(賽默飛世爾公司CM 4000))。在RNP電穿孔後1天、3天和5天更換新鮮的肝細胞維持培養基。
在RNP電穿孔後3天或7天,藉由以下收穫細胞:收集培養基並藉由與溶解在含有Ca/Mg的PBS(賽默飛世爾公司)中的2 mg/ml膠原酶IV(賽默飛世爾公司,17104019)在37°C培養箱中振盪(500 rpm)來分離細胞。細胞從板中解離後,將它們轉移至96孔TWIN.TEC® PCR板(Eppendorf)並離心。拂掉培養基,並將細胞重懸於20 µL的QUICKEXTRACT
TM(DNA提取緩衝液;盧西根公司(Lucigen))中。然後在PCR機器中使樣本在65°C下循環15 min、在68°C下循環15 min、在98°C下循環10 min。然後如實例1所述將樣本在-20°C冷凍並藉由NGS分析。
在電穿孔後7天收穫細胞時,將來自每個孔的培養基以100 g離心10分鐘並將上清液儲存在-80°C用於隨後的ELISA測定。按照製造商的說明,將來自每種條件的細胞培養上清液稀釋至最佳稀釋度(1 : 20)並進行TTR ELISA(人)(奧維亞生物技術有限公司(Aviva Systems Biology),OKBB01176)。
如
圖 8A顯示,每個測試的靶向TTR的RNA指導物在TTR靶位點中誘導了***缺失。非靶向性對照沒有誘導出***缺失。14個測試的TTR靶標中有5個在超過90%的NGS讀段中測量到***缺失。在RNP電穿孔後長達7天,原代人肝細胞保留了***缺失。
如
圖 8B顯示,每個測試的RNP在原代人肝細胞中誘導了***缺失並降低了TTR蛋白水平。黑色數據點對應於與非人靈長類動物中的TTR序列同源的TTR靶標;灰色數據點對應於與非人靈長類動物中的TTR序列不同源的TTR靶標。14個RNA指導物中的11個在超過60%的NGS讀段中誘導了***缺失,並且相對於非靶向性對照將TTR蛋白水平降低了至少60%。RNA指導物E1T1、E2T3、E2T5、E3T3、和E3T4在超過80%的NGS讀段中誘導了***缺失,並且相對於非靶向性對照將TTR蛋白水平降低了至少80%。
因此,本實例顯示在哺乳動物細胞(如原代人肝細胞)中,TTR可以被Cas12i2 RNP靶向。
實例 6 - 用 Cas12i2 和 Cas12i4 靶向 HepG2 細胞中的 TTR 靶序列
本實例描述了使用藉由暫態轉染引入至HepG2細胞中的變體對多個TTR靶標進行的***缺失評估。
將SEQ ID NO: 224和SEQ ID NO: 227的Cas12i2變體以及SEQ ID NO: 255的Cas12i4變體單獨選殖至pcda3.1骨架(英傑公司(Invitrogen))中。將編碼RNA指導物的核酸選殖到pUC19骨架(新英格蘭生物實驗室公司(New England Biolabs))中。然後將質體大量製備並且稀釋。RNA指導物和靶序列顯示在
表 11中。
[
表 11]
. TTR 靶序列和對應的 crRNA
靶標識別字 | 靶序列 | Cas12i2 crRNA 序列 | Cas12i4 crRNA 序列 |
E1T1 | TCATCGTCTGCTCCTCCTCT(SEQ ID NO: 327) | AGAAAUCCGUCUUUCAUUGACGGUCAUCGUCUGCUCCUCCUCU(SEQ ID NO: 345) | AGACAUGUGUCCUCAGUGACACUCAUCGUCUGCUCCUCCUCU(SEQ ID NO: 386) |
E1T2 | TTGGCAGGATGGCTTCTCAT(SEQ ID NO: 363) | AGAAAUCCGUCUUUCAUUGACGGUUGGCAGGAUGGCUUCUCAU(SEQ ID NO: 375) | AGACAUGUGUCCUCAGUGACACUUGGCAGGAUGGCUUCUCAU(SEQ ID NO: 387) |
E1T3 | GCAGGATGGCTTCTCATCGT(SEQ ID NO: 364) | AGAAAUCCGUCUUUCAUUGACGGGCAGGAUGGCUUCUCAUCGU(SEQ ID NO: 376) | AGACAUGUGUCCUCAGUGACACGCAGGAUGGCUUCUCAUCGU(SEQ ID NO: 388) |
E2T1 | TCTACACCCAGGGCACCGGT(SEQ ID NO: 328) | AGAAAUCCGUCUUUCAUUGACGGUCUACACCCAGGGCACCGGU(SEQ ID NO: 346) | AGACAUGUGUCCUCAGUGACACUCUACACCCAGGGCACCGGU(SEQ ID NO: 389) |
E2T2 | GACCATCAGAGGACACTTGG(SEQ ID NO: 329) | AGAAAUCCGUCUUUCAUUGACGGGACCAUCAGAGGACACUUGG(SEQ ID NO: 347) | AGACAUGUGUCCUCAGUGACACGACCAUCAGAGGACACUUGG(SEQ ID NO: 390) |
E2T3 | TAGATGCTGTCCGAGGCAGT(SEQ ID NO: 330) | AGAAAUCCGUCUUUCAUUGACGGUAGAUGCUGUCCGAGGCAGU(SEQ ID NO: 348) | AGACAUGUGUCCUCAGUGACACUAGAUGCUGUCCGAGGCAGU(SEQ ID NO: 391) |
E2T8 | ACCATCAGAGGACACTTGGA(SEQ ID NO: 365) | AGAAAUCCGUCUUUCAUUGACGGACCAUCAGAGGACACUUGGA(SEQ ID NO: 377) | AGACAUGUGUCCUCAGUGACACACCAUCAGAGGACACUUGGA(SEQ ID NO: 392) |
E3T1 | CACACCTTATAGGAAAACCA(SEQ ID NO: 335) | AGAAAUCCGUCUUUCAUUGACGGCACACCUUAUAGGAAAACCA(SEQ ID NO: 353) | AGACAUGUGUCCUCAGUGACACCACACCUUAUAGGAAAACCA(SEQ ID NO: 393) |
E3T2 | TACAAATTCCTCCTCAGTTG(SEQ ID NO: 336) | AGAAAUCCGUCUUUCAUUGACGGUACAAAUUCCUCCUCAGUUG(SEQ ID NO: 354) | AGACAUGUGUCCUCAGUGACACUACAAAUUCCUCCUCAGUUG(SEQ ID NO: 394) |
E3T3 | GTATATCCCTTCTACAAATT(SEQ ID NO: 337) | AGAAAUCCGUCUUUCAUUGACGGGUAUAUCCCUUCUACAAAUU(SEQ ID NO: 355) | AGACAUGUGUCCUCAGUGACACGUAUAUCCCUUCUACAAAUU(SEQ ID NO: 395) |
E3T4 | CAGTAAGATTTGGTGTCTAT(SEQ ID NO: 338) | AGAAAUCCGUCUUUCAUUGACGGCAGUAAGAUUUGGUGUCUAU(SEQ ID NO: 356) | AGACAUGUGUCCUCAGUGACACCAGUAAGAUUUGGUGUCUAU(SEQ ID NO: 396) |
E3T5 | ACACCTTATAGGAAAACCAG(SEQ ID NO: 366) | AGAAAUCCGUCUUUCAUUGACGGACACCUUAUAGGAAAACCAG(SEQ ID NO: 378) | AGACAUGUGUCCUCAGUGACACACACCUUAUAGGAAAACCAG(SEQ ID NO: 397) |
E3T6 | TAGGAAAACCAGTGAGTCTG(SEQ ID NO: 367) | AGAAAUCCGUCUUUCAUUGACGGUAGGAAAACCAGUGAGUCUG(SEQ ID NO: 379) | AGACAUGUGUCCUCAGUGACACUAGGAAAACCAGUGAGUCUG(SEQ ID NO: 398) |
E3T7 | GTAGAAGGGATATACAAAGT(SEQ ID NO: 368) | AGAAAUCCGUCUUUCAUUGACGGGUAGAAGGGAUAUACAAAGU(SEQ ID NO: 380) | AGACAUGUGUCCUCAGUGACACGUAGAAGGGAUAUACAAAGU(SEQ ID NO: 399) |
E3T8 | TAGAAGGGATATACAAAGTG(SEQ ID NO: 369) | N.A. | AGACAUGUGUCCUCAGUGACACUAGAAGGGAUAUACAAAGUG(SEQ ID NO: 400) |
E3T9 | CACTTTGTATATCCCTTCTA(SEQ ID NO: 370) | AGAAAUCCGUCUUUCAUUGACGGCACUUUGUAUAUCCCUUCUA(SEQ ID NO: 381) | AGACAUGUGUCCUCAGUGACACCACUUUGUAUAUCCCUUCUA(SEQ ID NO: 401) |
E3T10 | CCACTTTGTATATCCCTTCT(SEQ ID NO: 371) | AGAAAUCCGUCUUUCAUUGACGGCCACUUUGUAUAUCCCUUCU(SEQ ID NO: 382) | AGACAUGUGUCCUCAGUGACACCCACUUUGUAUAUCCCUUCU(SEQ ID NO: 402) |
E3T11 | GTGTCTATTTCCACTTTGTA(SEQ ID NO: 372) | AGAAAUCCGUCUUUCAUUGACGGGUGUCUAUUUCCACUUUGUA(SEQ ID NO: 383) | AGACAUGUGUCCUCAGUGACACGUGUCUAUUUCCACUUUGUA(SEQ ID NO: 403) |
E3T12 | GGTGTCTATTTCCACTTTGT(SEQ ID NO: 373) | AGAAAUCCGUCUUUCAUUGACGGGGUGUCUAUUUCCACUUUGU(SEQ ID NO: 384) | AGACAUGUGUCCUCAGUGACACGGUGUCUAUUUCCACUUUGU(SEQ ID NO: 404) |
E4T2 | CACCACGGCTGTCGTCACCA(SEQ ID NO: 340) | AGAAAUCCGUCUUUCAUUGACGGCACCACGGCUGUCGUCACCA(SEQ ID NO: 358) | AGACAUGUGUCCUCAGUGACACCACCACGGCUGUCGUCACCA(SEQ ID NO: 405) |
E4T3 | GTGACGACAGCCGTGGTGGA(SEQ ID NO: 341) | AGAAAUCCGUCUUUCAUUGACGGGUGACGACAGCCGUGGUGGA(SEQ ID NO: 359) | AGACAUGUGUCCUCAGUGACACGUGACGACAGCCGUGGUGGA(SEQ ID NO: 406) |
E4T4 | GGATTGGTGACGACAGCCGT(SEQ ID NO: 342) | AGAAAUCCGUCUUUCAUUGACGGGGAUUGGUGACGACAGCCGU(SEQ ID NO: 360) | AGACAUGUGUCCUCAGUGACACGGAUUGGUGACGACAGCCGU(SEQ ID NO: 407) |
E4T5 | CTTGGGATTGGTGACGACAG(SEQ ID NO: 343) | AGAAAUCCGUCUUUCAUUGACGGCUUGGGAUUGGUGACGACAG(SEQ ID NO: 361) | AGACAUGUGUCCUCAGUGACACCUUGGGAUUGGUGACGACAG(SEQ ID NO: 408) |
E4T7 | TCTCATAGGTGGTATTCACA(SEQ ID NO: 374) | AGAAAUCCGUCUUUCAUUGACGGUCUCAUAGGUGGUAUUCACA(SEQ ID NO: 385) | AGACAUGUGUCCUCAGUGACACUCUCAUAGGUGGUAUUCACA(SEQ ID NO: 409) |
使用TRYPLE
TM(重組細胞解離酶;賽默飛世爾公司)收穫HepG2細胞並計數。將細胞用PBS洗滌一次並重懸於SF緩衝液 + 補充劑(SF細胞系4D-NUCLEOFECTOR
TMX套組S;龍沙公司編號V4XC-2032)中。
在轉染前大約16小時,將在EMEM/10% FBS中的25,000個HepG2細胞鋪板到96孔板的每個孔中。在轉染的當天,細胞係70%-90%匯合的。對於待轉染的每個孔,製備Lipofectamine
TM3000和Opti-MEM®的混合物,並且然後在室溫下孵育5分鐘(溶液1)。孵育後,將lipofectamine
TM: OptiMEM
®混合物添加到含有核酸酶質體和RNA指導物質體以及P3000試劑的單獨混合物中(溶液2)。在陰性對照的情況下,在溶液2中不包含crRNA。將溶液1和溶液2藉由向上和向下吸移進行混合,然後在室溫下孵育15分鐘。在孵育後,將溶液1和溶液2混合物逐滴添加至含有細胞的96孔板的每個孔。
3天後,使用TRYPLE
TM(重組細胞解離酶;賽默飛世爾公司)對孔進行收穫並轉移至96孔TWIN.TEC
®PCR板(Eppendorf)。拂掉培養基,並將細胞重懸於20 µL的QUICKEXTRACT
TM(DNA提取緩衝液;盧西根公司(Lucigen))中。然後在PCR機器中使樣本在65°C下循環15 min、在68°C下循環15 min、在98°C下循環10 min。然後如實例1所述將樣本在-20°C冷凍並藉由NGS分析。
如
圖 9A顯示,與使用SEQ ID NO: 224的變體Cas12i2相比,使用SEQ ID NO: 227的變體Cas12i2時,九個指導物表現出顯著更高的活性,而十三個指導物顯示出SEQ ID NO: 227的變體Cas12i2與SEQ ID NO: 224的變體Cas12i2之間沒有顯著差異。在變體Cas12i4和Cas12i2變體之間觀察到相當的編輯。
圖 9B顯示了相對於E2T3和SEQ ID NO: 224的變體Cas12i2的PAM的***缺失大小頻率(左)和***缺失起始位置。如左圖顯示,缺失的大小範圍為從1個核苷酸至約40個核苷酸。大多數缺失的長度為約4個核苷酸至約18個核苷酸。如右圖顯示,靶序列表示為始於位置0且終於位置20。***缺失起始於PAM序列的下游約5個核苷酸和約35個核苷酸內。大多數***缺失起始於靶序列的末端附近,例如,PAM序列的下游約15個核苷酸至約25個核苷酸。
因此,本實例顯示TTR能夠被Cas12i2和Cas12i4變體兩者靶向。
實例 7 - Cas12i2 和靶向 TTR 的 RNA 指導物的脫靶分析
本實例描述了Cas12i2變體和靶向TTR的RNA指導物的中靶相比於脫靶評估。
根據PCT/US21/25257的實例16中所述之方法,用編碼SEQ ID NO: 224的變體Cas12i2的質體以及編碼E3T1(SEQ ID NO: 353)、E2T2(SEQ ID NO: 347)、E3T4(SEQ ID NO: 356)、E3T3(SEQ ID NO: 355)、E4T2(SEQ ID NO: 358)、E1T2(SEQ ID NO: 363)、或E1T1(SEQ ID NO: 345)的質體轉染HEK293T細胞。然後開展PCT/US21/25257的實例16中所述之基於標籤化的標籤整合位點定序(TTISS)方法。
圖 10A和
10B顯示了描繪中靶和脫靶TTISS讀段之圖。黑色楔形和居中的數字代表中靶TTISS讀段的分數。每個灰色楔形代表由TTISS鑒定的特有脫靶位點。每個灰色楔形的大小代表映射到給定脫靶位點的TTISS讀段的分數。
如
圖 10A中顯示,與E3T1或E4T2配對的SEQ ID NO: 224的變體Cas12i2證明脫靶編輯的可能性低,因為100%的TTISS讀段映射至中靶。沒有TTISS讀段映射至潛在的脫靶位點。E2T2、E3T4、和E3T3也顯示出脫靶編輯的可能性低。對於E2T2、E3T4和E3T3,99%的TTISS讀段映射至中靶;對於每個RNA指導物,脫靶位點合計占TTISS讀段的1%。然而,也如
圖 10B中顯示,E1T2和E1T1表明,使用TTISS方法,脫靶編輯的可能性較高。對於E1T2,僅51%的TTISS讀段映射至中靶,並且7個潛在的脫靶位點占TTISS讀段的剩餘49%。對於E1T1,僅31%的TTISS讀段映射至中靶,並且14個潛在的脫靶位點占TTISS讀段的剩餘69%。
因此,本實例顯示包含Cas12i2和靶向TTR的RNA指導物的組成物包含不同的脫靶活性譜。
其他實施方式
本說明書中揭露的所有特徵可以以任意組合進行組合。本說明書中揭露的每個特徵可以由用於相同、等同或類似目的可替代特徵替代。因此,除非另有明確說明,否則所揭露的每個特徵僅是通用等同或類似特徵的系列的實例。
熟悉該項技術者從以上描述可以容易地確定本揭露內容之本質特徵,並且在不脫離其精神和範圍的情況下,可以對本揭露內容進行各種更改和改變以使其適應各種用途和條件。因此,其他實施方式也在請求項範圍內。
等同物
儘管本文已經描述和說明了幾個發明性的實施方式,但是熟悉該項技術者將容易想到用於執行功能和/或獲得結果和/或本文所述之一或多個優點的各種其他手段和/或結構,並且每個這樣的變化和/或改變被視為在本文所述之發明性實施方式的範圍內。更通常地,熟悉該項技術者將容易理解,本文所述之所有參數、尺寸、材料和構型都旨在為示例性,並且實際的參數、尺寸、材料和/或組態將取決於使用本發明的教導的一或多種特定應用。熟悉該項技術者將認識到或僅使用常規實驗就能確定本文所述之特定發明性實施方式的多種等同物。因此,應當理解,前面的實施方式僅藉由舉例進行呈現,並且在所附請求項及其等同物的範圍內,可以以不同於特定地描述和要求保護的方式實施發明性實施方式。本揭露內容之發明性實施方式針對本文所述之每個單獨的特徵、系統、物品、材料、套組、和/或方法。此外,將兩個或更多個這樣的特徵、系統、物品、材料、套組、和/或方法的任何組合(如果這樣的特徵、系統、物品、材料、套組、和/或方法不相互矛盾)包括在本揭露內容之發明範圍內。
如本文所定義和所用的,所有定義應理解為優先於字典定義、藉由援引併入的文件中的定義、和/或所定義術語的普通含義。
本文揭露的所有參考文獻、專利和專利申請均相對於引用的每一個所針對的主題藉由援引併入,在一些情況下可涵蓋文件的全文。
如本文所用,在說明書和請求項中使用的不定冠詞「一個/種」應理解為意指「至少一個/種」,除非明確指出相反的情形。
如本文所用,在說明書和在請求項中使用的短語「和/或」應理解為意指如此結合的要素中的「一個或兩個」,即,要素在一些情況下結合存在並且在其他情況下不結合存在。用「和/或」列出的多個要素應該以相同的方式解釋,即,「一或多個」這樣結合的要素。除了由「和/或」從句特別鑒定的要素之外,可以視需要存在其他要素,無論與特別鑒定的那些要素相關還是不相關。因此,作為非限制性實例,當與開放式語言(如「包含」)結合使用時,對「A和/或B」的援引在一個實施方式中可以僅指A(視需要包括除B外的要素),在另一實施方式中僅指B(視需要包括除A外的要素),在又另一實施方式中指A和B兩者(視需要包括其他要素);等。
如本文所用,在說明書和請求項中,「或」應理解為與如上定義的「和/或」具有相同的含義。例如,當分隔列表中的項時,「或」或「和/或」應理解為具有包容性,即包括多個要素或要素列表中的至少一個(但也包括多於一個)以及視需要額外的未列出的項。只有明確指出相反情形的術語(如「僅一個」或「正好一個」)或在請求項中使用時,「由...組成」將指包括多個要素或要素列表中的正好一個要素。一般來說,如本文所用,如果前面帶有排他性術語,如「任一」、「中的一個」、「僅...中的一個」或「...中的正好一個」,術語「或」應僅理解為指示排他性替代方案(即,「一個或另一個但不是兩者」)。當在請求項中使用時,「基本上由……組成」應具有如專利法領域中所使用的其一般含義。
如本文所用,在說明書和請求項中,在提及一或多個要素的清單的情況下,短語「至少一個」應理解為意指選自要素列表中任何一或多個要素的至少一個要素,但不一定包括該要素列表中特定列出的每個要素中的至少一個,並且不排除該要素清單中的要素的任何組合。該定義還允許除了在短語「至少一個」所涉及的要素列表內特定鑒定的要素之外的要素可以視需要存在,無論與特別地鑒定的那些要素相關還是不相關。因此,作為非限制性實例,「A和B中的至少一個」(或等同地,「A或B中的至少一個」,或等同地,「A和/或B中的至少一個」)可以在一個實施方式中指至少一個(視需要包括多於一個)A,不存在B(並且視需要包括除B外的要素),在另一實施方式中指至少一個(視需要包括多於一個)B,不存在A(並且視需要包括除A外的要素),在又另一實施方式中指至少一個(視需要包括多於一個)A以及至少一個(視需要包括多於一個)B(並且視需要包括其他要素);等。
還應理解的是,除非明確指示相反的情形,否則在本文要求保護的任何包括多於一個步驟或動作的方法中,該方法的步驟或動作的順序不一定限於敘述該方法的步驟或動作的順序。
無
以下附圖構成本說明書的一部分並且將其包括以進一步說明本揭露內容之某些方面,藉由參考附圖並結合本文呈現的特定實施方式的詳細描述可以更好地理解該等方面。
[
圖 1]顯示了如實例1中所述使用變體Cas12i2在TTR靶序列內和/或附近觀察到的總編輯%。
[
圖 2]係顯示Cas12i TTR靶序列和示例性模板DNA序列之示意圖。模板DNA序列包含40個核苷酸的同源臂和供體區,以將T119M突變引入靶序列中。序列從上到下係SEQ ID NO: 419-425。
[
圖 3]顯示了總編輯(中灰色)、V30M SNP部分整合(淺灰色)、以及模板DNA的整合到TTR靶位點中的***區完全整合(黑色)。測試了包含40個核苷酸的同源臂和50個核苷酸的同源臂的模板DNA,並測量了變體Cas12i2的編輯效率。
[
圖 4]顯示了總編輯(中灰色)、V122I SNP部分整合(淺灰色)、以及模板DNA的整合到TTR靶位點中的***區完全整合(黑色)。測試了包含40個核苷酸的同源臂和50個核苷酸的同源臂的模板DNA,並測量了變體Cas12i2的編輯效率。
[
圖 5]顯示了總編輯(中灰色)、T119M SNP部分整合(淺灰色)、以及模板DNA的整合到TTR靶位點中的***區完全整合(黑色)。測試了包含40個核苷酸的同源臂和50個核苷酸的同源臂的模板DNA,並測量了變體Cas12i2的編輯效率。
[
圖 6]係顯示在將變體Cas12i2 RNP遞送至HEK293T細胞後TTR靶位點中的***缺失之圖。
[
圖 7]
係顯示在將變體Cas12i2 RNP遞送至HepG2細胞後TTR靶位點中的***缺失之圖。
[
圖 8A和
圖 8B]包括顯示使用變體Cas12i2/指導RNA RNP在TTR靶位點處的基因編輯效率之圖表。
圖 8A係顯示在將變體Cas12i2 RNP遞送至原代人肝細胞後3天後(深色條)和7天後(淺色條)TTR靶位點中的***缺失之圖。
圖 8B係顯示在將變體Cas12i2 RNP遞送至原代人肝細胞後在x軸上的TTR靶位點中的***缺失和在y軸上的TTR蛋白敲低之圖。黑色數據點代表與非人靈長類動物TTR序列具有完全同源性的靶序列。灰色數據點代表與非人靈長類動物TTR序列不具有完全同源性的靶序列。
[
圖 9A和
9B]包括顯示使用靶向TTR的crRNA和如所指示的Cas12i2變體在TTR靶向性位點處的編輯效率之圖表。
圖 9A係顯示由靶向TTR的crRNA和SEQ ID NO: 224的Cas12i2變體、SEQ ID NO: 227的Cas12i2變體、或SEQ ID NO: 255的Cas12i4變體誘導的***缺失%之圖。
圖 9B顯示了在HepG2細胞中由SEQ ID NO: 224的變體Cas12i2以及E2T3(SEQ ID NO: 348)的靶向TTR的RNA指導物誘導的***缺失的大小(左)和起始位置(右)。
[
圖 10A和
10B]顯示了描繪針對SEQ ID NO: 224的變體Cas12i2和靶向TTR的RNA指導物的基於標籤化的標籤整合位點定序(TTISS)讀段之圖。
圖 10A顯示了針對E3T1(SEQ ID NO: 353)、E2T2(SEQ ID NO: 347)、E3T4(SEQ ID NO: 356)、E3T3(SEQ ID NO: 355)、和E4T2(SEQ ID NO: 358)的TTISS圖。
圖 10B顯示了針對E1T2(SEQ ID NO: 363)和E1T1(SEQ ID NO: 345)的TTISS圖。黑色楔形和居中的數字代表中靶TTISS讀段的分數。每個灰色楔形代表由TTISS鑒定的特有脫靶位點。每個灰色楔形的大小代表映射到給定脫靶的TTISS讀段的分數。
無
序列表 <![CDATA[<110> 美商喬木生物技術公司(Arbor Biotechnologies, Inc.)]]> <![CDATA[<120> 包含靶向運甲狀腺素蛋白(TTR)的RNA指導物的基因編輯系統及其用途 ]]> <![CDATA[<140> 111120920]]> <![CDATA[<141> 2022-06-06]]> <![CDATA[<150> US 63/197,036]]> <![CDATA[<151> 2021-06-04]]> <![CDATA[<150> US 63/247,080]]> <![CDATA[<151> 2021-09-22]]> <![CDATA[<150> US 63/321,960]]> <![CDATA[<151> 2022-03-21]]> <![CDATA[<150> PCT/US22/32107]]> <![CDATA[<151> 2022-06-03]]> <![CDATA[<160> 425 ]]> <![CDATA[<170> PatentIn 3.5版]]> <![CDATA[<210> 1]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 1]]> guugcaaaac ccaagaaauc cgucuuucau ugacgg 36 <![CDATA[<210> 2]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 2]]> aauagcggcc cuaagaaauc cgucuuucau ugacgg 36 <![CDATA[<210> 3]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 3]]> auuggaacug gcgagaaauc cgucuuucau ugacgg 36 <![CDATA[<210> 4]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 4]]> ccagcaacac cuaagaaauc cgucuuucau ugacgg 36 <![CDATA[<210> 5]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 5]]> cggcgcucga auaggaaauc cgucuuucau ugacgg 36 <![CDATA[<210> 6]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 6]]> guggcaacac cuaagaaauc cgucuuucau ugacgg 36 <![CDATA[<210> 7]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 7]]> guugcaacac cuaagaaauc cgucuuucau ugacgg 36 <![CDATA[<210> 8]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 8]]> guugcaaugc cuaagaaauc cgucuuucau ugacgg 36 <![CDATA[<210> 9]]> <![CDATA[<211> 34]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 9]]> gcaacaccua agaaauccgu cuuucauuga cggg 34 <![CDATA[<210> 10]]> <![CDATA[<211> 23]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 10]]> agaaauccgu cuuucauuga cgg 23 <![CDATA[<210> 11]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 11]]> ttggcaggat ggcttctcat cgtctgctcc 30 <![CDATA[<210> 12]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 12]]> tcatcgtctg ctcctcctct gccttgctgg 30 <![CDATA[<210> 13]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 13]]> ctggactggt atttgtgtct gaggctggcc 30 <![CDATA[<210> 14]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 14]]> gtgtctgagg ctggccctac ggtgagtgtt 30 <![CDATA[<210> 15]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 15]]> tgtctgaggc tggccctacg gtgagtgttt 30 <![CDATA[<210> 16]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 16]]> ctgtgacatc ccattcctac atttaagatt 30 <![CDATA[<210> 17]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> ]]> 合成的 <![CDATA[<400> 17]]> tgtgacatcc cattcctaca tttaagattc 30 <![CDATA[<210> 18]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 18]]> agcgtgaatc ttaaatgtag gaatgggatg 30 <![CDATA[<210> 19]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 19]]> gcgtgaatct taaatgtagg aatgggatgt 30 <![CDATA[<210> 20]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 20]]> aatgtaggaa tgggatgtca cagaaacact 30 <![CDATA[<210> 21]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 21]]> gcaggatggc ttctcatcgt ctgctcctcc 30 <![CDATA[<210> 22]]> <![CDATA[<211> 24]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 22]]> ctacatttaa gattcacgct aaat 24 <![CDATA[<210> 23]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 23]]> gattcaccgg tgccctgggt gtagagaaga 30 <![CDATA[<210> 24]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 24]]> tgttaacttc tcacgtgtct tctctacacc 30 <![CDATA[<210> 25]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 25]]> gttaacttct cacgtgtctt ctctacaccc 30 <![CDATA[<210> 26]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 26]]> ttaacttctc acgtgtcttc tctacaccca 30 <![CDATA[<210> 27]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 27]]> tcacgtgtct tctctacacc cagggcaccg 30 <![CDATA[<210> 28]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 28]]> accggtgccc tgggtgtaga gaagacacgt 30 <![CDATA[<210> 29]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 29]]> tagatgctgt ccgaggcagt cctgccatca 30 <![CDATA[<210> 30]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 30]]> accatcagag gacacttgga ttcaccggtg 30 <![CDATA[<210> 31]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 31]]> gaccatcaga ggacacttgg attcaccggt 30 <![CDATA[<210> 32]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 32]]> atggcaggac tgcctcggac agcatctaga 30 <![CDATA[<210>]]> 33 <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 33]]> tgaacacatg cacggccaca ttgatggcag 30 <![CDATA[<210> 34]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 34]]> ctgaacacat gcacggccac attgatggca 30 <![CDATA[<210> 35]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 35]]> cccagaggca aatggctccc aggtgtcatc 30 <![CDATA[<210> 36]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 36]]> gcaacttacc cagaggcaaa tggctcccag 30 <![CDATA[<210> 37]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 37]]> tctacaccca gggcaccggt gaatccaagt 30 <![CDATA[<210> 38]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 38]]> ggcaacttac ccagaggcaa atggctccca 30 <![CDATA[<210> 39]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 39]]> ccaaagaacc ctcccacagg acttggtttt 30 <![CDATA[<210> 40]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 40]]> cctctgggta agttgccaaa gaaccctccc 30 <![CDATA[<210> 41]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> ]]>合成的 <![CDATA[<400> 41]]> gcctctgggt aagttgccaa agaaccctcc 30 <![CDATA[<210> 42]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 42]]> agaaaggctg ctgatgacac ctgggagcca 30 <![CDATA[<210> 43]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 43]]> tttggcaact tacccagagg caaatggctc 30 <![CDATA[<210> 44]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 44]]> acttctcacg tgtcttctct acacccaggg 30 <![CDATA[<210> 45]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 45]]> acaaaattga tcagagtgaa 20 <![CDATA[<210> 46]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213]]>> 人工序列]]> <br/> <br/><![CDATA[<220>]]> <br/><![CDATA[<223> 合成的]]> <br/> <br/><![CDATA[<400> 46]]> <br/><![CDATA[gcatctcccc attccatgag catgcagagg 30 <![CDATA[<210> 47]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 47]]> ctggaaggca cttggcatct ccccattcca 30 <![CDATA[<210> 48]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 48]]> tagaagggat atacaaagtg gaaatagaca 30 <![CDATA[<210> 49]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 49]]> tacaaattcc tcctcagttg tgagcccatg 30 <![CDATA[<210> 50]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 50]]> gagggttgtt ttggttttgg tttttgcttt 30 <![CDATA[<210> 51]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 51]]> cagtaagatt tggtgtctat ttccactttg 30 <![CDATA[<210> 52]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 52]]> ggtgtctatt tccactttgt atatcccttc 30 <![CDATA[<210> 53]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 53]]> gtgtctattt ccactttgta tatcccttct 30 <![CDATA[<210> 54]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 54]]> ccactttgta tatcccttct acaaattcct 30 <![CDATA[<210> 55]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 55]]> cactttgtat atcccttcta caaattcctc 30 <![CDATA[<210> 56]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 56]]> gtatatccct tctacaaatt cctcctcagt 30 <![CDATA[<210> 57]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 57]]> tatatccctt ctacaaattc ctcctcagtt 30 <![CDATA[<210> 58]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 58]]> gtagaaggga tatacaaagt ggaaatagac 30 <![CDATA[<210> 59]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 59]]> ctcctcagtt gtgagcccat gcagctctcc 30 <![CDATA[<210> 60]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 60]]> tgagcccatg cagctctcca gactcactgg 30 <![CDATA[<210> 61]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 61]]> tcctataagg tgtgaaagtc tggattaagt 30 <![CDATA[<210> 62]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 62]]> cctataaggt gtgaaagtct ggattaagtt 30 <![CDATA[<210> 63]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 63]]> ctataaggtg tgaaagtctg gattaagtta 30 <![CDATA[<210> 64]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 64]]> catgagcatg cagaggtgag tatacagacc 30 <![CDATA[<210> 65]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 65]]> taggaaaacc agtgagtctg gagagctgca 30 <![CDATA[<210> 66]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 66]]> gtttcctcca tgcgtaactt aatccagact 30 <![CDATA[<210> 67]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 67]]> cacaccttat aggaaaacca gtgagtctgg 30 <![CDATA[<210> 68]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 68]]> atccagactt tcacacctta taggaaaacc 30 <![CDATA[<210> 69]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 69]]> ctccatgcgt aacttaatcc agactttcac 30 <![CDATA[<210> 70]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 70]]> cctccatgcg taacttaatc cagactttca 30 <![CDATA[<210> 71]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 71]]> tttcctccat gcgtaactta atccagactt 30 <![CDATA[<210> 72]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 72]]> acaccttata ggaaaaccag tgagtctgga 30 <![CDATA[<210> 73]]> <![CDATA[<211> 24]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 73]]> ttttggtttt ggtttttgct tttg 24 <![CDATA[<210> 74]]> <![CDATA[<211> 21]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 74]]> tggttttggt ttttgctttt g 21 <![CDATA[<210> 75]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 75]]> ggttttggtt tttgcttttg 20 <![CDATA[<210> 76]]> <![CDATA[<211> 25]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 76]]> agttacgcat ggaggaaaca aatgg 25 <![CDATA[<210> 77]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 77]]> cgcatggagg aaacaaatgg 20 <![CDATA[<210> 78]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 78]]> ctaaagcagt gttttcacct catatgctat 30 <![CDATA[<210> 79]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 79]]> actaaagcag tgttttcacc tcatatgcta 30 <![CDATA[<210> 80]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 80]]> tactaaagca gtgttttcac ctcatatgct 30 <![CDATA[<210> 81]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 81]]> ttactaaagc agtgttttca cctcatatgc 30 <![CDATA[<210> 82]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 82]]> catttttact aaagcagtgt tttcacctca 30 <![CDATA[<210> 83]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 83]]> atgtaaccaa gagtattcca tttttactaa 30 <![CDATA[<210> 84]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 84]]> catgtaacca agagtattcc atttttacta 30 <![CDATA[<210> 85]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 85]]> caccacggct gtcgtcacca atcccaagga 30 <![CDATA[<210> 86]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 86]]> tcacctcata tgctatgtta gaagtccagg 30 <![CDATA[<210> 87]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 87]]> ccgccctgct gagcccctac tcctattcca 30 <![CDATA[<210> 88]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 88]]> acagccaacg actccggccc ccgccgctac 30 <![CDATA[<210> 89]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工]]>序列 <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 89]]> tctcataggt ggtattcaca gccaacgact 30 <![CDATA[<210> 90]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 90]]> gggctctggt ggaaatggat ctgtctgtct 30 <![CDATA[<210> 91]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 91]]> cgggctctgg tggaaatgga tctgtctgtc 30 <![CDATA[<210> 92]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 92]]> tcgggctctg gtggaaatgg atctgtctgt 30 <![CDATA[<210> 93]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 93]]> tcctccagtg gacctgaagg acgagggatg 30 <![CDATA[<210> 94]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<22]]>0>]]> <br/><![CDATA[<223> 合成的]]> <br/> <br/><![CDATA[<400> 94]]> <br/><![CDATA[cacctcatat gctatgttag aagtccaggc 30 <![CDATA[<210> 95]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 95]]> cacaggaatg ttttattgtc tctgcctgga 30 <![CDATA[<210> 96]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 96]]> gaagtccagg cagagacaat aaaacattcc 30 <![CDATA[<210> 97]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 97]]> gctgtgaata ccacctatga gagaagacag 30 <![CDATA[<210> 98]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 98]]> gtgacgacag ccgtggtgga ataggagtag 30 <![CDATA[<210> 99]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 99]]> ggattggtga cgacagccgt ggtggaatag 30 <![CDATA[<210> 100]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 100]]> cttgggattg gtgacgacag ccgtggtgga 30 <![CDATA[<210> 101]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 101]]> aggtccactg gaggagaagt ccctcattcc 30 <![CDATA[<210> 102]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 102]]> catgaaatcc catccctcgt ccttcaggtc 30 <![CDATA[<210> 103]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 103]]> gttacatgaa atcccatccc tcgtccttca 30 <![CDATA[<210> 1]]>04 <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 104]]> gtaaaaatgg aatactcttg gttacatgaa 30 <![CDATA[<210> 105]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 105]]> agtaaaaatg gaatactctt ggttacatga 30 <![CDATA[<210> 106]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 106]]> taacatagca tatgaggtga aaacactgct 30 <![CDATA[<210> 107]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 107]]> tctctgcctg gacttctaac atagcatatg 30 <![CDATA[<210> 108]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 108]]> ttgtctctgc ctggacttct aacatagcat 30 <![CDATA[<210> 109]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 109]]> attgtctctg cctggacttc taacatagca 30 <![CDATA[<210> 110]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 110]]> tattgtctct gcctggactt ctaacatagc 30 <![CDATA[<210> 111]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 111]]> acaggaatgt tttattgtct ctgcctggac 30 <![CDATA[<210> 112]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 112]]> acctcatatg ctatgttaga agtccaggca 30 <![CDATA[<210> 113]]> <![CDATA[<211> 30]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> ]]> 113 ttcgggctct ggtggaaatg gatctgtctg 30 <![CDATA[<210> 114]]> <![CDATA[<211> 22]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 114]]> ccaccagagc ccgaaaaacg tg 22 <![CDATA[<210> 115]]> <![CDATA[<211> 21]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 115]]> caccagagcc cgaaaaacgt g 21 <![CDATA[<210> 116]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 116]]> uuggcaggau ggcuucucau cgucugcucc 30 <![CDATA[<210> 117]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 117]]> ucaucgucug cuccuccucu gccuugcugg 30 <![CDATA[<210> 118]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 118]]> cuggacuggu auuugugucu gaggcuggcc 30 <![CDATA[<210> 119]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 119]]> gugucugagg cuggcccuac ggugaguguu 30 <![CDATA[<210> 120]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 120]]> ugucugaggc uggcccuacg gugaguguuu 30 <![CDATA[<210> 121]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 121]]> cugugacauc ccauuccuac auuuaagauu 30 <![CDATA[<210> 122]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 122]]> ugugacaucc cauuccuaca uuuaagauuc 30 <![CDATA[<210> 123]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 123]]> agcgugaauc uuaaauguag gaaugggaug 30 <![CDATA[<210> 124]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 124]]> gcgugaaucu uaaauguagg aaugggaugu 30 <![CDATA[<210> 125]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 125]]> aauguaggaa ugggauguca cagaaacacu 30 <![CDATA[<210> 126]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 126]]> gcaggauggc uucucaucgu cugcuccucc 30 <![CDATA[<210> 127]]> <![CDATA[<211> 24]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 127]]> cuacauuuaa gauucacgcu aaau 24 <![CDATA[<210> 128]]> <![CDATA[<211> ]]> 30 <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 128]]> gauucaccgg ugcccugggu guagagaaga 30 <![CDATA[<210> 129]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 129]]> uguuaacuuc ucacgugucu ucucuacacc 30 <![CDATA[<210> 130]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 130]]> guuaacuucu cacgugucuu cucuacaccc 30 <![CDATA[<210> 131]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 131]]> uuaacuucuc acgugucuuc ucuacaccca 30 <![CDATA[<210> 132]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 132]]> ucacgugucu ucucuacacc cagggcaccg 30 <![CDATA[<210> 133]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 133]]> accggugccc uggguguaga gaagacacgu 30 <![CDATA[<210> 134]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 134]]> uagaugcugu ccgaggcagu ccugccauca 30 <![CDATA[<210> 135]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 135]]> accaucagag gacacuugga uucaccggug 30 <![CDATA[<210> 136]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 136]]> gaccaucaga ggacacuugg auucaccggu 30 <![CDATA[<210> 137]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 137]]> auggcaggac ugccucggac agcaucuaga 30 <![CDATA[<210> 138]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 138]]> ugaacacaug cacggccaca uugauggcag 30 <![CDATA[<210> 139]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 139]]> cugaacacau gcacggccac auugauggca 30 <![CDATA[<210> 140]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 140]]> cccagaggca aauggcuccc aggugucauc 30 <![CDATA[<210> 141]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 141]]> gcaacuuacc cagaggcaaa uggcucccag 30 <![CDATA[<210> 142]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 142]]> ucuacaccca gggcaccggu gaauccaagu 30 <![CDATA[<210> 143]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 143]]> ggcaacuuac ccagaggcaa auggcuccca 30 <![CDATA[<210> 144]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 144]]> ccaaagaacc cucccacagg acuugguuuu 30 <![CDATA[<210> 145]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 145]]> ccucugggua aguugccaaa gaacccuccc 30 <![CDATA[<210> 146]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 146]]> gccucugggu aaguugccaa agaacccucc 30 <![CDATA[<210> 147]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 147]]> agaaaggcug cugaugacac cugggagcca 30 <![CDATA[<210> 148]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 148]]> uuuggcaacu uacccagagg caaauggcuc 30 <![CDATA[<210> 149]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 149]]> acuucucacg ugucuucucu acacccaggg 30 <![CDATA[<210> 150]]> <![CDATA[<211> 20]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 150]]> acaaaauuga ucagagugaa 20 <![CDATA[<210> 151]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 151]]> gcaucucccc auuccaugag caugcagagg 30 <![CDATA[<210> 152]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 152]]> cuggaaggca cuuggcaucu ccccauucca 30 <![CDATA[<210> 153]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 153]]> uagaagggau auacaaagug gaaauagaca 30 <![CDATA[<210> 154]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 154]]> uacaaauucc uccucaguug ugagcccaug 30 <![CDATA[<210> 155]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 155]]> gaggguuguu uugguuuugg uuuuugcuuu 30 <![CDATA[<210> 156]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 156]]> caguaagauu uggugucuau uuccacuuug 30 <![CDATA[<210> 157]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 157]]> ggugucuauu uccacuuugu auaucccuuc 30 <![CDATA[<210> 158]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 158]]> gugucuauuu ccacuuugua uaucccuucu 30 <![CDATA[<210> 159]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 159]]> ccacuuugua uaucccuucu acaaauuccu 30 <![CDATA[<210> 160]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 160]]> cacuuuguau aucccuucua caaauuccuc 30 <![CDATA[<210> 161]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 161]]> guauaucccu ucuacaaauu ccuccucagu 30 <![CDATA[<210> 162]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 162]]> uauaucccuu cuacaaauuc cuccucaguu 30 <![CDATA[<210> 163]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 163]]> guagaaggga uauacaaagu ggaaauagac 30 <![CDATA[<210> 164]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 164]]> cuccucaguu gugagcccau gcagcucucc 30 <![CDATA[<210> 165]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 165]]> ugagcccaug cagcucucca gacucacugg 30 <![CDATA[<210> 166]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 166]]> uccuauaagg ugugaaaguc uggauuaagu 30 <![CDATA[<210> 167]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 167]]> ccuauaaggu gugaaagucu ggauuaaguu 30 <![CDATA[<210> 168]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 168]]> cuauaaggug ugaaagucug gauuaaguua 30 <![CDATA[<210> 169]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 169]]> caugagcaug cagaggugag uauacagacc 30 <![CDATA[<210> 170]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 170]]> uaggaaaacc agugagucug gagagcugca 30 <![CDATA[<210> 171]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 171]]> guuuccucca ugcguaacuu aauccagacu 30 <![CDATA[<210> 172]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 172]]> cacaccuuau aggaaaacca gugagucugg 30 <![CDATA[<210> 173]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 173]]> auccagacuu ucacaccuua uaggaaaacc 30 <![CDATA[<210> 174]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 174]]> cuccaugcgu aacuuaaucc agacuuucac 30 <![CDATA[<210> 175]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 175]]> ccuccaugcg uaacuuaauc cagacuuuca 30 <![CDATA[<210> 176]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 176]]> uuuccuccau gcguaacuua auccagacuu 30 <![CDATA[<210> 177]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 177]]> acaccuuaua ggaaaaccag ugagucugga 30 <![CDATA[<210> 178]]> <![CDATA[<211> 24]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 178]]> uuuugguuuu gguuuuugcu uuug 24 <![CDATA[<210> 179]]> <![CDATA[<211> 21]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 179]]> ugguuuuggu uuuugcuuuu g 21 <![CDATA[<210> 180]]> <![CDATA[<211> 20]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400>]]> 180 gguuuugguu uuugcuuuug 20 <![CDATA[<210> 181]]> <![CDATA[<211> 25]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 181]]> aguuacgcau ggaggaaaca aaugg 25 <![CDATA[<210> 182]]> <![CDATA[<211> 20]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 182]]> cgcauggagg aaacaaaugg 20 <![CDATA[<210> 183]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 183]]> cuaaagcagu guuuucaccu cauaugcuau 30 <![CDATA[<210> 184]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 184]]> acuaaagcag uguuuucacc ucauaugcua 30 <![CDATA[<210> 185]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 185]]> uacuaaagca guguuuucac cucauaugcu 30 <![CDATA[<210> 186]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 186]]> uuacuaaagc aguguuuuca ccucauaugc 30 <![CDATA[<210> 187]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 187]]> cauuuuuacu aaagcagugu uuucaccuca 30 <![CDATA[<210> 188]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 188]]> auguaaccaa gaguauucca uuuuuacuaa 30 <![CDATA[<210> 189]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 189]]> cauguaacca agaguauucc auuuuuacua 30 <![CDATA[<210> 190]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 190]]> caccacggcu gucgucacca aucccaagga 30 <![CDATA[<210> 191]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 191]]> ucaccucaua ugcuauguua gaaguccagg 30 <![CDATA[<210> 192]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 192]]> ccgcccugcu gagccccuac uccuauucca 30 <![CDATA[<210> 193]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 193]]> acagccaacg acuccggccc ccgccgcuac 30 <![CDATA[<210> 194]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 194]]> ucucauaggu gguauucaca gccaacgacu 30 <![CDATA[<210> 195]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 195]]> gggcucuggu ggaaauggau cugucugucu 30 <![CDATA[<210> 196]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 196]]> cgggcucugg uggaaaugga ucugucuguc 30 <![CDATA[<210> 197]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 197]]> ucgggcucug guggaaaugg aucugucugu 30 <![CDATA[<210> 198]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 198]]> uccuccagug gaccugaagg acgagggaug 30 <![CDATA[<210> 199]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 199]]> caccucauau gcuauguuag aaguccaggc 30 <![CDATA[<210> 200]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 200]]> cacaggaaug uuuuauuguc ucugccugga 30 <![CDATA[<210> 201]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 201]]> gaaguccagg cagagacaau aaaacauucc 30 <![CDATA[<210> 202]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 202]]> gcugugaaua ccaccuauga gagaagacag 30 <![CDATA[<210> 203]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 203]]> gugacgacag ccguggugga auaggaguag 30 <![CDATA[<210> 204]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 204]]> ggauugguga cgacagccgu gguggaauag 30 <![CDATA[<210> 205]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 205]]> cuugggauug gugacgacag ccguggugga 30 <![CDATA[<210> 206]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 206]]> agguccacug gaggagaagu cccucauucc 30 <![CDATA[<210> 207]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 207]]> caugaaaucc caucccucgu ccuucagguc 30 <![CDATA[<210> 208]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 208]]> guuacaugaa aucccauccc ucguccuuca 30 <![CDATA[<210> 209]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 209]]> guaaaaaugg aauacucuug guuacaugaa 30 <![CDATA[<210> 210]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 210]]> aguaaaaaug gaauacucuu gguuacauga 30 <![CDATA[<210> 211]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 211]]> uaacauagca uaugagguga aaacacugcu 30 <![CDATA[<210> 212]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 212]]> ucucugccug gacuucuaac auagcauaug 30 <![CDATA[<210> 213]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 213]]> uugucucugc cuggacuucu aacauagcau 30 <![CDATA[<210> 214]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 214]]> auugucucug ccuggacuuc uaacauagca 30 <![CDATA[<210> 215]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 215]]> uauugucucu gccuggacuu cuaacauagc 30 <![CDATA[<210> 216]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 216]]> acaggaaugu uuuauugucu cugccuggac 30 <![CDATA[<210> 217]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 217]]> accucauaug cuauguuaga aguccaggca 30 <![CDATA[<210> 218]]> <![CDATA[<211> 30]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 2]]>18 uucgggcucu gguggaaaug gaucugucug 30 <![CDATA[<210> 219]]> <![CDATA[<211> 22]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 219]]> ccaccagagc ccgaaaaacg ug 22 <![CDATA[<210> 220]]> <![CDATA[<211> 21]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 220]]> caccagagcc cgaaaaacgu g 21 <![CDATA[<210> 221]]> <![CDATA[<211> 3162]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 221]]> atgagcagcg cgatcaaaag ctacaagagc gttctgcgtc cgaacgagcg taagaaccaa 60 ctgctgaaaa gcaccattca gtgcctggaa gacggtagcg cgttcttttt caagatgctg 120 caaggcctgt ttggtggcat caccccggag attgttcgtt tcagcaccga acaggagaaa 180 cagcaacagg atatcgcgct gtggtgcgcg gttaactggt tccgtccggt gagccaagac 240 agcctgaccc acaccattgc gagcgataac ctggtggaga agtttgagga atactatggt 300 ggcaccgcga gcgacgcgat caaacagtac ttcagcgcga gcattggcga aagctactat 360 tggaacgact gccgtcaaca gtactatgat ctgtgccgtg agctgggtgt tgaggtgagc 420 gacctgaccc atgatctgga gatcctgtgc cgtgaaaagt gcctggcggt tgcgaccgag 480 agcaaccaga acaacagcat cattagcgtt ctgtttggca ccggcgaaaa agaggaccgt 540 agcgtgaaac tgcgtatcac caagaaaatt ctggaggcga tcagcaacct gaaagaaatc 600 ccgaagaacg ttgcgccgat tcaagagatc attctgaacg tggcgaaagc gaccaaggaa 660 accttccgtc aggtgtatgc gggtaacctg ggtgcgccga gcaccctgga gaaatttatc 720 gcgaaggacg gccaaaaaga gttcgatctg aagaaactgc agaccgacct gaagaaagtt 780 attcgtggta aaagcaagga gcgtgattgg tgctgccagg aagagctgcg tagctacgtg 840 gagcaaaaca ccatccagta tgacctgtgg gcgtggggcg aaatgttcaa caaagcgcac 900 accgcgctga aaatcaagag cacccgtaac tacaactttg cgaagcaacg tctggaacag 960 ttcaaagaga ttcagagcct gaacaacctg ctggttgtga agaagctgaa cgactttttc 1020 gatagcgaat ttttcagcgg cgaggaaacc tacaccatct gcgttcacca tctgggtggc 1080 aaggacctga gcaaactgta taaggcgtgg gaggatgatc cggcggaccc ggaaaacgcg 1140 attgtggttc tgtgcgacga tctgaaaaac aactttaaga aagagccgat ccgtaacatt 1200 ctgcgttaca tcttcaccat tcgtcaagaa tgcagcgcgc aggacatcct ggcggcggcg 1260 aagtacaacc aacagctgga tcgttataaa agccaaaagg cgaacccgag cgttctgggt 1320 aaccagggct ttacctggac caacgcggtg atcctgccgg agaaggcgca gcgtaacgac 1380 cgtccgaaca gcctggatct gcgtatttgg ctgtacctga aactgcgtca cccggacggt 1440 cgttggaaga aacaccatat cccgttctac gatacccgtt tcttccaaga aatttatgcg 1500 gcgggcaaca gcccggttga cacctgccag tttcgtaccc cgcgtttcgg ttatcacctg 1560 ccgaaactga ccgatcagac cgcgatccgt gttaacaaga aacatgtgaa agcggcgaag 1620 accgaggcgc gtattcgtct ggcgatccaa cagggcaccc tgccggtgag caacctgaag 1680 atcaccgaaa ttagcgcgac catcaacagc aaaggtcaag tgcgtattcc ggttaagttt 1740 gacgtgggtc gtcaaaaagg caccctgcag atcggtgacc gtttctgcgg ctacgatcaa 1800 aaccagaccg cgagccacgc gtatagcctg tgggaagtgg ttaaagaggg tcaataccat 1860 aaagagctgg gctgctttgt tcgtttcatc agcagcggtg acatcgtgag cattaccgag 1920 aaccgtggca accaatttga tcagctgagc tatgaaggtc tggcgtaccc gcaatatgcg 1980 gactggcgta agaaagcgag caagttcgtg agcctgtggc agatcaccaa gaaaaacaag 2040 aaaaaggaaa tcgtgaccgt tgaagcgaaa gagaagtttg acgcgatctg caagtaccag 2100 ccgcgtctgt ataaattcaa caaggagtac gcgtatctgc tgcgtgatat tgttcgtggc 2160 aaaagcctgg tggaactgca acagattcgt caagagatct ttcgtttcat tgaacaggac 2220 tgcggtgtta cccgtctggg cagcctgagc ctgagcaccc tggaaaccgt gaaagcggtt 2280 aagggtatca tttacagcta ttttagcacc gcgctgaacg cgagcaagaa caacccgatc 2340 agcgacgaac agcgtaaaga gtttgatccg gaactgttcg cgctgctgga aaagctggag 2400 ctgattcgta cccgtaaaaa gaaacaaaaa gtggaacgta tcgcgaacag cctgattcag 2460 acctgcctgg agaacaacat caagttcatt cgtggtgaag gcgacctgag caccaccaac 2520 aacgcgacca agaaaaaggc gaacagccgt agcatggatt ggttggcgcg tggtgttttt 2580 aacaaaatcc gtcaactggc gccgatgcac aacattaccc tgttcggttg cggcagcctg 2640 tacaccagcc accaggaccc gctggtgcat cgtaacccgg ataaagcgat gaagtgccgt 2700 tgggcggcga tcccggttaa ggacattggc gattgggtgc tgcgtaagct gagccaaaac 2760 ctgcgtgcga aaaacatcgg caccggcgag tactatcacc aaggtgttaa agagttcctg 2820 agccattatg aactgcagga cctggaggaa gagctgctga agtggcgtag cgatcgtaaa 2880 agcaacattc cgtgctgggt gctgcagaac cgtctggcgg agaagctggg caacaaagaa 2940 gcggtggttt acatcccggt tcgtggtggc cgtatttatt ttgcgaccca caaggtggcg 3000 accggtgcgg tgagcatcgt tttcgaccaa aaacaagtgt gggtttgcaa cgcggatcat 3060 gttgcggcgg cgaacatcgc gctgaccgtg aagggtattg gcgaacaaag cagcgacgaa 3120 gagaacccgg atggtagccg tatcaaactg cagctgacca gc 3162 <![CDATA[<210> 222]]> <![CDATA[<211> 1054]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 222]]> Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu 1 5 10 15 Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly 20 25 30 Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr 35 40 45 Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp 50 55 60 Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp 65 70 75 80 Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu 85 90 95 Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser 100 105 110 Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr 115 120 125 Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His 130 135 140 Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu 145 150 155 160 Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu 165 170 175 Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu 180 185 190 Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln 195 200 205 Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln 210 215 220 Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile 225 230 235 240 Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp 245 250 255 Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys 260 265 270 Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp 275 280 285 Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys 290 295 300 Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln 305 310 315 320 Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu 325 330 335 Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr 340 345 350 Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys 355 360 365 Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu 370 375 380 Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile 385 390 395 400 Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile 405 410 415 Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln 420 425 430 Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn 435 440 445 Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser 450 455 460 Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly 465 470 475 480 Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln 485 490 495 Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg 500 505 510 Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala 515 520 525 Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg 530 535 540 Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys 545 550 555 560 Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile 565 570 575 Pro Val Lys Phe Asp Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly 580 585 590 Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr 595 600 605 Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly 610 615 620 Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu 625 630 635 640 Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr 645 650 655 Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu 660 665 670 Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu 675 680 685 Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr 690 695 700 Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly 705 710 715 720 Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe 725 730 735 Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser 740 745 750 Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe 755 760 765 Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln 770 775 780 Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu 785 790 795 800 Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn 805 810 815 Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly 820 825 830 Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn 835 840 845 Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg 850 855 860 Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu 865 870 875 880 Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala 885 890 895 Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp 900 905 910 Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Ile Gly Thr 915 920 925 Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu 930 935 940 Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys 945 950 955 960 Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu 965 970 975 Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile 980 985 990 Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe 995 1000 1005 Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala 1010 1015 1020 Ala Asn Ile Ala Leu Thr Val Lys Gly Ile Gly Glu Gln Ser Ser 1025 1030 1035 Asp Glu Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr 1040 1045 1050 Ser <![CDATA[<210> 223]]> <![CDATA[<211> 1054]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 223]]> Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu 1 5 10 15 Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly 20 25 30 Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr 35 40 45 Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp 50 55 60 Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp 65 70 75 80 Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu 85 90 95 Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser 100 105 110 Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr 115 120 125 Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His 130 135 140 Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu 145 150 155 160 Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu 165 170 175 Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu 180 185 190 Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln 195 200 205 Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln 210 215 220 Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile 225 230 235 240 Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp 245 250 255 Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys 260 265 270 Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp 275 280 285 Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys 290 295 300 Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln 305 310 315 320 Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu 325 330 335 Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr 340 345 350 Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys 355 360 365 Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu 370 375 380 Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile 385 390 395 400 Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile 405 410 415 Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln 420 425 430 Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn 435 440 445 Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser 450 455 460 Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly 465 470 475 480 Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln 485 490 495 Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg 500 505 510 Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala 515 520 525 Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg 530 535 540 Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys 545 550 555 560 Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile 565 570 575 Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly 580 585 590 Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr 595 600 605 Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly 610 615 620 Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu 625 630 635 640 Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr 645 650 655 Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu 660 665 670 Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu 675 680 685 Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr 690 695 700 Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly 705 710 715 720 Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe 725 730 735 Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser 740 745 750 Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe 755 760 765 Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln 770 775 780 Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu 785 790 795 800 Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn 805 810 815 Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly 820 825 830 Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn 835 840 845 Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg 850 855 860 Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu 865 870 875 880 Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala 885 890 895 Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Arg Trp 900 905 910 Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr 915 920 925 Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu 930 935 940 Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys 945 950 955 960 Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu 965 970 975 Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile 980 985 990 Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe 995 1000 1005 Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala 1010 1015 1020 Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Glu Gln Ser Ser 1025 1030 1035 Asp Glu Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr 1040 1045 1050 Ser <![CDATA[<210> 224]]> <![CDATA[<211> 1054]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 224]]> Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu 1 5 10 15 Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly 20 25 30 Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr 35 40 45 Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp 50 55 60 Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp 65 70 75 80 Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu 85 90 95 Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser 100 105 110 Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr 115 120 125 Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His 130 135 140 Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu 145 150 155 160 Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu 165 170 175 Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu 180 185 190 Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln 195 200 205 Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln 210 215 220 Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile 225 230 235 240 Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp 245 250 255 Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys 260 265 270 Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp 275 280 285 Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys 290 295 300 Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln 305 310 315 320 Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu 325 330 335 Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr 340 345 350 Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys 355 360 365 Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu 370 375 380 Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile 385 390 395 400 Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile 405 410 415 Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln 420 425 430 Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn 435 440 445 Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser 450 455 460 Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly 465 470 475 480 Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln 485 490 495 Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg 500 505 510 Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala 515 520 525 Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg 530 535 540 Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys 545 550 555 560 Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile 565 570 575 Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly 580 585 590 Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr 595 600 605 Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly 610 615 620 Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu 625 630 635 640 Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr 645 650 655 Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu 660 665 670 Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu 675 680 685 Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr 690 695 700 Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly 705 710 715 720 Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe 725 730 735 Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser 740 745 750 Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe 755 760 765 Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln 770 775 780 Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu 785 790 795 800 Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn 805 810 815 Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly 820 825 830 Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn 835 840 845 Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg 850 855 860 Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu 865 870 875 880 Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala 885 890 895 Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp 900 905 910 Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr 915 920 925 Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu 930 935 940 Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys 945 950 955 960 Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu 965 970 975 Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile 980 985 990 Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe 995 1000 1005 Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala 1010 1015 1020 Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Glu Gln Ser Ser 1025 1030 1035 Asp Glu Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr 1040 1045 1050 Ser <![CDATA[<210> 225]]> <![CDATA[<211]]>> 1054]]> <br/><![CDATA[<212> PRT]]> <br/><![CDATA[<213> 人工序列]]> <br/> <br/><![CDATA[<220>]]> <br/><![CDATA[<223> 合成的]]> <br/> <br/><![CDATA[<400> 225]]> <br/> <br/><![CDATA[Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu 1 5 10 15 Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly 20 25 30 Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr 35 40 45 Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp 50 55 60 Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp 65 70 75 80 Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu 85 90 95 Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser 100 105 110 Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr 115 120 125 Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His 130 135 140 Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu 145 150 155 160 Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu 165 170 175 Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu 180 185 190 Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln 195 200 205 Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln 210 215 220 Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile 225 230 235 240 Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp 245 250 255 Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys 260 265 270 Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp 275 280 285 Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys 290 295 300 Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln 305 310 315 320 Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu 325 330 335 Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr 340 345 350 Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys 355 360 365 Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu 370 375 380 Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile 385 390 395 400 Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile 405 410 415 Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln 420 425 430 Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn 435 440 445 Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser 450 455 460 Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly 465 470 475 480 Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln 485 490 495 Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg 500 505 510 Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala 515 520 525 Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg 530 535 540 Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys 545 550 555 560 Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile 565 570 575 Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly 580 585 590 Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr 595 600 605 Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly 610 615 620 Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu 625 630 635 640 Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr 645 650 655 Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu 660 665 670 Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu 675 680 685 Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr 690 695 700 Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly 705 710 715 720 Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe 725 730 735 Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser 740 745 750 Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe 755 760 765 Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln 770 775 780 Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu 785 790 795 800 Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn 805 810 815 Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly 820 825 830 Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn 835 840 845 Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg 850 855 860 Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu 865 870 875 880 Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala 885 890 895 Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp 900 905 910 Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr 915 920 925 Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu 930 935 940 Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys 945 950 955 960 Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu 965 970 975 Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile 980 985 990 Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe 995 1000 1005 Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala 1010 1015 1020 Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Glu Gln Ser Ser 1025 1030 1035 Asp Glu Glu Asn Pro Asp Gly Gly Arg Ile Lys Leu Gln Leu Thr 1040 1045 1050 Ser <![CDATA[<210> 226]]> <![CDATA[<211> 1054]]> <![CDATA[<212> PRT]]> <![CDATA[<21]]>3> 人工序列]]> <br/> <br/><![CDATA[<220>]]> <br/><![CDATA[<223> 合成的]]> <br/> <br/><![CDATA[<400> 226]]> <br/> <br/><![CDATA[Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu 1 5 10 15 Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly 20 25 30 Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr 35 40 45 Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp 50 55 60 Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp 65 70 75 80 Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu 85 90 95 Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser 100 105 110 Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr 115 120 125 Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His 130 135 140 Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu 145 150 155 160 Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu 165 170 175 Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu 180 185 190 Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln 195 200 205 Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln 210 215 220 Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile 225 230 235 240 Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp 245 250 255 Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys 260 265 270 Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp 275 280 285 Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys 290 295 300 Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln 305 310 315 320 Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu 325 330 335 Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr 340 345 350 Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys 355 360 365 Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu 370 375 380 Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile 385 390 395 400 Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile 405 410 415 Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln 420 425 430 Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn 435 440 445 Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser 450 455 460 Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly 465 470 475 480 Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln 485 490 495 Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg 500 505 510 Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala 515 520 525 Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg 530 535 540 Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys 545 550 555 560 Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile 565 570 575 Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly 580 585 590 Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr 595 600 605 Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Arg 610 615 620 Cys Arg Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu 625 630 635 640 Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr 645 650 655 Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu 660 665 670 Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu 675 680 685 Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr 690 695 700 Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly 705 710 715 720 Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe 725 730 735 Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser 740 745 750 Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe 755 760 765 Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln 770 775 780 Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu 785 790 795 800 Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn 805 810 815 Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly 820 825 830 Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn 835 840 845 Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg 850 855 860 Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu 865 870 875 880 Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala 885 890 895 Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp 900 905 910 Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr 915 920 925 Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu 930 935 940 Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys 945 950 955 960 Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu 965 970 975 Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile 980 985 990 Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe 995 1000 1005 Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala 1010 1015 1020 Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Arg Gln Ser Ser 1025 1030 1035 Asp Glu Glu Asn Pro Asp Gly Gly Arg Ile Lys Leu Gln Leu Thr 1040 1045 1050 Ser <![CDATA[<210> 227]]> <![CDATA[<211> 1054]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 227]]> Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu 1 5 10 15 Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly 20 25 30 Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr 35 40 45 Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp 50 55 60 Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp 65 70 75 80 Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu 85 90 95 Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser 100 105 110 Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr 115 120 125 Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His 130 135 140 Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu 145 150 155 160 Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu 165 170 175 Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu 180 185 190 Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln 195 200 205 Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln 210 215 220 Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile 225 230 235 240 Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp 245 250 255 Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys 260 265 270 Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp 275 280 285 Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys 290 295 300 Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln 305 310 315 320 Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu 325 330 335 Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr 340 345 350 Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys 355 360 365 Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu 370 375 380 Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile 385 390 395 400 Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile 405 410 415 Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln 420 425 430 Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn 435 440 445 Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser 450 455 460 Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly 465 470 475 480 Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln 485 490 495 Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg 500 505 510 Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala 515 520 525 Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg 530 535 540 Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys 545 550 555 560 Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile 565 570 575 Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly 580 585 590 Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr 595 600 605 Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Arg 610 615 620 Cys Arg Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu 625 630 635 640 Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr 645 650 655 Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu 660 665 670 Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu 675 680 685 Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr 690 695 700 Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly 705 710 715 720 Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe 725 730 735 Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser 740 745 750 Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe 755 760 765 Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln 770 775 780 Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu 785 790 795 800 Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn 805 810 815 Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly 820 825 830 Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn 835 840 845 Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg 850 855 860 Gln Leu Ala Thr Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu 865 870 875 880 Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala 885 890 895 Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp 900 905 910 Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr 915 920 925 Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu 930 935 940 Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys 945 950 955 960 Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu 965 970 975 Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile 980 985 990 Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe 995 1000 1005 Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala 1010 1015 1020 Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Arg Gln Ser Ser 1025 1030 1035 Asp Glu Glu Asn Pro Asp Gly Gly Arg Ile Lys Leu Gln Leu Thr 1040 1045 1050 Ser <![CDATA[<210> 228]]> <![CDATA[<211> 6945]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 228]]> acagaagtcc actcattctt ggcaggatgg cttctcatcg tctgctcctc ctctgccttg 60 ctggactggt atttgtgtct gaggctggcc ctacggtgag tgtttctgtg acatcccatt 120 cctacattta agattcacgc taaatgaagt agaagtgact ccttccagct ttgccaacca 180 gcttttatta ctagggcaag ggtacccagc atctattttt aatataatta attcaaactt 240 caaaaagaat gaagttccac tgagcttact gagctgggac ttgaactctg agcattctac 300 ctcattgctt tggtgcatta ggtttgtaat atctggtacc tctgtttcct cagatagatg 360 atagaaataa agatatgata ttaaggaagc tgttaatact gaattttcag aaaagtatcc 420 ctccataaaa tgtatttggg ggacaaactg caggagatta tattctggcc ctatagttat 480 tcaaaacgta tttattgatt aatctttaaa aggcttagtg aacaatattc tagtcagata 540 tctaattctt aaatcctcta gaagaattaa ctaatactat aaaatgggtc tggatgtagt 600 tctgacatta ttttataaca actggtaaga gggagtgact atagcaacaa ctaaaatgat 660 ctcaggaaaa cctgtttggc cctatgtatg gtacattaca tcttttcagt aattccactc 720 aaatggagac ttttaacaaa gcaactgttc tcaggggacc tattttctcc cttaaaattc 780 attatacaca tccctggttg atagcagtgt gtctggaggc agaaaccatt cttgctttgg 840 aaacaattac gtctgtgtta tactgagtag ggaagctcat taattgtcga cacttacgtt 900 cctgataatg ggatcagtgt gtaattcttg tttcgctcca gatttctaat accacaaaga 960 ataaatcctt tcactctgat caattttgtt aacttctcac gtgtcttctc tacacccagg 1020 gcaccggtga atccaagtgt cctctgatgg tcaaagttct agatgctgtc cgaggcagtc 1080 ctgccatcaa tgtggccgtg catgtgttca gaaaggctgc tgatgacacc tgggagccat 1140 ttgcctctgg gtaagttgcc aaagaaccct cccacaggac ttggttttat cttcccgttt 1200 gcccctcact tggtagagag aggctcacat catctgctaa agaatttaca agtagattga 1260 aaaacgtagg cagaggtcaa gtatgccctc tgaaggatgc cctctttttg ttttgcttag 1320 ctaggaagtg accaggaacc tgagcatcat ttaggggcag acagtagaga aaagaaggaa 1380 tcagaactcc tctcctctag ctgtggtttg caaccctttt gggtcacaga acactttatg 1440 taggtgatga aaagtaaaca ttctatgccc agaaaaaatg cacagataca cacacataca 1500 aaatcatata tgtgatttta ggagtttcac agattccctg gtgtccctgg gtaacaccaa 1560 agctaagtgt ccttgtctta gaattttagg aaaaggtata atgtgtatta acccattaac 1620 aaaaggaaag gaattcagaa atattattaa ccaggcatct gtctgtagtt aatatggatc 1680 acccaaaacc caaggctttt gcctaatgaa cactttgggg cacctactgt gtgcaaggct 1740 gggggctgtc aagctcagtt aaaaaaaaaa agatagaaga gatggatcca tgaggcaaag 1800 tacagcccca ggctaatccc acgatcaccc gacttcatgt ccaagagtgg cttctcacct 1860 tcattagcca gttcacaatt ttcatggagt ttttctacct gcactagcaa aaacttcaag 1920 gaaaatacat attaataaat ctaagcaaag tgaccagaag acagagcaat caggagaccc 1980 tttgcatcca gcagaagagg aactgctaag tatttacatc tccacagaga agaatttctg 2040 ttgggtttta attgaacccc aagaaccaca tgattcttca accattattg ggaagatcat 2100 tttcttaggt ctggttttaa ctggcttttt atttgggaat tcatttatgt ttatataaaa 2160 tgccaagcat aacatgaaaa gtggttacag gactattcta agggagagac agaatggaca 2220 ccaaaaatat tccaatgttc ttgtgaatct tttccttgca ccaggacaaa aaaaaaaaga 2280 agtgaaaaga agaaaggagg aggggcataa tcagagtcag taaagacaac tgctattttt 2340 atctatcgta gctgttgcag tcaaatggga agcaatttcc aacattcaac tatggagctg 2400 gtacttacat ggaaatagaa gttgcctagt gtttgttgct ggcaaagagt tatcagagag 2460 gttaaatata taaaagggaa aagagtcaga tacaggttct tcttcctact ttaggttttc 2520 cactgtgtgt gcaaatgata ctccctggtg gtgtgcagat gcctcaaagc tatcctcaca 2580 ccacaaggga gaggagcgag atcctgctgt cctggagaag tgcagagtta gaacagctgt 2640 ggccacttgc atccaatcat caatcttgaa tcacagggac tctttcttaa gtaaacatta 2700 tacctggccg ggcacggtgg ctcacgcctg taatcccagc actttgggat gccaaagtgg 2760 gcatatcatc tgaggtcagg agttcaagac cagcctggcc aacatggcaa aactccgtct 2820 ttatgaaaaa tacaaaaatt agccaggcat ggtggcaggc gcctgtaatc ccagctaatt 2880 gggaggctga ggctggagaa tcccttgaat ctaggaggca gaggttgcag tgagctgaga 2940 tcgtgccatt gcactccagc ctgggtgaca agagtaaaac tctgtctcaa aaaaaaaaaa 3000 ttatacctac attctcttct tatcagagaa aaaaatctac agtgagcttt tcaaaaagtt 3060 tttacaaact ttttgccatt taatttcagt taggagtttt ccctacttct gacttagttg 3120 aggggaaatg ttcataacat gtttataaca tgtttatgtg tgttagttgg tgggggtgta 3180 ttactttgcc atgccatttg tttcctccat gcgtaactta atccagactt tcacacctta 3240 taggaaaacc agtgagtctg gagagctgca tgggctcaca actgaggagg aatttgtaga 3300 agggatatac aaagtggaaa tagacaccaa atcttactgg aaggcacttg gcatctcccc 3360 attccatgag catgcagagg tgagtataca gaccttcgag ggttgttttg gttttggttt 3420 ttgcttttgg cattccagga aatgcacagt tttactcagt gtaccacaga aatgtcctaa 3480 ggaaggtgat gaatgaccaa aggttccctt tcctattata caagaaaaaa ttcacaacac 3540 tctgagaagc aaatttcttt ttgactttga tgaaaatcca cttagtaaca tgacttgaac 3600 ttacatgaaa ctactcatag tctattcatt ccactttata tgaatattga tgtatctgct 3660 gttgaaataa tagtttatga ggcagccctc cagaccccac gtagagtgta tgtaacaaga 3720 gatgcaccat tttatttctc gaaaacccgt aacattcttc attccaaaac acatctggct 3780 tctcggaggt ctggacaagt gattcttggc aacacatacc tatagagaca ataaaatcaa 3840 agtaataatg gcaacacaat agataacatt taccaagcat acaccatgtg gcagacacaa 3900 ttataagtgt tttccatatt taacctactt aatcctcagg aataagccac tgaggtcagt 3960 cctattatta tccccatctt atagatgaag aaaatgaggc accaggaagt caaataactt 4020 gtcaaaggtc acaagactag gaaatacaca agtagaaatg tttacaatta aggcccaggc 4080 tgggtttgcc ctcagttctg ctatgcctcg cattatgccc caggaaactt tttcccttgt 4140 gaaagccaag cttaaaaaaa gaaaagccac atttgtaacg tgctctgttc ccctgcctat 4200 ggtgaggatc ttcaaacagt tatacatgga cccagtcccc ctgccttctc cttaatttct 4260 taagtcattt gaaacagatg gctgtcatgg aaatagaatc cagacatgtt ggtcagagtt 4320 aaagatcaac taattccatc aaaaatagct cggcatgaaa gggaactatt ctctggctta 4380 gtcatggatg agactttcaa ttgctataaa gtggttcctt tattagacaa tgttaccagg 4440 gaaacaacag gggtttgttt gacttctggg gcccacaagt caacaagaga gccccatcta 4500 ccaaggagca tgtccctgac tacccctcag ccagcagcaa gacatggacc ccagtcaggg 4560 caggagcagg gtttcggcgg cgcccagcac aagacattgc ccctagagtc tcagccccta 4620 ccctcgagta atagatctgc ctacctgaga ctgttgtttg cccaagagct gggtctcagc 4680 ctgatgggaa ccatataaaa aggttcactg acatactgcc cacatgttgt tctctttcat 4740 tagatcttag cttccttgtc tgctcttcat tcttgcagta ttcattcaac aaacattaaa 4800 aaaaaaaaaa agcattctat gtgtggaaca ctctgctaga tgctgtggat ttagaaatga 4860 aaatacatcc cgacccttgg aatggaaggg aaaggactga agtaagacag attaagcagg 4920 accgtcagcc cagcttgaag cccagataaa tacggagaac aagagagagc gagtagtgag 4980 agatgagtcc caatgcctca ctttggtgac gggtgcgtgg tgggcttcat gcagcttctt 5040 ctgataaatg cctccttcag aactggtcaa ctctaccttg gccagtgacc caggtggtca 5100 tagtagattt accaagggaa aatggaaact tttattagga gctcttaggc ctcttcactt 5160 catggatttt tttttccttt ttttttgaga tggagttttg ccctgtcacc caggctggaa 5220 tgcagtggtg caatctcagc tcactgcaac ctccgcctcc caggttcaag caattctcct 5280 gcctcagcct cccgagtagc tgggactaca ggtgtgcgcc accacaccag gctaattttt 5340 gtattttttg taaagacagg ttttcaccac gttggccagg ctggtctgaa ctccagacct 5400 caggtgattc acctgtctca gcctcccaaa gtgctgggat tacaggtgtg agccaccgtg 5460 cccggctact tcatggattt ttgattacag attatgcctc ttacaatttt taagaagaat 5520 caagtgggct gaaggtcaat gtcaccataa gacaaaagac atttttatta gttgattcta 5580 gggaattggc cttaagggga gccctttctt cctaagagat tcttaggtga ttctcacttc 5640 ctcttgcccc agtattattt ttgtttttgg tatggctcac tcagatcctt ttttcctcct 5700 atccctaagt aatccgggtt tctttttccc atatttagaa caaaatgtat ttatgcagag 5760 tgtgtccaaa cctcaaccca aggcctgtat acaaaataaa tcaaattaaa cacatcttta 5820 ctgtcttcta cctctttcct gacctcaata tatcccaact tgcctcactc tgagaaccaa 5880 ggctgtccca gcacctgagt cgcagatatt ctactgattt gacagaactg tgtgactatc 5940 tggaacagca ttttgatcca caatttgccc agttacaaag cttaaatgag ctctagtgca 6000 tgcatatata tttcaaaatt ccaccatgat cttccacact ctgtattgta aatagagccc 6060 tgtaatgctt ttacttcgta tttcattgct tgttatacat aaaaatatac ttttcttctt 6120 catgttagaa aatgcaaaga ataggagggt gggggaatct ctgggcttgg agacaggaga 6180 cttgccttcc tactatggtt ccatcagaat gtagactggg acaatacaat aattcaagtc 6240 tggtttgctc atctgtaaat tgggaagaat gtttccagct ccagaatgct aaatctctaa 6300 gtctgtggtt ggcagccact attgcagcag ctcttcaatg actcaatgca gttttgcatt 6360 ctccctacct tttttttcta aaaccaataa aatagataca gcctttaggc tttctgggat 6420 ttcccttagt caagctaggg tcatcctgac tttcggcgtg aatttgcaaa acaagacctg 6480 actctgtact cctgctctaa ggactgtgca tggttccaaa ggcttagctt gccagcatat 6540 ttgagctttt tccttctgtt caaactgttc caaaatataa aagaataaaa ttaattaagt 6600 tggcactgga cttccggtgg tcagtcatgt gtgtcatctg tcacgttttt cgggctctgg 6660 tggaaatgga tctgtctgtc ttctctcata ggtggtattc acagccaacg actccggccc 6720 ccgccgctac accattgccg ccctgctgag cccctactcc tattccacca cggctgtcgt 6780 caccaatccc aaggaatgag ggacttctcc tccagtggac ctgaaggacg agggatggga 6840 tttcatgtaa ccaagagtat tccattttta ctaaagcagt gttttcacct catatgctat 6900 gttagaagtc caggcagaga caataaaaca ttcctgtgaa aggca 6945 <![CDATA[<210> 229]]> <![CDATA[<211> 145]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400>]]> 229 acagaagtcc actcattctt ggcaggatgg cttctcatcg tctgctcctc ctctgccttg 60 ctggactggt atttgtgtct gaggctggcc ctacggtgag tgtttctgtg acatcccatt 120 cctacattta agattcacgc taaat 145 <![CDATA[<210> 230]]> <![CDATA[<211> 231]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 230]]> ttcactctga tcaattttgt taacttctca cgtgtcttct ctacacccag ggcaccggtg 60 aatccaagtg tcctctgatg gtcaaagttc tagatgctgt ccgaggcagt cctgccatca 120 atgtggccgt gcatgtgttc agaaaggctg ctgatgacac ctgggagcca tttgcctctg 180 ggtaagttgc caaagaaccc tcccacagga cttggtttta tcttcccgtt t 231 <![CDATA[<210> 231]]> <![CDATA[<211> 236]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 231]]> ccatttgttt cctccatgcg taacttaatc cagactttca caccttatag gaaaaccagt 60 gagtctggag agctgcatgg gctcacaact gaggaggaat ttgtagaagg gatatacaaa 120 gtggaaatag acaccaaatc ttactggaag gcacttggca tctccccatt ccatgagcat 180 gcagaggtga gtatacagac cttcgagggt tgttttggtt ttggtttttg cttttg 236 <![CDATA[<210> 232]]> <![CDATA[<211> 304]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 232]]> cacgtttttc gggctctggt ggaaatggat ctgtctgtct tctctcatag gtggtattca 60 cagccaacga ctccggcccc cgccgctaca ccattgccgc cctgctgagc ccctactcct 120 attccaccac ggctgtcgtc accaatccca aggaatgagg gacttctcct ccagtggacc 180 tgaaggacga gggatgggat ttcatgtaac caagagtatt ccatttttac taaagcagtg 240 ttttcacctc atatgctatg ttagaagtcc aggcagagac aataaaacat tcctgtgaaa 300 ggca 304 <![CDATA[<210> 233]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 233]]> ucucaacgau agucagacau guguccucag ugacac 36 <![CDATA[<210> 234]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 234]]> uuuuaacaac acucaggcau guguccacag ugacac 36 <![CDATA[<210> 235]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 235]]> uugaacggau acucagacau guguuuccag ugacac 36 <![CDATA[<210> 236]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 236]]> ugcccucaau agucagaugu guguccacag ugacac 36 <![CDATA[<210> 237]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 237]]> ucucaaugau acuuagauac guguccucag ugacac 36 <![CDATA[<210> 238]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 238]]> ucucaaugau acucagacau guguccccag ugacac 36 <![CDATA[<210> 239]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 239]]> ucucaaugau acuaagacau guguccucag ugacac 36 <![CDATA[<210> 240]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 240]]> ucucaacuau acucagacau guguccucag ugacac 36 <![CDATA[<210> 241]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 241]]> ucucaacgau acucagacau guguccucag ugacac 36 <![CDATA[<210> 242]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 242]]> ucucaacgau acuaagauau guguccucag cgacac 36 <![CDATA[<210> 243]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 243]]> ucucaacgau acuaagauau guguccccag ugacac 36 <![CDATA[<210> 244]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 244]]> ucucaacgau acuaagauau guguccacag ugacac 36 <![CDATA[<210> 245]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> ]]>人工序列 <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 245]]> ucucaacaau acucagacau guguccccag ugacac 36 <![CDATA[<210> 246]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 246]]> ucucaacaau acuaaggcau guguccccag ugaccc 36 <![CDATA[<210> 247]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 247]]> ucucaaagau acucagacac guguccccag ugacac 36 <![CDATA[<210> 248]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 248]]> ucucaaaaau acucagacau guguccucag ugacac 36 <![CDATA[<210> 249]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 249]]> gcgaaacaac agucagacau guguccccag ugacac 36 <![CDATA[<210> 250]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 250]]> ccucaacgau auuaagacau guguccgcag ugacac 36 <![CDATA[<210> 251]]> <![CDATA[<211> 22]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 251]]> agacaugugu ccucagugac ac 22 <![CDATA[<210> 252]]> <![CDATA[<211> 3222]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 252]]> atggcttcca tctctaggcc atacggcacc aagctgcgac cggacgcacg gaagaaggag 60 atgctcgata agttctttaa tacactgact aagggtcagc gcgtgttcgc agacctggcc 120 ctgtgcatct atggctccct gaccctggag atggccaagt ctctggagcc agaaagtgat 180 tcagaactgg tgtgcgctat tgggtggttt cggctggtgg acaagaccat ctggtccaag 240 gatggcatca agcaggagaa tctggtgaaa cagtacgaag cctattccgg aaaggaggct 300 tctgaagtgg tcaaaacata cctgaacagc cccagctccg acaagtacgt gtggatcgat 360 tgcaggcaga aattcctgag gtttcagcgc gagctcggca ctcgcaacct gtccgaggac 420 ttcgaatgta tgctctttga acagtacatt agactgacca agggcgagat cgaagggtat 480 gccgctattt caaatatgtt cggaaacggc gagaaggaag accggagcaa gaaaagaatg 540 tacgctacac ggatgaaaga ttggctggag gcaaacgaaa atatcacttg ggagcagtat 600 agagaggccc tgaagaacca gctgaatgct aaaaacctgg agcaggttgt ggccaattac 660 aaggggaacg ctggcggggc agaccccttc tttaagtata gcttctccaa agagggaatg 720 gtgagcaaga aagaacatgc acagcagctc gacaagttca aaaccgtcct gaagaacaaa 780 gcccgggacc tgaattttcc aaacaaggag aagctgaagc agtacctgga ggccgaaatc 840 ggcattccgg tcgacgctaa cgtgtactcc cagatgttct ctaacggggt gagtgaggtc 900 cagcctaaga ccacacggaa tatgtctttt agtaacgaga aactggatct gctcactgaa 960 ctgaaggacc tgaacaaggg cgatgggttc gagtacgcca gagaagtgct gaacgggttc 1020 tttgactccg agctccacac taccgaggat aagtttaata tcacctctag gtacctggga 1080 ggcgacaaat caaaccgcct gagcaaactc tataagatct ggaagaaaga gggtgtggac 1140 tgcgaggaag gcattcagca gttctgtgaa gccgtcaaag ataagatggg ccagatcccc 1200 attcgaaatg tgctgaagta cctgtggcag ttccgggaga cagtcagtgc cgaggatttt 1260 gaagcagccg ctaaggctaa ccatctggag gaaaagatca gccgggtgaa agcccaccca 1320 atcgtgatta gcaataggta ctgggctttt gggacttccg cactggtggg aaacattatg 1380 cccgcagaca agaggcatca gggagagtat gccggtcaga atttcaaaat gtggctggag 1440 gctgaactgc actacgatgg caagaaagca aagcaccatc tgccttttta taacgcccgc 1500 ttctttgagg aagtgtactg ctatcacccc tctgtcgccg agatcactcc tttcaaaacc 1560 aagcagtttg gctgtgaaat cgggaaggac attccagatt acgtgagcgt cgctctgaag 1620 gacaatccgt ataagaaagc aaccaaacga atcctgcgtg caatctacaa tcccgtcgcc 1680 aacacaactg gcgttgataa gaccacaaac tgcagcttca tgatcaaacg cgagaatgac 1740 gaatataagc tggtcatcaa ccgaaaaatt tccgtggatc ggcctaagag aatcgaagtg 1800 ggcaggacaa ttatggggta cgaccgcaat cagacagcta gcgatactta ttggattggc 1860 cggctggtgc cacctggaac ccggggcgca taccgcatcg gagagtggag cgtccagtat 1920 attaagtccg ggcctgtcct gtctagtact cagggagtta acaattccac taccgaccag 1980 ctggtgtaca acggcatgcc atcaagctcc gagcggttca aggcctggaa gaaagccaga 2040 atggctttta tccgaaaact cattcgtcag ctgaatgacg agggactgga atctaagggt 2100 caggattata tccccgagaa cccttctagt ttcgatgtgc ggggcgaaac cctgtacgtc 2160 tttaacagta attatctgaa ggccctggtg agcaaacaca gaaaggccaa gaaacctgtt 2220 gaggggatcc tggacgagat tgaagcctgg acatctaaag acaaggattc atgcagcctg 2280 atgcggctga gcagcctgag cgatgcttcc atgcagggaa tcgccagcct gaagagtctg 2340 attaacagct acttcaacaa gaatggctgt aaaaccatcg aggacaaaga aaagtttaat 2400 cccgtgctgt atgccaagct ggttgaggtg gaacagcgga gaacaaacaa gcggtctgag 2460 aaagtgggaa gaatcgcagg tagtctggag cagctggccc tgctgaacgg ggttgaggtg 2520 gtcatcggcg aagctgacct gggggaggtc gaaaaaggaa agagtaagaa acagaattca 2580 cggaacatgg attggtgcgc aaagcaggtg gcacagcggc tggagtacaa actggccttc 2640 catggaatcg gttactttgg agtgaacccc atgtatacca gccaccagga ccctttcgaa 2700 cataggcgcg tggctgatca catcgtcatg cgagcacgtt ttgaggaagt caacgtggag 2760 aacattgccg aatggcacgt gcgaaatttc tcaaactacc tgcgtgcaga cagcggcact 2820 gggctgtact ataagcaggc caccatggac ttcctgaaac attacggtct ggaggaacac 2880 gctgagggcc tggaaaataa gaaaatcaag ttctatgact ttagaaagat cctggaggat 2940 aaaaacctga caagcgtgat cattccaaag aggggcgggc gcatctacat ggccaccaac 3000 ccagtgacat ccgactctac cccgattaca tacgccggca agacttataa taggtgtaac 3060 gctgatgagg tggcagccgc taatatcgtt atttctgtgc tggctccccg cagtaagaaa 3120 aacgaggaac aggacgatat ccctctgatt accaagaaag ccgagagtaa gtcaccaccg 3180 aaagaccgga agagatcaaa aacaagccag ctgcctcaga aa 3222 <![CDATA[<210> 253]]> <![CDATA[<211> 1074]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 253]]> Met Ala Ser Ile Ser Arg Pro Tyr Gly Thr Lys Leu Arg Pro Asp Ala 1 5 10 15 Arg Lys Lys Glu Met Leu Asp Lys Phe Phe Asn Thr Leu Thr Lys Gly 20 25 30 Gln Arg Val Phe Ala Asp Leu Ala Leu Cys Ile Tyr Gly Ser Leu Thr 35 40 45 Leu Glu Met Ala Lys Ser Leu Glu Pro Glu Ser Asp Ser Glu Leu Val 50 55 60 Cys Ala Ile Gly Trp Phe Arg Leu Val Asp Lys Thr Ile Trp Ser Lys 65 70 75 80 Asp Gly Ile Lys Gln Glu Asn Leu Val Lys Gln Tyr Glu Ala Tyr Ser 85 90 95 Gly Lys Glu Ala Ser Glu Val Val Lys Thr Tyr Leu Asn Ser Pro Ser 100 105 110 Ser Asp Lys Tyr Val Trp Ile Asp Cys Arg Gln Lys Phe Leu Arg Phe 115 120 125 Gln Arg Glu Leu Gly Thr Arg Asn Leu Ser Glu Asp Phe Glu Cys Met 130 135 140 Leu Phe Glu Gln Tyr Ile Arg Leu Thr Lys Gly Glu Ile Glu Gly Tyr 145 150 155 160 Ala Ala Ile Ser Asn Met Phe Gly Asn Gly Glu Lys Glu Asp Arg Ser 165 170 175 Lys Lys Arg Met Tyr Ala Thr Arg Met Lys Asp Trp Leu Glu Ala Asn 180 185 190 Glu Asn Ile Thr Trp Glu Gln Tyr Arg Glu Ala Leu Lys Asn Gln Leu 195 200 205 Asn Ala Lys Asn Leu Glu Gln Val Val Ala Asn Tyr Lys Gly Asn Ala 210 215 220 Gly Gly Ala Asp Pro Phe Phe Lys Tyr Ser Phe Ser Lys Glu Gly Met 225 230 235 240 Val Ser Lys Lys Glu His Ala Gln Gln Leu Asp Lys Phe Lys Thr Val 245 250 255 Leu Lys Asn Lys Ala Arg Asp Leu Asn Phe Pro Asn Lys Glu Lys Leu 260 265 270 Lys Gln Tyr Leu Glu Ala Glu Ile Gly Ile Pro Val Asp Ala Asn Val 275 280 285 Tyr Ser Gln Met Phe Ser Asn Gly Val Ser Glu Val Gln Pro Lys Thr 290 295 300 Thr Arg Asn Met Ser Phe Ser Asn Glu Lys Leu Asp Leu Leu Thr Glu 305 310 315 320 Leu Lys Asp Leu Asn Lys Gly Asp Gly Phe Glu Tyr Ala Arg Glu Val 325 330 335 Leu Asn Gly Phe Phe Asp Ser Glu Leu His Thr Thr Glu Asp Lys Phe 340 345 350 Asn Ile Thr Ser Arg Tyr Leu Gly Gly Asp Lys Ser Asn Arg Leu Ser 355 360 365 Lys Leu Tyr Lys Ile Trp Lys Lys Glu Gly Val Asp Cys Glu Glu Gly 370 375 380 Ile Gln Gln Phe Cys Glu Ala Val Lys Asp Lys Met Gly Gln Ile Pro 385 390 395 400 Ile Arg Asn Val Leu Lys Tyr Leu Trp Gln Phe Arg Glu Thr Val Ser 405 410 415 Ala Glu Asp Phe Glu Ala Ala Ala Lys Ala Asn His Leu Glu Glu Lys 420 425 430 Ile Ser Arg Val Lys Ala His Pro Ile Val Ile Ser Asn Arg Tyr Trp 435 440 445 Ala Phe Gly Thr Ser Ala Leu Val Gly Asn Ile Met Pro Ala Asp Lys 450 455 460 Arg His Gln Gly Glu Tyr Ala Gly Gln Asn Phe Lys Met Trp Leu Glu 465 470 475 480 Ala Glu Leu His Tyr Asp Gly Lys Lys Ala Lys His His Leu Pro Phe 485 490 495 Tyr Asn Ala Arg Phe Phe Glu Glu Val Tyr Cys Tyr His Pro Ser Val 500 505 510 Ala Glu Ile Thr Pro Phe Lys Thr Lys Gln Phe Gly Cys Glu Ile Gly 515 520 525 Lys Asp Ile Pro Asp Tyr Val Ser Val Ala Leu Lys Asp Asn Pro Tyr 530 535 540 Lys Lys Ala Thr Lys Arg Ile Leu Arg Ala Ile Tyr Asn Pro Val Ala 545 550 555 560 Asn Thr Thr Gly Val Asp Lys Thr Thr Asn Cys Ser Phe Met Ile Lys 565 570 575 Arg Glu Asn Asp Glu Tyr Lys Leu Val Ile Asn Arg Lys Ile Ser Val 580 585 590 Asp Arg Pro Lys Arg Ile Glu Val Gly Arg Thr Ile Met Gly Tyr Asp 595 600 605 Arg Asn Gln Thr Ala Ser Asp Thr Tyr Trp Ile Gly Arg Leu Val Pro 610 615 620 Pro Gly Thr Arg Gly Ala Tyr Arg Ile Gly Glu Trp Ser Val Gln Tyr 625 630 635 640 Ile Lys Ser Gly Pro Val Leu Ser Ser Thr Gln Gly Val Asn Asn Ser 645 650 655 Thr Thr Asp Gln Leu Val Tyr Asn Gly Met Pro Ser Ser Ser Glu Arg 660 665 670 Phe Lys Ala Trp Lys Lys Ala Arg Met Ala Phe Ile Arg Lys Leu Ile 675 680 685 Arg Gln Leu Asn Asp Glu Gly Leu Glu Ser Lys Gly Gln Asp Tyr Ile 690 695 700 Pro Glu Asn Pro Ser Ser Phe Asp Val Arg Gly Glu Thr Leu Tyr Val 705 710 715 720 Phe Asn Ser Asn Tyr Leu Lys Ala Leu Val Ser Lys His Arg Lys Ala 725 730 735 Lys Lys Pro Val Glu Gly Ile Leu Asp Glu Ile Glu Ala Trp Thr Ser 740 745 750 Lys Asp Lys Asp Ser Cys Ser Leu Met Arg Leu Ser Ser Leu Ser Asp 755 760 765 Ala Ser Met Gln Gly Ile Ala Ser Leu Lys Ser Leu Ile Asn Ser Tyr 770 775 780 Phe Asn Lys Asn Gly Cys Lys Thr Ile Glu Asp Lys Glu Lys Phe Asn 785 790 795 800 Pro Val Leu Tyr Ala Lys Leu Val Glu Val Glu Gln Arg Arg Thr Asn 805 810 815 Lys Arg Ser Glu Lys Val Gly Arg Ile Ala Gly Ser Leu Glu Gln Leu 820 825 830 Ala Leu Leu Asn Gly Val Glu Val Val Ile Gly Glu Ala Asp Leu Gly 835 840 845 Glu Val Glu Lys Gly Lys Ser Lys Lys Gln Asn Ser Arg Asn Met Asp 850 855 860 Trp Cys Ala Lys Gln Val Ala Gln Arg Leu Glu Tyr Lys Leu Ala Phe 865 870 875 880 His Gly Ile Gly Tyr Phe Gly Val Asn Pro Met Tyr Thr Ser His Gln 885 890 895 Asp Pro Phe Glu His Arg Arg Val Ala Asp His Ile Val Met Arg Ala 900 905 910 Arg Phe Glu Glu Val Asn Val Glu Asn Ile Ala Glu Trp His Val Arg 915 920 925 Asn Phe Ser Asn Tyr Leu Arg Ala Asp Ser Gly Thr Gly Leu Tyr Tyr 930 935 940 Lys Gln Ala Thr Met Asp Phe Leu Lys His Tyr Gly Leu Glu Glu His 945 950 955 960 Ala Glu Gly Leu Glu Asn Lys Lys Ile Lys Phe Tyr Asp Phe Arg Lys 965 970 975 Ile Leu Glu Asp Lys Asn Leu Thr Ser Val Ile Ile Pro Lys Arg Gly 980 985 990 Gly Arg Ile Tyr Met Ala Thr Asn Pro Val Thr Ser Asp Ser Thr Pro 995 1000 1005 Ile Thr Tyr Ala Gly Lys Thr Tyr Asn Arg Cys Asn Ala Asp Glu 1010 1015 1020 Val Ala Ala Ala Asn Ile Val Ile Ser Val Leu Ala Pro Arg Ser 1025 1030 1035 Lys Lys Asn Glu Glu Gln Asp Asp Ile Pro Leu Ile Thr Lys Lys 1040 1045 1050 Ala Glu Ser Lys Ser Pro Pro Lys Asp Arg Lys Arg Ser Lys Thr 1055 1060 1065 Ser Gln Leu Pro Gln Lys 1070 <![CDATA[<210> 254]]> <![CDATA[<211> 1074]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 254]]> Met Ala Ser Ile Ser Arg Pro Tyr Gly Thr Lys Leu Arg Pro Asp Ala 1 5 10 15 Arg Lys Lys Glu Met Leu Asp Lys Phe Phe Asn Thr Leu Thr Lys Gly 20 25 30 Gln Arg Val Phe Ala Asp Leu Ala Leu Cys Ile Tyr Gly Ser Leu Thr 35 40 45 Leu Glu Met Ala Lys Ser Leu Glu Pro Glu Ser Asp Ser Glu Leu Val 50 55 60 Cys Ala Ile Gly Trp Phe Arg Leu Val Asp Lys Thr Ile Trp Ser Lys 65 70 75 80 Asp Gly Ile Lys Gln Glu Asn Leu Val Lys Gln Tyr Glu Ala Tyr Ser 85 90 95 Gly Lys Glu Ala Ser Glu Val Val Lys Thr Tyr Leu Asn Ser Pro Ser 100 105 110 Ser Asp Lys Tyr Val Trp Ile Asp Cys Arg Gln Lys Phe Leu Arg Phe 115 120 125 Gln Arg Glu Leu Gly Thr Arg Asn Leu Ser Glu Asp Phe Glu Cys Met 130 135 140 Leu Phe Glu Gln Tyr Ile Arg Leu Thr Lys Gly Glu Ile Glu Gly Tyr 145 150 155 160 Ala Ala Ile Ser Asn Met Phe Gly Asn Gly Glu Lys Glu Asp Arg Ser 165 170 175 Lys Lys Arg Met Tyr Ala Thr Arg Met Lys Asp Trp Leu Glu Ala Asn 180 185 190 Glu Asn Ile Thr Trp Glu Gln Tyr Arg Glu Ala Leu Lys Asn Gln Leu 195 200 205 Asn Ala Lys Asn Leu Glu Gln Val Val Ala Asn Tyr Lys Gly Asn Ala 210 215 220 Gly Gly Ala Asp Pro Phe Phe Lys Tyr Ser Phe Ser Lys Glu Gly Met 225 230 235 240 Val Ser Lys Lys Glu His Ala Gln Gln Leu Asp Lys Phe Lys Thr Val 245 250 255 Leu Lys Asn Lys Ala Arg Asp Leu Asn Phe Pro Asn Lys Glu Lys Leu 260 265 270 Lys Gln Tyr Leu Glu Ala Glu Ile Gly Ile Pro Val Asp Ala Asn Val 275 280 285 Tyr Ser Gln Met Phe Ser Asn Gly Val Ser Glu Val Gln Pro Lys Thr 290 295 300 Thr Arg Asn Met Ser Phe Ser Asn Glu Lys Leu Asp Leu Leu Thr Glu 305 310 315 320 Leu Lys Asp Leu Asn Lys Gly Asp Gly Phe Glu Tyr Ala Arg Glu Val 325 330 335 Leu Asn Gly Phe Phe Asp Ser Glu Leu His Thr Thr Glu Asp Lys Phe 340 345 350 Asn Ile Thr Ser Arg Tyr Leu Gly Gly Asp Lys Ser Asn Arg Leu Ser 355 360 365 Lys Leu Tyr Lys Ile Trp Lys Lys Glu Gly Val Asp Cys Glu Glu Gly 370 375 380 Ile Gln Gln Phe Cys Glu Ala Val Lys Asp Lys Met Gly Gln Ile Pro 385 390 395 400 Ile Arg Asn Val Leu Lys Tyr Leu Trp Gln Phe Arg Glu Thr Val Ser 405 410 415 Ala Glu Asp Phe Glu Ala Ala Ala Lys Ala Asn His Leu Glu Glu Lys 420 425 430 Ile Ser Arg Val Lys Ala His Pro Ile Val Ile Ser Asn Arg Tyr Trp 435 440 445 Ala Phe Gly Thr Ser Ala Leu Val Gly Asn Ile Met Pro Ala Asp Lys 450 455 460 Arg His Gln Gly Glu Tyr Ala Gly Gln Asn Phe Lys Met Trp Leu Glu 465 470 475 480 Ala Glu Leu His Tyr Asp Gly Lys Lys Ala Lys His His Leu Pro Phe 485 490 495 Tyr Asn Ala Arg Phe Phe Glu Glu Val Tyr Cys Tyr His Pro Ser Val 500 505 510 Ala Glu Ile Thr Pro Phe Lys Thr Lys Gln Phe Gly Cys Glu Ile Gly 515 520 525 Lys Asp Ile Pro Asp Tyr Val Ser Val Ala Leu Lys Asp Asn Pro Tyr 530 535 540 Lys Lys Ala Thr Lys Arg Ile Leu Arg Ala Ile Tyr Asn Pro Val Ala 545 550 555 560 Asn Thr Thr Gly Val Asp Lys Thr Thr Asn Cys Ser Phe Met Ile Lys 565 570 575 Arg Glu Asn Asp Glu Tyr Lys Leu Val Ile Asn Arg Lys Ile Ser Arg 580 585 590 Asp Arg Pro Lys Arg Ile Glu Val Gly Arg Thr Ile Met Gly Tyr Asp 595 600 605 Arg Asn Gln Thr Ala Ser Asp Thr Tyr Trp Ile Gly Arg Leu Val Pro 610 615 620 Pro Gly Thr Arg Gly Ala Tyr Arg Ile Gly Glu Trp Ser Val Gln Tyr 625 630 635 640 Ile Lys Ser Gly Pro Val Leu Ser Ser Thr Gln Gly Val Asn Asn Ser 645 650 655 Thr Thr Asp Gln Leu Val Tyr Asn Gly Met Pro Ser Ser Ser Glu Arg 660 665 670 Phe Lys Ala Trp Lys Lys Ala Arg Met Ala Phe Ile Arg Lys Leu Ile 675 680 685 Arg Gln Leu Asn Asp Glu Gly Leu Glu Ser Lys Gly Gln Asp Tyr Ile 690 695 700 Pro Glu Asn Pro Ser Ser Phe Asp Val Arg Gly Glu Thr Leu Tyr Val 705 710 715 720 Phe Asn Ser Asn Tyr Leu Lys Ala Leu Val Ser Lys His Arg Lys Ala 725 730 735 Lys Lys Pro Val Glu Gly Ile Leu Asp Glu Ile Glu Ala Trp Thr Ser 740 745 750 Lys Asp Lys Asp Ser Cys Ser Leu Met Arg Leu Ser Ser Leu Ser Asp 755 760 765 Ala Ser Met Gln Gly Ile Ala Ser Leu Lys Ser Leu Ile Asn Ser Tyr 770 775 780 Phe Asn Lys Asn Gly Cys Lys Thr Ile Glu Asp Lys Glu Lys Phe Asn 785 790 795 800 Pro Val Leu Tyr Ala Lys Leu Val Glu Val Glu Gln Arg Arg Thr Asn 805 810 815 Lys Arg Ser Glu Lys Val Gly Arg Ile Ala Gly Ser Leu Glu Gln Leu 820 825 830 Ala Leu Leu Asn Gly Val Glu Val Val Ile Gly Glu Ala Asp Leu Gly 835 840 845 Glu Val Glu Lys Gly Lys Ser Lys Lys Gln Asn Ser Arg Asn Met Asp 850 855 860 Trp Cys Ala Lys Gln Val Ala Gln Arg Leu Glu Tyr Lys Leu Ala Phe 865 870 875 880 His Gly Ile Gly Tyr Phe Gly Val Asn Pro Met Tyr Thr Ser His Gln 885 890 895 Asp Pro Phe Glu His Arg Arg Val Ala Asp His Ile Val Met Arg Ala 900 905 910 Arg Phe Glu Glu Val Asn Val Glu Asn Ile Ala Glu Trp His Val Arg 915 920 925 Asn Phe Ser Asn Tyr Leu Arg Ala Asp Ser Gly Thr Gly Leu Tyr Tyr 930 935 940 Lys Gln Ala Thr Met Asp Phe Leu Lys His Tyr Gly Leu Glu Glu His 945 950 955 960 Ala Glu Gly Leu Glu Asn Lys Lys Ile Lys Phe Tyr Asp Phe Arg Lys 965 970 975 Ile Leu Glu Asp Lys Asn Leu Thr Ser Val Ile Ile Pro Lys Arg Gly 980 985 990 Gly Arg Ile Tyr Met Ala Thr Asn Pro Val Thr Ser Asp Ser Thr Pro 995 1000 1005 Ile Thr Tyr Ala Gly Lys Thr Tyr Asn Arg Cys Asn Ala Asp Glu 1010 1015 1020 Val Ala Ala Ala Asn Ile Val Ile Ser Val Leu Ala Pro Arg Ser 1025 1030 1035 Lys Lys Asn Arg Glu Gln Asp Asp Ile Pro Leu Ile Thr Lys Lys 1040 1045 1050 Ala Glu Ser Lys Ser Pro Pro Lys Asp Arg Lys Arg Ser Lys Thr 1055 1060 1065 Ser Gln Leu Pro Gln Lys 1070 <![CDATA[<210> 255]]> <![CDATA[<211> 1074]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 255]]> Met Ala Ser Ile Ser Arg Pro Tyr Gly Thr Lys Leu Arg Pro Asp Ala 1 5 10 15 Arg Lys Lys Glu Met Leu Asp Lys Phe Phe Asn Thr Leu Thr Lys Gly 20 25 30 Gln Arg Val Phe Ala Asp Leu Ala Leu Cys Ile Tyr Gly Ser Leu Thr 35 40 45 Leu Glu Met Ala Lys Ser Leu Glu Pro Glu Ser Asp Ser Glu Leu Val 50 55 60 Cys Ala Ile Gly Trp Phe Arg Leu Val Asp Lys Thr Ile Trp Ser Lys 65 70 75 80 Asp Gly Ile Lys Gln Glu Asn Leu Val Lys Gln Tyr Glu Ala Tyr Ser 85 90 95 Gly Lys Glu Ala Ser Glu Val Val Lys Thr Tyr Leu Asn Ser Pro Ser 100 105 110 Ser Asp Lys Tyr Val Trp Ile Asp Cys Arg Gln Lys Phe Leu Arg Phe 115 120 125 Gln Arg Glu Leu Gly Thr Arg Asn Leu Ser Glu Asp Phe Glu Cys Met 130 135 140 Leu Phe Glu Gln Tyr Ile Arg Leu Thr Lys Gly Glu Ile Glu Gly Tyr 145 150 155 160 Ala Ala Ile Ser Asn Met Phe Gly Asn Gly Glu Lys Glu Asp Arg Ser 165 170 175 Lys Lys Arg Met Tyr Ala Thr Arg Met Lys Asp Trp Leu Glu Ala Asn 180 185 190 Glu Asn Ile Thr Trp Glu Gln Tyr Arg Glu Ala Leu Lys Asn Gln Leu 195 200 205 Asn Ala Lys Asn Leu Glu Gln Val Val Ala Asn Tyr Lys Gly Asn Ala 210 215 220 Gly Gly Ala Asp Pro Phe Phe Lys Tyr Ser Phe Ser Lys Glu Gly Met 225 230 235 240 Val Ser Lys Lys Glu His Ala Gln Gln Leu Asp Lys Phe Lys Thr Val 245 250 255 Leu Lys Asn Lys Ala Arg Asp Leu Asn Phe Pro Asn Lys Glu Lys Leu 260 265 270 Lys Gln Tyr Leu Glu Ala Glu Ile Gly Ile Pro Val Asp Ala Asn Val 275 280 285 Tyr Ser Gln Met Phe Ser Asn Gly Val Ser Glu Val Gln Pro Lys Thr 290 295 300 Thr Arg Asn Met Ser Phe Ser Asn Glu Lys Leu Asp Leu Leu Thr Glu 305 310 315 320 Leu Lys Asp Leu Asn Lys Gly Asp Gly Phe Glu Tyr Ala Arg Glu Val 325 330 335 Leu Asn Gly Phe Phe Asp Ser Glu Leu His Thr Thr Glu Asp Lys Phe 340 345 350 Asn Ile Thr Ser Arg Tyr Leu Gly Gly Asp Lys Ser Asn Arg Leu Ser 355 360 365 Lys Leu Tyr Lys Ile Trp Lys Lys Glu Gly Val Asp Cys Glu Glu Gly 370 375 380 Ile Gln Gln Phe Cys Glu Ala Val Lys Asp Lys Met Gly Gln Ile Pro 385 390 395 400 Ile Arg Asn Val Leu Lys Tyr Leu Trp Gln Phe Arg Glu Thr Val Ser 405 410 415 Ala Glu Asp Phe Glu Ala Ala Ala Lys Ala Asn His Leu Glu Glu Lys 420 425 430 Ile Ser Arg Val Lys Ala His Pro Ile Val Ile Ser Asn Arg Tyr Trp 435 440 445 Ala Phe Gly Thr Ser Ala Leu Val Gly Asn Ile Met Pro Ala Asp Lys 450 455 460 Arg His Gln Gly Glu Tyr Ala Gly Gln Asn Phe Lys Met Trp Leu Arg 465 470 475 480 Ala Glu Leu His Tyr Asp Gly Lys Lys Ala Lys His His Leu Pro Phe 485 490 495 Tyr Asn Ala Arg Phe Phe Glu Glu Val Tyr Cys Tyr His Pro Ser Val 500 505 510 Ala Glu Ile Thr Pro Phe Lys Thr Lys Gln Phe Gly Cys Glu Ile Gly 515 520 525 Lys Asp Ile Pro Asp Tyr Val Ser Val Ala Leu Lys Asp Asn Pro Tyr 530 535 540 Lys Lys Ala Thr Lys Arg Ile Leu Arg Ala Ile Tyr Asn Pro Val Ala 545 550 555 560 Asn Thr Thr Arg Val Asp Lys Thr Thr Asn Cys Ser Phe Met Ile Lys 565 570 575 Arg Glu Asn Asp Glu Tyr Lys Leu Val Ile Asn Arg Lys Ile Ser Arg 580 585 590 Asp Arg Pro Lys Arg Ile Glu Val Gly Arg Thr Ile Met Gly Tyr Asp 595 600 605 Arg Asn Gln Thr Ala Ser Asp Thr Tyr Trp Ile Gly Arg Leu Val Pro 610 615 620 Pro Gly Thr Arg Gly Ala Tyr Arg Ile Gly Glu Trp Ser Val Gln Tyr 625 630 635 640 Ile Lys Ser Gly Pro Val Leu Ser Ser Thr Gln Gly Val Asn Asn Ser 645 650 655 Thr Thr Asp Gln Leu Val Tyr Asn Gly Met Pro Ser Ser Ser Glu Arg 660 665 670 Phe Lys Ala Trp Lys Lys Ala Arg Met Ala Phe Ile Arg Lys Leu Ile 675 680 685 Arg Gln Leu Asn Asp Glu Gly Leu Glu Ser Lys Gly Gln Asp Tyr Ile 690 695 700 Pro Glu Asn Pro Ser Ser Phe Asp Val Arg Gly Glu Thr Leu Tyr Val 705 710 715 720 Phe Asn Ser Asn Tyr Leu Lys Ala Leu Val Ser Lys His Arg Lys Ala 725 730 735 Lys Lys Pro Val Glu Gly Ile Leu Asp Glu Ile Glu Ala Trp Thr Ser 740 745 750 Lys Asp Lys Asp Ser Cys Ser Leu Met Arg Leu Ser Ser Leu Ser Asp 755 760 765 Ala Ser Met Gln Gly Ile Ala Ser Leu Lys Ser Leu Ile Asn Ser Tyr 770 775 780 Phe Asn Lys Asn Gly Cys Lys Thr Ile Glu Asp Lys Glu Lys Phe Asn 785 790 795 800 Pro Val Leu Tyr Ala Lys Leu Val Glu Val Glu Gln Arg Arg Thr Asn 805 810 815 Lys Arg Ser Glu Lys Val Gly Arg Ile Ala Gly Ser Leu Glu Gln Leu 820 825 830 Ala Leu Leu Asn Gly Val Glu Val Val Ile Gly Glu Ala Asp Leu Gly 835 840 845 Glu Val Glu Lys Gly Lys Ser Lys Lys Gln Asn Ser Arg Asn Met Asp 850 855 860 Trp Cys Ala Lys Gln Val Ala Gln Arg Leu Glu Tyr Lys Leu Ala Phe 865 870 875 880 His Gly Ile Gly Tyr Phe Gly Val Asn Pro Met Tyr Thr Ser His Gln 885 890 895 Asp Pro Phe Glu His Arg Arg Val Ala Asp His Ile Val Met Arg Ala 900 905 910 Arg Phe Glu Glu Val Asn Val Glu Asn Ile Ala Glu Trp His Val Arg 915 920 925 Asn Phe Ser Asn Tyr Leu Arg Ala Asp Ser Gly Thr Gly Leu Tyr Tyr 930 935 940 Lys Gln Ala Thr Met Asp Phe Leu Lys His Tyr Gly Leu Glu Glu His 945 950 955 960 Ala Glu Gly Leu Glu Asn Lys Lys Ile Lys Phe Tyr Asp Phe Arg Lys 965 970 975 Ile Leu Glu Asp Lys Asn Leu Thr Ser Val Ile Ile Pro Lys Arg Gly 980 985 990 Gly Arg Ile Tyr Met Ala Thr Asn Pro Val Thr Ser Asp Ser Thr Pro 995 1000 1005 Ile Thr Tyr Ala Gly Lys Thr Tyr Asn Arg Cys Asn Ala Asp Glu 1010 1015 1020 Val Ala Ala Ala Asn Ile Val Ile Ser Val Leu Ala Pro Arg Ser 1025 1030 1035 Lys Lys Asn Arg Glu Gln Asp Asp Ile Pro Leu Ile Thr Lys Lys 1040 1045 1050 Ala Glu Ser Lys Ser Pro Pro Lys Asp Arg Lys Arg Ser Lys Thr 1055 1060 1065 Ser Gln Leu Pro Gln Lys 1070 <![CDATA[<210> 256]]> <![CDATA[<211> 147]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 256]]> Met Ala Ser His Arg Leu Leu Leu Leu Cys Leu Ala Gly Leu Val Phe 1 5 10 15 Val Ser Glu Ala Gly Pro Thr Gly Thr Gly Glu Ser Lys Cys Pro Leu 20 25 30 Met Val Lys Val Leu Asp Ala Val Arg Gly Ser Pro Ala Ile Asn Val 35 40 45 Ala Val His Val Phe Arg Lys Ala Ala Asp Asp Thr Trp Glu Pro Phe 50 55 60 Ala Ser Gly Lys Thr Ser Glu Ser Gly Glu Leu His Gly Leu Thr Thr 65 70 75 80 Glu Glu Glu Phe Val Glu Gly Ile Tyr Lys Val Glu Ile Asp Thr Lys 85 90 95 Ser Tyr Trp Lys Ala Leu Gly Ile Ser Pro Phe His Glu His Ala Glu 100 105 110 Val Val Phe Thr Ala Asn Asp Ser Gly Pro Arg Arg Tyr Thr Ile Ala 115 120 125 Ala Leu Leu Ser Pro Tyr Ser Tyr Ser Thr Thr Ala Val Val Thr Asn 130 135 140 Pro Lys Glu 145 <![CDATA[<210> 257]]> <![CDATA[<211> 127]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 257]]> Gly Pro Thr Gly Thr Gly Glu Ser Lys Cys Pro Leu Met Val Lys Val 1 5 10 15 Leu Asp Ala Val Arg Gly Ser Pro Ala Ile Asn Val Ala Val His Val 20 25 30 Phe Arg Lys Ala Ala Asp Asp Thr Trp Glu Pro Phe Ala Ser Gly Lys 35 40 45 Thr Ser Glu Ser Gly Glu Leu His Gly Leu Thr Thr Glu Glu Glu Phe 50 55 60 Val Glu Gly Ile Tyr Lys Val Glu Ile Asp Thr Lys Ser Tyr Trp Lys 65 70 75 80 Ala Leu Gly Ile Ser Pro Phe His Glu His Ala Glu Val Val Phe Thr 85 90 95 Ala Asn Asp Ser Gly Pro Arg Arg Tyr Thr Ile Ala Ala Leu Leu Ser 100 105 110 Pro Tyr Ser Tyr Ser Thr Thr Ala Val Val Thr Asn Pro Lys Glu 115 120 125 <![CDATA[<210> 258]]> <![CDATA[<211> 444]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> ]]> 258 atggcttctc atcgtctgct cctcctctgc cttgctggac tggtatttgt gtctgaggct 60 ggccctacgg gcaccggtga atccaagtgt cctctgatgg tcaaagttct agatgctgtc 120 cgaggcagtc ctgccatcaa tgtggccgtg catgtgttca gaaaggctgc tgatgacacc 180 tgggagccat ttgcctctgg gaaaaccagt gagtctggag agctgcatgg gctcacaact 240 gaggaggaat ttgtagaagg gatatacaaa gtggaaatag acaccaaatc ttactggaag 300 gcacttggca tctccccatt ccatgagcat gcagaggtgg tattcacagc caacgactcc 360 ggcccccgcc gctacaccat tgccgccctg ctgagcccct actcctattc caccacggct 420 gtcgtcacca atcccaagga atga 444 <![CDATA[<210> 259]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 259]]> guuggaauga cuaauuuuug ugcccaccgu uggcac 36 <![CDATA[<210> 260]]> <![CDATA[<211> 24]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 260]]> aauuuuugug cccaucguug gcac 24 <![CDATA[<210> 261]]> <![CDATA[<211> 23]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223>]]> 合成的 <![CDATA[<400> 261]]> auuuuugugc ccaucguugg cac 23 <![CDATA[<210> 262]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 262]]> cuagcaauga ccuaauagug uguccuuagu ugacau 36 <![CDATA[<210> 263]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 263]]> ccuacaauac cuaagaaauc cguccuaagu ugacgg 36 <![CDATA[<210> 264]]> <![CDATA[<211> 22]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 264]]> auaguguguc cuuaguugac au 22 <![CDATA[<210> 265]]> <![CDATA[<211> 1093]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 265]]> Met Ser Asn Lys Glu Lys Asn Ala Ser Glu Thr Arg Lys Ala Tyr Thr 1 5 10 15 Thr Lys Met Ile Pro Arg Ser His Asp Arg Met Lys Leu Leu Gly Asn 20 25 30 Phe Met Asp Tyr Leu Met Asp Gly Thr Pro Ile Phe Phe Glu Leu Trp 35 40 45 Asn Gln Phe Gly Gly Gly Ile Asp Arg Asp Ile Ile Ser Gly Thr Ala 50 55 60 Asn Lys Asp Lys Ile Ser Asp Asp Leu Leu Leu Ala Val Asn Trp Phe 65 70 75 80 Lys Val Met Pro Ile Asn Ser Lys Pro Gln Gly Val Ser Pro Ser Asn 85 90 95 Leu Ala Asn Leu Phe Gln Gln Tyr Ser Gly Ser Glu Pro Asp Ile Gln 100 105 110 Ala Gln Glu Tyr Phe Ala Ser Asn Phe Asp Thr Glu Lys His Gln Trp 115 120 125 Lys Asp Met Arg Val Glu Tyr Glu Arg Leu Leu Ala Glu Leu Gln Leu 130 135 140 Ser Arg Ser Asp Met His His Asp Leu Lys Leu Met Tyr Lys Glu Lys 145 150 155 160 Cys Ile Gly Leu Ser Leu Ser Thr Ala His Tyr Ile Thr Ser Val Met 165 170 175 Phe Gly Thr Gly Ala Lys Asn Asn Arg Gln Thr Lys His Gln Phe Tyr 180 185 190 Ser Lys Val Ile Gln Leu Leu Glu Glu Ser Thr Gln Ile Asn Ser Val 195 200 205 Glu Gln Leu Ala Ser Ile Ile Leu Lys Ala Gly Asp Cys Asp Ser Tyr 210 215 220 Arg Lys Leu Arg Ile Arg Cys Ser Arg Lys Gly Ala Thr Pro Ser Ile 225 230 235 240 Leu Lys Ile Val Gln Asp Tyr Glu Leu Gly Thr Asn His Asp Asp Glu 245 250 255 Val Asn Val Pro Ser Leu Ile Ala Asn Leu Lys Glu Lys Leu Gly Arg 260 265 270 Phe Glu Tyr Glu Cys Glu Trp Lys Cys Met Glu Lys Ile Lys Ala Phe 275 280 285 Leu Ala Ser Lys Val Gly Pro Tyr Tyr Leu Gly Ser Tyr Ser Ala Met 290 295 300 Leu Glu Asn Ala Leu Ser Pro Ile Lys Gly Met Thr Thr Lys Asn Cys 305 310 315 320 Lys Phe Val Leu Lys Gln Ile Asp Ala Lys Asn Asp Ile Lys Tyr Glu 325 330 335 Asn Glu Pro Phe Gly Lys Ile Val Glu Gly Phe Phe Asp Ser Pro Tyr 340 345 350 Phe Glu Ser Asp Thr Asn Val Lys Trp Val Leu His Pro His His Ile 355 360 365 Gly Glu Ser Asn Ile Lys Thr Leu Trp Glu Asp Leu Asn Ala Ile His 370 375 380 Ser Lys Tyr Glu Glu Asp Ile Ala Ser Leu Ser Glu Asp Lys Lys Glu 385 390 395 400 Lys Arg Ile Lys Val Tyr Gln Gly Asp Val Cys Gln Thr Ile Asn Thr 405 410 415 Tyr Cys Glu Glu Val Gly Lys Glu Ala Lys Thr Pro Leu Val Gln Leu 420 425 430 Leu Arg Tyr Leu Tyr Ser Arg Lys Asp Asp Ile Ala Val Asp Lys Ile 435 440 445 Ile Asp Gly Ile Thr Phe Leu Ser Lys Lys His Lys Val Glu Lys Gln 450 455 460 Lys Ile Asn Pro Val Ile Gln Lys Tyr Pro Ser Phe Asn Phe Gly Asn 465 470 475 480 Asn Ser Lys Leu Leu Gly Lys Ile Ile Ser Pro Lys Asp Lys Leu Lys 485 490 495 His Asn Leu Lys Cys Asn Arg Asn Gln Val Asp Asn Tyr Ile Trp Ile 500 505 510 Glu Ile Lys Val Leu Asn Thr Lys Thr Met Arg Trp Glu Lys His His 515 520 525 Tyr Ala Leu Ser Ser Thr Arg Phe Leu Glu Glu Val Tyr Tyr Pro Ala 530 535 540 Thr Ser Glu Asn Pro Pro Asp Ala Leu Ala Ala Arg Phe Arg Thr Lys 545 550 555 560 Thr Asn Gly Tyr Glu Gly Lys Pro Ala Leu Ser Ala Glu Gln Ile Glu 565 570 575 Gln Ile Arg Ser Ala Pro Val Gly Leu Arg Lys Val Lys Lys Arg Gln 580 585 590 Met Arg Leu Glu Ala Ala Arg Gln Gln Asn Leu Leu Pro Arg Tyr Thr 595 600 605 Trp Gly Lys Asp Phe Asn Ile Asn Ile Cys Lys Arg Gly Asn Asn Phe 610 615 620 Glu Val Thr Leu Ala Thr Lys Val Lys Lys Lys Lys Glu Lys Asn Tyr 625 630 635 640 Lys Val Val Leu Gly Tyr Asp Ala Asn Ile Val Arg Lys Asn Thr Tyr 645 650 655 Ala Ala Ile Glu Ala His Ala Asn Gly Asp Gly Val Ile Asp Tyr Asn 660 665 670 Asp Leu Pro Val Lys Pro Ile Glu Ser Gly Phe Val Thr Val Glu Ser 675 680 685 Gln Val Arg Asp Lys Ser Tyr Asp Gln Leu Ser Tyr Asn Gly Val Lys 690 695 700 Leu Leu Tyr Cys Lys Pro His Val Glu Ser Arg Arg Ser Phe Leu Glu 705 710 715 720 Lys Tyr Arg Asn Gly Thr Met Lys Asp Asn Arg Gly Asn Asn Ile Gln 725 730 735 Ile Asp Phe Met Lys Asp Phe Glu Ala Ile Ala Asp Asp Glu Thr Ser 740 745 750 Leu Tyr Tyr Phe Asn Met Lys Tyr Cys Lys Leu Leu Gln Ser Ser Ile 755 760 765 Arg Asn His Ser Ser Gln Ala Lys Glu Tyr Arg Glu Glu Ile Phe Glu 770 775 780 Leu Leu Arg Asp Gly Lys Leu Ser Val Leu Lys Leu Ser Ser Leu Ser 785 790 795 800 Asn Leu Ser Phe Val Met Phe Lys Val Ala Lys Ser Leu Ile Gly Thr 805 810 815 Tyr Phe Gly His Leu Leu Lys Lys Pro Lys Asn Ser Lys Ser Asp Val 820 825 830 Lys Ala Pro Pro Ile Thr Asp Glu Asp Lys Gln Lys Ala Asp Pro Glu 835 840 845 Met Phe Ala Leu Arg Leu Ala Leu Glu Glu Lys Arg Leu Asn Lys Val 850 855 860 Lys Ser Lys Lys Glu Val Ile Ala Asn Lys Ile Val Ala Lys Ala Leu 865 870 875 880 Glu Leu Arg Asp Lys Tyr Gly Pro Val Leu Ile Lys Gly Glu Asn Ile 885 890 895 Ser Asp Thr Thr Lys Lys Gly Lys Lys Ser Ser Thr Asn Ser Phe Leu 900 905 910 Met Asp Trp Leu Ala Arg Gly Val Ala Asn Lys Val Lys Glu Met Val 915 920 925 Met Met His Gln Gly Leu Glu Phe Val Glu Val Asn Pro Asn Phe Thr 930 935 940 Ser His Gln Asp Pro Phe Val His Lys Asn Pro Glu Asn Thr Phe Arg 945 950 955 960 Ala Arg Tyr Ser Arg Cys Thr Pro Ser Glu Leu Thr Glu Lys Asn Arg 965 970 975 Lys Glu Ile Leu Ser Phe Leu Ser Asp Lys Pro Ser Lys Arg Pro Thr 980 985 990 Asn Ala Tyr Tyr Asn Glu Gly Ala Met Ala Phe Leu Ala Thr Tyr Gly 995 1000 1005 Leu Lys Lys Asn Asp Val Leu Gly Val Ser Leu Glu Lys Phe Lys 1010 1015 1020 Gln Ile Met Ala Asn Ile Leu His Gln Arg Ser Glu Asp Gln Leu 1025 1030 1035 Leu Phe Pro Ser Arg Gly Gly Met Phe Tyr Leu Ala Thr Tyr Lys 1040 1045 1050 Leu Asp Ala Asp Ala Thr Ser Val Asn Trp Asn Gly Lys Gln Phe 1055 1060 1065 Trp Val Cys Asn Ala Asp Leu Val Ala Ala Tyr Asn Val Gly Leu 1070 1075 1080 Val Asp Ile Gln Lys Asp Phe Lys Lys Lys 1085 1090 <![CDATA[<210> 266]]> <![CDATA[<211> 1098]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 266]]> Met Ser Ile Ser Asn Asn Asn Ile Leu Pro Tyr Asn Pro Lys Leu Leu 1 5 10 15 Pro Asp Asp Arg Lys His Lys Met Leu Val Asp Thr Phe Asn Gln Leu 20 25 30 Asp Leu Ile Arg Asn Asn Leu His Asp Met Ile Ile Ala Leu Tyr Gly 35 40 45 Ala Leu Lys Tyr Asp Asn Ile Lys Gln Phe Ala Ser Lys Glu Lys Pro 50 55 60 His Ile Ser Ala Asp Ala Leu Cys Ser Ile Asn Trp Phe Arg Leu Val 65 70 75 80 Lys Thr Asn Glu Arg Lys Pro Ala Ile Glu Ser Asn Gln Ile Ile Ser 85 90 95 Lys Phe Ile Gln Tyr Ser Gly His Thr Pro Asp Lys Tyr Ala Leu Ser 100 105 110 His Ile Thr Gly Asn His Glu Pro Ser His Lys Trp Ile Asp Cys Arg 115 120 125 Glu Tyr Ala Ile Asn Tyr Ala Arg Ile Met His Leu Ser Phe Ser Gln 130 135 140 Phe Gln Asp Leu Ala Thr Ala Cys Leu Asn Cys Lys Ile Leu Ile Leu 145 150 155 160 Asn Gly Thr Leu Thr Ser Ser Trp Ala Trp Gly Ala Asn Ser Ala Leu 165 170 175 Phe Gly Gly Ser Asp Lys Glu Asn Phe Ser Val Lys Ala Lys Ile Leu 180 185 190 Asn Ser Phe Ile Glu Asn Leu Lys Asp Glu Met Asn Thr Thr Lys Phe 195 200 205 Gln Val Val Glu Lys Val Cys Gln Gln Ile Gly Ser Ser Asp Ala Ala 210 215 220 Asp Leu Phe Asp Leu Tyr Arg Ser Thr Val Lys Asp Gly Asn Arg Gly 225 230 235 240 Pro Ala Thr Gly Arg Asn Pro Lys Val Met Asn Leu Phe Ser Gln Asp 245 250 255 Gly Glu Ile Ser Ser Glu Gln Arg Glu Asp Phe Ile Glu Ser Phe Gln 260 265 270 Lys Val Met Gln Glu Lys Asn Ser Lys Gln Ile Ile Pro His Leu Asp 275 280 285 Lys Leu Lys Tyr His Leu Val Lys Gln Ser Gly Leu Tyr Asp Ile Tyr 290 295 300 Ser Trp Ala Ala Ala Ile Lys Asn Ala Asn Ser Thr Ile Val Ala Ser 305 310 315 320 Asn Ser Ser Asn Leu Asn Thr Ile Leu Asn Lys Thr Glu Lys Gln Gln 325 330 335 Thr Phe Glu Glu Leu Arg Lys Asp Glu Lys Ile Val Ala Cys Ser Lys 340 345 350 Ile Leu Leu Ser Val Asn Asp Thr Leu Pro Glu Asp Leu His Tyr Asn 355 360 365 Pro Ser Thr Ser Asn Leu Gly Lys Asn Leu Asp Val Phe Phe Asp Leu 370 375 380 Leu Asn Glu Asn Ser Val His Thr Ile Glu Asn Lys Glu Glu Lys Asn 385 390 395 400 Lys Ile Val Lys Glu Cys Val Asn Gln Tyr Met Glu Glu Cys Lys Gly 405 410 415 Leu Asn Lys Pro Pro Met Pro Val Leu Leu Thr Phe Ile Ser Asp Tyr 420 425 430 Ala His Lys His Gln Ala Gln Asp Phe Leu Ser Ala Ala Lys Met Asn 435 440 445 Phe Ile Asp Leu Lys Ile Lys Ser Ile Lys Val Val Pro Thr Val His 450 455 460 Gly Ser Ser Pro Tyr Thr Trp Ile Ser Asn Leu Ser Lys Lys Asn Lys 465 470 475 480 Asp Gly Lys Met Ile Arg Thr Pro Asn Ser Ser Leu Ile Gly Trp Ile 485 490 495 Ile Pro Pro Glu Glu Ile His Asp Gln Lys Phe Ala Gly Gln Asn Pro 500 505 510 Ile Ile Trp Ala Val Leu Arg Val Tyr Cys Asn Asn Lys Trp Glu Met 515 520 525 His His Phe Pro Phe Ser Asp Ser Arg Phe Phe Thr Glu Val Tyr Ala 530 535 540 Tyr Lys Pro Asn Leu Pro Tyr Leu Pro Gly Gly Glu Asn Arg Ser Lys 545 550 555 560 Arg Phe Gly Tyr Arg His Ser Thr Asn Leu Ser Asn Glu Ser Arg Gln 565 570 575 Ile Leu Leu Asp Lys Ser Lys Tyr Ala Lys Ala Asn Lys Ser Val Leu 580 585 590 Arg Cys Met Glu Asn Met Thr His Asn Val Val Phe Asp Pro Lys Thr 595 600 605 Ser Leu Asn Ile Arg Ile Lys Thr Asp Lys Asn Asn Ser Pro Val Leu 610 615 620 Asp Asp Lys Gly Arg Ile Thr Phe Val Met Gln Ile Asn His Arg Ile 625 630 635 640 Leu Glu Lys Tyr Asn Asn Thr Lys Ile Glu Ile Gly Asp Arg Ile Leu 645 650 655 Ala Tyr Asp Gln Asn Gln Ser Glu Asn His Thr Tyr Ala Ile Leu Gln 660 665 670 Arg Thr Glu Glu Gly Ser His Ala His Gln Phe Asn Gly Trp Tyr Val 675 680 685 Arg Val Leu Glu Thr Gly Lys Val Thr Ser Ile Val Gln Gly Leu Ser 690 695 700 Gly Pro Ile Asp Gln Leu Asn Tyr Asp Gly Met Pro Val Thr Ser His 705 710 715 720 Lys Phe Asn Cys Trp Gln Ala Asp Arg Ser Ala Phe Val Ser Gln Phe 725 730 735 Ala Ser Leu Lys Ile Ser Glu Thr Glu Thr Phe Asp Glu Ala Tyr Gln 740 745 750 Ala Ile Asn Ala Gln Gly Ala Tyr Thr Trp Asn Leu Phe Tyr Leu Arg 755 760 765 Ile Leu Arg Lys Ala Leu Arg Val Cys His Met Glu Asn Ile Asn Gln 770 775 780 Phe Arg Glu Glu Ile Leu Ala Ile Ser Lys Asn Arg Leu Ser Pro Met 785 790 795 800 Ser Leu Gly Ser Leu Ser Gln Asn Ser Leu Lys Met Ile Arg Ala Phe 805 810 815 Lys Ser Ile Ile Asn Cys Tyr Met Ser Arg Met Ser Phe Val Asp Glu 820 825 830 Leu Gln Lys Lys Glu Gly Asp Leu Glu Leu His Thr Ile Met Arg Leu 835 840 845 Thr Asp Asn Lys Leu Asn Asp Lys Arg Val Glu Lys Ile Asn Arg Ala 850 855 860 Ser Ser Phe Leu Thr Asn Lys Ala His Ser Met Gly Cys Lys Met Ile 865 870 875 880 Val Gly Glu Ser Asp Leu Pro Val Ala Asp Ser Lys Thr Ser Lys Lys 885 890 895 Gln Asn Val Asp Arg Met Asp Trp Cys Ala Arg Ala Leu Ser His Lys 900 905 910 Val Glu Tyr Ala Cys Lys Leu Met Gly Leu Ala Tyr Arg Gly Ile Pro 915 920 925 Ala Tyr Met Ser Ser His Gln Asp Pro Leu Val His Leu Val Glu Ser 930 935 940 Lys Arg Ser Val Leu Arg Pro Arg Phe Val Val Ala Asp Lys Ser Asp 945 950 955 960 Val Lys Gln His His Leu Asp Asn Leu Arg Arg Met Leu Asn Ser Lys 965 970 975 Thr Lys Val Gly Thr Ala Val Tyr Tyr Arg Glu Ala Val Glu Leu Met 980 985 990 Cys Glu Glu Leu Gly Ile His Lys Thr Asp Met Ala Lys Gly Lys Val 995 1000 1005 Ser Leu Ser Asp Phe Val Asp Lys Phe Ile Gly Glu Lys Ala Ile 1010 1015 1020 Phe Pro Gln Arg Gly Gly Arg Phe Tyr Met Ser Thr Lys Arg Leu 1025 1030 1035 Thr Thr Gly Ala Lys Leu Ile Cys Tyr Ser Gly Ser Asp Val Trp 1040 1045 1050 Leu Ser Asp Ala Asp Glu Ile Ala Ala Ile Asn Ile Gly Met Phe 1055 1060 1065 Val Val Cys Asp Gln Thr Gly Ala Phe Lys Lys Lys Lys Lys Glu 1070 1075 1080 Lys Leu Asp Asp Glu Glu Cys Asp Ile Leu Pro Phe Arg Pro Met 1085 1090 1095 <![CDATA[<210> 267]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 267]]> tgaacacatg cacggccaca 20 <![CDATA[<210> 268]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 268]]> ctgaacacat gcacggccac 20 <![CDATA[<210> 269]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 269]]> caccacggct gtcgtcacca 20 <![CDATA[<210> 270]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 270]]> ggattggtga cgacagccgt 20 <![CDATA[<210> 271]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 271]]> caccacggct gtcgtcacca 20 <![CDATA[<210> 272]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 272]]> ggattggtga cgacagccgt 20 <![CDATA[<210> 273]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 273]]> agaaauccgu cuuucauuga cggugaacac augcacggcc aca 43 <![CDATA[<210> 274]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 274]]> agaaauccgu cuuucauuga cggcugaaca caugcacggc cac 43 <![CDATA[<210> 275]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 275]]> agaaauccgu cuuucauuga cggcaccacg gcugucguca cca 43 <![CDATA[<210> 276]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 276]]> agaaauccgu cuuucauuga cggggauugg ugacgacagc cgu 43 <![CDATA[<210> 277]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 277]]> agaaauccgu cuuucauuga cggcaccacg gcugucguca cca 43 <![CDATA[<210> 278]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 278]]> agaaauccgu cuuucauuga cggggauugg ugacgacagc cgu 43 <![CDATA[<210> 279]]> <![CDATA[<211> 100]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 279]]> ccagaggcaa atggctccca ggtgtcatca gcagcctttc tgaacacatg catagctaca 60 ttgatggcag gactgcctcg gacagcatct agaactttga 100 <![CDATA[<210> 280]]> <![CDATA[<211> 100]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 280]]> ccagaggcaa atggctccca ggtgtcatca gcagcctttc tgaacacatg catagctacg 60 ttgatggcag gactgcctcg gacagcatct agaactttga 100 <![CDATA[<210> 281]]> <![CDATA[<211> 100]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 281]]> ccagaggcaa atggctccca ggtgtcatca gcagcctttc tgaacacatg catggccaca 60 ttgatggcag gactgcctcg gacagcatct agaactttga 100 <![CDATA[<210> 282]]> <![CDATA[<211> 100]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人]]>工序列 <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 282]]> ccagaggcaa atggctccca ggtgtcatca gcagcctttc gaaatacgtg catagctacg 60 ttgatggcag gactgcctcg gacagcatct agaactttga 100 <![CDATA[<210> 283]]> <![CDATA[<211> 100]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 283]]> cccagaggca aatggctccc aggtgtcatc agcagccttt cgaaatacgt gcatagctac 60 attgatggca ggactgcctc ggacagcatc tagaactttg 100 <![CDATA[<210> 284]]> <![CDATA[<211> 100]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 284]]> cccagaggca aatggctccc aggtgtcatc agcagccttt ctgaacacat gcatagctac 60 attgatggca ggactgcctc ggacagcatc tagaactttg 100 <![CDATA[<210> 285]]> <![CDATA[<211> 100]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 285]]> cccagaggca aatggctccc aggtgtcatc agcagccttt ctgaacacat gcatggccac 60 attgatggca ggactgcctc ggacagcatc tagaactttg 100 <![CDATA[<210> 286]]> <![CDATA[<211> 100]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 286]]> cccagaggca aatggctccc aggtgtcatc agcagccttc cgaaatacgt gcatagctac 60 attgatggca ggactgcctc ggacagcatc tagaactttg 100 <![CDATA[<210> 287]]> <![CDATA[<211> 100]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 287]]> gctacaccat tgccgccctg ctgagcccct actcctatag tactatggct gtcgtcacca 60 atcccaagga atgagggact tctcctccag tggacctgaa 100 <![CDATA[<210> 288]]> <![CDATA[<211> 100]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 288]]> gctacaccat tgccgccctg ctgagcccct actcctattc caccatggct gttgttacta 60 atcccaagga atgagggact tctcctccag tggacctgaa 100 <![CDATA[<210> 289]]> <![CDATA[<211> 100]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 289]]> gctacaccat tgccgccctg ctgagcccct actcctattc caccatggct gtcgtcacca 60 atcccaagga atgagggact tctcctccag tggacctgaa 100 <![CDATA[<210> 290]]> <![CDATA[<211> 100]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 290]]> gctacaccat tgccgccctg ctgagcccct actcctatag tactatggcc gttgttacta 60 atcccaagga atgagggact tctcctccag tggacctgaa 100 <![CDATA[<210> 291]]> <![CDATA[<211> 100]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 291]]> gtccttcagg tccactggag gagaagtccc tcattccttg gggttagtga cgacagccat 60 ggtggaatag gagtaggggc tcagcagggc ggcaatggtg 100 <![CDATA[<210> 292]]> <![CDATA[<211> 100]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 292]]> gtccttcagg tccactggag gagaagtccc tcattccttg ggattggtga caacggccat 60 ggtggaatag gagtaggggc tcagcagggc ggcaatggtg 100 <![CDATA[<210> 293]]> <![CDATA[<211> 100]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 293]]> gtccttcagg tccactggag gagaagtccc tcattccttg ggattggtga cgacagccat 60 ggtggaatag gagtaggggc tcagcagggc ggcaatggtg 100 <![CDATA[<210> 294]]> <![CDATA[<211> 100]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 294]]> gtccttcagg tccactggag gagaagtccc tcattccttg gggttagtaa caacggccat 60 ggtggaatag gagtaggggc tcagcagggc ggcaatggtg 100 <![CDATA[<210> 295]]> <![CDATA[<211> 100]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 295]]> gctacaccat tgccgccctg ctgagcccct actcctattc tactacagcc gttatcacta 60 atcccaagga atgagggact tctcctccag tggacctgaa 100 <![CDATA[<210> 296]]> <![CDATA[<211> 100]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 296]]> gctacaccat tgccgccctg ctgagcccct actcctattc caccacggct gttatcacta 60 atcccaagga atgagggact tctcctccag tggacctgaa 100 <![CDATA[<210> 297]]> <![CDATA[<211> 100]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 297]]> gctacaccat tgccgccctg ctgagcccct actcctattc caccacggct gtcatcacca 60 atcccaagga atgagggact tctcctccag tggacctgaa 100 <![CDATA[<210> 298]]> <![CDATA[<211> 100]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 298]]> gctacaccat tgccgccctg ctgagcccct actcctatag tactacagcc gttatcacta 60 atcccaagga atgagggact tctcctccag tggacctgaa 100 <![CDATA[<210> 299]]> <![CDATA[<211> 100]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 299]]> gtccttcagg tccactggag gagaagtccc tcattccttg ggattggtga taacggccgt 60 ggtggaatag gagtaggggc tcagcagggc ggcaatggtg 100 <![CDATA[<210> 300]]> <![CDATA[<211> 100]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 300]]> gtccttcagg tccactggag gagaagtccc tcattccttg ggattggtga taacggctgt 60 ggtggaatag gagtaggggc tcagcagggc ggcaatggtg 100 <![CDATA[<210> 301]]> <![CDATA[<211> 100]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 301]]> gtccttcagg tccactggag gagaagtccc tcattccttg ggattggtga tgacagccgt 60 ggtggaatag gagtaggggc tcagcagggc ggcaatggtg 100 <![CDATA[<210> 302]]> <![CDATA[<211> 100]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 302]]> gtccttcagg tccactggag gagaagtccc tcattccttg gggttagtga taacggctgt 60 ggtggaatag gagtaggggc tcagcagggc ggcaatggtg 100 <![CDATA[<210> 303]]> <![CDATA[<211> 120]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 303]]> ggcccccgcc gctacaccat tgccgccctg ctgagcccct actcctatag tactatggct 60 gtcgtcacca atcccaagga atgagggact tctcctccag tggacctgaa ggacgaggga 120 <![CDATA[<210> 304]]> <![CDATA[<211> 120]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 304]]> ggcccccgcc gctacaccat tgccgccctg ctgagcccct actcctattc caccatggct 60 gttgttacta atcccaagga atgagggact tctcctccag tggacctgaa ggacgaggga 120 <![CDATA[<210> 305]]> <![CDATA[<211> 120]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 305]]> ggcccccgcc gctacaccat tgccgccctg ctgagcccct actcctattc caccatggct 60 gtcgtcacca atcccaagga atgagggact tctcctccag tggacctgaa ggacgaggga 120 <![CDATA[<210> 306]]> <![CDATA[<211> 120]]> <![CDATA[<212> DN]]>A <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 306]]> ggcccccgcc gctacaccat tgccgccctg ctgagcccct actcctatag tactatggcc 60 gttgttacta atcccaagga atgagggact tctcctccag tggacctgaa ggacgaggga 120 <![CDATA[<210> 307]]> <![CDATA[<211> 120]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 307]]> cccatccctc gtccttcagg tccactggag gagaagtccc tcattccttg gggttagtga 60 cgacagccat ggtggaatag gagtaggggc tcagcagggc ggcaatggtg tagcggcggg 120 <![CDATA[<210> 308]]> <![CDATA[<211> 120]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> ]]>合成的 <![CDATA[<400> 308]]> cccatccctc gtccttcagg tccactggag gagaagtccc tcattccttg ggattggtga 60 caacggccat ggtggaatag gagtaggggc tcagcagggc ggcaatggtg tagcggcggg 120 <![CDATA[<210> 309]]> <![CDATA[<211> 120]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 309]]> cccatccctc gtccttcagg tccactggag gagaagtccc tcattccttg ggattggtga 60 cgacagccat ggtggaatag gagtaggggc tcagcagggc ggcaatggtg tagcggcggg 120 <![CDATA[<210> 310]]> <![CDATA[<211> 120]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 310]]> cccatccctc gtccttcagg tccactggag gagaagtccc tcattccttg gggttagtaa 60 caacggccat ggtggaatag gagtaggggc tcagcagggc ggcaatggtg tagcggcggg 120 <![CDATA[<210> 311]]> <![CDATA[<211> 120]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 311]]> ggcaacttac ccagaggcaa atggctccca ggtgtcatca gcagcctttc tgaacacatg 60 catagctaca ttgatggcag gactgcctcg gacagcatct agaactttga ccatcagagg 120 <![CDATA[<210> 312]]> <![CDATA[<211> 120]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 312]]> ggcaacttac ccagaggcaa atggctccca ggtgtcatca gcagcctttc tgaacacatg 60 catagctacg ttgatggcag gactgcctcg gacagcatct agaactttga ccatcagagg 120 <![CDATA[<210> 313]]> <![CDATA[<211> 120]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 313]]> ggcaacttac ccagaggcaa atggctccca ggtgtcatca gcagcctttc tgaacacatg 60 catggccaca ttgatggcag gactgcctcg gacagcatct agaactttga ccatcagagg 120 <![CDATA[<210> 314]]> <![CDATA[<211> 120]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 314]]> ggcaacttac ccagaggcaa atggctccca ggtgtcatca gcagcctttc gaaatacgtg 60 catagctacg ttgatggcag gactgcctcg gacagcatct agaactttga ccatcagagg 120 <![CDATA[<210> 315]]> <![CDATA[<211> 120]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 315]]> tggcaactta cccagaggca aatggctccc aggtgtcatc agcagccttt cgaaatacgt 60 gcatagctac attgatggca ggactgcctc ggacagcatc tagaactttg accatcagag 120 <![CDATA[<210> 316]]> <![CDATA[<211> 120]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 316]]> tggcaactta cccagaggca aatggctccc aggtgtcatc agcagccttt ctgaacacat 60 gcatagctac attgatggca ggactgcctc ggacagcatc tagaactttg accatcagag 120 <![CDATA[<210> 317]]> <![CDATA[<211> 120]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 317]]> tggcaactta cccagaggca aatggctccc aggtgtcatc agcagccttt ctgaacacat 60 gcatggccac attgatggca ggactgcctc ggacagcatc tagaactttg accatcagag 120 <![CDATA[<210> 318]]> <![CDATA[<211> 120]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 318]]> tggcaactta cccagaggca aatggctccc aggtgtcatc agcagccttc cgaaatacgt 60 gcatagctac attgatggca ggactgcctc ggacagcatc tagaactttg accatcagag 120 <![CDATA[<210> 319]]> <![CDATA[<211> 120]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 319]]> ggcccccgcc gctacaccat tgccgccctg ctgagcccct actcctattc tactacagcc 60 gttatcacta atcccaagga atgagggact tctcctccag tggacctgaa ggacgaggga 120 <![CDATA[<210> 320]]> <![CDATA[<211> 120]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 320]]> ggcccccgcc gctacaccat tgccgccctg ctgagcccct actcctattc caccacggct 60 gttatcacta atcccaagga atgagggact tctcctccag tggacctgaa ggacgaggga 120 <![CDATA[<210> 321]]> <![CDATA[<211> 120]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 321]]> ggcccccgcc gctacaccat tgccgccctg ctgagcccct actcctattc caccacggct 60 gtcatcacca atcccaagga atgagggact tctcctccag tggacctgaa ggacgaggga 120 <![CDATA[<210> 322]]> <![CDATA[<211> 120]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 322]]> ggcccccgcc gctacaccat tgccgccctg ctgagcccct actcctatag tactacagcc 60 gttatcacta atcccaagga atgagggact tctcctccag tggacctgaa ggacgaggga 120 <![CDATA[<210> 323]]> <![CDATA[<211> 120]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 323]]> cccatccctc gtccttcagg tccactggag gagaagtccc tcattccttg ggattggtga 60 taacggccgt ggtggaatag gagtaggggc tcagcagggc ggcaatggtg tagcggcggg 120 <![CDATA[<210> 324]]> <![CDATA[<211> 120]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 324]]> cccatccctc gtccttcagg tccactggag gagaagtccc tcattccttg ggattggtga 60 taacggctgt ggtggaatag gagtaggggc tcagcagggc ggcaatggtg tagcggcggg 120 <![CDATA[<210> 325]]> <![CDATA[<211> 120]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 325]]> cccatccctc gtccttcagg tccactggag gagaagtccc tcattccttg ggattggtga 60 tgacagccgt ggtggaatag gagtaggggc tcagcagggc ggcaatggtg tagcggcggg 120 <![CDATA[<210> 326]]> <![CDATA[<211> 120]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 326]]> cccatccctc gtccttcagg tccactggag gagaagtccc tcattccttg gggttagtga 60 taacggctgt ggtggaatag gagtaggggc tcagcagggc ggcaatggtg tagcggcggg 120 <![CDATA[<210> 327]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 327]]> tcatcgtctg ctcctcctct 20 <![CDATA[<210> 328]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 328]]> tctacaccca gggcaccggt 20 <![CDATA[<210> 329]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 329]]> gaccatcaga ggacacttgg 20 <![CDATA[<210> 330]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 330]]> tagatgctgt ccgaggcagt 20 <![CDATA[<210> 331]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 331]]> agaaaggctg ctgatgacac 20 <![CDATA[<210> 332]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 332]]> ctgaacacat gcacggccac 20 <![CDATA[<210> 333]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 333]]> ggcaacttac ccagaggcaa 20 <![CDATA[<210> 334]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 334]]> tttggcaact tacccagagg 20 <![CDATA[<210> 335]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 335]]> cacaccttat aggaaaacca 20 <![CDATA[<210> 336]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 33]]>6 tacaaattcc tcctcagttg 20 <![CDATA[<210> 337]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 337]]> gtatatccct tctacaaatt 20 <![CDATA[<210> 338]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 338]]> cagtaagatt tggtgtctat 20 <![CDATA[<210> 339]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 339]]> ccgccctgct gagcccctac 20 <![CDATA[<210> 340]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 340]]> caccacggct gtcgtcacca 20 <![CDATA[<210> 341]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 341]]> gtgacgacag ccgtggtgga 20 <![CDATA[<210> 342]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 342]]> ggattggtga cgacagccgt 20 <![CDATA[<210> 343]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 343]]> cttgggattg gtgacgacag 20 <![CDATA[<210> 344]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 344]]> aggtccactg gaggagaagt 20 <![CDATA[<210> 345]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 345]]> agaaauccgu cuuucauuga cggucaucgu cugcuccucc ucu 43 <![CDATA[<210> 346]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 346]]> agaaauccgu cuuucauuga cggucuacac ccagggcacc ggu 43 <![CDATA[<210> 347]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 347]]> agaaauccgu cuuucauuga cgggaccauc agaggacacu ugg 43 <![CDATA[<210> 348]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 348]]> agaaauccgu cuuucauuga cgguagaugc uguccgaggc agu 43 <![CDATA[<210> 349]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 349]]> agaaauccgu cuuucauuga cggagaaagg cugcugauga cac 43 <![CDATA[<210> 350]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 350]]> agaaauccgu cuuucauuga cggcugaaca caugcacggc cac 43 <![CDATA[<210> 351]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 351]]> agaaauccgu cuuucauuga cggggcaacu uacccagagg caa 43 <![CDATA[<210> 352]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 352]]> agaaauccgu cuuucauuga cgguuuggca acuuacccag agg 43 <![CDATA[<210> 353]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 353]]> agaaauccgu cuuucauuga cggcacaccu uauaggaaaa cca 43 <![CDATA[<210> 354]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 354]]> agaaauccgu cuuucauuga cgguacaaau uccuccucag uug 43 <![CDATA[<210> 355]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 355]]> agaaauccgu cuuucauuga cggguauauc ccuucuacaa auu 43 <![CDATA[<210> 356]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 356]]> agaaauccgu cuuucauuga cggcaguaag auuugguguc uau 43 <![CDATA[<210> 357]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 357]]> agaaauccgu cuuucauuga cggccgcccu gcugagcccc uac 43 <![CDATA[<210> 358]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 358]]> agaaauccgu cuuucauuga cggcaccacg gcugucguca cca 43 <![CDATA[<210> 359]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 359]]> agaaauccgu cuuucauuga cgggugacga cagccguggu gga 43 <![CDATA[<210> 360]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 360]]> agaaauccgu cuuucauuga cggggauugg ugacgacagc cgu 43 <![CDATA[<210> 361]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 361]]> agaaauccgu cuuucauuga cggcuuggga uuggugacga cag 43 <![CDATA[<210> 362]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 362]]> agaaauccgu cuuucauuga cggaggucca cuggaggaga agu 43 <![CDATA[<210> 363]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 363]]> ttggcaggat ggcttctcat 20 <![CDATA[<210> 364]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 364]]> gcaggatggc ttctcatcgt 20 <![CDATA[<210> 365]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 365]]> accatcagag gacacttgga 20 <![CDATA[<210> 366]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 366]]> acaccttata ggaaaaccag 20 <![CDATA[<210> 367]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 367]]> taggaaaacc agtgagtctg 20 <![CDATA[<210> 368]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 368]]> gtagaaggga tatacaaagt 20 <![CDATA[<210> 369]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 369]]> tagaagggat atacaaagtg 20 <![CDATA[<210> 370]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 370]]> cactttgtat atcccttcta 20 <![CDATA[<210> 371]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 371]]> ccactttgta tatcccttct 20 <![CDATA[<210> 372]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 3]]>72 gtgtctattt ccactttgta 20 <![CDATA[<210> 373]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 373]]> ggtgtctatt tccactttgt 20 <![CDATA[<210> 374]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 374]]> tctcataggt ggtattcaca 20 <![CDATA[<210> 375]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 375]]> agaaauccgu cuuucauuga cgguuggcag gauggcuucu cau 43 <![CDATA[<210> 376]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 376]]> agaaauccgu cuuucauuga cgggcaggau ggcuucucau cgu 43 <![CDATA[<210> 377]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 377]]> agaaauccgu cuuucauuga cggaccauca gaggacacuu gga 43 <![CDATA[<210> 378]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 378]]> agaaauccgu cuuucauuga cggacaccuu auaggaaaac cag 43 <![CDATA[<210> 379]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 379]]> agaaauccgu cuuucauuga cgguaggaaa accagugagu cug 43 <![CDATA[<210> 380]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 380]]> agaaauccgu cuuucauuga cggguagaag ggauauacaa agu 43 <![CDATA[<210> 381]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 381]]> agaaauccgu cuuucauuga cggcacuuug uauaucccuu cua 43 <![CDATA[<210> 382]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 382]]> agaaauccgu cuuucauuga cggccacuuu guauaucccu ucu 43 <![CDATA[<210> 383]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 383]]> agaaauccgu cuuucauuga cgggugucua uuuccacuuu gua 43 <![CDATA[<210> 384]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 384]]> agaaauccgu cuuucauuga cggggugucu auuuccacuu ugu 43 <![CDATA[<210> 385]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 385]]> agaaauccgu cuuucauuga cggucucaua ggugguauuc aca 43 <![CDATA[<210> 386]]> <![CDATA[<211> 42]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 386]]> agacaugugu ccucagugac acucaucguc ugcuccuccu cu 42 <![CDATA[<210> 387]]> <![CDATA[<211> 42]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 387]]> agacaugugu ccucagugac acuuggcagg auggcuucuc au 42 <![CDATA[<210> 388]]> <![CDATA[<211> 42]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 388]]> agacaugugu ccucagugac acgcaggaug gcuucucauc gu 42 <![CDATA[<210> 389]]> <![CDATA[<211> 42]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 389]]> agacaugugu ccucagugac acucuacacc cagggcaccg gu 42 <![CDATA[<210> 390]]> <![CDATA[<211> 42]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 390]]> agacaugugu ccucagugac acgaccauca gaggacacuu gg 42 <![CDATA[<210> 391]]> <![CDATA[<211> 42]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 391]]> agacaugugu ccucagugac acuagaugcu guccgaggca gu 42 <![CDATA[<210> 392]]> <![CDATA[<211> 42]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 392]]> agacaugugu ccucagugac acaccaucag aggacacuug ga 42 <![CDATA[<210> 393]]> <![CDATA[<211> 42]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 393]]> agacaugugu ccucagugac accacaccuu auaggaaaac ca 42 <![CDATA[<210> ]]> 394 <![CDATA[<211> 42]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 394]]> agacaugugu ccucagugac acuacaaauu ccuccucagu ug 42 <![CDATA[<210> 395]]> <![CDATA[<211> 42]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 395]]> agacaugugu ccucagugac acguauaucc cuucuacaaa uu 42 <![CDATA[<210> 396]]> <![CDATA[<211> 42]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 396]]> agacaugugu ccucagugac accaguaaga uuuggugucu au 42 <![CDATA[<210> 397]]> <![CDATA[<211> 42]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 397]]> agacaugugu ccucagugac acacaccuua uaggaaaacc ag 42 <![CDATA[<210> 398]]> <![CDATA[<211> 42]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 398]]> agacaugugu ccucagugac acuaggaaaa ccagugaguc ug 42 <![CDATA[<210> 399]]> <![CDATA[<211> 42]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 399]]> agacaugugu ccucagugac acguagaagg gauauacaaa gu 42 <![CDATA[<210> 400]]> <![CDATA[<211> 42]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 400]]> agacaugugu ccucagugac acuagaaggg auauacaaag ug 42 <![CDATA[<210> 401]]> <![CDATA[<211> 42]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 401]]> agacaugugu ccucagugac accacuuugu auaucccuuc ua 42 <![CDATA[<210> 402]]> <![CDATA[<211> 42]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 402]]> agacaugugu ccucagugac acccacuuug uauaucccuu cu 42 <![CDATA[<210> 403]]> <![CDATA[<211> 42]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 403]]> agacaugugu ccucagugac acgugucuau uuccacuuug ua 42 <![CDATA[<210> 404]]> <![CDATA[<211> 42]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 404]]> agacaugugu ccucagugac acggugucua uuuccacuuu gu 42 <![CDATA[<210> 405]]> <![CDATA[<211> 42]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 405]]> agacaugugu ccucagugac accaccacgg cugucgucac ca 42 <![CDATA[<210> 406]]> <![CDATA[<211> 42]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 406]]> agacaugugu ccucagugac acgugacgac agccguggug ga 42 <![CDATA[<210> 407]]> <![CDATA[<211> ]]> 42 <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 407]]> agacaugugu ccucagugac acggauuggu gacgacagcc gu 42 <![CDATA[<210> 408]]> <![CDATA[<211> 42]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 408]]> agacaugugu ccucagugac accuugggau uggugacgac ag 42 <![CDATA[<210> 409]]> <![CDATA[<211> 42]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 409]]> agacaugugu ccucagugac acucucauag gugguauuca ca 42 <![CDATA[<210> 410]]> <![CDATA[<211> 20]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 410]]> gaccaucaga ggacacuugg 20 <![CDATA[<210> 411]]> <![CDATA[<211> 20]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 411]]> uagaugcugu ccgaggcagu 20 <![CDATA[<210> 412]]> <![CDATA[<211> 20]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 412]]> cugaacacau gcacggccac 20 <![CDATA[<210> 413]]> <![CDATA[<211> 20]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 413]]> ggcaacuuac ccagaggcaa 20 <![CDATA[<210> 414]]> <![CDATA[<211> 20]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 414]]> uuuggcaacu uacccagagg 20 <![CDATA[<210> 415]]> <![CDATA[<211> 20]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 415]]> cacaccuuau aggaaaacca 20 <![CDATA[<210> 416]]> <![CDATA[<211> 20]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 416]]> guauaucccu ucuacaaauu 20 <![CDATA[<210> 417]]> <![CDATA[<211> 20]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 417]]> caguaagauu uggugucuau 20 <![CDATA[<210> 418]]> <![CDATA[<211> 20]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 418]]> caccacggcu gucgucacca 20 <![CDATA[<210> 419]]> <![CDATA[<211> 109]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 419]]> ccgctacacc attgccgccc tgctgagccc ctactcctat tccaccacgg ctgtcgtcac 60 caatcccaag gaatgaggga cttctcctcc agtggacctg aaggacgag 109 <![CDATA[<210> 420]]> <![CDATA[<211> 109]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 420]]> ggcgatgtgg taacggcggg acgactcggg gatgaggata aggtggtgcc gacagcagtg 60 gttagggttc cttactccct gaagaggagg tcacctggac ttcctgctc 109 <![CDATA[<210> 421]]> <![CDATA[<211> 35]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 421]]> Arg Tyr Thr Ile Ala Ala Leu Leu Ser Pro Tyr Ser Tyr Ser Thr Thr 1 5 10 15 Ala Val Val Thr Asn Pro Lys Glu Gly Thr Ser Pro Pro Val Asp Leu 20 25 30 Lys Asp Glu 35 <![CDATA[<210> 422]]> <![CDATA[<211> 100]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 422]]> gtggtaacgg cgggacgact cggggatgag gataaggtgg taccgacagc agtggttagg 60 gttccttact ccctgaagag gaggtcacct ggacttcctg 100 <![CDATA[<210> 423]]> <![CDATA[<211> 100]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 423]]> gtggtaacgg cgggacgact cggggatgag gataaggtgg taccggcaac aatgattggg 60 gttccttact ccctgaagag gaggtcacct ggacttcctg 100 <![CDATA[<210> 424]]> <![CDATA[<211> 100]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 424]]> gtggtaacgg cgggacgact cggggatgag gataaggtgg taccggcaac agtggttagg 60 gttccttact ccctgaagag gaggtcacct ggacttcctg 100 <![CDATA[<210> 425]]> <![CDATA[<211> 100]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 425]]> gtggtaacgg cgggacgact cggggatgag gataaggtgg taccgacagc agtgattggg 60 gttccttact ccctgaagag gaggtcacct ggacttcctg 100
Claims (81)
- 一種用於運甲狀腺素蛋白(TTR)基因的基因編輯的基因編輯系統,該基因編輯系統包含 (i) Cas12i2多肽或編碼該Cas12i2多肽的第一核酸,其中該Cas12i2多肽包含與SEQ ID NO: 222具有至少95%同一性的胺基酸序列,並且相對於SEQ ID NO: 222包含一或多個突變; (ii) RNA指導物或編碼該RNA指導物的第二核酸,其中該RNA指導物包含對TTR基因內的靶序列具有特異性的間隔子序列,該靶序列與包含5'-TTN-3'模體的原型間隔子相鄰模體(PAM)相鄰,該PAM位於該靶序列的5'。
- 如請求項1所述之基因編輯系統,其中該Cas12i2多肽中的一或多個突變在SEQ ID NO: 222的位置D581、G624、F626、P868、I926、V1030、E1035、和/或S1046處。
- 如請求項1或請求項2所述之基因編輯系統,其中該一或多個突變係胺基酸取代,該等胺基酸取代視需要是D581R、G624R、F626R、P868T、I926R、V1030G、E1035R、S1046G、或其組合。
- 如請求項3所述之基因編輯基因編輯系統,其中該Cas12i2多肽包含: (i) 在位置D581、D911、I926、和V1030處的突變,該等突變視需要是胺基酸取代D581R、D911R、I926R、和V1030G; (ii) 在位置D581、I926、和V1030處的突變,該等突變視需要是胺基酸取代D581R、I926R、和V1030G; (iii) 在位置D581、I926、V1030、和S1046處的突變,該等突變視需要是胺基酸取代D581R、I926R、V1030G、和S1046G; (iv) 在位置D581、G624、F626、I926、V1030、E1035、和S1046處的突變,該等突變視需要是胺基酸取代D581R、G624R、F626R、I926R、V1030G、E1035R、和S1046G;或 (v) 在位置D581、G624、F626、P868、I926、V1030、E1035、和S1046處的突變,該等突變視需要是胺基酸取代D581R、G624R、F626R、P868T、I926R、V1030G、E1035R、和S1046G。
- 如請求項1所述之基因編輯系統,其中該Cas12i2多肽包含SEQ ID NO: 223-227的胺基酸序列,視需要其中該Cas12i2多肽包含SEQ ID NO: 224或SEQ ID NO: 227的胺基酸序列。
- 如請求項1-5中任一項所述之基因編輯系統,該基因編輯系統包含編碼該Cas12i2多肽的第一核酸。
- 如請求項6所述之基因編輯系統,其中該第一核酸係信使RNA(mRNA)。
- 如請求項6所述之基因編輯系統,其中該第一核酸被包括在病毒載體中,該病毒載體視需要是腺相關病毒(AAV)載體。
- 如請求項1-8中任一項所述之基因編輯系統,其中該靶序列在該TTR基因的外顯子2、外顯子3或外顯子4內。
- 如請求項9所述之基因編輯系統,其中該靶序列包含: (i) GACCATCAGAGGACACTTGG(SEQ ID NO: 329)、 (ii) TAGATGCTGTCCGAGGCAGT(SEQ ID NO: 330)、 (iii) CTGAACACATGCACGGCCAC(SEQ ID NO: 332)、 (iv) GGCAACTTACCCAGAGGCAA(SEQ ID NO: 333)、 (v) TTTGGCAACTTACCCAGAGG(SEQ ID NO: 334)、 (vi) CACACCTTATAGGAAAACCA(SEQ ID NO: 335)、 (vii) GTATATCCCTTCTACAAATT(SEQ ID NO: 337)、 (viii) CAGTAAGATTTGGTGTCTAT(SEQ ID NO: 338)、或 (ix) CACCACGGCTGTCGTCACCA(SEQ ID NO: 271)。
- 如請求項10所述之基因編輯系統,其中該間隔子序列被闡述為: (i) GACCAUCAGAGGACACUUGG(SEQ ID NO: 410)、 (ii) UAGAUGCUGUCCGAGGCAGU(SEQ ID NO: 411)、 (iii) CUGAACACAUGCACGGCCAC(SEQ ID NO: 412)、 (iv) GGCAACUUACCCAGAGGCAA(SEQ ID NO: 413)、 (v) UUUGGCAACUUACCCAGAGG(SEQ ID NO: 414)、 (vi) CACACCUUAUAGGAAAACCA(SEQ ID NO: 415)、 (vii) GUAUAUCCCUUCUACAAAUU(SEQ ID NO: 416)、 (viii) CAGUAAGAUUUGGUGUCUAU(SEQ ID NO: 417)、或 (xi) CACCACGGCUGUCGUCACCA(SEQ ID NO: 418)。
- 如請求項1-11中任一項所述之基因編輯系統,其中該間隔子序列的長度係20-30個核苷酸,視需要其中該間隔子序列的長度係20個核苷酸。
- 如請求項1-12中任一項所述之基因編輯系統,其中該RNA指導物包含該間隔子序列和直接重複序列。
- 如請求項13所述之基因編輯系統,其中該直接重複序列的長度係23-36個核苷酸。
- 如請求項14所述之基因編輯系統,其中該直接重複序列與SEQ ID NO: 1-10中的任一個或其長度為至少23個核苷酸的片段具有至少90%的同一性。
- 如請求項13所述之基因編輯系統,其中該直接重複序列係SEQ ID NO: 1-10中的任一個、或其長度為至少23個核苷酸的片段。
- 如請求項16所述之基因編輯系統,其中該直接重複序列係5’-AGAAAUCCGUCUUUCAUUGACGG-3’(SEQ ID NO: 10)。
- 如請求項1所述之基因編輯系統,其中該RNA指導物包含以下的核苷酸序列: (i) AGAAAUCCGUCUUUCAUUGACGGGACCAUCAGAGGACACUUGG(SEQ ID NO: 347)、 (ii) AGAAAUCCGUCUUUCAUUGACGGUAGAUGCUGUCCGAGGCAGU(SEQ ID NO: 348)、 (iii) AGAAAUCCGUCUUUCAUUGACGGCUGAACACAUGCACGGCCAC(SEQ ID NO: 350)、 (iv) AGAAAUCCGUCUUUCAUUGACGGGGCAACUUACCCAGAGGCAA(SEQ ID NO: 351)、 (v) AGAAAUCCGUCUUUCAUUGACGGUUUGGCAACUUACCCAGAGG(SEQ ID NO: 352)、 (vi) AGAAAUCCGUCUUUCAUUGACGGCACACCUUAUAGGAAAACCA(SEQ ID NO: 353)、 (vii) AGAAAUCCGUCUUUCAUUGACGGGUAUAUCCCUUCUACAAAUU(SEQ ID NO: 355)、 (viii) AGAAAUCCGUCUUUCAUUGACGGCAGUAAGAUUUGGUGUCUAU(SEQ ID NO: 356)、或 (ix) AGAAAUCCGUCUUUCAUUGACGGCACCACGGCUGUCGUCACCA(SEQ ID NO: 358)。
- 如請求項1-18中任一項所述之基因編輯系統,其中該系統包含編碼該RNA指導物的第二核酸。
- 如請求項19所述之基因編輯系統,其中編碼該RNA指導物的核酸位於病毒載體中。
- 如請求項8-20中任一項所述之基因編輯系統,其中該病毒載體包含編碼該Cas12i2多肽的第一核酸和編碼該RNA指導物的第二核酸兩者。
- 如請求項1-20中任一項所述之基因編輯系統,其中該系統包含編碼該Cas12i2多肽的第一核酸,該第一核酸位於第一載體中,並且其中該系統包含編碼該RNA指導物的第二核酸,該第二核酸位於第二載體中。
- 如請求項1-22中任一項所述之基因編輯系統,其中該系統進一步包含 (iii) 模板DNA,該模板DNA包含 (a) 與該TTR基因中的第一位點同源的第一區段,該第一位點在用於基因編輯的TTR基因靶位點的上游,(b) 與第二位點同源的第二區段,該第二位點在該用於基因編輯的TTR基因靶位點的下游,和 (c) 供體區,該供體區與該用於基因編輯的TTR基因靶位點同源並包含至少一個相對於該用於基因編輯的TTR基因靶位點的核苷酸變化;並且其中該供體區的側翼係該第一區段和該第二區段。
- 如請求項23所述之基因編輯系統,其中該用於基因編輯的TTR基因靶位點包含該靶序列、該PAM、或其組合。
- 如請求項23或請求項24所述之基因編輯系統,其中該用於基因編輯的TTR基因靶位點包含與疾病相關的突變,並且其中該供體區包含修復該突變的序列。
- 如請求項25所述之基因編輯系統,其中該與疾病相關的突變導致相對於SEQ ID NO: 257的TTR序列的胺基酸殘基取代V30M、V122I、T60A、L58H、或I84S。
- 如請求項23或請求項24所述之基因編輯系統,其中該供體區包含相對於該用於基因編輯的TTR基因靶位點的保護性突變。
- 如請求項27所述之基因編輯系統,其中該保護性突變導致相對於SEQ ID NO: 257的TTR序列的胺基酸殘基取代T119M。
- 如請求項23-28中任一項所述之基因編輯系統,其中該模板化的DNA位於病毒載體中,該病毒載體視需要是AAV載體。
- 如請求項1-29中任一項所述之基因編輯系統,其中該系統包含一或多個脂質奈米顆粒(LNP),該一或多個LNP涵蓋 (i)、(ii)、或兩者,以及視需要 (iii)。
- 如請求項30所述之基因編輯系統,其中該系統包含該LNP,該LNP涵蓋 (i),並且其中該系統包含病毒載體,該病毒載體包含編碼該RNA指導物的第二核酸;視需要其中該病毒載體係AAV載體。
- 如請求項30所述之基因編輯系統,其中該系統包含該LNP,該LNP涵蓋 (ii),並且其中該系統包含病毒載體,該病毒載體包含編碼Cas12i2多肽的第一核酸;視需要其中該病毒載體係AAV載體。
- 一種用於運甲狀腺素蛋白(TTR)基因的基因編輯的基因編輯系統,該基因編輯系統包含 (i) Cas12i多肽或編碼該Cas12i多肽的第一核酸,視需要其中該Cas12i多肽係Cas12i2多肽; (ii) RNA指導物或編碼該RNA指導物的第二核酸,其中該RNA指導物包含對TTR基因的外顯子2、外顯子3或外顯子4內的靶序列具有特異性的間隔子序列,該靶序列與包含5'-TTN-3'模體的原型間隔子相鄰模體(PAM)相鄰,該PAM位於該靶序列的5'。
- 如請求項33所述之基因編輯系統,其中該靶序列包含: (i) GACCATCAGAGGACACTTGG(SEQ ID NO: 329)、 (ii) TAGATGCTGTCCGAGGCAGT(SEQ ID NO: 330)、 (iii) CTGAACACATGCACGGCCAC(SEQ ID NO: 332)、 (iv) GGCAACTTACCCAGAGGCAA(SEQ ID NO: 333)、 (v) TTTGGCAACTTACCCAGAGG(SEQ ID NO: 334)、 (vi) CACACCTTATAGGAAAACCA(SEQ ID NO: 335)、 (vii) GTATATCCCTTCTACAAATT(SEQ ID NO: 337)、 (viii) CAGTAAGATTTGGTGTCTAT(SEQ ID NO: 338)、或 (ix) CACCACGGCTGTCGTCACCA(SEQ ID NO: 271)。
- 如請求項34所述之基因編輯系統,其中該間隔子序列被闡述為: (i) GACCAUCAGAGGACACUUGG(SEQ ID NO: 410)、 (ii) UAGAUGCUGUCCGAGGCAGU(SEQ ID NO: 411)、 (iii) CUGAACACAUGCACGGCCAC(SEQ ID NO: 412)、 (iv) GGCAACUUACCCAGAGGCAA(SEQ ID NO: 413)、 (v) UUUGGCAACUUACCCAGAGG(SEQ ID NO: 414)、 (vi) CACACCUUAUAGGAAAACCA(SEQ ID NO: 415)、 (vii) GUAUAUCCCUUCUACAAAUU(SEQ ID NO: 416)、 (viii) CAGUAAGAUUUGGUGUCUAU(SEQ ID NO: 417)、或 (xi) CACCACGGCUGUCGUCACCA(SEQ ID NO: 418)。
- 如請求項33-35中任一項所述之基因編輯系統,該基因編輯系統包含編碼該Cas12i2多肽的第一核酸。
- 如請求項36所述之基因編輯系統,其中該第一核酸係信使RNA(mRNA)。
- 如請求項37所述之基因編輯系統,其中該第一核酸被包括在病毒載體中,該病毒載體視需要是腺相關病毒(AAV)載體。
- 如請求項33-38中任一項所述之基因編輯系統,其中該間隔子序列的長度係20-30個核苷酸,視需要其中該間隔子序列的長度係20個核苷酸。
- 如請求項33-39中任一項所述之基因編輯系統,其中該RNA指導物包含該間隔子序列和直接重複序列。
- 如請求項40所述之基因編輯系統,其中該直接重複序列的長度係23-36個核苷酸。
- 如請求項41所述之基因編輯系統,其中該直接重複序列與SEQ ID NO: 1-10中的任一個或其長度為至少23個核苷酸的片段具有至少90%的同一性。
- 如請求項42所述之基因編輯系統,其中該直接重複序列係SEQ ID NO: 1-10中的任一個、或其長度為至少23個核苷酸的片段。
- 如請求項43所述之基因編輯系統,其中該直接重複序列係5’-AGAAAUCCGUCUUUCAUUGACGG-3’(SEQ ID NO: 10)。
- 如請求項43所述之基因編輯系統,其中該RNA指導物包含以下的核苷酸序列: (i) AGAAAUCCGUCUUUCAUUGACGGGACCAUCAGAGGACACUUGG(SEQ ID NO: 347)、 (ii) AGAAAUCCGUCUUUCAUUGACGGUAGAUGCUGUCCGAGGCAGU(SEQ ID NO: 348)、 (iii) AGAAAUCCGUCUUUCAUUGACGGCUGAACACAUGCACGGCCAC(SEQ ID NO: 350)、 (iv) AGAAAUCCGUCUUUCAUUGACGGGGCAACUUACCCAGAGGCAA(SEQ ID NO: 351)、 (v) AGAAAUCCGUCUUUCAUUGACGGUUUGGCAACUUACCCAGAGG(SEQ ID NO: 352)、 (vi) AGAAAUCCGUCUUUCAUUGACGGCACACCUUAUAGGAAAACCA(SEQ ID NO: 353)、 (vii) AGAAAUCCGUCUUUCAUUGACGGGUAUAUCCCUUCUACAAAUU(SEQ ID NO: 355)、 (viii) AGAAAUCCGUCUUUCAUUGACGGCAGUAAGAUUUGGUGUCUAU(SEQ ID NO: 356)、或 (ix) AGAAAUCCGUCUUUCAUUGACGGCACCACGGCUGUCGUCACCA(SEQ ID NO: 358)。
- 如請求項33-45中任一項所述之基因編輯系統,其中該系統包含編碼該RNA指導物的第二核酸。
- 如請求項46所述之基因編輯系統,其中編碼該RNA指導物的核酸位於病毒載體中。
- 如請求項38-47中任一項所述之基因編輯系統,其中該病毒載體包含編碼該Cas12i2多肽的第一核酸和編碼該RNA指導物的第二核酸兩者。
- 如請求項33-48中任一項所述之基因編輯系統,其中該系統包含編碼該Cas12i2多肽的第一核酸,該第一核酸位於第一載體上,並且其中該系統包含編碼該RNA指導物的第二核酸,該第二核酸位於第二載體上。
- 如請求項33-49中任一項所述之基因編輯系統,其中該系統進一步包含 (iii) 模板DNA,該模板DNA包含 (a) 與該TTR基因中的第一位點同源的第一區段,該第一位點在用於基因編輯的TTR基因靶位點的上游,(b) 與第二位點同源的第二區段,該第二位點在該用於基因編輯的TTR基因靶位點的下游,和 (c) 供體區,該供體區與該用於基因編輯的TTR基因靶位點同源並包含至少一個相對於該用於基因編輯的TTR基因靶位點的核苷酸變化;並且其中該供體區的側翼係該第一區段和該第二區段。
- 如請求項50所述之基因編輯系統,其中該用於基因編輯的TTR基因靶位點包含該靶序列、該PAM、或其組合。
- 如請求項50或請求項51所述之基因編輯系統,其中該用於基因編輯的TTR基因靶位點包含與疾病相關的突變,並且其中該供體區包含修復該突變的序列。
- 如請求項52所述之基因編輯系統,其中該與疾病相關的突變導致相對於SEQ ID NO: 257的TTR序列的胺基酸殘基取代V30M、V122I、T60A、L58H、或I84S。
- 如請求項50或請求項53所述之基因編輯系統,其中該供體區包含相對於該用於基因編輯的TTR基因靶位點的保護性突變。
- 如請求項54所述之基因編輯系統,其中該保護性突變導致相對於SEQ ID NO: 257的TTR序列的胺基酸殘基取代T119M。
- 如請求項50-55中任一項所述之基因編輯系統,其中該模板化的DNA位於病毒載體中,該病毒載體視需要是AAV載體。
- 如請求項33-56中任一項所述之基因編輯系統,其中該系統包含一或多個脂質奈米顆粒(LNP),該一或多個LNP涵蓋 (i)、(ii)、或兩者,或視需要 (iii)。
- 如請求項57所述之基因編輯系統,其中該系統包含該LNP,該LNP涵蓋 (i),並且其中該系統包含病毒載體,該病毒載體包含編碼該RNA指導物的第二核酸;視需要其中該病毒載體係AAV載體。
- 如請求項57所述之基因編輯系統,其中該系統包含該LNP,該LNP涵蓋 (ii),並且其中該系統包含病毒載體,該病毒載體包含編碼Cas12i2多肽的第一核酸;視需要其中該病毒載體係AAV載體。
- 一種用於運甲狀腺素蛋白(TTR)基因的基因編輯的基因編輯系統,該基因編輯系統包含 (i) Cas12i多肽或編碼該Cas12i多肽的第一核酸,視需要其中該Cas12i多肽係Cas12i2多肽; (ii) RNA指導物或編碼該RNA指導物的第二核酸,其中該RNA指導物包含對TTR基因內的靶序列具有特異性的間隔子序列,該靶序列與包含5'-TTN-3'模體的原型間隔子相鄰模體(PAM)相鄰,該PAM位於該靶序列的5';以及 (iii) 模板DNA,該模板DNA包含 (a) 與該TTR基因中的第一位點同源的第一區段,該第一位點在用於基因編輯的TTR基因靶位點的上游,(b) 與第二位點同源的第二區段,該第二位點在該用於基因編輯的TTR基因靶位點的下游,和 (c) 供體區,該供體區與該用於基因編輯的TTR基因靶位點同源並包含至少一個相對於該用於基因編輯的TTR基因靶位點的核苷酸變化;並且其中該供體區的側翼係該第一區段和該第二區段。
- 如請求項60所述之基因編輯系統,其中該模板DNA中的供體區包含修復該與疾病相關的TTR基因靶位點中的突變的序列、包含保護性突變、或其組合。
- 一種藥物組成物,該藥物組成物包含如請求項1-61中任一項闡述的基因編輯系統。
- 一種套組,該套組包含如請求項1-61中任一項闡述的基因編輯系統的元件 (i) 和 (ii)、以及視需要 (iii)。
- 一種用於編輯細胞中的運甲狀腺素蛋白(TTR)基因之方法,該方法包括使宿主細胞與如請求項1-61中任一項闡述的用於編輯該TTR基因的基因編輯系統接觸,以對該宿主細胞中的TTR基因進行基因編輯。
- 如請求項64所述之方法,其中該宿主細胞在體外培養。
- 如請求項65所述之方法,其中該接觸步驟藉由以下進行:向包含該宿主細胞的受試者投與用於編輯該TTR基因的系統。
- 一種包含經突變的運甲狀腺素蛋白(TTR)基因的細胞,其中該細胞視需要藉由以下產生:使宿主細胞與如請求項1-61中任一項所述之基因編輯系統接觸以對該宿主細胞中的TTR基因進行基因編輯,從而使該TTR基因突變。
- 如請求項67所述之細胞,其中該細胞包含經破壞的TTR基因。
- 如請求項67所述之細胞,其中該細胞包含經修飾的TTR基因,該經修飾的TTR基因相對於野生型對應細胞表現經突變的TTR。
- 一種用於治療受試者的澱粉樣變運甲狀腺素蛋白(ATTR)之方法,該方法包括向有需要的受試者投與如請求項1-61中任一項闡述的用於編輯運甲狀腺素蛋白(TTR)基因的基因編輯系統或如請求項67-69中任一項所述之細胞。
- 如請求項70所述之方法,其中該受試者係患有遺傳性ATTR(hATTR)或野生型ATTR類澱粉變性的人患者。
- 一種RNA指導物,該RNA指導物包含 (i) 對運甲狀腺素蛋白(TTR)基因中的靶序列具有特異性的間隔子序列,其中該靶序列與包含5’-TTN-3’模體的原型間隔子相鄰模體(PAM)相鄰,該PAM位於該靶序列的5’;以及 (ii) 直接重複序列。
- 如請求項72所述之RNA指導物,其中該間隔子序列的長度係20-30個核苷酸,視需要長度係20個核苷酸。
- 如請求項72或請求項73所述之RNA指導物,其中該直接重複序列的長度係23-36個核苷酸,視需要長度係23個核苷酸。
- 如請求項72-74中任一項所述之RNA指導物,其中該靶序列在該TTR基因的外顯子2、外顯子3或外顯子4內。
- 如請求項75所述之RNA指導物,其中該靶序列包含: (i) GACCATCAGAGGACACTTGG(SEQ ID NO: 329)、 (ii) TAGATGCTGTCCGAGGCAGT(SEQ ID NO: 330)、 (iii) CTGAACACATGCACGGCCAC(SEQ ID NO: 332)、 (iv) GGCAACTTACCCAGAGGCAA(SEQ ID NO: 333)、 (v) TTTGGCAACTTACCCAGAGG(SEQ ID NO: 334)、 (vi) CACACCTTATAGGAAAACCA(SEQ ID NO: 335)、 (vii) GTATATCCCTTCTACAAATT(SEQ ID NO: 337)、 (viii) CAGTAAGATTTGGTGTCTAT(SEQ ID NO: 338)、或 (ix) CACCACGGCTGTCGTCACCA(SEQ ID NO: 271)。
- 如請求項76所述之RNA指導物,其中該間隔子序列被闡述為: (i) GACCAUCAGAGGACACUUGG(SEQ ID NO: 410)、 (ii) UAGAUGCUGUCCGAGGCAGU(SEQ ID NO: 411)、 (iii) CUGAACACAUGCACGGCCAC(SEQ ID NO: 412)、 (iv) GGCAACUUACCCAGAGGCAA(SEQ ID NO: 413)、 (v) UUUGGCAACUUACCCAGAGG(SEQ ID NO: 414)、 (vi) CACACCUUAUAGGAAAACCA(SEQ ID NO: 415)、 (vii) GUAUAUCCCUUCUACAAAUU(SEQ ID NO: 416)、 (viii) CAGUAAGAUUUGGUGUCUAU(SEQ ID NO: 417)、或 (xi) CACCACGGCUGUCGUCACCA(SEQ ID NO: 418)。
- 如請求項72-77中任一項所述之RNA指導物,其中該直接重複序列與SEQ ID NO: 1-10中的任一個或其長度為至少23個核苷酸的片段具有至少90%的同一性。
- 如請求項78所述之RNA指導物,其中該直接重複序列係SEQ ID NO: 1-10中的任一個、或其長度為至少23個核苷酸的片段。
- 如請求項79所述之RNA指導物,其中該直接重複序列係5’-AGAAAUCCGUCUUUCAUUGACGG-3’(SEQ ID NO: 10)。
- 如請求項78所述之RNA指導物,該RNA指導物包含以下的核苷酸序列: (i) AGAAAUCCGUCUUUCAUUGACGGGACCAUCAGAGGACACUUGG(SEQ ID NO: 347)、 (ii) AGAAAUCCGUCUUUCAUUGACGGUAGAUGCUGUCCGAGGCAGU(SEQ ID NO: 348)、 (iii) AGAAAUCCGUCUUUCAUUGACGGCUGAACACAUGCACGGCCAC(SEQ ID NO: 350)、 (iv) AGAAAUCCGUCUUUCAUUGACGGGGCAACUUACCCAGAGGCAA(SEQ ID NO: 351)、 (v) AGAAAUCCGUCUUUCAUUGACGGUUUGGCAACUUACCCAGAGG(SEQ ID NO: 352)、 (vi) AGAAAUCCGUCUUUCAUUGACGGCACACCUUAUAGGAAAACCA(SEQ ID NO: 353)、 (vii) AGAAAUCCGUCUUUCAUUGACGGGUAUAUCCCUUCUACAAAUU(SEQ ID NO: 355)、 (viii) AGAAAUCCGUCUUUCAUUGACGGCAGUAAGAUUUGGUGUCUAU(SEQ ID NO: 356)、或 (ix) AGAAAUCCGUCUUUCAUUGACGGCACCACGGCUGUCGUCACCA(SEQ ID NO: 358)。
Applications Claiming Priority (8)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163197036P | 2021-06-04 | 2021-06-04 | |
US63/197,036 | 2021-06-04 | ||
US202163247080P | 2021-09-22 | 2021-09-22 | |
US63/247,080 | 2021-09-22 | ||
US202263321960P | 2022-03-21 | 2022-03-21 | |
US63/321,960 | 2022-03-21 | ||
PCT/US2022/032107 WO2022256619A2 (en) | 2021-06-04 | 2022-06-03 | Gene editing systems comprising an rna guide targeting transthyretin (ttr) and uses thereof |
WOPCT/US22/32107 | 2022-06-03 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW202317761A true TW202317761A (zh) | 2023-05-01 |
Family
ID=82492461
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW111120920A TW202317761A (zh) | 2021-06-04 | 2022-06-06 | 包含靶向運甲狀腺素蛋白(ttr)的rna指導物的基因編輯系統及其用途 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20220396782A1 (zh) |
EP (1) | EP4347831A2 (zh) |
TW (1) | TW202317761A (zh) |
WO (1) | WO2022256619A2 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114015674A (zh) | 2021-11-02 | 2022-02-08 | 辉二(上海)生物科技有限公司 | 新型CRISPR-Cas12i*** |
WO2023185697A2 (en) * | 2022-03-29 | 2023-10-05 | Accuredit Therapeutics (Suzhou) Co., Ltd. | Compositions and methods for treatment of transthyretin amyloidosis |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
PT3765615T (pt) | 2018-03-14 | 2023-08-28 | Arbor Biotechnologies Inc | Novas enzimas e sistemas de direcionamento de dna crispr |
KR20220004648A (ko) * | 2019-03-28 | 2022-01-11 | 인텔리아 테라퓨틱스, 인크. | Ttr 가이드 rna, 및 rna-가이드 dna 결합제를 암호화하는 폴리뉴클레오티드를 포함하는 조성물 및 방법 |
IL296791A (en) | 2020-03-31 | 2022-11-01 | Arbor Biotechnologies Inc | Preparations containing a polypeptide variant of cas12i2 and uses thereof |
WO2021257730A2 (en) * | 2020-06-16 | 2021-12-23 | Arbor Biotechnologies, Inc. | Cells modified by a cas12i polypeptide |
CN113308451B (zh) * | 2020-12-07 | 2023-07-25 | 中国科学院动物研究所 | 工程化的Cas效应蛋白及其使用方法 |
-
2022
- 2022-06-03 EP EP22741043.8A patent/EP4347831A2/en active Pending
- 2022-06-03 US US17/831,852 patent/US20220396782A1/en active Pending
- 2022-06-03 WO PCT/US2022/032107 patent/WO2022256619A2/en active Application Filing
- 2022-06-06 TW TW111120920A patent/TW202317761A/zh unknown
Also Published As
Publication number | Publication date |
---|---|
WO2022256619A2 (en) | 2022-12-08 |
US20220396782A1 (en) | 2022-12-15 |
WO2022256619A3 (en) | 2023-01-05 |
EP4347831A2 (en) | 2024-04-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TW202317761A (zh) | 包含靶向運甲狀腺素蛋白(ttr)的rna指導物的基因編輯系統及其用途 | |
US20230203539A1 (en) | Gene editing systems comprising an rna guide targeting stathmin 2 (stmn2) and uses thereof | |
KR20230107265A (ko) | Pdcd1을 표적화하는 rna 가이드를 포함하는 조성물 및 이의 용도 | |
US11821012B2 (en) | Gene editing systems comprising an RNA guide targeting hydroxyacid oxidase 1 (HAO1) and uses thereof | |
US11939607B2 (en) | Gene editing systems comprising an RNA guide targeting lactate dehydrogenase a (LDHA) and uses thereof | |
CN117813382A (zh) | 包括靶向stathmin 2(stmn2)的rna向导的基因编辑***和其用途 | |
TW202334421A (zh) | 包含靶向ciita之rna引導之組合物及其用途 | |
US20230023791A1 (en) | Gene editing systems comprising a crispr nuclease and uses thereof | |
US20230399639A1 (en) | Compositions comprising an rna guide targeting b2m and uses thereof | |
WO2023018856A1 (en) | Gene editing systems comprising an rna guide targeting polypyrimidine tract binding protein 1 (ptbp1) and uses thereof | |
CN117897485A (zh) | 包括靶向羟基酸氧化酶1(hao1)的rna向导的基因编辑***和其用途 | |
WO2023122433A1 (en) | Gene editing systems targeting hydroxyacid oxidase 1 (hao1) and lactate dehydrogenase a (ldha) | |
WO2023137451A1 (en) | Compositions comprising an rna guide targeting cd38 and uses thereof | |
KR20230117116A (ko) | Trac를 표적화하는 rna 가이드를 포함하는 조성물 및 이의 용도 | |
JP2023549080A (ja) | Bcl11aを標的とするrnaガイドを含む組成物及びその使用 | |
WO2024118747A1 (en) | Reverse transcriptase-mediated genetic editing of transthyretin (ttr) and uses thereof | |
CN116670275A (zh) | 包含靶向pdcd1的rna指导物的组合物及其用途 | |
CN116648505A (zh) | 包含靶向b2m的rna指导物的组合物及其用途 | |
EP4158020A2 (en) | Compositions comprising a cas12i2 polypeptide and uses thereof |