TW202317761A - 包含靶向運甲狀腺素蛋白(ttr)的rna指導物的基因編輯系統及其用途 - Google Patents

包含靶向運甲狀腺素蛋白(ttr)的rna指導物的基因編輯系統及其用途 Download PDF

Info

Publication number
TW202317761A
TW202317761A TW111120920A TW111120920A TW202317761A TW 202317761 A TW202317761 A TW 202317761A TW 111120920 A TW111120920 A TW 111120920A TW 111120920 A TW111120920 A TW 111120920A TW 202317761 A TW202317761 A TW 202317761A
Authority
TW
Taiwan
Prior art keywords
seq
nucleotides
sequence
gene
ttr
Prior art date
Application number
TW111120920A
Other languages
English (en)
Inventor
昆頓 諾曼 韋塞爾
傑佛利 雷蒙 哈斯威爾
蒂亞 瑪麗 迪托馬索
諾亞 邁克爾 賈基莫
塞茹蒂 森古塔
Original Assignee
美商喬木生物技術公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 美商喬木生物技術公司 filed Critical 美商喬木生物技術公司
Publication of TW202317761A publication Critical patent/TW202317761A/zh

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • A61K31/7105Natural ribonucleic acids, i.e. containing only riboses attached to adenine, guanine, cytosine or uracil and having 3'-5' phosphodiester links
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/46Hydrolases (3)
    • A61K38/465Hydrolases (3) acting on ester bonds (3.1), e.g. lipases, ribonucleases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/30Special therapeutic applications
    • C12N2320/34Allele or polymorphism specific uses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14311Parvovirus, e.g. minute virus of mice
    • C12N2750/14341Use of virus, viral particle or viral elements as a vector
    • C12N2750/14343Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Epidemiology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Immunology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Virology (AREA)
  • Cell Biology (AREA)
  • Mycology (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

揭露了一種用於運甲狀腺素蛋白(TTR)基因的基因編輯的系統,該系統包含 (i) Cas12i2多肽或編碼該Cas12i2多肽的第一核酸;以及 (ii) RNA指導物或編碼該RNA指導物的第二核酸,其中該RNA指導物包含對TTR基因內的靶序列具有特異性的間隔子序列。本文還提供了用於使用本文揭露的基因編輯系統編輯TTR基因和/或用於治療與TTR基因相關的疾病之方法。

Description

包含靶向運甲狀腺素蛋白(TTR)的RNA指導物的基因編輯系統及其用途
相關申請的交叉引用。本申請根據35 U.S.C. § 119(e)要求2021年6月4日提交的美國臨時申請案號63/197,036、2021年9月22日提交的美國臨時申請案號63/247,080、以及2022年3月21日提交的美國臨時申請案號63/321,960的權益,每個文獻的內容藉由援引以其全文併入本文。
序列表。本申請含有已以ASCII格式以電子方式提交且特此藉由援引以其全文併入的序列表。所述ASCII副本創建於2022年6月3日,命名為116928-0034-0002WO00_SEQ.txt,並且大小為203,161位元組。
本發明係關於一種包含靶向運甲狀腺素蛋白(TTR)的RNA指導物的基因編輯系統及其用途。
規律間隔重複短迴文序列簇(CRISPR)和CRISPR相關(Cas)基因(統稱為CRISPR-Cas或CRISPR/Cas系統)係古細菌和細菌中針對外來遺傳元件而防禦特定物種的適應性免疫系統。
本揭露內容至少部分基於用於運甲狀腺素蛋白(TTR)基因的基因編輯的系統的開發。該系統涉及Cas12i CRISPR核酸酶多肽(例如Cas12i2多肽或Cas12i4多肽)和指導RNA(gRNA),該指導RNA介導Cas12i CRISPR核酸酶多肽在TTR基因內的基因位點處的切割。該系統可以進一步涉及模板核酸,可經由同源重組在TTR基因內的基因位點處摻入該模板核酸,進而在該基因位點處將一或多個修飾引入該TTR基因。如本文所報告,本文揭露的基因編輯系統已經實現了TTR基因的成功編輯,具有高編輯效率和準確性。
不受理論的束縛,本文揭露的基因編輯系統可以進一步展現出一或多種以下有利特徵。與SpCas9和Cas12a相比,Cas12i效應子更小(1033至1093 aa),這種特徵連同它們的短成熟crRNA(40-43 nt)在遞送和合成成本方面係較佳的。與Cas9切割誘導的小缺失和+1***相比,Cas12i切割導致較大的缺失。Cas12i PAM序列也不同於Cas9的那些。因此,與Cas9相比,Cas12i多肽和RNA指導物可以破壞目的基因位點的較大部分和不同部分。使用基於標籤化的標籤整合位點定序(TTISS)的無偏方法,與Cas12i2相比,針對SpCas9鑒定出了更多潛在的脫靶位點,該等位點具有更多數目的獨特整合事件。參見 WO/2021/202800。因此,Cas12i2可以比Cas9更有特異性。
因此,本文提供了用於編輯TTR基因的基因編輯系統、包含該等基因編輯系統的藥物組成物或套組(kit)、使用該等基因編輯系統產生經基因修飾的細胞之方法、以及由此產生的所得細胞。本文還提供了本文揭露的基因編輯系統、包含該等基因編輯系統的藥物組成物和套組、和/或由此產生的經基因修飾的細胞用於治療受試者的澱粉樣變運甲狀腺素蛋白(ATTR)之用途。
在一些方面,本揭露內容的特點在於一種用於運甲狀腺素蛋白(TTR)基因的基因編輯的基因編輯系統,該基因編輯系統包含 (i) Cas12i多肽或編碼該Cas12i2多肽的第一核酸,和 (ii) RNA指導物或編碼該RNA指導物的第二核酸。RNA指導物包含對TTR基因內的靶序列具有特異性的間隔子序列,該靶序列與包含5'-TTN-3'模體的原型間隔子相鄰模體(PAM)相鄰,該PAM位於該靶序列的5'。
在一些實施方式中,Cas12i多肽可為Cas12i2多肽。在其他實施方式中,Cas12i多肽可為Cas12i4多肽。
在一些實施方式中,Cas12i多肽係Cas12i2多肽,其包含與SEQ ID NO: 222具有至少95%同一性的胺基酸序列並且相對於SEQ ID NO: 222包含一或多個突變。在一些實施方式中,Cas12i2多肽中的一或多個突變在SEQ ID NO: 222的位置D581、G624、F626、P868、I926、V1030、E1035、和/或S1046處。例如,該一或多個突變係胺基酸取代,例如,D581R、G624R、F626R、P868T、I926R、V1030G、E1035R、S1046G、或其組合。
在一個實例中,Cas12i2多肽在位置D581、D911、I926、和V1030處包含突變(例如,胺基酸取代D581R、D911R、I926R、和V1030G)。在另一實例中,Cas12i2多肽在位置D581、I926、和V1030處包含突變(例如,胺基酸取代D581R、I926R、和V1030G)。在又另一實例中,Cas12i2多肽在位置D581、I926、V1030、和S1046處包含突變(例如,胺基酸取代D581R、I926R、V1030G、和S1046G)。在仍另一實例中,Cas12i2多肽在位置D581、G624、F626、I926、V1030、E1035、和S1046處包含突變(例如,胺基酸取代D581R、G624R、F626R、I926R、V1030G、E1035R、和S1046G)。在另一實例中,Cas12i2多肽在位置D581、G624、F626、P868、I926、V1030、E1035、和S1046處包含突變(例如,胺基酸取代D581R、G624R、F626R、P868T、I926R、V1030G、E1035R、和S1046G)。
用於在本文揭露的任何基因編輯系統中使用的示例性Cas12i2多肽可以包含SEQ ID NO: 223-227中任一個的胺基酸序列。在一個實例中,用於在本文揭露的任何基因編輯系統中使用的示例性Cas12i2多肽包含SEQ ID NO: 224的胺基酸序列。在另一實例中,用於在本文揭露的任何基因編輯系統中使用的示例性Cas12i2多肽包含SEQ ID NO: 227的胺基酸序列。
在一些實施方式中,基因編輯系統可以包含編碼Cas12i多肽(例如,Cas12i2多肽)的第一核酸。在一些情況下,第一核酸位於第一載體(例如,病毒載體,如腺相關病毒載體或AAV載體)中。在一些情況下,第一核酸係信使RNA(mRNA)。在一些情況下,Cas12i多肽的編碼序列經密碼子優化。
在一些實施方式中,靶序列在TTR基因的外顯子2、外顯子3或外顯子4內。在一些實例中,靶序列包含:(i) GACCATCAGAGGACACTTGG(SEQ ID NO: 329)、(ii) TAGATGCTGTCCGAGGCAGT(SEQ ID NO: 330)、(iii) CTGAACACATGCACGGCCAC(SEQ ID NO: 332)、(iv) GGCAACTTA CCCAGAGGCAA(SEQ ID NO: 333)、(v) TTTGGCAACTTACCCAGAGG(SEQ ID NO: 334)、(vi) CACACCTTATAGGAAAACCA(SEQ ID NO: 335)、(vii) GTATATCCCTTCTACAAATT(SEQ ID NO: 337)、(viii) CAGTAAGA TTTGGTGTCTAT(SEQ ID NO: 338)、或 (ix) CACCACGGCTGTCGTCACCA(SEQ ID NO: 271)。
在一些實施方式中,間隔子序列的長度可為20-30個核苷酸。在一些實例中,間隔子序列的長度係20個核苷酸。在一些實例中,間隔子序列包含:(i) GACCAUCAGAGGACACUUGG(SEQ ID NO: 410)、(ii) UAGAUGCUGUCCGAGGCAGU(SEQ ID NO: 411)、(iii) CUGAACACAU GCACGGCCAC(SEQ ID NO: 412)、(iv) GGCAACUUACCCAGAGGCAA(SEQ ID NO: 413)、(v) UUUGGCAACUUACCCAGAGG(SEQ ID NO: 414)、(vi) CACACCUUAUAGGAAAACCA(SEQ ID NO: 415)、(vii) GUAUAUCCCUU CUACAAAUU(SEQ ID NO: 416)、(viii) CAGUAAGAUUUGGUGUCUAU(SEQ ID NO: 417)、或 (ix) CACCACGGCUGUCGUCACCA(SEQ ID NO: 418)。
在一些實施方式中,RNA指導物(gRNA)包含間隔子和直接重複序列。在一些實例中,直接重複序列的長度係23-36個核苷酸。在一個實例中,直接重複序列與SEQ ID NO: 1-10中的任一個或其長度為至少23個核苷酸的片段具有至少90%的同一性。在一些特定的實例中,直接重複序列係SEQ ID NO: 1-10中的任一個、或其長度為至少23個核苷酸的片段。作為非限制性實例,直接重複序列係5’-AGAAAUCCGUCUUUCAUUGACGG-3’(SEQ ID NO: 10)。
在特定的實例中,RNA指導物包含以下的核苷酸序列:(i) AGAAAUCCGUCUUUCAUUGACGGGACCAUCAGAGGACACUUGG(SEQ ID NO: 347)、(ii) AGAAAUCCGUCUUUCAUUGACGGUAGAUGCUGUCCGAGG CAGU(SEQ ID NO: 348)、(iii) AGAAAUCCGUCUUUCAUUGACGGCUGAACA CAUGCACGGCCAC(SEQ ID NO: 350)、(iv) AGAAAUCCGUCUUUCAUUGAC GGGGCAACUUACCCAGAGGCAA(SEQ ID NO: 351)、(v) AGAAAUCCGUC UUUCAUUGACGGUUUGGCAACUUACCCAGAGG(SEQ ID NO: 352)、(vi) AGAAAUCCGUCUUUCAUUGACGGCACACCUUAUAGGAAAAC CA(SEQ ID NO: 353)、(vii) AGAAAUCCGUCUUUCAUUGACGGGUAUAUCCCUUCUAC AAAUU(SEQ ID NO: 355)、(viii) AGAAAUCCGUCUUUCAUUGACGGCAG UAAGAUUU GGUGUCUAU(SEQ ID NO: 356)、或 (ix) AGAAAUCCGUC UUUCAUUGACGGCACCACG GCUGUCGUCACCA(SEQ ID NO: 358)。在一些實例中,RNA指導物可以包含一或多個修飾,例如,包含SEQ ID NO: 277的經修飾的核苷酸序列。
在一些實施方式中,該系統可以包含編碼RNA指導物的第二核酸。在一些實例中,編碼RNA指導物的核酸可以位於病毒載體中。在一些實例中,病毒載體包含編碼Cas12i多肽(例如,Cas12i2多肽)的第一核酸和編碼RNA指導物的第二核酸兩者。
在一些實施方式中,本文所述之任何系統可以包含編碼Cas12i多肽(例如,Cas12i2多肽)的第一核酸和編碼RNA指導物的第二核酸,該第一核酸位於第一載體中,該第二核酸位於第二載體上。在一些實例中,第一載體和/或第二載體係病毒載體。在一些特定的實例中,第一載體和第二載體係相同的載體。在其他實例中,第一載體和第二載體係不同的載體。
本文揭露的任何基因編輯系統可以進一步包含 (iii) 模板DNA,該模板DNA包含 (a) 與TTR基因中的第一位點同源的第一區段,該第一位點在用於基因編輯的TTR基因靶位點的上游,(b) 與第二位點同源的第二區段,該第二位點在用於基因編輯的TTR基因靶位點的下游,和 (c) 供體區,該供體區與用於基因編輯的TTR基因靶位點同源並包含至少一個相對於用於基因編輯的TTR基因靶位點的核苷酸變化;並且其中該供體區的側翼係該第一區段和該第二區段。在一些實施方式中,用於基因編輯的TTR基因靶位點包含靶序列、PAM、或其組合。模板化的DNA位於病毒載體(例如AAV載體)中。
在一些實施方式中,用於基因編輯的TTR基因靶位點包含與疾病相關的突變,並且其中供體區包含修復該突變的序列。與疾病相關的示例性突變可導致相對於SEQ ID NO: 257的TTR序列的胺基酸殘基取代V30M、V122I、T60A、L58H、或I84S。
在其他實施方式中,供體區包含相對於用於基因編輯的TTR基因靶位點的保護性突變。例如,保護性突變導致相對於SEQ ID NO: 257的TTR序列的胺基酸殘基取代T119M。
在一些實施方式中,基因編輯系統可以包含一或多個脂質奈米顆粒(LNP),該一或多個LNP涵蓋 (i)、(ii)、或兩者,以及視需要 (iii)。在一些實例中,基因編輯系統可以包含LNP,該LNP涵蓋 (i),並且其中該系統包含病毒載體,該病毒載體包含編碼RNA指導物的第二核酸;視需要其中該病毒載體係AAV載體。在其他實例中,基因編輯系統可以包含LNP,該LNP涵蓋 (ii),並且其中該系統包含病毒載體,該病毒載體包含編碼Cas12i多肽(例如,Cas12i2多肽)的第一核酸;視需要其中該病毒載體係AAV載體。
在其他方面,本揭露內容提供了一種用於運甲狀腺素蛋白(TTR)基因的基因編輯的基因編輯系統,該基因編輯系統包含 (i) Cas12i多肽(例如,Cas12i2或Cas12i4多肽)或編碼該Cas12i多肽的第一核酸、(ii) RNA指導物或編碼該RNA指導物的第二核酸。RNA指導物可以包含對TTR基因的外顯子2、外顯子3、或外顯子4內的靶序列具有特異性的間隔子序列。靶序列與包含5'-TTN-3'模體的原型間隔子相鄰模體(PAM)相鄰,該PAM位於該靶序列的5'。任何靶序列和/或間隔子序列均可用於該基因編輯系統。
在一些實施方式中,本文提供了一種用於運甲狀腺素蛋白(TTR)基因的基因編輯的基因編輯系統,該基因編輯系統包含 (i) 如本文揭露的Cas12i多肽(例如,Cas12i2多肽或Cas12i4多肽)或編碼該Cas12i多肽的第一核酸;(ii) 如本文揭露的RNA指導物或編碼該RNA指導物的第二核酸,其中該RNA指導物包含對TTR基因內的靶序列具有特異性的間隔子序列,該靶序列與包含5'-TTN-3'模體的原型間隔子相鄰模體(PAM)相鄰,該PAM位於該靶序列的5';以及 (iii) 如本文揭露的模板DNA,該模板DNA包含 (a) 與TTR基因中的第一位點同源的第一區段,該第一位點在用於基因編輯的TTR基因靶位點的上游,(b) 與第二位點同源的第二區段,該第二位點在用於基因編輯的TTR基因靶位點的下游,和 (c) 供體區,該供體區與用於基因編輯的TTR基因靶位點同源並包含至少一個相對於用於基因編輯的TTR基因靶位點的核苷酸變化;並且其中該供體區的側翼係該第一區段和該第二區段。在一些實例中,模板DNA中的供體區包含修復與疾病相關的TTR基因靶位點中的突變的序列、包含保護性突變、或其組合。
在一些方面,本揭露內容還提供了一種包含本文揭露的任何基因編輯系統的藥物組成物、或包含該基因編輯系統的組分的套組。
在一些方面,本揭露內容提供了一種用於編輯細胞中的運甲狀腺素蛋白(TTR)基因之方法,該方法包括使宿主細胞與本文揭露的用於編輯TTR基因的任何基因編輯系統接觸,以對該宿主細胞中的TTR基因進行基因編輯。在一些情況下,宿主細胞在體外培養。在其他情況下,接觸步驟藉由以下進行:向包含宿主細胞的受試者投與用於編輯TTR基因的系統。
此外,本文提供了一種包含經突變的運甲狀腺素蛋白(TTR)基因的細胞,其中該細胞視需要藉由以下產生:使宿主細胞與本文揭露的基因編輯系統接觸以對該宿主細胞中的TTR基因進行基因編輯,從而使該TTR基因突變。在一些情況下,細胞包含經破壞的TTR基因。在其他情況下,細胞包含經修飾的TTR基因,該經修飾的TTR基因相對於野生型對應細胞表現經突變的TTR。
此外,本揭露內容的特點在於一種用於治療受試者的澱粉樣變運甲狀腺素蛋白(ATTR)的方法,該方法包括向有需要的受試者投與本文揭露的用於編輯運甲狀腺素蛋白(TTR)基因的任何基因編輯系統或由該基因編輯系統產生的經修飾的細胞。在一些實施方式中,受試者係患有遺傳性ATTR(hATTR)或野生型ATTR類澱粉變性的人患者。
本文還提供了用於在受試者的ATTR治療中使用的本文揭露的任何基因編輯系統、包含該等基因編輯系統的藥物組成物或套組、或由該基因編輯系統產生的經基因修飾的細胞,以及本文揭露的基因編輯系統、包含該等基因編輯系統的藥物組成物或套組、或由該基因編輯系統產生的經基因修飾的細胞用於製造藥物之用途,該藥物用於治療受試者的ATTR。
此外,本揭露內容提供了一種RNA指導物,該RNA指導物包含 (i) 對運甲狀腺素蛋白(TTR)基因中的靶序列具有特異性的間隔子序列,其中該靶序列與包含5’-TTN-3’模體的原型間隔子相鄰模體(PAM)相鄰,該PAM位於該靶序列的5’;以及 (ii) 直接重複序列。在一些實施方式中,該間隔子序列的長度係20-30個核苷酸,視需要長度係20個核苷酸。可替代地或額外地,該直接重複序列的長度係23-36個核苷酸,視需要長度係23個核苷酸。
在一些實施方式中,靶序列在TTR基因的外顯子2、外顯子3或外顯子4內。在一些實例中,靶序列包含SEQ ID NO: 329、330、332-335、337、338、或271的核苷酸序列。在一些實例中,間隔子序列如SEQ ID NO: 410-418中任一個所闡述。
在一些實施方式中,本文揭露的任何RNA指導物中的直接重複序列與SEQ ID NO: 1-10中的任一個或其長度為至少23個核苷酸的片段具有至少90%的同一性。在一些實例中,直接重複序列係SEQ ID NO: 1-10中的任一個、或其長度為至少23個核苷酸的片段。在一個實例中,直接重複序列係SEQ ID NO: 10。在特定的實例中,RNA指導物可以包含SEQ ID NO: 347、348、350-353、355、356、或358中任一個的核苷酸序列。在一些情況下,RNA指導物可以包含一或多個修飾。在一個實例中,RNA指導物係包含SEQ ID NO: 277的經修飾的RNA分子。
本揭露內容之一或多個實施方式的細節在以下描述中闡述。根據以下附圖和幾個實施方式的詳細描述以及從所附請求項,本揭露內容之其他特徵或優點將顯而易見。
本揭露內容關於一種用於運甲狀腺素蛋白(TTR)基因的基因編輯的系統,該系統包含 (i) Cas12i多肽或編碼該Cas12i2多肽的第一核酸;以及 (ii) RNA指導物或編碼該RNA指導物的第二核酸,其中該RNA指導物包含對TTR基因內的靶序列具有特異性的間隔子序列,該靶序列與包含5'-TTN-3'模體的原型間隔子相鄰模體(PAM)相鄰,該PAM位於該靶序列的5'。本揭露內容還提供了一種包含這種系統的藥物組成物或套組及其用途。本文進一步揭露了一種用於編輯細胞中的TTR基因之方法、一種如此產生的包含經破壞的TTR基因的細胞、一種治療受試者的澱粉樣變運甲狀腺素蛋白(ATTR)之方法、和一種RNA指導物、及其用途,該RNA指導物包含 (i) 對TTR基因中的靶序列具有特異性的間隔子序列,其中該靶序列與包含5'-TTN-3'模體的原型間隔子相鄰模體(PAM)相鄰,該PAM位於該靶序列的5';以及 (ii) 直接重複序列。
用於在本文揭露的基因編輯系統中使用的Cas12i多肽可為Cas12i2多肽,例如,野生型Cas12i多肽或其變體,如本文揭露的那些。在一些實例中,Cas12i2多肽包含與SEQ ID NO: 222具有至少95%同一性的胺基酸序列並且相對於SEQ ID NO: 222包含一或多個突變。在其他實例中,Cas12i多肽可為也在本文中揭露的Cas12i4多肽。 定義
本揭露內容將相對於特定實施方式並參考某些附圖進行描述,但本揭露內容不限於此,而僅由請求項來限定。除非另有說明,否則下文闡述的術語通常應以其常見意義來理解。
如本文所用,術語「活性」係指生物活性。在一些實施方式中,活性包括酶活性,例如Cas12i多肽的催化能力。例如,活性可以包括核酸酶活性。
如本文所用,術語「TTR」係指「運甲狀腺素蛋白」。TTR係血清和腦脊液中的一種轉運蛋白,其攜帶甲狀腺激素甲狀腺素(T4)和與視黃醇(維生素A)結合的視黃醇結合蛋白。TTR錯誤折疊和聚集與澱粉樣病、老年系統性澱粉樣變性、家族性澱粉樣多發性神經病變、和家族性澱粉樣心肌病相關。如本文所闡述的SEQ ID NO: 228提供了TTR基因序列之實例。如本文所闡述的SEQ ID NO: 258提供了TTR編碼序列之實例。
如本文所用,術語「Cas12i多肽」(本文也稱為Cas12i)係指與RNA指導物指定的靶核酸上的靶序列結合的多肽,其中該多肽與野生型Cas12i多肽具有至少一些胺基酸序列同源性。在一些實施方式中,Cas12i多肽與美國專利案號10,808,245的SEQ ID NO: 1-5和11-18中任一個包含至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性,出於本文引用的主題和目的,將該文獻藉由援引併入。在一些實施方式中,Cas12i多肽與本申請之SEQ ID NO: 8、2、11和9中任一個包含至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一些實施方式中,本揭露內容之Cas12i多肽係如 WO/2021/202800中所述之Cas12i2多肽,出於本文引用的主題和目的,將該文獻的相關揭露內容藉由援引併入。在一些實施方式中,Cas12i多肽切割靶核酸(例如,作為切口或雙股斷裂)。
如本文所用,術語「相鄰」係指一個核苷酸或胺基酸序列緊鄰另一個核苷酸或胺基酸序列。在一些實施方式中,如果沒有核苷酸將一個核苷酸序列與另一個核苷酸序列分隔,則這兩個序列相鄰(即,緊鄰)。在一些實施方式中,如果少量核苷酸(例如,約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20個核苷酸)將一個核苷酸序列與另一個核苷酸序列分隔,則這兩個序列相鄰。在一些實施方式中,如果第一序列與第二序列相隔約5、6、7、8、9、10、11、12、13、14或15個核苷酸,則這兩個序列相鄰。在一些實施方式中,如果第一序列與第二序列相隔最多2個核苷酸、最多5個核苷酸、最多8個核苷酸、最多10個核苷酸、最多12個核苷酸或最多15個核苷酸,則這兩個序列相鄰。在一些實施方式中,如果第一序列與第二序列相隔2-5個核苷酸、4-6個核苷酸、4-8個核苷酸、4-10個核苷酸、6-8個核苷酸、6-10個核苷酸、6-12個核苷酸、8-10個核苷酸、8-12個核苷酸、10-12個核苷酸、10-15個核苷酸或12-15個核苷酸,則這兩個序列相鄰。
如本文所用,術語「複合物」係指兩個或更多個分子的組化。在一些實施方式中,複合物包含彼此相互作用(例如,結合、接觸、黏附)的多肽和核酸分子。例如,術語「複合物」可以指RNA指導物和多肽(例如,Cas12i多肽)的組化。可替代地,術語「複合物」可以指RNA指導物、多肽、和靶序列的互補區的組化。如本文所用,術語「複合物」可以指靶向TTR的RNA指導物和Cas12i多肽的組化。
如本文所用,術語「同源臂」係指與靶核酸具有同源性的模板核酸的一部分。在一些實施方式中,模板核酸可以包含一個或兩個同源臂。在一些實施方式中,同源臂與靶核酸的對應區域具有基本同一性或完全同一性。在一些實施方式中,同源臂係單股DNA或雙股DNA。在一些實施方式中,與使用缺乏同源臂的在其他方面類似的模板核酸相比,使用包含同源臂的模板核酸導致將更高水平的序列差異摻入靶核酸中。
如本文所用,術語「左同源臂」係指所在位置導致以下的同源臂:i) 同源臂的多個核苷酸與一部分靶位點同源,該部分靶位點在切割位點與靶位點的近PAM端之間;ii) 同源臂的多個核苷酸與一部分靶核酸同源,該部分靶核酸在從切割位點起的靶位點的遠PAM端的相反側;或i) 和ii) 兩者。
如本文所用,術語「右同源臂」係指所在位置導致以下的同源臂:i) 同源臂的多個核苷酸與一部分靶位點同源,該部分靶位點在切割位點與靶位點的遠PAM端之間;ii) 同源臂的多個核苷酸與一部分靶核酸同源,該部分靶核酸在從靶位點的遠PAM端起的切割位點的相反側;或i) 和ii) 兩者。
如本文所用,術語「原型間隔子相鄰模體」或「PAM」係指與靶序列(例如,TTR靶序列)相鄰的DNA序列,包含RNA指導物(例如,靶向TTR的RNA指導物)和Cas12i多肽的複合物與該靶序列結合。在雙鏈DNA分子中,含有PAM模體的鏈稱為「PAM鏈」,並且互補鏈稱為「非PAM股」。RNA指導物與非PAM股中與本文揭露的靶序列互補的位點結合。
在一些實施方式中,PAM股係編碼(例如,正義)股。在其他實施方式中,PAM股係非編碼(例如,反義股)的。由於RNA指導物經由鹼基配對與非PAM股結合,因此非PAM股也稱為靶股,而PAM股也稱為非靶股。
如本文所用,術語「靶序列」係指與PAM模體(在PAM股上)相鄰的DNA片段。靶序列的互補區在非PAM股上。靶序列可以緊鄰PAM模體。可替代地,靶序列和PAM可以由小的序列區段(例如,最多5個核苷酸,例如最多4、3、2或1個核苷酸)分隔。靶序列可以位於PAM模體的3’端或PAM模體的5’端,這取決於識別該PAM模體的CRISPR核酸酶,這係本領域已知的。例如,針對Cas12i多肽(例如,Cas12i2多肽,如本文揭露的那些),靶序列位於PAM模體的3'端。在一些實施方式中,靶序列係TTR基因序列內的序列,包括但不限於SEQ ID NO: 228或SEQ ID NO: 258中闡述的序列。
如本文所用,術語「間隔子」或「間隔子序列」係RNA指導物中的一部分,其係靶序列(DNA序列)的RNA等同物。間隔子含有能夠經由鹼基配對在與靶序列(在PAM股中)互補的位點處與非PAM股結合的序列。這種間隔子也稱為對靶序列具有特異性。在一些情況下,除了RNA-DNA序列差異外,間隔子可以與靶序列具有至少75%的同一性(例如,至少80%、至少85%、至少90%、至少95%、至少98%、或至少99%)。在一些情況下,除了RNA-DNA序列差異外,間隔子可以與靶序列具有100%同一性。
如本文所用,術語「RNA指導物」或「RNA指導物序列」係指促進本文所述之多肽(例如,Cas12i多肽)靶向靶序列(例如,TTR基因的序列)的任何RNA分子或經修飾的RNA分子。例如,RNA指導物可為被設計成與特定的核酸序列(靶序列,如具有TTR基因的靶序列)互補的分子。RNA指導物可以包含間隔子序列和直接重複(DR)序列。在一些情況下,RNA指導物可為經修飾的RNA分子,該經修飾的RNA分子例如在包含在RNA指導物中的DNA結合序列(其結合與靶序列互補的序列)中包含一或多個去氧核糖核苷酸。在一些實例中,DNA結合序列可以含有DNA序列或DNA/RNA雜交序列。術語CRISPR RNA(crRNA)、前crRNA和成熟crRNA在本文中也用於指RNA指導物。
如本文所用,術語「互補的」係指第一多核苷酸(例如,RNA指導物的間隔子序列)與第二多核苷酸(例如,靶序列的互補序列)具有一定水平的互補性,使得該第一多核苷酸和該第二多核苷酸可以經由鹼基配對形成雙股複合物,以允許與該第一多核苷酸複合的效應子多肽作用於(例如,切割)該第二多核苷酸。在一些實施方式中,第一多核苷酸可以與第二多核苷酸基本上互補,即,與該第二多核苷酸具有至少約80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的互補性。在一些實施方式中,第一多核苷酸與第二多核苷酸完全互補,即,與該第二多核苷酸具有100%的互補性。
使用如在Karlin和Altschul Proc. Natl. Acad. Sci. USA [美國國家科學院院刊] 90:5873-77, 1993中改良的Karlin和Altschul Proc. Natl. Acad. Sci. USA [美國國家科學院院刊] 87:2264-68, 1990的演算法確定兩個核酸或兩個胺基酸序列的「同一性百分比」(又稱為序列同一性)。這種演算法被併入Altschul等人 J. Mol. Biol. [分子生物學雜誌] 215:403-10, 1990的NBLAST和XBLAST程式(版本2.0)中。BLAST核苷酸搜索可以用NBLAST程式(評分 = 100,字長為-12)進行以獲得與本揭露內容之核酸分子同源的核苷酸序列。BLAST蛋白質搜索可以用XBLAST程式(評分 = 50,字長 = 3)進行以獲得與本揭露內容之蛋白分子同源的胺基酸序列。在兩個序列之間存在空位的情況下,可以如Altschul等人, Nucleic Acids Res. [核酸研究] 25(17):3389-3402, 1997中所述利用空位BLAST。當利用BLAST和空位BLAST程式時,可以使用相應程式(例如,XBLAST和NBLAST)的默認參數。
如本文所用,術語「模板核酸」、「模板DNA」、「供體」、「供體核酸」係指包含可與Cas12i多肽和RNA指導物一起使用以修飾靶核酸(例如,TTR基因靶位點)從而使其具有模板核酸的一些或全部序列的核酸序列的核酸分子。在一些實施方式中,靶核酸序列的修飾在一或多個切割位點處或附近。在一些實施方式中,模板核酸係單股核酸。在一些實施方式中,模板核酸係雙股核酸。在一些實施方式中,使用HDR時,模板DNA指導對靶核酸的修飾。
如本文所用,術語「編輯」係指引入靶核酸中(例如,在HAO1基因內)的一或多個修飾。編輯可為一或多個取代、一或多個***、一或多個缺失、或其組合。如本文所用,術語「取代」係指相對於參考序列,不同的一或多個核苷酸對一或多個核苷酸的替代。如本文所用,術語「***」係指相對於參考序列,核酸序列中的一或多個核苷酸的增加。如本文所用,術語「缺失」係指相對於參考序列,核酸序列中的一或多個核苷酸的丟失。
在如何製作包含缺失的序列方面,沒有暗示特定的方法。例如,可以從單個核苷酸直接合成包含缺失的序列。在其他實施方式中,藉由提供參考序列然後改變該參考序列來製造缺失。核酸序列可以在生物的基因組中。核酸序列可以在細胞中。核酸序列可為DNA序列。缺失可為框移突變或非框移突變。本文所述之缺失係指最多數個千鹼基的缺失。
如本文所用,術語「上游」和「下游」係指核酸分子中單個核酸(例如,DNA)序列內的相對位置。「上游」和「下游」分別涉及發生RNA轉錄的5'至3'方向。當第一序列的3'端出現在第二序列的5'端之前時,該第一序列在該第二序列的上游。當第一序列的5'端出現在第二序列的3'端之後時,該第一序列在該第二序列的下游。在一些實施方式中,5'-NTTN-3'或5'-TTN-3'序列在本文所述之***缺失的上游,並且Cas12i誘導的***缺失在5'-NTTN-3'或5'-TTN-3'序列的下游。 I. 基因編輯系統
在一些方面,本揭露內容提供了包含靶向TTR基因的RNA指導物的基因編輯系統。這種基因編輯系統可用於編輯TTR靶基因例如以破壞TTR基因。
運甲狀腺素蛋白「TTR」係血清和腦脊液中的一種轉運蛋白,其攜帶甲狀腺激素甲狀腺素(T4)和與維生素A。TTR錯誤折疊和聚集與澱粉樣病、老年系統性類澱粉變性、家族性澱粉樣多發性神經病變、和家族性澱粉樣心肌病相關。因此,此處揭露的靶向TTR基因的基因編輯系統可用於治療需要治療的受試者的澱粉樣病。
在一些實施方式中,RNA指導物由直接重複組分和間隔子序列構成。在一些實施方式中,RNA指導物與Cas12i多肽結合。在一些實施方式中,間隔子序列對TTR靶序列具有特異性,其中該TTR靶序列與如本文所述之5'-NTTN-3'或5'-TTN-3' PAM序列相鄰。在雙股靶標的情況下,RNA指導物與靶標的第一股(即,非PAM股)結合,並且如本文所述之PAM序列存在於第二互補股(即,PAM股)中。
在一些實施方式中,本揭露內容提供了包含複合物的組成物,其中該複合物包含靶向TTR的RNA指導物。在一些實施方式中,本揭露內容包含一種複合物,該複合物包含RNA指導物和Cas12i多肽。在一些實施方式中,RNA指導物和Cas12i多肽以約1 : 1的莫耳比彼此結合。在一些實施方式中,包含RNA指導物和Cas12i多肽的複合物與TTR基因內的靶序列的互補區結合。在一些實施方式中,包含靶向TTR的RNA指導物和Cas12i多肽的複合物與TTR基因內的靶序列的互補區以約1 : 1的莫耳比結合。在一些實施方式中,複合物包含可以切割TTR靶序列和/或互補序列的酶活性,如核酸酶活性。RNA指導物、Cas12i多肽、和TTR靶序列的互補區(無論是單獨還是一起)不是天然存在的。在一些實施方式中,複合物中的RNA指導物包含本文所述之直接重複序列和/或間隔子序列。在一些實施方式中,RNA指導物的序列與SEQ ID NO: 345-362中任一個的序列具有至少90%的同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性)。在一些實施方式中,RNA指導物具有SEQ ID NO: 345-362中任一個的序列。
在一些實施方式中,本揭露內容包含組成物,該等組成物包含如本文所述之RNA指導物和/或編碼如本文所述之Cas12i多肽的RNA。在一些實施方式中,RNA指導物和編碼Cas12i多肽的RNA一起被包含在相同的組成物中。在一些實施方式中,RNA指導物和編碼Cas12i多肽的RNA被包含在分開的組成物中。在一些實施方式中,RNA指導物包含本文所述之直接重複序列和/或間隔子序列。在一些實施方式中,RNA指導物的序列與SEQ ID NO: 345-362中任一個的序列具有至少90%的同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性)。在一些實施方式中,RNA指導物具有SEQ ID NO: 345-362中任一個的序列。
在一些實施方式中,本揭露內容之組成物進一步包含模板DNA。在一些實施方式中,組成物包含Cas12i多肽、RNA指導物、和模板DNA。在一些實施方式中,模板DNA包含同源臂(例如,左同源臂和/或右同源臂)。在一些實施方式中,同源臂與靶核酸的對應區域(例如,靶核酸的靶股或非靶股)具有至少80%、85%、90%、95%、99%、或100%的同一性。在一些實施方式中,相對於包含TTR靶序列的靶核酸序列,模板DNA包含序列差異。在一些實施方式中,序列差異係多型性。在一些實施方式中,多型性係與疾病(例如,遺傳性ATTR類澱粉變性(hATTR)、家族性澱粉樣多發性神經病變(FAP)或老年系統性類澱粉變性(SSA))相關的突變。在一些實施方式中,序列差異係保護性突變。在一些實施方式中,使用模板DNA通過同源定向修復(HDR),與疾病相關的突變被糾正(例如,突變的TTR靶序列被糾正為野生型TTR序列)。在一些實施方式中,通過HDR並使用模板DNA,將保護性突變引入到突變TTR靶序列中。在一些實施方式中,使用模板DNA通過HDR糾正突變相關疾病,並將保護性突變引入到TTR靶序列中。
本文揭露的基因編輯系統的使用具有優於其他已知的核酸酶系統的那些的優點。Cas12i多肽比其他核酸酶小。例如,Cas12i2的長度為1,054個胺基酸,而化釀膿鏈球菌( S. pyogenes)Cas9(SpCas9)的長度為1,368個胺基酸,嗜熱鏈球菌( S. thermophilus)Cas9(StCas9)的長度為1,128個胺基酸,FnCpf1的長度為1,300個胺基酸,AsCpf1的長度為1,307個胺基酸,並且LbCpf1的長度為1,246個胺基酸。不需要反式激活的CRISPR RNA(tracrRNA)的Cas12i RNA指導物也比Cas9 RNA指導物小。較小的Cas12i多肽和RNA指導物大小有利於遞送。與包含SpCas9多肽的組成物相比,包含Cas12i多肽的組成物還表現出降低的脫靶活性。參見WO/2021/202800,出於本文引用的主題和目的將該文獻的相關揭露內容藉由援引併入。此外,由包含Cas12i多肽的組成物誘導的***缺失不同於由包含SpCas9多肽的組成物誘導的***缺失。例如,SpCas9多肽主要誘導長度為1個核苷酸的***和缺失。然而,Cas12i多肽誘導較大的缺失,這可有利於破壞基因(如TTR)的較大部分。
本文還提供了一種用於TTR基因的基因編輯的系統,該系統包含 (i) Cas12i多肽(例如,Cas12i2多肽)或編碼該Cas12i多肽(例如,Cas12i2多肽包含與SEQ ID NO: 222具有至少95%同一性的胺基酸序列,該胺基酸序列相對於SEQ ID NO: 222可以包含一或多個突變)的第一核酸;以及 (ii) RNA指導物或編碼該RNA指導物的第二核酸,其中該RNA指導物包含對TTR基因內(例如,該TTR基因的外顯子2、外顯子3或外顯子4內)的靶序列具有特異性的間隔子序列,該靶序列與包含5’-TTN-3’(5’-NTTN-3’)模體的原型間隔子相鄰模體(PAM)相鄰,該PAM位於該靶序列的5’。 A. RNA 指導物
在一些實施方式中,本文所述之基因編輯系統包含靶向TTR基因(例如,靶向TTR基因的外顯子2、外顯子3或外顯子4)的RNA指導物。在一些實施方式中,本文所述之基因編輯系統可以包含兩個或更多個(例如,2、3、4、5、6、7、8、9、或更多個)靶向TTR的RNA指導物。
RNA指導物可以將如本文所述之基因編輯系統中含有的Cas12i多肽引導至HAO1靶序列。兩個或更多個RNA指導物可以將兩個或更多個如本文所述之單獨的Cas12i多肽(例如,具有相同或不同序列的Cas12i多肽)引導至兩個或更多個(例如,2、3、4、5、6、7、8、9、或更多個)TTR靶序列。閱讀以下特定種類的RNA指導物之實例的熟悉該項技術者將理解,在一些實施方式中,RNA指導物具有TTR靶特異性。也就是說,在一些實施方式中,RNA指導物與一或多個TTR靶序列(例如,在細胞內)特異性結合,並且不與非靶向的序列(例如,相同細胞內的非特異性DNA或隨機序列)結合。
在一些實施方式中,RNA指導物包含間隔子序列、隨後是直接重複序列,指的是從5'至3'方向的序列。在一些實施方式中,RNA指導物包含第一直接重複序列、隨後是間隔子序列、和第二直接重複序列,指的是從5'至3'方向的序列。在一些實施方式中,這種RNA指導物的第一直接重複序列和第二直接重複序列相同。在一些實施方式中,這種RNA指導物的第一直接重複序列和第二直接重複序列不同。
在一些實施方式中,RNA指導物的間隔子序列和一或多個直接重複序列存在於相同的RNA分子內。在一些實施方式中,間隔子序列和直接重複序列彼此直接連接。在一些實施方式中,在間隔子序列和直接重複序列之間存在短連接子,例如長度為1、2、或3個核苷酸的RNA連接子。在一些實施方式中,RNA指導物的間隔子序列和一或多個直接重複序列存在於單獨的分子中,它們藉由鹼基配對相互作用彼此連接。
關於RNA指導物的示例性直接重複組分和間隔子組分的額外資訊提供如下。 (i). 直接重複序列
在一些實施方式中,RNA指導物包含直接重複序列。在一些實施方式中,RNA指導物的直接重複序列的長度介於12-100、13-75、14-50、或15-40個核苷酸之間(例如,15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、或40個核苷酸)。
在一些實施方式中,直接重複序列係表1的序列或表1的序列的一部分。直接重複序列可以包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸1至核苷酸36。直接重複序列可以包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸2至核苷酸36。直接重複序列可以包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸3至核苷酸36。直接重複序列可以包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸4至核苷酸36。直接重複序列可以包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸5至核苷酸36。直接重複序列可以包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸6至核苷酸36。直接重複序列可以包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸7至核苷酸36。直接重複序列可以包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸8至核苷酸36。直接重複序列可以包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸9至核苷酸36。直接重複序列可以包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸10至核苷酸36。直接重複序列可以包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸11至核苷酸36。直接重複序列可以包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸12至核苷酸36。直接重複序列可以包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸13至核苷酸36。直接重複序列可以包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸14至核苷酸36。直接重複序列可以包含SEQ ID NO: 9的核苷酸1至核苷酸34。直接重複序列可以包含SEQ ID NO: 9的核苷酸2至核苷酸34。直接重複序列可以包含SEQ ID NO: 9的核苷酸3至核苷酸34。直接重複序列可以包含SEQ ID NO: 9的核苷酸4至核苷酸34。直接重複序列可以包含SEQ ID NO: 9的核苷酸5至核苷酸34。直接重複序列可以包含SEQ ID NO: 9的核苷酸6至核苷酸34。直接重複序列可以包含SEQ ID NO: 9的核苷酸7至核苷酸34。直接重複序列可以包含SEQ ID NO: 9的核苷酸8至核苷酸34。直接重複序列可以包含SEQ ID NO: 9的核苷酸9至核苷酸34。直接重複序列可以包含SEQ ID NO: 9的核苷酸10至核苷酸34。直接重複序列可以包含SEQ ID NO: 9的核苷酸11至核苷酸34。直接重複序列可以包含SEQ ID NO: 9的核苷酸12至核苷酸34。在一些實施方式中,直接重複序列在SEQ ID NO: 10中闡述。在一些實施方式中,直接重複序列包含在SEQ ID NO: 10中闡述的序列的一部分。
在一些實施方式中,直接重複序列與表1的序列或表1的序列的一部分具有至少90%的同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性)。直接重複序列可以與包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸1至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸2至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸3至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸4至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸5至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸6至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸7至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸8至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸9至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸10至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸11至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸12至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸13至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 1、2、3、4、5、6、7、或8中任一個的核苷酸14至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 9的核苷酸1至核苷酸34的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 9的核苷酸2至核苷酸34的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 9的核苷酸3至核苷酸34的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 9的核苷酸4至核苷酸34的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 9的核苷酸5至核苷酸34的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 9的核苷酸6至核苷酸34的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 9的核苷酸7至核苷酸34的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 9的核苷酸8至核苷酸34的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 9的核苷酸9至核苷酸34的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 9的核苷酸10至核苷酸34的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 9的核苷酸11至核苷酸34的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 9的核苷酸12至核苷酸34的序列具有至少90%的同一性。在一些實施方式中,直接重複序列與SEQ ID NO: 10具有至少90%的同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性)。在一些實施方式中,直接重複序列與在SEQ ID NO: 10中闡述的序列的一部分具有至少90%的同一性。
在一些實施方式中,包含本文所述之Cas12i2多肽和RNA指導物的組成物能夠將***缺失引入到TTR靶序列中。參見例如,實例1,其中在藉由RNP將RNA指導物和Cas12i2多肽遞送至HEK293T細胞後,在六個TTR靶序列處測量到***缺失;實例2,其中經由HDR和使用包含RNA指導物和Cas12i2多肽的RNP在HEK293T細胞的TTR靶位點內引入了取代;實例3,其中使用引入到HEK293細胞中的Cas12i2藉由RNP對TTR基因進行了基因組編輯;實例4,其中使用引入到HepG2細胞中的Cas12i2藉由RNP對TTR基因進行了基因組編輯;以及實例5,其中使用引入到原代肝細胞中的Cas12i2藉由RNP對TTR基因進行了基因組編輯。
在一些實施方式中,直接重複序列與SEQ ID NO: 1-10(參見表1)中任一個的反向互補序列具有至少90%的同一性。在一些實施方式中,直接重複序列係SEQ ID NO: 1-10中任一個的反向互補序列。 [ 1] . Cas12i2 直接重複序列
序列識別字 直接重複序列
SEQ ID NO: 1 GUUGCAAAACCCAAGAAAUCCGUCUUUCAUUGACGG
SEQ ID NO: 2 AAUAGCGGCCCUAAGAAAUCCGUCUUUCAUUGACGG
SEQ ID NO: 3 AUUGGAACUGGCGAGAAAUCCGUCUUUCAUUGACGG
SEQ ID NO: 4 CCAGCAACACCUAAGAAAUCCGUCUUUCAUUGACGG
SEQ ID NO: 5 CGGCGCUCGAAUAGGAAAUCCGUCUUUCAUUGACGG
SEQ ID NO: 6 GUGGCAACACCUAAGAAAUCCGUCUUUCAUUGACGG
SEQ ID NO: 7 GUUGCAACACCUAAGAAAUCCGUCUUUCAUUGACGG
SEQ ID NO: 8 GUUGCAAUGCCUAAGAAAUCCGUCUUUCAUUGACGG
SEQ ID NO: 9 GCAACACCUAAGAAAUCCGUCUUUCAUUGACGGG
SEQ ID NO: 10 AGAAAUCCGUCUUUCAUUGACGG
在一些實施方式中,直接重複序列係表2的序列或表2的序列的一部分。直接重複序列可以包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸1至核苷酸36。直接重複序列可以包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸2至核苷酸36。直接重複序列可以包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸3至核苷酸36。直接重複序列可以包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸4至核苷酸36。直接重複序列可以包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸5至核苷酸36。直接重複序列可以包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸6至核苷酸36。直接重複序列可以包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸7至核苷酸36。直接重複序列可以包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸8至核苷酸36。直接重複序列可以包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸9至核苷酸36。直接重複序列可以包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸10至核苷酸36。直接重複序列可以包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸11至核苷酸36。直接重複序列可以包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸12至核苷酸36。直接重複序列可以包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸13至核苷酸36。直接重複序列可以包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸14至核苷酸36。
在一些實施方式中,直接重複序列與表2的序列或表2的序列的一部分具有至少95%的同一性(例如,至少95%、96%、97%、98%、或99%的同一性)。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸1至核苷酸36的序列具有至少95%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸2至核苷酸36的序列具有至少95%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸3至核苷酸36的序列具有至少95%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸4至核苷酸36的序列具有至少95%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸5至核苷酸36的序列具有至少95%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸6至核苷酸36的序列具有至少95%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸7至核苷酸36的序列具有至少95%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸8至核苷酸36的序列具有至少95%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸9至核苷酸36的序列具有至少95%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸10至核苷酸36的序列具有至少95%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸11至核苷酸36的序列具有至少95%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸12至核苷酸36的序列具有至少95%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸13至核苷酸36的序列具有至少95%的同一性。
在一些實施方式中,直接重複序列與表2的序列或表2的序列的一部分具有至少90%的同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性)。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸1至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸2至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸3至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸4至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸5至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸6至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸7至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸8至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸9至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸10至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸11至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸12至核苷酸36的序列具有至少90%的同一性。直接重複序列可以與包含SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的核苷酸13至核苷酸36的序列具有至少90%的同一性。
在一些實施方式中,直接重複序列與SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的反向互補序列具有至少90%的同一性。在一些實施方式中,直接重複序列與SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的反向互補序列具有至少95%的同一性。在一些實施方式中,直接重複序列係SEQ ID NO: 233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、或250中任一個的反向互補序列。
在一些實施方式中,直接重複序列與SEQ ID NO: 251或SEQ ID NO: 251的一部分具有至少90%的同一性。在一些實施方式中,直接重複序列與SEQ ID NO: 251或SEQ ID NO: 251的一部分具有至少95%的同一性。在一些實施方式中,直接重複序列與SEQ ID NO: 251或SEQ ID NO: 251的一部分具有100%的同一性。 [ 2] . Cas12i4 直接重複序列
序列識別字 直接重複序列
SEQ ID NO: 233 UCUCAACGAUAGUCAGACAUGUGUCCUCAGUGACAC
SEQ ID NO: 234 UUUUAACAACACUCAGGCAUGUGUCCACAGUGACAC
SEQ ID NO: 235 UUGAACGGAUACUCAGACAUGUGUUUCCAGUGACAC
SEQ ID NO: 236 UGCCCUCAAUAGUCAGAUGUGUGUCCACAGUGACAC
SEQ ID NO: 237 UCUCAAUGAUACUUAGAUACGUGUCCUCAGUGACAC
SEQ ID NO: 238 UCUCAAUGAUACUCAGACAUGUGUCCCCAGUGACAC
SEQ ID NO: 239 UCUCAAUGAUACUAAGACAUGUGUCCUCAGUGACAC
SEQ ID NO: 240 UCUCAACUAUACUCAGACAUGUGUCCUCAGUGACAC
SEQ ID NO: 241 UCUCAACGAUACUCAGACAUGUGUCCUCAGUGACAC
SEQ ID NO: 242 UCUCAACGAUACUAAGAUAUGUGUCCUCAGCGACAC
SEQ ID NO: 243 UCUCAACGAUACUAAGAUAUGUGUCCCCAGUGACAC
SEQ ID NO: 244 UCUCAACGAUACUAAGAUAUGUGUCCACAGUGACAC
SEQ ID NO: 245 UCUCAACAAUACUCAGACAUGUGUCCCCAGUGACAC
SEQ ID NO: 246 UCUCAACAAUACUAAGGCAUGUGUCCCCAGUGACCC
SEQ ID NO: 247 UCUCAAAGAUACUCAGACACGUGUCCCCAGUGACAC
SEQ ID NO: 248 UCUCAAAAAUACUCAGACAUGUGUCCUCAGUGACAC
SEQ ID NO: 249 GCGAAACAACAGUCAGACAUGUGUCCCCAGUGACAC
SEQ ID NO: 250 CCUCAACGAUAUUAAGACAUGUGUCCGCAGUGACAC
SEQ ID NO: 251 AGACAUGUGUCCUCAGUGACAC
在一些實施方式中,直接重複序列係表3的序列或表3的序列的一部分。在一些實施方式中,直接重複序列與表3的序列或表3的序列的一部分具有至少95%的同一性(例如,至少95%、96%、97%、98%、或99%的同一性)。在一些實施方式中,直接重複序列與表3的序列或表3的序列的一部分具有至少90%的同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性)。在一些實施方式中,直接重複序列與SEQ ID NO: 259-261中任一個的反向互補序列具有至少90%的同一性。在一些實施方式中,直接重複序列與SEQ ID NO: 259-261中任一個的反向互補序列具有至少95%的同一性。在一些實施方式中,直接重複序列係SEQ ID NO: 259-261中任一個的反向互補序列。 [ 3] . Cas12i1 直接重複序列
序列識別字 直接重複序列
SEQ ID NO: 259 GUUGGAAUGACUAAUUUUUGUGCCCACCGUUGGCAC
SEQ ID NO: 260 AAUUUUUGUGCCCAUCGUUGGCAC
SEQ ID NO: 261 AUUUUUGUGCCCAUCGUUGGCAC
在一些實施方式中,直接重複序列係表4的序列或表4的序列的一部分。在一些實施方式中,直接重複序列與表4的序列或表4的序列的一部分具有至少95%的同一性(例如,至少95%、96%、97%、98%、或99%的同一性)。在一些實施方式中,直接重複序列與表4的序列或表4的序列的一部分具有至少90%的同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性)。在一些實施方式中,直接重複序列與SEQ ID NO: 262-264中任一個的反向互補序列具有至少90%的同一性。在一些實施方式中,直接重複序列與SEQ ID NO: 262-264中任一個的反向互補序列具有至少95%的同一性。在一些實施方式中,直接重複序列係SEQ ID NO: 262-264中任一個的反向互補序列。[ 4] . Cas12i3 直接重複序列。
序列識別字 直接重複序列
SEQ ID NO: 262 CUAGCAAUGACCUAAUAGUGUGUCCUUAGUUGACAU
SEQ ID NO: 263 CCUACAAUACCUAAGAAAUCCGUCCUAAGUUGACGG
SEQ ID NO: 264 AUAGUGUGUCCUUAGUUGACAU
在一些實施方式中,本文所述之直接重複序列包含尿嘧啶(U)。在一些實施方式中,本文所述之直接重複序列包含胸腺嘧啶(T)。在一些實施方式中,根據表1-4的直接重複序列包含這樣的序列,該序列在表1-4中指示為尿嘧啶的一或多個位置中包含胸腺嘧啶。 (ii).  間隔子序列
在一些實施方式中,RNA指導物包含靶向DNA的間隔子序列。在一些實施方式中,RNA指導物的間隔子序列的長度介於12-100、13-75、14-50、或15-30個核苷酸之間(例如,15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、或30個核苷酸)並且與非PAM股序列互補。在一些實施方式中,間隔子序列被設計為與例如基因組基因座的特定DNA股互補。
在一些實施方式中,RNA指導物間隔子序列與靶序列的互補股基本上相同。在一些實施方式中,RNA指導物包含與參考核酸序列(例如靶序列)的互補股具有至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約91%、至少約92%、至少約93%、至少約94%、至少約95%、至少約96%、至少約97%、至少約98%、至少約99%、或至少約99.5%序列同一性的序列。可以藉由檢查兩個最佳比對的核酸序列或藉由使用軟體程式或演算法(例如,BLAST、ALIGN、CLUSTAL)使用標準參數人工確定兩個此類核酸之間的同一性百分比。
在一些實施方式中,RNA指導物包含間隔子序列,該間隔子序列的長度介於12-100、13-75、14-50、或15-30個核苷酸之間(例如,15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、或30個核苷酸),並且該間隔子序列與非PAM股上與靶序列互補的區域具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%的互補性。在一些實施方式中,RNA指導物包含與靶DNA序列具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互補性的序列。在一些實施方式中,RNA指導物包含與靶基因組序列具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互補性的序列。在一些實施方式中,RNA指導物包含長度為最多50的序列(例如,RNA序列),並且該序列與非PAM股上與靶序列互補的區域具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%的互補性。在一些實施方式中,RNA指導物包含與靶DNA序列具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互補性的序列。在一些實施方式中,RNA指導物包含與靶基因組序列具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互補性的序列。
在一些實施方式中,間隔子序列係表5的序列或表5的序列的一部分。應當理解,SEQ ID NO: 116-220的指示應被視為等同於SEQ ID NO: 116-220的列表,其中每個介於其中的數字都存在於清單中,該等數字即116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、和220。
間隔子序列可以包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸16。間隔子序列可以包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸17。間隔子序列可以包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸18。間隔子序列可以包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸19。間隔子序列可以包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸20。間隔子序列可以包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸21。間隔子序列可以包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸22。間隔子序列可以包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸23。間隔子序列可以包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸24。間隔子序列可以包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸25。間隔子序列可以包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸26。間隔子序列可以包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸27。間隔子序列可以包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸28。間隔子序列可以包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸29。間隔子序列可以包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸30。
在一些實施方式中,間隔子序列與表5的序列或表5的序列的一部分具有至少90%的同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性)。間隔子序列可以與包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸16的序列具有至少90%的同一性。間隔子序列可以與包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸17的序列具有至少90%的同一性。間隔子序列可以與包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸18的序列具有至少90%的同一性。間隔子序列可以與包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸19的序列具有至少90%的同一性。間隔子序列可以與包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸20的序列具有至少90%的同一性。間隔子序列可以與包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸21的序列具有至少90%的同一性。間隔子序列可以與包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸22的序列具有至少90%的同一性。間隔子序列可以與包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸23的序列具有至少90%的同一性。間隔子序列可以與包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸24的序列具有至少90%的同一性。間隔子序列可以與包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸25的序列具有至少90%的同一性。間隔子序列可以與包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸26的序列具有至少90%的同一性。間隔子序列可以與包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸27的序列具有至少90%的同一性。間隔子序列可以與包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸28的序列具有至少90%的同一性。間隔子序列可以與包含SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸29的序列具有至少90%的同一性。間隔子序列可以與包含116-220中任一個的核苷酸1至核苷酸30的序列具有至少90%的同一性。 [ 5] . 靶序列和間隔子序列
TTR PAM* SEQ ID NO 靶序列 SEQ ID NO 間隔子序列
TTR_外顯子1 + ATTC 11 TTGGCAGGATGGCTTCTCATCGTCTGCTCC 116 UUGGCAGGAUGGCUUCUCAUCGUCUGCUCC
TTR_外顯子1 + CTTC 12 TCATCGTCTGCTCCTCCTCTGCCTTGCTGG 117 UCAUCGUCUGCUCCUCCUCUGCCUUGCUGG
TTR_外顯子1 + CTTG 13 CTGGACTGGTATTTGTGTCTGAGGCTGGCC 118 CUGGACUGGUAUUUGUGUCUGAGGCUGGCC
TTR_外顯子1 + ATTT 14 GTGTCTGAGGCTGGCCCTACGGTGAGTGTT 119 GUGUCUGAGGCUGGCCCUACGGUGAGUGUU
TTR_外顯子1 + TTTG 15 TGTCTGAGGCTGGCCCTACGGTGAGTGTTT 120 UGUCUGAGGCUGGCCCUACGGUGAGUGUUU
TTR_外顯子1 + GTTT 16 CTGTGACATCCCATTCCTACATTTAAGATT 121 CUGUGACAUCCCAUUCCUACAUUUAAGAUU
TTR_外顯子1 + TTTC 17 TGTGACATCCCATTCCTACATTTAAGATTC 122 UGUGACAUCCCAUUCCUACAUUUAAGAUUC
TTR_外顯子1 - ATTT 18 AGCGTGAATCTTAAATGTAGGAATGGGATG 123 AGCGUGAAUCUUAAAUGUAGGAAUGGGAUG
TTR_外顯子1 - TTTA 19 GCGTGAATCTTAAATGTAGGAATGGGATGT 124 GCGUGAAUCUUAAAUGUAGGAAUGGGAUGU
TTR_外顯子1 - CTTA 20 AATGTAGGAATGGGATGTCACAGAAACACT 125 AAUGUAGGAAUGGGAUGUCACAGAAACACU
TTR_外顯子1 + CTTG 21 GCAGGATGGCTTCTCATCGTCTGCTCCTCC 126 GCAGGAUGGCUUCUCAUCGUCUGCUCCUCC
TTR_外顯子1 + ATTC 22 CTACATTTAAGATTCACGCTAAAT 127 CUACAUUUAAGAUUCACGCUAAAU
TTR_外顯子2 - CTTG 23 GATTCACCGGTGCCCTGGGTGTAGAGAAGA 128 GAUUCACCGGUGCCCUGGGUGUAGAGAAGA
TTR_外顯子2 + ATTT 24 TGTTAACTTCTCACGTGTCTTCTCTACACC 129 UGUUAACUUCUCACGUGUCUUCUCUACACC
TTR_外顯子2 + TTTT 25 GTTAACTTCTCACGTGTCTTCTCTACACCC 130 GUUAACUUCUCACGUGUCUUCUCUACACCC
TTR_外顯子2 + TTTG 26 TTAACTTCTCACGTGTCTTCTCTACACCCA 131 UUAACUUCUCACGUGUCUUCUCUACACCCA
TTR_外顯子2 + CTTC 27 TCACGTGTCTTCTCTACACCCAGGGCACCG 132 UCACGUGUCUUCUCUACACCCAGGGCACCG
TTR_外顯子2 - ATTC 28 ACCGGTGCCCTGGGTGTAGAGAAGACACGT 133 ACCGGUGCCCUGGGUGUAGAGAAGACACGU
TTR_外顯子2 + GTTC 29 TAGATGCTGTCCGAGGCAGTCCTGCCATCA 134 UAGAUGCUGUCCGAGGCAGUCCUGCCAUCA
TTR_外顯子2 - TTTG 30 ACCATCAGAGGACACTTGGATTCACCGGTG 135 ACCAUCAGAGGACACUUGGAUUCACCGGUG
TTR_外顯子2 - CTTT 31 GACCATCAGAGGACACTTGGATTCACCGGT 136 GACCAUCAGAGGACACUUGGAUUCACCGGU
TTR_外顯子2 - ATTG 32 ATGGCAGGACTGCCTCGGACAGCATCTAGA 137 AUGGCAGGACUGCCUCGGACAGCAUCUAGA
TTR_外顯子2 - TTTC 33 TGAACACATGCACGGCCACATTGATGGCAG 138 UGAACACAUGCACGGCCACAUUGAUGGCAG
TTR_外顯子2 - CTTT 34 CTGAACACATGCACGGCCACATTGATGGCA 139 CUGAACACAUGCACGGCCACAUUGAUGGCA
TTR_外顯子2 - CTTA 35 CCCAGAGGCAAATGGCTCCCAGGTGTCATC 140 CCCAGAGGCAAAUGGCUCCCAGGUGUCAUC
TTR_外顯子2 - TTTG 36 GCAACTTACCCAGAGGCAAATGGCTCCCAG 141 GCAACUUACCCAGAGGCAAAUGGCUCCCAG
TTR_外顯子2 + CTTC 37 TCTACACCCAGGGCACCGGTGAATCCAAGT 142 UCUACACCCAGGGCACCGGUGAAUCCAAGU
TTR_外顯子2 - CTTT 38 GGCAACTTACCCAGAGGCAAATGGCTCCCA 143 GGCAACUUACCCAGAGGCAAAUGGCUCCCA
TTR_外顯子2 + GTTG 39 CCAAAGAACCCTCCCACAGGACTTGGTTTT 144 CCAAAGAACCCUCCCACAGGACUUGGUUUU
TTR_外顯子2 + TTTG 40 CCTCTGGGTAAGTTGCCAAAGAACCCTCCC 145 CCUCUGGGUAAGUUGCCAAAGAACCCUCCC
TTR_外顯子2 + ATTT 41 GCCTCTGGGTAAGTTGCCAAAGAACCCTCC 146 GCCUCUGGGUAAGUUGCCAAAGAACCCUCC
TTR_外顯子2 + GTTC 42 AGAAAGGCTGCTGATGACACCTGGGAGCCA 147 AGAAAGGCUGCUGAUGACACCUGGGAGCCA
TTR_外顯子2 - GTTC 43 TTTGGCAACTTACCCAGAGGCAAATGGCTC 148 UUUGGCAACUUACCCAGAGGCAAAUGGCUC
TTR_外顯子2 + GTTA 44 ACTTCTCACGTGTCTTCTCTACACCCAGGG 149 ACUUCUCACGUGUCUUCUCUACACCCAGGG
TTR_外顯子2 - GTTA 45 ACAAAATTGATCAGAGTGAA 150 ACAAAAUUGAUCAGAGUGAA
TTR_外顯子3 + CTTG 46 GCATCTCCCCATTCCATGAGCATGCAGAGG 151 GCAUCUCCCCAUUCCAUGAGCAUGCAGAGG
TTR_外顯子3 + CTTA 47 CTGGAAGGCACTTGGCATCTCCCCATTCCA 152 CUGGAAGGCACUUGGCAUCUCCCCAUUCCA
TTR_外顯子3 + TTTG 48 TAGAAGGGATATACAAAGTGGAAATAGACA 153 UAGAAGGGAUAUACAAAGUGGAAAUAGACA
TTR_外顯子3 - CTTC 49 TACAAATTCCTCCTCAGTTGTGAGCCCATG 154 UACAAAUUCCUCCUCAGUUGUGAGCCCAUG
TTR_外顯子3 + CTTC 50 GAGGGTTGTTTTGGTTTTGGTTTTTGCTTT 155 GAGGGUUGUUUUGGUUUUGGUUUUUGCUUU
TTR_外顯子3 - CTTC 51 CAGTAAGATTTGGTGTCTATTTCCACTTTG 156 CAGUAAGAUUUGGUGUCUAUUUCCACUUUG
TTR_外顯子3 - ATTT 52 GGTGTCTATTTCCACTTTGTATATCCCTTC 157 GGUGUCUAUUUCCACUUUGUAUAUCCCUUC
TTR_外顯子3 - TTTG 53 GTGTCTATTTCCACTTTGTATATCCCTTCT 158 GUGUCUAUUUCCACUUUGUAUAUCCCUUCU
TTR_外顯子3 - ATTT 54 CCACTTTGTATATCCCTTCTACAAATTCCT 159 CCACUUUGUAUAUCCCUUCUACAAAUUCCU
TTR_外顯子3 - TTTC 55 CACTTTGTATATCCCTTCTACAAATTCCTC 160 CACUUUGUAUAUCCCUUCUACAAAUUCCUC
TTR_外顯子3 - CTTT 56 GTATATCCCTTCTACAAATTCCTCCTCAGT 161 GUAUAUCCCUUCUACAAAUUCCUCCUCAGU
TTR_外顯子3 - TTTG 57 TATATCCCTTCTACAAATTCCTCCTCAGTT 162 UAUAUCCCUUCUACAAAUUCCUCCUCAGUU
TTR_外顯子3 + ATTT 58 GTAGAAGGGATATACAAAGTGGAAATAGAC 163 GUAGAAGGGAUAUACAAAGUGGAAAUAGAC
TTR_外顯子3 - ATTC 59 CTCCTCAGTTGTGAGCCCATGCAGCTCTCC 164 CUCCUCAGUUGUGAGCCCAUGCAGCUCUCC
TTR_外顯子3 - GTTG 60 TGAGCCCATGCAGCTCTCCAGACTCACTGG 165 UGAGCCCAUGCAGCUCUCCAGACUCACUGG
TTR_外顯子3 - GTTT 61 TCCTATAAGGTGTGAAAGTCTGGATTAAGT 166 UCCUAUAAGGUGUGAAAGUCUGGAUUAAGU
TTR_外顯子3 - TTTT 62 CCTATAAGGTGTGAAAGTCTGGATTAAGTT 167 CCUAUAAGGUGUGAAAGUCUGGAUUAAGUU
TTR_外顯子3 - TTTC 63 CTATAAGGTGTGAAAGTCTGGATTAAGTTA 168 CUAUAAGGUGUGAAAGUCUGGAUUAAGUUA
TTR_外顯子3 + ATTC 64 CATGAGCATGCAGAGGTGAGTATACAGACC 169 CAUGAGCAUGCAGAGGUGAGUAUACAGACC
TTR_外顯子3 + CTTA 65 TAGGAAAACCAGTGAGTCTGGAGAGCTGCA 170 UAGGAAAACCAGUGAGUCUGGAGAGCUGCA
TTR_外顯子3 + ATTT 66 GTTTCCTCCATGCGTAACTTAATCCAGACT 171 GUUUCCUCCAUGCGUAACUUAAUCCAGACU
TTR_外顯子3 + CTTT 67 CACACCTTATAGGAAAACCAGTGAGTCTGG 172 CACACCUUAUAGGAAAACCAGUGAGUCUGG
TTR_外顯子3 + CTTA 68 ATCCAGACTTTCACACCTTATAGGAAAACC 173 AUCCAGACUUUCACACCUUAUAGGAAAACC
TTR_外顯子3 + TTTC 69 CTCCATGCGTAACTTAATCCAGACTTTCAC 174 CUCCAUGCGUAACUUAAUCCAGACUUUCAC
TTR_外顯子3 + GTTT 70 CCTCCATGCGTAACTTAATCCAGACTTTCA 175 CCUCCAUGCGUAACUUAAUCCAGACUUUCA
TTR_外顯子3 + TTTG 71 TTTCCTCCATGCGTAACTTAATCCAGACTT 176 UUUCCUCCAUGCGUAACUUAAUCCAGACUU
TTR_外顯子3 + TTTC 72 ACACCTTATAGGAAAACCAGTGAGTCTGGA 177 ACACCUUAUAGGAAAACCAGUGAGUCUGGA
TTR_外顯子3 + GTTG 73 TTTTGGTTTTGGTTTTTGCTTTTG 178 UUUUGGUUUUGGUUUUUGCUUUUG
TTR_外顯子3 + GTTT 74 TGGTTTTGGTTTTTGCTTTTG 179 UGGUUUUGGUUUUUGCUUUUG
TTR_外顯子3 + TTTT 75 GGTTTTGGTTTTTGCTTTTG 180 GGUUUUGGUUUUUGCUUUUG
TTR_外顯子3 - ATTA 76 AGTTACGCATGGAGGAAACAAATGG 181 AGUUACGCAUGGAGGAAACAAAUGG
TTR_外顯子3 - GTTA 77 CGCATGGAGGAAACAAATGG 182 CGCAUGGAGGAAACAAAUGG
TTR_外顯子4 + TTTA 78 CTAAAGCAGTGTTTTCACCTCATATGCTAT 183 CUAAAGCAGUGUUUUCACCUCAUAUGCUAU
TTR_外顯子4 + TTTT 79 ACTAAAGCAGTGTTTTCACCTCATATGCTA 184 ACUAAAGCAGUGUUUUCACCUCAUAUGCUA
TTR_外顯子4 + TTTT 80 TACTAAAGCAGTGTTTTCACCTCATATGCT 185 UACUAAAGCAGUGUUUUCACCUCAUAUGCU
TTR_外顯子4 + ATTT 81 TTACTAAAGCAGTGTTTTCACCTCATATGC 186 UUACUAAAGCAGUGUUUUCACCUCAUAUGC
TTR_外顯子4 + ATTC 82 CATTTTTACTAAAGCAGTGTTTTCACCTCA 187 CAUUUUUACUAAAGCAGUGUUUUCACCUCA
TTR_外顯子4 + TTTC 83 ATGTAACCAAGAGTATTCCATTTTTACTAA 188 AUGUAACCAAGAGUAUUCCAUUUUUACUAA
TTR_外顯子4 + ATTT 84 CATGTAACCAAGAGTATTCCATTTTTACTA 189 CAUGUAACCAAGAGUAUUCCAUUUUUACUA
TTR_外顯子4 + ATTC 85 CACCACGGCTGTCGTCACCAATCCCAAGGA 190 CACCACGGCUGUCGUCACCAAUCCCAAGGA
TTR_外顯子4 + GTTT 86 TCACCTCATATGCTATGTTAGAAGTCCAGG 191 UCACCUCAUAUGCUAUGUUAGAAGUCCAGG
TTR_外顯子4 + ATTG 87 CCGCCCTGCTGAGCCCCTACTCCTATTCCA 192 CCGCCCUGCUGAGCCCCUACUCCUAUUCCA
TTR_外顯子4 + ATTC 88 ACAGCCAACGACTCCGGCCCCCGCCGCTAC 193 ACAGCCAACGACUCCGGCCCCCGCCGCUAC
TTR_外顯子4 + CTTC 89 TCTCATAGGTGGTATTCACAGCCAACGACT 194 UCUCAUAGGUGGUAUUCACAGCCAACGACU
TTR_外顯子4 + TTTC 90 GGGCTCTGGTGGAAATGGATCTGTCTGTCT 195 GGGCUCUGGUGGAAAUGGAUCUGUCUGUCU
TTR_外顯子4 + TTTT 91 CGGGCTCTGGTGGAAATGGATCTGTCTGTC 196 CGGGCUCUGGUGGAAAUGGAUCUGUCUGUC
TTR_外顯子4 + TTTT 92 TCGGGCTCTGGTGGAAATGGATCTGTCTGT 197 UCGGGCUCUGGUGGAAAUGGAUCUGUCUGU
TTR_外顯子4 + CTTC 93 TCCTCCAGTGGACCTGAAGGACGAGGGATG 198 UCCUCCAGUGGACCUGAAGGACGAGGGAUG
TTR_外顯子4 + TTTT 94 CACCTCATATGCTATGTTAGAAGTCCAGGC 199 CACCUCAUAUGCUAUGUUAGAAGUCCAGGC
TTR_外顯子4 - CTTT 95 CACAGGAATGTTTTATTGTCTCTGCCTGGA 200 CACAGGAAUGUUUUAUUGUCUCUGCCUGGA
TTR_外顯子4 + GTTA 96 GAAGTCCAGGCAGAGACAATAAAACATTCC 201 GAAGUCCAGGCAGAGACAAUAAAACAUUCC
TTR_外顯子4 - GTTG 97 GCTGTGAATACCACCTATGAGAGAAGACAG 202 GCUGUGAAUACCACCUAUGAGAGAAGACAG
TTR_外顯子4 - ATTG 98 GTGACGACAGCCGTGGTGGAATAGGAGTAG 203 GUGACGACAGCCGUGGUGGAAUAGGAGUAG
TTR_外顯子4 - CTTG 99 GGATTGGTGACGACAGCCGTGGTGGAATAG 204 GGAUUGGUGACGACAGCCGUGGUGGAAUAG
TTR_外顯子4 - ATTC 100 CTTGGGATTGGTGACGACAGCCGTGGTGGA 205 CUUGGGAUUGGUGACGACAGCCGUGGUGGA
TTR_外顯子4 - CTTC 101 AGGTCCACTGGAGGAGAAGTCCCTCATTCC 206 AGGUCCACUGGAGGAGAAGUCCCUCAUUCC
TTR_外顯子4 - GTTA 102 CATGAAATCCCATCCCTCGTCCTTCAGGTC 207 CAUGAAAUCCCAUCCCUCGUCCUUCAGGUC
TTR_外顯子4 - CTTG 103 GTTACATGAAATCCCATCCCTCGTCCTTCA 208 GUUACAUGAAAUCCCAUCCCUCGUCCUUCA
TTR_外顯子4 - TTTA 104 GTAAAAATGGAATACTCTTGGTTACATGAA 209 GUAAAAAUGGAAUACUCUUGGUUACAUGAA
TTR_外顯子4 - CTTT 105 AGTAAAAATGGAATACTCTTGGTTACATGA 210 AGUAAAAAUGGAAUACUCUUGGUUACAUGA
TTR_外顯子4 - CTTC 106 TAACATAGCATATGAGGTGAAAACACTGCT 211 UAACAUAGCAUAUGAGGUGAAAACACUGCU
TTR_外顯子4 - ATTG 107 TCTCTGCCTGGACTTCTAACATAGCATATG 212 UCUCUGCCUGGACUUCUAACAUAGCAUAUG
TTR_外顯子4 - TTTA 108 TTGTCTCTGCCTGGACTTCTAACATAGCAT 213 UUGUCUCUGCCUGGACUUCUAACAUAGCAU
TTR_外顯子4 - TTTT 109 ATTGTCTCTGCCTGGACTTCTAACATAGCA 214 AUUGUCUCUGCCUGGACUUCUAACAUAGCA
TTR_外顯子4 - GTTT 110 TATTGTCTCTGCCTGGACTTCTAACATAGC 215 UAUUGUCUCUGCCUGGACUUCUAACAUAGC
TTR_外顯子4 - TTTC 111 ACAGGAATGTTTTATTGTCTCTGCCTGGAC 216 ACAGGAAUGUUUUAUUGUCUCUGCCUGGAC
TTR_外顯子4 + TTTC 112 ACCTCATATGCTATGTTAGAAGTCCAGGCA 217 ACCUCAUAUGCUAUGUUAGAAGUCCAGGCA
TTR_外顯子4 + GTTT 113 TTCGGGCTCTGGTGGAAATGGATCTGTCTG 218 UUCGGGCUCUGGUGGAAAUGGAUCUGUCUG
TTR_外顯子4 - ATTT 114 CCACCAGAGCCCGAAAAACGTG 219 CCACCAGAGCCCGAAAAACGUG
TTR_外顯子4 - TTTC 115 CACCAGAGCCCGAAAAACGTG 220 CACCAGAGCCCGAAAAACGUG
* 三個3'核苷酸代表5'-TTN-3'模體。
本揭露內容包括與本文本揭露內容一致的、以上列出的直接重複序列和間隔子序列的所有組合。
在一些實施方式中,本文所述之間隔子序列包含尿嘧啶(U)。在一些實施方式中,本文所述之間隔子序列包含胸腺嘧啶(T)。在一些實施方式中,根據表5的間隔子序列包含這樣的序列,該序列在表5中指示為尿嘧啶的一或多個(例如,所有)位置中包含胸腺嘧啶。
本揭露內容包括包含本文所述之直接重複序列和間隔子(例如,如在以上表5中闡述)的任何和所有組合的RNA指導物。在一些實施方式中,RNA指導物與SEQ ID NO: 273-278或345-362中的任一個具有至少90%的同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性)。在一些實施方式中,RNA指導物與SEQ ID NO: 273-278和345-362中的任一個具有至少95%的同一性(例如,至少95%、96%、97%、98%、或99%的同一性)。在一些實施方式中,RNA指導物具有SEQ ID NO: 273-278和345-362中任一個闡述的序列。 B. 模板 DNA
如本文揭露的基因編輯系統可以進一步包含模板DNA,可以將該模板DNA的一部分經由例如同源重組摻入TTR基因內的基因位點中,引起在TTR基因位點處如所希望的基因編輯,例如,靶TTR基因中的突變的糾正或保護性突變的引入。在一些情況下,待摻入TTR基因的模板DNA的部分可以經密碼子優化。
在一些實施方式中,模板DNA係單股核酸。在一些實施方式中,模板DNA係雙股核酸。在一些實施方式中,模板DNA係DNA、RNA或DNA/RNA雜交分子。在一些實施方式中,模板DNA係單股寡DNA核苷酸(ssODN)模板DNA或包含ssODN。在一些實施方式中,模板DNA係雙股寡DNA核苷酸(dsODN)模板DNA或包含dsODN。在一些實施方式中,模板DNA係線性的。在一些實施方式中,模板DNA係環狀的(例如,質體)。在一些實施方式中,模板DNA係外源核酸分子,例如,對於靶細胞係外源的。在一些實施方式中,模板DNA係染色分體(例如,姊妹染色分體)。在一些實施方式中,模板DNA由病毒遞送。
在一些實施方式中,模板DNA和TTR靶核酸的序列不相同。在一些實施方式中,模板DNA包含一或多個與靶核酸異源的(例如,非同源的)核苷酸。在一些實施方式中,模板DNA包含一或多個(例如,相對於靶核酸的一個、兩個、三個、四個、五個或更多個序列差異)。在一些實施方式中,模板DNA相對於靶核酸包含***、缺失、多型性、倒置、或重排。***可以包含限制性位點或可選擇標記。在一些實施方式中,使用模板DNA藉由HDR修復靶核酸中的斷裂(例如,由Cas12i多肽誘導的斷裂)。照此,模板DNA的使用可以藉由HDR在靶核酸中產生***、缺失或取代。在一些實施方式中,***可以包含基因(例如,野生型基因)、或其一部分。在一些實施方式中,***可以包含如與靶核酸(例如,細胞的靶基因組)相比的基因或其一部分的缺失。
當然應當理解,將來自模板DNA的序列差異摻入到靶核酸中不要求將來自模板DNA的一或多個核苷酸物理***到靶核酸中。相反,作為實例,模板DNA可以用作DNA合成的模板,使得將模板DNA的資訊內容摻入到靶核酸中,而不將模板DNA的核苷酸物理摻入到靶核酸中。例如,不希望受理論的束縛,可以將模板DNA用於靶核酸的同源定向修復(HDR)。
在一些實施方式中,模板DNA包含供體區,該供體區包含在5'同源臂與3'同源臂之間的一或多個核苷酸(例如,***序列)。在一些實施方式中,模板DNA包含5'同源臂下游的供體區(例如,***序列)。在一些實施方式中,模板DNA包含3'同源臂上游的供體區(例如,***序列)。在一些實施方式中,模板DNA包含足夠的同源性以允許HDR。在一些實施方式中,模板DNA的5'同源臂和/或3'同源臂將與靶核酸具有至少50%的序列同一性。在某些實施方式中,存在至少60%、70%、80%、90%、95%、98%、99%、或100%的序列同一性。
在一些實施方式中,5'同源臂和/或5'同源臂可以與希望進行基因編輯的TTR基因靶位點的上游和/或下游同源。側翼為一或多個同源臂的供體區可以經由例如同源重組摻入TTR基因靶位點中,從而將由該供體區編碼的編輯引入到TTR基因靶位點中。
在一些實施方式中,單股模板DNA包含供體區(例如,***序列),該供體區的長度為1個核苷酸至約200個核苷酸,例如,1個核苷酸至5個核苷酸、5個核苷酸至10個核苷酸、10個核苷酸至15個核苷酸、15個核苷酸至20個核苷酸、20個核苷酸至25個核苷酸、25個核苷酸至30個核苷酸、30個核苷酸至35個核苷酸、35個核苷酸至40個核苷酸、40個核苷酸至45個核苷酸、45個核苷酸至50個核苷酸、50個核苷酸至55個核苷酸、55個核苷酸至60個核苷酸、60個核苷酸至65個核苷酸、65個核苷酸至70個核苷酸、70個核苷酸至75個核苷酸、75個核苷酸至80個核苷酸、80個核苷酸至85個核苷酸、85個核苷酸至90個核苷酸、90個核苷酸至95個核苷酸、95個核苷酸至100個核苷酸、100個核苷酸至105個核苷酸、105個核苷酸至110個核苷酸、110個核苷酸至115個核苷酸、115個核苷酸至120個核苷酸、120個核苷酸至125個核苷酸、125個核苷酸至130個核苷酸、130個核苷酸至135個核苷酸、135個核苷酸至140個核苷酸、140個核苷酸至145個核苷酸、145個核苷酸至150個核苷酸、150個核苷酸至155個核苷酸、155個核苷酸至160個核苷酸、160個核苷酸至165個核苷酸、165個核苷酸至170個核苷酸、170個核苷酸至175個核苷酸、175個核苷酸至180個核苷酸、180個核苷酸至185個核苷酸、185個核苷酸至190個核苷酸、190個核苷酸至195個核苷酸、或195個核苷酸至200個核苷酸。
在一些實施方式中,雙股模板DNA包含長度多達約10,000個鹼基對(10 kb)的供體區(例如,***序列)。例如,在一些實施方式中,雙股模板DNA包含供體區(例如,***物),該供體區的長度為1個鹼基對、約10個鹼基對、約20個鹼基對、約30個鹼基對、約40個鹼基對、約50個鹼基對、約60個鹼基對、約70個鹼基對、約80個鹼基對、約90個鹼基對、約100個鹼基對、約200個鹼基對、約300個鹼基對、約400個鹼基對、約500個鹼基對、約600個鹼基對、約700個鹼基對、約800個鹼基對、約900個鹼基對、約1 kb、約1.1 kb、約1.2 kb、約1.3 kb、約1.4 kb、約1.5 kb、約1.6 kb、約1.7 kb、約1.8 kb、約1.9 kb、約2 kb、約2.1 kb、約2.2 kb、約2.3 kb、約2.4 kb、約2.5 kb、約2.6 kb、約2.7 kb、約2.8 kb、約2.9 kb、3 kb、約3.1 kb、約3.2 kb、約3.3 kb、約3.4 kb、約3.5 kb、約3.6 kb、約3.7 kb、約3.8 kb、約3.9 kb、約4 kb、約4.1 kb、約4.2 kb、約4.3 kb、約4.4 kb、約4.5 kb、約4.6 kb、約4.7 kb、約4.8 kb、約4.9 kb、約5 kb、約5.1 kb、約5.2 kb、約5.3 kb、約5.4 kb、約5.5 kb、約5.6 kb、約5.7 kb、約5.8 kb、約5.9 kb、約6 kb、約6.1 kb、約6.2 kb、約6.3 kb、約6.4 kb、約6.5 kb、約6.6 kb、約6.7 kb、約6.8 kb、約6.9 kb、約7 kb、約7.1 kb、約7.2 kb、約7.3 kb、約7.4 kb、約7.5 kb、約7.6 kb、約7.7 kb、約7.8 kb、約7.9 kb、約8 kb、約8.1 kb、約8.2 kb、約8.3 kb、約8.4 kb、約8.5 kb、約8.6 kb、約8.7 kb、約8.8 kb、約8.9 kb、約9 kb、約9.1 kb、約9.2 kb、約9.3 kb、約9.4 kb、約9.5 kb、約9.6 kb、約9.7 kb、約9.8 kb、約9.9 kb、或約10 kb。
在一些實施方式中,模板DNA包含一個或兩個側翼同源臂。在一些實施方式中,模板DNA包含5'同源臂(例如,左同源臂)。在一些實施方式中,模板DNA包含3'同源臂(例如,右同源臂)。在一些實施方式中,模板DNA包含5'同源臂和3’同源臂。
在一些實施方式中,單股模板DNA包含5'同源臂(例如,左同源臂),該同源臂的長度為約20個核苷酸至約200個核苷酸,例如,20個核苷酸至25個核苷酸、25個核苷酸至30個核苷酸、30個核苷酸至35個核苷酸、35個核苷酸至40個核苷酸、40個核苷酸至45個核苷酸、45個核苷酸至50個核苷酸、50個核苷酸至55個核苷酸、55個核苷酸至60個核苷酸、60個核苷酸至65個核苷酸、65個核苷酸至70個核苷酸、70個核苷酸至75個核苷酸、75個核苷酸至80個核苷酸、80個核苷酸至85個核苷酸、85個核苷酸至90個核苷酸、90個核苷酸至95個核苷酸、95個核苷酸至100個核苷酸、100個核苷酸至105個核苷酸、105個核苷酸至110個核苷酸、110個核苷酸至115個核苷酸、115個核苷酸至120個核苷酸、120個核苷酸至125個核苷酸、125個核苷酸至130個核苷酸、130個核苷酸至135個核苷酸、135個核苷酸至140個核苷酸、140個核苷酸至145個核苷酸、145個核苷酸至150個核苷酸、150個核苷酸至155個核苷酸、155個核苷酸至160個核苷酸、160個核苷酸至165個核苷酸、165個核苷酸至170個核苷酸、170個核苷酸至175個核苷酸、175個核苷酸至180個核苷酸、180個核苷酸至185個核苷酸、185個核苷酸至190個核苷酸、190個核苷酸至195個核苷酸、或195個核苷酸至200個核苷酸。在一些實施方式中,單股模板DNA包含5'同源臂(例如,左同源臂),該同源臂的長度為約200個核苷酸至約500個核苷酸,例如,200個核苷酸至210個核苷酸、210個核苷酸至220個核苷酸、220個核苷酸至230個核苷酸、230個核苷酸至240個核苷酸、240個核苷酸至250個核苷酸、250個核苷酸至260個核苷酸、260個核苷酸至270個核苷酸、270個核苷酸至280個核苷酸、280個核苷酸至290個核苷酸、290個核苷酸至300個核苷酸、300個核苷酸至310個核苷酸、310個核苷酸至320個核苷酸、320個核苷酸至330個核苷酸、330個核苷酸至340個核苷酸、340個核苷酸至350個核苷酸、350個核苷酸至360個核苷酸、360個核苷酸至370個核苷酸、370個核苷酸至380個核苷酸、380個核苷酸至390個核苷酸、390個核苷酸至400個核苷酸、400個核苷酸至410個核苷酸、410個核苷酸至420個核苷酸、420個核苷酸至430個核苷酸、430個核苷酸至440個核苷酸、440個核苷酸至450個核苷酸、450個核苷酸至460個核苷酸、460個核苷酸至470個核苷酸、470個核苷酸至480個核苷酸、480個核苷酸至490個核苷酸、或490個核苷酸至500個核苷酸。
在一些實施方式中,單股模板DNA包含3'同源臂(例如,右同源臂),該同源臂的長度為約20個核苷酸至約200個核苷酸,例如,20個核苷酸至25個核苷酸、25個核苷酸至30個核苷酸、30個核苷酸至35個核苷酸、35個核苷酸至40個核苷酸、40個核苷酸至45個核苷酸、45個核苷酸至50個核苷酸、50個核苷酸至55個核苷酸、55個核苷酸至60個核苷酸、60個核苷酸至65個核苷酸、65個核苷酸至70個核苷酸、70個核苷酸至75個核苷酸、75個核苷酸至80個核苷酸、80個核苷酸至85個核苷酸、85個核苷酸至90個核苷酸、90個核苷酸至95個核苷酸、95個核苷酸至100個核苷酸、100個核苷酸至105個核苷酸、105個核苷酸至110個核苷酸、110個核苷酸至115個核苷酸、115個核苷酸至120個核苷酸、120個核苷酸至125個核苷酸、125個核苷酸至130個核苷酸、130個核苷酸至135個核苷酸、135個核苷酸至140個核苷酸、140個核苷酸至145個核苷酸、145個核苷酸至150個核苷酸、150個核苷酸至155個核苷酸、155個核苷酸至160個核苷酸、160個核苷酸至165個核苷酸、165個核苷酸至170個核苷酸、170個核苷酸至175個核苷酸、175個核苷酸至180個核苷酸、180個核苷酸至185個核苷酸、185個核苷酸至190個核苷酸、190個核苷酸至195個核苷酸、或195個核苷酸至200個核苷酸。在一些實施方式中,單股模板DNA包含3'同源臂(例如,右同源臂),該同源臂的長度為約200個核苷酸至約500個核苷酸,例如,200個核苷酸至210個核苷酸、210個核苷酸至220個核苷酸、220個核苷酸至230個核苷酸、230個核苷酸至240個核苷酸、240個核苷酸至250個核苷酸、250個核苷酸至260個核苷酸、260個核苷酸至270個核苷酸、270個核苷酸至280個核苷酸、280個核苷酸至290個核苷酸、290個核苷酸至300個核苷酸、300個核苷酸至310個核苷酸、310個核苷酸至320個核苷酸、320個核苷酸至330個核苷酸、330個核苷酸至340個核苷酸、340個核苷酸至350個核苷酸、350個核苷酸至360個核苷酸、360個核苷酸至370個核苷酸、370個核苷酸至380個核苷酸、380個核苷酸至390個核苷酸、390個核苷酸至400個核苷酸、400個核苷酸至410個核苷酸、410個核苷酸至420個核苷酸、420個核苷酸至430個核苷酸、430個核苷酸至440個核苷酸、440個核苷酸至450個核苷酸、450個核苷酸至460個核苷酸、460個核苷酸至470個核苷酸、470個核苷酸至480個核苷酸、480個核苷酸至490個核苷酸、或490個核苷酸至500個核苷酸。
在一些實施方式中,雙股模板DNA包含5'同源臂(例如,左同源臂),該同源臂的長度為約20個鹼基對至約200個鹼基對,例如,20個鹼基對至25個鹼基對、25個鹼基對至30個鹼基對、30個鹼基對至35個鹼基對、35個鹼基對至40個鹼基對、40個鹼基對至45個鹼基對、45個鹼基對至50個鹼基對、50個鹼基對至55個鹼基對、55個鹼基對至60個鹼基對、60個鹼基對至65個鹼基對、65個鹼基對至70個鹼基對、70個鹼基對至75個鹼基對、75個鹼基對至80個鹼基對、80個鹼基對至85個鹼基對、85個鹼基對至90個鹼基對、90個鹼基對至95個鹼基對、95個鹼基對至100個鹼基對、100個鹼基對至105個鹼基對、105個鹼基對至110個鹼基對、110個鹼基對至115個鹼基對、115個鹼基對至120個鹼基對、120個鹼基對至125個鹼基對、125個鹼基對至130個鹼基對、130個鹼基對至135個鹼基對、135個鹼基對至140個鹼基對、140個鹼基對至145個鹼基對、145個鹼基對至150個鹼基對、150個鹼基對至155個鹼基對、155個鹼基對至160個鹼基對、160個鹼基對至165個鹼基對、165個鹼基對至170個鹼基對、170個鹼基對至175個鹼基對、175個鹼基對至180個鹼基對、180個鹼基對至185個鹼基對、185個鹼基對至190個鹼基對、190個鹼基對至195個鹼基對、或195個鹼基對至200個鹼基對。在一些實施方式中,雙股模板DNA包含5'同源臂(例如,左同源臂),該同源臂的長度為約200個鹼基對至約500個鹼基對,例如,200個鹼基對至210個鹼基對、210個鹼基對至220個鹼基對、220個鹼基對至230個鹼基對、230個鹼基對至240個鹼基對、240個鹼基對至250個鹼基對、250個鹼基對至260個鹼基對、260個鹼基對至270個鹼基對、270個鹼基對至280個鹼基對、280個鹼基對至290個鹼基對、290個鹼基對至300個鹼基對、300個鹼基對至310個鹼基對、310個鹼基對至320個鹼基對、320個鹼基對至330個鹼基對、330個鹼基對至340個鹼基對、340個鹼基對至350個鹼基對、350個鹼基對至360個鹼基對、360個鹼基對至370個鹼基對、370個鹼基對至380個鹼基對、380個鹼基對至390個鹼基對、390個鹼基對至400個鹼基對、400個鹼基對至410個鹼基對、410個鹼基對至420個鹼基對、420個鹼基對至430個鹼基對、430個鹼基對至440個鹼基對、440個鹼基對至450個鹼基對、450個鹼基對至460個鹼基對、460個鹼基對至470個鹼基對、470個鹼基對至480個鹼基對、480個鹼基對至490個鹼基對、或490個鹼基對至500個鹼基對。在一些實施方式中,雙股模板DNA包含5'同源臂,該同源臂的長度為至少500個鹼基對,例如,500個鹼基對至550個鹼基對、550個鹼基對至600個鹼基對、600個鹼基對至650個鹼基對、650個鹼基對至700個鹼基對、700個鹼基對至750個鹼基對、750個鹼基對至800個鹼基對、800個鹼基對至850個鹼基對、850個鹼基對至900個鹼基對、900個鹼基對至950個鹼基對、或950個鹼基對至1,000個鹼基對(1 kb)。
在一些實施方式中,雙股模板DNA包含3'同源臂(例如,右同源臂),該同源臂的長度為約20個鹼基對至約200個鹼基對,例如,20個鹼基對至25個鹼基對、25個鹼基對至30個鹼基對、30個鹼基對至35個鹼基對、35個鹼基對至40個鹼基對、40個鹼基對至45個鹼基對、45個鹼基對至50個鹼基對、50個鹼基對至55個鹼基對、55個鹼基對至60個鹼基對、60個鹼基對至65個鹼基對、65個鹼基對至70個鹼基對、70個鹼基對至75個鹼基對、75個鹼基對至80個鹼基對、80個鹼基對至85個鹼基對、85個鹼基對至90個鹼基對、90個鹼基對至95個鹼基對、95個鹼基對至100個鹼基對、100個鹼基對至105個鹼基對、105個鹼基對至110個鹼基對、110個鹼基對至115個鹼基對、115個鹼基對至120個鹼基對、120個鹼基對至125個鹼基對、125個鹼基對至130個鹼基對、130個鹼基對至135個鹼基對、135個鹼基對至140個鹼基對、140個鹼基對至145個鹼基對、145個鹼基對至150個鹼基對、150個鹼基對至155個鹼基對、155個鹼基對至160個鹼基對、160個鹼基對至165個鹼基對、165個鹼基對至170個鹼基對、170個鹼基對至175個鹼基對、175個鹼基對至180個鹼基對、180個鹼基對至185個鹼基對、185個鹼基對至190個鹼基對、190個鹼基對至195個鹼基對、或195個鹼基對至200個鹼基對。在一些實施方式中,雙股模板DNA包含3'同源臂(例如,右同源臂),該同源臂的長度為約200個鹼基對至約500個鹼基對,例如,200個鹼基對至210個鹼基對、210個鹼基對至220個鹼基對、220個鹼基對至230個鹼基對、230個鹼基對至240個鹼基對、240個鹼基對至250個鹼基對、250個鹼基對至260個鹼基對、260個鹼基對至270個鹼基對、270個鹼基對至280個鹼基對、280個鹼基對至290個鹼基對、290個鹼基對至300個鹼基對、300個鹼基對至310個鹼基對、310個鹼基對至320個鹼基對、320個鹼基對至330個鹼基對、330個鹼基對至340個鹼基對、340個鹼基對至350個鹼基對、350個鹼基對至360個鹼基對、360個鹼基對至370個鹼基對、370個鹼基對至380個鹼基對、380個鹼基對至390個鹼基對、390個鹼基對至400個鹼基對、400個鹼基對至410個鹼基對、410個鹼基對至420個鹼基對、420個鹼基對至430個鹼基對、430個鹼基對至440個鹼基對、440個鹼基對至450個鹼基對、450個鹼基對至460個鹼基對、460個鹼基對至470個鹼基對、470個鹼基對至480個鹼基對、480個鹼基對至490個鹼基對、或490個鹼基對至500個鹼基對。在一些實施方式中,雙股模板DNA包含3'同源臂(例如,右同源臂),該同源臂的長度為至少500個鹼基對,例如,500個鹼基對至550個鹼基對、550個鹼基對至600個鹼基對、600個鹼基對至650個鹼基對、650個鹼基對至700個鹼基對、700個鹼基對至750個鹼基對、750個鹼基對至800個鹼基對、800個鹼基對至850個鹼基對、850個鹼基對至900個鹼基對、900個鹼基對至950個鹼基對、或950個鹼基對至1,000個鹼基對(1 kb)。
在一些實施方式中,雙股模板DNA包含正義股5'同源臂(例如,左同源臂),該同源臂的長度為約20個鹼基對至約200個鹼基對,例如,20個鹼基對至25個鹼基對、25個鹼基對至30個鹼基對、30個鹼基對至35個鹼基對、35個鹼基對至40個鹼基對、40個鹼基對至45個鹼基對、45個鹼基對至50個鹼基對、50個鹼基對至55個鹼基對、55個鹼基對至60個鹼基對、60個鹼基對至65個鹼基對、65個鹼基對至70個鹼基對、70個鹼基對至75個鹼基對、75個鹼基對至80個鹼基對、80個鹼基對至85個鹼基對、85個鹼基對至90個鹼基對、90個鹼基對至95個鹼基對、95個鹼基對至100個鹼基對、100個鹼基對至105個鹼基對、105個鹼基對至110個鹼基對、110個鹼基對至115個鹼基對、115個鹼基對至120個鹼基對、120個鹼基對至125個鹼基對、125個鹼基對至130個鹼基對、130個鹼基對至135個鹼基對、135個鹼基對至140個鹼基對、140個鹼基對至145個鹼基對、145個鹼基對至150個鹼基對、150個鹼基對至155個鹼基對、155個鹼基對至160個鹼基對、160個鹼基對至165個鹼基對、165個鹼基對至170個鹼基對、170個鹼基對至175個鹼基對、175個鹼基對至180個鹼基對、180個鹼基對至185個鹼基對、185個鹼基對至190個鹼基對、190個鹼基對至195個鹼基對、或195個鹼基對至200個鹼基對。在一些實施方式中,雙股模板DNA包含正義股5'同源臂(例如,左同源臂),該同源臂的長度為約200個鹼基對至約500個鹼基對,例如,200個鹼基對至210個鹼基對、210個鹼基對至220個鹼基對、220個鹼基對至230個鹼基對、230個鹼基對至240個鹼基對、240個鹼基對至250個鹼基對、250個鹼基對至260個鹼基對、260個鹼基對至270個鹼基對、270個鹼基對至280個鹼基對、280個鹼基對至290個鹼基對、290個鹼基對至300個鹼基對、300個鹼基對至310個鹼基對、310個鹼基對至320個鹼基對、320個鹼基對至330個鹼基對、330個鹼基對至340個鹼基對、340個鹼基對至350個鹼基對、350個鹼基對至360個鹼基對、360個鹼基對至370個鹼基對、370個鹼基對至380個鹼基對、380個鹼基對至390個鹼基對、390個鹼基對至400個鹼基對、400個鹼基對至410個鹼基對、410個鹼基對至420個鹼基對、420個鹼基對至430個鹼基對、430個鹼基對至440個鹼基對、440個鹼基對至450個鹼基對、450個鹼基對至460個鹼基對、460個鹼基對至470個鹼基對、470個鹼基對至480個鹼基對、480個鹼基對至490個鹼基對、或490個鹼基對至500個鹼基對。在一些實施方式中,雙股模板DNA包含正義股5'同源臂,該同源臂的長度為至少500個鹼基對,例如,500個鹼基對至550個鹼基對、550個鹼基對至600個鹼基對、600個鹼基對至650個鹼基對、650個鹼基對至700個鹼基對、700個鹼基對至750個鹼基對、750個鹼基對至800個鹼基對、800個鹼基對至850個鹼基對、850個鹼基對至900個鹼基對、900個鹼基對至950個鹼基對、或950個鹼基對至1,000個鹼基對(1 kb)。
在一些實施方式中,雙股模板DNA包含正義股3'同源臂(例如,右同源臂),該同源臂的長度為約20個鹼基對至約200個鹼基對,例如,20個鹼基對至25個鹼基對、25個鹼基對至30個鹼基對、30個鹼基對至35個鹼基對、35個鹼基對至40個鹼基對、40個鹼基對至45個鹼基對、45個鹼基對至50個鹼基對、50個鹼基對至55個鹼基對、55個鹼基對至60個鹼基對、60個鹼基對至65個鹼基對、65個鹼基對至70個鹼基對、70個鹼基對至75個鹼基對、75個鹼基對至80個鹼基對、80個鹼基對至85個鹼基對、85個鹼基對至90個鹼基對、90個鹼基對至95個鹼基對、95個鹼基對至100個鹼基對、100個鹼基對至105個鹼基對、105個鹼基對至110個鹼基對、110個鹼基對至115個鹼基對、115個鹼基對至120個鹼基對、120個鹼基對至125個鹼基對、125個鹼基對至130個鹼基對、130個鹼基對至135個鹼基對、135個鹼基對至140個鹼基對、140個鹼基對至145個鹼基對、145個鹼基對至150個鹼基對、150個鹼基對至155個鹼基對、155個鹼基對至160個鹼基對、160個鹼基對至165個鹼基對、165個鹼基對至170個鹼基對、170個鹼基對至175個鹼基對、175個鹼基對至180個鹼基對、180個鹼基對至185個鹼基對、185個鹼基對至190個鹼基對、190個鹼基對至195個鹼基對、或195個鹼基對至200個鹼基對。在一些實施方式中,雙股模板DNA包含正義股3'同源臂(例如,右同源臂),該同源臂的長度為約200個鹼基對至約500個鹼基對,例如,200個鹼基對至210個鹼基對、210個鹼基對至220個鹼基對、220個鹼基對至230個鹼基對、230個鹼基對至240個鹼基對、240個鹼基對至250個鹼基對、250個鹼基對至260個鹼基對、260個鹼基對至270個鹼基對、270個鹼基對至280個鹼基對、280個鹼基對至290個鹼基對、290個鹼基對至300個鹼基對、300個鹼基對至310個鹼基對、310個鹼基對至320個鹼基對、320個鹼基對至330個鹼基對、330個鹼基對至340個鹼基對、340個鹼基對至350個鹼基對、350個鹼基對至360個鹼基對、360個鹼基對至370個鹼基對、370個鹼基對至380個鹼基對、380個鹼基對至390個鹼基對、390個鹼基對至400個鹼基對、400個鹼基對至410個鹼基對、410個鹼基對至420個鹼基對、420個鹼基對至430個鹼基對、430個鹼基對至440個鹼基對、440個鹼基對至450個鹼基對、450個鹼基對至460個鹼基對、460個鹼基對至470個鹼基對、470個鹼基對至480個鹼基對、480個鹼基對至490個鹼基對、或490個鹼基對至500個鹼基對。在一些實施方式中,雙股模板DNA包含正義股3'同源臂,該同源臂的長度為至少500個鹼基對,例如,500個鹼基對至550個鹼基對、550個鹼基對至600個鹼基對、600個鹼基對至650個鹼基對、650個鹼基對至700個鹼基對、700個鹼基對至750個鹼基對、750個鹼基對至800個鹼基對、800個鹼基對至850個鹼基對、850個鹼基對至900個鹼基對、900個鹼基對至950個鹼基對、或950個鹼基對至1,000個鹼基對(1 kb)。
在一些實施方式中,雙股模板DNA包含正義股5'同源臂(例如,左同源臂)和正義股3'同源臂(例如,右同源臂),該5'同源臂的長度為約20個鹼基對至約200個鹼基對,例如,20個鹼基對至25個鹼基對、25個鹼基對至30個鹼基對、30個鹼基對至35個鹼基對、35個鹼基對至40個鹼基對、40個鹼基對至45個鹼基對、45個鹼基對至50個鹼基對、50個鹼基對至55個鹼基對、55個鹼基對至60個鹼基對、60個鹼基對至65個鹼基對、65個鹼基對至70個鹼基對、70個鹼基對至75個鹼基對、75個鹼基對至80個鹼基對、80個鹼基對至85個鹼基對、85個鹼基對至90個鹼基對、90個鹼基對至95個鹼基對、95個鹼基對至100個鹼基對、100個鹼基對至105個鹼基對、105個鹼基對至110個鹼基對、110個鹼基對至115個鹼基對、115個鹼基對至120個鹼基對、120個鹼基對至125個鹼基對、125個鹼基對至130個鹼基對、130個鹼基對至135個鹼基對、135個鹼基對至140個鹼基對、140個鹼基對至145個鹼基對、145個鹼基對至150個鹼基對、150個鹼基對至155個鹼基對、155個鹼基對至160個鹼基對、160個鹼基對至165個鹼基對、165個鹼基對至170個鹼基對、170個鹼基對至175個鹼基對、175個鹼基對至180個鹼基對、180個鹼基對至185個鹼基對、185個鹼基對至190個鹼基對、190個鹼基對至195個鹼基對、或195個鹼基對至200個鹼基對,該3'同源臂的長度為約20個鹼基對至約200個鹼基對,例如,20個鹼基對至25個鹼基對、25個鹼基對至30個鹼基對、30個鹼基對至35個鹼基對、35個鹼基對至40個鹼基對、40個鹼基對至45個鹼基對、45個鹼基對至50個鹼基對、50個鹼基對至55個鹼基對、55個鹼基對至60個鹼基對、60個鹼基對至65個鹼基對、65個鹼基對至70個鹼基對、70個鹼基對至75個鹼基對、75個鹼基對至80個鹼基對、80個鹼基對至85個鹼基對、85個鹼基對至90個鹼基對、90個鹼基對至95個鹼基對、95個鹼基對至100個鹼基對、100個鹼基對至105個鹼基對、105個鹼基對至110個鹼基對、110個鹼基對至115個鹼基對、115個鹼基對至120個鹼基對、120個鹼基對至125個鹼基對、125個鹼基對至130個鹼基對、130個鹼基對至135個鹼基對、135個鹼基對至140個鹼基對、140個鹼基對至145個鹼基對、145個鹼基對至150個鹼基對、150個鹼基對至155個鹼基對、155個鹼基對至160個鹼基對、160個鹼基對至165個鹼基對、165個鹼基對至170個鹼基對、170個鹼基對至175個鹼基對、175個鹼基對至180個鹼基對、180個鹼基對至185個鹼基對、185個鹼基對至190個鹼基對、190個鹼基對至195個鹼基對、或195個鹼基對至200個鹼基對。在一些實施方式中,雙股模板DNA包含正義股5'同源臂(例如,左同源臂)和正義股3'同源臂(例如,右同源臂),該5'同源臂的長度為約200個鹼基對至約500個鹼基對,例如,200個鹼基對至210個鹼基對、210個鹼基對至220個鹼基對、220個鹼基對至230個鹼基對、230個鹼基對至240個鹼基對、240個鹼基對至250個鹼基對、250個鹼基對至260個鹼基對、260個鹼基對至270個鹼基對、270個鹼基對至280個鹼基對、280個鹼基對至290個鹼基對、290個鹼基對至300個鹼基對、300個鹼基對至310個鹼基對、310個鹼基對至320個鹼基對、320個鹼基對至330個鹼基對、330個鹼基對至340個鹼基對、340個鹼基對至350個鹼基對、350個鹼基對至360個鹼基對、360個鹼基對至370個鹼基對、370個鹼基對至380個鹼基對、380個鹼基對至390個鹼基對、390個鹼基對至400個鹼基對、400個鹼基對至410個鹼基對、410個鹼基對至420個鹼基對、420個鹼基對至430個鹼基對、430個鹼基對至440個鹼基對、440個鹼基對至450個鹼基對、450個鹼基對至460個鹼基對、460個鹼基對至470個鹼基對、470個鹼基對至480個鹼基對、480個鹼基對至490個鹼基對、或490個鹼基對至500個鹼基對,該3'同源臂的長度為約200個鹼基對至約500個鹼基對,例如,200個鹼基對至210個鹼基對、210個鹼基對至220個鹼基對、220個鹼基對至230個鹼基對、230個鹼基對至240個鹼基對、240個鹼基對至250個鹼基對、250個鹼基對至260個鹼基對、260個鹼基對至270個鹼基對、270個鹼基對至280個鹼基對、280個鹼基對至290個鹼基對、290個鹼基對至300個鹼基對、300個鹼基對至310個鹼基對、310個鹼基對至320個鹼基對、320個鹼基對至330個鹼基對、330個鹼基對至340個鹼基對、340個鹼基對至350個鹼基對、350個鹼基對至360個鹼基對、360個鹼基對至370個鹼基對、370個鹼基對至380個鹼基對、380個鹼基對至390個鹼基對、390個鹼基對至400個鹼基對、400個鹼基對至410個鹼基對、410個鹼基對至420個鹼基對、420個鹼基對至430個鹼基對、430個鹼基對至440個鹼基對、440個鹼基對至450個鹼基對、450個鹼基對至460個鹼基對、460個鹼基對至470個鹼基對、470個鹼基對至480個鹼基對、480個鹼基對至490個鹼基對、或490個鹼基對至500個鹼基對。在一些實施方式中,雙股模板DNA包含正義股5'同源臂(例如,左同源臂)和正義股3'同源臂(例如,右同源臂),該5'同源臂的長度為至少500個鹼基對,例如,500個鹼基對至550個鹼基對、550個鹼基對至600個鹼基對、600個鹼基對至650個鹼基對、650個鹼基對至700個鹼基對、700個鹼基對至750個鹼基對、750個鹼基對至800個鹼基對、800個鹼基對至850個鹼基對、850個鹼基對至900個鹼基對、900個鹼基對至950個鹼基對、或950個鹼基對至1,000個鹼基對(1 kb),該3'同源臂的長度為至少500個鹼基對,例如,500個鹼基對至550個鹼基對、550個鹼基對至600個鹼基對、600個鹼基對至650個鹼基對、650個鹼基對至700個鹼基對、700個鹼基對至750個鹼基對、750個鹼基對至800個鹼基對、800個鹼基對至850個鹼基對、850個鹼基對至900個鹼基對、900個鹼基對至950個鹼基對、或950個鹼基對至1,000個鹼基對(1 kb)。
在一些實施方式中,模板DNA包含長度相同的5’同源臂(例如,左同源臂)和3’同源臂(例如,右同源臂)。在一些實施方式中,模板DNA包含長度不同的5’同源臂(例如,左同源臂)和3’同源臂(例如,右同源臂)。在一些實施方式中,5'同源臂的長度係3’同源臂的約10%、15%、20%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95% 96%、97%、98%、或99%,但不是100%。在一些實施方式中,3'同源臂的長度係5’同源臂的約10%、15%、20%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95% 96%、97%、98%、或99%,但不是100%。
在一些實施方式中,模板DNA包含兩個長度類似的同源臂(例如,長度類似的右同源臂和左同源臂)。例如,在一些實施方式中,5'同源臂(例如,左同源臂)的長度係3’同源臂(例如,右同源臂)的至少約70%(例如,約70%、71%、72%、73%、74%、75%、76%、77%、78%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%)。在一些實施方式中,5'同源臂(例如,左同源臂)的長度係3’同源臂(例如,右同源臂)的至少約75%(例如,約75%、76%、77%、78%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%)。在一些實施方式中,5'同源臂(例如,左同源臂)的長度係3’同源臂(例如,右同源臂)的至少約80%(例如,約80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%)。在一些實施方式中,5'同源臂(例如,左同源臂)的長度係3’同源臂(例如,右同源臂)的至少約85%(例如,約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%)。在一些實施方式中,5'同源臂(例如,左同源臂)的長度係3’同源臂(例如,右同源臂)的至少約90%(例如,約90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%)。在一些實施方式中,5'同源臂(例如,左同源臂)的長度係3’同源臂(例如,右同源臂)的至少約95%(例如,約95%、96%、97%、98%、或99%)。在一些實施方式中,3'同源臂(例如,右同源臂)的長度係5’同源臂(例如,左同源臂)的至少約70%(例如,約70%、71%、72%、73%、74%、75%、76%、77%、78%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%)。在一些實施方式中,3'同源臂(例如,右同源臂)的長度係5’同源臂(例如,左同源臂)的至少約75%(例如,約75%、76%、77%、78%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%)。在一些實施方式中,3'同源臂(例如,右同源臂)的長度係5’同源臂(例如,左同源臂)的至少約80%(例如,約80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%)。在一些實施方式中,3'同源臂(例如,右同源臂)的長度係5’同源臂(例如,左同源臂)的至少約85%(例如,約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%)。在一些實施方式中,3'同源臂(例如,右同源臂)的長度係5’同源臂(例如,左同源臂)的至少約90%(例如,約90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%)。在一些實施方式中,3'同源臂(例如,右同源臂)的長度係5’同源臂(例如,左同源臂)的至少約95%(例如,約95%、96%、97%、98%、或99%)。
在一些實施方式中,模板DNA包含5’同源臂但不包含3’同源臂。在一些實施方式中,模板DNA包含3’同源臂但不包含5’同源臂。
在一些實施方式中,***序列位於PAM股上5'-NTTN-3'序列上游的TTR靶核酸的對應區域內。例如,***序列位於5'-NTTN-3'序列的上游約20個核苷酸內,例如,5'-NTTN-3'序列的上游1個核苷酸、2個核苷酸、3個核苷酸、4個核苷酸、5個核苷酸、6個核苷酸、7個核苷酸、8個核苷酸、9個核苷酸、10個核苷酸、11個核苷酸、12個核苷酸、13個核苷酸、14個核苷酸、15個核苷酸、16個核苷酸、17個核苷酸、18個核苷酸、19個核苷酸、或20個核苷酸。
在一些實施方式中,***序列位於PAM股上5'-NTTN-3'序列下游的TTR靶核酸的對應區域內。例如,***序列可以位於5'-NTTN-3'序列的下游約60個核苷酸內,例如,5'-NTTN-3'序列的下游1個核苷酸、2個核苷酸、3個核苷酸、4個核苷酸、5個核苷酸、6個核苷酸、7個核苷酸、8個核苷酸、9個核苷酸、10個核苷酸、11個核苷酸、12個核苷酸、13個核苷酸、14個核苷酸、15個核苷酸、16個核苷酸、17個核苷酸、18個核苷酸、19個核苷酸、20個核苷酸、25個核苷酸、30個核苷酸、35個核苷酸、40個核苷酸、45個核苷酸、50個核苷酸、55個核苷酸、或60個核苷酸內。
在一些實施方式中,本文所述之模板DNA用於糾正與疾病相關的TTR突變。在一些實施方式中,突變係V30M、V122I、T60A、L58H、或I84S,並且疾病係hATTR、FAP、或SSA。在一些實施方式中,突變V30M、V122I、T60A、L58H、或I84S參考經翻譯後切割的SEQ ID NO: 257的TTR序列。在一些實施方式中,相對於SEQ ID NO: 256的全長TTR序列,該等突變被稱為V50M、V142I、T80A、L78H、和I104S。
在一些實施方式中,靶序列編碼V30M突變,並且模板DNA包含編碼M30V突變的***序列。在一些實施方式中,靶序列包含在SEQ ID NO: 258的TTR編碼序列中的148G>A突變。在一些實施方式中,模板DNA包含在SEQ ID NO: 258的TTR編碼序列的對應區域中的148A>G突變。
在一些實施方式中,靶序列編碼V122I突變,並且模板DNA包含編碼I122V突變的***序列。在一些實施方式中,靶序列包含在SEQ ID NO: 258的TTR編碼序列中的424G>A突變。在一些實施方式中,模板DNA包含在SEQ ID NO: 258的TTR編碼序列的對應區域中的424A>G突變。
在一些實施方式中,靶序列編碼T60A突變,並且模板DNA包含編碼A60T突變的***序列。在一些實施方式中,靶序列包含在SEQ ID NO: 258的TTR編碼序列中的238A>G突變。在一些實施方式中,模板DNA包含在SEQ ID NO: 258的TTR編碼序列的對應區域中的238G>A突變。
在一些實施方式中,靶序列編碼L58H突變,並且模板DNA包含編碼H58L突變的***序列。在一些實施方式中,靶序列包含在SEQ ID NO: 258的TTR編碼序列中的233T>A突變。在一些實施方式中,模板DNA包含在SEQ ID NO: 258的TTR編碼序列的對應區域中的233A>T突變。
在一些實施方式中,靶序列編碼I84S突變,並且模板DNA包含編碼S84I突變的***序列。在一些實施方式中,靶序列包含在SEQ ID NO: 258的TTR編碼序列中的311T>G突變。在一些實施方式中,模板DNA包含在SEQ ID NO: 258的TTR編碼序列的對應區域中的311G>T突變。
在一些實施方式中,本文所述之模板DNA用於引入與疾病相關的保護性突變。在一些實施方式中,突變係T119M,並且疾病係hATTR。在一些實施方式中,突變係T119M,並且疾病係野生型ATTR類澱粉變性。在一些實施方式中,T119M突變參考經翻譯後切割的SEQ ID NO: 257的TTR序列。在一些實施方式中,相對於SEQ ID NO: 256的全長TTR序列,T119M突變被稱為T139M。在一些實施方式中,靶序列編碼T119殘基,並且模板DNA包含編碼T119M突變的***序列。在一些實施方式中,靶序列包含在SEQ ID NO: 258的TTR編碼序列的416位置中的C。在一些實施方式中,模板DNA包含在SEQ ID NO: 258的TTR編碼序列的對應區域中的416C>T突變。
在一些實施方式中,模板DNA與SEQ ID NO: 287-294或SEQ ID NO: 303-310中的任一個、或SEQ ID NO: 287-294或SEQ ID NO: 303-310中任一個的一部分具有至少90%(例如,90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%)的同一性。在一些實施方式中,模板DNA與SEQ ID NO: 287-294或SEQ ID NO: 303-310中的任一個、或SEQ ID NO: 287-294或SEQ ID NO: 303-310中任一個的一部分具有至少95%(例如,95%、96%、97%、98%、99%、或100%)的同一性。在一些實施方式中,模板DNA包含SEQ ID NO: 287-294或SEQ ID NO: 303-310中的任一個、或SEQ ID NO: 287-294或SEQ ID NO: 303-310中任一個的一部分的序列。在一些實施方式中,模板DNA包含SEQ ID NO: 287-294或SEQ ID NO: 303-310中任一個的供體區,並且進一步具有左同源臂。在一些實施方式中,模板DNA包含SEQ ID NO: 287-294或SEQ ID NO: 303-310中任一個的供體區,並且進一步具有右同源臂。在一些實施方式中,模板DNA包含SEQ ID NO: 287-294或SEQ ID NO: 303-310中任一個的供體區,並且進一步具有左同源臂和右同源臂。在一些實施方式中,模板DNA包含SEQ ID NO: 287-294或SEQ ID NO: 303-310中任一個的供體區,並且進一步包含長度為約40至約50個核苷酸的同源臂。在一些實施方式中,模板DNA包含SEQ ID NO: 287-294或SEQ ID NO: 303-310中任一個的供體區,並且進一步包含長度小於約40至約50個核苷酸的同源臂。在一些實施方式中,模板DNA包含SEQ ID NO: 287-294或SEQ ID NO: 303-310中任一個的供體區,並且進一步包含長度大於約40至約50個核苷酸的同源臂。 C. 核酸修飾
RNA指導物或模板DNA可以包括相對於參考序列、特別是親本多核糖核苷酸的一或多個共價修飾,該一或多個共價修飾包括在本揭露內容之範圍內。
示例性修飾可以包括對糖、核鹼基、核苷間鍵(例如,對連接的磷酸酯/對磷酸二酯鍵/對磷酸二酯骨架)、及其任何組合的任何修飾。下面詳細描述本文提供的一些示例性修飾。
RNA指導物或模板DNA可以包括如對糖、核鹼基、或核苷間鍵(例如,對連接的磷酸酯/對磷酸二酯鍵/對磷酸二酯骨架)的任何有用的修飾。嘧啶核鹼基的一或多個原子可以被視需要取代的胺基、視需要取代的硫醇、視需要取代的烷基(例如甲基或乙基)或鹵代(例如氯代或氟代)替代或取代。在某些實施方式中,修飾(例如,一或多個修飾)存在於糖和核苷間鍵中的每一個中。修飾可為對核糖核酸(RNA)到去氧核糖核酸(DNA)、蘇糖核酸(TNA)、乙二醇核酸(GNA)、肽核酸(PNA)、鎖核酸(LNA)或其雜交體的修飾。本文描述了額外的修飾。
在一些實施方式中,修飾可以包括化學或細胞誘導的修飾。例如,Lewis和Pan在來自Nat Reviews Mol Cell Biol [自然評論分子細胞生物學], 2017, 18:202-210的「RNA modifications and structures cooperate to guide RNA-protein interactions [與指導RNA-蛋白質相互作用配合的RNA修飾和結構]」中描述了細胞內RNA修飾的一些非限制性實例。
不同的糖修飾、核苷酸修飾、和/或核苷間鍵(例如,骨架結構)可以存在於序列的各個位置。熟悉該項技術者將理解,核苷酸類似物或其他的一或多種修飾可以位於序列的任何一或多個位置,使得該序列的功能基本上不降低。序列可以包括約1%至約100%的經修飾的核苷酸(相對於總核苷酸含量,或相對於一或多種類型的核苷酸(即A、G、U或C中的任何一或多種))或任何中間百分比(例如,從1%至20%>、從1%至25%、從1%至50%、從1%至60%、從1%至70%、從1%至80%、從1%至90%、從1%至95%、從10%至20%、從10%至25%、從10%至50%、從10%至60%、從10%至70%、從10%至80%、從10%至90%、從10%至95%、從10%至100%、從20%至25%、從20%至50%、從20%至60%、從20%至70%、從20%至80%、從20%至90%、從20%至95%、從20%至100%、從50%至60%、從50%至70%、從50%至80%、從50%至90%、從50%至95%、從50%至100%、從70%至80%、從70%至90%、從70%至95%、從70%至100%、從80%至90%、從80%至95%、從80%至100%、從90%至95%、從90%至100%、以及從95%至100%)。
在一些實施方式中,序列的一或多個核糖核苷酸的糖修飾(例如,在2'位置或4'位置)或糖替代以及骨架修飾包括磷酸二酯鍵的修飾或替代。序列之特定實例包括但不限於包括經修飾的骨架或非天然核苷間鍵(例如核苷間修飾,包括磷酸二酯鍵的修飾或替代)的序列。具有經修飾的骨架的序列包括骨架中不具有磷原子的那些等。出於本申請之目的,並且如本領域中有時提及的,在其核苷間骨架中不具有磷原子的經修飾的RNA也可以被認為是寡核苷。在特定的實施方式中,序列將包括在其核苷間骨架中具有磷原子的核糖核苷酸。
經修飾的序列主鏈可以包括,例如,硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、胺基烷基磷酸三酯、甲基和其他烷基膦酸酯(如3’-伸烷基膦酸酯和手性膦酸酯)、亞膦酸酯、胺基磷酸酯(如3’-胺基胺基磷酸酯和胺基烷基胺基磷酸酯)、硫羰胺基磷酸酯(thionophosphoramidate)、硫羰烷基膦酸酯、硫羰烷基磷酸三酯、和具有正常3’-5’連接的硼酸磷酸酯、該等酯的2’-5’連接的類似物,以及具有相反極性的那些,其中相鄰的核苷單元對3’-5’連接至5’-3’或2’-5’連接至5’-2’。還包括各種鹽、混合鹽和游離酸形式。在一些實施方式中,序列可以帶負電荷或帶正電荷。
可摻入該序列中的經修飾的核苷酸可以在核苷間鍵(例如,磷酸酯骨架)上經修飾。在本文中,在多核苷酸骨架之上下文中,短語「磷酸酯」和「磷酸二酯」可互換地使用。可以藉由用不同的取代基替代一或多個氧原子來修飾骨架磷酸酯基團。此外,經修飾的核苷和核苷酸可以包括用如本文所述之另一核苷間鍵對未經修飾的磷酸酯部分進行整體替代。經修飾的磷酸酯基團之實例包括但不限於硫代磷酸酯、亞磷酸硒酸酯、硼酸磷酸酯(boranophosphates/boranophosphate ester)、氫膦酸酯、胺基磷酸酯、二胺基磷酸酯、烷基或芳基膦酸酯和磷酸三酯。二硫代磷酸酯的兩個非連接氧都被硫替代。也可以藉由用氮(橋連的胺基磷酸酯)、硫(橋連的硫代磷酸酯)和碳(橋連的亞甲基膦酸酯)替代連接氧來修飾磷酸酯連接子。
提供α-硫代取代的磷酸酯部分以通過非天然硫代磷酸酯骨架連接賦予RNA和DNA聚合物穩定性。硫代磷酸酯DNA和RNA具有增強的核酸酶抗性,並因此在細胞環境中具有更長的半衰期。
在一些實施方式中,模板DNA包含一或多個核苷間修飾(例如,硫代磷酸酯修飾)。在一些實施方式中,左同源臂包含一或多個核苷間修飾(例如,硫代磷酸酯修飾)。在一些實施方式中,右同源臂包含一或多個核苷間修飾(例如,硫代磷酸酯修飾)。在一些實施方式中,左同源臂包含一或多個核苷間修飾(例如,硫代磷酸酯修飾),並且右同源臂包含一或多個核苷間修飾(例如,硫代磷酸酯修飾)。在一些實施方式中,左同源臂包含兩個核苷間修飾(例如,硫代磷酸酯修飾),並且右同源臂包含兩個核苷間修飾(例如,硫代磷酸酯修飾)。在一些實施方式中,硫代磷酸酯修飾在左同源臂的5'端和右同源臂的3'端。在一些實施方式中,左同源臂在右同源臂的5'並且該左同源臂包含在該左同源臂的5'端處的兩個硫代磷酸酯修飾,該右同源臂包含在該右同源臂的3'端處的兩個硫代磷酸酯修飾。在一些實施方式中,模板DNA係包含第一股和第二股的雙股DNA,其中該第一股包含在該第一股的5'端處的至少一個(例如,2個)硫代磷酸酯修飾或在該第一股的3'端處的至少一個(例如,2個)硫代磷酸酯修飾、或兩者。在一些實施方式中,第二股包含在該第二股的5'端處的至少一個(例如,2個)硫代磷酸酯修飾或在該第二股的3'端處的至少一個(例如,2個)硫代磷酸酯修飾、或兩者。
在特定的實施方式中,經修飾的核苷包括α-硫代-核苷(例如,5'-O-(1-硫代磷酸)-腺苷、5'-O-(1-硫代磷酸)-胞苷(a-硫代-胞苷)、5'-O-(1-硫代磷酸)-鳥苷、5'-O-(1-硫代磷酸)-尿苷、或5'-O-(1-硫代磷酸)-假尿苷)。
本文描述了可根據本揭露內容採用的其他核苷間鍵,包括不含有磷原子的核苷間鍵。
在一些實施方式中,序列可以包括一或多個細胞毒性核苷。例如,可以將細胞毒性核苷併入序列中,如雙功能修飾。細胞毒性核苷可以包括但不限於阿糖腺苷、5-氮雜胞苷、4'-硫代阿糖胞苷、環戊烯基胞嘧啶、克拉屈濱、氯法拉濱、阿糖胞苷、胞嘧啶***糖苷、1-(2-C-氰基-2-去氧-β-D-***-戊呋喃糖基)-胞嘧啶、地西他濱、5-氟尿嘧啶、氟達拉濱、氟尿苷、吉西他濱、替加氟和尿嘧啶的組合、替加氟((RS)-5-氟-1-(四氫呋喃-2-基)嘧啶-2,4(1H,3H)-二酮)、曲沙他濱、替紮西他濱、2'-去氧-2'-亞甲基胞苷(DMDC)和6-巰基嘌呤。其他實例包括氟達拉濱磷酸酯、N4-山崳醯基-1-β-D-***戊呋喃糖基胞嘧啶、N4-十八烷基-1-β-D-***戊呋喃糖基胞嘧啶、N4-棕櫚醯基-1-(2-C-氰基-2-去氧-β-D-***-戊呋喃糖基)胞嘧啶和P-4055(阿糖胞苷5’-反油酸酯)。
在一些實施方式中,序列包括一或多個轉錄後修飾(例如,加帽、切割、聚腺苷酸化、剪接、聚A序列、甲基化、醯化、磷酸化、離胺酸和精胺酸殘基的甲基化、乙醯化、以及硫醇基團和酪胺酸殘基的亞硝基化等)。該一或多個轉錄後修飾可為任何轉錄後修飾,如已經在RNA中鑒定出的多於一百種不同的核苷修飾中的任一種(Rozenski, J, Crain, P, 和McCloskey, J. (1999).The RNA Modification Database: 1999 update [RNA修飾資料庫:1999年更新].Nucl Acids Res [核酸研究] 27: 196-197)。在一些實施方式中,第一分離的核酸包含信使RNA(mRNA)。在一些實施方式中,mRNA包含至少一種選自下群組的核苷,該群組由以下組成:吡啶-4-酮核糖核苷、5-氮雜-尿苷、2-硫代-5-氮雜-尿苷、2-硫尿苷、4-硫代-假尿苷、2-硫代-假尿苷、5-羥基尿苷、3-甲基尿苷、5-羧基甲基-尿苷、1-羧基甲基-假尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸基甲基尿苷、1-牛磺酸基甲基-假尿苷、5-牛磺酸基甲基-2-硫代-尿苷、1-牛磺酸基甲基-4-硫代-尿苷、5-甲基-尿苷、1-甲基-假尿苷、4-硫代-1-甲基-假尿苷、2-硫代-1-甲基-假尿苷、1-甲基-1-去氮-假尿苷、2-硫代-1-甲基-1-去氮-假尿苷、二氫尿苷、二氫假尿苷、2-硫代-二氫尿苷、2-硫代-二氫假尿苷、2-甲氧基尿苷、2-甲氧基-4-硫代-尿苷、4-甲氧基-假尿苷和4-甲氧基-2-硫代-假尿苷。在一些實施方式中,mRNA包含至少一種選自下群組的核苷,該群組由以下組成:5-氮雜-胞苷、假異胞苷、3-甲基-胞苷、N4-乙醯基胞苷、5-甲醯基胞苷、N4-甲基胞苷、5-羥基甲基胞苷、1-甲基-假異胞苷、吡咯并-胞苷、吡咯并-假異胞苷、2-硫代-胞苷、2-硫代-5-甲基-胞苷、4-硫代-假異胞苷、4-硫代-1-甲基-假異胞苷、4-硫代-1-甲基-1-去氮-假異胞苷、1-甲基-1-去氮-假異胞苷、折布拉林(zebularine)、5-氮雜-折布拉林、5-甲基-折布拉林、5-氮雜-2-硫代-折布拉林、2-硫代-折布拉林、2-甲氧基-胞苷、2-甲氧基-5-甲基-胞苷、4-甲氧基-假異胞苷和4-甲氧基-1-甲基-假異胞苷。在一些實施方式中,mRNA包含至少一種選自下群組的核苷,該群組由以下組成:2-胺基嘌呤、2,6-二胺基嘌呤、7-去氮-腺嘌呤、7-去氮-8-氮雜-腺嘌呤、7-去氮-2-胺基嘌呤、7-去氮-8-氮雜-2-胺基嘌呤、7-去氮-2,6-二胺基嘌呤、7-去氮-8-氮雜-2,6-二胺基嘌呤、1-甲基腺苷、N6-甲基腺苷、N6-異戊烯基腺苷、N6-(順式-羥基異戊烯基)腺苷、2-甲基硫代-N6-(順式-羥基異戊烯基)腺苷、N6-甘胺醯胺甲醯基腺苷、N6-蘇胺醯胺甲醯基腺苷、2-甲基硫代-N6-蘇胺醯胺甲醯基腺苷、N6,N6-二甲基腺苷、7-甲基腺嘌呤、2-甲基硫代-腺嘌呤和2-甲氧基-腺嘌呤。在一些實施方式中,mRNA包含至少一種選自下群組的核苷,該群組由以下組成:肌苷、1-甲基-肌苷、懷俄苷、懷丁苷、7-去氮-鳥苷、7-去氮-8-氮雜-鳥苷、6-硫代-鳥苷、6-硫代-7-去氮-鳥苷、6-硫代-7-去氮-8-氮雜-鳥苷、7-甲基-鳥苷、6-硫代-7-甲基-鳥苷、7-甲基肌苷、6-甲氧基-鳥苷、1-甲基鳥苷、N2-甲基鳥苷、N2,N2-二甲基鳥苷、8-側氧基-鳥苷、7-甲基-8-側氧基-鳥苷、1-甲基-6-硫代-鳥苷、N2-甲基-6-硫代-鳥苷、和N2,N2-二甲基-6-硫代-鳥苷。
序列沿著分子的整個長度可以被或者可以不被均一地修飾。例如,一或多種或所有類型的核苷酸(例如,天然存在的核苷酸、嘌呤或嘧啶,或A、G、U、C、I、pU中的任一或多種或全部)在序列中,或在其給定的預定序列區域中可以被或可以不被均一地修飾。在一些實施方式中,序列包括假尿苷。在一些實施方式中,序列包括肌苷,該肌苷可以説明免疫系統將序列相對於病毒RNA表徵為內源性。肌苷的摻入還可以介導改善的RNA穩定性/減少降解。參見例如,Yu, Z.等人 (2015) RNA editing by ADAR1 marks dsRNA as 「self」 [ADAR1進行的RNA編輯將dsRNA標記為「自我」].Cell Res [細胞研究]. 25, 1283-1284,將該文獻藉由援引以其全文併入。
當本文揭露的基因編輯系統包含編碼本文揭露的Cas12i多肽的核酸(例如,mRNA分子)時,在適用的情況下,這樣的核酸分子可以含有本文揭露的任何修飾。 D. Cas12i 多肽
在一些實施方式中,本揭露內容之組成物或系統包括如WO/2019/178427中所述之Cas12i多肽,出於本文引用的主題和目的將該文獻的相關揭露內容藉由援引併入。
在一些實施方式中,本揭露內容之基因編輯系統 包含本文所述之Cas12i2多肽(例如,包含SEQ ID NO: 222和/或由SEQ ID NO: 221(或其T被U替代的版本)編碼的多肽)。在一些實施方式中,Cas12i2多肽包含至少一個RuvC結構域。在一些實施方式中,本揭露內容之基因編輯系統 包含編碼Cas12i多肽的核酸分子(例如,DNA分子或多核糖核苷酸分子)。
編碼本文所述之Cas12i2多肽的核酸序列可以與參考核酸序列(例如,SEQ ID NO: 221(或其T被U替代的版本))基本上相同。在一些實施方式中,Cas12i2多肽由核酸編碼,該核酸包含與參考核酸序列(例如,SEQ ID NO: 221(或其T被U替代的版本))具有至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約91%、至少約92%、至少約93%、至少約94%、至少約95%、至少約96%、至少約97%、至少約98%、至少約99%、或至少約99.5%序列同一性的序列。可以藉由檢查兩個最佳比對的核酸序列或藉由使用軟體程式或演算法(例如,BLAST、ALIGN、CLUSTAL)使用標準參數人工確定兩個此類核酸之間的同一性百分比。兩個核酸序列基本上相同的一個指示係核酸分子在溫度和離子強度的嚴格條件下(例如,在中至高嚴格度的範圍內)與另一核酸分子的互補序列雜交。參見例如,Tijssen, 「Hybridization with Nucleic Acid Probes.Part I. Theory and Nucleic Acid Preparation [與核酸探針雜交.第I部分.理論和核酸製備]」(Laboratory Techniques in Biochemistry and Molecular Biology [生物化學和分子生物學實驗室技術],第24卷)。
在一些實施方式中,Cas12i2多肽由核酸序列編碼,該核酸序列與參考核酸序列(例如,SEQ ID NO: 221(或其T被U替代的版本))具有至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約91%、至少約92%、至少約93%、至少約94%、至少約95%、至少約96%、至少約97%、至少約98%、至少約99%、或更高的序列同一性,但不是100%序列同一性。
在一些實施方式中,本揭露內容之Cas12i2多肽包含與SEQ ID NO: 222具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的多肽序列。
在一些實施方式中,本揭露內容描述了Cas12i2多肽,該Cas12i2多肽與一或多個參考多肽具有指定程度的胺基酸序列同一性,例如,與SEQ ID NO: 222的胺基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%,至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或甚至至少99%但不是100%的序列同一性。同源性或同一性可以例如使用如本文所述之程式(如BLAST、ALIGN或CLUSTAL)藉由胺基酸序列比對來確定。
還提供了本揭露內容之Cas12i2多肽,該Cas12i2多肽具有酶活性(例如,核酸酶或內切核酸酶活性),並且當使用任何先前描述的比對方法比對時,包含與SEQ ID NO: 222的胺基酸序列差異50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、或0個胺基酸殘基的胺基酸序列。
在一些實施方式中,Cas12i2多肽相對於SEQ ID NO: 222可以含有一或多個突變,例如在位置D581、G624、F626、P868、I926、V1030、E1035、S1046、或其任何組合處。在一些情況下,一或多個突變係胺基酸取代,例如,D581R、G624R、F626R、P868T、I926R、V1030G、E1035R、S1046G、或其組合。
在一些實施方式中,Cas12i2多肽包含具有 SEQ ID NO: 223、SEQ ID NO: 224、SEQ ID NO: 225、SEQ ID NO: 226、或SEQ ID NO: 227的序列的多肽。在一些實例中,Cas12i2多肽在位置D581、D911、I926、和V1030處含有突變。這種Cas12i2多肽可以含有胺基酸取代D581R、D911R、I926R、和V1030G(例如,SEQ ID NO: 223)。在一些實例中,Cas12i2多肽在位置D581、I926、和V1030處含有突變。這種Cas12i2多肽可以含有胺基酸取代D581R、I926R、和V1030G(例如,SEQ ID NO: 224)。在一些實例中,Cas12i2多肽可以在位置D581、I926、V1030、和S1046處含有突變。這種Cas12i2多肽可以含有胺基酸取代D581R、I926R、V1030G、和S1046G(例如,SEQ ID NO: 225)。在一些實例中,Cas12i2多肽可以在位置D581、G624、F626、I926、V1030、E1035、和S1046處含有突變。這種Cas12i2多肽可以含有胺基酸取代D581R、G624R、F626R、I926R、V1030G、E1035R、和S1046G(例如,SEQ ID NO: 226)。在一些實例中,Cas12i2多肽可以在位置D581、G624、F626、P868、I926、V1030、E1035、和S1046處含有突變。這種Cas12i2多肽可以含有胺基酸取代D581R、G624R、F626R、P868T、I926R、V1030G、E1035R、和S1046G(例如,SEQ ID NO: 227)。
在一些實施方式中,本揭露內容之Cas12i2多肽包含與SEQ ID NO: 223、SEQ ID NO: 224、SEQ ID NO: 225、SEQ ID NO: 226、或SEQ ID NO: 227具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的多肽序列。在一些實施方式中,與SEQ ID NO: 223、SEQ ID NO: 224、SEQ ID NO: 225、SEQ ID NO: 226、或SEQ ID NO: 227具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的Cas12i2多肽保持將該多肽與其相應的親本/參考序列區分開的胺基酸變化(或該等變化中的至少1、2、3個等)。
在一些實施方式中,本揭露內容描述了Cas12i2多肽,該Cas12i2多肽與一或多個參考多肽具有指定程度的胺基酸序列同一性,例如,與SEQ ID NO: 223、SEQ ID NO: 224、SEQ ID NO: 225、SEQ ID NO: 226、或SEQ ID NO: 227的胺基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%,至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或甚至至少99%但不是100%的序列同一性。同源性或同一性可以例如使用如本文所述之程式(如BLAST、ALIGN或CLUSTAL)藉由胺基酸序列比對來確定。
還提供了本揭露內容之Cas12i2多肽,該Cas12i2多肽具有酶活性(例如,核酸酶或內切核酸酶活性),並且當使用任何先前描述的比對方法比對時,包含與SEQ ID NO: 223、SEQ ID NO: 224、SEQ ID NO: 225、SEQ ID NO: 226、或SEQ ID NO: 227的胺基酸序列差異50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、或0個胺基酸殘基的胺基酸序列。
在一些實施方式中,本揭露內容之組成物包括本文所述之Cas12i4多肽(例如,包含SEQ ID NO: 253和/或由SEQ ID NO: 252(或其T被U替代的版本)編碼的多肽)。在一些實施方式中,Cas12i4多肽包含至少一個RuvC結構域。
編碼本文所述之Cas12i4多肽的核酸序列可以與參考核酸序列(例如,SEQ ID NO: 252(或其T被U替代的版本))基本上相同。在一些實施方式中,Cas12i4多肽由核酸編碼,該核酸包含與參考核酸序列(例如,SEQ ID NO: 252(或其T被U替代的版本))具有至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約91%、至少約92%、至少約93%、至少約94%、至少約95%、至少約96%、至少約97%、至少約98%、至少約99%、或至少約99.5%序列同一性的序列。可以藉由檢查兩個最佳比對的核酸序列或藉由使用軟體程式或演算法(例如,BLAST、ALIGN、CLUSTAL)使用標準參數人工確定兩個此類核酸之間的同一性百分比。兩個核酸序列基本上相同的一個指示係核酸分子在溫度和離子強度的嚴格條件下(例如,在中至高嚴格度的範圍內)與另一核酸分子的互補序列雜交。
在一些實施方式中,Cas12i4多肽由核酸序列編碼,該核酸序列與參考核酸序列(例如,SEQ ID NO: 252(或其T被U替代的版本))具有至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約91%、至少約92%、至少約93%、至少約94%、至少約95%、至少約96%、至少約97%、至少約98%、至少約99%、或更高的序列同一性,但不是100%序列同一性。
在一些實施方式中,本揭露內容之Cas12i4多肽包含與SEQ ID NO: 253具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的多肽序列。
在一些實施方式中,本揭露內容描述了Cas12i4多肽,該Cas12i4多肽與一或多個參考多肽具有指定程度的胺基酸序列同一性,例如,與SEQ ID NO: 253的胺基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%,至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或甚至至少99%但不是100%的序列同一性。同源性或同一性可以例如使用如本文所述之程式(如BLAST、ALIGN或CLUSTAL)藉由胺基酸序列比對來確定。
還提供了本揭露內容之Cas12i4多肽,該Cas12i4多肽具有酶活性(例如,核酸酶或內切核酸酶活性),並且當使用任何先前描述的比對方法比對時,包含與SEQ ID NO: 253的胺基酸序列差異50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、或0個胺基酸殘基的胺基酸序列。
在一些實施方式中,Cas12i4多肽包含具有SEQ ID NO: 254或SEQ ID NO: 255的序列的多肽。
在一些實施方式中,本揭露內容之Cas12i4多肽包含與SEQ ID NO: 254或SEQ ID NO: 255具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的多肽序列。在一些實施方式中,與SEQ ID NO: 254或SEQ ID NO: 255具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的Cas12i4多肽保持將該多肽與其相應的親本/參考序列區分開的胺基酸變化(或該等變化中的至少1、2、3個等)。
在一些實施方式中,本揭露內容描述了Cas12i4多肽,該Cas12i4多肽與一或多個參考多肽具有指定程度的胺基酸序列同一性,例如,與SEQ ID NO: 254或SEQ ID NO: 255的胺基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%,至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或甚至至少99%但不是100%的序列同一性。同源性或同一性可以例如使用如本文所述之程式(如BLAST、ALIGN或CLUSTAL)藉由胺基酸序列比對來確定。
還提供了本揭露內容之Cas12i4多肽,該Cas12i4多肽具有酶活性(例如,核酸酶或內切核酸酶活性),並且當使用任何先前描述的比對方法比對時,包含與SEQ ID NO: 254或SEQ ID NO: 255的胺基酸序列差異50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、或0個胺基酸殘基的胺基酸序列。
在一些實施方式中,本揭露內容之組成物包括本文所述之Cas12i1多肽(例如,包含SEQ ID NO: 265的多肽)。在一些實施方式中,Cas12i4多肽包含至少一個RuvC結構域。
在一些實施方式中,本揭露內容之Cas12i1多肽包含與SEQ ID NO: 265具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的多肽序列。
在一些實施方式中,本揭露內容描述了Cas12i1多肽,該Cas12i1多肽與一或多個參考多肽具有指定程度的胺基酸序列同一性,例如,與SEQ ID NO: 265的胺基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%,至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或甚至至少99%但不是100%的序列同一性。同源性或同一性可以例如使用如本文所述之程式(如BLAST、ALIGN或CLUSTAL)藉由胺基酸序列比對來確定。
還提供了本揭露內容之Cas12i1多肽,該Cas12i1多肽具有酶活性(例如,核酸酶或內切核酸酶活性),並且當使用任何先前描述的比對方法比對時,包含與SEQ ID NO: 265的胺基酸序列差異50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、或0個胺基酸殘基的胺基酸序列。
在一些實施方式中,本揭露內容之組成物包括本文所述之Cas12i3多肽(例如,包含SEQ ID NO: 266的多肽)。在一些實施方式中,Cas12i4多肽包含至少一個RuvC結構域。
在一些實施方式中,本揭露內容之Cas12i3多肽包含與SEQ ID NO: 266具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的多肽序列。
在一些實施方式中,本揭露內容描述了Cas12i3多肽,該Cas12i3多肽與一或多個參考多肽具有指定程度的胺基酸序列同一性,例如與SEQ ID NO: 266的胺基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%,至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或甚至至少99%但不是100%的序列同一性。同源性或同一性可以例如使用如本文所述之程式(如BLAST、ALIGN或CLUSTAL)藉由胺基酸序列比對來確定。
還提供了本揭露內容之Cas12i3多肽,該Cas12i3多肽具有酶活性(例如,核酸酶或內切核酸酶活性),並且當使用任何先前描述的比對方法比對時,包含與SEQ ID NO: 266的胺基酸序列差異50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、或0個胺基酸殘基的胺基酸序列。
儘管本文所述之變化可為一或多個胺基酸的變化,但Cas12i多肽的變化也可為實質性的,例如作為胺基和/或羧基末端延伸的多肽融合。例如,Cas12i多肽可以含有額外的肽,例如,一或多個肽。額外的肽之實例可以包括用於標記的表位肽,如多組胺酸標籤(His標籤)、Myc和FLAG。在一些實施方式中,可以將本文所述之Cas12i多肽與可檢測部分融合,如螢光蛋白(例如,綠色螢光蛋白(GFP)或黃色螢光蛋白(YFP))。
在一些實施方式中,Cas12i多肽包含至少一個(例如,兩個、三個、四個、五個、六個或更多個)核定位訊號(NLS)。在一些實施方式中,Cas12i多肽包含至少一個(例如,兩個、三個、四個、五個、六個或更多個)出核訊號(NES)。在一些實施方式中,Cas12i多肽包含至少一個(例如,兩個、三個、四個、五個、六個或更多)NLS和至少一個(例如,兩個、三個、四個、五個、六個或更多個)NES。
在一些實施方式中,本文所述之Cas12i多肽可為自我滅活的。參見Epstein等人, 「Engineering a Self-Inactivating CRISPR System for AAV Vectors [改造用於AAV載體的自我滅活的CRISPR系統],」 Mol. Ther. [分子療法], 24 (2016): S50,將該文獻藉由援引以其全文併入。
在一些實施方式中,編碼本文所述之Cas12i多肽的核苷酸序列可以經密碼子優化以用於特定的宿主細胞或生物。例如,核酸可以經密碼子優化以用於任何非人真核生物(包括小鼠、大鼠、兔、狗、家畜或非人靈長類動物)。密碼子使用表係易於獲得的,例如在kazusa.orjp/codon/的萬維網站上可獲得的「密碼子使用數據庫(Codon Usage Database)」中,並且該等表可以按多種方式進行改編。參見Nakamura等人 Nucl. Acids Res.[核酸研究] 28:292 (2000),將其藉由援引以其全文併入本文。用於密碼子優化特定序列以在特定宿主細胞中表現的電腦演算法也是可得的,如基因製造(Gene Forge)(Aptagen公司;賓夕法尼亞州雅各斯(Jacobus, PA))。在一些實例中,編碼如本文揭露的Cas12i多肽(如Cas12i2多肽)的核酸可為mRNA分子,其可為經密碼子優化的。
示例性Cas12i多肽序列和相應的核苷酸序列列於 6中。 [ 6] . Cas12i TTR 序列
SEQ ID NO: 序列 描述 
    221 ATGAGCAGCGCGATCAAAAGCTACAAGAGCGTTCTGCGTCCGAACGAGCGTAAGAACCAACTGCTGAAAAGCACCATTCAGTGCCTGGAAGACGGTAGCGCGTTCTTTTTCAAGATGCTGCAAGGCCTGTTTGGTGGCATCACCCCGGAGATTGTTCGTTTCAGCACCGAACAGGAGAAACAGCAACAGGATATCGCGCTGTGGTGCGCGGTTAACTGGTTCCGTCCGGTGAGCCAAGACAGCCTGACCCACACCATTGCGAGCGATAACCTGGTGGAGAAGTTTGAGGAATACTATGGTGGCACCGCGAGCGACGCGATCAAACAGTACTTCAGCGCGAGCATTGGCGAAAGCTACTATTGGAACGACTGCCGTCAACAGTACTATGATCTGTGCCGTGAGCTGGGTGTTGAGGTGAGCGACCTGACCCATGATCTGGAGATCCTGTGCCGTGAAAAGTGCCTGGCGGTTGCGACCGAGAGCAACCAGAACAACAGCATCATTAGCGTTCTGTTTGGCACCGGCGAAAAAGAGGACCGTAGCGTGAAACTGCGTATCACCAAGAAAATTCTGGAGGCGATCAGCAACCTGAAAGAAATCCCGAAGAACGTTGCGCCGATTCAAGAGATCATTCTGAACGTGGCGAAAGCGACCAAGGAAACCTTCCGTCAGGTGTATGCGGGTAACCTGGGTGCGCCGAGCACCCTGGAGAAATTTATCGCGAAGGACGGCCAAAAAGAGTTCGATCTGAAGAAACTGCAGACCGACCTGAAGAAAGTTATTCGTGGTAAAAGCAAGGAGCGTGATTGGTGCTGCCAGGAAGAGCTGCGTAGCTACGTGGAGCAAAACACCATCCAGTATGACCTGTGGGCGTGGGGCGAAATGTTCAACAAAGCGCACACCGCGCTGAAAATCAAGAGCACCCGTAACTACAACTTTGCGAAGCAACGTCTGGAACAGTTCAAAGAGATTCAGAGCCTGAACAACCTGCTGGTTGTGAAGAAGCTGAACGACTTTTTCGATAGCGAATTTTTCAGCGGCGAGGAAACCTACACCATCTGCGTTCACCATCTGGGTGGCAAGGACCTGAGCAAACTGTATAAGGCGTGGGAGGATGATCCGGCGGACCCGGAAAACGCGATTGTGGTTCTGTGCGACGATCTGAAAAACAACTTTAAGAAAGAGCCGATCCGTAACATTCTGCGTTACATCTTCACCATTCGTCAAGAATGCAGCGCGCAGGACATCCTGGCGGCGGCGAAGTACAACCAACAGCTGGATCGTTATAAAAGCCAAAAGGCGAACCCGAGCGTTCTGGGTAACCAGGGCTTTACCTGGACCAACGCGGTGATCCTGCCGGAGAAGGCGCAGCGTAACGACCGTCCGAACAGCCTGGATCTGCGTATTTGGCTGTACCTGAAACTGCGTCACCCGGACGGTCGTTGGAAGAAACACCATATCCCGTTCTACGATACCCGTTTCTTCCAAGAAATTTATGCGGCGGGCAACAGCCCGGTTGACACCTGCCAGTTTCGTACCCCGCGTTTCGGTTATCACCTGCCGAAACTGACCGATCAGACCGCGATCCGTGTTAACAAGAAACATGTGAAAGCGGCGAAGACCGAGGCGCGTATTCGTCTGGCGATCCAACAGGGCACCCTGCCGGTGAGCAACCTGAAGATCACCGAAATTAGCGCGACCATCAACAGCAAAGGTCAAGTGCGTATTCCGGTTAAGTTTGACGTGGGTCGTCAAAAAGGCACCCTGCAGATCGGTGACCGTTTCTGCGGCTACGATCAAAACCAGACCGCGAGCCACGCGTATAGCCTGTGGGAAGTGGTTAAAGAGGGTCAATACCATAAAGAGCTGGGCTGCTTTGTTCGTTTCATCAGCAGCGGTGACATCGTGAGCATTACCGAGAACCGTGGCAACCAATTTGATCAGCTGAGCTATGAAGGTCTGGCGTACCCGCAATATGCGGACTGGCGTAAGAAAGCGAGCAAGTTCGTGAGCCTGTGGCAGATCACCAAGAAAAACAAGAAAAAGGAAATCGTGACCGTTGAAGCGAAAGAGAAGTTTGACGCGATCTGCAAGTACCAGCCGCGTCTGTATAAATTCAACAAGGAGTACGCGTATCTGCTGCGTGATATTGTTCGTGGCAAAAGCCTGGTGGAACTGCAACAGATTCGTCAAGAGATCTTTCGTTTCATTGAACAGGACTGCGGTGTTACCCGTCTGGGCAGCCTGAGCCTGAGCACCCTGGAAACCGTGAAAGCGGTTAAGGGTATCATTTACAGCTATTTTAGCACCGCGCTGAACGCGAGCAAGAACAACCCGATCAGCGACGAACAGCGTAAAGAGTTTGATCCGGAACTGTTCGCGCTGCTGGAAAAGCTGGAGCTGATTCGTACCCGTAAAAAGAAACAAAAAGTGGAACGTATCGCGAACAGCCTGATTCAGACCTGCCTGGAGAACAACATCAAGTTCATTCGTGGTGAAGGCGACCTGAGCACCACCAACAACGCGACCAAGAAAAAGGCGAACAGCCGTAGCATGGATTGGTTGGCGCGTGGTGTTTTTAACAAAATCCGTCAACTGGCGCCGATGCACAACATTACCCTGTTCGGTTGCGGCAGCCTGTACACCAGCCACCAGGACCCGCTGGTGCATCGTAACCCGGATAAAGCGATGAAGTGCCGTTGGGCGGCGATCCCGGTTAAGGACATTGGCGATTGGGTGCTGCGTAAGCTGAGCCAAAACCTGCGTGCGAAAAACATCGGCACCGGCGAGTACTATCACCAAGGTGTTAAAGAGTTCCTGAGCCATTATGAACTGCAGGACCTGGAGGAAGAGCTGCTGAAGTGGCGTAGCGATCGTAAAAGCAACATTCCGTGCTGGGTGCTGCAGAACCGTCTGGCGGAGAAGCTGGGCAACAAAGAAGCGGTGGTTTACATCCCGGTTCGTGGTGGCCGTATTTATTTTGCGACCCACAAGGTGGCGACCGGTGCGGTGAGCATCGTTTTCGACCAAAAACAAGTGTGGGTTTGCAACGCGGATCATGTTGCGGCGGCGAACATCGCGCTGACCGTGAAGGGTATTGGCGAACAAAGCAGCGACGAAGAGAACCCGGATGGTAGCCGTATCAAACTGCAGCTGACCAGC     編碼Cas12i2的核苷酸序列
222 MSSAIKSYKSVLRPNERKNQLLKSTIQCLEDGSAFFFKMLQGLFGGITPEIVRFSTEQEKQQQDIALWCAVNWFRPVSQDSLTHTIASDNLVEKFEEYYGGTASDAIKQYFSASIGESYYWNDCRQQYYDLCRELGVEVSDLTHDLEILCREKCLAVATESNQNNSIISVLFGTGEKEDRSVKLRITKKILEAISNLKEIPKNVAPIQEIILNVAKATKETFRQVYAGNLGAPSTLEKFIAKDGQKEFDLKKLQTDLKKVIRGKSKERDWCCQEELRSYVEQNTIQYDLWAWGEMFNKAHTALKIKSTRNYNFAKQRLEQFKEIQSLNNLLVVKKLNDFFDSEFFSGEETYTICVHHLGGKDLSKLYKAWEDDPADPENAIVVLCDDLKNNFKKEPIRNILRYIFTIRQECSAQDILAAAKYNQQLDRYKSQKANPSVLGNQGFTWTNAVILPEKAQRNDRPNSLDLRIWLYLKLRHPDGRWKKHHIPFYDTRFFQEIYAAGNSPVDTCQFRTPRFGYHLPKLTDQTAIRVNKKHVKAAKTEARIRLAIQQGTLPVSNLKITEISATINSKGQVRIPVKFDVGRQKGTLQIGDRFCGYDQNQTASHAYSLWEVVKEGQYHKELGCFVRFISSGDIVSITENRGNQFDQLSYEGLAYPQYADWRKKASKFVSLWQITKKNKKKEIVTVEAKEKFDAICKYQPRLYKFNKEYAYLLRDIVRGKSLVELQQIRQEIFRFIEQDCGVTRLGSLSLSTLETVKAVKGIIYSYFSTALNASKNNPISDEQRKEFDPELFALLEKLELIRTRKKKQKVERIANSLIQTCLENNIKFIRGEGDLSTTNNATKKKANSRSMDWLARGVFNKIRQLAPMHNITLFGCGSLYTSHQDPLVHRNPDKAMKCRWAAIPVKDIGDWVLRKLSQNLRAKNIGTGEYYHQGVKEFLSHYELQDLEEELLKWRSDRKSNIPCWVLQNRLAEKLGNKEAVVYIPVRGGRIYFATHKVATGAVSIVFDQKQVWVCNADHVAAANIALTVKGIGEQSSDEENPDGSRIKLQLTS Cas12i2胺基酸序列
223 MSSAIKSYKS VLRPNERKNQ LLKSTIQCLE DGSAFFFKML QGLFGGITPE IVRFSTEQEK QQQDIALWCA VNWFRPVSQD SLTHTIASDN LVEKFEEYYG GTASDAIKQY FSASIGESYY WNDCRQQYYD LCRELGVEVS DLTHDLEILC REKCLAVATE SNQNNSIISV LFGTGEKEDR SVKLRITKKI LEAISNLKEI PKNVAPIQEI ILNVAKATKE TFRQVYAGNL GAPSTLEKFI AKDGQKEFDL KKLQTDLKKV IRGKSKERDW CCQEELRSYV EQNTIQYDLW AWGEMFNKAH TALKIKSTRN YNFAKQRLEQ FKEIQSLNNL LVVKKLNDFF DSEFFSGEET YTICVHHLGG KDLSKLYKAW EDDPADPENA IVVLCDDLKN NFKKEPIRNI LRYIFTIRQE CSAQDILAAA KYNQQLDRYK SQKANPSVLG NQGFTWTNAV ILPEKAQRND RPNSLDLRIW LYLKLRHPDG RWKKHHIPFY DTRFFQEIYA AGNSPVDTCQ FRTPRFGYHL PKLTDQTAIR VNKKHVKAAK TEARIRLAIQ QGTLPVSNLK ITEISATINS KGQVRIPVKF RVGRQKGTLQ IGDRFCGYDQ NQTASHAYSL WEVVKEGQYH KELGCFVRFI SSGDIVSITE NRGNQFDQLS YEGLAYPQYA DWRKKASKFV SLWQITKKNK KKEIVTVEAK EKFDAICKYQ PRLYKFNKEY AYLLRDIVRG KSLVELQQIR QEIFRFIEQD CGVTRLGSLS LSTLETVKAV KGIIYSYFST ALNASKNNPI SDEQRKEFDP ELFALLEKLE LIRTRKKKQK VERIANSLIQ TCLENNIKFI RGEGDLSTTN NATKKKANSR SMDWLARGVF NKIRQLAPMH NITLFGCGSL YTSHQDPLVH RNPDKAMKCR WAAIPVKDIG RWVLRKLSQN LRAKNRGTGE YYHQGVKEFL SHYELQDLEE ELLKWRSDRK SNIPCWVLQN RLAEKLGNKE AVVYIPVRGG RIYFATHKVA TGAVSIVFDQ KQVWVCNADH VAAANIALTG KGIGEQSSDE ENPDGSRIKL QLTS PCT/US2021/025257的SEQ ID NO: 3的變體Cas12i2
224 MSSAIKSYKS VLRPNERKNQ LLKSTIQCLE DGSAFFFKML QGLFGGITPE IVRFSTEQEK QQQDIALWCA VNWFRPVSQD SLTHTIASDN LVEKFEEYYG GTASDAIKQY FSASIGESYY WNDCRQQYYD LCRELGVEVS DLTHDLEILC REKCLAVATE SNQNNSIISV LFGTGEKEDR SVKLRITKKI LEAISNLKEI PKNVAPIQEI ILNVAKATKE TFRQVYAGNL GAPSTLEKFI AKDGQKEFDL KKLQTDLKKV IRGKSKERDW CCQEELRSYV EQNTIQYDLW AWGEMFNKAH TALKIKSTRN YNFAKQRLEQ FKEIQSLNNL LVVKKLNDFF DSEFFSGEET YTICVHHLGG KDLSKLYKAW EDDPADPENA IVVLCDDLKN NFKKEPIRNI LRYIFTIRQE CSAQDILAAA KYNQQLDRYK SQKANPSVLG NQGFTWTNAV ILPEKAQRND RPNSLDLRIW LYLKLRHPDG RWKKHHIPFY DTRFFQEIYA AGNSPVDTCQ FRTPRFGYHL PKLTDQTAIR VNKKHVKAAK TEARIRLAIQ QGTLPVSNLK ITEISATINS KGQVRIPVKF RVGRQKGTLQ IGDRFCGYDQ NQTASHAYSL WEVVKEGQYH KELGCFVRFI SSGDIVSITE NRGNQFDQLS YEGLAYPQYA DWRKKASKFV SLWQITKKNK KKEIVTVEAK EKFDAICKYQ PRLYKFNKEY AYLLRDIVRG KSLVELQQIR QEIFRFIEQD CGVTRLGSLS LSTLETVKAV KGIIYSYFST ALNASKNNPI SDEQRKEFDP ELFALLEKLE LIRTRKKKQK VERIANSLIQ TCLENNIKFI RGEGDLSTTN NATKKKANSR SMDWLARGVF NKIRQLAPMH NITLFGCGSL YTSHQDPLVH RNPDKAMKCR WAAIPVKDIG DWVLRKLSQN LRAKNRGTGE YYHQGVKEFL SHYELQDLEE ELLKWRSDRK SNIPCWVLQN RLAEKLGNKE AVVYIPVRGG RIYFATHKVA TGAVSIVFDQ KQVWVCNADH VAAANIALTG KGIGEQSSDE ENPDGSRIKL QLTS PCT/US2021/025257的SEQ ID NO: 4的變體Cas12i2
225 MSSAIKSYKS VLRPNERKNQ LLKSTIQCLE DGSAFFFKML QGLFGGITPE IVRFSTEQEK QQQDIALWCA VNWFRPVSQD SLTHTIASDN LVEKFEEYYG GTASDAIKQY FSASIGESYY WNDCRQQYYD LCRELGVEVS DLTHDLEILC REKCLAVATE SNQNNSIISV LFGTGEKEDR SVKLRITKKI LEAISNLKEI PKNVAPIQEI ILNVAKATKE TFRQVYAGNL GAPSTLEKFI AKDGQKEFDL KKLQTDLKKV IRGKSKERDW CCQEELRSYV EQNTIQYDLW AWGEMFNKAH TALKIKSTRN YNFAKQRLEQ FKEIQSLNNL LVVKKLNDFF DSEFFSGEET YTICVHHLGG KDLSKLYKAW EDDPADPENA IVVLCDDLKN NFKKEPIRNI LRYIFTIRQE CSAQDILAAA KYNQQLDRYK SQKANPSVLG NQGFTWTNAV ILPEKAQRND RPNSLDLRIW LYLKLRHPDG RWKKHHIPFY DTRFFQEIYA AGNSPVDTCQ FRTPRFGYHL PKLTDQTAIR VNKKHVKAAK TEARIRLAIQ QGTLPVSNLK ITEISATINS KGQVRIPVKF RVGRQKGTLQ IGDRFCGYDQ NQTASHAYSL WEVVKEGQYH KELGCFVRFI SSGDIVSITE NRGNQFDQLS YEGLAYPQYA DWRKKASKFV SLWQITKKNK KKEIVTVEAK EKFDAICKYQ PRLYKFNKEY AYLLRDIVRG KSLVELQQIR QEIFRFIEQD CGVTRLGSLS LSTLETVKAV KGIIYSYFST ALNASKNNPI SDEQRKEFDP ELFALLEKLE LIRTRKKKQK VERIANSLIQ TCLENNIKFI RGEGDLSTTN NATKKKANSR SMDWLARGVF NKIRQLAPMH NITLFGCGSL YTSHQDPLVH RNPDKAMKCR WAAIPVKDIG DWVLRKLSQN LRAKNRGTGE YYHQGVKEFL SHYELQDLEE ELLKWRSDRK SNIPCWVLQN RLAEKLGNKE AVVYIPVRGG RIYFATHKVA TGAVSIVFDQ KQVWVCNADH VAAANIALTG KGIGEQSSDE ENPDGGRIKL QLTS PCT/US2021/025257的SEQ ID NO: 5的變體Cas12i2
226 MSSAIKSYKS VLRPNERKNQ LLKSTIQCLE DGSAFFFKML QGLFGGITPE IVRFSTEQEK QQQDIALWCA VNWFRPVSQD SLTHTIASDN LVEKFEEYYG GTASDAIKQY FSASIGESYY WNDCRQQYYD LCRELGVEVS DLTHDLEILC REKCLAVATE SNQNNSIISV LFGTGEKEDR SVKLRITKKI LEAISNLKEI PKNVAPIQEI ILNVAKATKE TFRQVYAGNL GAPSTLEKFI AKDGQKEFDL KKLQTDLKKV IRGKSKERDW CCQEELRSYV EQNTIQYDLW AWGEMFNKAH TALKIKSTRN YNFAKQRLEQ FKEIQSLNNL LVVKKLNDFF DSEFFSGEET YTICVHHLGG KDLSKLYKAW EDDPADPENA IVVLCDDLKN NFKKEPIRNI LRYIFTIRQE CSAQDILAAA KYNQQLDRYK SQKANPSVLG NQGFTWTNAV ILPEKAQRND RPNSLDLRIW LYLKLRHPDG RWKKHHIPFY DTRFFQEIYA AGNSPVDTCQ FRTPRFGYHL PKLTDQTAIR VNKKHVKAAK TEARIRLAIQ QGTLPVSNLK ITEISATINS KGQVRIPVKF RVGRQKGTLQ IGDRFCGYDQ NQTASHAYSL WEVVKEGQYH KELRCRVRFI SSGDIVSITE NRGNQFDQLS YEGLAYPQYA DWRKKASKFV SLWQITKKNK KKEIVTVEAK EKFDAICKYQ PRLYKFNKEY AYLLRDIVRG KSLVELQQIR QEIFRFIEQD CGVTRLGSLS LSTLETVKAV KGIIYSYFST ALNASKNNPI SDEQRKEFDP ELFALLEKLE LIRTRKKKQK VERIANSLIQ TCLENNIKFI RGEGDLSTTN NATKKKANSR SMDWLARGVF NKIRQLAPMH NITLFGCGSL YTSHQDPLVH RNPDKAMKCR WAAIPVKDIG DWVLRKLSQN LRAKNRGTGE YYHQGVKEFL SHYELQDLEE ELLKWRSDRK SNIPCWVLQN RLAEKLGNKE AVVYIPVRGG RIYFATHKVA TGAVSIVFDQ KQVWVCNADH VAAANIALTG KGIGRQSSDE ENPDGGRIKL QLTS PCT/US2021/025257的SEQ ID NO: 495的變體Cas12i2
227 MSSAIKSYKS VLRPNERKNQ LLKSTIQCLE DGSAFFFKML QGLFGGITPE IVRFSTEQEK QQQDIALWCA VNWFRPVSQD SLTHTIASDN LVEKFEEYYG GTASDAIKQY FSASIGESYY WNDCRQQYYD LCRELGVEVS DLTHDLEILC REKCLAVATE SNQNNSIISV LFGTGEKEDR SVKLRITKKI LEAISNLKEI PKNVAPIQEI ILNVAKATKE TFRQVYAGNL GAPSTLEKFI AKDGQKEFDL KKLQTDLKKV IRGKSKERDW CCQEELRSYV EQNTIQYDLW AWGEMFNKAH TALKIKSTRN YNFAKQRLEQ FKEIQSLNNL LVVKKLNDFF DSEFFSGEET YTICVHHLGG KDLSKLYKAW EDDPADPENA IVVLCDDLKN NFKKEPIRNI LRYIFTIRQE CSAQDILAAA KYNQQLDRYK SQKANPSVLG NQGFTWTNAV ILPEKAQRND RPNSLDLRIW LYLKLRHPDG RWKKHHIPFY DTRFFQEIYA AGNSPVDTCQ FRTPRFGYHL PKLTDQTAIR VNKKHVKAAK TEARIRLAIQ QGTLPVSNLK ITEISATINS KGQVRIPVKF RVGRQKGTLQ IGDRFCGYDQ NQTASHAYSL WEVVKEGQYH KELRCRVRFI SSGDIVSITE NRGNQFDQLS YEGLAYPQYA DWRKKASKFV SLWQITKKNK KKEIVTVEAK EKFDAICKYQ PRLYKFNKEY AYLLRDIVRG KSLVELQQIR QEIFRFIEQD CGVTRLGSLS LSTLETVKAV KGIIYSYFST ALNASKNNPI SDEQRKEFDP ELFALLEKLE LIRTRKKKQK VERIANSLIQ TCLENNIKFI RGEGDLSTTN NATKKKANSR SMDWLARGVF NKIRQLATMH NITLFGCGSL YTSHQDPLVH RNPDKAMKCR WAAIPVKDIG DWVLRKLSQN LRAKNRGTGE YYHQGVKEFL SHYELQDLEE ELLKWRSDRK SNIPCWVLQN RLAEKLGNKE AVVYIPVRGG RIYFATHKVA TGAVSIVFDQ KQVWVCNADH VAAANIALTG KGIGRQSSDE ENPDGGRIKL QLTS PCT/US2021/025257的SEQ ID NO: 496的變體Cas12i2
252 ATGGCTTCCATCTCTAGGCCATACGGCACCAAGCTGCGACCGGACGCACGGAAGAAGGAGATGCTCGATAAGTTCTTTAATACACTGACTAAGGGTCAGCGCGTGTTCGCAGACCTGGCCCTGTGCATCTATGGCTCCCTGACCCTGGAGATGGCCAAGTCTCTGGAGCCAGAAAGTGATTCAGAACTGGTGTGCGCTATTGGGTGGTTTCGGCTGGTGGACAAGACCATCTGGTCCAAGGATGGCATCAAGCAGGAGAATCTGGTGAAACAGTACGAAGCCTATTCCGGAAAGGAGGCTTCTGAAGTGGTCAAAACATACCTGAACAGCCCCAGCTCCGACAAGTACGTGTGGATCGATTGCAGGCAGAAATTCCTGAGGTTTCAGCGCGAGCTCGGCACTCGCAACCTGTCCGAGGACTTCGAATGTATGCTCTTTGAACAGTACATTAGACTGACCAAGGGCGAGATCGAAGGGTATGCCGCTATTTCAAATATGTTCGGAAACGGCGAGAAGGAAGACCGGAGCAAGAAAAGAATGTACGCTACACGGATGAAAGATTGGCTGGAGGCAAACGAAAATATCACTTGGGAGCAGTATAGAGAGGCCCTGAAGAACCAGCTGAATGCTAAAAACCTGGAGCAGGTTGTGGCCAATTACAAGGGGAACGCTGGCGGGGCAGACCCCTTCTTTAAGTATAGCTTCTCCAAAGAGGGAATGGTGAGCAAGAAAGAACATGCACAGCAGCTCGACAAGTTCAAAACCGTCCTGAAGAACAAAGCCCGGGACCTGAATTTTCCAAACAAGGAGAAGCTGAAGCAGTACCTGGAGGCCGAAATCGGCATTCCGGTCGACGCTAACGTGTACTCCCAGATGTTCTCTAACGGGGTGAGTGAGGTCCAGCCTAAGACCACACGGAATATGTCTTTTAGTAACGAGAAACTGGATCTGCTCACTGAACTGAAGGACCTGAACAAGGGCGATGGGTTCGAGTACGCCAGAGAAGTGCTGAACGGGTTCTTTGACTCCGAGCTCCACACTACCGAGGATAAGTTTAATATCACCTCTAGGTACCTGGGAGGCGACAAATCAAACCGCCTGAGCAAACTCTATAAGATCTGGAAGAAAGAGGGTGTGGACTGCGAGGAAGGCATTCAGCAGTTCTGTGAAGCCGTCAAAGATAAGATGGGCCAGATCCCCATTCGAAATGTGCTGAAGTACCTGTGGCAGTTCCGGGAGACAGTCAGTGCCGAGGATTTTGAAGCAGCCGCTAAGGCTAACCATCTGGAGGAAAAGATCAGCCGGGTGAAAGCCCACCCAATCGTGATTAGCAATAGGTACTGGGCTTTTGGGACTTCCGCACTGGTGGGAAACATTATGCCCGCAGACAAGAGGCATCAGGGAGAGTATGCCGGTCAGAATTTCAAAATGTGGCTGGAGGCTGAACTGCACTACGATGGCAAGAAAGCAAAGCACCATCTGCCTTTTTATAACGCCCGCTTCTTTGAGGAAGTGTACTGCTATCACCCCTCTGTCGCCGAGATCACTCCTTTCAAAACCAAGCAGTTTGGCTGTGAAATCGGGAAGGACATTCCAGATTACGTGAGCGTCGCTCTGAAGGACAATCCGTATAAGAAAGCAACCAAACGAATCCTGCGTGCAATCTACAATCCCGTCGCCAACACAACTGGCGTTGATAAGACCACAAACTGCAGCTTCATGATCAAACGCGAGAATGACGAATATAAGCTGGTCATCAACCGAAAAATTTCCGTGGATCGGCCTAAGAGAATCGAAGTGGGCAGGACAATTATGGGGTACGACCGCAATCAGACAGCTAGCGATACTTATTGGATTGGCCGGCTGGTGCCACCTGGAACCCGGGGCGCATACCGCATCGGAGAGTGGAGCGTCCAGTATATTAAGTCCGGGCCTGTCCTGTCTAGTACTCAGGGAGTTAACAATTCCACTACCGACCAGCTGGTGTACAACGGCATGCCATCAAGCTCCGAGCGGTTCAAGGCCTGGAAGAAAGCCAGAATGGCTTTTATCCGAAAACTCATTCGTCAGCTGAATGACGAGGGACTGGAATCTAAGGGTCAGGATTATATCCCCGAGAACCCTTCTAGTTTCGATGTGCGGGGCGAAACCCTGTACGTCTTTAACAGTAATTATCTGAAGGCCCTGGTGAGCAAACACAGAAAGGCCAAGAAACCTGTTGAGGGGATCCTGGACGAGATTGAAGCCTGGACATCTAAAGACAAGGATTCATGCAGCCTGATGCGGCTGAGCAGCCTGAGCGATGCTTCCATGCAGGGAATCGCCAGCCTGAAGAGTCTGATTAACAGCTACTTCAACAAGAATGGCTGTAAAACCATCGAGGACAAAGAAAAGTTTAATCCCGTGCTGTATGCCAAGCTGGTTGAGGTGGAACAGCGGAGAACAAACAAGCGGTCTGAGAAAGTGGGAAGAATCGCAGGTAGTCTGGAGCAGCTGGCCCTGCTGAACGGGGTTGAGGTGGTCATCGGCGAAGCTGACCTGGGGGAGGTCGAAAAAGGAAAGAGTAAGAAACAGAATTCACGGAACATGGATTGGTGCGCAAAGCAGGTGGCACAGCGGCTGGAGTACAAACTGGCCTTCCATGGAATCGGTTACTTTGGAGTGAACCCCATGTATACCAGCCACCAGGACCCTTTCGAACATAGGCGCGTGGCTGATCACATCGTCATGCGAGCACGTTTTGAGGAAGTCAACGTGGAGAACATTGCCGAATGGCACGTGCGAAATTTCTCAAACTACCTGCGTGCAGACAGCGGCACTGGGCTGTACTATAAGCAGGCCACCATGGACTTCCTGAAACATTACGGTCTGGAGGAACACGCTGAGGGCCTGGAAAATAAGAAAATCAAGTTCTATGACTTTAGAAAGATCCTGGAGGATAAAAACCTGACAAGCGTGATCATTCCAAAGAGGGGCGGGCGCATCTACATGGCCACCAACCCAGTGACATCCGACTCTACCCCGATTACATACGCCGGCAAGACTTATAATAGGTGTAACGCTGATGAGGTGGCAGCCGCTAATATCGTTATTTCTGTGCTGGCTCCCCGCAGTAAGAAAAACGAGGAACAGGACGATATCCCTCTGATTACCAAGAAAGCCGAGAGTAAGTCACCACCGAAAGACCGGAAGAGATCAAAAACAAGCCAGCTGCCTCAGAAA 編碼Cas12i4的核苷酸序列
253 MASISRPYGTKLRPDARKKEMLDKFFNTLTKGQRVFADLALCIYGSLTLEMAKSLEPESDSELVCAIGWFRLVDKTIWSKDGIKQENLVKQYEAYSGKEASEVVKTYLNSPSSDKYVWIDCRQKFLRFQRELGTRNLSEDFECMLFEQYIRLTKGEIEGYAAISNMFGNGEKEDRSKKRMYATRMKDWLEANENITWEQYREALKNQLNAKNLEQVVANYKGNAGGADPFFKYSFSKEGMVSKKEHAQQLDKFKTVLKNKARDLNFPNKEKLKQYLEAEIGIPVDANVYSQMFSNGVSEVQPKTTRNMSFSNEKLDLLTELKDLNKGDGFEYAREVLNGFFDSELHTTEDKFNITSRYLGGDKSNRLSKLYKIWKKEGVDCEEGIQQFCEAVKDKMGQIPIRNVLKYLWQFRETVSAEDFEAAAKANHLEEKISRVKAHPIVISNRYWAFGTSALVGNIMPADKRHQGEYAGQNFKMWLEAELHYDGKKAKHHLPFYNARFFEEVYCYHPSVAEITPFKTKQFGCEIGKDIPDYVSVALKDNPYKKATKRILRAIYNPVANTTGVDKTTNCSFMIKRENDEYKLVINRKISVDRPKRIEVGRTIMGYDRNQTASDTYWIGRLVPPGTRGAYRIGEWSVQYIKSGPVLSSTQGVNNSTTDQLVYNGMPSSSERFKAWKKARMAFIRKLIRQLNDEGLESKGQDYIPENPSSFDVRGETLYVFNSNYLKALVSKHRKAKKPVEGILDEIEAWTSKDKDSCSLMRLSSLSDASMQGIASLKSLINSYFNKNGCKTIEDKEKFNPVLYAKLVEVEQRRTNKRSEKVGRIAGSLEQLALLNGVEVVIGEADLGEVEKGKSKKQNSRNMDWCAKQVAQRLEYKLAFHGIGYFGVNPMYTSHQDPFEHRRVADHIVMRARFEEVNVENIAEWHVRNFSNYLRADSGTGLYYKQATMDFLKHYGLEEHAEGLENKKIKFYDFRKILEDKNLTSVIIPKRGGRIYMATNPVTSDSTPITYAGKTYNRCNADEVAAANIVISVLAPRSKKNEEQDDIPLITKKAESKSPPKDRKRSKTSQLPQK Cas12i4胺基酸序列
254 MASISRPYGT KLRPDARKKE MLDKFFNTLT KGQRVFADLA LCIYGSLTLE MAKSLEPESD SELVCAIGWF RLVDKTIWSK DGIKQENLVK QYEAYSGKEA SEVVKTYLNS PSSDKYVWID CRQKFLRFQR ELGTRNLSED FECMLFEQYI RLTKGEIEGY AAISNMFGNG EKEDRSKKRM YATRMKDWLE ANENITWEQY REALKNQLNA KNLEQVVANY KGNAGGADPF FKYSFSKEGM VSKKEHAQQL DKFKTVLKNK ARDLNFPNKE KLKQYLEAEI GIPVDANVYS QMFSNGVSEV QPKTTRNMSF SNEKLDLLTE LKDLNKGDGF EYAREVLNGF FDSELHTTED KFNITSRYLG GDKSNRLSKL YKIWKKEGVD CEEGIQQFCE AVKDKMGQIP IRNVLKYLWQ FRETVSAEDF EAAAKANHLE EKISRVKAHP IVISNRYWAF GTSALVGNIM PADKRHQGEY AGQNFKMWLE AELHYDGKKA KHHLPFYNAR FFEEVYCYHP SVAEITPFKT KQFGCEIGKD IPDYVSVALK DNPYKKATKR ILRAIYNPVA NTTGVDKTTN CSFMIKREND EYKLVINRKI SRDRPKRIEV GRTIMGYDRN QTASDTYWIG RLVPPGTRGA YRIGEWSVQY IKSGPVLSST QGVNNSTTDQ LVYNGMPSSS ERFKAWKKAR MAFIRKLIRQ LNDEGLESKG QDYIPENPSS FDVRGETLYV FNSNYLKALV SKHRKAKKPV EGILDEIEAW TSKDKDSCSL MRLSSLSDAS MQGIASLKSL INSYFNKNGC KTIEDKEKFN PVLYAKLVEV EQRRTNKRSE KVGRIAGSLE QLALLNGVEV VIGEADLGEV EKGKSKKQNS RNMDWCAKQV AQRLEYKLAF HGIGYFGVNP MYTSHQDPFE HRRVADHIVM RARFEEVNVE NIAEWHVRNF SNYLRADSGT GLYYKQATMD FLKHYGLEEH AEGLENKKIK FYDFRKILED KNLTSVIIPK RGGRIYMATN PVTSDSTPIT YAGKTYNRCN ADEVAAANIV ISVLAPRSKK NREQDDIPLI TKKAESKSPP KDRKRSKTSQ LPQK 變體Cas12i4 A
255 MASISRPYGT KLRPDARKKE MLDKFFNTLT KGQRVFADLA LCIYGSLTLE MAKSLEPESD SELVCAIGWF RLVDKTIWSK DGIKQENLVK QYEAYSGKEA SEVVKTYLNS PSSDKYVWID CRQKFLRFQR ELGTRNLSED FECMLFEQYI RLTKGEIEGY AAISNMFGNG EKEDRSKKRM YATRMKDWLE ANENITWEQY REALKNQLNA KNLEQVVANY KGNAGGADPF FKYSFSKEGM VSKKEHAQQL DKFKTVLKNK ARDLNFPNKE KLKQYLEAEI GIPVDANVYS QMFSNGVSEV QPKTTRNMSF SNEKLDLLTE LKDLNKGDGF EYAREVLNGF FDSELHTTED KFNITSRYLG GDKSNRLSKL YKIWKKEGVD CEEGIQQFCE AVKDKMGQIP IRNVLKYLWQ FRETVSAEDF EAAAKANHLE EKISRVKAHP IVISNRYWAF GTSALVGNIM PADKRHQGEY AGQNFKMWLR AELHYDGKKA KHHLPFYNAR FFEEVYCYHP SVAEITPFKT KQFGCEIGKD IPDYVSVALK DNPYKKATKR ILRAIYNPVA NTTRVDKTTN CSFMIKREND EYKLVINRKI SRDRPKRIEV GRTIMGYDRN QTASDTYWIG RLVPPGTRGA YRIGEWSVQY IKSGPVLSST QGVNNSTTDQ LVYNGMPSSS ERFKAWKKAR MAFIRKLIRQ LNDEGLESKG QDYIPENPSS FDVRGETLYV FNSNYLKALV SKHRKAKKPV EGILDEIEAW TSKDKDSCSL MRLSSLSDAS MQGIASLKSL INSYFNKNGC KTIEDKEKFN PVLYAKLVEV EQRRTNKRSE KVGRIAGSLE QLALLNGVEV VIGEADLGEV EKGKSKKQNS RNMDWCAKQV AQRLEYKLAF HGIGYFGVNP MYTSHQDPFE HRRVADHIVM RARFEEVNVE NIAEWHVRNF SNYLRADSGT GLYYKQATMD FLKHYGLEEH AEGLENKKIK FYDFRKILED KNLTSVIIPK RGGRIYMATN PVTSDSTPIT YAGKTYNRCN ADEVAAANIV ISVLAPRSKK NREQDDIPLI TKKAESKSPP KDRKRSKTSQ LPQK 變體Cas12i4 B
265 MSNKEKNASETRKAYTTKMIPRSHDRMKLLGNFMDYLMDGTPIFFELWNQFGGGIDRDIISGTANKDKISDDLLLAVNWFKVMPINSKPQGVSPSNLANLFQQYSGSEPDIQAQEYFASNFDTEKHQWKDMRVEYERLLAELQLSRSDMHHDLKLMYKEKCIGLSLSTAHYITSVMFGTGAKNNRQTKHQFYSKVIQLLEESTQINSVEQLASIILKAGDCDSYRKLRIRCSRKGATPSILKIVQDYELGTNHDDEVNVPSLIANLKEKLGRFEYECEWKCMEKIKAFLASKVGPYYLGSYSAMLENALSPIKGMTTKNCKFVLKQIDAKNDIKYENEPFGKIVEGFFDSPYFESDTNVKWVLHPHHIGESNIKTLWEDLNAIHSKYEEDIASLSEDKKEKRIKVYQGDVCQTINTYCEEVGKEAKTPLVQLLRYLYSRKDDIAVDKIIDGITFLSKKHKVEKQKINPVIQKYPSFNFGNNSKLLGKIISPKDKLKHNLKCNRNQVDNYIWIEIKVLNTKTMRWEKHHYALSSTRFLEEVYYPATSENPPDALAARFRTKTNGYEGKPALSAEQIEQIRSAPVGLRKVKKRQMRLEAARQQNLLPRYTWGKDFNINICKRGNNFEVTLATKVKKKKEKNYKVVLGYDANIVRKNTYAAIEAHANGDGVIDYNDLPVKPIESGFVTVESQVRDKSYDQLSYNGVKLLYCKPHVESRRSFLEKYRNGTMKDNRGNNIQIDFMKDFEAIADDETSLYYFNMKYCKLLQSSIRNHSSQAKEYREEIFELLRDGKLSVLKLSSLSNLSFVMFKVAKSLIGTYFGHLLKKPKNSKSDVKAPPITDEDKQKADPEMFALRLALEEKRLNKVKSKKEVIANKIVAKALELRDKYGPVLIKGENISDTTKKGKKSSTNSFLMDWLARGVANKVKEMVMMHQGLEFVEVNPNFTSHQDPFVHKNPENTFRARYSRCTPSELTEKNRKEILSFLSDKPSKRPTNAYYNEGAMAFLATYGLKKNDVLGVSLEKFKQIMANILHQRSEDQLLFPSRGGMFYLATYKLDADATSVNWNGKQFWVCNADLVAAYNVGLVDIQKDFKKK Cas12i1(美國專利案號10,808,245中的SEQ ID NO: 3)
266 MSISNNNILPYNPKLLPDDRKHKMLVDTFNQLDLIRNNLHDMIIALYGALKYDNIKQFASKEKPHISADALCSINWFRLVKTNERKPAIESNQIISKFIQYSGHTPDKYALSHITGNHEPSHKWIDCREYAINYARIMHLSFSQFQDLATACLNCKILILNGTLTSSWAWGANSALFGGSDKENFSVKAKILNSFIENLKDEMNTTKFQVVEKVCQQIGSSDAADLFDLYRSTVKDGNRGPATGRNPKVMNLFSQDGEISSEQREDFIESFQKVMQEKNSKQIIPHLDKLKYHLVKQSGLYDIYSWAAAIKNANSTIVASNSSNLNTILNKTEKQQTFEELRKDEKIVACSKILLSVNDTLPEDLHYNPSTSNLGKNLDVFFDLLNENSVHTIENKEEKNKIVKECVNQYMEECKGLNKPPMPVLLTFISDYAHKHQAQDFLSAAKMNFIDLKIKSIKVVPTVHGSSPYTWISNLSKKNKDGKMIRTPNSSLIGWIIPPEEIHDQKFAGQNPIIWAVLRVYCNNKWEMHHFPFSDSRFFTEVYAYKPNLPYLPGGENRSKRFGYRHSTNLSNESRQILLDKSKYAKANKSVLRCMENMTHNVVFDPKTSLNIRIKTDKNNSPVLDDKGRITFVMQINHRILEKYNNTKIEIGDRILAYDQNQSENHTYAILQRTEEGSHAHQFNGWYVRVLETGKVTSIVQGLSGPIDQLNYDGMPVTSHKFNCWQADRSAFVSQFASLKISETETFDEAYQAINAQGAYTWNLFYLRILRKALRVCHMENINQFREEILAISKNRLSPMSLGSLSQNSLKMIRAFKSIINCYMSRMSFVDELQKKEGDLELHTIMRLTDNKLNDKRVEKINRASSFLTNKAHSMGCKMIVGESDLPVADSKTSKKQNVDRMDWCARALSHKVEYACKLMGLAYRGIPAYMSSHQDPLVHLVESKRSVLRPRFVVADKSDVKQHHLDNLRRMLNSKTKVGTAVYYREAVELMCEELGIHKTDMAKGKVSLSDFVDKFIGEKAIFPQRGGRFYMSTKRLTTGAKLICYSGSDVWLSDADEIAAINIGMFVVCDQTGAFKKKKKEKLDDEECDILPFRPM Cas12i3(美國專利案號10,808,245中的SEQ ID NO: 14)
228 ACAGAAGTCCACTCATTCTTGGCAGGATGGCTTCTCATCGTCTGCTCCTCCTCTGCCTTGCTGGACTGGTATTTGTGTCTGAGGCTGGCCCTACGGTGAGTGTTTCTGTGACATCCCATTCCTACATTTAAGATTCACGCTAAATGAAGTAGAAGTGACTCCTTCCAGCTTTGCCAACCAGCTTTTATTACTAGGGCAAGGGTACCCAGCATCTATTTTTAATATAATTAATTCAAACTTCAAAAAGAATGAAGTTCCACTGAGCTTACTGAGCTGGGACTTGAACTCTGAGCATTCTACCTCATTGCTTTGGTGCATTAGGTTTGTAATATCTGGTACCTCTGTTTCCTCAGATAGATGATAGAAATAAAGATATGATATTAAGGAAGCTGTTAATACTGAATTTTCAGAAAAGTATCCCTCCATAAAATGTATTTGGGGGACAAACTGCAGGAGATTATATTCTGGCCCTATAGTTATTCAAAACGTATTTATTGATTAATCTTTAAAAGGCTTAGTGAACAATATTCTAGTCAGATATCTAATTCTTAAATCCTCTAGAAGAATTAACTAATACTATAAAATGGGTCTGGATGTAGTTCTGACATTATTTTATAACAACTGGTAAGAGGGAGTGACTATAGCAACAACTAAAATGATCTCAGGAAAACCTGTTTGGCCCTATGTATGGTACATTACATCTTTTCAGTAATTCCACTCAAATGGAGACTTTTAACAAAGCAACTGTTCTCAGGGGACCTATTTTCTCCCTTAAAATTCATTATACACATCCCTGGTTGATAGCAGTGTGTCTGGAGGCAGAAACCATTCTTGCTTTGGAAACAATTACGTCTGTGTTATACTGAGTAGGGAAGCTCATTAATTGTCGACACTTACGTTCCTGATAATGGGATCAGTGTGTAATTCTTGTTTCGCTCCAGATTTCTAATACCACAAAGAATAAATCCTTTCACTCTGATCAATTTTGTTAACTTCTCACGTGTCTTCTCTACACCCAGGGCACCGGTGAATCCAAGTGTCCTCTGATGGTCAAAGTTCTAGATGCTGTCCGAGGCAGTCCTGCCATCAATGTGGCCGTGCATGTGTTCAGAAAGGCTGCTGATGACACCTGGGAGCCATTTGCCTCTGGGTAAGTTGCCAAAGAACCCTCCCACAGGACTTGGTTTTATCTTCCCGTTTGCCCCTCACTTGGTAGAGAGAGGCTCACATCATCTGCTAAAGAATTTACAAGTAGATTGAAAAACGTAGGCAGAGGTCAAGTATGCCCTCTGAAGGATGCCCTCTTTTTGTTTTGCTTAGCTAGGAAGTGACCAGGAACCTGAGCATCATTTAGGGGCAGACAGTAGAGAAAAGAAGGAATCAGAACTCCTCTCCTCTAGCTGTGGTTTGCAACCCTTTTGGGTCACAGAACACTTTATGTAGGTGATGAAAAGTAAACATTCTATGCCCAGAAAAAATGCACAGATACACACACATACAAAATCATATATGTGATTTTAGGAGTTTCACAGATTCCCTGGTGTCCCTGGGTAACACCAAAGCTAAGTGTCCTTGTCTTAGAATTTTAGGAAAAGGTATAATGTGTATTAACCCATTAACAAAAGGAAAGGAATTCAGAAATATTATTAACCAGGCATCTGTCTGTAGTTAATATGGATCACCCAAAACCCAAGGCTTTTGCCTAATGAACACTTTGGGGCACCTACTGTGTGCAAGGCTGGGGGCTGTCAAGCTCAGTTAAAAAAAAAAAGATAGAAGAGATGGATCCATGAGGCAAAGTACAGCCCCAGGCTAATCCCACGATCACCCGACTTCATGTCCAAGAGTGGCTTCTCACCTTCATTAGCCAGTTCACAATTTTCATGGAGTTTTTCTACCTGCACTAGCAAAAACTTCAAGGAAAATACATATTAATAAATCTAAGCAAAGTGACCAGAAGACAGAGCAATCAGGAGACCCTTTGCATCCAGCAGAAGAGGAACTGCTAAGTATTTACATCTCCACAGAGAAGAATTTCTGTTGGGTTTTAATTGAACCCCAAGAACCACATGATTCTTCAACCATTATTGGGAAGATCATTTTCTTAGGTCTGGTTTTAACTGGCTTTTTATTTGGGAATTCATTTATGTTTATATAAAATGCCAAGCATAACATGAAAAGTGGTTACAGGACTATTCTAAGGGAGAGACAGAATGGACACCAAAAATATTCCAATGTTCTTGTGAATCTTTTCCTTGCACCAGGACAAAAAAAAAAAGAAGTGAAAAGAAGAAAGGAGGAGGGGCATAATCAGAGTCAGTAAAGACAACTGCTATTTTTATCTATCGTAGCTGTTGCAGTCAAATGGGAAGCAATTTCCAACATTCAACTATGGAGCTGGTACTTACATGGAAATAGAAGTTGCCTAGTGTTTGTTGCTGGCAAAGAGTTATCAGAGAGGTTAAATATATAAAAGGGAAAAGAGTCAGATACAGGTTCTTCTTCCTACTTTAGGTTTTCCACTGTGTGTGCAAATGATACTCCCTGGTGGTGTGCAGATGCCTCAAAGCTATCCTCACACCACAAGGGAGAGGAGCGAGATCCTGCTGTCCTGGAGAAGTGCAGAGTTAGAACAGCTGTGGCCACTTGCATCCAATCATCAATCTTGAATCACAGGGACTCTTTCTTAAGTAAACATTATACCTGGCCGGGCACGGTGGCTCACGCCTGTAATCCCAGCACTTTGGGATGCCAAAGTGGGCATATCATCTGAGGTCAGGAGTTCAAGACCAGCCTGGCCAACATGGCAAAACTCCGTCTTTATGAAAAATACAAAAATTAGCCAGGCATGGTGGCAGGCGCCTGTAATCCCAGCTAATTGGGAGGCTGAGGCTGGAGAATCCCTTGAATCTAGGAGGCAGAGGTTGCAGTGAGCTGAGATCGTGCCATTGCACTCCAGCCTGGGTGACAAGAGTAAAACTCTGTCTCAAAAAAAAAAAATTATACCTACATTCTCTTCTTATCAGAGAAAAAAATCTACAGTGAGCTTTTCAAAAAGTTTTTACAAACTTTTTGCCATTTAATTTCAGTTAGGAGTTTTCCCTACTTCTGACTTAGTTGAGGGGAAATGTTCATAACATGTTTATAACATGTTTATGTGTGTTAGTTGGTGGGGGTGTATTACTTTGCCATGCCATTTGTTTCCTCCATGCGTAACTTAATCCAGACTTTCACACCTTATAGGAAAACCAGTGAGTCTGGAGAGCTGCATGGGCTCACAACTGAGGAGGAATTTGTAGAAGGGATATACAAAGTGGAAATAGACACCAAATCTTACTGGAAGGCACTTGGCATCTCCCCATTCCATGAGCATGCAGAGGTGAGTATACAGACCTTCGAGGGTTGTTTTGGTTTTGGTTTTTGCTTTTGGCATTCCAGGAAATGCACAGTTTTACTCAGTGTACCACAGAAATGTCCTAAGGAAGGTGATGAATGACCAAAGGTTCCCTTTCCTATTATACAAGAAAAAATTCACAACACTCTGAGAAGCAAATTTCTTTTTGACTTTGATGAAAATCCACTTAGTAACATGACTTGAACTTACATGAAACTACTCATAGTCTATTCATTCCACTTTATATGAATATTGATGTATCTGCTGTTGAAATAATAGTTTATGAGGCAGCCCTCCAGACCCCACGTAGAGTGTATGTAACAAGAGATGCACCATTTTATTTCTCGAAAACCCGTAACATTCTTCATTCCAAAACACATCTGGCTTCTCGGAGGTCTGGACAAGTGATTCTTGGCAACACATACCTATAGAGACAATAAAATCAAAGTAATAATGGCAACACAATAGATAACATTTACCAAGCATACACCATGTGGCAGACACAATTATAAGTGTTTTCCATATTTAACCTACTTAATCCTCAGGAATAAGCCACTGAGGTCAGTCCTATTATTATCCCCATCTTATAGATGAAGAAAATGAGGCACCAGGAAGTCAAATAACTTGTCAAAGGTCACAAGACTAGGAAATACACAAGTAGAAATGTTTACAATTAAGGCCCAGGCTGGGTTTGCCCTCAGTTCTGCTATGCCTCGCATTATGCCCCAGGAAACTTTTTCCCTTGTGAAAGCCAAGCTTAAAAAAAGAAAAGCCACATTTGTAACGTGCTCTGTTCCCCTGCCTATGGTGAGGATCTTCAAACAGTTATACATGGACCCAGTCCCCCTGCCTTCTCCTTAATTTCTTAAGTCATTTGAAACAGATGGCTGTCATGGAAATAGAATCCAGACATGTTGGTCAGAGTTAAAGATCAACTAATTCCATCAAAAATAGCTCGGCATGAAAGGGAACTATTCTCTGGCTTAGTCATGGATGAGACTTTCAATTGCTATAAAGTGGTTCCTTTATTAGACAATGTTACCAGGGAAACAACAGGGGTTTGTTTGACTTCTGGGGCCCACAAGTCAACAAGAGAGCCCCATCTACCAAGGAGCATGTCCCTGACTACCCCTCAGCCAGCAGCAAGACATGGACCCCAGTCAGGGCAGGAGCAGGGTTTCGGCGGCGCCCAGCACAAGACATTGCCCCTAGAGTCTCAGCCCCTACCCTCGAGTAATAGATCTGCCTACCTGAGACTGTTGTTTGCCCAAGAGCTGGGTCTCAGCCTGATGGGAACCATATAAAAAGGTTCACTGACATACTGCCCACATGTTGTTCTCTTTCATTAGATCTTAGCTTCCTTGTCTGCTCTTCATTCTTGCAGTATTCATTCAACAAACATTAAAAAAAAAAAAAAGCATTCTATGTGTGGAACACTCTGCTAGATGCTGTGGATTTAGAAATGAAAATACATCCCGACCCTTGGAATGGAAGGGAAAGGACTGAAGTAAGACAGATTAAGCAGGACCGTCAGCCCAGCTTGAAGCCCAGATAAATACGGAGAACAAGAGAGAGCGAGTAGTGAGAGATGAGTCCCAATGCCTCACTTTGGTGACGGGTGCGTGGTGGGCTTCATGCAGCTTCTTCTGATAAATGCCTCCTTCAGAACTGGTCAACTCTACCTTGGCCAGTGACCCAGGTGGTCATAGTAGATTTACCAAGGGAAAATGGAAACTTTTATTAGGAGCTCTTAGGCCTCTTCACTTCATGGATTTTTTTTTCCTTTTTTTTTGAGATGGAGTTTTGCCCTGTCACCCAGGCTGGAATGCAGTGGTGCAATCTCAGCTCACTGCAACCTCCGCCTCCCAGGTTCAAGCAATTCTCCTGCCTCAGCCTCCCGAGTAGCTGGGACTACAGGTGTGCGCCACCACACCAGGCTAATTTTTGTATTTTTTGTAAAGACAGGTTTTCACCACGTTGGCCAGGCTGGTCTGAACTCCAGACCTCAGGTGATTCACCTGTCTCAGCCTCCCAAAGTGCTGGGATTACAGGTGTGAGCCACCGTGCCCGGCTACTTCATGGATTTTTGATTACAGATTATGCCTCTTACAATTTTTAAGAAGAATCAAGTGGGCTGAAGGTCAATGTCACCATAAGACAAAAGACATTTTTATTAGTTGATTCTAGGGAATTGGCCTTAAGGGGAGCCCTTTCTTCCTAAGAGATTCTTAGGTGATTCTCACTTCCTCTTGCCCCAGTATTATTTTTGTTTTTGGTATGGCTCACTCAGATCCTTTTTTCCTCCTATCCCTAAGTAATCCGGGTTTCTTTTTCCCATATTTAGAACAAAATGTATTTATGCAGAGTGTGTCCAAACCTCAACCCAAGGCCTGTATACAAAATAAATCAAATTAAACACATCTTTACTGTCTTCTACCTCTTTCCTGACCTCAATATATCCCAACTTGCCTCACTCTGAGAACCAAGGCTGTCCCAGCACCTGAGTCGCAGATATTCTACTGATTTGACAGAACTGTGTGACTATCTGGAACAGCATTTTGATCCACAATTTGCCCAGTTACAAAGCTTAAATGAGCTCTAGTGCATGCATATATATTTCAAAATTCCACCATGATCTTCCACACTCTGTATTGTAAATAGAGCCCTGTAATGCTTTTACTTCGTATTTCATTGCTTGTTATACATAAAAATATACTTTTCTTCTTCATGTTAGAAAATGCAAAGAATAGGAGGGTGGGGGAATCTCTGGGCTTGGAGACAGGAGACTTGCCTTCCTACTATGGTTCCATCAGAATGTAGACTGGGACAATACAATAATTCAAGTCTGGTTTGCTCATCTGTAAATTGGGAAGAATGTTTCCAGCTCCAGAATGCTAAATCTCTAAGTCTGTGGTTGGCAGCCACTATTGCAGCAGCTCTTCAATGACTCAATGCAGTTTTGCATTCTCCCTACCTTTTTTTTCTAAAACCAATAAAATAGATACAGCCTTTAGGCTTTCTGGGATTTCCCTTAGTCAAGCTAGGGTCATCCTGACTTTCGGCGTGAATTTGCAAAACAAGACCTGACTCTGTACTCCTGCTCTAAGGACTGTGCATGGTTCCAAAGGCTTAGCTTGCCAGCATATTTGAGCTTTTTCCTTCTGTTCAAACTGTTCCAAAATATAAAAGAATAAAATTAATTAAGTTGGCACTGGACTTCCGGTGGTCAGTCATGTGTGTCATCTGTCACGTTTTTCGGGCTCTGGTGGAAATGGATCTGTCTGTCTTCTCTCATAGGTGGTATTCACAGCCAACGACTCCGGCCCCCGCCGCTACACCATTGCCGCCCTGCTGAGCCCCTACTCCTATTCCACCACGGCTGTCGTCACCAATCCCAAGGAATGAGGGACTTCTCCTCCAGTGGACCTGAAGGACGAGGGATGGGATTTCATGTAACCAAGAGTATTCCATTTTTACTAAAGCAGTGTTTTCACCTCATATGCTATGTTAGAAGTCCAGGCAGAGACAATAAAACATTCCTGTGAAAGGCA TTR
229 ACAGAAGTCCACTCATTCTTGGCAGGATGGCTTCTCATCGTCTGCTCCTCCTCTGCCTTGCTGGACTGGTATTTGTGTCTGAGGCTGGCCCTACGGTGAGTGTTTCTGTGACATCCCATTCCTACATTTAAGATTCACGCTAAAT TTR外顯子1
230 TTCACTCTGATCAATTTTGTTAACTTCTCACGTGTCTTCTCTACACCCAGGGCACCGGTGAATCCAAGTGTCCTCTGATGGTCAAAGTTCTAGATGCTGTCCGAGGCAGTCCTGCCATCAATGTGGCCGTGCATGTGTTCAGAAAGGCTGCTGATGACACCTGGGAGCCATTTGCCTCTGGGTAAGTTGCCAAAGAACCCTCCCACAGGACTTGGTTTTATCTTCCCGTTT TTR外顯子2
231 CCATTTGTTTCCTCCATGCGTAACTTAATCCAGACTTTCACACCTTATAGGAAAACCAGTGAGTCTGGAGAGCTGCATGGGCTCACAACTGAGGAGGAATTTGTAGAAGGGATATACAAAGTGGAAATAGACACCAAATCTTACTGGAAGGCACTTGGCATCTCCCCATTCCATGAGCATGCAGAGGTGAGTATACAGACCTTCGAGGGTTGTTTTGGTTTTGGTTTTTGCTTTTG TTR外顯子3
232 CACGTTTTTCGGGCTCTGGTGGAAATGGATCTGTCTGTCTTCTCTCATAGGTGGTATTCACAGCCAACGACTCCGGCCCCCGCCGCTACACCATTGCCGCCCTGCTGAGCCCCTACTCCTATTCCACCACGGCTGTCGTCACCAATCCCAAGGAATGAGGGACTTCTCCTCCAGTGGACCTGAAGGACGAGGGATGGGATTTCATGTAACCAAGAGTATTCCATTTTTACTAAAGCAGTGTTTTCACCTCATATGCTATGTTAGAAGTCCAGGCAGAGACAATAAAACATTCCTGTGAAAGGCA TTR外顯子4
256 MASHRLLLLCLAGLVFVSEAGPTGTGESKCPLMVKVLDAVRGSPAINVAVHVFRKAADDTWEPFASGKTSESGELHGLTTEEEFVEGIYKVEIDTKSYWKALGISPFHEHAEVVFTANDSGPRRYTIAALLSPYSYSTTAVVTNPKE TTR(全蛋白質序列)
257 GPTGTGESKCPLMVKVLDAVRGSPAINVA VHVFRKAADDTWEPFASGKTSESGELHGLTTEEEFVEGIYKVEIDTKSYWKALGISPFHEHAEVVFTANDSGPRRYTIAALLSPYSYST TA VVTNPKE TTR(經翻譯後切割的序列) V30、T119、和V122以粗體顯示
258 ATGGCTTCTCATCGTCTGCTCCTCCTCTGCCTTGCTGGACTGGTATTTGTGTCTGAGGCTGGCCCTACGGGCACCGGTGAATCCAAGTGTCCTCTGATGGTCAAAGTTCTAGATGCTGTCCGAGGCAGTCCTGCCATCAATGTGGCCGTGCATGTGTTCAGAAAGGCTGCTGATGACACCTGGGAGCCATTTGCCTCTGGGAAAACCAGTGAGTCTGGAGAGCTGCATGGGCTCACAACTGAGGAGGAATTTGTAGAAGGGATATACAAAGTGGAAATAGACACCAAATCTTACTGGAAGGCACTTGGCATCTCCCCATTCCATGAGCATGCAGAGGTGGTATTCACAGCCAACGACTCCGGCCCCCGCCGCTACACCATTGCCGCCCTGCTGAGCCCCTACTCCTATTCCACCACGGCTGTCGTCACCAATCCCAAGGAATGA TTR編碼序列
在一些實施方式中,本文揭露的基因編輯系統可以包含如本文揭露的Cas12i多肽。在其他實施方式中,基因編輯系統可以包含編碼Cas12i多肽的核酸。例如,基因編輯系統可以包含編碼Cas12i多肽的載體(例如病毒載體,如AAV載體,如AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11和AAV12)。可替代地,基因編輯系統可以包含編碼Cas12i多肽的mRNA分子。在一些情況下,mRNA分子可為經密碼子優化的。 II. 基因編輯系統組分的製備
本揭露內容提供了用於產生本文揭露的基因編輯系統的組分(例如,RNA指導物)之方法、用於產生Cas12i多肽之方法、以及用於將RNA指導物和Cas12i多肽複合之方法。 A. RNA 指導物
在一些實施方式中,藉由DNA分子的體外轉錄來製備RNA指導物。因此,例如,在一些實施方式中,藉由使用上游啟動子序列(例如,T7聚合酶啟動子序列)在體外轉錄編碼RNA指導物的DNA分子來產生RNA指導物。在一些實施方式中,DNA分子編碼多個RNA指導物,或者體外轉錄反應包括多個不同的DNA分子,每個DNA分子編碼不同的RNA指導物。在一些實施方式中,使用化學合成方法製備RNA指導物。在一些實施方式中,藉由在用包括編碼RNA指導物的序列的質體轉染的細胞中表現RNA指導物序列來製備RNA指導物。在一些實施方式中,質體編碼多個不同的RNA指導物。在一些實施方式中,將各自編碼不同的RNA指導物的多個不同的質體轉染到細胞中。在一些實施方式中,從編碼RNA指導物並且還編碼Cas12i多肽的質體表現該RNA指導物。在一些實施方式中,從表現RNA指導物但不表現Cas12i多肽的質體表現該RNA指導物。在一些實施方式中,RNA指導物從商業供應商購買。在一些實施方式中,使用一或多個經修飾的核苷酸(例如,如上所述)合成RNA指導物。 B. 模板 DNA
在一些實施方式中,使用化學合成方法製備模板DNA。在一些實施方式中,藉由寡核苷酸合成或基於退火的寡核苷酸連接來製備模板DNA。在一些實施方式中,將模板DNA合成為單股寡DNA核苷酸(ssODN)。在一些實施方式中,將模板DNA合成為雙股寡DNA核苷酸(dsODN)。在一些實施方式中,在用包括模板DNA序列的質體轉染的細胞中製備模板DNA。在一些實施方式中,質體包含不同的模板DNA序列。在一些實施方式中,將各自包含不同的模板DNA的多個不同的質體轉染到細胞中。在一些實施方式中,包含模板DNA的質體進一步編碼RNA指導和/或Cas12i多肽。在一些實施方式中,模板DNA從商業供應商購買。在一些實施方式中,使用一或多個經修飾的核苷酸(例如,如上所述)合成模板DNA。 C. Cas12i 多肽
在一些實施方式中,本揭露內容之Cas12i多肽可以藉由以下製備:(a) 培養產生本揭露內容之Cas12i多肽的細菌,分離該Cas12i多肽,視需要純化該Cas12i多肽,並將該Cas12i多肽與RNA指導物複合。Cas12i多肽也可以藉由 (b) 已知的基因工程技術製備,特別地,藉由以下製備:從細菌中分離編碼本揭露內容之Cas12i多肽的基因,構建重組表現載體,然後將載體轉移到合適的宿主細胞中,該宿主細胞表現RNA指導物,用於在宿主細胞中表現與RNA指導物複合的重組蛋白。可替代地,Cas12i多肽可以藉由 (c) 體外偶合的轉錄-翻譯系統製備,然後與RNA指導物複合。
在一些實施方式中,宿主細胞用於表現Cas12i多肽。對宿主細胞沒有特別的限制,並且可以較佳的是使用各種已知的細胞。宿主細胞之特定實例包括細菌,例如大腸桿菌(E. coli)、酵母(出芽酵母(budding yeast)、釀酒酵母(Saccharomyces cerevisiae)和裂殖酵母(fission yeast)、粟酒裂殖酵母(Schizosaccharomyces pombe))、線蟲(秀麗隱桿線蟲(Caenorhabditis elegans))、非洲爪蟾(Xenopus laevis)卵母細胞和動物細胞(例如,CHO細胞、COS細胞和HEK293細胞)。用於將上述表現載體轉移到宿主細胞內之方法(即轉化法)沒有特別的限制,並且可以使用已知的方法,如電穿孔、磷酸鈣法、脂質體法和DEAE葡聚糖法。
在用表現載體轉化宿主後,可以培養、培育或繁殖宿主細胞以產生Cas12i多肽。在Cas12i多肽表現後,可以根據常規方法(例如,過濾、離心、細胞破壞、凝膠過濾層析、離子交換層析等)收集宿主細胞並從培養物中純化Cas12i多肽等。
在一些實施方式中,用於Cas12i多肽表現之方法包括翻譯該Cas12i多肽的至少5個胺基酸、至少10個胺基酸、至少15個胺基酸、至少20個胺基酸、至少50個胺基酸、至少100個胺基酸、至少150個胺基酸、至少200個胺基酸、至少250個胺基酸、至少300個胺基酸、至少400個胺基酸、至少500個胺基酸、至少600個胺基酸、至少700個胺基酸、至少800個胺基酸、至少900個胺基酸、或至少1000個胺基酸。在一些實施方式中,用於蛋白質表現之方法包括翻譯Cas12i多肽的約5個胺基酸、約10個胺基酸、約15個胺基酸、約20個胺基酸、約50個胺基酸、約100個胺基酸、約150個胺基酸、約200個胺基酸、約250個胺基酸、約300個胺基酸、約400個胺基酸、約500個胺基酸、約600個胺基酸、約700個胺基酸、約800個胺基酸、約900個胺基酸、約1000個胺基酸或更多。
可以使用多種方法來確定宿主細胞中Cas12i多肽的產生水平。這樣的方法包括但不限於例如利用對Cas12i多肽具有特異性的多株或單株抗體或如本文別處所述之標記標籤的方法。示例性方法包括但不限於酶聯免疫吸附測定(ELISA)、放射免疫測定(MA)、螢光免疫測定(FIA)、和螢光激活細胞分選(FACS)。該等和其他測定係本領域熟知的(參見例如,Maddox等人, J. Exp. Med. [實驗醫學雜誌] 158:1211 [1983])。
本揭露內容提供了在細胞中體內表現Cas12i多肽之方法,該等方法包括向宿主細胞提供編碼該Cas12i多肽的多核糖核苷酸(其中該多核糖核苷酸編碼該Cas12i多肽);在該細胞中表現該Cas12i多肽;以及從該細胞中獲得該Cas12i多肽。
本揭露內容進一步提供了在細胞中體內表現Cas12i多肽之方法,該等方法包括向宿主細胞提供編碼該Cas12i多肽的多核糖核苷酸(其中該多核糖核苷酸編碼該Cas12i多肽);以及在該細胞中表現該Cas12i多肽。在一些實施方式中,將編碼Cas12i多肽的多核糖核苷酸與RNA指導物一起遞送至細胞,並且一旦在該細胞中表現,該Cas12i多肽和該RNA指導物就形成複合物。在一些實施方式中,編碼Cas12i多肽的多核糖核苷酸和RNA指導物在單一的組成物內被遞送至細胞。在一些實施方式中,編碼Cas12i多肽的多核糖核苷酸和RNA指導物被包含在分開的組成物內。在一些實施方式中,宿主細胞存在於受試者(例如,人患者)中。 D. 複合物
在一些實施方式中,靶向TTR的RNA指導物與Cas12i多肽複合以形成核糖核蛋白(RNP)。在一些實施方式中,RNA指導物和Cas12i多肽的複合發生在低於約以下中任一個的溫度下:20°C、21°C、22°C、23°C、24°C、25°C、26°C、27°C、28°C、29°C、30°C、31°C、32°C、33°C、34°C、35°C、36°C、37°C、38°C、39°C、40°C、41°C、42°C、43°C、44°C、45°C、50°C、或55°C。在一些實施方式中,在約37°C下在至少約以下中的任一個的孵育時間段內,RNA指導物不會從Cas12i多肽解離:10 min、15 min、20 min、25 min、30 min、35 min、40 min、45 min、50 min、55 min、1 hr、2 hr、3 hr、4 hr、或更多個小時。
在一些實施方式中,RNA指導物和Cas12i多肽在複合緩衝液中複合。在一些實施方式中,將Cas12i多肽儲存在被複合緩衝液替代的緩衝液中以與RNA指導物形成複合物。在一些實施方式中,將Cas12i多肽儲存在複合緩衝液中。
在一些實施方式中,複合緩衝液的pH範圍為約7.3至8.6。在一個實施方式中,複合緩衝液的pH為約7.3。在一個實施方式中,複合緩衝液的pH為約7.4。在一個實施方式中,複合緩衝液的pH為約7.5。在一個實施方式中,複合緩衝液的pH為約7.6。在一個實施方式中,複合緩衝液的pH為約7.7。在一個實施方式中,複合緩衝液的pH為約7.8。在一個實施方式中,複合緩衝液的pH為約7.9。在一個實施方式中,複合緩衝液的pH為約8.0。在一個實施方式中,複合緩衝液的pH為約8.1。在一個實施方式中,複合緩衝液的pH為約8.2。在一個實施方式中,複合緩衝液的pH為約8.3。在一個實施方式中,複合緩衝液的pH為約8.4。在一個實施方式中,複合緩衝液的pH為約8.5。在一個實施方式中,複合緩衝液的pH為約8.6。
在一些實施方式中,在如本文所述純化之前,可以使Cas12i多肽在宿主細胞中過表現並與RNA指導物複合。在一些實施方式中,將編碼Cas12i多肽的mRNA或DNA引入細胞中,使得該Cas12i多肽在細胞中表現。在一些實施方式中,從單個mRNA或DNA構建體將RNA指導物也引入細胞中(無論是同時、分開、還是依次),使得在細胞中形成RNP複合物。
在一些實施方式中,模板DNA與Cas12i多肽結合。在一些實施方式中,模板DNA與Cas12i多肽共價結合。在一些實施方式中,模板DNA與Cas12i多肽非共價結合。在一些實施方式中,模板DNA與RNP結合。在一些實施方式中,模板DNA與RNP共價結合。在一些實施方式中,模板DNA與RNP非共價結合。 III. 基因編輯方法
本揭露內容還提供了修飾TTR基因內的靶序列之方法或將突變引入TTR基因之方法。在一些實施方式中,該等方法包括將靶向TTR的RNA指導物、Cas12i多肽、和模板DNA引入細胞中。可以將靶向TTR的RNA指導物和Cas12i多肽作為核糖核蛋白複合物引入細胞中。可以將靶向TTR的RNA指導物、模板DNA、和Cas12i多肽引入到核酸載體上。可以將Cas12i多肽作為mRNA引入。可以將RNA指導物和模板DNA直接引入細胞中。
本文揭露的任何基因編輯系統均可用於對TTR基因進行基因改造。基因編輯系統可以包含指導RNA、Cas12i2多肽、和模板DNA。指導RNA包含對TTR基因中的靶序列具有特異性(例如,對該TTR基因的外顯子2、外顯子3或外顯子4中的區域具有特異性)的間隔子序列。 A. 靶序列
在一些實施方式中,如本文揭露的RNA指導物被設計成與靶序列互補,該靶序列與5'-TTN-3' PAM序列或5'-NTTN-3' PAM序列相鄰。
在一些實施方式中,靶序列在TTR基因或TTR基因的基因座(例如,外顯子2、外顯子3或外顯子4)內,RNA指導物可以經由鹼基配對與其結合。在一些實施方式中,細胞僅具有靶序列的一個拷貝。在一些實施方式中,細胞具有靶序列的多於一個拷貝,如至少約2、3、4、5、10、100或更多個拷貝中的任一個。
在一些實施方式中,TTR基因係哺乳動物基因。在一些實施方式中,TTR基因係人基因。例如,在一些實施方式中,靶序列在序列SEQ ID NO: 228(或其反向互補序列)或SEQ ID NO: 258(或其反向互補序列)內。在一些實施方式中,靶序列在SEQ ID NO: 228(或其反向互補序列)或SEQ ID NO: 258(或其反向互補序列)闡述的TTR基因的外顯子內,例如,在SEQ ID NO: 229、230、231、或232的序列(或其中任一個的反向互補序列)內。SEQ ID NO: 228的TTR基因的外顯子區域內的靶序列在表6中闡述。在一些實施方式中,靶序列在SEQ ID NO: 228(或其反向互補序列)闡述的TTR基因的內含子內。在一些實施方式中,靶序列在SEQ ID NO: 228(或其反向互補序列)或SEQ ID NO: 258(或其反向互補序列)闡述的TTR基因序列的變體(例如,多型性變體)內。在一些實施方式中,TTR基因序列係在SEQ ID NO: 228(或其反向互補序列)或SEQ ID NO: 258(或其反向互補序列)中闡述的序列的同源物。在一些實施方式中,TTR基因序列係非人TTR序列。
在一些實施方式中,靶序列與5'-NTTN-3' PAM序列相鄰,其中N係任何核苷酸。5'-NTTN-3'序列可以緊鄰靶序列,或者例如在靶序列的少量(例如,1、2、3、4、或5個)核苷酸內。在一些實施方式中,5'-NTTN-3'序列係5’-NTTY-3’、5’-NTTC-3’、5’-NTTT-3’、5’-NTTA-3’、5’-NTTB-3’、5’-NTTG-3’、5’-CTTY-3’、5’-DTTR’3’、5’-CTTR-3’、5’-DTTT-3’、5’-ATTN-3’、或5’-GTTN-3’,其中Y係C或T,B係除A之外的任何核苷酸,D係除C之外的任何核苷酸,並且R係A或G。在一些實施方式中,5'-NTTN-3'序列係5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。PAM序列可以在靶序列的5'。
在一些實施方式中,靶序列係單股的(例如,單股DNA)。在一些實施方式中,靶序列係雙股的(例如,雙股DNA)。在一些實施方式中,靶序列包含單股區和雙股區兩者。在一些實施方式中,靶序列係線性的。在一些實施方式中,靶序列係環狀的。在一些實施方式中,靶序列包含一或多個經修飾的核苷酸,如甲基化的核苷酸、受損的核苷酸、或核苷酸類似物。在一些實施方式中,靶序列未經修飾。在一些實施方式中,RNA指導物與雙股靶序列的第一股(例如,靶股或間隔子互補股)結合,並且5'-NTTN-3' PAM序列存在於第二互補股(例如,非靶股或非間隔子互補股)。在一些實施方式中,RNA指導物在靶股(例如,間隔子互補股)上的5'-NAAN-3'序列附近結合。
5'-NTTN-3'序列可以緊鄰靶序列,或者例如在靶序列的少量(例如,1、2、3、4、或5個)核苷酸內。在一些實施方式中,5'-NTTN-3'序列係5’-NTTY-3’、5’-NTTC-3’、5’-NTTT-3’、5’-NTTA-3’、5’-NTTB-3’、5’-NTTG-3’、5’-CTTY-3’、5’-DTTR-3’、5’-CTTR-3’、5’-DTTT-3’、5’-ATTN-3’、或5’-GTTN-3’,其中Y係C或T,B係除A之外的任何核苷酸,D係除C之外的任何核苷酸,並且R係A或G。在一些實施方式中,5'-NTTN-3'序列係5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,RNA指導物被設計成與雙股靶核酸的第一股(即,非PAM股)結合,並且5'-NTTN-3' PAM序列存在於第二互補股(即,PAM股)中。在一些實施方式中,RNA指導物與非PAM股上的區域結合,該區域與PAM股上的靶序列互補,該靶序列與5'-NAAN-3'序列相鄰。
在一些實施方式中,靶序列存在於細胞中。在一些實施方式中,靶序列存在於細胞的核中。在一些實施方式中,靶序列對於細胞係內源的。在一些實施方式中,靶序列係基因組DNA。在一些實施方式中,靶序列係染色體DNA。在一些實施方式中,靶序列係編碼蛋白質的基因或其功能區如編碼區、或調節元件,如啟動子、強化子、5'或3'非翻譯區等。
在一些實施方式中,靶序列存在於靶序列的易於接近的區域中。在一些實施方式中,靶序列係靶基因的外顯子。在一些實施方式中,靶序列跨靶基因的外顯子-內含子接點。在一些實施方式中,靶序列存在於非編碼區(如基因的調節區)中。 B. 基因編輯
在一些實施方式中,Cas12i多肽具有酶活性(例如,核酸酶活性)。在一些實施方式中,Cas12i多肽在細胞中誘導一或多個DNA雙股斷裂。在一些實施方式中,Cas12i多肽在細胞中誘導一或多個DNA單股斷裂。在一些實施方式中,Cas12i多肽在細胞中誘導一或多個DNA切口。在一些實施方式中,DNA斷裂和/或切口導致形成一或多個***缺失(例如,一或多個缺失)。
在一些實施方式中,本文揭露的RNA指導物與Cas12i多肽形成複合物並將該Cas12i多肽引導至與5'-NTTN-3'序列相鄰的靶序列。在一些實施方式中,該複合物誘導與5'-NTTN-3'序列相鄰的缺失(例如,核苷酸缺失或DNA缺失)。在一些實施方式中,該複合物誘導與以下序列相鄰的缺失:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,該複合物誘導與富含T/C的序列相鄰的缺失。
在一些實施方式中,缺失在5'-NTTN-3'序列的下游。在一些實施方式中,缺失在以下序列的下游:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失在富含T/C的序列的下游。
在一些實施方式中,缺失改變TTR基因的表現。在一些實施方式中,缺失改變TTR基因的功能。在一些實施方式中,缺失使TTR基因失活。在一些實施方式中,缺失係框移缺失。在一些實施方式中,缺失係非框移缺失。在一些實施方式中,缺失導致細胞毒性或細胞死亡(例如,細胞凋亡)。
在一些實施方式中,缺失始於5'-NTTN-3'序列的約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內。在一些實施方式中,缺失始於以下序列的約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的下游約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內。在一些實施方式中,缺失始於以下序列的下游約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的下游約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內。在一些實施方式中,缺失始於以下序列的約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的下游約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內。在一些實施方式中,缺失始於以下序列的下游約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的下游約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內。在一些實施方式中,缺失始於以下序列的約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的下游約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內。在一些實施方式中,缺失始於以下序列的下游約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的下游約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內。
在一些實施方式中,缺失終於5'-NTTN-3'序列的約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。在一些實施方式中,缺失終於以下序列的約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失終於富含T/C的序列的約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。
在一些實施方式中,缺失終於5'-NTTN-3'序列的下游約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。在一些實施方式中,缺失終於以下序列的下游約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失終於富含T/C的序列的下游約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。
在一些實施方式中,缺失終於5'-NTTN-3'序列的約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內。在一些實施方式中,缺失終於以下序列的約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失終於富含T/C的序列的約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內。
在一些實施方式中,缺失終於5'-NTTN-3'序列的下游約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內。在一些實施方式中,缺失終於以下序列的下游約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失終於富含T/C的序列的下游約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內。
在一些實施方式中,缺失終於5'-NTTN-3'序列的約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。在一些實施方式中,缺失終於以下序列的約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失終於富含T/C的序列的約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。
在一些實施方式中,缺失終於5'-NTTN-3'序列的下游約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。在一些實施方式中,缺失終於以下序列的下游約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失終於富含T/C的序列的下游約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該5'-NTTN-3'序列的約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。在一些實施方式中,缺失始於以下序列的約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於以下序列的約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該富含T/C的序列的約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的下游約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該5'-NTTN-3'序列的下游約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。在一些實施方式中,缺失始於以下序列的下游約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,並且終於以下序列的下游約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的下游約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該富含T/C的序列的下游約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該5'-NTTN-3'序列的約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內。在一些實施方式中,缺失始於以下序列的約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於以下序列的約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該富含T/C的序列的約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的下游約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該5'-NTTN-3'序列的下游約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內。在一些實施方式中,缺失始於以下序列的下游約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,並且終於以下序列的下游約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的下游約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該富含T/C的序列的下游約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該5'-NTTN-3'序列的約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。在一些實施方式中,缺失始於以下序列的約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於以下序列的約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該富含T/C的序列的約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的下游約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該5'-NTTN-3'序列的下游約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。在一些實施方式中,缺失始於以下序列的下游約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,並且終於以下序列的下游約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的下游約5至約15個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該富含T/C的序列的下游約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內,並且終於該5'-NTTN-3'序列的約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。在一些實施方式中,缺失始於以下序列的約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內,並且終於以下序列的約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內,並且終於該富含T/C的序列的約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的下游約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內,並且終於該5'-NTTN-3'序列的下游約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。在一些實施方式中,缺失始於以下序列的下游約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,並且終於以下序列的下游約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的下游約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內,並且終於該富含T/C的序列的下游約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內,並且終於該5'-NTTN-3'序列的約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內。在一些實施方式中,缺失始於以下序列的約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內,並且終於該序列的約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的約5至約10個核苷酸內,並且終於該富含T/C的序列的約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的下游約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內,並且終於該5'-NTTN-3'序列的下游約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內。在一些實施方式中,缺失始於以下序列的下游約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,並且終於以下序列的下游約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的下游約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內,並且終於該富含T/C的序列的下游約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內,並且終於該5'-NTTN-3'序列的約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。在一些實施方式中,缺失始於富含T/C的序列的約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內,並且終於該富含T/C的序列的約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的下游約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內,並且終於該5'-NTTN-3'序列的下游約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。在一些實施方式中,缺失始於以下序列的下游約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,並且終於以下序列的下游約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的下游約5至約10個核苷酸(例如,約3、4、5、6、7、8、9、10、11、或12個核苷酸)內,並且終於該富含T/C的序列的下游約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該5'-NTTN-3'序列的約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。在一些實施方式中,缺失始於以下序列的約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於以下序列的約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該富含T/C的序列的約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的下游約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該5'-NTTN-3'序列的下游約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。在一些實施方式中,缺失始於以下序列的下游約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,並且終於以下序列的下游約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的下游約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該富含T/C的序列的下游約20至約30個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該5'-NTTN-3'序列的約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內。在一些實施方式中,缺失始於以下序列的約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於以下序列的約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該富含T/C的序列的約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的下游約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該5'-NTTN-3'序列的下游約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內。在一些實施方式中,缺失始於以下序列的下游約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,並且終於以下序列的下游約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的下游約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該富含T/C的序列的下游約20至約25個核苷酸(例如,約17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該5'-NTTN-3'序列的約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。在一些實施方式中,缺失始於以下序列的約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於以下序列的約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該富含T/C的序列的約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。
在一些實施方式中,缺失始於5'-NTTN-3'序列的下游約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該5'-NTTN-3'序列的下游約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。在一些實施方式中,缺失始於以下序列的下游約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,並且終於以下序列的下游約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些實施方式中,缺失始於富含T/C的序列的下游約10至約15個核苷酸(例如,約8、9、10、11、12、13、14、15、16、或17個核苷酸)內,並且終於該富含T/C的序列的下游約25至約30個核苷酸(例如,約22、23、24、25、26、27、28、29、30、31、32、或33個核苷酸)內。
在一些實施方式中,缺失的長度多達約50個核苷酸(例如,約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、或55個核苷酸)。在一些實施方式中,缺失的長度多達約40個核苷酸(例如,約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、或45個核苷酸)。在一些實施方式中,缺失的長度為約4個核苷酸至約40個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、或45個核苷酸)。在一些實施方式中,缺失的長度為約4個核苷酸至約25個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)。在一些實施方式中,缺失的長度為約10個核苷酸至約25個核苷酸(例如,約7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、或28個核苷酸)。在一些實施方式中,缺失的長度為約10個核苷酸至約15個核苷酸(例如,約7、8、9、10、11、12、13、14、15、16、或17個核苷酸)。
在一些實施方式中,本文所述之兩個或更多個RNA指導物用於引入長度大於40個核苷酸的缺失。在一些實施方式中,本文所述之兩個或更多個RNA指導物用於引入至少約41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、16、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、或400個核苷酸的缺失。在一些實施方式中,本文所述之兩個或更多個RNA指導物用於缺失TTR基因或SEQ ID NO: 228的全部或一部分。在一些實施方式中,本文所述之兩個或更多個RNA指導物用於缺失SEQ ID NO: 258的TTR編碼序列的全部或一部分。
在一些實施方式中,本文所述之方法用於改造在TTR基因中包含如本文所述之缺失的細胞。在一些實施方式中,該等方法使用包含如本文所述之Cas12i酶和RNA指導物的複合物來實施,該RNA指導物包含如本文所述之直接重複序列和間隔子序列。在一些實施方式中,RNA指導物的序列與SEQ ID NO: 345-362中任一個的序列具有至少90%的同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性)。在一些實施方式中,RNA指導物具有SEQ ID NO: 345-362中任一個的序列。
在一些實施方式中,靶向TTR的RNA指導物被編碼在質體中。在一些實施方式中,靶向TTR的RNA指導物係合成的或純化的RNA。在一些實施方式中,Cas12i多肽被編碼在質體中。在一些實施方式中,Cas12i多肽由合成的或純化的RNA編碼。
在一些實施方式中,本文所述之模板DNA用於糾正與疾病相關的突變。在一些實施方式中,突變係V30M、V122I、T60A、L58H、或I84S,並且疾病係hATTR、FAP、或SSA。在一些實施方式中,突變V30M、V122I、T60A、L58H、或I84S參考經翻譯後切割的SEQ ID NO: 257的TTR序列。當使用全長TTR序列(SEQ ID NO: 256)作為參考序列時,相對於SEQ ID NO: 256的全長TTR序列,該等突變被稱為V50M、V142I、T80A、L78H、和I104S。
在一些實施方式中,本文所述之模板DNA用於引入與疾病相關的保護性突變。在一些實施方式中,突變係T119M,並且疾病係hATTR。在一些實施方式中,突變係T119M,並且疾病係野生型ATTR類澱粉變性。在一些實施方式中,T119M突變參考經翻譯後切割的SEQ ID NO: 257的TTR序列。在一些實施方式中,相對於SEQ ID NO: 256的全長TTR序列,T119M突變被稱為T139M。
在一些實施方式中,本文所述之模板DNA用於糾正與疾病相關的突變並且引入保護性突變。在一些實施方式中,與疾病相關的突變係V30M、V122I、T60A、L58H、或I84S,並且疾病係(hATTR)。在一些實施方式中,保護性突變係T119M。在一些實施方式中,疾病係hATTR或野生型ATTR類澱粉變性。例如,在一些實施方式中,本文所述之模板DNA用於糾正V30M突變並且引入T119M突變。在一些實施方式中,本文所述之模板DNA用於糾正V122I突變並且引入T119M突變。在一些實施方式中,本文所述之模板DNA用於糾正T60A突變並且引入T119M突變。在一些實施方式中,本文所述之模板DNA用於糾正L58H突變並且引入T119M突變。在一些實施方式中,本文所述之模板DNA用於糾正I84S突變並且引入T119M突變。
在一些實施方式中,將***序列(例如,包含相對於靶核酸的序列差異的供體區)摻入靶區域(例如,RNA指導物結合的靶核酸區域)內的靶核酸中。在一些實施方式中,將***序列摻入靶區域外側的靶核酸中。在一些實施方式中,使用單股模板DNA藉由HDR將***序列摻入靶核酸的非靶股中。
在一些實施方式中,將突變摻入5’-NTTN-3’序列上游的靶核酸中。例如,將突變摻入5'-NTTN-3'序列的上游約20個核苷酸內,例如,5'-NTTN-3'序列的上游1個核苷酸、2個核苷酸、3個核苷酸、4個核苷酸、5個核苷酸、6個核苷酸、7個核苷酸、8個核苷酸、9個核苷酸、10個核苷酸、11個核苷酸、12個核苷酸、13個核苷酸、14個核苷酸、15個核苷酸、16個核苷酸、17個核苷酸、18個核苷酸、19個核苷酸、或20個核苷酸內。
在一些實施方式中,將突變摻入5’-NTTN-3’序列下游的靶核酸中。例如,可以將突變摻入5'-NTTN-3'序列的下游約60個核苷酸內,例如,5'-NTTN-3'序列的下游1個核苷酸、2個核苷酸、3個核苷酸、4個核苷酸、5個核苷酸、6個核苷酸、7個核苷酸、8個核苷酸、9個核苷酸、10個核苷酸、11個核苷酸、12個核苷酸、13個核苷酸、14個核苷酸、15個核苷酸、16個核苷酸、17個核苷酸、18個核苷酸、19個核苷酸、20個核苷酸、25個核苷酸、30個核苷酸、35個核苷酸、40個核苷酸、45個核苷酸、50個核苷酸、55個核苷酸、或60個核苷酸內。
在一些實施方式中,將本文所述之組成物引入多個細胞中。在一些實施方式中,至少約10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、或100%的細胞包含本文所述之缺失。在一些實施方式中,至少約1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、或25%的細胞包含野生型TTR基因(例如,一或多個以下突變被糾正:V30M、V122I、T60A、L58H、和I84S)。
在一些實施方式中,至少約10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、或100%的細胞包含本文所述之缺失。在一些實施方式中,至少約1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、或25%的細胞包含T119M突變。
在一些實施方式中,至少約10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、或100%的細胞包含本文所述之缺失。在一些實施方式中,至少約1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、或25%的細胞包含野生型TTR基因(例如,一或多個以下突變被糾正:V30M、V122I、T60A、L58H、和I84S)以及T119M突變。
在一些實施方式中,靶向TTR的RNA指導物被編碼在質體中。在一些實施方式中,靶向TTR的RNA指導物係合成的或純化的RNA。在一些實施方式中,Cas12i多肽被編碼在質體中。在一些實施方式中,Cas12i多肽由合成的或純化的RNA編碼。 C. 遞送
本文揭露的任何基因編輯系統的組分可以配製成例如包括運載體,如運載體和/或聚合物運載體(例如脂質體),並藉由已知的方法遞送至細胞(例如,原核、真核、植物、哺乳動物的細胞等)。這樣的方法包括但不限於轉染(例如,脂質介導的陽離子聚合物、磷酸鈣、樹枝狀聚合物);電穿孔或其他膜破壞方法(例如,核轉染)、病毒遞送(例如,慢病毒、反轉錄病毒、腺病毒、腺相關病毒(AAV))、顯微注射、微彈轟擊(「基因槍」)、fugene、直接聲載入、細胞擠壓、光轉染、原生質體融合、刺穿感染、磁轉染、胞泌體介導的轉移、脂質奈米顆粒介導的轉移、及其任何組合。
在一些實施方式中,該方法包括將一或多種核酸(例如,編碼Cas12i多肽、RNA指導物、模板DNA等的核酸)、其一或多種轉錄物、和/或預形成的RNA指導物/Cas12i多肽複合物遞送至細胞,在該細胞中形成三元複合物。在一些實施方式中,將RNA指導物和編碼Cas12i多肽的RNA在單個組成物中一起遞送。在一些實施方式中,將RNA指導物和編碼Cas12i多肽的RNA在分開的組成物中遞送。在一些實施方式中,使用相同的遞送技術遞送以分開的組成物遞送的RNA指導物和編碼Cas12i多肽的RNA。在一些實施方式中,使用不同的遞送技術遞送以分開的組成物遞送的RNA指導物和編碼Cas12i多肽的RNA。
在一些實施方式中,將Cas12i組分和RNA指導物組分一起遞送。例如,將Cas12i組分和RNA指導物組分一起包裝在單個AAV顆粒中。在另一實例中,將Cas12i組分和RNA指導物組分經由脂質奈米顆粒(LNP)一起遞送。在一些實施方式中,將Cas12i組分和RNA指導物組分分開遞送。例如,將Cas12i組分和RNA指導物組分包裝在分開的AAV顆粒中。在另一實例中,將Cas12i組分藉由第一遞送機制遞送,並將RNA指導物組分藉由第二遞送機制遞送。
示例性細胞內遞送方法包括但不限於:病毒(如AAV)、或病毒樣劑;基於化學的轉染方法,如使用磷酸鈣、樹枝狀聚合物、脂質體、或陽離子聚合物(例如,DEAE-葡聚糖或聚乙烯亞胺)的那些;非化學方法,如顯微注射、電穿孔、細胞擠壓、聲孔效應、光轉染、刺穿感染、原生質體融合、細菌軛合、質體或轉座子的遞送;基於粒子的方法,如使用基因槍、磁轉染或磁輔助轉染、粒子轟擊;以及混合方法,如核轉染。在一些實施方式中,脂質奈米顆粒包含編碼Cas12i多肽的mRNA、RNA指導物,或編碼Cas12i多肽和RNA指導物的mRNA。在一些實施方式中,編碼Cas12i多肽的mRNA係SEQ ID NO: 221或SEQ ID NO: 255闡述的核苷酸序列或其變體的轉錄物。在一些實施方式中,本申請進一步提供了藉由此類方法產生的細胞,以及包含此類細胞的或由此類細胞產生的生物(例如,動物、植物或真菌)。 D. 經基因修飾的細胞
可以將本文揭露的任何基因編輯系統遞送至多種細胞。在一些實施方式中,細胞係分離的細胞。在一些實施方式中,細胞在細胞培養物中或在兩種或更多種細胞類型的共培養物中。在一些實施方式中,細胞係離體的。在一些實施方式中,細胞獲自活的生物並維持在細胞培養物中。在一些實施方式中,細胞係單細胞生物。
在一些實施方式中,細胞係原核細胞。在一些實施方式中,細胞係細菌細胞或來源於細菌細胞。在一些實施方式中,細胞係古細菌細胞或來源於古細菌細胞。
在一些實施方式中,細胞係真核細胞。在一些實施方式中,細胞係植物細胞或來源於植物細胞。在一些實施方式中,細胞係真菌細胞或來源於真菌細胞。在一些實施方式中,細胞係動物細胞或來源於動物細胞。在一些實施方式中,細胞係無脊椎動物細胞或來源於無脊椎動物細胞。在一些實施方式中,細胞係脊椎動物細胞或來源於脊椎動物細胞。在一些實施方式中,細胞係哺乳動物細胞或來源於哺乳動物細胞。在一些實施方式中,細胞係人細胞。在一些實施方式中,細胞係斑馬魚細胞。在一些實施方式中,細胞係齧齒動物細胞。在一些實施方式中,細胞係合成製備的,有時稱為人工細胞。
在一些實施方式中,細胞來源於細胞系。用於組織培養的多種多樣的細胞系係本領域已知的。細胞系之實例包括但不限於293T、MF7、K562、HeLa、CHO、及其轉基因品種。細胞系可從熟悉該項技術者已知的多種來源獲得(參見例如,美國典型培養物保藏中心(ATCC)(維吉尼亞州馬納薩斯(Manassas, Va.)))。在一些實施方式中,細胞係永生或永生化細胞。
在一些實施方式中,細胞係原代細胞。在一些實施方式中,細胞係幹細胞,如全能幹細胞(例如,萬能)、富潛能幹細胞、多潛能幹細胞、寡潛能幹細胞或單潛能幹細胞。在一些實施方式中,細胞係誘導多能幹細胞(iPSC)或來源於iPSC。在一些實施方式中,細胞係分化細胞。例如,在一些實施方式中,分化細胞係肌肉細胞(例如,肌細胞)、脂肪細胞(例如,脂細胞)、骨細胞(bone cell)(例如,成骨細胞、骨細胞(osteocyte)、破骨細胞)、血細胞(例如,單核細胞、淋巴球、嗜中性球、嗜酸性球、嗜鹼性球、巨噬細胞、紅血球或血小板)、神經細胞(例如,神經元)、上皮細胞、免疫細胞(例如,淋巴球、嗜中性球、單核細胞或巨噬細胞)、肝臟細胞(例如,肝細胞)、成纖維細胞、或性細胞。在一些實施方式中,細胞係終末分化細胞。例如,在一些實施方式中,終末分化細胞係神經元細胞、脂細胞、心肌細胞、骨骼肌細胞、表皮細胞或腸道細胞。在一些實施方式中,細胞係免疫細胞。在一些實施方式中,免疫細胞係T細胞。在一些實施方式中,免疫細胞係B細胞。在一些實施方式中,免疫細胞係自然殺手(NK)細胞。在一些實施方式中,免疫細胞係腫瘤浸潤性淋巴球(TIL)。在一些實施方式中,細胞係哺乳動物細胞(例如,人細胞或鼠類細胞)。在一些實施方式中,鼠類細胞來源於野生型小鼠、免疫抑制小鼠或疾病特異性小鼠模型。在一些實施方式中,細胞係活組織、器官、或生物內的細胞。
使用本文揭露的任何基因編輯系統產生的任何經基因修飾的細胞也在本揭露內容之範圍內。這樣的經修飾的細胞可以包含經破壞的TTR基因。
本文揭露的任何基因編輯系統、包含該等基因編輯系統的組成物、載體、核酸、RNA指導物和細胞可用於療法中。本文揭露的基因編輯系統、組成物、載體、核酸、RNA指導物和細胞可用於治療受試者的疾病或病症之方法中。本領域已知的任何合適的遞送或投與方法可用於遞送本文揭露的組成物、載體、核酸、RNA指導物和細胞。這樣的方法可以涉及使靶序列與本文揭露的組成物、載體、核酸或RNA指導物接觸。這樣的方法可以涉及編輯如本文揭露的TTR序列的方法。在一些實施方式中,使用本文揭露的RNA指導物改造的細胞用於離體基因療法。 IV. 治療性應用
使用如本文揭露的這種基因編輯系統產生的任何基因編輯系統或經修飾的細胞可用於治療與TTR基因相關的疾病,例如澱粉樣變運甲狀腺素蛋白(ATTR)。在一些情況下,ATTR係遺傳性ATTR(hATTR)或野生型ATTR類澱粉變性。
hATTR類澱粉變性(也稱為運甲狀腺素蛋白家族性澱粉樣多發性神經病變(TTR-FAP)或家族性澱粉樣心肌病(TTR-FAC))係一種全身性障礙,其特徵在於錯誤折疊的運甲狀腺素蛋白(TTR)蛋白的細胞外沈積。正常情況下,TTR係由4個單鏈單體組成的四聚體。TTR基因突變被認為使蛋白質不穩定並導致四聚體解離成單體,該等單體聚集成澱粉樣原纖維。然後該等澱粉樣原纖維積聚在全身的多個器官中。
hATTR類澱粉變性係一種具有可變外顯率的體染色體顯性疾病。澱粉樣沈積或症狀性疾病典型地發生在30至70歲(取決於突變)的成年人中。已鑒定出超過120種澱粉樣變TTR突變。一些導致hATTR疾病的SNP/與hATTR疾病相關的SNP顯示在下表7中。DNA突變的位置係相對於SEQ ID NO: 258的TTR編碼序列。胺基酸突變的位置係相對於經翻譯後切割的SEQ ID NO: 257的TTR蛋白序列(頂部突變)或SEQ ID NO: 256的全長TTR蛋白序列(括弧中的底部突變)。 [ 7] . 導致 hATTR 疾病的 SNP/ hATTR 疾病相關的 SNP
DNA 突變 胺基酸突變 發病年齡 病程 位置 公佈的病例
WT 80 晚發型心臟受累 全世界 80歲以上的人約25%
c. 148G>A V30M (V50M) 30-60 出現多發性神經病變和自主神經機能異常,然後全身受累 全世界 > 400
c. 424G>A V122I (V142I) 60多歲 晚發型心臟類澱粉變性 非裔美國人 大多數係常見的變體
c. 238G>A T60A (T80A) 50多歲 晚發型心臟類澱粉變性伴一些神經受累 阿帕拉契山脈,愛爾蘭 > 40
c. 233T>A L58H (L78H) 40多歲 通常出現CTS,並在二十年內緩慢進展 馬里蘭(Maryland),德國 > 50
c. 311T>A I84S (I104S) 20-30 30歲時CTS,40-50多歲時玻璃體混濁,然後心臟受累 印第安那州(Indiana),瑞士 > 30
T119M突變被認為是非澱粉樣變的,並且穩定hATTR患者的TTR四聚體。參見例如Batista等人, Gene Therapy [基因療法] 21: 1041-50 (2014) 以及Yee等人, Nature Communications [自然通信] 10: 925 (2019)。因此,T119M被認為是一種保護性突變。可以引入T119M突變來治療具有澱粉樣變TTR突變的受試者的hATTR或治療具有野生型ATTR類澱粉變性的患者。
在一些實施方式中,本文提供了一種用於治療如本文揭露的靶疾病(例如澱粉樣變運甲狀腺素蛋白(ATTR),如hATTR)之方法,該方法包括向需要治療的受試者(例如,人患者)投與本文揭露的任何基因編輯系統。可以將基因編輯系統遞送至需要基因編輯的特定組織或特定類型的細胞。基因編輯系統可以包含含有該等組分中的一或多種的LNP、編碼該等組分中的一或多種的一或多種載體(例如,病毒載體)、或其組合。可以配製基因編輯系統的組分以形成藥物組成物,該藥物組成物可以進一步包含一或多種藥學上可接受的運載體。
在一些實施方式中,可以將使用本文揭露的任何基因編輯系統產生的經修飾細胞投與於需要治療的受試者(例如,人患者)。經修飾的細胞可以包含本文所述之取代、***和/或缺失。在一些實例中,經修飾的細胞可以包括由CRISPR核酸酶、反轉錄酶多肽和編輯模板RNA(例如,RNA指導物和RT供體RNA)修飾的細胞系。在一些情況下,經修飾的細胞可為包含具有不同類型基因編輯的細胞的異質群體。可替代地,經修飾的細胞可以包含含有TTR基因的一種特定基因編輯的基本上同質的細胞群(例如,整個群體中至少80%的細胞)。在一些實例中,可以使細胞懸浮於合適的培養基中。
在一些實施方式中,本文提供了一種包含基因編輯系統或其組分的組成物。這種組成物可為藥物組成物。可以將有用的藥物組成物以適合於口服、直腸、***、腸胃外、局部、肺、鼻內、病灶內、口腔、眼部、靜脈內、器官內或另外投與途徑的配製物製備、包裝或銷售。本揭露內容之藥物組成物可以作為單一單位劑量或作為多個單一單位劑量批量製備、包裝或銷售。如本文所用,「單位劑量」係將向受試者投與的藥物組成物(例如,基因編輯系統或其組分)的離散量、或這種劑量的方便的分數,例如,這種劑量的二分之一或三分之一。
適合於腸胃外投與的藥物組成物的配製物可以包含活性劑(例如,基因編輯系統或其組分或經修飾的細胞)與藥學上可接受的運載體(如無菌水或無菌等滲鹽水)的組合。這種配製物可以以適合於推注投與或連續投與的形式製備、包裝或銷售。一些可注射配製物可以以單位劑型(如在安瓿中或在含有防腐劑的多劑量容器中)製備、包裝或銷售。一些用於腸胃外投與的配製物包括但不限於懸浮液、溶液、油性或水性媒介物中的乳液、糊劑以及可植入的持續釋放或生物可降解配製物。一些配製物可以進一步包含一或多種額外的成分,包括但不限於懸浮劑、穩定劑或分散劑。
藥物組成物可為無菌可注射的水性或油性懸浮液或溶液的形式。這種懸浮液或溶液可以根據已知技術來配製,並且除了細胞之外還可以包含其他成分,例如本文所述之分散劑、潤濕劑或懸浮劑。這種無菌可注射配製物可以使用無毒的腸胃外可接受的稀釋劑或溶劑(如水或鹽水)來製備。其他可接受的稀釋劑以及溶劑包括但不限於林格溶液、等滲氯化鈉溶液以及固定油諸如合成的甘油單酯或甘油二酯。其他有用的腸胃外投與的配製物包括以下配製物,該等配製物可以包含在脂質體配製物或作為生物可降解聚合物系統的組分的呈包裝形式的細胞。一些用於持續釋放或植入的組成物可以包含藥學上可接受的聚合物或疏水材料,例如乳液、離子交換樹脂、微溶聚合物或微溶鹽。 V. 套組及其用途
本揭露內容還提供了可用以例如實施本文所述之用於對TTR基因進行基因修飾的方法的套組。在一些實施方式中,套組包括RNA指導物和Cas12i多肽。在一些實施方式中,套組包括RNA指導物、模板DNA、和Cas12i多肽。在一些實施方式中,套組包括編碼這種Cas12i多肽的多核苷酸,並且視需要,該多核苷酸被包含在例如如本文所述之載體內。在一些實施方式中,該套組包括編碼本文揭露的RNA指導物的多核苷酸。可以將Cas12i多肽(或編碼該Cas12i多肽的多核苷酸)和RNA指導物(例如,作為核糖核蛋白)包裝在套組內的相同容器或其他容器內,或者可以包裝在內容物可以在使用前混合的分開的小瓶或其他容器中。
可以將Cas12i多肽、RNA指導物、和模板DNA包裝在套組內的相同容器或其他容器內,或者可以包裝在內容物可以在使用前混合的分開的小瓶或其他容器中。視需要,套組還可以額外地包括緩衝液和/或RNA指導物、模板DNA、和Cas12i多肽的使用說明。
本文引用的所有參考文獻和出版物特此藉由援引併入。 額外的實施方式
下面提供了額外的實施方式,它們也在本揭露內容之範圍內。
實施方式1:一種包含RNA指導物的組成物,其中該RNA指導物包含 (i) 與TTR基因內的靶核酸的靶序列基本上互補或完全互補的間隔子序列,以及 (ii) 直接重複序列;其中該靶序列與包含序列5'-NTTN-3'的原型間隔子相鄰模體(PAM)相鄰。
在實施方式1中,TTR基因可以包含SEQ ID NO: 228的序列、SEQ ID NO: 228的反向互補序列、SEQ ID NO: 228的變體、SEQ ID NO: 228的變體的反向互補序列、SEQ ID NO: 258的序列、SEQ ID NO: 258的反向互補序列、SEQ ID NO: 258的變體、或SEQ ID NO: 258的變體的反向互補序列。在一些實例中,靶序列在TTR基因的外顯子1、外顯子2、外顯子3或外顯子4內。
在實施方式1中,間隔子序列包含: a. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸16; b. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸17; c. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸18; d. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸19; e. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸20; f. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸21; g. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸22; h. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸23; i. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸24; j. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸25; k. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸26; l. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸27; m. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸28; n. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸29;或 o. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸30。
在一些實例中,間隔子序列可以包含: a. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸16; b. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸17; c. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸18; d. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸19; e. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸20; f. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸21; g. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸22; h. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸23; i. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸24; j. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸25; k. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸26; l. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸27; m. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸28; n. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸29;或 o. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸30。
在實施方式1中,直接重複序列可以包含: a. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸36; b. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸2至核苷酸36; c. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸3至核苷酸36; d. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸4至核苷酸36; e. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸5至核苷酸36; f. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸6至核苷酸36; g. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸7至核苷酸36; h. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸8至核苷酸36; i. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸9至核苷酸36; j. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸10至核苷酸36; k. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸11至核苷酸36; l. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸12至核苷酸36; m. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸13至核苷酸36; n. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸14至核苷酸36; o. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸1至核苷酸34; p. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸2至核苷酸34; q. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸3至核苷酸34; r. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸4至核苷酸34; s. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸5至核苷酸34; t. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸6至核苷酸34; u. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸7至核苷酸34; v. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸8至核苷酸34; w. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸9至核苷酸34; x. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸10至核苷酸34; y. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸11至核苷酸34; z. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸12至核苷酸34;或 (aa) 與SEQ ID NO: 10的序列或其一部分具有至少90%同一性的序列。
在一些實例中,直接重複序列可以包含: a. SEQ ID NO: 1-8中任一個的核苷酸1至核苷酸36; b. SEQ ID NO: 1-8中任一個的核苷酸2至核苷酸36; c. SEQ ID NO: 1-8中任一個的核苷酸3至核苷酸36; d. SEQ ID NO: 1-8中任一個的核苷酸4至核苷酸36; e. SEQ ID NO: 1-8中任一個的核苷酸5至核苷酸36; f. SEQ ID NO: 1-8中任一個的核苷酸6至核苷酸36; g. SEQ ID NO: 1-8中任一個的核苷酸7至核苷酸36; h. SEQ ID NO: 1-8中任一個的核苷酸8至核苷酸36; i. SEQ ID NO: 1-8中任一個的核苷酸9至核苷酸36; j. SEQ ID NO: 1-8中任一個的核苷酸10至核苷酸36; k. SEQ ID NO: 1-8中任一個的核苷酸11至核苷酸36; l. SEQ ID NO: 1-8中任一個的核苷酸12至核苷酸36; m. SEQ ID NO: 1-8中任一個的核苷酸13至核苷酸36; n. SEQ ID NO: 1-8中任一個的核苷酸14至核苷酸36; o. SEQ ID NO: 9的核苷酸1至核苷酸34; p. SEQ ID NO: 9的核苷酸2至核苷酸34; q. SEQ ID NO: 9的核苷酸3至核苷酸34; r. SEQ ID NO: 9的核苷酸4至核苷酸34; s. SEQ ID NO: 9的核苷酸5至核苷酸34; t. SEQ ID NO: 9的核苷酸6至核苷酸34; u. SEQ ID NO: 9的核苷酸7至核苷酸34; v. SEQ ID NO: 9的核苷酸8至核苷酸34; w. SEQ ID NO: 9的核苷酸9至核苷酸34; x. SEQ ID NO: 9的核苷酸10至核苷酸34; y. SEQ ID NO: 9的核苷酸11至核苷酸34; z. SEQ ID NO: 9的核苷酸12至核苷酸34;或 aa. SEQ ID NO: 10或其一部分。
在實施方式1的任何組成物中,直接重複序列可以包含: a. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸36; b. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸2至核苷酸36; c. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸3至核苷酸36; d. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸4至核苷酸36; e. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸5至核苷酸36; f. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸6至核苷酸36; g. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸7至核苷酸36; h. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸8至核苷酸36; i. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸9至核苷酸36; j. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸10至核苷酸36; k. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸11至核苷酸36; l. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸12至核苷酸36; m. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸13至核苷酸36; n. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;或 o. 與SEQ ID NO: 251的序列或其一部分具有至少90%同一性的序列。
在一些實例中,直接重複序列可以包含: a. SEQ ID NO: 233-250中任一個的核苷酸1至核苷酸36; b. SEQ ID NO: 233-250中任一個的核苷酸2至核苷酸36; c. SEQ ID NO: 233-250中任一個的核苷酸3至核苷酸36; d. SEQ ID NO: 233-250中任一個的核苷酸4至核苷酸36; e. SEQ ID NO: 233-250中任一個的核苷酸5至核苷酸36; f. SEQ ID NO: 233-250中任一個的核苷酸6至核苷酸36; g. SEQ ID NO: 233-250中任一個的核苷酸7至核苷酸36; h. SEQ ID NO: 233-250中任一個的核苷酸8至核苷酸36; i. SEQ ID NO: 233-250中任一個的核苷酸9至核苷酸36; j. SEQ ID NO: 233-250中任一個的核苷酸10至核苷酸36; k. SEQ ID NO: 233-250中任一個的核苷酸11至核苷酸36; l. SEQ ID NO: 233-250中任一個的核苷酸12至核苷酸36; m. SEQ ID NO: 233-250中任一個的核苷酸13至核苷酸36; n. SEQ ID NO: 233-250中任一個的核苷酸14至核苷酸36;或 o. SEQ ID NO: 251或其一部分。
在其他實例中,直接重複序列可以包含: a. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸1至核苷酸36; b. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸2至核苷酸36; c. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸3至核苷酸36; d. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸4至核苷酸36; e. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸5至核苷酸36; f. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸6至核苷酸36; g. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸7至核苷酸36; h. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸8至核苷酸36; i. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸9至核苷酸36; j. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸10至核苷酸36; k. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸11至核苷酸36; l. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸12至核苷酸36; m. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸13至核苷酸36; n. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸14至核苷酸36;或 o. 與SEQ ID NO: 260或SEQ ID NO: 261的序列或其一部分具有至少90%同一性的序列。
在仍其他實例中,直接重複序列可以包含: a. SEQ ID NO: 259的核苷酸1至核苷酸36; b. SEQ ID NO: 259的核苷酸2至核苷酸36; c. SEQ ID NO: 259的核苷酸3至核苷酸36; d. SEQ ID NO: 259的核苷酸4至核苷酸36; e. SEQ ID NO: 259的核苷酸5至核苷酸36; f. SEQ ID NO: 259的核苷酸6至核苷酸36; g. SEQ ID NO: 259的核苷酸7至核苷酸36; h. SEQ ID NO: 259的核苷酸8至核苷酸36; i. SEQ ID NO: 259的核苷酸9至核苷酸36; j. SEQ ID NO: 259的核苷酸10至核苷酸36; k. SEQ ID NO: 259的核苷酸11至核苷酸36; l. SEQ ID NO: 259的核苷酸12至核苷酸36; m. SEQ ID NO: 259的核苷酸13至核苷酸36; n. SEQ ID NO: 259的核苷酸14至核苷酸36;或 o. SEQ ID NO: 260或SEQ ID NO: 261或其一部分。
在其他實例中,直接重複序列可以包含: a. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸1至核苷酸36; b. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸2至核苷酸36; c. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸3至核苷酸36; d. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸4至核苷酸36; e. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸5至核苷酸36; f. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸6至核苷酸36; g. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸7至核苷酸36; h. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸8至核苷酸36; i. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸9至核苷酸36; j. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸10至核苷酸36; k. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸11至核苷酸36; l. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸12至核苷酸36; m. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸13至核苷酸36; n. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸14至核苷酸36; o. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸15至核苷酸36;或 p. 與SEQ ID NO: 264的序列或其一部分具有至少90%同一性的序列。
在一些實例中,直接重複序列可以包含: a. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸1至核苷酸36; b. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸2至核苷酸36; c. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸3至核苷酸36; d. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸4至核苷酸36; e. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸5至核苷酸36; f. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸6至核苷酸36; g. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸7至核苷酸36; h. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸8至核苷酸36; i. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸9至核苷酸36; j. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸10至核苷酸36; k. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸11至核苷酸36; l. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸12至核苷酸36; m. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸13至核苷酸36; n. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸14至核苷酸36; o. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸15至核苷酸36;或p. SEQ ID NO: 264或其一部分。
在實施方式1的任何組成物中,間隔子序列與SEQ ID NO: 11-115中任一個的序列的互補序列基本上互補或完全互補。
在實施方式1的任何組成物中,PAM包含序列:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。
在一些實例中,靶序列緊鄰PAM序列。
在實施方式1的任何組成物中,RNA指導物具有如下序列,該序列與SEQ ID NO: 273-278或345-362中任一個的序列具有至少90%的同一性。在一些實例中,RNA指導物具有SEQ ID NO: 273-278或345-362中任一個的序列。
實施方式2:實施方式1的組成物可以進一步包含Cas12i多肽或編碼Cas12i多肽的多核糖核苷酸。在一些實例中,Cas12i多肽可為: a. Cas12i2多肽,該Cas12i2多肽包含與SEQ ID NO: 222、SEQ ID NO: 223、SEQ ID NO: 224、SEQ ID NO: 225、SEQ ID NO: 226、或SEQ ID NO: 227的序列具有至少90%同一性的序列; b. Cas12i4多肽,該Cas12i4多肽包含與SEQ ID NO: 253、SEQ ID NO: 254、或SEQ ID NO: 255的序列具有至少90%同一性的序列; c. Cas12i1多肽,該Cas12i1多肽包含與SEQ ID NO: 265的序列具有至少90%同一性的序列;或 d. Cas12i3多肽,該Cas12i3多肽包含與SEQ ID NO: 266的序列具有至少90%同一性的序列。
在一些實例中,Cas12i多肽係: a. Cas12i2多肽,該Cas12i2多肽包含SEQ ID NO: 222、SEQ ID NO: 223、SEQ ID NO: 224、SEQ ID NO: 225、SEQ ID NO: 226、或SEQ ID NO: 227的序列; b. Cas12i4多肽,該Cas12i4多肽包含SEQ ID NO: 253、SEQ ID NO: 254、或SEQ ID NO: 255的序列; c. Cas12i1多肽,該Cas12i1多肽包含SEQ ID NO: 265的序列;或 d. Cas12i3多肽,該Cas12i3多肽包含SEQ ID NO: 266的序列。
在一些實例中,RNA指導物和Cas12i多肽形成核糖核蛋白複合物。例如,核糖核蛋白複合物與靶核酸結合。
實施方式3:實施方式1或實施方式2的組成物可以進一步包含模板DNA,該模板DNA可以包含供體區,該供體區包含相對於靶核酸的第一序列差異。在一些情況下,模板DNA包含同源臂(例如,左同源臂和/或右同源臂)。在一些實例中,模板DNA係人DNA。
在一些實例中,模板DNA係雙股的。例如,雙股模板DNA的兩條股彼此基本上互補或完全互補。在其他實例中,模板DNA係單股的。在一些情況下,模板DNA係單股的,並且左同源臂或右同源臂各自獨立地與非靶股(PAM股)的對應區域具有至少80%、85%、90%、95%、99%、或100%的同一性。
在一些特定的實例中,模板DNA係單股的並且相對於靶股具有反向互補性。在一些情況下,模板DNA係單股的,並且左同源臂或右同源臂各自獨立地與靶股的對應區域具有至少80%、85%、90%、95%、99%、或100%的同一性。在其他情況下,模板DNA係單股的並且相對於非靶股具有反向互補性。
實施方式4:在實施方式1-3中任一個的任何組成物中,靶核酸包含與疾病相關的突變。例如,靶核酸包含具有與疾病相關的突變的TTR基因,並且模板DNA包含該TTR基因的野生型等位基因、或其與該突變對應的部分。
在一些實例中,模板DNA包含與靶核酸中的突變序列對應的野生型序列。在一些實例中,模板DNA不包含與疾病相關的突變。在一些實例中,模板DNA包含與疾病相關的突變。在特定的實例中,與疾病相關的突變係相對於SEQ ID NO: 257的TTR序列的V30M、V122I、T60A、L58H、或I84S。
在一些實例中,模板DNA包含與疾病相關的保護性突變。例如,模板DNA包含與疾病相關的突變或保護性突變。在特定的實例中,保護性突變係相對於SEQ ID NO: 257的TTR序列的T119M。
實施方式5:在實施方式1-4中任一個的任何組成物中,疾病係遺傳性ATTR(hATTR)或野生型ATTR類澱粉變性。
在一些實例中,模板DNA包含左同源臂但不包含右同源臂。在其他實例中,模板DNA包含右同源臂但不包含左同源臂。可替代地,模板DNA包含右同源臂和左同源臂。
在一些實例中,左同源臂與右同源臂長度相同或長度大致相同。在一些實例中,左同源臂的長度為約10-30、20-40、30-50、40-60、50-80、70-100、90-150、140-200、190-250、240-300、290-350、340-400、390-450、或440-500個核苷酸。在其他實例中,左同源臂的長度為約20-200個(例如,約20-25、25-30、30-35、35-40、40-45、45-50、50-55、55-60、60-65、65-70、70-75、75-80、80-85、85-90、90-95、95-100、100-105、105-110、110-115、115-120、120-125、125-130、130-135、135-140、140-145、145-150、150-155、155-160、160-165、165-170、170-175、175-180、180-185、185-190、190-195、或195-200個核苷酸)、約200-500個(例如,約200-210、210-220、220-230、230-240、240-250、250-260、260-270、270-280、280-290、290-300、300-310、310-320、320-330、330-340、340-350、350-360、360-370、370-380、380-390、390-400、400-410、410-420、420-430、430-440、440-450、450-460、460-470、470-480、480-490、或490-500個)核苷酸。
可替代地或額外地,右同源臂的長度為約10-30、20-40、30-50、40-60、60-80、80-100、100-150、150-200、200-250、250-300、300-350、350-400、400-450、或450-500個核苷酸。例如,右同源臂的長度為約20-200個(例如,約20-25、25-30、30-35、35-40、40-45、45-50、50-55、55-60、60-65、65-70、70-75、75-80、80-85、85-90、90-95、95-100、100-105、105-110、110-115、115-120、120-125、125-130、130-135、135-140、140-145、145-150、150-155、155-160、160-165、165-170、170-175、175-180、180-185、185-190、190-195、或195-200個核苷酸)、約200-500個(例如,約200-210、210-220、220-230、230-240、240-250、250-260、260-270、270-280、280-290、290-300、300-310、310-320、320-330、330-340、340-350、350-360、360-370、370-380、380-390、390-400、400-410、410-420、420-430、430-440、440-450、450-460、460-470、470-480、480-490、或490-500個)核苷酸。
實施方式6:在實施方式1-5中任一個的組成物中,供體區包含的第一序列差異位於靶序列的對應區域內。
在一些實例中,供體區包含的第一序列差異位於靶序列上游或下游10個核苷酸的對應區域內。在一些實例中,供體區包含的第一序列差異位於靶序列上游或下游5個核苷酸的對應區域內。在一些實例中,第一序列差異包含相對於靶核酸的取代。在一些實例中,第一序列差異包含沈默突變(例如,對密碼子的第三位置的、不改變由該密碼子編碼的胺基酸的突變)。在一些實例中,第一序列差異包含相對於靶核酸的多型性。
實施方式7:在實施方式1-6中任一個的組成物中,供體序列進一步包含相對於靶核酸的第二序列差異。
實施方式8:在實施方式1-7中任一個的組成物中,供體區包含的第二序列差異位於與靶序列對應的區域內。
在一些實例中,供體區包含的第二序列差異位於靶序列上游或下游10個核苷酸的對應區域內。在一些實例中,供體區包含的第二序列差異位於靶序列上游或下游5個核苷酸的對應區域內。在一些實例中,第二序列差異係取代。
實施方式9:在實施方式1-8中任一個的組成物中,供體區進一步包含相對於靶核酸的第三序列差異以及視需要的第四序列差異。
實施方式10:在實施方式1-9中任一個的組成物中,模板DNA包含一或多個核苷間修飾(例如,硫代磷酸酯修飾)。
在一些實例中,左同源臂包含一或多個核苷間修飾(例如,硫代磷酸酯修飾)。在一些實例中,右同源臂包含一或多個核苷間修飾(例如,硫代磷酸酯修飾)。可替代地,左同源臂包含一或多個核苷間修飾(例如,硫代磷酸酯修飾),並且右同源臂包含一或多個核苷間修飾(例如,硫代磷酸酯修飾)。在一些實例中,左同源臂包含兩個核苷間修飾(例如,硫代磷酸酯修飾),並且右同源臂包含兩個核苷間修飾(例如,硫代磷酸酯修飾)。
在一些特定的實例中,硫代磷酸酯修飾在左同源臂的5'端和右同源臂的3'端。在其他特定的實例中,左同源臂在右同源臂的5'並且該左同源臂包含在該左同源臂的5'端處的兩個硫代磷酸酯修飾,該右同源臂包含在該右同源臂的3'端處的兩個硫代磷酸酯修飾。
實施方式11:在實施方式1-10中任一個的組成物中,模板DNA係包含第一股和第二股的雙股DNA,其中該第一股包含在該第一股的5'端處的至少一個(例如,2個)硫代磷酸酯修飾或在該第一股的3'端處的至少一個(例如,2個)硫代磷酸酯修飾、或兩者。
在一些實例中,第二股包含在該第二股的5'端處的至少一個(例如,2個)硫代磷酸酯修飾或在該第二股的3'端處的至少一個(例如,2個)硫代磷酸酯修飾、或兩者。
實施方式12:實施方式1-11中任一個的組成物存在於細胞內。
實施方式13:在實施方式1-12中任一個的組成物中,RNA指導物和Cas12i多肽被編碼在載體(例如,表現載體)中。在一些實例中,RNA指導物和Cas12i多肽被編碼在單一載體中,或者該RNA指導物被編碼在第一載體中並且該Cas12i多肽被編碼在第二載體中。
實施方式14:在實施方式1-13中任一個的組成物中,模板DNA在載體中。
實施方式15,一種RNA指導物,該RNA指導物包含 (i) 與TTR基因內的靶序列基本上互補或完全互補的間隔子序列,以及 (ii) 直接重複序列。在一些實例中,靶序列在TTR基因的外顯子1、外顯子2、外顯子3或外顯子4內。在一些實例中,TTR基因包含SEQ ID NO: 228的序列、SEQ ID NO: 228的反向互補序列、SEQ ID NO: 228的變體、SEQ ID NO: 228的變體的反向互補序列、SEQ ID NO: 258的序列、SEQ ID NO: 258的反向互補序列、SEQ ID NO: 258的變體、或SEQ ID NO: 258的變體的反向互補序列。
在實施方式15中,間隔子序列可以包含:a. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸16;b. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸17;c. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸18;d. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸19;e. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸20;f. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸21;g. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸22;h. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸23;i. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸24;j. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸25;k. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸26;l. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸27;m. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸28;n. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸29;或o. 與SEQ ID NO: 116-220中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸30。
在一些實例中,間隔子序列可以包含:a. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸16;b. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸17;c. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸18;d. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸19;e. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸20;f. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸21;g. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸22;h. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸23;i. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸24;j. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸25;k. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸26;l. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸27;m. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸28;n. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸29;或o. SEQ ID NO: 116-220中任一個的核苷酸1至核苷酸30。
在實施方式15中,直接重複序列包含:a. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;b. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;c. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;d. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;e. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;f. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;g. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;h. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;i. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;j. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;k. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;l. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;m. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;n. 與SEQ ID NO: 1-8中任一個的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;o. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸1至核苷酸34;p. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸2至核苷酸34;q. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸3至核苷酸34;r. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸4至核苷酸34;s. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸5至核苷酸34;t. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸6至核苷酸34;u. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸7至核苷酸34;v. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸8至核苷酸34;w. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸9至核苷酸34;x. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸10至核苷酸34;y. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸11至核苷酸34;z. 與SEQ ID NO: 9的序列具有至少90%同一性的序列的核苷酸12至核苷酸34;或aa. 與SEQ ID NO: 10的序列或其一部分具有至少90%同一性的序列。
在一些實例中,直接重複序列可以包含:a. SEQ ID NO: 1-8中任一個的核苷酸1至核苷酸36;b. SEQ ID NO: 1-8中任一個的核苷酸2至核苷酸36;c. SEQ ID NO: 1-8中任一個的核苷酸3至核苷酸36;d. SEQ ID NO: 1-8中任一個的核苷酸4至核苷酸36;e. SEQ ID NO: 1-8中任一個的核苷酸5至核苷酸36;f. SEQ ID NO: 1-8中任一個的核苷酸6至核苷酸36;g. SEQ ID NO: 1-8中任一個的核苷酸7至核苷酸36;h. SEQ ID NO: 1-8中任一個的核苷酸8至核苷酸36;i. SEQ ID NO: 1-8中任一個的核苷酸9至核苷酸36;j. SEQ ID NO: 1-8中任一個的核苷酸10至核苷酸36;k. SEQ ID NO: 1-8中任一個的核苷酸11至核苷酸36;l. SEQ ID NO: 1-8中任一個的核苷酸12至核苷酸36;m. SEQ ID NO: 1-8中任一個的核苷酸13至核苷酸36;n. SEQ ID NO: 1-8中任一個的核苷酸14至核苷酸36;o. SEQ ID NO: 9的核苷酸1至核苷酸34;p. SEQ ID NO: 9的核苷酸2至核苷酸34;q. SEQ ID NO: 9的核苷酸3至核苷酸34;r. SEQ ID NO: 9的核苷酸4至核苷酸34;s. SEQ ID NO: 9的核苷酸5至核苷酸34;t. SEQ ID NO: 9的核苷酸6至核苷酸34;u. SEQ ID NO: 9的核苷酸7至核苷酸34;v. SEQ ID NO: 9的核苷酸8至核苷酸34;w. SEQ ID NO: 9的核苷酸9至核苷酸34;x. SEQ ID NO: 9的核苷酸10至核苷酸34;y. SEQ ID NO: 9的核苷酸11至核苷酸34;z. SEQ ID NO: 9的核苷酸12至核苷酸34;或aa.SEQ ID NO: 10或其一部分。
在一些實例中,直接重複序列包含:a. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;b. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;c. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;d. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;e. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;f. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;g. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;h. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;i. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;j. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;k. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;l. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;m. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;n. 與SEQ ID NO: 233-250中任一個的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;或o. 與SEQ ID NO: 251的序列或其一部分具有至少90%同一性的序列。
在一些實例中,直接重複序列包含:a. SEQ ID NO: 233-250中任一個的核苷酸1至核苷酸36;b. SEQ ID NO: 233-250中任一個的核苷酸2至核苷酸36;c. SEQ ID NO: 233-250中任一個的核苷酸3至核苷酸36;d. SEQ ID NO: 233-250中任一個的核苷酸4至核苷酸36;e. SEQ ID NO: 233-250中任一個的核苷酸5至核苷酸36;f. SEQ ID NO: 233-250中任一個的核苷酸6至核苷酸36;g. SEQ ID NO: 233-250中任一個的核苷酸7至核苷酸36;h. SEQ ID NO: 233-250中任一個的核苷酸8至核苷酸36;i. SEQ ID NO: 233-250中任一個的核苷酸9至核苷酸36;j. SEQ ID NO: 233-250中任一個的核苷酸10至核苷酸36;k. SEQ ID NO: 233-250中任一個的核苷酸11至核苷酸36;l. SEQ ID NO: 233-250中任一個的核苷酸12至核苷酸36;m. SEQ ID NO: 233-250中任一個的核苷酸13至核苷酸36;n. SEQ ID NO: 233-250中任一個的核苷酸14至核苷酸36;或o. SEQ ID NO: 251或其一部分。
在一些實例中,直接重複序列包含:a. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸1至核苷酸36;b. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸2至核苷酸36;c. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸3至核苷酸36;d. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸4至核苷酸36;e. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸5至核苷酸36;f. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸6至核苷酸36;g. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸7至核苷酸36;h. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸8至核苷酸36;i. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸9至核苷酸36;j. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸10至核苷酸36;k. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸11至核苷酸36;l. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸12至核苷酸36;m. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸13至核苷酸36;n. 與SEQ ID NO: 259具有至少90%同一性的序列的核苷酸14至核苷酸36;或o. 與SEQ ID NO: 260或SEQ ID NO: 261的序列或其一部分具有至少90%同一性的序列。
在一些實例中,直接重複序列包含:a. SEQ ID NO: 259的核苷酸1至核苷酸36;b. SEQ ID NO: 259的核苷酸2至核苷酸36;c. SEQ ID NO: 259的核苷酸3至核苷酸36;d. SEQ ID NO: 259的核苷酸4至核苷酸36;e. SEQ ID NO: 259的核苷酸5至核苷酸36;f. SEQ ID NO: 259的核苷酸6至核苷酸36;g. SEQ ID NO: 259的核苷酸7至核苷酸36;h. SEQ ID NO: 259的核苷酸8至核苷酸36;i. SEQ ID NO: 259的核苷酸9至核苷酸36;j. SEQ ID NO: 259的核苷酸10至核苷酸36;k. SEQ ID NO: 259的核苷酸11至核苷酸36;l. SEQ ID NO: 259的核苷酸12至核苷酸36;m. SEQ ID NO: 259的核苷酸13至核苷酸36;n. SEQ ID NO: 259的核苷酸14至核苷酸36;或o. SEQ ID NO: 260或SEQ ID NO: 261或其一部分。
在一些實例中,直接重複序列包含:a. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;b. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;c. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;d. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;e. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;f. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;g. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;h. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;i. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;j. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;k. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;l. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;m. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;n. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;o. 與SEQ ID NO: 262或SEQ ID NO: 263的序列具有至少90%同一性的序列的核苷酸15至核苷酸36;或p. 與SEQ ID NO: 264的序列或其一部分具有至少90%同一性的序列。
在一些實例中,直接重複序列包含:a. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸1至核苷酸36;b. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸2至核苷酸36;c. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸3至核苷酸36;d. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸4至核苷酸36;e. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸5至核苷酸36;f. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸6至核苷酸36;g. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸7至核苷酸36;h. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸8至核苷酸36;i. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸9至核苷酸36;j. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸10至核苷酸36;k. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸11至核苷酸36;l. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸12至核苷酸36;m. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸13至核苷酸36;n. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸14至核苷酸36;o. SEQ ID NO: 262或SEQ ID NO: 263的核苷酸15至核苷酸36;或p. SEQ ID NO: 264或其一部分。
在實施方式15中,間隔子序列與SEQ ID NO: 11-115中任一個的序列的互補序列基本上互補或完全互補。
在實施方式15中,靶序列與包含序列5'-NTTN-3'的原型間隔子相鄰模體(PAM)相鄰,其中N係任何核苷酸。在一些實例中,PAM包含序列5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。
在一些實例中,靶序列緊鄰PAM序列。
在特定的實例中,RNA指導物具有如下序列,該序列與SEQ ID NO: 273-278或345-362中任一個的序列具有至少90%的同一性。例如,RNA指導物具有SEQ ID NO: 273-278或345-362中任一個的序列。
實施方式16:一種核酸,該核酸編碼如本文所述之(例如,實施方式15中闡述的)RNA指導物。
實施方式17:一種載體,該載體包含如本文所述之(例如,實施方式16中闡述的)核酸。
實施方式18:一種載體系統,該載體系統包含一或多個載體,該一或多個載體編碼 (i) 如本文所述之RNA指導物,以及 (ii) Cas12i多肽,視需要其中該載體系統包含編碼該RNA指導物的第一載體和編碼該Cas12i多肽的第二載體。
實施方式19:一種細胞,該細胞包含如本文所述之組成物、RNA指導物、核酸、載體、或載體系統。在一些實例中,細胞係真核細胞、動物細胞、哺乳動物細胞、人細胞、原代細胞、細胞系、幹細胞、或T細胞。在特定的實例中,細胞係肝臟細胞(例如,肝細胞)。
實施方式20:一種套組,該套組包含本文所述之組成物、RNA指導物、核酸、載體、或載體系統。
實施方式21:一種編輯TTR序列之方法,該方法包括使TTR序列與如本文所述之組成物或RNA指導物接觸,其中視需要該方法在體內、體外、或離體進行。在一些實例中,TTR序列在細胞中。在一些實例中,組成物或RNA指導物誘導TTR序列的缺失。
在一些實例中,缺失與5'-NTTN-3'序列相鄰,其中N係任何核苷酸。例如,缺失在5'-NTTN-3'序列的下游。在一些情況下,缺失的長度係多達約50個核苷酸。在一些情況下,缺失的長度係多達約40個核苷酸。在一些情況下,缺失的長度係約4個核苷酸至40個核苷酸。在一些情況下,缺失的長度係約4個核苷酸至25個核苷酸。在一些特定的實例中,缺失的長度係約10個核苷酸至25個核苷酸。在其他特定的實例中,缺失的長度係約10個核苷酸至15個核苷酸。
在一些實例中,缺失始於5'-NTTN-3'序列的約5個核苷酸至約15個核苷酸內。在一些情況下,缺失始於5'-NTTN-3'序列的約5個核苷酸至約10個核苷酸內。在一些情況下,缺失始於5'-NTTN-3'序列的約10個核苷酸至約15個核苷酸內。在一些情況下,缺失始於5'-NTTN-3'序列的下游約5個核苷酸至約15個核苷酸內。在一些情況下,缺失始於5'-NTTN-3'序列的下游約5個核苷酸至約10個核苷酸內。在一些情況下,缺失始於5'-NTTN-3'序列的下游約10個核苷酸至約15個核苷酸內。
在一些實例中,缺失終於5'-NTTN-3'序列的約20個核苷酸至約30個核苷酸內。在一些情況下,缺失終於5'-NTTN-3'序列的約20個核苷酸至約25個核苷酸內。在一些情況下,缺失終於5'-NTTN-3'序列的約25個核苷酸至約30個核苷酸內。在一些情況下,缺失終於5'-NTTN-3'序列的下游約20個核苷酸至約30個核苷酸內。在一些情況下,缺失終於5'-NTTN-3'序列的下游約20個核苷酸至約25個核苷酸內。在一些情況下,缺失終於5'-NTTN-3'序列的下游約25個核苷酸至約30個核苷酸內。
在一些特定的實例中,缺失始於5'-NTTN-3'序列的下游約5個核苷酸至約15個核苷酸內,並且終於該5'-NTTN-3'序列的下游約20個核苷酸至約30個核苷酸內。在其他特定的實例中,缺失始於5'-NTTN-3'序列的下游約5個核苷酸至約15個核苷酸內,並且終於該5'-NTTN-3'序列的下游約20個核苷酸至約25個核苷酸內。在又其他特定的實例中,缺失始於5'-NTTN-3'序列的下游約5個核苷酸至約15個核苷酸內,並且終於該5'-NTTN-3'序列的下游約25個核苷酸至約30個核苷酸內。可替代地,缺失始於5'-NTTN-3'序列的下游約5個核苷酸至約10個核苷酸內,並且終於該5'-NTTN-3'序列的下游約20個核苷酸至約30個核苷酸內。在仍其他實例中,缺失始於5'-NTTN-3'序列的下游約5個核苷酸至約10個核苷酸內,並且終於該5'-NTTN-3'序列的下游約20個核苷酸至約25個核苷酸內。在其他情況下,缺失始於5'-NTTN-3'序列的下游約5個核苷酸至約10個核苷酸內,並且終於該5'-NTTN-3'序列的下游約25個核苷酸至約30個核苷酸內。在其他情況下,缺失始於5'-NTTN-3'序列的下游約10個核苷酸至約15個核苷酸內,並且終於該5'-NTTN-3'序列的下游約20個核苷酸至約30個核苷酸內。在又其他情況下,缺失始於5'-NTTN-3'序列的下游約10個核苷酸至約15個核苷酸內,並且終於該5'-NTTN-3'序列的下游約20個核苷酸至約25個核苷酸內。在又其他情況下,缺失始於5'-NTTN-3'序列的下游約10個核苷酸至約15個核苷酸內,並且終於該5'-NTTN-3'序列的下游約25個核苷酸至約30個核苷酸內。
在實施方式21的方法中,5'-NTTN-3'序列係5’-CTTT-3’、5’-CTTC-3’、5’-GTTT-3’、5’-GTTC-3’、5’-TTTC-3’、5’-GTTA-3’、或5’-GTTG-3’。
在一些實例中,缺失與基因中的突變重疊。在一些實例中,缺失破壞基因的一個或兩個等位基因。
在實施方式22的方法中,該方法將第一序列差異引入到靶核酸中。在一些實例中,供體區包含的第一序列差異位於靶序列內。在一些實例中,第一序列差異位於靶序列的上游或下游10個核苷酸內。在一些實例中,第一序列差異位於靶序列的上游或下游5個核苷酸內。在一些實例中,第一序列差異包含相對於靶核酸的取代。
在一些實例中,第一序列差異包含沈默突變(例如,對密碼子的第三位置的、不改變由該密碼子編碼的胺基酸的突變)。在一些實例中,第一序列差異包含相對於靶核酸的多型性。
在實施方式22的方法中,該方法將第二序列差異引入到靶核酸中。在一些實例中,第二序列差異位於靶序列內。在一些實例中,第二序列差異位於靶序列的上游或下游10個核苷酸內。在一些實例中,第二序列差異位於靶序列的上游或下游5個核苷酸內。在一些實例中,第二序列差異係取代。
在實施方式22的方法中,該方法進一步將第三序列差異以及視需要的第四序列差異引入到靶核酸中。
實施方式22的任何方法糾正與疾病相關的突變。在一些實例中,該方法引入保護性突變。在一些實例中,該方法糾正與疾病相關的突變並引入保護性突變。在一些情況下,疾病係hATTR或野生型ATTR類澱粉變性。在一些實例中,與疾病相關的突變係相對於SEQ ID NO: 257的TTR序列的V30M、V122I、T60A、L58H、或I84S。在一些實例中,保護性突變係相對於SEQ ID NO: 257的TTR序列的T119M。
實施方式22的任何方法都可以降低細胞中的TTR表現。可替代地,該方法可以穩定細胞中的TTR。在一些實例中,該方法減少細胞中澱粉樣原纖維的聚集。
在實施方式22的任何方法中,細胞係肝臟細胞(例如,肝細胞)。在一些實例中,細胞駐留在hATTR或野生型ATTR類澱粉變性患者中。
實施方式23:一種本文所述之組成物、RNA指導物、核酸、載體、載體系統、細胞、套組、或方法,RNA指導物包含SEQ ID NO: 273-278或345-362中任一個的序列。
實施方式24:一種治療受試者的澱粉樣病、老年系統性類澱粉變性、家族性澱粉樣多發性神經病變、或家族性澱粉樣心肌病之方法,該方法包括向該受試者投與本文所述之組成物、RNA指導物、或細胞。
實施方式25:一種本文所述之組成物、細胞、套組、或方法,RNA指導物和/或編碼Cas12i多肽的多核糖核苷酸被包含在脂質奈米顆粒內。
實施方式26:一種本文所述之組成物、細胞、套組、或方法,RNA指導物和編碼Cas12i多肽的多核糖核苷酸被包含在相同的脂質奈米顆粒內。
實施方式27:一種本文所述之組成物、細胞、套組、或方法,RNA指導物和編碼Cas12i多肽的多核糖核苷酸被包含在分開的脂質奈米顆粒內。
實施方式28:一種RNA指導物,該RNA指導物包含 (i) 與TTR基因內的靶序列互補的間隔子序列,以及 (ii) 直接重複序列,其中該靶序列係SEQ ID NO: 267-272或327-344中任一個的序列或其反向互補序列。在一些實例中,RNA指導物包含直接重複序列,該直接重複序列可為本文揭露的任何直接重複序列。在實施方式28的任何RNA指導物中,RNA指導物的前三個核苷酸中的每一個包含2'- O-甲基硫代磷酸酯修飾。可替代地或額外地,RNA指導物的最後四個核苷酸中的每一個包含2'- O-甲基硫代磷酸酯修飾。在特定的實例中,RNA指導物的倒數第二個、倒數第三個、以及倒數第四個核苷酸中的每一個包含2'- O-甲基硫代磷酸酯修飾,並且其中該RNA指導物的最後一個核苷酸未經修飾。 通用技術
除非另外指明,否則本揭露內容之實踐將採用分子生物學(包括重組技術)、微生物學、細胞生物學、生物化學和免疫學的常規技術,該等常規技術在本領域的技術範圍內。這樣的技術在文獻中得到充分的解釋,該等文獻如 Molecular Cloning: A Laboratory Manual[分子選殖:實驗室手冊] ,第二版 (Sambrook等人, 1989) 冷泉港出版社(Cold Spring Harbor Press); Oligonucleotide Synthesis[寡核苷酸合成] (M. J. Gait編輯 1984); Methods in Molecular Biology[分子生物學方法], 胡瑪納出版社(Humana Press); Cell Biology: A Laboratory Notebook[細胞生物學:實驗室筆記本] (J. E. Cellis編輯, 1989) 學術出版社(Academic Press);Animal Cell Culture [動物細胞培養] (R. I. Freshney編輯 1987);Introduction to Cell and Tissue Culture [細胞和組織培養簡介] (J. P. Mather和P. E. Roberts, 1998) 普萊南出版社(Plenum Press);Cell and Tissue Culture: Laboratory Procedures [細胞和組織培養:實驗室程序] (A. Doyle, J. B. Griffiths和D. G. Newell編輯1993-8) J. 威利父子公司(Wiley and Sons);Methods in Enzymology [酶學方法] (學術出版社公司(Academic Press, Inc.));Handbook of Experimental Immunology [實驗免疫學手冊] (D. M. Weir和C.C.Blackwell編輯): Gene Transfer Vectors for Mammalian Cells [哺乳動物細胞的基因轉移載體] (J. M. Miller和M. P. Calos編輯, 1987);Current Protocols in Molecular Biology [當前分子生物學方案] (F. M. Ausubel等人編輯1987);PCR: The Polymerase Chain Reaction [PCR:聚合酶鏈反應], (Mullis等人, 編輯1994);Current Protocols in Immunology [當前免疫學方案] (J. E. Coligan等人, 編輯, 1991);Short Protocols in Molecular Biology [精編分子生物學實驗指南] (威利父子公司(Wiley and Sons), 1999);Immunobiology [免疫生物學] (C.A. Janeway和P. Travers, 1997);Antibodies [抗體] (P. Finch, 1997);Antibodies: a practice approach [抗體:實踐方法] (D. Catty.編輯, IRL出版社(IRL Press), 1988-1989);Monoclonal antibodies: a practical approach [單株抗體:實踐方法] (P. Shepherd和C.Dean編輯, 牛津大學出版社(Oxford University Press), 2000);Using antibodies: a laboratory manual [使用抗體:實驗室手冊] (E. Harlow和D. Lane (冷泉港實驗室出版社(Cold Spring Harbor Laboratory Press), 1999);The Antibodies [抗體] (M. Zanetti和J. D. Capra編輯硬木學術出版社(Harwood Academic Publishers), 1995); DNA Cloning: A practical Approach[DNA選殖:實踐方法] ,第I和II卷 (D.N.Glover編輯 1985); Nucleic Acid Hybridization[核酸雜交] (B.D.Hames和S.J.Higgins編輯(1985)); Transcription and Translation[轉錄和翻譯] (B.D.Hames和S.J.Higgins編輯(1984)); Animal Cell Culture[動物細胞培養] (R.I.Freshney編輯 (1986)); Immobilized Cells and Enzymes[固定化細胞和酶] (IRL出版社(lRL Press), (1986));以及B. Perbal, A practical Guide To Molecular Cloning[分子選殖實用指南] (1984); F.M.Ausubel等人 (編輯)。
在無進一步詳述的情況下,認為熟悉該項技術者可以基於以上描述最大程度地利用本揭露內容。因此,以下特定的實施方式應解釋為僅僅是說明性的,並且不以任何方式限制本揭露內容之其餘部分。出於本文引用的目的或主題,將本文引用的所有出版物藉由援引併入。 實例
提供以下實例以進一步展示本揭露內容之一些實施方式,但並不旨在限制本揭露內容之範圍;藉由它們的示例性性質可以理解,可以可替代地使用熟悉該項技術者已知的其他程序、方法或技術。 實例 1 - 哺乳動物細胞中運甲狀腺素蛋白( TTR )靶位點的編輯
本實例描述了使用引入到HEK293T細胞中的Cas12i2將***缺失引入到TTR中。
Cas12i2 RNA指導物(crRNA)由綜合DNA技術公司(Integrated DNA Technologies)(IDT)設計,並訂購自該公司。將crRNA在250 mM NaCl中重懸至1 mM的最終濃度。序列顯示在表8中。 [ 8] . 靶序列和 crRNA 序列
指導物識別字 PAM* 靶股 靶序列(在非 PAM 股上) crRNA 序列
Cas12i2_TTR_ V30M_1 T TTC TS TGAACACATGCACGGCCACA(SEQ ID NO: 267) rArGrArArArUrCrCrGrUrCrUrUrUrCrArUrUrGrArCrGrGrUrGrArArCrArCrArUrGrCrArCrGrGrCrCrArCrA(SEQ ID NO: 273)
Cas12i2_TTR_ V30M_2 C TTT TS CTGAACACATGCACGGCCAC(SEQ ID NO: 268) rArGrArArArUrCrCrGrUrCrUrUrUrCrArUrUrGrArCrGrGrCrUrGrArArCrArCrArUrGrCrArCrGrGrCrCrArC(SEQ ID NO: 274)
Cas12i2_TTR_ V122I_1 A TTC BS CACCACGGCTGTCGTCACCA(SEQ ID NO: 269) rArGrArArArUrCrCrGrUrCrUrUrUrCrArUrUrGrArCrGrGrCrArCrCrArCrGrGrCrUrGrUrCrGrUrCrArCrCrA(SEQ ID NO: 275)
Cas12i2_TTR_ V122I_3 C TTG TS GGATTGGTGACGACAGCCGT(SEQ ID NO: 270) rArGrArArArUrCrCrGrUrCrUrUrUrCrArUrUrGrArCrGrGrGrGrArUrUrGrGrUrGrArCrGrArCrArGrCrCrGrU(SEQ ID NO: 276)
Cas12i2_TTR _T119M_1 A TTC BS CACCACGGCTGTCGTCACCA(SEQ ID NO: 271) rArGrArArArUrCrCrGrUrCrUrUrUrCrArUrUrGrArCrGrGrCrArCrCrArCrGrGrCrUrGrUrCrGrUrCrArCrCrA(SEQ ID NO: 277)
Cas12i2_TTR_T119M_2 C TTG TS GGATTGGTGACGACAGCCGT(SEQ ID NO: 272) rArGrArArArUrCrCrGrUrCrUrUrUrCrArUrUrGrArCrGrGrGrGrArUrUrGrGrUrGrArCrGrArCrArGrCrCrGrU(SEQ ID NO: 278)
*:TTN 3-nt PAM模體呈粗體。 TS係指「頂股」,BS係指「底股」
Cas12i2 RNP複合反應係藉由以下進行的:將純化的Cas12i2多肽(400 µM)與crRNA(在250 mM NaCl中1 mM)以1 : 1(Cas12i2多肽 : crRNA)的體積比(2.5 : 1的crRNA : Cas12i2莫耳比)混合。將複合反應在冰上孵育30-60 min。
孵育期間,使用TRYPLE TM(重組細胞解離酶;賽默飛世爾公司(ThermoFisher))收穫HEK293T細胞並計數。將細胞用PBS洗滌一次並重懸於SF緩衝液 + 補充劑(SF細胞系4D-NUCLEOFECTOR TMX套組S;龍沙公司(Lonza)編號V4XC-2032)中,濃度為16,480個細胞/µL。以3e5個細胞/反應液將重懸的細胞分配到龍沙公司的16孔NUCLEOCUVETTE®條中。將複合的Cas12i2 RNP以10 µM的最終濃度添加到每個反應液中。使用非靶向性指導物作為陰性對照。
使用電穿孔裝置(程式CM-130,龍沙公司4D-NUCLEOFECTOR TM)對該等條進行電穿孔。電穿孔後,立即將80 µL預熱的DMEM + 10% FBS添加到每個孔中,並藉由吸移輕輕混合。對於每個技術平行樣本板,將10 µL(30,000個細胞)稀釋的核轉染的細胞鋪板到預熱的96孔板中,孔中含有100 µL DMEM + 10% FBS。將編輯板在37°C和5% CO 2下孵育3天。
3天後,使用TRYPLE TM(重組細胞解離酶;賽默飛世爾公司)對孔進行收穫並轉移至96孔TWIN.TEC® PCR板(Eppendorf)PCR板。拂掉培養基,並將細胞重懸於20 µL的QUICKEXTRACT TM(DNA提取緩衝液;盧西根公司(Lucigen))中。然後在PCR機器中使樣本在65°C下循環15 min、在68°C下循環15 min、在98°C下循環10 min。然後將樣本在-20°C冷凍。
藉由多輪PCR製備用於下一代定序(NGS)的樣本。第一輪(PCR I)用於擴增靶位點側翼的基因組區域並添加NGS銜接子。第二輪(PCR II)用於添加NGS index。然後將反應液彙集,藉由柱純化進行純化,並在螢光計(Qubit)上定量。使用150循環NGS儀器(NEXTSEQ TMv2.5)中或高輸出套組(依諾米那公司(Illumina))運行定序,並在NGS儀器(NEXTSEQ TM550;依諾米那公司)上運行。
對於NGS分析,***缺失映射功能使用樣本的fastq檔、擴增子參考序列、和正向引物序列。對於每個讀段,使用kmer掃描演算法來計算讀段與參考序列之間的編輯操作(匹配、錯配、***、缺失)。為了去除一些樣本中存在的少量引物二聚體,每個讀段的前30 nt需要與參考匹配,並且超過一半的映射核苷酸為錯配的讀段也被濾除。通過該等過濾器的多達50,000個讀段用於分析,並且如果讀段含有***或缺失,則將其計為***缺失讀數。***缺失%計算為含有***缺失的讀段數目除以分析的讀段數目(藉由過濾器的讀段多達50,000個)。通過過濾器的最小讀段數目的QC標準係10,000。
1顯示了針對使用的每個RNA指導物都觀察到了***缺失活性。因此,Cas12i2能夠在已知攜帶與疾病相關的突變的區域中編輯TTR靶核酸的多個區域。 實例 2 - HDR 介導的 TTR 靶位點的編輯
本實例描述了使用引入到HEK293T細胞中的Cas12i2經由HDR引入在TTR靶位點內的取代。
Cas12i2 RNA指導物(crRNA)由綜合DNA技術公司(IDT)設計,並訂購自該公司。將crRNA在250 mM NaCl中重懸至1 mM的最終濃度。序列顯示在上表8中。
還由IDT設計並從IDT訂購了單股寡聚物供體(ssODN),並在水中重懸至100 µM的最終濃度。序列顯示在下 9中。ssODN被設計為在靶序列/指導物序列兩側具有40 bp或50 bp的同源臂,並且與靶DNA序列相比包含至少一個SNP修飾。前兩個鹼基經硫代磷酸酯修飾,並且最後3個鹼基中的2個鹼基經硫代磷酸酯修飾;最後一個鹼基未經修飾。引入了三個錯義突變(V30M、T119M、V122I),***或不***防止RNA指導物重新靶向的額外的沈默突變。每個錯義突變根據TTR前20個殘基的翻譯後蛋白質切割之後的胺基酸殘基編號。因此,作為實例,V50M被稱為V30M,因為前20個胺基酸在翻譯後被切割。 2係描繪在Cas12i2_TTR_HDR_T119M_2靶序列內引入40 bp同源臂和各種SNP的ssODN的示意圖。每個ssODN內引入的SNP在下面指示,而不是對應的核苷酸序列。
Cas12i2 RNP複合反應係藉由以下進行的:將純化的Cas12i2多肽(400 µM)與crRNA(在250 mM NaCl中1 mM)以1 : 1(Cas12i2多肽 : crRNA)的體積比(2.5 : 1的crRNA : Cas12i2多肽莫耳比)混合。將複合反應在冰上孵育30-60 min。
孵育期間,使用TRYPLE TM(重組細胞解離酶;賽默飛世爾公司)收穫HEK293T細胞並計數。將細胞用PBS洗滌一次並重懸於SF緩衝液 + 補充劑(SF細胞系4D-NUCLEOFECTOR TMX套組S;龍沙公司(Lonza)編號V4XC-2032)中,濃度為16,480個細胞/µL。以3e5個細胞/反應液將重懸的細胞分配到龍沙公司的16孔NUCLEOCUVETTE®條中。將複合的Cas12i2 RNP以10 µM的最終濃度添加到每個反應液中,然後添加4 µM最終濃度的ssODN供體序列。每個電穿孔反應液的最終體積為20 µL。使用非靶向性指導物作為陰性對照。
使用電穿孔裝置(程式CM-130,龍沙公司4D-NUCLEOFECTOR TM)對該等條進行電穿孔。電穿孔後,立即將80 µL預熱的DMEM + 10% FBS添加到每個孔中,並藉由吸移輕輕混合。對於每個技術平行樣本板,將10 µL(30,000個細胞)稀釋的核轉染的細胞鋪板到預熱的96孔板中,孔中含有100 µL DMEM + 10% FBS。將編輯板在37°C和5% CO 2下孵育3天。
3天後,使用TRYPLE TM(重組細胞解離酶;賽默飛世爾公司)對孔進行收穫並轉移至96孔TWIN.TEC® PCR板(Eppendorf)PCR板。拂掉培養基,並將細胞重懸於20 µL的DNA QUICKEXTRACT TM(DNA提取緩衝液;盧西根公司(Lucigen))中。然後在PCR機器中使樣本在65°C下循環15 min、在68°C下循環15 min、在98°C下循環10 min。然後將樣本在-20°C冷凍。
藉由多輪PCR製備用於下一代定序(NGS)的樣本。第一輪(PCR I)用於擴增靶位點側翼的基因組區域並添加NGS銜接子。第二輪(PCR II)用於添加NGS index。然後將反應液彙集,藉由柱純化進行純化,並在螢光計(Qubit)上定量。使用150循環NGS儀器(NEXTSEQ TMv2.5)中或高輸出套組(依諾米那公司(Illumina))運行定序,並在NGS儀器(NEXTSEQ TM550;依諾米那公司)上運行。 [ 9] . ssODN 序列
ssODN 識別字 指導物識別字 待糾正的 SNP SNP 在靶標內的位置 沈默突變的位置 總錯配數 同源臂長度 ssODN ssODN 序列
ssODN_40_TTR_HDR_V30M_1_13-14-17 Cas12i2_TTR_HDR_V30M_1 V30M(V50M)c.148G>A 13 14、17 3 40 BS CCAGAGGCAAATGGCTCCCAGGTGTCATCAGCAGCCTTTCTGAACACATGCATAGCTACATTGATGGCAGGACTGCCTCGGACAGCATCTAGAACTTTGA(SEQ ID NO: 279)
ssODN_40_TTR_HDR_V30M_1_13-14-17-20 Cas12i2_TTR_HDR_V30M_1 V30M(V50M)c.148G>A 13 14、17、20 4 40 BS CCAGAGGCAAATGGCTCCCAGGTGTCATCAGCAGCCTTTCTGAACACATGCATAGCTACGTTGATGGCAGGACTGCCTCGGACAGCATCTAGAACTTTGA(SEQ ID NO: 280)
ssODN_40_TTR_HDR_V30M_1_13SNP Cas12i2_TTR_HDR_V30M_1 V30M(V50M)c.148G>A 13 N/A 1 40 BS CCAGAGGCAAATGGCTCCCAGGTGTCATCAGCAGCCTTTCTGAACACATGCATGGCCACATTGATGGCAGGACTGCCTCGGACAGCATCTAGAACTTTGA(SEQ ID NO: 281)
ssODN_40_TTR_HDR_V30M_1_平鋪 Cas12i2_TTR_HDR_V30M_1 V30M(V50M)c.148G>A 13 1、2、5、8、 14、17、20 8 40 BS CCAGAGGCAAATGGCTCCCAGGTGTCATCAGCAGCCTTTCGAAATACGTGCATAGCTACGTTGATGGCAGGACTGCCTCGGACAGCATCTAGAACTTTGA(SEQ ID NO: 282)
ssODN_40_TTR_HDR_V30M_2_2-3-6-9-14-15-18 Cas12i2_TTR_HDR_V30M_2 V30M(V50M)c.148G>A 14 2、3、6、9、 15,18 7 40 BS CCCAGAGGCAAATGGCTCCCAGGTGTCATCAGCAGCCTTTCGAAATACGTGCATAGCTACATTGATGGCAGGACTGCCTCGGACAGCATCTAGAACTTTG(SEQ ID NO: 283)
ssODN_40_TTR_HDR_V30M_2_14-15-18 Cas12i2_TTR_HDR_V30M_2 V30M(V50M)c.148G>A 14 15,18 3 40 BS CCCAGAGGCAAATGGCTCCCAGGTGTCATCAGCAGCCTTTCTGAACACATGCATAGCTACATTGATGGCAGGACTGCCTCGGACAGCATCTAGAACTTTG(SEQ ID NO: 284)
ssODN_40_TTR_HDR_V30M_2_14SNP Cas12i2_TTR_HDR_V30M_2 V30M(V50M)c.148G>A 14 N/A 1 40 BS CCCAGAGGCAAATGGCTCCCAGGTGTCATCAGCAGCCTTTCTGAACACATGCATGGCCACATTGATGGCAGGACTGCCTCGGACAGCATCTAGAACTTTG(SEQ ID NO: 285)
ssODN_40_TTR_HDR_V30M_2_平鋪 Cas12i2_TTR_HDR_V30M_2 V30M(V50M)c.148G>A 14 -1、2、3、6、9、15、18 8 40 BS CCCAGAGGCAAATGGCTCCCAGGTGTCATCAGCAGCCTTCCGAAATACGTGCATAGCTACATTGATGGCAGGACTGCCTCGGACAGCATCTAGAACTTTG(SEQ ID NO: 286)
ssODN_40_TTR_HDR_T119M_1_--2—1-1-4-6 Cas12i2_TTR_HDR_T119M_1 T119M(T139M)c.416C>T 6 -2、-1、1、4 5 40 TS GCTACACCATTGCCGCCCTGCTGAGCCCCTACTCCTATAGTACTATGGCTGTCGTCACCAATCCCAAGGAATGAGGGACTTCTCCTCCAGTGGACCTGAA(SEQ ID NO: 287)
ssODN_40_TTR_HDR_T119M_1_6-13-16-19 Cas12i2_TTR_HDR_T119M_1 T119M(T139M)c.416C>T 6 13、16、19 4 40 TS GCTACACCATTGCCGCCCTGCTGAGCCCCTACTCCTATTCCACCATGGCTGTTGTTACTAATCCCAAGGAATGAGGGACTTCTCCTCCAGTGGACCTGAA(SEQ ID NO: 288)
ssODN_40_TTR_HDR_T119M_1_6SNP Cas12i2_TTR_HDR_T119M_1 T119M(T139M)c.416C>T 6 N/A 1 40 TS GCTACACCATTGCCGCCCTGCTGAGCCCCTACTCCTATTCCACCATGGCTGTCGTCACCAATCCCAAGGAATGAGGGACTTCTCCTCCAGTGGACCTGAA(SEQ ID NO: 289)
ssODN_40_TTR_HDR_T119M_1_平鋪 Cas12i2_TTR_HDR_T119M_1 T119M(T139M)c.416C>T 6 -2、-1、1、4、10、13、16、19 9 40 TS GCTACACCATTGCCGCCCTGCTGAGCCCCTACTCCTATAGTACTATGGCCGTTGTTACTAATCCCAAGGAATGAGGGACTTCTCCTCCAGTGGACCTGAA(SEQ ID NO: 290)
ssODN_40_TTR_HDR_T119M_2_3-6-19 Cas12i2_TTR_HDR_T119M_2 T119M(T139M)c.416C>T 19 3,6 3 40 BS GTCCTTCAGGTCCACTGGAGGAGAAGTCCCTCATTCCTTGGGGTTAGTGACGACAGCCATGGTGGAATAGGAGTAGGGGCTCAGCAGGGCGGCAATGGTG(SEQ ID NO: 291)
ssODN_40_TTR_HDR_T119M_2_12-15-19 Cas12i2_TTR_HDR_T119M_2 T119M(T139M)c.416C>T 19 12,15 3 40 BS GTCCTTCAGGTCCACTGGAGGAGAAGTCCCTCATTCCTTGGGATTGGTGACAACGGCCATGGTGGAATAGGAGTAGGGGCTCAGCAGGGCGGCAATGGTG(SEQ ID NO: 292)
ssODN_40_TTR_HDR_T119M_2_19SNP Cas12i2_TTR_HDR_T119M_2 T119M(T139M)c.416C>T 19 N/A 1 40 BS GTCCTTCAGGTCCACTGGAGGAGAAGTCCCTCATTCCTTGGGATTGGTGACGACAGCCATGGTGGAATAGGAGTAGGGGCTCAGCAGGGCGGCAATGGTG(SEQ ID NO: 293)
ssODN_40_TTR_HDR_T119M_2_平鋪 Cas12i2_TTR_HDR_T119M_2 T119M(T139M)c.416C>T 19 3、6、9、12、 15 6 40 BS GTCCTTCAGGTCCACTGGAGGAGAAGTCCCTCATTCCTTGGGGTTAGTAACAACGGCCATGGTGGAATAGGAGTAGGGGCTCAGCAGGGCGGCAATGGTG(SEQ ID NO: 294)
ssODN_40_TTR_HDR_V122I_1_1-4-7-10-13-14-19 Cas12i2_TTR_HDR_V122I_1 V122I(V142I)c.424G>A 14 1、4、7、10、 13,19 7 40 TS GCTACACCATTGCCGCCCTGCTGAGCCCCTACTCCTATTCTACTACAGCCGTTATCACTAATCCCAAGGAATGAGGGACTTCTCCTCCAGTGGACCTGAA(SEQ ID NO: 295)
ssODN_40_TTR_HDR_V122I_1_13-14-19 Cas12i2_TTR_HDR_V122I_1 V122I(V142I)c.424G>A 14 13,19 3 40 TS GCTACACCATTGCCGCCCTGCTGAGCCCCTACTCCTATTCCACCACGGCTGTTATCACTAATCCCAAGGAATGAGGGACTTCTCCTCCAGTGGACCTGAA(SEQ ID NO: 296)
ssODN_40_TTR_HDR_V122I_1_14SNP Cas12i2_TTR_HDR_V122I_1 V122I(V142I)c.424G>A 14 N/A 1 40 TS GCTACACCATTGCCGCCCTGCTGAGCCCCTACTCCTATTCCACCACGGCTGTCATCACCAATCCCAAGGAATGAGGGACTTCTCCTCCAGTGGACCTGAA(SEQ ID NO: 297)
ssODN_40_TTR_HDR_V122I_1_平鋪 Cas12i2_TTR_HDR_V122I_1 V122I(V142I)c.424G>A 14 -2、-1、1、4、7、 10、13、19 9 40 TS GCTACACCATTGCCGCCCTGCTGAGCCCCTACTCCTATAGTACTACAGCCGTTATCACTAATCCCAAGGAATGAGGGACTTCTCCTCCAGTGGACCTGAA(SEQ ID NO: 298)
ssODN_40_TTR_HDR_V122I_3_11-12-15 Cas12i2_TTR_HDR_V122I_3 V122I(V142I)c.424G>A 11 12,15 3 40 BS GTCCTTCAGGTCCACTGGAGGAGAAGTCCCTCATTCCTTGGGATTGGTGATAACGGCCGTGGTGGAATAGGAGTAGGGGCTCAGCAGGGCGGCAATGGTG(SEQ ID NO: 299)
ssODN_40_TTR_HDR_V122I_3_11-12-15-18 Cas12i2_TTR_HDR_V122I_3 V122I(V142I)c.424G>A 11 12、15、18 4 40 BS GTCCTTCAGGTCCACTGGAGGAGAAGTCCCTCATTCCTTGGGATTGGTGATAACGGCTGTGGTGGAATAGGAGTAGGGGCTCAGCAGGGCGGCAATGGTG(SEQ ID NO: 300)
ssODN_40_TTR_HDR_V122I_3_11SNP Cas12i2_TTR_HDR_V122I_3 V122I(V142I)c.424G>A 11 N/A 1 40 BS GTCCTTCAGGTCCACTGGAGGAGAAGTCCCTCATTCCTTGGGATTGGTGATGACAGCCGTGGTGGAATAGGAGTAGGGGCTCAGCAGGGCGGCAATGGTG(SEQ ID NO: 301)
ssODN_40_TTR_HDR_V122I_3_平鋪 Cas12i2_TTR_HDR_V122I_3 V122I(V142I)c.424G>A 11 3、6、12、15、18 6 40 BS GTCCTTCAGGTCCACTGGAGGAGAAGTCCCTCATTCCTTGGGGTTAGTGATAACGGCTGTGGTGGAATAGGAGTAGGGGCTCAGCAGGGCGGCAATGGTG(SEQ ID NO: 302)
ssODN_50_TTR_HDR_T119M_1_--2—1-1-4-6 Cas12i2_TTR_HDR_T119M_1 T119M(T139M)c.416C>T 6 -2、-1、1、4 5 50 TS GGCCCCCGCCGCTACACCATTGCCGCCCTGCTGAGCCCCTACTCCTATAGTACTATGGCTGTCGTCACCAATCCCAAGGAATGAGGGACTTCTCCTCCAGTGGACCTGAAGGACGAGGGA(SEQ ID NO: 303)
ssODN_50_TTR_HDR_T119M_1_6-13-16-19 Cas12i2_TTR_HDR_T119M_1 T119M(T139M)c.416C>T 6 13、16、19 4 50 TS GGCCCCCGCCGCTACACCATTGCCGCCCTGCTGAGCCCCTACTCCTATTCCACCATGGCTGTTGTTACTAATCCCAAGGAATGAGGGACTTCTCCTCCAGTGGACCTGAAGGACGAGGGA(SEQ ID NO: 304)
ssODN_50_TTR_HDR_T119M_1_6SNP Cas12i2_TTR_HDR_T119M_1 T119M(T139M)c.416C>T 6 N/A 1 50 TS GGCCCCCGCCGCTACACCATTGCCGCCCTGCTGAGCCCCTACTCCTATTCCACCATGGCTGTCGTCACCAATCCCAAGGAATGAGGGACTTCTCCTCCAGTGGACCTGAAGGACGAGGGA(SEQ ID NO: 305)
ssODN_50_TTR_HDR_T119M_1_平鋪 Cas12i2_TTR_HDR_T119M_1 T119M(T139M)c.416C>T 6 -2、-1、1、4、10、 13、16、19 9 50 TS GGCCCCCGCCGCTACACCATTGCCGCCCTGCTGAGCCCCTACTCCTATAGTACTATGGCCGTTGTTACTAATCCCAAGGAATGAGGGACTTCTCCTCCAGTGGACCTGAAGGACGAGGGA(SEQ ID NO: 306)
ssODN_50_TTR_HDR_T119M_2_3-6-19 Cas12i2_TTR_HDR_T119M_2 T119M(T139M)c.416C>T 19 3,6 3 50 BS CCCATCCCTCGTCCTTCAGGTCCACTGGAGGAGAAGTCCCTCATTCCTTGGGGTTAGTGACGACAGCCATGGTGGAATAGGAGTAGGGGCTCAGCAGGGCGGCAATGGTGTAGCGGCGGG(SEQ ID NO: 307)
ssODN_50_TTR_HDR_T119M_2_12-15-19 Cas12i2_TTR_HDR_T119M_2 T119M(T139M)c.416C>T 19 12,15 3 50 BS CCCATCCCTCGTCCTTCAGGTCCACTGGAGGAGAAGTCCCTCATTCCTTGGGATTGGTGACAACGGCCATGGTGGAATAGGAGTAGGGGCTCAGCAGGGCGGCAATGGTGTAGCGGCGGG(SEQ ID NO: 308)
ssODN_50_TTR_HDR_T119M_2_19SNP Cas12i2_TTR_HDR_T119M_2 T119M(T139M)c.416C>T 19 N/A 1 50 BS CCCATCCCTCGTCCTTCAGGTCCACTGGAGGAGAAGTCCCTCATTCCTTGGGATTGGTGACGACAGCCATGGTGGAATAGGAGTAGGGGCTCAGCAGGGCGGCAATGGTGTAGCGGCGGG(SEQ ID NO: 309)
ssODN_50_TTR_HDR_T119M_2_平鋪 Cas12i2_TTR_HDR_T119M_2 T119M(T139M)c.416C>T 19 3、6、9、12、 15 6 50 BS CCCATCCCTCGTCCTTCAGGTCCACTGGAGGAGAAGTCCCTCATTCCTTGGGGTTAGTAACAACGGCCATGGTGGAATAGGAGTAGGGGCTCAGCAGGGCGGCAATGGTGTAGCGGCGGG(SEQ ID NO: 310)
ssODN_50_TTR_HDR_V30M_1_13-14-17 Cas12i2_TTR_HDR_V30M_1 V30M(V50M)c.148G>A 13 14,17 3 50 BS GGCAACTTACCCAGAGGCAAATGGCTCCCAGGTGTCATCAGCAGCCTTTCTGAACACATGCATAGCTACATTGATGGCAGGACTGCCTCGGACAGCATCTAGAACTTTGACCATCAGAGG(SEQ ID NO: 311)
ssODN_50_TTR_HDR_V30M_1_13-14-17-20 Cas12i2_TTR_HDR_V30M_1 V30M(V50M)c.148G>A 13 14、17、20 4 50 BS GGCAACTTACCCAGAGGCAAATGGCTCCCAGGTGTCATCAGCAGCCTTTCTGAACACATGCATAGCTACGTTGATGGCAGGACTGCCTCGGACAGCATCTAGAACTTTGACCATCAGAGG(SEQ ID NO: 312)
ssODN_50_TTR_HDR_V30M_1_13SNP Cas12i2_TTR_HDR_V30M_1 V30M(V50M)c.148G>A 13 N/A 1 50 BS GGCAACTTACCCAGAGGCAAATGGCTCCCAGGTGTCATCAGCAGCCTTTCTGAACACATGCATGGCCACATTGATGGCAGGACTGCCTCGGACAGCATCTAGAACTTTGACCATCAGAGG(SEQ ID NO: 313)
ssODN_50_TTR_HDR_V30M_1_平鋪 Cas12i2_TTR_HDR_V30M_1 V30M(V50M)c.148G>A 13 1、2、5、8、 14、17、20 8 50 BS GGCAACTTACCCAGAGGCAAATGGCTCCCAGGTGTCATCAGCAGCCTTTCGAAATACGTGCATAGCTACGTTGATGGCAGGACTGCCTCGGACAGCATCTAGAACTTTGACCATCAGAGG(SEQ ID NO: 314)
ssODN_50_TTR_HDR_V30M_2_2-3-6-9-14-15-18 Cas12i2_TTR_HDR_V30M_2 V30M(V50M)c.148G>A 14 2、3、6、9、 15,18 7 50 BS TGGCAACTTACCCAGAGGCAAATGGCTCCCAGGTGTCATCAGCAGCCTTTCGAAATACGTGCATAGCTACATTGATGGCAGGACTGCCTCGGACAGCATCTAGAACTTTGACCATCAGAG(SEQ ID NO: 315)
ssODN_50_TTR_HDR_V30M_2_14-15-18 Cas12i2_TTR_HDR_V30M_2 V30M(V50M)c.148G>A 14 15,18 3 50 BS TGGCAACTTACCCAGAGGCAAATGGCTCCCAGGTGTCATCAGCAGCCTTTCTGAACACATGCATAGCTACATTGATGGCAGGACTGCCTCGGACAGCATCTAGAACTTTGACCATCAGAG(SEQ ID NO: 316)
ssODN_50_TTR_HDR_V30M_2_14SNP Cas12i2_TTR_HDR_V30M_2 V30M(V50M)c.148G>A 14 N/A 1 50 BS TGGCAACTTACCCAGAGGCAAATGGCTCCCAGGTGTCATCAGCAGCCTTTCTGAACACATGCATGGCCACATTGATGGCAGGACTGCCTCGGACAGCATCTAGAACTTTGACCATCAGAG(SEQ ID NO: 317)
ssODN_50_TTR_HDR_V30M_2_平鋪 Cas12i2_TTR_HDR_V30M_2 V30M(V50M)c.148G>A 14 -1、2、3、6、9、15、18 8 50 BS TGGCAACTTACCCAGAGGCAAATGGCTCCCAGGTGTCATCAGCAGCCTTCCGAAATACGTGCATAGCTACATTGATGGCAGGACTGCCTCGGACAGCATCTAGAACTTTGACCATCAGAG(SEQ ID NO: 318)
ssODN_50_TTR_HDR_V122I_1_1-4-7-10-13-14-19 Cas12i2_TTR_HDR_V122I_1 V122I(V142I)c.424G>A 14 1、4、7、10、 13,19 7 50 TS GGCCCCCGCCGCTACACCATTGCCGCCCTGCTGAGCCCCTACTCCTATTCTACTACAGCCGTTATCACTAATCCCAAGGAATGAGGGACTTCTCCTCCAGTGGACCTGAAGGACGAGGGA(SEQ ID NO: 319)
ssODN_50_TTR_HDR_V122I_1_13-14-19 Cas12i2_TTR_HDR_V122I_1 V122I(V142I)c.424G>A 14 13,19 3 50 TS GGCCCCCGCCGCTACACCATTGCCGCCCTGCTGAGCCCCTACTCCTATTCCACCACGGCTGTTATCACTAATCCCAAGGAATGAGGGACTTCTCCTCCAGTGGACCTGAAGGACGAGGGA(SEQ ID NO: 320)
ssODN_50_TTR_HDR_V122I_1_14SNP Cas12i2_TTR_HDR_V122I_1 V122I(V142I)c.424G>A 14 N/A 1 50 TS GGCCCCCGCCGCTACACCATTGCCGCCCTGCTGAGCCCCTACTCCTATTCCACCACGGCTGTCATCACCAATCCCAAGGAATGAGGGACTTCTCCTCCAGTGGACCTGAAGGACGAGGGA(SEQ ID NO: 321)
ssODN_50_TTR_HDR_V122I_1_tiled Cas12i2_TTR_HDR_V122I_1 V122I(V142I)c.424G>A 14 -2、-1、1、4、7、 10、13、19 9 50 TS GGCCCCCGCCGCTACACCATTGCCGCCCTGCTGAGCCCCTACTCCTATAGTACTACAGCCGTTATCACTAATCCCAAGGAATGAGGGACTTCTCCTCCAGTGGACCTGAAGGACGAGGGA(SEQ ID NO: 322)
ssODN_50_TTR_HDR_V122I_3_11-12-15 Cas12i2_TTR_HDR_V122I_3 V122I(V142I)c.424G>A 11 12,15 3 50 BS CCCATCCCTCGTCCTTCAGGTCCACTGGAGGAGAAGTCCCTCATTCCTTGGGATTGGTGATAACGGCCGTGGTGGAATAGGAGTAGGGGCTCAGCAGGGCGGCAATGGTGTAGCGGCGGG(SEQ ID NO: 323)
ssODN_50_TTR_HDR_V122I_3_11-12-15-18 Cas12i2_TTR_HDR_V122I_3 V122I(V142I)c.424G>A 11 12、15、18 4 50 BS CCCATCCCTCGTCCTTCAGGTCCACTGGAGGAGAAGTCCCTCATTCCTTGGGATTGGTGATAACGGCTGTGGTGGAATAGGAGTAGGGGCTCAGCAGGGCGGCAATGGTGTAGCGGCGGG(SEQ ID NO: 324)
ssODN_50_TTR_HDR_V122I_3_11SNP Cas12i2_TTR_HDR_V122I_3 V122I(V142I)c.424G>A 11 N/A 1 50 BS CCCATCCCTCGTCCTTCAGGTCCACTGGAGGAGAAGTCCCTCATTCCTTGGGATTGGTGATGACAGCCGTGGTGGAATAGGAGTAGGGGCTCAGCAGGGCGGCAATGGTGTAGCGGCGGG(SEQ ID NO: 325)
ssODN_50_TTR_HDR_V122I_3_tiled Cas12i2_TTR_HDR_V122I_3 V122I(V142I)c.424G>A 11 3、6、12、15、18 6 50 BS CCCATCCCTCGTCCTTCAGGTCCACTGGAGGAGAAGTCCCTCATTCCTTGGGGTTAGTGATAACGGCTGTGGTGGAATAGGAGTAGGGGCTCAGCAGGGCGGCAATGGTGTAGCGGCGGG(SEQ ID NO: 326)
對於NGS分析,***缺失映射功能使用樣本的fastq檔、擴增子參考序列、和正向引物序列。對於每個讀段,使用kmer掃描演算法來計算讀段與參考序列之間的編輯操作(匹配、錯配、***、缺失)。為了去除一些樣本中存在的少量引物二聚體,每個讀段的前30 nt需要與參考匹配,並且超過一半的映射核苷酸為錯配的讀段也被濾除。通過該等過濾器的多達50,000個讀段用於分析,並且如果讀段含有***或缺失,則將其計為***缺失讀數。***缺失%計算為含有***缺失的讀段數目除以分析的讀段數目(藉由過濾器的讀段多達50,000個)。完全HDR整合%計算為含有整個整合的ssODN序列的讀段數目除以分析的讀段數目(藉由過濾器的讀段多達50,000個)。部分HDR整合%計算為含有與指導物序列重疊的20 bp ssODN序列的讀段數目除以分析的讀段數目(藉由過濾器的讀段多達50,000個)。總編輯%藉由將***缺失%與完全HDR整合%相加來計算。總之,完全HDR整合%代表整個ssODN供體被整合到正確的基因組位置的讀段數目,而部分HDR整合%代表含有與指導物序列重疊的20 bp ssODN序列(即含有SNP的區域)的任何讀段(有或沒有***缺失)。通過過濾器的最小讀段數目的QC標準係10,000。
2顯示了用Cas12i2進行RNP轉染後在HEK293T細胞中V30M基因座處的HDR模板化取代的效率。 3顯示了用Cas12i2進行RNP轉染後在HEK293T細胞中V122I基因座處的HDR模板化取代的效率。 4顯示了用Cas12i2進行RNP轉染後在HEK293T細胞中T119M基因座處的HDR模板化取代的效率。黑色條反映在一個生物平行樣本中測量的平均完全HDR整合編輯%,淺灰色條反映平均部分SNP整合編輯%,並且中灰色條代表總編輯%(上述)。誤差條代表三個技術平行樣本的平均值。
2 3、和 4所顯示,觀察到了包含至少三個SNP的ssODN供體完全整合的顯著水平。單個SNP ssODN供體樣本中較低的完全HDR整合%可能是由於RNA指導物的重新靶向水平較高。
本實例顯示了可以用Cas12i2經由HDR將SNP引入到TTR靶位點內。例如,可以將與疾病相關的保護性SNP(例如,T119M)引入到TTR基因中。此外,可以使用這種方法糾正與疾病相關的SNP(例如,V30M和V122I)。 實例 3 - HEK293T 細胞中 Cas12i2 介導的 TTR 靶位點的編輯
本實例描述了使用引入到HEK293T細胞中的Cas12i2藉由RNP對TTR基因進行基因組編輯。
Cas12i2 RNA指導物(crRNA)由綜合DNA技術公司(IDT)設計,並訂購自該公司。將crRNA在250 mM NaCl中重懸至1 mM的最終濃度。靶標和RNA指導物序列顯示在 10中。 [ 10] . TTR 靶標和 RNA 指導物序列
靶標 PAM 序列 * 靶序列 crRNA 序列
E1T1 C TTC TCATCGTCTGCTCCTCCTCT(SEQ ID NO: 327) AGAAAUCCGUCUUUCAUUGACGGUCAUCGUCUGCUCCUCCUCU(SEQ ID NO: 345)
E2T1 C TTC TCTACACCCAGGGCACCGGT(SEQ ID NO: 328) AGAAAUCCGUCUUUCAUUGACGGUCUACACCCAGGGCACCGGU(SEQ ID NO: 346)
E2T2 C TTT GACCATCAGAGGACACTTGG(SEQ ID NO: 329) AGAAAUCCGUCUUUCAUUGACGGGACCAUCAGAGGACACUUGG(SEQ ID NO: 347)
E2T3 G TTC TAGATGCTGTCCGAGGCAGT(SEQ ID NO: 330) AGAAAUCCGUCUUUCAUUGACGGUAGAUGCUGUCCGAGGCAGU(SEQ ID NO: 348)
E2T4 G TTC AGAAAGGCTGCTGATGACAC(SEQ ID NO: 331) AGAAAUCCGUCUUUCAUUGACGGAGAAAGGCUGCUGAUGACAC(SEQ ID NO: 349)
E2T5 C TTT CTGAACACATGCACGGCCAC(SEQ ID NO: 332) AGAAAUCCGUCUUUCAUUGACGGCUGAACACAUGCACGGCCAC(SEQ ID NO: 350)
E2T6 C TTT GGCAACTTACCCAGAGGCAA(SEQ ID NO: 333) AGAAAUCCGUCUUUCAUUGACGGGGCAACUUACCCAGAGGCAA(SEQ ID NO: 351)
E2T7 G TTC TTTGGCAACTTACCCAGAGG(SEQ ID NO: 334) AGAAAUCCGUCUUUCAUUGACGGUUUGGCAACUUACCCAGAGG(SEQ ID NO: 352)
E3T1 C TTT CACACCTTATAGGAAAACCA(SEQ ID NO: 335) AGAAAUCCGUCUUUCAUUGACGGCACACCUUAUAGGAAAACCA(SEQ ID NO: 353)
E3T2 C TTC TACAAATTCCTCCTCAGTTG(SEQ ID NO: 336) AGAAAUCCGUCUUUCAUUGACGGUACAAAUUCCUCCUCAGUUG(SEQ ID NO: 354)
E3T3 C TTT GTATATCCCTTCTACAAATT(SEQ ID NO: 337) AGAAAUCCGUCUUUCAUUGACGGGUAUAUCCCUUCUACAAAUU(SEQ ID NO: 355)
E3T4 C TTC CAGTAAGATTTGGTGTCTAT(SEQ ID NO: 338) AGAAAUCCGUCUUUCAUUGACGGCAGUAAGAUUUGGUGUCUAU(SEQ ID NO: 356)
E4T1 A TTG CCGCCCTGCTGAGCCCCTAC(SEQ ID NO: 339) AGAAAUCCGUCUUUCAUUGACGGCCGCCCUGCUGAGCCCCUAC(SEQ ID NO: 357)
E4T2 A TTC CACCACGGCTGTCGTCACCA(SEQ ID NO: 340) AGAAAUCCGUCUUUCAUUGACGGCACCACGGCUGUCGUCACCA(SEQ ID NO: 358)
E4T3 A TTG GTGACGACAGCCGTGGTGGA(SEQ ID NO: 341) AGAAAUCCGUCUUUCAUUGACGGGUGACGACAGCCGUGGUGGA(SEQ ID NO: 359)
E4T4 C TTG GGATTGGTGACGACAGCCGT(SEQ ID NO: 342) AGAAAUCCGUCUUUCAUUGACGGGGAUUGGUGACGACAGCCGU(SEQ ID NO: 360)
E4T5 A TTC CTTGGGATTGGTGACGACAG(SEQ ID NO: 343) AGAAAUCCGUCUUUCAUUGACGGCUUGGGAUUGGUGACGACAG(SEQ ID NO: 361)
E4T6 C TTC AGGTCCACTGGAGGAGAAGT(SEQ ID NO: 344) AGAAAUCCGUCUUUCAUUGACGGAGGUCCACUGGAGGAGAAGU(SEQ ID NO: 362)
*:TTN 3-nt PAM模體呈粗體。
Cas12i2 RNP複合反應係藉由以下進行的:將純化的Cas12i2多肽(400 µM)與crRNA(在250 mM NaCl中1 mM)以1 : 1(Cas12i2多肽 : crRNA)的體積比(2.5 : 1的crRNA : Cas12i2多肽莫耳比)混合。將複合反應在冰上孵育30-60 min。
孵育期間,使用TRYPLE TM(重組細胞解離酶;賽默飛世爾公司)收穫HEK293T細胞並計數。將細胞用PBS洗滌一次並重懸於SF緩衝液 + 補充劑(SF細胞系4D-NUCLEOFECTOR TMX套組S;龍沙公司(Lonza)編號V4XC-2032)中,濃度為16,480個細胞/µL。以3e5個細胞/反應液將重懸的細胞分配到龍沙公司的16孔NUCLEOCUVETTE®條中。將複合的Cas12i2 RNP以10 µM的最終濃度添加到每個反應液中。使用非靶向性指導物作為陰性對照。
使用電穿孔裝置(程式CM-130,龍沙公司4D-NUCLEOFECTOR TM)對該等條進行電穿孔。電穿孔後,立即將80 µL預熱的DMEM + 10% FBS添加到每個孔中,並藉由吸移輕輕混合。對於每個技術平行樣本板,將10 µL(30,000個細胞)稀釋的核轉染的細胞鋪板到預熱的96孔板中,孔中含有100 µL DMEM + 10% FBS。將編輯板在37°C和5% CO 2下孵育3天。
3天後,使用TRYPLE TM(重組細胞解離酶;賽默飛世爾公司)對孔進行收穫並轉移至96孔TWIN.TEC® PCR板(Eppendorf)PCR板。拂掉培養基,並將細胞重懸於20 µL的QUICKEXTRACT TM(DNA提取緩衝液;盧西根公司(Lucigen))中。然後在PCR機器中使樣本在65°C下循環15 min、在68°C下循環15 min、在98°C下循環10 min。然後將樣本在-20°C冷凍。
藉由多輪PCR製備用於下一代定序(NGS)的樣本。第一輪(PCR I)用於擴增靶位點側翼的基因組區域並添加NGS銜接子。第二輪(PCR II)用於添加NGS index。然後將反應液彙集,藉由柱純化進行純化,並在螢光計(Qubit)上定量。使用150循環NGS儀器(NEXTSEQ TMv2.5)中或高輸出套組(依諾米那公司(Illumina))運行定序,並在NGS儀器(NEXTSEQ TM550;依諾米那公司)上運行。
對於NGS分析,***缺失映射功能使用樣本的fastq檔、擴增子參考序列、和正向引物序列。對於每個讀段,使用kmer掃描演算法來計算讀段與參考序列之間的編輯操作(匹配、錯配、***、缺失)。為了去除一些樣本中存在的少量引物二聚體,每個讀段的前30 nt需要與參考匹配,並且超過一半的映射核苷酸為錯配的讀段也被濾除。通過該等過濾器的多達50,000個讀段用於分析,並且如果讀段含有***或缺失,則將其計為***缺失讀數。***缺失%計算為含有***缺失的讀段數目除以分析的讀段數目(藉由過濾器的讀段多達50,000個)。通過過濾器的最小讀段數目的QC標準係10,000。
6顯示了RNP遞送後HEK293T細胞中的TTR中的***缺失。誤差條代表一個生物平行樣本中三個技術平行樣本的平均值。遞送後,在18個測試的TTR靶序列中的每一個中檢測到***缺失。在14個RNA指導物(E2T3、E3T3、和E4T6)的至少40%的NGS讀段中檢測到***缺失。在3個RNA指導物(E2T3、E3T3、和E4T6)的至少80%的NGS讀段中檢測到***缺失。
因此,本實例顯示了在哺乳動物細胞(如HEK293T細胞)中,Cas12i2 RNP可以靶向TTR的外顯子1、外顯子2、外顯子3、和外顯子4。 實例 4 - HepG2 細胞中 Cas12i2 介導的 TTR 靶位點的編輯
本實例描述了使用引入到HepG2細胞中的Cas12i2藉由RNP對TTR基因進行基因組編輯。
Cas12i2 RNP複合反應係藉由以下進行的:將純化的Cas12i2多肽與表8的靶向TTR的crRNA以2.5 : 1的crRNA : Cas12i2莫耳比混合。將複合反應在冰上孵育30-60 min。
使用TRYPLE TM(重組細胞解離酶;賽默飛世爾公司)收穫HepG2細胞並計數。將細胞用PBS洗滌一次並重懸於SF緩衝液 + 補充劑(SF細胞系4D-NUCLEOFECTOR TMX套組S;龍沙公司(Lonza)編號V4XC-2032)中,濃度為13,889個細胞/µL。以2.5e5個細胞/反應液將重懸的細胞分配到龍沙公司的16孔NUCLEOCUVETTE®條中。在沒有轉染增強寡聚物的情況下,將複合的Cas12i2 RNP以20 µM(Cas12i2)的最終濃度添加到每個反應液中。每個電穿孔反應液的最終體積為20 µL。使用非靶向性指導物作為陰性對照。
使用電穿孔裝置(程式DJ-100,龍沙公司4D-NUCLEOFECTOR TM)對該等條進行電穿孔。電穿孔後,立即將80 µL預熱的EMEM + 10% FBS添加到每個孔中,並藉由吸移輕輕混合。對於每個技術平行樣本板,將10 µL(25,000個細胞)稀釋的核轉染的細胞鋪板到預熱的96孔板中,孔中含有100 µL EMEM + 10% FBS。將編輯板在37°C和5% CO 2下孵育3天。
3天後,使用TRYPLE TM(重組細胞解離酶;賽默飛世爾公司)對孔進行收穫並轉移至96孔TWIN.TEC® PCR板(Eppendorf)。拂掉培養基,並將細胞重懸於20 µL的QUICKEXTRACT TM(DNA提取緩衝液;盧西根公司)中。然後在PCR機器中使樣本在65°C下循環15 min、在68°C下循環15 min、在98°C下循環10 min。然後如實例1所述將樣本在-20°C冷凍並藉由NGS分析。
7顯示了在RNP遞送後在HepG2細胞中的TTR靶位點中包含***缺失的NGS讀段的百分比。誤差條代表一個生物平行樣本中三個技術平行樣本的平均值。遞送後,在18個測試的TTR靶位點中的17個中檢測到***缺失。在6個RNA指導物(E1T1、E2T1、E2T3、E2T5、E3T3、和E3T4)的至少80%的NGS讀段中檢測到***缺失。
因此,本實例顯示了在哺乳動物細胞(如HepG2細胞)中,Cas12i2 RNP可以靶向TTR的外顯子1、外顯子2、外顯子3、和外顯子4。 實例 5 - 原代肝細胞中 Cas12i2 介導的 TTR 靶位點的編輯
本實例描述了使用引入到原代肝細胞中的Cas12i2藉由RNP對TTR的基因組編輯。
Cas12i2 RNP複合反應如實例3中所述使用14個被鑒定為在HepG2細胞中具有活性的RNA指導物進行。
將來自人供體的原代肝細胞在37°C水浴中迅速從液氮中解凍。將細胞添加到預熱的肝細胞回收培養基(賽默飛世爾公司,CM7000)並以100 g離心10分鐘。將細胞沈澱重懸於適當體積的肝細胞鋪板培養基(對威廉斯氏培養基E(Williams’ Medium E,賽默飛世爾公司A1217601)補充肝細胞鋪板補充包(Hepatocyte Plating Supplement Pack)(含血清),賽默飛世爾公司CM3000)中。使用INCUCYTE®一次性血細胞計數器(飛世爾科技公司(Fisher Scientific),22-600-100)對細胞進行台盼藍活力計數。然後將細胞在PBS中洗滌並重懸於P3緩衝液 + 補充劑(P3原代細胞4D-NUCLEOFECTOR TMX套組S;龍沙公司,VXP-3032)中,濃度為約7,500個細胞/µL。以150,000個細胞/反應液將重懸的細胞分配到龍沙公司的16孔NUCLEOCUVETTE®條中。將複合的Cas12i2 RNP以20 µM(Cas12i2)的最終濃度添加到每個反應液中,然後添加4 µM最終濃度的轉染增強寡聚物。每個電穿孔反應液的最終體積為20 µL。使用非靶向性指導物作為陰性對照。
使用電穿孔裝置(程式DS-150,龍沙公司4D-NUCLEOFECTOR TM)對該等條進行電穿孔。電穿孔後,立即將45 µL預熱的肝細胞鋪板培養基添加到每個孔中,並藉由吸移輕輕混合。對於每個技術平行樣本板,將65 µL(150,000個細胞)稀釋的核轉染的細胞鋪板到預熱的膠原包被的96孔板(賽默飛世爾公司)中,孔中含有60 µL的肝細胞鋪板培養基。然後將細胞在37°C的培養箱中孵育。4小時後細胞附著後,將培養基更換為肝細胞維持培養基(對威廉斯氏培養基E(賽默飛世爾公司A1217601)補充威廉斯氏E培養基細胞維持混合物(賽默飛世爾公司CM 4000))。在RNP電穿孔後1天、3天和5天更換新鮮的肝細胞維持培養基。
在RNP電穿孔後3天或7天,藉由以下收穫細胞:收集培養基並藉由與溶解在含有Ca/Mg的PBS(賽默飛世爾公司)中的2 mg/ml膠原酶IV(賽默飛世爾公司,17104019)在37°C培養箱中振盪(500 rpm)來分離細胞。細胞從板中解離後,將它們轉移至96孔TWIN.TEC® PCR板(Eppendorf)並離心。拂掉培養基,並將細胞重懸於20 µL的QUICKEXTRACT TM(DNA提取緩衝液;盧西根公司(Lucigen))中。然後在PCR機器中使樣本在65°C下循環15 min、在68°C下循環15 min、在98°C下循環10 min。然後如實例1所述將樣本在-20°C冷凍並藉由NGS分析。
在電穿孔後7天收穫細胞時,將來自每個孔的培養基以100 g離心10分鐘並將上清液儲存在-80°C用於隨後的ELISA測定。按照製造商的說明,將來自每種條件的細胞培養上清液稀釋至最佳稀釋度(1 : 20)並進行TTR ELISA(人)(奧維亞生物技術有限公司(Aviva Systems Biology),OKBB01176)。
8A顯示,每個測試的靶向TTR的RNA指導物在TTR靶位點中誘導了***缺失。非靶向性對照沒有誘導出***缺失。14個測試的TTR靶標中有5個在超過90%的NGS讀段中測量到***缺失。在RNP電穿孔後長達7天,原代人肝細胞保留了***缺失。
8B顯示,每個測試的RNP在原代人肝細胞中誘導了***缺失並降低了TTR蛋白水平。黑色數據點對應於與非人靈長類動物中的TTR序列同源的TTR靶標;灰色數據點對應於與非人靈長類動物中的TTR序列不同源的TTR靶標。14個RNA指導物中的11個在超過60%的NGS讀段中誘導了***缺失,並且相對於非靶向性對照將TTR蛋白水平降低了至少60%。RNA指導物E1T1、E2T3、E2T5、E3T3、和E3T4在超過80%的NGS讀段中誘導了***缺失,並且相對於非靶向性對照將TTR蛋白水平降低了至少80%。
因此,本實例顯示在哺乳動物細胞(如原代人肝細胞)中,TTR可以被Cas12i2 RNP靶向。 實例 6 - Cas12i2 Cas12i4 靶向 HepG2 細胞中的 TTR 靶序列
本實例描述了使用藉由暫態轉染引入至HepG2細胞中的變體對多個TTR靶標進行的***缺失評估。
將SEQ ID NO: 224和SEQ ID NO: 227的Cas12i2變體以及SEQ ID NO: 255的Cas12i4變體單獨選殖至pcda3.1骨架(英傑公司(Invitrogen))中。將編碼RNA指導物的核酸選殖到pUC19骨架(新英格蘭生物實驗室公司(New England Biolabs))中。然後將質體大量製備並且稀釋。RNA指導物和靶序列顯示在 11中。 [ 11] . TTR 靶序列和對應的 crRNA
靶標識別字 靶序列 Cas12i2 crRNA 序列 Cas12i4 crRNA 序列
E1T1 TCATCGTCTGCTCCTCCTCT(SEQ ID NO: 327) AGAAAUCCGUCUUUCAUUGACGGUCAUCGUCUGCUCCUCCUCU(SEQ ID NO: 345) AGACAUGUGUCCUCAGUGACACUCAUCGUCUGCUCCUCCUCU(SEQ ID NO: 386)
E1T2 TTGGCAGGATGGCTTCTCAT(SEQ ID NO: 363) AGAAAUCCGUCUUUCAUUGACGGUUGGCAGGAUGGCUUCUCAU(SEQ ID NO: 375) AGACAUGUGUCCUCAGUGACACUUGGCAGGAUGGCUUCUCAU(SEQ ID NO: 387)
E1T3 GCAGGATGGCTTCTCATCGT(SEQ ID NO: 364) AGAAAUCCGUCUUUCAUUGACGGGCAGGAUGGCUUCUCAUCGU(SEQ ID NO: 376) AGACAUGUGUCCUCAGUGACACGCAGGAUGGCUUCUCAUCGU(SEQ ID NO: 388)
E2T1 TCTACACCCAGGGCACCGGT(SEQ ID NO: 328) AGAAAUCCGUCUUUCAUUGACGGUCUACACCCAGGGCACCGGU(SEQ ID NO: 346) AGACAUGUGUCCUCAGUGACACUCUACACCCAGGGCACCGGU(SEQ ID NO: 389)
E2T2 GACCATCAGAGGACACTTGG(SEQ ID NO: 329) AGAAAUCCGUCUUUCAUUGACGGGACCAUCAGAGGACACUUGG(SEQ ID NO: 347) AGACAUGUGUCCUCAGUGACACGACCAUCAGAGGACACUUGG(SEQ ID NO: 390)
E2T3 TAGATGCTGTCCGAGGCAGT(SEQ ID NO: 330) AGAAAUCCGUCUUUCAUUGACGGUAGAUGCUGUCCGAGGCAGU(SEQ ID NO: 348) AGACAUGUGUCCUCAGUGACACUAGAUGCUGUCCGAGGCAGU(SEQ ID NO: 391)
E2T8 ACCATCAGAGGACACTTGGA(SEQ ID NO: 365) AGAAAUCCGUCUUUCAUUGACGGACCAUCAGAGGACACUUGGA(SEQ ID NO: 377) AGACAUGUGUCCUCAGUGACACACCAUCAGAGGACACUUGGA(SEQ ID NO: 392)
E3T1 CACACCTTATAGGAAAACCA(SEQ ID NO: 335) AGAAAUCCGUCUUUCAUUGACGGCACACCUUAUAGGAAAACCA(SEQ ID NO: 353) AGACAUGUGUCCUCAGUGACACCACACCUUAUAGGAAAACCA(SEQ ID NO: 393)
E3T2 TACAAATTCCTCCTCAGTTG(SEQ ID NO: 336) AGAAAUCCGUCUUUCAUUGACGGUACAAAUUCCUCCUCAGUUG(SEQ ID NO: 354) AGACAUGUGUCCUCAGUGACACUACAAAUUCCUCCUCAGUUG(SEQ ID NO: 394)
E3T3 GTATATCCCTTCTACAAATT(SEQ ID NO: 337) AGAAAUCCGUCUUUCAUUGACGGGUAUAUCCCUUCUACAAAUU(SEQ ID NO: 355) AGACAUGUGUCCUCAGUGACACGUAUAUCCCUUCUACAAAUU(SEQ ID NO: 395)
E3T4 CAGTAAGATTTGGTGTCTAT(SEQ ID NO: 338) AGAAAUCCGUCUUUCAUUGACGGCAGUAAGAUUUGGUGUCUAU(SEQ ID NO: 356) AGACAUGUGUCCUCAGUGACACCAGUAAGAUUUGGUGUCUAU(SEQ ID NO: 396)
E3T5 ACACCTTATAGGAAAACCAG(SEQ ID NO: 366) AGAAAUCCGUCUUUCAUUGACGGACACCUUAUAGGAAAACCAG(SEQ ID NO: 378) AGACAUGUGUCCUCAGUGACACACACCUUAUAGGAAAACCAG(SEQ ID NO: 397)
E3T6 TAGGAAAACCAGTGAGTCTG(SEQ ID NO: 367) AGAAAUCCGUCUUUCAUUGACGGUAGGAAAACCAGUGAGUCUG(SEQ ID NO: 379) AGACAUGUGUCCUCAGUGACACUAGGAAAACCAGUGAGUCUG(SEQ ID NO: 398)
E3T7 GTAGAAGGGATATACAAAGT(SEQ ID NO: 368) AGAAAUCCGUCUUUCAUUGACGGGUAGAAGGGAUAUACAAAGU(SEQ ID NO: 380) AGACAUGUGUCCUCAGUGACACGUAGAAGGGAUAUACAAAGU(SEQ ID NO: 399)
E3T8 TAGAAGGGATATACAAAGTG(SEQ ID NO: 369) N.A. AGACAUGUGUCCUCAGUGACACUAGAAGGGAUAUACAAAGUG(SEQ ID NO: 400)
E3T9 CACTTTGTATATCCCTTCTA(SEQ ID NO: 370) AGAAAUCCGUCUUUCAUUGACGGCACUUUGUAUAUCCCUUCUA(SEQ ID NO: 381) AGACAUGUGUCCUCAGUGACACCACUUUGUAUAUCCCUUCUA(SEQ ID NO: 401)
E3T10 CCACTTTGTATATCCCTTCT(SEQ ID NO: 371) AGAAAUCCGUCUUUCAUUGACGGCCACUUUGUAUAUCCCUUCU(SEQ ID NO: 382) AGACAUGUGUCCUCAGUGACACCCACUUUGUAUAUCCCUUCU(SEQ ID NO: 402)
E3T11 GTGTCTATTTCCACTTTGTA(SEQ ID NO: 372) AGAAAUCCGUCUUUCAUUGACGGGUGUCUAUUUCCACUUUGUA(SEQ ID NO: 383) AGACAUGUGUCCUCAGUGACACGUGUCUAUUUCCACUUUGUA(SEQ ID NO: 403)
E3T12 GGTGTCTATTTCCACTTTGT(SEQ ID NO: 373) AGAAAUCCGUCUUUCAUUGACGGGGUGUCUAUUUCCACUUUGU(SEQ ID NO: 384) AGACAUGUGUCCUCAGUGACACGGUGUCUAUUUCCACUUUGU(SEQ ID NO: 404)
E4T2 CACCACGGCTGTCGTCACCA(SEQ ID NO: 340) AGAAAUCCGUCUUUCAUUGACGGCACCACGGCUGUCGUCACCA(SEQ ID NO: 358) AGACAUGUGUCCUCAGUGACACCACCACGGCUGUCGUCACCA(SEQ ID NO: 405)
E4T3 GTGACGACAGCCGTGGTGGA(SEQ ID NO: 341) AGAAAUCCGUCUUUCAUUGACGGGUGACGACAGCCGUGGUGGA(SEQ ID NO: 359) AGACAUGUGUCCUCAGUGACACGUGACGACAGCCGUGGUGGA(SEQ ID NO: 406)
E4T4 GGATTGGTGACGACAGCCGT(SEQ ID NO: 342) AGAAAUCCGUCUUUCAUUGACGGGGAUUGGUGACGACAGCCGU(SEQ ID NO: 360) AGACAUGUGUCCUCAGUGACACGGAUUGGUGACGACAGCCGU(SEQ ID NO: 407)
E4T5 CTTGGGATTGGTGACGACAG(SEQ ID NO: 343) AGAAAUCCGUCUUUCAUUGACGGCUUGGGAUUGGUGACGACAG(SEQ ID NO: 361) AGACAUGUGUCCUCAGUGACACCUUGGGAUUGGUGACGACAG(SEQ ID NO: 408)
E4T7 TCTCATAGGTGGTATTCACA(SEQ ID NO: 374) AGAAAUCCGUCUUUCAUUGACGGUCUCAUAGGUGGUAUUCACA(SEQ ID NO: 385) AGACAUGUGUCCUCAGUGACACUCUCAUAGGUGGUAUUCACA(SEQ ID NO: 409)
使用TRYPLE TM(重組細胞解離酶;賽默飛世爾公司)收穫HepG2細胞並計數。將細胞用PBS洗滌一次並重懸於SF緩衝液 + 補充劑(SF細胞系4D-NUCLEOFECTOR TMX套組S;龍沙公司編號V4XC-2032)中。
在轉染前大約16小時,將在EMEM/10% FBS中的25,000個HepG2細胞鋪板到96孔板的每個孔中。在轉染的當天,細胞係70%-90%匯合的。對於待轉染的每個孔,製備Lipofectamine TM3000和Opti-MEM®的混合物,並且然後在室溫下孵育5分鐘(溶液1)。孵育後,將lipofectamine TM: OptiMEM ®混合物添加到含有核酸酶質體和RNA指導物質體以及P3000試劑的單獨混合物中(溶液2)。在陰性對照的情況下,在溶液2中不包含crRNA。將溶液1和溶液2藉由向上和向下吸移進行混合,然後在室溫下孵育15分鐘。在孵育後,將溶液1和溶液2混合物逐滴添加至含有細胞的96孔板的每個孔。
3天後,使用TRYPLE TM(重組細胞解離酶;賽默飛世爾公司)對孔進行收穫並轉移至96孔TWIN.TEC ®PCR板(Eppendorf)。拂掉培養基,並將細胞重懸於20 µL的QUICKEXTRACT TM(DNA提取緩衝液;盧西根公司(Lucigen))中。然後在PCR機器中使樣本在65°C下循環15 min、在68°C下循環15 min、在98°C下循環10 min。然後如實例1所述將樣本在-20°C冷凍並藉由NGS分析。
9A顯示,與使用SEQ ID NO: 224的變體Cas12i2相比,使用SEQ ID NO: 227的變體Cas12i2時,九個指導物表現出顯著更高的活性,而十三個指導物顯示出SEQ ID NO: 227的變體Cas12i2與SEQ ID NO: 224的變體Cas12i2之間沒有顯著差異。在變體Cas12i4和Cas12i2變體之間觀察到相當的編輯。 9B顯示了相對於E2T3和SEQ ID NO: 224的變體Cas12i2的PAM的***缺失大小頻率(左)和***缺失起始位置。如左圖顯示,缺失的大小範圍為從1個核苷酸至約40個核苷酸。大多數缺失的長度為約4個核苷酸至約18個核苷酸。如右圖顯示,靶序列表示為始於位置0且終於位置20。***缺失起始於PAM序列的下游約5個核苷酸和約35個核苷酸內。大多數***缺失起始於靶序列的末端附近,例如,PAM序列的下游約15個核苷酸至約25個核苷酸。
因此,本實例顯示TTR能夠被Cas12i2和Cas12i4變體兩者靶向。 實例 7 - Cas12i2 和靶向 TTR RNA 指導物的脫靶分析
本實例描述了Cas12i2變體和靶向TTR的RNA指導物的中靶相比於脫靶評估。
根據PCT/US21/25257的實例16中所述之方法,用編碼SEQ ID NO: 224的變體Cas12i2的質體以及編碼E3T1(SEQ ID NO: 353)、E2T2(SEQ ID NO: 347)、E3T4(SEQ ID NO: 356)、E3T3(SEQ ID NO: 355)、E4T2(SEQ ID NO: 358)、E1T2(SEQ ID NO: 363)、或E1T1(SEQ ID NO: 345)的質體轉染HEK293T細胞。然後開展PCT/US21/25257的實例16中所述之基於標籤化的標籤整合位點定序(TTISS)方法。
10A10B顯示了描繪中靶和脫靶TTISS讀段之圖。黑色楔形和居中的數字代表中靶TTISS讀段的分數。每個灰色楔形代表由TTISS鑒定的特有脫靶位點。每個灰色楔形的大小代表映射到給定脫靶位點的TTISS讀段的分數。
10A中顯示,與E3T1或E4T2配對的SEQ ID NO: 224的變體Cas12i2證明脫靶編輯的可能性低,因為100%的TTISS讀段映射至中靶。沒有TTISS讀段映射至潛在的脫靶位點。E2T2、E3T4、和E3T3也顯示出脫靶編輯的可能性低。對於E2T2、E3T4和E3T3,99%的TTISS讀段映射至中靶;對於每個RNA指導物,脫靶位點合計占TTISS讀段的1%。然而,也如 10B中顯示,E1T2和E1T1表明,使用TTISS方法,脫靶編輯的可能性較高。對於E1T2,僅51%的TTISS讀段映射至中靶,並且7個潛在的脫靶位點占TTISS讀段的剩餘49%。對於E1T1,僅31%的TTISS讀段映射至中靶,並且14個潛在的脫靶位點占TTISS讀段的剩餘69%。
因此,本實例顯示包含Cas12i2和靶向TTR的RNA指導物的組成物包含不同的脫靶活性譜。 其他實施方式
本說明書中揭露的所有特徵可以以任意組合進行組合。本說明書中揭露的每個特徵可以由用於相同、等同或類似目的可替代特徵替代。因此,除非另有明確說明,否則所揭露的每個特徵僅是通用等同或類似特徵的系列的實例。
熟悉該項技術者從以上描述可以容易地確定本揭露內容之本質特徵,並且在不脫離其精神和範圍的情況下,可以對本揭露內容進行各種更改和改變以使其適應各種用途和條件。因此,其他實施方式也在請求項範圍內。 等同物
儘管本文已經描述和說明了幾個發明性的實施方式,但是熟悉該項技術者將容易想到用於執行功能和/或獲得結果和/或本文所述之一或多個優點的各種其他手段和/或結構,並且每個這樣的變化和/或改變被視為在本文所述之發明性實施方式的範圍內。更通常地,熟悉該項技術者將容易理解,本文所述之所有參數、尺寸、材料和構型都旨在為示例性,並且實際的參數、尺寸、材料和/或組態將取決於使用本發明的教導的一或多種特定應用。熟悉該項技術者將認識到或僅使用常規實驗就能確定本文所述之特定發明性實施方式的多種等同物。因此,應當理解,前面的實施方式僅藉由舉例進行呈現,並且在所附請求項及其等同物的範圍內,可以以不同於特定地描述和要求保護的方式實施發明性實施方式。本揭露內容之發明性實施方式針對本文所述之每個單獨的特徵、系統、物品、材料、套組、和/或方法。此外,將兩個或更多個這樣的特徵、系統、物品、材料、套組、和/或方法的任何組合(如果這樣的特徵、系統、物品、材料、套組、和/或方法不相互矛盾)包括在本揭露內容之發明範圍內。
如本文所定義和所用的,所有定義應理解為優先於字典定義、藉由援引併入的文件中的定義、和/或所定義術語的普通含義。
本文揭露的所有參考文獻、專利和專利申請均相對於引用的每一個所針對的主題藉由援引併入,在一些情況下可涵蓋文件的全文。
如本文所用,在說明書和請求項中使用的不定冠詞「一個/種」應理解為意指「至少一個/種」,除非明確指出相反的情形。
如本文所用,在說明書和在請求項中使用的短語「和/或」應理解為意指如此結合的要素中的「一個或兩個」,即,要素在一些情況下結合存在並且在其他情況下不結合存在。用「和/或」列出的多個要素應該以相同的方式解釋,即,「一或多個」這樣結合的要素。除了由「和/或」從句特別鑒定的要素之外,可以視需要存在其他要素,無論與特別鑒定的那些要素相關還是不相關。因此,作為非限制性實例,當與開放式語言(如「包含」)結合使用時,對「A和/或B」的援引在一個實施方式中可以僅指A(視需要包括除B外的要素),在另一實施方式中僅指B(視需要包括除A外的要素),在又另一實施方式中指A和B兩者(視需要包括其他要素);等。
如本文所用,在說明書和請求項中,「或」應理解為與如上定義的「和/或」具有相同的含義。例如,當分隔列表中的項時,「或」或「和/或」應理解為具有包容性,即包括多個要素或要素列表中的至少一個(但也包括多於一個)以及視需要額外的未列出的項。只有明確指出相反情形的術語(如「僅一個」或「正好一個」)或在請求項中使用時,「由...組成」將指包括多個要素或要素列表中的正好一個要素。一般來說,如本文所用,如果前面帶有排他性術語,如「任一」、「中的一個」、「僅...中的一個」或「...中的正好一個」,術語「或」應僅理解為指示排他性替代方案(即,「一個或另一個但不是兩者」)。當在請求項中使用時,「基本上由……組成」應具有如專利法領域中所使用的其一般含義。
如本文所用,在說明書和請求項中,在提及一或多個要素的清單的情況下,短語「至少一個」應理解為意指選自要素列表中任何一或多個要素的至少一個要素,但不一定包括該要素列表中特定列出的每個要素中的至少一個,並且不排除該要素清單中的要素的任何組合。該定義還允許除了在短語「至少一個」所涉及的要素列表內特定鑒定的要素之外的要素可以視需要存在,無論與特別地鑒定的那些要素相關還是不相關。因此,作為非限制性實例,「A和B中的至少一個」(或等同地,「A或B中的至少一個」,或等同地,「A和/或B中的至少一個」)可以在一個實施方式中指至少一個(視需要包括多於一個)A,不存在B(並且視需要包括除B外的要素),在另一實施方式中指至少一個(視需要包括多於一個)B,不存在A(並且視需要包括除A外的要素),在又另一實施方式中指至少一個(視需要包括多於一個)A以及至少一個(視需要包括多於一個)B(並且視需要包括其他要素);等。
還應理解的是,除非明確指示相反的情形,否則在本文要求保護的任何包括多於一個步驟或動作的方法中,該方法的步驟或動作的順序不一定限於敘述該方法的步驟或動作的順序。
以下附圖構成本說明書的一部分並且將其包括以進一步說明本揭露內容之某些方面,藉由參考附圖並結合本文呈現的特定實施方式的詳細描述可以更好地理解該等方面。
[ 1]顯示了如實例1中所述使用變體Cas12i2在TTR靶序列內和/或附近觀察到的總編輯%。
[ 2]係顯示Cas12i TTR靶序列和示例性模板DNA序列之示意圖。模板DNA序列包含40個核苷酸的同源臂和供體區,以將T119M突變引入靶序列中。序列從上到下係SEQ ID NO: 419-425。
[ 3]顯示了總編輯(中灰色)、V30M SNP部分整合(淺灰色)、以及模板DNA的整合到TTR靶位點中的***區完全整合(黑色)。測試了包含40個核苷酸的同源臂和50個核苷酸的同源臂的模板DNA,並測量了變體Cas12i2的編輯效率。
[ 4]顯示了總編輯(中灰色)、V122I SNP部分整合(淺灰色)、以及模板DNA的整合到TTR靶位點中的***區完全整合(黑色)。測試了包含40個核苷酸的同源臂和50個核苷酸的同源臂的模板DNA,並測量了變體Cas12i2的編輯效率。
[ 5]顯示了總編輯(中灰色)、T119M SNP部分整合(淺灰色)、以及模板DNA的整合到TTR靶位點中的***區完全整合(黑色)。測試了包含40個核苷酸的同源臂和50個核苷酸的同源臂的模板DNA,並測量了變體Cas12i2的編輯效率。
[ 6]係顯示在將變體Cas12i2 RNP遞送至HEK293T細胞後TTR靶位點中的***缺失之圖。
[ 7] 顯示在將變體Cas12i2 RNP遞送至HepG2細胞後TTR靶位點中的***缺失之圖。
[ 8A 8B]包括顯示使用變體Cas12i2/指導RNA RNP在TTR靶位點處的基因編輯效率之圖表。 8A係顯示在將變體Cas12i2 RNP遞送至原代人肝細胞後3天後(深色條)和7天後(淺色條)TTR靶位點中的***缺失之圖。 8B係顯示在將變體Cas12i2 RNP遞送至原代人肝細胞後在x軸上的TTR靶位點中的***缺失和在y軸上的TTR蛋白敲低之圖。黑色數據點代表與非人靈長類動物TTR序列具有完全同源性的靶序列。灰色數據點代表與非人靈長類動物TTR序列不具有完全同源性的靶序列。
[ 9A9B]包括顯示使用靶向TTR的crRNA和如所指示的Cas12i2變體在TTR靶向性位點處的編輯效率之圖表。 9A係顯示由靶向TTR的crRNA和SEQ ID NO: 224的Cas12i2變體、SEQ ID NO: 227的Cas12i2變體、或SEQ ID NO: 255的Cas12i4變體誘導的***缺失%之圖。 9B顯示了在HepG2細胞中由SEQ ID NO: 224的變體Cas12i2以及E2T3(SEQ ID NO: 348)的靶向TTR的RNA指導物誘導的***缺失的大小(左)和起始位置(右)。
[ 10A10B]顯示了描繪針對SEQ ID NO: 224的變體Cas12i2和靶向TTR的RNA指導物的基於標籤化的標籤整合位點定序(TTISS)讀段之圖。 10A顯示了針對E3T1(SEQ ID NO: 353)、E2T2(SEQ ID NO: 347)、E3T4(SEQ ID NO: 356)、E3T3(SEQ ID NO: 355)、和E4T2(SEQ ID NO: 358)的TTISS圖。 10B顯示了針對E1T2(SEQ ID NO: 363)和E1T1(SEQ ID NO: 345)的TTISS圖。黑色楔形和居中的數字代表中靶TTISS讀段的分數。每個灰色楔形代表由TTISS鑒定的特有脫靶位點。每個灰色楔形的大小代表映射到給定脫靶的TTISS讀段的分數。
                         序列表
          <![CDATA[<110>  美商喬木生物技術公司(Arbor Biotechnologies, Inc.)]]>
          <![CDATA[<120>  包含靶向運甲狀腺素蛋白(TTR)的RNA指導物的基因編輯系統及其用途 ]]>
          <![CDATA[<140>  111120920]]>
          <![CDATA[<141>  2022-06-06]]>
          <![CDATA[<150>  US 63/197,036]]>
          <![CDATA[<151>  2021-06-04]]>
          <![CDATA[<150>  US 63/247,080]]>
          <![CDATA[<151>  2021-09-22]]>
          <![CDATA[<150>  US 63/321,960]]>
          <![CDATA[<151>  2022-03-21]]>
          <![CDATA[<150>  PCT/US22/32107]]>
          <![CDATA[<151>  2022-06-03]]>
          <![CDATA[<160>  425   ]]>
          <![CDATA[<170>  PatentIn 3.5版]]>
          <![CDATA[<210>  1]]>
          <![CDATA[<211>  36]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  1]]>
          guugcaaaac ccaagaaauc cgucuuucau ugacgg                                 36
          <![CDATA[<210>  2]]>
          <![CDATA[<211>  36]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  2]]>
          aauagcggcc cuaagaaauc cgucuuucau ugacgg                                 36
          <![CDATA[<210>  3]]>
          <![CDATA[<211>  36]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  3]]>
          auuggaacug gcgagaaauc cgucuuucau ugacgg                                 36
          <![CDATA[<210>  4]]>
          <![CDATA[<211>  36]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  4]]>
          ccagcaacac cuaagaaauc cgucuuucau ugacgg                                 36
          <![CDATA[<210>  5]]>
          <![CDATA[<211>  36]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  5]]>
          cggcgcucga auaggaaauc cgucuuucau ugacgg                                 36
          <![CDATA[<210>  6]]>
          <![CDATA[<211>  36]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  6]]>
          guggcaacac cuaagaaauc cgucuuucau ugacgg                                 36
          <![CDATA[<210>  7]]>
          <![CDATA[<211>  36]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  7]]>
          guugcaacac cuaagaaauc cgucuuucau ugacgg                                 36
          <![CDATA[<210>  8]]>
          <![CDATA[<211>  36]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  8]]>
          guugcaaugc cuaagaaauc cgucuuucau ugacgg                                 36
          <![CDATA[<210>  9]]>
          <![CDATA[<211>  34]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  9]]>
          gcaacaccua agaaauccgu cuuucauuga cggg                                   34
          <![CDATA[<210>  10]]>
          <![CDATA[<211>  23]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  10]]>
          agaaauccgu cuuucauuga cgg                                               23
          <![CDATA[<210>  11]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  11]]>
          ttggcaggat ggcttctcat cgtctgctcc                                        30
          <![CDATA[<210>  12]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  12]]>
          tcatcgtctg ctcctcctct gccttgctgg                                        30
          <![CDATA[<210>  13]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  13]]>
          ctggactggt atttgtgtct gaggctggcc                                        30
          <![CDATA[<210>  14]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  14]]>
          gtgtctgagg ctggccctac ggtgagtgtt                                        30
          <![CDATA[<210>  15]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  15]]>
          tgtctgaggc tggccctacg gtgagtgttt                                        30
          <![CDATA[<210>  16]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  16]]>
          ctgtgacatc ccattcctac atttaagatt                                        30
          <![CDATA[<210>  17]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223> ]]> 合成的
          <![CDATA[<400>  17]]>
          tgtgacatcc cattcctaca tttaagattc                                        30
          <![CDATA[<210>  18]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  18]]>
          agcgtgaatc ttaaatgtag gaatgggatg                                        30
          <![CDATA[<210>  19]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  19]]>
          gcgtgaatct taaatgtagg aatgggatgt                                        30
          <![CDATA[<210>  20]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  20]]>
          aatgtaggaa tgggatgtca cagaaacact                                        30
          <![CDATA[<210>  21]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  21]]>
          gcaggatggc ttctcatcgt ctgctcctcc                                        30
          <![CDATA[<210>  22]]>
          <![CDATA[<211>  24]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  22]]>
          ctacatttaa gattcacgct aaat                                              24
          <![CDATA[<210>  23]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  23]]>
          gattcaccgg tgccctgggt gtagagaaga                                        30
          <![CDATA[<210>  24]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  24]]>
          tgttaacttc tcacgtgtct tctctacacc                                        30
          <![CDATA[<210>  25]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  25]]>
          gttaacttct cacgtgtctt ctctacaccc                                        30
          <![CDATA[<210>  26]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  26]]>
          ttaacttctc acgtgtcttc tctacaccca                                        30
          <![CDATA[<210>  27]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  27]]>
          tcacgtgtct tctctacacc cagggcaccg                                        30
          <![CDATA[<210>  28]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  28]]>
          accggtgccc tgggtgtaga gaagacacgt                                        30
          <![CDATA[<210>  29]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  29]]>
          tagatgctgt ccgaggcagt cctgccatca                                        30
          <![CDATA[<210>  30]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  30]]>
          accatcagag gacacttgga ttcaccggtg                                        30
          <![CDATA[<210>  31]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  31]]>
          gaccatcaga ggacacttgg attcaccggt                                        30
          <![CDATA[<210>  32]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  32]]>
          atggcaggac tgcctcggac agcatctaga                                        30
          <![CDATA[<210>]]>  33
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  33]]>
          tgaacacatg cacggccaca ttgatggcag                                        30
          <![CDATA[<210>  34]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  34]]>
          ctgaacacat gcacggccac attgatggca                                        30
          <![CDATA[<210>  35]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  35]]>
          cccagaggca aatggctccc aggtgtcatc                                        30
          <![CDATA[<210>  36]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  36]]>
          gcaacttacc cagaggcaaa tggctcccag                                        30
          <![CDATA[<210>  37]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  37]]>
          tctacaccca gggcaccggt gaatccaagt                                        30
          <![CDATA[<210>  38]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  38]]>
          ggcaacttac ccagaggcaa atggctccca                                        30
          <![CDATA[<210>  39]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  39]]>
          ccaaagaacc ctcccacagg acttggtttt                                        30
          <![CDATA[<210>  40]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  40]]>
          cctctgggta agttgccaaa gaaccctccc                                        30
          <![CDATA[<210>  41]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  ]]>合成的
          <![CDATA[<400>  41]]>
          gcctctgggt aagttgccaa agaaccctcc                                        30
          <![CDATA[<210>  42]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  42]]>
          agaaaggctg ctgatgacac ctgggagcca                                        30
          <![CDATA[<210>  43]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  43]]>
          tttggcaact tacccagagg caaatggctc                                        30
          <![CDATA[<210>  44]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  44]]>
          acttctcacg tgtcttctct acacccaggg                                        30
          <![CDATA[<210>  45]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  45]]>
          acaaaattga tcagagtgaa                                                   20
          <![CDATA[<210>  46]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213]]>>  人工序列]]&gt;
          <br/>
          <br/>&lt;![CDATA[&lt;220&gt;]]&gt;
          <br/>&lt;![CDATA[&lt;223&gt;  合成的]]&gt;
          <br/>
          <br/>&lt;![CDATA[&lt;400&gt;  46]]&gt;
          <br/><![CDATA[gcatctcccc attccatgag catgcagagg                                        30
          <![CDATA[<210>  47]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  47]]>
          ctggaaggca cttggcatct ccccattcca                                        30
          <![CDATA[<210>  48]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  48]]>
          tagaagggat atacaaagtg gaaatagaca                                        30
          <![CDATA[<210>  49]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  49]]>
          tacaaattcc tcctcagttg tgagcccatg                                        30
          <![CDATA[<210>  50]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  50]]>
          gagggttgtt ttggttttgg tttttgcttt                                        30
          <![CDATA[<210>  51]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  51]]>
          cagtaagatt tggtgtctat ttccactttg                                        30
          <![CDATA[<210>  52]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  52]]>
          ggtgtctatt tccactttgt atatcccttc                                        30
          <![CDATA[<210>  53]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  53]]>
          gtgtctattt ccactttgta tatcccttct                                        30
          <![CDATA[<210>  54]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  54]]>
          ccactttgta tatcccttct acaaattcct                                        30
          <![CDATA[<210>  55]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  55]]>
          cactttgtat atcccttcta caaattcctc                                        30
          <![CDATA[<210>  56]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  56]]>
          gtatatccct tctacaaatt cctcctcagt                                        30
          <![CDATA[<210>  57]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  57]]>
          tatatccctt ctacaaattc ctcctcagtt                                        30
          <![CDATA[<210>  58]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  58]]>
          gtagaaggga tatacaaagt ggaaatagac                                        30
          <![CDATA[<210>  59]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  59]]>
          ctcctcagtt gtgagcccat gcagctctcc                                        30
          <![CDATA[<210>  60]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  60]]>
          tgagcccatg cagctctcca gactcactgg                                        30
          <![CDATA[<210>  61]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  61]]>
          tcctataagg tgtgaaagtc tggattaagt                                        30
          <![CDATA[<210>  62]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  62]]>
          cctataaggt gtgaaagtct ggattaagtt                                        30
          <![CDATA[<210>  63]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  63]]>
          ctataaggtg tgaaagtctg gattaagtta                                        30
          <![CDATA[<210>  64]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  64]]>
          catgagcatg cagaggtgag tatacagacc                                        30
          <![CDATA[<210>  65]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  65]]>
          taggaaaacc agtgagtctg gagagctgca                                        30
          <![CDATA[<210>  66]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  66]]>
          gtttcctcca tgcgtaactt aatccagact                                        30
          <![CDATA[<210>  67]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  67]]>
          cacaccttat aggaaaacca gtgagtctgg                                        30
          <![CDATA[<210>  68]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  68]]>
          atccagactt tcacacctta taggaaaacc                                        30
          <![CDATA[<210>  69]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  69]]>
          ctccatgcgt aacttaatcc agactttcac                                        30
          <![CDATA[<210>  70]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  70]]>
          cctccatgcg taacttaatc cagactttca                                        30
          <![CDATA[<210>  71]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  71]]>
          tttcctccat gcgtaactta atccagactt                                        30
          <![CDATA[<210>  72]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  72]]>
          acaccttata ggaaaaccag tgagtctgga                                        30
          <![CDATA[<210>  73]]>
          <![CDATA[<211>  24]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  73]]>
          ttttggtttt ggtttttgct tttg                                              24
          <![CDATA[<210>  74]]>
          <![CDATA[<211>  21]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  74]]>
          tggttttggt ttttgctttt g                                                 21
          <![CDATA[<210>  75]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  75]]>
          ggttttggtt tttgcttttg                                                   20
          <![CDATA[<210>  76]]>
          <![CDATA[<211>  25]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  76]]>
          agttacgcat ggaggaaaca aatgg                                             25
          <![CDATA[<210>  77]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  77]]>
          cgcatggagg aaacaaatgg                                                   20
          <![CDATA[<210>  78]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  78]]>
          ctaaagcagt gttttcacct catatgctat                                        30
          <![CDATA[<210>  79]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  79]]>
          actaaagcag tgttttcacc tcatatgcta                                        30
          <![CDATA[<210>  80]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  80]]>
          tactaaagca gtgttttcac ctcatatgct                                        30
          <![CDATA[<210>  81]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  81]]>
          ttactaaagc agtgttttca cctcatatgc                                        30
          <![CDATA[<210>  82]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  82]]>
          catttttact aaagcagtgt tttcacctca                                        30
          <![CDATA[<210>  83]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  83]]>
          atgtaaccaa gagtattcca tttttactaa                                        30
          <![CDATA[<210>  84]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  84]]>
          catgtaacca agagtattcc atttttacta                                        30
          <![CDATA[<210>  85]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  85]]>
          caccacggct gtcgtcacca atcccaagga                                        30
          <![CDATA[<210>  86]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  86]]>
          tcacctcata tgctatgtta gaagtccagg                                        30
          <![CDATA[<210>  87]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  87]]>
          ccgccctgct gagcccctac tcctattcca                                        30
          <![CDATA[<210>  88]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  88]]>
          acagccaacg actccggccc ccgccgctac                                        30
          <![CDATA[<210>  89]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工]]>序列
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  89]]>
          tctcataggt ggtattcaca gccaacgact                                        30
          <![CDATA[<210>  90]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  90]]>
          gggctctggt ggaaatggat ctgtctgtct                                        30
          <![CDATA[<210>  91]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  91]]>
          cgggctctgg tggaaatgga tctgtctgtc                                        30
          <![CDATA[<210>  92]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  92]]>
          tcgggctctg gtggaaatgg atctgtctgt                                        30
          <![CDATA[<210>  93]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  93]]>
          tcctccagtg gacctgaagg acgagggatg                                        30
          <![CDATA[<210>  94]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<22]]>0>]]&gt;
          <br/>&lt;![CDATA[&lt;223&gt;  合成的]]&gt;
          <br/>
          <br/>&lt;![CDATA[&lt;400&gt;  94]]&gt;
          <br/><![CDATA[cacctcatat gctatgttag aagtccaggc                                        30
          <![CDATA[<210>  95]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  95]]>
          cacaggaatg ttttattgtc tctgcctgga                                        30
          <![CDATA[<210>  96]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  96]]>
          gaagtccagg cagagacaat aaaacattcc                                        30
          <![CDATA[<210>  97]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  97]]>
          gctgtgaata ccacctatga gagaagacag                                        30
          <![CDATA[<210>  98]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  98]]>
          gtgacgacag ccgtggtgga ataggagtag                                        30
          <![CDATA[<210>  99]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  99]]>
          ggattggtga cgacagccgt ggtggaatag                                        30
          <![CDATA[<210>  100]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  100]]>
          cttgggattg gtgacgacag ccgtggtgga                                        30
          <![CDATA[<210>  101]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  101]]>
          aggtccactg gaggagaagt ccctcattcc                                        30
          <![CDATA[<210>  102]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  102]]>
          catgaaatcc catccctcgt ccttcaggtc                                        30
          <![CDATA[<210>  103]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  103]]>
          gttacatgaa atcccatccc tcgtccttca                                        30
          <![CDATA[<210>  1]]>04
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  104]]>
          gtaaaaatgg aatactcttg gttacatgaa                                        30
          <![CDATA[<210>  105]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  105]]>
          agtaaaaatg gaatactctt ggttacatga                                        30
          <![CDATA[<210>  106]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  106]]>
          taacatagca tatgaggtga aaacactgct                                        30
          <![CDATA[<210>  107]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  107]]>
          tctctgcctg gacttctaac atagcatatg                                        30
          <![CDATA[<210>  108]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  108]]>
          ttgtctctgc ctggacttct aacatagcat                                        30
          <![CDATA[<210>  109]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  109]]>
          attgtctctg cctggacttc taacatagca                                        30
          <![CDATA[<210>  110]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  110]]>
          tattgtctct gcctggactt ctaacatagc                                        30
          <![CDATA[<210>  111]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  111]]>
          acaggaatgt tttattgtct ctgcctggac                                        30
          <![CDATA[<210>  112]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  112]]>
          acctcatatg ctatgttaga agtccaggca                                        30
          <![CDATA[<210>  113]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400> ]]> 113
          ttcgggctct ggtggaaatg gatctgtctg                                        30
          <![CDATA[<210>  114]]>
          <![CDATA[<211>  22]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  114]]>
          ccaccagagc ccgaaaaacg tg                                                22
          <![CDATA[<210>  115]]>
          <![CDATA[<211>  21]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  115]]>
          caccagagcc cgaaaaacgt g                                                 21
          <![CDATA[<210>  116]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  116]]>
          uuggcaggau ggcuucucau cgucugcucc                                        30
          <![CDATA[<210>  117]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  117]]>
          ucaucgucug cuccuccucu gccuugcugg                                        30
          <![CDATA[<210>  118]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  118]]>
          cuggacuggu auuugugucu gaggcuggcc                                        30
          <![CDATA[<210>  119]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  119]]>
          gugucugagg cuggcccuac ggugaguguu                                        30
          <![CDATA[<210>  120]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  120]]>
          ugucugaggc uggcccuacg gugaguguuu                                        30
          <![CDATA[<210>  121]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  121]]>
          cugugacauc ccauuccuac auuuaagauu                                        30
          <![CDATA[<210>  122]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  122]]>
          ugugacaucc cauuccuaca uuuaagauuc                                        30
          <![CDATA[<210>  123]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  123]]>
          agcgugaauc uuaaauguag gaaugggaug                                        30
          <![CDATA[<210>  124]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  124]]>
          gcgugaaucu uaaauguagg aaugggaugu                                        30
          <![CDATA[<210>  125]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  125]]>
          aauguaggaa ugggauguca cagaaacacu                                        30
          <![CDATA[<210>  126]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  126]]>
          gcaggauggc uucucaucgu cugcuccucc                                        30
          <![CDATA[<210>  127]]>
          <![CDATA[<211>  24]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  127]]>
          cuacauuuaa gauucacgcu aaau                                              24
          <![CDATA[<210>  128]]>
          <![CDATA[<211> ]]> 30
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  128]]>
          gauucaccgg ugcccugggu guagagaaga                                        30
          <![CDATA[<210>  129]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  129]]>
          uguuaacuuc ucacgugucu ucucuacacc                                        30
          <![CDATA[<210>  130]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  130]]>
          guuaacuucu cacgugucuu cucuacaccc                                        30
          <![CDATA[<210>  131]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  131]]>
          uuaacuucuc acgugucuuc ucuacaccca                                        30
          <![CDATA[<210>  132]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  132]]>
          ucacgugucu ucucuacacc cagggcaccg                                        30
          <![CDATA[<210>  133]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  133]]>
          accggugccc uggguguaga gaagacacgu                                        30
          <![CDATA[<210>  134]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  134]]>
          uagaugcugu ccgaggcagu ccugccauca                                        30
          <![CDATA[<210>  135]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  135]]>
          accaucagag gacacuugga uucaccggug                                        30
          <![CDATA[<210>  136]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  136]]>
          gaccaucaga ggacacuugg auucaccggu                                        30
          <![CDATA[<210>  137]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  137]]>
          auggcaggac ugccucggac agcaucuaga                                        30
          <![CDATA[<210>  138]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  138]]>
          ugaacacaug cacggccaca uugauggcag                                        30
          <![CDATA[<210>  139]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  139]]>
          cugaacacau gcacggccac auugauggca                                        30
          <![CDATA[<210>  140]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  140]]>
          cccagaggca aauggcuccc aggugucauc                                        30
          <![CDATA[<210>  141]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  141]]>
          gcaacuuacc cagaggcaaa uggcucccag                                        30
          <![CDATA[<210>  142]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  142]]>
          ucuacaccca gggcaccggu gaauccaagu                                        30
          <![CDATA[<210>  143]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  143]]>
          ggcaacuuac ccagaggcaa auggcuccca                                        30
          <![CDATA[<210>  144]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  144]]>
          ccaaagaacc cucccacagg acuugguuuu                                        30
          <![CDATA[<210>  145]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  145]]>
          ccucugggua aguugccaaa gaacccuccc                                        30
          <![CDATA[<210>  146]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  146]]>
          gccucugggu aaguugccaa agaacccucc                                        30
          <![CDATA[<210>  147]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  147]]>
          agaaaggcug cugaugacac cugggagcca                                        30
          <![CDATA[<210>  148]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  148]]>
          uuuggcaacu uacccagagg caaauggcuc                                        30
          <![CDATA[<210>  149]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  149]]>
          acuucucacg ugucuucucu acacccaggg                                        30
          <![CDATA[<210>  150]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  150]]>
          acaaaauuga ucagagugaa                                                   20
          <![CDATA[<210>  151]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  151]]>
          gcaucucccc auuccaugag caugcagagg                                        30
          <![CDATA[<210>  152]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  152]]>
          cuggaaggca cuuggcaucu ccccauucca                                        30
          <![CDATA[<210>  153]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  153]]>
          uagaagggau auacaaagug gaaauagaca                                        30
          <![CDATA[<210>  154]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  154]]>
          uacaaauucc uccucaguug ugagcccaug                                        30
          <![CDATA[<210>  155]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  155]]>
          gaggguuguu uugguuuugg uuuuugcuuu                                        30
          <![CDATA[<210>  156]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  156]]>
          caguaagauu uggugucuau uuccacuuug                                        30
          <![CDATA[<210>  157]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  157]]>
          ggugucuauu uccacuuugu auaucccuuc                                        30
          <![CDATA[<210>  158]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  158]]>
          gugucuauuu ccacuuugua uaucccuucu                                        30
          <![CDATA[<210>  159]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  159]]>
          ccacuuugua uaucccuucu acaaauuccu                                        30
          <![CDATA[<210>  160]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  160]]>
          cacuuuguau aucccuucua caaauuccuc                                        30
          <![CDATA[<210>  161]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  161]]>
          guauaucccu ucuacaaauu ccuccucagu                                        30
          <![CDATA[<210>  162]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  162]]>
          uauaucccuu cuacaaauuc cuccucaguu                                        30
          <![CDATA[<210>  163]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  163]]>
          guagaaggga uauacaaagu ggaaauagac                                        30
          <![CDATA[<210>  164]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  164]]>
          cuccucaguu gugagcccau gcagcucucc                                        30
          <![CDATA[<210>  165]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  165]]>
          ugagcccaug cagcucucca gacucacugg                                        30
          <![CDATA[<210>  166]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  166]]>
          uccuauaagg ugugaaaguc uggauuaagu                                        30
          <![CDATA[<210>  167]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  167]]>
          ccuauaaggu gugaaagucu ggauuaaguu                                        30
          <![CDATA[<210>  168]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  168]]>
          cuauaaggug ugaaagucug gauuaaguua                                        30
          <![CDATA[<210>  169]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  169]]>
          caugagcaug cagaggugag uauacagacc                                        30
          <![CDATA[<210>  170]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  170]]>
          uaggaaaacc agugagucug gagagcugca                                        30
          <![CDATA[<210>  171]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  171]]>
          guuuccucca ugcguaacuu aauccagacu                                        30
          <![CDATA[<210>  172]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  172]]>
          cacaccuuau aggaaaacca gugagucugg                                        30
          <![CDATA[<210>  173]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  173]]>
          auccagacuu ucacaccuua uaggaaaacc                                        30
          <![CDATA[<210>  174]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  174]]>
          cuccaugcgu aacuuaaucc agacuuucac                                        30
          <![CDATA[<210>  175]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  175]]>
          ccuccaugcg uaacuuaauc cagacuuuca                                        30
          <![CDATA[<210>  176]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  176]]>
          uuuccuccau gcguaacuua auccagacuu                                        30
          <![CDATA[<210>  177]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  177]]>
          acaccuuaua ggaaaaccag ugagucugga                                        30
          <![CDATA[<210>  178]]>
          <![CDATA[<211>  24]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  178]]>
          uuuugguuuu gguuuuugcu uuug                                              24
          <![CDATA[<210>  179]]>
          <![CDATA[<211>  21]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  179]]>
          ugguuuuggu uuuugcuuuu g                                                 21
          <![CDATA[<210>  180]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>]]>  180
          gguuuugguu uuugcuuuug                                                   20
          <![CDATA[<210>  181]]>
          <![CDATA[<211>  25]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  181]]>
          aguuacgcau ggaggaaaca aaugg                                             25
          <![CDATA[<210>  182]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  182]]>
          cgcauggagg aaacaaaugg                                                   20
          <![CDATA[<210>  183]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  183]]>
          cuaaagcagu guuuucaccu cauaugcuau                                        30
          <![CDATA[<210>  184]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  184]]>
          acuaaagcag uguuuucacc ucauaugcua                                        30
          <![CDATA[<210>  185]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  185]]>
          uacuaaagca guguuuucac cucauaugcu                                        30
          <![CDATA[<210>  186]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  186]]>
          uuacuaaagc aguguuuuca ccucauaugc                                        30
          <![CDATA[<210>  187]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  187]]>
          cauuuuuacu aaagcagugu uuucaccuca                                        30
          <![CDATA[<210>  188]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  188]]>
          auguaaccaa gaguauucca uuuuuacuaa                                        30
          <![CDATA[<210>  189]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  189]]>
          cauguaacca agaguauucc auuuuuacua                                        30
          <![CDATA[<210>  190]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  190]]>
          caccacggcu gucgucacca aucccaagga                                        30
          <![CDATA[<210>  191]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  191]]>
          ucaccucaua ugcuauguua gaaguccagg                                        30
          <![CDATA[<210>  192]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  192]]>
          ccgcccugcu gagccccuac uccuauucca                                        30
          <![CDATA[<210>  193]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  193]]>
          acagccaacg acuccggccc ccgccgcuac                                        30
          <![CDATA[<210>  194]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  194]]>
          ucucauaggu gguauucaca gccaacgacu                                        30
          <![CDATA[<210>  195]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  195]]>
          gggcucuggu ggaaauggau cugucugucu                                        30
          <![CDATA[<210>  196]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  196]]>
          cgggcucugg uggaaaugga ucugucuguc                                        30
          <![CDATA[<210>  197]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  197]]>
          ucgggcucug guggaaaugg aucugucugu                                        30
          <![CDATA[<210>  198]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  198]]>
          uccuccagug gaccugaagg acgagggaug                                        30
          <![CDATA[<210>  199]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  199]]>
          caccucauau gcuauguuag aaguccaggc                                        30
          <![CDATA[<210>  200]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  200]]>
          cacaggaaug uuuuauuguc ucugccugga                                        30
          <![CDATA[<210>  201]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  201]]>
          gaaguccagg cagagacaau aaaacauucc                                        30
          <![CDATA[<210>  202]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  202]]>
          gcugugaaua ccaccuauga gagaagacag                                        30
          <![CDATA[<210>  203]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  203]]>
          gugacgacag ccguggugga auaggaguag                                        30
          <![CDATA[<210>  204]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  204]]>
          ggauugguga cgacagccgu gguggaauag                                        30
          <![CDATA[<210>  205]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  205]]>
          cuugggauug gugacgacag ccguggugga                                        30
          <![CDATA[<210>  206]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  206]]>
          agguccacug gaggagaagu cccucauucc                                        30
          <![CDATA[<210>  207]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  207]]>
          caugaaaucc caucccucgu ccuucagguc                                        30
          <![CDATA[<210>  208]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  208]]>
          guuacaugaa aucccauccc ucguccuuca                                        30
          <![CDATA[<210>  209]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  209]]>
          guaaaaaugg aauacucuug guuacaugaa                                        30
          <![CDATA[<210>  210]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  210]]>
          aguaaaaaug gaauacucuu gguuacauga                                        30
          <![CDATA[<210>  211]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  211]]>
          uaacauagca uaugagguga aaacacugcu                                        30
          <![CDATA[<210>  212]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  212]]>
          ucucugccug gacuucuaac auagcauaug                                        30
          <![CDATA[<210>  213]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  213]]>
          uugucucugc cuggacuucu aacauagcau                                        30
          <![CDATA[<210>  214]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  214]]>
          auugucucug ccuggacuuc uaacauagca                                        30
          <![CDATA[<210>  215]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  215]]>
          uauugucucu gccuggacuu cuaacauagc                                        30
          <![CDATA[<210>  216]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  216]]>
          acaggaaugu uuuauugucu cugccuggac                                        30
          <![CDATA[<210>  217]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  217]]>
          accucauaug cuauguuaga aguccaggca                                        30
          <![CDATA[<210>  218]]>
          <![CDATA[<211>  30]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  2]]>18
          uucgggcucu gguggaaaug gaucugucug                                        30
          <![CDATA[<210>  219]]>
          <![CDATA[<211>  22]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  219]]>
          ccaccagagc ccgaaaaacg ug                                                22
          <![CDATA[<210>  220]]>
          <![CDATA[<211>  21]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  220]]>
          caccagagcc cgaaaaacgu g                                                 21
          <![CDATA[<210>  221]]>
          <![CDATA[<211>  3162]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  221]]>
          atgagcagcg cgatcaaaag ctacaagagc gttctgcgtc cgaacgagcg taagaaccaa       60
          ctgctgaaaa gcaccattca gtgcctggaa gacggtagcg cgttcttttt caagatgctg      120
          caaggcctgt ttggtggcat caccccggag attgttcgtt tcagcaccga acaggagaaa      180
          cagcaacagg atatcgcgct gtggtgcgcg gttaactggt tccgtccggt gagccaagac      240
          agcctgaccc acaccattgc gagcgataac ctggtggaga agtttgagga atactatggt      300
          ggcaccgcga gcgacgcgat caaacagtac ttcagcgcga gcattggcga aagctactat      360
          tggaacgact gccgtcaaca gtactatgat ctgtgccgtg agctgggtgt tgaggtgagc      420
          gacctgaccc atgatctgga gatcctgtgc cgtgaaaagt gcctggcggt tgcgaccgag      480
          agcaaccaga acaacagcat cattagcgtt ctgtttggca ccggcgaaaa agaggaccgt      540
          agcgtgaaac tgcgtatcac caagaaaatt ctggaggcga tcagcaacct gaaagaaatc      600
          ccgaagaacg ttgcgccgat tcaagagatc attctgaacg tggcgaaagc gaccaaggaa      660
          accttccgtc aggtgtatgc gggtaacctg ggtgcgccga gcaccctgga gaaatttatc      720
          gcgaaggacg gccaaaaaga gttcgatctg aagaaactgc agaccgacct gaagaaagtt      780
          attcgtggta aaagcaagga gcgtgattgg tgctgccagg aagagctgcg tagctacgtg      840
          gagcaaaaca ccatccagta tgacctgtgg gcgtggggcg aaatgttcaa caaagcgcac      900
          accgcgctga aaatcaagag cacccgtaac tacaactttg cgaagcaacg tctggaacag      960
          ttcaaagaga ttcagagcct gaacaacctg ctggttgtga agaagctgaa cgactttttc     1020
          gatagcgaat ttttcagcgg cgaggaaacc tacaccatct gcgttcacca tctgggtggc     1080
          aaggacctga gcaaactgta taaggcgtgg gaggatgatc cggcggaccc ggaaaacgcg     1140
          attgtggttc tgtgcgacga tctgaaaaac aactttaaga aagagccgat ccgtaacatt     1200
          ctgcgttaca tcttcaccat tcgtcaagaa tgcagcgcgc aggacatcct ggcggcggcg     1260
          aagtacaacc aacagctgga tcgttataaa agccaaaagg cgaacccgag cgttctgggt     1320
          aaccagggct ttacctggac caacgcggtg atcctgccgg agaaggcgca gcgtaacgac     1380
          cgtccgaaca gcctggatct gcgtatttgg ctgtacctga aactgcgtca cccggacggt     1440
          cgttggaaga aacaccatat cccgttctac gatacccgtt tcttccaaga aatttatgcg     1500
          gcgggcaaca gcccggttga cacctgccag tttcgtaccc cgcgtttcgg ttatcacctg     1560
          ccgaaactga ccgatcagac cgcgatccgt gttaacaaga aacatgtgaa agcggcgaag     1620
          accgaggcgc gtattcgtct ggcgatccaa cagggcaccc tgccggtgag caacctgaag     1680
          atcaccgaaa ttagcgcgac catcaacagc aaaggtcaag tgcgtattcc ggttaagttt     1740
          gacgtgggtc gtcaaaaagg caccctgcag atcggtgacc gtttctgcgg ctacgatcaa     1800
          aaccagaccg cgagccacgc gtatagcctg tgggaagtgg ttaaagaggg tcaataccat     1860
          aaagagctgg gctgctttgt tcgtttcatc agcagcggtg acatcgtgag cattaccgag     1920
          aaccgtggca accaatttga tcagctgagc tatgaaggtc tggcgtaccc gcaatatgcg     1980
          gactggcgta agaaagcgag caagttcgtg agcctgtggc agatcaccaa gaaaaacaag     2040
          aaaaaggaaa tcgtgaccgt tgaagcgaaa gagaagtttg acgcgatctg caagtaccag     2100
          ccgcgtctgt ataaattcaa caaggagtac gcgtatctgc tgcgtgatat tgttcgtggc     2160
          aaaagcctgg tggaactgca acagattcgt caagagatct ttcgtttcat tgaacaggac     2220
          tgcggtgtta cccgtctggg cagcctgagc ctgagcaccc tggaaaccgt gaaagcggtt     2280
          aagggtatca tttacagcta ttttagcacc gcgctgaacg cgagcaagaa caacccgatc     2340
          agcgacgaac agcgtaaaga gtttgatccg gaactgttcg cgctgctgga aaagctggag     2400
          ctgattcgta cccgtaaaaa gaaacaaaaa gtggaacgta tcgcgaacag cctgattcag     2460
          acctgcctgg agaacaacat caagttcatt cgtggtgaag gcgacctgag caccaccaac     2520
          aacgcgacca agaaaaaggc gaacagccgt agcatggatt ggttggcgcg tggtgttttt     2580
          aacaaaatcc gtcaactggc gccgatgcac aacattaccc tgttcggttg cggcagcctg     2640
          tacaccagcc accaggaccc gctggtgcat cgtaacccgg ataaagcgat gaagtgccgt     2700
          tgggcggcga tcccggttaa ggacattggc gattgggtgc tgcgtaagct gagccaaaac     2760
          ctgcgtgcga aaaacatcgg caccggcgag tactatcacc aaggtgttaa agagttcctg     2820
          agccattatg aactgcagga cctggaggaa gagctgctga agtggcgtag cgatcgtaaa     2880
          agcaacattc cgtgctgggt gctgcagaac cgtctggcgg agaagctggg caacaaagaa     2940
          gcggtggttt acatcccggt tcgtggtggc cgtatttatt ttgcgaccca caaggtggcg     3000
          accggtgcgg tgagcatcgt tttcgaccaa aaacaagtgt gggtttgcaa cgcggatcat     3060
          gttgcggcgg cgaacatcgc gctgaccgtg aagggtattg gcgaacaaag cagcgacgaa     3120
          gagaacccgg atggtagccg tatcaaactg cagctgacca gc                        3162
          <![CDATA[<210>  222]]>
          <![CDATA[<211>  1054]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  222]]>
          Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu 
          1               5                   10                  15      
          Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly 
                      20                  25                  30          
          Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr 
                  35                  40                  45              
          Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp 
              50                  55                  60                  
          Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp 
          65                  70                  75                  80  
          Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu 
                          85                  90                  95      
          Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser 
                      100                 105                 110         
          Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr 
                  115                 120                 125             
          Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His 
              130                 135                 140                 
          Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu 
          145                 150                 155                 160 
          Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu 
                          165                 170                 175     
          Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu 
                      180                 185                 190         
          Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln 
                  195                 200                 205             
          Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln 
              210                 215                 220                 
          Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile 
          225                 230                 235                 240 
          Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp 
                          245                 250                 255     
          Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys 
                      260                 265                 270         
          Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp 
                  275                 280                 285             
          Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys 
              290                 295                 300                 
          Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln 
          305                 310                 315                 320 
          Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu 
                          325                 330                 335     
          Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr 
                      340                 345                 350         
          Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys 
                  355                 360                 365             
          Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu 
              370                 375                 380                 
          Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile 
          385                 390                 395                 400 
          Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile 
                          405                 410                 415     
          Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln 
                      420                 425                 430         
          Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn 
                  435                 440                 445             
          Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser 
              450                 455                 460                 
          Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly 
          465                 470                 475                 480 
          Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln 
                          485                 490                 495     
          Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg 
                      500                 505                 510         
          Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala 
                  515                 520                 525             
          Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg 
              530                 535                 540                 
          Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys 
          545                 550                 555                 560 
          Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile 
                          565                 570                 575     
          Pro Val Lys Phe Asp Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly 
                      580                 585                 590         
          Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr 
                  595                 600                 605             
          Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly 
              610                 615                 620                 
          Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu 
          625                 630                 635                 640 
          Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr 
                          645                 650                 655     
          Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu 
                      660                 665                 670         
          Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu 
                  675                 680                 685             
          Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr 
              690                 695                 700                 
          Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly 
          705                 710                 715                 720 
          Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe 
                          725                 730                 735     
          Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser 
                      740                 745                 750         
          Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe 
                  755                 760                 765             
          Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln 
              770                 775                 780                 
          Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu 
          785                 790                 795                 800 
          Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn 
                          805                 810                 815     
          Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly 
                      820                 825                 830         
          Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn 
                  835                 840                 845             
          Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg 
              850                 855                 860                 
          Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu 
          865                 870                 875                 880 
          Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala 
                          885                 890                 895     
          Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp 
                      900                 905                 910         
          Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Ile Gly Thr 
                  915                 920                 925             
          Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu 
              930                 935                 940                 
          Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys 
          945                 950                 955                 960 
          Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu 
                          965                 970                 975     
          Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile 
                      980                 985                 990         
          Tyr Phe Ala Thr His Lys Val Ala  Thr Gly Ala Val Ser  Ile Val Phe 
                  995                 1000                 1005             
          Asp Gln  Lys Gln Val Trp Val  Cys Asn Ala Asp His  Val Ala Ala 
              1010                 1015                 1020             
          Ala Asn  Ile Ala Leu Thr Val  Lys Gly Ile Gly Glu  Gln Ser Ser 
              1025                 1030                 1035             
          Asp Glu  Glu Asn Pro Asp Gly  Ser Arg Ile Lys Leu  Gln Leu Thr 
              1040                 1045                 1050             
          Ser 
          <![CDATA[<210>  223]]>
          <![CDATA[<211>  1054]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  223]]>
          Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu 
          1               5                   10                  15      
          Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly 
                      20                  25                  30          
          Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr 
                  35                  40                  45              
          Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp 
              50                  55                  60                  
          Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp 
          65                  70                  75                  80  
          Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu 
                          85                  90                  95      
          Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser 
                      100                 105                 110         
          Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr 
                  115                 120                 125             
          Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His 
              130                 135                 140                 
          Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu 
          145                 150                 155                 160 
          Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu 
                          165                 170                 175     
          Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu 
                      180                 185                 190         
          Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln 
                  195                 200                 205             
          Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln 
              210                 215                 220                 
          Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile 
          225                 230                 235                 240 
          Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp 
                          245                 250                 255     
          Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys 
                      260                 265                 270         
          Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp 
                  275                 280                 285             
          Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys 
              290                 295                 300                 
          Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln 
          305                 310                 315                 320 
          Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu 
                          325                 330                 335     
          Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr 
                      340                 345                 350         
          Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys 
                  355                 360                 365             
          Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu 
              370                 375                 380                 
          Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile 
          385                 390                 395                 400 
          Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile 
                          405                 410                 415     
          Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln 
                      420                 425                 430         
          Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn 
                  435                 440                 445             
          Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser 
              450                 455                 460                 
          Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly 
          465                 470                 475                 480 
          Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln 
                          485                 490                 495     
          Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg 
                      500                 505                 510         
          Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala 
                  515                 520                 525             
          Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg 
              530                 535                 540                 
          Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys 
          545                 550                 555                 560 
          Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile 
                          565                 570                 575     
          Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly 
                      580                 585                 590         
          Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr 
                  595                 600                 605             
          Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly 
              610                 615                 620                 
          Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu 
          625                 630                 635                 640 
          Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr 
                          645                 650                 655     
          Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu 
                      660                 665                 670         
          Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu 
                  675                 680                 685             
          Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr 
              690                 695                 700                 
          Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly 
          705                 710                 715                 720 
          Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe 
                          725                 730                 735     
          Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser 
                      740                 745                 750         
          Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe 
                  755                 760                 765             
          Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln 
              770                 775                 780                 
          Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu 
          785                 790                 795                 800 
          Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn 
                          805                 810                 815     
          Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly 
                      820                 825                 830         
          Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn 
                  835                 840                 845             
          Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg 
              850                 855                 860                 
          Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu 
          865                 870                 875                 880 
          Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala 
                          885                 890                 895     
          Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Arg Trp 
                      900                 905                 910         
          Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr 
                  915                 920                 925             
          Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu 
              930                 935                 940                 
          Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys 
          945                 950                 955                 960 
          Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu 
                          965                 970                 975     
          Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile 
                      980                 985                 990         
          Tyr Phe Ala Thr His Lys Val Ala  Thr Gly Ala Val Ser  Ile Val Phe 
                  995                 1000                 1005             
          Asp Gln  Lys Gln Val Trp Val  Cys Asn Ala Asp His  Val Ala Ala 
              1010                 1015                 1020             
          Ala Asn  Ile Ala Leu Thr Gly  Lys Gly Ile Gly Glu  Gln Ser Ser 
              1025                 1030                 1035             
          Asp Glu  Glu Asn Pro Asp Gly  Ser Arg Ile Lys Leu  Gln Leu Thr 
              1040                 1045                 1050             
          Ser 
          <![CDATA[<210>  224]]>
          <![CDATA[<211>  1054]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  224]]>
          Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu 
          1               5                   10                  15      
          Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly 
                      20                  25                  30          
          Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr 
                  35                  40                  45              
          Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp 
              50                  55                  60                  
          Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp 
          65                  70                  75                  80  
          Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu 
                          85                  90                  95      
          Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser 
                      100                 105                 110         
          Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr 
                  115                 120                 125             
          Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His 
              130                 135                 140                 
          Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu 
          145                 150                 155                 160 
          Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu 
                          165                 170                 175     
          Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu 
                      180                 185                 190         
          Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln 
                  195                 200                 205             
          Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln 
              210                 215                 220                 
          Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile 
          225                 230                 235                 240 
          Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp 
                          245                 250                 255     
          Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys 
                      260                 265                 270         
          Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp 
                  275                 280                 285             
          Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys 
              290                 295                 300                 
          Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln 
          305                 310                 315                 320 
          Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu 
                          325                 330                 335     
          Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr 
                      340                 345                 350         
          Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys 
                  355                 360                 365             
          Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu 
              370                 375                 380                 
          Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile 
          385                 390                 395                 400 
          Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile 
                          405                 410                 415     
          Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln 
                      420                 425                 430         
          Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn 
                  435                 440                 445             
          Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser 
              450                 455                 460                 
          Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly 
          465                 470                 475                 480 
          Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln 
                          485                 490                 495     
          Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg 
                      500                 505                 510         
          Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala 
                  515                 520                 525             
          Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg 
              530                 535                 540                 
          Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys 
          545                 550                 555                 560 
          Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile 
                          565                 570                 575     
          Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly 
                      580                 585                 590         
          Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr 
                  595                 600                 605             
          Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly 
              610                 615                 620                 
          Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu 
          625                 630                 635                 640 
          Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr 
                          645                 650                 655     
          Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu 
                      660                 665                 670         
          Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu 
                  675                 680                 685             
          Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr 
              690                 695                 700                 
          Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly 
          705                 710                 715                 720 
          Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe 
                          725                 730                 735     
          Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser 
                      740                 745                 750         
          Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe 
                  755                 760                 765             
          Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln 
              770                 775                 780                 
          Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu 
          785                 790                 795                 800 
          Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn 
                          805                 810                 815     
          Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly 
                      820                 825                 830         
          Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn 
                  835                 840                 845             
          Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg 
              850                 855                 860                 
          Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu 
          865                 870                 875                 880 
          Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala 
                          885                 890                 895     
          Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp 
                      900                 905                 910         
          Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr 
                  915                 920                 925             
          Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu 
              930                 935                 940                 
          Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys 
          945                 950                 955                 960 
          Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu 
                          965                 970                 975     
          Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile 
                      980                 985                 990         
          Tyr Phe Ala Thr His Lys Val Ala  Thr Gly Ala Val Ser  Ile Val Phe 
                  995                 1000                 1005             
          Asp Gln  Lys Gln Val Trp Val  Cys Asn Ala Asp His  Val Ala Ala 
              1010                 1015                 1020             
          Ala Asn  Ile Ala Leu Thr Gly  Lys Gly Ile Gly Glu  Gln Ser Ser 
              1025                 1030                 1035             
          Asp Glu  Glu Asn Pro Asp Gly  Ser Arg Ile Lys Leu  Gln Leu Thr 
              1040                 1045                 1050             
          Ser 
          <![CDATA[<210>  225]]>
          <![CDATA[<211]]>>  1054]]&gt;
          <br/>&lt;![CDATA[&lt;212&gt;  PRT]]&gt;
          <br/>&lt;![CDATA[&lt;213&gt;  人工序列]]&gt;
          <br/>
          <br/>&lt;![CDATA[&lt;220&gt;]]&gt;
          <br/>&lt;![CDATA[&lt;223&gt;  合成的]]&gt;
          <br/>
          <br/>&lt;![CDATA[&lt;400&gt;  225]]&gt;
          <br/>
          <br/><![CDATA[Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu 
          1               5                   10                  15      
          Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly 
                      20                  25                  30          
          Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr 
                  35                  40                  45              
          Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp 
              50                  55                  60                  
          Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp 
          65                  70                  75                  80  
          Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu 
                          85                  90                  95      
          Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser 
                      100                 105                 110         
          Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr 
                  115                 120                 125             
          Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His 
              130                 135                 140                 
          Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu 
          145                 150                 155                 160 
          Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu 
                          165                 170                 175     
          Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu 
                      180                 185                 190         
          Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln 
                  195                 200                 205             
          Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln 
              210                 215                 220                 
          Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile 
          225                 230                 235                 240 
          Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp 
                          245                 250                 255     
          Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys 
                      260                 265                 270         
          Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp 
                  275                 280                 285             
          Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys 
              290                 295                 300                 
          Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln 
          305                 310                 315                 320 
          Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu 
                          325                 330                 335     
          Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr 
                      340                 345                 350         
          Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys 
                  355                 360                 365             
          Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu 
              370                 375                 380                 
          Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile 
          385                 390                 395                 400 
          Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile 
                          405                 410                 415     
          Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln 
                      420                 425                 430         
          Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn 
                  435                 440                 445             
          Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser 
              450                 455                 460                 
          Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly 
          465                 470                 475                 480 
          Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln 
                          485                 490                 495     
          Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg 
                      500                 505                 510         
          Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala 
                  515                 520                 525             
          Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg 
              530                 535                 540                 
          Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys 
          545                 550                 555                 560 
          Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile 
                          565                 570                 575     
          Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly 
                      580                 585                 590         
          Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr 
                  595                 600                 605             
          Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly 
              610                 615                 620                 
          Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu 
          625                 630                 635                 640 
          Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr 
                          645                 650                 655     
          Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu 
                      660                 665                 670         
          Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu 
                  675                 680                 685             
          Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr 
              690                 695                 700                 
          Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly 
          705                 710                 715                 720 
          Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe 
                          725                 730                 735     
          Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser 
                      740                 745                 750         
          Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe 
                  755                 760                 765             
          Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln 
              770                 775                 780                 
          Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu 
          785                 790                 795                 800 
          Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn 
                          805                 810                 815     
          Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly 
                      820                 825                 830         
          Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn 
                  835                 840                 845             
          Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg 
              850                 855                 860                 
          Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu 
          865                 870                 875                 880 
          Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala 
                          885                 890                 895     
          Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp 
                      900                 905                 910         
          Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr 
                  915                 920                 925             
          Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu 
              930                 935                 940                 
          Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys 
          945                 950                 955                 960 
          Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu 
                          965                 970                 975     
          Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile 
                      980                 985                 990         
          Tyr Phe Ala Thr His Lys Val Ala  Thr Gly Ala Val Ser  Ile Val Phe 
                  995                 1000                 1005             
          Asp Gln  Lys Gln Val Trp Val  Cys Asn Ala Asp His  Val Ala Ala 
              1010                 1015                 1020             
          Ala Asn  Ile Ala Leu Thr Gly  Lys Gly Ile Gly Glu  Gln Ser Ser 
              1025                 1030                 1035             
          Asp Glu  Glu Asn Pro Asp Gly  Gly Arg Ile Lys Leu  Gln Leu Thr 
              1040                 1045                 1050             
          Ser 
          <![CDATA[<210>  226]]>
          <![CDATA[<211>  1054]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<21]]>3>  人工序列]]&gt;
          <br/>
          <br/>&lt;![CDATA[&lt;220&gt;]]&gt;
          <br/>&lt;![CDATA[&lt;223&gt;  合成的]]&gt;
          <br/>
          <br/>&lt;![CDATA[&lt;400&gt;  226]]&gt;
          <br/>
          <br/><![CDATA[Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu 
          1               5                   10                  15      
          Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly 
                      20                  25                  30          
          Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr 
                  35                  40                  45              
          Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp 
              50                  55                  60                  
          Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp 
          65                  70                  75                  80  
          Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu 
                          85                  90                  95      
          Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser 
                      100                 105                 110         
          Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr 
                  115                 120                 125             
          Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His 
              130                 135                 140                 
          Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu 
          145                 150                 155                 160 
          Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu 
                          165                 170                 175     
          Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu 
                      180                 185                 190         
          Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln 
                  195                 200                 205             
          Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln 
              210                 215                 220                 
          Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile 
          225                 230                 235                 240 
          Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp 
                          245                 250                 255     
          Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys 
                      260                 265                 270         
          Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp 
                  275                 280                 285             
          Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys 
              290                 295                 300                 
          Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln 
          305                 310                 315                 320 
          Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu 
                          325                 330                 335     
          Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr 
                      340                 345                 350         
          Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys 
                  355                 360                 365             
          Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu 
              370                 375                 380                 
          Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile 
          385                 390                 395                 400 
          Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile 
                          405                 410                 415     
          Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln 
                      420                 425                 430         
          Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn 
                  435                 440                 445             
          Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser 
              450                 455                 460                 
          Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly 
          465                 470                 475                 480 
          Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln 
                          485                 490                 495     
          Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg 
                      500                 505                 510         
          Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala 
                  515                 520                 525             
          Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg 
              530                 535                 540                 
          Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys 
          545                 550                 555                 560 
          Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile 
                          565                 570                 575     
          Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly 
                      580                 585                 590         
          Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr 
                  595                 600                 605             
          Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Arg 
              610                 615                 620                 
          Cys Arg Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu 
          625                 630                 635                 640 
          Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr 
                          645                 650                 655     
          Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu 
                      660                 665                 670         
          Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu 
                  675                 680                 685             
          Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr 
              690                 695                 700                 
          Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly 
          705                 710                 715                 720 
          Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe 
                          725                 730                 735     
          Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser 
                      740                 745                 750         
          Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe 
                  755                 760                 765             
          Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln 
              770                 775                 780                 
          Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu 
          785                 790                 795                 800 
          Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn 
                          805                 810                 815     
          Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly 
                      820                 825                 830         
          Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn 
                  835                 840                 845             
          Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg 
              850                 855                 860                 
          Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu 
          865                 870                 875                 880 
          Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala 
                          885                 890                 895     
          Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp 
                      900                 905                 910         
          Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr 
                  915                 920                 925             
          Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu 
              930                 935                 940                 
          Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys 
          945                 950                 955                 960 
          Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu 
                          965                 970                 975     
          Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile 
                      980                 985                 990         
          Tyr Phe Ala Thr His Lys Val Ala  Thr Gly Ala Val Ser  Ile Val Phe 
                  995                 1000                 1005             
          Asp Gln  Lys Gln Val Trp Val  Cys Asn Ala Asp His  Val Ala Ala 
              1010                 1015                 1020             
          Ala Asn  Ile Ala Leu Thr Gly  Lys Gly Ile Gly Arg  Gln Ser Ser 
              1025                 1030                 1035             
          Asp Glu  Glu Asn Pro Asp Gly  Gly Arg Ile Lys Leu  Gln Leu Thr 
              1040                 1045                 1050             
          Ser 
          <![CDATA[<210>  227]]>
          <![CDATA[<211>  1054]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  227]]>
          Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu 
          1               5                   10                  15      
          Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly 
                      20                  25                  30          
          Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr 
                  35                  40                  45              
          Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp 
              50                  55                  60                  
          Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp 
          65                  70                  75                  80  
          Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu 
                          85                  90                  95      
          Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser 
                      100                 105                 110         
          Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr 
                  115                 120                 125             
          Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His 
              130                 135                 140                 
          Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu 
          145                 150                 155                 160 
          Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu 
                          165                 170                 175     
          Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu 
                      180                 185                 190         
          Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln 
                  195                 200                 205             
          Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln 
              210                 215                 220                 
          Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile 
          225                 230                 235                 240 
          Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp 
                          245                 250                 255     
          Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys 
                      260                 265                 270         
          Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp 
                  275                 280                 285             
          Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys 
              290                 295                 300                 
          Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln 
          305                 310                 315                 320 
          Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu 
                          325                 330                 335     
          Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr 
                      340                 345                 350         
          Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys 
                  355                 360                 365             
          Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu 
              370                 375                 380                 
          Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile 
          385                 390                 395                 400 
          Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile 
                          405                 410                 415     
          Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln 
                      420                 425                 430         
          Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn 
                  435                 440                 445             
          Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser 
              450                 455                 460                 
          Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly 
          465                 470                 475                 480 
          Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln 
                          485                 490                 495     
          Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg 
                      500                 505                 510         
          Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala 
                  515                 520                 525             
          Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg 
              530                 535                 540                 
          Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys 
          545                 550                 555                 560 
          Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile 
                          565                 570                 575     
          Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly 
                      580                 585                 590         
          Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr 
                  595                 600                 605             
          Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Arg 
              610                 615                 620                 
          Cys Arg Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu 
          625                 630                 635                 640 
          Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr 
                          645                 650                 655     
          Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu 
                      660                 665                 670         
          Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu 
                  675                 680                 685             
          Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr 
              690                 695                 700                 
          Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly 
          705                 710                 715                 720 
          Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe 
                          725                 730                 735     
          Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser 
                      740                 745                 750         
          Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe 
                  755                 760                 765             
          Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln 
              770                 775                 780                 
          Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu 
          785                 790                 795                 800 
          Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn 
                          805                 810                 815     
          Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly 
                      820                 825                 830         
          Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn 
                  835                 840                 845             
          Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg 
              850                 855                 860                 
          Gln Leu Ala Thr Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu 
          865                 870                 875                 880 
          Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala 
                          885                 890                 895     
          Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp 
                      900                 905                 910         
          Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr 
                  915                 920                 925             
          Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu 
              930                 935                 940                 
          Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys 
          945                 950                 955                 960 
          Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu 
                          965                 970                 975     
          Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile 
                      980                 985                 990         
          Tyr Phe Ala Thr His Lys Val Ala  Thr Gly Ala Val Ser  Ile Val Phe 
                  995                 1000                 1005             
          Asp Gln  Lys Gln Val Trp Val  Cys Asn Ala Asp His  Val Ala Ala 
              1010                 1015                 1020             
          Ala Asn  Ile Ala Leu Thr Gly  Lys Gly Ile Gly Arg  Gln Ser Ser 
              1025                 1030                 1035             
          Asp Glu  Glu Asn Pro Asp Gly  Gly Arg Ile Lys Leu  Gln Leu Thr 
              1040                 1045                 1050             
          Ser 
          <![CDATA[<210>  228]]>
          <![CDATA[<211>  6945]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  228]]>
          acagaagtcc actcattctt ggcaggatgg cttctcatcg tctgctcctc ctctgccttg       60
          ctggactggt atttgtgtct gaggctggcc ctacggtgag tgtttctgtg acatcccatt      120
          cctacattta agattcacgc taaatgaagt agaagtgact ccttccagct ttgccaacca      180
          gcttttatta ctagggcaag ggtacccagc atctattttt aatataatta attcaaactt      240
          caaaaagaat gaagttccac tgagcttact gagctgggac ttgaactctg agcattctac      300
          ctcattgctt tggtgcatta ggtttgtaat atctggtacc tctgtttcct cagatagatg      360
          atagaaataa agatatgata ttaaggaagc tgttaatact gaattttcag aaaagtatcc      420
          ctccataaaa tgtatttggg ggacaaactg caggagatta tattctggcc ctatagttat      480
          tcaaaacgta tttattgatt aatctttaaa aggcttagtg aacaatattc tagtcagata      540
          tctaattctt aaatcctcta gaagaattaa ctaatactat aaaatgggtc tggatgtagt      600
          tctgacatta ttttataaca actggtaaga gggagtgact atagcaacaa ctaaaatgat      660
          ctcaggaaaa cctgtttggc cctatgtatg gtacattaca tcttttcagt aattccactc      720
          aaatggagac ttttaacaaa gcaactgttc tcaggggacc tattttctcc cttaaaattc      780
          attatacaca tccctggttg atagcagtgt gtctggaggc agaaaccatt cttgctttgg      840
          aaacaattac gtctgtgtta tactgagtag ggaagctcat taattgtcga cacttacgtt      900
          cctgataatg ggatcagtgt gtaattcttg tttcgctcca gatttctaat accacaaaga      960
          ataaatcctt tcactctgat caattttgtt aacttctcac gtgtcttctc tacacccagg     1020
          gcaccggtga atccaagtgt cctctgatgg tcaaagttct agatgctgtc cgaggcagtc     1080
          ctgccatcaa tgtggccgtg catgtgttca gaaaggctgc tgatgacacc tgggagccat     1140
          ttgcctctgg gtaagttgcc aaagaaccct cccacaggac ttggttttat cttcccgttt     1200
          gcccctcact tggtagagag aggctcacat catctgctaa agaatttaca agtagattga     1260
          aaaacgtagg cagaggtcaa gtatgccctc tgaaggatgc cctctttttg ttttgcttag     1320
          ctaggaagtg accaggaacc tgagcatcat ttaggggcag acagtagaga aaagaaggaa     1380
          tcagaactcc tctcctctag ctgtggtttg caaccctttt gggtcacaga acactttatg     1440
          taggtgatga aaagtaaaca ttctatgccc agaaaaaatg cacagataca cacacataca     1500
          aaatcatata tgtgatttta ggagtttcac agattccctg gtgtccctgg gtaacaccaa     1560
          agctaagtgt ccttgtctta gaattttagg aaaaggtata atgtgtatta acccattaac     1620
          aaaaggaaag gaattcagaa atattattaa ccaggcatct gtctgtagtt aatatggatc     1680
          acccaaaacc caaggctttt gcctaatgaa cactttgggg cacctactgt gtgcaaggct     1740
          gggggctgtc aagctcagtt aaaaaaaaaa agatagaaga gatggatcca tgaggcaaag     1800
          tacagcccca ggctaatccc acgatcaccc gacttcatgt ccaagagtgg cttctcacct     1860
          tcattagcca gttcacaatt ttcatggagt ttttctacct gcactagcaa aaacttcaag     1920
          gaaaatacat attaataaat ctaagcaaag tgaccagaag acagagcaat caggagaccc     1980
          tttgcatcca gcagaagagg aactgctaag tatttacatc tccacagaga agaatttctg     2040
          ttgggtttta attgaacccc aagaaccaca tgattcttca accattattg ggaagatcat     2100
          tttcttaggt ctggttttaa ctggcttttt atttgggaat tcatttatgt ttatataaaa     2160
          tgccaagcat aacatgaaaa gtggttacag gactattcta agggagagac agaatggaca     2220
          ccaaaaatat tccaatgttc ttgtgaatct tttccttgca ccaggacaaa aaaaaaaaga     2280
          agtgaaaaga agaaaggagg aggggcataa tcagagtcag taaagacaac tgctattttt     2340
          atctatcgta gctgttgcag tcaaatggga agcaatttcc aacattcaac tatggagctg     2400
          gtacttacat ggaaatagaa gttgcctagt gtttgttgct ggcaaagagt tatcagagag     2460
          gttaaatata taaaagggaa aagagtcaga tacaggttct tcttcctact ttaggttttc     2520
          cactgtgtgt gcaaatgata ctccctggtg gtgtgcagat gcctcaaagc tatcctcaca     2580
          ccacaaggga gaggagcgag atcctgctgt cctggagaag tgcagagtta gaacagctgt     2640
          ggccacttgc atccaatcat caatcttgaa tcacagggac tctttcttaa gtaaacatta     2700
          tacctggccg ggcacggtgg ctcacgcctg taatcccagc actttgggat gccaaagtgg     2760
          gcatatcatc tgaggtcagg agttcaagac cagcctggcc aacatggcaa aactccgtct     2820
          ttatgaaaaa tacaaaaatt agccaggcat ggtggcaggc gcctgtaatc ccagctaatt     2880
          gggaggctga ggctggagaa tcccttgaat ctaggaggca gaggttgcag tgagctgaga     2940
          tcgtgccatt gcactccagc ctgggtgaca agagtaaaac tctgtctcaa aaaaaaaaaa     3000
          ttatacctac attctcttct tatcagagaa aaaaatctac agtgagcttt tcaaaaagtt     3060
          tttacaaact ttttgccatt taatttcagt taggagtttt ccctacttct gacttagttg     3120
          aggggaaatg ttcataacat gtttataaca tgtttatgtg tgttagttgg tgggggtgta     3180
          ttactttgcc atgccatttg tttcctccat gcgtaactta atccagactt tcacacctta     3240
          taggaaaacc agtgagtctg gagagctgca tgggctcaca actgaggagg aatttgtaga     3300
          agggatatac aaagtggaaa tagacaccaa atcttactgg aaggcacttg gcatctcccc     3360
          attccatgag catgcagagg tgagtataca gaccttcgag ggttgttttg gttttggttt     3420
          ttgcttttgg cattccagga aatgcacagt tttactcagt gtaccacaga aatgtcctaa     3480
          ggaaggtgat gaatgaccaa aggttccctt tcctattata caagaaaaaa ttcacaacac     3540
          tctgagaagc aaatttcttt ttgactttga tgaaaatcca cttagtaaca tgacttgaac     3600
          ttacatgaaa ctactcatag tctattcatt ccactttata tgaatattga tgtatctgct     3660
          gttgaaataa tagtttatga ggcagccctc cagaccccac gtagagtgta tgtaacaaga     3720
          gatgcaccat tttatttctc gaaaacccgt aacattcttc attccaaaac acatctggct     3780
          tctcggaggt ctggacaagt gattcttggc aacacatacc tatagagaca ataaaatcaa     3840
          agtaataatg gcaacacaat agataacatt taccaagcat acaccatgtg gcagacacaa     3900
          ttataagtgt tttccatatt taacctactt aatcctcagg aataagccac tgaggtcagt     3960
          cctattatta tccccatctt atagatgaag aaaatgaggc accaggaagt caaataactt     4020
          gtcaaaggtc acaagactag gaaatacaca agtagaaatg tttacaatta aggcccaggc     4080
          tgggtttgcc ctcagttctg ctatgcctcg cattatgccc caggaaactt tttcccttgt     4140
          gaaagccaag cttaaaaaaa gaaaagccac atttgtaacg tgctctgttc ccctgcctat     4200
          ggtgaggatc ttcaaacagt tatacatgga cccagtcccc ctgccttctc cttaatttct     4260
          taagtcattt gaaacagatg gctgtcatgg aaatagaatc cagacatgtt ggtcagagtt     4320
          aaagatcaac taattccatc aaaaatagct cggcatgaaa gggaactatt ctctggctta     4380
          gtcatggatg agactttcaa ttgctataaa gtggttcctt tattagacaa tgttaccagg     4440
          gaaacaacag gggtttgttt gacttctggg gcccacaagt caacaagaga gccccatcta     4500
          ccaaggagca tgtccctgac tacccctcag ccagcagcaa gacatggacc ccagtcaggg     4560
          caggagcagg gtttcggcgg cgcccagcac aagacattgc ccctagagtc tcagccccta     4620
          ccctcgagta atagatctgc ctacctgaga ctgttgtttg cccaagagct gggtctcagc     4680
          ctgatgggaa ccatataaaa aggttcactg acatactgcc cacatgttgt tctctttcat     4740
          tagatcttag cttccttgtc tgctcttcat tcttgcagta ttcattcaac aaacattaaa     4800
          aaaaaaaaaa agcattctat gtgtggaaca ctctgctaga tgctgtggat ttagaaatga     4860
          aaatacatcc cgacccttgg aatggaaggg aaaggactga agtaagacag attaagcagg     4920
          accgtcagcc cagcttgaag cccagataaa tacggagaac aagagagagc gagtagtgag     4980
          agatgagtcc caatgcctca ctttggtgac gggtgcgtgg tgggcttcat gcagcttctt     5040
          ctgataaatg cctccttcag aactggtcaa ctctaccttg gccagtgacc caggtggtca     5100
          tagtagattt accaagggaa aatggaaact tttattagga gctcttaggc ctcttcactt     5160
          catggatttt tttttccttt ttttttgaga tggagttttg ccctgtcacc caggctggaa     5220
          tgcagtggtg caatctcagc tcactgcaac ctccgcctcc caggttcaag caattctcct     5280
          gcctcagcct cccgagtagc tgggactaca ggtgtgcgcc accacaccag gctaattttt     5340
          gtattttttg taaagacagg ttttcaccac gttggccagg ctggtctgaa ctccagacct     5400
          caggtgattc acctgtctca gcctcccaaa gtgctgggat tacaggtgtg agccaccgtg     5460
          cccggctact tcatggattt ttgattacag attatgcctc ttacaatttt taagaagaat     5520
          caagtgggct gaaggtcaat gtcaccataa gacaaaagac atttttatta gttgattcta     5580
          gggaattggc cttaagggga gccctttctt cctaagagat tcttaggtga ttctcacttc     5640
          ctcttgcccc agtattattt ttgtttttgg tatggctcac tcagatcctt ttttcctcct     5700
          atccctaagt aatccgggtt tctttttccc atatttagaa caaaatgtat ttatgcagag     5760
          tgtgtccaaa cctcaaccca aggcctgtat acaaaataaa tcaaattaaa cacatcttta     5820
          ctgtcttcta cctctttcct gacctcaata tatcccaact tgcctcactc tgagaaccaa     5880
          ggctgtccca gcacctgagt cgcagatatt ctactgattt gacagaactg tgtgactatc     5940
          tggaacagca ttttgatcca caatttgccc agttacaaag cttaaatgag ctctagtgca     6000
          tgcatatata tttcaaaatt ccaccatgat cttccacact ctgtattgta aatagagccc     6060
          tgtaatgctt ttacttcgta tttcattgct tgttatacat aaaaatatac ttttcttctt     6120
          catgttagaa aatgcaaaga ataggagggt gggggaatct ctgggcttgg agacaggaga     6180
          cttgccttcc tactatggtt ccatcagaat gtagactggg acaatacaat aattcaagtc     6240
          tggtttgctc atctgtaaat tgggaagaat gtttccagct ccagaatgct aaatctctaa     6300
          gtctgtggtt ggcagccact attgcagcag ctcttcaatg actcaatgca gttttgcatt     6360
          ctccctacct tttttttcta aaaccaataa aatagataca gcctttaggc tttctgggat     6420
          ttcccttagt caagctaggg tcatcctgac tttcggcgtg aatttgcaaa acaagacctg     6480
          actctgtact cctgctctaa ggactgtgca tggttccaaa ggcttagctt gccagcatat     6540
          ttgagctttt tccttctgtt caaactgttc caaaatataa aagaataaaa ttaattaagt     6600
          tggcactgga cttccggtgg tcagtcatgt gtgtcatctg tcacgttttt cgggctctgg     6660
          tggaaatgga tctgtctgtc ttctctcata ggtggtattc acagccaacg actccggccc     6720
          ccgccgctac accattgccg ccctgctgag cccctactcc tattccacca cggctgtcgt     6780
          caccaatccc aaggaatgag ggacttctcc tccagtggac ctgaaggacg agggatggga     6840
          tttcatgtaa ccaagagtat tccattttta ctaaagcagt gttttcacct catatgctat     6900
          gttagaagtc caggcagaga caataaaaca ttcctgtgaa aggca                     6945
          <![CDATA[<210>  229]]>
          <![CDATA[<211>  145]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>]]>  229
          acagaagtcc actcattctt ggcaggatgg cttctcatcg tctgctcctc ctctgccttg       60
          ctggactggt atttgtgtct gaggctggcc ctacggtgag tgtttctgtg acatcccatt      120
          cctacattta agattcacgc taaat                                            145
          <![CDATA[<210>  230]]>
          <![CDATA[<211>  231]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  230]]>
          ttcactctga tcaattttgt taacttctca cgtgtcttct ctacacccag ggcaccggtg       60
          aatccaagtg tcctctgatg gtcaaagttc tagatgctgt ccgaggcagt cctgccatca      120
          atgtggccgt gcatgtgttc agaaaggctg ctgatgacac ctgggagcca tttgcctctg      180
          ggtaagttgc caaagaaccc tcccacagga cttggtttta tcttcccgtt t               231
          <![CDATA[<210>  231]]>
          <![CDATA[<211>  236]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  231]]>
          ccatttgttt cctccatgcg taacttaatc cagactttca caccttatag gaaaaccagt       60
          gagtctggag agctgcatgg gctcacaact gaggaggaat ttgtagaagg gatatacaaa      120
          gtggaaatag acaccaaatc ttactggaag gcacttggca tctccccatt ccatgagcat      180
          gcagaggtga gtatacagac cttcgagggt tgttttggtt ttggtttttg cttttg          236
          <![CDATA[<210>  232]]>
          <![CDATA[<211>  304]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  232]]>
          cacgtttttc gggctctggt ggaaatggat ctgtctgtct tctctcatag gtggtattca       60
          cagccaacga ctccggcccc cgccgctaca ccattgccgc cctgctgagc ccctactcct      120
          attccaccac ggctgtcgtc accaatccca aggaatgagg gacttctcct ccagtggacc      180
          tgaaggacga gggatgggat ttcatgtaac caagagtatt ccatttttac taaagcagtg      240
          ttttcacctc atatgctatg ttagaagtcc aggcagagac aataaaacat tcctgtgaaa      300
          ggca                                                                   304
          <![CDATA[<210>  233]]>
          <![CDATA[<211>  36]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  233]]>
          ucucaacgau agucagacau guguccucag ugacac                                 36
          <![CDATA[<210>  234]]>
          <![CDATA[<211>  36]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  234]]>
          uuuuaacaac acucaggcau guguccacag ugacac                                 36
          <![CDATA[<210>  235]]>
          <![CDATA[<211>  36]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  235]]>
          uugaacggau acucagacau guguuuccag ugacac                                 36
          <![CDATA[<210>  236]]>
          <![CDATA[<211>  36]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  236]]>
          ugcccucaau agucagaugu guguccacag ugacac                                 36
          <![CDATA[<210>  237]]>
          <![CDATA[<211>  36]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  237]]>
          ucucaaugau acuuagauac guguccucag ugacac                                 36
          <![CDATA[<210>  238]]>
          <![CDATA[<211>  36]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  238]]>
          ucucaaugau acucagacau guguccccag ugacac                                 36
          <![CDATA[<210>  239]]>
          <![CDATA[<211>  36]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  239]]>
          ucucaaugau acuaagacau guguccucag ugacac                                 36
          <![CDATA[<210>  240]]>
          <![CDATA[<211>  36]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  240]]>
          ucucaacuau acucagacau guguccucag ugacac                                 36
          <![CDATA[<210>  241]]>
          <![CDATA[<211>  36]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  241]]>
          ucucaacgau acucagacau guguccucag ugacac                                 36
          <![CDATA[<210>  242]]>
          <![CDATA[<211>  36]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  242]]>
          ucucaacgau acuaagauau guguccucag cgacac                                 36
          <![CDATA[<210>  243]]>
          <![CDATA[<211>  36]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  243]]>
          ucucaacgau acuaagauau guguccccag ugacac                                 36
          <![CDATA[<210>  244]]>
          <![CDATA[<211>  36]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  244]]>
          ucucaacgau acuaagauau guguccacag ugacac                                 36
          <![CDATA[<210>  245]]>
          <![CDATA[<211>  36]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  ]]>人工序列
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  245]]>
          ucucaacaau acucagacau guguccccag ugacac                                 36
          <![CDATA[<210>  246]]>
          <![CDATA[<211>  36]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  246]]>
          ucucaacaau acuaaggcau guguccccag ugaccc                                 36
          <![CDATA[<210>  247]]>
          <![CDATA[<211>  36]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  247]]>
          ucucaaagau acucagacac guguccccag ugacac                                 36
          <![CDATA[<210>  248]]>
          <![CDATA[<211>  36]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  248]]>
          ucucaaaaau acucagacau guguccucag ugacac                                 36
          <![CDATA[<210>  249]]>
          <![CDATA[<211>  36]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  249]]>
          gcgaaacaac agucagacau guguccccag ugacac                                 36
          <![CDATA[<210>  250]]>
          <![CDATA[<211>  36]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  250]]>
          ccucaacgau auuaagacau guguccgcag ugacac                                 36
          <![CDATA[<210>  251]]>
          <![CDATA[<211>  22]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  251]]>
          agacaugugu ccucagugac ac                                                22
          <![CDATA[<210>  252]]>
          <![CDATA[<211>  3222]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  252]]>
          atggcttcca tctctaggcc atacggcacc aagctgcgac cggacgcacg gaagaaggag       60
          atgctcgata agttctttaa tacactgact aagggtcagc gcgtgttcgc agacctggcc      120
          ctgtgcatct atggctccct gaccctggag atggccaagt ctctggagcc agaaagtgat      180
          tcagaactgg tgtgcgctat tgggtggttt cggctggtgg acaagaccat ctggtccaag      240
          gatggcatca agcaggagaa tctggtgaaa cagtacgaag cctattccgg aaaggaggct      300
          tctgaagtgg tcaaaacata cctgaacagc cccagctccg acaagtacgt gtggatcgat      360
          tgcaggcaga aattcctgag gtttcagcgc gagctcggca ctcgcaacct gtccgaggac      420
          ttcgaatgta tgctctttga acagtacatt agactgacca agggcgagat cgaagggtat      480
          gccgctattt caaatatgtt cggaaacggc gagaaggaag accggagcaa gaaaagaatg      540
          tacgctacac ggatgaaaga ttggctggag gcaaacgaaa atatcacttg ggagcagtat      600
          agagaggccc tgaagaacca gctgaatgct aaaaacctgg agcaggttgt ggccaattac      660
          aaggggaacg ctggcggggc agaccccttc tttaagtata gcttctccaa agagggaatg      720
          gtgagcaaga aagaacatgc acagcagctc gacaagttca aaaccgtcct gaagaacaaa      780
          gcccgggacc tgaattttcc aaacaaggag aagctgaagc agtacctgga ggccgaaatc      840
          ggcattccgg tcgacgctaa cgtgtactcc cagatgttct ctaacggggt gagtgaggtc      900
          cagcctaaga ccacacggaa tatgtctttt agtaacgaga aactggatct gctcactgaa      960
          ctgaaggacc tgaacaaggg cgatgggttc gagtacgcca gagaagtgct gaacgggttc     1020
          tttgactccg agctccacac taccgaggat aagtttaata tcacctctag gtacctggga     1080
          ggcgacaaat caaaccgcct gagcaaactc tataagatct ggaagaaaga gggtgtggac     1140
          tgcgaggaag gcattcagca gttctgtgaa gccgtcaaag ataagatggg ccagatcccc     1200
          attcgaaatg tgctgaagta cctgtggcag ttccgggaga cagtcagtgc cgaggatttt     1260
          gaagcagccg ctaaggctaa ccatctggag gaaaagatca gccgggtgaa agcccaccca     1320
          atcgtgatta gcaataggta ctgggctttt gggacttccg cactggtggg aaacattatg     1380
          cccgcagaca agaggcatca gggagagtat gccggtcaga atttcaaaat gtggctggag     1440
          gctgaactgc actacgatgg caagaaagca aagcaccatc tgccttttta taacgcccgc     1500
          ttctttgagg aagtgtactg ctatcacccc tctgtcgccg agatcactcc tttcaaaacc     1560
          aagcagtttg gctgtgaaat cgggaaggac attccagatt acgtgagcgt cgctctgaag     1620
          gacaatccgt ataagaaagc aaccaaacga atcctgcgtg caatctacaa tcccgtcgcc     1680
          aacacaactg gcgttgataa gaccacaaac tgcagcttca tgatcaaacg cgagaatgac     1740
          gaatataagc tggtcatcaa ccgaaaaatt tccgtggatc ggcctaagag aatcgaagtg     1800
          ggcaggacaa ttatggggta cgaccgcaat cagacagcta gcgatactta ttggattggc     1860
          cggctggtgc cacctggaac ccggggcgca taccgcatcg gagagtggag cgtccagtat     1920
          attaagtccg ggcctgtcct gtctagtact cagggagtta acaattccac taccgaccag     1980
          ctggtgtaca acggcatgcc atcaagctcc gagcggttca aggcctggaa gaaagccaga     2040
          atggctttta tccgaaaact cattcgtcag ctgaatgacg agggactgga atctaagggt     2100
          caggattata tccccgagaa cccttctagt ttcgatgtgc ggggcgaaac cctgtacgtc     2160
          tttaacagta attatctgaa ggccctggtg agcaaacaca gaaaggccaa gaaacctgtt     2220
          gaggggatcc tggacgagat tgaagcctgg acatctaaag acaaggattc atgcagcctg     2280
          atgcggctga gcagcctgag cgatgcttcc atgcagggaa tcgccagcct gaagagtctg     2340
          attaacagct acttcaacaa gaatggctgt aaaaccatcg aggacaaaga aaagtttaat     2400
          cccgtgctgt atgccaagct ggttgaggtg gaacagcgga gaacaaacaa gcggtctgag     2460
          aaagtgggaa gaatcgcagg tagtctggag cagctggccc tgctgaacgg ggttgaggtg     2520
          gtcatcggcg aagctgacct gggggaggtc gaaaaaggaa agagtaagaa acagaattca     2580
          cggaacatgg attggtgcgc aaagcaggtg gcacagcggc tggagtacaa actggccttc     2640
          catggaatcg gttactttgg agtgaacccc atgtatacca gccaccagga ccctttcgaa     2700
          cataggcgcg tggctgatca catcgtcatg cgagcacgtt ttgaggaagt caacgtggag     2760
          aacattgccg aatggcacgt gcgaaatttc tcaaactacc tgcgtgcaga cagcggcact     2820
          gggctgtact ataagcaggc caccatggac ttcctgaaac attacggtct ggaggaacac     2880
          gctgagggcc tggaaaataa gaaaatcaag ttctatgact ttagaaagat cctggaggat     2940
          aaaaacctga caagcgtgat cattccaaag aggggcgggc gcatctacat ggccaccaac     3000
          ccagtgacat ccgactctac cccgattaca tacgccggca agacttataa taggtgtaac     3060
          gctgatgagg tggcagccgc taatatcgtt atttctgtgc tggctccccg cagtaagaaa     3120
          aacgaggaac aggacgatat ccctctgatt accaagaaag ccgagagtaa gtcaccaccg     3180
          aaagaccgga agagatcaaa aacaagccag ctgcctcaga aa                        3222
          <![CDATA[<210>  253]]>
          <![CDATA[<211>  1074]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  253]]>
          Met Ala Ser Ile Ser Arg Pro Tyr Gly Thr Lys Leu Arg Pro Asp Ala 
          1               5                   10                  15      
          Arg Lys Lys Glu Met Leu Asp Lys Phe Phe Asn Thr Leu Thr Lys Gly 
                      20                  25                  30          
          Gln Arg Val Phe Ala Asp Leu Ala Leu Cys Ile Tyr Gly Ser Leu Thr 
                  35                  40                  45              
          Leu Glu Met Ala Lys Ser Leu Glu Pro Glu Ser Asp Ser Glu Leu Val 
              50                  55                  60                  
          Cys Ala Ile Gly Trp Phe Arg Leu Val Asp Lys Thr Ile Trp Ser Lys 
          65                  70                  75                  80  
          Asp Gly Ile Lys Gln Glu Asn Leu Val Lys Gln Tyr Glu Ala Tyr Ser 
                          85                  90                  95      
          Gly Lys Glu Ala Ser Glu Val Val Lys Thr Tyr Leu Asn Ser Pro Ser 
                      100                 105                 110         
          Ser Asp Lys Tyr Val Trp Ile Asp Cys Arg Gln Lys Phe Leu Arg Phe 
                  115                 120                 125             
          Gln Arg Glu Leu Gly Thr Arg Asn Leu Ser Glu Asp Phe Glu Cys Met 
              130                 135                 140                 
          Leu Phe Glu Gln Tyr Ile Arg Leu Thr Lys Gly Glu Ile Glu Gly Tyr 
          145                 150                 155                 160 
          Ala Ala Ile Ser Asn Met Phe Gly Asn Gly Glu Lys Glu Asp Arg Ser 
                          165                 170                 175     
          Lys Lys Arg Met Tyr Ala Thr Arg Met Lys Asp Trp Leu Glu Ala Asn 
                      180                 185                 190         
          Glu Asn Ile Thr Trp Glu Gln Tyr Arg Glu Ala Leu Lys Asn Gln Leu 
                  195                 200                 205             
          Asn Ala Lys Asn Leu Glu Gln Val Val Ala Asn Tyr Lys Gly Asn Ala 
              210                 215                 220                 
          Gly Gly Ala Asp Pro Phe Phe Lys Tyr Ser Phe Ser Lys Glu Gly Met 
          225                 230                 235                 240 
          Val Ser Lys Lys Glu His Ala Gln Gln Leu Asp Lys Phe Lys Thr Val 
                          245                 250                 255     
          Leu Lys Asn Lys Ala Arg Asp Leu Asn Phe Pro Asn Lys Glu Lys Leu 
                      260                 265                 270         
          Lys Gln Tyr Leu Glu Ala Glu Ile Gly Ile Pro Val Asp Ala Asn Val 
                  275                 280                 285             
          Tyr Ser Gln Met Phe Ser Asn Gly Val Ser Glu Val Gln Pro Lys Thr 
              290                 295                 300                 
          Thr Arg Asn Met Ser Phe Ser Asn Glu Lys Leu Asp Leu Leu Thr Glu 
          305                 310                 315                 320 
          Leu Lys Asp Leu Asn Lys Gly Asp Gly Phe Glu Tyr Ala Arg Glu Val 
                          325                 330                 335     
          Leu Asn Gly Phe Phe Asp Ser Glu Leu His Thr Thr Glu Asp Lys Phe 
                      340                 345                 350         
          Asn Ile Thr Ser Arg Tyr Leu Gly Gly Asp Lys Ser Asn Arg Leu Ser 
                  355                 360                 365             
          Lys Leu Tyr Lys Ile Trp Lys Lys Glu Gly Val Asp Cys Glu Glu Gly 
              370                 375                 380                 
          Ile Gln Gln Phe Cys Glu Ala Val Lys Asp Lys Met Gly Gln Ile Pro 
          385                 390                 395                 400 
          Ile Arg Asn Val Leu Lys Tyr Leu Trp Gln Phe Arg Glu Thr Val Ser 
                          405                 410                 415     
          Ala Glu Asp Phe Glu Ala Ala Ala Lys Ala Asn His Leu Glu Glu Lys 
                      420                 425                 430         
          Ile Ser Arg Val Lys Ala His Pro Ile Val Ile Ser Asn Arg Tyr Trp 
                  435                 440                 445             
          Ala Phe Gly Thr Ser Ala Leu Val Gly Asn Ile Met Pro Ala Asp Lys 
              450                 455                 460                 
          Arg His Gln Gly Glu Tyr Ala Gly Gln Asn Phe Lys Met Trp Leu Glu 
          465                 470                 475                 480 
          Ala Glu Leu His Tyr Asp Gly Lys Lys Ala Lys His His Leu Pro Phe 
                          485                 490                 495     
          Tyr Asn Ala Arg Phe Phe Glu Glu Val Tyr Cys Tyr His Pro Ser Val 
                      500                 505                 510         
          Ala Glu Ile Thr Pro Phe Lys Thr Lys Gln Phe Gly Cys Glu Ile Gly 
                  515                 520                 525             
          Lys Asp Ile Pro Asp Tyr Val Ser Val Ala Leu Lys Asp Asn Pro Tyr 
              530                 535                 540                 
          Lys Lys Ala Thr Lys Arg Ile Leu Arg Ala Ile Tyr Asn Pro Val Ala 
          545                 550                 555                 560 
          Asn Thr Thr Gly Val Asp Lys Thr Thr Asn Cys Ser Phe Met Ile Lys 
                          565                 570                 575     
          Arg Glu Asn Asp Glu Tyr Lys Leu Val Ile Asn Arg Lys Ile Ser Val 
                      580                 585                 590         
          Asp Arg Pro Lys Arg Ile Glu Val Gly Arg Thr Ile Met Gly Tyr Asp 
                  595                 600                 605             
          Arg Asn Gln Thr Ala Ser Asp Thr Tyr Trp Ile Gly Arg Leu Val Pro 
              610                 615                 620                 
          Pro Gly Thr Arg Gly Ala Tyr Arg Ile Gly Glu Trp Ser Val Gln Tyr 
          625                 630                 635                 640 
          Ile Lys Ser Gly Pro Val Leu Ser Ser Thr Gln Gly Val Asn Asn Ser 
                          645                 650                 655     
          Thr Thr Asp Gln Leu Val Tyr Asn Gly Met Pro Ser Ser Ser Glu Arg 
                      660                 665                 670         
          Phe Lys Ala Trp Lys Lys Ala Arg Met Ala Phe Ile Arg Lys Leu Ile 
                  675                 680                 685             
          Arg Gln Leu Asn Asp Glu Gly Leu Glu Ser Lys Gly Gln Asp Tyr Ile 
              690                 695                 700                 
          Pro Glu Asn Pro Ser Ser Phe Asp Val Arg Gly Glu Thr Leu Tyr Val 
          705                 710                 715                 720 
          Phe Asn Ser Asn Tyr Leu Lys Ala Leu Val Ser Lys His Arg Lys Ala 
                          725                 730                 735     
          Lys Lys Pro Val Glu Gly Ile Leu Asp Glu Ile Glu Ala Trp Thr Ser 
                      740                 745                 750         
          Lys Asp Lys Asp Ser Cys Ser Leu Met Arg Leu Ser Ser Leu Ser Asp 
                  755                 760                 765             
          Ala Ser Met Gln Gly Ile Ala Ser Leu Lys Ser Leu Ile Asn Ser Tyr 
              770                 775                 780                 
          Phe Asn Lys Asn Gly Cys Lys Thr Ile Glu Asp Lys Glu Lys Phe Asn 
          785                 790                 795                 800 
          Pro Val Leu Tyr Ala Lys Leu Val Glu Val Glu Gln Arg Arg Thr Asn 
                          805                 810                 815     
          Lys Arg Ser Glu Lys Val Gly Arg Ile Ala Gly Ser Leu Glu Gln Leu 
                      820                 825                 830         
          Ala Leu Leu Asn Gly Val Glu Val Val Ile Gly Glu Ala Asp Leu Gly 
                  835                 840                 845             
          Glu Val Glu Lys Gly Lys Ser Lys Lys Gln Asn Ser Arg Asn Met Asp 
              850                 855                 860                 
          Trp Cys Ala Lys Gln Val Ala Gln Arg Leu Glu Tyr Lys Leu Ala Phe 
          865                 870                 875                 880 
          His Gly Ile Gly Tyr Phe Gly Val Asn Pro Met Tyr Thr Ser His Gln 
                          885                 890                 895     
          Asp Pro Phe Glu His Arg Arg Val Ala Asp His Ile Val Met Arg Ala 
                      900                 905                 910         
          Arg Phe Glu Glu Val Asn Val Glu Asn Ile Ala Glu Trp His Val Arg 
                  915                 920                 925             
          Asn Phe Ser Asn Tyr Leu Arg Ala Asp Ser Gly Thr Gly Leu Tyr Tyr 
              930                 935                 940                 
          Lys Gln Ala Thr Met Asp Phe Leu Lys His Tyr Gly Leu Glu Glu His 
          945                 950                 955                 960 
          Ala Glu Gly Leu Glu Asn Lys Lys Ile Lys Phe Tyr Asp Phe Arg Lys 
                          965                 970                 975     
          Ile Leu Glu Asp Lys Asn Leu Thr Ser Val Ile Ile Pro Lys Arg Gly 
                      980                 985                 990         
          Gly Arg Ile Tyr Met Ala Thr Asn  Pro Val Thr Ser Asp  Ser Thr Pro 
                  995                 1000                 1005             
          Ile Thr  Tyr Ala Gly Lys Thr  Tyr Asn Arg Cys Asn  Ala Asp Glu 
              1010                 1015                 1020             
          Val Ala  Ala Ala Asn Ile Val  Ile Ser Val Leu Ala  Pro Arg Ser 
              1025                 1030                 1035             
          Lys Lys  Asn Glu Glu Gln Asp  Asp Ile Pro Leu Ile  Thr Lys Lys 
              1040                 1045                 1050             
          Ala Glu  Ser Lys Ser Pro Pro  Lys Asp Arg Lys Arg  Ser Lys Thr 
              1055                 1060                 1065             
          Ser Gln  Leu Pro Gln Lys 
              1070                 
          <![CDATA[<210>  254]]>
          <![CDATA[<211>  1074]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  254]]>
          Met Ala Ser Ile Ser Arg Pro Tyr Gly Thr Lys Leu Arg Pro Asp Ala 
          1               5                   10                  15      
          Arg Lys Lys Glu Met Leu Asp Lys Phe Phe Asn Thr Leu Thr Lys Gly 
                      20                  25                  30          
          Gln Arg Val Phe Ala Asp Leu Ala Leu Cys Ile Tyr Gly Ser Leu Thr 
                  35                  40                  45              
          Leu Glu Met Ala Lys Ser Leu Glu Pro Glu Ser Asp Ser Glu Leu Val 
              50                  55                  60                  
          Cys Ala Ile Gly Trp Phe Arg Leu Val Asp Lys Thr Ile Trp Ser Lys 
          65                  70                  75                  80  
          Asp Gly Ile Lys Gln Glu Asn Leu Val Lys Gln Tyr Glu Ala Tyr Ser 
                          85                  90                  95      
          Gly Lys Glu Ala Ser Glu Val Val Lys Thr Tyr Leu Asn Ser Pro Ser 
                      100                 105                 110         
          Ser Asp Lys Tyr Val Trp Ile Asp Cys Arg Gln Lys Phe Leu Arg Phe 
                  115                 120                 125             
          Gln Arg Glu Leu Gly Thr Arg Asn Leu Ser Glu Asp Phe Glu Cys Met 
              130                 135                 140                 
          Leu Phe Glu Gln Tyr Ile Arg Leu Thr Lys Gly Glu Ile Glu Gly Tyr 
          145                 150                 155                 160 
          Ala Ala Ile Ser Asn Met Phe Gly Asn Gly Glu Lys Glu Asp Arg Ser 
                          165                 170                 175     
          Lys Lys Arg Met Tyr Ala Thr Arg Met Lys Asp Trp Leu Glu Ala Asn 
                      180                 185                 190         
          Glu Asn Ile Thr Trp Glu Gln Tyr Arg Glu Ala Leu Lys Asn Gln Leu 
                  195                 200                 205             
          Asn Ala Lys Asn Leu Glu Gln Val Val Ala Asn Tyr Lys Gly Asn Ala 
              210                 215                 220                 
          Gly Gly Ala Asp Pro Phe Phe Lys Tyr Ser Phe Ser Lys Glu Gly Met 
          225                 230                 235                 240 
          Val Ser Lys Lys Glu His Ala Gln Gln Leu Asp Lys Phe Lys Thr Val 
                          245                 250                 255     
          Leu Lys Asn Lys Ala Arg Asp Leu Asn Phe Pro Asn Lys Glu Lys Leu 
                      260                 265                 270         
          Lys Gln Tyr Leu Glu Ala Glu Ile Gly Ile Pro Val Asp Ala Asn Val 
                  275                 280                 285             
          Tyr Ser Gln Met Phe Ser Asn Gly Val Ser Glu Val Gln Pro Lys Thr 
              290                 295                 300                 
          Thr Arg Asn Met Ser Phe Ser Asn Glu Lys Leu Asp Leu Leu Thr Glu 
          305                 310                 315                 320 
          Leu Lys Asp Leu Asn Lys Gly Asp Gly Phe Glu Tyr Ala Arg Glu Val 
                          325                 330                 335     
          Leu Asn Gly Phe Phe Asp Ser Glu Leu His Thr Thr Glu Asp Lys Phe 
                      340                 345                 350         
          Asn Ile Thr Ser Arg Tyr Leu Gly Gly Asp Lys Ser Asn Arg Leu Ser 
                  355                 360                 365             
          Lys Leu Tyr Lys Ile Trp Lys Lys Glu Gly Val Asp Cys Glu Glu Gly 
              370                 375                 380                 
          Ile Gln Gln Phe Cys Glu Ala Val Lys Asp Lys Met Gly Gln Ile Pro 
          385                 390                 395                 400 
          Ile Arg Asn Val Leu Lys Tyr Leu Trp Gln Phe Arg Glu Thr Val Ser 
                          405                 410                 415     
          Ala Glu Asp Phe Glu Ala Ala Ala Lys Ala Asn His Leu Glu Glu Lys 
                      420                 425                 430         
          Ile Ser Arg Val Lys Ala His Pro Ile Val Ile Ser Asn Arg Tyr Trp 
                  435                 440                 445             
          Ala Phe Gly Thr Ser Ala Leu Val Gly Asn Ile Met Pro Ala Asp Lys 
              450                 455                 460                 
          Arg His Gln Gly Glu Tyr Ala Gly Gln Asn Phe Lys Met Trp Leu Glu 
          465                 470                 475                 480 
          Ala Glu Leu His Tyr Asp Gly Lys Lys Ala Lys His His Leu Pro Phe 
                          485                 490                 495     
          Tyr Asn Ala Arg Phe Phe Glu Glu Val Tyr Cys Tyr His Pro Ser Val 
                      500                 505                 510         
          Ala Glu Ile Thr Pro Phe Lys Thr Lys Gln Phe Gly Cys Glu Ile Gly 
                  515                 520                 525             
          Lys Asp Ile Pro Asp Tyr Val Ser Val Ala Leu Lys Asp Asn Pro Tyr 
              530                 535                 540                 
          Lys Lys Ala Thr Lys Arg Ile Leu Arg Ala Ile Tyr Asn Pro Val Ala 
          545                 550                 555                 560 
          Asn Thr Thr Gly Val Asp Lys Thr Thr Asn Cys Ser Phe Met Ile Lys 
                          565                 570                 575     
          Arg Glu Asn Asp Glu Tyr Lys Leu Val Ile Asn Arg Lys Ile Ser Arg 
                      580                 585                 590         
          Asp Arg Pro Lys Arg Ile Glu Val Gly Arg Thr Ile Met Gly Tyr Asp 
                  595                 600                 605             
          Arg Asn Gln Thr Ala Ser Asp Thr Tyr Trp Ile Gly Arg Leu Val Pro 
              610                 615                 620                 
          Pro Gly Thr Arg Gly Ala Tyr Arg Ile Gly Glu Trp Ser Val Gln Tyr 
          625                 630                 635                 640 
          Ile Lys Ser Gly Pro Val Leu Ser Ser Thr Gln Gly Val Asn Asn Ser 
                          645                 650                 655     
          Thr Thr Asp Gln Leu Val Tyr Asn Gly Met Pro Ser Ser Ser Glu Arg 
                      660                 665                 670         
          Phe Lys Ala Trp Lys Lys Ala Arg Met Ala Phe Ile Arg Lys Leu Ile 
                  675                 680                 685             
          Arg Gln Leu Asn Asp Glu Gly Leu Glu Ser Lys Gly Gln Asp Tyr Ile 
              690                 695                 700                 
          Pro Glu Asn Pro Ser Ser Phe Asp Val Arg Gly Glu Thr Leu Tyr Val 
          705                 710                 715                 720 
          Phe Asn Ser Asn Tyr Leu Lys Ala Leu Val Ser Lys His Arg Lys Ala 
                          725                 730                 735     
          Lys Lys Pro Val Glu Gly Ile Leu Asp Glu Ile Glu Ala Trp Thr Ser 
                      740                 745                 750         
          Lys Asp Lys Asp Ser Cys Ser Leu Met Arg Leu Ser Ser Leu Ser Asp 
                  755                 760                 765             
          Ala Ser Met Gln Gly Ile Ala Ser Leu Lys Ser Leu Ile Asn Ser Tyr 
              770                 775                 780                 
          Phe Asn Lys Asn Gly Cys Lys Thr Ile Glu Asp Lys Glu Lys Phe Asn 
          785                 790                 795                 800 
          Pro Val Leu Tyr Ala Lys Leu Val Glu Val Glu Gln Arg Arg Thr Asn 
                          805                 810                 815     
          Lys Arg Ser Glu Lys Val Gly Arg Ile Ala Gly Ser Leu Glu Gln Leu 
                      820                 825                 830         
          Ala Leu Leu Asn Gly Val Glu Val Val Ile Gly Glu Ala Asp Leu Gly 
                  835                 840                 845             
          Glu Val Glu Lys Gly Lys Ser Lys Lys Gln Asn Ser Arg Asn Met Asp 
              850                 855                 860                 
          Trp Cys Ala Lys Gln Val Ala Gln Arg Leu Glu Tyr Lys Leu Ala Phe 
          865                 870                 875                 880 
          His Gly Ile Gly Tyr Phe Gly Val Asn Pro Met Tyr Thr Ser His Gln 
                          885                 890                 895     
          Asp Pro Phe Glu His Arg Arg Val Ala Asp His Ile Val Met Arg Ala 
                      900                 905                 910         
          Arg Phe Glu Glu Val Asn Val Glu Asn Ile Ala Glu Trp His Val Arg 
                  915                 920                 925             
          Asn Phe Ser Asn Tyr Leu Arg Ala Asp Ser Gly Thr Gly Leu Tyr Tyr 
              930                 935                 940                 
          Lys Gln Ala Thr Met Asp Phe Leu Lys His Tyr Gly Leu Glu Glu His 
          945                 950                 955                 960 
          Ala Glu Gly Leu Glu Asn Lys Lys Ile Lys Phe Tyr Asp Phe Arg Lys 
                          965                 970                 975     
          Ile Leu Glu Asp Lys Asn Leu Thr Ser Val Ile Ile Pro Lys Arg Gly 
                      980                 985                 990         
          Gly Arg Ile Tyr Met Ala Thr Asn  Pro Val Thr Ser Asp  Ser Thr Pro 
                  995                 1000                 1005             
          Ile Thr  Tyr Ala Gly Lys Thr  Tyr Asn Arg Cys Asn  Ala Asp Glu 
              1010                 1015                 1020             
          Val Ala  Ala Ala Asn Ile Val  Ile Ser Val Leu Ala  Pro Arg Ser 
              1025                 1030                 1035             
          Lys Lys  Asn Arg Glu Gln Asp  Asp Ile Pro Leu Ile  Thr Lys Lys 
              1040                 1045                 1050             
          Ala Glu  Ser Lys Ser Pro Pro  Lys Asp Arg Lys Arg  Ser Lys Thr 
              1055                 1060                 1065             
          Ser Gln  Leu Pro Gln Lys 
              1070                 
          <![CDATA[<210>  255]]>
          <![CDATA[<211>  1074]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  255]]>
          Met Ala Ser Ile Ser Arg Pro Tyr Gly Thr Lys Leu Arg Pro Asp Ala 
          1               5                   10                  15      
          Arg Lys Lys Glu Met Leu Asp Lys Phe Phe Asn Thr Leu Thr Lys Gly 
                      20                  25                  30          
          Gln Arg Val Phe Ala Asp Leu Ala Leu Cys Ile Tyr Gly Ser Leu Thr 
                  35                  40                  45              
          Leu Glu Met Ala Lys Ser Leu Glu Pro Glu Ser Asp Ser Glu Leu Val 
              50                  55                  60                  
          Cys Ala Ile Gly Trp Phe Arg Leu Val Asp Lys Thr Ile Trp Ser Lys 
          65                  70                  75                  80  
          Asp Gly Ile Lys Gln Glu Asn Leu Val Lys Gln Tyr Glu Ala Tyr Ser 
                          85                  90                  95      
          Gly Lys Glu Ala Ser Glu Val Val Lys Thr Tyr Leu Asn Ser Pro Ser 
                      100                 105                 110         
          Ser Asp Lys Tyr Val Trp Ile Asp Cys Arg Gln Lys Phe Leu Arg Phe 
                  115                 120                 125             
          Gln Arg Glu Leu Gly Thr Arg Asn Leu Ser Glu Asp Phe Glu Cys Met 
              130                 135                 140                 
          Leu Phe Glu Gln Tyr Ile Arg Leu Thr Lys Gly Glu Ile Glu Gly Tyr 
          145                 150                 155                 160 
          Ala Ala Ile Ser Asn Met Phe Gly Asn Gly Glu Lys Glu Asp Arg Ser 
                          165                 170                 175     
          Lys Lys Arg Met Tyr Ala Thr Arg Met Lys Asp Trp Leu Glu Ala Asn 
                      180                 185                 190         
          Glu Asn Ile Thr Trp Glu Gln Tyr Arg Glu Ala Leu Lys Asn Gln Leu 
                  195                 200                 205             
          Asn Ala Lys Asn Leu Glu Gln Val Val Ala Asn Tyr Lys Gly Asn Ala 
              210                 215                 220                 
          Gly Gly Ala Asp Pro Phe Phe Lys Tyr Ser Phe Ser Lys Glu Gly Met 
          225                 230                 235                 240 
          Val Ser Lys Lys Glu His Ala Gln Gln Leu Asp Lys Phe Lys Thr Val 
                          245                 250                 255     
          Leu Lys Asn Lys Ala Arg Asp Leu Asn Phe Pro Asn Lys Glu Lys Leu 
                      260                 265                 270         
          Lys Gln Tyr Leu Glu Ala Glu Ile Gly Ile Pro Val Asp Ala Asn Val 
                  275                 280                 285             
          Tyr Ser Gln Met Phe Ser Asn Gly Val Ser Glu Val Gln Pro Lys Thr 
              290                 295                 300                 
          Thr Arg Asn Met Ser Phe Ser Asn Glu Lys Leu Asp Leu Leu Thr Glu 
          305                 310                 315                 320 
          Leu Lys Asp Leu Asn Lys Gly Asp Gly Phe Glu Tyr Ala Arg Glu Val 
                          325                 330                 335     
          Leu Asn Gly Phe Phe Asp Ser Glu Leu His Thr Thr Glu Asp Lys Phe 
                      340                 345                 350         
          Asn Ile Thr Ser Arg Tyr Leu Gly Gly Asp Lys Ser Asn Arg Leu Ser 
                  355                 360                 365             
          Lys Leu Tyr Lys Ile Trp Lys Lys Glu Gly Val Asp Cys Glu Glu Gly 
              370                 375                 380                 
          Ile Gln Gln Phe Cys Glu Ala Val Lys Asp Lys Met Gly Gln Ile Pro 
          385                 390                 395                 400 
          Ile Arg Asn Val Leu Lys Tyr Leu Trp Gln Phe Arg Glu Thr Val Ser 
                          405                 410                 415     
          Ala Glu Asp Phe Glu Ala Ala Ala Lys Ala Asn His Leu Glu Glu Lys 
                      420                 425                 430         
          Ile Ser Arg Val Lys Ala His Pro Ile Val Ile Ser Asn Arg Tyr Trp 
                  435                 440                 445             
          Ala Phe Gly Thr Ser Ala Leu Val Gly Asn Ile Met Pro Ala Asp Lys 
              450                 455                 460                 
          Arg His Gln Gly Glu Tyr Ala Gly Gln Asn Phe Lys Met Trp Leu Arg 
          465                 470                 475                 480 
          Ala Glu Leu His Tyr Asp Gly Lys Lys Ala Lys His His Leu Pro Phe 
                          485                 490                 495     
          Tyr Asn Ala Arg Phe Phe Glu Glu Val Tyr Cys Tyr His Pro Ser Val 
                      500                 505                 510         
          Ala Glu Ile Thr Pro Phe Lys Thr Lys Gln Phe Gly Cys Glu Ile Gly 
                  515                 520                 525             
          Lys Asp Ile Pro Asp Tyr Val Ser Val Ala Leu Lys Asp Asn Pro Tyr 
              530                 535                 540                 
          Lys Lys Ala Thr Lys Arg Ile Leu Arg Ala Ile Tyr Asn Pro Val Ala 
          545                 550                 555                 560 
          Asn Thr Thr Arg Val Asp Lys Thr Thr Asn Cys Ser Phe Met Ile Lys 
                          565                 570                 575     
          Arg Glu Asn Asp Glu Tyr Lys Leu Val Ile Asn Arg Lys Ile Ser Arg 
                      580                 585                 590         
          Asp Arg Pro Lys Arg Ile Glu Val Gly Arg Thr Ile Met Gly Tyr Asp 
                  595                 600                 605             
          Arg Asn Gln Thr Ala Ser Asp Thr Tyr Trp Ile Gly Arg Leu Val Pro 
              610                 615                 620                 
          Pro Gly Thr Arg Gly Ala Tyr Arg Ile Gly Glu Trp Ser Val Gln Tyr 
          625                 630                 635                 640 
          Ile Lys Ser Gly Pro Val Leu Ser Ser Thr Gln Gly Val Asn Asn Ser 
                          645                 650                 655     
          Thr Thr Asp Gln Leu Val Tyr Asn Gly Met Pro Ser Ser Ser Glu Arg 
                      660                 665                 670         
          Phe Lys Ala Trp Lys Lys Ala Arg Met Ala Phe Ile Arg Lys Leu Ile 
                  675                 680                 685             
          Arg Gln Leu Asn Asp Glu Gly Leu Glu Ser Lys Gly Gln Asp Tyr Ile 
              690                 695                 700                 
          Pro Glu Asn Pro Ser Ser Phe Asp Val Arg Gly Glu Thr Leu Tyr Val 
          705                 710                 715                 720 
          Phe Asn Ser Asn Tyr Leu Lys Ala Leu Val Ser Lys His Arg Lys Ala 
                          725                 730                 735     
          Lys Lys Pro Val Glu Gly Ile Leu Asp Glu Ile Glu Ala Trp Thr Ser 
                      740                 745                 750         
          Lys Asp Lys Asp Ser Cys Ser Leu Met Arg Leu Ser Ser Leu Ser Asp 
                  755                 760                 765             
          Ala Ser Met Gln Gly Ile Ala Ser Leu Lys Ser Leu Ile Asn Ser Tyr 
              770                 775                 780                 
          Phe Asn Lys Asn Gly Cys Lys Thr Ile Glu Asp Lys Glu Lys Phe Asn 
          785                 790                 795                 800 
          Pro Val Leu Tyr Ala Lys Leu Val Glu Val Glu Gln Arg Arg Thr Asn 
                          805                 810                 815     
          Lys Arg Ser Glu Lys Val Gly Arg Ile Ala Gly Ser Leu Glu Gln Leu 
                      820                 825                 830         
          Ala Leu Leu Asn Gly Val Glu Val Val Ile Gly Glu Ala Asp Leu Gly 
                  835                 840                 845             
          Glu Val Glu Lys Gly Lys Ser Lys Lys Gln Asn Ser Arg Asn Met Asp 
              850                 855                 860                 
          Trp Cys Ala Lys Gln Val Ala Gln Arg Leu Glu Tyr Lys Leu Ala Phe 
          865                 870                 875                 880 
          His Gly Ile Gly Tyr Phe Gly Val Asn Pro Met Tyr Thr Ser His Gln 
                          885                 890                 895     
          Asp Pro Phe Glu His Arg Arg Val Ala Asp His Ile Val Met Arg Ala 
                      900                 905                 910         
          Arg Phe Glu Glu Val Asn Val Glu Asn Ile Ala Glu Trp His Val Arg 
                  915                 920                 925             
          Asn Phe Ser Asn Tyr Leu Arg Ala Asp Ser Gly Thr Gly Leu Tyr Tyr 
              930                 935                 940                 
          Lys Gln Ala Thr Met Asp Phe Leu Lys His Tyr Gly Leu Glu Glu His 
          945                 950                 955                 960 
          Ala Glu Gly Leu Glu Asn Lys Lys Ile Lys Phe Tyr Asp Phe Arg Lys 
                          965                 970                 975     
          Ile Leu Glu Asp Lys Asn Leu Thr Ser Val Ile Ile Pro Lys Arg Gly 
                      980                 985                 990         
          Gly Arg Ile Tyr Met Ala Thr Asn  Pro Val Thr Ser Asp  Ser Thr Pro 
                  995                 1000                 1005             
          Ile Thr  Tyr Ala Gly Lys Thr  Tyr Asn Arg Cys Asn  Ala Asp Glu 
              1010                 1015                 1020             
          Val Ala  Ala Ala Asn Ile Val  Ile Ser Val Leu Ala  Pro Arg Ser 
              1025                 1030                 1035             
          Lys Lys  Asn Arg Glu Gln Asp  Asp Ile Pro Leu Ile  Thr Lys Lys 
              1040                 1045                 1050             
          Ala Glu  Ser Lys Ser Pro Pro  Lys Asp Arg Lys Arg  Ser Lys Thr 
              1055                 1060                 1065             
          Ser Gln  Leu Pro Gln Lys 
              1070                 
          <![CDATA[<210>  256]]>
          <![CDATA[<211>  147]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  256]]>
          Met Ala Ser His Arg Leu Leu Leu Leu Cys Leu Ala Gly Leu Val Phe 
          1               5                   10                  15      
          Val Ser Glu Ala Gly Pro Thr Gly Thr Gly Glu Ser Lys Cys Pro Leu 
                      20                  25                  30          
          Met Val Lys Val Leu Asp Ala Val Arg Gly Ser Pro Ala Ile Asn Val 
                  35                  40                  45              
          Ala Val His Val Phe Arg Lys Ala Ala Asp Asp Thr Trp Glu Pro Phe 
              50                  55                  60                  
          Ala Ser Gly Lys Thr Ser Glu Ser Gly Glu Leu His Gly Leu Thr Thr 
          65                  70                  75                  80  
          Glu Glu Glu Phe Val Glu Gly Ile Tyr Lys Val Glu Ile Asp Thr Lys 
                          85                  90                  95      
          Ser Tyr Trp Lys Ala Leu Gly Ile Ser Pro Phe His Glu His Ala Glu 
                      100                 105                 110         
          Val Val Phe Thr Ala Asn Asp Ser Gly Pro Arg Arg Tyr Thr Ile Ala 
                  115                 120                 125             
          Ala Leu Leu Ser Pro Tyr Ser Tyr Ser Thr Thr Ala Val Val Thr Asn 
              130                 135                 140                 
          Pro Lys Glu 
          145         
          <![CDATA[<210>  257]]>
          <![CDATA[<211>  127]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  257]]>
          Gly Pro Thr Gly Thr Gly Glu Ser Lys Cys Pro Leu Met Val Lys Val 
          1               5                   10                  15      
          Leu Asp Ala Val Arg Gly Ser Pro Ala Ile Asn Val Ala Val His Val 
                      20                  25                  30          
          Phe Arg Lys Ala Ala Asp Asp Thr Trp Glu Pro Phe Ala Ser Gly Lys 
                  35                  40                  45              
          Thr Ser Glu Ser Gly Glu Leu His Gly Leu Thr Thr Glu Glu Glu Phe 
              50                  55                  60                  
          Val Glu Gly Ile Tyr Lys Val Glu Ile Asp Thr Lys Ser Tyr Trp Lys 
          65                  70                  75                  80  
          Ala Leu Gly Ile Ser Pro Phe His Glu His Ala Glu Val Val Phe Thr 
                          85                  90                  95      
          Ala Asn Asp Ser Gly Pro Arg Arg Tyr Thr Ile Ala Ala Leu Leu Ser 
                      100                 105                 110         
          Pro Tyr Ser Tyr Ser Thr Thr Ala Val Val Thr Asn Pro Lys Glu 
                  115                 120                 125         
          <![CDATA[<210>  258]]>
          <![CDATA[<211>  444]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400> ]]> 258
          atggcttctc atcgtctgct cctcctctgc cttgctggac tggtatttgt gtctgaggct       60
          ggccctacgg gcaccggtga atccaagtgt cctctgatgg tcaaagttct agatgctgtc      120
          cgaggcagtc ctgccatcaa tgtggccgtg catgtgttca gaaaggctgc tgatgacacc      180
          tgggagccat ttgcctctgg gaaaaccagt gagtctggag agctgcatgg gctcacaact      240
          gaggaggaat ttgtagaagg gatatacaaa gtggaaatag acaccaaatc ttactggaag      300
          gcacttggca tctccccatt ccatgagcat gcagaggtgg tattcacagc caacgactcc      360
          ggcccccgcc gctacaccat tgccgccctg ctgagcccct actcctattc caccacggct      420
          gtcgtcacca atcccaagga atga                                             444
          <![CDATA[<210>  259]]>
          <![CDATA[<211>  36]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  259]]>
          guuggaauga cuaauuuuug ugcccaccgu uggcac                                 36
          <![CDATA[<210>  260]]>
          <![CDATA[<211>  24]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  260]]>
          aauuuuugug cccaucguug gcac                                              24
          <![CDATA[<210>  261]]>
          <![CDATA[<211>  23]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>]]>  合成的
          <![CDATA[<400>  261]]>
          auuuuugugc ccaucguugg cac                                               23
          <![CDATA[<210>  262]]>
          <![CDATA[<211>  36]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  262]]>
          cuagcaauga ccuaauagug uguccuuagu ugacau                                 36
          <![CDATA[<210>  263]]>
          <![CDATA[<211>  36]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  263]]>
          ccuacaauac cuaagaaauc cguccuaagu ugacgg                                 36
          <![CDATA[<210>  264]]>
          <![CDATA[<211>  22]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  264]]>
          auaguguguc cuuaguugac au                                                22
          <![CDATA[<210>  265]]>
          <![CDATA[<211>  1093]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  265]]>
          Met Ser Asn Lys Glu Lys Asn Ala Ser Glu Thr Arg Lys Ala Tyr Thr 
          1               5                   10                  15      
          Thr Lys Met Ile Pro Arg Ser His Asp Arg Met Lys Leu Leu Gly Asn 
                      20                  25                  30          
          Phe Met Asp Tyr Leu Met Asp Gly Thr Pro Ile Phe Phe Glu Leu Trp 
                  35                  40                  45              
          Asn Gln Phe Gly Gly Gly Ile Asp Arg Asp Ile Ile Ser Gly Thr Ala 
              50                  55                  60                  
          Asn Lys Asp Lys Ile Ser Asp Asp Leu Leu Leu Ala Val Asn Trp Phe 
          65                  70                  75                  80  
          Lys Val Met Pro Ile Asn Ser Lys Pro Gln Gly Val Ser Pro Ser Asn 
                          85                  90                  95      
          Leu Ala Asn Leu Phe Gln Gln Tyr Ser Gly Ser Glu Pro Asp Ile Gln 
                      100                 105                 110         
          Ala Gln Glu Tyr Phe Ala Ser Asn Phe Asp Thr Glu Lys His Gln Trp 
                  115                 120                 125             
          Lys Asp Met Arg Val Glu Tyr Glu Arg Leu Leu Ala Glu Leu Gln Leu 
              130                 135                 140                 
          Ser Arg Ser Asp Met His His Asp Leu Lys Leu Met Tyr Lys Glu Lys 
          145                 150                 155                 160 
          Cys Ile Gly Leu Ser Leu Ser Thr Ala His Tyr Ile Thr Ser Val Met 
                          165                 170                 175     
          Phe Gly Thr Gly Ala Lys Asn Asn Arg Gln Thr Lys His Gln Phe Tyr 
                      180                 185                 190         
          Ser Lys Val Ile Gln Leu Leu Glu Glu Ser Thr Gln Ile Asn Ser Val 
                  195                 200                 205             
          Glu Gln Leu Ala Ser Ile Ile Leu Lys Ala Gly Asp Cys Asp Ser Tyr 
              210                 215                 220                 
          Arg Lys Leu Arg Ile Arg Cys Ser Arg Lys Gly Ala Thr Pro Ser Ile 
          225                 230                 235                 240 
          Leu Lys Ile Val Gln Asp Tyr Glu Leu Gly Thr Asn His Asp Asp Glu 
                          245                 250                 255     
          Val Asn Val Pro Ser Leu Ile Ala Asn Leu Lys Glu Lys Leu Gly Arg 
                      260                 265                 270         
          Phe Glu Tyr Glu Cys Glu Trp Lys Cys Met Glu Lys Ile Lys Ala Phe 
                  275                 280                 285             
          Leu Ala Ser Lys Val Gly Pro Tyr Tyr Leu Gly Ser Tyr Ser Ala Met 
              290                 295                 300                 
          Leu Glu Asn Ala Leu Ser Pro Ile Lys Gly Met Thr Thr Lys Asn Cys 
          305                 310                 315                 320 
          Lys Phe Val Leu Lys Gln Ile Asp Ala Lys Asn Asp Ile Lys Tyr Glu 
                          325                 330                 335     
          Asn Glu Pro Phe Gly Lys Ile Val Glu Gly Phe Phe Asp Ser Pro Tyr 
                      340                 345                 350         
          Phe Glu Ser Asp Thr Asn Val Lys Trp Val Leu His Pro His His Ile 
                  355                 360                 365             
          Gly Glu Ser Asn Ile Lys Thr Leu Trp Glu Asp Leu Asn Ala Ile His 
              370                 375                 380                 
          Ser Lys Tyr Glu Glu Asp Ile Ala Ser Leu Ser Glu Asp Lys Lys Glu 
          385                 390                 395                 400 
          Lys Arg Ile Lys Val Tyr Gln Gly Asp Val Cys Gln Thr Ile Asn Thr 
                          405                 410                 415     
          Tyr Cys Glu Glu Val Gly Lys Glu Ala Lys Thr Pro Leu Val Gln Leu 
                      420                 425                 430         
          Leu Arg Tyr Leu Tyr Ser Arg Lys Asp Asp Ile Ala Val Asp Lys Ile 
                  435                 440                 445             
          Ile Asp Gly Ile Thr Phe Leu Ser Lys Lys His Lys Val Glu Lys Gln 
              450                 455                 460                 
          Lys Ile Asn Pro Val Ile Gln Lys Tyr Pro Ser Phe Asn Phe Gly Asn 
          465                 470                 475                 480 
          Asn Ser Lys Leu Leu Gly Lys Ile Ile Ser Pro Lys Asp Lys Leu Lys 
                          485                 490                 495     
          His Asn Leu Lys Cys Asn Arg Asn Gln Val Asp Asn Tyr Ile Trp Ile 
                      500                 505                 510         
          Glu Ile Lys Val Leu Asn Thr Lys Thr Met Arg Trp Glu Lys His His 
                  515                 520                 525             
          Tyr Ala Leu Ser Ser Thr Arg Phe Leu Glu Glu Val Tyr Tyr Pro Ala 
              530                 535                 540                 
          Thr Ser Glu Asn Pro Pro Asp Ala Leu Ala Ala Arg Phe Arg Thr Lys 
          545                 550                 555                 560 
          Thr Asn Gly Tyr Glu Gly Lys Pro Ala Leu Ser Ala Glu Gln Ile Glu 
                          565                 570                 575     
          Gln Ile Arg Ser Ala Pro Val Gly Leu Arg Lys Val Lys Lys Arg Gln 
                      580                 585                 590         
          Met Arg Leu Glu Ala Ala Arg Gln Gln Asn Leu Leu Pro Arg Tyr Thr 
                  595                 600                 605             
          Trp Gly Lys Asp Phe Asn Ile Asn Ile Cys Lys Arg Gly Asn Asn Phe 
              610                 615                 620                 
          Glu Val Thr Leu Ala Thr Lys Val Lys Lys Lys Lys Glu Lys Asn Tyr 
          625                 630                 635                 640 
          Lys Val Val Leu Gly Tyr Asp Ala Asn Ile Val Arg Lys Asn Thr Tyr 
                          645                 650                 655     
          Ala Ala Ile Glu Ala His Ala Asn Gly Asp Gly Val Ile Asp Tyr Asn 
                      660                 665                 670         
          Asp Leu Pro Val Lys Pro Ile Glu Ser Gly Phe Val Thr Val Glu Ser 
                  675                 680                 685             
          Gln Val Arg Asp Lys Ser Tyr Asp Gln Leu Ser Tyr Asn Gly Val Lys 
              690                 695                 700                 
          Leu Leu Tyr Cys Lys Pro His Val Glu Ser Arg Arg Ser Phe Leu Glu 
          705                 710                 715                 720 
          Lys Tyr Arg Asn Gly Thr Met Lys Asp Asn Arg Gly Asn Asn Ile Gln 
                          725                 730                 735     
          Ile Asp Phe Met Lys Asp Phe Glu Ala Ile Ala Asp Asp Glu Thr Ser 
                      740                 745                 750         
          Leu Tyr Tyr Phe Asn Met Lys Tyr Cys Lys Leu Leu Gln Ser Ser Ile 
                  755                 760                 765             
          Arg Asn His Ser Ser Gln Ala Lys Glu Tyr Arg Glu Glu Ile Phe Glu 
              770                 775                 780                 
          Leu Leu Arg Asp Gly Lys Leu Ser Val Leu Lys Leu Ser Ser Leu Ser 
          785                 790                 795                 800 
          Asn Leu Ser Phe Val Met Phe Lys Val Ala Lys Ser Leu Ile Gly Thr 
                          805                 810                 815     
          Tyr Phe Gly His Leu Leu Lys Lys Pro Lys Asn Ser Lys Ser Asp Val 
                      820                 825                 830         
          Lys Ala Pro Pro Ile Thr Asp Glu Asp Lys Gln Lys Ala Asp Pro Glu 
                  835                 840                 845             
          Met Phe Ala Leu Arg Leu Ala Leu Glu Glu Lys Arg Leu Asn Lys Val 
              850                 855                 860                 
          Lys Ser Lys Lys Glu Val Ile Ala Asn Lys Ile Val Ala Lys Ala Leu 
          865                 870                 875                 880 
          Glu Leu Arg Asp Lys Tyr Gly Pro Val Leu Ile Lys Gly Glu Asn Ile 
                          885                 890                 895     
          Ser Asp Thr Thr Lys Lys Gly Lys Lys Ser Ser Thr Asn Ser Phe Leu 
                      900                 905                 910         
          Met Asp Trp Leu Ala Arg Gly Val Ala Asn Lys Val Lys Glu Met Val 
                  915                 920                 925             
          Met Met His Gln Gly Leu Glu Phe Val Glu Val Asn Pro Asn Phe Thr 
              930                 935                 940                 
          Ser His Gln Asp Pro Phe Val His Lys Asn Pro Glu Asn Thr Phe Arg 
          945                 950                 955                 960 
          Ala Arg Tyr Ser Arg Cys Thr Pro Ser Glu Leu Thr Glu Lys Asn Arg 
                          965                 970                 975     
          Lys Glu Ile Leu Ser Phe Leu Ser Asp Lys Pro Ser Lys Arg Pro Thr 
                      980                 985                 990         
          Asn Ala Tyr Tyr Asn Glu Gly Ala  Met Ala Phe Leu Ala  Thr Tyr Gly 
                  995                 1000                 1005             
          Leu Lys  Lys Asn Asp Val Leu  Gly Val Ser Leu Glu  Lys Phe Lys 
              1010                 1015                 1020             
          Gln Ile  Met Ala Asn Ile Leu  His Gln Arg Ser Glu  Asp Gln Leu 
              1025                 1030                 1035             
          Leu Phe  Pro Ser Arg Gly Gly  Met Phe Tyr Leu Ala  Thr Tyr Lys 
              1040                 1045                 1050             
          Leu Asp  Ala Asp Ala Thr Ser  Val Asn Trp Asn Gly  Lys Gln Phe 
              1055                 1060                 1065             
          Trp Val  Cys Asn Ala Asp Leu  Val Ala Ala Tyr Asn  Val Gly Leu 
              1070                 1075                 1080             
          Val Asp  Ile Gln Lys Asp Phe  Lys Lys Lys 
              1085                 1090             
          <![CDATA[<210>  266]]>
          <![CDATA[<211>  1098]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  266]]>
          Met Ser Ile Ser Asn Asn Asn Ile Leu Pro Tyr Asn Pro Lys Leu Leu 
          1               5                   10                  15      
          Pro Asp Asp Arg Lys His Lys Met Leu Val Asp Thr Phe Asn Gln Leu 
                      20                  25                  30          
          Asp Leu Ile Arg Asn Asn Leu His Asp Met Ile Ile Ala Leu Tyr Gly 
                  35                  40                  45              
          Ala Leu Lys Tyr Asp Asn Ile Lys Gln Phe Ala Ser Lys Glu Lys Pro 
              50                  55                  60                  
          His Ile Ser Ala Asp Ala Leu Cys Ser Ile Asn Trp Phe Arg Leu Val 
          65                  70                  75                  80  
          Lys Thr Asn Glu Arg Lys Pro Ala Ile Glu Ser Asn Gln Ile Ile Ser 
                          85                  90                  95      
          Lys Phe Ile Gln Tyr Ser Gly His Thr Pro Asp Lys Tyr Ala Leu Ser 
                      100                 105                 110         
          His Ile Thr Gly Asn His Glu Pro Ser His Lys Trp Ile Asp Cys Arg 
                  115                 120                 125             
          Glu Tyr Ala Ile Asn Tyr Ala Arg Ile Met His Leu Ser Phe Ser Gln 
              130                 135                 140                 
          Phe Gln Asp Leu Ala Thr Ala Cys Leu Asn Cys Lys Ile Leu Ile Leu 
          145                 150                 155                 160 
          Asn Gly Thr Leu Thr Ser Ser Trp Ala Trp Gly Ala Asn Ser Ala Leu 
                          165                 170                 175     
          Phe Gly Gly Ser Asp Lys Glu Asn Phe Ser Val Lys Ala Lys Ile Leu 
                      180                 185                 190         
          Asn Ser Phe Ile Glu Asn Leu Lys Asp Glu Met Asn Thr Thr Lys Phe 
                  195                 200                 205             
          Gln Val Val Glu Lys Val Cys Gln Gln Ile Gly Ser Ser Asp Ala Ala 
              210                 215                 220                 
          Asp Leu Phe Asp Leu Tyr Arg Ser Thr Val Lys Asp Gly Asn Arg Gly 
          225                 230                 235                 240 
          Pro Ala Thr Gly Arg Asn Pro Lys Val Met Asn Leu Phe Ser Gln Asp 
                          245                 250                 255     
          Gly Glu Ile Ser Ser Glu Gln Arg Glu Asp Phe Ile Glu Ser Phe Gln 
                      260                 265                 270         
          Lys Val Met Gln Glu Lys Asn Ser Lys Gln Ile Ile Pro His Leu Asp 
                  275                 280                 285             
          Lys Leu Lys Tyr His Leu Val Lys Gln Ser Gly Leu Tyr Asp Ile Tyr 
              290                 295                 300                 
          Ser Trp Ala Ala Ala Ile Lys Asn Ala Asn Ser Thr Ile Val Ala Ser 
          305                 310                 315                 320 
          Asn Ser Ser Asn Leu Asn Thr Ile Leu Asn Lys Thr Glu Lys Gln Gln 
                          325                 330                 335     
          Thr Phe Glu Glu Leu Arg Lys Asp Glu Lys Ile Val Ala Cys Ser Lys 
                      340                 345                 350         
          Ile Leu Leu Ser Val Asn Asp Thr Leu Pro Glu Asp Leu His Tyr Asn 
                  355                 360                 365             
          Pro Ser Thr Ser Asn Leu Gly Lys Asn Leu Asp Val Phe Phe Asp Leu 
              370                 375                 380                 
          Leu Asn Glu Asn Ser Val His Thr Ile Glu Asn Lys Glu Glu Lys Asn 
          385                 390                 395                 400 
          Lys Ile Val Lys Glu Cys Val Asn Gln Tyr Met Glu Glu Cys Lys Gly 
                          405                 410                 415     
          Leu Asn Lys Pro Pro Met Pro Val Leu Leu Thr Phe Ile Ser Asp Tyr 
                      420                 425                 430         
          Ala His Lys His Gln Ala Gln Asp Phe Leu Ser Ala Ala Lys Met Asn 
                  435                 440                 445             
          Phe Ile Asp Leu Lys Ile Lys Ser Ile Lys Val Val Pro Thr Val His 
              450                 455                 460                 
          Gly Ser Ser Pro Tyr Thr Trp Ile Ser Asn Leu Ser Lys Lys Asn Lys 
          465                 470                 475                 480 
          Asp Gly Lys Met Ile Arg Thr Pro Asn Ser Ser Leu Ile Gly Trp Ile 
                          485                 490                 495     
          Ile Pro Pro Glu Glu Ile His Asp Gln Lys Phe Ala Gly Gln Asn Pro 
                      500                 505                 510         
          Ile Ile Trp Ala Val Leu Arg Val Tyr Cys Asn Asn Lys Trp Glu Met 
                  515                 520                 525             
          His His Phe Pro Phe Ser Asp Ser Arg Phe Phe Thr Glu Val Tyr Ala 
              530                 535                 540                 
          Tyr Lys Pro Asn Leu Pro Tyr Leu Pro Gly Gly Glu Asn Arg Ser Lys 
          545                 550                 555                 560 
          Arg Phe Gly Tyr Arg His Ser Thr Asn Leu Ser Asn Glu Ser Arg Gln 
                          565                 570                 575     
          Ile Leu Leu Asp Lys Ser Lys Tyr Ala Lys Ala Asn Lys Ser Val Leu 
                      580                 585                 590         
          Arg Cys Met Glu Asn Met Thr His Asn Val Val Phe Asp Pro Lys Thr 
                  595                 600                 605             
          Ser Leu Asn Ile Arg Ile Lys Thr Asp Lys Asn Asn Ser Pro Val Leu 
              610                 615                 620                 
          Asp Asp Lys Gly Arg Ile Thr Phe Val Met Gln Ile Asn His Arg Ile 
          625                 630                 635                 640 
          Leu Glu Lys Tyr Asn Asn Thr Lys Ile Glu Ile Gly Asp Arg Ile Leu 
                          645                 650                 655     
          Ala Tyr Asp Gln Asn Gln Ser Glu Asn His Thr Tyr Ala Ile Leu Gln 
                      660                 665                 670         
          Arg Thr Glu Glu Gly Ser His Ala His Gln Phe Asn Gly Trp Tyr Val 
                  675                 680                 685             
          Arg Val Leu Glu Thr Gly Lys Val Thr Ser Ile Val Gln Gly Leu Ser 
              690                 695                 700                 
          Gly Pro Ile Asp Gln Leu Asn Tyr Asp Gly Met Pro Val Thr Ser His 
          705                 710                 715                 720 
          Lys Phe Asn Cys Trp Gln Ala Asp Arg Ser Ala Phe Val Ser Gln Phe 
                          725                 730                 735     
          Ala Ser Leu Lys Ile Ser Glu Thr Glu Thr Phe Asp Glu Ala Tyr Gln 
                      740                 745                 750         
          Ala Ile Asn Ala Gln Gly Ala Tyr Thr Trp Asn Leu Phe Tyr Leu Arg 
                  755                 760                 765             
          Ile Leu Arg Lys Ala Leu Arg Val Cys His Met Glu Asn Ile Asn Gln 
              770                 775                 780                 
          Phe Arg Glu Glu Ile Leu Ala Ile Ser Lys Asn Arg Leu Ser Pro Met 
          785                 790                 795                 800 
          Ser Leu Gly Ser Leu Ser Gln Asn Ser Leu Lys Met Ile Arg Ala Phe 
                          805                 810                 815     
          Lys Ser Ile Ile Asn Cys Tyr Met Ser Arg Met Ser Phe Val Asp Glu 
                      820                 825                 830         
          Leu Gln Lys Lys Glu Gly Asp Leu Glu Leu His Thr Ile Met Arg Leu 
                  835                 840                 845             
          Thr Asp Asn Lys Leu Asn Asp Lys Arg Val Glu Lys Ile Asn Arg Ala 
              850                 855                 860                 
          Ser Ser Phe Leu Thr Asn Lys Ala His Ser Met Gly Cys Lys Met Ile 
          865                 870                 875                 880 
          Val Gly Glu Ser Asp Leu Pro Val Ala Asp Ser Lys Thr Ser Lys Lys 
                          885                 890                 895     
          Gln Asn Val Asp Arg Met Asp Trp Cys Ala Arg Ala Leu Ser His Lys 
                      900                 905                 910         
          Val Glu Tyr Ala Cys Lys Leu Met Gly Leu Ala Tyr Arg Gly Ile Pro 
                  915                 920                 925             
          Ala Tyr Met Ser Ser His Gln Asp Pro Leu Val His Leu Val Glu Ser 
              930                 935                 940                 
          Lys Arg Ser Val Leu Arg Pro Arg Phe Val Val Ala Asp Lys Ser Asp 
          945                 950                 955                 960 
          Val Lys Gln His His Leu Asp Asn Leu Arg Arg Met Leu Asn Ser Lys 
                          965                 970                 975     
          Thr Lys Val Gly Thr Ala Val Tyr Tyr Arg Glu Ala Val Glu Leu Met 
                      980                 985                 990         
          Cys Glu Glu Leu Gly Ile His Lys  Thr Asp Met Ala Lys  Gly Lys Val 
                  995                 1000                 1005             
          Ser Leu  Ser Asp Phe Val Asp  Lys Phe Ile Gly Glu  Lys Ala Ile 
              1010                 1015                 1020             
          Phe Pro  Gln Arg Gly Gly Arg  Phe Tyr Met Ser Thr  Lys Arg Leu 
              1025                 1030                 1035             
          Thr Thr  Gly Ala Lys Leu Ile  Cys Tyr Ser Gly Ser  Asp Val Trp 
              1040                 1045                 1050             
          Leu Ser  Asp Ala Asp Glu Ile  Ala Ala Ile Asn Ile  Gly Met Phe 
              1055                 1060                 1065             
          Val Val  Cys Asp Gln Thr Gly  Ala Phe Lys Lys Lys  Lys Lys Glu 
              1070                 1075                 1080             
          Lys Leu  Asp Asp Glu Glu Cys  Asp Ile Leu Pro Phe  Arg Pro Met 
              1085                 1090                 1095             
          <![CDATA[<210>  267]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  267]]>
          tgaacacatg cacggccaca                                                   20
          <![CDATA[<210>  268]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  268]]>
          ctgaacacat gcacggccac                                                   20
          <![CDATA[<210>  269]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  269]]>
          caccacggct gtcgtcacca                                                   20
          <![CDATA[<210>  270]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  270]]>
          ggattggtga cgacagccgt                                                   20
          <![CDATA[<210>  271]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  271]]>
          caccacggct gtcgtcacca                                                   20
          <![CDATA[<210>  272]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  272]]>
          ggattggtga cgacagccgt                                                   20
          <![CDATA[<210>  273]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  273]]>
          agaaauccgu cuuucauuga cggugaacac augcacggcc aca                         43
          <![CDATA[<210>  274]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  274]]>
          agaaauccgu cuuucauuga cggcugaaca caugcacggc cac                         43
          <![CDATA[<210>  275]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  275]]>
          agaaauccgu cuuucauuga cggcaccacg gcugucguca cca                         43
          <![CDATA[<210>  276]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  276]]>
          agaaauccgu cuuucauuga cggggauugg ugacgacagc cgu                         43
          <![CDATA[<210>  277]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  277]]>
          agaaauccgu cuuucauuga cggcaccacg gcugucguca cca                         43
          <![CDATA[<210>  278]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  278]]>
          agaaauccgu cuuucauuga cggggauugg ugacgacagc cgu                         43
          <![CDATA[<210>  279]]>
          <![CDATA[<211>  100]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  279]]>
          ccagaggcaa atggctccca ggtgtcatca gcagcctttc tgaacacatg catagctaca       60
          ttgatggcag gactgcctcg gacagcatct agaactttga                            100
          <![CDATA[<210>  280]]>
          <![CDATA[<211>  100]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  280]]>
          ccagaggcaa atggctccca ggtgtcatca gcagcctttc tgaacacatg catagctacg       60
          ttgatggcag gactgcctcg gacagcatct agaactttga                            100
          <![CDATA[<210>  281]]>
          <![CDATA[<211>  100]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  281]]>
          ccagaggcaa atggctccca ggtgtcatca gcagcctttc tgaacacatg catggccaca       60
          ttgatggcag gactgcctcg gacagcatct agaactttga                            100
          <![CDATA[<210>  282]]>
          <![CDATA[<211>  100]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人]]>工序列
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  282]]>
          ccagaggcaa atggctccca ggtgtcatca gcagcctttc gaaatacgtg catagctacg       60
          ttgatggcag gactgcctcg gacagcatct agaactttga                            100
          <![CDATA[<210>  283]]>
          <![CDATA[<211>  100]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  283]]>
          cccagaggca aatggctccc aggtgtcatc agcagccttt cgaaatacgt gcatagctac       60
          attgatggca ggactgcctc ggacagcatc tagaactttg                            100
          <![CDATA[<210>  284]]>
          <![CDATA[<211>  100]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  284]]>
          cccagaggca aatggctccc aggtgtcatc agcagccttt ctgaacacat gcatagctac       60
          attgatggca ggactgcctc ggacagcatc tagaactttg                            100
          <![CDATA[<210>  285]]>
          <![CDATA[<211>  100]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  285]]>
          cccagaggca aatggctccc aggtgtcatc agcagccttt ctgaacacat gcatggccac       60
          attgatggca ggactgcctc ggacagcatc tagaactttg                            100
          <![CDATA[<210>  286]]>
          <![CDATA[<211>  100]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  286]]>
          cccagaggca aatggctccc aggtgtcatc agcagccttc cgaaatacgt gcatagctac       60
          attgatggca ggactgcctc ggacagcatc tagaactttg                            100
          <![CDATA[<210>  287]]>
          <![CDATA[<211>  100]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  287]]>
          gctacaccat tgccgccctg ctgagcccct actcctatag tactatggct gtcgtcacca       60
          atcccaagga atgagggact tctcctccag tggacctgaa                            100
          <![CDATA[<210>  288]]>
          <![CDATA[<211>  100]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  288]]>
          gctacaccat tgccgccctg ctgagcccct actcctattc caccatggct gttgttacta       60
          atcccaagga atgagggact tctcctccag tggacctgaa                            100
          <![CDATA[<210>  289]]>
          <![CDATA[<211>  100]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  289]]>
          gctacaccat tgccgccctg ctgagcccct actcctattc caccatggct gtcgtcacca       60
          atcccaagga atgagggact tctcctccag tggacctgaa                            100
          <![CDATA[<210>  290]]>
          <![CDATA[<211>  100]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  290]]>
          gctacaccat tgccgccctg ctgagcccct actcctatag tactatggcc gttgttacta       60
          atcccaagga atgagggact tctcctccag tggacctgaa                            100
          <![CDATA[<210>  291]]>
          <![CDATA[<211>  100]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  291]]>
          gtccttcagg tccactggag gagaagtccc tcattccttg gggttagtga cgacagccat       60
          ggtggaatag gagtaggggc tcagcagggc ggcaatggtg                            100
          <![CDATA[<210>  292]]>
          <![CDATA[<211>  100]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  292]]>
          gtccttcagg tccactggag gagaagtccc tcattccttg ggattggtga caacggccat       60
          ggtggaatag gagtaggggc tcagcagggc ggcaatggtg                            100
          <![CDATA[<210>  293]]>
          <![CDATA[<211>  100]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  293]]>
          gtccttcagg tccactggag gagaagtccc tcattccttg ggattggtga cgacagccat       60
          ggtggaatag gagtaggggc tcagcagggc ggcaatggtg                            100
          <![CDATA[<210>  294]]>
          <![CDATA[<211>  100]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  294]]>
          gtccttcagg tccactggag gagaagtccc tcattccttg gggttagtaa caacggccat       60
          ggtggaatag gagtaggggc tcagcagggc ggcaatggtg                            100
          <![CDATA[<210>  295]]>
          <![CDATA[<211>  100]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  295]]>
          gctacaccat tgccgccctg ctgagcccct actcctattc tactacagcc gttatcacta       60
          atcccaagga atgagggact tctcctccag tggacctgaa                            100
          <![CDATA[<210>  296]]>
          <![CDATA[<211>  100]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  296]]>
          gctacaccat tgccgccctg ctgagcccct actcctattc caccacggct gttatcacta       60
          atcccaagga atgagggact tctcctccag tggacctgaa                            100
          <![CDATA[<210>  297]]>
          <![CDATA[<211>  100]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  297]]>
          gctacaccat tgccgccctg ctgagcccct actcctattc caccacggct gtcatcacca       60
          atcccaagga atgagggact tctcctccag tggacctgaa                            100
          <![CDATA[<210>  298]]>
          <![CDATA[<211>  100]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  298]]>
          gctacaccat tgccgccctg ctgagcccct actcctatag tactacagcc gttatcacta       60
          atcccaagga atgagggact tctcctccag tggacctgaa                            100
          <![CDATA[<210>  299]]>
          <![CDATA[<211>  100]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  299]]>
          gtccttcagg tccactggag gagaagtccc tcattccttg ggattggtga taacggccgt       60
          ggtggaatag gagtaggggc tcagcagggc ggcaatggtg                            100
          <![CDATA[<210>  300]]>
          <![CDATA[<211>  100]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  300]]>
          gtccttcagg tccactggag gagaagtccc tcattccttg ggattggtga taacggctgt       60
          ggtggaatag gagtaggggc tcagcagggc ggcaatggtg                            100
          <![CDATA[<210>  301]]>
          <![CDATA[<211>  100]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  301]]>
          gtccttcagg tccactggag gagaagtccc tcattccttg ggattggtga tgacagccgt       60
          ggtggaatag gagtaggggc tcagcagggc ggcaatggtg                            100
          <![CDATA[<210>  302]]>
          <![CDATA[<211>  100]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  302]]>
          gtccttcagg tccactggag gagaagtccc tcattccttg gggttagtga taacggctgt       60
          ggtggaatag gagtaggggc tcagcagggc ggcaatggtg                            100
          <![CDATA[<210>  303]]>
          <![CDATA[<211>  120]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  303]]>
          ggcccccgcc gctacaccat tgccgccctg ctgagcccct actcctatag tactatggct       60
          gtcgtcacca atcccaagga atgagggact tctcctccag tggacctgaa ggacgaggga      120
          <![CDATA[<210>  304]]>
          <![CDATA[<211>  120]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  304]]>
          ggcccccgcc gctacaccat tgccgccctg ctgagcccct actcctattc caccatggct       60
          gttgttacta atcccaagga atgagggact tctcctccag tggacctgaa ggacgaggga      120
          <![CDATA[<210>  305]]>
          <![CDATA[<211>  120]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  305]]>
          ggcccccgcc gctacaccat tgccgccctg ctgagcccct actcctattc caccatggct       60
          gtcgtcacca atcccaagga atgagggact tctcctccag tggacctgaa ggacgaggga      120
          <![CDATA[<210>  306]]>
          <![CDATA[<211>  120]]>
          <![CDATA[<212>  DN]]>A
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  306]]>
          ggcccccgcc gctacaccat tgccgccctg ctgagcccct actcctatag tactatggcc       60
          gttgttacta atcccaagga atgagggact tctcctccag tggacctgaa ggacgaggga      120
          <![CDATA[<210>  307]]>
          <![CDATA[<211>  120]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  307]]>
          cccatccctc gtccttcagg tccactggag gagaagtccc tcattccttg gggttagtga       60
          cgacagccat ggtggaatag gagtaggggc tcagcagggc ggcaatggtg tagcggcggg      120
          <![CDATA[<210>  308]]>
          <![CDATA[<211>  120]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  ]]>合成的
          <![CDATA[<400>  308]]>
          cccatccctc gtccttcagg tccactggag gagaagtccc tcattccttg ggattggtga       60
          caacggccat ggtggaatag gagtaggggc tcagcagggc ggcaatggtg tagcggcggg      120
          <![CDATA[<210>  309]]>
          <![CDATA[<211>  120]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  309]]>
          cccatccctc gtccttcagg tccactggag gagaagtccc tcattccttg ggattggtga       60
          cgacagccat ggtggaatag gagtaggggc tcagcagggc ggcaatggtg tagcggcggg      120
          <![CDATA[<210>  310]]>
          <![CDATA[<211>  120]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  310]]>
          cccatccctc gtccttcagg tccactggag gagaagtccc tcattccttg gggttagtaa       60
          caacggccat ggtggaatag gagtaggggc tcagcagggc ggcaatggtg tagcggcggg      120
          <![CDATA[<210>  311]]>
          <![CDATA[<211>  120]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  311]]>
          ggcaacttac ccagaggcaa atggctccca ggtgtcatca gcagcctttc tgaacacatg       60
          catagctaca ttgatggcag gactgcctcg gacagcatct agaactttga ccatcagagg      120
          <![CDATA[<210>  312]]>
          <![CDATA[<211>  120]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  312]]>
          ggcaacttac ccagaggcaa atggctccca ggtgtcatca gcagcctttc tgaacacatg       60
          catagctacg ttgatggcag gactgcctcg gacagcatct agaactttga ccatcagagg      120
          <![CDATA[<210>  313]]>
          <![CDATA[<211>  120]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  313]]>
          ggcaacttac ccagaggcaa atggctccca ggtgtcatca gcagcctttc tgaacacatg       60
          catggccaca ttgatggcag gactgcctcg gacagcatct agaactttga ccatcagagg      120
          <![CDATA[<210>  314]]>
          <![CDATA[<211>  120]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  314]]>
          ggcaacttac ccagaggcaa atggctccca ggtgtcatca gcagcctttc gaaatacgtg       60
          catagctacg ttgatggcag gactgcctcg gacagcatct agaactttga ccatcagagg      120
          <![CDATA[<210>  315]]>
          <![CDATA[<211>  120]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  315]]>
          tggcaactta cccagaggca aatggctccc aggtgtcatc agcagccttt cgaaatacgt       60
          gcatagctac attgatggca ggactgcctc ggacagcatc tagaactttg accatcagag      120
          <![CDATA[<210>  316]]>
          <![CDATA[<211>  120]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  316]]>
          tggcaactta cccagaggca aatggctccc aggtgtcatc agcagccttt ctgaacacat       60
          gcatagctac attgatggca ggactgcctc ggacagcatc tagaactttg accatcagag      120
          <![CDATA[<210>  317]]>
          <![CDATA[<211>  120]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  317]]>
          tggcaactta cccagaggca aatggctccc aggtgtcatc agcagccttt ctgaacacat       60
          gcatggccac attgatggca ggactgcctc ggacagcatc tagaactttg accatcagag      120
          <![CDATA[<210>  318]]>
          <![CDATA[<211>  120]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  318]]>
          tggcaactta cccagaggca aatggctccc aggtgtcatc agcagccttc cgaaatacgt       60
          gcatagctac attgatggca ggactgcctc ggacagcatc tagaactttg accatcagag      120
          <![CDATA[<210>  319]]>
          <![CDATA[<211>  120]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  319]]>
          ggcccccgcc gctacaccat tgccgccctg ctgagcccct actcctattc tactacagcc       60
          gttatcacta atcccaagga atgagggact tctcctccag tggacctgaa ggacgaggga      120
          <![CDATA[<210>  320]]>
          <![CDATA[<211>  120]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  320]]>
          ggcccccgcc gctacaccat tgccgccctg ctgagcccct actcctattc caccacggct       60
          gttatcacta atcccaagga atgagggact tctcctccag tggacctgaa ggacgaggga      120
          <![CDATA[<210>  321]]>
          <![CDATA[<211>  120]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  321]]>
          ggcccccgcc gctacaccat tgccgccctg ctgagcccct actcctattc caccacggct       60
          gtcatcacca atcccaagga atgagggact tctcctccag tggacctgaa ggacgaggga      120
          <![CDATA[<210>  322]]>
          <![CDATA[<211>  120]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  322]]>
          ggcccccgcc gctacaccat tgccgccctg ctgagcccct actcctatag tactacagcc       60
          gttatcacta atcccaagga atgagggact tctcctccag tggacctgaa ggacgaggga      120
          <![CDATA[<210>  323]]>
          <![CDATA[<211>  120]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  323]]>
          cccatccctc gtccttcagg tccactggag gagaagtccc tcattccttg ggattggtga       60
          taacggccgt ggtggaatag gagtaggggc tcagcagggc ggcaatggtg tagcggcggg      120
          <![CDATA[<210>  324]]>
          <![CDATA[<211>  120]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  324]]>
          cccatccctc gtccttcagg tccactggag gagaagtccc tcattccttg ggattggtga       60
          taacggctgt ggtggaatag gagtaggggc tcagcagggc ggcaatggtg tagcggcggg      120
          <![CDATA[<210>  325]]>
          <![CDATA[<211>  120]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  325]]>
          cccatccctc gtccttcagg tccactggag gagaagtccc tcattccttg ggattggtga       60
          tgacagccgt ggtggaatag gagtaggggc tcagcagggc ggcaatggtg tagcggcggg      120
          <![CDATA[<210>  326]]>
          <![CDATA[<211>  120]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  326]]>
          cccatccctc gtccttcagg tccactggag gagaagtccc tcattccttg gggttagtga       60
          taacggctgt ggtggaatag gagtaggggc tcagcagggc ggcaatggtg tagcggcggg      120
          <![CDATA[<210>  327]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  327]]>
          tcatcgtctg ctcctcctct                                                   20
          <![CDATA[<210>  328]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  328]]>
          tctacaccca gggcaccggt                                                   20
          <![CDATA[<210>  329]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  329]]>
          gaccatcaga ggacacttgg                                                   20
          <![CDATA[<210>  330]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  330]]>
          tagatgctgt ccgaggcagt                                                   20
          <![CDATA[<210>  331]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  331]]>
          agaaaggctg ctgatgacac                                                   20
          <![CDATA[<210>  332]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  332]]>
          ctgaacacat gcacggccac                                                   20
          <![CDATA[<210>  333]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  333]]>
          ggcaacttac ccagaggcaa                                                   20
          <![CDATA[<210>  334]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  334]]>
          tttggcaact tacccagagg                                                   20
          <![CDATA[<210>  335]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  335]]>
          cacaccttat aggaaaacca                                                   20
          <![CDATA[<210>  336]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  33]]>6
          tacaaattcc tcctcagttg                                                   20
          <![CDATA[<210>  337]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  337]]>
          gtatatccct tctacaaatt                                                   20
          <![CDATA[<210>  338]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  338]]>
          cagtaagatt tggtgtctat                                                   20
          <![CDATA[<210>  339]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  339]]>
          ccgccctgct gagcccctac                                                   20
          <![CDATA[<210>  340]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  340]]>
          caccacggct gtcgtcacca                                                   20
          <![CDATA[<210>  341]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  341]]>
          gtgacgacag ccgtggtgga                                                   20
          <![CDATA[<210>  342]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  342]]>
          ggattggtga cgacagccgt                                                   20
          <![CDATA[<210>  343]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  343]]>
          cttgggattg gtgacgacag                                                   20
          <![CDATA[<210>  344]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  344]]>
          aggtccactg gaggagaagt                                                   20
          <![CDATA[<210>  345]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  345]]>
          agaaauccgu cuuucauuga cggucaucgu cugcuccucc ucu                         43
          <![CDATA[<210>  346]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  346]]>
          agaaauccgu cuuucauuga cggucuacac ccagggcacc ggu                         43
          <![CDATA[<210>  347]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  347]]>
          agaaauccgu cuuucauuga cgggaccauc agaggacacu ugg                         43
          <![CDATA[<210>  348]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  348]]>
          agaaauccgu cuuucauuga cgguagaugc uguccgaggc agu                         43
          <![CDATA[<210>  349]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  349]]>
          agaaauccgu cuuucauuga cggagaaagg cugcugauga cac                         43
          <![CDATA[<210>  350]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  350]]>
          agaaauccgu cuuucauuga cggcugaaca caugcacggc cac                         43
          <![CDATA[<210>  351]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  351]]>
          agaaauccgu cuuucauuga cggggcaacu uacccagagg caa                         43
          <![CDATA[<210>  352]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  352]]>
          agaaauccgu cuuucauuga cgguuuggca acuuacccag agg                         43
          <![CDATA[<210>  353]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  353]]>
          agaaauccgu cuuucauuga cggcacaccu uauaggaaaa cca                         43
          <![CDATA[<210>  354]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  354]]>
          agaaauccgu cuuucauuga cgguacaaau uccuccucag uug                         43
          <![CDATA[<210>  355]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  355]]>
          agaaauccgu cuuucauuga cggguauauc ccuucuacaa auu                         43
          <![CDATA[<210>  356]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  356]]>
          agaaauccgu cuuucauuga cggcaguaag auuugguguc uau                         43
          <![CDATA[<210>  357]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  357]]>
          agaaauccgu cuuucauuga cggccgcccu gcugagcccc uac                         43
          <![CDATA[<210>  358]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  358]]>
          agaaauccgu cuuucauuga cggcaccacg gcugucguca cca                         43
          <![CDATA[<210>  359]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  359]]>
          agaaauccgu cuuucauuga cgggugacga cagccguggu gga                         43
          <![CDATA[<210>  360]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  360]]>
          agaaauccgu cuuucauuga cggggauugg ugacgacagc cgu                         43
          <![CDATA[<210>  361]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  361]]>
          agaaauccgu cuuucauuga cggcuuggga uuggugacga cag                         43
          <![CDATA[<210>  362]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  362]]>
          agaaauccgu cuuucauuga cggaggucca cuggaggaga agu                         43
          <![CDATA[<210>  363]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  363]]>
          ttggcaggat ggcttctcat                                                   20
          <![CDATA[<210>  364]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  364]]>
          gcaggatggc ttctcatcgt                                                   20
          <![CDATA[<210>  365]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  365]]>
          accatcagag gacacttgga                                                   20
          <![CDATA[<210>  366]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  366]]>
          acaccttata ggaaaaccag                                                   20
          <![CDATA[<210>  367]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  367]]>
          taggaaaacc agtgagtctg                                                   20
          <![CDATA[<210>  368]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  368]]>
          gtagaaggga tatacaaagt                                                   20
          <![CDATA[<210>  369]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  369]]>
          tagaagggat atacaaagtg                                                   20
          <![CDATA[<210>  370]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  370]]>
          cactttgtat atcccttcta                                                   20
          <![CDATA[<210>  371]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  371]]>
          ccactttgta tatcccttct                                                   20
          <![CDATA[<210>  372]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  3]]>72
          gtgtctattt ccactttgta                                                   20
          <![CDATA[<210>  373]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  373]]>
          ggtgtctatt tccactttgt                                                   20
          <![CDATA[<210>  374]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  374]]>
          tctcataggt ggtattcaca                                                   20
          <![CDATA[<210>  375]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  375]]>
          agaaauccgu cuuucauuga cgguuggcag gauggcuucu cau                         43
          <![CDATA[<210>  376]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  376]]>
          agaaauccgu cuuucauuga cgggcaggau ggcuucucau cgu                         43
          <![CDATA[<210>  377]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  377]]>
          agaaauccgu cuuucauuga cggaccauca gaggacacuu gga                         43
          <![CDATA[<210>  378]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  378]]>
          agaaauccgu cuuucauuga cggacaccuu auaggaaaac cag                         43
          <![CDATA[<210>  379]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  379]]>
          agaaauccgu cuuucauuga cgguaggaaa accagugagu cug                         43
          <![CDATA[<210>  380]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  380]]>
          agaaauccgu cuuucauuga cggguagaag ggauauacaa agu                         43
          <![CDATA[<210>  381]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  381]]>
          agaaauccgu cuuucauuga cggcacuuug uauaucccuu cua                         43
          <![CDATA[<210>  382]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  382]]>
          agaaauccgu cuuucauuga cggccacuuu guauaucccu ucu                         43
          <![CDATA[<210>  383]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  383]]>
          agaaauccgu cuuucauuga cgggugucua uuuccacuuu gua                         43
          <![CDATA[<210>  384]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  384]]>
          agaaauccgu cuuucauuga cggggugucu auuuccacuu ugu                         43
          <![CDATA[<210>  385]]>
          <![CDATA[<211>  43]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  385]]>
          agaaauccgu cuuucauuga cggucucaua ggugguauuc aca                         43
          <![CDATA[<210>  386]]>
          <![CDATA[<211>  42]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  386]]>
          agacaugugu ccucagugac acucaucguc ugcuccuccu cu                          42
          <![CDATA[<210>  387]]>
          <![CDATA[<211>  42]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  387]]>
          agacaugugu ccucagugac acuuggcagg auggcuucuc au                          42
          <![CDATA[<210>  388]]>
          <![CDATA[<211>  42]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  388]]>
          agacaugugu ccucagugac acgcaggaug gcuucucauc gu                          42
          <![CDATA[<210>  389]]>
          <![CDATA[<211>  42]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  389]]>
          agacaugugu ccucagugac acucuacacc cagggcaccg gu                          42
          <![CDATA[<210>  390]]>
          <![CDATA[<211>  42]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  390]]>
          agacaugugu ccucagugac acgaccauca gaggacacuu gg                          42
          <![CDATA[<210>  391]]>
          <![CDATA[<211>  42]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  391]]>
          agacaugugu ccucagugac acuagaugcu guccgaggca gu                          42
          <![CDATA[<210>  392]]>
          <![CDATA[<211>  42]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  392]]>
          agacaugugu ccucagugac acaccaucag aggacacuug ga                          42
          <![CDATA[<210>  393]]>
          <![CDATA[<211>  42]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  393]]>
          agacaugugu ccucagugac accacaccuu auaggaaaac ca                          42
          <![CDATA[<210> ]]> 394
          <![CDATA[<211>  42]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  394]]>
          agacaugugu ccucagugac acuacaaauu ccuccucagu ug                          42
          <![CDATA[<210>  395]]>
          <![CDATA[<211>  42]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  395]]>
          agacaugugu ccucagugac acguauaucc cuucuacaaa uu                          42
          <![CDATA[<210>  396]]>
          <![CDATA[<211>  42]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  396]]>
          agacaugugu ccucagugac accaguaaga uuuggugucu au                          42
          <![CDATA[<210>  397]]>
          <![CDATA[<211>  42]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  397]]>
          agacaugugu ccucagugac acacaccuua uaggaaaacc ag                          42
          <![CDATA[<210>  398]]>
          <![CDATA[<211>  42]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  398]]>
          agacaugugu ccucagugac acuaggaaaa ccagugaguc ug                          42
          <![CDATA[<210>  399]]>
          <![CDATA[<211>  42]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  399]]>
          agacaugugu ccucagugac acguagaagg gauauacaaa gu                          42
          <![CDATA[<210>  400]]>
          <![CDATA[<211>  42]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  400]]>
          agacaugugu ccucagugac acuagaaggg auauacaaag ug                          42
          <![CDATA[<210>  401]]>
          <![CDATA[<211>  42]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  401]]>
          agacaugugu ccucagugac accacuuugu auaucccuuc ua                          42
          <![CDATA[<210>  402]]>
          <![CDATA[<211>  42]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  402]]>
          agacaugugu ccucagugac acccacuuug uauaucccuu cu                          42
          <![CDATA[<210>  403]]>
          <![CDATA[<211>  42]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  403]]>
          agacaugugu ccucagugac acgugucuau uuccacuuug ua                          42
          <![CDATA[<210>  404]]>
          <![CDATA[<211>  42]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  404]]>
          agacaugugu ccucagugac acggugucua uuuccacuuu gu                          42
          <![CDATA[<210>  405]]>
          <![CDATA[<211>  42]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  405]]>
          agacaugugu ccucagugac accaccacgg cugucgucac ca                          42
          <![CDATA[<210>  406]]>
          <![CDATA[<211>  42]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  406]]>
          agacaugugu ccucagugac acgugacgac agccguggug ga                          42
          <![CDATA[<210>  407]]>
          <![CDATA[<211> ]]> 42
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  407]]>
          agacaugugu ccucagugac acggauuggu gacgacagcc gu                          42
          <![CDATA[<210>  408]]>
          <![CDATA[<211>  42]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  408]]>
          agacaugugu ccucagugac accuugggau uggugacgac ag                          42
          <![CDATA[<210>  409]]>
          <![CDATA[<211>  42]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  409]]>
          agacaugugu ccucagugac acucucauag gugguauuca ca                          42
          <![CDATA[<210>  410]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  410]]>
          gaccaucaga ggacacuugg                                                   20
          <![CDATA[<210>  411]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  411]]>
          uagaugcugu ccgaggcagu                                                   20
          <![CDATA[<210>  412]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  412]]>
          cugaacacau gcacggccac                                                   20
          <![CDATA[<210>  413]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  413]]>
          ggcaacuuac ccagaggcaa                                                   20
          <![CDATA[<210>  414]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  414]]>
          uuuggcaacu uacccagagg                                                   20
          <![CDATA[<210>  415]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  415]]>
          cacaccuuau aggaaaacca                                                   20
          <![CDATA[<210>  416]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  416]]>
          guauaucccu ucuacaaauu                                                   20
          <![CDATA[<210>  417]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  417]]>
          caguaagauu uggugucuau                                                   20
          <![CDATA[<210>  418]]>
          <![CDATA[<211>  20]]>
          <![CDATA[<212>  RNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  418]]>
          caccacggcu gucgucacca                                                   20
          <![CDATA[<210>  419]]>
          <![CDATA[<211>  109]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  419]]>
          ccgctacacc attgccgccc tgctgagccc ctactcctat tccaccacgg ctgtcgtcac       60
          caatcccaag gaatgaggga cttctcctcc agtggacctg aaggacgag                  109
          <![CDATA[<210>  420]]>
          <![CDATA[<211>  109]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  420]]>
          ggcgatgtgg taacggcggg acgactcggg gatgaggata aggtggtgcc gacagcagtg       60
          gttagggttc cttactccct gaagaggagg tcacctggac ttcctgctc                  109
          <![CDATA[<210>  421]]>
          <![CDATA[<211>  35]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  421]]>
          Arg Tyr Thr Ile Ala Ala Leu Leu Ser Pro Tyr Ser Tyr Ser Thr Thr 
          1               5                   10                  15      
          Ala Val Val Thr Asn Pro Lys Glu Gly Thr Ser Pro Pro Val Asp Leu 
                      20                  25                  30          
          Lys Asp Glu 
                  35  
          <![CDATA[<210>  422]]>
          <![CDATA[<211>  100]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  422]]>
          gtggtaacgg cgggacgact cggggatgag gataaggtgg taccgacagc agtggttagg       60
          gttccttact ccctgaagag gaggtcacct ggacttcctg                            100
          <![CDATA[<210>  423]]>
          <![CDATA[<211>  100]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  423]]>
          gtggtaacgg cgggacgact cggggatgag gataaggtgg taccggcaac aatgattggg       60
          gttccttact ccctgaagag gaggtcacct ggacttcctg                            100
          <![CDATA[<210>  424]]>
          <![CDATA[<211>  100]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  424]]>
          gtggtaacgg cgggacgact cggggatgag gataaggtgg taccggcaac agtggttagg       60
          gttccttact ccctgaagag gaggtcacct ggacttcctg                            100
          <![CDATA[<210>  425]]>
          <![CDATA[<211>  100]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  人工序列]]>
          <![CDATA[<220>]]>
          <![CDATA[<223>  合成的]]>
          <![CDATA[<400>  425]]>
          gtggtaacgg cgggacgact cggggatgag gataaggtgg taccgacagc agtgattggg       60
          gttccttact ccctgaagag gaggtcacct ggacttcctg                            100
          
Figure 12_A0101_SEQ_0001
Figure 12_A0101_SEQ_0002
Figure 12_A0101_SEQ_0003
Figure 12_A0101_SEQ_0004
Figure 12_A0101_SEQ_0005
Figure 12_A0101_SEQ_0006
Figure 12_A0101_SEQ_0007
Figure 12_A0101_SEQ_0008
Figure 12_A0101_SEQ_0009
Figure 12_A0101_SEQ_0010
Figure 12_A0101_SEQ_0011
Figure 12_A0101_SEQ_0012
Figure 12_A0101_SEQ_0013
Figure 12_A0101_SEQ_0014
Figure 12_A0101_SEQ_0015
Figure 12_A0101_SEQ_0016
Figure 12_A0101_SEQ_0017
Figure 12_A0101_SEQ_0018
Figure 12_A0101_SEQ_0019
Figure 12_A0101_SEQ_0020
Figure 12_A0101_SEQ_0021
Figure 12_A0101_SEQ_0022
Figure 12_A0101_SEQ_0023
Figure 12_A0101_SEQ_0024
Figure 12_A0101_SEQ_0025
Figure 12_A0101_SEQ_0026
Figure 12_A0101_SEQ_0027
Figure 12_A0101_SEQ_0028
Figure 12_A0101_SEQ_0029
Figure 12_A0101_SEQ_0030
Figure 12_A0101_SEQ_0031
Figure 12_A0101_SEQ_0032
Figure 12_A0101_SEQ_0033
Figure 12_A0101_SEQ_0034
Figure 12_A0101_SEQ_0035
Figure 12_A0101_SEQ_0036
Figure 12_A0101_SEQ_0037
Figure 12_A0101_SEQ_0038
Figure 12_A0101_SEQ_0039
Figure 12_A0101_SEQ_0040
Figure 12_A0101_SEQ_0041
Figure 12_A0101_SEQ_0042
Figure 12_A0101_SEQ_0043
Figure 12_A0101_SEQ_0044
Figure 12_A0101_SEQ_0045
Figure 12_A0101_SEQ_0046
Figure 12_A0101_SEQ_0047
Figure 12_A0101_SEQ_0048
Figure 12_A0101_SEQ_0049
Figure 12_A0101_SEQ_0050
Figure 12_A0101_SEQ_0051
Figure 12_A0101_SEQ_0052
Figure 12_A0101_SEQ_0053
Figure 12_A0101_SEQ_0054
Figure 12_A0101_SEQ_0055
Figure 12_A0101_SEQ_0056
Figure 12_A0101_SEQ_0057
Figure 12_A0101_SEQ_0058
Figure 12_A0101_SEQ_0059
Figure 12_A0101_SEQ_0060
Figure 12_A0101_SEQ_0061
Figure 12_A0101_SEQ_0062
Figure 12_A0101_SEQ_0063
Figure 12_A0101_SEQ_0064
Figure 12_A0101_SEQ_0065
Figure 12_A0101_SEQ_0066
Figure 12_A0101_SEQ_0067
Figure 12_A0101_SEQ_0068
Figure 12_A0101_SEQ_0069
Figure 12_A0101_SEQ_0070
Figure 12_A0101_SEQ_0071
Figure 12_A0101_SEQ_0072
Figure 12_A0101_SEQ_0073
Figure 12_A0101_SEQ_0074
Figure 12_A0101_SEQ_0075
Figure 12_A0101_SEQ_0076
Figure 12_A0101_SEQ_0077
Figure 12_A0101_SEQ_0078
Figure 12_A0101_SEQ_0079
Figure 12_A0101_SEQ_0080
Figure 12_A0101_SEQ_0081
Figure 12_A0101_SEQ_0082
Figure 12_A0101_SEQ_0083
Figure 12_A0101_SEQ_0084
Figure 12_A0101_SEQ_0085
Figure 12_A0101_SEQ_0086
Figure 12_A0101_SEQ_0087
Figure 12_A0101_SEQ_0088
Figure 12_A0101_SEQ_0089
Figure 12_A0101_SEQ_0090
Figure 12_A0101_SEQ_0091
Figure 12_A0101_SEQ_0092
Figure 12_A0101_SEQ_0093
Figure 12_A0101_SEQ_0094
Figure 12_A0101_SEQ_0095
Figure 12_A0101_SEQ_0096
Figure 12_A0101_SEQ_0097
Figure 12_A0101_SEQ_0098
Figure 12_A0101_SEQ_0099
Figure 12_A0101_SEQ_0100
Figure 12_A0101_SEQ_0101
Figure 12_A0101_SEQ_0102
Figure 12_A0101_SEQ_0103
Figure 12_A0101_SEQ_0104
Figure 12_A0101_SEQ_0105
Figure 12_A0101_SEQ_0106
Figure 12_A0101_SEQ_0107
Figure 12_A0101_SEQ_0108
Figure 12_A0101_SEQ_0109
Figure 12_A0101_SEQ_0110
Figure 12_A0101_SEQ_0111
Figure 12_A0101_SEQ_0112
Figure 12_A0101_SEQ_0113
Figure 12_A0101_SEQ_0114
Figure 12_A0101_SEQ_0115
Figure 12_A0101_SEQ_0116
Figure 12_A0101_SEQ_0117
Figure 12_A0101_SEQ_0118
Figure 12_A0101_SEQ_0119
Figure 12_A0101_SEQ_0120
Figure 12_A0101_SEQ_0121
Figure 12_A0101_SEQ_0122
Figure 12_A0101_SEQ_0123
Figure 12_A0101_SEQ_0124
Figure 12_A0101_SEQ_0125
Figure 12_A0101_SEQ_0126
Figure 12_A0101_SEQ_0127
Figure 12_A0101_SEQ_0128
Figure 12_A0101_SEQ_0129
Figure 12_A0101_SEQ_0130
Figure 12_A0101_SEQ_0131
Figure 12_A0101_SEQ_0132
Figure 12_A0101_SEQ_0133
Figure 12_A0101_SEQ_0134
Figure 12_A0101_SEQ_0135
Figure 12_A0101_SEQ_0136
Figure 12_A0101_SEQ_0137
Figure 12_A0101_SEQ_0138
Figure 12_A0101_SEQ_0139
Figure 12_A0101_SEQ_0140
Figure 12_A0101_SEQ_0141
Figure 12_A0101_SEQ_0142
Figure 12_A0101_SEQ_0143
Figure 12_A0101_SEQ_0144
Figure 12_A0101_SEQ_0145
Figure 12_A0101_SEQ_0146
Figure 12_A0101_SEQ_0147
Figure 12_A0101_SEQ_0148
Figure 12_A0101_SEQ_0149
Figure 12_A0101_SEQ_0150
Figure 12_A0101_SEQ_0151
Figure 12_A0101_SEQ_0152
Figure 12_A0101_SEQ_0153
Figure 12_A0101_SEQ_0154
Figure 12_A0101_SEQ_0155
Figure 12_A0101_SEQ_0156
Figure 12_A0101_SEQ_0157
Figure 12_A0101_SEQ_0158
Figure 12_A0101_SEQ_0159
Figure 12_A0101_SEQ_0160
Figure 12_A0101_SEQ_0161
Figure 12_A0101_SEQ_0162
Figure 12_A0101_SEQ_0163
Figure 12_A0101_SEQ_0164
Figure 12_A0101_SEQ_0165
Figure 12_A0101_SEQ_0166
Figure 12_A0101_SEQ_0167
Figure 12_A0101_SEQ_0168
Figure 12_A0101_SEQ_0169
Figure 12_A0101_SEQ_0170
Figure 12_A0101_SEQ_0171
Figure 12_A0101_SEQ_0172
Figure 12_A0101_SEQ_0173
Figure 12_A0101_SEQ_0174
Figure 12_A0101_SEQ_0175

Claims (81)

  1. 一種用於運甲狀腺素蛋白(TTR)基因的基因編輯的基因編輯系統,該基因編輯系統包含 (i) Cas12i2多肽或編碼該Cas12i2多肽的第一核酸,其中該Cas12i2多肽包含與SEQ ID NO: 222具有至少95%同一性的胺基酸序列,並且相對於SEQ ID NO: 222包含一或多個突變; (ii) RNA指導物或編碼該RNA指導物的第二核酸,其中該RNA指導物包含對TTR基因內的靶序列具有特異性的間隔子序列,該靶序列與包含5'-TTN-3'模體的原型間隔子相鄰模體(PAM)相鄰,該PAM位於該靶序列的5'。
  2. 如請求項1所述之基因編輯系統,其中該Cas12i2多肽中的一或多個突變在SEQ ID NO: 222的位置D581、G624、F626、P868、I926、V1030、E1035、和/或S1046處。
  3. 如請求項1或請求項2所述之基因編輯系統,其中該一或多個突變係胺基酸取代,該等胺基酸取代視需要是D581R、G624R、F626R、P868T、I926R、V1030G、E1035R、S1046G、或其組合。
  4. 如請求項3所述之基因編輯基因編輯系統,其中該Cas12i2多肽包含: (i) 在位置D581、D911、I926、和V1030處的突變,該等突變視需要是胺基酸取代D581R、D911R、I926R、和V1030G; (ii) 在位置D581、I926、和V1030處的突變,該等突變視需要是胺基酸取代D581R、I926R、和V1030G; (iii) 在位置D581、I926、V1030、和S1046處的突變,該等突變視需要是胺基酸取代D581R、I926R、V1030G、和S1046G; (iv) 在位置D581、G624、F626、I926、V1030、E1035、和S1046處的突變,該等突變視需要是胺基酸取代D581R、G624R、F626R、I926R、V1030G、E1035R、和S1046G;或 (v) 在位置D581、G624、F626、P868、I926、V1030、E1035、和S1046處的突變,該等突變視需要是胺基酸取代D581R、G624R、F626R、P868T、I926R、V1030G、E1035R、和S1046G。
  5. 如請求項1所述之基因編輯系統,其中該Cas12i2多肽包含SEQ ID NO: 223-227的胺基酸序列,視需要其中該Cas12i2多肽包含SEQ ID NO: 224或SEQ ID NO: 227的胺基酸序列。
  6. 如請求項1-5中任一項所述之基因編輯系統,該基因編輯系統包含編碼該Cas12i2多肽的第一核酸。
  7. 如請求項6所述之基因編輯系統,其中該第一核酸係信使RNA(mRNA)。
  8. 如請求項6所述之基因編輯系統,其中該第一核酸被包括在病毒載體中,該病毒載體視需要是腺相關病毒(AAV)載體。
  9. 如請求項1-8中任一項所述之基因編輯系統,其中該靶序列在該TTR基因的外顯子2、外顯子3或外顯子4內。
  10. 如請求項9所述之基因編輯系統,其中該靶序列包含: (i) GACCATCAGAGGACACTTGG(SEQ ID NO: 329)、 (ii) TAGATGCTGTCCGAGGCAGT(SEQ ID NO: 330)、 (iii) CTGAACACATGCACGGCCAC(SEQ ID NO: 332)、 (iv) GGCAACTTACCCAGAGGCAA(SEQ ID NO: 333)、 (v) TTTGGCAACTTACCCAGAGG(SEQ ID NO: 334)、 (vi) CACACCTTATAGGAAAACCA(SEQ ID NO: 335)、 (vii) GTATATCCCTTCTACAAATT(SEQ ID NO: 337)、 (viii) CAGTAAGATTTGGTGTCTAT(SEQ ID NO: 338)、或 (ix) CACCACGGCTGTCGTCACCA(SEQ ID NO: 271)。
  11. 如請求項10所述之基因編輯系統,其中該間隔子序列被闡述為: (i) GACCAUCAGAGGACACUUGG(SEQ ID NO: 410)、 (ii) UAGAUGCUGUCCGAGGCAGU(SEQ ID NO: 411)、 (iii) CUGAACACAUGCACGGCCAC(SEQ ID NO: 412)、 (iv) GGCAACUUACCCAGAGGCAA(SEQ ID NO: 413)、 (v) UUUGGCAACUUACCCAGAGG(SEQ ID NO: 414)、 (vi) CACACCUUAUAGGAAAACCA(SEQ ID NO: 415)、 (vii) GUAUAUCCCUUCUACAAAUU(SEQ ID NO: 416)、 (viii) CAGUAAGAUUUGGUGUCUAU(SEQ ID NO: 417)、或 (xi) CACCACGGCUGUCGUCACCA(SEQ ID NO: 418)。
  12. 如請求項1-11中任一項所述之基因編輯系統,其中該間隔子序列的長度係20-30個核苷酸,視需要其中該間隔子序列的長度係20個核苷酸。
  13. 如請求項1-12中任一項所述之基因編輯系統,其中該RNA指導物包含該間隔子序列和直接重複序列。
  14. 如請求項13所述之基因編輯系統,其中該直接重複序列的長度係23-36個核苷酸。
  15. 如請求項14所述之基因編輯系統,其中該直接重複序列與SEQ ID NO: 1-10中的任一個或其長度為至少23個核苷酸的片段具有至少90%的同一性。
  16. 如請求項13所述之基因編輯系統,其中該直接重複序列係SEQ ID NO: 1-10中的任一個、或其長度為至少23個核苷酸的片段。
  17. 如請求項16所述之基因編輯系統,其中該直接重複序列係5’-AGAAAUCCGUCUUUCAUUGACGG-3’(SEQ ID NO: 10)。
  18. 如請求項1所述之基因編輯系統,其中該RNA指導物包含以下的核苷酸序列: (i) AGAAAUCCGUCUUUCAUUGACGGGACCAUCAGAGGACACUUGG(SEQ ID NO: 347)、 (ii) AGAAAUCCGUCUUUCAUUGACGGUAGAUGCUGUCCGAGGCAGU(SEQ ID NO: 348)、 (iii) AGAAAUCCGUCUUUCAUUGACGGCUGAACACAUGCACGGCCAC(SEQ ID NO: 350)、 (iv) AGAAAUCCGUCUUUCAUUGACGGGGCAACUUACCCAGAGGCAA(SEQ ID NO: 351)、 (v) AGAAAUCCGUCUUUCAUUGACGGUUUGGCAACUUACCCAGAGG(SEQ ID NO: 352)、 (vi) AGAAAUCCGUCUUUCAUUGACGGCACACCUUAUAGGAAAACCA(SEQ ID NO: 353)、 (vii) AGAAAUCCGUCUUUCAUUGACGGGUAUAUCCCUUCUACAAAUU(SEQ ID NO: 355)、 (viii) AGAAAUCCGUCUUUCAUUGACGGCAGUAAGAUUUGGUGUCUAU(SEQ ID NO: 356)、或 (ix) AGAAAUCCGUCUUUCAUUGACGGCACCACGGCUGUCGUCACCA(SEQ ID NO: 358)。
  19. 如請求項1-18中任一項所述之基因編輯系統,其中該系統包含編碼該RNA指導物的第二核酸。
  20. 如請求項19所述之基因編輯系統,其中編碼該RNA指導物的核酸位於病毒載體中。
  21. 如請求項8-20中任一項所述之基因編輯系統,其中該病毒載體包含編碼該Cas12i2多肽的第一核酸和編碼該RNA指導物的第二核酸兩者。
  22. 如請求項1-20中任一項所述之基因編輯系統,其中該系統包含編碼該Cas12i2多肽的第一核酸,該第一核酸位於第一載體中,並且其中該系統包含編碼該RNA指導物的第二核酸,該第二核酸位於第二載體中。
  23. 如請求項1-22中任一項所述之基因編輯系統,其中該系統進一步包含 (iii) 模板DNA,該模板DNA包含 (a) 與該TTR基因中的第一位點同源的第一區段,該第一位點在用於基因編輯的TTR基因靶位點的上游,(b) 與第二位點同源的第二區段,該第二位點在該用於基因編輯的TTR基因靶位點的下游,和 (c) 供體區,該供體區與該用於基因編輯的TTR基因靶位點同源並包含至少一個相對於該用於基因編輯的TTR基因靶位點的核苷酸變化;並且其中該供體區的側翼係該第一區段和該第二區段。
  24. 如請求項23所述之基因編輯系統,其中該用於基因編輯的TTR基因靶位點包含該靶序列、該PAM、或其組合。
  25. 如請求項23或請求項24所述之基因編輯系統,其中該用於基因編輯的TTR基因靶位點包含與疾病相關的突變,並且其中該供體區包含修復該突變的序列。
  26. 如請求項25所述之基因編輯系統,其中該與疾病相關的突變導致相對於SEQ ID NO: 257的TTR序列的胺基酸殘基取代V30M、V122I、T60A、L58H、或I84S。
  27. 如請求項23或請求項24所述之基因編輯系統,其中該供體區包含相對於該用於基因編輯的TTR基因靶位點的保護性突變。
  28. 如請求項27所述之基因編輯系統,其中該保護性突變導致相對於SEQ ID NO: 257的TTR序列的胺基酸殘基取代T119M。
  29. 如請求項23-28中任一項所述之基因編輯系統,其中該模板化的DNA位於病毒載體中,該病毒載體視需要是AAV載體。
  30. 如請求項1-29中任一項所述之基因編輯系統,其中該系統包含一或多個脂質奈米顆粒(LNP),該一或多個LNP涵蓋 (i)、(ii)、或兩者,以及視需要 (iii)。
  31. 如請求項30所述之基因編輯系統,其中該系統包含該LNP,該LNP涵蓋 (i),並且其中該系統包含病毒載體,該病毒載體包含編碼該RNA指導物的第二核酸;視需要其中該病毒載體係AAV載體。
  32. 如請求項30所述之基因編輯系統,其中該系統包含該LNP,該LNP涵蓋 (ii),並且其中該系統包含病毒載體,該病毒載體包含編碼Cas12i2多肽的第一核酸;視需要其中該病毒載體係AAV載體。
  33. 一種用於運甲狀腺素蛋白(TTR)基因的基因編輯的基因編輯系統,該基因編輯系統包含 (i) Cas12i多肽或編碼該Cas12i多肽的第一核酸,視需要其中該Cas12i多肽係Cas12i2多肽; (ii) RNA指導物或編碼該RNA指導物的第二核酸,其中該RNA指導物包含對TTR基因的外顯子2、外顯子3或外顯子4內的靶序列具有特異性的間隔子序列,該靶序列與包含5'-TTN-3'模體的原型間隔子相鄰模體(PAM)相鄰,該PAM位於該靶序列的5'。
  34. 如請求項33所述之基因編輯系統,其中該靶序列包含: (i) GACCATCAGAGGACACTTGG(SEQ ID NO: 329)、 (ii) TAGATGCTGTCCGAGGCAGT(SEQ ID NO: 330)、 (iii) CTGAACACATGCACGGCCAC(SEQ ID NO: 332)、 (iv) GGCAACTTACCCAGAGGCAA(SEQ ID NO: 333)、 (v) TTTGGCAACTTACCCAGAGG(SEQ ID NO: 334)、 (vi) CACACCTTATAGGAAAACCA(SEQ ID NO: 335)、 (vii) GTATATCCCTTCTACAAATT(SEQ ID NO: 337)、 (viii) CAGTAAGATTTGGTGTCTAT(SEQ ID NO: 338)、或 (ix) CACCACGGCTGTCGTCACCA(SEQ ID NO: 271)。
  35. 如請求項34所述之基因編輯系統,其中該間隔子序列被闡述為: (i) GACCAUCAGAGGACACUUGG(SEQ ID NO: 410)、 (ii) UAGAUGCUGUCCGAGGCAGU(SEQ ID NO: 411)、 (iii) CUGAACACAUGCACGGCCAC(SEQ ID NO: 412)、 (iv) GGCAACUUACCCAGAGGCAA(SEQ ID NO: 413)、 (v) UUUGGCAACUUACCCAGAGG(SEQ ID NO: 414)、 (vi) CACACCUUAUAGGAAAACCA(SEQ ID NO: 415)、 (vii) GUAUAUCCCUUCUACAAAUU(SEQ ID NO: 416)、 (viii) CAGUAAGAUUUGGUGUCUAU(SEQ ID NO: 417)、或 (xi) CACCACGGCUGUCGUCACCA(SEQ ID NO: 418)。
  36. 如請求項33-35中任一項所述之基因編輯系統,該基因編輯系統包含編碼該Cas12i2多肽的第一核酸。
  37. 如請求項36所述之基因編輯系統,其中該第一核酸係信使RNA(mRNA)。
  38. 如請求項37所述之基因編輯系統,其中該第一核酸被包括在病毒載體中,該病毒載體視需要是腺相關病毒(AAV)載體。
  39. 如請求項33-38中任一項所述之基因編輯系統,其中該間隔子序列的長度係20-30個核苷酸,視需要其中該間隔子序列的長度係20個核苷酸。
  40. 如請求項33-39中任一項所述之基因編輯系統,其中該RNA指導物包含該間隔子序列和直接重複序列。
  41. 如請求項40所述之基因編輯系統,其中該直接重複序列的長度係23-36個核苷酸。
  42. 如請求項41所述之基因編輯系統,其中該直接重複序列與SEQ ID NO: 1-10中的任一個或其長度為至少23個核苷酸的片段具有至少90%的同一性。
  43. 如請求項42所述之基因編輯系統,其中該直接重複序列係SEQ ID NO: 1-10中的任一個、或其長度為至少23個核苷酸的片段。
  44. 如請求項43所述之基因編輯系統,其中該直接重複序列係5’-AGAAAUCCGUCUUUCAUUGACGG-3’(SEQ ID NO: 10)。
  45. 如請求項43所述之基因編輯系統,其中該RNA指導物包含以下的核苷酸序列: (i) AGAAAUCCGUCUUUCAUUGACGGGACCAUCAGAGGACACUUGG(SEQ ID NO: 347)、 (ii) AGAAAUCCGUCUUUCAUUGACGGUAGAUGCUGUCCGAGGCAGU(SEQ ID NO: 348)、 (iii) AGAAAUCCGUCUUUCAUUGACGGCUGAACACAUGCACGGCCAC(SEQ ID NO: 350)、 (iv) AGAAAUCCGUCUUUCAUUGACGGGGCAACUUACCCAGAGGCAA(SEQ ID NO: 351)、 (v) AGAAAUCCGUCUUUCAUUGACGGUUUGGCAACUUACCCAGAGG(SEQ ID NO: 352)、 (vi) AGAAAUCCGUCUUUCAUUGACGGCACACCUUAUAGGAAAACCA(SEQ ID NO: 353)、 (vii) AGAAAUCCGUCUUUCAUUGACGGGUAUAUCCCUUCUACAAAUU(SEQ ID NO: 355)、 (viii) AGAAAUCCGUCUUUCAUUGACGGCAGUAAGAUUUGGUGUCUAU(SEQ ID NO: 356)、或 (ix) AGAAAUCCGUCUUUCAUUGACGGCACCACGGCUGUCGUCACCA(SEQ ID NO: 358)。
  46. 如請求項33-45中任一項所述之基因編輯系統,其中該系統包含編碼該RNA指導物的第二核酸。
  47. 如請求項46所述之基因編輯系統,其中編碼該RNA指導物的核酸位於病毒載體中。
  48. 如請求項38-47中任一項所述之基因編輯系統,其中該病毒載體包含編碼該Cas12i2多肽的第一核酸和編碼該RNA指導物的第二核酸兩者。
  49. 如請求項33-48中任一項所述之基因編輯系統,其中該系統包含編碼該Cas12i2多肽的第一核酸,該第一核酸位於第一載體上,並且其中該系統包含編碼該RNA指導物的第二核酸,該第二核酸位於第二載體上。
  50. 如請求項33-49中任一項所述之基因編輯系統,其中該系統進一步包含 (iii) 模板DNA,該模板DNA包含 (a) 與該TTR基因中的第一位點同源的第一區段,該第一位點在用於基因編輯的TTR基因靶位點的上游,(b) 與第二位點同源的第二區段,該第二位點在該用於基因編輯的TTR基因靶位點的下游,和 (c) 供體區,該供體區與該用於基因編輯的TTR基因靶位點同源並包含至少一個相對於該用於基因編輯的TTR基因靶位點的核苷酸變化;並且其中該供體區的側翼係該第一區段和該第二區段。
  51. 如請求項50所述之基因編輯系統,其中該用於基因編輯的TTR基因靶位點包含該靶序列、該PAM、或其組合。
  52. 如請求項50或請求項51所述之基因編輯系統,其中該用於基因編輯的TTR基因靶位點包含與疾病相關的突變,並且其中該供體區包含修復該突變的序列。
  53. 如請求項52所述之基因編輯系統,其中該與疾病相關的突變導致相對於SEQ ID NO: 257的TTR序列的胺基酸殘基取代V30M、V122I、T60A、L58H、或I84S。
  54. 如請求項50或請求項53所述之基因編輯系統,其中該供體區包含相對於該用於基因編輯的TTR基因靶位點的保護性突變。
  55. 如請求項54所述之基因編輯系統,其中該保護性突變導致相對於SEQ ID NO: 257的TTR序列的胺基酸殘基取代T119M。
  56. 如請求項50-55中任一項所述之基因編輯系統,其中該模板化的DNA位於病毒載體中,該病毒載體視需要是AAV載體。
  57. 如請求項33-56中任一項所述之基因編輯系統,其中該系統包含一或多個脂質奈米顆粒(LNP),該一或多個LNP涵蓋 (i)、(ii)、或兩者,或視需要 (iii)。
  58. 如請求項57所述之基因編輯系統,其中該系統包含該LNP,該LNP涵蓋 (i),並且其中該系統包含病毒載體,該病毒載體包含編碼該RNA指導物的第二核酸;視需要其中該病毒載體係AAV載體。
  59. 如請求項57所述之基因編輯系統,其中該系統包含該LNP,該LNP涵蓋 (ii),並且其中該系統包含病毒載體,該病毒載體包含編碼Cas12i2多肽的第一核酸;視需要其中該病毒載體係AAV載體。
  60. 一種用於運甲狀腺素蛋白(TTR)基因的基因編輯的基因編輯系統,該基因編輯系統包含 (i) Cas12i多肽或編碼該Cas12i多肽的第一核酸,視需要其中該Cas12i多肽係Cas12i2多肽; (ii) RNA指導物或編碼該RNA指導物的第二核酸,其中該RNA指導物包含對TTR基因內的靶序列具有特異性的間隔子序列,該靶序列與包含5'-TTN-3'模體的原型間隔子相鄰模體(PAM)相鄰,該PAM位於該靶序列的5';以及 (iii) 模板DNA,該模板DNA包含 (a) 與該TTR基因中的第一位點同源的第一區段,該第一位點在用於基因編輯的TTR基因靶位點的上游,(b) 與第二位點同源的第二區段,該第二位點在該用於基因編輯的TTR基因靶位點的下游,和 (c) 供體區,該供體區與該用於基因編輯的TTR基因靶位點同源並包含至少一個相對於該用於基因編輯的TTR基因靶位點的核苷酸變化;並且其中該供體區的側翼係該第一區段和該第二區段。
  61. 如請求項60所述之基因編輯系統,其中該模板DNA中的供體區包含修復該與疾病相關的TTR基因靶位點中的突變的序列、包含保護性突變、或其組合。
  62. 一種藥物組成物,該藥物組成物包含如請求項1-61中任一項闡述的基因編輯系統。
  63. 一種套組,該套組包含如請求項1-61中任一項闡述的基因編輯系統的元件 (i) 和 (ii)、以及視需要 (iii)。
  64. 一種用於編輯細胞中的運甲狀腺素蛋白(TTR)基因之方法,該方法包括使宿主細胞與如請求項1-61中任一項闡述的用於編輯該TTR基因的基因編輯系統接觸,以對該宿主細胞中的TTR基因進行基因編輯。
  65. 如請求項64所述之方法,其中該宿主細胞在體外培養。
  66. 如請求項65所述之方法,其中該接觸步驟藉由以下進行:向包含該宿主細胞的受試者投與用於編輯該TTR基因的系統。
  67. 一種包含經突變的運甲狀腺素蛋白(TTR)基因的細胞,其中該細胞視需要藉由以下產生:使宿主細胞與如請求項1-61中任一項所述之基因編輯系統接觸以對該宿主細胞中的TTR基因進行基因編輯,從而使該TTR基因突變。
  68. 如請求項67所述之細胞,其中該細胞包含經破壞的TTR基因。
  69. 如請求項67所述之細胞,其中該細胞包含經修飾的TTR基因,該經修飾的TTR基因相對於野生型對應細胞表現經突變的TTR。
  70. 一種用於治療受試者的澱粉樣變運甲狀腺素蛋白(ATTR)之方法,該方法包括向有需要的受試者投與如請求項1-61中任一項闡述的用於編輯運甲狀腺素蛋白(TTR)基因的基因編輯系統或如請求項67-69中任一項所述之細胞。
  71. 如請求項70所述之方法,其中該受試者係患有遺傳性ATTR(hATTR)或野生型ATTR類澱粉變性的人患者。
  72. 一種RNA指導物,該RNA指導物包含 (i) 對運甲狀腺素蛋白(TTR)基因中的靶序列具有特異性的間隔子序列,其中該靶序列與包含5’-TTN-3’模體的原型間隔子相鄰模體(PAM)相鄰,該PAM位於該靶序列的5’;以及 (ii) 直接重複序列。
  73. 如請求項72所述之RNA指導物,其中該間隔子序列的長度係20-30個核苷酸,視需要長度係20個核苷酸。
  74. 如請求項72或請求項73所述之RNA指導物,其中該直接重複序列的長度係23-36個核苷酸,視需要長度係23個核苷酸。
  75. 如請求項72-74中任一項所述之RNA指導物,其中該靶序列在該TTR基因的外顯子2、外顯子3或外顯子4內。
  76. 如請求項75所述之RNA指導物,其中該靶序列包含: (i) GACCATCAGAGGACACTTGG(SEQ ID NO: 329)、 (ii) TAGATGCTGTCCGAGGCAGT(SEQ ID NO: 330)、 (iii) CTGAACACATGCACGGCCAC(SEQ ID NO: 332)、 (iv) GGCAACTTACCCAGAGGCAA(SEQ ID NO: 333)、 (v) TTTGGCAACTTACCCAGAGG(SEQ ID NO: 334)、 (vi) CACACCTTATAGGAAAACCA(SEQ ID NO: 335)、 (vii) GTATATCCCTTCTACAAATT(SEQ ID NO: 337)、 (viii) CAGTAAGATTTGGTGTCTAT(SEQ ID NO: 338)、或 (ix) CACCACGGCTGTCGTCACCA(SEQ ID NO: 271)。
  77. 如請求項76所述之RNA指導物,其中該間隔子序列被闡述為: (i) GACCAUCAGAGGACACUUGG(SEQ ID NO: 410)、 (ii) UAGAUGCUGUCCGAGGCAGU(SEQ ID NO: 411)、 (iii) CUGAACACAUGCACGGCCAC(SEQ ID NO: 412)、 (iv) GGCAACUUACCCAGAGGCAA(SEQ ID NO: 413)、 (v) UUUGGCAACUUACCCAGAGG(SEQ ID NO: 414)、 (vi) CACACCUUAUAGGAAAACCA(SEQ ID NO: 415)、 (vii) GUAUAUCCCUUCUACAAAUU(SEQ ID NO: 416)、 (viii) CAGUAAGAUUUGGUGUCUAU(SEQ ID NO: 417)、或 (xi) CACCACGGCUGUCGUCACCA(SEQ ID NO: 418)。
  78. 如請求項72-77中任一項所述之RNA指導物,其中該直接重複序列與SEQ ID NO: 1-10中的任一個或其長度為至少23個核苷酸的片段具有至少90%的同一性。
  79. 如請求項78所述之RNA指導物,其中該直接重複序列係SEQ ID NO: 1-10中的任一個、或其長度為至少23個核苷酸的片段。
  80. 如請求項79所述之RNA指導物,其中該直接重複序列係5’-AGAAAUCCGUCUUUCAUUGACGG-3’(SEQ ID NO: 10)。
  81. 如請求項78所述之RNA指導物,該RNA指導物包含以下的核苷酸序列: (i) AGAAAUCCGUCUUUCAUUGACGGGACCAUCAGAGGACACUUGG(SEQ ID NO: 347)、 (ii) AGAAAUCCGUCUUUCAUUGACGGUAGAUGCUGUCCGAGGCAGU(SEQ ID NO: 348)、 (iii) AGAAAUCCGUCUUUCAUUGACGGCUGAACACAUGCACGGCCAC(SEQ ID NO: 350)、 (iv) AGAAAUCCGUCUUUCAUUGACGGGGCAACUUACCCAGAGGCAA(SEQ ID NO: 351)、 (v) AGAAAUCCGUCUUUCAUUGACGGUUUGGCAACUUACCCAGAGG(SEQ ID NO: 352)、 (vi) AGAAAUCCGUCUUUCAUUGACGGCACACCUUAUAGGAAAACCA(SEQ ID NO: 353)、 (vii) AGAAAUCCGUCUUUCAUUGACGGGUAUAUCCCUUCUACAAAUU(SEQ ID NO: 355)、 (viii) AGAAAUCCGUCUUUCAUUGACGGCAGUAAGAUUUGGUGUCUAU(SEQ ID NO: 356)、或 (ix) AGAAAUCCGUCUUUCAUUGACGGCACCACGGCUGUCGUCACCA(SEQ ID NO: 358)。
TW111120920A 2021-06-04 2022-06-06 包含靶向運甲狀腺素蛋白(ttr)的rna指導物的基因編輯系統及其用途 TW202317761A (zh)

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
US202163197036P 2021-06-04 2021-06-04
US63/197,036 2021-06-04
US202163247080P 2021-09-22 2021-09-22
US63/247,080 2021-09-22
US202263321960P 2022-03-21 2022-03-21
US63/321,960 2022-03-21
PCT/US2022/032107 WO2022256619A2 (en) 2021-06-04 2022-06-03 Gene editing systems comprising an rna guide targeting transthyretin (ttr) and uses thereof
WOPCT/US22/32107 2022-06-03

Publications (1)

Publication Number Publication Date
TW202317761A true TW202317761A (zh) 2023-05-01

Family

ID=82492461

Family Applications (1)

Application Number Title Priority Date Filing Date
TW111120920A TW202317761A (zh) 2021-06-04 2022-06-06 包含靶向運甲狀腺素蛋白(ttr)的rna指導物的基因編輯系統及其用途

Country Status (4)

Country Link
US (1) US20220396782A1 (zh)
EP (1) EP4347831A2 (zh)
TW (1) TW202317761A (zh)
WO (1) WO2022256619A2 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114015674A (zh) 2021-11-02 2022-02-08 辉二(上海)生物科技有限公司 新型CRISPR-Cas12i***
WO2023185697A2 (en) * 2022-03-29 2023-10-05 Accuredit Therapeutics (Suzhou) Co., Ltd. Compositions and methods for treatment of transthyretin amyloidosis

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PT3765615T (pt) 2018-03-14 2023-08-28 Arbor Biotechnologies Inc Novas enzimas e sistemas de direcionamento de dna crispr
KR20220004648A (ko) * 2019-03-28 2022-01-11 인텔리아 테라퓨틱스, 인크. Ttr 가이드 rna, 및 rna-가이드 dna 결합제를 암호화하는 폴리뉴클레오티드를 포함하는 조성물 및 방법
IL296791A (en) 2020-03-31 2022-11-01 Arbor Biotechnologies Inc Preparations containing a polypeptide variant of cas12i2 and uses thereof
WO2021257730A2 (en) * 2020-06-16 2021-12-23 Arbor Biotechnologies, Inc. Cells modified by a cas12i polypeptide
CN113308451B (zh) * 2020-12-07 2023-07-25 中国科学院动物研究所 工程化的Cas效应蛋白及其使用方法

Also Published As

Publication number Publication date
WO2022256619A2 (en) 2022-12-08
US20220396782A1 (en) 2022-12-15
WO2022256619A3 (en) 2023-01-05
EP4347831A2 (en) 2024-04-10

Similar Documents

Publication Publication Date Title
TW202317761A (zh) 包含靶向運甲狀腺素蛋白(ttr)的rna指導物的基因編輯系統及其用途
US20230203539A1 (en) Gene editing systems comprising an rna guide targeting stathmin 2 (stmn2) and uses thereof
KR20230107265A (ko) Pdcd1을 표적화하는 rna 가이드를 포함하는 조성물 및 이의 용도
US11821012B2 (en) Gene editing systems comprising an RNA guide targeting hydroxyacid oxidase 1 (HAO1) and uses thereof
US11939607B2 (en) Gene editing systems comprising an RNA guide targeting lactate dehydrogenase a (LDHA) and uses thereof
CN117813382A (zh) 包括靶向stathmin 2(stmn2)的rna向导的基因编辑***和其用途
TW202334421A (zh) 包含靶向ciita之rna引導之組合物及其用途
US20230023791A1 (en) Gene editing systems comprising a crispr nuclease and uses thereof
US20230399639A1 (en) Compositions comprising an rna guide targeting b2m and uses thereof
WO2023018856A1 (en) Gene editing systems comprising an rna guide targeting polypyrimidine tract binding protein 1 (ptbp1) and uses thereof
CN117897485A (zh) 包括靶向羟基酸氧化酶1(hao1)的rna向导的基因编辑***和其用途
WO2023122433A1 (en) Gene editing systems targeting hydroxyacid oxidase 1 (hao1) and lactate dehydrogenase a (ldha)
WO2023137451A1 (en) Compositions comprising an rna guide targeting cd38 and uses thereof
KR20230117116A (ko) Trac를 표적화하는 rna 가이드를 포함하는 조성물 및 이의 용도
JP2023549080A (ja) Bcl11aを標的とするrnaガイドを含む組成物及びその使用
WO2024118747A1 (en) Reverse transcriptase-mediated genetic editing of transthyretin (ttr) and uses thereof
CN116670275A (zh) 包含靶向pdcd1的rna指导物的组合物及其用途
CN116648505A (zh) 包含靶向b2m的rna指导物的组合物及其用途
EP4158020A2 (en) Compositions comprising a cas12i2 polypeptide and uses thereof