TW202330918A - 環形rna及其製備方法 - Google Patents

環形rna及其製備方法 Download PDF

Info

Publication number
TW202330918A
TW202330918A TW111136419A TW111136419A TW202330918A TW 202330918 A TW202330918 A TW 202330918A TW 111136419 A TW111136419 A TW 111136419A TW 111136419 A TW111136419 A TW 111136419A TW 202330918 A TW202330918 A TW 202330918A
Authority
TW
Taiwan
Prior art keywords
residual
seq
circular rna
nucleotide sequence
loop
Prior art date
Application number
TW111136419A
Other languages
English (en)
Inventor
李斯琪
徐弈鋒
劉楚霄
陳玲玲
Original Assignee
中國科學院分子細胞科學卓越創新中心
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 中國科學院分子細胞科學卓越創新中心 filed Critical 中國科學院分子細胞科學卓越創新中心
Publication of TW202330918A publication Critical patent/TW202330918A/zh

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/42Vector systems having a special element relevant for transcription being an intron or intervening sequence for splicing and/or stability of RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/60Vector systems having a special element relevant for transcription from viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2840/00Vectors comprising a special translation-regulating system
    • C12N2840/20Vectors comprising a special translation-regulating system translation of more than one cistron
    • C12N2840/203Vectors comprising a special translation-regulating system translation of more than one cistron having an IRES

Landscapes

  • Genetics & Genomics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本發明涉及生物醫藥領域,具體而言,涉及改進的環形RNA及其製備方法,其中所述改進的環形RNA生成效率高且具有降低的免疫原性。本發明還涉及用於製備所述改進的環形RNA的載體,以及所述改進的環形RNA的用途。

Description

環形RNA及其製備方法
本發明涉及生物醫藥領域,具體而言,涉及改進的環形RNA及其製備方法,其中所述改進的環形RNA生成效率高且具有降低的免疫原性。本發明還涉及用於製備所述改進的環形RNA的載體,以及所述改進的環形RNA的用途。
環形RNA (circular RNA)是真核生物常見的一種RNA類型。天然存在的環形RNA主要是通過細胞內一種稱之為“反向剪接”(back splicing)的分子機制產生。目前已發現真核生物環形RNA具有多種分子細胞調控功能。例如,環形RNA可通過結合微小RNA (microRNA)而調節靶標基因的表現;環形RNA可通過與靶蛋白直接結合進而調節基因表現。
環形RNA由於其環形屬性,使其相對於線性mRNA具有更長的半衰期,因此推測體外合成的環形RNA可能具有較好的穩定性。體外形成環形RNA的方法包括化學法、酶催化法以及核酶催化法等。化學法成本高,可獲得的環形RNA分子大小有限。酶催化法主要是利用T4 RNA連接酶催化線性RNA的環化,其能實現環化的RNA負載大小也有限。核酶催化法(例如基於I類內含子)則是一種有前景的環形RNA製備方法。
天然的I類內含子系統可發生剪切與連接反應形成環形內含子RNA。位於5'端外顯子E1的特定的剪切位點保守序列受游離的三磷酸鳥苷3'羥基的親核攻擊而發生斷裂,產生裸露的3'羥基,而鳥苷酸則結合在斷裂的5'外顯子E1上。其後,內含子5'端的裸露的3'羥基對內含子3'端與外顯子E2的之間的保守序列進行攻擊,將外顯子E2切除,而內含子發生成環反應,得到環形的內含子RNA。目前已報導了一種改良的來自Anabaena tRNA內含子的核酶催化法應用於體外環形RNA的形成,稱為“倒置的I類內含子-外顯子自剪接系統”(Group I permuted intron-exon self-splicing system, PIE系統)。該方法可把內含子切除,形成包含外顯子的環形RNA,因此,該方法具有形成可表現的環形RNA的潛力。PIE系統的基本設計原理是通過分子克隆法將外顯子E1與E2序列首尾相接,形成連續的環形質體。通過限制性內切酶將內含子剪切斷裂,得到線性質體。再通過倒置的3'內含子上游的T7啟動子進行體外轉錄,得到包含3'內含子-E2-E1-5'內含子結構的線狀RNA。與天然的I類內含子系統類似,外顯子E1的特定的剪切位點保守序列受游離的鳥苷酸3'羥基的親核攻擊而發生斷裂,外顯子E1產生裸露的3'羥基,而鳥苷酸則結合在斷裂的5'內含子上。其後,外顯子E1的裸露的3'羥基對3'內含子與外顯子E2之間的保守序列進行攻擊,將3'內含子切除,而外顯子E2與E1發生成環反應,得到環形的E1-E2 RNA。
然而,本領域還需要改進的環形RNA及其製備方法。
在一方面,本發明提供環形RNA前體,其包含從5'至3'方向按以下順序排列的以下元件: a) 3'自剪接內含子片段; b) 第一殘留(residual)成環元件; c) 感興趣的核苷酸序列; d) 第二殘留成環元件;和 e) 5'自剪接內含子片段; 其中所述環形RNA前體能夠通過自剪接生成包含所述第一殘留成環元件、所述感興趣的核苷酸序列和所述第二殘留成環元件的環形RNA。在一些優選的實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約5至大約100個核苷酸。
在一方面,本發明提供用於生成環形RNA分子的核酸載體,所述載體包含本發明所述的環形RNA前體編碼序列。
在另一方面,本發明提供環形RNA,其由本發明所述的環形RNA前體或核酸載體製備。
在另一方面,本發明提供環形RNA,其包含第一殘留成環元件、感興趣的核苷酸序列和第二殘留成環元件。在一些優選的實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約5至大約100個核苷酸。
在另一方面,本發明還提供本發明所述環形RNA前體和/或環形RNA作為表現載體的用途。
在另一方面,本發明提供藥物組合物,其包含本發明所述核酸載體和/或本發明所述環形RNA前體和/或環形RNA,以及藥物可接受的載體。
在另一方面,本發明提供製備環形RNA的方法,所述方法包括: 1) 提供本發明所述的環形RNA前體或從本發明的核酸載體轉錄獲得環形RNA前體; 2) 在存在二價金屬陽離子的情況下,在RNA環化發生的溫度下培育環形RNA前體;和 3) 收穫步驟2)所獲得的環形RNA。
在另一方面,本發明提供製備環形RNA的方法,所述方法包括: a) 提供作為轉錄範本的包含基於自剪接內含子的RNA環化元件的核酸載體;和 b) 在包含二價金屬陽離子和RNA聚合酶的體外轉錄系統中培育所述核酸載體第一時間段,在所述第一時間段期間體外轉錄產生的線性RNA在所述RNA環化元件的作用下自我環化以產生環形RNA。
在一方面,本發明提供純化環形RNA的方法,所述方法包括: a) 使包含環形RNA和未環化的線性環形RNA前體的混合物與環形RNA特異性探針在允許所述環形RNA特異性探針與所述環形RNA特異性結合並形成複合物的條件下接觸; b) 使所述複合物與所述混合物中未與所述環形RNA特異性探針結合的一種或多種組分分離;和 c) 從所述複合物釋放所述環形RNA。
在一方面,本發明提供純化環形RNA的方法,所述方法包括: i) 使包含環形RNA和未環化的線性環形RNA前體的混合物與線性環形RNA前體特異性探針在允許所述線性環形RNA前體特異性探針與所述線性環形RNA前體特異性結合並形成複合物的條件下接觸;和 ii) 從所述混合物去除所述線性環形RNA前體特異性探針與所述線性環形RNA前體形成的複合物, iii) 收集步驟ii)所得的包含環形RNA的混合物,和 視情況,進行多次所述步驟i)-iii),例如2次、3次、4次或更多次。
在一方面,本發明提供純化環形RNA的方法,所述方法包括: i) 向包含環形RNA和線性RNA的混合物中的線性RNA添加線性RNA特異性標籤; ii) 使包含環形RNA和線性RNA的混合物與特異性結合所述標籤的線性RNA探針在允許所述探針與所述線性RNA特異性結合並形成複合物的條件下接觸;和 iii) 從所述混合物去除所述線性RNA探針與線性RNA形成的複合物, iv) 收集步驟ii)所得的包含環形RNA的混合物, 視情況,進行多次所述步驟ii)-iv),例如2次、3次、4次或更多次。
在一方面,本發明提供通過本發明所述的方法生產或純化的環形RNA。
在一方面,本發明提供體外轉錄方法,所述方法包括: a) 提供作為體外轉錄的範本的核酸載體; b) 在包含二價金屬陽離子和RNA聚合酶的體外轉錄系統中培育所述核酸載體,反應第一時間段;和 c) i) 向所述系統添加額外量的金屬陽離子,或ii) 改變所述系統的緩衝液並向所述系統添加金屬陽離子,並培育所述系統,反應第二時間段。
在一方面,本發明提供通過本發明所述的體外轉錄方法產生的RNA。
在本發明中,除非另有說明,否則所使用的科學技術術語是指本領域技術人員普遍理解的含義。此外,本文所使用的有關蛋白質和核苷酸化學、分子生物學、細胞和組織培養、微生物學、免疫學的術語和實驗方法均屬於本領域普遍使用的術語和常規方法。例如,本文所使用的標準DNA重組和分子克隆技術為本領域技術人員所熟知,並在以下參考文獻中詳細描述:Sambrook, J., Fritsch, Efland Maniatis, T., Molecular Cloning: A Laboratory Manual; Cold Spring Harbor Laboratory Press: Cold Spring Harbor, 1989。同時,為了更好地理解本發明,下文提供了相關術語的定義和解釋。
如本文所用,術語“和/或”涵蓋由該術語連接的專案的所有組合,應視作各個組合已經單獨地在本文列出。例如,“A和/或B”涵蓋了“A”、“A和B”以及“B”。例如,“A、B和/或C”涵蓋“A”、“B”、“C”、“A和B”、“A和C”、“B和C”以及“A和B和C”。
“多核苷酸”、“核酸序列”、“核苷酸序列”或“核酸片段”可互換使用,指單鏈或雙鏈RNA或DNA聚合物,視情況可含有合成的、非天然的或改變的核苷酸鹼基。核苷酸(通常以5'-單磷酸形式存在)通過如下它們的單個字母名稱來指代:“A”為腺苷或去氧腺苷(分別對應RNA或DNA),“C”表示胞苷或去氧胞苷,“G”表示鳥苷或去氧鳥苷,“U”表示尿苷,“T”表示去氧胸苷,“R”表示嘌呤(A或G),“Y”表示嘧啶(C或T),“K”表示G或T,“H”表示A或C或T,“I”表示肌苷,並且“N”表示任何核苷酸。儘管本文中的核苷酸序列可能以DNA序列表示(包含T),但在提及RNA時,本領域技術人員可以容易地確定相應的RNA序列(即用U替換T)。
序列“相同性”具有本領域公認的含義,並且可以利用公開的技術計算兩個核酸或多肽分子或區域之間序列相同性的百分比。可以沿著多核苷酸或多肽的全長或者沿著該分子的區域測量序列相同性。(參見,例如:Computational Molecular Biology, Lesk, A.M., ed., Oxford University Press, New York, 1988; Biocomputing: Informatics and Genome Projects, Smith, D.W., ed., Academic Press, New York, 1993; Computer Analysis of Sequence Data, Part I, Griffin, A.M., and Griffin, H.G., eds., Humana Press, New Jersey, 1994; Sequence Analysis in Molecular Biology, von Heinje, G., Academic Press, 1987; and Sequence Analysis Primer, Gribskov, M. and Devereux, J., eds., M Stockton Press, New York, 1991)。許多方法可用於確定序列相同性。適合於確定序列相同性百分比的演算法的一個實例是在基本局部比對搜索工具(以下為“BLAST”)中使用的演算法,見例如Altschul等人,J. Mol. Biol. 215:403-410, 1990和Altschul等人,Nucleic Acids Res., 15:3389-3402, 1997。進行BLAST分析的軟體是通過國家生物技術資訊中心(以下為“NCBI”)公開可獲得的。在使用從NCBI可獲得的軟體(如針對核酸序列的BLASTN)來確定序列相同性所使用的默認參數在McGinnis等人Nucleic Acids Res., 32:W20-W25, 2004中有所描述。
I. 環形 RNA 、前體和載體
在一方面,本發明提供環形RNA前體,其包含從5'至3'方向按以下順序排列的以下元件: a) 3'自剪接內含子片段; b) 第一殘留成環元件; c) 感興趣的核苷酸序列; d) 第二殘留成環元件;和 e) 5'自剪接內含子片段; 其中所述環形RNA前體能夠通過自剪接生成包含所述第一殘留成環元件、所述感興趣的核苷酸序列和所述第二殘留成環元件的環形RNA。
本文的“環形RNA前體”是指能夠形成共價連接的閉合環形RNA分子的線性RNA分子,如通過自剪接。環形RNA前體可由包含環形RNA前體編碼序列的核酸載體轉錄產生。或者,環形RNA前體也可以通過化學合成得到。
在一些實施方案中,環形RNA前體在自剪接內含子片段和殘留成環元件的作用下,通過自剪接能夠形成共價連接的閉合環形RNA分子。
如本文所用,術語“自剪接內含子”是指具有自剪接核酶活性,能夠將自身切除並使側翼兩個外顯子連接起來的內含子。在一些實施方案中,所述剪接是自催化剪接(autocatalytic splicing)。
“自剪接內含子”包括但不限於I類內含子和II類內含子。I類內含子包含14個亞類,而大部分I類內含子屬於IC3亞類。例如,所述I類內含子可以是屬於IC3亞類的藍藻魚腥藻屬(Anabaena) I類內含子或來自屬於IA2亞類的T4噬菌體I類內含子或來自屬於IC3亞類的Azoarcus sp. BH72 I類內含子。額外的可用於本發明的自剪接內含子的實例包括但不限於衍生自以下生物體的自剪接內含子:Enterobacteriophage T4, Bacteriophage Twort, Bacteriophage SPO1, Bacteriophage S3b, Bacillus anthracis, Clostridium botulinum, Tetrahymena thermophila, Dunaliella parva, Pneumocystis carinii, Physarum polycephalum, Anabaena sp. PCC7120, Scytonema hofmanni, Agrobacterium tumefaciens, Synechocystis PCC 6803, Synechococcus elongatus PCC 6301, Neurospora crassa, Candida albicans, Scytalidium dimidiatum, Saccharomyces cerevisiae, Pediastrum biradiatum, Chlamydomonas nivalis, Chlorella vulgaris, Amoebidium parasiticum, Neurospora crassa, Emericella nidulans, Saccharomyces cerevisiae, Schizosaccharomyces pombe, Neochloris aquatica, Dunaliella parva, Symkania negevensis, Emericella nidulans。參見例如Vicens, Q., et al., (2008). Toward predicting self-splicing and protein-facilitated splicing of group I introns. RNA 14: 2013-2029; Tanner, A. M., et al., (1996). Activity and thermostability of thr small self-splicing group I intron in the pre-tRNAIIe of the purple bacterium Azoarcus. RNA 2:74-83。
在一些實施方案中,所述3'自剪接內含子片段和所述5'自剪接內含子片段衍生自相同自剪接內含子。在一些實施方案中,所述3'自剪接內含子片段衍生自或包含自剪接內含子(天然的自剪接內含子)的3'端部分,並且相應地所述5'自剪接內含子片段衍生自或包含自剪接內含子(天然的自剪接內含子)的5'端部分。在一些實施方案中,所述3'自剪接內含子片段和所述5'自剪接內含子片段組合保留自剪接內含子(天然的自剪接內含子)的自剪接活性。
在一些實施方案中,所述3'自剪接內含子片段衍生自天然自剪接內含子的3'端部分,即從內部分割位點到天然自剪接內含子的3'末端的部分,並且相應地所述5'自剪接內含子片段衍生自天然自剪接內含子的5'端部分,即從內部分割位點到天然自剪接內含子的5'末端的部分,並且,所述3'自剪接內含子片段和所述5'自剪接內含子片段組合保留天然自剪接內含子的自剪接活性。
在一些實施方案中,所述自剪接內含子是I類內含子。在一些實施方案中,所述自剪接內含子是IA2或IC3亞類的I類內含子,優選地是IC3亞類。
在一些實施方案中,所述3'自剪接內含子片段是3' I類內含子片段。在一些實施方案中,所述5'自剪接內含子片段是5' I類內含子片段。
如本文所用,3'自剪接內含子片段(例如,3' I類內含子片段)是與天然自剪接內含子(例如,I類內含子)的3'端部分至少75%,例如,至少80%,至少85%,至少90%,至少95%,100%相同的序列。5'自剪接內含子片段(例如,5' I類內含子片段)是與天然自剪接內含子(例如,I類內含子)的5'端部分至少75%,例如,至少80%,至少85%,至少90%,至少95%,100%相同的序列。
通常認為,為了實現環化,所述天然I類內含子需要從內部 位點分割開,形成所謂的“倒置的I類內含子-外顯子自剪切系統”(Group I permuted intron-exon self-splicing system, PIE系統)。選擇內部分割位點以產生天然I類內含子的兩個獨立部分(3'端部分和5'端部分),它們一起可以維持自剪接所需的核酶活性,即使在倒置之後也是如此。據認為維持了天然I類內含子整體構形的天然I類內含子的兩個獨立部分,可以維持自剪接所需的核酶活性。在一些實施方案中,所述天然I類內含子的3'端部分是從內部分割位點到天然I類內含子的3'末端的部分,相應地,所述天然I類內含子的5'端部分是從內部分割位點到天然I類內含子的5'末端的部分。
I類內含子的內部分割位點是本領域技術人員可以確定的,例如可以參考以下文獻確定:Puttaraju M., et al., (1992). Group I permuted intron-exon (PIE) sequences self-splice to produce circular exons; Puttaraju M., et al., (1996). Cirular ribozymes generated in Escherichia coli using group I self-splicing permuted intron-exson sequences。例如,對於I類內含子,特別地對於Anabaena I類內含子,通常可以在其P6區域內的特定位點分割開形成PIE系統。因此,在一些實施方案中,天然I類內含子(例如,Anabaena I類內含子)的3'端部分是從天然I類內含子(例如,Anabaena I類內含子)的P6區域內的特定位點至3'末端的部分。在一些實施方案中,所述天然I類內含子(例如,Anabaena I類內含子)的5'端部分是從天然I類內含子(例如,Anabaena I類內含子)的P6區域內的特定位點至5'末端的部分。對於I類內含子,特別地對於Anabaena I類內含子,分割位點也可以位於其P2、P5、P8或P9區域內以形成PIE系統,如WO2021236855A1所示。對於Ⅱ類內含子,分割位點可以位於其D4區域內,見例如:Roth A.等人,Natural circularly permuted group II introns I bacteria produce RNA circles, 2021;Pyle M. A.等人,Group II intron self-splicing, 2016。
天然I類內含子的3'端部分的長度可能為天然I類內含子全長的大約5%至95%,例如大約5%、大約10%、大約20%、大約30%、大約40%、大約50%、大約60%、大約70%、大約80%、大約90%、大約95%。相應地,天然I類內含子的5'端部分的長度可能為天然I類內含子全長的大約5%-90%,例如大約5%、大約10%、大約20%、大約30%、大約40%、大約50%、大約60%、大約70%、大約80%、大約90%、大約95%。
在一些實施方案中,所述3' I類內含子片段和5' I類內含子片段的組合基本上具有相應的天然I類內含子的自剪接活性。
在一些實施方案中,所述自剪接內含子是藍藻魚腥藻屬的I類內含子,例如,藍藻魚腥藻屬pre-tRNA-Leu基因的I類內含子。相應地,在一些實施方案中,所述3'自剪接內含子片段(3' I類內含子片段)和5'自剪接內含子片段(5' I類內含子片段)衍生自藍藻魚腥藻屬的I類內含子,例如,藍藻魚腥藻屬pre-tRNA-Leu基因的I類內含子。在一些實施方案中,所述藍藻魚腥藻屬pre-tRNA-Leu基因的天然I類內含子具有SEQ ID NO:136的核苷酸序列。P6區域對應於SEQ ID NO:136的第98位到第157位。分割位點可以是SEQ ID NO:136的第122位到第138位之間的任何位置。
在一些實施方案中,所述3'自剪接內含子片段(3' I類內含子片段)衍生自藍藻魚腥藻屬pre-tRNA-Leu基因的I類內含子,並且包含SEQ ID NO:1的核苷酸序列或與SEQ ID NO:1具有至少75%,例如,至少80%、至少85%、至少90%、至少95%、100%相同性的核苷酸序列,或由其組成。在一些實施方案中,所述5'自剪接內含子片段(5' I類內含子片段)衍生自藍藻魚腥藻屬pre-tRNA-Leu基因的I類內含子,並且包含SEQ ID NO:2的核苷酸序列或與SEQ ID NO:2具有至少75%,例如,至少80%、至少85%、至少90%、至少95%、100%相同性的核苷酸序列,或由其組成。
在一些實施方案中,所述自剪接內含子是T4噬菌體的I類內含子,例如,T4噬菌體td基因的I類內含子。相應地,在一些實施方案中,所述3'自剪接內含子片段(3' I類內含子片段)和5'自剪接內含子片段(5' I類內含子片段)衍生自T4噬菌體的I類內含子,例如,T4噬菌體td基因的I類內含子。在一些實施方案中,所述T4噬菌體td基因的天然I類內含子具有SEQ ID NO:149的核苷酸序列。P6區域對應於SEQ ID NO:149的第100位到第246位。分割位點可以是SEQ ID NO:149的第109位到第125位之間的任何位置。
在一些實施方案中,所述3'自剪接內含子片段(3' I類內含子片段)衍生自T4噬菌體td基因的I類內含子,並且包含SEQ ID NO:5的核苷酸序列或與SEQ ID NO:5具有至少75%,例如,至少80%、至少85%、至少90%、至少95%、100%相同性的核苷酸序列,或由其組成。在一些實施方案中,所述5'自剪接內含子片段(5' I類內含子片段)衍生自T4噬菌體td基因的I類內含子,並且包含SEQ ID NO:6的核苷酸序列或與SEQ ID NO:6具有至少75%,例如,至少80%、至少85%、至少90%、至少95%、100%相同性的核苷酸序列,或由其組成。
在一些實施方案中,所述自剪接內含子可以是Azoarcus sp. BH72的I類內含子,例如,Azoarcus sp. BH72 pre-tRNA-Ile基因的I類內含子。相應地,在一些實施方案中,所述3'自剪接內含子片段(3' I類內含子片段)和5'自剪接內含子片段(5' I類內含子片段)衍生自Azoarcus sp. BH72的I類內含子,例如,Azoarcus sp. BH72 pre-tRNA-Ile基因的I類內含子。在一些實施方案中,所述Azoarcus sp. BH72 pre-tRNA-Ile基因的天然I類內含子具有SEQ ID NO:137的核苷酸序列。P6區域對應於SEQ ID NO:137的第108位到第138位。分割位點可以是SEQ ID NO:137的第121位到第125位之間的任何位置。
在一些實施方案中,所述3'自剪接內含子片段(3' I類內含子片段)衍生自Azoarcus sp. BH72 pre-tRNA-Ile基因的I類內含子,並且包含SEQ ID NO:3的核苷酸序列或與SEQ ID NO:3具有至少75%,例如,至少80%、至少85%、至少90%、至少95%、100%相同性的核苷酸序列,或由其組成。在一些實施方案中,所述5'自剪接內含子片段(5' I類內含子片段)衍生自Azoarcus sp. BH72 pre-tRNA-Ile基因的I類內含子,並且包含SEQ ID NO:4的核苷酸序列或與SEQ ID NO:4具有至少75%,例如,至少80%、至少85%、至少90%、至少95%、100%相同性的核苷酸序列,或由其組成。
如本文所用,“殘留成環元件”是指通過自剪接內含子參與成環或為成環所需並且與自剪接內含子一起參與成環但是被保留在最終環形RNA中的序列。本文的“殘留成環元件”也可稱為“環內成環元件(intra-circle circularizing element)”。
本發明人令人驚奇地發現,利用自剪接內含子進行RNA環化時,其在環形RNA中導入的額外的成環元件會增加環形RNA分子的免疫原性,而對該部分保留在環形RNA中的元件(殘留成環元件)進行截短及突變後,既能保留甚至提高環化效率,也能顯著降低環形RNA的免疫原性,這對於環形RNA作為藥物或藥物載體的潛在應用有重要意義。
在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度不大於大約500個核苷酸,例如不大於大約500個、大約400個、大約300個、大約200個、大約100個、大約90個、大約80個、大約70個、大約60個、大約50個、大約40個、大約30個、大約20個、大約15個、大約10個、大約5個核苷酸。
在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約2至大約500個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約2至大約400個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約2至大約300個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約2至大約200個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約2至大約100個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約2至大約90個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約2至大約80個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約2至大約70個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約2至大約60個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約2至大約50個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約2至大約40個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約2至大約30個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約2至大約20個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約2至大約15個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約2至大約10個核苷酸,或其間任何整數個核苷酸。
在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為至少5個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為至少10個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為至少15個核苷酸。
在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約5至大約100個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約10至大約100個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約15至大約100個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約15至大約30個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約20至大約35個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約25至大約40個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約30至大約45個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約35至大約50個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約40至大約55個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約45至大約60個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約50至大約65個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約55至大約70個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約60至大約75個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約65至大約80個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約70至大約85個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約75至大約90個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約80至大約95個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約85至大約100個核苷酸,或其間任何整數個核苷酸。
在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、200、300、400、500個核苷酸。
在一些實施方案中,所述第一殘留成環元件和第二殘留成環元件使得包含其的環形RNA,相對於包含SEQ ID NO:29和SEQ ID NO:64的殘留成環元件(Ana3.0,殘留成環元件總長度為176個核苷酸)的對照環形RNA具有降低的免疫原性。
在一些實施方案中,所述第一殘留成環元件和第二殘留成環元件使得包含其的環形RNA,相對於對照線性RNA具有降低的免疫原性,例如,包含相同感興趣的核苷酸序列但沒有化學修飾的核苷酸的對應線性RNA。
如本文所用,“降低的免疫原性”可以指環形RNA與細胞接觸後引起的免疫反應降低,即免疫反應水準低於對照環形RNA或對照線性RNA。例如,降低的免疫反應指降低的細胞因數表現。所述細胞因數包括但不限於IFNβ,TNFα,IL6和/或RIG-I。在一些實施方案中,所述環形RNA的免疫原性降低至少大約10%、至少大約20%、至少大約30%、至少大約40%、至少大約50%、至少大約60%、至少大約70%、至少大約80%、至少大約90%或更多。降低的免疫原性可以通過本領域所熟知的方法來確定,例如在本發明實施例10中描述的方法。
在一些實施方案中,所述第一殘留成環元件和第二殘留成環元件使得包含其的環形RNA或環形RNA前體,相對於包含SEQ ID NO:29和SEQ ID NO:64的殘留成環元件(Ana3.0)的環形RNA或環形RNA前體具有相當的或增加的成環效率。
如本文所用,“成環效率”可以指在給定的時間段內,輸出的環形RNA與輸入前體的比值。或者,本文使用的“成環效率”可以指在給定的時間段內,最終產物中所需的環形RNA與線性RNA的比值。成環效率可以通過本領域所熟知的方法來確定,例如在本發明實施例17、19、20中描述的方法。
在一些實施方案中,所述環形RNA的成環效率增加至少大約10%、至少大約20%、至少大約30%、至少大約40%、至少大約50%、至少大約60%、至少大約70%、至少大約80%、至少大約90%、至少大約100%、至少大約200%、至少大約300%、至少大約400%、至少大約500%或更多。
在一些實施方案中,所述第一殘留成環元件包含從5'到3'方向的3'外顯子區域和可選的第一間隔子(spacer),或由其組成。在所述環形RNA前體中,3'外顯子區域的5'末端直接連接到3'自剪接內含子片段的3'末端。
如本文所用,所述殘留成環元件中的“外顯子區域”是衍生於自剪接內含子的天然外顯子(自剪接內含子側翼的外顯子)的序列,並且能夠被自剪接內含子(或第一自剪接內含子片段和第二自剪接內含子片段的結合)識別和/或剪接,並且因此是環化所必需的。本文中的“外顯子區域”也可以被稱為“剪接位點序列”。
在一些實施方案中,所述3'外顯子區域衍生自所述自剪接內含子的天然3'外顯子(所述自剪接內含子3'末端側翼(下游)的外顯子)或其從5'端核苷酸開始的連續片段。
在一些實施方案中,所述3'外顯子區域是所述自剪接內含子的全部天然3'外顯子,或與所述自剪接內含子的全部天然3'外顯子具有至少50%、至少60%、至少70%、至少80%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少99%或至少99%序列相同性,或與所述自剪接內含子的全部天然3'外顯子相比具有1、2、3、4、5、6、7、8、9或10個或更多個的核苷酸取代、缺失或添加。
在一些實施方案中,所述3'外顯子區域是從天然3'外顯子的5'端核苷酸開始的連續片段。在一些實施方案中,3'外顯子區域與從天然3'外顯子的5'端核苷酸開始的連續片段具有至少50%、至少60%、至少70%、至少80%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性。在一些實施方案中,3'外顯子區域與從天然3'外顯子的5'端核苷酸開始的連續片段相比具有1、2、3、4、5、6、7、8、9或10個或更多個的核苷酸取代、缺失或添加。
在一些實施方案中,所述從天然3'外顯子的5'端核苷酸開始的連續片段包含天然3'外顯子的至少1%、至少5%、至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%的核苷酸或由其組成。在一些實施方案中,所述從天然3'外顯子的5'端核苷酸開始的連續片段的長度為至少1個核苷酸,如至少2個、至少3個、至少4個、至少5個、至少6個、至少7個、至少8個、至少9個、至少10個、至少15個、至少20個、至少25個、至少50個或更多個核苷酸。在一些實施方案中,所述從天然3'外顯子的5'端核苷酸開始的連續片段的長度為1個核苷酸或最多2個、最多3個、最多4個、最多5個、最多6個、最多7個、最多8個、最多9個、最多10個、最多15個、最多20個、最多25個、最多50個核苷酸或最多為天然3'外顯子的全長。
在一些實施方案中,其中所述自剪接內含子是I類內含子,3'外顯子區域至少在其5'端包含一個序列(例如約1至約20個核苷酸的序列),該序列可以與相應I類內含子的P1區域配對形成P10雙鏈區。
據認為,對於I類內含子的自剪接,所述天然3'外顯子的5'端起的連續一個或多個核苷酸(例如至少約1-約7個核苷酸)可以與P1區域配對形成P10雙鏈區,因而在自剪接中其重要作用。I類內含子的P1區和P10區的定義是本領域已知的,例如可參考以下文獻確定:Burke, J. M., et al., (1987). Structural conventions for group I introns; Stahley, R. M., et al (2006). RNA splicing: group I intron crystal structures reveal the basis of splice site selection and metal ion catalysis; Woodson, A. S., (2005). Structure and assembly of group I introns。
在一些實施方案中,所述第二殘留成環元件包含從3'到5'方向的5'外顯子區域和可選的第二間隔子,或由其組成。在環形RNA前體中,5'外顯子區域的3'末端直接連接到第二自剪接內含子片段的5'末端。
在一些實施方案中,所述5’外顯子區域衍生自所述自剪接內含子的天然5’外顯子(所述自剪接內含子5’端側翼(下游)的外顯子)或其從3'端核苷酸開始的連續片段。
在一些實施方案中,所述5'外顯子區域是所述自剪接內含子的全部天然5'外顯子,或與所述I類內含子的全部天然5'外顯子具有至少50%、至少60%、至少70%、至少80%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少99%或至少99%序列相同性,或與所述自剪接內含子的全部天然5'外顯子相比具有1、2、3、4、5、6、7、8、9或10個或更多個的核苷酸取代、缺失或添加。
在一些實施方案中,所述5'外顯子區域是從天然5'外顯子的3'端核苷酸開始的連續片段。在一些實施方案中,5'外顯子區域與從天然5'外顯子的3'端核苷酸開始的連續片段具有至少50%、至少60%、至少70%、至少80%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性。在一些實施方案中,5'外顯子區域與從天然5'外顯子的3'端核苷酸開始的連續片段相比具有1、2、3、4、5、6、7、8、9或10個或更多個的核苷酸取代、缺失或添加。
在一些實施方案中,所述從天然5'外顯子的3'端核苷酸開始的連續片段包含天然5'外顯子的至少1%、至少5%、至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%的核苷酸或由其組成。在一些實施方案中,所述從天然5'外顯子的3'端核苷酸開始的連續片段的長度為至少1個核苷酸,如至少2個、至少3個、至少4個、至少5個、至少6個、至少7個、至少8個、至少9個、至少10個、至少15個、至少20個、至少25個、至少50個或更多個核苷酸。在一些實施方案中,所述從天然5'外顯子的3'端核苷酸開始的連續片段的長度為1個核苷酸或最多2個、最多3個、最多4個、最多5個、最多6個、最多7個、最多8個、最多9個、最多10個、最多15個、最多20個、最多25個、最多50個核苷酸或最多為天然5'外顯子的全長。
在一些實施方案中,其中所述自剪接內含子是I類內含子,5'外顯子區域在其3'端包含一個序列(例如,約3至約8個連續的核苷酸的序列),該序列可以與相應I類內含子的內在導向序列(internal guide sequence, IGS)配對形成P1雙鏈區。
據認為,對於I類內含子的自剪接,所述天然5'外顯子的3'端起的連續約3個至約8個核苷酸可以與內在導向序列(internal guide sequence, IGS)配對形成P1雙鏈區,因而在自剪接中其重要作用。I類內含子的IGS和/或P1區定義是本領域已知的,例如可參考以下文獻確定:Burke, J. M., et al., (1987). Structural conventions for group I introns; Stahley, R. M., et al (2006). RNA splicing: group I intron crystal structures reveal the basis of splice site selection and metal ion catalysis; Woodson, A. S., (2005). Structure and assembly of group I introns。
在一些實施方案中,所述3'外顯子區域衍生自魚腥藻屬pre-tRNA-Leu基因的I類內含子的3'天然外顯子。所述魚腥藻屬pre-tRNA-Leu基因的I類內含子的3'天然外顯子包含SEQ ID NO:7的核苷酸序列。在一些實施方案中,所述5'外顯子區域衍生自魚腥藻屬pre-tRNA-Leu基因的I類內含子的5'天然外顯子。所述魚腥藻屬pre-tRNA-Leu基因的I類內含子的5'天然外顯子包含SEQ ID NO:8的核苷酸序列。
在一些實施方案中,所述3'外顯子區域衍生自T4噬菌體td基因的I類內含子的3'天然外顯子。所述T4噬菌體td基因的I類內含子的3'天然外顯子包含SEQ ID NO:11的核苷酸序列。在一些實施方案中,所述5'外顯子區域衍生自T4噬菌體td基因的I類內含子的5'天然外顯子。所述T4噬菌體td基因的I類內含子的5'天然外顯子包含SEQ ID NO:12的核苷酸序列。
在一些實施方案中,所述3'外顯子區域衍生自Azoarcus sp. BH72 pre-tRNA-Ile基因的I類內含子的3'天然外顯子。所述Azoarcus sp. BH72 pre-tRNA-Ile基因的I類內含子的3'天然外顯子包含SEQ ID NO:9的核苷酸序列。在一些實施方案中,所述5'外顯子區域衍生自Azoarcus sp. BH72 pre-tRNA-Ile基因的I類內含子的5'天然外顯子。所述Azoarcus sp. BH72 pre-tRNA-Ile基因的I類內含子的5'天然外顯子包含SEQ ID NO:10的核苷酸序列。
在環形RNA前體的環化過程中,3'自剪接內含子片段(例如,3' I類內含子片段)及其5'末端上游的序列(如存在),和5'自剪接內含子片段(例如,5' I類內含子片段)及其3'末端下游的序列(如存在)均被切除,並且第一殘留成環元件的5'末端和第二殘留成環元件的3'末端共價連接,實現RNA的環化。
在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件包含不同的間隔子序列,或者其中之一包含間隔子序列而另一個不包含間隔子序列。
如本文所用,“間隔子”是指至少不負面干預相連元件功能的任何連續的核苷酸序列。通常,如果需要避免兩相近或相鄰元件的相互影響,則可以在該兩元件之間***間隔子。本文所述的間隔子序列可具有兩個功能:(1)促進環化和(2)通過允許殘留成環元件和感興趣的核苷酸序列(如IRES)的正確折疊來促進功能性。在一些實施方案中,間隔子長度為不超過150個、不超過100個、不超過50個、不超過30個、不超過10個、不超過5個或不超過3個核苷酸。在一些實施方案中,間隔子長度為5個核苷酸。在一些實施方案中,間隔子長度為4個核苷酸。在一些實施方案中,間隔子長度為3個核苷酸。在一些實施方案中,第一間隔子可以不存在。在一些實施方案中,第二間隔子可以不存在。在一些實施方案中,第一間隔子和第二間隔子都可以不存在。
在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件被設置為能夠形成莖環(stem-loop)結構。在一些實施方案中,剪接位點(splicing junction)包含在所述莖環結構的環(loop)中。
在一些實施方案中,通過參與環化的所述3'自剪接內含子片段(例如,3' I類內含子片段)、所述第一殘留成環元件、所述第二殘留成環元件和所述5'自剪接內含子片段(例如,5' I類內含子片段)的核苷酸序列預測和/或確定所述莖環結構的存在。在一些實施方案中,通過RNA結構預測工具例如RNAfold (http://rna.tbi.univie.ac.at/cgi-bin/RNAWebSuite/RNAfold.cgi)或者RNAstructure (https://rna.urmc.rochester.edu/RNAstructureWeb/index.html)根據所述核苷酸序列預測和/或確定莖環結構的存在。通過參考實施例3和圖10中描述的方法,可以預測和/或確定莖環結構的存在。
在一些實施方案中,所述第一殘留成環元件包含下式所述序列結構:5'-第一環(loop)序列-第一配對序列-第一非配對序列-3';且,所述第二殘留成環元件包含下式所述序列結構:5'-第二非配對序列-第二配對序列-第二環(loop)序列-3', 其中所述第一非配對序列或第二非配對序列可以獨立地存在或不存在, 其中所述第一配對序列和所述第二配對序列可互補配對形成所述莖環結構的莖,其中第一環序列和第二環序列可形成所述莖環結構的環,例如,通過進行環化的自剪接。
通常而言,形成所述莖環結構的環的序列衍生自所述3'外顯子區或5'外顯子區。
在一些實施方案中,其中所述自剪接內含子是I類內含子,所述第一環序列包含一個或多個核苷酸(例如,約1至約20個核苷酸)或由其組成,這些核苷酸可以與相應I類內含子的P1區域(或由3'自剪接內含子片段和5'自剪接內含子片段組成的結構)配對,在環化過程中形成P10雙鏈區。
在一些實施方案中,所述第一環序列可以包含(N)n核苷酸序列或由其組成,其中N表示任何核苷酸(A、G、U或C),n表示1-20之間的整數,例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20。在一些特定的實施方案中,n是2、4或5。
在一些實施方案中,所述第一環序列包含從I類內含子的天然3'外顯子5'端核苷酸開始的約1-約7個連續核苷酸或由其組成。 在一些實施方案中,所述第一環序列例如包含AAAA、AA、UUUU、CAAA或GAAA或由其組成。
在一些實施方案中,其中所述自剪接內含子是I類內含子,所述第二環序列包含一個或多個核苷酸(例如,約3至約8個核苷酸)或由其組成,這些核苷酸可以與相應I類內含子的導向序列(internal guide sequence, IGS) (或由3'自剪接內含子片段和5'自剪接內含子片段組成的結構)配對,在環化過程中形成P1雙鏈區。
在一些實施方案中,所述第二環序列包含從I類內含子的天然5'外顯子3'端核苷酸開始的約3-約8個連續核苷酸或由其組成。
在一些實施方案中,所述第二環序列例如包含CUU或CUC或由其組成。
在一些特定的實施方案中,可以在環化後形成具有CUUAAAA、CUUUUUU、CUUAA、CUUGAAA、CUUUAAA、CUUCAAA或CUCAAAA序列的環。
在一些實施方案中,所述第一環序列包含AAAA或由其組成,並且所述第二環序列包含CUU或由其組成。在一些特定的實施方案中,可以在環化後形成具有CUUAAAA序列的環。
形成所述莖環結構的莖的所述配對序列可以來自所述外顯子區域,然而,其也可以是來自所述間隔子序列。或者所述配對序列可以來自外顯子區域和間隔子序列,即所述配對序列包含外顯子區域的至少一部分和所述間隔子的至少一部分。
不受任何理論限制,基於內含子自剪接(例如,I類內含子自剪接)的RNA環化效率與殘留成環元件形成的莖環結構中的莖部分的鹼基對數目或鹼基對類型或組成相關。莖環結構的穩定性(例如可以通過計算的自由能預測)可能影響環化效率。
在一些實施方案中,所述莖環結構中的莖部分包含至少2個鹼基對,例如至少3個、至少4個、至少5個、至少6個、至少7個、至少8個、至少9個、至少10個、至少11個、至少12個、至少13個、至少14個、至少15個或更多個鹼基對,優選連續的鹼基對。在一些實施方案中,所述莖環結構中的莖部分包含2-15個或更多個連續鹼基對。在一些實施方案中,所述莖環結構中的莖部分包含3-15個或更多個連續鹼基對。在一些實施方案中,所述莖環結構中的莖部分包含4-15個或更多個連續鹼基對。在一些實施方案中,所述莖環結構中的莖部分包含5-15個或更多個連續鹼基對。在一些實施方案中,所述莖環結構中的莖部分包含6-15個或更多個連續鹼基對。在一些實施方案中,所述莖環結構中的莖部分包含7-15個或更多個連續鹼基對。在一些實施方案中,所述莖環結構中的莖部分包含8-15個或更多個連續鹼基對。在一些實施方案中,所述莖環結構中的莖部分包含9-15個或更多個連續鹼基對。在一些實施方案中,所述莖環結構中的莖部分包含10-15個或更多個連續鹼基對。在一些實施方案中,所述莖環結構中的莖部分包含11-15個或更多個連續鹼基對。在一些實施方案中,所述莖環結構中的莖部分包含12-15個或更多個連續鹼基對。在一些實施方案中,所述莖環結構中的莖部分包含13-15個或更多個連續鹼基對。在一些實施方案中,所述莖環結構中的莖部分包含14-15個或更多個連續鹼基對。在一些實施方案中,所述莖環結構中的莖部分包含2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個或15個鹼基對,優選連續的鹼基對。在一些實施方案中,所述莖環結構中的莖部分包含5個鹼基對,優選連續的鹼基對。在一些實施方案中,所述莖環結構中的莖部分包含6個鹼基對,優選連續的鹼基對。在一些實施方案中,所述莖環結構中的莖部分包含7個鹼基對,優選連續的鹼基對。
在一些實施方案中,所述莖環結構中的莖部分包含至多2個鹼基錯配,或者至多1個鹼基錯配,優選地,所述莖部分不包含鹼基錯配。
在一些實施方案中,其中所述莖環結構的經預測的自由能小於大約-1 kal/mol,小於大約-2 kal/mol,小於大約-3 kal/mol,小於大約-4 kal/mol,小於大約-5 kal/mol,小於大約-6 kal/mol,小於大約-7 kal/mol,小於大約-8 kal/mol,小於大約-9 kal/mol,小於大約-10 kal/mol,或更小。在一些實施方案中,其中所述莖環結構的經預測的自由能為約-1 kal/mol至約-10 kal/mol。在一些實施方案中,其中所述莖環結構的經預測的自由能為約-2 kal/mol至約-10 kal/mol。在一些實施方案中,其中所述莖環結構的經預測的自由能為約-3 kal/mol至約-10 kal/mol。在一些實施方案中,其中所述莖環結構的經預測的自由能為約-4 kal/mol至約-10 kal/mol。在一些實施方案中,其中所述莖環結構的經預測的自由能為約-5 kal/mol至約-10 kal/mol。在一些實施方案中,其中所述莖環結構的經預測的自由能為約-6 kal/mol至約-10 kal/mol。在一些實施方案中,其中所述莖環結構的經預測的自由能為約-7 kal/mol至約-10 kal/mol。在一些實施方案中,其中所述莖環結構的經預測的自由能為約-8 kal/mol至約-10 kal/mol。在一些實施方案中,其中所述莖環結構的經預測的自由能為約-9 kal/mol至約-10 kal/mol。所述自由能例如可以通過RNAfold (http://rna.tbi.univie.ac.at/cgi-bin/RNAWebSuite/RNAfold.cgi)或者RNAstructure (https://rna.urmc.rochester.edu/RNAstructureWeb/ index.html)結構預測工具確定。
在一些實施方案中,所述第一配對序列僅包含G,所述第二配對序列僅包含C。在一些實施方案中,所述第一配對序列僅包含C,所述第二配對序列僅包含G。在一些實施方案中,所述第一配對序列僅包括A,所述第二配對序列僅包括U。
在一些實施方案中,所述第一配對序列包含SEQ ID NO:42至55中的任一序列或由其組成。
在一些實施方案中,所述第一殘留成環元件包含與選自SEQ ID NO:13至55之一的核苷酸序列具有至少50%,至少60%,至少70%,至少80%,至少90%,至少95%或100%序列相同性的核苷酸序列或由其組成。在一些實施方案中,所述第一殘留成環元件包含選自SEQ ID NO:13至55之一的核苷酸序列或由其組成。
在一些實施方案中,所述第二配對序列包含SEQ ID NO:78-93中的任一序列或由其組成。
在一些實施方案中,所述第二殘留成環元件包含與選自SEQ ID NO:56-93之一的核苷酸序列具有至少50%,至少60%,至少70%,至少80%,至少90%,至少95%或100%序列相同性的核苷酸序列或由其組成。在一些實施方案中,所述第二殘留成環元件包含選自SEQ ID NO:56-93之一的核苷酸序列或由其組成。
在一些實施方案中,所述第一殘留成環元件包含SEQ ID NO:13-55中的任一核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56-93中的任一核苷酸序列或由其組成。
在一些實施方案中,所述第一殘留成環元件包含SEQ ID NO:15的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:57的核苷酸序列或由其組成。
在一些實施方案中,所述第一殘留成環元件包含SEQ ID NO:14的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:58的核苷酸序列或由其組成。
在一些實施方案中,所述第一殘留成環元件包含SEQ ID NO:18的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:59的核苷酸序列或由其組成。
在一些實施方案中,所述第一殘留成環元件包含SEQ ID NO:19的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:60的核苷酸序列或由其組成。
在一些實施方案中,所述第一殘留成環元件包含SEQ ID NO:20的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:61的核苷酸序列或由其組成。
在一些實施方案中,所述第一殘留成環元件包含SEQ ID NO:21的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:62的核苷酸序列或由其組成。
在一些實施方案中,所述第一殘留成環元件包含SEQ ID NO:23的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成。
在一些實施方案中,所述第一殘留成環元件包含SEQ ID NO:24的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成。
在一些實施方案中,所述第一殘留成環元件包含SEQ ID NO:26的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成。
在一些實施方案中,所述第一殘留成環元件包含SEQ ID NO:27的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成。
在一些實施方案中,所述第一殘留成環元件包含SEQ ID NO:28的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成。
在一些實施方案中,所述第一殘留成環元件包含SEQ ID NO:13的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:67的核苷酸序列或由其組成。
在一些實施方案中,所述第一殘留成環元件包含SEQ ID NO:13的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:59的核苷酸序列或由其組成。
在一些實施方案中,所述第一殘留成環元件包含SEQ ID NO:13的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成。
在一些實施方案中,所述第一殘留成環元件包含SEQ ID NO:17的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:59的核苷酸序列或由其組成。
在一些實施方案中,所述第一殘留成環元件包含SEQ ID NO:22的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:63的核苷酸序列或由其組成。
在一些實施方案中,所述3'自剪接內含子片段(3' I類內含子片段)衍生自魚腥藻屬pre-tRNA-Leu基因的I類內含子,並且包含SEQ ID NO:1的核苷酸序列或與SEQ ID NO:1具有至少75%,例如,至少80%,至少85%,至少90%,至少95%,100%序列相同性的核苷酸序列或由其組成; 所述5'自剪接內含子片段(5' I類內含子片段)衍生自魚腥藻屬pre-tRNA-Leu基因的I類內含子,並且包含SEQ ID NO:2的核苷酸序列或與SEQ ID NO:2具有至少75%,例如,至少80%,至少85%,至少90%,至少95%,100%序列相同性的核苷酸序列或由其組成; 所述第一殘留成環元件和所述第二殘留成環元件總長度為大約5至大約100個核苷酸,或其間任何整數個核苷酸; 所述第一殘留成環元件和所述第二殘留成環元件被設置為自剪接後能夠形成莖環結構進行環化,所述第一殘留成環元件包含下式所述序列結構:5'-第一環序列-第一配對序列-第一非配對序列-3';且所述第二殘留成環元件包含下式所述序列結構:5'-第二非配對序列-第二配對序列-第二環序列-3', 其中所述第一非配對序列或第二非配對序列可以獨立地存在或不存在,所述第一配對序列和所述第二配對序列可互補配對形成所述莖環結構的莖,其中第一環序列和第二環序列可形成所述莖環結構的環,例如,通過用於環化的自剪接, 其中所述第一環序列包含AAAA、AA、UUUU、CAAA或GAAA或由其組成,並且所述第二環序列包含CUU或CUC或由其組成;並且 其中所述第一配對序列包含SEQ ID NO:42-55中的任一序列或由其組成;並且所述第二配對序列包含SEQ ID NO:78-93中的任一序列或由其組成。
在一些實施方案中,所述3'自剪接內含子片段(3' I類內含子片段)衍生自魚腥藻屬pre-tRNA-Leu基因的I類內含子,並且包含SEQ ID NO:1的核苷酸序列或與SEQ ID NO:1具有至少75%,例如,至少80%,至少85%,至少90%,至少95%,100%序列相同性的核苷酸序列或由其組成; 所述5'自剪接內含子片段(5' I類內含子片段)衍生自魚腥藻屬pre-tRNA-Leu基因的I類內含子,並且包含SEQ ID NO:2的核苷酸序列或與SEQ ID NO:2具有至少75%,例如,至少80%,至少85%,至少90%,至少95%,100%序列相同性的核苷酸序列或由其組成; 所述第一殘留成環元件和所述第二殘留成環元件總長度為大約5至大約100個核苷酸,或其間任何整數個核苷酸; 所述第一殘留成環元件和所述第二殘留成環元件被設置為自剪接後能夠形成莖環結構進行環化,所述第一殘留成環元件包含與選自SEQ ID NO:13-55之一的核苷酸序列具有至少50%,至少60%,至少70%,至少80%,至少90%,至少95%或100%序列相同性的核苷酸序列或由其組成,並且所述第二殘留成環元件包含與選自SEQ ID NO:56-93之一的核苷酸序列具有至少50%,至少60%,至少70%,至少80%,至少90%,至少95%或100%序列相同性的核苷酸序列或由其組成。
在一些實施方案中,所述3'自剪接內含子片段(3' I類內含子片段)衍生自魚腥藻屬pre-tRNA-Leu基因的I類內含子,並且包含SEQ ID NO:1的核苷酸序列或由其組成; 所述5'自剪接內含子片段(5' I類內含子片段)衍生自魚腥藻屬pre-tRNA-Leu基因的I類內含子,並且包含SEQ ID NO:2的核苷酸序列或由其組成; 所述第一殘留成環元件和所述第二殘留成環元件被設置為自剪接後能夠形成莖環結構進行環化,其中 1)所述第一殘留成環元件包含SEQ ID NO:15的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:57的核苷酸序列或由其組成; 2)所述第一殘留成環元件包含SEQ ID NO:14的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:58的核苷酸序列或由其組成; 3)所述第一殘留成環元件包含SEQ ID NO:18的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:59的核苷酸序列或由其組成; 4)所述第一殘留成環元件包含SEQ ID NO:19的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:60的核苷酸序列或由其組成; 5)所述第一殘留成環元件包含SEQ ID NO:20的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:61的核苷酸序列或由其組成; 6)所述第一殘留成環元件包含SEQ ID NO:21的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:62的核苷酸序列或由其組成; 7)所述第一殘留成環元件包含SEQ ID NO:23的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 8)所述第一殘留成環元件包含SEQ ID NO:24的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 9)所述第一殘留成環元件包含SEQ ID NO:26的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 10)所述第一殘留成環元件包含SEQ ID NO:27的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 11)所述第一殘留成環元件包含SEQ ID NO:28的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 12)所述第一殘留成環元件包含SEQ ID NO:13的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:67的核苷酸序列或由其組成; 13)所述第一殘留成環元件包含SEQ ID NO:13的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:59的核苷酸序列或由其組成; 14)所述第一殘留成環元件包含SEQ ID NO:13的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 15)所述第一殘留成環元件包含SEQ ID NO:17的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:59的核苷酸序列或由其組成; 16)所述第一殘留成環元件包含SEQ ID NO:22的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:63的核苷酸序列或由其組成。
在一些實施方案中,所述3'自剪接內含子片段(3' I類內含子片段)衍生自魚腥藻屬pre-tRNA-Leu基因的I類內含子,並且包含SEQ ID NO:1的核苷酸序列或由其組成; 所述5'自剪接內含子片段(5' I類內含子片段)衍生自魚腥藻屬pre-tRNA-Leu基因的I類內含子,並且包含SEQ ID NO:2的核苷酸序列或由其組成; 所述第一殘留成環元件和所述第二殘留成環元件被設置為自剪接後能夠形成莖環結構進行環化,其中所述第一殘留成環元件包含SEQ ID NO:13的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:59的核苷酸序列或由其組成。
在一些實施方案中,所述3'自剪接內含子片段(3' I類內含子片段)衍生自魚腥藻屬pre-tRNA-Leu基因的I類內含子,並且包含SEQ ID NO:1的核苷酸序列或由其組成; 所述5'自剪接內含子片段(5' I類內含子片段)衍生自魚腥藻屬pre-tRNA-Leu基因的I類內含子,並且包含SEQ ID NO:2的核苷酸序列或由其組成; 所述第一殘留成環元件和所述第二殘留成環元件被設置為自剪接後能夠形成莖環結構進行環化,其中所述第一殘留成環元件包含SEQ ID NO:17的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:59的核苷酸序列或由其組成。
在一些實施方案中,所述3'自剪接內含子片段(3' I類內含子片段)衍生自魚腥藻屬pre-tRNA-Leu基因的I類內含子,並且包含SEQ ID NO:1的核苷酸序列或由其組成; 所述5'自剪接內含子片段(5' I類內含子片段)衍生自魚腥藻屬pre-tRNA-Leu基因的I類內含子,並且包含SEQ ID NO:2的核苷酸序列或由其組成; 所述第一殘留成環元件和所述第二殘留成環元件被設置為自剪接後能夠形成莖環結構進行環化,其中所述第一殘留成環元件包含SEQ ID NO:22的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:63的核苷酸序列或由其組成。
在一些實施方案中,所述3'自剪接內含子片段(3' I類內含子片段)衍生自魚腥藻屬pre-tRNA-Leu基因的I類內含子,並且包含SEQ ID NO:1的核苷酸序列或由其組成; 所述5'自剪接內含子片段(5' I類內含子片段)衍生自魚腥藻屬pre-tRNA-Leu基因的I類內含子,並且包含SEQ ID NO:2的核苷酸序列或由其組成; 所述第一殘留成環元件和所述第二殘留成環元件被設置為自剪接後能夠形成莖環結構進行環化,其中所述第一殘留成環元件包含SEQ ID NO:13的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成。
在一些實施方案中,所述環形RNA前體還包含能夠互補配對形成同源臂雙鏈區的5'同源臂序列和3'同源臂序列。在一些實施方案中,其中所述5'同源臂序列在所述3'自剪接內含子片段的5'末端上游,所述3'同源臂序列在所述5'自剪接內含子片段的3'末端下游。
所述同源臂的長度可以為例如約5至50個核苷酸,例如,約5至50個,約10至50個,約20至50個,約30至50個或約40至50個核苷酸。在一些實施方案中,所述同源臂的長度可以為20個核苷酸。在一些實施方案中,所述同源臂的長度可以為40個核苷酸。在某些實施方案中,所述同源臂的長度為至少5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20個核苷酸。在某些實施方案中,所述同源臂的長度不超過50、45、40、35、30、25或20個核苷酸。在某些實施方案中,所述同源臂的長度為5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50個核苷酸。所述兩個同源臂序列可以分別是polyA和polyT,或分別是polyG和polyC。
在一些實施方案中,所述同源臂序列之一可以具有SEQ ID NO:151至162中的任一核苷酸序列或與SEQ ID NO:151至162中的任一具有至少50%,至少60%,至少70%,至少80%,至少90%,至少95%或至少99%序列相同性的核苷酸序列,而另一個同源臂序列可以具有相應的互補序列。在一些優選的實施方案中,所述5'同源臂序列為SEQ ID NO:152的核苷酸序列,並且所述3'同源臂序列為SEQ ID NO:162的核苷酸序列。
在一些實施方案中,所述感興趣的核苷酸序列包含至少一個蛋白編碼序列和與其可操作地連接的轉譯起始元件例如內部核糖體進入位點(IRES)。在此,“可操作地連接”指的是轉譯起始元件如IRES能夠指導所編碼蛋白的轉譯。在一些實施方案中,所述環形RNA前體中,所述轉譯起始元件如IRES位於至少一個蛋白編碼序列的5'末端上游,或者所述轉譯起始元件如IRES位於至少一個蛋白編碼序列的3'末端下游。
蛋白編碼序列可以編碼真核、原核或者病毒來源的蛋白質。在某些實施方案中,蛋白質可以是用於治療或診斷用途的任何蛋白質。例如,蛋白質編碼區可以編碼人蛋白質、抗原、抗體、基因編輯酶如CRISPR核酸酶等。例如,所編碼的蛋白可以是嵌合抗原受體、免疫調節蛋白和/或轉錄因數等。一些具體的實例包括但不限於EGF、FGF1、RBD、G6PC、PAH、HGF等。
IRES序列可以選自但不限於以下的IRES序列:Taura症候群病毒、吸血獵蝽病毒、泰累爾氏腦脊髓炎病毒(Tyler's encephalomyelitis virus)、猿猴病毒40、紅火蟻病毒1、禾谷縊管蚜病毒(cereal constriction virus)、網狀內皮增生症病毒、福曼脊髓灰質炎病毒1(Forman poliovirus 1)、大豆尺蠖病毒、喀什米爾蜂病毒、人鼻病毒2、琉璃葉蟬病毒-1、人免疫缺陷病毒1型、琉璃葉蟬病毒-1、虱P病毒、C型肝炎病毒、A型肝炎病毒、GB型肝炎病毒、***病毒、人腸道病毒71、馬鼻病毒、茶尺蠖樣病毒(Tea inchworm-like virus)、腦心肌炎病毒(EMCV)、果蠅C病毒、十字花科煙草病毒、蟋蟀麻痹病毒、牛病毒性腹瀉病毒1、黑皇后細胞病毒、蚜蟲致死麻痹病毒、禽腦脊髓炎病毒、急性蜂麻痹病毒、芙蓉枯黃環斑病毒、豬瘟病毒、人類FGF2、人類SFTPA1、人類AMLl/RUNXl、果蠅觸角、人類AQP4、人類AT1R、人類BAG-1、人類BCL2、人類BiP、人類c-IAPl、人類c-myc、人類eIF4G、小鼠NDST4L、人類LEF1、小鼠HIF1α、人類n.myc、小鼠Gtx、人類p27kipl、人類PDGF2/c-sis、人類p53、人類Pim-1、小鼠Rbm3、果蠅reaper、犬Scamper、果蠅Ubx、人類UNR、小鼠UtrA、人類VEGF-A、人類XIAP、果蠅hairless、釀酒酵母TFIID、釀酒酵母YAP1、人類c-src、人類FGF-1、猿猴小核糖核酸病毒、蕪菁縐縮病病毒(turnip crepe disease virus)、eIF4G的適體、柯薩奇病毒B3 (CVB3)或柯薩奇病毒A (CVA1/2)。野生型IRES序列也可以被修飾並在本發明中使用。優選地,所述IRES是CVB3、BRAV-1_L、PV1_L、CAV2_L、BRAV-1、PV1或CAV2。
示例性的IRES包含SEQ ID NO:105-135之一所示的核苷酸序列,或包含與SEQ ID NO:105-135之一具有至少75%,例如,至少80%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%序列相同性的核苷酸序列。
在一些實施方案中,所述感興趣的核苷酸序列是非蛋白編碼序列。例如,所述非蛋白編碼序列可以是反義RNA、適配體、嚮導RNA或者任何生物體記憶體在的非蛋白編碼RNA等。所述非蛋白編碼序列可以包含或不包含特定的二級結構。
在一些實施方案中,所述感興趣的核苷酸序列長度為至少10、20、40、60、80、100、200、300、400、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、10000、20000個核苷酸。在一些實施方案中,所述感興趣的核苷酸序列長度為約10至約20000個核苷酸。
所述環形RNA前體可以是(例如,化學上)未修飾的,部分修飾的或完全修飾的。在一些實施方案中,所述環形RNA前體包含至少一種核苷酸修飾。在一些實施方案中,環形RNA前體多達100%的核苷被修飾。在一些實施方案中,至少一種核苷酸修飾是胞苷修飾、尿苷修飾或腺苷修飾。在一些實施方案中,至少一種核苷修飾選自5-甲基胞嘧啶(m5C)、N6-甲基腺苷(m6A)、假尿苷(ψ)、N1-甲基假尿苷(m1ψ)和5-甲氧基尿苷(5moU)。在一些實施方案中,環形RNA前體包含少於100%、少於90%、少於80%、少於70%、少於60%、少於50%、少於40%、少於30%、少於20%、少於15%、少於10%、少於5%、少於1%的特定核苷酸修飾。本文中關於特定核苷酸修飾的百分比,指的是序列中已進行該特定修飾的核苷酸與可進行該特定修飾的核苷酸的比例。
在一些優選實施方案中,所述環形RNA前體是未修飾的。在一些實施方案中,所述環形RNA前體不包含核苷酸化學修飾。
在一方面,本發明提供用於生成環形RNA分子的核酸載體,所述載體包含本發明的環形RNA前體編碼序列。
如本文所用,“載體”是指從病毒、質體或高等生物的細胞中提取的一段DNA,可以將外來DNA片段***或已經***其中以進行克隆和/或表現目的。在某些實施方案中,載體可以穩定地維持在生物體中。載體可包含,例如,複製起點、選擇性標記或報告基因,如抗生素抗性或GFP,和/或多克隆位點(MCS)。該術語包括線性DNA片段(例如,PCR產物、線性的質體片段)、質體載體、病毒載體、粘粒、細菌人工染色體(BAC)、酵母人工染色體(YAC)等。
在一些實施方案中,所述核酸載體還包含與所述環形RNA前體編碼序列可操作地連接的RNA聚合酶啟動子序列。所述可操作地連接的啟動子允許所述環形RNA前體的體內和/或體外轉錄。所述啟動子例如是T7 RNA聚合酶啟動子、T6病毒RNA聚合酶啟動子、SP6病毒RNA聚合酶啟動子、T3病毒RNA聚合酶啟動子或T4病毒RNA聚合酶啟動子。
在另一方面,本發明提供環形RNA,其由本發明所述的環形RNA前體或核酸載體製備。
在另一方面,本發明提供環形RNA,其包含第一殘留成環元件、感興趣的核苷酸序列和第二殘留成環元件。
在一些實施方案中,所述第一殘留成環元件、所述感興趣的核苷酸序列和所述第二殘留成環元件可以具有上述定義。
在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件通過自剪接內含子(例如,I類內含子)參與RNA成環或為RNA成環所需。所述第一殘留成環元件和所述第二殘留成環元件與所述自剪接內含子(例如,I類內含子)一起參與成環但是被保留在最終環形RNA中。
在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件共價連接。在一些實施方案中,所述第一殘留成環元件的5'末端和第二殘留成環元件的3'末端共價連接。
如本文所用,“殘留成環元件”是指通過自剪接內含子參與成環或為成環所需的序列。所述殘留成環元件與自剪接內含子一起參與成環但是被保留在最終環形RNA中的序列。
本發明人令人驚奇地發現,利用自剪接內含子進行RNA環化時,其在環形RNA中導入的額外的成環元件會增加環形RNA分子的免疫原性,而對該部分保留在環形RNA中的元件(殘留成環元件)進行截短及突變後,既能保留甚至提高環化效率,也能顯著降低環形RNA的免疫原性,這對於環形RNA作為藥物或藥物載體的潛在應用有重要意義。
在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度不大於大約500個核苷酸,例如不大於大約500個、大約400個、大約300個、大約200個、大約100個、大約90個、大約80個、大約70個、大約60個、大約50個、大約40個、大約30個、大約20個、大約15個、大約10個、大約5個核苷酸。
在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約2至大約500個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約2至大約400個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約2至大約300個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約2至大約200個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約2至大約100個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約2至大約90個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約2至大約80個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約2至大約70個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約2至大約60個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約2至大約50個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約2至大約40個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約2至大約30個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約2至大約20個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約2至大約15個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約2至大約10個核苷酸,或其間任何整數個核苷酸。
在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為至少5個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為至少10個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為至少15個核苷酸。
在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約5至大約100個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約10至大約100個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約15至大約100個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約15至大約30個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約20至大約35個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約25至大約40個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約30至大約45個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約35至大約50個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約40至大約55個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約45至大約60個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約50至大約65個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約55至大約70個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約60至大約75個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約65至大約80個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約70至大約85個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約75至大約90個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約80至大約95個核苷酸,或其間任何整數個核苷酸。在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約85至大約100個核苷酸,或其間任何整數個核苷酸。
在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、200、300、400、500個核苷酸。
在一些實施方案中,所述第一殘留成環元件和第二殘留成環元件使得包含其的環形RNA,相對於包含SEQ ID NO:29和SEQ ID NO:64的殘留成環元件(Ana3.0,殘留成環元件總長度為176個核苷酸)的對照環形RNA具有降低的免疫原性。
在一些實施方案中,所述環形RNA相對於包含SEQ ID NO:29和SEQ ID NO:64的殘留成環元件(Ana3.0,殘留成環元件總長度為176個核苷酸)的對照環形RNA具有降低的免疫原性。
在一些實施方案中,所述第一殘留成環元件和第二殘留成環元件使得包含其的環形RNA,相對於對照線性RNA,例如,沒有化學修飾的核苷酸的對應線性RNA,具有降低的免疫原性。
在一些實施方案中,所述環形RNA,相對於對照線性RNA,例如,沒有化學修飾的核苷酸的對應線性RNA,具有降低的免疫原性。
如本文所用,“降低的免疫原性”可以指環形RNA與細胞接觸後引起的免疫反應降低,即免疫反應水準低於對照環形RNA或對照線性RNA。例如,降低的免疫反應指降低的細胞因數表現。所述細胞因數包括但不限於IFNβ,TNFα,IL6和/或RIG-I。在一些實施方案中,所述環形RNA的免疫原性降低至少大約10%、至少大約20%、至少大約30%、至少大約40%、至少大約50%、至少大約60%、至少大約70%、至少大約80%、至少大約90%或更多。降低的免疫原性可以通過本領域所熟知的方法來確定,例如在本發明實施例10中描述的方法。
在一些實施方案中,所述第一殘留成環元件和第二殘留成環元件使得包含其的環形RNA,相對於包含SEQ ID NO:29和SEQ ID NO:64 (Ana3.0)的殘留成環元件的環形RNA具有相當的或增加的成環效率。
如本文所用,“成環效率”可以指在給定的時間段內,輸出的環形RNA與輸入前體的比值。或者,如本文所用,“成環效率”可以指在給定的時間段內,最終產物中所需的環形RNA與線性RNA的比值。成環效率可以通過本領域所熟知的方法來確定,例如在本發明實施例17、19、20中描述的方法。
在一些實施方案中,所述環形RNA的成環效率增加至少大約10%、至少大約20%、至少大約30%、至少大約40%、至少大約50%、至少大約60%、至少大約70%、至少大約80%、至少大約90%、至少大約100%、至少大約200%、至少大約300%、至少大約400%、至少大約500%或更多。
在一些實施方案中,所述第一殘留成環元件包含從5'到3'方向的3'外顯子區域和可選的間隔子,或由其組成。在所述環形RNA前體中,3'外顯子區域的5'末端直接連接到3'自剪接內含子片段的3'末端。
如本文所用,所述殘留成環元件中的“外顯子區域”是衍生於自剪接內含子的天然外顯子(自剪接內含子側翼的外顯子)的序列,並且能夠被自剪接內含子(或第一自剪接內含子片段和第二自剪接內含子片段的結合)識別和/或剪接,並且因此是環化所必需的。
在一些實施方案中,所述3'外顯子區域衍生自所述自剪接內含子的天然3'外顯子(所述自剪接內含子3'端側翼(下游)的外顯子)或其從5'端核苷酸開始的連續片段。
在一些實施方案中,所述3'外顯子區域是所述自剪接內含子的全部天然3'外顯子,或與所述自剪接內含子的全部天然3'外顯子具有至少50%、至少60%、至少70%、至少80%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少99%或至少99%序列相同性,或與所述自剪接內含子的全部天然3'外顯子相比具有1、2、3、4、5、6、7、8、9或10個或更多個的核苷酸取代、缺失或添加。
在一些實施方案中,所述3'外顯子區域是從天然3'外顯子的5'端核苷酸開始的連續片段。在一些實施方案中,3'外顯子區域與從天然3'外顯子的5'端核苷酸開始的連續片段具有至少50%、至少60%、至少70%、至少80%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性。在一些實施方案中,3'外顯子區域與從天然3'外顯子的5'端核苷酸開始的連續片段相比具有1、2、3、4、5、6、7、8、9或10個或更多個的核苷酸取代、缺失或添加。
在一些實施方案中,所述從天然3'外顯子的5'端核苷酸開始的連續片段包含天然3'外顯子的至少1%、至少5%、至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%的核苷酸或由其組成。在一些實施方案中,所述從天然3'外顯子的5'端核苷酸開始的連續片段的長度為至少1個核苷酸,如至少2個、至少3個、至少4個、至少5個、至少6個、至少7個、至少8個、至少9個、至少10個、至少15個、至少20個、至少25個、至少50個或更多個核苷酸。在一些實施方案中,所述從天然3'外顯子的5'端核苷酸開始的連續片段的長度為1個核苷酸或最多2個、最多3個、最多4個、最多5個、最多6個、最多7個、最多8個、最多9個、最多10個、最多15個、最多20個、最多25個、最多50個核苷酸或最多為天然3'外顯子的全長。
在一些實施方案中,其中所述自剪接內含子是I類內含子,3'外顯子區域至少在其5'端包含一個序列(例如約1至約20個核苷酸的序列),該序列可以與相應I類內含子的P1區域配對形成P10雙鏈區。
據認為,對於I類內含子的自剪接,所述天然3'外顯子的5'末端起的連續一個或多個核苷酸(例如至少約1至約7個核苷酸)可以與P1區域配對形成P10雙鏈區,因而在自剪接中其重要作用。I類內含子的P1區和P10區的定義是本領域已知的,例如可參考以下文獻確定:Burke, J. M., et al., (1987). Structural conventions for group I introns; Stahley, R. M., et al (2006). RNA splicing: group I intron crystal structures reveal the basis of splice site selection and metal ion catalysis; Woodson, A. S., (2005). Structure and assembly of group I introns。
在一些實施方案中,所述第二殘留成環元件包含從3'到5'方向的5'外顯子區域和可選的間隔子,或由其組成。在環形RNA前體中,5'外顯子區域的3'末端直接連接到第二自剪接內含子片段的5'末端。
在一些實施方案中,所述5'外顯子區域衍生自所述自剪接內含子的天然5'外顯子(所述自剪接內含子5'末端側翼(下游)的外顯子)或其從3'端核苷酸開始的連續片段。
在一些實施方案中,所述5'外顯子區域是所述自剪接內含子的全部天然5'外顯子,或與所述I類內含子的全部天然5'外顯子具有至少50%、至少60%、至少70%、至少80%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少99%或至少99%序列相同性,或與所述自剪接內含子的全部天然5'外顯子相比具有1、2、3、4、5、6、7、8、9或10個或更多個的核苷酸取代、缺失或添加。
在一些實施方案中,所述5'外顯子區域是從天然5'外顯子的3'端核苷酸開始的連續片段。在一些實施方案中,5'外顯子區域與從天然5'外顯子的3'端核苷酸開始的連續片段具有至少50%、至少60%、至少70%、至少80%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性。在一些實施方案中,5'外顯子區域與從天然5'外顯子的3'端核苷酸開始的連續片段相比具有1、2、3、4、5、6、7、8、9或10個或更多個的核苷酸取代、缺失或添加。
在一些實施方案中,所述從天然5'外顯子的3'端核苷酸開始的連續片段包含天然5'外顯子的至少1%、至少5%、至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%的核苷酸或由其組成。在一些實施方案中,所述從天然5'外顯子的3'端核苷酸開始的連續片段的長度為至少1個核苷酸,如至少2個、至少3個、至少4個、至少5個、至少6個、至少7個、至少8個、至少9個、至少10個、至少15個、至少20個、至少25個、至少50個或更多個核苷酸。在一些實施方案中,所述從天然5'外顯子的3'端核苷酸開始的連續片段的長度為1個核苷酸或最多2個、最多3個、最多4個、最多5個、最多6個、最多7個、最多8個、最多9個、最多10個、最多15個、最多20個、最多25個、最多50個核苷酸或最多為天然5'外顯子的全長。
在一些實施方案中,其中所述自剪接內含子是I類內含子,5'外顯子區域在其3'端包含一個序列(例如,約3至約8個連續的核苷酸的序列),該序列可以與相應I類內含子的內在導向序列(internal guide sequence, IGS)配對形成P1雙鏈區。
據認為,對於I類內含子的自剪接,所述天然5'外顯子的3'末端起的連續約3個至約8個核苷酸可以與內在導向序列(internal guide sequence, IGS)配對形成P1雙鏈區,因而在自剪接中其重要作用。I類內含子的IGS和/或P1區定義是本領域已知的,例如可參考以下文獻確定:Burke, J. M., et al., (1987). Structural conventions for group I introns; Stahley, R. M., et al (2006). RNA splicing: group I intron crystal structures reveal the basis of splice site selection and metal ion catalysis; Woodson, A. S., (2005). Structure and assembly of group I introns。
在一些實施方案中,所述3'外顯子區域衍生自魚腥藻屬pre-tRNA-Leu基因的I類內含子的3'天然外顯子。所述魚腥藻屬pre-tRNA-Leu基因的I類內含子的3'天然外顯子包含SEQ ID NO:7的核苷酸序列。在一些實施方案中,所述5'外顯子區域衍生自魚腥藻屬pre-tRNA-Leu基因的I類內含子的5'天然外顯子。所述魚腥藻屬pre-tRNA-Leu基因的I類內含子的5'天然外顯子包含SEQ ID NO:8的核苷酸序列。
在一些實施方案中,所述3'外顯子區域衍生自T4噬菌體td基因的I類內含子的3'天然外顯子。所述T4噬菌體td基因的3'天然外顯子包含SEQ ID NO:11的核苷酸序列。在一些實施方案中,所述5'外顯子區域衍生自T4噬菌體td基因的I類內含子的5'天然外顯子。所述T4噬菌體td基因的5'天然外顯子包含SEQ ID NO:12的核苷酸序列。
在一些實施方案中,所述3'外顯子區域衍生自Azoarcus sp. BH72 pre-tRNA-Ile基因的I類內含子的3'天然外顯子。所述Azoarcus sp. BH72 pre-tRNA-Ile基因的3'天然外顯子包含SEQ ID NO:9的核苷酸序列。在一些實施方案中,所述5'外顯子區域衍生自Azoarcus sp. BH72 pre-tRNA-Ile基因的I類內含子的5'天然外顯子。所述Azoarcus sp. BH72 pre-tRNA-Ile基因的5'天然外顯子包含SEQ ID NO:10的核苷酸序列。
在環形RNA前體的環化過程中,3'自剪接內含子片段(例如,3' I類內含子片段)及其5'末端上游的序列(如存在),和5'自剪接內含子片段(例如,5' I類內含子片段)及其3'末端下游的序列(如存在)均被切除,並且第一殘留成環元件的5'末端和第二殘留成環元件的3'末端共價連接,實現RNA的環化。
在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件包含不同的間隔子序列,或者其中之一包含間隔子序列而另一個不包含間隔子序列。
如本文所用,“間隔子”是指至少不負面干預相連元件功能的任何連續的核苷酸序列。通常,如果需要避免兩相近或相鄰元件的相互影響,則可以在該兩元件之間***間隔子。本文所述的間隔子序列可具有兩個功能:(1)促進環化和(2)通過允許殘留成環元件和感興趣的核苷酸序列(如IRES)的正確折疊來促進功能性。在一些實施方案中,間隔子長度為不超過150個、不超過100個、不超過50個、不超過30個、不超過10個、不超過5個或不超過3個核苷酸。在一些實施方案中,間隔子長度為5個核苷酸。在一些實施方案中,間隔子長度為4個核苷酸。在一些實施方案中,間隔子長度為3個核苷酸。在一些實施方案中,間隔子可以不存在。
在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件被設置為能夠形成莖環(stem-loop)結構。在一些實施方案中,剪接位點(splicing junction)包含在所述莖環結構的環(loop)中。
在一些實施方案中,通過參與環化的所述3'自剪接內含子片段(例如,3' I類內含子片段)、所述第一殘留成環元件、所述第二殘留成環元件和所述5'自剪接內含子片段(例如,5' I類內含子片段)的核苷酸序列預測和/或確定所述莖環結構的存在。在一些實施方案中,通過RNA結構預測工具例如RNAfold (http://rna.tbi.univie.ac.at/cgi-bin/RNAWebSuite/RNAfold.cgi)或者RNAstructure (https://rna.urmc.rochester.edu/RNAstructureWeb/index.html)根據所述核苷酸序列預測和/或確定莖環結構的存在。通過參考實施例3和圖10中描述的方法,可以預測和/或確定莖環結構的存在。
在一些實施方案中,所述第一殘留成環元件包含下式所述序列結構:5'-第一環(loop)序列-第一配對序列-第一非配對序列-3';且,所述第二殘留成環元件包含下式所述序列結構:5'-第二非配對序列-第二配對序列-第二環序列-3', 其中所述第一非配對序列或第二非配對序列可以獨立地存在或不存在, 所述第一配對序列和所述第二配對序列可互補配對形成所述莖環結構的莖,其中第一環序列和第二環序列可形成所述莖環結構的環,例如,通過自剪接。
通常而言,形成所述莖環結構的環的序列衍生自所述3'外顯子區和/或5'外顯子區。
在一些實施方案中,其中所述自剪接內含子是I類內含子,所述第一環序列包含一個或多個核苷酸(例如,約1至約20個核苷酸)或由其組成,這些核苷酸可以與相應I類內含子的P1區域配對,在環化過程中形成P10雙鏈區。
在一些實施方案中,所述第一環序列可以包含(N)n核苷酸序列或由其組成,其中N表示任何核苷酸(A、G、U或C),n表示1-20之間的整數,例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20。
在一些實施方案中,所述第一環序列包含從I類內含子的天然3'外顯子5'端核苷酸開始的約1-約7個連續核苷酸或由其組成。 在一些實施方案中,所述第一環序列例如包含AAAA、AA、UUUU、CAAA或GAAA或由其組成。
在一些實施方案中,其中所述自剪接內含子是I類內含子,所述第二環序列包含一個或多個核苷酸(例如,約3至約8個核苷酸)或由其組成,這些核苷酸可以與I類內含子的導向序列(internal guide sequence, IGS)配對,在環化過程中形成P1雙鏈區。
在一些實施方案中,所述第二環序列包含從I類內含子的天然5'外顯子3'端核苷酸開始的約3-約8個連續核苷酸或由其組成。
在一些實施方案中,所述第二環序列例如包含CUU或CUC或由其組成。
在一些特定的實施方案中,可以在環化後形成具有CUUAAAA、CUUUUUU、CUUAA、CUUGAAA、CUUUAAA、CUUCAAA或CUCAAAA序列的環。
在一些實施方案中,所述第一環序列包含AAAA或由其組成,並且所述第二環序列包含CUU或由其組成。在一些特定的實施方案中,可以在環化後形成具有CUUAAAA序列的環。
形成所述莖環結構的莖的所述配對序列可以來自所述外顯子區域,然而,其也可以是來自所述間隔子序列。或者所述配對序列可以來自外顯子區域和間隔子序列,即所述配對序列包含外顯子區域的至少一部分和所述間隔子的至少一部分。
不受任何理論限制,基於內含子自剪接(例如,I類內含子自剪接)的RNA環化效率與殘留成環元件形成的莖環結構中的莖部分的鹼基對數目或鹼基對類型或組成相關。莖環結構的穩定性(例如可以通過計算的自由能預測)可能影響環化效率。
在一些實施方案中,所述莖環結構中的莖部分包含至少2個鹼基對,例如至少3個、至少4個、至少5個、至少6個、至少7個、至少8個、至少9個、至少10個、至少11個、至少12個、至少13個、至少14個、至少15個或更多個鹼基對,優選連續的鹼基對。在一些實施方案中,所述莖環結構中的莖部分包含2至15個或更多個連續鹼基對。在一些實施方案中,所述莖環結構中的莖部分包含3至15個或更多個連續鹼基對。在一些實施方案中,所述莖環結構中的莖部分包含4至15個或更多個連續鹼基對。在一些實施方案中,所述莖環結構中的莖部分包含5至15個或更多個連續鹼基對。在一些實施方案中,所述莖環結構中的莖部分包含6至15個或更多個連續鹼基對。在一些實施方案中,所述莖環結構中的莖部分包含7至15個或更多個連續鹼基對。在一些實施方案中,所述莖環結構中的莖部分包含8至15個或更多個連續鹼基對。在一些實施方案中,所述莖環結構中的莖部分包含9至15個或更多個連續鹼基對。在一些實施方案中,所述莖環結構中的莖部分包含10至15個或更多個連續鹼基對。在一些實施方案中,所述莖環結構中的莖部分包含11至15個或更多個連續鹼基對。在一些實施方案中,所述莖環結構中的莖部分包含12至15個或更多個連續鹼基對。在一些實施方案中,所述莖環結構中的莖部分包含13至15個或更多個連續鹼基對。在一些實施方案中,所述莖環結構中的莖部分包含14至15個或更多個連續鹼基對。在一些實施方案中,所述莖環結構中的莖部分包含2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個或15個鹼基對,優選連續的鹼基對。在一些實施方案中,所述莖環結構中的莖部分包含5個鹼基對,優選連續的鹼基對。在一些實施方案中,所述莖環結構中的莖部分包含6個鹼基對,優選連續的鹼基對。在一些實施方案中,所述莖環結構中的莖部分包含7個鹼基對,優選連續的鹼基對。
在一些實施方案中,所述莖環結構中的莖部分包含至多2個鹼基錯配,或者至多1個鹼基錯配,優選地,所述莖部分不包含鹼基錯配。
在一些實施方案中,其中所述莖環結構的經預測的自由能小於大約-1 kal/mol,小於大約-2 kal/mol,小於大約-3 kal/mol,小於大約-4 kal/mol,小於大約-5 kal/mol,小於大約-6 kal/mol,小於大約-7 kal/mol,小於大約-8 kal/mol,小於大約-9 kal/mol,小於大約-10 kal/mol,或更小。在一些實施方案中,其中所述莖環結構的經預測的自由能為約-1 kal/mol至約-10 kal/mol。在一些實施方案中,其中所述莖環結構的經預測的自由能為約-2 kal/mol至約-10 kal/mol。在一些實施方案中,其中所述莖環結構的經預測的自由能為約-3 kal/mol至約-10 kal/mol。在一些實施方案中,其中所述莖環結構的經預測的自由能為約-4 kal/mol至約-10 kal/mol。在一些實施方案中,其中所述莖環結構的經預測的自由能為約-5 kal/mol至約-10 kal/mol。在一些實施方案中,其中所述莖環結構的經預測的自由能為約-6 kal/mol至約-10 kal/mol。在一些實施方案中,其中所述莖環結構的經預測的自由能為約-7 kal/mol至約-10 kal/mol。在一些實施方案中,其中所述莖環結構的經預測的自由能為約-8 kal/mol至約-10 kal/mol。在一些實施方案中,其中所述莖環結構的經預測的自由能為約-9 kal/mol至約-10 kal/mol。所述自由能例如可以通過RNAfold (http://rna.tbi.univie.ac.at/cgi-bin/RNAWebSuite/RNAfold.cgi)或者RNAstructure (https://rna.urmc.rochester.edu/RNAstructureWeb/ index.html)結構預測工具確定。
在一些實施方案中,所述第一配對序列僅包含G,所述第二配對序列僅包含C。在一些實施方案中,所述第一配對序列僅包含C,所述第二配對序列僅包含G。在一些實施方案中,所述第一配對序列僅包括A,所述第二配對序列僅包括U。
在一些實施方案中,所述第一配對序列包含SEQ ID NO:42至55中的任一序列或由其組成。在一些實施方案中,所述第二配對序列包含SEQ ID NO:78至93中的任一序列或由其組成。
在一些實施方案中,所述第一殘留成環元件包含與選自SEQ ID NO:13至55之一的核苷酸序列具有至少50%,至少60%,至少70%,至少80%,至少90%,至少95%或100%序列相同性的核苷酸序列或由其組成。在一些實施方案中,所述第一殘留成環元件包含選自SEQ ID NO:13至55之一的核苷酸序列或由其組成。
在一些實施方案中,所述第二殘留成環元件包含與選自SEQ ID NO:56至93之一的核苷酸序列具有至少50%,至少60%,至少70%,至少80%,至少90%,至少95%或100%序列相同性的核苷酸序列或由其組成。在一些實施方案中,所述第二殘留成環元件包含選自SEQ ID NO:56至93之一的核苷酸序列或由其組成。
在一些實施方案中,所述第一殘留成環元件包含SEQ ID NO:13至55中的任一核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56至93中的任一核苷酸序列或由其組成。
在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約5至大約100個核苷酸,或其間任何整數個核苷酸; 所述第一殘留成環元件和所述第二殘留成環元件被設置為自剪接後能夠形成莖環結構進行環化,所述第一殘留成環元件包含下式所述序列結構:5'-第一環序列-第一配對序列-第一非配對序列-3';且所述第二殘留成環元件包含下式所述序列結構:5'-第二非配對序列-第二配對序列-第二環序列-3', 其中所述第一非配對序列或第二非配對序列可以獨立地存在或不存在,所述第一配對序列和所述第二配對序列可互補配對形成所述莖環結構的莖,其中第一環序列和第二環序列可形成所述莖環結構的環,例如,通過自剪接進行環化, 其中所述第一環序列包含AAAA、AA、UUUU、CAAA或GAAA或由其組成,並且所述第二環序列包含CUU或CUC或由其組成;並且 其中所述第一配對序列包含SEQ ID NO:42至55中的任一序列或由其組成;並且所述第二配對序列包含SEQ ID NO:78至93中的任一序列或由其組成。
在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件總長度為大約5至大約100個核苷酸,或其間任何整數個核苷酸; 所述第一殘留成環元件和所述第二殘留成環元件被設置為自剪接後能夠形成莖環結構進行環化,所述第一殘留成環元件包含與選自SEQ ID NO:13至55之一的核苷酸序列具有至少50%,至少60%,至少70%,至少80%,至少90%,至少95%或100%序列相同性的核苷酸序列或由其組成,並且所述第二殘留成環元件包含與選自SEQ ID NO:56至93之一的核苷酸序列具有至少50%,至少60%,至少70%,至少80%,至少90%,至少95%或100%序列相同性的核苷酸序列或由其組成。
在一些實施方案中,所述第一殘留成環元件和所述第二殘留成環元件被設置為自剪接後能夠形成莖環結構進行環化,其中 1)所述第一殘留成環元件包含SEQ ID NO:15的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:57的核苷酸序列或由其組成; 2)所述第一殘留成環元件包含SEQ ID NO:14的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:58的核苷酸序列或由其組成; 3)所述第一殘留成環元件包含SEQ ID NO:18的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:59的核苷酸序列或由其組成; 4)所述第一殘留成環元件包含SEQ ID NO:19的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:60的核苷酸序列或由其組成; 5)所述第一殘留成環元件包含SEQ ID NO:20的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:61的核苷酸序列或由其組成; 6)所述第一殘留成環元件包含SEQ ID NO:21的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:62的核苷酸序列或由其組成; 7)所述第一殘留成環元件包含SEQ ID NO:23的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 8)所述第一殘留成環元件包含SEQ ID NO:24的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 9)所述第一殘留成環元件包含SEQ ID NO:26的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 10)所述第一殘留成環元件包含SEQ ID NO:27的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 11)所述第一殘留成環元件包含SEQ ID NO:28的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 12)所述第一殘留成環元件包含SEQ ID NO:13的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:67的核苷酸序列或由其組成; 13)所述第一殘留成環元件包含SEQ ID NO:13的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:59的核苷酸序列或由其組成; 14)所述第一殘留成環元件包含SEQ ID NO:13的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 15)所述第一殘留成環元件包含SEQ ID NO:17的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:59的核苷酸序列或由其組成; 16)所述第一殘留成環元件包含SEQ ID NO:22的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:63的核苷酸序列或由其組成。
在一些實施方案中,所述第一殘留成環元件包含SEQ ID NO:15的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:57的核苷酸序列或由其組成。
在一些實施方案中,所述第一殘留成環元件包含SEQ ID NO:14的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:58的核苷酸序列或由其組成。
在一些實施方案中,所述第一殘留成環元件包含SEQ ID NO:18的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:59的核苷酸序列或由其組成。
在一些實施方案中,所述第一殘留成環元件包含SEQ ID NO:19的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:60的核苷酸序列或由其組成。
在一些實施方案中,所述第一殘留成環元件包含SEQ ID NO:20的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:61的核苷酸序列或由其組成。
在一些實施方案中,所述第一殘留成環元件包含SEQ ID NO:21的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:62的核苷酸序列或由其組成。
在一些實施方案中,所述第一殘留成環元件包含SEQ ID NO:23的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成。
在一些實施方案中,所述第一殘留成環元件包含SEQ ID NO:24的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成。
在一些實施方案中,所述第一殘留成環元件包含SEQ ID NO:26的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成。
在一些實施方案中,所述第一殘留成環元件包含SEQ ID NO:27的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成。
在一些實施方案中,所述第一殘留成環元件包含SEQ ID NO:28的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成。
在一些實施方案中,所述第一殘留成環元件包含SEQ ID NO:13的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:67的核苷酸序列或由其組成。
在一些實施方案中,所述第一殘留成環元件包含SEQ ID NO:13的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:59的核苷酸序列或由其組成。
在一些實施方案中,所述第一殘留成環元件包含SEQ ID NO:13的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成。
在一些實施方案中,所述第一殘留成環元件包含SEQ ID NO:17的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:59的核苷酸序列或由其組成。
在一些實施方案中,所述第一殘留成環元件包含SEQ ID NO:22的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:63的核苷酸序列或由其組成。
在一些實施方案中,所述感興趣的核苷酸序列包含至少一個蛋白編碼序列和與其可操作地連接的轉譯起始元件例如IRES(轉譯起始元件例如IRES如上所定義)。在此,“可操作地連接”指的是轉譯起始元件如IRES能夠指導所編碼蛋白的轉譯。
在一些實施方案中,所述環形RNA按順序包含第一殘留成環元件、轉譯起始元件如IRES、至少一個蛋白編碼序列和第二殘留成環元件。在一些實施方案中,所述環形RNA按順序包含第一殘留成環元件、至少一個蛋白編碼序列、轉譯起始元件如IRES和第二殘留成環元件。
蛋白編碼序列可以編碼真核、原核或者病毒來源的蛋白質。在某些實施方案中,蛋白質可以是用於治療或診斷用途的任何蛋白質。例如,蛋白質編碼區可以編碼人蛋白質、抗原、抗體、基因編輯酶如CRISPR核酸酶等。例如,所編碼的蛋白可以是嵌合抗原受體、免疫調節蛋白和/或轉錄因數等。一些具體的實例包括但不限於EGF、FGF1、RBD、G6PC、PAH、HGF等。
IRES序列可以選自但不限於以下的IRES序列:Taura症候群病毒、吸血獵蝽病毒、泰累爾氏腦脊髓炎病毒、猿猴病毒40、紅火蟻病毒1、禾谷縊管蚜病毒、網狀內皮增生症病毒、福曼脊髓灰質炎病毒1、大豆尺蠖病毒、喀什米爾蜂病毒、人鼻病毒2、琉璃葉蟬病毒-1、人免疫缺陷病毒1型、琉璃葉蟬病毒-1、虱P病毒、C型肝炎病毒、A型肝炎病毒、GB型肝炎病毒、***病毒、人腸道病毒71、馬鼻病毒、茶尺蠖樣病毒、腦心肌炎病毒(EMCV)、果蠅C病毒、十字花科煙草病毒、蟋蟀麻痹病毒、牛病毒性腹瀉病毒1、黑皇后細胞病毒、蚜蟲致死麻痹病毒、禽腦脊髓炎病毒、急性蜂麻痹病毒、芙蓉枯黃環斑病毒、豬瘟病毒、人類FGF2、人類SFTPA1、人類AMLl/RUNXl、果蠅觸角、人類AQP4、人類AT1R、人類BAG-1、人類BCL2、人類BiP、人類c-IAPl、人類c-myc、人類eIF4G、小鼠NDST4L、人類LEF1、小鼠HIF1α、人類n.myc、小鼠Gtx、人類p27kipl、人類PDGF2/c-sis、人類p53、人類Pim-1、小鼠Rbm3、果蠅reaper、犬Scamper、果蠅Ubx、人類UNR、小鼠UtrA、人類VEGF-A、人類XIAP、果蠅hairless、釀酒酵母TFIID、釀酒酵母YAP1、人類c-src、人類FGF-1、猿猴小核糖核酸病毒、蕪菁縐縮病病毒、eIF4G的適體、柯薩奇病毒B3 (CVB3)或柯薩奇病毒A (CVA1/2)。野生型IRES序列也可以被修飾並在本發明中使用。優選地,所述IRES是CVB3、BRAV-1_L、PV1_L、CAV2_L、BRAV-1、PV1或CAV2。
示例性的IRES包含SEQ ID NO:105-135之一所示的核苷酸序列,或包含與SEQ ID NO:105-135之一具有至少75%,例如,至少80%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%序列相同性的核苷酸序列。
在一些實施方案中,所述感興趣的核苷酸序列是非蛋白編碼序列。例如,所述非蛋白編碼序列可以是反義RNA、適配體、嚮導RNA或者任何生物體記憶體在的非蛋白編碼RNA等。所述非蛋白編碼序列可以包含或不包含特定的二級結構。
在一些實施方案中,所述感興趣的核苷酸序列長度為至少10、20、40、60、80、100、200、300、400、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、10000、20000個核苷酸。
在一些實施方案中,所述環形RNA長度為至少10、20、40、60、80、100、200、300、400、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000、10000、20000個核苷酸。在一些實施方案中,所述環形RNA長度為至少約10個核苷酸。在一些實施方案中,所述環形RNA為約500nt或更小。在一些實施方案中,所述環形RNA為至少約1k nt。
所述環形RNA可以是未修飾的,部分修飾的或完全修飾的。在一些實施方案中,所述環形RNA包含至少一種核苷酸修飾。在一些實施方案中,環形RNA的多達100%的核苷被修飾。在一些實施方案中,至少一種核苷酸修飾是胞苷修飾、尿苷修飾或腺苷修飾。在一些實施方案中,至少一種核苷酸修飾選自5-甲基胞嘧啶(m5C)、N6-甲基腺苷(m6A)、假尿苷(ψ)、N1-甲基假尿苷(m1ψ)和5-甲氧基尿苷(5moU)。在一些實施方案中,環形RNA包含少於100%、少於90%、少於80%、少於70%、少於60%、少於50%、少於40%、少於30%、少於20%、少於15%、少於10%、少於5%、少於1%的特定核苷酸修飾。本文中關於特定核苷酸修飾的百分比,指的是序列中已進行該特定修飾的核苷酸與可進行該特定修飾的核苷酸的比例。
在一些優選實施方案中,所述環形RNA是未修飾的。在一些實施方案中,所述環形RNA不包含核苷酸修飾。
在另一方面,本發明還提供本發明所述環形RNA前體和/或環形RNA作為表現載體的用途。
在另一方面,本發明提供藥物組合物,其包含本發明所述核酸載體和/或本發明所述環形RNA前體和/或環形RNA,以及藥物可接受的載體。所述組合物的具體用途取決於所述感興趣的核苷酸序列。
在一些實施方案中,所述藥物組合物用於治療個體的疾病。所述治療的具體疾病取決於所述感興趣的核苷酸序列。
藥學上可接受的載體可以包括但不限於緩衝劑、賦形劑、穩定劑或防腐劑。藥學上可接受的載體的實例是生理上相容的溶劑、分散介質、包衣、抗細菌和抗真菌劑、等滲劑和吸收延遲劑等,如鹽、緩衝液、糖類、抗氧化劑、水性或非水性載體、防腐劑、潤濕劑、表面活性劑或乳化劑或其組合。可以基於載體的活性和製劑的所需特性,如穩定性和/或最小氧化,通過實驗確定藥物組合物中的藥學上可接受的載體的量。
II. 環形 RNA 製備方法
在另一方面,本發明提供製備環形RNA的方法,所述方法包括: 1) 提供本發明所述的環形RNA前體或從本發明所述的核酸載體轉錄獲得環形RNA前體; 2) 在存在二價金屬陽離子的情況下,在RNA環化發生的溫度下培育環形RNA前體;和 3) 收穫步驟2)所獲得的環形RNA。
在一些實施方案中,所述二價金屬陽離子是Mg 2+和/或Mn 2+
在一些實施方案中,所述二價金屬陽離子的濃度為至少大約5mM,例如大約5mM至大約550mM,例如至少大約5mM、大約10mM、大約15mM、至少大約20mM、至少大約30mM、至少大約40mM、至少大約50mM、至少大約60mM、至少大約70mM、至少大約80mM、至少大約90mM、至少大約100mM、至少大約125mM、至少大約150mM、至少大約175mM、至少大約200mM、至少大約250mM、至少大約300mM、至少大約350mM、至少大約400mM、至少大約450mM、至少大約500mM、至少大約550mM或更高。
在另一方面,本發明提供製備環形RNA的方法,所述方法包括 a) 提供作為轉錄範本的包含基於自剪接內含子的RNA環化元件的核酸載體;和 b) 使所述核酸載體在包含二價金屬陽離子和RNA聚合酶的體外轉錄系統中培育第一時間段,期間體外轉錄產生的線性RNA在所述RNA環化元件的作用下自我環化以產生環形RNA。
在一些實施方案中,所述核酸載體是本發明第I節中所述的核酸載體。
在一些實施方案中,所述體外轉錄系統中的二價金屬陽離子是Mg2 +
在一些實施方案中,所述體外轉錄系統還包含一價金屬陽離子和/或一價陰離子。
在一些實施方案中,所述一價金屬陽離子是Na +或K +
在一些實施方案中,所述一價金屬陰離子是Cl -或CH3COO -(OAc)。
在一些實施方案中,第一時間段內系統中所述二價金屬陽離子的濃度為大約5mM至大約50mM,例如大約5mM、大約10mM、大約15mM、大約20mM、大約25mM、大約30mM、大約35mM、大約40mM、大約45mM、大約50mM。在一些實施方案中,第一時間段內系統中所述二價金屬陽離子的濃度為30mM。
在一些實施方案中,第一時間段內系統中所述一價金屬陽離子的濃度為大約5mM-大約50mM,例如大約5mM、大約10mM、大約15mM、大約20mM、大約25mM、大約30mM、大約35mM、大約40mM、大約45mM、大約50mM、大約60mM、大約70mM、大約80mM、大約90mM、大約100mM。在一些實施方案中,所述一價金屬陽離子是Na +,第一時間段內系統中所述濃度為15mM。在一些實施方案中,所述一價金屬陽離子是K +,第一時間段內系統中所述濃度為90mM。
在一些實施方案中,第一時間段內系統中所述一價陰離子的濃度為大約5mM至大約50mM,例如大約5mM、大約10mM、大約15mM、大約20mM、大約25mM、大約30mM、大約35mM、大約40mM、大約45mM、大約50mM、大約100mM、大約150mM。在一些實施方案中,所述一價陰離子是Cl -,第一時間段內系統中所述濃度為90mM。在一些實施方案中,所述一價陰離子是CH3COO -,第一時間段內系統中所述濃度為125mM。
在一些實施方案中,所述體外轉錄和自我環化在同一反應系統中進行。
在一些實施方案中,所述方法不包括分離和/或純化體外轉錄產生的線性RNA的步驟。
本領域技術人員知曉,所述體外轉錄系統還包括轉錄所需的各種組分,例如緩衝劑、rATP、rCTP、rUTP、rGTP等。
在一些實施方案中,所述體外轉錄系統的緩衝劑是Tris鹽酸緩衝液,或HEPES緩衝液,或MES緩衝液,或檸檬酸緩衝液,或磷酸緩衝液。一些實施方案中,所述體外轉錄系統的緩衝劑是HEPES緩衝液。
在一些實施方案中,所述體外轉錄系統的pH範圍是約5至約8,例如pH為約5、約5.5、約6、約6.5、約7、約7.5或約8。在一些實施方案中,所述體外轉錄系統的pH為7.5。
所述RNA聚合酶取決於核酸載體上使用的驅動轉錄的啟動子。所述RNA聚合酶可以包括但不限於T7 RNA聚合酶、T6病毒RNA聚合酶、SP6病毒RNA聚合酶、T3病毒RNA聚合酶或T4病毒RNA聚合酶。在一些實施方案中,所述RNA聚合酶是T7 RNA聚合酶。
在一些實施方案中,所述第一時間段為至少0.5小時,例如大約0.5小時至大約24小時,例如大約0.5小時、大約1小時、大約1.5小時、大約2小時、大約2.5小時、大約3小時、大約3.5小時、大約4小時、大約5小時、大約10小時或大約24小時。在一些實施方案中,所述第一時間段為3小時。
在一些實施方案中,所述第一時間段的反應在大約16°C至大約60°C下進行,例如在大約16°C、大約17°C、大約18°C、大約19°C、大約20°C、大約21°C、大約22°C、大約23°C、大約24°C、大約25°C、大約26°C、大約27°C、大約28°C、大約29°C、大約30°C、大約31°C、大約32°C、大約33°C、大約34°C、大約35°C、大約36°C、大約37°C、大約38°C、大約39°C、大約40°C、大約41°C、大約42°C、大約43°C、大約44°C、大約45°C、大約46°C、大約47°C、大約48°C、大約49°C、大約50°C、大約51°C、大約52°C、大約53°C、大約54°C、大約55°C、大約56°C、大約57°C、大約58°C、大約59°C或大約60°C下進行。在一些實施方案中,所述第一時間段的反應在大約37°C下進行。
在一些實施方案中,在所述步驟b)的第一時間段反應後,所述方法還包含步驟c): 向所述體外轉錄系統添加額外量的金屬陽離子並反應第二時間段;或者 改變所述系統的緩衝液,添加金屬陽離子並反應第二時間段。
在一些實施方案中,所述為第二時間段反應添加的金屬陽離子是二價金屬陽離子,例如Mg 2+或Mn 2+
在一些實施方案中,所述第二時間段的反應中,所述金屬陽離子添加至終濃度為至少大約5mM,例如大約5mM-大約550mM,例如至少大約5mM、至少大約10mM、至少大約15mM、至少大約20mM、至少大約30mM、至少大約40mM、至少大約50mM、至少大約60mM、至少大約70mM、至少大約80mM、至少大約90mM、至少大約100mM、至少大約125mM、至少大約150mM、至少大約175mM、至少大約200mM、至少大約250mM、至少大約300mM、至少大約350mM、至少大約400mM、至少大約450mM、至少大約500mM、至少大約550mM或更高。
在一些實施方案中,所述第二時間段的反應中,所述系統的緩衝劑是Tris鹽酸緩衝液,或HEPES緩衝液,或MES緩衝液,或檸檬酸緩衝液,或磷酸緩衝液。
在一些實施方案中,所述第二時間段反應系統的pH範圍是5至8,例如pH為5,pH為5.5,pH為6,pH為6.5,pH為7,pH為7.5或pH為8。
在一些實施方案中,所述第二時間段為至少5分鐘,例如大約5分鐘至大約2小時,例如大約5分鐘、大約10分鐘、大約15分鐘、大約20分鐘、大約25分鐘、大約30分鐘、大約45分鐘、大約50分鐘、大約55分鐘、大約60分鐘、大約120分鐘或更長時間。
在一些實施方案中,所述第二時間段的反應在大約25°C至大約75°C下進行,例如在大約25°C、大約26°C、大約27°C、大約28°C、大約29°C、大約30°C、大約31°C、大約32°C、大約33°C、大約34°C、大約35°C、大約36°C、大約37°C、大約38°C、大約39°C、大約40°C、大約41°C、大約42°C、大約43°C、大約44°C、大約45°C、大約50°C、大約55°C、大約60°C、大約65°C、大約70°C或大約75°C下進行。
在一些實施方案中,所述方法還包含回收或純化所產生的環形RNA的步驟。
在一方面,本發明提供通過本發明所述的方法生產的環形RNA。
在一方面,本發明提供體外轉錄方法,所述方法包括: a) 提供作為範本的核酸載體用於體外轉錄; b) 在包含二價金屬陽離子和RNA聚合酶的體外轉錄系統中培育所述核酸載體,反應第一時間段;和 c) i) 向所述系統添加額外量的金屬陽離子,或ii) 改變所述系統的緩衝液並向所述系統添加金屬陽離子,並培育所述系統,反應第二時間段。
在一些實施方案中,所述第一時間段的反應中所述體外轉錄系統還包含一價金屬陽離子和/或一價陰離子。
在一些實施方案中,所述第一時間段的反應中所述體外轉錄系統中的所述二價金屬陽離子是Mg 2+
在一些實施方案中,所述第一時間段的反應中所述一價金屬陽離子是Na +,或K +
在一些實施方案中,所述第一時間段的反應中所述一價陰離子是Cl -,或CH 3COO -
所述RNA聚合酶取決於核酸載體上使用的驅動轉錄的啟動子。所述RNA聚合酶可以包括但不限於T7 RNA聚合酶、T6病毒RNA聚合酶、SP6病毒RNA聚合酶、T3病毒RNA聚合酶或T4病毒RNA聚合酶。在一些實施方案中,所述RNA聚合酶是T7 RNA聚合酶。
在一些實施方案中,所述第一時間段的反應中所述二價金屬陽離子的濃度為大約5mM至大約50mM,例如大約5mM、大約10mM、大約15mM、大約20mM、大約25mM、大約30mM、大約35mM、大約40mM、大約45mM、大約50mM。
在一些實施方案中,所述第一時間段的反應中所述一價金屬陽離子的濃度為大約5mM至大約100mM,例如大約5mM、大約10mM、大約15mM、大約20mM、大約25mM、大約30mM、大約35mM、大約40mM、大約45mM、大約50mM、大約60mM、大約70mM、大約80mM、大約90mM、大約100mM。
在一些實施方案中,所述第一時間段的反應中所述一價陰離子的濃度為大約5mM至大約150mM,例如大約5mM、大約10mM、大約15mM、大約20mM、大約25mM、大約30mM、大約35mM、大約40mM、大約45mM、大約50mM、大約100mM、大約150mM。
在一些實施方案中,所述第一時間段的反應中所述體外轉錄系統的緩衝劑是Tris鹽酸緩衝液,或HEPES緩衝液,或MES緩衝液,或檸檬酸緩衝液,或磷酸緩衝液。
在一些實施方案中,所述第一時間段的反應中所述體外轉錄系統的pH範圍是5至8,例如pH為5,pH為5.5,pH為6,pH為6.5,pH為7,pH為7.5或pH為8。
在一些實施方案中,所述第一時間段為至少0.5小時,例如大約0.5小時至大約24小時,例如大約0.5小時、大約1小時、大約1.5小時、大約2小時、大約2.5小時、大約3小時、大約3.5小時、大約4小時、大約5小時、大約10小時或大約24小時。
在一些實施方案中,所述第一時間段的反應在大約16°C至大約60°C下進行,例如在大約16°C、大約17°C、大約18°C、大約19°C、大約20°C、大約21°C、大約22°C、大約23°C、大約24°C、大約25°C、大約26°C、大約27°C、大約28°C、大約29°C、大約30°C、大約31°C、大約32°C、大約33°C、大約34°C、大約35°C、大約36°C、大約37°C、大約38°C、大約39°C、大約40°C、大約41°C、大約42°C、大約43°C、大約44°C、大約45°C、大約46°C、大約47°C、大約48°C、大約49°C、大約50°C、大約51°C、大約52°C、大約53°C、大約54°C、大約55°C、大約56°C、大約57°C、大約58°C、大約59°C或大約60°C下進行。
在一些實施方案中,所述為第二時間段反應向系統中添加的金屬陽離子是二價金屬陽離子,例如Mg 2+或Mn 2+
在一些實施方案中,所述第二時間段的反應中所述金屬陽離子添加至終濃度為至少大約5mM,例如大約5mM至大約550mM,例如至少大約5mM、大約10mM、大約15mM、至少大約20mM、至少大約30mM、至少大約40mM、至少大約50mM、至少大約60mM、至少大約70mM、至少大約80mM、至少大約90mM、至少大約100mM、至少大約125mM、至少大約150mM、至少大約175mM、至少大約200mM、至少大約250mM、至少大約300mM、至少大約350mM、至少大約400mM、至少大約450mM、至少大約500mM、至少大約550mM或更高。
在一些實施方案中,所述第二時間段為至少5分鐘,例如大約5分鐘至大約2小時,例如大約5分鐘、大約10分鐘、大約15分鐘、大約20分鐘、大約25分鐘、大約30分鐘、大約45分鐘、大約50分鐘、大約55分鐘、大約60分鐘、大約120分鐘或更長時間。
在一些實施方案中,所述第二時間段的反應在在大約25°C至大約75°C下進行,例如在大約25°C、大約26°C、大約27°C、大約28°C、大約29°C、大約30°C、大約31°C、大約32°C、大約33°C、大約34°C、大約35°C、大約36°C、大約37°C、大約38°C、大約39°C、大約40°C、大約41°C、大約42°C、大約43°C、大約44°C、大約45°C、大約50°C、大約55°C、大約60°C、大約65°C、大約70°C或大約75°C下進行。
在一些實施方案中,所述方法還包括回收和/或純化步驟c)中獲得的RNA的步驟。
在一方面,本發明提供通過本發明所述的方法生產的RNA。
III. 環形 RNA 純化方法
在一方面,本發明提供純化環形RNA的方法,所述方法包括: a) 使包含環形RNA和未環化的線性環形RNA前體的混合物與環形RNA特異性探針在允許所述環形RNA特異性探針與所述環形RNA特異性結合並形成複合物的條件下接觸; b) 使所述複合物與所述混合物中未與所述環形RNA特異性探針結合的一種或多種組分分離;和 c) 從所述複合物釋放所述環形RNA。
在一些實施方案中,所述環形RNA通過環化線性環形RNA前體製備。在一些實施方案中,所述環形RNA通過用RNA連接酶例如T4 RNA連接酶連接線性環形RNA前體的兩端而製備。在一些實施方案中,所述環形RNA通過線性環形RNA前體中包含的基於I類內含子的環化元件的自剪接核酶活性而製備,例如,所述環形RNA是本文第I節或下文任一條款中所述的環形RNA和/或通過本文第II節或下文任一條款中所述的方法製備。
在一些實施方案中,所述環形RNA特異性探針是單鏈DNA探針。
在一些實施方案中,所述環形RNA特異性探針是單鏈RNA探針。
在一些實施方案中,所述環形RNA特異性探針與所述環形RNA的環化連接點兩側區域特異性雜交。
在一些實施方案中,所述環形RNA特異性探針長度為至少10個核苷酸,至少12個核苷酸,至少14個核苷酸,至少16個核苷酸,至少18個核苷酸,至少20個核苷酸,至少25個核苷酸,至少30個核苷酸,至少35個核苷酸或更長,例如所述環形RNA特異性探針長度為16、17、18、19、20、21、22、23、24、25、25、27、28、29或30個核苷酸。
在一些實施方案中,所述環形RNA特異性探針固定化於支持物例如固體支持物上,例如,所述環形RNA特異性探針在與所述環形RNA結合後再固定化於支持物上,或者所述環形RNA特異性探針預先固定化於支持物上。
在一些實施方案中,所述步驟a)中所述條件包括在大約60°C至大約95°C(例如大約60°C、大約62°C、大約64°C、大約66°C、大約68°C、大約70°C、大約75°C、大約80°C、大約85°C、大約90°C、大約95°C)使RNA變性大約2分鐘至大約10分鐘(例如大約2、3、4、5、6、7、8、9或10分鐘),然後使溫度逐步降低至低於大約40°C(例如低於大約35°C,低於大約30°C,低於大約25°C,低於大約20°C或更低)使所述環形RNA與所述環形RNA特異性探針黏著(annealing)。
在一些實施方案中,所述步驟a)中所述條件包括濃度範圍在0.25M至2M的高鹽,例如,0.25M、0.5M、0.75M、1M、1.25M、1.5M、1.75M或2M。在一些實施方案中,所述鹽為NaCl或胍鹽(例如,鹽酸胍)。
在一些實施方案中,其中步驟b)通過用洗滌緩衝液洗滌所述複合物來去除所述一種或多種組分。
在一些實施方案中,其中步驟c)通過將溫度升高至大約60°C至大約95°C(例如大約60°C、大約62°C、大約64°C、大約66°C、大約68°C、大約70°C、大約75°C、大約80°C、大約85°C、大約90°C、大約95°C)來釋放所述環形RNA。
在一些實施方案中,其中步驟c)通過用洗脫緩衝液洗脫來釋放所述環形RNA。在一些實施方案中,所述洗脫緩衝液是低鹽緩衝液,例如,鹽濃度低於0.5M的緩衝液。在一些實施方案中,所述洗脫緩衝液是Tris-EDTA緩衝液(TE緩衝液)或水。
在一些實施方案中,所述方法還包括以下步驟: i) 使包含環形RNA和未環化的線性環形RNA前體的混合物與線性環形RNA前體特異性探針在允許所述線性環形RNA前體特異性探針與所述線性環形RNA前體特異性結合並形成複合物的條件下接觸; ii) 從所述混合物去除所述線性環形RNA前體特異性探針與所述線性環形RNA前體形成的複合物,和 iii) 收集步驟ii)所得的包含環形RNA的混合物。
在一些實施方案中,所述步驟i)至iii)在步驟a)之前進行,例如在步驟a)之前進行多次步驟i)至iii),例如2次、3次、4次或更多次。在一些實施方案中,所述步驟i)至iii)與步驟a)至c)同時進行。
在一方面,本發明提供純化環形RNA的方法,所述方法包括: i) 使包含環形RNA和未環化的線性環形RNA前體的混合物與線性環形RNA前體特異性探針在允許所述線性環形RNA前體特異性探針與所述線性環形RNA前體特異性結合並形成複合物的條件下接觸;和 ii) 從所述混合物去除所述線性環形RNA前體特異性探針與所述線性環形RNA前體形成的複合物, iii) 收集步驟ii)所得的包含環形RNA的混合物,和 視情況,進行多次所述步驟i)至iii),例如2次、3次、4次或更多次。
在一些實施方案中,所述線性環形RNA前體特異性探針特異性結合所述線性環形RNA前體而基本上不結合所述環形RNA。
在一些實施方案中,所述線性環形RNA前體特異性探針固定化於支持物例如固體支持物上,例如,所述線性環形RNA前體特異性探針在與所述線性環形RNA前體結合後再固定化於支持物上,或者,所述線性環形RNA前體特異性探針預先固定化於支持物上。
在本發明所述純化環形RNA的方法的一些實施方案中,所述線性環形RNA前體包含從5'至3'方向按以下順序排列的以下元件: a) 3'自剪接內含子片段; b) 第一殘留成環元件; c) 感興趣的核苷酸序列; d) 第二殘留成環元件;和 e) 5'自剪接內含子片段; 其中所述線性環形RNA前體能夠通過自剪接去除3'自剪接內含子片段和5'自剪接內含子片段,生成包含所述第一殘留成環元件、所述感興趣的核苷酸序列和所述第二殘留成環元件的環形RNA。在一些實施方案中,所述線性環形RNA前體的元件如本文第I節或下文任一條款中所定義。
在一些實施方案中,所述環形RNA特異性探針至少與所述第一殘留成環元件的一部分和所述第二殘留成環元件的一部分特異性雜交。
在一些實施方案中,所述線性環形RNA前體特異性探針與所述線性環形RNA前體中除所述第一殘留成環元件、所述感興趣的核苷酸序列和所述第二殘留成環元件之外的部分雜交。
在一些實施方案中,所述線性環形RNA前體特異性探針與所述3'自剪接內含子片段或其部分或其5'側翼序列,或所述5'自剪接內含子片段或其部分或其3'側翼序列雜交。
在一些實施方案中,所述線性環形RNA前體包含選自SEQ ID NO:96至101的序列或其互補序列,優選地SEQ ID NO:100或其互補序列,其在所述第一殘留成環元件、所述感興趣的核苷酸序列和所述第二殘留成環元件之外,所述線性環形RNA前體特異性探針與之特異性雜交。
在本發明所述純化環形RNA的方法的一些實施方案中,所述探針與所述混合物中RNA分子的摩爾比為大約1:1至大約100000:1。
在一些實施方案中,所述線性環形RNA前體特異性探針與線性環形RNA前體上的3'同源臂序列或其部分,或線性環形RNA前體上的5'同源臂序列或其部分雜交。在一些實施方案中,所述同源臂序列包含polyA、polyU、polyG或polyC。在一些實施方案中,所述同源臂序列的長度為大約10至大約200nt。相應地,在一些實施方案中,所述線性環形RNA前體特異性探針包含polyT、polyA、polyC或polyG。在一些實施方案中,所述線性環形RNA前體特異性探針長度為大約10至大約200nt。
在一方面,本發明提供純化環形RNA的方法,所述方法包括: i) 向包含環形RNA和線性RNA的混合物中的線性RNA添加線性RNA特異性標籤; ii) 使包含環形RNA和線性RNA的混合物與特異性結合所述標籤的線性RNA探針在允許所述探針與所述線性RNA特異性結合並形成複合物的條件下接觸;和 iii) 從所述混合物去除所述線性RNA探針與線性RNA形成的複合物, iv) 收集步驟ii)所得的包含環形RNA的混合物, 視情況,進行多次所述步驟ii)至iv),例如2次、3次、4次或更多次。
在一些實施方案中,所述標籤包含polyA、polyG、polyU或polyC序列。相應地,所述探針包括polyT/polyU、polyC、polyA或polyG序列。或者,所述標籤可以是隨機序列,所述探針包含與所述隨機序列互補配對的序列。
在一些實施方案中,所述標籤的長度可以是大約10至200nt。在一些實施方案中,所述探針的長度可以是大約10至200nt。
在一些實施方案中,通過向所述混合物添加PolyA/T/C/G聚合酶或者連接酶在線性RNA末端添加所述標籤。在一些實施方案中,還包括向所述混合物添加rATP、rGTP、rUTP、rCTP或rNTP,或10至200nt隨機標籤序列。
在一些實施方案中,所述線性RNA探針特異性結合所添加的標籤而基本上不結合所述環形RNA。在一些實施方案中,所述線性RNA探針是單鏈DNA探針,或是單鏈RNA探針。
在一些實施方案中,所述線性RNA探針固定化於支持物例如固體支持物上,例如,所述線性RNA探針在與所述線性RNA結合後再固定化於支持物上,或者,所述線性RNA探針預先固定化於支持物上。
條款
以下條款是本發明公開的一部分,將進一步說明本發明。
條款1 環形RNA前體,其包含從5'至3'方向按以下順序排列的以下元件: a) 3'自剪接內含子片段; b) 第一殘留成環元件; c) 感興趣的核苷酸序列; d) 第二殘留成環元件;和 e) 5'自剪接內含子片段; 其中所述環形RNA前體能夠通過其自剪接生成包含所述第一殘留成環元件、所述感興趣的核苷酸序列和所述第二殘留成環元件的環形RNA, 其中所述第一殘留成環元件和所述第二殘留成環元件總長度為大約5至大約100個核苷酸。
條款2 條款1所述的環形RNA前體,其中所述自剪接內含子選自I類內含子和II類內含子,例如,所述自剪接內含子是I類內含子。
條款3 條款1或2所述的環形RNA前體,其中所述自剪接內含子選自I類內含子的IC3亞類。
條款4 條款1至3中任一項所述的環形RNA前體,其中所述自剪接內含子選自藍藻魚腥藻屬(Anabaena)的I類內含子、T4噬菌體的I類內含子或者Azoarcus sp. BH72的I類內含子,例如,所述自剪接內含子是藍藻魚腥藻屬的I類內含子。
條款5 條款1至4中任一項所述的環形RNA前體,其中所述自剪接內含子選自魚腥藻屬pre-tRNA-Leu基因的I類內含子、T4噬菌體td基因的I類內含子或者Azoarcus sp. BH72 pre-tRNA-Leu基因的I類內含子,例如,所述自剪接內含子是魚腥藻屬pre-tRNA-Leu基因的I類內含子。
條款6 條款1至5中任一項所述的環形RNA前體,其中所述3'自剪接內含子片段衍生自天然自剪接內含子的3'端部分,即從內部分割位點到天然自剪接內含子的3'末端的部分,並且其中所述5'自剪接內含子片段衍生自天然自剪接內含子的5'端部分,即從內部分割位點到天然自剪接內含子的5'末端的部分,並且,所述3'自剪接內含子片段和所述5'自剪接內含子片段組合保留天然自剪接內含子的自剪接活性。
條款7 條款6所述的環形RNA前體,其中所述內部分割位點位於I類內含子的P6、P2、P5、P8或P9區域,或者II類內含子的D4區域,優選地,所述內部分割位點位於I類內含子的P6區域。
條款8 條款6或7所述的環形RNA前體,其中所述3'自剪接內含子片段與天然自剪接內含子的3'端部分具有至少75%、至少80%、至少85%、至少90%、至少95%、100%的序列相同性,並且所述5'自剪接內含子片段是與天然自剪接內含子的5'端部分具有至少75%、至少80%、至少85%、至少90%、至少95%、100%的序列相同性。
條款9 條款1至8中任一項所述的環形RNA前體,其中所述自剪接內含子是魚腥藻屬pre-tRNA-Leu基因的I類內含子,並且所述3'自剪接內含子片段包含SEQ ID NO:1的核苷酸序列或與SEQ ID NO:1具有至少75%、至少80%、至少85%、至少90%、至少95%、100%相同性的核苷酸序列,或由其組成;並且所述5'自剪接內含子片段包含SEQ ID NO:2的核苷酸序列或與SEQ ID NO:2具有至少75%、至少80%、至少85%、至少90%、至少95%、100%相同性的核苷酸序列,或由其組成。
條款10 條款1至8中任一項所述的環形RNA前體,其中所述自剪接內含子是T4噬菌體td基因的I類內含子,並且所述3'自剪接內含子片段包含SEQ ID NO:5的核苷酸序列或與SEQ ID NO:5具有至少75%、至少80%、至少85%、至少90%、至少95%、100%相同性的核苷酸序列,或由其組成;並且所述5'自剪接內含子片段包含SEQ ID NO:6的核苷酸序列或與SEQ ID NO:6具有至少75%、至少80%、至少85%、至少90%、至少95%、100%相同性的核苷酸序列,或由其組成。
條款11 條款1至8中任一項所述的環形RNA前體,其中所述自剪接內含子是Azoarcus sp. BH72 pre-tRNA-Leu基因的I類內含子,並且所述3'自剪接內含子片段包含SEQ ID NO:3的核苷酸序列或與SEQ ID NO:3具有至少75%、至少80%、至少85%、至少90%、至少95%、100%相同性的核苷酸序列,或由其組成;並且所述5'自剪接內含子片段包含SEQ ID NO:4的核苷酸序列或與SEQ ID NO:4具有至少75%、至少80%、至少85%、至少90%、至少95%、100%相同性的核苷酸序列,或由其組成。
條款12 條款1至11中任一項所述的環形RNA前體,其中所述第一殘留成環元件和第二殘留成環元件使得包含其的環形RNA,相對於對照RNA,例如包含SEQ ID NO:29和SEQ ID NO:64的成環元件的對照環形RNA,或者包含相同感興趣的核苷酸序列的對照線性RNA,具有降低的免疫原性。
條款13 條款1至12中任一項所述的環形RNA前體,其中所述第一殘留成環元件和第二殘留成環元件使得包含其的環形RNA或環形RNA前體,相對於對照環形RNA或環形RNA前體,例如分別包含SEQ ID NO:29和SEQ ID NO:64 (Ana3.0)的第一殘留成環元件和第二殘留成環元件的對照環形RNA或環形RNA前體,具有相當的或增加的成環效率。
條款14 條款1至13中任一項所述的環形RNA前體,其中所述第一殘留成環元件和所述第二殘留成環元件總長度為大約20至大約35個核苷酸。
條款15 條款1至14中任一項所述的環形RNA前體,其中所述第一殘留成環元件和所述第二殘留成環元件被設置為能夠形成莖環(stem-loop)結構,例如,在自剪接環化後。 條款16 條款15所述的環形RNA前體,其中所述莖環結構的環(loop)中包含剪接位點(splicing junction)。
條款17 條款15至16中任一項所述的環形RNA前體,其中所述第一殘留成環元件包含下式所述序列結構:5'-第一環(loop)序列-第一配對序列-第一非配對序列-3';且所述第二殘留成環元件包含下式所述序列結構:5'-第二非配對序列-第二配對序列-第二環序列-3', 其中所述第一非配對序列或第二非配對序列可以獨立地存在或不存在, 所述第一配對序列和所述第二配對序列可互補配對形成所述莖環結構的莖,其中第一環序列和第二環序列可形成所述莖環結構的環,例如,通過自剪接環化。
條款18 條款17所述的環形RNA前體,其中所述第一環序列包含一個或多個可以與對應自剪接內含子的P1區域配對而在環化過程中形成P10雙鏈區的核苷酸,或由其組成。
條款19 條款17或18所述的環形RNA前體,其中所述第一環序列由(N)n核苷酸序列組成,其中N表示任何核苷酸(A、G、U或C),n表示1至20之間的整數,例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20。
條款20 條款17至19中任一項所述的環形RNA前體,其中所述第一環序列包含AAAA、AA、UUUU、CAAA或GAAA或由其組成,優選為AAAA。
條款21 條款17至20中任一項所述的環形RNA前體,其中所述第二環序列包含一個或多個可以與對應自剪接內含子的導向序列(internal guide sequence, IGS)配對而在環化過程中形成P1雙鏈區的核苷酸,或由其組成。
條款22 條款17至21中任一項所述的環形RNA前體,其中所述第二環序列包含CUU或CUC,優選為CUU。
條款23 條款17至22中任一項所述的環形RNA前體,其中所述莖環結構的環具有CUUAAAA、CUUUUUU、CUUAA、CUUGAAA、CUUUAAA、CUUCAAA或CUCAAAA序列,優選為CUUAAAA。
條款24 條款17至23中任一項所述的環形RNA前體,其中所述莖環結構中的莖部分包含2至15個或更多個連續鹼基對。優選地,所述莖環結構中的莖部分包含5、6或7個連續鹼基對。
條款25 條款17至24中任一項所述的環形RNA前體,其中所述莖環結構中的莖部分包含至多2個鹼基錯配,或者所述莖部分只包含1個鹼基錯配,優選地,所述莖部分不包含鹼基錯配。
條款26 條款17至25中任一項所述的環形RNA前體,其中所述第一配對序列僅包含G,所述第二配對序列僅包含C。
條款27 條款17至25中任一項所述的環形RNA前體,其中所述第一配對序列僅包含C,所述第二配對序列僅包含G。
條款28 條款17至25中任一項所述的環形RNA前體,其中所述第一配對序列僅包括A,所述第二配對序列僅包括U。
條款29 條款17至25中任一項所述的環形RNA前體,其中所述第一配對序列包含SEQ ID NO:42至55中的任一序列或由其組成,並且,所述第二配對序列包含SEQ ID NO:78至93中的任一序列或由其組成。
條款30 條款15至29中任一項所述的環形RNA前體,其中所述莖環結構的經預測的自由能小於大約-1 kal/mol,小於大約-2 kal/mol,小於大約-3 kal/mol,小於大約-4 kal/mol,小於大約-5 kal/mol,小於大約-6 kal/mol,小於大約-7 kal/mol,小於大約-8 kal/mol,小於大約-9 kal/mol,小於大約-10 kal/mol,或更小。
條款31 條款1至30中任一項所述的環形RNA前體,其中所述第一殘留成環元件包含從5'到3'方向的3'外顯子區域和可選的第一間隔子,或由其組成;所述第二殘留成環元件包含從3'到5'方向的5'外顯子區域和可選的第二間隔子,或由其組成。
條款32 條款31所述的環形RNA前體,其中所述3'外顯子區域衍生於自剪接內含子的天然3'外顯子,所述5'外顯子區域衍生於自剪接內含子的天然5'外顯子,並且3'外顯子區域和5'外顯子區域可以被自剪接內含子或3'自剪接內含子片段和5'自剪接內含子片段的結合所識別和/或剪接。
條款33 條款32所述的環形RNA前體,其中所述3'外顯子區域是與天然3'外顯子或從天然3'外顯子的5'端核苷酸開始的約1至約50個核苷酸的連續片段具有至少50%、至少60%、至少70%、至少80%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的序列, 所述5'外顯子區域是與天然5'外顯子或從天然5'外顯子的3'端核苷酸開始的約1至約50個核苷酸的連續片段具有至少50%、至少60%、至少70%、至少80%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的序列。
條款34 條款1至33中任一項所述的環形RNA前體,其中所述第一殘留成環元件包含與選自SEQ ID NO:13至55的核苷酸序列具有至少50%,至少60%,至少70%,至少80%,至少90%,至少95%或100%序列相同性的核苷酸序列或由其組成。
條款35 條款1至34中任一項所述的環形RNA前體,其中所述第二殘留成環元件包含與選自SEQ ID NO:56至93的核苷酸序列具有至少50%,至少60%,至少70%,至少80%,至少90%,至少95%或100%序列相同性的核苷酸序列或由其組成。
條款36 條款1至35中任一項所述的環形RNA前體,其中所述第一殘留成環元件包含SEQ ID NO:13至55中的任一核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56-93中的任一核苷酸序列或由其組成。
條款37 條款1至36中任一項所述的環形RNA前體,其中, 1)所述第一殘留成環元件包含SEQ ID NO:15的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:57的核苷酸序列或由其組成; 2)所述第一殘留成環元件包含SEQ ID NO:14的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:58的核苷酸序列或由其組成; 3)所述第一殘留成環元件包含SEQ ID NO:18的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:59的核苷酸序列或由其組成; 4)所述第一殘留成環元件包含SEQ ID NO:19的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:60的核苷酸序列或由其組成; 5)所述第一殘留成環元件包含SEQ ID NO:20的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:61的核苷酸序列或由其組成; 6)所述第一殘留成環元件包含SEQ ID NO:21的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:62的核苷酸序列或由其組成; 7)所述第一殘留成環元件包含SEQ ID NO:23的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 8)所述第一殘留成環元件包含SEQ ID NO:24的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 9)所述第一殘留成環元件包含SEQ ID NO:26的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 10)所述第一殘留成環元件包含SEQ ID NO:27的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 11)所述第一殘留成環元件包含SEQ ID NO:28的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 12)所述第一殘留成環元件包含SEQ ID NO:13的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:67的核苷酸序列或由其組成; 13)所述第一殘留成環元件包含SEQ ID NO:13的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:59的核苷酸序列或由其組成; 14)所述第一殘留成環元件包含SEQ ID NO:17的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:59的核苷酸序列或由其組成; 15)所述第一殘留成環元件包含SEQ ID NO:22的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:63的核苷酸序列或由其組成。
條款38 環形RNA前體,其包含從5'至3'方向按以下順序排列的以下元件: a) 3'自剪接內含子片段; b) 第一殘留成環元件; c) 感興趣的核苷酸序列; d) 第二殘留成環元件;和 e) 5'自剪接內含子片段; 其中所述環形RNA前體能夠通過其自剪接生成包含所述第一殘留成環元件、所述感興趣的核苷酸序列和所述第二殘留成環元件的環形RNA, 其中所述第一殘留成環元件和所述第二殘留成環元件總長度為大約5至大約100個核苷酸, 其中所述自剪接內含子選自魚腥藻屬pre-tRNA-Leu基因的I類內含子, 其中所述3'自剪接內含子片段包含SEQ ID NO:1的核苷酸序列或與SEQ ID NO:1具有至少75%、至少80%、至少85%、至少90%、至少95%、100%相同性的核苷酸序列,或由其組成;並且所述5'自剪接內含子片段包含SEQ ID NO:2的核苷酸序列或與SEQ ID NO:2具有至少75%、至少80%、至少85%、至少90%、至少95%、100%相同性的核苷酸序列,或由其組成, 其中所述第一殘留成環元件包含與選自SEQ ID NO:13至55的核苷酸序列具有至少50%,至少60%,至少70%,至少80%,至少90%,至少95%或100%序列相同性的核苷酸序列或由其組成,並且所述第二殘留成環元件包含與選自SEQ ID NO:56至93的核苷酸序列具有至少50%,至少60%,至少70%,至少80%,至少90%,至少95%或100%序列相同性的核苷酸序列或由其組成。
條款39 條款38所述的環形RNA前體,其中所述3'自剪接內含子片段包含SEQ ID NO:1的核苷酸序列或由其組成,並且所述5'自剪接內含子片段包含SEQ ID NO:2的核苷酸序列或由其組成。
條款40 條款38或39所述的環形RNA前體,其中 1)所述第一殘留成環元件包含SEQ ID NO:15的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:57的核苷酸序列或由其組成; 2)所述第一殘留成環元件包含SEQ ID NO:14的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:58的核苷酸序列或由其組成; 3)所述第一殘留成環元件包含SEQ ID NO:18的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:59的核苷酸序列或由其組成; 4)所述第一殘留成環元件包含SEQ ID NO:19的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:60的核苷酸序列或由其組成; 5)所述第一殘留成環元件包含SEQ ID NO:20的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:61的核苷酸序列或由其組成; 6)所述第一殘留成環元件包含SEQ ID NO:21的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:62的核苷酸序列或由其組成; 7)所述第一殘留成環元件包含SEQ ID NO:23的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 8)所述第一殘留成環元件包含SEQ ID NO:24的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 9)所述第一殘留成環元件包含SEQ ID NO:26的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 10)所述第一殘留成環元件包含SEQ ID NO:27的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 11)所述第一殘留成環元件包含SEQ ID NO:28的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 12)所述第一殘留成環元件包含SEQ ID NO:13的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:67的核苷酸序列或由其組成; 13)所述第一殘留成環元件包含SEQ ID NO:13的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:59的核苷酸序列或由其組成; 14)所述第一殘留成環元件包含SEQ ID NO:17的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:59的核苷酸序列或由其組成; 15)所述第一殘留成環元件包含SEQ ID NO:22的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:63的核苷酸序列或由其組成。
條款41 條款1至40中任一項所述的環形RNA前體,其中所述環形RNA前體還包含能夠互補配對形成同源臂雙鏈區的5'同源臂序列和3'同源臂序列。
條款42 條款41所述的環形RNA前體,其中所述5'同源臂序列在所述3'自剪接內含子片段的上游,並且所述3'同源臂序列在所述5'自剪接內含子片段的下游。
條款43 條款1至42中任一項所述的環形RNA前體,其中所述同源臂的長度為約5-50個核苷酸,優選地,為約40個核苷酸。
條款44 條款41至43中任一項所述的環形RNA前體,其中所述兩個同源臂序列可以分別是polyA和polyT,或分別是polyG和polyC。
條款45 條款41至4中任一項所述的環形RNA前體,其中所述同源臂序列之一可以具有SEQ ID NO:151至162中的任一核苷酸序列或與SEQ ID NO:151至162中的任一具有至少50%,至少60%,至少70%,至少80%,至少90%,至少95%或至少99%序列相同性的核苷酸序列,而另一個同源臂序列可以具有相應的互補序列。
條款46 條款1至45中任一項所述的環形RNA前體,其中所述感興趣的核苷酸序列包含至少一個蛋白編碼序列和與其可操作地連接的轉譯起始元件例如內部核糖體進入位點(IRES)。
條款47 條款46所述的環形RNA前體,其中所述轉譯起始元件如IRES位於至少一個蛋白編碼序列的5'末端上游。
條款48 條款46所述的環形RNA前體,其中所述轉譯起始元件如IRES位於至少一個蛋白編碼序列的3'末端下游。
條款49 條款46至48中任一項所述的環形RNA前體,其中所述蛋白編碼序列編碼真核、原核或者病毒來源的蛋白質,例如,用於治療或診斷用途的任何蛋白質。
條款50 條款46至49中任一項所述的環形RNA前體,其中所述轉譯起始元件是內部核糖體進入位點(IRES),IRES序列可以選自但不限於以下的IRES序列:Taura症候群病毒、吸血獵蝽病毒、泰累爾氏腦脊髓炎病毒、猿猴病毒40、紅火蟻病毒1、禾谷縊管蚜病毒、網狀內皮增生症病毒、福曼脊髓灰質炎病毒1、大豆尺蠖病毒、喀什米爾蜂病毒、人鼻病毒2、琉璃葉蟬病毒-1、人免疫缺陷病毒1型、琉璃葉蟬病毒-1、虱P病毒、C型肝炎病毒、A型肝炎病毒、GB型肝炎病毒、***病毒、人腸道病毒71、馬鼻病毒、茶尺蠖樣病毒、腦心肌炎病毒(EMCV)、果蠅C病毒、十字花科煙草病毒、蟋蟀麻痹病毒、牛病毒性腹瀉病毒1、黑皇后細胞病毒、蚜蟲致死麻痹病毒、禽腦脊髓炎病毒、急性蜂麻痹病毒、芙蓉枯黃環斑病毒、豬瘟病毒、人類FGF2、人類SFTPA1、人類AMLl/RUNXl、果蠅觸角、人類AQP4、人類AT1R、人類BAG-1、人類BCL2、人類BiP、人類c-IAPl、人類c-myc、人類eIF4G、小鼠NDST4L、人類LEF1、小鼠HIF1α、人類n.myc、小鼠Gtx、人類p27kipl、人類PDGF2/c-sis、人類p53、人類Pim-1、小鼠Rbm3、果蠅reaper、犬Scamper、果蠅Ubx、人類UNR、小鼠UtrA、人類VEGF-A、人類XIAP、果蠅hairless、釀酒酵母TFIID、釀酒酵母YAP1、人類c-src、人類FGF-1、猿猴小核糖核酸病毒、蕪菁縐縮病病毒、eIF4G的適體、柯薩奇病毒B3 (CVB3)或柯薩奇病毒A (CVA1/2),優選地,所述IRES是CVB3、BRAV-1_L、PV1_L、CAV2_L、BRAV-1、PV1或CAV2。
條款51 條款46至50中任一項所述的環形RNA前體,其中所述IRES包含SEQ ID NO:105至135之一所示的核苷酸序列,或包含與SEQ ID NO:105至135之一具有至少75%,例如,至少80%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%序列相同性的核苷酸序列。
條款52 條款1至45中任一項所述的環形RNA前體,其中所述感興趣的核苷酸序列是非蛋白編碼序列,例如,所述非蛋白編碼序列選自反義RNA、適配體、嚮導RNA或者天然存在於生物體內的非蛋白編碼RNA。
條款53 條款1至52中任一項所述的環形RNA前體,其中所述感興趣的核苷酸序列長度為約10至約20000個核苷酸。
條款54 條款1至53中任一項所述的環形RNA前體,其中所述環形RNA前體不包含核苷酸化學修飾。
條款55 用於產生環形RNA分子的核酸載體,所述載體包含條款1-54中任一項所述的環形RNA前體的編碼序列。
條款56 條款55所述的核酸載體,其還包含與所述環形RNA前體編碼序列可操作地連接的RNA聚合酶啟動子序列。
條款57 條款56所述的核酸載體,其中所述啟動子是T7 RNA聚合酶啟動子、T6病毒RNA聚合酶啟動子、SP6病毒RNA聚合酶啟動子、T3病毒RNA聚合酶啟動子或T4病毒RNA聚合酶啟動子,優選地是T7 RNA聚合酶啟動子。
條款58 環形RNA,其由條款1至54中任一項所述的環形RNA前體製備或者由條款55至57中任一項所述的核酸載體製備。
條款59 環形RNA,其包含第一殘留成環元件、感興趣的核苷酸序列和第二殘留成環元件,其中所述第一殘留成環元件、感興趣的核苷酸序列和第二殘留成環元件由條款1至54中任一項所定義。
條款60 環形RNA,其包含第一殘留成環元件、感興趣的核苷酸序列和第二殘留成環元件, 其中所述第一殘留成環元件和第二殘留成環元件的總長度為約5至約100個核苷酸。
條款61 條款60所述的環形RNA,其中所述第一殘留成環元件和第二殘留成環元件通過自剪接內含子參與RNA環化,例如I類內含子,優選地魚腥藻屬pre-tRNA-Leu基因的I類內含子。
條款62 條款60或61所述的環形RNA,其中所述第一殘留成環元件和第二殘留成環元件共價連接,例如,所述第一殘留成環元件的5'端和所述第二殘留成環元件的3'端共價連接
條款63 條款60至62中任一項所述的環形RNA,其中所述第一殘留成環元件和第二殘留成環元件使得包含其的環形RNA,相對於對照RNA,例如包含SEQ ID NO:29和SEQ ID NO:64的殘留成環元件的對照環形RNA或者包含相同感興趣的核苷酸序列的對照線性RNA具有降低的免疫原性。
條款64 條款60至63中任一項所述的環形RNA,其中所述第一殘留成環元件和第二殘留成環元件使得包含其的環形RNA,相對於對照環形RNA,例如包含SEQ ID NO:29和SEQ ID NO:64 (Ana3.0)的殘留成環元件的對照環形RNA,具有相當的或增加的成環效率。
條款65 條款60至64中任一項所述的環形RNA,其中所述第一殘留成環元件和第二殘留成環元件的總長度為約20-約35個核苷酸。
條款66 條款60至65中任一項所述的環形RNA,其中所述第一殘留成環元件和所述第二殘留成環元件被設置為能夠形成莖環結構。
條款67 條款66所述的環形RNA,其中所述莖環結構的環中包含所述第一殘留成環元件和所述第二殘留成環元件之間的剪接位點。
條款68 條款60至67中任一項所述的環形RNA,其中所述第一殘留成環元件包含下式所述序列結構:5'-第一環序列-第一配對序列-第一非配對序列-3';且所述第二殘留成環元件包含下式所述序列結構:5'-第二非配對序列-第二配對序列-第二環序列-3', 其中所述第一非配對序列或第二非配對序列可以獨立地存在或不存在, 所述第一配對序列和所述第二配對序列可互補配對形成所述莖環結構的莖,其中第一環序列和第二環序列可形成所述莖環結構的環。
條款69 條款68所述的環形RNA,其中所述第一環序列包含一個或更多個可以在環化過程中與對應自剪接內含子的P1區域配對形成P10雙鏈區的核苷酸,或由其組成。
條款70 條款68或69所述的環形RNA,其中所述第一環序列包含(N)n核苷酸序列或由其組成,其中N表示任何核苷酸(A、G、U或C),n表示1-20之間的整數,例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20。
條款71 條款68至70中任一項所述的環形RNA,其中所述第一環序列包含AAAA、AA、UUUU、CAAA或GAAA或由其組成,優選為AAAA。
條款72 條款68至71中任一項所述的環形RNA,其中所述第二環序列包含一個或多個可以與對應自剪接內含子的導向序列(internal guide sequence, IGS)配對而在環化過程中形成P1雙鏈區的核苷酸,或由其組成。
條款73 條款68至72中任一項所述的環形RNA,其中所述第二環序列包含CUU或CUC,優選為CUU。
條款74 條款68至73中任一項所述的環形RNA,其中所述莖環結構的環具有CUUAAAA、CUUUUUU、CUUAA、CUUGAAA、CUUUAAA、CUUCAAA或CUCAAAA序列,優選為CUUAAAA。
條款75 條款68至74中任一項所述的環形RNA,其中所述莖環結構中的莖部分包含2至15個或更多個連續鹼基對,優選地,所述莖環結構中的莖部分包含5、6或7個連續鹼基對。
條款76 條款68至75中任一項所述的環形RNA,其中所述莖環結構中的莖部分包含至多2個鹼基錯配,或者所述莖部分只包含1個鹼基錯配,優選地,所述莖部分不包含鹼基錯配。
條款77 條款68至76中任一項所述的環形RNA,其中所述第一配對序列僅包含G,所述第二配對序列僅包含C。
條款78 條款68至76中任一項所述的環形RNA,其中所述第一配對序列僅包含C,所述第二配對序列僅包含G。
條款79 條款68至76中任一項所述的環形RNA,其中所述第一配對序列僅包括A,所述第二配對序列僅包括U。
條款80 條款68至76中任一項所述的環形RNA,其中所述第一配對序列包含SEQ ID NO:42至55中的任一序列或由其組成,並且,所述第二配對序列包含SEQ ID NO:78至93中的任一序列或由其組成。
條款81 條款67至80中任一項所述的環形RNA,其中所述莖環結構的經預測的自由能小於大約-1 kal/mol,小於大約-2 kal/mol,小於大約-3 kal/mol,小於大約-4 kal/mol,小於大約-5 kal/mol,小於大約-6 kal/mol,小於大約-7 kal/mol,小於大約-8 kal/mol,小於大約-9 kal/mol,小於大約-10 kal/mol,或更小。
條款82 條款60至81中任一項所述的環形RNA,其中所述第一殘留成環元件包含從5'到3'方向的3'外顯子區域和可選的第一間隔子,或由其組成;所述第二殘留成環元件包含從3'到5'方向的5'外顯子區域和可選的第二間隔子,或由其組成。
條款83 條款82所述的環形RNA,其中所述3'外顯子區域衍生於自剪接內含子的天然3'外顯子,所述5'外顯子區域衍生於自剪接內含子的天然5'外顯子,並且3'外顯子區域和5'外顯子區域可以被自剪接內含子或3'自剪接內含子片段和5'自剪接內含子片段的結合所識別和/或剪接。
條款84 條款83所述的環形RNA,其中所述3'外顯子區域是與天然3'外顯子或從天然3'外顯子的5'端核苷酸開始的約1至約50個核苷酸的連續片段具有至少50%、至少60%、至少70%、至少80%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的序列, 所述5'外顯子區域是與天然5'外顯子或從天然5'外顯子的3'端核苷酸開始的約1至約50個核苷酸的連續片段具有至少50%、至少60%、至少70%、至少80%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的序列。
條款85 條款60至84中任一項所述的環形RNA,其中所述第一殘留成環元件包含與選自SEQ ID NO:13-55的核苷酸序列具有至少50%,至少60%,至少70%,至少80%,至少90%,至少95%或100%序列相同性的核苷酸序列或由其組成。
條款86 條款60至85中任一項所述的環形RNA,其中所述第二殘留成環元件包含與選自SEQ ID NO:56-93的核苷酸序列具有至少50%,至少60%,至少70%,至少80%,至少90%,至少95%或100%序列相同性的核苷酸序列或由其組成。
條款87 條款60至86中任一項所述的環形RNA,其中所述第一殘留成環元件包含SEQ ID NO:13-55中的任一核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56-93中的任一核苷酸序列或由其組成。
條款88 條款60至87中任一項所述的環形RNA,其中, 1)所述第一殘留成環元件包含SEQ ID NO:15的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:57的核苷酸序列或由其組成; 2)所述第一殘留成環元件包含SEQ ID NO:14的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:58的核苷酸序列或由其組成; 3)所述第一殘留成環元件包含SEQ ID NO:18的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:59的核苷酸序列或由其組成; 4)所述第一殘留成環元件包含SEQ ID NO:19的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:60的核苷酸序列或由其組成; 5)所述第一殘留成環元件包含SEQ ID NO:20的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:61的核苷酸序列或由其組成; 6)所述第一殘留成環元件包含SEQ ID NO:21的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:62的核苷酸序列或由其組成; 7)所述第一殘留成環元件包含SEQ ID NO:23的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 8)所述第一殘留成環元件包含SEQ ID NO:24的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 9)所述第一殘留成環元件包含SEQ ID NO:26的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 10)所述第一殘留成環元件包含SEQ ID NO:27的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 11)所述第一殘留成環元件包含SEQ ID NO:28的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 12)所述第一殘留成環元件包含SEQ ID NO:13的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:67的核苷酸序列或由其組成; 13)所述第一殘留成環元件包含SEQ ID NO:13的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:59的核苷酸序列或由其組成; 14)所述第一殘留成環元件包含SEQ ID NO:17的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:59的核苷酸序列或由其組成; 15)所述第一殘留成環元件包含SEQ ID NO:22的核苷酸序列或由其組成,並且所述第二殘留成環元件包含SEQ ID NO:63的核苷酸序列或由其組成。
條款89 條款60-88中任一項所述的環形RNA,其中所述感興趣的核苷酸序列包含至少一個蛋白編碼序列和與其可操作地連接的轉譯起始元件例如內部核糖體進入位點(IRES)。
條款90 條款89所述的環形RNA,其中所述轉譯起始元件如IRES位於至少一個蛋白編碼序列的5'端上游。
條款91 條款89所述的環形RNA,其中所述轉譯起始元件如IRES位於至少一個蛋白編碼序列的3'端下游。
條款92 條款89至91中任一項所述的環形RNA,其中所述蛋白編碼序列編碼真核、原核或者病毒來源的蛋白質,例如,用於治療或診斷用途的蛋白質。
條款93 條款89至92中任一項所述的環形RNA,其中所述轉譯起始元件是內部核糖體進入位點(IRES),IRES序列可以選自但不限於以下的IRES序列:Taura症候群病毒、吸血獵蝽病毒、泰累爾氏腦脊髓炎病毒、猿猴病毒40、紅火蟻病毒1、禾谷縊管蚜病毒、網狀內皮增生症病毒、福曼脊髓灰質炎病毒1、大豆尺蠖病毒、喀什米爾蜂病毒、人鼻病毒2、琉璃葉蟬病毒-1、人免疫缺陷病毒1型、琉璃葉蟬病毒-1、虱P病毒、C型肝炎病毒、A型肝炎病毒、GB型肝炎病毒、***病毒、人腸道病毒71、馬鼻病毒、茶尺蠖樣病毒、腦心肌炎病毒(EMCV)、果蠅C病毒、十字花科煙草病毒、蟋蟀麻痹病毒、牛病毒性腹瀉病毒1、黑皇后細胞病毒、蚜蟲致死麻痹病毒、禽腦脊髓炎病毒、急性蜂麻痹病毒、芙蓉枯黃環斑病毒、豬瘟病毒、人類FGF2、人類SFTPA1、人類AMLl/RUNXl、果蠅觸角、人類AQP4、人類AT1R、人類BAG-1、人類BCL2、人類BiP、人類c-IAPl、人類c-myc、人類eIF4G、小鼠NDST4L、人類LEF1、小鼠HIF1α、人類n.myc、小鼠Gtx、人類p27kipl、人類PDGF2/c-sis、人類p53、人類Pim-1、小鼠Rbm3、果蠅reaper、犬Scamper、果蠅Ubx、人類UNR、小鼠UtrA、人類VEGF-A、人類XIAP、果蠅hairless、釀酒酵母TFIID、釀酒酵母YAP1、人類c-src、人類FGF-1、猿猴小核糖核酸病毒、蕪菁縐縮病病毒、eIF4G的適體、柯薩奇病毒B3 (CVB3)或柯薩奇病毒A (CVA1/2),優選地,所述IRES是CVB3、BRAV-1_L、PV1_L、CAV2_L、BRAV-1、PV1或CAV2。
條款94 條款89至93中任一項所述的環形RNA,其中所述IRES包含SEQ ID NO:105至135之一所示的核苷酸序列,或包含與SEQ ID NO:105-135之一具有至少75%,例如,至少80%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%序列相同性的核苷酸序列。
條款95 條款60至88中任一項所述的環形RNA,其中所述感興趣的核苷酸序列是非蛋白編碼序列,例如,所述非蛋白編碼序列選自反義RNA、適配體、嚮導RNA或者天然存在於生物體內的非蛋白編碼RNA。
條款96 條款60至95中任一項所述的環形RNA,其中所述感興趣的核苷酸序列長度為約10至約20000個核苷酸。
條款97 條款60至96中任一項所述的環形RNA,其中所述環形RNA不包含核苷酸化學修飾。
條款98 條款1至54中任一項所述的環形RNA前體和/或條款58-97中任一項所述的環形RNA作為表現載體的用途。
條款99 藥物組合物,其包含條款1至54中任一項所述的環形RNA前體和/或條款55至57中任一項所述的核酸載體和/或條款58-97中任一項所述的環形RNA,以及藥學上可接受的載體。
條款100 條款99所述的藥物組合物,其在治療個體疾病中的用途。
條款101 製備環形RNA的方法,所述方法包括: 1) 提供條款1至54中任一項所述的環形RNA前體或從條款55至57中任一項所述的核酸載體轉錄獲得環形RNA前體; 2) 在存在二價金屬陽離子的情況下,在RNA環化發生的溫度下培育環形RNA前體;和 3) 收穫步驟2)所獲得的環形RNA。
條款102 條款101所述的方法,其中所述二價金屬陽離子是Mg 2+和/或Mn 2+
條款103 條款101或102所述的方法,其中所述二價金屬陽離子的濃度為大約5mM至大約550mM。
條款104 製備環形RNA的方法,所述方法包括 a) 提供作為轉錄範本的包含基於自剪接內含子的RNA環化元件的核酸載體;和 b) 在包含二價金屬陽離子和RNA聚合酶的體外轉錄系統中培育所述核酸載體第一時間段,期間體外轉錄產生的線性RNA在所述RNA環化元件的作用下自我環化以產生環形RNA。
條款105 條款104所述的方法,其中所述核酸載體是條款55-57中任一項所述的核酸載體。
條款106 條款104或105所述的方法,其中所述體外轉錄系統中的二價金屬陽離子是Mg2 +
條款107 條款104-106中任一項所述的方法,其中所述體外轉錄系統還包含一價金屬陽離子和/或一價陰離子。
條款108 條款107所述的方法,其中所述一價金屬陽離子是Na +或K +
條款109 條款107所述的方法,其中所述一價金屬陰離子是Cl -或CH3COO -(OAc)。
條款110 條款104至109中任一項所述的方法,其中所述第一時間段內系統中所述二價金屬陽離子的濃度為大約5mM至大約50mM。
條款111 條款107至110中任一項所述的方法,其中所述第一時間段內系統中所述一價金屬陽離子的濃度為大約5mM至大約100mM,。
條款112 條款107至111中任一項所述的方法,其中所述第一時間段內系統中所述一價陰離子的濃度為大約5mM至大約150mM。
條款113 條款107至112中任一項所述的方法,其中所述方法不包括分離和/或純化體外轉錄產生的線性RNA的步驟。
條款114 條款107至113中任一項所述的方法,其中所述體外轉錄系統的緩衝液選自Tris鹽酸緩衝液,或HEPES緩衝液,或MES緩衝液,或檸檬酸緩衝液,或磷酸緩衝液,優選地,所述體外轉錄系統的緩衝液是HEPES緩衝液。
條款115 條款107至114中任一項所述的方法,其中所述體外轉錄系統的pH範圍是約5-約8,優選地,所述體外轉錄系統的pH為約7.5。
條款116 條款107至115中任一項所述的方法,其中所述RNA聚合酶選自T7 RNA聚合酶、T6病毒RNA聚合酶、SP6病毒RNA聚合酶、T3病毒RNA聚合酶或T4病毒RNA聚合酶,優選地,所述RNA聚合酶是T7 RNA聚合酶。
條款117 條款107至116中任一項所述的方法,其中所述第一時間段為大約0.5小時至大約24小時,優選地,所述第一時間段為3小時。
條款118 條款107-117中任一項所述的方法,其中所述第一時間段的反應在大約16°C至大約60°C下進行,優選地,所述第一時間段的反應在大約37°C下進行。
條款119 條款107至118中任一項所述的方法,其中在所述步驟b)的第一時間段反應後,所述方法還包含步驟c): 向所述體外轉錄系統添加額外量的金屬陽離子並反應第二時間段;或者 改變所述系統的緩衝液,添加金屬陽離子並反應第二時間段。
條款120 條款119所述的方法,其中所述為第二時間段反應添加的金屬陽離子是二價金屬陽離子,例如Mg 2+或Mn 2+
條款121 條款119或120所述的方法,其中所述第二時間段的反應中,所述金屬陽離子添加至終濃度為大約5mM-大約550mM。
條款122 條款119或121所述的方法,其中所述第二時間段中,所述系統的緩衝液改為Tris鹽酸緩衝液,或HEPES緩衝液,或MES緩衝液,或檸檬酸緩衝液,或磷酸緩衝液。
條款123 條款119或122所述的方法,其中所述第二時間段反應系統的pH範圍是5至8。
條款124 條款119或123所述的方法,其中所述第二時間段為大約5分鐘至大約2小時。
條款125 條款119或124所述的方法,其中所述第二時間段的反應在大約25°C至大約75°C下進行。
條款126 條款104或125所述的方法,其中所述方法還包含回收或純化所產生的環形RNA的步驟。
條款127 純化環形RNA的方法,所述方法包括: a) 使包含環形RNA和未環化的線性環形RNA前體的混合物與環形RNA特異性探針在允許所述環形RNA特異性探針與所述環形RNA特異性結合並形成複合物的條件下接觸; b) 使所述複合物與所述混合物中未與所述環形RNA特異性探針結合的一種或多種組分分離;和 c) 從所述複合物釋放所述環形RNA。
條款128 條款127所述的方法,其中所述環形RNA通過環化線性環形RNA前體製備。
條款129 條款127或128所述的方法,其中所述環形RNA通過用RNA連接酶連接線性環形RNA前體的兩端而製備,或者,通過線性環形RNA前體中包含的基於自剪接內含子的環化元件的自剪接核酶活性而製備。
條款130 條款127至129中任一項所述的方法,其中所述環形RNA特異性探針是單鏈DNA或RNA探針。
條款131 條款127至130中任一項所述的方法,其中所述環形RNA特異性探針與所述環形RNA的環化連接點兩側區域特異性雜交。
條款132 條款127至131中任一項所述的方法,其中所述環形RNA特異性探針長度為約10個核苷酸-約35個核苷酸或更長。
條款133 條款127至132中任一項所述的方法,其中所述環形RNA特異性探針固定化於支持物例如固體支持物上,例如,所述環形RNA特異性探針在與所述環形RNA結合後再固定化於支持物上,或者所述環形RNA特異性探針預先固定化於支持物上。
條款134 條款127至133中任一項所述的方法,其中所述步驟a)中所述條件包括在大約60°C至大約95°C使RNA變性大約2分鐘至大約10分鐘,然後使溫度逐步降低至低於大約40°C使所述環形RNA與所述環形RNA特異性探針黏著。
條款135 條款134所述的方法,其中步驟c)通過將溫度升高至大約60°C至大約95°C(例如大約60°C、大約62°C、大約64°C、大約66°C、大約68°C、大約70°C、大約75°C、大約80°C、大約85°C、大約90°C、大約95°C)來釋放所述環形RNA。
條款136 條款127至133中任一項所述的方法,其中所述步驟a)中所述條件包括濃度範圍在0.25M-2M的高鹽。
條款137 條款136所述的方法,其中所述鹽為NaCl或胍鹽。
條款138 條款136或137所述的方法,其中步驟c)通過用洗脫緩衝液洗脫來釋放所述環形RNA,例如低鹽緩衝液。
條款139 條款138所述的方法,其中所述洗脫緩衝液是Tris-EDTA緩衝液(TE緩衝液)或水。
條款140 條款127至139中任一項所述的方法,其中步驟b)通過用洗滌緩衝液洗滌所述複合物來去除所述一種或多種組分。
條款141 條款127至140中任一項所述的方法,其中所述方法還包括以下步驟: i) 使包含環形RNA和未環化的線性環形RNA前體的混合物與線性環形RNA前體特異性探針在允許所述線性環形RNA前體特異性探針與所述線性環形RNA前體特異性結合並形成複合物的條件下接觸; ii) 從所述混合物去除所述線性環形RNA前體特異性探針與所述線性環形RNA前體形成的複合物,和 iii) 收集步驟ii)所得的包含環形RNA的混合物。
條款142 條款141所述的方法,其中步驟i)至iii)在步驟a)之前進行,例如在步驟a)之前進行多次步驟i)至iii),例如2次、3次、4次或更多次。
條款143 條款141所述的方法,其中步驟i)至iii)與步驟a)-c)同時進行。
條款144 純化環形RNA的方法,所述方法包括: i) 使包含環形RNA和未環化的線性環形RNA前體的混合物與線性環形RNA前體特異性探針在允許所述線性環形RNA前體特異性探針與所述線性環形RNA前體特異性結合並形成複合物的條件下接觸;和 ii) 從所述混合物去除所述線性環形RNA前體特異性探針與所述線性環形RNA前體形成的複合物, iii) 收集步驟ii)所得的包含環形RNA的混合物,和 視情況,進行多次所述步驟i)至iii),例如2次、3次、4次或更多次。
條款145 條款144所述的方法,其中所述線性環形RNA前體特異性探針特異性結合所述線性環形RNA前體而基本上不結合所述環形RNA。
條款146 條款144或145所述的方法,其中所述線性環形RNA前體特異性探針固定化於支持物例如固體支持物上,例如,所述線性環形RNA前體特異性探針在與所述線性環形RNA前體結合後再固定化於支持物上,或者,所述線性環形RNA前體特異性探針預先固定化於支持物上。
條款147 條款127至146中任一項所述的方法,其中所述線性環形RNA前體包含從5'至3'方向按以下順序排列的以下元件: a) 3'自剪接內含子片段; b) 第一殘留成環元件; c) 感興趣的核苷酸序列; d) 第二殘留成環元件;和 e) 5'自剪接內含子片段; 其中所述線性環形RNA前體能夠通過自剪接去除3'自剪接內含子片段和5'自剪接內含子片段,生成包含所述第一殘留成環元件、所述感興趣的核苷酸序列和所述第二殘留成環元件的環形RNA。
條款148 條款147所述的方法,其中所述環形RNA特異性探針至少與所述第一殘留成環元件的一部分和所述第二殘留成環元件的一部分特異性雜交。
條款149 條款147或148所述的方法,其中所述線性前體RNA特異性探針與所述線性環形RNA前體中除所述第一殘留成環元件、所述感興趣的核苷酸序列和所述第二殘留成環元件之外的部分雜交。
條款150 條款147至149中任一項所述的方法,其中所述線性前體RNA特異性探針與所述3'自剪接內含子片段或其部分或其5'側翼序列,或所述5'自剪接內含子片段或其部分或其3'側翼序列雜交。
條款151 條款147至150中任一項所述的方法,其中所述線性環形RNA前體包含選自SEQ ID NO:96至101的序列或其互補序列,優選SEQ ID NO:100或其互補序列,其在所述第一殘留成環元件、所述感興趣的核苷酸序列和所述第二殘留成環元件之外,所述線性前體RNA特異性探針與之特異性雜交。
條款152 條款147至151中任一項所述的方法,其中所述探針與所述混合物中RNA分子的摩爾比為大約1:1至大約100000:1。
條款153 純化環形RNA的方法,所述方法包括: i) 向包含環形RNA和線性RNA的混合物中的線性RNA添加線性RNA特異性標籤; ii) 使包含環形RNA和線性RNA的混合物與特異性結合所述標籤的線性RNA探針在允許所述探針與所述線性RNA特異性結合並形成複合物的條件下接觸;和 iii) 從所述混合物去除所述線性RNA探針與線性RNA形成的複合物, iv) 收集步驟ii)所得的包含環形RNA的混合物, 視情況,進行多次所述步驟ii)至iv),例如2次、3次、4次或更多次。
條款154 條款153所述的方法,其中所述標籤包含polyA、polyG、polyU或polyC序列。
條款155 條款153或154所述的方法,其中所述標籤的長度為大約10-200nt或所述探針的長度為大約10至200nt。
條款156 條款153至155中任一項所述的方法,其中所述標籤通過向所述混合物添加PolyA/T/C/G聚合酶或者連接酶而添加到線性RNA上。
條款157 條款153至156中任一項所述的方法,其中所述線性RNA探針特異性結合所添加的標籤而基本上不結合所述環形RNA。
條款158 條款153至157中任一項所述的方法,其中所述線性RNA探針是單鏈DNA探針,或是單鏈RNA探針。
條款159 條款153至158中任一項所述的方法,其中所述線性RNA探針固定化於支持物例如固體支持物上,例如,所述線性RNA探針在與所述線性RNA結合後再固定化於支持物上,或者,所述線性RNA探針預先固定化於支持物上。
條款160 產生環形RNA分子的核酸載體,其包含環形RNA前體的編碼序列,所述環形RNA前體包含從5'至3'方向按以下順序排列的以下元件: a) 3' Ⅰ類內含子片段; b) 第一殘留成環元件; c) 感興趣的核苷酸序列; d) 第二殘留成環元件;和 e) 5' Ⅰ類內含子片段; 其中,當通過所述核酸載體轉錄產生環形RNA前體時,所述環形RNA前體能夠生成包含所述第一殘留成環元件、所述感興趣的核苷酸序列和所述第二殘留成環元件的環形RNA; 其中所述第一殘留成環元件和所述第二殘留成環元件總長度為至少15個核苷酸,並且所述第一殘留成環元件和所述第二殘留成環元件在環形RNA中形成莖環結構。
條款161 條款160所述的核酸載體,其中所述第一殘留成環元件從5'至3'方向包含:b1) 3'外顯子區域;和/或b2) 5'間隔子。
條款162 條款160或161所述的核酸載體,其中所述第二殘留成環元件從5'至3'方向包含:d1) 3'間隔子;和/或d2) 5'外顯子區域。
條款163 條款160至162中任一項所述的核酸載體,其中所述3' Ⅰ類內含子片段和5' Ⅰ類內含子片段來自藍藻魚腥藻屬I類內含子或來自T4噬菌體I類內含子。
條款164 條款160至163中任一項所述的核酸載體,其中所述莖環結構中的莖部分包含至少3個鹼基對,或至少5個鹼基對,或至少7個鹼基對。
條款165 條款160至164中任一項所述的核酸載體,其中所述莖環結構中的莖部分包含至多2個鹼基錯配,或者至多1個鹼基錯配,或者不包含鹼基錯配。
條款166 條款160至165中任一項所述的核酸載體,其中所述第一殘留成環元件包含與選自SEQ ID NO:13、16、30和31中的核苷酸序列具有至少80%、至少90%、至少95%或100%序列相同性的核苷酸序列。
條款167 條款160至166中任一項所述的核酸載體,其中所述第二殘留成環元件包含與選自SEQ ID NO:56、57、59和65中的核苷酸序列具有至少80%、至少90%、至少95%或100%序列相同性的核苷酸序列。
條款168 條款160至167中任一項所述的核酸載體,其中所述第一殘留成環元件和所述第二殘留成環元件分別包含 SEQ ID NO:13和SEQ ID NO: 56;或 SEQ ID NO:31和SEQ ID NO:65;或 SEQ ID NO:30和SEQ ID NO:65;或 SEQ ID NO:13和SEQ ID NO:59;或 SEQ ID NO:16和SEQ ID NO:56;或 SEQ ID NO:13和SEQ ID NO:57。
條款169 條款160至168中任一項所述的核酸載體,其中所述3' Ⅰ類內含子片段包含SEQ ID NO:1所示的核苷酸序列,並且5' Ⅰ類內含子片段包含SEQ ID NO:2所示的核苷酸序列。
條款170 條款160至169中任一項所述的核酸載體,還包含5'同源臂和3'同源臂。
條款171 條款170所述的核酸載體,其中所述5'同源臂在所述3' Ⅰ類內含子片段的5'端,並且所述3'同源臂在所述5' Ⅰ類內含子片段的3'端。
條款172 條款160至171中任一項所述的核酸載體,其中所述感興趣的核苷酸序列包含蛋白編碼序列和與其可操作地連接的IRES(例如,CVB3 IRES)。
條款173 條款160至171中任一項所述的核酸載體,其中所述感興趣的核苷酸序列時非蛋白編碼序列。
條款174 條款160至173中任一項所述的核酸載體,還包含啟動子序列,例如T7啟動子,可操作地連接於環形RNA前體的編碼序列。
條款175 環形RNA,其 1) 由上述如請求項之一所述的核酸載體製備而成;和/或 2) 包含第一殘留成環元件、感興趣的核苷酸序列和第二殘留成環元件,其中所述第一和第二殘留成環元件總長度為至少15個核苷酸,並且所述第一殘留成環元件和第二殘留成環元件在環形RNA中形成莖環結構。
條款176 條款175所述的環形RNA,其中所述第一殘留成環元件從5'至3'方向包含:b1) 3'外顯子區域;和/或b2) 5'間隔子。
條款177 條款176所述的環形RNA,其中所述第二殘留成環元件從5'至3'方向包含:d1) 3'間隔子;和/或d2) 5'外顯子區域。
條款178 條款175至177中任一項所述的環形RNA,其中所述莖環結構中的莖部分包含至少3個鹼基對,或至少5個鹼基對,或至少7個鹼基對。
條款179 條款175至178中任一項所述的環形RNA,其中所述莖環結構中的莖部分包含至多2個鹼基錯配,或者至多1個鹼基錯配,或者不包含鹼基錯配。
條款180 條款175至179中任一項所述的環形RNA,其中所述第一殘留成環元件包含與選自SEQ ID NO:13、16、30和31中的核苷酸序列具有至少80%、至少90%、至少95%或100%序列相同性的核苷酸序列。
條款181 條款175至180中任一項所述的環形RNA,其中所述第二殘留成環元件包含與選自SEQ ID NO:56、57、59和65中的核苷酸序列具有至少80%、至少90%、至少95%或100%序列相同性的核苷酸序列。
條款182 條款175至181中任一項所述的環形RNA,其中所述第一殘留成環元件和所述第二殘留成環元件分別包含 SEQ ID NO:13和SEQ ID NO: 56;或 SEQ ID NO:31和SEQ ID NO:65;或 SEQ ID NO:30和SEQ ID NO:65;或 SEQ ID NO:13和SEQ ID NO:59;或 SEQ ID NO:16和SEQ ID NO:56;或 SEQ ID NO:13和SEQ ID NO:57。
條款183 藥物組合物,其包含條款1至174中任一項所述的核酸載體和/或條款175至182中任一項所述的環形RNA,以及藥學上可接受的載體。
實施例
下列實施例進一步說明本文所描述的發明並展示本發明的實施方案。本領域技術人員應知曉,在下列實施例中公開的技術,代表了由發明者發現的技術在本發明的實踐中很好地發揮了作用,因此可以被認為是其實踐的構成模式。然而,根據本發明公開的內容,本領域技術人員應知曉可以對所公開的具體實施方案進行更改,並仍能獲得在本發明請求保護的範圍內的類似結果。
實施例 1 、環形 RNA 成環方式
本實施例闡明多種環形RNA的體外成環方式(圖1),包括: 1)通過連接酶,例如RNA連接酶,DNA連接酶等,將體外轉錄產生的線性RNA的3'-OH末端和5'-磷酸末端以磷酸二酯鍵連結,形成環形RNA(圖2)。 2)利用DNA或者RNA 夾板(splint)與體外轉錄產生的線性RNA的末端鹼基互補配對,在連接酶(例如RNA連接酶,DNA連接酶等)催化下,將線性RNA的3'-OH末端和5'-磷酸末端以磷酸二酯鍵連結,形成環形RNA(圖3)。 3)通過自剪接核酶,例如基於I類內含子,基於II類內含子等,發生剪切和連接反應形成環形RNA。其基本原理是通過分子克隆法將外顯子E1與E2序列首尾相接,形成連續的環形質體。通過限制性內切酶將內含子剪切斷裂,得到線性質體。再通過倒置的3'內含子上游的啟動子進行體外轉錄,得到包含3'內含子-E2-E1-5'內含子結構的線狀RNA。外顯子E1的特定的剪切位點保守序列受游離的鳥苷酸3'羥基的親核攻擊而發生斷裂,外顯子E1產生裸露的3'羥基,而鳥苷酸則結合在斷裂的5'內含子上。其後,外顯子E1的裸露的3'羥基對3'內含子與外顯子E2之間的保守序列進行攻擊,將3'內含子切除,而外顯子E2與E1發生成環反應,得到環形的E1-E2 RNA(圖 4, 5)。 4)通過自剪切核酶(例如HDV,HHR,Twister等)和連接酶(例如RtcB等)共同作用,使線性RNA末端連接成環形RNA。其基本原理是通過分子克隆將5'和3'自剪切核酶序列分別置於線性質體末端,在啟動體外轉錄後,產生的線性RNA前體末端會自動被5'和3'末端核酶剪切,分別形成5'-OH和2',3'-環磷酸酯,隨後在連接酶(RtcB等)作用下,以磷酸二酯鍵連結末端,形成環形RNA(圖 6)。
實施例 2 I 類內含子殘留成環元件的引入導致環形 RNA 的免疫原性
體外合成的環形RNA主要包括2個元件,1)殘留成環元件,即成環反應過程中引入環形RNA終產物的額外序列;2)感興趣的序列(Cargo)(圖7)。殘留成環元件是由體外成環方法(主要通過核酶成環方式)所引入的額外殘留在環形RNA上的序列。以魚腥藻屬pre-tRNA I類內含子自剪接環化的方式(Wesselhoeft A. R.等人, (2018) Engineering circular RNA for potent and stable translation in eukaryotic cells.)為例,在成功製備的環形RNA終產物中會額外引入和殘留176個核苷酸序列。本實施例闡明環形RNA終產物中額外不必要核苷酸序列的殘留會對相應環形RNA終產物帶來負面的影響,至少包括可能干擾目的靶標序列的***,或潛在導致細胞內一定程度的天然免疫反應。
1. 環形RNA合成與純化 分別用三種方式(圖2、4、5)在體外製備純化環形RNA circPOLR2A: 方法一:通過RNA體外轉錄及T4 RNA連接酶分子內連接的方式成功製備環形RNA,並用變性的聚丙烯醯胺凝膠電泳(變性PAGE)純化的方式進行了體外純化得到高純度的 circPOLR2A(圖2)。 方法二:通過RNA體外轉錄及td I類內含子自剪切的方式(Chen G. Y.等人, (2017) Sensing Self and Foreign Circular RNAs by Intron Identity; Wesselhoeft A. R.等人, (2018) Engineering circular RNA for potent and stable translation in eukaryotic cells.) 成功製備環形RNA,並用變性PAGE純化的方式進行了體外純化得到高純度的 circPOLR2A(圖4)。 方法三:通過RNA體外轉錄及魚腥藻屬I類內含子環化的方式(Wesselhoeft A. R.等人, (2018) Engineering circular RNA for potent and stable translation in eukaryotic cells.)成功製備環形RNA,並用變性PAGE純化的方式進行了體外純化得到高純度的 circPOLR2A(圖5)。
2. 比較三種不同方式獲得的 circPOLR2A在細胞水準的免疫原性 通過上述三種環化的方式成功製備環形RNA,並用變性PAGE純化的方式進行了體外純化得到高純度的 circPOLR2A。然後,用脂質體轉染的方法在12孔板中將 circPOLR2A(200ng/孔)導入人源A549細胞,轉染1小時或6小時後,收集細胞,進行RT-qPCR檢測細胞因數IFNβ、TNFα、IL6和RIG-I的表現水準。 結果顯示,用方法一製備並純化的 circPOLR2A相對於雙鏈RNA Poly (I:C),未純化的RNA和線性的 POLR2A,不會導致檢測細胞因數IFNβ、TNFα、IL6和RIG-I的表現水準升高。這些資料充分說明方法一體外製備並純化的 circPOLR2A並不會引起顯著的免疫反應。相對的,通過方法二和方法三體外製備並純化的 circPOLR2A會導致細胞因數IFNβ、TNFα、IL6和RIG-I的表現水準升高。這些資料充分說明方法二和方法三製備的 circPOLR2A會引起增強的免疫反應。
3. 潛在的機制解釋 對三種方法製備的環形RNA的二級結構進行預測。結果如圖9所示,方法二及方法三製備的環形RNA,其通過環化方法額外引入的核苷酸序列殘留,額外引入的序列會形成穩定的雙鏈莖環結構(圖9的框內部分),推測該額外引入序列形成的穩定雙鏈莖環結構。所述雙鏈莖環結構引起了細胞內的天然免疫反應。
實施例 3 、改進的 I 類內含子殘留成環元件
如前文所述,通過體外轉錄及魚腥藻屬pre-tRNA I類內含子自剪接環化的方式在環形RNA終產物中額外引入並殘留176個核苷酸(Wesselhoeft等人, 2018 A. R., et al., (2018) Engineering circular RNA for potent and stable translation in eukaryotic cells.)。我們假設額外引入序列會引起的潛在的不利因素,尤其是導致細胞內一定程度的天然免疫反應。本實施方案對Wesselhoeft等人, 2018中的魚腥藻屬pre-tRNA I類內含子(命名為Ana3.0)自剪接環化的方式進行了一系列改良性探索。
1 縮短環形RNA中魚腥藻屬I類內含子產生的殘留成環元件的序列保持高效的環化效率 通過RNAstructure (https://rna.urmc.rochester.edu/RNAstructureWeb/index.html)對殘留的額外核苷酸序列進行初步的RNA二級結構預測表明,殘留的額外核苷酸序列傾向於形成一個比較長的莖環(stem-loop)結構,在不改變整體莖環結構的前提下,按距離剪接位點從遠到近的順序,基於和剪接位點的距離對殘留序列進行一系列截短(圖10),並檢測截短後對Anabaena I類內含子成環效率的影響。殘留序列截短版本保留99個核苷酸(Ana1.0)、保留66個核苷酸(Ana0.9)和保留27個核苷酸(AnaX)。以體外產生的環形 mCherry為例,Northern Blot結果顯示,保留27個核苷酸及以上,其成環效率與原始版本Ana3.0基本一致(圖10)。其中,RNase R用作驗證環形RNA環形結構的工具酶,能有效降解具有裸露末端的線性RNA,但不能降解環形RNA。
2 縮短環形RNA中魚腥藻屬I類內含子產生的殘留成環元件在細胞水準保持低免疫原性 為比較一系列截短後魚腥藻屬I類內含子自剪接合成環形RNA的免疫原性,在體外合成不同魚腥藻屬I類內含子截短版本的環形 mCherry,並通過Northern Blot檢測不同截短版本的純度(圖10)。轉染相同品質(200 ng)的不同截短版本環形 mCherry RNA以及線性mCherry mRNA到A549細胞中,在轉染6小時後,分別收集細胞,加入Trizol試劑根據說明書提取細胞的總RNA並進行RT-qPCR分別檢測細胞因數IFNβ、TNF、IL6和RIG-I的mRNA表現量。結果顯示,通過保留27個額外核苷酸的AnaX產生的環形 mCherry比其它魚腥藻屬I類內含子截短版本具有更低的免疫原性。另外,不同截短版本的環形 mCherry的免疫原性均比線性mCherry mRNA更低,與實施方案2中環形RNA相對線性RNA具有更低的免疫原性結論相一致。同時,T4連接酶方式形成的環形 mCherry的免疫原性最低(圖10)。其中,IFNβ、TNFα、IL6和RIG-I為常用的細胞內免疫原性檢測標記基因,陽性對照Poly (I:C)為常用的細胞水準長雙鏈RNA病毒刺激類比物。
3 AnaX-環形RNA的轉譯效率高於mRNA 為檢測轉譯效率,利用Lipofectamine MessengerMAX™ (Thermo Fisher)將和200 ng線性 mCherrymRNA和通過AnaX環化方法產生的不同量(6.25 ng-200 ng)包含殘留成環元件的環形 mCherryRNA導入到人源HEK293FT細胞中。利用螢光顯微鏡在不同時間點檢測轉譯產物mCherry的紅色螢光信號(圖11)。如圖11所示,在導入24小時後,導入200ng mRNA的細胞,其紅色螢光信號與導入50ng mCherry的細胞相似(圖11,紅色螢光定量統計結果),說明相對於線性 mCherrymRNA,AnaX以更高的細胞內轉譯效率合成環形 mCherry
4 AnaX-circular RNA的免疫原性低於mRNA 為檢測將線性mRNA轉染入細胞後引起的細胞內天然免疫反應,利用Lipofectamine MessengerMAX™ (Thermo Fisher)將200 ng線性 mCherrymRNA和通過AnaX環化方法產生的不同量(6.25 ng至200 ng)包含殘留成環元件的環形 mCherryRNA導入到人源A549細胞中。在轉染6小時後,分別收集細胞,加入Trizol試劑提取細胞的總RNA進行RT-qPCR分別檢測細胞因數IFNβ、TNFα、IL6和RIG-I的mRNA表現水準。結果所示,轉染200ng的線性 mCherrymRNA的A549細胞中相應細胞因數的表現水準要高於轉染通過AnaX產生的環形RNA的A549細胞中相應細胞因數的表現水準(圖12)。並且,在轉譯效率基本相同的前提下,轉染環形 mCherry的A549細胞幾乎沒有相應細胞因數水準的增加,說明在轉譯效率相同的情況下,通過AnaX產生的環形 mCherry相對於線性 mCherrymRNA,具有更低的免疫原性(圖12)。其中,IFNβ、TNFα、IL6和RIG-I為常用的細胞內免疫原性檢測標記基因,陽性對照Poly (I:C)為常用的長雙鏈RNA病毒類比物。
實施例 4 、用 AnaX 系統環化不同長度的 RNA
為檢測具有不同 長度感興趣的序列(cargo)的RNA環化情況,利用AnaX環化方法在體外產生各種環形RNA,包括EGF、FGF1、RBD、G6PC、PAH、 Luciferase和HGF,並在變性PAGE凝膠上檢測成環效率(圖13)。結果顯示,不同長度的RNA可以通過AnaX系統以高效率成環。然而,隨著cargo長度的增加,成環效率會減弱。RNase R是驗證環形RNA環形結構的工具酶,能有效降解具有裸露末端的線性RNA,但不能降解環形RNA。
為比較通過AnaX產生的具有不同長度cargo的環形RNA的免疫原性,轉染200 ng上述產生的RNA到A549細胞中,並且將相同量的具有相同編碼序列的mRNA用作對照。在轉染6小時後,分別收集細胞,加入Trizol試劑提取細胞的總RNA進行RT-qPCR分別檢測細胞因數IFNβ、TNFα、IL6和RIG-I的mRNA表現水準。如圖14所示,環形RNA比其對應的具有相同編碼序列的線性mRNA引起的免疫原性更低,與實施例2中的資料和結論相一致。IFNβ、TNFα、IL6和RIG-I為常用的細胞內免疫原性檢測標記基因,陽性對照Poly (I:C)為常用的長雙鏈RNA病毒刺激。
為檢測環形RNA和線性RNA在細胞內轉譯蛋白質的效率,利用Lipofectamine MessengerMAX™ (Thermo Fisher) RNA轉染試劑分別將AnaX合成的環形 RBD和環形 Luciferase以及其對應的具有相同編碼序列的mRNA轉染進HEK293FT細胞中,於24小時後收集細胞總蛋白質,通過Western Blot檢測其轉譯的蛋白質水準,結果顯示,通過AnaX產生的環形RNA其轉譯效率高於對應的具有相同編碼序列的線性mRNA(圖15)。
綜上,這一系列實施方案證明通過AnaX產生的環形RNA相對於其對應線性RNA具有更高的轉譯效率以及更低的免疫原性。更重要的是,對比Ana3.0(Wesselhoeft A. R.等人, (2018) Engineering circular RNA for potent and stable translation in eukaryotic cells.)產生的環形RNA,通過AnaX產生的環形RNA保留更少的殘留核苷酸,具有更低的免疫原性。
實施例 5 、對 AnaX 系統產生的環形 RNA 中的殘留成環元件序列的進一步改進
有文獻指出天然的魚腥藻屬tRNA-Leu I類內含子的外顯子反密碼子區域的莖環配對區域對I類內含子的自剪接反應是必要的(Zaug, A. J.等人, (1993). Self-splicing of the group I intron from Anabaena pre-tRNA: requirement for base-pairing of the exons in the anticodon stem. Biochemistry 32(31): 7946-7953.)。而AnaX殘留成環元件形成的莖環結構接近天然tRNA-Leu的天然反密碼子區域的莖環結構,基於這種結構在自剪接反應中有重要作用的原理產生合理設計。
1   干擾殘留成環元件莖環結構中莖的配對可導致成環效率減弱 AnaX殘留成環元件的莖環結構中有5個鹼基對(5bp)。突變體AnaXD1在3'端的第一殘留成環元件的配對區域中間引入G-A單鹼基突變,其對應的回補突變體AnaXRD1在5'端的第二殘留成環元件的對應位置引入C-T突變;為了破壞莖的配對區域,在AnaXD2中將3'端的第一殘留成環元件的配對區域5個鹼基ACGGA突變為互補的UGCCU;為了破壞莖的配對區域,在AnaXD3中將5'端的第二殘留成環元件的配對區域5個鹼基UCCGU突變為互補的AGGCA。回補突變體AnaXD2同時具有互補突變以在莖環結構中再次形成配對莖。根據初步的RNA二級結構預測,AnaXD1和AnaXD2攜帶的突變完全破壞特徵元件的莖環結構,AnaXD3則擾亂原有配對(5個鹼基對)產生有3個鹼基對的較弱結構。回補突變體AnaXRD1和AnaXRD2可以恢復殘留成環元件的莖環結構(圖16A)。 以 POLR2A的環化為例,在低鎂離子濃度(5mM MgCl 2)的緩衝液條件下體外轉錄產生前體RNA,隨後在自剪接反應緩衝液(50 mM Tris-HCl, 10 mM MgCl2, 1mM DTT, pH 7.5)中。在55℃培育一定時間後加入RNA變性上樣緩衝液以中止反應。變性PAGE顯示自剪接反應中前體和生成的環形RNA隨時間變化趨勢。AnaXD1和AnaXD3突變體在環化反應8分鐘內生成的環形RNA減少至AnaX版本的30%以下。AnaXD2幾乎無環形RNA生成,而AnaXRD1和AnaXRD2突變體中環形RNA的生成效率相較於以上3個突變體有不同程度恢復(圖17)。 綜上所述,AnaX殘留成環元件的莖環結構區域的鹼基配對是成環反應產生環形RNA的必要條件。
2   增加殘留成環元件莖環結構鹼基配對數目可導致成環效率增強 突變體AnaXE1在3'端第一殘留成環元件遠離剪接位點一側引入單鹼基突變,使莖環結構中莖部鹼基配對從5增加至7對;突變體AnaXE2在5'端第二殘留成環元件遠離剪接位點一側引入單鹼基突變,使莖環結構莖部鹼基配對從5增加至7對;突變體AnaXE3引入以上兩種突變,使莖環結構莖部鹼基配對增加至9對;突變體AnaXE4在突變體AnaXE1的基礎上在5'端第二殘留成環元件遠離剪接位點一側引入2個額外的核苷酸***,使莖環結構莖部鹼基配對增加至9對;突變體AnaXE5在突變體AnaXE1的基礎上在5’端第二殘留成環元件遠離剪接位點一側引入4個額外的核苷酸***,使莖環結構莖部鹼基配對增加至11對。AnaXE1、AnaXE4、AnaXE5在增強配對的同時保持了剪接位點附近第一殘留成環元件與內含子的配對,AnaXE2、AnaXE3則破壞了這一配對(圖16B)。 以 POLR2A的環化為例,在低鎂離子濃度(5mM MgCl 2)的緩衝液條件下體外轉錄產生前體RNA,隨後在自剪接反應緩衝液(50 mM Tris-HCl, 10 mM MgCl2, 1mM DTT, pH 7.5)下。在55℃培育一定時間後加入RNA變性上樣緩衝液以中止反應。變性PAGE結果顯示自剪接反應中前體和生成的環形RNA隨時間動態變化趨勢。AnaXE1、AnaXE4、AnaXE5的環形RNA生成速率較AnaX顯著提高,而AnaXE2、AnaXE3的環形RNA生成速率顯著降低(圖17)。 為了進一步驗證在殘留成環元件遠離剪接位點一側增加鹼基配對數可導致成環效率增強,通過體外轉錄產生了具有AnaX、AnaXE1和AnaXE4的殘留成環元件的螢火蟲 LuciferaseRNA並進一步用於成環反應。在這些殘留成環元件中比較成環效率。變性PAGE膠結果顯示在相同反應條件和相同反應時間內,AnaXE1和AnaXE4的環形RNA產物比AnaX更多(圖19A、B)。 綜上所述,增加殘留成環元件莖環結構莖中的鹼基互補配對數目可導致成環效率增強。
3   將殘留成環元件莖環結構的配對鹼基序列替換為人為設計序列以增強成環效率 通過增加莖環結構莖中的G/C比例可能會增強殘留成環元件莖環結構的莖穩定性。AnaXAU突變體的莖中包含大量AU配對,最小的配對鹼基必須為至少7對才能實現與AnaX相比更低的自由能(圖18)。突變體AnaXCGv1、AnaXCGv2和AnaXCGv3的莖區域中的配對鹼基被改為GC鹼基對。AnaXCGv1有5個GC鹼基對,AnaXCGv2、AnaXCGv3有7個GC鹼基對。AnaXCGv2的3'端第一殘留成環元件全部為G,AnaXCGv1、AnaXCGv3的3'端第一殘留成環元件全部為C(圖18)。 以 LuciferaseRNA的環化為例,在體外轉錄前體RNA後進行自剪接反應。變性PAGE膠結果顯示AnaXCGv3在反應2分鐘和8分鐘後環形RNA產物生成量多於AnaX。AnaXAU的環形RNA產物生成量與AnaX接近。在變性PAGE膠上,AnaXAU和AnaXCGv2的環形RNA產物生成量少於AnaX(圖19A、C)。AnaXCGv1和AnaXCGv3與AnaX相比產生更多量的環形RNA表明其導致環化效率升高,AnaXAU和AnaXCGv2與AnaX相比產生更少量的環形RNA表明其導致環化效率降低(圖20)。這些資料與上述結果一致。 以上對殘留成環元件的合理設計也被應用於產生環形 mCherryRNA。變性PAGE膠結果顯示AnaXAU、AnaXCGv1和AnaXCGv3的成環效率高於AnaX,AnaXCGv2的成環效率低於AnaX(圖20),表明殘留成環元件頸環結構的鹼基對組成對成環效率有顯著影響。成環效率也可以被感興趣的序列(cargo)的長度和鹼基組成影響,但是所有資料仍支援AnaXCGv1和AnaXCGv3增強成環效率。 綜上所述,AnaX殘留成環元件莖環結構莖的配對序列可被替換為人為設計的配對序列,且莖環結構中莖區域全為G/C配對的AnaXCGv1和AnaXCGv3導致攜帶不同鹼基組成和長度的cargo的RNA成環效率增強。
4 突變AnaX殘留成環元件對環形RNA免疫原性的影響 為比較AnaX與突變體的免疫原性,利用體外轉錄和成環產生包含AnaX、AnaXE1、AnaXE4、AnaXAU、AnaXCGv1、AnaXCGv2和AnaXCGv3的 LuciferaseRNA。相同品質(100 ng)的包含各種殘留成環元件的環形 Luciferase被轉染到人源A549細胞中。在轉染6小時後,分別收集細胞,加入Trizol試劑提取細胞的總RNA進行RT-qPCR檢測細胞因數IFNβ、TNFα、IL6和RIG-I的mRNA表現水準。結果顯示,包含AnaX、AnaXE4和AnaXCGv3的環形 Luciferase具有較低的免疫原性,引起IFNβ mRNA的表現上調平均值在25倍以內,引起RIG-I mRNA的表現上調平均值在7倍以內。TNFα和IL6的水準保持在很低的水準,沒有顯著變化(圖21)。IFNβ、TNFα、IL6和RIG-I為常用的細胞內免疫原性檢測標記基因,陽性對照Poly (I:C)為常用的長雙鏈RNA病毒刺激。
5 突變AnaX殘留成環元件對環形RNA轉譯效率的影響 為比較體外合成的具有AnaX殘留成環元件或者突變AnaX殘留成環元件的環形RNA的轉譯效率,通過體外轉錄產生 LuciferaseRNA並進一步進行了成環反應。在HEK293FT細胞中分別檢測了具有AnaX、AnaXE1、AnaXE4、AnaXAU、AnaXCGv1、AnaXCGv2和AnaXCGv3殘留成環元件的環形 LuciferaseRNA的轉譯。相同品質(200 ng)的體外環化的環形 Luciferase被轉染到人源293FT細胞中。在24小時後收集細胞提取總蛋白樣品。Western Blot結果顯示AnaXCGv1的Luciferase蛋白表現量低於AnaX,AnaXCGv2和AnaXCGv3的Luciferase蛋白表現量高於AnaX,AnaXE1、AnaXE4、AnaXAU的Luciferase蛋白表現量與AnaX接近(圖22A)。使用Actin蛋白作為Western Blot內參。此外,通過添加相應底物產生發光信號來測量螢光素酶的酶活性。發光信號反映細胞內螢光素酶的表現水準。結果顯示包含AnaXE4與AnaX殘留成環元件的環形 Luciferase的發光信號相似。AnaXCGv3環形 Luciferase的發光信號強度高於AnaX,其他構建體的發光信號強度顯著低於AnaX(圖22B)。 綜上所述,環形RNA的殘留成環元件形成的頸環結構,即AnaX和突變對於高環化效率至關重要。保留環結構的構形,增加莖鹼基配對數目或者加強莖鹼基配對(即,G/C鹼基對與A/T鹼基對相對)可以顯著提高成環效率。此外,這些殘留成環元件也會導致轉譯效率增高和細胞免疫原性降低。
6 改變殘留成環元件莖環結構中環的特定序列可抑制成環 魚腥藻屬Ⅰ類內含子的第一殘留成環元件、與剪接位點鄰近的3個核苷酸和內在導向序列(IGS)形成核酶的P1雙鏈區並決定5'剪接位點。第二殘留成環元件以及與剪接位點鄰近的數個鹼基參與形成核酶的P10雙鏈區並決定3'剪接位點。這兩部分序列形成殘留成環元件莖環結構中的環區域。為探索殘留成環元件莖環結構中環區域對RNA成環影響,針對環區域設計不同突變體(AnaXD5-AnaXD14)確定對成環效率的影響。突變體AnaXD 5是將第二殘留成環元件莖環結構環區域處AAAA改變成UUUU;突變體AnaXD 6是將第一殘留成環元件莖環結構環區域處CUU改變成CAA;突變體AnaXD 7是將第二殘留成環元件環區域處AAAA截斷成AA;突變體AnaXD 8是將第二殘留成環元件環區域處AAAA全部去除;突變體AnaXD 9是將第二殘留成環元件環區域處AAAA改變成GAAA;突變體AnaXD 10是將第二殘留成環元件環區域處AAAA改變成UAAA;突變體AnaXD 11是將第二殘留成環元件環區域處AAAA改變成CAAA;突變體AnaXD 12是將第一殘留成環元件環區域處CUU改變成CUC;突變體AnaXD 13是將第一特徵元件環區域處CUU改變成CUA;突變體AnaXD 14是將第一殘留成環元件環區域處CUU改變成CUG(圖23 A)。 以 POLR2A的環化為例,如果AnaX P1區莖環結構的環在突變體AnaXD 6、AnaXD 13和AnaXD14中被破壞,則RNA不能成環。在突變體AnaXD12中,第一殘留成環元件環區域處的CUU被改變成CUC,使AnaX系統P1的莖環處的GU配對轉變成GC配對,因此維持原來的構形,不影響成環。突變體AnaXD 5、AnaXD 7、AnaXD9、AnaXD10和AnaXD11分別改變或者截短第二殘留成環元件環區域鹼基,仍然保留成環效率。然而,完全去除第二成環殘留元件環區域所有鹼基(突變體AnaXD8)能顯著降低成環效率(圖23 B、C)。 綜上所述,第一殘留成環元件環區域突變而破壞的P1結構會導致RNA成環能力喪失。第二殘留成環元件環區域核苷酸作為連接子發揮作用。突變或者截短並不影響成環,但是環區域的核苷酸不能完全缺失。
實施例 6 AnaX 殘留成環元件的莖長度對成環的影響
本實施例探索AnaX殘留成環元件莖環結構莖區域成環所需要的最小鹼基配對數目。剪接位點附近莖環區域的環結構保留了一系列分別將殘留成環元件改變為17、15、13和11個核苷酸以及將莖鹼基對改變為5、4、3、2個鹼基對的截短。所述截短被分別命名為AnaXv1、AnaXv2、AnaXv3和AnaXv4等版本。以 mCherryRNA的環化為例,以上截短版本均保留成環能力(圖24)。值得注意的是,感興趣的序列的5'端和3'端形成有3個鹼基對的結構,可能對殘留成環元件的莖的截短起到補償作用。上述結果說明,保留莖環結構中環構形以及最小化莖部鹼基配對數目仍能保留AnaX成環能力。
實施例 7 、對 AnaX 系統的自剪接內含子片段外側的同源臂序列進行改造
如圖25所示,隨著感興趣的序列(cargo)長度的增加,AnaX系統的成環效率會減弱。為提高更大RNA cargo的成環效率,我們對AnaX系統的內含子片段外側的同源臂序列進行改造,包括1)增長同源臂序列長度;2)替換同源臂隨機序列為AU鹼基配對序列;3)替換同源臂隨機序列為UA鹼基配對序列;4)替換同源臂隨機序列為AU鹼基配對序列並增加鹼基對數目;5)替換同源臂隨機序列為UA鹼基配對序列並增加鹼基對數目;6)替換同源臂隨機序列為CG鹼基配對序列;7)替換同源臂隨機序列為GC鹼基配對序列並增加鹼基對數目;8)替換同源臂隨機序列為CG鹼基配對序列並增加鹼基對數目;9)去除同源臂序列(圖25)。
為檢測內含子片段外側改造的同源臂序列對AnaX系統的成環效率的影響,以luciferase RNA的環化為例,利用變性PAGE凝膠進行環化效率檢測。結果顯示,增加同源臂隨機鹼基配對序列長度顯著性提高RNA的成環效率。然而,同源臂序列變更為AU/UA配對時,對RNA成環效率沒有明顯影響。相反的是,增加AU/UA配對數目會降低RNA成環效率。而同源臂序列變更為GC/CG配對時,會影響體外轉錄效率,同時也顯著抑制RNA成環效率(圖26)。
綜上所述,增加內含子片段外側的同源臂序列的長度,可以明顯提高AnaX催化內含子的成環效率,但是外側的同源臂序列為多聚GC配對,會嚴重影響體外轉錄效率,進而降低產生的環形RNA數量。
實施例 8 Azoarcus Ⅰ類內含子的成環效率和殘留成環元件的改進
為進一步驗證殘留成環元件中莖環對Ⅰ類內含子成環的重要性,我們檢測了另一個野生型Azoarcus Ⅰ類內含子的成環效率。對殘留成環元件的序列進行突變,以驗證對其成環效率的影響。以環形 POLR2A為例,變性PAGE凝膠結果顯示,野生型Azoarcus Ⅰ類內含子可以成環並產生環形RNA,但相比於改進的AnaX,其成環效率較低。然而,改變Azoarcus Ⅰ類內含子殘留成環元件莖環中的莖區域的核苷酸,即將原始的AU配對改成GC配對,增強莖結構的穩定性,並顯著提高Azoarcus Ⅰ類內含子成環效率(圖27)。以上結果說明,Ⅰ類內含子殘留成環元件中莖環結構對其成環起重要作用,提高莖結構的穩定性可以促進成環效率。
實施例 9 、在 AnaX 系統中, IRES 可位於蛋白編碼序列下游
為檢測IRES在蛋白編碼序列下游對環形RNA蛋白轉譯的影響,以 Luciferase為例,我們分別在AnaX、Ana0.9、Ana1.0和Ana3.0系統中,將IRES(CVB3)位於 Luciferase編碼序列上游或者下游。變性PAGE凝膠結果顯示,IRES無論在蛋白編碼區上游還是下游都能以相似的效率成環。隨後,通過變性PAGE凝膠切除的方式來純化不同Azoarcus Ⅰ類內含子的環形 Luciferase。利用Lipofectamine MessengerMAX™ RNA轉染試劑將等量(200 ng)環形 LuciferaseRNA導入到人源HEK293FT細胞中。利用luciferase蛋白與底物反應的強度反映luciferase蛋白表現水準,即轉譯效率。結果顯示,在AnaX、Ana0.9和Ana1.0系統中,IRES在蛋白編碼區上游或者下游都不影響蛋白轉譯。但是對於Ana3.0,IRES在蛋白編碼序列下游能顯著影響蛋白轉譯。可能是Ana3.0中殘留成環元件形成的強結構阻礙了核糖體移動的速率(圖28),因此,導致底蛋白轉譯效率。
實施例 10 、環形 RNA 製備方法的改進
本實施例證明改進的環形RNA製備方法可通過體外轉錄和隨後的AnaX自剪接方法在體外有效合成環形RNA mCherry,並且利用該方法製備的環形RNA可以被正確轉譯為蛋白質(圖29)。
以體外合成的環形RNA mCherry為例,利用體外轉錄和AnaX的自剪接製備環形mCherry。所述改進的環形RNA製備方法具體包括以下步驟: 1. 質體構建及體外轉錄:環形RNA mCherry的範本由PCR方法獲得。在5'端帶有T7啟動子的線性全序列通過多克隆位點***到pUT7載體,重組質體通過桑格測序(Sanger-sequencing)進行驗證。 2. 取1 μg PCR擴增的5'端帶有T7啟動子的線性範本序列,與2 μl T7 RNA聚合酶(Promega)、rATP、rCTP、rUTP、rGTP (各1 mM)以及包含20mM Mg2+的緩衝液於37°C共培育3.5小時,從而獲得包含5'端和3'端具有魚腥藻屬I類內含子自剪接序列的線性前體RNA及自剪接後的環形mCherry的RNA混合初產物。 3. 分析環形RNA之後通過變性PAGE凝膠將其純化。
為檢測所述改進的環形RNA製備方法的成環效率,以mCherry RNA為例,我們利用變性PAGE凝膠對通過改進的環形RNA製備方法獲得的mCherry RNA初產物或者通過原始成環方法獲得的mCherry RNA初產物進行分析。結果表明改進的環形RNA製備方法獲得的環形RNA的成環效率(25.5%)與原始方法(27.9%)基本相同。
為進一步檢測通過上文所述改進的方法製備的環形RNA的轉譯效率,利用Lipofectamine MessengerMAX™(Thermo Fisher)RNA轉染試劑將200 ng改進的方法製備的環形mCherry導入到人源HEK293FT細胞中。利用螢光成像顯微鏡檢測mCherry蛋白的紅色螢光信號(圖29),確認通過改進的方法製備的環形mCherry轉譯水準。結果顯示,利用改進的方法製備的環形mCherry在細胞中可以轉譯出紅色螢光蛋白質,且轉譯紅色螢光蛋白質的效率與原始方法相似。
綜上所述,改進的環形RNA製備方法,在保持成環效率基本相同的情況下,相對原始方法更加便捷。改進的方法在大規模製備環形RNA方面有明顯的應用前景。
實施例 11 、改進的體外轉錄條件有效提高成環效率
本實施例證明改進體外轉錄條件可有效增加總RNA產量和RNA成環效率。
1、提高鎂離子濃度可以促進體外轉錄效率以及成環能力 為進一步優化成環效率,以AnaX系統產生的環形 mCherry為例,在進行體外轉錄(IVT)反應37℃培育3.5小時之後,向IVT產物加入呈梯度濃度的Mg 2+(0-500mM)並37℃培育0.5小時。利用天然瓊脂糖凝膠和變性PAGE分析總RNA產量和RNA成環效率。結果表明RNA總產量與額外添加的Mg 2+濃度呈正相關 (圖30)。此外,環形 mCherry以及相應的線性前體RNA也有顯著增加(圖30)。另外,利用其他兩個不同序列的環形RNA,環形HGF和EGF,產生相同的結果並證實在Mg 2+濃度逐漸提高的情況下,總RNA產量和環形RNA產量以及成環效率顯著增加。 綜上所述,通過提高Mg 2+濃度,不僅提高了總RNA產量,同時也增加環形RNA成環效率。
2、一價金屬陽離子可以促進體外轉錄效率,提高環形RNA總產量 為進一步優化體外轉錄和成環效率,以AnaX產生的環形 LuciferaseRNA為例,在進行體外轉錄反應時,額外加入呈梯度濃度的鈉離子(Na +)或者鉀離子(K +),利用天然瓊脂糖凝膠檢測其對RNA體外轉錄和成環效率的影響。結果顯示,隨著Na +濃度升高,體外轉錄的總RNA產量在逐漸提高。當Na +濃度達到15mM時,總RNA產量到達高原期。同時,Na +濃度升高不影響 LuciferaseRNA的環化效率,但是環形 LuciferaseRNA的總產量有顯著增加(圖32)。與Na +一樣,加入額外K +可以促進體外轉錄效率且不影響RNA環化。當K +濃度達到90mM時,體外轉錄效率到達高原期(圖33)。以上結果表明一價金屬陽離子,如Na +和K +可以促進體外轉錄效率,並且不影響RNA環化,進而提高環形RNA總產量。
3、一價陰離子可以促進體外轉錄效率,提高環形RNA總產量 為進一步優化體外轉錄和成環效率,以通過AnaX產生的環形 LuciferaseRNA為例,在進行體外轉錄反應時,額外加入呈梯度濃度的氯離子(Cl -)或者醋酸根離子(OAc -),利用天然瓊脂糖凝膠檢測其對體外轉錄和成環效率的影響。結果顯示,隨著Cl -濃度升高,體外轉錄的總RNA產量在逐漸提高。當Cl -濃度達到90mM時,總RNA產量到達高原期。同時,Cl -濃度升高不影響 LuciferaseRNA的環化效率,但是環形 LuciferaseRNA的總產量有顯著增加(圖33)。與Cl -一樣,加入額外OAc -可以促進體外轉錄效率,且不影響RNA環化(圖33和圖34)。以上結果表明一價陰離子,如Cl -和OAc -可以促進體外轉錄效率,並且不影響RNA環化,進而提高環形RNA總產量。
4、體外轉錄溫度對RNA轉錄和環化的影響 文獻報導,55°C是適合RNA環化的溫度。因此,為進一步簡化RNA成環步驟,我們探索提高RNA體外轉錄溫度是否對提高成環效率有積極作用。以通過AnaX產生的環形 LuciferaseRNA為例,我們利用耐高溫T7聚合酶在不同溫度下進行體外轉錄以及後續的環化反應,並且利用天然瓊脂糖凝膠檢測體外轉錄產生的 LuciferaseRNA總RNA產量和環化效率。結果顯示,與通用溫度37°C相比,在50°C和55°C高溫下,可以進行體外轉錄,但是轉錄效率顯著下降,且未起到促進RNA環化效率的作用(圖35)。以上結果說明,在適合RNA環化的溫度下進行體外轉錄和環化反應並不能提高RNA環化效率,反而會抑制RNA體外轉錄效率。
5、體外轉錄時間對RNA轉錄和環化影響 為檢測體外轉錄時間對體外轉錄和成環效率的影響,以環形 Luciferase和環形 IL2RNA為例,利用天然瓊脂糖凝膠電泳比較不同時間點的體外轉錄效率和環化效率。結果顯示,隨著體外轉錄時間增長,環形 Luciferase和環形 IL2的環化效率與體外轉錄時長成正比,但是環形 Luciferase和環形 IL2轉錄產量在5-7.5小時最佳(圖36)。過長時間的轉錄可能會造成RNA降解而導致RNA轉錄產量明顯下降。以上結果說明,一定程度延長體外轉錄時間可以促進RNA環化並獲得高產量的RNA,但是過長的體外轉錄可能會引起RNA降解,減少RNA總產量。
6、體外轉錄緩衝液對RNA轉錄和環化影響 為檢測不同緩衝液對體外轉錄和成環效率的影響,以AnaX產生的環形 LuciferaseRNA為例,在體外轉錄過程中,採用HEPES和Tris-HCl緩衝液分別進行體外轉錄和後續環化反應。利用天然瓊脂糖凝膠比較不同緩衝液對體外轉錄和環化效率的影響。結果顯示,HEPES和Tris-HCl緩衝液系統具有相同的體外轉錄效率,但是,在體外轉錄過程中,相對於Tris-HCl緩衝液,環形 Luciferase可以在HEPES緩衝液系統中達到更高的環化率。以上結果說明,HEPES和Tris-HCl緩衝液系統不影響體外轉錄效率,但是HEPES緩衝液更有利於體外轉錄過程中的環化(圖37)。
實施例 12 、改進的環化條件有效提高環化效率
本實施例證明對環形RNA製備過程中的環化條件進行改良,可有效環化效率。
1、二價金屬離子可以促進成環效率 為進一步優化成環效率,以AnaX產生的環形 LuciferaseRNA為例,在環化步驟中,檢測呈梯度濃度(0-50mM)的錳離子(Mn 2+)並培育15min,檢測“一步法”成環獲得RNA產物的效率。通過天然瓊脂糖凝膠分析相應成環效率。結果如圖38所示,在一定範圍內提高錳離子濃度可以有效提高RNA環化效率。其中Mn 2+濃度在20mM的效果最佳,超過20mM後無法進一步提高環化效率。以上結果說明,在成環過程中,Mn 2+可以促進I類內含子剪接,提高成環效率,其中Mn 2+的最佳濃度為20mM。
2、反應溫度和反應時間對環化效率的影響 為探索反應溫度和時間對環化效率的影響,以AnaX產生的環形 LuciferaseRNA為例,在環化步驟中,測試不同溫度(35°C -60°C)和時間(15-60min)。通過天然瓊脂糖凝膠分析相應成環效率。結果如圖39所示,隨著溫度升高,環化效率逐漸提高,在50°C開始到達高原期期。溫度達到60°C,環化效率開始下降。不同的反應時間對環化效率沒有表現出顯著性差異,即15-30min足夠環化反應完全發生。以上結果說明,50°C-60°C是環化反應的最佳溫度,反應時間不是影響環化效率的主要因素。
3、緩衝液和pH對環化效率的影響 為檢測不同緩衝液和pH對成環效率的影響,以環形 OTCRNA為例,在環化過程中,檢測不同pH(5.5-7.5)的HEPES和MES緩衝液。利用天然瓊脂糖凝膠和變性PAGE凝膠分析不同緩衝液和不同pH對環化效率的影響。結果顯示,HEPES和MES緩衝液系統在pH6.0以上具有相似的體外轉錄效率,但是,在pH5.5時,環化效率顯著降低。以上結果說明,在pH6.0以上的條件下,HEPES和MES緩衝液都適合用於體外環化,但是低pH不適合環化(圖40)。
實施例 13 、新型的環形 RNA 純化方法可有效富集環形 RNA
本實施例證明所述新型的環形RNA純化方法可有效去除線性前體RNA和內含子剪切的RNA,富集純化通過I類自剪接內含子體外合成的環形RNA。
以環形 mCherryRNA為例,通過體外轉錄和進一步利用具有27個作為殘留成環元件的核苷酸的AnaX自剪接內含子進行環化來製備環形 mCherry。採用這個環化方法製備的RNA初產物包含自剪接和環化過程中的環形 mCherry以及一系列線性前體RNA和內含子剪切的RNA。為了從RNA初產物中有效富集純化環形 mCherry,去除線性前體RNA和內含子剪切的RNA,設計鹼基互補配對的DNA探針去除線性前體RNA和內含子剪切的RNA。這個純化方法的策略不同於現有技術的純化策略。這個方法利用只特異性結合線性前體RNA和內含子剪切RNA的互補配對DNA探針,用鏈黴親和素磁珠結合DNA探針以特異性去除線性前體RNA和內含子剪切的RNA隨後將特異性靶向環形RNA殘留成環元件的鹼基互補配對DNA探針與RNA樣品共培育,並用鏈黴親和素磁珠進行富集。最後用洗脫液洗脫環形RNA,達到富集純化環形RNA的目的。
針對線性前體RNA中的內含子和環形RNA中的殘留成環元件分別設計了鹼基互補配對的DNA探針,命名為Ligand-Intron(SEQ ID NO:94)和Ligand-Feature(SEQ ID NO:95)。所述探針由上海生工生物工程有限公司(Sangon Biotech)合成,並利用生物素(Biotin)修飾。取20 μg環形 mCherryRNA初產物加入到無RNase的1.5 ml離心管中,加入5 μL(100 mM)上述生物素修飾的Ligand-Intron探針(DNA探針與靶標RNA摩爾比為10 0~10 5:1),於68℃培育10分鐘後,然後置於室溫(~25℃)自然冷卻以黏著,使得生物素修飾的DNA探針可以有效與靶標前體RNA和內含子剪切的RNA結合。取200 μL鏈黴親和素磁珠(1 mg磁珠能夠結合200 pmol生物素修飾的DNA探針)加入到上述混合液中,置於旋轉搖床於室溫(~25℃)培育15分鐘,在培育完畢後收集上清液。上清液隨後置入新的無RNase的離心管中並被收集作為流穿液(flow-through)組分。用BW緩衝液(5 mM Tris-HCl,0.5 mM EDTA,1M NaCl,0.01% Tween-20)清洗鏈黴親和素磁珠三次,向管中加入100 μL無RNase的雙蒸水(ddH 2O),隨後管被置於68℃水浴2分鐘以洗脫並收集洗脫液(三份洗脫液分別命名為E1,E2和E3)。
在利用Ligand-Intron探針去除前體RNA和內含子剪切的RNA之後,取前述收集的流穿液(flow-through)組分,進一步進行環形RNA的富集和純化。向前述流穿液(flow-through)組分中加入5 μL(100 mM)生物素修飾的Ligand-Feature探針,於68℃培育10分鐘後,置於室溫(~25℃)自然冷卻,使生物素修飾的DNA探針與靶標環形RNA有效結合。取200 μL鏈黴親和素磁珠加入到混合液中,置於旋轉搖床於室溫(~25℃)培育15分鐘。培育完畢後收集上清液置入新的無RNase的離心管中作為流穿液(flow-through)組分。用BW緩衝液(5 mM Tris-HCl,0.5 mM EDTA,1M NaCl,0.01% Tween-20)清洗鏈黴親和素磁珠三次,向管中加入100μL無RNase的雙蒸水,隨後管被置於68℃水浴2分鐘以收集洗脫液作為洗脫(elution)組分(兩份洗脫液分別命名為E1和E2)。
為檢測新型環形RNA純化方法的純化效率,分別收集了上述環形RNA製備初產物(Input),以及不同探針富集洗脫後的流穿液(flow-through)組分及洗脫(elution)組分,並利用變性PAGE凝膠進行了分析。結果如圖41所示,Ligand-Intron探針可以有效結合並去除環形RNA初產物中的線性前體RNA和內含子剪切的RNA。因此,提高Ligand-Feature探針特異性富集純化環形 mCherry的效率。
綜上所述,前文所述新型的環形RNA純化方法可有效去除線性前體RNA和內含子剪切的RNA,進而實現環形RNA的富集純化。
實施例 14 、不同長度探針對 環形 RNA 純化效率影響
如前文所述,Ligand-Intron探針可以有效結合並去除混合在環形RNA初產物中的線性前體RNA和內含子剪切的RNA,同時Ligand-Feature探針能夠特異性富集純化環形RNA。為了進一步探索有效純化環形RNA的探針長度,設計合成了不同長度包含生物素標籤用來純化環形RNA的探針(Ligand-F10,SEQ ID NO:96;Ligand-F20,SEQ ID NO:97;Ligand-F23,SEQ ID NO:98;Ligand-F25,SEQ ID NO:99;Ligand-F27,SEQ ID NO:100;Ligand-F29,SEQ ID NO:101)。利用前述不同長度的探針,以環形 mCherry為例,檢測這些探針純化環形RNA的效率。
首先,檢測三個探針(Ligand-F10、Ligand-F20和Ligand-F27)對環形RNA富集的影響。實驗流程如下:取20 μg環形 mCherry初產物加入到無RNase的1.5ml離心管中,加入5 μL(100 mM)上述生物素修飾的DNA探針。管被加熱至68℃培育10分鐘後,置於室溫(~25℃)自然冷卻,使生物素修飾的DNA探針與靶標環形RNA有效結合。取200 μL鏈黴親和素磁珠加入到上述混合液中,置於旋轉搖床於室溫(~25℃)培育15分鐘。培育完畢後收集上清液並轉移到新的無RNase的離心管中作為流穿液(flow-through)組分。用BW緩衝液(5 mM Tris-HCl,0.5 mM EDTA,1M NaCl,0.01% Tween-20)清洗鏈黴親和素磁珠三次,向混合液中加入100μL無RNase的雙蒸水,隨後管被置於68℃水浴2分鐘以收集洗脫(elution)組分(兩份洗脫液分別命名為E1和E2)。將收集的上述環形RNA製備初產物(Input)、流穿液(flow-through)組分及洗脫(elution)組分,利用變性PAGE凝膠電泳進行分析。結果如圖42所示,Ligand-F-20和Ligand-F-27兩組探針能夠特異性富集純化環形 mCherry,但是較短的Ligand-F-10並不能有效富集環形RNA。另外,Ligand-F-27相對於Ligand-F-20有更強的富集環形RNA的效率,但其富集純化產物中,也包含一定線性前體RNA及剪切RNA。
進一步檢測探針長度(Ligand-F23、Ligand-F25、Ligand-F27和Ligand-F29)對環形RNA純化的效率。以環形 mCherry為例,具體實驗流程如上所述。將上述環形RNA製備初產物(Input),以及不同探針富集洗脫後收集的流穿液(flow-through)組分及洗脫(elution)組分,利用變性PAGE凝膠電泳進行分析。結果如圖43所示,Ligand-F-27探針能夠特異性富集純化環形 mCherry,Ligand-F-23、Ligand-F-25以及Ligand-F-29能夠特異性富集純化環形 mCherry,說明23nt-29nt範圍內的不同長度探針可以用於新型的環形RNA純化/富集方法。
綜上所述,探針長度在10nt或以下對環形RNA純化或富集沒有影響,而在20-29nt長度範圍內的探針可以用於純化或富集環形RNA。
實施例 15 、利用新型純化方法純化的環形 RNA 可以轉譯
本實施例證明,利用前文所述新型的環形RNA純化方法純化的環形 mCherry可在細胞中轉譯出紅色螢光蛋白質。
如前文所述,新型的環形RNA純化方法可有效富集環形RNA並提高富集純化環形RNA的特異性。為進一步檢測前文所述新型的環形RNA純化方法純化的環形 mCherry能否在細胞內轉譯為蛋白質,利用Lipofectamine MessengerMAX™(Thermo Fisher)RNA轉染試劑將200 ng該方法純化環形 mCherry導入到人源HEK293FT細胞中。將200 ng用傳統的變性PAGE凝膠純化得到的環形RNA作為對照,同時導入到人源HEK293FT細胞中。利用螢光成像顯微鏡檢測轉譯產物紅色螢光蛋白質的紅色螢光信號(圖44),確認利用該新型的環形RNA純化方法純化的環形RNA產物可以轉譯出紅色螢光蛋白質,並且比通過變性PAGE凝膠的膠切除純化獲得的更好。
實施例 16 、利用新型純化方法純化的環形 RNA 具有低免疫原性
本實施例證明,利用前文所述新型的環形RNA純化方法純化的環形 mCherry導入到人源A549細胞中引起低免疫原性。
如前文所述,新型的環形RNA純化方法可有效富集環形RNA並提高富集純化環形RNA的特異性。為進一步檢測前文所述新型的環形RNA純化方法純化的環形 mCherry免疫原性,將等量(200ng)該方法純化的環形 mCherry、傳統變性PAGE凝膠的膠切除純化的環形 mCherry以及線性 mCherrymRNA分別導入到人源A549細胞中。在轉染6小時後,分別收集細胞,加入Trizol試劑提取細胞的總RNA進行RT-qPCR檢測細胞因數IFNβ、TNFα、IL6和RIG-I的mRNA表現水準。結果如圖45所示,與傳統變性PAGE純化的環形 mCherry一樣,該新型純化方法獲得的環形 mCherry免疫原性均顯著低於線性 mCherrymRNA。其中,IFNβ、TNFα、IL6和RIG-I為常用的細胞內免疫原性檢測標記基因,陽性對照Poly (I:C)為常用的長雙鏈RNA病毒類比物。
實施例 17 、利用新型的環形 RNA 純化方法純化環形 Luciferase RNA 且純化的 RNA 可以轉譯
本實施例證明,利用前文所述新型的環形RNA純化方法可有效富集純化環形 LuciferaseRNA,說明該方法不受限於環形RNA中感興趣的序列。
如前文所述,新型的環形RNA純化方法可有效富集純化環形RNA。利用所述新型的環形RNA純化方法純化的環形 mCherry能在細胞內轉譯為蛋白質。為進一步檢測前文所述新型的環形RNA純化方法是否受限於環形RNA中感興趣的序列,利用該方法純化了具有不同感興趣的序列的另一個環形RNA,環形 Luciferase RNA,具體實驗步驟如前文實施例所述。
為檢測所述改進的新型環形RNA純化方法純化環形 Luciferase RNA的效率,分別收集了上述環形 Luciferase RNA製備初產物(Input),以及Ligand-Feature探針富集洗脫後的流穿液(flow-through)組分及洗脫(elution)組分。利用變性PAGE凝膠電泳進行了分析。結果如圖46所示,說明所述方法可有效富集環形 Luciferase RNA並提高富集純化環形RNA的特異性(圖46顯示純化效率統計結果)。
進一步,為檢測前文所述新型的環形RNA純化方法純化的環形 Luciferase RNA能否在細胞內轉譯為蛋白質,利用Lipofectamine MessengerMAX™(Thermo Fisher)RNA轉染試劑將等量(200 ng)的純化的環形 RNA、線性 LuciferasemRNA和Luciferase質體導入到人源HEK293FT細胞中。利用luciferase蛋白與底物反應的活性強度反映蛋白表現水準和RNA轉譯效率。這些結果確認利用該新型的環形RNA純化方法純化的環形RNA產物可以轉譯luciferase蛋白質,並且比線性 LuciferasemRNA的轉譯效率高(圖46)。
實施例 18 、利用新型的環形 RNA 純化方法純化 T4 連接酶產生的環形 RNA
本實施例證明,利用前文所述新型的環形RNA純化方法可有效富集純化T4連接酶合成的環形RNA,說明該方法不受限於產生環形RNA的成環方式。
以體外由T4連接酶產生的環形 POLR2A為例。該方法製備的環形 POLR2A初產物包含環形 POLR2A、未連接的線性前體RNA以及分子間連接的線性RNA。針對環形RNA連接位點設計互補配對的DNA探針,命名為Ligand-Feature/ligase(SEQ ID NO:102),所述探針由上海生工生物工程有限公司(Sangon Biotech)合成,並用生物素(Biotin)修飾。取20 μg環形 POLR2A初產物加入到無RNase的1.5ml離心管中,加入5 μL(100 mM)上述生物素修飾的DNA探針。混合液於68℃培育10分鐘後,置於室溫(~25℃)自然冷卻,使生物素修飾的DNA探針與靶標環形RNA有效結合。取200 μL鏈黴親和素磁珠加入到上述混合液中,置於旋轉搖床於室溫(~25℃)培育15分鐘。培育完畢後收集上清液並置入新的無RNase的離心管中作為流穿液(flow-through)組分。用BW緩衝液(5 mM Tris-HCl,0.5 mM EDTA,1M NaCl,0.01% Tween-20)清洗鏈黴親和素磁珠三次,加入100μL無RNase的雙蒸水並置於68℃水浴2分鐘以收集洗脫(elution)組分(兩次洗脫液分別命名為E1和E2)。
為檢測所述新型的環形RNA純化方法對T4連接酶合成的環形RNA的純化效率,分別收集了上述環形RNA製備初產物(Input),流穿液(flow-through)組分及洗脫(elution)組分,並利用變性PAGE凝膠電泳進行了檢測。結果如圖47所示,Ligand-Feature/ligase探針能夠富集純化環形 POLR2A,但其富集純化產物中,也包含一定線性前體RNA及分子間連接的線性RNA。
綜上所述,前文所述新型的環形RNA純化方法對T4連接酶合成的環形RNA具有一定的富集純化效果。
實施例 19 、利用新型的環形 RNA 純化方法純化 Td I 類內含子產生的環形 RNA
本實施例證明,利用前文所述新型的環形RNA純化方法可有效富集純化Td I類內含子自剪接成環產生的環形RNA,說明該方法不受限於產生環形RNA的環化方法。
以體外利用Td I類內含子自剪接成環產生的環形 POLR2A為例。該方法製備的環形 POLR2A初產物包含環形 POLR2A、一系列線性前體RNA、內含子剪切的RNA以及線性剪切RNA。針對線性前體RNA中的內含子和環形RNA的殘留成環元件設計互補配對的DNA探針,分別命名為Ligand-Td-Intron(SEQ ID NO:103)和Ligand-Td-Feature(SEQ ID NO:104)。所述探針由上海生工生物工程有限公司(Sangon Biotech)合成,並用生物素(Biotin)修飾。取20 μg環形 POLR2A初產物加入到無RNase的1.5 ml離心管中,加入5 μL(100 mM)上述生物素修飾的Ligand-Td-Intron探針(DNA探針與靶標RNA摩爾比為10 0~10 5:1)。反應於68℃進行10分鐘後,置於室溫(~25℃)自然冷卻,使生物素修飾的DNA探針與靶標前體RNA有效結合。取200μL鏈黴親和磁珠(1 mg磁珠能夠結合200 pmol生物素修飾的DNA探針)加入到上述混合液中,置於旋轉搖床於室溫(~25℃)培育15分鐘。培育完畢後收集上清液,將上清液置入新的無RNase的離心管中作為流穿液(flow-through)組分。用BW緩衝液(5 mM Tris-HCl,0.5 mM EDTA,1 M NaCl,0.01% Tween-20)清洗鏈黴親和磁珠三次,加入100μL無RNase的雙蒸水並將管置於68℃水浴2分鐘以收集洗脫(elution)組分(三份洗脫液分別命名為E1,E2和E3)。
在利用Ligand-Td-Intron探針去除前體RNA後,取前述收集的流穿液(flow-through)組分,進一步進行環形RNA的富集和純化。向前述流穿液(flow-through)組分加入5 μL(100 mM)生物素修飾的Ligand-Td-Feature探針,於68℃培育10分鐘後,置於室溫(~25℃)自然冷卻以黏著,使生物素修飾的DNA探針與靶標前體RNA有效結合。取200 μL鏈黴親和磁珠加入到上述混合液中,置於旋轉搖床於室溫(~25℃)培育15分鐘。培育完畢後收集上清液並置入新的無RNase的離心管中作為流穿液(flow-through)組分。用BW緩衝液(5 mM Tris-HCl,0.5 mM EDTA,1 M NaCl,0.01% Tween-20)清洗鏈黴親和磁珠三次,加入100 μL無RNase的雙蒸水,並將管置於68℃水浴2分鐘以收集收集洗脫(elution)組分(兩份洗脫液分別命名為E1和E2)。
為檢測所述新型的環形RNA純化方法對Td I類內含子自剪接合成的環形RNA的純化效率,分別收集了上述環形RNA製備初產物(Input)、流穿液(flow-through)組分及洗脫(elution)組分,並利用變性PAGE凝膠電泳進行分析。結果如圖48所示,Ligand-Td-Feature探針能夠富集純化環形 POLR2A,但其富集純化產物中,也包含一定部分的線性前體RNA和剪切RNA。
綜上所述,前文所述新型的環形RNA純化方法對Td I類內含子自剪接合成的環形RNA具有一定的富集效果。
實施例 20 、新型的環形 RNA 純化方法結合柱層析純化環形 RNA
本實施例證明利用前文所述新型的環形RNA純化方法結合柱層析方式可有效去除線性前體RNA,富集純化環形RNA,說明這種基於親和力的純化可以不受限於固定方式和材料而實現。
將靶向線性前體RNA中的內含子和環形RNA的殘留成環元件的DNA探針固定在層析柱上,用於除去前體RNA和富集環形RNA。固定在柱上的配體分別命名為Ligand-Feature和Ligand-Intron。以體外合成的環形 IL2為例,檢測Ligand-Intron層析柱對前體RNA去除效率。利用AnaX自剪接內含子成環反應進行體外轉錄製備環形 IL2。所述體外轉錄製備的環形 IL2初產物包含環形 IL2、自剪接成環過程中的一系列線性前體RNA以及剪切RNA。取100 μg環形 IL2初產物(Input)裝載到Ligand-Intron層析柱,收集流穿液(flow-through, FT)組分。隨後,用TE緩衝液洗脫Ligand-Intron層析柱,並收集相應的洗脫(Elution)組分。將Input、FT及Elution組分用於變性PAGE凝膠電泳,結果顯示,Ligand-Intron層析柱能有效的去除前體RNA(圖49A)。
以體外合成的環形RNA Luciferase為例,檢測Ligand-Feature層析柱富集環形RNA的效率。首先利用AnaX自剪接方法進行體外轉錄製備環形 Luciferase。所述體外轉錄和環化製備的環形 Luciferase初產物包含環形 Luciferase、一系列線性前體RNA、內含子剪切的RNA以及剪切RNA。取100 μg環化的環形 Luciferase初產物(Input)裝載到Ligand-Feature層析柱,分別收集流穿液(flow-through, FT)組分和洗脫(Elution)組分。將Input、FT及Elution組分用於瓊脂糖凝膠電泳,結果顯示,Ligand-Feature層析柱能有效的富集環形RNA(圖49B)。
以利用AnaX自剪接內含子體外轉錄製備的環形 Luciferase為例,檢測將Ligand-Intron和Ligand-Feature層析柱組合後,去除前體RNA和富集環形RNA的效率。首先通過體外轉錄和成環製備環形 Luciferase。所述體外轉錄和成環製備的環形 Luciferase初產物包含環形 Luciferase 一系列線性前體RNA、內含子剪切的RNA以及剪切RNA。取100 μg環形 Luciferase環化初產物裝載到Ligand-Intron,流穿液直接流過Ligand-Feature層析柱。收集最終的流穿液(flow-through, FT)和洗脫組分(Elution)。將Input、FT及Elution組分通過瓊脂糖凝膠電泳進行分析。Ligand-Intron層析柱能有效的去除前體RNA,同時Ligand-Feature層析柱能夠進一步富集純化環形 Luciferase(圖50)。採用該新型環形RNA純化方法可以有效富集環形RNA並且在IVT和環化過程中產生的其餘線性組分可以被有效去除。這些配體被固定在例如層析柱的固體支援材料上。
實施例 21 、利用將 oligo-dT 作為配體的基於親和力的純化方法純化環形 RNA 且純化的 RNA 可以轉譯
1、基於oligo-dT親和純化方法去除線性RNA 本實施例證明利用oligo-dT的親和純化方法純化體外合成的環形RNA。在任何成環方法的環化反應結束後,利用Poly A聚合酶(例如,E coli. Poly A聚合酶,酵母poly A 聚合酶等)對環化系統中所有線性RNA的3'端進行polyA加尾。通過oligo-dT親和純化方法去除所有polyA加尾的線性RNA,實現富集純化環形RNA的目的。 以AnaX自剪接內含子進行體外轉錄製備環形 LuciferaseRNA為例,在成環反應結束後,向反應系統中所有線性RNA(包括主要的線性前體RNA、內含子剪切的RNA和線性剪切RNA)的3'端通過E coli. Poly A聚合酶進行polyA(20-500 nt)加尾。利用瓊脂糖凝膠分析線性RNA poly A加尾的結果,結果顯示相比於未進行加尾反應的樣品,所有類型的線性RNA的條帶都顯著的向上遷移。結果表明大部分線性RNA進行poly A加尾(圖51)。隨後,利用Oligo-dT層析柱通過polyA尾的互補系列捕獲所有加尾的線性RNA。環形RNA流經層析柱,因此實現富集純化。通過變性PAGE凝膠對收集的環化反應中的環形RNA (Input)、流穿液(flow-through, FT)組分和洗脫組分(Elution)進行檢測,確定富集純化環形RNA的效率。結果顯示,該方法能夠有效去除含Poly A序列的所有線性RNA以富集純化環形RNA(圖51)。 綜上所述,在內含子自剪接成環反應後進行Poly A加尾,利用oligo-dT親和純化方法能去除線性RNA,實現富集純化環形RNA的效果。
2、oligo-dT親和純化獲得的環形RNA在細胞中具有高表現水準 進一步,為檢測前文所述新型純化方法純化的環形 LuciferaseRNA能否在細胞內轉譯蛋白質,利用Lipofectamine MessengerMAX™(Thermo Fisher)RNA轉染試劑將RNA轉染至細胞內。將等量(200 ng)該方法純化的環形 Luciferase RNA、未純化的環形 Luciferase RNA 線性 LuciferasemRNA和m1Ψ修飾的線性 LuciferasemRNA分別導入到人源HEK293FT細胞中。利用luciferase蛋白與底物反應的發光信號反映RNA轉譯效率(圖51)。結果顯示利用該新型的環形RNA純化方法純化的環形 LuciferaseRNA可以有效轉譯為Luciferase蛋白質,並且其轉譯效率比核苷酸修飾或未修飾的線性 LuciferasemRNA的轉譯效率更高。
實施例 22 、環形 RNA 相對於線性 RNA 的優勢
1、環形RNA在體內外的高穩定性 本實施例證明環形RNA相對於線性RNA具有更好的體內外穩定性。 以人體內源表現的環形 circPOLR2ARNA為例,進行體外環形RNA的合成及純化。環形 POLR2A序列是在circexplorer資料庫(http://yanglab.github.io/CIRCexplorer/)中獲得,構建範本所用質體及相關引物由上海博尚生物有限公司合成。通過體外轉錄及魚腥藻屬I類內含子自剪接(autocatalytic)環化的方式(Wesselhoeft等人, 2018 A. R., et al., (2018) Engineering circular RNA for potent and stable translation in eukaryotic cells.),在體外製備環形RNA。利用變性PAGE凝膠的凝膠切除方法純化具有相同序列的高純度環形 POLR2A以及線性 POLR2A。 為檢測體外合成環形RNA和線性RNA在細胞內的穩定性,利用Lipofectamine MessengerMAX™ (Thermo Fisher) RNA轉染試劑分別將等量(200 ng)環形 POLR2A和線性 POLR2A導入到人源HEK293FT細胞中。接下來在圖52所示的時間點,收集分別轉染了環形 POLR2A和線性 POLR2A的HEK293FT細胞,加入Trizol試劑提取細胞中的總RNA。利用Northern Blot檢測環形 POLR2A和線性 POLR2A在細胞中的含量。結果(圖52)顯示,線性 POLR2A在48小時被降解,環形 POLR2A在細胞中更加穩定不易降解。 為檢測體外合成環形RNA和線性RNA在不同溫度下的貯藏壽命,將200 ng環形 mCherry和200 ng線性 mCherrymRNA溶於無RNase的雙蒸水中並存放在25°C或4°C,並通過變性PAGE凝膠電泳檢測不同存放天數後相應RNA的穩定性。結果如圖53所示,相對於第0天(D0),RNA的量直到第7天並無顯著變化,說明溶於無RNase的雙蒸水中的RNA在25°C或4°C下相對穩定。
2、環形RNA在細胞內的長半衰期和高轉譯效率 本實施例證明在細胞內,環形RNA相對於線性RNA具有更長的半衰期和更好的轉譯效率。 為檢測體外合成環形RNA和線性mRNA在細胞內的轉譯效率,利用Lipofectamine MessengerMAX™ (Thermo Fisher) RNA轉染試劑將等量純化的環形 LuciferaseRNA、未純化的環形 LuciferaseRNA m1Ψ修飾的線性 LuciferasemRNA和未修飾的線性 LuciferasemRNA分別導入到人源HEK293FT細胞中。利用加入螢光素底物之後luciferase引發的發光信號來表明luciferase表現水準,從而定量RNA轉譯效率(圖54)。在不同時間點檢測發光信號。如圖54所示,在轉染後6小時,線性RNA的表現高於環形RNA,表明線性RNA的轉譯起始速度比環形RNA的轉譯起始速度更快。在轉染後24小時,環形RNA表現水準與線性RNA相當。環形RNA的表現水準持續上升且在72小時穩定表現。線性RNA的表現水準在24小時到達峰值並且在72小時快速降低至基線。結果說明環形 LuciferaseRNA相對於線性mRNA,在細胞內有更高的轉譯效率,因而產生更多蛋白質並且蛋白質表現更加穩定。
3、環形RNA具有低細胞內免疫原性 本實施例證明在細胞內,環形RNA具有低免疫原性。 為檢測體外合成環形RNA和線性RNA轉染入細胞後,引起的細胞內天然免疫反應情況,利用Lipofectamine MessengerMAX™ (Thermo Fisher)RNA轉染試劑分別將等量純化的環形 Luciferase(純度為約70%)、未純化的環形 Luciferase m1Ψ修飾的線性 LuciferasemRNA(純度大於95%)和未修飾的線性 LuciferasemRNA(純度大於95%)導入到人源A549細胞中。在轉染6小時後收集細胞,加入Trizol試劑提取細胞的總RNA進行RT-qPCR檢測細胞因數IFNβ、TNFα、IL6和RIG-I的mRNA表現水準。通過RT-qPCR檢測轉染的 LuciferaseRNA的水準來監測轉染效率。如圖55所示,與未修飾的線性 LuciferasemRNA相比,環形RNA無論純化程度如何,其在A549細胞中相應檢測細胞因數的表現水準偏低。純化的環形RNA刺激的細胞因數水準與m1Ψ修飾的線性 LuciferasemRNA相當,說明環形RNA相對於線性Luciferase mRNA具有更低的免疫原性及更佳的安全性。其中,IFNβ、TNFα、IL6和RIG-I為常用的細胞內免疫原性檢測標記基因,陽性對照Poly (I:C)為常用的雙鏈RNA病毒類比物。
4、環形RNA導致穩定的體內表現 本實施例證明當以裸露的形式經皮注射遞送至小鼠時,環形RNA相對於線性mRNA具有更穩定的蛋白質表現。 為檢測體外合成的環形RNA和線性RNA在體內的效果,將溶解在PBS溶液中的5 ug m1Ψ修飾的線性 LuciferasemRNA和5 ug環形 LuciferaseRNA經皮注射遞送至小鼠。利用IVIS活體成像檢測在RNA注射後不同時間點注射螢光素後引起的發光信號來反映蛋白質表現水準。發光信號的強度用來反映luciferase的表現。在RNA注射後6小時,檢測到的發光信號表明RNA的表現。檢測額外時間點直到336小時。結果表明線性 LuciferasemRNA和環形 Luciferase可以在不具備特殊劑型而只有PBS的狀態下經皮遞送並且在體內持續表現至少168小時,環形RNA表現在至少336小時內更穩定(圖56)。 為檢測脂質體(lipid-nanoparticle, LNP)包裹的環形RNA在組織器官中表現情況,將5 ug由MC3-LNP包裹的m1Ψ修飾的線性 LuciferasemRNA和5 ug環形 Luciferase通過尾靜脈遞送方式注射到小鼠體內。利用IVIS活體成像檢測在RNA注射後不同時間點注射螢光素後引起的發光信號來反映蛋白質表現水準。結果顯示在6小時時間點,線性 LuciferasemRNA和環形 Luciferase在組織中表現到達最高點。隨著時間推移,線性 LuciferasemRNA和環形 Luciferase表現逐漸下降,但是相對於線性 LuciferasemRNA,環形 LuciferaseRNA下降更緩慢(圖57)。 綜上所述,這一系列實施例證明環形RNA相對於線性RNA具有至少幾個優勢,包括相較於線性RNA更高的穩定性,更低的免疫原性,更高的轉譯效率和更長的持續時間。
實施例 23 、在環形 RNA 製備中化學修飾的核苷酸降低成環效率
本實施例證明,在體外合成環形RNA過程中引入化學修飾的核苷酸降低成環效率。
1、引入m5C降低成環效率 本實施例證明,引入m5C降低成環效率。 以AnaX內含子自剪接進行體外轉錄製備環形 RBD為例,在體外轉錄過程中,不同百分比(0%、12.5%、25%、50%和100%)的胞嘧啶被m5C修飾的胞嘧啶替換。在37℃反應3.5小時後,取0.5 μl反應產物進行瓊脂糖凝膠電泳監測體外轉錄效率。隨後,加入GTP和Mg 2+在55℃條件下進行15分鐘環化反應。利用變性PAGE凝膠電泳檢測環化效率。結果顯示,引入m5C修飾的胞嘧啶並不影響體外轉錄效率(圖58),但是引入不同量的m5C顯著抑制 RBDRNA成環。當m5C替換的胞嘧啶比例為100%時, RBDRNA基本不能發生成環反應(圖58)。
2、引入Ψ降低成環效率 本實施例證明,在引入Ψ降低成環效率。 以AnaX內含子自剪接進行體外轉錄製備環形 RBD為例,在體外轉錄過程中,不同百分比(0%、12.5%、25%、50%和100%)的尿嘧啶被Ψ替換。在37℃反應3.5小時後,取0.5 μl反應產物進行天然瓊脂糖凝膠電泳監測體外轉錄效率。隨後,加入GTP和Mg 2+在55℃條件下進行15分鐘環化反應。利用變性PAGE凝膠電泳檢測環化效率。結果顯示,引入Ψ並不影響體外轉錄效率(圖59),但是引入不同量的Ψ顯著抑制RNA成環。當Ψ替換的尿嘧啶比例為100%時,基本不能發生成環反應(圖59)。
3、m1Ψ修飾影響環形RNA成環效率 本實施例證明,引入m1Ψ降低成環效率。 以AnaX內含子自剪接進行體外轉錄製備環形 RBD為例,在體外轉錄過程中,不同百分比(0%、1%、12.5%、25%、50%和100%)的尿嘧啶被m1Ψ替換。在37℃反應3.5小時後,取0.5 μl反應液進行天然瓊脂糖凝膠電泳監測體外轉錄效率。隨後,加入GTP和Mg 2+在55℃條件下進行15分鐘環化反應。利用變性PAGE凝膠電泳檢測環化效率。結果顯示,引入m1Ψ並不影響體外轉錄效率(圖60),但是引入不同量的m1Ψ顯著抑制RNA成環。當m1Ψ替換的尿嘧啶比例為100%時,RNA基本不能發生成環反應(圖60)。
4、m6A修飾影響環形RNA成環效率 本實施例證明,引入m6A降低成環效率。 以AnaX內含子自剪接進行體外轉錄製備環形 RBD為例,在體外轉錄過程中,不同百分比(0%、1%、12.5%、25%、50%和100%)的腺嘌呤被m6A替換。在37℃反應3.5小時後,取0.5 μl反應液進行天然瓊脂糖凝膠電泳監測體外轉錄效率。隨後,加入GTP和Mg 2+在55℃條件下進行15分鐘環化反應。利用變性PAGE凝膠電泳檢測環化效率。結果顯示,引入m6A並不影響體外轉錄效率(圖61),但是引入不同量的m6A顯著抑制RNA成環。當m6A替換的腺嘌呤比例為100%時,RNA基本不能發生成環反應(圖61)。
實施例 24 、核苷酸修飾影響環形 RNA 轉譯
本實施例證明,在通過體外合成環形RNA製備的環形RNA中引入化學修飾的核苷酸降低環形RNA轉譯效率。 以AnaX內含子自剪接進行體外轉錄製備環形 RBD為例,通過實施例23.1和23.2所述方式合成有不同比例m5C替換的胞嘧啶和不同比例Ψ替換的尿嘧啶的環形RNA。利用Lipofectamine MessengerMAX™ (Thermo Fisher) RNA轉染試劑分別將等量有化學修飾的核苷酸的環形 RBD導入到人源HEK293FT細胞中。轉染24小時後,利用Western Blot檢測有化學修飾的核苷酸的環形 RBD轉譯出的蛋白質產物表現水準。結果顯示,與未修飾的環形 RBD相比,向環形 RBD引入m5C或Ψ導致在細胞內表現量極低,甚至不表現(圖62)。
綜上所述,向環形RNA引入m5C或Ψ能顯著抑制環形的RNA在細胞內轉譯表現。
實施例 25 IRES 元件影響環形 RNA 轉譯水準
本實施例證明,IRES元件可以影響體外合成的環形RNA轉譯蛋白的表現水準。
選取來自不同病毒的typeⅠ、typeⅡ、typeⅢ和typeⅣ IRES進行環形 mCherry的表現。以AnaX系統自剪接方式進行體外轉錄製備環形RNA,利用Lipofectamine MessengerMAX™ (Thermo Fisher)RNA轉染試劑將等量的含有不同IRES元件的環形RNA導入到人源HEK293FT細胞中。轉染48小時後,利用螢光顯微鏡檢測轉譯產物紅色螢光蛋白質mCherry的紅色螢光信號(圖63上圖),並利用Western Blot檢測轉譯出的蛋白質產物表現水準(圖64下圖)。這些IRES來自脊髓灰質炎病毒1、鼻病毒A1、柯薩奇病毒A2、柯薩奇病毒B3、腦心肌炎病毒、***病毒、牛甲型鼻炎病毒、C型肝炎病毒、豬瘟病毒、塞內加河谷病毒、豬薩伯羅病毒、蟋蟀麻痹病毒、果蠅C病毒、陶拉症候群病毒、以色列急性麻痹病毒。結果顯示,在4類IRES中,由typeⅠ和typeⅡ的IRES元件啟動的環形RNA轉譯效率相對更高。
為進一步探究病毒完整的5' UTR與IRES序列對轉譯效率的影響,將IRES序列BRAV-1、PV1、CVA2與其完整的5' UTR序列BRAV-1_L、PV1_L、CVA2_L的轉譯能力進行了檢測。BRAV-1_L、PV1_L、CVA2_L在基因組的位置分別向前延伸了100個鹼基。以AnaX系統的內含子自剪接進行體外轉錄製備環形 mCherry,利用Lipofectamine MessengerMAX™ (Thermo Fisher) RNA轉染試劑將等量的含有不同IRES元件的環形RNA導入到人源HEK293FT細胞中。轉染48小時後,利用螢光成像顯微鏡檢測轉譯產物紅色螢光蛋白質mCherry的紅色螢光信號,並利用Western Blot檢測轉譯出的蛋白質產物表現水準(圖65)。結果顯示完整的5' UTR序列BRAV-1_L、PV1_L、CVA2_L比傳統定義的BRAV-1、PV1、CVA2具有更強的轉譯能力。
綜上所述,typeⅠ和typeⅡ的IRES元件更加適用於調控環形RNA轉譯,同時病毒完整的5' UTR序列相比於傳統定義的IRES具有更強的轉譯能力,即為更完整的IRES元件。
本文提及的序列:
SEQ ID NO. 序列 描述
1 AACAATAGATGACTTACAACTAATCGGAAGGTGCAGAGACTCGACGGGAGCTACCCTAACGTCAAGACGAGGGTAAAGAGAGAGTCCAATTCTCAAAGCCAATAGGCAGTAGCGAAAGCTGCAAGAGAATG 3’ I類內含子片段 衍生自 Anabaena  pre-tRNA-Leu 基因 I類內含子
2 AAATAATTGAGCCTTAAAGAAGAAATTCTTTAAGTGGATGCTCTCAAACTCAGGGAAACCTAAATCTAGTTATAGACAAGGCAATCCTGAGCCAAGCCGAAGTAGTAATTAGTAA 5’ I類內含子片段 衍生自 Anabaena  pre-tRNA-Leu 基因 I類內含子
3 TGCGCCGATGAAGGTGTAGAGACTAGACGGCACCCACCTAAGGCAAACGCTATGGTGAAGGCATAGTCCAGGGAGTGGCGAAAGTCACACAAACCGG 3’ I類內含子片段 衍生自 Azoarcus sp. BH72
4 ATTTCGATGTGCCTTGCGCCGGGAAACCACGCAAGGGATGGTGTCAAATTCGGCGAAACCTAAGCGCCCGCCCGGGCGTATGGCAACGCCGAGCCAAGCTTCGGCGCC 5’ I類內含子片段 衍生自 Azoarcus sp. BH72
5 AAAATTTCGTCTGGATTAGTTACTTATCGTGTAAAATCTGATAAATGGAATTGGTTCTACATAAATGCCTAACGACTATCCCTTTGGGGAGTAGGGTCAAGTGACTCGAAACGATAGACAACTTGCTTTAACAAGTTGGAGATATAGTCTGCTCTGCATGGTGACATGCAGCTGGATATAATTCCGGGGTAAGATTAACGACCTTATCTGAACATAATG 3’ I類內含子片段 衍生自 T4.v.td,1
6 TAATTGAGGCCTGAGTATAAGGTGACTTATACTTGTAATCTATCTAAACGGGGAACCTCTCTAGTAGACAATCCCGTGCTAAATTGTAGGACTGCCCTTTAATAAATACTTCTATATTTAAAGAGGTATTTATGAAAAGCGGAATTTATCAGATTAAAAATACTTT 5’ I類內含子片段 衍生自 T4.v.td,1
7 AAAATCCGT I類內含子的3’外顯子 來自Anabaena pre-tRNA-Leu 基因
8 CGCTACGGACTT    I類內含子的5’外顯子 來自Anabaena  pre-tRNA-Leu 基因
9 AATCCGCCGGTG I類內含子的3’外顯子 來自Azoarcus sp. BH72
10 GAGCGGCGGACTCAT I類內含子的5’外顯子 來自Azoarcus sp. BH72
11 ctaccgtttaatatt I類內含子的3’外顯子 來自T4.v.td,1
12 gatgttttcttgggt I類內含子的5’外顯子 來自T4.v.td,1
13 AAAATCCGTTGA 第一殘留環化元件,AnaX, AnaXD1, AnaXD2, AnaXD6, AnaXD 12, AnaXD13, AnaXD14 AnaXE1
14 AAAAAGGCATGA 第一殘留環化元件,AnaXD3, AnaXRD2
15 AAAATCTGTTGA 第一殘留環化元件,AnaXRD1
16 AAAGTCCGTTGA 第一殘留環化元件,AnaXE2, AnaXE3
17 AAAATCCGTTGCGA 第一殘留環化元件,AnaXE4
18 AAAATCCGTTGCGTCA 第一殘留環化元件,AnaXE5
19 AAAAAAAAAAGG 第一殘留環化元件,AnaXAU
20 AAAACCCCCTGA 第一殘留環化元件,AnaXCGv1
21 AAAATGGGGGGA 第一殘留環化元件,AnaXCGv2
22 AAAACCCCCCCA 第一殘留環化元件,AnaXCGv3
23 TTTTTCCGTTGA 第一殘留環化元件,AnaXD5
24 AATCCGTTGA 第一殘留環化元件,AnaXD7
25 TCCGTTGA 第一殘留環化元件,AnaXD8
26 GAAATCCGTTGA 第一殘留環化元件,AnaXD9
27 TAAATCCGTTGA 第一殘留環化元件,AnaXD10
28 CAAATCCGTTGA 第一殘留環化元件,AnaXD11
29 AAAATCCGTTGACCTTAAACGGTCGTGTGGGTTCAAGTCCCTCCACCCCCACGCCGGAAACGCAATAGCCGAAAAACAAAAAACAAAAAAAACAAAAAAAAAACCAAAAAAACAAAACACA 第一殘留環化元件,Ana3.0
30 AAAATCCGTTGACCTTAAACGGTCGTGTGGGTTCAAGTCCCTCCACCCCCAGAAACCAACTTTATTACTATATTCCCCACAACC 第一殘留環化元件,Ana1.0
31 AAAATCCGTTGACCTTAAACGGTCGTGTGGGTTCAAGTCCCTCCACCCCCA 第一殘留環化元件,Ana0.9
32 AATCCGTTGGTG 第一殘留環化元件,Azo
33 AATCCGCCGGTG 第一殘留環化元件,AzoE
34 AAAA 第一環序列
35 TTTT 第一環序列
36 AA 第一環序列
37 TAAA 第一環序列
38 GAAA 第一環序列
39 CAAA 第一環序列
40 AAAAU 第一環序列
41 AAAAC 第一環序列
42 TCCGT 第一配對序列
43 GGC 第一配對序列
44 AGGCA 第一配對序列
45 CGTT 第一配對序列
46 TCTGT 第一配對序列
47 TCCGUUG 第一配對序列
48 AAGTCCGT 第一配對序列
49 AAGTCCGTTG 第一配對序列
50 TCCGTTGCG 第一配對序列
51 TCCGTTGCGTC 第一配對序列
52 AAAAAAGG 第一配對序列
53 CCCC 第一配對序列
54 GGGGGG 第一配對序列
55 CCCCCCC 第一配對序列
56 AGACGCTACGGACTT 第二殘留環化元件,AnaX,AnaXD3, AnaXE2,AnaXD5, AnaXD7, AnaXD8, AnaXD9, AnaXD10, AnaXD11
57 AGACGCTACAGACTT 第二殘留環化元件,AnaXD1, AnaXRD1
58 AGACGCTTGCCTCTT 第二殘留環化元件,AnaXD2, AnaXRD2
59 AGACGCAACGGACTT 第二殘留環化元件,AnaXE1, AnaXE3, AnaXE4, AnaXE5
60 AGACCCTTTTTTCTT 第二殘留環化元件,AnaXAU
61 AGACGCTGGGGGCTT 第二殘留環化元件,AnaXCGv1
62 AGACGCCCCCCACTT 第二殘留環化元件,AnaXCGv2
63 AGACGGGGGGGGCTT 第二殘留環化元件,AnaXCGv3
64 AAAAAACAAAAAACAAAACGGCTATTATGCGTTACCGGCGAGACGCTACGGACTT 第二殘留環化元件,Ana3.0
65 AGACGCTACGGACTT 第二殘留環化元件,Ana1.0,Ana0.9
66 AGACGCTACGGACAA 第二殘留環化元件,AnaXD6
67 AGACGCTACGGACTC 第二殘留環化元件,AnaXD12
68 AGACGCTACGGACTA 第二殘留環化元件,AnaXD13
69 AGACGCTACGGACTG 第二殘留環化元件,AnaXD14
70 GAGCAGCGGACTCAT 第二殘留環化元件,Azo
71 GAGCGGCGGACTCAT 第二殘留環化元件,AzoE
72 CTC 第二環序列
73 CTT 第二環序列
74 CTA 第二環序列
75 CTG 第二環序列
76 GCTT 第二環序列
77 ACTT 第二環序列
78 ACGGA 第二配對序列
79 GACG 第二配對序列
80 GACG 第二配對序列
81 GCT 第二配對序列
82 ACAGA 第二配對序列
83 TGCCT 第二配對序列
84 TGCCT 第二配對序列
85 CAACGGA 第二配對序列
86 ACGGACTT 第二配對序列
87 CAACGGACTT 第二配對序列
88 CGCAACGGA 第二配對序列
89 GACGCAACGGA 第二配對序列
90 CCTTTTTT 第二配對序列
91 GGGG 第二配對序列
92 CCCCCC 第二配對序列
93 GGGGGGG 第二配對序列
94 CCGATTAGTTGTAAGTCATCTATTG Ligand Intron
95 TCAACGGATTTTAAGTCCGTAGCGTCT Ligand Feature
96 ATTTTAAGTC Ligand F10
97 AACGGATTTTAAGTCCGTAG Ligand F20
98 CAACGGATTTTAAGTCCGTAGCG Ligand F23
99 TCAACGGATTTTAAGTCCGTAGCGT Ligand F25
100 TCAACGGATTTTAAGTCCGTAGCGTCT Ligand F27
101 ATCAACGGATTTTAAGTCCGTAGCGTCTT Ligand F29
102 TGCGAGGAACCATCCGGCCAGCTCCTG Ligand-Feature/ligase
103 GATAGTCGTTAGGCATTTATGTAGA Ligand-Td-Intron
104 TATTAAACGGTAGACCCAAGAAAACAT Ligand-Td-Feature
105 TTAAAACAGCCTGTGGGTTGATCCCACCCACAGGCCCATTGGGCGCTAGCACTCTGGTATCACGGTACCTTTGTGCGCCTGTTTTATACCCCCTCCCCCAACTGTAACTTAGAAGTAACACACACCGATCAACAGTCAGCGTGGCACACCAGCCACGTTTTGATCAAGCACTTCTGTTACCCCGGACTGAGTATCAATAGACTGCTCACGCGGTTGAAGGAGAAAGCGTTCGTTATCCGGCCAACTACTTCGAAAAACCTAGTAACACCGTGGAAGTTGCAGAGTGTTTCGCTCAGCACTACCCCAGTGTAGATCAGGTCGATGAGTCACCGTATTCCCCACGGGCGACCGTGGCGGTGGCTGCGTTGGCGGCCTGCCCATGGGGAAACCCATGGGACGCTCTAATACAGACATGGTGCGAAGAGTCTATTGAGCTAGTTGGTAGTCCTCCGGCCCCTGAATGCGGCTAATCCTAACTGCGGAGCACACACCCTCAAGCCAGAGGGCAGTGTGTCGTAACGGGCAACTCTGCAGCGGAACCGACTACTTTGGGTGTCCGTGTTTCATTTTATTCCTATACTGGCTGCTTATGGTGACAATTGAGAGATCGTTACCATATAGCTATTGGATTGGCCATCCGGTGACTAATAGAGCTATTATATATCCCTTTGTTGGGTTTATACCACTTAGCTTGAAAGAGGTTAAAACATTACAATTCATTGTTAAGTTGAATACAGCAAA Coxsackievirus B3 (CVB3)
106 TTTTGCGGCTCTGCCGCCGTTCGGGTTTTACCTGTTTTCACAGAGCAAAACAGGACCTCTAGTTTCGTGCTTAAACGAGATCATGCTCGAACTAGAACTATAACGCTGGTCACTGGACCCGTGCCGCGCCTTGCGGATCTTTGCGGGAATGGTGGCTAGTGGGCTGTGGAAGTGACTCTAACCACACGCCCCTCAAGTGTGGGAAAACACGAACTGGTGTAGCGACGACGATAGGCCTTGGGACACCCTCTCCAGTGATGGAGACCCAAGGGGCCAAAAGCCACGCCTTGTGCCCTGTCGTTCACAACCCCAGTGCAGTTCGTGCCAGTACCTGCTTTTGGGAAGTGTGCTTTGGACAGCTGAAAACAGTCCTAGTGGGAGACTAAGGATGCCCAGGAGGTACCCGGAGGTAACAAGTGACACTCTGGATCTGACTTGGGGAGAGCGGGTCTGCTTTACAGACGCCACTCTTTAAAAAACTTCTATGTCTCGTCAGGCACCGGAGGCCGGGCCTTTTCCTTTAAAACAATACACTTT BRAV-1_L
107 ATAACGCTGGTCACTGGACCCGTGCCGCGCCTTGCGGATCTTTGCGGGAATGGTGGCTAGTGGGCTGTGGAAGTGACTCTAACCACACGCCCCTCAAGTGTGGGAAAACACGAACTGGTGTAGCGACGACGATAGGCCTTGGGACACCCTCTCCAGTGATGGAGACCCAAGGGGCCAAAAGCCACGCCTTGTGCCCTGTCGTTCACAACCCCAGTGCAGTTCGTGCCAGTACCTGCTTTTGGGAAGTGTGCTTTGGACAGCTGAAAACAGTCCTAGTGGGAGACTAAGGATGCCCAGGAGGTACCCGGAGGTAACAAGTGACACTCTGGATCTGACTTGGGGAGAGCGGGTCTGCTTTACAGACGCCACTCTTTAAAAAACTTCTATGTCTCGTCAGGCACCGGAGGCCGGGCCTTTTCCTTTAAAACAATACACTTT BRAV-1
108 CGTAACTTAGACGCACAAAACCAAGTTCAATAGAAGGGGGTACAAACCAGTACCACCACGAACAAGCACTTCTGTTTCCCCGGTGATGTCGTATAGACTGCTTGCGTGGTTGAAAGCGACGGATCCGTTATCCGCTTATGTACTTCGAGAAGCCCAGTACCACCTCGGAATCTTCGATGCGTTGCGCTCAGCACTCAACCCCAGAGTGTAGCTTAGGCTGATGAGTCTGGACATCCCTCACCGGTGACGGTGGTCCAGGCTGCGTTGGCGGCCTACCTATGGCTAACGCCATGGGACGCTAGTTGTGAACAAGGTGTGAAGAGCCTATTGAGCTACATAAGAATCCTCCGGCCCCTGAATGCGGCTAATCCCAACCTCGGAGCAGGTGGTCACAAACCAGTGATTGGCCTGTCGTAACGCGCAAGTCCGTGGCGGAACCGACTACTTTGGGTGTCCGTGTTTCCTTTTATTTTATTGTGGCTGCTTATGGTGACAATCACAGATTGTTATCATAAAGCGAATTGGATTGGCCATCCGGTGAAAGTGAGACTCATTATCTATCTGTTTGCTGGATCCGCTCCATTGAGTGTGTTTACTCTAAGTACAATTTCAACAGTTATTTCAATCAGACAATTGTATCATA PV1
109 TTAAAACAGCTCTGGGGTTGTACCCACCCCAGAGGCCCACGTGGCGGCTAGTACTCCGGTATTGCGGTACCCTTGTACGCCTGTTTTATACTCCCTTCCCGTAACTTAGACGCACAAAACCAAGTTCAATAGAAGGGGGTACAAACCAGTACCACCACGAACAAGCACTTCTGTTTCCCCGGTGATGTCGTATAGACTGCTTGCGTGGTTGAAAGCGACGGATCCGTTATCCGCTTATGTACTTCGAGAAGCCCAGTACCACCTCGGAATCTTCGATGCGTTGCGCTCAGCACTCAACCCCAGAGTGTAGCTTAGGCTGATGAGTCTGGACATCCCTCACCGGTGACGGTGGTCCAGGCTGCGTTGGCGGCCTACCTATGGCTAACGCCATGGGACGCTAGTTGTGAACAAGGTGTGAAGAGCCTATTGAGCTACATAAGAATCCTCCGGCCCCTGAATGCGGCTAATCCCAACCTCGGAGCAGGTGGTCACAAACCAGTGATTGGCCTGTCGTAACGCGCAAGTCCGTGGCGGAACCGACTACTTTGGGTGTCCGTGTTTCCTTTTATTTTATTGTGGCTGCTTATGGTGACAATCACAGATTGTTATCATAAAGCGAATTGGATTGGCCATCCGGTGAAAGTGAGACTCATTATCTATCTGTTTGCTGGATCCGCTCCATTGAGTGTGTTTACTCTAAGTACAATTTCAACAGTTATTTCAATCAGACAATTGTATCATAATGGGTGC PV1_L
110 TTAAAACAGCCTGTGGGTTGCACCCACCCACAGGGCCCACTGGGCGCTAGCACTCTGGTATCACGATACCTTTGTGCGCCTGTTTTATATCCCCACCCCGAGTAAACGTTAGAAGTTACGCAACCCCGATCAATAGTAGGTGTAGCACTCCAGCTGCATCGAGATCAAGCACTTCTGTCTCCCCGGACCGAGTATCAATAGACTGCTAACGCGGTTGAAGGAGAAAACGTTCGTTACCCGGCCAATTACTTCGAGAAGCCCAGTAGTGCCGTGAAAGTTGCGGAGTGTTTCGCTCAGCACTTCCCCCGTGTAGATCAGGCTGATGAGTCACCGCGATCCCCACAGGTGACTGTGGCGGTGGCTGCGTTGGCGGCCTGCCTATGGGGCAACCCATAGGACGCTCTAATACAGACATGGTGCGAAGAGCCTATTGAGCTAATTGGTAGTCCTCCGGCCCCTGAATGCGGCTAATCCTAACTGCGGAGCACATGCCCTCAAACCAGGGGGTGGTGTGTCGTAACGGGTAACTCTGCAGCGGAACCGACTACTTTGGGTGTCCGTGTTTCTTTTTATTCTTATAATGGCTGCTTATGGTGACAATTAAAGAATTGTTACCATATAGCTATTGGATTGGCCATCCGGTGACTAACAAATCGCTCATATACCAGTTTGTTGGTTTTGTTCCCTTATCACATACAGCTCATAACACCCTCTTATATTTACTACAATTGAATAGCAAGAAATGGGGGC CVA2_L
111 GAGTAAACGTTAGAAGTTACGCAACCCCGATCAATAGTAGGTGTAGCACTCCAGCTGCATCGAGATCAAGCACTTCTGTCTCCCCGGACCGAGTATCAATAGACTGCTAACGCGGTTGAAGGAGAAAACGTTCGTTACCCGGCCAATTACTTCGAGAAGCCCAGTAGTGCCGTGAAAGTTGCGGAGTGTTTCGCTCAGCACTTCCCCCGTGTAGATCAGGCTGATGAGTCACCGCGATCCCCACAGGTGACTGTGGCGGTGGCTGCGTTGGCGGCCTGCCTATGGGGCAACCCATAGGACGCTCTAATACAGACATGGTGCGAAGAGCCTATTGAGCTAATTGGTAGTCCTCCGGCCCCTGAATGCGGCTAATCCTAACTGCGGAGCACATGCCCTCAAACCAGGGGGTGGTGTGTCGTAACGGGTAACTCTGCAGCGGAACCGACTACTTTGGGTGTCCGTGTTTCTTTTTATTCTTATAATGGCTGCTTATGGTGACAATTAAAGAATTGTTACCATATAGCTATTGGATTGGCCATCCGGTGACTAACAAATCGCTCATATACCAGTTTGTTGGTTTTGTTCCCTTATCACATACAGCTCATAACACCCTCTTATATTTACTACAATTGAATAGCAAGAA CVA2
112 TAAGTAGGGAACATATTCAATTCATATTGTTCATCTCACTGAACCCGCATGAAGGACTGCATTGCATATCCTGGACGAGGTGACGTGGAATATTTGGACATTTATGGATTGGACACTATAACGCTTTGTGCCTCTACGGAGATGTAACCATAATCTTAAGTAGTAGTACCCCAGCACAAGAGGATAAAGTGGCATACACGACAACGGGTGTTGCTCGCACCTTAGTAATGTGGATGTCCACCCTTGGAGCGTGCTGAAACTCTGTGGGTAAAGACACATATTAGTACAAATGTGGGGGAACTCACTGAAAGGGCATGTCCCGTGTACTGGTGTGCCGGAAAGTGGGGGTC GCTTTCTGGAGAACTTAGTAGTTCTTGTTATTGGGTGATAGCCTTGCGGCGGATCAACCCACAGTTTTAATCCGTTGTTTTGCAT Rafivirus A1 (RaV-A1)
113 GAGTAAACGTTAGAAGTTACGCAACCCCGATCAATAGTAGGTGTAGCACTCCAGCTGCATCGAGATCAAGCACTTCTGTCTCCCCGGACCGAGTATCAATAGACTGCTAACGCGGTTGAAGGAGAAAACGTTCGTTACCCGGCCAATTACTTCGAGAAGCCCAGTAGTGCCGTGAAAGTTGCGGAGTGTTTCGCTCAGCACTTCCCCCGTGTAGATCAGGCTGATGAGTCACCGCGATCCCCACAGGTGACTGTGGCGGTGGCTGCGTTGGCGGCCTGCCTATGGGGCAACCCATAGGACGCTCTAATACAGACATGGTGCGAAGAGCCTATTGAGCTAATTGGTAGTCCTCCGGCCCCTGAATGCGGCTAATCCTAACTGCGGAGCACATGCCCTCAAACCAGGGGGTGGTGTGTCGTAACGGGTAACTCTGCAGCGGAACCGACTACTTTGGGTGTCCGTGTTTCTTTTTATTCTTATAATGGCTGCTTATGGTGACAATTAAAGAATTGTTACCATATAGCTATTGGATTGGCCATCCGGTGACTAACAAATCGCTCATATACCAGTTTGTTGGTTTTGTTCCCTTATCACATACAGCTCATAACACCCTCTTATATTTACTACAATTGAATAGCAAGAA Coxsackievirus A2 (CVA2)
114 CCTGTCTTCTTGACGAGCATTCCTAGGGGTCTTTCCCCTCTCGCCAAAGGAATGCAAGGTCTGTTGAATG TCGTGAAGGAAGCAGTTCCTCTGGAAGCTTCTTGAAGACAAACAACGTCTGTAGCGACCCTTTGCAGGCAGCGGAACCCCCCACCTGGCGACAGGTGCCTCTGCGGCCAAAAGCCACGTGTATAAGATACACCTGCAAAGGCGGCACAACCCCAGTGCCACGTTGTGAGTTGGATAGTTGTGGAAAGAGTCAAATGGCTCTCCTCAAGCGTATTCAACAAGGGGCTGAAGGATGCCCAGAAGGTACCCCATTGTATGGGATCTGATCTGGGGCCTCGGTGCACATGCTTTACATGTGTTTAGTCGAGGTTAAAAAACGTCTAGGCCCCCCGAACCACGGGGACGTGGTTT TCCTTTGAAAAACACGATGATAAT Encephalomyocarditis virus (EMCV-1)
115 TGACATACACCGTGCAATTTGAAACTCCGCCTGGTCTTTCCAGGTCTAGAGGGGTAACACTTTGTACTGTGCTTGACTCCACGCTCGGTCCACTGGCGAGTGTTAGTAACAGCACTGGTGCTTCGTAGCGGAGCATGGTGGCCGTGGGAACTCCTCCTTGGTAACAAGGACCCACGGGGCCGAAAGCCACGTCCTGACGGACCCACCATGTGTGCAACCCCAGCACGGCAACTTTTCTGTGAAACTCACTCTAAGGTGACACTGATACTGGTATTCAAGTACTGGTGACAGGCTAAGGATGCCCTTCAGGTACCCCGAGGTAACACGCGACACTCGGGATCTGAGAAGGG GACTGGGGCTTCTGTAAAAGCGCCCAGTTTAAAAAGCTTCTATGCCTGGATAGGTGACCGGAGGCCGGCGCCTTTCCATTATAACTACTGACTTTA Foot-and-mouth disease virus (FMDV-O)
116 CCTGTGAGGAACTACTGTCTTCACGCAGAAAGCGTCTAGCCATGGCGTTAGTATGAGTGTCGTGCAGCCTCCAGGACCCCCCCTCCCGGGAGAGCCATAGTGGTCTGCGGAACCGGTGAGTACACCGGAATTGCCAGGACGACCGGGTCCTTTCTTGGATAAACCCGCTCAATGCCTGGAGATTTGGGCGTGCCCCCGCAAGACTGCTAGCCGAGTAGTGTTGGGTCGCGAAAGGCCTTGTGGTACTGCCTGATAGGGTGCTTGCGAGTGCCCCGGGAGGTCTCGTAGACCGTGCACC Hepatitis C virus (HCV1a)
117 ACCTGCCTCTTACGAGGCGACACTCCACCATGGATCACTCCCCTGTGAGGAACTTCTGTCTTCACGCGGAAAGCGCCTAGCCATGGCGTTAGTACGAGTGTCGTGCAGCCTCCAGGACCCCCCCTCCCGGGAGAGCCATAGTGGTCTGCGGAACCGGTGAGTACACCGGAATCGCTGGGGTGACCGGGTCCTTTCTTGGAGCAACCCGCTCAATACCCAGAAATTTGGGCGTGCCCCCGCGAGATCACTAGCCGAGTAGTGTTGGGTCGCGAAAGGCCTTGTGGTACTGCCTGATAGGGTGCTTGCGAGTGCCCCGGGAGGTCTCGTAGACCGTGCAAC Hepatitis C virus (HCV3a)
118 TTCACGCAGAAAGCGTCTAGCCATGGCGTTAGTATGAGTGTTGTACAGCCTCCAGGACCCCCCCTCCCGGGAGAGCCATAGTGGTCTTCGGAACCGGTGAGTACACCGGAATCGCCGGGATGACCGGGTCCTTTCTTGGATTAACCCGCTCAATGCCCGGAAATTTGGGCGTGCCCCCGCAAGACTGCTAGCCGAGTAGTGTTGGGTCGCGAAAGGCCTTGCGGTACTGCCTGATAGGGTGCTTGCGAGTGCCCCGGGAGGTCTCGTAGACCGTGCACC Hepatitis C virus (HCV4a)
119 TTCACGCAGAAAGCGTCTAGCCATGGCGTTAGTATGAGTGTCGAACAGCCTCCAGGACCCCCCCTCCCGGGAGAGCCATAGTGGTCTGCGGAACCGGTGAGTACACCGGAATTGCCGGGATGACCGGGTCCTTTCTTGGATAAACCCGCTCAATGCCCGGAGATTTGGGCGTGCCCCCGCGAGACTGCTAGCCGAGTAGTGTTGGGTCGCGAAAGGCCTTGTGGTACTGCCTGATAGGGTGCTTGCGAGTGCCCCGGGAGGTCTCGTAGACCGTGCACC Hepatitis C virus (HCV5a)
120 GCCAGCCCCTTACGGGGCGACACTCCGCCATGAATCACTCCCCTGCGAGGAACCACTGTCCTCACGCAGAAAGCGTCTAGCCATGACGTTAGTATGAGTGTCGTACAGCCTCCAGGACCCCCCCTCCCGGGAGAGCCATAGTGGTCTGCGGAACCGGTGAGTACACCGGAATTGCCGGGAAGACTGGGTCCTTTCTTGGATCAACCCACTCTATGCCCGGAGATTTGGGCGTGCCCCCGCGAGACTGCTAGCCGAGTAGTGTTGGGTCGCGAAAGGCCTTGTGGTACTGCCTGATAGGGTGCTTGCGAGTGCCCCGGGAGGTCTCGTAGACCGTGCACC Hepatitis C virus (HCV7a)
121 GTATACGAGGTTAGTTCATTCTCGTATGCATGATTGGACAAATTAAAATTTCAATTTGGATCAGGGCCTCCCTCCAGCGACGGCCGAACTGGGCTAGCCATGCCCACAGTAGGACTAGCAAACGGAGGGACTAGCCGTAGTGGCGAGCTCCCTGGGTGGTCTAAGTCCTGAGTACAGGACAGTCGTCAGTAGTTCGACGTGAGCAGAAGCCCACCTCGATATGCTATGTGGACGAGGGCATGCCCAAGACACACCTTAACCCTAGCGGGGGTCGCTAGGGTGAAATCACACCACGTGATGGGAGTACGACCTGATAGGGTGCTGCAGAGGCCCACTATTAGGCTAGTATA AAAATCTCTGCTGTACATGGCAC Classical swine fever virus (CSFV)
122 TAAGACTGGCTCAAGCGCGGAAAGCGCTGTAACCACATGCTGTTAGTCCCTTTATGGCTGCAAGATGGCTACCCACCTCGGATCACTGAACTGGAGCTCGACCCTCCTTAGTAAGGGAACCGAGAGGCCTTCGTGCAACAAGCTCCGACACAGAGTCCACGTGACTGCTACCACCATGAGTACATGGTTCTCCCCTCTCGACCCAGGACTTCTTTTTGAATATCCACGGCTCGATCCAGAGGGTGGGGCATGACCCCTAGCATAGCGAGCTACAGCGGGAACTGTAGCTAGGCCTTAGCGTGCCTTGGATACTGCCTGATAGGGCGACGGCCTAGTCGTGTCGGTTCTAT AGGTAGCACATACAAAT Seneca Valley virus (SVV)
123 ACACTCATTTCCCCCCTCCACCCTTAAGGTGGTTGTATCCCCTACACCCTACCCTCCCTTCCACATAGGACGAATAAACGGACTTGAGATTAAGGCAAGTACATAAGGTATGGTTTTTGGATACACTTAAATGGCAGTAGCGTGGCGAGCTATGGAAAAATCGCAATTGTCGATAGCCATGTTAGCGACGCGCTTCGGCGTGCTCCTTTGGTGATTCGGCGACTGGTTACAGGAGAGTAGACAGTGAGCTATGGGCAAACCCCTACAGTATTACTTAGGGGAATGTGCAATTGAGACTTGACGAGCGTCTCTTTGAGATGTGGCGCATGCTCTTGGCATTACCATAGTGA GCTTCCAGGTTGGGAAACCTGGACTGGGTCTATACTGCCTGATAGGGTCGCGGCTGGCCGCCTGTAACTAGTATAGTCAGTTGAAAACCCCCC Porcine sapelovirus (PSV)
124 AAAAGCAAAAATGTGATCTTGCTTGTAAATACAATTTTGAGAGGTTAATAAATTACAAGTAGTGCTATTTTTGTATTTAGGTTAGCTATTTAGCTTTACGTTCCAGGATGCCTAGTGGCAGCCCCACAATATCCAGGAAGCCCTCTCTGCGGTTTTTCAGATTAGGTAGTCGAAAAACCTAAGAAATTTACCT Cricket paralysis virus (CrPV)
125 GTTAAGATGTGATCTTGCTTCCTTATACAATTTTGAGAGGTTAATAAGAAGGAAGTAGTGCTATCTTAATAATTAGGTTAACTATTTAGTTTTACTGTTCAGGATGCCTATTGGCAGCCCCATAATATCCAGGACACCCTCTCTGCTTCTTATATGATTAGGTTGTCATTTAGAATAAGAAAATAACCT Drosophila C virus (DCV)
126 ATAGCACCACCCGATCGTAAACTCCATGTATTGGTTACCCATCTGCATCGAAAACTCTCCGAACACTAGGTGCAGTAAGGCTTTCATGGAGTGGTTTGCTATTTAGCGTACGTGTACCATAGGCAGCCCCAAAAACACGTGTGAGGAGAAAGTCCCAGTCACTTTGGGCAAAGTAGACAGCCGCGCTTGCGTGGTGGGACTTAATTA Taura syndrome virus (TSV)
127 AGTATAGTGTTCTGGAGGCATCATTCTATGGTTACCCATCATTAGAGGAAATTTCCAATAAACTCTGGTGTAAGGCTTAGAGTGATGGTCGAGGTGCCCTATTTAGGGTGAGGAGCCTCGGTGGCAGCCCCACCAAATCCTCTATTGGATAGGAACAGCTGTACTGGGCAGTTACAGCAGTCGTATGGTAACACATGCGGCGTTCCGAAA Israeli acute paralysis virus (IAPV)
128 TTAAAACTGGGTGTGGGTTGTTCCCACCCACACCACCCAATGGGTGTTGTACTCTGTTATTCCGGTAACTTTGTACGCCAGTTTTTCCCTCCCCTCCCCATCCTTTTACGTAACTTAGAAGTTTTAAATACAAGACCAATAGTAGGCAACTCTCCAGGTTGTCTAAGGTCAAGCACTTCTGTTTCCCCGGTTGATGTTGATATGCTCCAACAGGGCAAAAACAACAGATACCGTTATCCGCAAAGTGCCTACACAGAGCTTAGTAGGATTCTGAAAGATCTTTGGTTGGTCGTTCAGCTGCATACCCAGCAGTAGACCTTGCAGATGAGGCTGGACATTCCCCACTGGTAACAGTGGTCCAGCCTGCGTGGCTGCCTGCGCACCTCTCATGAGGTGTGAAGCCAAAGATCGGACAGGGTGTGAAGAGCCGCGTGTGCTCACTTTGAGTCCTCCGGCCCCTGAATGCGGCTAACCTTAAACCTGCAGCCATGGCTCATAAGCCAATGAGTTTATGGTCGTAACGAGTAATTGCGGGATGGGACCGACTACTTTGGGTGTCCGTGTTTCACTTTTTCCTTTATTAATTGCTTATGGTGACAATATATATATTGATATATATTGGCATC Rhinovirus A1 (RV-A1)
129 cccacagcaagaatgccatcatctgtcctcacccccaattttcccttttcttcccctgcaaccattacgcttactcgcatgtgcattgagtggtgcatgtgttgaacaaacagctacactcacatgggggcgggttttcccgccctacggcctctcgcgaggcccaccccttccctccccttataactacagtgctttggtaggtaagcatcctgatcccccgcggaagctgctcacgtggcaactgtggggacccagacaggttatcaaaggcacccggtctttccgccttcaggagtatccctactagtgaattctagcggggctctgcttggtgccaacctcccccaaatgcgcgctgcgggagtgctcttccccaactcaccctagtatcctctcatgtgtgtgcttggtcagcatatctgagacgatgttccgctgtcccagaccagtccagtaatggacgggccagtgcgtgtagtcgtcttccggcttgtccggggcatgtttggtgaaccggtggggtaaggttggtgtgcccaacgcccgtactttggtgacacctcaagaccacccaggaatgccagggaggtaccccacctcacggtgggatctgaccctgggctaattgtctacggtggttcttcttgcttccacttctttcttctgttcacg 18-675   
130 Gtataagagacaggtgtttgccttgtcttcggactggcatcttgggaccaaccccccttttccccagccatgggttaaatggcaataaaggacgtaacaactttgtaaccattaagctttgtaattttgtaaccactaagctttgtgcacataatgtaaccatcaagcttgttagtcccagcaggaggtttgcatgcttgtagccgaaatggggctcgaccccccatagtaggatacttgattttgcattccattgtggacctgcaaactctacacatagaggctttgtcttgcatctaaacacctgagtacagtgtgtacctagaccctatagtacgggaggaccgtttgtttcctcaataaccctacataataggctaggtgggcatgcccaatttgcaagatcccagactgggggtcggtctgggcagggttagatccctgttagctactgcctgatagggtggtgctcaaccatgtgtagtttaaattgagctgttcatatacc Crohivirus B   
131 Acatggggggtctgcggacggcttcggcccacccgcgacaagaatgccgtcatctgtcctcattacccgtattccttcccttcccccgcaaccaccacgcttactcgcgcacgtgttgagtggcacgtgcgttgtccaaacagctacacccacacccttcggggcgggtttgtcccgccctcgggttcctcgcggaacccccccctccctctctctctttctatccgccctcacttcccataactacagtgctttggtaggtgagcaccctgaccccccgcggaagctgctaacgtggcaactgtggggatccaggcaggttatcaaaggcacccggtctttccgccttcaggagtatctctgccggtgaattccggtagggctctgcttggtgccaacctcccccaaatgcgcgctgcgggagtgctcttccccaactcatcttagtaacctctcatgtgtgtgcttggtcagcatatctgaggcgacgttccgctgtcccagaccagtccagcaatggacgggccagtgtgcgtagtcgctttccggttttccggcgcatgtttggcgaaacgctgaggtaaggttggtgtgcccaacgcccgtaatttggtgatacctcaagaccacccaggaatgccagggaggtaccccacttcggtgggatctgaccctgggctaattgtctacggtggttcttcttgcttccacttctcttttttctggcatg Salivirus FHB   
132 Tttgaaaagggggtgggggggcctcggccccctcaccctcttttccggtggtctggtcccggaccaccgttactccattcagcttcttcggaacctgttcggaggaattaaacgggcacccatactccccccaccccccttttgtaactaagtatgtgtgctcgtgatcttgactcccacggaacggaccgatccgttggtgaacaaacagctaggtccacatcctcccttcccctgggagggcccccgccctcccacatcctccccccagcctgacgtatcacaggctgtgtgaagcccccgcgaaagctgctcacgtggcaattgtgggtccccccttcatcaagacaccaggtctttcctccttaaggctagccccggcgtgtgaattcacgttgggcaactagtggtgtcactgtgcgctcccaatctcggccgcggagtgctgttccccaagccaaacccctggcccttcactatgtgcctggcaagcatatctgagaaggtgttccgctgtggctgccaacctggtgacaggtgccccagtgtgcgtaaccttcttccgtctccggacggtagtgattggttaagatttggtgtaaggttcatgtgccaacgccctgtgcgggatgaaacctctactgccctaggaatgccaggcaggtaccccacctccgggtgggatctgagcctgggctaattgtctacgggtagtttcatttccaatccttttatgtcggagtc Aichi Virus   
133 Tatggcaggcgggcttgtggacggcttcggcccacccacagcaagaatgccatcatctgtcctcacccccaattttcccttttcttcccctgcaaccattacgcttactcgcatgtgcattgagtggtgcatgtgttgaacaaacagctacactcacatgggggcgggttttcccgccctacggcctctcgcgaggcccaccccttccctccccttataactacagtgctttggtaggtaagcatcctgatcccccgcggaagctgctcacgtggcaactgtggggacccagacaggttatcaaaggcacccggtctttccgccttcaggagtatccctactagtgaattctagcggggctctgcttggtgccaacctcccccaaatgcgcgctgcgggagtgctcttccccaactcaccctagtatcctctcatgtgtgtgcttggtcagcatatctgagacgatgttccgctgtcccagaccagtccagtaatggacgggccagtgcgtgtagtcgtcttccggcttgtccggggcatgtttggtgaaccggtggggtaaggttggtgtgcccaacgcccgtactttggtgacacctcaagaccacccaggaatgccagggaggtaccccacctcacggtgggatctgaccctgggctaattgtctacggtggttcttcttgcttccacttctttcttctgttcacg Salivirus NG-J1   
134 Ttaaaacagcggatgggtatcccaccatccgacccacagggtgtagtgctctggtattttgtacctttgcacgcctgtttccccattgtacccctccttaaatttcctccccaagtaacgttagaagtttaaggaaacaaatgtacaataggaagcatcacatccagtggtgttatgtacaagcacttctgtttccccggagcgaggtataagtggtacccaccgccgaaagcctttaaccgttatccgccaatcaactacgtaatggctagtattaccatgtttgtgacttggtgttcgatcaggtggttccccccactagtttggtcgatgaggctaggaactccccacgggtgaccgtgtcctagcctgcgtggcggccaacccagcttttgctgggacgcctttttacagacatggtgtgaagacctgcatgtgcttgattgtgagtcctcggcccctgaatgcggctaaccttaaccccggagccttgcaacataatccaatgttgttgaggtcgtaatgagtaattctgggatgggaccgactactttgggtgtccgtgtttccttttattctttatattgtcttatggtcacagcatatatagcatatatactgtgatc HRVB27   
135 cttccttttaattcgtaactgataagtgatagtccttggaagctaggtatttgttacgctagttttggattatcttgtgcccaacatttgttttcgaacatatgttgtgtttaaacacagaaatctagtttctttggttatgagtttaatggaatatccttttgaaagacttgccttggcgcgggctagagcgcaattgtcaccaggtattgcaccaatggtggcgacagggtacagaagagcaagtactcctgactgggtaatgggactgcattgcatatccctaggcatctattgagatttctctggagcccaccagcatggagttcctgtatgggaatgcaggactggacttgtgctgcctgacagggtcgcggctggccgtctgtactttgtatagtcagttgaaactcatt PTV B   
136 CGGACTTAAATAATTGAGCCTTAAAGAAGAAATTCTTTAAGTGGATGCTCTCAAACTCAGGGAAACCTAAATCTAGTTATAGACAAGGCAATCCTGAGCCAAGCCGAAGTAGTAATTAGTAAAACAATAGATGACTTACAACTAATCGGAAGGTGCAGAGACTCGACGGGAGCTACCCTAACGTCAAGACGAGGGTAAAGAGAGAGTCCAATTCTCAAAGCCAATAGGCAGTAGCGAAAGCTGCAAGAGAATGAAAATCCGT I類內含子,Anabaena sp.YBS01
137 GAGCGGCGGACTCATATTTCGATGTGCCTTGCGCCGGGAAACCACGCAAGGGATGGTGTCAAATTCGGCGAAACCTAAGCGCCCGCCCGGGCGTATGGCAACGCCGAGCCAAGCTTCGGCGCCTGCGCCGATGAAGGTGTAGAGACTAGACGGCACCCACCTAAGGCAAACGCTATGGTGAAGGCATAGTCCAGGGAGTGGCGAAAGTCACACAAACCGGAATCCGCCGGTG I類內含子,Azoarcus sp. BH72
138 ctttcggacaggggttcgatTCAAAAGAGTCGCCTTATGAAGTGATTCATAAGTGAAAACTTGGCTTTATCGGTGAAACCGAAACGTAAGACGTCGGCAATACCGAGTGGTATGTGGGGAAACCCAACAGCCGTATCGACTCATAGGTTTCTAACCTTAAGAAATGAAATTTTCTTAAGTAAGAAATACTAGGATAGAAGTTTTAAACTATAATATAGCTTCTATAACATGCCAAGGTACTTAAAACTTATAAGTTTTAAGCACGAGATATAGTCAGTGCCATTAGAGATAATGGAATAGCATGtcccctcgcctccacca I類內含子,Clostridium botulinum
139 agacgctacggacttAATTGGATTGAGCCTTGGTATGGAAACCTACTAAGTGATAACTTTCAAATTCAGAGAAACCCGGGAATTAACAATGGGCAATCCTGAGCCAAATCCTGGTTTACGCGAACAAACCAAAGTGTAGAAAGCGAGAAAGAAGGGATAGGTGCAGAGACTCAATGGAAGCTGTTCTAACAAATGGAGTTCACTACCTTGTATTGATCAAATGATTCACTTCATAGTCTGATAGATCCTTGGTGGAACTGATTAATCGGACGAGAATAAAGATAGAGTCCCATTCTACATGTCAATACTGACAACAATGAAATTTATAGTAAGATGaaaatccgttgactt I類內含子,Ddu.c.trnL-1
140 agacgctacggacttAATTGGATTGAGCCTTGGTATGGAAACCTACTAAGTGATAACTTTCAAATTCAGAGAAACCCGGGAATTAACAATGGGCAATCCTGAGCCAAATCCTGGTTTACGCGAACAAACCAAAGTGTAGAAAGCGAGAAAGAAGGGATAGGTGCAGAGACTCAATGGAAGCTGTTCTAACAAATGGAGTTCACTACCTTGTATTGATCAAATGATTCACTTCATAGTCTGATAGATCCTTGGTGGAACTGATTAATCGGACGAGAATAAAGATAGAGTCCCATTCTACATGTCAATACTGACAACAATGAAATTTATAGTAAGATGaaaatccgttgactt I類內含子,Dla.c.trnL
141 agacgctacggacttAATTGGATTGAGCCTTGGTATGGAAACCTACTAAGTGATAACTTTCAAATTCAGAGAAACCCGGGAATTAACAATGGGCAATCCTGAGCCAAATCCTGGTTTACGCGAACAAACCAAAGTGTAGAAAGCGAGAAAGAAGGGATAGGTGCAGAGACTCAATGGAAGCTGTTCTAACAAATGGAGTTCACTACCTTGTATTGATCAAATGATTCACTTCATAGTCTGATAGATCCTTGGTGGAACTGATTAATCGGACGAGAATAAAGATAGAGTCCCATTCTACATGTCAATACTGACAACAATGAAATTTATAGTAAGATGaaaatccgttgactt I類內含子,Dto.c.trnL-1
142 ctacggacttAATTGGATTGAGCCTTGGTATGGAAACCTACCAAGTGATAACTTTCAAATTCAGAGAAACCCTGGAATTAAAAATGGGCAATCCTGAGCCAAATCCCGTTTTATGAAAACAAACAAGGGTTTCAGAAAGCGAGAATAAATAAAGGATAGGTGCAGAGACTCAATGGAAGCTGTTCTAACAAATGGAGTTGGCTGCATTGTGTTCGTAGTAAAGGAATCGAAACTTCCGAAAGGATGAAAGATAAACCTATATACATATGTATACTTACTGAAATACTATCGCCAAATAATTCAAAATGATTAATGACGACTCCGTCCGCTAAATCTTTTTATTTTTAAAAATTTTTAAATCGGATAAGAATAAAGATAGAGTCCCATTCTACATGTCAATATCGACAACAATGAAATTTATAGTAAGAGGaaaatccgtc I類內含子,Fan.c.trnL
143 aatcgcagtgtggttTAACATTCGGGCCACACTATAATAAACTCCTTGAATTCGGTAAACCTCTCAACGAATAAAGTTCGCAGACAATACCGAGCTAAGCTTAATATGCTAAGATTTTAAATGTGTTTACTCCAACCAAACATGCTATAATAAACCTAAGAGGTGATAGCAATGGAGCATTGGAAATGGATAGATGGTTTTGAGGGCAAATACGAAGTCAGTGATTTAGGCAGAGTAAGGTCTTATGCAACTGGCAAATGCGCTTATCTATCTGTTAATCGCCTAACTCGCGATGGCTATAGCCATATTGCTTTGCGAAAAAATGGCAAAGCATATGAGTTTAGACTAAACAGACTGGTGGCAGCAGCTTTTATTGGCCAACCATCTAAAGAGAAAAACACAGTTAATCACATTAATGGCATCAAAACTGATAATCGAGCAGTTAACCTTGAATGGGCCTCACGATCAGAGCAAATGTATCATGCTTATCAACACCATTTAAAATTACCCAGGAAAGGAAAACGCAGAACATTTGACGACTTCAGCTTTGAAGAAAAGCAAGATATCTGGAATAATTATCAGCCATATAAAAAAGGGCACAGTAAAAGATATTTTTGCATTAAATATAATACCCACTATTCAGTGATTGACAAAATCTTAGCAGAAAAGAAAGTGTAACGACTATCGAAACACAAAAAGCATCAGCTGATTAGCTGATGCTTTTTGAATGGAGTAGAGTAGTCCCCAAGCGGGGGCGAAGCAGGGAGCATCAGCAATATGATGAAGAGCTAGTCTGAACTTGATAGAAATATCAAGAGCATGTATGGACGCGATACATGCGCAACAACATTAcgaagaatttgcaaa I類內含子,LL-H.v.terL
144 agacgctgcggacttAATTTAATTGAGCTTTAGTTGAGAAATTTACTAAATGATTGTTTTCAAATTCAGGGAAACCTAGGTTGCAAAAAAAAGATAAAAATTAGGTAATCCTGAGCCAAATTTTGTTTACTAAAACAAAAGAGGTGCAGAGACTCAAAGAAAACTATCCTAACGAAATTTTTTATCATTTTTATAAAAAATTGGATTAATATATTAATTAATAATAATAAAATTATTAAATCATTTTTTCATTTTAAATATAGACGAGGATAAAGATAGAGTCCGTTTTTACAAGTTAATTTTAACAACAATGCAAATTGTAGTAAAATGaaaatccgttggctt I類內含子,Mpo.c.trnL
145 ctacggacttGATCGAATTGAGCCTTGGTATGGAAACCTACCAAGTGATAGCTTCCAAATCCAGGGAACCCTGGGATATTTTGAATGGGTAATCCTGAGCCAAATCCGGTTCATGAAGACAATGTTTCTTCTCCTAAGATAGGAAGGGGATAGGTGCAGAGACTCAATGGAAGCTATTCTAACGAATGAATCTCATTTGGTCCAATACTGTAGTTACTGTAGTTATAGAACGATCTATTTACACCTCAAAAATGGAGAGAGATGTTATATAACATCAGACAAAACTGGCGATCAGAACTCGTTCCAAGCATTTTATTCATAAGATAGATGCCAGATTCGAGTTGAAGTACTGATTTGACATTAAGTAATCCAATTATGAACTTATCTACTCTAGATGAATAATTTAATTATTTTTTGGAATAAATGGTTGGACGAGGATAAAGATAGAGTCCAATTCTACATGTCAATGTAAACAACAATGCAAATTGCAGTAGGAGGaaaatccgtt I類內含子,Pth.c.trnL
146 agacgctacggacttGATTGTATTGAGCCTTGGTATGGAAACCTGCTAAGTGGTAACTTCCAAATTCAGAGAAACCCTGGAATGAAAAATGGGCAATCCTGAGCCAAATCCACTTTTTTCAAAAAAGTGGTTCTCAAACTAGAACCCAAAGGAAAAGGATAGGTGCAGAGACTCAATGGAAGCTGTTCTAACGAATCGAAGTAATAACGATTAATCACAGAACCCATATTATAATATAGGTTCTTTATTTTATTTTGAGAATGAAATTAGGAATGATTATGAAATAGAAAATTCATAATTTTTTTAGAATTATTGTGAATCTATTCCAATCGAATATTGAGTAATCAAATCCTTCAATTCATTGTTTTCGAGATCTTTTAAAAAGTGGATTAATCGGACGAGGATAAAGAGAGAGTCCCATTCTACATGTCAATACTGACAACAATGAAATTTCTAGTAAAAGGaaaatccgtcgactt I類內含子,Sbi.c.trnL
147 aacaggtTGACGACAACAGGCCTGTGACAGCGGGGCTTCGAACTTTCCGTGTTTTTTTTTCTTCCGCTAGTCGATCATCCGTGACGGCCGGGCAAGCGCCCGAGTACCAGGACCGTCGGGCCCCCGAGAAGGGGGGGCCTAGGATGCGGCAAGACGACCCGGTTCGGGGAACGCCAGCGTGCGCTGGCCGATCCCGAGGCGAGGTGCCGTAGCGGGCACCCGTCGTAACGCGCGGTAGGGCGTCGGTCCCCCCTCCCACGGCGGAGGGGAGGCTTAAGGTACGTGCTAAACCCCCAGCGATGGGGCCTGTAGGAAAAGCCCTGGTACGGCGAAGCCTACGGGGACCGCCCGATGGCGGTCGGATGCCGGCGGGCCACGGAGCCCCCGGCGTCGATTGctgtta I類內含子,Scytalidium_dimidiatum
148 agacgcagcggacttAGAAAACTGGGCCTCGATCGCGAAAGGGATCGAGTGGCAGCTCTCAAACTCAGGGAAACCTAAAACTTTAAACATTAAAGTCATGGCAATCCTGAGCCAAGCTAAAGCTAAACAACTAACAGCTTTAGAAGGTGCAGAGACTAGACGGGAGCTACCCTAACGGATTCAGCCGAGGGTAAAGGGATAGTCCAATTCTCAACATCGCGATTGTTGATGGCAGCGAAAGTTGCAGAGAGAATGaaaatccgctgactg I類內含子,Sel.b.trnL-2
149 gatgttttcttgggtTAATTGAGGCCTGAGTATAAGGTGACTTATACTTGTAATCTATCTAAACGGGGAACCTCTCTAGTAGACAATCCCGTGCTAAATTGTAGGACTGCCCTTTAATAAATACTTCTATATTTAAAGAGGTATTTATGAAAAGCGGAATTTATCAGATTAAAAATACTTTAAACAATAAAGTATATGTAGGAAGTGCTAAAGATTTTGAAAAGAGATGGAAGAGGCATTTTAAAGATTTAGAAAAAGGATGCCATTCTTCTATAAAACTTCAGAGGTCTTTTAACAAACATGGTAATGTGTTTGAATGTTCTATTTTGGAAGAAATTCCATATGAGAAAGATTTGATTATTGAACGAGAAAATTTTTGGATTAAAGAGCTTAATTCTAAAATTAATGGATACAATATTGCTGATGCAACGTTTGGTGATACATGTTCTACGCATCCATTAAAAGAAGAAATTATTAAGAAACGTTCTGAAACTGTTAAAGCTAAGATGCTTAAACTTGGACCTGATGGTCGGAAAGCTCTTTACAGTAAACCCGGAAGTAAAAACGGGCGTTGGAATCCAGAAACCCATAAGTTTTGTAAGTGCGGTGTTCGCATACAAACTTCTGCTTATACTTGTAGTAAATGCAGAAATCGTTCAGGTGAAAATAATTCATTCTTTAATCATAAGCATTCAGACATAACTAAATCTAAAATATCAGAAAAGATGAAAGGTAAAAAGCCTAGTAATATTAAAAAGATTTCATGTGATGGGGTTATTTTTGATTGTGCAGCAGATGCAGCTAGACATTTTAAAATTTCGTCTGGATTAGTTACTTATCGTGTAAAATCTGATAAATGGAATTGGTTCTACATAAATGCCTAACGACTATCCCTTTGGGGAGTAGGGTCAAGTGACTCGAAACGATAGACAACTTGCTTTAACAAGTTGGAGATATAGTCTGCTCTGCATGGTGACATGCAGCTGGATATAATTCCGGGGTAAGATTAACGACCTTATCTGAACATAATGctaccgtttaatatt I類內含子,T4.v.td,1
150 agacgctacggacttGATTGTATTGAGCCTTGGTATGGAAACCTGCTAAGTGGTAACTTCCAAATTCAGAGAAACCCTGGAATGAAAAATGGGCAATCCTGAGCCAAATCCCTTTTTTGAAAAACAAGTGGTTCTCAAACTAGAACCCAAAGGAAAAGGATAGGTGCAGAGACTCAATGGAAGCTGTTCTAACGAATCGAAGTAATAACGATTAATCACAGAACCCATATTATAATATAGGTTCTTTATTTTATTTTTAGAATGAAATTAGGAATGATTATGAAATAGAAAATTCATAATTTTTTTTTAGAATTATTGTGAATCTATTCCAATCAAATATTGAGTAATCAAATCCTTCAATTCATTGTTTTCGAGATCTTTTAATTTTAAAAAGTGGATTAATCGGACGAGGATAAAGAGAGAGTCCCATTCTACATGTCAATACTGACAACAATGAAATTTCTAGTAAAAGGaaaatccgtcgactt I類內含子,Zma.c.trnL
151 CCGTCGATTGTCCACTGGTC 5’ 同源臂-原始(20)
152 ccgtcgattgtccactggtcccgtcgattgtccactggtc 5’ 同源臂-2x原始(40)
153 aaaaaaaaaaaaaaaaaaaa 5’ 同源臂-AU 對(20), 3’ 同源臂-UA 對(20)
154 tttttttttttttttttttt 5’ 同源臂-UA 對(20), 3’ 同源臂-AU對(20)
155 aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa 5’ 同源臂-AU pair (40), 3’ 同源臂-UA對(40)
156 tttttttttttttttttttttttttttttttttttttttt 5’ 同源臂-UA對(40), 3’ 同源臂-AU對(40)
157 cccccccccccccccccccc 5’ 同源臂-CG對(20),
158 gggggggggggggggggggg 3’ 同源臂-CG對(20)
159 gggggggggggggggggggggggggggggggggggggggg 5’ 同源臂-GC對(40), 3’ 同源臂-CG對(40)
160 cccccccccccccccccccccccccccccccccccccccc 5’ 同源臂-CG對(40), 3’ 同源臂-GC對(40)
161 GACCAGTGGACAATCGACGG 3’ 同源臂-原始(20)
162 gaccagtggacaatcgacgggaccagtggacaatcgacgg 3’ 同源臂-2x 原始(40)
圖1、RNA環化的不同方法。 圖2、通過T4連接酶的RNA環化。 圖3、通過T4連接酶與夾板(splint)的RNA環化。 圖4、通過Td I類內含子的RNA環化。 圖5、通過Ana I類內含子的RNA環化。 圖6、通過Tornado系統的RNA環化。 圖7、AnaX系統以及RNA環化的組分示意圖。 圖8、通過I類內含子剪接產生的環形 POLR2A刺激免疫反應。 圖9、用體外circSHAPE-MaP預測環形 POLR2A_Lig、環形 POLR2A_TD和環形 POLR2A_Ana的二級結構。 圖10、縮短環形RNA中的外來序列降低免疫原性。 圖11、AnaX-circRNA的轉譯效率高於mRNA。 圖12、AnaX-circRNA的免疫原性低於mRNA。 圖13、AnaX環化不同長度的RNA。 圖14、AnaX催化的環形RNA具有較低的免疫原性。 圖15、與相應mRNA相比,AnaX催化的環形RBD和螢光素酶 LuciferaseRNA具有更高的轉譯效率。 圖16、殘留序列莖環中的鹼基對的改造。 圖17、增加莖環中鹼基對的數量可提高RNA環化效率。 圖18、用AU對或GC對替換殘留序列的莖環中的鹼基對。 圖19、莖環結構中強的配對能力提高RNA環化效率(不同環化時間段)。 圖20、莖環結構中強的配對能力提高RNA環化效率(編碼 mCheeryLuciferase)。 圖21、改造殘留序列莖環中的鹼基對不影響免疫原性。 圖22、用GC對替換殘留序列莖環中的鹼基對可提高環形RNA轉譯效率。 圖23、殘留序列莖環中的環對RNA環化的影響。 圖24、環形RNA中縮短的外來序列保持高環化效率。 圖25、改造AnaX I類內含子的同源臂。 圖26、增加AnaX I類內含子的同源臂長度可以提高RNA成環效率。 圖27、Azoarcus I類內含子及其莖環結構的改進。 圖28、IRES在蛋白編碼區上游或者下游都不影響蛋白轉譯。 圖29、簡化和優化RNA環化的方法。 圖30、添加Mg2+可提高IVT和環化效率。 圖31、IVT進行3h後添加大量Mg2+可顯著提高IVT效率。 圖32、添加NaOAc可以提高體外轉錄效率。 圖33、添加KCl可以提高體外轉錄效率。 圖34、Mg(OAc)2可以提高體外轉錄效率。 圖35、高溫影響體外轉錄效率且不促進環化。 圖36、延長體外轉錄時間可以提高RNA產量並促進RNA環化。 圖37、緩衝液對體外轉錄和RNA環化效率的影響。 圖38、不同MnCl 2濃度對RNA環化效率的影響。 圖39、環化溫度和時間對RNA環化效率的影響。 圖40、不同緩衝液以及不同pH對RNA環化效率的影響。 圖41、通過使用配體純化AnaX-circRNA。 圖42、比較不同長度配體對環形RNA的富集。 圖43、通過縮短配體長度比較配體結合環形RNA的特異性。 圖44、親和寡聚配體磁珠純化的環形 mCherryRNA的轉譯效率。 圖45、親和寡聚配體磁珠純化的環形 mCherry的低免疫原性。 圖46、親和寡聚配體純化的環形 LuciferaseRNA。 圖47、親和寡聚配體純化T4連接酶環化的環形 POLR2A。 圖48、親和寡聚配體純化Td I類內含子環化的環形 POLR2A。 圖49、Ligand Intron和Ligand Feature層析柱純化環形RNA效率。 圖50、雙層析柱親和層析純化circRNA。 圖51、對線性RNA加尾以純化環形RNA。 圖52、環形RNA在細胞中比線性RNA更穩定。 圖53、裸環形RNA在RT或4°C下是穩定的。 圖54、比較細胞中螢光素酶mRNA和環形螢光素酶RNA的表現和穩定性。 圖55、比較細胞中螢光素酶mRNA和環形螢光素酶RNA的免疫原性。 圖56、通過皮內注射遞送裸環形RNA。 圖57、通過脂質體遞送環形RNA。 圖58、m5C修飾影響RNA環化。 圖59、Ψ修飾影響RNA環化。 圖60、m1Ψ修飾影響RNA環化。 圖61、m6A修飾影響RNA環化。 圖62、核苷酸修飾影響環形RNA表現。 圖63、通過螢光檢測不同類型病毒IRES的效率。 圖64、通過Western Blot檢測不同類型病毒IRES的效率。 圖65、BRAV1_L和PV1_L顯示出與CVB3相當的轉譯效率。 圖66、檢測不同IRES在不同細胞內的活性。
TW202330918A_111136419_SEQL.xml

Claims (159)

  1. 一種環形RNA前體,其包含從5'至3'方向按以下順序排列的以下元件: a) 3'自剪接內含子片段; b) 第一殘留成環元件; c) 感興趣的核苷酸序列; d) 第二殘留成環元件;和 e) 5'自剪接內含子片段; 其中該環形RNA前體能夠通過其自剪接生成包含該第一殘留成環元件、該感興趣的核苷酸序列和該第二殘留成環元件的環形RNA, 其中該第一殘留成環元件和該第二殘留成環元件總長度為大約5至大約100個核苷酸。
  2. 如請求項1之環形RNA前體,其中該自剪接內含子選自I類內含子和II類內含子,例如,該自剪接內含子是I類內含子。
  3. 如請求項1或2之環形RNA前體,其中該自剪接內含子選自I類內含子的IC3亞類。
  4. 如請求項1至3中任一項之環形RNA前體,其中該自剪接內含子選自藍藻魚腥藻屬(Anabaena)的I類內含子、T4噬菌體的I類內含子或者Azoarcus sp. BH72的I類內含子,例如,該自剪接內含子是藍藻魚腥藻屬的I類內含子。
  5. 如請求項1至4中任一項之環形RNA前體,其中該自剪接內含子選自魚腥藻屬pre-tRNA-Leu基因的I類內含子、T4噬菌體td基因的I類內含子或者Azoarcus sp. BH72 pre-tRNA-Leu基因的I類內含子,例如,該自剪接內含子是魚腥藻屬pre-tRNA-Leu基因的I類內含子。
  6. 如請求項1至5中任一項之環形RNA前體,其中該3'自剪接內含子片段衍生自天然自剪接內含子的3'端部分,即從內部分割位點到天然自剪接內含子的3'末端的部分,並且其中該5'自剪接內含子片段衍生自天然自剪接內含子的5'端部分,即從內部分割位點到天然自剪接內含子的5'末端的部分,並且,該3'自剪接內含子片段和該5'自剪接內含子片段組合保留天然自剪接內含子的自剪接活性。
  7. 如請求項6之環形RNA前體,其中該內部分割位點位於I類內含子的P6、P2、P5、P8或P9區域,或者II類內含子的D4區域,優選地,該內部分割位點位於I類內含子的P6區域。
  8. 如請求項6或7之環形RNA前體,其中該3'自剪接內含子片段與天然自剪接內含子的3'端部分具有至少75%、至少80%、至少85%、至少90%、至少95%、100%的序列相同性,並且該5'自剪接內含子片段是與天然自剪接內含子的5'端部分具有至少75%、至少80%、至少85%、至少90%、至少95%、100%的序列相同性。
  9. 如請求項1至8中任一項之環形RNA前體,其中該自剪接內含子是魚腥藻屬pre-tRNA-Leu基因的I類內含子,並且該3'自剪接內含子片段包含SEQ ID NO:1的核苷酸序列或與SEQ ID NO:1具有至少75%、至少80%、至少85%、至少90%、至少95%、100%相同性的核苷酸序列,或由其組成;並且該5'自剪接內含子片段包含SEQ ID NO:2的核苷酸序列或與SEQ ID NO:2具有至少75%、至少80%、至少85%、至少90%、至少95%、100%相同性的核苷酸序列,或由其組成。
  10. 如請求項1至8中任一項之環形RNA前體,其中該自剪接內含子是T4噬菌體td基因的I類內含子,並且該3'自剪接內含子片段包含SEQ ID NO:5的核苷酸序列或與SEQ ID NO:5具有至少75%、至少80%、至少85%、至少90%、至少95%、100%相同性的核苷酸序列,或由其組成;並且該5'自剪接內含子片段包含SEQ ID NO:6的核苷酸序列或與SEQ ID NO:6具有至少75%、至少80%、至少85%、至少90%、至少95%、100%相同性的核苷酸序列,或由其組成。
  11. 如請求項1至8中任一項之環形RNA前體,其中該自剪接內含子是Azoarcus sp. BH72 pre-tRNA-Leu基因的I類內含子,並且該3'自剪接內含子片段包含SEQ ID NO:3的核苷酸序列或與SEQ ID NO:3具有至少75%、至少80%、至少85%、至少90%、至少95%、100%相同性的核苷酸序列,或由其組成;並且該5'自剪接內含子片段包含SEQ ID NO:4的核苷酸序列或與SEQ ID NO:4具有至少75%、至少80%、至少85%、至少90%、至少95%、100%相同性的核苷酸序列,或由其組成。
  12. 如請求項1至11中任一項之環形RNA前體,其中該第一殘留成環元件和第二殘留成環元件使得包含其的環形RNA,相對於對照RNA,例如包含SEQ ID NO:29和SEQ ID NO:64的成環元件的對照環形RNA,或者包含相同感興趣的核苷酸序列的對照線性RNA,具有降低的免疫原性。
  13. 如請求項1至12中任一項之環形RNA前體,其中該第一殘留成環元件和第二殘留成環元件使得包含其的環形RNA或環形RNA前體,相對於對照環形RNA或環形RNA前體,例如分別包含SEQ ID NO:29和SEQ ID NO:64 (Ana3.0)的第一殘留成環元件和第二殘留成環元件的對照環形RNA或環形RNA前體,具有相當的或增加的成環效率。
  14. 如請求項1至13中任一項之環形RNA前體,其中該第一殘留成環元件和該第二殘留成環元件總長度為大約20至大約35個核苷酸。
  15. 如請求項1至14中任一項之環形RNA前體,其中該第一殘留成環元件和該第二殘留成環元件被設置為能夠形成莖環(stem-loop)結構,例如,在自剪接後實現環化。
  16. 如請求項15之環形RNA前體,其中該莖環結構的環(loop)中包含剪接位點(splicing junction)。
  17. 如請求項15至16中任一項之環形RNA前體,其中該第一殘留成環元件包含下式該序列結構:5'-第一環(loop)序列-第一配對序列-第一非配對序列-3';且該第二殘留成環元件包含下式該序列結構:5'-第二非配對序列-第二配對序列-第二環序列-3', 其中該第一非配對序列或第二非配對序列可以獨立地存在或不存在, 該第一配對序列和該第二配對序列可互補配對形成該莖環結構的莖,其中第一環序列和第二環序列可形成該莖環結構的環,例如,通過自剪接進行環化。
  18. 如請求項17之環形RNA前體,其中該第一環序列包含一個或多個可以與對應自剪接內含子的P1區域配對而在環化過程中形成P10雙鏈區的核苷酸,或由其組成。
  19. 如請求項17或18之環形RNA前體,其中該第一環序列由(N)n核苷酸序列組成,其中N表示任何核苷酸(A、G、U或C),n表示1-20之間的整數,例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20。
  20. 如請求項17-19中任一項之環形RNA前體,其中該第一環序列包含AAAA、AA、UUUU、CAAA或GAAA或由其組成,優選為AAAA。
  21. 如請求項17至20中任一項之環形RNA前體,其中該第二環序列包含一個或多個可以與對應自剪接內含子的導向序列(internal guide sequence, IGS)配對而在環化過程中形成P1雙鏈區的核苷酸,或由其組成。
  22. 如請求項17至21中任一項之環形RNA前體,其中該第二環序列包含CUU或CUC,優選為CUU。
  23. 如請求項17至22中任一項之環形RNA前體,其中該莖環結構的環具有CUUAAAA、CUUUUUU、CUUAA、CUUGAAA、CUUUAAA、CUUCAAA或CUCAAAA序列,優選為CUUAAAA。
  24. 如請求項17至23中任一項之環形RNA前體,其中該莖環結構中的莖部分包含2至15個或更多個連續鹼基對。優選地,該莖環結構中的莖部分包含5、6或7個連續鹼基對。
  25. 如請求項17至24中任一項之環形RNA前體,其中該莖環結構中的莖部分包含至多2個鹼基錯配,或者該莖部分只包含1個鹼基錯配,優選地,該莖部分不包含鹼基錯配。
  26. 如請求項17至25中任一項之環形RNA前體,其中該第一配對序列僅包含G,該第二配對序列僅包含C。
  27. 如請求項17至25中任一項之環形RNA前體,其中該第一配對序列僅包含C,該第二配對序列僅包含G。
  28. 如請求項17至25中任一項之環形RNA前體,其中該第一配對序列僅包括A,該第二配對序列僅包括U。
  29. 如請求項17至25中任一項之環形RNA前體,其中該第一配對序列包含SEQ ID NO:42至55中的任一序列或由其組成,並且,該第二配對序列包含SEQ ID NO:78至93中的任一序列或由其組成。
  30. 如請求項15至29中任一項之環形RNA前體,其中該莖環結構的經預測的自由能小於大約-1 kal/mol,小於大約-2 kal/mol,小於大約-3 kal/mol,小於大約-4 kal/mol,小於大約-5 kal/mol,小於大約-6 kal/mol,小於大約-7 kal/mol,小於大約-8 kal/mol,小於大約-9 kal/mol,小於大約-10 kal/mol,或更小。
  31. 如請求項1至30中任一項之環形RNA前體,其中該第一殘留成環元件包含從5'到3'方向的3'外顯子區域和可選的第一間隔子,或由其組成;該第二殘留成環元件包含從3'到5'方向的5'外顯子區域和可選的第二間隔子,或由其組成。
  32. 如請求項31之環形RNA前體,其中該3'外顯子區域衍生於自剪接內含子的天然3'外顯子,該5'外顯子區域衍生於自剪接內含子的天然5'外顯子,並且3'外顯子區域和5'外顯子區域可以被自剪接內含子或3'自剪接內含子片段和5'自剪接內含子片段的結合所識別和/或剪接。
  33. 如請求項32之環形RNA前體,其中該3'外顯子區域是與天然3'外顯子或從天然3'外顯子的5'端核苷酸開始的約1-約50個核苷酸的連續片段具有至少50%、至少60%、至少70%、至少80%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的序列, 該5'外顯子區域是與天然5'外顯子或從天然5'外顯子的3'端核苷酸開始的約1至約50個核苷酸的連續片段具有至少50%、至少60%、至少70%、至少80%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的序列。
  34. 如請求項1至33中任一項之環形RNA前體,其中該第一殘留成環元件包含與選自SEQ ID NO:13至55的核苷酸序列具有至少50%,至少60%,至少70%,至少80%,至少90%,至少95%或100%序列相同性的核苷酸序列或由其組成。
  35. 如請求項1至34中任一項之環形RNA前體,其中該第二殘留成環元件包含與選自SEQ ID NO:56至93的核苷酸序列具有至少50%,至少60%,至少70%,至少80%,至少90%,至少95%或100%序列相同性的核苷酸序列或由其組成。
  36. 如請求項1至35中任一項之環形RNA前體,其中該第一殘留成環元件包含SEQ ID NO:13至55中的任一核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:56至93中的任一核苷酸序列或由其組成。
  37. 如請求項1至36中任一項之環形RNA前體,其中, 1)該第一殘留成環元件包含SEQ ID NO:15的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:57的核苷酸序列或由其組成; 2)該第一殘留成環元件包含SEQ ID NO:14的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:58的核苷酸序列或由其組成; 3)該第一殘留成環元件包含SEQ ID NO:18的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:59的核苷酸序列或由其組成; 4)該第一殘留成環元件包含SEQ ID NO:19的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:60的核苷酸序列或由其組成; 5)該第一殘留成環元件包含SEQ ID NO:20的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:61的核苷酸序列或由其組成; 6)該第一殘留成環元件包含SEQ ID NO:21的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:62的核苷酸序列或由其組成; 7)該第一殘留成環元件包含SEQ ID NO:23的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 8)該第一殘留成環元件包含SEQ ID NO:24的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 9)該第一殘留成環元件包含SEQ ID NO:26的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 10)該第一殘留成環元件包含SEQ ID NO:27的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 11)該第一殘留成環元件包含SEQ ID NO:28的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 12)該第一殘留成環元件包含SEQ ID NO:13的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:67的核苷酸序列或由其組成; 13)該第一殘留成環元件包含SEQ ID NO:13的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:59的核苷酸序列或由其組成; 14)該第一殘留成環元件包含SEQ ID NO:13的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 15)該第一殘留成環元件包含SEQ ID NO:17的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:59的核苷酸序列或由其組成; 16)該第一殘留成環元件包含SEQ ID NO:22的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:63的核苷酸序列或由其組成。
  38. 一種環形RNA前體,其包含從5'至3'方向按以下順序排列的以下元件: a) 3'自剪接內含子片段; b) 第一殘留成環元件; c) 感興趣的核苷酸序列; d) 第二殘留成環元件;和 e) 5'自剪接內含子片段; 其中該環形RNA前體能夠通過其自剪接生成包含該第一殘留成環元件、該感興趣的核苷酸序列和該第二殘留成環元件的環形RNA, 其中該第一殘留成環元件和該第二殘留成環元件總長度為大約5至大約100個核苷酸, 其中該自剪接內含子選自魚腥藻屬pre-tRNA-Leu基因的I類內含子, 其中該3'自剪接內含子片段包含SEQ ID NO:1的核苷酸序列或與SEQ ID NO:1具有至少75%、至少80%、至少85%、至少90%、至少95%、100%相同性的核苷酸序列,或由其組成;並且該5'自剪接內含子片段包含SEQ ID NO:2的核苷酸序列或與SEQ ID NO:2具有至少75%、至少80%、至少85%、至少90%、至少95%、100%相同性的核苷酸序列,或由其組成, 其中該第一殘留成環元件包含與選自SEQ ID NO:13至55的核苷酸序列具有至少50%,至少60%,至少70%,至少80%,至少90%,至少95%或100%序列相同性的核苷酸序列或由其組成,並且該第二殘留成環元件包含與選自SEQ ID NO:56至93的核苷酸序列具有至少50%,至少60%,至少70%,至少80%,至少90%,至少95%或100%序列相同性的核苷酸序列或由其組成。
  39. 如請求項38之環形RNA前體,其中該3'自剪接內含子片段包含SEQ ID NO:1的核苷酸序列或由其組成,並且該5'自剪接內含子片段包含SEQ ID NO:2的核苷酸序列或由其組成。
  40. 如請求項38或39之環形RNA前體,其中 1)該第一殘留成環元件包含SEQ ID NO:15的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:57的核苷酸序列或由其組成; 2)該第一殘留成環元件包含SEQ ID NO:14的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:58的核苷酸序列或由其組成; 3)該第一殘留成環元件包含SEQ ID NO:18的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:59的核苷酸序列或由其組成; 4)該第一殘留成環元件包含SEQ ID NO:19的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:60的核苷酸序列或由其組成; 5)該第一殘留成環元件包含SEQ ID NO:20的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:61的核苷酸序列或由其組成; 6)該第一殘留成環元件包含SEQ ID NO:21的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:62的核苷酸序列或由其組成; 7)該第一殘留成環元件包含SEQ ID NO:23的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 8)該第一殘留成環元件包含SEQ ID NO:24的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 9)該第一殘留成環元件包含SEQ ID NO:26的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 10)該第一殘留成環元件包含SEQ ID NO:27的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 11)該第一殘留成環元件包含SEQ ID NO:28的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 12)該第一殘留成環元件包含SEQ ID NO:13的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:67的核苷酸序列或由其組成; 13)該第一殘留成環元件包含SEQ ID NO:13的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:59的核苷酸序列或由其組成; 14)該第一殘留成環元件包含SEQ ID NO:13的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 15)該第一殘留成環元件包含SEQ ID NO:17的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:59的核苷酸序列或由其組成; 16)該第一殘留成環元件包含SEQ ID NO:22的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:63的核苷酸序列或由其組成。
  41. 如請求項1至40中任一項之環形RNA前體,其中該環形RNA前體進一步包含能夠互補配對形成同源臂雙鏈區的5'同源臂序列和3'同源臂序列。
  42. 如請求項41之環形RNA前體,其中該5'同源臂序列在該3'自剪接內含子片段的上游,並且該3'同源臂序列在該5'自剪接內含子片段的下游。
  43. 如請求項1至42中任一項之環形RNA前體,其中該同源臂的長度為約5至50個核苷酸,優選地,為約40個核苷酸。
  44. 如請求項41至43中任一項之環形RNA前體,其中該兩個同源臂序列可以分別是polyA和polyT,或分別是polyG和polyC。
  45. 如請求項41至44中任一項之環形RNA前體,其中該同源臂序列之一可以具有SEQ ID NO:151至162中的任一核苷酸序列或與SEQ ID NO:151至162中的任一具有至少50%,至少60%,至少70%,至少80%,至少90%,至少95%或至少99%序列相同性的核苷酸序列,而另一個同源臂序列可以具有相應的互補序列。
  46. 如請求項1至45中任一項之環形RNA前體,其中該感興趣的核苷酸序列包含至少一個蛋白編碼序列和與其可操作地連接的轉譯起始元件例如內部核糖體進入位點(IRES)。
  47. 如請求項46之環形RNA前體,其中該轉譯起始元件如IRES位於至少一個蛋白編碼序列的5'端上游。
  48. 如請求項46之環形RNA前體,其中該轉譯起始元件如IRES位於至少一個蛋白編碼序列的3'端下游。
  49. 如請求項46至48中任一項之環形RNA前體,其中該蛋白編碼序列編碼真核、原核或者病毒來源的蛋白質,例如,用於治療或診斷用途的任何蛋白質。
  50. 如請求項46至49中任一項之環形RNA前體,其中該轉譯起始元件是內部核糖體進入位點(IRES),IRES序列可以選自但不限於以下的IRES序列:Taura症候群病毒、吸血獵蝽病毒、泰累爾氏腦脊髓炎病毒(Tyler's encephalomyelitis virus)、猿猴病毒40、紅火蟻病毒1、禾谷縊管蚜病毒(cereal constriction virus)、網狀內皮增生症病毒、福曼脊髓灰質炎病毒1(Forman poliovirus 1)、大豆尺蠖病毒、喀什米爾蜂病毒、人鼻病毒2、琉璃葉蟬病毒-1、人免疫缺陷病毒1型、琉璃葉蟬病毒-1、虱P病毒、C型肝炎病毒、A型肝炎病毒、GB型肝炎病毒、***病毒、人腸道病毒71、馬鼻病毒、茶尺蠖樣病毒(Tea inchworm-like virus)、腦心肌炎病毒(EMCV)、果蠅C病毒、十字花科煙草病毒、蟋蟀麻痹病毒、牛病毒性腹瀉病毒1、黑皇后細胞病毒、蚜蟲致死麻痹病毒、禽腦脊髓炎病毒、急性蜂麻痹病毒、芙蓉枯黃環斑病毒、豬瘟病毒、人類FGF2、人類SFTPA1、人類AMLl/RUNXl、果蠅觸角、人類AQP4、人類AT1R、人類BAG-1、人類BCL2、人類BiP、人類c-IAPl、人類c-myc、人類eIF4G、小鼠NDST4L、人類LEF1、小鼠HIF1α、人類n.myc、小鼠Gtx、人類p27kipl、人類PDGF2/c-sis、人類p53、人類Pim-1、小鼠Rbm3、果蠅reaper、犬Scamper、果蠅Ubx、人類UNR、小鼠UtrA、人類VEGF-A、人類XIAP、果蠅hairless、釀酒酵母TFIID、釀酒酵母YAP1、人類c-src、人類FGF-1、猿猴小核糖核酸病毒、蕪菁縐縮病病毒(turnip crepe disease virus)、eIF4G的適體、柯薩奇病毒B3 (CVB3)或柯薩奇病毒A (CVA1/2),優選地,該IRES是CVB3、BRAV-1_L、PV1_L、CAV2_L、BRAV-1、PV1或CAV2。
  51. 如請求項46至50中任一項之環形RNA前體,其中該IRES包含SEQ ID NO:105至135之一所示的核苷酸序列,或包含與SEQ ID NO:105至135之一具有至少75%,例如,至少80%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%序列相同性的核苷酸序列。
  52. 如請求項1至45中任一項之環形RNA前體,其中該感興趣的核苷酸序列是非蛋白編碼序列,例如,該非蛋白編碼序列選自反義RNA、適配體、嚮導RNA或者天然存在於生物體內的非蛋白編碼RNA。
  53. 如請求項1至52中任一項之環形RNA前體,其中該感興趣的核苷酸序列長度為約10至約20000個核苷酸。
  54. 如請求項1至53中任一項之環形RNA前體,其中該環形RNA前體不包含核苷酸化學修飾。
  55. 一種用於產生環形RNA分子的核酸載體,該載體包含如請求項1至54中任一項之環形RNA前體的編碼序列。
  56. 如請求項55之核酸載體,其進一步包含與該環形RNA前體編碼序列可操作地連接的RNA聚合酶啟動子序列。
  57. 如請求項56之核酸載體,其中該啟動子是T7 RNA聚合酶啟動子、T6病毒RNA聚合酶啟動子、SP6病毒RNA聚合酶啟動子、T3病毒RNA聚合酶啟動子或T4病毒RNA聚合酶啟動子,優選地是T7 RNA聚合酶啟動子。
  58. 一種環形RNA,其由如請求項1至54中任一項之環形RNA前體製備或者由如請求項55至57中任一項之核酸載體製備。
  59. 一種環形RNA,其包含第一殘留成環元件、感興趣的核苷酸序列和第二殘留成環元件,其中該第一殘留成環元件、感興趣的核苷酸序列和第二殘留成環元件由如請求項1至54中任一項所定義。
  60. 一種環形RNA,其包含第一殘留成環元件、感興趣的核苷酸序列和第二殘留成環元件, 其中該第一殘留成環元件和第二殘留成環元件的總長度為約5至約100個核苷酸。
  61. 如請求項60之環形RNA,其中該第一殘留成環元件和第二殘留成環元件通過自剪接內含子參與RNA環化,例如I類內含子,優選地魚腥藻屬pre-tRNA-Leu基因的I類內含子。
  62. 如請求項60或61之環形RNA,其中該第一殘留成環元件和第二殘留成環元件共價連接,例如,該第一殘留成環元件的5'末端和該第二殘留成環元件的3'末端共價連接。
  63. 如請求項60至62中任一項之環形RNA,其中該第一殘留成環元件和第二殘留成環元件使得包含其的環形RNA,相對於對照RNA,例如包含SEQ ID NO:29和SEQ ID NO:64的殘留成環元件的對照環形RNA或者包含相同感興趣的核苷酸序列的對照線性RNA具有降低的免疫原性。
  64. 如請求項60至63中任一項之環形RNA,其中該第一殘留成環元件和第二殘留成環元件使得包含其的環形RNA,相對於對照環形RNA,例如包含SEQ ID NO:29和SEQ ID NO:64 (Ana3.0)的殘留成環元件的對照環形RNA,具有相當的或增加的成環效率。
  65. 如請求項60至64中任一項之環形RNA,其中該第一殘留成環元件和第二殘留成環元件的總長度為約20-約35個核苷酸。
  66. 如請求項60至65中任一項之環形RNA,其中該第一殘留成環元件和該第二殘留成環元件被設置為能夠形成莖環結構。
  67. 如請求項66之環形RNA,其中該莖環結構的環中包含該第一殘留成環元件和該第二殘留成環元件之間的剪接位點。
  68. 如請求項60至67中任一項之環形RNA,其中該第一殘留成環元件包含下式該序列結構:5'-第一環序列-第一配對序列-第一非配對序列-3';且該第二殘留成環元件包含下式該序列結構:5'-第二非配對序列-第二配對序列-第二環序列-3', 其中該第一非配對序列或第二非配對序列可以獨立地存在或不存在, 該第一配對序列和該第二配對序列可互補配對形成該莖環結構的莖,其中第一環序列和第二環序列可形成該莖環結構的環。
  69. 如請求項68之環形RNA,其中該第一環序列包含一個或更多個可以在環化過程中與對應自剪接內含子的P1區域配對形成P10雙鏈區的核苷酸,或由其組成。
  70. 如請求項68或69之環形RNA,其中該第一環序列包含(N)n核苷酸序列或由其組成,其中N表示任何核苷酸(A、G、U或C),n表示1-20之間的整數,例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20。
  71. 如請求項68至70中任一項之環形RNA,其中該第一環序列包含AAAA、AA、UUUU、CAAA或GAAA或由其組成,優選為AAAA。
  72. 如請求項68至71中任一項之環形RNA,其中該第二環序列包含一個或多個可以與對應自剪接內含子的導向序列(internal guide sequence, IGS)配對而在環化過程中形成P1雙鏈區的核苷酸,或由其組成。
  73. 如請求項68至72中任一項之環形RNA,其中該第二環序列包含CUU或CUC,優選為CUU。
  74. 如請求項68至73中任一項之環形RNA,其中該莖環結構的環具有CUUAAAA、CUUUUUU、CUUAA、CUUGAAA、CUUUAAA、CUUCAAA或CUCAAAA序列,優選為CUUAAAA。
  75. 如請求項68至74中任一項之環形RNA,其中該莖環結構中的莖部分包含2至15個或更多個連續鹼基對,優選地,該莖環結構中的莖部分包含5、6或7個連續鹼基對。
  76. 如請求項68至75中任一項之環形RNA,其中該莖環結構中的莖部分包含至多2個鹼基錯配,或者該莖部分只包含1個鹼基錯配,優選地,該莖部分不包含鹼基錯配。
  77. 如請求項68至76中任一項之環形RNA,其中該第一配對序列僅包含G,該第二配對序列僅包含C。
  78. 如請求項68至76中任一項之環形RNA,其中該第一配對序列僅包含C,該第二配對序列僅包含G。
  79. 如請求項68至76中任一項之環形RNA,其中該第一配對序列僅包括A,該第二配對序列僅包括U。
  80. 如請求項68至76中任一項之環形RNA,其中該第一配對序列包含SEQ ID NO:42至55中的任一序列或由其組成,並且,該第二配對序列包含SEQ ID NO:78至93中的任一序列或由其組成。
  81. 如請求項67-80中任一項之環形RNA,其中該莖環結構的經預測的自由能小於大約-1 kal/mol,小於大約-2 kal/mol,小於大約-3 kal/mol,小於大約-4 kal/mol,小於大約-5 kal/mol,小於大約-6 kal/mol,小於大約-7 kal/mol,小於大約-8 kal/mol,小於大約-9 kal/mol,小於大約-10 kal/mol,或更小。
  82. 如請求項60至81中任一項之環形RNA,其中該第一殘留成環元件包含從5'到3'方向的3'外顯子區域和可選的第一間隔子,或由其組成;該第二殘留成環元件包含從3'到5'方向的5'外顯子區域和可選的第二間隔子,或由其組成。
  83. 如請求項82之環形RNA,其中該3'外顯子區域衍生於自剪接內含子的天然3'外顯子,該5'外顯子區域衍生於自剪接內含子的天然5'外顯子,並且3'外顯子區域和5'外顯子區域可以被自剪接內含子或3'自剪接內含子片段和5'自剪接內含子片段的結合所識別和/或剪接。
  84. 如請求項83之環形RNA,其中該3'外顯子區域是與天然3'外顯子或從天然3'外顯子的5'端核苷酸開始的約1至約50個核苷酸的連續片段具有至少50%、至少60%、至少70%、至少80%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的序列, 該5'外顯子區域是與天然5'外顯子或從天然5'外顯子的3'端核苷酸開始的約1至約50個核苷酸的連續片段具有至少50%、至少60%、至少70%、至少80%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列相同性的序列。
  85. 如請求項60至84中任一項之環形RNA,其中該第一殘留成環元件包含與選自SEQ ID NO:13至55的核苷酸序列具有至少50%,至少60%,至少70%,至少80%,至少90%,至少95%或100%序列相同性的核苷酸序列或由其組成。
  86. 如請求項60至85中任一項之環形RNA,其中該第二殘留成環元件包含與選自SEQ ID NO:56至93的核苷酸序列具有至少50%,至少60%,至少70%,至少80%,至少90%,至少95%或100%序列相同性的核苷酸序列或由其組成。
  87. 如請求項60至86中任一項之環形RNA,其中該第一殘留成環元件包含SEQ ID NO:13至55中的任一核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:56至93中的任一核苷酸序列或由其組成。
  88. 如請求項60至87中任一項之環形RNA,其中, 1)該第一殘留成環元件包含SEQ ID NO:15的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:57的核苷酸序列或由其組成; 2)該第一殘留成環元件包含SEQ ID NO:14的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:58的核苷酸序列或由其組成; 3)該第一殘留成環元件包含SEQ ID NO:18的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:59的核苷酸序列或由其組成; 4)該第一殘留成環元件包含SEQ ID NO:19的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:60的核苷酸序列或由其組成; 5)該第一殘留成環元件包含SEQ ID NO:20的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:61的核苷酸序列或由其組成; 6)該第一殘留成環元件包含SEQ ID NO:21的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:62的核苷酸序列或由其組成; 7)該第一殘留成環元件包含SEQ ID NO:23的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 8)該第一殘留成環元件包含SEQ ID NO:24的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 9)該第一殘留成環元件包含SEQ ID NO:26的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 10)該第一殘留成環元件包含SEQ ID NO:27的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 11)該第一殘留成環元件包含SEQ ID NO:28的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 12)該第一殘留成環元件包含SEQ ID NO:13的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:67的核苷酸序列或由其組成; 13)該第一殘留成環元件包含SEQ ID NO:13的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:59的核苷酸序列或由其組成; 14)該第一殘留成環元件包含SEQ ID NO:13的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:56的核苷酸序列或由其組成; 15)該第一殘留成環元件包含SEQ ID NO:17的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:59的核苷酸序列或由其組成; 16)該第一殘留成環元件包含SEQ ID NO:22的核苷酸序列或由其組成,並且該第二殘留成環元件包含SEQ ID NO:63的核苷酸序列或由其組成。
  89. 如請求項60至88中任一項之環形RNA,其中該感興趣的核苷酸序列包含至少一個蛋白編碼序列和與其可操作地連接的轉譯起始元件例如內部核糖體進入位點(IRES)。
  90. 如請求項89之環形RNA,其中該轉譯起始元件如IRES位於至少一個蛋白編碼序列的5'端上游。
  91. 如請求項89之環形RNA,其中該轉譯起始元件如IRES位於至少一個蛋白編碼序列的3'端下游。
  92. 如請求項89至91中任一項之環形RNA,其中該蛋白編碼序列編碼真核、原核或者病毒來源的蛋白質,例如,用於治療或診斷用途的蛋白質。
  93. 如請求項89至92中任一項之環形RNA,其中該轉譯起始元件是內部核糖體進入位點(IRES),IRES序列可以選自但不限於以下的IRES序列:Taura症候群病毒、吸血獵蝽病毒、泰累爾氏腦脊髓炎病毒、猿猴病毒40、紅火蟻病毒1、禾谷縊管蚜病毒、網狀內皮增生症病毒、福曼脊髓灰質炎病毒1、大豆尺蠖病毒、喀什米爾蜂病毒、人鼻病毒2、琉璃葉蟬病毒-1、人免疫缺陷病毒1型、琉璃葉蟬病毒-1、虱P病毒、C型肝炎病毒、A型肝炎病毒、GB型肝炎病毒、***病毒、人腸道病毒71、馬鼻病毒、茶尺蠖樣病毒、腦心肌炎病毒(EMCV)、果蠅C病毒、十字花科煙草病毒、蟋蟀麻痹病毒、牛病毒性腹瀉病毒1、黑皇后細胞病毒、蚜蟲致死麻痹病毒、禽腦脊髓炎病毒、急性蜂麻痹病毒、芙蓉枯黃環斑病毒、豬瘟病毒、人類FGF2、人類SFTPA1、人類AMLl/RUNXl、果蠅觸角、人類AQP4、人類AT1R、人類BAG-1、人類BCL2、人類BiP、人類c-IAPl、人類c-myc、人類eIF4G、小鼠NDST4L、人類LEF1、小鼠HIF1α、人類n.myc、小鼠Gtx、人類p27kipl、人類PDGF2/c-sis、人類p53、人類Pim-1、小鼠Rbm3、果蠅reaper、犬Scamper、果蠅Ubx、人類UNR、小鼠UtrA、人類VEGF-A、人類XIAP、果蠅hairless、釀酒酵母TFIID、釀酒酵母YAP1、人類c-src、人類FGF-1、猿猴小核糖核酸病毒、蕪菁縐縮病病毒、eIF4G的適體、柯薩奇病毒B3 (CVB3)或柯薩奇病毒A (CVA1/2),優選地,該IRES是CVB3、BRAV-1_L、PV1_L、CAV2_L、BRAV-1、PV1或CAV2。
  94. 如請求項89至93中任一項之環形RNA,其中該IRES包含SEQ ID NO:105至135之一所示的核苷酸序列,或包含與SEQ ID NO:105至135之一具有至少75%,例如,至少80%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%序列相同性的核苷酸序列。
  95. 如請求項60至88中任一項之環形RNA,其中該感興趣的核苷酸序列是非蛋白編碼序列,例如,該非蛋白編碼序列選自反義RNA、適配體、嚮導RNA或者天然存在於生物體內的非蛋白編碼RNA。
  96. 如請求項60至95中任一項之環形RNA,其中該感興趣的核苷酸序列長度為約10至約20000個核苷酸。
  97. 如請求項60至96中任一項之環形RNA,其中該環形RNA不包含核苷酸化學修飾。
  98. 如請求項1至54中任一項之環形RNA前體和/或如請求項58至97中任一項之環形RNA作為表現載體的用途。
  99. 一種醫藥組合物,其包含如請求項1至54中任一項之環形RNA前體和/或如請求項55至57中任一項之核酸載體和/或如請求項58至97中任一項之環形RNA,以及藥學上可接受的載體。
  100. 如請求項99之醫藥組合物,其在治療個體疾病中的用途。
  101. 一種製備環形RNA的方法,該方法包括: 1) 提供如請求項1至54中任一項之環形RNA前體或從如請求項55至57中任一項之核酸載體轉錄獲得環形RNA前體; 2) 在存在二價金屬陽離子的情況下,在RNA環化發生的溫度下培育環形RNA前體;和 3) 收穫步驟2)所獲得的環形RNA。
  102. 如請求項101之方法,其中該二價金屬陽離子是Mg 2+和/或Mn 2+
  103. 如請求項101或102之方法,其中該二價金屬陽離子的濃度為大約5mM至大約550mM。
  104. 一種製備環形RNA的方法,該方法包括 a) 提供作為轉錄範本的包含基於自剪接內含子的RNA環化元件的核酸載體;和 b) 在包含二價金屬陽離子和RNA聚合酶的體外轉錄系統中培育該核酸載體第一時間段,期間體外轉錄產生的線性RNA在該RNA環化元件的作用下自我環化以產生環形RNA。
  105. 如請求項104之方法,其中該核酸載體是如請求項55至57中任一項之核酸載體。
  106. 如請求項104或105之方法,其中該體外轉錄系統中的二價金屬陽離子是Mg2 +
  107. 如請求項104至106中任一項之方法,其中該體外轉錄系統進一步包含一價金屬陽離子和/或一價陰離子。
  108. 如請求項107之方法,其中該一價金屬陽離子是Na +或K +
  109. 如請求項107之方法,其中該一價金屬陰離子是Cl -或CH3COO -(OAc)。
  110. 如請求項104至109中任一項之方法,其中該第一時間段內系統中二價金屬陽離子的濃度為大約5mM-大約50mM。
  111. 如請求項107至110中任一項之方法,其中該第一時間段內系統中一價金屬陽離子的濃度為大約5mM至大約100mM,。
  112. 如請求項107至111中任一項之方法,其中該第一時間段內系統中一價陰離子的濃度為大約5mM至大約150mM。
  113. 如請求項107至112中任一項之方法,其中該方法不包括分離和/或純化體外轉錄產生的線性RNA的步驟。
  114. 如請求項107至113中任一項之方法,其中該體外轉錄系統的緩衝液選自Tris鹽酸緩衝液,或HEPES緩衝液,或MES緩衝液,或檸檬酸緩衝液,或磷酸緩衝液,優選地,該體外轉錄系統的緩衝液是HEPES緩衝液。
  115. 如請求項107至114中任一項之方法,其中該體外轉錄系統的pH範圍是約5至約8,優選地,該體外轉錄系統的pH為約7.5。
  116. 如請求項107至115中任一項之方法,其中該RNA聚合酶選自T7 RNA聚合酶、T6病毒RNA聚合酶、SP6病毒RNA聚合酶、T3病毒RNA聚合酶或T4病毒RNA聚合酶,優選地,該RNA聚合酶是T7 RNA聚合酶。
  117. 如請求項107至116中任一項之方法,其中該第一時間段為大約0.5小時至大約24小時,優選地,該第一時間段為3小時。
  118. 如請求項107至117中任一項之方法,其中該第一時間段的反應在大約16°C至大約60°C下進行,優選地,該第一時間段的反應在大約37°C下進行。
  119. 如請求項107至118中任一項之方法,其中在該步驟b)的第一時間段反應後,該方法進一步包含步驟c): 向該體外轉錄系統添加額外量的金屬陽離子並反應第二時間段;或者 改變該系統的緩衝液,添加金屬陽離子並反應第二時間段。
  120. 如請求項119之方法,其中該為第二時間段反應添加的金屬陽離子是二價金屬陽離子,例如Mg 2+或Mn 2+
  121. 如請求項119或120之方法,其中該第二時間段的反應中,該金屬陽離子添加至終濃度為大約5mM至大約550mM。
  122. 如請求項119或121之方法,其中該第二時間段中,該系統的緩衝液改為Tris鹽酸緩衝液,或HEPES緩衝液,或MES緩衝液,或檸檬酸緩衝液,或磷酸緩衝液。
  123. 如請求項119或122之方法,其中該第二時間段反應系統的pH範圍是5至8。
  124. 如請求項119或123之方法,其中該第二時間段為大約5分鐘至大約2小時。
  125. 如請求項119或124之方法,其中該第二時間段的反應在大約25°C至大約75°C下進行。
  126. 如請求項104或125之方法,其中該方法進一步包含回收或純化所產生的環形RNA的步驟。
  127. 一種純化環形RNA的方法,該方法包括: a) 使包含環形RNA和未環化的線性環形RNA前體的混合物與環形RNA特異性探針在允許該環形RNA特異性探針與該環形RNA特異性結合並形成複合物的條件下接觸; b) 使該複合物與該混合物中未與該環形RNA特異性探針結合的一種或多種組分分離;和 c) 從該複合物釋放該環形RNA。
  128. 如請求項127之方法,其中該環形RNA通過環化線性環形RNA前體製備。
  129. 如請求項127或128之方法,其中該環形RNA通過用RNA連接酶連接線性環形RNA前體的兩端而製備,或者,通過線性環形RNA前體中包含的基於自剪接內含子的環化元件的自剪接核酶活性而製備。
  130. 如請求項127至129中任一項之方法,其中該環形RNA特異性探針是單鏈DNA或RNA探針。
  131. 如請求項127至130中任一項之方法,其中該環形RNA特異性探針與該環形RNA的環化連接點兩側區域特異性雜交。
  132. 如請求項127至131中任一項之方法,其中該環形RNA特異性探針長度為約10個核苷酸至約35個核苷酸或更長。
  133. 如請求項127至132中任一項之方法,其中該環形RNA特異性探針固定化於支持物例如固體支持物上,例如,該環形RNA特異性探針在與該環形RNA結合後再固定化於支持物上,或者該環形RNA特異性探針預先固定化於支持物上。
  134. 如請求項127至133中任一項之方法,其中該步驟a)中該條件包括在大約60°C至大約95°C使RNA變性大約2分鐘至大約10分鐘,然後使溫度逐步降低至低於大約40°C使該環形RNA與該環形RNA特異性探針黏著(annealing)。
  135. 如請求項134之方法,其中步驟c)通過將溫度升高至大約60°C至大約95°C(例如大約60°C、大約62°C、大約64°C、大約66°C、大約68°C、大約70°C、大約75°C、大約80°C、大約85°C、大約90°C、大約95°C)來釋放該環形RNA。
  136. 如請求項127至133中任一項之方法,其中該步驟a)中該條件包括濃度範圍在0.25M至2M的高鹽。
  137. 如請求項136之方法,其中該鹽為NaCl或胍鹽。
  138. 如請求項136或137之方法,其中步驟c)通過用洗脫緩衝液洗脫來釋放該環形RNA,例如低鹽緩衝液。
  139. 如請求項138之方法,其中該洗脫緩衝液是Tris-EDTA緩衝液(TE緩衝液)或水。
  140. 如請求項127至139中任一項之方法,其中步驟b)通過用洗滌緩衝液洗滌該複合物來去除該一種或多種組分。
  141. 如請求項127至140中任一項之方法,其中該方法進一步包括以下步驟: i) 使包含環形RNA和未環化的線性環形RNA前體的混合物與線性環形RNA前體特異性探針在允許該線性環形RNA前體特異性探針與該線性環形RNA前體特異性結合並形成複合物的條件下接觸; ii) 從該混合物去除該線性環形RNA前體特異性探針與該線性環形RNA前體形成的複合物,和 iii) 收集步驟ii)所得的包含環形RNA的混合物。
  142. 如請求項141之方法,其中步驟i)至iii)在步驟a)之前進行,例如在步驟a)之前進行多次步驟i)至iii),例如2次、3次、4次或更多次。
  143. 如請求項141之方法,其中步驟i)至iii)與步驟a)至c)同時進行。
  144. 一種純化環形RNA的方法,該方法包括: i) 使包含環形RNA和未環化的線性環形RNA前體的混合物與線性環形RNA前體特異性探針在允許該線性環形RNA前體特異性探針與該線性環形RNA前體特異性結合並形成複合物的條件下接觸;和 ii) 從該混合物去除該線性環形RNA前體特異性探針與該線性環形RNA前體形成的複合物, iii) 收集步驟ii)所得的包含環形RNA的混合物,和 視情況,進行多次該步驟i)至iii),例如2次、3次、4次或更多次。
  145. 如請求項144之方法,其中該線性環形RNA前體特異性探針特異性結合該線性環形RNA前體而基本上不結合該環形RNA。
  146. 如請求項144或145之方法,其中該線性環形RNA前體特異性探針固定化於支持物例如固體支持物上,例如,該線性環形RNA前體特異性探針在與該線性環形RNA前體結合後再固定化於支持物上,或者,該線性環形RNA前體特異性探針預先固定化於支持物上。
  147. 如請求項127至146中任一項之方法,其中該線性環形RNA前體包含從5'至3'方向按以下順序排列的以下元件: a) 3'自剪接內含子片段; b) 第一殘留成環元件; c) 感興趣的核苷酸序列; d) 第二殘留成環元件;和 e) 5'自剪接內含子片段; 其中該線性環形RNA前體能夠通過自剪接去除3'自剪接內含子片段和5'自剪接內含子片段,生成包含該第一殘留成環元件、該感興趣的核苷酸序列和該第二殘留成環元件的環形RNA。
  148. 如請求項147之方法,其中該環形RNA特異性探針至少與該第一殘留成環元件的一部分和該第二殘留成環元件的一部分特異性雜交。
  149. 如請求項147或148之方法,其中該線性前體RNA特異性探針與該線性環形RNA前體中除該第一殘留成環元件、該感興趣的核苷酸序列和該第二殘留成環元件之外的部分雜交。
  150. 如請求項147至149中任一項之方法,其中該線性前體RNA特異性探針與該3'自剪接內含子片段或其部分或其5'側翼序列,或該5'自剪接內含子片段或其部分或其3'側翼序列雜交。
  151. 如請求項147至150中任一項之方法,其中該線性環形RNA前體包含選自SEQ ID NO:96至101的序列或其互補序列,優選SEQ ID NO:100或其互補序列,其在該第一殘留成環元件、該感興趣的核苷酸序列和該第二殘留成環元件之外,該線性前體RNA特異性探針與之特異性雜交。
  152. 如請求項147至151中任一項之方法,其中該探針與所述混合物中RNA分子的摩爾比為大約1:1至大約100000:1。
  153. 一種純化環形RNA的方法,該方法包括: i) 向包含環形RNA和線性RNA的混合物中的線性RNA添加線性RNA特異性標籤; ii) 使包含環形RNA和線性RNA的混合物與特異性結合該標籤的線性RNA探針在允許該探針與該線性RNA特異性結合並形成複合物的條件下接觸;和 iii) 從該混合物去除該線性RNA探針與線性RNA形成的複合物, iv) 收集步驟ii)所得的包含環形RNA的混合物, 視情況,進行多次該步驟ii)至iv),例如2次、3次、4次或更多次。
  154. 如請求項153之方法,其中該標籤包含polyA、polyG、polyU或polyC序列。
  155. 如請求項153或154之方法,其中該標籤的長度為大約10至200nt或該探針的長度為大約10至200nt。
  156. 如請求項153至155中任一項之方法,其中該標籤通過向該混合物添加PolyA/T/C/G聚合酶或者連接酶而添加到線性RNA上。
  157. 如請求項153至156中任一項之方法,其中該線性RNA探針特異性結合所添加的標籤而基本上不結合該環形RNA。
  158. 如請求項153至157中任一項之方法,其中該線性RNA探針是單鏈DNA探針,或是單鏈RNA探針。
  159. 如請求項153至158中任一項之方法,其中該線性RNA探針固定化於支持物例如固體支持物上,例如,該線性RNA探針在與該線性RNA結合後再固定化於支持物上,或者,該線性RNA探針預先固定化於支持物上。
TW111136419A 2021-09-26 2022-09-26 環形rna及其製備方法 TW202330918A (zh)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
CN202111131281 2021-09-26
CN202111131281.0 2021-09-26
CN202111136958.X 2021-09-27
CN202111136958 2021-09-27
CN202111138732.3 2021-09-27
CN202111138732 2021-09-27

Publications (1)

Publication Number Publication Date
TW202330918A true TW202330918A (zh) 2023-08-01

Family

ID=84357865

Family Applications (1)

Application Number Title Priority Date Filing Date
TW111136419A TW202330918A (zh) 2021-09-26 2022-09-26 環形rna及其製備方法

Country Status (7)

Country Link
KR (1) KR20240082384A (zh)
AR (1) AR127142A1 (zh)
AU (1) AU2022350873A1 (zh)
CA (1) CA3233336A1 (zh)
IL (1) IL311745A (zh)
TW (1) TW202330918A (zh)
WO (1) WO2023046153A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024055941A1 (en) * 2022-09-13 2024-03-21 Suzhou Abogen Biosciences Co., Ltd. One-step method for synthesis of circular rna

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010084371A1 (en) * 2009-01-26 2010-07-29 Mitoprod Novel circular interfering rna molecules
CA3160739A1 (en) * 2019-12-04 2021-06-10 Brian Goodman Circular rna compositions and methods

Also Published As

Publication number Publication date
CA3233336A1 (en) 2023-03-30
IL311745A (en) 2024-05-01
AR127142A1 (es) 2023-12-20
WO2023046153A1 (en) 2023-03-30
AU2022350873A1 (en) 2024-04-18
KR20240082384A (ko) 2024-06-10

Similar Documents

Publication Publication Date Title
CN115651927B (zh) 编辑rna的方法和组合物
KR102595683B1 (ko) 변형된 가이드 rna
KR20220004674A (ko) Rna를 편집하기 위한 방법 및 조성물
CA2542053C (en) Dna cloning vector plasmids and methods for their use
CN109154001B (zh) Utr序列
EP2714913A2 (en) Transcription terminator sequences
JP2016521133A (ja) 環状rnaの細胞内翻訳
EP3612630B1 (en) Site-specific dna modification using a donor dna repair template having tandem repeat sequences
CN114981409A (zh) 用于基因组整合的方法和组合物
CN114574483B (zh) 基于翻译起始元件点突变的重组核酸分子及其在制备环状rna中的应用
JP2009523428A (ja) 直鎖状ベクター、宿主細胞およびクローニング法
TW202330918A (zh) 環形rna及其製備方法
CN116239703A (zh) 一种融合蛋白及含有其的高效特异碱基编辑***和应用
WO2023206871A1 (zh) 一种优化的CRISPR/SpCas12f1***、工程化向导RNA及其应用
KR102151064B1 (ko) 매칭된 5' 뉴클레오타이드를 포함하는 가이드 rna를 포함하는 유전자 교정용 조성물 및 이를 이용한 유전자 교정 방법
KR20240055811A (ko) 프라임 편집을 위한 화학적 변형을 갖는 가이드 rna
IL308445A (en) Methods and compositions for genomic integration
JPH08507218A (ja) 一重鎖分子の過剰発現
WO2024055664A1 (zh) 一种优化的向导RNA、CRISPR/AcC2C9基因编辑***及基因编辑方法
WO2023222114A1 (en) Methods of making circular rna
WO2024145248A1 (en) Compositions and methods for generating circular rna
JP2024522821A (ja) ゲノム編集のための組成物及び方法
KR20240095313A (ko) Cas 단백질 또는 이의 변이체의 스크리닝 방법, 및 이를 이용하여 제조된 Cas 단백질 또는 이의 변이체
JP2023073997A (ja) 循環rnaプラットフォーム、その用途、および操作されたdnaからの製造プロセス
CN117836009A (zh) 用于基因组整合的方法和组合物