CN107109400B - 使用具有隐身性的rna的基因表达***以及包含该rna的基因导入、表达载体 - Google Patents

使用具有隐身性的rna的基因表达***以及包含该rna的基因导入、表达载体 Download PDF

Info

Publication number
CN107109400B
CN107109400B CN201680005950.0A CN201680005950A CN107109400B CN 107109400 B CN107109400 B CN 107109400B CN 201680005950 A CN201680005950 A CN 201680005950A CN 107109400 B CN107109400 B CN 107109400B
Authority
CN
China
Prior art keywords
rna
sequence
gene
protein
stealth
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201680005950.0A
Other languages
English (en)
Other versions
CN107109400A (zh
Inventor
中西真人
饭岛実
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tokiwa Bio Inc
National Institute of Advanced Industrial Science and Technology AIST
Original Assignee
Tokiwa Bio Inc
National Institute of Advanced Industrial Science and Technology AIST
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokiwa Bio Inc, National Institute of Advanced Industrial Science and Technology AIST filed Critical Tokiwa Bio Inc
Publication of CN107109400A publication Critical patent/CN107109400A/zh
Application granted granted Critical
Publication of CN107109400B publication Critical patent/CN107109400B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • C07K16/28Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants
    • C07K16/2863Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants against receptors for growth factors, growth regulators
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • C07K16/32Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against translation products of oncogenes
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/46Hybrid immunoglobulins
    • C07K16/468Immunoglobulins having two or more different antigen binding sites, e.g. multifunctional antibodies
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0696Artificially induced pluripotent stem cells, e.g. iPS
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/10Cells modified by introduction of foreign genetic material
    • C12N5/12Fused cells, e.g. hybridomas
    • C12N5/14Plant cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/127RNA-directed RNA polymerase (2.7.7.48), i.e. RNA replicase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07048RNA-directed RNA polymerase (2.7.7.48), i.e. RNA replicase
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/10Immunoglobulins specific features characterized by their source of isolation or production
    • C07K2317/14Specific host cells or culture conditions, e.g. components, pH or temperature
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/20Immunoglobulins specific features characterized by taxonomic origin
    • C07K2317/21Immunoglobulins specific features characterized by taxonomic origin from primates, e.g. man
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/30Immunoglobulins specific features characterized by aspects of specificity or valency
    • C07K2317/31Immunoglobulins specific features characterized by aspects of specificity or valency multispecific
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2506/00Differentiation of animal cells from one lineage to another; Differentiation of pluripotent cells
    • C12N2506/02Differentiation of animal cells from one lineage to another; Differentiation of pluripotent cells from embryonic cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2760/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
    • C12N2760/00011Details
    • C12N2760/18011Paramyxoviridae
    • C12N2760/18811Sendai virus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2760/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
    • C12N2760/00011Details
    • C12N2760/18011Paramyxoviridae
    • C12N2760/18811Sendai virus
    • C12N2760/18841Use of virus, viral particle or viral elements as a vector
    • C12N2760/18843Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/22Vectors comprising a coding region that has been codon optimised for expression in a respective host
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/70Vectors containing special elements for cloning, e.g. topoisomerase, adaptor sites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2820/00Vectors comprising a special origin of replication system
    • C12N2820/60Vectors comprising a special origin of replication system from viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/60Vector systems having a special element relevant for transcription from viruses

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Cell Biology (AREA)
  • Virology (AREA)
  • Botany (AREA)
  • Oncology (AREA)
  • Developmental Biology & Embryology (AREA)
  • Transplantation (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明是由包含下述(1)至(8)的负单链RNA、单链RNA结合蛋白和RNA依赖性RNA合成酶构成的不使先天免疫机制激活的复合体,通过使用隐身型RNA基因表达***,使多个外源基因同时且稳定地表达成为可能。(1)编码任意蛋白质或功能性RNA的目标RNA序列;(2)构成非编码区的源自在动物细胞中表达的mRNA的RNA序列;(3)前述RNA依赖性RNA合成酶所识别的转录起始信号序列;(4)该酶所识别的转录终止信号序列;(5)包含该酶所识别的复制起点的RNA序列;(6)编码该酶的RNA序列,并且是针对导入对象细胞所由来的生物物种进行了密码子优化的RNA序列;(7)编码调节该酶活性的蛋白质的RNA序列,并且是针对导入对象细胞所由来的生物物种进行了密码子优化的RNA序列;(8)编码前述单链RNA结合蛋白的RNA序列,并且是针对导入对象细胞所由来的生物物种进行了密码子优化的RNA序列。

Description

使用具有隐身性的RNA的基因表达***以及包含该RNA的基因 导入、表达载体
技术领域
本发明涉及用于在动物细胞中导入并持续表达外源基因的载体。
背景技术
从外部将任意基因导入至包括人类细胞在内的动物细胞中并在该细胞中持续表达的技术是在使用生物技术的各种行业中所必需的技术。例如,为了大量生产工业用的作为医药品使用的人类单克隆抗体,使免疫球蛋白的H链和L链的基因以同等水平持续表达的技术是必要的。另外,在先天性代谢疾病的基因治疗中,将治疗用基因导入人类的组织细胞并在体内长时间稳定表达的技术是必要的。
1.关于细胞重编程技术
近年来,使用基因将正常组织细胞的性质进行转换而制作有用细胞的细胞重编程技术备受瞩目,然而,在动物细胞中导入基因并持续表达的技术成为即使在细胞重编程中也不可缺少的基础技术。例如,通过将被称为OCT4、SOX2、KLF4、c-MYC或被称为OCT4、SOX2、NANOG、LIN28的4个基因进行组合并导入人类正常成纤维细胞,使该基因持续表达21天,可以制作人类诱导多能干细胞(iPS细胞)(专利文献1、专利文献2、非专利文献1、非专利文献2)。同时,通过在人类的成纤维细胞中导入被称为FOXA3、HNF1A、HNF4A的3个基因并使之持续表达14天,可以制作肝细胞(非专利文献3)。此外,也有报道指出,通过在人类的成纤维细胞中导入被称为ASCL1、BRN2、MYT1L、LMX1A、FOXA2的5个基因并使之持续表达24天,可以制作多巴胺能神经元(dopaminergic neuron)(非专利文献4)。如上所述,在各种细胞重编程中,可以同时向细胞导入多个基因并进行表达并在对于重编程而言必要的期间维持其表达的技术被认为是必要的。
已知在活体内也可以诱导细胞重编程。例如,已有报道指出,在小鼠的心肌梗塞模型中,将GATA4、MEF2C、TBX5这3个基因或者GATA4、HAND2、MEF2C、TBX5这4个基因向梗塞部位投药,浸润的成纤维细胞变化成为心肌细胞(非专利文献5、非专利文献6),因此,期待细胞重编程技术将来成为心肌梗塞或脊髓损伤等再生医疗的基础。
2.细胞重编程效率的提高
另外,假定在体外将细胞重编程用于医疗,期望作为材料的细胞可以在不实施侵袭的情况下从人体采取,并且可以在不被活体外的微生物污染的状态下采取。满足这些条件的细胞几乎仅限于外周血中的单核细胞,期望有适用于这些细胞的基因导入载体。
一般而言,借助由外部导入的基因将动物细胞重编程的效率非常低,然而,将该基因全部搭载于一个载体上,通过向细胞一次性导入使之表达,可提高其效率(专利文献3、专利文献4、非专利文献7、非专利文献8)。
此外,还已知通过增加在细胞重编程中使用的基因的数目,也会提高其效率。例如,已知在将小鼠成纤维细胞转换成诱导多能干细胞(iPS细胞)的技术中,通过向OCT4、SOX2、KLF4、c-MYC这4个基因追加BRG1和BAF155这2个基因,共计使用6个基因,转换效率提高5倍(非专利文献9)。另外,已知在将人类成纤维细胞重编程为运动神经的技术中,通过向被称为LHX3、ASCL1、BRN2、MYT1L的4个基因追加被称为HB9、ISL1、NGN2的3个基因,共计使用7个基因,重编程效率提高100倍(非专利文献10)。
增加细胞重编程中使用的基因的数目,则不得不搭载的基因的大小也增大。以制作iPS细胞的情况为例,KLF4、OCT4、SOX2、c-MYC这4个基因合计为4,774个碱基对,然而,如果追加上述BRG1(5,040个碱基对)和BAF155(3,318个碱基对)这2个基因,则合计为13,132个碱基对(非专利文献9)。此外,如果向KLF4、OCT4、SOX2、c-MYC这4个基因追加编码染色质重构因子的CHD1基因(5,133个碱基对),则合计为9,907个碱基对,染色质重构因子在胚胎干细胞中特异性表达,预测将加速iPS细胞的初始化;如果追加编码DNA去甲基化酶的TET1基因(6,429个碱基对),则合计为11,203个碱基对。此外,在将人类成纤维细胞重编程为运动神经的技术中使用的LHX3、ASCL1、BRN2、MYT1L、HB9、ISL1、NGN2这7个基因合计为9,887个碱基对(非专利文献10)。
如上所述,为了提高细胞重编程的效率,期望使用至少6个以上的基因,并且期望可以一次性搭载所有这些基因的载体。另外,导入的外源基因的大小共计为5,000个碱基以上,因而期望即使是8,000个碱基以上也能进行表达的载体。
另外,在本说明书中,载体是指以包含外源基因的核酸作为成分,可以将该核酸导入动物细胞并表达该基因的基因重组病毒或非病毒性的核酸·高分子物质复合体。
另外,已知在使外源基因表达而进行动物细胞的重编程的情况下,该基因的表达水平对通过重编程制作的细胞的性质产生很大影响。例如,已知在使被称为OCT4、SOX2、KLF4、c-MYC的4个基因在小鼠成纤维细胞中表达的情况下,在该基因表达弱的情况下产生iPS细胞,与之相对,在该基因表达强的情况下产生与iPS细胞性质完全不同的细胞(非专利文献11)。因此,在使由外部导入的基因表达而对包括人类细胞在内的动物细胞进行重编程的技术中,能够根据目的将该基因的表达设定为最适水平的载体是必要的。
3.重编程用基因的去除
进一步地,为了使通过由外部导入基因进行细胞重编程而制作的细胞完全发挥其功能,将该重编程用基因从该细胞完全去除是必要的。另外,在将制作的人类细胞作为再生医疗的材料使用时,为了确保安全性,将该基因从该细胞完全去除也是必要的。例如,在使用OCT4、SOX2、KLF4、c-MYC这4个基因制作的诱导多能干细胞(iPS细胞)中,因为这4个基因维持表达时不能发挥多能性,所以,相比至少完全抑制其表达,更期望的是需要从该细胞完全去除(专利文献1、专利文献2、专利文献3、非专利文献1、非专利文献2、非专利文献7)。另外,已知制作iPS细胞时使用的c-MYC基因若残留在该iPS细胞中,则使该iPS细胞再分化而制作的组织细胞会以高频率发生癌变(非专利文献12)。因此,为了确保安全性,需要将该c-MYC基因从iPS细胞完全去除。
如上所述,在细胞重编程中必要的基因表达技术必须兼顾下述矛盾的性质:一方面为了实现重编程而期望最适水平的持续的基因表达;另一方面要求一旦重编程完成可简单且完全地去除。
4.避免先天免疫机制激活的重要性
现在,就用于动物细胞的几乎所有的基因导入、表达载体而言,以感染动物的病毒或使用大肠杆菌等微生物制造的质粒DNA作为材料使用。但是,为了击退由外部侵入的病原体,动物细胞具备先天免疫机制(非专利文献13),从细胞外导入的源自病毒或微生物的核酸作为异物被识别,激活先天免疫机制。先天免疫机制的激活程度超过一定水平,则通过细胞凋亡诱导细胞死亡,导致重编程效率降低。另外,通过先天免疫机制的激活诱导干扰素或炎性细胞因子的表达时,在活体内引起炎症。为了防止此类不期望的反应,在进行细胞重编程的基因导入、表达技术中,要求避免先天免疫机制的激活。特别是对于在前述1.所述的包括活体内的细胞重编程在内的再生医疗的应用中,该性质很重要。
5.理想的用于细胞重编程的基因导入、表达***
通过以上的探讨,为了将使用基因对包括人类细胞在内的动物细胞进行重编程的技术进行进一步改良而应用于产业中,如上述1.~4.所探讨的,至少满足以下5个条件的基因导入、表达技术是必要的。
(1)可将外源基因有效导入包括人类外周血细胞在内的动物细胞。
(2)可在必要的任意期间持续表达该基因。
(3)在该基因表达时,可避免细胞所具有的先天免疫机制。
(4)即使导入的外源基因长度合计为5,000个碱基以上、期望为8,000个碱基以上,仍可表达。
(5)可同时表达至少6个、期望为8个以上的该基因。
而且,进一步强烈期望还实现以下方面。
(6)可调节该基因的表达水平。特别是,在导入基因为多个的情况下,优选可分别调节各基因的表达水平。
另外,尤其在将基因导入细胞应用于移植技术的情况下,以下方面也成为极重要的要点。
(7)在该基因变为不需要时,可通过简单的方法去除。
6.向动物细胞导入多个基因的技术
这是向包括人类细胞在内的动物细胞由外部导入多个基因并在该细胞中持续表达的技术,作为已报道的可使用于细胞重编程的技术,已知有以下3种:
(1)将该基因***存在于细胞核内的基因组DNA中的方法;
(2)将该基因搭载于在细胞核内可与基因组DNA独立且稳定地存在的DNA中的方法;
(3)将该基因搭载于存在于细胞质的RNA中的方法。
6-1.将多个基因***细胞核内的基因组DNA中的方法
就使用慢病毒载体(非专利文献8、非专利文献14)、转座子(非专利文献15、非专利文献16)、非同源重组、同源重组等将外源基因***存在于细胞核内的基因组DNA中的方法而言,该基因可与基因组DNA同等且稳定地存在。但是,一旦被***基因组DNA,为了仅将该基因从基因组DNA选择性地去除,除了需要将序列特异性重组酶导入细胞等繁杂的操作之外,并不能在所有细胞中确实地去除(非专利文献15)。另外,向基因组DNA***外源基因需要宿主细胞的DNA复制,因此,向血液细胞等增殖能力低的细胞导入基因的效率极低。进一步地,已知通过将外源基因随机***基因组DNA引起宿主的基因破坏或异常激活的被称为“***突变”的现象,因此,为了进行医疗应用,尚存在安全性的顾虑(非专利文献17)。
6-2.在细胞核内将多个基因搭载于与基因组DNA独立的DNA中的方法
作为在细胞核内将外源基因搭载于可与基因组DNA独立且稳定存在的DNA中的方法,已知使用搭载Epstein-Barr病毒的基因组的复制起点的环状DNA的方法(非专利文献18);以及使用包含直链巨大DNA的人工染色体的方法(非专利文献19)。这些DNA分子在人类细胞的细胞核内持续且稳定地维持复制,然而,该机制依赖于宿主细胞基因组DNA进行复制的机制。因此,不能仅特异性地抑制搭载外源基因的DNA的复制,而且尚未报道将该DNA从细胞主动去除的技术。另外,为了将该DNA分子导入细胞核内,宿主细胞的***是必要的,因此,向血液细胞等增殖能力低的细胞导入基因的效率极低。另外,已知细胞核内的环状DNA高频率地并入该细胞的基因组DNA,因此,不能排除***突变的危险性(非专利文献20)。
6-3.由同一载体DNA表达多个基因的技术
另外,在如上述6-1.和6-2.所记载的将DNA作为基因表达的平台使用的情况下,由同一载体DNA表达多个基因的技术是必要的。作为该技术,已知有以下3种:1)将多个独立的基因简单地连接后进行表达的方法;2)使用被称为内部核糖体进入位点(IRES)的RNA结构,由一条信使RNA(mRNA)表达多个蛋白质的方法;3)将多个蛋白质通过2A肽连接而表达融合蛋白的方法。
就将多个独立的基因进行连接的方法而言,已知由于基因间的相互干扰而使得基因表达受到强烈抑制(非专利文献21)。为了防止上述情况,需要在基因之间***被称为绝缘子的结构,在使载体DNA的大小变大的同时,结构也变得复杂。就该方法而言,报道了将4个基因搭载于1个DNA分子中使之表达的实例(非专利文献22),然而,尚未报道将5个以上基因同时表达的实例。
就使用IRES序列由一条信使RNA(mRNA)表达多个蛋白质的方法而言,置于IRES序列下游的蛋白质的翻译效率比置于IRES序列上游的蛋白质的翻译效率低,有时为10%以下(非专利文献23)。另外,因为IRES序列的大小较大且结构复杂,所以,使用IRES序列的方法主要用于同时表达2个蛋白质。
2A肽是在正单链RNA病毒中发现的由18至22个氨基酸残基构成的结构,多个蛋白质通过2A肽连接而成的融合蛋白在合成时自动断开,分解为原来的多个蛋白质。就该技术而言,在断开后产生的各蛋白质的N末端残留有1个脯氨酸,C末端残留有17至21个氨基酸残基,这些多余的氨基酸残基具有对该蛋白质的功能产生影响的可能性(非专利文献24)。另外,在2A肽部位的断开效率受到融合蛋白结构的巨大影响,因此,为了高效制作多个蛋白质,付出劳动来试错是必要的(非专利文献25)。就通过2A肽连接多个蛋白质的方法而言,报道了同时表达4个蛋白质的实例(非专利文献8)以及同时表达5个蛋白质的实例(非专利文献16)。另外,也报道了将IRES序列与2A肽组合而表达4个蛋白质的实例(非专利文献14)。
6-4.将多个基因搭载于存在于细胞质的RNA中的方法
如前述6-1.~6-3.所记载的,就将DNA作为基因表达平台使用的目前的基因导入、表达技术而言,报道了使用4个至5个基因的细胞重编程。但是,限于将DNA作为基因表达的平台使用,不能容易地同时搭载6个以上基因,并且不能容易地通过简单的方法实现基因的去除,也尚未报道可全部满足前述5.所示的理想的重编程中所要求的5个条件的技术。
另一方面,作为将RNA作为平台将多个基因由外部导入包括人类细胞在内的动物细胞并表达并将细胞进行重编程的技术,报道了使用正链RNA的技术(非专利文献26、非专利文献27);以及使用负链RNA的技术(专利文献3、专利文献4、专利文献5、专利文献6、非专利文献7、非专利文献28、非专利文献29、非专利文献30)。
6-4-1.使用正链RNA的方法
作为使用可在细胞质中稳定存在的正链RNA对细胞进行重编程的技术,已报道了使用源自委内瑞拉马脑炎病毒(VEEV)的正单链基因组RNA的技术(非专利文献26)。就该技术而言,通过将VEEV的基因组RNA 3ˊ侧的结构基因替换成编码由2A肽连接的蛋白质的基因,实现了4个蛋白质的表达。该***引起非常强的干扰素表达的诱导,必须与抗干扰素物质(源自痘苗病毒的B18R蛋白质)进行组合(非专利文献26)。另外,基因导入的效率依赖于进行组合的基因导入试剂,重编程的可能性被限定于成纤维细胞等贴壁细胞。搭载外源基因的RNA是不稳定的,因此,B18R蛋白质被从培养基去除而消失。
作为使用正链RNA对细胞进行重编程的技术,也报道了使用化学合成的信使RNA(mRNA)的技术(非专利文献27)。因为该现有技术是将各自分别搭载最多5个外源基因的多个mRNA混合,然后使用基因导入试剂导入细胞,所以基因表达是瞬时的,因此,每天向该细胞重新进行导入是必要的。另外,基因导入的可能性限于成纤维细胞等贴壁细胞。在该技术中还强烈激活先天免疫机制,因此,与抗干扰素物质(源自痘苗病毒的B18R蛋白质)进行组合是必要的(非专利文献27)。
6-4-2.使用负链RNA的方法
作为使用负链RNA对细胞进行重编程的技术,作为现有技术已报道了在作为一种副粘病毒的仙台病毒野生株中将分别搭载外源基因的载体混合使用的方法(专利文献5、非专利文献28、非专利文献29);以及同时搭载3个基因的方法(专利文献6、非专利文献30)。就使用这些负链RNA的基因表达***而言,因为缺失F基因,野生型病毒的自主复制能力减弱,外源基因分别作为单独的基因表达盒被搭载。没有记载关于先天免疫机制的激活,然而,已知作为材料的仙台病毒具有强烈的干扰素诱导能力(非专利文献31),因此,预测该载体也具有基于此的先天免疫机制激活能力。另外,报道了在野生型病毒的基因组中导入温度敏感型突变,使培养温度升高可以去除载体(专利文献6、非专利文献29、非专利文献30)。已报道了使用基于野生型仙台病毒的载体可表达的基因的大小为3078个碱基对(大肠杆菌β-半乳糖苷酶)(非专利文献32)至3450个碱基对(KLF4、OCT4、SOX2这3个基因的合计)(专利文献6、非专利文献30)。
另外,作为使用负链RNA对细胞进行重编程的技术,已报道了基于持续感染突变仙台病毒的技术(专利文献3、专利文献4、非专利文献7)。在该技术中,在成为载体材料的病毒基因组中,已确认与长期持续性相关的多个点突变,显示这些突变与避免先天免疫机制激活(干扰素表达的降低)相关。另外,通过从病毒基因组删除3个基因后搭载新基因,可使4个外源基因同时表达。进一步地,报道了通过用小干扰RNA(short interfering RNA,siRNA)抑制编码RNA依赖性RNA合成酶的L基因的表达,主动将载体从细胞去除。就基于持续感染突变仙台病毒的载体而言,报道了可表达的基因的大小为4774个碱基对(KLF4、OCT4、SOX2、c-MYC这4个基因的合计)(专利文献3、专利文献4、非专利文献7)。
7.多个基因导入技术的今后的课题
就前述6-4.所述的将RNA作为基因表达平台使用的目前的基因导入、表达技术而言,报道了使用4个至5个基因的细胞重编程。其中,前述6-4-2.所述的缺陷持续表达型仙台病毒载体具有最优异的性质,然而,已报道的可搭载的基因的数目为最多4个。另外,就将RNA病毒作为材料的技术而言,很难使基因表达水平发生变化。
如前述6.所述,由外部将多个基因导入包括人类细胞在内的动物细胞并在该细胞中持续表达的技术的目标是针对使用基因将正常组织细胞的性质进行转换并制作有用细胞的细胞重编程进行优化,进行各种改良。但是,完全满足如前述5.所示的理想的重编程所要求的5个条件的技术迄今未见报道。
现有技术文献
专利文献
专利文献1:WO 2007/069666
专利文献2:WO 2008/118820
专利文献3:WO 2010/134526
专利文献4:WO 2012/063817
专利文献5:WO 2010/008054
专利文献6:WO 2012/029770
专利文献7:美国专利第8,326,547号说明书
专利文献8:美国专利第8,401,798号说明书
专利文献9:美国专利第7,561,973号说明书
非专利文献
非专利文献1:Takahashi等,Cell,131,861-872,2007
非专利文献2:Yu等,Science,318,1917-1920,2007
非专利文献3:Huang等,Cell Stem Cell,14,370-384,2014
非专利文献4:Son等,Cell Stem Cell,9,205-218,2011
非专利文献5:Qian等,Nature,485,593-598,2012
非专利文献6:Song等,Nature,485,599-604,2012
非专利文献7:Nishimura等,J.Biol.Chem.,286,4760-4771,2011
非专利文献8:Carey等,Proc.Natl.Acad.Sci.USA,106,157-162,2009
非专利文献9:Singhal等,Cell,141,943-955,2010
非专利文献10:Son等,Cell Stem Cell,9,205-218,2011
非专利文献11:Tonge等,Nature,516,192-197,2014
非专利文献12:Miura等,Nature Biotechnology,27,743-745,2009
非专利文献13:Randall,J.Gen Virol.,89,1-47,2008
非专利文献14:Sommer等,Stem Cells,28,64-74,2010
非专利文献15:Kaji等,Nature,458,771-775,2009
非专利文献16:Grabundzjia等,Nuc.Acids Res.,41,1829-1847,2013
非专利文献17:Hacein-Bey-Abina等,Science,302,415-419,2003
非专利文献18:Wu等,Proc.Natl.Acad.Sci.USA,111,10678-10683,2014
非专利文献19:Hiratsuka等,Plos One,6,e25961,2011
非专利文献20:Hurley等,J.Virol.,65,1245-1254,1991
非专利文献21:Yahata等,J.Mol.Biol.,374,580-590,2007
非专利文献22:Nishiumi等,Cell Struct.Funct.,34,47-59,2009
非专利文献23:Balvay等,Biochi.Biophys.Acta,1789,542-557,2009
非专利文献24:Felipe等,Trends Biotech.,24,68-75,2006
非专利文献25:Lengler等,Anal.Biochem.,343,116-124,2005
非专利文献26:Yoshioka等,Cell Stem Cell,13,246-254,2013
非专利文献27:Warren等,Cell Stem Cell,7,1-13,2010
非专利文献28:Fusaki等,Proc.Jpn.Acad.Ser.B85,348-362,2009
非专利文献29:Ban等,Proc.Natl.Acad.Sci.USA,108,14234-14239,2011
非专利文献30:Fujie等,Plos One,9,e113052,2014
非专利文献31:Hua等,J.Leukocyte Biol.,60,125-128,1996
非专利文献32:Sakai等,FEBS Lett.,456,221-226,1999
非专利文献33:Kondo等,J.Biol.Chem.,268,21924-21930,1993
非专利文献34:Ward等,Proc.Natl.Acad.Sci.USA,108,331-336,2011
非专利文献35:Saito等,Nature,454,523-527,2008
非专利文献36:Vabret等,Plos One,7,e33502,2012
非专利文献37:Rehwinkel等,Cell,140,397-408,2010
非专利文献38:Shioda等,Nuc.Acids Res.,14,1545-1563,1986
非专利文献39:Vidal等,J.Virol.,64,239-246,1990
非专利文献40:Irie等,J.Virol.,86,7136-7145,2012
非专利文献41:Kato等,EMBO J.,16,578-587,1997
非专利文献42:Tapparel等,J.Virol.,72,3117-3128,1998
非专利文献43:Park等,Proc.Natl.Acad.Sci.USA,88,5537-5541,1991
非专利文献44:Harty等,J.Virol.,69,5128-5131,1995
非专利文献45:Willenbrink等,J.Virol.,68,8413-8417,1994
非专利文献46:Sharp等,Nuc.Acids Res.,15,1281-1295,1987
非专利文献47:Guigo等,J.Mol.Biol.,253,51-60,1995
非专利文献48:Vabret等,J.Virol.,88,4161-4172,2014
非专利文献49:Raab等,Syst.Synth.Biol.,4,215-225,2010
非专利文献50:Alan,H.,Gene,56,125-135,1987
非专利文献51:Kuo等,J.Virol.,62,4439-4444,1988
非专利文献52:Sengupta等,J.Biol.Chem.,264,14246-14255,1989
非专利文献53:Melton等,Nuc.Acids Res.,12,7035-7056,1984
非专利文献54:Hampel,A.等,Biochemistry,28,4929-4933,1989
非专利文献55:Tuschl等,Genes Dev.,13,3191-3197,1999
非专利文献56:Chang等,J.Bacteriol.,134,1141-1156,1978
非专利文献57:Garcin等,EMBO J.,14,6087-6094,1995
非专利文献58:Gotoh等,Virology,171,434-443,1989
非专利文献59:Lopez等,Mol.Microbiol.,33,188-199,1999
非专利文献60:Kozak,Cell,44,283-292,1986
非专利文献61:Kozak,Mol.Cell Biol.,7,3438-3445,1987
非专利文献62:Vara等,Gene,33,197-206,1985
非专利文献63:Nakajima等,Biosci.Biotechnol.Biochem.,68,565-570,2004
非专利文献64:Ai等,Biochemistry,46,5904-5910,2007
非专利文献65:Drocourt等,Nuc.Acids Res.,18,4009,1990
非专利文献66:Kogure等,Nat.Biotechnol.,24,577-581,2006
非专利文献67:Gritz等,Gene,25,179-188,1983
非专利文献68:Studier等,J.Mol.Biol.,189,113-130,1986
非专利文献69:Nawa等,Biol.Pharm.Bull,21,893-898,1998
非专利文献70:Karasawa等,Biochem.J.,381,307-312,2004
非专利文献71:Yoneyama等,Nature Immunol.,5,730-737,2004
非专利文献72:Sakaguchi等,Microbiol.Immunol.,55,760-767,2011
非专利文献73:Jia等,J.Immunol.,183,4241-4248,2009
非专利文献74:Studier等,J.Mol.Biol.,189,113-130,1986
非专利文献75:Akagi等,Proc.Natl.Acad.Sci.USA,100,13567-13572,2003
非专利文献76:Hatsuzawa等,J.Biol.Chem.,265,22075-22078,1990
非专利文献77:Boshart等,Cell,41,521-530,1985
非专利文献78:Taira等,Arch.Virol.,140,187-194,1995
非专利文献79:Takebe等,Mol.Cell Biol.,8,466-472,1988
非专利文献80:Recillas-Targa等,Proc.Natl.Acad.Sci.USA,99,6883-6888,2002
非专利文献81:Fujita等,Cell,41,489-496,1985
非专利文献82:Yi和Lemon,J.Virol.,77,3557-3568,2003
非专利文献83:You和Rice,J.Virol.,82,184-195,2008
非专利文献84:Chromikova等,Cytotechnology,67,343-356,2015
非专利文献85:Brandlein和Vollmers,Histol.Histopathol.,19,897-905,2004
非专利文献86:Okada等,Microbiol.Immunol.,49,447-459,2005
非专利文献87:Lewis等,Nature Biotech.,32,191-198,2014
非专利文献88:Wurm.,Nature Biotech.,22,1393-1398,2004
发明内容
发明所要解决的技术问题
如上所述,本发明所要解决的技术问题之一是开发为了使用基因将包括人类细胞在内的动物细胞进行重编程而所期望的基因导入、表达技术以及用于该技术的载体。进一步地,本发明提供可搭载不限于重编程基因的全长为5,000个碱基以上或至少6个以上的外源基因并且在动物细胞中既不激活先天免疫机制又可持续表达的载体。同时,本发明还提供用于在载体上搭载6个以上外源基因的有效方法。
并且,本发明提供特别是对于重编程技术而言所期望的满足以下(1)~(5)的条件、优选进一步满足包括(6)、(7)的条件的基因导入、表达技术。
(1)可将外源基因有效导入包括人类外周血细胞在内的动物细胞。
(2)可在必要的任意期间持续表达该基因。
(3)在该基因表达时,可避免细胞所具有的先天免疫机制。
(4)即使导入的外源基因长度合计为5,000个碱基以上、期望为8,000个碱基以上,仍可表达。
(5)可同时表达至少6个、期望为8个以上的该基因。
(6)可调节该基因的表达水平。特别是,在导入基因为多个的情况下,可分别调节。
另外,特别是在应用于移植技术的情况下,以下方面也成为重要的要点。
(7)在该基因变为不需要时,可通过简单的方法去除基因表达***。解决技术问题的技术手段
如背景技术的6-1.~6-3.所述,在将DNA作为基因表达的平台使用的情况下,具备作为本发明所要解决的技术问题所显示的理想的重编程所要求的全部5个条件、更优选全部7个条件,这在原理上是极为困难的。另一方面,如6-4.所述,在将RNA作为基因表达的平台使用的情况下,在将可搭载于同一载体上的基因数的上限提高至6个以上且将全基因长度提高至5,000个碱基以上的同时,如何避免源自病毒的RNA引起细胞内的先天免疫机制激活的问题,成为最大的课题。
在此,本发明将源自不激活先天免疫机制的动物细胞的mRNA作为材料使用,首先设计将这些RNA与RNA依赖性RNA合成酶识别的转录起始信号、转录终止信号、复制起点组合的负单链RNA。接着,将编码RNA依赖性RNA合成酶等转录和复制必需的4个蛋白质的基因进行结构优化,使之不被先天免疫机制作为异物识别,然后搭载于该负单链RNA上。进一步地,开发使用5种限制性酶将10个基因按照设计进行结合的新方法,将与这10个基因互补的cRNA搭载于上述负单链RNA上。
通过将经上述方法完成的负单链RNA作为基因表达的平台使用,成功搭载至少10个外源基因(合计大小为至少13,500个碱基),并且既不激活先天免疫机制又可长时间持续表达。进一步地,通过改变基因表达所必需的N蛋白或C蛋白的表达效率,可以使搭载的基因的表达在最大80倍的范围内进行调节。如上所述,通过尽可能排除具有源自病毒的结构的RNA,成功地制作了大幅超过使用RNA病毒的基因组的现有基因表达***的能力界限的新的基因表达***。
进一步地,在具有本发明所制作的搭载外源基因的负单链RNA的细胞中,按照专利文献3和非专利文献33、非专利文献7所记载的方法,通过表达副粘病毒的外膜蛋白和基质蛋白,将该RNA分子进行包封,制作了具有导入其它细胞的活性的颗粒。在包括人类血液细胞在内的各种动物细胞中,该颗粒在将先天免疫机制的激活抑制为低的同时,可以持续表达搭载于该RNA分子上的10个基因。进一步地,通过将与搭载于该RNA分子上的经结构优化的RNA依赖性RNA合成酶的基因互补的siRNA导入该细胞,可将搭载外源基因的RNA分子去除。通过上述方法,确认除了可解决“发明所要解决的技术问题”中所示的(1)~(5)的5个技术问题之外,解决了还包含前述优选情况的技术问题(6)、(7)在内的全部7个技术问题,从而完成了本发明。
本发明中使用的RNA分子缺失用于先天免疫机制作为“对于病原微生物而言的特征性分子模式(病原体相关分子模式,pathogen-associated molecular pattern,PAMP)”进行识别所必需的特异性结构,因此,显示难以被先天免疫机制捕捉的“隐身(stealth)性”。因此,以后将该RNA分子称为“具有隐身性的RNA”,将使用该RNA作为材料的基因表达***称为“隐身型RNA基因表达***”,将包封该基因表达***并具有将该基因表达***导入动物细胞的活性的构建体称为“隐身型RNA载体”。
也就是说,本发明如下。
[1]一种隐身型RNA基因表达***,所述隐身型RNA基因表达***是由包含下述(1)~(8)的RNA序列的负单链RNA(A)、单链RNA结合蛋白(B)和RNA依赖性RNA合成酶(C)构成的不使先天免疫机制激活的复合体:
(1)编码任意蛋白质或功能性RNA的目标RNA序列;
(2)构成非编码区的源自在动物细胞中表达的mRNA的RNA序列;
(3)前述RNA依赖性RNA合成酶所识别的转录起始信号序列;
(4)该酶所识别的转录终止信号序列;
(5)包含该酶所识别的复制起点的RNA序列;
(6)编码该酶的RNA序列,并且是针对导入对象细胞所由来的生物物种进行了密码子优化的RNA序列;
(7)编码调节该酶活性的蛋白质的RNA序列,并且是针对导入对象细胞所由来的生物物种进行了密码子优化的RNA序列;
(8)编码前述单链RNA结合蛋白的RNA序列,并且是针对导入对象细胞所由来的生物物种进行了密码子优化的RNA序列。
此处,典型的导入对象细胞是人类细胞,因此其优选情况可记载如下。
[1’]一种隐身型RNA基因表达***,所述隐身型RNA基因表达***是由包含下述(1)~(8)的RNA序列的负单链RNA(A)、单链RNA结合蛋白(B)和RNA依赖性RNA合成酶(C)构成的不使先天免疫机制激活的复合体:
(1)编码任意蛋白质或功能性RNA的目标RNA序列;
(2)构成非编码区的源自人类mRNA的RNA序列;
(3)前述RNA依赖性RNA合成酶所识别的转录起始信号序列;
(4)该酶所识别的转录终止信号序列;
(5)包含该酶所识别的复制起点的RNA序列;
(6)编码该酶的RNA序列,并且是针对人类细胞进行了密码子优化的RNA序列;
(7)编码调节该酶活性的蛋白质的RNA序列,并且是针对人类细胞进行了密码子优化的RNA序列;
(8)编码前述单链RNA结合蛋白的RNA序列,并且是针对人类细胞进行了密码子优化的RNA序列。
[2]如前述[1]所记载的隐身型RNA基因表达***,其中,前述(1)的目标RNA序列是包含至少6个基因或全长为5000个碱基以上长度的RNA序列。
此处,目标RNA序列是可包含7~10个基因且全长为5,000~15,000个碱基长度的RNA序列。
[3]如前述[1]或[2]所记载的隐身型RNA基因表达***,其中,前述(2)的RNA序列是人类基因的mRNA序列中的5~49个碱基长度的RNA序列。
此处,作为前述人类基因的mRNA序列,优选为人类管家基因的mRNA序列,更优选为人类管家基因的mRNA序列中的非编码区序列,例如可使用表1所记载的RNA序列或其中的连续的5~49个碱基长度的部分序列,或者将其多个连接使用。
[4]如前述[1]~[3]中任一项所记载的隐身型RNA基因表达***,其特征在于,由相同或不同序列构成的前述(2)的RNA序列被配置为邻接于前述(1)的目标RNA序列中所包含的各基因序列的3ˊ末端侧和/或5ˊ末端侧。
[5]如前述[1]~[4]中任一项所记载的隐身型RNA基因表达***,其特征在于,
前述(6)的RNA序列所编码的RNA依赖性RNA合成酶是源自属于副粘病毒科的RNA病毒的L蛋白和P蛋白;
前述(7)的RNA序列所编码的调节该酶活性的蛋白质是源自与该RNA病毒相同的病毒的C蛋白;
前述(8)的RNA序列所编码的单链RNA结合蛋白是源自与该RNA病毒相同的病毒的NP蛋白;并且
前述(3)~(5)的RNA序列中的任一者都是包含源自与该RNA病毒相同的病毒的基因组序列中的转录起始信号、转录终止信号和复制起点的RNA序列。
[6]如前述[5]所记载的隐身型RNA基因表达***,其中,编码前述L蛋白、P蛋白、C蛋白和NP蛋白的RNA序列针对人类细胞进行了优化,并且其GC含量被调节在50~60%的范围内。
[7]如前述[6]所记载的隐身型RNA基因表达***,其中,前述属于副粘病毒科的RNA病毒是选自于仙台病毒、人副流感病毒和新城疫病毒中的任一者的RNA病毒。
[8]如前述[1]~[7]中任一项所记载的隐身型RNA基因表达***,其特征在于,前述(3)的转录起始信号序列是选自于3ˊ-UCCCACUUUC-5ˊ(序列号1)、3ˊ-UCCCUAUUUC-5ˊ(序列号2)、3ˊ-UCCCACUUAC-5ˊ(序列号3)、3ˊ-UCCUAAUUUC-5ˊ(序列号7)和3ˊ-UGCCCAUCUUC-5ˊ(序列号9)中的任一者所示的RNA序列的RNA序列;前述(4)的转录终止信号序列是选自于3ˊ-AAUUCUUUUU-5ˊ(序列号4)、3ˊ-CAUUCUUUUU-5ˊ(序列号5)、3ˊ-UAUUCUUUUU-5ˊ(序列号6)和3ˊ-UUAUUCUUUUU-5ˊ(序列号8)中的任一者所示的RNA序列的RNA序列。
[9]如前述[4]~[8]中任一项所记载的隐身型RNA基因表达***,其特征在于,前述(2)的RNA序列被配置为邻接于前述(1)的目标RNA序列中所包含的各基因序列的3ˊ末端侧,由相同或不同序列构成的前述(3)的转录起始信号序列被配置为邻接于前述(2)的RNA序列的更3ˊ末端侧;并且,前述(4)的转录终止信号序列被配置为邻接于被配置为与前述(1)的目标RNA序列中所包含的各基因序列的5ˊ末端侧相邻接的RNA序列的更5ˊ末端侧。
[10]如前述[7]~[9]中任一项所记载的隐身型RNA基因表达***,其特征在于,前述(5)的包含复制起点的RNA序列包含下述序列:
(a)3ˊ-UGGUCUGUUCUC-5ˊ(序列号11)或3ˊ-UGGUUUGUUCUC-5ˊ(序列号12)所示的RNA序列;
(b)3ˊ-GAGAACAGACCA-5ˊ(序列号13)或3ˊ-GAGAACAAACCA-5ˊ(序列号14)所示的RNA序列;
(c)3ˊ-(CNNNNN)3-5ˊ(序列号15)所示的RNA序列;
(d)3ˊ-(NNNNNG)3-5ˊ(序列号16)所示的RNA序列。
[11]如前述[10]所记载的隐身型RNA基因表达***,其特征在于,前述(a)的RNA序列位于负单链RNA(A)的3ˊ末端,并且前述(b)的RNA序列位于5ˊ末端。
[12]如前述[10]或[11]所记载的隐身型RNA基因表达***,其特征在于,前述(c)的RNA序列从负单链RNA(A)的3ˊ末端起第79个碱基开始,并且前述(d)的RNA序列从5ˊ末端起第96个碱基开始。
[13]如前述[10]~[12]中任一项所记载的隐身型RNA基因表达***,其特征在于,前述(5)的包含复制起点的RNA序列进一步在负单链RNA(A)的3ˊ末端起第97~116个碱基的位置包含(e)3ˊ-AAAGAAACGACGGUUUCA-5ˊ(序列号17)的RNA序列或具有与其相同碱基长度的18个碱基长度的RNA序列。
[14]一种不使先天免疫机制激活的隐身型RNA载体,其中,该隐身型RNA载体为包含构成前述[1]~[13]所记载的隐身型RNA基因表达***的复合体、具有将该复合体导入动物细胞的活性的RNA载体。
[15]如前述[14]所记载的隐身型RNA载体,其中,该隐身型RNA载体形成对动物细胞具有感染能力的病毒颗粒。
[16]导入前述[14]或[15]所记载的隐身型RNA载体的动物细胞。
[17]一种隐身型RNA,所述隐身型RNA是包含下述(1)~(8)的RNA序列的负单链RNA(A),并且可以与单链RNA结合蛋白(B)和RNA依赖性RNA合成酶(C)一起形成不使先天免疫机制激活的复合体:
(1)编码任意蛋白质或功能性RNA的目标RNA序列;
(2)构成非编码区的先天免疫机制不能识别的RNA序列;
(3)RNA依赖性RNA合成酶所识别的转录起始信号序列;
(4)该酶所识别的转录终止信号序列;
(5)包含该酶所识别的复制起点的RNA序列;
(6)编码该酶的RNA序列,并且是进行了结构优化使先天免疫机制不能识别的RNA序列;
(7)编码调节该酶活性的蛋白质的RNA序列,并且是进行了结构优化使先天免疫机制不能识别的RNA序列;
(8)编码单链RNA结合蛋白的RNA序列,并且是进行了结构优化使先天免疫机制不能识别的RNA序列。
本发明还包括以下实施方式。
[17’]一种隐身型RNA,所述隐身型RNA是包含下述(1)~(8)的RNA序列的负单链RNA(A),并且可以与单链RNA结合蛋白(B)和RNA依赖性RNA合成酶(C)一起形成不使先天免疫机制激活的复合体:
(1)编码任意蛋白质或功能性RNA的目标RNA序列;
(2)构成非编码区的源自在动物细胞中表达的mRNA的RNA序列;
(3)前述RNA依赖性RNA合成酶所识别的转录起始信号序列;
(4)该酶所识别的转录终止信号序列;
(5)包含该酶所识别的复制起点的RNA序列;
(6)编码该酶的RNA序列,并且是针对导入对象细胞所由来的生物物种进行了密码子优化的RNA序列;
(7)编码调节该酶活性的蛋白质的RNA序列,并且是针对导入对象细胞所由来的生物物种进行了密码子优化的RNA序列;
(8)编码前述单链RNA结合蛋白的RNA序列,并且是针对导入对象细胞所由来的生物物种进行了密码子优化的RNA序列。
[17”]一种隐身型RNA,所述隐身型RNA是包含下述(1)~(8)的RNA序列的负单链RNA(A),并且可以与单链RNA结合蛋白(B)和RNA依赖性RNA合成酶(C)一起形成不使先天免疫机制激活的复合体:
(1)编码任意蛋白质或功能性RNA的目标RNA序列;
(2)构成非编码区的源自人类mRNA的RNA序列;
(3)前述RNA依赖性RNA合成酶所识别的转录起始信号序列;
(4)该酶所识别的转录终止信号序列;
(5)包含该酶所识别的复制起点的RNA序列;
(6)编码该酶的RNA序列,并且是针对人类细胞进行了密码子优化的RNA序列;
(7)编码调节该酶活性的蛋白质的RNA序列,并且是针对人类细胞进行了密码子优化的RNA序列;
(8)编码前述单链RNA结合蛋白的RNA序列,并且是针对人类细胞进行了密码子优化的RNA序列。
[18]如前述[17]所记载的隐身型RNA,其中,在前述负单链RNA(A)的3ˊ末端侧和5ˊ末端侧包含前述(5)的包含RNA依赖性RNA合成酶所识别的复制起点的RNA序列,并且是分别与3ˊ末端侧的RNA序列和5ˊ末端侧的RNA序列互补的RNA序列。
[19]如前述[17]或[18]所记载的隐身型RNA,其特征在于,前述(2)的RNA序列被配置为邻接于前述(1)的目标RNA序列中所包含的多个基因序列各自的3ˊ末端侧,由相同或不同序列构成的前述(3)的转录起始信号序列被配置为邻接于前述(2)的RNA序列的更3ˊ末端侧;并且,前述(4)的转录终止信号序列被配置为邻接于被配置为与前述(1)的目标RNA序列中所包含的多个基因序列的各基因序列的5ˊ末端侧相邻接的RNA序列的更5ˊ末端侧。
[20]如前述[17]~[19]中任一项所记载的隐身型RNA,其特征在于,前述(2)的RNA序列被配置为邻接于前述(1)的目标RNA序列中所包含的多个基因序列各自的3ˊ末端侧,由相同或不同序列构成的前述(3)的转录起始信号序列被配置为邻接于前述(2)的RNA序列的更3ˊ末端侧;并且,前述(4)的转录终止信号序列被配置为邻接于被配置为与前述(1)的目标RNA序列中所包含的多个基因序列的各基因序列的5ˊ末端侧相邻接的RNA序列的更5ˊ末端侧;进一步地,在其两端构成具有多个可通过限制性酶进行酶切的限制性酶酶切位点的盒结构,多个该盒结构结合在一起。
[21]一种重构隐身型RNA基因表达***的方法,所述方法是包括下述(1)~(5)的步骤的方法:
(1)准备表达T7RNA聚合酶的大肠杆菌的步骤;
(2)将搭载前述[1]~[13]中任一项所记载的负单链RNA(A)以及至少编码RNA依赖性RNA合成酶和RNA结合活性蛋白的RNA的大肠杆菌用载体、以及表达编码RNA结合活性蛋白的DNA的大肠杆菌用载体导入(1)的大肠杆菌宿主内的转化步骤;
(3)在(2)的转化大肠杆菌内,形成负单链RNA与RNA结合活性蛋白的复合体的步骤,该负单链RNA包含通过T7RNA聚合酶使之表达的外源基因RNA;
(4)准备表达RNA依赖性RNA合成酶的动物细胞的步骤;
(5)将由(3)得到的负单链RNA与RNA结合活性蛋白的复合体导入(4)的动物细胞宿主内,重构由负单链RNA、RNA结合活性蛋白和RNA依赖性RNA合成酶的复合体所构成的隐身型RNA基因表达***的步骤。
[22]一种串联型盒,所述串联型盒是具有2个克隆位点A、B的基于DNA的串联型盒,其中,
该串联型盒从5ˊ末端侧开始依次由(1)多聚化部位A、(2)转录起始信号A、(3)非编码序列A1、(4)克隆位点A、(5)非编码区A2、(6)转录终止信号A、(7)转录起始信号B、(8)非编码序列B1、(9)克隆位点B、(10)非编码区B2、(11)转录终止信号B和(12)多聚化部位B构成;
前述(1)多聚化部位A和(12)多聚化部位B分别包含限制性酶识别序列和/或部位特异性重组酶识别序列,彼此为相同或不同的DNA;
前述(2)转录起始信号A和(7)转录起始信号B在被转录为RNA的情况下分别包含RNA依赖性RNA合成酶所识别的转录起始信号,彼此为相同或不同的DNA;
前述(3)非编码序列A1、(5)非编码区A2、(8)非编码序列B1和(10)非编码区B2在被转录为RNA的情况下分别成为不被宿主细胞的先天免疫机制识别的RNA,彼此为相同或不同的DNA;
前述(4)克隆位点A和(9)克隆位点B分别包含一个以上的限制性酶识别序列和/或部位特异性重组酶识别序列,彼此为相同或不同的DNA;
前述(6)转录终止信号A和(11)转录终止信号B在被转录为RNA的情况下分别包含RNA依赖性RNA合成酶所识别的转录终止信号,彼此为相同或不同的DNA。
[23]如前述[22]所记载的串联型盒,其中,
前述(4)克隆位点A从5ˊ末端侧开始依次包含限制性酶A识别序列和限制性酶C识别序列,
前述(9)克隆位点B从5ˊ末端侧开始依次包含限制性酶D识别序列和限制性酶B识别序列,
其中,限制性酶A和限制性酶D是产生相同序列的单链突出末端的限制性酶,限制性酶C和限制性酶B是产生相同序列的单链突出末端的限制性酶。
[24]如前述[22]或[23]所记载的串联型盒,其中,前述(1)多聚化部位A和(12)多聚化部位B中的任一者都是包含产生NN或NNN表示的序列的任意单链突出末端的限制性酶识别序列的DNA。
[25]如前述[22]~[24]中任一项所记载的串联型盒,其中,
前述(3)非编码序列A1、(5)非编码区A2、(8)非编码序列B1和(10)非编码区B2分别为与源自在动物细胞表达的mRNA的RNA序列的部分序列相对应的相同或不同的cDNA;
在前述(4)克隆位点A和(9)克隆位点B中***相同或不同的源自人类的基因。
发明效果
本发明的隐身型RNA基因表达***因为难以被先天免疫机制捕捉,所以细胞毒性极低,可搭载10个基因并导入各种组织细胞,可在必要的期间始终持续表达。另外,在本发明中被称为可避免先天免疫机制或不被免疫机制识别时,是指导入的基因或为此目的的载体等不实质性地刺激宿主的先天免疫。具体而言,是指将干扰素β诱导能力作为指标,将正常细胞中IFN-βmRNA的表达量设为1.0时,为30以下,优选为20以下,更优选为10以下。
另外,隐身型RNA基因表达***在细胞质发挥功能,因此,如果使用将该基因表达***包封的隐身型RNA载体,导入不具有增殖能力且没有进行细胞***的外周血细胞,可以表达搭载基因。进一步地,能够以最大80倍的倍率选择表达强度不同的基因表达***,可在成为不需要时通过抑制RNA依赖性RNA合成酶的活性而简单地去除。因此,本技术对于使用迄今为止不可能的6个以上基因,将包括人类细胞在内的动物细胞的性质有效地进行重编程的目的而言是最合适的。
例如,可以考虑将人类外周血细胞作为材料,应用在所谓不含动物成分(Xeno-free)、不使用饲养细胞(Feeder-free)的困难条件下,有效制作在再生医疗的临床应用中使用的高质量的iPS细胞。另外,也可应用于被称为直接重编程的技术,使用6个以上基因由人类的组织细胞(血液、皮肤、胎盘等)制作神经细胞、神经干细胞、干细胞、胰β细胞等的有用基因。进一步地,因为引起细胞死亡或炎症的可能性低,所以也期待应用于使用也包括巨大基因在内的各种基因的基因治疗或利用活体内的重编程的再生医疗。
隐身型RNA基因表达***因为可同时搭载多个基因并以一定的比例表达,在由多个亚基构成的生物医药品的制造中也发挥效果。例如,在生产人类免疫球蛋白G的情况下,在同一细胞同时表达各亚基是必要的。此外,在生产人类免疫球蛋白G的情况下,期望H链和L链以1:1的比例在同一细胞同时表达;而在生产人类免疫球蛋白M的情况下,期望H链:L链:μ链以1:1:0.2的比例在同一细胞同时表达,隐身型RNA基因表达***可容易地满足这样的要求。
进一步地,隐身型RNA基因表达***可以改变基因表达的水平,因此,可容易地实现在生物医药品制造中必需的强基因表达。就迄今为止的使用动物细胞的生物医药品制造工序而言,必须建立并入染色体的基因的拷贝数增加的稳定细胞株,这是必须耗费大量时间和劳动的过程,然而,如果采用隐身型RNA基因表达***,则不需要耗费这样的劳动。
另外,隐身型RNA基因表达***对于抑制在生物医药品的制造中成为问题的基因突变也发挥效果。近年来,已报道了引起RNA病毒基因组突变的主要原因是细胞质的腺苷脱氨酶(作用于RNA的腺苷脱氨酶,ADAR1)(非专利文献39)。ADAR1通过先天免疫机制的激活而被诱导,因此,就隐身型RNA基因表达***而言,可将ADAR1的诱导抑制至最小限度,从而抑制基因突变。
隐身型RNA基因表达***对于由多个亚基构成的药物研发靶标蛋白的表达而言也是最合适的。例如,为了表达药物研发靶标酶NADPH氧化酶(Nox2),同时表达gp91phox、p22phox、Rac、p47phox、p67phox、p40phox这6个亚基是必要的,而隐身型RNA基因表达***可容易地实现。进一步地,如果使用隐身型RNA载体,即使在因为不引起细胞***而使基因导入和表达困难的原代培养血管内皮细胞或神经细胞等靶标细胞中,也可表达药物研发靶标蛋白,可容易地实现目的。
另外,因为隐身型RNA基因表达***或隐身型RNA载体引起细胞毒性或炎症的可能性低,所以,作为通过活体内的基因表达得到治疗效果的基因治疗平台的应用是可能的。特别是,因为可以搭载就以往的基因导入、表达载体而言不可能的血友病A的致病基因产物血液凝固因子VIII的cDNA(7053个碱基)或杜氏肌肉营养不良症的致病基因产物肌养蛋白(dystrophin)的cDNA(11058个碱基)等巨大的基因并且持续表达,所以被期待作为这些疾病的基因治疗用载体而使用。
进一步地,本发明中,因为为了在载体上搭载6个以上、优选8个以上的外源基因而开发的使用串联型盒连接法的串联型盒是基于DNA构建的,所以该方法不仅可应用于本发明的隐身型RNA载体,还可广泛应用于普通的DNA表达载体等。
附图说明
图1是表示负单链RNA分子的结构的图,该负单链RNA分子是将源自在动物细胞中表达的mRNA的RNA与RNA依赖性RNA合成酶所识别的转录起始信号、转录终止信号、复制起点进行组合而制作的。
图2是表示负单链RNA分子复制时必需的核酸的3ˊ末端和5ˊ末端的结构的图。
图3是表示负单链RNA分子复制时必需的核酸的3ˊ末端的结构的图。
图4是表示负单链RNA分子复制时必需的核酸的5ˊ末端的结构的图。
图5是源自RNA病毒的mRNA中的密码子适应指数(Codon adaptation index)的解析。
图6是源自RNA病毒的mRNA中的GC含量的解析。
图7是表示在隐身型RNA基因表达***中搭载的外源基因cDNA的设计方法的图。
图8是表示将2个外源基因cDNA进行结合的方法的图。
图9是表示将10个外源基因cDNA进行结合的方法的图。
图10是表示构建用于制作搭载10个外源基因的隐身型RNA基因表达***的模板cDNA的方法的图。
图11是表示用于由模板cDNA重构隐身型RNA基因表达***的第一方法的图。
图12是表示用于由模板cDNA重构隐身型RNA基因表达***的第二方法的图。
图13是表示搭载10个外源基因cDNA的隐身型RNA基因表达***的基因组结构的图。
图14是表示搭载10个外源基因cDNA的隐身型RNA基因表达***的基因表达活性的图。
图15是表示通过与图13不同的方法将核酸的碱基序列进行优化而制作的搭载10个外源基因cDNA的隐身型RNA基因表达***的基因组结构的图。
图16是表示通过改变N、C、PolS(P)基因的布局而制作的搭载10个外源基因cDNA的隐身型RNA基因表达***的基因组结构的图。
图17是表示隐身型RNA载体的干扰素诱导活性的图。
图18是表示为了完全避免先天免疫活性诱导能力而搭载附加因子的隐身型RNA基因表达***的基因组结构的图。
图19是表示来自于搭载附加因子的隐身型RNA载体的干扰素诱导能力的图。
图20是表示具有不同基因表达水平的隐身型RNA基因表达***的结构的图(以正链RNA序列进行标注)。
图21是表示C基因缺失或翻译抑制的隐身型RNA基因表达***的基因组结构和基因表达的图。
图22是表示隐身型RNA基因表达***的包装信号(packaging signal)的活性的图。
图23是表示将隐身型RNA基因表达***从细胞去除的图。
图24是表示迄今为止所制作的隐身型RNA载体的基因组结构的图。
图25是表示由搭载6个初始化基因的隐身型RNA载体制作诱导多能干细胞(iPS细胞)的效率的图。
图26是表示通过隐身型RNA基因表达***表达免疫球蛋白M的图。
图27是表示通过隐身型RNA基因表达***表达双重特异性抗体的图。
具体实施方式
1.本发明的“隐身型RNA基因表达***”的构成要素
本发明使用的RNA分子显示难以被先天免疫机制捕捉的“隐身性”。因此,在本发明中,将该RNA分子称为“具有隐身性的RNA”,将使用该RNA作为材料的基因表达***称为“隐身型RNA基因表达***”,将包封该基因表达***并具有将该基因表达***导入动物细胞的活性的构建体称为“隐身型RNA载体”。
在本发明中,所谓隐身型RNA基因表达***是指由包含以下(1)~(8)的RNA序列的负单链RNA(A)、单链RNA结合蛋白(B)和RNA依赖性RNA合成酶(C)构成,并且不使先天免疫机制激活的复合体。所谓隐身型RNA载体是指包含该复合体并且具有将该复合体导入动物细胞的活性的颗粒。另外,在本发明中,在标注负单链RNA的RNA序列时,在指编码蛋白质的序列的情况下,是指反义链一侧的RNA序列。
(1)编码任意蛋白质或功能性RNA的目标RNA序列;
(2)构成非编码区的先天免疫机制不能识别的RNA序列;
(3)前述RNA依赖性RNA合成酶所识别的转录起始信号序列;
(4)该酶所识别的转录终止信号序列;
(5)包含该酶所识别的复制起点的RNA序列;
(6)编码该酶的RNA序列,并且是进行了结构优化使先天免疫机制不能识别的RNA序列;
(7)编码调节该酶活性的蛋白质的RNA序列,并且是进行了结构优化使先天免疫机制不能识别的RNA序列;
(8)编码前述单链RNA结合蛋白的RNA序列,并且是进行了结构优化使先天免疫机制不能识别的RNA序列。
(以下,基因RNA也有被简称为基因的情况)。
此处,优选(2)的RNA具有5~49个碱基长度,作为(1)的被导入的外源基因RNA各自的3ˊ末端侧和5ˊ末端侧的非编码区进行配置。
另外,(1)的导入的外源基因RNA的个数即使小于6个(例如1~5个),总碱基长度即使小于5,000个碱基长度,当然都可作为隐身型RNA基因表达***发挥功能,然而,本发明的RNA基因表达***特别是在包含下述RNA的情况下发挥显著效果:外源基因RNA的个数为6个以上,优选为8个以上,更优选为10个以上的基因;并且总碱基长度为5,000个碱基长度,优选为8,000个碱基长度,更优选为10,000个碱基长度。
另外,在本申请说明书中,被称为基因或基因材料时,包括负链RNA或cDNA以及与其互补的正链RNA或cDNA。也就是说,通过转录或逆转录可以合成的上述任一基因或基因材料的物质都包含于本发明中。
2.本发明的隐身型RNA表达***的构成要素
2-1.用于外源基因RNA导入的串联型盒的制作
本发明的隐身型RNA基因表达***中的外源基因RNA在其3ˊ末端和5ˊ末端的非编码区具有5~49个碱基的相同或不同的“(1)不被先天免疫机制识别的RNA”,在其更外侧的3ˊ末端和5ˊ末端分别设置有(3)的“转录起始信号”和(4)的“转录终止信号”,在最外侧的两端设置有多聚化部位,从而可成为盒。
通过使用如下所示的基于DNA的串联型盒,可容易地构建在本发明的隐身型RNA基因表达***中所使用的负单链RNA。
本发明的串联型盒从5ˊ末端侧开始依次由(1)多聚化部位A、(2)转录起始信号A、(3)非编码序列A1、(4)克隆位点A、(5)非编码区A2、(6)转录终止信号A、(7)转录起始信号B、(8)非编码序列B1、(9)克隆位点B、(10)非编码区B2、(11)转录终止信号B和(12)多聚化部位B构成。作为示意性示出该串联型盒的图,可列举图7的下图。
上述多聚化部位A和B可彼此相同或不同,只要是可用于该盒的多聚化、或可用于与其它核酸结合的序列,可使用任意序列。作为多聚化部位的优选实例,可列举限制性酶识别序列和部位特异性重组酶的识别序列。作为优选的限制性酶的实例,可列举具有在切面生成如NN或NNN所示序列的任意的单链突出端的性质的SapI、BbsI、BbvI、BcoDI、BfuAI、BsaI、BsmBI、BsmFI、BtgZI、EarI、FokI、HgaI、SfaNI。另外,作为其它优选实例,可列举在识别序列内部具有不规则序列的AlwNI、BglI、BstAPI、BstXI、DraIII、SfiI等。另外,在利用同源重组的情况下,作为重组酶的识别序列,可列举attB1和attB2等序列。进一步地,在利用Gibson组装***(Gibson Assembly System,New England Biolabs,Inc)的情况下,以成为连接对象的其它串联型盒的末端部与重叠序列成为相同序列作为前提,作为多聚化部位可使用任意的15个碱基以上的序列。
转录起始信号A和B彼此可相同或不同,只要在转录为RNA的情况下作为RNA依赖性RNA合成酶所识别的转录起始信号具有功能,可以是任何序列。RNA依赖性RNA合成酶所识别的转录起始信号的实例由下文的段落具体记载。优选可列举序列号1~3的序列。
非编码序列A1、A2、B1和B2彼此可相同或不同。只要在转录为RNA的情况下是上述定义的“不被先天免疫机制识别的RNA”,可以是任何序列,可列举的优选实例为5~49个碱基长度的表1所披露的各序列。
只要可以将所期望的外源基因***,克隆位点A和B可以是任何序列。优选一个克隆位点包含1个或2个以上的限制性酶识别序列,或包含1个或2个以上的部位特异性重组酶的识别序列。作为克隆位点的优选实例,可列举:包含Acc65I识别位点和SalI识别位点的序列;包含Acc65I识别位点和XhoI识别位点的序列;包含BsiWI识别位点和SalI识别位点的序列;以及包含BsiWI识别位点和XhoI识别位点的序列。
转录终止信号A和B彼此可相同或不同,只要在转录为RNA的情况下作为RNA依赖性RNA合成酶所识别的转录终止信号具有功能,可以是任何序列。RNA依赖性RNA合成酶所识别的转录终止信号的实例由下文的段落具体记载。优选可列举序列号4~6的序列。
在一个该串联型盒中,可***至少2个外源基因。将5个***2个外源基因的盒进行连接而得的盒多聚体成为承载有10个外源基因的盒多聚体。在下述实施例中,利用将这样的串联型盒进行多聚化而制作承载有4、6或10个外源基因的DNA片段,将之亚克隆至质粒中。进一步通过与源自病毒的RNA依赖性RNA合成酶基因和RNA结合蛋白基因组合,构建本发明所期望的RNA表达***。
2-2.RNA依赖性RNA合成酶以及该酶所识别的转录起始信号和转录终止信号
“RNA依赖性RNA合成酶”以及该酶所识别的转录起始信号和转录终止信号优选选自于源自相同负链RNA病毒的序列,典型地为源自属于副粘病毒科的病毒的基因组的序列。属于副粘病毒科的病毒的基因组的“RNA依赖性RNA合成酶”、“该酶所识别的转录起始信号”与“该酶所识别的转录终止信号”的组合是为了全部具有相同的基本结构,也可使用源自任何病毒的序列的组合。
在本发明的实施例中,作为“RNA依赖性RNA合成酶”选择仙台病毒的L蛋白(RNA合成酶的大亚基PolL)和P蛋白(RNA合成酶的小亚基PolS)的组合;作为“RNA依赖性RNA合成酶所识别的转录起始信号的RNA”选择“3ˊ-UCCCACUUUC-5ˊ(序列号1)”;作为“RNA依赖性RNA合成酶所识别的转录终止信号的RNA”选择“3ˊ-AAUUCUUUUU-5ˊ(序列号4)”,将转录起始信号和转录终止信号分别配置在各基因的3ˊ侧和5ˊ侧(图1)。并且,作为“调节RNA合成酶活性的蛋白质”使用仙台病毒的C蛋白(C);另外,作为“单链RNA结合蛋白”使用仙台病毒的NP蛋白(N)。
另外,在本说明书所公开的技术中,RNA主要以负链的单链RNA的实施方式被使用,只要没有特别注释,RNA序列作为负链的序列信息从3ˊ末端侧开始进行公开。但是,构成本说明书的一部分的序列表的序列信息遵照指南从5ˊ末端侧开始记载。
在作为“RNA依赖性RNA合成酶”选择仙台病毒的L蛋白和P蛋白的组合的情况下,作为转录起始信号,除了“3ˊ-UCCCACUUUC-5ˊ(序列号1)”、“3ˊ-UCCCUAUUUC-5ˊ(序列号2)”、“3ˊ-UCCCACUUAC-5ˊ(序列号3)”之外,可使用与这些序列具有同等功能的RNA。另外,对于转录终止信号也同样,除了“3ˊ-AAUUCUUUUU-5ˊ(序列号4)”、“3ˊ-CAUUCUUUUU-5ˊ(序列号5)”、“3ˊ-UAUUCUUUUU-5ˊ(序列号6)”之外,可使用与这些序列具有同等功能的RNA。另外,在作为“RNA依赖性RNA合成酶”选择人类副流感病毒3型的L蛋白和P蛋白的组合的情况下,作为转录起始信号,可使用“3ˊ-UCCUAAUUUC-5ˊ(序列号7)”或具有同等功能的RNA;作为转录终止信号,可使用“3ˊ-UUAUUCUUUUU-5ˊ(序列号8)”或具有同等功能的RNA。进一步地,在作为“RNA依赖性RNA合成酶”选择新城疫病毒的L蛋白和P蛋白的组合的情况下,作为转录起始信号可使用“3ˊ-UGCCCAUCUUC-5ˊ(序列号9)”或具有同等功能的RNA;作为转录终止信号可使用“3ˊ-AAUCUUUUUU-5ˊ(序列号10)”或具有同等功能的RNA。
2-3.用于本发明的隐身型RNA基因表达***的复制功能的要素
作为用于本发明的隐身型RNA基因表达***的复制功能的必需要素是具有RNA依赖性RNA合成酶所识别的复制起点以及所谓3ˊ末端侧的(CNNNNN)3-和5ˊ末端侧的(NNNNNG)3-的结构的序列。
在本发明的实施例中,作为“RNA依赖性RNA合成酶”选择仙台病毒的L蛋白和P蛋白的组合,因此,作为“包含RNA依赖性RNA合成酶所识别的复制起点的RNA”选择存在于仙台病毒基因组3ˊ末端的114个碱基的RNA以及存在于仙台病毒基因组5ˊ末端的96个碱基的RNA。在此结构中,在隐身型RNA基因表达***的复制功能中所必需的要素如下(图2、图3、图4)。
(1)存在于基因组3ˊ末端的“3ˊ-UGGUCUGUUCUC-5ˊ(序列号11)”或具有同等功能的12个碱基的RNA序列(例如,“3ˊ-UGGUUUGUUCUC-5ˊ(序列号12)”);
(2)存在于基因组5ˊ末端的“3ˊ-GAGAACAGACCA-5ˊ(序列号13)”或具有同等功能的12个碱基的RNA序列(例如,“3ˊ-GAGAACAAACCA-5ˊ(序列号14)”);
(3)具有从基因组3ˊ末端起第79个碱基开始的所谓“3ˊ-(CNNNNN)3-5ˊ(序列号15)”的结构的18个碱基的RNA序列;
(4)具有从基因组5ˊ末端起第96个碱基开始的所谓“3ˊ-(NNNNNG)3-5ˊ(序列号16)”的结构的18个碱基的RNA序列。
其中,(1)和(2)是彼此互补的序列,因为基因组RNA的3ˊ末端与反基因组RNA(与基因组RNA互补的RNA)的3ˊ末端相同,所以被认为是RNA依赖性RNA合成酶所识别的复制起点。另外,(3)和(4)功能尚不清楚,然而已知其是在由RNA依赖性RNA合成酶进行的单链RNA复制中必需的序列(非专利文献42)。
2-4.负单链RNA中颗粒化所必需的包装信号(packaging signal)区
另外,在本发明中,首次将作为负单链RNA中用于颗粒化的包装信号的区域确定为从基因组3ˊ末端起第97个碱基至第114个碱基的区域。
如实施例18(图22)所示,将该区域(标记为“序列D”)全部去除并不影响包装细胞内的基因表达,然而,得到隐身型RNA载体的颗粒化效率极为低下这一结果。
上述结果显示,该18个碱基的序列或该18个碱基长的区域或其一部分是用于摄入至病毒样颗粒所必需的序列或区域。
于是,进一步尝试将该18个碱基的序列用从下述“表1”所列举的源自管家基因的mRNA的部分序列中任意选择的序列进行置换(图3的(5),序列号75),确认颗粒化效率没有变化。
因此,从基因组3ˊ末端起第97~114个碱基的18个碱基长度或其一部分长度的区域被认为是在负单链RNA中用于颗粒化的包装中所必需的。也就是说,虽然该区域在以负单链RNA为模板的转录和复制中不是必需的,但是,可以说该区域是用于将隐身型RNA基因表达***摄入至病毒样颗粒所必需的“包装信号区域”。
(5)与从基因组3ˊ末端起第97~114个碱基的“3ˊ-AAAGAAACGACGGUUUCA-5ˊ(序列号17)”对应的18个碱基长度的RNA,或者该RNA的至少连续8个碱基以上、优选10个碱基以上、更优选15个碱基以上长度的任意RNA。
对于缺失上述(5)的18个碱基长度或其部分区域的隐身型RNA基因表达***而言,即使宿主细胞经同种或不同种病毒感染,导致产生包含该隐身型RNA基因表达***的病毒样颗粒的可能性极低。
因此,在将本发明的隐身型RNA基因表达***作为感染性颗粒以及作为隐身型RNA基因表达载体使用的情况下,该18个碱基长度或其部分区域是必需的区域,然而,在极力排除病毒样颗粒的混入而力争确保安全性的生物医药品制造中,反倒成为应该排除的序列。
2-5.负单链RNA基因表达模板的构建
已知将“作为RNA依赖性RNA合成酶所识别的转录起始信号的RNA”、“作为RNA依赖性RNA合成酶所识别的转录终止信号的RNA”以及存在于负单链RNA 3ˊ末端和5ˊ末端的“包含RNA依赖性RNA合成酶所识别的复制起点的RNA”组合、并在转录起始信号与转录终止信号之间搭载了任意外源基因的RNA分子在反式(trans)提供的源自病毒的RNA依赖性RNA合成酶等必要因子的存在下,成为转录和复制的模板(非专利文献43、非专利文献44、非专利文献45)。例如,将源自仙台病毒的转录起始信号、转录终止信号和复制起点组合、并搭载了大肠杆菌的氯霉素乙酰转移酶(CAT)基因作为外源基因的具有上述结构的负单链RNA显示在经仙台病毒感染的细胞中成为转录和复制的模板,制造CAT(非专利文献43、非专利文献44)。另外,具有同样结构的负单链RNA在稳定表达仙台病毒的NP(单链RNA结合蛋白)、P(RNA依赖性RNA合成酶的小亚基)和L(RNA依赖性RNA合成酶的大亚基)蛋白的细胞中显示连续地进行持续复制(非专利文献45)。
这些报道显示,本发明所制作的负单链RNA成为基因表达的模板,然而,在这种情况下,转录和复制的活性依赖于由包含病毒基因的细胞反式提供的NP、P、L蛋白,因此不能成为在任意细胞中都可进行基因表达的通用型基因表达***。因此,接下来尝试在具有前述2-3.(图1)所示的结构、由不被先天免疫机制识别的成分构成的RNA分子中搭载转录和复制所必需的基因。
3.关于避免动物细胞中先天免疫机制激活(PAMP)的知识
3-1.关于源自病毒的RNA的PAMP
动物细胞所具有的先天免疫机制识别存在于侵入细胞内的病毒的基因组RNA或病毒基因的mRNA中的“对于病原微生物而言的特征性分子模式(病原体相关分子模式,PAMP)”而被激活。迄今为止,PAMP的结构在C型肝炎病毒和人类免疫缺陷病毒中被确认。就C型肝炎病毒而言,报道了存在于基因组3ˊ末端的非编码区的富含尿嘧啶(Uridine)的序列为PAMP(非专利文献35)。另一方面,就人类免疫缺陷病毒而言,报道了在由Gag、Pol、Env这3个基因转录而来的mRNA中存在的腺嘌呤含量高的区域为PAMP(非专利文献36)。此外,就仙台病毒而言,已知存在于感染细胞中的比600个碱基长度长的长链RNA片段被检测出具有强PAMP活性(非专利文献37),在F、HN、L的各基因的非编码区也存在具有作为PAMP发挥功能的可能性的高级二级结构(非专利文献38)。因此,预测几乎所有源自病毒的RNA都包含PAMP。
3-2.对源自病毒的RNA进行优化的探讨
通过将RNA病毒基因组中的编码蛋白质的区域的密码子针对人类细胞进行优化而破坏PAMP结构以避免先天免疫机制激活的这种尝试以前已多次进行。例如,报道了因为在由人类免疫缺陷病毒(HIV)的Gag、Pol、Env各基因转录而来的各mRNA中分别存在PAMP,所以,如果使任一基因保持原样在动物细胞中表达,则诱导干扰素,然而,针对人类细胞进行优化后表达的Gag、Pol、Env蛋白中的任一种都可抑制干扰素诱导(非专利文献36)。另外,已知在猴免疫缺陷病毒(SIV)中,与HIV一样,在Gag、Pol、Env的mRNA中也存在PAMP,通过将包含各基因的PAMP的区域的密码子针对人类细胞进行优化,可降低干扰素诱导能力(非专利文献48)。但是,就仅将SIV基因组序列中的包含Pol基因的PAMP的区域的密码子进行优化而言,SIV的干扰素诱导能力几乎没有变化。因此,除了Pol基因的优化之外,还将包含Gag基因的PAMP的区域的密码子进行优化,则病毒的复制能力降低至1%以下,显示病毒的转录、复制功能严重受损的结果(非专利文献48)。该结果显示,SIV的Pol基因和Gag基因不仅只是编码Pol蛋白和Gag蛋白,在编码蛋白质的核酸序列本身中也存在病毒转录或复制的功能所必需的信息。
另外,对于C型肝炎病毒基因组3ˊ末端的非编码区中的包含PAMP的区域,也报道了破坏该区域将使其病毒复制能力受损(非专利文献82、非专利文献83)。
这些结果显示,RNA病毒基因组中的“包含PAMP的区域”同时对病毒复制等功能而言是必需区域的可能性高。
如上所述,因为尚未知晓有既不损伤RNA病毒的功能又从基因组核酸中将具有PAMP功能的结构去除的普遍方法,所以,将针对人类细胞对病毒RNA中包含PAMP的区域的密码子进行优化的技术应用于RNA病毒载体反倒成为否定性的结果。
3-3.源自病毒的先天免疫抑制因子的利用
就将RNA病毒的基因组或合成RNA作为基因表达的平台使用的现有技术而言,并非将作为PAMP被识别的结构探明并将该结构去除,而是在各种病毒所具备的拮抗先天免疫机制的因子的作用下,抑制由PAMP导致的先天免疫机制的激活,减弱细胞毒性。例如,在非专利文献26和非专利文献27中作为必需构成要素而使用的B18R蛋白是在痘苗病毒的基因组DNA中编码的干扰素结合蛋白,具有通过抑制干扰素的活性而抑制先天免疫机制激活的功能。
另外,就在专利文献3、专利文献4、非专利文献7中记载的基于仙台病毒的载体而言,与RNA依赖性RNA合成酶(L蛋白和P蛋白)的突变一起,源自仙台病毒的V蛋白的表达也承担抑制先天免疫机制的作用。V蛋白是以由仙台病毒的P基因区域转录而来的mRNA制作的蛋白质之一,具有与P蛋白相同的N末端(317个氨基酸残基)以及具有V蛋白所固有的结构的碱基性C末端(67个氨基酸残基)(非专利文献39)。V蛋白经由转录因子IRF-3的抑制而抑制先天免疫机制的激活(非专利文献40)。另外,已知就在P基因的碱基序列中人工导入突变而制作的V蛋白缺失的仙台病毒而言,抑制先天免疫机制激活的功能丧失,容易从感染个体中被排除(非专利文献40、非专利文献41)。
如上所述,在并用源自病毒的先天免疫抑制因子的情况下,产生了导入外源基因的细胞即使感染其它种病原微生物也不会激活先天免疫机制的安全性方面的顾虑。例如,就稳定维持仙台病毒载体的基因组的细胞而言,因为V蛋白恒定表达,所以,在活体的组织细胞使用该载体的情况下,存在该细胞即使感染别的病毒也不能激活先天免疫机制的可能性。因此,期望有借助不依赖于通过源自病毒的因子来抑制先天免疫机制的方法来避免先天免疫机制激活的技术。
4.本发明的RNA基因表达***中用于避免PAMP的方法
4-1.非编码区序列中的“不被先天免疫机制识别的RNA”
掌控本发明的关键在于对可避免激活动物细胞所具有的先天免疫机制的RNA的选择。另外,本发明中提及避免先天免疫机制激活时,以干扰素β诱导能力作为指标,在将正常细胞中IFN-βmRNA的表达量设为1.0时,为30以下,优选为20以下,更优选为10以下,这一点如上所述。
因此,在本发明中,作为“不被先天免疫机制识别的RNA”的材料,使用源自人类等动物细胞表达的mRNA的RNA序列,其中,选择了源自在广泛的人类细胞中表达的管家基因的mRNA。该mRNA在几乎所有人类细胞中都较大量地表达,不包含被人类先天免疫机制识别的基序。进一步地,从该mRNA的不编码蛋白质的非编码区选择不形成高级二级结构的5个碱基至49个碱基的RNA(表1),配置在搭载于载体上的各基因的5ˊ侧非编码区和3ˊ侧非编码区(图1)。
即使在本发明的非编码区序列中“不被先天免疫机制识别的RNA”的“源自在动物细胞中表达的mRNA的RNA序列”中,下述表1所列举的源自管家基因的mRNA的部分序列中的任一序列都可作为特别优选的序列使用。作为这样的优选序列的其它实例,也可优选使用源自白蛋白基因等在活体内大量表达的基因的mRNA的RNA序列的部分序列。
如上所述,在本发明的实施例中,考虑到应用于再生医疗而选择源自在人类细胞中表达的mRNA的非编码区序列,使用了其部分序列,然而,作为“不被先天免疫机制识别的RNA”,不限于实施例或表1所列举的来自于源自人类mRNA的非编码区序列的序列。例如,在OptimumGen基因设计***(专利文献7,GenScript USA,Inc.)中,为了求出基准CAI值,可使用从所采用的在人类中表达量高的人类mRNA组中适当选择的人类mRNA所具有的非编码序列的部分序列。此外,如果载体不被所使用的宿主细胞的先天免疫机制识别,那么,也可以是mRNA以外的人类RNA、在其它动物种的细胞中表达的RNA、非天然的合成RNA。
表1
Figure GDA0001595451670000361
4-2.RNA载体基因组3ˊ末端和5ˊ末端区域中“不被先天免疫机制识别的RNA”的置换
如图2、图3和图4所示,在构成本发明的隐身型RNA载体的基因组RNA序列中,在3ˊ末端区域和5ˊ末端区域,除了前述2-2.~2-3.等所示的与转录、复制等相关的必需构成要素以外,还存在任意的功能不明的序列区域,在这些序列中,在多个位置存在可以置换为源自管家基因的mRNA的部分序列等的“不被先天免疫机制识别的RNA”的区域。
例如,如图3的实施例所示,在存在于天然病毒基因组3ˊ末端的结构中,将(1)至(6)的区域置换为包含表1的源自管家基因的mRNA的部分序列的无同源性的其它碱基序列是可能的,隐身型RNA基因表达***的3ˊ变体1至3ˊ变体6中的任一种都可进行稳定的基因表达以及载体颗粒的产生。另外,如图4的实施例所示,在存在于天然病毒基因组5ˊ末端的结构中,将(1)至(4)的区域使用无同源性的其它碱基序列进行置换或***是可能的,隐身型RNA基因表达***的5ˊ变体1至5ˊ变体5中的任一种也都可进行稳定的基因表达。
并且,可以认为,通过将这些位置的序列置换成表1的源自管家基因的mRNA的部分序列等“不被先天免疫机制识别的RNA”,进一步抑制干扰素诱导能力的可能性很高。
5.用于避免由转录、复制中所必需的蛋白质引起的先天免疫机制激活(PAMP)的方法
5-1.成为编码转录、复制中所必需的蛋白质的基因中的PAMP结构的指标的值的探讨
在本发明的实施例中,作为“RNA依赖性RNA合成酶”选定仙台病毒的L蛋白(RNA合成酶的大亚基,PolL)和P蛋白(RNA合成酶的小亚基,PolS);作为“调节RNA合成酶活性的蛋白质”选定仙台病毒的C蛋白(C);作为“单链RNA结合蛋白”选定仙台病毒的NP蛋白(N)。这些蛋白质对于由负单链RNA进行转录和复制是必需的,然而,在编码它们的仙台病毒的基因组RNA或mRNA中,存在如非专利文献37所示的“对于病原微生物而言的特征性分子模式(PAMP)”的可能性高。因此,为了构建不激活先天免疫机制的隐身型RNA基因表达***,从编码这些蛋白质的RNA去除具有PAMP可能性的结构是必要的。
虽然在构成仙台病毒的基因组RNA或mRNA中确实存在PAMP活性,然而,尚不清楚实际上在哪个区域存在PAMP活性。但是,具有PAMP活性的RNA似乎与在宿主细胞中表达的RNA具有明显不同的结构。因此,首先,为了探讨源自RNA病毒的mRNA与人类细胞的mRNA在结构上的不同,将编码区的密码子适应指数(CAI)作为指标进行比较。CAI是指示与在某生物种的细胞中编码最强烈表达的100个蛋白质的mRNA的密码子的出现频率的偏离情况的指标,在CAI=1.0的情况下,表示密码子使用频率与这100种mRNA相同(非专利文献46)。经过“OptimumGen基因设计***(专利文献7,GenScript USA,Inc.)解析的结果,任意选择的151个人类mRNA编码区的CAI平均值为0.778,与之相对,仙台病毒的7种mRNA中的CAI平均值为0.704,同属于副粘病毒科的麻疹病毒的7种mRNA中的CAI平均值为0.697,得到副粘病毒的mRNA的CAI显著低于人类细胞的mRNA的平均CAI这一结果(图5)。另外,在作为参考而解析的大肠杆菌中表达的任意11种mRNA中,CAI的平均值为0.698(图5)。由此,在人类细胞中使用的情况下,副粘病毒的mRNA偏向于与原核生物大肠杆菌的mRNA相比拟的结构,这可以认为存在作为PAMP被识别的可能性。
另外,为了从另一观点来探讨源自RNA病毒的mRNA与人类细胞的mRNA在结构上的不同,计算了编码区的GC含量。其结果是,源自天然副粘病毒的RNA的GC含量平均值为47.7%至48.5%,显著低于人类mRNA编码区的GC含量平均值56.3%(非专利文献47)(图6)。考虑到RNA病毒的基因组GC含量较低且腺嘌呤和尿嘧啶多的序列成为PAMP的可能性高(非专利文献43),可以认为,GC含量也有成为暗示PAMP的存在的指标的可能性。
5-2.源自仙台病毒的与转录、复制相关的基因的“密码子优化”应用实验
用于使这样的CAI值和GC含量接近于人类细胞mRNA平均值的“密码子优化”对于源自病毒的编码区中的PAMP结构的破坏和PAMP的避免是有效的,这已由如前述3-2.所示的HIV、SIV和肝炎病毒等得到证实。
然而,前述3-2.中同时还示出若在这些病毒中对转录、复制所必需的基因的序列内的PAMP区域进行“密码子优化”,将大幅损害复制能力这样的结果。由此,在转录、复制中所必需的基因的序列内的PAMP结构在转录、复制中承担必需的二级结构的作用的可能性高,这可以说是现有的技术常识。
一般而言,综合考虑病毒基因组各种功能紧密地装配到一起,则从这样的现有知识来看,可以认为在仙台病毒的情况下,也与这些病毒基因组一样,转录、复制中所必需的基因序列内的PAMP结构对于病毒功能很重要的可能性高。也就是说,高度预测在将用于在本发明的RNA基因表达***中使用的源自仙台病毒的“RNA依赖性RNA合成酶”等的与转录、复制相关的蛋白质的编码区中的密码子针对人类细胞进行优化的情况下,即使可避免PAMP,本来的转录、复制能力也将同时大幅受损。
在这样的状况下,本发明人特意将编码“RNA依赖性RNA合成酶”、“RNA结合蛋白”等与转录、复制相关的蛋白质的RNA全部针对人类细胞进行了密码子优化。
在本发明中,作为“RNA依赖性RNA合成酶”使用仙台病毒的L蛋白(RNA合成酶的大亚基,PolL)和P蛋白(RNA合成酶的小亚基,PolS),作为“调节RNA合成酶活性的蛋白质”使用仙台病毒的C蛋白(C),作为“单链RNA结合蛋白”使用仙台病毒的NP蛋白(N),所以,以从编码上述蛋白质的RNA中去除PAMP为目的,通过作为密码子优化法而被广泛使用的程序之一“OptimumGen基因设计***(专利文献7,GenScript USA,Inc.)”进行了密码子优化。其结果是,任一CAI值都变为0.86至0.88,显示为接近于编码在人类细胞中高表达的蛋白质的mRNA的数值。
以下,以表2来表示利用“OptimumGen基因设计***(也被称为OGGDS法)”对仙台病毒的L、P、C和N蛋白基因进行密码子优化的应用结果。
表2
Figure GDA0001595451670000401
在上述表2中,为了进一步从另一观点来解析优化的RNA的结构,对于密码子优化后的RNA,与CAI值一起计算了GC含量。其结果是,相对于优化前RNA的GC含量为44.0%至50.1%,优化后RNA的GC含量升高为52.5%至55.5%,接近于人类mRNA编码区的GC含量平均值56.3%(非专利文献47)(表2)(图6)。就RNA病毒而言,已知腺嘌呤和尿嘧啶多的序列成为PAMP的可能性高(非专利文献36),通过密码子优化的方法使源自病毒的RNA的结构接近于人类mRNA的结构,同时也强烈暗示具有PAMP活性的区域被去除的可能性。
并且,在本发明中,实际上通过该方法构建了将针对人类细胞进行优化的编码源自仙台病毒的NP蛋白、P蛋白、C蛋白、L蛋白的RNA与10个外源基因一起搭载的RNA载体(图13)(实施例8),使之在Hela细胞内表达进行验证的结果是(实施例9),确认10个外源基因全部以可观察到的充足的量进行表达。另外,确认该RNA载体可避免人类成纤维细胞内的INF-β诱导(实施例13,图17)。
以上结果显示,本发明的搭载了针对人类细胞进行优化的源自仙台病毒的与转录、复制相关的基因RNA的RNA载体是显示作为具备PAMP避免效果的优异的隐身型RNA载体而发挥功能的RNA载体。
另外,该结果还显示,在仙台病毒的情况下,存在于转录、复制所必需的基因序列内的PAMP结构并不是在所有转录、复制中所必需的结构,即使对于实施实验的本发明人而言,这也是预料之外的惊人结果。
5-3.密码子优化方法的探讨
根据前述表2的结果,暗示为了进行用于去除具有PAMP活性的区域而抑制诱导先天免疫反应的“密码子优化”,“CAI值”和“GC含量”这2种数值范围的设定是重要条件。因此,为了探讨2个条件中哪一个是比较本质的条件,进行了应用其它密码子优化方法的实验。作为密码子优化方法,除了上述OGGDS法之外,还提议有GeneOptimizer程序(非专利文献49)和GeneGPS表达优化技术(专利文献8、专利文献9)等各种方法,因此,通过该追加实验,可以确认即便使用上述OGGDS法以外的方法,也可达到同样的效果。
因此,将与OGGDS法同样被广泛使用的“密码子优化”方法GeneGPS表达优化技术(GeneGPS Expression Optimization Technology,以下也称为GGEOT法)的密码子优化方法应用于编码仙台病毒的NP蛋白、P蛋白、C蛋白、L蛋白的模板DNA,同样地制作了可搭载10个外源基因的RNA载体(图15)。在通过实施例9的方法进行验证时,确认该载体是与通过OGGDS法进行优化的隐身型RNA载体一样可避免诱导先天免疫反应的隐身型RNA载体(数据未显示)。
通过OGGDS法优化与通过GGEOT法优化使用了完全不同的算法,将通过这两种方法进行优化的核酸的碱基序列进行比较,两者的一致性为77%~80%,可看出为了进行密码子优化选择了非常不同的碱基(表4)。
综上,为了将编码“RNA依赖性RNA合成酶”、“调节RNA合成酶活性的蛋白质”、“单链RNA结合蛋白”的基因制成隐身型RNA基因表达***而进行的优化方法并不依赖于特定的密码子优化法,已证实,无论基于何种算法的密码子优化方法都可作为本发明的密码子优化法使用。
以下,以表3来表示对仙台病毒的L、P、C和N蛋白基因通过GGEOT法进行密码子优化后的GC含量和CAI值的值与上述表2所示的使用OGGDS法的值进行对比的表。另外,因为在GGEOT法中没有“CAI值”的计算程序,所以,按照OGGDS法的“CAI值”的计算程序进行计算。
另外,表4示出了分别对于L、P、C和N蛋白基因的原始序列、应用OGGDS后的序列和应用GGEOT后的序列之间的同源性(一致性)的值。
表3
Figure GDA0001595451670000421
表4
Figure GDA0001595451670000422
5-4.用于“密码子优化”的必需指标
CAI作为估计在人类细胞内的mRNA翻译效率的指标之一使用(非专利文献46),然而,就本发明而言,将密码子优化作为从源自病毒的RNA去除具有PAMP活性的结构的一种手段来使用,不必获得翻译效率的升高也是可以的。
另外,CAI是“指示与在某生物种的细胞中编码最强烈表达的100个蛋白质的mRNA的密码子的出现频率的偏离情况的指标”,然而,并未有指示选择作为标准的100个蛋白质的客观基准。在本发明中,在将在源自人类的培养细胞内抑制同等的先天免疫反应诱导的可实现10个基因表达的通过OGGDS法的优化与通过GGEOT法的优化进行比较的情况下,在后者的CAI值(通过OGGDS法进行计算)的情况下,显示优化后与优化前几乎没有变化的结果(表3)。
另一方面,对于GC含量,无论使用哪种优化法都显示51%以上、最大为约60%的值。由此可知,作为表示去除具有PAMP活性的结构的可能性的指标,GC含量比CAI值更为有效。也就是说,作为用于抑制先天免疫反应诱导的“隐身型RNA基因表达***”的“密码子优化”中的指标,GC含量是最佳指标,源自病毒的蛋白质的密码子优化后的GC含量如果至少为50.0%以上,期望为52.0%以上,则推测有去除具有PAMP活性的结构的可能性。
综上所述,本发明中在提及用于RNA基因表达***的“密码子优化”时,是指将编码RNA基因表达***所必需的蛋白质的全部碱基序列调节为GC含量为50~60%,优选为52~56%。
另外,由密码子优化导致碱基序列改变的结果是,存在于P基因区域的编码C蛋白和V蛋白的序列消失,由进行优化的P基因也不表达C蛋白和V蛋白。编码C蛋白和V蛋白的RNA即使完全被去除仍可进行基因表达,因此不是必需的,然而,特别是在C蛋白的情况下,用于适当地调节本发明RNA载体的表达量是重要的,因此优选在序列中添加如前所述进行优化的C蛋白基因RNA。根据需要,对于V蛋白RNA,也可进行适当的同样的密码子优化并添加至序列中。
6.本发明中用于将多个外源基因搭载于隐身型RNA上的方法(转录盒连接法)
6-1.将6个以上基因搭载于同一载体上的方法的探讨
接着,探讨使用简单的方法将6个以上(例如10个)外源基因搭载于隐身型RNA上的方法。另外,RNA分子本身不能通过基因重组进行操作,因此,包括在5-4.中优化的源自病毒的基因的搭载在内,全部以cDNA进行构建,将此cDNA作为模板,通过源自T7噬菌体的T7RNA聚合酶等DNA依赖性RNA合成酶制作RNA。
为了最简单地制作搭载10个基因的DNA分子,可以考虑在各个基因的cDNA的上游和下游导入各基因固有的限制性酶酶切位点并将经此限制性酶酶切的cDNA依次***的方法。但是,在此情况下,除了至少需要20个不同的限制性酶之外,为了进行基因的组合或者变更基因在隐身型RNA上的位置,还必须将cDNA全部重新制作,这是不现实的。
6-2.各搭载2个基因的“串联型转录盒”的制作
就本发明而言,如前述2-1.(图1)所述,采用制作各搭载2个基因的“串联型转录盒”并将它们多个进行连接的方法,此时,花费工夫使得搭载的基因全部设计为具有相同结构并且可搭载于隐身型RNA上的任何位置(图7)。就该设计方法而言,在搭载的基因的5ˊ上游侧设定为限制性酶A,在3ˊ下游测设定为限制性酶B,分别设定限制性酶酶切位点,此处将经酶切的cDNA***成为模板的DNA分子。在被***的模板DNA中,除了由限制性酶A和限制性酶B识别的序列之外,还设定由限制性酶C和限制性酶D识别的序列。选择这些限制性酶的组合,使得经限制性酶A酶切的DNA片段和经限制性酶D酶切的DNA片段都可以进行共价结合,并且经限制性酶B酶切的DNA片段和经限制性酶C酶切的DNA片段都可以进行共价结合。这样的组合存在多个,除了实施例所列举的Acc65I和BsiWI、XhoI和SalI的组合以外,还可以考虑有XbaI和SpeI或NheI的组合、BamHI和BglII的组合等。在这种情况下,对于搭载的基因的cDNA,其结构上的制约为内部不包含限制性酶A、限制性酶B、限制性酶C、限制性酶D的识别序列。通过使用这样的限制性酶的组合,首先制作各搭载2个cDNA的DNA片段(图8)。
6-3.“转录盒”连接法
接着,将5个如上所述制作的连接2个cDNA的DNA片段连接在一起,制作搭载共计10个cDNA的DNA(图7、图8、图9)。就实施例而言,将在上述6-2.中制作的连接有2个cDNA的DNA片段用被称为SapI的限制性酶酶切后进行分离。由SapI酶切的DNA的切面在5ˊ侧具有3个碱基突出的结构,通过将这3个碱基的序列任意设定,可选择4×4×4=64种切面(图7)(图9)。因此,可以将5个DNA片段按照设计正确结合并作为一个DNA分子回收(图9)。此时,对于搭载的基因的cDNA,设计成除了不包含限制性酶A、限制性酶B、限制性酶C、限制性酶D的识别序列之外,还不包含SapI的识别序列(图7)。
这样的具有在切面生成如NN或NNN表示的序列中的任意的单链突出端的性质的限制性酶并不限于SapI,通过BbsI、BbvI、BcoDI、BfuAI、BsaI、BsmBI、BsmFI、BtgZI、EarI、FokI、HgaI、SfaNI等多种限制性酶也可得到同样结果。另外,在识别序列内部具有不规则序列的AlwNI、BglI、BstAPI、BstXI、DraIII、SfiI等也可得到同样效果。另外,此阶段不必利用使用限制性酶的克隆也是可以的,也可利用使用同源重组的方法(In-Fusion HD克隆***(TAKARA-Bio,Inc.)或Gibson组装***(New England Biolabs,Inc.))。另外,将10个cDNA结合后组装至环状质粒DNA中的阶段即使不使用实施例所示的通过同源重组组装至pDONR-221等的方法(Gateway System(Life Technologies,Inc.)),也可借助使用通常的T4DNA连接酶进行共价结合的方法。另外,通过如图9所示的方法,可制作搭载1个至10个任意基因的DNA分子。
6-4.外源基因表达量的调节
一般而言,已知在包含分别编码一组RNA依赖性RNA合成酶(PolS、PolL)、单链RNA结合蛋白(N)、调节RNA合成酶活性的蛋白质(C)的基因的负链单链RNA基因表达***中,在***多个外源基因的情况下,越接近上游的3ˊ末端侧,表达量越多。本发明的隐身型RNA基因表达***也具有同样的倾向。就本发明而言,可以将多个外源基因按照任意顺序组装成盒状,因此,可以简单地使各个基因按照想要获得的表达量依次排列。另外,由各个基因制作的蛋白质的表达量通过改变翻译效率来进行调节也是可能的(图20)。
7.隐身型RNA的合成
接着,将上述6.所制作的连接10个cDNA的DNA片段与按照前述5.所记载的方法针对人类细胞进行密码子优化(以下称为“人源化”,在各蛋白质的缩写前附加h进行标记)的编码单链RNA结合蛋白的基因(hN)、编码调节RNA合成酶活性的蛋白质的基因(hC)、编码RNA依赖性RNA合成酶的基因(hPolL、hPolS)进行连接,制作用于合成隐身型RNA的环状模板cDNA(图10)。隐身型RNA的结构可以通过RNA聚合酶所识别的启动子的位置从负链和正链中进行选择。此处,将与由搭载于隐身型RNA上的基因表达的mRNA为相同方向的RNA定义为正链,将与mRNA为互补方向的RNA定义为负链,在图10中例示了用于使用T7RNA聚合酶合成负链RNA的模板的制作。从T7启动子(非专利文献50)的下游侧配置为了切割RNA而制作正确末端的源自人类D型肝炎病毒的反基因组的核酶(非专利文献51)和T7RNA聚合酶的转录终止信号(非专利文献50),使之可合成与隐身型RNA全长相当的RNA。在RNA合成中使用的酶并不限于T7RNA聚合酶,如果是可在大肠杆菌或动物细胞中使用的DNA依赖性RNA聚合酶,可使用任何种类的酶。例如,源自大肠杆菌T3噬菌体的T3RNA聚合酶(非专利文献52)或源自沙门氏菌SP6噬菌体的SP6RNA聚合酶(非专利文献53)也可以与这些酶所识别的启动子和转录终止位点组合进行使用。另外,核酶是为了正确切割RNA的3ˊ末端而使用,并不限于实施例的源自人类D型肝炎病毒的反基因组的核酶,也可使用源自人类D型肝炎病毒的基因组的核酶(非专利文献51)或者烟草环斑病毒的发夹状核酶(非专利文献54),进一步也可使用可在细胞内对RNA进行切割的短抑制RNA(short inhibitory RNA,siRNA)(专利文献55)。
另外,与隐身型RNA全长互补的cDNA被克隆至具有源自p15A的复制起点的质粒(非专利文献56)。由于在大肠杆菌中是以低拷贝数的状态维持,具有源自p15A的复制起点的质粒不仅对于使大DNA片段在大肠杆菌中稳定地保持是有利的,而且在用于重构隐身型RNA基因表达***的方法2中,使该质粒与具有源自ColE1的复制起点的N蛋白表达质粒在大肠杆菌中共存是可能的(非专利文献56)。就实施例而言,在具有源自p15A的复制起点的质粒上搭载氨苄青霉素抗性,在具有源自ColE1的复制起点的质粒上搭载卡那霉素抗性,通过氨苄青霉素和卡那霉素的双重选择将2个质粒维持在同一大肠杆菌内,然而,抗生素的组合并不限于该示例。另外,质粒的组合也可使用具有替代源自p15A的复制起点的源自F因子的复制起点的质粒、具有替代源自ColE1的复制起点的源自pUC的复制起点的质粒。
8.隐身型RNA基因表达***的重构
8-1.现有形式的重构法
由负单链RNA以及与该RNA结合的蛋白质构成的隐身型RNA基因表达***的重构可通过两种方法进行。第一种方法是通过已知作为已经具有负单链RNA基因组的病毒以及利用该病毒的载体的重构法的技术,将与负单链RNA互补的正单链RNA使用T7RNA聚合酶在动物细胞内表达,同时,通过使NP(N)、P(PolS)、L(PolL)这3个蛋白质在该细胞内表达而重构正链RNA的隐身型RNA基因表达***(图11)(非专利文献57、专利文献3)。就该方法而言,优点是仅通过使用稳定地表达T7RNA聚合酶的动物细胞,将作为材料的质粒DNA导入细胞便可重构,十分便利。另一方面,已知因为是将包含用于合成正单链RNA的模板cDNA的质粒与搭载有表达NP、P、L这3个蛋白质的基因的3个质粒同时导入细胞,所以这些DNA分子之间经常发生基因重组,在想要制作的负单链RNA结构中***突变(非专利文献57)。另外,在专利文献3的实施例中,为了提高重构效率,进一步追加表达M、F、HN蛋白的质粒。
8-2.本发明开发的重构法
就第二种方法而言,首先在大肠杆菌中制作负单链RNA和具有单链RNA结合能力的NP蛋白(N)的复合体,将该复合体导入表达P(PolS)蛋白和L(PolL)蛋白的动物细胞,重构隐身型RNA基因表达***(图12)。在该方法中,首先,分别通过T7RNA聚合酶由在大肠杆菌中可共存的2个质粒合成编码N蛋白的mRNA和隐身型RNA,通过在大肠杆菌内同时表达单链RNA结合蛋白(N)和隐身型RNA来制作复合体。将从天然存在的RNA病毒分离的RNA-蛋白质复合体作为材料重构RNA病毒的方法在非专利文献58中公开,然而,就此次开发的方法而言,将通过基因重组技术合成的隐身型RNA作为材料进行重构成为可能。与第一种方法相比,此方法具有步骤较多且复杂的缺点,然而,通过使用与同源重组相关的基因(RecA)和编码RNA分解酶的基因(RNaseE)被破坏的大肠杆菌(非专利文献59),可以在没有在基因组RNA中引入突变的情况下重构隐身型RNA基因表达***。
也就是说,本发明开发的隐身型RNA基因表达***的重构法是在表达T7RNA聚合酶的宿主细胞内事先制作负单链RNA与具有单链RNA结合能力的蛋白质(例如NP蛋白(N))的复合体,将该复合体导入表达RNA依赖性RNA合成酶(例如P(PolS)蛋白和L(PolL)蛋白)的动物细胞来重构隐身型RNA基因表达***的方法。作为宿主细胞优选使用RecA基因和RNaseE基因被破坏且表达T7RNA聚合酶的大肠杆菌。
接着,使用按照上述7.所记载的方法合成的搭载10个基因的隐身型RNA,通过前述8.所记载的任一种方法构建隐身型RNA基因表达***(图13)。如此操作制作的具有负单链RNA的基因表达***可持续地表达所搭载的全部10个基因,这可通过稳定地表达3种耐药性特性(嘌呤霉素抗性、博来霉素抗性、潮霉素抗性)、4种荧光蛋白(EGFP、E2-Crimson、EBFP2、Keima-Red)、3种萤光素酶(萤火虫萤光素酶、海肾萤光素酶、夜光海萤(Cypridinanoctiluca)萤光素酶)进行确认(图14)。
8-3.隐身型RNA基因表达***中RNA结合蛋白(hN、hC、hPol)基因的连接顺序
在本发明的隐身型RNA基因表达***中,编码单链RNA结合蛋白的基因(hN)、编码调节RNA合成酶活性的蛋白质的基因(hC)、编码RNA依赖性RNA合成酶的基因(hPolS)在隐身型RNA上的位置并不限定于如图13所示的从3ˊ末端侧开始的所谓hN-hC-hPolS的顺序。例如,即使替换为如hN-hPolS-hC或hPolS-hN-hC这样的顺序,也可构建隐身型RNA基因表达***(图16)。
8-4.隐身型RNA基因表达***中的源自病毒的蛋白质基因中的突变的必要性
另外,在该隐身型RNA基因表达***中,在由编码单链RNA结合蛋白的人源化基因(hN)、编码调节RNA合成酶活性的蛋白质的人源化基因(hC)、编码RNA依赖性RNA合成酶的人源化基因(hPolS、hPolL)表达的蛋白质中,不需要存在特别的突变。
如前述3-3.所述,在现有技术中,作为避免先天免疫机制的方法,导入对源自病毒的RNA依赖性RNA合成酶基因等的PAMP活性进行抑制的突变作为最有效的方法而被使用。
但是,在本发明中,借助前述5.所示的方法将源自病毒的蛋白质基因通过全部密码子优化来去除PAMP活性,因此,不需要事先向源自病毒的蛋白质中导入蛋白质水平的突变。例如,即使是在使用表达源自作为已知具有强干扰素诱导能力的野生型副粘病毒的仙台病毒Z株的NP、P、C和L蛋白的基因的情况下,也可通过前述5.所示的方法进行优化,从而可作为隐身型RNA基因表达***的材料使用。例如,作为在图16中以“hPol”表示的表达L蛋白的基因,将源自Z株的基因序列针对人类细胞进行优化而使用。
9.对于先天免疫机制诱导活性的验证
9-1.与现有技术避免先天免疫机制激活的效果的比较
接着,对于基因导入时诱导先天免疫机制的活性,为了将搭载隐身型RNA基因表达***的隐身型RNA载体与现有技术进行比较,制作了非专利文献7的图1B所描述的作为现有技术的持续表达型仙台病毒载体以及搭载完全相同的4个基因(Keima-Red、杀稻瘟菌素S抗性基因、EGFP、Kusabira-Orange)的隐身型RNA载体。使用这2种载体向人类原代培养成纤维细胞中导入基因,将24小时后的干扰素βmRNA的量用Real-Time PCR法进行定量(图17)。其结果是,就隐身型RNA载体而言,尽管没有搭载抑制先天免疫机制的V基因,诱导也被控制在正常细胞中的干扰素βmRNA的量的5倍以内。另一方面,就现有技术而言,即使保有V基因,仍观察到正常细胞47倍的诱导(图17)。从该结果可知,就隐身型RNA基因表达***而言,即使在不存在抑制先天免疫机制的因子的条件下,也可避免先天免疫机制的激活。
9-2.进一步的先天免疫机制激活的避免
诱导先天免疫机制的活性也受到保有隐身型RNA基因表达***的细胞的种类以及来自于隐身型RNA基因表达***的基因表达的强度的影响。例如,源自人类的HeLa细胞中几乎不诱导干扰素β,与之相对,同样源自人类的293细胞中则强烈诱导。另外,为了制造生物医药品,基因表达越强,干扰素β的诱导也越强。在使用隐身型RNA基因表达***制造生物医药品的情况下,由干扰素诱导的细胞质的腺苷脱氨酶(作用于RNA的腺苷脱氨酶,ADAR1)的活性所造成的RNA基因组的突变(非专利文献39)成为问题,因此,期望进一步抑制在隐身型RNA基因表达***中残存的先天免疫机制诱导活性。
此目标可通过在隐身型RNA基因表达***中追加搭载抑制先天免疫机制的因子而实现(图18、图19)。作为这样的因子,可列举存在于细胞质中的“对于病原微生物而言的特征性分子模式(病原体相关分子模式,PAMP)”受体RIG-I的缺失变体(RIG-IC)(非专利文献71)、仙台病毒V蛋白的C末端区域(非专利文献72)、蛋白酶体的构成成分PSMA7(非专利文献73)等。
10.基因表达水平的调节
接着,探讨了通过调节搭载于该载体上的与转录、复制相关的因子的表达,在隐身型RNA基因表达***中的基因表达水平会怎样发生变化(图20、图21)。另外,在图20中以正链RNA序列进行标记。各个因子的表达可通过改变由mRNA翻译为蛋白质的效率进行调节。另外,使翻译效率变化最简单的方法是变更紧接翻译起始密码子(AUG)上游的5ˊ非编码序列。认为在动物细胞中翻译效率最高的是恰好在AUG前方具有所谓5ˊ-CCACC-3ˊ(序列号18)的结构的情况(非专利文献60)。另一方面,通过在5ˊ上游侧***短编码区,可使翻译效率降低(非专利文献61)。在实施例中,制作将RNA依赖性RNA聚合酶(hPolS和hPolL)的表达控制为一定水平并将单链RNA结合蛋白(hN)和调节RNA合成酶活性的蛋白质(hC)的表达分别抑制为40%和23%的载体,将所搭载的萤火虫萤光素酶的表达进行比较(图20)。其结果是,通过抑制hN和hC中任一种的表达,所搭载的萤光素酶基因的表达升高,通过将hN和hC的表达抑制进行组合,观察到最大79倍的基因表达的升高。
这样的基因表达水平的调节可仅通过对调节RNA合成酶活性的蛋白质(hC)的表达水平进行调节来进行(图21)。在此情况下,即使缺失hC基因,也可重构隐身型RNA基因表达***,因为基因表达水平成为最大,所以hC基因并不是隐身型RNA基因表达***的必需要素。但是,搭载基因的表达过强,则细胞增殖被强烈抑制,因此,将hC蛋白表达为适当水平并实现符合目标的基因表达是具有实用性的。
作为基因表达***中的重要性质,可列举可以根据目的选择最适当的表达水平。例如,在细胞重编程中,转录因子的表达过强,则诱导细胞死亡。另外,在生物医药品的制造中,表达弱,则生产效率降低。一般来说,在使用RNA病毒的基因表达***中改变载体的表达水平是困难的,然而,隐身型RNA基因表达***可以通过微调节各个构成成分的表达平衡,根据使用目的来自由地改变表达强度。
接着,尝试将如此完成的隐身型RNA基因表达***封入内部,制作可向各种动物细胞导入隐身型RNA基因表达***的载体颗粒。使用在细胞质中具有隐身型RNA基因表达***的BHK细胞,使用强SRα启动子使副粘病毒的M、F、HN这3种蛋白质表达,则在细胞的培养上清液中检测到具有基因导入活性的载体颗粒。其感染价约为107感染单元/mL,得到与现有形式的持续表达型仙台病毒载体同等的高活性。此载体颗粒通过F和HN蛋白的活性吸附在细胞表面,可通过膜之间的融合将内容物,即隐身型RNA基因表达***导入细胞质中。此过程不需要细胞***,因此,不进行细胞***的细胞也可进行基因导入。
另外,可导入的细胞的细胞特异性、种特异性由所使用的F和HN蛋白的来源决定,然而,在使用仙台病毒的F和HN蛋白的情况下,可以向包括外周血的血液细胞在内的非常广范的人类细胞和动物细胞中进行基因导入。
11.载体的去除
另外,就现有技术的持续表达型仙台病毒载体而言,通过以siRNA抑制RNA依赖性RNA聚合酶的活性,成功地迅速去除了载体(专利文献3、非专利文献7)。因此,探讨了在隐身型RNA基因表达***中可否以同样的方法去除(图23)。隐身型RNA基因表达***所具有的人源化RNA依赖性RNA聚合酶(hPolL)的碱基序列与现有技术的持续表达型仙台病毒载体不同,因此,合成了三种新siRNA,探讨其活性。其结果是,确认使用三种中的一种siRNA(目标序列为序列号46),可与现有技术同样地去除(图23)。如上所述,可知本发明的隐身型RNA基因表达***可应用以往的持续表达型仙台病毒载体所使用的通过RNAi去除载体的方法。同样地,也可应用使用microRNA(miRNA)的去除方法,例如,如专利文献3所记载的,通过在外源基因的3ˊ非编码区或5ˊ非编码区***microRNA(miRNA)的目标序列,与内源性miRNA反应而去除也是可能的。
12.本发明的隐身型RNA表达***的用途
在本发明的隐身型RNA表达***中使用的负单链隐身性RNA载体中,可搭载源自人类的基因等任意基因6个以上,进一步可达10个,可搭载长度为5,000个碱基长度,进一步可达15,000个碱基长度。
并且,因为具有可在人类细胞等动物细胞中避免先天免疫机制激活的隐身性,并且载体的去除也可简单地进行,所以,可以考虑必须同时导入多个基因的细胞重编程技术、包含巨大基因的基因治疗、再生医疗、生物医药品的制造等广泛的用途。
具体而言,可以考虑以下实施方式。
(1)在高效率地制作使用于再生医疗的临床用高品质iPS细胞的技术中的应用。
在搭载用于对人类细胞等动物细胞进行重编程的6个以上基因,例如用于iPS细胞转换的山中4因子(KLF4、OCT4、SOX2、c-Myc)+BRG1+BAF155这6个基因的情况下,成为13,132个碱基长度。另外,在搭载OCT4、KLF4、SOX2、c-MYC、NANOG、LIN28这6个基因的情况下,成为7,000个碱基长度。
实际上,将这6个基因搭载于本发明的隐身性RNA载体上(图25)并在人类胎儿成纤维细胞中使之表达时,得到实现超过40%的初始化效率这样的结果(实施例21)。另外,确认此时山中4因子(KLF4、OCT4、SOX2、c-Myc)的搭载顺序可适当改变(数据未显示)。
另外,将人类外周血细胞作为材料,在不含动物成分(Xeno-free)、不使用饲养细胞(Feeder-free)的条件下进行同样实验的结果是,同样地,也可得到比现有方法进行更高初始化的结果(数据未显示)。
另外,在KLF4、OCT4、SOX2、c-MYC这4个基因上,搭载编码染色质重构因子的CHD1基因(合计9,907个碱基长度),进一步追加编码DNA去甲基化酶的TET1基因(合计11,203个碱基长度),也可提高初始化效率。
作为其它可能的组合,进一步使将2种***特异性组蛋白组合的8个基因在人类体细胞中表达,高效率地制作人类iPS细胞是可能的。
(2)利用直接重编程技术从人类组织细胞(血液、皮肤、胎盘等)制作神经细胞、神经干细胞、干细胞、胰脏β细胞等的有用基因的再生医疗中的应用。
例如,在将人类成纤维细胞重编程为运动神经的技术中,在被称为LHX3、ASCL1、BRN2、MYT1L的4个基因上追加被称为HB9、ISL1、NGN2的3个基因,合计可搭载7个基因(9,887个碱基长度)。
(3)由多个亚基构成的生物医药品的制造。
本发明对于用于生产作为巨大基因、并且需要亚基在同一细胞中同时表达、并且还需要调节各亚基的表达量的免疫球蛋白G、M是有用的。
实际上,在本发明的隐身性RNA载体上搭载人类免疫球蛋白的H(μ)链基因、L(κ、λ)链基因以及J基因(图24),使用BHK细胞制造了人类免疫球蛋白M(实施例22)。此时,通过在搭载基因的顺序上下功夫,成功使H链:L链:μ链以约为1:1:0.2的比例进行表达。
另外,在本发明的隐身性RNA载体上搭载人类免疫球蛋白的4个cDNA(2个H链和2个L链),成功表达了人类双重特异性抗体(实施例23)。
(4)在由多个亚基构成的药物研发靶标蛋白质的表达中的应用。
例如,通过将gp91phox、p22phox、Rac、p47phox、p67phox、p40phox这6个亚基搭载于本发明的隐身性RNA载体上并使之同时表达,可表达药物研发靶标酶NADPH氧化酶(Nox2)。
(5)在疾病的致病基因是巨大基因的情况下,在本发明的隐身性RNA载体中搭载这些巨大基因使之持续表达,作为这些疾病的基因治疗用载体的应用。
具体而言,可将血友病A的致病基因产物血液凝固因子VIII的cDNA(7053个碱基长度)或杜氏肌肉营养不良症的致病基因产物肌养蛋白的cDNA(11058个碱基长度)搭载于本发明的隐身性RNA载体上(图24)来使用。
实施例
以下通过实施例对本发明进行更为详细的说明,然而,本发明并不限定于这些实施例。
本发明中的其它用语和概念是以该技术领域中惯常使用的用语的意思为基础的用语和概念,为了实施本发明而使用的各种技术,除了特别明示其出处的技术之外,基于公知的文献等,只要是本领域技术人员就可容易且确实地实施。另外,各种分析等根据使用的分析仪器或试剂、试剂盒的使用说明书、目录等所记载的方法进行。
另外,本说明书中引用的现有技术文献、专利公报和专利申请说明书中的记载内容作为本发明的记载内容而被参考。
实施例1:搭载10个外源基因的DNA片段的制作(1)
通过PCR以使之成为Acc65I-cDNA-XhoI的结构的方式对以下基因进行扩增后进行亚克隆(图7)。
1)萤火虫萤光素酶(Firefly Luciferase):(GenBank登录号AY738224);
2)海肾萤光素酶(Renilla Luciferase):(GenBank登录号AY738228);
3)增强型绿色荧光蛋白(EGFP):(GenBank登录号U55761);
4)嘌呤霉素抗性基因(针对人类细胞进行密码子优化并合成):非专利文献62,序列号47;
5)夜光海萤萤光素酶:非专利文献63(GenBank登录号AB177531);
6)E2-Crimson:源自pE2-Crimson(Clontech Laboratories,Inc.),序列号48;
7)增强型蓝色荧光蛋白2(EBFP2):非专利文献64(GenBank登录号EF517318);
8)博来霉素抗性基因(针对人类细胞进行密码子优化并合成):非专利文献65,序列号49;
9)dKeima-Red:非专利文献66(GenBank登录号AB209968);
10)潮霉素B抗性基因(针对人类细胞进行密码子优化并合成):非专利文献67,序列号50。
实施例2:搭载10个外源基因的DNA片段的制作(2)
接着,制作以下质粒。
另外,本实施例中使用的核酸都是DNA片段,对于序列号1或序列号4等在序列表中作为负链RNA序列被指定的序列是指对应的DNA序列。在使用DNA片段的其它实施例中也同样如此。
1)质粒#1:
在质粒LITMUS38i(New England BioLab,Inc.)的ApaI酶切位点与StuI酶切位点之间克隆具有以下结构的DNA:SapI酶切位点-attB1(序列号51)-序列号1-序列号24-Acc65I酶切位点-SalI酶切位点-序列号25-序列号4-ctt-序列号1-序列号26-BsiWI酶切位点-XhoI酶切位点-序列号27-序列号4-SapI酶切位点。
2)质粒#2:
在质粒LITMUS38i的ApaI酶切位点与StuI酶切位点之间克隆具有以下结构的DNA:SapI酶切位点-序列号1-序列号28-Acc65I酶切位点-SalI酶切位点-序列号29-序列号4-ctt-序列号1-序列号30-BsiWI酶切位点-XhoI酶切位点-序列号31-序列号4-SapI酶切位点。
3)质粒#3:
在质粒LITMUS38i的ApaI酶切位点与StuI酶切位点之间克隆具有以下结构的DNA:SapI酶切位点-序列号1-序列号32-Acc65I酶切位点-SalI酶切位点-序列号33-序列号4-ctt-序列号1-序列号34-BsiWI酶切位点-XhoI酶切位点-序列号35-序列号4-SapI酶切位点。
4)质粒#4:
在质粒LITMUS38i的ApaI酶切位点与StuI酶切位点之间克隆具有以下结构的DNA:SapI酶切位点-序列号1-序列号36-Acc65I酶切位点-SalI酶切位点-序列号37-序列号4-ctt-序列号1-序列号38-BsiWI酶切位点-XhoI酶切位点-序列号39-序列号4-SapI酶切位点。
5)质粒#5:
在LITMUS38i的ApaI酶切位点与StuI酶切位点之间克隆具有以下结构的DNA:SapI酶切位点-序列号1-序列号36-Acc65I酶切位点-SalI酶切位点-序列号37-序列号4-ctt-序列号1-序列号38-BsiWI酶切位点-XhoI酶切位点-序列号39-序列号4-attB2(序列号52)-SapI酶切位点。
实施例3:搭载10个外源基因的DNA片段的制作(3)(参见图8)
接着,制作以下质粒。
1)质粒#1C
在质粒#1的Acc65I-SalI之间克隆包含萤火虫萤光素酶基因的Acc65I-XhoI片段,制作质粒#1B。进一步地,在质粒#1B的BsiWI-XhoI之间克隆包含海肾萤光素酶基因的Acc65I-XhoI片段,制作质粒#1C。
2)质粒#2C
在质粒#2的Acc65I-SalI之间克隆包含EGFP基因的Acc65I-XhoI片段,制作质粒#2B。进一步地,在质粒#2B的BsiWI-XhoI之间克隆包含嘌呤霉素抗性基因的Acc65I-XhoI片段,制作质粒#2C。
3)质粒#3C
在质粒#3的Acc65I-SalI之间克隆包含夜光海萤萤光素酶基因的Acc65I-XhoI片段,制作质粒#3B。进一步地,在质粒#3B的BsiWI-XhoI之间克隆包含E2-Crimson基因的Acc65I-XhoI片段,制作质粒#3C。
4)质粒#4C
在质粒#4的Acc65I-SalI之间克隆包含EBFP2基因的Acc65I-XhoI片段,制作质粒#4B。进一步地,在质粒#4B的BsiWI-XhoI之间克隆包含博来霉素抗性基因的Acc65I-XhoI片段,制作质粒#4C。
5)质粒#5C
在质粒#5的Acc65I-SalI之间克隆包含dKeima-Red基因的Acc65I-XhoI片段,制作质粒#5B。进一步地,在质粒#5B的BsiWI-XhoI之间克隆包含潮霉素B抗性基因的Acc65I-XhoI片段,制作质粒#5C。
实施例4:搭载10个外源基因的DNA片段的制作(4)(参见图9)
将从质粒#1C使用SapI切出的包含萤火虫萤光素酶基因和海肾萤光素酶基因的DNA片段100ng、从质粒#2C使用SapI切出的包含EGFP基因和嘌呤霉素抗性基因的DNA片段100ng、从质粒#3C使用SapI切出的包含夜光海萤萤光素酶基因和E2-Crimson基因的DNA片段100ng、从质粒#4C使用SapI切出的包含EBFP2基因和博来霉素抗性基因的DNA片段100ng、从质粒#5C使用SapI切出的包含dKeima-Red基因和潮霉素B抗性基因的DNA片段100ng,共计500ng,溶解于5μL H2O中,混合5μL Ligation-Convenience Kit(NIPPON GENE Co.,Ltd.),使之在16℃反应60分钟。纯化后,溶解于7μL H2O中,加入1μL质粒#6(pDONR-221,LifeTechnologies,Inc.)(150ng)和2μL BP Clonase2(Life Technologies,Inc.),使之在25℃反应2小时,然后导入大肠杆菌DH-5α,分离卡那霉素抗性菌落,制作质粒#7。
实施例5:制造搭载10个外源基因的隐身型RNA的模板DNA的制作(参见图10)
质粒#8是将具有p15A的复制起点的质粒pACYC177(非专利文献56)的卡那霉素抗性基因使用pDONR-221的包含attB1-氯霉素抗性基因-attB2的DNA片段进行置换而制作的。在通过OptimumGen基因设计***优化的包含hN-hC-hPolS的DNA(序列号53)的5ˊ侧依次连接attB1、T7终止子和HDV核酶的DNA片段由GenScript公司合成。同样地,合成了在通过OptimumGen基因设计***优化的包含hPolL的DNA(序列号54)的3ˊ侧连接T7启动子和attB2的DNA。将使用BamHI和XmaI切出的依次包含attB1-T7终止子-HDV核酶-hN-hC-hPolS的DNA片段100ng、使用XmaI和NotI从质粒#7切出的包含10个基因的DNA片段100ng、使用NotI和SalI切出的依次包含hPolL-T7启动子-attB2的DNA片段100ng,共计300ng,溶解于5μL H2O中,混合5μL Ligation-Convenience Kit,使之在16℃反应60分钟。纯化后,溶解于7μL H2O中,加入1μL质粒#8(150ng)和2μL BP Clonase2,使之在25℃反应16小时,然后导入大肠杆菌HST-08(Takara Bio Co.),分离氨苄青霉素抗性菌落,制作成为合成负链隐身型RNA的模板的质粒#9B。
合成正链隐身型RNA的模板DNA是将T7启动子与T7终止子互换而制作的。具体而言,将依次包含attB1-T7启动子-hN-hC-hPolS的DNA片段100ng、使用XmaI和NotI从质粒#7切出的包含10个基因的DNA片段100ng、使用NotI和SalI切出的依次包含hPolL-HDV核酶-T7终止子-attB2的DNA片段100ng,共计300ng,溶解于5μL H2O中,混合5μL Ligation-Convenience Kit,使之在16℃反应60分钟。纯化后,溶解于7μL H2O中,加入1μL质粒#8(150ng)和2μL BP Clonase2,使之在25℃反应16小时,然后导入大肠杆菌HST-08,分离氨苄青霉素抗性菌落,制作成为合成正链隐身型RNA的模板的质粒#9A。
实施例6:搭载10个外源基因的隐身型RNA基因表达***的重构(方法1)(参见图11)
方法1根据专利文献3和非专利文献7所描述的方法进行。
具体而言,作为BHK/T7/151M(SE)细胞,按照以下方法制作稳定表达T7RNA聚合酶和M蛋白的源自仓鼠的BHK-21细胞。BHK-21细胞从日本理化学研究所生物资源中心获得。将T7RNA聚合酶基因(非专利文献74)针对动物细胞进行密码子优化后合成的cDNA(序列号77)搭载于反转录病毒载体pCX4neo(非专利文献75,GenBank登录号AB086385)上,导入BHK-21细胞后,通过包含800μg/mL G-418的含有10%FCS的DMEM培养基进行选择,得到BHK/T7细胞。接着,将仙台病毒温度敏感型突变株Clone 151株的M基因(GenBank登录号NM_011046)搭载于反转录病毒载体pCX4pur(非专利文献75,GenBank登录号AB086386)上,导入BHK-21/T7细胞后,通过包含200μg/mL嘌呤霉素的含有10%FCS的DMEM培养基进行选择,得到BHK/T7/151M(SE)细胞。
重构中使用的表达载体通过以下方法制作。NP蛋白表达质粒pCMV-NP、P蛋白表达质粒pCMV-P、L蛋白表达质粒pCMV-L、小鼠弗林蛋白酶(Furin)表达质粒pCMV-Furin是将仙台病毒Z株的NP基因、P基因、L基因(GenBank登录号M30202.1)和小鼠弗林蛋白酶cDNA(非专利文献76,GenBank登录号NM_011046)连接至巨细胞病毒的立即早期基因(immediateearly gene)的增强子、启动子(非专利文献77)下游而制作的。F和HN蛋白表达质粒pSRD-HN-Fmut(非专利文献78)是将仙台病毒Z株的F和HN基因连接至SRα启动子(非专利文献79)下游的质粒。pMKIT-151M是在SRα启动子的下游连接仙台病毒温度敏感型突变株Clone 151株的M基因而制作的。
将稳定表达M蛋白的BHK/T7/151M(SE)细胞按照5×105细胞/孔接种于6孔板,培养24小时后洗净。将质粒#9A、NP蛋白表达质粒pCMV-NP、P蛋白表达质粒pCMV-P、L蛋白表达质粒pCMV-L、F和HN蛋白表达质粒pSRD-HN-Fmut、小鼠弗林蛋白酶表达质粒pCMV-Furin分别按照2μg、1μg、1μg、1μg、2μg、20ng的用量比悬浮于300μL OptiMEM(Life Technologies,Inc.)中,将与包含10μL Lipofectamine LTX(Life Technologies,Inc.)的300μL OptiMEM混合并在室温放置20分钟的培养基添加至细胞,培养4小时。将细胞再度洗净后,添加含有10%FCS的DMEM培养基,进一步在32℃培养3天。之后,将细胞移至包含300μg/mL潮霉素B的含有10%FCS的DMEM培养基继续培养,分离BHK/#9A细胞。通过EGFP和Keima-Red的表达确认了引起隐身型RNA基因表达***重构的事实。
实施例7:搭载10个外源基因的隐身型RNA基因表达***的重构(方法2)(参见图12)
作为RecA和RNaseE的双重缺陷突变株的大肠杆菌E-AIST7株是依次将大肠杆菌BL21(DE3)株(非专利文献68)的RNase E基因和Rec A基因破坏进行制作的。在RNase E基因中将RNase E C末端的缺陷突变(rne131)导入(非专利文献59),在Rec A基因中将完全缺陷突变导入。基因破坏使用Gene Bridges GmbH公司的Quick&Easy大肠杆菌基因删除试剂盒(E.coli Gene Deletion Kit),根据该试剂盒的实验规程进行。在大肠杆菌中表达单链RNA结合蛋白(N)的质粒#10是通过在质粒pET-24a(+)(Merck KGaA)上搭载针对大肠杆菌进行密码子优化的N基因(eN)(序列号55)进行制作的。
在大肠杆菌E-AIST7株中导入质粒#9B和质粒#10,通过氨苄青霉素和卡那霉素进行选择,制作E-AIST7/N/9B株。将E-AIST7/N/9B株在30℃培养,当达到OD600=0.3时,加入0.5mM IPTG,诱导T7RNA聚合酶的表达,培养3小时,回收大肠杆菌。将回收的菌悬浮于10mL10%蔗糖、50mM Tris-HCl(pH7.5)、2mM MgCl2中,加入150千单位(kunits)重组溶菌酶(rLysozome)(Merck KGaA)和25单位全能核酸酶(Benzonase)(Merck KGaA)后,在30℃处理30分钟,回收原生质体。将原生质体使用50mM Tris-HCl(pH7.5)、2mM MgCl2、50mM CHAPS进行破坏后,将4,500rpm 10分钟的离心上清液使用Beckman SW41Ti转子以25,000rpm离心60分钟,将RNA-N蛋白复合体作为沉淀物进行回收。进一步将RNA-N蛋白复合体悬浮于28%氯化铯溶液,使用Beckman SW41Ti转子以37,000rpm离心45小时,纯化了RNA-N蛋白复合体。
将BHK/T7/151M(SE)细胞以5×105细胞/孔接种于6孔板,培养24小时后,将P蛋白表达质粒pCMV-P、L蛋白表达质粒pCMV-L各1μg通过Lipofectamine LTX导入。再经24小时后,将5μg RNA-N蛋白复合体与10μL Pro-DeliverIN试剂(OZ Biosciences)混合,导入细胞。从24小时后开始,将细胞移至包含300μg/mL潮霉素B的含有10%FCS的DMEM培养基中继续培养,分离BHK/#9A2细胞。通过EGFP和Keima-Red的表达确认了引起隐身型RNA基因表达***重构的事实。
实施例8:搭载10个外源基因的隐身型RNA载体#1的制作
对于5.0×105个BHK/#9A细胞(或BHK/#9A2细胞),将作为缺陷基因表达质粒的pMKIT-151M、pSRD-HN-Fmut、pCMV-Furin按照2μg、2μg、30ng的比例使用Lipofectamine LTX进行导入,4小时后洗净细胞后,加入含有10%FCS的DMEM培养基,进一步在32℃培养4天。之后,回收包含隐身型RNA载体#1(图13)的培养上清液,使用0.45μm的过滤器过滤后,如果需要,可通过超离心法浓缩载体。将载体悬浮液在液氮中急速冷冻,在-80℃保存。载体的活性使用源自猴肾脏的LLCMK2细胞由抗NP蛋白抗体通过间接荧光抗体法进行检测(非专利文献7)。由此方法得到的隐身型RNA载体的感染价为约107感染单元/mL,得到与现有形式的持续表达型仙台病毒载体同等或其以上的活性。
实施例9:通过搭载10个外源基因的隐身型RNA载体进行的基因表达(参见图14)
将实施例8制作的隐身型RNA载体#1以感染复数(MOI)=3感染HeLa细胞,通过包含100μg/mL潮霉素B的含有10%FCS的DMEM培养基进行选择,建立HeLa/#9细胞。该细胞的抗药性能通过嘌呤霉素(1.5μg/mL)、博来霉素(100μg/mL)、潮霉素B(100μg/mL)、G418(800μg/mL)、杀稻瘟菌素S(10μg/mL)进行选择,生存率通过菌落分析进行测定。阴性对照的HeLa细胞对这些抗生素都具有敏感性,与之相对,HeLa/#9细胞对嘌呤霉素、博来霉素、潮霉素B选择性地显示抗性,确认对这3种试剂表达抗性特性(图14,上部)。
HeLa/#9细胞中的荧光蛋白表达通过流式细胞仪(Gallios,Beckman Coulter)进行计测。各荧光蛋白的观察条件如下。EBFP2:激发405nm,检测450nm;Keima-Red:激发405nm,检测620nm;EGFP:激发488nm,检测530nm;E2-Crimson:激发638nm,检测660nm。与不保有载体的HeLa细胞相比,确认HeLa/#9细胞显著表达4个荧光蛋白(图14,中部)。
HeLa/#9细胞中的萤光素酶表达使用以下试剂通过照度计(Promega,Corp.)检测发光。萤火虫萤光素酶和海肾萤光素酶:双荧光素酶报告子检测***(Dual-LuciferaseReporter Assay System)(Promega,Corp.);夜光海萤萤光素酶:BioLux海萤萤光素酶分析试剂盒(Cypridina Luciferase Assay Kit)(New England Biolabs,Inc.)。不保有载体的HeLa细胞未检测到任一种萤光素酶的活性,然而,HeLa/#9细胞检测到萤光素酶的高活性(图14,下部)。
实施例10:搭载10个外源基因的隐身型RNA载体#2(图15)的制作
除了将在模板cDNA制作中使用的hN、hC、hPolS、hPolL基因通过GeneGPS表达优化技术进行优化并将hN、hC、hPolS这3个基因按照hN-hPolS-hC的顺序搭载之外,使用与实施例8所记载的方法同样的方法制作载体,并按照实施例9所记载的方法进行验证。在包含hN-hPolS-hC的DNA(序列号78)的5ˊ侧依次连接attB1和T7启动子的DNA片段由DNA 2.0公司合成。同样地,在包含hPolL的DNA(序列号79)的3ˊ侧连接HDV核酶、T7终止子和attB2的DNA片段由DNA 2.0公司合成。
实施例11:搭载10个外源基因的隐身型RNA载体#3、#4(图16)的制作
除了将使用OptimumGen基因设计***优化的hN、hC、hPolS这3个基因按照hN-hPolS-hC的顺序(#3)或按照hPolS-hN-hC的顺序(#4)进行搭载之外,使用与实施例8所记载的方法同样的方法制作载体,并按照实施例9所记载的方法进行验证。在包含hN-hPolS-hC的DNA(序列号80)的5ˊ侧依次连接attB1和T7启动子的DNA片段、在包含hPolS-hN-hC的DNA(序列号81)的5ˊ侧依次连接attB1和T7启动子的DNA片段以及在包含hPolL的DNA(序列号82)的3ˊ侧连接HDV核酶、T7终止子和attB2的DNA片段由GenScript公司合成。
实施例12:搭载4个外源基因的隐身型RNA载体#5的制作
杀稻瘟菌素S抗性基因(非专利文献69)(序列号56)和Kusabira-Orange基因(非专利文献70)(GenBank登录号AB128819)以使之成为Acc65I-cDNA-XhoI的结构的方式进行PCR扩增后亚克隆(图7)。质粒#5D在LITMUS38i的ApaI酶切位点与StuI酶切位点之间克隆有具有下述结构的DNA。但是,与质粒#5相比,SapI酶切切面有所不同:SapI酶切位点-序列号1-序列号36-Acc65I酶切位点-SalI酶切位点-序列号37-序列号4-ctt-序列号1-序列号38-BsiWI酶切位点-XhoI酶切位点-序列号39-序列号4-attB2-SapI酶切位点。
在质粒#1的Acc65I-SalI之间克隆包含dKeima-Red基因的Acc65I-XhoI片段,制作质粒#1D。进一步地,在质粒#1D的BsiWI-XhoI之间克隆包含杀稻瘟菌素S抗性基因的Acc65I-XhoI片段,制作质粒#1E。同时,在质粒#5D的Acc65I-SalI之间克隆包含EGFP基因的Acc65I-XhoI片段,制作质粒#5E。进一步地,在质粒#5E的BsiWI-XhoI之间克隆包含Kusabira-Orange基因的Acc65I-XhoI片段,制作质粒#5F。
将使用SapI从质粒#1E切出的包含dKeima-Red基因和杀稻瘟菌素S抗性基因的DNA片段100ng、使用SapI从质粒#5F切出的包含EGFP基因和Kusabira-Orange基因的DNA片段100ng,合计200ng,溶解于5μL H2O中,混合5μL Ligation-Convenience Kit,使之在16℃反应60分钟。纯化后,溶解于7μL H2O中,加入1μL质粒#6(150ng)和2μL BP Clonase2,使之在25℃反应2小时,之后导入大肠杆菌DH-5α,分离卡那霉素抗性菌落,制作质粒#11。利用从质粒#11使用XmaI和NotI切出的包含4个基因的DNA片段进行的隐身型RNA载体#5的制作根据实施例5~实施例8所记载的方法进行。
实施例13:通过隐身型RNA载体进行的IFN-β基因的诱导(图17)
缺陷持续表达型仙台病毒载体SeVdp(KR/Bsr/EGFP/KO)记载于非专利文献7。将实施例12中制作的隐身型RNA载体#5和SeVdp(KR/Bsr/EGFP/KO)载体一起以MOI=3感染源自原代培养人类皮肤的成纤维细胞。在此条件下,任一载体都可在约80%的细胞中进行基因导入。在载体感染后第24小时,使用ISOGEN试剂盒(NIPPON GENE Co.,Ltd.)提取细胞总RNA,使用脱氧核糖核酸酶(Deoxyribonuclease)(RT级)(NIPPON GENE Co.,Ltd.)降解基因组DNA。接着,将该RNA作为模板,使用用于RT-PCR的SuperScriptIII第一链合成***(SuperScriptIII First-Strand Synthesis System for RT-PCR)(Life Technologies,Inc.)和oligo(dT)20,通过反转录反应进行第一链cDNA合成。进一步地,使用SsoAdvanced通用型SYBR Green预混液(SsoAdvanced Universal SYBR Green Supermix)(Bio-Rad),将第一链cDNA作为模板,使用参考基因或干扰素β基因的基因特异性引物(GSP)和CFX96实时***(Real-Time System)(Bio-Rad)通过实时PCR法进行IFN-βmRNA的表达量的解析。
实施例14:搭载6个外源基因的隐身型RNA基因表达***#6、#7、#8、#9、#10的制作(图20、图22)
质粒#2D在质粒LITMUS38i的ApaI酶切位点与StuI酶切位点之间克隆有具有以下结构的DNA。但是,与质粒#2相比,由SapI酶切的切面的序列是不同的:SapI酶切位点-序列号1-序列号28-Acc65I酶切位点-SalI酶切位点-序列号29-序列号4-ctt-序列号1-序列号30-BsiWI酶切位点-XhoI酶切位点-序列号31-序列号4-SapI酶切位点。
在质粒#2D的Acc65I-SalI之间克隆包含EGFP基因的Acc65I-XhoI片段,制作质粒#2E。进一步地,在质粒#2E的BsiWI-XhoI之间克隆包含嘌呤霉素抗性基因的Acc65I-XhoI片段,制作质粒#2F。
将从质粒#1C由SapI切出的包含萤火虫萤光素酶基因和海肾萤光素酶基因的DNA片段100ng、从质粒#2F由SapI切出的包含EGFP基因和嘌呤霉素抗性基因的DNA片段100ng、从质粒#5C由SapI切出的包含dKeima-Red基因和潮霉素B抗性基因的DNA片段100ng,共计300ng,溶解于5μL H2O中,混合5μL Ligation-Convenience Kit,使之在16℃反应60分钟。纯化后,溶解于7μL H2O中,加入1μL质粒#6(150ng)和2μL BP Clonase2,使之在25℃反应2小时,之后导入大肠杆菌DH-5α,分离卡那霉素抗性菌落,制作质粒#12。使用从质粒#12由XmaI和NotI切出的包含6个基因的DNA片段进行的隐身型RNA基因表达***#6、#7、#8(图20)(实施例16)和#9、#10(图22)(实施例18)的制作根据实施例5、实施例6和实施例8所记载的方法进行。
实施例15:搭载5个外源基因的隐身型RNA基因表达***#11、#12、#13、#14、#15的 制作(图18)
除了在实施例14的质粒#12所搭载的基因中去除萤火虫萤光素酶基因并且将嘌呤霉素抗性基因置换为源自质粒pBR322的四环素抗性基因(GenBank登录号J01749.1)以外,搭载5个基因的质粒#13按照实施例14所记载的方法进行制作。
将这5个外源基因搭载于将hN、hC、hPolS这3个基因按照hN-hPolS-hC的顺序搭载的隐身型RNA载体#3上(图16),制作搭载5个外源基因的隐身型RNA基因表达***#11。进一步地,在此隐身型RNA基因表达***的XmaI位点***包含密码子优化的RIG-IC的基因盒(序列号83)、包含密码子优化的仙台病毒V蛋白的C末端区域的基因盒(序列号84)、包含密码子优化的蛋白酶体的构成成分PSMA7的基因盒(序列号85),制作搭载5个外源基因的隐身型RNA基因表达***#12、#13、#14。同时,搭载5个外源基因的隐身型RNA基因表达***#15是将hN-hPolS-hC基因中的hPolS基因的一部分置换成未优化的仙台病毒Z株的P基因(序列号86),使V蛋白进行表达的基因表达***。
由包含这些隐身型RNA基因表达***的细胞依照实施例8制作隐身型RNA载体,导入源自人类的293细胞,测定干扰素诱导能力。就图19而言,将作为代表例的隐身型RNA载体#11与#12进行比较,显示通过追加RIG-IC基因,在隐身型RNA载体中残存的干扰素β的诱导几乎完全被抑制。
实施例16:N蛋白和C蛋白表达效率的变化对于搭载于隐身型RNA基因表达***上 的外源基因的表达所产生的影响的解析(参见图20)
在pGL4.12(Promega公司)(GenBank登录号AY738224)所编码的萤火虫萤光素酶cDNA的翻译起始密码子(AUG)上游***对应于序列号56、序列号57、序列号58的RNA序列,使用CMV启动子使之在HeLa细胞中表达,使用双荧光素酶报告子检测***检测萤光素酶的活性(图20)。其结果可知,如果在原本的翻译起始密码子上游以不符合读码框(out-frame)的方式将其它起始密码子置入,则原本的蛋白质与翻译序列发生偏差,翻译效率降低。
接着,检测了将hN mRNA和hC mRNA的翻译起始密码子5ˊ上游侧的碱基序列进行改变的隐身型RNA基因表达***#6、#7、#8的基因表达能力。就隐身型RNA基因表达***#6而言,hN mRNA和hC mRNA的翻译起始密码子(AUG)5ˊ上游侧是被认为是翻译效率最高的所谓“Kozak序列(序列号57)”。就隐身型RNA基因表达***#7而言,hN mRNA的翻译起始密码子5ˊ上游侧被置换为“Kozak序列(序列号57)”(非专利文献60)、hC mRNA的翻译起始密码子5ˊ上游侧被置换为翻译效率降低至23%的序列号59的碱基序列。同时,就隐身型RNA基因表达***#8而言,hN mRNA的翻译起始密码子5ˊ上游侧被置换为翻译效率降低至40%的序列号58的碱基序列、hC mRNA的翻译起始密码子5ˊ上游侧被置换为翻译效率降低至23%的序列号59的碱基序列。就此实验而言,在稳定地保有隐身型RNA基因表达***#6、#7、#8的BHK/T7/151M(SE)细胞中,使用双荧光素酶报告子检测***检测萤光素酶的活性(图20)。
实施例17:搭载5个外源基因的隐身型RNA基因表达***#16、#17的制作(图21)
将hN、hC、hPolS这3个基因按照hN-hPolS-hC的顺序进行搭载,搭载5个外源基因的隐身型RNA基因表达***#11记载于实施例15。此载体的hC基因改变了5ˊ侧非翻译区域的序列,翻译效率降低至23%(图21)。隐身型RNA基因表达***#16是从#11去除hC基因的基因表达***。隐身型RNA基因表达***#17是将#11的hC基因的5ˊ非翻译序列变为Kozak序列,翻译效率成为100%的基因表达***。
由图21所示的EGFP表达可知,隐身型RNA基因表达***的基因表达水平可通过改变hC基因的翻译效率进行调节。另外,hC基因不是隐身型RNA基因表达***重构所必需的要素,然而,如果没有hC基因,则外源基因表达变为非常强,因此,细胞增殖受到抑制。因此,通过使hC基因表达为某种水平,可得到实用性水平的基因表达,这是现实性的。
实施例18:位于隐身型RNA基因表达***的基因组3ˊ侧的包装信号对于载体颗粒 产生所施加的影响的解析(参见图22)
隐身型RNA基因表达***#9是从隐身型RNA基因表达***#6(图20)删除基因组RNA3ˊ侧的序列D(序列号17)的基因表达***。同时,隐身型RNA基因表达***#10是从隐身型RNA基因表达***#7(图20)删除基因组RNA 3ˊ侧的序列D(序列号17)的基因表达***。在稳定地保有这些隐身型RNA基因表达***的BHK/T7/151M(SE)细胞中,按照实施例5所记载的方法表达M、F、HN的各蛋白质,从上清液回收的隐身型RNA载体的基因导入能力使用LLCMK2细胞由抗NP蛋白抗体通过间接荧光抗体法进行检测(非专利文献7)。
进一步地,试图从列举于表1中的源自管家基因的mRNA的部分序列进行任意选择,对这18个碱基的序列进行置换(图2的(5)(序列号75)),确认颗粒化效率没有变化(数据未显示)。
由此可知,可以认为从基因组3ˊ末端起第97~114个碱基的18个碱基长度或其一部分长度的区域对于负单链RNA中用于颗粒化的包装是必需的。无论如何,该位置的18个碱基长度或其一部分长度的区域对于以负单链RNA作为模板的转录和复制不是必需的,然而,可以说,其是隐身型RNA基因表达***并入病毒样颗粒所必需的“包装信号区域”。
实施例19:将保有隐身型RNA基因表达***的HeLa细胞使用siRNA处理时的萤光素 酶活性的经时变化(参见图23)
从隐身型RNA基因表达***#6(图20)制作隐身型RNA载体#6,将基因导入HeLa细胞,通过潮霉素B进行选择,建立HeLa/#3细胞株。将HeLa/#3细胞按照1.0×104/孔接种于48孔板,第二天,将以PolL基因的靶序列(序列号46)作为靶标的siRNA与导入试剂RNAiMAX(Life Technologies,Inc.)混合后导入,使最终浓度为100nM。萤光素酶活性经时测定的结果是,4次独立实施的实验的每一次都表明萤光素酶的活性10天被抑制至约0.1%,隐身型RNA基因表达***被高效率地从细胞去除。
实施例20:搭载大基因的隐身型RNA载体的制作(参见图24)
搭载各种外源基因的隐身型RNA载体的制作可与实施例1~实施例2同样地各由2个基因制造“转录盒”,与实施例3~实施例5同样地依次连接“转录盒”,按照与实施例6或实施例7以及实施例8同样的方法进行制作。可作为如此大的外源基因搭载的外源基因的名称及其碱基序列如下。人类KLF4:序列号60;人类OCT4:序列号61;人类SOX2:序列号62;人类c-Myc:序列号63;人类BRG1:序列号64;人类BAF155:序列号65;人类免疫球蛋白G的H链:序列号66;人类免疫球蛋白G的L链:序列号67;人类免疫球蛋白M克隆2G9的H链:序列号68;人类免疫球蛋白M克隆2G9的L链:序列号69;人类免疫球蛋白M的J链:序列号70;人类血液凝固因子VIII:序列号71;人类肌养蛋白:序列号72。
将这些基因作为外源基因搭载的RNA表达***可按照基于上述各实施例所记载的步骤的方法导入目标细胞。并且,通过在同一细胞中同时表达多个外源基因,使得对于细胞重编程等向导入细胞加入所期望的变更成为可能。
实施例21:通过搭载6个初始化基因的隐身型RNA载体进行的诱导多能干细胞(iPS 细胞)的诱导(图25)
可以认为,可搭载6个以上基因并确实地表达的所谓隐身型RNA载体的特征是,对所谓将人类的体细胞进行初始化并转换成iPS细胞的细胞重编程是特别有效的。因此,向作为用于制作人类诱导多能干细胞的方法最初被报道的KLF4、OCT4、SOX2、c-MYC这4个初始化基因的组合(专利文献1、非专利文献1)追加具有补全性功能的初始化基因NANOG和LIN28(专利文献2、非专利文献2),制作同时表达合计6个初始化基因的隐身型RNA载体,在其与迄今为止被报道的iPS细胞的制作技术中初始化效率最高的“同时搭载4个初始化基因(KLF4、OCT4、SOX2、c-MYC)的持续表达型仙台病毒载体”(专利文献3、专利文献4、非专利文献7)(图25A)之间,对细胞的初始化活性进行比较。
搭载6个初始化基因的隐身型RNA载体#23(图25B)是使用实施例14所示的方法依次结合人类KLF4(序列号60)、人类OCT4(序列号61)、人类SOX2(序列号62)、人类c-MYC(序列号63)、人类NANOG(序列号87)、人类LIN28(序列号88),组装至图16的隐身型RNA载体#3,按照实施例6和实施例8进行制作。
iPS细胞的制作按照专利文献3进行。具体而言,将作为源自人类胎儿的成纤维细胞的TIG3细胞以1.0×105细胞/孔接种于12孔板,第二天,将搭载KLF4、OCT4、SOX2、c-MYC的持续表达用仙台病毒载体(图25A)以及搭载KLF4、OCT4、SOX2、c-MYC、NANOG、LIN28的隐身型RNA载体(图25B)分别以感染复数(MOI)=3的条件加入培养基中,通过在室温放置2小时后在37℃培养一夜进行感染。将经丝裂霉素C处理的MEF作为饲养细胞,在涂覆明胶的培养皿上进行准备,将上述载体感染细胞在其上接种,在人类多能干细胞用培养基StemFit AK03(Ajinomoto,Co.,Inc.)中进行培养。在基因导入后第11天,使用AlexaFluor488标记的抗TRA-1-60抗原抗体(Merck-Millipore)进行染色,对从1×104个TIG-3细胞中出现的TRA-1-60阳性的iPS细胞克隆数进行计数(图25C)。其结果是,由搭载4因子的载体出现的iPS细胞为85个克隆(初始化效率0.85%),与之相对,搭载6因子的载体出现4290个克隆(初始化效率42.9%)的iPS细胞克隆,显示同时搭载6个基因的隐身型RNA载体的有效性。另外,此实施例所使用的基因的合计碱基长度为7.0kb,是使用现有的RNA载体的方法不可能实现的大小。
实施例22:通过同时表达人类免疫球蛋白M(IgM)的H链、L链、J链进行的人类免疫 球蛋白M的产生(图26)
在生物医药品制造的技术领域中,作为必须使多个多肽同时表达的代表性制品有抗体医药品。可以表达H链和L链并制造的免疫球蛋白G(IgG)的商业生产技术已经被确立,然而,必须使编码H链、L链、J链的3个基因同时表达的IgM的制造迄今为止仍然是不容易的(非专利文献84)。已知在IgM中存在具有IgG所没有的强抗肿瘤活性的抗体(非专利文献85),IgM的制造法的确立具有产业上的重大意义。因此,尝试通过将编码人IgM的H链、L链、J链的3个基因搭载于隐身型RNA载体上并使之同时表达,制造分子量为950k道尔顿的IgM。
就实施例22而言,选择与人类免疫缺陷病毒(HIV)感染细胞发生反应的人类单克隆IgM抗体9F11和2G9(非专利文献86)作为材料,将9F11抗体的H链基因(序列号89)和L链基因(序列号90)、J链基因(序列号70)、潮霉素B抗性基因(序列号50)、或者2G9抗体的H链基因(序列号68)和L链基因(序列号69)、J链基因(序列号70)、潮霉素B抗性基因(序列号50)依照实施例12按照上述顺序进行连接,搭载于图20的隐身型RNA载体#8上,得到隐身型RNA载体#23和#20。接着,以MOI=3的条件对在蛋白质制造用的无血清培养基Opti-Pro SFM(LifeTechnologies,Inc.)中驯化的源自仓鼠的BHK细胞进行基因导入,通过添加100μg/mL潮霉素B进行选择。更换新培养基后,在24小时回收,回收该培养上清液。
将培养上清液中的人IgM的量使用抗人IgM ELISA试剂盒(Bethyl Laboratories,Inc.)进行定量,在导入2G9的基因集的情况下,检测出9.17μg/mL IgM;在导入9F11的基因集的情况下,检测出11.15μg/mL IgM。未导入基因的BHK细胞的培养上清液中的IgM在检测限以下。如果将上述量以每个细胞每天的表达效率(pg/细胞/天)进行换算,则2G9为16.38pg/细胞/天、9F11为19.91pg/细胞/天(图26)。
接着,将包含300ng和100ng IgM的培养上清液使用4~20%梯度凝胶(Bio-Rad)通过SDS聚丙烯酰胺电泳进行解析,使用生物安全考马斯亮蓝G250染剂(BioSafe CoomasieG250stain)(Bio-Rad)进行染色。其结果是,非还原状态在与天然的人IgM相同的970k道尔顿的位置检测到条带,同时,还原状态在分子量75k道尔顿的H链和25k道尔顿的L链的位置检测到条带,表明得到与天然相同的21条多肽结合的IgM分子。
在非专利文献84中,记载了使用CHO-DG44细胞和HEK293细胞通过甲氨蝶呤进行基因扩增的结果得到的IgM稳定表达细胞4个克隆的解析结果,然而,表达效率为25.00、3.59、4.60、0.21pg/细胞/天。由此表明,如果使用隐身型RNA载体,可容易地实现与通过需要数月的基因扩增而实现的IgM的表达同等或较高水平的生产。
实施例23:通过同时表达4个cDNA进行的人类双重特异性抗体的产生(图27)
可识别2个不同抗原的双重特异性抗体作为将迄今为止的抗体医药品的可能性大幅扩展的分子,在生物医药品技术领域中最近备受瞩目。双重特异性抗体是在识别抗原A的H链(A)和L链(A)以及识别抗原B的H链(B)和L链(B)构成的四聚体中导入突变使H链(A)和L链(B)或者H链(B)和L链(A)难以结合,且导入突变使得与H链(A)之间或H链(B)之间的结合相比,H链(A)与H链(B)的结合变强,在此基础上,使编码H链(A)、L链(A)、H链(B)、L链(B)的4个基因同时表达而进行制作(非专利文献87)。将这样的4个基因同时导入细胞后,基因扩增,得到同时高表达4个多肽的细胞株是极为困难的,因此,通常通过瞬时基因表达进行生产。就本实施例而言,在非专利文献87所记载的双重特异性抗体中,尝试制作同时识别HER2和上皮细胞增殖因子受体(EGFR)的HEDesignLK。
将非专利文献87公开的抗HER2抗体的H链HC1(VHVRD1CH1CRD2)基因(序列号91)和L链LC1(VLVRD1CRD2)基因(序列号92)以及抗EGFR抗体的H链HC2(VHVRD2CH1WT)基因(序列号93)和L链LC2(VLVRD2WT)基因(序列号94)与EGFP基因和潮霉素B抗性基因一起,按照实施例14进行连接,搭载于隐身型RNA载体#8上(图20),制作隐身型RNA载体#24。同时,为了比较,将仅表达抗HER2抗体的H链和L链的载体#25(图27B)以及仅表达抗EGFR抗体的H链和L链的载体#26(图27C)按照实施例12进行制作。
使用这些载体,按照实施例22的方法向在Opti-Pro SFM(Life Technologies,Inc.)中驯化的源自仓鼠的BHK细胞中导入基因,将稳定表达细胞的培养上清液中的人IgG的量使用抗人IgG ELISA试剂盒(Bethyl Laboratories,Inc.)进行定量。其结果是,与制作四聚体的活性低的仅有HC1和LC1的组合(12.93pg/细胞/天)、或HC2和LC2的组合(14.02pg/细胞/天)相比,在同时搭载HC1、LC1、HC2、LC2这4个基因的情况下,观察到显著高(37.45pg/细胞/天)的抗体产生,暗示双重特异性抗体被高效率地产生。同时,此表达水平与使用基因扩增在CHO细胞中建立的一般性的细胞株的基因表达水平(最大约为90pg/细胞/天)(非专利文献88)是可比的。由此暗示,作为用于可以将通过现有方法难以得到稳定表达细胞株的双重特异性抗体稳定地产生的方法,隐身型RNA载体是非常有效的。另外,此实施例中使用的基因的合计碱基长度为6.7k个碱基,是使用现有的RNA载体的方法不能实现的大小。
工业实用性
本发明是在包含诱导多能干细胞(iPS细胞)的制作在内的人类细胞重编程、蛋白质医药品的制造、使用包含巨大基因的各种基因的基因治疗、药物研发靶标分子的表达等众多产业领域中有用的技术。
序列表
<110> 国立研究开发法人产业技术综合研究所
常磐-生物株式会社
<120> 使用具有隐身性的RNA的基因表达***以及包含该RNA的基因导入、表达载体
<130> SJU5167979WO
<150> JP2015-007288
<151> 2015-01-16
<160> 94
<170> PatentIn version 3.5
<210> 1
<211> 10
<212> RNA
<213> 人工序列
<220>
<223> 仙台病毒转录起始信号,负链序列
<400> 1
cuuucacccu 10
<210> 2
<211> 10
<212> RNA
<213> 人工序列
<220>
<223> 仙台病毒转录起始信号,负链序列
<400> 2
cuuuaucccu 10
<210> 3
<211> 10
<212> RNA
<213> 人工序列
<220>
<223> 仙台病毒转录起始信号,负链序列
<400> 3
cauucacccu 10
<210> 4
<211> 10
<212> RNA
<213> 人工序列
<220>
<223> 仙台病毒转录终止信号,负链序列
<400> 4
uuuuucuuaa 10
<210> 5
<211> 10
<212> RNA
<213> 人工序列
<220>
<223> 仙台病毒转录终止信号,负链序列
<400> 5
uuuuucuuac 10
<210> 6
<211> 10
<212> RNA
<213> 人工序列
<220>
<223> 仙台病毒转录终止信号,负链序列
<400> 6
uuuuucuuau 10
<210> 7
<211> 10
<212> RNA
<213> 人工序列
<220>
<223> 人类副流感病毒III转录起始信号,负链序列
<400> 7
cuuuaauccu 10
<210> 8
<211> 11
<212> RNA
<213> 人工序列
<220>
<223> 人类副流感病毒III转录终止信号
<400> 8
uuuuucuuau u 11
<210> 9
<211> 11
<212> RNA
<213> 人工序列
<220>
<223> 新城疫病毒转录起始信号,负链序列
<400> 9
cuucuacccg u 11
<210> 10
<211> 10
<212> RNA
<213> 人工序列
<220>
<223> 新城疫病毒转录终止信号,负链序列
<400> 10
uuuuuucuaa 10
<210> 11
<211> 12
<212> RNA
<213> 人工序列
<220>
<223> 仙台病毒基因组RNA 3'末端复制起点,负链序列
<400> 11
cucuugucug gu 12
<210> 12
<211> 12
<212> RNA
<213> 人工序列
<220>
<223> 仙台病毒基因组RNA 3'末端复制起点,负链序列
<400> 12
cucuuguuug gu 12
<210> 13
<211> 12
<212> RNA
<213> 人工序列
<220>
<223> 仙台病毒基因组RNA 5'末端复制起点,负链序列
<400> 13
accagacaag ag 12
<210> 14
<211> 12
<212> RNA
<213> 人工序列
<220>
<223> 仙台病毒基因组RNA 5'末端复制起点,负链序列
<400> 14
accaaacaag ag 12
<210> 15
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 仙台病毒(CNNNNN)3-盒,负链序列
<220>
<221> misc_feature
<222> (1)..(5)
<223> n为a、c、g或u
<220>
<221> misc_feature
<222> (7)..(11)
<223> n为a、c、g或u
<220>
<221> misc_feature
<222> (13)..(17)
<223> n为a、c、g或u
<400> 15
nnnnncnnnn ncnnnnnc 18
<210> 16
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 仙台病毒(NNNNNG)3-盒,负链序列
<220>
<221> misc_feature
<222> (2)..(6)
<223> n为a、c、g或u
<220>
<221> misc_feature
<222> (8)..(12)
<223> n为a、c、g或u
<220>
<221> misc_feature
<222> (14)..(18)
<223> n为a、c、g或u
<400> 16
gnnnnngnnn nngnnnnn 18
<210> 17
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 仙台病毒包装信号,负链序列
<400> 17
acuuuggcag caaagaaa 18
<210> 18
<211> 5
<212> RNA
<213> 人工序列
<220>
<223> 源自人类3-磷酸甘油醛脱氢酶的非编码序列
<400> 18
ccacc 5
<210> 19
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 源自人类真核翻译延长因子1 α-1的非编码序列
<400> 19
acgaggcctc agtttgtcta cttggtc 27
<210> 20
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 源自人类羟甲基胆素合酶的非编码序列
<400> 20
cctcagtgcc ccattctcac tgct 24
<210> 21
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 源自人类3-磷酸甘油醛脱氢酶的非编码序列
<400> 21
ggagccgcac cttgtcatgt accatcaata 30
<210> 22
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 源自人类3-磷酸甘油醛脱氢酶的非编码序列
<400> 22
tctcccctcc tcaca 15
<210> 23
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 源自人类线粒体核糖体蛋白L32的非编码序列
<400> 23
taatagccca cttactcctg aatctttaa 29
<210> 24
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 源自人类β-肌动蛋白的非编码序列
<400> 24
cgttacaccc tttcttgaca aaacctaact 30
<210> 25
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 源自人类β-肌动蛋白的非编码序列
<400> 25
cttccccctt ttttgtcccc caacttgag 29
<210> 26
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 源自人类磷酸甘油酸激酶1的非编码序列
<400> 26
cgacctctct ccccagctgt atttccaaa 29
<210> 27
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 源自人类磷酸甘油酸激酶1的非编码序列
<400> 27
aggctctgtt ccacatatat ttccacttc 29
<210> 28
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 源自人类肽基脯氨酰异构酶A的非编码序列
<400> 28
accgccgagg aaaaccgtgt actattagc 29
<210> 29
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 源自人类肽基脯氨酰异构酶A的非编码序列
<400> 29
gtttgacttg tgttttatct taaccacca 29
<210> 30
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 源自人类微管蛋白α-1b的非编码序列
<400> 30
tgtctgctcc tgtcgccttc gcctcctaa 29
<210> 31
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 源自人类微管蛋白β-1的非编码序列
<400> 31
agcactgcca tctcttccag caccatcag 29
<210> 32
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 源自人类转铁蛋白受体的非编码序列
<400> 32
cccaactcct ataattccct atcttttag 29
<210> 33
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 源自人类真核翻译延长因子2的非编码序列
<400> 33
gatgtccaaa ctaattttaa caaacgcat 29
<210> 34
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 源自人类泛素C的非编码序列
<400> 34
gtatcagcag aaggacattt taggacggg 29
<210> 35
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 源自人类转铁蛋白受体的非编码序列
<400> 35
gagttacttc ctatcaagcc agtacgtgc 29
<210> 36
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 源自人类TATA盒结合蛋白的非编码序列
<400> 36
ctaggaaaaa attgaatagt gagacgagt 29
<210> 37
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 源自人类核纤层蛋白B2的非编码序列
<400> 37
cagaaccccc caccctacat ttgccttgg 29
<210> 38
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 源自人类α-肌动蛋白,心肌1的非编码序列
<400> 38
cgccgacgaa ccccctgaag ctgtgccaa 29
<210> 39
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 源自人类α-肌动蛋白,心肌1的非编码序列
<400> 39
gatgccttct ctctccatct accttccag 29
<210> 40
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 源自人类微管蛋白β-1的非编码序列
<400> 40
gacaggcaga aagcagagaa gggccagga 29
<210> 41
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 源自人类微管蛋白β-1的非编码序列
<400> 41
caccccccaa aatgctctgc agcctctct 29
<210> 42
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 源自人类1-酰基甘油-3-磷酸O-酰基转移酶1的非编码序列
<400> 42
ccaacctccc actcccacct cccctccat 29
<210> 43
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 源自人类1-酰基甘油-3-磷酸O-酰基转移酶1的非编码序列
<400> 43
ccactcttga cccccacctc c 21
<210> 44
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 源自人类微管蛋白α-1b的非编码序列
<400> 44
taaagctttc tgg 13
<210> 45
<211> 46
<212> DNA
<213> 人工序列
<220>
<223> 源自人类3-磷酸甘油醛脱氢酶的非编码序列
<400> 45
agccgcacct tgtcatgtac catcaataaa gtaccctgtg ctcaac 46
<210> 46
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 用于hPolL抑制的siRNA靶序列
<400> 46
gggacagaug agauuucuu 19
<210> 47
<211> 600
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的嘌呤霉素抗性基因
<400> 47
atgaccgagt acaagcctac cgtgcggctg gccacaaggg atgacgtgcc tcgggccgtg 60
aggaccctgg ccgccgcttt cgccgactac cccgccacaa gacacaccgt ggacccagac 120
agacacatcg agagggtgac cgagctgcag gagctgttcc tgaccagagt gggcctggac 180
atcggaaagg tgtgggtggc cgacgacggc gccgccgtgg ctgtgtggac aacccccgag 240
tccgtggagg ccggcgctgt gttcgctgag atcggacctc ggatggccga gctgagcgga 300
agcagactgg ccgcccagca gcagatggag ggcctgctgg ctcctcacag acctaaggag 360
ccagcttggt tcctggctac cgtgggcgtg tcccctgatc accagggcaa gggcctgggc 420
agcgccgtgg tgctgcctgg agtggaggcc gccgagcgcg ccggagtgcc tgcttttctg 480
gagaccagcg cccctcgcaa cctgccattc tatgagagac tgggcttcac cgtgacagct 540
gacgtggagg tgcctgaggg ccccagaaca tggtgtatga cccggaagcc tggcgcctga 600
<210> 48
<211> 678
<212> DNA
<213> 人工序列
<220>
<223> E2-Crimson荧光蛋白基因
<400> 48
atggatagca ctgagaacgt catcaagccc ttcatgcgct tcaaggtgca catggagggc 60
tccgtgaacg gccacgagtt cgagatcgag ggcgtgggcg agggcaagcc ctacgagggc 120
acccagaccg ccaagctgca agtgaccaag ggcggccccc tgcccttcgc ctgggacatc 180
ctgtcccccc agttcttcta cggctccaag gcgtacatca agcaccccgc cgacatcccc 240
gactacctca agcagtcctt ccccgagggc ttcaagtggg agcgcgtgat gaacttcgag 300
gacggcggcg tggtgaccgt gacccaggac tcctccctgc aggacggcac cctcatctac 360
cacgtgaagt tcatcggcgt gaacttcccc tccgacggcc ccgtaatgca gaagaagact 420
ctgggctggg agccctccac tgagcgcaac tacccccgcg acggcgtgct gaagggcgag 480
aaccacatgg cgctgaagct gaagggcggc ggccactacc tgtgtgagtt caagtccatc 540
tacatggcca agaagcccgt gaagctgccc ggctaccact acgtggacta caagctcgac 600
atcacctccc acaacgagga ctacaccgtg gtggagcagt acgagcgcgc cgaggcccgc 660
caccacctgt tccagtag 678
<210> 49
<211> 375
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的博来霉素抗性基因
<400> 49
atggctaagc tgaccagcgc cgtgcccgtg ctgacagcga gggacgtggc tggagctgtg 60
gagttctgga cagacaggct gggcttcagc agggacttcg tggaggacga cttcgccggc 120
gtggtgaggg acgacgtgac cctgttcatc agcgccgtgc aggaccaggt ggtgcccgac 180
aacacactgg cttgggtgtg ggtgagggga ctggatgagc tgtatgctga gtggtctgag 240
gtggtgagca ccaacttcag ggatgcttct ggacctgcta tgacagagat tggagagcag 300
ccttggggaa gagagtttgc cctgagggac cctgctggaa actgcgtgca ctttgtggct 360
gaggagcagg actga 375
<210> 50
<211> 1026
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的潮霉素抗性基因
<400> 50
atgaagaagc ccgagctgac cgctaccagc gtggagaagt tcctgatcga gaagttcgac 60
agcgtgagcg acctgatgca gctgagcgag ggcgaggaga gcagggcctt cagcttcgac 120
gtgggcggca ggggctacgt gctgagggtg aacagctgcg ccgacggctt ctacaaggac 180
agatacgtgt acagacactt tgctagcgcc gccctgccca tccctgaggt gctggacatt 240
ggagagttca gcgagagcct gacctactgc atcagcagga gagctcaggg agtgaccctg 300
caggacctgc ctgagacaga gctgcctgcc gtgctgcagc ctgtggctga ggctatggat 360
gctattgctg ccgcagacct gagccagacc agcggatttg gacccttcgg ccctcagggt 420
atcggacagt acaccacctg gagggacttc atctgcgcca tcgccgaccc ccacgtgtac 480
cactggcaga ccgtgatgga tgacaccgtg agcgcctctg tggctcaggc cctggatgag 540
ctgatgctgt gggctgagga ctgccctgag gtgaggcacc tggtgcacgc cgacttcggc 600
agcaacaacg tgctgaccga caacggcagg atcaccgccg tgatcgactg gagcgaggcc 660
atgttcggcg acagccagta cgaggtggcc aacatcttct tctggaggcc ctggctggcc 720
tgcatggagc agcagaccag gtactttgag aggaggcacc ctgagctggc tggaagccca 780
aggctgaggg cttacatgct gaggattgga ctggaccagc tgtaccagag cctggtggac 840
ggcaacttcg acgatgctgc ttgggctcag ggaaggtgcg atgctatcgt gaggagcgga 900
gctggcaccg tgggaaggac ccagattgct aggaggagcg ccgccgtgtg gacagatgga 960
tgcgtggagg tgctggctga ctctggaaac cgtaggccta gcacccgacc aagagctaag 1020
gagtga 1026
<210> 51
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 重组序列attB1
<400> 51
acaagtttgt acaaaaaagc aggct 25
<210> 52
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 重组序列attB2
<400> 52
acccagcttt cttgtacaaa gtggt 25
<210> 53
<211> 4212
<212> DNA
<213> 人工序列
<220>
<223> 包含hN基因、hC基因和hPolS基因的DNA片段
<400> 53
accagacaag agtttaagag atatgtatcc ttttaaattt tcttaagaaa aacttagggt 60
gaaagtatcc accctgagga gcaggttcca gatccttttc tttgctgcca aagtccacca 120
tggctggcct gctgtcaacc ttcgatacct tttcaagtag gaggagcgag tcaatcaaca 180
aatctggggg cggagctgtc atccctggac agcggtccac cgtgtctgtc ttcgtgctgg 240
gcccctctgt gacagacgat gccgacaagc tgttcatcgc caccacattt ctggctcaca 300
gtctggacac agataaacag cattcacaga gaggcgggtt tctggtgagc ctgctggcta 360
tggcatacag ctccccagaa ctgtatctga ctaccaacgg agtgaatgcc gacgtgaagt 420
acgtgatcta taacattgag aaggacccca aaaggactaa gaccgatggc ttcatcgtga 480
agacacggga tatggaatac gagagaacaa ctgagtggct gttcgggcct atggtgaaca 540
agagcccact gtttcaggga cagcgagacg cagctgaccc cgataccctg ctgcaaatct 600
acggctatcc tgcctgcctg ggggctatca ttgtccaagt gtggatcgtc ctggtgaaag 660
caattacctc tagtgccggc ctgcggaagg ggttctttaa ccgcctggag gctttccgac 720
aggatggaac agtgaagggc gcactggtct ttaccggcga aacagtggag ggaatcggct 780
ctgtcatgag aagtcagcag tcactggtca gcctgatggt ggaaactctg gtcaccatga 840
acacagccag aagtgacctg accacactgg agaaaaacat ccagattgtg gggaattaca 900
tcagggatgc cggcctggcc agcttcatga ataccatcaa gtatggggtg gaaacaaaga 960
tggcagccct gactctgtcc aacctgagac ccgacatcaa caagctgcgg agcctgattg 1020
atacctacct gtctaagggc cccagggccc ctttcatctg tattctgaaa gacccagtgc 1080
acggggagtt tgctccagga aactaccccg cactgtggtc ctatgcaatg ggcgtggccg 1140
tggtccagaa taaggccatg cagcagtacg tcactggccg cacctatctg gacatggaaa 1200
tgtttctgct ggggcaggcc gtggctaaag atgccgagag caagatcagc agcgccctgg 1260
aggacgagct gggagtcaca gatactgcca aggggcgact gcggcaccat ctggcaaacc 1320
tgtccggagg cgacggagca tatcacaaac ctacaggggg aggcgctatc gaagtggcac 1380
tggataatgc cgacattgat ctggagacta aggcacatgc agaccaggat gctcgcggat 1440
ggggaggaga ttccggcgaa agatgggcca ggcaggtgtc tggcgggcac tttgtcactc 1500
tgcatggcgc tgagcgactg gaggaagaga ccaatgacga agatgtgagt gacatcgagc 1560
ggagaattgc tatgcgactg gcagaaaggc gccaggagga ctcagccacc catggggatg 1620
agggacggaa caatggagtg gaccatgacg aagatgatga cgccgccgca gtcgcaggca 1680
ttggaggaat ttgaggatct acgaggcctc agtttgtcta cttggtctta agaaaaactt 1740
agggtgaaag cctcagtgcc ccattctcac tgctactaga ggagcccacc atgcccagct 1800
ttctgaagaa gattctgaaa ctgagaggac gaagacagga agatgagtct cgaagtcgga 1860
tgctgtccga cagctccatg ctgtcttgca gggtgaacca gctgactagc gagggaaccg 1920
aagctggctc aaccacaccc agcacactgc ctaaagacca ggccctgctg atcgagccaa 1980
aggtccgggc taaggaaaaa tcccagcacc ggagacccaa gatcattgat caggtgaggc 2040
gcgtcgagag tctgggggaa caggcatcac agcggcagaa acatatgctg gagaccctga 2100
tcaacaaaat ctacacaggc cctctggggg aggaactggt gcagactctg tatctgagaa 2160
tctgggccat ggaggaaacc ccagagtctc tgaaaatcct gcagatgcgc gaagacattc 2220
gagatcaggt cctgaagatg aaaacagaga gatggctgag gactctgatt aggggcgaaa 2280
agaccaaact gaaggatttc cagaagcggt acgaggaagt gcacccctat ctgatgaaag 2340
agaaggtgga acaggtcatc atggaagagg cttggtcact ggcagctcat attgtgcagg 2400
agtaatgact cgacggagcc gcaccttgtc atgtaccatc aatattaaga aaaacttagg 2460
gtgaaagtct cccctcctca cacctagagc cgccaccatg gaccaggacg cttttattct 2520
gaaggaggat tctgaagtgg aacgggaggc accaggggga agggagagtc tgagtgatgt 2580
cattggcttc ctggacgccg tgctgagctc cgagccaaca gatatcggag gggaccggag 2640
ctggctgcac aacactatta atacccccca ggggcctgga agtgcacata gagccaagtc 2700
agagggcgaa ggggaggtgt caacacccag cactcaggat aacaggtctg gggaggaatc 2760
cagagtctct ggaaggacca gtaagcctga agcagaggcc cacgctggca acctggacaa 2820
acagaatatc catcgagctt ttggaggccg gaccgggaca aactctgtga gtcaggacct 2880
gggagatggg ggagactctg gcatcctgga aaacccccct aatgagcgcg gctaccctcg 2940
atccgggatt gaagatgaga atagggagat ggccgctcac ccagataagc gaggagaaga 3000
ccaggcagag ggactgcctg aggaagtgcg gggctcaacc agcctgccag acgaaggaga 3060
gggaggagcc tccaacaatg gccggtctat ggaacctggg tctagtcatt ccgctagagt 3120
gacaggcgtg ctggtcattc cttctccaga gctggaggaa gcagtcctgc ggagaaacaa 3180
gaggcgccca accaattccg gatctaaacc actgacccca gcaacagtgc ccggcacacg 3240
gagcccaccc ctgaacagat ataatagtac cgggtcacct ccaggaaagc ccccttctac 3300
acaggatgag cacatcaaca gtggggacac tccagctgtg cgggtcaagg atagaaaacc 3360
acccattgga actcggagcg tgagcgactg cccagcaaac ggaagaccta tccaccccgg 3420
cctggagact gattccacca agaaaggaat tggcgaaaat acctcaagca tgaaggagat 3480
ggccacactg ctgactagcc tgggcgtgat ccagtccgca caggaattcg agagcagccg 3540
ggacgccagt tacgtctttg ctcgacgggc actgaaatca gccaactatg ctgagatgac 3600
cttcaacgtg tgcggcctga ttctgagcgc cgaaaagagt tcagctagaa aagtggatga 3660
gaataagcag ctgctgaaac agatccagga aagcgtcgag tccttcagag acatctacaa 3720
gaggttttca gaatatcaga aagagcagaa cagcctgctg atgtctaatc tgagtacact 3780
gcacatcatt actgataggg gaggcaagac cgataacaca gacagcctga cacgcagccc 3840
ttccgtgttc gctaagtcca aagagaataa gactaaagca acccgctttg acccctccat 3900
ggaaactctg gaggatatga agtacaaacc tgacctgatc cgggaagatg agtttaggga 3960
cgaaattcgc aacccagtgt atcaggaacg cgatactgag ccccgagcat caaatgccag 4020
cagactgctg ccctccaagg agaaacctac catgcattct ctgaggctgg tcatcgaaag 4080
ctccccactg agccgcgctg agaaggtggc atacgtcaaa tctctgagta agtgcaaaac 4140
cgaccaggag gtgaaggctg tgatggaact ggtggaggaa gacattgaat ctctgacaaa 4200
ctaaatcccg gg 4212
<210> 54
<211> 6884
<212> DNA
<213> 人工序列
<220>
<223> 包含hPolL基因的DNA片段
<400> 54
gcggccgctt aagaaaaact tagggtgaat gtaaagcttt ctggccacca tggacgggca 60
ggagtcatcc cagaatcctt ccgatatcct gtatcccgaa tgtcatctga actcacctat 120
tgtgcgaggc aaaatcgccc agctgcacgt gctgctggac gtgaaccagc catataggct 180
gaaggacgat tccatcatta atatcacaaa gcataagatt cgcaacggcg ggctgtctcc 240
cagacagatc aagatcagga gtctgggcaa ggccctgcag agaactatca aggatctgga 300
caggtacaca ttcgagcctt acccaactta ttctcaggaa ctgctgcggc tggacattcc 360
agagatctgc gataaaatcc ggagcgtgtt cgccgtcagt gaccggctga ccagagagct 420
gagctccggc ttccaggatc tgtggctgaa tatcttcaag cagctgggga acatcgaggg 480
acgcgaaggc tatgatccac tgcaggacat tggcacaatc cccgagatta ctgacaaata 540
ctcacgcaac cgatggtatc ggcccttcct gacctggttt agcatcaaat acgacatgag 600
gtggatgcag aagacccgcc ccggaggacc tctggataca agtaactcac acaatctgct 660
ggagtgcaag agctacacac tggtgactta tggagatctg attatgatcc tgaacaagct 720
gactctgacc ggctacatcc tgacccccga actggtgctg atgtattgtg acgtggtcga 780
gggaagatgg aacatgagcg ccgctggcca tctggacaag aagtccattg gcatcacaag 840
caagggggag gaactgtggg aactggtgga cagcctgttc tctagtctgg gagaggaaat 900
ctataatgtc attgccctgc tggagcctct gagcctggct ctgattcagc tgaacgatcc 960
agtgatcccc ctgcgcggcg cattcatgcg acacgtcctg accgagctgc aggccgtgct 1020
gacctccagg gatgtctaca cagacgcaga ggccgatact atcgtggaat ccctgctggc 1080
tatctttcat gggacatcta ttgacgagaa ggcagaaatc ttcagtttct ttaggacctt 1140
tggacacccc tcactggagg ccgtgacagc agccgataaa gtccgcgctc atatgtacgc 1200
acagaaggcc atcaaactga agactctgta tgaatgccac gccgtgttct gtaccatcat 1260
tatcaatggc taccgggaga gacacggagg acagtggcca ccttgcgatt ttcctgacca 1320
cgtgtgcctg gaactgcgca acgctcaggg gtccaatact gcaatctctt acgagtgtgc 1380
cgtggacaac tataccagct tcattggatt caaatttcgc aagtttatcg agccacagct 1440
ggatgaagac ctgaccatct acatgaaaga taaggcactg agcccccgga aggaagcctg 1500
ggacagcgtg taccctgatt caaatctgta ctataaagcc ccagagagcg aggaaacacg 1560
gagactgatc gaggtgttca ttaatgacga aaactttaat cccgaggaaa ttatcaacta 1620
cgtcgaaagc ggggactggc tgaaagatga gaagttcaac attagctatt ccctgaaaga 1680
gaaggaaatc aagcaggaag gaagactgtt tgccaaaatg acatacaaga tgagggctgt 1740
gcaggtcctg gcagagactc tgctggccaa aggaatcggc gagctgttct ccgaaaacgg 1800
gatggtgaaa ggagagattg acctgctgaa gaggctgacc acactgtctg tgagtggcgt 1860
ccctcgcacc gatagcgtgt ataacaattc caaatcaagc gagaagagga atgaagggat 1920
gaagaaaaag aactctggcg ggtattggga cgagaaaaag aggagtcgcc acgaattcaa 1980
ggccacagac tcctctactg atggctacga gactctgagc tgctttctga ctaccgatct 2040
gaaaaagtat tgtctgaatt ggcgcttcga aagcaccgct ctgtttgggc agcgatgcaa 2100
tgagatcttc ggcttcaaga ccttcttcaa ctggatgcat cccgtgctgg agagatgcac 2160
catctacgtg ggcgaccctt attgtccagt cgccgatagg atgcaccgcc agctgcagga 2220
tcatgctgac agcgggattt tcatccacaa ccctagggga ggcatcgagg gatactgtca 2280
gaagctgtgg accctgattt caatcagcgc aattcatctg gctgcagtgc gggtcggagt 2340
gagagtcagt gccatggtgc agggcgacaa tcaggctatc gcagtcactt caagagtgcc 2400
cgtcgcccag acctataagc agaaaaagaa ccacgtgtat aaggagatta caaagtattt 2460
cggcgctctg aggcacgtga tgtttgatgt cgggcatgag ctgaaactga atgaaactat 2520
catcagttca aagatgttcg tgtactccaa gagaatctac tatgacggca aaatcctgcc 2580
acagtgcctg aaggcactga cacggtgcgt gttctggtct gagactctgg tcgatgaaaa 2640
cagatccgcc tgctctaata tctccacttc tattgccaag gctatcgaga acggctactc 2700
ccccatcctg gggtactgta ttgccctgta taaaacctgc cagcaggtgt gcatctcact 2760
gggcatgacc attaatccca caatcagccc tactgtgcga gaccagtact tcaaagggaa 2820
gaactggctg cgatgcgctg tgctgatccc agcaaacgtc gggggattca attatatgag 2880
tacctcaagg tgttttgtgc gcaacatcgg ggaccctgca gtcgccgctc tggctgatct 2940
gaagcgattc attcgggccg atctgctgga caaacaggtg ctgtaccgcg tgatgaatca 3000
ggagcctgga gatagctcct ttctggactg ggcttctgat ccctatagtt gcaacctgcc 3060
tcacagccag tccatcacaa ctattatcaa gaatatcacc gcaaggtctg tgctgcaaga 3120
aagtcccaac cctctgctga gcgggctgtt cacagagact tccggagagg aagacctgaa 3180
tctggcttcc tttctgatgg atcgaaaagt gatcctgcca cgggtcgcac atgaaatcct 3240
gggaaactct ctgaccggcg tgcgggaggc aatcgcagga atgctggaca ccacaaagag 3300
tctggtgaga tctagtgtca aaaagggcgg gctgtcatac ggcatcctga ggcgcctggt 3360
gaattacgac ctgctgcagt atgaaaccct gacaagaact ctgaggaaac ccgtgaagga 3420
taacatcgag tacgaatata tgtgcagcgt ggagctggca gtcggactga gacagaagat 3480
gtggattcac ctgacatacg ggaggcctat ccatggactg gagactccag atcccctgga 3540
actgctgagg ggcaccttca tcgaggggtc agaagtgtgc aagctgtgcc gcagcgaggg 3600
agcagaccct atctacacct ggttttatct gccagataat attgatctgg acaccctgac 3660
aaacggatgt cctgctattc gcatcccata cttcggctct gctacagacg agcgaagtga 3720
agcacagctg ggctatgtgc ggaatctgag caaacctgcc aaggcagcca ttcggatcgc 3780
tatggtgtat acctgggcat atgggacaga tgagatttct tggatggaag ctgcactgat 3840
cgcacagaca agagccaacc tgagtctgga gaatctgaag ctgctgactc cagtgtctac 3900
tagtaccaac ctgtcccaca ggctgaaaga cacagccact cagatgaagt tctcaagcgc 3960
aactctggtg cgcgccagcc ggttcatcac catcagcaac gacaatatgg ctctgaaaga 4020
ggcaggagaa tctaaggata caaatctggt gtaccagcag atcatgctga ctggcctgag 4080
cctgttcgag tttaacatgc gctataaaaa ggggtccctg ggaaagcctc tgatcctgca 4140
cctgcatctg aacaatggct gctgtattat ggagtcccca caggaagcca atatcccacc 4200
ccggtctacc ctggacctgg agattacaca ggaaaacaac aagctgatct atgatcctga 4260
cccactgaag gatgtggacc tggaactgtt ctccaaagtg cgggacgtgg tccacaccgt 4320
cgatatgaca tactggagcg acgatgaagt gatcagagcc acctccattt gcaccgccat 4380
gacaatcgct gacacaatga gccagctgga tcgggacaac ctgaaggaaa tgattgctct 4440
ggtgaacgac gatgacgtga atagcctgat taccgagttc atggtcatcg atgtcccact 4500
gttctgttcc acatttggag gcatcctggt gaatcagttt gcctactctc tgtatggact 4560
gaacattcga ggccgggagg aaatctgggg ccacgtggtc cgcatcctga aagacaccag 4620
ccatgcagtg ctgaaggtcc tgtcaaatgc cctgagccac cccaaaattt tcaagcggtt 4680
ttggaacgca ggagtggtcg agccagtgta cggacccaac ctgagcaatc aggataagat 4740
cctgctggcc ctgtcagtgt gcgaatatag cgtggacctg ttcatgcacg attggcaggg 4800
gggagtgccc ctggagatct tcatctgtga taatgaccct gatgtcgctg acatgcgacg 4860
gtcctctttc ctggcacgcc atctggccta cctgtgctcc gtggcagaaa tcagccggga 4920
cggaccacga ctggagagta tgaactcact ggagaggctg gaaagcctga agtcctacct 4980
ggagctgact ttcctggatg accccgtgct gcgctattct cagctgaccg gcctggtcat 5040
caaggtcttt cctagtaccc tgacatacat ccggaaaagt tcaattaagg tgctgagaac 5100
cagggggatt ggagtgcccg aggtcctgga agactgggat cctgaagctg acaatgcact 5160
gctggatggc attgccgctg agatccagca gaacattcca ctgggacacc agacacgcgc 5220
cccattttgg ggactgcgag tgtcaaagag ccaggtcctg cgcctgcgag ggtacaaaga 5280
gatcaccaga ggcgaaattg ggagaagcgg cgtggggctg acactgccat tcgacggccg 5340
gtatctgtcc catcagctga gactgtttgg gatcaattcc acatcttgcc tgaaggccct 5400
ggaactgact tacctgctgt cccccctggt ggacaaagat aaggacagac tgtacctggg 5460
agagggcgct ggggcaatgc tgtcttgcta tgacgctacc ctgggccctt gtatcaacta 5520
ctataattcc ggcgtgtact cttgtgatgt caacgggcag agagagctga atatctaccc 5580
agccgaagtg gctctggtcg ggaaaaagct gaacaatgtg acctcactgg gacagagggt 5640
gaaggtcctg ttcaacggaa atcccggcag cacatggatt ggaaacgacg agtgcgaagc 5700
cctgatctgg aacgagctgc agaatagctc cattggcctg gtgcactgtg acatggaagg 5760
cggggatcat aaggatgacc aggtggtcct gcacgagcat tacagcgtga ttaggatcgc 5820
ctatctggtc ggcgatcgcg acgtggtcct gatctccaaa attgctccta ggctggggac 5880
tgactggacc cgccagctgt ctctgtacct gcgatattgg gatgaagtga atctgatcgt 5940
cctgaagact agtaacccag cctcaaccga aatgtacctg ctgagtaggc accccaaatc 6000
agacattatc gaggattcca agaccgtgct ggcttctctg ctgccactga gcaaggagga 6060
cagcatcaag atcgaaaagt ggattctgat cgagaaagcc aaggctcacg aatgggtgac 6120
cagagagctg agagaagggt ctagttcaag cggaatgctg cggccttacc atcaggccct 6180
gcagacattc ggctttgagc caaacctgta taagctgagc agagacttcc tgtccacaat 6240
gaacattgct gatactcata attgcatgat cgcattcaac agggtgctga aggacaccat 6300
ttttgagtgg gcccggatca cagaatccga taaaagactg aagctgacag gaaaatacga 6360
cctgtatcct gtgcgcgatt ctggcaaact gaagactgtg agtagaaggc tggtcctgtc 6420
atggatcagt ctgtcaatga gcactcggct ggtgaccggg agtttcccag accagaagtt 6480
tgaagccaga ctgcagctgg gaatcgtgtc tctgtcctct agggagattc gcaatctgcg 6540
agtcatcact aaaaccctgc tggaccgctt cgaagatatt atccacagca tcacttaccg 6600
atttctgacc aaagagatta agatcctgat gaaaattctg ggagccgtga agatgtttgg 6660
cgctcggcag aacgagtaca ccactgtgat tgacgacggc agcctgggcg acattgaacc 6720
ttacgattcc tcctaaaccg gtagccgcac cttgtcatgt accatcaata aagtaccctg 6780
tgctcaacga agtcttggac tgatccatat gacaatagta agaaaaactt acaagaagac 6840
aagaaaattt aaaagaatac atatctctta aactcttgtc tggt 6884
<210> 55
<211> 1575
<212> DNA
<213> 人工序列
<220>
<223> 用于在大肠杆菌中表达的密码子优化的N基因
<400> 55
atggcaggtt tactcagcac gttcgacact tttagcagca gacgcagcga gagcatcaac 60
aaatccggtg gtggcgcggt gatccctggt cagcgctcta ccgtgagcgt gtttattctg 120
ggcccgtctg tcaccgatga tgccgataag ctgttcattg ccaccacctt tctggcccac 180
agcctggaca cggacaaaca gcactctcaa cgtggcggtt tcctggtttc gttgctggcg 240
atggcgtata gcagcccgga gctgtacttg accaccaacg gcgtgaacgc ggatgtgaag 300
tatgtgattt acaacatcga gaaagatccg aagcgtacga aaaccgacgg ttttatcgtt 360
aagacccgcg atatggaata cgagcgtacc acggagtggc tgttcggtcc gatggtcaat 420
aagagcccgc tgttccaagg ccagcgcgac gcagcggacc cggacaccct gctgcagatc 480
tatggctacc ctgcgtgtct gggcgcgatc attgttcaag tatggatcgt tctggtcaag 540
gcgattacca gcagcgcagg tctgcgtaag ggctttttca atcgcctgga ggcgttccgt 600
caggatggca ccgtgaaagg tgcactggtt tttaccggtg aaaccgtcga aggtattggc 660
tctgttatgc gttcccagca gagcttggtc agcctgatgg ttgagactct ggttacgatg 720
aatactgccc gcagcgatct gacgaccctg gagaaaaaca ttcaaattgt cggcaactac 780
atccgtgatg cgggtctggc atccttcatg aatacgatca aatatggcgt ggaaacgaag 840
atggcggcct tgaccctgtc caatctgcgt ccggacatta acaaattgcg tagcctgatt 900
gacacgtacc tgagcaaagg tccgcgtgcc ccgttcatct gcattctgaa agatccagtt 960
cacggtgagt tcgcaccggg taactatccg gccctgtgga gctatgcaat gggcgtggct 1020
gtcgtccaga acaagagcat gcagcagtac gttacgggtc gtacctacct ggatatggag 1080
atgtttctgc tgggtcaagc agttgcaaaa gacgcggagt ccaaaatcag cagcgccctg 1140
gaggacgagt tgggtgtcac cgacaccgcg aaggaacgtc tgcgtcatca tctggctaat 1200
ctgagcggtg gtgatggcgc gtaccacaag ccgacgggtg gtggtgctat cgaagttgcg 1260
ctggataatg cggacatcga tttggaaact gaagcacacg cggatcaaga cgcgcgtggc 1320
tggggtggtg atagcggcga acgctgggcg cgtcaagtgt cgggcggtca ctttgtgacc 1380
ctgcatggtg cggagcgtct ggaagaagaa accaatgatg aggacgttag cgatattgag 1440
cgccgtattg ctatgcgcct ggcggaacgt cgtcaagagg acagcgctac gcacggtgac 1500
gagggccgca acaatggcgt cgaccatgaa gaggacgacg acgctgcagc cgcagcgggt 1560
attggtggca tctaa 1575
<210> 56
<211> 423
<212> DNA
<213> 人工序列
<220>
<223> 杀稻瘟菌素S抗性基因
<400> 56
atgaagacct tcaatattag ccagcaggac ctggagctgg tggaggtggc caccgagaaa 60
atcaccatgc tgtacgagga caataagcac cacgtggggg ccgccattcg caccaagaca 120
ggcgagatca tcagcgccgt gcacatcgag gcctacatcg gccgggtgac cgtgtgcgcc 180
gaggccatcg ccatcggctc cgccgtgtcc aacggccaga aggattttga taccattgtg 240
gccgtgaggc acccatacag cgacgaggtg gatcggagca tccgggtggt gtccccttgc 300
gggatgtgca gagagctgat ttccgattac gcccctgact gcttcgtgct gatcgagatg 360
aatgggaagc tggtgaaaac aacaatcgag gagctgatcc ccctgaagta taccaggaac 420
tga 423
<210> 57
<211> 5
<212> RNA
<213> 人工序列
<220>
<223> Kozak序列
<400> 57
ccacc 5
<210> 58
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> 5'非编码序列#1
<400> 58
ccaccatgaa attgccagaa gactgacact agagccgcca cc 42
<210> 59
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 5'非编码序列#2
<400> 59
caccatggcc caggcttcat a 21
<210> 60
<211> 1440
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的人类KLF4基因
<400> 60
atgcgacagc ctcctggcga atccgatatg gccgtctccg atgctctgct gccttctttc 60
tctacttttg cctctggacc tgctggcagg gagaagacac tgcgacaggc aggagctccc 120
aacaatcgat ggcgggagga actgtctcac atgaaaagac tgccccctgt cctgcctggg 180
aggccatacg acctggccgc tgcaaccgtg gccacagatc tggagtccgg aggagctgga 240
gcagcttgcg gaggaagcaa cctggcacca ctgcctcgga gagaaaccga ggaattcaac 300
gatctgctgg acctggattt tatcctgtct aatagtctga cccacccacc agagtccgtc 360
gcagcaacag tgagctcctc tgcatctgcc agttcaagct cctctccaag ttcaagcggc 420
ccagcttcag cacccagcac ttgttccttc acctacccca ttcgggcagg gaatgaccct 480
ggagtggccc cagggggaac aggaggggga ctgctgtatg gcagagaatc tgcacctcca 540
cccactgccc ctttcaacct ggctgacatc aatgatgtct caccaagcgg aggatttgtg 600
gcagagctgc tgaggcccga actggatcct gtctatattc ctccacagca gcctcagccc 660
cctggaggag gactgatggg caagttcgtg ctgaaagcct ccctgtctgc tccaggcagc 720
gagtacggga gtccctcagt catcagcgtg tccaagggat ctcctgacgg aagtcaccca 780
gtggtcgtgg caccatataa cggaggccca cccaggactt gccccaagat caagcaggaa 840
gctgtgtcct cttgtaccca tctgggggca ggacctccac tgagcaatgg ccaccgcccc 900
gctgcacatg actttcctct ggggcgacag ctgccttccc ggaccacacc aaccctggga 960
ctggaggaag tgctgagttc acgcgattgc cacccagccc tgcctctgcc ccctgggttc 1020
cacccacatc ccggacctaa ctacccaagc tttctgccag accagatgca gccacaggtg 1080
ccacccctgc actatcagga gctgatgcct ccaggaagtt gtatgcccga ggaaccaaag 1140
ccaaaacggg gcaggcgcag ctggcctaga aagaggactg ctacccatac atgcgattac 1200
gcaggctgtg ggaagactta taccaaaagc tcccacctga aggcccatct gagaacacac 1260
actggcgaga aaccttacca ctgcgactgg gatggatgtg gctggaagtt cgctcgctcc 1320
gacgaactga cacgccatta tcgaaagcac actgggcatc gaccattcca gtgccagaaa 1380
tgtgaccggg cattttctag aagtgatcat ctggccctgc acatgaaacg gcatttttga 1440
<210> 61
<211> 1083
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的人类OCT4基因
<400> 61
atggccggac acctggcttc agattttgcc ttctcaccac cacctggggg agggggcgac 60
ggacctgggg gacccgaacc tggatgggtg gaccccagaa cctggctgag ctttcaggga 120
ccccctggcg ggccaggaat cggccctggc gtgggacctg gctccgaggt ctgggggatt 180
ccaccctgcc ctccacccta cgaattctgc ggaggcatgg cttattgtgg accacaagtg 240
ggagtcggac tggtgcctca ggggggactg gagacatctc agcctgaggg agaagcagga 300
gtgggagtcg agagcaactc cgatggcgct agtcccgaac cttgcaccgt gactccaggg 360
gcagtcaagc tggagaagga aaaactggag cagaatcccg aggaatccca ggacatcaag 420
gctctgcaga aagagctgga acagtttgca aagctgctga agcagaaacg cattaccctg 480
ggctacacac aggccgatgt ggggctgact ctgggagtgc tgttcggcaa agtcttttcc 540
cagaccacaa tctgccgatt cgaggcactg cagctgagct tcaagaacat gtgtaaactg 600
aggcccctgc tgcagaagtg ggtggaggaa gccgacaaca atgagaatct gcaggaaatc 660
tgcaaagcag aaacactggt gcaggccagg aagcgcaaac gaactagcat tgagaaccgg 720
gtcagaggca acctggaaaa tctgtttctg cagtgcccaa agcccacact gcagcagatc 780
agccacattg cccagcagct ggggctggag aaagatgtgg tccgggtgtg gttctgtaat 840
cggagacaga agggaaaaag gagctcctct gactatgctc agcgcgagga tttcgaagcc 900
gctggctctc cttttagtgg cgggccagtg agtttccccc tggcacctgg gccacacttt 960
ggaactcctg gatacggctc accacatttc accgccctgt atagttcagt gcccttccct 1020
gagggagaag cttttcctcc agtgtctgtc actaccctgg gctcaccaat gcatagcaac 1080
tga 1083
<210> 62
<211> 954
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的人类SOX基因
<400> 62
atgtataata tgatggaaac cgaactgaag ccacctggac cacagcagac aagcggggga 60
ggggggggaa actcaacagc agcagcagcc ggcgggaacc agaagaatag tccagacaga 120
gtgaaaaggc ccatgaacgc attcatggtc tggtcccgag gccagcggag aaagatggcc 180
caggagaacc ccaaaatgca caatagtgaa atctcaaagc ggctgggggc cgagtggaaa 240
ctgctgagcg agactgaaaa gagacctttt attgacgaag caaaacgact gcgggccctg 300
cacatgaagg agcatcctga ttacaaatat cgcccaaggc gcaagaccaa aacactgatg 360
aagaaagaca agtacaccct gcccggagga ctgctggctc ctgggggaaa cagcatggca 420
tccggagtgg gagtcggagc tggactggga gcaggagtga atcagaggat ggactcatat 480
gcccacatga acgggtggag caatggaagt tactcaatga tgcaggatca gctgggctat 540
ccccagcacc ctggactgaa cgctcatggc gccgctcaga tgcagcctat gcatcgctac 600
gatgtgtctg cactgcagta taacagtatg actagctccc agacctacat gaatggctct 660
cctacctaca gcatgtccta ttctcagcag ggcacaccag ggatggccct gggatctatg 720
ggcagtgtgg tcaagtccga agcttctagt tcaccccctg tggtcacaag ctcctctcac 780
tcccgcgccc catgccaggc tggggacctg cgagatatga tctctatgta cctgccagga 840
gcagaggtgc cagaaccagc agcaccctca agactgcaca tgagccagca ttatcagtcc 900
ggccctgtcc cagggacagc tattaatggc actctgcccc tgagccatat gtga 954
<210> 63
<211> 1320
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的人类c-Myc基因
<400> 63
atgcccctga atgtgagctt tactaacaga aactacgacc tggactacga cagcgtgcag 60
ccctattttt attgtgacga agaagagaac ttctaccagc agcagcagca gagcgagctg 120
cagccacctg caccttccga ggacatttgg aagaaatttg aactgctgcc tacaccaccc 180
ctgtctccaa gtcggagaag cggcctgtgc tcacccagct atgtggccgt cactcctttc 240
agcctgcgag gggacaatga tggaggagga ggatcctttt ctacagccga tcagctggag 300
atggtgactg aactgctggg gggagacatg gtcaaccaga gcttcatttg cgatccagac 360
gatgagactt ttatcaagaa tatcatcatc caggactgta tgtggtcagg cttcagcgcc 420
gctgcaaagc tggtgtctga aaaactggca agttaccagg ccgctcgcaa agatagtggg 480
tcacctaacc cagccagagg ccactccgtg tgctctacaa gctccctgta cctgcaggac 540
ctgagcgcag ccgcttccga gtgtattgat ccctccgtgg tcttccccta tcctctgaat 600
gactctagtt cacccaagag ttgtgcatca caggacagct ccgccttttc accttctagt 660
gatagcctgc tgtcaagcac tgagtcctct ccacagggca gcccagaacc cctggtgctg 720
catgaggaaa cccctccaac cacaagttca gattccgagg aggagcagga ggacgaagag 780
gaaatcgatg tggtctctgt ggagaagcgg caggctccag gaaaaagaag cgaatccgga 840
tctccaagtg caggaggaca ctccaagcca cctcattctc ccctggtgct gaaaaggtgc 900
cacgtctcca cccaccagca taactacgca gccccaccct ctacaagaaa ggactatccc 960
gctgcaaaga gggtgaaact ggatagcgtg cgcgtcctgc gacagatcag taacaatagg 1020
aagtgtactt cacctcgcag ctccgacacc gaggaaaacg tgaaaaggcg cacccataat 1080
gtcctggagc gccagcgacg gaatgaactg aagcgatcct tctttgccct gcgggatcag 1140
attcctgagc tggaaaacaa tgagaaggct ccaaaagtgg tcattctgaa gaaagccaca 1200
gcttatatcc tgtctgtgca ggccgaggaa cagaagctga tcagtgagga agacctgctg 1260
cggaaaagaa gggagcagct gaagcacaaa ctggaacagc tgagaaacag ctgcgcctga 1320
<210> 64
<211> 5040
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的人类BRG1基因
<400> 64
atgagcaccc cagaccctcc tctgggcggc acacctagac caggcccaag ccctggacca 60
gggccaagcc ccggcgctat gctgggacca tcccccggac ctagccccgg ctccgcacat 120
tctatgatgg gacctagtcc tggaccaccc tcagcaggac acccaatccc aacacaggga 180
ccagggggct acccacagga taatatgcac cagatgcata agccaatgga gtcaatgcac 240
gaaaaaggca tgagcgacga tcccaggtat aaccagatga agggcatggg aatgagatcc 300
ggagggcacg caggaatggg ccctccaccc tctcctatgg accagcatag ccagggatac 360
ccttccccac tgggcggatc tgagcacgct agctccccag tgcctgcaag cggaccttct 420
agtggcccac agatgtcaag cggccccggc ggcgcccctc tggatggagc tgacccacag 480
gcactggggc agcagaacag aggcccaacc cccttcaatc agaaccagct gcaccagctg 540
cgcgcccaga tcatggctta caagatgctg gcaaggggcc agcctctgcc agaccatctg 600
cagatggcag tccagggcaa gcgaccaatg cctggaatgc agcagcagat gcccacactg 660
cctccaccca gtgtgtcagc cactggacca gggcccggcc ctggaccagg gcccggccct 720
ggaccagggc cggctcctcc aaattattcc agaccacacg gaatgggagg gccaaacatg 780
ccccctccag ggccatctgg agtgccccct ggaatgcctg ggcagccacc cggcggacct 840
ccaaagcctt ggccagaggg acctatggcc aacgccgctg caccaacctc tacaccccag 900
aagctgatcc ctccccagcc tacaggcagg cccagtcctg caccacccgc agtccctcca 960
gcagctagcc cagtgatgcc ccctcagact cagagccccg gccagcctgc tcagccagca 1020
cccatggtcc cactgcacca gaagcagagc cgcatcaccc ctattcagaa accacgaggc 1080
ctggatcccg tggagattct gcaggaacgc gagtaccgac tgcaggcccg aattgctcat 1140
aggatccagg aactggagaa tctgcccgga tccctggccg gggatctgag aactaaggcc 1200
accatcgagc tgaaagctct gcggctgctg aactttcaga ggcagctgag acaggaggtg 1260
gtcgtgtgca tgaggagaga caccgcactg gaaacagccc tgaatgcaaa agcctataag 1320
cggtccaaac gccagtctct gcgagaggct aggattacag aaaagctgga gaaacagcag 1380
aagatcgaac aggagaggaa gcggcgccag aaacaccagg agtacctgaa cagtattctg 1440
cagcacgcca aagacttcaa ggaatatcat agatcagtca ccggcaaaat ccagaagctg 1500
acaaaagctg tggcaactta ccatgctaat accgaacggg agcagaagaa agaaaacgag 1560
cgcattgaaa aggagcgaat gcgaaggctg atggccgagg atgaggaagg ctatcggaag 1620
ctgatcgatc agaagaaaga caaacgcctg gcatacctgc tgcagcagac tgacgagtat 1680
gtcgccaacc tgaccgaact ggtgagacag cacaaggcag cccaggtggc taaggagaag 1740
aaaaagaaaa agaaaaagaa aaaggcagaa aatgcagagg gacagacccc agcaatcgga 1800
cctgatggag agccactgga cgaaacaagt cagatgtcag atctgcccgt caaagtgatc 1860
cacgtggagt ccggaaaaat cctgactggg accgacgctc ctaaggcagg gcagctggag 1920
gcttggctgg aaatgaaccc tggctacgag gtggcaccac gcagcgactc cgaggaatct 1980
ggcagtgagg aagaagagga ggaagaggaa gaggaacagc cacaggctgc acagccaccc 2040
acactgcctg tcgaggagaa gaagaagatc cctgatccag acagtgacga tgtctcagag 2100
gtggatgcaa ggcacatcat tgaaaatgcc aagcaggacg tggacgatga gtatggagtg 2160
tctcaggccc tggctagagg gctgcagagt tactatgcag tcgcccatgc tgtgaccgag 2220
cgggtcgata agcagagcgc cctgatggtc aatggcgtgc tgaagcagta ccagatcaag 2280
ggactggagt ggctggtgtc cctgtataac aataacctga acggcatcct ggctgacgaa 2340
atgggcctgg gaaaaacaat ccagactatt gcactgatca cctacctgat ggagcacaag 2400
agaatcaatg gaccctttct gatcattgtg cctctgagca cactgtccaa ctgggcttac 2460
gagttcgaca agtgggcacc ctccgtcgtg aaggtgagct ataaaggatc cccagccgct 2520
agacgggctt ttgtccccca gctgcggtct gggaagttca acgtgctgct gaccacatac 2580
gagtacatca ttaaggataa gcatattctg gccaagatcc gctggaaata catgatcgtg 2640
gacgagggac acaggatgaa gaatcaccat tgcaaactga cacaggtcct gaacactcat 2700
tatgtggcac ctcgccgact gctgctgaca gggactccac tgcagaataa gctgcccgag 2760
ctgtgggccc tgctgaactt tctgctgcca actattttca agtcatgtag caccttcgag 2820
cagtggttta atgccccctt cgctatgaca ggcgaaaagg tggatctgaa cgaggaagag 2880
actatcctga tcattaggag actgcacaag gtcctgcggc cctttctgct gcggcgcctg 2940
aagaaagaag tggaggccca gctgcctgaa aaggtcgagt acgtgatcaa atgcgacatg 3000
tctgccctgc agagagtcct gtatcggcat atgcaggcta aaggggtgct gctgacagat 3060
ggcagcgaga aggacaagaa aggcaagggc ggcaccaaaa cactgatgaa tactattatg 3120
cagctgcgca agatctgtaa ccacccatac atgttccagc atattgaaga gtccttttct 3180
gagcacctgg gcttcactgg agggatcgtg cagggactgg atctgtatag ggcatctggg 3240
aagtttgagc tgctggacag gattctgccc aagctgagag ccaccaacca taaagtgctg 3300
ctgttctgcc agatgacttc cctgatgacc atcatggagg attactttgc ctatcggggc 3360
ttcaagtacc tgcgcctgga tggaactacc aaagctgagg accgcgggat gctgctgaag 3420
accttcaacg agcctggctc cgaatatttc atttttctgc tgtctactag ggccggcgga 3480
ctgggactga atctgcagtc agctgacacc gtgatcattt tcgatagcga ctggaaccct 3540
caccaggatc tgcaggctca ggacagagca catcggatcg gccagcagaa tgaggtccgc 3600
gtgctgcgac tgtgcaccgt caacagcgtg gaagagaaga ttctggcagc cgctaagtac 3660
aaactgaacg tggatcagaa agtcatccag gccggaatgt ttgaccagaa gtcctctagt 3720
cacgagcgaa gggccttcct gcaggctatc ctggagcacg aggagcagga cgaatctcgc 3780
cattgtagta ccgggagtgg ctcagcaagc ttcgcacata cagctcctcc acccgcagga 3840
gtgaatcctg acctggagga gcctcccctg aaggaagagg acgaggtccc agacgatgaa 3900
accgtgaacc agatgatcgc tcgacacgaa gaggaattcg atctgtttat gcggatggat 3960
ctggacagac ggcgcgagga agcccggaat cccaagagga aacctagact gatggaggaa 4020
gacgagctgc ccagctggat cattaaggac gatgccgaag tggagcgcct gacctgcgag 4080
gaagaggaag agaaaatgtt cggaagggga tcccggcacc gaaaggaggt ggattactcc 4140
gactctctga cagaaaaaca gtggctgaag aaaattacag gaaaggatat ccatgacact 4200
gcatcaagcg tggcccgagg actgcagttt cagagggggc tgcagttctg tactcgcgca 4260
agcaaggcca ttgaagaggg gaccctggaa gagatcgaag aggaagtgag gcagaagaaa 4320
tcctctcgaa agaggaaaag agattccgac gccggcagtt caacccctac aacttctaca 4380
cggagtcgcg acaaggacga tgagagcaag aagcagaaga aacgaggaag gccccctgct 4440
gaaaagctga gcccaaatcc acccaacctg accaagaaaa tgaagaaaat tgtcgatgcc 4500
gtgatcaagt acaaagacag ctcctctggc cgccagctga gtgaggtgtt tattcagctg 4560
ccttcaagaa aagaactgcc agagtactat gaactgatcc ggaagcctgt ggatttcaag 4620
aaaattaagg agagaatccg gaatcacaaa tacaggtccc tgaacgatct ggaaaaggac 4680
gtgatgctgc tgtgtcagaa tgcccagact tttaacctgg aggggtctct gatctacgaa 4740
gacagtatcg tgctgcagtc agtcttcacc agcgtgagac agaagattga aaaagaggac 4800
gatagtgagg gcgaggaatc agaggaagag gaagagggcg aagaggaagg aagtgaatca 4860
gagagccggt ccgtcaaggt gaaaatcaag ctggggagaa aagagaaggc tcaggaccgg 4920
ctgaaagggg gccgaaggag accttcacgg ggcagccgcg caaagccagt cgtgtccgac 4980
gatgactctg aggaggagca ggaagaggat aggtctggca gtggatcaga agaggactga 5040
<210> 65
<211> 3318
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的人类BAF155基因
<400> 65
atggcagctg cagccggcgg agggggcccc ggcacagccg tgggagctac tggatccgga 60
atcgctgcag cagctgcagg actggctgtg taccggagaa aagacggagg gcctgcaaca 120
aagttctggg aatctccaga gactgtgtcc cagctggact ctgtgcgggt ctggctgggg 180
aaacactaca agaaatatgt gcatgcagat gcccctacaa acaagactct ggctggcctg 240
gtggtccagc tgctgcagtt ccaggaggat gcatttggaa agcacgtgac caatccagct 300
tttacaaaac tgcccgcaaa gtgcttcatg gactttaagg caggcggagc cctgtgtcat 360
atcctgggag ccgcttacaa atacaagaac gagcagggat ggcgacgatt cgacctgcag 420
aatccctcca ggatggatag aaacgtggaa atgttcatga acatcgagaa gaccctggtc 480
cagaacaatt gcctgacacg gcctaacatc tacctgatcc cagacattga tctgaaactg 540
gccaacaagc tgaaggacat cattaagcgc caccagggaa ccttcacaga tgagaaaagt 600
aaagcttcac accatatcta cccttatagc tcctctcagg acgatgagga atggctgcgg 660
ccagtgatgc gcaaagagaa gcaggtgctg gtccactggg gcttttaccc cgactcctat 720
gatacctggg tccattctaa cgacgtggat gccgaaatcg aggatccccc tattccagag 780
aaaccctgga aggtgcacgt caagtggatc ctggacactg atattttcaa cgagtggatg 840
aatgaggaag actacgaagt cgatgagaac cggaaacctg tgtcatttcg gcagcgcatc 900
agcacaaaga atgaggaacc tgtgcgatct ccagagcgaa gggacaggaa ggctagtgca 960
aacgcccgaa aaaggaagca tagcccatcc ccaccccctc caactcctac cgagagtcgc 1020
aagaaatcag gaaagaaagg gcaggccagt ctgtatggca aaagacggtc acagaaggag 1080
gaagacgaac aggaggatct gacaaaggac atggaggatc ctactccagt gcccaacatt 1140
gaggaagtgg tcctgcccaa gaacgtcaat ctgaagaaag actctgaaaa tactcctgtc 1200
aagggcggca ccgtggcaga cctggatgag caggatgagg aaacagtgac tgcaggaggg 1260
aaagaagacg aggatccagc caagggggac cagtctagga gtgtggacct gggcgaagat 1320
aacgtgaccg agcagacaaa tcacatcatt atccccagct acgcctcctg gttcgactat 1380
aactgcatcc atgtgattga acgccgagct ctgccagagt tctttaacgg caaaaataag 1440
agcaaaacac ccgagatcta cctggcctat cgcaacttta tgattgatac ttaccgactg 1500
aatcctcagg agtatctgac cagcacagct tgcaggagaa acctgaccgg agacgtgtgt 1560
gccgtcatga gggtgcacgc tttcctggaa cagtgggggc tggtcaacta ccaggtggat 1620
cccgagagca gacctatggc catgggccct cctcccactc cacactttaa tgtcctggct 1680
gacaccccat caggactggt gcccctgcat ctgagaagcc ctcaggtccc agcagcccag 1740
cagatgctga acttcccaga gaagaacaag gagaagcccg tggacctgca gaactttggc 1800
ctgcgaaccg atatctacag caagaaaaca ctggccaaaa gcaagggagc ttccgcagga 1860
cgagagtgga ctgaacagga gaccctgctg ctgctggaag ccctggagat gtataaagac 1920
gattggaata aggtctctga acacgtgggc agtaggaccc aggatgagtg tatcctgcat 1980
ttcctgagac tgccaattga agacccctac ctggagaact ctgatgcaag tctgggacct 2040
ctggcctatc agcctgtgcc attctcacag agcgggaatc cagtcatgag cacagtggct 2100
tttctggcat ccgtggtgga ccccagagtg gcatccgctg cagcaaaggc tgcactggag 2160
gaattctcta gagtccggga ggaagtgccc ctggaactgg tggaggcaca cgtcaagaaa 2220
gtgcaggagg cagctcgcgc cagcggaaag gtggacccta catacgggct ggagagttca 2280
tgcatcgccg gaactgggcc cgatgaacct gagaaactgg aaggggccga ggaagagaag 2340
atggaggctg accctgatgg ccagcagcca gaaaaagccg agaacaaggt ggaaaatgag 2400
accgacgagg gggataaggc tcaggatggc gaaaacgaga aaaatagcga aaaggagcag 2460
gactcagaag tgagcgagga tactaaatcc gaagagaagg aaaccgaaga gaacaaagag 2520
ctgactgaca cctgtaagga aagggagagt gatacaggca agaaaaaggt cgaacacgag 2580
atctcagagg gaaatgtcgc aaccgcagca gctgcagcac tggcttctgc tgcaacaaaa 2640
gcaaagcatc tggccgctgt ggaagagaga aaaattaaga gtctggtcgc cctgctggtg 2700
gaaacccaga tgaaaaagct ggagatcaag ctgcggcact tcgaggagct ggagacaatt 2760
atggaccgcg aaaaggaggc cctggaacag cagagacagc agctgctgac cgagcggcag 2820
aactttcaca tggaacagct gaagtacgcc gagctgcgcg ctcgacagca gatggagcag 2880
cagcagcatg ggcagaatcc acagcaggca caccagcatt ccggcggacc tggcctggct 2940
ccactgggcg cagcaggaca ccccggcatg atgcctcatc agcagccccc tccatatcct 3000
ctgatgcacc atcagatgcc ccctccccac cctccccagc caggccagat ccccggccct 3060
ggatctatga tgcctggcca gcacatgcct ggaaggatga tcccaactgt ggctgcaaac 3120
attcatccat ccggatctgg acctacccct cccggcatgc ctccaatgcc aggaaacatt 3180
ctgggaccaa gagtgccact gaccgcacca aatggcatgt accctccccc tccccagcag 3240
cagcctccac cccctccacc cgctgacggc gtgcctccac cccctgcacc cggaccaccc 3300
gccagcgccg ctccttga 3318
<210> 66
<211> 1431
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的人类免疫球蛋白G H链基因
<400> 66
atggattgga cttggagatt cctgttcgtc gtcgcagcag caaccggcgt gcagagccag 60
atgcaggtcg tgcagagcgg ggcagaagtg aagaaaccag gcagctccgt cactgtgagt 120
tgcaaggcct caggcgggac cttcagcaac tacgcaatct cctgggtgcg gcaggccccc 180
ggacagggac tggaatggat gggaggcatc attcccctgt tcggaactcc tacctattct 240
cagaattttc agggccgcgt gacaatcact gctgataaga gtacctcaac agcacacatg 300
gagctgattt ctctgcgaag tgaagacact gctgtgtact attgcgcaac cgaccggtac 360
agacaggcca acttcgatag ggctcgcgtg gggtggtttg acccttgggg gcagggaacc 420
ctggtcacag tgtctagtgc atctaccaag ggaccaagtg tgtttccact ggccccctca 480
agcaaaagca cttccggagg aaccgcagct ctgggatgtc tggtgaagga ttatttccca 540
gagcccgtca cagtgtcatg gaacagcgga gcactgacca gcggggtcca tacatttccc 600
gctgtgctgc agtcctctgg cctgtactcc ctgagttcag tggtcaccgt ccctagctcc 660
tctctgggga ctcagaccta tatctgcaac gtgaatcaca agccttctaa tacaaaagtg 720
gacaagaagg tggaaccaaa gagttgtgac aaaacacata cttgcccccc ttgtcctgca 780
ccagagctgc tgggaggacc aagcgtgttc ctgtttccac ccaagcccaa agataccctg 840
atgattagca ggacaccaga agtcacttgc gtggtcgtgg acgtgtccca cgaggatccc 900
gaagtcaagt tcaactggta cgtggacggc gtcgaggtgc ataatgctaa gaccaaaccc 960
agagaggagc agtacaattc aacctatcgg gtcgtgagcg tcctgacagt gctgcaccag 1020
gattggctga acggcaaaga gtataagtgc aaagtgtcta ataaggcact gcccgcccct 1080
atcgagaaaa caattagcaa ggctaaaggg cagcctagag aaccacaggt gtataccctg 1140
cctccaagca gggatgagct gacaaagaac caggtctccc tgacttgtct ggtgaaaggg 1200
ttctatccca gtgacattgc agtggagtgg gaatcaaatg gacagcctga aaacaattac 1260
aagaccacac cccctgtgct ggactccgat ggatctttct ttctgtattc caagctgact 1320
gtggacaaat ctcggtggca gcagggcaac gtcttttctt gtagtgtgat gcatgaggcc 1380
ctgcacaatc attacacaca gaagtcactg agcctgtccc ccggcaaatg a 1431
<210> 67
<211> 708
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的人类免疫球蛋白G L链基因
<400> 67
atggcttggg cactgctgct gctgacactg ctgacacagg atactgggtc ttgggcacag 60
agcgcactga cacagcctgc ttccgtgtcc ggctctcctg ggcagtctat caccattagt 120
tgcaccggga caaacaatga cgtgggaagt tacaacctgg tctcatggta tcagcagcac 180
ccaggcaagg cccccaaaat catgatctac gaggtgtcca agcggccaag tggggtctca 240
aaccggttca gcggatcaaa aagcggcaat acagcctcac tgactatcag cggactgcag 300
gcagaggacg aagccgatta ctattgctgt tcctacgctg gctcttatac agtggtcttc 360
ggcgggggaa ctaagctgac cgtgctgggg cagcctaaag ccgctccatc tgtgactctg 420
tttcccccta gctccgagga actgcaggct aataaggcaa ccctggtgtg tctgattagc 480
gacttctacc ccggagctgt gacagtcgcc tggaaggctg attctagtcc cgtgaaagca 540
ggggtcgaga ccacaactcc tagcaagcag tccaacaaca agtacgcagc ctcaagctat 600
ctgtccctga ctccagaaca gtggaagtct cacaggtcct attcttgcca ggtgacccat 660
gagggcagta ccgtggaaaa aacagtcgcc cccactgaat gttcctga 708
<210> 68
<211> 1773
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的人类免疫球蛋白M H链基因
<400> 68
atggaactgg gcctgagatg ggtctttctg gtcgctatcc tggagggagt gcagtgtgaa 60
gtgcagctgg tcgagtctgg cgggggactg gtgaaaccag gcggatctct gcgactgagt 120
tgcgcagctt caggcttcac cttcagcact tactcaatga actgggtccg acaggccccc 180
ggcaagggac tggaatgggt gagctccatc tctagttcaa gctcctacat ctactatgct 240
gacagcgtga aagggcgatt cactatctct cgggataacg caaagaatag tctgtatctg 300
cagatgaatt cactgagagc cgaggacaca gctgtctact attgtgccag ggatctgctg 360
attgctgtgg caggacactg gggacagggg accctggtga cagtctctag tggcagcgcc 420
tccgctccaa ctctgttccc cctggtgtcc tgcgaaaact ctcctagtga cacctcaagc 480
gtggcagtcg gatgtctggc ccaggacttc ctgccagata gcatcacatt ttcctggaag 540
tacaaaaaca acagtgatat ttcctctact cgcggctttc cctctgtgct gcgaggaggc 600
aaatatgcag ccaccagtca ggtcctgctg ccttcaaagg acgtgatgca ggggacagat 660
gagcacgtgg tctgcaaagt gcagcatccc aacggaaata aggagaagaa cgtcccactg 720
cccgtgatcg ctgagctgcc acctaaggtg agcgtcttcg tgccacccag agacgggttc 780
tttggaaatc ccagaaagag caaactgatc tgtcaggcca ccggctttag ccctaggcag 840
attcaggtgt cctggctgcg cgaagggaag caggtcggat ccggcgtgac cacagatcag 900
gtccaggcag aagccaagga gtctgggccc actacctaca aagtgacctc tacactgact 960
atcaaggaga gtgactggct gtcacagagc atgttcacct gccgggtgga tcatagagga 1020
ctgacatttc agcagaatgc cagttcaatg tgtgtccctg accaggatac cgctatcagg 1080
gtgttcgcaa ttcctccaag cttcgcttcc atttttctga ctaagtccac caaactgaca 1140
tgcctggtca ccgacctgac aacttatgat tctgtgacca tcagttggac acgccagaac 1200
ggcgaagccg tgaagaccca cacaaacatt tccgagtctc atcccaatgc aaccttcagc 1260
gccgtgggcg aagcttccat ctgcgaggac gattggaata gcggggagcg gtttacttgt 1320
accgtgacac acactgacct gccttcacca ctgaagcaga ccattagccg acctaaaggc 1380
gtcgccctgc atcggccaga tgtgtacctg ctgccccctg caagagaaca gctgaacctg 1440
agggagagcg ccaccatcac atgtctggtg accggattca gccctgcaga cgtctttgtg 1500
cagtggatgc agcgaggaca gccactgtcc cctgaaaagt acgtgacatc tgcaccaatg 1560
cctgagccac aggccccagg cagatatttt gctcactcca ttctgacagt gtctgaggaa 1620
gagtggaaca ctggggagac ttatacctgc gtggtcgctc atgaagcact gccaaatagg 1680
gtcactgagc gcaccgtgga caagagcact gggaaaccca ccctgtataa cgtctcactg 1740
gtcatgagcg atacagccgg aacttgttat tga 1773
<210> 69
<211> 711
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的人类免疫球蛋白M L链基因
<400> 69
atggacatgc gagtgcctgc tcagctgctg ggactgctgc tgctgtggct gcccgataca 60
agatgcgaca ttcagatgac tcagagccca agctccctga gtgcctcagt gggagaccgg 120
gtcaccatca catgcagagc ttcacagggc attagcaact acctggcatg gtatcagcag 180
aagccaggca aagtgcccaa gctgctgatc tacgcagctt ccaccctgca gtctggggtg 240
cccagtcgat tcagcggatc cggatctgga acagacttta ctctgaccat ttctagtctg 300
cagcctgagg atgtggctac ttactattgc cagaaataca attctgcacc atataccttc 360
ggccagggga caaaactgga gatcaagagg acagtggcag ccccctctgt cttcattttt 420
ccccctagcg acgaacagct gaagtccggc accgcttccg tggtctgtct gctgaacaat 480
ttttaccctc gcgaagccaa agtgcagtgg aaggtcgata acgctctgca gagtggcaat 540
tcacaggaga gcgtgactga acaggactcc aaagattcta cctatagtct gtcaagcaca 600
ctgactctga gcaaggcaga ttacgagaag cacaaactgt atgcctgcga agtgacacat 660
caggggctgt cctctcctgt cactaagtcc ttcaacagag gagagtgttg a 711
<210> 70
<211> 480
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的人类免疫球蛋白M J链基因
<400> 70
atgaagaacc atctgctgtt ttggggagtg ctggctgtgt ttatcaaggc tgtccatgtg 60
aaggctcagg aagacgagag aattgtgctg gtggacaaca agtgcaaatg tgctagaatc 120
acctccagga tcattcgcag ctccgaggac cctaacgaag acatcgtgga gcgaaatatt 180
cggatcattg tcccactgaa caatcgcgaa aatatttctg atcccaccag tcctctgcgg 240
acaagattcg tgtaccacct gagtgacctg tgcaagaaat gtgatcccac agaggtggaa 300
ctggacaacc agatcgtcac cgcaacacag tcaaatattt gcgacgaaga tagcgccact 360
gagacctgct acacttatga taggaacaag tgttacaccg cagtggtccc tctggtgtat 420
ggaggagaaa ctaaaatggt cgagacagcc ctgactccag acgcttgtta tcccgattga 480
<210> 71
<211> 7056
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的人类凝固因子VIII基因
<400> 71
atgcagattg aactgtccac ctgtttcttc ctgtgcctgc tgagattttg tttttccgct 60
actcgcagat actacctggg ggctgtggaa ctgtcttggg attacatgca gagtgacctg 120
ggagagctgc cagtggacgc acgatttcca cctcgggtgc caaagtcatt cccctttaac 180
acaagcgtgg tctacaagaa gaccctgttc gtggagttca ccgatcacct gttcaatatc 240
gctaagcccc ggccaccctg gatgggactg ctggggccta ccatccaggc agaggtgtac 300
gacaccgtgg tcattacact gaaaaacatg gcatcacacc cagtgagcct gcatgccgtc 360
ggagtgtctt actggaaggc tagtgagggc gcagaatatg acgatcagac ctctcagaga 420
gagaaggaag acgataaagt gtttcccggc gggagccata catatgtctg gcaggtgctg 480
aaggagaacg gcccaatggc tagcgacccc ctgtgcctga cctactcata tctgagccac 540
gtggacctgg tgaaggatct gaatagcgga ctgatcggcg ccctgctggt gtgcagggag 600
ggatccctgg ctaaagaaaa gacacagact ctgcataagt tcattctgct gttcgccgtg 660
tttgacgagg ggaaatcctg gcactctgaa accaagaact cactgatgca ggaccgagat 720
gcagctagcg cacgagcctg gcccaaaatg cacacagtca acggctacgt gaatagatca 780
ctgcctgggc tgatcggatg ccacaggaag tctgtctatt ggcatgtgat cgggatggga 840
accacaccag aggtccacag cattttcctg gaagggcata cctttctggt gcgcaaccac 900
cgacaggctt ccctggagat ctctcccatt acattcctga ctgcacagac cctgctgatg 960
gatctgggcc agttcctgct gttttgccac atcagctccc accagcatga tgggatggag 1020
gcttacgtca aagtggactc ctgtcctgag gaaccacagc tgcggatgaa gaacaatgag 1080
gaagccgaag actatgacga tgacctgaca gactctgaga tggatgtggt caggttcgat 1140
gacgataaca gcccctcctt tatccagatt cgcagcgtcg ccaagaaaca ccctaagacc 1200
tgggtgcatt acatcgcagc cgaggaagag gactgggatt atgctcctct ggtgctggca 1260
ccagacgata gaagttacaa atcacagtat ctgaacaatg gccctcagcg gattgggaga 1320
aagtacaaga aagtgcgatt catggcatac acagatgaaa cttttaagac cagagaggcc 1380
atccagcacg aaagcggcat tctggggcca ctgctgtacg gagaagtggg cgacactctg 1440
ctgatcatct tcaagaacca ggccagccgg ccctacaata tctatcctca tggaattacc 1500
gatgtcagac cactgtactc ccggagactg cccaaaggag tgaagcacct gaaagacttc 1560
cccatcctgc ctggcgaaat cttcaagtat aagtggaccg tcacagtgga ggatggccca 1620
actaagtccg accccagatg cctgaccagg tactattcta gtttcgtgaa catggaaagg 1680
gatctggcct ctgggctgat cggaccactg ctgatttgtt acaaagagag tgtggatcag 1740
aggggcaacc agatcatgtc agacaagcgc aatgtcattc tgttcagcgt gtttgacgag 1800
aatcgctcct ggtatctgac cgaaaacatc cagcgattcc tgccaaatcc cgctggcgtg 1860
cagctggagg atcccgaatt tcaggcatca aacatcatgc atagcattaa tggctacgtg 1920
ttcgacagtc tgcagctgtc agtctgcctg cacgaggtgg cttactggta tatcctgagc 1980
attggggcac agacagattt cctgagcgtc ttcttttccg gatacacttt taaacataag 2040
atggtgtacg aggacactct gaccctgttc ccattttctg gcgagaccgt gtttatgagt 2100
atggaaaacc ccggactgtg gatcctgggc tgccacaact ccgatttcag gaatcgcgga 2160
atgactgccc tgctgaaagt gtcaagctgt gacaagaata ccggcgacta ctatgaggat 2220
tcctacgaag acatctctgc ttatctgctg agtaaaaaca atgcaattga gccacgctct 2280
tttagtcaga actctaggca ccccagtacc cgccagaagc agttcaacgc cactaccatc 2340
cctgagaatg atattgaaaa aacagaccca tggtttgctc atcggactcc tatgccaaag 2400
atccagaacg tgagcagcag cgatctgctg atgctgctga gacagagccc cactcctcac 2460
gggctgtcac tgagcgacct gcaggaggca aagtacgaaa ccttctcaga cgatccaagc 2520
cccggagcca tcgattccaa caattccctg tctgagatga cccacttccg gccacagctg 2580
caccattccg gggacatggt gtttacaccc gagtctggac tgcagctgag actgaacgaa 2640
aaactgggca caactgctgc aacagagctg aagaaactgg actttaaggt gtcaagcact 2700
agcaacaatc tgatctccac cattccctct gataacctgg ccgctgggac agacaatact 2760
tcctctctgg gacctccatc aatgcctgtg cactacgata gccagctgga caccacactg 2820
ttcggcaaga aaagttcacc tctgaccgag tctggaggcc cactgagtct gtcagaagag 2880
aacaatgatt caaaactgct ggagagcgga ctgatgaact cccaggaaag ctcctggggc 2940
aagaacgtga gcagcaccga gtccgggcgg ctgtttaaag gaaagagagc ccatggccct 3000
gctctgctga ctaaagacaa cgctctgttc aaggtgagca tctccctgct gaagaccaac 3060
aaaacaagca acaattccgc aactaatcgg aagacccaca tcgatggccc atccctgctg 3120
attgagaact ctcccagtgt ctggcagaat atcctggagt ctgacacaga gttcaagaag 3180
gtcactccac tgattcatga tcggatgctg atggacaaga atgctaccgc actgagactg 3240
aaccacatga gcaataagac tacctcaagc aaaaacatgg agatggtgca gcagaagaaa 3300
gaaggaccta tcccccctga tgcacagaat ccagacatga gcttctttaa aatgctgttc 3360
ctgcctgagt ccgcccgctg gattcagcga acacacggca agaactctct gaatagtggc 3420
caggggcctt ccccaaaaca gctggtctct ctgggcccag agaagagtgt ggaagggcag 3480
aactttctgt ccgagaaaaa taaggtggtc gtgggaaagg gcgaattcac caaagatgtc 3540
ggcctgaagg agatggtgtt cccctcctct aggaatctgt ttctgactaa cctggacaat 3600
ctgcacgaga acaataccca taaccaggaa aagaaaatcc aggaagagat tgagaagaaa 3660
gaaacactga tccaggagaa cgtcgtgctg ccccagattc acacagtgac tggcaccaag 3720
aacttcatga aaaatctgtt tctgctgtct acccgccaga atgtcgaggg cagttacgac 3780
ggggcctatg ctcctgtgct gcaggatttt cgcagtctga acgactcaac taatcgaacc 3840
aagaaacaca ccgcccattt cagcaagaaa ggggaagagg aaaacctgga agggctggga 3900
aatcagacaa aacagatcgt ggagaagtac gcttgcacaa ctagaattag cccaaacaca 3960
tcccagcaga atttcgtgac tcagaggagc aagcgcgccc tgaaacagtt taggctgccc 4020
ctggaggaaa ctgagctgga aaagcgcatc attgtggacg atacatctac tcagtggagc 4080
aagaacatga agcatctgac cccctccacc ctgacacaga tcgattataa cgagaaagaa 4140
aagggcgcca ttacccagtc acctctgagc gactgtctga cacgatcaca cagcatccca 4200
caggccaacc ggtctcccct gcctattgct aaggtgagtt cattccctag catcaggcca 4260
atctacctga cccgcgtgct gtttcaggat aatagctccc atctgcctgc agcctcatat 4320
aggaagaaag acagcggggt gcaggagtct agtcacttcc tgcagggagc aaagaaaaac 4380
aatctgtccc tggccatcct gacactggag atgactgggg atcagcgcga agtcggctca 4440
ctggggacaa gcgccactaa ctccgtgacc tacaagaaag tcgaaaatac agtgctgcca 4500
aagcccgacc tgcctaagac atctggaaaa gtcgagctgc tgccaaaagt gcatatctat 4560
cagaaggatc tgtttcccac tgaaacctcc aacggatctc ctggccacct ggacctggtg 4620
gagggaagcc tgctgcaggg gaccgaggga gcaatcaaat ggaacgaagc caatcggccc 4680
ggcaaggtcc ctttcctgag agtggccacc gagtcaagcg ccaagacacc ctccaaactg 4740
ctggatcctc tggcttggga caatcattac ggcacccaga tcccaaagga ggaatggaaa 4800
tctcaggaga agagtcccga aaaaactgcc ttcaagaaaa aggacaccat tctgtccctg 4860
aacgcttgcg aatctaatca cgcaatcgct gcaattaacg aggggcagaa caagcccgag 4920
atcgaagtga catgggccaa gcagggacga actgagcggc tgtgcagcca gaacccaccc 4980
gtgctgaaga gacatcagag ggagattaca aggaccacac tgcagtccga tcaggaggaa 5040
atcgactacg acgatactat ttctgtggag atgaaaaagg aagacttcga tatctatgac 5100
gaggatgaaa atcagagtcc tagatcattc cagaaaaaga ccaggcatta ctttattgcc 5160
gctgtggagc gcctgtggga ttatgggatg tcctctagtc ctcacgtcct gcgaaaccgg 5220
gcccagtccg gatctgtgcc acagttcaaa aaggtcgtgt tccaggagtt tactgacggc 5280
agctttaccc agccactgta ccggggggag ctgaatgaac acctgggact gctgggacca 5340
tatatccgag ctgaggtcga agataacatt atggtgacat tccgaaatca ggcatcacgg 5400
ccctacagct tttattcaag cctgatctcc tacgaggaag accagcgaca gggcgctgaa 5460
ccccggaaga acttcgtcaa gcctaacgag acaaagactt acttctggaa ggtgcagcac 5520
catatggccc ctaccaaaga cgaattcgat tgcaaggcat gggcctattt ttctgacgtg 5580
gacctggaga aggacgtgca cagtggactg atcggccctc tgctggtgtg ccataccaac 5640
acactgaatc cagcacacgg ccggcaggtc acagtgcagg aattcgctct gttctttaca 5700
atctttgatg agactaagag ctggtacttc actgagaaca tggaacgcaa ttgccgagcc 5760
ccatgtaaca ttcagatgga ggaccccact ttcaaggaaa actacagatt tcacgccatc 5820
aatggctata ttatggatac cctgcccggc ctggtcatgg ctcaggacca gagaatcagg 5880
tggtatctgc tgagcatggg ctccaacgag aatatccact ccattcattt ctctgggcat 5940
gtctttacag tgcggaaaaa ggaggaatat aaaatggccc tgtataacct gtatcccgga 6000
gtcttcgaga ctgtggaaat gctgccttcc aaggcaggca tctggagagt ggagtgcctg 6060
attggagaac acctgcatgc cggcatgtcc accctgtttc tggtgtactc taacaagtgt 6120
cagacacctc tgggaatggc aagtggccat atcagggatt tccagattac cgcatccgga 6180
cagtacggac agtgggcacc aaagctggcc cgcctgcact atagtgggtc aatcaatgcc 6240
tggagtacca aagagccctt ctcatggatt aaggtggacc tgctggcccc tatgatcatt 6300
cacgggatca aaacacaggg agctaggcag aagttctcct ctctgtatat cagtcagttt 6360
atcatcatgt attcactgga tggaaaaaag tggcagacct accgcgggaa tagcactgga 6420
accctgatgg tcttctttgg gaacgtggac agttcaggaa tcaagcataa cattttcaat 6480
cctccaatca ttgcccggta catcagactg caccccaccc attattctat tcggagtaca 6540
ctgagaatgg aactgatggg ctgcgatctg aacagctgtt ccatgcctct ggggatggag 6600
agtaaggcta tctcagacgc acagattacc gccagctcct atttcaccaa catgtttgcc 6660
acatggtctc ccagtaaagc tagactgcac ctgcagggca gaagcaatgc ctggaggcct 6720
caggtcaaca atccaaagga gtggctgcag gtggattttc agaagaccat gaaagtcaca 6780
ggcgtgacta cccagggggt caaaagcctg ctgacttcca tgtacgtgaa ggagttcctg 6840
atctctagtt cacaggacgg ccaccagtgg accctgttct ttcagaacgg aaaagtcaag 6900
gtgttccagg gcaatcagga tagctttaca cctgtcgtga actccctgga cccccctctg 6960
ctgactaggt atctgcgcat ccatccacag tcctgggtgc atcagattgc tctgcgaatg 7020
gaagtgctgg ggtgcgaagc tcaggacctg tattga 7056
<210> 72
<211> 11058
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的人类肌养蛋白基因
<400> 72
atgctgtggt gggaagaggt cgaggattgc tacgagagag aagatgtcca gaagaagact 60
tttactaaat gggtcaacgc tcagttctca aaattcggca agcagcatat cgagaacctg 120
tttagcgacc tgcaggatgg gcggagactg ctggacctgc tggagggact gactggccag 180
aaactgccca aagaaaaggg ctctaccaga gtgcacgccc tgaacaatgt caataaggct 240
ctgagggtgc tgcagaacaa taacgtggat ctggtcaata tcgggagcac cgacattgtg 300
gatggaaacc acaagctgac actgggcctg atctggaata tcattctgca ttggcaggtg 360
aaaaatgtca tgaagaacat catggccggc ctgcagcaga caaacagcga gaagattctg 420
ctgtcctggg tgaggcagtc tactcgcaat taccctcaag tgaatgtcat caacttcacc 480
acaagctggt ccgacggact ggccctgaac gctctgattc actcccatcg cccagacctg 540
ttcgattgga attccgtggt ctgccagcag tctgccaccc agaggctgga gcacgccttt 600
aacatcgctc gctatcagct gggcattgag aagctgctgg acccagaaga cgtggatact 660
acctaccccg acaagaagtc catcctgatg tatattacaa gtctgttcca ggtgctgcca 720
cagcaggtca gcatcgaggc cattcaggaa gtggagatgc tgccccggcc ccctaaagtc 780
accaaggagg aacactttca gctgcaccat cagatgcatt acagtcagca gatcaccgtg 840
agcctggctc agggatatga gcgaaccagc tccccaaaac cccggttcaa gtcctacgca 900
tatacacagg ccgcttacgt gacaacttct gacccaacta gatccccttt cccatctcag 960
catctggagg ctcccgaaga caagtctttt ggctctagtc tgatggaaag tgaggtgaac 1020
ctggataggt atcagactgc cctggaggaa gtcctgagtt ggctgctgtc agccgaggat 1080
accctgcagg ctcagggcga gatcagcaac gacgtggaag tggtcaagga tcagttccac 1140
acacatgagg ggtacatgat ggacctgact gcccaccagg ggagagtggg aaatatcctg 1200
cagctggggt caaaactgat tggaaccggc aagctgagcg aggatgagga aacagaggtg 1260
caggaacaga tgaatctgct gaactcccgg tgggagtgcc tgagagtggc cagtatggaa 1320
aagcagtcaa atctgcatag ggtcctgatg gacctgcaga atcagaaact gaaggagctg 1380
aacgattggc tgaccaagac agaggaaagg acccgcaaaa tggaggagga gcccctggga 1440
ccagacctgg aggatctgaa gcggcaggtg cagcagcaca aagtcctgca ggaagacctg 1500
gaacaggagc aggtgagagt caacagcctg acacacatgg tggtcgtggt ggacgagtca 1560
agcggagatc atgctactgc cgccctggag gagcagctga aggtgctggg cgatcgctgg 1620
gcaaatatct gtaggtggac tgaggaccgc tgggtgctgc tgcaggatat tctgctgaag 1680
tggcagcggc tgaccgagga gcagtgcctg ttcagcgcct ggctgtccga aaaagaggac 1740
gcagtgaaca agatccacac cacaggcttt aaggatcaga atgagatgct gtcctctctg 1800
cagaaactgg cagtgctgaa ggccgacctg gagaagaaaa agcagagcat ggggaaactg 1860
tactccctga agcaggatct gctgtctaca ctgaaaaaca agagtgtgac tcagaagacc 1920
gaggcatggc tggacaattt cgccagatgt tgggataacc tggtgcagaa actggagaag 1980
tccaccgcac agatctccca ggccgtgact accacacagc ctagcctgac ccagactacc 2040
gtcatggaga cagtgacaac tgtcaccaca cgcgaacaga ttctggtgaa gcatgcacag 2100
gaggagctgc caccacctcc accacagaaa aagcggcaga tcaccgtgga ctccgagatt 2160
cgaaagcggc tggacgtgga catcactgaa ctgcactctt ggattaccag gagtgaggcc 2220
gtgctgcaga gcccagaatt cgctatcttt cgcaaggagg ggaatttctc cgatctgaaa 2280
gagaaggtga acgctattga aagagagaaa gcagaaaagt ttaggaaact gcaggacgcc 2340
tctcgcagtg ctcaggcact ggtggagcag atggtcaatg aaggagtgaa cgccgattca 2400
atcaagcagg ctagcgagca gctgaactcc aggtggattg aattctgcca gctgctgagc 2460
gagcgcctga actggctgga ataccagaat aacatcattg ccttctacaa tcagctgcag 2520
cagctggaac agatgactac cacagccgag aactggctga aaatccagcc cactacccct 2580
tcagagccaa cagccatcaa gagccagctg aagatttgta aagacgaagt gaatagactg 2640
tctggcctgc agcctcagat tgagaggctg aagatccaga gtattgccct gaaagaaaag 2700
gggcagggac caatgtttct ggacgctgat ttcgtggcct tcaccaacca cttcaagcag 2760
gtcttttccg acgtgcaggc tcgcgaaaaa gagctgcaga caatcttcga tactctgcct 2820
ccaatgcgat accaggagac tatgtctgcc attcggacct gggtgcagca gtctgaaaca 2880
aagctgagta tccctcagct gtcagtcact gactatgaga ttatggaaca gcggctggga 2940
gagctgcagg ctctgcagag ttcactgcag gaacagcagt caggactgta ctatctgagc 3000
acaactgtga aagagatgtc aaaaaaggcc ccatccgaaa tctctcgcaa gtaccagagc 3060
gagtttgaag agattgaagg acgatggaaa aagctgagct cccagctggt ggagcattgt 3120
cagaagctgg aggagcagat gaataagctg cgcaaaatcc agaaccacat tcagacactg 3180
aaaaagtgga tggccgaggt ggacgtgttc ctgaaggaag agtggcctgc tctgggcgat 3240
tctgagatcc tgaaaaagca gctgaagcag tgccggctgc tggtgagtga catccagacc 3300
attcagccaa gtctgaattc agtcaacgag ggcgggcaga aaatcaagaa cgaagctgag 3360
cccgaatttg caagcagact ggagacagaa ctgaaggagc tgaatactca gtgggaccat 3420
atgtgccagc aggtgtacgc caggaaagaa gctctgaagg gaggcctgga gaaaaccgtc 3480
tccctgcaga aggatctgtc tgagatgcac gaatggatga cacaggccga agaggaatac 3540
ctggagcggg acttcgaata taagactcca gatgagctgc agaaagccgt ggaggaaatg 3600
aagagagcaa aagaggaagc ccagcagaag gaggctaaag tgaagctgct gacagaaagc 3660
gtgaactccg tcatcgcaca ggctccacct gtggcacagg aggccctgaa aaaggagctg 3720
gaaactctga ccacaaatta ccagtggctg tgcacccggc tgaacggcaa atgcaagaca 3780
ctggaggaag tgtgggcatg ctggcatgag ctgctgtcct atctggaaaa ggccaacaag 3840
tggctgaacg aggtggaatt caaactgaag actaccgaga acatccccgg cggagccgag 3900
gaaattagcg aggtgctgga ctccctggaa aatctgatgc gccacagcga ggataatcct 3960
aaccagatcc gaattctggc acagactctg accgacggag gcgtgatgga tgaactgatc 4020
aatgaggaac tggagacctt taactccaga tggagggagc tgcatgagga agctgtgagg 4080
cgccagaaac tgctggaaca gtctatccag agtgcacagg agacagaaaa gtccctgcac 4140
ctgatccagg agtctctgac tttcattgac aagcagctgg ctgcatacat tgctgacaaa 4200
gtggatgccg ctcagatgcc ccaggaggca cagaagatcc agtctgatct gaccagtcac 4260
gaaatttcac tggaggaaat gaaaaagcat aaccagggca aggaggcagc ccagagagtc 4320
ctgtcccaga tcgacgtggc acagaaaaag ctgcaggacg tgagcatgaa attccgactg 4380
tttcagaagc cagccaattt cgagctgcgg ctgcaggaaa gcaagatgat cctggacgag 4440
gtgaaaatgc atctgcccgc cctggaaacc aagtcagtcg agcaggaagt ggtccagagc 4500
cagctgaatc actgcgtgaa cctgtataag tcactgagcg aggtcaagtc cgaggtggaa 4560
atggtcatca agaccggaag gcagattgtg cagaaaaagc agacagagaa cccaaaggag 4620
ctggacgaac gcgtgaccgc cctgaaactg cactataatg agctgggcgc taaagtcaca 4680
gagagaaagc agcagctgga aaagtgtctg aaactgagcc ggaagatgag aaaagagatg 4740
aacgtgctga ccgaatggct ggctgcaacc gacatggagc tgacaaagag gtccgccgtg 4800
gaagggatgc ccagcaatct ggattccgag gtcgcttggg gaaaagcaac ccagaaggag 4860
atcgaaaaac agaaggtgca cctgaagtct attacagagg tcggggaagc cctgaaaacc 4920
gtgctgggaa aaaaggagac actggtggaa gacaagctgt ctctgctgaa tagtaactgg 4980
atcgccgtca caagccgcgc tgaggaatgg ctgaacctgc tgctggagta ccagaaacac 5040
atggaaactt ttgaccagaa tgtggatcat attactaagt ggatcattca ggccgacacc 5100
ctgctggatg agagcgagaa gaagaagccc cagcagaaag aggacgtgct gaagcggctg 5160
aaagctgaac tgaacgatat ccgacctaag gtggactcta cacgggatca ggccgctaat 5220
ctgatggcca accgagggga ccactgccga aagctggtgg agccacagat cagcgaactg 5280
aaccacagat tcgcagccat ctcccatagg attaagaccg gaaaagcttc tattcccctg 5340
aaggagctgg aacagtttaa ttccgatatc cagaaactgc tggagcctct ggaggccgaa 5400
attcagcagg gcgtgaatct gaaagaggaa gacttcaaca aggatatgaa tgaggacaac 5460
gaagggactg tgaaagagct gctgcagcgc ggagacaacc tgcagcagcg aatcaccgat 5520
gagcgcaagc gagaggaaat caaaattaag cagcagctgc tgcagaccaa acataatgcc 5580
ctgaaggacc tgaggagtca gcgacggaag aaagctctgg agatctcaca ccagtggtat 5640
cagtataagc gccaggctga cgatctgctg aaatgcctgg acgatattga gaagaaactg 5700
gcatccctgc ccgagcctag ggacgaacgc aaaatcaagg agattgatag agaactgcag 5760
aagaaaaagg aggaactgaa cgcagtgaga aggcaggccg agggactgtc tgaagacggc 5820
gctgcaatgg ccgtggagcc tacccagatc cagctgtcca agcggtggag agagattgaa 5880
tctaaattcg cacagtttcg ccgactgaat tttgcccaga tccatactgt cagggaggaa 5940
accatgatgg tcatgacaga ggacatgcca ctggaaatct catacgtgcc cagcacatat 6000
ctgactgaga ttacccacgt cagccaggcc ctgctggagg tggaacagct gctgaacgct 6060
cccgacctgt gcgcaaagga cttcgaggat ctgtttaaac aggaagaaag tctgaagaat 6120
atcaaagact cactgcagca gtctagtggg cggattgata tcattcacag taaaaagact 6180
gccgctctgc agtcagctac ccctgtggag agagtcaagc tgcaggaagc actgagtcag 6240
ctggacttcc agtgggagaa ggtgaacaaa atgtataagg accgacaggg acggtttgat 6300
agatcagtcg agaagtggcg gagattccat tacgatatca aaatcttcaa ccagtggctg 6360
actgaggcag aacagttcct gcgcaaaacc cagatccccg agaattggga acacgccaaa 6420
tacaagtggt atctgaagga gctgcaggac ggcattgggc agagacagac cgtggtcagg 6480
acactgaacg ccactggaga ggaaatcatt cagcagtcaa gcaagaccga cgctagcatc 6540
ctgcaggaga aactgggctc cctgaatctg cgctggcagg aagtgtgcaa acagctgagc 6600
gataggaaaa agcgcctgga ggaacagaag aacatcctgt ccgaattcca gcgggacctg 6660
aatgagtttg tgctgtggct ggaggaagcc gataacatcg cttccattcc cctggagcct 6720
ggcaaagaac agcagctgaa agagaagctg gaacaggtca agctgctggt ggaggaactg 6780
cctctgcggc aggggatcct gaagcagctg aatgaaaccg gaggaccagt gctggtctcc 6840
gccccaattt ctcccgagga acaggacaag ctggagaaca agctgaagca gacaaacctg 6900
cagtggatca aggtgtctag agcactgcct gagaaacagg gcgagatcga agcccagatt 6960
aaggacctgg ggcagctgga gaaaaagctg gaagatctgg aggaacagct gaaccatctg 7020
ctgctgtggc tgagcccaat caggaatcag ctggagatct acaatcagcc aaaccaggaa 7080
ggacccttcg acgtgcagga gacagaaatc gctgtgcagg caaagcagcc cgatgtcgag 7140
gaaattctgt ccaaaggcca gcacctgtat aaagagaagc ccgccaccca gcctgtgaaa 7200
cgcaagctgg aggacctgtc ctctgaatgg aaagctgtca acaggctgct gcaggagctg 7260
cgcgcaaagc agccagatct ggcccctggc ctgacaacta tcggagctag tccaacacag 7320
actgtgaccc tggtcaccca gcccgtggtc acaaaagaaa ctgccatttc aaagctggag 7380
atgcctagtt cactgatgct ggaggtgcca gcactggccg acttcaacag ggcctggacc 7440
gaactgacag actggctgtc tctgctggat caggtcatca agagtcagcg cgtgatggtc 7500
ggcgacctgg aggatattaa tgaaatgatc atcaagcaga aggccaccat gcaggatctg 7560
gagcagaggc gcccacagct ggaggaactg atcacagcag cccagaatct gaaaaacaag 7620
actagcaacc aggaggccag gactatcatt accgaccgaa tcgaacggat tcagaatcag 7680
tgggatgagg tgcaggaaca cctgcagaat cgacggcagc agctgaacga gatgctgaag 7740
gactctaccc agtggctgga ggcaaaagag gaagcagaac aggtgctggg acaggctcgc 7800
gcaaaactgg agagttggaa ggaagggccc tacactgtgg acgcaatcca gaaaaagatt 7860
acagagacta aacagctggc caaggatctg cggcagtggc agaccaatgt ggatgtcgct 7920
aacgacctgg cactgaaact gctgagagac tatagcgccg acgatacaag gaaggtgcac 7980
atgatcactg agaatattaa cgcttcatgg aggagcatcc ataagcgagt gtccgagcgg 8040
gaagctgcac tggaggaaac ccaccgcctg ctgcagcagt tccctctgga cctggagaag 8100
tttctggcat ggctgactga ggccgaaacc acagctaacg tgctgcagga cgccaccaga 8160
aaagagaggc tgctggaaga ttccaaagga gtgaaggagc tgatgaagca gtggcaggat 8220
ctgcagggcg agatcgaagc tcacaccgac gtgtaccata atctggatga gaactcccag 8280
aagattctga ggagtctgga aggctcagac gatgccgtgc tgctgcagag aaggctggac 8340
aatatgaact ttaagtggtc tgagctgcgg aaaaagtctc tgaacatcag aagtcacctg 8400
gaagccagct ccgatcagtg gaaaagactg catctgtcac tgcaggagct gctggtgtgg 8460
ctgcagctga aggacgatga gctgagcagg caggctccta tcgggggaga cttcccagca 8520
gtccagaagc agaatgatgt gcacagagcc tttaaaaggg agctgaaaac aaaggaacca 8580
gtgatcatga gcacactgga gactgtcaga attttcctga ctgaacagcc tctggagggc 8640
ctggaaaagc tgtaccagga gccaagggaa ctgccacccg aggaacgcgc acagaacgtg 8700
acccgactgc tgcgaaagca ggctgaggaa gtcaatacag agtgggaaaa actgaacctg 8760
cactccgccg actggcagcg caagatcgat gagaccctgg aacgactgca ggagctgcag 8820
gaagcaacag acgagctgga tctgaagctg aggcaggccg aagtgatcaa aggatcttgg 8880
cagcccgtcg gcgatctgct gattgacagt ctgcaggatc atctggagaa agtgaaggct 8940
ctgcgggggg agatcgcacc actgaaggaa aatgtgagcc acgtcaacga cctggccaga 9000
cagctgacta ccctgggaat tcagctgtca ccctataatc tgagcacact ggaggatctg 9060
aacactcggt ggaagctgct gcaggtggca gtcgaggaca gggtgcgcca gctgcacgaa 9120
gcacatagag atttcggccc tgcctcccag cactttctgt ccacatctgt gcagggacca 9180
tgggagaggg ccatctctcc taacaaggtg ccctactata ttaaccacga gactcagaca 9240
acttgctggg accatcccaa gatgaccgaa ctgtaccaga gcctggccga tctgaataac 9300
gtgcgctttt ccgcatatcg aaccgccatg aaactgcgcc gactgcagaa ggccctgtgc 9360
ctggacctgc tgagtctgtc agccgcttgc gacgccctgg atcagcataa tctgaagcag 9420
aacgaccagc ccatggatat cctgcagatc attaactgtc tgaccacaat ctacgatcgg 9480
ctggagcagg aacacaataa cctggtgaat gtccctctgt gcgtggacat gtgcctgaat 9540
tggctgctga acgtctatga taccggcaga acagggcgaa tccgggtgct gagcttcaag 9600
actggcatca tttccctgtg caaagctcat ctggaggaca agtacaggta tctgttcaaa 9660
caggtggcat ctagtaccgg cttttgcgac cagcggagac tgggactgct gctgcacgat 9720
agcatccaga ttcccaggca gctgggagag gtggctagct tcggcggatc caacatcgaa 9780
ccctccgtcc gctcttgctt ccagtttgcc aataacaagc ctgagattga agcagccctg 9840
tttctggact ggatgcggct ggagcctcag agcatggtct ggctgccagt gctgcacaga 9900
gtcgctgcag ccgagacagc taaacatcag gcaaagtgca acatctgtaa agaatgccct 9960
atcattggct tcagatacag gtccctgaag cactttaatt acgatatctg tcagtcttgc 10020
ttctttagtg gcagagtggc caaagggcac aagatgcatt accccatggt cgagtattgt 10080
acccctacta cctctgggga agacgtgcgg gattttgcca aggtgctgaa aaacaagttc 10140
cggaccaaaa gatactttgc taagcatccc cggatgggat atctgcctgt gcagacagtc 10200
ctggagggcg acaatatgga aactcccgtg accctgatca acttctggcc tgtcgatagc 10260
gcccccgctt caagccctca gctgagtcac gacgataccc attcacgaat tgagcactac 10320
gcctcccggc tggctgagat ggaaaatagt aacggctcat atctgaatga cagcatctcc 10380
cctaacgagt ctattgacga tgaacacctg ctgatccagc attactgcca gagtctgaat 10440
caggatagcc cactgtccca gcctaggtca ccagcccaga tcctgatttc tctggagagt 10500
gaggaacggg gggagctgga aagaatcctg gctgacctgg aggaagagaa tcggaacctg 10560
caggcagagt atgatagact gaagcagcag cacgaacata aaggactgtc accactgccc 10620
agccctccag agatgatgcc cacctcacct cagagcccac gggacgctga gctgatcgca 10680
gaagccaagc tgctgagaca gcacaaagga cgcctggaag cccgaatgca gattctggag 10740
gatcacaaca agcagctgga aagccagctg catcgactgc gacagctgct ggagcagcca 10800
caggctgaag caaaagtgaa tggcacaact gtctcctctc cctctaccag tctgcagcgg 10860
agtgacagtt cacagcctat gctgctgaga gtggtcggat cacagacatc agacagcatg 10920
ggcgaagagg atctgctgag cccccctcag gatacctcca caggcctgga agaagtgatg 10980
gagcagctga ataactcctt cccatccagc agaggcagaa ataccccagg aaaaccaatg 11040
agagaggaca ctatgtga 11058
<210> 73
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 人类 ATP合酶线粒体Fo复合体B1亚基mRNA的一部分
<400> 73
gctacctgga ct 12
<210> 74
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 人类 ATP合酶线粒体Fo复合体B1亚基mRNA的一部分
<400> 74
gcagcaggcc aggcacag 18
<210> 75
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 人类肽基脯氨酰异构酶A (亲环素A)mRNA的一部分
<400> 75
tggcctccca aactgctg 18
<210> 76
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 人类核糖体蛋白大亚基P1(RPLP1) mRNA的一部分
<400> 76
cagccctaca ct 12
<210> 77
<211> 2652
<212> DNA
<213> 人工序列
<220>
<223> T7 RNA聚合酶cDNA
<400> 77
atgaacacca tcaacatcgc aaaaaacgac tttagtgaca tcgaactggc tgctatcccc 60
ttcaatactc tggctgacca ttacggggag cgactggcca gagagcagct ggctctggag 120
cacgaaagct acgagatggg ggaagcccga ttccggaaga tgtttgagcg gcagctgaaa 180
gctggagaag tggcagacaa cgccgctgca aagccactga ttaccacact gctgcccaaa 240
atgatcgcca gaattaatga ttggttcgag gaagtgaagg caaaaagagg caagaggcct 300
accgccttcc agtttctgca ggagatcaag ccagaagcag tggcctacat caccatcaag 360
actaccctgg catgcctgac aagcgccgac aacacaactg tgcaggctgt cgcatccgcc 420
atcgggaggg ctattgagga cgaagcacgc tttggaagaa tcagggatct ggaggccaag 480
cacttcaaga agaacgtgga ggagcagctg aacaagcggg tgggacacgt ctacaagaag 540
gccttcatgc aggtggtcga ggccgacatg ctgtcaaagg gactgctggg aggagaggca 600
tggagctcct ggcacaaaga agatagcatc catgtggggg tcaggtgcat cgagatgctg 660
attgaatcta ccggaatggt gagtctgcac cgacagaacg caggagtggt cggacaggac 720
tctgagacaa tcgaactggc tcccgagtac gctgaagcaa ttgccactag agctggggca 780
ctggccggaa tcagtcccat gttccagcct tgcgtggtgc cccctaagcc atggactggc 840
atcaccggag gcgggtactg ggctaatggg cggagacccc tggcactggt gaggacacac 900
agcaagaaag ccctgatgcg ctacgaggat gtctatatgc ctgaagtgta taaggccatc 960
aacattgctc agaatacagc atggaaaatt aacaagaaag tgctggctgt cgcaaatgtg 1020
atcactaagt ggaaacattg tcctgtggag gacatcccag ccattgaaag ggaggaactg 1080
cctatgaagc cagaggacat cgatatgaac ccagaagccc tgaccgcttg gaaacgagcc 1140
gctgcagccg tgtatagaaa ggatcgcgcc cgaaaatcca ggcgcatttc tctggagttc 1200
atgctggaac aggccaacaa gtttgctaat cataaagcaa tctggttccc ttacaacatg 1260
gactggcggg ggagagtcta tgccgtgtcc atgttcaacc cacagggaaa tgatatgaca 1320
aagggcctgc tgactctggc taagggcaaa cccattggaa aggagggcta ctattggctg 1380
aaaatccacg gagcaaattg cgcaggagtg gacaaggtgc cattcccaga gcggatcaag 1440
ttcatcgagg aaaaccatga aaatattatg gcctgtgcta agtctcccct ggagaacaca 1500
tggtgggccg aacaggatag tcctttctgc tttctggcct tctgttttga gtacgctggg 1560
gtgcagcacc atggactgag ttataattgc tcactgcccc tggcctttga cggctcttgt 1620
agtgggatcc agcacttctc cgcaatgctg cgggatgagg tcggaggcag agccgtgaac 1680
ctgctgcctt ctgagactgt gcaggacatc tacggcattg tcgccaagaa agtgaatgag 1740
atcctgcagg cagacgccat taacggaacc gataatgagg tggtcaccgt cacagatgaa 1800
aacactggcg agatctctga aaaggtgaaa ctggggacca aggctctggc aggacagtgg 1860
ctggcacatg gagtcacccg ctcagtgaca aagcgaagcg tgatgacact ggcttacggc 1920
agcaaagagt tcgggtttag acagcaggtg ctggaagaca ccatccagcc cgccattgat 1980
tccgggaagg gacccatgtt tacacagcct aaccaggctg caggctatat ggccaagctg 2040
atctgggagt cagtgagcgt cactgtggtc gccgctgtgg aagctatgaa ttggctgaag 2100
tccgccgcca aactgctggc tgcagaggtg aaggacaaga aaactggcga aattctgagg 2160
aaacgctgcg ccgtccactg ggtgacccca gatgggttcc ccgtgtggca ggagtacaag 2220
aaacctatcc agacccggct gaacctgatg ttcctgggcc agtttagact gcagccaaca 2280
atcaacacta ataaggacag tgagattgat gctcataaac aggaatcagg aattgcacca 2340
aattttgtgc acagccagga cggctcccat ctgaggaaga ccgtggtctg ggctcacgag 2400
aaatatggca tcgaatcctt cgcactgatt catgactctt ttgggacaat ccccgccgat 2460
gccgctaatc tgttcaaggc tgtccgcgag actatggtgg acacctacga aagttgtgat 2520
gtgctggccg acttctatga tcagtttgct gaccagctgc acgagtcaca gctggataag 2580
atgcctgccc tgcccgctaa gggcaacctg aacctgaggg acattctgga gtctgatttc 2640
gcattcgctt ga 2652
<210> 78
<211> 4242
<212> DNA
<213> 人工序列
<220>
<223> hN-hPolS-hC cDNA
<400> 78
accagacaag agtttaagag atatgtatcc ttttaaattt tcttaagaaa aacttagggt 60
gaaagtatcc accctgagga gcaggttcca gatccttttc tttgctgcca aagtccacca 120
tggccggcct tctgtccact ttcgacacct ttagctcacg gcgctccgag tccatcaaca 180
agtccggcgg tggagccgtg atccctggac agcgctccac tgtctccgtg ttcgtcctcg 240
ggccgtcggt gaccgacgac gccgacaagc tgttcatcgc cactactttc ctcgctcatt 300
ccctggatac cgataagcag cactcccagc gcggaggttt tttggtgtct ctcctggcaa 360
tggcctactc gtccccggag ctgtacctga caactaacgg agtgaacgcg gacgtgaaat 420
acgtgatcta caacatcgaa aaggacccga agcggaccaa gaccgacggt ttcattgtca 480
agactcggga tatggagtac gagaggacca ccgagtggct tttcggccca atggtcaaca 540
agagcccgct gttccaagga cagcgggacg ccgcggaccc cgacaccctg ctgcaaatct 600
acggctaccc tgcttgcctg ggagccatca tcgtccaagt ctggattgtg ctcgtgaagg 660
ccattaccag ctccgccggt ctgagaaagg ggtttttcaa ccgcctggag gcgttcagac 720
aggacggcac cgtgaagggg gcactggtgt tcaccggcga aaccgtggaa ggaatcggct 780
cagtgatgcg gtcccagcag tccctggtgt cgctgatggt ggaaactctc gtgaccatga 840
acacggcccg gtcggacctg accaccctgg agaagaacat ccagattgtg ggcaactaca 900
ttcgggatgc cggactcgct agcttcatga acactattaa gtacggagtg gaaaccaaga 960
tggccgccct gactctctcc aacctgaggc ccgatatcaa caagctgcgc tcgctgatcg 1020
atacctacct gtcaaagggg cccagggccc cattcatttg catacttaaa gaccctgtgc 1080
acggagagtt cgcccctgga aactatcccg ctctgtggag ctacgcaatg ggagtggccg 1140
tggtgcagaa caaggccatg cagcaatacg tcaccgggag gacctatctc gatatggaga 1200
tgttcctgct ggggcaggcc gtggcgaagg acgcagaaag caaaatctcg tcggcccttg 1260
aagatgaact gggtgtcact gacaccgcga agggcagact cagacaccac ttggccaacc 1320
tcagcggagg agatggagct taccacaagc cgactggggg tggagcgatt gaagtcgccc 1380
tggataacgc cgacatcgac cttgagacta aggcgcatgc ggaccaggac gccaggggat 1440
ggggcgggga cagcggcgaa cgctgggccc gccaagtgtc cggcggtcac ttcgtgacct 1500
tgcatggcgc ggagcgcctg gaagaggaaa ccaatgatga ggacgtgtca gacatcgaaa 1560
gacggatcgc catgcgactg gctgaacggc gccaggagga ttccgcgacg cacggggacg 1620
agggacggaa caatggagtg gaccacgacg aagatgacga cgccgcagcc gtggccggaa 1680
tcggcggaat ctagcggttt atttattgat ccttatttat tcaaagatct acgaggcctc 1740
agtttgtcta cttggtctta agaaaaactt agggtgaaag cctcagtgcc ccattctcac 1800
tgctactagt cgccaacatg gaccaggacg cattcattct gaaagaagat tcagaagtcg 1860
aacgcgaagc ccccggtgga agggagtctc tcagcgacgt gatcggattc ctggacgccg 1920
tgctgtcatc ggaaccgacc gacattgggg gagacaggtc gtggctgcac aacactatca 1980
acaccccgca agggcctggc tccgcgcatc gggccaagtc ggagggagaa ggagaagtgt 2040
caaccccgag cacccaggac aaccgctcag gggaagagtc cagagtctcc ggtagaacgt 2100
caaagcctga agccgaggcc catgccggaa acctggataa gcagaacatt caccgggcct 2160
ttggtggccg caccgggaca aactccgtgt cgcaagacct gggcgatggc ggcgattccg 2220
gtatcctgga gaatccccca aacgagaggg gatacccaag atccggaatc gaggacgaaa 2280
accgggaaat ggcagcccac cctgataagc ggggcgaaga tcaggccgaa ggcctgcctg 2340
aggaggtccg gggatcgacc tccttgcctg acgaagggga aggcggcgcc tcgaacaacg 2400
gccggtcaat ggagcccggc agctcccatt ccgctcgggt cactggagtc ctcgtgattc 2460
cttccccgga actggaggaa gccgtgctga ggcggaacaa gcggcggccg accaactccg 2520
gatcaaagcc tctgactccc gccaccgtgc ccggaactag gtccccgccc ctgaaccgat 2580
acaactcgac cgggtcacca cccggaaagc cgccgtccac ccaagacgag cacatcaaca 2640
gcggggacac tccggccgtg cgcgtgaagg accggaagcc acccatcggc actcggagcg 2700
tgtctgactg tcctgcgaat ggtagaccca tccaccctgg cctggaaacc gactccacca 2760
agaagggaat aggggagaac acctccagca tgaaggagat ggctactctg ctcacctcgc 2820
ttggcgtgat ccagtccgcg caagagttcg aatccagccg cgacgcctcc tacgtgttcg 2880
cgcggcgcgc cctgaagtcc gcgaactacg ccgagatgac tttcaacgtg tgcggattga 2940
tcctgtccgc ggaaaagagc tccgcaagaa aagtggacga gaacaagcag ctgctcaagc 3000
agatccagga gagcgtggag tccttccgcg acatctacaa acgcttctcc gagtatcaga 3060
aggagcagaa ctcccttctc atgtccaacc tgtccaccct tcacatcatc actgatcggg 3120
gtggaaagac ggataacacc gattcgttga cccgctcccc gagcgtgttc gccaagtcca 3180
aagagaacaa gactaaggcc accagatttg atccttcgat ggaaaccctg gaggacatga 3240
agtacaagcc cgacctcatt cgggaggacg aattccggga cgagatcaga aacccggtgt 3300
accaagagag ggacaccgaa ccccgcgcta gcaatgctag ccgcctcctg ccgtcaaagg 3360
agaagccaac catgcactcg ctgcggctgg tcattgaaag ctctcccctg tcccgcgcgg 3420
aaaaggtcgc ctacgtgaaa agcctctcga agtgcaagac cgaccaggaa gtgaaggccg 3480
tgatggaact ggtggaggag gacatcgaat ccctcaccaa ttgaaccggt gtcgacggag 3540
ccgcaccttg tcatgtacca tcaatattaa gaaaaactta gggtgaaagt ctcccctcct 3600
cacacctagg agaccaccat gcccagcttt ctcaagaaga ttttgaaact tcggggacga 3660
cgccaggagg acgagtcgcg gagccggatg ctttccgatt cctcaatgtt gtcatgccgc 3720
gtgaatcagc tgacatcaga agggacggaa gccggatcga cgacgccctc gactttgccg 3780
aaagaccagg cattgctgat cgagccgaaa gtccgcgcga aagaaaagtc gcagcaccga 3840
aggcccaaga ttatcgatca agtgagaagg gtcgaatccc ttggtgagca ggcgagccag 3900
agacaaaaac atatgcttga aacgctgatc aacaagattt acaccgggcc tcttggagaa 3960
gagctggtgc agacactcta tcttcggatt tgggcgatgg aagagactcc ggaatcgctg 4020
aagatcctcc aaatgagaga ggacattcgc gatcaggtac tgaagatgaa aaccgaaaga 4080
tggttgagga ctctcatcag gggcgagaaa acaaagttga aagacttcca aaagcgatac 4140
gaggaggtgc atccctatct catgaaggaa aaggtagaac aggtcattat ggaggaggcg 4200
tggtcactcg ccgcacacat cgtgcaagag tgataacccg gg 4242
<210> 79
<211> 6884
<212> DNA
<213> 人工序列
<220>
<223> hPolL cDNA
<400> 79
gcggccgctt aagaaaaact tagggtgaat gtaaagcttt ctggccacca tggacggtca 60
ggaatcaagc cagaatccgt ccgacatcct ctacccggag tgccatctta acagcccgat 120
cgtacgcggg aagatcgcac agcttcacgt cctgttggat gtcaatcagc cgtacagatt 180
gaaagatgac tcaatcatta acattaccaa gcacaagatt cgaaatggag gtttgtcacc 240
tcggcagatt aaaatccggt cactggggaa ggcgcttcag aggaccatca aagaccttga 300
ccgctacacc ttcgagccct acccgacgta ctcccaagaa cttttgcggc tcgacatccc 360
ggagatctgc gataagatcc ggtcggtgtt tgccgtatcc gataggctta cgcgcgagtt 420
gtcgtcgggg ttccaagacc tctggctcaa tatctttaaa cagcttggga atatcgaagg 480
ccgagaaggc tacgacccgc ttcaggatat cggcacgatt cccgagatca ccgacaaata 540
ctcaaggaat cgatggtaca gacccttcct tacatggttc tcaatcaaat acgatatgag 600
gtggatgcag aaaactaggc cgggagggcc tcttgacacg agcaattcgc ataacctctt 660
ggagtgtaag tcctacacgc tggtgacgta cggcgacctt atcatgattt tgaacaaact 720
cacgcttacg gggtacatct tgacaccaga attggtactt atgtactgtg acgtagtgga 780
aggaaggtgg aacatgtcag cagcgggcca cctcgacaag aagtccatcg gaattacttc 840
caaaggggag gaattgtggg agttggtgga ctcgttgttt agcagccttg gtgaggagat 900
ctacaacgta atcgcccttt tggagccgct ttcactcgcg ttgatccaac tcaacgatcc 960
cgtcattcct ttgcggggtg cgtttatgag acacgtactg actgagcttc aggcagtgtt 1020
gacatcgaga gatgtctaca cggatgccga agcggatact atcgtggagt cactccttgc 1080
aatcttccac ggcaccagca tcgacgagaa agctgaaatc tttagcttct ttcggacttt 1140
cgggcacccc tcacttgaag ccgtcaccgc ggctgacaaa gtacgggcgc acatgtacgc 1200
gcagaaggcg attaaactta agacgttgta cgagtgccat gctgtgttct gcacaatcat 1260
tattaatggt tacagagagc ggcacggggg tcagtggccc ccttgcgact ttccagacca 1320
cgtctgcttg gagctcagaa atgcacaggg ttcgaacacg gcgatcagct acgaatgtgc 1380
ggtggacaac tatactagct tcatcgggtt caaattcagg aaattcatcg aaccacagct 1440
ggacgaagac ctgactatct acatgaagga taaggcgctg tcaccgagga aagaagcatg 1500
ggatagcgtg taccccgact caaatttgta ctataaagcg ccagagtccg aggagacacg 1560
gcggttgatt gaggtgttca ttaacgatga gaattttaac ccagaagaga tcatcaacta 1620
tgtcgagtcg ggcgactggc tcaaggacga gaagttcaac atctcgtact ccttgaaaga 1680
aaaagaaatc aagcaggagg ggcgactgtt cgctaagatg acatacaaga tgcgagccgt 1740
gcaagtcttg gcggaaacct tgttggcaaa ggggatcgga gaattgttct cggaaaacgg 1800
aatggtcaag ggagagatcg accttttgaa acgcctgaca accttgtcgg tctcgggagt 1860
cccgcgcact gactcggtgt ataacaacag caagtcctcg gagaagcgaa acgaggggat 1920
gaagaagaag aattcaggtg gatactggga cgagaaaaag agatccaggc atgagttcaa 1980
ggccacagac tcgtcaacgg atggttatga aacgctttcg tgcttcctga cgaccgatct 2040
caaaaagtac tgcctcaact ggcggttcga aagcacagca ctttttgggc agagatgtaa 2100
cgaaatcttt gggtttaaga ccttctttaa ctggatgcac cccgtcttgg agcggtgcac 2160
aatctacgta ggagatccat actgtccggt ggctgaccga atgcataggc aactccagga 2220
ccatgcggat tccggaattt tcatccacaa cccgagagga ggaatcgagg ggtattgcca 2280
gaaactctgg accctgattt cgattagcgc gattcacctt gctgcggtgc gagtgggggt 2340
cagggtgtca gcgatggtgc agggagataa tcaggcaatc gcggtcactt cgcgagtgcc 2400
ggtcgcgcag acgtacaaac agaagaaaaa tcatgtatac aaggaaatca ccaagtactt 2460
tggggctctg cggcacgtca tgtttgacgt gggacacgag ttgaaactta atgaaacgat 2520
catcagctcg aaaatgtttg tatacagcaa gagaatttac tacgacggaa agattctccc 2580
gcagtgcttg aaggctctga ctcgatgtgt attctggagc gaaacgctgg tcgatgaaaa 2640
caggtcagca tgtagcaata tctcgacatc gatcgcaaaa gcgattgaaa atggttattc 2700
gccaattttg ggatactgta tcgcgcttta caaaacgtgt cagcaagtgt gtatctcgct 2760
gggtatgacc attaacccca ccatttcgcc tacggtgcgg gatcagtact tcaagggaaa 2820
gaattggctg aggtgcgcgg tgttgatccc agcaaatgtg ggaggtttta actatatgtc 2880
cacgtcacga tgctttgtcc ggaatatcgg tgatccagcc gtggccgctc tggccgattt 2940
gaaaagattc atccgagctg acttgctcga caagcaggtg ttgtatcggg tgatgaatca 3000
ggagccgggt gactcctcat ttttggattg ggcgtccgac ccgtactcgt gcaatctgcc 3060
gcactcccaa tcgatcacca ctatcatcaa gaacatcaca gccaggtcag tgttgcaaga 3120
aagcccgaat cctctgttgt caggtctctt cacagagact tcgggggagg aagatttgaa 3180
cttggcgtcg tttctcatgg atcgcaaggt gatcctccca cgggtcgcgc atgagatcct 3240
tggaaacagc ctgacagggg tgcgagaagc gattgcgggc atgttggata ctacgaagag 3300
cctcgtccgc tcctccgtga aaaagggagg actctcgtac gggatcttgc ggagacttgt 3360
caattacgac ttgctccagt atgagacgct gacaaggaca ctgaggaaac ccgtgaagga 3420
caatatcgaa tacgaataca tgtgctcagt ggaattggcc gtggggctga ggcaaaagat 3480
gtggatccac ctgacatacg gacgcccgat ccacggactg gagacacctg accctcttga 3540
gttgttgagg gggacgttca tcgaagggtc ggaggtctgc aaactctgta gatcggaggg 3600
agccgacccc atctacacgt ggttttatct ccccgataat attgatcttg acacacttac 3660
aaatggatgc cctgcgatta gaatcccgta tttcgggtca gcaacggacg agaggtccga 3720
ggctcagctt gggtacgtgc gcaaccttag caagcccgcg aaagccgcca tcagaatcgc 3780
tatggtgtat acgtgggcct acgggaccga tgaaatttca tggatggaag ccgcgctcat 3840
tgctcagaca agagcgaatc tctcgctgga aaatctgaag ctcctgacac ccgtatcaac 3900
atccacgaac ctttcccatc ggttgaaaga caccgccacc cagatgaagt tttcctcggc 3960
aacgctcgtc agggcgtcac gcttcatcac gatctcgaat gataacatgg cgcttaaaga 4020
agccggagag tcgaaagaca cgaacctcgt ctatcaacag atcatgttga ctggactgtc 4080
gctttttgag ttcaatatga ggtacaagaa gggatcgctc ggcaaacctc tcatcctcca 4140
cttgcacctc aataacgggt gctgcatcat ggagtcacct caagaggcga acatcccgcc 4200
tagaagcaca ttggacttgg agattacaca agagaataac aaactcatct acgatcccga 4260
tcccctcaag gatgtggacc ttgaactttt ctcgaaagta cgcgatgtcg tccacaccgt 4320
tgacatgaca tattggtccg acgacgaggt aatccgcgca acctcgatct gcaccgcgat 4380
gacaatcgca gacaccatgt cccagcttga ccgggataac cttaaggaga tgattgcgct 4440
ggtcaatgac gacgacgtaa actcgctgat tacggagttc atggtcatcg acgtgcctct 4500
cttctgcagc acattcggag gcatcctggt caaccagttc gcctacagcc tttatggtct 4560
taacatccga ggaagagaag agatttgggg gcacgtggtg agaatcttga aggacacgtc 4620
ccatgcggta cttaaggtgc tgagcaacgc cctcagccac cccaaaattt ttaagagatt 4680
ttggaatgcc ggggtggtgg aacctgtgta cggacccaat ctttcgaatc aagacaaaat 4740
cctgcttgca ctcagcgtct gtgagtattc cgtggacctt ttcatgcacg attggcaagg 4800
gggagtcccc ttggaaatct tcatctgcga caatgacccc gacgtggcgg atatgcggag 4860
atcgtcattt cttgctcgcc atcttgcata cttgtgctcc gtagcagaga tctcacggga 4920
cgggcctcgc ctggagtcaa tgaactcatt ggaacggctc gaatccctga aatcgtacct 4980
cgaattgact ttcctggacg atccggtcct taggtattcg cagctcactg ggcttgtaat 5040
caaggtattt ccctcgacat tgacgtacat caggaagtcg tccattaaag tattgcgcac 5100
tcgcgggatc ggcgtaccgg aagtgcttga ggattgggac ccggaggcgg ataacgcatt 5160
gctcgatggt atcgctgcgg agattcagca gaatatcccc ctcgggcatc agaccagagc 5220
tcccttttgg gggctgcggg tatcgaaaag ccaggtcctc cgactgaggg gatacaaaga 5280
gattaccaga ggagagattg ggagatcagg agtcggattg acacttccgt ttgacggacg 5340
ctatctctcc caccaactgc gcctctttgg gattaactcg acttcgtgcc tcaaggccct 5400
tgagcttacg tatctcctgt ccccgttggt ggacaaggac aaagaccgct tgtatctggg 5460
ggaaggggcg ggtgcaatgc tttcgtgtta cgatgcgacg cttggtccgt gcattaacta 5520
ttacaactcg ggagtgtact cgtgtgacgt caacggccaa agagaattga atatctaccc 5580
agcagaggta gcgctcgtgg gaaagaaact gaacaatgtc acctcactcg gacagcgcgt 5640
gaaggtgctc ttcaatggta accccggatc gacgtggatt ggtaatgatg agtgcgaagc 5700
tttgatttgg aacgaactcc aaaattcctc gattggattg gtgcactgtg acatggaggg 5760
aggggaccac aaggatgatc aagtagtact ccacgagcac tacagcgtga ttcggatcgc 5820
ttatttggtg ggcgatcggg acgtcgtact catctccaag atcgcccctc gactgggaac 5880
agactggact cgccaattgt ccctctacct ccgctactgg gatgaagtca atcttatcgt 5940
ccttaagaca tcgaacccgg cttcgactga aatgtacctc ctcagcagac accccaagtc 6000
ggacatcatt gaggatagca aaacagtact cgcgtcactg ctccccctct cgaaggagga 6060
ttccattaag atcgagaaat ggattctcat cgagaaagca aaggcccatg aatgggtaac 6120
gagagagctg cgcgagggaa gctcgtcatc gggcatgctt agaccctacc accaggcgct 6180
gcagactttt ggattcgaac ccaatctgta taaacttagc cgcgacttcc tcagcaccat 6240
gaacatcgct gacacacata actgcatgat cgctttcaac cgggtactca aagacacgat 6300
ttttgagtgg gccagaatca cggagtcgga caagcggctg aaacttacag ggaagtacga 6360
cctttatccc gtcagagaca gcggtaaact gaaaacagtg tccagaagac tggttctgtc 6420
atggatctca ctgtcaatga gcacgcgatt ggtcacgggt tcgttccctg atcaaaagtt 6480
tgaggcgaga ctccaattgg gcattgtctc gctctcgtca agagagatca ggaacctccg 6540
agtcattact aaaacgctcc tcgacagatt cgaggacatt attcacagca tcacttatcg 6600
atttttgacg aaggagatca agatccttat gaagattctc ggtgccgtga aaatgttcgg 6660
ggcgagacaa aatgagtaca caacagtcat tgatgacggt tcgctcggag atatcgagcc 6720
atacgatagc tcgtgaaccg gtagccgcac cttgtcatgt accatcaata aagtaccctg 6780
tgctcaacga agtcttggac tgatccatat gacaatagta agaaaaactt acaagaagac 6840
aagaaaattt aaaagaatac atatctctta aactcttgtc tggt 6884
<210> 80
<211> 4248
<212> DNA
<213> 人工序列
<220>
<223> hN-hPolS-hC cDNA
<400> 80
accaaacaag agaaaaaaca tgtatgggat atgtaatgaa gtttaagaaa aacttagggt 60
gaaagtatcc accctgagga gcaggttcca gatccttttc tttgctgcca aagtccacca 120
tggctggcct gctgtcaacc ttcgatacct tttcaagtag gaggagcgag tcaatcaaca 180
aatctggggg cggagctgtc atccctggac agcggtccac cgtgtctgtc ttcgtgctgg 240
gcccctctgt gacagacgat gccgacaagc tgttcatcgc caccacattt ctggctcaca 300
gtctggacac agataaacag cattcacaga gaggcgggtt tctggtgagc ctgctggcta 360
tggcatacag ctccccagaa ctgtatctga ctaccaacgg agtgaatgcc gacgtgaagt 420
acgtgatcta taacattgag aaggacccca aaaggactaa gaccgatggc ttcatcgtga 480
agacacggga tatggaatac gagagaacaa ctgagtggct gttcgggcct atggtgaaca 540
agagcccact gtttcaggga cagcgagacg cagctgaccc cgataccctg ctgcaaatct 600
acggctatcc tgcctgcctg ggggctatca ttgtccaagt gtggatcgtc ctggtgaaag 660
caattacctc tagtgccggc ctgcggaagg ggttctttaa ccgcctggag gctttccgac 720
aggatggaac agtgaagggc gcactggtct ttaccggcga aacagtggag ggaatcggct 780
ctgtcatgag aagtcagcag tcactggtca gcctgatggt ggaaactctg gtcaccatga 840
acacagccag aagtgacctg accacactgg agaaaaacat ccagattgtg gggaattaca 900
tcagggatgc cggcctggcc agcttcatga ataccatcaa gtatggggtg gaaacaaaga 960
tggcagccct gactctgtcc aacctgagac ccgacatcaa caagctgcgg agcctgattg 1020
atacctacct gtctaagggc cccagggccc ctttcatctg tattctgaaa gacccagtgc 1080
acggggagtt tgctccagga aactaccccg cactgtggtc ctatgcaatg ggcgtggccg 1140
tggtccagaa taaggccatg cagcagtacg tcactggccg cacctatctg gacatggaaa 1200
tgtttctgct ggggcaggcc gtggctaaag atgccgagag caagatcagc agcgccctgg 1260
aggacgagct gggagtcaca gatactgcca aggggcgact gcggcaccat ctggcaaacc 1320
tgtccggagg cgacggagca tatcacaaac ctacaggggg aggcgctatc gaagtggcac 1380
tggataatgc cgacattgat ctggagacta aggcacatgc agaccaggat gctcgcggat 1440
ggggaggaga ttccggcgaa agatgggcca ggcaggtgtc tggcgggcac tttgtcactc 1500
tgcatggcgc tgagcgactg gaggaagaga ccaatgacga agatgtgagt gacatcgagc 1560
ggagaattgc tatgcgactg gcagaaaggc gccaggagga ctcagccacc catggggatg 1620
agggacggaa caatggagtg gaccatgacg aagatgatga cgccgccgca gtcgcaggca 1680
ttggaggaat ttgacggttt atttattgat ccttatttat tcaaagatct acgaggcctc 1740
agtttgtcta cttggtctta agaaaaactt agggtgaaag cctcagtgcc ccattctcac 1800
tgctactagt cgccaccatg gaccaggacg cttttattct gaaggaggat tctgaagtgg 1860
aacgggaggc accaggggga agggagagtc tgagtgatgt cattggcttc ctggacgccg 1920
tgctgagctc cgagccaaca gatatcggag gggaccggag ctggctgcac aacactatta 1980
atacccccca ggggcctgga agtgcacata gagccaagtc agagggcgaa ggggaggtgt 2040
caacacccag cactcaggat aacaggtctg gggaggaatc cagagtctct ggaaggacca 2100
gtaagcctga agcagaggcc cacgctggca acctggacaa acagaatatc catcgagctt 2160
ttggaggccg gaccgggaca aactctgtga gtcaggacct gggagatggg ggagactctg 2220
gcatcctgga aaacccccct aatgagcgcg gctaccctcg atccgggatt gaagatgaga 2280
atagggagat ggccgctcac ccagataagc gaggagaaga ccaggcagag ggactgcctg 2340
aggaagtgcg gggctcaacc agcctgccag acgaaggaga gggaggagcc tccaacaatg 2400
gccggtctat ggaacctggg tctagtcatt ccgctagagt gacaggcgtg ctggtcattc 2460
cttctccaga gctggaggaa gcagtcctgc ggagaaacaa gaggcgccca accaattccg 2520
gatctaaacc actgacccca gcaacagtgc ccggcacacg gagcccaccc ctgaacagat 2580
ataatagtac cgggtcacct ccaggaaagc ccccttctac acaggatgag cacatcaaca 2640
gtggggacac tccagctgtg cgggtcaagg atagaaaacc acccattgga actcggagcg 2700
tgagcgactg cccagcaaac ggaagaccta tccaccccgg cctggagact gattccacca 2760
agaaaggaat tggcgaaaat acctcaagca tgaaggagat ggccacactg ctgactagcc 2820
tgggcgtgat ccagtccgca caggaattcg agagcagccg ggacgccagt tacgtctttg 2880
ctcgacgggc actgaaatca gccaactatg ctgagatgac cttcaacgtg tgcggcctga 2940
ttctgagcgc cgaaaagagt tcagctagaa aagtggatga gaataagcag ctgctgaaac 3000
agatccagga aagcgtcgag tccttcagag acatctacaa gaggttttca gaatatcaga 3060
aagagcagaa cagcctgctg atgtctaatc tgagtacact gcacatcatt actgataggg 3120
gaggcaagac cgataacaca gacagcctga cacgcagccc ttccgtgttc gctaagtcca 3180
aagagaataa gactaaagca acccgctttg acccctccat ggaaactctg gaggatatga 3240
agtacaaacc tgacctgatc cgggaagatg agtttaggga cgaaattcgc aacccagtgt 3300
atcaggaacg cgatactgag ccccgagcat caaatgccag cagactgctg ccctccaagg 3360
agaaacctac catgcattct ctgaggctgg tcatcgaaag ctccccactg agccgcgctg 3420
agaaggtggc atacgtcaaa tctctgagta agtgcaaaac cgaccaggag gtgaaggctg 3480
tgatggaact ggtggaggaa gacattgaat ctctgacaaa ctaagtcgac ggagccgcac 3540
cttgtcatgt accatcaata ttaagaaaaa cttagggtga aagtctcccc tcctcacacc 3600
taggaccatg gcccaggctt cataatgccc agctttctga agaagattct gaaactgaga 3660
ggacgaagac aggaagatga gtctcgaagt cggatgctgt ccgacagctc catgctgtct 3720
tgcagggtga accagctgac tagcgaggga accgaagctg gctcaaccac acccagcaca 3780
ctgcctaaag accaggccct gctgatcgag ccaaaggtcc gggctaagga aaaatcccag 3840
caccggagac ccaagatcat tgatcaggtg aggcgcgtcg agagtctggg ggaacaggca 3900
tcacagcggc agaaacatat gctggagacc ctgatcaaca aaatctacac aggccctctg 3960
ggggaggaac tggtgcagac tctgtatctg agaatctggg ccatggagga aaccccagag 4020
tctctgaaaa tcctgcagat gcgcgaagac attcgagatc aggtcctgaa gatgaaaaca 4080
gagagatggc tgaggactct gattaggggc gaaaagacca aactgaagga tttccagaag 4140
cggtacgagg aagtgcaccc ctatctgatg aaagagaagg tggaacaggt catcatggaa 4200
gaggcttggt cactggcagc tcatattgtg caggagtaat gacccggg 4248
<210> 81
<211> 4242
<212> DNA
<213> 人工序列
<220>
<223> hPolS-hN-hC cDNA
<400> 81
accagacaag agtttaagag atatgtatcc ttttaaattt tcttaagaaa aacttagggt 60
gaaagtatcc accctgagga gcaggttcca gatccttttc tttgctgcca aagtccacca 120
tggaccagga cgcattcatt ctgaaagaag attcagaagt cgaacgcgaa gcccccggtg 180
gaagggagtc tctcagcgac gtgatcggat tcctggacgc cgtgctgtca tcggaaccga 240
ccgacattgg gggagacagg tcgtggctgc acaacactat caacaccccg caagggcctg 300
gctccgcgca tcgggccaag tcggagggag aaggagaagt gtcaaccccg agcacccagg 360
acaaccgctc aggggaagag tccagagtct ccggtagaac gtcaaagcct gaagccgagg 420
cccatgccgg aaacctggat aagcagaaca ttcaccgggc ctttggtggc cgcaccggga 480
caaactccgt gtcgcaagac ctgggcgatg gcggcgattc cggtatcctg gagaatcccc 540
caaacgagag gggataccca agatccggaa tcgaggacga aaaccgggaa atggcagccc 600
accctgataa gcggggcgaa gatcaggccg aaggcctgcc tgaggaggtc cggggatcga 660
cctccttgcc tgacgaaggg gaaggcggcg cctcgaacaa cggccggtca atggagcccg 720
gcagctccca ttccgctcgg gtcactggag tcctcgtgat tccttccccg gaactggagg 780
aagccgtgct gaggcggaac aagcggcggc cgaccaactc cggatcaaag cctctgactc 840
ccgccaccgt gcccggaact aggtccccgc ccctgaaccg atacaactcg accgggtcac 900
cacccggaaa gccgccgtcc acccaagacg agcacatcaa cagcggggac actccggccg 960
tgcgcgtgaa ggaccggaag ccacccatcg gcactcggag cgtgtctgac tgtcctgcga 1020
atggtagacc catccaccct ggcctggaaa ccgactccac caagaaggga ataggggaga 1080
acacctccag catgaaggag atggctactc tgctcacctc gcttggcgtg atccagtccg 1140
cgcaagagtt cgaatccagc cgcgacgcct cctacgtgtt cgcgcggcgc gccctgaagt 1200
ccgcgaacta cgccgagatg actttcaacg tgtgcggatt gatcctgtcc gcggaaaaga 1260
gctccgcaag aaaagtggac gagaacaagc agctgctcaa gcagatccag gagagcgtgg 1320
agtccttccg cgacatctac aaacgcttct ccgagtatca gaaggagcag aactcccttc 1380
tcatgtccaa cctgtccacc cttcacatca tcactgatcg gggtggaaag acggataaca 1440
ccgattcgtt gacccgctcc ccgagcgtgt tcgccaagtc caaagagaac aagactaagg 1500
ccaccagatt tgatccttcg atggaaaccc tggaggacat gaagtacaag cccgacctca 1560
ttcgggagga cgaattccgg gacgagatca gaaacccggt gtaccaagag agggacaccg 1620
aaccccgcgc tagcaatgct agccgcctcc tgccgtcaaa ggagaagcca accatgcact 1680
cgctgcggct ggtcattgaa agctctcccc tgtcccgcgc ggaaaaggtc gcctacgtga 1740
aaagcctctc gaagtgcaag accgaccagg aagtgaaggc cgtgatggaa ctggtggagg 1800
aggacatcga atccctcacc aattgaaccg gtagatctac gaggcctcag tttgtctact 1860
tggtcttaag aaaaacttag ggtgaaagcc tcagtgcccc attctcactg ctactagtcg 1920
ccaacatggc cggccttctg tccactttcg acacctttag ctcacggcgc tccgagtcca 1980
tcaacaagtc cggcggtgga gccgtgatcc ctggacagcg ctccactgtc tccgtgttcg 2040
tcctcgggcc gtcggtgacc gacgacgccg acaagctgtt catcgccact actttcctcg 2100
ctcattccct ggataccgat aagcagcact cccagcgcgg aggttttttg gtgtctctcc 2160
tggcaatggc ctactcgtcc ccggagctgt acctgacaac taacggagtg aacgcggacg 2220
tgaaatacgt gatctacaac atcgaaaagg acccgaagcg gaccaagacc gacggtttca 2280
ttgtcaagac tcgggatatg gagtacgaga ggaccaccga gtggcttttc ggcccaatgg 2340
tcaacaagag cccgctgttc caaggacagc gggacgccgc ggaccccgac accctgctgc 2400
aaatctacgg ctaccctgct tgcctgggag ccatcatcgt ccaagtctgg attgtgctcg 2460
tgaaggccat taccagctcc gccggtctga gaaaggggtt tttcaaccgc ctggaggcgt 2520
tcagacagga cggcaccgtg aagggggcac tggtgttcac cggcgaaacc gtggaaggaa 2580
tcggctcagt gatgcggtcc cagcagtccc tggtgtcgct gatggtggaa actctcgtga 2640
ccatgaacac ggcccggtcg gacctgacca ccctggagaa gaacatccag attgtgggca 2700
actacattcg ggatgccgga ctcgctagct tcatgaacac tattaagtac ggagtggaaa 2760
ccaagatggc cgccctgact ctctccaacc tgaggcccga tatcaacaag ctgcgctcgc 2820
tgatcgatac ctacctgtca aaggggccca gggccccatt catttgcata cttaaagacc 2880
ctgtgcacgg agagttcgcc cctggaaact atcccgctct gtggagctac gcaatgggag 2940
tggccgtggt gcagaacaag gccatgcagc aatacgtcac cgggaggacc tatctcgata 3000
tggagatgtt cctgctgggg caggccgtgg cgaaggacgc agaaagcaaa atctcgtcgg 3060
cccttgaaga tgaactgggt gtcactgaca ccgcgaaggg cagactcaga caccacttgg 3120
ccaacctcag cggaggagat ggagcttacc acaagccgac tgggggtgga gcgattgaag 3180
tcgccctgga taacgccgac atcgaccttg agactaaggc gcatgcggac caggacgcca 3240
ggggatgggg cggggacagc ggcgaacgct gggcccgcca agtgtccggc ggtcacttcg 3300
tgaccttgca tggcgcggag cgcctggaag aggaaaccaa tgatgaggac gtgtcagaca 3360
tcgaaagacg gatcgccatg cgactggctg aacggcgcca ggaggattcc gcgacgcacg 3420
gggacgaggg acggaacaat ggagtggacc acgacgaaga tgacgacgcc gcagccgtgg 3480
ccggaatcgg cggaatctag cggtttattt attgatcctt atttattcaa gtcgacggag 3540
ccgcaccttg tcatgtacca tcaatattaa gaaaaactta gggtgaaagt ctcccctcct 3600
cacacctagg agaccaccat gcccagcttt ctgaagaaga ttctgaaact gagaggacga 3660
agacaggaag atgagtctcg aagtcggatg ctgtccgaca gctccatgct gtcttgcagg 3720
gtgaaccagc tgactagcga gggaaccgaa gctggctcaa ccacacccag cacactgcct 3780
aaagaccagg ccctgctgat cgagccaaag gtccgggcta aggaaaaatc ccagcaccgg 3840
agacccaaga tcattgatca ggtgaggcgc gtcgagagtc tgggggaaca ggcatcacag 3900
cggcagaaac atatgctgga gaccctgatc aacaaaatct acacaggccc tctgggggag 3960
gaactggtgc agactctgta tctgagaatc tgggccatgg aggaaacccc agagtctctg 4020
aaaatcctgc agatgcgcga agacattcga gatcaggtcc tgaagatgaa aacagagaga 4080
tggctgagga ctctgattag gggcgaaaag accaaactga aggatttcca gaagcggtac 4140
gaggaagtgc acccctatct gatgaaagag aaggtggaac aggtcatcat ggaagaggct 4200
tggtcactgg cagctcatat tgtgcaggag taatgacccg gg 4242
<210> 82
<211> 6884
<212> DNA
<213> 人工序列
<220>
<223> hPolL cDNA
<400> 82
gcggccgctt aagaaaaact tagggtgaat gtaaagcttt ctggccacca tggacggaca 60
ggaatctagc cagaatccca gcgacatcct gtatcccgag tgccacctga atagcccaat 120
cgtgagagga aaaatcgccc agctgcacgt gctgctggac gtgaaccagc catataggct 180
gaaggacgat tccatcatta atatcacaaa gcataagatt cgcaacggcg ggctgtctcc 240
ccgccagatt aagatccgaa gtctgggcaa agccctgcag cgcactatca aagatctgga 300
ccgatacacc ttcgagcctt acccaacata tagccaggaa ctgctgaggc tggacattcc 360
agagatctgc gataagatcc gcagcgtgtt tgctgtctcc gaccggctga ccagagagct 420
gagctccggc ttccaggatc tgtggctgaa tatcttcaag cagctgggga acatcgaggg 480
aagagaaggc tatgatccac tgcaggacat tggcaccatc cccgagatta cagacaagta 540
ctctcgcaac cgatggtata ggcccttcct gacctggttt agtatcaagt acgacatgcg 600
atggatgcag aaaacacggc ccggaggccc tctggatact tccaactctc acaatctgct 660
ggagtgcaaa agctacacac tggtgactta tggagatctg gtcatgatcc tgaataagct 720
gactctgacc ggctacattc tgacccccga actggtgctg atgtattgtg acgtggtcga 780
gggaagatgg aacatgagcg ccgctggcca tctggacaag aagagcattg gcatcaccag 840
taagggggag gaactgtggg aactggtgga ctccctgttc tctagtctgg gagaggaaat 900
ctataatgtg attgccctgc tggagcctct gtctctggct ctgattcagc tgaacgatcc 960
agtgatcccc ctgcggggcg ccttcatgag acacgtcctg accgagctgc agaccgtgct 1020
gacaagcagg gatgtctaca ctgacgcaga ggccgatacc atcgtggaat ccctgctggc 1080
aatctttcat gggacatcta ttgacgagaa ggccgaaatc ttcagtttct ttcggacatt 1140
tggacacccc tcactggagg ccgtgactgc agccgataag gtcagagctc atatgtacgc 1200
acagaaagcc atcaagctga aaaccctgta tgaatgccac gccgtgttct gcaccatcat 1260
tatcaatggc taccgggaga gacacggggg acagtggcca ccttgcgatt ttcctgacca 1320
cgtgtgcctg gaactgcgca acgctcaggg gtcaaatact gcaatcagct acgagtgtgc 1380
cgtggacaac tataccagct tcattggatt caagtttaga aagttcatcg agccacagct 1440
ggatgaagac ctgaccatct acatgaagga taaagcactg tcccccagga aagaagcctg 1500
ggactccgtg tatcctgatt ctaatctgta ctataaggcc ccagagtctg aggaaacacg 1560
gagactgatc gaggtgttca ttaatgacga aaactttaat cccgaggaaa ttatcaacta 1620
cgtggagagc ggggactggc tgaaggatga ggaattcaac attagttatt cactgaagga 1680
gaaagaaatc aagcaggaag gacgcctgtt tgccaagatg acatacaaaa tgcgagctgt 1740
gcaggtcctg gcagagactc tgctggccaa gggaatcggc gagctgttct ccgaaaatgg 1800
gatggtgaag ggagagattg acctgctgaa acgactgacc acactgagcg tgtccggcgt 1860
ccctcggacc gatagcgtgt ataacaattc aaagtcaagc gagaaaagga acgaggggat 1920
ggaaaacaaa aattctggcg ggtattggga cgagaagaaa aggagtcgcc acgaattcaa 1980
ggccaccgac tcctctacag atggctacga gactctgagt tgctttctga ctaccgatct 2040
gaagaaatat tgtctgaatt ggcggttcga atctaccgct ctgtttgggc agagatgcaa 2100
tgagatcttc ggcttcaaga ccttcttcaa ctggatgcat cccgtgctgg agagatgcac 2160
catctacgtg ggcgaccctt attgtccagt cgctgatagg atgcaccgcc agctgcagga 2220
tcatgcagac tccgggattt tcatccacaa ccctagggga ggcatcgagg gatactgtca 2280
gaagctgtgg accctgattt ctatcagtgc cattcatctg gctgcagtgc gggtcggagt 2340
gagagtctcc gctatggtgc agggcgacaa tcaggctatc gcagtcacct ctcgcgtgcc 2400
cgtcgctcag acatataaac agaagaaaaa ccacgtgtac gaggaaatta caaagtattt 2460
cggcgcactg cggcacgtga tgtttgatgt cgggcatgag ctgaaactga atgaaactat 2520
catcagttca aagatgttcg tgtactccaa aagaatctac tatgacggca agatcctgcc 2580
acagtgcctg aaggccctga ctaaatgcgt gttctggagc gagaccctgg tcgatgaaaa 2640
caggtcagct tgcagcaata tctcaactag cattgccaaa gctatcgaga acggctacag 2700
ccccatcctg gggtactgta ttgccctgta taagacctgc cagcaggtgt gcatctcact 2760
gggcatgact attaatccca ccatcagccc tacagtgaga gaccagtact tcaaggggaa 2820
aaactggctg aggtgcgctg tgctgatccc cgcaaacgtc gggggattca attatatgtc 2880
cacctctagg tgttttgtgc gcaacatcgg ggaccctgca gtcgccgctc tggctgatct 2940
gaaacgattc attcgggccg atctgctgga caagcaggtg ctgtaccgcg tgatgaatca 3000
ggagcctgga gatagctcct ttctggactg ggcaagcgat ccctattcct gcaacctgcc 3060
tcacagtcag tcaatcacaa ctattatcaa gaatatcacc gccaggagcg tgctgcagga 3120
atcccccaac cctctgctga gcgggctgtt cacagagact tccggagagg aagacctgaa 3180
tctggccagc ttcctgatgg atagaaaagt gatcctgcca agggtcgccc atgaaatcct 3240
gggaaacagc ctgaccggcg tgagagaggc aatcgccgga atgctggaca ccacaaagtc 3300
tctggtgcga gccagtgtcc ggaaaggagg actgagctac ggcatcctga ggcgcctggt 3360
gaattacgac ctgctgcagt atgaaaccct gacaagaact ctgaggaagc ccgtgaaaga 3420
taacatcgag tacgaatata tgtgcagcgt ggagctggca gtcggactgc gacagaagat 3480
gtggattcac ctgacttacg ggcgacctat ccacggcctg gagaccccag atcccctgga 3540
actgctgagg ggcattttca tcgaggggtc agaagtgtgc aagctgtgcc gcagcgaggg 3600
agctgaccct atctacacct ggttttatct gccagataat attgatctgg acaccctgac 3660
aaacggatgt cctgcaattc gcatcccata cttcggctct gctacagacg agagaagtga 3720
agcacagctg ggctatgtga ggaatctgag caagcctgcc aaagcagcca ttcggatcgc 3780
tatggtgtat acctgggcat atgggaccga tgagattagc tggatggaag ctgcactgat 3840
cgcacagaca cgcgccaacc tgtccctgga gaatctgaag ctgctgactc cagtgagcac 3900
ttccaccaac ctgtcccacc ggctgaagga cacagccact cagatgaaat tctctagtgc 3960
aaccctggtg cgcgccagcc ggttcatcac aatcagcaac gacaatatgg ctctgaagga 4020
ggcaggagaa tctaaagata caaatctggt gtaccagcag atcatgctga ctggcctgag 4080
tctgttcgag tttaacatgc gctacaagaa ggggtcactg ggaaagcctc tgatcctgca 4140
cctgcatctg aacaatggct gctgtattat ggagtcccca caggaagcca atatcccacc 4200
ccggtctaca ctggacctgg agattactca ggaaaacaat aagctgatct atgatcctga 4260
cccactgaaa gatgtggacc tggaactgtt ctccaaggtg agggacgtgg tccacactgt 4320
cgatatgacc tactggagcg acgatgaagt gatccgcgcc acctccattt gcactgccat 4380
gaccatcgct gacacaatgt cccagctgga tcgggacaac ctgaaggaaa tgattgctct 4440
ggtgaacgac gatgacgtga attctctgat taccgagttc atggtcatcg atgtcccact 4500
gttctgttca acatttggag gcatcctggt gaatcagttt gcctacagcc tgtatggact 4560
gaacattcga ggccgggagg aaatctgggg ccacgtggtc agaatcctga aggacacctc 4620
ccatgcagtg ctgaaagtcc tgtctaatgc cctgagtcac cccaagattt tcaaaaggtt 4680
ttggaacgca ggagtggtcg agccagtgta cggacccaac ctgtctaatc aggataagat 4740
cctgctggct ctgtcagtgt gcgaatatag cgtggacctg ttcatgcacg attggcaggg 4800
gggagtgccc ctggagatct tcatctgtga taatgaccct gatgtcgcag acatgcggcg 4860
gagcagcttc ctggcacgcc atctggccta cctgtgctcc ctggccgaaa tctctagaga 4920
tggccccagg ctggagtcca tgaactctct ggagcggctg gaaagtctga aatcatacct 4980
ggagctgact ttcctggatg accccgtgct gagatatagc cagctgaccg gcctggtcat 5040
caaggtcttt ccttccaccc tgacatacat ccggaagtcc agcatcaagg tgctgagaac 5100
cagggggatc ggagtgcccg aggtcctgga agactgggat cctgaagctg acaatgcact 5160
gctggatggc attgccgctg agatccagca gaacattcca ctgggacacc agacacgggc 5220
cccattttgg ggactgagag tgtctaaaag tcaggtcctg cgcctgcgag ggtacaagga 5280
gatcaccagg ggcgaaattg ggcgcagtgg agtgggactg acactgccat tcgacggcag 5340
gtatctgtca catcagctgc gcctgtttgg gatcaactca actagctgcc tgaaggccct 5400
ggaactgacc tacctgctga gccccctggt ggacaaggat aaagacagac tgtacctggg 5460
agagggcgct ggggcaatgc tgagctgcta tgacgctacc ctgggccctt gtatcaacta 5520
ctataattca ggcgtgtact cctgtgatgt caacgggcag cgcgagctga atatctaccc 5580
agccgaagtg gctctggtcg ggaagaaact gaacaatgtg acctctctgg gacagcgggt 5640
gaaggtcctg ttcaacggaa atcccggcag tacatggatt ggaaacgacg agtgcgaagc 5700
cctgatctgg aacgagctgc agaatagttc aattggcctg gtgcactgtg acatggaagg 5760
cggggatcat aaagatgacc aggtggtcct gcacgagcat tacagcgtga ttcgaatcgc 5820
ttatctggtc ggcgatcggg acgtggtcct gatctcaaag attgcacctc gactggggac 5880
agactggact cggcagctga gcctgtacct gagatattgg gatgaagtga atctgatcgt 5940
cctgaaaacc tccaacccag cctctacaga aatgtacctg ctgagtaggc accccaagtc 6000
agacattatc gaggattcca aaaccgtgct ggcttctctg ctgccactga gtaaggagga 6060
ctcaattaag atcgaaaaat ggattctgat cgagaaggcc aaagctcacg aatgggtgac 6120
cagagagctg agggaaggga gctcctctag tggaatgctg aggccttacc atcaggccct 6180
gcagacattc ggctttgagc caaacctgta taagctgagc cgcgacttcc tgtccactat 6240
gaacattgct gatacccata attgcatgat cgcattcaac cgggtgctga aagacacaat 6300
ttttgagtgg gccaggatca ctgaaagcga taagcgcctg aaactgacag gaaagtacga 6360
cctgtatcct gtgcgcgata gcggcaagct gaaaactatc agtagaaggc tggtgctgtc 6420
atggatttcc ctgtctatga gtacacggct ggtcactggg tccttcccag accagaaatt 6480
tgaagccaga ctgcagctgg gaatcgtgtc tctgtcaagc agggagattc gcaatctgcg 6540
agtcatcact aagaccctgc tggacagatt cgaagatatt atccacagca tcacatacag 6600
atttctgact aaggagatca agatcctgat gaagattctg ggagccgtga aaatgtttgg 6660
cgctcggcag aacgagtaca ccactgtgat tgatgatggc agcctggggg acattgaacc 6720
ctacgactcc tcctaaaccg gtagccgcac cttgtcatgt accatcaata aagtaccctg 6780
tgctcaacga agtcttggac tgatccatat gacaatagta agaaaaactt acaagaagac 6840
aagaaaattt aaaagaatac atatctctta aactcttgtc tggt 6884
<210> 83
<211> 2237
<212> DNA
<213> 人工序列
<220>
<223> hRIG-IC cDNA
<400> 83
ccggtagcag aaatagactg ggaagatgca caacttaaga aaaacttagg gtgaaagcct 60
gcgacaaaac ctcctccttt tccaagtgta ccaccatgga atgtcagaac ctgtcagaaa 120
actcctgtcc ccccagcgaa gtgtcagata ctaacctgta ctcccctttc aagccacgga 180
attaccagct ggagctggcc ctgcccgcta tgaagggcaa aaacaccatc atttgcgctc 240
ctaccggatg tggcaagaca ttcgtgtctc tgctgatttg tgaacaccat ctgaagaaat 300
ttcctcaggg gcagaaggga aaagtggtct tctttgccaa ccagatccca gtgtatgagc 360
agcagaagag tgtcttctca aaatactttg aacgacacgg ctatcgggtg acaggcatca 420
gcggggcaac tgccgagaat gtgcccgtcg agcagattgt ggaaaacaat gacatcatta 480
tcctgacccc acagatcctg gtgaacaatc tgaagaaagg gaccattccc tcactgagca 540
tcttcacact gatgattttt gacgagtgcc acaatacatc taagcagcat ccttacaaca 600
tgatcatgtt caactatctg gatcagaaac tgggagggag ctccggacca ctgcctcagg 660
tcatcggcct gacagcaagc gtgggagtcg gagacgccaa gaacactgac gaggctctgg 720
attacatctg caagctgtgc gcttctctgg atgcaagtgt gattgccact gtcaagcaca 780
atctggagga actggagcag gtggtctaca agcctcagaa attctttagg aaggtggaaa 840
gcaggatctc cgataagttc aaatatatta tcgcacagct gatgcgggac accgagagcc 900
tggccaagag aatctgtaaa gatctggaaa acctgtccca gattcagaat agagagtttg 960
ggactcagaa gtatgaacag tggattgtga ccgtccagaa agcctgcatg gtgttccaga 1020
tgccagacaa ggatgaagaa agtcgaatct gtaaggccct gttcctgtat acctcacacc 1080
tgcggaagta taacgacgct ctgattatct cagagcatgc aagaatgaag gacgccctgg 1140
attacctgaa agatttcttt agcaatgtga gggccgctgg cttcgacgag atcgaacagg 1200
atctgactca gaggtttgag gaaaagctcc aggagctgga atccgtgtct cgcgacccaa 1260
gcaacgagaa tcccaaactg gaagatctgt gcttcatcct ccaggaggaa tatcacctga 1320
acccagagac cattacaatc ctgtttgtga agaccagagc tctggtggac gcactgaaaa 1380
actggattga agggaatcct aagctgtcct tcctgaaacc aggaatcctg actggcaggg 1440
ggaagaccaa ccagaatact ggaatgaccc tgcccgctca gaagtgcatt ctggacgcct 1500
tcaaggccag cggagatcat aacattctga tcgccacatc tgtggctgac gagggcattg 1560
atatcgccca gtgtaacctg gtcatcctgt acgaatatgt gggcaatgtc attaagatga 1620
tccagactcg gggaagaggc agggctcgcg gctcaaagtg cttcctgctg accagcaatg 1680
caggcgtgat cgagaaggaa cagattaaca tgtataagga gaagatgatg aacgacagta 1740
ttctgaggct ccagacatgg gatgaggccg tgttccgcga aaagattctg cacatccaga 1800
ctcatgagaa gttcatccgc gactcccagg aaaagccaaa acccgtgcct gataaggaga 1860
acaagaaact gctgtgccga aagtgtaaag ctctggcatg ctacaccgca gacgtgcggg 1920
tcatcgagga atgtcactat acagtgctgg gcgatgcctt caaggagtgc tttgtctccc 1980
ggccacatcc caagcctaaa cagttctcta gttttgaaaa gcgcgctaaa atcttctgcg 2040
cacgacagaa ttgttctcac gactggggca tccacgtgaa gtacaaaacc ttcgagattc 2100
ccgtcattaa gatcgagtct tttgtggtcg aagatatcgc cacaggagtg cagactctgt 2160
atagtaagtg gaaagatttt cattttgaga agattccctt tgacccagca gagatgtcta 2220
agtaactcga ccccggg 2237
<210> 84
<211> 317
<212> DNA
<213> 人工序列
<220>
<223> hV-独特区cDNA
<400> 84
ccggtagcag aaatagactg ggaagatgca caacttaaga aaaacttagg gtgaaagcct 60
gcgacaaaac ctcctccttt tccaagtgta ccaccatggg ccaccgacgg gaacatatca 120
tctacgagcg ggatgggtat atcgtggacg aatcttggtg caatccagtc tgtagtcgca 180
ttcgaatcat tcccagaagg gagctgtgcg tgtgtaaaac ctgtcctaag gtctgcaaac 240
tgtgtaggga cgatatccag tgcatgcgcc ccgacccttt ctgtagagaa atttttagga 300
gctgactcga ccccggg 317
<210> 85
<211> 857
<212> DNA
<213> 人工序列
<220>
<223> hPSMA7 cDNA
<400> 85
ccggtagcag aaatagactg ggaagatgca caacttaaga aaaacttagg gtgaaagcct 60
gcgacaaaac ctcctccttt tccaagtgta ccaccatgag ttacgataga gcaatcacag 120
tgttctcccc cgatggacat ctgtttcagg tcgagtatgc ccaggaagcc gtcaaaaaag 180
ggtccactgc cgtgggggtc cgaggacggg acatcgtggt cctgggggtg gagaagaaat 240
ctgtcgcaaa gctccaggat gaacgcaccg tgcgaaaaat ttgcgccctg gacgataacg 300
tctgtatggc cttcgctggc ctgacagcag acgcacgaat cgtgattaat agagccaggg 360
tcgagtgcca gagccaccgc ctgactgtgg aggaccccgt gactgtcgaa tacatcacca 420
ggtatattgc cagcctgaag cagcggtaca cccagtccaa cggccggaga cccttcggga 480
tcagcgccct gattgtggga ttcgactttg atggcacacc cagactgtac cagacagacc 540
cttcaggcac ttatcatgcc tggaaagcta acgcaatcgg acggggcgct aagagcgtga 600
gagagttcct ggagaagaac tacaccgatg aggctattga aaccgacgat ctgaccatca 660
agctggtcat caaggccctg ctggaggtgg tccagtctgg agggaagaac atcgaactgg 720
cagtgatgag gcgcgaccag agtctgaaga tcctgaatcc cgaggaaatt gagaaatatg 780
tggctgagat tgagaaagaa aaggaggaga atgagaaaaa gaaacagaag aaagccagtt 840
gataactcga ccccggg 857
<210> 86
<211> 1707
<212> DNA
<213> 人工序列
<220>
<223> hPolS cDNA
<400> 86
atggaccagg acgcattcat tctgaaagaa gattcagaag tcgaacgcga agcccccggt 60
ggaagggagt ctctcagcga cgtgatcgga ttcctggacg ccgtgctgtc atcggaaccg 120
accgacattg ggggagacag gtcgtggctg cacaacacta tcaacacccc gcaagggcct 180
ggctccgcgc atcgggccaa gtcggaggga gaaggagaag tgtcaacccc gagcacccag 240
gacaaccgct caggggaaga gtccagagtc tccggtagaa cgtcaaagcc tgaagccgag 300
gcccatgccg gaaacctgga taagcagaac attcaccggg cctttggtgg ccgcaccggg 360
acaaactccg tgtcgcaaga cctgggcgat ggcggcgatt ccggtatcct ggagaatccc 420
ccaaacgaga ggggataccc aagatccgga atcgaggacg aaaaccggga aatggcagcc 480
caccctgata agcggggcga agatcaggcc gaaggcctgc ctgaggaggt ccggggatcg 540
acctccttgc ctgacgaagg ggaaggcggc gcctcgaaca acggccggtc aatggagccc 600
ggcagctccc attccgctcg ggtcactgga gtcctcgtga ttccttcccc ggaactggag 660
gaagccgtgc tgaggcggaa caagcggcgg ccgaccaact ccggatcaaa gcctctgact 720
cccgccaccg tgcccggaac taggtccccg cccctgaacc gatacaactc gaccgggtca 780
ccacccggaa agccgccgtc cacccaagac gagcacatca acagcgggga cactccggcc 840
gtgcgcgtga aggaccggaa gccacccatc ggcactcgga gcgtgtctga ctgtcctgcg 900
aatggtagac ccatccaccc tggcctggaa accgactcaa caaaaaaggg cataggagag 960
aacacatcat ctatgaaaga gatggctaca ttgttgacga gtcttggtgt aatccagtct 1020
gctcaagaat tcgaatcatc ccgagacgcg agttatgtgt ttgcaagacg tgccctaaag 1080
tctgcaaact atgcagagat gacattcaat gtatgcggcc tgatcctttc tgccgagaaa 1140
tcttccgctc gtaaagtgga cgagaacaag cagctgctca agcagatcca ggagagcgtg 1200
gagtccttcc gcgacatcta caaacgcttc tccgagtatc agaaggagca gaactccctt 1260
ctcatgtcca acctgtccac ccttcacatc atcactgatc ggggtggaaa gacggataac 1320
accgattcgt tgacccgctc cccgagcgtg ttcgccaagt ccaaagagaa caagactaag 1380
gccaccagat ttgatccttc gatggaaacc ctggaggaca tgaagtacaa gcccgacctc 1440
attcgggagg acgaattccg ggacgagatc agaaacccgg tgtaccaaga gagggacacc 1500
gaaccccgcg ctagcaatgc tagccgcctc ctgccgtcaa aggagaagcc aaccatgcac 1560
tcgctgcggc tggtcattga aagctctccc ctgtcccgcg cggaaaaggt cgcctacgtg 1620
aaaagcctct cgaagtgcaa gaccgaccag gaagtgaagg ccgtgatgga actggtggag 1680
gaggacatcg aatccctcac caattga 1707
<210> 87
<211> 918
<212> DNA
<213> 人工序列
<220>
<223> 人类NANOG cDNA
<400> 87
atgagtgtgg atccagcttg tccccaaagc ttgccttgct ttgaagcatc cgactgtaaa 60
gaatcttcac ctatgcctgt gatttgtggg cctgaagaaa actatccatc cttgcaaatg 120
tcttctgctg agatgcctca cacggagact gtctctcctc ttccttcctc catggatctg 180
cttattcagg acagccctga ttcttccacc agtcccaaag gcaaacaacc cacttctgca 240
gagaagagtg tcgcaaaaaa ggaagacaag gtcccggtca agaaacagaa gaccagaact 300
gtgttctctt ccacccagct gtgtgtactc aatgatagat ttcagagaca gaaatacctc 360
agcctccagc agatgcaaga actctccaac atcctgaacc tcagctacaa acaggtgaag 420
acctggttcc agaaccagag aatgaaatct aagaggtggc agaaaaacaa ctggccgaag 480
aatagcaatg gtgtgacgca gaaggcctca gcacctacct accccagcct ttactcttcc 540
taccaccagg gatgcctggt gaacccgact gggaaccttc caatgtggag caaccagacc 600
tggaacaatt caacctggag caaccagacc cagaacatcc agtcctggag caaccactcc 660
tggaacactc agacctggtg cacccaatcc tggaacaatc aggcctggaa cagtcccttc 720
tataactgtg gagaggaatc tctgcagtcc tgcatgcagt tccagccaaa ttctcctgcc 780
agtgacttgg aggctgcctt ggaagctgct ggggaaggcc ttaatgtaat acagcagacc 840
actaggtatt ttagtactcc acaaaccatg gatttattcc taaactactc catgaacatg 900
caacctgaag acgtgtga 918
<210> 88
<211> 630
<212> DNA
<213> 人工序列
<220>
<223> 人类LIN28 cDNA
<400> 88
atgggctccg tgtccaacca gcagtttgca ggtggctgcg ccaaggcggc agaagaggcg 60
cccgaggagg cgccggagga cgcggcacgg gcggcggacg agcctcagct gctgcacggt 120
gcgggcatct gtaagtggtt caacgtgcgc atggggttcg gcttcctgtc catgaccgcc 180
cgcgccgggg tcgcgctcga ccccccagtg gatgtctttg tgcaccagag taagctgcac 240
atggaagggt tccggagctt gaaggagggt gaggcagtgg agttcacctt taagaagtca 300
gccaagggtc tggaatccat ccgtgtcacc ggacctggtg gagtattctg tattgggagt 360
gagaggcggc caaaaggaaa gagcatgcag aagcgcagat caaaaggaga caggtgctac 420
aactgtggag gtctagatca tcatgccaag gaatgcaagc tgccacccca gcccaagaag 480
tgccacttct gccagagcat cagccatatg gtagcctcat gtccgctgaa ggcccagcag 540
ggccctagtg cacagggaaa gccaacctac tttcgagagg aagaagaaga aatccacagc 600
cctaccctgc tcccggaggc acagaattga 630
<210> 89
<211> 1800
<212> DNA
<213> 人工序列
<220>
<223> 人类IgM 9F11重链cDNA
<400> 89
atgtcagtgt catttctgat ttttctgcca gtcctggggc tgccttgggg ggtcctgtca 60
caggtccagc tgcagcagtc cgggccagga ctggtgaaac ctgctcagac actgtccctg 120
acttgcgcaa tcagtggcga ctcagtgagc tccaactctg ctacctggaa ttggattaga 180
cagagtccac tgaggggact ggagtggctg ggacggacat actatagaag caaatggtac 240
aacgactatg ccgtgagcgt caagtcccgg atcaccatta accctgatac aagcaagaat 300
cagttctccc tgcagctgaa ttctgtcacc ccagaagaca cagcagtgta ctattgtgcc 360
agggagaact actatggatc cggccgctac aattggttcg atccttgggg gcagggaaca 420
ctggtgactg tctctagtgg aagcgcatcc gccccaaccc tgtttcccct ggtgagctgc 480
gaaaactctc ccagtgacac atcaagcgtg gctgtcggct gtctggcaca ggacttcctg 540
cctgattcaa tcacttttag ctggaagtac aaaaacaatt cagacatcag cagcaccaga 600
ggctttccat ctgtgctgag aggcgggaaa tatgccgcta caagccaggt cctgctgccc 660
tccaaggacg tgatgcaggg aactgatgag cacgtggtct gcaaagtgca gcatcccaac 720
ggcaataagg agaagaacgt cccactgccc gtgatcgctg agctgccacc taaggtgtcc 780
gtcttcgtgc caccccgaga cggattcttt ggcaatcccc ggaagtctaa actgatctgt 840
caggccaccg ggttttcacc tagacagatt caggtgagct ggctgaggga aggaaagcag 900
gtcggctctg gggtgaccac agatcaggtc caggctgaag caaaggagag cgggccaact 960
acctacaaag tgacctccac actgactatc aaggagtctg actggctgtc acagagcatg 1020
ttcacatgca gggtggatca ccgcggcctg acttttcagc agaatgcaag ttcaatgtgt 1080
gtccccgacc aggataccgc catcagggtg ttcgctattc ctccatcttt cgccagtatt 1140
tttctgacca agtccacaaa actgacttgc ctggtcacag acctgacaac ttatgattcc 1200
gtgactatct cttggacccg ccagaacggc gaagccgtga agacccacac aaacatttcc 1260
gagtctcatc ccaatgcaac cttctctgcc gtgggcgaag ctagtatctg cgaggacgat 1320
tggaatagcg gggagcggtt cacctgtacc gtgacacaca ctgacctgcc tagtccactg 1380
aagcagacca tttcacgccc taaaggcgtc gccctgcatc gaccagatgt gtacctgctg 1440
ccacctgccc gcgaacagct gaacctgcga gagagtgcta ccatcacatg tctggtgacc 1500
ggcttctccc ccgctgatgt ctttgtgcag tggatgcagc gaggacagcc actgagccct 1560
gaaaagtacg tgacatccgc acccatgcct gagccacagg cacctggcag atattttgcc 1620
cacagtattc tgactgtgtc agaggaagag tggaacaccg gggagactta tacctgcgtg 1680
gtcgcccatg aagctctgcc aaatcgagtc accgagcgga cagtggacaa gagcacaggg 1740
aaacccactc tgtataacgt cagtctggtc atgtcagata ctgccggaac ctgttattga 1800
<210> 90
<211> 714
<212> DNA
<213> 人工序列
<220>
<223> 人类IgM 9F11轻链cDNA
<400> 90
atggatatgc gagtgcccgc tcagctgctg ggactgctgc tgctgtggtt ccccggatca 60
agatgcgaca ttcagatgac tcagagccca agctccgtgt ctgcaagtgt cggcgaccga 120
gtgaccatca catgcagagc ctcccagggg atttctagtt ggctggcttg gtatcagcag 180
aagccaggga aagctcccaa gctgctgatc tatgatgcat caagcctgca gagtggagtg 240
ccctcacgat tctcaggcag cgggtccgga accgacttta ctctgaccat ttcctctctg 300
cagcctgagg atttcgcaac atactattgc cagcaggcca acagcttccc actgaccttt 360
ggcgggggaa caaaagtgga gatcaagagg actgtcgccg ctccctctgt gttcattttt 420
ccccctagtg acgaacagct gaaaagcggc acagcttccg tggtctgtct gctgaacaat 480
ttttaccctc gcgaagcaaa agtccagtgg aaggtggata acgccctgca gtctgggaat 540
agtcaggagt cagtgactga acaggacagc aaagattcca cctattctct gagttcaaca 600
ctgactctgt ccaaggctga ctacgagaag cacaaactgt atgcatgcga agtcacacat 660
cagggactga gctcccctgt gactaagtct ttcaatagag gcgagtgttg ataa 714
<210> 91
<211> 1410
<212> DNA
<213> 人工序列
<220>
<223> 人类IgG HC1重链cDNA
<400> 91
atggattgga cttggagatt cctcttcgtc gtagcagcag ctacaggtgt ccagtccgag 60
gtgcagctgg tggaatcagg ggggggactg gtgcagcctg gagggtcact gcgactgtct 120
tgtgccgctt ctgggttcac ttttaccgac tacacaatgg attgggtgcg caaggcacct 180
ggcaagggac tggagtgggt cgctgatgtg aacccaaata gcggcgggtc catctacaac 240
caggagttca agggccggtt caccctgtcc gtggaccgat ctaaaaacac cctgtatctg 300
cagatgaata gcctgcgagc tgaagatact gcagtgtact attgcgcccg gaatctgggc 360
cccagcttct actttgacta ttggggacag ggcactctgg tcaccgtgag ctccgctagt 420
acaaagggcc cttcagtgtt cccactggca ccctctagta aatccacatc tggaggcact 480
gccgctctgg ggtgtctggt gaaggactac ttcccagagc ccgtcaccgt gtcttggaac 540
agtggggcac tgactagcgg agtcgcaacc ggacctgccg tgctgcagtc aagcggactg 600
tactccctgt cctctgtggt caccgtccca agttcaagcc tgggcactca gacctatatc 660
tgcaacgtga atcacaagcc aagtaataca aaagtggaca agaaagtgga gcccaagtct 720
tgtgataaaa cacatacttg ccccccttgt cctgcaccag aactgctggg gggaccctcc 780
gtgttcctgt ttccacccaa gcctaaagat accctgatga ttagcaggac cccagaggtc 840
acatgcgtgg tcgtggacgt gagccacgag gaccccgaag tcaagtttaa ctggtacgtg 900
gacggcgtcg aagtgcataa tgctaagaca aaacccaggg aggaacagta caacagcacc 960
tatcgcgtcg tgtccgtcct gacagtgctg catcaggatt ggctgaacgg aaaagagtat 1020
aagtgcaaag tgtccaataa ggcactgccc gcccctatcg agaaaacaat ttctaaggcc 1080
aaaggccagc ctagagaacc acaggtgtat accctgcctc catccaggga tgaactgaca 1140
aagaaccagg tctctctgac ttgtctggtg aaaggcttct atccctcaga tattgctgtg 1200
gagtgggaaa gcaatgggca gcctgagaac aattacaaga ccacaccccc tgtgctggac 1260
tcagatggga gcttctttct gtattctaag ctgaccgtgg acaaaagtcg gtggcagcag 1320
ggaaatgtct ttagttgttc agtgatgcac gaagcactgc acaaccatta cactcagaaa 1380
tcactgtcac tgtcccctgg caagtgataa 1410
<210> 92
<211> 702
<212> DNA
<213> 人工序列
<220>
<223> 人类IgG LC1轻链cDNA
<400> 92
atggcttggg ctctgctgct gctgacactg ctgacccagg atacaggatc ttgggctcgc 60
attcagatga cccagtcccc tagttctctg tccgcctctg tgggcgacag ggtcaccatc 120
acatgcaagg ctagccagga cgtgagcatt ggagtcgcat ggtatcagga taagccaggc 180
aaagcaccca agctgctgat ctatagtgcc tcataccggt ataccggggt gcccagcaga 240
ttcagcggat ccgggtctgg aacagacttt actctgacca ttagctccct gcagccagag 300
gatttcgcca catactattg ccagcagtac tatatctacc cctatacatt tggccagggg 360
actaaagtgg aaattaaggg ccagcctaaa gccgctccat ccgtcactct gttcccccct 420
tctagtgagg aactgcaggc taacaaggcc accctggtgt gctacatctc tgacttttat 480
cctggggcag tgaccgtcgc atggaaggct gattcaagcc ccgtgaaagc tggagtcgag 540
accacaactc ctagcaagca gtccaacaac aagtacgcag cctggtctta tctgagtctg 600
acaccagaac agtggaaaag ccaccggagt tactcatgtc aggtcactca cgaaggcagc 660
actgtggaaa aaactgtggc tcctaccgaa tgttcttgat aa 702
<210> 93
<211> 1416
<212> DNA
<213> 人工序列
<220>
<223> 人类IgG HC2重链cDNA
<400> 93
atggattgga catggcgctt tctgttcgtc gtcgcagccg caaccggagt gcagtctcag 60
gtgcagctgg tgcagtcagg agccgaggtg aagaaacctg gcgcctccgt caaagtgtct 120
tgcaaggcta gtgggtacac tttcacctct cactggatgc attgggtgag atatgcccct 180
gggcagggac tggagtggat cggagaattc aacccaagca atggaaggac taactacaac 240
gagaagttta aatctaaggc tacaatgact gtggatacca gtacaaacac tgcatatatg 300
gagctgagct ccctgaggtc agaggacacc gccgtgtact attgcgcaag ccgggactac 360
gattatgacg gaagatactt cgattattgg ggccagggga cactggtcac cgtgagcagc 420
gccagcacca aaggccctag cgtgtttcca ctggctccct caagcaagag tacctcagga 480
gggacagccg ctctgggatg tctggtgaag gactacttcc cagagcccgt caccgtgtct 540
tggaacagtg gagcactgac aagcggcgtc cacacttttc ctgccgtgct gcagtcctct 600
gggctgtact ccctgagttc agtggtcacc gtcccaagct cctctctggg aacccagaca 660
tatatctgca acgtgaatca caaaccaagt aatacaaagg tggacaagaa ggtggaaccc 720
aaaagctgtg acaagactca tacctgccca ccttgtcctg caccagagct gctgggagga 780
ccaagcgtgt tcctgtttcc acccaaacct aaggataccc tgatgattag ccgcactcca 840
gaagtcacct gcgtggtcgt ggacgtgagc cacgaggacc ccgaagtcaa gtttaactgg 900
tacgtggacg gcgtcgaggt gcataatgcc aaaacaaagc ccagggagga acagtacaac 960
tccacttatc gcgtcgtgtc tgtcctgacc gtgctgcacc aggattggct gaacggcaag 1020
gaatataaat gcaaggtgtc taacaaggcc ctgcccgccc ctatcgagaa gacaattagc 1080
aaagcaaagg gccagcccag agagccacag gtgtataccc tgcctcccag ccgggacgag 1140
ctgaccaaaa accaggtctc tctgacatgt ctggtgaagg gattctatcc cagcgacatt 1200
gctgtggagt gggaatccaa tggccagcct gagaacaatt acaagaccac accccctgtg 1260
ctggattcag acggcagctt ctttctgtat agtaaactga ccgtggacaa gtcacgatgg 1320
cagcagggga atgtctttag ctgttccgtg atgcatgaag cactgcataa tcactacacc 1380
cagaaatcac tgtcactgag cccaggaaaa taatga 1416
<210> 94
<211> 696
<212> DNA
<213> 人工序列
<220>
<223> 人类IgG LC2轻链cDNA
<400> 94
atggcttggg ctctgctgct gctgaccctg ctgacccagg acaccgggag ttgggctgac 60
atccagatga cccagtcccc ttcttccctg agtgcatcag tgggcgaccg ggtcaccatc 120
acatgcagcg ccagctcctc tgtgacatac atgtattggt atcagagaaa gccaggaaaa 180
gctcccaagc tgctgatcta cgatacttct aacctggcaa gtggcgtgcc aagcaggttc 240
agcggatccg gatctggaac tgactacact tttaccatca gttcactgca gcccgaggat 300
attgccacct actattgcca gcagtggagc tcccacatct tcacatttgg ccaggggact 360
aaagtggaaa ttaaggggca gcctaaagcc gctccaagcg tcacactgtt ccccccttct 420
agtgaggaac tgcaggctaa taaggccacc ctggtgtgcc tgatctccga cttttatcct 480
ggggccgtga cagtcgcctg gaaggctgat tcaagccccg tgaaagctgg agtcgagacc 540
acaactccta gcaagcagtc caacaacaag tatgcagcct cctcttacct gtccctgacc 600
cccgaacagt ggaaatctca tcggagttac tcatgtcagg tcactcacga agggagcact 660
gtggaaaaaa ccgtcgcacc aaccgaatgt tcataa 696

Claims (26)

1.一种隐身型RNA基因表达***,所述隐身型RNA基因表达***是由包含下述(1)~(8)的RNA序列的负单链RNA(A)、单链RNA结合蛋白(B)和RNA依赖性RNA合成酶(C)构成的不使先天免疫机制激活的复合体:
(1)编码任意蛋白质或功能性RNA的目标RNA序列;
(2)构成非编码区的在动物细胞中表达的mRNA的RNA序列;
(3)前述RNA依赖性RNA合成酶所识别的属于副粘病毒科的病毒的基因组的转录起始信号序列;
(4)该酶所识别的属于副粘病毒科的病毒的基因组的转录终止信号序列;
(5)包含该酶所识别的复制起点的RNA序列;
(6)编码该酶的RNA序列,并且是针对人类细胞进行了密码子优化的RNA序列;
(7)编码调节该酶活性的蛋白质的RNA序列,并且是针对人类细胞进行了密码子优化的RNA序列;
(8)编码前述单链RNA结合蛋白的RNA序列,并且是针对人类细胞进行了密码子优化的RNA序列,
其中,前述(6)的RNA序列所编码的RNA依赖性RNA合成酶是属于副粘病毒科的RNA病毒的L蛋白和P蛋白;
前述(7)的RNA序列所编码的调节该酶活性的蛋白质是与该RNA病毒相同的病毒的C蛋白;
前述(8)的RNA序列所编码的单链RNA结合蛋白是与该RNA病毒相同的病毒的NP蛋白;
前述(3)~(5)的RNA序列中的任一者都是包含与该RNA病毒相同的病毒的基因组序列中的转录起始信号、转录终止信号和复制起点的RNA序列;
编码前述L蛋白、P蛋白、C蛋白和NP蛋白的RNA序列针对人类细胞进行了优化,并且其GC含量被调节在50~60%的范围内。
2.如权利要求1所述的隐身型RNA基因表达***,其中,前述(1)的目标RNA序列是包含至少6个基因或全长为5000个碱基以上长度的RNA序列。
3.如权利要求1或2所述的隐身型RNA基因表达***,其中,前述(2)的RNA序列是人类的mRNA序列的5~49个碱基长度的RNA序列。
4.如权利要求1~3中任一项所述的隐身型RNA基因表达***,其特征在于,由相同或不同序列构成的前述(2)的RNA序列被配置为邻接于前述(1)的目标RNA序列中所包含的各基因序列的3ˊ末端侧和/或5ˊ末端侧。
5.如权利要求1~3中任一项所述的隐身型RNA基因表达***,其中,前述属于副粘病毒科的RNA病毒是选自于仙台病毒、人副流感病毒和新城疫病毒中的任一者的RNA病毒。
6.如权利要求1~3中任一项所述的隐身型RNA基因表达***,其特征在于,
前述(3)的转录起始信号序列是选自于3ˊ-UCCCACUUUC-5ˊ(序列号1)、3ˊ-UCCCUAUUUC-5ˊ(序列号2)、3ˊ-UCCCACUUAC-5ˊ(序列号3)、3ˊ-UCCUAAUUUC-5ˊ(序列号7)和3ˊ-UGCCCAUCUUC-5ˊ(序列号9)中的任一者所示的RNA序列的RNA序列;
前述(4)的转录终止信号序列是选自于3ˊ-AAUUCUUUUU-5ˊ(序列号4)、3ˊ-CAUUCUUUUU-5ˊ(序列号5)、3ˊ-UAUUCUUUUU-5ˊ(序列号6)和3ˊ-UUAUUCUUUUU-5ˊ(序列号8)中的任一者所示的RNA序列的RNA序列。
7.如权利要求4所述的隐身型RNA基因表达***,其特征在于,
前述(3)的转录起始信号序列是选自于3ˊ-UCCCACUUUC-5ˊ(序列号1)、3ˊ-UCCCUAUUUC-5ˊ(序列号2)、3ˊ-UCCCACUUAC-5ˊ(序列号3)、3ˊ-UCCUAAUUUC-5ˊ(序列号7)和3ˊ-UGCCCAUCUUC-5ˊ(序列号9)中的任一者所示的RNA序列的RNA序列;
前述(4)的转录终止信号序列是选自于3ˊ-AAUUCUUUUU-5ˊ(序列号4)、3ˊ-CAUUCUUUUU-5ˊ(序列号5)、3ˊ-UAUUCUUUUU-5ˊ(序列号6)和3ˊ-UUAUUCUUUUU-5ˊ(序列号8)中的任一者所示的RNA序列的RNA序列。
8.如权利要求4所述的隐身型RNA基因表达***,其特征在于,前述(2)的RNA序列被配置为邻接于前述(1)的目标RNA序列中所包含的各基因序列的3ˊ末端侧,由相同或不同序列构成的前述(3)的转录起始信号序列被配置为邻接于前述(2)的RNA序列的更3ˊ末端侧;并且,前述(4)的转录终止信号序列被配置为邻接于被配置为与前述(1)的目标RNA序列中所包含的各基因序列的5ˊ末端侧相邻接的RNA序列的更5ˊ末端侧。
9.如权利要求6所述的隐身型RNA基因表达***,其特征在于,前述(2)的RNA序列被配置为邻接于前述(1)的目标RNA序列中所包含的各基因序列的3ˊ末端侧,由相同或不同序列构成的前述(3)的转录起始信号序列被配置为邻接于前述(2)的RNA序列的更3ˊ末端侧;并且,前述(4)的转录终止信号序列被配置为邻接于被配置为与前述(1)的目标RNA序列中所包含的各基因序列的5ˊ末端侧相邻接的RNA序列的更5ˊ末端侧。
10.如权利要求1~3中任一项所述的隐身型RNA基因表达***,其特征在于,前述(5)的包含复制起点的RNA序列包含下述序列:
(a)3ˊ-UGGUCUGUUCUC-5ˊ(序列号11)或3ˊ-UGGUUUGUUCUC-5ˊ(序列号12)所示的RNA序列;
(b)3ˊ-GAGAACAGACCA-5ˊ(序列号13)或3ˊ-GAGAACAAACCA-5ˊ(序列号14)所示的RNA序列;
(c)3ˊ-(CNNNNN)3-5ˊ(序列号15)所示的RNA序列;
(d)3ˊ-(NNNNNG)3-5ˊ(序列号16)所示的RNA序列。
11.如权利要求4所述的隐身型RNA基因表达***,其特征在于,前述(5)的包含复制起点的RNA序列包含下述序列:
(a)3ˊ-UGGUCUGUUCUC-5ˊ(序列号11)或3ˊ-UGGUUUGUUCUC-5ˊ(序列号12)所示的RNA序列;
(b)3ˊ-GAGAACAGACCA-5ˊ(序列号13)或3ˊ-GAGAACAAACCA-5ˊ(序列号14)所示的RNA序列;
(c)3ˊ-(CNNNNN)3-5ˊ(序列号15)所示的RNA序列;
(d)3ˊ-(NNNNNG)3-5ˊ(序列号16)所示的RNA序列。
12.如权利要求10所述的隐身型RNA基因表达***,其特征在于,前述(a)的RNA序列位于负单链RNA(A)的3ˊ末端,并且前述(b)的RNA序列位于5ˊ末端。
13.如权利要求11所述的隐身型RNA基因表达***,其特征在于,前述(a)的RNA序列位于负单链RNA(A)的3ˊ末端,并且前述(b)的RNA序列位于5ˊ末端。
14.如权利要求10所述的隐身型RNA基因表达***,其特征在于,前述(c)的RNA序列从负单链RNA(A)的3ˊ末端起第79个碱基开始,并且前述(d)的RNA序列从5ˊ末端起第96个碱基开始。
15.如权利要求12所述的隐身型RNA基因表达***,其特征在于,前述(c)的RNA序列从负单链RNA(A)的3ˊ末端起第79个碱基开始,并且前述(d)的RNA序列从5ˊ末端起第96个碱基开始。
16.如权利要求10所述的隐身型RNA基因表达***,其特征在于,前述(5)的包含复制起点的RNA序列进一步在负单链RNA(A)的3ˊ末端起第97~116个碱基的位置包含(e)3ˊ-AAAGAAACGACGGUUUCA-5ˊ(序列号17)的RNA序列或具有与其相同碱基长度的18个碱基长度的RNA序列。
17.如权利要求12所述的隐身型RNA基因表达***,其特征在于,前述(5)的包含复制起点的RNA序列进一步在负单链RNA(A)的3ˊ末端起第97~116个碱基的位置包含(e)3ˊ-AAAGAAACGACGGUUUCA-5ˊ(序列号17)的RNA序列或具有与其相同碱基长度的18个碱基长度的RNA序列。
18.如权利要求14所述的隐身型RNA基因表达***,其特征在于,前述(5)的包含复制起点的RNA序列进一步在负单链RNA(A)的3ˊ末端起第97~116个碱基的位置包含(e)3ˊ-AAAGAAACGACGGUUUCA-5ˊ(序列号17)的RNA序列或具有与其相同碱基长度的18个碱基长度的RNA序列。
19.一种不使先天免疫机制激活的隐身型RNA载体,其中,该隐身型RNA载体为包含构成权利要求1~18中任一项所述的隐身型RNA基因表达***的复合体、具有将该复合体导入动物细胞的活性的RNA载体。
20.如权利要求19所述的隐身型RNA载体,其中,该隐身型RNA载体形成对动物细胞具有感染能力的病毒颗粒。
21.导入权利要求19或20所述的隐身型RNA载体的动物细胞。
22.一种隐身型RNA,所述隐身型RNA是包含下述(1)~(8)的RNA序列的负单链RNA(A),并且可以与单链RNA结合蛋白(B)和RNA依赖性RNA合成酶(C)一起形成不使先天免疫机制激活的复合体:
(1)编码任意蛋白质或功能性RNA的目标RNA序列;
(2)构成非编码区的先天免疫机制不能识别的RNA序列,并且是在动物细胞中表达的mRNA的5~49个碱基长度的RNA序列;
(3)RNA依赖性RNA合成酶所识别的属于副粘病毒科的病毒的基因组的转录起始信号序列;
(4)该酶所识别的属于副粘病毒科的病毒的基因组的转录终止信号序列;
(5)包含该酶所识别的复制起点的RNA序列;
(6)编码该酶的RNA序列,并且是进行了结构优化使先天免疫机制不能识别的RNA序列;
(7)编码调节该酶活性的蛋白质的RNA序列,并且是进行了结构优化使先天免疫机制不能识别的RNA序列;
(8)编码单链RNA结合蛋白的RNA序列,并且是进行了结构优化使先天免疫机制不能识别的RNA序列,
其中,前述(6)的RNA序列所编码的RNA依赖性RNA合成酶是属于副粘病毒科的RNA病毒的L蛋白和P蛋白;
前述(7)的RNA序列所编码的调节该酶活性的蛋白质是与该RNA病毒相同的病毒的C蛋白;
前述(8)的RNA序列所编码的单链RNA结合蛋白是与该RNA病毒相同的病毒的NP蛋白;
前述(3)~(5)的RNA序列中的任一者都是包含与该RNA病毒相同的病毒的基因组序列中的转录起始信号、转录终止信号和复制起点的RNA序列;
编码前述L蛋白、P蛋白、C蛋白和NP蛋白的RNA序列针对人类细胞进行了优化,并且其GC含量被调节在50~60%的范围内。
23.如权利要求22所述的隐身型RNA,其中,在前述负单链RNA(A)的3ˊ末端侧和5ˊ末端侧包含前述(5)的包含RNA依赖性RNA合成酶所识别的复制起点的RNA序列,并且是分别与3ˊ末端侧的RNA序列和5ˊ末端侧的RNA序列互补的RNA序列。
24.如权利要求22或23所述的隐身型RNA,其特征在于,前述(2)的RNA序列被配置为邻接于前述(1)的目标RNA序列中所包含的多个基因序列各自的3ˊ末端侧,由相同或不同序列构成的前述(3)的转录起始信号序列被配置为邻接于前述(2)的RNA序列的更3ˊ末端侧;并且,前述(4)的转录终止信号序列被配置为邻接于被配置为与前述(1)的目标RNA序列中所包含的多个基因序列的各基因序列的5ˊ末端侧相邻接的RNA序列的更5ˊ末端侧。
25.如权利要求22或23所述的隐身型RNA,其特征在于,前述(2)的RNA序列被配置为邻接于前述(1)的目标RNA序列中所包含的多个基因序列各自的3ˊ末端侧,由相同或不同序列构成的前述(3)的转录起始信号序列被配置为邻接于前述(2)的RNA序列的更3ˊ末端侧;并且,前述(4)的转录终止信号序列被配置为邻接于被配置为与前述(1)的目标RNA序列中所包含的多个基因序列的各基因序列的5ˊ末端侧相邻接的RNA序列的更5ˊ末端侧;进一步地,在其两端构成具有多个可通过限制性酶进行酶切的限制性酶酶切位点的盒结构,多个该盒结构结合在一起。
26.一种重构权利要求1~18中任一项所述的隐身型RNA基因表达***的方法,所述方法是包括下述(1)~(5)的步骤的方法:
(1)准备表达T7 RNA聚合酶的大肠杆菌的步骤;
(2)将搭载外源基因RNA以及至少编码RNA依赖性RNA合成酶和RNA结合活性蛋白的RNA的大肠杆菌用载体、以及表达编码RNA结合活性蛋白的DNA的大肠杆菌用载体导入(1)的大肠杆菌宿主内的转化步骤;
(3)在(2)的转化大肠杆菌内,形成负单链RNA与RNA结合活性蛋白的复合体的步骤,该负单链RNA包含通过T7 RNA聚合酶使之表达的外源基因RNA;
(4)准备表达RNA依赖性RNA合成酶的动物细胞的步骤;
(5)将由(3)得到的负单链RNA与RNA结合活性蛋白的复合体导入(4)的动物细胞宿主内,重构由负单链RNA、RNA结合活性蛋白和RNA依赖性RNA合成酶的复合体所构成的隐身型RNA基因表达***的步骤。
CN201680005950.0A 2015-01-16 2016-01-18 使用具有隐身性的rna的基因表达***以及包含该rna的基因导入、表达载体 Active CN107109400B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2015007288 2015-01-16
JP2015-007288 2015-01-16
PCT/JP2016/051336 WO2016114405A1 (ja) 2015-01-16 2016-01-18 ステルス性を有するrnaを使った遺伝子発現系および当該rnaを含む遺伝子導入・発現ベクター

Publications (2)

Publication Number Publication Date
CN107109400A CN107109400A (zh) 2017-08-29
CN107109400B true CN107109400B (zh) 2021-06-08

Family

ID=56405944

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680005950.0A Active CN107109400B (zh) 2015-01-16 2016-01-18 使用具有隐身性的rna的基因表达***以及包含该rna的基因导入、表达载体

Country Status (9)

Country Link
US (3) US10544431B2 (zh)
EP (1) EP3246406B1 (zh)
JP (3) JP6770224B2 (zh)
KR (1) KR102459458B1 (zh)
CN (1) CN107109400B (zh)
CA (1) CA2973943A1 (zh)
SG (1) SG11201705820UA (zh)
TW (1) TWI696700B (zh)
WO (1) WO2016114405A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108363904B (zh) * 2018-02-07 2019-06-28 南京林业大学 一种用于木本植物遗传密码子优化的CodonNX***及其优化方法
CN110331165B (zh) * 2019-05-13 2021-05-11 深圳市瑞亚再生医学科技有限责任公司 用于人体细胞重编程的重组仙台病毒的制备方法及其应用
WO2020256099A1 (ja) * 2019-06-21 2020-12-24 国立大学法人大阪大学 外来遺伝子を安定的に保持する人工組換えrnaウイルスの作製方法
WO2021194672A1 (en) 2020-03-23 2021-09-30 Hdt Bio Corp. Compositions and methods for delivery of rna
CN110804627B (zh) * 2019-11-22 2022-12-13 中国科学院深圳先进技术研究院 一种表达E2-crimson的重组伪狂犬病毒及其制备方法和应用
WO2022165085A1 (en) * 2021-01-29 2022-08-04 Academia Sinica Kits and methods for nucleic acid delivery
WO2023049753A2 (en) * 2021-09-22 2023-03-30 Hdt Bio Corp. Compositions and methods for enhanced antigen binding proteins

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001081596A2 (en) * 2000-04-26 2001-11-01 Zymogenetics, Inc. Methods for enhancing the expression of a protein of interest by recombinant host cells
WO2005085456A1 (en) * 2004-03-09 2005-09-15 Eidgenoessische Technische Hochschule Zurich New expression tools for multiprotein applications
EP2639297A1 (en) * 2010-11-09 2013-09-18 National Institute of Advanced Industrial Science And Technology Method for producing peripheral blood monocyte-derived pluripotent stem cells

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4223769A3 (en) 2005-12-13 2023-11-01 Kyoto University Nuclear reprogramming factor
CN101517079A (zh) * 2006-07-13 2009-08-26 生物载体株式会社 非复制型副粘病毒科病毒载体
WO2008118820A2 (en) 2007-03-23 2008-10-02 Wisconsin Alumni Research Foundation Somatic cell reprogramming
US8530233B2 (en) * 2007-10-02 2013-09-10 Genetai Inc Expression vector with enhanced gene expression capacity and method for using the same
US7561973B1 (en) 2008-07-31 2009-07-14 Dna Twopointo, Inc. Methods for determining properties that affect an expression property value of polynucleotides in an expression system
US8401798B2 (en) 2008-06-06 2013-03-19 Dna Twopointo, Inc. Systems and methods for constructing frequency lookup tables for expression systems
EP2322611B1 (en) 2008-07-16 2016-06-01 IP Pharma Co., Ltd. Method for production of reprogrammed cell using chromosomally unintegrated virus vector
EP2434012B1 (en) 2009-05-18 2017-12-13 National Institute of Advanced Industrial Science And Technology Vector material for creating pluripotent stem cells, and pluripotent stem cell creation method using said vector material
US8496941B2 (en) 2009-06-03 2013-07-30 National Institute Of Advanced Industrial Science And Technology Vectors for generating pluripotent stem cells and methods of producing pluripotent stem cells using the same
US8326547B2 (en) 2009-10-07 2012-12-04 Nanjingjinsirui Science & Technology Biology Corp. Method of sequence optimization for improved recombinant protein expression using a particle swarm optimization algorithm
CN103189508B (zh) * 2010-08-30 2016-08-10 生物载体株式会社 用于诱导多能性干细胞的组合物及其用途

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001081596A2 (en) * 2000-04-26 2001-11-01 Zymogenetics, Inc. Methods for enhancing the expression of a protein of interest by recombinant host cells
WO2005085456A1 (en) * 2004-03-09 2005-09-15 Eidgenoessische Technische Hochschule Zurich New expression tools for multiprotein applications
EP2639297A1 (en) * 2010-11-09 2013-09-18 National Institute of Advanced Industrial Science And Technology Method for producing peripheral blood monocyte-derived pluripotent stem cells

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Large-Scale Nucleotide Optimization of Simian Immunodeficiency Virus Reduces Its Capacity To Stimulate Type I Interferon In Vitro;N.VABRET ET AL.;《JOURNAL OF VIROLOGY》;20140129;第88卷(第8期);4168-4170 *

Also Published As

Publication number Publication date
EP3246406A4 (en) 2018-07-04
JP2022141733A (ja) 2022-09-29
TW201636426A (zh) 2016-10-16
US10544431B2 (en) 2020-01-28
US20170369903A1 (en) 2017-12-28
US11926840B2 (en) 2024-03-12
TWI696700B (zh) 2020-06-21
SG11201705820UA (en) 2017-08-30
WO2016114405A1 (ja) 2016-07-21
EP3246406B1 (en) 2022-03-09
CN107109400A (zh) 2017-08-29
JP6770224B2 (ja) 2020-10-14
KR102459458B1 (ko) 2022-10-25
JP2021006032A (ja) 2021-01-21
US20200190537A1 (en) 2020-06-18
US20200157571A1 (en) 2020-05-21
JP7174958B2 (ja) 2022-11-18
KR20170101926A (ko) 2017-09-06
EP3246406A1 (en) 2017-11-22
CA2973943A1 (en) 2016-07-21
JPWO2016114405A1 (ja) 2017-10-19
US11834667B2 (en) 2023-12-05

Similar Documents

Publication Publication Date Title
CN107109400B (zh) 使用具有隐身性的rna的基因表达***以及包含该rna的基因导入、表达载体
KR102235603B1 (ko) 향상된 이식유전자 발현 및 가공
AU2023251441A1 (en) RNA containing composition for treatment of tumor diseases
AU2018271254B2 (en) Reprogramming progenitor compositions and methods of use therefore
KR101476010B1 (ko) 고생산성 세포의 수립을 위한 발현 벡터 및 고생산성 세포
KR20200126997A (ko) 인간 대상체에서의 비-노화-관련 청각 손상의 치료를 위한 조성물 및 방법
KR20210060429A (ko) 적응 면역의 조절을 위한 조성물 및 방법
KR20220044811A (ko) Crispr/cas13을 사용하는 표적화된 트랜스-이어맞추기
KR20230029603A (ko) 필수 유전자 녹-인에 의한 선택
KR101791770B1 (ko) 단백질의 제조 방법
KR20180091099A (ko) 단백질 제조를 위한 개선된 진핵 세포 및 이들을 제조하는 방법
RU2775176C2 (ru) Нуклеиновые кислоты, кодирующие ассоциированные с crispr белки, и их применения
KR102443932B1 (ko) 세포의 부착 의존성 조절용 조성물
RU2779637C1 (ru) Содержащая рнк композиция для лечения опухолевых заболеваний
CN116018404A (zh) 缺陷干扰病毒基因组

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant