CN109022478A - 一种用于高通量体外蛋白质合成的dna元件 - Google Patents

一种用于高通量体外蛋白质合成的dna元件 Download PDF

Info

Publication number
CN109022478A
CN109022478A CN201710430876.3A CN201710430876A CN109022478A CN 109022478 A CN109022478 A CN 109022478A CN 201710430876 A CN201710430876 A CN 201710430876A CN 109022478 A CN109022478 A CN 109022478A
Authority
CN
China
Prior art keywords
sequence
protein
yeast
dna
kluyveromyces
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710430876.3A
Other languages
English (en)
Inventor
郭敏
王海鹏
柴智
刘帅龙
于雪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kang Code (shanghai) Biological Technology Co Ltd
Original Assignee
Kang Code (shanghai) Biological Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kang Code (shanghai) Biological Technology Co Ltd filed Critical Kang Code (shanghai) Biological Technology Co Ltd
Priority to CN201710430876.3A priority Critical patent/CN109022478A/zh
Publication of CN109022478A publication Critical patent/CN109022478A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/43504Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
    • C07K14/43595Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from coelenteratae, e.g. medusae
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4716Muscle proteins, e.g. myosin, actin
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0008Oxidoreductases (1.) acting on the aldehyde or oxo group of donors (1.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0065Oxidoreductases (1.) acting on hydrogen peroxide as acceptor (1.11)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0069Oxidoreductases (1.) acting on single donors with incorporation of molecular oxygen, i.e. oxygenases (1.13)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y102/00Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
    • C12Y102/01Oxidoreductases acting on the aldehyde or oxo group of donors (1.2) with NAD+ or NADP+ as acceptor (1.2.1)
    • C12Y102/01009Glyceraldehyde-3-phosphate dehydrogenase (NADP+) (1.2.1.9)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y111/00Oxidoreductases acting on a peroxide as acceptor (1.11)
    • C12Y111/01Peroxidases (1.11.1)
    • C12Y111/01006Catalase (1.11.1.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y113/00Oxidoreductases acting on single donors with incorporation of molecular oxygen (oxygenases) (1.13)
    • C12Y113/12Oxidoreductases acting on single donors with incorporation of molecular oxygen (oxygenases) (1.13) with incorporation of one atom of oxygen (internal monooxygenases or internal mixed function oxidases)(1.13.12)
    • C12Y113/12007Photinus-luciferin 4-monooxygenase (ATP-hydrolysing) (1.13.12.7), i.e. firefly-luciferase

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Mycology (AREA)
  • Toxicology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明提供了一种用于高通量体外蛋白质合成的DNA元件,具体地,本发明首次意外地发现了一种可大幅度增强蛋白质翻译效率的新型DNA元件,在酵母体外蛋白质合成体系中应用本发明的DNA元件,所合成的荧光素酶活性的相对光单位值比仅含有Ω序列的DNA元件增强约22.3倍。

Description

一种用于高通量体外蛋白质合成的DNA元件
技术领域
本发明涉及生物技术领域,较佳地,涉及一种用于高通量体外蛋白质合成的DNA元件。
背景技术
在真核细胞内,绝大部分用于编码蛋白质的mRNA分子都含有5’端的“帽子”结构(m7GpppN)和3’端的多聚腺苷链[poly(A)]结构。这两种结构不仅可以增强 mRNA分子的稳定性,而且是蛋白质翻译所必需的[1]。其中,5’“帽子”结构能够被翻译起始因子eIF4E所识别,并招募下游的多种翻译起始因子和核糖体,进而起始蛋白质翻译过程[1]。真核细胞内对mRNA进行加“帽子”修饰涉及由3个酶催化的3步反应,而且这个过程是与由RNA聚合酶II催化的转录同时进行的[2]
在转录与翻译偶联的体外蛋白质合成体系中,往往使用噬菌体或者病毒的 RNA聚合酶(如T7RNA聚合酶)进行转录,这决定了很难对mRNA进行加“帽子”修饰。在基于真核细胞的体外蛋白质合成体系中,要想利用来源于真核细胞的蛋白质翻译体系(包括翻译起始因子和核糖体等),不具有“帽子”结构的mRNA 必须含有其他元件来招募相关因子,进而起始蛋白质的翻译[3]
然而,目前的提高蛋白质合成所用的元件主要有烟草花叶病毒的翻译增强子Ω序列和一些其他病毒的内部核糖体进入序列(Internal Ribosome Entry Sites,IRESs),如EMCV IRES(Encephalomyocarditis virus)。这些元件可以在细胞内和体外蛋白质合成体系中起始“帽子”-非依赖的蛋白质翻译。但是,这些元件起始蛋白质翻译的效率往往比较低,会增加蛋白质合成所需时间,限制最终蛋白质的产量[4]
因此,本领域迫切需要开发一种能够增强蛋白质翻译效率的新的DNA元件。
发明内容
本发明的目的在于提供一种能够增强蛋白质翻译效率的新的DNA元件。
本发明第一方面提供了一种核酸构建物,所述的构建物具有从5’至3’的式 I结构:
Z1-Z2-Z3-Z4 (I)
式中,
Z1、Z2、Z3、Z4分别为用于构成所述构建物的元件;
各“-”独立地为键或核苷酸连接序列;
Z1为烟草花叶病毒的5’端前导序列(leading sequence)-Ω序列;
Z2为腺嘌呤脱氧核苷酸的寡聚链[oligo(A)]n
Z3为翻译起始密码子;
Z4为丝氨酸密码子;
并且,所述Z2、Z3、Z4共同组成了Kozak序列,所述Kozak序列来源于克鲁维酵母属酵母。
在另一优选例中,所述克鲁维酵母属酵母选自下组:乳酸克鲁维酵母、马克斯克鲁维酵母、多布克鲁维酵母(Kluyveromyces dobzhanskii)、或其组合。
在另一优选例中,所述翻译起始密码子选自下组:ATG、ATA、ATT、GTG、 TTG、或其组合。
在另一优选例中,所述翻译起始密码子为ATG。
在另一优选例中,所述丝氨酸密码子选自下组:TCT、TCC、TCA、TCG、 AGT、AGC、或其组合。
在另一优选例中,所述丝氨酸密码子为TCT。
在另一优选例中,n为6-12,较佳地,8-10。
在另一优选例中,所述Ω序列包括直接重复模块(ACAATTAC)m和(CAA) p模块。
在另一优选例中,所述m为1-6,较佳地,2-4。
在另一优选例中,所述p为6-12个,较佳地,8-10个。
在另一优选例中,所述(CAA)p模块为1-5个,较佳地,1-3个。
在另一优选例中,所述(CAA)p模块还包括优化的(CAA)p模块。
在另一优选例中,所述核酸构建物的序列如SEQ ID NO.:1-3所示。
在另一优选例中,所示Kozak序列如SEQ ID NO.:5所示。
本发明第二方面提供了一种核酸构建物,所述的构建物具有从5’至3’的式 II结构:
Z1-Z2-Z3-Z4-Z5 (II)
式中,
Z1、Z2、Z3、Z4、Z5分别为用于构成所述构建物的元件;
各“-”独立地为键或核苷酸连接序列;
Z1为烟草花叶病毒的5’端前导序列(leading sequence)-Ω序列;
Z2为腺嘌呤脱氧核苷酸的寡聚链[oligo(A)]n
Z3为翻译起始密码子;
Z4为丝氨酸密码子;
Z5为外源蛋白的编码序列;
并且,所述Z2、Z3、Z4共同组成了Kozak序列,所述Kozak序列来源于克鲁维酵母属酵母。
在另一优选例中,所述外源蛋白的编码序列来自原核生物、真核生物。
在另一优选例中,所述外源蛋白的编码序列来自动物、植物、病原体。
在另一优选例中,所述外源蛋白的编码序列来自哺乳动物,较佳地灵长动物,啮齿动物,包括人、小鼠、大鼠。
在另一优选例中,所述的外源蛋白的编码序列选自下组:编码荧光素蛋白、或荧光素酶(如萤火虫荧光素酶)、绿色荧光蛋白、黄色荧光蛋白、氨酰tRNA合成酶、甘油醛-3-磷酸脱氢酶、过氧化氢酶、肌动蛋白、抗体的可变区域的外源DNA、萤光素酶突变体的DNA、或其组合。
在另一优选例中,所述外源蛋白选自下组:α-淀粉酶、肠道菌素A、丙型肝炎病毒E2糖蛋白、胰岛素前体、干扰素αA、白细胞介素-1β、溶菌酶素、血清白蛋白、单链抗体段(scFV)、甲状腺素运载蛋白、酪氨酸酶、木聚糖酶、或其组合。
在另一优选例中,所述外源蛋白的编码序列的核苷酸序列如SEQ ID NO.:6-12 所示。
本发明第三方面提供了一种载体或载体组合,所述的载体或载体组合含有本发明第一方面或本发明第二方面所述的核酸构建物。
本发明第四方面提供了一种基因工程细胞,所述基因工程细胞的基因组的一个或多个位点整合有本发明第一方面或本发明第二方面所述的构建物,或者所述基因工程细胞中含有本发明第三方面所述的载体或载体组合。
在另一优选例中,所述基因工程细胞为酵母细胞。
在另一优选例中,所述酵母细胞来自克鲁维酵母属酵母。
在另一优选例中,所述克鲁维酵母属酵母选自下组:乳酸克鲁维酵母、马克斯克鲁维酵母、多布克鲁维酵母(Kluyveromyces dobzhanskii)、或其组合。
本发明第五方面提供了一种试剂盒,所述试剂盒中包含的试剂选自下组中的一种或多种:
(a)本发明第一方面或本发明第二方面所述的构建物;
(b)本发明第三方面所述的载体或载体组合;和
(c)本发明第四方面所述的基因工程细胞;
在另一优选例中,所述试剂盒还包括(d)酵母体外蛋白合成体系。
在另一优选例中,所述酵母体外蛋白合成体系为克鲁维酵母体外蛋白合成体系(优选乳酸克鲁维酵母体外蛋白合成体系)。
本发明第六方面提供了如本发明第一方面或本发明第二方面所述的构建物、本发明第三方面所述的载体或载体组合、本发明第四方面所述的基因工程细胞或本发明第五方面所述试剂盒的用途,用于进行高通量的体外蛋白合成。
本发明第七方面提供了一种体外高通量的外源蛋白合成方法,包括步骤:
(i)在酵母体外蛋白合成体系存在下,提供本发明第二方面所述的核酸构建物;
(ii)在适合的条件下,孵育步骤(i)的酵母体外蛋白合成体系一段时间T1,从而合成所述外源蛋白。
在另一优选例中,所述方法还包括:(iii)任选地从所述酵母体外蛋白合成体系中,分离或检测所述外源蛋白。
在另一优选例中,所述酵母体外蛋白合成体系为克鲁维酵母体外蛋白合成体系(优选乳酸克鲁维酵母体外蛋白合成体系)。
在另一优选例中,所述外源蛋白的编码序列来自原核生物、真核生物。
在另一优选例中,所述外源蛋白的编码序列来自动物、植物、病原体。
在另一优选例中,所述外源蛋白的编码序列来自哺乳动物,较佳地灵长动物,啮齿动物,包括人、小鼠、大鼠。
在另一优选例中,所述的外源蛋白的编码序列选自下组:编码荧光素蛋白、或荧光素酶(如萤火虫荧光素酶)、绿色荧光蛋白、黄色荧光蛋白、氨酰tRNA合成酶、甘油醛-3-磷酸脱氢酶、过氧化氢酶、肌动蛋白、抗体的可变区域的外源DNA、萤光素酶突变体的DNA、或其组合。
在另一优选例中,所述外源蛋白选自下组:α-淀粉酶、肠道菌素A、丙型肝炎病毒E2糖蛋白、胰岛素前体、干扰素αA、白细胞介素-1β、溶菌酶素、血清白蛋白、单链抗体段(scFV)、甲状腺素运载蛋白、酪氨酸酶、木聚糖酶、或其组合。
在另一优选例中,所述外源蛋白的编码序列的核苷酸序列如SEQ ID NO.:6-12 所示。
在另一优选例中,所述步骤(ii)中,反应温度为20-37℃,较佳地,22-35℃。
在另一优选例中,所述步骤(ii)中,反应时间为1-10h,较佳地,2-8h。
应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例) 中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。
附图说明
图1显示了加入了含有乳酸克鲁维酵母特异性Kozak序列的Ω -10A/8A/6A-Fluc3个DNA片段和不含有Kozak序列的Ω-Fluc DNA片段在酵母体外蛋白质合成体系中编码合成Fluc蛋白质的相对光单位值(Relative Light Unit,RLU),以及不加入任何DNA片段的酵母体外蛋白质体系的相对光单位值 RLU。
具体实施方式
经过广泛而深入的研究,通过大量筛选和摸索,首次意外地发现了一种可大幅度增强蛋白质翻译效率的新型DNA元件,本发明的DNA元件包括Ω序列、腺嘌呤脱氧核苷寡聚链、翻译起始密码子和丝氨酸密码子,其中后三个元件构成了克鲁维酵母(如乳酸克鲁维酵母)特异性的Kozak序列,在酵母体外蛋白质合成体系中应用本发明的DNA元件,所合成的荧光素酶活性的相对光单位值比仅含有Ω序列的DNA元件增强约22.3倍。在此基础上,本发明人完成了本发明。
酵母体外蛋白质合成体系
酵母(yeast)兼具培养简单、高效蛋白质折叠、和翻译后修饰的优势。其中酿酒酵母(Saccharomyces cerevisiae)和毕氏酵母(Pichia pastoris)是表达复杂真核蛋白质和膜蛋白的模式生物,酵母也可作为制备体外翻译***的原料。
克鲁维酵母(Kluyveromyces)是一种子囊孢子酵母,其中的马克斯克鲁维酵母(Kluyveromyces marxianus)和乳酸克鲁维酵母(Kluyveromyces lactis)是工业上广泛使用的酵母[5]。与其他酵母相比,乳酸克鲁维酵母具有许多优点,如超强的分泌能力, 更好的大规模发酵特性、食品安全的级别、以及同时具有蛋白翻译后修饰的能力等[5]
在本发明中,酵母体外蛋白质合成体系不受特别限制,一种优选的酵母体外蛋白质合成体系为克鲁维酵母表达***(更佳地,乳酸克鲁维酵母表达***)。
在本发明中,所述酵母体外蛋白质合成体系包括:
(a)酵母细胞提取物;
(b)聚乙二醇;
(c)任选的外源蔗糖;和
(d)任选的溶剂,所述溶剂为水或水性溶剂。
在一特别优选的实施方式中,本发明提供的体外蛋白合成体系包括:酵母细胞提取物,4-羟乙基哌嗪乙磺酸,醋酸钾,醋酸镁,腺嘌呤核苷三磷酸(ATP),鸟嘌呤核苷三磷酸(GTP),胞嘧啶核苷三磷酸(CTP),胸腺嘧啶核苷三磷酸(TTP),氨基酸混合物,磷酸肌酸,二硫苏糖醇(DTT),磷酸肌酸激酶,RNA酶抑制剂,荧光素,萤光素酶DNA,RNA聚合酶。
在本发明中,RNA聚合酶没有特别限制,可以选自一种或多种RNA聚合酶,典型的RNA聚合酶为T7RNA聚合酶。
在本发明中,所述酵母细胞提取物在体外蛋白合成体系中的比例不受特别限制,通常所述酵母细胞提取物在体外蛋白质合成蛋白合成体系中所占体系为 20-70%,较佳地,30-60%,更佳地,40-50%。
在本发明中,所述的酵母细胞提取物不含完整的细胞,典型的酵母细胞提取物包括用于蛋白翻译的核糖体、转运RNA、氨酰tRNA合成酶、蛋白质合成需要的起始因子和延伸因子以及终止释放因子。此外,酵母提取物中还含有一些源自酵母细胞的细胞质中的其他蛋白,尤其是可溶性蛋白。
在本发明中,所述的酵母细胞提取物所含蛋白含量为20-100mg/ml,较佳为 50-100mg/ml。所述的测定蛋白含量方法为考马斯亮蓝测定方法。
在本发明中,所述的酵母细胞提取物的制备方法不受限制,一种优选的制备方法包括以下步骤:
(i)提供酵母细胞;
(ii)对酵母细胞进行洗涤处理,获得经洗涤的酵母细胞;
(iii)对经洗涤的酵母细胞进行破细胞处理,从而获得酵母粗提物;
(iv)对所述酵母粗提物进行固液分离,获得液体部分,即为酵母细胞提取物。
在本发明中,所述的固液分离方式不受特别限制,一种优选的方式为离心。
在一优选实施方式中,所述离心在液态下进行。
在本发明中,所述离心条件不受特别限制,一种优选的离心条件为5000-100000×g,较佳地,8000-30000×g。
在本发明中,所述离心时间不受特别限制,一种优选的离心时间为0.5min-2h,较佳地,20min-50min。
在本发明中,所述离心的温度不受特别限制,优选的,所述离心在1-10℃下进行,较佳地,在2-6℃下进行。
在本发明中,所述的洗涤处理方式不受特别限制,一种优选的洗涤处理方式为采用洗涤液在pH为7-8(较佳地,7.4)下进行处理,所述洗涤液没有特别限制,典型的所述洗涤液选自下组:4-羟乙基哌嗪乙磺酸钾、醋酸钾、醋酸镁、或其组合。
在本发明中,所述破细胞处理的方式不受特别限制,一种优选的所述的破细胞处理包括高压破碎、冻融(如液氮低温)破碎。
所述体外蛋白质合成体系中的核苷三磷酸混合物为腺嘌呤核苷三磷酸、鸟嘌呤核苷三磷酸、胞嘧啶核苷三磷酸和尿嘧啶核苷三磷酸。在本发明中,各种单核苷酸的浓度没有特别限制,通常每种单核苷酸的浓度为0.5-5mM,较佳地为1.0-2.0mM。
所述体外蛋白质合成体系中的氨基酸混合物可包括天然或非天然氨基酸,可包括D型或L型氨基酸。代表性的氨基酸包括(但并不限于)20种天然氨基酸:甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、苯丙氨酸、脯氨酸、色氨酸、丝氨酸、酪氨酸、半胱氨酸、蛋氨酸、天冬酰胺、谷氨酰胺、苏氨酸、天冬氨酸、谷氨酸、赖氨酸、精氨酸和组氨酸。每种氨基酸的浓度通常为0.01-0.5mM,较佳地 0.02-0.2mM,如0.05、0.06、0.07、0.08mM。
在优选例中,所述体外蛋白质合成体系还含有聚乙二醇或其类似物。聚乙二醇或其类似物的浓度没有特别限制,通常,聚乙二醇或其类似物的浓度(w/v) 为0.1-8%,较佳地,0.5-4%,更佳地,1-2%,以所述蛋白合成体系的总重量计。代表性的PEG例子包括(但并不限于):PEG3000,PEG8000,PEG6000和PEG3350。应理解,本发明的体系还可包括其他各种分子量的聚乙二醇(如PEG200、400、 1500、2000、4000、6000、8000、10000等)。
在优选例中,所述体外蛋白质合成体系还含有蔗糖。蔗糖的浓度没有特别限制,通常,蔗糖的浓度为0.03-40wt%,较佳地,0.08-10wt%,更佳地,0.1-5wt%,以所述蛋白合成体系的总重量计。
一种特别优选的体外蛋白质合成体系,除了酵母提取物之外,还含有以下组分:22mM,pH为7.4的4-羟乙基哌嗪乙磺酸,30-150mM醋酸钾,1.0-5.0 mM醋酸镁,1.5-4mM核苷三磷酸混合物,0.08-0.24mM的氨基酸混合物,25 mM磷酸肌酸,1.7mM二硫苏糖醇,0.27mg/mL磷酸肌酸激酶,1%-4%聚乙二醇,0.5%-2%蔗糖,8-20ng/μl萤火虫荧光素酶的DNA,0.027-0.054mg/mL T7 RNA聚合酶。
外源蛋白的编码序列(外源DNA)
如本文所用,术语“外源蛋白的编码序列”与“外源DNA”可互换使用,均指外源的用于指导蛋白质合成的DNA分子。通常,所述的DNA分子为线性的或环状的。所述的DNA分子含有编码外源蛋白的序列。
在本发明中,所述的编码外源蛋白的序列的例子包括(但并不限于):基因组序列、cDNA序列。所述的编码外源蛋白的序列还含有启动子序列、5'非翻译序列、 3'非翻译序列。
在本发明中,所述外源DNA的选择没有特别限制,通常,外源DNA选自下组:编码荧光素蛋白、或荧光素酶(如萤火虫荧光素酶)、绿色荧光蛋白、黄色荧光蛋白、氨酰tRNA合成酶、甘油醛-3-磷酸脱氢酶、过氧化氢酶、肌动蛋白、抗体的可变区域的外源DNA、萤光素酶突变体的DNA、或其组合。
外源DNA还可以选自下组:编码α-淀粉酶、肠道菌素A、丙型肝炎病毒E2 糖蛋白、胰岛素前体、干扰素αA、白细胞介素-1β、溶菌酶素、血清白蛋白、单链抗体段(scFV)、甲状腺素运载蛋白、酪氨酸酶、木聚糖酶的外源DNA、或其组合。
一类代表性的外源DNA的序列选自:SEQ ID NO.:6-12。
在一优选实施方式中,所述外源DNA编码选自下组的蛋白:绿色荧光蛋白(enhanced GFP,eGFP)、黄色荧光蛋白(YFP)、大肠杆菌β-半乳糖苷酶 (β-galactosidase,LacZ)、人赖氨酸-tRNA合成酶(Lysine-tRNA synthetase)、人亮氨酸-tRNA合成酶(Leucine-tRNA synthetase)、拟南芥甘油醛3-磷酸脱氢酶 (Glyceraldehyde-3-phosphate dehydrogenase)、鼠过氧化氢酶(Catalase)、或其组合。
在一优选实施方式中,所述绿色荧光蛋白的核苷酸序列如SEQ ID NO.:6所示;所述黄色荧光蛋白的核苷酸序列如SEQ ID NO.:7所示;所述大肠杆菌β-半乳糖苷酶的核苷酸序列如SEQ ID NO.:8所示;所述人赖氨酸-tRNA合成酶的核苷酸序列如SEQ ID NO.:9所示;所述人亮氨酸-tRNA合成酶的核苷酸序列如SEQ ID NO.:10 所示;所述拟南芥甘油醛3-磷酸脱氢酶的核苷酸序列如SEQ ID NO.:11所示;所述鼠过氧化氢酶的核苷酸序列如SEQ IDNO.:12所示。
Ω序列
如本文所用,术语“Ω序列”是烟草花叶病毒基因组的5’端前导序列,是该种病毒的翻译增强子。Ω的DNA序列含有68个碱基对,由1-6个(优选2-4个,更优选3个)8碱基对直接重复模块(ACAATTAC)和1-5个(优选1-3个,更优选 1个)(CAA)p模块,其中,p为6-12个,较佳地,8-10个。这两个模块对于Ω序列的增强翻译功能是关键。在本发明的酵母体外蛋白质合成体系中,Ω序列能够起始“帽子结构”非依赖性的蛋白质翻译,这种功能可能是通过招募翻译起始因子 eIF4G实现的。但是Ω序列起始蛋白质翻译的效率比较低,需要对其构成进行优化,并配合其他DNA元件或者蛋白质来增强蛋白质翻译的效率。
Kozak序列
通过对已知的真核生物的mRNA分子中翻译起始密码子(AUG)上下游序列进行分析,找出的共有序列被称为Kozak序列。Kozak序列被证实能够增强mRNA 的翻译起始效率。不同物种的Kozak序列往往是不同的,如酿酒酵母细胞 (Saccharomyces cerevisiae)与哺乳动物细胞的Kozak序列就存在着显著差异。
在本发明中,所用的Kozak序列包括6-12个腺嘌呤脱氧核苷寡聚链(较佳地, 8-10)、翻译起始密码子(如ATG、ATA、ATT、GTG、TTG等,优选ATG)和丝氨酸密码子(如TCT、TCC、TCA、TCG、AGT、AGC等,优选TCT),来源于克鲁维酵母(优选乳酸克鲁维酵母)。
DNA构建物
本发明提供了一种DNA构建物,所述DNA构建物含有结构如式I所示的核酸序列:
Z1-Z2-Z3-Z4 (I)
式中,
Z1、Z2、Z3、Z4分别为用于构成所述构建物的元件;
各“-”独立地为键或核苷酸连接序列;
Z1为烟草花叶病毒的5’端前导序列(leading sequence)-Ω序列;
Z2为腺嘌呤脱氧核苷酸的寡聚链[oligo(A)]n
Z3为翻译起始密码子;
Z4为丝氨酸密码子;
并且,所述Z2、Z3、Z4共同组成了Kozak序列,所述Kozak序列来源于克鲁维酵母属酵母。
本发明还提供了一种DNA构建物,所述的构建物具有从5’至3’的式II结构:
Z1-Z2-Z3-Z4-Z5 (II)
式中,
Z1、Z2、Z3、Z4、Z5分别为用于构成所述构建物的元件;
各“-”独立地为键或核苷酸连接序列;
Z1为烟草花叶病毒的5’端前导序列(leading sequence)-Ω序列;
Z2为腺嘌呤脱氧核苷酸的寡聚链[oligo(A)]n
Z3为翻译起始密码子;
Z4为丝氨酸密码子;
Z5为外源蛋白的编码序列;
在本发明中,所述外源蛋白的编码序列的选择没有特别限制,通常,外源蛋白的编码序列选自下组:编码荧光素蛋白、或荧光素酶(如萤火虫荧光素酶)、绿色荧光蛋白、黄色荧光蛋白、氨酰tRNA合成酶、甘油醛-3-磷酸脱氢酶、过氧化氢酶、肌动蛋白、抗体的可变区域的外源DNA、萤光素酶突变体的DNA、或其组合。
外源蛋白还可以选自下组:α-淀粉酶、肠道菌素A、丙型肝炎病毒E2糖蛋白、胰岛素前体、干扰素αA、白细胞介素-1β、溶菌酶素、血清白蛋白、单链抗体段(scFV)、甲状腺素运载蛋白、酪氨酸酶、木聚糖酶、或其组合。
此外,本发明的所述核酸构建物可以是线性的,也可以是环状的。本发明的所述核酸构建物可以是单链的,也可以是双链的。本发明的所述核酸构建物可以是 DNA,也可以是RNA,或DNA/RNA杂合。
在另一优选例中,所述的构建物还包括选自下组的元件或其组合:启动子、终止子、poly(A)元件、转运元件、基因靶向元件、筛选标记基因、增强子、抗性基因、转座酶编码基因。
多种选择性标志基因均可应用于本发明,包括但不限于:营养缺陷型标记,抗性标记,报告基因标记。选择性标志的应用对于重组细胞(重组子)的筛选起到作用,使得受体细胞能够与未转化的细胞进行显著区分。营养缺陷型标记是通过转入的标记基因与受体细胞突变基因互补,从而使受体细胞表现野生型生长。抗性标记是指将抗性基因转入受体细胞中,转入的基因使受体细胞在一定的药物浓度下表现抗药性。作为本发明的优选方式,应用抗性标记来实现重组细胞的便捷筛选。
在本发明中,在本发明的酵母体外蛋白质合成体系中应用本发明的DNA构建物,可显著提高蛋白翻译的效率,具体地,应用本发明的DNA构建物所合成的荧光素酶活性的相对光单位值比仅含有Ω序列的DNA元件增强约22.3倍。
载体,基因工程细胞
本发明还提供了一种载体或载体组合,所述载体含有本发明的DNA构建物。优选地,所述载体选自:细菌质粒、噬菌体、酵母质粒、或动物细胞载体、穿梭载体;所述的载体为转座子载体。用于制备重组载体的方法是本领域普通技术人员所熟知的。只要其能够在宿主体内复制和稳定,任何质粒和载体都是可以被采用的。
本领域普通技术人员可以使用熟知的方法构建含有本发明所述的启动子和 /或目的基因序列的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等。
本发明还提供了一种基因工程细胞,所述的基因工程细胞含有所述的构建物或载体或载体组合,或所述的基因工程细胞染色体整合有所述的构建物或载体。在另一优选例中,所述的基因工程细胞还包括含有编码转座酶基因的载体或其染色体上整合有转座酶基因。
优选地,所述的基因工程细胞为真核细胞。
在另一优选例中,所述真核细胞,包括(但不限于):酵母细胞(优选,克鲁维酵母细胞,更优选乳酸克鲁维酵母细胞)。
本发明的构建物或载体,可以用于转化适当的基因工程细胞。基因工程细胞可以是原核细胞,如大肠杆菌,链霉菌属、农杆菌:或是低等真核细胞,如酵母细胞;或是高等动物细胞,如昆虫细胞。本领域一般技术人员都清楚如何选择适当的载体和基因工程细胞。用重组DNA转化基因工程细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物(如大肠杆菌)时,可以用CaCl2法处理,也可用电穿孔法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法(如显微注射、电穿孔、脂质体包装等)。转化植物也可使用农杆菌转化或基因枪转化等方法,例如叶盘法、幼胚转化法、花芽浸泡法等。
体外高通量的蛋白合成方法
本发明提供了一种体外高通量的蛋白合成方法,包括步骤:
(i)在酵母体外蛋白合成体系存在下,提供本发明第一方面所述的核酸构建物,并加入外源的用于指导蛋白质合成的DNA分子;或提供本发明第二方面所述的核酸构建物;
(ii)在适合的条件下,孵育步骤(i)的酵母体外蛋白合成体系一段时间T1,从而合成由所述外源DNA编码的蛋白质或外源蛋白。
本发明的主要优点包括:
(1)本发明首次发现,将Ω序列和来源于克鲁维酵母(优选乳酸克鲁维酵母) 的Kozak序列作为核酸构建物,应用于本发明的酵母体外蛋白质合成体系中,可显著提高蛋白翻译的效率。
(2)本发明首次发现,与仅含有Ω序列的DNA元件相比,本发明的DNA构建物所合成的荧光素酶活性的相对光单位值增强约22.3倍。
(3)本发明首次发现,在促进蛋白质合成方面,Ω-10A要优于Ω-8A和Ω-6A。
(4)本发明的新型DNA元件Ω-10A来源于乳酸克鲁维酵母特异性的Kozak 序列,能够显著增强酵母体外合成体系合成蛋白质的效率。与不含有Kozak序列的Ω-Fluc DNA片段相比,Ω-10A-Fluc增加了22.3倍的蛋白质合成量。
(5)本发明通过对乳酸克鲁维酵母基因mRNA中翻译起始密码子AUG上下游序列的分析发现,其5’端的序列是A与U富集的,而且含有多腺嘌呤核苷(10A) 寡聚链的DNA片段增强蛋白质合成的效率要优于含有8A与6A的DNA片段。以上分析与实验结果表明,本发明所包含的新型DNA元件具有进一步优化的潜力。
(6)本发明所包含的新型DNA元件Ω-10A中的Ω序列通常被应用于体外蛋白质合成体系中,来起始蛋白质的合成。本发明通过对Ω序列组成部分的了解,得知具有起始蛋白质翻译能力的可能的组成模块,后续可以针对这些模块的序列、数量以及不同模块之间的排列顺序进行进一步的优化,期望能够更进一步强化其起始蛋白质合成效率的能力。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人,分子克隆:实验室手册(New York: Cold Spring HarborLaboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。除非另外说明,否则百分比和份数是重量百分比和重量份数。
如无特别说明,则本发明实施例中所用的材料和试剂均为市售产品。
实施例1:乳酸克鲁维酵母特异性Kozak序列分析
1.1乳酸克鲁维酵母特异性的Kozak序列的确定:根据分析酿酒酵母(Saccharomyces cerevisiae)特异性的Kozak序列的方法,检索并收集乳酸克鲁维酵母107个基因的mRNA序列,并将筛选出的乳酸克鲁维酵母mRNA翻译起始密码子AUG 5’端的60个碱基序列和3’端下游的一个密码子序列进行A、 U、C和G的含量分析,意外发现在AUG的5’端位置上,腺嘌呤A的比例占优势,而在AUG的3’端确定了一个丝氨酸的密码子UCU占优势,这样就初步确定了乳酸克鲁维酵母特异性的Kozak序列,命名为kl-Kozak序列。
1.2构建含有乳酸克鲁维酵母特异性kl-Kozak序列的酵母体外蛋白质合成体系质粒:在原有的酵母体外蛋白质合成体系质粒(修改过的pET21a质粒,获自康码(上海)生物科技有限公司)中的Ω序列与报告基因萤火虫荧光素酶 Fluc的序列之间加入乳酸克鲁维酵母特异性的kl-Kozak序列,在Fluc起始密码子的5’端***了含有不同数量腺嘌呤脱氧核苷酸的寡聚链,包括10A、8A 和6A,并将丝氨酸密码子TCT***Fluc起始密码子和第二个密码子之间,最终形成了含有乳酸克鲁维酵母特异性kl-Kozak序列的pKL-Ω-10A-Fluc、 pKL-Ω-8A-Fluc和pKL-Ω-6A-Fluc的质粒。
具体实施过程如下:使用3对引物:
O6A-605_f(CAACAATTACCAACAACAACAAACAACAAACAACATTACAATTACTATTTACAATTACAAAAAAAATGTCTGAAGACGCCAAAAACAT AAAGAAAGGCC)(SEQ ID NO.:13)与OK-60_b (TTTTTTTTGTAATTGTAAATAGTAATTGTAATGTTGTTTGTTGTTTGTTGT TG)(SEQ IDNO.:14);
O8A-605_f(CAATTACCAACAACAACAAACAACAAACAACATTACAATTACTATTTACAATTACAAAAAAAAAATGTCTGAAGACGCCAAAAACATA AAGAAAGGCC)(SEQ ID NO.:15)与OK-60_b;
O10A-605_f(AATTACCAACAACAACAAACAACAAACAACATTACAATTACTATTTACAATTACAAAAAAAAAAAATGTCTGAAGACGCCAAAAACA TAAAGAAAGGCC)(SEQ ID NO.:16)与OK-60_b对质粒pKL-Ω-Fluc(SEQ ID NO.:4)进行PCR扩增,向20μL扩增产物中加入1μL Dpn I,37℃孵育6h;将DpnI处理后产物4μL加入50μL DH5α感受态细胞中,冰上放置30min, 42℃热激45s后,冰上放置3min,加入200μL LB液体培养基37℃振荡培养4h,涂布于含有Amp抗生素的LB固体培养基上过夜培养;挑取6个单克隆进行扩大培养后,进行测序确认正确后,提取质粒保存,命名为pKL-Ω -10A-Fluc(SEQ ID NO.:1)、pKL-Ω-8A-Fluc(SEQID NO.:2)和pKL-Ω -6A-Fluc(SEQ ID NO.:3)质粒。
实施例2:kl-Kozak序列在酵母体外蛋白质合成体系中的应用
2.1利用PCR的方法,并使用引物T7_pET21a_F: CGCGAAATTAATACGACTCACTATAGG(SEQ ID NO.:17)和 T7ter_pET21a_R:TCCGGATATAGTTCCTCCTTTCAG(SEQ ID NO.:18)将质粒pKL-Ω-10A/8A/6A-Fluc和pKL-Ω-Fluc中位于T7转录起始序列和终止序列之间包括Ω-10A/8A/6A-Fluc的片段和Ω-Fluc片段进行扩增。
并将扩增得到的DNA片段用乙醇沉淀的方法进行纯化和富集:向PCR 产物中加入1/10体积的3M醋酸钠(pH5.2),然后再加入2.5-3倍体积(该体积为加入醋酸钠之后的体积)的95%的乙醇,置于冰上孵育15min;室温条件下以高于14000g的速度离心30min,弃掉上清;使用70%乙醇进行清洗,然后再离心15min,弃掉上清,并用超纯水将沉淀溶解,测定DNA浓度。
2.2按照使用说明,将纯化的DNA片段加入到自制的乳酸克鲁维酵母体外蛋白质合成体系中。并将上述反应体系置于25-30℃的环境中,静置孵育约2-6h。反应结束后,在96孔白板或者384孔白板中加入等体积的Fluc底物荧光素(luciferin),立即放置于Envision2120多功能酶标仪(Perkin Elmer),读数,检测Fluc活性,相对光单位值(Relative LightUnit,RLU)作为活性单位,如图1所示。
2.3使用不含有kl-Kozak序列的DNA片段(Ω-Fluc)作为对照,每个样品均设计三组独立实验,并设计不含有任何DNA片段的实验组作为阴性对照。
实验结果
1.乳酸克鲁维酵母特异性的kl-Kozak序列
乳酸克鲁维酵母的107个基因mRNA的5’端位于起始密码子AUG之前的位置上,腺嘌呤核苷酸(A)的比例占优势,有几个位置上尿嘧啶核苷酸(U)的比例与接近,但略少。所以与酿酒酵母类似,乳酸克鲁维酵母的基因mRNA起始密码子5’端序列是A与U富集的。起始密码子AUG之后的密码子的3个位置上占优势的依次为U、C和U,为丝氨酸的密码子。最终确定的乳酸克鲁维酵母特异性的kl-Kozak序列如SEQ ID NO.:5所示。
2.kl-Kozak序列在酵母体外蛋白质合成体系中的应用
如图1所示,含有乳酸克鲁维酵母特异性kl-Kozak序列的Ω -10A/8A/6A-Fluc 3个DNA片段在酵母体外蛋白质合成体系中编码合成的Fluc 蛋白放出的相对光单位值最高达到2.72×107。而不含有kl-Kozak序列的Ω-Fluc DNA片段编码合成的Fluc蛋白的相对光单位值仅有1.22×106。这表明kl-Kozak 序列的***能够有效增强酵母体外蛋白质合成体系合成蛋白质的效率。因为处于检测仪器相对光单位值RLU与蛋白质浓度关系的线性范围内,活性最高的Ω-10A-Fluc片段的相对光单位值是Ω-Fluc片段的22.3倍,表明Ω-10A能够增强大约22.3倍的蛋白质合成。
含有不同长度腺嘌呤核苷寡聚链的DNA片段增强蛋白质合成的效率也是存在差异的,加入了Ω-10A-Fluc、Ω-8A-Fluc和Ω-6A-Fluc片段的酵母体外蛋白质合成体系合成的Fluc蛋白质的相对光单位值分别为2.72×107、1.52×107和1.01×107。这些结果表明在促进蛋白质合成方面,Ω-10A要优于Ω-8A和Ω -6A。没有加入任何DNA片段的酵母体外蛋白质合成体系作为阴性对照,相对光单位值仅有190.33。
本发明结果表明,乳酸克鲁维酵母特异性的kl-Kozak序列能够显著增强酵母体外蛋白质合成体系产生蛋白质的效率,Ω-10A-Fluc DNA片段的相对光单位值是Ω-Fluc的22.3倍,达到了2.72×107,表明Ω-10A能够增强22.3倍的蛋白质合成。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
参考文献:
1.Dever,T.E.,et al.(2016)Mechanism and Regulation of ProteinSynthesis in Saccharomyces cerevisiae.Genetics 203,65-107.
2.Kyrieleis,O.J.,et al.(2014)Crystal structure of vaccinia virus mRNAcapping enzyme provides insights into the mechanism and evolution of thecapping apparatus.Structure 22,452-465.
3.Katzen,F.,et al.(2005)The past,present and future of cell-freeprotein synthesis.Trends in biotechnology 23,150-156.
4.Anastasina,M.,et al.(2014)A technique to increase protein yield ina rabbit reticulocyte lysate translation system.BioTechniques 56,36-39.
5.Spohner,S.C.,et al.(2016)Kluyveromyces lactis:An emerging tool inbiotechnology.Journal of biotechnology 222,104-116.
序列表
<110> 康码(上海)生物科技有限公司
<120> 一种用于高通量体外蛋白质合成的DNA元件
<130> P2017-1191
<160> 18
<170> PatentIn version 3.5
<210> 1
<211> 1993
<212> DNA
<213> 人工序列
<400> 1
cgcgaaatta atacgactca ctataggggt atttttacaa caattaccaa caacaacaaa 60
caacaaacaa cattacaatt actatttaca attacaaaaa aaaaaaatgt ctgaagacgc 120
caaaaacata aagaaaggcc cggcgccatt ctatcctcta gaggatggaa ccgctggaga 180
gcaactgcat aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga 240
tgcacatatc gaggtgaaca tcacgtacgc ggaatacttc gaaatgtccg ttcggttggc 300
agaagctatg aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa 360
ctctcttcaa ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc 420
cgcgaacgac atttataatg aacgtgaatt gctcaacagt atgaacattt cgcagcctac 480
cgtagtgttt gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaaattacc 540
aataatccag aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat 600
gtacacgttc gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtaccaga 660
gtcctttgat cgtgacaaaa caattgcact gataatgaat tcctctggat ctactgggtt 720
acctaagggt gtggcccttc cgcatagaac tgcctgcgtc agattctcgc atgccagaga 780
tcctattttt ggcaatcaaa tcattccgga tactgcgatt ttaagtgttg ttccattcca 840
tcacggtttt ggaatgttta ctacactcgg atatttgata tgtggatttc gagtcgtctt 900
aatgtataga tttgaagaag agctgttttt acgatccctt caggattaca aaattcaaag 960
tgcgttgcta gtaccaaccc tattttcatt cttcgccaaa agcactctga ttgacaaata 1020
cgatttatct aatttacacg aaattgcttc tgggggcgca cctctttcga aagaagtcgg 1080
ggaagcggtt gcaaaacgct tccatcttcc agggatacga caaggatatg ggctcactga 1140
gactacatca gctattctga ttacacccga gggggatgat aaaccgggcg cggtcggtaa 1200
agttgttcca ttttttgaag cgaaggttgt ggatctggat accgggaaaa cgctgggcgt 1260
taatcagaga ggcgaattat gtgtcagagg acctatgatt atgtccggtt atgtaaacaa 1320
tccggaagcg accaacgcct tgattgacaa ggatggatgg ctacattctg gagacatagc 1380
ttactgggac gaagacgaac acttcttcat agttgaccgc ttgaagtctt taattaaata 1440
caaaggatat caggtggccc ccgctgaatt ggaatcgata ttgttacaac accccaacat 1500
cttcgacgcg ggcgtggcag gtcttcccga cgatgacgcc ggtgaacttc ccgccgccgt 1560
tgttgttttg gagcacggaa agacgatgac ggaaaaagag atcgtggatt acgtcgccag 1620
tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg tttgtggacg aagtaccgaa 1680
aggtcttacc ggaaaactcg acgcaagaaa aatcagagag atcctcataa aggccaagaa 1740
gggcggaaag tccaaattgg tttaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1800
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaactcga 1860
gcaccaccac caccaccact gagatccggc tgctaacaaa gcccgaaagg aagctgagtt 1920
ggctgctgcc accgctgagc aataactagc ataacccctt ggggcctcta aacgggtctt 1980
gaggggtttt ttg 1993
<210> 2
<211> 1991
<212> DNA
<213> 人工序列
<400> 2
cgcgaaatta atacgactca ctataggggt atttttacaa caattaccaa caacaacaaa 60
caacaaacaa cattacaatt actatttaca attacaaaaa aaaaatgtct gaagacgcca 120
aaaacataaa gaaaggcccg gcgccattct atcctctaga ggatggaacc gctggagagc 180
aactgcataa ggctatgaag agatacgccc tggttcctgg aacaattgct tttacagatg 240
cacatatcga ggtgaacatc acgtacgcgg aatacttcga aatgtccgtt cggttggcag 300
aagctatgaa acgatatggg ctgaatacaa atcacagaat cgtcgtatgc agtgaaaact 360
ctcttcaatt ctttatgccg gtgttgggcg cgttatttat cggagttgca gttgcgcccg 420
cgaacgacat ttataatgaa cgtgaattgc tcaacagtat gaacatttcg cagcctaccg 480
tagtgtttgt ttccaaaaag gggttgcaaa aaattttgaa cgtgcaaaaa aaattaccaa 540
taatccagaa aattattatc atggattcta aaacggatta ccagggattt cagtcgatgt 600
acacgttcgt cacatctcat ctacctcccg gttttaatga atacgatttt gtaccagagt 660
cctttgatcg tgacaaaaca attgcactga taatgaattc ctctggatct actgggttac 720
ctaagggtgt ggcccttccg catagaactg cctgcgtcag attctcgcat gccagagatc 780
ctatttttgg caatcaaatc attccggata ctgcgatttt aagtgttgtt ccattccatc 840
acggttttgg aatgtttact acactcggat atttgatatg tggatttcga gtcgtcttaa 900
tgtatagatt tgaagaagag ctgtttttac gatcccttca ggattacaaa attcaaagtg 960
cgttgctagt accaacccta ttttcattct tcgccaaaag cactctgatt gacaaatacg 1020
atttatctaa tttacacgaa attgcttctg ggggcgcacc tctttcgaaa gaagtcgggg 1080
aagcggttgc aaaacgcttc catcttccag ggatacgaca aggatatggg ctcactgaga 1140
ctacatcagc tattctgatt acacccgagg gggatgataa accgggcgcg gtcggtaaag 1200
ttgttccatt ttttgaagcg aaggttgtgg atctggatac cgggaaaacg ctgggcgtta 1260
atcagagagg cgaattatgt gtcagaggac ctatgattat gtccggttat gtaaacaatc 1320
cggaagcgac caacgccttg attgacaagg atggatggct acattctgga gacatagctt 1380
actgggacga agacgaacac ttcttcatag ttgaccgctt gaagtcttta attaaataca 1440
aaggatatca ggtggccccc gctgaattgg aatcgatatt gttacaacac cccaacatct 1500
tcgacgcggg cgtggcaggt cttcccgacg atgacgccgg tgaacttccc gccgccgttg 1560
ttgttttgga gcacggaaag acgatgacgg aaaaagagat cgtggattac gtcgccagtc 1620
aagtaacaac cgcgaaaaag ttgcgcggag gagttgtgtt tgtggacgaa gtaccgaaag 1680
gtcttaccgg aaaactcgac gcaagaaaaa tcagagagat cctcataaag gccaagaagg 1740
gcggaaagtc caaattggtt taaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1800
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaactcgagc 1860
accaccacca ccaccactga gatccggctg ctaacaaagc ccgaaaggaa gctgagttgg 1920
ctgctgccac cgctgagcaa taactagcat aaccccttgg ggcctctaaa cgggtcttga 1980
ggggtttttt g 1991
<210> 3
<211> 1989
<212> DNA
<213> 人工序列
<400> 3
cgcgaaatta atacgactca ctataggggt atttttacaa caattaccaa caacaacaaa 60
caacaaacaa cattacaatt actatttaca attacaaaaa aaatgtctga agacgccaaa 120
aacataaaga aaggcccggc gccattctat cctctagagg atggaaccgc tggagagcaa 180
ctgcataagg ctatgaagag atacgccctg gttcctggaa caattgcttt tacagatgca 240
catatcgagg tgaacatcac gtacgcggaa tacttcgaaa tgtccgttcg gttggcagaa 300
gctatgaaac gatatgggct gaatacaaat cacagaatcg tcgtatgcag tgaaaactct 360
cttcaattct ttatgccggt gttgggcgcg ttatttatcg gagttgcagt tgcgcccgcg 420
aacgacattt ataatgaacg tgaattgctc aacagtatga acatttcgca gcctaccgta 480
gtgtttgttt ccaaaaaggg gttgcaaaaa attttgaacg tgcaaaaaaa attaccaata 540
atccagaaaa ttattatcat ggattctaaa acggattacc agggatttca gtcgatgtac 600
acgttcgtca catctcatct acctcccggt tttaatgaat acgattttgt accagagtcc 660
tttgatcgtg acaaaacaat tgcactgata atgaattcct ctggatctac tgggttacct 720
aagggtgtgg cccttccgca tagaactgcc tgcgtcagat tctcgcatgc cagagatcct 780
atttttggca atcaaatcat tccggatact gcgattttaa gtgttgttcc attccatcac 840
ggttttggaa tgtttactac actcggatat ttgatatgtg gatttcgagt cgtcttaatg 900
tatagatttg aagaagagct gtttttacga tcccttcagg attacaaaat tcaaagtgcg 960
ttgctagtac caaccctatt ttcattcttc gccaaaagca ctctgattga caaatacgat 1020
ttatctaatt tacacgaaat tgcttctggg ggcgcacctc tttcgaaaga agtcggggaa 1080
gcggttgcaa aacgcttcca tcttccaggg atacgacaag gatatgggct cactgagact 1140
acatcagcta ttctgattac acccgagggg gatgataaac cgggcgcggt cggtaaagtt 1200
gttccatttt ttgaagcgaa ggttgtggat ctggataccg ggaaaacgct gggcgttaat 1260
cagagaggcg aattatgtgt cagaggacct atgattatgt ccggttatgt aaacaatccg 1320
gaagcgacca acgccttgat tgacaaggat ggatggctac attctggaga catagcttac 1380
tgggacgaag acgaacactt cttcatagtt gaccgcttga agtctttaat taaatacaaa 1440
ggatatcagg tggcccccgc tgaattggaa tcgatattgt tacaacaccc caacatcttc 1500
gacgcgggcg tggcaggtct tcccgacgat gacgccggtg aacttcccgc cgccgttgtt 1560
gttttggagc acggaaagac gatgacggaa aaagagatcg tggattacgt cgccagtcaa 1620
gtaacaaccg cgaaaaagtt gcgcggagga gttgtgtttg tggacgaagt accgaaaggt 1680
cttaccggaa aactcgacgc aagaaaaatc agagagatcc tcataaaggc caagaagggc 1740
ggaaagtcca aattggttta aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1800
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa actcgagcac 1860
caccaccacc accactgaga tccggctgct aacaaagccc gaaaggaagc tgagttggct 1920
gctgccaccg ctgagcaata actagcataa ccccttgggg cctctaaacg ggtcttgagg 1980
ggttttttg 1989
<210> 4
<211> 1983
<212> DNA
<213> 人工序列
<400> 4
cgcgaaatta atacgactca ctataggggt atttttacaa caattaccaa caacaacaaa 60
caacaaacaa cattacaatt actatttaca attacaatgt ctgaagacgc caaaaacata 120
aagaaaggcc cggcgccatt ctatcctcta gaggatggaa ccgctggaga gcaactgcat 180
aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc 240
gaggtgaaca tcacgtacgc ggaatacttc gaaatgtccg ttcggttggc agaagctatg 300
aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa 360
ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac 420
atttataatg aacgtgaatt gctcaacagt atgaacattt cgcagcctac cgtagtgttt 480
gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaaattacc aataatccag 540
aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc 600
gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtaccaga gtcctttgat 660
cgtgacaaaa caattgcact gataatgaat tcctctggat ctactgggtt acctaagggt 720
gtggcccttc cgcatagaac tgcctgcgtc agattctcgc atgccagaga tcctattttt 780
ggcaatcaaa tcattccgga tactgcgatt ttaagtgttg ttccattcca tcacggtttt 840
ggaatgttta ctacactcgg atatttgata tgtggatttc gagtcgtctt aatgtataga 900
tttgaagaag agctgttttt acgatccctt caggattaca aaattcaaag tgcgttgcta 960
gtaccaaccc tattttcatt cttcgccaaa agcactctga ttgacaaata cgatttatct 1020
aatttacacg aaattgcttc tgggggcgca cctctttcga aagaagtcgg ggaagcggtt 1080
gcaaaacgct tccatcttcc agggatacga caaggatatg ggctcactga gactacatca 1140
gctattctga ttacacccga gggggatgat aaaccgggcg cggtcggtaa agttgttcca 1200
ttttttgaag cgaaggttgt ggatctggat accgggaaaa cgctgggcgt taatcagaga 1260
ggcgaattat gtgtcagagg acctatgatt atgtccggtt atgtaaacaa tccggaagcg 1320
accaacgcct tgattgacaa ggatggatgg ctacattctg gagacatagc ttactgggac 1380
gaagacgaac acttcttcat agttgaccgc ttgaagtctt taattaaata caaaggatat 1440
caggtggccc ccgctgaatt ggaatcgata ttgttacaac accccaacat cttcgacgcg 1500
ggcgtggcag gtcttcccga cgatgacgcc ggtgaacttc ccgccgccgt tgttgttttg 1560
gagcacggaa agacgatgac ggaaaaagag atcgtggatt acgtcgccag tcaagtaaca 1620
accgcgaaaa agttgcgcgg aggagttgtg tttgtggacg aagtaccgaa aggtcttacc 1680
ggaaaactcg acgcaagaaa aatcagagag atcctcataa aggccaagaa gggcggaaag 1740
tccaaattgg tttaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1800
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaactcga gcaccaccac 1860
caccaccact gagatccggc tgctaacaaa gcccgaaagg aagctgagtt ggctgctgcc 1920
accgctgagc aataactagc ataacccctt ggggcctcta aacgggtctt gaggggtttt 1980
ttg 1983
<210> 5
<211> 16
<212> RNA
<213> 人工序列
<400> 5
aaaaaaaaaa augucu 16
<210> 6
<211> 717
<212> DNA
<213> 人工序列
<400> 6
atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60
ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120
ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180
ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240
cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300
ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360
gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420
aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480
ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540
gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600
tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660
ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaag 717
<210> 7
<211> 717
<212> DNA
<213> 人工序列
<400> 7
atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60
ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120
ggcaagctga ccctgaagct gatctgcacc accggcaagc tgcccgtgcc ctggcccacc 180
ctcgtgacca ccctgggcta cggcctgcag tgcttcgccc gctaccccga ccacatgaag 240
cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300
ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360
gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420
aagctggagt acaactacaa cagccacaac gtctatatca ccgccgacaa gcagaagaac 480
ggcatcaagg ccaacttcaa gatccgccac aacatcgagg acggcggcgt gcagctcgcc 540
gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600
tacctgagct accagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660
ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaag 717
<210> 8
<211> 3048
<212> DNA
<213> 人工序列
<400> 8
atggtcgttt tacaacgtcg tgactgggaa aaccctggcg ttacccaact taatcgcctt 60
gcagcacatc cccctttcgc cagctggcgt aatagcgaag aggcccgcac cgatcgccct 120
tcccaacagt tgcgcagcct gaatggcgaa tggcgctttg cctggtttcc ggcaccagaa 180
gcggtgccgg aaagctggct ggagtgcgat cttcctgagg ccgatactgt cgtcgtcccc 240
tcaaactggc agatgcacgg ttacgatgcg cccatctaca ccaacgtgac ctatcccatt 300
acggtcaatc cgccgtttgt tcccacggag aatccgacgg gttgttactc gctcacattt 360
aatgttgatg aaagctggct acaggaaggc cagacgcgaa ttatttttga tggcgttaac 420
tcggcgtttc atctgtggtg caacgggcgc tgggtcggtt acggccagga cagtcgtttg 480
ccgtctgaat ttgacctgag cgcattttta cgcgccggag aaaaccgcct cgcggtgatg 540
gtgctgcgct ggagtgacgg cagttatctg gaagatcagg atatgtggcg gatgagcggc 600
attttccgtg acgtctcgtt gctgcataaa ccgactacac aaatcagcga tttccatgtt 660
gccactcgct ttaatgatga tttcagccgc gctgtactgg aggctgaagt tcagatgtgc 720
ggcgagttgc gtgactacct acgggtaaca gtttctttat ggcagggtga aacgcaggtc 780
gccagcggca ccgcgccttt cggcggtgaa attatcgatg agcgtggtgg ttatgccgat 840
cgcgtcacac tacgtctgaa cgtcgaaaac ccgaaactgt ggagcgccga aatcccgaat 900
ctctatcgtg cggtggttga actgcacacc gccgacggca cgctgattga agcagaagcc 960
tgcgatgtcg gtttccgcga ggtgcggatt gaaaatggtc tgctgctgct gaacggcaag 1020
ccgttgctga ttcgaggcgt taaccgtcac gagcatcatc ctctgcatgg tcaggtcatg 1080
gatgagcaga cgatggtgca ggatatcctg ctgatgaagc agaacaactt taacgccgtg 1140
cgctgttcgc attatccgaa ccatccgctg tggtacacgc tgtgcgaccg ctacggcctg 1200
tatgtggtgg atgaagccaa tattgaaacc cacggcatgg tgccaatgaa tcgtctgacc 1260
gatgatccgc gctggctacc ggcgatgagc gaacgcgtaa cgcgaatggt gcagcgcgat 1320
cgtaatcacc cgagtgtgat catctggtcg ctggggaatg aatcaggcca cggcgctaat 1380
cacgacgcgc tgtatcgctg gatcaaatct gtcgatcctt cccgcccggt gcagtatgaa 1440
ggcggcggag ccgacaccac ggccaccgat attatttgcc cgatgtacgc gcgcgtggat 1500
gaagaccagc ccttcccggc tgtgccgaaa tggtccatca aaaaatggct ttcgctacct 1560
ggagagacgc gcccgctgat cctttgcgaa tacgcccacg cgatgggtaa cagtcttggc 1620
ggtttcgcta aatactggca ggcgtttcgt cagtatcccc gtttacaggg cggcttcgtc 1680
tgggactggg tggatcagtc gctgattaaa tatgatgaaa acggcaaccc gtggtcggct 1740
tacggcggtg attttggcga tacgccgaac gatcgccagt tctgtatgaa cggtctggtc 1800
tttgccgacc gcacgccgca tccagcgctg acggaagcaa aacaccagca gcagtttttc 1860
cagttccgtt tatccgggca aaccatcgaa gtgaccagcg aatacctgtt ccgtcatagc 1920
gataacgagc tcctgcactg gatggtggcg ctggatggta agccgctggc aagcggtgaa 1980
gtgcctctgg atgtcgctcc acaaggtaaa cagttgattg aactgcctga actaccgcag 2040
ccggagagcg ccgggcaact ctggctcaca gtacgcgtag tgcaaccgaa cgcgaccgca 2100
tggtcagaag ccggacacat cagcgcctgg cagcagtggc gtctggctga aaacctcagc 2160
gtgacactcc ccgccgcgtc ccacgccatc ccgcatctga ccaccagcga aatggatttt 2220
tgcatcgagc tgggtaataa gcgttggcaa tttaaccgcc agtcaggctt tctttcacag 2280
atgtggattg gcgataaaaa acaactgctg acgccgctgc gcgatcagtt cacccgtgca 2340
ccgctggata acgacattgg cgtaagtgaa gcgacccgca ttgaccctaa cgcctgggtc 2400
gaacgctgga aggcggcggg ccattaccag gccgaagcag cgttgttgca gtgcacggca 2460
gatacacttg ctgatgcggt gctgattacg accgctcacg cgtggcagca tcaggggaaa 2520
accttattta tcagccggaa aacctaccgg attgatggta gtggtcaaat ggcgattacc 2580
gttgatgttg aagtggcgag cgatacaccg catccggcgc ggattggcct gaactgccag 2640
ctggcgcagg tagcagagcg ggtaaactgg ctcggattag ggccgcaaga aaactatccc 2700
gaccgcctta ctgccgcctg ttttgaccgc tgggatctgc cattgtcaga catgtatacc 2760
ccgtacgtct tcccgagcga aaacggtctg cgctgcggga cgcgcgaatt gaattatggc 2820
ccacaccagt ggcgcggcga cttccagttc aacatcagcc gctacagtca acagcaactg 2880
atggaaacca gccatcgcca tctgctgcac gcggaagaag gcacatggct gaatatcgac 2940
ggtttccata tggggattgg tggcgacgac tcctggagcc cgtcagtatc ggcggaattc 3000
cagctgagcg ccggtcgcta ccattaccag ttggtctggt gtcaaaaa 3048
<210> 9
<211> 1935
<212> DNA
<213> 人工序列
<400> 9
atggcggccg tgcaggcggc cgaggtgaaa gtggatggca gcgagccgaa actgagcaag 60
aatgagctga agagacgcct gaaagctgag aagaaagtag cagagaagga ggccaaacag 120
aaagagctca gtgagaaaca gctaagccaa gccactgctg ctgccaccaa ccacaccact 180
gataatggtg tgggtcctga ggaagagagc gtggacccaa atcaatacta caaaatccgc 240
agtcaagcaa ttcatcagct gaaggtcaat ggggaagacc catacccaca caagttccat 300
gtagacatct cactcactga cttcatccaa aaatatagtc acctgcagcc tggggatcac 360
ctgactgaca tcaccttaaa ggtggcaggt aggatccatg ccaaaagagc ttctggggga 420
aagctcatct tctatgatct tcgaggagag ggggtgaagt tgcaagtcat ggccaattcc 480
agaaattata aatcagaaga agaatttatt catattaata acaaactgcg tcggggagac 540
ataattggag ttcaggggaa tcctggtaaa accaagaagg gtgagctgag catcattccg 600
tatgagatca cactgctgtc tccctgtttg catatgttac ctcatcttca ctttggcctc 660
aaagacaagg aaacaaggta tcgccagaga tacttggact tgatcctgaa tgactttgtg 720
aggcagaaat ttatcatccg ctctaagatc atcacatata taagaagttt cttagatgag 780
ctgggattcc tagagattga aactcccatg atgaacatca tcccaggggg agccgtggcc 840
aagcctttca tcacttatca caacgagctg gacatgaact tatatatgag aattgctcca 900
gaactctatc ataagatgct tgtggttggt ggcatcgacc gggtttatga aattggacgc 960
cagttccgga atgaggggat tgatttgacg cacaatcctg agttcaccac ctgtgagttc 1020
tacatggcct atgcagacta tcacgatctc atggaaatca cggagaagat ggtttcaggg 1080
atggtgaagc atattacagg cagttacaag gtcacctacc acccagatgg cccagagggc 1140
caagcctacg atgttgactt caccccaccc ttccggcgaa tcaacatggt agaagagctt 1200
gagaaagccc tggggatgaa gctgccagaa acgaacctct ttgaaactga agaaactcgc 1260
aaaattcttg atgatatctg tgtggcaaaa gctgttgaat gccctccacc tcggaccaca 1320
gccaggctcc ttgacaagct tgttggggag ttcctggaag tgacttgcat caatcctaca 1380
ttcatctgtg atcacccaca gataatgagc cctttggcta aatggcaccg ctctaaagag 1440
ggtctgactg agcgctttga gctgtttgtc atgaagaaag agatatgcaa tgcgtatact 1500
gagctgaatg atcccatgcg gcagcggcag ctttttgaag aacaggccaa ggccaaggct 1560
gcaggtgatg atgaggccat gttcatagat gaaaacttct gtactgccct ggaatatggg 1620
ctgcccccca cagctggctg gggcatgggc attgatcgag tcgccatgtt tctcacggac 1680
tccaacaaca tcaaggaagt acttctgttt cctgccatga aacccgaaga caagaaggag 1740
aatgtagcaa ccactgatac actggaaagc acaacagttg gcacttctgt ctagaaaata 1800
ataattgcaa gttgtataac tcaggcgtct ttgcatttct gcgaaagatc aaggtctgca 1860
agggaattct tgtgtgctgc tttccatttg acaccgcagt tctgttcagc catcagaaga 1920
gagacaagga attaa 1935
<210> 10
<211> 3531
<212> DNA
<213> 人工序列
<400> 10
atggcggaaa gaaaaggaac agccaaagtg gactttttga agaagattga gaaagaaatc 60
caacagaaat gggatactga gagagtgttt gaggtcaatg catctaattt agagaaacag 120
accagcaagg gcaagtattt tgtaaccttc ccatatccat atatgaatgg acgccttcat 180
ttgggacaca cgttttcttt atccaaatgt gagtttgctg tagggtacca gcgattgaaa 240
ggaaaatgtt gtctgtttcc ctttggcctg cactgtactg gaatgcctat taaggcatgt 300
gctgataagt tgaaaagaga aatagagctg tatggttgcc cccctgattt tccagatgaa 360
gaagaggaag aggaagaaac cagtgttaaa acagaagata taataattaa ggataaagct 420
aaaggaaaaa agagtaaagc tgctgctaaa gctggatctt ctaaatacca gtggggcatt 480
atgaaatccc ttggcctgtc tgatgaagag atagtaaaat tttctgaagc agaacattgg 540
cttgattatt tcccgccact ggctattcag gatttaaaaa gaatgggttt gaaggtagac 600
tggcgtcgtt ccttcatcac cactgatgtt aatccttact atgattcatt tgtcagatgg 660
caatttttaa cattaagaga aagaaacaaa attaaatttg ggaagcggta tacaatttac 720
tctccgaaag atggacagcc ttgcatggat catgatagac aaactggaga gggtgttgga 780
cctcaggaat atactttact caaattgaag gtgcttgagc catacccatc taaattaagt 840
ggcctgaaag gtaaaaatat tttcttggtg gctgctactc tcagacctga gaccatgttt 900
gggcagacaa attgttgggt tcgtcctgat atgaagtaca ttggatttga gacggtgaat 960
ggtgatatat tcatctgtac ccaaaaagca gccaggaata tgtcatacca gggctttacc 1020
aaagacaatg gcgtggtgcc tgttgttaag gaattaatgg gggaggaaat tcttggtgca 1080
tcactttctg cacctttaac atcatacaag gtgatctatg ttctcccaat gctaactatt 1140
aaggaggata aaggcactgg tgtggttaca agtgttcctt ccgactcccc tgatgatatt 1200
gctgccctca gagacttgaa gaaaaagcaa gccttacgag caaaatatgg aattagagat 1260
gacatggtct tgccatttga gccggtgcca gtcattgaaa tcccaggttt tggaaatctt 1320
tctgctgtaa ccatttgtga tgagttgaaa attcagagcc agaatgaccg ggaaaaactt 1380
gcagaagcaa aggagaagat atatctaaaa ggattttatg agggtatcat gttggtggat 1440
ggatttaaag gacagaaggt tcaagatgta aagaagacta ttcagaaaaa gatgattgac 1500
gctggagatg cacttattta catggaacca gagaaacaag tgatgtccag gtcgtcagat 1560
gaatgtgttg tggctctgtg tgaccagtgg tacttggatt atggagaaga gaattggaag 1620
aaacagacat ctcagtgctt gaagaacctg gaaacattct gtgaggagac caggaggaat 1680
tttgaagcca ccttaggttg gctacaagaa catgcttgct caagaactta tggtctaggc 1740
actcacctgc cttgggatga gcagtggctg attgaatcac tttctgactc cactatttac 1800
atggcatttt acacagttgc acacctattg caggggggta acttgcatgg acaggcagag 1860
tctccgctgg gcattagacc gcaacagatg accaaggaag tttgggatta tgttttcttc 1920
aaggaggctc catttcctaa gactcagatt gcaaaggaaa aattagatca gttaaagcag 1980
gagtttgaat tctggtatcc tgttgatctt cgcgtctctg gcaaggatct tgttccaaat 2040
catctttcat attaccttta taatcatgtg gctatgtggc cggaacaaag tgacaaatgg 2100
cctacagctg tgagagcaaa tggacatctc ctcctgaact ctgagaagat gtcaaaatcc 2160
acaggcaact tcctcacttt gacccaagct attgacaaat tttcagcaga tggaatgcgt 2220
ttggctctgg ctgatgctgg tgacactgta gaagatgcca actttgtgga agccatggca 2280
gatgcaggta ttctccgtct gtacacctgg gtagagtggg tgaaagaaat ggttgccaac 2340
tgggacagcc taagaagtgg tcctgccagc actttcaatg atagagtttt tgccagtgaa 2400
ttgaatgcag gaattataaa aacagatcaa aactatgaaa agatgatgtt taaagaagct 2460
ttgaaaacag ggttttttga gtttcaggcc gcaaaagata agtaccgtga attggctgtg 2520
gaagggatgc acagagaact tgtgttccgg tttattgaag ttcagacact tctcctcgct 2580
ccattctgtc cacatttgtg tgagcacatc tggacactcc tgggaaagcc tgactcaatt 2640
atgaatgctt catggcctgt ggcaggtcct gttaatgaag ttttaataca ctcctcacag 2700
tatcttatgg aagtaacaca tgaccttaga ctacgactca agaactatat gatgccagct 2760
aaagggaaga agactgacaa acaacccctg cagaagccct cacattgcac catctatgtg 2820
gcaaagaact atccaccttg gcaacatacc accctgtctg ttctacgtaa acactttgag 2880
gccaataacg gaaaactgcc tgacaacaaa gtcattgcta gtgaactagg cagtatgcca 2940
gaactgaaga aatacatgaa gaaagtcatg ccatttgttg ccatgattaa ggaaaatctg 3000
gagaagatgg ggcctcgtat tctggatttg caattagaat ttgatgaaaa ggctgtgctt 3060
atggagaata tagtctatct gactaattcg cttgagctag aacacataga agtcaagttt 3120
gcctccgaag cagaagataa aatcagggaa gactgctgtc ctgggaaacc acttaatgtt 3180
tttagaatag aacctggtgt gtccgtttct ctggtgaatc cccagccatc caatggccac 3240
ttctcaacca aaattgaaat caggcaagga gataactgtg attccataat caggcgttta 3300
atgaaaatga atcgaggaat taaagacctt tccaaagtga aactgatgag atttgatgat 3360
ccactgttgg ggcctcgacg agttcctgtc ctgggaaagg agtacaccga gaagaccccc 3420
atttctgagc atgctgtttt caatgtggac ctcatgagca agaaaattca tctgactgag 3480
aatgggataa gggtggatat tggcgataca ataatctatc tggttcatta a 3531
<210> 11
<211> 1017
<212> DNA
<213> 人工序列
<400> 11
atggctgaca agaagattag gatcggaatc aacggattcg gaagaattgg tcgtttggtt 60
gctagagttg ttctccagag ggacgatgtt gagctcgtcg ctgtcaacga ccccttcatc 120
actactgagt acatgaccta catgttcaag tacgacagtg ttcacggtca atggaaacac 180
aatgaactca agatcaagga tgagaagacc cttctcttcg gtgagaagcc agtcactgtt 240
ttcggcatca ggaaccctga ggatatccca tgggccgagg ctggagctga ctacgttgtt 300
gagtctactg gtgtcttcac tgacaaagac aaggctgcag ctcacttgaa gggtggtgcc 360
aagaaggttg ttatctctga acccagcaaa gacgctccaa tgtttgttgt tggtgtcaac 420
gagcacgaat acaagtccga ccttgacatt gtctccaacg ctagctgcac cactaactgc 480
cttgctcccc ttgccaaggt tatcaatgac agatttggaa ttgttgaggg tcttatgact 540
acagtccact caatcactgc tactcagaag actgttgatg ggccttcaat gaaggactgg 600
agaggtggaa gagctgcttc attcaacatt attcccagca gcactggagc tgccaaggct 660
gtcggaaagg tgcttccagc tcttaacgga aagttgactg gaatgtcttt ccgtgtccca 720
accgttgatg tctcagttgt tgaccttact gtcagactcg agaaagctgc tacctacgaa 780
gaaatcaaaa aggctatcaa ggaggaatcc gaaggcaaac tcaagggaat ccttggatac 840
accgaggatg atgttgtctc aactgacttc gttggcgaca acaggtcgag catttttgac 900
gccaaggctg gaattgcatt gagcgacaag tttgtgaaat tggtgtcatg gtacgacaac 960
gaatggggtt acagttcccg tgtggtcgac ttgatcgtcc acatgtcaaa ggcctaa 1017
<210> 12
<211> 1584
<212> DNA
<213> 人工序列
<400> 12
atgtcggaca gtcgggaccc agccagcgac cagatgaagc agtggaagga gcagcgggcc 60
tcgcagagac cagatgtcct gaccaccgga ggcgggaacc caataggaga taaacttaat 120
atcatgaccg cggggtcccg agggcccctc ctcgttcagg atgtggtttt cactgacgag 180
atggcacact ttgacagaga gcggattcct gagagagtgg tacacgcaaa aggagcaggt 240
gcttttggat actttgaggt cacccacgat atcaccagat actccaaggc aaaggtgttt 300
gagcatattg gaaagaggac ccctattgcc gttcgattct ccacagtcgc tggagagtca 360
ggctcagctg acacagttcg tgaccctcgg gggtttgcag tgaaatttta cactgaagat 420
ggtaactggg atcttgtggg aaacaacacc cctattttct tcatcaggga tgccatattg 480
tttccatcct ttatccatag ccagaagaga aacccacaga ctcacctgaa ggatcctgac 540
atggtctggg acttctggag tcttcgtccc gagtctctcc atcaggtttc tttcttgttc 600
agtgaccgag ggattcccga tggtcaccgg cacatgaatg gctatggatc acacaccttc 660
aagttggtta atgcagatgg agaggcagtc tattgcaagt tccattacaa gaccgaccag 720
ggcatcaaaa acttgcctgt tggagaggca ggaaggcttg ctcaggaaga tccggattat 780
ggcctccgag atcttttcaa tgccatcgcc aatggcaatt acccgtcctg gacgttttac 840
atccaggtca tgacttttaa ggaggcagaa actttcccat ttaatccatt tgatctgacc 900
aaggtttggc ctcacaagga ctaccctctt ataccagttg gcaaactggt tttaaacaaa 960
aatccagtta attactttgc tgaagttgaa cagatggctt ttgacccaag caatatgccc 1020
cctggcatcg agcccagccc tgacaaaatg cttcagggcc gcctttttgc ctacccggac 1080
actcaccgcc accgcctggg acccaactat ctgcagatac ctgtgaactg tccctaccgc 1140
gctcgagtgg ccaactacca gcgtgatggc cccatgtgca tgcatgacaa ccagggtggt 1200
gcccccaact attaccccaa cagcttcagc gcaccagagc agcagcgctc agccctggag 1260
cacagcgtcc agtgcgctgt agatgtgaaa cgcttcaaca gtgctaatga agacaatgtc 1320
actcaggtgc ggacattcta cacaaaggtg ttgaatgagg aggagaggaa acgcctgtgt 1380
gagaacattg ctggccacct gaaggacgct cagcttttca ttcagaagaa agcggtcaag 1440
aatttcactg acgtccaccc tgactatggg gcccgcatcc aggctcttct ggacaagtac 1500
aacgctgaga agcctaagaa cgcaattcac acctacacgc aggccggctc tcacatggct 1560
gcgaagggaa aagctaacct gtaa 1584
<210> 13
<211> 99
<212> DNA
<213> 人工序列
<400> 13
caacaattac caacaacaac aaacaacaaa caacattaca attactattt acaattacaa 60
aaaaaatgtc tgaagacgcc aaaaacataa agaaaggcc 99
<210> 14
<211> 53
<212> DNA
<213> 人工序列
<400> 14
ttttttttgt aattgtaaat agtaattgta atgttgtttg ttgtttgttg ttg 53
<210> 15
<211> 98
<212> DNA
<213> 人工序列
<400> 15
caattaccaa caacaacaaa caacaaacaa cattacaatt actatttaca attacaaaaa 60
aaaaatgtct gaagacgcca aaaacataaa gaaaggcc 98
<210> 16
<211> 99
<212> DNA
<213> 人工序列
<400> 16
aattaccaac aacaacaaac aacaaacaac attacaatta ctatttacaa ttacaaaaaa 60
aaaaaatgtc tgaagacgcc aaaaacataa agaaaggcc 99
<210> 17
<211> 27
<212> DNA
<213> 人工序列
<400> 17
cgcgaaatta atacgactca ctatagg 27
<210> 18
<211> 24
<212> DNA
<213> 人工序列
<400> 18
tccggatata gttcctcctt tcag 24

Claims (10)

1.一种核酸构建物,其特征在于,所述的构建物具有从5’至3’的式I结构:
Z1-Z2-Z3-Z4 (I)
式中,
Z1、Z2、Z3、Z4分别为用于构成所述构建物的元件;
各“-”独立地为键或核苷酸连接序列;
Z1为烟草花叶病毒的5’端前导序列(leading sequence)-Ω序列;
Z2为腺嘌呤脱氧核苷酸的寡聚链[oligo(A)]n
Z3为翻译起始密码子;
Z4为丝氨酸密码子;
并且,所述Z2、Z3、Z4共同组成了Kozak序列,所述Kozak序列来源于克鲁维酵母属酵母。
2.如权利要求1所述的核酸构建物,其特征在于,所述克鲁维酵母属酵母选自下组:乳酸克鲁维酵母、马克斯克鲁维酵母、多布克鲁维酵母、或其组合。
3.一种核酸构建物,其特征在于,所述的构建物具有从5’至3’的式II结构:
Z1-Z2-Z3-Z4-Z5 (II)
式中,
Z1、Z2、Z3、Z4、Z5分别为用于构成所述构建物的元件;
各“-”独立地为键或核苷酸连接序列;
Z1为烟草花叶病毒的5’端前导序列(leading sequence)-Ω序列;
Z2为腺嘌呤脱氧核苷酸的寡聚链[oligo(A)]n
Z3为翻译起始密码子;
Z4为丝氨酸密码子;
Z5为外源蛋白的编码序列;
并且,所述Z2、Z3、Z4共同组成了Kozak序列,所述Kozak序列来源于克鲁维酵母属酵母。
4.如权利要求3所述的核酸构建物,其特征在于,所述的外源蛋白的编码序列选自下组:编码荧光素蛋白、或荧光素酶(如萤火虫荧光素酶)、绿色荧光蛋白、黄色荧光蛋白、氨酰tRNA合成酶、甘油醛-3-磷酸脱氢酶、过氧化氢酶、肌动蛋白、抗体的可变区域的外源DNA、萤光素酶突变体的DNA、或其组合。
5.一种载体或载体组合,其特征在于,所述的载体或载体组合含有权利要求1或3所述的核酸构建物。
6.一种基因工程细胞,其特征在于,所述基因工程细胞的基因组的一个或多个位点整合有权利要求1或3所述的核酸构建物,或者所述基因工程细胞中含有权利要求5所述的载体或载体组合。
7.一种试剂盒,其特征在于,所述试剂盒中包含的试剂选自下组中的一种或多种:
(a) 权利要求1或3所述的构建物;
(b) 权利要求5所述的载体或载体组合;和
(c) 权利要求6所述的基因工程细胞。
8.如权利要求1或3所述的构建物、权利要求5所述的载体或载体组合、权利要求6所述的基因工程细胞或权利要求7所述试剂盒的用途,其特征在于,用于进行高通量的体外蛋白合成。
9.一种体外高通量的蛋白合成方法,其特征在于,包括步骤:
(i) 在酵母体外蛋白合成体系存在下,提供权利要求3所述的核酸构建物;
(ii) 在适合的条件下,孵育步骤(i)的酵母体外蛋白合成体系一段时间T1,从而合成所述外源蛋白。
10.如权利要求9所述的方法,其特征在于,所述方法还包括:(iii) 任选地从所述酵母体外蛋白合成体系中,分离或检测所述外源蛋白。
CN201710430876.3A 2017-06-09 2017-06-09 一种用于高通量体外蛋白质合成的dna元件 Pending CN109022478A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710430876.3A CN109022478A (zh) 2017-06-09 2017-06-09 一种用于高通量体外蛋白质合成的dna元件

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710430876.3A CN109022478A (zh) 2017-06-09 2017-06-09 一种用于高通量体外蛋白质合成的dna元件

Publications (1)

Publication Number Publication Date
CN109022478A true CN109022478A (zh) 2018-12-18

Family

ID=64628733

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710430876.3A Pending CN109022478A (zh) 2017-06-09 2017-06-09 一种用于高通量体外蛋白质合成的dna元件

Country Status (1)

Country Link
CN (1) CN109022478A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020239111A1 (zh) 2019-05-30 2020-12-03 康码(上海)生物科技有限公司 体外定量共表达多种蛋白的方法及其应用
WO2021104435A1 (zh) 2019-11-30 2021-06-03 康码(上海)生物科技有限公司 一种生物磁性微球及其制备方法和应用
CN114085864A (zh) * 2021-09-14 2022-02-25 福建农林大学 一种大孢子母细胞***细胞特异性诱导表达***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1032367A (zh) * 1987-07-28 1989-04-12 吉斯特-布罗卡迪斯 含有指导异源多肽分泌的克鲁维酵母α-因子前导顺序的DAN组建物
CN1336436A (zh) * 2001-09-05 2002-02-20 南京大学 一种改善外源基因在大肠杆菌中可溶性表达的方法
CN1778923A (zh) * 2005-10-13 2006-05-31 上海交通大学 人粒细胞巨噬细胞集落刺激因子特异性表达的基因序列
CN102753700A (zh) * 2009-09-04 2012-10-24 先正达参股股份有限公司 增加植物中多肽表达的翻译增强子元件堆叠

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1032367A (zh) * 1987-07-28 1989-04-12 吉斯特-布罗卡迪斯 含有指导异源多肽分泌的克鲁维酵母α-因子前导顺序的DAN组建物
CN1336436A (zh) * 2001-09-05 2002-02-20 南京大学 一种改善外源基因在大肠杆菌中可溶性表达的方法
CN1778923A (zh) * 2005-10-13 2006-05-31 上海交通大学 人粒细胞巨噬细胞集落刺激因子特异性表达的基因序列
CN102753700A (zh) * 2009-09-04 2012-10-24 先正达参股股份有限公司 增加植物中多肽表达的翻译增强子元件堆叠

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020239111A1 (zh) 2019-05-30 2020-12-03 康码(上海)生物科技有限公司 体外定量共表达多种蛋白的方法及其应用
WO2021104435A1 (zh) 2019-11-30 2021-06-03 康码(上海)生物科技有限公司 一种生物磁性微球及其制备方法和应用
CN114085864A (zh) * 2021-09-14 2022-02-25 福建农林大学 一种大孢子母细胞***细胞特异性诱导表达***
CN114085864B (zh) * 2021-09-14 2024-01-19 福建农林大学 一种大孢子母细胞***细胞特异性诱导表达***

Similar Documents

Publication Publication Date Title
US9745588B2 (en) Transcription terminator sequences
JP7058839B2 (ja) ローリングサークル増幅産物を使用した無細胞タンパク質発現
CN109971775B (zh) 一种核酸构建物及其调控蛋白合成的方法
CN111778169B (zh) 一种提高体外蛋白合成效率的方法
CN109022478A (zh) 一种用于高通量体外蛋白质合成的dna元件
CN110408636A (zh) 多重标签串联的dna序列及其在蛋白质表达纯化***的应用
EP3684934B1 (en) In vivo rna or protein expression using double-stranded concatemeric dna including phosphorothioated nucleotides
CN110408635A (zh) 一种含有链霉亲和素元件的核酸构建物在蛋白质表达、纯化中的应用
KR20200036925A (ko) 이중-가닥 콘카테머 dna를 사용하는 무세포 단백질 발현
CN110845622A (zh) 不同结构域缺失融合蛋白的制备及其在提高蛋白质合成的应用
US11371047B2 (en) Promoter construct for cell-free protein synthesis
CN110938649A (zh) 一种提高外源蛋白表达量的蛋白合成体系及其应用方法
CN110551745A (zh) 一种多重组氨酸序列标签及其在蛋白质表达、纯化中的应用
CN109423497A (zh) 增强蛋白质合成效率的rna元件
JP7028986B2 (ja) タンパク質合成効率を高めることができるタンデムdnaエレメント
CN111778270B (zh) 通过整合发光报告基因反映体外无细胞蛋白表达水平的方法
CN106834293B (zh) 一种带有分子标志物的环状rna及其制备方法和应用
CN113215005A (zh) 一种体外无细胞蛋白合成体系(d2p体系)、其试剂盒及其应用
CN112876536A (zh) 一种多肽标签及其在体外蛋白合成中的应用
WO2024051855A1 (zh) 一种核酸构建物以及在ivtt体系中的应用
WO2023198006A1 (zh) 一种s-乳酰谷胱甘肽的制备方法
CN118064461A (zh) 一种新型5-氨基戊酸环化酶基因、由此制备而来的基因工程菌及其应用
WO2024126847A1 (en) Mrna recombinant capping enzymes
CN113493813A (zh) 含外源镁离子的体外无细胞蛋白合成体系与试剂盒及其应用
CN111363742A (zh) 基于密码子偏好性利用点突变抑制变异链球菌毒力的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: Building No. 12, 118 Lane, Furong Hualu, Pudong New Area, Shanghai, 201321

Applicant after: Kang code (Shanghai) Biological Technology Co., Ltd.

Address before: 3rd Floor, No. 8 Building, 500 Lane, Furong Hualu, Pudong New Area, Shanghai, 201321

Applicant before: Kang code (Shanghai) Biological Technology Co., Ltd.

CB02 Change of applicant information
RJ01 Rejection of invention patent application after publication

Application publication date: 20181218

RJ01 Rejection of invention patent application after publication