CN116323650A - 多核苷酸 - Google Patents

多核苷酸 Download PDF

Info

Publication number
CN116323650A
CN116323650A CN202180052048.5A CN202180052048A CN116323650A CN 116323650 A CN116323650 A CN 116323650A CN 202180052048 A CN202180052048 A CN 202180052048A CN 116323650 A CN116323650 A CN 116323650A
Authority
CN
China
Prior art keywords
cfi
nucleotide sequence
seq
sequence
less
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180052048.5A
Other languages
English (en)
Inventor
A·基亚
J·佛里
M·卡纳维瑟
R·柯巴
S·寇里亚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sean Conner Ip Holdings 2 Ltd
Original Assignee
Free Exercise Therapy Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Free Exercise Therapy Co ltd filed Critical Free Exercise Therapy Co ltd
Publication of CN116323650A publication Critical patent/CN116323650A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0066Manipulation of the nucleic acid to modify its expression pattern, e.g. enhance its duration of expression, achieved by the presence of particular introns in the delivered nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0058Nucleic acids adapted for tissue specific expression, e.g. having tissue specific promoters as part of a contruct
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P13/00Drugs for disorders of the urinary system
    • A61P13/12Drugs for disorders of the urinary system of the kidneys
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/472Complement proteins, e.g. anaphylatoxin, C3a, C5a
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14171Demonstrated in vivo effect
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/22Vectors comprising a coding region that has been codon optimised for expression in a respective host
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/008Vector systems having a special element relevant for transcription cell type or tissue specific enhancer/promoter combination

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Virology (AREA)
  • Toxicology (AREA)
  • Microbiology (AREA)
  • Epidemiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Immunology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Urology & Nephrology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Saccharide Compounds (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

本发明涉及包含编码补体因子I(CFI)多肽或其片段的CFI核苷酸序列的多核苷酸。本发明进一步涉及包含含有本发明的多核苷酸的重组基因组的病毒颗粒,以及包含本发明的多核苷酸或病毒颗粒的组合物。本发明还涉及本发明的多核苷酸、病毒颗粒和/或组合物的使用方法和用途。本发明还涉及包含CFI核苷酸序列的多核苷酸、包含含有该多核苷酸的重组基因组的病毒颗粒或包含该多核苷酸或病毒颗粒的组合物的使用方法和用途。

Description

多核苷酸
发明领域
本发明涉及包含编码补体因子I(CFI)多肽或其片段的CFI核苷酸序列的多核苷酸。本发明进一步涉及包含含有本发明的多核苷酸的重组基因组的病毒颗粒,以及包含本发明的多核苷酸或病毒颗粒的组合物。本发明还涉及本发明的多核苷酸、病毒颗粒和/或组合物的使用方法和用途。本发明还涉及包含CFI核苷酸序列的多核苷酸、包含含有该多核苷酸的重组基因组的病毒颗粒或包含该多核苷酸或病毒颗粒的组合物的使用方法和用途。
发明背景
补体因子I(CFI)是一种参与补体***的蛋白质。补体***是先天免疫***的一部分,并通过触发炎症反应形成抵御感染的第一道防线。补体***包含主要由肝脏合成并作为无活性前体在血液中循环的许多蛋白质。补体***的刺激(例如外来实体的刺激)触发***中的蛋白酶以裂解前体并释放分子如细胞因子以启动进一步的放大级联。补体***的活化可以刺激吞噬细胞、刺激炎症并活化细胞杀伤膜攻击复合体。补体***可通过经典途径、凝集素途径和旁路途径活化。所有三种途径都集中在C3转化酶对C3的裂解和活化。形成C3a和C3b,导致进一步裂解和活化事件的级联。
旁路途径在低水平下具有组成性活性(所谓的“tick-over”),并且当C3b被释放到液相中或更典型地被外来实体调理时也可以作为放大回路。此外,旁路途径可以由受损组织触发或在缺乏必要调节剂的组织上传播。在正常情况下,旁路途径受两个竞争循环(即增强补体放大的C3b反馈循环和导致下调的C3b分解循环)之间的平衡控制。
由于自发的C3水解以形成C3b,旁路途径在低水平持续活化。C3b可以共价结合到细胞或病原体的表面。表面结合的C3b可以与因子B组合以形成复合物C3bB。C3bB可以在因子D存在的情况下被裂解以形成C3bBb(旁路途径C3转化酶),其可以将更多的C3转化为C3b。复合的C3bBb可以结合因子P(备解素)以形成稳定的C3转化酶C3bBbP,其能够将更多的C3裂解成C3b,从而放大反应。当C3bBbP复合物在病原体或细胞表面上形成时,它能够结合额外的C3b以形成旁路途径C5转化酶,其由(C3b)2BbP组成。C5转化酶将C5裂解成C5a和C5b。然后可以由依次与C6、C7、C8和多个C9分子结合的C5b形成膜攻击复合物。
存在C3分解循环以防止过度C3b生成。特别地,CFI在C3分解循环中发挥作用。它的作用是通过分两步裂解C3b和iC3b来调节补体活化。在第一步中,CFI在存在辅因子H的情况下催化C3b裂解为iC3b。iC3b不能形成C3或C5转化酶的一部分,但具有促炎作用。在第二步中,CFI在存在辅因子CR1(CD35)的情况下进一步分解iC3b,产生C3片段C3d,g。
补体***在许多具有免疫成分的疾病(例如狼疮性肾炎和C3肾小球病)中发挥作用。因此,这些途径的失调具有临床意义。例如,如果CFI不起作用或缺乏,或旁路途径被过度刺激或不当地刺激,则补体***的平衡可随后被破坏,导致炎症因子在例如肾脏中的积聚,其可导致肾脏病理学。因此,需要重新平衡旁路途径的循环,特别是通过促进C3b和iC3b分解,从而减轻炎症。因此,恢复或增加CFI的水平在治疗上会是有利的。
因此,需要提供用于补体介导的病症的有效治疗载体,其将允许恢复或增加功能性CFI的表达水平。恢复或增加功能性CFI的表达水平可用于治疗补体介导的疾病,例如肾小球疾病。
发明概述
本申请证明向肝脏施用包含编码CFI多肽或其片段的CFI核苷酸序列的多核苷酸可用于全身性提供CFI多肽或其片段。为了实现这一点,以高水平表达CFI多肽或其片段的CFI核苷酸序列是有利的。特别地,此类核苷酸序列可以以较低的剂量、较低的商品成本和较低的毒性施用。
本申请表明,可以在体外和/或体内实现CFI多肽或其片段的提高的表达水平。这种提高的表达水平可以通过修饰编码CFI多肽或其片段的核苷酸序列来实现。因此,本发明提供了包含CFI核苷酸序列的多核苷酸,其中CFI核苷酸序列编码CFI多肽或其片段,并且其中CFI核苷酸序列的至少一部分不是野生型的。
此外,本申请使用小鼠模型证明包含编码CFI多肽或其片段的CFI核苷酸序列的多核苷酸可用于治疗补体介导的病症。因此,本发明还提供了用于治疗方法的包含CFI核苷酸序列的多核苷酸、包含含有该多核苷酸的重组基因组的病毒颗粒或包含该多核苷酸或病毒颗粒的组合物,其中该治疗方法是治疗补体介导的病症的方法,并且CFI核苷酸序列编码CFI多肽或其片段。
因此,在本发明的第在一个方面,提供了包含补体因子I(CFI)核苷酸序列的多核苷酸,其中CFI核苷酸序列编码CFI多肽或其片段,并且其中CFI核苷酸序列的至少一部分不是野生型的。
在本发明的第二个方面,提供了包含CFI核苷酸序列的多核苷酸,其中CFI核苷酸序列编码CFI多肽或其片段并且CFI核苷酸序列包含与SEQ ID NO:1-40中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
在本发明的第三个方面,提供了包含重组基因组的病毒颗粒,所述重组基因组包含本发明的多核苷酸。
在本发明的第四个方面,提供了包含本发明的多核苷酸或病毒颗粒以及药学上可接受的赋形剂的组合物。
在本发明的第五个方面,提供了用于治疗方法的本发明的多核苷酸、病毒颗粒或组合物。
在本发明的第六个方面,提供了一种治疗方法,包括施用有效量的本发明的多核苷酸、病毒颗粒或组合物。
在本发明的第七个方面,提供了本发明的多核苷酸、病毒颗粒或组合物在制备用于治疗方法的药物中的用途。
在本发明的第八个方面,提供了用于治疗方法的包含补体因子I(CFI)核苷酸序列的多核苷酸、包含含有该多核苷酸的重组基因组的病毒颗粒或包含该多核苷酸或病毒颗粒的组合物,其中治疗方法是治疗补体介导的病症的方法,并且CFI核苷酸序列编码CFI多肽或其片段。
在本发明的第九个方面,提供了一种治疗方法,包括施用有效量的包含CFI核苷酸序列的多核苷酸、包含含有该多核苷酸的重组基因组的病毒颗粒或包含该多核苷酸或病毒颗粒的组合物,其中所述治疗方法是治疗补体介导的病症的方法,并且CFI核苷酸序列编码CFI多肽或其片段。
在本发明的第十个方面,提供了包含CFI核苷酸序列的多核苷酸、包含含有该多核苷酸的重组基因组的病毒颗粒或包含该多核苷酸或病毒颗粒的组合物在制备用于治疗方法的药物中的用途,其中所述治疗方法是治疗补体介导的病症的方法,并且CFI核苷酸序列编码CFI多肽或其片段。
本申请证明使用密码子优化的CFI核苷酸序列可以提高编码的CFI多肽的表达。可以进一步修饰此类修饰的CFI核苷酸序列以进一步改善所编码的CFI多肽的表达。进一步的修饰可以包括在CFI核苷酸序列中提供进一步的修饰,例如去除CpG基序。
附图说明
图1显示了C57BL/b小鼠中CFI表达水平和腹膜嗜中性粒细胞计数的Spearman等级。小鼠通过静脉内注射6x1011、2x1012或6x1013vg/kg的包含CFI的AAV施用,或未处理(“UT”),并通过ELISA测定它们在血液中的人CFI表达水平(从尾静脉收集)。对于未处理,n=3;对于6x1011vg/kg剂量和对于2x1012vg/kg剂量,n=4;和对于6x1013vg/kg剂量,n=2。AAV包含Co01密码子优化的CFI核苷酸序列和CAG启动子。在施用后4、8和12周测量人CFI(“因子I”)的水平,平均值绘制在图1A中。误差条表示一个标准偏差。在AAV施用后16周,通过腹膜内注射用悬浮在PBS中的酵母聚糖处理小鼠。酵母聚糖处理后4小时测定腹膜嗜中性粒细胞的数量,平均值绘制在图1B中(Y轴=嗜中性粒细胞计数x106/mL)。误差条表示一个标准偏差。标记为“对照”的泳道未施用AAV,而是用PBS而非酵母聚糖处理。对于“对照”,N=3。施用后12周的CFI表达水平和AAV施用后16周的嗜中性粒细胞计数使用Spearman等级进行关联。结果如图1C所示。对于Spearman等级,r=-0.82且p<0.001。
图2显示了MRL-lpr小鼠模型中不同处理组的蛋白尿水平(通过ACR测量)。“未处理的”是处理组1。“AAV-CFI”是处理组2。“MRL/Mp”是处理组3。“环磷酰胺”是处理组4。绘制平均值。误差条表示一个标准偏差。
图3显示了四个处理组的PAS染色切片的半定量分级。
图4-序列表
图5显示转染后在Huh-7细胞培养基中观察到的野生型人CFI核苷酸序列和各种密码子优化的人CFI序列的CFI表达水平。结果以表达水平的顺序显示。CFI表达水平已使用萤光素酶表达水平标准化,以考虑转染效率。CFI表达水平表示为ng/ml(每ml培养基的CFI的ng)。每次转染一式两份进行,每次重复获得的值显示为一个点。误差条=平均值±SD。使用LSP-S启动子和BgpA多聚A序列表达序列。LOQ,定量限。
图6显示了体外研究的结果,该研究比较了Huh7细胞中质粒转染后野生型人CFI蛋白的表达。质粒使用FRE72启动子或LSP-S或LSP-L启动子(各自是肝脏特异性转录调节元件)。在转染后第3天使用ELISA测量培养物上清液中的蛋白质水平。CMV-萤光素酶对照质粒用作共转染载体以用于转染效率的标准化。图6A显示了萤光素酶校正前的结果,图6B显示了萤光素酶校正后的结果。条形代表中值。
图7-显示FRE72(SEQ ID NO:66)、HCR-hAAT(SEQ ID NO:67)、NP1(SEQ ID NO:68)、NP2(SEQ ID NO:69)、NP3(SEQ ID NO:70)、NP4(SEQ ID NO:71)、NP5(SEQ ID NO:72)、NP6(SEQ ID NO:73)和NP7(SEQ ID NO:74)中存在的不同序列元件的示意图。示意图每个部分中的标签显示了各种序列元件的名称。被称为ApoE-HCR1的序列元件为SEQ ID NO:92的序列元件。被称为hAAT的序列元件为SEQ ID NO:94的序列元件。被称为AMBP的序列元件为SEQID NO:94的序列元件。被称为CRM6的序列元件是SEQ ID NO:98的序列元件。被称为ALDOB的序列元件是SEQ ID NO:102的序列元件。被称为F2的序列元件是SEQ ID NO:104的序列元件。示意图左侧的标签显示TRE的名称。示意图右侧的数字显示相应TRE的长度。
图8-(A)显示了NP3(SEQ ID NO:70)中存在的序列元件的示意图,包括ApoE HCR-1序列元件中ApoE增强子的位置和hAAT序列元件中的高同源性区域。上面的比例尺显示了每个不同元件的核苷酸位置。(B)总结了基于NP3的一组TRE(NP3衍生的TRE)的特征的表格。该表显示了各种NP3衍生的TRE和NP3之间的差异。
图9-显示与HCR-hAAT相比,Huh7细胞中由NP1、NP2、NP3、NP4、NP5、NP6和NP7促进的CFI表达水平的倍数变化的图。HLP2和FRE72作为对照包括在内。Huh7人肝细胞用包含可操作地连接至CFI的TRE的质粒DNA以及包含可操作地连接至CMV启动子的萤光素酶编码核苷酸序列的对照质粒转染。然后培养、收获细胞并通过ELISA测量CFI的表达水平。与ELISA平行,进行萤光素酶测定以确定萤光素酶表达水平。每个样品的CFI表达水平针对相应的萤光素酶表达水平进行标准化。误差条显示平均值+1SD。
图10-显示与HCR-hAAT相比,在Huh7细胞中由NP12-NP24促进的CFI表达水平的倍数变化的图。HLP2、FRE72和NP3作为对照包括在内。Huh7人肝细胞用包含可操作地连接至CFI的TRE的质粒DNA以及包含可操作地连接至CMV启动子的萤光素酶编码核苷酸序列的对照质粒转染。然后培养、收获细胞并通过ELISA测量CFI的表达水平。与ELISA平行,进行萤光素酶测定以确定萤光素酶表达水平。每个样品的CFI表达水平针对相应的萤光素酶表达水平进行标准化。误差条显示平均值+/-1SD。
图11-显示了与HCR-hAAT相比,在Huh7细胞中由NP8-NP11促进的CFI表达水平的倍数变化的图。HLP2、FRE72和NP3作为对照包括在内。Huh7人肝细胞用包含可操作地连接至CFI的TRE的质粒DNA以及包含可操作地连接至CMV启动子的萤光素酶编码核苷酸序列的对照质粒转染。然后培养、收获细胞并通过ELISA测量CFI的表达水平。与ELISA平行,进行萤光素酶测定以确定萤光素酶表达水平。每个样品的CFI表达水平针对相应的萤光素酶表达水平进行标准化。误差条显示平均值+/-1SD。
图12显示了补体活化的步骤的概述。FD、FB、FH和FI分别代表因子D、B、H和I。
图13显示了脊椎动物补体的旁路途径的反馈回路。虚线表示酶促反应。实线表示蛋白质的转化。D、B、H和I分别代表因子D、B、H和I。
序列描述
Figure BDA0004091717840000071
Figure BDA0004091717840000081
Figure BDA0004091717840000091
Figure BDA0004091717840000101
详述
一般定义
除非另有定义,本文使用的技术和科学术语与本发明所属领域的技术人员通常理解的含义相同。
一般而言,术语“包含”旨在表示包括但不限于。例如,短语“包含CFI核苷酸序列的多核苷酸”应被解释为表示该多核苷酸具有CFI核苷酸序列,但该多核苷酸可包含额外的核苷酸。
在本发明的一些实施方案中,单词“包含”可以替换为短语“由......组成”。术语“由......组成”旨在进行限制。例如,短语“由CFI核苷酸序列组成的多核苷酸”应理解为是指该多核苷酸具有CFI核苷酸序列并且没有额外的核苷酸。
在本发明的一些实施方案中,单词“具有”或“含有”可以用单词“包含”或短语“由......组成”代替。
如本文所用,当提及两个端点以定义值的范围时,“之间”应当被理解为“介于之间和包括”。因此,定义为“介于5和10之间”的范围包括大于5和小于10的所有值,以及离散值5和10本身。
描述核苷酸序列长度的上下文中使用的术语“约”表示序列可以包含限定数目,加或减10%,更具体地加或减5%,更具体地加或减1%或更具体地加或减一个整数的核苷酸或由其组成。例如,提及长度为“约”1698个核苷酸的核苷酸序列可以指长度为1529-1867个核苷酸,更具体地1614-1782个核苷酸,更具体地1682-1714个核苷酸,更具体地1697-1699个核苷酸的核苷酸序列。
为了本发明的目的,为了确定两个序列(例如两个多核苷酸或两个多肽序列)的同一性百分比,将序列比对以用于最佳比较目的(例如,可以在第一序列中引入空位以进行与第二序列的最佳比对)。然后比较每个位置的核苷酸或氨基酸残基。当第一序列中的一个位置被与第二序列中的相应位置相同的核苷酸或氨基酸残基占据时,则该位置的核苷酸或氨基酸是相同的。两个序列之间的同一性百分比是序列共有的相同位置的数量的函数(即,%同一性=相同位置数/参考序列中的位置总数x100)。
通常,序列比较是在参考序列的长度上进行的。例如,如果用户希望确定给定(“测试”)序列是否与SEQ ID NO:5具有95%的同一性,则SEQ ID NO:5将是参考序列。例如,为了评估序列是否与SEQ ID NO:5(参考序列的示例)至少95%相同,技术人员将在SEQ ID NO:5的长度上进行比对,并鉴定测试序列中与SEQ ID NO:5相同的位置的数量。如果至少95%的位置相同,则测试序列与SEQ ID NO:5至少95%相同。如果序列短于SEQ ID NO:5,则空位或缺失的位置应被认为是不相同的位置。
技术人员知道可用于确定两个序列之间的同源性或同一性的不同计算机程序。例如,两个序列之间的序列比较和同一性百分比的确定可以使用数学算法来完成。在一个实施方案中,两个氨基酸或核苷酸序列之间的同一性百分比是使用Needleman和Wunsch(1970)算法(该算法已被并入Accelrys GCG软件包(可在http://www.accelrys.com/products/gcg/获得)中的GAP程序中)、使用Blosum 62矩阵或PAM250矩阵和16、14、12、10、8、6或4的空位权重和1、2、3、4、5或6的长度权重确定的。
为了本发明的目的,术语“片段”是指序列的连续部分。例如,50个核苷酸的SEQ IDNO:5的片段是指SEQ ID NO:5的50个连续核苷酸。
术语“蛋白质”和“多肽”在本文中可互换使用,并意指任何长度的氨基酸的聚合链。
术语“因子I”和“补体因子I”在本文中可互换使用。
多核苷酸
本发明提供了包含补体因子I(CFI)核苷酸序列的多核苷酸,其中CFI核苷酸序列编码CFI多肽或其片段,并且其中CFI核苷酸序列的至少一部分不是野生型的。任选地,CFI核苷酸序列是人CFI核苷酸序列。任选地,CFI多肽是人CFI多肽。
本发明还提供了包含CFI核苷酸序列的多核苷酸,其中CFI核苷酸序列编码CFI多肽或其片段,并且CFI核苷酸序列包含与SEQ ID NO:1-40中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列是人CFI核苷酸序列。任选地,CFI多肽是人CFI多肽。
术语“核酸分子”、“多核苷酸”和“核苷酸序列”旨在指任何长度的核苷酸(包括脱氧核糖核苷酸、核糖核苷酸或其类似物)的聚合链。例如,核酸分子、多核苷酸或核苷酸序列可包含DNA(脱氧核糖核苷酸)或RNA(核糖核苷酸)。核酸分子、多核苷酸或核苷酸序列可由DNA组成。核酸分子、多核苷酸或核苷酸序列可以是mRNA。由于核酸分子、多核苷酸或核苷酸序列可包含RNA或DNA,所以所有对T(胸腺嘧啶)核苷酸的引用可替换为U(尿嘧啶)。
在一些实施方案中,术语“核苷酸序列”可以被术语“核酸分子”替代。
在一些实施方案中,CFI核苷酸序列包含与SEQ ID NO:1-40中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含与SEQ IDNO:1-20中任一个的至少1200、至少1400、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
任选地,CFI核苷酸序列包含与SEQ ID NO:3-20和23-40中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含与SEQ IDNO:3-20中任一个的至少1200、至少1400、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
任选地,CFI核苷酸序列包含与SEQ ID NO:1、2、3、5、6、7、9-12、14-17、20、21、22、23、25、26、27、29-32、34-37和40中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含与SEQ ID NO:1、2、3、5、6、7、9-12、14-17和20任一个的至少1200、至少1400、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
任选地,CFI核苷酸序列包含与SEQ ID NO:2、3、5、6、7、9-12、14-17、20、22、23、25、26、27、29-32、34-37和40中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含与SEQ ID NO:2、3、5、6、7、9-12、14-17和20中任一个的至少1200、至少1400、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
任选地,CFI核苷酸序列包含与SEQ ID NO:1、5、7、10-14、16、17、21、25、27、30-34、36和37中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含与SEQ ID NO:1、5、7、10-14、16和17中任一个的至少1200、至少1400、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
任选地,CFI核苷酸序列包含与SEQ ID NO:1、5、7、11-14、16、17、21、25、27、31-34、36和37中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含与SEQ ID NO:1、5、7、11-14、16和17中任一个的至少1200、至少1400、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
任选地,CFI核苷酸序列包含与SEQ ID NO:1、5、7、11、12、14、16、17、21、25、27、31、32、34、36和37中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含与SEQ ID NO:1、5、7、11、12、14、16和17中任一个的至少1200、至少1400、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
任选地,CFI核苷酸序列包含与SEQ ID NO:5、7、12-14、16、17、25、27、32-34、36和37中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含与SEQ ID NO:5、7、12-14、16和17中任一个的至少1200、至少1400、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
任选地,CFI核苷酸序列包含与SEQ ID NO:5、7、12、14、16、17、25、27、32、34、36和37中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含与SEQ ID NO:5、7、12、14、16和17中任一个的至少1200、至少1400、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
任选地,CFI核苷酸序列包含与SEQ ID NO:5、7、14、25、27和34中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含与SEQ ID NO:5、7和14中任一个的至少1200、至少1400、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
任选地,CFI核苷酸序列包含与SEQ ID NO:3、5-7、10、14、17、20、23、25-27、30、34、37和40中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含与SEQ ID NO:3、5-7、10、14、17和20中任一个的至少1200、至少1400、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
任选地,CFI核苷酸序列包含与SEQ ID NO:5、10、17、25、30和37中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含与SEQ ID NO:5、10和17中任一个的至少1200、至少1400、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
任选地,CFI核苷酸序列包含与SEQ ID NO:5或25的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含与SEQ ID NO:5的至少1200、至少1400、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
任选地,CFI核苷酸序列包含与SEQ ID NO:7或27的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含与SEQ ID NO:7的至少1200、至少1400、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
任选地,CFI核苷酸序列包含与SEQ ID NO:10或30的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
任选地,CFI核苷酸序列包含与SEQ ID NO:10的至少1200、至少1400、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
任选地,CFI核苷酸序列包含与SEQ ID NO:14或34的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含与SEQ ID NO:14的至少1200、至少1400、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
任选地,CFI核苷酸序列包含与SEQ ID NO:17或37的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含与SEQ ID NO:17的至少1200、至少1400、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
任选地,CFI核苷酸序列包含与SEQ ID NO:1-40中任一个的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含与SEQ ID NO:1-20中任一个的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含SEQ ID NO:1-20中任一个的核苷酸序列。
任选地,CFI核苷酸序列包含与SEQ ID NO:3-20和23-40中任一个的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含与SEQ ID NO:3-20中任一个的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含SEQ ID NO:3-20中任一个的核苷酸序列。
任选地,CFI核苷酸序列包含与SEQ ID NO:1、2、3、5、6、7、9-12、14-17、20、21、22、23、25、26、27、29-32、34-37和40中任一个的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含与SEQ ID NO:1、2、3、5、6、7、9-12、14-17和20中任一个的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含SEQ ID NO:1、2、3、5、6、7、9-12、14-17和20中任一个的核苷酸序列。
任选地,CFI核苷酸序列包含与SEQ ID NO:2、3、5、6、7、9-12、14-17、20、22、23、25、26、27、29-32、34-37和40中任一个的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含与SEQID NO:2、3、5、6、7、9-12、14-17和20中任一个的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含SEQ ID NO:2、3、5、6、7、9-12、14-17和20中任一个的核苷酸序列。
任选地,CFI核苷酸序列包含与SEQ ID NO:1、5、7、10-14、16、17、21、25、27、30-34、36和37中任一个的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含与SEQ ID NO:1、5、7、10-14、16和17中任一个的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含SEQ ID NO:1、5、7、10-14、16和17中任一个的核苷酸序列。
任选地,CFI核苷酸序列包含与SEQ ID NO:1、5、7、11-14、16、17、21、25、27、31-34、36和37中任一个的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含与SEQ ID NO:1、5、7、11-14、16和17中任一个的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含SEQ ID NO:1、5、7、11-14、16和17中任一个的核苷酸序列。
任选地,CFI核苷酸序列包含与SEQ ID NO:1、5、7、11、12、14、16、17、21、25、27、31、32、34、36和37中任一个的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含与SEQ ID NO:1、5、7、11、12、14、16和17中任一个的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含SEQ IDNO:1、5、7、11、12、14、16和17中任一个的核苷酸序列。
任选地,CFI核苷酸序列包含与SEQ ID NO:5、7、12-14、16、17、25、27、32-34、36和37中任一个的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含与SEQ ID NO:5、7、12-14、16和17中任一个的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含SEQ ID NO:5、7、12-14、16和17中任一个的核苷酸序列。
任选地,CFI核苷酸序列包含与SEQ ID NO:5、7、12、14、16、17、25、27、32、34、36和37中任一个的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含与SEQ ID NO:5、7、12、14、16和17中任一个的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含SEQ ID NO:5、7、12、14、16和17中任一个的核苷酸序列。
任选地,CFI核苷酸序列包含与SEQ ID NO:5、7、14、25、27和34中任一个的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含与SEQ ID NO:5、7和14中任一个的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含SEQ ID NO:5、7和14中任一个的核苷酸序列。
任选地,CFI核苷酸序列包含与SEQ ID NO:3、5-7、10、14、17、20、23、25-27、30、34、37和40中任一个的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含与SEQ ID NO:3、5-7、10、14、17和20中任一个的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。任选地,CFI核苷酸序列包含SEQ ID NO:3、5-7、10、14、17和20中任一个的核苷酸序列。
任选地,CFI核苷酸序列包含与SEQ ID NO:5、10、17、25、30和37中任一个的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含与SEQ ID NO:5、10和17中任一个的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含SEQ ID NO:5、10和17中任一个的核苷酸序列。
任选地,CFI核苷酸序列包含与SEQ ID NO:5或25的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含与SEQ ID NO:5的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含SEQ ID NO:5的核苷酸序列。
任选地,CFI核苷酸序列包含与SEQ ID NO:7或27的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含与SEQ ID NO:7的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含SEQ ID NO:7的核苷酸序列。
任选地,CFI核苷酸序列包含与SEQ ID NO:10或30的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含与SEQ ID NO:10的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含SEQ ID NO:10的核苷酸序列。
任选地,CFI核苷酸序列包含与SEQ ID NO:14或34的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含与SEQ ID NO:14的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含SEQ ID NO:14的核苷酸序列。
任选地,CFI核苷酸序列包含与SEQ ID NO:17或37的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含与SEQ ID NO:17的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含SEQ ID NO:17的核苷酸序列。
任选地,CFI核苷酸序列包含与SEQ ID NO:1或21的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含与SEQ ID NO:1的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,CFI核苷酸序列包含SEQ ID NO:1的核苷酸序列。
本发明的多核苷酸包含CFI核苷酸序列并且CFI核苷酸序列编码CFI多肽或其片段。术语“编码的序列”或“序列编码”是指包含开放阅读框的核苷酸序列,该开放阅读框包含编码所编码的多肽的密码子。例如,编码CFI多肽或其片段的核苷酸序列包含编码CFI多肽或其片段的氨基酸序列的密码子。编码野生型CFI多肽的CFI核苷酸序列的实例在SEQ IDNO:41或42中提供。
编码多肽的密码子也称为“编码核苷酸”。CFI核苷酸序列可以被非编码核苷酸(例如内含子)打断,但只有编码多肽的核苷酸(即编码核苷酸)才应该被认为是CFI核苷酸序列的一部分。例如,编码CFI多肽的CFI核苷酸序列将包含编码形成CFI多肽的一部分的氨基酸的任何密码子(即编码核苷酸),无论这些密码子是在序列上连续的还是被一个或多个非编码核苷酸隔开。换言之,包含被一段非编码核苷酸打断的编码核苷酸区段的多核苷酸将被认为包含“CFI核苷酸序列”,其由紧挨着并列的编码核苷酸的非连续区段组成(即减去非编码核苷酸)。然而,在本文中,终止密码子的核苷酸将被认为是编码核苷酸。
编码CFI多肽或其片段的CFI核苷酸序列还可包含编码信号肽的序列。众所周知,一些蛋白质,特别是输出到不同组织的蛋白质,被表达为具有信号肽。信号肽可以位于蛋白质序列的N端(例如编码序列的5'端),并且许多信号肽在细胞加工后被裂解。因此,在本文中,成熟蛋白质或多肽(例如成熟CFI蛋白质或多肽)将被认为是在信号肽已经被加工和去除/裂解(因此不再形成多肽序列的一部分)之后得到的蛋白质或多肽。
下表描述了编码每个氨基酸的密码子:
Figure BDA0004091717840000231
/>
Figure BDA0004091717840000241
相应的RNA密码子将包含U以代替上表中的T。
CFI多肽是由重链和轻链组成的糖蛋白异源二聚体。CFI在C3分解循环中发挥作用。CFI可以通过使C3b失活和降解iC3b来调节补体活化。CFI可以催化C3b裂解为iC3b(也称为“C3b-失活”活性)。CFI可以将iC3b分解为C3d,g(也称为“iC3b-降解”活性)。典型的野生型CFI多肽由SEQ ID NO:41或42编码。
通常,CFI多肽最初表达为前体“未成熟”形式(例如由SEQ ID NO:41编码的SEQ IDNO:43的CFI),包含信号肽(例如SEQ ID NO:43的氨基酸残基1至18和SEQ ID NO:41的密码子1至18),以及成熟的CFI多肽区。加工后,CFI的“成熟”形式缺少信号肽。术语“成熟CFI”或“成熟CFI多肽”是指不包含信号肽的CFI多肽,例如由SEQ ID NO:1-20和42编码的CFI。典型的野生型CFI信号肽可以由SEQ ID NO:45的核苷酸序列编码并具有SEQ ID NO:46的多肽序列。
优选地,CFI多肽或其片段是有功能的。确定由CFI核苷酸序列编码的CFI多肽或其片段是否有功能在本领域技术人员的能力范围内。技术人员只需要表达CFI核苷酸序列,测试表达的多肽是否具有活性。例如,技术人员可以制备包含与可操作启动子连接的CFI核苷酸序列的本发明的病毒颗粒,并在适合表达CFI多肽或其片段的条件下用病毒颗粒转导细胞。如果CFI多肽或其片段具有至少20%的野生型CFI的CFI活性,则它是有功能的。优选地,CFI活性包括C3b-失活和/或iC3b-降解活性。
多肽是否具有C3b-失活活性可由本领域技术人员确定,例如通过使用基于凝胶的裂解测定。例如,待测试的多肽可以与辅因子H因子混合。然后可以添加痕量的123I-标记的C3b并且孵育样品(例如在37℃下过夜)。然后可以通过添加还原(DDT)SDS PAGE样品缓冲液来终止反应。然后可以使样品变性(例如通过加热至95摄氏度持续5分钟)并在SDS-PAGE凝胶(例如10-15%梯度)上运行。然后可以干燥凝胶并使蛋白质可视化(例如通过使用PhosphorImager;Molecular Dynamics,Sunnyvale,CA)。然后可以分析α'-链的强度和C3b条带的43kDa片段(例如使用ImageGauge;Fujifilm)。条带可以通过光密度测定法进行量化。C3b(产物)的43kDa片段与α'-链(底物)的比率可用于指示多肽在失活C3b方面的活性。比率越大,活性越高。
多肽是否具有iC3b-降解活性可由本领域技术人员确定,例如通过使用ELISA测定,例如配对的ELISA测定。例如,待测试的多肽可与血清混合,然后与旁路补体途径的活化剂(例如酵母聚糖)混合。然后可以将混合物孵育一段时间(例如0、30、60、120、180、240和480分钟)以允许被测试的多肽使C3b失活并随后降解iC3b。可以在每个时间点收集样品(例如可以收集样品并微量离心以去除酵母聚糖)。iC3b的水平如何随时间变化可用于确定被测试的多肽的iC3b-降解活性。iC3b的水平可以通过对样品进行ELISA来确定。在这种ELISA中达到的OD水平将与样品中未降解的iC3b的量成比例。OD水平越高,样品中存在的iC3b越多。随着时间的推移,在前2小时内达到的最大OD可以作为旁路途径被活化的程度的量度。随着时间的推移(例如8小时),最大OD到最低OD的百分比减少可以用作iC3b降解为C3c和C3dg的量度,因此可以用作iC3b-降解活性的量度。随着时间的推移最大OD到最低OD的减少百分比越高,iC3b-降解活性就越高。Lay等人Clinical and Experimental Immunology,181:314–3212中提到了可以使用的ELISA的实例。可以使用的ELISA的实例如下。
抗C3g抗体(如Lay等人Clinical and Experimental Immunology,181:314–3212中公开的抗体)可以与板结合(例如包被到微量滴定板)。可以将每个样品加载到板上并孵育(例如在室温下孵育1小时)。C3g的区域作为新抗原存在于iC3b和C3dg中,但未暴露于天然C3或C3b中。因此,抗C3g抗体(与新抗原结合)只会从每个样品中捕获iC3b或C3dg(不会捕获C3或C3b)。然后可以检测捕获的iC3b。可以通过洗涤板并与抗C3c抗体孵育(例如在室温下孵育1小时)来检测捕获的iC3b。抗C3c抗体将仅结合iC3b而不结合C3dg,因为C3c包含在iC3b内(即抗C3c抗体将结合iC3b)并在iC3b转化为C3dg时释放(即抗C3c抗体不结合C3dg)。因此,抗C3c抗体只能识别iC3b而不能识别C3dg。存在的抗C3c抗体水平将指示存在的未降解的iC3b的量。可以通过测量抗C3c抗体的量来测量与板上的iC3b结合的抗C3c抗体的水平。例如,抗C3c抗体可以是生物素化抗体,因此可以使用亲和素-过氧化物酶(例如extravidin-过氧化物酶,Sigma-Aldrich)进行检测,该酶可以结合生物素并催化底物如TMB(3,3',5,5'-四甲基联苯胺产生蓝色反应产物)。例如,可以洗涤板并进一步用亲和素-过氧化物酶孵育(例如在室温下孵育1小时)。进一步洗涤后,可以添加TMB(3,3',5,5'-四甲基联苯胺)。蓝色产物(OD)的水平可以通过450nm处的吸光度来检测。蓝色产物(OD)的水平与洗涤步骤后剩余的抗C3c抗体的量成比例,这与样品中未降解的iC3b的量成比例。OD水平越高,样品中存在的iC3b越多。
任选地,在上述ELISA测定中,辅因子CR1(或重组CR1功能蛋白片段,例如Mirococept)可以与血清和旁路补体途径的活化剂一起添加。
任选地,CFI多肽或其片段具有至少70%、至少80%、至少90%或至少100%的野生型CFI的CFI活性。优选地,CFI活性包括C3b-失活活性和/或iC3b-降解活性。任选地,CFI多肽或其片段具有至少70%、至少80%、至少90%或至少100%的野生型CFI的C3b-失活活性。任选地,CFI多肽或其片段具有至少70%、至少80%、至少90%或至少100%的野生型CFI的iC3b-降解活性。任选地,CFI多肽或其片段具有至少70%、至少80%、至少90%或至少100%的野生型CFI的C3b-失活活性,并且CFI多肽或其片段具有至少70%、至少80%、至少90%或至少100%的野生型CFI的iC3b-降解活性。
任选地,由CFI核苷酸序列编码的CFI多肽或其片段包含序列,其:(a)与SEQ IDNO:43或44至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同;(b)与SEQID NO:43或44的至少300、至少350、至少400、583或更少、565或更少、300至583或300至565个氨基酸长度的片段至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。
在一个实施方案中,CFI多肽或其片段与SEQ ID NO:44至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同;或与SEQ ID NO:44的约565个氨基酸长度的片段至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。任选地,CFI多肽或其片段不包含SEQ ID NO:46的信号肽。
CFI核苷酸序列可包含SEQ ID NO:1-20中任一个的序列或其编码CFI多肽的变体,所述CFI多肽包含与SEQ ID NO:44的野生型CFI氨基酸序列至少95%相同的序列。任选地,该变体是SEQ ID NO:5、7和14中任一个的变体。任选地,该变体是SEQ ID NO:5、10和17中任一个的变体。任选地,该变体编码具有CFI活性的CFI多肽。优选地,变体编码有功能的CFI多肽。任选地,该变体编码具有至少70%、至少80%、至少90%或至少100%的野生型CFI的CFI活性的CFI多肽。优选地,CFI活性包括C3b-失活活性和/或iC3b-降解活性。任选地,变体编码具有至少70%、至少80%、至少90%或至少100%的野生型CFI的C3b-失活活性的CFI多肽。任选地,该变体编码具有至少70%、至少80%、至少90%或至少100%的野生型CFI的iC3b-降解活性的CFI多肽。任选地,该变体编码具有至少70%、至少80%、至少90%或至少100%的野生型CFI的C3b-失活活性的CFI多肽,并且该变体编码具有至少70%、至少80%、至少90%或至少100%的野生型CFI的iC3b-降解活性的CFI多肽。
任选地,变体是SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20中任一个的变体。在一些实施方案中,SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20的变体分别与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20相同,除了其包含核苷酸取代以使得编码的CFI多肽相对于SEQ IDNO:44的野生型CFI氨基酸序列具有1个、2个或更少、3个或更少、4个或更少、5个或更少、6个或更少、7个或更少、8个或更少、9个或更少或10个或更少的氨基酸取代。在一些实施方案中,SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20的变体分别相对于SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20的序列具有1个、2个或更少、3个或更少、4个或更少、5个或更少、6个或更少、7个或更少、8个或更少、9个或更少、10个或更少、20个或更少或30个或更少的核苷酸取代。SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20的变体分别相对于SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20的序列可以具有1个、2个或更少、3个或更少、4个或更少、5个或更少或6个或更少的核苷酸取代。在一个实施方案中,SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20的变体分别相对于SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20的序列具有4个或更少的核苷酸取代,和/或编码相对于SEQ ID NO:44的野生型CFI氨基酸序列具有3个或更少的氨基酸取代的CFI多肽。在一个实施方案中,SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20的变体分别相对于SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20的序列具有3个或更少的核苷酸取代,和/或编码相对于SEQ ID NO:44的野生型CFI氨基酸序列具有2个或更少的氨基酸取代的CFI多肽。在一个实施方案中,SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20的变体分别相对于SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20的序列具有1个核苷酸取代,和/或编码相对于SEQ ID NO:44的野生型CFI氨基酸序列具有1个氨基酸取代的CFI多肽。在一个实施方案中,SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20的变体编码相对于SEQ ID NO:44的野生型CFI氨基酸序列具有3个或更少的氨基酸取代的CFI多肽。在一个实施方案中,SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20的变体编码相对于SEQ ID NO:44的野生型CFI氨基酸序列具有2个或更少的氨基酸取代的CFI多肽。在一个实施方案中,SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20的变体编码相对于SEQ ID NO:44的野生型CFI氨基酸序列具有1个氨基酸取代的CFI多肽。
任选地,变体是SEQ ID NO:5的变体。在一些实施方案中,SEQ ID NO:5的变体与SEQ ID NO:5相同,除了它包含核苷酸取代以使得CFI多肽相对于SEQ ID NO:44的野生型CFI氨基酸序列具有1个、2个或更少、3个或更少、4个或更少、5个或更少、6个或更少、7个或更少、8个或更少、9个或更少或10个或更少的氨基酸取代。在一些实施方案中,SEQ ID NO:5的变体相对于SEQ ID NO:5的序列具有1个、2个或更少、3个或更少、4个或更少、5个或更少、6个或更少、7个或更少、8个或更少、9个或更少、10个或更少、20个或更少或30个或更少的核苷酸取代。SEQ ID NO:5的变体相对于SEQ ID NO:5的序列可以具有1个、2个或更少、3个或更少、4个或更少、5个或更少或6个或更少的核苷酸取代。在一个实施方案中,SEQ ID NO:5的变体相对于SEQ ID NO:5的序列具有4个或更少的核苷酸取代和/或编码相对于SEQ IDNO:44的野生型氨基酸CFI序列具有3个或更少的氨基酸取代的CFI多肽。在一个实施方案中,SEQ ID NO:5的变体相对于SEQ ID NO:5的序列具有3个或更少的核苷酸取代和/或编码相对于SEQ ID NO:44的野生型CFI氨基酸序列具有2个或更少的氨基酸取代的CFI多肽。在一个实施方案中,SEQ ID NO:5的变体相对于SEQ ID NO:5的序列具有1个核苷酸取代和/或编码相对于SEQ ID NO:44的野生型CFI氨基酸序列具有1个氨基酸取代的CFI多肽。在一个实施方案中,SEQ ID NO:5的变体编码相对于SEQ ID NO:44的野生型CFI氨基酸序列具有3个或更少的氨基酸取代的CFI多肽。在一个实施方案中,SEQ ID NO:5的变体编码相对于SEQID NO:44的野生型CFI氨基酸序列具有2个或更少的氨基酸取代的CFI多肽。在一个实施方案中,SEQ ID NO:5的变体编码相对于SEQ ID NO:44的野生型CFI氨基酸序列具有1个氨基酸取代的CFI多肽。
任选地,变体是SEQ ID NO:7的变体。在一些实施方案中,SEQ ID NO:7的变体与SEQ ID NO:7相同,除了它包含核苷酸取代以使得CFI多肽相对于SEQ ID NO:44的野生型CFI氨基酸序列具有1个、2个或更少、3个或更少、4个或更少、5个或更少、6个或更少、7个或更少、8个或更少、9个或更少或10个或更少的氨基酸取代。在一些实施方案中,SEQ ID NO:7的变体相对于SEQ ID NO:7的序列具有1个、2个或更少、3个或更少、4个或更少、5个或更少、6个或更少、7个或更少、8个或更少、9个或更少、10个或更少、20个或更少或30个或更少的核苷酸取代。SEQ ID NO:7的变体可以相对于SEQ ID NO:7的序列具有1个、2个或更少、3个或更少、4个或更少、5个或更少或6个或更少的核苷酸取代。在一个实施方案中,SEQ ID NO:7的变体相对于SEQ ID NO:7的序列具有4个或更少的核苷酸取代和/或编码相对于SEQ IDNO:44的野生型氨基酸CFI序列具有3个或更少的氨基酸取代的CFI多肽。在一个实施方案中,SEQ ID NO:7的变体相对于SEQ ID NO:7的序列具有3个或更少的核苷酸取代和/或编码相对于SEQ ID NO:44的野生型CFI氨基酸序列具有2个或更少的氨基酸取代的CFI多肽。在一个实施方案中,SEQ ID NO:7的变体相对于SEQ ID NO:7的序列具有1个核苷酸取代和/或编码相对于SEQ ID NO:44的野生型CFI氨基酸序列具有1个氨基酸取代的CFI多肽。在一个实施方案中,SEQ ID NO:7的变体编码相对于SEQ ID NO:44的野生型CFI氨基酸序列具有3个或更少的氨基酸取代的CFI多肽。在一个实施方案中,SEQ ID NO:7的变体编码相对于SEQID NO:44的野生型CFI氨基酸序列具有2个或更少的氨基酸取代的CFI多肽。在一个实施方案中,SEQ ID NO:7的变体编码相对于SEQ ID NO:44的野生型CFI氨基酸序列具有1个氨基酸取代的CFI多肽。
任选地,变体是SEQ ID NO:10的变体。在一些实施方案中,SEQ ID NO:10的变体与SEQ ID NO:10相同,除了它包含核苷酸取代以使得CFI多肽相对于SEQ ID NO:44的野生型CFI氨基酸序列具有1个、2个或更少、3个或更少、4个或更少、5个或更少、6个或更少、7个或更少、8个或更少、9个或更少或10个或更少的氨基酸取代。在一些实施方案中,SEQ ID NO:10的变体相对于SEQ ID NO:10的序列具有1个、2个或更少、3个或更少、4个或更少、5个或更少、6个或更少、7个或更少、8个或更少、9个或更少、10个或更少、20个或更少或30个或更少的核苷酸取代。SEQ ID NO:10的变体相对于SEQ ID NO:10的序列可以具有1个、2个或更少、3个或更少、4个或更少、5个或更少或6个或更少的核苷酸取代。在一个实施方案中,SEQ IDNO:10的变体相对于SEQ ID NO:10的序列具有4个或更少的核苷酸取代和/或编码相对于SEQ ID NO:44的野生型氨基酸CFI序列具有3个或更少的氨基酸取代的CFI多肽。在一个实施方案中,SEQ ID NO:10的变体相对于SEQ ID NO:10的序列具有3个或更少的核苷酸取代和/或编码相对于SEQ ID NO:44的野生型CFI氨基酸序列具有2个或更少的氨基酸取代的CFI多肽。在一个实施方案中,SEQ ID NO:10的变体相对于SEQ ID NO:10的序列具有1个核苷酸取代和/或编码相对于SEQ ID NO:44的野生型CFI氨基酸序列具有1个氨基酸取代的CFI多肽。在一个实施方案中,SEQ ID NO:10的变体编码相对于SEQ ID NO:44的野生型CFI氨基酸序列具有3个或更少的氨基酸取代的CFI多肽。在一个实施方案中,SEQ ID NO:10的变体编码相对于SEQ ID NO:44的野生型CFI氨基酸序列具有2个或更少的氨基酸取代的CFI多肽。在一个实施方案中,SEQ ID NO:10的变体编码相对于SEQ ID NO:44的野生型CFI氨基酸序列具有1个氨基酸取代的CFI多肽。
任选地,变体是SEQ ID NO:14的变体。在一些实施方案中,SEQ ID NO:14的变体与SEQ ID NO:14相同,除了它包含核苷酸取代以使得CFI多肽相对于SEQ ID NO:44的野生型CFI氨基酸序列具有1个、2个或更少、3个或更少、4个或更少、5个或更少、6个或更少、7个或更少、8个或更少、9个或更少或10个或更少的氨基酸取代。在一些实施方案中,SEQ ID NO:14的变体相对于SEQ ID NO:14的序列具有1个、2个或更少、3个或更少、4个或更少、5个或更少、6个或更少、7个或更少、8个或更少、9个或更少、10个或更少、20个或更少或30个或更少的核苷酸取代。SEQ ID NO:14的变体相对于SEQ ID NO:14的序列可以具有1个、2个或更少、3个或更少、4个或更少、5个或更少或6个或更少的核苷酸取代。在一个实施方案中,SEQ IDNO:14的变体相对于SEQ ID NO:14的序列具有4个或更少的核苷酸取代和/或编码相对于SEQ ID NO:44的野生型氨基酸CFI序列具有3个或更少的氨基酸取代的CFI多肽。在一个实施方案中,SEQ ID NO:14的变体相对于SEQ ID NO:14的序列具有3个或更少的核苷酸取代和/或编码相对于SEQ ID NO:44的野生型CFI氨基酸序列具有2个或更少的氨基酸取代的CFI多肽。在一个实施方案中,SEQ ID NO:14的变体相对于SEQ ID NO:14的序列具有1个核苷酸取代和/或编码相对于SEQ ID NO:44的野生型CFI氨基酸序列具有1个氨基酸取代的CFI多肽。在一个实施方案中,SEQ ID NO:14的变体编码相对于SEQ ID NO:44的野生型CFI氨基酸序列具有3个或更少的氨基酸取代的CFI多肽。在一个实施方案中,SEQ ID NO:14的变体编码相对于SEQ ID NO:44的野生型CFI氨基酸序列具有2个或更少的氨基酸取代的CFI多肽。在一个实施方案中,SEQ ID NO:14的变体编码相对于SEQ ID NO:44的野生型CFI氨基酸序列具有1个氨基酸取代的CFI多肽。
任选地,变体是SEQ ID NO:17的变体。在一些实施方案中,SEQ ID NO:17的变体与SEQ ID NO:17相同,除了它包含核苷酸取代以使得CFI多肽相对于SEQ ID NO:44的野生型CFI氨基酸序列具有1个、2个或更少、3个或更少、4个或更少、5个或更少、6个或更少、7个或更少、8个或更少、9个或更少或10个或更少的氨基酸取代。在一些实施方案中,SEQ ID NO:17的变体相对于SEQ ID NO:17的序列具有1个、2个或更少、3个或更少、4个或更少、5个或更少、6个或更少、7个或更少、8个或更少、9个或更少、10个或更少、20个或更少或30个或更少的核苷酸取代。SEQ ID NO:17的变体相对于SEQ ID NO:17的序列可以具有1个、2个或更少、3个或更少、4个或更少、5个或更少或6个或更少的核苷酸取代。在一个实施方案中,SEQ IDNO:17的变体相对于SEQ ID NO:17的序列具有4个或更少的核苷酸取代和/或编码相对于SEQ ID NO:44的野生型氨基酸CFI序列具有3个或更少的氨基酸取代的CFI多肽。在一个实施方案中,SEQ ID NO:17的变体相对于SEQ ID NO:17的序列具有3个或更少的核苷酸取代和/或编码相对于SEQ ID NO:44的野生型CFI氨基酸序列具有2个或更少的氨基酸取代的CFI多肽。在一个实施方案中,SEQ ID NO:17的变体相对于SEQ ID NO:17的序列具有1个核苷酸取代和/或编码相对于SEQ ID NO:44的野生型CFI氨基酸序列具有1个氨基酸取代的CFI多肽。在一个实施方案中,SEQ ID NO:17的变体编码相对于SEQ ID NO:44的野生型CFI氨基酸序列具有3个或更少的氨基酸取代的CFI多肽。在一个实施方案中,SEQ ID NO:17的变体编码相对于SEQ ID NO:44的野生型CFI氨基酸序列具有2个或更少的氨基酸取代的CFI多肽。在一个实施方案中,SEQ ID NO:17的变体编码相对于SEQ ID NO:44的野生型CFI氨基酸序列具有1个氨基酸取代的CFI多肽。
CFI核苷酸序列可以编码相对于SEQ ID NO:44的野生型CFI氨基酸序列具有1个、2个或更少、3个或更少、4个或更少或5个或更少的氨基酸取代的CFI多肽。CFI核苷酸序列可编码相对于SEQ ID NO:44的野生型CFI氨基酸序列具有3个或更少的氨基酸取代的CFI多肽。CFI核苷酸序列可编码相对于SEQ ID NO:44的野生型CFI氨基酸序列具有2个或更少的氨基酸取代的CFI多肽。CFI核苷酸序列可以编码相对于SEQ ID NO:44的野生型CFI氨基酸序列具有1个氨基酸取代的CFI多肽。
术语“核苷酸取代”意指用不同的核苷酸取代核苷酸序列中的一个核苷酸。术语“氨基酸取代”意指用不同的氨基酸取代氨基酸序列中的一个氨基酸。
在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:1-40中任一个的至少1500个核苷酸的片段至少98%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ IDNO:1-40中任一个的至少1500个核苷酸的片段至少99%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:1-40中任一个的核苷酸序列至少98%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:1-40中任一个的核苷酸序列至少99%相同的序列。在一个实施方案中,CFI核苷酸序列包含SEQ ID NO:1-40中任一个的核苷酸序列。
在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:3-20和23-40中任一个的至少1500个核苷酸的片段至少98%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:3-20和23-40中任一个的至少1500个核苷酸的片段至少99%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:3-20和23-40中任一个的核苷酸序列至少98%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:3-20和23-40中任一个的核苷酸序列至少99%相同的序列。在一个实施方案中,CFI核苷酸序列包含SEQ IDNO:3-20和23-40中任一个的序列。
在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:1、2、3、5、6、7、9-12、14-17、20、21、22、23、25、26、27、29-32、34-37和40中任一个的至少1500个核苷酸的片段至少98%相同的序列。在一个实施方案中,CFI核苷酸序列包含与与SEQ ID NO:1、2、3、5、6、7、9-12、14-17、20、21、22、23、25、26、27、29-32、34-37和40中任一个的至少1500个核苷酸的片段至少99%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:1、2、3、5、6、7、9-12、14-17、20、21、22、23、25、26、27、29-32、34-37和40中任一个的核苷酸序列至少98%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:1、2、3、5、6、7、9-12、14-17、20、21、22、23、25、26、27、29-32、34-37和40中任一个的核苷酸序列至少99%相同的序列。在一个实施方案中,CFI核苷酸序列包含SEQ ID NO:1、2、3、5、6、7、9-12、14-17、20、21、22、23、25、26、27、29-32、34-37和40中任一个的序列。
在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:2、3、5、6、7、9-12、14-17、20、22、23、25、26、27、29-32、34-37和40中任一个的至少1500个核苷酸的片段至少98%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:2、3、5、6、7、9-12、14-17、20、22、23、25、26、27、29-32、34-37和40中任一个的至少1500个核苷酸的片段至少99%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:2、3、5、6、7、9-12、14-17、20、22、23、25、26、27、29-32、34-37和40中任一个的核苷酸序列至少98%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:2、3、5、6、7、9-12、14-17、20、22、23、25、26、27、29-32、34-37和40中任一个的核苷酸序列至少99%相同的序列。在一个实施方案中,CFI核苷酸序列包含SEQ ID NO:2、3、5、6、7、9-12、14-17、20、22、23、25、26、27、29-32、34-37和40中任一个的序列。
在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:1、5、7、10-14、16、17、21、25、27、30-34、36和37中任一个的至少1500个核苷酸的片段至少98%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:1、5、7、10-14、16、17、21、25、27、30-34、36和37中任一个的至少1500个核苷酸的片段至少99%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:1、5、7、10-14、16、17、21、25、27、30-34、36和37中任一个的核苷酸序列至少98%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:1、5、7、10-14、16、17、21、25、27、30-34、36和37中任一个的核苷酸序列至少99%相同的序列。在一个实施方案中,CFI核苷酸序列包含SEQ ID NO:1、5、7、10-14、16、17、21、25、27、30-34、36和37中任一个的序列。
在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:1、5、7、11-14、16、17、21、25、27、31-34、36和37中任一个的至少1500个核苷酸的片段至少98%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:1、5、7、11-14、16、17、21、25、27、31-34、36和37中任一个的至少1500个核苷酸的片段至少99%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:1、5、7、11-14、16、17、21、25、27、31-34、36和37中任一个的核苷酸序列至少98%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:1、5、7、11-14、16、17、21、25、27、31-34、36和37中任一个的核苷酸序列至少99%相同的序列。在一个实施方案中,CFI核苷酸序列包含SEQ ID NO:1、5、7、11-14、16、17、21、25、27、31-34、36和37中任一个的序列。
在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:1、5、7、11、12、14、16、17、21、25、27、31、32、34、36和37中任一个的至少1500个核苷酸的片段至少98%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:1、5、7、11、12、14、16、17、21、25、27、31、32、34、36和37中任一个的至少1500个核苷酸的片段至少99%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:1、5、7、11、12、14、16、17、21、25、27、31、32、34、36和37中任一个的核苷酸序列至少98%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:1、5、7、11、12、14、16、17、21、25、27、31、32、34、36和37中任一个的核苷酸序列至少99%相同的序列。在一个实施方案中,CFI核苷酸序列包含SEQ ID NO:1、5、7、11、12、14、16、17、21、25、27、31、32、34、36和37中任一个的序列。
在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:5、7、12-14、16、17、25、27、32-34、36和37中任一个的至少1500个核苷酸的片段至少98%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:5、7、12-14、16、17、25、27、32-34、36和37中任一个的至少1500个核苷酸的片段至少99%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:5、7、12-14、16、17、25、27、32-34、36和37中任一个的核苷酸序列至少98%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:5、7、12-14、16、17、25、27、32-34、36和37中任一个的核苷酸序列至少99%相同的序列。在一个实施方案中,CFI核苷酸序列包含SEQ ID NO:5、7、12-14、16、17、25、27、32-34、36和37中任一个的序列。
在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:5、7、12、14、16、17、25、27、32、34、36和37中任一个的至少1500个核苷酸的片段至少98%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:5、7、12、14、16、17、25、27、32、34、36和37中任一个的至少1500个核苷酸的片段至少99%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:5、7、12、14、16、17、25、27、32、34、36和37中任一个的核苷酸序列至少98%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:5、7、12、14、16、17、25、27、32、34、36和37中任一个的核苷酸序列至少99%相同的序列。在一个实施方案中,CFI核苷酸序列包含SEQ ID NO:5、7、12、14、16、17、25、27、32、34、36和37中任一个的序列。
在一个实施方案中,CFI核苷酸序列包含SEQ ID NO:5、7、12、14、16、17、25、27、32-34、36和37中任一个的序列。
在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:5、7、14、25、27和34中任一个的至少1500个核苷酸的片段至少98%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:5、7、14、25、27和34中任一个的至少1500个核苷酸的片段至少99%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:5、7、14、25、27和34中任一个的核苷酸序列至少98%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:5、7、14、25、27和34中任一个的核苷酸序列至少99%相同的序列。在一个实施方案中,CFI核苷酸序列包含SEQ ID NO:5、7、14、25、27和34中任一个的序列。
在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:3、5-7、10、14、17、20、23、25-27、30、34、37和40中任一个的至少1500个核苷酸的片段至少98%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:3、5-7、10、14、17、20、23、25-27、30、34、37和40中任一个的至少1500个核苷酸的片段至少99%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:3、5-7、10、14、17、20、23、25-27、30、34、37和40中任一个的核苷酸序列至少98%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:3、5-7、10、14、17、20、23、25-27、30、34、37和40中任一个的核苷酸序列至少99%相同的序列。在一个实施方案中,CFI核苷酸序列包含SEQ ID NO:3、5-7、10、14、17、20、23、25-27、30、34、37和40中任一个的序列。
在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:5、10、17、25、30和37中任一个的至少1500个核苷酸的片段至少98%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:5、10、17、25、30和37中任一个的至少1500个核苷酸的片段至少99%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:5、10、17、25、30和37中任一个的核苷酸序列至少98%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:5、10、17、25、30和37中任一个的核苷酸序列至少99%相同的序列。在一个实施方案中,CFI核苷酸序列包含SEQ ID NO:5、10、17、25、30和37中任一个的序列。
在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:5或25的至少1500个核苷酸的片段至少98%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:5或25的至少1500个核苷酸的片段至少99%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:5或25的核苷酸序列至少98%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:5或25的核苷酸序列至少99%相同的序列。在一个实施方案中,CFI核苷酸序列包含SEQ ID NO:5或25的序列。
在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:7或27的至少1500个核苷酸的片段至少98%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:7或27的至少1500个核苷酸的片段至少99%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:7或27的核苷酸序列至少98%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:7或27的核苷酸序列至少99%相同的序列。在一个实施方案中,CFI核苷酸序列包含SEQ ID NO:7或27的序列。
在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:10或30的至少1500个核苷酸的片段至少98%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:10或30的至少1500个核苷酸的片段至少99%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:10或30的核苷酸序列至少98%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:10或30的核苷酸序列至少99%相同的序列。在一个实施方案中,CFI核苷酸序列包含SEQ ID NO:10或30的序列。
在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:14或34的至少1500个核苷酸的片段至少98%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:14或34的至少1500个核苷酸的片段至少99%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:14或34的核苷酸序列至少98%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:14或34的核苷酸序列至少99%相同的序列。在一个实施方案中,CFI核苷酸序列包含SEQ ID NO:14或34的序列。
在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:17或37的至少1500个核苷酸的片段至少98%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:17或37的至少1500个核苷酸的片段至少99%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:17或37的核苷酸序列至少98%相同的序列。在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:17或37的核苷酸序列至少99%相同的序列。在一个实施方案中,CFI核苷酸序列包含SEQ ID NO:17或37的序列。
任选地,CFI核苷酸序列的至少一部分(例如编码CFI多肽或其片段的编码序列)不是野生型的。编码野生型CFI的CFI核苷酸序列由SEQ ID NO:41或42表示,包含序列不同于SEQ ID NO:41或42的部分的CFI核苷酸序列包含不是野生型的部分。
CFI核苷酸序列或不是野生型的CFI核苷酸序列部分可以是密码子优化的。本发明的多核苷酸可包含未经密码子优化的部分。例如,CFI核苷酸序列可包含未经密码子优化的部分。
在一个实施方案中,非野生型的CFI核苷酸序列部分是密码子优化的。任选地,所有或部分CFI核苷酸序列是密码子优化的。密码子优化可以改善特定组织和/或特定生物体中核苷酸序列(例如CFI核苷酸序列)的表达。例如,如果核苷酸序列针对在人肝脏中的表达进行了密码子优化,则可以修饰核苷酸序列以增加可能在人肝脏中有利的密码子的数量(在此类密码子对应于比对相同氨基酸特异的其他tRNA种类更丰富的tRNA种类的意义上)。作为进一步的例子,如果核苷酸序列针对在人肝细胞中的表达进行了密码子优化,则可以修饰核苷酸序列以增加可能在人肝细胞中有利的密码子的数量(在此类密码子对应于比对相同氨基酸特异的其他tRNA种类更丰富的tRNA种类的意义上)。技术人员会理解,密码子优化序列可能不需要改变每个密码子,尤其是因为“偏好密码子”可能已经存在于某些位置。
此类密码子优化可能会受到其他因素的影响。例如,可能不在将CpG引入序列的位置处引入偏好密码子;这仍将被视为是密码子优化的。在一个实施方案中,以C核苷酸结尾的偏好密码子将不包括在密码子优化的编码序列部分中,其中序列中的下一个密码子以G开始。例如,密码子GCC编码丙氨酸。任选地,当GCC是偏好密码子时,它不应该用于编码丙氨酸,其中序列中的下一个密码子以G开头,例如密码子GAC(或可选择地,下一个密码子(如果可能)可以被选择以避免在第一个位置处的G)。
直接确定在核苷酸序列的一部分中使用的每个密码子的频率。技术人员只需要将该部分的序列输入到查看密码子使用和检查结果的现成算法之一。可选择地,用户可以简单地计算它们。
在一个实施方案中,偏好密码子可选自:GCT、GCC、TGC、GAC、GAG、TTC、GGA、GGC、CAC、ATC、AAG、CTG、AAT、AAC、CCT、CCC、CAG、AGG、AGA、AGT、AGC、ACC、GTG和TAC。在一些实施方案中,至少一个氨基酸不具有偏好密码子。
在一个实施方案中,在密码子优化的CFI核苷酸序列或CFI核苷酸序列部分中,至少70%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%或至少81%、至少82%、至少83%或至少84%的密码子可选自:GCT、GCC、TGC、GAC、GAG、TTC、GGA、GGC、CAC、ATC、AAG、CTG、AAT、AAC、CCT、CCC、CAG、AGG、AGA、AGT、AGC、ACC、GTG和TAC。在一个实施方案中,在密码子优化的CFI核苷酸序列或CFI核苷酸序列部分中,至少80%、至少81%、至少82%、至少83%或至少84%的密码子可选自:GCT、GCC、TGC、GAC、GAG、TTC、GGA、GGC、CAC、ATC、AAG、CTG、AAT、AAC、CCT、CCC、CAG、AGG、AGA、AGT,AGC、ACC、GTG和TAC。在一个实施方案中,在密码子优化的CFI核苷酸序列或CFI核苷酸序列部分中,至少83%或至少84%的密码子可选自:GCT、GCC、TGC、GAC、GAG、TTC、GGA、GGC、CAC、ATC、AAG、CTG、AAT、AAC、CCT、CCC、CAG、AGG、AGA、AGT、AGC、ACC、GTG和TAC。
在一个实施方案中,在密码子优化的CFI核苷酸序列或CFI核苷酸序列部分中,至少75%、至少76%、至少77%、至少78%、至少79%、至少80%或至少81%的密码子可选自:GCT、GCC、TGC、GAC、GAG、TTC、GGA、GGC、CAC、ATC、AAG、CTG、AAT、AAC、CCT,CCC、CAG、AGG、AGA、AGT、AGC、ACC、GTG和TAC。在一个实施方案中,在密码子优化的CFI核苷酸序列或CFI核苷酸序列部分中,至少76%、至少77%、至少78%、至少79%、至少80%或至少81%的密码子可选自:GCT、GCC、TGC、GAC、GAG、TTC、GGA、GGC、CAC、ATC、AAG、CTG、AAT、AAC、CCT、CCC、CAG、AGG、AGA、AGT、AGC、ACC、GTG和TAC。在一个实施方案中,在密码子优化的CFI核苷酸序列或CFI核苷酸序列部分中,至少80%或至少81%的密码子可选自:GCT、GCC、TGC、GAC、GAG、TTC、GGA、GGC、CAC、ATC、AAG、CTG、AAT、AAC、CCT、CCC、CAG、AGG、AGA、AGT、AGC、ACC、GTG和TAC。
任选地,密码子优化的CFI核苷酸序列部分针对在人肝细胞中的表达进行了密码子优化。任选地,密码子优化的CFI核苷酸序列部分是连续部分。任选地,CFI核苷酸序列针对在人肝细胞中的表达进行了密码子优化。任选地,如果CFI核苷酸序列与由参考CFI核苷酸序列编码的CFI多肽的表达相比以更高的水平在人肝细胞中表达CFI多肽或其片段,则CFI核苷酸序列或其部分针对在人肝细胞中的表达进行了密码子优化。任选地,如果CFI核苷酸序列在转染包含CFI核苷酸序列的多核苷酸时与用包含参考CFI核苷酸序列的等效多核苷酸转染时由参考CFI核苷酸序列编码的CFI多肽的表达相比以更高水平在人肝细胞中表达CFI多肽或其片段,则CFI核苷酸序列或其部分针对在人肝细胞中的表达进行了密码子优化。在这样的实施方案中,参考CFI核苷酸序列可以是野生型CFI核苷酸序列。野生型CFI核苷酸可以是SEQ ID NO:41或42的序列。包含参考CFI核苷酸的“等效”多核苷酸是与本发明的多核苷酸相同(即包含相同的转录调节元件等)的多核苷酸,除了CFI核苷酸序列是不同的。例如,被比较的不同CFI核苷酸序列可操作地连接到相同的启动子序列。任选地,人肝细胞是Huh-7细胞。
密码子优化的部分可对应于编码部分或全部CFI多肽或其片段的序列。任选地,密码子优化的CFI核苷酸序列部分的长度为至少1000、至少1200、至少1300、至少1400、至少1500、至少1600、至少1700、1752或更少、1300至1752、1500至1752、1600至1752或约1752个核苷酸。任选地,密码子优化的CFI核苷酸序列部分的长度为至少1000、至少1200、至少1300、至少1400、至少1500、1698或更少、1300至1698、1500至1698或约1698个核苷酸。例如,编码序列可以编码全长CFI多肽(例如SEQ ID NO:43),包括不是成熟CFI多肽的一部分的信号肽,并且整个编码序列可以是密码子优化的。任选地,密码子优化的CFI核苷酸序列部分编码成熟的CFI多肽。在一些实施方案中,密码子优化的CFI核苷酸序列部分不编码全部或部分信号肽。例如,CFI核苷酸序列可以编码未成熟的CFI多肽(即包括信号肽),并且密码子优化的CFI核苷酸序列部分编码成熟的CFI蛋白并且不编码全部或部分信号肽。在一些实施方案中,密码子优化的CFI核苷酸序列部分编码全部或部分信号肽。例如,CFI核苷酸序列可以编码未成熟的CFI多肽(即包括信号肽),并且密码子优化的CFI核苷酸序列部分编码成熟的CFI蛋白和全部或部分信号肽。在一些实施方案中,编码整个成熟CFI多肽序列的CFI核苷酸序列是密码子优化的。
基因治疗载体中CpG(即CG二核苷酸)的存在可能对治疗性转基因的表达(例如所述表达的持久性)具有不利影响。这是因为CpG可能被甲基化,并且它们的甲基化可能导致基因沉默,从而降低表达。此外,可能的是高CpG含量可能触发TLR反应,从而增加抗AAV免疫反应的风险。与参考CFI核苷酸序列的相应部分相比,密码子优化的CFI核苷酸序列或CFI核苷酸序列部分可以包含减少数量的CpG。在此类实施方案中,参考CFI核苷酸序列可以是野生型CFI核苷酸序列或SEQ ID NO:1或21的核苷酸序列。参考CFI核苷酸序列可以是野生型CFI核苷酸序列。野生型CFI核苷酸可以是SEQ ID NO:41或42的序列。参考CFI核苷酸序列可以是SEQ ID NO:1或21的核苷酸序列。短语“参考CFI核苷酸序列的相应部分”意指“对应于”密码子优化的CFI核苷酸序列或CFI核苷酸序列部分的参考CFI核苷酸序列部分。确定“对应于”密码子优化的CFI核苷酸序列或CFI核苷酸序列部分的参考CFI核苷酸序列部分在本领域技术人员的能力范围内。例如,本领域技术人员仅需要使用合适的比对算法(例如上述Needleman和Wunsch的算法)将参考CFI核苷酸序列与本发明的CFI核苷酸序列进行序列比对,并确定参考CFI核苷酸序列的哪个区域与密码子优化的CFI核苷酸序列或CFI核苷酸序列部分比对。
在一个实施方案中,密码子优化的CFI核苷酸序列或CFI核苷酸序列部分(其可以是全部CFI核苷酸序列)包含40个或更少、20个或更少、15个或更少、10个或更少或5个或更少的CpG。在一个实施方案中,密码子优化的CFI核苷酸序列或CFI核苷酸序列部分(其可以是全部CFI核苷酸序列)每100个核苷酸包含5个或更少、4个或更少、3个或更少或2个或更少的CpG。在一些实施方案中,密码子优化的CFI核苷酸序列或CFI核苷酸序列部分不含CpG,即不含(0个)CG二核苷酸。
在一个实施方案中,密码子优化的CFI核苷酸序列部分与SEQ ID NO:1-20中任一个的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。在一个实施方案中,密码子优化的CFI核苷酸序列部分与SEQ ID NO:1、2、3、5、6、7、9-12、14-17和20中任一个的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。在一个实施方案中,密码子优化的CFI核苷酸序列部分与SEQ ID NO:2、3、5、6、7、9-12、14-17和20中任一个的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。在一个实施方案中,密码子优化的CFI核苷酸序列部分与SEQ ID NO:1、5、7、10-14、16和17中任一个的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。在一个实施方案中,密码子优化的CFI核苷酸序列部分与SEQ ID NO:1、5、7、11-14、16和17中任一个的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。在一个实施方案中,密码子优化的CFI核苷酸序列部分与SEQ ID NO:1、5、7、11、12、14、16和17中任一个的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。在一个实施方案中,密码子优化的CFI核苷酸序列部分与SEQ ID NO:5、7、12-14、16和17中任一个的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。在一个实施方案中,密码子优化的CFI核苷酸序列部分与SEQ IDNO:5、7、12、14、16和17中任一个的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。在一个实施方案中,密码子优化的CFI核苷酸序列部分与SEQ ID NO:5、7和14中任一个的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。
在一个实施方案中,密码子优化的CFI核苷酸序列部分与SEQ ID NO:3、5-7、10、14、17和20中任一个的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。在一个实施方案中,密码子优化的CFI核苷酸序列部分与SEQ ID NO:5、10和17中任一个的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。
在一个实施方案中,密码子优化的CFI核苷酸序列部分与SEQ ID NO:1-20至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。在一个实施方案中,密码子优化的CFI核苷酸序列部分与SEQ ID NO:1、2、3、5、6、7、9-12、14-17和20中的任一个至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。在一个实施方案中,密码子优化的CFI核苷酸序列部分与SEQ ID NO:2、3、5、6、7、9-12、14-17和20中的任一个至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。在一个实施方案中,密码子优化的CFI核苷酸序列部分SEQ ID NO:1、5、7、10-14、16和17中的任一个至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。在一个实施方案中,密码子优化的CFI核苷酸序列部分与SEQ ID NO:1、5、7、11-14、16和17中的任一个至少80%、至少85%、至少90%、至少95%,至少98%、至少99%、至少99.5%、至少99.8%或100%相同。在一个实施方案中,密码子优化的CFI核苷酸序列部分与SEQ ID NO:1、5、7、11、12、14、16和17中的任一个至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。在一个实施方案中,密码子优化的CFI核苷酸序列部分SEQ ID NO:5、7、12-14、16和17中的任一个至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。在一个实施方案中,密码子优化的CFI核苷酸序列部分与SEQ ID NO:5、7、12、14、16和17中的任一个至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。在一个实施方案中,密码子优化的CFI核苷酸序列部分与SEQ ID NO:5、7和14中的任一个至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。
在一个实施方案中,密码子优化的CFI核苷酸序列部分与SEQ ID NO:3、5-7、10、14、17和20中的任一个至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。在一个实施方案中,密码子优化的CFI核苷酸序列部分与SEQ ID NO:5、10和17中的任一个至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。
在一个实施方案中,密码子优化的CFI核苷酸序列部分与SEQ ID NO:5的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。在一个实施方案中,密码子优化的CFI核苷酸序列部分与SEQ IDNO:5至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。在一个实施方案中,密码子优化的CFI核苷酸序列部分与SEQ ID NO:5的至少1500个核苷酸的片段至少99.5%、至少99.8%或100%相同。在一个实施方案中,密码子优化的CFI核苷酸序列部分与SEQ ID NO:5至少99%、至少99.5%、至少99.8%或100%相同。
在一个实施方案中,密码子优化的CFI核苷酸序列部分与SEQ ID NO:7的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。在一个实施方案中,密码子优化的CFI核苷酸序列部分与SEQ IDNO:7至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。在一个实施方案中,密码子优化的CFI核苷酸序列部分与SEQ ID NO:7的至少1500个核苷酸的片段至少99.5%、至少99.8%或100%相同。在一个实施方案中,密码子优化的CFI核苷酸序列部分与SEQ ID NO:7至少99%、至少99.5%、至少99.8%或100%相同。
在一个实施方案中,密码子优化的CFI核苷酸序列部分与SEQ ID NO:10的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。在一个实施方案中,密码子优化的CFI核苷酸序列部分与SEQ IDNO:10至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。在一个实施方案中,密码子优化的CFI核苷酸序列部分与SEQ ID NO:10的至少1500个核苷酸的片段至少99.5%、至少99.8%或100%相同。在一个实施方案中,密码子优化的CFI核苷酸序列部分与SEQ ID NO:10至少99%、至少99.5%、至少99.8%或100%相同。
在一个实施方案中,密码子优化的CFI核苷酸序列部分与SEQ ID NO:14的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。在一个实施方案中,密码子优化的CFI核苷酸序列部分与SEQ IDNO:14至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。在一个实施方案中,密码子优化的CFI核苷酸序列部分与SEQ ID NO:14的至少1500个核苷酸的片段至少99.5%、至少99.8%或100%相同。在一个实施方案中,密码子优化的CFI核苷酸序列部分与SEQ ID NO:14至少99%、至少99.5%、至少99.8%或100%相同。
在一个实施方案中,密码子优化的CFI核苷酸序列部分与SEQ ID NO:17的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。在一个实施方案中,密码子优化的CFI核苷酸序列部分与SEQ IDNO:17至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。在一个实施方案中,密码子优化的CFI核苷酸序列部分与SEQ ID NO:17的至少1500个核苷酸的片段至少99.5%、至少99.8%或100%相同。在一个实施方案中,密码子优化的CFI核苷酸序列部分与SEQ ID NO:17至少99%、至少99.5%、至少99.8%或100%相同。
与由参考CFI核苷酸序列编码的CFI多肽的表达相比,由CFI核苷酸序列编码的CFI多肽或其片段可以在人肝细胞中以相同或更高的水平表达。任选地,与在用包含参考CFI核苷酸序列的等效多核苷酸转染由参考CFI核苷酸序列编码的CFI多肽的表达相比,在将包含CFI核苷酸序列的多核苷酸转染到人肝细胞中时由CFI核苷酸序列编码的CFI多肽或其片段以相同或更高的水平表达。任选地,人肝细胞是Huh-7细胞。包含参考CFI核苷酸的“等效”多核苷酸是与本发明的多核苷酸相同(即包含相同的转录调节元件等)的多核苷酸,除了CFI核苷酸序列是不同的。例如,被比较的不同CFI核苷酸序列可操作地连接到相同的启动子序列。在由CFI核苷酸序列编码的CFI核苷酸序列编码的CFI多肽或其片段的表达与由参考CFI核苷酸序列编码的CFI多肽的表达相比处于相同水平的实施方案中,参考CFI核苷酸序列可以是SEQ ID NO:1、21、5或25中任一个的核苷酸序列。参考CFI核苷酸序列可以是SEQ IDNO:1或21的核苷酸序列。参考CFI核苷酸序列可以是SEQ ID NO:5或25的核苷酸序列。任选地,与由参考CFI核苷酸序列编码的CFI多肽的表达相比,由CFI核苷酸序列编码的CFI多肽或其片段的表达水平更高。任选地,由CFI核苷酸序列编码的CFI多肽或其片段的表达与由参考CFI核苷酸序列编码的CFI多肽相比可以为至少1.5x、至少2x、至少3x、至少5x、至少8x、至少10x、至少20x、至少30x、至少40x或至少50x。任选地,由CFI核苷酸序列编码的CFI多肽或其片段的表达与由参考CFI核苷酸序列编码的CFI多肽相比可以为1.5x至50x、5x至50x、10x至50x或30x至50x。
任选地,由CFI核苷酸序列编码的CFI多肽或其片段的表达与由参考CFI核苷酸序列编码的CFI多肽相比可以为至少80x,至少100x,至少200x,至少250x,至少300x,至少350x,或至少400x。任选地,由CFI核苷酸序列编码的CFI多肽或其片段的表达与由参考CFI核苷酸序列编码的CFI多肽相比可以为至少400x。任选地,由CFI核苷酸序列编码的CFI多肽或其片段的表达与参考CFI核苷酸序列编码的CFI多肽相比可以为1.5x至500x、10x至500x、100x至500x或20x至500x。任选地,由CFI核苷酸序列编码的CFI多肽或其片段的表达比由至少一个SEQ ID NO:1-4、6-24和26-40编码的CFI多肽或其片段的表达高至少一个标准偏差。任选地,由CFI核苷酸序列编码的CFI多肽或其片段的表达比由至少一个SEQ ID NO:17或37编码的CFI多肽或其片段的表达高至少一个标准偏差。
在由CFI核苷酸序列编码的CFI核苷酸序列编码的CFI多肽或其片段的表达与由参考CFI核苷酸序列编码的CFI多肽的表达相比处于更高水平的实施方案中,参考CFI核苷酸序列可以是野生型CFI核苷酸序列或SEQ ID NO:1、21、5或25中任一个的核苷酸序列。参考CFI核苷酸序列可以是野生型CFI核苷酸序列。野生型CFI核苷酸可以是SEQ ID NO:41或42的序列。参考CFI核苷酸序列可以是SEQ ID NO:1或21的核苷酸序列。参考CFI核苷酸序列可以是SEQ ID NO:5或25的核苷酸序列。任选地,由本发明的CFI核苷酸序列编码的CFI多肽或其片段的表达为由SEQ ID NO:5或25的序列编码的CFI多肽的表达的至少50%、至少60%、至少70%、至少80%、至少90%、至少95%或至少100%。
CFI多肽或其片段的表达水平通常可以通过测量样品中CFI多肽或其片段的水平来确定。任选地,CFI多肽或其片段的表达水平通过使用ELISA来确定。CFI多肽或其片段的表达水平可以使用如实施例1中所述的ELISA测定来确定。任选地,表达水平针对转染效率进行标准化。任选地,表达水平未针对转染效率进行标准化。针对转染效率进行标准化的一种方法是使用萤光素酶测定。
确定CFI多肽或其片段的表达水平的ELISA可以使用结合CFI多肽或其片段的两种抗体,使用夹心ELISA进行(例如,根据制造商的说明使用CFI ELISA试剂盒(例如Hycult目录号HK355-01))。例如,可以将结合CFI或其片段的第一抗体固定到板上,并且可以将包含CFI多肽或其片段的样品施加到其上固定有第一抗体的板上。可以洗涤板,然后可以将结合CFI多肽或其片段并与标记缀合的第二抗体施加到板上。第二抗体可以与生物素缀合,生物素与链霉亲和素-过氧化物酶结合,并且在这种情况下,链霉亲和素-过氧化物酶充当标记。可再次洗涤板,并通过评估存在的标记的量来测量结合至板的CFI多肽或其片段的量。例如,如果标记是链霉亲和素-过氧化物酶,则可以添加与链霉亲和素-过氧化物酶反应的底物四甲基联苯胺(TMB)。加入草酸可终止酶反应。对于每个样品和标准品,可以使用分光光度计测量450nm处的吸光度。可以通过绘制吸光度(线性)针对人CFI标准品的相应浓度(对数)的图来获得标准曲线。然后可以从标准曲线确定样品中人CFI的浓度。
任选地,在用包含编码CFI多肽或其片段的CFI核苷酸序列的多核苷酸转染人肝细胞(例如Huh-7细胞)后测定CFI多肽或其片段的表达水平。任选地,检测CFI多肽或其片段的表达水平包括收获在其中培养转染的人肝细胞的培养基并检测该培养基中的表达水平。如上所述,CFI多肽或其片段的表达水平可以使用萤光素酶测定针对转染效率进行标准化。任选地,转染可以包括共转染包含编码萤光素酶的转基因的多核苷酸。这允许用户标准化测量的表达以反映已转染的细胞数量(从而考虑转染效率的差异),因为被包含编码CFI多肽或其片段的CFI核苷酸序列的多核苷酸转染的细胞的比例将与由包含萤光素酶转基因的多核苷酸表达的萤光素酶产生的荧光信号成比例。任选地,包含萤光素酶转基因的多核苷酸进一步包含CMV或TK启动子,并且萤光素酶转基因可操作地连接至CMV或TK启动子。任选地,可以在细胞(或细胞的一部分)中测量萤光素酶表达。例如,可收获并裂解细胞(或细胞的一部分),并测量裂解物中的萤光素酶表达。任选地,可以在其中培养转染的人肝细胞的培养基(或一部分培养基)中测量萤光素酶表达。任选地,可以通过进行萤光素酶测定来测量萤光素酶表达。任选地,可以使用发光计测量发光。可以通过在Molecular DevicesSpectraMax i3x读板器上测量发光来测量萤光素酶表达。
CFI核苷酸序列可以编码信号肽。任选地,信号肽的氨基酸序列是野生型CFI信号肽的氨基酸序列。野生型CFI信号肽的氨基酸序列可以是SEQ ID NO:46的氨基酸序列。信号肽可以由SEQ ID NO:45的核苷酸序列编码。信号肽可以不由野生型CFI信号肽编码核苷酸序列编码。信号肽可由SEQ ID NO:21至40中任一个的第1至54位核苷酸编码。任选地,信号肽的氨基酸序列是其不是野生型CFI信号肽的信号肽的氨基酸序列。例如,信号肽可能不是野生型CFI信号肽。信号肽可以是来自另一多肽的信号肽。任选地,CFI核苷酸序列编码信号肽。任选地,CFI核苷酸序列不编码信号肽。任选地,CFI多肽或其片段包含信号肽。任选地,CFI多肽或其片段不包含信号肽。
本发明的多核苷酸可包含转录调节元件。
可以使用任何合适的转录调节元件,例如HLP2、HLP1、LP1、HCR-hAAT、ApoE-hAAT或LSP,它们都是肝脏特异性转录调节元件。这些转录调节元件在以下参考文献中有更详细的描述:HLP1:McIntosh J.等人,Blood 2013Apr 25,121(17):3335-44;LP1:Nathwani等人,Blood.2006April 1,107(7):2653–2661;HCR-hAAT:Miao等人,Mol Ther.2000;1:522-532;ApoE-hAAT:Okuyama等人,Human Gene Therapy,7,637-645(1996);和LSP:Wang等人,ProcNatl Acad Sci U S A.1999March 30,96(7):3906–3910。转录调节元件可包含肝脏特异性启动子。
转录调节元件可包含启动子和/或增强子,例如来自HLP2、HLP1、LP1、HCR-hAAT、ApoE-hAAT或LSP的启动子元件和/或增强子元件。这些转录调节元件中的每一个都包含启动子、增强子和任选地其他核苷酸。转录调节元件可以可操作地连接至本发明的CFI核苷酸序列。启动子和/或增强子可以可操作地连接到本发明的CFI核苷酸序列。
在一些实施方案中,转录调节元件包含启动子,该启动子是人α-1抗胰蛋白酶启动子(A1AT;Miao等人(2000),Molecular Therapy1(6):522)或其片段。在一个实施方案中,A1AT启动子的片段的长度为至少100、至少120、至少150、至少180、255或更少、100至255、150至225、150至300或180至255个核苷酸。任选地,A1AT启动子的片段的长度为150至300个核苷酸。任选地,A1AT启动子的片段的长度为180至255个核苷酸。在一个实施方案中,A1AT启动子的片段的长度为至少200个、至少250个、至少300个、500个或更少、200至500、250至500或350至450或约418个核苷酸。任选地,A1AT启动子的片段的长度为350至450个核苷酸。
合适的A1AT启动子片段在SEQ ID NO:47和48中描述。任选地,转录调节元件包含长度为至少100、至少120、至少150、至少180、小于255、100至255、150至300或180至255个核苷酸的启动子,并且启动子包含与SEQ ID NO:47至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的多核苷酸序列。任选地,转录调节元件包含长度为180至255个核苷酸的启动子,并且启动子包含与SEQ ID NO:47至少98%、至少99%、至少99.5%、至少99.8%或100%相同的多核苷酸序列。任选地,多核苷酸包含与SEQ ID NO:47的至少100、至少120或至少150个核苷酸的片段至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的启动子。任选地,多核苷酸包含与SEQ ID NO:47至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的启动子。任选地,多核苷酸包含与SEQ ID NO:47至少98%、至少99%、至少99.5%、至少99.8%或100%相同的启动子。任选地,多核苷酸包含SEQ ID NO:47的启动子。
转录调节元件可包含长度为至少200、至少250、至少300、500或更少、200至500、250至500、350至450或约418个核苷酸的启动子,并且启动子包含与SEQ ID NO:48至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的多核苷酸序列。任选地,转录调节元件包含长度为350至450个核苷酸的启动子,并且启动子包含与SEQ ID NO:48至少98%、至少99%、至少99.5%、至少99.8%或100%相同的多核苷酸序列。任选地,该多核苷酸包含与SEQ ID NO:48的至少350个核苷酸的片段至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的启动子。任选地,多核苷酸包含与SEQ ID NO:48至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的启动子。任选地,多核苷酸包含与SEQ ID NO:48至少98%、至少99%、至少99.5%、至少99.8%或100%相同的启动子。任选地,多核苷酸包含SEQ ID NO:48的启动子。
任选地,转录调节元件包含A1AT启动子的片段,其长度等于或少于418个核苷酸、等于或少于255个核苷酸或等于或少于185个核苷酸并且包含SEQ ID NO:47。
如果多核苷酸意欲在肝脏中表达,则启动子可以是肝脏特异性启动子。任选地,启动子是人肝脏特异性启动子。
转录调节元件可包含增强子。在一些实施方案中,转录调节元件包含增强子,其是人载脂蛋白E(ApoE)肝基因座控制区(HCR;Miao等人(2000),Molecular Therapy 1(6):522)或其片段。在一个实施方案中,转录调节元件包含HCR增强子的片段,其是长度为至少80、至少90、至少100、192或更少、80至192、90至192、100至250或117至192个核苷酸的片段。任选地,HCR增强子的片段的长度为100到250个核苷酸。任选地,HCR增强子的片段的长度为117到192个核苷酸。在一个实施方案中,HCR增强子或HCR增强子的片段是长度为至少150、至少190、至少230、少于400、150至400、190至370、230至340、250至340或约321个核苷酸的片段。任选地,HCR增强子或HCR增强子的片段的长度为250至340个核苷酸。
合适的HCR增强子元件片段在SEQ ID NO:49和50中定义。任选地,转录调节元件包含长度为至少80、至少90、至少100、小于192、80至192、90至192、100至250或117至192个核苷酸的增强子,并且增强子包含与SEQ ID NO:49至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的多核苷酸序列。任选地,转录调节元件包含长度为117至192个核苷酸的增强子,并且增强子包含与SEQ ID NO:49至少98%、至少99%、至少99.5%、至少99.8%或100%相同的多核苷酸序列。任选地,转录调节元件包含与SEQ ID NO:49的至少90、至少100或至少110个核苷酸的片段至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的增强子。任选地,该多核苷酸包含与SEQ ID NO:49至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的增强子。任选地,该多核苷酸包含与SEQ ID NO:49至少98%、至少99%、至少99.5%、至少99.8%或100%相同的增强子。任选地,该多核苷酸包含SEQ ID NO:49的增强子。
在一些实施方案中,转录调节元件包含长度为至少150、至少190、至少230、少于400、150至400、190至370、230至340、250至340或约321个核苷酸的增强子或增强子的片段,并且增强子包含与SEQ ID NO:50至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的多核苷酸序列。任选地,转录调节元件包含长度为250至340个核苷酸的增强子,并且增强子包含与SEQ ID NO:50至少98%、至少99%、至少99.5%、至少99.8%或100%相同的多核苷酸序列。任选地,转录调节元件包含与SEQ IDNO:50的至少250个核苷酸的片段至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的增强子。任选地,多核苷酸包含与SEQ ID NO:50至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的增强子。任选地,该多核苷酸包含与SEQ ID NO:50至少98%、至少99%、至少99.5%、至少99.8%或100%相同的增强子。任选地,该多核苷酸包含SEQ ID NO:50的增强子。
任选地,转录调节元件包含HCR增强子的片段,其长度等于或少于321个核苷酸、等于或少于192个核苷酸或等于或少于117个核苷酸并且包含SEQ ID NO:49。
在一个实施方案中,转录调节元件与SEQ ID NO:51至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。在一个实施方案中,多核苷酸包含与SEQ ID NO:51至少98%、至少99%、至少99.5%、至少99.8%或100%相同的转录调节元件。任选地,该多核苷酸包含与SEQ ID NO:51至少98%相同的转录调节元件。任选地,该多核苷酸包含具有SEQ ID NO:51的序列的转录调节元件。任选地,该多核苷酸包含SEQ ID NO:51的转录调节元件。任选地,多核苷酸包含由SEQ ID NO:51组成的转录调节元件。
在一个实施方案中,转录调节元件与SEQ ID NO:52至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。在一个实施方案中,多核苷酸包含与SEQ ID NO:52至少98%、至少99%、至少99.5%、至少99.8%或100%相同的转录调节元件。任选地,该多核苷酸包含与SEQ ID NO:52至少98%相同的转录调节元件。任选地,该多核苷酸包含具有SEQ ID NO:52的序列的转录调节元件。任选地,该多核苷酸包含SEQ ID NO:52的转录调节元件。任选地,多核苷酸包含由SEQ ID NO:52组成的转录调节元件。
在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:5或25至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列;并且该多核苷酸包含与SEQ IDNO:47至少98%、至少99%、至少99.5%、至少99.8%或100%相同的启动子和/或与SEQ IDNO:49至少98%、至少99%、至少99.5%、至少99.8%或100%相同的增强子元件。在另一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:5或25至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列;并且该多核苷酸包含与SEQ ID NO:51至少98%、至少99%、至少99.5%、至少99.8%或100%相同的转录调节元件。
在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:7或27至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列;并且该多核苷酸包含与SEQ IDNO:47至少98%、至少99%、至少99.5%、至少99.8%或100%相同的启动子和/或与SEQ IDNO:49至少98%、至少99%、至少99.5%、至少99.8%或100%相同的增强子元件。在另一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:7或27至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列;并且该多核苷酸包含与SEQ ID NO:51至少98%、至少99%、至少99.5%、至少99.8%或100%相同的转录调节元件。
在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:10或30至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列;并且该多核苷酸包含与SEQID NO:47至少98%、至少99%、至少99.5%、至少99.8%或100%相同的启动子和/或与SEQID NO:49至少98%、至少99%、至少99.5%、至少99.8%或100%相同的增强子元件。在另一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:10或30至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列;并且该多核苷酸包含与SEQ ID NO:51至少98%、至少99%、至少99.5%、至少99.8%或100%相同的转录调节元件。
在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:14或34至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列;并且该多核苷酸包含与SEQID NO:47至少98%、至少99%、至少99.5%、至少99.8%或100%相同的启动子和/或与SEQID NO:49至少98%、至少99%、至少99.5%、至少99.8%或100%相同的增强子元件。在另一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:14或34至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列;并且该多核苷酸包含与SEQ ID NO:51至少98%、至少99%、至少99.5%、至少99.8%或100%相同的转录调节元件。
在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:17或37至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列;并且该多核苷酸包含与SEQID NO:47至少98%、至少99%、至少99.5%、至少99.8%或100%相同的启动子和/或与SEQID NO:49至少98%、至少99%、至少99.5%、至少99.8%或100%相同的增强子元件。在另一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:17或37至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列;并且该多核苷酸包含与SEQ ID NO:51至少98%、至少99%、至少99.5%、至少99.8%或100%相同的转录调节元件。
在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:5或25至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列;并且该多核苷酸包含与SEQ IDNO:48至少98%、至少99%、至少99.5%、至少99.8%或100%相同的启动子和/或与SEQ IDNO:50至少98%、至少99%、至少99.5%、至少99.8%或100%相同的增强子元件。在另一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:5或25至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列;并且该多核苷酸包含与SEQ ID NO:52至少98%、至少99%、至少99.5%、至少99.8%或100%相同的转录调节元件。
在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:7或27至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列;并且该多核苷酸包含与SEQ IDNO:48至少98%、至少99%、至少99.5%、至少99.8%或100%相同的启动子和/或与SEQ IDNO:50至少98%、至少99%、至少99.5%、至少99.8%或100%相同的增强子元件。在另一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:7或27至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列;并且该多核苷酸包含与SEQ ID NO:52至少98%、至少99%、至少99.5%、至少99.8%或100%相同的转录调节元件。
在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:10或30至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列;并且该多核苷酸包含与SEQID NO:48至少98%、至少99%、至少99.5%、至少99.8%或100%相同的启动子和/或与SEQID NO:50至少98%、至少99%、至少99.5%、至少99.8%或100%相同的增强子元件。在另一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:10或30至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列;并且该多核苷酸包含与SEQ ID NO:52至少98%、至少99%、至少99.5%、至少99.8%或100%相同的转录调节元件。
在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:14或34至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列;并且该多核苷酸包含与SEQID NO:48至少98%、至少99%、至少99.5%、至少99.8%或100%相同的启动子和/或与SEQID NO:50至少98%、至少99%、至少99.5%、至少99.8%或100%相同的增强子元件。在另一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:14或34至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列;并且该多核苷酸包含与SEQ ID NO:52至少98%、至少99%、至少99.5%、至少99.8%或100%相同的转录调节元件。
在一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:17或37至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列;并且该多核苷酸包含与SEQID NO:48至少98%、至少99%、至少99.5%、至少99.8%或100%相同的启动子和/或与SEQID NO:50至少98%、至少99%、至少99.5%、至少99.8%或100%相同的增强子元件。在另一个实施方案中,CFI核苷酸序列包含与SEQ ID NO:17或37至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列;并且该多核苷酸包含与SEQ ID NO:52至少98%、至少99%、至少99.5%、至少99.8%或100%相同的转录调节元件。
在一些实施方案中,转录调节元件包含普遍表达启动子。任选地,转录调节元件包含CAG启动子。任选地,转录调节元件包含与CAG启动子的核苷酸序列(例如SEQ ID NO:61)至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,本发明的多核苷酸包含与CAG启动子的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列,并且CFI核苷酸序列包含与SEQ ID NO:1或21的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,本发明的多核苷酸包含CAG启动子并且CFI核苷酸序列包含与SEQ ID NO:1或21的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。任选地,多核苷酸本发明包含CAG启动子并且CFI核苷酸序列包含SEQ ID NO:1或21的序列。
在一个实施方案中,本发明的多核苷酸包含土拨鼠肝炎转录后调节元件(WPRE)。例如,本发明的多核苷酸包含Zanta-Boussif等人(2009),Gene Therapy,16:605-619中描述的突变WPRE序列。在另一个实施方案中,本发明的多核苷酸不包含土拨鼠肝炎转录后调节元件(WPRE)。
在一个实施方案中,本发明的多核苷酸包含土拨鼠肝炎转录后调节元件或其变体。任选地,土拨鼠肝炎转录后调节元件与SEQ ID NO:62至64中的任一个至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。任选地,该多核苷酸包含土拨鼠肝炎转录后调节元件,其与SEQ ID NO62至64中的任一个至少98%、至少99%、至少99.5%、至少99.8%或100%相同。任选地,该多核苷酸包含土拨鼠肝炎转录后调节元件,其与SEQ ID NO:62至64中的任一个至少98%相同。任选地,该多核苷酸包含土拨鼠肝炎转录后调节元件,其具有SEQ ID NO:62至64中任一个的序列。任选地,该多核苷酸包含SEQ ID NO:62至64中任一个的土拨鼠肝炎转录后调节元件。任选地,多核苷酸包含土拨鼠肝炎转录后调节元件,其由SEQ ID NO:62至64中的任一个组成。
任选地,转录调节元件包含A1AT启动子的两个片段。任选地,A1AT启动子的第一个片段的长度为75到100个核苷酸,A1AT启动子的第二个片段的长度为25到50个核苷酸。任选地,多核苷酸包含与SEQ ID NO:66至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%或100%相同的启动子。
转录调节元件可以是这样的转录调节元件,其:
(a)促进比HCR-hAAT更高的表达;
(b)促进比FRE72更高的表达;
(c)包含hAAT序列元件;和/或
(d)包含AMBP序列元件。
TRE可以包含一个或多个启动子和/或增强子元件,例如选自hAAT序列元件、AMBP序列元件、ApoE-HCR1序列元件、ALDOB序列元件、CRM6序列元件和F2序列元件的启动子和/或增强子元件。例如,包含hAAT序列元件的多核苷酸是TRE。
在一个方面,TRE的长度大于500、大于600、大于700、大于800、大于900、大于1000、大于1100、大于1200、大于1300、大于1400、大于1500或大于1600个核苷酸。在一个方面,TRE的长度小于2000、小于1800、小于1600、小于1500、小于1400、小于1300、小于1200、小于1100、小于1000、小于900、小于800、小于700或小于600个核苷酸。在一个方面,TRE的长度为400至2000、500至1800、600至1400、800至1600、500至600、600至700、700至800、800至900、900至1000、1000至1100、1100至1200、1200至1300、1300至1400、1400至1500或1500至1600或1600至1700个核苷酸。
在一个实施方案中,TRE的长度为563至1628个核苷酸。在一个实施方案中,TRE的长度为563至583个核苷酸。在一个实施方案中,TRE的长度为566至586个核苷酸。在一个实施方案中,TRE的长度为888至908个核苷酸。在一个实施方案中,TRE的长度为893到913个核苷酸。在一个实施方案中,TRE的长度为897到917个核苷酸。在一个实施方案中,TRE的长度为899至919个核苷酸。在一个实施方案中,TRE的长度为903到923个核苷酸。在一个实施方案中,TRE的长度为905到925个核苷酸。在一个实施方案中,TRE的长度为909至929个核苷酸。在一个实施方案中,TRE的长度为913到933个核苷酸。在一个实施方案中,TRE的长度为923至943个核苷酸。在一个实施方案中,TRE的长度为933至953个核苷酸。在一个实施方案中,TRE的长度为1353到1373个核苷酸。在一个实施方案中,TRE的长度为1608到1628个核苷酸。在一个实施方案中,TRE的长度为1474至1494个核苷酸。
在一个实施方案中,TRE比FRE72长。在一个实施方案中,TRE比FRE72长至少450个、至少770个、至少1240个、至少1340个或至少1390个核苷酸。在一个实施方案中,TRE比HCR-hAAT短。在一个实施方案中,TRE比HCR-hAAT短至少160个核苷酸。在一个实施方案中,TRE比HCR-hAAT长。在一个实施方案中,TRE比HCR-hAAT长至少150、至少620、至少720或至少770个核苷酸。在一个实施方案中,TRE长于FRE72且短于HCR-hAAT。在一个实施方案中,TRE的长度超过898个核苷酸。在一个实施方案中,TRE的长度超过1363个核苷酸。
当确定TRE的长度时,本领域技术人员会理解应包括被认为是TRE一部分的所有核苷酸(例如对应于hAAT序列元件、AMBP序列元件、ApoE-HCR1、ALDOB序列元件、CRM6序列元件或F2序列元件的所有核苷酸应包括在内,并且对应于任何其他已知转录调节元件的核苷酸也应包括在内)。例如,如果构建体包含相同TRE的两个拷贝,则在计算长度时应包括两个拷贝。
特别地,当确定TRE的长度时,必须将多核苷酸的任何连续部分的核苷酸计入TRE的长度,前体是连续部分包含核苷酸序列,其:
(i)与SEQ ID NO:66-105中的任一个具有至少95%的序列同一性;
(ii)与任何已知启动子或增强子元件或任何已知启动子或增强子元件的片段具有至少95%的序列同一性;和/或
(iii)与任何已知的转录因子结合位点具有至少有95%的序列同一性。
在一个方面,TRE包含以下或由以下组成:
(a)与SEQ ID NO:68-91中的任一个具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%序列同一性的核苷酸序列;或
(b)SEQ ID NO:68-91中任一个的核苷酸序列。
在一个方面,TRE包含以下或由以下组成:
(a)与SEQ ID NO:70具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的序列同一性的核苷酸序列;或
(b)SEQ ID NO:70的核苷酸序列。
在一个方面,TRE包含以下或由以下组成:
(a)与SEQ ID NO:74具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的序列同一性的核苷酸序列;或
(b)SEQ ID NO:74的核苷酸序列。
在一个实施方案中,TRE包含与SEQ ID NO:68-91具有至少95%序列同一性的核苷酸序列或由其组成。在一个实施方案中,TRE包含与SEQ ID NO:70具有至少95%序列同一性的核苷酸序列或由其组成。在一个实施方案中,TRE包含与SEQ ID NO:74具有至少95%序列同一性的核苷酸序列或由其组成。
在一个实施方案中,TRE包含与SEQ ID NO:68-91具有至少98%序列同一性的核苷酸序列或由其组成。在一个实施方案中,TRE包含与SEQ ID NO:70具有至少98%序列同一性的核苷酸序列或由其组成。在一个实施方案中,TRE包含与SEQ ID NO:74具有至少98%序列同一性的核苷酸序列或由其组成。
HCR-hAAT是一种杂合TRE,其来源于人α-1-抗胰蛋白酶启动子和ApoE基因的增强子/肝基因座控制区(HCR)。FRE72是一种TRE,其仅包含hAAT启动子的核心区域。已显示HCR-hAAT和FRE72促进转基因在人肝细胞中的高水平表达,所述人肝细胞已经用病毒载体转导,所述病毒载体包含含有与所述转基因可操作地连接的HCR-hAAT或FRE72的表达盒。
在一个方面,TRE促进比HCR-hAAT更高的表达。HCR-hAAT是一种TRE,其在Miao等人,Mol Ther.2000;1(6):522-532中有更详细的描述,并且具有SEQ ID NO:67的序列。TRE可以促进与HCR-hAAT相比为1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍或至少3倍的表达。在一个实施方案中,TRE促进与HCR-hAAT相比为至少1.8倍的表达。
在一个方面,TRE促进与HCR-hAAT相比为1.2倍至3倍、1.5倍至3倍、1.8倍至3倍、2倍至3倍、2.5倍至3倍、1.2倍至5倍、1.5倍至5倍、1.8倍至5倍、2倍至5倍、2.5倍至5倍或3倍至5倍的表达。在一个实施方案中,TRE促进与HCR-hAAT相比为2至3倍的表达。
在一个方面,TRE促进比FRE72更高的表达。FRE72是一种启动子,其在WO2021/084277中有更详细的描述并具有SEQ ID NO:66的序列。TRE可以促进与FRE72相比为至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍或至少3倍的表达。在一个实施方案中,TRE促进与FRE72相比为至少1.8倍的表达。
在一个方面,TRE促进与FRE72相比为1.2倍至3倍、1.5倍至3倍、1.8倍至3倍、2倍至3倍、2.5倍至3倍、1.2倍至5倍、1.5倍至5倍、1.8倍至5倍、2倍至5倍、2.5倍至5倍或3倍至5倍的表达。在一个实施方案中,TRE促进与FRE72相比为2至3倍的表达。
技术人员将理解有许多合适的方法用于确定由TRE促进的表达水平。合适的表达测定在实施例和下文中描述。
任选地,表达通过包括以下的表达测定来测量:
(i)用包含表达盒的质粒转染人肝细胞,所述表达盒包含可操作地连接至TRE的转基因;
(ii)在适合发生转基因表达的条件下孵育转染的细胞;和
(iii)使用对转基因编码的蛋白质具有特异性的抗体通过ELISA测量转基因水平。
任选地,转基因编码野生型人CFI多肽。任选地,转染步骤(i)包括将质粒与转染试剂(例如
Figure BDA0004091717840000661
HD(Promega,目录号E2311)混合以形成转染混合物,并将转染混合物递送至肝细胞。任选地,肝细胞是Huh7细胞。转染人肝细胞的步骤可以是将人肝细胞与转染混合物孵育过夜的步骤。孵育转染的细胞的步骤可以是将转染的细胞在合适的生长条件下培养5天的步骤。测量转基因水平的步骤可包括在孵育转染的细胞的步骤之后收获由孵育转染的细胞的步骤产生的细胞和培养基。
任选地,转染步骤(i)包括用包含表达盒的质粒共转染人肝细胞,所述表达盒包含可操作地连接至启动子的编码萤光素酶的转基因,以及测量总萤光素酶表达。
通过ELISA测量转基因水平的步骤可以使用结合CFI的两种抗体使用夹心ELISA来进行(例如,根据制造商的说明使用CFI ELISA试剂盒(例如Hycult目录号HK355-01))。例如,可以将结合CFI的第一抗体固定到板上,并且可以将任选作为测量转基因水平的步骤的一部分收获的一部分细胞和培养基与固定在板上第一抗体一起施加至板。可以洗涤板,然后可以将结合CFI并与标记缀合的第二抗体施加至板。第二抗体可以与生物素缀合,生物素与链霉亲和素-过氧化物酶结合,并且在这种情况下,链霉亲和素-过氧化物酶充当标记。可以再次洗涤该板,并通过评估存在的标记的量来测量与该板结合的CFI的量。例如,如果标记是链霉亲和素-过氧化物酶,则可以添加与链霉亲和素-过氧化物酶反应的底物四甲基联苯胺(TMB)。加入草酸可终止酶反应。对于每个样品和标准品,可以使用分光光度计测量450nm处的吸光度。可以通过绘制吸光度(线性)针对人CFI标准品的相应浓度的图来获得标准曲线。然后可以从标准曲线确定样品中人CFI的浓度。
可以将测得的表达与使用不同(参考)TRE(例如HCR-hAAT或FRE72)时测得的表达进行比较。在这种情况下,使用参考TRE代替本发明的多核苷酸中的TRE(“测试”TRE)重复上述步骤(即,用户重复相同的步骤,但将参考TRE代替测试TRE***转染步骤(i)中使用的质粒)。
如上所述,转染步骤(i)可以包括用包含表达盒的质粒共转染人肝细胞,所述表达盒包含可操作地连接至启动子的编码萤光素酶的转基因,以及测量总萤光素酶表达。包含含有编码萤光素酶的转基因的表达盒的质粒可以与包含含有可操作地连接到TRE的转基因的表达盒的质粒相同(除了转基因不同并且TRE可能不同)。这允许用户标准化测量的表达以反映已被转染的细胞数量(从而考虑转染效率的差异),因为被载体转染的细胞比例(即转染效率)将与总萤光素酶表达成比例。在这种情况下,表达测定还包括检测总萤光素酶表达的步骤。任选地,萤光素酶可操作地连接至CMV启动子。
总萤光素酶表达可通过对任选作为测量转基因水平步骤的一部分收获的细胞的一部分进行萤光素酶测定来测量。可以通过使用发光计测量发光来测量总萤光素酶表达。例如,可以用磷酸缓冲盐水(PBS)洗涤细胞两次,然后用来自萤光素酶测定试剂盒(Promega目录号E1501/4530)的100μl萤光素酶裂解缓冲液处理。可以通过在Molecular DevicesSpextraMax i3x读板器上测量发光来测量萤光素酶表达。
任选地,表达测定包括通过用ELISA测量的转基因水平除以来自相应细胞的总萤光素酶表达来计算表达的标准化值。
任选地,TRE是肝脏特异性的。如果与一般的其他细胞相比,TRE在肝细胞中驱动更高水平的表达,则它是“肝脏特异性的”。例如,技术人员可以通过比较多核苷酸在肝细胞(例如Huh7细胞)中的表达与多核苷酸在来自其他组织的细胞(例如肾细胞,例如HEK293T细胞)中的表达来确定TRE是否是肝脏特异性的TRE。如果与来自其他组织的细胞相比,肝细胞中的表达水平更高,则TRE是肝脏特异性TRE。可选地,肝脏特异性TRE不会在非肝细胞中产生可观的表达水平。
在一个方面,TRE包含hAAT序列元件。hAAT序列元件是来源于人α-1-抗胰蛋白酶启动子(hAAT启动子)的多核苷酸。hAAT启动子的示例性序列如SEQ ID NO:94所示。
在一个实施方案中,TRE包含hAAT序列元件,其中hAAT序列元件包含SEQ ID NO:95或SEQ ID NO:95的在1、2或3个核苷酸上不同的变体的核苷酸序列。在一个实施方案中,TRE包含hAAT序列元件,其中hAAT序列元件包含核苷酸序列SEQ ID NO:95。在一个实施方案中,TRE包含hAAT序列元件,其中hAAT序列元件包含SEQ ID NO:96或SEQ ID NO:96的在1、2或3个核苷酸上不同的变体的核苷酸序列。在一个实施方案中,TRE包含hAAT序列元件,其中hAAT序列元件包含SEQ ID NO:96的核苷酸序列。
在一个实施方案中,TRE包含hAAT序列元件,其中hAAT序列元件包含与SEQ ID NO:94或SEQ ID NO:94的至少200、至少300或至少400个核苷酸长的片段至少80%、至少85%、至少90%、至少95%、至少98%或至少99%相同的核苷酸序列。在一个实施方案中,TRE包含hAAT序列元件,其中hAAT序列元件包含与SEQ ID NO:94至少98%相同的核苷酸序列。在一个实施方案中,TRE包含hAAT序列元件,其中hAAT序列元件包含SEQ ID NO:94的核苷酸序列。在一个实施方案中,TRE包含第二个hAAT序列元件。
在一个实施方案中,TRE包含第一和第二hAAT序列元件,其中第二hAAT序列元件在第一hAAT序列元件的5'和AMBP序列元件的5'。在一个实施方案中,第二hAAT序列元件包含SEQ ID NO:95或SEQ ID NO:95的在1、2或3个核苷酸上不同的变体的核苷酸序列。在一个实施方案中,第二hAAT序列元件包含SEQ ID NO:95的核苷酸序列。在实施方案中,第一hAAT序列元件包含SEQ ID NO:94,第二hAAT序列元件包含SEQ ID NO:95。
在一个方面,TRE包含AMBP序列元件。AMBP序列元件是来源于人α1-微球蛋白/bikunin增强子(AMBP增强子)的多核苷酸。Rouet等人,Journal of BiologicalChemistry,1992,267;20765-20773中进一步描述了AMBP增强子。AMBP增强子的示例性序列如SEQ ID NO:097所示。
在一个实施方案中,TRE包括AMBP序列元件,其中AMBP序列元件包括SEQ ID NO:98或SEQ ID NO:98的在1、2或3个核苷酸上不同的变体的核苷酸序列。在一个实施方案中,TRE包含AMBP序列元件,其中AMBP序列元件包含SEQ ID NO:98的核苷酸序列。在一个实施方案中,TRE包含AMBP序列元件,其中AMBP序列元件包含SEQ ID NO:97或SEQ ID NO:97的在1、2或3个核苷酸上不同的变体的核苷酸序列。在一个实施方案中,TRE包含AMBP序列元件,其中AMBP序列元件包含SEQ ID NO:97的核苷酸序列。
AMBP序列元件可包含一种或多种转录因子的结合位点。因此,在一个方面,AMBP序列元件包含至少一个选自以下的结合位点:HNF1-1结合位点、HNF4结合位点、HNF3a结合位点、HNF1-2结合位点和HNF3-2结合位点。在一个方面,TRE包含AMBP序列元件,其中AMBP序列元件包含至少两个选自以下的结合位点:HNF1-1结合位点、HNF4结合位点、HNF3a结合位点、HNF1-2结合位点和HNF3-2结合位点。在一个方面,TRE包含AMBP序列元件,其中AMBP序列元件包含至少三个选自以下的结合位点:HNF1-1结合位点、HNF4结合位点、HNF3a结合位点、HNF1-2结合位点和HNF3-2结合位点。在一个方面,TRE包含AMBP序列元件,其中AMBP序列元件包含至少四个选自以下的结合位点:HNF1-1结合位点、HNF4结合位点、HNF3a结合位点、HNF1-2结合位点和HNF3-2结合位点。在一个方面,TRE包含AMBP序列元件,其中AMBP序列元件包含HNF1-1结合位点、HNF4结合位点、HNF3a结合位点、HNF1-2结合位点和HNF3-2结合位点。
在一个方面,AMBP序列元件在hAAT序列元件的5’。任选地,AMBP序列元件在hAAT序列元件的5'的少于10个、少于8个或少于5个核苷酸处。任选地,AMBP序列元件紧邻hAAT序列元件的5'。
在一个方面,包含AMBP序列元件的TRE与缺乏AMBP序列元件的相应TRE相比促进相等或更高的表达。技术人员可以使用标题“表达测定”下描述的技术通过确定由包含AMBP序列元件的测试TRE和参考TRE促进的表达水平来确定包含AMBP序列元件的TRE(测试TRE)是否促进与不包含AMBP序列元件的第二TRE(参考TRE)相等或更高的表达。任选地,用户通过创建包含在HCR-hAAT的5'的测试AMBP序列元件的测试TRE并将测试TRE的表达水平与HCR-hAAT(参考TRE)的表达水平进行比较来确定包含AMBP序列元件(测试AMBP序列元件)的TRE是否促进与不包含AMBP序列元件的参考TRE相等或更高的表达。如果测试TRE的表达水平等于或高于HCR-hAAT的表达水平,则TRE促进与不包含AMBP序列元件的相应TRE相等或更高的表达。
在一个方面,TRE包含ApoE-HCR1序列元件。ApoE-HCR1序列元件是来源于ApoE基因的肝基因座控制区(HCR)的多核苷酸。ApoE-HCR1在Miao等人(2000),Molecular Therapy 1(6):522中有进一步描述。ApoE-HCR1的示例性序列如SEQ ID NO:92所示。
在一个实施方案中,TRE包含ApoE-HCR1序列元件,其中ApoE-HCR1序列元件包含SEQ ID NO:93或SEQ ID NO:93的在1、2或3个核苷酸上不同的变体的核苷酸序列。在一个实施方案中,TRE包含ApoE-HCR1序列元件,其中ApoE-HCR1序列元件包含SEQ ID NO:93的核苷酸序列。在一个实施方案中,TRE包含ApoE-HCR1序列元件,其中ApoE-HCR1序列元件包含SEQID NO:92或SEQ ID NO:92的在1、2或3个核苷酸上不同的变体的核苷酸序列。在一个实施方案中,TRE包含ApoE-HCR1序列元件,其中ApoE-HCR1序列元件包含SEQ ID NO:92的核苷酸序列。
在一个方面,ApoE-HCR1序列元件在hAAT序列元件的5’。任选地,ApoE-HCR1序列元件在hAAT序列元件的5'的少于10个、少于8个或少于5个核苷酸处。任选地,ApoE-HCR1序列元件紧邻hAAT序列元件的5'。在一个方面,ApoE-HCR1序列元件在AMBP序列元件的5’。任选地,ApoE-HCR1序列元件在AMBP序列元件的5'的少于10个、少于8个或少于5个核苷酸处。任选地,ApoE-HCR1序列元件紧邻AMBP序列元件的5'。在一个方面,ApoE-HCR1序列元件在AMBP序列元件的3’。任选地,ApoE-HCR1序列元件在AMBP序列元件的5'的少于10个、少于8个或少于5个核苷酸处。任选地,ApoE-HCR1序列元件紧邻AMBP序列元件的5'。在一个方面,ApoE-HCR1序列元件在hAAT序列元件和AMBP序列元件的5'。在一个方面,ApoE-HCR1序列元件在hAAT序列元件的5’和AMBP序列元件的3'。
在一个方面,包含ApoE-HCR1序列元件的TRE与缺乏ApoE-HCR1序列元件的相应TRE相比促进相等或更高的表达。技术人员可以使用标题“表达测定”下描述的技术通过确定由包含ApoE-HCR1的测试TRE和参考TRE促进的表达水平来确定包含ApoE-HCR1序列的TRE(测试TRE)是否促进与不包含ApoE-HCR1序列的第二TRE(参考TRE)相等或更高的表达。任选地,用户通过创建包含在hAAT的5'的测试ApoE-HCR1序列元件的测试TRE并将测试TRE的表达水平与hAAT(参考TRE)的表达水平进行比较来确定包含ApoE-HCR1序列元件(测试ApoE-HCR1序列元件)的TRE是否促进与不包含ApoE-HCR1序列元件的参考TRE相等或更高的表达。如果测试TRE的表达水平等于或高于hAAT的表达水平,则TRE促进与不包含ApoE-HCR1序列元件的相应TRE相等或更高的表达。
在一个方面,TRE包含CRM6序列元件。CRM6序列元件是来源于CRM6的多核苷酸。CRM6在Chuah等人,Molecular Therapy,2014,22;1605-1613中有更详细的描述。CRM6的示例性序列如SEQ ID NO:99所示。
在一个实施方案中,TRE包含CRM6序列元件,其中CRM6序列元件包含SEQ ID NO:100或SEQ ID NO:100的在1、2或3个核苷酸上不同的变体的核苷酸序列。在一个实施方案中,TRE包含CRM6序列元件,其中CRM6序列元件包含SEQ ID NO:100的核苷酸序列。在一个实施方案中,TRE包含CRM6序列元件,其中CRM6序列元件包含SEQ ID NO:101或SEQ ID NO:101的在1、2或3个核苷酸上不同的变体的核苷酸序列。在一个实施方案中,TRE包含CRM6序列元件,其中CRM6序列元件包含SEQ ID NO:101的核苷酸序列。在一个实施方案中,TRE包含CRM6序列元件,其中CRM6序列元件包含SEQ ID NO:99或SEQ ID NO:99的在1、2或3个核苷酸上不同的变体的核苷酸序列。在一个实施方案中,TRE包含CRM6序列元件,其中CRM6序列元件包含SEQ ID NO:99的核苷酸序列。
CRM6序列元件可包含一种或多种转录因子的结合位点。因此,在一个方面,CRM6序列元件包含至少一个选自Sp1结合位点、Sp2结合位点、HNF3A结合位点和HNF-1结合位点的结合位点。在一个方面,CRM6序列元件包含至少两个选自Sp1结合位点、Sp2结合位点、HNF3A结合位点和HNF-1结合位点的结合位点。在一个方面,CRM6序列元件包含至少三个选自Sp1结合位点、Sp2结合位点、HNF3A结合位点和HNF-1结合位点的结合位点。在一个方面,TRE包含CRM6序列元件,其中CRM6序列元件包含Sp1结合位点、Sp2结合位点、HNF3A结合位点和HNF-1结合位点。
在一个方面,CRM6序列元件在hAAT序列元件的5’。任选地,CRM6序列元件在hAAT序列元件的5’的少于10个、少于8个或少于5个核苷酸处。任选地,CRM6序列元件紧邻hAAT序列元件的5'。在一个方面,CRM6序列元件在AMBP序列元件的5’。任选地,CRM6序列元件在AMBP序列元件的5’的少于10个、少于8个或少于5个核苷酸处。任选地,CRM6序列元件紧邻AMBP序列元件的5'。在一个方面,CRM6序列元件在AMBP序列元件的3’。任选地,CRM6序列元件在AMBP序列元件的3’的少于10个、少于8个或少于5个核苷酸处。任选地,CRM6序列元件紧邻AMBP序列元件的3'。在一个方面,CRM6序列元件在hAAT序列元件和AMBP序列元件两者的5’。在一个方面,CRM6序列元件在hAAT序列元件的5’和AMBP序列元件的3'。
在一个方面,包含CRM6序列元件的TRE与缺乏CRM6序列元件的相应TRE相比促进相等或更高的表达。技术人员可以使用标题“表达测定”下描述的技术通过确定由包含CRM6序列元件的测试TRE和参考TRE促进的表达水平来确定包含CRM6序列元件的TRE(测试TRE)是否促进与不包含CRM6序列元件的第二TRE(参考TRE)相等或更高的表达。任选地,用户通过创建包含在HCR-hAAT的5'的测试CRM6序列元件的测试TRE并将测试TRE的表达水平与HCR-hAAT(参考TRE)的表达水平进行比较来确定包含CRM6序列元件(测试CRM6序列元件)的TRE是否促进与不包含CRM6序列元件的参考TRE相等或更高的表达。如果测试TRE的表达水平等于或高于HCR-hAAT的表达水平,则TRE促进与不包含CRM6序列元件的相应TRE相等或更高的表达。
在一个方面,TRE包含ALDOB序列元件。ALDOB序列元件是来源于醛缩酶B基因的增强子的多核苷酸。ALDOB增强子在Gregori2002和Patwardhan等人2012中有更详细的描述。ALDOB的示例性序列如SEQ ID NO:102所示。
在一个实施方案中,TRE包含ALDOB序列元件,其中ALDOB序列元件包含SEQ ID NO:103或SEQ ID NO:103的在1、2或3个核苷酸上不同的变体的核苷酸序列。在一个实施方案中,TRE包含ALDOB序列元件,其中ALDOB序列元件包含SEQ ID NO:103的核苷酸序列。在一个实施方案中,TRE包含ALDOB序列元件,其中ALDOB序列元件包含SEQ ID NO:102或SEQ IDNO:102的在1、2或3个核苷酸上不同的变体的核苷酸序列。在一个实施方案中,TRE包含ALDOB序列元件,其中ALDOB序列元件包含SEQ ID NO:102的核苷酸序列。
ALDOB序列元件可包含一种或多种转录因子的结合位点。因此,在一个方面,ALDOB序列元件包含至少一个选自以下的结合位点:SP1结合位点、HNF1-a结合位点、C/EBP结合位点、GATA2结合位点、USF1结合位点和USF2结合位点。在一个方面,ALDOB序列元件包含至少两个选自以下的结合位点:SP1结合位点、HNF1-a结合位点、C/EBP结合位点、GATA2结合位点、USF1结合位点和USF2结合位点。在一个方面,ALDOB序列元件包含至少三个选自以下的结合位点:SP1结合位点、HNF1-a结合位点、C/EBP结合位点、GATA2结合位点、USF1结合位点和USF2结合位点。在一个方面,ALDOB序列元件包含至少四个选自以下的结合位点:SP1结合位点、HNF1-a结合位点、C/EBP结合位点、GATA2结合位点、USF1结合位点和USF2结合位点。在一个方面,ALDOB序列元件包含至少五个选自以下的结合位点:SP1结合位点、HNF1-a结合位点、C/EBP结合位点、GATA2结合位点、USF1结合位点和USF2结合位点。在一个方面,ALDOB序列元件包含至少一个SP1结合位点、至少一个HNF1-a结合位点、至少一个C/EBP结合位点、至少一个GATA2结合位点、至少一个USF1结合位点以及至少一个USF2结合位点。
在一个方面,ALDOB序列元件在hAAT序列元件的5’。任选地,ALDOB序列元件在hAAT序列元件的5’的少于10个、少于8个或少于5个核苷酸处。任选地,ALDOB序列元件紧邻hAAT序列元件的5'。在一个方面,ALDOB序列元件在AMBP序列元件的5’。任选地,ALDOB序列元件在AMBP序列元件的5’的少于10个、少于8个或少于5个核苷酸处。任选地,ALDOB序列元件紧邻AMBP序列元件的5'。在一个方面,ALDOB序列元件在AMBP序列元件的3’。任选地,ALDOB序列元件在AMBP序列元件的3’的少于10个、少于8个或少于5个核苷酸处。任选地,ALDOB序列元件紧邻AMBP序列元件的3'。在一个方面,ALDOB序列元件在hAAT序列元件和AMBP序列元件的5'。在一个方面,ALDOB序列元件在hAAT序列元件的5’和AMBP序列元件的3'。
在一个方面,包含ALDOB序列元件的TRE与缺乏ALDOB序列元件的相应TRE相比促进相等或更高的表达。技术人员可以使用标题“表达测定”下描述的技术通过确定由包含AMBP序列的测试TRE和参考TRE促进的表达水平来确定包含ALDOB序列元件的TRE(测试TRE)是否促进与不包含ALDOB序列元件的第二TRE(参考TRE)相等或更高的表达。任选地,用户通过创建包含在HCR-hAAT的5'的测试ALDOB序列元件的测试TRE并将测试TRE的表达水平与HCR-hAAT(参考TRE)的表达水平进行比较来确定包含ALDOB序列元件(测试ALDOB序列元件)的TRE是否促进与不包含ALDOB序列元件的参考TRE相等或更高的表达。如果测试TRE的表达水平等于或高于HCR-hAAT的表达水平,则TRE促进与不包含ALDOB序列元件的相应TRE相等或更高的表达。
在一个方面,TRE包含F2序列元件。F2序列元件是来源于凝血酶原基因增强子的多核苷酸。凝血酶原增强子的示例性序列如SEQ ID NO:104所示。
在一个实施方案中,TRE包含F2序列元件,其中F2序列元件包含SEQ ID NO:105或SEQ ID NO:105的在1、2或3个核苷酸上不同的变体的核苷酸序列。在一个实施方案中,TRE包含F2序列元件,其中F2序列元件包含SEQ ID NO:105的核苷酸序列。在一个实施方案中,TRE包含F2序列元件,其中F2序列元件包含SEQ ID NO:104或SEQ ID NO:104的在1、2或3个核苷酸上不同的变体的核苷酸序列。在一个实施方案中,TRE包含F2序列元件,其中F2序列元件包含SEQ ID NO:104的核苷酸序列。
F2序列元件可包含一种或多种转录因子的结合位点。因此,在一个方面,F2序列元件包含至少一个选自以下的结合位点:HNF4a结合位点、HNF3a结合位点、HNF1a结合位点、HNF3b结合位点、STAT3结合位点、RBPJ结合位点和SP3结合位点。在一个方面,F2序列元件包含至少两个选自以下的结合位点:HNF4a结合位点、HNF3a结合位点、HNF1a结合位点、HNF3b结合位点、STAT3结合位点、RBPJ结合位点和SP3结合位点。在一个方面,F2序列元件包含至少三个选自以下的结合位点:HNF4a结合位点、HNF3a结合位点、HNF1a结合位点、HNF3b结合位点、STAT3结合位点、RBPJ结合位点和SP3结合位点。在一个方面,F2序列元件包含至少四个选自以下的结合位点:HNF4a结合位点、HNF3a结合位点、HNF1a结合位点、HNF3b结合位点、STAT3结合位点、RBPJ结合位点和SP3结合位点。在一个方面,F2序列元件包含至少五个选自以下的结合位点:HNF4a结合位点、HNF3a结合位点、HNF1a结合位点、HNF3b结合位点、STAT3结合位点、RBPJ结合位点和SP3结合位点。在一个方面,F2序列元件包含至少六个选自以下的结合位点:HNF4a结合位点、HNF3a结合位点、HNF1a结合位点、HNF3b结合位点、STAT3结合位点、RBPJ结合位点和SP3结合位点。在一个方面,TRE包含F2序列元件,其中F2序列元件包含HNF4a结合位点、HNF3a结合位点、HNF1a结合位点、HNF3b结合位点、STAT3结合位点、RBPJ结合位点和SP3结合位点。
在一个方面,F2序列元件在hAAT序列元件的5’。任选地,F2序列元件在hAAT序列元件的5’的少于10个、少于8个或少于5个核苷酸处。任选地,F2序列元件紧邻hAAT序列元件的5'。在一个方面,F2序列元件在AMBP序列元件的5’。任选地,F2序列元件在AMBP序列元件的5’的少于10个、少于8个或少于5个核苷酸处。任选地,F2序列元件紧邻AMBP序列元件的5'。在一个方面,F2序列元件在AMBP序列元件的3’。任选地,F2序列元件在AMBP序列元件的3’的少于10个、少于8个或少于5个核苷酸处。任选地,F2序列元件紧邻AMBP序列元件的5'。在一个方面,F2序列元件在hAAT序列元件和AMBP序列元件两者的5’。在一个方面,F2序列元件在hAAT序列元件的5’和AMBP序列元件的3'。
在一个方面,包含F2序列元件的TRE与缺乏F2序列元件的相应TRE相比促进相等或更高的表达。技术人员可以使用标题“表达测定”下描述的技术通过确定由包含F2序列元件的测试TRE和参考TRE促进的表达水平来确定包含F2序列元件的TRE(测试TRE)是否促进与不包含F2序列元件的第二TRE(参考TRE)相等或更高的表达。任选地,用户通过创建包含在HCR-hAAT的5'的测试F2序列元件的测试TRE并将测试TRE的表达水平与HCR-hAAT(参考TRE)的表达水平进行比较来确定包含F2序列元件(测试F2序列元件)的TRE是否促进与不包含F2序列元件的参考TRE相等或更高的表达。如果测试TRE的表达水平等于或高于HCR-hAAT的表达水平,则TRE促进与不包含F2序列元件的相应TRE相等或更高的表达。
在一个实施方案中,TRE(例如NP1)包括:
(i)AMBP序列元件;和
(ii)hAAT序列元件,
其中:
(i)AMBP序列元件包含SEQ ID NO:97的核苷酸序列;
(ii)hAAT序列元件包含SEQ ID NO:94的核苷酸序列;
(iii)AMBP序列元件在hAAT序列元件的5’;和
(iv)TRE的长度为550到600个核苷酸。
在一个实施方案中,TRE(例如NP2)包括:
(i)AMBP序列元件;
(ii)hAAT序列元件;和
(iii)ApoE-HCR1序列元件,
其中:
(i)AMBP序列元件包含SEQ ID NO:97的核苷酸序列;
(ii)hAAT序列元件包含SEQ ID NO:94的核苷酸序列;
(iii)ApoE-HCR1序列元件包含SEQ ID NO:92的核苷酸序列;
(iv)AMBP序列元件在hAAT序列元件的5’;
(v)ApoE-HCR1序列元件在AMBP序列元件和hAAT序列元件两者的5';和
(vi)TRE的长度为875到925个核苷酸。
在一个实施方案中,TRE(例如NP3)包括:
(i)AMBP序列元件;
(ii)hAAT序列元件;和
(iii)ApoE-HCR1序列元件,
其中:
(i)AMBP序列元件包含SEQ ID NO:97的核苷酸序列;
(ii)hAAT序列元件包含SEQ ID NO:94的核苷酸序列;
(iii)ApoE-HCR1序列元件包含SEQ ID NO:92的核苷酸序列;
(iv)AMBP序列元件在hAAT序列元件的5’;
(v)ApoE-HCR1序列元件在hAAT序列元件的5'和AMBP序列元件的3';和
(vi)TRE的长度为875到925个核苷酸。
在一个实施方案中,TRE(例如NP4)包括:
(i)AMBP序列元件;
(ii)hAAT序列元件;和
(iii)F2序列元件,
其中:
(i)AMBP序列元件包含SEQ ID NO:97的核苷酸序列;
(ii)hAAT序列元件包含长度为300和350个核苷酸的SEQ ID NO:94的片段;
(iii)hAAT序列元件包含SEQ ID NO:95的核苷酸序列;
(iv)F2序列元件包含SEQ ID NO:104的核苷酸序列;
(v)AMBP序列元件在hAAT序列元件的5’;
(vi)F2序列元件在AMBP序列元件和hAAT序列元件两者的5’;和
(vii)TRE的长度为550到600个核苷酸。
在一个实施方案中,TRE(例如NP5)包括:
(i)AMBP序列元件;
(ii)hAAT序列元件;
(iii)ApoE-HCR1序列元件;
(iv)CRM6序列元件;和
(v)ALDOB序列元件,
其中:
(i)AMBP序列元件包含SEQ ID NO:97的核苷酸序列;
(ii)hAAT序列元件包含SEQ ID NO:94的核苷酸序列;
(iii)ApoE-HCR1序列元件包含SEQ ID NO:92的核苷酸序列;
(iv)CRM6序列元件包含SEQ ID NO:99的核苷酸序列;
(v)ALDOB序列元件包含SEQ ID NO:102的核苷酸序列;
(vi)AMBP序列元件在hAAT序列元件的5’;
(vii)ApoE-HCR1序列元件在AMBP序列元件和hAAT序列元件两者的5’;
(viii)CRM6序列元件在AMBP序列元件、hAAT序列元件、ApoE-HCR1序列元件的5';
(ix)ALDOB序列元件在hAAT序列元件的5’和AMBP序列元件的3';和
(x)TRE的长度为1600到1650个核苷酸。
在一个实施方案中,TRE(例如NP6)包括:
(i)AMBP序列元件;
(ii)第一hAAT序列元件;
(iii)第二hAAT序列元件;
(iv)F2序列元件;和
(v)ALDOB序列元件,
其中:
(i)AMBP序列元件包含SEQ ID NO:97的核苷酸序列;
(ii)hAAT序列元件包含SEQ ID NO:94的核苷酸序列;
(iii)第二hAAT序列元件包含SEQ ID NO:95的核苷酸序列;
(iv)F2序列元件包含SEQ ID NO:104的核苷酸序列;
(v)ALDOB序列元件包含SEQ ID NO:102的核苷酸序列;
(vi)AMBP序列元件在hAAT序列元件的5’;
(vii)第二hAAT序列元件在AMBP序列元件和hAAT序列元件两者的5’;
(viii)F2序列元件在AMBP序列元件、hAAT序列元件和第二hAAT序列元件的5';
(ix)ALDOB序列元件在hAAT序列元件、AMBP序列元件、第二hAAT序列元件和F2序列元件的5';和
(x)TRE的长度为1350到1400个核苷酸。
在一个实施方案中,TRE(例如NP7)包括:
(i)AMBP序列元件;
(ii)hAAT序列元件;
(iii)ApoE-HCR1序列元件;和
(iv)ALDOB序列元件,
其中:
(i)AMBP序列元件包含SEQ ID NO:97的核苷酸序列;
(ii)hAAT序列元件包含SEQ ID NO:94的核苷酸序列;
(iii)ApoE-HCR1序列元件包含SEQ ID NO:92的核苷酸序列;
(iv)ALDOB序列元件包含SEQ ID NO:102的核苷酸序列;
(v)AMBP序列元件在hAAT序列元件的5’;
(vi)ApoE-HCR1序列元件在AMBP序列元件和hAAT序列元件两者的5’;
(vii)ALDOB序列元件在hAAT序列元件、AMBP序列元件和ApoE-HCR1序列元件的5';和
(viii)TRE的长度为1450到1500个核苷酸。
转录因子结合位点是转录因子可以结合的核苷酸序列。转录因子与转录因子结合位点的结合可导致包含所述结合位点的多核苷酸的表达水平发生变化。表1提供了几个转录因子结合位点的示例性序列,但本领域技术人员会理解该列表并非详尽无遗,并且转录因子可能结合替代位点。
Figure BDA0004091717840000811
/>
Figure BDA0004091717840000821
在一个方面,TRE包含一个或多个转录因子结合位点。在一个方面,TRE包括
a)TATA盒子;
b)HNF6结合位点;
c)HNF4a结合位点;
d)HNF1结合位点;和/或
e)HNF3结合位点。
在一个方面,TRE包含TATA盒,任选地是经典TATA盒,任选地其中TRE包含hAAT序列元件并且TATA盒被***到hAAT序列元件中。
经典TATA盒是富含AT的核苷酸序列,能够结合TATA结合蛋白(TBP),其包含核苷酸序列TATA,例如TATAAAA(SEQ ID NO:200)是经典TATA盒。非经典TATA盒是富含AT的核苷酸序列,能够结合TATA结合蛋白(TBP),其不包含核苷酸序列TATA,例如TTAAATA(SEQ ID NO:201)。hAAT序列元件可包含非经典TATA盒。TRE可包含hAAT序列元件,其中hAAT序列元件包含非经典TATA盒。
hAAT序列元件可以包含SEQ ID NO:95或SEQ ID NO:95的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且TATA盒可以在SEQ ID NO:95或SEQ ID NO:95的变体的核苷酸序列的3'。hAAT序列元件可以包含SEQ ID NO:95或SEQ ID NO:95的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且TATA盒可以在SEQ ID NO:95或SEQ ID NO:95的变体的核苷酸序列的5'。
与不包含TATA盒的相应TRE相比,TRE可以促进相等或更高的表达。
在一个方面,包含TATA盒的TRE与缺乏TATA盒的相应TRE相比促进相等或更高的表达。技术人员可以使用标题“表达测定”下描述的技术通过确定由包含TATA盒的测试TRE和参考TRE促进的表达水平来确定包含TATA盒的TRE(测试TRE)是否促进与不包含TATA盒的第二TRE(参考TRE)相等或更高的表达。任选地,用户通过创建包含在HCR-hAAT的5'的测试TATA盒的测试TRE并将测试TRE的表达水平与HCR-hAAT(参考TRE)的表达水平进行比较来确定包含TATA盒(测试TATA盒)的TRE是否促进与不包含TATA盒的参考TRE相等或更高的表达。如果测试TRE的表达水平等于或高于HCR-hAAT的表达水平,则TRE促进与不包含TATA盒的相应TRE相等或更高的表达。
在一个方面,TRE包含HNF6结合位点。任选地,HNF6结合位点具有SEQ ID NO:156或157的核苷酸序列。
在一个方面,TRE包含HNF6结合位点,并且:
a.TRE包含hAAT序列元件,其包含SEQ ID NO:95或SEQ ID NO:95的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF6结合位点在包含SEQ ID NO:95或SEQ ID NO:95的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的5’;和/或
b.TRE包含hAAT序列元件,其包含SEQ ID NO:96或SEQ ID NO:96的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF6结合位点在包含SEQ ID NO:96或SEQ ID NO:96的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的5’;和/或
c.TRE包含hAAT序列元件,其包含SEQ ID NO:94或SEQ ID NO:94的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF6结合位点在包含SEQ ID NO:94或SEQ ID NO:94的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的5’;和/或
d.TRE包含hAAT序列元件,其包含SEQ ID NO:95或SEQ ID NO:95的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF6结合位点在包含SEQ ID NO:95或SEQ ID NO:95的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的3’;和/或
e.TRE包含hAAT序列元件,其包含SEQ ID NO:96或SEQ ID NO:96的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF6结合位点在包含SEQ ID NO:96或SEQ ID NO:96的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的3’;和/或
f.TRE包含hAAT序列元件,其包含SEQ ID NO:94或SEQ ID NO:94的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF6结合位点在包含SEQ ID NO:94或SEQ ID NO:94的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的3’;和/或
g.TRE包含ApoE-HCR1序列元件,其包含SEQ ID NO:93或SEQ ID NO:93的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF6结合位点在包含SEQ ID NO:93或SEQ IDNO:93的在1、2或3个核苷酸上不同的变体的核苷酸序列的ApoE-HCR1序列元件的3’;和/或
h.TRE包含ApoE-HCR1序列元件,其包含SEQ ID NO:92或SEQ ID NO:92的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF6结合位点在包含SEQ ID NO:92或SEQ IDNO:92的在1、2或3个核苷酸上不同的变体的核苷酸序列的ApoE-HCR1序列元件的3’;和/或
i.TRE包含ApoE-HCR1序列元件,其包含SEQ ID NO:93或SEQ ID NO:93的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF6结合位点在包含SEQ ID NO:93或SEQ IDNO:93的在1、2或3个核苷酸上不同的变体的核苷酸序列的ApoE-HCR1序列元件的5’;和/或
j.TRE包含ApoE-HCR1序列元件,其包含SEQ ID NO:92或SEQ ID NO:92的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF6结合位点在包含SEQ ID NO:92或SEQ IDNO:92的在1、2或3个核苷酸上不同的变体的核苷酸序列的ApoE-HCR1序列元件的5’;和/或
k.TRE包含AMBP序列元件,其包含SEQ ID NO:98或SEQ ID NO:98的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF6结合位点在包含SEQ ID NO:98或SEQ ID NO:98的在1、2或3个核苷酸上不同的变体的核苷酸序列的AMBP序列元件的3’;和/或
l.TRE包含AMBP序列元件,其包含SEQ ID NO:97或SEQ ID NO:97的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF6结合位点在包含SEQ ID NO:97或SEQ ID NO:97的在1、2或3个核苷酸上不同的变体的核苷酸序列的AMBP序列元件的3’;和/或
m.TRE包含AMBP序列元件,其包含SEQ ID NO:98或SEQ ID NO:98的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF6结合位点在包含SEQ ID NO:98或SEQ ID NO:98的在1、2或3个核苷酸上不同的变体的核苷酸序列的AMBP序列元件的5’;和/或
n.TRE包含AMBP序列元件,其包含SEQ ID NO:97或SEQ ID NO:97的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF6结合位点在包含SEQ ID NO:97或SEQ ID NO:97的在1、2或3个核苷酸上不同的变体的核苷酸序列的AMBP序列元件的5’。
TRE可以促进与不包含HNF6结合位点的相应TRE相等或更高的表达。
在一个方面,包含HNF6结合位点的TRE与缺乏HNF6结合位点的相应TRE促进相等或更高的表达。技术人员可以使用标题“表达测定”下描述的技术通过确定由包含HNF6结合位点的测试TRE和参考TRE促进的表达水平来确定包含HNF6结合位点的TRE(测试TRE)是否促进与不包含HNF6结合位点的第二TRE(参考TRE)相等或更高的表达。任选地,用户通过创建包含在HCR-hAAT的5'的测试HNF6结合位点的测试TRE并将测试TRE的表达水平与HCR-hAAT(参考TRE)的表达水平进行比较来确定包含HNF6结合位点(测试HNF6结合位点)的TRE是否促进与不包含HNF6结合位点的参考TRE相等或更高的表达。如果测试TRE的表达水平等于或高于HCR-hAAT的表达水平,则TRE促进与不包含HNF6结合位点的相应TRE相等或更高的表达。
包含HNF6结合位点和TATA盒的TRE可以促进与不包含HNF6结合位点和TATA盒的相应TRE相等或更高的表达。
在一个方面,TRE进一步包含HNF4a结合位点。任选地,HNF4a结合位点具有SEQ IDNO:151-154中任一个的核苷酸序列。
在一个方面,TRE包含HNF4a结合位点,并且:
a.TRE包含hAAT序列元件,其包含SEQ ID NO:95或SEQ ID NO:95的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF4a结合位点在包含SEQ ID NO:95或SEQ ID NO:95的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的5’;和/或
b.TRE包含hAAT序列元件,其包含SEQ ID NO:96或SEQ ID NO:96的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF4a结合位点在包含SEQ ID NO:96或SEQ ID NO:96的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的5’;和/或
c.TRE包含hAAT序列元件,其包含SEQ ID NO:94或SEQ ID NO:94的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF4a结合位点在包含SEQ ID NO:94或SEQ ID NO:94的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的5’;和/或
d.TRE包含ApoE-HCR1序列元件,其包含SEQ ID NO:93或SEQ ID NO:93的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF4a结合位点在包含SEQ ID NO:93或SEQ IDNO:93的在1、2或3个核苷酸上不同的变体的核苷酸序列的ApoE-HCR1序列元件的3’;和/或
e.TRE包含ApoE-HCR1序列元件,其包含SEQ ID NO:93或SEQ ID NO:93的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF4a结合位点在包含SEQ ID NO:93或SEQ IDNO:93的在1、2或3个核苷酸上不同的变体的核苷酸序列的ApoE-HCR1序列元件的5’;和/或
f.TRE包含ApoE-HCR1序列元件,其包含SEQ ID NO:92或SEQ ID NO:92的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF4a结合位点在包含SEQ ID NO:92或SEQ IDNO:92的在1、2或3个核苷酸上不同的变体的核苷酸序列的ApoE-HCR1序列元件的5’;和/或
g.TRE包含AMBP序列元件,其包含SEQ ID NO:98或SEQ ID NO:98的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF4a结合位点在包含SEQ ID NO:98或SEQ ID NO:98的在1、2或3个核苷酸上不同的变体的核苷酸序列的AMBP序列元件的3’;和/或
h.TRE包含AMBP序列元件,其包含SEQ ID NO:97或SEQ ID NO:97的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF4a结合位点在包含SEQ ID NO:97或SEQ ID NO:97的在1、2或3个核苷酸上不同的变体的核苷酸序列的AMBP序列元件的3’;和/或
i.TRE包含AMBP序列元件,其包含SEQ ID NO:98或SEQ ID NO:98的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF4a结合位点在包含SEQ ID NO:98或SEQ ID NO:98的在1、2或3个核苷酸上不同的变体的核苷酸序列的AMBP序列元件的5’;和/或
j.TRE包含AMBP序列元件,其包含SEQ ID NO:97或SEQ ID NO:97的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF4a结合位点在包含SEQ ID NO:97或SEQ ID NO:97的在1、2或3个核苷酸上不同的变体的核苷酸序列的AMBP序列元件的5’。
TRE可以促进与不包含HNF4a结合位点的相应TRE相等或更高的表达。
在一个方面,包含HNF4a结合位点的TRE比缺乏HNF4a结合位点的相应TRE促进相等或更高的表达。技术人员可以使用标题“表达测定”下描述的技术通过确定由包含HNF4a结合位点的测试TRE和参考TRE促进的表达水平来确定包含HNF4a结合位点的TRE(测试TRE)是否促进与不包含HNF4a结合位点的第二TRE(参考TRE)相等或更高的表达。任选地,用户通过创建包含在HCR-hAAT的5'的测试HNF4a结合位点的测试TRE并将测试TRE的表达水平与HCR-hAAT(参考TRE)的表达水平进行比较来确定包含HNF4a结合位点(测试HNF4a结合位点)的TRE是否促进与不包含HNF4a结合位点的参考TRE相等或更高的表达。如果测试TRE的表达水平等于或高于HCR-hAAT的表达水平,则TRE促进与不包含HNF4a结合位点的相应TRE相等或更高的表达。
包含HNF6结合位点和HNF4a结合位点的TRE可以促进与不包含HNF6结合位点和HNF4a结合位点的相应TRE相等或更高的表达。
在一个方面,TRE进一步包含HNF1结合位点。任选地,HNF1结合位点具有SEQ IDNO:133或134的核苷酸序列。
在一个方面,TRE包含HNF1结合位点,并且:
a.TRE包含hAAT序列元件,其包含SEQ ID NO:95或SEQ ID NO:95的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF1结合位点在包含SEQ ID NO:95或SEQ ID NO:95的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的5’;和/或
b.TRE包含hAAT序列元件,其包含SEQ ID NO:96或SEQ ID NO:96的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF1结合位点在包含SEQ ID NO:96或SEQ ID NO:96的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的5’;和/或
c.TRE包含hAAT序列元件,其包含SEQ ID NO:94或SEQ ID NO:94的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF1结合位点在包含SEQ ID NO:94或SEQ ID NO:94的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的5’;和/或
d.TRE包含ApoE-HCR1序列元件,其包含SEQ ID NO:93或SEQ ID NO:93的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF1结合位点在包含SEQ ID NO:93或SEQ IDNO:93的在1、2或3个核苷酸上不同的变体的核苷酸序列的ApoE-HCR1序列元件的3’;和/或
e.TRE包含ApoE-HCR1序列元件,其包含SEQ ID NO:92或SEQ ID NO:92的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF1结合位点在包含SEQ ID NO:92或SEQ IDNO:92的在1、2或3个核苷酸上不同的变体的核苷酸序列的ApoE-HCR1序列元件的3’;和/或
f.TRE包含AMBP序列元件,其包含SEQ ID NO:98或SEQ ID NO:98的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF1结合位点在包含SEQ ID NO:98或SEQ ID NO:98的在1、2或3个核苷酸上不同的变体的核苷酸序列的AMBP序列元件的3’;和/或
g.TRE包含AMBP序列元件,其包含SEQ ID NO:97或SEQ ID NO:97的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF1结合位点在包含SEQ ID NO:97或SEQ ID NO:97的在1、2或3个核苷酸上不同的变体的核苷酸序列的AMBP序列元件的3’。
TRE可以促进与不包含HNF1结合位点的相应TRE相等或更高的表达。
在一个方面,包含HNF1结合位点的TRE与缺乏HNF1结合位点的相应TRE促进相等或更高的表达。技术人员可以使用标题“表达测定”下描述的技术通过确定由包含HNF1结合位点的测试TRE和参考TRE促进的表达水平来确定包含HNF1结合位点的TRE(测试TRE)是否促进与不包含HNF1结合位点的第二TRE(参考TRE)相等或更高的表达。任选地,用户通过创建包含在HCR-hAAT的5'的测试HNF1结合位点的测试TRE并将测试TRE的表达水平与HCR-hAAT(参考TRE)的表达水平进行比较来确定包含HNF1结合位点(测试HNF1结合位点)的TRE是否促进与不包含HNF1结合位点的参考TRE相等或更高的表达。如果测试TRE的表达水平等于或高于HCR-hAAT的表达水平,则TRE促进与不包含HNF1结合位点的相应TRE相等或更高的表达。
包含HNF6结合位点、HNF4a结合位点和TATA盒的TRE可以促进与不包含HNF6结合位点、HNF4a结合位点和TATA盒的相应TRE相等或更高的表达。
在一个方面,TRE进一步包含HNF3结合位点。任选地,HNF3结合位点具有SEQ IDNO:142-144中任一个的核苷酸序列。
在一个方面,TRE包含HNF3结合位点,并且:
a.TRE包含hAAT序列元件,其包含SEQ ID NO:95或SEQ ID NO:95的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF3结合位点在包含SEQ ID NO:95或SEQ ID NO:95的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的5’;和/或
b.TRE包含hAAT序列元件,其包含SEQ ID NO:96或SEQ ID NO:96的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF3结合位点在包含SEQ ID NO:96或SEQ ID NO:96的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的5’;和/或
c.TRE包含hAAT序列元件,其包含SEQ ID NO:94或SEQ ID NO:94的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF3结合位点在包含SEQ ID NO:94或SEQ ID NO:94的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的5’;和/或
d.TRE包含ApoE-HCR1序列元件,其包含SEQ ID NO:93或SEQ ID NO:93的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF3结合位点在包含SEQ ID NO:93或SEQ IDNO:93的在1、2或3个核苷酸上不同的变体的核苷酸序列的ApoE-HCR1序列元件的3’;和/或
e.TRE包含ApoE-HCR1序列元件,其包含SEQ ID NO:92或SEQ ID NO:92的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF3结合位点在包含SEQ ID NO:92或SEQ IDNO:92的在1、2或3个核苷酸上不同的变体的核苷酸序列的ApoE-HCR1序列元件的3’;和/或
f.TRE包含AMBP序列元件,其包含SEQ ID NO:98或SEQ ID NO:98的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF3结合位点在包含SEQ ID NO:98或SEQ ID NO:98的在1、2或3个核苷酸上不同的变体的核苷酸序列的AMBP序列元件的3’;和/或
g.TRE包含AMBP序列元件,其包含SEQ ID NO:97或SEQ ID NO:97的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF3结合位点在包含SEQ ID NO:97或SEQ ID NO:97的在1、2或3个核苷酸上不同的变体的核苷酸序列的AMBP序列元件的3’。
TRE可以促进与不包含HNF3结合位点的相应TRE相等或更高的表达。
在一个方面,包含HNF3结合位点的TRE与缺乏HNF3结合位点的相应TRE促进相等或更高的表达。技术人员可以使用标题“表达测定”下描述的技术通过确定由包含HNF3结合位点的测试TRE和参考TRE促进的表达水平来确定包含HNF3结合位点的TRE(测试TRE)是否促进与不包含HNF3结合位点的第二TRE(参考TRE)相等或更高的表达。任选地,用户通过创建包含在HCR-hAAT的5'的测试HNF3结合位点的测试TRE并将测试TRE的表达水平与HCR-hAAT(参考TRE)的表达水平进行比较来确定包含HNF3结合位点(测试HNF3结合位点)的TRE是否促进与不包含HNF3结合位点的参考TRE相等或更高的表达。如果测试TRE的表达水平等于或高于HCR-hAAT的表达水平,则TRE促进与不包含HNF3结合位点的相应TRE相等或更高的表达。
包含HNF3结合位点和TATA盒的TRE并且TRE可以促进与不包含HNF3结合位点和TATA盒的相应TRE相等或更高的表达。
在一个实施方案中,TRE包括:
(i)AMBP序列元件;
(ii)hAAT序列元件;
(iii)ApoE-HCR1序列元件;
(iv)转录起始位点(TSS);和
(v)TATA盒,
其中:
(i)AMBP序列元件包含SEQ ID NO:97的核苷酸序列;
(ii)hAAT序列元件包含SEQ ID NO:94的核苷酸序列;
(iii)ApoE-HCR1序列元件包含SEQ ID NO:92的核苷酸序列;
(iv)AMBP序列元件在hAAT序列元件的5’;
(v)ApoE-HCR1序列元件在hAAT序列元件的5'和AMBP序列元件的3';
(vi)TATA盒位于距离TSS的-37位置;和
(vii)TRE的长度为875到925个核苷酸。
在一个实施方案中,TRE包括:
(i)AMBP序列元件;
(ii)hAAT序列元件;
(iii)ApoE-HCR1序列元件;
(iv)HNF6结合位点;
(v)HNF4a结合位点;
(vi)TATA盒;和
(vii)第二个HNF6结合位点,
其中:
(i)AMBP序列元件包含SEQ ID NO:97的核苷酸序列;
(ii)hAAT序列元件包含SEQ ID NO:94的核苷酸序列;
(iii)ApoE-HCR1序列元件包含SEQ ID NO:92的核苷酸序列;
(iv)AMBP序列元件在hAAT序列元件的5’;
(v)ApoE-HCR1序列元件在hAAT序列元件的5'和AMBP序列元件的3';
(vi)HNF6结合位点在AMBP序列元件的3'和ApoE-HCR1序列元件的5';
(vii)HNF4a结合位点在ApoE-HCR-1序列元件的3'和hAAT序列元件的5';
(viii)TATA盒紧邻对应于SEQ ID NO:95的核苷酸序列的核苷酸序列的5';
(ix)第二个HNF6结合位点紧邻对应于SEQ ID NO:95的核苷酸序列的核苷酸序列的3';和
(x)TRE的长度为900到950个核苷酸。
在一个实施方案中,TRE包括:
(i)AMBP序列元件;
(ii)hAAT序列元件;
(iii)ApoE-HCR1序列元件;
(iv)HNF6结合位点;
(v)HNF1结合位点;
(vi)HNF4a结合位点;
(vii)TATA盒;和
(viii)第二个HNF6结合位点,
其中:
(i)AMBP序列元件包含SEQ ID NO:97的核苷酸序列;
(ii)hAAT序列元件包含SEQ ID NO:94的核苷酸序列;
(iii)ApoE-HCR1序列元件包含SEQ ID NO:92的核苷酸序列;
(iv)AMBP序列元件在hAAT序列元件的5’;
(v)ApoE-HCR1序列元件在hAAT序列元件的5'和AMBP序列元件的3';
(vi)HNF6结合位点在AMBP序列元件的3'和ApoE-HCR1序列元件的5';
(vii)HNF1结合位点紧邻HNF4a结合位点的3';
(viii)HNF4a结合位点在ApoE-HCR-1序列元件的3'和hAAT序列元件的5';
(ix)TATA盒紧邻对应于SEQ ID NO:95的核苷酸序列的核苷酸序列的5';
(x)第二个HNF6结合位点紧邻对应于SEQ ID NO:95的核苷酸序列的核苷酸序列的3';和
(xi)TRE的长度为900到950个核苷酸。
在一个实施方案中,TRE包括:
(i)AMBP序列元件;
(ii)hAAT序列元件;
(iii)ApoE-HCR1序列元件;
(iv)HNF3结合位点;和
(v)TATA盒,
其中:
(i)AMBP序列元件包含SEQ ID NO:97的核苷酸序列;
(ii)hAAT序列元件包含SEQ ID NO:94的核苷酸序列;
(iii)ApoE-HCR1序列元件包含SEQ ID NO:92的核苷酸序列;
(iv)AMBP序列元件在hAAT序列元件的5’;
(v)ApoE-HCR1序列元件在hAAT序列元件的5'和AMBP序列元件的3';
(vi)HNF3结合位点在ApoE-HCR1序列元件的3'和hAAT序列元件的5';
(vii)TATA盒紧邻对应于SEQ ID NO:95的核苷酸序列的核苷酸序列的5';和
(viii)TRE的长度为875到925个核苷酸。
在一个实施方案中,TRE包括:
(i)AMBP序列元件;
(ii)hAAT序列元件;
(iii)ApoE-HCR1序列元件;
(iv)HNF6结合位点;和
(v)TATA盒,
其中:
(i)AMBP序列元件包含SEQ ID NO:97的核苷酸序列;
(ii)hAAT序列元件包含SEQ ID NO:94的核苷酸序列;
(iii)ApoE-HCR1序列元件包含SEQ ID NO:92的核苷酸序列;
(iv)AMBP序列元件在hAAT序列元件的5’;
(v)ApoE-HCR1序列元件在hAAT序列元件的5'和AMBP序列元件的3';
(vi)HNF6结合位点在AMBP序列元件的3'和ApoE-HCR1序列元件的5';
(vii)TATA盒紧邻对应于SEQ ID NO:95的核苷酸序列的核苷酸序列的5';和
(viii)TRE的长度为875到925个核苷酸。
在一个实施方案中,TRE包括:
(i)AMBP序列元件;
(ii)hAAT序列元件;
(iii)ApoE-HCR1序列元件;和
(iv)HNF6结合位点,
其中:
(i)AMBP序列元件包含SEQ ID NO:97的核苷酸序列;
(ii)hAAT序列元件包含SEQ ID NO:94的核苷酸序列;
(iii)ApoE-HCR1序列元件包含SEQ ID NO:92的核苷酸序列;
(iv)AMBP序列元件在hAAT序列元件的5’;
(v)ApoE-HCR1序列元件在hAAT序列元件的5'和AMBP序列元件的3';
(vi)HNF6结合位点在AMBP序列元件的3'和ApoE-HCR1序列元件的5';和
(vii)TRE的长度为875到925个核苷酸。
在一个实施方案中,TRE包括:
(i)AMBP序列元件;
(ii)hAAT序列元件;
(iii)ApoE-HCR1序列元件;和
(iv)HNF4结合位点,
其中:
(i)AMBP序列元件包含SEQ ID NO:97的核苷酸序列;
(ii)hAAT序列元件包含SEQ ID NO:94的核苷酸序列;
(iii)ApoE-HCR1序列元件包含SEQ ID NO:92的核苷酸序列;
(iv)AMBP序列元件在hAAT序列元件的5’;
(v)ApoE-HCR1序列元件在hAAT序列元件的5'和AMBP序列元件的3';
(vi)HNF4结合位点在AMBP序列元件的3'和ApoE-HCR1序列元件的5';和
(vii)TRE的长度为875到925个核苷酸。
在一个实施方案中,TRE包括:
(i)AMBP序列元件;
(ii)hAAT序列元件;
(iii)ApoE-HCR1序列元件;和
(iv)HNF6结合位点,
其中:
(i)AMBP序列元件包含SEQ ID NO:97的核苷酸序列;
(ii)hAAT序列元件包含SEQ ID NO:94的核苷酸序列;
(iii)ApoE-HCR1序列元件包含SEQ ID NO:92的核苷酸序列;
(iv)AMBP序列元件在hAAT序列元件的5’;
(v)ApoE-HCR1序列元件在hAAT序列元件的5'和AMBP序列元件的3';
(vi)HNF6结合位点在ApoE-HCR1序列元件的3'和hAAT序列元件的5';和
(vii)TRE的长度为875到925个核苷酸。
在一个实施方案中,TRE包括:
(i)AMBP序列元件;
(ii)hAAT序列元件;
(iii)ApoE-HCR1序列元件;和
(iv)HNF4结合位点,
其中:
(i)AMBP序列元件包含SEQ ID NO:97的核苷酸序列;
(ii)hAAT序列元件包含SEQ ID NO:94的核苷酸序列;
(iii)ApoE-HCR1序列元件包含SEQ ID NO:92的核苷酸序列;
(iv)AMBP序列元件在hAAT序列元件的5’;
(v)ApoE-HCR1序列元件在hAAT序列元件的5'和AMBP序列元件的3';
(vi)HNF4结合位点在ApoE-HCR1序列元件的3'和hAAT序列元件的5';和
(vii)TRE的长度为875到925个核苷酸。
在一个实施方案中,TRE包括:
(i)AMBP序列元件;
(ii)hAAT序列元件;
(iii)ApoE-HCR1序列元件;和
(iv)HNF4结合位点,
其中:
(i)AMBP序列元件包含SEQ ID NO:97的核苷酸序列;
(ii)hAAT序列元件包含SEQ ID NO:94的核苷酸序列;
(iii)ApoE-HCR1序列元件包含SEQ ID NO:92的核苷酸序列;
(iv)AMBP序列元件在hAAT序列元件的5’;
(v)ApoE-HCR1序列元件在hAAT序列元件的5’和AMBP序列元件的3';
(vi)HNF4结合位点紧邻对应于SEQ ID NO:93的核苷酸序列的核苷酸序列的3';和
(vii)TRE的长度为875到925个核苷酸。
在一个实施方案中,TRE包括:
(i)AMBP序列元件;
(ii)hAAT序列元件;
(iii)ApoE-HCR1序列元件;
(iv)HNF6结合位点;和
(v)TATA盒,
其中:
(i)AMBP序列元件包含SEQ ID NO:97的核苷酸序列;
(ii)hAAT序列元件包含SEQ ID NO:94的核苷酸序列;
(iii)ApoE-HCR1序列元件包含SEQ ID NO:92的核苷酸序列;
(iv)AMBP序列元件在hAAT序列元件的5’;
(v)ApoE-HCR1序列元件在hAAT序列元件的5’和AMBP序列元件的3';
(vi)HNF6结合位点紧邻对应于SEQ ID NO:95的核苷酸序列的核苷酸序列的3';
(vii)TATA盒紧邻HNF6结合位点的5';和
(viii)TRE的长度为875到925个核苷酸。
在一个实施方案中,TRE包括:
(i)AMBP序列元件;
(ii)hAAT序列元件;
(iii)ApoE-HCR1序列元件;
(iv)HNF4结合位点;和
(v)HNF6结合位点,
其中:
(i)AMBP序列元件包含SEQ ID NO:97的核苷酸序列;
(ii)hAAT序列元件包含SEQ ID NO:94的核苷酸序列;
(iii)ApoE-HCR1序列元件包含SEQ ID NO:92的核苷酸序列;
(iv)AMBP序列元件在hAAT序列元件的5’;
(v)ApoE-HCR1序列元件在hAAT序列元件的5’和AMBP序列元件的3';
(vi)HNF4结合位点在ApoE-HCR1序列元件的3’和hAAT序列元件的5';
(vii)HNF6结合位点在AMBP序列元件的3’和ApoE-HCR1序列元件的5';和
(viii)TRE的长度为875到925个核苷酸。
在一个实施方案中,TRE包括:
(i)AMBP序列元件;
(ii)hAAT序列元件;
(iii)ApoE-HCR1序列元件;
(iv)HNF6结合位点;和
(v)HNF4结合位点,
其中:
(i)AMBP序列元件包含SEQ ID NO:97的核苷酸序列;
(ii)hAAT序列元件包含SEQ ID NO:94的核苷酸序列;
(iii)ApoE-HCR1序列元件包含SEQ ID NO:92的核苷酸序列;
(iv)AMBP序列元件在hAAT序列元件的5’;
(v)ApoE-HCR1序列元件在hAAT序列元件的5’和AMBP序列元件的3';
(vi)HNF6结合位点在ApoE-HCR1序列元件的3’和hAAT序列元件的5';
(vii)HNF4结合位点在AMBP序列元件的3’和ApoE-HCR1序列元件的5';和
(viii)TRE的长度为875到925个核苷酸。
在一个实施方案中,TRE包括:
(i)AMBP序列元件;
(ii)hAAT序列元件;
(iii)ApoE-HCR1序列元件;
(iv)HNF6结合位点;和
(v)TATA盒,
其中:
(i)AMBP序列元件包含SEQ ID NO:97的核苷酸序列;
(ii)hAAT序列元件包含SEQ ID NO:94的核苷酸序列;
(iii)ApoE-HCR1序列元件包含SEQ ID NO:92的核苷酸序列;
(iv)AMBP序列元件在hAAT序列元件的5’;
(v)ApoE-HCR1序列元件在hAAT序列元件的5’和AMBP序列元件的3';
(vi)HNF6结合位点紧邻对应于SEQ ID NO:95的核苷酸序列的核苷酸序列的3';
(vii)TATA盒紧邻对应于SEQ ID NO:95的核苷酸序列的核苷酸序列的5';和
(viii)TRE的长度为875到925个核苷酸。
在一个实施方案中,TRE包括:
(i)AMBP序列元件;
(ii)hAAT序列元件;
(iii)ApoE-HCR1序列元件;和
(iv)HNF6结合位点,
其中:
(i)AMBP序列元件包含SEQ ID NO:97的核苷酸序列;
(ii)hAAT序列元件包含SEQ ID NO:94的核苷酸序列;
(iii)ApoE-HCR1序列元件包含SEQ ID NO:92的核苷酸序列;
(iv)AMBP序列元件在hAAT序列元件的5’;
(v)ApoE-HCR1序列元件在hAAT序列元件的5’和AMBP序列元件的3';
(vi)HNF6结合位点在AMBP序列元件的5’;和
(vii)TRE的长度为875到925个核苷酸。
在一个实施方案中,TRE包括:
(i)AMBP序列元件;
(ii)hAAT序列元件;
(iii)ApoE-HCR1序列元件;和
(iv)HNF4结合位点,
其中:
(i)AMBP序列元件包含SEQ ID NO:97的核苷酸序列;
(ii)hAAT序列元件包含SEQ ID NO:94的核苷酸序列;
(iii)ApoE-HCR1序列元件包含SEQ ID NO:92的核苷酸序列;
(iv)AMBP序列元件在hAAT序列元件的5’;
(v)ApoE-HCR1序列元件在hAAT序列元件的5’和AMBP序列元件的3';
(vi)HNF4结合位点在AMBP序列元件的5’;和
(vii)TRE的长度为875到925个核苷酸。
在一个实施方案中,TRE包括:
(i)AMBP序列元件;
(ii)hAAT序列元件;
(iii)ApoE-HCR1序列元件;和
(iv)HNF6结合位点,
其中:
(i)AMBP序列元件包含SEQ ID NO:97的核苷酸序列;
(ii)hAAT序列元件包含SEQ ID NO:94的核苷酸序列;
(iii)ApoE-HCR1序列元件包含SEQ ID NO:92的核苷酸序列;
(iv)AMBP序列元件在hAAT序列元件的5’;
(v)ApoE-HCR1序列元件在hAAT序列元件的5’和AMBP序列元件的3';
(vi)HNF6结合位点紧邻对应于SEQ ID NO:95的核苷酸序列的核苷酸序列的3';和
(vii)TRE的长度为875到925个核苷酸。
本发明的多核苷酸还可包含一个或两个ITR。在一个实施方案中,该或每个ITR的核苷酸序列长度少于157个、少于154个或约145个核苷酸。任选地,该或每个ITR是野生型ITR。任选地,该或每个ITR是AAV2 ITR。在一些实施方案中,该或每个ITR的核苷酸序列包含SEQ ID NO:53或SEQ ID NO:54的核苷酸序列。
本发明的多核苷酸可以进一步包含多聚A核苷酸序列。多聚A序列可以是牛生长激素多聚A序列(bGHpA-SEQ ID NO:55)。在一些实施方案中,多聚A核苷酸序列包含SEQ IDNO:55的核苷酸序列。多聚A序列的长度可以是200至220、205至215或约208个核苷酸。多聚A序列可位于本发明的CFI核苷酸序列的下游。
本发明的多核苷酸可以进一步包含内含子序列,例如病毒内含子序列,任选地SV40内含子序列(SEQ ID NO:60)。
包含多核苷酸的病毒颗粒
本发明进一步提供了包含重组基因组的病毒颗粒,所述重组基因组包含本发明的多核苷酸。为了本发明的目的,术语“病毒颗粒”是指全部或部分病毒体。例如,病毒颗粒包含重组基因组并且可以进一步包含衣壳。病毒颗粒可以是基因治疗载体。在此,术语“病毒颗粒”和“载体”可互换使用。出于本申请的目的,“基因治疗”载体是可用于基因治疗的病毒颗粒,即包含施用后在宿主细胞中表达转基因(例如CFI核苷酸序列)所需的所有功能元件的病毒颗粒。
合适的病毒颗粒包括细小病毒、逆转录病毒、慢病毒或单纯疱疹病毒。细小病毒可以是腺相关病毒(AAV)。任选地,病毒颗粒是AAV、腺病毒或慢病毒颗粒。病毒颗粒优选为重组AAV载体或慢病毒载体。更优选地,病毒颗粒是AAV病毒颗粒。术语AAV和rAAV在本文中可互换使用,除非上下文明显另有说明。
所有已知AAV血清型的基因组组织非常相似。AAV的基因组是线性单链DNA分子,长度小于约5,000个核苷酸。反向末端重复(ITR)位于非结构复制(Rep)蛋白和结构(VP)蛋白的独特编码核苷酸序列的两侧。VP蛋白(VP1、-2和-3)形成衣壳。末端~145nt(ITR)是自互补的,并且经过组织以便可以形成形成T形发夹的能量稳定的分子内双链体。这些发夹结构用作病毒DNA复制的起点,作为细胞DNA聚合酶复合物的引物。在哺乳动物细胞中的野生型(wt)AAV感染后,Rep基因(即编码Rep78和Rep52蛋白)分别从P5启动子和P19启动子表达,并且两种Rep蛋白都在病毒基因组的复制中发挥作用。Rep ORF中的剪接事件导致四种Rep蛋白(即Rep78、Rep68、Rep52和Rep40)的表达。然而,已经表明,哺乳动物细胞中编码Rep78和Rep52蛋白的未剪接mRNA足以用于AAV载体产生。在昆虫细胞中,Rep78和Rep52蛋白也足以AAV载体产生。
如上所述,本发明的多核苷酸可包含一个或两个ITR。因此,重组病毒基因组可包含一个或两个如上所述的ITR。本发明的AAV载体可能仅与一个ITR一起发挥作用。因此,病毒基因组通常包含至少一个ITR,但更通常包含两个ITR(通常在病毒基因组的任一端各有一个,即一个在5'端,一个在3'端)。在本发明的CFI核苷酸序列和一个或两个ITR之间可能存在***序列。CFI核苷酸序列可以掺入位于两个常规ITR之间或位于用两个D区工程改造的ITR任一侧的病毒颗粒中。
可以在本发明中用于生产AAV载体的AAV序列可以来源于任何AAV血清型的基因组。通常,AAV血清型在氨基酸和核苷酸水平上具有显著同源性的基因组序列,提供相同的一组遗传功能,产生基本上物理和功能等效的病毒体,并通过几乎相同的机制复制和组装。对于各种AAV血清型的基因组序列和基因组相似性的概述,参见例如GenBank登录号U89790;GenBank登录号J01901;GenBank登录号AF043303;GenBank登录号AF085716;Chiorini等人,1997;Srivastava等人,1983;Chiorini等人,1999;Rutledge等人,1998;和Wu等人,2000。AAV血清型1、2、3、3B、4、5、6、7、8、9、10、11或12可用于本发明。当用于产生基因治疗载体时,来自AAV血清型的序列可能被突变或工程改造。
任选地,AAV载体包含来源于AAV1、AAV2、AAV4和/或AAV6的ITR序列。优选地,ITR序列是AAV2 ITR序列。在本文中,术语AAVx/y是指包含基因组成分例如来自AAVx的至少ITR(其中x是AAV血清型编号)并具有来自AAVy的衣壳(其中y是相同或不同血清型的编号)的病毒颗粒。例如,AAV2/8载体可包含来自AAV2毒株的病毒基因组的一部分,包括ITR,以及来自AAV8毒株的衣壳。
在一个实施方案中,病毒颗粒包含衣壳。在一个实施方案中,病毒颗粒是包含衣壳的AAV病毒颗粒。AAV衣壳通常由三种蛋白质VP1、VP2和VP3形成。VP1的氨基酸序列包含VP2的序列。不构成VP2一部分的VP1部分被称为VP1unique或VP1U。VP2的氨基酸序列包含VP3的序列。不构成VP3一部分的VP2部分被称为VP2unique或VP2U。任选地,病毒颗粒包含嗜肝衣壳。病毒颗粒(衣壳)是否对特定组织具有趋向性可以例如通过施用表达标记基因如萤光素酶的这样的颗粒并在多个时间点在体内成像来评估(例如如Zincarelli等人(2008),Molecular Therapy,16:1073-1080中所述)。在肝组织中驱动强标记物表达的颗粒(特别是如果与其他组织中的较少表达形成对比)将被认为是嗜肝的。
在一些实施方案中,嗜肝衣壳可以是AAV3-、AAV3B-、AAV5或AAV8-衍生的衣壳。任选地,嗜肝衣壳可以是AAV3-、AAV3B-或AAV8-衍生的衣壳。任选地,嗜肝衣壳包含与SEQ IDNO:56-59中任一个的至少600、至少650、至少700、600至734、600和736、650至734、650至736、700至734、700至736、约734或约736个氨基酸的片段至少98%、至少99%或至少99.5%相同的序列。任选地,嗜肝衣壳包含与SEQ ID NO:56-59中的任一个至少99%相同的序列。任选地,嗜肝衣壳包含与SEQ ID NO:57或58至少99%相同的序列。任选地,嗜肝衣壳包含与SEQ ID NO:57至少99%相同的序列。
在一些实施方案中,衣壳不是AAV2衍生的衣壳。在一些实施方案中,衣壳不是AAV8衍生的衣壳。
本发明的病毒颗粒可以是“杂合”颗粒,其中病毒ITR和病毒衣壳来自不同的细小病毒,例如不同的AAV血清型。优选地,病毒ITR和衣壳来自不同血清型的AAV,在这种情况下,这样的病毒颗粒被称为转衣壳或假型。类似地,细小病毒可具有“嵌合”衣壳(例如,含有来自不同细小病毒的序列,优选不同AAV血清型)或“靶向”衣壳(例如,定向向性)。
在一些实施方案中,重组AAV基因组包含完整的ITR,包含功能性末端解析位点(TRS)。这样的AAV基因组可能包含一个或两个可解析的ITR,即包含功能性TRS的ITR,在该TRS处可以发生位点特异性切口以产生游离的3'羟基,该游离3'羟基可以用作DNA聚合酶的底物以解旋和复制ITR。
优选地,重组基因组是单链的(即,它以单链形式包装到病毒颗粒中)。任选地,重组基因组不以自互补构型包装,即基因组不包含具有在病毒颗粒中退火的实质自互补部分的单个共价连接的多核苷酸链。可选择地,重组基因组可以以“单体双链体”形式包装。“单体双链体”描述于WO2011/122950。基因组可包装为两个基本上互补但非共价连接的多核苷酸,其在病毒颗粒中退火。
如上所述,本发明的多核苷酸可包含多聚A核苷酸序列。因此,病毒颗粒可包含如上所述的多聚A序列。
如上所述,本发明的多核苷酸可包含内含子序列。因此,本发明的多核苷酸可包含如上所述的内含子序列。
在一个实施方案中,病毒颗粒包含含有转录调节元件(包括例如启动子和/或增强子)、CFI核苷酸序列和多聚A序列例如bGHpA序列的多核苷酸序列。在这样的实施方案中,多聚A序列,例如bGHpA序列,可以位于CFI核苷酸序列的下游。内含子序列,例如SV40内含子序列,可以位于转录调节元件和CFI核苷酸序列之间。
在一个实施方案中,与在施用包含参考CFI核苷酸序列的等效病毒颗粒时由参考CFI核苷酸序列编码的CFI多肽的表达相比,由CFI核苷酸序列编码的CFI多肽或其片段在施用病毒颗粒时以相同或更高的水平表达。参考CFI核苷酸序列可以是SEQ ID NO:1或21的核苷酸序列。参考CFI核苷酸序列可以是SEQ ID NO:5或25的核苷酸序列。包含参考CFI核苷酸的“等效”病毒颗粒是除了CFI核苷酸序列不同之外与本发明的病毒颗粒相同的病毒颗粒(即病毒颗粒包含相同的衣壳并且重组基因组包含相同的转录调节元件等)。例如,被比较的不同CFI核苷酸序列可操作地连接到相同的启动子序列。在一个实施方案中,与由参考CFI核苷酸序列编码的CFI多肽的表达相比,由CFI核苷酸序列编码的CFI多肽或其片段的表达处于更高的水平。在一个实施方案中,由CFI核苷酸序列编码的CFI多肽或其片段的表达与由参考CFI核苷酸序列编码的CFI多肽相比为至少1.5x、至少2x、至少3x、至少5x、至少8x或至少10x。任选地,由CFI核苷酸序列编码的CFI多肽或其片段的表达与由参考CFI核苷酸序列编码的CFI多肽相比可以为1.5x至10x、2x至10x、5x至10x或8x至10x。参考CFI核苷酸序列可以是野生型CFI核苷酸序列或SEQ ID NO:1、21、5或25中任一个的核苷酸序列。参考CFI核苷酸序列可以是野生型CFI核苷酸序列。野生型CFI核苷酸可以是SEQ ID NO:41或42的序列。参考CFI核苷酸序列可以是SEQ ID NO:1或21的核苷酸序列。参考CFI核苷酸序列可以是SEQ ID NO:5或25的核苷酸序列。
在一个实施方案中,由CFI核苷酸序列编码的CFI多肽或其片段的表达为由SEQ IDNO:5或25的序列编码的CFI多肽的表达水平的至少50%、至少60%、至少70%、至少80%、至少90%、至少95%或至少100%。
CFI多肽或其片段的表达水平通常可以通过测量样品中CFI多肽或其片段的水平来确定。任选地,CFI多肽或其片段的表达水平通过使用ELISA来确定。CFI多肽或其片段的表达水平可以使用如实施例2中所述的ELISA测定来确定。任选地,表达水平通过载体基因组拷贝数标准化。任选地,表达水平未通过载体基因组拷贝数标准化。
任选地,CFI多肽或其片段的表达水平通过使用如上所述的ELISA来确定。
任选地,上述病毒颗粒的施用是对小鼠(例如C57/B1/6小鼠)的施用。如上所述,CFI多肽或其片段的表达水平可以通过载体基因组拷贝数标准化。载体基因组拷贝数可以通过执行qPCR来确定。可以确定鼠肝脏(或一部分)中的载体基因组拷贝数。
任选地,病毒颗粒包含嗜肝衣壳(例如包含与SEQ ID NO:57至少99%相同的序列的嗜肝衣壳)并且多核苷酸包含肝脏特异性转录调节元件(例如与SEQ ID NO:74至少99%相同)。任选地,病毒颗粒包含嗜肝衣壳(例如包含与SEQ ID NO:57至少99%相同的序列的嗜肝衣壳),多核苷酸包含肝脏特异性转录调节元件(例如与SEQ ID NO:74至少99%相同),并且病毒颗粒未眼内施用。
组合物、方法和用途
在本发明的另在一个方面,提供了包含本发明的多核苷酸或载体/病毒颗粒和药学上可接受的赋形剂的组合物。
药学上可接受的赋形剂可以包括载体、稀释剂和/或其他医药剂、制药剂或佐剂等。任选地,药学上可接受的赋形剂包括盐水溶液。任选地,药学上可接受的赋形剂包括人血清白蛋白。
本发明还提供了用于治疗方法的本发明的CFI多核苷酸、载体/病毒颗粒或组合物。任选地,治疗方法包括向患者施用有效量的本发明的CFI多核苷酸、载体/病毒颗粒或组合物。
本发明还提供了一种治疗方法,包括施用有效量的本发明的CFI多核苷酸、载体/病毒颗粒或组合物。任选地,治疗方法包括对患者施用有效量的本发明的多核苷酸或载体/病毒颗粒。
本发明进一步提供本发明的CFI多核苷酸、载体/病毒颗粒或组合物在制备用于治疗方法的药物中的用途。任选地,治疗方法包括对患者施用有效量的本发明的多核苷酸或载体/病毒颗粒。
任选地,治疗方法是基因治疗。“基因治疗”涉及施用本发明的载体/病毒颗粒,该载体/病毒颗粒能够在其施用于的宿主(例如患者)中表达转基因(例如CFI核苷酸序列)。
本发明进一步提供用于治疗方法的包含CFI核苷酸序列的多核苷酸、包含含有该多核苷酸的重组基因组的载体/病毒颗粒或包含该多核苷酸或载体/病毒颗粒的组合物,其中该治疗方法是治疗补体介导的病症的方法,并且CFI核苷酸序列编码CFI多肽或其片段。
本发明还提供了一种治疗方法,包括施用有效量的包含CFI核苷酸序列的多核苷酸、包含含有该多核苷酸的重组基因组的载体/病毒颗粒或包含该多核苷酸或载体/病毒颗粒的组合物,其中该治疗方法是治疗补体介导的病症的方法,并且CFI核苷酸序列编码CFI多肽或其片段。
本发明进一步提供包含CFI核苷酸序列的多核苷酸、包含含有该多核苷酸的重组基因组的载体/病毒颗粒或包含该多核苷酸或载体/病毒颗粒的组合物在制备用于治疗方法的药物中的用途,其中治疗方法是治疗补体介导的病症的方法,并且CFI核苷酸序列编码CFI多肽或其片段。
任选地,治疗方法包括向患者施用有效量的多核苷酸、载体/病毒颗粒或组合物。
任选地,患者具有低于正常水平的CFI蛋白水平。任选地,患者在CFI基因中或CFI基因的一种或多种转录调节元件中具有突变。任选地,患者缺乏CFI。任选地,患者具有正常水平的CFI蛋白。任选地,多核苷酸、病毒颗粒或组合物的施用增加了CFI蛋白的水平。任选地,多核苷酸、病毒颗粒或组合物的施用将CFI蛋白的水平提高到高于正常水平。
任选地,该多核苷酸是如本文所述的本发明的多核苷酸。任选地,病毒颗粒是如本文所述的本发明的病毒颗粒。任选地,该组合物是如本文所述的本发明的组合物。
任选地,治疗方法是治疗补体介导的病症的方法。任选地,补体介导的病症是C3介导的病症。任选地,补体介导的病症是肾脏疾病。
任选地,补体介导的病症是可以通过增加患者中CFI蛋白的水平来治疗的病症。任选地,补体介导的病症是与增加的和/或慢性的炎症相关的病症。任选地,补体介导的病症是其中患者将受益于减轻炎症的病症。任选地,补体介导的病症不是由功能性CFI蛋白的水平不足和/或补体***中的缺陷引起的,但仍然可以通过提高CFI蛋白水平来治疗。任选地,补体介导的病症是***性红斑狼疮。
任选地,补体介导的病症与补体C3b反馈循环的过度活动有关。任选地,补体介导的病症选自C3肾小球病、IgA肾病、狼疮性肾炎、***性红斑狼疮、膜性肾病、膜增生性肾小球肾炎、阵发性睡眠性血红蛋白尿、非典型溶血性***综合征、自身免疫性溶血性贫血、ANCA相关血管炎、戈谢病、腹膜炎、年龄-相关黄斑变性、糖尿病性视网膜病变、致密物沉积病、年龄相关性炎症或自身炎症性疾病、自身免疫性关节炎如类风湿性关节炎、动脉粥样硬化、慢性心血管疾病、阿尔茨海默氏病、***性血管炎、格林-巴利综合征和Henoch-Schonlein紫癜。
任选地,补体介导的病症是与年龄相关的炎症性疾病或自身炎症性疾病。任选地,补体介导的病症是慢性炎症性疾病。
任选地,补体介导的病症选自C3肾小球病、C3肾小球肾炎和致密物沉积病。
任选地,补体介导的病症是非典型溶血性***综合征。任选地,补体介导的病症是具有单等位基因CFH突变的非典型溶血性***综合征。换句话说,补体介导的病症可以是非典型溶血性***综合征,并且待治疗的患者组是具有单等位基因CFH突变的非典型溶血性***综合征患者的子集。
任选地,补体介导的病症是肾小球或肾小管病症。任选地,该病症选自C3肾小球病、IgA肾病、狼疮性肾炎和膜性肾病。任选地,该病症是狼疮性肾炎。任选地,该病症是***性红斑狼疮。
当疾病或病症如本文所讨论的那样被“治疗”时(例如在本发明的方法或用途中),这意味着疾病或病症的一种或多种症状得到改善。这并不意味着疾病或病症的症状已完全治愈以至于它们不再存在于患者中,尽管在一些方法中可能是这种情况。因此,在所有情况下,术语“治疗”或“医治”可分别替换为术语“改善”或“减轻”。本发明的方法或用途(例如治疗或医治的方法)可导致比治疗前更轻的疾病或病症的一种或多种症状。任选地,相对于施用前的情况,本发明的方法或用途(例如治疗或医治的方法)导致在给定体积的血液中可检测到的患者血液中循环CFI的量/浓度。
此外,本发明的方法或用途可以“预防”病症。在一些实施方案中,术语“治疗”或“医治”可分别替换为术语“预防”或“防止”。
“有效量”是指在必要的剂量和时间段内有效实现所需治疗结果(例如提高受试者中的功能性CFI的水平(例如以导致足以改善疾病或病症的症状的水平的功能性CFI产生))的量。
任选地,载体/病毒颗粒以小于1×1011、小于1×1012、小于5×1012、小于2×1012、小于1.5×1012、小于3x1012、小于1x1013、小于2x1013或小于3x1013个载体基因组/kg患者体重(vg/kg)的剂量施用。任选地,选择施用的载体/病毒颗粒的剂量以使得受试者以未患该病症的健康受试者的水平的10%-90%、20%-80%、30%-70%、25%-50%、20%-150%、30%-140%、40%-130%、50%-120%、60%-110%或70%-100%的水平表达CFI多肽。
任选地,多核苷酸、病毒颗粒或组合物的施用减少受试者中与病症相关的炎症。任选地,多核苷酸、病毒颗粒或组合物的施用将炎症降低至施用多核苷酸、病毒颗粒或组合物之前存在的炎症水平的小于或约60%、小于或约55%、小于或约50%、小于或约45%、小于或约40%、小于或约35%、小于或约30%、小于或约25%或小于或约20%的水平。任选地,多核苷酸、病毒颗粒或组合物的施用将炎症降低至施用多核苷酸、病毒颗粒或组合物之前存在的炎症水平的小于或约60%、小于或约55%、小于或约50%、小于或约45%、小于或约45%的水平炎症水平的40%、小于或约35%、小于或约30%、小于或约25%、小于或约20%、小于或约15%或小于或约10%的水平。
任选地,治疗方法是减轻患者中的炎症的方法。任选地,治疗方法是减轻患者中的炎症的方法,从而治疗补体介导的病症。任选地,治疗方法是通过减轻患者中的炎症来治疗疾病的方法。任选地,减轻炎症是将炎症减轻至施用多核苷酸、病毒颗粒或组合物之前存在的炎症水平的小于或约60%、小于或约55%、小于或约50%、小于或约45%、小于或约40%、小于或约35%、小于或约30%、小于或约25%或小于或约20%的水平。任选地,多核苷酸、病毒颗粒或组合物的施用将炎症减轻至在施用多核苷酸、病毒颗粒或组合物之前存在的炎症水平的小于或约60%、小于或约55%、小于或约50%、小于或约45%、小于或约40%、小于或约35%、小于或约30%、小于或约25%、小于或约20%、小于或约15%或小于或约10%的水平。
任选地,治疗方法包括向患者施用有效量的多核苷酸、病毒颗粒或组合物,并且有效量的CFI多核苷酸、载体/病毒颗粒或组合物是足以减轻患者中的炎症的量。任选地,足以减轻患者中的炎症的量是足以将炎症减轻至施用多核苷酸、病毒颗粒或组合物之前存在的炎症水平的小于或约60%、小于或约55%、小于或约50%、小于或约45%、小于或约40%、小于或约35%、小于或约30%、小于或约25%或小于或约20%的水平的量。任选地,多核苷酸、病毒颗粒或组合物的施用将炎症减轻至在施用多核苷酸、病毒颗粒或组合物之前存在的炎症水平的小于或约60%、小于或约55%、小于或约50%、小于或约45%、小于或约40%、小于或约35%、小于或约30%、小于或约25%、小于或约20%、小于或约15%或小于或约10%的水平。
任选地,多核苷酸、病毒颗粒或组合物的施用减少受试者的蛋白尿。任选地,通过测量尿液中的白蛋白与肌酸酐比值(ACR)对蛋白尿进行评分。任选地,多核苷酸、病毒颗粒或组合物的施用将蛋白尿减少至施用多核苷酸、病毒颗粒或组合物之前存在的蛋白尿水平的小于或约70%、小于或约65%、小于或约60%、小于或约55%、小于或约50%、小于或约45%、小于或约40%、小于或约35%、小于或约30%、小于或约25%、小于或约20%、小于或约15%或小于或约10%的水平。任选地,多核苷酸、病毒颗粒或组合物的施用将蛋白尿降低至施用多核苷酸、病毒颗粒或组合物之前存在的蛋白尿水平的小于或约40%、小于或约35%、小于或约30%、小于或约25%、小于或约20%、小于或约15%或小于或约10%的水平。
任选地,治疗方法是减少患者中的蛋白尿的方法。任选地,治疗方法是减少患者中的蛋白尿的方法,从而治疗补体介导的病症。任选地,治疗方法是通过减少患者的蛋白尿来治疗疾病的方法。任选地,减少蛋白尿是将蛋白尿减少至施用多核苷酸、病毒颗粒或组合物之前存在的蛋白尿水平的小于或约70%、小于或约65%、小于或约60%、小于或约55%、小于或约50%、小于或约45%、小于或约40%、小于或约35%、小于或约30%、小于或约25%、小于或约20%、小于或约15%或小于或约10%的水平。任选地,多核苷酸、病毒颗粒或组合物的施用将蛋白尿降低至施用多核苷酸、病毒颗粒或组合物之前存在的蛋白尿水平的小于或约40%、小于或约35%、小于或约30%、小于或约25%、小于或约20%、小于或约15%或小于或约10%的水平。
任选地,治疗方法包括向患者施用有效量的CFI多核苷酸、载体/病毒颗粒或组合物,并且有效量是足以减少患者中的蛋白尿的量。任选地,足以减少患者中的蛋白尿的量是足以将蛋白尿减少至施用多核苷酸、病毒颗粒或组合物之前存在的蛋白尿水平的小于或约70%、小于或约65%、小于或约60%、小于或约55%、小于或约50%、小于或约45%、小于或约40%、小于或约35%、小于或约30%、小于或约25%、小于或约20%、小于或约15%或小于或约10%的水平的量。任选地,足以减少患者中的蛋白尿的量是足以将蛋白尿减少至施用多核苷酸、病毒颗粒或组合物之前存在的蛋白尿水平的小于或约40%、小于或约35%、小于或约30%、小于或约25%、小于或约20%、小于或约15%或小于或约10%的水平的量。
任选地,多核苷酸、病毒颗粒或组合物的施用减少受试者中的肾小球病理和/或肾小管病理。任选地,多核苷酸、病毒颗粒或组合物的施用减少肾小球病理和/或肾小管病理,如通过PAS染色时降低的病理学水平所见。
任选地,治疗方法是减少患者中的肾小球病理和/或肾小管病理的方法。任选地,治疗方法是减少患者中的肾小球病理和/或肾小管病理的方法,从而治疗补体介导的病症。任选地,治疗方法是通过减少患者中的肾小球病理和/或肾小管病理来治疗疾病的方法。任选地,减少肾小球病理和/或肾小管病理是如通过PAS染色时降低的病理学水平所见的减少肾小球病理和/或肾小管病理。任选地,治疗方法包括向患者施用有效量的多核苷酸、病毒颗粒或组合物,并且有效量是足以减少患者中的肾小球病理和/或肾小管病理的量。任选地,足以减少患者中的肾小球病理和/或肾小管病理的量是足以如通过PAS染色时降低的病理学水平所见的减少肾小球病理和/或肾小管病理的量。
任选地,该病症不是眼部病症。任选地,多核苷酸、病毒颗粒或组合物不经眼内施用。
任选地,多核苷酸、病毒颗粒或组合物不通过视网膜下注射施用。任选地,多核苷酸、病毒颗粒或组合物不通过直接视网膜注射施用。任选地,多核苷酸、病毒颗粒或组合物不通过脉络膜上腔注射施用。任选地,多核苷酸、病毒颗粒或组合物不通过玻璃体内注射施用。
任选地,CFI多核苷酸、载体/病毒颗粒和/或组合物静脉内施用。任选地,全身施用CFI多核苷酸、载体/病毒颗粒和/或组合物。任选地,CFI多核苷酸、载体/病毒颗粒和/或组合物通过外周静脉输注施用至肝脏。任选地,CFI多核苷酸、载体/病毒颗粒和/或组合物经由肝血管例如肝静脉输注或肝动脉输注施用至肝脏。任选地,CFI多核苷酸、载体/病毒颗粒和/或组合物通过直接向肝脏的实质内施用来施用。任选地,CFI多核苷酸、载体/病毒颗粒和/或组合物通过注射到肾动脉中来施用。任选地,CFI多核苷酸、载体/病毒颗粒和/或组合物通过逆行施用来施用,例如使用导尿管经由输尿管施用。
任选地,CFI核苷酸序列包含与SEQ ID NO:1或21的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
任选地,CFI核苷酸序列包含与SEQ ID NO:5或25的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
任选地,CFI核苷酸序列包含与SEQ ID NO:7或27的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
任选地,CFI核苷酸序列包含与SEQ ID NO:10或30的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
任选地,CFI核苷酸序列包含与SEQ ID NO:14或34的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
任选地,CFI核苷酸序列包含与SEQ ID NO:17或37的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
任选地,多核苷酸、病毒颗粒或组合物的施用增加患者中C3b-失活和/或iC3b-降解活性的水平。任选地,多核苷酸、病毒颗粒或组合物的施用将C3b-失活和/或iC3b-降解活性的水平增加到高于正常水平。任选地,多核苷酸、病毒颗粒或组合物的施用将C3b-失活和/或iC3b-降解活性的水平增加至正常水平的1.2倍、1.5倍、1.8倍或2倍的水平。任选地,正常水平相当于血清中30-40μg/ml CFI多肽所提供的水平。
任选地,该治疗方法是用于增加患者中C3b-失活和/或iC3b-降解的水平的方法。任选地,治疗方法是增加患者中C3b-失活和/或iC3b-降解的水平的方法,从而治疗补体介导的病症。任选地,治疗方法是通过增加患者中的C3b-失活和/或iC3b-降解水平来治疗疾病的方法。任选地,增加患者中的C3b-失活和/或iC3b-降解水平是将C3b-失活和/或iC3b-降解活性水平增加到高于正常水平。任选地,增加患者中C3b-失活和/或iC3b-降解的水平是将C3b-失活和/或iC3b-降解活性水平增加至正常水平的1.2倍、1.5倍、1.8倍或2倍的水平。任选地,正常水平相当于血清中30-40μg/ml CFI多肽所提供的水平。
任选地,病毒颗粒包含嗜肝衣壳(例如包含与SEQ ID NO:57至少99%相同的序列的嗜肝衣壳)并且多核苷酸包含肝脏特异性转录调节元件(例如与SEQ ID NO:74至少99%相同)。任选地,病毒颗粒包含嗜肝衣壳(例如包含与SEQ ID NO:57至少99%相同的序列的嗜肝衣壳),多核苷酸包含肝脏特异性转录调节元件(例如与SEQ ID NO:74至少99%相同),并且病毒颗粒未眼内施用。
任选地,CFI核苷酸序列是来自WO2020/086735的SEQ ID NO:1、2、3或5或来自WO2017/072515的SEQ ID NO:8中任一个的核苷酸序列。任选地,CFI核苷酸序列是来自WO2020/128516的SEQ ID NO:18至26中任一个的核苷酸序列。
任选地,CFI核苷酸序列是来自WO2020/086735的SEQ ID NO:1、2、3或5中任一个的核苷酸序列,或其编码CFI多肽的变体,其包含与分别由来自WO2020/086735的SEQ ID NO:1、2、3或5编码的多肽至少95%相同的序列。任选地,CFI核苷酸序列是来自WO2017/072515的SEQ ID NO:8的核苷酸序列,或其编码CFI多肽的变体,其包含与来自WO2017/072515的SEQ ID NO:8至少95%相同的序列。任选地,CFI核苷酸序列是来自WO2020/128516的SEQ IDNO:18至26中任一个的核苷酸序列,或其编码CFI多肽的变体,其包含与分别由来自WO2020/128516的SEQ ID NO:18、19、20、21、22、23、24、25或26编码的多肽至少95%相同的序列。
任选地,变体是来自WO2020/086735的SEQ ID NO:1、2、3或5、来自WO2017/072515的SEQ ID NO:8或来自WO2020/128516的SEQ ID NO:18至26中任一个的变体。在一些实施方案中,来自WO2020/086735的SEQ ID NO:1、2、3或5、来自WO2017/072515的SEQ ID NO:8或来自WO2020/128516的SEQ ID NO:18、19、20、21、22、23、24、25或26的变体分别与来自WO2020/086735的SEQ ID NO:1、2、3或5、来自WO2017/072515的SEQ ID NO:8或来自WO2020/128516的SEQ ID NO:18、19、20、21、22、23、24、25或26相同,除了其包含核苷酸取代以使得编码的CFI多肽分别相对于由来自WO2020/086735的SEQ ID NO:1、2、3或5、来自WO2017/072515的SEQ ID NO:8或来自WO2020/128516的SEQ ID NO:18、19、20、21、22、23、24、25或26编码的CFI多肽序列具有1个、2个或更少、3个或更少、4个或更少、5个或更少,6个或更少、7个或更少、8个或更少、9个或更少或10个或更少的氨基酸取代。在一些实施方案中,来自WO2020/086735的SEQ ID NO:1、2、3或5、来自WO2017/072515的SEQ ID NO:8或来自WO2020/128516的SEQ ID NO:18、19、20、21、22、23、24、25或26的变体分别相对于来自WO2020/086735的SEQID NO:1、2、3或5、来自WO2017/072515的SEQ ID NO:8或来自WO2020/128516的SEQ ID NO:18、19、20、21、22、23、24、25或26的序列具有1个、2个或更少、3个或更少、4个或更少、5个或更少、6个或更少、7个或更少、8个或更少、9个或更少、10个或更少、20个或更少或30个或更少的核苷酸取代。来自WO2020/086735的SEQ ID NO:1、2、3或5、来自WO2017/072515的SEQID NO:8或来自WO2020/128516的SEQ ID NO:18、19、20、21、22、23、24、25或26的变体分别相对于来自WO2020/086735的SEQ ID NO:1、2、3或5、来自WO2017/072515的SEQ ID NO:8或来自WO2020/128516的SEQ ID NO:18、19、20、21、22、23、24、25或26的序列有1个、2个或更少、3个或更少、4个或更少、5个或更少或6个或更少的核苷酸取代。在一个实施方案中,来自WO2020/086735的SEQ ID NO:1、2、3或5、来自WO2017/072515的SEQ ID NO:8或来自WO2020/128516的SEQ ID NO:18、19、20、21、22、23、24、25或26的变体分别相对于来自WO2020/086735的SEQ ID NO:1、2、3或5、来自WO2017/072515的SEQ ID NO:8或来自WO2020/128516的SEQ ID NO:18、19、20、21、22、23、24、25或26的序列具有4个或更少的核苷酸取代,和/或编码分别相对于由来自WO2020/086735的SEQ ID NO:1、2、3或5、来自WO2017/072515的SEQID NO:8或来自WO2020/128516的SEQ ID NO:18、19、20、21、22、23、24、25或26编码的CFI多肽序列具有3个或更少的氨基酸取代的CFI多肽。在一个实施方案中,来自WO2020/086735的SEQ ID NO:1、2、3或5、来自WO2017/072515的SEQ ID NO:8或来自WO2020/128516的SEQ IDNO:18、19、20、21、22、23、24、25或26的变体分别相对于来自WO2020/086735的SEQ ID NO:1、2、3或5、来自WO2017/072515的SEQ ID NO:8或来自WO2020/128516的SEQ ID NO:18、19、20、21、22、23、24、25或26的序列具有3个或更少的核苷酸取代,和/或编码分别相对于由来自WO2020/086735的SEQ ID NO:1、2、3或5、来自WO2017/072515的SEQ ID NO:8或来自WO2020/128516的SEQ ID NO:18、19、20、21、22、23、24、25或26编码的CFI多肽序列具有2个或更少的氨基酸取代的CFI多肽。在一个实施方案中,来自WO2020/086735的SEQ ID NO:1、2、3或5、来自WO2017/072515的SEQ ID NO:8或来自WO2020/128516的SEQ ID NO:18、19、20、21、22、23、24、25或26的变体分别相对于来自WO2020/086735的SEQ ID NO:1、2、3或5、来自WO2017/072515的SEQ ID NO:8或来自WO2020/128516的SEQ ID NO:18、19、20、21、22、23、24、25或26的序列具有2个或更少的核苷酸取代,和/或编码分别相对于由来自WO2020/086735的SEQID NO:1、2、3或5、来自WO2017/072515的SEQ ID NO:8或来自WO2020/128516的SEQ ID NO:18、19、20、21、22、23、24、25或26编码的CFI多肽序列具有1个或更少的氨基酸取代的CFI多肽。在一个实施方案中,来自WO2020/086735的SEQ ID NO:1、2、3或5、来自WO2017/072515的SEQ ID NO:8或来自WO2020/128516的SEQ ID NO:18、19、20、21、22、23、24、25或26的变体编码分别相对于由来自WO2020/086735的SEQ ID NO:1、2、3或5、来自WO2017/072515的SEQ IDNO:8或来自WO2020/128516的SEQ ID NO:18、19、20、21、22、23、24、25或26编码的CFI多肽序列具有3个或更少的氨基酸取代的CFI多肽。在一个实施方案中,来自WO2020/086735的SEQID NO:1、2、3或5、来自WO2017/072515的SEQ ID NO:8或来自WO2020/128516的SEQ ID NO:18、19、20、21、22、23、24、25或26的变体编码分别相对于由来自WO2020/086735的SEQ IDNO:1、2、3或5、来自WO2017/072515的SEQ ID NO:8或来自WO2020/128516的SEQ ID NO:18、19、20、21、22、23、24、25或26编码的CFI多肽序列具有2个或更少的氨基酸取代的CFI多肽。在一个实施方案中,来自WO2020/086735的SEQ ID NO:1、2、3或5、来自WO2017/072515的SEQID NO:8或来自WO2020/128516的SEQ ID NO:18、19、20、21、22、23、24、25或26的变体编码分别相对于由来自WO2020/086735的SEQ ID NO:1、2、3或5、来自WO2017/072515的SEQ ID NO:8或来自WO2020/128516的SEQ ID NO:18、19、20、21、22、23、24、25或26编码的CFI多肽序列具有1个或更少的氨基酸取代的CFI多肽。
现在将参考以下实施例描述本发明,这些实施例仅是说明性的并且不应以任何方式被解释为限制本发明的范围。
实施例
实施例1-密码子优化的序列的Huh7体外转染研究
基于瞬时转染Huh7细胞后产生的蛋白质的量(w/v)筛选和排序独特的密码子优化的人CFI序列。每个密码子优化序列编码野生型人CFI多肽。
方法
产生表达盒,其包含密码子优化的CFI序列之一或用于对照目的的野生型CFI序列。使用的启动子是“LSP-S”(SEQ ID NO:51)或“LSP-L”(SEQ ID NO:52),其各自是肝脏特异性转录调节元件。
对于包含独特的密码子优化的CFI基因之一的每个表达盒,瞬时转染需要混合携带这样的表达盒的质粒与转染试剂(
Figure BDA0004091717840001201
HD(Promega,目录号E2311))并将混合物递送至细胞以使得可以表达基因,随后通过ELISA对蛋白质进行定量。在适用的情况下,萤光素酶报道基因被包含在转染混合物中作为评估转染效率的一种方式。
Huh7细胞培养和转染:将Huh7细胞(JCRB细胞库,编号JCRB0403)接种于96孔板(每孔30,000个细胞)中的DMEM低葡萄糖、10%FBS+Glutamax(D10培养基)中,在37℃和5%CO2下培养(第1天)。第二天(细胞接种后约24小时;第2天),制备质粒DNA转染试剂混合物并将其转染到Huh7细胞中。简而言之,将0.225μg测试质粒DNA和0.025μg CMV-萤光素酶对照质粒与FuGENE以每μg DNA 4μl的FuGENE(或每0.25μg质粒DNA 1μl的FuGENE)的比例混合。对于96孔转染实验,每孔加入1μl FuGENE混合物。将质粒DNA转染试剂混合物在37℃和5%CO2下在细胞上孵育过夜。第二天早上(第3天),转染后约18小时,将培养基更换为新鲜的D10培养基,并将细胞在37℃和5%CO2下孵育过夜。第二天早上(24小时后;第4天),培养基被新鲜的DMEM低葡萄糖+Glutamax+胰岛素-转铁蛋白-硒补充剂(D0/ITS培养基)取代。第二天(第5天)收获细胞和培养基(上清液)。
根据制造商的说明,使用CFI ELISA试剂盒(例如Hycult目录号HK355-01)评估培养基(上清液)中的CFI表达。简而言之,将培养基样品(必要时用试剂盒中的样品稀释剂稀释)和来自试剂盒的人CFI标准品在包被有抗人CFI抗体(以捕获人CFI)的微量滴定孔中孵育。添加生物素化示踪抗体(以结合捕获的人CFI),然后加入链霉亲和素-过氧化物酶缀合物(以结合生物素化示踪抗体)。然后加入与链霉亲和素-过氧化物酶缀合物反应的底物四甲基联苯胺(TMB)。通过加入草酸终止酶反应。对于每个样品和标准品,使用分光光度计测量450nm处的吸光度。通过绘制吸光度(线性)对人CFI标准品的相应浓度(对数)的图来获得标准曲线。然后根据标准曲线确定样品中人CFI的浓度。
在适用的情况下,与ELISA平行,用磷酸缓冲盐水(PBS)洗涤Huh7细胞两次,并用来自萤光素酶测定试剂盒(Promega目录号E1501/E4530)的100μl萤光素酶裂解缓冲液处理细胞。将细胞裂解物储存在-80℃。在萤光素酶测定当天,解冻细胞裂解物并使用20μl样品在Molecular Devices SpextraMax i3x读板器上通过发光测量萤光素酶表达。详细的方案发表在Promega Technical Bullitin#TB281中。在适用的情况下,萤光素酶表达用作内部对照以使CFI表达水平标准化。使用软件Graphpad Prism v7进行分析。
结果
针对野生型人CFI核苷酸序列和38个密码子优化的人CFI序列,测量了转染到Huh-7细胞中之后培养基中的CFI表达水平。如上所述,使用萤光素酶表达对CFI表达水平进行标准化。每个表达盒包含LSP-L启动子和BgpA多聚A序列。密码子优化的CFI序列之一“Co01”(SEQ ID NO:21)比野生型CFI核苷酸序列表达更多的CFI多肽。密码子优化的CFI序列Co01也比其他37个密码子优化的CFI序列表达更多的CFI多肽。因此Co01被排序为最高表达者。
针对密码子优化的CFI序列“Co01”和19个其他密码子优化的CFI序列Co02至Co20(分别为SEQ ID NO:22至40),测量了转染到Huh-7细胞中之后培养基中的CFI表达水平。每个表达盒包含LSP-S启动子和BgpA多聚A序列。每个密码子优化的CFI序列(Co02至Co20)以与Co01相似或更高的水平表达CFI多肽。具体而言,密码子优化的CFI序列Co02、Co03、Co05、Co06、Co07、Co09、Co10、Co11、Co12、Co14、Co15、Co16、Co17和Co20被排序为比Co01更高的CFI多肽表达者。
实施例2-各种密码子优化序列的体内CFI表达
通过将表达盒载体化到AAV2/8伪型衣壳中并通过全身尾静脉注射转导小鼠进一步体内评估密码子优化的CFI序列Co01、Co05、Co07、Co11、Co12、Co13、Co14、Co16和Co17(SEQ ID NO:分别为21、25、27、31、32、33、34、36和37)。
方法
独特的密码子优化的CFI序列以ITR-启动子-[密码子优化的CFI]-多聚A-ITR的方向被克隆到包含反向末端重复序列的质粒中。包含LSP-S启动子、BgpA多聚A序列和CFI密码子优化序列之一(Co01、Co05、Co07、Co11、Co12、Co13、Co14、Co16或Co17)的AAV2/8-CFI载体由使用聚乙烯亚胺作为横断试剂的三重转染方法产生(Grieger等人Nature Protocols2006;1(3):1412-1428或类似的),通过柱层析纯化并使用qPCR测定滴定。对于密码子优化的CFI载体的每个实验组,将载体稀释至等效浓度并注射到C57Bl/6小鼠的尾静脉中。剂量为2x1012vg/kg,并且研究在注射后4周终止。在研究结束时,通过心脏穿刺将血液收集到抗凝剂(柠檬酸钠)中,通过离心处理血浆并储存在-80℃直到CFI水平可以通过ELISA表征。还收集了肝脏,用液氮快速冷冻并储存用于未来通过qPCR对载体基因组进行定量。
根据制造商的说明,使用CFI ELISA试剂盒(例如Hycult目录号HK355-01)评估鼠血浆中的CFI表达。简而言之,将鼠血浆样品(必要时用试剂盒中的样品稀释剂稀释)和来自试剂盒的人CFI标准品在包被有抗人CFI抗体(以捕获人CFI)的微量滴定孔中孵育。添加生物素化示踪抗体(以结合捕获的人CFI),然后加入链霉亲和素-过氧化物酶缀合物(以结合生物素化示踪抗体)。然后加入与链霉亲和素-过氧化物酶缀合物反应的底物四甲基联苯胺(TMB)。通过加入草酸终止酶反应。对于每个样品和标准品,使用分光光度计测量450nm处的吸光度。通过绘制吸光度(线性)对人CFI标准品的相应浓度(对数)的图获得标准曲线。然后根据标准曲线确定样品中人CFI的浓度。
在通过qPCR测定进行载体基因组定量之前,将肝脏匀浆并使用QIAGEN DNeasyBlood and Tissue试剂盒(目录号69506)提取和纯化DNA。根据需要通过用RNaseA处理样品来消化RNA。对分离的DNA进行qPCR反应:第一个是量化鼠肝脏中靶(即密码子优化的CFI)载体基因组的数量,第二个是量化管家基因组的拷贝数基因(例如GAPDH)。将密码子优化的载体基因组的拷贝数除以管家基因的拷贝数以确定每个细胞的密码子优化的载体基因组的拷贝数。使用标准方法进行qPCR测定。对于密码子优化的CFI序列,将结合AAV包装DNA的共同序列(例如启动子内的序列)的引物对用于扩增DNA。使用PowerUp Sybr green(LifeTechnologies,目录号A25743)监测DNA扩增,并通过标准曲线的插值法进行量化。
结果
每个密码子优化的CFI序列(Co05、Co07、Co11、Co12、Co13、Co14、Co16和Co17)在小鼠血浆中以与Co01相似或更高的水平表达CFI多肽。特别地,密码子优化的CFI序列Co05、Co07、Co12、Co14、Co16和Co17被排序为比Co01更高的CFI蛋白表达者。Co05、Co07和Co14被排序为表达量最高的前三者。Co05被排序为最高表达者。
实施例3-将AAV-CFI施用至酵母聚糖诱导的腹膜炎模型
通过AAV-CFI施用抑制酵母聚糖诱导的腹膜炎模型中的炎症
进行实验以确定使用表达CFI的AAV进行的治疗是否可以减少酵母聚糖诱导的腹膜炎模型中的炎症。先前已经证明,酵母聚糖诱导的腹膜炎至少部分由C3介导(Mullalyand Kubes.Eur.J.Immunol.2007.37:224–234)。简而言之,对C57BL/6小鼠和对于C3纯合阴性的小鼠(C3-/-)腹膜内注射酵母聚糖(5mg/kg)或盐水,并在酵母聚糖处理后4小时测定腹膜嗜中性粒细胞的数量。在没有C3的情况下,募集到腹膜腔中的嗜中性粒细胞数量显著下降。
为了确定表达CFI的AAV是否可以减轻炎症,在酵母聚糖处理之前,向C57BL/b小鼠施用包含CFI的AAV8(通过HEK293T细胞的三重质粒瞬时转染制备)。给小鼠施用6x1011、2x1012或6x1013vg/kg剂量的AAV。AAV包含Co01密码子优化的CFI核苷酸序列(SEQ ID NO:21)和CAG启动子(SEQ ID NO:61)。在施用包含CFI的AAV8后16周,以5mg/kg体重的剂量施用酵母聚糖。在酵母聚糖处理后4小时测定腹膜嗜中性粒细胞的数量。通过灌洗腹腔收集腹膜嗜中性粒细胞,对细胞进行染色以用于FACS分析并根据Cash等人(2009),Methods inEnzymology,Volume 461,p.379-396中第3节的方法计数。通过ELISA确定血液中的人CFI表达水平(从尾静脉收集)。
图1A显示了CFI在血液中的剂量依赖性表达。在酵母聚糖处理后,CFI表达导致腹膜嗜中性粒细胞浸润的剂量依赖性减少(参见图1B)。图1C显示了CFI表达与嗜中性粒细胞计数之间的负相关。
实施例4-将AAV-CFI施用至狼疮性肾炎模型
MRL-lpr小鼠模型(狼疮性肾炎小鼠模型)的小鼠用包含CFI的AAV8(通过HEK293T细胞的三重质粒瞬时转染制备)处理。有四个处理组。从6周龄开始,根据下表1对小鼠进行处理。处理持续19周,小鼠在25周龄时被安乐死。将26只MRL/MpJ-Faslpr/J(JAX库存号000485)雌性小鼠分配到3个处理组(处理组1、2和4)。处理组1包含10只小鼠,其仅用媒介物处理。处理组2包含10只小鼠,其用包含CFI的AAV以6x1013vg/kg的剂量处理。AAV包含Co01密码子优化的CFI核苷酸序列和CAG启动子。处理组4包含6只小鼠,其用25mg/kg的环磷酰胺处理。处理组3是包含仅用媒介物处理的5只MRL/MpJ(JAX库存号000486)小鼠的对照组。
MRL/MpJ-Faslpr/J(通常称为MRL-lpr或lpr突变体)对于淋巴组织增生自发突变(Faslpr)是纯合的。(https://www.jax.org/strain/000485)。MRL/MpJ是MRL/MpJ-Faslpr的亲本和对照株系。MRL/MpJ小鼠携带正常的Fas基因。(https://www.jax.org/strain/000486)。
表1
小鼠数量 株系 化合物 给药途径 给药频率
1 10 MRL/MpJ-Faslpr/J 媒介物 IV 单次注射
2 10 MRL/MpJ-Faslpr/J AAV-CFI IV 单次注射
3 5 MRL/MpJ 媒介物 IV 单次注射
4 6 MRL/MpJ-Faslpr/J 环磷酰胺 IP 每周两次
IV=静脉注射;IP=腹膜内
通过使用
Figure BDA0004091717840001251
和Beckman AU680化学分析仪测量尿液中的ACR(白蛋白肌酸酐比率)每两周监测蛋白尿,结果如图2所示。来自处理组2的10只小鼠中有3只分别在9周龄、15周龄和22周龄时死亡。收集蛋白尿数据直至死亡。使用包含CFI的AAV进行的处理导致蛋白尿减少。
安乐死后,收集肾脏并将来自每只小鼠的一个肾脏固定在10%中性缓冲***中。然后对组织进行处理并包埋在石蜡中。肾脏用高碘酸席夫(PAS)染色剂染色。用显微镜评估肾脏。显微镜检查对处理组在不知情的情况下进行。病理变化在PAS染色切片上按用于增加的严重程度的0-4的升序量表进行半定量分级,0表示无病理,1表示轻度病理,2表示中度病理,3表示显著病理,4表示严重病理。
使用GraphPad Prism版本8.1.1将半定量评分作为非参数数据进行统计比较。Mann-Whitney/Kruskal-Wallis检验用于比较所有组。通过比较处理组与媒介物处理组来分析处理效果。统计显著性分配为p值<0.05(*<0.05,**<0.01,***<0.001,****<0.0001)。来自处理组2的10只小鼠中有7只进行了组织病理学检查。
图3显示与仅媒介物对照(处理组1)相比,在使用AAV-CFI(处理组2)处理时肾小球和肾小管的病理的减少。
实施例5-密码子优化的序列的Huh7体外转染研究
基于瞬时反向转染Huh7细胞后产生的蛋白质量(w/v)筛选和排序独特的密码子优化的人CFI序列。每个密码子优化的序列编码野生型人CFI多肽。
方法
产生表达盒,其包含密码子优化的CFI序列之一或用于对照目的的野生型CFI序列。使用的启动子是“LSP-S”(SEQ ID NO:51),它是一种肝脏特异性转录调节元件。
对于包含独特的密码子优化的CFI基因之一的每个表达盒,瞬时转染需要混合携带这样的表达盒的质粒与转染试剂(
Figure BDA0004091717840001261
HD(Promega,目录号E2311))并将混合物递送至细胞以使得可以表达基因,随后通过ELISA对蛋白质进行定量。在适用的情况下,萤光素酶报道基因被包含在转染混合物中作为评估转染效率的一种方式。
Huh7细胞培养和转染:简而言之,将0.8μg测试质粒DNA和0.08μg TK-萤光素酶对照质粒与FuGENE以每μg DNA 3μl的FuGENE(或每0.33μg质粒DNA 1μl的FuGENE)的比例混合。将50μL转染混合物转移到24孔板中。然后将300,000个Huh7细胞(JCRB细胞库,编号JCRB0403)接种到每孔450μL DMEM低葡萄糖、10%FBS+Glutamax(D10培养基)中。将质粒DNA转染试剂混合物与细胞在37℃和5%CO2下培养过夜。转染后约24小时,培养基被替换为500μL DMEM低葡萄糖+Glutamax+胰岛素-转铁蛋白-硒补充剂(D0/ITS培养基)。24小时后收获培养基(上清液)。
根据制造商的说明,使用CFI ELISA试剂盒(Hycult目录号HK355-02)评估培养基(上清液)中的CFI表达。简而言之,将未稀释的培养基样品和来自试剂盒的人CFI标准品在包被有抗人CFI抗体(以捕获人CFI)的微量滴定孔中孵育。添加生物素化示踪抗体(以结合捕获的人CFI),然后加入链霉亲和素-过氧化物酶缀合物(以结合生物素化示踪抗体)。然后加入与链霉亲和素-过氧化物酶缀合物反应的底物四甲基联苯胺(TMB)。通过加入草酸终止酶反应。对于每个样品和标准品,使用Molecular Devices SpectraMax i3x读板器测量450nm处的吸光度。通过绘制吸光度(线性)对人CFI标准品的相应浓度(对数)的图来获得标准曲线。然后根据标准曲线确定样品中人CFI的浓度。
使用Nano-
Figure BDA0004091717840001271
萤光素酶测定***(Promega目录号N1120)测量上清液的萤光素酶表达。将20μL上清液在培养基中稀释至100μL的最终体积,并与等体积的Nano-/>
Figure BDA0004091717840001272
萤光素酶测定试剂混合。在室温下孵育3分钟后,在Molecular Devices SpectraMax i3x读板器上通过发光测量萤光素酶表达。详细的方案发表在Promega Nano-Glo LuciferaseAssay System Technical Manual#TM369中。
萤光素酶表达用作内部对照以使CFI表达水平标准化。使用软件Graphpad Prismv9.0.1进行分析。
结果
针对野生型人CFI核苷酸序列和20个密码子优化的人CFI序列(Co01至Co20,分别为SEQ ID NO:21至40),测量了转染到Huh-7细胞中之后培养基中的CFI表达水平。如上所述,使用萤光素酶表达对CFI表达水平进行标准化。每个表达盒包含LSP-S启动子和BgpA多聚A序列。
图5显示了比野生型CFI序列表达更高的所有测试的密码子优化的CFI序列(Co01到Co20)。
实施例6:当转基因处于不同启动子的控制下时体外Huh7细胞中CFI表达的比较
制备了三个单独的测试质粒DNA构建体,其中掺入了密码子优化的转基因序列(Co05,SEQ ID NO:25),其编码在FRE72启动子(SEQ ID NO:65)或“LSP-S”(SEQ ID NO:51)或“LSP-L”(SEQ ID NO:52)启动子(其各自是肝脏特异性转录调节元件)的控制下的野生型人CFI蛋白。
为了比较每个启动子的表达水平,将Huh7细胞(JCRB细胞库,编号JCRB0403)接种于96孔板(每孔30,000个细胞)中的DMEM低葡萄糖、10%FBS+Glutamax(D10培养基)中并在37℃和5%CO2下培养(第1天)。第二天(细胞接种后约24小时;第2天),制备质粒DNA转染试剂混合物并将其转染到Huh7细胞中。将0.225μg测试质粒DNA和0.025μg CMV-萤光素酶对照质粒与FuGENE以每μg DNA 4μl的FuGENE(或每0.25μg质粒DNA 1μl的FuGENE)的比例混合。对于96孔转染实验,每孔加入1μl FuGENE混合物。将质粒DNA转染试剂混合物在37℃和5%CO2下在细胞上孵育过夜。
第二天早上(第3天),转染后约18小时,将培养基更换为新鲜的D10培养基,并将细胞在37℃和5%CO2下孵育过夜。第二天早上(24小时后;第4天),培养基被新鲜的DMEM低葡萄糖+Glutamax+胰岛素-转铁蛋白-硒补充剂(D0/ITS培养基)取代。第二天(第5天)收集细胞和培养基。
使用ELISA试剂盒评估培养基中的蛋白质表达。
与ELISA平行,用磷酸缓冲盐水(PBS)洗涤Huh7细胞两次,并用来自萤光素酶测定试剂盒(Promega目录号E1501/E4530)的100μl萤光素酶裂解缓冲液处理细胞。将细胞裂解物储存在-80℃。在萤光素酶测定当天,将细胞裂解物解冻,并使用20μl样品在MolecularDevices SpectraMax i3x板读数器上通过发光测量萤光素酶表达。详细的方案发表在Promega Technical Bulletin#TB281中。萤光素酶表达用作内部对照以使蛋白质水平标准化。使用软件Graphpad Prism v7进行分析。
结果如图6A(萤光素酶校正前)和图6B(萤光素酶校正后)所示。
实施例7:当转基因处于不同启动子的控制下时体外Huh7细胞中CFI表达的比较
基于瞬时转染Huh7细胞后产生的蛋白质的量(w/v)筛选并排序新的基于hAAT的TRE。每个新的基于hAAT的TRE与野生型人CFI多肽(具有SEQ ID NO:25的序列的野生型人CFI多肽)缀合。
方法
产生表达盒,其包含新的基于hAAT的TRE之一(每个TRE具有SEQ ID NO:68-91之一的序列)或HCR-hAAT(SEQ ID NO:67)、HLP2(SEQ ID NO:51)或FRE72(SEQ ID NO:66)以用于对照目的。
对于包含TRE之一的每个表达盒,瞬时转染需要混合携带这样的表达盒的质粒与转染试剂(
Figure BDA0004091717840001291
HD(Promega,目录号E2311))并将混合物递送至细胞以使得可以表达基因,随后通过ELISA对蛋白质进行定量。在每种情况下,萤光素酶报告基因被包含在转染混合物中作为评估转染效率的一种方式。
Huh7细胞培养和转染:将Huh7细胞(JCRB细胞库,编号JCRB0403)接种于96孔板(每孔30,000个细胞)中的DMEM低葡萄糖、10%FBS+Glutamax(D10培养基)中,在37℃和5%CO2下培养(第1天)。第二天(细胞接种后约24小时;第2天),制备质粒DNA转染试剂混合物并将其转染到Huh7细胞中。简而言之,将0.225μg测试质粒DNA和0.025μg CMV-萤光素酶对照质粒(FLJ-PL282)与FuGENE以每μg DNA 4μl的FuGENE(或每0.25μg质粒DNA 1μl的FuGENE)的比例混合。此外,将0.25μg CMV-萤光素酶对照质粒(FLJ-PL282)与FuGENE以每μg DNA 4μl的FuGENE的比例混合以用作萤光素酶测定的阳性对照。对于96孔转染实验,每孔加入10μl质粒DNA-FuGENE混合物。将质粒DNA转染试剂混合物在37℃和5%CO2条件下在细胞上孵育过夜。第二天早上(第3天),转染后约18小时,将培养基更换为新鲜的D10培养基,并将细胞在37℃和5%CO2下孵育过夜。第二天早上(24小时后;第4天),培养基被新鲜的DMEM低葡萄糖+Glutamax+胰岛素-转铁蛋白-硒补充剂(D0/ITS培养基)取代。第二天(第5天)收集细胞和培养基。
根据制造商的说明,使用CFI ELISA试剂盒(例如Hycult目录号HK355-01)评估培养基中的CFI表达。简而言之,将培养基样品(必要时用试剂盒中的样品稀释剂稀释)和来自试剂盒的人CFI标准品在包被有抗人CFI抗体(以捕获人CFI)的微量滴定孔中孵育。添加生物素化示踪抗体(以结合捕获的人CFI),然后加入链霉亲和素-过氧化物酶缀合物(以结合生物素化示踪抗体)。然后加入与链霉亲和素-过氧化物酶缀合物反应的底物四甲基联苯胺(TMB)。通过加入草酸终止酶反应。对于每个样品和标准品,使用分光光度计测量450nm处的吸光度。通过绘制吸光度(线性)对人CFI标准品的相应浓度(对数)的图来获得标准曲线。然后根据标准曲线确定样品中人CFI的浓度。
与ELISA平行,Huh7细胞用磷酸缓冲盐水(PBS)洗涤两次,并用来自萤光素酶测定试剂盒(Promega目录号E1501/E4530)的100μl萤光素酶裂解缓冲液处理细胞。将细胞裂解物储存在-80℃。在萤光素酶测定当天,解冻细胞裂解物并使用20μl样品在MolecularDevices SpectraMax i3x读板器上通过发光测量萤光素酶表达。详细的方案发表在Promega Technical Bullitin#TB281中。在适用的情况下,萤光素酶表达用作内部对照以使CFI表达水平标准化。使用软件Graphpad Prism v7进行分析。
结果
转染到Huh-7细胞中后培养基中的CFI表达水平针对HCR-hAAT、HLP2、FRE72和二十四种其他基于hAAT的TRE进行了测量。如上所述,使用萤光素酶表达对C FI表达水平进行标准化。每个表达盒包含野生型人CFI和BgpA多聚A序列。该数据显示在图9-11中。所有新的基于hAAT的TRE都促进了比所有HCR-hAAT、HLP2和FRE72更高的表达。
本发明的编号的方面
1.一种包含补体因子I(CFI)核苷酸序列的多核苷酸,其中CFI核苷酸序列编码CFI多肽或其片段,并且其中CFI核苷酸序列的至少一部分不是野生型的。
2.方面1的多核苷酸,其中非野生型的CFI核苷酸序列部分是密码子优化的。
3.方面1或2的多核苷酸,其中CFI核苷酸序列包含与SEQ ID NO:1-40中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
4.一种包含CFI核苷酸序列的多核苷酸,其中CFI核苷酸序列编码CFI多肽或其片段,并且CFI核苷酸序列包含与SEQ ID NO:1-40中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
5.前述方面中任一项的多核苷酸,其中所述CFI核苷酸序列包含与SEQ ID NO:2、3、5、6、7、9-12、14-17、20、22、23、25、26、27、29-32、34-37和40中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
6.前述方面中任一项的多核苷酸,其中所述CFI核苷酸序列包含与SEQ ID NO:1、5、7、11-14、16、17、21、25、27、31-34、36和37中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
7.前述方面中任一项的多核苷酸,其中所述CFI核苷酸序列包含与SEQ ID NO:1、5、7、11、12、14、16、17、21、25、27、31、32、34、36和37中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
8.前述方面中任一项的多核苷酸,其中所述CFI核苷酸序列包含与SEQ ID NO:5、7、12、14、16、17、25、27、32、34、36和37中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
9.前述方面中任一项的多核苷酸,其中所述CFI核苷酸序列包含与SEQ ID NO:5、7、14、25、27和34中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
10.前述方面中任一项的多核苷酸,其中所述CFI核苷酸序列包含与SEQ ID NO:3、5-7、10、14、17、20、23、25-27、30、34、37和40中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
11.前述方面中任一项的多核苷酸,其中所述CFI核苷酸序列包含与SEQ ID NO:5、10、17、25、30和37中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
12.前述方面中任一项的多核苷酸,其中所述CFI核苷酸序列包含与SEQ ID NO:5或25中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
13.前述方面中任一项的多核苷酸,其中所述CFI核苷酸序列包含与SEQ ID NO:1-40中任一个的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
14.前述方面中任一项的多核苷酸,其中所述CFI核苷酸序列包含与SEQ ID NO:2、3、5、6、7、9-12、14-17、20、22、23、25、26、27、29-32、34-37和40中任一个的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
15.前述方面中任一项的多核苷酸,其中所述CFI核苷酸序列包含与SEQ ID NO:1、5、7、11-14、16、17、21、25、27、31-34、36和37中任一个的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
16.前述方面中任一项的多核苷酸,其中所述CFI核苷酸序列包含与SEQ ID NO:1、5、7、11、12、14、16、17、21、25、27、31、32、34、36和37中任一个的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
17.前述方面中任一项的多核苷酸,其中所述CFI核苷酸序列包含与SEQ ID NO:5、7、12、14、16、17、25、27、32、34、36和37中任一个的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
18.前述方面中任一项的多核苷酸,其中所述CFI核苷酸序列包含与SEQ ID NO:5、7、14、25、27和34中任一个的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
19.前述方面中任一项的多核苷酸,其中所述CFI核苷酸序列包含与SEQ ID NO:3、5-7、10、14、17、20、23、25-27、30、34、37和40中任一个的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
20.前述方面中任一项的多核苷酸,其中所述CFI核苷酸序列包含与SEQ ID NO:5、10、17、25、30和37中任一个的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
21.前述方面中任一项的多核苷酸,其中所述CFI核苷酸序列包含与SEQ ID NO:5或25的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
22.前述方面中任一项的多核苷酸,其中所述CFI核苷酸序列包含SEQ ID NO:1-20中任一个的序列,或其变体,其编码包含与SEQ ID NO:44的野生型CFI氨基酸序列至少95%相同的序列的CFI多肽。
23.方面22的多核苷酸,其中变体是SEQ ID NO:5、7和14中任一个的变体。
24.方面22的多核苷酸,其中变体是SEQ ID NO:5、10和17中任一个的变体。
25.方面23或24的多核苷酸,其中变体是SEQ ID NO:5的变体。
26.方面22至25中任一项的多核苷酸,其中所述变体编码具有至少70%、至少80%、至少90%或至少100%的野生型CFI的CFI活性的CFI多肽。
27.方面26的多核苷酸,其中CFI活性包括C3b-失活和/或iC3b-降解活性。
28.方面22至27中任一项的多核苷酸,其中SEQ ID NO:5的变体与SEQ ID NO:5相同,除了它包含核苷酸取代以使得CFI多肽相对于SEQ ID NO:44的野生型CFI氨基酸序列具有1个、2个或更少、3个或更少、4个或更少、5个或更少、6个或更少、7个或更少、8个或更少、9个或更少或10个或更少的氨基酸取代。
29.方面22至28中任一项的多核苷酸,其中SEQ ID NO:5的变体相对于SEQ ID NO:5的序列具有1个、2个或更少、3个或更少、4个或更少、5个或更少、6个或更少、7个或更少、8个或更少、9个或更少、10个或更少、20个或更少或30个或更少的核苷酸取代。
30.方面22至29中任一项的多核苷酸,其中SEQ ID NO:5的变体相对于SEQ ID NO:5的序列具有1个、2个或更少、3个或更少、4个或更少、5个或更少或6个或更少的核苷酸取代。
31.方面22至30中任一项的多核苷酸,其中SEQ ID NO:5的变体相对于SEQ ID NO:5的序列具有4个或更少的核苷酸取代和/或编码相对于SEQ ID NO:44的野生型CFI氨基酸序列具有3个或更少的氨基酸取代的CFI多肽。
32.方面22至31中任一项的多核苷酸,其中SEQ ID NO:5的变体相对于SEQ ID NO:5的序列具有3个或更少的核苷酸取代和/或编码相对于SEQ ID NO:44的野生型CFI氨基酸序列具有2个或更少的氨基酸取代的CFI多肽。
33.方面22至32中任一项的多核苷酸,其中SEQ ID NO:5的变体相对于SEQ ID NO:5的序列具有1个核苷酸取代和/或编码相对于SEQ ID NO:44的野生型CFI氨基酸序列具有1个氨基酸取代的CFI多肽。
34.前述方面中任一项的多核苷酸,其中所述CFI核苷酸序列编码相对于SEQ IDNO:44的野生型CFI氨基酸序列具有1个、2个或更少、3个或更少、4个或更少或5个或更少的氨基酸取代的CFI多肽。
35.前述方面中任一项的多核苷酸,其中所述CFI核苷酸序列编码相对于SEQ IDNO:44的野生型CFI氨基酸序列具有3个或更少的氨基酸取代的CFI多肽。
36.前述方面中任一项的多核苷酸,其中所述CFI核苷酸序列编码相对于SEQ IDNO:44的野生型CFI氨基酸序列具有2个或更少的氨基酸取代的CFI多肽。
37.前述方面中任一项的多核苷酸,其中所述CFI核苷酸序列编码相对于SEQ IDNO:44的野生型CFI氨基酸序列具有1个氨基酸取代的CFI多肽。
38.前述方面中任一项的多核苷酸,其中CFI核苷酸序列包含与SEQ ID NO:1-40中任一个的至少1500个核苷酸的片段至少98%相同的序列。
39.前述方面中任一项的多核苷酸,其中CFI核苷酸序列包含与SEQ ID NO:1-40中任一个的至少1500个核苷酸的片段至少99%相同的序列。
40.前述方面中任一项的多核苷酸,其中CFI核苷酸序列包含与SEQ ID NO:1-40中任一个的核苷酸序列至少98%相同的序列。
41.前述方面中任一项的多核苷酸,其中CFI核苷酸序列包含与SEQ ID NO:1-40中任一个的核苷酸序列至少99%相同的序列。
42.前述方面中任一项的多核苷酸,其中CFI核苷酸序列包含与SEQ ID NO:5或25的至少1500个核苷酸的片段至少98%同一的序列。
43.前述方面中任一项的多核苷酸,其中CFI核苷酸序列包含与SEQ ID NO:5或25的至少1500个核苷酸的片段至少99%同一的序列。
44.前述方面中任一项的多核苷酸,其中所述CFI核苷酸序列包含与SEQ ID NO:5或25至少98%相同的序列。
45.前述方面中任一项的多核苷酸,其中所述CFI核苷酸序列包含与SEQ ID NO:5或25至少99%相同的序列。
46.前述方面中任一项的多核苷酸,其中所述CFI核苷酸序列包含SEQ ID NO:5或25的序列。
47.方面3至46中任一项的多核苷酸,其中CFI核苷酸序列的至少一部分是密码子优化的。
48.方面2或47的多核苷酸,其中密码子优化的CFI核苷酸序列部分针对在人肝细胞中的表达进行了密码子优化。
49.前述方面中任一项的多核苷酸,其中CFI核苷酸序列针对在人肝细胞中的表达进行了密码子优化。
50.方面2、47或48中任一项的多核苷酸,其中密码子优化的CFI核苷酸序列部分是连续部分。
51.方面2、47、48或50中任一项的多核苷酸,其中密码子优化的CFI核苷酸序列部分的长度为至少1000、至少1200、至少1300、至少1400、至少1500、至少1600、至少1700、1752或更少、1300至1752、1500至1752、1600至1752或约1752个核苷酸。
52.方面2、47、48、50或51中任一项的多核苷酸,其中密码子优化的CFI核苷酸序列部分的长度为至少1000、至少1200、至少1300、至少1400、至少1500、1698或更少、1300至1698、1500至1698或约1698个核苷酸。
53.方面2、47、48或50至52中任一项的多核苷酸,其中密码子优化的CFI核苷酸序列部分编码成熟CFI多肽。
54.方面2、47、48或50至53中任一项的多核苷酸,其中密码子优化的CFI核苷酸序列部分编码全部或部分信号肽。
55.方面2、47、48或50至54中任一项的多核苷酸,其中密码子优化的CFI核苷酸序列部分不编码全部或部分信号肽。
56.方面2、47至55中任一项的多核苷酸,其中在密码子优化的CFI核苷酸序列或CFI核苷酸序列部分中,至少70%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%或至少81%、至少82%、至少83%或至少84%的密码子选自:GCT、GCC、TGC、GAC、GAG、TTC、GGA、GGC、CAC、ATC、AAG、CTG、AAT、AAC、CCT、CCC、CAG、AGG、AGA、AGT、AGC、ACC、GTG和TAC。
57.方面56的多核苷酸,其中在密码子优化的CFI核苷酸序列或CFI核苷酸序列部分中,至少83%或至少84%的密码子选自:GCT、GCC、TGC、GAC、GAG、TTC、GGA、GGC、CAC、ATC、AAG、CTG、AAT、AAC、CCT、CCC、CAG、AGG、AGA、AGT、AGC、ACC、GTG和TAC。
58.前述方面中任一项的多核苷酸,其中与参考CFI核苷酸序列的对应部分相比,密码子优化的CFI核苷酸序列或CFI核苷酸序列部分包含减少数量的CpG。
59.方面58的多核苷酸,其中密码子优化的CFI核苷酸序列或CFI核苷酸序列部分包含40个或更少、20个或更少、15个或更少、10个或更少或5个或更少的CpG。
60.方面59的多核苷酸,其中密码子优化的CFI核苷酸序列或CFI核苷酸序列部分每100个核苷酸包含5个或更少、4个或更少、3个或更少或2个或更少的CpG。
61.方面58至60中任一项的多核苷酸,其中密码子优化的CFI核苷酸序列或CFI核苷酸序列部分是无CpG的。
62.方面58至61中任一项的多核苷酸,其中参考CFI核苷酸序列是野生型CFI核苷酸序列。
63.方面62的多核苷酸,其中野生型CFI核苷酸序列是SEQ ID NO:41或42的核苷酸序列。
64.方面2、47、48或50至63中任一项的多核苷酸,其中密码子优化的CFI核苷酸序列部分与SEQ ID NO:1-20中任一个的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。
65.方面2、47、48或50至64中任一项的多核苷酸,其中密码子优化的CFI核苷酸序列部分与SEQ ID NO:2、3、5、6、7、9-12、14-17和20中任一个的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。
66.方面2、47、48或50至65中任一项的多核苷酸,其中密码子优化的CFI核苷酸序列部分与SEQ ID NO:1、5、7、11-14、16和17中任一个的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。
67.方面2、47、48或50至66中任一项的多核苷酸,其中密码子优化的CFI核苷酸序列部分与SEQ ID NO:1、5、7、11、12、14、16和17中任一个的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。
68.方面2、47、48或50至67中任一项的多核苷酸,其中密码子优化的CFI核苷酸序列部分与SEQ ID NO:5、7、12、14、16和17中任一个的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。
69.方面2、47、48或50至68中任一项的多核苷酸,其中密码子优化的CFI核苷酸序列部分与SEQ ID NO:5、7和14中任一个的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。
70.方面2、47、48或50至69中任一项的多核苷酸,其中密码子优化的CFI核苷酸序列部分与SEQ ID NO:3、5-7、10、14、17和20中任一个的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。
71.方面2、47、48或50至70中任一项的多核苷酸,其中密码子优化的CFI核苷酸序列部分与SEQ ID NO:5、10和17中任一个的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。
72.方面2、47、48或50至71中任一项的多核苷酸,其中密码子优化的CFI核苷酸序列部分与SEQ ID NO:5的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。
73.方面2、47、48或50至72中任一项的多核苷酸,其中密码子优化的CFI核苷酸序列部分与SEQ ID NO:1-20中的任一个至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。
74.方面2、47、48或50至73中任一项的多核苷酸,其中密码子优化的CFI核苷酸序列部分与SEQ ID NO:2、3、5、6、7、9-12、14-17和20中的任一个至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。
75.方面2、47、48或50至74中任一项的多核苷酸,其中密码子优化的CFI核苷酸序列部分与SEQ ID NO:1、5、7、11-14、16和17中的任一个至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。
76.方面2、47、48或50至75中任一项的多核苷酸,其中密码子优化的CFI核苷酸序列部分与SEQ ID NO:1、5、7、11、12、14、16和17中的任一个至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。
77.方面2、47、48或50至76中任一项的多核苷酸,其中密码子优化的CFI核苷酸序列部分与SEQ ID NO:5、7、12、14、16和17中的任一个至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。
78.方面2、47、48或50至77中任一项的多核苷酸,其中密码子优化的CFI核苷酸序列部分与SEQ ID NO:5、7和14中的任一个至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。
79.方面2、47、48或50至78中任一项的多核苷酸,其中密码子优化的CFI核苷酸序列部分与SEQ ID NO:3、5-7、10、14、17和20中的任一个至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。
80.方面2、47、48或50至79中任一项的多核苷酸,其中密码子优化的CFI核苷酸序列部分与SEQ ID NO:5、10和17中的任一个至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。
81.方面2、47、48或50至80中任一项的多核苷酸,其中密码子优化的CFI核苷酸序列部分与SEQ ID NO:5的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。
82.方面2、47、48或50至81中任一项的多核苷酸,其中密码子优化的CFI核苷酸序列部分与SEQ ID NO:5至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。
83.方面2、47、48或50至82中任一项的多核苷酸,其中密码子优化的CFI核苷酸序列部分与SEQ ID NO:5的至少1500个核苷酸的片段至少99.5%、至少99.8%或100%相同。
84.方面2、47、48或50至83中任一项的多核苷酸,其中密码子优化的CFI核苷酸序列部分与SEQ ID NO:5至少99%、至少99.5%、至少99.8%或100%相同。
85.前述方面中任一项的多核苷酸,其中与由参考CFI核苷酸序列编码的CFI多肽的表达相比,由CFI核苷酸序列编码的CFI多肽或其片段在人肝细胞中以相同或更高的水平表达。
86.方面85的多核苷酸,其中与在用包含参考CFI核苷酸序列的等效多核苷酸转染时由参考CFI核苷酸编码的CFI多肽的表达相比,由CFI核苷酸序列编码的CFI多肽或其片段在将包含CFI核苷酸序列的多核苷酸转染到人肝细胞中时以相同或更高的水平表达。
87.方面85或86的多核苷酸,其中人肝细胞是Huh-7细胞。
88.方面85至87中任一项的多核苷酸,其中与由参考CFI核苷酸序列编码的CFI多肽的表达相比,由CFI核苷酸序列编码的CFI多肽或其片段的表达处于更高水平。
89.方面85至88中任一项的多核苷酸,其中由CFI核苷酸序列编码的CFI多肽或其片段的表达是由参考CFI核苷酸序列编码的CFI多肽的至少1.5x、至少2x、至少3x、至少5x、至少8x、至少10x、至少20x、至少30x、至少40x或至少50x。
90.方面88或89的多核苷酸,其中参考CFI核苷酸序列是野生型CFI核苷酸序列。
91.方面90的多核苷酸,其中野生型CFI核苷酸序列是SEQ ID NO:41或42的序列。
92.方面85至89中任一项的多核苷酸,其中参考CFI核苷酸序列是SEQ ID NO:1或21的序列。
93.方面85至89中任一项的多核苷酸,其中参考CFI核苷酸序列是SEQ ID NO:5或25的序列。
94.前述方面中任一项的多核苷酸,其中由CFI核苷酸序列编码的CFI多肽或其片段的表达是由SEQ ID NO:5或25的序列编码的CFI多肽的表达的至少50%、至少60%、至少70%、至少80%、至少90%、至少95%或至少100%。
95.前述方面中任一项的多核苷酸,其中CFI核苷酸序列编码信号肽。
96.方面95的多核苷酸,其中信号肽的氨基酸序列是野生型CFI信号肽的氨基酸序列。
97.方面95的多核苷酸,其中信号肽的氨基酸序列是其不是野生型CFI信号肽的信号肽的氨基酸序列。
98.前述方面中任一项的多核苷酸,其中所述多核苷酸还包含转录调节元件。
99.方面98的多核苷酸,其中转录调节元件包含肝脏特异性启动子。
100.方面98或99的多核苷酸,其中转录调节元件包含A1AT启动子或A1AT启动子的片段。
101.方面100的多核苷酸,其中转录调节元件包含A1AT启动子的两个片段。
102.方面101的多核苷酸,其中A1AT启动子的第一片段的长度为75至100个核苷酸并且A1AT启动子的第二片段的长度为25至50个核苷酸。
103.方面100-102中任一项的多核苷酸,其中所述多核苷酸包含与SEQ ID NO:66至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%或100%相同的启动子。
104.方面100·的多核苷酸,其中A1AT启动子的片段的长度为至少100个、至少120个、至少150个、至少180个、255个或更少、100至255个、150至225个、150至300个或180至255个核苷酸。
105.方面104的多核苷酸,其中A1AT启动子的片段的长度为180个255个核苷酸。
106.方面1至101、104或105中任一项的多核苷酸,其中所述多核苷酸包含与SEQID NO:47或SEQ ID NO:48至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的启动子。
107.方面106的多核苷酸,其中所述多核苷酸包含与SEQ ID NO:47或SEQ ID NO:48至少98%、至少99%、至少99.5%、至少99.8%或100%相同的启动子。
108.方面107的多核苷酸,其中所述多核苷酸包含SEQ ID NO:47或SEQ ID NO:48的启动子。
109.方面98至101或104至108中任一项的多核苷酸,其中转录调节元件包含长度等于或少于418个核苷酸、等于或少于255个核苷酸或等于或少于185个核苷酸并包含SEQID NO:47的A1AT启动子片段。
110.方面98至101或104至109中任一项的多核苷酸,其中转录调节元件包含增强子。
111.方面110的多核苷酸,其中增强子是HCR增强子或HCR增强子的片段。
112.方面111的多核苷酸,其中HCR增强子的片段是长度为至少80、至少90、至少100、192或更少、80至192、90至192、100至250或117至192个核苷酸的片段。
113.方面112的多核苷酸,其中HCR增强子的片段的长度为117至192个核苷酸。
114.如1至101或104至113中任一项的多核苷酸,其中该多核苷酸包含与SEQ IDNO:49或SEQ ID NO:50至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的增强子。
115.方面114的多核苷酸,其中所述多核苷酸包含与SEQ ID NO:49或SEQ ID NO:50至少98%、至少99%、至少99.5%、至少99.8%或100%相同的增强子。
116.方面115的多核苷酸,其中该多核苷酸包含SEQ ID NO:49或SEQ ID NO:50的增强子。
117.方面98至101或104至116中任一项的多核苷酸,其中转录调节元件包含HCR增强子的片段,其长度等于或少于321个核苷酸、等于或少于192个核苷酸或等于或少于117个核苷酸并包含SEQ ID NO:49。
118.方面98至101或104至117中任一项的多核苷酸,其中转录调节元件与SEQ IDNO:51至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。
119.方面118的多核苷酸,其中转录调节元件具有SEQ ID NO:51的序列。
120.前述方面中任一项的多核苷酸,其中:
(i)CFI核苷酸序列包含与SEQ ID NO:5或25至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列;和
(ii)多核苷酸包含与SEQ ID NO:47至少98%、至少99%、至少99.5%、至少99.8%或100%相同的启动子和/或与SEQ ID NO:49至少98%、至少99%、至少99.5%、至少99.8%或100%相同的增强子元件。
121.前述方面中任一项的多核苷酸,其中:
(i)CFI核苷酸序列包含与SEQ ID NO:5或25至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列;和
(ii)多核苷酸包含与SEQ ID NO:51至少98%、至少99%、至少99.5%、至少99.8%或100%相同的转录调节元件。
122.方面100的多核苷酸,其中A1AT启动子或A1AT启动子的片段的长度为至少200、至少250、至少300、500或更少、200至500、250至500、350至450或约418个核苷酸。
123.方面122的多核苷酸,其中A1AT启动子或A1AT启动子片段的长度为350至450个核苷酸。
124.方面111的多核苷酸,其中HCR增强子或HCR增强子的片段是长度为至少150、至少190、至少230、少于400、150至400、190至370、190至370、230至340、250至340或约321个核苷酸的片段。
125.方面124的多核苷酸,其中HCR增强子或HCR增强子的片段的长度为250至340个核苷酸。
126.方面98至101或104至125中任一项的多核苷酸,其中转录调节元件与SEQ IDNO:52至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。
127.方面126的多核苷酸,其中转录调节元件具有SEQ ID NO:52的序列。
128.方面1至99或122至125中任一项的多核苷酸,其中:
(i)CFI核苷酸序列包含与SEQ ID NO:5或25至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列;和
(ii)多核苷酸包含与SEQ ID NO:48至少98%、至少99%、至少99.5%、至少99.8%或100%相同的启动子和/或与SEQ ID NO:50至少98%、至少99%、至少99.5%、至少99.8%或100%相同的增强子元件。
129.方面1至99或122至128中任一项的多核苷酸,其中:
(i)CFI核苷酸序列包含与SEQ ID NO:5或25至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列;和
(ii)多核苷酸包含与SEQ ID NO:52至少98%、至少99%、至少99.5%、至少99.8%或100%相同的转录调节元件。
130.前述方面中任一项的多核苷酸,其中所述多核苷酸包含土拨鼠肝炎转录后调节元件(WPRE)。
131.前述方面中任一项的多核苷酸,其中所述多核苷酸包含土拨鼠肝炎转录后调节元件(WPRE),其与SEQ ID NO:62至64中的任一个至少98%、至少99%、至少99.5%、至少99.8%或100%相同。
132.前述方面中任一项的多核苷酸,其中所述多核苷酸包含土拨鼠肝炎转录后调节元件(WPRE),其与SEQ ID NO:62至64中的任一项至少98%相同。
133.前述方面中任一项的多核苷酸,其中所述多核苷酸包含SEQ ID NO:62至64中任一项的土拨鼠肝炎转录后调节元件(WPRE)。
134.方面98的多核苷酸,其中转录调节元件(TRE):
(a)促进比HCR-hAAT更高的表达;
(b)促进比FRE72更高的表达;
(c)包含hAAT序列元件;和/或
(d)包含AMBP序列元件。
135.方面134的多核苷酸,其中TRE的长度大于500、大于600、大于700、大于800、大于900、大于1000、大于1100、大于1200、大于1300、大于1400、大于1500或大于1600个核苷酸。
136.方面134或135的多核苷酸,其中TRE的长度小于2000、小于1800、小于1600、小于1500、小于1400、小于1300、小于1200、小于1100、小于1000、小于900、小于800、小于700或小于600个核苷酸。
137.方面134-136中任一项的多核苷酸,其中TRE的长度为400至2000、500至1800、600至1400、800至1600、500至600、600至700、700至800、800至900、900至1000、1000至1100、1100至1200、1200至1300、1300至1400、1400至1500、1500至1600或1600至1700个核苷酸。
138.方面134-137中任一项的多核苷酸,其中TRE包含hAAT序列元件。
139.方面134-138中任一项的多核苷酸,其中hAAT序列元件包含SEQ ID NO:95或SEQ ID NO:95的在1、2或3个核苷酸上不同的变体的核苷酸序列。
140.方面134-139中任一项的多核苷酸,其中hAAT序列元件包含SEQ ID NO:95的核苷酸序列。
141.方面134-140中任一项的多核苷酸,其中hAAT序列元件包含SEQ ID NO:96或SEQ ID NO:96的在1、2或3个核苷酸上不同的变体的核苷酸序列。
142.方面134-141中任一项的多核苷酸,其中hAAT序列元件包含SEQ ID NO:96的核苷酸序列。
143.方面134-142中任一项的多核苷酸,其中hAAT序列元件包含与SEQ ID NO:94或SEQ ID NO:94的至少200、至少300或至少400个核苷酸长的片段至少80%、至少85%、至少90%、至少95%、至少98%或至少99%相同的核苷酸序列。
144.方面134-143中任一项的多核苷酸,其中hAAT序列元件包含与SEQ ID NO:94至少98%相同的核苷酸序列。
145.方面134-144中任一项的多核苷酸,其中hAAT序列元件包含SEQ ID NO:94的核苷酸序列。
146.方面134-145中任一项的多核苷酸,其中TRE包含第一和第二hAAT序列元件。
147.方面146的多核苷酸,其中第二hAAT序列元件在第一hAAT序列元件的5'和AMBP序列元件的5'。
148.方面146或方面147的多核苷酸,其中第二hAAT序列元件包含SEQ ID NO:95或SEQ ID NO:95的在1、2或3个核苷酸上不同的变体的核苷酸序列。
149.方面148的TRE,其中第二hAAT序列元件包含SEQ ID NO:95的核苷酸序列。
150.方面134-149中任一项的多核苷酸,其中TRE包含AMBP序列元件。
151.方面134-150中任一项的多核苷酸,其中包含AMBP序列元件的TRE促进与缺乏AMBP序列元件的相应TRE相等或更高的表达。
152.方面134-151中任一项的多核苷酸,其中包含AMBP序列元件的TRE促进比缺乏AMBP序列元件的相应TRE更高的表达。
153.方面134-152中任一项的多核苷酸,其中所述AMBP序列元件包含至少一个选自以下的结合位点:HNF1-1结合位点、HNF4结合位点、HNF3a结合位点、HNF1-2结合位点和HNF3-2结合位点。
154.方面153的多核苷酸,其中所述AMBP序列元件包含HNF1-1结合位点、HNF4结合位点、HNF3a结合位点、HNF1-2结合位点和HNF3-2结合位点。
155.方面134-154中任一项的多核苷酸,其中所述AMBP序列元件包含SEQ ID NO:98或SEQ ID NO:98的在1、2或3个核苷酸上不同的变体的核苷酸序列。
156.方面134-155中任一项的多核苷酸,其中所述AMBP序列元件包含SEQ ID NO:98的核苷酸序列。
157.方面134-156中任一项的多核苷酸,其中所述AMBP序列元件包含SEQ ID NO:97或SEQ ID NO:97的在1、2或3个核苷酸上不同的变体的核苷酸序列。
158.方面134-157中任一项的多核苷酸,其中所述AMBP序列元件包含SEQ ID NO:97的核苷酸序列。
159.方面134-158中任一项的多核苷酸,其中AMBP序列元件在hAAT序列元件的5'。
160.方面134-159中任一项的多核苷酸,其中TRE是肝脏特异性的。
161.方面134-160中任一项的多核苷酸,其中TRE促进比HCR-hAAT更高的表达。
162.方面134-161中任一项的多核苷酸,其中TRE促进比FRE72更高的表达。
163.方面134-162中任一项的多核苷酸,其中TRE促进与HCR-hAAT相比至少1.2倍、至少1.5倍、至少1.8倍或至少2倍的表达。
164.方面134-163中任一项的多核苷酸,其中TRE促进与HCR-hAAT相比至少1.6倍或至少1.8倍的表达。
165.方面134-164中任一项的多核苷酸,其中TRE促进与FRE72相比至少1.2倍、至少1.5倍、至少1.8倍或至少2倍的表达。
166.方面134-165中任一项的多核苷酸,其中TRE促进与FRE72相比至少1.6倍或至少1.8倍的表达。
167.方面134-166中任一项的多核苷酸,其中表达通过表达测定来测量,所述表达测定包括:
(i)用包含表达盒的质粒转染人肝细胞,所述表达盒包含可操作地连接至TRE的转基因;
(ii)在适合发生转基因表达的条件下孵育转基因;和
(iii)使用对转基因编码的蛋白质具有特异性的抗体,通过ELISA测量转基因的水平。
168.方面167的多核苷酸,其中人肝细胞是Huh7细胞。
169.方面167或168的多核苷酸,其中转基因编码CFI(补体因子I)。
170.方面167-169中任一项的多核苷酸,其中转染人肝细胞的步骤(i)包括用包含表达盒的质粒共转染人肝细胞,所述表达盒包含可操作地连接到启动子的编码萤光素酶的转基因,并且表达测定还包括测量总萤光素酶表达。
171.方面134-170中任一项的多核苷酸,其中TRE包含ApoE-HCR1序列元件。
172.方面171的多核苷酸,其中包含ApoE-HCR1序列元件的TRE促进与缺乏ApoE-HCR1序列元件的相应TRE相等或更高的表达。
173.方面171或172的多核苷酸,其中包含ApoE-HCR1序列元件的TRE促进比缺乏ApoE-HCR1序列元件的相应TRE更高的表达。
174.方面171-173中任一项的多核苷酸,其中ApoE-HCR1序列元件包含SEQ ID NO:93或SEQ ID NO:93的在1、2或3个核苷酸上不同的变体的核苷酸序列。
175.方面171-174中任一项的多核苷酸,其中ApoE-HCR1序列元件包含SEQ ID NO:93的核苷酸序列。
176.方面171-175中任一项的多核苷酸,其中ApoE-HCR1序列元件包含SEQ ID NO:92或SEQ ID NO:92的在1、2或3个核苷酸上不同的变体的核苷酸序列。
177.方面171-176中任一项的多核苷酸,其中ApoE-HCR1序列元件在hAAT序列元件的5’。
178.方面171-177中任一项的多核苷酸,其中ApoE-HCR1序列元件在AMBP序列元件的5’。
179.方面171-177中任一项的多核苷酸,其中ApoE-HCR1序列元件在AMBP序列元件的3’。
180.方面171-178中任一项的多核苷酸,其中ApoE-HCR1序列元件在hAAT序列元件和AMBP序列元件两者的5'。
181.方面171-177或179中任一项的多核苷酸,其中ApoE-HCR1序列元件在hAAT序列元件的5’和AMBP序列元件的3'。
182.方面134-181中任一项的多核苷酸,其中TRE包含CRM6序列元件。
183.方面182的多核苷酸,其中包含CRM6序列元件的TRE促进与缺乏CRM6序列元件的相应TRE相等或更高的表达。
184.方面182或方面183的多核苷酸,其中包含CRM6序列元件的TRE促进与缺乏CRM6序列元件的相应TRE相等的表达。
185.方面182-184中任一项的多核苷酸,其中CRM6序列元件包含选自Sp1结合位点、Sp2结合位点、HNF3a结合位点和HNF-1结合位点的结合位点。
186.方面185的多核苷酸,其中CRM6序列元件包含Sp1结合位点、Sp2结合位点、HNF3a结合位点和HNF1结合位点。
187.方面182-186中任一项的多核苷酸,其中CRM6序列元件包含SEQ ID NO:100或SEQ ID NO:100的在1或2个核苷酸上不同的变体的核苷酸序列。
188.方面182-187中任一项的多核苷酸,其中CRM6序列元件包含SEQ ID NO:100的核苷酸序列。
189.方面182-188中任一项的多核苷酸,其中CRM6序列元件包含SEQ ID NO:101或SEQ ID NO:101的在1、2或3个核苷酸上不同的变体的核苷酸序列。
190.方面182-189中任一项的多核苷酸,其中CRM6序列元件包含SEQ ID NO:101的核苷酸序列。
191.方面182-190中任一项的多核苷酸,其中CRM6序列元件包含SEQ ID NO:100的核苷酸序列和SEQ ID NO:101的核苷酸序列。
192.方面182-191中任一项的多核苷酸,其中CRM6序列元件包含SEQ ID NO:99或SEQ ID NO:99的在1、2或3个核苷酸上不同的变体的核苷酸序列。
193.方面182-192中任一项的多核苷酸,其中CRM6序列元件包含SEQ ID NO:99的核苷酸序列。
194.方面182-193中任一项的多核苷酸,其中CRM6序列元件在hAAT序列元件的5’。
195.方面182-194中任一项的多核苷酸,其中CRM6序列元件在AMBP序列元件的5’。
196.方面182-194中任一项的多核苷酸,其中CRM6序列元件在AMBP序列元件的3’。
197.方面182-195中任一项的多核苷酸,其中CRM6序列元件在hAAT序列元件和AMBP序列元件两者的5’。
198.方面182-194或196中任一项的多核苷酸,其中CRM6序列元件在hAAT序列元件的5’和AMBP序列元件的3'。
199.方面134-198中任一项的多核苷酸,其中TRE包含ALDOB序列元件。
200.方面199的多核苷酸,其中包含ALDOB序列元件的TRE促进与缺乏ALDOB序列元件的相应TRE相等或更高的表达。
201.方面199或200中任一项的多核苷酸,其中包含ALDOB序列元件的TRE促进与缺乏ALDOB序列元件的相应TRE相等的表达。
202.方面199-201中任一项的多核苷酸,其中ALDOB序列元件包含至少一个选自以下的结合位点:SP1结合位点、HNF1a结合位点、C/EBP结合位点、GATA2结合位点、USF1结合位点和USF2结合位点。
203.方面202的多核苷酸,其中ALDOB序列元件包含SP1结合位点、HNF1a结合位点、C/EBP结合位点、GATA2结合位点、USF1结合位点和USF2结合位点。
204.方面199-203中任一项的多核苷酸,其中所述ALDOB序列元件包含SEQ ID NO:103或SEQ ID NO:103的在1、2或3个核苷酸上不同的变体的核苷酸序列。
205.方面199-204中任一项的多核苷酸,其中ALDOB序列元件包含SEQ ID NO:103的核苷酸序列。
206.方面199-205中任一项的多核苷酸,其中ALDOB序列元件包含SEQ ID NO:102或SEQ ID NO:102的在1、2或3个核苷酸上不同的变体的核苷酸序列。
207.方面206的多核苷酸,其中ALDOB序列元件包含SEQ ID NO:102的核苷酸序列。
208.方面199-207中任一项的多核苷酸,其中ALDOB序列元件在hAAT序列元件的5’。
209.方面199-208中任一项的多核苷酸,其中ALDOB序列元件在AMBP序列元件的5’。
210.方面199-208中任一项的多核苷酸,其中ALDOB序列元件在AMBP序列元件的3’。
211.方面199-209中任一项的多核苷酸,其中ALDOB序列元件在hAAT序列元件和AMBP序列元件两者的5’。
212.方面199-208或210中任一项的多核苷酸,其中ALDOB序列元件在hAAT序列元件的5’和AMBP序列元件的3'。
213.方面134-212中任一项的多核苷酸,其中TRE包含F2序列元件。
214.方面213的多核苷酸,其中包含F2序列元件的TRE促进与缺乏F2序列元件的相应TRE相等或更高的表达。
215.方面213或方面214的多核苷酸,其中包含F2序列元件的TRE促进比缺乏F2序列元件的相应TRE更高的表达。
216.方面213-215中任一项的多核苷酸,其中F2序列元件包含至少一个选自以下的结合位点:HNF4a结合位点、HNF3a结合位点、HNF1a结合位点、HNF3b结合位点、STAT3结合位点、RBPJ结合位点和SP3结合位点。
217.方面216的多核苷酸,其中F2序列元件包含HNF4a结合位点、HNF3a结合位点、HNF1a结合位点、HNF3b结合位点、STAT3结合位点、RBPJ结合位点和SP3结合位点。
218.方面213-217中任一项的多核苷酸,其中F2序列元件包含SEQ ID NO:105或SEQ ID NO:105的在1、2或3个核苷酸上不同的变体的核苷酸序列。
219.方面218的多核苷酸,其中F2序列元件包含SEQ ID NO:105的序列。
220.方面213-219中任一项的多核苷酸,其中F2序列元件包含SEQ ID NO:104或SEQ ID NO:104的在1、2或3个核苷酸上不同的变体的核苷酸序列。
221.方面220的多核苷酸,其中F2序列元件包含SEQ ID NO:104的核苷酸序列。
222.方面213-221中任一项的多核苷酸,其中F2序列元件在hAAT序列元件的5’。
223.方面213-222中任一项的多核苷酸,其中F2序列元件在AMBP序列元件的5’。
224.方面213-222中任一项的多核苷酸,其中F2序列元件在AMBP序列元件的3’。
225.方面213-223中任一项的多核苷酸,其中F2序列元件在hAAT序列元件和AMBP序列元件两者的5’。
226.方面213-222或224中任一项的多核苷酸,其中F2序列元件在hAAT序列元件的5’和AMBP序列元件的3'。
227.方面134-226中任一项的多核苷酸,其中TRE包含:
(a)与SEQ ID NO:68-91中的任一个具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%序列同一性的核苷酸序列;或
(b)SEQ ID NO:68-91中任一个的核苷酸序列。
228.方面134-227中任一项的多核苷酸,其中TRE包含:
(a)与SEQ ID NO:70具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%序列同一性的核苷酸序列;或
(b)SEQ ID NO:70的核苷酸序列。
229.方面134-227中任一项的多核苷酸,其中TRE包含:
(a)与SEQ ID NO:74具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%序列同一性的核苷酸序列;或
(b)SEQ ID NO:74的核苷酸序列。
230.方面134-229中任一项的多核苷酸,其中TRE进一步包含:
a)TATA盒;
b)HNF6结合位点;
c)HNF4a结合位点;
d)HNF1结合位点;和/或
e)HNF3结合位点。
231.方面230的多核苷酸,其中TRE进一步包含TATA盒,任选地经典TATA盒。
232.方面231的多核苷酸,其中TRE包含hAAT序列元件并且TATA盒***到hAAT序列元件中。
233.方面231或232的多核苷酸,其中hAAT序列元件包含SEQ ID NO:95或SEQ IDNO:95的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且TATA盒在SEQ ID NO:95或SEQID NO:95的变体的核苷酸序列的3'。
234.方面231或232的多核苷酸,其中hAAT序列元件包含SEQ ID NO:95或SEQ IDNO:95的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且TATA盒在SEQ ID NO:95或SEQID NO:95的变体的核苷酸序列的5'。
235.方面230-234中任一项的多核苷酸,其中TRE促进与不包含TATA盒的相应TRE相等或更高的表达。
236.方面230-235中任一项的多核苷酸,其中TRE还包含HNF6结合位点。
237.方面236的多核苷酸,其中TRE包含HNF6结合位点,并且:
a.TRE包含hAAT序列元件,其包含SEQ ID NO:95或SEQ ID NO:95的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF6结合位点在包含SEQ ID NO:95或SEQ ID NO:95的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的5’;和/或
b.TRE包含hAAT序列元件,其包含SEQ ID NO:31或SEQ ID NO:96的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF6结合位点在包含SEQ ID NO:96或SEQ ID NO:31的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的5’;和/或
c.TRE包含hAAT序列元件,其包含SEQ ID NO:94或SEQ ID NO:94的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF6结合位点在包含SEQ ID NO:94或SEQ ID NO:94的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的5’;和/或
d.TRE包含hAAT序列元件,其包含SEQ ID NO:95或SEQ ID NO:95的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF6结合位点在包含SEQ ID NO:95或SEQ ID NO:95的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的3’;和/或
e.TRE包含hAAT序列元件,其包含SEQ ID NO:96或SEQ ID NO:96的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF6结合位点在包含SEQ ID NO:96或SEQ ID NO:96的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的3’;和/或
f.TRE包含hAAT序列元件,其包含SEQ ID NO:94或SEQ ID NO:94的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF6结合位点在包含SEQ ID NO:94或SEQ ID NO:94的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的3’;和/或
g.TRE包含ApoE-HCR1序列元件,其包含SEQ ID NO:93或SEQ ID NO:93的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF6结合位点在包含SEQ ID NO:93或SEQ IDNO:93的在1、2或3个核苷酸上不同的变体的核苷酸序列的ApoE-HCR1序列元件的3’;和/或
h.TRE包含ApoE-HCR1序列元件,其包含SEQ ID NO:92或SEQ ID NO:92的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF6结合位点在包含SEQ ID NO:92或SEQ IDNO:92的在1、2或3个核苷酸上不同的变体的核苷酸序列的ApoE-HCR1序列元件的3’;和/或
i.TRE包含ApoE-HCR1序列元件,其包含SEQ ID NO:93或SEQ ID NO:93的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF6结合位点在包含SEQ ID NO:93或SEQ IDNO:93的在1、2或3个核苷酸上不同的变体的核苷酸序列的ApoE-HCR1序列元件的5’;和/或
j.TRE包含ApoE-HCR1序列元件,其包含SEQ ID NO:92或SEQ ID NO:92的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF6结合位点在包含SEQ ID NO:92或SEQ IDNO:92的在1、2或3个核苷酸上不同的变体的核苷酸序列的ApoE-HCR1序列元件的5’;和/或
k.TRE包含AMBP序列元件,其包含SEQ ID NO:98或SEQ ID NO:98的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF6结合位点在包含SEQ ID NO:98或SEQ ID NO:98的在1、2或3个核苷酸上不同的变体的核苷酸序列的AMBP序列元件的3’;和/或
l.TRE包含AMBP序列元件,其包含SEQ ID NO:97或SEQ ID NO:97的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF6结合位点在包含SEQ ID NO:97或SEQ ID NO:97的在1、2或3个核苷酸上不同的变体的核苷酸序列的AMBP序列元件的3’;和/或
m.TRE包含AMBP序列元件,其包含SEQ ID NO:98或SEQ ID NO:98的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF6结合位点在包含SEQ ID NO:98或SEQ ID NO:98的在1、2或3个核苷酸上不同的变体的核苷酸序列的AMBP序列元件的5’;和/或
n.TRE包含AMBP序列元件,其包含SEQ ID NO:97或SEQ ID NO:97的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF6结合位点在包含SEQ ID NO:97或SEQ ID NO:97的在1、2或3个核苷酸上不同的变体的核苷酸序列的AMBP序列元件的5’。
238.方面236-237中任一项的多核苷酸,其中TRE促进与不包含HNF6结合位点的相应TRE相等或更高的表达。
239.方面236-238中任一项的多核苷酸,其中TRE包含HNF6结合位点和TATA盒并且TRE促进与不包含HNF6结合位点和TATA盒的相应TRE相等或更高的表达。
240.方面230-239中任一项的多核苷酸,其中TRE还包含HNF4a结合位点。
241.方面240的多核苷酸,其中TRE包含HNF4a结合位点,并且:
a.TRE包含hAAT序列元件,其包含SEQ ID NO:95或SEQ ID NO:95的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF4a结合位点在包含SEQ ID NO:95或SEQ ID NO:95的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的5’;和/或
b.TRE包含hAAT序列元件,其包含SEQ ID NO:96或SEQ ID NO:96的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF4a结合位点在包含SEQ ID NO:96或SEQ ID NO:96的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的5’;和/或
c.TRE包含hAAT序列元件,其包含SEQ ID NO:94或SEQ ID NO:94的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF4a结合位点在包含SEQ ID NO:94或SEQ ID NO:94的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的5’;和/或
d.TRE包含ApoE-HCR1序列元件,其包含SEQ ID NO:93或SEQ ID NO:93的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF4a结合位点在包含SEQ ID NO:93或SEQ IDNO:93的在1、2或3个核苷酸上不同的变体的核苷酸序列的ApoE-HCR1序列元件的3’;和/或
e.TRE包含ApoE-HCR1序列元件,其包含SEQ ID NO:93或SEQ ID NO:93的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF4a结合位点在包含SEQ ID NO:93或SEQ IDNO:93的在1、2或3个核苷酸上不同的变体的核苷酸序列的ApoE-HCR1序列元件的5’;和/或
f.TRE包含ApoE-HCR1序列元件,其包含SEQ ID NO:92或SEQ ID NO:92的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF4a结合位点在包含SEQ ID NO:92或SEQ IDNO:92的在1、2或3个核苷酸上不同的变体的核苷酸序列的ApoE-HCR1序列元件的5’;和/或
g.TRE包含AMBP序列元件,其包含SEQ ID NO:98或SEQ ID NO:98的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF4a结合位点在包含SEQ ID NO:98或SEQ ID NO:98的在1、2或3个核苷酸上不同的变体的核苷酸序列的AMBP序列元件的3’;和/或
h.TRE包含AMBP序列元件,其包含SEQ ID NO:97或SEQ ID NO:97的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF4a结合位点在包含SEQ ID NO:97或SEQ ID NO:97的在1、2或3个核苷酸上不同的变体的核苷酸序列的AMBP序列元件的3’;和/或
i.TRE包含AMBP序列元件,其包含SEQ ID NO:98或SEQ ID NO:98的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF4a结合位点在包含SEQ ID NO:98或SEQ ID NO:98的在1、2或3个核苷酸上不同的变体的核苷酸序列的AMBP序列元件的5’;和/或
j.TRE包含AMBP序列元件,其包含SEQ ID NO:97或SEQ ID NO:97的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF4a结合位点在包含SEQ ID NO:97或SEQ ID NO:97的在1、2或3个核苷酸上不同的变体的核苷酸序列的AMBP序列元件的5’。
242.方面240-241中任一项的多核苷酸,其中TRE促进与不包含HNF4a结合位点的相应TRE相等或更高的表达。
243.方面240-242中任一项的多核苷酸,其中TRE包含HNF6结合位点和HNF4a结合位点并且TRE促进与不包含HNF6结合位点和HNF4a结合位点的相应TRE相等或更高的表达。
244.方面240-243中任一项的多核苷酸,其中TRE还包含HNF1结合位点。
245.方面244的多核苷酸,其中TRE包含HNF1结合位点,并且:
a.TRE包含hAAT序列元件,其包含SEQ ID NO:95或SEQ ID NO:95的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF1结合位点在包含SEQ ID NO:95或SEQ ID NO:95的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的5’;和/或
b.TRE包含hAAT序列元件,其包含SEQ ID NO:96或SEQ ID NO:96的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF1结合位点在包含SEQ ID NO:96或SEQ ID NO:96的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的5’;和/或
c.TRE包含hAAT序列元件,其包含SEQ ID NO:94或SEQ ID NO:94的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF1结合位点在包含SEQ ID NO:94或SEQ ID NO:94的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的5’;和/或
d.TRE包含ApoE-HCR1序列元件,其包含SEQ ID NO:93或SEQ ID NO:93的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF1结合位点在包含SEQ ID NO:93或SEQ IDNO:93的在1、2或3个核苷酸上不同的变体的核苷酸序列的ApoE-HCR1序列元件的3’;和/或
e.TRE包含ApoE-HCR1序列元件,其包含SEQ ID NO:92或SEQ ID NO:92的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF1结合位点在包含SEQ ID NO:92或SEQ IDNO:92的在1、2或3个核苷酸上不同的变体的核苷酸序列的ApoE-HCR1序列元件的3’;和/或
f.TRE包含AMBP序列元件,其包含SEQ ID NO:98或SEQ ID NO:98的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF1结合位点在包含SEQ ID NO:98或SEQ ID NO:98的在1、2或3个核苷酸上不同的变体的核苷酸序列的AMBP序列元件的3’;和/或
g.TRE包含AMBP序列元件,其包含SEQ ID NO:97或SEQ ID NO:97的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF1结合位点在包含SEQ ID NO:97或SEQ ID NO:97的在1、2或3个核苷酸上不同的变体的核苷酸序列的AMBP序列元件的3’。
246.方面244-245中任一项的多核苷酸,其中TRE促进与不包含HNF1结合位点的相应TRE相等或更高的表达。
247.方面244-246中任一项的多核苷酸,其中TRE包含HNF6结合位点、HNF4a结合位点和TATA盒并且TRE促进与不包含HNF6结合位点、HNF4a结合位点和TATA盒的相应TRE相等或更高的表达。
248.方面230-247中任一项的多核苷酸,其中TRE还包含HNF3结合位点。
249.方面248的多核苷酸,其中TRE包含HNF3结合位点,并且:
a.TRE包含hAAT序列元件,其包含SEQ ID NO:95或SEQ ID NO:95的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF3结合位点在包含SEQ ID NO:95或SEQ ID NO:95的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的5’;和/或
b.TRE包含hAAT序列元件,其包含SEQ ID NO:96或SEQ ID NO:96的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF3结合位点在包含SEQ ID NO:96或SEQ ID NO:96的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的5’;和/或
c.TRE包含hAAT序列元件,其包含SEQ ID NO:94或SEQ ID NO:94的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF3结合位点在包含SEQ ID NO:94或SEQ ID NO:94的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的5’;和/或
d.TRE包含ApoE-HCR1序列元件,其包含SEQ ID NO:93或SEQ ID NO:93的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF3结合位点在包含SEQ ID NO:93或SEQ IDNO:93的在1、2或3个核苷酸上不同的变体的核苷酸序列的ApoE-HCR1序列元件的3’;和/或
e.TRE包含ApoE-HCR1序列元件,其包含SEQ ID NO:92或SEQ ID NO:92的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF3结合位点在包含SEQ ID NO:92或SEQ IDNO:92的在1、2或3个核苷酸上不同的变体的核苷酸序列的ApoE-HCR1序列元件的3’;和/或
f.TRE包含AMBP序列元件,其包含SEQ ID NO:98或SEQ ID NO:98的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF3结合位点在包含SEQ ID NO:98或SEQ ID NO:98的在1、2或3个核苷酸上不同的变体的核苷酸序列的AMBP序列元件的3’;和/或
g.TRE包含AMBP序列元件,其包含SEQ ID NO:97或SEQ ID NO:97的在1、2或3个核苷酸上不同的变体的核苷酸序列,并且HNF3结合位点在包含SEQ ID NO:97或SEQ ID NO:97的在1、2或3个核苷酸上不同的变体的核苷酸序列的AMBP序列元件的3’。
250.方面248-249中任一项的多核苷酸,其中TRE促进与不包含HNF3结合位点的相应TRE相等或更高的表达。
251.方面248-250中任一项的多核苷酸,其中TRE包含HNF3结合位点和TATA盒并且TRE促进与不包含HNF3结合位点和TATA盒的相应TRE相等或更高的表达。
252.前述方面中任一项的多核苷酸,其中所述多核苷酸进一步包含一个或两个ITR。
253.方面252的多核苷酸,其中该或每个ITR的核苷酸序列长度少于157个、少于154个或为约145个核苷酸。
254.方面252或253的多核苷酸,其中该或每个ITR是野生型ITR。
255.方面252至254中任一项的多核苷酸,其中该或每个ITR是AAV2 ITR。
256.方面252至255中任一项的多核苷酸,其中该或每个ITR的核苷酸序列包含SEQID NO:53或SEQ ID NO:54的核苷酸序列。
257.前述方面中任一项的多核苷酸,其中所述多核苷酸还包含多聚A核苷酸序列。
258.方面257的多核苷酸,其中多聚A核苷酸序列包含SEQ ID NO:55的核苷酸序列。
259.前述方面中任一项的多核苷酸,其中所述多核苷酸还包含内含子。
260.前述方面中任一项的多核苷酸,其中CFI多肽或其片段包含序列,其:
a)与SEQ ID NO:43或44至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同;或
b)与SEQ ID NO:43或44的至少300、至少350、至少400、583或更少、565或更少、300至583或300至565个氨基酸长度的片段至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。
261.一种包含重组基因组的病毒颗粒,所述重组基因组包含前述方面中任一项的多核苷酸。
262.方面261的病毒颗粒,其是AAV、腺病毒或慢病毒病毒颗粒。
263.方面262的病毒颗粒,其是AAV病毒颗粒。
264.方面261至263中任一项的病毒颗粒,其中所述病毒颗粒包含衣壳。
265.方面264的病毒颗粒,其中所述病毒颗粒包含嗜肝衣壳。
266.方面265的病毒颗粒,其中所述嗜肝衣壳包含与SEQ ID NO:56-59中任一个的至少600、至少650、至少700、600至734、600至736、650至734、650至736、700至734、700至736、约734或约736个氨基酸的片段至少98%、至少99%或至少99.5%相同的序列。
267.方面266的病毒颗粒,其中所述嗜肝衣壳包含与SEQ ID NO:56-59中的任一个至少99%相同的序列。
268.方面267的病毒颗粒,其中所述嗜肝衣壳包含与SEQ ID NO:57至少99%相同的序列。
269.方面261至268中任一项的病毒颗粒,其中重组基因组是单链的。
270.方面261至269中任一项的病毒颗粒,其中与在施用包含参考CFI核苷酸序列的等效病毒颗粒时由参考CFI核苷酸编码的CFI多肽的表达相比,由CFI核苷酸序列编码的CFI多肽或其片段在施用病毒颗粒时以相同或更高的水平表达。
271.方面270的病毒颗粒,其中与由参考CFI核苷酸序列编码的CFI多肽的表达相比,由CFI核苷酸序列编码的CFI多肽或其片段的表达处于更高水平。
272.方面270或271的病毒颗粒,其中由CFI核苷酸序列编码的CFI多肽或其片段的表达与由参考CFI核苷酸序列编码的CFI多肽相比为至少1.5x、至少2x、至少3x、至少5x、至少8x或至少10x。
273.方面271或272的病毒颗粒,其中参考CFI核苷酸序列是野生型CFI核苷酸序列。
274.方面273的病毒颗粒,其中野生型CFI核苷酸序列是SEQ ID NO:41或42的序列。
275.方面270至272中任一项的病毒颗粒,其中参考CFI核苷酸序列是SEQ ID NO:1或21的序列。
276.方面270至272中任一项的病毒颗粒,其中参考CFI核苷酸序列是SEQ ID NO:5或25的序列。
277.前述方面中任一项的病毒颗粒,其中由CFI核苷酸序列编码的CFI多肽或其片段的表达是由SEQ ID NO:5或25的序列编码的CFI多肽的表达的至少50%、至少60%、至少70%、至少80%、至少90%、至少95%或至少100%。
278.一种组合物,其包含前述方面中任一项的多核苷酸或病毒颗粒,以及药学上可接受的赋形剂。
279.根据方面1至260中任一项的多核苷酸、根据方面261至277中任一项的病毒颗粒或根据方面278的组合物,其用于治疗方法。
280.一种治疗方法,包括施用有效量的根据方面1至260中任一项的多核苷酸、根据方面261至277中任一项的病毒颗粒或根据方面278的组合物。
281.根据方面1至260中任一项的多核苷酸、根据方面261至277中任一项的病毒颗粒或根据方面278的组合物在制备用于治疗方法的药物中的用途。
282.根据方面279至281中任一项使用的多核苷酸、病毒颗粒或组合物或用途,其中治疗方法包括向患者施用有效量的多核苷酸、病毒颗粒或组合物。
283.用于治疗方法的包含补体因子I(CFI)核苷酸序列的多核苷酸、包含含有该多核苷酸的重组基因组的病毒颗粒或包含该多核苷酸或病毒颗粒的组合物,其中该治疗方法是治疗补体介导的病症的方法,并且CFI核苷酸序列编码CFI多肽或其片段。
284.一种治疗方法,包括施用有效量的包含CFI核苷酸序列的多核苷酸、包含含有该多核苷酸的重组基因组的病毒颗粒或包含该多核苷酸或病毒颗粒的组合物,其中该治疗方法是治疗补体介导的病症的方法,并且CFI核苷酸序列编码CFI多肽或其片段。
285.一种包含CFI核苷酸序列的多核苷酸、包含含有该多核苷酸的重组基因组的病毒颗粒或包含该多核苷酸或病毒颗粒的组合物在制备用于治疗方法的药物中的用途,其中该治疗方法是治疗补体介导的病症的方法,并且CFI核苷酸序列编码CFI多肽或其片段。
286.根据方面283至285中任一项使用的多核苷酸、病毒颗粒或组合物或用途,其中治疗方法包括向患者施用有效量的多核苷酸、病毒颗粒或组合物。
287.根据方面279至282中任一项使用的多核苷酸、病毒颗粒或组合物或用途,其中治疗方法是治疗补体介导的病症的方法。
288.根据方面283至287中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中所述病症是C3介导的病症。
289.根据方面283至288中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中所述病症是肾脏疾病。
290.根据方面283至289中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中所述病症与补体C3b反馈循环的过度活动有关。
291.根据方面283至290中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中所述病症选自C3肾小球病、IgA肾病、狼疮性肾炎、***性红斑狼疮、膜性肾病、膜增生性肾小球肾炎、阵发性睡眠性血红蛋白尿、非典型溶血性***综合征、自身免疫性溶血性贫血、ANCA相关血管炎、戈谢病、腹膜炎、年龄-相关黄斑变性、糖尿病性视网膜病变、致密物沉积病、年龄相关性炎症或自身炎症性疾病、自身免疫性关节炎如类风湿性关节炎、动脉粥样硬化、慢性心血管疾病、阿尔茨海默氏病、***性血管炎、格林-巴利综合征和Henoch-Schonlein紫癜。
292.根据方面283至291中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中所述病症选自C3肾小球病、C3肾小球肾炎和致密物沉积病。
293.根据方面283至291中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中所述病症是具有单等位基因CFH突变的非典型溶血性***综合征。
294.根据方面283至291中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中所述病症是肾小球或肾小管病症。
295.根据方面283至291或294中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中所述病症选自C3肾小球病、IgA肾病、狼疮性肾炎和膜性肾病。
296.根据方面283至291或294至295中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中所述病症是狼疮性肾炎。
297.根据方面283至291中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中所述病症是***性红斑狼疮。
298.根据方面283至297中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中该多核苷酸、病毒颗粒或组合物是根据方面1至278中任一项的。
299.根据方面283至298中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中多核苷酸、病毒颗粒或组合物的施用减少受试者中与病症相关的炎症。
300.根据方面299使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中多核苷酸、病毒颗粒或组合物的施用将炎症降低至施用多核苷酸、病毒颗粒或组合物之前存在的炎症水平的小于或约60%、小于或约55%、小于或约50%、小于或约45%、小于或约40%、小于或约35%、小于或约30%、小于或约25%或小于或约20%的水平。
301.根据方面279至300中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中治疗方法是减轻患者中的炎症的方法。
302.根据方面283至301中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中治疗方法是减轻患者中的炎症的方法,从而治疗补体介导的病症。
303.根据方面283至302中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中治疗方法是通过减轻患者中的炎症来治疗疾病的方法。
304.根据方面301至303中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中减轻炎症是将炎症减轻至施用多核苷酸、病毒颗粒或组合物之前存在的炎症水平的小于或约60%、小于或约55%、小于或约50%、小于或约45%、小于或约40%、小于或约35%、小于或约30%、小于或约25%或小于或约20%的水平。
305.根据方面282或286至304中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中治疗方法包括向患者施用有效量的多核苷酸、病毒颗粒或组合物,并且有效量是足以减轻患者中的炎症的量。
306.根据方面305使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中足以减轻患者中的炎症的量是足以将炎症减轻至施用多核苷酸、病毒颗粒或组合物之前存在的炎症水平的小于或约60%、小于或约55%、小于或约50%、小于或约45%、小于或约40%、小于或约35%、小于或约30%、小于或约25%或小于或约20%的水平的量。
307.根据方面282至298中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中多核苷酸、病毒颗粒或组合物的施用减少受试者中的蛋白尿。
308.根据方面307使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中蛋白尿通过测量尿液中的白蛋白与肌酸酐比值(ACR)来评分。
309.根据方面307或308使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中多核苷酸、病毒颗粒或组合物的施用将蛋白尿减少至施用多核苷酸、病毒颗粒或组合物之前存在的蛋白尿水平的小于或约70%、小于或约65%、小于或约60%、小于或约55%、小于或约50%、小于或约45%、小于或约40%、小于或约35%、小于或约30%、小于或约25%、小于或约20%、小于或约15%或小于或约10%的水平。
310.根据方面283至309中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中所述治疗方法是用于减少患者中的蛋白尿的方法。
311.根据方面283至310中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中所述治疗方法是减少患者中的蛋白尿从而治疗补体介导的病症的方法。
312.根据方面283至311中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中所述治疗方法是通过减少患者的蛋白尿来治疗疾病的方法。
313.根据方面310至312中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中减少蛋白尿是将蛋白尿减少至施用多核苷酸、病毒颗粒或组合物之前存在的蛋白尿水平的小于或约70%、小于或约65%、小于或约60%、小于或约55%、小于或约50%、小于或约45%、小于或约40%、小于或约35%、小于或约30%、小于或约25%、小于或约20%、小于或约15%或小于或约10%的水平。
314.根据方面282至305中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中治疗方法包括向患者施用有效量的多核苷酸、病毒颗粒或组合物,并且有效量是足以减少患者中的蛋白尿的量。
315.根据方面314使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中足以减少患者中的蛋白尿的量是足以将蛋白尿减少至施用多核苷酸、病毒颗粒或组合物之前存在的蛋白尿水平的小于或约70%、小于或约65%、小于或约60%、小于或约55%、小于或约50%、小于或约45%、小于或约40%、小于或约35%、小于或约30%、小于或约25%、小于或约20%、小于或约15%或小于或约10%的水平的量。
316.根据方面280至315中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中多核苷酸、病毒颗粒或组合物的施用减少受试者中的肾小球病理和/或肾小管病理。
317.根据方面316使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中多核苷酸、病毒颗粒或组合物的施用减少肾小球病理和/或肾小管病理,如通过PAS染色时降低的病理学水平所见。
318.根据方面283至317中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中治疗方法是减少患者中的肾小球病理和/或肾小管病理的方法。
319.根据方面283至318中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中治疗方法是减少患者中的肾小球病理和/或肾小管病理的方法,从而治疗补体介导的疾病。
320.根据方面283至319中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中所述治疗方法是通过减少患者中的肾小球病理和/或肾小管病理来治疗疾病的方法。
321.根据方面318至320中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中减少肾小球病理和/或肾小管病理是如通过PAS染色时降低的病理学水平所见的减少肾小球病理和/或肾小管病理。
322.根据方面282至321中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中治疗方法包括向患者施用有效量的多核苷酸、病毒颗粒或组合物,并且有效量是足以减少患者中的肾小球病理和/或肾小管病理的量。
323.根据方面322使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中足以减少患者中的肾小球病理和/或肾小管病理的量是足以如通过PAS染色时降低的病理学水平所见的减少肾小球病理和/或肾小管病理的量。
324.根据方面283至323中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中所述病症不是眼部病症。
325.根据方面283至324中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中多核苷酸、病毒颗粒或组合物不是通过视网膜下注射、直接视网膜注射、脉络膜上腔注射和/或玻璃体内注射施用的。
326.根据方面279至325中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中多核苷酸、病毒颗粒或组合物不是眼内施用的。
327.根据方面279至326中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中所述多核苷酸、病毒颗粒或组合物通过以下方式施用:静脉内;全身地;通过外周静脉输注至肝脏;通过肝血管如肝静脉输注或肝动脉输注至肝脏;或通过实质内直接施用至肝脏。
328.根据方面279至327中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中所述多核苷酸、病毒颗粒或组合物静脉内施用。
329.根据方面279至327中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中全身施用所述多核苷酸、病毒颗粒或组合物。
330.根据方面279至327中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中通过外周静脉输注将多核苷酸、病毒颗粒或组合物施用至肝脏。
331.根据方面279至327中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中所述多核苷酸、病毒颗粒或组合物经由肝血管施用至肝脏,其中所述施用是通过肝静脉输注或肝动脉输注进行的。
332.根据方面279至327中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中所述多核苷酸、病毒颗粒或组合物通过直接向肝脏的实质内施用来施用。
333.根据方面279至327中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中所述多核苷酸、病毒颗粒或组合物通过注射入肾动脉来施用。
334.根据方面279至327中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中通过逆行施用来施用所述多核苷酸、病毒颗粒或组合物。
335.根据方面334使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中通过逆行施用来施用多核苷酸、病毒颗粒或组合物,其中施用是使用导尿管经由输尿管进行的。
336.根据方面279至335中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中CFI核苷酸序列包含与SEQ ID NO:1或21的核苷酸序列至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
337.根据方面283至336中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中多核苷酸、病毒颗粒或组合物的施用增加患者中的C3b-失活和/或iC3b-降解活性的水平。
338.根据方面337使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中多核苷酸、病毒颗粒或组合物的施用使C3b-失活和/或iC3b-降解活性的水平增加至高于正常水平。
339.根据方面337或338使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中多核苷酸、病毒颗粒或组合物的施用将C3b-失活和/或iC3b-降解活性的水平提高至正常水平的1.2倍、1.5倍、1.8倍或2倍水平。
340.根据方面338或339使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中正常水平相当于血清中30-40μg/ml CFI多肽提供的水平。
341.根据方面283至340中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中治疗方法是增加患者中的C3b-失活和/或iC3b-降解水平的方法。
342.根据方面283至341中任一项使用的多核苷酸、病毒颗粒或组合物的用途、用途或方法,其中治疗方法是增加患者中的C3b-失活和/或iC3b-降解水平的方法,从而治疗补体介导的疾病。
343.根据方面283至342中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中治疗方法是通过增加患者中的C3b-失活和/或iC3b-降解水平来治疗疾病的方法。
344.根据方面337或338使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中增加患者中C3b-失活和/或iC3b-降解的水平是将C3b-失活和/或iC3b-降解活性的水平增加至高于正常水平。
345.根据方面337或338使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中增加患者中C3b-失活和/或iC3b-降解的水平是将C3b-失活和/或iC3b-降解活性增加至正常水平的1.2倍、1.5倍、1.8倍或2倍水平。
346.根据方面344或345使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中正常水平相当于血清中30-40μg/ml CFI多肽提供的水平。
347.根据方面279至346中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中CFI核苷酸序列是来自WO2020/086735的SEQ ID NO:1、2、3或5中任一个,或来自WO2017/072515的SEQ ID NO:8的核苷酸序列。
348.根据方面279至346中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中CFI核苷酸序列是来自WO2020/128516的SEQ ID NO:18至26中任一个的核苷酸序列。
序列表
<110> 自由行疗法有限公司
<120> 多核苷酸
<130> N418304WO
<150> GB2009741.6
<151> 2020-06-25
<160> 202
<170> PatentIn version 3.5
<210> 1
<211> 1698
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 1
aaggtgacct atacatctca ggaggatctg gtggagaaga agtgtctggc caagaagtac 60
acacacctga gctgcgacaa ggtgttctgt cagccatggc agcggtgcat cgagggaacc 120
tgcgtgtgca agctgcctta tcagtgccca aagaacggca ccgccgtgtg cgccacaaat 180
cggagatctt ttccaacata ctgccagcag aagagcctgg agtgtctgca ccccggcacc 240
aagtttctga acaatggcac ctgcacagcc gagggcaagt tctctgtgag cctgaagcac 300
ggcaacacag attccgaggg catcgtggag gtgaagctgg tggaccagga taagaccatg 360
ttcatctgta agagctcctg gtctatgaga gaggccaacg tggcctgcct ggatctgggc 420
tttcagcagg gcgccgacac acagaggcgc ttcaagctgt ccgacctgtc tatcaatagc 480
accgagtgcc tgcacgtgca ctgtaggggc ctggagacaa gcctggccga gtgcaccttt 540
acaaagcgga gaaccatggg ctatcaggac ttcgccgacg tggtgtgcta cacccagaag 600
gccgattctc caatggacga tttctttcag tgcgtgaacg gcaagtacat cagccagatg 660
aaggcctgcg acggcatcaa tgactgtggc gatcagtccg acgagctgtg ctgtaaggcc 720
tgtcagggca agggctttca ctgcaagagc ggcgtgtgca tcccctccca gtatcagtgc 780
aacggcgagg tggattgtat caccggagag gacgaagtgg gatgcgcagg cttcgcctcc 840
gtgacccagg aggagaccga gatcctgaca gccgacatgg atgccgagag gcgccggatc 900
aagtctctgc tgcctaagct gagctgtggc gtgaagaata gaatgcacat cagaaggaag 960
cgcatcgtgg gaggcaagag ggcacagctg ggcgatctgc catggcaggt ggccatcaag 1020
gacgcaagcg gaatcacctg cggaggcatc tatatcggag gatgttggat cctgaccgca 1080
gcacactgcc tgagagcatc caagacacac aggtaccaga tctggaccac agtggtggat 1140
tggatccacc ctgacctgaa gagaatcgtg atcgagtatg tggataggat catcttccac 1200
gagaactaca atgccggcac atatcagaac gacatcgccc tgatcgagat gaagaaggat 1260
ggcaataaga aggactgtga gctgccacgc tccatccctg catgcgtgcc ctggtctcct 1320
tacctgtttc agccaaacga tacctgcatc gtgagcggat ggggaaggga gaaggacaat 1380
gagcgggtgt tctccctgca gtggggcgag gtgaagctga tctccaactg ttctaagttt 1440
tacggcaatc ggttctatga gaaggagatg gagtgcgccg gcacctacga tggcagcatc 1500
gacgcctgta agggcgattc cggaggacca ctggtgtgca tggacgcaaa caatgtgaca 1560
tacgtgtggg gagtggtgag ctggggagag aactgcggca agccagagtt tcccggcgtc 1620
tacaccaagg tggccaatta ttttgactgg atctcctacc acgtgggcag gcctttcatc 1680
tctcagtaca acgtgtga 1698
<210> 2
<211> 1698
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 2
aaagtgacct acaccagcca agaggacctg gtggaaaaga agtgcctggc caagaagtac 60
acccacctga gctgcgacaa ggtgttctgc cagccttggc agagatgcat cgagggcacc 120
tgtgtgtgca agctgcccta tcagtgcccc aagaatggca cagccgtgtg cgccaccaac 180
agaagaagct tccctaccta ctgccagcag aaaagcctgg aatgtctgca ccccggcacc 240
aagtttctga acaacggcac ctgtaccgcc gagggcaagt ttagcgtgtc cctgaagcac 300
ggcaacaccg actctgaggg catcgtggaa gtgaagctgg tggaccagga caagaccatg 360
ttcatctgca agagcagctg gtccatgcgc gaggccaatg tggcttgtct ggatctggga 420
ttccagcagg gcgccgacac acagagaaga ttcaagctga gcgacctgag catcaacagc 480
accgagtgcc tgcatgtgca ctgtagaggc ctggaaacaa gcctggccga gtgcaccttc 540
accaagagaa ggaccatggg ctaccaggac ttcgccgacg tcgtgtgcta cacccagaaa 600
gccgactctc ccatggacga tttcttccag tgcgtgaacg gcaagtacat cagccagatg 660
aaggcctgcg acggcatcaa cgattgcggc gatcagagcg acgagctgtg ctgcaaagcc 720
tgtcaaggca agggcttcca ctgcaagtcc ggcgtgtgta tccctagcca gtaccagtgc 780
aatggcgagg tggactgtat caccggcgag gatgaagtgg gctgtgccgg atttgccagc 840
gtgacccaag aggaaaccga gatcctgacc gccgatatgg acgccgagcg gcggagaatc 900
aaaagcctgc tgcctaagct gtcctgcggc gtgaagaacc ggatgcacat ccggcgcaag 960
agaatcgtcg gaggcaaaag agcacagctg ggcgatctgc cttggcaagt ggccatcaag 1020
gatgccagcg gcatcacatg tggcggcatc tacatcggcg gctgctggat tctgacagcc 1080
gctcattgtc tgcgggccag caagacccac cggtatcaga tctggaccac cgtggtggac 1140
tggattcacc ccgacctgaa gcggatcgtg atcgagtacg tggaccggat catcttccac 1200
gagaactaca acgccggcac ctaccagaac gatatcgccc tgatcgagat gaagaaggac 1260
gggaacaaga aggactgcga gctgcctaga tctatccccg cctgtgttcc ttggagcccc 1320
tacctgttcc agcctaacga tacctgcatc gtgtccggct ggggcagaga gaaggataac 1380
gagagggtgt tcagcctgca gtggggcgaa gtgaaactga tcagcaactg cagcaagttc 1440
tacggcaacc ggttctacga gaaagaaatg gaatgcgccg gcacatacga cggctccatc 1500
gatgcctgta aaggcgattc tggcggccct ctcgtgtgca tggatgccaa caatgtgacc 1560
tacgtgtggg gcgtcgtgtc ctggggagag aattgtggca agcctgagtt ccccggcgtc 1620
tacaccaagg tggccaacta cttcgactgg atcagctacc acgtgggcag accctttatc 1680
agccagtaca acgtgtga 1698
<210> 3
<211> 1698
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 3
aaggtgacct atacatctca ggaggatctg gtggagaaga agtgtctggc caagaagtac 60
acacacctga gttgtgacaa ggtgttctgt cagccatggc agagatgcat tgagggaacc 120
tgtgtgtgca agctgcctta tcagtgccca aagaatggca ctgctgtgtg tgccacaaat 180
aggagatctt ttccaacata ctgccagcag aagagcctgg agtgtctgca ccctggcacc 240
aagtttctga acaatggcac ctgcacagct gagggcaagt tctctgtgag cctgaagcat 300
ggcaacacag atagtgaggg cattgtggag gtgaagctgg tggaccagga taagaccatg 360
ttcatctgta agagctcctg gtctatgaga gaggccaatg tggcctgcct ggatctgggc 420
tttcaacaag gagctgacac acagaggaga ttcaagctga gtgacctgtc tatcaatagc 480
acagagtgcc tgcatgtgca ctgtagaggc ctggagacaa gcctggctga gtgcaccttt 540
acaaagagaa ggaccatggg ctatcaggac tttgctgatg tggtatgcta cacccagaag 600
gctgattctc caatggatga tttctttcaa tgtgtgaatg gcaagtacat cagccagatg 660
aaggcctgtg atggcatcaa tgactgtgga gatcagagtg atgagctgtg ttgcaaggcc 720
tgtcagggca agggctttca ctgcaagagt ggagtgtgca tcccctccca atatcagtgc 780
aatggagagg tggattgtat cacaggagag gatgaagtgg gatgtgcagg ctttgcctca 840
gtgacccagg aggagacaga gatcctgaca gctgacatgg atgctgagag gagaaggatc 900
aagtctctgc tgcctaagct gagctgtgga gtgaagaata gaatgcacat cagaaggaag 960
agaattgtgg gaggcaagag ggcacagctg ggagatctgc catggcaggt ggccatcaag 1020
gatgcaagtg gaatcacctg tggaggcatc tatattggag gatgttggat cctgacagca 1080
gcacactgcc tgagagcatc caagacacac agataccaga tctggaccac agtggttgat 1140
tggatccacc ctgacctgaa gagaattgtg attgagtatg tggataggat catcttccat 1200
gagaactaca atgctggcac atatcagaat gacattgccc tgattgagat gaagaaggat 1260
ggcaataaga aggactgtga gctgccaaga tccatccctg catgtgtgcc ctggtctcct 1320
tacctgtttc agccaaatga tacctgcatt gtatccggat ggggaaggga gaaggacaat 1380
gagagagtgt tctccctgca gtggggagag gtgaagctga tctccaactg ttctaagttt 1440
tatggcaata gattctatga gaaggagatg gagtgtgcag gcacctatga tggcagcatt 1500
gatgcctgta agggagatag tggaggacca ctggtgtgca tggatgcaaa caatgtgaca 1560
tatgtgtggg gagtggtgag ctggggagag aactgtggca agccagagtt tcctggagtc 1620
tacaccaagg tggccaatta ttttgactgg atctcctacc atgtgggcag gcctttcatc 1680
tctcagtaca atgtgtga 1698
<210> 4
<211> 1698
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 4
aaggtgacct acaccagcca agaggacctg gtggaaaaga agtgcctggc caagaagtac 60
acccacctga gctgtgacaa ggtgttctgc cagccttggc agagatgcat tgagggcacc 120
tgtgtgtgca agctgcccta tcagtgcccc aagaatggca cagctgtgtg tgccaccaac 180
agaaggagct tccctaccta ctgccagcag aaaagcctgg aatgtctgca ccctggcacc 240
aagtttctga acaatggcac ctgtacagct gagggcaagt ttagtgtgtc cctgaagcat 300
ggcaacacag actctgaggg cattgtggaa gtgaagctgg tggaccagga caagaccatg 360
ttcatctgca agagtagctg gtccatgaga gaggccaatg tggcttgtct ggatctggga 420
ttccaacagg gagctgacac acagagaaga ttcaagctga gtgacctgag catcaacagc 480
acagagtgcc tgcatgtgca ctgtagaggc ctggaaacaa gcctggctga gtgcaccttc 540
accaagagaa ggaccatggg ctaccaggac tttgctgatg tggtgtgcta cacccagaaa 600
gctgactctc ccatggatga tttctttcaa tgtgtgaatg gcaagtacat cagccagatg 660
aaggcctgtg atggcatcaa tgattgtgga gatcagagtg atgagctgtg ctgcaaagcc 720
tgtcaaggca agggcttcca ctgcaagagt ggagtgtgta tccctagcca gtaccagtgc 780
aatggagagg tggactgtat cacaggagag gatgaagtgg gctgtgctgg atttgccagt 840
gtgacccaag aggaaacaga gatcctgaca gctgatatgg atgctgagag aaggagaatc 900
aaaagcctgc ttcctaagct gtcctgtgga gtgaagaaca gaatgcacat cagaaggaag 960
agaattgtgg gaggcaaaag agcacagctg ggagatctgc cttggcaagt ggccatcaag 1020
gatgccagtg gcatcacatg tggaggcatc tacattggag gctgctggat tctgacagct 1080
gctcattgtc tgagagccag caagacccac agatatcaga tctggaccac agtggtagac 1140
tggattcacc ctgacctgaa gagaattgtg attgagtatg tggacagaat catcttccat 1200
gagaactaca atgctggcac ctaccagaat gatattgccc tgattgagat gaagaaggat 1260
ggaaacaaga aagactgtga gctgcctaga tctatccctg cctgtgttcc ttggagcccc 1320
tacctgttcc agcctaatga tacctgcata gtttctggat ggggcagaga gaaggataat 1380
gagagggtgt tcagcctgca gtggggagaa gtgaaactga tcagcaactg cagcaagttc 1440
tatggcaaca gattctatga gaaagaaatg gaatgtgctg gcacatatga tggctccatt 1500
gatgcctgta aaggagattc tggaggccct cttgtgtgca tggatgccaa caatgtgacc 1560
tatgtgtggg gagtggtatc ctggggagag aattgtggca agcctgagtt ccctggagtc 1620
tacaccaagg tggccaacta ctttgactgg atcagctacc atgtgggcag accctttatc 1680
agccagtaca atgtgtga 1698
<210> 5
<211> 1698
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 5
aaggtgacct acaccagcca ggaggacctg gtggagaaga agtgcctggc caagaagtac 60
acccacctga gctgtgacaa ggtgttctgc cagccctggc agagatgcat tgagggcacc 120
tgtgtgtgca agctgcccta ccagtgcccc aagaatggca cagctgtgtg tgccaccaac 180
agaaggagct tccccaccta ctgccagcag aagagcctgg agtgcctgca ccctggcacc 240
aagttcctga acaatggcac ctgcacagct gagggcaagt tcagtgtgag cctgaagcat 300
ggcaacacag acagtgaggg cattgtggag gtgaagctgg tggaccagga caagaccatg 360
ttcatctgca agagcagttg gagcatgaga gaggccaatg tggcctgcct ggacctgggc 420
ttccagcaag gagctgacac ccagagaagg ttcaagctga gtgacctgag catcaacagc 480
acagagtgcc tgcatgtgca ctgcagaggc ctggagacca gcctggctga gtgcaccttc 540
accaagagaa ggaccatggg ctaccaggac tttgctgatg tggtttgcta cacccagaag 600
gctgacagcc ccatggatga cttcttccag tgtgtgaatg gcaagtacat cagccagatg 660
aaggcctgtg atggcatcaa tgactgtgga gaccagagtg atgagctgtg ctgcaaggcc 720
tgccagggca agggcttcca ctgcaagagt ggagtgtgca tccccagcca gtaccagtgc 780
aatggagagg tggactgcat cacaggagag gatgaggtgg gctgtgctgg ctttgccagt 840
gtgacccagg aggagacaga gatcctgaca gctgacatgg atgctgagag aaggagaatc 900
aagagcctgc tgcccaagct gagctgtgga gtgaagaaca gaatgcacat cagaaggaag 960
agaattgtgg gaggcaagag agcccagctg ggagacctgc cctggcaggt ggccatcaag 1020
gatgccagtg gcatcacctg tggaggaatc tacattggag gctgctggat tctgacagct 1080
gcccactgcc tgagagccag caagacccac agataccaga tctggaccac agtggttgac 1140
tggattcacc ctgacctgaa gagaattgtg attgagtatg tggacagaat cattttccat 1200
gagaactaca atgctggcac ctaccagaat gacattgccc tgattgagat gaagaaggat 1260
ggcaacaaga aagactgtga gctgcccaga agcatccctg cctgtgtgcc ctggagcccc 1320
tacctgttcc agcccaatga cacctgtatt gtcagtggat ggggcagaga gaaggacaat 1380
gagagagtgt tcagcctgca gtggggagag gtgaagctga tcagcaactg cagcaagttc 1440
tatggcaaca gattctatga gaaggagatg gagtgtgctg gcacctatga tggcagcatt 1500
gatgcctgca agggagacag tggaggcccc ctggtgtgca tggatgccaa caatgtgacc 1560
tatgtgtggg gagtggttag ctggggagag aactgtggca agcctgagtt ccctggagtg 1620
tacaccaagg tggccaacta ctttgactgg atcagctacc atgtgggcag acccttcatc 1680
agccagtaca atgtgtaa 1698
<210> 6
<211> 1698
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 6
aaggtgacct atacatcaca ggaggacctg gtggagaaga agtgtctggc caagaagtat 60
acacatctgt catgtgacaa ggtgttctgt cagccttggc agaggtgtat tgagggaaca 120
tgtgtgtgta agctgcctta tcagtgtcct aagaatggaa cagctgtgtg tgccacaaat 180
aggaggtcat tccctacata ttgtcagcag aagtcactgg agtgtctgca tcctggaaca 240
aagttcctga ataatggaac atgtacagct gagggaaagt tctcagtgtc actgaagcat 300
ggaaatacag actcagaggg aattgtggag gtgaagctgg tggaccagga caagacaatg 360
ttcatctgca agtcatcatg gtcaatgagg gaggccaatg tggcctgtct ggacctggga 420
ttccagcagg gagctgacac acagaggagg ttcaagctgt cagacctgtc aatcaattca 480
acagagtgtc tgcatgtgca ttgtagagga ctggagacat cactggctga gtgtacattc 540
acaaagagga gaacaatggg atatcaggac tttgctgatg tggtttgtta tacacagaag 600
gctgactcac ctatggatga cttctttcaa tgtgtgaatg gaaagtatat ctcacagatg 660
aaggcctgtg atggaatcaa tgactgtgga gaccagtcag atgagctgtg ttgcaaggcc 720
tgtcagggaa agggattcca ttgcaagtca ggagtgtgta tcccttcaca atatcagtgt 780
aatggagagg tggactgtat cacaggagag gatgaggtgg gatgtgcagg atttgcctca 840
gtgacccagg aggagacaga gatcctgaca gctgacatgg atgctgagag aaggagaatc 900
aagtcactgc tgcctaagct gtcatgtgga gtgaagaata ggatgcatat caggaggaag 960
aggattgtgg gaggaaagag ggcccagctg ggagacctgc cttggcaagt ggccatcaag 1020
gatgcctcag gaatcacatg tggaggaatc tatattggag gatgttggat cctgacagct 1080
gcccattgtc tgagggcctc aaagacacat agatatcaga tctggacaac agtggtggac 1140
tggatccatc ctgacctgaa gaggattgtg attgagtatg tggacaggat catcttccat 1200
gagaattata atgctggaac atatcagaat gacattgccc tgattgagat gaagaaggat 1260
ggaaataaga aggactgtga gctgcctagg tcaatccctg cctgtgtgcc ttggtcccct 1320
tatctgttcc aacctaatga cacatgtatt gtgtctggat ggggaaggga gaaggacaat 1380
gagagggtgt tctcactgca gtggggagag gtgaagctga tctcaaattg ttcaaagttc 1440
tatggaaata ggttctatga gaaggagatg gagtgtgctg gaacatatga tggatcaatt 1500
gatgcctgta agggagactc aggaggacct ctagtatgta tggatgccaa taatgtgaca 1560
tatgtgtggg gagtggtgtc atggggagag aattgtggaa agcctgagtt ccctggagtg 1620
tatacaaagg tggccaatta ttttgactgg atctcatatc atgtgggaag gcctttcatc 1680
tcacagtata atgtgtaa 1698
<210> 7
<211> 1698
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 7
aaggtgacct atacctctca agaggatctg gtggagaaga agtgcctggc taagaagtat 60
actcacctga gctgtgataa ggtgttctgc cagccctggc agaggtgcat tgagggcacc 120
tgtgtgtgta agctgcccta tcagtgcccc aagaatggca ctgctgtgtg tgctactaac 180
aggaggagct tccccaccta ctgtcagcag aagagcctgg agtgtctgca tcctgggacc 240
aagtttctga ataatggaac ctgcacagct gagggaaagt ttagtgtgag cctgaagcat 300
ggaaatacag atagtgaggg aattgtggag gtgaagctgg tggaccagga taagaccatg 360
ttcatctgca agagcagctg gagcatgagg gaggccaatg tggcctgcct ggacctgggg 420
tttcagcaag gtgctgatac tcagaggagg tttaagctgt ctgatctgtc tatcaatagc 480
actgagtgtc tgcatgtgca ttgtagagga ctggagacca gcctggctga gtgtactttt 540
actaagagga ggactatggg ataccaggat tttgctgatg tggtgtgtta tacccagaag 600
gctgattctc ccatggatga cttctttcag tgtgtgaatg ggaagtacat ctctcagatg 660
aaggcctgtg atggtatcaa tgattgtgga gaccagagtg atgagctgtg ttgtaaggct 720
tgccaaggca agggctttca ttgcaagagt ggagtgtgca tccccagcca gtatcagtgc 780
aatggagagg tggactgcat cacaggggag gatgaggtgg gctgtgctgg ctttgcttct 840
gtgactcaag aggagacaga gatcctgact gctgacatgg atgctgagag gaggaggatc 900
aagagcctgc tgcctaagct gtcttgtgga gtgaagaaca ggatgcacat caggaggaag 960
aggattgtgg gaggaaagag ggctcagctg ggagacctgc cctggcaggt ggctatcaag 1020
gatgccagtg gaatcacctg tgggggaatc tatattggtg gctgttggat cctgactgct 1080
gctcattgtc tgagggccag caagactcat agataccaga tctggaccac agtggtggac 1140
tggatccacc ctgacctgaa gaggattgtg attgagtatg tggataggat catcttccat 1200
gagaactaca atgctggcac ttaccagaat gacattgctc tgattgagat gaagaaggat 1260
ggaaacaaga aggattgtga gctgcctagg agcatccctg cctgtgtgcc ctggtctcct 1320
tacctgttcc aacctaatga tacctgcatt gtgtctggct ggggaaggga gaaggataat 1380
gagagggtgt ttagcctgca gtggggtgag gtgaagctga tcagcaactg ctctaagttt 1440
tatggaaata ggttctatga gaaggagatg gagtgtgctg gaacctatga tggtagcatt 1500
gatgcctgca agggggactc tggaggcccc ctggtttgta tggatgccaa caatgtgact 1560
tatgtgtggg gtgtggtgag ctggggggag aactgtggaa agcctgagtt ccctggagtg 1620
tacaccaagg tggccaatta ttttgactgg atcagctacc atgtgggaag gccttttatc 1680
tctcagtaca atgtgtaa 1698
<210> 8
<211> 1698
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 8
aaggtgacct atacaagcca ggaggatctg gtggagaaga agtgcctggc aaagaagtat 60
acccacctga gctgtgataa ggtgttttgc cagccctggc agagatgcat tgagggcacc 120
tgtgtttgta agctgcccta tcagtgcccc aagaatggca cagcagtgtg tgcaaccaat 180
agaaggagct ttcccacata ctgtcagcag aagagcctgg aatgtctgca tcctgggaca 240
aagtttctga ataatggaac atgcacagct gaaggaaagt ttagtgttag cctgaagcat 300
ggaaatacag atagtgaggg aatagttgaa gtgaagctgg tggaccagga taagacaatg 360
tttatatgca agagtagctg gagcatgaga gaagccaatg tggcctgcct ggacctgggg 420
tttcagcaag gagctgatac ccagagaagg tttaagctga gtgatctgag cataaatagc 480
acagaatgtc tgcatgtgca ttgcagagga ctggagacca gcctggctga atgtaccttt 540
accaagagaa ggaccatggg ctaccaggat tttgctgatg tggtttgtta tacacagaag 600
gcagatagcc ccatggatga cttttttcaa tgtgtgaatg ggaagtacat tagccagatg 660
aaggcctgtg atggcatcaa tgattgtgga gaccagagtg atgaactgtg ttgtaaggca 720
tgccagggca agggctttca ttgcaagagt ggagtttgca ttcccagcca gtatcagtgc 780
aatggagagg tggactgcat tacaggggaa gatgaagttg gctgtgcagg ctttgcaagt 840
gtgactcagg aagaaacaga aattctgaca gctgacatgg atgcagaaag aagaagaata 900
aagagcctgc tgcctaagct gagctgtgga gttaagaata gaatgcacat tagaaggaag 960
agaattgtgg gaggaaagag agcacagctg ggagacctgc cctggcaggt ggcaattaag 1020
gatgccagtg gaatcacctg tgggggaatt tatattggag gctgttggat tctgacagct 1080
gcacattgtc tgagagccag caagacccat agataccaga tatggacaac agtggtggac 1140
tggatacacc ctgacctgaa gagaatagtg attgaatatg tggatagaat tatttttcat 1200
gaaaattaca atgcaggcac ctaccagaat gacattgctc tgattgaaat gaagaaggat 1260
ggaaataaga aggattgtga gctgcctaga agcatccctg cctgtgtgcc ctggagccct 1320
tacctgtttc agcctaatga tacatgcatt gttagtggct ggggaagaga aaaggataat 1380
gaaagagtgt ttagcctgca gtggggagaa gttaagctga taagcaattg cagcaagttt 1440
tatggaaata gattttatga aaaggaaatg gaatgtgcag gcacatatga tggcagcatt 1500
gatgcctgca agggggacag tggaggcccc ctagtatgta tggatgccaa taatgtgacc 1560
tatgtgtggg gagttgtgag ctggggggaa aattgtggaa agcctgagtt tcctggagtt 1620
tacaccaagg tggccaatta ttttgactgg attagctacc atgtgggaag accttttatt 1680
agccagtaca atgtgtaa 1698
<210> 9
<211> 1698
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 9
aaggtgacct atacatctca ggaggatctg gtggagaaga agtgtctggc caagaagtat 60
acacacctct cctgtgataa ggtgttctgt cagccatggc agaggtgtat tgagggaacc 120
tgtgtgtgta agctgcctta tcagtgtcca aagaatggaa cagctgtgtg tgccacaaac 180
aggaggagct tcccaacata ctgtcagcag aagtcactgg aatgtctgca tccaggaaca 240
aagttcctga ataatggaac atgtacagct gaaggaaagt tctcagtgtc cctgaagcat 300
ggaaatacag attcagaggg aattgtggaa gtgaagctgg tggaccagga taagacaatg 360
ttcatctgta agagcagctg gagcatgagg gaagccaatg tggcctgtct ggacctggga 420
ttccagcagg gagctgatac acagaggagg ttcaagctgt ctgatctctc tatcaattcc 480
acagaatgtc tgcatgtgca ttgcagaggt ctggagacct cactggctga atgtacattc 540
acaaagagga ggacaatggg ataccaggat tttgctgatg tggtgtgtta tacacagaag 600
gctgattctc caatggatga cttctttcag tgtgtgaatg gaaagtacat ctctcagatg 660
aaggcctgtg atggaatcaa tgattgtgga gaccagtcag atgaactgtg ctgcaaggcc 720
tgtcagggaa agggattcca ttgcaagtca ggagtgtgta tcccaagcca gtatcagtgt 780
aatggagagg tggactgtat cacaggagaa gatgaagtgg gatgtgcagg atttgcctct 840
gtgactcagg aagaaacaga aatcctgaca gctgacatgg atgctgaaag gaggaggatc 900
aagtcactgc tgcctaagct gtcttgtgga gtgaagaaca ggatgcacat caggaggaag 960
aggattgtgg gaggaaagag ggcccagctg ggagacctcc catggcaggt ggccatcaag 1020
gatgcctcag gaatcacctg tggaggaatc tatattggag gatgttggat cctgacagct 1080
gcccattgtc taagagcctc aaagacacat agataccaga tctggacaac agtggtggac 1140
tggatccacc ctgacctgaa gaggattgtg attgaatatg tggataggat catcttccat 1200
gaaaactaca atgctggaac ataccagaat gacattgctc tgatagaaat gaagaaggat 1260
ggaaacaaga aggattgtga gctgcctagg tccatccctg cctgtgtgcc ctggtctcct 1320
tacctgttcc aacctaatga tacatgtatt gtgtctggat ggggaaggga aaaggataat 1380
gaaagggtgt tctcactgca gtggggagaa gtgaagctga tcagcaactg ttctaagttc 1440
tatggaaata ggttctatga aaaggaaatg gaatgtgctg gaacatatga tggatccatt 1500
gatgcctgta agggagactc tggaggaccc ctggtttgta tggatgccaa caatgtgaca 1560
tatgtgtggg gagtggtgtc atggggagaa aactgtggaa agccagagtt cccaggagtg 1620
tacaccaagg tggccaatta ttttgactgg atcagctacc atgtgggaag gcctttcatc 1680
tctcagtaca atgtgtaa 1698
<210> 10
<211> 1698
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 10
aaggtgacct atacatccca agaggatctt gtggaaaaga aatgtctggc caaaaagtac 60
acccatctgt cttgtgacaa ggtcttctgc cagccttggc agagatgtat tgaaggaact 120
tgtgtctgta aactgcccta ccagtgccct aagaatggaa cagctgtctg tgctactaat 180
agaaggtcat tcccaactta ctgccagcag aagtctctgg agtgtctcca ccctggaact 240
aaattcctga acaatggcac atgtacagct gaaggcaagt tctctgtctc cctcaaacat 300
ggaaacacag actcagaagg gattgtggaa gtcaagctgg tggatcagga taagaccatg 360
tttatttgca agtcatcctg gtctatgaga gaagcaaatg tggcctgcct ggatctgggc 420
tttcaacaag gagcagacac tcagaggaga ttcaagctct ctgacctgtc tattaatagc 480
actgagtgtc tgcatgtgca ttgtagagga ctggagacct cacttgctga atgtacattc 540
actaaaagaa ggactatggg ataccaggac tttgctgatg tggtgtgcta tacccagaag 600
gcagactccc ccatggatga ctttttccaa tgtgttaatg ggaaatatat tagtcagatg 660
aaggcttgtg atggaattaa tgactgtgga gatcagagtg atgagctctg ttgcaaagcc 720
tgtcagggaa agggtttcca ctgcaaaagt ggggtttgta ttccttctca ataccaatgc 780
aatggggagg tggactgcat tactggagag gatgaggtgg ggtgtgctgg ctttgcttct 840
gtgacccaag aggagacaga gatcctgaca gctgatatgg atgctgaaag gagaagaatt 900
aagtcactgc tgcccaaact gtcttgtgga gttaaaaaca gaatgcacat cagaagaaag 960
agaattgtgg gaggaaaaag agcccagctt ggagatctcc cttggcaagt ggccattaag 1020
gatgccagtg gtatcacatg tggaggcatc tatattggag ggtgctggat tctcacagct 1080
gcacactgtc tgagagccag taaaacccat agatatcaga tctggacaac agtggttgat 1140
tggattcatc ctgatctcaa gagaattgtg attgagtatg tggacagaat tatttttcat 1200
gaaaactaca atgcaggaac ctatcagaat gatattgccc tcattgagat gaagaaggat 1260
gggaacaaaa aggattgtga gctgcccaga agcatcccag cttgtgtgcc ttggtctcca 1320
tacctctttc agccaaatga tacttgcatt gtcagtggat ggggtagaga gaaagataat 1380
gagagagtct tctccctcca gtggggagag gttaagctca tcagtaattg ctccaagttt 1440
tatggaaaca ggttctatga aaaagagatg gaatgtgcag gaacatatga tggtagtatt 1500
gatgcttgca aaggagatag tggtggaccc ctggtctgta tggatgccaa caatgtgact 1560
tatgtgtggg gggtggtgag ctggggagag aattgtggga agcctgagtt tccaggagtc 1620
tacaccaagg tggctaatta ctttgactgg atcagttacc atgtgggtag gcccttcatt 1680
agccagtaca atgtctga 1698
<210> 11
<211> 1698
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 11
aaggttacct atacatccca ggaagacctg gtggagaaaa agtgtcttgc caagaagtac 60
acccacctca gttgtgataa ggtcttttgc cagccatggc agagatgtat tgaaggcact 120
tgtgtgtgca agctgccata ccagtgtccc aaaaatggga cagcagtctg tgcaactaat 180
agaagatcct tccctacata ctgccagcag aagagtcttg agtgcctgca cccaggcaca 240
aagtttctga ataatggcac atgcacagct gaaggcaaat tcagtgtctc cctgaaacat 300
ggaaacacag atagtgaggg aattgtggaa gttaagctgg tggaccagga taaaaccatg 360
ttcatttgta aatcttcatg gagtatgaga gaagctaatg tggcatgtct ggaccttgga 420
tttcaacaag gagcagatac ccagagaagg tttaagctga gtgatctctc cattaactct 480
actgagtgtc tgcatgtgca ttgtagagga ctggagacat cactggcaga atgtactttt 540
accaaaagga gaaccatggg ttatcaggac tttgcagatg tggtctgtta cacccagaag 600
gctgactccc ccatggatga cttctttcaa tgtgtgaatg ggaaatacat ctcccagatg 660
aaggcctgtg atggtatcaa tgactgtgga gaccagtctg atgagctctg ctgcaaggcc 720
tgtcagggga agggatttca ctgcaaaagt ggggtttgca tccccagtca gtaccagtgc 780
aatggggaag tggactgcat tacaggggaa gatgaggttg gttgtgctgg gtttgctagt 840
gtgacccagg aggaaacaga gatcctgaca gctgatatgg atgcagaaag aagaagaatt 900
aagagcctcc tgcctaagct cagttgtgga gtcaaaaata ggatgcatat taggagaaag 960
aggattgtgg gagggaaaag agcccagctt ggagacctgc catggcaggt tgccatcaag 1020
gatgcctcag ggatcacatg tggagggatc tatattggtg gatgttggat tctgactgct 1080
gcccattgcc tgagggcctc aaagacccac agatatcaga tctggaccac tgtggtggac 1140
tggattcatc ctgacctgaa gagaattgtg attgaatatg tggacaggat tatctttcat 1200
gagaactata atgctggaac ttatcagaat gatattgcac tgattgagat gaagaaggat 1260
gggaataaaa aggactgtga actcccaaga agcattcctg catgtgtgcc ttggtctcct 1320
tacctcttcc aacccaatga cacttgtatt gtcagtggat ggggtagaga aaaagacaat 1380
gagagggttt tcagtctgca gtggggggag gtcaagctca tcagcaactg ctccaaattc 1440
tatggaaaca ggttctatga aaaagaaatg gagtgtgctg ggacttatga tggtagtatt 1500
gatgcctgta aaggggattc tggagggcca cttgtctgta tggatgctaa caatgtgacc 1560
tatgtctggg gagtggtgtc atggggagaa aattgtggca aacctgagtt tcctggagtg 1620
tatacaaagg tggctaacta ttttgattgg atcagttatc atgttggtag acccttcatc 1680
agtcagtaca atgtctag 1698
<210> 12
<211> 1698
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 12
aaggtgacct acaccagcca ggaggacctg gtggaaaaga aatgtcttgc taagaaatat 60
acccacctgt cctgtgacaa agtcttctgt cagccttggc agagatgtat tgaagggaca 120
tgtgtctgta agctgcctta ccagtgtcct aagaatggga ctgcagtctg tgccactaat 180
agaagatcat tcccaacata ctgccagcag aagagtctgg agtgtctgca tcctggcaca 240
aagtttctca acaatgggac atgtacagct gaaggaaaat tctctgtgag cctgaaacat 300
ggcaatacag atagtgaggg aattgttgag gttaagctgg tggatcagga caaaacaatg 360
tttatctgca aaagcagctg gtccatgaga gaggctaatg tggcctgtct tgaccttggc 420
tttcaacaag gagcagatac ccagagaaga tttaaactgt cagatctgag catcaattca 480
acagagtgtc tgcatgtgca ttgtagagga ctggagacca gcctggctga atgtaccttc 540
acaaagagaa gaacaatggg ataccaggac tttgctgatg tggtttgtta cacccagaag 600
gcagacagcc ccatggatga cttctttcag tgtgtgaatg gaaagtatat tagccagatg 660
aaggcatgtg atggtatcaa tgattgtggg gaccagagtg atgagctctg ttgtaaggct 720
tgtcaaggca aaggcttcca ctgcaagtca ggggtgtgca tcccctccca ataccagtgc 780
aatggagagg tggattgcat cacaggggag gatgaagtgg gttgtgctgg gtttgcaagt 840
gtgacccagg aggaaacaga aatcctgact gctgatatgg atgctgagag gagaagaatc 900
aaaagcctcc tgcctaaact gtcttgtggt gttaagaata gaatgcacat tagaagaaag 960
agaattgtgg ggggaaagag agcacagctg ggtgatctgc cctggcaagt ggcaattaag 1020
gatgcctcag gcatcacctg tggaggcatt tacattgggg gttgctggat tctgacagca 1080
gcccactgtc tcagagccag caaaactcac agatatcaga tttggacaac agttgtggat 1140
tggattcacc ctgatctgaa gagaattgtc attgagtatg tggacagaat tattttccat 1200
gagaactaca atgctggcac ataccagaat gacattgccc tcattgaaat gaagaaggat 1260
ggaaataaaa aggactgtga actcccaaga tcaattcctg cctgtgtgcc atggagtcct 1320
tacctcttcc aaccaaatga tacctgcatt gtcagtggct gggggagaga gaaggataat 1380
gaaagagttt tctccctgca gtggggagag gtgaagctca ttagtaactg ttctaagttt 1440
tatgggaaca gattttatga gaaggagatg gaatgtgcag gaacttatga tggtagcatt 1500
gatgcatgca aaggagacag tggaggtcca cttgtctgca tggatgctaa caatgtgact 1560
tatgtctggg gagtggtctc ctggggtgaa aactgtggaa agcctgagtt cccaggagtg 1620
tatacaaaag tggccaacta ctttgactgg atttcatacc atgtggggag accttttatc 1680
agccagtaca atgtctga 1698
<210> 13
<211> 1698
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 13
aaggtgacct acacctctca ggaagacctg gtggagaaga agtgtcttgc caagaaatat 60
acccatctgt catgtgataa agtgttctgt cagccttggc agagatgtat tgagggaaca 120
tgtgtgtgca agctgcccta ccagtgtcca aagaatggga ctgctgtttg tgccactaac 180
agaagatctt ttcctacata ctgtcagcag aagagtctgg agtgcctcca ccctggcaca 240
aaattcctca ataatggcac atgtacagct gagggaaagt tttctgttag cctcaagcat 300
ggcaatactg attcagaggg tattgttgaa gtcaaactgg tggatcagga taaaaccatg 360
ttcatttgta agagtagctg gtccatgagg gaggctaatg tggcatgcct ggacctgggc 420
tttcaacaag gggctgacac tcagagaagg tttaagctga gtgacctgag cattaattca 480
actgagtgtc tgcatgtgca ttgtagaggg ctggagacta gccttgcaga gtgcacattc 540
actaagagaa gaacaatggg ataccaggat tttgcagatg tggtgtgcta cactcagaaa 600
gctgactctc ccatggatga cttcttccaa tgtgtgaatg ggaaatatat ttcacagatg 660
aaggcctgtg atggaattaa tgattgtggt gatcagagtg atgagctctg ttgtaaggct 720
tgccagggga agggttttca ctgtaaaagt ggggtttgta tcccctctca ataccagtgc 780
aatggggaag ttgattgcat tacaggagag gatgaggtgg gatgtgcagg ctttgccagt 840
gtgacacagg aagagacaga gatcctgaca gctgatatgg atgcagaaag aagaagaatc 900
aagtccctgc tccccaaact gtcctgtggg gtcaagaata gaatgcacat cagaaggaag 960
agaattgtgg gaggcaaaag ggcacagctg ggggacctcc catggcaggt ggcaattaag 1020
gatgccagtg gtatcacatg tggagggatt tacattggag gctgctggat tctcacagca 1080
gcccactgcc tcagagcatc taaaactcac agataccaga tttggaccac tgtggtggac 1140
tggattcacc ctgacctgaa gagaattgtg attgaatatg tggatagaat cattttccat 1200
gaaaattaca atgctggcac ttatcagaat gacattgcac tcattgagat gaagaaagat 1260
gggaataaaa aggactgtga actgcccaga agcattccag cttgtgtgcc atggagtcca 1320
tatctgtttc agccaaatga tacatgcata gtgtctggtt ggggaagaga gaaggacaat 1380
gaaagggttt ttagcctcca gtggggggag gtcaagctga ttagcaactg cagtaaattc 1440
tatggcaaca gattttatga gaaggagatg gaatgtgcag gcacttatga tggctcaatt 1500
gatgcctgca agggagattc tggtggaccc ctggtgtgca tggatgccaa taatgtcacc 1560
tatgtctggg gtgtggttag ctggggagag aactgtggga agcctgagtt tccaggagtg 1620
tatacaaaag tggcaaatta ctttgactgg atctcctatc atgtggggag accctttatc 1680
tctcagtaca atgtttga 1698
<210> 14
<211> 1698
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 14
aaggtgacct atacctctca ggaggacctg gttgagaaaa agtgcctggc taaaaagtac 60
acccacctct cttgtgataa ggtgttctgc cagccttggc agagatgcat tgaaggcaca 120
tgtgtttgta aactgcctta ccagtgtccc aaaaatggga ctgctgtgtg tgccacaaat 180
agaaggagct ttccaaccta ctgtcagcag aagagccttg aatgcctcca tcctgggaca 240
aaattcctga acaatggaac ctgtacagct gaaggcaaat ttagtgttag cctgaaacat 300
gggaatacag attctgaggg aattgtggag gtcaaactgg tggaccagga taaaaccatg 360
tttatctgca agagtagctg gtccatgaga gaggccaatg tggcatgcct ggatcttggg 420
tttcaacaag gagctgacac ccagagaaga ttcaaactca gtgacctgag tattaactca 480
acagaatgtc tgcatgtgca ttgtagagga ctggaaacta gccttgcaga gtgcactttt 540
accaagagaa gaaccatggg atatcaggat tttgctgatg tggtgtgcta cacccagaaa 600
gcagacagtc ccatggatga cttcttccag tgtgtgaatg gcaagtatat ttcccagatg 660
aaagcatgtg atggcatcaa tgattgtgga gaccagagtg atgaactgtg ctgtaaggct 720
tgccagggaa agggtttcca ctgcaaaagt ggagtttgca tccccagcca gtaccagtgc 780
aatggagaag tggattgcat tacaggagag gatgaagtgg gatgtgctgg ctttgcttct 840
gttacccaag aagagacaga gattctgaca gctgacatgg atgcagagag gagaagaatt 900
aagtccctgc tgcctaaact gtcctgtggt gtcaagaata gaatgcacat cagaaggaag 960
agaattgtgg ggggaaaaag agcccagctt ggagacctgc cttggcaagt ggctattaag 1020
gatgccagtg ggatcacatg tggaggaatt tacattggag ggtgctggat tctcacagct 1080
gcccactgcc tgagggccag caaaacccac agataccaga tctggacaac agttgtggat 1140
tggattcatc ctgatctcaa gagaattgtt attgagtatg tggataggat cattttccat 1200
gaaaattaca atgcaggcac ataccaaaat gacattgcac tcattgagat gaagaaggat 1260
gggaataaaa aggattgtga gctccccagg agcattcctg cttgtgtccc ctggtcccct 1320
tacctcttcc aacccaatga cacctgcatt gtcagtggct ggggtagaga aaaagataat 1380
gagagagtct tcagcctgca gtggggggag gtgaagctga ttagcaattg tagcaagttt 1440
tatgggaaca ggttctatga gaaggagatg gagtgtgctg gcacctatga tggctctatt 1500
gatgcttgta agggggacag tgggggacca ctggtttgta tggatgcaaa caatgtgacc 1560
tatgtttggg gagtggttag ctggggagaa aattgtggaa aacctgagtt tcctggtgtc 1620
tatacaaaag tggctaatta ttttgattgg atcagttatc atgttgggag accctttatt 1680
agtcagtaca atgtctag 1698
<210> 15
<211> 1698
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 15
aaggtgacct acactagcca ggaggatctg gtggagaaaa agtgccttgc aaaaaagtac 60
actcacctca gctgtgacaa ggtcttctgt cagccttggc agagatgcat tgaggggaca 120
tgtgtgtgca aactcccata ccagtgtcct aagaatggta cagctgtctg tgcaacaaac 180
aggagatcct ttcccaccta ttgtcagcag aagtccctgg agtgtctgca ccctggtaca 240
aagtttctga ataatggcac atgcactgct gagggaaagt tcagtgtgtc cctgaaacat 300
ggaaacactg attcagaggg tattgtggag gtgaaacttg tggatcagga caagaccatg 360
ttcatctgca agtccagttg gagcatgaga gaggctaatg tggcctgtct ggacctgggt 420
tttcagcaag gagctgacac tcagagaagg ttcaagctgt cagatctcag tatcaactcc 480
acagaatgtc tgcatgtgca ttgcagaggg ctggagacta gccttgctga atgtactttt 540
acaaagagaa gaactatggg ataccaggat tttgcagatg tggtctgtta tactcagaag 600
gctgattcac ccatggatga cttcttccag tgtgtgaatg gcaagtacat ttcacaaatg 660
aaagcatgtg atggtatcaa tgattgtgga gaccagagtg atgaactctg ttgcaaggca 720
tgccagggca agggattcca ctgcaagagt ggtgtctgta ttcccagtca gtatcagtgc 780
aatggggagg tggactgcat cactggggaa gatgaagtgg gctgtgctgg ttttgctagt 840
gtgacacagg aggaaactga aattctcaca gcagatatgg atgctgagag aaggagaatc 900
aagtccctcc tccctaaact gagttgtgga gtgaaaaaca gaatgcatat tagaagaaaa 960
agaattgtgg gaggcaagag agctcagctt ggggacctcc catggcaagt ggctattaag 1020
gatgcaagtg ggattacatg tggagggatc tatattgggg ggtgctggat tctgacagca 1080
gcccactgtc tgagagcctc taaaacccat agatatcaga tctggacaac agtggtggat 1140
tggattcacc cagacctcaa gaggattgtg attgagtatg tggatagaat tatttttcat 1200
gagaactaca atgctggaac ctatcagaat gatattgctc tgattgaaat gaaaaaggat 1260
gggaacaaaa aggactgtga actgccaaga tcaatccctg catgtgtgcc atggagtccc 1320
tatctctttc agcccaatga tacatgcatt gttagtggat gggggaggga gaaagacaat 1380
gagagagtgt tcagtctcca gtggggtgaa gtgaagctca tttctaattg tagcaagttt 1440
tatgggaata gattctatga aaaagaaatg gagtgtgcag gaacttatga tggttccatt 1500
gatgcctgca agggagatag tggtgggccc ctggtgtgca tggatgctaa taatgtgacc 1560
tatgtctggg gagtggtttc atggggagag aattgtggaa agcctgagtt ccctggagtg 1620
tacaccaagg tggccaatta ctttgattgg atcagctatc atgtgggaag accatttatt 1680
tcccagtaca atgtctaa 1698
<210> 16
<211> 1698
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 16
aaggtgacct atacaagcca ggaagatctt gtggagaaaa agtgccttgc taagaagtac 60
actcacctca gctgtgacaa agtcttttgc cagccttggc agagatgtat tgagggaact 120
tgtgtctgta agctcccata tcagtgtccc aagaatggaa cagctgtgtg tgctactaac 180
agaaggagct ttcccaccta ctgccagcag aagagccttg aatgtctcca cccagggacc 240
aagtttctga acaatggcac atgtacagct gaggggaaat tcagtgtcag tctcaaacat 300
gggaatactg atagtgaggg cattgttgag gtgaaacttg tggaccagga taagaccatg 360
tttatctgca agtcaagctg gtcaatgaga gaagctaatg tggcttgtct ggaccttggg 420
tttcaacaag gagctgacac tcagagaaga tttaagctga gtgatctgag tatcaacagc 480
actgaatgtc tgcatgtgca ttgcagaggg ctggagacta gccttgctga gtgcactttt 540
accaagagaa gaacaatggg ataccaggat tttgctgatg tggtctgtta tactcagaag 600
gcagattcac caatggatga cttctttcag tgtgtgaatg gaaaatacat ttcccagatg 660
aaggcttgtg atggtatcaa tgactgtggg gaccagagtg atgagctctg ttgtaaggca 720
tgtcagggca aaggatttca ctgcaagtct ggggtctgta tccccagcca gtatcagtgt 780
aatggagagg ttgattgtat cacaggggag gatgaagtgg gttgtgctgg ctttgcatca 840
gtgacacagg aagagacaga aattctgaca gcagatatgg atgctgaaag aaggagaatt 900
aaaagcctcc tgccaaaact gagctgtggt gtcaagaata gaatgcacat cagaaggaag 960
agaattgttg gtggaaagag ggcccagctt ggggacctgc catggcaggt tgcaatcaaa 1020
gatgcaagtg gcattacctg tggaggaatt tacattggag ggtgttggat tctgacagca 1080
gctcattgtc taagagcctc caaaacccac agataccaga tctggaccac tgtggtggat 1140
tggattcacc ctgacctgaa aagaattgtc attgagtatg tggacaggat tattttccat 1200
gagaattata atgctggcac ctaccagaat gacattgccc tgattgagat gaagaaagat 1260
ggaaataaga aggactgtga gctcccaaga tcaattcctg cttgtgtgcc ttggtctcca 1320
tacctgtttc agcccaatga tacttgtatt gtttctggat ggggcaggga aaaagacaat 1380
gagagagtgt tcagcctgca gtggggggag gtgaagctga tctcaaactg cagcaagttc 1440
tatggaaata gattttatga gaaggaaatg gagtgtgcag gcacttatga tggatcaatt 1500
gatgcctgca agggtgacag tggtggccca cttgtgtgca tggatgctaa caatgtgacc 1560
tatgtttggg gtgtggtgtc atggggggaa aactgtggca aacctgagtt tcctggtgtt 1620
tacactaagg ttgcaaacta ctttgactgg atcagctatc atgtgggcag accttttatt 1680
tcccagtata atgtctaa 1698
<210> 17
<211> 1698
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 17
aaggtgacct ataccagcca ggaggacctt gttgagaaga aatgcctggc taagaaatac 60
acccacctgt cctgtgacaa ggtgttctgt cagccttggc agaggtgcat tgaagggacc 120
tgtgtgtgta aactccccta ccagtgccct aagaatggca ctgcagtgtg tgctacaaac 180
agaagatcat tcccaaccta ttgccagcag aaatcactgg aatgcctgca tcctggtaca 240
aaattcctga acaatgggac ttgtactgct gaggggaaat tcagtgtgtc cctgaaacat 300
gggaacacag attctgaggg tattgttgag gtgaagctgg tggatcagga taagactatg 360
tttatctgca agtcaagctg gtccatgagg gaagccaatg tggcatgcct ggatctgggt 420
tttcaacaag gagctgatac ccagagaaga tttaagctga gtgacctcag cattaactct 480
actgagtgtc tgcatgtgca ctgtagaggg cttgaaacaa gcctggcaga gtgcaccttc 540
accaagagaa ggacaatggg ataccaggac tttgctgatg tggtctgcta cacccagaag 600
gctgattccc ccatggatga tttctttcaa tgtgtgaatg ggaagtacat cagccagatg 660
aaagcatgtg atgggatcaa tgactgtgga gaccagagtg atgagctgtg ctgcaaagct 720
tgccagggga aaggctttca ttgcaagagt ggggtctgta ttccctccca ataccagtgc 780
aatggggagg tggattgcat cacaggagaa gatgaagtgg gctgtgctgg atttgcctca 840
gtgactcagg aagagacaga aattctcaca gctgatatgg atgcagagag aaggaggatc 900
aagtccctcc tgcctaaact gagttgtgga gtgaagaaca ggatgcatat tagaaggaag 960
agaattgtgg ggggtaaaag agcccagctt ggggacctgc cttggcaagt ggctatcaaa 1020
gatgccagtg gtattacctg tggtgggatc tatattggtg gttgctggat tctcactgct 1080
gcacactgtc tgagagccag caaaacccac agatatcaga tttggactac agtggttgac 1140
tggattcacc ctgacctgaa gagaattgtt attgagtatg tggatagaat catcttccat 1200
gagaattaca atgctgggac ttatcagaat gatattgccc tcattgaaat gaagaaggat 1260
gggaacaaaa aggattgtga gctgcccaga agcattccag cctgtgtgcc atggagcccc 1320
tatctgtttc agccaaatga cacttgtatt gtttctggtt ggggcaggga aaaagacaat 1380
gaaagagtct ttagcctcca gtggggagaa gttaagctga tttcaaattg cagcaaattc 1440
tatgggaaca ggttctatga gaaggagatg gagtgtgctg ggacatatga tggttcaatt 1500
gatgcttgca aaggagatag tggtgggcca ctggtctgca tggatgccaa taatgtgaca 1560
tatgtctggg gggtggtttc ctggggagag aattgtggga agccagagtt tcctggtgtc 1620
tatacaaaag tggctaacta ttttgactgg atcagctatc atgtggggag acctttcatc 1680
agtcagtata atgtgtag 1698
<210> 18
<211> 1698
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 18
aaggtgacct acacctctca ggaggatctg gtggagaaaa agtgcctggc aaaaaagtat 60
actcacctca gttgtgacaa ggtcttctgc cagccatggc agagatgtat tgagggaacc 120
tgtgtgtgca aactccctta tcagtgtccc aagaatggga ctgcagtctg tgcaaccaac 180
agaagaagct ttcccacata ctgtcagcag aaatcccttg agtgcctgca ccctggaacc 240
aaattcctga ataatggaac ttgcacagca gaggggaaat tcagtgtcag cctgaaacat 300
ggcaacactg atagtgaggg gattgttgaa gtgaagctgg tggatcagga taagactatg 360
tttatctgca aaagttcatg gagcatgaga gaagcaaatg tggcatgcct tgatctgggt 420
ttccaacaag gagctgacac tcagagaaga tttaaactca gtgatctgtc aatcaacagc 480
acagagtgcc tgcatgtgca ctgtagagga cttgagacat cacttgcaga atgcacattt 540
accaaaagaa gaaccatggg ataccaggat tttgcagatg tggtgtgcta tactcagaaa 600
gctgatagcc ccatggatga cttcttccag tgtgtcaatg ggaagtatat cagccagatg 660
aaggcctgtg atggaatcaa tgactgtgga gatcagagtg atgaactctg ttgtaaggca 720
tgtcagggga agggtttcca ttgcaagagt ggagtctgca ttccttcaca ataccagtgc 780
aatggagagg tggattgtat tactggggag gatgaagtgg gttgtgcagg atttgccagt 840
gtgactcagg aggaaactga gattctgaca gctgacatgg atgctgagag aagaaggatc 900
aagagcctgc tcccaaagct gtcatgtggg gtcaaaaata gaatgcacat cagaaggaag 960
agaattgtgg gagggaaaag agctcagctg ggagacctcc cttggcaagt ggcaatcaag 1020
gatgctagtg gtatcacatg tggaggaatc tacattgggg ggtgttggat tctgactgca 1080
gcccattgcc tgagggcatc caaaacccac agatatcaga tctggacaac agttgtggac 1140
tggattcacc ctgacctcaa aagaattgtc attgagtatg tggacagaat cattttccat 1200
gagaattaca atgctggcac ttaccagaat gacattgccc tgattgaaat gaagaaggat 1260
ggaaacaaga aggattgtga actccccagg tcaatcccag cctgtgtgcc ctggagcccc 1320
tacctgttcc agccaaatga tacatgtatt gtcagtggat gggggagaga gaaggacaat 1380
gagagagtgt tttcactgca gtggggggaa gtgaagctga tcagcaattg ctccaagttc 1440
tatggaaaca ggttttatga gaaggagatg gagtgtgctg ggacttatga tggaagtatt 1500
gatgcttgta aaggggattc aggaggtcct cttgtctgca tggatgctaa caatgtgaca 1560
tatgtgtggg gagtagtcag ttggggagaa aactgtggaa aaccagaatt tcctggggtg 1620
tatactaaag tggcaaatta ttttgactgg atcagctatc atgtgggtag acccttcatt 1680
agtcagtata atgtgtga 1698
<210> 19
<211> 1698
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 19
aaggtgacct acacctctca ggaagacctt gttgaaaaga agtgtctggc caaaaagtat 60
actcatctgt cttgtgacaa agtcttctgt cagccctggc agagatgcat tgagggaaca 120
tgtgtctgca agctccctta tcagtgtccc aaaaatggca cagcagtttg tgccacaaat 180
agaaggtctt ttcctacata ctgccagcag aagagccttg aatgtctcca cccaggcaca 240
aagtttctga ataatgggac ttgcacagca gaaggcaaat ttagtgtgtc cctgaaacat 300
ggaaacactg atagtgaggg cattgtggag gttaagcttg tggatcagga taaaacaatg 360
ttcatctgca agagctcatg gtccatgaga gaggctaatg tggcttgtct ggacctgggt 420
tttcaacaag gagctgatac tcagagaagg tttaagctca gtgacctgag catcaacagt 480
acagagtgtc tgcatgtgca ttgtagagga ctggaaactt ctctggctga gtgtaccttt 540
acaaagagaa gaacaatggg ataccaggat tttgctgatg tggtctgcta cacccagaaa 600
gctgactccc ccatggatga tttctttcaa tgtgttaatg ggaaatacat tagccagatg 660
aaggcttgtg atggtatcaa tgactgtgga gaccagtctg atgaactgtg ctgtaaagcc 720
tgtcaaggga aaggattcca ctgcaagagt ggagtgtgca ttccatccca gtaccagtgt 780
aatggagaag ttgattgcat tacaggggaa gatgaagtgg gttgtgcagg gtttgcttca 840
gtaactcagg aggagacaga aatcctgaca gctgacatgg atgctgaaag gagaaggatc 900
aaaagcctgc tgcccaagct ctcatgtggg gtgaaaaaca ggatgcatat tagaaggaag 960
aggattgtgg gagggaaaag agcccagctg ggggacctgc catggcaggt tgccattaaa 1020
gatgcttcag ggatcacatg tgggggcatc tatattggag gctgttggat tctcacagca 1080
gcacactgcc tgagagcttc aaagactcac agatatcaga tttggacaac agtggtggat 1140
tggattcacc ctgatctcaa aagaattgtc attgaatatg ttgacagaat catctttcat 1200
gaaaactaca atgctggaac ttatcagaat gatattgctc tgattgaaat gaagaaagat 1260
ggaaacaaaa aggactgtga actgcccaga agcatccctg cttgtgttcc atggtcccct 1320
tacctgtttc agcctaatga cacctgcatt gttagtggct gggggagaga gaaggacaat 1380
gagagagtgt tttccctgca gtggggagag gtgaaactca tctctaactg ttcaaaattc 1440
tatgggaata gattttatga gaaggagatg gaatgtgctg ggacctatga tgggtcaatt 1500
gatgcttgta agggtgacag tggaggaccc ctggtgtgca tggatgccaa caatgtgaca 1560
tatgtctggg gggtggttag ctggggagaa aattgtggga agcctgagtt ccctggggtg 1620
tacaccaagg ttgcaaacta ttttgattgg atttcttatc atgtgggtag accatttatc 1680
agtcagtata atgtgtag 1698
<210> 20
<211> 1698
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 20
aaggtgacct atacttctca agaggatctg gtggagaaaa aatgcctggc taaaaaatat 60
actcacctgt cctgtgataa agtcttctgc cagccatggc agagatgcat tgagggaact 120
tgtgtgtgca aactgccata tcagtgccca aaaaatggaa ctgctgtgtg tgctactaac 180
aggagaagct tcccaactta ttgccagcag aaaagtctgg aatgccttca tccaggaact 240
aaatttctga ataatggaac ttgcactgct gaaggaaaat ttagtgtgtc cctgaaacat 300
ggaaatactg attcagaggg aattgtggaa gtgaaacttg tggatcagga taaaactatg 360
ttcatttgca aaagcagctg gagcatgagg gaagctaatg tggcttgcct tgatcttgga 420
tttcaacaag gagctgatac tcagagaagg tttaaactgt ctgatctgtc tattaattcc 480
actgaatgcc tgcatgtgca ttgcagagga ctggagacta gtctggctga atgcactttt 540
actaaaagaa gaactatggg atatcaggat tttgctgatg tggtgtgcta tactcagaaa 600
gctgattctc caatggatga tttctttcaa tgtgtgaatg gaaaatatat ttctcagatg 660
aaagcttgtg atggaatcaa tgattgtgga gatcagagtg atgaactgtg ctgcaaagct 720
tgccagggaa aaggatttca ttgcaaatct ggagtgtgca ttccaagcca gtatcagtgc 780
aatggagagg tggattgcat tactggagaa gatgaagtgg gatgtgctgg atttgcttct 840
gtgactcaag aagaaactga aattctgact gctgatatgg atgctgaaag aagaagaatt 900
aaatcactgc tgcctaaact gtcttgtgga gtgaaaaaca gaatgcacat tagaaggaaa 960
agaattgtgg gaggaaaaag agctcagctg ggagatctgc catggcaggt ggctattaaa 1020
gatgctagtg gaatcacttg tggaggaatt tatattggag gatgctggat tctgactgct 1080
gctcattgcc tgagagctag taaaactcat agatatcaga tttggactac tgtggtggat 1140
tggattcacc cagatcttaa aagaattgtg attgaatatg tggatagaat tattttccat 1200
gaaaactata atgctggaac ttatcagaat gatattgctc tgattgaaat gaaaaaagat 1260
ggaaacaaaa aagattgtga gctgcctaga tccatccctg cttgtgtccc atggtctcct 1320
tatctgttcc aacctaatga tacttgcatt gtgtctggat ggggaagaga aaaagataat 1380
gaaagagtct tttcacttca atggggagaa gtgaaactga ttagcaactg ctctaaattt 1440
tatggaaata gattctatga aaaagaaatg gaatgtgctg gaacttatga tggatccatt 1500
gatgcttgca aaggagattc tggaggacca ctggtctgca tggatgctaa caatgtgact 1560
tatgtctggg gagtggtcag ttggggagaa aactgtggaa aaccagagtt cccaggagtg 1620
tatactaaag tggctaatta ttttgattgg attagctatc atgtgggaag gccttttatt 1680
tctcagtata atgtgtaa 1698
<210> 21
<211> 1752
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 21
atgaagctgc tgcacgtgtt cctgctgttt ctgtgcttcc acctgcgctt ttgtaaggtg 60
acctatacat ctcaggagga tctggtggag aagaagtgtc tggccaagaa gtacacacac 120
ctgagctgcg acaaggtgtt ctgtcagcca tggcagcggt gcatcgaggg aacctgcgtg 180
tgcaagctgc cttatcagtg cccaaagaac ggcaccgccg tgtgcgccac aaatcggaga 240
tcttttccaa catactgcca gcagaagagc ctggagtgtc tgcaccccgg caccaagttt 300
ctgaacaatg gcacctgcac agccgagggc aagttctctg tgagcctgaa gcacggcaac 360
acagattccg agggcatcgt ggaggtgaag ctggtggacc aggataagac catgttcatc 420
tgtaagagct cctggtctat gagagaggcc aacgtggcct gcctggatct gggctttcag 480
cagggcgccg acacacagag gcgcttcaag ctgtccgacc tgtctatcaa tagcaccgag 540
tgcctgcacg tgcactgtag gggcctggag acaagcctgg ccgagtgcac ctttacaaag 600
cggagaacca tgggctatca ggacttcgcc gacgtggtgt gctacaccca gaaggccgat 660
tctccaatgg acgatttctt tcagtgcgtg aacggcaagt acatcagcca gatgaaggcc 720
tgcgacggca tcaatgactg tggcgatcag tccgacgagc tgtgctgtaa ggcctgtcag 780
ggcaagggct ttcactgcaa gagcggcgtg tgcatcccct cccagtatca gtgcaacggc 840
gaggtggatt gtatcaccgg agaggacgaa gtgggatgcg caggcttcgc ctccgtgacc 900
caggaggaga ccgagatcct gacagccgac atggatgccg agaggcgccg gatcaagtct 960
ctgctgccta agctgagctg tggcgtgaag aatagaatgc acatcagaag gaagcgcatc 1020
gtgggaggca agagggcaca gctgggcgat ctgccatggc aggtggccat caaggacgca 1080
agcggaatca cctgcggagg catctatatc ggaggatgtt ggatcctgac cgcagcacac 1140
tgcctgagag catccaagac acacaggtac cagatctgga ccacagtggt ggattggatc 1200
caccctgacc tgaagagaat cgtgatcgag tatgtggata ggatcatctt ccacgagaac 1260
tacaatgccg gcacatatca gaacgacatc gccctgatcg agatgaagaa ggatggcaat 1320
aagaaggact gtgagctgcc acgctccatc cctgcatgcg tgccctggtc tccttacctg 1380
tttcagccaa acgatacctg catcgtgagc ggatggggaa gggagaagga caatgagcgg 1440
gtgttctccc tgcagtgggg cgaggtgaag ctgatctcca actgttctaa gttttacggc 1500
aatcggttct atgagaagga gatggagtgc gccggcacct acgatggcag catcgacgcc 1560
tgtaagggcg attccggagg accactggtg tgcatggacg caaacaatgt gacatacgtg 1620
tggggagtgg tgagctgggg agagaactgc ggcaagccag agtttcccgg cgtctacacc 1680
aaggtggcca attattttga ctggatctcc taccacgtgg gcaggccttt catctctcag 1740
tacaacgtgt ga 1752
<210> 22
<211> 1752
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 22
atgaagctgc tgcatgtgtt tctgctgttc ctctgcttcc acctgaggtt ctgcaaagtg 60
acctacacca gccaagagga cctggtggaa aagaagtgcc tggccaagaa gtacacccac 120
ctgagctgcg acaaggtgtt ctgccagcct tggcagagat gcatcgaggg cacctgtgtg 180
tgcaagctgc cctatcagtg ccccaagaat ggcacagccg tgtgcgccac caacagaaga 240
agcttcccta cctactgcca gcagaaaagc ctggaatgtc tgcaccccgg caccaagttt 300
ctgaacaacg gcacctgtac cgccgagggc aagtttagcg tgtccctgaa gcacggcaac 360
accgactctg agggcatcgt ggaagtgaag ctggtggacc aggacaagac catgttcatc 420
tgcaagagca gctggtccat gcgcgaggcc aatgtggctt gtctggatct gggattccag 480
cagggcgccg acacacagag aagattcaag ctgagcgacc tgagcatcaa cagcaccgag 540
tgcctgcatg tgcactgtag aggcctggaa acaagcctgg ccgagtgcac cttcaccaag 600
agaaggacca tgggctacca ggacttcgcc gacgtcgtgt gctacaccca gaaagccgac 660
tctcccatgg acgatttctt ccagtgcgtg aacggcaagt acatcagcca gatgaaggcc 720
tgcgacggca tcaacgattg cggcgatcag agcgacgagc tgtgctgcaa agcctgtcaa 780
ggcaagggct tccactgcaa gtccggcgtg tgtatcccta gccagtacca gtgcaatggc 840
gaggtggact gtatcaccgg cgaggatgaa gtgggctgtg ccggatttgc cagcgtgacc 900
caagaggaaa ccgagatcct gaccgccgat atggacgccg agcggcggag aatcaaaagc 960
ctgctgccta agctgtcctg cggcgtgaag aaccggatgc acatccggcg caagagaatc 1020
gtcggaggca aaagagcaca gctgggcgat ctgccttggc aagtggccat caaggatgcc 1080
agcggcatca catgtggcgg catctacatc ggcggctgct ggattctgac agccgctcat 1140
tgtctgcggg ccagcaagac ccaccggtat cagatctgga ccaccgtggt ggactggatt 1200
caccccgacc tgaagcggat cgtgatcgag tacgtggacc ggatcatctt ccacgagaac 1260
tacaacgccg gcacctacca gaacgatatc gccctgatcg agatgaagaa ggacgggaac 1320
aagaaggact gcgagctgcc tagatctatc cccgcctgtg ttccttggag cccctacctg 1380
ttccagccta acgatacctg catcgtgtcc ggctggggca gagagaagga taacgagagg 1440
gtgttcagcc tgcagtgggg cgaagtgaaa ctgatcagca actgcagcaa gttctacggc 1500
aaccggttct acgagaaaga aatggaatgc gccggcacat acgacggctc catcgatgcc 1560
tgtaaaggcg attctggcgg ccctctcgtg tgcatggatg ccaacaatgt gacctacgtg 1620
tggggcgtcg tgtcctgggg agagaattgt ggcaagcctg agttccccgg cgtctacacc 1680
aaggtggcca actacttcga ctggatcagc taccacgtgg gcagaccctt tatcagccag 1740
tacaacgtgt ga 1752
<210> 23
<211> 1752
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 23
atgaagctgc tgcatgtgtt cctgctgttt ctgtgcttcc acctgagatt ttgtaaggtg 60
acctatacat ctcaggagga tctggtggag aagaagtgtc tggccaagaa gtacacacac 120
ctgagttgtg acaaggtgtt ctgtcagcca tggcagagat gcattgaggg aacctgtgtg 180
tgcaagctgc cttatcagtg cccaaagaat ggcactgctg tgtgtgccac aaataggaga 240
tcttttccaa catactgcca gcagaagagc ctggagtgtc tgcaccctgg caccaagttt 300
ctgaacaatg gcacctgcac agctgagggc aagttctctg tgagcctgaa gcatggcaac 360
acagatagtg agggcattgt ggaggtgaag ctggtggacc aggataagac catgttcatc 420
tgtaagagct cctggtctat gagagaggcc aatgtggcct gcctggatct gggctttcaa 480
caaggagctg acacacagag gagattcaag ctgagtgacc tgtctatcaa tagcacagag 540
tgcctgcatg tgcactgtag aggcctggag acaagcctgg ctgagtgcac ctttacaaag 600
agaaggacca tgggctatca ggactttgct gatgtggtat gctacaccca gaaggctgat 660
tctccaatgg atgatttctt tcaatgtgtg aatggcaagt acatcagcca gatgaaggcc 720
tgtgatggca tcaatgactg tggagatcag agtgatgagc tgtgttgcaa ggcctgtcag 780
ggcaagggct ttcactgcaa gagtggagtg tgcatcccct cccaatatca gtgcaatgga 840
gaggtggatt gtatcacagg agaggatgaa gtgggatgtg caggctttgc ctcagtgacc 900
caggaggaga cagagatcct gacagctgac atggatgctg agaggagaag gatcaagtct 960
ctgctgccta agctgagctg tggagtgaag aatagaatgc acatcagaag gaagagaatt 1020
gtgggaggca agagggcaca gctgggagat ctgccatggc aggtggccat caaggatgca 1080
agtggaatca cctgtggagg catctatatt ggaggatgtt ggatcctgac agcagcacac 1140
tgcctgagag catccaagac acacagatac cagatctgga ccacagtggt tgattggatc 1200
caccctgacc tgaagagaat tgtgattgag tatgtggata ggatcatctt ccatgagaac 1260
tacaatgctg gcacatatca gaatgacatt gccctgattg agatgaagaa ggatggcaat 1320
aagaaggact gtgagctgcc aagatccatc cctgcatgtg tgccctggtc tccttacctg 1380
tttcagccaa atgatacctg cattgtatcc ggatggggaa gggagaagga caatgagaga 1440
gtgttctccc tgcagtgggg agaggtgaag ctgatctcca actgttctaa gttttatggc 1500
aatagattct atgagaagga gatggagtgt gcaggcacct atgatggcag cattgatgcc 1560
tgtaagggag atagtggagg accactggtg tgcatggatg caaacaatgt gacatatgtg 1620
tggggagtgg tgagctgggg agagaactgt ggcaagccag agtttcctgg agtctacacc 1680
aaggtggcca attattttga ctggatctcc taccatgtgg gcaggccttt catctctcag 1740
tacaatgtgt ga 1752
<210> 24
<211> 1752
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 24
atgaagctgc tgcatgtgtt tctgctgttc ctctgcttcc acctgaggtt ctgcaaggtg 60
acctacacca gccaagagga cctggtggaa aagaagtgcc tggccaagaa gtacacccac 120
ctgagctgtg acaaggtgtt ctgccagcct tggcagagat gcattgaggg cacctgtgtg 180
tgcaagctgc cctatcagtg ccccaagaat ggcacagctg tgtgtgccac caacagaagg 240
agcttcccta cctactgcca gcagaaaagc ctggaatgtc tgcaccctgg caccaagttt 300
ctgaacaatg gcacctgtac agctgagggc aagtttagtg tgtccctgaa gcatggcaac 360
acagactctg agggcattgt ggaagtgaag ctggtggacc aggacaagac catgttcatc 420
tgcaagagta gctggtccat gagagaggcc aatgtggctt gtctggatct gggattccaa 480
cagggagctg acacacagag aagattcaag ctgagtgacc tgagcatcaa cagcacagag 540
tgcctgcatg tgcactgtag aggcctggaa acaagcctgg ctgagtgcac cttcaccaag 600
agaaggacca tgggctacca ggactttgct gatgtggtgt gctacaccca gaaagctgac 660
tctcccatgg atgatttctt tcaatgtgtg aatggcaagt acatcagcca gatgaaggcc 720
tgtgatggca tcaatgattg tggagatcag agtgatgagc tgtgctgcaa agcctgtcaa 780
ggcaagggct tccactgcaa gagtggagtg tgtatcccta gccagtacca gtgcaatgga 840
gaggtggact gtatcacagg agaggatgaa gtgggctgtg ctggatttgc cagtgtgacc 900
caagaggaaa cagagatcct gacagctgat atggatgctg agagaaggag aatcaaaagc 960
ctgcttccta agctgtcctg tggagtgaag aacagaatgc acatcagaag gaagagaatt 1020
gtgggaggca aaagagcaca gctgggagat ctgccttggc aagtggccat caaggatgcc 1080
agtggcatca catgtggagg catctacatt ggaggctgct ggattctgac agctgctcat 1140
tgtctgagag ccagcaagac ccacagatat cagatctgga ccacagtggt agactggatt 1200
caccctgacc tgaagagaat tgtgattgag tatgtggaca gaatcatctt ccatgagaac 1260
tacaatgctg gcacctacca gaatgatatt gccctgattg agatgaagaa ggatggaaac 1320
aagaaagact gtgagctgcc tagatctatc cctgcctgtg ttccttggag cccctacctg 1380
ttccagccta atgatacctg catagtttct ggatggggca gagagaagga taatgagagg 1440
gtgttcagcc tgcagtgggg agaagtgaaa ctgatcagca actgcagcaa gttctatggc 1500
aacagattct atgagaaaga aatggaatgt gctggcacat atgatggctc cattgatgcc 1560
tgtaaaggag attctggagg ccctcttgtg tgcatggatg ccaacaatgt gacctatgtg 1620
tggggagtgg tatcctgggg agagaattgt ggcaagcctg agttccctgg agtctacacc 1680
aaggtggcca actactttga ctggatcagc taccatgtgg gcagaccctt tatcagccag 1740
tacaatgtgt ga 1752
<210> 25
<211> 1752
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 25
atgaagctgc tgcatgtgtt cctgctgttc ctgtgcttcc acctgagatt ctgcaaggtg 60
acctacacca gccaggagga cctggtggag aagaagtgcc tggccaagaa gtacacccac 120
ctgagctgtg acaaggtgtt ctgccagccc tggcagagat gcattgaggg cacctgtgtg 180
tgcaagctgc cctaccagtg ccccaagaat ggcacagctg tgtgtgccac caacagaagg 240
agcttcccca cctactgcca gcagaagagc ctggagtgcc tgcaccctgg caccaagttc 300
ctgaacaatg gcacctgcac agctgagggc aagttcagtg tgagcctgaa gcatggcaac 360
acagacagtg agggcattgt ggaggtgaag ctggtggacc aggacaagac catgttcatc 420
tgcaagagca gttggagcat gagagaggcc aatgtggcct gcctggacct gggcttccag 480
caaggagctg acacccagag aaggttcaag ctgagtgacc tgagcatcaa cagcacagag 540
tgcctgcatg tgcactgcag aggcctggag accagcctgg ctgagtgcac cttcaccaag 600
agaaggacca tgggctacca ggactttgct gatgtggttt gctacaccca gaaggctgac 660
agccccatgg atgacttctt ccagtgtgtg aatggcaagt acatcagcca gatgaaggcc 720
tgtgatggca tcaatgactg tggagaccag agtgatgagc tgtgctgcaa ggcctgccag 780
ggcaagggct tccactgcaa gagtggagtg tgcatcccca gccagtacca gtgcaatgga 840
gaggtggact gcatcacagg agaggatgag gtgggctgtg ctggctttgc cagtgtgacc 900
caggaggaga cagagatcct gacagctgac atggatgctg agagaaggag aatcaagagc 960
ctgctgccca agctgagctg tggagtgaag aacagaatgc acatcagaag gaagagaatt 1020
gtgggaggca agagagccca gctgggagac ctgccctggc aggtggccat caaggatgcc 1080
agtggcatca cctgtggagg aatctacatt ggaggctgct ggattctgac agctgcccac 1140
tgcctgagag ccagcaagac ccacagatac cagatctgga ccacagtggt tgactggatt 1200
caccctgacc tgaagagaat tgtgattgag tatgtggaca gaatcatttt ccatgagaac 1260
tacaatgctg gcacctacca gaatgacatt gccctgattg agatgaagaa ggatggcaac 1320
aagaaagact gtgagctgcc cagaagcatc cctgcctgtg tgccctggag cccctacctg 1380
ttccagccca atgacacctg tattgtcagt ggatggggca gagagaagga caatgagaga 1440
gtgttcagcc tgcagtgggg agaggtgaag ctgatcagca actgcagcaa gttctatggc 1500
aacagattct atgagaagga gatggagtgt gctggcacct atgatggcag cattgatgcc 1560
tgcaagggag acagtggagg ccccctggtg tgcatggatg ccaacaatgt gacctatgtg 1620
tggggagtgg ttagctgggg agagaactgt ggcaagcctg agttccctgg agtgtacacc 1680
aaggtggcca actactttga ctggatcagc taccatgtgg gcagaccctt catcagccag 1740
tacaatgtgt aa 1752
<210> 26
<211> 1752
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 26
atgaagctgc tgcatgtgtt cctgctgttc ctgtgtttcc atctgaggtt ctgtaaggtg 60
acctatacat cacaggagga cctggtggag aagaagtgtc tggccaagaa gtatacacat 120
ctgtcatgtg acaaggtgtt ctgtcagcct tggcagaggt gtattgaggg aacatgtgtg 180
tgtaagctgc cttatcagtg tcctaagaat ggaacagctg tgtgtgccac aaataggagg 240
tcattcccta catattgtca gcagaagtca ctggagtgtc tgcatcctgg aacaaagttc 300
ctgaataatg gaacatgtac agctgaggga aagttctcag tgtcactgaa gcatggaaat 360
acagactcag agggaattgt ggaggtgaag ctggtggacc aggacaagac aatgttcatc 420
tgcaagtcat catggtcaat gagggaggcc aatgtggcct gtctggacct gggattccag 480
cagggagctg acacacagag gaggttcaag ctgtcagacc tgtcaatcaa ttcaacagag 540
tgtctgcatg tgcattgtag aggactggag acatcactgg ctgagtgtac attcacaaag 600
aggagaacaa tgggatatca ggactttgct gatgtggttt gttatacaca gaaggctgac 660
tcacctatgg atgacttctt tcaatgtgtg aatggaaagt atatctcaca gatgaaggcc 720
tgtgatggaa tcaatgactg tggagaccag tcagatgagc tgtgttgcaa ggcctgtcag 780
ggaaagggat tccattgcaa gtcaggagtg tgtatccctt cacaatatca gtgtaatgga 840
gaggtggact gtatcacagg agaggatgag gtgggatgtg caggatttgc ctcagtgacc 900
caggaggaga cagagatcct gacagctgac atggatgctg agagaaggag aatcaagtca 960
ctgctgccta agctgtcatg tggagtgaag aataggatgc atatcaggag gaagaggatt 1020
gtgggaggaa agagggccca gctgggagac ctgccttggc aagtggccat caaggatgcc 1080
tcaggaatca catgtggagg aatctatatt ggaggatgtt ggatcctgac agctgcccat 1140
tgtctgaggg cctcaaagac acatagatat cagatctgga caacagtggt ggactggatc 1200
catcctgacc tgaagaggat tgtgattgag tatgtggaca ggatcatctt ccatgagaat 1260
tataatgctg gaacatatca gaatgacatt gccctgattg agatgaagaa ggatggaaat 1320
aagaaggact gtgagctgcc taggtcaatc cctgcctgtg tgccttggtc cccttatctg 1380
ttccaaccta atgacacatg tattgtgtct ggatggggaa gggagaagga caatgagagg 1440
gtgttctcac tgcagtgggg agaggtgaag ctgatctcaa attgttcaaa gttctatgga 1500
aataggttct atgagaagga gatggagtgt gctggaacat atgatggatc aattgatgcc 1560
tgtaagggag actcaggagg acctctagta tgtatggatg ccaataatgt gacatatgtg 1620
tggggagtgg tgtcatgggg agagaattgt ggaaagcctg agttccctgg agtgtataca 1680
aaggtggcca attattttga ctggatctca tatcatgtgg gaaggccttt catctcacag 1740
tataatgtgt aa 1752
<210> 27
<211> 1752
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 27
atgaagctgc tgcatgtgtt cctgctgttt ctgtgcttcc acctgaggtt ttgcaaggtg 60
acctatacct ctcaagagga tctggtggag aagaagtgcc tggctaagaa gtatactcac 120
ctgagctgtg ataaggtgtt ctgccagccc tggcagaggt gcattgaggg cacctgtgtg 180
tgtaagctgc cctatcagtg ccccaagaat ggcactgctg tgtgtgctac taacaggagg 240
agcttcccca cctactgtca gcagaagagc ctggagtgtc tgcatcctgg gaccaagttt 300
ctgaataatg gaacctgcac agctgaggga aagtttagtg tgagcctgaa gcatggaaat 360
acagatagtg agggaattgt ggaggtgaag ctggtggacc aggataagac catgttcatc 420
tgcaagagca gctggagcat gagggaggcc aatgtggcct gcctggacct ggggtttcag 480
caaggtgctg atactcagag gaggtttaag ctgtctgatc tgtctatcaa tagcactgag 540
tgtctgcatg tgcattgtag aggactggag accagcctgg ctgagtgtac ttttactaag 600
aggaggacta tgggatacca ggattttgct gatgtggtgt gttataccca gaaggctgat 660
tctcccatgg atgacttctt tcagtgtgtg aatgggaagt acatctctca gatgaaggcc 720
tgtgatggta tcaatgattg tggagaccag agtgatgagc tgtgttgtaa ggcttgccaa 780
ggcaagggct ttcattgcaa gagtggagtg tgcatcccca gccagtatca gtgcaatgga 840
gaggtggact gcatcacagg ggaggatgag gtgggctgtg ctggctttgc ttctgtgact 900
caagaggaga cagagatcct gactgctgac atggatgctg agaggaggag gatcaagagc 960
ctgctgccta agctgtcttg tggagtgaag aacaggatgc acatcaggag gaagaggatt 1020
gtgggaggaa agagggctca gctgggagac ctgccctggc aggtggctat caaggatgcc 1080
agtggaatca cctgtggggg aatctatatt ggtggctgtt ggatcctgac tgctgctcat 1140
tgtctgaggg ccagcaagac tcatagatac cagatctgga ccacagtggt ggactggatc 1200
caccctgacc tgaagaggat tgtgattgag tatgtggata ggatcatctt ccatgagaac 1260
tacaatgctg gcacttacca gaatgacatt gctctgattg agatgaagaa ggatggaaac 1320
aagaaggatt gtgagctgcc taggagcatc cctgcctgtg tgccctggtc tccttacctg 1380
ttccaaccta atgatacctg cattgtgtct ggctggggaa gggagaagga taatgagagg 1440
gtgtttagcc tgcagtgggg tgaggtgaag ctgatcagca actgctctaa gttttatgga 1500
aataggttct atgagaagga gatggagtgt gctggaacct atgatggtag cattgatgcc 1560
tgcaaggggg actctggagg ccccctggtt tgtatggatg ccaacaatgt gacttatgtg 1620
tggggtgtgg tgagctgggg ggagaactgt ggaaagcctg agttccctgg agtgtacacc 1680
aaggtggcca attattttga ctggatcagc taccatgtgg gaaggccttt tatctctcag 1740
tacaatgtgt aa 1752
<210> 28
<211> 1752
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 28
atgaagctgc tgcatgtttt tctgctgttt ctgtgctttc acctgagatt ttgcaaggtg 60
acctatacaa gccaggagga tctggtggag aagaagtgcc tggcaaagaa gtatacccac 120
ctgagctgtg ataaggtgtt ttgccagccc tggcagagat gcattgaggg cacctgtgtt 180
tgtaagctgc cctatcagtg ccccaagaat ggcacagcag tgtgtgcaac caatagaagg 240
agctttccca catactgtca gcagaagagc ctggaatgtc tgcatcctgg gacaaagttt 300
ctgaataatg gaacatgcac agctgaagga aagtttagtg ttagcctgaa gcatggaaat 360
acagatagtg agggaatagt tgaagtgaag ctggtggacc aggataagac aatgtttata 420
tgcaagagta gctggagcat gagagaagcc aatgtggcct gcctggacct ggggtttcag 480
caaggagctg atacccagag aaggtttaag ctgagtgatc tgagcataaa tagcacagaa 540
tgtctgcatg tgcattgcag aggactggag accagcctgg ctgaatgtac ctttaccaag 600
agaaggacca tgggctacca ggattttgct gatgtggttt gttatacaca gaaggcagat 660
agccccatgg atgacttttt tcaatgtgtg aatgggaagt acattagcca gatgaaggcc 720
tgtgatggca tcaatgattg tggagaccag agtgatgaac tgtgttgtaa ggcatgccag 780
ggcaagggct ttcattgcaa gagtggagtt tgcattccca gccagtatca gtgcaatgga 840
gaggtggact gcattacagg ggaagatgaa gttggctgtg caggctttgc aagtgtgact 900
caggaagaaa cagaaattct gacagctgac atggatgcag aaagaagaag aataaagagc 960
ctgctgccta agctgagctg tggagttaag aatagaatgc acattagaag gaagagaatt 1020
gtgggaggaa agagagcaca gctgggagac ctgccctggc aggtggcaat taaggatgcc 1080
agtggaatca cctgtggggg aatttatatt ggaggctgtt ggattctgac agctgcacat 1140
tgtctgagag ccagcaagac ccatagatac cagatatgga caacagtggt ggactggata 1200
caccctgacc tgaagagaat agtgattgaa tatgtggata gaattatttt tcatgaaaat 1260
tacaatgcag gcacctacca gaatgacatt gctctgattg aaatgaagaa ggatggaaat 1320
aagaaggatt gtgagctgcc tagaagcatc cctgcctgtg tgccctggag cccttacctg 1380
tttcagccta atgatacatg cattgttagt ggctggggaa gagaaaagga taatgaaaga 1440
gtgtttagcc tgcagtgggg agaagttaag ctgataagca attgcagcaa gttttatgga 1500
aatagatttt atgaaaagga aatggaatgt gcaggcacat atgatggcag cattgatgcc 1560
tgcaaggggg acagtggagg ccccctagta tgtatggatg ccaataatgt gacctatgtg 1620
tggggagttg tgagctgggg ggaaaattgt ggaaagcctg agtttcctgg agtttacacc 1680
aaggtggcca attattttga ctggattagc taccatgtgg gaagaccttt tattagccag 1740
tacaatgtgt aa 1752
<210> 29
<211> 1752
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 29
atgaagctgc tgcatgtgtt cctgctgttc ctgtgtttcc acctgaggtt ctgtaaggtg 60
acctatacat ctcaggagga tctggtggag aagaagtgtc tggccaagaa gtatacacac 120
ctctcctgtg ataaggtgtt ctgtcagcca tggcagaggt gtattgaggg aacctgtgtg 180
tgtaagctgc cttatcagtg tccaaagaat ggaacagctg tgtgtgccac aaacaggagg 240
agcttcccaa catactgtca gcagaagtca ctggaatgtc tgcatccagg aacaaagttc 300
ctgaataatg gaacatgtac agctgaagga aagttctcag tgtccctgaa gcatggaaat 360
acagattcag agggaattgt ggaagtgaag ctggtggacc aggataagac aatgttcatc 420
tgtaagagca gctggagcat gagggaagcc aatgtggcct gtctggacct gggattccag 480
cagggagctg atacacagag gaggttcaag ctgtctgatc tctctatcaa ttccacagaa 540
tgtctgcatg tgcattgcag aggtctggag acctcactgg ctgaatgtac attcacaaag 600
aggaggacaa tgggatacca ggattttgct gatgtggtgt gttatacaca gaaggctgat 660
tctccaatgg atgacttctt tcagtgtgtg aatggaaagt acatctctca gatgaaggcc 720
tgtgatggaa tcaatgattg tggagaccag tcagatgaac tgtgctgcaa ggcctgtcag 780
ggaaagggat tccattgcaa gtcaggagtg tgtatcccaa gccagtatca gtgtaatgga 840
gaggtggact gtatcacagg agaagatgaa gtgggatgtg caggatttgc ctctgtgact 900
caggaagaaa cagaaatcct gacagctgac atggatgctg aaaggaggag gatcaagtca 960
ctgctgccta agctgtcttg tggagtgaag aacaggatgc acatcaggag gaagaggatt 1020
gtgggaggaa agagggccca gctgggagac ctcccatggc aggtggccat caaggatgcc 1080
tcaggaatca cctgtggagg aatctatatt ggaggatgtt ggatcctgac agctgcccat 1140
tgtctaagag cctcaaagac acatagatac cagatctgga caacagtggt ggactggatc 1200
caccctgacc tgaagaggat tgtgattgaa tatgtggata ggatcatctt ccatgaaaac 1260
tacaatgctg gaacatacca gaatgacatt gctctgatag aaatgaagaa ggatggaaac 1320
aagaaggatt gtgagctgcc taggtccatc cctgcctgtg tgccctggtc tccttacctg 1380
ttccaaccta atgatacatg tattgtgtct ggatggggaa gggaaaagga taatgaaagg 1440
gtgttctcac tgcagtgggg agaagtgaag ctgatcagca actgttctaa gttctatgga 1500
aataggttct atgaaaagga aatggaatgt gctggaacat atgatggatc cattgatgcc 1560
tgtaagggag actctggagg acccctggtt tgtatggatg ccaacaatgt gacatatgtg 1620
tggggagtgg tgtcatgggg agaaaactgt ggaaagccag agttcccagg agtgtacacc 1680
aaggtggcca attattttga ctggatcagc taccatgtgg gaaggccttt catctctcag 1740
tacaatgtgt aa 1752
<210> 30
<211> 1752
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 30
atgaaactgc tgcatgtgtt tctcctgttc ctgtgctttc atctgaggtt ctgtaaggtg 60
acctatacat cccaagagga tcttgtggaa aagaaatgtc tggccaaaaa gtacacccat 120
ctgtcttgtg acaaggtctt ctgccagcct tggcagagat gtattgaagg aacttgtgtc 180
tgtaaactgc cctaccagtg ccctaagaat ggaacagctg tctgtgctac taatagaagg 240
tcattcccaa cttactgcca gcagaagtct ctggagtgtc tccaccctgg aactaaattc 300
ctgaacaatg gcacatgtac agctgaaggc aagttctctg tctccctcaa acatggaaac 360
acagactcag aagggattgt ggaagtcaag ctggtggatc aggataagac catgtttatt 420
tgcaagtcat cctggtctat gagagaagca aatgtggcct gcctggatct gggctttcaa 480
caaggagcag acactcagag gagattcaag ctctctgacc tgtctattaa tagcactgag 540
tgtctgcatg tgcattgtag aggactggag acctcacttg ctgaatgtac attcactaaa 600
agaaggacta tgggatacca ggactttgct gatgtggtgt gctataccca gaaggcagac 660
tcccccatgg atgacttttt ccaatgtgtt aatgggaaat atattagtca gatgaaggct 720
tgtgatggaa ttaatgactg tggagatcag agtgatgagc tctgttgcaa agcctgtcag 780
ggaaagggtt tccactgcaa aagtggggtt tgtattcctt ctcaatacca atgcaatggg 840
gaggtggact gcattactgg agaggatgag gtggggtgtg ctggctttgc ttctgtgacc 900
caagaggaga cagagatcct gacagctgat atggatgctg aaaggagaag aattaagtca 960
ctgctgccca aactgtcttg tggagttaaa aacagaatgc acatcagaag aaagagaatt 1020
gtgggaggaa aaagagccca gcttggagat ctcccttggc aagtggccat taaggatgcc 1080
agtggtatca catgtggagg catctatatt ggagggtgct ggattctcac agctgcacac 1140
tgtctgagag ccagtaaaac ccatagatat cagatctgga caacagtggt tgattggatt 1200
catcctgatc tcaagagaat tgtgattgag tatgtggaca gaattatttt tcatgaaaac 1260
tacaatgcag gaacctatca gaatgatatt gccctcattg agatgaagaa ggatgggaac 1320
aaaaaggatt gtgagctgcc cagaagcatc ccagcttgtg tgccttggtc tccatacctc 1380
tttcagccaa atgatacttg cattgtcagt ggatggggta gagagaaaga taatgagaga 1440
gtcttctccc tccagtgggg agaggttaag ctcatcagta attgctccaa gttttatgga 1500
aacaggttct atgaaaaaga gatggaatgt gcaggaacat atgatggtag tattgatgct 1560
tgcaaaggag atagtggtgg acccctggtc tgtatggatg ccaacaatgt gacttatgtg 1620
tggggggtgg tgagctgggg agagaattgt gggaagcctg agtttccagg agtctacacc 1680
aaggtggcta attactttga ctggatcagt taccatgtgg gtaggccctt cattagccag 1740
tacaatgtct ga 1752
<210> 31
<211> 1752
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 31
atgaagctgc tgcatgtgtt cctcctgttt ctctgtttcc atctgagatt ctgcaaggtt 60
acctatacat cccaggaaga cctggtggag aaaaagtgtc ttgccaagaa gtacacccac 120
ctcagttgtg ataaggtctt ttgccagcca tggcagagat gtattgaagg cacttgtgtg 180
tgcaagctgc cataccagtg tcccaaaaat gggacagcag tctgtgcaac taatagaaga 240
tccttcccta catactgcca gcagaagagt cttgagtgcc tgcacccagg cacaaagttt 300
ctgaataatg gcacatgcac agctgaaggc aaattcagtg tctccctgaa acatggaaac 360
acagatagtg agggaattgt ggaagttaag ctggtggacc aggataaaac catgttcatt 420
tgtaaatctt catggagtat gagagaagct aatgtggcat gtctggacct tggatttcaa 480
caaggagcag atacccagag aaggtttaag ctgagtgatc tctccattaa ctctactgag 540
tgtctgcatg tgcattgtag aggactggag acatcactgg cagaatgtac ttttaccaaa 600
aggagaacca tgggttatca ggactttgca gatgtggtct gttacaccca gaaggctgac 660
tcccccatgg atgacttctt tcaatgtgtg aatgggaaat acatctccca gatgaaggcc 720
tgtgatggta tcaatgactg tggagaccag tctgatgagc tctgctgcaa ggcctgtcag 780
gggaagggat ttcactgcaa aagtggggtt tgcatcccca gtcagtacca gtgcaatggg 840
gaagtggact gcattacagg ggaagatgag gttggttgtg ctgggtttgc tagtgtgacc 900
caggaggaaa cagagatcct gacagctgat atggatgcag aaagaagaag aattaagagc 960
ctcctgccta agctcagttg tggagtcaaa aataggatgc atattaggag aaagaggatt 1020
gtgggaggga aaagagccca gcttggagac ctgccatggc aggttgccat caaggatgcc 1080
tcagggatca catgtggagg gatctatatt ggtggatgtt ggattctgac tgctgcccat 1140
tgcctgaggg cctcaaagac ccacagatat cagatctgga ccactgtggt ggactggatt 1200
catcctgacc tgaagagaat tgtgattgaa tatgtggaca ggattatctt tcatgagaac 1260
tataatgctg gaacttatca gaatgatatt gcactgattg agatgaagaa ggatgggaat 1320
aaaaaggact gtgaactccc aagaagcatt cctgcatgtg tgccttggtc tccttacctc 1380
ttccaaccca atgacacttg tattgtcagt ggatggggta gagaaaaaga caatgagagg 1440
gttttcagtc tgcagtgggg ggaggtcaag ctcatcagca actgctccaa attctatgga 1500
aacaggttct atgaaaaaga aatggagtgt gctgggactt atgatggtag tattgatgcc 1560
tgtaaagggg attctggagg gccacttgtc tgtatggatg ctaacaatgt gacctatgtc 1620
tggggagtgg tgtcatgggg agaaaattgt ggcaaacctg agtttcctgg agtgtataca 1680
aaggtggcta actattttga ttggatcagt tatcatgttg gtagaccctt catcagtcag 1740
tacaatgtct ag 1752
<210> 32
<211> 1752
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 32
atgaagctgc tccatgtctt cctgctgttc ctgtgcttcc acctgagatt ttgcaaggtg 60
acctacacca gccaggagga cctggtggaa aagaaatgtc ttgctaagaa atatacccac 120
ctgtcctgtg acaaagtctt ctgtcagcct tggcagagat gtattgaagg gacatgtgtc 180
tgtaagctgc cttaccagtg tcctaagaat gggactgcag tctgtgccac taatagaaga 240
tcattcccaa catactgcca gcagaagagt ctggagtgtc tgcatcctgg cacaaagttt 300
ctcaacaatg ggacatgtac agctgaagga aaattctctg tgagcctgaa acatggcaat 360
acagatagtg agggaattgt tgaggttaag ctggtggatc aggacaaaac aatgtttatc 420
tgcaaaagca gctggtccat gagagaggct aatgtggcct gtcttgacct tggctttcaa 480
caaggagcag atacccagag aagatttaaa ctgtcagatc tgagcatcaa ttcaacagag 540
tgtctgcatg tgcattgtag aggactggag accagcctgg ctgaatgtac cttcacaaag 600
agaagaacaa tgggatacca ggactttgct gatgtggttt gttacaccca gaaggcagac 660
agccccatgg atgacttctt tcagtgtgtg aatggaaagt atattagcca gatgaaggca 720
tgtgatggta tcaatgattg tggggaccag agtgatgagc tctgttgtaa ggcttgtcaa 780
ggcaaaggct tccactgcaa gtcaggggtg tgcatcccct cccaatacca gtgcaatgga 840
gaggtggatt gcatcacagg ggaggatgaa gtgggttgtg ctgggtttgc aagtgtgacc 900
caggaggaaa cagaaatcct gactgctgat atggatgctg agaggagaag aatcaaaagc 960
ctcctgccta aactgtcttg tggtgttaag aatagaatgc acattagaag aaagagaatt 1020
gtggggggaa agagagcaca gctgggtgat ctgccctggc aagtggcaat taaggatgcc 1080
tcaggcatca cctgtggagg catttacatt gggggttgct ggattctgac agcagcccac 1140
tgtctcagag ccagcaaaac tcacagatat cagatttgga caacagttgt ggattggatt 1200
caccctgatc tgaagagaat tgtcattgag tatgtggaca gaattatttt ccatgagaac 1260
tacaatgctg gcacatacca gaatgacatt gccctcattg aaatgaagaa ggatggaaat 1320
aaaaaggact gtgaactccc aagatcaatt cctgcctgtg tgccatggag tccttacctc 1380
ttccaaccaa atgatacctg cattgtcagt ggctggggga gagagaagga taatgaaaga 1440
gttttctccc tgcagtgggg agaggtgaag ctcattagta actgttctaa gttttatggg 1500
aacagatttt atgagaagga gatggaatgt gcaggaactt atgatggtag cattgatgca 1560
tgcaaaggag acagtggagg tccacttgtc tgcatggatg ctaacaatgt gacttatgtc 1620
tggggagtgg tctcctgggg tgaaaactgt ggaaagcctg agttcccagg agtgtataca 1680
aaagtggcca actactttga ctggatttca taccatgtgg ggagaccttt tatcagccag 1740
tacaatgtct ga 1752
<210> 33
<211> 1752
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 33
atgaaactgc tgcatgtgtt tctgctcttt ctctgcttcc acctgagatt ttgcaaggtg 60
acctacacct ctcaggaaga cctggtggag aagaagtgtc ttgccaagaa atatacccat 120
ctgtcatgtg ataaagtgtt ctgtcagcct tggcagagat gtattgaggg aacatgtgtg 180
tgcaagctgc cctaccagtg tccaaagaat gggactgctg tttgtgccac taacagaaga 240
tcttttccta catactgtca gcagaagagt ctggagtgcc tccaccctgg cacaaaattc 300
ctcaataatg gcacatgtac agctgaggga aagttttctg ttagcctcaa gcatggcaat 360
actgattcag agggtattgt tgaagtcaaa ctggtggatc aggataaaac catgttcatt 420
tgtaagagta gctggtccat gagggaggct aatgtggcat gcctggacct gggctttcaa 480
caaggggctg acactcagag aaggtttaag ctgagtgacc tgagcattaa ttcaactgag 540
tgtctgcatg tgcattgtag agggctggag actagccttg cagagtgcac attcactaag 600
agaagaacaa tgggatacca ggattttgca gatgtggtgt gctacactca gaaagctgac 660
tctcccatgg atgacttctt ccaatgtgtg aatgggaaat atatttcaca gatgaaggcc 720
tgtgatggaa ttaatgattg tggtgatcag agtgatgagc tctgttgtaa ggcttgccag 780
gggaagggtt ttcactgtaa aagtggggtt tgtatcccct ctcaatacca gtgcaatggg 840
gaagttgatt gcattacagg agaggatgag gtgggatgtg caggctttgc cagtgtgaca 900
caggaagaga cagagatcct gacagctgat atggatgcag aaagaagaag aatcaagtcc 960
ctgctcccca aactgtcctg tggggtcaag aatagaatgc acatcagaag gaagagaatt 1020
gtgggaggca aaagggcaca gctgggggac ctcccatggc aggtggcaat taaggatgcc 1080
agtggtatca catgtggagg gatttacatt ggaggctgct ggattctcac agcagcccac 1140
tgcctcagag catctaaaac tcacagatac cagatttgga ccactgtggt ggactggatt 1200
caccctgacc tgaagagaat tgtgattgaa tatgtggata gaatcatttt ccatgaaaat 1260
tacaatgctg gcacttatca gaatgacatt gcactcattg agatgaagaa agatgggaat 1320
aaaaaggact gtgaactgcc cagaagcatt ccagcttgtg tgccatggag tccatatctg 1380
tttcagccaa atgatacatg catagtgtct ggttggggaa gagagaagga caatgaaagg 1440
gtttttagcc tccagtgggg ggaggtcaag ctgattagca actgcagtaa attctatggc 1500
aacagatttt atgagaagga gatggaatgt gcaggcactt atgatggctc aattgatgcc 1560
tgcaagggag attctggtgg acccctggtg tgcatggatg ccaataatgt cacctatgtc 1620
tggggtgtgg ttagctgggg agagaactgt gggaagcctg agtttccagg agtgtataca 1680
aaagtggcaa attactttga ctggatctcc tatcatgtgg ggagaccctt tatctctcag 1740
tacaatgttt ga 1752
<210> 34
<211> 1752
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 34
atgaaactgc tccatgtttt tctcctcttt ctctgcttcc acctgagatt ttgcaaggtg 60
acctatacct ctcaggagga cctggttgag aaaaagtgcc tggctaaaaa gtacacccac 120
ctctcttgtg ataaggtgtt ctgccagcct tggcagagat gcattgaagg cacatgtgtt 180
tgtaaactgc cttaccagtg tcccaaaaat gggactgctg tgtgtgccac aaatagaagg 240
agctttccaa cctactgtca gcagaagagc cttgaatgcc tccatcctgg gacaaaattc 300
ctgaacaatg gaacctgtac agctgaaggc aaatttagtg ttagcctgaa acatgggaat 360
acagattctg agggaattgt ggaggtcaaa ctggtggacc aggataaaac catgtttatc 420
tgcaagagta gctggtccat gagagaggcc aatgtggcat gcctggatct tgggtttcaa 480
caaggagctg acacccagag aagattcaaa ctcagtgacc tgagtattaa ctcaacagaa 540
tgtctgcatg tgcattgtag aggactggaa actagccttg cagagtgcac ttttaccaag 600
agaagaacca tgggatatca ggattttgct gatgtggtgt gctacaccca gaaagcagac 660
agtcccatgg atgacttctt ccagtgtgtg aatggcaagt atatttccca gatgaaagca 720
tgtgatggca tcaatgattg tggagaccag agtgatgaac tgtgctgtaa ggcttgccag 780
ggaaagggtt tccactgcaa aagtggagtt tgcatcccca gccagtacca gtgcaatgga 840
gaagtggatt gcattacagg agaggatgaa gtgggatgtg ctggctttgc ttctgttacc 900
caagaagaga cagagattct gacagctgac atggatgcag agaggagaag aattaagtcc 960
ctgctgccta aactgtcctg tggtgtcaag aatagaatgc acatcagaag gaagagaatt 1020
gtggggggaa aaagagccca gcttggagac ctgccttggc aagtggctat taaggatgcc 1080
agtgggatca catgtggagg aatttacatt ggagggtgct ggattctcac agctgcccac 1140
tgcctgaggg ccagcaaaac ccacagatac cagatctgga caacagttgt ggattggatt 1200
catcctgatc tcaagagaat tgttattgag tatgtggata ggatcatttt ccatgaaaat 1260
tacaatgcag gcacatacca aaatgacatt gcactcattg agatgaagaa ggatgggaat 1320
aaaaaggatt gtgagctccc caggagcatt cctgcttgtg tcccctggtc cccttacctc 1380
ttccaaccca atgacacctg cattgtcagt ggctggggta gagaaaaaga taatgagaga 1440
gtcttcagcc tgcagtgggg ggaggtgaag ctgattagca attgtagcaa gttttatggg 1500
aacaggttct atgagaagga gatggagtgt gctggcacct atgatggctc tattgatgct 1560
tgtaaggggg acagtggggg accactggtt tgtatggatg caaacaatgt gacctatgtt 1620
tggggagtgg ttagctgggg agaaaattgt ggaaaacctg agtttcctgg tgtctataca 1680
aaagtggcta attattttga ttggatcagt tatcatgttg ggagaccctt tattagtcag 1740
tacaatgtct ag 1752
<210> 35
<211> 1752
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 35
atgaaactcc tgcatgtgtt tctgctgttc ctctgttttc acctgaggtt ttgtaaggtg 60
acctacacta gccaggagga tctggtggag aaaaagtgcc ttgcaaaaaa gtacactcac 120
ctcagctgtg acaaggtctt ctgtcagcct tggcagagat gcattgaggg gacatgtgtg 180
tgcaaactcc cataccagtg tcctaagaat ggtacagctg tctgtgcaac aaacaggaga 240
tcctttccca cctattgtca gcagaagtcc ctggagtgtc tgcaccctgg tacaaagttt 300
ctgaataatg gcacatgcac tgctgaggga aagttcagtg tgtccctgaa acatggaaac 360
actgattcag agggtattgt ggaggtgaaa cttgtggatc aggacaagac catgttcatc 420
tgcaagtcca gttggagcat gagagaggct aatgtggcct gtctggacct gggttttcag 480
caaggagctg acactcagag aaggttcaag ctgtcagatc tcagtatcaa ctccacagaa 540
tgtctgcatg tgcattgcag agggctggag actagccttg ctgaatgtac ttttacaaag 600
agaagaacta tgggatacca ggattttgca gatgtggtct gttatactca gaaggctgat 660
tcacccatgg atgacttctt ccagtgtgtg aatggcaagt acatttcaca aatgaaagca 720
tgtgatggta tcaatgattg tggagaccag agtgatgaac tctgttgcaa ggcatgccag 780
ggcaagggat tccactgcaa gagtggtgtc tgtattccca gtcagtatca gtgcaatggg 840
gaggtggact gcatcactgg ggaagatgaa gtgggctgtg ctggttttgc tagtgtgaca 900
caggaggaaa ctgaaattct cacagcagat atggatgctg agagaaggag aatcaagtcc 960
ctcctcccta aactgagttg tggagtgaaa aacagaatgc atattagaag aaaaagaatt 1020
gtgggaggca agagagctca gcttggggac ctcccatggc aagtggctat taaggatgca 1080
agtgggatta catgtggagg gatctatatt ggggggtgct ggattctgac agcagcccac 1140
tgtctgagag cctctaaaac ccatagatat cagatctgga caacagtggt ggattggatt 1200
cacccagacc tcaagaggat tgtgattgag tatgtggata gaattatttt tcatgagaac 1260
tacaatgctg gaacctatca gaatgatatt gctctgattg aaatgaaaaa ggatgggaac 1320
aaaaaggact gtgaactgcc aagatcaatc cctgcatgtg tgccatggag tccctatctc 1380
tttcagccca atgatacatg cattgttagt ggatggggga gggagaaaga caatgagaga 1440
gtgttcagtc tccagtgggg tgaagtgaag ctcatttcta attgtagcaa gttttatggg 1500
aatagattct atgaaaaaga aatggagtgt gcaggaactt atgatggttc cattgatgcc 1560
tgcaagggag atagtggtgg gcccctggtg tgcatggatg ctaataatgt gacctatgtc 1620
tggggagtgg tttcatgggg agagaattgt ggaaagcctg agttccctgg agtgtacacc 1680
aaggtggcca attactttga ttggatcagc tatcatgtgg gaagaccatt tatttcccag 1740
tacaatgtct aa 1752
<210> 36
<211> 1752
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 36
atgaagctcc tgcatgtgtt tctgctcttc ctctgctttc acctgagatt ctgtaaggtg 60
acctatacaa gccaggaaga tcttgtggag aaaaagtgcc ttgctaagaa gtacactcac 120
ctcagctgtg acaaagtctt ttgccagcct tggcagagat gtattgaggg aacttgtgtc 180
tgtaagctcc catatcagtg tcccaagaat ggaacagctg tgtgtgctac taacagaagg 240
agctttccca cctactgcca gcagaagagc cttgaatgtc tccacccagg gaccaagttt 300
ctgaacaatg gcacatgtac agctgagggg aaattcagtg tcagtctcaa acatgggaat 360
actgatagtg agggcattgt tgaggtgaaa cttgtggacc aggataagac catgtttatc 420
tgcaagtcaa gctggtcaat gagagaagct aatgtggctt gtctggacct tgggtttcaa 480
caaggagctg acactcagag aagatttaag ctgagtgatc tgagtatcaa cagcactgaa 540
tgtctgcatg tgcattgcag agggctggag actagccttg ctgagtgcac ttttaccaag 600
agaagaacaa tgggatacca ggattttgct gatgtggtct gttatactca gaaggcagat 660
tcaccaatgg atgacttctt tcagtgtgtg aatggaaaat acatttccca gatgaaggct 720
tgtgatggta tcaatgactg tggggaccag agtgatgagc tctgttgtaa ggcatgtcag 780
ggcaaaggat ttcactgcaa gtctggggtc tgtatcccca gccagtatca gtgtaatgga 840
gaggttgatt gtatcacagg ggaggatgaa gtgggttgtg ctggctttgc atcagtgaca 900
caggaagaga cagaaattct gacagcagat atggatgctg aaagaaggag aattaaaagc 960
ctcctgccaa aactgagctg tggtgtcaag aatagaatgc acatcagaag gaagagaatt 1020
gttggtggaa agagggccca gcttggggac ctgccatggc aggttgcaat caaagatgca 1080
agtggcatta cctgtggagg aatttacatt ggagggtgtt ggattctgac agcagctcat 1140
tgtctaagag cctccaaaac ccacagatac cagatctgga ccactgtggt ggattggatt 1200
caccctgacc tgaaaagaat tgtcattgag tatgtggaca ggattatttt ccatgagaat 1260
tataatgctg gcacctacca gaatgacatt gccctgattg agatgaagaa agatggaaat 1320
aagaaggact gtgagctccc aagatcaatt cctgcttgtg tgccttggtc tccatacctg 1380
tttcagccca atgatacttg tattgtttct ggatggggca gggaaaaaga caatgagaga 1440
gtgttcagcc tgcagtgggg ggaggtgaag ctgatctcaa actgcagcaa gttctatgga 1500
aatagatttt atgagaagga aatggagtgt gcaggcactt atgatggatc aattgatgcc 1560
tgcaagggtg acagtggtgg cccacttgtg tgcatggatg ctaacaatgt gacctatgtt 1620
tggggtgtgg tgtcatgggg ggaaaactgt ggcaaacctg agtttcctgg tgtttacact 1680
aaggttgcaa actactttga ctggatcagc tatcatgtgg gcagaccttt tatttcccag 1740
tataatgtct aa 1752
<210> 37
<211> 1752
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 37
atgaaactcc tgcatgtgtt tctcctgttc ctctgctttc acctgagatt ttgtaaggtg 60
acctatacca gccaggagga ccttgttgag aagaaatgcc tggctaagaa atacacccac 120
ctgtcctgtg acaaggtgtt ctgtcagcct tggcagaggt gcattgaagg gacctgtgtg 180
tgtaaactcc cctaccagtg ccctaagaat ggcactgcag tgtgtgctac aaacagaaga 240
tcattcccaa cctattgcca gcagaaatca ctggaatgcc tgcatcctgg tacaaaattc 300
ctgaacaatg ggacttgtac tgctgagggg aaattcagtg tgtccctgaa acatgggaac 360
acagattctg agggtattgt tgaggtgaag ctggtggatc aggataagac tatgtttatc 420
tgcaagtcaa gctggtccat gagggaagcc aatgtggcat gcctggatct gggttttcaa 480
caaggagctg atacccagag aagatttaag ctgagtgacc tcagcattaa ctctactgag 540
tgtctgcatg tgcactgtag agggcttgaa acaagcctgg cagagtgcac cttcaccaag 600
agaaggacaa tgggatacca ggactttgct gatgtggtct gctacaccca gaaggctgat 660
tcccccatgg atgatttctt tcaatgtgtg aatgggaagt acatcagcca gatgaaagca 720
tgtgatggga tcaatgactg tggagaccag agtgatgagc tgtgctgcaa agcttgccag 780
gggaaaggct ttcattgcaa gagtggggtc tgtattccct cccaatacca gtgcaatggg 840
gaggtggatt gcatcacagg agaagatgaa gtgggctgtg ctggatttgc ctcagtgact 900
caggaagaga cagaaattct cacagctgat atggatgcag agagaaggag gatcaagtcc 960
ctcctgccta aactgagttg tggagtgaag aacaggatgc atattagaag gaagagaatt 1020
gtggggggta aaagagccca gcttggggac ctgccttggc aagtggctat caaagatgcc 1080
agtggtatta cctgtggtgg gatctatatt ggtggttgct ggattctcac tgctgcacac 1140
tgtctgagag ccagcaaaac ccacagatat cagatttgga ctacagtggt tgactggatt 1200
caccctgacc tgaagagaat tgttattgag tatgtggata gaatcatctt ccatgagaat 1260
tacaatgctg ggacttatca gaatgatatt gccctcattg aaatgaagaa ggatgggaac 1320
aaaaaggatt gtgagctgcc cagaagcatt ccagcctgtg tgccatggag cccctatctg 1380
tttcagccaa atgacacttg tattgtttct ggttggggca gggaaaaaga caatgaaaga 1440
gtctttagcc tccagtgggg agaagttaag ctgatttcaa attgcagcaa attctatggg 1500
aacaggttct atgagaagga gatggagtgt gctgggacat atgatggttc aattgatgct 1560
tgcaaaggag atagtggtgg gccactggtc tgcatggatg ccaataatgt gacatatgtc 1620
tggggggtgg tttcctgggg agagaattgt gggaagccag agtttcctgg tgtctataca 1680
aaagtggcta actattttga ctggatcagc tatcatgtgg ggagaccttt catcagtcag 1740
tataatgtgt ag 1752
<210> 38
<211> 1752
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 38
atgaagctgc tgcatgtgtt tctgctcttt ctgtgcttcc acctgagatt ttgcaaggtg 60
acctacacct ctcaggagga tctggtggag aaaaagtgcc tggcaaaaaa gtatactcac 120
ctcagttgtg acaaggtctt ctgccagcca tggcagagat gtattgaggg aacctgtgtg 180
tgcaaactcc cttatcagtg tcccaagaat gggactgcag tctgtgcaac caacagaaga 240
agctttccca catactgtca gcagaaatcc cttgagtgcc tgcaccctgg aaccaaattc 300
ctgaataatg gaacttgcac agcagagggg aaattcagtg tcagcctgaa acatggcaac 360
actgatagtg aggggattgt tgaagtgaag ctggtggatc aggataagac tatgtttatc 420
tgcaaaagtt catggagcat gagagaagca aatgtggcat gccttgatct gggtttccaa 480
caaggagctg acactcagag aagatttaaa ctcagtgatc tgtcaatcaa cagcacagag 540
tgcctgcatg tgcactgtag aggacttgag acatcacttg cagaatgcac atttaccaaa 600
agaagaacca tgggatacca ggattttgca gatgtggtgt gctatactca gaaagctgat 660
agccccatgg atgacttctt ccagtgtgtc aatgggaagt atatcagcca gatgaaggcc 720
tgtgatggaa tcaatgactg tggagatcag agtgatgaac tctgttgtaa ggcatgtcag 780
gggaagggtt tccattgcaa gagtggagtc tgcattcctt cacaatacca gtgcaatgga 840
gaggtggatt gtattactgg ggaggatgaa gtgggttgtg caggatttgc cagtgtgact 900
caggaggaaa ctgagattct gacagctgac atggatgctg agagaagaag gatcaagagc 960
ctgctcccaa agctgtcatg tggggtcaaa aatagaatgc acatcagaag gaagagaatt 1020
gtgggaggga aaagagctca gctgggagac ctcccttggc aagtggcaat caaggatgct 1080
agtggtatca catgtggagg aatctacatt ggggggtgtt ggattctgac tgcagcccat 1140
tgcctgaggg catccaaaac ccacagatat cagatctgga caacagttgt ggactggatt 1200
caccctgacc tcaaaagaat tgtcattgag tatgtggaca gaatcatttt ccatgagaat 1260
tacaatgctg gcacttacca gaatgacatt gccctgattg aaatgaagaa ggatggaaac 1320
aagaaggatt gtgaactccc caggtcaatc ccagcctgtg tgccctggag cccctacctg 1380
ttccagccaa atgatacatg tattgtcagt ggatggggga gagagaagga caatgagaga 1440
gtgttttcac tgcagtgggg ggaagtgaag ctgatcagca attgctccaa gttctatgga 1500
aacaggtttt atgagaagga gatggagtgt gctgggactt atgatggaag tattgatgct 1560
tgtaaagggg attcaggagg tcctcttgtc tgcatggatg ctaacaatgt gacatatgtg 1620
tggggagtag tcagttgggg agaaaactgt ggaaaaccag aatttcctgg ggtgtatact 1680
aaagtggcaa attattttga ctggatcagc tatcatgtgg gtagaccctt cattagtcag 1740
tataatgtgt ga 1752
<210> 39
<211> 1752
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 39
atgaagctcc tgcatgtctt tctgctgttt ctctgcttcc atctgagatt ttgcaaggtg 60
acctacacct ctcaggaaga ccttgttgaa aagaagtgtc tggccaaaaa gtatactcat 120
ctgtcttgtg acaaagtctt ctgtcagccc tggcagagat gcattgaggg aacatgtgtc 180
tgcaagctcc cttatcagtg tcccaaaaat ggcacagcag tttgtgccac aaatagaagg 240
tcttttccta catactgcca gcagaagagc cttgaatgtc tccacccagg cacaaagttt 300
ctgaataatg ggacttgcac agcagaaggc aaatttagtg tgtccctgaa acatggaaac 360
actgatagtg agggcattgt ggaggttaag cttgtggatc aggataaaac aatgttcatc 420
tgcaagagct catggtccat gagagaggct aatgtggctt gtctggacct gggttttcaa 480
caaggagctg atactcagag aaggtttaag ctcagtgacc tgagcatcaa cagtacagag 540
tgtctgcatg tgcattgtag aggactggaa acttctctgg ctgagtgtac ctttacaaag 600
agaagaacaa tgggatacca ggattttgct gatgtggtct gctacaccca gaaagctgac 660
tcccccatgg atgatttctt tcaatgtgtt aatgggaaat acattagcca gatgaaggct 720
tgtgatggta tcaatgactg tggagaccag tctgatgaac tgtgctgtaa agcctgtcaa 780
gggaaaggat tccactgcaa gagtggagtg tgcattccat cccagtacca gtgtaatgga 840
gaagttgatt gcattacagg ggaagatgaa gtgggttgtg cagggtttgc ttcagtaact 900
caggaggaga cagaaatcct gacagctgac atggatgctg aaaggagaag gatcaaaagc 960
ctgctgccca agctctcatg tggggtgaaa aacaggatgc atattagaag gaagaggatt 1020
gtgggaggga aaagagccca gctgggggac ctgccatggc aggttgccat taaagatgct 1080
tcagggatca catgtggggg catctatatt ggaggctgtt ggattctcac agcagcacac 1140
tgcctgagag cttcaaagac tcacagatat cagatttgga caacagtggt ggattggatt 1200
caccctgatc tcaaaagaat tgtcattgaa tatgttgaca gaatcatctt tcatgaaaac 1260
tacaatgctg gaacttatca gaatgatatt gctctgattg aaatgaagaa agatggaaac 1320
aaaaaggact gtgaactgcc cagaagcatc cctgcttgtg ttccatggtc cccttacctg 1380
tttcagccta atgacacctg cattgttagt ggctggggga gagagaagga caatgagaga 1440
gtgttttccc tgcagtgggg agaggtgaaa ctcatctcta actgttcaaa attctatggg 1500
aatagatttt atgagaagga gatggaatgt gctgggacct atgatgggtc aattgatgct 1560
tgtaagggtg acagtggagg acccctggtg tgcatggatg ccaacaatgt gacatatgtc 1620
tggggggtgg ttagctgggg agaaaattgt gggaagcctg agttccctgg ggtgtacacc 1680
aaggttgcaa actattttga ttggatttct tatcatgtgg gtagaccatt tatcagtcag 1740
tataatgtgt ag 1752
<210> 40
<211> 1752
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 40
atgaaacttc ttcatgtgtt cctgctgttt ctgtgcttcc acctgaggtt ttgcaaggtg 60
acctatactt ctcaagagga tctggtggag aaaaaatgcc tggctaaaaa atatactcac 120
ctgtcctgtg ataaagtctt ctgccagcca tggcagagat gcattgaggg aacttgtgtg 180
tgcaaactgc catatcagtg cccaaaaaat ggaactgctg tgtgtgctac taacaggaga 240
agcttcccaa cttattgcca gcagaaaagt ctggaatgcc ttcatccagg aactaaattt 300
ctgaataatg gaacttgcac tgctgaagga aaatttagtg tgtccctgaa acatggaaat 360
actgattcag agggaattgt ggaagtgaaa cttgtggatc aggataaaac tatgttcatt 420
tgcaaaagca gctggagcat gagggaagct aatgtggctt gccttgatct tggatttcaa 480
caaggagctg atactcagag aaggtttaaa ctgtctgatc tgtctattaa ttccactgaa 540
tgcctgcatg tgcattgcag aggactggag actagtctgg ctgaatgcac ttttactaaa 600
agaagaacta tgggatatca ggattttgct gatgtggtgt gctatactca gaaagctgat 660
tctccaatgg atgatttctt tcaatgtgtg aatggaaaat atatttctca gatgaaagct 720
tgtgatggaa tcaatgattg tggagatcag agtgatgaac tgtgctgcaa agcttgccag 780
ggaaaaggat ttcattgcaa atctggagtg tgcattccaa gccagtatca gtgcaatgga 840
gaggtggatt gcattactgg agaagatgaa gtgggatgtg ctggatttgc ttctgtgact 900
caagaagaaa ctgaaattct gactgctgat atggatgctg aaagaagaag aattaaatca 960
ctgctgccta aactgtcttg tggagtgaaa aacagaatgc acattagaag gaaaagaatt 1020
gtgggaggaa aaagagctca gctgggagat ctgccatggc aggtggctat taaagatgct 1080
agtggaatca cttgtggagg aatttatatt ggaggatgct ggattctgac tgctgctcat 1140
tgcctgagag ctagtaaaac tcatagatat cagatttgga ctactgtggt ggattggatt 1200
cacccagatc ttaaaagaat tgtgattgaa tatgtggata gaattatttt ccatgaaaac 1260
tataatgctg gaacttatca gaatgatatt gctctgattg aaatgaaaaa agatggaaac 1320
aaaaaagatt gtgagctgcc tagatccatc cctgcttgtg tcccatggtc tccttatctg 1380
ttccaaccta atgatacttg cattgtgtct ggatggggaa gagaaaaaga taatgaaaga 1440
gtcttttcac ttcaatgggg agaagtgaaa ctgattagca actgctctaa attttatgga 1500
aatagattct atgaaaaaga aatggaatgt gctggaactt atgatggatc cattgatgct 1560
tgcaaaggag attctggagg accactggtc tgcatggatg ctaacaatgt gacttatgtc 1620
tggggagtgg tcagttgggg agaaaactgt ggaaaaccag agttcccagg agtgtatact 1680
aaagtggcta attattttga ttggattagc tatcatgtgg gaaggccttt tatttctcag 1740
tataatgtgt aa 1752
<210> 41
<211> 1752
<212> DNA
<213> 智人
<400> 41
atgaagcttc ttcatgtttt cctgttattt ctgtgcttcc acttaaggtt ttgcaaggtc 60
acttatacat ctcaagagga tctggtggag aaaaagtgct tagcaaaaaa atatactcac 120
ctctcctgcg ataaagtctt ctgccagcca tggcagagat gcattgaggg cacctgtgtt 180
tgtaaactac cgtatcagtg cccaaagaat ggcactgcag tgtgtgcaac taacaggaga 240
agcttcccaa catactgtca acaaaagagt ttggaatgtc ttcatccagg gacaaagttt 300
ttaaataacg gaacatgcac agccgaagga aagtttagtg tttccttgaa gcatggaaat 360
acagattcag agggaatagt tgaagtaaaa cttgtggacc aagataagac aatgttcata 420
tgcaaaagca gctggagcat gagggaagcc aacgtggcct gccttgacct tgggtttcaa 480
caaggtgctg atactcaaag aaggtttaag ttgtctgatc tctctataaa ttccactgaa 540
tgtctacatg tgcattgccg aggattagag accagtttgg ctgaatgtac ttttactaag 600
agaagaacta tgggttacca ggatttcgct gatgtggttt gttatacaca gaaagcagat 660
tctccaatgg atgacttctt tcagtgtgtg aatgggaaat acatttctca gatgaaagcc 720
tgtgatggta tcaatgattg tggagaccaa agtgatgaac tgtgttgtaa agcatgccaa 780
ggcaaaggct tccattgcaa atcgggtgtt tgcattccaa gccagtatca atgcaatggt 840
gaggtggact gcattacagg ggaagatgaa gttggctgtg caggctttgc atctgtgact 900
caagaagaaa cagaaatttt gactgctgac atggatgcag aaagaagacg gataaaatca 960
ttattaccta aactatcttg tggagttaaa aacagaatgc acattcgaag gaaacgaatt 1020
gtgggaggaa agcgagcaca actgggagac ctcccatggc aggtggcaat taaggatgcc 1080
agtggaatca cctgtggggg aatttatatt ggtggctgtt ggattctgac tgctgcacat 1140
tgtctcagag ccagtaaaac tcatcgttac caaatatgga caacagtagt agactggata 1200
caccccgacc ttaaacgtat agtaattgaa tacgtggata gaattatttt ccatgaaaac 1260
tacaatgcag gcacttacca aaatgacatc gctttgattg aaatgaaaaa agacggaaac 1320
aaaaaagatt gtgagctgcc tcgttccatc cctgcctgtg tcccctggtc tccttaccta 1380
ttccaaccta atgatacatg catcgtttct ggctggggac gagaaaaaga taacgaaaga 1440
gtcttttcac ttcagtgggg tgaagttaaa ctaataagca actgctctaa gttttacgga 1500
aatcgtttct atgaaaaaga aatggaatgt gcaggtacat atgatggttc catcgatgcc 1560
tgtaaagggg actctggagg ccccttagtc tgtatggatg ccaacaatgt gacttatgtc 1620
tggggtgttg tgagttgggg ggaaaactgt ggaaaaccag agttcccagg tgtttacacc 1680
aaagtggcca attattttga ctggattagc taccatgtag gaaggccttt tatttctcag 1740
tacaatgtat aa 1752
<210> 42
<211> 1698
<212> DNA
<213> 智人
<400> 42
aaggtcactt atacatctca agaggatctg gtggagaaaa agtgcttagc aaaaaaatat 60
actcacctct cctgcgataa agtcttctgc cagccatggc agagatgcat tgagggcacc 120
tgtgtttgta aactaccgta tcagtgccca aagaatggca ctgcagtgtg tgcaactaac 180
aggagaagct tcccaacata ctgtcaacaa aagagtttgg aatgtcttca tccagggaca 240
aagtttttaa ataacggaac atgcacagcc gaaggaaagt ttagtgtttc cttgaagcat 300
ggaaatacag attcagaggg aatagttgaa gtaaaacttg tggaccaaga taagacaatg 360
ttcatatgca aaagcagctg gagcatgagg gaagccaacg tggcctgcct tgaccttggg 420
tttcaacaag gtgctgatac tcaaagaagg tttaagttgt ctgatctctc tataaattcc 480
actgaatgtc tacatgtgca ttgccgagga ttagagacca gtttggctga atgtactttt 540
actaagagaa gaactatggg ttaccaggat ttcgctgatg tggtttgtta tacacagaaa 600
gcagattctc caatggatga cttctttcag tgtgtgaatg ggaaatacat ttctcagatg 660
aaagcctgtg atggtatcaa tgattgtgga gaccaaagtg atgaactgtg ttgtaaagca 720
tgccaaggca aaggcttcca ttgcaaatcg ggtgtttgca ttccaagcca gtatcaatgc 780
aatggtgagg tggactgcat tacaggggaa gatgaagttg gctgtgcagg ctttgcatct 840
gtgactcaag aagaaacaga aattttgact gctgacatgg atgcagaaag aagacggata 900
aaatcattat tacctaaact atcttgtgga gttaaaaaca gaatgcacat tcgaaggaaa 960
cgaattgtgg gaggaaagcg agcacaactg ggagacctcc catggcaggt ggcaattaag 1020
gatgccagtg gaatcacctg tgggggaatt tatattggtg gctgttggat tctgactgct 1080
gcacattgtc tcagagccag taaaactcat cgttaccaaa tatggacaac agtagtagac 1140
tggatacacc ccgaccttaa acgtatagta attgaatacg tggatagaat tattttccat 1200
gaaaactaca atgcaggcac ttaccaaaat gacatcgctt tgattgaaat gaaaaaagac 1260
ggaaacaaaa aagattgtga gctgcctcgt tccatccctg cctgtgtccc ctggtctcct 1320
tacctattcc aacctaatga tacatgcatc gtttctggct ggggacgaga aaaagataac 1380
gaaagagtct tttcacttca gtggggtgaa gttaaactaa taagcaactg ctctaagttt 1440
tacggaaatc gtttctatga aaaagaaatg gaatgtgcag gtacatatga tggttccatc 1500
gatgcctgta aaggggactc tggaggcccc ttagtctgta tggatgccaa caatgtgact 1560
tatgtctggg gtgttgtgag ttggggggaa aactgtggaa aaccagagtt cccaggtgtt 1620
tacaccaaag tggccaatta ttttgactgg attagctacc atgtaggaag gccttttatt 1680
tctcagtaca atgtataa 1698
<210> 43
<211> 583
<212> PRT
<213> 智人
<400> 43
Met Lys Leu Leu His Val Phe Leu Leu Phe Leu Cys Phe His Leu Arg
1 5 10 15
Phe Cys Lys Val Thr Tyr Thr Ser Gln Glu Asp Leu Val Glu Lys Lys
20 25 30
Cys Leu Ala Lys Lys Tyr Thr His Leu Ser Cys Asp Lys Val Phe Cys
35 40 45
Gln Pro Trp Gln Arg Cys Ile Glu Gly Thr Cys Val Cys Lys Leu Pro
50 55 60
Tyr Gln Cys Pro Lys Asn Gly Thr Ala Val Cys Ala Thr Asn Arg Arg
65 70 75 80
Ser Phe Pro Thr Tyr Cys Gln Gln Lys Ser Leu Glu Cys Leu His Pro
85 90 95
Gly Thr Lys Phe Leu Asn Asn Gly Thr Cys Thr Ala Glu Gly Lys Phe
100 105 110
Ser Val Ser Leu Lys His Gly Asn Thr Asp Ser Glu Gly Ile Val Glu
115 120 125
Val Lys Leu Val Asp Gln Asp Lys Thr Met Phe Ile Cys Lys Ser Ser
130 135 140
Trp Ser Met Arg Glu Ala Asn Val Ala Cys Leu Asp Leu Gly Phe Gln
145 150 155 160
Gln Gly Ala Asp Thr Gln Arg Arg Phe Lys Leu Ser Asp Leu Ser Ile
165 170 175
Asn Ser Thr Glu Cys Leu His Val His Cys Arg Gly Leu Glu Thr Ser
180 185 190
Leu Ala Glu Cys Thr Phe Thr Lys Arg Arg Thr Met Gly Tyr Gln Asp
195 200 205
Phe Ala Asp Val Val Cys Tyr Thr Gln Lys Ala Asp Ser Pro Met Asp
210 215 220
Asp Phe Phe Gln Cys Val Asn Gly Lys Tyr Ile Ser Gln Met Lys Ala
225 230 235 240
Cys Asp Gly Ile Asn Asp Cys Gly Asp Gln Ser Asp Glu Leu Cys Cys
245 250 255
Lys Ala Cys Gln Gly Lys Gly Phe His Cys Lys Ser Gly Val Cys Ile
260 265 270
Pro Ser Gln Tyr Gln Cys Asn Gly Glu Val Asp Cys Ile Thr Gly Glu
275 280 285
Asp Glu Val Gly Cys Ala Gly Phe Ala Ser Val Thr Gln Glu Glu Thr
290 295 300
Glu Ile Leu Thr Ala Asp Met Asp Ala Glu Arg Arg Arg Ile Lys Ser
305 310 315 320
Leu Leu Pro Lys Leu Ser Cys Gly Val Lys Asn Arg Met His Ile Arg
325 330 335
Arg Lys Arg Ile Val Gly Gly Lys Arg Ala Gln Leu Gly Asp Leu Pro
340 345 350
Trp Gln Val Ala Ile Lys Asp Ala Ser Gly Ile Thr Cys Gly Gly Ile
355 360 365
Tyr Ile Gly Gly Cys Trp Ile Leu Thr Ala Ala His Cys Leu Arg Ala
370 375 380
Ser Lys Thr His Arg Tyr Gln Ile Trp Thr Thr Val Val Asp Trp Ile
385 390 395 400
His Pro Asp Leu Lys Arg Ile Val Ile Glu Tyr Val Asp Arg Ile Ile
405 410 415
Phe His Glu Asn Tyr Asn Ala Gly Thr Tyr Gln Asn Asp Ile Ala Leu
420 425 430
Ile Glu Met Lys Lys Asp Gly Asn Lys Lys Asp Cys Glu Leu Pro Arg
435 440 445
Ser Ile Pro Ala Cys Val Pro Trp Ser Pro Tyr Leu Phe Gln Pro Asn
450 455 460
Asp Thr Cys Ile Val Ser Gly Trp Gly Arg Glu Lys Asp Asn Glu Arg
465 470 475 480
Val Phe Ser Leu Gln Trp Gly Glu Val Lys Leu Ile Ser Asn Cys Ser
485 490 495
Lys Phe Tyr Gly Asn Arg Phe Tyr Glu Lys Glu Met Glu Cys Ala Gly
500 505 510
Thr Tyr Asp Gly Ser Ile Asp Ala Cys Lys Gly Asp Ser Gly Gly Pro
515 520 525
Leu Val Cys Met Asp Ala Asn Asn Val Thr Tyr Val Trp Gly Val Val
530 535 540
Ser Trp Gly Glu Asn Cys Gly Lys Pro Glu Phe Pro Gly Val Tyr Thr
545 550 555 560
Lys Val Ala Asn Tyr Phe Asp Trp Ile Ser Tyr His Val Gly Arg Pro
565 570 575
Phe Ile Ser Gln Tyr Asn Val
580
<210> 44
<211> 565
<212> PRT
<213> 智人
<400> 44
Lys Val Thr Tyr Thr Ser Gln Glu Asp Leu Val Glu Lys Lys Cys Leu
1 5 10 15
Ala Lys Lys Tyr Thr His Leu Ser Cys Asp Lys Val Phe Cys Gln Pro
20 25 30
Trp Gln Arg Cys Ile Glu Gly Thr Cys Val Cys Lys Leu Pro Tyr Gln
35 40 45
Cys Pro Lys Asn Gly Thr Ala Val Cys Ala Thr Asn Arg Arg Ser Phe
50 55 60
Pro Thr Tyr Cys Gln Gln Lys Ser Leu Glu Cys Leu His Pro Gly Thr
65 70 75 80
Lys Phe Leu Asn Asn Gly Thr Cys Thr Ala Glu Gly Lys Phe Ser Val
85 90 95
Ser Leu Lys His Gly Asn Thr Asp Ser Glu Gly Ile Val Glu Val Lys
100 105 110
Leu Val Asp Gln Asp Lys Thr Met Phe Ile Cys Lys Ser Ser Trp Ser
115 120 125
Met Arg Glu Ala Asn Val Ala Cys Leu Asp Leu Gly Phe Gln Gln Gly
130 135 140
Ala Asp Thr Gln Arg Arg Phe Lys Leu Ser Asp Leu Ser Ile Asn Ser
145 150 155 160
Thr Glu Cys Leu His Val His Cys Arg Gly Leu Glu Thr Ser Leu Ala
165 170 175
Glu Cys Thr Phe Thr Lys Arg Arg Thr Met Gly Tyr Gln Asp Phe Ala
180 185 190
Asp Val Val Cys Tyr Thr Gln Lys Ala Asp Ser Pro Met Asp Asp Phe
195 200 205
Phe Gln Cys Val Asn Gly Lys Tyr Ile Ser Gln Met Lys Ala Cys Asp
210 215 220
Gly Ile Asn Asp Cys Gly Asp Gln Ser Asp Glu Leu Cys Cys Lys Ala
225 230 235 240
Cys Gln Gly Lys Gly Phe His Cys Lys Ser Gly Val Cys Ile Pro Ser
245 250 255
Gln Tyr Gln Cys Asn Gly Glu Val Asp Cys Ile Thr Gly Glu Asp Glu
260 265 270
Val Gly Cys Ala Gly Phe Ala Ser Val Thr Gln Glu Glu Thr Glu Ile
275 280 285
Leu Thr Ala Asp Met Asp Ala Glu Arg Arg Arg Ile Lys Ser Leu Leu
290 295 300
Pro Lys Leu Ser Cys Gly Val Lys Asn Arg Met His Ile Arg Arg Lys
305 310 315 320
Arg Ile Val Gly Gly Lys Arg Ala Gln Leu Gly Asp Leu Pro Trp Gln
325 330 335
Val Ala Ile Lys Asp Ala Ser Gly Ile Thr Cys Gly Gly Ile Tyr Ile
340 345 350
Gly Gly Cys Trp Ile Leu Thr Ala Ala His Cys Leu Arg Ala Ser Lys
355 360 365
Thr His Arg Tyr Gln Ile Trp Thr Thr Val Val Asp Trp Ile His Pro
370 375 380
Asp Leu Lys Arg Ile Val Ile Glu Tyr Val Asp Arg Ile Ile Phe His
385 390 395 400
Glu Asn Tyr Asn Ala Gly Thr Tyr Gln Asn Asp Ile Ala Leu Ile Glu
405 410 415
Met Lys Lys Asp Gly Asn Lys Lys Asp Cys Glu Leu Pro Arg Ser Ile
420 425 430
Pro Ala Cys Val Pro Trp Ser Pro Tyr Leu Phe Gln Pro Asn Asp Thr
435 440 445
Cys Ile Val Ser Gly Trp Gly Arg Glu Lys Asp Asn Glu Arg Val Phe
450 455 460
Ser Leu Gln Trp Gly Glu Val Lys Leu Ile Ser Asn Cys Ser Lys Phe
465 470 475 480
Tyr Gly Asn Arg Phe Tyr Glu Lys Glu Met Glu Cys Ala Gly Thr Tyr
485 490 495
Asp Gly Ser Ile Asp Ala Cys Lys Gly Asp Ser Gly Gly Pro Leu Val
500 505 510
Cys Met Asp Ala Asn Asn Val Thr Tyr Val Trp Gly Val Val Ser Trp
515 520 525
Gly Glu Asn Cys Gly Lys Pro Glu Phe Pro Gly Val Tyr Thr Lys Val
530 535 540
Ala Asn Tyr Phe Asp Trp Ile Ser Tyr His Val Gly Arg Pro Phe Ile
545 550 555 560
Ser Gln Tyr Asn Val
565
<210> 45
<211> 54
<212> DNA
<213> 智人
<400> 45
atgaagcttc ttcatgtttt cctgttattt ctgtgcttcc acttaaggtt ttgc 54
<210> 46
<211> 18
<212> PRT
<213> 智人
<400> 46
Met Lys Leu Leu His Val Phe Leu Leu Phe Leu Cys Phe His Leu Arg
1 5 10 15
Phe Cys
<210> 47
<211> 185
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 47
gggcgactca gatcccagcc agtggactta gcccctgttt gctcctccga taactggggt 60
gaccttggtt aatattcacc agcagcctcc cccgttgccc ctctggatcc actgcttaaa 120
tacggacgag gacagggccc tgtctcctca gcttcaggca ccaccactga cctgggacag 180
tgaat 185
<210> 48
<211> 418
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 48
ggatcttgct accagtggaa cagccactaa ggattctgca gtgagagcag agggccagct 60
aagtggtact ctcccagaga ctgtctgact cacgccaccc cctccacctt ggacacagga 120
cgctgtggtt tctgagccag gtacaatgac tcctttcggt aagtgcagtg gaagctgtac 180
actgcccagg caaagcgtcc gggcagcgta ggcgggcgac tcagatccca gccagtggac 240
ttagcccctg tttgctcctc cgataactgg ggtgaccttg gttaatattc accagcagcc 300
tcccccgttg cccctctgga tccactgctt aaatacggac gaggacaggg ccctgtctcc 360
tcagcttcag gcaccaccac tgacctggga cagtgaatga tccccctgat ctgcggcc 418
<210> 49
<211> 117
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 49
ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60
tgaccttgga gctggggcag aggtcagaca cctctctggg cccatgccac ctccaac 117
<210> 50
<211> 321
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 50
tggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60
ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120
tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180
cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240
tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300
ggtttaggta gtgtgagagg g 321
<210> 51
<211> 334
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 51
ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60
tgaccttgga gctggggcag aggtcagaca cctctctggg cccatgccac ctccaactgg 120
acacaggacg ctgtggtttc tgagccaggg ggcgactcag atcccagcca gtggacttag 180
cccctgtttg ctcctccgat aactggggtg accttggtta atattcacca gcagcctccc 240
ccgttgcccc tctggatcca ctgcttaaat acggacgagg acagggccct gtctcctcag 300
cttcaggcac caccactgac ctgggacagt gaat 334
<210> 52
<211> 747
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 52
aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60
ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120
tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180
cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240
tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300
ggtttaggta gtgtgagagg ggtacccggg gatcttgcta ccagtggaac agccactaag 360
gattctgcag tgagagcaga gggccagcta agtggtactc tcccagagac tgtctgactc 420
acgccacccc ctccaccttg gacacaggac gctgtggttt ctgagccagg tacaatgact 480
cctttcggta agtgcagtgg aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag 540
gcgggcgact cagatcccag ccagtggact tagcccctgt ttgctcctcc gataactggg 600
gtgaccttgg ttaatattca ccagcagcct cccccgttgc ccctctggat ccactgctta 660
aatacggacg aggacagggc cctgtctcct cagcttcagg caccaccact gacctgggac 720
agtgaatgat ccccctgatc tgcggcc 747
<210> 53
<211> 145
<212> DNA
<213> 腺相关病毒2
<400> 53
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcct 145
<210> 54
<211> 145
<212> DNA
<213> 腺相关病毒2
<400> 54
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120
gagcgcgcag agagggagtg gccaa 145
<210> 55
<211> 208
<212> DNA
<213> 牛
<400> 55
ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc 60
tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc 120
tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt 180
gggaagacaa tagcaggcat gctgggga 208
<210> 56
<211> 736
<212> PRT
<213> 腺相关病毒3B
<400> 56
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Val Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Arg Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly
145 150 155 160
Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr
435 440 445
Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu Phe Ser
450 455 460
Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala Asn Asp Asn
485 490 495
Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His Leu Asn
500 505 510
Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile Phe Gly
530 535 540
Lys Glu Gly Thr Thr Ala Ser Asn Ala Glu Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln
565 570 575
Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala Pro Thr
580 585 590
Thr Arg Thr Val Asn Asp Gln Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 57
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 合成衣壳蛋白
<400> 57
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly
145 150 155 160
Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr
435 440 445
Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu Phe Ser
450 455 460
Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala Asn Asp Asn
485 490 495
Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His Leu Asn
500 505 510
Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile Phe Gly
530 535 540
Lys Glu Gly Thr Thr Ala Ser Asn Ala Glu Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln
565 570 575
Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala Pro Thr
580 585 590
Thr Arg Thr Val Asn Asp Gln Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 58
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 合成衣壳蛋白
<400> 58
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Gln Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly
145 150 155 160
Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr
435 440 445
Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu Phe Ser
450 455 460
Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala Asn Asp Asn
485 490 495
Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His Leu Asn
500 505 510
Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile Phe Gly
530 535 540
Lys Glu Gly Thr Thr Ala Ser Asn Ala Glu Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln
565 570 575
Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala Pro Thr
580 585 590
Thr Arg Thr Val Asn Asp Gln Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
<210> 59
<211> 724
<212> PRT
<213> 腺相关病毒5
<400> 59
Met Ser Phe Val Asp His Pro Pro Asp Trp Leu Glu Glu Val Gly Glu
1 5 10 15
Gly Leu Arg Glu Phe Leu Gly Leu Glu Ala Gly Pro Pro Lys Pro Lys
20 25 30
Pro Asn Gln Gln His Gln Asp Gln Ala Arg Gly Leu Val Leu Pro Gly
35 40 45
Tyr Asn Tyr Leu Gly Pro Gly Asn Gly Leu Asp Arg Gly Glu Pro Val
50 55 60
Asn Arg Ala Asp Glu Val Ala Arg Glu His Asp Ile Ser Tyr Asn Glu
65 70 75 80
Gln Leu Glu Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp
85 90 95
Ala Glu Phe Gln Glu Lys Leu Ala Asp Asp Thr Ser Phe Gly Gly Asn
100 105 110
Leu Gly Lys Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro Phe
115 120 125
Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Thr Gly Lys Arg Ile
130 135 140
Asp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp Ser
145 150 155 160
Lys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser Gln
165 170 175
Gln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp Thr
180 185 190
Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly Ala
195 200 205
Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr Trp
210 215 220
Met Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu Pro
225 230 235 240
Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val Asp
245 250 255
Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr
260 265 270
Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp Gln
275 280 285
Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg Val
290 295 300
Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser Thr
305 310 315 320
Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp
325 330 335
Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly Cys
340 345 350
Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly Tyr
355 360 365
Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser Ser
370 375 380
Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly Asn
385 390 395 400
Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser Ser
405 410 415
Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val Asp
420 425 430
Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val Gln
435 440 445
Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn Trp
450 455 460
Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser Gly
465 470 475 480
Val Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met Glu
485 490 495
Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met Thr
500 505 510
Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met Ile
515 520 525
Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu Glu
530 535 540
Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn Arg
545 550 555 560
Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser Ser
565 570 575
Thr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val Pro
580 585 590
Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp
595 600 605
Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala Met
610 615 620
Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys Asn
625 630 635 640
Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val Ser
645 650 655
Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met Glu
660 665 670
Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln
675 680 685
Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro Asp
690 695 700
Ser Thr Gly Glu Tyr Arg Thr Thr Arg Pro Ile Gly Thr Arg Tyr Leu
705 710 715 720
Thr Arg Pro Leu
<210> 60
<211> 66
<212> DNA
<213> 猿猴病毒40
<400> 60
gtaaatataa aatttttaag tgtataatgt gttaaactac tgattctaat tgtttctctc 60
ttttag 66
<210> 61
<211> 659
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 61
gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60
catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120
acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180
ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240
aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300
ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 360
tagtcatcgc tattaccatg gtcgaggtga gccccacgtt ctgcttcact ctccccatct 420
cccccccctc cccaccccca attttgtatt tatttatttt ttaattattt tgtgcagcga 480
tgggggcggg gggggggggg gggcgcgcgc caggcggggc ggggcggggc gaggggcggg 540
gcggggcgag gcggagaggt gcggcggcag ccaatcagag cggcgcgctc cgaaagtttc 600
cttttatggc gaggcggcgg cggcggcggc cctataaaaa gcgaagcgcg cggcgggcg 659
<210> 62
<211> 588
<212> DNA
<213> 土拨鼠肝炎病毒
<400> 62
atcaacctct ggattacaaa atttgtgaaa gattgactgg tattcttaac tatgttgctc 60
cttttacgct atgtggatac gctgctttaa tgcctttgta tcatgctatt gcttcccgta 120
tggctttcat tttctcctcc ttgtataaat cctggttgct gtctctttat gaggagttgt 180
ggcccgttgt caggcaacgt ggcgtggtgt gcactgtgtt tgctgacgca acccccactg 240
gttggggcat tgccaccacc tgtcagctcc tttccgggac tttcgctttc cccctcccta 300
ttgccacggc ggaactcatc gccgcctgcc ttgcccgctg ctggacaggg gctcggctgt 360
tgggcactga caattccgtg gtgttgtcgg ggaaatcatc gtcctttcct tggctgctcg 420
cctgtgttgc cacctggatt ctgcgcggga cgtccttctg ctacgtccct tcggccctca 480
atccagcgga ccttccttcc cgcggcctgc tgccggctct gcggcctctt ccgcgtcttc 540
gccttcgccc tcagacgagt cggatctccc tttgggccgc ctccccgc 588
<210> 63
<211> 245
<212> DNA
<213> 土拨鼠肝炎病毒
<400> 63
aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60
ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120
atggctttca ttttctcctc cttgtataaa tcctggttag ttcttgccac ggcggaactc 180
atcgccgcct gccttgcccg ctgctggaca ggggctcggc tgttgggcac tgacaattcc 240
gtggt 245
<210> 64
<211> 589
<212> DNA
<213> 土拨鼠肝炎病毒
<400> 64
aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60
ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120
atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180
tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240
ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300
attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360
ttgggcactg acaattccgt ggtgttgtcg gggaaatcat cgtcctttcc ttggctgctc 420
gcctgtgttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480
aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540
cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589
<210> 65
<211> 119
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 65
cccagccagt ggacttagcc cctgtttgct cctccgataa ctggggtgac cttggttaat 60
attcaccagc agcctccccc tcagcttcag gcaccaccac tgacctggga cagtgaatc 119
<210> 66
<211> 119
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 66
cccagccagt ggacttagcc cctgtttgct cctccgataa ctggggtgac cttggttaat 60
attcaccagc agcctccccc tcagcttcag gcaccaccac tgacctggga cagtgaatc 119
<210> 67
<211> 747
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 67
aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60
ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120
tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180
cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240
tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300
ggtttaggta gtgtgagagg ggtacccggg gatcttgcta ccagtggaac agccactaag 360
gattctgcag tgagagcaga gggccagcta agtggtactc tcccagagac tgtctgactc 420
acgccacccc ctccaccttg gacacaggac gctgtggttt ctgagccagg tacaatgact 480
cctttcggta agtgcagtgg aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag 540
gcgggcgact cagatcccag ccagtggact tagcccctgt ttgctcctcc gataactggg 600
gtgaccttgg ttaatattca ccagcagcct cccccgttgc ccctctggat ccactgctta 660
aatacggacg aggacagggc cctgtctcct cagcttcagg caccaccact gacctgggac 720
agtgaatgat ccccctgatc tgcggcc 747
<210> 68
<211> 576
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 68
ggttaatttt taaaaagcag tcaaaagtcc aagtggccct tgcgagcatt tactctctct 60
gtttgctctg gttaataatc tcaggagcac aaacattcct ggaggcagga gaagaaatca 120
acatcctgga cttatcctct gggcctctcg tacccgggga tcttgctacc agtggaacag 180
ccactaagga ttctgcagtg agagcagagg gccagctaag tggtactctc ccagagactg 240
tctgactcac gccaccccct ccaccttgga cacaggacgc tgtggtttct gagccaggta 300
caatgactcc tttcggtaag tgcagtggaa gctgtacact gcccaggcaa agcgtccggg 360
cagcgtaggc gggcgactca gatcccagcc agtggactta gcccctgttt gctcctccga 420
taactggggt gaccttggtt aatattcacc agcagcctcc cccgttgccc ctctggatcc 480
actgcttaaa tacggacgag gacagggccc tgtctcctca gcttcaggca ccaccactga 540
cctgggacag tgaatgatcc ccctgatctg cggccg 576
<210> 69
<211> 898
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 69
caggctcaga ggcacacagg agtttctggg ctcaccctgc ccccttccaa cccctcagtt 60
cccatcctcc agcagctgtt tgtgtgctgc ctctgaagtc cacactgaac aaacttcagc 120
ctactcatgt ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct 180
ccctgcctgc tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac 240
ctccaacatc cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg 300
tggtttaggt agtgtgagag gggggttaat ttttaaaaag cagtcaaaag tccaagtggc 360
ccttgcgagc atttactctc tctgtttgct ctggttaata atctcaggag cacaaacatt 420
cctggaggca ggagaagaaa tcaacatcct ggacttatcc tctgggcctc tctacccggg 480
gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga gggccagcta 540
agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg gacacaggac 600
gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg aagctgtaca 660
ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact 720
tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct 780
cccccgttgc ccctctggat ccactgctta aatacggacg aggacagggc cctgtctcct 840
cagcttcagg caccaccact gacctgggac agtgaatgat ccccctgatc tgcggccg 898
<210> 70
<211> 898
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 70
ggttaatttt taaaaagcag tcaaaagtcc aagtggccct tgcgagcatt tactctctct 60
gtttgctctg gttaataatc tcaggagcac aaacattcct ggaggcagga gaagaaatca 120
acatcctgga cttatcctct gggcctctcc aggctcagag gcacacagga gtttctgggc 180
tcaccctgcc cccttccaac ccctcagttc ccatcctcca gcagctgttt gtgtgctgcc 240
tctgaagtcc acactgaaca aacttcagcc tactcatgtc cctaaaatgg gcaaacattg 300
caagcagcaa acagcaaaca cacagccctc cctgcctgct gaccttggag ctggggcaga 360
ggtcagagac ctctctgggc ccatgccacc tccaacatcc actcgacccc ttggaatttc 420
ggtggagagg agcagaggtt gtcctggcgt ggtttaggta gtgtgagagg ggtacccggg 480
gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga gggccagcta 540
agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg gacacaggac 600
gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg aagctgtaca 660
ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact 720
tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct 780
cccccgttgc ccctctggat ccactgctta aatacggacg aggacagggc cctgtctcct 840
cagcttcagg caccaccact gacctgggac agtgaatgat ccccctgatc tgcggccg 898
<210> 71
<211> 573
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 71
tgcctccccg tgttcctgct ctttgtccct ctgtcctact tagactaata tttgccttgg 60
gtactgcaaa caggaaatgg gggagggaca ggaggttaat ttttaaaaag cagtcaaaag 120
tccaagtggc ccttgcgagc atttactctc tctgtttgct ctggttaata atctcaggag 180
cacaaacatt cctggaggca ggagaagaaa tcaacatcct ggacttatcc tctgggcctc 240
tcgtacccgg ggatcttgct accagtggaa cagccactaa ggattctgca gtgagagcag 300
agggccagct aagtggtact ctcccagaga ctgtctgact cacgccaccc cctccacctt 360
ggacacagga cgctgtggtt tctgagccag gtacaatgac tcctttcggt aagtgcagtg 420
gaagctgtac actgcccagg caaagcgtcc gggcagcgta ggcgggcgac tcagatccca 480
gccagtggac ttagcccctg tttgctcctc cgataactgg ggtgaccttg gttaatattc 540
accagcagcc tcccccgttg cccctctgga tcc 573
<210> 72
<211> 1618
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 72
cacaattttt atagacttct catcatgttt tttttttcca atatttgccc tcccctttct 60
accttgacct agtagggagg tgtttattca acacctctga ttggctcata aacaaccagt 120
ccttaaaatc atgccaggct cagaggcaca caggagtttc tgggctcacc ctgccccctt 180
ccaacccctc agttcccatc ctccagcagc tgtttgtgtg ctgcctctga agtccacact 240
gaacaaactt cagcctactc atgtccctaa aatgggcaaa cattgcaagc agcaaacagc 300
aaacacacag ccctccctgc ctgctgacct tggagctggg gcagaggtca gagacctctc 360
tgggcccatg ccacctccaa catccactcg accccttgga atttcggtgg agaggagcag 420
aggttgtcct ggcgtggttt aggtagtgtg agagggggtt aatttttaaa aagcagtcaa 480
aagtccaagt ggcccttgcg agcatttact ctctctgttt gctctggtta ataatctcag 540
gagcacaaac attcctggag gcaggagaag aaatcaacat cctggactta tcctctgggc 600
ctctcgggat tcaaattctg cttagctaac ccaatgttgt gagttaatgc ttgtctactt 660
gggcagaagt accttgcaaa attatctagg tagcatgtga tagaaccagg attcaaaccc 720
aggtgtgtct gacctcaaag tgtggggact ttccactcta ctgctgctaa tttttttcta 780
aaaataatac ttccgggtgc agagtttaat cttctttgtc caaggtactg tggtaagcac 840
cttatgtaca ttgtctaagt taatccccac aacattttga gaaatcccca ttttgagata 900
ggagaactga ggctcacaat atttcagtga ctggcccaag gtcacagttg ttaaatggag 960
gagctggtat tgaaaaccag gtacgtgtgg ctctaagacc agtgtaatag ttgtgttttg 1020
tttttccttg cttccttctt tacttgcctt catttctagc ttacactggc atgattcatc 1080
tcagtgggca atatccttac cttgaatggt ggtttctttg tttgttcctg caagaggagc 1140
acctccttgg tctaactgtg gatacaaata attaacaggt gtcagatgtc agtacccggg 1200
gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga gggccagcta 1260
agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg gacacaggac 1320
gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg aagctgtaca 1380
ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact 1440
tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct 1500
cccccgttgc ccctctggat ccactgctta aatacggacg aggacagggc cctgtctcct 1560
cagcttcagg caccaccact gacctgggac agtgaatgat ccccctgatc tgcggccg 1618
<210> 73
<211> 1363
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 73
ggaggggtgt taattaaaag cttgatatgg gattcaaatt ctgcttagct aacccaatgt 60
tgtgagttaa tgcttgtcta cttgggcaga agtaccttgc aaaattatct aggtagcatg 120
tgatagaacc aggattcaaa cccaggtgtg tctgacctca aagtgtgggg actttccact 180
ctactgctgc taattttttt ctaaaaataa tacttccggg tgcagagttt aatcttcttt 240
gtccaaggta ctgtggtaag caccttatgt acattgtcta agttaatccc cacaacattt 300
tgagaaatcc ccattttgag ataggagaac tgaggctcac aatatttcag tgactggccc 360
aaggtcacag ttgttaaatg gaggagctgg tattgaaaac caggtacgtg tggctctaag 420
accagtgtaa tagttgtgtt ttgtttttcc ttgcttcctt ctttacttgc cttcatttct 480
agcttacact ggcatgattc atctcagtgg gcaatatcct taccttgaat ggtggtttct 540
ttgtttgttc ctgcaagagg agcacctcct tggtctaact gtggatacaa ataattaaca 600
ggtgtcagat gtcatgcctc cccgtgttcc tgctctttgt ccctctgtcc tacttagact 660
aatatttgcc ttgggtactg caaacaggaa atgggggagg gacaggaccc agccagtgga 720
cttagcccct gtttgctcct ccgataactg gggtgacctt ggttaatatt caccagcagc 780
ctcccccggt taatttttaa aaagcagtca aaagtccaag tggcccttgc gagcatttac 840
tctctctgtt tgctctggtt aataatctca ggagcacaaa cattcctgga ggcaggagaa 900
gaaatcaaca tcctggactt atcctctggg cctctcgtac ccggggatct tgctaccagt 960
ggaacagcca ctaaggattc tgcagtgaga gcagagggcc agctaagtgg tactctccca 1020
gagactgtct gactcacgcc accccctcca ccttggacac aggacgctgt ggtttctgag 1080
ccaggtacaa tgactccttt cggtaagtgc agtggaagct gtacactgcc caggcaaagc 1140
gtccgggcag cgtaggcggg cgactcagat cccagccagt ggacttagcc cctgtttgct 1200
cctccgataa ctggggtgac cttggttaat attcaccagc agcctccccc gttgcccctc 1260
tggatccact gcttaaatac ggacgaggac agggccctgt ctcctcagct tcaggcacca 1320
ccactgacct gggacagtga atgatccccc tgatctgcgg ccg 1363
<210> 74
<211> 1484
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 74
gggattcaaa ttctgcttag ctaacccaat gttgtgagtt aatgcttgtc tacttgggca 60
gaagtacctt gcaaaattat ctaggtagca tgtgatagaa ccaggattca aacccaggtg 120
tgtctgacct caaagtgtgg ggactttcca ctctactgct gctaattttt ttctaaaaat 180
aatacttccg ggtgcagagt ttaatcttct ttgtccaagg tactgtggta agcaccttat 240
gtacattgtc taagttaatc cccacaacat tttgagaaat ccccattttg agataggaga 300
actgaggctc acaatatttc agtgactggc ccaaggtcac agttgttaaa tggaggagct 360
ggtattgaaa accaggtacg tgtggctcta agaccagtgt aatagttgtg ttttgttttt 420
ccttgcttcc ttctttactt gccttcattt ctagcttaca ctggcatgat tcatctcagt 480
gggcaatatc cttaccttga atggtggttt ctttgtttgt tcctgcaaga ggagcacctc 540
cttggtctaa ctgtggatac aaataattaa caggtgtcag atgtcacagg ctcagaggca 600
cacaggagtt tctgggctca ccctgccccc ttccaacccc tcagttccca tcctccagca 660
gctgtttgtg tgctgcctct gaagtccaca ctgaacaaac ttcagcctac tcatgtccct 720
aaaatgggca aacattgcaa gcagcaaaca gcaaacacac agccctccct gcctgctgac 780
cttggagctg gggcagaggt cagagacctc tctgggccca tgccacctcc aacatccact 840
cgaccccttg gaatttcggt ggagaggagc agaggttgtc ctggcgtggt ttaggtagtg 900
tgagaggggg ttaattttta aaaagcagtc aaaagtccaa gtggcccttg cgagcattta 960
ctctctctgt ttgctctggt taataatctc aggagcacaa acattcctgg aggcaggaga 1020
agaaatcaac atcctggact tatcctctgg gcctctcgta cccggggatc ttgctaccag 1080
tggaacagcc actaaggatt ctgcagtgag agcagagggc cagctaagtg gtactctccc 1140
agagactgtc tgactcacgc caccccctcc accttggaca caggacgctg tggtttctga 1200
gccaggtaca atgactcctt tcggtaagtg cagtggaagc tgtacactgc ccaggcaaag 1260
cgtccgggca gcgtaggcgg gcgactcaga tcccagccag tggacttagc ccctgtttgc 1320
tcctccgata actggggtga ccttggttaa tattcaccag cagcctcccc cgttgcccct 1380
ctggatccac tgcttaaata cggacgagga cagggccctg tctcctcagc ttcaggcacc 1440
accactgacc tgggacagtg aatgatcccc ctgatctgcg gccg 1484
<210> 75
<211> 903
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 75
ggttaatttt taaaaagcag tcaaaagtcc aagtggccct tgcgagcatt tactctctct 60
gtttgctctg gttaataatc tcaggagcac aaacattcct ggaggcagga gaagaaatca 120
acatcctgga cttatcctct gggcctctcc aggctcagag gcacacagga gtttctgggc 180
tcaccctgcc cccttccaac ccctcagttc ccatcctcca gcagctgttt gtgtgctgcc 240
tctgaagtcc acactgaaca aacttcagcc tactcatgtc cctaaaatgg gcaaacattg 300
caagcagcaa acagcaaaca cacagccctc cctgcctgct gaccttggag ctggggcaga 360
ggtcagagac ctctctgggc ccatgccacc tccaacatcc actcgacccc ttggaatttc 420
ggtggagagg agcagaggtt gtcctggcgt ggtttaggta gtgtgagagg ggtacccggg 480
gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga gggccagcta 540
agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg gacacaggac 600
gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg aagctgtaca 660
ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact 720
tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct 780
cccccgttgc ccctctggat ccactgctta aatacggata taaacgagga cagggccctg 840
tctcctcagc ttcaggcacc accactgacc tgggacagtg aatgatcccc ctgatctgcg 900
gcc 903
<210> 76
<211> 933
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 76
ggttaatttt taaaaagcag tcaaaagtcc aagtggccct tgcgagcatt tactctctct 60
gtttgctctg gttaataatc tcaggagcac aaacattcct ggaggcagga gaagaaatca 120
acatcctgga cttatcctct gggcctctct tattgatatt ccaggctcag aggcacacag 180
gagtttctgg gctcaccctg cccccttcca acccctcagt tcccatcctc cagcagctgt 240
ttgtgtgctg cctctgaagt ccacactgaa caaacttcag cctactcatg tccctaaaat 300
gggcaaacat tgcaagcagc aaacagcaaa cacacagccc tccctgcctg ctgaccttgg 360
agctggggca gaggtcagag acctctctgg gcccatgcca cctccaacat ccactcgacc 420
ccttggaatt tcggtggaga ggagcagagg ttgtcctggc gtggtttagg tagtgtgaga 480
gggtggccct tgcgtacccg gggatcttgc taccagtgga acagccacta aggattctgc 540
agtgagagca gagggccagc taagtggtac tctcccagag actgtctgac tcacgccacc 600
ccctccacct tggacacagg acgctgtggt ttctgagcca ggtacaatga ctcctttcgg 660
taagtgcagt ggaagctgta cactgcccag gcaaagcgtc cgggcagcgt aggcgggcga 720
ctcagatccc atataaagcc agtggactta gcccctgttt gctcctccga taactggggt 780
gaccttggtt aatattcacc agcagcctcc ccctattgat tgttgcccct ctggatccac 840
tgcttaaata cggacgagga cagggccctg tctcctcagc ttcaggcacc accactgacc 900
tgggacagtg aatgatcccc ctgatctgcg gcc 933
<210> 77
<211> 943
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 77
ggttaatttt taaaaagcag tcaaaagtcc aagtggccct tgcgagcatt tactctctct 60
gtttgctctg gttaataatc tcaggagcac aaacattcct ggaggcagga gaagaaatca 120
acatcctgga cttatcctct gggcctctct tattgatatt ccaggctcag aggcacacag 180
gagtttctgg gctcaccctg cccccttcca acccctcagt tcccatcctc cagcagctgt 240
ttgtgtgctg cctctgaagt ccacactgaa caaacttcag cctactcatg tccctaaaat 300
gggcaaacat tgcaagcagc aaacagcaaa cacacagccc tccctgcctg ctgaccttgg 360
agctggggca gaggtcagag acctctctgg gcccatgcca cctccaacat ccactcgacc 420
ccttggaatt tcggtggaga ggagcagagg ttgtcctggc gtggtttagg tagtgtgaga 480
ggggttaata atctggccct tgcgtacccg gggatcttgc taccagtgga acagccacta 540
aggattctgc agtgagagca gagggccagc taagtggtac tctcccagag actgtctgac 600
tcacgccacc ccctccacct tggacacagg acgctgtggt ttctgagcca ggtacaatga 660
ctcctttcgg taagtgcagt ggaagctgta cactgcccag gcaaagcgtc cgggcagcgt 720
aggcgggcga ctcagatccc atataaagcc agtggactta gcccctgttt gctcctccga 780
taactggggt gaccttggtt aatattcacc agcagcctcc ccctattgat tgttgcccct 840
ctggatccac tgcttaaata cggacgagga cagggccctg tctcctcagc ttcaggcacc 900
accactgacc tgggacagtg aatgatcccc ctgatctgcg gcc 943
<210> 78
<211> 913
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 78
ggttaatttt taaaaagcag tcaaaagtcc aagtggccct tgcgagcatt tactctctct 60
gtttgctctg gttaataatc tcaggagcac aaacattcct ggaggcagga gaagaaatca 120
acatcctgga cttatcctct gggcctctcc aggctcagag gcacacagga gtttctgggc 180
tcaccctgcc cccttccaac ccctcagttc ccatcctcca gcagctgttt gtgtgctgcc 240
tctgaagtcc acactgaaca aacttcagcc tactcatgtc cctaaaatgg gcaaacattg 300
caagcagcaa acagcaaaca cacagccctc cctgcctgct gaccttggag ctggggcaga 360
ggtcagagac ctctctgggc ccatgccacc tccaacatcc actcgacccc ttggaatttc 420
ggtggagagg agcagaggtt gtcctggcgt ggtttaggta gtgtgagagg gctgtttgct 480
cgtacccggg gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga 540
gggccagcta agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg 600
gacacaggac gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg 660
aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccat 720
ataaagccag tggacttagc ccctgtttgc tcctccgata actggggtga ccttggttaa 780
tattcaccag cagcctcccc cgttgcccct ctggatccac tgcttaaata cggacgagga 840
cagggccctg tctcctcagc ttcaggcacc accactgacc tgggacagtg aatgatcccc 900
ctgatctgcg gcc 913
<210> 79
<211> 915
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 79
ggttaatttt taaaaagcag tcaaaagtcc aagtggccct tgcgagcatt tactctctct 60
gtttgctctg gttaataatc tcaggagcac aaacattcct ggaggcagga gaagaaatca 120
acatcctgga cttatcctct gggcctctct tattgatatt ccaggctcag aggcacacag 180
gagtttctgg gctcaccctg cccccttcca acccctcagt tcccatcctc cagcagctgt 240
ttgtgtgctg cctctgaagt ccacactgaa caaacttcag cctactcatg tccctaaaat 300
gggcaaacat tgcaagcagc aaacagcaaa cacacagccc tccctgcctg ctgaccttgg 360
agctggggca gaggtcagag acctctctgg gcccatgcca cctccaacat ccactcgacc 420
ccttggaatt tcggtggaga ggagcagagg ttgtcctggc gtggtttagg tagtgtgaga 480
ggggtacccg gggatcttgc taccagtgga acagccacta aggattctgc agtgagagca 540
gagggccagc taagtggtac tctcccagag actgtctgac tcacgccacc ccctccacct 600
tggacacagg acgctgtggt ttctgagcca ggtacaatga ctcctttcgg taagtgcagt 660
ggaagctgta cactgcccag gcaaagcgtc cgggcagcgt aggcgggcga ctcagatccc 720
atataaagcc agtggactta gcccctgttt gctcctccga taactggggt gaccttggtt 780
aatattcacc agcagcctcc cccgttgccc ctctggatcc actgcttaaa tacggacgag 840
gacagggccc tgtctcctca gcttcaggca ccaccactga cctgggacag tgaatgatcc 900
ccctgatctg cggcc 915
<210> 80
<211> 909
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 80
ggttaatttt taaaaagcag tcaaaagtcc aagtggccct tgcgagcatt tactctctct 60
gtttgctctg gttaataatc tcaggagcac aaacattcct ggaggcagga gaagaaatca 120
acatcctgga cttatcctct gggcctctct tattgatatt ccaggctcag aggcacacag 180
gagtttctgg gctcaccctg cccccttcca acccctcagt tcccatcctc cagcagctgt 240
ttgtgtgctg cctctgaagt ccacactgaa caaacttcag cctactcatg tccctaaaat 300
gggcaaacat tgcaagcagc aaacagcaaa cacacagccc tccctgcctg ctgaccttgg 360
agctggggca gaggtcagag acctctctgg gcccatgcca cctccaacat ccactcgacc 420
ccttggaatt tcggtggaga ggagcagagg ttgtcctggc gtggtttagg tagtgtgaga 480
ggggtacccg gggatcttgc taccagtgga acagccacta aggattctgc agtgagagca 540
gagggccagc taagtggtac tctcccagag actgtctgac tcacgccacc ccctccacct 600
tggacacagg acgctgtggt ttctgagcca ggtacaatga ctcctttcgg taagtgcagt 660
ggaagctgta cactgcccag gcaaagcgtc cgggcagcgt aggcgggcga ctcagatccc 720
agccagtgga cttagcccct gtttgctcct ccgataactg gggtgacctt ggttaatatt 780
caccagcagc ctcccccgtt gcccctctgg atccactgct taaatacgga cgaggacagg 840
gccctgtctc ctcagcttca ggcaccacca ctgacctggg acagtgaatg atccccctga 900
tctgcggcc 909
<210> 81
<211> 907
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 81
ggttaatttt taaaaagcag tcaaaagtcc aagtggccct tgcgagcatt tactctctct 60
gtttgctctg gttaataatc tcaggagcac aaacattcct ggaggcagga gaagaaatca 120
acatcctgga cttatcctct gggcctctct ggcccttgcc aggctcagag gcacacagga 180
gtttctgggc tcaccctgcc cccttccaac ccctcagttc ccatcctcca gcagctgttt 240
gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc tactcatgtc cctaaaatgg 300
gcaaacattg caagcagcaa acagcaaaca cacagccctc cctgcctgct gaccttggag 360
ctggggcaga ggtcagagac ctctctgggc ccatgccacc tccaacatcc actcgacccc 420
ttggaatttc ggtggagagg agcagaggtt gtcctggcgt ggtttaggta gtgtgagagg 480
ggtacccggg gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga 540
gggccagcta agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg 600
gacacaggac gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg 660
aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag 720
ccagtggact tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca 780
ccagcagcct cccccgttgc ccctctggat ccactgctta aatacggacg aggacagggc 840
cctgtctcct cagcttcagg caccaccact gacctgggac agtgaatgat ccccctgatc 900
tgcggcc 907
<210> 82
<211> 909
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 82
ggttaatttt taaaaagcag tcaaaagtcc aagtggccct tgcgagcatt tactctctct 60
gtttgctctg gttaataatc tcaggagcac aaacattcct ggaggcagga gaagaaatca 120
acatcctgga cttatcctct gggcctctcc aggctcagag gcacacagga gtttctgggc 180
tcaccctgcc cccttccaac ccctcagttc ccatcctcca gcagctgttt gtgtgctgcc 240
tctgaagtcc acactgaaca aacttcagcc tactcatgtc cctaaaatgg gcaaacattg 300
caagcagcaa acagcaaaca cacagccctc cctgcctgct gaccttggag ctggggcaga 360
ggtcagagac ctctctgggc ccatgccacc tccaacatcc actcgacccc ttggaatttc 420
ggtggagagg agcagaggtt gtcctggcgt ggtttaggta gtgtgagagg gttattgata 480
ttcgtacccg gggatcttgc taccagtgga acagccacta aggattctgc agtgagagca 540
gagggccagc taagtggtac tctcccagag actgtctgac tcacgccacc ccctccacct 600
tggacacagg acgctgtggt ttctgagcca ggtacaatga ctcctttcgg taagtgcagt 660
ggaagctgta cactgcccag gcaaagcgtc cgggcagcgt aggcgggcga ctcagatccc 720
agccagtgga cttagcccct gtttgctcct ccgataactg gggtgacctt ggttaatatt 780
caccagcagc ctcccccgtt gcccctctgg atccactgct taaatacgga cgaggacagg 840
gccctgtctc ctcagcttca ggcaccacca ctgacctggg acagtgaatg atccccctga 900
tctgcggcc 909
<210> 83
<211> 907
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 83
ggttaatttt taaaaagcag tcaaaagtcc aagtggccct tgcgagcatt tactctctct 60
gtttgctctg gttaataatc tcaggagcac aaacattcct ggaggcagga gaagaaatca 120
acatcctgga cttatcctct gggcctctcc aggctcagag gcacacagga gtttctgggc 180
tcaccctgcc cccttccaac ccctcagttc ccatcctcca gcagctgttt gtgtgctgcc 240
tctgaagtcc acactgaaca aacttcagcc tactcatgtc cctaaaatgg gcaaacattg 300
caagcagcaa acagcaaaca cacagccctc cctgcctgct gaccttggag ctggggcaga 360
ggtcagagac ctctctgggc ccatgccacc tccaacatcc actcgacccc ttggaatttc 420
ggtggagagg agcagaggtt gtcctggcgt ggtttaggta gtgtgagagg gtggcccttg 480
cgtacccggg gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga 540
gggccagcta agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg 600
gacacaggac gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg 660
aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag 720
ccagtggact tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca 780
ccagcagcct cccccgttgc ccctctggat ccactgctta aatacggacg aggacagggc 840
cctgtctcct cagcttcagg caccaccact gacctgggac agtgaatgat ccccctgatc 900
tgcggcc 907
<210> 84
<211> 907
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 84
ggttaatttt taaaaagcag tcaaaagtcc aagtggccct tgcgagcatt tactctctct 60
gtttgctctg gttaataatc tcaggagcac aaacattcct ggaggcagga gaagaaatca 120
acatcctgga cttatcctct gggcctctcc aggctcagag gcacacagga gtttctgggc 180
tcaccctgcc cccttccaac ccctcagttc ccatcctcca gcagctgttt gtgtgctgcc 240
tctgaagtcc acactgaaca aacttcagcc tactcatgtc cctaaaatgg gcaaacattg 300
caagcagcaa acagcaaaca catggccctt gccagccctc cctgcctgct gaccttggag 360
ctggggcaga ggtcagagac ctctctgggc ccatgccacc tccaacatcc actcgacccc 420
ttggaatttc ggtggagagg agcagaggtt gtcctggcgt ggtttaggta gtgtgagagg 480
ggtacccggg gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga 540
gggccagcta agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg 600
gacacaggac gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg 660
aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag 720
ccagtggact tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca 780
ccagcagcct cccccgttgc ccctctggat ccactgctta aatacggacg aggacagggc 840
cctgtctcct cagcttcagg caccaccact gacctgggac agtgaatgat ccccctgatc 900
tgcggcc 907
<210> 85
<211> 913
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 85
ggttaatttt taaaaagcag tcaaaagtcc aagtggccct tgcgagcatt tactctctct 60
gtttgctctg gttaataatc tcaggagcac aaacattcct ggaggcagga gaagaaatca 120
acatcctgga cttatcctct gggcctctcc aggctcagag gcacacagga gtttctgggc 180
tcaccctgcc cccttccaac ccctcagttc ccatcctcca gcagctgttt gtgtgctgcc 240
tctgaagtcc acactgaaca aacttcagcc tactcatgtc cctaaaatgg gcaaacattg 300
caagcagcaa acagcaaaca cacagccctc cctgcctgct gaccttggag ctggggcaga 360
ggtcagagac ctctctgggc ccatgccacc tccaacatcc actcgacccc ttggaatttc 420
ggtggagagg agcagaggtt gtcctggcgt ggtttaggta gtgtgagagg ggtacccggg 480
gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga gggccagcta 540
agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg gacacaggac 600
gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg aagctgtaca 660
ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact 720
tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct 780
ccccctatat aaatattgat tgttgcccct ctggatccac tgcttaaata cggacgagga 840
cagggccctg tctcctcagc ttcaggcacc accactgacc tgggacagtg aatgatcccc 900
ctgatctgcg gcc 913
<210> 86
<211> 919
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 86
ggttaatttt taaaaagcag tcaaaagtcc aagtggccct tgcgagcatt tactctctct 60
gtttgctctg gttaataatc tcaggagcac aaacattcct ggaggcagga gaagaaatca 120
acatcctgga cttatcctct gggcctctct tattgatatt ccaggctcag aggcacacag 180
gagtttctgg gctcaccctg cccccttcca acccctcagt tcccatcctc cagcagctgt 240
ttgtgtgctg cctctgaagt ccacactgaa caaacttcag cctactcatg tccctaaaat 300
gggcaaacat tgcaagcagc aaacagcaaa cacacagccc tccctgcctg ctgaccttgg 360
agctggggca gaggtcagag acctctctgg gcccatgcca cctccaacat ccactcgacc 420
ccttggaatt tcggtggaga ggagcagagg ttgtcctggc gtggtttagg tagtgtgaga 480
gggtggccct tgcgtacccg gggatcttgc taccagtgga acagccacta aggattctgc 540
agtgagagca gagggccagc taagtggtac tctcccagag actgtctgac tcacgccacc 600
ccctccacct tggacacagg acgctgtggt ttctgagcca ggtacaatga ctcctttcgg 660
taagtgcagt ggaagctgta cactgcccag gcaaagcgtc cgggcagcgt aggcgggcga 720
ctcagatccc agccagtgga cttagcccct gtttgctcct ccgataactg gggtgacctt 780
ggttaatatt caccagcagc ctcccccgtt gcccctctgg atccactgct taaatacgga 840
cgaggacagg gccctgtctc ctcagcttca ggcaccacca ctgacctggg acagtgaatg 900
atccccctga tctgcggcc 919
<210> 87
<211> 919
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 87
ggttaatttt taaaaagcag tcaaaagtcc aagtggccct tgcgagcatt tactctctct 60
gtttgctctg gttaataatc tcaggagcac aaacattcct ggaggcagga gaagaaatca 120
acatcctgga cttatcctct gggcctctct ggcccttgcc aggctcagag gcacacagga 180
gtttctgggc tcaccctgcc cccttccaac ccctcagttc ccatcctcca gcagctgttt 240
gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc tactcatgtc cctaaaatgg 300
gcaaacattg caagcagcaa acagcaaaca cacagccctc cctgcctgct gaccttggag 360
ctggggcaga ggtcagagac ctctctgggc ccatgccacc tccaacatcc actcgacccc 420
ttggaatttc ggtggagagg agcagaggtt gtcctggcgt ggtttaggta gtgtgagagg 480
gttattgata ttcgtacccg gggatcttgc taccagtgga acagccacta aggattctgc 540
agtgagagca gagggccagc taagtggtac tctcccagag actgtctgac tcacgccacc 600
ccctccacct tggacacagg acgctgtggt ttctgagcca ggtacaatga ctcctttcgg 660
taagtgcagt ggaagctgta cactgcccag gcaaagcgtc cgggcagcgt aggcgggcga 720
ctcagatccc agccagtgga cttagcccct gtttgctcct ccgataactg gggtgacctt 780
ggttaatatt caccagcagc ctcccccgtt gcccctctgg atccactgct taaatacgga 840
cgaggacagg gccctgtctc ctcagcttca ggcaccacca ctgacctggg acagtgaatg 900
atccccctga tctgcggcc 919
<210> 88
<211> 915
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 88
ggttaatttt taaaaagcag tcaaaagtcc aagtggccct tgcgagcatt tactctctct 60
gtttgctctg gttaataatc tcaggagcac aaacattcct ggaggcagga gaagaaatca 120
acatcctgga cttatcctct gggcctctcc aggctcagag gcacacagga gtttctgggc 180
tcaccctgcc cccttccaac ccctcagttc ccatcctcca gcagctgttt gtgtgctgcc 240
tctgaagtcc acactgaaca aacttcagcc tactcatgtc cctaaaatgg gcaaacattg 300
caagcagcaa acagcaaaca cacagccctc cctgcctgct gaccttggag ctggggcaga 360
ggtcagagac ctctctgggc ccatgccacc tccaacatcc actcgacccc ttggaatttc 420
ggtggagagg agcagaggtt gtcctggcgt ggtttaggta gtgtgagagg ggtacccggg 480
gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga gggccagcta 540
agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg gacacaggac 600
gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg aagctgtaca 660
ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccat ataaagccag 720
tggacttagc ccctgtttgc tcctccgata actggggtga ccttggttaa tattcaccag 780
cagcctcccc cttattgata ttcgttgccc ctctggatcc actgcttaaa tacggacgag 840
gacagggccc tgtctcctca gcttcaggca ccaccactga cctgggacag tgaatgatcc 900
ccctgatctg cggcc 915
<210> 89
<211> 909
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 89
ttattgatat tcggttaatt tttaaaaagc agtcaaaagt ccaagtggcc cttgcgagca 60
tttactctct ctgtttgctc tggttaataa tctcaggagc acaaacattc ctggaggcag 120
gagaagaaat caacatcctg gacttatcct ctgggcctct ccaggctcag aggcacacag 180
gagtttctgg gctcaccctg cccccttcca acccctcagt tcccatcctc cagcagctgt 240
ttgtgtgctg cctctgaagt ccacactgaa caaacttcag cctactcatg tccctaaaat 300
gggcaaacat tgcaagcagc aaacagcaaa cacacagccc tccctgcctg ctgaccttgg 360
agctggggca gaggtcagag acctctctgg gcccatgcca cctccaacat ccactcgacc 420
ccttggaatt tcggtggaga ggagcagagg ttgtcctggc gtggtttagg tagtgtgaga 480
ggggtacccg gggatcttgc taccagtgga acagccacta aggattctgc agtgagagca 540
gagggccagc taagtggtac tctcccagag actgtctgac tcacgccacc ccctccacct 600
tggacacagg acgctgtggt ttctgagcca ggtacaatga ctcctttcgg taagtgcagt 660
ggaagctgta cactgcccag gcaaagcgtc cgggcagcgt aggcgggcga ctcagatccc 720
agccagtgga cttagcccct gtttgctcct ccgataactg gggtgacctt ggttaatatt 780
caccagcagc ctcccccgtt gcccctctgg atccactgct taaatacgga cgaggacagg 840
gccctgtctc ctcagcttca ggcaccacca ctgacctggg acagtgaatg atccccctga 900
tctgcggcc 909
<210> 90
<211> 907
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 90
tggcccttgc ggttaatttt taaaaagcag tcaaaagtcc aagtggccct tgcgagcatt 60
tactctctct gtttgctctg gttaataatc tcaggagcac aaacattcct ggaggcagga 120
gaagaaatca acatcctgga cttatcctct gggcctctcc aggctcagag gcacacagga 180
gtttctgggc tcaccctgcc cccttccaac ccctcagttc ccatcctcca gcagctgttt 240
gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc tactcatgtc cctaaaatgg 300
gcaaacattg caagcagcaa acagcaaaca cacagccctc cctgcctgct gaccttggag 360
ctggggcaga ggtcagagac ctctctgggc ccatgccacc tccaacatcc actcgacccc 420
ttggaatttc ggtggagagg agcagaggtt gtcctggcgt ggtttaggta gtgtgagagg 480
ggtacccggg gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga 540
gggccagcta agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg 600
gacacaggac gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg 660
aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag 720
ccagtggact tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca 780
ccagcagcct cccccgttgc ccctctggat ccactgctta aatacggacg aggacagggc 840
cctgtctcct cagcttcagg caccaccact gacctgggac agtgaatgat ccccctgatc 900
tgcggcc 907
<210> 91
<211> 907
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 91
ggttaatttt taaaaagcag tcaaaagtcc aagtggccct tgcgagcatt tactctctct 60
gtttgctctg gttaataatc tcaggagcac aaacattcct ggaggcagga gaagaaatca 120
acatcctgga cttatcctct gggcctctcc aggctcagag gcacacagga gtttctgggc 180
tcaccctgcc cccttccaac ccctcagttc ccatcctcca gcagctgttt gtgtgctgcc 240
tctgaagtcc acactgaaca aacttcagcc tactcatgtc cctaaaatgg gcaaacattg 300
caagcagcaa acagcaaaca cacagccctc cctgcctgct gaccttggag ctggggcaga 360
ggtcagagac ctctctgggc ccatgccacc tccaacatcc actcgacccc ttggaatttc 420
ggtggagagg agcagaggtt gtcctggcgt ggtttaggta gtgtgagagg ggtacccggg 480
gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga gggccagcta 540
agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg gacacaggac 600
gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg aagctgtaca 660
ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact 720
tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct 780
ccccctttat tgatattcgc ccctctggat ccactgctta aatacggacg aggacagggc 840
cctgtctcct cagcttcagg caccaccact gacctgggac agtgaatgat ccccctgatc 900
tgcggcc 907
<210> 92
<211> 322
<212> DNA
<213> 智人
<400> 92
caggctcaga ggcacacagg agtttctggg ctcaccctgc ccccttccaa cccctcagtt 60
cccatcctcc agcagctgtt tgtgtgctgc ctctgaagtc cacactgaac aaacttcagc 120
ctactcatgt ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct 180
ccctgcctgc tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac 240
ctccaacatc cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg 300
tggtttaggt agtgtgagag gg 322
<210> 93
<211> 117
<212> DNA
<213> 智人
<400> 93
ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60
tgaccttgga gctggggcag aggtcagaca cctctctggg cccatgccac ctccaac 117
<210> 94
<211> 426
<212> DNA
<213> 智人
<400> 94
gtacccgggg atcttgctac cagtggaaca gccactaagg attctgcagt gagagcagag 60
ggccagctaa gtggtactct cccagagact gtctgactca cgccaccccc tccaccttgg 120
acacaggacg ctgtggtttc tgagccaggt acaatgactc ctttcggtaa gtgcagtgga 180
agctgtacac tgcccaggca aagcgtccgg gcagcgtagg cgggcgactc agatcccagc 240
cagtggactt agcccctgtt tgctcctccg ataactgggg tgaccttggt taatattcac 300
cagcagcctc ccccgttgcc cctctggatc cactgcttaa atacggacga ggacagggcc 360
ctgtctcctc agcttcaggc accaccactg acctgggaca gtgaatgatc cccctgatct 420
gcggcc 426
<210> 95
<211> 73
<212> DNA
<213> 智人
<400> 95
agtggactta gcccctgttt gctcctccga taactggggt gaccttggtt aatattcacc 60
agcagcctcc ccc 73
<210> 96
<211> 80
<212> DNA
<213> 智人
<400> 96
cccagccagt ggacttagcc cctgtttgct cctccgataa ctggggtgac cttggttaat 60
attcaccagc agcctccccc 80
<210> 97
<211> 149
<212> DNA
<213> 智人
<400> 97
ggttaatttt taaaaagcag tcaaaagtcc aagtggccct tgcgagcatt tactctctct 60
gtttgctctg gttaataatc tcaggagcac aaacattcct ggaggcagga gaagaaatca 120
acatcctgga cttatcctct gggcctctc 149
<210> 98
<211> 93
<212> DNA
<213> 智人
<400> 98
ttaattttta aaaagcagtc aaaagtccaa gtggcccttg cgagcattta ctctctctgt 60
ttgctctggt taataatctc aggagcacaa aca 93
<210> 99
<211> 134
<212> DNA
<213> 智人
<400> 99
cacaattttt atagacttct catcatgttt tttttttcca atatttgccc tcccctttct 60
accttgacct agtagggagg tgtttattca acacctctga ttggctcata aacaaccagt 120
ccttaaaatc atgc 134
<210> 100
<211> 12
<212> DNA
<213> 智人
<400> 100
aatttttata ga 12
<210> 101
<211> 52
<212> DNA
<213> 智人
<400> 101
gtagggaggt gtttattcaa cacctctgat tggctcataa acaaccagtc ct 52
<210> 102
<211> 586
<212> DNA
<213> 智人
<400> 102
gggattcaaa ttctgcttag ctaacccaat gttgtgagtt aatgcttgtc tacttgggca 60
gaagtacctt gcaaaattat ctaggtagca tgtgatagaa ccaggattca aacccaggtg 120
tgtctgacct caaagtgtgg ggactttcca ctctactgct gctaattttt ttctaaaaat 180
aatacttccg ggtgcagagt ttaatcttct ttgtccaagg tactgtggta agcaccttat 240
gtacattgtc taagttaatc cccacaacat tttgagaaat ccccattttg agataggaga 300
actgaggctc acaatatttc agtgactggc ccaaggtcac agttgttaaa tggaggagct 360
ggtattgaaa accaggtacg tgtggctcta agaccagtgt aatagttgtg ttttgttttt 420
ccttgcttcc ttctttactt gccttcattt ctagcttaca ctggcatgat tcatctcagt 480
gggcaatatc cttaccttga atggtggttt ctttgtttgt tcctgcaaga ggagcacctc 540
cttggtctaa ctgtggatac aaataattaa caggtgtcag atgtca 586
<210> 103
<211> 113
<212> DNA
<213> 智人
<400> 103
cttgcaaaat tatctaggta gcatgtgata gaaccaggat tcaaacccag gtgtgtctga 60
cctcaaagtg tggggacttt ccactctact gctgctaatt tttttctaaa aat 113
<210> 104
<211> 93
<212> DNA
<213> 智人
<400> 104
tgcctccccg tgttcctgct ctttgtccct ctgtcctact tagactaata tttgccttgg 60
gtactgcaaa caggaaatgg gggagggaca gga 93
<210> 105
<211> 77
<212> DNA
<213> 智人
<400> 105
tgttcctgct ctttgtccct ctgtcctact tagactaata tttgccttgg gtactgcaaa 60
caggaaatgg gggaggg 77
<210> 106
<211> 14
<212> DNA
<213> 智人
<400> 106
tagactaata tttg 14
<210> 107
<211> 9
<212> DNA
<213> 智人
<400> 107
cttgcaaaa 9
<210> 108
<211> 10
<212> DNA
<213> 智人
<400> 108
tatgtacatt 10
<210> 109
<211> 10
<212> DNA
<213> 智人
<400> 109
cccacaacat 10
<210> 110
<211> 9
<212> DNA
<213> 智人
<400> 110
ttgagaaat 9
<210> 111
<211> 10
<212> DNA
<213> 智人
<400> 111
gattcatctc 10
<210> 112
<211> 10
<212> DNA
<213> 智人
<400> 112
ttggtctaac 10
<210> 113
<211> 12
<212> DNA
<213> 智人
<400> 113
ctttctacct tg 12
<210> 114
<211> 10
<212> DNA
<213> 智人
<400> 114
ctgtttgctc 10
<210> 115
<211> 9
<212> DNA
<213> 智人
<400> 115
cttgcaaaa 9
<210> 116
<211> 10
<212> DNA
<213> 智人
<400> 116
ctgtttgctc 10
<210> 117
<211> 9
<212> DNA
<213> 智人
<400> 117
cccaggtgt 9
<210> 118
<211> 8
<212> DNA
<213> 智人
<400> 118
tattgatt 8
<210> 119
<211> 11
<212> DNA
<213> 智人
<400> 119
aaaagcagtc a 11
<210> 120
<211> 11
<212> DNA
<213> 智人
<400> 120
aggcaggaga a 11
<210> 121
<211> 11
<212> DNA
<213> 智人
<400> 121
gagaagaaat c 11
<210> 122
<211> 11
<212> DNA
<213> 智人
<400> 122
caacatcctg g 11
<210> 123
<211> 11
<212> DNA
<213> 智人
<400> 123
acttatcctc t 11
<210> 124
<211> 11
<212> DNA
<213> 智人
<400> 124
cgtgttcctg c 11
<210> 125
<211> 9
<212> DNA
<213> 智人
<400> 125
gcaaacagg 9
<210> 126
<211> 7
<212> DNA
<213> 智人
<400> 126
tcatgtt 7
<210> 127
<211> 8
<212> DNA
<213> 智人
<400> 127
atcaacat 8
<210> 128
<211> 18
<212> DNA
<213> 智人
<400> 128
ataatctcag gagcacaa 18
<210> 129
<211> 6
<212> DNA
<213> 智人
<400> 129
ttatct 6
<210> 130
<211> 6
<212> DNA
<213> 智人
<400> 130
tgatag 6
<210> 131
<211> 6
<212> DNA
<213> 智人
<400> 131
agatag 6
<210> 132
<211> 11
<212> DNA
<213> 智人
<400> 132
gacttatcct c 11
<210> 133
<211> 18
<212> DNA
<213> 智人
<400> 133
tgtttattca acacctct 18
<210> 134
<211> 10
<212> DNA
<213> 智人
<400> 134
gttaataatc 10
<210> 135
<211> 13
<212> DNA
<213> 智人
<400> 135
gactaatatt tgc 13
<210> 136
<211> 13
<212> DNA
<213> 智人
<400> 136
cttgcaaaat tat 13
<210> 137
<211> 13
<212> DNA
<213> 智人
<400> 137
gctgctaatt ttt 13
<210> 138
<211> 13
<212> DNA
<213> 智人
<400> 138
acaaataatt aac 13
<210> 139
<211> 13
<212> DNA
<213> 智人
<400> 139
gttaattttt aaa 13
<210> 140
<211> 11
<212> DNA
<213> 智人
<400> 140
ggttaataat c 11
<210> 141
<211> 12
<212> DNA
<213> 智人
<400> 141
tggttaatat tc 12
<210> 142
<211> 10
<212> DNA
<213> 智人
<400> 142
tgtttgctct 10
<210> 143
<211> 10
<212> DNA
<213> 智人
<400> 143
agcacaaaca 10
<210> 144
<211> 9
<212> DNA
<213> 智人
<400> 144
tgtttgctc 9
<210> 145
<211> 7
<212> DNA
<213> 智人
<400> 145
tgtttgc 7
<210> 146
<211> 8
<212> DNA
<213> 智人
<400> 146
tgtttgct 8
<210> 147
<211> 11
<212> DNA
<213> 智人
<400> 147
agaaatcaac a 11
<210> 148
<211> 15
<212> DNA
<213> 智人
<400> 148
ctaatatttg ccttg 15
<210> 149
<211> 13
<212> DNA
<213> 智人
<400> 149
gactaatatt tgc 13
<210> 150
<211> 12
<212> DNA
<213> 智人
<400> 150
tctgtttgct ct 12
<210> 151
<211> 17
<212> DNA
<213> 智人
<400> 151
ttcctgctct ttgtccc 17
<210> 152
<211> 8
<212> DNA
<213> 智人
<400> 152
cagagttt 8
<210> 153
<211> 12
<212> DNA
<213> 智人
<400> 153
ccctgtttgc tc 12
<210> 154
<211> 10
<212> DNA
<213> 智人
<400> 154
tggcccttgc 10
<210> 155
<211> 15
<212> DNA
<213> 智人
<400> 155
agcagtcaaa agtcc 15
<210> 156
<211> 12
<212> DNA
<213> 智人
<400> 156
ttattgatat tc 12
<210> 157
<211> 8
<212> DNA
<213> 智人
<400> 157
tattgatt 8
<210> 158
<211> 15
<212> DNA
<213> 智人
<400> 158
ttttttttcc aatat 15
<210> 159
<211> 21
<212> DNA
<213> 智人
<400> 159
atttactctc tctgtttgct c 21
<210> 160
<211> 21
<212> DNA
<213> 智人
<400> 160
ttactctctc tgtttgctct g 21
<210> 161
<211> 13
<212> DNA
<213> 智人
<400> 161
ttaataatct cag 13
<210> 162
<211> 17
<212> DNA
<213> 智人
<400> 162
tggttaatat tcaccag 17
<210> 163
<211> 11
<212> DNA
<213> 智人
<400> 163
caacatcctg g 11
<210> 164
<211> 13
<212> DNA
<213> 智人
<400> 164
agtccaagtg gcc 13
<210> 165
<211> 12
<212> DNA
<213> 智人
<400> 165
gtccaagtgg cc 12
<210> 166
<211> 10
<212> DNA
<213> 智人
<400> 166
ctctggttaa 10
<210> 167
<211> 10
<212> DNA
<213> 智人
<400> 167
aaatggggga 10
<210> 168
<211> 10
<212> DNA
<213> 智人
<400> 168
tcaaaagtcc 10
<210> 169
<211> 14
<212> DNA
<213> 智人
<400> 169
tagactaata tttg 14
<210> 170
<211> 15
<212> DNA
<213> 智人
<400> 170
caggagaaga aatca 15
<210> 171
<211> 14
<212> DNA
<213> 智人
<400> 171
tgttaattaa aagc 14
<210> 172
<211> 10
<212> DNA
<213> 智人
<400> 172
gttaattttt 10
<210> 173
<211> 10
<212> DNA
<213> 智人
<400> 173
ttactctctc 10
<210> 174
<211> 10
<212> DNA
<213> 智人
<400> 174
cttgggtact 10
<210> 175
<211> 9
<212> DNA
<213> 智人
<400> 175
gcaaacagg 9
<210> 176
<211> 8
<212> DNA
<213> 智人
<400> 176
ttaatttt 8
<210> 177
<211> 8
<212> DNA
<213> 智人
<400> 177
gggattca 8
<210> 178
<211> 8
<212> DNA
<213> 智人
<400> 178
ggtactgt 8
<210> 179
<211> 8
<212> DNA
<213> 智人
<400> 179
ttaatccc 8
<210> 180
<211> 8
<212> DNA
<213> 智人
<400> 180
ggtattga 8
<210> 181
<211> 8
<212> DNA
<213> 智人
<400> 181
ggctctaa 8
<210> 182
<211> 8
<212> DNA
<213> 智人
<400> 182
ggcatgat 8
<210> 183
<211> 8
<212> DNA
<213> 智人
<400> 183
ttcaaacc 8
<210> 184
<211> 8
<212> DNA
<213> 智人
<400> 184
atagaacc 8
<210> 185
<211> 10
<212> DNA
<213> 智人
<400> 185
tggaggcagg 10
<210> 186
<211> 7
<212> DNA
<213> 智人
<400> 186
acaggaa 7
<210> 187
<211> 13
<212> DNA
<213> 智人
<400> 187
atgggggagg gac 13
<210> 188
<211> 9
<212> DNA
<213> 智人
<400> 188
gcagtcaaa 9
<210> 189
<211> 9
<212> DNA
<213> 智人
<400> 189
gagcacaaa 9
<210> 190
<211> 11
<212> DNA
<213> 智人
<400> 190
attcctggag g 11
<210> 191
<211> 11
<212> DNA
<213> 智人
<400> 191
caaacaggaa a 11
<210> 192
<211> 6
<212> DNA
<213> 智人
<400> 192
tataaa 6
<210> 193
<211> 8
<212> DNA
<213> 智人
<400> 193
tatataaa 8
<210> 194
<211> 13
<212> DNA
<213> 智人
<400> 194
aaacattcct gga 13
<210> 195
<211> 7
<212> DNA
<213> 智人
<400> 195
acgtgtg 7
<210> 196
<211> 9
<212> DNA
<213> 智人
<400> 196
caggtgtca 9
<210> 197
<211> 9
<212> DNA
<213> 智人
<400> 197
cagatgtca 9
<210> 198
<211> 11
<212> DNA
<213> 智人
<400> 198
tccaagtggc c 11
<210> 199
<211> 11
<212> DNA
<213> 智人
<400> 199
agcatgtgat a 11
<210> 200
<211> 7
<212> DNA
<213> 智人
<400> 200
tataaaa 7
<210> 201
<211> 7
<212> DNA
<213> 智人
<400> 201
ttaaata 7
<210> 202
<211> 335
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 202
ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60
tgaccttgga gctggggcag aggtcagaca cctctctggg cccatgccac ctccaactgg 120
acacaggacg ctgtggtttc tgagccaggg ggcgactcag atcccagcca gtggacttag 180
cccctgtttg ctcctccgat aactggggtg accttggtta atattcacca gcagcctccc 240
ccgttgcccc tctggatcca ctgcttaaat acggacgagg acagggccct gtctcctcag 300
cttcaggcac caccactgac ctgggacagt gaatc 335

Claims (32)

1.一种包含补体因子I(CFI)核苷酸序列的多核苷酸,其中CFI核苷酸序列编码CFI多肽或其片段,其中CFI核苷酸序列的至少一部分不是野生型的,其中与由参考CFI核苷酸序列编码的CFI多肽的表达相比,由所述CFI核苷酸序列编码的CFI多肽或其片段在人肝细胞中以更高水平表达。
2.权利要求1的多核苷酸,其中:
(i)参考CFI核苷酸序列是野生型CFI核苷酸序列;
(ii)与在用包含参考CFI核苷酸序列的等效多核苷酸转染时由参考CFI核苷酸编码的CFI多肽的表达相比,在将包含所述CFI核苷酸序列的多核苷酸转染到人肝细胞中由所述CFI核苷酸序列编码的CFI多肽或其片段时以更高的水平表达;
(iii)人肝细胞是Huh-7细胞;和/或
(iv)由CFI核苷酸序列编码的CFI多肽或其片段的表达为由参考CFI核苷酸序列编码的CFI多肽的至少1.5x、至少2x、至少3x、至少5x、至少8x、至少10x、至少20x、至少30x、至少40x或至少50x。
3.权利要求1或2的多核苷酸,其中非野生型的CFI核苷酸序列部分是密码子优化的,并且其中密码子优化的CFI核苷酸序列部分针对在人肝细胞中的表达进行了密码子优化。
4.权利要求3的多核苷酸,其中密码子优化的CFI核苷酸序列部分:
(i)是连续的部分;
(ii)长度为至少1000、至少1200、至少1300、至少1400、至少1500、至少1600、至少1700、1752或更少、1300至1752、1500至1752、1600至1752或约1752个核苷酸;
(iii)长度为至少1000、至少1200、至少1300、至少1400、至少1500、1698或更少、1300至1698、1500至1698或约1698个核苷酸;和/或
(iv)编码成熟的CFI多肽。
5.前述权利要求中任一项的多核苷酸,其中所述CFI核苷酸序列针对在人肝细胞中的表达进行了密码子优化。
6.权利要求3至5中任一项的多核苷酸,其中在密码子优化的CFI核苷酸序列或CFI核苷酸序列部分中,至少70%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%或至少81%、至少82%、至少83%或至少84%的密码子选自:GCT、GCC、TGC、GAC、GAG、TTC、GGA、GGC、CAC、ATC、AAG、CTG、AAT、AAC、CCT、CCC、CAG、AGG、AGA、AGT、AGC、ACC、GTG和TAC。
7.权利要求3至6中任一项的多核苷酸,其中密码子优化的CFI核苷酸序列或CFI核苷酸序列部分:
(i)与参考CFI核苷酸序列的相应部分相比,包含减少数量的CpG;和/或
(ii)与参考CFI核苷酸序列的相应部分相比,包含减少数量的CpG,并且:
(a)包含40个或更少、20个或更少、15个或更少、10个或更少或5个或更少的CpG;
(b)包含40个或更少、20个或更少、15个或更少、10个或更少或5个或更少的CpG,并且其中密码子优化的CFI核苷酸序列或CFI核苷酸序列部分每100个核苷酸包含5个或更少、4个或更少、3个或更少或2个或更少的CpG;和/或
(c)不含CpG。
8.权利要求7的多核苷酸,其中所述参考CFI核苷酸序列是野生型CFI核苷酸序列。
9.权利要求3、4或6至8中任一项的多核苷酸,其中密码子优化的CFI核苷酸序列部分:
(i)与SEQ ID NO:5、10和17中的任一个至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同;
(ii)与SEQ ID NO:1-20中的任一个至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同;和/或
(iii)与SEQ ID NO:5至少80%、至少85%、至少90%、至少95%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同。
10.前述权利要求中任一项的多核苷酸,其中所述CFI核苷酸序列编码信号肽。
11.前述权利要求中任一项的多核苷酸,其中所述多核苷酸还包含转录调节元件。
12.权利要求11的多核苷酸,其中所述转录调节元件包含肝脏特异性启动子。
13.权利要求11或12的多核苷酸,其中所述转录调节元件包含与SEQ ID NO:74具有至少98%同一性的核苷酸序列。
14.一种包含补体因子I(CFI)核苷酸序列的多核苷酸,其中CFI核苷酸序列编码CFI多肽或其片段,并且其中CFI核苷酸序列的至少一部分不是野生型的。
15.前述权利要求中任一项的多核苷酸,其中所述CFI核苷酸序列包含与SEQ ID NO:1-40中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
16.一种包含CFI核苷酸序列的多核苷酸,其中CFI核苷酸序列编码CFI多肽或其片段,并且CFI核苷酸序列包含与SEQ ID NO:1-40中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列。
17.前述权利要求中任一项的多核苷酸,其中所述CFI核苷酸序列包含:
(i)与SEQ ID NO:5或25中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.8%或100%相同的序列;
(ii)SEQ ID NO:1-20中任一个的序列,或其编码包含与SEQ IDNO:44的野生型CFI氨基酸序列至少95%相同的序列的CFI多肽的变体;和/或
(iii)SEQ ID NO:1-20中任一个的序列,或其编码包含与SEQ IDNO:44的野生型CFI氨基酸序列至少95%相同的序列的CFI多肽的变体,其中所述变体是SEQ ID NO:5的变体,并且其中SEQ ID NO:5的变体与SEQ ID NO:5相同,除了它包含核苷酸取代以使得CFI多肽相对于SEQ ID NO:44的野生型CFI氨基酸序列具有1个、2个或更少、3个或更少、4个或更少、5个或更少、6个或更少、7个或更少、8个或更少、9个或更少或10个或更少的氨基酸取代。
18.一种包含重组基因组的病毒颗粒,所述重组基因组包含前述权利要求中任一项的多核苷酸。
19.权利要求18的病毒颗粒,其是AAV病毒颗粒。
20.权利要求19的病毒颗粒,其中所述病毒颗粒包含:
(i)衣壳;
(ii)嗜肝衣壳;和/或
(iii)嗜肝衣壳,其中嗜肝衣壳包含与SEQ ID NO:56-59中任一个的至少600、至少650、至少700、600至734、600至736、650至734、650至736、700至734、700至736、约734或约736个氨基酸的片段至少98%、至少99%或至少99.5%相同的序列。
21.一种组合物,其包含前述权利要求中任一项的多核苷酸或病毒颗粒,以及药学上可接受的赋形剂。
22.权利要求1至17中任一项的多核苷酸、权利要求18至20中任一项的病毒颗粒或权利要求21的组合物,其用于治疗方法。
23.一种治疗方法,包括施用有效量的权利要求1至17中任一项的多核苷酸、权利要求18至20中任一项的病毒颗粒或权利要求21的组合物。
24.权利要求1至17中任一项的多核苷酸、权利要求18至20中任一项的病毒颗粒或权利要求21的组合物在制备用于治疗方法的药物中的用途。
25.根据权利要求22至24中任一项使用的多核苷酸、病毒颗粒或组合物或用途,其中所述治疗方法包括向患者施用有效量的所述多核苷酸、病毒颗粒或组合物。
26.用于治疗方法的包含补体因子I(CFI)核苷酸序列的多核苷酸、包含含有所述多核苷酸的重组基因组的病毒颗粒或包含所述多核苷酸或病毒颗粒的组合物,其中所述治疗方法是治疗补体介导的病症的方法,并且CFI核苷酸序列编码CFI多肽或其片段。
27.一种治疗方法,包括施用有效量的包含CFI核苷酸序列的多核苷酸、包含含有所述多核苷酸的重组基因组的病毒颗粒或包含所述多核苷酸或病毒颗粒的组合物,其中所述治疗方法是治疗补体介导的病症的方法,并且CFI核苷酸序列编码CFI多肽或其片段。
28.一种包含CFI核苷酸序列的多核苷酸、包含含有所述多核苷酸的重组基因组的病毒颗粒或包含所述多核苷酸或病毒颗粒的组合物在制备用于治疗方法的药物中的用途,其中所述治疗方法是治疗补体介导的病症的方法,并且CFI核苷酸序列编码CFI多肽或其片段。
29.根据权利要求26至28中任一项使用的多核苷酸、病毒颗粒或组合物或用途,其中所述治疗方法包括向患者施用有效量的所述多核苷酸、病毒颗粒或组合物。
30.根据权利要求22至25中任一项使用的多核苷酸、病毒颗粒或组合物或用途,其中所述治疗方法是治疗补体介导的病症的方法。
31.根据权利要求26至30中使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中所述病症:
(i)是C3介导的病症;
(ii)是肾脏疾病;
(iii)与补体C3b反馈循环的过度活动有关;
(iv)选自C3肾小球病、IgA肾病、狼疮性肾炎、***性红斑狼疮、膜性肾病、膜增生性肾小球肾炎、阵发性睡眠性血红蛋白尿、非典型溶血性***综合征、自身免疫性溶血性贫血、ANCA相关血管炎、戈谢病、腹膜炎、年龄-相关黄斑变性、糖尿病性视网膜病变、致密物沉积病、年龄相关性炎症或自身炎症性疾病、自身免疫性关节炎如类风湿性关节炎、动脉粥样硬化、慢性心血管疾病、阿尔茨海默氏病、***性血管炎、格林-巴利综合征和Henoch-Schonlein紫癜;
(v)选自C3肾小球病、C3肾小球肾炎和致密物沉积病;
(vi)是具有单等位基因CFH突变的非典型溶血性***综合征;
(vii)是肾小球或肾小管病症;和/或
(vii)不是眼部病症。
32.根据权利要求22至31中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法,其中所述多核苷酸、病毒颗粒或组合物:
(i)不是眼内施用的;
(ii)通过以下方式施用:静脉内;全身地;通过外周静脉输注至肝脏;通过肝血管如肝静脉输注或肝动脉输注至肝脏;或通过实质内直接施用至肝脏;
(iii)通过注射施用至肾动脉中;
(iv)通过逆行施用进行施用;和/或
(v)通过逆行施用进行施用,其中使用导尿管通过输尿管施用。
CN202180052048.5A 2020-06-25 2021-06-25 多核苷酸 Pending CN116323650A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB2009741.6 2020-06-25
GBGB2009741.6A GB202009741D0 (en) 2020-06-25 2020-06-25 Polynucleotide
PCT/GB2021/051627 WO2021260394A1 (en) 2020-06-25 2021-06-25 Polynucleotide

Publications (1)

Publication Number Publication Date
CN116323650A true CN116323650A (zh) 2023-06-23

Family

ID=71949773

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180052048.5A Pending CN116323650A (zh) 2020-06-25 2021-06-25 多核苷酸

Country Status (10)

Country Link
US (1) US20230226224A1 (zh)
EP (1) EP4172182A1 (zh)
JP (1) JP2023533460A (zh)
KR (1) KR20230026504A (zh)
CN (1) CN116323650A (zh)
AU (1) AU2021298219A1 (zh)
CA (1) CA3187937A1 (zh)
GB (1) GB202009741D0 (zh)
IL (1) IL299374A (zh)
WO (1) WO2021260394A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB202109231D0 (en) * 2021-06-25 2021-08-11 Freeline Therapeutics Ltd Promoter

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011122950A1 (en) 2010-04-01 2011-10-06 Amsterdam Molecular Therapeutics (Amt) Ip B.V. Monomeric duplex aav vectors
GB201519086D0 (en) 2015-10-28 2015-12-09 Syncona Partners Llp Gene Therapy
GB201608046D0 (en) * 2016-05-09 2016-06-22 Cambridge Entpr Ltd And Syndey Children S Hospitals Network Randwick And Westmead Incorporating The Treatment of complement-mediated disorders
WO2020086735A1 (en) 2018-10-23 2020-04-30 Gemini Therapeutics Inc. Compositions and methods for treating age-related macular degeneration and other diseases
GB201821089D0 (en) 2018-12-21 2019-02-06 Gyroscope Therapeutics Ltd Codon-optimised complement factor I
EP4051703A1 (en) 2019-11-01 2022-09-07 Freeline Therapeutics Limited Factor viii polypeptide

Also Published As

Publication number Publication date
KR20230026504A (ko) 2023-02-24
IL299374A (en) 2023-02-01
US20230226224A1 (en) 2023-07-20
EP4172182A1 (en) 2023-05-03
GB202009741D0 (en) 2020-08-12
WO2021260394A1 (en) 2021-12-30
AU2021298219A1 (en) 2023-02-02
CA3187937A1 (en) 2021-12-30
JP2023533460A (ja) 2023-08-03

Similar Documents

Publication Publication Date Title
US20200407750A1 (en) Novel adeno-associated virus (aav) vectors, aav vectors having reduced capsid deamidation and uses therefor
US20210123073A1 (en) Novel adeno-associated virus (aav) vectors, aav vectors having reduced capsid deamidation and uses therefor
US11492614B2 (en) Stem loop RNA mediated transport of mitochondria genome editing molecules (endonucleases) into the mitochondria
AU2017339511A1 (en) Inducible caspases and methods for use
CN114174520A (zh) 用于选择性基因调节的组合物和方法
KR20210049833A (ko) Mma의 치료를 위한 비-붕괴적 유전자 요법
AU2019268346A1 (en) Compositions and methods for reducing spliceopathy and treating RNA dominance disorders
KR20240025507A (ko) 미성숙 종결 코돈-매개 장애를 치료하기 위한 방법 및 조성물
CN112739818A (zh) 编码因子ix的核苷酸
WO2020047268A1 (en) Products and methods for inhibition of expression of mutant gars protein
CN116323650A (zh) 多核苷酸
KR20240099184A (ko) 재생불량성 질환 치료를 위한 mrna 레귤론 요법
CN112533645A (zh) 通过因子viii的表达改善临床参数
US20230175014A1 (en) Compositions and methods for reducing nuclease expression and off-target activity using a promoter with low transcriptional activity
RU2799048C2 (ru) Улучшение клинических параметров посредством экспрессии фактора viii
TW202302854A (zh) 藉由異源使用選擇性剪接匣以提供基因療法貨物調控的方法及組成物
WO2024126696A1 (en) Compositions and methods for treating neurological diseases
WO2024056902A2 (en) Compositions and methods for treating neurological diseases
CN115427568A (zh) Rp1相关视网膜变性的基于单倍型的治疗
KR20230037586A (ko) Mapt 유전자를 표적으로 하는 알츠하이머병의 치료 방법
WO2022256522A1 (en) Crispr induced disruption of mogs gene
EA046157B1 (ru) Композиции и способы селективной регуляции экспрессии генов

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20231122

Address after: London

Applicant after: Sean Conner IP Holdings (2) Ltd.

Address before: Hurt Forde

Applicant before: Free exercise therapy Co.,Ltd.