CN116323650A

CN116323650A - 多核苷酸

Info

Publication number: CN116323650A
Application number: CN202180052048.5A
Authority: CN
Inventors: A·基亚; J·佛里; M·卡纳维瑟; R·柯巴; S·寇里亚
Original assignee: Free Exercise Therapy Co ltd
Current assignee: Sean Conner Ip Holdings 2 Ltd
Priority date: 2020-06-25
Filing date: 2021-06-25
Publication date: 2023-06-23
Also published as: KR20230026504A; IL299374A; US20230226224A1; EP4172182A1; GB202009741D0; WO2021260394A1; AU2021298219A1; CA3187937A1; JP2023533460A

Abstract

本发明涉及包含编码补体因子I(CFI)多肽或其片段的CFI核苷酸序列的多核苷酸。本发明进一步涉及包含含有本发明的多核苷酸的重组基因组的病毒颗粒，以及包含本发明的多核苷酸或病毒颗粒的组合物。本发明还涉及本发明的多核苷酸、病毒颗粒和/或组合物的使用方法和用途。本发明还涉及包含CFI核苷酸序列的多核苷酸、包含含有该多核苷酸的重组基因组的病毒颗粒或包含该多核苷酸或病毒颗粒的组合物的使用方法和用途。

Description

多核苷酸

发明领域

发明背景

补体因子I(CFI)是一种参与补体***的蛋白质。补体***是先天免疫***的一部分，并通过触发炎症反应形成抵御感染的第一道防线。补体***包含主要由肝脏合成并作为无活性前体在血液中循环的许多蛋白质。补体***的刺激(例如外来实体的刺激)触发***中的蛋白酶以裂解前体并释放分子如细胞因子以启动进一步的放大级联。补体***的活化可以刺激吞噬细胞、刺激炎症并活化细胞杀伤膜攻击复合体。补体***可通过经典途径、凝集素途径和旁路途径活化。所有三种途径都集中在C3转化酶对C3的裂解和活化。形成C3a和C3b，导致进一步裂解和活化事件的级联。

旁路途径在低水平下具有组成性活性(所谓的“tick-over”)，并且当C3b被释放到液相中或更典型地被外来实体调理时也可以作为放大回路。此外，旁路途径可以由受损组织触发或在缺乏必要调节剂的组织上传播。在正常情况下，旁路途径受两个竞争循环(即增强补体放大的C3b反馈循环和导致下调的C3b分解循环)之间的平衡控制。

由于自发的C3水解以形成C3b，旁路途径在低水平持续活化。C3b可以共价结合到细胞或病原体的表面。表面结合的C3b可以与因子B组合以形成复合物C3bB。C3bB可以在因子D存在的情况下被裂解以形成C3bBb(旁路途径C3转化酶)，其可以将更多的C3转化为C3b。复合的C3bBb可以结合因子P(备解素)以形成稳定的C3转化酶C3bBbP，其能够将更多的C3裂解成C3b，从而放大反应。当C3bBbP复合物在病原体或细胞表面上形成时，它能够结合额外的C3b以形成旁路途径C5转化酶，其由(C3b)₂BbP组成。C5转化酶将C5裂解成C5a和C5b。然后可以由依次与C6、C7、C8和多个C9分子结合的C5b形成膜攻击复合物。

存在C3分解循环以防止过度C3b生成。特别地，CFI在C3分解循环中发挥作用。它的作用是通过分两步裂解C3b和iC3b来调节补体活化。在第一步中，CFI在存在辅因子H的情况下催化C3b裂解为iC3b。iC3b不能形成C3或C5转化酶的一部分，但具有促炎作用。在第二步中，CFI在存在辅因子CR1(CD35)的情况下进一步分解iC3b，产生C3片段C3d,g。

补体***在许多具有免疫成分的疾病(例如狼疮性肾炎和C3肾小球病)中发挥作用。因此，这些途径的失调具有临床意义。例如，如果CFI不起作用或缺乏，或旁路途径被过度刺激或不当地刺激，则补体***的平衡可随后被破坏，导致炎症因子在例如肾脏中的积聚，其可导致肾脏病理学。因此，需要重新平衡旁路途径的循环，特别是通过促进C3b和iC3b分解，从而减轻炎症。因此，恢复或增加CFI的水平在治疗上会是有利的。

因此，需要提供用于补体介导的病症的有效治疗载体，其将允许恢复或增加功能性CFI的表达水平。恢复或增加功能性CFI的表达水平可用于治疗补体介导的疾病，例如肾小球疾病。

发明概述

本申请证明向肝脏施用包含编码CFI多肽或其片段的CFI核苷酸序列的多核苷酸可用于全身性提供CFI多肽或其片段。为了实现这一点，以高水平表达CFI多肽或其片段的CFI核苷酸序列是有利的。特别地，此类核苷酸序列可以以较低的剂量、较低的商品成本和较低的毒性施用。

本申请表明，可以在体外和/或体内实现CFI多肽或其片段的提高的表达水平。这种提高的表达水平可以通过修饰编码CFI多肽或其片段的核苷酸序列来实现。因此，本发明提供了包含CFI核苷酸序列的多核苷酸，其中CFI核苷酸序列编码CFI多肽或其片段，并且其中CFI核苷酸序列的至少一部分不是野生型的。

此外，本申请使用小鼠模型证明包含编码CFI多肽或其片段的CFI核苷酸序列的多核苷酸可用于治疗补体介导的病症。因此，本发明还提供了用于治疗方法的包含CFI核苷酸序列的多核苷酸、包含含有该多核苷酸的重组基因组的病毒颗粒或包含该多核苷酸或病毒颗粒的组合物，其中该治疗方法是治疗补体介导的病症的方法，并且CFI核苷酸序列编码CFI多肽或其片段。

因此，在本发明的第在一个方面，提供了包含补体因子I(CFI)核苷酸序列的多核苷酸，其中CFI核苷酸序列编码CFI多肽或其片段，并且其中CFI核苷酸序列的至少一部分不是野生型的。

在本发明的第二个方面，提供了包含CFI核苷酸序列的多核苷酸，其中CFI核苷酸序列编码CFI多肽或其片段并且CFI核苷酸序列包含与SEQ ID NO：1-40中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

在本发明的第三个方面，提供了包含重组基因组的病毒颗粒，所述重组基因组包含本发明的多核苷酸。

在本发明的第四个方面，提供了包含本发明的多核苷酸或病毒颗粒以及药学上可接受的赋形剂的组合物。

在本发明的第五个方面，提供了用于治疗方法的本发明的多核苷酸、病毒颗粒或组合物。

在本发明的第六个方面，提供了一种治疗方法，包括施用有效量的本发明的多核苷酸、病毒颗粒或组合物。

在本发明的第七个方面，提供了本发明的多核苷酸、病毒颗粒或组合物在制备用于治疗方法的药物中的用途。

在本发明的第八个方面，提供了用于治疗方法的包含补体因子I(CFI)核苷酸序列的多核苷酸、包含含有该多核苷酸的重组基因组的病毒颗粒或包含该多核苷酸或病毒颗粒的组合物，其中治疗方法是治疗补体介导的病症的方法，并且CFI核苷酸序列编码CFI多肽或其片段。

在本发明的第九个方面，提供了一种治疗方法，包括施用有效量的包含CFI核苷酸序列的多核苷酸、包含含有该多核苷酸的重组基因组的病毒颗粒或包含该多核苷酸或病毒颗粒的组合物，其中所述治疗方法是治疗补体介导的病症的方法，并且CFI核苷酸序列编码CFI多肽或其片段。

在本发明的第十个方面，提供了包含CFI核苷酸序列的多核苷酸、包含含有该多核苷酸的重组基因组的病毒颗粒或包含该多核苷酸或病毒颗粒的组合物在制备用于治疗方法的药物中的用途，其中所述治疗方法是治疗补体介导的病症的方法，并且CFI核苷酸序列编码CFI多肽或其片段。

本申请证明使用密码子优化的CFI核苷酸序列可以提高编码的CFI多肽的表达。可以进一步修饰此类修饰的CFI核苷酸序列以进一步改善所编码的CFI多肽的表达。进一步的修饰可以包括在CFI核苷酸序列中提供进一步的修饰，例如去除CpG基序。

附图说明

图1显示了C57BL/b小鼠中CFI表达水平和腹膜嗜中性粒细胞计数的Spearman等级。小鼠通过静脉内注射6x10¹¹、2x10¹²或6x10¹³vg/kg的包含CFI的AAV施用，或未处理(“UT”)，并通过ELISA测定它们在血液中的人CFI表达水平(从尾静脉收集)。对于未处理，n＝3；对于6x10¹¹vg/kg剂量和对于2x10¹²vg/kg剂量，n＝4；和对于6x10¹³vg/kg剂量，n＝2。AAV包含Co01密码子优化的CFI核苷酸序列和CAG启动子。在施用后4、8和12周测量人CFI(“因子I”)的水平，平均值绘制在图1A中。误差条表示一个标准偏差。在AAV施用后16周，通过腹膜内注射用悬浮在PBS中的酵母聚糖处理小鼠。酵母聚糖处理后4小时测定腹膜嗜中性粒细胞的数量，平均值绘制在图1B中(Y轴＝嗜中性粒细胞计数x10⁶/mL)。误差条表示一个标准偏差。标记为“对照”的泳道未施用AAV，而是用PBS而非酵母聚糖处理。对于“对照”，N＝3。施用后12周的CFI表达水平和AAV施用后16周的嗜中性粒细胞计数使用Spearman等级进行关联。结果如图1C所示。对于Spearman等级，r＝-0.82且p<0.001。

图2显示了MRL-lpr小鼠模型中不同处理组的蛋白尿水平(通过ACR测量)。“未处理的”是处理组1。“AAV-CFI”是处理组2。“MRL/Mp”是处理组3。“环磷酰胺”是处理组4。绘制平均值。误差条表示一个标准偏差。

图3显示了四个处理组的PAS染色切片的半定量分级。

图4-序列表

图5显示转染后在Huh-7细胞培养基中观察到的野生型人CFI核苷酸序列和各种密码子优化的人CFI序列的CFI表达水平。结果以表达水平的顺序显示。CFI表达水平已使用萤光素酶表达水平标准化，以考虑转染效率。CFI表达水平表示为ng/ml(每ml培养基的CFI的ng)。每次转染一式两份进行，每次重复获得的值显示为一个点。误差条＝平均值±SD。使用LSP-S启动子和BgpA多聚A序列表达序列。LOQ，定量限。

图6显示了体外研究的结果，该研究比较了Huh7细胞中质粒转染后野生型人CFI蛋白的表达。质粒使用FRE72启动子或LSP-S或LSP-L启动子(各自是肝脏特异性转录调节元件)。在转染后第3天使用ELISA测量培养物上清液中的蛋白质水平。CMV-萤光素酶对照质粒用作共转染载体以用于转染效率的标准化。图6A显示了萤光素酶校正前的结果，图6B显示了萤光素酶校正后的结果。条形代表中值。

图7-显示FRE72(SEQ ID NO：66)、HCR-hAAT(SEQ ID NO：67)、NP1(SEQ ID NO：68)、NP2(SEQ ID NO：69)、NP3(SEQ ID NO：70)、NP4(SEQ ID NO：71)、NP5(SEQ ID NO：72)、NP6(SEQ ID NO：73)和NP7(SEQ ID NO：74)中存在的不同序列元件的示意图。示意图每个部分中的标签显示了各种序列元件的名称。被称为ApoE-HCR1的序列元件为SEQ ID NO：92的序列元件。被称为hAAT的序列元件为SEQ ID NO：94的序列元件。被称为AMBP的序列元件为SEQID NO：94的序列元件。被称为CRM6的序列元件是SEQ ID NO：98的序列元件。被称为ALDOB的序列元件是SEQ ID NO：102的序列元件。被称为F2的序列元件是SEQ ID NO：104的序列元件。示意图左侧的标签显示TRE的名称。示意图右侧的数字显示相应TRE的长度。

图8-(A)显示了NP3(SEQ ID NO：70)中存在的序列元件的示意图，包括ApoE HCR-1序列元件中ApoE增强子的位置和hAAT序列元件中的高同源性区域。上面的比例尺显示了每个不同元件的核苷酸位置。(B)总结了基于NP3的一组TRE(NP3衍生的TRE)的特征的表格。该表显示了各种NP3衍生的TRE和NP3之间的差异。

图9-显示与HCR-hAAT相比，Huh7细胞中由NP1、NP2、NP3、NP4、NP5、NP6和NP7促进的CFI表达水平的倍数变化的图。HLP2和FRE72作为对照包括在内。Huh7人肝细胞用包含可操作地连接至CFI的TRE的质粒DNA以及包含可操作地连接至CMV启动子的萤光素酶编码核苷酸序列的对照质粒转染。然后培养、收获细胞并通过ELISA测量CFI的表达水平。与ELISA平行，进行萤光素酶测定以确定萤光素酶表达水平。每个样品的CFI表达水平针对相应的萤光素酶表达水平进行标准化。误差条显示平均值+1SD。

图10-显示与HCR-hAAT相比，在Huh7细胞中由NP12-NP24促进的CFI表达水平的倍数变化的图。HLP2、FRE72和NP3作为对照包括在内。Huh7人肝细胞用包含可操作地连接至CFI的TRE的质粒DNA以及包含可操作地连接至CMV启动子的萤光素酶编码核苷酸序列的对照质粒转染。然后培养、收获细胞并通过ELISA测量CFI的表达水平。与ELISA平行，进行萤光素酶测定以确定萤光素酶表达水平。每个样品的CFI表达水平针对相应的萤光素酶表达水平进行标准化。误差条显示平均值+/-1SD。

图11-显示了与HCR-hAAT相比，在Huh7细胞中由NP8-NP11促进的CFI表达水平的倍数变化的图。HLP2、FRE72和NP3作为对照包括在内。Huh7人肝细胞用包含可操作地连接至CFI的TRE的质粒DNA以及包含可操作地连接至CMV启动子的萤光素酶编码核苷酸序列的对照质粒转染。然后培养、收获细胞并通过ELISA测量CFI的表达水平。与ELISA平行，进行萤光素酶测定以确定萤光素酶表达水平。每个样品的CFI表达水平针对相应的萤光素酶表达水平进行标准化。误差条显示平均值+/-1SD。

图12显示了补体活化的步骤的概述。FD、FB、FH和FI分别代表因子D、B、H和I。

图13显示了脊椎动物补体的旁路途径的反馈回路。虚线表示酶促反应。实线表示蛋白质的转化。D、B、H和I分别代表因子D、B、H和I。

序列描述

详述

一般定义

除非另有定义，本文使用的技术和科学术语与本发明所属领域的技术人员通常理解的含义相同。

一般而言，术语“包含”旨在表示包括但不限于。例如，短语“包含CFI核苷酸序列的多核苷酸”应被解释为表示该多核苷酸具有CFI核苷酸序列，但该多核苷酸可包含额外的核苷酸。

在本发明的一些实施方案中，单词“包含”可以替换为短语“由......组成”。术语“由......组成”旨在进行限制。例如，短语“由CFI核苷酸序列组成的多核苷酸”应理解为是指该多核苷酸具有CFI核苷酸序列并且没有额外的核苷酸。

在本发明的一些实施方案中，单词“具有”或“含有”可以用单词“包含”或短语“由......组成”代替。

如本文所用，当提及两个端点以定义值的范围时，“之间”应当被理解为“介于之间和包括”。因此，定义为“介于5和10之间”的范围包括大于5和小于10的所有值，以及离散值5和10本身。

描述核苷酸序列长度的上下文中使用的术语“约”表示序列可以包含限定数目，加或减10％，更具体地加或减5％，更具体地加或减1％或更具体地加或减一个整数的核苷酸或由其组成。例如，提及长度为“约”1698个核苷酸的核苷酸序列可以指长度为1529-1867个核苷酸，更具体地1614-1782个核苷酸，更具体地1682-1714个核苷酸，更具体地1697-1699个核苷酸的核苷酸序列。

为了本发明的目的，为了确定两个序列(例如两个多核苷酸或两个多肽序列)的同一性百分比，将序列比对以用于最佳比较目的(例如，可以在第一序列中引入空位以进行与第二序列的最佳比对)。然后比较每个位置的核苷酸或氨基酸残基。当第一序列中的一个位置被与第二序列中的相应位置相同的核苷酸或氨基酸残基占据时，则该位置的核苷酸或氨基酸是相同的。两个序列之间的同一性百分比是序列共有的相同位置的数量的函数(即，％同一性＝相同位置数/参考序列中的位置总数x100)。

通常，序列比较是在参考序列的长度上进行的。例如，如果用户希望确定给定(“测试”)序列是否与SEQ ID NO：5具有95％的同一性，则SEQ ID NO：5将是参考序列。例如，为了评估序列是否与SEQ ID NO：5(参考序列的示例)至少95％相同，技术人员将在SEQ ID NO：5的长度上进行比对，并鉴定测试序列中与SEQ ID NO：5相同的位置的数量。如果至少95％的位置相同，则测试序列与SEQ ID NO：5至少95％相同。如果序列短于SEQ ID NO：5，则空位或缺失的位置应被认为是不相同的位置。

技术人员知道可用于确定两个序列之间的同源性或同一性的不同计算机程序。例如，两个序列之间的序列比较和同一性百分比的确定可以使用数学算法来完成。在一个实施方案中，两个氨基酸或核苷酸序列之间的同一性百分比是使用Needleman和Wunsch(1970)算法(该算法已被并入Accelrys GCG软件包(可在http://www.accelrys.com/products/gcg/获得)中的GAP程序中)、使用Blosum 62矩阵或PAM250矩阵和16、14、12、10、8、6或4的空位权重和1、2、3、4、5或6的长度权重确定的。

为了本发明的目的，术语“片段”是指序列的连续部分。例如，50个核苷酸的SEQ IDNO：5的片段是指SEQ ID NO：5的50个连续核苷酸。

术语“蛋白质”和“多肽”在本文中可互换使用，并意指任何长度的氨基酸的聚合链。

术语“因子I”和“补体因子I”在本文中可互换使用。

多核苷酸

本发明提供了包含补体因子I(CFI)核苷酸序列的多核苷酸，其中CFI核苷酸序列编码CFI多肽或其片段，并且其中CFI核苷酸序列的至少一部分不是野生型的。任选地，CFI核苷酸序列是人CFI核苷酸序列。任选地，CFI多肽是人CFI多肽。

本发明还提供了包含CFI核苷酸序列的多核苷酸，其中CFI核苷酸序列编码CFI多肽或其片段，并且CFI核苷酸序列包含与SEQ ID NO：1-40中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列是人CFI核苷酸序列。任选地，CFI多肽是人CFI多肽。

术语“核酸分子”、“多核苷酸”和“核苷酸序列”旨在指任何长度的核苷酸(包括脱氧核糖核苷酸、核糖核苷酸或其类似物)的聚合链。例如，核酸分子、多核苷酸或核苷酸序列可包含DNA(脱氧核糖核苷酸)或RNA(核糖核苷酸)。核酸分子、多核苷酸或核苷酸序列可由DNA组成。核酸分子、多核苷酸或核苷酸序列可以是mRNA。由于核酸分子、多核苷酸或核苷酸序列可包含RNA或DNA，所以所有对T(胸腺嘧啶)核苷酸的引用可替换为U(尿嘧啶)。

在一些实施方案中，术语“核苷酸序列”可以被术语“核酸分子”替代。

在一些实施方案中，CFI核苷酸序列包含与SEQ ID NO：1-40中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含与SEQ IDNO：1-20中任一个的至少1200、至少1400、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

任选地，CFI核苷酸序列包含与SEQ ID NO：3-20和23-40中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含与SEQ IDNO：3-20中任一个的至少1200、至少1400、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

任选地，CFI核苷酸序列包含与SEQ ID NO：1、2、3、5、6、7、9-12、14-17、20、21、22、23、25、26、27、29-32、34-37和40中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含与SEQ ID NO：1、2、3、5、6、7、9-12、14-17和20任一个的至少1200、至少1400、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

任选地，CFI核苷酸序列包含与SEQ ID NO：2、3、5、6、7、9-12、14-17、20、22、23、25、26、27、29-32、34-37和40中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含与SEQ ID NO：2、3、5、6、7、9-12、14-17和20中任一个的至少1200、至少1400、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

任选地，CFI核苷酸序列包含与SEQ ID NO：1、5、7、10-14、16、17、21、25、27、30-34、36和37中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含与SEQ ID NO：1、5、7、10-14、16和17中任一个的至少1200、至少1400、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

任选地，CFI核苷酸序列包含与SEQ ID NO：1、5、7、11-14、16、17、21、25、27、31-34、36和37中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含与SEQ ID NO：1、5、7、11-14、16和17中任一个的至少1200、至少1400、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

任选地，CFI核苷酸序列包含与SEQ ID NO：1、5、7、11、12、14、16、17、21、25、27、31、32、34、36和37中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含与SEQ ID NO：1、5、7、11、12、14、16和17中任一个的至少1200、至少1400、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

任选地，CFI核苷酸序列包含与SEQ ID NO：5、7、12-14、16、17、25、27、32-34、36和37中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含与SEQ ID NO：5、7、12-14、16和17中任一个的至少1200、至少1400、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

任选地，CFI核苷酸序列包含与SEQ ID NO：5、7、12、14、16、17、25、27、32、34、36和37中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含与SEQ ID NO：5、7、12、14、16和17中任一个的至少1200、至少1400、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

任选地，CFI核苷酸序列包含与SEQ ID NO：5、7、14、25、27和34中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含与SEQ ID NO：5、7和14中任一个的至少1200、至少1400、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

任选地，CFI核苷酸序列包含与SEQ ID NO：3、5-7、10、14、17、20、23、25-27、30、34、37和40中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含与SEQ ID NO：3、5-7、10、14、17和20中任一个的至少1200、至少1400、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

任选地，CFI核苷酸序列包含与SEQ ID NO：5、10、17、25、30和37中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含与SEQ ID NO：5、10和17中任一个的至少1200、至少1400、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

任选地，CFI核苷酸序列包含与SEQ ID NO：5或25的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含与SEQ ID NO：5的至少1200、至少1400、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

任选地，CFI核苷酸序列包含与SEQ ID NO：7或27的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含与SEQ ID NO：7的至少1200、至少1400、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

任选地，CFI核苷酸序列包含与SEQ ID NO：10或30的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

任选地，CFI核苷酸序列包含与SEQ ID NO：10的至少1200、至少1400、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

任选地，CFI核苷酸序列包含与SEQ ID NO：14或34的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含与SEQ ID NO：14的至少1200、至少1400、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

任选地，CFI核苷酸序列包含与SEQ ID NO：17或37的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含与SEQ ID NO：17的至少1200、至少1400、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

任选地，CFI核苷酸序列包含与SEQ ID NO：1-40中任一个的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含与SEQ ID NO：1-20中任一个的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含SEQ ID NO：1-20中任一个的核苷酸序列。

任选地，CFI核苷酸序列包含与SEQ ID NO：3-20和23-40中任一个的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含与SEQ ID NO：3-20中任一个的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含SEQ ID NO：3-20中任一个的核苷酸序列。

任选地，CFI核苷酸序列包含与SEQ ID NO：1、2、3、5、6、7、9-12、14-17、20、21、22、23、25、26、27、29-32、34-37和40中任一个的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含与SEQ ID NO：1、2、3、5、6、7、9-12、14-17和20中任一个的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含SEQ ID NO：1、2、3、5、6、7、9-12、14-17和20中任一个的核苷酸序列。

任选地，CFI核苷酸序列包含与SEQ ID NO：2、3、5、6、7、9-12、14-17、20、22、23、25、26、27、29-32、34-37和40中任一个的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含与SEQID NO：2、3、5、6、7、9-12、14-17和20中任一个的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含SEQ ID NO：2、3、5、6、7、9-12、14-17和20中任一个的核苷酸序列。

任选地，CFI核苷酸序列包含与SEQ ID NO：1、5、7、10-14、16、17、21、25、27、30-34、36和37中任一个的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含与SEQ ID NO：1、5、7、10-14、16和17中任一个的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含SEQ ID NO：1、5、7、10-14、16和17中任一个的核苷酸序列。

任选地，CFI核苷酸序列包含与SEQ ID NO：1、5、7、11-14、16、17、21、25、27、31-34、36和37中任一个的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含与SEQ ID NO：1、5、7、11-14、16和17中任一个的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含SEQ ID NO：1、5、7、11-14、16和17中任一个的核苷酸序列。

任选地，CFI核苷酸序列包含与SEQ ID NO：1、5、7、11、12、14、16、17、21、25、27、31、32、34、36和37中任一个的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含与SEQ ID NO：1、5、7、11、12、14、16和17中任一个的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含SEQ IDNO：1、5、7、11、12、14、16和17中任一个的核苷酸序列。

任选地，CFI核苷酸序列包含与SEQ ID NO：5、7、12-14、16、17、25、27、32-34、36和37中任一个的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含与SEQ ID NO：5、7、12-14、16和17中任一个的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含SEQ ID NO：5、7、12-14、16和17中任一个的核苷酸序列。

任选地，CFI核苷酸序列包含与SEQ ID NO：5、7、12、14、16、17、25、27、32、34、36和37中任一个的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含与SEQ ID NO：5、7、12、14、16和17中任一个的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含SEQ ID NO：5、7、12、14、16和17中任一个的核苷酸序列。

任选地，CFI核苷酸序列包含与SEQ ID NO：5、7、14、25、27和34中任一个的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含与SEQ ID NO：5、7和14中任一个的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含SEQ ID NO：5、7和14中任一个的核苷酸序列。

任选地，CFI核苷酸序列包含与SEQ ID NO：3、5-7、10、14、17、20、23、25-27、30、34、37和40中任一个的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含与SEQ ID NO：3、5-7、10、14、17和20中任一个的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。任选地，CFI核苷酸序列包含SEQ ID NO：3、5-7、10、14、17和20中任一个的核苷酸序列。

任选地，CFI核苷酸序列包含与SEQ ID NO：5、10、17、25、30和37中任一个的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含与SEQ ID NO：5、10和17中任一个的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含SEQ ID NO：5、10和17中任一个的核苷酸序列。

任选地，CFI核苷酸序列包含与SEQ ID NO：5或25的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含与SEQ ID NO：5的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含SEQ ID NO：5的核苷酸序列。

任选地，CFI核苷酸序列包含与SEQ ID NO：7或27的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含与SEQ ID NO：7的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含SEQ ID NO：7的核苷酸序列。

任选地，CFI核苷酸序列包含与SEQ ID NO：10或30的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含与SEQ ID NO：10的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含SEQ ID NO：10的核苷酸序列。

任选地，CFI核苷酸序列包含与SEQ ID NO：14或34的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含与SEQ ID NO：14的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含SEQ ID NO：14的核苷酸序列。

任选地，CFI核苷酸序列包含与SEQ ID NO：17或37的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含与SEQ ID NO：17的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含SEQ ID NO：17的核苷酸序列。

任选地，CFI核苷酸序列包含与SEQ ID NO：1或21的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含与SEQ ID NO：1的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，CFI核苷酸序列包含SEQ ID NO：1的核苷酸序列。

本发明的多核苷酸包含CFI核苷酸序列并且CFI核苷酸序列编码CFI多肽或其片段。术语“编码的序列”或“序列编码”是指包含开放阅读框的核苷酸序列，该开放阅读框包含编码所编码的多肽的密码子。例如，编码CFI多肽或其片段的核苷酸序列包含编码CFI多肽或其片段的氨基酸序列的密码子。编码野生型CFI多肽的CFI核苷酸序列的实例在SEQ IDNO：41或42中提供。

编码多肽的密码子也称为“编码核苷酸”。CFI核苷酸序列可以被非编码核苷酸(例如内含子)打断，但只有编码多肽的核苷酸(即编码核苷酸)才应该被认为是CFI核苷酸序列的一部分。例如，编码CFI多肽的CFI核苷酸序列将包含编码形成CFI多肽的一部分的氨基酸的任何密码子(即编码核苷酸)，无论这些密码子是在序列上连续的还是被一个或多个非编码核苷酸隔开。换言之，包含被一段非编码核苷酸打断的编码核苷酸区段的多核苷酸将被认为包含“CFI核苷酸序列”，其由紧挨着并列的编码核苷酸的非连续区段组成(即减去非编码核苷酸)。然而，在本文中，终止密码子的核苷酸将被认为是编码核苷酸。

编码CFI多肽或其片段的CFI核苷酸序列还可包含编码信号肽的序列。众所周知，一些蛋白质，特别是输出到不同组织的蛋白质，被表达为具有信号肽。信号肽可以位于蛋白质序列的N端(例如编码序列的5'端)，并且许多信号肽在细胞加工后被裂解。因此，在本文中，成熟蛋白质或多肽(例如成熟CFI蛋白质或多肽)将被认为是在信号肽已经被加工和去除/裂解(因此不再形成多肽序列的一部分)之后得到的蛋白质或多肽。

下表描述了编码每个氨基酸的密码子：

/>

相应的RNA密码子将包含U以代替上表中的T。

CFI多肽是由重链和轻链组成的糖蛋白异源二聚体。CFI在C3分解循环中发挥作用。CFI可以通过使C3b失活和降解iC3b来调节补体活化。CFI可以催化C3b裂解为iC3b(也称为“C3b-失活”活性)。CFI可以将iC3b分解为C3d,g(也称为“iC3b-降解”活性)。典型的野生型CFI多肽由SEQ ID NO：41或42编码。

通常，CFI多肽最初表达为前体“未成熟”形式(例如由SEQ ID NO：41编码的SEQ IDNO：43的CFI)，包含信号肽(例如SEQ ID NO：43的氨基酸残基1至18和SEQ ID NO：41的密码子1至18)，以及成熟的CFI多肽区。加工后，CFI的“成熟”形式缺少信号肽。术语“成熟CFI”或“成熟CFI多肽”是指不包含信号肽的CFI多肽，例如由SEQ ID NO：1-20和42编码的CFI。典型的野生型CFI信号肽可以由SEQ ID NO：45的核苷酸序列编码并具有SEQ ID NO：46的多肽序列。

优选地，CFI多肽或其片段是有功能的。确定由CFI核苷酸序列编码的CFI多肽或其片段是否有功能在本领域技术人员的能力范围内。技术人员只需要表达CFI核苷酸序列，测试表达的多肽是否具有活性。例如，技术人员可以制备包含与可操作启动子连接的CFI核苷酸序列的本发明的病毒颗粒，并在适合表达CFI多肽或其片段的条件下用病毒颗粒转导细胞。如果CFI多肽或其片段具有至少20％的野生型CFI的CFI活性，则它是有功能的。优选地，CFI活性包括C3b-失活和/或iC3b-降解活性。

多肽是否具有C3b-失活活性可由本领域技术人员确定，例如通过使用基于凝胶的裂解测定。例如，待测试的多肽可以与辅因子H因子混合。然后可以添加痕量的¹²³I-标记的C3b并且孵育样品(例如在37℃下过夜)。然后可以通过添加还原(DDT)SDS PAGE样品缓冲液来终止反应。然后可以使样品变性(例如通过加热至95摄氏度持续5分钟)并在SDS-PAGE凝胶(例如10-15％梯度)上运行。然后可以干燥凝胶并使蛋白质可视化(例如通过使用PhosphorImager；Molecular Dynamics,Sunnyvale,CA)。然后可以分析α'-链的强度和C3b条带的43kDa片段(例如使用ImageGauge；Fujifilm)。条带可以通过光密度测定法进行量化。C3b(产物)的43kDa片段与α'-链(底物)的比率可用于指示多肽在失活C3b方面的活性。比率越大，活性越高。

多肽是否具有iC3b-降解活性可由本领域技术人员确定，例如通过使用ELISA测定，例如配对的ELISA测定。例如，待测试的多肽可与血清混合，然后与旁路补体途径的活化剂(例如酵母聚糖)混合。然后可以将混合物孵育一段时间(例如0、30、60、120、180、240和480分钟)以允许被测试的多肽使C3b失活并随后降解iC3b。可以在每个时间点收集样品(例如可以收集样品并微量离心以去除酵母聚糖)。iC3b的水平如何随时间变化可用于确定被测试的多肽的iC3b-降解活性。iC3b的水平可以通过对样品进行ELISA来确定。在这种ELISA中达到的OD水平将与样品中未降解的iC3b的量成比例。OD水平越高，样品中存在的iC3b越多。随着时间的推移，在前2小时内达到的最大OD可以作为旁路途径被活化的程度的量度。随着时间的推移(例如8小时)，最大OD到最低OD的百分比减少可以用作iC3b降解为C3c和C3dg的量度，因此可以用作iC3b-降解活性的量度。随着时间的推移最大OD到最低OD的减少百分比越高，iC3b-降解活性就越高。Lay等人Clinical and Experimental Immunology,181:314–3212中提到了可以使用的ELISA的实例。可以使用的ELISA的实例如下。

抗C3g抗体(如Lay等人Clinical and Experimental Immunology,181:314–3212中公开的抗体)可以与板结合(例如包被到微量滴定板)。可以将每个样品加载到板上并孵育(例如在室温下孵育1小时)。C3g的区域作为新抗原存在于iC3b和C3dg中，但未暴露于天然C3或C3b中。因此，抗C3g抗体(与新抗原结合)只会从每个样品中捕获iC3b或C3dg(不会捕获C3或C3b)。然后可以检测捕获的iC3b。可以通过洗涤板并与抗C3c抗体孵育(例如在室温下孵育1小时)来检测捕获的iC3b。抗C3c抗体将仅结合iC3b而不结合C3dg，因为C3c包含在iC3b内(即抗C3c抗体将结合iC3b)并在iC3b转化为C3dg时释放(即抗C3c抗体不结合C3dg)。因此，抗C3c抗体只能识别iC3b而不能识别C3dg。存在的抗C3c抗体水平将指示存在的未降解的iC3b的量。可以通过测量抗C3c抗体的量来测量与板上的iC3b结合的抗C3c抗体的水平。例如，抗C3c抗体可以是生物素化抗体，因此可以使用亲和素-过氧化物酶(例如extravidin-过氧化物酶，Sigma-Aldrich)进行检测，该酶可以结合生物素并催化底物如TMB(3,3',5,5'-四甲基联苯胺产生蓝色反应产物)。例如，可以洗涤板并进一步用亲和素-过氧化物酶孵育(例如在室温下孵育1小时)。进一步洗涤后，可以添加TMB(3,3',5,5'-四甲基联苯胺)。蓝色产物(OD)的水平可以通过450nm处的吸光度来检测。蓝色产物(OD)的水平与洗涤步骤后剩余的抗C3c抗体的量成比例，这与样品中未降解的iC3b的量成比例。OD水平越高，样品中存在的iC3b越多。

任选地，在上述ELISA测定中，辅因子CR1(或重组CR1功能蛋白片段，例如Mirococept)可以与血清和旁路补体途径的活化剂一起添加。

任选地，CFI多肽或其片段具有至少70％、至少80％、至少90％或至少100％的野生型CFI的CFI活性。优选地，CFI活性包括C3b-失活活性和/或iC3b-降解活性。任选地，CFI多肽或其片段具有至少70％、至少80％、至少90％或至少100％的野生型CFI的C3b-失活活性。任选地，CFI多肽或其片段具有至少70％、至少80％、至少90％或至少100％的野生型CFI的iC3b-降解活性。任选地，CFI多肽或其片段具有至少70％、至少80％、至少90％或至少100％的野生型CFI的C3b-失活活性，并且CFI多肽或其片段具有至少70％、至少80％、至少90％或至少100％的野生型CFI的iC3b-降解活性。

任选地，由CFI核苷酸序列编码的CFI多肽或其片段包含序列，其：(a)与SEQ IDNO：43或44至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同；(b)与SEQID NO：43或44的至少300、至少350、至少400、583或更少、565或更少、300至583或300至565个氨基酸长度的片段至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。

在一个实施方案中，CFI多肽或其片段与SEQ ID NO：44至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同；或与SEQ ID NO：44的约565个氨基酸长度的片段至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。任选地，CFI多肽或其片段不包含SEQ ID NO：46的信号肽。

CFI核苷酸序列可包含SEQ ID NO：1-20中任一个的序列或其编码CFI多肽的变体，所述CFI多肽包含与SEQ ID NO：44的野生型CFI氨基酸序列至少95％相同的序列。任选地，该变体是SEQ ID NO：5、7和14中任一个的变体。任选地，该变体是SEQ ID NO：5、10和17中任一个的变体。任选地，该变体编码具有CFI活性的CFI多肽。优选地，变体编码有功能的CFI多肽。任选地，该变体编码具有至少70％、至少80％、至少90％或至少100％的野生型CFI的CFI活性的CFI多肽。优选地，CFI活性包括C3b-失活活性和/或iC3b-降解活性。任选地，变体编码具有至少70％、至少80％、至少90％或至少100％的野生型CFI的C3b-失活活性的CFI多肽。任选地，该变体编码具有至少70％、至少80％、至少90％或至少100％的野生型CFI的iC3b-降解活性的CFI多肽。任选地，该变体编码具有至少70％、至少80％、至少90％或至少100％的野生型CFI的C3b-失活活性的CFI多肽，并且该变体编码具有至少70％、至少80％、至少90％或至少100％的野生型CFI的iC3b-降解活性的CFI多肽。

任选地，变体是SEQ ID NO：1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20中任一个的变体。在一些实施方案中，SEQ ID NO：1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20的变体分别与SEQ ID NO：1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20相同，除了其包含核苷酸取代以使得编码的CFI多肽相对于SEQ IDNO：44的野生型CFI氨基酸序列具有1个、2个或更少、3个或更少、4个或更少、5个或更少、6个或更少、7个或更少、8个或更少、9个或更少或10个或更少的氨基酸取代。在一些实施方案中，SEQ ID NO：1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20的变体分别相对于SEQ ID NO：1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20的序列具有1个、2个或更少、3个或更少、4个或更少、5个或更少、6个或更少、7个或更少、8个或更少、9个或更少、10个或更少、20个或更少或30个或更少的核苷酸取代。SEQ ID NO：1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20的变体分别相对于SEQ ID NO：1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20的序列可以具有1个、2个或更少、3个或更少、4个或更少、5个或更少或6个或更少的核苷酸取代。在一个实施方案中，SEQ ID NO：1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20的变体分别相对于SEQ ID NO：1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20的序列具有4个或更少的核苷酸取代，和/或编码相对于SEQ ID NO：44的野生型CFI氨基酸序列具有3个或更少的氨基酸取代的CFI多肽。在一个实施方案中，SEQ ID NO：1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20的变体分别相对于SEQ ID NO：1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20的序列具有3个或更少的核苷酸取代，和/或编码相对于SEQ ID NO：44的野生型CFI氨基酸序列具有2个或更少的氨基酸取代的CFI多肽。在一个实施方案中，SEQ ID NO：1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20的变体分别相对于SEQ ID NO：1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20的序列具有1个核苷酸取代，和/或编码相对于SEQ ID NO：44的野生型CFI氨基酸序列具有1个氨基酸取代的CFI多肽。在一个实施方案中，SEQ ID NO：1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20的变体编码相对于SEQ ID NO：44的野生型CFI氨基酸序列具有3个或更少的氨基酸取代的CFI多肽。在一个实施方案中，SEQ ID NO：1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20的变体编码相对于SEQ ID NO：44的野生型CFI氨基酸序列具有2个或更少的氨基酸取代的CFI多肽。在一个实施方案中，SEQ ID NO：1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20的变体编码相对于SEQ ID NO：44的野生型CFI氨基酸序列具有1个氨基酸取代的CFI多肽。

任选地，变体是SEQ ID NO：5的变体。在一些实施方案中，SEQ ID NO：5的变体与SEQ ID NO：5相同，除了它包含核苷酸取代以使得CFI多肽相对于SEQ ID NO：44的野生型CFI氨基酸序列具有1个、2个或更少、3个或更少、4个或更少、5个或更少、6个或更少、7个或更少、8个或更少、9个或更少或10个或更少的氨基酸取代。在一些实施方案中，SEQ ID NO：5的变体相对于SEQ ID NO：5的序列具有1个、2个或更少、3个或更少、4个或更少、5个或更少、6个或更少、7个或更少、8个或更少、9个或更少、10个或更少、20个或更少或30个或更少的核苷酸取代。SEQ ID NO：5的变体相对于SEQ ID NO：5的序列可以具有1个、2个或更少、3个或更少、4个或更少、5个或更少或6个或更少的核苷酸取代。在一个实施方案中，SEQ ID NO：5的变体相对于SEQ ID NO：5的序列具有4个或更少的核苷酸取代和/或编码相对于SEQ IDNO：44的野生型氨基酸CFI序列具有3个或更少的氨基酸取代的CFI多肽。在一个实施方案中，SEQ ID NO：5的变体相对于SEQ ID NO：5的序列具有3个或更少的核苷酸取代和/或编码相对于SEQ ID NO：44的野生型CFI氨基酸序列具有2个或更少的氨基酸取代的CFI多肽。在一个实施方案中，SEQ ID NO：5的变体相对于SEQ ID NO：5的序列具有1个核苷酸取代和/或编码相对于SEQ ID NO：44的野生型CFI氨基酸序列具有1个氨基酸取代的CFI多肽。在一个实施方案中，SEQ ID NO：5的变体编码相对于SEQ ID NO：44的野生型CFI氨基酸序列具有3个或更少的氨基酸取代的CFI多肽。在一个实施方案中，SEQ ID NO：5的变体编码相对于SEQID NO：44的野生型CFI氨基酸序列具有2个或更少的氨基酸取代的CFI多肽。在一个实施方案中，SEQ ID NO：5的变体编码相对于SEQ ID NO：44的野生型CFI氨基酸序列具有1个氨基酸取代的CFI多肽。

任选地，变体是SEQ ID NO：7的变体。在一些实施方案中，SEQ ID NO：7的变体与SEQ ID NO：7相同，除了它包含核苷酸取代以使得CFI多肽相对于SEQ ID NO：44的野生型CFI氨基酸序列具有1个、2个或更少、3个或更少、4个或更少、5个或更少、6个或更少、7个或更少、8个或更少、9个或更少或10个或更少的氨基酸取代。在一些实施方案中，SEQ ID NO：7的变体相对于SEQ ID NO：7的序列具有1个、2个或更少、3个或更少、4个或更少、5个或更少、6个或更少、7个或更少、8个或更少、9个或更少、10个或更少、20个或更少或30个或更少的核苷酸取代。SEQ ID NO：7的变体可以相对于SEQ ID NO：7的序列具有1个、2个或更少、3个或更少、4个或更少、5个或更少或6个或更少的核苷酸取代。在一个实施方案中，SEQ ID NO：7的变体相对于SEQ ID NO：7的序列具有4个或更少的核苷酸取代和/或编码相对于SEQ IDNO：44的野生型氨基酸CFI序列具有3个或更少的氨基酸取代的CFI多肽。在一个实施方案中，SEQ ID NO：7的变体相对于SEQ ID NO：7的序列具有3个或更少的核苷酸取代和/或编码相对于SEQ ID NO：44的野生型CFI氨基酸序列具有2个或更少的氨基酸取代的CFI多肽。在一个实施方案中，SEQ ID NO：7的变体相对于SEQ ID NO：7的序列具有1个核苷酸取代和/或编码相对于SEQ ID NO：44的野生型CFI氨基酸序列具有1个氨基酸取代的CFI多肽。在一个实施方案中，SEQ ID NO：7的变体编码相对于SEQ ID NO：44的野生型CFI氨基酸序列具有3个或更少的氨基酸取代的CFI多肽。在一个实施方案中，SEQ ID NO：7的变体编码相对于SEQID NO：44的野生型CFI氨基酸序列具有2个或更少的氨基酸取代的CFI多肽。在一个实施方案中，SEQ ID NO：7的变体编码相对于SEQ ID NO：44的野生型CFI氨基酸序列具有1个氨基酸取代的CFI多肽。

任选地，变体是SEQ ID NO：10的变体。在一些实施方案中，SEQ ID NO：10的变体与SEQ ID NO：10相同，除了它包含核苷酸取代以使得CFI多肽相对于SEQ ID NO：44的野生型CFI氨基酸序列具有1个、2个或更少、3个或更少、4个或更少、5个或更少、6个或更少、7个或更少、8个或更少、9个或更少或10个或更少的氨基酸取代。在一些实施方案中，SEQ ID NO：10的变体相对于SEQ ID NO：10的序列具有1个、2个或更少、3个或更少、4个或更少、5个或更少、6个或更少、7个或更少、8个或更少、9个或更少、10个或更少、20个或更少或30个或更少的核苷酸取代。SEQ ID NO：10的变体相对于SEQ ID NO：10的序列可以具有1个、2个或更少、3个或更少、4个或更少、5个或更少或6个或更少的核苷酸取代。在一个实施方案中，SEQ IDNO：10的变体相对于SEQ ID NO：10的序列具有4个或更少的核苷酸取代和/或编码相对于SEQ ID NO：44的野生型氨基酸CFI序列具有3个或更少的氨基酸取代的CFI多肽。在一个实施方案中，SEQ ID NO：10的变体相对于SEQ ID NO：10的序列具有3个或更少的核苷酸取代和/或编码相对于SEQ ID NO：44的野生型CFI氨基酸序列具有2个或更少的氨基酸取代的CFI多肽。在一个实施方案中，SEQ ID NO：10的变体相对于SEQ ID NO：10的序列具有1个核苷酸取代和/或编码相对于SEQ ID NO：44的野生型CFI氨基酸序列具有1个氨基酸取代的CFI多肽。在一个实施方案中，SEQ ID NO：10的变体编码相对于SEQ ID NO：44的野生型CFI氨基酸序列具有3个或更少的氨基酸取代的CFI多肽。在一个实施方案中，SEQ ID NO：10的变体编码相对于SEQ ID NO：44的野生型CFI氨基酸序列具有2个或更少的氨基酸取代的CFI多肽。在一个实施方案中，SEQ ID NO：10的变体编码相对于SEQ ID NO：44的野生型CFI氨基酸序列具有1个氨基酸取代的CFI多肽。

任选地，变体是SEQ ID NO：14的变体。在一些实施方案中，SEQ ID NO：14的变体与SEQ ID NO：14相同，除了它包含核苷酸取代以使得CFI多肽相对于SEQ ID NO：44的野生型CFI氨基酸序列具有1个、2个或更少、3个或更少、4个或更少、5个或更少、6个或更少、7个或更少、8个或更少、9个或更少或10个或更少的氨基酸取代。在一些实施方案中，SEQ ID NO：14的变体相对于SEQ ID NO：14的序列具有1个、2个或更少、3个或更少、4个或更少、5个或更少、6个或更少、7个或更少、8个或更少、9个或更少、10个或更少、20个或更少或30个或更少的核苷酸取代。SEQ ID NO：14的变体相对于SEQ ID NO：14的序列可以具有1个、2个或更少、3个或更少、4个或更少、5个或更少或6个或更少的核苷酸取代。在一个实施方案中，SEQ IDNO：14的变体相对于SEQ ID NO：14的序列具有4个或更少的核苷酸取代和/或编码相对于SEQ ID NO：44的野生型氨基酸CFI序列具有3个或更少的氨基酸取代的CFI多肽。在一个实施方案中，SEQ ID NO：14的变体相对于SEQ ID NO：14的序列具有3个或更少的核苷酸取代和/或编码相对于SEQ ID NO：44的野生型CFI氨基酸序列具有2个或更少的氨基酸取代的CFI多肽。在一个实施方案中，SEQ ID NO：14的变体相对于SEQ ID NO：14的序列具有1个核苷酸取代和/或编码相对于SEQ ID NO：44的野生型CFI氨基酸序列具有1个氨基酸取代的CFI多肽。在一个实施方案中，SEQ ID NO：14的变体编码相对于SEQ ID NO：44的野生型CFI氨基酸序列具有3个或更少的氨基酸取代的CFI多肽。在一个实施方案中，SEQ ID NO：14的变体编码相对于SEQ ID NO：44的野生型CFI氨基酸序列具有2个或更少的氨基酸取代的CFI多肽。在一个实施方案中，SEQ ID NO：14的变体编码相对于SEQ ID NO：44的野生型CFI氨基酸序列具有1个氨基酸取代的CFI多肽。

任选地，变体是SEQ ID NO：17的变体。在一些实施方案中，SEQ ID NO：17的变体与SEQ ID NO：17相同，除了它包含核苷酸取代以使得CFI多肽相对于SEQ ID NO：44的野生型CFI氨基酸序列具有1个、2个或更少、3个或更少、4个或更少、5个或更少、6个或更少、7个或更少、8个或更少、9个或更少或10个或更少的氨基酸取代。在一些实施方案中，SEQ ID NO：17的变体相对于SEQ ID NO：17的序列具有1个、2个或更少、3个或更少、4个或更少、5个或更少、6个或更少、7个或更少、8个或更少、9个或更少、10个或更少、20个或更少或30个或更少的核苷酸取代。SEQ ID NO：17的变体相对于SEQ ID NO：17的序列可以具有1个、2个或更少、3个或更少、4个或更少、5个或更少或6个或更少的核苷酸取代。在一个实施方案中，SEQ IDNO：17的变体相对于SEQ ID NO：17的序列具有4个或更少的核苷酸取代和/或编码相对于SEQ ID NO：44的野生型氨基酸CFI序列具有3个或更少的氨基酸取代的CFI多肽。在一个实施方案中，SEQ ID NO：17的变体相对于SEQ ID NO：17的序列具有3个或更少的核苷酸取代和/或编码相对于SEQ ID NO：44的野生型CFI氨基酸序列具有2个或更少的氨基酸取代的CFI多肽。在一个实施方案中，SEQ ID NO：17的变体相对于SEQ ID NO：17的序列具有1个核苷酸取代和/或编码相对于SEQ ID NO：44的野生型CFI氨基酸序列具有1个氨基酸取代的CFI多肽。在一个实施方案中，SEQ ID NO：17的变体编码相对于SEQ ID NO：44的野生型CFI氨基酸序列具有3个或更少的氨基酸取代的CFI多肽。在一个实施方案中，SEQ ID NO：17的变体编码相对于SEQ ID NO：44的野生型CFI氨基酸序列具有2个或更少的氨基酸取代的CFI多肽。在一个实施方案中，SEQ ID NO：17的变体编码相对于SEQ ID NO：44的野生型CFI氨基酸序列具有1个氨基酸取代的CFI多肽。

CFI核苷酸序列可以编码相对于SEQ ID NO：44的野生型CFI氨基酸序列具有1个、2个或更少、3个或更少、4个或更少或5个或更少的氨基酸取代的CFI多肽。CFI核苷酸序列可编码相对于SEQ ID NO：44的野生型CFI氨基酸序列具有3个或更少的氨基酸取代的CFI多肽。CFI核苷酸序列可编码相对于SEQ ID NO：44的野生型CFI氨基酸序列具有2个或更少的氨基酸取代的CFI多肽。CFI核苷酸序列可以编码相对于SEQ ID NO：44的野生型CFI氨基酸序列具有1个氨基酸取代的CFI多肽。

术语“核苷酸取代”意指用不同的核苷酸取代核苷酸序列中的一个核苷酸。术语“氨基酸取代”意指用不同的氨基酸取代氨基酸序列中的一个氨基酸。

在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：1-40中任一个的至少1500个核苷酸的片段至少98％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ IDNO：1-40中任一个的至少1500个核苷酸的片段至少99％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：1-40中任一个的核苷酸序列至少98％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：1-40中任一个的核苷酸序列至少99％相同的序列。在一个实施方案中，CFI核苷酸序列包含SEQ ID NO：1-40中任一个的核苷酸序列。

在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：3-20和23-40中任一个的至少1500个核苷酸的片段至少98％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：3-20和23-40中任一个的至少1500个核苷酸的片段至少99％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：3-20和23-40中任一个的核苷酸序列至少98％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：3-20和23-40中任一个的核苷酸序列至少99％相同的序列。在一个实施方案中，CFI核苷酸序列包含SEQ IDNO：3-20和23-40中任一个的序列。

在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：1、2、3、5、6、7、9-12、14-17、20、21、22、23、25、26、27、29-32、34-37和40中任一个的至少1500个核苷酸的片段至少98％相同的序列。在一个实施方案中，CFI核苷酸序列包含与与SEQ ID NO：1、2、3、5、6、7、9-12、14-17、20、21、22、23、25、26、27、29-32、34-37和40中任一个的至少1500个核苷酸的片段至少99％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：1、2、3、5、6、7、9-12、14-17、20、21、22、23、25、26、27、29-32、34-37和40中任一个的核苷酸序列至少98％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：1、2、3、5、6、7、9-12、14-17、20、21、22、23、25、26、27、29-32、34-37和40中任一个的核苷酸序列至少99％相同的序列。在一个实施方案中，CFI核苷酸序列包含SEQ ID NO：1、2、3、5、6、7、9-12、14-17、20、21、22、23、25、26、27、29-32、34-37和40中任一个的序列。

在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：2、3、5、6、7、9-12、14-17、20、22、23、25、26、27、29-32、34-37和40中任一个的至少1500个核苷酸的片段至少98％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：2、3、5、6、7、9-12、14-17、20、22、23、25、26、27、29-32、34-37和40中任一个的至少1500个核苷酸的片段至少99％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：2、3、5、6、7、9-12、14-17、20、22、23、25、26、27、29-32、34-37和40中任一个的核苷酸序列至少98％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：2、3、5、6、7、9-12、14-17、20、22、23、25、26、27、29-32、34-37和40中任一个的核苷酸序列至少99％相同的序列。在一个实施方案中，CFI核苷酸序列包含SEQ ID NO：2、3、5、6、7、9-12、14-17、20、22、23、25、26、27、29-32、34-37和40中任一个的序列。

在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：1、5、7、10-14、16、17、21、25、27、30-34、36和37中任一个的至少1500个核苷酸的片段至少98％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：1、5、7、10-14、16、17、21、25、27、30-34、36和37中任一个的至少1500个核苷酸的片段至少99％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：1、5、7、10-14、16、17、21、25、27、30-34、36和37中任一个的核苷酸序列至少98％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：1、5、7、10-14、16、17、21、25、27、30-34、36和37中任一个的核苷酸序列至少99％相同的序列。在一个实施方案中，CFI核苷酸序列包含SEQ ID NO：1、5、7、10-14、16、17、21、25、27、30-34、36和37中任一个的序列。

在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：1、5、7、11-14、16、17、21、25、27、31-34、36和37中任一个的至少1500个核苷酸的片段至少98％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：1、5、7、11-14、16、17、21、25、27、31-34、36和37中任一个的至少1500个核苷酸的片段至少99％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：1、5、7、11-14、16、17、21、25、27、31-34、36和37中任一个的核苷酸序列至少98％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：1、5、7、11-14、16、17、21、25、27、31-34、36和37中任一个的核苷酸序列至少99％相同的序列。在一个实施方案中，CFI核苷酸序列包含SEQ ID NO：1、5、7、11-14、16、17、21、25、27、31-34、36和37中任一个的序列。

在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：1、5、7、11、12、14、16、17、21、25、27、31、32、34、36和37中任一个的至少1500个核苷酸的片段至少98％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：1、5、7、11、12、14、16、17、21、25、27、31、32、34、36和37中任一个的至少1500个核苷酸的片段至少99％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：1、5、7、11、12、14、16、17、21、25、27、31、32、34、36和37中任一个的核苷酸序列至少98％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：1、5、7、11、12、14、16、17、21、25、27、31、32、34、36和37中任一个的核苷酸序列至少99％相同的序列。在一个实施方案中，CFI核苷酸序列包含SEQ ID NO：1、5、7、11、12、14、16、17、21、25、27、31、32、34、36和37中任一个的序列。

在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：5、7、12-14、16、17、25、27、32-34、36和37中任一个的至少1500个核苷酸的片段至少98％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：5、7、12-14、16、17、25、27、32-34、36和37中任一个的至少1500个核苷酸的片段至少99％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：5、7、12-14、16、17、25、27、32-34、36和37中任一个的核苷酸序列至少98％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：5、7、12-14、16、17、25、27、32-34、36和37中任一个的核苷酸序列至少99％相同的序列。在一个实施方案中，CFI核苷酸序列包含SEQ ID NO：5、7、12-14、16、17、25、27、32-34、36和37中任一个的序列。

在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：5、7、12、14、16、17、25、27、32、34、36和37中任一个的至少1500个核苷酸的片段至少98％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：5、7、12、14、16、17、25、27、32、34、36和37中任一个的至少1500个核苷酸的片段至少99％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：5、7、12、14、16、17、25、27、32、34、36和37中任一个的核苷酸序列至少98％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：5、7、12、14、16、17、25、27、32、34、36和37中任一个的核苷酸序列至少99％相同的序列。在一个实施方案中，CFI核苷酸序列包含SEQ ID NO：5、7、12、14、16、17、25、27、32、34、36和37中任一个的序列。

在一个实施方案中，CFI核苷酸序列包含SEQ ID NO：5、7、12、14、16、17、25、27、32-34、36和37中任一个的序列。

在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：5、7、14、25、27和34中任一个的至少1500个核苷酸的片段至少98％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：5、7、14、25、27和34中任一个的至少1500个核苷酸的片段至少99％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：5、7、14、25、27和34中任一个的核苷酸序列至少98％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：5、7、14、25、27和34中任一个的核苷酸序列至少99％相同的序列。在一个实施方案中，CFI核苷酸序列包含SEQ ID NO：5、7、14、25、27和34中任一个的序列。

在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：3、5-7、10、14、17、20、23、25-27、30、34、37和40中任一个的至少1500个核苷酸的片段至少98％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：3、5-7、10、14、17、20、23、25-27、30、34、37和40中任一个的至少1500个核苷酸的片段至少99％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：3、5-7、10、14、17、20、23、25-27、30、34、37和40中任一个的核苷酸序列至少98％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：3、5-7、10、14、17、20、23、25-27、30、34、37和40中任一个的核苷酸序列至少99％相同的序列。在一个实施方案中，CFI核苷酸序列包含SEQ ID NO：3、5-7、10、14、17、20、23、25-27、30、34、37和40中任一个的序列。

在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：5、10、17、25、30和37中任一个的至少1500个核苷酸的片段至少98％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：5、10、17、25、30和37中任一个的至少1500个核苷酸的片段至少99％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：5、10、17、25、30和37中任一个的核苷酸序列至少98％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：5、10、17、25、30和37中任一个的核苷酸序列至少99％相同的序列。在一个实施方案中，CFI核苷酸序列包含SEQ ID NO：5、10、17、25、30和37中任一个的序列。

在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：5或25的至少1500个核苷酸的片段至少98％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：5或25的至少1500个核苷酸的片段至少99％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：5或25的核苷酸序列至少98％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：5或25的核苷酸序列至少99％相同的序列。在一个实施方案中，CFI核苷酸序列包含SEQ ID NO：5或25的序列。

在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：7或27的至少1500个核苷酸的片段至少98％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：7或27的至少1500个核苷酸的片段至少99％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：7或27的核苷酸序列至少98％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：7或27的核苷酸序列至少99％相同的序列。在一个实施方案中，CFI核苷酸序列包含SEQ ID NO：7或27的序列。

在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：10或30的至少1500个核苷酸的片段至少98％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：10或30的至少1500个核苷酸的片段至少99％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：10或30的核苷酸序列至少98％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：10或30的核苷酸序列至少99％相同的序列。在一个实施方案中，CFI核苷酸序列包含SEQ ID NO：10或30的序列。

在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：14或34的至少1500个核苷酸的片段至少98％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：14或34的至少1500个核苷酸的片段至少99％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：14或34的核苷酸序列至少98％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：14或34的核苷酸序列至少99％相同的序列。在一个实施方案中，CFI核苷酸序列包含SEQ ID NO：14或34的序列。

在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：17或37的至少1500个核苷酸的片段至少98％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：17或37的至少1500个核苷酸的片段至少99％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：17或37的核苷酸序列至少98％相同的序列。在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：17或37的核苷酸序列至少99％相同的序列。在一个实施方案中，CFI核苷酸序列包含SEQ ID NO：17或37的序列。

任选地，CFI核苷酸序列的至少一部分(例如编码CFI多肽或其片段的编码序列)不是野生型的。编码野生型CFI的CFI核苷酸序列由SEQ ID NO：41或42表示，包含序列不同于SEQ ID NO：41或42的部分的CFI核苷酸序列包含不是野生型的部分。

CFI核苷酸序列或不是野生型的CFI核苷酸序列部分可以是密码子优化的。本发明的多核苷酸可包含未经密码子优化的部分。例如，CFI核苷酸序列可包含未经密码子优化的部分。

在一个实施方案中，非野生型的CFI核苷酸序列部分是密码子优化的。任选地，所有或部分CFI核苷酸序列是密码子优化的。密码子优化可以改善特定组织和/或特定生物体中核苷酸序列(例如CFI核苷酸序列)的表达。例如，如果核苷酸序列针对在人肝脏中的表达进行了密码子优化，则可以修饰核苷酸序列以增加可能在人肝脏中有利的密码子的数量(在此类密码子对应于比对相同氨基酸特异的其他tRNA种类更丰富的tRNA种类的意义上)。作为进一步的例子，如果核苷酸序列针对在人肝细胞中的表达进行了密码子优化，则可以修饰核苷酸序列以增加可能在人肝细胞中有利的密码子的数量(在此类密码子对应于比对相同氨基酸特异的其他tRNA种类更丰富的tRNA种类的意义上)。技术人员会理解，密码子优化序列可能不需要改变每个密码子，尤其是因为“偏好密码子”可能已经存在于某些位置。

此类密码子优化可能会受到其他因素的影响。例如，可能不在将CpG引入序列的位置处引入偏好密码子；这仍将被视为是密码子优化的。在一个实施方案中，以C核苷酸结尾的偏好密码子将不包括在密码子优化的编码序列部分中，其中序列中的下一个密码子以G开始。例如，密码子GCC编码丙氨酸。任选地，当GCC是偏好密码子时，它不应该用于编码丙氨酸，其中序列中的下一个密码子以G开头，例如密码子GAC(或可选择地，下一个密码子(如果可能)可以被选择以避免在第一个位置处的G)。

直接确定在核苷酸序列的一部分中使用的每个密码子的频率。技术人员只需要将该部分的序列输入到查看密码子使用和检查结果的现成算法之一。可选择地，用户可以简单地计算它们。

在一个实施方案中，偏好密码子可选自：GCT、GCC、TGC、GAC、GAG、TTC、GGA、GGC、CAC、ATC、AAG、CTG、AAT、AAC、CCT、CCC、CAG、AGG、AGA、AGT、AGC、ACC、GTG和TAC。在一些实施方案中，至少一个氨基酸不具有偏好密码子。

在一个实施方案中，在密码子优化的CFI核苷酸序列或CFI核苷酸序列部分中，至少70％、至少75％、至少76％、至少77％、至少78％、至少79％、至少80％或至少81％、至少82％、至少83％或至少84％的密码子可选自：GCT、GCC、TGC、GAC、GAG、TTC、GGA、GGC、CAC、ATC、AAG、CTG、AAT、AAC、CCT、CCC、CAG、AGG、AGA、AGT、AGC、ACC、GTG和TAC。在一个实施方案中，在密码子优化的CFI核苷酸序列或CFI核苷酸序列部分中，至少80％、至少81％、至少82％、至少83％或至少84％的密码子可选自：GCT、GCC、TGC、GAC、GAG、TTC、GGA、GGC、CAC、ATC、AAG、CTG、AAT、AAC、CCT、CCC、CAG、AGG、AGA、AGT，AGC、ACC、GTG和TAC。在一个实施方案中，在密码子优化的CFI核苷酸序列或CFI核苷酸序列部分中，至少83％或至少84％的密码子可选自：GCT、GCC、TGC、GAC、GAG、TTC、GGA、GGC、CAC、ATC、AAG、CTG、AAT、AAC、CCT、CCC、CAG、AGG、AGA、AGT、AGC、ACC、GTG和TAC。

在一个实施方案中，在密码子优化的CFI核苷酸序列或CFI核苷酸序列部分中，至少75％、至少76％、至少77％、至少78％、至少79％、至少80％或至少81％的密码子可选自：GCT、GCC、TGC、GAC、GAG、TTC、GGA、GGC、CAC、ATC、AAG、CTG、AAT、AAC、CCT，CCC、CAG、AGG、AGA、AGT、AGC、ACC、GTG和TAC。在一个实施方案中，在密码子优化的CFI核苷酸序列或CFI核苷酸序列部分中，至少76％、至少77％、至少78％、至少79％、至少80％或至少81％的密码子可选自：GCT、GCC、TGC、GAC、GAG、TTC、GGA、GGC、CAC、ATC、AAG、CTG、AAT、AAC、CCT、CCC、CAG、AGG、AGA、AGT、AGC、ACC、GTG和TAC。在一个实施方案中，在密码子优化的CFI核苷酸序列或CFI核苷酸序列部分中，至少80％或至少81％的密码子可选自：GCT、GCC、TGC、GAC、GAG、TTC、GGA、GGC、CAC、ATC、AAG、CTG、AAT、AAC、CCT、CCC、CAG、AGG、AGA、AGT、AGC、ACC、GTG和TAC。

任选地，密码子优化的CFI核苷酸序列部分针对在人肝细胞中的表达进行了密码子优化。任选地，密码子优化的CFI核苷酸序列部分是连续部分。任选地，CFI核苷酸序列针对在人肝细胞中的表达进行了密码子优化。任选地，如果CFI核苷酸序列与由参考CFI核苷酸序列编码的CFI多肽的表达相比以更高的水平在人肝细胞中表达CFI多肽或其片段，则CFI核苷酸序列或其部分针对在人肝细胞中的表达进行了密码子优化。任选地，如果CFI核苷酸序列在转染包含CFI核苷酸序列的多核苷酸时与用包含参考CFI核苷酸序列的等效多核苷酸转染时由参考CFI核苷酸序列编码的CFI多肽的表达相比以更高水平在人肝细胞中表达CFI多肽或其片段，则CFI核苷酸序列或其部分针对在人肝细胞中的表达进行了密码子优化。在这样的实施方案中，参考CFI核苷酸序列可以是野生型CFI核苷酸序列。野生型CFI核苷酸可以是SEQ ID NO：41或42的序列。包含参考CFI核苷酸的“等效”多核苷酸是与本发明的多核苷酸相同(即包含相同的转录调节元件等)的多核苷酸，除了CFI核苷酸序列是不同的。例如，被比较的不同CFI核苷酸序列可操作地连接到相同的启动子序列。任选地，人肝细胞是Huh-7细胞。

密码子优化的部分可对应于编码部分或全部CFI多肽或其片段的序列。任选地，密码子优化的CFI核苷酸序列部分的长度为至少1000、至少1200、至少1300、至少1400、至少1500、至少1600、至少1700、1752或更少、1300至1752、1500至1752、1600至1752或约1752个核苷酸。任选地，密码子优化的CFI核苷酸序列部分的长度为至少1000、至少1200、至少1300、至少1400、至少1500、1698或更少、1300至1698、1500至1698或约1698个核苷酸。例如，编码序列可以编码全长CFI多肽(例如SEQ ID NO：43)，包括不是成熟CFI多肽的一部分的信号肽，并且整个编码序列可以是密码子优化的。任选地，密码子优化的CFI核苷酸序列部分编码成熟的CFI多肽。在一些实施方案中，密码子优化的CFI核苷酸序列部分不编码全部或部分信号肽。例如，CFI核苷酸序列可以编码未成熟的CFI多肽(即包括信号肽)，并且密码子优化的CFI核苷酸序列部分编码成熟的CFI蛋白并且不编码全部或部分信号肽。在一些实施方案中，密码子优化的CFI核苷酸序列部分编码全部或部分信号肽。例如，CFI核苷酸序列可以编码未成熟的CFI多肽(即包括信号肽)，并且密码子优化的CFI核苷酸序列部分编码成熟的CFI蛋白和全部或部分信号肽。在一些实施方案中，编码整个成熟CFI多肽序列的CFI核苷酸序列是密码子优化的。

基因治疗载体中CpG(即CG二核苷酸)的存在可能对治疗性转基因的表达(例如所述表达的持久性)具有不利影响。这是因为CpG可能被甲基化，并且它们的甲基化可能导致基因沉默，从而降低表达。此外，可能的是高CpG含量可能触发TLR反应，从而增加抗AAV免疫反应的风险。与参考CFI核苷酸序列的相应部分相比，密码子优化的CFI核苷酸序列或CFI核苷酸序列部分可以包含减少数量的CpG。在此类实施方案中，参考CFI核苷酸序列可以是野生型CFI核苷酸序列或SEQ ID NO：1或21的核苷酸序列。参考CFI核苷酸序列可以是野生型CFI核苷酸序列。野生型CFI核苷酸可以是SEQ ID NO：41或42的序列。参考CFI核苷酸序列可以是SEQ ID NO：1或21的核苷酸序列。短语“参考CFI核苷酸序列的相应部分”意指“对应于”密码子优化的CFI核苷酸序列或CFI核苷酸序列部分的参考CFI核苷酸序列部分。确定“对应于”密码子优化的CFI核苷酸序列或CFI核苷酸序列部分的参考CFI核苷酸序列部分在本领域技术人员的能力范围内。例如，本领域技术人员仅需要使用合适的比对算法(例如上述Needleman和Wunsch的算法)将参考CFI核苷酸序列与本发明的CFI核苷酸序列进行序列比对，并确定参考CFI核苷酸序列的哪个区域与密码子优化的CFI核苷酸序列或CFI核苷酸序列部分比对。

在一个实施方案中，密码子优化的CFI核苷酸序列或CFI核苷酸序列部分(其可以是全部CFI核苷酸序列)包含40个或更少、20个或更少、15个或更少、10个或更少或5个或更少的CpG。在一个实施方案中，密码子优化的CFI核苷酸序列或CFI核苷酸序列部分(其可以是全部CFI核苷酸序列)每100个核苷酸包含5个或更少、4个或更少、3个或更少或2个或更少的CpG。在一些实施方案中，密码子优化的CFI核苷酸序列或CFI核苷酸序列部分不含CpG，即不含(0个)CG二核苷酸。

在一个实施方案中，密码子优化的CFI核苷酸序列部分与SEQ ID NO：1-20中任一个的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。在一个实施方案中，密码子优化的CFI核苷酸序列部分与SEQ ID NO：1、2、3、5、6、7、9-12、14-17和20中任一个的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。在一个实施方案中，密码子优化的CFI核苷酸序列部分与SEQ ID NO：2、3、5、6、7、9-12、14-17和20中任一个的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。在一个实施方案中，密码子优化的CFI核苷酸序列部分与SEQ ID NO：1、5、7、10-14、16和17中任一个的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。在一个实施方案中，密码子优化的CFI核苷酸序列部分与SEQ ID NO：1、5、7、11-14、16和17中任一个的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。在一个实施方案中，密码子优化的CFI核苷酸序列部分与SEQ ID NO：1、5、7、11、12、14、16和17中任一个的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。在一个实施方案中，密码子优化的CFI核苷酸序列部分与SEQ ID NO：5、7、12-14、16和17中任一个的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。在一个实施方案中，密码子优化的CFI核苷酸序列部分与SEQ IDNO：5、7、12、14、16和17中任一个的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。在一个实施方案中，密码子优化的CFI核苷酸序列部分与SEQ ID NO：5、7和14中任一个的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。

在一个实施方案中，密码子优化的CFI核苷酸序列部分与SEQ ID NO：3、5-7、10、14、17和20中任一个的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。在一个实施方案中，密码子优化的CFI核苷酸序列部分与SEQ ID NO：5、10和17中任一个的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。

在一个实施方案中，密码子优化的CFI核苷酸序列部分与SEQ ID NO：1-20至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。在一个实施方案中，密码子优化的CFI核苷酸序列部分与SEQ ID NO：1、2、3、5、6、7、9-12、14-17和20中的任一个至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。在一个实施方案中，密码子优化的CFI核苷酸序列部分与SEQ ID NO：2、3、5、6、7、9-12、14-17和20中的任一个至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。在一个实施方案中，密码子优化的CFI核苷酸序列部分SEQ ID NO：1、5、7、10-14、16和17中的任一个至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。在一个实施方案中，密码子优化的CFI核苷酸序列部分与SEQ ID NO：1、5、7、11-14、16和17中的任一个至少80％、至少85％、至少90％、至少95％，至少98％、至少99％、至少99.5％、至少99.8％或100％相同。在一个实施方案中，密码子优化的CFI核苷酸序列部分与SEQ ID NO：1、5、7、11、12、14、16和17中的任一个至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。在一个实施方案中，密码子优化的CFI核苷酸序列部分SEQ ID NO：5、7、12-14、16和17中的任一个至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。在一个实施方案中，密码子优化的CFI核苷酸序列部分与SEQ ID NO：5、7、12、14、16和17中的任一个至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。在一个实施方案中，密码子优化的CFI核苷酸序列部分与SEQ ID NO：5、7和14中的任一个至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。

在一个实施方案中，密码子优化的CFI核苷酸序列部分与SEQ ID NO：3、5-7、10、14、17和20中的任一个至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。在一个实施方案中，密码子优化的CFI核苷酸序列部分与SEQ ID NO：5、10和17中的任一个至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。

在一个实施方案中，密码子优化的CFI核苷酸序列部分与SEQ ID NO：5的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。在一个实施方案中，密码子优化的CFI核苷酸序列部分与SEQ IDNO：5至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。在一个实施方案中，密码子优化的CFI核苷酸序列部分与SEQ ID NO：5的至少1500个核苷酸的片段至少99.5％、至少99.8％或100％相同。在一个实施方案中，密码子优化的CFI核苷酸序列部分与SEQ ID NO：5至少99％、至少99.5％、至少99.8％或100％相同。

在一个实施方案中，密码子优化的CFI核苷酸序列部分与SEQ ID NO：7的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。在一个实施方案中，密码子优化的CFI核苷酸序列部分与SEQ IDNO：7至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。在一个实施方案中，密码子优化的CFI核苷酸序列部分与SEQ ID NO：7的至少1500个核苷酸的片段至少99.5％、至少99.8％或100％相同。在一个实施方案中，密码子优化的CFI核苷酸序列部分与SEQ ID NO：7至少99％、至少99.5％、至少99.8％或100％相同。

在一个实施方案中，密码子优化的CFI核苷酸序列部分与SEQ ID NO：10的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。在一个实施方案中，密码子优化的CFI核苷酸序列部分与SEQ IDNO：10至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。在一个实施方案中，密码子优化的CFI核苷酸序列部分与SEQ ID NO：10的至少1500个核苷酸的片段至少99.5％、至少99.8％或100％相同。在一个实施方案中，密码子优化的CFI核苷酸序列部分与SEQ ID NO：10至少99％、至少99.5％、至少99.8％或100％相同。

在一个实施方案中，密码子优化的CFI核苷酸序列部分与SEQ ID NO：14的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。在一个实施方案中，密码子优化的CFI核苷酸序列部分与SEQ IDNO：14至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。在一个实施方案中，密码子优化的CFI核苷酸序列部分与SEQ ID NO：14的至少1500个核苷酸的片段至少99.5％、至少99.8％或100％相同。在一个实施方案中，密码子优化的CFI核苷酸序列部分与SEQ ID NO：14至少99％、至少99.5％、至少99.8％或100％相同。

在一个实施方案中，密码子优化的CFI核苷酸序列部分与SEQ ID NO：17的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。在一个实施方案中，密码子优化的CFI核苷酸序列部分与SEQ IDNO：17至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。在一个实施方案中，密码子优化的CFI核苷酸序列部分与SEQ ID NO：17的至少1500个核苷酸的片段至少99.5％、至少99.8％或100％相同。在一个实施方案中，密码子优化的CFI核苷酸序列部分与SEQ ID NO：17至少99％、至少99.5％、至少99.8％或100％相同。

与由参考CFI核苷酸序列编码的CFI多肽的表达相比，由CFI核苷酸序列编码的CFI多肽或其片段可以在人肝细胞中以相同或更高的水平表达。任选地，与在用包含参考CFI核苷酸序列的等效多核苷酸转染由参考CFI核苷酸序列编码的CFI多肽的表达相比，在将包含CFI核苷酸序列的多核苷酸转染到人肝细胞中时由CFI核苷酸序列编码的CFI多肽或其片段以相同或更高的水平表达。任选地，人肝细胞是Huh-7细胞。包含参考CFI核苷酸的“等效”多核苷酸是与本发明的多核苷酸相同(即包含相同的转录调节元件等)的多核苷酸，除了CFI核苷酸序列是不同的。例如，被比较的不同CFI核苷酸序列可操作地连接到相同的启动子序列。在由CFI核苷酸序列编码的CFI核苷酸序列编码的CFI多肽或其片段的表达与由参考CFI核苷酸序列编码的CFI多肽的表达相比处于相同水平的实施方案中，参考CFI核苷酸序列可以是SEQ ID NO：1、21、5或25中任一个的核苷酸序列。参考CFI核苷酸序列可以是SEQ IDNO：1或21的核苷酸序列。参考CFI核苷酸序列可以是SEQ ID NO：5或25的核苷酸序列。任选地，与由参考CFI核苷酸序列编码的CFI多肽的表达相比，由CFI核苷酸序列编码的CFI多肽或其片段的表达水平更高。任选地，由CFI核苷酸序列编码的CFI多肽或其片段的表达与由参考CFI核苷酸序列编码的CFI多肽相比可以为至少1.5x、至少2x、至少3x、至少5x、至少8x、至少10x、至少20x、至少30x、至少40x或至少50x。任选地，由CFI核苷酸序列编码的CFI多肽或其片段的表达与由参考CFI核苷酸序列编码的CFI多肽相比可以为1.5x至50x、5x至50x、10x至50x或30x至50x。

任选地，由CFI核苷酸序列编码的CFI多肽或其片段的表达与由参考CFI核苷酸序列编码的CFI多肽相比可以为至少80x,至少100x,至少200x,至少250x,至少300x,至少350x,或至少400x。任选地，由CFI核苷酸序列编码的CFI多肽或其片段的表达与由参考CFI核苷酸序列编码的CFI多肽相比可以为至少400x。任选地，由CFI核苷酸序列编码的CFI多肽或其片段的表达与参考CFI核苷酸序列编码的CFI多肽相比可以为1.5x至500x、10x至500x、100x至500x或20x至500x。任选地，由CFI核苷酸序列编码的CFI多肽或其片段的表达比由至少一个SEQ ID NO：1-4、6-24和26-40编码的CFI多肽或其片段的表达高至少一个标准偏差。任选地，由CFI核苷酸序列编码的CFI多肽或其片段的表达比由至少一个SEQ ID NO：17或37编码的CFI多肽或其片段的表达高至少一个标准偏差。

在由CFI核苷酸序列编码的CFI核苷酸序列编码的CFI多肽或其片段的表达与由参考CFI核苷酸序列编码的CFI多肽的表达相比处于更高水平的实施方案中，参考CFI核苷酸序列可以是野生型CFI核苷酸序列或SEQ ID NO：1、21、5或25中任一个的核苷酸序列。参考CFI核苷酸序列可以是野生型CFI核苷酸序列。野生型CFI核苷酸可以是SEQ ID NO：41或42的序列。参考CFI核苷酸序列可以是SEQ ID NO：1或21的核苷酸序列。参考CFI核苷酸序列可以是SEQ ID NO：5或25的核苷酸序列。任选地，由本发明的CFI核苷酸序列编码的CFI多肽或其片段的表达为由SEQ ID NO：5或25的序列编码的CFI多肽的表达的至少50％、至少60％、至少70％、至少80％、至少90％、至少95％或至少100％。

CFI多肽或其片段的表达水平通常可以通过测量样品中CFI多肽或其片段的水平来确定。任选地，CFI多肽或其片段的表达水平通过使用ELISA来确定。CFI多肽或其片段的表达水平可以使用如实施例1中所述的ELISA测定来确定。任选地，表达水平针对转染效率进行标准化。任选地，表达水平未针对转染效率进行标准化。针对转染效率进行标准化的一种方法是使用萤光素酶测定。

确定CFI多肽或其片段的表达水平的ELISA可以使用结合CFI多肽或其片段的两种抗体，使用夹心ELISA进行(例如，根据制造商的说明使用CFI ELISA试剂盒(例如Hycult目录号HK355-01))。例如，可以将结合CFI或其片段的第一抗体固定到板上，并且可以将包含CFI多肽或其片段的样品施加到其上固定有第一抗体的板上。可以洗涤板，然后可以将结合CFI多肽或其片段并与标记缀合的第二抗体施加到板上。第二抗体可以与生物素缀合，生物素与链霉亲和素-过氧化物酶结合，并且在这种情况下，链霉亲和素-过氧化物酶充当标记。可再次洗涤板，并通过评估存在的标记的量来测量结合至板的CFI多肽或其片段的量。例如，如果标记是链霉亲和素-过氧化物酶，则可以添加与链霉亲和素-过氧化物酶反应的底物四甲基联苯胺(TMB)。加入草酸可终止酶反应。对于每个样品和标准品，可以使用分光光度计测量450nm处的吸光度。可以通过绘制吸光度(线性)针对人CFI标准品的相应浓度(对数)的图来获得标准曲线。然后可以从标准曲线确定样品中人CFI的浓度。

任选地，在用包含编码CFI多肽或其片段的CFI核苷酸序列的多核苷酸转染人肝细胞(例如Huh-7细胞)后测定CFI多肽或其片段的表达水平。任选地，检测CFI多肽或其片段的表达水平包括收获在其中培养转染的人肝细胞的培养基并检测该培养基中的表达水平。如上所述，CFI多肽或其片段的表达水平可以使用萤光素酶测定针对转染效率进行标准化。任选地，转染可以包括共转染包含编码萤光素酶的转基因的多核苷酸。这允许用户标准化测量的表达以反映已转染的细胞数量(从而考虑转染效率的差异)，因为被包含编码CFI多肽或其片段的CFI核苷酸序列的多核苷酸转染的细胞的比例将与由包含萤光素酶转基因的多核苷酸表达的萤光素酶产生的荧光信号成比例。任选地，包含萤光素酶转基因的多核苷酸进一步包含CMV或TK启动子，并且萤光素酶转基因可操作地连接至CMV或TK启动子。任选地，可以在细胞(或细胞的一部分)中测量萤光素酶表达。例如，可收获并裂解细胞(或细胞的一部分)，并测量裂解物中的萤光素酶表达。任选地，可以在其中培养转染的人肝细胞的培养基(或一部分培养基)中测量萤光素酶表达。任选地，可以通过进行萤光素酶测定来测量萤光素酶表达。任选地，可以使用发光计测量发光。可以通过在Molecular DevicesSpectraMax i3x读板器上测量发光来测量萤光素酶表达。

CFI核苷酸序列可以编码信号肽。任选地，信号肽的氨基酸序列是野生型CFI信号肽的氨基酸序列。野生型CFI信号肽的氨基酸序列可以是SEQ ID NO：46的氨基酸序列。信号肽可以由SEQ ID NO：45的核苷酸序列编码。信号肽可以不由野生型CFI信号肽编码核苷酸序列编码。信号肽可由SEQ ID NO：21至40中任一个的第1至54位核苷酸编码。任选地，信号肽的氨基酸序列是其不是野生型CFI信号肽的信号肽的氨基酸序列。例如，信号肽可能不是野生型CFI信号肽。信号肽可以是来自另一多肽的信号肽。任选地，CFI核苷酸序列编码信号肽。任选地，CFI核苷酸序列不编码信号肽。任选地，CFI多肽或其片段包含信号肽。任选地，CFI多肽或其片段不包含信号肽。

本发明的多核苷酸可包含转录调节元件。

可以使用任何合适的转录调节元件，例如HLP2、HLP1、LP1、HCR-hAAT、ApoE-hAAT或LSP，它们都是肝脏特异性转录调节元件。这些转录调节元件在以下参考文献中有更详细的描述：HLP1:McIntosh J.等人,Blood 2013Apr 25,121(17):3335-44；LP1:Nathwani等人,Blood.2006April 1,107(7):2653–2661；HCR-hAAT:Miao等人,Mol Ther.2000；1:522-532；ApoE-hAAT:Okuyama等人,Human Gene Therapy,7,637-645(1996)；和LSP:Wang等人,ProcNatl Acad Sci U S A.1999March 30,96(7):3906–3910。转录调节元件可包含肝脏特异性启动子。

转录调节元件可包含启动子和/或增强子，例如来自HLP2、HLP1、LP1、HCR-hAAT、ApoE-hAAT或LSP的启动子元件和/或增强子元件。这些转录调节元件中的每一个都包含启动子、增强子和任选地其他核苷酸。转录调节元件可以可操作地连接至本发明的CFI核苷酸序列。启动子和/或增强子可以可操作地连接到本发明的CFI核苷酸序列。

在一些实施方案中，转录调节元件包含启动子，该启动子是人α-1抗胰蛋白酶启动子(A1AT；Miao等人(2000),Molecular Therapy1(6):522)或其片段。在一个实施方案中，A1AT启动子的片段的长度为至少100、至少120、至少150、至少180、255或更少、100至255、150至225、150至300或180至255个核苷酸。任选地，A1AT启动子的片段的长度为150至300个核苷酸。任选地，A1AT启动子的片段的长度为180至255个核苷酸。在一个实施方案中，A1AT启动子的片段的长度为至少200个、至少250个、至少300个、500个或更少、200至500、250至500或350至450或约418个核苷酸。任选地，A1AT启动子的片段的长度为350至450个核苷酸。

合适的A1AT启动子片段在SEQ ID NO：47和48中描述。任选地，转录调节元件包含长度为至少100、至少120、至少150、至少180、小于255、100至255、150至300或180至255个核苷酸的启动子，并且启动子包含与SEQ ID NO：47至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的多核苷酸序列。任选地，转录调节元件包含长度为180至255个核苷酸的启动子，并且启动子包含与SEQ ID NO：47至少98％、至少99％、至少99.5％、至少99.8％或100％相同的多核苷酸序列。任选地，多核苷酸包含与SEQ ID NO：47的至少100、至少120或至少150个核苷酸的片段至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的启动子。任选地，多核苷酸包含与SEQ ID NO：47至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的启动子。任选地，多核苷酸包含与SEQ ID NO：47至少98％、至少99％、至少99.5％、至少99.8％或100％相同的启动子。任选地，多核苷酸包含SEQ ID NO：47的启动子。

转录调节元件可包含长度为至少200、至少250、至少300、500或更少、200至500、250至500、350至450或约418个核苷酸的启动子，并且启动子包含与SEQ ID NO：48至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的多核苷酸序列。任选地，转录调节元件包含长度为350至450个核苷酸的启动子，并且启动子包含与SEQ ID NO：48至少98％、至少99％、至少99.5％、至少99.8％或100％相同的多核苷酸序列。任选地，该多核苷酸包含与SEQ ID NO：48的至少350个核苷酸的片段至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的启动子。任选地，多核苷酸包含与SEQ ID NO：48至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的启动子。任选地，多核苷酸包含与SEQ ID NO：48至少98％、至少99％、至少99.5％、至少99.8％或100％相同的启动子。任选地，多核苷酸包含SEQ ID NO：48的启动子。

任选地，转录调节元件包含A1AT启动子的片段，其长度等于或少于418个核苷酸、等于或少于255个核苷酸或等于或少于185个核苷酸并且包含SEQ ID NO：47。

如果多核苷酸意欲在肝脏中表达，则启动子可以是肝脏特异性启动子。任选地，启动子是人肝脏特异性启动子。

转录调节元件可包含增强子。在一些实施方案中，转录调节元件包含增强子，其是人载脂蛋白E(ApoE)肝基因座控制区(HCR；Miao等人(2000),Molecular Therapy 1(6):522)或其片段。在一个实施方案中，转录调节元件包含HCR增强子的片段，其是长度为至少80、至少90、至少100、192或更少、80至192、90至192、100至250或117至192个核苷酸的片段。任选地，HCR增强子的片段的长度为100到250个核苷酸。任选地，HCR增强子的片段的长度为117到192个核苷酸。在一个实施方案中，HCR增强子或HCR增强子的片段是长度为至少150、至少190、至少230、少于400、150至400、190至370、230至340、250至340或约321个核苷酸的片段。任选地，HCR增强子或HCR增强子的片段的长度为250至340个核苷酸。

合适的HCR增强子元件片段在SEQ ID NO：49和50中定义。任选地，转录调节元件包含长度为至少80、至少90、至少100、小于192、80至192、90至192、100至250或117至192个核苷酸的增强子，并且增强子包含与SEQ ID NO：49至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的多核苷酸序列。任选地，转录调节元件包含长度为117至192个核苷酸的增强子，并且增强子包含与SEQ ID NO：49至少98％、至少99％、至少99.5％、至少99.8％或100％相同的多核苷酸序列。任选地，转录调节元件包含与SEQ ID NO：49的至少90、至少100或至少110个核苷酸的片段至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的增强子。任选地，该多核苷酸包含与SEQ ID NO：49至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的增强子。任选地，该多核苷酸包含与SEQ ID NO：49至少98％、至少99％、至少99.5％、至少99.8％或100％相同的增强子。任选地，该多核苷酸包含SEQ ID NO：49的增强子。

在一些实施方案中，转录调节元件包含长度为至少150、至少190、至少230、少于400、150至400、190至370、230至340、250至340或约321个核苷酸的增强子或增强子的片段，并且增强子包含与SEQ ID NO：50至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的多核苷酸序列。任选地，转录调节元件包含长度为250至340个核苷酸的增强子，并且增强子包含与SEQ ID NO：50至少98％、至少99％、至少99.5％、至少99.8％或100％相同的多核苷酸序列。任选地，转录调节元件包含与SEQ IDNO：50的至少250个核苷酸的片段至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的增强子。任选地，多核苷酸包含与SEQ ID NO：50至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的增强子。任选地，该多核苷酸包含与SEQ ID NO：50至少98％、至少99％、至少99.5％、至少99.8％或100％相同的增强子。任选地，该多核苷酸包含SEQ ID NO：50的增强子。

任选地，转录调节元件包含HCR增强子的片段，其长度等于或少于321个核苷酸、等于或少于192个核苷酸或等于或少于117个核苷酸并且包含SEQ ID NO：49。

在一个实施方案中，转录调节元件与SEQ ID NO：51至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。在一个实施方案中，多核苷酸包含与SEQ ID NO：51至少98％、至少99％、至少99.5％、至少99.8％或100％相同的转录调节元件。任选地，该多核苷酸包含与SEQ ID NO：51至少98％相同的转录调节元件。任选地，该多核苷酸包含具有SEQ ID NO：51的序列的转录调节元件。任选地，该多核苷酸包含SEQ ID NO：51的转录调节元件。任选地，多核苷酸包含由SEQ ID NO：51组成的转录调节元件。

在一个实施方案中，转录调节元件与SEQ ID NO：52至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。在一个实施方案中，多核苷酸包含与SEQ ID NO：52至少98％、至少99％、至少99.5％、至少99.8％或100％相同的转录调节元件。任选地，该多核苷酸包含与SEQ ID NO：52至少98％相同的转录调节元件。任选地，该多核苷酸包含具有SEQ ID NO：52的序列的转录调节元件。任选地，该多核苷酸包含SEQ ID NO：52的转录调节元件。任选地，多核苷酸包含由SEQ ID NO：52组成的转录调节元件。

在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：5或25至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列；并且该多核苷酸包含与SEQ IDNO：47至少98％、至少99％、至少99.5％、至少99.8％或100％相同的启动子和/或与SEQ IDNO：49至少98％、至少99％、至少99.5％、至少99.8％或100％相同的增强子元件。在另一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：5或25至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列；并且该多核苷酸包含与SEQ ID NO：51至少98％、至少99％、至少99.5％、至少99.8％或100％相同的转录调节元件。

在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：7或27至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列；并且该多核苷酸包含与SEQ IDNO：47至少98％、至少99％、至少99.5％、至少99.8％或100％相同的启动子和/或与SEQ IDNO：49至少98％、至少99％、至少99.5％、至少99.8％或100％相同的增强子元件。在另一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：7或27至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列；并且该多核苷酸包含与SEQ ID NO：51至少98％、至少99％、至少99.5％、至少99.8％或100％相同的转录调节元件。

在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：10或30至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列；并且该多核苷酸包含与SEQID NO：47至少98％、至少99％、至少99.5％、至少99.8％或100％相同的启动子和/或与SEQID NO：49至少98％、至少99％、至少99.5％、至少99.8％或100％相同的增强子元件。在另一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：10或30至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列；并且该多核苷酸包含与SEQ ID NO：51至少98％、至少99％、至少99.5％、至少99.8％或100％相同的转录调节元件。

在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：14或34至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列；并且该多核苷酸包含与SEQID NO：47至少98％、至少99％、至少99.5％、至少99.8％或100％相同的启动子和/或与SEQID NO：49至少98％、至少99％、至少99.5％、至少99.8％或100％相同的增强子元件。在另一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：14或34至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列；并且该多核苷酸包含与SEQ ID NO：51至少98％、至少99％、至少99.5％、至少99.8％或100％相同的转录调节元件。

在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：17或37至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列；并且该多核苷酸包含与SEQID NO：47至少98％、至少99％、至少99.5％、至少99.8％或100％相同的启动子和/或与SEQID NO：49至少98％、至少99％、至少99.5％、至少99.8％或100％相同的增强子元件。在另一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：17或37至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列；并且该多核苷酸包含与SEQ ID NO：51至少98％、至少99％、至少99.5％、至少99.8％或100％相同的转录调节元件。

在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：5或25至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列；并且该多核苷酸包含与SEQ IDNO：48至少98％、至少99％、至少99.5％、至少99.8％或100％相同的启动子和/或与SEQ IDNO：50至少98％、至少99％、至少99.5％、至少99.8％或100％相同的增强子元件。在另一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：5或25至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列；并且该多核苷酸包含与SEQ ID NO：52至少98％、至少99％、至少99.5％、至少99.8％或100％相同的转录调节元件。

在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：7或27至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列；并且该多核苷酸包含与SEQ IDNO：48至少98％、至少99％、至少99.5％、至少99.8％或100％相同的启动子和/或与SEQ IDNO：50至少98％、至少99％、至少99.5％、至少99.8％或100％相同的增强子元件。在另一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：7或27至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列；并且该多核苷酸包含与SEQ ID NO：52至少98％、至少99％、至少99.5％、至少99.8％或100％相同的转录调节元件。

在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：10或30至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列；并且该多核苷酸包含与SEQID NO：48至少98％、至少99％、至少99.5％、至少99.8％或100％相同的启动子和/或与SEQID NO：50至少98％、至少99％、至少99.5％、至少99.8％或100％相同的增强子元件。在另一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：10或30至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列；并且该多核苷酸包含与SEQ ID NO：52至少98％、至少99％、至少99.5％、至少99.8％或100％相同的转录调节元件。

在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：14或34至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列；并且该多核苷酸包含与SEQID NO：48至少98％、至少99％、至少99.5％、至少99.8％或100％相同的启动子和/或与SEQID NO：50至少98％、至少99％、至少99.5％、至少99.8％或100％相同的增强子元件。在另一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：14或34至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列；并且该多核苷酸包含与SEQ ID NO：52至少98％、至少99％、至少99.5％、至少99.8％或100％相同的转录调节元件。

在一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：17或37至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列；并且该多核苷酸包含与SEQID NO：48至少98％、至少99％、至少99.5％、至少99.8％或100％相同的启动子和/或与SEQID NO：50至少98％、至少99％、至少99.5％、至少99.8％或100％相同的增强子元件。在另一个实施方案中，CFI核苷酸序列包含与SEQ ID NO：17或37至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列；并且该多核苷酸包含与SEQ ID NO：52至少98％、至少99％、至少99.5％、至少99.8％或100％相同的转录调节元件。

在一些实施方案中，转录调节元件包含普遍表达启动子。任选地，转录调节元件包含CAG启动子。任选地，转录调节元件包含与CAG启动子的核苷酸序列(例如SEQ ID NO：61)至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，本发明的多核苷酸包含与CAG启动子的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列，并且CFI核苷酸序列包含与SEQ ID NO：1或21的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，本发明的多核苷酸包含CAG启动子并且CFI核苷酸序列包含与SEQ ID NO：1或21的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，多核苷酸本发明包含CAG启动子并且CFI核苷酸序列包含SEQ ID NO：1或21的序列。

在一个实施方案中，本发明的多核苷酸包含土拨鼠肝炎转录后调节元件(WPRE)。例如，本发明的多核苷酸包含Zanta-Boussif等人(2009),Gene Therapy,16:605-619中描述的突变WPRE序列。在另一个实施方案中，本发明的多核苷酸不包含土拨鼠肝炎转录后调节元件(WPRE)。

在一个实施方案中，本发明的多核苷酸包含土拨鼠肝炎转录后调节元件或其变体。任选地，土拨鼠肝炎转录后调节元件与SEQ ID NO：62至64中的任一个至少75％、至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。任选地，该多核苷酸包含土拨鼠肝炎转录后调节元件，其与SEQ ID NO62至64中的任一个至少98％、至少99％、至少99.5％、至少99.8％或100％相同。任选地，该多核苷酸包含土拨鼠肝炎转录后调节元件，其与SEQ ID NO：62至64中的任一个至少98％相同。任选地，该多核苷酸包含土拨鼠肝炎转录后调节元件，其具有SEQ ID NO：62至64中任一个的序列。任选地，该多核苷酸包含SEQ ID NO：62至64中任一个的土拨鼠肝炎转录后调节元件。任选地，多核苷酸包含土拨鼠肝炎转录后调节元件，其由SEQ ID NO：62至64中的任一个组成。

任选地，转录调节元件包含A1AT启动子的两个片段。任选地，A1AT启动子的第一个片段的长度为75到100个核苷酸，A1AT启动子的第二个片段的长度为25到50个核苷酸。任选地，多核苷酸包含与SEQ ID NO：66至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％或100％相同的启动子。

转录调节元件可以是这样的转录调节元件，其：

(a)促进比HCR-hAAT更高的表达；

(b)促进比FRE72更高的表达；

(c)包含hAAT序列元件；和/或

(d)包含AMBP序列元件。

TRE可以包含一个或多个启动子和/或增强子元件，例如选自hAAT序列元件、AMBP序列元件、ApoE-HCR1序列元件、ALDOB序列元件、CRM6序列元件和F2序列元件的启动子和/或增强子元件。例如，包含hAAT序列元件的多核苷酸是TRE。

在一个方面，TRE的长度大于500、大于600、大于700、大于800、大于900、大于1000、大于1100、大于1200、大于1300、大于1400、大于1500或大于1600个核苷酸。在一个方面，TRE的长度小于2000、小于1800、小于1600、小于1500、小于1400、小于1300、小于1200、小于1100、小于1000、小于900、小于800、小于700或小于600个核苷酸。在一个方面，TRE的长度为400至2000、500至1800、600至1400、800至1600、500至600、600至700、700至800、800至900、900至1000、1000至1100、1100至1200、1200至1300、1300至1400、1400至1500或1500至1600或1600至1700个核苷酸。

在一个实施方案中，TRE的长度为563至1628个核苷酸。在一个实施方案中，TRE的长度为563至583个核苷酸。在一个实施方案中，TRE的长度为566至586个核苷酸。在一个实施方案中，TRE的长度为888至908个核苷酸。在一个实施方案中，TRE的长度为893到913个核苷酸。在一个实施方案中，TRE的长度为897到917个核苷酸。在一个实施方案中，TRE的长度为899至919个核苷酸。在一个实施方案中，TRE的长度为903到923个核苷酸。在一个实施方案中，TRE的长度为905到925个核苷酸。在一个实施方案中，TRE的长度为909至929个核苷酸。在一个实施方案中，TRE的长度为913到933个核苷酸。在一个实施方案中，TRE的长度为923至943个核苷酸。在一个实施方案中，TRE的长度为933至953个核苷酸。在一个实施方案中，TRE的长度为1353到1373个核苷酸。在一个实施方案中，TRE的长度为1608到1628个核苷酸。在一个实施方案中，TRE的长度为1474至1494个核苷酸。

在一个实施方案中，TRE比FRE72长。在一个实施方案中，TRE比FRE72长至少450个、至少770个、至少1240个、至少1340个或至少1390个核苷酸。在一个实施方案中，TRE比HCR-hAAT短。在一个实施方案中，TRE比HCR-hAAT短至少160个核苷酸。在一个实施方案中，TRE比HCR-hAAT长。在一个实施方案中，TRE比HCR-hAAT长至少150、至少620、至少720或至少770个核苷酸。在一个实施方案中，TRE长于FRE72且短于HCR-hAAT。在一个实施方案中，TRE的长度超过898个核苷酸。在一个实施方案中，TRE的长度超过1363个核苷酸。

当确定TRE的长度时，本领域技术人员会理解应包括被认为是TRE一部分的所有核苷酸(例如对应于hAAT序列元件、AMBP序列元件、ApoE-HCR1、ALDOB序列元件、CRM6序列元件或F2序列元件的所有核苷酸应包括在内，并且对应于任何其他已知转录调节元件的核苷酸也应包括在内)。例如，如果构建体包含相同TRE的两个拷贝，则在计算长度时应包括两个拷贝。

特别地，当确定TRE的长度时，必须将多核苷酸的任何连续部分的核苷酸计入TRE的长度，前体是连续部分包含核苷酸序列，其：

(i)与SEQ ID NO：66-105中的任一个具有至少95％的序列同一性；

(ii)与任何已知启动子或增强子元件或任何已知启动子或增强子元件的片段具有至少95％的序列同一性；和/或

(iii)与任何已知的转录因子结合位点具有至少有95％的序列同一性。

在一个方面，TRE包含以下或由以下组成：

(a)与SEQ ID NO：68-91中的任一个具有至少80％、至少85％、至少90％、至少95％、至少98％或至少99％序列同一性的核苷酸序列；或

(b)SEQ ID NO：68-91中任一个的核苷酸序列。

在一个方面，TRE包含以下或由以下组成：

(a)与SEQ ID NO：70具有至少80％、至少85％、至少90％、至少95％、至少98％或至少99％的序列同一性的核苷酸序列；或

(b)SEQ ID NO：70的核苷酸序列。

在一个方面，TRE包含以下或由以下组成：

(a)与SEQ ID NO：74具有至少80％、至少85％、至少90％、至少95％、至少98％或至少99％的序列同一性的核苷酸序列；或

(b)SEQ ID NO：74的核苷酸序列。

在一个实施方案中，TRE包含与SEQ ID NO：68-91具有至少95％序列同一性的核苷酸序列或由其组成。在一个实施方案中，TRE包含与SEQ ID NO：70具有至少95％序列同一性的核苷酸序列或由其组成。在一个实施方案中，TRE包含与SEQ ID NO：74具有至少95％序列同一性的核苷酸序列或由其组成。

在一个实施方案中，TRE包含与SEQ ID NO：68-91具有至少98％序列同一性的核苷酸序列或由其组成。在一个实施方案中，TRE包含与SEQ ID NO：70具有至少98％序列同一性的核苷酸序列或由其组成。在一个实施方案中，TRE包含与SEQ ID NO：74具有至少98％序列同一性的核苷酸序列或由其组成。

HCR-hAAT是一种杂合TRE，其来源于人α-1-抗胰蛋白酶启动子和ApoE基因的增强子/肝基因座控制区(HCR)。FRE72是一种TRE，其仅包含hAAT启动子的核心区域。已显示HCR-hAAT和FRE72促进转基因在人肝细胞中的高水平表达，所述人肝细胞已经用病毒载体转导，所述病毒载体包含含有与所述转基因可操作地连接的HCR-hAAT或FRE72的表达盒。

在一个方面，TRE促进比HCR-hAAT更高的表达。HCR-hAAT是一种TRE，其在Miao等人,Mol Ther.2000；1(6):522-532中有更详细的描述，并且具有SEQ ID NO：67的序列。TRE可以促进与HCR-hAAT相比为1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍或至少3倍的表达。在一个实施方案中，TRE促进与HCR-hAAT相比为至少1.8倍的表达。

在一个方面，TRE促进与HCR-hAAT相比为1.2倍至3倍、1.5倍至3倍、1.8倍至3倍、2倍至3倍、2.5倍至3倍、1.2倍至5倍、1.5倍至5倍、1.8倍至5倍、2倍至5倍、2.5倍至5倍或3倍至5倍的表达。在一个实施方案中，TRE促进与HCR-hAAT相比为2至3倍的表达。

在一个方面，TRE促进比FRE72更高的表达。FRE72是一种启动子，其在WO2021/084277中有更详细的描述并具有SEQ ID NO：66的序列。TRE可以促进与FRE72相比为至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少2.6倍、至少2.7倍、至少2.8倍、至少2.9倍或至少3倍的表达。在一个实施方案中，TRE促进与FRE72相比为至少1.8倍的表达。

在一个方面，TRE促进与FRE72相比为1.2倍至3倍、1.5倍至3倍、1.8倍至3倍、2倍至3倍、2.5倍至3倍、1.2倍至5倍、1.5倍至5倍、1.8倍至5倍、2倍至5倍、2.5倍至5倍或3倍至5倍的表达。在一个实施方案中，TRE促进与FRE72相比为2至3倍的表达。

技术人员将理解有许多合适的方法用于确定由TRE促进的表达水平。合适的表达测定在实施例和下文中描述。

任选地，表达通过包括以下的表达测定来测量：

(i)用包含表达盒的质粒转染人肝细胞，所述表达盒包含可操作地连接至TRE的转基因；

(ii)在适合发生转基因表达的条件下孵育转染的细胞；和

(iii)使用对转基因编码的蛋白质具有特异性的抗体通过ELISA测量转基因水平。

任选地，转基因编码野生型人CFI多肽。任选地，转染步骤(i)包括将质粒与转染试剂(例如

HD(Promega,目录号E2311)混合以形成转染混合物，并将转染混合物递送至肝细胞。任选地，肝细胞是Huh7细胞。转染人肝细胞的步骤可以是将人肝细胞与转染混合物孵育过夜的步骤。孵育转染的细胞的步骤可以是将转染的细胞在合适的生长条件下培养5天的步骤。测量转基因水平的步骤可包括在孵育转染的细胞的步骤之后收获由孵育转染的细胞的步骤产生的细胞和培养基。

任选地，转染步骤(i)包括用包含表达盒的质粒共转染人肝细胞，所述表达盒包含可操作地连接至启动子的编码萤光素酶的转基因，以及测量总萤光素酶表达。

通过ELISA测量转基因水平的步骤可以使用结合CFI的两种抗体使用夹心ELISA来进行(例如，根据制造商的说明使用CFI ELISA试剂盒(例如Hycult目录号HK355-01))。例如，可以将结合CFI的第一抗体固定到板上，并且可以将任选作为测量转基因水平的步骤的一部分收获的一部分细胞和培养基与固定在板上第一抗体一起施加至板。可以洗涤板，然后可以将结合CFI并与标记缀合的第二抗体施加至板。第二抗体可以与生物素缀合，生物素与链霉亲和素-过氧化物酶结合，并且在这种情况下，链霉亲和素-过氧化物酶充当标记。可以再次洗涤该板，并通过评估存在的标记的量来测量与该板结合的CFI的量。例如，如果标记是链霉亲和素-过氧化物酶，则可以添加与链霉亲和素-过氧化物酶反应的底物四甲基联苯胺(TMB)。加入草酸可终止酶反应。对于每个样品和标准品，可以使用分光光度计测量450nm处的吸光度。可以通过绘制吸光度(线性)针对人CFI标准品的相应浓度的图来获得标准曲线。然后可以从标准曲线确定样品中人CFI的浓度。

可以将测得的表达与使用不同(参考)TRE(例如HCR-hAAT或FRE72)时测得的表达进行比较。在这种情况下，使用参考TRE代替本发明的多核苷酸中的TRE(“测试”TRE)重复上述步骤(即，用户重复相同的步骤，但将参考TRE代替测试TRE***转染步骤(i)中使用的质粒)。

如上所述，转染步骤(i)可以包括用包含表达盒的质粒共转染人肝细胞，所述表达盒包含可操作地连接至启动子的编码萤光素酶的转基因，以及测量总萤光素酶表达。包含含有编码萤光素酶的转基因的表达盒的质粒可以与包含含有可操作地连接到TRE的转基因的表达盒的质粒相同(除了转基因不同并且TRE可能不同)。这允许用户标准化测量的表达以反映已被转染的细胞数量(从而考虑转染效率的差异)，因为被载体转染的细胞比例(即转染效率)将与总萤光素酶表达成比例。在这种情况下，表达测定还包括检测总萤光素酶表达的步骤。任选地，萤光素酶可操作地连接至CMV启动子。

总萤光素酶表达可通过对任选作为测量转基因水平步骤的一部分收获的细胞的一部分进行萤光素酶测定来测量。可以通过使用发光计测量发光来测量总萤光素酶表达。例如，可以用磷酸缓冲盐水(PBS)洗涤细胞两次，然后用来自萤光素酶测定试剂盒(Promega目录号E1501/4530)的100μl萤光素酶裂解缓冲液处理。可以通过在Molecular DevicesSpextraMax i3x读板器上测量发光来测量萤光素酶表达。

任选地，表达测定包括通过用ELISA测量的转基因水平除以来自相应细胞的总萤光素酶表达来计算表达的标准化值。

任选地，TRE是肝脏特异性的。如果与一般的其他细胞相比，TRE在肝细胞中驱动更高水平的表达，则它是“肝脏特异性的”。例如，技术人员可以通过比较多核苷酸在肝细胞(例如Huh7细胞)中的表达与多核苷酸在来自其他组织的细胞(例如肾细胞，例如HEK293T细胞)中的表达来确定TRE是否是肝脏特异性的TRE。如果与来自其他组织的细胞相比，肝细胞中的表达水平更高，则TRE是肝脏特异性TRE。可选地，肝脏特异性TRE不会在非肝细胞中产生可观的表达水平。

在一个方面，TRE包含hAAT序列元件。hAAT序列元件是来源于人α-1-抗胰蛋白酶启动子(hAAT启动子)的多核苷酸。hAAT启动子的示例性序列如SEQ ID NO：94所示。

在一个实施方案中，TRE包含hAAT序列元件，其中hAAT序列元件包含SEQ ID NO：95或SEQ ID NO：95的在1、2或3个核苷酸上不同的变体的核苷酸序列。在一个实施方案中，TRE包含hAAT序列元件，其中hAAT序列元件包含核苷酸序列SEQ ID NO：95。在一个实施方案中，TRE包含hAAT序列元件，其中hAAT序列元件包含SEQ ID NO：96或SEQ ID NO：96的在1、2或3个核苷酸上不同的变体的核苷酸序列。在一个实施方案中，TRE包含hAAT序列元件，其中hAAT序列元件包含SEQ ID NO：96的核苷酸序列。

在一个实施方案中，TRE包含hAAT序列元件，其中hAAT序列元件包含与SEQ ID NO：94或SEQ ID NO：94的至少200、至少300或至少400个核苷酸长的片段至少80％、至少85％、至少90％、至少95％、至少98％或至少99％相同的核苷酸序列。在一个实施方案中，TRE包含hAAT序列元件，其中hAAT序列元件包含与SEQ ID NO：94至少98％相同的核苷酸序列。在一个实施方案中，TRE包含hAAT序列元件，其中hAAT序列元件包含SEQ ID NO：94的核苷酸序列。在一个实施方案中，TRE包含第二个hAAT序列元件。

在一个实施方案中，TRE包含第一和第二hAAT序列元件，其中第二hAAT序列元件在第一hAAT序列元件的5'和AMBP序列元件的5'。在一个实施方案中，第二hAAT序列元件包含SEQ ID NO：95或SEQ ID NO：95的在1、2或3个核苷酸上不同的变体的核苷酸序列。在一个实施方案中，第二hAAT序列元件包含SEQ ID NO：95的核苷酸序列。在实施方案中，第一hAAT序列元件包含SEQ ID NO：94，第二hAAT序列元件包含SEQ ID NO：95。

在一个方面，TRE包含AMBP序列元件。AMBP序列元件是来源于人α1-微球蛋白/bikunin增强子(AMBP增强子)的多核苷酸。Rouet等人,Journal of BiologicalChemistry,1992,267；20765-20773中进一步描述了AMBP增强子。AMBP增强子的示例性序列如SEQ ID NO：097所示。

在一个实施方案中，TRE包括AMBP序列元件，其中AMBP序列元件包括SEQ ID NO：98或SEQ ID NO：98的在1、2或3个核苷酸上不同的变体的核苷酸序列。在一个实施方案中，TRE包含AMBP序列元件，其中AMBP序列元件包含SEQ ID NO：98的核苷酸序列。在一个实施方案中，TRE包含AMBP序列元件，其中AMBP序列元件包含SEQ ID NO：97或SEQ ID NO：97的在1、2或3个核苷酸上不同的变体的核苷酸序列。在一个实施方案中，TRE包含AMBP序列元件，其中AMBP序列元件包含SEQ ID NO：97的核苷酸序列。

AMBP序列元件可包含一种或多种转录因子的结合位点。因此，在一个方面，AMBP序列元件包含至少一个选自以下的结合位点：HNF1-1结合位点、HNF4结合位点、HNF3a结合位点、HNF1-2结合位点和HNF3-2结合位点。在一个方面，TRE包含AMBP序列元件，其中AMBP序列元件包含至少两个选自以下的结合位点：HNF1-1结合位点、HNF4结合位点、HNF3a结合位点、HNF1-2结合位点和HNF3-2结合位点。在一个方面，TRE包含AMBP序列元件，其中AMBP序列元件包含至少三个选自以下的结合位点：HNF1-1结合位点、HNF4结合位点、HNF3a结合位点、HNF1-2结合位点和HNF3-2结合位点。在一个方面，TRE包含AMBP序列元件，其中AMBP序列元件包含至少四个选自以下的结合位点：HNF1-1结合位点、HNF4结合位点、HNF3a结合位点、HNF1-2结合位点和HNF3-2结合位点。在一个方面，TRE包含AMBP序列元件，其中AMBP序列元件包含HNF1-1结合位点、HNF4结合位点、HNF3a结合位点、HNF1-2结合位点和HNF3-2结合位点。

在一个方面，AMBP序列元件在hAAT序列元件的5’。任选地，AMBP序列元件在hAAT序列元件的5'的少于10个、少于8个或少于5个核苷酸处。任选地，AMBP序列元件紧邻hAAT序列元件的5'。

在一个方面，包含AMBP序列元件的TRE与缺乏AMBP序列元件的相应TRE相比促进相等或更高的表达。技术人员可以使用标题“表达测定”下描述的技术通过确定由包含AMBP序列元件的测试TRE和参考TRE促进的表达水平来确定包含AMBP序列元件的TRE(测试TRE)是否促进与不包含AMBP序列元件的第二TRE(参考TRE)相等或更高的表达。任选地，用户通过创建包含在HCR-hAAT的5'的测试AMBP序列元件的测试TRE并将测试TRE的表达水平与HCR-hAAT(参考TRE)的表达水平进行比较来确定包含AMBP序列元件(测试AMBP序列元件)的TRE是否促进与不包含AMBP序列元件的参考TRE相等或更高的表达。如果测试TRE的表达水平等于或高于HCR-hAAT的表达水平，则TRE促进与不包含AMBP序列元件的相应TRE相等或更高的表达。

在一个方面，TRE包含ApoE-HCR1序列元件。ApoE-HCR1序列元件是来源于ApoE基因的肝基因座控制区(HCR)的多核苷酸。ApoE-HCR1在Miao等人(2000),Molecular Therapy 1(6):522中有进一步描述。ApoE-HCR1的示例性序列如SEQ ID NO：92所示。

在一个实施方案中，TRE包含ApoE-HCR1序列元件，其中ApoE-HCR1序列元件包含SEQ ID NO：93或SEQ ID NO：93的在1、2或3个核苷酸上不同的变体的核苷酸序列。在一个实施方案中，TRE包含ApoE-HCR1序列元件，其中ApoE-HCR1序列元件包含SEQ ID NO：93的核苷酸序列。在一个实施方案中，TRE包含ApoE-HCR1序列元件，其中ApoE-HCR1序列元件包含SEQID NO：92或SEQ ID NO：92的在1、2或3个核苷酸上不同的变体的核苷酸序列。在一个实施方案中，TRE包含ApoE-HCR1序列元件，其中ApoE-HCR1序列元件包含SEQ ID NO：92的核苷酸序列。

在一个方面，ApoE-HCR1序列元件在hAAT序列元件的5’。任选地，ApoE-HCR1序列元件在hAAT序列元件的5'的少于10个、少于8个或少于5个核苷酸处。任选地，ApoE-HCR1序列元件紧邻hAAT序列元件的5'。在一个方面，ApoE-HCR1序列元件在AMBP序列元件的5’。任选地，ApoE-HCR1序列元件在AMBP序列元件的5'的少于10个、少于8个或少于5个核苷酸处。任选地，ApoE-HCR1序列元件紧邻AMBP序列元件的5'。在一个方面，ApoE-HCR1序列元件在AMBP序列元件的3’。任选地，ApoE-HCR1序列元件在AMBP序列元件的5'的少于10个、少于8个或少于5个核苷酸处。任选地，ApoE-HCR1序列元件紧邻AMBP序列元件的5'。在一个方面，ApoE-HCR1序列元件在hAAT序列元件和AMBP序列元件的5'。在一个方面，ApoE-HCR1序列元件在hAAT序列元件的5’和AMBP序列元件的3'。

在一个方面，包含ApoE-HCR1序列元件的TRE与缺乏ApoE-HCR1序列元件的相应TRE相比促进相等或更高的表达。技术人员可以使用标题“表达测定”下描述的技术通过确定由包含ApoE-HCR1的测试TRE和参考TRE促进的表达水平来确定包含ApoE-HCR1序列的TRE(测试TRE)是否促进与不包含ApoE-HCR1序列的第二TRE(参考TRE)相等或更高的表达。任选地，用户通过创建包含在hAAT的5'的测试ApoE-HCR1序列元件的测试TRE并将测试TRE的表达水平与hAAT(参考TRE)的表达水平进行比较来确定包含ApoE-HCR1序列元件(测试ApoE-HCR1序列元件)的TRE是否促进与不包含ApoE-HCR1序列元件的参考TRE相等或更高的表达。如果测试TRE的表达水平等于或高于hAAT的表达水平，则TRE促进与不包含ApoE-HCR1序列元件的相应TRE相等或更高的表达。

在一个方面，TRE包含CRM6序列元件。CRM6序列元件是来源于CRM6的多核苷酸。CRM6在Chuah等人,Molecular Therapy,2014,22；1605-1613中有更详细的描述。CRM6的示例性序列如SEQ ID NO：99所示。

在一个实施方案中，TRE包含CRM6序列元件，其中CRM6序列元件包含SEQ ID NO：100或SEQ ID NO：100的在1、2或3个核苷酸上不同的变体的核苷酸序列。在一个实施方案中，TRE包含CRM6序列元件，其中CRM6序列元件包含SEQ ID NO：100的核苷酸序列。在一个实施方案中，TRE包含CRM6序列元件，其中CRM6序列元件包含SEQ ID NO：101或SEQ ID NO：101的在1、2或3个核苷酸上不同的变体的核苷酸序列。在一个实施方案中，TRE包含CRM6序列元件，其中CRM6序列元件包含SEQ ID NO：101的核苷酸序列。在一个实施方案中，TRE包含CRM6序列元件，其中CRM6序列元件包含SEQ ID NO：99或SEQ ID NO：99的在1、2或3个核苷酸上不同的变体的核苷酸序列。在一个实施方案中，TRE包含CRM6序列元件，其中CRM6序列元件包含SEQ ID NO：99的核苷酸序列。

CRM6序列元件可包含一种或多种转录因子的结合位点。因此，在一个方面，CRM6序列元件包含至少一个选自Sp1结合位点、Sp2结合位点、HNF3A结合位点和HNF-1结合位点的结合位点。在一个方面，CRM6序列元件包含至少两个选自Sp1结合位点、Sp2结合位点、HNF3A结合位点和HNF-1结合位点的结合位点。在一个方面，CRM6序列元件包含至少三个选自Sp1结合位点、Sp2结合位点、HNF3A结合位点和HNF-1结合位点的结合位点。在一个方面，TRE包含CRM6序列元件，其中CRM6序列元件包含Sp1结合位点、Sp2结合位点、HNF3A结合位点和HNF-1结合位点。

在一个方面，CRM6序列元件在hAAT序列元件的5’。任选地，CRM6序列元件在hAAT序列元件的5’的少于10个、少于8个或少于5个核苷酸处。任选地，CRM6序列元件紧邻hAAT序列元件的5'。在一个方面，CRM6序列元件在AMBP序列元件的5’。任选地，CRM6序列元件在AMBP序列元件的5’的少于10个、少于8个或少于5个核苷酸处。任选地，CRM6序列元件紧邻AMBP序列元件的5'。在一个方面，CRM6序列元件在AMBP序列元件的3’。任选地，CRM6序列元件在AMBP序列元件的3’的少于10个、少于8个或少于5个核苷酸处。任选地，CRM6序列元件紧邻AMBP序列元件的3'。在一个方面，CRM6序列元件在hAAT序列元件和AMBP序列元件两者的5’。在一个方面，CRM6序列元件在hAAT序列元件的5’和AMBP序列元件的3'。

在一个方面，包含CRM6序列元件的TRE与缺乏CRM6序列元件的相应TRE相比促进相等或更高的表达。技术人员可以使用标题“表达测定”下描述的技术通过确定由包含CRM6序列元件的测试TRE和参考TRE促进的表达水平来确定包含CRM6序列元件的TRE(测试TRE)是否促进与不包含CRM6序列元件的第二TRE(参考TRE)相等或更高的表达。任选地，用户通过创建包含在HCR-hAAT的5'的测试CRM6序列元件的测试TRE并将测试TRE的表达水平与HCR-hAAT(参考TRE)的表达水平进行比较来确定包含CRM6序列元件(测试CRM6序列元件)的TRE是否促进与不包含CRM6序列元件的参考TRE相等或更高的表达。如果测试TRE的表达水平等于或高于HCR-hAAT的表达水平，则TRE促进与不包含CRM6序列元件的相应TRE相等或更高的表达。

在一个方面，TRE包含ALDOB序列元件。ALDOB序列元件是来源于醛缩酶B基因的增强子的多核苷酸。ALDOB增强子在Gregori2002和Patwardhan等人2012中有更详细的描述。ALDOB的示例性序列如SEQ ID NO：102所示。

在一个实施方案中，TRE包含ALDOB序列元件，其中ALDOB序列元件包含SEQ ID NO：103或SEQ ID NO：103的在1、2或3个核苷酸上不同的变体的核苷酸序列。在一个实施方案中，TRE包含ALDOB序列元件，其中ALDOB序列元件包含SEQ ID NO：103的核苷酸序列。在一个实施方案中，TRE包含ALDOB序列元件，其中ALDOB序列元件包含SEQ ID NO：102或SEQ IDNO：102的在1、2或3个核苷酸上不同的变体的核苷酸序列。在一个实施方案中，TRE包含ALDOB序列元件，其中ALDOB序列元件包含SEQ ID NO：102的核苷酸序列。

ALDOB序列元件可包含一种或多种转录因子的结合位点。因此，在一个方面，ALDOB序列元件包含至少一个选自以下的结合位点：SP1结合位点、HNF1-a结合位点、C/EBP结合位点、GATA2结合位点、USF1结合位点和USF2结合位点。在一个方面，ALDOB序列元件包含至少两个选自以下的结合位点：SP1结合位点、HNF1-a结合位点、C/EBP结合位点、GATA2结合位点、USF1结合位点和USF2结合位点。在一个方面，ALDOB序列元件包含至少三个选自以下的结合位点：SP1结合位点、HNF1-a结合位点、C/EBP结合位点、GATA2结合位点、USF1结合位点和USF2结合位点。在一个方面，ALDOB序列元件包含至少四个选自以下的结合位点：SP1结合位点、HNF1-a结合位点、C/EBP结合位点、GATA2结合位点、USF1结合位点和USF2结合位点。在一个方面，ALDOB序列元件包含至少五个选自以下的结合位点：SP1结合位点、HNF1-a结合位点、C/EBP结合位点、GATA2结合位点、USF1结合位点和USF2结合位点。在一个方面，ALDOB序列元件包含至少一个SP1结合位点、至少一个HNF1-a结合位点、至少一个C/EBP结合位点、至少一个GATA2结合位点、至少一个USF1结合位点以及至少一个USF2结合位点。

在一个方面，ALDOB序列元件在hAAT序列元件的5’。任选地，ALDOB序列元件在hAAT序列元件的5’的少于10个、少于8个或少于5个核苷酸处。任选地，ALDOB序列元件紧邻hAAT序列元件的5'。在一个方面，ALDOB序列元件在AMBP序列元件的5’。任选地，ALDOB序列元件在AMBP序列元件的5’的少于10个、少于8个或少于5个核苷酸处。任选地，ALDOB序列元件紧邻AMBP序列元件的5'。在一个方面，ALDOB序列元件在AMBP序列元件的3’。任选地，ALDOB序列元件在AMBP序列元件的3’的少于10个、少于8个或少于5个核苷酸处。任选地，ALDOB序列元件紧邻AMBP序列元件的3'。在一个方面，ALDOB序列元件在hAAT序列元件和AMBP序列元件的5'。在一个方面，ALDOB序列元件在hAAT序列元件的5’和AMBP序列元件的3'。

在一个方面，包含ALDOB序列元件的TRE与缺乏ALDOB序列元件的相应TRE相比促进相等或更高的表达。技术人员可以使用标题“表达测定”下描述的技术通过确定由包含AMBP序列的测试TRE和参考TRE促进的表达水平来确定包含ALDOB序列元件的TRE(测试TRE)是否促进与不包含ALDOB序列元件的第二TRE(参考TRE)相等或更高的表达。任选地，用户通过创建包含在HCR-hAAT的5'的测试ALDOB序列元件的测试TRE并将测试TRE的表达水平与HCR-hAAT(参考TRE)的表达水平进行比较来确定包含ALDOB序列元件(测试ALDOB序列元件)的TRE是否促进与不包含ALDOB序列元件的参考TRE相等或更高的表达。如果测试TRE的表达水平等于或高于HCR-hAAT的表达水平，则TRE促进与不包含ALDOB序列元件的相应TRE相等或更高的表达。

在一个方面，TRE包含F2序列元件。F2序列元件是来源于凝血酶原基因增强子的多核苷酸。凝血酶原增强子的示例性序列如SEQ ID NO：104所示。

在一个实施方案中，TRE包含F2序列元件，其中F2序列元件包含SEQ ID NO：105或SEQ ID NO：105的在1、2或3个核苷酸上不同的变体的核苷酸序列。在一个实施方案中，TRE包含F2序列元件，其中F2序列元件包含SEQ ID NO：105的核苷酸序列。在一个实施方案中，TRE包含F2序列元件，其中F2序列元件包含SEQ ID NO：104或SEQ ID NO：104的在1、2或3个核苷酸上不同的变体的核苷酸序列。在一个实施方案中，TRE包含F2序列元件，其中F2序列元件包含SEQ ID NO：104的核苷酸序列。

F2序列元件可包含一种或多种转录因子的结合位点。因此，在一个方面，F2序列元件包含至少一个选自以下的结合位点：HNF4a结合位点、HNF3a结合位点、HNF1a结合位点、HNF3b结合位点、STAT3结合位点、RBPJ结合位点和SP3结合位点。在一个方面，F2序列元件包含至少两个选自以下的结合位点：HNF4a结合位点、HNF3a结合位点、HNF1a结合位点、HNF3b结合位点、STAT3结合位点、RBPJ结合位点和SP3结合位点。在一个方面，F2序列元件包含至少三个选自以下的结合位点：HNF4a结合位点、HNF3a结合位点、HNF1a结合位点、HNF3b结合位点、STAT3结合位点、RBPJ结合位点和SP3结合位点。在一个方面，F2序列元件包含至少四个选自以下的结合位点：HNF4a结合位点、HNF3a结合位点、HNF1a结合位点、HNF3b结合位点、STAT3结合位点、RBPJ结合位点和SP3结合位点。在一个方面，F2序列元件包含至少五个选自以下的结合位点：HNF4a结合位点、HNF3a结合位点、HNF1a结合位点、HNF3b结合位点、STAT3结合位点、RBPJ结合位点和SP3结合位点。在一个方面，F2序列元件包含至少六个选自以下的结合位点：HNF4a结合位点、HNF3a结合位点、HNF1a结合位点、HNF3b结合位点、STAT3结合位点、RBPJ结合位点和SP3结合位点。在一个方面，TRE包含F2序列元件，其中F2序列元件包含HNF4a结合位点、HNF3a结合位点、HNF1a结合位点、HNF3b结合位点、STAT3结合位点、RBPJ结合位点和SP3结合位点。

在一个方面，F2序列元件在hAAT序列元件的5’。任选地，F2序列元件在hAAT序列元件的5’的少于10个、少于8个或少于5个核苷酸处。任选地，F2序列元件紧邻hAAT序列元件的5'。在一个方面，F2序列元件在AMBP序列元件的5’。任选地，F2序列元件在AMBP序列元件的5’的少于10个、少于8个或少于5个核苷酸处。任选地，F2序列元件紧邻AMBP序列元件的5'。在一个方面，F2序列元件在AMBP序列元件的3’。任选地，F2序列元件在AMBP序列元件的3’的少于10个、少于8个或少于5个核苷酸处。任选地，F2序列元件紧邻AMBP序列元件的5'。在一个方面，F2序列元件在hAAT序列元件和AMBP序列元件两者的5’。在一个方面，F2序列元件在hAAT序列元件的5’和AMBP序列元件的3'。

在一个方面，包含F2序列元件的TRE与缺乏F2序列元件的相应TRE相比促进相等或更高的表达。技术人员可以使用标题“表达测定”下描述的技术通过确定由包含F2序列元件的测试TRE和参考TRE促进的表达水平来确定包含F2序列元件的TRE(测试TRE)是否促进与不包含F2序列元件的第二TRE(参考TRE)相等或更高的表达。任选地，用户通过创建包含在HCR-hAAT的5'的测试F2序列元件的测试TRE并将测试TRE的表达水平与HCR-hAAT(参考TRE)的表达水平进行比较来确定包含F2序列元件(测试F2序列元件)的TRE是否促进与不包含F2序列元件的参考TRE相等或更高的表达。如果测试TRE的表达水平等于或高于HCR-hAAT的表达水平，则TRE促进与不包含F2序列元件的相应TRE相等或更高的表达。

在一个实施方案中，TRE(例如NP1)包括：

(i)AMBP序列元件；和

(ii)hAAT序列元件，

其中：

(i)AMBP序列元件包含SEQ ID NO：97的核苷酸序列；

(ii)hAAT序列元件包含SEQ ID NO：94的核苷酸序列；

(iii)AMBP序列元件在hAAT序列元件的5’；和

(iv)TRE的长度为550到600个核苷酸。

在一个实施方案中，TRE(例如NP2)包括：

(i)AMBP序列元件；

(ii)hAAT序列元件；和

(iii)ApoE-HCR1序列元件，

其中：

(i)AMBP序列元件包含SEQ ID NO：97的核苷酸序列；

(ii)hAAT序列元件包含SEQ ID NO：94的核苷酸序列；

(iii)ApoE-HCR1序列元件包含SEQ ID NO：92的核苷酸序列；

(iv)AMBP序列元件在hAAT序列元件的5’；

(v)ApoE-HCR1序列元件在AMBP序列元件和hAAT序列元件两者的5'；和

(vi)TRE的长度为875到925个核苷酸。

在一个实施方案中，TRE(例如NP3)包括：

(i)AMBP序列元件；

(ii)hAAT序列元件；和

(iii)ApoE-HCR1序列元件，

其中：

(i)AMBP序列元件包含SEQ ID NO：97的核苷酸序列；

(ii)hAAT序列元件包含SEQ ID NO：94的核苷酸序列；

(iii)ApoE-HCR1序列元件包含SEQ ID NO：92的核苷酸序列；

(iv)AMBP序列元件在hAAT序列元件的5’；

(v)ApoE-HCR1序列元件在hAAT序列元件的5'和AMBP序列元件的3'；和

(vi)TRE的长度为875到925个核苷酸。

在一个实施方案中，TRE(例如NP4)包括：

(i)AMBP序列元件；

(ii)hAAT序列元件；和

(iii)F2序列元件，

其中：

(i)AMBP序列元件包含SEQ ID NO：97的核苷酸序列；

(ii)hAAT序列元件包含长度为300和350个核苷酸的SEQ ID NO：94的片段；

(iii)hAAT序列元件包含SEQ ID NO：95的核苷酸序列；

(iv)F2序列元件包含SEQ ID NO：104的核苷酸序列；

(v)AMBP序列元件在hAAT序列元件的5’；

(vi)F2序列元件在AMBP序列元件和hAAT序列元件两者的5’；和

(vii)TRE的长度为550到600个核苷酸。

在一个实施方案中，TRE(例如NP5)包括：

(i)AMBP序列元件；

(ii)hAAT序列元件；

(iii)ApoE-HCR1序列元件；

(iv)CRM6序列元件；和

(v)ALDOB序列元件，

其中：

(i)AMBP序列元件包含SEQ ID NO：97的核苷酸序列；

(ii)hAAT序列元件包含SEQ ID NO：94的核苷酸序列；

(iii)ApoE-HCR1序列元件包含SEQ ID NO：92的核苷酸序列；

(iv)CRM6序列元件包含SEQ ID NO：99的核苷酸序列；

(v)ALDOB序列元件包含SEQ ID NO：102的核苷酸序列；

(vi)AMBP序列元件在hAAT序列元件的5’；

(vii)ApoE-HCR1序列元件在AMBP序列元件和hAAT序列元件两者的5’；

(viii)CRM6序列元件在AMBP序列元件、hAAT序列元件、ApoE-HCR1序列元件的5'；

(ix)ALDOB序列元件在hAAT序列元件的5’和AMBP序列元件的3'；和

(x)TRE的长度为1600到1650个核苷酸。

在一个实施方案中，TRE(例如NP6)包括：

(i)AMBP序列元件；

(ii)第一hAAT序列元件；

(iii)第二hAAT序列元件；

(iv)F2序列元件；和

(v)ALDOB序列元件，

其中：

(i)AMBP序列元件包含SEQ ID NO：97的核苷酸序列；

(ii)hAAT序列元件包含SEQ ID NO：94的核苷酸序列；

(iii)第二hAAT序列元件包含SEQ ID NO：95的核苷酸序列；

(iv)F2序列元件包含SEQ ID NO：104的核苷酸序列；

(v)ALDOB序列元件包含SEQ ID NO：102的核苷酸序列；

(vi)AMBP序列元件在hAAT序列元件的5’；

(vii)第二hAAT序列元件在AMBP序列元件和hAAT序列元件两者的5’；

(viii)F2序列元件在AMBP序列元件、hAAT序列元件和第二hAAT序列元件的5'；

(ix)ALDOB序列元件在hAAT序列元件、AMBP序列元件、第二hAAT序列元件和F2序列元件的5'；和

(x)TRE的长度为1350到1400个核苷酸。

在一个实施方案中，TRE(例如NP7)包括：

(i)AMBP序列元件；

(ii)hAAT序列元件；

(iii)ApoE-HCR1序列元件；和

(iv)ALDOB序列元件，

其中：

(i)AMBP序列元件包含SEQ ID NO：97的核苷酸序列；

(ii)hAAT序列元件包含SEQ ID NO：94的核苷酸序列；

(iii)ApoE-HCR1序列元件包含SEQ ID NO：92的核苷酸序列；

(iv)ALDOB序列元件包含SEQ ID NO：102的核苷酸序列；

(v)AMBP序列元件在hAAT序列元件的5’；

(vi)ApoE-HCR1序列元件在AMBP序列元件和hAAT序列元件两者的5’；

(vii)ALDOB序列元件在hAAT序列元件、AMBP序列元件和ApoE-HCR1序列元件的5'；和

(viii)TRE的长度为1450到1500个核苷酸。

转录因子结合位点是转录因子可以结合的核苷酸序列。转录因子与转录因子结合位点的结合可导致包含所述结合位点的多核苷酸的表达水平发生变化。表1提供了几个转录因子结合位点的示例性序列，但本领域技术人员会理解该列表并非详尽无遗，并且转录因子可能结合替代位点。

/>

在一个方面，TRE包含一个或多个转录因子结合位点。在一个方面，TRE包括

a)TATA盒子；

b)HNF6结合位点；

c)HNF4a结合位点；

d)HNF1结合位点；和/或

e)HNF3结合位点。

在一个方面，TRE包含TATA盒，任选地是经典TATA盒，任选地其中TRE包含hAAT序列元件并且TATA盒被***到hAAT序列元件中。

经典TATA盒是富含AT的核苷酸序列，能够结合TATA结合蛋白(TBP)，其包含核苷酸序列TATA，例如TATAAAA(SEQ ID NO：200)是经典TATA盒。非经典TATA盒是富含AT的核苷酸序列，能够结合TATA结合蛋白(TBP)，其不包含核苷酸序列TATA，例如TTAAATA(SEQ ID NO：201)。hAAT序列元件可包含非经典TATA盒。TRE可包含hAAT序列元件，其中hAAT序列元件包含非经典TATA盒。

hAAT序列元件可以包含SEQ ID NO：95或SEQ ID NO：95的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且TATA盒可以在SEQ ID NO：95或SEQ ID NO：95的变体的核苷酸序列的3'。hAAT序列元件可以包含SEQ ID NO：95或SEQ ID NO：95的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且TATA盒可以在SEQ ID NO：95或SEQ ID NO：95的变体的核苷酸序列的5'。

与不包含TATA盒的相应TRE相比，TRE可以促进相等或更高的表达。

在一个方面，包含TATA盒的TRE与缺乏TATA盒的相应TRE相比促进相等或更高的表达。技术人员可以使用标题“表达测定”下描述的技术通过确定由包含TATA盒的测试TRE和参考TRE促进的表达水平来确定包含TATA盒的TRE(测试TRE)是否促进与不包含TATA盒的第二TRE(参考TRE)相等或更高的表达。任选地，用户通过创建包含在HCR-hAAT的5'的测试TATA盒的测试TRE并将测试TRE的表达水平与HCR-hAAT(参考TRE)的表达水平进行比较来确定包含TATA盒(测试TATA盒)的TRE是否促进与不包含TATA盒的参考TRE相等或更高的表达。如果测试TRE的表达水平等于或高于HCR-hAAT的表达水平，则TRE促进与不包含TATA盒的相应TRE相等或更高的表达。

在一个方面，TRE包含HNF6结合位点。任选地，HNF6结合位点具有SEQ ID NO：156或157的核苷酸序列。

在一个方面，TRE包含HNF6结合位点，并且：

a.TRE包含hAAT序列元件，其包含SEQ ID NO：95或SEQ ID NO：95的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且HNF6结合位点在包含SEQ ID NO：95或SEQ ID NO：95的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的5’；和/或

b.TRE包含hAAT序列元件，其包含SEQ ID NO：96或SEQ ID NO：96的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且HNF6结合位点在包含SEQ ID NO：96或SEQ ID NO：96的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的5’；和/或

c.TRE包含hAAT序列元件，其包含SEQ ID NO：94或SEQ ID NO：94的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且HNF6结合位点在包含SEQ ID NO：94或SEQ ID NO：94的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的5’；和/或

d.TRE包含hAAT序列元件，其包含SEQ ID NO：95或SEQ ID NO：95的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且HNF6结合位点在包含SEQ ID NO：95或SEQ ID NO：95的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的3’；和/或

e.TRE包含hAAT序列元件，其包含SEQ ID NO：96或SEQ ID NO：96的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且HNF6结合位点在包含SEQ ID NO：96或SEQ ID NO：96的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的3’；和/或

f.TRE包含hAAT序列元件，其包含SEQ ID NO：94或SEQ ID NO：94的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且HNF6结合位点在包含SEQ ID NO：94或SEQ ID NO：94的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的3’；和/或

g.TRE包含ApoE-HCR1序列元件，其包含SEQ ID NO：93或SEQ ID NO：93的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且HNF6结合位点在包含SEQ ID NO：93或SEQ IDNO：93的在1、2或3个核苷酸上不同的变体的核苷酸序列的ApoE-HCR1序列元件的3’；和/或

h.TRE包含ApoE-HCR1序列元件，其包含SEQ ID NO：92或SEQ ID NO：92的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且HNF6结合位点在包含SEQ ID NO：92或SEQ IDNO：92的在1、2或3个核苷酸上不同的变体的核苷酸序列的ApoE-HCR1序列元件的3’；和/或

i.TRE包含ApoE-HCR1序列元件，其包含SEQ ID NO：93或SEQ ID NO：93的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且HNF6结合位点在包含SEQ ID NO：93或SEQ IDNO：93的在1、2或3个核苷酸上不同的变体的核苷酸序列的ApoE-HCR1序列元件的5’；和/或

j.TRE包含ApoE-HCR1序列元件，其包含SEQ ID NO：92或SEQ ID NO：92的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且HNF6结合位点在包含SEQ ID NO：92或SEQ IDNO：92的在1、2或3个核苷酸上不同的变体的核苷酸序列的ApoE-HCR1序列元件的5’；和/或

k.TRE包含AMBP序列元件，其包含SEQ ID NO：98或SEQ ID NO：98的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且HNF6结合位点在包含SEQ ID NO：98或SEQ ID NO：98的在1、2或3个核苷酸上不同的变体的核苷酸序列的AMBP序列元件的3’；和/或

l.TRE包含AMBP序列元件，其包含SEQ ID NO：97或SEQ ID NO：97的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且HNF6结合位点在包含SEQ ID NO：97或SEQ ID NO：97的在1、2或3个核苷酸上不同的变体的核苷酸序列的AMBP序列元件的3’；和/或

m.TRE包含AMBP序列元件，其包含SEQ ID NO：98或SEQ ID NO：98的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且HNF6结合位点在包含SEQ ID NO：98或SEQ ID NO：98的在1、2或3个核苷酸上不同的变体的核苷酸序列的AMBP序列元件的5’；和/或

n.TRE包含AMBP序列元件，其包含SEQ ID NO：97或SEQ ID NO：97的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且HNF6结合位点在包含SEQ ID NO：97或SEQ ID NO：97的在1、2或3个核苷酸上不同的变体的核苷酸序列的AMBP序列元件的5’。

TRE可以促进与不包含HNF6结合位点的相应TRE相等或更高的表达。

在一个方面，包含HNF6结合位点的TRE与缺乏HNF6结合位点的相应TRE促进相等或更高的表达。技术人员可以使用标题“表达测定”下描述的技术通过确定由包含HNF6结合位点的测试TRE和参考TRE促进的表达水平来确定包含HNF6结合位点的TRE(测试TRE)是否促进与不包含HNF6结合位点的第二TRE(参考TRE)相等或更高的表达。任选地，用户通过创建包含在HCR-hAAT的5'的测试HNF6结合位点的测试TRE并将测试TRE的表达水平与HCR-hAAT(参考TRE)的表达水平进行比较来确定包含HNF6结合位点(测试HNF6结合位点)的TRE是否促进与不包含HNF6结合位点的参考TRE相等或更高的表达。如果测试TRE的表达水平等于或高于HCR-hAAT的表达水平，则TRE促进与不包含HNF6结合位点的相应TRE相等或更高的表达。

包含HNF6结合位点和TATA盒的TRE可以促进与不包含HNF6结合位点和TATA盒的相应TRE相等或更高的表达。

在一个方面，TRE进一步包含HNF4a结合位点。任选地，HNF4a结合位点具有SEQ IDNO：151-154中任一个的核苷酸序列。

在一个方面，TRE包含HNF4a结合位点，并且：

a.TRE包含hAAT序列元件，其包含SEQ ID NO：95或SEQ ID NO：95的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且HNF4a结合位点在包含SEQ ID NO：95或SEQ ID NO：95的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的5’；和/或

b.TRE包含hAAT序列元件，其包含SEQ ID NO：96或SEQ ID NO：96的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且HNF4a结合位点在包含SEQ ID NO：96或SEQ ID NO：96的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的5’；和/或

c.TRE包含hAAT序列元件，其包含SEQ ID NO：94或SEQ ID NO：94的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且HNF4a结合位点在包含SEQ ID NO：94或SEQ ID NO：94的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的5’；和/或

d.TRE包含ApoE-HCR1序列元件，其包含SEQ ID NO：93或SEQ ID NO：93的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且HNF4a结合位点在包含SEQ ID NO：93或SEQ IDNO：93的在1、2或3个核苷酸上不同的变体的核苷酸序列的ApoE-HCR1序列元件的3’；和/或

e.TRE包含ApoE-HCR1序列元件，其包含SEQ ID NO：93或SEQ ID NO：93的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且HNF4a结合位点在包含SEQ ID NO：93或SEQ IDNO：93的在1、2或3个核苷酸上不同的变体的核苷酸序列的ApoE-HCR1序列元件的5’；和/或

f.TRE包含ApoE-HCR1序列元件，其包含SEQ ID NO：92或SEQ ID NO：92的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且HNF4a结合位点在包含SEQ ID NO：92或SEQ IDNO：92的在1、2或3个核苷酸上不同的变体的核苷酸序列的ApoE-HCR1序列元件的5’；和/或

g.TRE包含AMBP序列元件，其包含SEQ ID NO：98或SEQ ID NO：98的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且HNF4a结合位点在包含SEQ ID NO：98或SEQ ID NO：98的在1、2或3个核苷酸上不同的变体的核苷酸序列的AMBP序列元件的3’；和/或

h.TRE包含AMBP序列元件，其包含SEQ ID NO：97或SEQ ID NO：97的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且HNF4a结合位点在包含SEQ ID NO：97或SEQ ID NO：97的在1、2或3个核苷酸上不同的变体的核苷酸序列的AMBP序列元件的3’；和/或

i.TRE包含AMBP序列元件，其包含SEQ ID NO：98或SEQ ID NO：98的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且HNF4a结合位点在包含SEQ ID NO：98或SEQ ID NO：98的在1、2或3个核苷酸上不同的变体的核苷酸序列的AMBP序列元件的5’；和/或

j.TRE包含AMBP序列元件，其包含SEQ ID NO：97或SEQ ID NO：97的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且HNF4a结合位点在包含SEQ ID NO：97或SEQ ID NO：97的在1、2或3个核苷酸上不同的变体的核苷酸序列的AMBP序列元件的5’。

TRE可以促进与不包含HNF4a结合位点的相应TRE相等或更高的表达。

在一个方面，包含HNF4a结合位点的TRE比缺乏HNF4a结合位点的相应TRE促进相等或更高的表达。技术人员可以使用标题“表达测定”下描述的技术通过确定由包含HNF4a结合位点的测试TRE和参考TRE促进的表达水平来确定包含HNF4a结合位点的TRE(测试TRE)是否促进与不包含HNF4a结合位点的第二TRE(参考TRE)相等或更高的表达。任选地，用户通过创建包含在HCR-hAAT的5'的测试HNF4a结合位点的测试TRE并将测试TRE的表达水平与HCR-hAAT(参考TRE)的表达水平进行比较来确定包含HNF4a结合位点(测试HNF4a结合位点)的TRE是否促进与不包含HNF4a结合位点的参考TRE相等或更高的表达。如果测试TRE的表达水平等于或高于HCR-hAAT的表达水平，则TRE促进与不包含HNF4a结合位点的相应TRE相等或更高的表达。

包含HNF6结合位点和HNF4a结合位点的TRE可以促进与不包含HNF6结合位点和HNF4a结合位点的相应TRE相等或更高的表达。

在一个方面，TRE进一步包含HNF1结合位点。任选地，HNF1结合位点具有SEQ IDNO：133或134的核苷酸序列。

在一个方面，TRE包含HNF1结合位点，并且：

a.TRE包含hAAT序列元件，其包含SEQ ID NO：95或SEQ ID NO：95的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且HNF1结合位点在包含SEQ ID NO：95或SEQ ID NO：95的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的5’；和/或

b.TRE包含hAAT序列元件，其包含SEQ ID NO：96或SEQ ID NO：96的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且HNF1结合位点在包含SEQ ID NO：96或SEQ ID NO：96的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的5’；和/或

c.TRE包含hAAT序列元件，其包含SEQ ID NO：94或SEQ ID NO：94的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且HNF1结合位点在包含SEQ ID NO：94或SEQ ID NO：94的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的5’；和/或

d.TRE包含ApoE-HCR1序列元件，其包含SEQ ID NO：93或SEQ ID NO：93的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且HNF1结合位点在包含SEQ ID NO：93或SEQ IDNO：93的在1、2或3个核苷酸上不同的变体的核苷酸序列的ApoE-HCR1序列元件的3’；和/或

e.TRE包含ApoE-HCR1序列元件，其包含SEQ ID NO：92或SEQ ID NO：92的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且HNF1结合位点在包含SEQ ID NO：92或SEQ IDNO：92的在1、2或3个核苷酸上不同的变体的核苷酸序列的ApoE-HCR1序列元件的3’；和/或

f.TRE包含AMBP序列元件，其包含SEQ ID NO：98或SEQ ID NO：98的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且HNF1结合位点在包含SEQ ID NO：98或SEQ ID NO：98的在1、2或3个核苷酸上不同的变体的核苷酸序列的AMBP序列元件的3’；和/或

g.TRE包含AMBP序列元件，其包含SEQ ID NO：97或SEQ ID NO：97的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且HNF1结合位点在包含SEQ ID NO：97或SEQ ID NO：97的在1、2或3个核苷酸上不同的变体的核苷酸序列的AMBP序列元件的3’。

TRE可以促进与不包含HNF1结合位点的相应TRE相等或更高的表达。

在一个方面，包含HNF1结合位点的TRE与缺乏HNF1结合位点的相应TRE促进相等或更高的表达。技术人员可以使用标题“表达测定”下描述的技术通过确定由包含HNF1结合位点的测试TRE和参考TRE促进的表达水平来确定包含HNF1结合位点的TRE(测试TRE)是否促进与不包含HNF1结合位点的第二TRE(参考TRE)相等或更高的表达。任选地，用户通过创建包含在HCR-hAAT的5'的测试HNF1结合位点的测试TRE并将测试TRE的表达水平与HCR-hAAT(参考TRE)的表达水平进行比较来确定包含HNF1结合位点(测试HNF1结合位点)的TRE是否促进与不包含HNF1结合位点的参考TRE相等或更高的表达。如果测试TRE的表达水平等于或高于HCR-hAAT的表达水平，则TRE促进与不包含HNF1结合位点的相应TRE相等或更高的表达。

包含HNF6结合位点、HNF4a结合位点和TATA盒的TRE可以促进与不包含HNF6结合位点、HNF4a结合位点和TATA盒的相应TRE相等或更高的表达。

在一个方面，TRE进一步包含HNF3结合位点。任选地，HNF3结合位点具有SEQ IDNO：142-144中任一个的核苷酸序列。

在一个方面，TRE包含HNF3结合位点，并且：

a.TRE包含hAAT序列元件，其包含SEQ ID NO：95或SEQ ID NO：95的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且HNF3结合位点在包含SEQ ID NO：95或SEQ ID NO：95的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的5’；和/或

b.TRE包含hAAT序列元件，其包含SEQ ID NO：96或SEQ ID NO：96的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且HNF3结合位点在包含SEQ ID NO：96或SEQ ID NO：96的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的5’；和/或

c.TRE包含hAAT序列元件，其包含SEQ ID NO：94或SEQ ID NO：94的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且HNF3结合位点在包含SEQ ID NO：94或SEQ ID NO：94的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的5’；和/或

d.TRE包含ApoE-HCR1序列元件，其包含SEQ ID NO：93或SEQ ID NO：93的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且HNF3结合位点在包含SEQ ID NO：93或SEQ IDNO：93的在1、2或3个核苷酸上不同的变体的核苷酸序列的ApoE-HCR1序列元件的3’；和/或

e.TRE包含ApoE-HCR1序列元件，其包含SEQ ID NO：92或SEQ ID NO：92的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且HNF3结合位点在包含SEQ ID NO：92或SEQ IDNO：92的在1、2或3个核苷酸上不同的变体的核苷酸序列的ApoE-HCR1序列元件的3’；和/或

f.TRE包含AMBP序列元件，其包含SEQ ID NO：98或SEQ ID NO：98的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且HNF3结合位点在包含SEQ ID NO：98或SEQ ID NO：98的在1、2或3个核苷酸上不同的变体的核苷酸序列的AMBP序列元件的3’；和/或

g.TRE包含AMBP序列元件，其包含SEQ ID NO：97或SEQ ID NO：97的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且HNF3结合位点在包含SEQ ID NO：97或SEQ ID NO：97的在1、2或3个核苷酸上不同的变体的核苷酸序列的AMBP序列元件的3’。

TRE可以促进与不包含HNF3结合位点的相应TRE相等或更高的表达。

在一个方面，包含HNF3结合位点的TRE与缺乏HNF3结合位点的相应TRE促进相等或更高的表达。技术人员可以使用标题“表达测定”下描述的技术通过确定由包含HNF3结合位点的测试TRE和参考TRE促进的表达水平来确定包含HNF3结合位点的TRE(测试TRE)是否促进与不包含HNF3结合位点的第二TRE(参考TRE)相等或更高的表达。任选地，用户通过创建包含在HCR-hAAT的5'的测试HNF3结合位点的测试TRE并将测试TRE的表达水平与HCR-hAAT(参考TRE)的表达水平进行比较来确定包含HNF3结合位点(测试HNF3结合位点)的TRE是否促进与不包含HNF3结合位点的参考TRE相等或更高的表达。如果测试TRE的表达水平等于或高于HCR-hAAT的表达水平，则TRE促进与不包含HNF3结合位点的相应TRE相等或更高的表达。

包含HNF3结合位点和TATA盒的TRE并且TRE可以促进与不包含HNF3结合位点和TATA盒的相应TRE相等或更高的表达。

在一个实施方案中，TRE包括：

(i)AMBP序列元件；

(ii)hAAT序列元件；

(iii)ApoE-HCR1序列元件；

(iv)转录起始位点(TSS)；和

(v)TATA盒，

其中：

(i)AMBP序列元件包含SEQ ID NO：97的核苷酸序列；

(ii)hAAT序列元件包含SEQ ID NO：94的核苷酸序列；

(iii)ApoE-HCR1序列元件包含SEQ ID NO：92的核苷酸序列；

(iv)AMBP序列元件在hAAT序列元件的5’；

(v)ApoE-HCR1序列元件在hAAT序列元件的5'和AMBP序列元件的3'；

(vi)TATA盒位于距离TSS的-37位置；和

(vii)TRE的长度为875到925个核苷酸。

在一个实施方案中，TRE包括：

(i)AMBP序列元件；

(ii)hAAT序列元件；

(iii)ApoE-HCR1序列元件；

(iv)HNF6结合位点；

(v)HNF4a结合位点；

(vi)TATA盒；和

(vii)第二个HNF6结合位点，

其中：

(i)AMBP序列元件包含SEQ ID NO：97的核苷酸序列；

(ii)hAAT序列元件包含SEQ ID NO：94的核苷酸序列；

(iii)ApoE-HCR1序列元件包含SEQ ID NO：92的核苷酸序列；

(iv)AMBP序列元件在hAAT序列元件的5’；

(v)ApoE-HCR1序列元件在hAAT序列元件的5'和AMBP序列元件的3'；

(vi)HNF6结合位点在AMBP序列元件的3'和ApoE-HCR1序列元件的5'；

(vii)HNF4a结合位点在ApoE-HCR-1序列元件的3'和hAAT序列元件的5'；

(viii)TATA盒紧邻对应于SEQ ID NO：95的核苷酸序列的核苷酸序列的5'；

(ix)第二个HNF6结合位点紧邻对应于SEQ ID NO：95的核苷酸序列的核苷酸序列的3'；和

(x)TRE的长度为900到950个核苷酸。

在一个实施方案中，TRE包括：

(i)AMBP序列元件；

(ii)hAAT序列元件；

(iii)ApoE-HCR1序列元件；

(iv)HNF6结合位点；

(v)HNF1结合位点；

(vi)HNF4a结合位点；

(vii)TATA盒；和

(viii)第二个HNF6结合位点，

其中：

(i)AMBP序列元件包含SEQ ID NO：97的核苷酸序列；

(ii)hAAT序列元件包含SEQ ID NO：94的核苷酸序列；

(iii)ApoE-HCR1序列元件包含SEQ ID NO：92的核苷酸序列；

(iv)AMBP序列元件在hAAT序列元件的5’；

(v)ApoE-HCR1序列元件在hAAT序列元件的5'和AMBP序列元件的3'；

(vi)HNF6结合位点在AMBP序列元件的3'和ApoE-HCR1序列元件的5'；

(vii)HNF1结合位点紧邻HNF4a结合位点的3'；

(viii)HNF4a结合位点在ApoE-HCR-1序列元件的3'和hAAT序列元件的5'；

(ix)TATA盒紧邻对应于SEQ ID NO：95的核苷酸序列的核苷酸序列的5'；

(x)第二个HNF6结合位点紧邻对应于SEQ ID NO：95的核苷酸序列的核苷酸序列的3'；和

(xi)TRE的长度为900到950个核苷酸。

在一个实施方案中，TRE包括：

(i)AMBP序列元件；

(ii)hAAT序列元件；

(iii)ApoE-HCR1序列元件；

(iv)HNF3结合位点；和

(v)TATA盒，

其中：

(i)AMBP序列元件包含SEQ ID NO：97的核苷酸序列；

(ii)hAAT序列元件包含SEQ ID NO：94的核苷酸序列；

(iii)ApoE-HCR1序列元件包含SEQ ID NO：92的核苷酸序列；

(iv)AMBP序列元件在hAAT序列元件的5’；

(v)ApoE-HCR1序列元件在hAAT序列元件的5'和AMBP序列元件的3'；

(vi)HNF3结合位点在ApoE-HCR1序列元件的3'和hAAT序列元件的5'；

(vii)TATA盒紧邻对应于SEQ ID NO：95的核苷酸序列的核苷酸序列的5'；和

(viii)TRE的长度为875到925个核苷酸。

在一个实施方案中，TRE包括：

(i)AMBP序列元件；

(ii)hAAT序列元件；

(iii)ApoE-HCR1序列元件；

(iv)HNF6结合位点；和

(v)TATA盒，

其中：

(i)AMBP序列元件包含SEQ ID NO：97的核苷酸序列；

(ii)hAAT序列元件包含SEQ ID NO：94的核苷酸序列；

(iii)ApoE-HCR1序列元件包含SEQ ID NO：92的核苷酸序列；

(iv)AMBP序列元件在hAAT序列元件的5’；

(v)ApoE-HCR1序列元件在hAAT序列元件的5'和AMBP序列元件的3'；

(vi)HNF6结合位点在AMBP序列元件的3'和ApoE-HCR1序列元件的5'；

(viii)TRE的长度为875到925个核苷酸。

在一个实施方案中，TRE包括：

(i)AMBP序列元件；

(ii)hAAT序列元件；

(iii)ApoE-HCR1序列元件；和

(iv)HNF6结合位点，

其中：

(i)AMBP序列元件包含SEQ ID NO：97的核苷酸序列；

(ii)hAAT序列元件包含SEQ ID NO：94的核苷酸序列；

(iii)ApoE-HCR1序列元件包含SEQ ID NO：92的核苷酸序列；

(iv)AMBP序列元件在hAAT序列元件的5’；

(v)ApoE-HCR1序列元件在hAAT序列元件的5'和AMBP序列元件的3'；

(vi)HNF6结合位点在AMBP序列元件的3'和ApoE-HCR1序列元件的5'；和

(vii)TRE的长度为875到925个核苷酸。

在一个实施方案中，TRE包括：

(i)AMBP序列元件；

(ii)hAAT序列元件；

(iii)ApoE-HCR1序列元件；和

(iv)HNF4结合位点，

其中：

(i)AMBP序列元件包含SEQ ID NO：97的核苷酸序列；

(ii)hAAT序列元件包含SEQ ID NO：94的核苷酸序列；

(iii)ApoE-HCR1序列元件包含SEQ ID NO：92的核苷酸序列；

(iv)AMBP序列元件在hAAT序列元件的5’；

(v)ApoE-HCR1序列元件在hAAT序列元件的5'和AMBP序列元件的3'；

(vi)HNF4结合位点在AMBP序列元件的3'和ApoE-HCR1序列元件的5'；和

(vii)TRE的长度为875到925个核苷酸。

在一个实施方案中，TRE包括：

(i)AMBP序列元件；

(ii)hAAT序列元件；

(iii)ApoE-HCR1序列元件；和

(iv)HNF6结合位点，

其中：

(i)AMBP序列元件包含SEQ ID NO：97的核苷酸序列；

(ii)hAAT序列元件包含SEQ ID NO：94的核苷酸序列；

(iii)ApoE-HCR1序列元件包含SEQ ID NO：92的核苷酸序列；

(iv)AMBP序列元件在hAAT序列元件的5’；

(v)ApoE-HCR1序列元件在hAAT序列元件的5'和AMBP序列元件的3'；

(vi)HNF6结合位点在ApoE-HCR1序列元件的3'和hAAT序列元件的5'；和

(vii)TRE的长度为875到925个核苷酸。

在一个实施方案中，TRE包括：

(i)AMBP序列元件；

(ii)hAAT序列元件；

(iii)ApoE-HCR1序列元件；和

(iv)HNF4结合位点，

其中：

(i)AMBP序列元件包含SEQ ID NO：97的核苷酸序列；

(ii)hAAT序列元件包含SEQ ID NO：94的核苷酸序列；

(iii)ApoE-HCR1序列元件包含SEQ ID NO：92的核苷酸序列；

(iv)AMBP序列元件在hAAT序列元件的5’；

(v)ApoE-HCR1序列元件在hAAT序列元件的5'和AMBP序列元件的3'；

(vi)HNF4结合位点在ApoE-HCR1序列元件的3'和hAAT序列元件的5'；和

(vii)TRE的长度为875到925个核苷酸。

在一个实施方案中，TRE包括：

(i)AMBP序列元件；

(ii)hAAT序列元件；

(iii)ApoE-HCR1序列元件；和

(iv)HNF4结合位点，

其中：

(i)AMBP序列元件包含SEQ ID NO：97的核苷酸序列；

(ii)hAAT序列元件包含SEQ ID NO：94的核苷酸序列；

(iii)ApoE-HCR1序列元件包含SEQ ID NO：92的核苷酸序列；

(iv)AMBP序列元件在hAAT序列元件的5’；

(v)ApoE-HCR1序列元件在hAAT序列元件的5’和AMBP序列元件的3'；

(vi)HNF4结合位点紧邻对应于SEQ ID NO：93的核苷酸序列的核苷酸序列的3'；和

(vii)TRE的长度为875到925个核苷酸。

在一个实施方案中，TRE包括：

(i)AMBP序列元件；

(ii)hAAT序列元件；

(iii)ApoE-HCR1序列元件；

(iv)HNF6结合位点；和

(v)TATA盒，

其中：

(i)AMBP序列元件包含SEQ ID NO：97的核苷酸序列；

(ii)hAAT序列元件包含SEQ ID NO：94的核苷酸序列；

(iii)ApoE-HCR1序列元件包含SEQ ID NO：92的核苷酸序列；

(iv)AMBP序列元件在hAAT序列元件的5’；

(v)ApoE-HCR1序列元件在hAAT序列元件的5’和AMBP序列元件的3'；

(vi)HNF6结合位点紧邻对应于SEQ ID NO：95的核苷酸序列的核苷酸序列的3'；

(vii)TATA盒紧邻HNF6结合位点的5'；和

(viii)TRE的长度为875到925个核苷酸。

在一个实施方案中，TRE包括：

(i)AMBP序列元件；

(ii)hAAT序列元件；

(iii)ApoE-HCR1序列元件；

(iv)HNF4结合位点；和

(v)HNF6结合位点，

其中：

(i)AMBP序列元件包含SEQ ID NO：97的核苷酸序列；

(ii)hAAT序列元件包含SEQ ID NO：94的核苷酸序列；

(iii)ApoE-HCR1序列元件包含SEQ ID NO：92的核苷酸序列；

(iv)AMBP序列元件在hAAT序列元件的5’；

(v)ApoE-HCR1序列元件在hAAT序列元件的5’和AMBP序列元件的3'；

(vi)HNF4结合位点在ApoE-HCR1序列元件的3’和hAAT序列元件的5'；

(vii)HNF6结合位点在AMBP序列元件的3’和ApoE-HCR1序列元件的5'；和

(viii)TRE的长度为875到925个核苷酸。

在一个实施方案中，TRE包括：

(i)AMBP序列元件；

(ii)hAAT序列元件；

(iii)ApoE-HCR1序列元件；

(iv)HNF6结合位点；和

(v)HNF4结合位点，

其中：

(i)AMBP序列元件包含SEQ ID NO：97的核苷酸序列；

(ii)hAAT序列元件包含SEQ ID NO：94的核苷酸序列；

(iii)ApoE-HCR1序列元件包含SEQ ID NO：92的核苷酸序列；

(iv)AMBP序列元件在hAAT序列元件的5’；

(v)ApoE-HCR1序列元件在hAAT序列元件的5’和AMBP序列元件的3'；

(vi)HNF6结合位点在ApoE-HCR1序列元件的3’和hAAT序列元件的5'；

(vii)HNF4结合位点在AMBP序列元件的3’和ApoE-HCR1序列元件的5'；和

(viii)TRE的长度为875到925个核苷酸。

在一个实施方案中，TRE包括：

(i)AMBP序列元件；

(ii)hAAT序列元件；

(iii)ApoE-HCR1序列元件；

(iv)HNF6结合位点；和

(v)TATA盒，

其中：

(i)AMBP序列元件包含SEQ ID NO：97的核苷酸序列；

(ii)hAAT序列元件包含SEQ ID NO：94的核苷酸序列；

(iii)ApoE-HCR1序列元件包含SEQ ID NO：92的核苷酸序列；

(iv)AMBP序列元件在hAAT序列元件的5’；

(v)ApoE-HCR1序列元件在hAAT序列元件的5’和AMBP序列元件的3'；

(viii)TRE的长度为875到925个核苷酸。

在一个实施方案中，TRE包括：

(i)AMBP序列元件；

(ii)hAAT序列元件；

(iii)ApoE-HCR1序列元件；和

(iv)HNF6结合位点，

其中：

(i)AMBP序列元件包含SEQ ID NO：97的核苷酸序列；

(ii)hAAT序列元件包含SEQ ID NO：94的核苷酸序列；

(iii)ApoE-HCR1序列元件包含SEQ ID NO：92的核苷酸序列；

(iv)AMBP序列元件在hAAT序列元件的5’；

(v)ApoE-HCR1序列元件在hAAT序列元件的5’和AMBP序列元件的3'；

(vi)HNF6结合位点在AMBP序列元件的5’；和

(vii)TRE的长度为875到925个核苷酸。

在一个实施方案中，TRE包括：

(i)AMBP序列元件；

(ii)hAAT序列元件；

(iii)ApoE-HCR1序列元件；和

(iv)HNF4结合位点，

其中：

(i)AMBP序列元件包含SEQ ID NO：97的核苷酸序列；

(ii)hAAT序列元件包含SEQ ID NO：94的核苷酸序列；

(iii)ApoE-HCR1序列元件包含SEQ ID NO：92的核苷酸序列；

(iv)AMBP序列元件在hAAT序列元件的5’；

(v)ApoE-HCR1序列元件在hAAT序列元件的5’和AMBP序列元件的3'；

(vi)HNF4结合位点在AMBP序列元件的5’；和

(vii)TRE的长度为875到925个核苷酸。

在一个实施方案中，TRE包括：

(i)AMBP序列元件；

(ii)hAAT序列元件；

(iii)ApoE-HCR1序列元件；和

(iv)HNF6结合位点，

其中：

(i)AMBP序列元件包含SEQ ID NO：97的核苷酸序列；

(ii)hAAT序列元件包含SEQ ID NO：94的核苷酸序列；

(iii)ApoE-HCR1序列元件包含SEQ ID NO：92的核苷酸序列；

(iv)AMBP序列元件在hAAT序列元件的5’；

(v)ApoE-HCR1序列元件在hAAT序列元件的5’和AMBP序列元件的3'；

(vi)HNF6结合位点紧邻对应于SEQ ID NO：95的核苷酸序列的核苷酸序列的3'；和

(vii)TRE的长度为875到925个核苷酸。

本发明的多核苷酸还可包含一个或两个ITR。在一个实施方案中，该或每个ITR的核苷酸序列长度少于157个、少于154个或约145个核苷酸。任选地，该或每个ITR是野生型ITR。任选地，该或每个ITR是AAV2 ITR。在一些实施方案中，该或每个ITR的核苷酸序列包含SEQ ID NO：53或SEQ ID NO：54的核苷酸序列。

本发明的多核苷酸可以进一步包含多聚A核苷酸序列。多聚A序列可以是牛生长激素多聚A序列(bGHpA-SEQ ID NO：55)。在一些实施方案中，多聚A核苷酸序列包含SEQ IDNO：55的核苷酸序列。多聚A序列的长度可以是200至220、205至215或约208个核苷酸。多聚A序列可位于本发明的CFI核苷酸序列的下游。

本发明的多核苷酸可以进一步包含内含子序列，例如病毒内含子序列，任选地SV40内含子序列(SEQ ID NO：60)。

包含多核苷酸的病毒颗粒

本发明进一步提供了包含重组基因组的病毒颗粒，所述重组基因组包含本发明的多核苷酸。为了本发明的目的，术语“病毒颗粒”是指全部或部分病毒体。例如，病毒颗粒包含重组基因组并且可以进一步包含衣壳。病毒颗粒可以是基因治疗载体。在此，术语“病毒颗粒”和“载体”可互换使用。出于本申请的目的，“基因治疗”载体是可用于基因治疗的病毒颗粒，即包含施用后在宿主细胞中表达转基因(例如CFI核苷酸序列)所需的所有功能元件的病毒颗粒。

合适的病毒颗粒包括细小病毒、逆转录病毒、慢病毒或单纯疱疹病毒。细小病毒可以是腺相关病毒(AAV)。任选地，病毒颗粒是AAV、腺病毒或慢病毒颗粒。病毒颗粒优选为重组AAV载体或慢病毒载体。更优选地，病毒颗粒是AAV病毒颗粒。术语AAV和rAAV在本文中可互换使用，除非上下文明显另有说明。

所有已知AAV血清型的基因组组织非常相似。AAV的基因组是线性单链DNA分子，长度小于约5,000个核苷酸。反向末端重复(ITR)位于非结构复制(Rep)蛋白和结构(VP)蛋白的独特编码核苷酸序列的两侧。VP蛋白(VP1、-2和-3)形成衣壳。末端～145nt(ITR)是自互补的，并且经过组织以便可以形成形成T形发夹的能量稳定的分子内双链体。这些发夹结构用作病毒DNA复制的起点，作为细胞DNA聚合酶复合物的引物。在哺乳动物细胞中的野生型(wt)AAV感染后，Rep基因(即编码Rep78和Rep52蛋白)分别从P5启动子和P19启动子表达，并且两种Rep蛋白都在病毒基因组的复制中发挥作用。Rep ORF中的剪接事件导致四种Rep蛋白(即Rep78、Rep68、Rep52和Rep40)的表达。然而，已经表明，哺乳动物细胞中编码Rep78和Rep52蛋白的未剪接mRNA足以用于AAV载体产生。在昆虫细胞中，Rep78和Rep52蛋白也足以AAV载体产生。

如上所述，本发明的多核苷酸可包含一个或两个ITR。因此，重组病毒基因组可包含一个或两个如上所述的ITR。本发明的AAV载体可能仅与一个ITR一起发挥作用。因此，病毒基因组通常包含至少一个ITR，但更通常包含两个ITR(通常在病毒基因组的任一端各有一个，即一个在5'端，一个在3'端)。在本发明的CFI核苷酸序列和一个或两个ITR之间可能存在***序列。CFI核苷酸序列可以掺入位于两个常规ITR之间或位于用两个D区工程改造的ITR任一侧的病毒颗粒中。

可以在本发明中用于生产AAV载体的AAV序列可以来源于任何AAV血清型的基因组。通常，AAV血清型在氨基酸和核苷酸水平上具有显著同源性的基因组序列，提供相同的一组遗传功能，产生基本上物理和功能等效的病毒体，并通过几乎相同的机制复制和组装。对于各种AAV血清型的基因组序列和基因组相似性的概述，参见例如GenBank登录号U89790；GenBank登录号J01901；GenBank登录号AF043303；GenBank登录号AF085716；Chiorini等人，1997；Srivastava等人，1983；Chiorini等人，1999；Rutledge等人，1998；和Wu等人，2000。AAV血清型1、2、3、3B、4、5、6、7、8、9、10、11或12可用于本发明。当用于产生基因治疗载体时，来自AAV血清型的序列可能被突变或工程改造。

任选地，AAV载体包含来源于AAV1、AAV2、AAV4和/或AAV6的ITR序列。优选地，ITR序列是AAV2 ITR序列。在本文中，术语AAVx/y是指包含基因组成分例如来自AAVx的至少ITR(其中x是AAV血清型编号)并具有来自AAVy的衣壳(其中y是相同或不同血清型的编号)的病毒颗粒。例如，AAV2/8载体可包含来自AAV2毒株的病毒基因组的一部分，包括ITR，以及来自AAV8毒株的衣壳。

在一个实施方案中，病毒颗粒包含衣壳。在一个实施方案中，病毒颗粒是包含衣壳的AAV病毒颗粒。AAV衣壳通常由三种蛋白质VP1、VP2和VP3形成。VP1的氨基酸序列包含VP2的序列。不构成VP2一部分的VP1部分被称为VP1unique或VP1U。VP2的氨基酸序列包含VP3的序列。不构成VP3一部分的VP2部分被称为VP2unique或VP2U。任选地，病毒颗粒包含嗜肝衣壳。病毒颗粒(衣壳)是否对特定组织具有趋向性可以例如通过施用表达标记基因如萤光素酶的这样的颗粒并在多个时间点在体内成像来评估(例如如Zincarelli等人(2008),Molecular Therapy,16:1073-1080中所述)。在肝组织中驱动强标记物表达的颗粒(特别是如果与其他组织中的较少表达形成对比)将被认为是嗜肝的。

在一些实施方案中，嗜肝衣壳可以是AAV3-、AAV3B-、AAV5或AAV8-衍生的衣壳。任选地，嗜肝衣壳可以是AAV3-、AAV3B-或AAV8-衍生的衣壳。任选地，嗜肝衣壳包含与SEQ IDNO：56-59中任一个的至少600、至少650、至少700、600至734、600和736、650至734、650至736、700至734、700至736、约734或约736个氨基酸的片段至少98％、至少99％或至少99.5％相同的序列。任选地，嗜肝衣壳包含与SEQ ID NO：56-59中的任一个至少99％相同的序列。任选地，嗜肝衣壳包含与SEQ ID NO：57或58至少99％相同的序列。任选地，嗜肝衣壳包含与SEQ ID NO：57至少99％相同的序列。

在一些实施方案中，衣壳不是AAV2衍生的衣壳。在一些实施方案中，衣壳不是AAV8衍生的衣壳。

本发明的病毒颗粒可以是“杂合”颗粒，其中病毒ITR和病毒衣壳来自不同的细小病毒，例如不同的AAV血清型。优选地，病毒ITR和衣壳来自不同血清型的AAV，在这种情况下，这样的病毒颗粒被称为转衣壳或假型。类似地，细小病毒可具有“嵌合”衣壳(例如，含有来自不同细小病毒的序列，优选不同AAV血清型)或“靶向”衣壳(例如，定向向性)。

在一些实施方案中，重组AAV基因组包含完整的ITR，包含功能性末端解析位点(TRS)。这样的AAV基因组可能包含一个或两个可解析的ITR，即包含功能性TRS的ITR，在该TRS处可以发生位点特异性切口以产生游离的3'羟基，该游离3'羟基可以用作DNA聚合酶的底物以解旋和复制ITR。

优选地，重组基因组是单链的(即，它以单链形式包装到病毒颗粒中)。任选地，重组基因组不以自互补构型包装，即基因组不包含具有在病毒颗粒中退火的实质自互补部分的单个共价连接的多核苷酸链。可选择地，重组基因组可以以“单体双链体”形式包装。“单体双链体”描述于WO2011/122950。基因组可包装为两个基本上互补但非共价连接的多核苷酸，其在病毒颗粒中退火。

如上所述，本发明的多核苷酸可包含多聚A核苷酸序列。因此，病毒颗粒可包含如上所述的多聚A序列。

如上所述，本发明的多核苷酸可包含内含子序列。因此，本发明的多核苷酸可包含如上所述的内含子序列。

在一个实施方案中，病毒颗粒包含含有转录调节元件(包括例如启动子和/或增强子)、CFI核苷酸序列和多聚A序列例如bGHpA序列的多核苷酸序列。在这样的实施方案中，多聚A序列，例如bGHpA序列，可以位于CFI核苷酸序列的下游。内含子序列，例如SV40内含子序列，可以位于转录调节元件和CFI核苷酸序列之间。

在一个实施方案中，与在施用包含参考CFI核苷酸序列的等效病毒颗粒时由参考CFI核苷酸序列编码的CFI多肽的表达相比，由CFI核苷酸序列编码的CFI多肽或其片段在施用病毒颗粒时以相同或更高的水平表达。参考CFI核苷酸序列可以是SEQ ID NO：1或21的核苷酸序列。参考CFI核苷酸序列可以是SEQ ID NO：5或25的核苷酸序列。包含参考CFI核苷酸的“等效”病毒颗粒是除了CFI核苷酸序列不同之外与本发明的病毒颗粒相同的病毒颗粒(即病毒颗粒包含相同的衣壳并且重组基因组包含相同的转录调节元件等)。例如，被比较的不同CFI核苷酸序列可操作地连接到相同的启动子序列。在一个实施方案中，与由参考CFI核苷酸序列编码的CFI多肽的表达相比，由CFI核苷酸序列编码的CFI多肽或其片段的表达处于更高的水平。在一个实施方案中，由CFI核苷酸序列编码的CFI多肽或其片段的表达与由参考CFI核苷酸序列编码的CFI多肽相比为至少1.5x、至少2x、至少3x、至少5x、至少8x或至少10x。任选地，由CFI核苷酸序列编码的CFI多肽或其片段的表达与由参考CFI核苷酸序列编码的CFI多肽相比可以为1.5x至10x、2x至10x、5x至10x或8x至10x。参考CFI核苷酸序列可以是野生型CFI核苷酸序列或SEQ ID NO：1、21、5或25中任一个的核苷酸序列。参考CFI核苷酸序列可以是野生型CFI核苷酸序列。野生型CFI核苷酸可以是SEQ ID NO：41或42的序列。参考CFI核苷酸序列可以是SEQ ID NO：1或21的核苷酸序列。参考CFI核苷酸序列可以是SEQ ID NO：5或25的核苷酸序列。

在一个实施方案中，由CFI核苷酸序列编码的CFI多肽或其片段的表达为由SEQ IDNO：5或25的序列编码的CFI多肽的表达水平的至少50％、至少60％、至少70％、至少80％、至少90％、至少95％或至少100％。

CFI多肽或其片段的表达水平通常可以通过测量样品中CFI多肽或其片段的水平来确定。任选地，CFI多肽或其片段的表达水平通过使用ELISA来确定。CFI多肽或其片段的表达水平可以使用如实施例2中所述的ELISA测定来确定。任选地，表达水平通过载体基因组拷贝数标准化。任选地，表达水平未通过载体基因组拷贝数标准化。

任选地，CFI多肽或其片段的表达水平通过使用如上所述的ELISA来确定。

任选地，上述病毒颗粒的施用是对小鼠(例如C57/B1/6小鼠)的施用。如上所述，CFI多肽或其片段的表达水平可以通过载体基因组拷贝数标准化。载体基因组拷贝数可以通过执行qPCR来确定。可以确定鼠肝脏(或一部分)中的载体基因组拷贝数。

任选地，病毒颗粒包含嗜肝衣壳(例如包含与SEQ ID NO：57至少99％相同的序列的嗜肝衣壳)并且多核苷酸包含肝脏特异性转录调节元件(例如与SEQ ID NO：74至少99％相同)。任选地，病毒颗粒包含嗜肝衣壳(例如包含与SEQ ID NO：57至少99％相同的序列的嗜肝衣壳)，多核苷酸包含肝脏特异性转录调节元件(例如与SEQ ID NO：74至少99％相同)，并且病毒颗粒未眼内施用。

组合物、方法和用途

在本发明的另在一个方面，提供了包含本发明的多核苷酸或载体/病毒颗粒和药学上可接受的赋形剂的组合物。

药学上可接受的赋形剂可以包括载体、稀释剂和/或其他医药剂、制药剂或佐剂等。任选地，药学上可接受的赋形剂包括盐水溶液。任选地，药学上可接受的赋形剂包括人血清白蛋白。

本发明还提供了用于治疗方法的本发明的CFI多核苷酸、载体/病毒颗粒或组合物。任选地，治疗方法包括向患者施用有效量的本发明的CFI多核苷酸、载体/病毒颗粒或组合物。

本发明还提供了一种治疗方法，包括施用有效量的本发明的CFI多核苷酸、载体/病毒颗粒或组合物。任选地，治疗方法包括对患者施用有效量的本发明的多核苷酸或载体/病毒颗粒。

本发明进一步提供本发明的CFI多核苷酸、载体/病毒颗粒或组合物在制备用于治疗方法的药物中的用途。任选地，治疗方法包括对患者施用有效量的本发明的多核苷酸或载体/病毒颗粒。

任选地，治疗方法是基因治疗。“基因治疗”涉及施用本发明的载体/病毒颗粒，该载体/病毒颗粒能够在其施用于的宿主(例如患者)中表达转基因(例如CFI核苷酸序列)。

本发明进一步提供用于治疗方法的包含CFI核苷酸序列的多核苷酸、包含含有该多核苷酸的重组基因组的载体/病毒颗粒或包含该多核苷酸或载体/病毒颗粒的组合物，其中该治疗方法是治疗补体介导的病症的方法，并且CFI核苷酸序列编码CFI多肽或其片段。

本发明还提供了一种治疗方法，包括施用有效量的包含CFI核苷酸序列的多核苷酸、包含含有该多核苷酸的重组基因组的载体/病毒颗粒或包含该多核苷酸或载体/病毒颗粒的组合物，其中该治疗方法是治疗补体介导的病症的方法，并且CFI核苷酸序列编码CFI多肽或其片段。

本发明进一步提供包含CFI核苷酸序列的多核苷酸、包含含有该多核苷酸的重组基因组的载体/病毒颗粒或包含该多核苷酸或载体/病毒颗粒的组合物在制备用于治疗方法的药物中的用途，其中治疗方法是治疗补体介导的病症的方法，并且CFI核苷酸序列编码CFI多肽或其片段。

任选地，治疗方法包括向患者施用有效量的多核苷酸、载体/病毒颗粒或组合物。

任选地，患者具有低于正常水平的CFI蛋白水平。任选地，患者在CFI基因中或CFI基因的一种或多种转录调节元件中具有突变。任选地，患者缺乏CFI。任选地，患者具有正常水平的CFI蛋白。任选地，多核苷酸、病毒颗粒或组合物的施用增加了CFI蛋白的水平。任选地，多核苷酸、病毒颗粒或组合物的施用将CFI蛋白的水平提高到高于正常水平。

任选地，该多核苷酸是如本文所述的本发明的多核苷酸。任选地，病毒颗粒是如本文所述的本发明的病毒颗粒。任选地，该组合物是如本文所述的本发明的组合物。

任选地，治疗方法是治疗补体介导的病症的方法。任选地，补体介导的病症是C3介导的病症。任选地，补体介导的病症是肾脏疾病。

任选地，补体介导的病症是可以通过增加患者中CFI蛋白的水平来治疗的病症。任选地，补体介导的病症是与增加的和/或慢性的炎症相关的病症。任选地，补体介导的病症是其中患者将受益于减轻炎症的病症。任选地，补体介导的病症不是由功能性CFI蛋白的水平不足和/或补体***中的缺陷引起的，但仍然可以通过提高CFI蛋白水平来治疗。任选地，补体介导的病症是***性红斑狼疮。

任选地，补体介导的病症与补体C3b反馈循环的过度活动有关。任选地，补体介导的病症选自C3肾小球病、IgA肾病、狼疮性肾炎、***性红斑狼疮、膜性肾病、膜增生性肾小球肾炎、阵发性睡眠性血红蛋白尿、非典型溶血性***综合征、自身免疫性溶血性贫血、ANCA相关血管炎、戈谢病、腹膜炎、年龄-相关黄斑变性、糖尿病性视网膜病变、致密物沉积病、年龄相关性炎症或自身炎症性疾病、自身免疫性关节炎如类风湿性关节炎、动脉粥样硬化、慢性心血管疾病、阿尔茨海默氏病、***性血管炎、格林-巴利综合征和Henoch-Schonlein紫癜。

任选地，补体介导的病症是与年龄相关的炎症性疾病或自身炎症性疾病。任选地，补体介导的病症是慢性炎症性疾病。

任选地，补体介导的病症选自C3肾小球病、C3肾小球肾炎和致密物沉积病。

任选地，补体介导的病症是非典型溶血性***综合征。任选地，补体介导的病症是具有单等位基因CFH突变的非典型溶血性***综合征。换句话说，补体介导的病症可以是非典型溶血性***综合征，并且待治疗的患者组是具有单等位基因CFH突变的非典型溶血性***综合征患者的子集。

任选地，补体介导的病症是肾小球或肾小管病症。任选地，该病症选自C3肾小球病、IgA肾病、狼疮性肾炎和膜性肾病。任选地，该病症是狼疮性肾炎。任选地，该病症是***性红斑狼疮。

当疾病或病症如本文所讨论的那样被“治疗”时(例如在本发明的方法或用途中)，这意味着疾病或病症的一种或多种症状得到改善。这并不意味着疾病或病症的症状已完全治愈以至于它们不再存在于患者中，尽管在一些方法中可能是这种情况。因此，在所有情况下，术语“治疗”或“医治”可分别替换为术语“改善”或“减轻”。本发明的方法或用途(例如治疗或医治的方法)可导致比治疗前更轻的疾病或病症的一种或多种症状。任选地，相对于施用前的情况，本发明的方法或用途(例如治疗或医治的方法)导致在给定体积的血液中可检测到的患者血液中循环CFI的量/浓度。

此外，本发明的方法或用途可以“预防”病症。在一些实施方案中，术语“治疗”或“医治”可分别替换为术语“预防”或“防止”。

“有效量”是指在必要的剂量和时间段内有效实现所需治疗结果(例如提高受试者中的功能性CFI的水平(例如以导致足以改善疾病或病症的症状的水平的功能性CFI产生))的量。

任选地，载体/病毒颗粒以小于1×10¹¹、小于1×10¹²、小于5×10¹²、小于2×10¹²、小于1.5×10¹²、小于3x10¹²、小于1x10¹³、小于2x10¹³或小于3x10¹³个载体基因组/kg患者体重(vg/kg)的剂量施用。任选地，选择施用的载体/病毒颗粒的剂量以使得受试者以未患该病症的健康受试者的水平的10％-90％、20％-80％、30％-70％、25％-50％、20％-150％、30％-140％、40％-130％、50％-120％、60％-110％或70％-100％的水平表达CFI多肽。

任选地，多核苷酸、病毒颗粒或组合物的施用减少受试者中与病症相关的炎症。任选地，多核苷酸、病毒颗粒或组合物的施用将炎症降低至施用多核苷酸、病毒颗粒或组合物之前存在的炎症水平的小于或约60％、小于或约55％、小于或约50％、小于或约45％、小于或约40％、小于或约35％、小于或约30％、小于或约25％或小于或约20％的水平。任选地，多核苷酸、病毒颗粒或组合物的施用将炎症降低至施用多核苷酸、病毒颗粒或组合物之前存在的炎症水平的小于或约60％、小于或约55％、小于或约50％、小于或约45％、小于或约45％的水平炎症水平的40％、小于或约35％、小于或约30％、小于或约25％、小于或约20％、小于或约15％或小于或约10％的水平。

任选地，治疗方法是减轻患者中的炎症的方法。任选地，治疗方法是减轻患者中的炎症的方法，从而治疗补体介导的病症。任选地，治疗方法是通过减轻患者中的炎症来治疗疾病的方法。任选地，减轻炎症是将炎症减轻至施用多核苷酸、病毒颗粒或组合物之前存在的炎症水平的小于或约60％、小于或约55％、小于或约50％、小于或约45％、小于或约40％、小于或约35％、小于或约30％、小于或约25％或小于或约20％的水平。任选地，多核苷酸、病毒颗粒或组合物的施用将炎症减轻至在施用多核苷酸、病毒颗粒或组合物之前存在的炎症水平的小于或约60％、小于或约55％、小于或约50％、小于或约45％、小于或约40％、小于或约35％、小于或约30％、小于或约25％、小于或约20％、小于或约15％或小于或约10％的水平。

任选地，治疗方法包括向患者施用有效量的多核苷酸、病毒颗粒或组合物，并且有效量的CFI多核苷酸、载体/病毒颗粒或组合物是足以减轻患者中的炎症的量。任选地，足以减轻患者中的炎症的量是足以将炎症减轻至施用多核苷酸、病毒颗粒或组合物之前存在的炎症水平的小于或约60％、小于或约55％、小于或约50％、小于或约45％、小于或约40％、小于或约35％、小于或约30％、小于或约25％或小于或约20％的水平的量。任选地，多核苷酸、病毒颗粒或组合物的施用将炎症减轻至在施用多核苷酸、病毒颗粒或组合物之前存在的炎症水平的小于或约60％、小于或约55％、小于或约50％、小于或约45％、小于或约40％、小于或约35％、小于或约30％、小于或约25％、小于或约20％、小于或约15％或小于或约10％的水平。

任选地，多核苷酸、病毒颗粒或组合物的施用减少受试者的蛋白尿。任选地，通过测量尿液中的白蛋白与肌酸酐比值(ACR)对蛋白尿进行评分。任选地，多核苷酸、病毒颗粒或组合物的施用将蛋白尿减少至施用多核苷酸、病毒颗粒或组合物之前存在的蛋白尿水平的小于或约70％、小于或约65％、小于或约60％、小于或约55％、小于或约50％、小于或约45％、小于或约40％、小于或约35％、小于或约30％、小于或约25％、小于或约20％、小于或约15％或小于或约10％的水平。任选地，多核苷酸、病毒颗粒或组合物的施用将蛋白尿降低至施用多核苷酸、病毒颗粒或组合物之前存在的蛋白尿水平的小于或约40％、小于或约35％、小于或约30％、小于或约25％、小于或约20％、小于或约15％或小于或约10％的水平。

任选地，治疗方法是减少患者中的蛋白尿的方法。任选地，治疗方法是减少患者中的蛋白尿的方法，从而治疗补体介导的病症。任选地，治疗方法是通过减少患者的蛋白尿来治疗疾病的方法。任选地，减少蛋白尿是将蛋白尿减少至施用多核苷酸、病毒颗粒或组合物之前存在的蛋白尿水平的小于或约70％、小于或约65％、小于或约60％、小于或约55％、小于或约50％、小于或约45％、小于或约40％、小于或约35％、小于或约30％、小于或约25％、小于或约20％、小于或约15％或小于或约10％的水平。任选地，多核苷酸、病毒颗粒或组合物的施用将蛋白尿降低至施用多核苷酸、病毒颗粒或组合物之前存在的蛋白尿水平的小于或约40％、小于或约35％、小于或约30％、小于或约25％、小于或约20％、小于或约15％或小于或约10％的水平。

任选地，治疗方法包括向患者施用有效量的CFI多核苷酸、载体/病毒颗粒或组合物，并且有效量是足以减少患者中的蛋白尿的量。任选地，足以减少患者中的蛋白尿的量是足以将蛋白尿减少至施用多核苷酸、病毒颗粒或组合物之前存在的蛋白尿水平的小于或约70％、小于或约65％、小于或约60％、小于或约55％、小于或约50％、小于或约45％、小于或约40％、小于或约35％、小于或约30％、小于或约25％、小于或约20％、小于或约15％或小于或约10％的水平的量。任选地，足以减少患者中的蛋白尿的量是足以将蛋白尿减少至施用多核苷酸、病毒颗粒或组合物之前存在的蛋白尿水平的小于或约40％、小于或约35％、小于或约30％、小于或约25％、小于或约20％、小于或约15％或小于或约10％的水平的量。

任选地，多核苷酸、病毒颗粒或组合物的施用减少受试者中的肾小球病理和/或肾小管病理。任选地，多核苷酸、病毒颗粒或组合物的施用减少肾小球病理和/或肾小管病理，如通过PAS染色时降低的病理学水平所见。

任选地，治疗方法是减少患者中的肾小球病理和/或肾小管病理的方法。任选地，治疗方法是减少患者中的肾小球病理和/或肾小管病理的方法，从而治疗补体介导的病症。任选地，治疗方法是通过减少患者中的肾小球病理和/或肾小管病理来治疗疾病的方法。任选地，减少肾小球病理和/或肾小管病理是如通过PAS染色时降低的病理学水平所见的减少肾小球病理和/或肾小管病理。任选地，治疗方法包括向患者施用有效量的多核苷酸、病毒颗粒或组合物，并且有效量是足以减少患者中的肾小球病理和/或肾小管病理的量。任选地，足以减少患者中的肾小球病理和/或肾小管病理的量是足以如通过PAS染色时降低的病理学水平所见的减少肾小球病理和/或肾小管病理的量。

任选地，该病症不是眼部病症。任选地，多核苷酸、病毒颗粒或组合物不经眼内施用。

任选地，多核苷酸、病毒颗粒或组合物不通过视网膜下注射施用。任选地，多核苷酸、病毒颗粒或组合物不通过直接视网膜注射施用。任选地，多核苷酸、病毒颗粒或组合物不通过脉络膜上腔注射施用。任选地，多核苷酸、病毒颗粒或组合物不通过玻璃体内注射施用。

任选地，CFI多核苷酸、载体/病毒颗粒和/或组合物静脉内施用。任选地，全身施用CFI多核苷酸、载体/病毒颗粒和/或组合物。任选地，CFI多核苷酸、载体/病毒颗粒和/或组合物通过外周静脉输注施用至肝脏。任选地，CFI多核苷酸、载体/病毒颗粒和/或组合物经由肝血管例如肝静脉输注或肝动脉输注施用至肝脏。任选地，CFI多核苷酸、载体/病毒颗粒和/或组合物通过直接向肝脏的实质内施用来施用。任选地，CFI多核苷酸、载体/病毒颗粒和/或组合物通过注射到肾动脉中来施用。任选地，CFI多核苷酸、载体/病毒颗粒和/或组合物通过逆行施用来施用，例如使用导尿管经由输尿管施用。

任选地，CFI核苷酸序列包含与SEQ ID NO：1或21的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

任选地，CFI核苷酸序列包含与SEQ ID NO：5或25的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

任选地，CFI核苷酸序列包含与SEQ ID NO：7或27的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

任选地，CFI核苷酸序列包含与SEQ ID NO：10或30的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

任选地，CFI核苷酸序列包含与SEQ ID NO：14或34的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

任选地，CFI核苷酸序列包含与SEQ ID NO：17或37的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

任选地，多核苷酸、病毒颗粒或组合物的施用增加患者中C3b-失活和/或iC3b-降解活性的水平。任选地，多核苷酸、病毒颗粒或组合物的施用将C3b-失活和/或iC3b-降解活性的水平增加到高于正常水平。任选地，多核苷酸、病毒颗粒或组合物的施用将C3b-失活和/或iC3b-降解活性的水平增加至正常水平的1.2倍、1.5倍、1.8倍或2倍的水平。任选地，正常水平相当于血清中30-40μg/ml CFI多肽所提供的水平。

任选地，该治疗方法是用于增加患者中C3b-失活和/或iC3b-降解的水平的方法。任选地，治疗方法是增加患者中C3b-失活和/或iC3b-降解的水平的方法，从而治疗补体介导的病症。任选地，治疗方法是通过增加患者中的C3b-失活和/或iC3b-降解水平来治疗疾病的方法。任选地，增加患者中的C3b-失活和/或iC3b-降解水平是将C3b-失活和/或iC3b-降解活性水平增加到高于正常水平。任选地，增加患者中C3b-失活和/或iC3b-降解的水平是将C3b-失活和/或iC3b-降解活性水平增加至正常水平的1.2倍、1.5倍、1.8倍或2倍的水平。任选地，正常水平相当于血清中30-40μg/ml CFI多肽所提供的水平。

任选地，CFI核苷酸序列是来自WO2020/086735的SEQ ID NO：1、2、3或5或来自WO2017/072515的SEQ ID NO：8中任一个的核苷酸序列。任选地，CFI核苷酸序列是来自WO2020/128516的SEQ ID NO：18至26中任一个的核苷酸序列。

任选地，CFI核苷酸序列是来自WO2020/086735的SEQ ID NO：1、2、3或5中任一个的核苷酸序列，或其编码CFI多肽的变体，其包含与分别由来自WO2020/086735的SEQ ID NO：1、2、3或5编码的多肽至少95％相同的序列。任选地，CFI核苷酸序列是来自WO2017/072515的SEQ ID NO：8的核苷酸序列，或其编码CFI多肽的变体，其包含与来自WO2017/072515的SEQ ID NO：8至少95％相同的序列。任选地，CFI核苷酸序列是来自WO2020/128516的SEQ IDNO：18至26中任一个的核苷酸序列，或其编码CFI多肽的变体，其包含与分别由来自WO2020/128516的SEQ ID NO：18、19、20、21、22、23、24、25或26编码的多肽至少95％相同的序列。

任选地，变体是来自WO2020/086735的SEQ ID NO：1、2、3或5、来自WO2017/072515的SEQ ID NO：8或来自WO2020/128516的SEQ ID NO：18至26中任一个的变体。在一些实施方案中，来自WO2020/086735的SEQ ID NO：1、2、3或5、来自WO2017/072515的SEQ ID NO：8或来自WO2020/128516的SEQ ID NO：18、19、20、21、22、23、24、25或26的变体分别与来自WO2020/086735的SEQ ID NO：1、2、3或5、来自WO2017/072515的SEQ ID NO：8或来自WO2020/128516的SEQ ID NO：18、19、20、21、22、23、24、25或26相同，除了其包含核苷酸取代以使得编码的CFI多肽分别相对于由来自WO2020/086735的SEQ ID NO：1、2、3或5、来自WO2017/072515的SEQ ID NO：8或来自WO2020/128516的SEQ ID NO：18、19、20、21、22、23、24、25或26编码的CFI多肽序列具有1个、2个或更少、3个或更少、4个或更少、5个或更少，6个或更少、7个或更少、8个或更少、9个或更少或10个或更少的氨基酸取代。在一些实施方案中，来自WO2020/086735的SEQ ID NO：1、2、3或5、来自WO2017/072515的SEQ ID NO：8或来自WO2020/128516的SEQ ID NO：18、19、20、21、22、23、24、25或26的变体分别相对于来自WO2020/086735的SEQID NO：1、2、3或5、来自WO2017/072515的SEQ ID NO：8或来自WO2020/128516的SEQ ID NO：18、19、20、21、22、23、24、25或26的序列具有1个、2个或更少、3个或更少、4个或更少、5个或更少、6个或更少、7个或更少、8个或更少、9个或更少、10个或更少、20个或更少或30个或更少的核苷酸取代。来自WO2020/086735的SEQ ID NO：1、2、3或5、来自WO2017/072515的SEQID NO：8或来自WO2020/128516的SEQ ID NO：18、19、20、21、22、23、24、25或26的变体分别相对于来自WO2020/086735的SEQ ID NO：1、2、3或5、来自WO2017/072515的SEQ ID NO：8或来自WO2020/128516的SEQ ID NO：18、19、20、21、22、23、24、25或26的序列有1个、2个或更少、3个或更少、4个或更少、5个或更少或6个或更少的核苷酸取代。在一个实施方案中，来自WO2020/086735的SEQ ID NO：1、2、3或5、来自WO2017/072515的SEQ ID NO：8或来自WO2020/128516的SEQ ID NO：18、19、20、21、22、23、24、25或26的变体分别相对于来自WO2020/086735的SEQ ID NO：1、2、3或5、来自WO2017/072515的SEQ ID NO：8或来自WO2020/128516的SEQ ID NO：18、19、20、21、22、23、24、25或26的序列具有4个或更少的核苷酸取代，和/或编码分别相对于由来自WO2020/086735的SEQ ID NO：1、2、3或5、来自WO2017/072515的SEQID NO：8或来自WO2020/128516的SEQ ID NO：18、19、20、21、22、23、24、25或26编码的CFI多肽序列具有3个或更少的氨基酸取代的CFI多肽。在一个实施方案中，来自WO2020/086735的SEQ ID NO：1、2、3或5、来自WO2017/072515的SEQ ID NO：8或来自WO2020/128516的SEQ IDNO：18、19、20、21、22、23、24、25或26的变体分别相对于来自WO2020/086735的SEQ ID NO：1、2、3或5、来自WO2017/072515的SEQ ID NO：8或来自WO2020/128516的SEQ ID NO：18、19、20、21、22、23、24、25或26的序列具有3个或更少的核苷酸取代，和/或编码分别相对于由来自WO2020/086735的SEQ ID NO：1、2、3或5、来自WO2017/072515的SEQ ID NO：8或来自WO2020/128516的SEQ ID NO：18、19、20、21、22、23、24、25或26编码的CFI多肽序列具有2个或更少的氨基酸取代的CFI多肽。在一个实施方案中，来自WO2020/086735的SEQ ID NO：1、2、3或5、来自WO2017/072515的SEQ ID NO：8或来自WO2020/128516的SEQ ID NO：18、19、20、21、22、23、24、25或26的变体分别相对于来自WO2020/086735的SEQ ID NO：1、2、3或5、来自WO2017/072515的SEQ ID NO：8或来自WO2020/128516的SEQ ID NO：18、19、20、21、22、23、24、25或26的序列具有2个或更少的核苷酸取代，和/或编码分别相对于由来自WO2020/086735的SEQID NO：1、2、3或5、来自WO2017/072515的SEQ ID NO：8或来自WO2020/128516的SEQ ID NO：18、19、20、21、22、23、24、25或26编码的CFI多肽序列具有1个或更少的氨基酸取代的CFI多肽。在一个实施方案中，来自WO2020/086735的SEQ ID NO：1、2、3或5、来自WO2017/072515的SEQ ID NO：8或来自WO2020/128516的SEQ ID NO：18、19、20、21、22、23、24、25或26的变体编码分别相对于由来自WO2020/086735的SEQ ID NO：1、2、3或5、来自WO2017/072515的SEQ IDNO：8或来自WO2020/128516的SEQ ID NO：18、19、20、21、22、23、24、25或26编码的CFI多肽序列具有3个或更少的氨基酸取代的CFI多肽。在一个实施方案中，来自WO2020/086735的SEQID NO：1、2、3或5、来自WO2017/072515的SEQ ID NO：8或来自WO2020/128516的SEQ ID NO：18、19、20、21、22、23、24、25或26的变体编码分别相对于由来自WO2020/086735的SEQ IDNO：1、2、3或5、来自WO2017/072515的SEQ ID NO：8或来自WO2020/128516的SEQ ID NO：18、19、20、21、22、23、24、25或26编码的CFI多肽序列具有2个或更少的氨基酸取代的CFI多肽。在一个实施方案中，来自WO2020/086735的SEQ ID NO：1、2、3或5、来自WO2017/072515的SEQID NO：8或来自WO2020/128516的SEQ ID NO：18、19、20、21、22、23、24、25或26的变体编码分别相对于由来自WO2020/086735的SEQ ID NO：1、2、3或5、来自WO2017/072515的SEQ ID NO：8或来自WO2020/128516的SEQ ID NO：18、19、20、21、22、23、24、25或26编码的CFI多肽序列具有1个或更少的氨基酸取代的CFI多肽。

现在将参考以下实施例描述本发明，这些实施例仅是说明性的并且不应以任何方式被解释为限制本发明的范围。

实施例

实施例1-密码子优化的序列的Huh7体外转染研究

基于瞬时转染Huh7细胞后产生的蛋白质的量(w/v)筛选和排序独特的密码子优化的人CFI序列。每个密码子优化序列编码野生型人CFI多肽。

方法

产生表达盒，其包含密码子优化的CFI序列之一或用于对照目的的野生型CFI序列。使用的启动子是“LSP-S”(SEQ ID NO：51)或“LSP-L”(SEQ ID NO：52)，其各自是肝脏特异性转录调节元件。

对于包含独特的密码子优化的CFI基因之一的每个表达盒，瞬时转染需要混合携带这样的表达盒的质粒与转染试剂(

HD(Promega，目录号E2311))并将混合物递送至细胞以使得可以表达基因，随后通过ELISA对蛋白质进行定量。在适用的情况下，萤光素酶报道基因被包含在转染混合物中作为评估转染效率的一种方式。

Huh7细胞培养和转染：将Huh7细胞(JCRB细胞库，编号JCRB0403)接种于96孔板(每孔30,000个细胞)中的DMEM低葡萄糖、10％FBS+Glutamax(D10培养基)中，在37℃和5％CO₂下培养(第1天)。第二天(细胞接种后约24小时；第2天)，制备质粒DNA转染试剂混合物并将其转染到Huh7细胞中。简而言之，将0.225μg测试质粒DNA和0.025μg CMV-萤光素酶对照质粒与FuGENE以每μg DNA 4μl的FuGENE(或每0.25μg质粒DNA 1μl的FuGENE)的比例混合。对于96孔转染实验，每孔加入1μl FuGENE混合物。将质粒DNA转染试剂混合物在37℃和5％CO₂下在细胞上孵育过夜。第二天早上(第3天)，转染后约18小时，将培养基更换为新鲜的D10培养基，并将细胞在37℃和5％CO₂下孵育过夜。第二天早上(24小时后；第4天)，培养基被新鲜的DMEM低葡萄糖+Glutamax+胰岛素-转铁蛋白-硒补充剂(D0/ITS培养基)取代。第二天(第5天)收获细胞和培养基(上清液)。

根据制造商的说明，使用CFI ELISA试剂盒(例如Hycult目录号HK355-01)评估培养基(上清液)中的CFI表达。简而言之，将培养基样品(必要时用试剂盒中的样品稀释剂稀释)和来自试剂盒的人CFI标准品在包被有抗人CFI抗体(以捕获人CFI)的微量滴定孔中孵育。添加生物素化示踪抗体(以结合捕获的人CFI)，然后加入链霉亲和素-过氧化物酶缀合物(以结合生物素化示踪抗体)。然后加入与链霉亲和素-过氧化物酶缀合物反应的底物四甲基联苯胺(TMB)。通过加入草酸终止酶反应。对于每个样品和标准品，使用分光光度计测量450nm处的吸光度。通过绘制吸光度(线性)对人CFI标准品的相应浓度(对数)的图来获得标准曲线。然后根据标准曲线确定样品中人CFI的浓度。

在适用的情况下，与ELISA平行，用磷酸缓冲盐水(PBS)洗涤Huh7细胞两次，并用来自萤光素酶测定试剂盒(Promega目录号E1501/E4530)的100μl萤光素酶裂解缓冲液处理细胞。将细胞裂解物储存在-80℃。在萤光素酶测定当天，解冻细胞裂解物并使用20μl样品在Molecular Devices SpextraMax i3x读板器上通过发光测量萤光素酶表达。详细的方案发表在Promega Technical Bullitin#TB281中。在适用的情况下，萤光素酶表达用作内部对照以使CFI表达水平标准化。使用软件Graphpad Prism v7进行分析。

结果

针对野生型人CFI核苷酸序列和38个密码子优化的人CFI序列，测量了转染到Huh-7细胞中之后培养基中的CFI表达水平。如上所述，使用萤光素酶表达对CFI表达水平进行标准化。每个表达盒包含LSP-L启动子和BgpA多聚A序列。密码子优化的CFI序列之一“Co01”(SEQ ID NO：21)比野生型CFI核苷酸序列表达更多的CFI多肽。密码子优化的CFI序列Co01也比其他37个密码子优化的CFI序列表达更多的CFI多肽。因此Co01被排序为最高表达者。

针对密码子优化的CFI序列“Co01”和19个其他密码子优化的CFI序列Co02至Co20(分别为SEQ ID NO：22至40)，测量了转染到Huh-7细胞中之后培养基中的CFI表达水平。每个表达盒包含LSP-S启动子和BgpA多聚A序列。每个密码子优化的CFI序列(Co02至Co20)以与Co01相似或更高的水平表达CFI多肽。具体而言，密码子优化的CFI序列Co02、Co03、Co05、Co06、Co07、Co09、Co10、Co11、Co12、Co14、Co15、Co16、Co17和Co20被排序为比Co01更高的CFI多肽表达者。

实施例2-各种密码子优化序列的体内CFI表达

通过将表达盒载体化到AAV2/8伪型衣壳中并通过全身尾静脉注射转导小鼠进一步体内评估密码子优化的CFI序列Co01、Co05、Co07、Co11、Co12、Co13、Co14、Co16和Co17(SEQ ID NO：分别为21、25、27、31、32、33、34、36和37)。

方法

独特的密码子优化的CFI序列以ITR-启动子-[密码子优化的CFI]-多聚A-ITR的方向被克隆到包含反向末端重复序列的质粒中。包含LSP-S启动子、BgpA多聚A序列和CFI密码子优化序列之一(Co01、Co05、Co07、Co11、Co12、Co13、Co14、Co16或Co17)的AAV2/8-CFI载体由使用聚乙烯亚胺作为横断试剂的三重转染方法产生(Grieger等人Nature Protocols2006；1(3):1412-1428或类似的)，通过柱层析纯化并使用qPCR测定滴定。对于密码子优化的CFI载体的每个实验组，将载体稀释至等效浓度并注射到C57Bl/6小鼠的尾静脉中。剂量为2x10¹²vg/kg，并且研究在注射后4周终止。在研究结束时，通过心脏穿刺将血液收集到抗凝剂(柠檬酸钠)中，通过离心处理血浆并储存在-80℃直到CFI水平可以通过ELISA表征。还收集了肝脏，用液氮快速冷冻并储存用于未来通过qPCR对载体基因组进行定量。

根据制造商的说明，使用CFI ELISA试剂盒(例如Hycult目录号HK355-01)评估鼠血浆中的CFI表达。简而言之，将鼠血浆样品(必要时用试剂盒中的样品稀释剂稀释)和来自试剂盒的人CFI标准品在包被有抗人CFI抗体(以捕获人CFI)的微量滴定孔中孵育。添加生物素化示踪抗体(以结合捕获的人CFI)，然后加入链霉亲和素-过氧化物酶缀合物(以结合生物素化示踪抗体)。然后加入与链霉亲和素-过氧化物酶缀合物反应的底物四甲基联苯胺(TMB)。通过加入草酸终止酶反应。对于每个样品和标准品，使用分光光度计测量450nm处的吸光度。通过绘制吸光度(线性)对人CFI标准品的相应浓度(对数)的图获得标准曲线。然后根据标准曲线确定样品中人CFI的浓度。

在通过qPCR测定进行载体基因组定量之前，将肝脏匀浆并使用QIAGEN DNeasyBlood and Tissue试剂盒(目录号69506)提取和纯化DNA。根据需要通过用RNaseA处理样品来消化RNA。对分离的DNA进行qPCR反应：第一个是量化鼠肝脏中靶(即密码子优化的CFI)载体基因组的数量，第二个是量化管家基因组的拷贝数基因(例如GAPDH)。将密码子优化的载体基因组的拷贝数除以管家基因的拷贝数以确定每个细胞的密码子优化的载体基因组的拷贝数。使用标准方法进行qPCR测定。对于密码子优化的CFI序列，将结合AAV包装DNA的共同序列(例如启动子内的序列)的引物对用于扩增DNA。使用PowerUp Sybr green(LifeTechnologies,目录号A25743)监测DNA扩增，并通过标准曲线的插值法进行量化。

结果

每个密码子优化的CFI序列(Co05、Co07、Co11、Co12、Co13、Co14、Co16和Co17)在小鼠血浆中以与Co01相似或更高的水平表达CFI多肽。特别地，密码子优化的CFI序列Co05、Co07、Co12、Co14、Co16和Co17被排序为比Co01更高的CFI蛋白表达者。Co05、Co07和Co14被排序为表达量最高的前三者。Co05被排序为最高表达者。

实施例3-将AAV-CFI施用至酵母聚糖诱导的腹膜炎模型

通过AAV-CFI施用抑制酵母聚糖诱导的腹膜炎模型中的炎症

进行实验以确定使用表达CFI的AAV进行的治疗是否可以减少酵母聚糖诱导的腹膜炎模型中的炎症。先前已经证明，酵母聚糖诱导的腹膜炎至少部分由C3介导(Mullalyand Kubes.Eur.J.Immunol.2007.37:224–234)。简而言之，对C57BL/6小鼠和对于C3纯合阴性的小鼠(C3-/-)腹膜内注射酵母聚糖(5mg/kg)或盐水，并在酵母聚糖处理后4小时测定腹膜嗜中性粒细胞的数量。在没有C3的情况下，募集到腹膜腔中的嗜中性粒细胞数量显著下降。

为了确定表达CFI的AAV是否可以减轻炎症，在酵母聚糖处理之前，向C57BL/b小鼠施用包含CFI的AAV8(通过HEK293T细胞的三重质粒瞬时转染制备)。给小鼠施用6x10¹¹、2x10¹²或6x10¹³vg/kg剂量的AAV。AAV包含Co01密码子优化的CFI核苷酸序列(SEQ ID NO：21)和CAG启动子(SEQ ID NO：61)。在施用包含CFI的AAV8后16周，以5mg/kg体重的剂量施用酵母聚糖。在酵母聚糖处理后4小时测定腹膜嗜中性粒细胞的数量。通过灌洗腹腔收集腹膜嗜中性粒细胞，对细胞进行染色以用于FACS分析并根据Cash等人(2009),Methods inEnzymology,Volume 461,p.379-396中第3节的方法计数。通过ELISA确定血液中的人CFI表达水平(从尾静脉收集)。

图1A显示了CFI在血液中的剂量依赖性表达。在酵母聚糖处理后，CFI表达导致腹膜嗜中性粒细胞浸润的剂量依赖性减少(参见图1B)。图1C显示了CFI表达与嗜中性粒细胞计数之间的负相关。

实施例4-将AAV-CFI施用至狼疮性肾炎模型

MRL-lpr小鼠模型(狼疮性肾炎小鼠模型)的小鼠用包含CFI的AAV8(通过HEK293T细胞的三重质粒瞬时转染制备)处理。有四个处理组。从6周龄开始，根据下表1对小鼠进行处理。处理持续19周，小鼠在25周龄时被安乐死。将26只MRL/MpJ-Fas^lpr/J(JAX库存号000485)雌性小鼠分配到3个处理组(处理组1、2和4)。处理组1包含10只小鼠，其仅用媒介物处理。处理组2包含10只小鼠，其用包含CFI的AAV以6x10¹³vg/kg的剂量处理。AAV包含Co01密码子优化的CFI核苷酸序列和CAG启动子。处理组4包含6只小鼠，其用25mg/kg的环磷酰胺处理。处理组3是包含仅用媒介物处理的5只MRL/MpJ(JAX库存号000486)小鼠的对照组。

MRL/MpJ-Fas^lpr/J(通常称为MRL-lpr或lpr突变体)对于淋巴组织增生自发突变(Fas^lpr)是纯合的。(https://www.jax.org/strain/000485)。MRL/MpJ是MRL/MpJ-Faslpr的亲本和对照株系。MRL/MpJ小鼠携带正常的Fas基因。(https://www.jax.org/strain/000486)。

表1

组	小鼠数量	株系	化合物	给药途径	给药频率
						1	10	MRL/MpJ-Fas^lpr/J	媒介物	IV	单次注射
2	10	MRL/MpJ-Fas^lpr/J	AAV-CFI	IV	单次注射
						3	5	MRL/MpJ	媒介物	IV	单次注射
4	6	MRL/MpJ-Fas^lpr/J	环磷酰胺	IP	每周两次

IV＝静脉注射；IP＝腹膜内

通过使用

和Beckman AU680化学分析仪测量尿液中的ACR(白蛋白肌酸酐比率)每两周监测蛋白尿，结果如图2所示。来自处理组2的10只小鼠中有3只分别在9周龄、15周龄和22周龄时死亡。收集蛋白尿数据直至死亡。使用包含CFI的AAV进行的处理导致蛋白尿减少。

安乐死后，收集肾脏并将来自每只小鼠的一个肾脏固定在10％中性缓冲***中。然后对组织进行处理并包埋在石蜡中。肾脏用高碘酸席夫(PAS)染色剂染色。用显微镜评估肾脏。显微镜检查对处理组在不知情的情况下进行。病理变化在PAS染色切片上按用于增加的严重程度的0-4的升序量表进行半定量分级，0表示无病理，1表示轻度病理，2表示中度病理，3表示显著病理，4表示严重病理。

使用GraphPad Prism版本8.1.1将半定量评分作为非参数数据进行统计比较。Mann-Whitney/Kruskal-Wallis检验用于比较所有组。通过比较处理组与媒介物处理组来分析处理效果。统计显著性分配为p值<0.05(*<0.05，**<0.01，***<0.001，****<0.0001)。来自处理组2的10只小鼠中有7只进行了组织病理学检查。

图3显示与仅媒介物对照(处理组1)相比，在使用AAV-CFI(处理组2)处理时肾小球和肾小管的病理的减少。

实施例5-密码子优化的序列的Huh7体外转染研究

基于瞬时反向转染Huh7细胞后产生的蛋白质量(w/v)筛选和排序独特的密码子优化的人CFI序列。每个密码子优化的序列编码野生型人CFI多肽。

方法

产生表达盒，其包含密码子优化的CFI序列之一或用于对照目的的野生型CFI序列。使用的启动子是“LSP-S”(SEQ ID NO：51)，它是一种肝脏特异性转录调节元件。

Huh7细胞培养和转染：简而言之，将0.8μg测试质粒DNA和0.08μg TK-萤光素酶对照质粒与FuGENE以每μg DNA 3μl的FuGENE(或每0.33μg质粒DNA 1μl的FuGENE)的比例混合。将50μL转染混合物转移到24孔板中。然后将300,000个Huh7细胞(JCRB细胞库，编号JCRB0403)接种到每孔450μL DMEM低葡萄糖、10％FBS+Glutamax(D10培养基)中。将质粒DNA转染试剂混合物与细胞在37℃和5％CO₂下培养过夜。转染后约24小时，培养基被替换为500μL DMEM低葡萄糖+Glutamax+胰岛素-转铁蛋白-硒补充剂(D0/ITS培养基)。24小时后收获培养基(上清液)。

根据制造商的说明，使用CFI ELISA试剂盒(Hycult目录号HK355-02)评估培养基(上清液)中的CFI表达。简而言之，将未稀释的培养基样品和来自试剂盒的人CFI标准品在包被有抗人CFI抗体(以捕获人CFI)的微量滴定孔中孵育。添加生物素化示踪抗体(以结合捕获的人CFI)，然后加入链霉亲和素-过氧化物酶缀合物(以结合生物素化示踪抗体)。然后加入与链霉亲和素-过氧化物酶缀合物反应的底物四甲基联苯胺(TMB)。通过加入草酸终止酶反应。对于每个样品和标准品，使用Molecular Devices SpectraMax i3x读板器测量450nm处的吸光度。通过绘制吸光度(线性)对人CFI标准品的相应浓度(对数)的图来获得标准曲线。然后根据标准曲线确定样品中人CFI的浓度。

使用Nano-

萤光素酶测定***(Promega目录号N1120)测量上清液的萤光素酶表达。将20μL上清液在培养基中稀释至100μL的最终体积，并与等体积的Nano-/>

萤光素酶测定试剂混合。在室温下孵育3分钟后，在Molecular Devices SpectraMax i3x读板器上通过发光测量萤光素酶表达。详细的方案发表在Promega Nano-Glo LuciferaseAssay System Technical Manual#TM369中。

萤光素酶表达用作内部对照以使CFI表达水平标准化。使用软件Graphpad Prismv9.0.1进行分析。

结果

针对野生型人CFI核苷酸序列和20个密码子优化的人CFI序列(Co01至Co20，分别为SEQ ID NO：21至40)，测量了转染到Huh-7细胞中之后培养基中的CFI表达水平。如上所述，使用萤光素酶表达对CFI表达水平进行标准化。每个表达盒包含LSP-S启动子和BgpA多聚A序列。

图5显示了比野生型CFI序列表达更高的所有测试的密码子优化的CFI序列(Co01到Co20)。

实施例6：当转基因处于不同启动子的控制下时体外Huh7细胞中CFI表达的比较

制备了三个单独的测试质粒DNA构建体，其中掺入了密码子优化的转基因序列(Co05，SEQ ID NO：25)，其编码在FRE72启动子(SEQ ID NO：65)或“LSP-S”(SEQ ID NO：51)或“LSP-L”(SEQ ID NO：52)启动子(其各自是肝脏特异性转录调节元件)的控制下的野生型人CFI蛋白。

为了比较每个启动子的表达水平，将Huh7细胞(JCRB细胞库，编号JCRB0403)接种于96孔板(每孔30,000个细胞)中的DMEM低葡萄糖、10％FBS+Glutamax(D10培养基)中并在37℃和5％CO₂下培养(第1天)。第二天(细胞接种后约24小时；第2天)，制备质粒DNA转染试剂混合物并将其转染到Huh7细胞中。将0.225μg测试质粒DNA和0.025μg CMV-萤光素酶对照质粒与FuGENE以每μg DNA 4μl的FuGENE(或每0.25μg质粒DNA 1μl的FuGENE)的比例混合。对于96孔转染实验，每孔加入1μl FuGENE混合物。将质粒DNA转染试剂混合物在37℃和5％CO₂下在细胞上孵育过夜。

第二天早上(第3天)，转染后约18小时，将培养基更换为新鲜的D10培养基，并将细胞在37℃和5％CO₂下孵育过夜。第二天早上(24小时后；第4天)，培养基被新鲜的DMEM低葡萄糖+Glutamax+胰岛素-转铁蛋白-硒补充剂(D0/ITS培养基)取代。第二天(第5天)收集细胞和培养基。

使用ELISA试剂盒评估培养基中的蛋白质表达。

与ELISA平行，用磷酸缓冲盐水(PBS)洗涤Huh7细胞两次，并用来自萤光素酶测定试剂盒(Promega目录号E1501/E4530)的100μl萤光素酶裂解缓冲液处理细胞。将细胞裂解物储存在-80℃。在萤光素酶测定当天，将细胞裂解物解冻，并使用20μl样品在MolecularDevices SpectraMax i3x板读数器上通过发光测量萤光素酶表达。详细的方案发表在Promega Technical Bulletin#TB281中。萤光素酶表达用作内部对照以使蛋白质水平标准化。使用软件Graphpad Prism v7进行分析。

结果如图6A(萤光素酶校正前)和图6B(萤光素酶校正后)所示。

实施例7：当转基因处于不同启动子的控制下时体外Huh7细胞中CFI表达的比较

基于瞬时转染Huh7细胞后产生的蛋白质的量(w/v)筛选并排序新的基于hAAT的TRE。每个新的基于hAAT的TRE与野生型人CFI多肽(具有SEQ ID NO：25的序列的野生型人CFI多肽)缀合。

方法

产生表达盒，其包含新的基于hAAT的TRE之一(每个TRE具有SEQ ID NO：68-91之一的序列)或HCR-hAAT(SEQ ID NO：67)、HLP2(SEQ ID NO：51)或FRE72(SEQ ID NO：66)以用于对照目的。

对于包含TRE之一的每个表达盒，瞬时转染需要混合携带这样的表达盒的质粒与转染试剂(

HD(Promega，目录号E2311))并将混合物递送至细胞以使得可以表达基因，随后通过ELISA对蛋白质进行定量。在每种情况下，萤光素酶报告基因被包含在转染混合物中作为评估转染效率的一种方式。

Huh7细胞培养和转染：将Huh7细胞(JCRB细胞库，编号JCRB0403)接种于96孔板(每孔30,000个细胞)中的DMEM低葡萄糖、10％FBS+Glutamax(D10培养基)中，在37℃和5％CO₂下培养(第1天)。第二天(细胞接种后约24小时；第2天)，制备质粒DNA转染试剂混合物并将其转染到Huh7细胞中。简而言之，将0.225μg测试质粒DNA和0.025μg CMV-萤光素酶对照质粒(FLJ-PL282)与FuGENE以每μg DNA 4μl的FuGENE(或每0.25μg质粒DNA 1μl的FuGENE)的比例混合。此外，将0.25μg CMV-萤光素酶对照质粒(FLJ-PL282)与FuGENE以每μg DNA 4μl的FuGENE的比例混合以用作萤光素酶测定的阳性对照。对于96孔转染实验，每孔加入10μl质粒DNA-FuGENE混合物。将质粒DNA转染试剂混合物在37℃和5％CO₂条件下在细胞上孵育过夜。第二天早上(第3天)，转染后约18小时，将培养基更换为新鲜的D10培养基，并将细胞在37℃和5％CO₂下孵育过夜。第二天早上(24小时后；第4天)，培养基被新鲜的DMEM低葡萄糖+Glutamax+胰岛素-转铁蛋白-硒补充剂(D0/ITS培养基)取代。第二天(第5天)收集细胞和培养基。

根据制造商的说明，使用CFI ELISA试剂盒(例如Hycult目录号HK355-01)评估培养基中的CFI表达。简而言之，将培养基样品(必要时用试剂盒中的样品稀释剂稀释)和来自试剂盒的人CFI标准品在包被有抗人CFI抗体(以捕获人CFI)的微量滴定孔中孵育。添加生物素化示踪抗体(以结合捕获的人CFI)，然后加入链霉亲和素-过氧化物酶缀合物(以结合生物素化示踪抗体)。然后加入与链霉亲和素-过氧化物酶缀合物反应的底物四甲基联苯胺(TMB)。通过加入草酸终止酶反应。对于每个样品和标准品，使用分光光度计测量450nm处的吸光度。通过绘制吸光度(线性)对人CFI标准品的相应浓度(对数)的图来获得标准曲线。然后根据标准曲线确定样品中人CFI的浓度。

与ELISA平行，Huh7细胞用磷酸缓冲盐水(PBS)洗涤两次，并用来自萤光素酶测定试剂盒(Promega目录号E1501/E4530)的100μl萤光素酶裂解缓冲液处理细胞。将细胞裂解物储存在-80℃。在萤光素酶测定当天，解冻细胞裂解物并使用20μl样品在MolecularDevices SpectraMax i3x读板器上通过发光测量萤光素酶表达。详细的方案发表在Promega Technical Bullitin#TB281中。在适用的情况下，萤光素酶表达用作内部对照以使CFI表达水平标准化。使用软件Graphpad Prism v7进行分析。

结果

转染到Huh-7细胞中后培养基中的CFI表达水平针对HCR-hAAT、HLP2、FRE72和二十四种其他基于hAAT的TRE进行了测量。如上所述，使用萤光素酶表达对C FI表达水平进行标准化。每个表达盒包含野生型人CFI和BgpA多聚A序列。该数据显示在图9-11中。所有新的基于hAAT的TRE都促进了比所有HCR-hAAT、HLP2和FRE72更高的表达。

本发明的编号的方面

1.一种包含补体因子I(CFI)核苷酸序列的多核苷酸，其中CFI核苷酸序列编码CFI多肽或其片段，并且其中CFI核苷酸序列的至少一部分不是野生型的。

2.方面1的多核苷酸，其中非野生型的CFI核苷酸序列部分是密码子优化的。

3.方面1或2的多核苷酸，其中CFI核苷酸序列包含与SEQ ID NO：1-40中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

4.一种包含CFI核苷酸序列的多核苷酸，其中CFI核苷酸序列编码CFI多肽或其片段，并且CFI核苷酸序列包含与SEQ ID NO：1-40中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

5.前述方面中任一项的多核苷酸，其中所述CFI核苷酸序列包含与SEQ ID NO：2、3、5、6、7、9-12、14-17、20、22、23、25、26、27、29-32、34-37和40中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

6.前述方面中任一项的多核苷酸，其中所述CFI核苷酸序列包含与SEQ ID NO：1、5、7、11-14、16、17、21、25、27、31-34、36和37中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

7.前述方面中任一项的多核苷酸，其中所述CFI核苷酸序列包含与SEQ ID NO：1、5、7、11、12、14、16、17、21、25、27、31、32、34、36和37中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

8.前述方面中任一项的多核苷酸，其中所述CFI核苷酸序列包含与SEQ ID NO：5、7、12、14、16、17、25、27、32、34、36和37中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

9.前述方面中任一项的多核苷酸，其中所述CFI核苷酸序列包含与SEQ ID NO：5、7、14、25、27和34中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

10.前述方面中任一项的多核苷酸，其中所述CFI核苷酸序列包含与SEQ ID NO：3、5-7、10、14、17、20、23、25-27、30、34、37和40中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

11.前述方面中任一项的多核苷酸，其中所述CFI核苷酸序列包含与SEQ ID NO：5、10、17、25、30和37中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

12.前述方面中任一项的多核苷酸，其中所述CFI核苷酸序列包含与SEQ ID NO：5或25中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

13.前述方面中任一项的多核苷酸，其中所述CFI核苷酸序列包含与SEQ ID NO：1-40中任一个的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

14.前述方面中任一项的多核苷酸，其中所述CFI核苷酸序列包含与SEQ ID NO：2、3、5、6、7、9-12、14-17、20、22、23、25、26、27、29-32、34-37和40中任一个的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

15.前述方面中任一项的多核苷酸，其中所述CFI核苷酸序列包含与SEQ ID NO：1、5、7、11-14、16、17、21、25、27、31-34、36和37中任一个的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

16.前述方面中任一项的多核苷酸，其中所述CFI核苷酸序列包含与SEQ ID NO：1、5、7、11、12、14、16、17、21、25、27、31、32、34、36和37中任一个的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

17.前述方面中任一项的多核苷酸，其中所述CFI核苷酸序列包含与SEQ ID NO：5、7、12、14、16、17、25、27、32、34、36和37中任一个的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

18.前述方面中任一项的多核苷酸，其中所述CFI核苷酸序列包含与SEQ ID NO：5、7、14、25、27和34中任一个的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

19.前述方面中任一项的多核苷酸，其中所述CFI核苷酸序列包含与SEQ ID NO：3、5-7、10、14、17、20、23、25-27、30、34、37和40中任一个的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

20.前述方面中任一项的多核苷酸，其中所述CFI核苷酸序列包含与SEQ ID NO：5、10、17、25、30和37中任一个的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

21.前述方面中任一项的多核苷酸，其中所述CFI核苷酸序列包含与SEQ ID NO：5或25的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

22.前述方面中任一项的多核苷酸，其中所述CFI核苷酸序列包含SEQ ID NO：1-20中任一个的序列，或其变体，其编码包含与SEQ ID NO：44的野生型CFI氨基酸序列至少95％相同的序列的CFI多肽。

23.方面22的多核苷酸，其中变体是SEQ ID NO：5、7和14中任一个的变体。

24.方面22的多核苷酸，其中变体是SEQ ID NO：5、10和17中任一个的变体。

25.方面23或24的多核苷酸，其中变体是SEQ ID NO：5的变体。

26.方面22至25中任一项的多核苷酸，其中所述变体编码具有至少70％、至少80％、至少90％或至少100％的野生型CFI的CFI活性的CFI多肽。

27.方面26的多核苷酸，其中CFI活性包括C3b-失活和/或iC3b-降解活性。

28.方面22至27中任一项的多核苷酸，其中SEQ ID NO：5的变体与SEQ ID NO：5相同，除了它包含核苷酸取代以使得CFI多肽相对于SEQ ID NO：44的野生型CFI氨基酸序列具有1个、2个或更少、3个或更少、4个或更少、5个或更少、6个或更少、7个或更少、8个或更少、9个或更少或10个或更少的氨基酸取代。

29.方面22至28中任一项的多核苷酸，其中SEQ ID NO：5的变体相对于SEQ ID NO：5的序列具有1个、2个或更少、3个或更少、4个或更少、5个或更少、6个或更少、7个或更少、8个或更少、9个或更少、10个或更少、20个或更少或30个或更少的核苷酸取代。

30.方面22至29中任一项的多核苷酸，其中SEQ ID NO：5的变体相对于SEQ ID NO：5的序列具有1个、2个或更少、3个或更少、4个或更少、5个或更少或6个或更少的核苷酸取代。

31.方面22至30中任一项的多核苷酸，其中SEQ ID NO：5的变体相对于SEQ ID NO：5的序列具有4个或更少的核苷酸取代和/或编码相对于SEQ ID NO：44的野生型CFI氨基酸序列具有3个或更少的氨基酸取代的CFI多肽。

32.方面22至31中任一项的多核苷酸，其中SEQ ID NO：5的变体相对于SEQ ID NO：5的序列具有3个或更少的核苷酸取代和/或编码相对于SEQ ID NO：44的野生型CFI氨基酸序列具有2个或更少的氨基酸取代的CFI多肽。

33.方面22至32中任一项的多核苷酸，其中SEQ ID NO：5的变体相对于SEQ ID NO：5的序列具有1个核苷酸取代和/或编码相对于SEQ ID NO：44的野生型CFI氨基酸序列具有1个氨基酸取代的CFI多肽。

34.前述方面中任一项的多核苷酸，其中所述CFI核苷酸序列编码相对于SEQ IDNO：44的野生型CFI氨基酸序列具有1个、2个或更少、3个或更少、4个或更少或5个或更少的氨基酸取代的CFI多肽。

35.前述方面中任一项的多核苷酸，其中所述CFI核苷酸序列编码相对于SEQ IDNO：44的野生型CFI氨基酸序列具有3个或更少的氨基酸取代的CFI多肽。

36.前述方面中任一项的多核苷酸，其中所述CFI核苷酸序列编码相对于SEQ IDNO：44的野生型CFI氨基酸序列具有2个或更少的氨基酸取代的CFI多肽。

37.前述方面中任一项的多核苷酸，其中所述CFI核苷酸序列编码相对于SEQ IDNO：44的野生型CFI氨基酸序列具有1个氨基酸取代的CFI多肽。

38.前述方面中任一项的多核苷酸，其中CFI核苷酸序列包含与SEQ ID NO：1-40中任一个的至少1500个核苷酸的片段至少98％相同的序列。

39.前述方面中任一项的多核苷酸，其中CFI核苷酸序列包含与SEQ ID NO：1-40中任一个的至少1500个核苷酸的片段至少99％相同的序列。

40.前述方面中任一项的多核苷酸，其中CFI核苷酸序列包含与SEQ ID NO：1-40中任一个的核苷酸序列至少98％相同的序列。

41.前述方面中任一项的多核苷酸，其中CFI核苷酸序列包含与SEQ ID NO：1-40中任一个的核苷酸序列至少99％相同的序列。

42.前述方面中任一项的多核苷酸，其中CFI核苷酸序列包含与SEQ ID NO：5或25的至少1500个核苷酸的片段至少98％同一的序列。

43.前述方面中任一项的多核苷酸，其中CFI核苷酸序列包含与SEQ ID NO：5或25的至少1500个核苷酸的片段至少99％同一的序列。

44.前述方面中任一项的多核苷酸，其中所述CFI核苷酸序列包含与SEQ ID NO：5或25至少98％相同的序列。

45.前述方面中任一项的多核苷酸，其中所述CFI核苷酸序列包含与SEQ ID NO：5或25至少99％相同的序列。

46.前述方面中任一项的多核苷酸，其中所述CFI核苷酸序列包含SEQ ID NO：5或25的序列。

47.方面3至46中任一项的多核苷酸，其中CFI核苷酸序列的至少一部分是密码子优化的。

48.方面2或47的多核苷酸，其中密码子优化的CFI核苷酸序列部分针对在人肝细胞中的表达进行了密码子优化。

49.前述方面中任一项的多核苷酸，其中CFI核苷酸序列针对在人肝细胞中的表达进行了密码子优化。

50.方面2、47或48中任一项的多核苷酸，其中密码子优化的CFI核苷酸序列部分是连续部分。

51.方面2、47、48或50中任一项的多核苷酸，其中密码子优化的CFI核苷酸序列部分的长度为至少1000、至少1200、至少1300、至少1400、至少1500、至少1600、至少1700、1752或更少、1300至1752、1500至1752、1600至1752或约1752个核苷酸。

52.方面2、47、48、50或51中任一项的多核苷酸，其中密码子优化的CFI核苷酸序列部分的长度为至少1000、至少1200、至少1300、至少1400、至少1500、1698或更少、1300至1698、1500至1698或约1698个核苷酸。

53.方面2、47、48或50至52中任一项的多核苷酸，其中密码子优化的CFI核苷酸序列部分编码成熟CFI多肽。

54.方面2、47、48或50至53中任一项的多核苷酸，其中密码子优化的CFI核苷酸序列部分编码全部或部分信号肽。

55.方面2、47、48或50至54中任一项的多核苷酸，其中密码子优化的CFI核苷酸序列部分不编码全部或部分信号肽。

56.方面2、47至55中任一项的多核苷酸，其中在密码子优化的CFI核苷酸序列或CFI核苷酸序列部分中，至少70％、至少75％、至少76％、至少77％、至少78％、至少79％、至少80％或至少81％、至少82％、至少83％或至少84％的密码子选自：GCT、GCC、TGC、GAC、GAG、TTC、GGA、GGC、CAC、ATC、AAG、CTG、AAT、AAC、CCT、CCC、CAG、AGG、AGA、AGT、AGC、ACC、GTG和TAC。

57.方面56的多核苷酸，其中在密码子优化的CFI核苷酸序列或CFI核苷酸序列部分中，至少83％或至少84％的密码子选自：GCT、GCC、TGC、GAC、GAG、TTC、GGA、GGC、CAC、ATC、AAG、CTG、AAT、AAC、CCT、CCC、CAG、AGG、AGA、AGT、AGC、ACC、GTG和TAC。

58.前述方面中任一项的多核苷酸，其中与参考CFI核苷酸序列的对应部分相比，密码子优化的CFI核苷酸序列或CFI核苷酸序列部分包含减少数量的CpG。

59.方面58的多核苷酸，其中密码子优化的CFI核苷酸序列或CFI核苷酸序列部分包含40个或更少、20个或更少、15个或更少、10个或更少或5个或更少的CpG。

60.方面59的多核苷酸，其中密码子优化的CFI核苷酸序列或CFI核苷酸序列部分每100个核苷酸包含5个或更少、4个或更少、3个或更少或2个或更少的CpG。

61.方面58至60中任一项的多核苷酸，其中密码子优化的CFI核苷酸序列或CFI核苷酸序列部分是无CpG的。

62.方面58至61中任一项的多核苷酸，其中参考CFI核苷酸序列是野生型CFI核苷酸序列。

63.方面62的多核苷酸，其中野生型CFI核苷酸序列是SEQ ID NO：41或42的核苷酸序列。

64.方面2、47、48或50至63中任一项的多核苷酸，其中密码子优化的CFI核苷酸序列部分与SEQ ID NO：1-20中任一个的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。

65.方面2、47、48或50至64中任一项的多核苷酸，其中密码子优化的CFI核苷酸序列部分与SEQ ID NO：2、3、5、6、7、9-12、14-17和20中任一个的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。

66.方面2、47、48或50至65中任一项的多核苷酸，其中密码子优化的CFI核苷酸序列部分与SEQ ID NO：1、5、7、11-14、16和17中任一个的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。

67.方面2、47、48或50至66中任一项的多核苷酸，其中密码子优化的CFI核苷酸序列部分与SEQ ID NO：1、5、7、11、12、14、16和17中任一个的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。

68.方面2、47、48或50至67中任一项的多核苷酸，其中密码子优化的CFI核苷酸序列部分与SEQ ID NO：5、7、12、14、16和17中任一个的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。

69.方面2、47、48或50至68中任一项的多核苷酸，其中密码子优化的CFI核苷酸序列部分与SEQ ID NO：5、7和14中任一个的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。

70.方面2、47、48或50至69中任一项的多核苷酸，其中密码子优化的CFI核苷酸序列部分与SEQ ID NO：3、5-7、10、14、17和20中任一个的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。

71.方面2、47、48或50至70中任一项的多核苷酸，其中密码子优化的CFI核苷酸序列部分与SEQ ID NO：5、10和17中任一个的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。

72.方面2、47、48或50至71中任一项的多核苷酸，其中密码子优化的CFI核苷酸序列部分与SEQ ID NO：5的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。

73.方面2、47、48或50至72中任一项的多核苷酸，其中密码子优化的CFI核苷酸序列部分与SEQ ID NO：1-20中的任一个至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。

74.方面2、47、48或50至73中任一项的多核苷酸，其中密码子优化的CFI核苷酸序列部分与SEQ ID NO：2、3、5、6、7、9-12、14-17和20中的任一个至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。

75.方面2、47、48或50至74中任一项的多核苷酸，其中密码子优化的CFI核苷酸序列部分与SEQ ID NO：1、5、7、11-14、16和17中的任一个至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。

76.方面2、47、48或50至75中任一项的多核苷酸，其中密码子优化的CFI核苷酸序列部分与SEQ ID NO：1、5、7、11、12、14、16和17中的任一个至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。

77.方面2、47、48或50至76中任一项的多核苷酸，其中密码子优化的CFI核苷酸序列部分与SEQ ID NO：5、7、12、14、16和17中的任一个至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。

78.方面2、47、48或50至77中任一项的多核苷酸，其中密码子优化的CFI核苷酸序列部分与SEQ ID NO：5、7和14中的任一个至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。

79.方面2、47、48或50至78中任一项的多核苷酸，其中密码子优化的CFI核苷酸序列部分与SEQ ID NO：3、5-7、10、14、17和20中的任一个至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。

80.方面2、47、48或50至79中任一项的多核苷酸，其中密码子优化的CFI核苷酸序列部分与SEQ ID NO：5、10和17中的任一个至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。

81.方面2、47、48或50至80中任一项的多核苷酸，其中密码子优化的CFI核苷酸序列部分与SEQ ID NO：5的至少1000、至少1200、至少1300、至少1500、1698或更少、1200至1698、1500至1698或约1698个核苷酸的片段至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。

82.方面2、47、48或50至81中任一项的多核苷酸，其中密码子优化的CFI核苷酸序列部分与SEQ ID NO：5至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。

83.方面2、47、48或50至82中任一项的多核苷酸，其中密码子优化的CFI核苷酸序列部分与SEQ ID NO：5的至少1500个核苷酸的片段至少99.5％、至少99.8％或100％相同。

84.方面2、47、48或50至83中任一项的多核苷酸，其中密码子优化的CFI核苷酸序列部分与SEQ ID NO：5至少99％、至少99.5％、至少99.8％或100％相同。

85.前述方面中任一项的多核苷酸，其中与由参考CFI核苷酸序列编码的CFI多肽的表达相比，由CFI核苷酸序列编码的CFI多肽或其片段在人肝细胞中以相同或更高的水平表达。

86.方面85的多核苷酸，其中与在用包含参考CFI核苷酸序列的等效多核苷酸转染时由参考CFI核苷酸编码的CFI多肽的表达相比，由CFI核苷酸序列编码的CFI多肽或其片段在将包含CFI核苷酸序列的多核苷酸转染到人肝细胞中时以相同或更高的水平表达。

87.方面85或86的多核苷酸，其中人肝细胞是Huh-7细胞。

88.方面85至87中任一项的多核苷酸，其中与由参考CFI核苷酸序列编码的CFI多肽的表达相比，由CFI核苷酸序列编码的CFI多肽或其片段的表达处于更高水平。

89.方面85至88中任一项的多核苷酸，其中由CFI核苷酸序列编码的CFI多肽或其片段的表达是由参考CFI核苷酸序列编码的CFI多肽的至少1.5x、至少2x、至少3x、至少5x、至少8x、至少10x、至少20x、至少30x、至少40x或至少50x。

90.方面88或89的多核苷酸，其中参考CFI核苷酸序列是野生型CFI核苷酸序列。

91.方面90的多核苷酸，其中野生型CFI核苷酸序列是SEQ ID NO：41或42的序列。

92.方面85至89中任一项的多核苷酸，其中参考CFI核苷酸序列是SEQ ID NO：1或21的序列。

93.方面85至89中任一项的多核苷酸，其中参考CFI核苷酸序列是SEQ ID NO：5或25的序列。

94.前述方面中任一项的多核苷酸，其中由CFI核苷酸序列编码的CFI多肽或其片段的表达是由SEQ ID NO：5或25的序列编码的CFI多肽的表达的至少50％、至少60％、至少70％、至少80％、至少90％、至少95％或至少100％。

95.前述方面中任一项的多核苷酸，其中CFI核苷酸序列编码信号肽。

96.方面95的多核苷酸，其中信号肽的氨基酸序列是野生型CFI信号肽的氨基酸序列。

97.方面95的多核苷酸，其中信号肽的氨基酸序列是其不是野生型CFI信号肽的信号肽的氨基酸序列。

98.前述方面中任一项的多核苷酸，其中所述多核苷酸还包含转录调节元件。

99.方面98的多核苷酸，其中转录调节元件包含肝脏特异性启动子。

100.方面98或99的多核苷酸，其中转录调节元件包含A1AT启动子或A1AT启动子的片段。

101.方面100的多核苷酸，其中转录调节元件包含A1AT启动子的两个片段。

102.方面101的多核苷酸，其中A1AT启动子的第一片段的长度为75至100个核苷酸并且A1AT启动子的第二片段的长度为25至50个核苷酸。

103.方面100-102中任一项的多核苷酸，其中所述多核苷酸包含与SEQ ID NO：66至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％或100％相同的启动子。

104.方面100·的多核苷酸，其中A1AT启动子的片段的长度为至少100个、至少120个、至少150个、至少180个、255个或更少、100至255个、150至225个、150至300个或180至255个核苷酸。

105.方面104的多核苷酸，其中A1AT启动子的片段的长度为180个255个核苷酸。

106.方面1至101、104或105中任一项的多核苷酸，其中所述多核苷酸包含与SEQID NO：47或SEQ ID NO：48至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的启动子。

107.方面106的多核苷酸，其中所述多核苷酸包含与SEQ ID NO：47或SEQ ID NO：48至少98％、至少99％、至少99.5％、至少99.8％或100％相同的启动子。

108.方面107的多核苷酸，其中所述多核苷酸包含SEQ ID NO：47或SEQ ID NO：48的启动子。

109.方面98至101或104至108中任一项的多核苷酸，其中转录调节元件包含长度等于或少于418个核苷酸、等于或少于255个核苷酸或等于或少于185个核苷酸并包含SEQID NO：47的A1AT启动子片段。

110.方面98至101或104至109中任一项的多核苷酸，其中转录调节元件包含增强子。

111.方面110的多核苷酸，其中增强子是HCR增强子或HCR增强子的片段。

112.方面111的多核苷酸，其中HCR增强子的片段是长度为至少80、至少90、至少100、192或更少、80至192、90至192、100至250或117至192个核苷酸的片段。

113.方面112的多核苷酸，其中HCR增强子的片段的长度为117至192个核苷酸。

114.如1至101或104至113中任一项的多核苷酸，其中该多核苷酸包含与SEQ IDNO：49或SEQ ID NO：50至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的增强子。

115.方面114的多核苷酸，其中所述多核苷酸包含与SEQ ID NO：49或SEQ ID NO：50至少98％、至少99％、至少99.5％、至少99.8％或100％相同的增强子。

116.方面115的多核苷酸，其中该多核苷酸包含SEQ ID NO：49或SEQ ID NO：50的增强子。

117.方面98至101或104至116中任一项的多核苷酸，其中转录调节元件包含HCR增强子的片段，其长度等于或少于321个核苷酸、等于或少于192个核苷酸或等于或少于117个核苷酸并包含SEQ ID NO：49。

118.方面98至101或104至117中任一项的多核苷酸，其中转录调节元件与SEQ IDNO：51至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。

119.方面118的多核苷酸，其中转录调节元件具有SEQ ID NO：51的序列。

120.前述方面中任一项的多核苷酸，其中：

(i)CFI核苷酸序列包含与SEQ ID NO：5或25至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列；和

(ii)多核苷酸包含与SEQ ID NO：47至少98％、至少99％、至少99.5％、至少99.8％或100％相同的启动子和/或与SEQ ID NO：49至少98％、至少99％、至少99.5％、至少99.8％或100％相同的增强子元件。

121.前述方面中任一项的多核苷酸，其中：

(ii)多核苷酸包含与SEQ ID NO：51至少98％、至少99％、至少99.5％、至少99.8％或100％相同的转录调节元件。

122.方面100的多核苷酸，其中A1AT启动子或A1AT启动子的片段的长度为至少200、至少250、至少300、500或更少、200至500、250至500、350至450或约418个核苷酸。

123.方面122的多核苷酸，其中A1AT启动子或A1AT启动子片段的长度为350至450个核苷酸。

124.方面111的多核苷酸，其中HCR增强子或HCR增强子的片段是长度为至少150、至少190、至少230、少于400、150至400、190至370、190至370、230至340、250至340或约321个核苷酸的片段。

125.方面124的多核苷酸，其中HCR增强子或HCR增强子的片段的长度为250至340个核苷酸。

126.方面98至101或104至125中任一项的多核苷酸，其中转录调节元件与SEQ IDNO：52至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。

127.方面126的多核苷酸，其中转录调节元件具有SEQ ID NO：52的序列。

128.方面1至99或122至125中任一项的多核苷酸，其中：

(ii)多核苷酸包含与SEQ ID NO：48至少98％、至少99％、至少99.5％、至少99.8％或100％相同的启动子和/或与SEQ ID NO：50至少98％、至少99％、至少99.5％、至少99.8％或100％相同的增强子元件。

129.方面1至99或122至128中任一项的多核苷酸，其中：

(ii)多核苷酸包含与SEQ ID NO：52至少98％、至少99％、至少99.5％、至少99.8％或100％相同的转录调节元件。

130.前述方面中任一项的多核苷酸，其中所述多核苷酸包含土拨鼠肝炎转录后调节元件(WPRE)。

131.前述方面中任一项的多核苷酸，其中所述多核苷酸包含土拨鼠肝炎转录后调节元件(WPRE)，其与SEQ ID NO：62至64中的任一个至少98％、至少99％、至少99.5％、至少99.8％或100％相同。

132.前述方面中任一项的多核苷酸，其中所述多核苷酸包含土拨鼠肝炎转录后调节元件(WPRE)，其与SEQ ID NO：62至64中的任一项至少98％相同。

133.前述方面中任一项的多核苷酸，其中所述多核苷酸包含SEQ ID NO：62至64中任一项的土拨鼠肝炎转录后调节元件(WPRE)。

134.方面98的多核苷酸，其中转录调节元件(TRE):

(a)促进比HCR-hAAT更高的表达；

(b)促进比FRE72更高的表达；

(c)包含hAAT序列元件；和/或

(d)包含AMBP序列元件。

135.方面134的多核苷酸，其中TRE的长度大于500、大于600、大于700、大于800、大于900、大于1000、大于1100、大于1200、大于1300、大于1400、大于1500或大于1600个核苷酸。

136.方面134或135的多核苷酸，其中TRE的长度小于2000、小于1800、小于1600、小于1500、小于1400、小于1300、小于1200、小于1100、小于1000、小于900、小于800、小于700或小于600个核苷酸。

137.方面134-136中任一项的多核苷酸，其中TRE的长度为400至2000、500至1800、600至1400、800至1600、500至600、600至700、700至800、800至900、900至1000、1000至1100、1100至1200、1200至1300、1300至1400、1400至1500、1500至1600或1600至1700个核苷酸。

138.方面134-137中任一项的多核苷酸，其中TRE包含hAAT序列元件。

139.方面134-138中任一项的多核苷酸，其中hAAT序列元件包含SEQ ID NO：95或SEQ ID NO：95的在1、2或3个核苷酸上不同的变体的核苷酸序列。

140.方面134-139中任一项的多核苷酸，其中hAAT序列元件包含SEQ ID NO：95的核苷酸序列。

141.方面134-140中任一项的多核苷酸，其中hAAT序列元件包含SEQ ID NO：96或SEQ ID NO：96的在1、2或3个核苷酸上不同的变体的核苷酸序列。

142.方面134-141中任一项的多核苷酸，其中hAAT序列元件包含SEQ ID NO：96的核苷酸序列。

143.方面134-142中任一项的多核苷酸，其中hAAT序列元件包含与SEQ ID NO：94或SEQ ID NO：94的至少200、至少300或至少400个核苷酸长的片段至少80％、至少85％、至少90％、至少95％、至少98％或至少99％相同的核苷酸序列。

144.方面134-143中任一项的多核苷酸，其中hAAT序列元件包含与SEQ ID NO：94至少98％相同的核苷酸序列。

145.方面134-144中任一项的多核苷酸，其中hAAT序列元件包含SEQ ID NO：94的核苷酸序列。

146.方面134-145中任一项的多核苷酸，其中TRE包含第一和第二hAAT序列元件。

147.方面146的多核苷酸，其中第二hAAT序列元件在第一hAAT序列元件的5'和AMBP序列元件的5'。

148.方面146或方面147的多核苷酸，其中第二hAAT序列元件包含SEQ ID NO：95或SEQ ID NO：95的在1、2或3个核苷酸上不同的变体的核苷酸序列。

149.方面148的TRE，其中第二hAAT序列元件包含SEQ ID NO：95的核苷酸序列。

150.方面134-149中任一项的多核苷酸，其中TRE包含AMBP序列元件。

151.方面134-150中任一项的多核苷酸，其中包含AMBP序列元件的TRE促进与缺乏AMBP序列元件的相应TRE相等或更高的表达。

152.方面134-151中任一项的多核苷酸，其中包含AMBP序列元件的TRE促进比缺乏AMBP序列元件的相应TRE更高的表达。

153.方面134-152中任一项的多核苷酸，其中所述AMBP序列元件包含至少一个选自以下的结合位点：HNF1-1结合位点、HNF4结合位点、HNF3a结合位点、HNF1-2结合位点和HNF3-2结合位点。

154.方面153的多核苷酸，其中所述AMBP序列元件包含HNF1-1结合位点、HNF4结合位点、HNF3a结合位点、HNF1-2结合位点和HNF3-2结合位点。

155.方面134-154中任一项的多核苷酸，其中所述AMBP序列元件包含SEQ ID NO：98或SEQ ID NO：98的在1、2或3个核苷酸上不同的变体的核苷酸序列。

156.方面134-155中任一项的多核苷酸，其中所述AMBP序列元件包含SEQ ID NO：98的核苷酸序列。

157.方面134-156中任一项的多核苷酸，其中所述AMBP序列元件包含SEQ ID NO：97或SEQ ID NO：97的在1、2或3个核苷酸上不同的变体的核苷酸序列。

158.方面134-157中任一项的多核苷酸，其中所述AMBP序列元件包含SEQ ID NO：97的核苷酸序列。

159.方面134-158中任一项的多核苷酸，其中AMBP序列元件在hAAT序列元件的5'。

160.方面134-159中任一项的多核苷酸，其中TRE是肝脏特异性的。

161.方面134-160中任一项的多核苷酸，其中TRE促进比HCR-hAAT更高的表达。

162.方面134-161中任一项的多核苷酸，其中TRE促进比FRE72更高的表达。

163.方面134-162中任一项的多核苷酸，其中TRE促进与HCR-hAAT相比至少1.2倍、至少1.5倍、至少1.8倍或至少2倍的表达。

164.方面134-163中任一项的多核苷酸，其中TRE促进与HCR-hAAT相比至少1.6倍或至少1.8倍的表达。

165.方面134-164中任一项的多核苷酸，其中TRE促进与FRE72相比至少1.2倍、至少1.5倍、至少1.8倍或至少2倍的表达。

166.方面134-165中任一项的多核苷酸，其中TRE促进与FRE72相比至少1.6倍或至少1.8倍的表达。

167.方面134-166中任一项的多核苷酸，其中表达通过表达测定来测量，所述表达测定包括：

(ii)在适合发生转基因表达的条件下孵育转基因；和

(iii)使用对转基因编码的蛋白质具有特异性的抗体，通过ELISA测量转基因的水平。

168.方面167的多核苷酸，其中人肝细胞是Huh7细胞。

169.方面167或168的多核苷酸，其中转基因编码CFI(补体因子I)。

170.方面167-169中任一项的多核苷酸，其中转染人肝细胞的步骤(i)包括用包含表达盒的质粒共转染人肝细胞，所述表达盒包含可操作地连接到启动子的编码萤光素酶的转基因，并且表达测定还包括测量总萤光素酶表达。

171.方面134-170中任一项的多核苷酸，其中TRE包含ApoE-HCR1序列元件。

172.方面171的多核苷酸，其中包含ApoE-HCR1序列元件的TRE促进与缺乏ApoE-HCR1序列元件的相应TRE相等或更高的表达。

173.方面171或172的多核苷酸，其中包含ApoE-HCR1序列元件的TRE促进比缺乏ApoE-HCR1序列元件的相应TRE更高的表达。

174.方面171-173中任一项的多核苷酸，其中ApoE-HCR1序列元件包含SEQ ID NO：93或SEQ ID NO：93的在1、2或3个核苷酸上不同的变体的核苷酸序列。

175.方面171-174中任一项的多核苷酸，其中ApoE-HCR1序列元件包含SEQ ID NO：93的核苷酸序列。

176.方面171-175中任一项的多核苷酸，其中ApoE-HCR1序列元件包含SEQ ID NO：92或SEQ ID NO：92的在1、2或3个核苷酸上不同的变体的核苷酸序列。

177.方面171-176中任一项的多核苷酸，其中ApoE-HCR1序列元件在hAAT序列元件的5’。

178.方面171-177中任一项的多核苷酸，其中ApoE-HCR1序列元件在AMBP序列元件的5’。

179.方面171-177中任一项的多核苷酸，其中ApoE-HCR1序列元件在AMBP序列元件的3’。

180.方面171-178中任一项的多核苷酸，其中ApoE-HCR1序列元件在hAAT序列元件和AMBP序列元件两者的5'。

181.方面171-177或179中任一项的多核苷酸，其中ApoE-HCR1序列元件在hAAT序列元件的5’和AMBP序列元件的3'。

182.方面134-181中任一项的多核苷酸，其中TRE包含CRM6序列元件。

183.方面182的多核苷酸，其中包含CRM6序列元件的TRE促进与缺乏CRM6序列元件的相应TRE相等或更高的表达。

184.方面182或方面183的多核苷酸，其中包含CRM6序列元件的TRE促进与缺乏CRM6序列元件的相应TRE相等的表达。

185.方面182-184中任一项的多核苷酸，其中CRM6序列元件包含选自Sp1结合位点、Sp2结合位点、HNF3a结合位点和HNF-1结合位点的结合位点。

186.方面185的多核苷酸，其中CRM6序列元件包含Sp1结合位点、Sp2结合位点、HNF3a结合位点和HNF1结合位点。

187.方面182-186中任一项的多核苷酸，其中CRM6序列元件包含SEQ ID NO：100或SEQ ID NO：100的在1或2个核苷酸上不同的变体的核苷酸序列。

188.方面182-187中任一项的多核苷酸，其中CRM6序列元件包含SEQ ID NO：100的核苷酸序列。

189.方面182-188中任一项的多核苷酸，其中CRM6序列元件包含SEQ ID NO：101或SEQ ID NO：101的在1、2或3个核苷酸上不同的变体的核苷酸序列。

190.方面182-189中任一项的多核苷酸，其中CRM6序列元件包含SEQ ID NO：101的核苷酸序列。

191.方面182-190中任一项的多核苷酸，其中CRM6序列元件包含SEQ ID NO：100的核苷酸序列和SEQ ID NO：101的核苷酸序列。

192.方面182-191中任一项的多核苷酸，其中CRM6序列元件包含SEQ ID NO：99或SEQ ID NO：99的在1、2或3个核苷酸上不同的变体的核苷酸序列。

193.方面182-192中任一项的多核苷酸，其中CRM6序列元件包含SEQ ID NO：99的核苷酸序列。

194.方面182-193中任一项的多核苷酸，其中CRM6序列元件在hAAT序列元件的5’。

195.方面182-194中任一项的多核苷酸，其中CRM6序列元件在AMBP序列元件的5’。

196.方面182-194中任一项的多核苷酸，其中CRM6序列元件在AMBP序列元件的3’。

197.方面182-195中任一项的多核苷酸，其中CRM6序列元件在hAAT序列元件和AMBP序列元件两者的5’。

198.方面182-194或196中任一项的多核苷酸，其中CRM6序列元件在hAAT序列元件的5’和AMBP序列元件的3'。

199.方面134-198中任一项的多核苷酸，其中TRE包含ALDOB序列元件。

200.方面199的多核苷酸，其中包含ALDOB序列元件的TRE促进与缺乏ALDOB序列元件的相应TRE相等或更高的表达。

201.方面199或200中任一项的多核苷酸，其中包含ALDOB序列元件的TRE促进与缺乏ALDOB序列元件的相应TRE相等的表达。

202.方面199-201中任一项的多核苷酸，其中ALDOB序列元件包含至少一个选自以下的结合位点：SP1结合位点、HNF1a结合位点、C/EBP结合位点、GATA2结合位点、USF1结合位点和USF2结合位点。

203.方面202的多核苷酸，其中ALDOB序列元件包含SP1结合位点、HNF1a结合位点、C/EBP结合位点、GATA2结合位点、USF1结合位点和USF2结合位点。

204.方面199-203中任一项的多核苷酸，其中所述ALDOB序列元件包含SEQ ID NO：103或SEQ ID NO：103的在1、2或3个核苷酸上不同的变体的核苷酸序列。

205.方面199-204中任一项的多核苷酸，其中ALDOB序列元件包含SEQ ID NO：103的核苷酸序列。

206.方面199-205中任一项的多核苷酸，其中ALDOB序列元件包含SEQ ID NO：102或SEQ ID NO：102的在1、2或3个核苷酸上不同的变体的核苷酸序列。

207.方面206的多核苷酸，其中ALDOB序列元件包含SEQ ID NO：102的核苷酸序列。

208.方面199-207中任一项的多核苷酸，其中ALDOB序列元件在hAAT序列元件的5’。

209.方面199-208中任一项的多核苷酸，其中ALDOB序列元件在AMBP序列元件的5’。

210.方面199-208中任一项的多核苷酸，其中ALDOB序列元件在AMBP序列元件的3’。

211.方面199-209中任一项的多核苷酸，其中ALDOB序列元件在hAAT序列元件和AMBP序列元件两者的5’。

212.方面199-208或210中任一项的多核苷酸，其中ALDOB序列元件在hAAT序列元件的5’和AMBP序列元件的3'。

213.方面134-212中任一项的多核苷酸，其中TRE包含F2序列元件。

214.方面213的多核苷酸，其中包含F2序列元件的TRE促进与缺乏F2序列元件的相应TRE相等或更高的表达。

215.方面213或方面214的多核苷酸，其中包含F2序列元件的TRE促进比缺乏F2序列元件的相应TRE更高的表达。

216.方面213-215中任一项的多核苷酸，其中F2序列元件包含至少一个选自以下的结合位点：HNF4a结合位点、HNF3a结合位点、HNF1a结合位点、HNF3b结合位点、STAT3结合位点、RBPJ结合位点和SP3结合位点。

217.方面216的多核苷酸，其中F2序列元件包含HNF4a结合位点、HNF3a结合位点、HNF1a结合位点、HNF3b结合位点、STAT3结合位点、RBPJ结合位点和SP3结合位点。

218.方面213-217中任一项的多核苷酸，其中F2序列元件包含SEQ ID NO：105或SEQ ID NO：105的在1、2或3个核苷酸上不同的变体的核苷酸序列。

219.方面218的多核苷酸，其中F2序列元件包含SEQ ID NO：105的序列。

220.方面213-219中任一项的多核苷酸，其中F2序列元件包含SEQ ID NO：104或SEQ ID NO：104的在1、2或3个核苷酸上不同的变体的核苷酸序列。

221.方面220的多核苷酸，其中F2序列元件包含SEQ ID NO：104的核苷酸序列。

222.方面213-221中任一项的多核苷酸，其中F2序列元件在hAAT序列元件的5’。

223.方面213-222中任一项的多核苷酸，其中F2序列元件在AMBP序列元件的5’。

224.方面213-222中任一项的多核苷酸，其中F2序列元件在AMBP序列元件的3’。

225.方面213-223中任一项的多核苷酸，其中F2序列元件在hAAT序列元件和AMBP序列元件两者的5’。

226.方面213-222或224中任一项的多核苷酸，其中F2序列元件在hAAT序列元件的5’和AMBP序列元件的3'。

227.方面134-226中任一项的多核苷酸，其中TRE包含：

(b)SEQ ID NO：68-91中任一个的核苷酸序列。

228.方面134-227中任一项的多核苷酸，其中TRE包含：

(a)与SEQ ID NO：70具有至少80％、至少85％、至少90％、至少95％、至少98％或至少99％序列同一性的核苷酸序列；或

(b)SEQ ID NO：70的核苷酸序列。

229.方面134-227中任一项的多核苷酸，其中TRE包含：

(a)与SEQ ID NO：74具有至少80％、至少85％、至少90％、至少95％、至少98％或至少99％序列同一性的核苷酸序列；或

(b)SEQ ID NO：74的核苷酸序列。

230.方面134-229中任一项的多核苷酸，其中TRE进一步包含：

a)TATA盒；

b)HNF6结合位点；

c)HNF4a结合位点；

d)HNF1结合位点；和/或

e)HNF3结合位点。

231.方面230的多核苷酸，其中TRE进一步包含TATA盒，任选地经典TATA盒。

232.方面231的多核苷酸，其中TRE包含hAAT序列元件并且TATA盒***到hAAT序列元件中。

233.方面231或232的多核苷酸，其中hAAT序列元件包含SEQ ID NO：95或SEQ IDNO：95的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且TATA盒在SEQ ID NO：95或SEQID NO：95的变体的核苷酸序列的3'。

234.方面231或232的多核苷酸，其中hAAT序列元件包含SEQ ID NO：95或SEQ IDNO：95的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且TATA盒在SEQ ID NO：95或SEQID NO：95的变体的核苷酸序列的5'。

235.方面230-234中任一项的多核苷酸，其中TRE促进与不包含TATA盒的相应TRE相等或更高的表达。

236.方面230-235中任一项的多核苷酸，其中TRE还包含HNF6结合位点。

237.方面236的多核苷酸，其中TRE包含HNF6结合位点，并且：

b.TRE包含hAAT序列元件，其包含SEQ ID NO：31或SEQ ID NO：96的在1、2或3个核苷酸上不同的变体的核苷酸序列，并且HNF6结合位点在包含SEQ ID NO：96或SEQ ID NO：31的在1、2或3个核苷酸上不同的变体的核苷酸序列的hAAT序列元件的5’；和/或

238.方面236-237中任一项的多核苷酸，其中TRE促进与不包含HNF6结合位点的相应TRE相等或更高的表达。

239.方面236-238中任一项的多核苷酸，其中TRE包含HNF6结合位点和TATA盒并且TRE促进与不包含HNF6结合位点和TATA盒的相应TRE相等或更高的表达。

240.方面230-239中任一项的多核苷酸，其中TRE还包含HNF4a结合位点。

241.方面240的多核苷酸，其中TRE包含HNF4a结合位点，并且：

242.方面240-241中任一项的多核苷酸，其中TRE促进与不包含HNF4a结合位点的相应TRE相等或更高的表达。

243.方面240-242中任一项的多核苷酸，其中TRE包含HNF6结合位点和HNF4a结合位点并且TRE促进与不包含HNF6结合位点和HNF4a结合位点的相应TRE相等或更高的表达。

244.方面240-243中任一项的多核苷酸，其中TRE还包含HNF1结合位点。

245.方面244的多核苷酸，其中TRE包含HNF1结合位点，并且：

246.方面244-245中任一项的多核苷酸，其中TRE促进与不包含HNF1结合位点的相应TRE相等或更高的表达。

247.方面244-246中任一项的多核苷酸，其中TRE包含HNF6结合位点、HNF4a结合位点和TATA盒并且TRE促进与不包含HNF6结合位点、HNF4a结合位点和TATA盒的相应TRE相等或更高的表达。

248.方面230-247中任一项的多核苷酸，其中TRE还包含HNF3结合位点。

249.方面248的多核苷酸，其中TRE包含HNF3结合位点，并且：

250.方面248-249中任一项的多核苷酸，其中TRE促进与不包含HNF3结合位点的相应TRE相等或更高的表达。

251.方面248-250中任一项的多核苷酸，其中TRE包含HNF3结合位点和TATA盒并且TRE促进与不包含HNF3结合位点和TATA盒的相应TRE相等或更高的表达。

252.前述方面中任一项的多核苷酸，其中所述多核苷酸进一步包含一个或两个ITR。

253.方面252的多核苷酸，其中该或每个ITR的核苷酸序列长度少于157个、少于154个或为约145个核苷酸。

254.方面252或253的多核苷酸，其中该或每个ITR是野生型ITR。

255.方面252至254中任一项的多核苷酸，其中该或每个ITR是AAV2 ITR。

256.方面252至255中任一项的多核苷酸，其中该或每个ITR的核苷酸序列包含SEQID NO：53或SEQ ID NO：54的核苷酸序列。

257.前述方面中任一项的多核苷酸，其中所述多核苷酸还包含多聚A核苷酸序列。

258.方面257的多核苷酸，其中多聚A核苷酸序列包含SEQ ID NO：55的核苷酸序列。

259.前述方面中任一项的多核苷酸，其中所述多核苷酸还包含内含子。

260.前述方面中任一项的多核苷酸，其中CFI多肽或其片段包含序列，其：

a)与SEQ ID NO：43或44至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同；或

b)与SEQ ID NO：43或44的至少300、至少350、至少400、583或更少、565或更少、300至583或300至565个氨基酸长度的片段至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。

261.一种包含重组基因组的病毒颗粒，所述重组基因组包含前述方面中任一项的多核苷酸。

262.方面261的病毒颗粒，其是AAV、腺病毒或慢病毒病毒颗粒。

263.方面262的病毒颗粒，其是AAV病毒颗粒。

264.方面261至263中任一项的病毒颗粒，其中所述病毒颗粒包含衣壳。

265.方面264的病毒颗粒，其中所述病毒颗粒包含嗜肝衣壳。

266.方面265的病毒颗粒，其中所述嗜肝衣壳包含与SEQ ID NO：56-59中任一个的至少600、至少650、至少700、600至734、600至736、650至734、650至736、700至734、700至736、约734或约736个氨基酸的片段至少98％、至少99％或至少99.5％相同的序列。

267.方面266的病毒颗粒，其中所述嗜肝衣壳包含与SEQ ID NO：56-59中的任一个至少99％相同的序列。

268.方面267的病毒颗粒，其中所述嗜肝衣壳包含与SEQ ID NO：57至少99％相同的序列。

269.方面261至268中任一项的病毒颗粒，其中重组基因组是单链的。

270.方面261至269中任一项的病毒颗粒，其中与在施用包含参考CFI核苷酸序列的等效病毒颗粒时由参考CFI核苷酸编码的CFI多肽的表达相比，由CFI核苷酸序列编码的CFI多肽或其片段在施用病毒颗粒时以相同或更高的水平表达。

271.方面270的病毒颗粒，其中与由参考CFI核苷酸序列编码的CFI多肽的表达相比，由CFI核苷酸序列编码的CFI多肽或其片段的表达处于更高水平。

272.方面270或271的病毒颗粒，其中由CFI核苷酸序列编码的CFI多肽或其片段的表达与由参考CFI核苷酸序列编码的CFI多肽相比为至少1.5x、至少2x、至少3x、至少5x、至少8x或至少10x。

273.方面271或272的病毒颗粒，其中参考CFI核苷酸序列是野生型CFI核苷酸序列。

274.方面273的病毒颗粒，其中野生型CFI核苷酸序列是SEQ ID NO：41或42的序列。

275.方面270至272中任一项的病毒颗粒，其中参考CFI核苷酸序列是SEQ ID NO：1或21的序列。

276.方面270至272中任一项的病毒颗粒，其中参考CFI核苷酸序列是SEQ ID NO：5或25的序列。

277.前述方面中任一项的病毒颗粒，其中由CFI核苷酸序列编码的CFI多肽或其片段的表达是由SEQ ID NO：5或25的序列编码的CFI多肽的表达的至少50％、至少60％、至少70％、至少80％、至少90％、至少95％或至少100％。

278.一种组合物，其包含前述方面中任一项的多核苷酸或病毒颗粒，以及药学上可接受的赋形剂。

279.根据方面1至260中任一项的多核苷酸、根据方面261至277中任一项的病毒颗粒或根据方面278的组合物，其用于治疗方法。

280.一种治疗方法，包括施用有效量的根据方面1至260中任一项的多核苷酸、根据方面261至277中任一项的病毒颗粒或根据方面278的组合物。

281.根据方面1至260中任一项的多核苷酸、根据方面261至277中任一项的病毒颗粒或根据方面278的组合物在制备用于治疗方法的药物中的用途。

282.根据方面279至281中任一项使用的多核苷酸、病毒颗粒或组合物或用途，其中治疗方法包括向患者施用有效量的多核苷酸、病毒颗粒或组合物。

283.用于治疗方法的包含补体因子I(CFI)核苷酸序列的多核苷酸、包含含有该多核苷酸的重组基因组的病毒颗粒或包含该多核苷酸或病毒颗粒的组合物，其中该治疗方法是治疗补体介导的病症的方法，并且CFI核苷酸序列编码CFI多肽或其片段。

284.一种治疗方法，包括施用有效量的包含CFI核苷酸序列的多核苷酸、包含含有该多核苷酸的重组基因组的病毒颗粒或包含该多核苷酸或病毒颗粒的组合物，其中该治疗方法是治疗补体介导的病症的方法，并且CFI核苷酸序列编码CFI多肽或其片段。

285.一种包含CFI核苷酸序列的多核苷酸、包含含有该多核苷酸的重组基因组的病毒颗粒或包含该多核苷酸或病毒颗粒的组合物在制备用于治疗方法的药物中的用途，其中该治疗方法是治疗补体介导的病症的方法，并且CFI核苷酸序列编码CFI多肽或其片段。

286.根据方面283至285中任一项使用的多核苷酸、病毒颗粒或组合物或用途，其中治疗方法包括向患者施用有效量的多核苷酸、病毒颗粒或组合物。

287.根据方面279至282中任一项使用的多核苷酸、病毒颗粒或组合物或用途，其中治疗方法是治疗补体介导的病症的方法。

288.根据方面283至287中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中所述病症是C3介导的病症。

289.根据方面283至288中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中所述病症是肾脏疾病。

290.根据方面283至289中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中所述病症与补体C3b反馈循环的过度活动有关。

291.根据方面283至290中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中所述病症选自C3肾小球病、IgA肾病、狼疮性肾炎、***性红斑狼疮、膜性肾病、膜增生性肾小球肾炎、阵发性睡眠性血红蛋白尿、非典型溶血性***综合征、自身免疫性溶血性贫血、ANCA相关血管炎、戈谢病、腹膜炎、年龄-相关黄斑变性、糖尿病性视网膜病变、致密物沉积病、年龄相关性炎症或自身炎症性疾病、自身免疫性关节炎如类风湿性关节炎、动脉粥样硬化、慢性心血管疾病、阿尔茨海默氏病、***性血管炎、格林-巴利综合征和Henoch-Schonlein紫癜。

292.根据方面283至291中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中所述病症选自C3肾小球病、C3肾小球肾炎和致密物沉积病。

293.根据方面283至291中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中所述病症是具有单等位基因CFH突变的非典型溶血性***综合征。

294.根据方面283至291中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中所述病症是肾小球或肾小管病症。

295.根据方面283至291或294中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中所述病症选自C3肾小球病、IgA肾病、狼疮性肾炎和膜性肾病。

296.根据方面283至291或294至295中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中所述病症是狼疮性肾炎。

297.根据方面283至291中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中所述病症是***性红斑狼疮。

298.根据方面283至297中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中该多核苷酸、病毒颗粒或组合物是根据方面1至278中任一项的。

299.根据方面283至298中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中多核苷酸、病毒颗粒或组合物的施用减少受试者中与病症相关的炎症。

300.根据方面299使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中多核苷酸、病毒颗粒或组合物的施用将炎症降低至施用多核苷酸、病毒颗粒或组合物之前存在的炎症水平的小于或约60％、小于或约55％、小于或约50％、小于或约45％、小于或约40％、小于或约35％、小于或约30％、小于或约25％或小于或约20％的水平。

301.根据方面279至300中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中治疗方法是减轻患者中的炎症的方法。

302.根据方面283至301中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中治疗方法是减轻患者中的炎症的方法，从而治疗补体介导的病症。

303.根据方面283至302中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中治疗方法是通过减轻患者中的炎症来治疗疾病的方法。

304.根据方面301至303中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中减轻炎症是将炎症减轻至施用多核苷酸、病毒颗粒或组合物之前存在的炎症水平的小于或约60％、小于或约55％、小于或约50％、小于或约45％、小于或约40％、小于或约35％、小于或约30％、小于或约25％或小于或约20％的水平。

305.根据方面282或286至304中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中治疗方法包括向患者施用有效量的多核苷酸、病毒颗粒或组合物，并且有效量是足以减轻患者中的炎症的量。

306.根据方面305使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中足以减轻患者中的炎症的量是足以将炎症减轻至施用多核苷酸、病毒颗粒或组合物之前存在的炎症水平的小于或约60％、小于或约55％、小于或约50％、小于或约45％、小于或约40％、小于或约35％、小于或约30％、小于或约25％或小于或约20％的水平的量。

307.根据方面282至298中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中多核苷酸、病毒颗粒或组合物的施用减少受试者中的蛋白尿。

308.根据方面307使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中蛋白尿通过测量尿液中的白蛋白与肌酸酐比值(ACR)来评分。

309.根据方面307或308使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中多核苷酸、病毒颗粒或组合物的施用将蛋白尿减少至施用多核苷酸、病毒颗粒或组合物之前存在的蛋白尿水平的小于或约70％、小于或约65％、小于或约60％、小于或约55％、小于或约50％、小于或约45％、小于或约40％、小于或约35％、小于或约30％、小于或约25％、小于或约20％、小于或约15％或小于或约10％的水平。

310.根据方面283至309中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中所述治疗方法是用于减少患者中的蛋白尿的方法。

311.根据方面283至310中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中所述治疗方法是减少患者中的蛋白尿从而治疗补体介导的病症的方法。

312.根据方面283至311中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中所述治疗方法是通过减少患者的蛋白尿来治疗疾病的方法。

313.根据方面310至312中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中减少蛋白尿是将蛋白尿减少至施用多核苷酸、病毒颗粒或组合物之前存在的蛋白尿水平的小于或约70％、小于或约65％、小于或约60％、小于或约55％、小于或约50％、小于或约45％、小于或约40％、小于或约35％、小于或约30％、小于或约25％、小于或约20％、小于或约15％或小于或约10％的水平。

314.根据方面282至305中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中治疗方法包括向患者施用有效量的多核苷酸、病毒颗粒或组合物，并且有效量是足以减少患者中的蛋白尿的量。

315.根据方面314使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中足以减少患者中的蛋白尿的量是足以将蛋白尿减少至施用多核苷酸、病毒颗粒或组合物之前存在的蛋白尿水平的小于或约70％、小于或约65％、小于或约60％、小于或约55％、小于或约50％、小于或约45％、小于或约40％、小于或约35％、小于或约30％、小于或约25％、小于或约20％、小于或约15％或小于或约10％的水平的量。

316.根据方面280至315中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中多核苷酸、病毒颗粒或组合物的施用减少受试者中的肾小球病理和/或肾小管病理。

317.根据方面316使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中多核苷酸、病毒颗粒或组合物的施用减少肾小球病理和/或肾小管病理，如通过PAS染色时降低的病理学水平所见。

318.根据方面283至317中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中治疗方法是减少患者中的肾小球病理和/或肾小管病理的方法。

319.根据方面283至318中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中治疗方法是减少患者中的肾小球病理和/或肾小管病理的方法，从而治疗补体介导的疾病。

320.根据方面283至319中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中所述治疗方法是通过减少患者中的肾小球病理和/或肾小管病理来治疗疾病的方法。

321.根据方面318至320中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中减少肾小球病理和/或肾小管病理是如通过PAS染色时降低的病理学水平所见的减少肾小球病理和/或肾小管病理。

322.根据方面282至321中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中治疗方法包括向患者施用有效量的多核苷酸、病毒颗粒或组合物，并且有效量是足以减少患者中的肾小球病理和/或肾小管病理的量。

323.根据方面322使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中足以减少患者中的肾小球病理和/或肾小管病理的量是足以如通过PAS染色时降低的病理学水平所见的减少肾小球病理和/或肾小管病理的量。

324.根据方面283至323中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中所述病症不是眼部病症。

325.根据方面283至324中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中多核苷酸、病毒颗粒或组合物不是通过视网膜下注射、直接视网膜注射、脉络膜上腔注射和/或玻璃体内注射施用的。

326.根据方面279至325中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中多核苷酸、病毒颗粒或组合物不是眼内施用的。

327.根据方面279至326中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中所述多核苷酸、病毒颗粒或组合物通过以下方式施用：静脉内；全身地；通过外周静脉输注至肝脏；通过肝血管如肝静脉输注或肝动脉输注至肝脏；或通过实质内直接施用至肝脏。

328.根据方面279至327中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中所述多核苷酸、病毒颗粒或组合物静脉内施用。

329.根据方面279至327中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中全身施用所述多核苷酸、病毒颗粒或组合物。

330.根据方面279至327中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中通过外周静脉输注将多核苷酸、病毒颗粒或组合物施用至肝脏。

331.根据方面279至327中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中所述多核苷酸、病毒颗粒或组合物经由肝血管施用至肝脏，其中所述施用是通过肝静脉输注或肝动脉输注进行的。

332.根据方面279至327中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中所述多核苷酸、病毒颗粒或组合物通过直接向肝脏的实质内施用来施用。

333.根据方面279至327中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中所述多核苷酸、病毒颗粒或组合物通过注射入肾动脉来施用。

334.根据方面279至327中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中通过逆行施用来施用所述多核苷酸、病毒颗粒或组合物。

335.根据方面334使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中通过逆行施用来施用多核苷酸、病毒颗粒或组合物，其中施用是使用导尿管经由输尿管进行的。

336.根据方面279至335中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中CFI核苷酸序列包含与SEQ ID NO：1或21的核苷酸序列至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

337.根据方面283至336中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中多核苷酸、病毒颗粒或组合物的施用增加患者中的C3b-失活和/或iC3b-降解活性的水平。

338.根据方面337使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中多核苷酸、病毒颗粒或组合物的施用使C3b-失活和/或iC3b-降解活性的水平增加至高于正常水平。

339.根据方面337或338使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中多核苷酸、病毒颗粒或组合物的施用将C3b-失活和/或iC3b-降解活性的水平提高至正常水平的1.2倍、1.5倍、1.8倍或2倍水平。

340.根据方面338或339使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中正常水平相当于血清中30-40μg/ml CFI多肽提供的水平。

341.根据方面283至340中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中治疗方法是增加患者中的C3b-失活和/或iC3b-降解水平的方法。

342.根据方面283至341中任一项使用的多核苷酸、病毒颗粒或组合物的用途、用途或方法，其中治疗方法是增加患者中的C3b-失活和/或iC3b-降解水平的方法，从而治疗补体介导的疾病。

343.根据方面283至342中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中治疗方法是通过增加患者中的C3b-失活和/或iC3b-降解水平来治疗疾病的方法。

344.根据方面337或338使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中增加患者中C3b-失活和/或iC3b-降解的水平是将C3b-失活和/或iC3b-降解活性的水平增加至高于正常水平。

345.根据方面337或338使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中增加患者中C3b-失活和/或iC3b-降解的水平是将C3b-失活和/或iC3b-降解活性增加至正常水平的1.2倍、1.5倍、1.8倍或2倍水平。

346.根据方面344或345使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中正常水平相当于血清中30-40μg/ml CFI多肽提供的水平。

347.根据方面279至346中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中CFI核苷酸序列是来自WO2020/086735的SEQ ID NO：1、2、3或5中任一个，或来自WO2017/072515的SEQ ID NO：8的核苷酸序列。

348.根据方面279至346中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中CFI核苷酸序列是来自WO2020/128516的SEQ ID NO：18至26中任一个的核苷酸序列。

序列表

<110> 自由行疗法有限公司

<120> 多核苷酸

<130> N418304WO

<150> GB2009741.6

<151> 2020-06-25

<160> 202

<170> PatentIn version 3.5

<210> 1

<211> 1698

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 1

aaggtgacct atacatctca ggaggatctg gtggagaaga agtgtctggc caagaagtac 60

acacacctga gctgcgacaa ggtgttctgt cagccatggc agcggtgcat cgagggaacc 120

tgcgtgtgca agctgcctta tcagtgccca aagaacggca ccgccgtgtg cgccacaaat 180

cggagatctt ttccaacata ctgccagcag aagagcctgg agtgtctgca ccccggcacc 240

aagtttctga acaatggcac ctgcacagcc gagggcaagt tctctgtgag cctgaagcac 300

ggcaacacag attccgaggg catcgtggag gtgaagctgg tggaccagga taagaccatg 360

ttcatctgta agagctcctg gtctatgaga gaggccaacg tggcctgcct ggatctgggc 420

tttcagcagg gcgccgacac acagaggcgc ttcaagctgt ccgacctgtc tatcaatagc 480

accgagtgcc tgcacgtgca ctgtaggggc ctggagacaa gcctggccga gtgcaccttt 540

acaaagcgga gaaccatggg ctatcaggac ttcgccgacg tggtgtgcta cacccagaag 600

gccgattctc caatggacga tttctttcag tgcgtgaacg gcaagtacat cagccagatg 660

aaggcctgcg acggcatcaa tgactgtggc gatcagtccg acgagctgtg ctgtaaggcc 720

tgtcagggca agggctttca ctgcaagagc ggcgtgtgca tcccctccca gtatcagtgc 780

aacggcgagg tggattgtat caccggagag gacgaagtgg gatgcgcagg cttcgcctcc 840

gtgacccagg aggagaccga gatcctgaca gccgacatgg atgccgagag gcgccggatc 900

aagtctctgc tgcctaagct gagctgtggc gtgaagaata gaatgcacat cagaaggaag 960

cgcatcgtgg gaggcaagag ggcacagctg ggcgatctgc catggcaggt ggccatcaag 1020

gacgcaagcg gaatcacctg cggaggcatc tatatcggag gatgttggat cctgaccgca 1080

gcacactgcc tgagagcatc caagacacac aggtaccaga tctggaccac agtggtggat 1140

tggatccacc ctgacctgaa gagaatcgtg atcgagtatg tggataggat catcttccac 1200

gagaactaca atgccggcac atatcagaac gacatcgccc tgatcgagat gaagaaggat 1260

ggcaataaga aggactgtga gctgccacgc tccatccctg catgcgtgcc ctggtctcct 1320

tacctgtttc agccaaacga tacctgcatc gtgagcggat ggggaaggga gaaggacaat 1380

gagcgggtgt tctccctgca gtggggcgag gtgaagctga tctccaactg ttctaagttt 1440

tacggcaatc ggttctatga gaaggagatg gagtgcgccg gcacctacga tggcagcatc 1500

gacgcctgta agggcgattc cggaggacca ctggtgtgca tggacgcaaa caatgtgaca 1560

tacgtgtggg gagtggtgag ctggggagag aactgcggca agccagagtt tcccggcgtc 1620

tacaccaagg tggccaatta ttttgactgg atctcctacc acgtgggcag gcctttcatc 1680

tctcagtaca acgtgtga 1698

<210> 2

<211> 1698

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 2

aaagtgacct acaccagcca agaggacctg gtggaaaaga agtgcctggc caagaagtac 60

acccacctga gctgcgacaa ggtgttctgc cagccttggc agagatgcat cgagggcacc 120

tgtgtgtgca agctgcccta tcagtgcccc aagaatggca cagccgtgtg cgccaccaac 180

agaagaagct tccctaccta ctgccagcag aaaagcctgg aatgtctgca ccccggcacc 240

aagtttctga acaacggcac ctgtaccgcc gagggcaagt ttagcgtgtc cctgaagcac 300

ggcaacaccg actctgaggg catcgtggaa gtgaagctgg tggaccagga caagaccatg 360

ttcatctgca agagcagctg gtccatgcgc gaggccaatg tggcttgtct ggatctggga 420

ttccagcagg gcgccgacac acagagaaga ttcaagctga gcgacctgag catcaacagc 480

accgagtgcc tgcatgtgca ctgtagaggc ctggaaacaa gcctggccga gtgcaccttc 540

accaagagaa ggaccatggg ctaccaggac ttcgccgacg tcgtgtgcta cacccagaaa 600

gccgactctc ccatggacga tttcttccag tgcgtgaacg gcaagtacat cagccagatg 660

aaggcctgcg acggcatcaa cgattgcggc gatcagagcg acgagctgtg ctgcaaagcc 720

tgtcaaggca agggcttcca ctgcaagtcc ggcgtgtgta tccctagcca gtaccagtgc 780

aatggcgagg tggactgtat caccggcgag gatgaagtgg gctgtgccgg atttgccagc 840

gtgacccaag aggaaaccga gatcctgacc gccgatatgg acgccgagcg gcggagaatc 900

aaaagcctgc tgcctaagct gtcctgcggc gtgaagaacc ggatgcacat ccggcgcaag 960

agaatcgtcg gaggcaaaag agcacagctg ggcgatctgc cttggcaagt ggccatcaag 1020

gatgccagcg gcatcacatg tggcggcatc tacatcggcg gctgctggat tctgacagcc 1080

gctcattgtc tgcgggccag caagacccac cggtatcaga tctggaccac cgtggtggac 1140

tggattcacc ccgacctgaa gcggatcgtg atcgagtacg tggaccggat catcttccac 1200

gagaactaca acgccggcac ctaccagaac gatatcgccc tgatcgagat gaagaaggac 1260

gggaacaaga aggactgcga gctgcctaga tctatccccg cctgtgttcc ttggagcccc 1320

tacctgttcc agcctaacga tacctgcatc gtgtccggct ggggcagaga gaaggataac 1380

gagagggtgt tcagcctgca gtggggcgaa gtgaaactga tcagcaactg cagcaagttc 1440

tacggcaacc ggttctacga gaaagaaatg gaatgcgccg gcacatacga cggctccatc 1500

gatgcctgta aaggcgattc tggcggccct ctcgtgtgca tggatgccaa caatgtgacc 1560

tacgtgtggg gcgtcgtgtc ctggggagag aattgtggca agcctgagtt ccccggcgtc 1620

tacaccaagg tggccaacta cttcgactgg atcagctacc acgtgggcag accctttatc 1680

agccagtaca acgtgtga 1698

<210> 3

<211> 1698

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 3

aaggtgacct atacatctca ggaggatctg gtggagaaga agtgtctggc caagaagtac 60

acacacctga gttgtgacaa ggtgttctgt cagccatggc agagatgcat tgagggaacc 120

tgtgtgtgca agctgcctta tcagtgccca aagaatggca ctgctgtgtg tgccacaaat 180

aggagatctt ttccaacata ctgccagcag aagagcctgg agtgtctgca ccctggcacc 240

aagtttctga acaatggcac ctgcacagct gagggcaagt tctctgtgag cctgaagcat 300

ggcaacacag atagtgaggg cattgtggag gtgaagctgg tggaccagga taagaccatg 360

ttcatctgta agagctcctg gtctatgaga gaggccaatg tggcctgcct ggatctgggc 420

tttcaacaag gagctgacac acagaggaga ttcaagctga gtgacctgtc tatcaatagc 480

acagagtgcc tgcatgtgca ctgtagaggc ctggagacaa gcctggctga gtgcaccttt 540

acaaagagaa ggaccatggg ctatcaggac tttgctgatg tggtatgcta cacccagaag 600

gctgattctc caatggatga tttctttcaa tgtgtgaatg gcaagtacat cagccagatg 660

aaggcctgtg atggcatcaa tgactgtgga gatcagagtg atgagctgtg ttgcaaggcc 720

tgtcagggca agggctttca ctgcaagagt ggagtgtgca tcccctccca atatcagtgc 780

aatggagagg tggattgtat cacaggagag gatgaagtgg gatgtgcagg ctttgcctca 840

gtgacccagg aggagacaga gatcctgaca gctgacatgg atgctgagag gagaaggatc 900

aagtctctgc tgcctaagct gagctgtgga gtgaagaata gaatgcacat cagaaggaag 960

agaattgtgg gaggcaagag ggcacagctg ggagatctgc catggcaggt ggccatcaag 1020

gatgcaagtg gaatcacctg tggaggcatc tatattggag gatgttggat cctgacagca 1080

gcacactgcc tgagagcatc caagacacac agataccaga tctggaccac agtggttgat 1140

tggatccacc ctgacctgaa gagaattgtg attgagtatg tggataggat catcttccat 1200

gagaactaca atgctggcac atatcagaat gacattgccc tgattgagat gaagaaggat 1260

ggcaataaga aggactgtga gctgccaaga tccatccctg catgtgtgcc ctggtctcct 1320

tacctgtttc agccaaatga tacctgcatt gtatccggat ggggaaggga gaaggacaat 1380

gagagagtgt tctccctgca gtggggagag gtgaagctga tctccaactg ttctaagttt 1440

tatggcaata gattctatga gaaggagatg gagtgtgcag gcacctatga tggcagcatt 1500

gatgcctgta agggagatag tggaggacca ctggtgtgca tggatgcaaa caatgtgaca 1560

tatgtgtggg gagtggtgag ctggggagag aactgtggca agccagagtt tcctggagtc 1620

tacaccaagg tggccaatta ttttgactgg atctcctacc atgtgggcag gcctttcatc 1680

tctcagtaca atgtgtga 1698

<210> 4

<211> 1698

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 4

aaggtgacct acaccagcca agaggacctg gtggaaaaga agtgcctggc caagaagtac 60

acccacctga gctgtgacaa ggtgttctgc cagccttggc agagatgcat tgagggcacc 120

tgtgtgtgca agctgcccta tcagtgcccc aagaatggca cagctgtgtg tgccaccaac 180

agaaggagct tccctaccta ctgccagcag aaaagcctgg aatgtctgca ccctggcacc 240

aagtttctga acaatggcac ctgtacagct gagggcaagt ttagtgtgtc cctgaagcat 300

ggcaacacag actctgaggg cattgtggaa gtgaagctgg tggaccagga caagaccatg 360

ttcatctgca agagtagctg gtccatgaga gaggccaatg tggcttgtct ggatctggga 420

ttccaacagg gagctgacac acagagaaga ttcaagctga gtgacctgag catcaacagc 480

acagagtgcc tgcatgtgca ctgtagaggc ctggaaacaa gcctggctga gtgcaccttc 540

accaagagaa ggaccatggg ctaccaggac tttgctgatg tggtgtgcta cacccagaaa 600

gctgactctc ccatggatga tttctttcaa tgtgtgaatg gcaagtacat cagccagatg 660

aaggcctgtg atggcatcaa tgattgtgga gatcagagtg atgagctgtg ctgcaaagcc 720

tgtcaaggca agggcttcca ctgcaagagt ggagtgtgta tccctagcca gtaccagtgc 780

aatggagagg tggactgtat cacaggagag gatgaagtgg gctgtgctgg atttgccagt 840

gtgacccaag aggaaacaga gatcctgaca gctgatatgg atgctgagag aaggagaatc 900

aaaagcctgc ttcctaagct gtcctgtgga gtgaagaaca gaatgcacat cagaaggaag 960

agaattgtgg gaggcaaaag agcacagctg ggagatctgc cttggcaagt ggccatcaag 1020

gatgccagtg gcatcacatg tggaggcatc tacattggag gctgctggat tctgacagct 1080

gctcattgtc tgagagccag caagacccac agatatcaga tctggaccac agtggtagac 1140

tggattcacc ctgacctgaa gagaattgtg attgagtatg tggacagaat catcttccat 1200

gagaactaca atgctggcac ctaccagaat gatattgccc tgattgagat gaagaaggat 1260

ggaaacaaga aagactgtga gctgcctaga tctatccctg cctgtgttcc ttggagcccc 1320

tacctgttcc agcctaatga tacctgcata gtttctggat ggggcagaga gaaggataat 1380

gagagggtgt tcagcctgca gtggggagaa gtgaaactga tcagcaactg cagcaagttc 1440

tatggcaaca gattctatga gaaagaaatg gaatgtgctg gcacatatga tggctccatt 1500

gatgcctgta aaggagattc tggaggccct cttgtgtgca tggatgccaa caatgtgacc 1560

tatgtgtggg gagtggtatc ctggggagag aattgtggca agcctgagtt ccctggagtc 1620

tacaccaagg tggccaacta ctttgactgg atcagctacc atgtgggcag accctttatc 1680

agccagtaca atgtgtga 1698

<210> 5

<211> 1698

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 5

aaggtgacct acaccagcca ggaggacctg gtggagaaga agtgcctggc caagaagtac 60

acccacctga gctgtgacaa ggtgttctgc cagccctggc agagatgcat tgagggcacc 120

tgtgtgtgca agctgcccta ccagtgcccc aagaatggca cagctgtgtg tgccaccaac 180

agaaggagct tccccaccta ctgccagcag aagagcctgg agtgcctgca ccctggcacc 240

aagttcctga acaatggcac ctgcacagct gagggcaagt tcagtgtgag cctgaagcat 300

ggcaacacag acagtgaggg cattgtggag gtgaagctgg tggaccagga caagaccatg 360

ttcatctgca agagcagttg gagcatgaga gaggccaatg tggcctgcct ggacctgggc 420

ttccagcaag gagctgacac ccagagaagg ttcaagctga gtgacctgag catcaacagc 480

acagagtgcc tgcatgtgca ctgcagaggc ctggagacca gcctggctga gtgcaccttc 540

accaagagaa ggaccatggg ctaccaggac tttgctgatg tggtttgcta cacccagaag 600

gctgacagcc ccatggatga cttcttccag tgtgtgaatg gcaagtacat cagccagatg 660

aaggcctgtg atggcatcaa tgactgtgga gaccagagtg atgagctgtg ctgcaaggcc 720

tgccagggca agggcttcca ctgcaagagt ggagtgtgca tccccagcca gtaccagtgc 780

aatggagagg tggactgcat cacaggagag gatgaggtgg gctgtgctgg ctttgccagt 840

gtgacccagg aggagacaga gatcctgaca gctgacatgg atgctgagag aaggagaatc 900

aagagcctgc tgcccaagct gagctgtgga gtgaagaaca gaatgcacat cagaaggaag 960

agaattgtgg gaggcaagag agcccagctg ggagacctgc cctggcaggt ggccatcaag 1020

gatgccagtg gcatcacctg tggaggaatc tacattggag gctgctggat tctgacagct 1080

gcccactgcc tgagagccag caagacccac agataccaga tctggaccac agtggttgac 1140

tggattcacc ctgacctgaa gagaattgtg attgagtatg tggacagaat cattttccat 1200

gagaactaca atgctggcac ctaccagaat gacattgccc tgattgagat gaagaaggat 1260

ggcaacaaga aagactgtga gctgcccaga agcatccctg cctgtgtgcc ctggagcccc 1320

tacctgttcc agcccaatga cacctgtatt gtcagtggat ggggcagaga gaaggacaat 1380

gagagagtgt tcagcctgca gtggggagag gtgaagctga tcagcaactg cagcaagttc 1440

tatggcaaca gattctatga gaaggagatg gagtgtgctg gcacctatga tggcagcatt 1500

gatgcctgca agggagacag tggaggcccc ctggtgtgca tggatgccaa caatgtgacc 1560

tatgtgtggg gagtggttag ctggggagag aactgtggca agcctgagtt ccctggagtg 1620

tacaccaagg tggccaacta ctttgactgg atcagctacc atgtgggcag acccttcatc 1680

agccagtaca atgtgtaa 1698

<210> 6

<211> 1698

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 6

aaggtgacct atacatcaca ggaggacctg gtggagaaga agtgtctggc caagaagtat 60

acacatctgt catgtgacaa ggtgttctgt cagccttggc agaggtgtat tgagggaaca 120

tgtgtgtgta agctgcctta tcagtgtcct aagaatggaa cagctgtgtg tgccacaaat 180

aggaggtcat tccctacata ttgtcagcag aagtcactgg agtgtctgca tcctggaaca 240

aagttcctga ataatggaac atgtacagct gagggaaagt tctcagtgtc actgaagcat 300

ggaaatacag actcagaggg aattgtggag gtgaagctgg tggaccagga caagacaatg 360

ttcatctgca agtcatcatg gtcaatgagg gaggccaatg tggcctgtct ggacctggga 420

ttccagcagg gagctgacac acagaggagg ttcaagctgt cagacctgtc aatcaattca 480

acagagtgtc tgcatgtgca ttgtagagga ctggagacat cactggctga gtgtacattc 540

acaaagagga gaacaatggg atatcaggac tttgctgatg tggtttgtta tacacagaag 600

gctgactcac ctatggatga cttctttcaa tgtgtgaatg gaaagtatat ctcacagatg 660

aaggcctgtg atggaatcaa tgactgtgga gaccagtcag atgagctgtg ttgcaaggcc 720

tgtcagggaa agggattcca ttgcaagtca ggagtgtgta tcccttcaca atatcagtgt 780

aatggagagg tggactgtat cacaggagag gatgaggtgg gatgtgcagg atttgcctca 840

gtgacccagg aggagacaga gatcctgaca gctgacatgg atgctgagag aaggagaatc 900

aagtcactgc tgcctaagct gtcatgtgga gtgaagaata ggatgcatat caggaggaag 960

aggattgtgg gaggaaagag ggcccagctg ggagacctgc cttggcaagt ggccatcaag 1020

gatgcctcag gaatcacatg tggaggaatc tatattggag gatgttggat cctgacagct 1080

gcccattgtc tgagggcctc aaagacacat agatatcaga tctggacaac agtggtggac 1140

tggatccatc ctgacctgaa gaggattgtg attgagtatg tggacaggat catcttccat 1200

gagaattata atgctggaac atatcagaat gacattgccc tgattgagat gaagaaggat 1260

ggaaataaga aggactgtga gctgcctagg tcaatccctg cctgtgtgcc ttggtcccct 1320

tatctgttcc aacctaatga cacatgtatt gtgtctggat ggggaaggga gaaggacaat 1380

gagagggtgt tctcactgca gtggggagag gtgaagctga tctcaaattg ttcaaagttc 1440

tatggaaata ggttctatga gaaggagatg gagtgtgctg gaacatatga tggatcaatt 1500

gatgcctgta agggagactc aggaggacct ctagtatgta tggatgccaa taatgtgaca 1560

tatgtgtggg gagtggtgtc atggggagag aattgtggaa agcctgagtt ccctggagtg 1620

tatacaaagg tggccaatta ttttgactgg atctcatatc atgtgggaag gcctttcatc 1680

tcacagtata atgtgtaa 1698

<210> 7

<211> 1698

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 7

aaggtgacct atacctctca agaggatctg gtggagaaga agtgcctggc taagaagtat 60

actcacctga gctgtgataa ggtgttctgc cagccctggc agaggtgcat tgagggcacc 120

tgtgtgtgta agctgcccta tcagtgcccc aagaatggca ctgctgtgtg tgctactaac 180

aggaggagct tccccaccta ctgtcagcag aagagcctgg agtgtctgca tcctgggacc 240

aagtttctga ataatggaac ctgcacagct gagggaaagt ttagtgtgag cctgaagcat 300

ggaaatacag atagtgaggg aattgtggag gtgaagctgg tggaccagga taagaccatg 360

ttcatctgca agagcagctg gagcatgagg gaggccaatg tggcctgcct ggacctgggg 420

tttcagcaag gtgctgatac tcagaggagg tttaagctgt ctgatctgtc tatcaatagc 480

actgagtgtc tgcatgtgca ttgtagagga ctggagacca gcctggctga gtgtactttt 540

actaagagga ggactatggg ataccaggat tttgctgatg tggtgtgtta tacccagaag 600

gctgattctc ccatggatga cttctttcag tgtgtgaatg ggaagtacat ctctcagatg 660

aaggcctgtg atggtatcaa tgattgtgga gaccagagtg atgagctgtg ttgtaaggct 720

tgccaaggca agggctttca ttgcaagagt ggagtgtgca tccccagcca gtatcagtgc 780

aatggagagg tggactgcat cacaggggag gatgaggtgg gctgtgctgg ctttgcttct 840

gtgactcaag aggagacaga gatcctgact gctgacatgg atgctgagag gaggaggatc 900

aagagcctgc tgcctaagct gtcttgtgga gtgaagaaca ggatgcacat caggaggaag 960

aggattgtgg gaggaaagag ggctcagctg ggagacctgc cctggcaggt ggctatcaag 1020

gatgccagtg gaatcacctg tgggggaatc tatattggtg gctgttggat cctgactgct 1080

gctcattgtc tgagggccag caagactcat agataccaga tctggaccac agtggtggac 1140

tggatccacc ctgacctgaa gaggattgtg attgagtatg tggataggat catcttccat 1200

gagaactaca atgctggcac ttaccagaat gacattgctc tgattgagat gaagaaggat 1260

ggaaacaaga aggattgtga gctgcctagg agcatccctg cctgtgtgcc ctggtctcct 1320

tacctgttcc aacctaatga tacctgcatt gtgtctggct ggggaaggga gaaggataat 1380

gagagggtgt ttagcctgca gtggggtgag gtgaagctga tcagcaactg ctctaagttt 1440

tatggaaata ggttctatga gaaggagatg gagtgtgctg gaacctatga tggtagcatt 1500

gatgcctgca agggggactc tggaggcccc ctggtttgta tggatgccaa caatgtgact 1560

tatgtgtggg gtgtggtgag ctggggggag aactgtggaa agcctgagtt ccctggagtg 1620

tacaccaagg tggccaatta ttttgactgg atcagctacc atgtgggaag gccttttatc 1680

tctcagtaca atgtgtaa 1698

<210> 8

<211> 1698

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 8

aaggtgacct atacaagcca ggaggatctg gtggagaaga agtgcctggc aaagaagtat 60

acccacctga gctgtgataa ggtgttttgc cagccctggc agagatgcat tgagggcacc 120

tgtgtttgta agctgcccta tcagtgcccc aagaatggca cagcagtgtg tgcaaccaat 180

agaaggagct ttcccacata ctgtcagcag aagagcctgg aatgtctgca tcctgggaca 240

aagtttctga ataatggaac atgcacagct gaaggaaagt ttagtgttag cctgaagcat 300

ggaaatacag atagtgaggg aatagttgaa gtgaagctgg tggaccagga taagacaatg 360

tttatatgca agagtagctg gagcatgaga gaagccaatg tggcctgcct ggacctgggg 420

tttcagcaag gagctgatac ccagagaagg tttaagctga gtgatctgag cataaatagc 480

acagaatgtc tgcatgtgca ttgcagagga ctggagacca gcctggctga atgtaccttt 540

accaagagaa ggaccatggg ctaccaggat tttgctgatg tggtttgtta tacacagaag 600

gcagatagcc ccatggatga cttttttcaa tgtgtgaatg ggaagtacat tagccagatg 660

aaggcctgtg atggcatcaa tgattgtgga gaccagagtg atgaactgtg ttgtaaggca 720

tgccagggca agggctttca ttgcaagagt ggagtttgca ttcccagcca gtatcagtgc 780

aatggagagg tggactgcat tacaggggaa gatgaagttg gctgtgcagg ctttgcaagt 840

gtgactcagg aagaaacaga aattctgaca gctgacatgg atgcagaaag aagaagaata 900

aagagcctgc tgcctaagct gagctgtgga gttaagaata gaatgcacat tagaaggaag 960

agaattgtgg gaggaaagag agcacagctg ggagacctgc cctggcaggt ggcaattaag 1020

gatgccagtg gaatcacctg tgggggaatt tatattggag gctgttggat tctgacagct 1080

gcacattgtc tgagagccag caagacccat agataccaga tatggacaac agtggtggac 1140

tggatacacc ctgacctgaa gagaatagtg attgaatatg tggatagaat tatttttcat 1200

gaaaattaca atgcaggcac ctaccagaat gacattgctc tgattgaaat gaagaaggat 1260

ggaaataaga aggattgtga gctgcctaga agcatccctg cctgtgtgcc ctggagccct 1320

tacctgtttc agcctaatga tacatgcatt gttagtggct ggggaagaga aaaggataat 1380

gaaagagtgt ttagcctgca gtggggagaa gttaagctga taagcaattg cagcaagttt 1440

tatggaaata gattttatga aaaggaaatg gaatgtgcag gcacatatga tggcagcatt 1500

gatgcctgca agggggacag tggaggcccc ctagtatgta tggatgccaa taatgtgacc 1560

tatgtgtggg gagttgtgag ctggggggaa aattgtggaa agcctgagtt tcctggagtt 1620

tacaccaagg tggccaatta ttttgactgg attagctacc atgtgggaag accttttatt 1680

agccagtaca atgtgtaa 1698

<210> 9

<211> 1698

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 9

aaggtgacct atacatctca ggaggatctg gtggagaaga agtgtctggc caagaagtat 60

acacacctct cctgtgataa ggtgttctgt cagccatggc agaggtgtat tgagggaacc 120

tgtgtgtgta agctgcctta tcagtgtcca aagaatggaa cagctgtgtg tgccacaaac 180

aggaggagct tcccaacata ctgtcagcag aagtcactgg aatgtctgca tccaggaaca 240

aagttcctga ataatggaac atgtacagct gaaggaaagt tctcagtgtc cctgaagcat 300

ggaaatacag attcagaggg aattgtggaa gtgaagctgg tggaccagga taagacaatg 360

ttcatctgta agagcagctg gagcatgagg gaagccaatg tggcctgtct ggacctggga 420

ttccagcagg gagctgatac acagaggagg ttcaagctgt ctgatctctc tatcaattcc 480

acagaatgtc tgcatgtgca ttgcagaggt ctggagacct cactggctga atgtacattc 540

acaaagagga ggacaatggg ataccaggat tttgctgatg tggtgtgtta tacacagaag 600

gctgattctc caatggatga cttctttcag tgtgtgaatg gaaagtacat ctctcagatg 660

aaggcctgtg atggaatcaa tgattgtgga gaccagtcag atgaactgtg ctgcaaggcc 720

tgtcagggaa agggattcca ttgcaagtca ggagtgtgta tcccaagcca gtatcagtgt 780

aatggagagg tggactgtat cacaggagaa gatgaagtgg gatgtgcagg atttgcctct 840

gtgactcagg aagaaacaga aatcctgaca gctgacatgg atgctgaaag gaggaggatc 900

aagtcactgc tgcctaagct gtcttgtgga gtgaagaaca ggatgcacat caggaggaag 960

aggattgtgg gaggaaagag ggcccagctg ggagacctcc catggcaggt ggccatcaag 1020

gatgcctcag gaatcacctg tggaggaatc tatattggag gatgttggat cctgacagct 1080

gcccattgtc taagagcctc aaagacacat agataccaga tctggacaac agtggtggac 1140

tggatccacc ctgacctgaa gaggattgtg attgaatatg tggataggat catcttccat 1200

gaaaactaca atgctggaac ataccagaat gacattgctc tgatagaaat gaagaaggat 1260

ggaaacaaga aggattgtga gctgcctagg tccatccctg cctgtgtgcc ctggtctcct 1320

tacctgttcc aacctaatga tacatgtatt gtgtctggat ggggaaggga aaaggataat 1380

gaaagggtgt tctcactgca gtggggagaa gtgaagctga tcagcaactg ttctaagttc 1440

tatggaaata ggttctatga aaaggaaatg gaatgtgctg gaacatatga tggatccatt 1500

gatgcctgta agggagactc tggaggaccc ctggtttgta tggatgccaa caatgtgaca 1560

tatgtgtggg gagtggtgtc atggggagaa aactgtggaa agccagagtt cccaggagtg 1620

tacaccaagg tggccaatta ttttgactgg atcagctacc atgtgggaag gcctttcatc 1680

tctcagtaca atgtgtaa 1698

<210> 10

<211> 1698

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 10

aaggtgacct atacatccca agaggatctt gtggaaaaga aatgtctggc caaaaagtac 60

acccatctgt cttgtgacaa ggtcttctgc cagccttggc agagatgtat tgaaggaact 120

tgtgtctgta aactgcccta ccagtgccct aagaatggaa cagctgtctg tgctactaat 180

agaaggtcat tcccaactta ctgccagcag aagtctctgg agtgtctcca ccctggaact 240

aaattcctga acaatggcac atgtacagct gaaggcaagt tctctgtctc cctcaaacat 300

ggaaacacag actcagaagg gattgtggaa gtcaagctgg tggatcagga taagaccatg 360

tttatttgca agtcatcctg gtctatgaga gaagcaaatg tggcctgcct ggatctgggc 420

tttcaacaag gagcagacac tcagaggaga ttcaagctct ctgacctgtc tattaatagc 480

actgagtgtc tgcatgtgca ttgtagagga ctggagacct cacttgctga atgtacattc 540

actaaaagaa ggactatggg ataccaggac tttgctgatg tggtgtgcta tacccagaag 600

gcagactccc ccatggatga ctttttccaa tgtgttaatg ggaaatatat tagtcagatg 660

aaggcttgtg atggaattaa tgactgtgga gatcagagtg atgagctctg ttgcaaagcc 720

tgtcagggaa agggtttcca ctgcaaaagt ggggtttgta ttccttctca ataccaatgc 780

aatggggagg tggactgcat tactggagag gatgaggtgg ggtgtgctgg ctttgcttct 840

gtgacccaag aggagacaga gatcctgaca gctgatatgg atgctgaaag gagaagaatt 900

aagtcactgc tgcccaaact gtcttgtgga gttaaaaaca gaatgcacat cagaagaaag 960

agaattgtgg gaggaaaaag agcccagctt ggagatctcc cttggcaagt ggccattaag 1020

gatgccagtg gtatcacatg tggaggcatc tatattggag ggtgctggat tctcacagct 1080

gcacactgtc tgagagccag taaaacccat agatatcaga tctggacaac agtggttgat 1140

tggattcatc ctgatctcaa gagaattgtg attgagtatg tggacagaat tatttttcat 1200

gaaaactaca atgcaggaac ctatcagaat gatattgccc tcattgagat gaagaaggat 1260

gggaacaaaa aggattgtga gctgcccaga agcatcccag cttgtgtgcc ttggtctcca 1320

tacctctttc agccaaatga tacttgcatt gtcagtggat ggggtagaga gaaagataat 1380

gagagagtct tctccctcca gtggggagag gttaagctca tcagtaattg ctccaagttt 1440

tatggaaaca ggttctatga aaaagagatg gaatgtgcag gaacatatga tggtagtatt 1500

gatgcttgca aaggagatag tggtggaccc ctggtctgta tggatgccaa caatgtgact 1560

tatgtgtggg gggtggtgag ctggggagag aattgtggga agcctgagtt tccaggagtc 1620

tacaccaagg tggctaatta ctttgactgg atcagttacc atgtgggtag gcccttcatt 1680

agccagtaca atgtctga 1698

<210> 11

<211> 1698

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 11

aaggttacct atacatccca ggaagacctg gtggagaaaa agtgtcttgc caagaagtac 60

acccacctca gttgtgataa ggtcttttgc cagccatggc agagatgtat tgaaggcact 120

tgtgtgtgca agctgccata ccagtgtccc aaaaatggga cagcagtctg tgcaactaat 180

agaagatcct tccctacata ctgccagcag aagagtcttg agtgcctgca cccaggcaca 240

aagtttctga ataatggcac atgcacagct gaaggcaaat tcagtgtctc cctgaaacat 300

ggaaacacag atagtgaggg aattgtggaa gttaagctgg tggaccagga taaaaccatg 360

ttcatttgta aatcttcatg gagtatgaga gaagctaatg tggcatgtct ggaccttgga 420

tttcaacaag gagcagatac ccagagaagg tttaagctga gtgatctctc cattaactct 480

actgagtgtc tgcatgtgca ttgtagagga ctggagacat cactggcaga atgtactttt 540

accaaaagga gaaccatggg ttatcaggac tttgcagatg tggtctgtta cacccagaag 600

gctgactccc ccatggatga cttctttcaa tgtgtgaatg ggaaatacat ctcccagatg 660

aaggcctgtg atggtatcaa tgactgtgga gaccagtctg atgagctctg ctgcaaggcc 720

tgtcagggga agggatttca ctgcaaaagt ggggtttgca tccccagtca gtaccagtgc 780

aatggggaag tggactgcat tacaggggaa gatgaggttg gttgtgctgg gtttgctagt 840

gtgacccagg aggaaacaga gatcctgaca gctgatatgg atgcagaaag aagaagaatt 900

aagagcctcc tgcctaagct cagttgtgga gtcaaaaata ggatgcatat taggagaaag 960

aggattgtgg gagggaaaag agcccagctt ggagacctgc catggcaggt tgccatcaag 1020

gatgcctcag ggatcacatg tggagggatc tatattggtg gatgttggat tctgactgct 1080

gcccattgcc tgagggcctc aaagacccac agatatcaga tctggaccac tgtggtggac 1140

tggattcatc ctgacctgaa gagaattgtg attgaatatg tggacaggat tatctttcat 1200

gagaactata atgctggaac ttatcagaat gatattgcac tgattgagat gaagaaggat 1260

gggaataaaa aggactgtga actcccaaga agcattcctg catgtgtgcc ttggtctcct 1320

tacctcttcc aacccaatga cacttgtatt gtcagtggat ggggtagaga aaaagacaat 1380

gagagggttt tcagtctgca gtggggggag gtcaagctca tcagcaactg ctccaaattc 1440

tatggaaaca ggttctatga aaaagaaatg gagtgtgctg ggacttatga tggtagtatt 1500

gatgcctgta aaggggattc tggagggcca cttgtctgta tggatgctaa caatgtgacc 1560

tatgtctggg gagtggtgtc atggggagaa aattgtggca aacctgagtt tcctggagtg 1620

tatacaaagg tggctaacta ttttgattgg atcagttatc atgttggtag acccttcatc 1680

agtcagtaca atgtctag 1698

<210> 12

<211> 1698

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 12

aaggtgacct acaccagcca ggaggacctg gtggaaaaga aatgtcttgc taagaaatat 60

acccacctgt cctgtgacaa agtcttctgt cagccttggc agagatgtat tgaagggaca 120

tgtgtctgta agctgcctta ccagtgtcct aagaatggga ctgcagtctg tgccactaat 180

agaagatcat tcccaacata ctgccagcag aagagtctgg agtgtctgca tcctggcaca 240

aagtttctca acaatgggac atgtacagct gaaggaaaat tctctgtgag cctgaaacat 300

ggcaatacag atagtgaggg aattgttgag gttaagctgg tggatcagga caaaacaatg 360

tttatctgca aaagcagctg gtccatgaga gaggctaatg tggcctgtct tgaccttggc 420

tttcaacaag gagcagatac ccagagaaga tttaaactgt cagatctgag catcaattca 480

acagagtgtc tgcatgtgca ttgtagagga ctggagacca gcctggctga atgtaccttc 540

acaaagagaa gaacaatggg ataccaggac tttgctgatg tggtttgtta cacccagaag 600

gcagacagcc ccatggatga cttctttcag tgtgtgaatg gaaagtatat tagccagatg 660

aaggcatgtg atggtatcaa tgattgtggg gaccagagtg atgagctctg ttgtaaggct 720

tgtcaaggca aaggcttcca ctgcaagtca ggggtgtgca tcccctccca ataccagtgc 780

aatggagagg tggattgcat cacaggggag gatgaagtgg gttgtgctgg gtttgcaagt 840

gtgacccagg aggaaacaga aatcctgact gctgatatgg atgctgagag gagaagaatc 900

aaaagcctcc tgcctaaact gtcttgtggt gttaagaata gaatgcacat tagaagaaag 960

agaattgtgg ggggaaagag agcacagctg ggtgatctgc cctggcaagt ggcaattaag 1020

gatgcctcag gcatcacctg tggaggcatt tacattgggg gttgctggat tctgacagca 1080

gcccactgtc tcagagccag caaaactcac agatatcaga tttggacaac agttgtggat 1140

tggattcacc ctgatctgaa gagaattgtc attgagtatg tggacagaat tattttccat 1200

gagaactaca atgctggcac ataccagaat gacattgccc tcattgaaat gaagaaggat 1260

ggaaataaaa aggactgtga actcccaaga tcaattcctg cctgtgtgcc atggagtcct 1320

tacctcttcc aaccaaatga tacctgcatt gtcagtggct gggggagaga gaaggataat 1380

gaaagagttt tctccctgca gtggggagag gtgaagctca ttagtaactg ttctaagttt 1440

tatgggaaca gattttatga gaaggagatg gaatgtgcag gaacttatga tggtagcatt 1500

gatgcatgca aaggagacag tggaggtcca cttgtctgca tggatgctaa caatgtgact 1560

tatgtctggg gagtggtctc ctggggtgaa aactgtggaa agcctgagtt cccaggagtg 1620

tatacaaaag tggccaacta ctttgactgg atttcatacc atgtggggag accttttatc 1680

agccagtaca atgtctga 1698

<210> 13

<211> 1698

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 13

aaggtgacct acacctctca ggaagacctg gtggagaaga agtgtcttgc caagaaatat 60

acccatctgt catgtgataa agtgttctgt cagccttggc agagatgtat tgagggaaca 120

tgtgtgtgca agctgcccta ccagtgtcca aagaatggga ctgctgtttg tgccactaac 180

agaagatctt ttcctacata ctgtcagcag aagagtctgg agtgcctcca ccctggcaca 240

aaattcctca ataatggcac atgtacagct gagggaaagt tttctgttag cctcaagcat 300

ggcaatactg attcagaggg tattgttgaa gtcaaactgg tggatcagga taaaaccatg 360

ttcatttgta agagtagctg gtccatgagg gaggctaatg tggcatgcct ggacctgggc 420

tttcaacaag gggctgacac tcagagaagg tttaagctga gtgacctgag cattaattca 480

actgagtgtc tgcatgtgca ttgtagaggg ctggagacta gccttgcaga gtgcacattc 540

actaagagaa gaacaatggg ataccaggat tttgcagatg tggtgtgcta cactcagaaa 600

gctgactctc ccatggatga cttcttccaa tgtgtgaatg ggaaatatat ttcacagatg 660

aaggcctgtg atggaattaa tgattgtggt gatcagagtg atgagctctg ttgtaaggct 720

tgccagggga agggttttca ctgtaaaagt ggggtttgta tcccctctca ataccagtgc 780

aatggggaag ttgattgcat tacaggagag gatgaggtgg gatgtgcagg ctttgccagt 840

gtgacacagg aagagacaga gatcctgaca gctgatatgg atgcagaaag aagaagaatc 900

aagtccctgc tccccaaact gtcctgtggg gtcaagaata gaatgcacat cagaaggaag 960

agaattgtgg gaggcaaaag ggcacagctg ggggacctcc catggcaggt ggcaattaag 1020

gatgccagtg gtatcacatg tggagggatt tacattggag gctgctggat tctcacagca 1080

gcccactgcc tcagagcatc taaaactcac agataccaga tttggaccac tgtggtggac 1140

tggattcacc ctgacctgaa gagaattgtg attgaatatg tggatagaat cattttccat 1200

gaaaattaca atgctggcac ttatcagaat gacattgcac tcattgagat gaagaaagat 1260

gggaataaaa aggactgtga actgcccaga agcattccag cttgtgtgcc atggagtcca 1320

tatctgtttc agccaaatga tacatgcata gtgtctggtt ggggaagaga gaaggacaat 1380

gaaagggttt ttagcctcca gtggggggag gtcaagctga ttagcaactg cagtaaattc 1440

tatggcaaca gattttatga gaaggagatg gaatgtgcag gcacttatga tggctcaatt 1500

gatgcctgca agggagattc tggtggaccc ctggtgtgca tggatgccaa taatgtcacc 1560

tatgtctggg gtgtggttag ctggggagag aactgtggga agcctgagtt tccaggagtg 1620

tatacaaaag tggcaaatta ctttgactgg atctcctatc atgtggggag accctttatc 1680

tctcagtaca atgtttga 1698

<210> 14

<211> 1698

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 14

aaggtgacct atacctctca ggaggacctg gttgagaaaa agtgcctggc taaaaagtac 60

acccacctct cttgtgataa ggtgttctgc cagccttggc agagatgcat tgaaggcaca 120

tgtgtttgta aactgcctta ccagtgtccc aaaaatggga ctgctgtgtg tgccacaaat 180

agaaggagct ttccaaccta ctgtcagcag aagagccttg aatgcctcca tcctgggaca 240

aaattcctga acaatggaac ctgtacagct gaaggcaaat ttagtgttag cctgaaacat 300

gggaatacag attctgaggg aattgtggag gtcaaactgg tggaccagga taaaaccatg 360

tttatctgca agagtagctg gtccatgaga gaggccaatg tggcatgcct ggatcttggg 420

tttcaacaag gagctgacac ccagagaaga ttcaaactca gtgacctgag tattaactca 480

acagaatgtc tgcatgtgca ttgtagagga ctggaaacta gccttgcaga gtgcactttt 540

accaagagaa gaaccatggg atatcaggat tttgctgatg tggtgtgcta cacccagaaa 600

gcagacagtc ccatggatga cttcttccag tgtgtgaatg gcaagtatat ttcccagatg 660

aaagcatgtg atggcatcaa tgattgtgga gaccagagtg atgaactgtg ctgtaaggct 720

tgccagggaa agggtttcca ctgcaaaagt ggagtttgca tccccagcca gtaccagtgc 780

aatggagaag tggattgcat tacaggagag gatgaagtgg gatgtgctgg ctttgcttct 840

gttacccaag aagagacaga gattctgaca gctgacatgg atgcagagag gagaagaatt 900

aagtccctgc tgcctaaact gtcctgtggt gtcaagaata gaatgcacat cagaaggaag 960

agaattgtgg ggggaaaaag agcccagctt ggagacctgc cttggcaagt ggctattaag 1020

gatgccagtg ggatcacatg tggaggaatt tacattggag ggtgctggat tctcacagct 1080

gcccactgcc tgagggccag caaaacccac agataccaga tctggacaac agttgtggat 1140

tggattcatc ctgatctcaa gagaattgtt attgagtatg tggataggat cattttccat 1200

gaaaattaca atgcaggcac ataccaaaat gacattgcac tcattgagat gaagaaggat 1260

gggaataaaa aggattgtga gctccccagg agcattcctg cttgtgtccc ctggtcccct 1320

tacctcttcc aacccaatga cacctgcatt gtcagtggct ggggtagaga aaaagataat 1380

gagagagtct tcagcctgca gtggggggag gtgaagctga ttagcaattg tagcaagttt 1440

tatgggaaca ggttctatga gaaggagatg gagtgtgctg gcacctatga tggctctatt 1500

gatgcttgta agggggacag tgggggacca ctggtttgta tggatgcaaa caatgtgacc 1560

tatgtttggg gagtggttag ctggggagaa aattgtggaa aacctgagtt tcctggtgtc 1620

tatacaaaag tggctaatta ttttgattgg atcagttatc atgttgggag accctttatt 1680

agtcagtaca atgtctag 1698

<210> 15

<211> 1698

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 15

aaggtgacct acactagcca ggaggatctg gtggagaaaa agtgccttgc aaaaaagtac 60

actcacctca gctgtgacaa ggtcttctgt cagccttggc agagatgcat tgaggggaca 120

tgtgtgtgca aactcccata ccagtgtcct aagaatggta cagctgtctg tgcaacaaac 180

aggagatcct ttcccaccta ttgtcagcag aagtccctgg agtgtctgca ccctggtaca 240

aagtttctga ataatggcac atgcactgct gagggaaagt tcagtgtgtc cctgaaacat 300

ggaaacactg attcagaggg tattgtggag gtgaaacttg tggatcagga caagaccatg 360

ttcatctgca agtccagttg gagcatgaga gaggctaatg tggcctgtct ggacctgggt 420

tttcagcaag gagctgacac tcagagaagg ttcaagctgt cagatctcag tatcaactcc 480

acagaatgtc tgcatgtgca ttgcagaggg ctggagacta gccttgctga atgtactttt 540

acaaagagaa gaactatggg ataccaggat tttgcagatg tggtctgtta tactcagaag 600

gctgattcac ccatggatga cttcttccag tgtgtgaatg gcaagtacat ttcacaaatg 660

aaagcatgtg atggtatcaa tgattgtgga gaccagagtg atgaactctg ttgcaaggca 720

tgccagggca agggattcca ctgcaagagt ggtgtctgta ttcccagtca gtatcagtgc 780

aatggggagg tggactgcat cactggggaa gatgaagtgg gctgtgctgg ttttgctagt 840

gtgacacagg aggaaactga aattctcaca gcagatatgg atgctgagag aaggagaatc 900

aagtccctcc tccctaaact gagttgtgga gtgaaaaaca gaatgcatat tagaagaaaa 960

agaattgtgg gaggcaagag agctcagctt ggggacctcc catggcaagt ggctattaag 1020

gatgcaagtg ggattacatg tggagggatc tatattgggg ggtgctggat tctgacagca 1080

gcccactgtc tgagagcctc taaaacccat agatatcaga tctggacaac agtggtggat 1140

tggattcacc cagacctcaa gaggattgtg attgagtatg tggatagaat tatttttcat 1200

gagaactaca atgctggaac ctatcagaat gatattgctc tgattgaaat gaaaaaggat 1260

gggaacaaaa aggactgtga actgccaaga tcaatccctg catgtgtgcc atggagtccc 1320

tatctctttc agcccaatga tacatgcatt gttagtggat gggggaggga gaaagacaat 1380

gagagagtgt tcagtctcca gtggggtgaa gtgaagctca tttctaattg tagcaagttt 1440

tatgggaata gattctatga aaaagaaatg gagtgtgcag gaacttatga tggttccatt 1500

gatgcctgca agggagatag tggtgggccc ctggtgtgca tggatgctaa taatgtgacc 1560

tatgtctggg gagtggtttc atggggagag aattgtggaa agcctgagtt ccctggagtg 1620

tacaccaagg tggccaatta ctttgattgg atcagctatc atgtgggaag accatttatt 1680

tcccagtaca atgtctaa 1698

<210> 16

<211> 1698

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 16

aaggtgacct atacaagcca ggaagatctt gtggagaaaa agtgccttgc taagaagtac 60

actcacctca gctgtgacaa agtcttttgc cagccttggc agagatgtat tgagggaact 120

tgtgtctgta agctcccata tcagtgtccc aagaatggaa cagctgtgtg tgctactaac 180

agaaggagct ttcccaccta ctgccagcag aagagccttg aatgtctcca cccagggacc 240

aagtttctga acaatggcac atgtacagct gaggggaaat tcagtgtcag tctcaaacat 300

gggaatactg atagtgaggg cattgttgag gtgaaacttg tggaccagga taagaccatg 360

tttatctgca agtcaagctg gtcaatgaga gaagctaatg tggcttgtct ggaccttggg 420

tttcaacaag gagctgacac tcagagaaga tttaagctga gtgatctgag tatcaacagc 480

actgaatgtc tgcatgtgca ttgcagaggg ctggagacta gccttgctga gtgcactttt 540

accaagagaa gaacaatggg ataccaggat tttgctgatg tggtctgtta tactcagaag 600

gcagattcac caatggatga cttctttcag tgtgtgaatg gaaaatacat ttcccagatg 660

aaggcttgtg atggtatcaa tgactgtggg gaccagagtg atgagctctg ttgtaaggca 720

tgtcagggca aaggatttca ctgcaagtct ggggtctgta tccccagcca gtatcagtgt 780

aatggagagg ttgattgtat cacaggggag gatgaagtgg gttgtgctgg ctttgcatca 840

gtgacacagg aagagacaga aattctgaca gcagatatgg atgctgaaag aaggagaatt 900

aaaagcctcc tgccaaaact gagctgtggt gtcaagaata gaatgcacat cagaaggaag 960

agaattgttg gtggaaagag ggcccagctt ggggacctgc catggcaggt tgcaatcaaa 1020

gatgcaagtg gcattacctg tggaggaatt tacattggag ggtgttggat tctgacagca 1080

gctcattgtc taagagcctc caaaacccac agataccaga tctggaccac tgtggtggat 1140

tggattcacc ctgacctgaa aagaattgtc attgagtatg tggacaggat tattttccat 1200

gagaattata atgctggcac ctaccagaat gacattgccc tgattgagat gaagaaagat 1260

ggaaataaga aggactgtga gctcccaaga tcaattcctg cttgtgtgcc ttggtctcca 1320

tacctgtttc agcccaatga tacttgtatt gtttctggat ggggcaggga aaaagacaat 1380

gagagagtgt tcagcctgca gtggggggag gtgaagctga tctcaaactg cagcaagttc 1440

tatggaaata gattttatga gaaggaaatg gagtgtgcag gcacttatga tggatcaatt 1500

gatgcctgca agggtgacag tggtggccca cttgtgtgca tggatgctaa caatgtgacc 1560

tatgtttggg gtgtggtgtc atggggggaa aactgtggca aacctgagtt tcctggtgtt 1620

tacactaagg ttgcaaacta ctttgactgg atcagctatc atgtgggcag accttttatt 1680

tcccagtata atgtctaa 1698

<210> 17

<211> 1698

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 17

aaggtgacct ataccagcca ggaggacctt gttgagaaga aatgcctggc taagaaatac 60

acccacctgt cctgtgacaa ggtgttctgt cagccttggc agaggtgcat tgaagggacc 120

tgtgtgtgta aactccccta ccagtgccct aagaatggca ctgcagtgtg tgctacaaac 180

agaagatcat tcccaaccta ttgccagcag aaatcactgg aatgcctgca tcctggtaca 240

aaattcctga acaatgggac ttgtactgct gaggggaaat tcagtgtgtc cctgaaacat 300

gggaacacag attctgaggg tattgttgag gtgaagctgg tggatcagga taagactatg 360

tttatctgca agtcaagctg gtccatgagg gaagccaatg tggcatgcct ggatctgggt 420

tttcaacaag gagctgatac ccagagaaga tttaagctga gtgacctcag cattaactct 480

actgagtgtc tgcatgtgca ctgtagaggg cttgaaacaa gcctggcaga gtgcaccttc 540

accaagagaa ggacaatggg ataccaggac tttgctgatg tggtctgcta cacccagaag 600

gctgattccc ccatggatga tttctttcaa tgtgtgaatg ggaagtacat cagccagatg 660

aaagcatgtg atgggatcaa tgactgtgga gaccagagtg atgagctgtg ctgcaaagct 720

tgccagggga aaggctttca ttgcaagagt ggggtctgta ttccctccca ataccagtgc 780

aatggggagg tggattgcat cacaggagaa gatgaagtgg gctgtgctgg atttgcctca 840

gtgactcagg aagagacaga aattctcaca gctgatatgg atgcagagag aaggaggatc 900

aagtccctcc tgcctaaact gagttgtgga gtgaagaaca ggatgcatat tagaaggaag 960

agaattgtgg ggggtaaaag agcccagctt ggggacctgc cttggcaagt ggctatcaaa 1020

gatgccagtg gtattacctg tggtgggatc tatattggtg gttgctggat tctcactgct 1080

gcacactgtc tgagagccag caaaacccac agatatcaga tttggactac agtggttgac 1140

tggattcacc ctgacctgaa gagaattgtt attgagtatg tggatagaat catcttccat 1200

gagaattaca atgctgggac ttatcagaat gatattgccc tcattgaaat gaagaaggat 1260

gggaacaaaa aggattgtga gctgcccaga agcattccag cctgtgtgcc atggagcccc 1320

tatctgtttc agccaaatga cacttgtatt gtttctggtt ggggcaggga aaaagacaat 1380

gaaagagtct ttagcctcca gtggggagaa gttaagctga tttcaaattg cagcaaattc 1440

tatgggaaca ggttctatga gaaggagatg gagtgtgctg ggacatatga tggttcaatt 1500

gatgcttgca aaggagatag tggtgggcca ctggtctgca tggatgccaa taatgtgaca 1560

tatgtctggg gggtggtttc ctggggagag aattgtggga agccagagtt tcctggtgtc 1620

tatacaaaag tggctaacta ttttgactgg atcagctatc atgtggggag acctttcatc 1680

agtcagtata atgtgtag 1698

<210> 18

<211> 1698

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 18

aaggtgacct acacctctca ggaggatctg gtggagaaaa agtgcctggc aaaaaagtat 60

actcacctca gttgtgacaa ggtcttctgc cagccatggc agagatgtat tgagggaacc 120

tgtgtgtgca aactccctta tcagtgtccc aagaatggga ctgcagtctg tgcaaccaac 180

agaagaagct ttcccacata ctgtcagcag aaatcccttg agtgcctgca ccctggaacc 240

aaattcctga ataatggaac ttgcacagca gaggggaaat tcagtgtcag cctgaaacat 300

ggcaacactg atagtgaggg gattgttgaa gtgaagctgg tggatcagga taagactatg 360

tttatctgca aaagttcatg gagcatgaga gaagcaaatg tggcatgcct tgatctgggt 420

ttccaacaag gagctgacac tcagagaaga tttaaactca gtgatctgtc aatcaacagc 480

acagagtgcc tgcatgtgca ctgtagagga cttgagacat cacttgcaga atgcacattt 540

accaaaagaa gaaccatggg ataccaggat tttgcagatg tggtgtgcta tactcagaaa 600

gctgatagcc ccatggatga cttcttccag tgtgtcaatg ggaagtatat cagccagatg 660

aaggcctgtg atggaatcaa tgactgtgga gatcagagtg atgaactctg ttgtaaggca 720

tgtcagggga agggtttcca ttgcaagagt ggagtctgca ttccttcaca ataccagtgc 780

aatggagagg tggattgtat tactggggag gatgaagtgg gttgtgcagg atttgccagt 840

gtgactcagg aggaaactga gattctgaca gctgacatgg atgctgagag aagaaggatc 900

aagagcctgc tcccaaagct gtcatgtggg gtcaaaaata gaatgcacat cagaaggaag 960

agaattgtgg gagggaaaag agctcagctg ggagacctcc cttggcaagt ggcaatcaag 1020

gatgctagtg gtatcacatg tggaggaatc tacattgggg ggtgttggat tctgactgca 1080

gcccattgcc tgagggcatc caaaacccac agatatcaga tctggacaac agttgtggac 1140

tggattcacc ctgacctcaa aagaattgtc attgagtatg tggacagaat cattttccat 1200

gagaattaca atgctggcac ttaccagaat gacattgccc tgattgaaat gaagaaggat 1260

ggaaacaaga aggattgtga actccccagg tcaatcccag cctgtgtgcc ctggagcccc 1320

tacctgttcc agccaaatga tacatgtatt gtcagtggat gggggagaga gaaggacaat 1380

gagagagtgt tttcactgca gtggggggaa gtgaagctga tcagcaattg ctccaagttc 1440

tatggaaaca ggttttatga gaaggagatg gagtgtgctg ggacttatga tggaagtatt 1500

gatgcttgta aaggggattc aggaggtcct cttgtctgca tggatgctaa caatgtgaca 1560

tatgtgtggg gagtagtcag ttggggagaa aactgtggaa aaccagaatt tcctggggtg 1620

tatactaaag tggcaaatta ttttgactgg atcagctatc atgtgggtag acccttcatt 1680

agtcagtata atgtgtga 1698

<210> 19

<211> 1698

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 19

aaggtgacct acacctctca ggaagacctt gttgaaaaga agtgtctggc caaaaagtat 60

actcatctgt cttgtgacaa agtcttctgt cagccctggc agagatgcat tgagggaaca 120

tgtgtctgca agctccctta tcagtgtccc aaaaatggca cagcagtttg tgccacaaat 180

agaaggtctt ttcctacata ctgccagcag aagagccttg aatgtctcca cccaggcaca 240

aagtttctga ataatgggac ttgcacagca gaaggcaaat ttagtgtgtc cctgaaacat 300

ggaaacactg atagtgaggg cattgtggag gttaagcttg tggatcagga taaaacaatg 360

ttcatctgca agagctcatg gtccatgaga gaggctaatg tggcttgtct ggacctgggt 420

tttcaacaag gagctgatac tcagagaagg tttaagctca gtgacctgag catcaacagt 480

acagagtgtc tgcatgtgca ttgtagagga ctggaaactt ctctggctga gtgtaccttt 540

acaaagagaa gaacaatggg ataccaggat tttgctgatg tggtctgcta cacccagaaa 600

gctgactccc ccatggatga tttctttcaa tgtgttaatg ggaaatacat tagccagatg 660

aaggcttgtg atggtatcaa tgactgtgga gaccagtctg atgaactgtg ctgtaaagcc 720

tgtcaaggga aaggattcca ctgcaagagt ggagtgtgca ttccatccca gtaccagtgt 780

aatggagaag ttgattgcat tacaggggaa gatgaagtgg gttgtgcagg gtttgcttca 840

gtaactcagg aggagacaga aatcctgaca gctgacatgg atgctgaaag gagaaggatc 900

aaaagcctgc tgcccaagct ctcatgtggg gtgaaaaaca ggatgcatat tagaaggaag 960

aggattgtgg gagggaaaag agcccagctg ggggacctgc catggcaggt tgccattaaa 1020

gatgcttcag ggatcacatg tgggggcatc tatattggag gctgttggat tctcacagca 1080

gcacactgcc tgagagcttc aaagactcac agatatcaga tttggacaac agtggtggat 1140

tggattcacc ctgatctcaa aagaattgtc attgaatatg ttgacagaat catctttcat 1200

gaaaactaca atgctggaac ttatcagaat gatattgctc tgattgaaat gaagaaagat 1260

ggaaacaaaa aggactgtga actgcccaga agcatccctg cttgtgttcc atggtcccct 1320

tacctgtttc agcctaatga cacctgcatt gttagtggct gggggagaga gaaggacaat 1380

gagagagtgt tttccctgca gtggggagag gtgaaactca tctctaactg ttcaaaattc 1440

tatgggaata gattttatga gaaggagatg gaatgtgctg ggacctatga tgggtcaatt 1500

gatgcttgta agggtgacag tggaggaccc ctggtgtgca tggatgccaa caatgtgaca 1560

tatgtctggg gggtggttag ctggggagaa aattgtggga agcctgagtt ccctggggtg 1620

tacaccaagg ttgcaaacta ttttgattgg atttcttatc atgtgggtag accatttatc 1680

agtcagtata atgtgtag 1698

<210> 20

<211> 1698

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 20

aaggtgacct atacttctca agaggatctg gtggagaaaa aatgcctggc taaaaaatat 60

actcacctgt cctgtgataa agtcttctgc cagccatggc agagatgcat tgagggaact 120

tgtgtgtgca aactgccata tcagtgccca aaaaatggaa ctgctgtgtg tgctactaac 180

aggagaagct tcccaactta ttgccagcag aaaagtctgg aatgccttca tccaggaact 240

aaatttctga ataatggaac ttgcactgct gaaggaaaat ttagtgtgtc cctgaaacat 300

ggaaatactg attcagaggg aattgtggaa gtgaaacttg tggatcagga taaaactatg 360

ttcatttgca aaagcagctg gagcatgagg gaagctaatg tggcttgcct tgatcttgga 420

tttcaacaag gagctgatac tcagagaagg tttaaactgt ctgatctgtc tattaattcc 480

actgaatgcc tgcatgtgca ttgcagagga ctggagacta gtctggctga atgcactttt 540

actaaaagaa gaactatggg atatcaggat tttgctgatg tggtgtgcta tactcagaaa 600

gctgattctc caatggatga tttctttcaa tgtgtgaatg gaaaatatat ttctcagatg 660

aaagcttgtg atggaatcaa tgattgtgga gatcagagtg atgaactgtg ctgcaaagct 720

tgccagggaa aaggatttca ttgcaaatct ggagtgtgca ttccaagcca gtatcagtgc 780

aatggagagg tggattgcat tactggagaa gatgaagtgg gatgtgctgg atttgcttct 840

gtgactcaag aagaaactga aattctgact gctgatatgg atgctgaaag aagaagaatt 900

aaatcactgc tgcctaaact gtcttgtgga gtgaaaaaca gaatgcacat tagaaggaaa 960

agaattgtgg gaggaaaaag agctcagctg ggagatctgc catggcaggt ggctattaaa 1020

gatgctagtg gaatcacttg tggaggaatt tatattggag gatgctggat tctgactgct 1080

gctcattgcc tgagagctag taaaactcat agatatcaga tttggactac tgtggtggat 1140

tggattcacc cagatcttaa aagaattgtg attgaatatg tggatagaat tattttccat 1200

gaaaactata atgctggaac ttatcagaat gatattgctc tgattgaaat gaaaaaagat 1260

ggaaacaaaa aagattgtga gctgcctaga tccatccctg cttgtgtccc atggtctcct 1320

tatctgttcc aacctaatga tacttgcatt gtgtctggat ggggaagaga aaaagataat 1380

gaaagagtct tttcacttca atggggagaa gtgaaactga ttagcaactg ctctaaattt 1440

tatggaaata gattctatga aaaagaaatg gaatgtgctg gaacttatga tggatccatt 1500

gatgcttgca aaggagattc tggaggacca ctggtctgca tggatgctaa caatgtgact 1560

tatgtctggg gagtggtcag ttggggagaa aactgtggaa aaccagagtt cccaggagtg 1620

tatactaaag tggctaatta ttttgattgg attagctatc atgtgggaag gccttttatt 1680

tctcagtata atgtgtaa 1698

<210> 21

<211> 1752

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 21

atgaagctgc tgcacgtgtt cctgctgttt ctgtgcttcc acctgcgctt ttgtaaggtg 60

acctatacat ctcaggagga tctggtggag aagaagtgtc tggccaagaa gtacacacac 120

ctgagctgcg acaaggtgtt ctgtcagcca tggcagcggt gcatcgaggg aacctgcgtg 180

tgcaagctgc cttatcagtg cccaaagaac ggcaccgccg tgtgcgccac aaatcggaga 240

tcttttccaa catactgcca gcagaagagc ctggagtgtc tgcaccccgg caccaagttt 300

ctgaacaatg gcacctgcac agccgagggc aagttctctg tgagcctgaa gcacggcaac 360

acagattccg agggcatcgt ggaggtgaag ctggtggacc aggataagac catgttcatc 420

tgtaagagct cctggtctat gagagaggcc aacgtggcct gcctggatct gggctttcag 480

cagggcgccg acacacagag gcgcttcaag ctgtccgacc tgtctatcaa tagcaccgag 540

tgcctgcacg tgcactgtag gggcctggag acaagcctgg ccgagtgcac ctttacaaag 600

cggagaacca tgggctatca ggacttcgcc gacgtggtgt gctacaccca gaaggccgat 660

tctccaatgg acgatttctt tcagtgcgtg aacggcaagt acatcagcca gatgaaggcc 720

tgcgacggca tcaatgactg tggcgatcag tccgacgagc tgtgctgtaa ggcctgtcag 780

ggcaagggct ttcactgcaa gagcggcgtg tgcatcccct cccagtatca gtgcaacggc 840

gaggtggatt gtatcaccgg agaggacgaa gtgggatgcg caggcttcgc ctccgtgacc 900

caggaggaga ccgagatcct gacagccgac atggatgccg agaggcgccg gatcaagtct 960

ctgctgccta agctgagctg tggcgtgaag aatagaatgc acatcagaag gaagcgcatc 1020

gtgggaggca agagggcaca gctgggcgat ctgccatggc aggtggccat caaggacgca 1080

agcggaatca cctgcggagg catctatatc ggaggatgtt ggatcctgac cgcagcacac 1140

tgcctgagag catccaagac acacaggtac cagatctgga ccacagtggt ggattggatc 1200

caccctgacc tgaagagaat cgtgatcgag tatgtggata ggatcatctt ccacgagaac 1260

tacaatgccg gcacatatca gaacgacatc gccctgatcg agatgaagaa ggatggcaat 1320

aagaaggact gtgagctgcc acgctccatc cctgcatgcg tgccctggtc tccttacctg 1380

tttcagccaa acgatacctg catcgtgagc ggatggggaa gggagaagga caatgagcgg 1440

gtgttctccc tgcagtgggg cgaggtgaag ctgatctcca actgttctaa gttttacggc 1500

aatcggttct atgagaagga gatggagtgc gccggcacct acgatggcag catcgacgcc 1560

tgtaagggcg attccggagg accactggtg tgcatggacg caaacaatgt gacatacgtg 1620

tggggagtgg tgagctgggg agagaactgc ggcaagccag agtttcccgg cgtctacacc 1680

aaggtggcca attattttga ctggatctcc taccacgtgg gcaggccttt catctctcag 1740

tacaacgtgt ga 1752

<210> 22

<211> 1752

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 22

atgaagctgc tgcatgtgtt tctgctgttc ctctgcttcc acctgaggtt ctgcaaagtg 60

acctacacca gccaagagga cctggtggaa aagaagtgcc tggccaagaa gtacacccac 120

ctgagctgcg acaaggtgtt ctgccagcct tggcagagat gcatcgaggg cacctgtgtg 180

tgcaagctgc cctatcagtg ccccaagaat ggcacagccg tgtgcgccac caacagaaga 240

agcttcccta cctactgcca gcagaaaagc ctggaatgtc tgcaccccgg caccaagttt 300

ctgaacaacg gcacctgtac cgccgagggc aagtttagcg tgtccctgaa gcacggcaac 360

accgactctg agggcatcgt ggaagtgaag ctggtggacc aggacaagac catgttcatc 420

tgcaagagca gctggtccat gcgcgaggcc aatgtggctt gtctggatct gggattccag 480

cagggcgccg acacacagag aagattcaag ctgagcgacc tgagcatcaa cagcaccgag 540

tgcctgcatg tgcactgtag aggcctggaa acaagcctgg ccgagtgcac cttcaccaag 600

agaaggacca tgggctacca ggacttcgcc gacgtcgtgt gctacaccca gaaagccgac 660

tctcccatgg acgatttctt ccagtgcgtg aacggcaagt acatcagcca gatgaaggcc 720

tgcgacggca tcaacgattg cggcgatcag agcgacgagc tgtgctgcaa agcctgtcaa 780

ggcaagggct tccactgcaa gtccggcgtg tgtatcccta gccagtacca gtgcaatggc 840

gaggtggact gtatcaccgg cgaggatgaa gtgggctgtg ccggatttgc cagcgtgacc 900

caagaggaaa ccgagatcct gaccgccgat atggacgccg agcggcggag aatcaaaagc 960

ctgctgccta agctgtcctg cggcgtgaag aaccggatgc acatccggcg caagagaatc 1020

gtcggaggca aaagagcaca gctgggcgat ctgccttggc aagtggccat caaggatgcc 1080

agcggcatca catgtggcgg catctacatc ggcggctgct ggattctgac agccgctcat 1140

tgtctgcggg ccagcaagac ccaccggtat cagatctgga ccaccgtggt ggactggatt 1200

caccccgacc tgaagcggat cgtgatcgag tacgtggacc ggatcatctt ccacgagaac 1260

tacaacgccg gcacctacca gaacgatatc gccctgatcg agatgaagaa ggacgggaac 1320

aagaaggact gcgagctgcc tagatctatc cccgcctgtg ttccttggag cccctacctg 1380

ttccagccta acgatacctg catcgtgtcc ggctggggca gagagaagga taacgagagg 1440

gtgttcagcc tgcagtgggg cgaagtgaaa ctgatcagca actgcagcaa gttctacggc 1500

aaccggttct acgagaaaga aatggaatgc gccggcacat acgacggctc catcgatgcc 1560

tgtaaaggcg attctggcgg ccctctcgtg tgcatggatg ccaacaatgt gacctacgtg 1620

tggggcgtcg tgtcctgggg agagaattgt ggcaagcctg agttccccgg cgtctacacc 1680

aaggtggcca actacttcga ctggatcagc taccacgtgg gcagaccctt tatcagccag 1740

tacaacgtgt ga 1752

<210> 23

<211> 1752

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 23

atgaagctgc tgcatgtgtt cctgctgttt ctgtgcttcc acctgagatt ttgtaaggtg 60

acctatacat ctcaggagga tctggtggag aagaagtgtc tggccaagaa gtacacacac 120

ctgagttgtg acaaggtgtt ctgtcagcca tggcagagat gcattgaggg aacctgtgtg 180

tgcaagctgc cttatcagtg cccaaagaat ggcactgctg tgtgtgccac aaataggaga 240

tcttttccaa catactgcca gcagaagagc ctggagtgtc tgcaccctgg caccaagttt 300

ctgaacaatg gcacctgcac agctgagggc aagttctctg tgagcctgaa gcatggcaac 360

acagatagtg agggcattgt ggaggtgaag ctggtggacc aggataagac catgttcatc 420

tgtaagagct cctggtctat gagagaggcc aatgtggcct gcctggatct gggctttcaa 480

caaggagctg acacacagag gagattcaag ctgagtgacc tgtctatcaa tagcacagag 540

tgcctgcatg tgcactgtag aggcctggag acaagcctgg ctgagtgcac ctttacaaag 600

agaaggacca tgggctatca ggactttgct gatgtggtat gctacaccca gaaggctgat 660

tctccaatgg atgatttctt tcaatgtgtg aatggcaagt acatcagcca gatgaaggcc 720

tgtgatggca tcaatgactg tggagatcag agtgatgagc tgtgttgcaa ggcctgtcag 780

ggcaagggct ttcactgcaa gagtggagtg tgcatcccct cccaatatca gtgcaatgga 840

gaggtggatt gtatcacagg agaggatgaa gtgggatgtg caggctttgc ctcagtgacc 900

caggaggaga cagagatcct gacagctgac atggatgctg agaggagaag gatcaagtct 960

ctgctgccta agctgagctg tggagtgaag aatagaatgc acatcagaag gaagagaatt 1020

gtgggaggca agagggcaca gctgggagat ctgccatggc aggtggccat caaggatgca 1080

agtggaatca cctgtggagg catctatatt ggaggatgtt ggatcctgac agcagcacac 1140

tgcctgagag catccaagac acacagatac cagatctgga ccacagtggt tgattggatc 1200

caccctgacc tgaagagaat tgtgattgag tatgtggata ggatcatctt ccatgagaac 1260

tacaatgctg gcacatatca gaatgacatt gccctgattg agatgaagaa ggatggcaat 1320

aagaaggact gtgagctgcc aagatccatc cctgcatgtg tgccctggtc tccttacctg 1380

tttcagccaa atgatacctg cattgtatcc ggatggggaa gggagaagga caatgagaga 1440

gtgttctccc tgcagtgggg agaggtgaag ctgatctcca actgttctaa gttttatggc 1500

aatagattct atgagaagga gatggagtgt gcaggcacct atgatggcag cattgatgcc 1560

tgtaagggag atagtggagg accactggtg tgcatggatg caaacaatgt gacatatgtg 1620

tggggagtgg tgagctgggg agagaactgt ggcaagccag agtttcctgg agtctacacc 1680

aaggtggcca attattttga ctggatctcc taccatgtgg gcaggccttt catctctcag 1740

tacaatgtgt ga 1752

<210> 24

<211> 1752

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 24

atgaagctgc tgcatgtgtt tctgctgttc ctctgcttcc acctgaggtt ctgcaaggtg 60

acctacacca gccaagagga cctggtggaa aagaagtgcc tggccaagaa gtacacccac 120

ctgagctgtg acaaggtgtt ctgccagcct tggcagagat gcattgaggg cacctgtgtg 180

tgcaagctgc cctatcagtg ccccaagaat ggcacagctg tgtgtgccac caacagaagg 240

agcttcccta cctactgcca gcagaaaagc ctggaatgtc tgcaccctgg caccaagttt 300

ctgaacaatg gcacctgtac agctgagggc aagtttagtg tgtccctgaa gcatggcaac 360

acagactctg agggcattgt ggaagtgaag ctggtggacc aggacaagac catgttcatc 420

tgcaagagta gctggtccat gagagaggcc aatgtggctt gtctggatct gggattccaa 480

cagggagctg acacacagag aagattcaag ctgagtgacc tgagcatcaa cagcacagag 540

tgcctgcatg tgcactgtag aggcctggaa acaagcctgg ctgagtgcac cttcaccaag 600

agaaggacca tgggctacca ggactttgct gatgtggtgt gctacaccca gaaagctgac 660

tctcccatgg atgatttctt tcaatgtgtg aatggcaagt acatcagcca gatgaaggcc 720

tgtgatggca tcaatgattg tggagatcag agtgatgagc tgtgctgcaa agcctgtcaa 780

ggcaagggct tccactgcaa gagtggagtg tgtatcccta gccagtacca gtgcaatgga 840

gaggtggact gtatcacagg agaggatgaa gtgggctgtg ctggatttgc cagtgtgacc 900

caagaggaaa cagagatcct gacagctgat atggatgctg agagaaggag aatcaaaagc 960

ctgcttccta agctgtcctg tggagtgaag aacagaatgc acatcagaag gaagagaatt 1020

gtgggaggca aaagagcaca gctgggagat ctgccttggc aagtggccat caaggatgcc 1080

agtggcatca catgtggagg catctacatt ggaggctgct ggattctgac agctgctcat 1140

tgtctgagag ccagcaagac ccacagatat cagatctgga ccacagtggt agactggatt 1200

caccctgacc tgaagagaat tgtgattgag tatgtggaca gaatcatctt ccatgagaac 1260

tacaatgctg gcacctacca gaatgatatt gccctgattg agatgaagaa ggatggaaac 1320

aagaaagact gtgagctgcc tagatctatc cctgcctgtg ttccttggag cccctacctg 1380

ttccagccta atgatacctg catagtttct ggatggggca gagagaagga taatgagagg 1440

gtgttcagcc tgcagtgggg agaagtgaaa ctgatcagca actgcagcaa gttctatggc 1500

aacagattct atgagaaaga aatggaatgt gctggcacat atgatggctc cattgatgcc 1560

tgtaaaggag attctggagg ccctcttgtg tgcatggatg ccaacaatgt gacctatgtg 1620

tggggagtgg tatcctgggg agagaattgt ggcaagcctg agttccctgg agtctacacc 1680

aaggtggcca actactttga ctggatcagc taccatgtgg gcagaccctt tatcagccag 1740

tacaatgtgt ga 1752

<210> 25

<211> 1752

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 25

atgaagctgc tgcatgtgtt cctgctgttc ctgtgcttcc acctgagatt ctgcaaggtg 60

acctacacca gccaggagga cctggtggag aagaagtgcc tggccaagaa gtacacccac 120

ctgagctgtg acaaggtgtt ctgccagccc tggcagagat gcattgaggg cacctgtgtg 180

tgcaagctgc cctaccagtg ccccaagaat ggcacagctg tgtgtgccac caacagaagg 240

agcttcccca cctactgcca gcagaagagc ctggagtgcc tgcaccctgg caccaagttc 300

ctgaacaatg gcacctgcac agctgagggc aagttcagtg tgagcctgaa gcatggcaac 360

acagacagtg agggcattgt ggaggtgaag ctggtggacc aggacaagac catgttcatc 420

tgcaagagca gttggagcat gagagaggcc aatgtggcct gcctggacct gggcttccag 480

caaggagctg acacccagag aaggttcaag ctgagtgacc tgagcatcaa cagcacagag 540

tgcctgcatg tgcactgcag aggcctggag accagcctgg ctgagtgcac cttcaccaag 600

agaaggacca tgggctacca ggactttgct gatgtggttt gctacaccca gaaggctgac 660

agccccatgg atgacttctt ccagtgtgtg aatggcaagt acatcagcca gatgaaggcc 720

tgtgatggca tcaatgactg tggagaccag agtgatgagc tgtgctgcaa ggcctgccag 780

ggcaagggct tccactgcaa gagtggagtg tgcatcccca gccagtacca gtgcaatgga 840

gaggtggact gcatcacagg agaggatgag gtgggctgtg ctggctttgc cagtgtgacc 900

caggaggaga cagagatcct gacagctgac atggatgctg agagaaggag aatcaagagc 960

ctgctgccca agctgagctg tggagtgaag aacagaatgc acatcagaag gaagagaatt 1020

gtgggaggca agagagccca gctgggagac ctgccctggc aggtggccat caaggatgcc 1080

agtggcatca cctgtggagg aatctacatt ggaggctgct ggattctgac agctgcccac 1140

tgcctgagag ccagcaagac ccacagatac cagatctgga ccacagtggt tgactggatt 1200

caccctgacc tgaagagaat tgtgattgag tatgtggaca gaatcatttt ccatgagaac 1260

tacaatgctg gcacctacca gaatgacatt gccctgattg agatgaagaa ggatggcaac 1320

aagaaagact gtgagctgcc cagaagcatc cctgcctgtg tgccctggag cccctacctg 1380

ttccagccca atgacacctg tattgtcagt ggatggggca gagagaagga caatgagaga 1440

gtgttcagcc tgcagtgggg agaggtgaag ctgatcagca actgcagcaa gttctatggc 1500

aacagattct atgagaagga gatggagtgt gctggcacct atgatggcag cattgatgcc 1560

tgcaagggag acagtggagg ccccctggtg tgcatggatg ccaacaatgt gacctatgtg 1620

tggggagtgg ttagctgggg agagaactgt ggcaagcctg agttccctgg agtgtacacc 1680

aaggtggcca actactttga ctggatcagc taccatgtgg gcagaccctt catcagccag 1740

tacaatgtgt aa 1752

<210> 26

<211> 1752

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 26

atgaagctgc tgcatgtgtt cctgctgttc ctgtgtttcc atctgaggtt ctgtaaggtg 60

acctatacat cacaggagga cctggtggag aagaagtgtc tggccaagaa gtatacacat 120

ctgtcatgtg acaaggtgtt ctgtcagcct tggcagaggt gtattgaggg aacatgtgtg 180

tgtaagctgc cttatcagtg tcctaagaat ggaacagctg tgtgtgccac aaataggagg 240

tcattcccta catattgtca gcagaagtca ctggagtgtc tgcatcctgg aacaaagttc 300

ctgaataatg gaacatgtac agctgaggga aagttctcag tgtcactgaa gcatggaaat 360

acagactcag agggaattgt ggaggtgaag ctggtggacc aggacaagac aatgttcatc 420

tgcaagtcat catggtcaat gagggaggcc aatgtggcct gtctggacct gggattccag 480

cagggagctg acacacagag gaggttcaag ctgtcagacc tgtcaatcaa ttcaacagag 540

tgtctgcatg tgcattgtag aggactggag acatcactgg ctgagtgtac attcacaaag 600

aggagaacaa tgggatatca ggactttgct gatgtggttt gttatacaca gaaggctgac 660

tcacctatgg atgacttctt tcaatgtgtg aatggaaagt atatctcaca gatgaaggcc 720

tgtgatggaa tcaatgactg tggagaccag tcagatgagc tgtgttgcaa ggcctgtcag 780

ggaaagggat tccattgcaa gtcaggagtg tgtatccctt cacaatatca gtgtaatgga 840

gaggtggact gtatcacagg agaggatgag gtgggatgtg caggatttgc ctcagtgacc 900

caggaggaga cagagatcct gacagctgac atggatgctg agagaaggag aatcaagtca 960

ctgctgccta agctgtcatg tggagtgaag aataggatgc atatcaggag gaagaggatt 1020

gtgggaggaa agagggccca gctgggagac ctgccttggc aagtggccat caaggatgcc 1080

tcaggaatca catgtggagg aatctatatt ggaggatgtt ggatcctgac agctgcccat 1140

tgtctgaggg cctcaaagac acatagatat cagatctgga caacagtggt ggactggatc 1200

catcctgacc tgaagaggat tgtgattgag tatgtggaca ggatcatctt ccatgagaat 1260

tataatgctg gaacatatca gaatgacatt gccctgattg agatgaagaa ggatggaaat 1320

aagaaggact gtgagctgcc taggtcaatc cctgcctgtg tgccttggtc cccttatctg 1380

ttccaaccta atgacacatg tattgtgtct ggatggggaa gggagaagga caatgagagg 1440

gtgttctcac tgcagtgggg agaggtgaag ctgatctcaa attgttcaaa gttctatgga 1500

aataggttct atgagaagga gatggagtgt gctggaacat atgatggatc aattgatgcc 1560

tgtaagggag actcaggagg acctctagta tgtatggatg ccaataatgt gacatatgtg 1620

tggggagtgg tgtcatgggg agagaattgt ggaaagcctg agttccctgg agtgtataca 1680

aaggtggcca attattttga ctggatctca tatcatgtgg gaaggccttt catctcacag 1740

tataatgtgt aa 1752

<210> 27

<211> 1752

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 27

atgaagctgc tgcatgtgtt cctgctgttt ctgtgcttcc acctgaggtt ttgcaaggtg 60

acctatacct ctcaagagga tctggtggag aagaagtgcc tggctaagaa gtatactcac 120

ctgagctgtg ataaggtgtt ctgccagccc tggcagaggt gcattgaggg cacctgtgtg 180

tgtaagctgc cctatcagtg ccccaagaat ggcactgctg tgtgtgctac taacaggagg 240

agcttcccca cctactgtca gcagaagagc ctggagtgtc tgcatcctgg gaccaagttt 300

ctgaataatg gaacctgcac agctgaggga aagtttagtg tgagcctgaa gcatggaaat 360

acagatagtg agggaattgt ggaggtgaag ctggtggacc aggataagac catgttcatc 420

tgcaagagca gctggagcat gagggaggcc aatgtggcct gcctggacct ggggtttcag 480

caaggtgctg atactcagag gaggtttaag ctgtctgatc tgtctatcaa tagcactgag 540

tgtctgcatg tgcattgtag aggactggag accagcctgg ctgagtgtac ttttactaag 600

aggaggacta tgggatacca ggattttgct gatgtggtgt gttataccca gaaggctgat 660

tctcccatgg atgacttctt tcagtgtgtg aatgggaagt acatctctca gatgaaggcc 720

tgtgatggta tcaatgattg tggagaccag agtgatgagc tgtgttgtaa ggcttgccaa 780

ggcaagggct ttcattgcaa gagtggagtg tgcatcccca gccagtatca gtgcaatgga 840

gaggtggact gcatcacagg ggaggatgag gtgggctgtg ctggctttgc ttctgtgact 900

caagaggaga cagagatcct gactgctgac atggatgctg agaggaggag gatcaagagc 960

ctgctgccta agctgtcttg tggagtgaag aacaggatgc acatcaggag gaagaggatt 1020

gtgggaggaa agagggctca gctgggagac ctgccctggc aggtggctat caaggatgcc 1080

agtggaatca cctgtggggg aatctatatt ggtggctgtt ggatcctgac tgctgctcat 1140

tgtctgaggg ccagcaagac tcatagatac cagatctgga ccacagtggt ggactggatc 1200

caccctgacc tgaagaggat tgtgattgag tatgtggata ggatcatctt ccatgagaac 1260

tacaatgctg gcacttacca gaatgacatt gctctgattg agatgaagaa ggatggaaac 1320

aagaaggatt gtgagctgcc taggagcatc cctgcctgtg tgccctggtc tccttacctg 1380

ttccaaccta atgatacctg cattgtgtct ggctggggaa gggagaagga taatgagagg 1440

gtgtttagcc tgcagtgggg tgaggtgaag ctgatcagca actgctctaa gttttatgga 1500

aataggttct atgagaagga gatggagtgt gctggaacct atgatggtag cattgatgcc 1560

tgcaaggggg actctggagg ccccctggtt tgtatggatg ccaacaatgt gacttatgtg 1620

tggggtgtgg tgagctgggg ggagaactgt ggaaagcctg agttccctgg agtgtacacc 1680

aaggtggcca attattttga ctggatcagc taccatgtgg gaaggccttt tatctctcag 1740

tacaatgtgt aa 1752

<210> 28

<211> 1752

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 28

atgaagctgc tgcatgtttt tctgctgttt ctgtgctttc acctgagatt ttgcaaggtg 60

acctatacaa gccaggagga tctggtggag aagaagtgcc tggcaaagaa gtatacccac 120

ctgagctgtg ataaggtgtt ttgccagccc tggcagagat gcattgaggg cacctgtgtt 180

tgtaagctgc cctatcagtg ccccaagaat ggcacagcag tgtgtgcaac caatagaagg 240

agctttccca catactgtca gcagaagagc ctggaatgtc tgcatcctgg gacaaagttt 300

ctgaataatg gaacatgcac agctgaagga aagtttagtg ttagcctgaa gcatggaaat 360

acagatagtg agggaatagt tgaagtgaag ctggtggacc aggataagac aatgtttata 420

tgcaagagta gctggagcat gagagaagcc aatgtggcct gcctggacct ggggtttcag 480

caaggagctg atacccagag aaggtttaag ctgagtgatc tgagcataaa tagcacagaa 540

tgtctgcatg tgcattgcag aggactggag accagcctgg ctgaatgtac ctttaccaag 600

agaaggacca tgggctacca ggattttgct gatgtggttt gttatacaca gaaggcagat 660

agccccatgg atgacttttt tcaatgtgtg aatgggaagt acattagcca gatgaaggcc 720

tgtgatggca tcaatgattg tggagaccag agtgatgaac tgtgttgtaa ggcatgccag 780

ggcaagggct ttcattgcaa gagtggagtt tgcattccca gccagtatca gtgcaatgga 840

gaggtggact gcattacagg ggaagatgaa gttggctgtg caggctttgc aagtgtgact 900

caggaagaaa cagaaattct gacagctgac atggatgcag aaagaagaag aataaagagc 960

ctgctgccta agctgagctg tggagttaag aatagaatgc acattagaag gaagagaatt 1020

gtgggaggaa agagagcaca gctgggagac ctgccctggc aggtggcaat taaggatgcc 1080

agtggaatca cctgtggggg aatttatatt ggaggctgtt ggattctgac agctgcacat 1140

tgtctgagag ccagcaagac ccatagatac cagatatgga caacagtggt ggactggata 1200

caccctgacc tgaagagaat agtgattgaa tatgtggata gaattatttt tcatgaaaat 1260

tacaatgcag gcacctacca gaatgacatt gctctgattg aaatgaagaa ggatggaaat 1320

aagaaggatt gtgagctgcc tagaagcatc cctgcctgtg tgccctggag cccttacctg 1380

tttcagccta atgatacatg cattgttagt ggctggggaa gagaaaagga taatgaaaga 1440

gtgtttagcc tgcagtgggg agaagttaag ctgataagca attgcagcaa gttttatgga 1500

aatagatttt atgaaaagga aatggaatgt gcaggcacat atgatggcag cattgatgcc 1560

tgcaaggggg acagtggagg ccccctagta tgtatggatg ccaataatgt gacctatgtg 1620

tggggagttg tgagctgggg ggaaaattgt ggaaagcctg agtttcctgg agtttacacc 1680

aaggtggcca attattttga ctggattagc taccatgtgg gaagaccttt tattagccag 1740

tacaatgtgt aa 1752

<210> 29

<211> 1752

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 29

atgaagctgc tgcatgtgtt cctgctgttc ctgtgtttcc acctgaggtt ctgtaaggtg 60

acctatacat ctcaggagga tctggtggag aagaagtgtc tggccaagaa gtatacacac 120

ctctcctgtg ataaggtgtt ctgtcagcca tggcagaggt gtattgaggg aacctgtgtg 180

tgtaagctgc cttatcagtg tccaaagaat ggaacagctg tgtgtgccac aaacaggagg 240

agcttcccaa catactgtca gcagaagtca ctggaatgtc tgcatccagg aacaaagttc 300

ctgaataatg gaacatgtac agctgaagga aagttctcag tgtccctgaa gcatggaaat 360

acagattcag agggaattgt ggaagtgaag ctggtggacc aggataagac aatgttcatc 420

tgtaagagca gctggagcat gagggaagcc aatgtggcct gtctggacct gggattccag 480

cagggagctg atacacagag gaggttcaag ctgtctgatc tctctatcaa ttccacagaa 540

tgtctgcatg tgcattgcag aggtctggag acctcactgg ctgaatgtac attcacaaag 600

aggaggacaa tgggatacca ggattttgct gatgtggtgt gttatacaca gaaggctgat 660

tctccaatgg atgacttctt tcagtgtgtg aatggaaagt acatctctca gatgaaggcc 720

tgtgatggaa tcaatgattg tggagaccag tcagatgaac tgtgctgcaa ggcctgtcag 780

ggaaagggat tccattgcaa gtcaggagtg tgtatcccaa gccagtatca gtgtaatgga 840

gaggtggact gtatcacagg agaagatgaa gtgggatgtg caggatttgc ctctgtgact 900

caggaagaaa cagaaatcct gacagctgac atggatgctg aaaggaggag gatcaagtca 960

ctgctgccta agctgtcttg tggagtgaag aacaggatgc acatcaggag gaagaggatt 1020

gtgggaggaa agagggccca gctgggagac ctcccatggc aggtggccat caaggatgcc 1080

tcaggaatca cctgtggagg aatctatatt ggaggatgtt ggatcctgac agctgcccat 1140

tgtctaagag cctcaaagac acatagatac cagatctgga caacagtggt ggactggatc 1200

caccctgacc tgaagaggat tgtgattgaa tatgtggata ggatcatctt ccatgaaaac 1260

tacaatgctg gaacatacca gaatgacatt gctctgatag aaatgaagaa ggatggaaac 1320

aagaaggatt gtgagctgcc taggtccatc cctgcctgtg tgccctggtc tccttacctg 1380

ttccaaccta atgatacatg tattgtgtct ggatggggaa gggaaaagga taatgaaagg 1440

gtgttctcac tgcagtgggg agaagtgaag ctgatcagca actgttctaa gttctatgga 1500

aataggttct atgaaaagga aatggaatgt gctggaacat atgatggatc cattgatgcc 1560

tgtaagggag actctggagg acccctggtt tgtatggatg ccaacaatgt gacatatgtg 1620

tggggagtgg tgtcatgggg agaaaactgt ggaaagccag agttcccagg agtgtacacc 1680

aaggtggcca attattttga ctggatcagc taccatgtgg gaaggccttt catctctcag 1740

tacaatgtgt aa 1752

<210> 30

<211> 1752

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 30

atgaaactgc tgcatgtgtt tctcctgttc ctgtgctttc atctgaggtt ctgtaaggtg 60

acctatacat cccaagagga tcttgtggaa aagaaatgtc tggccaaaaa gtacacccat 120

ctgtcttgtg acaaggtctt ctgccagcct tggcagagat gtattgaagg aacttgtgtc 180

tgtaaactgc cctaccagtg ccctaagaat ggaacagctg tctgtgctac taatagaagg 240

tcattcccaa cttactgcca gcagaagtct ctggagtgtc tccaccctgg aactaaattc 300

ctgaacaatg gcacatgtac agctgaaggc aagttctctg tctccctcaa acatggaaac 360

acagactcag aagggattgt ggaagtcaag ctggtggatc aggataagac catgtttatt 420

tgcaagtcat cctggtctat gagagaagca aatgtggcct gcctggatct gggctttcaa 480

caaggagcag acactcagag gagattcaag ctctctgacc tgtctattaa tagcactgag 540

tgtctgcatg tgcattgtag aggactggag acctcacttg ctgaatgtac attcactaaa 600

agaaggacta tgggatacca ggactttgct gatgtggtgt gctataccca gaaggcagac 660

tcccccatgg atgacttttt ccaatgtgtt aatgggaaat atattagtca gatgaaggct 720

tgtgatggaa ttaatgactg tggagatcag agtgatgagc tctgttgcaa agcctgtcag 780

ggaaagggtt tccactgcaa aagtggggtt tgtattcctt ctcaatacca atgcaatggg 840

gaggtggact gcattactgg agaggatgag gtggggtgtg ctggctttgc ttctgtgacc 900

caagaggaga cagagatcct gacagctgat atggatgctg aaaggagaag aattaagtca 960

ctgctgccca aactgtcttg tggagttaaa aacagaatgc acatcagaag aaagagaatt 1020

gtgggaggaa aaagagccca gcttggagat ctcccttggc aagtggccat taaggatgcc 1080

agtggtatca catgtggagg catctatatt ggagggtgct ggattctcac agctgcacac 1140

tgtctgagag ccagtaaaac ccatagatat cagatctgga caacagtggt tgattggatt 1200

catcctgatc tcaagagaat tgtgattgag tatgtggaca gaattatttt tcatgaaaac 1260

tacaatgcag gaacctatca gaatgatatt gccctcattg agatgaagaa ggatgggaac 1320

aaaaaggatt gtgagctgcc cagaagcatc ccagcttgtg tgccttggtc tccatacctc 1380

tttcagccaa atgatacttg cattgtcagt ggatggggta gagagaaaga taatgagaga 1440

gtcttctccc tccagtgggg agaggttaag ctcatcagta attgctccaa gttttatgga 1500

aacaggttct atgaaaaaga gatggaatgt gcaggaacat atgatggtag tattgatgct 1560

tgcaaaggag atagtggtgg acccctggtc tgtatggatg ccaacaatgt gacttatgtg 1620

tggggggtgg tgagctgggg agagaattgt gggaagcctg agtttccagg agtctacacc 1680

aaggtggcta attactttga ctggatcagt taccatgtgg gtaggccctt cattagccag 1740

tacaatgtct ga 1752

<210> 31

<211> 1752

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 31

atgaagctgc tgcatgtgtt cctcctgttt ctctgtttcc atctgagatt ctgcaaggtt 60

acctatacat cccaggaaga cctggtggag aaaaagtgtc ttgccaagaa gtacacccac 120

ctcagttgtg ataaggtctt ttgccagcca tggcagagat gtattgaagg cacttgtgtg 180

tgcaagctgc cataccagtg tcccaaaaat gggacagcag tctgtgcaac taatagaaga 240

tccttcccta catactgcca gcagaagagt cttgagtgcc tgcacccagg cacaaagttt 300

ctgaataatg gcacatgcac agctgaaggc aaattcagtg tctccctgaa acatggaaac 360

acagatagtg agggaattgt ggaagttaag ctggtggacc aggataaaac catgttcatt 420

tgtaaatctt catggagtat gagagaagct aatgtggcat gtctggacct tggatttcaa 480

caaggagcag atacccagag aaggtttaag ctgagtgatc tctccattaa ctctactgag 540

tgtctgcatg tgcattgtag aggactggag acatcactgg cagaatgtac ttttaccaaa 600

aggagaacca tgggttatca ggactttgca gatgtggtct gttacaccca gaaggctgac 660

tcccccatgg atgacttctt tcaatgtgtg aatgggaaat acatctccca gatgaaggcc 720

tgtgatggta tcaatgactg tggagaccag tctgatgagc tctgctgcaa ggcctgtcag 780

gggaagggat ttcactgcaa aagtggggtt tgcatcccca gtcagtacca gtgcaatggg 840

gaagtggact gcattacagg ggaagatgag gttggttgtg ctgggtttgc tagtgtgacc 900

caggaggaaa cagagatcct gacagctgat atggatgcag aaagaagaag aattaagagc 960

ctcctgccta agctcagttg tggagtcaaa aataggatgc atattaggag aaagaggatt 1020

gtgggaggga aaagagccca gcttggagac ctgccatggc aggttgccat caaggatgcc 1080

tcagggatca catgtggagg gatctatatt ggtggatgtt ggattctgac tgctgcccat 1140

tgcctgaggg cctcaaagac ccacagatat cagatctgga ccactgtggt ggactggatt 1200

catcctgacc tgaagagaat tgtgattgaa tatgtggaca ggattatctt tcatgagaac 1260

tataatgctg gaacttatca gaatgatatt gcactgattg agatgaagaa ggatgggaat 1320

aaaaaggact gtgaactccc aagaagcatt cctgcatgtg tgccttggtc tccttacctc 1380

ttccaaccca atgacacttg tattgtcagt ggatggggta gagaaaaaga caatgagagg 1440

gttttcagtc tgcagtgggg ggaggtcaag ctcatcagca actgctccaa attctatgga 1500

aacaggttct atgaaaaaga aatggagtgt gctgggactt atgatggtag tattgatgcc 1560

tgtaaagggg attctggagg gccacttgtc tgtatggatg ctaacaatgt gacctatgtc 1620

tggggagtgg tgtcatgggg agaaaattgt ggcaaacctg agtttcctgg agtgtataca 1680

aaggtggcta actattttga ttggatcagt tatcatgttg gtagaccctt catcagtcag 1740

tacaatgtct ag 1752

<210> 32

<211> 1752

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 32

atgaagctgc tccatgtctt cctgctgttc ctgtgcttcc acctgagatt ttgcaaggtg 60

acctacacca gccaggagga cctggtggaa aagaaatgtc ttgctaagaa atatacccac 120

ctgtcctgtg acaaagtctt ctgtcagcct tggcagagat gtattgaagg gacatgtgtc 180

tgtaagctgc cttaccagtg tcctaagaat gggactgcag tctgtgccac taatagaaga 240

tcattcccaa catactgcca gcagaagagt ctggagtgtc tgcatcctgg cacaaagttt 300

ctcaacaatg ggacatgtac agctgaagga aaattctctg tgagcctgaa acatggcaat 360

acagatagtg agggaattgt tgaggttaag ctggtggatc aggacaaaac aatgtttatc 420

tgcaaaagca gctggtccat gagagaggct aatgtggcct gtcttgacct tggctttcaa 480

caaggagcag atacccagag aagatttaaa ctgtcagatc tgagcatcaa ttcaacagag 540

tgtctgcatg tgcattgtag aggactggag accagcctgg ctgaatgtac cttcacaaag 600

agaagaacaa tgggatacca ggactttgct gatgtggttt gttacaccca gaaggcagac 660

agccccatgg atgacttctt tcagtgtgtg aatggaaagt atattagcca gatgaaggca 720

tgtgatggta tcaatgattg tggggaccag agtgatgagc tctgttgtaa ggcttgtcaa 780

ggcaaaggct tccactgcaa gtcaggggtg tgcatcccct cccaatacca gtgcaatgga 840

gaggtggatt gcatcacagg ggaggatgaa gtgggttgtg ctgggtttgc aagtgtgacc 900

caggaggaaa cagaaatcct gactgctgat atggatgctg agaggagaag aatcaaaagc 960

ctcctgccta aactgtcttg tggtgttaag aatagaatgc acattagaag aaagagaatt 1020

gtggggggaa agagagcaca gctgggtgat ctgccctggc aagtggcaat taaggatgcc 1080

tcaggcatca cctgtggagg catttacatt gggggttgct ggattctgac agcagcccac 1140

tgtctcagag ccagcaaaac tcacagatat cagatttgga caacagttgt ggattggatt 1200

caccctgatc tgaagagaat tgtcattgag tatgtggaca gaattatttt ccatgagaac 1260

tacaatgctg gcacatacca gaatgacatt gccctcattg aaatgaagaa ggatggaaat 1320

aaaaaggact gtgaactccc aagatcaatt cctgcctgtg tgccatggag tccttacctc 1380

ttccaaccaa atgatacctg cattgtcagt ggctggggga gagagaagga taatgaaaga 1440

gttttctccc tgcagtgggg agaggtgaag ctcattagta actgttctaa gttttatggg 1500

aacagatttt atgagaagga gatggaatgt gcaggaactt atgatggtag cattgatgca 1560

tgcaaaggag acagtggagg tccacttgtc tgcatggatg ctaacaatgt gacttatgtc 1620

tggggagtgg tctcctgggg tgaaaactgt ggaaagcctg agttcccagg agtgtataca 1680

aaagtggcca actactttga ctggatttca taccatgtgg ggagaccttt tatcagccag 1740

tacaatgtct ga 1752

<210> 33

<211> 1752

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 33

atgaaactgc tgcatgtgtt tctgctcttt ctctgcttcc acctgagatt ttgcaaggtg 60

acctacacct ctcaggaaga cctggtggag aagaagtgtc ttgccaagaa atatacccat 120

ctgtcatgtg ataaagtgtt ctgtcagcct tggcagagat gtattgaggg aacatgtgtg 180

tgcaagctgc cctaccagtg tccaaagaat gggactgctg tttgtgccac taacagaaga 240

tcttttccta catactgtca gcagaagagt ctggagtgcc tccaccctgg cacaaaattc 300

ctcaataatg gcacatgtac agctgaggga aagttttctg ttagcctcaa gcatggcaat 360

actgattcag agggtattgt tgaagtcaaa ctggtggatc aggataaaac catgttcatt 420

tgtaagagta gctggtccat gagggaggct aatgtggcat gcctggacct gggctttcaa 480

caaggggctg acactcagag aaggtttaag ctgagtgacc tgagcattaa ttcaactgag 540

tgtctgcatg tgcattgtag agggctggag actagccttg cagagtgcac attcactaag 600

agaagaacaa tgggatacca ggattttgca gatgtggtgt gctacactca gaaagctgac 660

tctcccatgg atgacttctt ccaatgtgtg aatgggaaat atatttcaca gatgaaggcc 720

tgtgatggaa ttaatgattg tggtgatcag agtgatgagc tctgttgtaa ggcttgccag 780

gggaagggtt ttcactgtaa aagtggggtt tgtatcccct ctcaatacca gtgcaatggg 840

gaagttgatt gcattacagg agaggatgag gtgggatgtg caggctttgc cagtgtgaca 900

caggaagaga cagagatcct gacagctgat atggatgcag aaagaagaag aatcaagtcc 960

ctgctcccca aactgtcctg tggggtcaag aatagaatgc acatcagaag gaagagaatt 1020

gtgggaggca aaagggcaca gctgggggac ctcccatggc aggtggcaat taaggatgcc 1080

agtggtatca catgtggagg gatttacatt ggaggctgct ggattctcac agcagcccac 1140

tgcctcagag catctaaaac tcacagatac cagatttgga ccactgtggt ggactggatt 1200

caccctgacc tgaagagaat tgtgattgaa tatgtggata gaatcatttt ccatgaaaat 1260

tacaatgctg gcacttatca gaatgacatt gcactcattg agatgaagaa agatgggaat 1320

aaaaaggact gtgaactgcc cagaagcatt ccagcttgtg tgccatggag tccatatctg 1380

tttcagccaa atgatacatg catagtgtct ggttggggaa gagagaagga caatgaaagg 1440

gtttttagcc tccagtgggg ggaggtcaag ctgattagca actgcagtaa attctatggc 1500

aacagatttt atgagaagga gatggaatgt gcaggcactt atgatggctc aattgatgcc 1560

tgcaagggag attctggtgg acccctggtg tgcatggatg ccaataatgt cacctatgtc 1620

tggggtgtgg ttagctgggg agagaactgt gggaagcctg agtttccagg agtgtataca 1680

aaagtggcaa attactttga ctggatctcc tatcatgtgg ggagaccctt tatctctcag 1740

tacaatgttt ga 1752

<210> 34

<211> 1752

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 34

atgaaactgc tccatgtttt tctcctcttt ctctgcttcc acctgagatt ttgcaaggtg 60

acctatacct ctcaggagga cctggttgag aaaaagtgcc tggctaaaaa gtacacccac 120

ctctcttgtg ataaggtgtt ctgccagcct tggcagagat gcattgaagg cacatgtgtt 180

tgtaaactgc cttaccagtg tcccaaaaat gggactgctg tgtgtgccac aaatagaagg 240

agctttccaa cctactgtca gcagaagagc cttgaatgcc tccatcctgg gacaaaattc 300

ctgaacaatg gaacctgtac agctgaaggc aaatttagtg ttagcctgaa acatgggaat 360

acagattctg agggaattgt ggaggtcaaa ctggtggacc aggataaaac catgtttatc 420

tgcaagagta gctggtccat gagagaggcc aatgtggcat gcctggatct tgggtttcaa 480

caaggagctg acacccagag aagattcaaa ctcagtgacc tgagtattaa ctcaacagaa 540

tgtctgcatg tgcattgtag aggactggaa actagccttg cagagtgcac ttttaccaag 600

agaagaacca tgggatatca ggattttgct gatgtggtgt gctacaccca gaaagcagac 660

agtcccatgg atgacttctt ccagtgtgtg aatggcaagt atatttccca gatgaaagca 720

tgtgatggca tcaatgattg tggagaccag agtgatgaac tgtgctgtaa ggcttgccag 780

ggaaagggtt tccactgcaa aagtggagtt tgcatcccca gccagtacca gtgcaatgga 840

gaagtggatt gcattacagg agaggatgaa gtgggatgtg ctggctttgc ttctgttacc 900

caagaagaga cagagattct gacagctgac atggatgcag agaggagaag aattaagtcc 960

ctgctgccta aactgtcctg tggtgtcaag aatagaatgc acatcagaag gaagagaatt 1020

gtggggggaa aaagagccca gcttggagac ctgccttggc aagtggctat taaggatgcc 1080

agtgggatca catgtggagg aatttacatt ggagggtgct ggattctcac agctgcccac 1140

tgcctgaggg ccagcaaaac ccacagatac cagatctgga caacagttgt ggattggatt 1200

catcctgatc tcaagagaat tgttattgag tatgtggata ggatcatttt ccatgaaaat 1260

tacaatgcag gcacatacca aaatgacatt gcactcattg agatgaagaa ggatgggaat 1320

aaaaaggatt gtgagctccc caggagcatt cctgcttgtg tcccctggtc cccttacctc 1380

ttccaaccca atgacacctg cattgtcagt ggctggggta gagaaaaaga taatgagaga 1440

gtcttcagcc tgcagtgggg ggaggtgaag ctgattagca attgtagcaa gttttatggg 1500

aacaggttct atgagaagga gatggagtgt gctggcacct atgatggctc tattgatgct 1560

tgtaaggggg acagtggggg accactggtt tgtatggatg caaacaatgt gacctatgtt 1620

tggggagtgg ttagctgggg agaaaattgt ggaaaacctg agtttcctgg tgtctataca 1680

aaagtggcta attattttga ttggatcagt tatcatgttg ggagaccctt tattagtcag 1740

tacaatgtct ag 1752

<210> 35

<211> 1752

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 35

atgaaactcc tgcatgtgtt tctgctgttc ctctgttttc acctgaggtt ttgtaaggtg 60

acctacacta gccaggagga tctggtggag aaaaagtgcc ttgcaaaaaa gtacactcac 120

ctcagctgtg acaaggtctt ctgtcagcct tggcagagat gcattgaggg gacatgtgtg 180

tgcaaactcc cataccagtg tcctaagaat ggtacagctg tctgtgcaac aaacaggaga 240

tcctttccca cctattgtca gcagaagtcc ctggagtgtc tgcaccctgg tacaaagttt 300

ctgaataatg gcacatgcac tgctgaggga aagttcagtg tgtccctgaa acatggaaac 360

actgattcag agggtattgt ggaggtgaaa cttgtggatc aggacaagac catgttcatc 420

tgcaagtcca gttggagcat gagagaggct aatgtggcct gtctggacct gggttttcag 480

caaggagctg acactcagag aaggttcaag ctgtcagatc tcagtatcaa ctccacagaa 540

tgtctgcatg tgcattgcag agggctggag actagccttg ctgaatgtac ttttacaaag 600

agaagaacta tgggatacca ggattttgca gatgtggtct gttatactca gaaggctgat 660

tcacccatgg atgacttctt ccagtgtgtg aatggcaagt acatttcaca aatgaaagca 720

tgtgatggta tcaatgattg tggagaccag agtgatgaac tctgttgcaa ggcatgccag 780

ggcaagggat tccactgcaa gagtggtgtc tgtattccca gtcagtatca gtgcaatggg 840

gaggtggact gcatcactgg ggaagatgaa gtgggctgtg ctggttttgc tagtgtgaca 900

caggaggaaa ctgaaattct cacagcagat atggatgctg agagaaggag aatcaagtcc 960

ctcctcccta aactgagttg tggagtgaaa aacagaatgc atattagaag aaaaagaatt 1020

gtgggaggca agagagctca gcttggggac ctcccatggc aagtggctat taaggatgca 1080

agtgggatta catgtggagg gatctatatt ggggggtgct ggattctgac agcagcccac 1140

tgtctgagag cctctaaaac ccatagatat cagatctgga caacagtggt ggattggatt 1200

cacccagacc tcaagaggat tgtgattgag tatgtggata gaattatttt tcatgagaac 1260

tacaatgctg gaacctatca gaatgatatt gctctgattg aaatgaaaaa ggatgggaac 1320

aaaaaggact gtgaactgcc aagatcaatc cctgcatgtg tgccatggag tccctatctc 1380

tttcagccca atgatacatg cattgttagt ggatggggga gggagaaaga caatgagaga 1440

gtgttcagtc tccagtgggg tgaagtgaag ctcatttcta attgtagcaa gttttatggg 1500

aatagattct atgaaaaaga aatggagtgt gcaggaactt atgatggttc cattgatgcc 1560

tgcaagggag atagtggtgg gcccctggtg tgcatggatg ctaataatgt gacctatgtc 1620

tggggagtgg tttcatgggg agagaattgt ggaaagcctg agttccctgg agtgtacacc 1680

aaggtggcca attactttga ttggatcagc tatcatgtgg gaagaccatt tatttcccag 1740

tacaatgtct aa 1752

<210> 36

<211> 1752

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 36

atgaagctcc tgcatgtgtt tctgctcttc ctctgctttc acctgagatt ctgtaaggtg 60

acctatacaa gccaggaaga tcttgtggag aaaaagtgcc ttgctaagaa gtacactcac 120

ctcagctgtg acaaagtctt ttgccagcct tggcagagat gtattgaggg aacttgtgtc 180

tgtaagctcc catatcagtg tcccaagaat ggaacagctg tgtgtgctac taacagaagg 240

agctttccca cctactgcca gcagaagagc cttgaatgtc tccacccagg gaccaagttt 300

ctgaacaatg gcacatgtac agctgagggg aaattcagtg tcagtctcaa acatgggaat 360

actgatagtg agggcattgt tgaggtgaaa cttgtggacc aggataagac catgtttatc 420

tgcaagtcaa gctggtcaat gagagaagct aatgtggctt gtctggacct tgggtttcaa 480

caaggagctg acactcagag aagatttaag ctgagtgatc tgagtatcaa cagcactgaa 540

tgtctgcatg tgcattgcag agggctggag actagccttg ctgagtgcac ttttaccaag 600

agaagaacaa tgggatacca ggattttgct gatgtggtct gttatactca gaaggcagat 660

tcaccaatgg atgacttctt tcagtgtgtg aatggaaaat acatttccca gatgaaggct 720

tgtgatggta tcaatgactg tggggaccag agtgatgagc tctgttgtaa ggcatgtcag 780

ggcaaaggat ttcactgcaa gtctggggtc tgtatcccca gccagtatca gtgtaatgga 840

gaggttgatt gtatcacagg ggaggatgaa gtgggttgtg ctggctttgc atcagtgaca 900

caggaagaga cagaaattct gacagcagat atggatgctg aaagaaggag aattaaaagc 960

ctcctgccaa aactgagctg tggtgtcaag aatagaatgc acatcagaag gaagagaatt 1020

gttggtggaa agagggccca gcttggggac ctgccatggc aggttgcaat caaagatgca 1080

agtggcatta cctgtggagg aatttacatt ggagggtgtt ggattctgac agcagctcat 1140

tgtctaagag cctccaaaac ccacagatac cagatctgga ccactgtggt ggattggatt 1200

caccctgacc tgaaaagaat tgtcattgag tatgtggaca ggattatttt ccatgagaat 1260

tataatgctg gcacctacca gaatgacatt gccctgattg agatgaagaa agatggaaat 1320

aagaaggact gtgagctccc aagatcaatt cctgcttgtg tgccttggtc tccatacctg 1380

tttcagccca atgatacttg tattgtttct ggatggggca gggaaaaaga caatgagaga 1440

gtgttcagcc tgcagtgggg ggaggtgaag ctgatctcaa actgcagcaa gttctatgga 1500

aatagatttt atgagaagga aatggagtgt gcaggcactt atgatggatc aattgatgcc 1560

tgcaagggtg acagtggtgg cccacttgtg tgcatggatg ctaacaatgt gacctatgtt 1620

tggggtgtgg tgtcatgggg ggaaaactgt ggcaaacctg agtttcctgg tgtttacact 1680

aaggttgcaa actactttga ctggatcagc tatcatgtgg gcagaccttt tatttcccag 1740

tataatgtct aa 1752

<210> 37

<211> 1752

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 37

atgaaactcc tgcatgtgtt tctcctgttc ctctgctttc acctgagatt ttgtaaggtg 60

acctatacca gccaggagga ccttgttgag aagaaatgcc tggctaagaa atacacccac 120

ctgtcctgtg acaaggtgtt ctgtcagcct tggcagaggt gcattgaagg gacctgtgtg 180

tgtaaactcc cctaccagtg ccctaagaat ggcactgcag tgtgtgctac aaacagaaga 240

tcattcccaa cctattgcca gcagaaatca ctggaatgcc tgcatcctgg tacaaaattc 300

ctgaacaatg ggacttgtac tgctgagggg aaattcagtg tgtccctgaa acatgggaac 360

acagattctg agggtattgt tgaggtgaag ctggtggatc aggataagac tatgtttatc 420

tgcaagtcaa gctggtccat gagggaagcc aatgtggcat gcctggatct gggttttcaa 480

caaggagctg atacccagag aagatttaag ctgagtgacc tcagcattaa ctctactgag 540

tgtctgcatg tgcactgtag agggcttgaa acaagcctgg cagagtgcac cttcaccaag 600

agaaggacaa tgggatacca ggactttgct gatgtggtct gctacaccca gaaggctgat 660

tcccccatgg atgatttctt tcaatgtgtg aatgggaagt acatcagcca gatgaaagca 720

tgtgatggga tcaatgactg tggagaccag agtgatgagc tgtgctgcaa agcttgccag 780

gggaaaggct ttcattgcaa gagtggggtc tgtattccct cccaatacca gtgcaatggg 840

gaggtggatt gcatcacagg agaagatgaa gtgggctgtg ctggatttgc ctcagtgact 900

caggaagaga cagaaattct cacagctgat atggatgcag agagaaggag gatcaagtcc 960

ctcctgccta aactgagttg tggagtgaag aacaggatgc atattagaag gaagagaatt 1020

gtggggggta aaagagccca gcttggggac ctgccttggc aagtggctat caaagatgcc 1080

agtggtatta cctgtggtgg gatctatatt ggtggttgct ggattctcac tgctgcacac 1140

tgtctgagag ccagcaaaac ccacagatat cagatttgga ctacagtggt tgactggatt 1200

caccctgacc tgaagagaat tgttattgag tatgtggata gaatcatctt ccatgagaat 1260

tacaatgctg ggacttatca gaatgatatt gccctcattg aaatgaagaa ggatgggaac 1320

aaaaaggatt gtgagctgcc cagaagcatt ccagcctgtg tgccatggag cccctatctg 1380

tttcagccaa atgacacttg tattgtttct ggttggggca gggaaaaaga caatgaaaga 1440

gtctttagcc tccagtgggg agaagttaag ctgatttcaa attgcagcaa attctatggg 1500

aacaggttct atgagaagga gatggagtgt gctgggacat atgatggttc aattgatgct 1560

tgcaaaggag atagtggtgg gccactggtc tgcatggatg ccaataatgt gacatatgtc 1620

tggggggtgg tttcctgggg agagaattgt gggaagccag agtttcctgg tgtctataca 1680

aaagtggcta actattttga ctggatcagc tatcatgtgg ggagaccttt catcagtcag 1740

tataatgtgt ag 1752

<210> 38

<211> 1752

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 38

atgaagctgc tgcatgtgtt tctgctcttt ctgtgcttcc acctgagatt ttgcaaggtg 60

acctacacct ctcaggagga tctggtggag aaaaagtgcc tggcaaaaaa gtatactcac 120

ctcagttgtg acaaggtctt ctgccagcca tggcagagat gtattgaggg aacctgtgtg 180

tgcaaactcc cttatcagtg tcccaagaat gggactgcag tctgtgcaac caacagaaga 240

agctttccca catactgtca gcagaaatcc cttgagtgcc tgcaccctgg aaccaaattc 300

ctgaataatg gaacttgcac agcagagggg aaattcagtg tcagcctgaa acatggcaac 360

actgatagtg aggggattgt tgaagtgaag ctggtggatc aggataagac tatgtttatc 420

tgcaaaagtt catggagcat gagagaagca aatgtggcat gccttgatct gggtttccaa 480

caaggagctg acactcagag aagatttaaa ctcagtgatc tgtcaatcaa cagcacagag 540

tgcctgcatg tgcactgtag aggacttgag acatcacttg cagaatgcac atttaccaaa 600

agaagaacca tgggatacca ggattttgca gatgtggtgt gctatactca gaaagctgat 660

agccccatgg atgacttctt ccagtgtgtc aatgggaagt atatcagcca gatgaaggcc 720

tgtgatggaa tcaatgactg tggagatcag agtgatgaac tctgttgtaa ggcatgtcag 780

gggaagggtt tccattgcaa gagtggagtc tgcattcctt cacaatacca gtgcaatgga 840

gaggtggatt gtattactgg ggaggatgaa gtgggttgtg caggatttgc cagtgtgact 900

caggaggaaa ctgagattct gacagctgac atggatgctg agagaagaag gatcaagagc 960

ctgctcccaa agctgtcatg tggggtcaaa aatagaatgc acatcagaag gaagagaatt 1020

gtgggaggga aaagagctca gctgggagac ctcccttggc aagtggcaat caaggatgct 1080

agtggtatca catgtggagg aatctacatt ggggggtgtt ggattctgac tgcagcccat 1140

tgcctgaggg catccaaaac ccacagatat cagatctgga caacagttgt ggactggatt 1200

caccctgacc tcaaaagaat tgtcattgag tatgtggaca gaatcatttt ccatgagaat 1260

tacaatgctg gcacttacca gaatgacatt gccctgattg aaatgaagaa ggatggaaac 1320

aagaaggatt gtgaactccc caggtcaatc ccagcctgtg tgccctggag cccctacctg 1380

ttccagccaa atgatacatg tattgtcagt ggatggggga gagagaagga caatgagaga 1440

gtgttttcac tgcagtgggg ggaagtgaag ctgatcagca attgctccaa gttctatgga 1500

aacaggtttt atgagaagga gatggagtgt gctgggactt atgatggaag tattgatgct 1560

tgtaaagggg attcaggagg tcctcttgtc tgcatggatg ctaacaatgt gacatatgtg 1620

tggggagtag tcagttgggg agaaaactgt ggaaaaccag aatttcctgg ggtgtatact 1680

aaagtggcaa attattttga ctggatcagc tatcatgtgg gtagaccctt cattagtcag 1740

tataatgtgt ga 1752

<210> 39

<211> 1752

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 39

atgaagctcc tgcatgtctt tctgctgttt ctctgcttcc atctgagatt ttgcaaggtg 60

acctacacct ctcaggaaga ccttgttgaa aagaagtgtc tggccaaaaa gtatactcat 120

ctgtcttgtg acaaagtctt ctgtcagccc tggcagagat gcattgaggg aacatgtgtc 180

tgcaagctcc cttatcagtg tcccaaaaat ggcacagcag tttgtgccac aaatagaagg 240

tcttttccta catactgcca gcagaagagc cttgaatgtc tccacccagg cacaaagttt 300

ctgaataatg ggacttgcac agcagaaggc aaatttagtg tgtccctgaa acatggaaac 360

actgatagtg agggcattgt ggaggttaag cttgtggatc aggataaaac aatgttcatc 420

tgcaagagct catggtccat gagagaggct aatgtggctt gtctggacct gggttttcaa 480

caaggagctg atactcagag aaggtttaag ctcagtgacc tgagcatcaa cagtacagag 540

tgtctgcatg tgcattgtag aggactggaa acttctctgg ctgagtgtac ctttacaaag 600

agaagaacaa tgggatacca ggattttgct gatgtggtct gctacaccca gaaagctgac 660

tcccccatgg atgatttctt tcaatgtgtt aatgggaaat acattagcca gatgaaggct 720

tgtgatggta tcaatgactg tggagaccag tctgatgaac tgtgctgtaa agcctgtcaa 780

gggaaaggat tccactgcaa gagtggagtg tgcattccat cccagtacca gtgtaatgga 840

gaagttgatt gcattacagg ggaagatgaa gtgggttgtg cagggtttgc ttcagtaact 900

caggaggaga cagaaatcct gacagctgac atggatgctg aaaggagaag gatcaaaagc 960

ctgctgccca agctctcatg tggggtgaaa aacaggatgc atattagaag gaagaggatt 1020

gtgggaggga aaagagccca gctgggggac ctgccatggc aggttgccat taaagatgct 1080

tcagggatca catgtggggg catctatatt ggaggctgtt ggattctcac agcagcacac 1140

tgcctgagag cttcaaagac tcacagatat cagatttgga caacagtggt ggattggatt 1200

caccctgatc tcaaaagaat tgtcattgaa tatgttgaca gaatcatctt tcatgaaaac 1260

tacaatgctg gaacttatca gaatgatatt gctctgattg aaatgaagaa agatggaaac 1320

aaaaaggact gtgaactgcc cagaagcatc cctgcttgtg ttccatggtc cccttacctg 1380

tttcagccta atgacacctg cattgttagt ggctggggga gagagaagga caatgagaga 1440

gtgttttccc tgcagtgggg agaggtgaaa ctcatctcta actgttcaaa attctatggg 1500

aatagatttt atgagaagga gatggaatgt gctgggacct atgatgggtc aattgatgct 1560

tgtaagggtg acagtggagg acccctggtg tgcatggatg ccaacaatgt gacatatgtc 1620

tggggggtgg ttagctgggg agaaaattgt gggaagcctg agttccctgg ggtgtacacc 1680

aaggttgcaa actattttga ttggatttct tatcatgtgg gtagaccatt tatcagtcag 1740

tataatgtgt ag 1752

<210> 40

<211> 1752

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 40

atgaaacttc ttcatgtgtt cctgctgttt ctgtgcttcc acctgaggtt ttgcaaggtg 60

acctatactt ctcaagagga tctggtggag aaaaaatgcc tggctaaaaa atatactcac 120

ctgtcctgtg ataaagtctt ctgccagcca tggcagagat gcattgaggg aacttgtgtg 180

tgcaaactgc catatcagtg cccaaaaaat ggaactgctg tgtgtgctac taacaggaga 240

agcttcccaa cttattgcca gcagaaaagt ctggaatgcc ttcatccagg aactaaattt 300

ctgaataatg gaacttgcac tgctgaagga aaatttagtg tgtccctgaa acatggaaat 360

actgattcag agggaattgt ggaagtgaaa cttgtggatc aggataaaac tatgttcatt 420

tgcaaaagca gctggagcat gagggaagct aatgtggctt gccttgatct tggatttcaa 480

caaggagctg atactcagag aaggtttaaa ctgtctgatc tgtctattaa ttccactgaa 540

tgcctgcatg tgcattgcag aggactggag actagtctgg ctgaatgcac ttttactaaa 600

agaagaacta tgggatatca ggattttgct gatgtggtgt gctatactca gaaagctgat 660

tctccaatgg atgatttctt tcaatgtgtg aatggaaaat atatttctca gatgaaagct 720

tgtgatggaa tcaatgattg tggagatcag agtgatgaac tgtgctgcaa agcttgccag 780

ggaaaaggat ttcattgcaa atctggagtg tgcattccaa gccagtatca gtgcaatgga 840

gaggtggatt gcattactgg agaagatgaa gtgggatgtg ctggatttgc ttctgtgact 900

caagaagaaa ctgaaattct gactgctgat atggatgctg aaagaagaag aattaaatca 960

ctgctgccta aactgtcttg tggagtgaaa aacagaatgc acattagaag gaaaagaatt 1020

gtgggaggaa aaagagctca gctgggagat ctgccatggc aggtggctat taaagatgct 1080

agtggaatca cttgtggagg aatttatatt ggaggatgct ggattctgac tgctgctcat 1140

tgcctgagag ctagtaaaac tcatagatat cagatttgga ctactgtggt ggattggatt 1200

cacccagatc ttaaaagaat tgtgattgaa tatgtggata gaattatttt ccatgaaaac 1260

tataatgctg gaacttatca gaatgatatt gctctgattg aaatgaaaaa agatggaaac 1320

aaaaaagatt gtgagctgcc tagatccatc cctgcttgtg tcccatggtc tccttatctg 1380

ttccaaccta atgatacttg cattgtgtct ggatggggaa gagaaaaaga taatgaaaga 1440

gtcttttcac ttcaatgggg agaagtgaaa ctgattagca actgctctaa attttatgga 1500

aatagattct atgaaaaaga aatggaatgt gctggaactt atgatggatc cattgatgct 1560

tgcaaaggag attctggagg accactggtc tgcatggatg ctaacaatgt gacttatgtc 1620

tggggagtgg tcagttgggg agaaaactgt ggaaaaccag agttcccagg agtgtatact 1680

aaagtggcta attattttga ttggattagc tatcatgtgg gaaggccttt tatttctcag 1740

tataatgtgt aa 1752

<210> 41

<211> 1752

<212> DNA

<213> 智人

<400> 41

atgaagcttc ttcatgtttt cctgttattt ctgtgcttcc acttaaggtt ttgcaaggtc 60

acttatacat ctcaagagga tctggtggag aaaaagtgct tagcaaaaaa atatactcac 120

ctctcctgcg ataaagtctt ctgccagcca tggcagagat gcattgaggg cacctgtgtt 180

tgtaaactac cgtatcagtg cccaaagaat ggcactgcag tgtgtgcaac taacaggaga 240

agcttcccaa catactgtca acaaaagagt ttggaatgtc ttcatccagg gacaaagttt 300

ttaaataacg gaacatgcac agccgaagga aagtttagtg tttccttgaa gcatggaaat 360

acagattcag agggaatagt tgaagtaaaa cttgtggacc aagataagac aatgttcata 420

tgcaaaagca gctggagcat gagggaagcc aacgtggcct gccttgacct tgggtttcaa 480

caaggtgctg atactcaaag aaggtttaag ttgtctgatc tctctataaa ttccactgaa 540

tgtctacatg tgcattgccg aggattagag accagtttgg ctgaatgtac ttttactaag 600

agaagaacta tgggttacca ggatttcgct gatgtggttt gttatacaca gaaagcagat 660

tctccaatgg atgacttctt tcagtgtgtg aatgggaaat acatttctca gatgaaagcc 720

tgtgatggta tcaatgattg tggagaccaa agtgatgaac tgtgttgtaa agcatgccaa 780

ggcaaaggct tccattgcaa atcgggtgtt tgcattccaa gccagtatca atgcaatggt 840

gaggtggact gcattacagg ggaagatgaa gttggctgtg caggctttgc atctgtgact 900

caagaagaaa cagaaatttt gactgctgac atggatgcag aaagaagacg gataaaatca 960

ttattaccta aactatcttg tggagttaaa aacagaatgc acattcgaag gaaacgaatt 1020

gtgggaggaa agcgagcaca actgggagac ctcccatggc aggtggcaat taaggatgcc 1080

agtggaatca cctgtggggg aatttatatt ggtggctgtt ggattctgac tgctgcacat 1140

tgtctcagag ccagtaaaac tcatcgttac caaatatgga caacagtagt agactggata 1200

caccccgacc ttaaacgtat agtaattgaa tacgtggata gaattatttt ccatgaaaac 1260

tacaatgcag gcacttacca aaatgacatc gctttgattg aaatgaaaaa agacggaaac 1320

aaaaaagatt gtgagctgcc tcgttccatc cctgcctgtg tcccctggtc tccttaccta 1380

ttccaaccta atgatacatg catcgtttct ggctggggac gagaaaaaga taacgaaaga 1440

gtcttttcac ttcagtgggg tgaagttaaa ctaataagca actgctctaa gttttacgga 1500

aatcgtttct atgaaaaaga aatggaatgt gcaggtacat atgatggttc catcgatgcc 1560

tgtaaagggg actctggagg ccccttagtc tgtatggatg ccaacaatgt gacttatgtc 1620

tggggtgttg tgagttgggg ggaaaactgt ggaaaaccag agttcccagg tgtttacacc 1680

aaagtggcca attattttga ctggattagc taccatgtag gaaggccttt tatttctcag 1740

tacaatgtat aa 1752

<210> 42

<211> 1698

<212> DNA

<213> 智人

<400> 42

aaggtcactt atacatctca agaggatctg gtggagaaaa agtgcttagc aaaaaaatat 60

actcacctct cctgcgataa agtcttctgc cagccatggc agagatgcat tgagggcacc 120

tgtgtttgta aactaccgta tcagtgccca aagaatggca ctgcagtgtg tgcaactaac 180

aggagaagct tcccaacata ctgtcaacaa aagagtttgg aatgtcttca tccagggaca 240

aagtttttaa ataacggaac atgcacagcc gaaggaaagt ttagtgtttc cttgaagcat 300

ggaaatacag attcagaggg aatagttgaa gtaaaacttg tggaccaaga taagacaatg 360

ttcatatgca aaagcagctg gagcatgagg gaagccaacg tggcctgcct tgaccttggg 420

tttcaacaag gtgctgatac tcaaagaagg tttaagttgt ctgatctctc tataaattcc 480

actgaatgtc tacatgtgca ttgccgagga ttagagacca gtttggctga atgtactttt 540

actaagagaa gaactatggg ttaccaggat ttcgctgatg tggtttgtta tacacagaaa 600

gcagattctc caatggatga cttctttcag tgtgtgaatg ggaaatacat ttctcagatg 660

aaagcctgtg atggtatcaa tgattgtgga gaccaaagtg atgaactgtg ttgtaaagca 720

tgccaaggca aaggcttcca ttgcaaatcg ggtgtttgca ttccaagcca gtatcaatgc 780

aatggtgagg tggactgcat tacaggggaa gatgaagttg gctgtgcagg ctttgcatct 840

gtgactcaag aagaaacaga aattttgact gctgacatgg atgcagaaag aagacggata 900

aaatcattat tacctaaact atcttgtgga gttaaaaaca gaatgcacat tcgaaggaaa 960

cgaattgtgg gaggaaagcg agcacaactg ggagacctcc catggcaggt ggcaattaag 1020

gatgccagtg gaatcacctg tgggggaatt tatattggtg gctgttggat tctgactgct 1080

gcacattgtc tcagagccag taaaactcat cgttaccaaa tatggacaac agtagtagac 1140

tggatacacc ccgaccttaa acgtatagta attgaatacg tggatagaat tattttccat 1200

gaaaactaca atgcaggcac ttaccaaaat gacatcgctt tgattgaaat gaaaaaagac 1260

ggaaacaaaa aagattgtga gctgcctcgt tccatccctg cctgtgtccc ctggtctcct 1320

tacctattcc aacctaatga tacatgcatc gtttctggct ggggacgaga aaaagataac 1380

gaaagagtct tttcacttca gtggggtgaa gttaaactaa taagcaactg ctctaagttt 1440

tacggaaatc gtttctatga aaaagaaatg gaatgtgcag gtacatatga tggttccatc 1500

gatgcctgta aaggggactc tggaggcccc ttagtctgta tggatgccaa caatgtgact 1560

tatgtctggg gtgttgtgag ttggggggaa aactgtggaa aaccagagtt cccaggtgtt 1620

tacaccaaag tggccaatta ttttgactgg attagctacc atgtaggaag gccttttatt 1680

tctcagtaca atgtataa 1698

<210> 43

<211> 583

<212> PRT

<213> 智人

<400> 43

Met Lys Leu Leu His Val Phe Leu Leu Phe Leu Cys Phe His Leu Arg

1 5 10 15

Phe Cys Lys Val Thr Tyr Thr Ser Gln Glu Asp Leu Val Glu Lys Lys

20 25 30

Cys Leu Ala Lys Lys Tyr Thr His Leu Ser Cys Asp Lys Val Phe Cys

35 40 45

Gln Pro Trp Gln Arg Cys Ile Glu Gly Thr Cys Val Cys Lys Leu Pro

50 55 60

Tyr Gln Cys Pro Lys Asn Gly Thr Ala Val Cys Ala Thr Asn Arg Arg

65 70 75 80

Ser Phe Pro Thr Tyr Cys Gln Gln Lys Ser Leu Glu Cys Leu His Pro

85 90 95

Gly Thr Lys Phe Leu Asn Asn Gly Thr Cys Thr Ala Glu Gly Lys Phe

100 105 110

Ser Val Ser Leu Lys His Gly Asn Thr Asp Ser Glu Gly Ile Val Glu

115 120 125

Val Lys Leu Val Asp Gln Asp Lys Thr Met Phe Ile Cys Lys Ser Ser

130 135 140

Trp Ser Met Arg Glu Ala Asn Val Ala Cys Leu Asp Leu Gly Phe Gln

145 150 155 160

Gln Gly Ala Asp Thr Gln Arg Arg Phe Lys Leu Ser Asp Leu Ser Ile

165 170 175

Asn Ser Thr Glu Cys Leu His Val His Cys Arg Gly Leu Glu Thr Ser

180 185 190

Leu Ala Glu Cys Thr Phe Thr Lys Arg Arg Thr Met Gly Tyr Gln Asp

195 200 205

Phe Ala Asp Val Val Cys Tyr Thr Gln Lys Ala Asp Ser Pro Met Asp

210 215 220

Asp Phe Phe Gln Cys Val Asn Gly Lys Tyr Ile Ser Gln Met Lys Ala

225 230 235 240

Cys Asp Gly Ile Asn Asp Cys Gly Asp Gln Ser Asp Glu Leu Cys Cys

245 250 255

Lys Ala Cys Gln Gly Lys Gly Phe His Cys Lys Ser Gly Val Cys Ile

260 265 270

Pro Ser Gln Tyr Gln Cys Asn Gly Glu Val Asp Cys Ile Thr Gly Glu

275 280 285

Asp Glu Val Gly Cys Ala Gly Phe Ala Ser Val Thr Gln Glu Glu Thr

290 295 300

Glu Ile Leu Thr Ala Asp Met Asp Ala Glu Arg Arg Arg Ile Lys Ser

305 310 315 320

Leu Leu Pro Lys Leu Ser Cys Gly Val Lys Asn Arg Met His Ile Arg

325 330 335

Arg Lys Arg Ile Val Gly Gly Lys Arg Ala Gln Leu Gly Asp Leu Pro

340 345 350

Trp Gln Val Ala Ile Lys Asp Ala Ser Gly Ile Thr Cys Gly Gly Ile

355 360 365

Tyr Ile Gly Gly Cys Trp Ile Leu Thr Ala Ala His Cys Leu Arg Ala

370 375 380

Ser Lys Thr His Arg Tyr Gln Ile Trp Thr Thr Val Val Asp Trp Ile

385 390 395 400

His Pro Asp Leu Lys Arg Ile Val Ile Glu Tyr Val Asp Arg Ile Ile

405 410 415

Phe His Glu Asn Tyr Asn Ala Gly Thr Tyr Gln Asn Asp Ile Ala Leu

420 425 430

Ile Glu Met Lys Lys Asp Gly Asn Lys Lys Asp Cys Glu Leu Pro Arg

435 440 445

Ser Ile Pro Ala Cys Val Pro Trp Ser Pro Tyr Leu Phe Gln Pro Asn

450 455 460

Asp Thr Cys Ile Val Ser Gly Trp Gly Arg Glu Lys Asp Asn Glu Arg

465 470 475 480

Val Phe Ser Leu Gln Trp Gly Glu Val Lys Leu Ile Ser Asn Cys Ser

485 490 495

Lys Phe Tyr Gly Asn Arg Phe Tyr Glu Lys Glu Met Glu Cys Ala Gly

500 505 510

Thr Tyr Asp Gly Ser Ile Asp Ala Cys Lys Gly Asp Ser Gly Gly Pro

515 520 525

Leu Val Cys Met Asp Ala Asn Asn Val Thr Tyr Val Trp Gly Val Val

530 535 540

Ser Trp Gly Glu Asn Cys Gly Lys Pro Glu Phe Pro Gly Val Tyr Thr

545 550 555 560

Lys Val Ala Asn Tyr Phe Asp Trp Ile Ser Tyr His Val Gly Arg Pro

565 570 575

Phe Ile Ser Gln Tyr Asn Val

580

<210> 44

<211> 565

<212> PRT

<213> 智人

<400> 44

Lys Val Thr Tyr Thr Ser Gln Glu Asp Leu Val Glu Lys Lys Cys Leu

1 5 10 15

Ala Lys Lys Tyr Thr His Leu Ser Cys Asp Lys Val Phe Cys Gln Pro

20 25 30

Trp Gln Arg Cys Ile Glu Gly Thr Cys Val Cys Lys Leu Pro Tyr Gln

35 40 45

Cys Pro Lys Asn Gly Thr Ala Val Cys Ala Thr Asn Arg Arg Ser Phe

50 55 60

Pro Thr Tyr Cys Gln Gln Lys Ser Leu Glu Cys Leu His Pro Gly Thr

65 70 75 80

Lys Phe Leu Asn Asn Gly Thr Cys Thr Ala Glu Gly Lys Phe Ser Val

85 90 95

Ser Leu Lys His Gly Asn Thr Asp Ser Glu Gly Ile Val Glu Val Lys

100 105 110

Leu Val Asp Gln Asp Lys Thr Met Phe Ile Cys Lys Ser Ser Trp Ser

115 120 125

Met Arg Glu Ala Asn Val Ala Cys Leu Asp Leu Gly Phe Gln Gln Gly

130 135 140

Ala Asp Thr Gln Arg Arg Phe Lys Leu Ser Asp Leu Ser Ile Asn Ser

145 150 155 160

Thr Glu Cys Leu His Val His Cys Arg Gly Leu Glu Thr Ser Leu Ala

165 170 175

Glu Cys Thr Phe Thr Lys Arg Arg Thr Met Gly Tyr Gln Asp Phe Ala

180 185 190

Asp Val Val Cys Tyr Thr Gln Lys Ala Asp Ser Pro Met Asp Asp Phe

195 200 205

Phe Gln Cys Val Asn Gly Lys Tyr Ile Ser Gln Met Lys Ala Cys Asp

210 215 220

Gly Ile Asn Asp Cys Gly Asp Gln Ser Asp Glu Leu Cys Cys Lys Ala

225 230 235 240

Cys Gln Gly Lys Gly Phe His Cys Lys Ser Gly Val Cys Ile Pro Ser

245 250 255

Gln Tyr Gln Cys Asn Gly Glu Val Asp Cys Ile Thr Gly Glu Asp Glu

260 265 270

Val Gly Cys Ala Gly Phe Ala Ser Val Thr Gln Glu Glu Thr Glu Ile

275 280 285

Leu Thr Ala Asp Met Asp Ala Glu Arg Arg Arg Ile Lys Ser Leu Leu

290 295 300

Pro Lys Leu Ser Cys Gly Val Lys Asn Arg Met His Ile Arg Arg Lys

305 310 315 320

Arg Ile Val Gly Gly Lys Arg Ala Gln Leu Gly Asp Leu Pro Trp Gln

325 330 335

Val Ala Ile Lys Asp Ala Ser Gly Ile Thr Cys Gly Gly Ile Tyr Ile

340 345 350

Gly Gly Cys Trp Ile Leu Thr Ala Ala His Cys Leu Arg Ala Ser Lys

355 360 365

Thr His Arg Tyr Gln Ile Trp Thr Thr Val Val Asp Trp Ile His Pro

370 375 380

Asp Leu Lys Arg Ile Val Ile Glu Tyr Val Asp Arg Ile Ile Phe His

385 390 395 400

Glu Asn Tyr Asn Ala Gly Thr Tyr Gln Asn Asp Ile Ala Leu Ile Glu

405 410 415

Met Lys Lys Asp Gly Asn Lys Lys Asp Cys Glu Leu Pro Arg Ser Ile

420 425 430

Pro Ala Cys Val Pro Trp Ser Pro Tyr Leu Phe Gln Pro Asn Asp Thr

435 440 445

Cys Ile Val Ser Gly Trp Gly Arg Glu Lys Asp Asn Glu Arg Val Phe

450 455 460

Ser Leu Gln Trp Gly Glu Val Lys Leu Ile Ser Asn Cys Ser Lys Phe

465 470 475 480

Tyr Gly Asn Arg Phe Tyr Glu Lys Glu Met Glu Cys Ala Gly Thr Tyr

485 490 495

Asp Gly Ser Ile Asp Ala Cys Lys Gly Asp Ser Gly Gly Pro Leu Val

500 505 510

Cys Met Asp Ala Asn Asn Val Thr Tyr Val Trp Gly Val Val Ser Trp

515 520 525

Gly Glu Asn Cys Gly Lys Pro Glu Phe Pro Gly Val Tyr Thr Lys Val

530 535 540

Ala Asn Tyr Phe Asp Trp Ile Ser Tyr His Val Gly Arg Pro Phe Ile

545 550 555 560

Ser Gln Tyr Asn Val

565

<210> 45

<211> 54

<212> DNA

<213> 智人

<400> 45

atgaagcttc ttcatgtttt cctgttattt ctgtgcttcc acttaaggtt ttgc 54

<210> 46

<211> 18

<212> PRT

<213> 智人

<400> 46

Met Lys Leu Leu His Val Phe Leu Leu Phe Leu Cys Phe His Leu Arg

1 5 10 15

Phe Cys

<210> 47

<211> 185

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 47

gggcgactca gatcccagcc agtggactta gcccctgttt gctcctccga taactggggt 60

gaccttggtt aatattcacc agcagcctcc cccgttgccc ctctggatcc actgcttaaa 120

tacggacgag gacagggccc tgtctcctca gcttcaggca ccaccactga cctgggacag 180

tgaat 185

<210> 48

<211> 418

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 48

ggatcttgct accagtggaa cagccactaa ggattctgca gtgagagcag agggccagct 60

aagtggtact ctcccagaga ctgtctgact cacgccaccc cctccacctt ggacacagga 120

cgctgtggtt tctgagccag gtacaatgac tcctttcggt aagtgcagtg gaagctgtac 180

actgcccagg caaagcgtcc gggcagcgta ggcgggcgac tcagatccca gccagtggac 240

ttagcccctg tttgctcctc cgataactgg ggtgaccttg gttaatattc accagcagcc 300

tcccccgttg cccctctgga tccactgctt aaatacggac gaggacaggg ccctgtctcc 360

tcagcttcag gcaccaccac tgacctggga cagtgaatga tccccctgat ctgcggcc 418

<210> 49

<211> 117

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 49

ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60

tgaccttgga gctggggcag aggtcagaca cctctctggg cccatgccac ctccaac 117

<210> 50

<211> 321

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 50

tggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60

ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120

tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180

cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240

tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300

ggtttaggta gtgtgagagg g 321

<210> 51

<211> 334

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 51

ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60

tgaccttgga gctggggcag aggtcagaca cctctctggg cccatgccac ctccaactgg 120

acacaggacg ctgtggtttc tgagccaggg ggcgactcag atcccagcca gtggacttag 180

cccctgtttg ctcctccgat aactggggtg accttggtta atattcacca gcagcctccc 240

ccgttgcccc tctggatcca ctgcttaaat acggacgagg acagggccct gtctcctcag 300

cttcaggcac caccactgac ctgggacagt gaat 334

<210> 52

<211> 747

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 52

aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60

ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120

tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180

cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240

tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300

ggtttaggta gtgtgagagg ggtacccggg gatcttgcta ccagtggaac agccactaag 360

gattctgcag tgagagcaga gggccagcta agtggtactc tcccagagac tgtctgactc 420

acgccacccc ctccaccttg gacacaggac gctgtggttt ctgagccagg tacaatgact 480

cctttcggta agtgcagtgg aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag 540

gcgggcgact cagatcccag ccagtggact tagcccctgt ttgctcctcc gataactggg 600

gtgaccttgg ttaatattca ccagcagcct cccccgttgc ccctctggat ccactgctta 660

aatacggacg aggacagggc cctgtctcct cagcttcagg caccaccact gacctgggac 720

agtgaatgat ccccctgatc tgcggcc 747

<210> 53

<211> 145

<212> DNA

<213> 腺相关病毒2

<400> 53

ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60

cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120

gccaactcca tcactagggg ttcct 145

<210> 54

<211> 145

<212> DNA

<213> 腺相关病毒2

<400> 54

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60

ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120

gagcgcgcag agagggagtg gccaa 145

<210> 55

<211> 208

<212> DNA

<213> 牛

<400> 55

ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc 60

tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc 120

tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt 180

gggaagacaa tagcaggcat gctgggga 208

<210> 56

<211> 736

<212> PRT

<213> 腺相关病毒3B

<400> 56

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Val Pro Gln Pro

20 25 30

Lys Ala Asn Gln Gln His Gln Asp Asn Arg Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly

145 150 155 160

Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro

180 185 190

Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly Gly

195 200 205

Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr

260 265 270

Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His

275 280 285

Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp

290 295 300

Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile Gln Val

305 310 315 320

Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu

325 330 335

Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr

340 345 350

Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp

355 360 365

Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser

370 375 380

Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser

385 390 395 400

Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu

405 410 415

Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg

420 425 430

Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr

435 440 445

Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu Phe Ser

450 455 460

Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp Leu Pro

465 470 475 480

Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala Asn Asp Asn

485 490 495

Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His Leu Asn

500 505 510

Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys

515 520 525

Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile Phe Gly

530 535 540

Lys Glu Gly Thr Thr Ala Ser Asn Ala Glu Leu Asp Asn Val Met Ile

545 550 555 560

Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln

565 570 575

Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala Pro Thr

580 585 590

Thr Arg Thr Val Asn Asp Gln Gly Ala Leu Pro Gly Met Val Trp Gln

595 600 605

Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His

610 615 620

Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu

625 630 635 640

Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala

645 650 655

Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr

660 665 670

Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln

675 680 685

Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn

690 695 700

Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val

705 710 715 720

Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu

725 730 735

<210> 57

<211> 736

<212> PRT

<213> 人工序列

<220>

<223> 合成衣壳蛋白

<400> 57

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro

20 25 30

Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly

145 150 155 160

Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro

180 185 190

Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly Gly

195 200 205

Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr

260 265 270

Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His

275 280 285

Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp

290 295 300

Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile Gln Val

305 310 315 320

Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu

325 330 335

Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr

340 345 350

Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp

355 360 365

Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser

370 375 380

Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser

385 390 395 400

Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu

405 410 415

Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg

420 425 430

Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr

435 440 445

Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu Phe Ser

450 455 460

Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp Leu Pro

465 470 475 480

Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala Asn Asp Asn

485 490 495

Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His Leu Asn

500 505 510

Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys

515 520 525

Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile Phe Gly

530 535 540

Lys Glu Gly Thr Thr Ala Ser Asn Ala Glu Leu Asp Asn Val Met Ile

545 550 555 560

Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln

565 570 575

Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala Pro Thr

580 585 590

Thr Arg Thr Val Asn Asp Gln Gly Ala Leu Pro Gly Met Val Trp Gln

595 600 605

Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His

610 615 620

Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu

625 630 635 640

Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala

645 650 655

Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr

660 665 670

Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln

675 680 685

Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn

690 695 700

Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val

705 710 715 720

Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu

725 730 735

<210> 58

<211> 736

<212> PRT

<213> 人工序列

<220>

<223> 合成衣壳蛋白

<400> 58

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Ala Leu Gln Pro Gly Ala Pro Lys Pro

20 25 30

Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly

145 150 155 160

Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro

180 185 190

Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly Gly

195 200 205

Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr

260 265 270

Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His

275 280 285

Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp

290 295 300

Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile Gln Val

305 310 315 320

Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu

325 330 335

Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr

340 345 350

Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp

355 360 365

Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser

370 375 380

Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser

385 390 395 400

Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu

405 410 415

Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg

420 425 430

Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr

435 440 445

Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu Phe Ser

450 455 460

Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp Leu Pro

465 470 475 480

Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala Asn Asp Asn

485 490 495

Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His Leu Asn

500 505 510

Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys

515 520 525

Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile Phe Gly

530 535 540

Lys Glu Gly Thr Thr Ala Ser Asn Ala Glu Leu Asp Asn Val Met Ile

545 550 555 560

Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln

565 570 575

Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala Pro Thr

580 585 590

Thr Arg Thr Val Asn Asp Gln Gly Ala Leu Pro Gly Met Val Trp Gln

595 600 605

Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His

610 615 620

Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu

625 630 635 640

Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala

645 650 655

Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr

660 665 670

Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln

675 680 685

Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn

690 695 700

Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val

705 710 715 720

Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu

725 730 735

<210> 59

<211> 724

<212> PRT

<213> 腺相关病毒5

<400> 59

Met Ser Phe Val Asp His Pro Pro Asp Trp Leu Glu Glu Val Gly Glu

1 5 10 15

Gly Leu Arg Glu Phe Leu Gly Leu Glu Ala Gly Pro Pro Lys Pro Lys

20 25 30

Pro Asn Gln Gln His Gln Asp Gln Ala Arg Gly Leu Val Leu Pro Gly

35 40 45

Tyr Asn Tyr Leu Gly Pro Gly Asn Gly Leu Asp Arg Gly Glu Pro Val

50 55 60

Asn Arg Ala Asp Glu Val Ala Arg Glu His Asp Ile Ser Tyr Asn Glu

65 70 75 80

Gln Leu Glu Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp

85 90 95

Ala Glu Phe Gln Glu Lys Leu Ala Asp Asp Thr Ser Phe Gly Gly Asn

100 105 110

Leu Gly Lys Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro Phe

115 120 125

Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Thr Gly Lys Arg Ile

130 135 140

Asp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp Ser

145 150 155 160

Lys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser Gln

165 170 175

Gln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp Thr

180 185 190

Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly Ala

195 200 205

Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr Trp

210 215 220

Met Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu Pro

225 230 235 240

Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val Asp

245 250 255

Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr

260 265 270

Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp Gln

275 280 285

Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg Val

290 295 300

Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser Thr

305 310 315 320

Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp

325 330 335

Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly Cys

340 345 350

Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly Tyr

355 360 365

Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser Ser

370 375 380

Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly Asn

385 390 395 400

Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser Ser

405 410 415

Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val Asp

420 425 430

Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val Gln

435 440 445

Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn Trp

450 455 460

Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser Gly

465 470 475 480

Val Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met Glu

485 490 495

Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met Thr

500 505 510

Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met Ile

515 520 525

Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu Glu

530 535 540

Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn Arg

545 550 555 560

Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser Ser

565 570 575

Thr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val Pro

580 585 590

Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp

595 600 605

Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala Met

610 615 620

Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys Asn

625 630 635 640

Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val Ser

645 650 655

Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met Glu

660 665 670

Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln

675 680 685

Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro Asp

690 695 700

Ser Thr Gly Glu Tyr Arg Thr Thr Arg Pro Ile Gly Thr Arg Tyr Leu

705 710 715 720

Thr Arg Pro Leu

<210> 60

<211> 66

<212> DNA

<213> 猿猴病毒40

<400> 60

gtaaatataa aatttttaag tgtataatgt gttaaactac tgattctaat tgtttctctc 60

ttttag 66

<210> 61

<211> 659

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 61

gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60

catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120

acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180

ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240

aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300

ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 360

tagtcatcgc tattaccatg gtcgaggtga gccccacgtt ctgcttcact ctccccatct 420

cccccccctc cccaccccca attttgtatt tatttatttt ttaattattt tgtgcagcga 480

tgggggcggg gggggggggg gggcgcgcgc caggcggggc ggggcggggc gaggggcggg 540

gcggggcgag gcggagaggt gcggcggcag ccaatcagag cggcgcgctc cgaaagtttc 600

cttttatggc gaggcggcgg cggcggcggc cctataaaaa gcgaagcgcg cggcgggcg 659

<210> 62

<211> 588

<212> DNA

<213> 土拨鼠肝炎病毒

<400> 62

atcaacctct ggattacaaa atttgtgaaa gattgactgg tattcttaac tatgttgctc 60

cttttacgct atgtggatac gctgctttaa tgcctttgta tcatgctatt gcttcccgta 120

tggctttcat tttctcctcc ttgtataaat cctggttgct gtctctttat gaggagttgt 180

ggcccgttgt caggcaacgt ggcgtggtgt gcactgtgtt tgctgacgca acccccactg 240

gttggggcat tgccaccacc tgtcagctcc tttccgggac tttcgctttc cccctcccta 300

ttgccacggc ggaactcatc gccgcctgcc ttgcccgctg ctggacaggg gctcggctgt 360

tgggcactga caattccgtg gtgttgtcgg ggaaatcatc gtcctttcct tggctgctcg 420

cctgtgttgc cacctggatt ctgcgcggga cgtccttctg ctacgtccct tcggccctca 480

atccagcgga ccttccttcc cgcggcctgc tgccggctct gcggcctctt ccgcgtcttc 540

gccttcgccc tcagacgagt cggatctccc tttgggccgc ctccccgc 588

<210> 63

<211> 245

<212> DNA

<213> 土拨鼠肝炎病毒

<400> 63

aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60

ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120

atggctttca ttttctcctc cttgtataaa tcctggttag ttcttgccac ggcggaactc 180

atcgccgcct gccttgcccg ctgctggaca ggggctcggc tgttgggcac tgacaattcc 240

gtggt 245

<210> 64

<211> 589

<212> DNA

<213> 土拨鼠肝炎病毒

<400> 64

aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60

ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120

atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180

tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240

ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300

attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360

ttgggcactg acaattccgt ggtgttgtcg gggaaatcat cgtcctttcc ttggctgctc 420

gcctgtgttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480

aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540

cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589

<210> 65

<211> 119

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 65

cccagccagt ggacttagcc cctgtttgct cctccgataa ctggggtgac cttggttaat 60

attcaccagc agcctccccc tcagcttcag gcaccaccac tgacctggga cagtgaatc 119

<210> 66

<211> 119

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 66

cccagccagt ggacttagcc cctgtttgct cctccgataa ctggggtgac cttggttaat 60

attcaccagc agcctccccc tcagcttcag gcaccaccac tgacctggga cagtgaatc 119

<210> 67

<211> 747

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 67

aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60

ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120

tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180

cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240

tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300

ggtttaggta gtgtgagagg ggtacccggg gatcttgcta ccagtggaac agccactaag 360

gattctgcag tgagagcaga gggccagcta agtggtactc tcccagagac tgtctgactc 420

acgccacccc ctccaccttg gacacaggac gctgtggttt ctgagccagg tacaatgact 480

cctttcggta agtgcagtgg aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag 540

gcgggcgact cagatcccag ccagtggact tagcccctgt ttgctcctcc gataactggg 600

gtgaccttgg ttaatattca ccagcagcct cccccgttgc ccctctggat ccactgctta 660

aatacggacg aggacagggc cctgtctcct cagcttcagg caccaccact gacctgggac 720

agtgaatgat ccccctgatc tgcggcc 747

<210> 68

<211> 576

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 68

ggttaatttt taaaaagcag tcaaaagtcc aagtggccct tgcgagcatt tactctctct 60

gtttgctctg gttaataatc tcaggagcac aaacattcct ggaggcagga gaagaaatca 120

acatcctgga cttatcctct gggcctctcg tacccgggga tcttgctacc agtggaacag 180

ccactaagga ttctgcagtg agagcagagg gccagctaag tggtactctc ccagagactg 240

tctgactcac gccaccccct ccaccttgga cacaggacgc tgtggtttct gagccaggta 300

caatgactcc tttcggtaag tgcagtggaa gctgtacact gcccaggcaa agcgtccggg 360

cagcgtaggc gggcgactca gatcccagcc agtggactta gcccctgttt gctcctccga 420

taactggggt gaccttggtt aatattcacc agcagcctcc cccgttgccc ctctggatcc 480

actgcttaaa tacggacgag gacagggccc tgtctcctca gcttcaggca ccaccactga 540

cctgggacag tgaatgatcc ccctgatctg cggccg 576

<210> 69

<211> 898

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 69

caggctcaga ggcacacagg agtttctggg ctcaccctgc ccccttccaa cccctcagtt 60

cccatcctcc agcagctgtt tgtgtgctgc ctctgaagtc cacactgaac aaacttcagc 120

ctactcatgt ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct 180

ccctgcctgc tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac 240

ctccaacatc cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg 300

tggtttaggt agtgtgagag gggggttaat ttttaaaaag cagtcaaaag tccaagtggc 360

ccttgcgagc atttactctc tctgtttgct ctggttaata atctcaggag cacaaacatt 420

cctggaggca ggagaagaaa tcaacatcct ggacttatcc tctgggcctc tctacccggg 480

gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga gggccagcta 540

agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg gacacaggac 600

gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg aagctgtaca 660

ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact 720

tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct 780

cccccgttgc ccctctggat ccactgctta aatacggacg aggacagggc cctgtctcct 840

cagcttcagg caccaccact gacctgggac agtgaatgat ccccctgatc tgcggccg 898

<210> 70

<211> 898

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 70

ggttaatttt taaaaagcag tcaaaagtcc aagtggccct tgcgagcatt tactctctct 60

gtttgctctg gttaataatc tcaggagcac aaacattcct ggaggcagga gaagaaatca 120

acatcctgga cttatcctct gggcctctcc aggctcagag gcacacagga gtttctgggc 180

tcaccctgcc cccttccaac ccctcagttc ccatcctcca gcagctgttt gtgtgctgcc 240

tctgaagtcc acactgaaca aacttcagcc tactcatgtc cctaaaatgg gcaaacattg 300

caagcagcaa acagcaaaca cacagccctc cctgcctgct gaccttggag ctggggcaga 360

ggtcagagac ctctctgggc ccatgccacc tccaacatcc actcgacccc ttggaatttc 420

ggtggagagg agcagaggtt gtcctggcgt ggtttaggta gtgtgagagg ggtacccggg 480

gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga gggccagcta 540

agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg gacacaggac 600

gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg aagctgtaca 660

ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact 720

tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct 780

cccccgttgc ccctctggat ccactgctta aatacggacg aggacagggc cctgtctcct 840

cagcttcagg caccaccact gacctgggac agtgaatgat ccccctgatc tgcggccg 898

<210> 71

<211> 573

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 71

tgcctccccg tgttcctgct ctttgtccct ctgtcctact tagactaata tttgccttgg 60

gtactgcaaa caggaaatgg gggagggaca ggaggttaat ttttaaaaag cagtcaaaag 120

tccaagtggc ccttgcgagc atttactctc tctgtttgct ctggttaata atctcaggag 180

cacaaacatt cctggaggca ggagaagaaa tcaacatcct ggacttatcc tctgggcctc 240

tcgtacccgg ggatcttgct accagtggaa cagccactaa ggattctgca gtgagagcag 300

agggccagct aagtggtact ctcccagaga ctgtctgact cacgccaccc cctccacctt 360

ggacacagga cgctgtggtt tctgagccag gtacaatgac tcctttcggt aagtgcagtg 420

gaagctgtac actgcccagg caaagcgtcc gggcagcgta ggcgggcgac tcagatccca 480

gccagtggac ttagcccctg tttgctcctc cgataactgg ggtgaccttg gttaatattc 540

accagcagcc tcccccgttg cccctctgga tcc 573

<210> 72

<211> 1618

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 72

cacaattttt atagacttct catcatgttt tttttttcca atatttgccc tcccctttct 60

accttgacct agtagggagg tgtttattca acacctctga ttggctcata aacaaccagt 120

ccttaaaatc atgccaggct cagaggcaca caggagtttc tgggctcacc ctgccccctt 180

ccaacccctc agttcccatc ctccagcagc tgtttgtgtg ctgcctctga agtccacact 240

gaacaaactt cagcctactc atgtccctaa aatgggcaaa cattgcaagc agcaaacagc 300

aaacacacag ccctccctgc ctgctgacct tggagctggg gcagaggtca gagacctctc 360

tgggcccatg ccacctccaa catccactcg accccttgga atttcggtgg agaggagcag 420

aggttgtcct ggcgtggttt aggtagtgtg agagggggtt aatttttaaa aagcagtcaa 480

aagtccaagt ggcccttgcg agcatttact ctctctgttt gctctggtta ataatctcag 540

gagcacaaac attcctggag gcaggagaag aaatcaacat cctggactta tcctctgggc 600

ctctcgggat tcaaattctg cttagctaac ccaatgttgt gagttaatgc ttgtctactt 660

gggcagaagt accttgcaaa attatctagg tagcatgtga tagaaccagg attcaaaccc 720

aggtgtgtct gacctcaaag tgtggggact ttccactcta ctgctgctaa tttttttcta 780

aaaataatac ttccgggtgc agagtttaat cttctttgtc caaggtactg tggtaagcac 840

cttatgtaca ttgtctaagt taatccccac aacattttga gaaatcccca ttttgagata 900

ggagaactga ggctcacaat atttcagtga ctggcccaag gtcacagttg ttaaatggag 960

gagctggtat tgaaaaccag gtacgtgtgg ctctaagacc agtgtaatag ttgtgttttg 1020

tttttccttg cttccttctt tacttgcctt catttctagc ttacactggc atgattcatc 1080

tcagtgggca atatccttac cttgaatggt ggtttctttg tttgttcctg caagaggagc 1140

acctccttgg tctaactgtg gatacaaata attaacaggt gtcagatgtc agtacccggg 1200

gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga gggccagcta 1260

agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg gacacaggac 1320

gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg aagctgtaca 1380

ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact 1440

tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct 1500

cccccgttgc ccctctggat ccactgctta aatacggacg aggacagggc cctgtctcct 1560

cagcttcagg caccaccact gacctgggac agtgaatgat ccccctgatc tgcggccg 1618

<210> 73

<211> 1363

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 73

ggaggggtgt taattaaaag cttgatatgg gattcaaatt ctgcttagct aacccaatgt 60

tgtgagttaa tgcttgtcta cttgggcaga agtaccttgc aaaattatct aggtagcatg 120

tgatagaacc aggattcaaa cccaggtgtg tctgacctca aagtgtgggg actttccact 180

ctactgctgc taattttttt ctaaaaataa tacttccggg tgcagagttt aatcttcttt 240

gtccaaggta ctgtggtaag caccttatgt acattgtcta agttaatccc cacaacattt 300

tgagaaatcc ccattttgag ataggagaac tgaggctcac aatatttcag tgactggccc 360

aaggtcacag ttgttaaatg gaggagctgg tattgaaaac caggtacgtg tggctctaag 420

accagtgtaa tagttgtgtt ttgtttttcc ttgcttcctt ctttacttgc cttcatttct 480

agcttacact ggcatgattc atctcagtgg gcaatatcct taccttgaat ggtggtttct 540

ttgtttgttc ctgcaagagg agcacctcct tggtctaact gtggatacaa ataattaaca 600

ggtgtcagat gtcatgcctc cccgtgttcc tgctctttgt ccctctgtcc tacttagact 660

aatatttgcc ttgggtactg caaacaggaa atgggggagg gacaggaccc agccagtgga 720

cttagcccct gtttgctcct ccgataactg gggtgacctt ggttaatatt caccagcagc 780

ctcccccggt taatttttaa aaagcagtca aaagtccaag tggcccttgc gagcatttac 840

tctctctgtt tgctctggtt aataatctca ggagcacaaa cattcctgga ggcaggagaa 900

gaaatcaaca tcctggactt atcctctggg cctctcgtac ccggggatct tgctaccagt 960

ggaacagcca ctaaggattc tgcagtgaga gcagagggcc agctaagtgg tactctccca 1020

gagactgtct gactcacgcc accccctcca ccttggacac aggacgctgt ggtttctgag 1080

ccaggtacaa tgactccttt cggtaagtgc agtggaagct gtacactgcc caggcaaagc 1140

gtccgggcag cgtaggcggg cgactcagat cccagccagt ggacttagcc cctgtttgct 1200

cctccgataa ctggggtgac cttggttaat attcaccagc agcctccccc gttgcccctc 1260

tggatccact gcttaaatac ggacgaggac agggccctgt ctcctcagct tcaggcacca 1320

ccactgacct gggacagtga atgatccccc tgatctgcgg ccg 1363

<210> 74

<211> 1484

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 74

gggattcaaa ttctgcttag ctaacccaat gttgtgagtt aatgcttgtc tacttgggca 60

gaagtacctt gcaaaattat ctaggtagca tgtgatagaa ccaggattca aacccaggtg 120

tgtctgacct caaagtgtgg ggactttcca ctctactgct gctaattttt ttctaaaaat 180

aatacttccg ggtgcagagt ttaatcttct ttgtccaagg tactgtggta agcaccttat 240

gtacattgtc taagttaatc cccacaacat tttgagaaat ccccattttg agataggaga 300

actgaggctc acaatatttc agtgactggc ccaaggtcac agttgttaaa tggaggagct 360

ggtattgaaa accaggtacg tgtggctcta agaccagtgt aatagttgtg ttttgttttt 420

ccttgcttcc ttctttactt gccttcattt ctagcttaca ctggcatgat tcatctcagt 480

gggcaatatc cttaccttga atggtggttt ctttgtttgt tcctgcaaga ggagcacctc 540

cttggtctaa ctgtggatac aaataattaa caggtgtcag atgtcacagg ctcagaggca 600

cacaggagtt tctgggctca ccctgccccc ttccaacccc tcagttccca tcctccagca 660

gctgtttgtg tgctgcctct gaagtccaca ctgaacaaac ttcagcctac tcatgtccct 720

aaaatgggca aacattgcaa gcagcaaaca gcaaacacac agccctccct gcctgctgac 780

cttggagctg gggcagaggt cagagacctc tctgggccca tgccacctcc aacatccact 840

cgaccccttg gaatttcggt ggagaggagc agaggttgtc ctggcgtggt ttaggtagtg 900

tgagaggggg ttaattttta aaaagcagtc aaaagtccaa gtggcccttg cgagcattta 960

ctctctctgt ttgctctggt taataatctc aggagcacaa acattcctgg aggcaggaga 1020

agaaatcaac atcctggact tatcctctgg gcctctcgta cccggggatc ttgctaccag 1080

tggaacagcc actaaggatt ctgcagtgag agcagagggc cagctaagtg gtactctccc 1140

agagactgtc tgactcacgc caccccctcc accttggaca caggacgctg tggtttctga 1200

gccaggtaca atgactcctt tcggtaagtg cagtggaagc tgtacactgc ccaggcaaag 1260

cgtccgggca gcgtaggcgg gcgactcaga tcccagccag tggacttagc ccctgtttgc 1320

tcctccgata actggggtga ccttggttaa tattcaccag cagcctcccc cgttgcccct 1380

ctggatccac tgcttaaata cggacgagga cagggccctg tctcctcagc ttcaggcacc 1440

accactgacc tgggacagtg aatgatcccc ctgatctgcg gccg 1484

<210> 75

<211> 903

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 75

ggttaatttt taaaaagcag tcaaaagtcc aagtggccct tgcgagcatt tactctctct 60

gtttgctctg gttaataatc tcaggagcac aaacattcct ggaggcagga gaagaaatca 120

acatcctgga cttatcctct gggcctctcc aggctcagag gcacacagga gtttctgggc 180

tcaccctgcc cccttccaac ccctcagttc ccatcctcca gcagctgttt gtgtgctgcc 240

tctgaagtcc acactgaaca aacttcagcc tactcatgtc cctaaaatgg gcaaacattg 300

caagcagcaa acagcaaaca cacagccctc cctgcctgct gaccttggag ctggggcaga 360

ggtcagagac ctctctgggc ccatgccacc tccaacatcc actcgacccc ttggaatttc 420

ggtggagagg agcagaggtt gtcctggcgt ggtttaggta gtgtgagagg ggtacccggg 480

gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga gggccagcta 540

agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg gacacaggac 600

gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg aagctgtaca 660

ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact 720

tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct 780

cccccgttgc ccctctggat ccactgctta aatacggata taaacgagga cagggccctg 840

tctcctcagc ttcaggcacc accactgacc tgggacagtg aatgatcccc ctgatctgcg 900

gcc 903

<210> 76

<211> 933

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 76

ggttaatttt taaaaagcag tcaaaagtcc aagtggccct tgcgagcatt tactctctct 60

gtttgctctg gttaataatc tcaggagcac aaacattcct ggaggcagga gaagaaatca 120

acatcctgga cttatcctct gggcctctct tattgatatt ccaggctcag aggcacacag 180

gagtttctgg gctcaccctg cccccttcca acccctcagt tcccatcctc cagcagctgt 240

ttgtgtgctg cctctgaagt ccacactgaa caaacttcag cctactcatg tccctaaaat 300

gggcaaacat tgcaagcagc aaacagcaaa cacacagccc tccctgcctg ctgaccttgg 360

agctggggca gaggtcagag acctctctgg gcccatgcca cctccaacat ccactcgacc 420

ccttggaatt tcggtggaga ggagcagagg ttgtcctggc gtggtttagg tagtgtgaga 480

gggtggccct tgcgtacccg gggatcttgc taccagtgga acagccacta aggattctgc 540

agtgagagca gagggccagc taagtggtac tctcccagag actgtctgac tcacgccacc 600

ccctccacct tggacacagg acgctgtggt ttctgagcca ggtacaatga ctcctttcgg 660

taagtgcagt ggaagctgta cactgcccag gcaaagcgtc cgggcagcgt aggcgggcga 720

ctcagatccc atataaagcc agtggactta gcccctgttt gctcctccga taactggggt 780

gaccttggtt aatattcacc agcagcctcc ccctattgat tgttgcccct ctggatccac 840

tgcttaaata cggacgagga cagggccctg tctcctcagc ttcaggcacc accactgacc 900

tgggacagtg aatgatcccc ctgatctgcg gcc 933

<210> 77

<211> 943

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 77

ggttaatttt taaaaagcag tcaaaagtcc aagtggccct tgcgagcatt tactctctct 60

gtttgctctg gttaataatc tcaggagcac aaacattcct ggaggcagga gaagaaatca 120

acatcctgga cttatcctct gggcctctct tattgatatt ccaggctcag aggcacacag 180

gagtttctgg gctcaccctg cccccttcca acccctcagt tcccatcctc cagcagctgt 240

ttgtgtgctg cctctgaagt ccacactgaa caaacttcag cctactcatg tccctaaaat 300

gggcaaacat tgcaagcagc aaacagcaaa cacacagccc tccctgcctg ctgaccttgg 360

agctggggca gaggtcagag acctctctgg gcccatgcca cctccaacat ccactcgacc 420

ccttggaatt tcggtggaga ggagcagagg ttgtcctggc gtggtttagg tagtgtgaga 480

ggggttaata atctggccct tgcgtacccg gggatcttgc taccagtgga acagccacta 540

aggattctgc agtgagagca gagggccagc taagtggtac tctcccagag actgtctgac 600

tcacgccacc ccctccacct tggacacagg acgctgtggt ttctgagcca ggtacaatga 660

ctcctttcgg taagtgcagt ggaagctgta cactgcccag gcaaagcgtc cgggcagcgt 720

aggcgggcga ctcagatccc atataaagcc agtggactta gcccctgttt gctcctccga 780

taactggggt gaccttggtt aatattcacc agcagcctcc ccctattgat tgttgcccct 840

ctggatccac tgcttaaata cggacgagga cagggccctg tctcctcagc ttcaggcacc 900

accactgacc tgggacagtg aatgatcccc ctgatctgcg gcc 943

<210> 78

<211> 913

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 78

ggttaatttt taaaaagcag tcaaaagtcc aagtggccct tgcgagcatt tactctctct 60

gtttgctctg gttaataatc tcaggagcac aaacattcct ggaggcagga gaagaaatca 120

acatcctgga cttatcctct gggcctctcc aggctcagag gcacacagga gtttctgggc 180

tcaccctgcc cccttccaac ccctcagttc ccatcctcca gcagctgttt gtgtgctgcc 240

tctgaagtcc acactgaaca aacttcagcc tactcatgtc cctaaaatgg gcaaacattg 300

caagcagcaa acagcaaaca cacagccctc cctgcctgct gaccttggag ctggggcaga 360

ggtcagagac ctctctgggc ccatgccacc tccaacatcc actcgacccc ttggaatttc 420

ggtggagagg agcagaggtt gtcctggcgt ggtttaggta gtgtgagagg gctgtttgct 480

cgtacccggg gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga 540

gggccagcta agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg 600

gacacaggac gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg 660

aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccat 720

ataaagccag tggacttagc ccctgtttgc tcctccgata actggggtga ccttggttaa 780

tattcaccag cagcctcccc cgttgcccct ctggatccac tgcttaaata cggacgagga 840

cagggccctg tctcctcagc ttcaggcacc accactgacc tgggacagtg aatgatcccc 900

ctgatctgcg gcc 913

<210> 79

<211> 915

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 79

ggttaatttt taaaaagcag tcaaaagtcc aagtggccct tgcgagcatt tactctctct 60

gtttgctctg gttaataatc tcaggagcac aaacattcct ggaggcagga gaagaaatca 120

acatcctgga cttatcctct gggcctctct tattgatatt ccaggctcag aggcacacag 180

gagtttctgg gctcaccctg cccccttcca acccctcagt tcccatcctc cagcagctgt 240

ttgtgtgctg cctctgaagt ccacactgaa caaacttcag cctactcatg tccctaaaat 300

gggcaaacat tgcaagcagc aaacagcaaa cacacagccc tccctgcctg ctgaccttgg 360

agctggggca gaggtcagag acctctctgg gcccatgcca cctccaacat ccactcgacc 420

ccttggaatt tcggtggaga ggagcagagg ttgtcctggc gtggtttagg tagtgtgaga 480

ggggtacccg gggatcttgc taccagtgga acagccacta aggattctgc agtgagagca 540

gagggccagc taagtggtac tctcccagag actgtctgac tcacgccacc ccctccacct 600

tggacacagg acgctgtggt ttctgagcca ggtacaatga ctcctttcgg taagtgcagt 660

ggaagctgta cactgcccag gcaaagcgtc cgggcagcgt aggcgggcga ctcagatccc 720

atataaagcc agtggactta gcccctgttt gctcctccga taactggggt gaccttggtt 780

aatattcacc agcagcctcc cccgttgccc ctctggatcc actgcttaaa tacggacgag 840

gacagggccc tgtctcctca gcttcaggca ccaccactga cctgggacag tgaatgatcc 900

ccctgatctg cggcc 915

<210> 80

<211> 909

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 80

ggttaatttt taaaaagcag tcaaaagtcc aagtggccct tgcgagcatt tactctctct 60

gtttgctctg gttaataatc tcaggagcac aaacattcct ggaggcagga gaagaaatca 120

acatcctgga cttatcctct gggcctctct tattgatatt ccaggctcag aggcacacag 180

gagtttctgg gctcaccctg cccccttcca acccctcagt tcccatcctc cagcagctgt 240

ttgtgtgctg cctctgaagt ccacactgaa caaacttcag cctactcatg tccctaaaat 300

gggcaaacat tgcaagcagc aaacagcaaa cacacagccc tccctgcctg ctgaccttgg 360

agctggggca gaggtcagag acctctctgg gcccatgcca cctccaacat ccactcgacc 420

ccttggaatt tcggtggaga ggagcagagg ttgtcctggc gtggtttagg tagtgtgaga 480

ggggtacccg gggatcttgc taccagtgga acagccacta aggattctgc agtgagagca 540

gagggccagc taagtggtac tctcccagag actgtctgac tcacgccacc ccctccacct 600

tggacacagg acgctgtggt ttctgagcca ggtacaatga ctcctttcgg taagtgcagt 660

ggaagctgta cactgcccag gcaaagcgtc cgggcagcgt aggcgggcga ctcagatccc 720

agccagtgga cttagcccct gtttgctcct ccgataactg gggtgacctt ggttaatatt 780

caccagcagc ctcccccgtt gcccctctgg atccactgct taaatacgga cgaggacagg 840

gccctgtctc ctcagcttca ggcaccacca ctgacctggg acagtgaatg atccccctga 900

tctgcggcc 909

<210> 81

<211> 907

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 81

ggttaatttt taaaaagcag tcaaaagtcc aagtggccct tgcgagcatt tactctctct 60

gtttgctctg gttaataatc tcaggagcac aaacattcct ggaggcagga gaagaaatca 120

acatcctgga cttatcctct gggcctctct ggcccttgcc aggctcagag gcacacagga 180

gtttctgggc tcaccctgcc cccttccaac ccctcagttc ccatcctcca gcagctgttt 240

gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc tactcatgtc cctaaaatgg 300

gcaaacattg caagcagcaa acagcaaaca cacagccctc cctgcctgct gaccttggag 360

ctggggcaga ggtcagagac ctctctgggc ccatgccacc tccaacatcc actcgacccc 420

ttggaatttc ggtggagagg agcagaggtt gtcctggcgt ggtttaggta gtgtgagagg 480

ggtacccggg gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga 540

gggccagcta agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg 600

gacacaggac gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg 660

aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag 720

ccagtggact tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca 780

ccagcagcct cccccgttgc ccctctggat ccactgctta aatacggacg aggacagggc 840

cctgtctcct cagcttcagg caccaccact gacctgggac agtgaatgat ccccctgatc 900

tgcggcc 907

<210> 82

<211> 909

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 82

ggttaatttt taaaaagcag tcaaaagtcc aagtggccct tgcgagcatt tactctctct 60

gtttgctctg gttaataatc tcaggagcac aaacattcct ggaggcagga gaagaaatca 120

acatcctgga cttatcctct gggcctctcc aggctcagag gcacacagga gtttctgggc 180

tcaccctgcc cccttccaac ccctcagttc ccatcctcca gcagctgttt gtgtgctgcc 240

tctgaagtcc acactgaaca aacttcagcc tactcatgtc cctaaaatgg gcaaacattg 300

caagcagcaa acagcaaaca cacagccctc cctgcctgct gaccttggag ctggggcaga 360

ggtcagagac ctctctgggc ccatgccacc tccaacatcc actcgacccc ttggaatttc 420

ggtggagagg agcagaggtt gtcctggcgt ggtttaggta gtgtgagagg gttattgata 480

ttcgtacccg gggatcttgc taccagtgga acagccacta aggattctgc agtgagagca 540

gagggccagc taagtggtac tctcccagag actgtctgac tcacgccacc ccctccacct 600

tggacacagg acgctgtggt ttctgagcca ggtacaatga ctcctttcgg taagtgcagt 660

ggaagctgta cactgcccag gcaaagcgtc cgggcagcgt aggcgggcga ctcagatccc 720

agccagtgga cttagcccct gtttgctcct ccgataactg gggtgacctt ggttaatatt 780

caccagcagc ctcccccgtt gcccctctgg atccactgct taaatacgga cgaggacagg 840

gccctgtctc ctcagcttca ggcaccacca ctgacctggg acagtgaatg atccccctga 900

tctgcggcc 909

<210> 83

<211> 907

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 83

ggttaatttt taaaaagcag tcaaaagtcc aagtggccct tgcgagcatt tactctctct 60

gtttgctctg gttaataatc tcaggagcac aaacattcct ggaggcagga gaagaaatca 120

acatcctgga cttatcctct gggcctctcc aggctcagag gcacacagga gtttctgggc 180

tcaccctgcc cccttccaac ccctcagttc ccatcctcca gcagctgttt gtgtgctgcc 240

tctgaagtcc acactgaaca aacttcagcc tactcatgtc cctaaaatgg gcaaacattg 300

caagcagcaa acagcaaaca cacagccctc cctgcctgct gaccttggag ctggggcaga 360

ggtcagagac ctctctgggc ccatgccacc tccaacatcc actcgacccc ttggaatttc 420

ggtggagagg agcagaggtt gtcctggcgt ggtttaggta gtgtgagagg gtggcccttg 480

cgtacccggg gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga 540

gggccagcta agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg 600

gacacaggac gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg 660

aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag 720

ccagtggact tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca 780

ccagcagcct cccccgttgc ccctctggat ccactgctta aatacggacg aggacagggc 840

cctgtctcct cagcttcagg caccaccact gacctgggac agtgaatgat ccccctgatc 900

tgcggcc 907

<210> 84

<211> 907

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 84

ggttaatttt taaaaagcag tcaaaagtcc aagtggccct tgcgagcatt tactctctct 60

gtttgctctg gttaataatc tcaggagcac aaacattcct ggaggcagga gaagaaatca 120

acatcctgga cttatcctct gggcctctcc aggctcagag gcacacagga gtttctgggc 180

tcaccctgcc cccttccaac ccctcagttc ccatcctcca gcagctgttt gtgtgctgcc 240

tctgaagtcc acactgaaca aacttcagcc tactcatgtc cctaaaatgg gcaaacattg 300

caagcagcaa acagcaaaca catggccctt gccagccctc cctgcctgct gaccttggag 360

ctggggcaga ggtcagagac ctctctgggc ccatgccacc tccaacatcc actcgacccc 420

ttggaatttc ggtggagagg agcagaggtt gtcctggcgt ggtttaggta gtgtgagagg 480

ggtacccggg gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga 540

gggccagcta agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg 600

gacacaggac gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg 660

aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag 720

ccagtggact tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca 780

ccagcagcct cccccgttgc ccctctggat ccactgctta aatacggacg aggacagggc 840

cctgtctcct cagcttcagg caccaccact gacctgggac agtgaatgat ccccctgatc 900

tgcggcc 907

<210> 85

<211> 913

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 85

ggttaatttt taaaaagcag tcaaaagtcc aagtggccct tgcgagcatt tactctctct 60

gtttgctctg gttaataatc tcaggagcac aaacattcct ggaggcagga gaagaaatca 120

acatcctgga cttatcctct gggcctctcc aggctcagag gcacacagga gtttctgggc 180

tcaccctgcc cccttccaac ccctcagttc ccatcctcca gcagctgttt gtgtgctgcc 240

tctgaagtcc acactgaaca aacttcagcc tactcatgtc cctaaaatgg gcaaacattg 300

caagcagcaa acagcaaaca cacagccctc cctgcctgct gaccttggag ctggggcaga 360

ggtcagagac ctctctgggc ccatgccacc tccaacatcc actcgacccc ttggaatttc 420

ggtggagagg agcagaggtt gtcctggcgt ggtttaggta gtgtgagagg ggtacccggg 480

gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga gggccagcta 540

agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg gacacaggac 600

gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg aagctgtaca 660

ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact 720

tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct 780

ccccctatat aaatattgat tgttgcccct ctggatccac tgcttaaata cggacgagga 840

cagggccctg tctcctcagc ttcaggcacc accactgacc tgggacagtg aatgatcccc 900

ctgatctgcg gcc 913

<210> 86

<211> 919

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 86

ggttaatttt taaaaagcag tcaaaagtcc aagtggccct tgcgagcatt tactctctct 60

gtttgctctg gttaataatc tcaggagcac aaacattcct ggaggcagga gaagaaatca 120

acatcctgga cttatcctct gggcctctct tattgatatt ccaggctcag aggcacacag 180

gagtttctgg gctcaccctg cccccttcca acccctcagt tcccatcctc cagcagctgt 240

ttgtgtgctg cctctgaagt ccacactgaa caaacttcag cctactcatg tccctaaaat 300

gggcaaacat tgcaagcagc aaacagcaaa cacacagccc tccctgcctg ctgaccttgg 360

agctggggca gaggtcagag acctctctgg gcccatgcca cctccaacat ccactcgacc 420

ccttggaatt tcggtggaga ggagcagagg ttgtcctggc gtggtttagg tagtgtgaga 480

gggtggccct tgcgtacccg gggatcttgc taccagtgga acagccacta aggattctgc 540

agtgagagca gagggccagc taagtggtac tctcccagag actgtctgac tcacgccacc 600

ccctccacct tggacacagg acgctgtggt ttctgagcca ggtacaatga ctcctttcgg 660

taagtgcagt ggaagctgta cactgcccag gcaaagcgtc cgggcagcgt aggcgggcga 720

ctcagatccc agccagtgga cttagcccct gtttgctcct ccgataactg gggtgacctt 780

ggttaatatt caccagcagc ctcccccgtt gcccctctgg atccactgct taaatacgga 840

cgaggacagg gccctgtctc ctcagcttca ggcaccacca ctgacctggg acagtgaatg 900

atccccctga tctgcggcc 919

<210> 87

<211> 919

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 87

ggttaatttt taaaaagcag tcaaaagtcc aagtggccct tgcgagcatt tactctctct 60

gtttgctctg gttaataatc tcaggagcac aaacattcct ggaggcagga gaagaaatca 120

acatcctgga cttatcctct gggcctctct ggcccttgcc aggctcagag gcacacagga 180

gtttctgggc tcaccctgcc cccttccaac ccctcagttc ccatcctcca gcagctgttt 240

gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc tactcatgtc cctaaaatgg 300

gcaaacattg caagcagcaa acagcaaaca cacagccctc cctgcctgct gaccttggag 360

ctggggcaga ggtcagagac ctctctgggc ccatgccacc tccaacatcc actcgacccc 420

ttggaatttc ggtggagagg agcagaggtt gtcctggcgt ggtttaggta gtgtgagagg 480

gttattgata ttcgtacccg gggatcttgc taccagtgga acagccacta aggattctgc 540

agtgagagca gagggccagc taagtggtac tctcccagag actgtctgac tcacgccacc 600

ccctccacct tggacacagg acgctgtggt ttctgagcca ggtacaatga ctcctttcgg 660

taagtgcagt ggaagctgta cactgcccag gcaaagcgtc cgggcagcgt aggcgggcga 720

ctcagatccc agccagtgga cttagcccct gtttgctcct ccgataactg gggtgacctt 780

ggttaatatt caccagcagc ctcccccgtt gcccctctgg atccactgct taaatacgga 840

cgaggacagg gccctgtctc ctcagcttca ggcaccacca ctgacctggg acagtgaatg 900

atccccctga tctgcggcc 919

<210> 88

<211> 915

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 88

ggttaatttt taaaaagcag tcaaaagtcc aagtggccct tgcgagcatt tactctctct 60

gtttgctctg gttaataatc tcaggagcac aaacattcct ggaggcagga gaagaaatca 120

acatcctgga cttatcctct gggcctctcc aggctcagag gcacacagga gtttctgggc 180

tcaccctgcc cccttccaac ccctcagttc ccatcctcca gcagctgttt gtgtgctgcc 240

tctgaagtcc acactgaaca aacttcagcc tactcatgtc cctaaaatgg gcaaacattg 300

caagcagcaa acagcaaaca cacagccctc cctgcctgct gaccttggag ctggggcaga 360

ggtcagagac ctctctgggc ccatgccacc tccaacatcc actcgacccc ttggaatttc 420

ggtggagagg agcagaggtt gtcctggcgt ggtttaggta gtgtgagagg ggtacccggg 480

gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga gggccagcta 540

agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg gacacaggac 600

gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg aagctgtaca 660

ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccat ataaagccag 720

tggacttagc ccctgtttgc tcctccgata actggggtga ccttggttaa tattcaccag 780

cagcctcccc cttattgata ttcgttgccc ctctggatcc actgcttaaa tacggacgag 840

gacagggccc tgtctcctca gcttcaggca ccaccactga cctgggacag tgaatgatcc 900

ccctgatctg cggcc 915

<210> 89

<211> 909

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 89

ttattgatat tcggttaatt tttaaaaagc agtcaaaagt ccaagtggcc cttgcgagca 60

tttactctct ctgtttgctc tggttaataa tctcaggagc acaaacattc ctggaggcag 120

gagaagaaat caacatcctg gacttatcct ctgggcctct ccaggctcag aggcacacag 180

gagtttctgg gctcaccctg cccccttcca acccctcagt tcccatcctc cagcagctgt 240

ttgtgtgctg cctctgaagt ccacactgaa caaacttcag cctactcatg tccctaaaat 300

gggcaaacat tgcaagcagc aaacagcaaa cacacagccc tccctgcctg ctgaccttgg 360

agctggggca gaggtcagag acctctctgg gcccatgcca cctccaacat ccactcgacc 420

ccttggaatt tcggtggaga ggagcagagg ttgtcctggc gtggtttagg tagtgtgaga 480

ggggtacccg gggatcttgc taccagtgga acagccacta aggattctgc agtgagagca 540

gagggccagc taagtggtac tctcccagag actgtctgac tcacgccacc ccctccacct 600

tggacacagg acgctgtggt ttctgagcca ggtacaatga ctcctttcgg taagtgcagt 660

ggaagctgta cactgcccag gcaaagcgtc cgggcagcgt aggcgggcga ctcagatccc 720

agccagtgga cttagcccct gtttgctcct ccgataactg gggtgacctt ggttaatatt 780

caccagcagc ctcccccgtt gcccctctgg atccactgct taaatacgga cgaggacagg 840

gccctgtctc ctcagcttca ggcaccacca ctgacctggg acagtgaatg atccccctga 900

tctgcggcc 909

<210> 90

<211> 907

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 90

tggcccttgc ggttaatttt taaaaagcag tcaaaagtcc aagtggccct tgcgagcatt 60

tactctctct gtttgctctg gttaataatc tcaggagcac aaacattcct ggaggcagga 120

gaagaaatca acatcctgga cttatcctct gggcctctcc aggctcagag gcacacagga 180

gtttctgggc tcaccctgcc cccttccaac ccctcagttc ccatcctcca gcagctgttt 240

gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc tactcatgtc cctaaaatgg 300

gcaaacattg caagcagcaa acagcaaaca cacagccctc cctgcctgct gaccttggag 360

ctggggcaga ggtcagagac ctctctgggc ccatgccacc tccaacatcc actcgacccc 420

ttggaatttc ggtggagagg agcagaggtt gtcctggcgt ggtttaggta gtgtgagagg 480

ggtacccggg gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga 540

gggccagcta agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg 600

gacacaggac gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg 660

aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag 720

ccagtggact tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca 780

ccagcagcct cccccgttgc ccctctggat ccactgctta aatacggacg aggacagggc 840

cctgtctcct cagcttcagg caccaccact gacctgggac agtgaatgat ccccctgatc 900

tgcggcc 907

<210> 91

<211> 907

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 91

ggttaatttt taaaaagcag tcaaaagtcc aagtggccct tgcgagcatt tactctctct 60

gtttgctctg gttaataatc tcaggagcac aaacattcct ggaggcagga gaagaaatca 120

acatcctgga cttatcctct gggcctctcc aggctcagag gcacacagga gtttctgggc 180

tcaccctgcc cccttccaac ccctcagttc ccatcctcca gcagctgttt gtgtgctgcc 240

tctgaagtcc acactgaaca aacttcagcc tactcatgtc cctaaaatgg gcaaacattg 300

caagcagcaa acagcaaaca cacagccctc cctgcctgct gaccttggag ctggggcaga 360

ggtcagagac ctctctgggc ccatgccacc tccaacatcc actcgacccc ttggaatttc 420

ggtggagagg agcagaggtt gtcctggcgt ggtttaggta gtgtgagagg ggtacccggg 480

gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga gggccagcta 540

agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg gacacaggac 600

gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg aagctgtaca 660

ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact 720

tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct 780

ccccctttat tgatattcgc ccctctggat ccactgctta aatacggacg aggacagggc 840

cctgtctcct cagcttcagg caccaccact gacctgggac agtgaatgat ccccctgatc 900

tgcggcc 907

<210> 92

<211> 322

<212> DNA

<213> 智人

<400> 92

caggctcaga ggcacacagg agtttctggg ctcaccctgc ccccttccaa cccctcagtt 60

cccatcctcc agcagctgtt tgtgtgctgc ctctgaagtc cacactgaac aaacttcagc 120

ctactcatgt ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct 180

ccctgcctgc tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac 240

ctccaacatc cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg 300

tggtttaggt agtgtgagag gg 322

<210> 93

<211> 117

<212> DNA

<213> 智人

<400> 93

ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60

tgaccttgga gctggggcag aggtcagaca cctctctggg cccatgccac ctccaac 117

<210> 94

<211> 426

<212> DNA

<213> 智人

<400> 94

gtacccgggg atcttgctac cagtggaaca gccactaagg attctgcagt gagagcagag 60

ggccagctaa gtggtactct cccagagact gtctgactca cgccaccccc tccaccttgg 120

acacaggacg ctgtggtttc tgagccaggt acaatgactc ctttcggtaa gtgcagtgga 180

agctgtacac tgcccaggca aagcgtccgg gcagcgtagg cgggcgactc agatcccagc 240

cagtggactt agcccctgtt tgctcctccg ataactgggg tgaccttggt taatattcac 300

cagcagcctc ccccgttgcc cctctggatc cactgcttaa atacggacga ggacagggcc 360

ctgtctcctc agcttcaggc accaccactg acctgggaca gtgaatgatc cccctgatct 420

gcggcc 426

<210> 95

<211> 73

<212> DNA

<213> 智人

<400> 95

agtggactta gcccctgttt gctcctccga taactggggt gaccttggtt aatattcacc 60

agcagcctcc ccc 73

<210> 96

<211> 80

<212> DNA

<213> 智人

<400> 96

cccagccagt ggacttagcc cctgtttgct cctccgataa ctggggtgac cttggttaat 60

attcaccagc agcctccccc 80

<210> 97

<211> 149

<212> DNA

<213> 智人

<400> 97

ggttaatttt taaaaagcag tcaaaagtcc aagtggccct tgcgagcatt tactctctct 60

gtttgctctg gttaataatc tcaggagcac aaacattcct ggaggcagga gaagaaatca 120

acatcctgga cttatcctct gggcctctc 149

<210> 98

<211> 93

<212> DNA

<213> 智人

<400> 98

ttaattttta aaaagcagtc aaaagtccaa gtggcccttg cgagcattta ctctctctgt 60

ttgctctggt taataatctc aggagcacaa aca 93

<210> 99

<211> 134

<212> DNA

<213> 智人

<400> 99

cacaattttt atagacttct catcatgttt tttttttcca atatttgccc tcccctttct 60

accttgacct agtagggagg tgtttattca acacctctga ttggctcata aacaaccagt 120

ccttaaaatc atgc 134

<210> 100

<211> 12

<212> DNA

<213> 智人

<400> 100

aatttttata ga 12

<210> 101

<211> 52

<212> DNA

<213> 智人

<400> 101

gtagggaggt gtttattcaa cacctctgat tggctcataa acaaccagtc ct 52

<210> 102

<211> 586

<212> DNA

<213> 智人

<400> 102

gggattcaaa ttctgcttag ctaacccaat gttgtgagtt aatgcttgtc tacttgggca 60

gaagtacctt gcaaaattat ctaggtagca tgtgatagaa ccaggattca aacccaggtg 120

tgtctgacct caaagtgtgg ggactttcca ctctactgct gctaattttt ttctaaaaat 180

aatacttccg ggtgcagagt ttaatcttct ttgtccaagg tactgtggta agcaccttat 240

gtacattgtc taagttaatc cccacaacat tttgagaaat ccccattttg agataggaga 300

actgaggctc acaatatttc agtgactggc ccaaggtcac agttgttaaa tggaggagct 360

ggtattgaaa accaggtacg tgtggctcta agaccagtgt aatagttgtg ttttgttttt 420

ccttgcttcc ttctttactt gccttcattt ctagcttaca ctggcatgat tcatctcagt 480

gggcaatatc cttaccttga atggtggttt ctttgtttgt tcctgcaaga ggagcacctc 540

cttggtctaa ctgtggatac aaataattaa caggtgtcag atgtca 586

<210> 103

<211> 113

<212> DNA

<213> 智人

<400> 103

cttgcaaaat tatctaggta gcatgtgata gaaccaggat tcaaacccag gtgtgtctga 60

cctcaaagtg tggggacttt ccactctact gctgctaatt tttttctaaa aat 113

<210> 104

<211> 93

<212> DNA

<213> 智人

<400> 104

tgcctccccg tgttcctgct ctttgtccct ctgtcctact tagactaata tttgccttgg 60

gtactgcaaa caggaaatgg gggagggaca gga 93

<210> 105

<211> 77

<212> DNA

<213> 智人

<400> 105

tgttcctgct ctttgtccct ctgtcctact tagactaata tttgccttgg gtactgcaaa 60

caggaaatgg gggaggg 77

<210> 106

<211> 14

<212> DNA

<213> 智人

<400> 106

tagactaata tttg 14

<210> 107

<211> 9

<212> DNA

<213> 智人

<400> 107

cttgcaaaa 9

<210> 108

<211> 10

<212> DNA

<213> 智人

<400> 108

tatgtacatt 10

<210> 109

<211> 10

<212> DNA

<213> 智人

<400> 109

cccacaacat 10

<210> 110

<211> 9

<212> DNA

<213> 智人

<400> 110

ttgagaaat 9

<210> 111

<211> 10

<212> DNA

<213> 智人

<400> 111

gattcatctc 10

<210> 112

<211> 10

<212> DNA

<213> 智人

<400> 112

ttggtctaac 10

<210> 113

<211> 12

<212> DNA

<213> 智人

<400> 113

ctttctacct tg 12

<210> 114

<211> 10

<212> DNA

<213> 智人

<400> 114

ctgtttgctc 10

<210> 115

<211> 9

<212> DNA

<213> 智人

<400> 115

cttgcaaaa 9

<210> 116

<211> 10

<212> DNA

<213> 智人

<400> 116

ctgtttgctc 10

<210> 117

<211> 9

<212> DNA

<213> 智人

<400> 117

cccaggtgt 9

<210> 118

<211> 8

<212> DNA

<213> 智人

<400> 118

tattgatt 8

<210> 119

<211> 11

<212> DNA

<213> 智人

<400> 119

aaaagcagtc a 11

<210> 120

<211> 11

<212> DNA

<213> 智人

<400> 120

aggcaggaga a 11

<210> 121

<211> 11

<212> DNA

<213> 智人

<400> 121

gagaagaaat c 11

<210> 122

<211> 11

<212> DNA

<213> 智人

<400> 122

caacatcctg g 11

<210> 123

<211> 11

<212> DNA

<213> 智人

<400> 123

acttatcctc t 11

<210> 124

<211> 11

<212> DNA

<213> 智人

<400> 124

cgtgttcctg c 11

<210> 125

<211> 9

<212> DNA

<213> 智人

<400> 125

gcaaacagg 9

<210> 126

<211> 7

<212> DNA

<213> 智人

<400> 126

tcatgtt 7

<210> 127

<211> 8

<212> DNA

<213> 智人

<400> 127

atcaacat 8

<210> 128

<211> 18

<212> DNA

<213> 智人

<400> 128

ataatctcag gagcacaa 18

<210> 129

<211> 6

<212> DNA

<213> 智人

<400> 129

ttatct 6

<210> 130

<211> 6

<212> DNA

<213> 智人

<400> 130

tgatag 6

<210> 131

<211> 6

<212> DNA

<213> 智人

<400> 131

agatag 6

<210> 132

<211> 11

<212> DNA

<213> 智人

<400> 132

gacttatcct c 11

<210> 133

<211> 18

<212> DNA

<213> 智人

<400> 133

tgtttattca acacctct 18

<210> 134

<211> 10

<212> DNA

<213> 智人

<400> 134

gttaataatc 10

<210> 135

<211> 13

<212> DNA

<213> 智人

<400> 135

gactaatatt tgc 13

<210> 136

<211> 13

<212> DNA

<213> 智人

<400> 136

cttgcaaaat tat 13

<210> 137

<211> 13

<212> DNA

<213> 智人

<400> 137

gctgctaatt ttt 13

<210> 138

<211> 13

<212> DNA

<213> 智人

<400> 138

acaaataatt aac 13

<210> 139

<211> 13

<212> DNA

<213> 智人

<400> 139

gttaattttt aaa 13

<210> 140

<211> 11

<212> DNA

<213> 智人

<400> 140

ggttaataat c 11

<210> 141

<211> 12

<212> DNA

<213> 智人

<400> 141

tggttaatat tc 12

<210> 142

<211> 10

<212> DNA

<213> 智人

<400> 142

tgtttgctct 10

<210> 143

<211> 10

<212> DNA

<213> 智人

<400> 143

agcacaaaca 10

<210> 144

<211> 9

<212> DNA

<213> 智人

<400> 144

tgtttgctc 9

<210> 145

<211> 7

<212> DNA

<213> 智人

<400> 145

tgtttgc 7

<210> 146

<211> 8

<212> DNA

<213> 智人

<400> 146

tgtttgct 8

<210> 147

<211> 11

<212> DNA

<213> 智人

<400> 147

agaaatcaac a 11

<210> 148

<211> 15

<212> DNA

<213> 智人

<400> 148

ctaatatttg ccttg 15

<210> 149

<211> 13

<212> DNA

<213> 智人

<400> 149

gactaatatt tgc 13

<210> 150

<211> 12

<212> DNA

<213> 智人

<400> 150

tctgtttgct ct 12

<210> 151

<211> 17

<212> DNA

<213> 智人

<400> 151

ttcctgctct ttgtccc 17

<210> 152

<211> 8

<212> DNA

<213> 智人

<400> 152

cagagttt 8

<210> 153

<211> 12

<212> DNA

<213> 智人

<400> 153

ccctgtttgc tc 12

<210> 154

<211> 10

<212> DNA

<213> 智人

<400> 154

tggcccttgc 10

<210> 155

<211> 15

<212> DNA

<213> 智人

<400> 155

agcagtcaaa agtcc 15

<210> 156

<211> 12

<212> DNA

<213> 智人

<400> 156

ttattgatat tc 12

<210> 157

<211> 8

<212> DNA

<213> 智人

<400> 157

tattgatt 8

<210> 158

<211> 15

<212> DNA

<213> 智人

<400> 158

ttttttttcc aatat 15

<210> 159

<211> 21

<212> DNA

<213> 智人

<400> 159

atttactctc tctgtttgct c 21

<210> 160

<211> 21

<212> DNA

<213> 智人

<400> 160

ttactctctc tgtttgctct g 21

<210> 161

<211> 13

<212> DNA

<213> 智人

<400> 161

ttaataatct cag 13

<210> 162

<211> 17

<212> DNA

<213> 智人

<400> 162

tggttaatat tcaccag 17

<210> 163

<211> 11

<212> DNA

<213> 智人

<400> 163

caacatcctg g 11

<210> 164

<211> 13

<212> DNA

<213> 智人

<400> 164

agtccaagtg gcc 13

<210> 165

<211> 12

<212> DNA

<213> 智人

<400> 165

gtccaagtgg cc 12

<210> 166

<211> 10

<212> DNA

<213> 智人

<400> 166

ctctggttaa 10

<210> 167

<211> 10

<212> DNA

<213> 智人

<400> 167

aaatggggga 10

<210> 168

<211> 10

<212> DNA

<213> 智人

<400> 168

tcaaaagtcc 10

<210> 169

<211> 14

<212> DNA

<213> 智人

<400> 169

tagactaata tttg 14

<210> 170

<211> 15

<212> DNA

<213> 智人

<400> 170

caggagaaga aatca 15

<210> 171

<211> 14

<212> DNA

<213> 智人

<400> 171

tgttaattaa aagc 14

<210> 172

<211> 10

<212> DNA

<213> 智人

<400> 172

gttaattttt 10

<210> 173

<211> 10

<212> DNA

<213> 智人

<400> 173

ttactctctc 10

<210> 174

<211> 10

<212> DNA

<213> 智人

<400> 174

cttgggtact 10

<210> 175

<211> 9

<212> DNA

<213> 智人

<400> 175

gcaaacagg 9

<210> 176

<211> 8

<212> DNA

<213> 智人

<400> 176

ttaatttt 8

<210> 177

<211> 8

<212> DNA

<213> 智人

<400> 177

gggattca 8

<210> 178

<211> 8

<212> DNA

<213> 智人

<400> 178

ggtactgt 8

<210> 179

<211> 8

<212> DNA

<213> 智人

<400> 179

ttaatccc 8

<210> 180

<211> 8

<212> DNA

<213> 智人

<400> 180

ggtattga 8

<210> 181

<211> 8

<212> DNA

<213> 智人

<400> 181

ggctctaa 8

<210> 182

<211> 8

<212> DNA

<213> 智人

<400> 182

ggcatgat 8

<210> 183

<211> 8

<212> DNA

<213> 智人

<400> 183

ttcaaacc 8

<210> 184

<211> 8

<212> DNA

<213> 智人

<400> 184

atagaacc 8

<210> 185

<211> 10

<212> DNA

<213> 智人

<400> 185

tggaggcagg 10

<210> 186

<211> 7

<212> DNA

<213> 智人

<400> 186

acaggaa 7

<210> 187

<211> 13

<212> DNA

<213> 智人

<400> 187

atgggggagg gac 13

<210> 188

<211> 9

<212> DNA

<213> 智人

<400> 188

gcagtcaaa 9

<210> 189

<211> 9

<212> DNA

<213> 智人

<400> 189

gagcacaaa 9

<210> 190

<211> 11

<212> DNA

<213> 智人

<400> 190

attcctggag g 11

<210> 191

<211> 11

<212> DNA

<213> 智人

<400> 191

caaacaggaa a 11

<210> 192

<211> 6

<212> DNA

<213> 智人

<400> 192

tataaa 6

<210> 193

<211> 8

<212> DNA

<213> 智人

<400> 193

tatataaa 8

<210> 194

<211> 13

<212> DNA

<213> 智人

<400> 194

aaacattcct gga 13

<210> 195

<211> 7

<212> DNA

<213> 智人

<400> 195

acgtgtg 7

<210> 196

<211> 9

<212> DNA

<213> 智人

<400> 196

caggtgtca 9

<210> 197

<211> 9

<212> DNA

<213> 智人

<400> 197

cagatgtca 9

<210> 198

<211> 11

<212> DNA

<213> 智人

<400> 198

tccaagtggc c 11

<210> 199

<211> 11

<212> DNA

<213> 智人

<400> 199

agcatgtgat a 11

<210> 200

<211> 7

<212> DNA

<213> 智人

<400> 200

tataaaa 7

<210> 201

<211> 7

<212> DNA

<213> 智人

<400> 201

ttaaata 7

<210> 202

<211> 335

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 202

ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60

tgaccttgga gctggggcag aggtcagaca cctctctggg cccatgccac ctccaactgg 120

acacaggacg ctgtggtttc tgagccaggg ggcgactcag atcccagcca gtggacttag 180

cccctgtttg ctcctccgat aactggggtg accttggtta atattcacca gcagcctccc 240

ccgttgcccc tctggatcca ctgcttaaat acggacgagg acagggccct gtctcctcag 300

cttcaggcac caccactgac ctgggacagt gaatc 335

Claims

1.一种包含补体因子I(CFI)核苷酸序列的多核苷酸，其中CFI核苷酸序列编码CFI多肽或其片段，其中CFI核苷酸序列的至少一部分不是野生型的，其中与由参考CFI核苷酸序列编码的CFI多肽的表达相比，由所述CFI核苷酸序列编码的CFI多肽或其片段在人肝细胞中以更高水平表达。

2.权利要求1的多核苷酸，其中：

(i)参考CFI核苷酸序列是野生型CFI核苷酸序列；

(ii)与在用包含参考CFI核苷酸序列的等效多核苷酸转染时由参考CFI核苷酸编码的CFI多肽的表达相比，在将包含所述CFI核苷酸序列的多核苷酸转染到人肝细胞中由所述CFI核苷酸序列编码的CFI多肽或其片段时以更高的水平表达；

(iii)人肝细胞是Huh-7细胞；和/或

(iv)由CFI核苷酸序列编码的CFI多肽或其片段的表达为由参考CFI核苷酸序列编码的CFI多肽的至少1.5x、至少2x、至少3x、至少5x、至少8x、至少10x、至少20x、至少30x、至少40x或至少50x。

3.权利要求1或2的多核苷酸，其中非野生型的CFI核苷酸序列部分是密码子优化的，并且其中密码子优化的CFI核苷酸序列部分针对在人肝细胞中的表达进行了密码子优化。

4.权利要求3的多核苷酸，其中密码子优化的CFI核苷酸序列部分：

(i)是连续的部分；

(ii)长度为至少1000、至少1200、至少1300、至少1400、至少1500、至少1600、至少1700、1752或更少、1300至1752、1500至1752、1600至1752或约1752个核苷酸；

(iii)长度为至少1000、至少1200、至少1300、至少1400、至少1500、1698或更少、1300至1698、1500至1698或约1698个核苷酸；和/或

(iv)编码成熟的CFI多肽。

5.前述权利要求中任一项的多核苷酸，其中所述CFI核苷酸序列针对在人肝细胞中的表达进行了密码子优化。

6.权利要求3至5中任一项的多核苷酸，其中在密码子优化的CFI核苷酸序列或CFI核苷酸序列部分中，至少70％、至少75％、至少76％、至少77％、至少78％、至少79％、至少80％或至少81％、至少82％、至少83％或至少84％的密码子选自：GCT、GCC、TGC、GAC、GAG、TTC、GGA、GGC、CAC、ATC、AAG、CTG、AAT、AAC、CCT、CCC、CAG、AGG、AGA、AGT、AGC、ACC、GTG和TAC。

7.权利要求3至6中任一项的多核苷酸，其中密码子优化的CFI核苷酸序列或CFI核苷酸序列部分：

(i)与参考CFI核苷酸序列的相应部分相比，包含减少数量的CpG；和/或

(ii)与参考CFI核苷酸序列的相应部分相比，包含减少数量的CpG，并且：

(a)包含40个或更少、20个或更少、15个或更少、10个或更少或5个或更少的CpG；

(b)包含40个或更少、20个或更少、15个或更少、10个或更少或5个或更少的CpG，并且其中密码子优化的CFI核苷酸序列或CFI核苷酸序列部分每100个核苷酸包含5个或更少、4个或更少、3个或更少或2个或更少的CpG；和/或

(c)不含CpG。

8.权利要求7的多核苷酸，其中所述参考CFI核苷酸序列是野生型CFI核苷酸序列。

9.权利要求3、4或6至8中任一项的多核苷酸，其中密码子优化的CFI核苷酸序列部分：

(i)与SEQ ID NO：5、10和17中的任一个至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同；

(ii)与SEQ ID NO：1-20中的任一个至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同；和/或

(iii)与SEQ ID NO：5至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。

10.前述权利要求中任一项的多核苷酸，其中所述CFI核苷酸序列编码信号肽。

11.前述权利要求中任一项的多核苷酸，其中所述多核苷酸还包含转录调节元件。

12.权利要求11的多核苷酸，其中所述转录调节元件包含肝脏特异性启动子。

13.权利要求11或12的多核苷酸，其中所述转录调节元件包含与SEQ ID NO：74具有至少98％同一性的核苷酸序列。

14.一种包含补体因子I(CFI)核苷酸序列的多核苷酸，其中CFI核苷酸序列编码CFI多肽或其片段，并且其中CFI核苷酸序列的至少一部分不是野生型的。

15.前述权利要求中任一项的多核苷酸，其中所述CFI核苷酸序列包含与SEQ ID NO：1-40中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

16.一种包含CFI核苷酸序列的多核苷酸，其中CFI核苷酸序列编码CFI多肽或其片段，并且CFI核苷酸序列包含与SEQ ID NO：1-40中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

17.前述权利要求中任一项的多核苷酸，其中所述CFI核苷酸序列包含：

(i)与SEQ ID NO：5或25中任一个的至少1200、至少1400、至少1500、1698或更少、1752或更少、1200至1698、1200至1752、1500至1698、1500至1752、约1698或约1752个核苷酸的片段至少95％、至少96％、至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列；

(ii)SEQ ID NO：1-20中任一个的序列，或其编码包含与SEQ IDNO：44的野生型CFI氨基酸序列至少95％相同的序列的CFI多肽的变体；和/或

(iii)SEQ ID NO：1-20中任一个的序列，或其编码包含与SEQ IDNO：44的野生型CFI氨基酸序列至少95％相同的序列的CFI多肽的变体，其中所述变体是SEQ ID NO：5的变体，并且其中SEQ ID NO：5的变体与SEQ ID NO：5相同，除了它包含核苷酸取代以使得CFI多肽相对于SEQ ID NO：44的野生型CFI氨基酸序列具有1个、2个或更少、3个或更少、4个或更少、5个或更少、6个或更少、7个或更少、8个或更少、9个或更少或10个或更少的氨基酸取代。

18.一种包含重组基因组的病毒颗粒，所述重组基因组包含前述权利要求中任一项的多核苷酸。

19.权利要求18的病毒颗粒，其是AAV病毒颗粒。

20.权利要求19的病毒颗粒，其中所述病毒颗粒包含：

(i)衣壳；

(ii)嗜肝衣壳；和/或

(iii)嗜肝衣壳，其中嗜肝衣壳包含与SEQ ID NO：56-59中任一个的至少600、至少650、至少700、600至734、600至736、650至734、650至736、700至734、700至736、约734或约736个氨基酸的片段至少98％、至少99％或至少99.5％相同的序列。

21.一种组合物，其包含前述权利要求中任一项的多核苷酸或病毒颗粒，以及药学上可接受的赋形剂。

22.权利要求1至17中任一项的多核苷酸、权利要求18至20中任一项的病毒颗粒或权利要求21的组合物，其用于治疗方法。

23.一种治疗方法，包括施用有效量的权利要求1至17中任一项的多核苷酸、权利要求18至20中任一项的病毒颗粒或权利要求21的组合物。

24.权利要求1至17中任一项的多核苷酸、权利要求18至20中任一项的病毒颗粒或权利要求21的组合物在制备用于治疗方法的药物中的用途。

25.根据权利要求22至24中任一项使用的多核苷酸、病毒颗粒或组合物或用途，其中所述治疗方法包括向患者施用有效量的所述多核苷酸、病毒颗粒或组合物。

26.用于治疗方法的包含补体因子I(CFI)核苷酸序列的多核苷酸、包含含有所述多核苷酸的重组基因组的病毒颗粒或包含所述多核苷酸或病毒颗粒的组合物，其中所述治疗方法是治疗补体介导的病症的方法，并且CFI核苷酸序列编码CFI多肽或其片段。

27.一种治疗方法，包括施用有效量的包含CFI核苷酸序列的多核苷酸、包含含有所述多核苷酸的重组基因组的病毒颗粒或包含所述多核苷酸或病毒颗粒的组合物，其中所述治疗方法是治疗补体介导的病症的方法，并且CFI核苷酸序列编码CFI多肽或其片段。

28.一种包含CFI核苷酸序列的多核苷酸、包含含有所述多核苷酸的重组基因组的病毒颗粒或包含所述多核苷酸或病毒颗粒的组合物在制备用于治疗方法的药物中的用途，其中所述治疗方法是治疗补体介导的病症的方法，并且CFI核苷酸序列编码CFI多肽或其片段。

29.根据权利要求26至28中任一项使用的多核苷酸、病毒颗粒或组合物或用途，其中所述治疗方法包括向患者施用有效量的所述多核苷酸、病毒颗粒或组合物。

30.根据权利要求22至25中任一项使用的多核苷酸、病毒颗粒或组合物或用途，其中所述治疗方法是治疗补体介导的病症的方法。

31.根据权利要求26至30中使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中所述病症：

(i)是C3介导的病症；

(ii)是肾脏疾病；

(iii)与补体C3b反馈循环的过度活动有关；

(iv)选自C3肾小球病、IgA肾病、狼疮性肾炎、***性红斑狼疮、膜性肾病、膜增生性肾小球肾炎、阵发性睡眠性血红蛋白尿、非典型溶血性***综合征、自身免疫性溶血性贫血、ANCA相关血管炎、戈谢病、腹膜炎、年龄-相关黄斑变性、糖尿病性视网膜病变、致密物沉积病、年龄相关性炎症或自身炎症性疾病、自身免疫性关节炎如类风湿性关节炎、动脉粥样硬化、慢性心血管疾病、阿尔茨海默氏病、***性血管炎、格林-巴利综合征和Henoch-Schonlein紫癜；

(v)选自C3肾小球病、C3肾小球肾炎和致密物沉积病；

(vi)是具有单等位基因CFH突变的非典型溶血性***综合征；

(vii)是肾小球或肾小管病症；和/或

(vii)不是眼部病症。

32.根据权利要求22至31中任一项使用的多核苷酸、病毒颗粒或组合物、用途或方法，其中所述多核苷酸、病毒颗粒或组合物：

(i)不是眼内施用的；

(ii)通过以下方式施用：静脉内；全身地；通过外周静脉输注至肝脏；通过肝血管如肝静脉输注或肝动脉输注至肝脏；或通过实质内直接施用至肝脏；

(iii)通过注射施用至肾动脉中；

(iv)通过逆行施用进行施用；和/或

(v)通过逆行施用进行施用，其中使用导尿管通过输尿管施用。