CN113811542A

CN113811542A - 包含细胞因子和支架蛋白的融合蛋白

Info

Publication number: CN113811542A
Application number: CN201980092808.8A
Authority: CN
Inventors: J·斯泰亚特; E·帕顿; A·沃尔科尼格; V·卡利恰克; W·弗兰肯; T·乌坎斯基; A·舍维涅; M·什帕科夫斯卡
Original assignee: Vlaams Instituut voor Biotechnologie VIB; Universite Libre de Bruxelles ULB; Luxembourg Institute of Health LIH
Current assignee: Vlaams Instituut voor Biotechnologie VIB; Universite Libre de Bruxelles ULB; Luxembourg Institute of Health LIH
Priority date: 2018-12-21
Filing date: 2019-12-20
Publication date: 2021-12-17
Also published as: CA3122045A1; WO2020127983A1; JP2022515150A; EP3898664A1; US20220064245A1

Abstract

本发明涉及结构生物学领域。更具体地，本发明涉及新型融合蛋白、它们在大分子三维结构分析中的用途和方法，如X射线晶体学和高分辨率冷冻电镜，以及它们在基于结构的药物设计和筛选中的用途。甚至更具体地，本发明涉及细胞因子和支架蛋白的功能性融合蛋白，其中支架是折叠蛋白，其打断细胞因子的拓扑结构以形成保留了其受体结合和激活能力的刚性融合蛋白。更具体地，本文公开了基于趋化因子和白介素的功能性融合蛋白及其生产和用途。

Description

包含细胞因子和支架蛋白的融合蛋白

发明领域

本发明涉及结构生物学领域。更具体地，本发明涉及新型融合蛋白、它们在大分子三维结构分析中的用途和方法，如X射线晶体学和高分辨率冷冻电镜，以及它们在基于结构的药物设计和筛选中的用途。甚至更具体地，本发明涉及细胞因子和支架蛋白的功能性融合蛋白，其中支架是折叠蛋白，其打断(interrupt)细胞因子的拓扑结构以形成保留了其受体结合和激活能力的刚性融合蛋白。更具体地，本文公开了基于趋化因子和白介素的功能性融合蛋白及其生产和用途。

背景

对某些构象状态下的许多蛋白质和复合物进行3D结构分析仍然很困难。大分子X射线晶体学本质上具有几个缺点，如高质量纯化的蛋白质的先决条件、需要相对大量的蛋白质以及衍射质量晶体的制备。以抗体片段或其他蛋白质的形式应用结晶伴侣已被证明有助于通过最小化靶标的构象异质性来获得有序晶体。此外，伴侣可以提供初始的基于模型的定相信息(Koide，2009)。尽管如此，单粒子电子低温显微镜(冷冻电镜)最近已发展成为一种替代且通用的技术，用于以原子分辨率对大分子复合物进行结构分析(Nogales，2016)。尽管用于数据分析的仪器和方法不断改进，但3D重建可达到的最高分辨率主要取决于给定样本的均质性，以及以高精度迭代细化每个单独粒子的取向参数的能力。由于大分子的表面特性导致特定区域优先粘附到空气-水界面或基底支撑物上引起的优选粒子取向代表了冷冻电镜中反复出现的问题。因此，在这方面，我们仍然缺少诸如下一代伴侣之类的工具来克服这些障碍。

细胞因子是一类小蛋白质(5-20kDa)，在皮摩尔或纳摩尔浓度下充当细胞信号分子，以调节炎症和调节细胞活动，如迁移、生长、存活和分化。细胞因子是异常庞大且多样化的一组促炎或抗炎因子，它们根据其结构同源性或其受体的结构同源性分为多个家族。细胞因子可以包括趋化因子、干扰素、白介素、淋巴因子、肿瘤坏死因子、激素或生长因子。白细胞介素(IL)是一组具有复杂免疫调节功能的细胞因子，所述功能包括细胞增殖、成熟、迁移和粘附，在免疫细胞分化和激活中发挥着重要作用。IL还具有促炎和抗炎作用，并且由于宿主免疫***和感染生物体之间的持续竞争而处于持续的压力下来进化；因此，IL经历了显著的进化，导致直系同源蛋白之间极少氨基酸保守，使基因家族组织复杂化。尽管如此，晶体学数据和常见结构基序的鉴定已导致分为四个主要组，包括编码以下的基因：IL1-样细胞因子、I类螺旋细胞因子(IL4样、γ链和IL6/12样)，II类螺旋细胞因子(IL10样和IL28样)和IL17样细胞因子(在结构上与其他IL亚家族无关，并且IL17F构成半胱氨酸-结折叠)。

趋化因子是细胞因子家族内的一组分泌的小球状蛋白，其一般功能是诱导细胞迁移。细胞因子或趋化因子配体与其同源受体的结合导致受体的激活，进而触发级联的信号事件，其调节各种细胞功能，如细胞粘附、吞噬作用、细胞因子分泌、细胞激活、细胞增殖、细胞存活和细胞死亡、细胞凋亡、血管生成和增殖。

趋化因子在细胞表面和胞外基质上以梯度形式积累，并被迁移细胞上的趋化因子受体解释为定向信号。大多数趋化因子受体是七跨膜(7TM)G-蛋白偶联受体(GPCR)，其响应趋化因子结合激活Gαi依赖性胞内途径。一些趋化因子受体通过其他机制转运或清除趋化因子，因此被称为非典型趋化因子受体(ACKR)。这些“趋化细胞因子”参与了白细胞的化学吸引和免疫细胞向全身各部位的运输。趋化因子***涉及许多疾病领域，如哮喘、动脉粥样硬化和类风湿性关节炎等炎症病理以及自身免疫性疾病。细胞因子和趋化因子在介导各种炎性神经退行性疾病的神经炎症和神经退行病变方面起着重要作用，所述疾病包括细菌性脑膜炎、脑脓肿、莱姆神经疏螺旋体病和HIV脑炎(综述参见Ramesh等，2013)。因此，对***的理解对于适当的治疗靶选择和归因特异性至关重要。

趋化因子是约7-12kDa的小蛋白质，基于接近成熟配体(CC、CXC、CX3C和C)氨基末端的半胱氨酸残基的特征性模式分为四个亚家族。所有趋化因子都显示出同源的三级结构，并以不同的寡聚状态与细胞表面糖胺聚糖(GAG)以及趋化因子受体相互作用。目前已知大约有45种人类趋化因子和22种趋化因子受体，同一亚家族内的趋化因子通常与同一类别的多个受体结合。尽管趋化因子以二聚体形式出现，但结合以激活趋化因子受体的是其单体形式。受体结合和激活的双位点模型涉及在受体激活中必不可少的趋化因子的N-末端，以及介导受体结合的趋化因子核心结构域。天然趋化因子具有不同的受体特异性，且已知趋化因子的变体显示出其受体的少许不同的构象状态，导致不同的信号传导和反应。因此，一些趋化因子充当给定受体的激动剂，而其他趋化因子可充当拮抗剂或反向激动剂。为了充分理解这种识别和激活机制，需要与完整受体复合的趋化因子或变体的高分辨率结构。例如，正在研究被称为激动剂和拮抗剂的几种CCL5(或RANTES)变体的结构研究，以了解它们作为杀微生物剂保护免受HIV的潜力(Kufareva等，2015)。趋化因子的几种结构是已知的，对于更易处理的GPCR，概括为可溶性复合物，结构已经被解析(β2-肾上腺素能受体，视紫红质)。然而，由于受体作为跨膜蛋白的构象灵活性，对趋化因子/受体复合物和相互作用的结构见解仍然有限并形成挑战。已经确定了与小分子复合的趋化因子受体CXCR4和CCR5GPCR，以及与拮抗剂趋化因子变体5P7-CCL5复合的CCR5，与病毒拮抗剂趋化因子vMIP-II复合的CXCR4，以及与人CX3CL1受体复合的病毒受体US28的晶体结构。此外，对于G蛋白和β-抑制蛋白复合的GPCR的可用晶体结构，当彼此比较时，没有观察到受体的明显显著构象差异，表明配体-受体对的新见解对于评估它们的成药性至关重要(Proudfoot等，2015年)。应用了揭示结构信息的替代方法，例如放射分解足迹、二硫化物捕获和诱变，例如绘制ACKR3：CXCL12和ACKR3：小分子复合物的结构(Gustavsson等，2017)。这些技术提供了在同源受体中通过X射线晶体学证明无法解析的动态区域，与分子建模相整合，以产生完整的和有凝聚力的实验驱动模型，以扩展对受体：趋化因子和受体：小分子复合物结构的现有知识。然而，为了探索新途径并发现配体诱导的GPCR，以及其他趋化因子、白细胞介素或整体“细胞因子受体”(一种通用原型伴侣)构象变化的新机制，以促进此类复合物的与其配体的X射线晶体学或冷冻电镜分析，需要配体类似物或变体。

发明概述

本申请涉及新型功能性融合蛋白的设计和生成及其用途，如它们在结构分析中作为下一代伴侣的作用。如本文所述的融合蛋白基于以下发现：细胞因子配体可以扩大为刚性融合蛋白以促进某些构象状态下的配体/受体复合物的结构分析。事实上，本公开提供了一种融合蛋白，其基于已知细胞因子的超家族共享序列相似性并在它们的相互受体***中表现出结构同源性和一些混杂性，尽管它们不表现出功能相似性。由于细胞因子是根据其结构分组的，因此可以从细胞因子亚组内结构元素的相似性开始设计通用融合方案。白介素是细胞因子的一个亚组，其中例如IL-1超家族采用保守的特征β-三叶形折叠，其由以三重对称模式排列的反平行β-链组成，具有保守的β-桶疏水性核心基序，其在环区域具有显著的柔韧性。趋化因子是细胞因子的另一个亚组，它们显示出非常相似的基本三级结构，趋化因子核心结构域包含具有至少3条β链的β折叠。所述亚家族的结构保守性理想地将细胞***素定位为提供通用方法和原型作为配体/受体复合物的结构分析中的下一代伴侣。由于三级结构在这些亚家族中是同源的，如“IL-1受体型白细胞介素”或“IL-1家族”，如在本文中可互换使用，以及趋化因子，具有包含二级β-结构(β-折叠或-桶)，通过暴露的转角或环提供了β链的相互连接，其核心域中暴露的且可与支架蛋白融合的物理位置通常可以用作示例，以形成整合配体的伴侣，用于细胞因子/受体复合物内的含β链结构域的细胞因子的结构分析。将白介素-1或趋化因子配体用于构建刚性的较大的配体，称为MegaKine^TM，且令人惊讶的是，扩大的配体融合蛋白保留了其受体结合和激活能力。这些新型功能性融合蛋白提供了新的途径来捕获不同构象状态的受体(如GPCR)并促进其结构分析。通过以这样打断细胞因子其核心结构域的拓扑结构而没有干扰其折叠或功能的方式在细胞因子核心结构域内刚性***支架蛋白而形成的新型融合允许在基于结构的药物发现中采用新方法。所得到的功能性融合蛋白是通过所述细胞因子(如针对趋化因子和IL-1β所证明的)和支架蛋白之间的遗传融合表达获得的，该支架蛋白被设计为使得支架或其片段***细胞因子核心结构域的拓扑结构内。令人惊讶地表明了所得到的新型融合蛋白的特征在于其融合区域的高刚性，并且令人惊讶地保留了它们典型的折叠和功能性，即它们保留了结合亲和力，并且此外在与细胞因子受体结合时显示出激活能力。事实上，技术人员选择在暴露的β-转角的可及位点处的细胞因子其保守的核心结构域和支架蛋白之间进行的遗传融合，使得不干扰或改变受体结合。因此，本发明通过在细胞因子保守的核心结构域(如趋化因子核心结构域，即β-链β2和β-链β3之间，或IL-1β-桶核心基序，即β-链β6和β-链β7之间)内的暴露的β-转角或β-环中的完美选择的位点，提供了一种新的和独特类型的功能性融合蛋白，以允许与折叠的支架蛋白进行刚性非柔性融合，这并不容易设计。因此，融合蛋白提供了一种新的工具，通过增加质量和提供结构特征来促进趋化因子配体/受体复合物的高分辨率冷冻电镜和X射线晶体学结构分析。因此，这些用于任何可能的细胞因子(尤其是趋化因子或其变体配体，或白介素IL-1或其变体)与其受体的复合物的结构分析的下一代伴侣的设计和生成允许扩大的配体，其增加了质量和/或向目的复合物添加了定义的特征，以获得高分辨率结构而没有改变构象状态。事实上，融合蛋白因此作为结构分析中的工具是有利的，而且在基于结构的药物设计和筛选中也是有利的，并成为用于发现和开发新型生物制品和小分子物质的附加价值。

本发明的第一个方面涉及一种包含功能性细胞因子的新型融合蛋白，所述功能性细胞因子与支架或融合伙伴蛋白相连，其中所述支架蛋白是至少50个氨基酸的折叠蛋白，并且在一个或多个可及的氨基酸位置与细胞因子偶联，因此暴露在所述细胞因子的表面，导致所述细胞因子的拓扑结构的打断(interruption)。所述融合蛋白的进一步特征在于它是功能性的，即与未与所述支架蛋白融合的细胞因子配体相比，它保留了其细胞因子功能性。另一个实施方案公开了本发明的融合蛋白，其中支架蛋白和细胞因子蛋白的融合导致细胞因子的一级拓扑结构被打断(interrupted)，与未与另一个蛋白质融合的细胞因子的折叠相比，允许保留细胞因子蛋白的折叠和典型的三级结构。更具体地，可及氨基酸位置存在于beta转角(β-转角)或β-环的暴露区域中，其将保守的细胞因子的β链结构相互连接。

在本发明的特定实施方案中，融合可以是直接融合，或由接头或接头肽制成的融合，所述融合位点被完美地设计以产生刚性、非柔性融合蛋白。优选，接头包含五个、四个、三个或更优选地两个，甚至更优选一个氨基酸残基，或是直接融合体(无接头)。

所述具有在趋化因子核心结构域表面的一个或多个可及或暴露位点与细胞因子或趋化因子核心结构域偶联的支架蛋白的融合蛋白特征还在于所述可及或暴露位点不在负责或参与受体结合和受体激活的区域中，以便在结合和/或激活受体时保留其细胞因子功能。

本发明的一个实施方案涉及一种新型融合蛋白，其中所述细胞因子是功能性趋化因子，其与支架或融合伙伴蛋白相连，其中所述支架蛋白在一个或多个可及氨基酸位置与趋化因子的核心结构域偶联，因此暴露在所述结构域的表面，导致所述趋化因子的拓扑结构的打断。所述融合蛋白的进一步特征在于，与未与所述支架蛋白融合的趋化因子配体相比，它保留了其趋化因子功能性。另一个实施方案公开了本发明的融合蛋白，其中支架蛋白和趋化因子核心结构域的融合导致趋化因子核心结构域的一级拓扑结构打断，与未与另一个蛋白质融合的趋化因子配体的折叠相比，允许保留所述趋化因子核心结构域的折叠和典型三级结构。在一个实施方案中，所述融合蛋白包含具有N-末端环、含有3条β-链的β折叠和C-末端螺旋的趋化因子核心结构域。在一个具体实施方案中，融合蛋白的所述趋化因子核心结构域中的暴露区域特别涉及连接β-链β2和β-链β3的β-转角。因此，支架蛋白在存在于那2条β链之间的β转角中的可及位点处被***核心结构域内。

可替换的实施方案涉及融合蛋白，其中所述细胞因子是白介素，优选“IL-1家族”白介素，并且其中所述支架蛋白在所述β-桶核心基序的暴露的β-转角中的一个或多个可及位点打断白介素β-桶核心基序的拓扑结构。在具体实施方案中，融合蛋白的所述保守β-桶核心基序中的暴露区域特别涉及连接β-链β6和β-链β7的β-转角。因此，支架蛋白在存在于那2条β链之间的β转角中的可及位点处被***核心基序内。

在本发明的另一个实施方案中，用于产生融合蛋白的支架蛋白是环状排列蛋白，更具体地，可以在所述支架蛋白的N-和C-末端之间进行环状排列。在某些实施方案中，环状排列的支架蛋白在所述支架蛋白的另一个可及位点处被切割，以提供与趋化因子核心结构域的可及位点融合的位点。本发明的另一个实施方案涉及融合蛋白，其中支架蛋白的总分子量为至少30kDa。

本发明的再一个方面涉及编码本文所述的任何融合蛋白的核酸分子。或者，在一个实施方案中，嵌合基因具有至少一个启动子，编码融合蛋白的所述核酸分子，以及包含转录终止信号的3'端区域。另一个实施方案涉及编码所述融合蛋白或包含编码所述融合蛋白的核酸分子的表达盒。进一步的实施方案涉及包含编码本发明融合蛋白的所述核酸分子的载体。在特定的实施方案中，所述载体适合于在大肠杆菌或本文提出的替代宿主中表达，并且适合于酵母、噬菌体、细菌或病毒(表面)展示。在另一个实施方案中，公开了包含本发明融合蛋白的宿主细胞。或者，其中共表达所述融合蛋白和能够结合融合蛋白的细胞因子部分的细胞因子或趋化因子受体的宿主细胞。

本发明的另一个方面涉及包含所述融合蛋白和细胞因子受体的复合物。更具体地，包含趋化因子或白介素受体(其能够结合融合蛋白的细胞因子部分，或特别是融合蛋白的趋化因子或白介素部分)和所述融合蛋白的复合物，其中所述受体蛋白特异性地结合所述融合蛋白。更具体地，其中所述受体蛋白与所述融合蛋白的细胞因子部分或替代地与所述融合蛋白的趋化因子或白介素部分结合，甚至更具体地，与融合蛋白的已知受体结合区结合。在某个实施方案中，如本文所述的复合物包含激活的受体，其中所述受体在其细胞因子受体结合区或特别地在其趋化因子或白介素受体结合区与融合蛋白结合时被激活。

本发明的另一个方面涉及一种用于测定细胞因子受体复合物的三维结构的方法，包括以下步骤：

(i)提供本发明的融合蛋白与细胞因子受体(如趋化因子/白介素受体)，以形成复合物，其中所述受体蛋白与融合蛋白的细胞因子特异性地结合，(如分别地，融合蛋白的趋化因子或白介素)，或替换地，提供本发明的复合物；

(ii)并在合适的条件下展示所述混合物或复合物，用于结构分析，

其中通过所述结构分析以高分辨率确定所述配体/受体复合物的3D结构。

另一个方面涉及一种用于生产如本文所述的功能性融合蛋白的方法，包括步骤：

a.选择细胞因子超家族，如趋化因子或白介素-1-样配体，以及支架蛋白，其3-D结构揭示了至少10kDa的折叠蛋白，其中细胞因子在暴露的β-环或β-转角中具有可及位点，用于打断氨基酸序列，而没有打断保守的细胞因子核心结构域的一级拓扑结构，

b.设计基因融合构建体，其中设计核酸序列以编码蛋白质序列，其中：

(i)细胞因子配体的蛋白质序列在与其保守核心结构域结构的两条β链之间(其是暴露于表面的β-环或β-转角)的位点相对应的氨基酸位置被打断，

(ii)细胞因子最N-末端打断的氨基酸位点(最N-末端β-链的C-末端与支架蛋白最N-末端打断的位点融合，细胞因子最C-末端打断的位点(最C-末端β-链的N-末端)与支架蛋白最C-末端打断的位点融合，

c.在表达***中引入所述基因融合构建体以获得融合蛋白，其中所述趋化因子在其核心结构域的两个或更多个位点与支架蛋白融合。

可替换的实施方案公开了用于生产如本文所述的融合蛋白的方法，包括步骤：

a.选择趋化因子和在其三级结构中具有可及环或转角的折叠支架蛋白，其被打断来形成融合蛋白的蛋白质序列，趋化因子或支架蛋白的一级拓扑结构没有打断，

(i)趋化因子的蛋白质序列在与其核心结构域结构的β-链β2和β-链β3之间的可及位点相对应的氨基酸处被打断，

(ii)支架蛋白至少为10kDa并且在其N-和C-末端融合，以获得环状排列的支架蛋白，

(iii)在对应于暴露的β-环或β-转角的可及位点在其氨基酸序列中进一步打断ii)的环状排列的支架蛋白，其不含在步骤ii)中融合的氨基酸，

(iv)将趋化因子β-链β2的C-末端打断的位点融合到环状排列的支架蛋白的最N-末端打断的氨基酸残基，即，N-末端，以及将趋化因子β-链β3的N-末端打断的位点融合到环状排列的支架蛋白的最C-末端打断的氨基酸残基，即，C-末端，

c.在表达***中引入所述基因融合构建体以获得融合蛋白，其中所述趋化因子在其核心结构域的两个或更多个位点与环状排列的支架蛋白融合。

另一个方面涉及本发明的融合蛋白的用途或核酸分子、载体、宿主细胞或复合物的用途，用于细胞因子配体/受体蛋白的结构分析。特别地，融合蛋白的用途，其中所述细胞因子受体(或趋化因子/白介素/……受体)蛋白是结合所述融合蛋白的蛋白质。具体地，一个实施方案涉及融合蛋白在包括单颗粒冷冻电镜或包括晶体学的结构分析中的用途。

附图描述

所描述的附图只是示意性的并且是非限制性的。在附图中，为了说明的目的，一些元件的尺寸可能被夸大并且未按比例绘制。

图1.柔性融合蛋白与刚性趋化因子嵌合蛋白的比较

(A)在趋化因子结构域和支架蛋白的N-或C-末端的柔性融合或接头，仅使用一个直接融合或接头。(B)趋化因子结构域和支架蛋白的刚性融合，其中趋化因子结构域经由至少两个将趋化因子结构域连接到支架的直接融合或接头与支架蛋白融合。这

图2.从***连接趋化因子的β-链β2和β3的β-转角的支架蛋白的环状排列变体构建趋化因子融合蛋白的工程化原理

该方案显示了如何通过连接趋化因子结构域和支架的两个肽键或两个短接头可以将趋化因子嫁接到大的支架蛋白上。剪刀指示必须在趋化因子和支架中切割哪些暴露的转角。虚线表示趋化因子和支架的剩余部分必须如何通过使用肽键或短肽接头连接来构建趋化因子嵌合蛋白。

图3.从***连接6P4-CCL5趋化因子的β-链β2和β3的β-转角中的HopQ的环状排列变体构建的50kDa 6P4-CCL5融合蛋白的模型1。

(A)趋化因子融合蛋白的模型，由趋化因子6P4-CCL5(顶部)和幽门螺杆菌(H.pylori)的HopQ的粘附素结构域的环状排列变体(底部)通过连接趋化因子和支架的两个肽键或接头融合而成。(B)将编码幽门螺杆菌株G27的1型HopQ的粘附素结构域的环状排列基因(底部，PDB5LP2，SEQ ID NO:2，c7HopQ)***6P4-CCL5(顶部，PDB 5UIW，SEQ ID NO:1)的连接β-链β2和β3的β-转角(β-转角β2-β3)中。(C)所得到的趋化因子嵌合蛋白的氨基酸序列(Mk_6P4-CCL5 ^c7HopQ，SEQ ID NO:3)。源自趋化因子的序列以粗体表示。源自HopQ的序列在两者之间。包括6xHis和EPEA的C-末端标签标记了虚线下划线。

图4.从***连接6P4-CCL5趋化因子的β-链β2和β3的β-转角中的HopQ的环状排列变体构建的50kDa 6P4-CCL5融合蛋白的模型2。

(A)趋化因子融合蛋白的模型，由趋化因子6P4-CCL5(顶部)和幽门螺杆菌(H.pylori)的HopQ的粘附素结构域的环状排列变体(底部)通过连接趋化因子和支架的两个肽键或接头融合而成。(B)将编码幽门螺杆菌株G27的1型HopQ的粘附素结构域的环状排列基因(底部，PDB5LP2，SEQ ID NO:2，c7HopQ)***6P4-CCL5(顶部，PDB 5UIW，SEQ ID NO:1)的连接β-链β2和β3的β-转角(β-转角β2-β3)中。(C)所得到的趋化因子嵌合蛋白的氨基酸序列(Mk_6P4-CCL5 ^c7HopQ，SEQ ID NO:4)。源自趋化因子的序列以粗体表示。源自HopQ的序列在两者之间。包括6xHis和EPEA的C-末端标签标记了虚线下划线。

图5.从***连接6P4-CCL5趋化因子的β-链β2和β3的β-转角中的HopQ的环状排列变体构建的50kDa 6P4-CCL5融合蛋白的模型3。

(A)趋化因子融合蛋白的模型，由趋化因子6P4-CCL5(顶部)和幽门螺杆菌(H.pylori)的HopQ的粘附素结构域的环状排列变体(底部)通过连接趋化因子和支架的两个肽键或接头融合而成。(B)将编码幽门螺杆菌株G27的1型HopQ的粘附素结构域的环状排列基因(底部，PDB5LP2，SEQ ID NO:2，c7HopQ)***6P4-CCL5(顶部，PDB 5UIW，SEQ ID NO:1)的连接β-链β2和β3的β-转角(β-转角β2-β3)中。(C)所得到的趋化因子嵌合蛋白的氨基酸序列(Mk_6P4-CCL5 ^c7HopQ，SEQ ID NO:5)。源自趋化因子的序列以粗体表示。源自HopQ的序列在两者之间。包括6xHis和EPEA的C-末端标签标记了虚线下划线。

图6.从***连接6P4-CCL5趋化因子的β-链β2和β3的β-转角中的HopQ的环状排列变体构建的50kDa 6P4-CCL5融合蛋白的模型4。

(A)趋化因子融合蛋白的模型，由趋化因子6P4-CCL5(顶部)和幽门螺杆菌(H.pylori)的HopQ的粘附素结构域的环状排列变体(底部)通过连接趋化因子和支架的两个肽键或接头融合而成。(B)将编码幽门螺杆菌株G27的1型HopQ的粘附素结构域的环状排列基因(底部，PDB5LP2，SEQ ID NO:2，c7HopQ)***6P4-CCL5(顶部，PDB 5UIW，SEQ ID NO:1)的连接β-链β2和β3的β-转角(β-转角β2-β3)中。(C)所得到的趋化因子嵌合蛋白的氨基酸序列(Mk_6P4-CCL5 ^c7HopQ，SEQ ID NO:6)。源自趋化因子的序列以粗体表示。源自HopQ的序列在两者之间。包括6xHis和EPEA的C-末端标签标记了虚线下划线。

图7.用于优化连接支架蛋白HopQ和趋化因子的接头肽的组成和长度的酵母展示载体。

(A)展示载体的示意图。LS：指引酵母中的胞外分泌的酵母α-因子appS4的工程化分泌信号(Rakestraw等，2009)。N：直至β-链β2的6P4-CCL5的N-末端部分(SEQ ID NO:1的1-43)；编码幽门螺杆菌株G27的1型HopQ的粘附素结构域的环状排列基因(底部，PDB 5LP2，SEQ ID NO:2，c7HopQ)；6P4-CCL5趋化因子的从β-链β3起的6P4-CCL5 C-末端(SEQ ID NO:1的47-69)；连接展示的蛋白Aga2p的柔性接头，Aga2p是酵母凝集素蛋白的粘附亚基，其通过到Aga1p蛋白的二硫键连接酵母细胞壁(Chao等，2006)；ACP：酰基载体蛋白，用于展示的趋化因子融合蛋白的正交标记，以监测其表达水平(Johnsson等，2005)。(B)展示的趋化因子融合蛋白的序列多样性(SEQ ID NO:25-28)：正常字体的AppS4前导序列，粗体表示的具有随机接头的Megakine Mk_6P4-CCL5 ^c7HopQ，(X)_1-2是可变长度(1或2个氨基酸)和混合组成的短肽接头，柔性(GGGS)_n多肽接头表示为斜体，Aga2p蛋白序列是下划线的，ACP序列是双下划线的，cMyc标签。(C)通过使用等摩尔混合的2个正向(SEQ ID NO:29，SEQ ID NO:30)和2个反向PCR引物(SEQ ID NO:31，SEQ ID NO:32)，来引入不同长度(1或2个氨基酸)和混合组成的短肽接头，产生了4个趋化因子融合蛋白序列池(每个表示25％的文库)，编码总共176400个AA-序列变体。

图8.通过酵母展示和二维流式细胞术连续轮选择趋化因子融合蛋白。

为了优化连接支架蛋白HopQ和趋化因子CCL5的接头肽的组成和长度，通过酵母展示和流式细胞术进行了选择。每个点表示用pCTCON2衍生物转化的分开的EBY100酵母细胞的两个荧光信号，所述衍生物编码通过具有不同长度和组成的接头与Aga2p和ACP融合的趋化因子融合蛋白Mk_6P4-CCL5 ^c7HopQ。使用SFP合酶(1μM)用CoA-547(2μM)将酵母细胞正交染色，以测量Megakine展示水平(Y-轴)。为了测量展示的Megakine是否含有折叠的CCL5部分，这些细胞用Alexa

647标记的抗人RANTES(CCL5)抗体补充染色(X-轴)。在第1轮中，用0.25mg/ml的Alexa

647抗人RANTES(CCL5)抗体孵育文库。分选了200000个对Megakine表达(PE通道)和抗人RANTES(CCL5)(647nm通道)展示了高荧光的酵母细胞。在第2轮中，我们用0.025mg/ml的Alexa

647抗人RANTES(CCL5)抗体孵育富集的文库。分选了20000个对Megakine表达(PE通道)和抗人RANTES(CCL5)(647nm通道)展示了最高荧光的酵母细胞，并接受序列分析。

图9.通过二维流式细胞术定性分析EBY100酵母细胞表面上的具有不同接头的四个不同的趋化因子融合蛋白的展示。

用编码与Aga2p和ACP融合的趋化因子融合蛋白Mk_6P4-CCL5 ^c7HopQ的pCTCON2衍生物转化的单独的EBY100酵母细胞的相对荧光强度的点图表示(A至D，分别是模型1至4，SEQ IDNO:7-10)。将展示MegaBody Mb_Nb207 ^cHopQ的酵母细胞用作阳性对照(E，SEQ ID NO:11)。在这个实验中，包括未转化的EBY100酵母细胞作为阴性对照(F)。使用SFP合酶(1μM)用CoA-547(2μM)将转化和未转化的酵母细胞同等地正交染色。

图10.通过流式细胞术定量分析EBY100酵母细胞表面上具有不同接头的四个不同的趋化因子融合蛋白的展示。

单参数直方图显示了与作为阳性对照的Mb_Nb207 ^cHopQ(SEQ ID NO:11)和作为阴性对照的未转化的EBY100酵母细胞相比，用编码与Aga2p和ACP融合的趋化因子融合蛋白Mk_6P4-CCL5 ^c7HopQ的pCTCON2衍生物转化的EBY100酵母细胞的相对荧光强度(版本1至4，SEQ IDNO:7-10)。使用SFP合酶(1μM)用CoA-547(2μM)将转化和未转化的酵母细胞正交染色。模型1、2、3、4是指实际克隆或融合蛋白。

图11.在EBY100酵母细胞表面上展示的Mk_6P4-CCL5 ^c7HopQ融合蛋白变体1和2的功能性的流式细胞分析。

用pCTCON2衍生物转化的单独的EBY100酵母细胞的相对荧光强度的点图表示，所述衍生物编码作为与Aga2p和ACP融合体的Mk_6P4-CCL5 ^c7HopQ融合蛋白模型1和2(SEQ ID NO:7和SEQ ID NO:8)。使用SFP合酶(1μM)用CoA-547(2μM)将酵母克隆诱导并正交染色，并用五个不同浓度的Alexa

647抗人RANTES(CCL5)抗体(分别为15、31、62、125和250ng/ml)孵育。y-轴展示了相对PE/CoA-547荧光的平均荧光强度(Megakine展示水平)。x-轴展示了相对Alexa

647抗人荧光RANTES(CCL5)抗体结合的平均荧光强度。模型1、2是指实际克隆。

图12.在EBY100酵母细胞表面上展示的Mk_6P4-CCL5 ^c7HopQ融合蛋白变体3和4的功能性的流式细胞分析。

用pCTCON2衍生物转化的单独的EBY100酵母细胞的相对荧光强度的点图表示，所述衍生物编码作为与Aga2p和ACP融合体的Mk_6P4-CCL5 ^c7HopQ融合蛋白模型3和4(SEQ ID NO:9和SEQ ID NO:10)。使用SFP合酶(1μM)用CoA-547(2μM)将酵母克隆诱导并正交染色，并用五个不同浓度的Alexa

647抗人RANTES(CCL5)抗体(分别为15、31、62、125和250ng/ml)孵育。y-轴展示了相对PE/CoA-547荧光的平均荧光强度(Megakine展示水平)，x-轴展示了相对Alexa

647荧光(RANTES(CCL5)抗体结合)的平均荧光强度。模型3、4是指实际克隆。

图13.在EBY100酵母细胞表面上展示的抗原结合嵌合蛋白Mb_Nb207 ^cHopQ的功能性的流式细胞分析。

用pCTCON2衍生物转化的单独的EBY100酵母细胞的相对荧光强度的点图表示，所述衍生物编码作为与Aga2p和ACP融合体的抗原结合嵌合蛋白Mb_Nb207 ^cHopQ(SEQ ID NO:11)。使用SFP合酶(1μM)用CoA-547(2μM)将酵母克隆诱导并正交染色，并用五个不同浓度的Alexa

647抗人RANTES(CCL5)抗体(分别为15、31、62、125和250ng/ml)孵育。y-轴展示了相对PE/CoA-547荧光的平均荧光强度(抗原结合嵌合蛋白展示水平)，x-轴展示了相对Alexa

647荧光(RANTES(CCL5)抗体结合)的平均荧光强度。

图14.四种不同的嵌合趋化因子与Alexa

647荧光RANTES(CCL5)结合的流式细胞定量分析。

用pCTCON2衍生物转化的单独的EBY100酵母细胞的计算的相对Alexa

647荧光的平均荧光强度(RANTES(CCL5)抗体结合)的图表表示，所述衍生物编码作为与Aga2p和ACP融合体的Mk_6P4-CCL5 ^c7HopQ融合蛋白模型1至4(SEQ ID NO:7-10)和阴性对照抗原结合嵌合蛋白Mb_Nb207 ^cHopQ(SEQ ID NO:11)。酵母克隆用五个不同浓度的Alexa

647抗人RANTES(CCL5)抗体(分别为15、31、62、125和250ng/ml)诱导并孵育。

图15.可以从酵母膜洗脱展示的趋化因子融合蛋白。

(A)酵母膜上展示的并使用1mM DTT洗脱的趋化因子融合蛋白的示意图。(B)12％SDS-PAGE，四个不同的变体和作为对照的抗原结合嵌合蛋白Mb_Nb207 ^cHopQ的洗脱级分。使用鼠抗cMYC一抗和山羊抗鼠碱性磷酸酶缀合抗体的相同凝胶的蛋白质印迹分析。通过分子量标记(箭头)证实了Mk_6P4-CCL5 ^c7HopQ的约50kDa的分子量。

图16.从酿酒酵母EBY100分泌的四种不同的重组趋化因子融合蛋白变体的表达的 SDS-PAGE和蛋白质印迹分析。

在酿酒酵母EBY100中表达His标记的融合蛋白Mk_6P4-CCL5 ^cHopQ模型1至4(SEQ ID NO:12-15)，与指引在酵母中的胞外分泌的appS4前导序列融合并通过镍亲和色谱(IMAC)纯化。(A)12％SDS-PAGE凝胶上上样的，用500mM咪唑洗脱的IMAC纯化的融合蛋白Mk_6P4-CCL5 ^c7HopQ。(B)使用鼠抗-His一抗和山羊抗鼠碱性磷酸酶缀合抗体的相同凝胶的蛋白质印迹分析。通过分子量标记(左线：M)证实了Mk_6P4-CCL5 ^c7HopQ的约50kDa的分子量。

图17.四种不同的重组趋化因子融合蛋白变体在大肠杆菌WK6周质中的表达的 SDS-PAGE和蛋白质印迹分析。

在大肠杆菌周质中表达了His标记的融合蛋白Mk_6P4-CCL5 ^c7HopQ模型1至4(SEQ ID NO:3-6)，并通过镍亲和色谱(IMAC)纯化。(A)12％SDS-PAGE凝胶上上样的，来自大肠杆菌提取物的和来自IMAC后用500mM咪唑洗脱的纯化蛋白质的融合蛋白Mk_6P4-CCL5 ^c7HopQ的样品。(B)使用鼠抗-His一抗和山羊抗鼠碱性磷酸酶缀合抗体的相同凝胶的蛋白质印迹分析。通过分子量标记(右线：M)证实了Mk_6P4-CCL5 ^c7HopQ的约50kDa的分子量。

图18.Mk_6P4c-CCL5 ^c7HopQ V1-V4融合蛋白变体对趋化因子受体CCR5的生物活性。

使用NanoLuc-竞争测定在HEK293T细胞中监测以不同稀释度(A)或Ni-NTA纯化后(B)大肠杆菌周质中产生的趋化因子融合蛋白变体诱导的miniGi到CCR5的募集。将HEK293T中产生的并稀释100倍的重组可溶性6P4-CCL5趋化因子用作阳性对照。将结果表示为优于未处理样品的发光的倍数增加。

使用NanoLuc-竞争测定在HEK293T细胞中监测以不同稀释度(C)或Ni-NTA纯化后(D)大肠杆菌周质中产生的趋化因子融合蛋白变体诱导的β-抑制蛋白-1到CCR5的募集。将HEK293T中产生的并稀释100倍的重组可溶性6P4-CCL5趋化因子用作阳性对照。将结果表示为优于未处理样品的发光的倍数增加。

图19.从***连接CXCL12趋化因子的β-链β2和β3的β-转角中的HopQ的环状排列变体构建的50kDa CXCL12融合蛋白的模型。

(A)趋化因子融合蛋白的模型，由CXCL12(顶部)和幽门螺杆菌的HopQ的粘附素结构域的环状排列变体(底部)通过连接趋化因子和支架的两个肽键或接头融合而成。(B)将编码幽门螺杆菌株G27的1型HopQ的粘附素结构域的环状排列基因(底部，PDB 5LP2，SEQ IDNO:2，c7HopQ)***CXCL12(顶部，SEQ ID NO:22)的连接β-链β2和β3的β-转角(β-转角β2-β3)中。(C)所得到的CXCL12趋化因子融合蛋白的氨基酸序列(Mk_CXCL12 ^c7HopQ，SEQ ID NO:23)。源自趋化因子的序列以粗体表示。源自HopQ的序列是普通文本。包括6xHis和EPEA的C-末端标签是虚线下划线的。

图20.从***连接6P4-CCL5趋化因子的β-链β2和β3的β-转角中的环状排列c1YgjK 变体构建的Mk_6P4-CCL5 ^c1YgjKV1，94kDa 6P4-CCL5融合蛋白的模型。

(A)趋化因子融合蛋白的模型，由趋化因子6P4-CCL5(顶部)和大肠杆菌的YgjK糖苷酶的环状排列变体(底部)通过连接趋化因子和支架的两个肽键或接头融合而成。(B)将编码大肠杆菌的YgjK糖苷酶的环状排列变体1基因(底部，PDB 3W7S，SEQ ID NO:36，c1YgjK)***6P4-CCL5(顶部，PDB 5UIW，SEQ ID NO:1)的连接β-链β2和β3的β-转角(β-转角β2-β3)中。(C)所得到的趋化因子嵌合蛋白的氨基酸序列(Mk_6P4-CCL5 ^c1YgjKV1，SEQ ID NO:38)。源自趋化因子的序列以粗体表示。两个氨基酸肽接头是下划线的。源自c1YgjK的序列在两者之间。

图21.从***连接6P4-CCL5趋化因子的β-链β2和β3的β-转角中的环状排列c1YgjK 变体构建的Mk_6P4-CCL5 ^c1YgjKV2，94kDa 6P4-CCL5融合蛋白的模型。

(A)趋化因子融合蛋白的模型，由趋化因子6P4-CCL5(顶部)和大肠杆菌的YgjK糖苷酶的环状排列变体(底部)通过连接趋化因子和支架的两个肽键或接头融合而成。(B)将编码大肠杆菌的YgjK糖苷酶的环状排列变体1基因(底部，PDB 3W7S，SEQ ID NO:36，c1YgjK)***6P4-CCL5(顶部，PDB 5UIW，SEQ ID NO:1)的连接β-链β2和β3的β-转角(β-转角β2-β3)中。(C)所得到的趋化因子嵌合蛋白的氨基酸序列(Mk_6P4-CCL5 ^c1YgjKV1，SEQ ID NO:39)。源自趋化因子的序列以粗体表示。一个氨基酸肽接头是下划线的。源自c1YgjK的序列在两者之间。

图22.从***连接6P4-CCL5趋化因子的β-链β2和β3的β-转角中的环状排列c1YgjK 变体构建的Mk_6P4-CCL5 ^c1YgjKV3，94kDa 6P4-CCL5融合蛋白的模型。

(A)趋化因子融合蛋白的模型，由趋化因子6P4-CCL5(顶部)和大肠杆菌的YgjK糖苷酶的环状排列变体(底部)通过连接趋化因子和支架的两个肽键或接头融合而成。(B)将编码大肠杆菌的YgjK糖苷酶的环状排列变体1基因(底部，PDB 3W7S，SEQ ID NO:36，c1YgjK)***6P4-CCL5(顶部，PDB 5UIW，SEQ ID NO:1)的连接β-链β2和β3的β-转角(β-转角β2-β3)中。(C)所得到的趋化因子嵌合蛋白的氨基酸序列(Mk_6P4-CCL5 ^c1YgjKV1，SEQ ID NO:40)。源自趋化因子的序列以粗体表示。源自c1YgjK的序列在之间。

图23.从***连接6P4-CCL5趋化因子的β-链β2和β3的β-转角中的环状排列c2YgjK 变体构建的Mk_6P4-CCL5 ^c2YgjKV1，94kDa 6P4-CCL5融合蛋白的模型。

(A)趋化因子融合蛋白的模型，由趋化因子6P4-CCL5(顶部)和大肠杆菌的YgjK糖苷酶的环状排列变体(底部)通过连接趋化因子和支架的两个肽键或接头融合而成。(B)将编码大肠杆菌的YgjK糖苷酶的环状排列变体B基因(底部，PDB 3W7S，SEQ ID NO:37，c2YgjK)***6P4-CCL5(顶部，PDB 5UIW，SEQ ID NO:1)的连接β-链β2和β3的β-转角(β-转角β2-β3)中。(C)所得到的趋化因子嵌合蛋白的氨基酸序列(Mk_6P4-CCL5 ^c2YgjKV1，SEQ ID NO:41)。源自趋化因子的序列以粗体表示。两个氨基酸肽接头是下划线的。源自c2YgjK的序列在两者之间。

图24.从***连接6P4-CCL5趋化因子的β-链β2和β3的β-转角中的环状排列c2YgjK 变体构建的Mk_6P4-CCL5 ^c2YgjKV3，94kDa 6P4-CCL5融合蛋白的模型。

(A)趋化因子融合蛋白的模型，由趋化因子6P4-CCL5(顶部)和大肠杆菌的YgjK糖苷酶的环状排列变体(底部)通过连接趋化因子和支架的两个肽键或接头融合而成。(B)将编码大肠杆菌的YgjK糖苷酶的环状排列变体B基因(底部，PDB 3W7S，SEQ ID NO:37，c2YgjK)***6P4-CCL5(顶部，PDB 5UIW，SEQ ID NO:1)的连接β-链β2和β3的β-转角(β-转角β2-β3)中。(C)所得到的趋化因子嵌合蛋白的氨基酸序列(Mk_6P4-CCL5 ^c2YgjKV3，SEQ ID NO:42)。源自趋化因子的序列以粗体表示。源自c2YgjK的序列在两者之间。

图25.通过二维流式细胞术定性分析EBY100酵母细胞表面上具有不同接头和拓扑结构的五个不同的趋化因子融合蛋白的展示。

用编码与Aga2p和ACP融合的趋化因子融合蛋白Mk_6P4-CCL5 ^c1YgjKV1-V3(A至C，分别是SEQ ID NO:43-45)以及与Aga2p和ACP融合的趋化因子融合蛋白Mk_6P4-CCL5 ^c2YgjKV1/V3(D至E，分别是SEQ ID NO:46-47)的pCTCON2衍生物转化的单独的EBY100酵母细胞的相对荧光强度的点图表示。将展示megakine Mk_6P4-CCL5 ^c7HopQV4(SEQ ID NO:10)的酵母细胞用作阳性对照(F，SEQ ID NO:11)。在这个实验中，包括展示MegaBody Mb_Nb207 ^cHopQ的酵母细胞(G，SEQ IDNO:11)和未转化的EBY100酵母细胞(H)作为阴性对照。使用SFP合酶(1μM)用CoA-547(2μM)将转化和未转化的酵母细胞同等地正交染色。

图26.在EBY100酵母细胞表面上展示的Mk_6P4-CCL5 ^c1/2YgjK融合蛋白变体的功能性的流式细胞分析。

用pCTCON2衍生物转化的单独的EBY100酵母细胞的相对荧光强度的点图表示，所述衍生物编码与Aga2p和ACP融合的Mk_6P4-CCL5 ^c1YgjK V1-V3(A至C，分别是SEQ ID NO:43-45)以及与Aga2p和ACP融合的Mk_6P4-CCL5 ^c2YgjK V1/V3(D至E，分别是SEQ ID NO:46-47)。将展示megakine Mk_6P4-CCL5 ^c7HopQV4(SEQ ID NO:10)的酵母细胞用作阳性对照(F，SEQ ID NO:11)。在这个实验中，包括展示MegaBody Mb_Nb207 ^cHopQ的酵母细胞(G，SEQ ID NO:11)和未转化的EBY100酵母细胞(H)作为阴性对照。使用SFP合酶(1μM)用CoA-547(2μM)将酵母克隆诱导并正交染色，并用80ng/mL浓度的Alexa

647抗人RANTES(CCL5)抗体孵育。y-轴展示了相对CoA-547荧光(Megakine展示水平)。x-轴展示了相对Alexa

647抗人荧光RANTES(CCL5)抗体结合。

图27.从***连接IL-1β白介素的β-链β6和β7的β-转角中的支架蛋白的环状排列变体构建白介素融合蛋白的工程化原理

该方案显示了如何经由连接趋化因子结构域和支架的两个肽键或两个短接头可以将白介素嫁接到大的支架蛋白上。剪刀指示必须在白介素和支架中切割哪些暴露的转角。虚线表示白介素和支架的剩余部分必须如何通过使用肽键或短肽接头连接来构建白介素嵌合蛋白。

图28.结合IL-1R1和IL-1RAcP的胞外结构域的IL-1β的晶体结构。

IL-1β·IL-1R·IL-1RAcP复合物以两个视图呈现，围绕垂直轴旋转90°。IL-1RII和IL 1RAcP表示为表面，IL-1β表示为带状结构。连接β-折叠β6和β7的β-转角由箭头突出显示。

图29.从***连接IL-1β白介素的β-链β6和β7的β-转角中的环状排列HopQ变体构建的Mk_IL-1β ^c7HopQV1，58kDa IL-1β融合蛋白的模型。

(A)趋化因子融合蛋白的模型，由人IL-1β白介素(顶部)和幽门螺杆菌(H.pylori)的HopQ的粘附素结构域的环状排列变体(底部)经由连接白介素和支架的两个肽键或接头融合而成。(B)将编码幽门螺杆菌HopQ的粘附素结构域的环状排列基因(底部，PDB 5LP2，SEQ ID NO:2，c7HopQ)***IL-1β白介素(顶部，PDB 3O4O，SEQ ID NO:48)的连接β-链β6和β7的β-转角(β-转角β6-β7)中。(C)所得到的白介素嵌合蛋白的氨基酸序列(Mk_IL-1β ^c7HopQV1，SEQ ID NO:49)。源自白介素的序列以粗体表示。两个氨基酸肽接头是下划线的。源自HopQ的序列在两者之间。

图30.从***连接IL-1β白介素的β-链β6和β7的β-转角中的环状排列HopQ变体构建的Mk_IL-1β ^c7HopQV2，58kDa IL-1β融合蛋白的模型。

(A)趋化因子融合蛋白的模型，由人IL-1β白介素(顶部)和幽门螺杆菌(H.pylori)的HopQ的粘附素结构域的环状排列变体(底部)经由连接白介素和支架的两个肽键或接头融合而成。(B)将编码幽门螺杆菌HopQ的粘附素结构域的环状排列基因(底部，PDB 5LP2，SEQ ID NO:2，c7HopQ)***IL-1β白介素(顶部，PDB 3O4O，SEQ ID NO:48)的连接β-链β6和β7的β-转角(β-转角β6-β7)中。(C)所得到的白介素嵌合蛋白的氨基酸序列(Mk_IL-1β ^c7HopQV2，SEQ ID NO:50)。源自白介素的序列以粗体表示。一个氨基酸肽接头是下划线的。源自HopQ的序列在两者之间。

图31.从***连接IL-1β白介素的β-链β6和β7的β-转角中的环状排列HopQ变体构建的Mk_IL-1β ^c7HopQV3，58kDa IL-1β融合蛋白的模型。

(A)趋化因子融合蛋白的模型，由人IL-1β白介素(顶部)和幽门螺杆菌(H.pylori)的HopQ的粘附素结构域的环状排列变体(底部)经由连接白介素和支架的两个肽键或接头融合而成。(B)将编码幽门螺杆菌HopQ的粘附素结构域的环状排列基因(底部，PDB 5LP2，SEQ ID NO:2，c7HopQ)***IL-1β白介素(顶部，PDB 3O4O，SEQ ID NO:48)的连接β-链β6和β7的β-转角(β-转角β6-β7)中。(C)所得到的白介素嵌合蛋白的氨基酸序列(Mk_IL-1β ^c7HopQV3，SEQ ID NO:51)。源自白介素的序列以粗体表示。源自HopQ的序列在之间。

详述

本发明将关于特定实施方案并参考某些附图进行描述，但本发明不限于此，而仅受权利要求的限制。权利要求中的任何附图标记不应被解释为限制范围。当然，应当理解，根据本发明的任何特定实施方案，不一定可以实现所有方面或优点。因此，例如本领域技术人员将认识到，本发明可以以实现或优化如本文所教导的一个或一组优点而不必实现如本文所教导或建议的其他方面或优点的方式来体现或实施。

当结合附图阅读以下详细描述时，通过参考以下详述，关于组织和操作方法，连同其特征和优点，可以最好地理解本发明。参考下文描述的实施方案，本发明的方面和优点将变得明显并被阐明。在整个说明书中对“一个(one)实施方案”或“一个(an)实施方案”的提及意味着结合本发明的至少一个实施方案中包括的实施方案描述的特定特征、结构或特性。因此，在本说明书中的各个地方出现的短语“在一个(one)实施方案中”或“在一个(an)实施方案中”不一定都指相同的实施方案，而是可以。类似地，应当理解，在对本发明的示例性实施方案的描述中，有时将本发明的各种特征组合在单个实施方案、图或对其的描述中，用于简化公开并帮助理解各个创造性方面中的一个或多个的目的。然而，这种公开方法不应被解释为反映要求保护的发明需要比每个权利要求中明确叙述的特征更多的特征的意图。相反，如以下权利要求所反映的，创造性方面在于少于单个前述公开的实施方案的所有特征。

定义

当指代单数名词时使用不定冠词或定冠词的情况中，例如“一个(a)”或“一个(an)”、“该(the)”，除非另有特定说明，否则包括该名词的复数形式。在本说明书和权利要求中使用术语“包括(comprising)”时，它不排除其他元件或步骤。此外，说明书和权利要求中的术语第一、第二、第三等用于区分相似的元件，并不一定用于描述顺序或时间顺序。应当理解，如此使用的术语在适当情况下是可互换的，并且本文描述的本发明的实施方案能够以不同于本文描述或说明的其他顺序进行操作。提供以下术语或定义仅用于帮助理解本发明。除非在此特别定义，否则在此使用的所有术语都具有本发明领域的技术人员已知的相同含义。从业者特别针对Sambrook等，Molecular Cloning:A Laboratory Manual，第4版，Cold Spring Harbor Press，Plainsview，纽约(2012)；和Ausubel等，CurrentProtocols in Molecular Biology(增刊114)，John Wiley&Sons，纽约(2016)，用于本领域的定义和术语。不应将本文提供的定义解释为具有低于本领域普通技术人员理解的范围。

当涉及诸如含量、时间持续之类的可测量值时，本文所使用的“约”意指包括距指定值±20％或±10％，更优选±5％，甚至更优选±1％，并且更优选±0.％的变化，因为这样的变化适合于执行所公开的方法。如本文所用的，“相似的”与一样、类似、相当、相应和如同可互换，并且意指具有相同或共同的特征，和/或以可量化的方式显示相当的结果，即具有20％、10％，更优选5％或甚至更优选1％或更少的最大变化。

如本文所用的，“核苷酸序列”、“DNA序列”或“核酸分子”是指任何长度的核苷酸(核糖核苷酸或脱氧核糖核苷酸)的聚合形式。该术语仅指分子的一级结构。因此，该术语包括双链和单链DNA以及RNA。它还包括已知类型的修饰，例如甲基化，一个或多个天然存在的核苷酸被类似物“加帽”取代。“核酸构建体”是指已经构建来包含一个或多个自然界中未一起发现的功能单元的核酸序列。实例包括环状、线性、双链、染色体外DNA分子(质粒)、粘粒(含有来自λ噬菌体的COS序列的质粒)、包含非天然核酸序列的病毒基因组等。

“编码序列”是置于适当调控序列的控制下时被转录成mRNA和/或翻译成多肽的核苷酸序列。编码序列的边界由5'-末端的翻译起始密码子和3'-末端的翻译终止密码子确定。编码序列可以包括但不限于mRNA、cDNA、重组核苷酸序列或基因组DNA，而在某些情况下内含子也可以存在。

如本文所用的，“基因的启动子区”是指功能性DNA序列单元，可操作地连接编码序列并可能置于适当的诱导条件下时，该DNA单元足以促进所述编码序列的转录。“可操作地连接”是指一种并置，其中所述的组成部分处于允许它们以其预期的方式起作用的关系中。以在与启动子序列相容的条件下实现编码序列表达的方式，启动子序列“可操作地连接”编码序列。如本文所用的，“基因”包括基因的启动子区域以及编码序列。它既指基因组序列(包括可能的内含子)，也指可操作地连接启动子序列的衍生自剪接信使的cDNA。术语“终止子”或“转录终止信号”包括其是在转录单元末端的DNA序列的控制序列，其指示初级转录物的3'加工和聚腺苷酸化以及转录终止。终止子可以衍生自天然基因、各种其他植物基因或T-DNA。待添加的终止子可以衍生自例如胭脂碱合酶或章鱼碱合酶基因，或替代地衍生自另一种植物基因，或更优选地衍生自任何其他真核基因。

“遗传构建体”、“嵌合基因”、“嵌合构建体”或“嵌合基因构建体”是指其中启动子或调控核酸序列可操作地连接或结合编码mRNA的核酸序列的重组核酸序列，使得调控核酸序列能够调控相关核酸编码序列的转录或表达。嵌合基因的调控核酸序列不与天然发现的相关核酸序列可操作地连接。特别地，如本文使用的术语“遗传融合构建体”是指编码翻译成本文公开的本发明的融合蛋白的mRNA的遗传构建体。

本文所用的术语“载体”、“载体构建体”、“表达载体”或“基因转移载体”旨在指能够运输与其连接的另一核酸分子的核酸分子，并且包括本领域技术人员已知的任何载体，包括任何合适的类型，包括但不限于质粒载体、粘粒载体、噬菌体载体(如λ噬菌体)，病毒载体(如腺病毒、AAV或杆状病毒载体)或人工染色体载体(如细菌人工染色体(BAC)、酵母人工染色体(YAC)或P1人工染色体(PAC))。表达载体包括质粒以及病毒载体，并且通常含有所需的编码序列以及在特定宿主生物(例如细菌、酵母、植物、昆虫或哺乳动物)中或在体外表达***中表达可操作地连接的编码序列所必需的合适的DNA序列。表达载体能够在引入它们的宿主细胞中自主复制(例如，具有在宿主细胞中起作用的复制起点的载体)。在将其他载体引入宿主细胞时，其可以整合到宿主细胞的基因组中，从而与宿主基因组一起复制。合适的载体根据需要并根据特定的宿主生物(例如细菌细胞、酵母细胞)具有调控序列，如启动子、增强子、终止子序列等。克隆载体通常用于工程化和扩增某些所需的DNA片段，并且可能缺少表达所需DNA片段需要的功能序列。用于转染原核细胞的表达载体的构建在本领域中也是公知的，并且因此可以通过标准技术来完成(参见，例如，Sambrook等，MolecularCloning:ALaboratory Manual，第4版，Cold Spring Harbor Press，Plainsview，New York(2012)；和Ausubel等，Current Protocols in Molecular Biology(增补114)，JohnWiley&Sons，New York(2016)，以获取本领域的定义和术语。

“宿主细胞”可以是原核或真核的。细胞可以是瞬时或稳定转染的。可以通过本领域已知的任何技术将表达载体转染到原核和真核细胞中，包括但不限于标准细菌转化、磷酸钙共沉淀、电穿孔或脂质体介导-、DEAE葡聚糖介导-、聚阳离子介导-或病毒介导的转染。对于所有标准技术，参见，例如，Sambrook等，Molecular Cloning:A Laboratory Manual，第4版，Cold Spring Harbor Press，Plainsview，New York(2012)；和Ausubel等，CurrentProtocols in Molecular Biology(增补114)，John Wiley&Sons，New York(2016)。在本文中，重组宿主细胞是已经被遗传修饰以含有本发明分离的DNA分子、核酸分子或表达构建体或载体的那些。可以通过本领域已知的适合特定细胞类型的任何方式引入DNA，包括但不限于转化、脂转染、电穿孔或病毒介导的转导。通过本领域已知的技术，如克隆、杂交筛选和聚合酶链反应(PCR)，可以容易地制备能够表达本发明的嵌合蛋白的DNA构建体。用于克隆、DNA分离、扩增和纯化，用于涉及DNA连接酶、DNA聚合酶、限制性核酸内切酶等的酶促反应的标准技术，以及各种分离技术是本领域技术人员已知的和常用的那些技术。Sambrook等(2012)，Wu(编辑)(1993)和Ausubel等(2016)描述了许多标准技术。可用于本发明的代表性宿主细胞包括但不限于细菌细胞、酵母细胞、植物细胞和动物细胞。适用于本发明的细菌宿主细胞包括埃希氏菌属(Escherichia)细胞、芽孢杆菌属(Bacillus)细胞、链霉菌属(Streptomyces)细胞、欧文氏菌属(Erwinia)细胞、克雷伯菌属(Klebsiella)细胞、沙雷氏菌属(Serratia)细胞、假单胞菌属(Pseudomonas)细胞和沙门氏菌属(Salmonella)细胞。适用于本发明的动物宿主细胞包括昆虫细胞和哺乳动物细胞(最特别地衍生自中国仓鼠(例如CHO)，以及人类细胞系，如HeLa。适用于本发明的酵母宿主细胞包括酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)(例如巴斯德毕赤酵母(Pichia pastoris))、汉逊酵母属(Hansenula)(例如多形汉逊酵母(Hansenula polymorpha))、Yarowia、施氏酵母属(Schwaniomyces)、裂殖酵母属(Schizosaccharomyces)、接合酵母属(Zygosaccharomyces)等内的种。酿酒酵母(Saccharomyces cerevisiae)、卡尔酵母(S.carlsbergensis)和乳酸克鲁维酵母(K.lactis)是最常用的酵母宿主。宿主细胞可以以悬浮或烧瓶培养物、组织培养物、器官培养物等形式提供。或者，宿主细胞也可以是转基因动物。

术语“蛋白质”、“多肽”、“肽”在本文中进一步可互换使用，是指氨基酸残基的聚合物以及其变体和合成类似物。因此，这些术语适用于其中一个或多个氨基酸残基是合成的非天然存在氨基酸(如相应天然存在的氨基酸的化学类似物)的氨基酸聚合物，以及天然存在的氨基酸聚合物。该术语还包括多肽的翻译后修饰，如糖基化、磷酸化和乙酰化。基于氨基酸序列和修饰，多肽的原子或分子量或重量以(千)道尔顿(kDa)表示。“重组多肽”是指使用重组技术，即通过表达重组或合成多核苷酸制备的多肽。重组生产嵌合多肽或其生物活性部分时，也优选基本上不含培养基，即培养基占少于约20％，更优选少于约10％，且最优选少于约5％蛋白质制剂的体积。“分离的”是指基本上或实质上没有通常在其天然状态下伴随其的组分的材料。例如，“分离的多肽”是指已经从天然存在状态下伴随其的分子中纯化的多肽，例如已经从与所述多肽相邻的生产宿主中存在的分子取出的如本文公开的融合蛋白。分离的嵌合体可以通过氨基酸化学合成来产生，或者可以通过重组产生来产生。表述“异源蛋白质”可以表示该蛋白质不是来自用于展示或表达该蛋白质的相同物种或品系。

“同源物”，蛋白质的“同源物”包括相对于所讨论的未修饰的蛋白质具有氨基酸取代、缺失和/或***并且与衍生它们的未修饰的蛋白质具有相似的生物学和功能活性的肽、寡肽、多肽、蛋白质和酶。如本文所用的，术语“氨基酸同一性”是指在比较窗口中，在氨基酸对氨基酸的基础上，序列相同的程度。因此，通过在比较窗口中比较两个最佳比对的序列，确定两个序列中均出现的相同氨基酸残基(例如，Ala、Pro、Ser、Thr、Gly、Val、Leu、Ile、Phe、Tyr、Trp、Lys、Arg、His、Asp、Glu、Asn、Gln、Cys和Met，在本文中也用一个字母代码表示)，以产生匹配的位置数，将匹配的位置数除以比较窗口中的位置总数(即窗口大小)，然后将结果乘以100，获得序列同一性的百分比，从而计算“序列同一性的百分比”。与亲本蛋白质或其片段的氨基酸序列或核苷酸序列相比，本文所用的“取代”或“突变”是分别由一个或多个氨基酸或核苷酸被不同的氨基酸或核苷酸替换引起的。可以理解，蛋白质或其片段可以具有保守的氨基酸取代，其对蛋白质的活性基本上没有影响。

术语“野生型”是指从天然产生来源分离的基因或基因产物。野生型基因是在群体中最常观察到的基因，因此该基因的“正常”或“野生型”形式被任意设计。相反，术语“修饰的”、“突变体”或“变体”是指与野生型基因或基因产物相比时，在序列、翻译后修饰和/或功能特性(即改变的特征)上显示出修饰的基因或基因产物。应当指出，可以分离天然存在的突变体；通过与野生型基因或基因产物相比，它们具有改变的特征这一事实来鉴定它们。

“蛋白质结构域”是蛋白质中不同的功能和/或结构单元。通常，蛋白质结构域负责特定功能或相互作用，有助于蛋白质的整体作用。结构域可以存在于多种生物环境中，其中在具有不同功能的蛋白质中可以发现相似的结构域。蛋白质二级结构元件(SSE)通常在蛋白质折叠成其三维三级结构之前自发地作为中间体形成。蛋白质的两种最常见的二级结构元件是α螺旋和beta(β)折叠，尽管也会出现β-转角和ω环。β-桶是由串联重复组成的β折叠，所述串联重复扭曲和卷曲形成闭合的环形结构，其中第一链结合最后的链(氢键)。许多β-桶中的β链以反平行的方式排列。β折叠由通过至少两个或三个骨架氢键侧向连接的beta链(也称为β链)组成，形成了大致扭曲的褶状片层。β-链是一条通常3至10个氨基酸长的多肽链，其主链呈延伸构象。β-转角是蛋白质中一种不规则的二级结构，其引起多肽链方向的变化。Bata转角(β转角、β-转角、β-弯头、紧弯、反向弯头或β-环(本文也称为环))是蛋白质和多肽中非常常见的基序，主要用于连接β-链。

术语“蛋白质的环状排列”或“环状排列的蛋白质”是指与野生型蛋白质序列相比，其氨基酸序列中的氨基酸顺序改变的蛋白质，因此获得具有不同的连通性，但总体上三维(3D)形状相似的蛋白质。蛋白质的环状排列类似于环状排列的数学概念，从某种意义上说，野生型蛋白质的第一部分的序列(与N-末端相邻)与所得的环状排列蛋白质的第二部分的序列(接近其C-末端)有关，如例如Bliven和Prlic(2012)中所述的。通过蛋白质序列的遗传或人工工程化，获得与其野生蛋白质相比的蛋白质环状排列，其中野生型蛋白质的N-和C-末端“相连”，并且蛋白质序列在另一个位点被打断，以形成所述蛋白质的新的N-和C-末端。本发明的环状排列支架蛋白是野生型蛋白序列连接的N-和C-末端以及所述支架蛋白的可接近或暴露位点(优选β-转角或环)处切割或打断序列的结果，从而与野生型蛋白的折叠相比，环状排列的支架蛋白的折叠得以保留或相似。所述环状排列的支架蛋白中N-和C-末端的所述连接可以是肽键连接或引入肽接头的结果，或者如果是野生型蛋白，是原始N-和C-末端附近的肽段的缺失，接着是肽键或其余氨基酸的结果。

如本文所用的，术语“融合”，以及在本文中可互换地用作“结合”，“缀合”，“连接”，尤其是指“遗传融合”，例如通过重组DNA技术，以及是指导致稳定的共价连接的“化学和/或酶结合”。

术语“嵌合多肽”、“嵌合蛋白”、“嵌合体”、“融合多肽”、“融合蛋白”或“非天然存在的蛋白质”在本文中可互换使用，并且是指包含至少两个可能来自或可能不来自同一蛋白质的单独的且不同的多肽成分。该术语还指非天然存在的分子，这意味着它是人造的。涉及嵌合多肽(如本文所定义的)时，术语“融合”和其他语法等同形式，如“共价连接”，“结合”，“附上”，“连接”，“缀合”，是指连接两个或多个多肽成分的任何化学或重组机制。两个或更多个多肽组分的融合可以是序列的直接融合，或者可以是间接融合，例如使用***氨基酸序列或接头序列或化学接头。如本文所述的，两个多肽或细胞因子(如趋化因子)与支架蛋白的融合也可以指通过化学连接获得的非共价融合。例如，趋化因子核心结构域的β2β-链的C-末端和β3β-链的N-末端都可以连接化学单元，该化学单元能够在暴露或可及位点结合与部分或全长(环状排列)支架蛋白连接或融合的互补化学单元或结合口袋。

如本文所用的，术语“蛋白质复合物”或“复合物”是指一组两个或更多个结合的大分子，其中至少一个大分子是蛋白质。如本文所用的，蛋白质复合物通常是指可以在生理条件下形成的大分子缔合。蛋白质复合物的各个成员通过非共价相互作用连接。蛋白质复合物可以是仅蛋白质的非共价相互作用，因此被称为蛋白质-蛋白质复合物；例如，两种蛋白质、三种蛋白质、四种蛋白质等的非共价相互作用。更具体地，是融合蛋白和趋化因子受体的复合物，或趋化因子或包含趋化因子的配体蛋白质(如融合蛋白)与其特异性结合的互动物的复合物，所述互动物如能够结合细胞因子或趋化因子配体的细胞因子或趋化因子受体。基于趋化因子的融合蛋白的蛋白质复合物，通过其趋化因子受体相互作用区(其N-末端)结合趋化因子受体，因此成为结合所述趋化因子配体，结合趋化因子受体，将是本文使用的所形成的复合物。或者，基于白介素-1型配体的融合蛋白的蛋白质复合物，通过其IL-1受体结合，可以是本文使用的复合物。例如，其可以用于3D结构分析中，其中目的在于分辩细胞因子配体受体和细胞因子相互作用位点(其是融合蛋白的一部分)之间的结构和相互作用。更具体地，其中在结构上分析趋化因子和趋化因子受体的相互作用或结合位点。不太相关的是是否确定融合蛋白的整个结构。将理解蛋白质复合物可以是多聚的。蛋白质复合物装配可导致同型多聚或杂多聚复合物的形成。此外，相互作用可以是稳定的或短暂的。术语“多聚体”、“多聚复合物”或“多聚蛋白质白”包括多个相同或异源的多肽单体。

如本文所用的，术语“确定”、“测量”、“评估”和“测定”可互换使用，并且包括定量和定性测定。

术语“合适的条件”是指环境因素，如温度、运动、其他成分和/或“缓冲条件”，其中，“缓冲条件”具体是指在其中进行测定的溶液的组成。所述组合物包括缓冲溶液和/或溶质，如pH缓冲物质、水、盐水、生理盐溶液、甘油、防腐剂等，本领域技术人员知道将其合适地用于获得最佳测定性能。

“结合”是指任何相互作用，无论是直接的还是间接的。直接的相互作用互意味着结合伴侣之间的接触。间接的相互作用是指相互作用伴侣在多于两个分子的复合物中相互作用的任何相互作用。在一个或多个桥接分子的帮助下，相互作用可以是完全间接的，或者在伴侣之间仍然存在直接接触的情况下，可以是部分间接的，这通过一个或多个分子的额外相互作用而得以稳定。通常，结合结构域可以是基于免疫球蛋白的或免疫球蛋白样的，或者可以基于蛋白质中存在的结构域，包括但不限于微生物蛋白、蛋白酶抑制剂、毒素、纤连蛋白、脂质运载蛋白、单链反平行卷曲螺旋蛋白或重复基序蛋白。结合还包括配体与其受体之间的相互作用，如对于趋化因子和趋化因子受体相互作用。术语“特异性结合”是指识别特定靶标但基本上不识别或结合样品中的其他分子的结合结构域。对于趋化因子，已知用于特异性结合趋化因子受体的配体，因此结合其受体是特异性的。然而，在许多情况中，一个亚家族的趋化因子可以结合相同家族的受体，因此特异性结合部排除结合另一个趋化因子受体。因此，特异性结合不是表示排他性结合。然而，特异性结合确实表示这样的配体或反之这样的受体对一个或几个趋化因子受体或反之配体具有一定增加的亲和力或偏好。如本文所用的，术语“亲和力”通常是指配体(如本文进一步定义的)与靶蛋白结合的程度，以使靶蛋白和配体的平衡向着由它们的结合形成的复合物的存在转移。因此，例如，在受体和配体以相对相等的浓度结合的情况下，高亲和力的配体将结合受体，从而使平衡向着高浓度的所得复合物移动。

确定氨基酸的空间构象的方法是本领域已知的，并且包括例如X射线晶体学和多维核磁共振。蛋白质的“构象”或“构象状态”通常是指蛋白质在任何瞬间都可以采用的结构范围。本领域技术人员将认识到，构象或构象状态的决定簇包括如蛋白质的氨基酸序列(包括修饰的氨基酸)所反映的蛋白质的一级结构和蛋白质周围的环境。蛋白质的构象或构象状态还涉及结构特征，如蛋白质二级结构(例如，α-螺旋、β-折叠等)、三级结构(例如，多肽链的三维折叠)和四级结构(例如，多肽链与其他蛋白质亚基的相互作用)。多肽链的翻译后修饰和其他修饰，如配体结合、磷酸化、硫酸化、糖基化或疏水基团的连接等，可能会影响蛋白质的构象。此外，环境因素，如pH、盐浓度、离子强度和周围溶液的重量克分子渗透压摩尔浓度，以及与其他蛋白质和辅助因子的相互作用等，都可以影响蛋白质构象。蛋白质的构象状态可以通过针对活性或与另一分子的结合的功能测定或通过物理方法(如X射线晶体学，NMR或自旋标记)来确定。对于蛋白质构象和构象状态的一般性讨论，可以参考Cantor和Schimmel，Biophysical Chemistry，第I部分：The Conformation ofBiological.Macromolecules,.W.H.Freeman and Company，1980，和Creighton，Proteins:Structures and Molecular Properties,W.H.Freeman and Company，1993。

最后，在本发明的内容中，术语“功能性融合蛋白”或“构象选择性融合蛋白”是指任选以构象选择性的方式在结合其细胞因子或特别地白介素-或趋化因子-受体蛋白中和/或在这种受体的激活/灭活中(取决于已知的配体：激动剂、拮抗剂、反向激动剂)起作用的融合蛋白。选择性结合靶蛋白的特定构象的结合域是指与靶标采取的其他构象相比，构象子集中以更高亲和力结合靶标的结合结构域。本领域技术人员将认识到，选择性结合靶标的特定构象的结合域将使靶标稳定或保留在这个特定构象中。例如，活性状态构象-选择性结合结构域将优先结合处于活性构象状态的靶标，并且将不结合或以较小的程度结合非活性构象状态的靶标，且因此对所述活性构象状态将具有更高的亲和力；或反之亦然。术语“特异性地结合”、“选择性地结合”、“优先结合”及其语法等效表述在本文中可互换使用。术语“构象特异性”或“构象选择性”在本文中也可互换使用。

详述

本文提出了设计刚性融合的含细胞因子的功能性融合蛋白的新概念。新的融合蛋白源自细胞因子和支架蛋白之间的融合体的生成，其中支架蛋白是打断了细胞因子的拓扑结构的折叠蛋白，以这样的方式，所述细胞因子仍然以其典型的折叠出现，并与非融合的细胞因子配体相比，以相似的方式起作用，特异性地结合其同源受体。新的融合蛋白在本文被证明为源自具有基于保守的二级β-链的核心结构域或基序的细胞因子的融合体，所述细胞因子如趋化因子细胞因子或白介素(IL)-1家族。所述“含β-链核心结构域”或“含β-链结构域”细胞因子在本文可互换使用，它们的氨基酸序列被支架蛋白***，导致改变的细胞因子蛋白的拓扑结构，尽管如此，它仍然令人惊讶地以其典型的折叠出现，并与非融合的细胞因子配体相比，以相似的方式起作用，特异性地结合其受体。虽然在其天然状态下通常不连接，但多肽组分的经典连接通过直接或通过肽键连接它们各自的氨基(N-)和羧基(C-)末端以形成单个连续多肽来进行。这些融合体常常通过柔性接头制得，或者至少以柔性方式连接，这意味着融合伙伴彼此之间并没有处于稳定的位置或构象。如图1A中呈现的，通过N-和C-末端连接蛋白质，简单的线性串联，融合很容易，但可能不稳定，容易降解，因此在某些情况下会导致非功能性配体蛋白。另一方面，本文提出的刚性嵌合/融合蛋白在两个或多个蛋白质的一级拓扑结构内具有一个或多个融合点或连接，具有至少一个非柔性融合点(图1B)。本发明固有地包含细胞因子配体蛋白，其中通过形成数个融合体来禁止细胞因子蛋白相对于其融合伙伴(支架蛋白)旋转或弯曲。通过在同一嵌合体中存在几个融合体，获得了本发明的新嵌合体改进的刚性，这是完美设计融合位点以允许仍然可以保留其细胞因子结构域折叠的融合体及其结合其靶标的功能的结果。蛋白质的刚性实际上是蛋白质(在这种情况下是新型嵌合体)(三级)结构所固有的。已经表明，通过改变已知蛋白质折叠的拓扑结构可以获得增加的刚度(King等，2015)。在本发明的融合蛋白中形成的融合体的刚性因此提供了足够强的刚性以“定向”或“固定”融合细胞因子配体特异性结合的细胞因子受体，尽管大部分刚性仍将低于靶标本身的刚性。然而，本发明的刚性融合蛋白仍然保持其受体结合和激活功能性的事实是令人惊讶的观察，因为初级拓扑结构的打断可能已经导致结构域或蛋白质折叠的改变，影响三级拓扑结构和受体结合或激活。尽管技术人员有能力使用用于涉及此类融合体的结构信息，但从外源引入细胞中的新核酸构建体翻译的融合蛋白的实际折叠仍然是不可预测的。本文已经证明了这种一级拓扑结构的打断没有影响受体结合或激活，导致涉及细胞因子受体结构生物学和药物发现领域中的功能性和治疗相关途径的开辟，如本文具体在趋化因子和IL受体领域中显示的。本发明涉及提供独特的下一代融合技术和高亲和力和/或构象选择性趋化因子/IL-受体结合潜力的新组合，以允许蛋白质的非共价结合。根据细胞因子家族的类型，如趋化因子或趋化因子变体，一级IL或IL-1受体型白介素，或用于产生融合蛋白的折叠支架蛋白的类型，这种新型功能性融合蛋白有助于多种有价值的应用。优势是众多的，可直接用于结构生物学中，促进冷冻电镜和X射线晶体学，用于难处理的蛋白质，如7跨膜蛋白，作为GPCR。通过使用这种下一代融合技术，可以在GPCR和IL-受体复合物的结构生物学中预见到跳跃性的前进，因为刚***工具是目前可用的并且在完全执行中，也可以使用这些工具来研发改进的、更稳固的治疗和诊断分子，如通过基于结构的药物设计和基于结构的新化合物筛选。时尚，在细胞因子受体的构象选择性识别中时，如活性构象，更具体地激动剂、部分激动剂或偏向激动剂构象。根据细胞因子配体或配体变体，基于特定的细胞因子(趋化因子或IL)配体发现了本发明的融合蛋白的更多应用，所述配体描述为特异性地稳定可施药(druggable)信号构象使得能够筛选途径选择性激动剂。随着生物技术中此类技术的快速发展，可预见本发明将影响新型蛋白质疗法的创造和当前蛋白质药物的性能改进。

在第一个方面中，本发明涉及包含与支架蛋白融合的细胞因子的功能性融合蛋白，其中所述支架蛋白连接细胞因子蛋白，使得通过所述细胞因子结构折叠中可及的至少一个或多个氨基酸位点的融合打断所述细胞因子的拓扑结构。所述融合蛋白是“功能性的”，因为与未与所述支架蛋白融合的，其天然或野生型形式的细胞因子配体相比，其保留了相似方式的受体结合功能性。在一个实施方案中，所述融合蛋白是构象选择性结合结构域。细胞因子包含非常多样的配体超家族，优选的细胞因子超家族是具有基于β-链或含β-链的保守核心结构域或基序的那些，揭示了在使这些β-链相互连接的β-转角或环中存在的暴露区域的可及氨基酸位点。新的融合体应当包含离细胞因子的受体结合位点足够远的可及位点，这样不会扰乱受体结合以保留其功能性。事实是细胞因子是相对小的蛋白质，给设计这样的功能性融合体增加了一层复杂性，并且因此本文所呈现的提供了一种令人惊讶的解决方法，使得技术人员在这些基于β-链的细胞因子保守的核心结构域暴露的β-转角衍生可及位点。

在第一个实施方案中，本发明涉及包含属于趋化因子超家族的细胞因子的融合蛋白，所述细胞因子与支架蛋白融合，其中所述支架蛋白是至少50个氨基酸的折叠蛋白，并且与趋化因子核心结构域连接，使得通过在折叠其暴露的β-转角的所述趋化因子核心结构域中可及的至少一个或多个氨基酸位点的融合打断所述核心结构域的拓扑结构。所述融合蛋白的再一个特征在于与未与所述支架蛋白融合的，其天然或野生型形式的趋化因子相比，其保留了相似方式的受体结合功能性。因此，在一个实施方案中，所述融合蛋白是构象选择性结合结构域。

已经根据成熟蛋白质N-末端邻近的半胱氨酸残基的特征性模式，将趋化因子蛋白质配体分成四个亚家族CC、CXC、C和CX3C，其中X是任何氨基酸。然而，所有趋化因子的基础三级结构或构造都含有无序的N-末端“信号结构域”，接着是结构化的“核心结构域”，其含有N-环、三条链的β-折叠和C-末端螺旋(图2)。

在每个亚家族内，许多趋化因子结合多个受体并且几个受体结合许多趋化因子。已知趋化因子二聚化，并且不同亚家族之间的不同二聚化基序最初被认为是定义受体特异性。然而，功能分析表明，实际上单体结合并激活受体，而寡聚化似乎对结合葡糖胺聚糖至关重要。通常，趋化因子核心结构域与趋化因子受体的N-末端形成相互作用位点或趋化因子识别位点1(CRS1)，而趋化因子的N-末端与受体的受体-配体结合口袋相互作用(趋化因子识别位点2，CRS2)。第一个相互作用是受体N-末端与趋化因子核心结构域(CRS1)的结合，允许正确定位趋化因子N-末端信号结构域，使其与CRS2 TM口袋相互作用。许多结构研究已经表明了受体结合和激活至少可以部分解耦。然而，需要对具有完整受体的构象特异性复合物进行进一步的高分辨率结构分析。从历史上看，由于跨膜受体的性质和因此分析更易处理的可溶性复合物的限制，这在大多数使用NMR方法的情况下一直是极具挑战性的。

磺基酪氨酸在受体中的结构作用已经确定，它允许与趋化因子的β2-β3发夹或环中的同源碱性残基形成盐桥。认为与受体的趋化因子界面涉及核心结构域的β-折叠的N-环和β2-β3链。尽管事实是CRS1结合后的结构重排在复合物与复合物之间不同，但禁止简化识别和激活机制，强调需要更好的结构确定工具。事实上，许多修饰的趋化因子也已被应用于阐明特定受体在疾病中的作用，表明细胞因子领域内的配体药理学，并且更特定的趋化因子将受益于对受体保持高亲和力的微妙操作，但导致适应的功能结果，如激动剂、反向激动剂、拮抗剂或超激动剂/拮抗剂特征。事实上，一般的原型伴侣，如本文提出的融合蛋白，提供了一种解决方案来剖析趋化因子配体/受体相互作用和激活机制特征。已知伴侣蛋白(如纳米抗体)有助于稳定膜受体构象(Manglik等，2017年)，尽管在某种构象中，这些类型的伴侣不允许迫使受体进入其中受体仅与特定配体结合的构象。此外，新型趋化因子融合蛋白还可以为针对完整受体的某些受体构象状态的药物筛选提供优势。到目前为止，很少有使用完整受体(CXCR4/vMIP-II、US28/CX3CL1)确定趋化因子/受体复合物结构，以及最近使用蛋白质抑制剂的CCR5受体_，如5P7-CCL5为导致HIV抑制的趋化因子受体信号传导提供了新的见解。后者已经证明了配体5P7-CCL5与CCR5相互作用的方式不是从双位点模型中准确预测的，如上所述，因为5P7-CCL5的N-环、β1-链和30s-环是与受体的主要相互作用位点。以前，使用例如受体的N-末端肽和配体(CXCL8/CXCR1肽；CXCL12/CXCR4硫肽、CCL11/CCR3肽)获得了更多的结构数据，但有仅获得对结构天然内容的局部视图的风险。

另一个实施方案涉及新的融合蛋白，其中所述细胞因子是白介素，其中所述支架蛋白在所述β-桶核心基序暴露的β-转角中的一个或多个可及位点打断了白介素β-桶核心基序的拓扑结构。更具体地，融合蛋白中的所述细胞因子是IL-1受体白介素。细胞因子的白介素1(IL-1)超家族是先天性和获得性免疫的重要调节剂，在对抗感染的宿主防御、炎症、损伤和应激中起着关键作用。本文可互换使用的“IL-1受体型白介素”超家族或“IL-1家族”白介素包括白介素IL-1、IL-1α、IL-1β、IL-18、IL18BP、IL1F5、IL1F6、IL1F7、IL1F8、IL1F10、IL-33和IL-36、IL36B和IL-37。这些细胞因子彼此在来源、受体结构和信号传导途径方面相关。IL-1超家族白介素的受体共享相似的构造，由其胞外结构域中的三个Ig-样结构域和Toll样受体中也发现的胞内Toll/IL-1R(TIR)结构域组成。细胞因子信号传导的启动需要两个受体，主要的特异性受体和在一些情况中可以共享的辅助受体。主要受体负责特异性的细胞因子结合，而辅助受体自身不结合细胞因子，但与从细胞因子和主要受体预先装配的二元复合物结合。细胞因子与其各自的受体的结合导致信号传导三元复合物，导致两种受体的TIR结构域的二聚化。这通过激活有丝***原激活的蛋白激酶(MAPK)和激活的B细胞的核因子κ-轻链增强子(NF-κB)启动胞内信号传导。该信号传导诱导了炎症应答，如2型环加氧酶的诱导，增加的粘附分子的表达和一氧化氮的合成。

已经测定了IL-1超家族的几种白介素细胞因子的三维结构，并且证明了尽管具有有限的序列相似性，但这些细胞因子采用由以三重折叠对称模式排列的12条反平行β-链组成的保守特征性β-三叶形折叠。β-桶核心基序被每个细胞因子结构中的不同含量的螺旋包装。每个人细胞因子的Cα原子的叠加揭示了保守的疏水性核心，在环区域中具有显著的灵活性。β-链之间的表面残基和环没有显示出对于整体稳定性是重要的并且在细胞因子之间明显不同，这与它们低的序列相似性一致，并且部分地解释了它们对各自受体的独特识别(涉及特定的环)。例如，人IL-18与鼠IL-18共享～65％序列同一性，而与人IL-1α和人IL-1β分别仅共享15％和18％同一性。尽管如此，IL-18在其三维结构中与其他IL-1细胞因子显示出惊人的相似性。因此，这种IL-1样受体白介素提供了细胞因子内超家族的第二个实例，其具有基于β链的保守结构核心结构域，该结构域通过灵活的β转角或环相互连接，其中一些参与受体识别，和其他可能参与连接折叠的支架蛋白，如本文所示的，以获得新的扩大的融合配体。

一个实施方案提供了细胞因子融合蛋白，其中基于β-链的保守核心结构域以支架蛋白“打断”核心结构域的拓扑结构的方式与支架蛋白融合。一般来说，蛋白质的“拓扑结构”是指在三维空间中规则的二级结构相对于彼此的取向。蛋白质折叠主要由多肽链拓扑结构来定义(Orengo等，1994)。因此，在最基本的层面上，“一级拓扑结构”被定义为二级结构元件(SSE)的序列，其负责蛋白质折叠识别基序，从而负责二级和三级蛋白质/结构域折叠。因此，就蛋白质结构而言，真正的或主要的拓扑结构是SSE的序列，即如果想象能够保持蛋白质链的N-和C-末端，并将其拉直，则拓扑结构不会改变任何蛋白质折叠。然后将蛋白质折叠描述为三级拓扑结构，类似于蛋白质的一级和三级结构(还参见Martin，2000)。

具体而言，如本文所述的，本发明的趋化因子功能性融合蛋白的趋化因子核心结构域因此在其一级拓扑结构中被打断，通过在趋化因子核心结构域的β2和β3β-链之间暴露的β-转角或环的可及位点引入支架蛋白融合体，其允许保留其3D折叠，并且出乎意料地，所述趋化因子还保留了其三级结构，从而允许保留其功能性受体结合能力。类似地，IL-1样受体白介素IL-1β具有保守的β-桶核心基序，如本文所述的，通过***折叠支架蛋白，在保守核心的2条β-链之间的暴露的β-转角处，从保守的β-桶核心基序打断一级拓扑结构，令人惊讶地保留了结合能力，从而提供了正确折叠的或功能性的融合蛋白。

如本文所述的，“支架蛋白”是指具有允许与另一种蛋白(特别是与细胞因子或趋化因子)融合的结构的任何类型的蛋白。蛋白质折叠的经典原理是蛋白质采用正确的三维构象所需的所有信息都由其氨基酸序列提供，从而通过各种分子相互作用将特定的折叠蛋白结合在一起。为了在本文中用作支架，支架蛋白必须折叠成不同的三维构象。因此，所述支架蛋白在本文中被定义为“折叠的”蛋白，将氨基酸长度限制到有一个最小值，因为对于短肽，众所周知它们非常灵活，并且不提供折叠结构。因此，用于新型功能性融合蛋白的支架蛋白本质上不同于肽或非常小的多肽，如由40个或更少氨基酸组成的那些，不被认为是合适的融合为Megakine的支架蛋白。因此，本文定义的“支架蛋白”是至少200个氨基酸，或150个氨基酸，或至少100个氨基酸，或至少50个氨基酸，或更优选至少40个氨基酸，至少30个氨基酸、至少20个氨基酸、至少10个氨基酸、至少9个氨基酸的折叠蛋白。接头或肽，特别是8个或更少氨基酸的接头，不适合作为用于本发明目的的支架蛋白。此外，这种“支架”、“连接”或“融合伙伴(fusion partner)”蛋白优选在其三级结构中具有至少一个暴露区域，以提供至少一个可及位点，以切割作为用于细胞因子或趋化因子的融合点。支架多肽用于与细胞因子或趋化因子核心结构域组装，从而形成呈对接构型的融合蛋白，以增加质量、提供对称性和/或提供扩大的配体，以诱导等价受体的特定构象状态和/或提高或增加对受体的功能性。因此，根据所使用的支架蛋白的类型，可以预见到所得到的融合蛋白的不同目的。支架蛋白的类型和性质无关紧要，因为它可以是任何蛋白质，并且根据其结构、大小、功能或存在，与所述细胞因子或趋化因子核心结构域融合的支架蛋白，如在本发明的融合蛋白中的，将用于不同的应用领域中。支架蛋白的结构将影响最终的嵌合结构，因此本领域技术人员应在支架蛋白上实施已知的结构信息，并在选择支架时考虑合理的预期。本申请实施例中提供了支架蛋白的实例，并且非限制数量的支架蛋白是酶、膜蛋白、受体、适体蛋白、分子伴侣、转录因子、核蛋白、抗原结合蛋白本身，如纳米抗体等，可用作支架蛋白以产生本发明的融合蛋白。在优选实施方案中，所述支架蛋白的3D结构是已知的或者可以由技术人员预测，因此可以由所述技术人员确定与细胞因子或其保守核心结构域融合的可及位点。

新的嵌合或融合蛋白以独特的方式融合，以避免连接是嵌合蛋白结构内的柔性、松散、弱连接/区域。连接或融合两个多肽的方便方法是通过从重组核酸分子作为融合蛋白来表达它们，该重组核酸分子包括以经典的已知方式与编码第二多肽的第二多核苷酸可操作地连接的编码第一多肽的第一多核苷酸。然而，在本发明的重组核酸分子中，所述支架打断细胞因子或其保守的核心结构域的拓扑结构也反映在表达所述融合蛋白的基因融合体的设计中。因此，在一个实施方案中，功能性融合蛋白由嵌合基因编码，所述嵌合基因通过将编码细胞因子或具体的趋化因子或IL的基因的一部分与编码支架蛋白的基因的一部分重组而形成，其中所述编码的支架蛋白通过至少两个或多个直接融合或由编码的肽接头形成的融合在所述暴露的β-转角中的结构域的一个或多个可及位点打断编码的细胞因子，或具体的所述趋化因子或IL保守核心结构域的一级拓扑结构。因此，将编码待融合多肽的多核苷酸片段化和重组，以这样的方式提供融合蛋白，该融合蛋白在所述蛋白质之间提供刚性的非柔性连接、结合或融合。通过将支架蛋白与细胞因子或具体的保守的趋化因子或IL核心结构域融合制得新的嵌合体，以这样的方式使得细胞因子或保守核心结构域的一级拓扑结构被打断，这意味着细胞因子核心结构域的氨基酸序列在可及位点被打断并与支架蛋白的可及氨基酸连接，因此该序列也可能被打断。连接在分子内进行，换句话说，在氨基酸序列内内部进行(参见实施例和附图)。因此，本发明的重组融合不仅产生了在N-或C-末端融合的功能性嵌合体，而且包括至少一个内部融合位点，其中这些位点直接融合或通过接头肽融合。将环状排列的支架用于产生融合蛋白的情况中，通过连接N-和C-末端，然后在支架蛋白序列内的另一个位点(对应于其三级结构中的可及位点)切割或分离氨基酸序列，与细胞因子或趋化因子/IL部分的氨基酸序列融合，可以改变所述支架蛋白的氨基酸序列。用于获得环状排列的所述N-和C-末端连接可以通过直接融合、接头肽，或者甚至通过N-和C-末端附近区域的短缺失，然后通过末端的肽键来实现。

术语“可及位点”、“融合位点”或“融合点”或“连接位点”或“暴露位点”在本文中可互换使用，并且均指结构上可及的蛋白质序列的氨基酸位点，优选位于蛋白质表面，或暴露于表面，更优选位于暴露的β-转角或环区域。从本文提供的公开内容，本领域技术人员将能够得出用于趋化因子的那些位点。细胞因子(如趋化因子或IL)的受体-结合或激活位点常常涉及这样的暴露区域，如例如趋化因子的无序N-末端信号结构域或N-环，或IL-1的β-链4和β-链5之间的β-转角。然而，那些用于将趋化因子与支架蛋白融合的位点的打断可以导致受体-结合或激活能力的丢失，这不适用于本发明的融合蛋白，并且因此不打算在本文用作可及融合位点。因此，如本文所述的，作为“环”或“β转角”的“可及位点”和“暴露区域”是指那些不是受***点或区域的位点和区域，或可能不扰乱受体结合位点(例如，在空间上)。所述结合位点可能在靶向的受体方面不同，但通常将涉及趋化因子的N-末端信号结构域和N-环以及相应的IL-1型受体白介素的β4和β5之间的β-转角。在大部分情况中，蛋白质的N-末端或C-末端也是蛋白质3D-结构的“松散”末端，并且因此从表面是可及的。可以认为这些是本发明的嵌合体中的可及位点，除非受体结合或激活需要这样的末端是游离的，并且条件是细胞因子/趋化因子核心结构域中的至少一个其他的可及位点用于融合，这导致在可及位点的打断/***，打断了拓扑结构，因为这后一种可及位点融合将给新的前合体提供刚性。因此，可及位点可以因此包括蛋白质的氨基-和/或羧基-末端位点，但嵌合体不能仅基于由N-或C-末端组成的可及位点的融合。将趋化因子/IL核心结构域的至少一个或多个位点用于与支架蛋白融合，从而导致已知常规结构域折叠的拓扑结构的打断。因此，在一个实施方案中，如果至少一个是一个，至少一个可及位点不是所述结构域的N-末端和/或C-末端位点，和/或不包括所述结构域的N-或C-末端位点。在特定的实施方案中，至少一个位点不是所述结构域的N-或C-末端氨基酸。在另一个实施方案中，至少一个以上的位点用于与支架蛋白融合时，可及位点可以是保守核心结构域的N-或C-末端位点。支架蛋白也通过从其三级结构可见的可及位点融合，为此，在一个实施方案中，所述至少一个位点不是支架蛋白的N-或C-末端，而在可替换的实施方案中，至少一个位点是所述支架的N-或C-末端。在一些实施方案中，融合蛋白包含在所述保守核心结构域的暴露区域中的打断处融合的所述支架蛋白的N-末端片段以及与所述保守核心附近的C-末端融合的所述支架蛋白的C-末端片段。

在本发明的一些实施方案中，融合体可以是直接融合体，或通过接头肽形成的融合体，所述融合体被完美地设计，以获得刚性的、非柔性的融合蛋白。除了选择的可及位点的位置，接头肽的长度和类型也有助于所得嵌合蛋白的刚性以及可能有助于功能性。在本发明的内容中，将构成融合蛋白的多肽彼此通过经由肽键的连接直接融合，或间接融合，由此通过经由短肽接头的连接间接偶联装配两个多肽。优选的“接头分子”、“接头”或“短多肽接头”是具有最大十个氨基酸的长度的肽，更可能是四个氨基酸，通常仅为三个氨基酸长度，但优选仅两个或甚至更优选仅单个氨基酸，以给可及位点的融合连接提供所需的刚性。合适的接头序列的非限制性实例在实施例部分中描述，其可以是随机的，并且其中已经成功地选择了接头以保持结构域之间的固定距离，以及保持融合伙伴的独立功能(例如，受体结合)。在涉及使用刚性接头的实施方案中，通常已知这些通过采用α-螺旋结构或通过含有多个脯氨酸残基而呈现出独特的构象。在许多情况下，它们与也可能是合适的柔性接头相比，更有效地分离功能性结构域，优选短的仅有1-4个氨基酸的长度。

在可替换的实施方案中，将融合蛋白描述为刚性融合蛋白，其包含i)细胞因子(如趋化因子或IL)的N-末端氨基酸序列，ii)功能性支架蛋白，和iii)缺少所述i)的N-末端氨基酸序列的细胞因子(如趋化因子或IL)序列，其中i)和iii)连接所述ii)的支架蛋白。在优选实施方案中，所述刚性融合蛋白包含N-末端氨基酸序列，其对应于趋化因子N-末端信号结构域，接着是含有β-折叠的头两条β-链的趋化因子核心结构域的部分，与支架蛋白或环状排列支架蛋白的氨基酸序列融合，其在其序列中被打断并在对应于暴露的表面环或转角中的位点的可及位点融合，最后与趋化因子的剩余部分融合，其含有核心结构域的β3链，和所述结构域的C-末端螺旋。因此，在一个打断的氨基酸序列位点获得支架蛋白掺入趋化因子蛋白序列中，所述位点对应于趋化因子核心结构域的β2-β3转角或环中的可及位点，其在趋化因子的结构术语学中也称为40s-环。

在一个实施方案中，趋化因子核心结构域的可及位点在结构域折叠的暴露区域中。所述暴露区域鉴定为不太固定的氨基酸链，其主要位于蛋白质的表面，或在结构的边缘上。优选，暴露的区域呈现为蛋白质结构的环或β转角。趋化因子核心结构域的“暴露区域”的最直接鉴定是暴露的环，优选β-转角，其是位于β-折叠3D-结构边缘的暴露环。对于三条链的β-折叠结构，可能的是包含β1-β2转角或环，也称为30s环，或β2-β3转角或环，也称为40s-环。在某些趋化因子受体复合物中，已知30s-环涉及受体结合，并且因此与40s-环相比，对于支架融合时的打断，不太优选。

在另一个实施方案中，支架蛋白具有环状排列。在优选实施方案中，所述支架蛋白的环状排列存在于支架蛋白的N-和/或C-末端，或最优选存在于支架蛋白的N-和C-末端之间。另一个实施方案提供了包含至少2条反平行β链的支架蛋白。

在一个实施方案中，通过在其对应于β2-β3转角的序列中的切割可及位点打断细胞因子或趋化因子核心结构域，通过在对应于其结构(其中所述暴露的或可及位点不是N-或C-末端)的暴露区域的序列中的切割可及位点与环状排列的支架蛋白融合，将细胞因子或趋化因子核心结构域连接支架获得融合蛋白(使用两个肽键或两个短接头)。因此，在其中支架蛋白的环状排列在N-和C-末端的特定实施方案中(如图2中)，可以将支架蛋白序列与细胞因子或趋化因子片段重组融合成为整体(如图7中)。在特定的实施方案中，所述融合蛋白通过另外产生由位于细胞因子或趋化因子内的半胱氨酸残基形成的加强二硫桥使得其刚性增强。

本发明的再一个方面涉及包含与支架蛋白融合的细胞因子的新型功能性融合蛋白，所述细胞因子如包含趋化因子或IL核心结构域的细胞因子，其中所述支架蛋白打断所述细胞因子趋化因子/IL保守核心结构域的拓扑结构，和其中支架蛋白的总质量或分子量为至少30kDa，使得通过融合体与靶标(如配体的受体)的结合增加质量和结构特征将是重要的并且足以允许非共价结合所述前合体时靶标的三维结构分析。在另一个实施方案中，支架蛋白的总质量或分子量为至少40，至少45，至少50或至少60kDa。这种特定的尺寸或质量增加将影响图像中的信噪比降低。其次，嵌合体将通过提供足够的特征来提供结构指导，用于小或难以结晶的蛋白质的精确图像对齐，以使用冷冻电镜和X射线晶体学达到足够高的分辨率。

本发明的再一个方面涉及编码本发明所述融合蛋白的核酸分子。所述核酸分子包含所述细胞因子、趋化因子或白介素和所述支架蛋白，和/或其片段的编码序列，其中所述结构域打断的拓扑结构反映在所述结构域序列将含有支架蛋白序列(或环状排列的序列，或其片段)***的事实中，使得N-末端细胞因子、趋化因子，或IL-片段和C-末端细胞因子、趋化因子或IL-保守核心结构域片段在所述核酸分子内被支架蛋白序列或其片段隔开。在另一个实施方案中，嵌合基因被描述为具有至少启动子，所述编码融合蛋白的核酸分子和含有转录终止信号的3'端区域。另一个实施方案涉及编码本发明的所述融合蛋白的表达盒，或包含编码所述融合蛋白的核酸分子或嵌合基因的表达盒。在某些实施方案中，所述表达盒以通用形式作为文库应用，含有大量细胞因子(如趋化因子或白介素)融合体以选择最合适的受体或抗体或可替换的靶标或相互作用伴侣的结合剂。进一步的实施方案涉及包含编码本发明融合蛋白的所述表达盒或核酸分子的载体。在特定的实施方案中，用于在大肠杆菌中表达的载体允许产生融合蛋白并在其靶标存在或不存在的情况下纯化。可替换的实施方案涉及宿主细胞，其包含本发明的融合蛋白，或编码本发明的融合蛋白的核酸分子或表达盒或载体。在特定实施方案中，所述宿主细胞进一步共表达靶蛋白或例如特异性结合融合蛋白的细胞因子(如趋化因子或IL)的受体。另一个实施方案公开了所述宿主细胞或其分离的膜制剂或从中分离的蛋白质用于配体筛选、药物筛选、蛋白质捕获和纯化或生物物理研究的用途。提供所述载体的本发明进一步包括在通用融合载体中进行高通量克隆的选择。在另外的实施方案中描述了所述通用载体，其中所述载体特别适合在酵母、噬菌体、细菌或病毒中的表面展示。此外，所述载体可应用于选择和筛选包含具有大量不同配体，特别是具有例如不同接头的此类通用载体或表达盒的文库。因此，为筛选用于特定受体的新型融合蛋白而构建的所述文库中的差异序列由接头序列的差异或替换地其他区域中的差异提供。

在一个实施方案中，本发明的载体适用于涉及在细胞群的胞外表面上展示细胞因子融合蛋白集合的方法中。表面展示方法概述于Hoogenboom(2005；Nature Biotechol 23，1105-16)，并且包括细菌展示、酵母展示、(细菌)噬菌体展示。优选，细胞群是酵母细胞。不同的酵母表面展示方法都提供紧密连接由文库编码的每个融合蛋白与携带编码该蛋白的质粒的酵母细胞的胞外表面的方式。迄今为止描述的大部分酵母展示方法使用酿酒酵母(Saccharomyces cerevisiae)，但其他酵母种，例如，巴斯德毕赤酵母，也可以使用。更具体地，在一些实施方案中，酵母株来自选自酵母属、毕赤酵母属、汉逊酵母属、裂殖酵母属、克鲁维酵母属、耶氏酵母属和假丝酵母属的属。在一些实施方案中，酵母种选自酿酒酵母、巴斯德毕赤酵母、多形汉逊酵母、粟酒裂殖酵母、乳酸克鲁维酵母、解脂耶氏酵母和白色假丝酵母。大部分酵母表达融合蛋白基于GPI(羰基-磷脂酰-肌醇)锚定蛋白，其在细胞表面蛋白的表面表达中起着重要作用，并且对于酵母的生活力至关重要。一种这样的蛋白质，α-凝集素，由AGA1编码的核心亚基组成并且通过二硫化物桥连接AGA2编码的小结合亚基。由核酸文库编码的蛋白质可以引至AGA1的N-末端区域上或AGA2的C-末端或N-末端区域上。两种融合模式都将导致多肽在酵母细胞表面上的展示。

本文公开的载体还适用于原核宿主细胞在表面上展示蛋白质。用于这个目的的合适的原核生物包括真细菌，如革兰氏阴性或革兰氏阳性生物体，例如，肠杆菌科(Enterobacteriaceae)，如埃希氏菌属(Escherichia)，例如大肠埃希氏菌(E.coli)，肠杆菌属(Enterobacter)，欧文氏菌属(Erwinia)，克雷伯菌属(Klebsiella)，变形杆菌属(Proteus)，沙门氏菌属(Salmonella)，例如鼠伤寒沙门氏菌(Salmonella typhimurium)，沙雷氏菌属(Serratia)，例如粘质沙雷氏菌(Serratia marcescans)和志贺氏菌属(Shigella)，以及芽孢杆菌属(Bacilli)，例如枯草芽孢杆菌(B.subtilis)和地衣芽孢杆菌(B.licheniformis)(例如，在1989年4月12日公开的DD266,710中公开的地衣芽孢杆菌41P)，假单胞菌属(Pseudomonas)，如铜绿假单胞菌(P.aeruginosa)和链霉菌属(Streptomyces)。一种优选的大肠埃希氏菌克隆宿主是大肠埃希氏菌294(ATCC 31,446)，尽管其他株，如大肠埃希氏菌B、大肠埃希氏菌1776(ATCC 31,537)和大肠埃希氏菌W3110(ATCC 27,325)，是合适的。这些实例是说明性的，而非限制性的。宿主细胞是原核细胞时，合适的细胞表面蛋白的实例包括合适的细菌外膜蛋白。这样的外膜蛋白包括菌毛和鞭毛、脂蛋白、冰核蛋白和自转运蛋白。用于异源蛋白质展示的示例性细菌蛋白包括LamB(Charbit等，EMBO J，5(11)：3029-37(1986))、OmpA(Freudl，Gene，82(2)：229-36(1989))和内膜蛋白(Wentzel等，J Biol Chem，274(30)：21037-43，(1999))。另外的示例性外膜蛋白包括但不限于FliC、支链淀粉酶、OprF、OprI、PhoE、MisL和溶细胞素。Lee等，TrendsBiotechnol，21(1)：45-52(2003)，Jose，Appl Microbiol Biotechnol，69(6)：607-14(2006)和Daugherty，Curr Opin Struct Biol，17(4)：474-80(2007)中详细介绍了已用于表面展示的细菌膜蛋白的广泛列表。

此外，为了进行深入的筛选选择，可将载体应用于酵母和/或噬菌体展示，然后分别进行FACS和淘选。例如，酵母细胞上细胞因子或趋化因子融合蛋白的显示结合荧光激活细胞分选(FACS)的分辨能力，提供了一种优选的选择方法。在酵母展示中，每种细胞因子或趋化因子融合蛋白例如都以与Aga2p蛋白的融合体形式展示，在单个细胞表面上～50,000个拷贝。对于通过FACS的选择，用不同荧光染料标记将决定选择程序。接下来，可以用所用荧光蛋白的混合物将展示抗原结合嵌合体的酵母文库染色。然后可以使用双色FACS来分析在特定酵母细胞上展示的每种融合蛋白的特性，以分辨不同的细胞群。展示高度适合于靶向目标蛋白质的融合蛋白的酵母细胞将结合，并可以在双色FACS中沿对角线进行分类。例如，需要筛选特异性靶向瞬时蛋白-蛋白相互作用或构象选择性结合状态的融合蛋白时，最优选将载体用于这种选择方法。类似地，施加用于噬菌体展示的载体，并用于在噬菌体上展示融合蛋白，然后淘选。例如可以通过使所述通用载体内的细胞因子或趋化因子融合蛋白与噬菌体衣壳蛋白III融合而在M13颗粒上进行展示(Hoogenboom，2000；Immunology.5699：371-378)。例如，为了选择特异性结合某些构象和/或瞬时蛋白-蛋白相互作用的融合蛋白，仅将相互作用的原体之一固定在固相上。然后通过淘选噬菌体展示的融合蛋白来进行生物选择，该方法是在过量的剩余可溶性原体存在下进行的。任选，可以从固定在固相上的交联复合物或蛋白质的一轮淘选开始。

本发明的另一个方面涉及包含所述融合蛋白和受体蛋白的复合物，其中所述受体蛋白特异性地结合细胞因子，如趋化因子或白介素，其中包括其他类型的细胞因子及其同源受体。更特别地，一个实施方案涉及其中所述受体蛋白结合所述融合蛋白的细胞因子部分的蛋白质复合物。一个实施方案公开了如本文所述的复合物，其中所述融合蛋白的细胞因子或趋化因子或IL是构象选择性配体。更特别地，公开了其中融合蛋白的细胞因子或趋化因子或IL部分稳定功能性构象的受体蛋白的复合物。更具体地，其中，所述功能性构象可以涉及激动剂构象，可以涉及部分激动剂构象，或偏向激动剂构象。或者，公开了本发明的复合物，其中融合蛋白的细胞因子或趋化因子或IL稳定功能性构象的受体蛋白，其中所述功能性构象是无活性构象，或其中所述功能性构象涉及反向激动剂构象。另一个实施方案涉及与其受体的复合物中的所述细胞因子融合蛋白或趋化因子或IL融合蛋白，其中受体在结合融合蛋白后被激活。如本文之前所述的，各种细胞因子受体，包括趋化因子和/或IL受体，需要几个界面来结合配体，以获得激活的状态。

本发明的另一个实施方案涉及生产根据本发明的细胞因子功能性融合蛋白的方法，包括步骤(a)在有助于融合蛋白表达的条件下，培养包含本发明的载体、表达盒、嵌合基因或核酸序列的宿主，和(b)任选，回收表达的多肽。

更具体的实施方案涉及用于生产如本文所述的趋化因子融合蛋白的方法，包括步骤：(a)选择趋化因子配体和支架蛋白_，其3-D结构揭示了暴露区域(如环或转角)中的可及位点，用于打断氨基酸序列，而没有打断一级拓扑结构，(b)设计遗传融合构建体，其中设计核酸序列以编码由核酸序列分子编码的蛋白质序列，其中：

1.趋化因子序列的打断存在于对应于趋化因子蛋白保守核心结构域结构的β-链β2和β-链β3之间的可及位点的位置，

2.用于通过融合其5’和3’核酸序列端***的支架序列(因此作为整体)，或用于通过融合所述支架的可替换的打断位点***的支架蛋白，其序列存在于所述支架蛋白的可及位点序列，如环或β-转角，

3.趋化因子的最5’打断的序列3’端(对应于β-链β2的氨基酸残基C-末端)与支架蛋白的最5’-(打断的)位点的5’起始融合，且趋化因子的最C-末端打断的位点的5’起始(对应于β-链β3的氨基酸残基N-末端)与支架蛋白的最C-末端打断的位点的3’端融合，

(c)在表达***中引入所述遗传融合构建体，以获得融合蛋白，其中所述趋化因子在其核心结构域的两个或更多个位点与支架蛋白融合。

可替换的实施方案公开了一种用于生产或产生如本文所述的功能蛋白的方法，包括步骤：(a)选择趋化因子配体和在其三级结构中具有可及环或转角的支架蛋白，其可以打断以形成融合蛋白而没不打断趋化因子的一级拓扑结构和/或支架蛋白的一级拓扑结构，

(b)设计遗传融合构建体，其中设计核酸序列以编码表达宿主中的蛋白质，其中：

1.趋化因子的蛋白质序列在对应于核心结构域的β-链β2和β-链β3之间的可及位点的氨基酸处被中断，

2.将支架蛋白的N-末端和C-末端融合，得到环状排列的支架蛋白，

3.2.的环状排列支架蛋白然后在其对应于三级序列的暴露环或转角中的可及位点的氨基酸序列中被打断，其是不同于步骤2中融合的氨基酸的打断位点。

4.将趋化因子N-末端部分的C-末端(即β-链β2趋化因子C-末端的打断位点)与环状排列支架蛋白的N-末端融合，和趋化因子C-末端部分的N-末端起始(即β-链β3的趋化因子N-末端的打断位点)与环状排列支架蛋白的C-末端融合，

(c)将所述遗传融合构建体引入表达***，以获得融合蛋白，其中所述趋化因子在其核心结构域的两个或更多个位点与环状排列支架蛋白融合。

另一个方面涉及本发明的细胞因子功能性融合蛋白的用途或核酸分子、嵌合基因、表达盒、载体或复合物的用途，所述用途在其同源受体蛋白的结构分析中。特别地，基于β-链核心结构域的细胞因子融合蛋白在受体蛋白的结构分析中的用途，其中所述受体蛋白是特异性结合所述融合蛋白的所述细胞因子的蛋白质。如本文使用的，“分解结构”或“结构分析”是指确定蛋白质的原子排列或原子坐标，并且通常通过生物物理方法来完成，如X射线晶体学或冷冻电子显微镜(冷冻电镜)。具体地，一个实施方案涉及在结构分析中的用途，包括单颗粒冷冻电镜或包括晶体学。本发明的这些细胞因子融合蛋白在结构生物学中的使用提供了可以用作结晶助剂的主要优势，即起晶体接触的作用并增加对称性，甚至更多地用作冷冻电镜中的刚性工具，冷冻电镜对于分解大型的难点靶标的结构将非常有价值，以减少当今所应付的尺寸障碍，还增加了对称性，并稳定和观察与所述细胞因子或趋化因子融合蛋白的复合物中的靶标的特异性构象状态。

与更传统的方法(如X射线晶体学)相比，使用冷冻电镜进行结构确定具有多个优势。特别是，冷冻电镜在纯度、均质性和数量方面对待分析样品的要求不那么严格。重要的是，冷冻电镜可以应用于不会形成合适的用于结构确定的晶体的靶标。可以将单独的或与其他蛋白质分子(如本发明的细胞因子融合蛋白)或非蛋白质分子(如核酸)复合物中的纯化的或未纯化的蛋白质的悬浮液施加于碳网上，以通过冷冻电镜成像。涂覆的格栅通常在液态乙烷中闪冻，以将悬浮液中的颗粒保持为冷冻水合状态。较大的颗粒可以通过冷冻固定玻璃化。可以在冷冻超薄切片机中将玻璃化的样品切成薄片(通常为40至200nm厚)，并将这些切片放在电子显微镜栅格上进行成像。通过使用平行照明和更好的显微镜对准可以获得高达

的分辨率，从而改善从图像获得的数据的质量。在这样的高分辨率下，从头开始建立完整原子结构的模型是可能的。然而，在可以使用选定的或紧密相关的靶蛋白和选定的异源蛋白或紧密同源物的原子分辨率的结构数据可用于约束比较建模的情况下，则较低分辨率的成像可能就足够了。为了进一步提高数据质量，可以仔细对准显微镜，以揭示在用于成像的相同条件下记录的碳膜图像的傅里叶变换中，可见对比度传递函数(CTF)环超过

然后可以使用如CTFFIND之类的软件确定每张显微照片的散焦值。

此外，本文公开了用于确定配体/受体复合物的三维结构的方法，包括步骤：(i)提供根据本发明的融合蛋白，和提供受体，以形成复合物，其中所述受体蛋白结合本发明的融合蛋白的细胞因子部分，或提供如上文所述的复合物；(ii)在合适的条件下展示所述复合物，用于结构分析，其中在高分辨率下确定所述蛋白质复合物的3D结构。

在特定的实施方案中，通过X-射线晶体学进行所述结构分析。在另一个实施方案中，所述3D分析包括冷冻电镜。更具体地，本文如下描述了一种用于冷冻电镜分析的方法。印迹前将样品(例如，在与目标受体的复合物中的选择的融合蛋白)施加到选择的性能最佳的放电网格上(碳涂层铜网格，C-Flat，1.2/1.3 200目)：Electron Microscopy Sciences；金R1.2/1.330目UltraAuFoil网格：Quantifoil等)，然后在液态乙烷中急冻(VitrobotMarkIV(FEI)或选择的其他急冻机)。单个网格的数据是在配备有选择的探测器(例如，Falcon 3EC直接探测器)的300kV电子显微镜(以Krios300kV为例，带有选择的补充相板)下收集的。显微照片以电子计数模式以适合预期的配体/受体复合物大小的适当放大倍率收集。手动检查收集的显微照片，然后再进行进一步的图像处理。通过选择的软件(例如RELION，SPHIRE包)应用漂移校正、射束感应运动、剂量加权、CTF拟合和相移估计。使用选择的软件挑选粒子，并将其用于2D分类。手动检查2D分类，并消除假阳性。根据数据收集设置对粒子进行分类。通过应用适当的低通滤波器来生成初始3D参考模型，并生成多个(以六个为例)3D分类。使用原始粒子进行3D细化(如果需要，使用软蒙板)。通过使用傅立叶壳相关(FSC)＝0.143标准来估计重建分辨率。本地分辨率可以通过Scipion中的MonoRes实施来计算。重建的冷冻电镜图谱可以使用UCSF Chimera和Coot软件进行分析。最初可以使用UCSFChimera拟合设计模型，然后通过选择的软件(UCSF Chimera，PyMOL或Coot)进行分析。

本发明方法的另一个优点是，由于使用细胞因子融合蛋白，以常规方式只能用高纯度蛋白质才能进行的结构分析对纯度的要求不那么严格了。这样的细胞因子配体融合蛋白，更特别地此类基于β-链保守核心结构域的细胞因子融合蛋白，如趋化因子或IL-融合蛋白，将通过在复杂混合物中的高亲和力结合位点而特异性地滤出目标受体。受体蛋白可以通过这种方式被捕获、冷冻并通过冷冻电镜进行分析。

所述方法在可替换的实施方案中也适用于3D分析，其中受体蛋白是瞬时蛋白-蛋白复合物或处于瞬时特定的构象状态。另外，所述融合蛋白分子也可以用于确定受体的三维结构的方法中以稳定作为靶标的瞬时蛋白-蛋白相互作用以进行其结构分析。

另一个实施方案涉及选择或筛选与相同受体蛋白的不同构象结合的一组融合蛋白的方法，包括步骤：(i)设计结合受体蛋白的融合蛋白的配体文库，和(ii)通过表面酵母展示、噬菌体展示或细菌噬菌体选择融合蛋白以获得包含与所述受体蛋白的几个相关构象状态结合的蛋白质的融合蛋白组，从而允许在分开的图像中例如在冷冻电镜中分析受体蛋白的几种构象。为了获得特定的或某些构象状态，可以使用基于细胞的***，其中受体在膜上，其中可以根据实验目的处理或操纵所述细胞。

在另一个实施方案中，本发明的所述方法和所述融合蛋白用于基于结构的药物设计和基于结构的药物筛选。基于结构的药物设计的迭代过程通常会经过多个周期，然后才能将优化的先导引入I期临床试验。第一个周期包括通过三种主要方法之一的受体蛋白或核酸的克隆、纯化和结构测定：X射线晶体学、NMR或同源性建模。使用计算机算法，将数据库中的化合物或化合物片段置于结构的选定区域中。可以使用本发明的融合蛋白来固定或稳定受体的某些结构构象。根据所选化合物与该靶标位点的空间和静电相互作用对其进行评分和排名，并通过生化分析测试最佳化合物。在第二个周期中，对与来自第一个周期的具有前景的先导(在体外至少具有微摩尔抑制作用)的复合物中的靶标进行结构测定，揭示了可以优化以提高效力的化合物上的位点。同样在这一点上，本发明的融合蛋白可以发挥作用，因为它有助于对某种构象状态的所述靶受体蛋白进行结构分析。其他周期包括优化先导的合成，确定新靶标:先导复合物的结构以及进一步优化先导化合物。在药物设计过程的几个循环后，优化的化合物通常在结合并且常常在针对靶标的特异性方面表现出显著提高。文库筛选会导致命中，并将其进一步发展为先导，对于这些先导的结构信息以及用于结构-活性-关系分析的药物化学是必不可少的。

另一个实施方案涉及鉴定(构象选择性)化合物的方法，包括步骤：

i)提供靶受体蛋白和特异性结合所述靶受体蛋白的本发明的融合蛋白

ii)提供测试化合物

iii)评估测试化合物与靶受体蛋白的选择性结合。

根据特别优选的实施方案，以上所述的鉴定构象选择性化合物的方法通过配体结合试验或竞争试验来进行，甚至更优选通过放射性配体结合或竞争试验来进行。最优选，以上所述的鉴定构象选择性化合物的方法在比较试验中进行，更具体地，在比较配体竞争试验中进行，甚至更具体地，在比较放射性配体竞争试验中进行。

应当理解，尽管本文已经针对根据本发明的工程化细胞和方法讨论了特定的实施方案、特定的构造以及材料和/或分子，但是可以在形式和细节上进行各种改变或修改而不背离本发明的范围和精神。提供以下实施例以更好地说明特定实施方案，并且不应将其视为限制本申请。本申请仅受权利要求的限制。

实施例

概述

我们已经设计了新型功能性刚性融合蛋白，也称为“Megakine^TM”(Mk)，由细胞因子和支架蛋白组成，其中细胞因子的基于β-链保守核心结构域或基序，或特定的细胞因子亚家族，通过两个或三个短接头，或通过两个或三个直接连接，与支架蛋白连接。本文针对细胞因子的2个超家族，包括趋化因子(具体是CCL5和CXCL12)和白介素，更具体地是IL-1型受体白介素，举例说明了原理，这两个超家族对于这样的包含基于β-链保守核心结构域的细胞因子是代表性的。根据趋化因子或白介素与其受体的作用和结合模式的机制，这些刚性融合蛋白结合并固定特定的和不同的趋化因子-或白介素-受体的构象状态。那些融合蛋白实际上代表扩大的趋化因子或白介素配体，并且对于确定趋化因子或白介素复合物(例如，与其受体)的蛋白质结构是有帮助的，并且有助于几个应用，包括X-射线晶体学和冷冻电镜应用。Megakine通过降低结合的同源细胞因子受体的构象灵活性和通过扩展易于形成晶体接触的表面，以及通过提供额外的定相信息，起到下一代伴侣的作用。通过将特定的Megakine蛋白与趋化因子-或白介素-特异性受体混合，它们的特异性结合相互作用导致“质量”增加并固定受体的特定构象状态。

作为这种方法概念的证明，我们***了基因的环状排列变体(c7HopQ)作为折叠支架蛋白，所述基因编码趋化因子CCL5变体6P4(超激动剂)的趋化因子核心结构域(图2)(实施例1)和趋化因子CXCL12的趋化因子核心结构域(图19)(实施例7)的β-链2(β2)和β-链3(β3)之间的β-转角中的HopQ(幽门螺杆菌的周质蛋白，PDB 5LP2)的粘附结构域。或者，我们在白介素IL-1β的β-桶核心基序或结构域的β-链6(β6)和β-链7(β7)之间的β-转角中***所述c7HopQ支架(图27)(实施例10)。此外，对于CCL5趋化因子，使用较大的支架蛋白大肠杆菌Ygjk(PDB密码子3W7S；Kurakava等，2008)产生了替代的Megakine，为此设计了2个环状排列变体(C1Ygjk和C2Ygjk)，以在所述与CCL5 6P4的Megakine融合体中测试(实施例8)。

使用了Modeler软件(https://salilab.org/modeller)设计了构建体，并且使用不同的短接头制得了不同的融合体。

我们进行了几个不同的融合蛋白构建体的酵母表面展示，其含有不同的接头(实施例6、8、10)，这证明了用于基于细胞因子的Megakine的所有不同构建体能够结合细胞因子配体特异性单克隆抗体(实施例2、9和11)。我们在酵母(实施例3)和大肠杆菌周质(实施例4)中将这些融合蛋白表达为分泌蛋白。此外，在实施例5中，我们显示了在基于细胞的测定中应用的纯化蛋白质或周质提取物能够激活CCR5受体，甚至在一些情况中，达到对于6P4-CCL5趋化因子激动剂自身观察到的水平。

实施例1：从***6P4-CCL5-趋化因子的连接β-链β2-β3的β-转角中的c7HopQ支架构建的50kDa融合蛋白的设计和产生。

作为获得刚性融合蛋白“Megakine”概念的第一个证明，根据图2，经由连接6P4-CCL5与支架的两个肽键，将称为6P4-CCL5趋化因子的改进的CCL5趋化因子嫁接到大的支架蛋白上，以构建刚性Megakine。

此处描述的50kDa Megakine是一种嵌合多肽，由根据图2至6连接的趋化因子的部分和支架蛋白的部分连接而成。在此，使用的趋化因子是6P4-CCL5，源自天然CCL5配体，属于CC-趋化因子的亚家族，其修饰为如SEQ ID NO:1中所示的CCR5 GPCR的超激动剂(6P4-CCL5是拮抗剂CCL5-5P7的类似物；Zheng等，2017；PDB代码CCL5-5P7:5UIW)。将连接6P4-CCL5的β-链2和β-链3的β-转角打断，用于与支架蛋白融合。支架蛋白是幽门螺杆菌株G27的粘附素结构域(PDB：5LP2；SEQ ID NO:2)，称为HopQ(Javaheri等，2016)。将HopQ的N-和C-末端连接，尽管在环状排列区域中截短了7个氨基酸后(称为c7HopQ)，其在晶体结构的电子密度中显示为永远不会完全可见的一个环。这种截短的融合产生了HopQ的环状排列变体，称为c7HopQ，其中氨基酸序列内的切割发生在其序列的其他地方(即，在对应于所述支架蛋白暴露区域中可及位点的位置)。为了设计功能性Megakine融合蛋白变体，在计算机分子建模中使用Modeler软件(https://salilab.org/modeller)以及定制编写的Python脚本。结果，产生了四个低自由能Mk_6P4-CCL5 ^c7HopQ模型，其中所有部分通过肽键以以下给出的顺序从氨基(N-)至羧基(C-)末端彼此连接：

Mk_6P4-CCL5 ^c7HopQ V1(SEQ ID NO:3)：6P4-CCL5趋化因子的直至β-链2的N-末端(SEQID NO:1的1-43)，HopQ的C-末端部分(SEQ ID NO:2的残基193-411)，HopQ的N-末端部分(SEQ ID NO:2的残基18-185)，6P4-CCL5趋化因子从β-链3直至末尾的C-末端部分(SEQ IDNO:1的47-69)，6xHis标签和EPEA标签(US 9518084 B2；SEQ ID NO:21)。

Mk_6P4-CCL5 ^c7HopQ V2(SEQ ID NO:4)：6P4-CCL5趋化因子的直至β-链2的N-末端(SEQID NO:1的1-44)，Thr一氨基酸接头，HopQ的C-末端部分(SEQ ID NO:2的残基194-411)，HopQ的N-末端部分(SEQ ID NO:2的残基18-185)，6P4-CCL5趋化因子从β-链3直至末尾的C-末端部分(SEQ ID NO:1的47-69)，6xHis标签和EPEA标签。

Mk_6P4-CCL5 ^c7HopQ V3(SEQ ID NO:5)：6P4-CCL5趋化因子的直至β-链2的N-末端2(SEQID NO:1的1-45)，HopQ的C-末端部分(SEQ ID NO:2的残基192-411)，HopQ的N-末端部分(SEQ ID NO:2的残基18-185)，6P4-CCL5趋化因子从β-链3直至末尾的C-末端部分(SEQ IDNO:1的47-69)，6xHis标签和EPEA标签(US 9518084 B2)。

Mk_6P4-CCL5 ^c7HopQ V4(SEQ ID NO:6)：6P4-CCL5趋化因子的直至β-链2的N-末端(SEQID NO:1的1-44)，HopQ的C-末端部分(SEQ ID NO:2的残基193-411)，HopQ的N-末端部分(SEQ ID NO:2的残基18-185)，6P4-CCL5趋化因子从β-链3直至末尾的C-末端部分(SEQ IDNO:1的47-69)，6xHis标签和EPEA标签。

实施例2.从***6P4-CCL5-趋化因子的连接β-链β2-β3的β-转角中的c7HopQ支架构建的50kDa融合蛋白的酵母展示。

为了证明四种Mk_6P4-CCL5 ^c7HopQV1-V4 Megakine变体(SEQ ID NO:3-6)可以表达为折叠良好和功能性的蛋白质，我们在酵母表面展示了这种蛋白质(Boder，1997)。通过使用与功能性6P4-CCL5趋化因子结合的荧光偶联单克隆抗体(来自Biolegend的Alexa

647抗人RANTES(CCL5)抗体，参考号515506；抗CCL5-mAb647)检查6P4-CCL5趋化因子部分的正确折叠。为了在酵母上展示Mk_6P4-CCL5 ^c7HopQV1-V4 Megakine变体，我们使用标准方法构建了开放阅读框，其编码与各种辅助肽和蛋白质融合的Megakine(SEQ ID NO:7-10)：指导在酵母中胞外分泌的appS4前导序列(Rakestraw，2009)，Mk_6P4-CCL5 ^c7HopQ Megakine变体，柔性肽接头，Aga2p(酵母凝集素蛋白Aga2p的粘附亚基，它通过与Aga1p的二硫键连接到酵母细胞壁蛋白)，酰基载体蛋白(用于展示的融合蛋白的正交荧光染色(Johnsson，2005))，然后是cMyc标签。这个开放阅读框在半乳糖诱导型GAL1/10启动子的转录控制下放入pCTCON2载体中(Chao，2006)并引入酵母菌株EBY100中。

将携带这个质粒的EBY100酵母细胞在富含半乳糖的培养基中生长和诱导过夜，以触发Mk_6P4-CCL5 ^c7HopQ-Aga2p-ACP融合体的表达和分泌。对于ACP的正交染色，细胞在荧光标记的CoA类似物(CoA-547，2μM)和催化量的SFP合酶(1μM)存在下孵育1小时。为了分析展示的Megakine的功能性，我们通过流式细胞术检测了其被Alexa

647荧光标记的抗CCL5单克隆抗体(抗CCL5-mAb647)识别的能力。因此，诱导EBY100酵母细胞并与CoA547正交荧光染色，以监测Mk_6P4-CCL5 ^c7HopQ-Aga2p-ACP融合体的显示。这些正交染色的酵母细胞随后在不同浓度的抗CCL5-mAb647(15、31、62、125和250ng/mL)存在下孵育1小时。在这些实验中，洗涤诱导的酵母细胞并进行流式细胞术以通过将CoA547荧光水平与展示MegaBody Mb_Nb207 ^cHopQ-Aga2p-ACP融合体(SEQ ID NO:11，其中MegaBody类似于Megakine，但纳米抗体(Nb)替代了趋化因子与支架蛋白融合，本文中Nb₂₀₇作为GFP特异性Nb)并以相同方式正交染色的酵母细胞进行比较来测量每个细胞的Megakine展示水平。随后，通过检查647-荧光水平来分析抗CCL5-mAb647的结合，该水平应与酵母表面上的Mb_Nb207 ^cHopQ表达水平呈线性相关。事实上，二维流式细胞术分析证实了抗CCL5-mAb647(高647荧光水平)仅与具有显著Megakine展示水平(高CoA547荧光水平)的酵母细胞结合(图9和图10-14)。相比之下，抗CCL5-mAb647不与展示MegaBody Mb_Nb207 ^cHopQ-Aga2p-ACP融合体(SEQ ID NO:11)的并以相同方式染色的酵母细胞结合。

我们从这些实验得出结论，所有四种Mk_6P4 ^c7HopQV1-V4 Megakine变体(SEQ ID NO:3-6)都可以在酵母表面上表达为折叠良好的和功能性的嵌合蛋白。

实施例3：从***6P4-CCL5-趋化因子的连接β-链β2-β3的β-转角中的c7HopQ支架构建的50kDa融合蛋白的酵母表达和纯化。

因为我们能够在酵母表面上展示功能性Megakine，我们开始在EBY100细胞中将这些50kDa融合蛋白表达为可溶性分泌蛋白，将它们纯化至同质并确定它们的特性。

为了表达四种Megakines Mk_6P4-CCL5 ^c7HopQV1-V4 Megakine变体(SEQ ID NO:3-6)，我们使用标准方法来构建开放阅读框，其编码与多种辅助肽和蛋白质融合的Megakine(SEQID NO:12-15)：指导在酵母中胞外分泌的appS4前导序列(Rakestraw，2009)、Mk_6P4-CCL5 ^c7HopQMegakine变体、6xHis标签、EPEA标签和完成翻译的终止密码子。将这个开放阅读框放入pCTCON2载体中置于半乳糖诱导型GAL1/10启动子的转录控制下(Chao，2006)并引入酵母株EBY100中。将携带这个质粒的EBY100酵母细胞在富含半乳糖的培养基中生长和诱导过夜，以在30℃下触发Mk_6P4-CCL5 ^c7HopQV1-V4变体(SEQ ID NO:12-15)的表达和分泌。在HisTrap(NiNTA)FF 5mL预装柱上从培养基中回收重组Megakine融合蛋白。接着通过应用500mM咪唑从NiNTA树脂上洗脱蛋白质，并通过使用NMWL过滤器(Nominal Molecular Weight Limit)以10kDa的截留进行离心浓缩(图15-16)。

我们从这些实验中得出结论，Mk_6P4-CCL5 ^c7HopQV1-V4 Megakine变体(SEQ ID NO:3-6)中的几个可以表达为折叠良好的和功能性的嵌合蛋白，并通过常规纯化方法进行纯化。

实施例4：从***6P4-CCL5-趋化因子的连接β-链β2-β3的β-转角中的c7HopQ支架构建的50kDa融合蛋白的细菌表达和纯化。

由于我们能够在酵母表面上展示功能性Megakine并将它们在酵母中表达为可溶性蛋白，我们开始在大肠杆菌的周质中表达这种50kDa融合蛋白，将它们纯化至同质并确定它们的特性。为了在大肠杆菌的周质中表达Megakine Mk_6P4-CCL5 ^c7HopQV1-V4 Megakine变体蛋白(SEQ ID NO:3-6)，我们使用标准方法构建了允许表达6P4-CCL5 megakine的载体：可以将支架***连接6P4-CCL5趋化因子的β-链2(β2)和β-链3(β3)的β-转角中。这个载体是pMESy4的衍生物(Pardon，2014)并包含编码以下多肽的开放阅读框：指导Megakine分泌到大肠杆菌周质中的DsbA前导序列，6P4-CCL5趋化因子的直至β-链β2的N末端，多克隆位点(对于这个实施例，其中克隆了HopQ的环状排列变体(c7HopQ))，6P4-CCL5趋化因子的从β-链β3起的C-末端，6xHis标签和EPEA标签，接着是Amber终止密码子。可以在这个载体的多克隆位点中克隆任何其他合适的支架。

为了在大肠杆菌周质中表达Megakine并将这个重组蛋白纯化至同质，我们使用了标准方法构建载体，其中DsbA前导序列指导四种His标签和EPEA标签的Mk_6P4-CCL5 ^c7HopQV1-V4Megakine变体(SEQ ID NO:16-19)在pLac启动子的转录控制下在大肠杆菌周质中表达。WK6细菌细胞(WK6是su-非遏制株)在3升2xTY培养基中于37℃生长，并在细胞达到对数生长期时通过IPTG进行诱导。带His-标签和EPEA-标签的Mk_6P4-CCL5 ^c7HopQV1-V4 Megakine变体(SEQID NO:16-19)的周质表达在28℃下持续过夜。通过离心收获细胞，并使用渗透休克从周质中释放重组Megakine(Pardon等，2014)。然后通过离心将重组Megakine与原生质体分离，并在HisTrap FF 5mL预装柱上从澄清的上清液中回收。接着通过应用500mM咪唑从NiNTA树脂上洗脱蛋白质，并使用NMWL过滤器(Nominal Molecular Weight Limit)以10kDa的截留进行离心浓缩(图17)。表达并纯化至同质的MegaBody Mb_Nb207 ^c7HopQ(SEQ ID NO:20)用作功能实验的对照。

我们从这些实验得出结论，一些Mk_6P4-CCL5 ^c7HopQV1-V4 Megakine变体(SEQ ID NO:3-6)可以在大肠杆菌中表达为折叠良好的和功能性的嵌合蛋白，并通过常规纯化方法进行纯化。

实施例5.基于细胞的测定证实了从***6P4-CCL5-趋化因子的连接β-链β2-β3的β-转角(40s环)中的c7HopQ支架构建的50kDa融合蛋白的功能性。

通过Mk_6P4-CCL5 ^c7HopQV1-V4 Megakine变体激活CCR5(CCL5的同源受体)的能力来评估在c7HopQ支架中呈现时6P4-CCL5的功能性/正确折叠的保留。在基于细胞的测定中评估活性，所述测定基于***的纳米荧光素酶(NanoBiT-Promega)的互补(Dixon AS等，2016ACSChem Biol.)监测β-抑制蛋白-1或miniGi(Gα亚基的工程化GTPase结构域；Wan等，2018)在激动剂刺激后向CCR5的募集。

将5×10⁶HEK293T细胞接种在10cm培养皿中，24小时后用pNBe2和pNBe3载体(Promega)共转染，这两个载体分别编码C-末端与由15Gly/Ser接头(GSSGGGGSGGGGSSG)隔开的SmBiT(VTGYRLFEEIL)(纳米荧光素酶亚基I)融合的人CCR5，和与N-末端与后跟15Gly/Ser接头的LgBiT(纳米荧光素酶亚基II，残基1-156)融合的人β-抑制蛋白-1或miniGi。收集转染后24小时的细胞，在37℃下与稀释100倍的Nano-Glo Live Cell底物一起孵育25分钟，然后按5×10⁴个细胞/孔分配到白色96孔板中。通过纳米荧光素酶互补评估β-抑制蛋白-1或miniGi在添加Megakine后向CCR5的募集，并因此用Mithras LB940光度计(BertholdTechnologies)测量催化活性恢复。将未纯化的周质提取物和选自酵母展示的纯化Mk_6P4-CCL5 ^c7HopQV1-V4 Megakine变体(SEQ ID NO:16-19)的活性与未纯化的使用pIRES-嘌呤霉素载体在CMV启动子依赖性下在哺乳动物细胞(HEK293T)中产生的重组可溶性6P4-CCL5趋化因子(SEQ ID NO:33)的活性进行比较。

6P4-CCL5趋化因子在将c7HopQ支架***其连接β2-β3的β-链后保留其功能性，正如通过Mk_6P4-CCL5 ^c7HopQV1-V4 Megakine变体诱导浓度依赖性β-抑制蛋白-1和miniGi募集到CCR5的能力所证明的(图18)。

实施例6.通过体内选择设计和产生其他从***6P4-CCL5-趋化因子的连接β-链β2-β3的β-转角中的c7HopQ支架构建的50kDa融合蛋白。

由于Megakine的折叠能力以及稳定性和刚性可能依赖于连接趋化因子与支架的多肽键的组成和长度，我们引入了体外进化技术，如果需要，可用于微调特定的Megakine形式。从实施例1中描述的Megakine开始，我们构建了具有类似设计的编码Megakine的文库，其中根据图2，可变长度和混合氨基酸组成的两个短肽将趋化因子连接支架，其适于体内选择。

这里描述的50kDa Megakine是一种嵌合多肽，根据图2和3，由趋化因子的部分和支架蛋白的部分连接而成。在此，使用的趋化因子是6P4-CCL5，CCR5 GPCR的激动剂，如SEQID NO:1中所示(6P4-CCL5是拮抗剂CCL5-5P7的类似物；Zheng等，2017；PDB编码CCL5-5P7:5UIW)。将连接6P4-CCL5的β-链2和β-链3的β-转角打断，用于与支架蛋白融合。支架蛋白是幽门螺杆菌株G27的粘附素结构域(PDB：5LP2；SEQ ID NO:2)，称为HopQ(Javaheri等，2016)。将HopQ的N-和C-末端连接，尽管在环状排列区域中截短了7个氨基酸后(称为c7HopQ)，其在晶体结构的电子密度中显示为永远不会完全可见的一个环。这种截短的融合产生了HopQ的环状排列变体，称为c7HopQ，其中氨基酸序列内的切割发生在其序列的其他地方(即，在对应于所述支架蛋白暴露区域中可及位点的位置)。所有部分通过肽键以以下给出的顺序从氨基至羧基末端彼此连接：6P4-CCL5趋化因子的直至β-链2的N-末端(SEQ IDNO:1的1-44)，具有随机组成的一个或两个氨基酸的肽接头，HopQ的C-末端部分(SEQ IDNO:2的残基195-411)，HopQ的N-末端部分(SEQ ID NO:2的残基18-183)，具有随机组成的一个或两个氨基酸的肽接头，6P4-CCL5趋化因子从β-链3直至末尾的C-末端部分(SEQ ID NO:1的47-69)。

为了展示和选择实施例1至5中所述的Megakine的功能性变体，这些变体在酵母上连接趋化因子与支架的接头的组成和长度上不同，根据图7，我们使用标准方法构建了开放阅读框文库，其编码与若干辅助肽和蛋白质融合的各种Megakine(SEQ ID NO:25-28)：指导在酵母中胞外分泌的appS4前导序列(Rakestraw，2009)，6P4-CCL5趋化因子的直至β-链2的N-末端(SEQ ID NO:1的1-44)，具有随机组成的一个或两个氨基酸的肽接头，HopQ的C-末端部分(SEQ ID NO:2的残基195-411)，HopQ的N-末端部分(SEQ ID NO:2的残基18-183)，具有随机组成的一个或两个氨基酸的肽接头，6P4-CCL5趋化因子从β-链3直至末尾的C-末端部分(SEQ ID NO:1的47-69)，柔性(GGSG)_n肽接头，Aga2p(酵母凝集素蛋白Aga2p的粘附亚基，它通过与Aga1p的二硫键连接到酵母细胞壁蛋白)，酰基载体蛋白(用于展示的融合蛋白的正交荧光染色(Johnsson，2005))，然后是cMyc标签。这个开放阅读框在半乳糖诱导型GAL1/10启动子的转录控制下放入pCTCON2载体中(Chao，2006)，以构建编码176400个不同的Megakine变体的酵母展示文库(参见图7)。

为了体外选择，将这个文库引入酵母株EBY100中。将转化的细胞在富含半乳糖的培养基中生长和诱导过夜。使用SFP合酶(1μM)用coA-547(2μM)将诱导的细胞正交染色，并用0.25μg/mL Alexa

647荧光标记的抗CCL5单克隆抗体(抗CCL5-mAb647)孵育。接着，洗涤这些细胞并进行2参数FACS分析以鉴定展示高水平Megakine表达(高CoA-547荧光)和结合抗CCL5-mAb647(高Alexa

647荧光)的酵母细胞。将展示高水平抗CCL5-mAb647结合的细胞在富含葡萄糖的培养基中进行分选和扩增，以通过酵母展示和双参数FACS分析进行后续轮的选择(图8)。

经过两轮选择后，将CoA-547和Alexa

647通道中具有代表性数量的高荧光细胞作为单菌落生长，并进行DNA测序以确定代表性数量的连接趋化因子与支架蛋白的肽接头的序列。具有1-1、1-2、2-1和2-2氨基酸短接头变体的每种类型接头的两个代表性克隆列于表1中。

表1.某些酵母展示优化的连接支架蛋白c7HopQ与趋化因子的肽接头的组成和长度

这证明了趋化因子和支架蛋白之间的不同短肽连接可以通过使用酵母展示的体内选择从Megakine文库中选择出来，并在酵母细胞表面上展示为功能性趋化因子嵌合蛋白。

实施例7：从***CXCL12趋化因子的连接β-链β2-β3的β-转角中的c7HopQ支架构建的50kDa融合蛋白的细菌表达和纯化。

作为获得刚性融合蛋白“Megakine”概念的第二个证明，根据图2，通过连接CXCL12与支架的两个肽键，将CXCL12趋化因子(属于CXC-趋化因子的亚家族)嫁接到大的支架蛋白上，以构建刚性Megakine。

此处描述的50kDa Megakine是一种嵌合多肽，根据图2和3由连接的趋化因子的部分和支架蛋白的部分连接而成。在此，使用的趋化因子是CXCL12，如SEQ ID NO:22中所示的(PDB代码：3HP3)，也称为SDF-1，其结合并激活CXCR4 GPCR以及ACKR3 GPCR。将支架蛋白***CXCL12的连接β-链2和β-链3的β-转角中。支架蛋白是幽门螺杆菌株G27的粘附素结构域(PDB：5LP2；SEQ ID NO:2)，称为HopQ(Javaheri等，2016)。将HopQ的N-和C-末端连接，尽管在环状排列区域中截短了7个氨基酸后(称为c7HopQ)，其在晶体结构的电子密度中显示为永远不会完全可见的一个环。这种截短的融合产生了HopQ的环状排列变体，称为c7HopQ，其中氨基酸序列内的切割发生在其序列的其他地方(即，在对应于所述支架蛋白暴露区域中可及位点的位置)。与实施例1类似，产生了低自由能Mk_CXCL12 ^c7HopQ(SEQ ID NO:23)，其中所有部分如下连接：CXCL12趋化因子的直至β-链2的N-末端(SEQ ID NO:22的1-43)，HopQ的C-末端部分(SEQ ID NO:2的残基192-411)，HopQ的N-末端部分(SEQ ID NO:2的残基18-184)，CXCL12趋化因子从β-链3直至末尾的的C-末端部分(SEQ ID NO:22的45-68)，6xHis标签和EPEA标签(US 9518084 B2)。

我们开始在大肠杆菌的周质中表达这种50kDa融合蛋白，将它们纯化至同质并确定它们的特性。为了在大肠杆菌的周质中表达Megakine Mk_CXCL12 ^c7HopQ，我们使用标准方法构建了允许表达Mk_CXCL12 ^c7HopQ Megakine的载体：可以将支架***连接CXCL12趋化因子的β-链2(β2)和β-链3(β3)的β-转角中。这个载体是pMESy4的衍生物(Pardon，2014)并含有编码以下多肽的开放阅读框：指导Megakine分泌到大肠杆菌周质中的DsbA前导序列，CXCL12趋化因子的直至β-链β2的N末端，多克隆位点(对于这个实施例，其中克隆了HopQ的环状排列变体(c7HopQ))，CXCL12趋化因子的从β-链β3起的C-末端，6xHis标签和EPEA标签，接着是Amber终止密码子(SEQ ID NO:24)。可以在这个载体的多克隆位点中克隆任何其他合适的支架。Mk_CXCL12 ^c7HopQ表达如实施例4中所述。

实施例8：从***6P4-CCL5-趋化因子的连接β-链β2-β3的β-转角中的YgjK支架构建的94kDa融合蛋白的设计和产生。

在从嫁接到c7HopQ上的6P4-CCL5趋化因子成功设计了我们的第一个Megakine的基础上(实施例1至6)，我们还旨在开发其他Megakine设计，这些设计从连接到较大的支架蛋白的趋化因子构建。

此处描述的94kDa Megakine是一种嵌合多肽，根据图2，由趋化因子的部分和支架蛋白的部分连接而成。在此，使用的趋化因子是6P4-CCL5，与之前实施例中使用的相同，并且如SEQ ID NO:1中所示。将连接6P4-CCL5的β-链2和β-链3的β-转角打断，用于与支架蛋白融合。支架蛋白是大肠杆菌的86kDA周质蛋白(PDB代码3W7S，SEQ ID NO:34)，称为YgjK(Kurakave等，2008)。在YgjK的三级结构中，鉴定了两条反平行的具有表面可及β-转角的β-链：β-转角A’S1-A’S2和β-转角NS6-NS7。为了产生不同的94kDa MW的Megakine，其中拓扑结构被(不同地)打断，将这两个β-转角截短并且引入另外的环状排列来产生两个支架蛋白：

c1YgiK(SEQ ID NO:36)：YgiK的C-末端部分(SEQ ID NO:34的残基464-760)，连接YgiK的C-末端和N-末端产生支架蛋白的环状排列的短肽接头(SEQ ID NO:35)，YgiK的N-末端部分(SEQ ID NO:34的残基1-461)

c1YgiK(SEQ ID NO:37)：YgiK的C-末端部分(SEQ ID NO:34的残基105-760)，连接YgiK的C-末端和N-末端产生支架蛋白的环状排列的短肽接头(SEQ ID NO:35)，YgiK的N-末端部分(SEQ ID NO:34的残基1-102)

为了设计功能性Megakine融合蛋白变体，进行了使用可及晶体结构(PDB代码CCL5-5P7：5UIW，PDB代码YgjK：3W7S)的计算机分子建模。结果是，产生了三个MegakineMk_6P4-CCL5 ^c1YgjK和两个Mk_6P4-CCL5 ^c2YgjK模型，其中所有部分通过肽键以以下给出的顺序从氨基(N-)至羧基(C-)末端彼此连接：

Mk_6P4-CCL5 ^c1YgjK V1(SEQ ID NO:38，图20)：6P4-CCL5趋化因子的直至β-链2的N-末端(SEQ ID NO:1的1-45)，Gly-Gly双氨基酸接头，c1YgjK支架蛋白(SEQ ID NO:36)，Gly-Gly双氨基酸接头，6P4-CCL5趋化因子从β-链3直至末尾的的C-末端部分(SEQ ID NO:1的47-69)

Mk_6P4-CCL5 ^c1YgjKV2(SEQ ID NO:39，图21)：6P4-CCL5趋化因子的直至β-链2的N-末端(SEQ ID NO:1的1-45)，Gly一个氨基酸接头，c1YgjK支架蛋白(SEQ ID NO:36)，Gly一个氨基酸接头，6P4-CCL5趋化因子从β-链3直至末尾的的C-末端部分(SEQ ID NO:1的47-69)

Mk_6P4-CCL5 ^c1YgjKV3(SEQ ID NO:40，图22)：6P4-CCL5趋化因子的直至β-链2的N-末端(SEQ ID NO:1的1-45)，c1YgjK支架蛋白(SEQ ID NO:36)，6P4-CCL5趋化因子从β-链3直至末尾的的C-末端部分(SEQ ID NO:1的47-69)

Mk_6P4-CCL5 ^c2YgjKV1(SEQ ID NO:41，图23)：6P4-CCL5趋化因子的直至β-链2的N-末端(SEQ ID NO:1的1-45)，Gly-Gly两个氨基酸接头，c2YgjK支架蛋白(SEQ ID NO:37)，Gly-Gly两个氨基酸接头，6P4-CCL5趋化因子从β-链3直至末尾的的C-末端部分(SEQ ID NO:1的47-69)

Mk_6P4-CCL5 ^c2YgjKV3(SEQ ID NO:42，图24)：6P4-CCL5趋化因子的直至β-链2的N-末端(SEQ ID NO:1的1-45)，c2YgjK支架蛋白(SEQ ID NO:37)，6P4-CCL5趋化因子从β-链3直至末尾的的C-末端部分(SEQ ID NO:1的47-69)

实施例9.从***6P4-CCL5-趋化因子的连接β-链β2-β3的β-转角中的c1YgjK和c2YgjK支架构建的94kDa融合蛋白的酵母展示。

为了证明这五个Mk_6P4-CCL5 ^c1YgjKV1-V3和Mk_6P4-CCL5 ^c2YgjKV1/V3Megakine变体(SEQ IDNO:38-42)可以表达为折叠良好和功能性的蛋白质，我们按照对Mk_6P4-CCL5 ^c7HopQV1-V4Megakine变体进行的(实施例2)，在酵母表面展示了这些蛋白质(Boder，1997)。通过使用与功能性6P4-CCL5趋化因子结合的荧光偶联单克隆抗体(来自Biolegend的Alexa

647抗人RANTES(CCL5)抗体，参考号515506；抗CCL5-mAb647)检查6P4-CCL5趋化因子部分的正确折叠。为了在酵母上展示Mk_6P4-CCL5 ^c1YgjKV1-V3和Mk_6P4-CCL5 ^c2YgjKV1/V3 Megakine变体，我们使用标准方法构建了开放阅读框，其编码与用于酵母展示的各种辅助肽和蛋白质融合的Megakine(SEQ ID NO:43-47)：指导在酵母中胞外分泌的appS4前导序列(Rakestraw，2009)，Mk_6P4-CCL5 ^c1YgjK或Mk_6P4-CCL5 ^c2YgjKMegakine变体，柔性肽接头，Aga2p(酵母凝集素蛋白Aga2p的粘附亚基，它通过与Aga1p的二硫键连接到酵母细胞壁蛋白)，酰基载体蛋白(用于展示的融合蛋白的正交荧光染色(Johnsson，2005))，然后是cMyc标签。这个开放阅读框在半乳糖诱导型GAL1/10启动子的转录控制下放入pCTCON2载体中(Chao，2006)并引入酵母菌株EBY100中。

将携带这个质粒的EBY100酵母细胞在富含半乳糖的培养基中生长和诱导过夜，以触发Mk_6P4-CCL5 ^c1/2YgjK-Aga2p-ACP融合体的表达和分泌。对于ACP的正交染色，细胞在荧光标记的CoA类似物(CoA-547，2μM)和催化量的SFP合酶(1μM)存在下孵育1小时。为了分析展示的Megakine的功能性，我们通过流式细胞术检测了其被Alexa

647荧光标记的抗CCL5单克隆抗体(抗CCL5-mAb647)识别的能力。因此，诱导EBY100酵母细胞并与CoA547正交荧光染色，以监测Mk_6P4-CCL5 ^c1/2YgjK-Aga2p-ACP融合体的显示。这些正交染色的酵母细胞随后在抗CCL5-mAb647(浓度为80ng/mL)存在下孵育1小时。在这些实验中，洗涤诱导的酵母细胞并进行流式细胞术以通过将CoA547荧光水平与展示MegaBody Mb_Nb207 ^cHopQ-Aga2p-ACP融合体(SEQ ID NO:11，其中MegaBody类似于Megakine，但纳米抗体(Nb)替代了趋化因子与支架蛋白融合，本文中Nb₂₀₇作为GFP特异性Nb)的酵母细胞进行比较来测量每个细胞的Megakine展示水平，并以相同方式正交染色。实际上，对于所有5种Mk_6P4-CCL5 ^c1/2YgjK变体，Mk_6P4-CCL5 ^c1/2YgjK-Aga2p-ACP融合体的定量展示水平大约为70％(图25)。

接着，通过检查647-荧光水平来分析抗CCL5-mAb647的结合，该水平应与酵母表面上的Mk_6P4-CCL5 ^c1/2YgjK表达水平呈线性相关。二维流式细胞术分析证实了抗CCL5-mAb647(高647荧光水平)仅与具有显著Megakine展示水平(高CoA547荧光水平)的酵母细胞结合，最高的线性拟合为Mk_6P4-CCL5 ^c2YgjKV1(SEQ ID NO:46)和Mk_6P4-CCL5 ^c2YgjKV3(SEQ ID NO:47)，可能是由于被抗CCL5-mAb647识别的表位的最佳可及性引起的。相比之下，抗CCL5-mAb647不与展示MegaBody Mb_Nb207 ^cHopQ-Aga2p-ACP融合体(SEQ ID NO:11；作为阴性对照的GFP特异性Megabody)的并以相同方式染色的酵母细胞结合。

我们从这些实验得出结论，具有两种不同融合支架的所有五种Mk_6P4-CCL5 ^c1YgjKV1-V3和Mk_6P4-CCL5 ^c2YgjKV1/V3 Megakine变体(SEQ ID NO:38-42)都可以在酵母表面上表达为折叠良好的和功能性的嵌合蛋白。

实施例10：从***IL-1β白介素的连接β-链β6-β7的β-转角中的HopQ支架构建的58kDa融合蛋白的设计和产生。

在从嫁接到c7HopQ(实施例1至7)和c1YgjK/c2YgjK(实施例8和9)支架上的6P4-CCL5和CXCL12趋化因子成功设计了我们的第一个Megakine的基础上，我们还旨在开发其他Megakine设计，这些设计从连接到较大支架的另一类细胞因子(特别是白介素)构建。

此处描述的58kDa Megakine是一种嵌合多肽，根据图27，由白介素的部分和支架蛋白的部分连接而成。在此，使用的白介素是IL-1β(SEQ NO:48)，属于通过I型IL-1受体(IL-1RI)和IL-1受体辅助蛋白(IL-1RAcP)发挥其作用的白介素亚家族(PDB 3O4O，Wang等，2010)。在功能性IL-1β·IL-1RI·IL-1RAcP复合物中，连接IL-1β的β-链β6和β-链β7的β-转角是暴露于溶剂的，并且因此，对于支架蛋白融合是可及的(图28)。支架蛋白是用于产生基于6P4-CCL5趋化因子的Megakine的c7HopQ支架(实施例1至6)。为了设计功能性MkIL-1βc7HopQ Megakine融合蛋白变体，进行了使用可及晶体结构(PDB代码IL-1β：3O4O，PDB代码HopQ：5LP2)的计算机分子建模。作为结果，产生了三个Mk_IL-1β ^c7HopQ模型，其中所有部分通过肽键以以下给出的顺序从氨基(N-)至羧基(C-)末端彼此连接：

Mk_IL-1β ^c7HopQ V1(SEQ ID NO:49，图29)：人IL-1β白介素的直至β-链β6的N-末端(SEQID NO:48的1-73)，Gly-Gly两个氨基酸接头，HopQ的C-末端部分(SEQ ID NO:2的残基193-411)，HopQ的N-末端部分(SEQ ID NO:2的残基18-185)，Gly-Gly两个氨基酸接头，人IL-1β白介素的从β-链β7起的C-末端(SEQ ID NO:48的78-153)

Mk_IL-1β ^c7HopQ V2(SEQ ID NO:50，图30)：人IL-1β白介素的直至β-链β6的N-末端(SEQID NO:48的1-73)，Gly一个氨基酸接头，HopQ的C-末端部分(SEQ ID NO:2的残基193-411)，HopQ的N-末端部分(SEQ ID NO:2的残基18-185)，Gly一个氨基酸接头，人IL-1β白介素的从β-链β7起的C-末端(SEQ ID NO:48的78-153)

Mk_IL-1β ^c7HopQ V3(SEQ ID NO:51，图31)：人IL-1β白介素的直至β-链β6的N-末端(SEQID NO:48的1-73)，HopQ的C-末端部分(SEQ ID NO:2的残基193-411)，HopQ的N-末端部分(SEQ ID NO:2的残基18-185)，人IL-1β白介素的从β-链β7起的C-末端(SEQ ID NO:48的78-153)

实施例11.从***IL-1β白介素的连接β-链β6-β7的β-转角中的HopQ支架构建的58kDa融合蛋白的酵母展示。

为了证明这三个Mk_IL-1β ^c7HopQ Megakine变体(SEQ ID NO:49-51)可以表达为折叠良好和功能性的蛋白质，按照对Mk_6P4-CCL5 ^c7HopQ Megakine变体(实施例2)和Mk_6P4-CCL5 ^cYgjkA/BMegakine变体(实施例9)进行的，需要这些蛋白质的酵母表面展示(Boder，1997)。通过使用与功能性IL-1β结合的荧光偶联单克隆抗体(来自Life Technologies的Alexa

647抗人IL-1β抗体(CRM46)，参考号51-7018-42)检查IL-1β白介素部分的正确折叠。为了在酵母上展示Mk_IL-1β ^c7HopQ V1-V3 Megakine变体，我们使用标准方法构建了开放阅读框，其编码与若干辅助肽和蛋白质融合的Megakine(SEQ ID NO:52-54)：指导在酵母中胞外分泌的appS4前导序列(Rakestraw，2009)，Mk_IL-1β ^c7HopQ Megakine变体，柔性肽接头，Aga2p(酵母凝集素蛋白Aga2p的粘附亚基，它通过与Aga1p的二硫键连接到酵母细胞壁蛋白)，酰基载体蛋白(用于展示的融合蛋白的正交荧光染色(Johnsson，2005))，然后是cMyc标签。这个开放阅读框在半乳糖诱导型GAL1/10启动子的转录控制下放入pCTCON2载体中(Chao，2006)并引入酵母菌株EBY100中。将携带这个质粒的EBY100酵母细胞在富含半乳糖的培养基中生长和诱导过夜，以触发Mk_IL-1β ^c7HopQ-Aga2p-ACP融合体的表达和分泌。对于ACP的正交染色，如之前实施例中所示的，细胞在荧光标记的CoA类似物(CoA-547，2μM)和催化量的SFP合酶(1μM)存在下孵育1小时。为了分析展示的Megakine的功能性，我们通过流式细胞术监测其被Alexa

647荧光标记的IL-1β单克隆抗体(抗人IL-1β抗体CRM46)识别的能力。因此，诱导EBY100酵母细胞并与CoA547正交荧光染色，以监测Mk_IL-1β ^c7HopQ-Aga2p-ACP融合体的展示。展示IL-1β白介素(SEQ ID NO:55)的酵母细胞形成了另外的阳性对照。这些正交染色的酵母细胞随后在抗人IL-1β抗体CRM46(浓度为80ng/mL)存在下孵育1小时。在这些实验中，洗涤诱导的酵母细胞并进行流式细胞术以通过将CoA547荧光水平与展示MegaBody Mb_Nb207 ^cHopQ-Aga2p-ACP融合体(SEQ ID NO:11，其中MegaBody类似于Megakine，但纳米抗体(Nb)替代了白介素与支架蛋白融合，本文中Nb₂₀₇作为GFP特异性Nb)并以相同方式正交染色的酵母细胞进行比较来测量每个细胞的Megakine展示水平。接着，通过检查647-荧光水平来分析抗人IL-1β抗体CRM46的结合，该水平应与酵母表面上的Mk_IL-1β ^c7HopQ变体表达水平呈线性相关。二维流式细胞术分析证实了抗人IL-1β抗体CRM46(高647荧光水平)仅与具有显著Megakine展示水平(高CoA547荧光水平)的酵母细胞结合。相比之下，抗人IL-1β抗体CRM46不与展示MegaBody Mb_Nb207 ^cHopQ-Aga2p-ACP融合体(SEQ ID NO:11)的并以相同方式染色的酵母细胞结合。

参考文献

Bliven,S.,Prlic,A.(2012).Circular permutation in proteins.PLOSComput.Biol.8(3):e1002445.

Boder,E.T.,和Wittrup,K.D.(1997).Yeast surface display for screeningcombinatorial polypeptide libraries.Nat Biotechnol 15,553-557.

Chao,G.,Lau,W.L.,Hackel,B.J.,Sazinsky,S.L.,Lippow,S.M.,和Wittrup,K.D.(2006).Isolating and engineering human antibodies using yeast surfacedisplay.Nat Protoc 1,755-768.

Dixon AS等，2016.NanoLuc Complementation Reporter Optimized forAccurate Measurement of Protein Interactions in Cells.ACS Chem Biol,11(2):400-8

Gustavsson M.等，2017.Structural basis of ligand interaction withatypical chemokine receptor 3.Nature Comm.8:14135.

Javaheri,A.,Kruse,T.,Moonens,K.,Mejías-Luque,R.,Debraekeleer,A.,Asche,C.I.,Tegtmeyer,N.,Kalali,B.,Bach,N.C.,Sieber,S.A.,Hill,D.J.,

V.,Hauck,C.R.,Moskalenko,R.,Haas,R.,Busch,D.H.,Klaile,E.,Slevogt,H.,Schmidt,A.,Backert,S.,Remaut,H.,Singer,B.B.和Gerhard,M.(2016).Helicobacter pyloriadhesin HopQ engages in a virulence-enhancing interaction with humanCEACAMs.Nature Microbiology 2,16189.

Johnsson,N.,George,N.和Johnsson,K.(2005).Protein chemistry on thesurface of living cells.Chembiochem:a European journal of chemical biology 6,47-52.King I.C.,Gleixner,J.,Doyle,L.,Kuzin,A.,Hunt,J.F.,Xiao,R.,Montelione,G.T.,Stoddard,B.L.,DiMaio,F.和Baker,D.(2015).Precise assembly of complex betasheet topologies from de novo designed building blocks.eLife 4:e11012.doi:10.7554/eLife.11012.

Koide,S.(2009).Engineering of recombinant crystallizationchaperones.Curr Opin Struct Biol 19(4):449-457.

Kufareva I.等，2015.Chemokine and chemokine receptor structure andinteractions:implications for therapeutic strategies.Immunol Cell Biol.93(4):372–383.

Kurakata,Y.Uechi,A.Yoshida,H.Kamitori,S.Sakano,Y.Nishikawa,A.Tonozuka,T.(2008).Structural Insights into the Substrate Specificity andFunction of Escherichia coli K12 YgjK,a Glucosidase Belonging to theGlycoside Hydrolase Family 63.J.Mol.Biol.381,116–128.

Manglik,A.,Kobilka,B.K.和Steyaert,J.(2017).Nanobodies to StudyGProtein-Coupled Receptor Structure and Function.Annu Rev PharmacolToxicol.57:19-37.

Martin AC.(2000).The ups and downs of protein topology；rapidcomparison of protein structure.Protein Eng.13(12):829-37.

Nogales,E.(2016).The development of cryo-EM into a mainstreamstructural biology technique.Nature Methods 13,24-27.

Orengo等(1994).Protein superfamilies and domain superfolds.Nature.15；372(6507):631-4.

Pardon,E.,Laeremans,T.,Triest,S.,Rasmussen,S.G.,Wohlkonig,A.,Ruf,A.,Muyldermans,S.,Hol,

W.G.,Kobilka,B.K.和Steyaert,J.(2014).Ageneral protocol for thegeneration of Nanobodies for structural biology.Nature Protocols.9:674-693.

Proudfoot A.E.I.等，2015.Targeting chemokines:Pathogens can,why can’twe？Cytokine 74(2015)259–267

Rakestraw J,Sazinsky S,Piatesi A,Antipov E,Wittrup K.(2009).Directedevolution of a secretory leader for the improved expression of heterologousproteins and full-length antibodies in Saccharomyces cerevisiae.Biotechnol.Bioeng.103,1192–1201.

Ramesh,G.等，Cytokines and Chemokines at the crossroads ofneuroinflammation,neurodegeneration,and neuropathic pain.Hinawi PublishingGroup,Mediators of Inflammation ID480739,(2013)

Wan,Q.等，(2018)Mini G protein probes for active G protein-coupledreceptors(GPCRs)in live cells.J Biol Chem 293,7466-7473.

Wang,D.Zhang,S.Li,L.Liu,X.Mei,K.Wang,X.(2010).Structural insightsinto the assembly and activation of IL-1βwith its receptors.NatureImmunology,11,905–911.

Zheng等，(2017)Structure of CC Chemokine Receptor 5 with a PotentChemokine Antagonist Reveals Mechanisms of Chemokine Recognition andMolecular Mimicry by HIV.Immunity,46:1005-1017.