CN113811542A - 包含细胞因子和支架蛋白的融合蛋白 - Google Patents
包含细胞因子和支架蛋白的融合蛋白 Download PDFInfo
- Publication number
- CN113811542A CN113811542A CN201980092808.8A CN201980092808A CN113811542A CN 113811542 A CN113811542 A CN 113811542A CN 201980092808 A CN201980092808 A CN 201980092808A CN 113811542 A CN113811542 A CN 113811542A
- Authority
- CN
- China
- Prior art keywords
- protein
- chemokine
- beta
- scaffold
- fusion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108020001507 fusion proteins Proteins 0.000 title claims abstract description 298
- 102000037865 fusion proteins Human genes 0.000 title claims abstract description 298
- 101710167800 Capsid assembly scaffolding protein Proteins 0.000 title claims abstract description 181
- 101710130420 Probable capsid assembly scaffolding protein Proteins 0.000 title claims abstract description 181
- 101710204410 Scaffold protein Proteins 0.000 title claims abstract description 181
- 102000004127 Cytokines Human genes 0.000 title claims abstract description 171
- 108090000695 Cytokines Proteins 0.000 title claims abstract description 171
- 102000019034 Chemokines Human genes 0.000 claims abstract description 331
- 108010012236 Chemokines Proteins 0.000 claims abstract description 328
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 243
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 197
- 102000005962 receptors Human genes 0.000 claims abstract description 154
- 108020003175 receptors Proteins 0.000 claims abstract description 154
- 230000027455 binding Effects 0.000 claims abstract description 99
- 238000009739 binding Methods 0.000 claims abstract description 99
- 102000015696 Interleukins Human genes 0.000 claims abstract description 93
- 108010063738 Interleukins Proteins 0.000 claims abstract description 93
- 238000000034 method Methods 0.000 claims abstract description 39
- 238000000386 microscopy Methods 0.000 claims abstract description 19
- 238000004519 manufacturing process Methods 0.000 claims abstract description 14
- 230000004927 fusion Effects 0.000 claims description 123
- 210000004027 cell Anatomy 0.000 claims description 77
- 239000003446 ligand Substances 0.000 claims description 73
- 150000001413 amino acids Chemical class 0.000 claims description 61
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 54
- 239000013598 vector Substances 0.000 claims description 50
- 210000004899 c-terminal region Anatomy 0.000 claims description 46
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 42
- 150000007523 nucleic acids Chemical class 0.000 claims description 42
- 241000588724 Escherichia coli Species 0.000 claims description 31
- 238000012916 structural analysis Methods 0.000 claims description 29
- 102000039446 nucleic acids Human genes 0.000 claims description 27
- 108020004707 nucleic acids Proteins 0.000 claims description 27
- 239000000203 mixture Substances 0.000 claims description 20
- 102000003675 cytokine receptors Human genes 0.000 claims description 15
- 108010057085 cytokine receptors Proteins 0.000 claims description 15
- 230000002068 genetic effect Effects 0.000 claims description 13
- 239000002245 particle Substances 0.000 claims description 12
- 241000894006 Bacteria Species 0.000 claims description 5
- 102000039996 IL-1 family Human genes 0.000 claims description 4
- 108091069196 IL-1 family Proteins 0.000 claims description 4
- 241000700605 Viruses Species 0.000 claims description 4
- 238000002050 diffraction method Methods 0.000 claims description 3
- 241001515965 unidentified phage Species 0.000 claims description 3
- 230000004913 activation Effects 0.000 abstract description 18
- 238000002424 x-ray crystallography Methods 0.000 abstract description 14
- 238000004458 analytical method Methods 0.000 abstract description 7
- 238000009510 drug design Methods 0.000 abstract description 7
- 238000007877 drug screening Methods 0.000 abstract description 6
- 229920002521 macromolecule Polymers 0.000 abstract description 5
- 235000018102 proteins Nutrition 0.000 description 185
- 108090000765 processed proteins & peptides Proteins 0.000 description 90
- 235000001014 amino acid Nutrition 0.000 description 76
- 210000005253 yeast cell Anatomy 0.000 description 63
- 102000004196 processed proteins & peptides Human genes 0.000 description 59
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 51
- 229920001184 polypeptide Polymers 0.000 description 49
- 102000000589 Interleukin-1 Human genes 0.000 description 30
- 108010002352 Interleukin-1 Proteins 0.000 description 30
- 108050000299 Chemokine receptor Proteins 0.000 description 25
- 108010055166 Chemokine CCL5 Proteins 0.000 description 23
- 102000001327 Chemokine CCL5 Human genes 0.000 description 23
- 101000797762 Homo sapiens C-C motif chemokine 5 Proteins 0.000 description 23
- 108090000193 Interleukin-1 beta Proteins 0.000 description 23
- 102000003777 Interleukin-1 beta Human genes 0.000 description 23
- 102000009410 Chemokine receptor Human genes 0.000 description 22
- 230000003993 interaction Effects 0.000 description 22
- 238000013461 design Methods 0.000 description 18
- 238000000684 flow cytometry Methods 0.000 description 18
- 108010037896 heparin-binding hemagglutinin Proteins 0.000 description 18
- 108091028043 Nucleic acid sequence Proteins 0.000 description 17
- 238000002818 protein evolution Methods 0.000 description 17
- 238000003780 insertion Methods 0.000 description 16
- 230000037431 insertion Effects 0.000 description 16
- 229940047122 interleukins Drugs 0.000 description 16
- 230000006870 function Effects 0.000 description 14
- 210000001322 periplasm Anatomy 0.000 description 14
- 230000028327 secretion Effects 0.000 description 14
- OVKKNJPJQKTXIT-JLNKQSITSA-N (5Z,8Z,11Z,14Z,17Z)-icosapentaenoylethanolamine Chemical compound CC\C=C/C\C=C/C\C=C/C\C=C/C\C=C/CCCC(=O)NCCO OVKKNJPJQKTXIT-JLNKQSITSA-N 0.000 description 13
- 101000617130 Homo sapiens Stromal cell-derived factor 1 Proteins 0.000 description 13
- 239000013078 crystal Substances 0.000 description 13
- 108091026890 Coding region Proteins 0.000 description 12
- 108700026244 Open Reading Frames Proteins 0.000 description 12
- 239000000556 agonist Substances 0.000 description 12
- 230000008901 benefit Effects 0.000 description 12
- 150000001875 compounds Chemical class 0.000 description 12
- 238000002474 experimental method Methods 0.000 description 12
- 239000012634 fragment Substances 0.000 description 12
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 12
- 238000010561 standard procedure Methods 0.000 description 12
- 102000003688 G-Protein-Coupled Receptors Human genes 0.000 description 11
- 108090000045 G-Protein-Coupled Receptors Proteins 0.000 description 11
- 238000010367 cloning Methods 0.000 description 11
- 238000000746 purification Methods 0.000 description 11
- 108010031186 Glycoside Hydrolases Proteins 0.000 description 10
- 102000005744 Glycoside Hydrolases Human genes 0.000 description 10
- 102100021669 Stromal cell-derived factor 1 Human genes 0.000 description 10
- 238000003556 assay Methods 0.000 description 10
- 241000590002 Helicobacter pylori Species 0.000 description 9
- 239000005557 antagonist Substances 0.000 description 9
- 230000001580 bacterial effect Effects 0.000 description 9
- 229940037467 helicobacter pylori Drugs 0.000 description 9
- 108020004414 DNA Proteins 0.000 description 8
- 241000853480 Helicobacter pylori G27 Species 0.000 description 8
- 125000000539 amino acid group Chemical group 0.000 description 8
- 238000003776 cleavage reaction Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 8
- 239000013612 plasmid Substances 0.000 description 8
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 8
- 230000007017 scission Effects 0.000 description 8
- 239000000126 substance Substances 0.000 description 8
- 238000010276 construction Methods 0.000 description 7
- 239000002773 nucleotide Substances 0.000 description 7
- 125000003729 nucleotide group Chemical group 0.000 description 7
- 239000013641 positive control Substances 0.000 description 7
- 238000012216 screening Methods 0.000 description 7
- 108010008951 Chemokine CXCL12 Proteins 0.000 description 6
- 102000006573 Chemokine CXCL12 Human genes 0.000 description 6
- 108050006617 Interleukin-1 receptor Proteins 0.000 description 6
- 102000019223 Interleukin-1 receptor Human genes 0.000 description 6
- 108010006519 Molecular Chaperones Proteins 0.000 description 6
- 241000235648 Pichia Species 0.000 description 6
- 239000000427 antigen Substances 0.000 description 6
- 108091007433 antigens Proteins 0.000 description 6
- 102000036639 antigens Human genes 0.000 description 6
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 6
- YMAWOPBAYDPSLA-UHFFFAOYSA-N glycylglycine Chemical compound [NH3+]CC(=O)NCC([O-])=O YMAWOPBAYDPSLA-UHFFFAOYSA-N 0.000 description 6
- 230000001965 increasing effect Effects 0.000 description 6
- 230000000670 limiting effect Effects 0.000 description 6
- 230000007246 mechanism Effects 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 239000013642 negative control Substances 0.000 description 6
- 230000012846 protein folding Effects 0.000 description 6
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 6
- 230000001105 regulatory effect Effects 0.000 description 6
- 239000007320 rich medium Substances 0.000 description 6
- 230000011664 signaling Effects 0.000 description 6
- 230000001052 transient effect Effects 0.000 description 6
- 101710146995 Acyl carrier protein Proteins 0.000 description 5
- 102100031650 C-X-C chemokine receptor type 4 Human genes 0.000 description 5
- 101100239628 Danio rerio myca gene Proteins 0.000 description 5
- 241000588722 Escherichia Species 0.000 description 5
- 101150094690 GAL1 gene Proteins 0.000 description 5
- 102100028501 Galanin peptides Human genes 0.000 description 5
- 101000922348 Homo sapiens C-X-C chemokine receptor type 4 Proteins 0.000 description 5
- 101100121078 Homo sapiens GAL gene Proteins 0.000 description 5
- 101001033249 Homo sapiens Interleukin-1 beta Proteins 0.000 description 5
- 101800000324 Immunoglobulin A1 protease translocator Proteins 0.000 description 5
- 102100039880 Interleukin-1 receptor accessory protein Human genes 0.000 description 5
- 101710180389 Interleukin-1 receptor accessory protein Proteins 0.000 description 5
- 108090001090 Lectins Proteins 0.000 description 5
- 102000004856 Lectins Human genes 0.000 description 5
- 102000005431 Molecular Chaperones Human genes 0.000 description 5
- 241000235070 Saccharomyces Species 0.000 description 5
- 241000235346 Schizosaccharomyces Species 0.000 description 5
- 108010003723 Single-Domain Antibodies Proteins 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 239000013604 expression vector Substances 0.000 description 5
- 239000007850 fluorescent dye Substances 0.000 description 5
- 229930182830 galactose Natural products 0.000 description 5
- 239000000499 gel Substances 0.000 description 5
- 102000002467 interleukin receptors Human genes 0.000 description 5
- 108010093036 interleukin receptors Proteins 0.000 description 5
- 238000002372 labelling Methods 0.000 description 5
- 230000007115 recruitment Effects 0.000 description 5
- 239000000523 sample Substances 0.000 description 5
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 5
- 230000009870 specific binding Effects 0.000 description 5
- -1 Amino Chemical group 0.000 description 4
- 102000017917 Atypical chemokine receptor Human genes 0.000 description 4
- 108060003357 Atypical chemokine receptor Proteins 0.000 description 4
- 241000193830 Bacillus <bacterium> Species 0.000 description 4
- 102100021935 C-C motif chemokine 26 Human genes 0.000 description 4
- 241000588698 Erwinia Species 0.000 description 4
- 101000897493 Homo sapiens C-C motif chemokine 26 Proteins 0.000 description 4
- 101000773184 Homo sapiens Twist-related protein 1 Proteins 0.000 description 4
- 241000588748 Klebsiella Species 0.000 description 4
- 108010052285 Membrane Proteins Proteins 0.000 description 4
- 241001529936 Murinae Species 0.000 description 4
- 238000005481 NMR spectroscopy Methods 0.000 description 4
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical compound [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 4
- 241000589516 Pseudomonas Species 0.000 description 4
- 241000607142 Salmonella Species 0.000 description 4
- 241000607720 Serratia Species 0.000 description 4
- 102100030398 Twist-related protein 1 Human genes 0.000 description 4
- 102000007378 beta-Arrestin 1 Human genes 0.000 description 4
- 108010032969 beta-Arrestin 1 Proteins 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 4
- 230000003197 catalytic effect Effects 0.000 description 4
- 238000005119 centrifugation Methods 0.000 description 4
- 239000001963 growth medium Substances 0.000 description 4
- 238000000338 in vitro Methods 0.000 description 4
- 238000001727 in vivo Methods 0.000 description 4
- 230000014759 maintenance of location Effects 0.000 description 4
- 239000012528 membrane Substances 0.000 description 4
- 108020004999 messenger RNA Proteins 0.000 description 4
- 238000000302 molecular modelling Methods 0.000 description 4
- 238000004091 panning Methods 0.000 description 4
- 238000002823 phage display Methods 0.000 description 4
- 108091033319 polynucleotide Proteins 0.000 description 4
- 102000040430 polynucleotide Human genes 0.000 description 4
- 239000002157 polynucleotide Substances 0.000 description 4
- 239000000047 product Substances 0.000 description 4
- 150000003384 small molecules Chemical class 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 238000010186 staining Methods 0.000 description 4
- 238000001262 western blot Methods 0.000 description 4
- 101150084750 1 gene Proteins 0.000 description 3
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 3
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 3
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 3
- 241000194108 Bacillus licheniformis Species 0.000 description 3
- 241000283707 Capra Species 0.000 description 3
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 3
- 108020004705 Codon Proteins 0.000 description 3
- 102000053602 DNA Human genes 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 229920002683 Glycosaminoglycan Polymers 0.000 description 3
- 102000003810 Interleukin-18 Human genes 0.000 description 3
- 108090000171 Interleukin-18 Proteins 0.000 description 3
- 241000235649 Kluyveromyces Species 0.000 description 3
- 241001138401 Kluyveromyces lactis Species 0.000 description 3
- 241000235058 Komagataella pastoris Species 0.000 description 3
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 3
- 108010001267 Protein Subunits Proteins 0.000 description 3
- 102000002067 Protein Subunits Human genes 0.000 description 3
- 230000003213 activating effect Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 229910052799 carbon Inorganic materials 0.000 description 3
- 238000000423 cell based assay Methods 0.000 description 3
- 230000000052 comparative effect Effects 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 238000001493 electron microscopy Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000001976 improved effect Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 229940125425 inverse agonist Drugs 0.000 description 3
- 238000001000 micrograph Methods 0.000 description 3
- 238000010369 molecular cloning Methods 0.000 description 3
- 230000037361 pathway Effects 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 238000003752 polymerase chain reaction Methods 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 210000001236 prokaryotic cell Anatomy 0.000 description 3
- 230000004850 protein–protein interaction Effects 0.000 description 3
- 238000010187 selection method Methods 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 230000002483 superagonistic effect Effects 0.000 description 3
- 239000000725 suspension Substances 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 230000005030 transcription termination Effects 0.000 description 3
- 238000001890 transfection Methods 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 230000003612 virological effect Effects 0.000 description 3
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical class NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 2
- 101150076489 B gene Proteins 0.000 description 2
- 235000014469 Bacillus subtilis Nutrition 0.000 description 2
- 102000004274 CCR5 Receptors Human genes 0.000 description 2
- 108010017088 CCR5 Receptors Proteins 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- 241000588914 Enterobacter Species 0.000 description 2
- 241000588921 Enterobacteriaceae Species 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 241000701959 Escherichia virus Lambda Species 0.000 description 2
- OTMSDBZUPAUEDD-UHFFFAOYSA-N Ethane Chemical compound CC OTMSDBZUPAUEDD-UHFFFAOYSA-N 0.000 description 2
- 238000012413 Fluorescence activated cell sorting analysis Methods 0.000 description 2
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 2
- 101000854520 Homo sapiens Fractalkine Proteins 0.000 description 2
- 101000998126 Homo sapiens Interleukin-36 beta Proteins 0.000 description 2
- 101000998122 Homo sapiens Interleukin-37 Proteins 0.000 description 2
- 206010061218 Inflammation Diseases 0.000 description 2
- 102100033498 Interleukin-36 beta Human genes 0.000 description 2
- 102100033502 Interleukin-37 Human genes 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- 102000043136 MAP kinase family Human genes 0.000 description 2
- 108091054455 MAP kinase family Proteins 0.000 description 2
- 102000018697 Membrane Proteins Human genes 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 108010085220 Multiprotein Complexes Proteins 0.000 description 2
- 102000007474 Multiprotein Complexes Human genes 0.000 description 2
- MWUXSHHQAYIFBG-UHFFFAOYSA-N Nitric oxide Chemical compound O=[N] MWUXSHHQAYIFBG-UHFFFAOYSA-N 0.000 description 2
- 241000320412 Ogataea angusta Species 0.000 description 2
- 101710116435 Outer membrane protein Proteins 0.000 description 2
- 108010090127 Periplasmic Proteins Proteins 0.000 description 2
- 108700001094 Plant Genes Proteins 0.000 description 2
- 241000588769 Proteus <enterobacteria> Species 0.000 description 2
- 241000589517 Pseudomonas aeruginosa Species 0.000 description 2
- 230000010799 Receptor Interactions Effects 0.000 description 2
- 241001123227 Saccharomyces pastorianus Species 0.000 description 2
- 241000607715 Serratia marcescens Species 0.000 description 2
- 241000607768 Shigella Species 0.000 description 2
- 241000187747 Streptomyces Species 0.000 description 2
- 108020005038 Terminator Codon Proteins 0.000 description 2
- 101150044134 US28 gene Proteins 0.000 description 2
- 241000235013 Yarrowia Species 0.000 description 2
- 238000001042 affinity chromatography Methods 0.000 description 2
- 230000003110 anti-inflammatory effect Effects 0.000 description 2
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 2
- 210000004507 artificial chromosome Anatomy 0.000 description 2
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 230000020411 cell activation Effects 0.000 description 2
- 230000021164 cell adhesion Effects 0.000 description 2
- 230000012292 cell migration Effects 0.000 description 2
- 230000004663 cell proliferation Effects 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 238000002425 crystallisation Methods 0.000 description 2
- 230000008025 crystallization Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000010790 dilution Methods 0.000 description 2
- 239000012895 dilution Substances 0.000 description 2
- 238000006471 dimerization reaction Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 238000007876 drug discovery Methods 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 230000013595 glycosylation Effects 0.000 description 2
- 238000006206 glycosylation reaction Methods 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- 239000001257 hydrogen Substances 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 210000002865 immune cell Anatomy 0.000 description 2
- 230000002757 inflammatory effect Effects 0.000 description 2
- 230000004054 inflammatory process Effects 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 102000014909 interleukin-1 receptor activity proteins Human genes 0.000 description 2
- 108040006732 interleukin-1 receptor activity proteins Proteins 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 238000005304 joining Methods 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 238000004020 luminiscence type Methods 0.000 description 2
- 210000004962 mammalian cell Anatomy 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 210000004897 n-terminal region Anatomy 0.000 description 2
- 230000004770 neurodegeneration Effects 0.000 description 2
- 229910052759 nickel Inorganic materials 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 239000004031 partial agonist Substances 0.000 description 2
- 230000026731 phosphorylation Effects 0.000 description 2
- 238000006366 phosphorylation reaction Methods 0.000 description 2
- 230000004481 post-translational protein modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000000770 proinflammatory effect Effects 0.000 description 2
- 108020001580 protein domains Proteins 0.000 description 2
- 230000012743 protein tagging Effects 0.000 description 2
- 238000004451 qualitative analysis Methods 0.000 description 2
- 238000004445 quantitative analysis Methods 0.000 description 2
- 239000002287 radioligand Substances 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 239000011347 resin Substances 0.000 description 2
- 229920005989 resin Polymers 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 239000007790 solid phase Substances 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 230000004083 survival effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 102000035160 transmembrane proteins Human genes 0.000 description 2
- 108091005703 transmembrane proteins Proteins 0.000 description 2
- 230000032258 transport Effects 0.000 description 2
- 108010054167 vMIP-II Proteins 0.000 description 2
- 239000013603 viral vector Substances 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- JARGNLJYKBUKSJ-KGZKBUQUSA-N (2r)-2-amino-5-[[(2r)-1-(carboxymethylamino)-3-hydroxy-1-oxopropan-2-yl]amino]-5-oxopentanoic acid;hydrobromide Chemical compound Br.OC(=O)[C@H](N)CCC(=O)N[C@H](CO)C(=O)NCC(O)=O JARGNLJYKBUKSJ-KGZKBUQUSA-N 0.000 description 1
- JOEHPBQVSCDCHE-BKGQOYFSSA-N (4r,7s,10s,13s,19s,22s,25s,28s,31s,34r)-34-amino-22-(4-aminobutyl)-10-(3-amino-3-oxopropyl)-31-benzyl-13,19-bis[3-(diaminomethylideneamino)propyl]-25-[(1r)-1-hydroxyethyl]-28-(2-methylpropyl)-6,9,12,15,18,21,24,27,30,33-decaoxo-7-propan-2-yl-1,2-dithia-5, Chemical compound N1C(=O)[C@@H](N)CSSC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CC1=CC=CC=C1 JOEHPBQVSCDCHE-BKGQOYFSSA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- NCYCYZXNIZJOKI-IOUUIBBYSA-N 11-cis-retinal Chemical compound O=C/C=C(\C)/C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C NCYCYZXNIZJOKI-IOUUIBBYSA-N 0.000 description 1
- BFSVOASYOCHEOV-UHFFFAOYSA-N 2-diethylaminoethanol Chemical compound CCN(CC)CCO BFSVOASYOCHEOV-UHFFFAOYSA-N 0.000 description 1
- 108091023037 Aptamer Proteins 0.000 description 1
- 201000001320 Atherosclerosis Diseases 0.000 description 1
- 102100022716 Atypical chemokine receptor 3 Human genes 0.000 description 1
- 208000023275 Autoimmune disease Diseases 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 108010071023 Bacterial Outer Membrane Proteins Proteins 0.000 description 1
- 108010077805 Bacterial Proteins Proteins 0.000 description 1
- 208000004020 Brain Abscess Diseases 0.000 description 1
- 102100024167 C-C chemokine receptor type 3 Human genes 0.000 description 1
- 101710149862 C-C chemokine receptor type 3 Proteins 0.000 description 1
- 102100036166 C-X-C chemokine receptor type 1 Human genes 0.000 description 1
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 1
- 102000001902 CC Chemokines Human genes 0.000 description 1
- 108010040471 CC Chemokines Proteins 0.000 description 1
- 108700011778 CCR5 Proteins 0.000 description 1
- 108050006947 CXC Chemokine Proteins 0.000 description 1
- 102000019388 CXC chemokine Human genes 0.000 description 1
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 1
- 241000222122 Candida albicans Species 0.000 description 1
- 108090000565 Capsid Proteins Proteins 0.000 description 1
- 244000253759 Carya myristiciformis Species 0.000 description 1
- 102100023321 Ceruloplasmin Human genes 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 241000699802 Cricetulus griseus Species 0.000 description 1
- 108010066133 D-octopine dehydrogenase Proteins 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 238000007399 DNA isolation Methods 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 1
- 102100023688 Eotaxin Human genes 0.000 description 1
- 241001522878 Escherichia coli B Species 0.000 description 1
- 241001302584 Escherichia coli str. K-12 substr. W3110 Species 0.000 description 1
- 102000010834 Extracellular Matrix Proteins Human genes 0.000 description 1
- 108010037362 Extracellular Matrix Proteins Proteins 0.000 description 1
- 108091092566 Extrachromosomal DNA Proteins 0.000 description 1
- 102000016359 Fibronectins Human genes 0.000 description 1
- 108010067306 Fibronectins Proteins 0.000 description 1
- 102100020997 Fractalkine Human genes 0.000 description 1
- 108091006027 G proteins Proteins 0.000 description 1
- 102000013446 GTP Phosphohydrolases Human genes 0.000 description 1
- 102000030782 GTP binding Human genes 0.000 description 1
- 108091000058 GTP-Binding Proteins 0.000 description 1
- 108091006109 GTPases Proteins 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- 102000034354 Gi proteins Human genes 0.000 description 1
- 108091006101 Gi proteins Proteins 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 102100040615 Homeobox protein MSX-2 Human genes 0.000 description 1
- 101000678890 Homo sapiens Atypical chemokine receptor 3 Proteins 0.000 description 1
- 101000728629 Homo sapiens Beta-arrestin-1 Proteins 0.000 description 1
- 101000946926 Homo sapiens C-C chemokine receptor type 5 Proteins 0.000 description 1
- 101000947174 Homo sapiens C-X-C chemokine receptor type 1 Proteins 0.000 description 1
- 101000978392 Homo sapiens Eotaxin Proteins 0.000 description 1
- 101000967222 Homo sapiens Homeobox protein MSX-2 Proteins 0.000 description 1
- 101001002634 Homo sapiens Interleukin-1 alpha Proteins 0.000 description 1
- 101001076386 Homo sapiens Interleukin-1 family member 10 Proteins 0.000 description 1
- 101000998151 Homo sapiens Interleukin-17F Proteins 0.000 description 1
- 101000960954 Homo sapiens Interleukin-18 Proteins 0.000 description 1
- 101001019591 Homo sapiens Interleukin-18-binding protein Proteins 0.000 description 1
- 101000998140 Homo sapiens Interleukin-36 alpha Proteins 0.000 description 1
- 101001040964 Homo sapiens Interleukin-36 receptor antagonist protein Proteins 0.000 description 1
- 101001055222 Homo sapiens Interleukin-8 Proteins 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 1
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- 102100020881 Interleukin-1 alpha Human genes 0.000 description 1
- 102100026015 Interleukin-1 family member 10 Human genes 0.000 description 1
- 102100033454 Interleukin-17F Human genes 0.000 description 1
- 102100035017 Interleukin-18-binding protein Human genes 0.000 description 1
- 108010082786 Interleukin-1alpha Proteins 0.000 description 1
- 102000017761 Interleukin-33 Human genes 0.000 description 1
- 108010067003 Interleukin-33 Proteins 0.000 description 1
- 108091007973 Interleukin-36 Proteins 0.000 description 1
- 102100033474 Interleukin-36 alpha Human genes 0.000 description 1
- 102100021150 Interleukin-36 receptor antagonist protein Human genes 0.000 description 1
- 102100026236 Interleukin-8 Human genes 0.000 description 1
- 235000014072 Juglans neotropica Nutrition 0.000 description 1
- 235000019687 Lamb Nutrition 0.000 description 1
- 108050006654 Lipocalin Proteins 0.000 description 1
- 102000019298 Lipocalin Human genes 0.000 description 1
- 108090001030 Lipoproteins Proteins 0.000 description 1
- 102000004895 Lipoproteins Human genes 0.000 description 1
- 208000008551 Lyme Neuroborreliosis Diseases 0.000 description 1
- 208000016604 Lyme disease Diseases 0.000 description 1
- 102000008072 Lymphokines Human genes 0.000 description 1
- 108010074338 Lymphokines Proteins 0.000 description 1
- 206010027202 Meningitis bacterial Diseases 0.000 description 1
- 241001421711 Mithras Species 0.000 description 1
- 101800000597 N-terminal peptide Proteins 0.000 description 1
- 102400000108 N-terminal peptide Human genes 0.000 description 1
- 208000036110 Neuroinflammatory disease Diseases 0.000 description 1
- 108010061100 Nucleoproteins Proteins 0.000 description 1
- 102000011931 Nucleoproteins Human genes 0.000 description 1
- CIQHWLTYGMYQQR-QMMMGPOBSA-N O(4')-sulfo-L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(OS(O)(=O)=O)C=C1 CIQHWLTYGMYQQR-QMMMGPOBSA-N 0.000 description 1
- 108010079246 OMPA outer membrane proteins Proteins 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 102000004503 Perforin Human genes 0.000 description 1
- 108010056995 Perforin Proteins 0.000 description 1
- 206010057249 Phagocytosis Diseases 0.000 description 1
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 102100040756 Rhodopsin Human genes 0.000 description 1
- 108090000820 Rhodopsin Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 235000003534 Saccharomyces carlsbergensis Nutrition 0.000 description 1
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 1
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 101710088580 Stromal cell-derived factor 1 Proteins 0.000 description 1
- 108020000411 Toll-like receptor Proteins 0.000 description 1
- 102000002689 Toll-like receptor Human genes 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 1
- 108010073429 Type V Secretion Systems Proteins 0.000 description 1
- 108070000030 Viral receptors Proteins 0.000 description 1
- IXKSXJFAGXLQOQ-XISFHERQSA-N WHWLQLKPGQPMY Chemical compound C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 IXKSXJFAGXLQOQ-XISFHERQSA-N 0.000 description 1
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 241000235015 Yarrowia lipolytica Species 0.000 description 1
- 241000235017 Zygosaccharomyces Species 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 108090000637 alpha-Amylases Proteins 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000003698 anagen phase Effects 0.000 description 1
- 230000033115 angiogenesis Effects 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 102000025171 antigen binding proteins Human genes 0.000 description 1
- 108091000831 antigen binding proteins Proteins 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 208000006673 asthma Diseases 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 238000002819 bacterial display Methods 0.000 description 1
- 201000009904 bacterial meningitis Diseases 0.000 description 1
- 230000010310 bacterial transformation Effects 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 238000005452 bending Methods 0.000 description 1
- 102000016966 beta-2 Adrenergic Receptors Human genes 0.000 description 1
- 108010014499 beta-2 Adrenergic Receptors Proteins 0.000 description 1
- 102000000072 beta-Arrestins Human genes 0.000 description 1
- 108010080367 beta-Arrestins Proteins 0.000 description 1
- 239000011230 binding agent Substances 0.000 description 1
- 238000012742 biochemical analysis Methods 0.000 description 1
- 229960000074 biopharmaceutical Drugs 0.000 description 1
- 238000005460 biophysical method Methods 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 210000004900 c-terminal fragment Anatomy 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 229940095731 candida albicans Drugs 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 230000011748 cell maturation Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000005754 cellular signaling Effects 0.000 description 1
- 239000002556 chemokine receptor agonist Substances 0.000 description 1
- 239000005482 chemotactic factor Substances 0.000 description 1
- STJMRWALKKWQGH-UHFFFAOYSA-N clenbuterol Chemical compound CC(C)(C)NCC(O)C1=CC(Cl)=C(N)C(Cl)=C1 STJMRWALKKWQGH-UHFFFAOYSA-N 0.000 description 1
- 238000000975 co-precipitation Methods 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 239000013601 cosmid vector Substances 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 208000015842 craniosynostosis 2 Diseases 0.000 description 1
- 238000002447 crystallographic data Methods 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- UQHKFADEQIVWID-UHFFFAOYSA-N cytokinin Natural products C1=NC=2C(NCC=C(CO)C)=NC=NC=2N1C1CC(O)C(CO)O1 UQHKFADEQIVWID-UHFFFAOYSA-N 0.000 description 1
- 239000004062 cytokinin Substances 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000000635 electron micrograph Methods 0.000 description 1
- 230000009881 electrostatic interaction Effects 0.000 description 1
- 206010014599 encephalitis Diseases 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 210000002744 extracellular matrix Anatomy 0.000 description 1
- 210000003495 flagella Anatomy 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 230000005714 functional activity Effects 0.000 description 1
- 238000010230 functional analysis Methods 0.000 description 1
- 238000002825 functional assay Methods 0.000 description 1
- 108010044804 gamma-glutamyl-seryl-glycine Proteins 0.000 description 1
- 230000008571 general function Effects 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 102000034238 globular proteins Human genes 0.000 description 1
- 108091005896 globular proteins Proteins 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 102000057825 human ARRB1 Human genes 0.000 description 1
- 102000048160 human CCR5 Human genes 0.000 description 1
- 102000057105 human CX3CL1 Human genes 0.000 description 1
- 102000043959 human IL18 Human genes 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 125000001165 hydrophobic group Chemical group 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 230000004957 immunoregulator effect Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000028709 inflammatory response Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 229940047124 interferons Drugs 0.000 description 1
- 239000000543 intermediate Substances 0.000 description 1
- 230000006662 intracellular pathway Effects 0.000 description 1
- 230000004068 intracellular signaling Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 150000002611 lead compounds Chemical class 0.000 description 1
- 239000002523 lectin Substances 0.000 description 1
- 210000000265 leukocyte Anatomy 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000010534 mechanism of action Effects 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 102000006240 membrane receptors Human genes 0.000 description 1
- 108020004084 membrane receptors Proteins 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 230000003641 microbiacidal effect Effects 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 229940124561 microbicide Drugs 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 230000004001 molecular interaction Effects 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 210000004898 n-terminal fragment Anatomy 0.000 description 1
- 208000015122 neurodegenerative disease Diseases 0.000 description 1
- 230000003959 neuroinflammation Effects 0.000 description 1
- 108010058731 nopaline synthase Proteins 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000006384 oligomerization reaction Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000003204 osmotic effect Effects 0.000 description 1
- 239000006179 pH buffering agent Substances 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 1
- 230000008782 phagocytosis Effects 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- 238000009520 phase I clinical trial Methods 0.000 description 1
- 230000010363 phase shift Effects 0.000 description 1
- 238000000053 physical method Methods 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 239000002504 physiological saline solution Substances 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 230000030786 positive chemotaxis Effects 0.000 description 1
- 230000001323 posttranslational effect Effects 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 125000001500 prolyl group Chemical group [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 description 1
- 239000012268 protein inhibitor Substances 0.000 description 1
- 229940121649 protein inhibitor Drugs 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 229950010131 puromycin Drugs 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003014 reinforcing effect Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 206010039073 rheumatoid arthritis Diseases 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000013515 script Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 230000007781 signaling event Effects 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 230000035882 stress Effects 0.000 description 1
- 238000003107 structure activity relationship analysis Methods 0.000 description 1
- 230000019635 sulfation Effects 0.000 description 1
- 238000005670 sulfation reaction Methods 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 102000027257 transmembrane receptors Human genes 0.000 description 1
- 108091008578 transmembrane receptors Proteins 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 102000003390 tumor necrosis factor Human genes 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
- C07K14/715—Receptors; Cell surface antigens; Cell surface determinants for cytokines; for lymphokines; for interferons
- C07K14/7158—Receptors; Cell surface antigens; Cell surface determinants for cytokines; for lymphokines; for interferons for chemokines
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/52—Cytokines; Lymphokines; Interferons
- C07K14/521—Chemokines
- C07K14/523—Beta-chemokines, e.g. RANTES, I-309/TCA-3, MIP-1alpha, MIP-1beta/ACT-2/LD78/SCIF, MCP-1/MCAF, MCP-2, MCP-3, LDCF-1, LDCF-2
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/52—Cytokines; Lymphokines; Interferons
- C07K14/521—Chemokines
- C07K14/522—Alpha-chemokines, e.g. NAP-2, ENA-78, GRO-alpha/MGSA/NAP-3, GRO-beta/MIP-2alpha, GRO-gamma/MIP-2beta, IP-10, GCP-2, MIG, PBSF, PF-4, KC
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/35—Fusion polypeptide containing a fusion for enhanced stability/folding during expression, e.g. fusions with chaperones or thioredoxin
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/60—Fusion polypeptide containing spectroscopic/fluorescent detection, e.g. green fluorescent protein [GFP]
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Toxicology (AREA)
- Cell Biology (AREA)
- Immunology (AREA)
- Peptides Or Proteins (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本发明涉及结构生物学领域。更具体地,本发明涉及新型融合蛋白、它们在大分子三维结构分析中的用途和方法,如X射线晶体学和高分辨率冷冻电镜,以及它们在基于结构的药物设计和筛选中的用途。甚至更具体地,本发明涉及细胞因子和支架蛋白的功能性融合蛋白,其中支架是折叠蛋白,其打断细胞因子的拓扑结构以形成保留了其受体结合和激活能力的刚性融合蛋白。更具体地,本文公开了基于趋化因子和白介素的功能性融合蛋白及其生产和用途。
Description
发明领域
本发明涉及结构生物学领域。更具体地,本发明涉及新型融合蛋白、它们在大分子三维结构分析中的用途和方法,如X射线晶体学和高分辨率冷冻电镜,以及它们在基于结构的药物设计和筛选中的用途。甚至更具体地,本发明涉及细胞因子和支架蛋白的功能性融合蛋白,其中支架是折叠蛋白,其打断(interrupt)细胞因子的拓扑结构以形成保留了其受体结合和激活能力的刚性融合蛋白。更具体地,本文公开了基于趋化因子和白介素的功能性融合蛋白及其生产和用途。
背景
对某些构象状态下的许多蛋白质和复合物进行3D结构分析仍然很困难。大分子X射线晶体学本质上具有几个缺点,如高质量纯化的蛋白质的先决条件、需要相对大量的蛋白质以及衍射质量晶体的制备。以抗体片段或其他蛋白质的形式应用结晶伴侣已被证明有助于通过最小化靶标的构象异质性来获得有序晶体。此外,伴侣可以提供初始的基于模型的定相信息(Koide,2009)。尽管如此,单粒子电子低温显微镜(冷冻电镜)最近已发展成为一种替代且通用的技术,用于以原子分辨率对大分子复合物进行结构分析(Nogales,2016)。尽管用于数据分析的仪器和方法不断改进,但3D重建可达到的最高分辨率主要取决于给定样本的均质性,以及以高精度迭代细化每个单独粒子的取向参数的能力。由于大分子的表面特性导致特定区域优先粘附到空气-水界面或基底支撑物上引起的优选粒子取向代表了冷冻电镜中反复出现的问题。因此,在这方面,我们仍然缺少诸如下一代伴侣之类的工具来克服这些障碍。
细胞因子是一类小蛋白质(5-20kDa),在皮摩尔或纳摩尔浓度下充当细胞信号分子,以调节炎症和调节细胞活动,如迁移、生长、存活和分化。细胞因子是异常庞大且多样化的一组促炎或抗炎因子,它们根据其结构同源性或其受体的结构同源性分为多个家族。细胞因子可以包括趋化因子、干扰素、白介素、淋巴因子、肿瘤坏死因子、激素或生长因子。白细胞介素(IL)是一组具有复杂免疫调节功能的细胞因子,所述功能包括细胞增殖、成熟、迁移和粘附,在免疫细胞分化和激活中发挥着重要作用。IL还具有促炎和抗炎作用,并且由于宿主免疫***和感染生物体之间的持续竞争而处于持续的压力下来进化;因此,IL经历了显著的进化,导致直系同源蛋白之间极少氨基酸保守,使基因家族组织复杂化。尽管如此,晶体学数据和常见结构基序的鉴定已导致分为四个主要组,包括编码以下的基因:IL1-样细胞因子、I类螺旋细胞因子(IL4样、γ链和IL6/12样),II类螺旋细胞因子(IL10样和IL28样)和IL17样细胞因子(在结构上与其他IL亚家族无关,并且IL17F构成半胱氨酸-结折叠)。
趋化因子是细胞因子家族内的一组分泌的小球状蛋白,其一般功能是诱导细胞迁移。细胞因子或趋化因子配体与其同源受体的结合导致受体的激活,进而触发级联的信号事件,其调节各种细胞功能,如细胞粘附、吞噬作用、细胞因子分泌、细胞激活、细胞增殖、细胞存活和细胞死亡、细胞凋亡、血管生成和增殖。
趋化因子在细胞表面和胞外基质上以梯度形式积累,并被迁移细胞上的趋化因子受体解释为定向信号。大多数趋化因子受体是七跨膜(7TM)G-蛋白偶联受体(GPCR),其响应趋化因子结合激活Gαi依赖性胞内途径。一些趋化因子受体通过其他机制转运或清除趋化因子,因此被称为非典型趋化因子受体(ACKR)。这些“趋化细胞因子”参与了白细胞的化学吸引和免疫细胞向全身各部位的运输。趋化因子***涉及许多疾病领域,如哮喘、动脉粥样硬化和类风湿性关节炎等炎症病理以及自身免疫性疾病。细胞因子和趋化因子在介导各种炎性神经退行性疾病的神经炎症和神经退行病变方面起着重要作用,所述疾病包括细菌性脑膜炎、脑脓肿、莱姆神经疏螺旋体病和HIV脑炎(综述参见Ramesh等,2013)。因此,对***的理解对于适当的治疗靶选择和归因特异性至关重要。
趋化因子是约7-12kDa的小蛋白质,基于接近成熟配体(CC、CXC、CX3C和C)氨基末端的半胱氨酸残基的特征性模式分为四个亚家族。所有趋化因子都显示出同源的三级结构,并以不同的寡聚状态与细胞表面糖胺聚糖(GAG)以及趋化因子受体相互作用。目前已知大约有45种人类趋化因子和22种趋化因子受体,同一亚家族内的趋化因子通常与同一类别的多个受体结合。尽管趋化因子以二聚体形式出现,但结合以激活趋化因子受体的是其单体形式。受体结合和激活的双位点模型涉及在受体激活中必不可少的趋化因子的N-末端,以及介导受体结合的趋化因子核心结构域。天然趋化因子具有不同的受体特异性,且已知趋化因子的变体显示出其受体的少许不同的构象状态,导致不同的信号传导和反应。因此,一些趋化因子充当给定受体的激动剂,而其他趋化因子可充当拮抗剂或反向激动剂。为了充分理解这种识别和激活机制,需要与完整受体复合的趋化因子或变体的高分辨率结构。例如,正在研究被称为激动剂和拮抗剂的几种CCL5(或RANTES)变体的结构研究,以了解它们作为杀微生物剂保护免受HIV的潜力(Kufareva等,2015)。趋化因子的几种结构是已知的,对于更易处理的GPCR,概括为可溶性复合物,结构已经被解析(β2-肾上腺素能受体,视紫红质)。然而,由于受体作为跨膜蛋白的构象灵活性,对趋化因子/受体复合物和相互作用的结构见解仍然有限并形成挑战。已经确定了与小分子复合的趋化因子受体CXCR4和CCR5GPCR,以及与拮抗剂趋化因子变体5P7-CCL5复合的CCR5,与病毒拮抗剂趋化因子vMIP-II复合的CXCR4,以及与人CX3CL1受体复合的病毒受体US28的晶体结构。此外,对于G蛋白和β-抑制蛋白复合的GPCR的可用晶体结构,当彼此比较时,没有观察到受体的明显显著构象差异,表明配体-受体对的新见解对于评估它们的成药性至关重要(Proudfoot等,2015年)。应用了揭示结构信息的替代方法,例如放射分解足迹、二硫化物捕获和诱变,例如绘制ACKR3:CXCL12和ACKR3:小分子复合物的结构(Gustavsson等,2017)。这些技术提供了在同源受体中通过X射线晶体学证明无法解析的动态区域,与分子建模相整合,以产生完整的和有凝聚力的实验驱动模型,以扩展对受体:趋化因子和受体:小分子复合物结构的现有知识。然而,为了探索新途径并发现配体诱导的GPCR,以及其他趋化因子、白细胞介素或整体“细胞因子受体”(一种通用原型伴侣)构象变化的新机制,以促进此类复合物的与其配体的X射线晶体学或冷冻电镜分析,需要配体类似物或变体。
发明概述
本申请涉及新型功能性融合蛋白的设计和生成及其用途,如它们在结构分析中作为下一代伴侣的作用。如本文所述的融合蛋白基于以下发现:细胞因子配体可以扩大为刚性融合蛋白以促进某些构象状态下的配体/受体复合物的结构分析。事实上,本公开提供了一种融合蛋白,其基于已知细胞因子的超家族共享序列相似性并在它们的相互受体***中表现出结构同源性和一些混杂性,尽管它们不表现出功能相似性。由于细胞因子是根据其结构分组的,因此可以从细胞因子亚组内结构元素的相似性开始设计通用融合方案。白介素是细胞因子的一个亚组,其中例如IL-1超家族采用保守的特征β-三叶形折叠,其由以三重对称模式排列的反平行β-链组成,具有保守的β-桶疏水性核心基序,其在环区域具有显著的柔韧性。趋化因子是细胞因子的另一个亚组,它们显示出非常相似的基本三级结构,趋化因子核心结构域包含具有至少3条β链的β折叠。所述亚家族的结构保守性理想地将细胞***素定位为提供通用方法和原型作为配体/受体复合物的结构分析中的下一代伴侣。由于三级结构在这些亚家族中是同源的,如“IL-1受体型白细胞介素”或“IL-1家族”,如在本文中可互换使用,以及趋化因子,具有包含二级β-结构(β-折叠或-桶),通过暴露的转角或环提供了β链的相互连接,其核心域中暴露的且可与支架蛋白融合的物理位置通常可以用作示例,以形成整合配体的伴侣,用于细胞因子/受体复合物内的含β链结构域的细胞因子的结构分析。将白介素-1或趋化因子配体用于构建刚性的较大的配体,称为MegaKineTM,且令人惊讶的是,扩大的配体融合蛋白保留了其受体结合和激活能力。这些新型功能性融合蛋白提供了新的途径来捕获不同构象状态的受体(如GPCR)并促进其结构分析。通过以这样打断细胞因子其核心结构域的拓扑结构而没有干扰其折叠或功能的方式在细胞因子核心结构域内刚性***支架蛋白而形成的新型融合允许在基于结构的药物发现中采用新方法。所得到的功能性融合蛋白是通过所述细胞因子(如针对趋化因子和IL-1β所证明的)和支架蛋白之间的遗传融合表达获得的,该支架蛋白被设计为使得支架或其片段***细胞因子核心结构域的拓扑结构内。令人惊讶地表明了所得到的新型融合蛋白的特征在于其融合区域的高刚性,并且令人惊讶地保留了它们典型的折叠和功能性,即它们保留了结合亲和力,并且此外在与细胞因子受体结合时显示出激活能力。事实上,技术人员选择在暴露的β-转角的可及位点处的细胞因子其保守的核心结构域和支架蛋白之间进行的遗传融合,使得不干扰或改变受体结合。因此,本发明通过在细胞因子保守的核心结构域(如趋化因子核心结构域,即β-链β2和β-链β3之间,或IL-1β-桶核心基序,即β-链β6和β-链β7之间)内的暴露的β-转角或β-环中的完美选择的位点,提供了一种新的和独特类型的功能性融合蛋白,以允许与折叠的支架蛋白进行刚性非柔性融合,这并不容易设计。因此,融合蛋白提供了一种新的工具,通过增加质量和提供结构特征来促进趋化因子配体/受体复合物的高分辨率冷冻电镜和X射线晶体学结构分析。因此,这些用于任何可能的细胞因子(尤其是趋化因子或其变体配体,或白介素IL-1或其变体)与其受体的复合物的结构分析的下一代伴侣的设计和生成允许扩大的配体,其增加了质量和/或向目的复合物添加了定义的特征,以获得高分辨率结构而没有改变构象状态。事实上,融合蛋白因此作为结构分析中的工具是有利的,而且在基于结构的药物设计和筛选中也是有利的,并成为用于发现和开发新型生物制品和小分子物质的附加价值。
本发明的第一个方面涉及一种包含功能性细胞因子的新型融合蛋白,所述功能性细胞因子与支架或融合伙伴蛋白相连,其中所述支架蛋白是至少50个氨基酸的折叠蛋白,并且在一个或多个可及的氨基酸位置与细胞因子偶联,因此暴露在所述细胞因子的表面,导致所述细胞因子的拓扑结构的打断(interruption)。所述融合蛋白的进一步特征在于它是功能性的,即与未与所述支架蛋白融合的细胞因子配体相比,它保留了其细胞因子功能性。另一个实施方案公开了本发明的融合蛋白,其中支架蛋白和细胞因子蛋白的融合导致细胞因子的一级拓扑结构被打断(interrupted),与未与另一个蛋白质融合的细胞因子的折叠相比,允许保留细胞因子蛋白的折叠和典型的三级结构。更具体地,可及氨基酸位置存在于beta转角(β-转角)或β-环的暴露区域中,其将保守的细胞因子的β链结构相互连接。
在本发明的特定实施方案中,融合可以是直接融合,或由接头或接头肽制成的融合,所述融合位点被完美地设计以产生刚性、非柔性融合蛋白。优选,接头包含五个、四个、三个或更优选地两个,甚至更优选一个氨基酸残基,或是直接融合体(无接头)。
所述具有在趋化因子核心结构域表面的一个或多个可及或暴露位点与细胞因子或趋化因子核心结构域偶联的支架蛋白的融合蛋白特征还在于所述可及或暴露位点不在负责或参与受体结合和受体激活的区域中,以便在结合和/或激活受体时保留其细胞因子功能。
本发明的一个实施方案涉及一种新型融合蛋白,其中所述细胞因子是功能性趋化因子,其与支架或融合伙伴蛋白相连,其中所述支架蛋白在一个或多个可及氨基酸位置与趋化因子的核心结构域偶联,因此暴露在所述结构域的表面,导致所述趋化因子的拓扑结构的打断。所述融合蛋白的进一步特征在于,与未与所述支架蛋白融合的趋化因子配体相比,它保留了其趋化因子功能性。另一个实施方案公开了本发明的融合蛋白,其中支架蛋白和趋化因子核心结构域的融合导致趋化因子核心结构域的一级拓扑结构打断,与未与另一个蛋白质融合的趋化因子配体的折叠相比,允许保留所述趋化因子核心结构域的折叠和典型三级结构。在一个实施方案中,所述融合蛋白包含具有N-末端环、含有3条β-链的β折叠和C-末端螺旋的趋化因子核心结构域。在一个具体实施方案中,融合蛋白的所述趋化因子核心结构域中的暴露区域特别涉及连接β-链β2和β-链β3的β-转角。因此,支架蛋白在存在于那2条β链之间的β转角中的可及位点处被***核心结构域内。
可替换的实施方案涉及融合蛋白,其中所述细胞因子是白介素,优选“IL-1家族”白介素,并且其中所述支架蛋白在所述β-桶核心基序的暴露的β-转角中的一个或多个可及位点打断白介素β-桶核心基序的拓扑结构。在具体实施方案中,融合蛋白的所述保守β-桶核心基序中的暴露区域特别涉及连接β-链β6和β-链β7的β-转角。因此,支架蛋白在存在于那2条β链之间的β转角中的可及位点处被***核心基序内。
在本发明的另一个实施方案中,用于产生融合蛋白的支架蛋白是环状排列蛋白,更具体地,可以在所述支架蛋白的N-和C-末端之间进行环状排列。在某些实施方案中,环状排列的支架蛋白在所述支架蛋白的另一个可及位点处被切割,以提供与趋化因子核心结构域的可及位点融合的位点。本发明的另一个实施方案涉及融合蛋白,其中支架蛋白的总分子量为至少30kDa。
本发明的再一个方面涉及编码本文所述的任何融合蛋白的核酸分子。或者,在一个实施方案中,嵌合基因具有至少一个启动子,编码融合蛋白的所述核酸分子,以及包含转录终止信号的3'端区域。另一个实施方案涉及编码所述融合蛋白或包含编码所述融合蛋白的核酸分子的表达盒。进一步的实施方案涉及包含编码本发明融合蛋白的所述核酸分子的载体。在特定的实施方案中,所述载体适合于在大肠杆菌或本文提出的替代宿主中表达,并且适合于酵母、噬菌体、细菌或病毒(表面)展示。在另一个实施方案中,公开了包含本发明融合蛋白的宿主细胞。或者,其中共表达所述融合蛋白和能够结合融合蛋白的细胞因子部分的细胞因子或趋化因子受体的宿主细胞。
本发明的另一个方面涉及包含所述融合蛋白和细胞因子受体的复合物。更具体地,包含趋化因子或白介素受体(其能够结合融合蛋白的细胞因子部分,或特别是融合蛋白的趋化因子或白介素部分)和所述融合蛋白的复合物,其中所述受体蛋白特异性地结合所述融合蛋白。更具体地,其中所述受体蛋白与所述融合蛋白的细胞因子部分或替代地与所述融合蛋白的趋化因子或白介素部分结合,甚至更具体地,与融合蛋白的已知受体结合区结合。在某个实施方案中,如本文所述的复合物包含激活的受体,其中所述受体在其细胞因子受体结合区或特别地在其趋化因子或白介素受体结合区与融合蛋白结合时被激活。
本发明的另一个方面涉及一种用于测定细胞因子受体复合物的三维结构的方法,包括以下步骤:
(i)提供本发明的融合蛋白与细胞因子受体(如趋化因子/白介素受体),以形成复合物,其中所述受体蛋白与融合蛋白的细胞因子特异性地结合,(如分别地,融合蛋白的趋化因子或白介素),或替换地,提供本发明的复合物;
(ii)并在合适的条件下展示所述混合物或复合物,用于结构分析,
其中通过所述结构分析以高分辨率确定所述配体/受体复合物的3D结构。
另一个方面涉及一种用于生产如本文所述的功能性融合蛋白的方法,包括步骤:
a.选择细胞因子超家族,如趋化因子或白介素-1-样配体,以及支架蛋白,其3-D结构揭示了至少10kDa的折叠蛋白,其中细胞因子在暴露的β-环或β-转角中具有可及位点,用于打断氨基酸序列,而没有打断保守的细胞因子核心结构域的一级拓扑结构,
b.设计基因融合构建体,其中设计核酸序列以编码蛋白质序列,其中:
(i)细胞因子配体的蛋白质序列在与其保守核心结构域结构的两条β链之间(其是暴露于表面的β-环或β-转角)的位点相对应的氨基酸位置被打断,
(ii)细胞因子最N-末端打断的氨基酸位点(最N-末端β-链的C-末端与支架蛋白最N-末端打断的位点融合,细胞因子最C-末端打断的位点(最C-末端β-链的N-末端)与支架蛋白最C-末端打断的位点融合,
c.在表达***中引入所述基因融合构建体以获得融合蛋白,其中所述趋化因子在其核心结构域的两个或更多个位点与支架蛋白融合。
可替换的实施方案公开了用于生产如本文所述的融合蛋白的方法,包括步骤:
a.选择趋化因子和在其三级结构中具有可及环或转角的折叠支架蛋白,其被打断来形成融合蛋白的蛋白质序列,趋化因子或支架蛋白的一级拓扑结构没有打断,
b.设计基因融合构建体,其中设计核酸序列以编码蛋白质序列,其中:
(i)趋化因子的蛋白质序列在与其核心结构域结构的β-链β2和β-链β3之间的可及位点相对应的氨基酸处被打断,
(ii)支架蛋白至少为10kDa并且在其N-和C-末端融合,以获得环状排列的支架蛋白,
(iii)在对应于暴露的β-环或β-转角的可及位点在其氨基酸序列中进一步打断ii)的环状排列的支架蛋白,其不含在步骤ii)中融合的氨基酸,
(iv)将趋化因子β-链β2的C-末端打断的位点融合到环状排列的支架蛋白的最N-末端打断的氨基酸残基,即,N-末端,以及将趋化因子β-链β3的N-末端打断的位点融合到环状排列的支架蛋白的最C-末端打断的氨基酸残基,即,C-末端,
c.在表达***中引入所述基因融合构建体以获得融合蛋白,其中所述趋化因子在其核心结构域的两个或更多个位点与环状排列的支架蛋白融合。
另一个方面涉及本发明的融合蛋白的用途或核酸分子、载体、宿主细胞或复合物的用途,用于细胞因子配体/受体蛋白的结构分析。特别地,融合蛋白的用途,其中所述细胞因子受体(或趋化因子/白介素/……受体)蛋白是结合所述融合蛋白的蛋白质。具体地,一个实施方案涉及融合蛋白在包括单颗粒冷冻电镜或包括晶体学的结构分析中的用途。
附图描述
所描述的附图只是示意性的并且是非限制性的。在附图中,为了说明的目的,一些元件的尺寸可能被夸大并且未按比例绘制。
图1.柔性融合蛋白与刚性趋化因子嵌合蛋白的比较
(A)在趋化因子结构域和支架蛋白的N-或C-末端的柔性融合或接头,仅使用一个直接融合或接头。(B)趋化因子结构域和支架蛋白的刚性融合,其中趋化因子结构域经由至少两个将趋化因子结构域连接到支架的直接融合或接头与支架蛋白融合。这
图2.从***连接趋化因子的β-链β2和β3的β-转角的支架蛋白的环状排列变体构
建趋化因子融合蛋白的工程化原理
该方案显示了如何通过连接趋化因子结构域和支架的两个肽键或两个短接头可以将趋化因子嫁接到大的支架蛋白上。剪刀指示必须在趋化因子和支架中切割哪些暴露的转角。虚线表示趋化因子和支架的剩余部分必须如何通过使用肽键或短肽接头连接来构建趋化因子嵌合蛋白。
图3.从***连接6P4-CCL5趋化因子的β-链β2和β3的β-转角中的HopQ的环状排列
变体构建的50kDa 6P4-CCL5融合蛋白的模型1。
(A)趋化因子融合蛋白的模型,由趋化因子6P4-CCL5(顶部)和幽门螺杆菌(H.pylori)的HopQ的粘附素结构域的环状排列变体(底部)通过连接趋化因子和支架的两个肽键或接头融合而成。(B)将编码幽门螺杆菌株G27的1型HopQ的粘附素结构域的环状排列基因(底部,PDB5LP2,SEQ ID NO:2,c7HopQ)***6P4-CCL5(顶部,PDB 5UIW,SEQ ID NO:1)的连接β-链β2和β3的β-转角(β-转角β2-β3)中。(C)所得到的趋化因子嵌合蛋白的氨基酸序列(Mk6P4-CCL5 c7HopQ,SEQ ID NO:3)。源自趋化因子的序列以粗体表示。源自HopQ的序列在两者之间。包括6xHis和EPEA的C-末端标签标记了虚线下划线。
图4.从***连接6P4-CCL5趋化因子的β-链β2和β3的β-转角中的HopQ的环状排列
变体构建的50kDa 6P4-CCL5融合蛋白的模型2。
(A)趋化因子融合蛋白的模型,由趋化因子6P4-CCL5(顶部)和幽门螺杆菌(H.pylori)的HopQ的粘附素结构域的环状排列变体(底部)通过连接趋化因子和支架的两个肽键或接头融合而成。(B)将编码幽门螺杆菌株G27的1型HopQ的粘附素结构域的环状排列基因(底部,PDB5LP2,SEQ ID NO:2,c7HopQ)***6P4-CCL5(顶部,PDB 5UIW,SEQ ID NO:1)的连接β-链β2和β3的β-转角(β-转角β2-β3)中。(C)所得到的趋化因子嵌合蛋白的氨基酸序列(Mk6P4-CCL5 c7HopQ,SEQ ID NO:4)。源自趋化因子的序列以粗体表示。源自HopQ的序列在两者之间。包括6xHis和EPEA的C-末端标签标记了虚线下划线。
图5.从***连接6P4-CCL5趋化因子的β-链β2和β3的β-转角中的HopQ的环状排列
变体构建的50kDa 6P4-CCL5融合蛋白的模型3。
(A)趋化因子融合蛋白的模型,由趋化因子6P4-CCL5(顶部)和幽门螺杆菌(H.pylori)的HopQ的粘附素结构域的环状排列变体(底部)通过连接趋化因子和支架的两个肽键或接头融合而成。(B)将编码幽门螺杆菌株G27的1型HopQ的粘附素结构域的环状排列基因(底部,PDB5LP2,SEQ ID NO:2,c7HopQ)***6P4-CCL5(顶部,PDB 5UIW,SEQ ID NO:1)的连接β-链β2和β3的β-转角(β-转角β2-β3)中。(C)所得到的趋化因子嵌合蛋白的氨基酸序列(Mk6P4-CCL5 c7HopQ,SEQ ID NO:5)。源自趋化因子的序列以粗体表示。源自HopQ的序列在两者之间。包括6xHis和EPEA的C-末端标签标记了虚线下划线。
图6.从***连接6P4-CCL5趋化因子的β-链β2和β3的β-转角中的HopQ的环状排列
变体构建的50kDa 6P4-CCL5融合蛋白的模型4。
(A)趋化因子融合蛋白的模型,由趋化因子6P4-CCL5(顶部)和幽门螺杆菌(H.pylori)的HopQ的粘附素结构域的环状排列变体(底部)通过连接趋化因子和支架的两个肽键或接头融合而成。(B)将编码幽门螺杆菌株G27的1型HopQ的粘附素结构域的环状排列基因(底部,PDB5LP2,SEQ ID NO:2,c7HopQ)***6P4-CCL5(顶部,PDB 5UIW,SEQ ID NO:1)的连接β-链β2和β3的β-转角(β-转角β2-β3)中。(C)所得到的趋化因子嵌合蛋白的氨基酸序列(Mk6P4-CCL5 c7HopQ,SEQ ID NO:6)。源自趋化因子的序列以粗体表示。源自HopQ的序列在两者之间。包括6xHis和EPEA的C-末端标签标记了虚线下划线。
图7.用于优化连接支架蛋白HopQ和趋化因子的接头肽的组成和长度的酵母展示
载体。
(A)展示载体的示意图。LS:指引酵母中的胞外分泌的酵母α-因子appS4的工程化分泌信号(Rakestraw等,2009)。N:直至β-链β2的6P4-CCL5的N-末端部分(SEQ ID NO:1的1-43);编码幽门螺杆菌株G27的1型HopQ的粘附素结构域的环状排列基因(底部,PDB 5LP2,SEQ ID NO:2,c7HopQ);6P4-CCL5趋化因子的从β-链β3起的6P4-CCL5 C-末端(SEQ ID NO:1的47-69);连接展示的蛋白Aga2p的柔性接头,Aga2p是酵母凝集素蛋白的粘附亚基,其通过到Aga1p蛋白的二硫键连接酵母细胞壁(Chao等,2006);ACP:酰基载体蛋白,用于展示的趋化因子融合蛋白的正交标记,以监测其表达水平(Johnsson等,2005)。(B)展示的趋化因子融合蛋白的序列多样性(SEQ ID NO:25-28):正常字体的AppS4前导序列,粗体表示的具有随机接头的Megakine Mk6P4-CCL5 c7HopQ,(X)1-2是可变长度(1或2个氨基酸)和混合组成的短肽接头,柔性(GGGS)n多肽接头表示为斜体,Aga2p蛋白序列是下划线的,ACP序列是双下划线的,cMyc标签。(C)通过使用等摩尔混合的2个正向(SEQ ID NO:29,SEQ ID NO:30)和2个反向PCR引物(SEQ ID NO:31,SEQ ID NO:32),来引入不同长度(1或2个氨基酸)和混合组成的短肽接头,产生了4个趋化因子融合蛋白序列池(每个表示25%的文库),编码总共176400个AA-序列变体。
图8.通过酵母展示和二维流式细胞术连续轮选择趋化因子融合蛋白。
为了优化连接支架蛋白HopQ和趋化因子CCL5的接头肽的组成和长度,通过酵母展示和流式细胞术进行了选择。每个点表示用pCTCON2衍生物转化的分开的EBY100酵母细胞的两个荧光信号,所述衍生物编码通过具有不同长度和组成的接头与Aga2p和ACP融合的趋化因子融合蛋白Mk6P4-CCL5 c7HopQ。使用SFP合酶(1μM)用CoA-547(2μM)将酵母细胞正交染色,以测量Megakine展示水平(Y-轴)。为了测量展示的Megakine是否含有折叠的CCL5部分,这些细胞用Alexa 647标记的抗人RANTES(CCL5)抗体补充染色(X-轴)。在第1轮中,用0.25mg/ml的Alexa 647抗人RANTES(CCL5)抗体孵育文库。分选了200000个对Megakine表达(PE通道)和抗人RANTES(CCL5)(647nm通道)展示了高荧光的酵母细胞。在第2轮中,我们用0.025mg/ml的Alexa647抗人RANTES(CCL5)抗体孵育富集的文库。分选了20000个对Megakine表达(PE通道)和抗人RANTES(CCL5)(647nm通道)展示了最高荧光的酵母细胞,并接受序列分析。
图9.通过二维流式细胞术定性分析EBY100酵母细胞表面上的具有不同接头的四
个不同的趋化因子融合蛋白的展示。
用编码与Aga2p和ACP融合的趋化因子融合蛋白Mk6P4-CCL5 c7HopQ的pCTCON2衍生物转化的单独的EBY100酵母细胞的相对荧光强度的点图表示(A至D,分别是模型1至4,SEQ IDNO:7-10)。将展示MegaBody MbNb207 cHopQ的酵母细胞用作阳性对照(E,SEQ ID NO:11)。在这个实验中,包括未转化的EBY100酵母细胞作为阴性对照(F)。使用SFP合酶(1μM)用CoA-547(2μM)将转化和未转化的酵母细胞同等地正交染色。
图10.通过流式细胞术定量分析EBY100酵母细胞表面上具有不同接头的四个不同
的趋化因子融合蛋白的展示。
单参数直方图显示了与作为阳性对照的MbNb207 cHopQ(SEQ ID NO:11)和作为阴性对照的未转化的EBY100酵母细胞相比,用编码与Aga2p和ACP融合的趋化因子融合蛋白Mk6P4-CCL5 c7HopQ的pCTCON2衍生物转化的EBY100酵母细胞的相对荧光强度(版本1至4,SEQ IDNO:7-10)。使用SFP合酶(1μM)用CoA-547(2μM)将转化和未转化的酵母细胞正交染色。模型1、2、3、4是指实际克隆或融合蛋白。
图11.在EBY100酵母细胞表面上展示的Mk6P4-CCL5 c7HopQ融合蛋白变体1和2的功能性
的流式细胞分析。
用pCTCON2衍生物转化的单独的EBY100酵母细胞的相对荧光强度的点图表示,所述衍生物编码作为与Aga2p和ACP融合体的Mk6P4-CCL5 c7HopQ融合蛋白模型1和2(SEQ ID NO:7和SEQ ID NO:8)。使用SFP合酶(1μM)用CoA-547(2μM)将酵母克隆诱导并正交染色,并用五个不同浓度的Alexa 647抗人RANTES(CCL5)抗体(分别为15、31、62、125和250ng/ml)孵育。y-轴展示了相对PE/CoA-547荧光的平均荧光强度(Megakine展示水平)。x-轴展示了相对Alexa647抗人荧光RANTES(CCL5)抗体结合的平均荧光强度。模型1、2是指实际克隆。
图12.在EBY100酵母细胞表面上展示的Mk6P4-CCL5 c7HopQ融合蛋白变体3和4的功能性
的流式细胞分析。
用pCTCON2衍生物转化的单独的EBY100酵母细胞的相对荧光强度的点图表示,所述衍生物编码作为与Aga2p和ACP融合体的Mk6P4-CCL5 c7HopQ融合蛋白模型3和4(SEQ ID NO:9和SEQ ID NO:10)。使用SFP合酶(1μM)用CoA-547(2μM)将酵母克隆诱导并正交染色,并用五个不同浓度的Alexa647抗人RANTES(CCL5)抗体(分别为15、31、62、125和250ng/ml)孵育。y-轴展示了相对PE/CoA-547荧光的平均荧光强度(Megakine展示水平),x-轴展示了相对Alexa647荧光(RANTES(CCL5)抗体结合)的平均荧光强度。模型3、4是指实际克隆。
图13.在EBY100酵母细胞表面上展示的抗原结合嵌合蛋白MbNb207 cHopQ的功能性的
流式细胞分析。
用pCTCON2衍生物转化的单独的EBY100酵母细胞的相对荧光强度的点图表示,所述衍生物编码作为与Aga2p和ACP融合体的抗原结合嵌合蛋白MbNb207 cHopQ(SEQ ID NO:11)。使用SFP合酶(1μM)用CoA-547(2μM)将酵母克隆诱导并正交染色,并用五个不同浓度的Alexa647抗人RANTES(CCL5)抗体(分别为15、31、62、125和250ng/ml)孵育。y-轴展示了相对PE/CoA-547荧光的平均荧光强度(抗原结合嵌合蛋白展示水平),x-轴展示了相对Alexa647荧光(RANTES(CCL5)抗体结合)的平均荧光强度。
用pCTCON2衍生物转化的单独的EBY100酵母细胞的计算的相对Alexa647荧光的平均荧光强度(RANTES(CCL5)抗体结合)的图表表示,所述衍生物编码作为与Aga2p和ACP融合体的Mk6P4-CCL5 c7HopQ融合蛋白模型1至4(SEQ ID NO:7-10)和阴性对照抗原结合嵌合蛋白MbNb207 cHopQ(SEQ ID NO:11)。酵母克隆用五个不同浓度的Alexa647抗人RANTES(CCL5)抗体(分别为15、31、62、125和250ng/ml)诱导并孵育。
图15.可以从酵母膜洗脱展示的趋化因子融合蛋白。
(A)酵母膜上展示的并使用1mM DTT洗脱的趋化因子融合蛋白的示意图。(B)12%SDS-PAGE,四个不同的变体和作为对照的抗原结合嵌合蛋白MbNb207 cHopQ的洗脱级分。使用鼠抗cMYC一抗和山羊抗鼠碱性磷酸酶缀合抗体的相同凝胶的蛋白质印迹分析。通过分子量标记(箭头)证实了Mk6P4-CCL5 c7HopQ的约50kDa的分子量。
图16.从酿酒酵母EBY100分泌的四种不同的重组趋化因子融合蛋白变体的表达的 SDS-PAGE和蛋白质印迹分析。
在酿酒酵母EBY100中表达His标记的融合蛋白Mk6P4-CCL5 cHopQ模型1至4(SEQ ID NO:12-15),与指引在酵母中的胞外分泌的appS4前导序列融合并通过镍亲和色谱(IMAC)纯化。(A)12%SDS-PAGE凝胶上上样的,用500mM咪唑洗脱的IMAC纯化的融合蛋白Mk6P4-CCL5 c7HopQ。(B)使用鼠抗-His一抗和山羊抗鼠碱性磷酸酶缀合抗体的相同凝胶的蛋白质印迹分析。通过分子量标记(左线:M)证实了Mk6P4-CCL5 c7HopQ的约50kDa的分子量。
图17.四种不同的重组趋化因子融合蛋白变体在大肠杆菌WK6周质中的表达的 SDS-PAGE和蛋白质印迹分析。
在大肠杆菌周质中表达了His标记的融合蛋白Mk6P4-CCL5 c7HopQ模型1至4(SEQ ID NO:3-6),并通过镍亲和色谱(IMAC)纯化。(A)12%SDS-PAGE凝胶上上样的,来自大肠杆菌提取物的和来自IMAC后用500mM咪唑洗脱的纯化蛋白质的融合蛋白Mk6P4-CCL5 c7HopQ的样品。(B)使用鼠抗-His一抗和山羊抗鼠碱性磷酸酶缀合抗体的相同凝胶的蛋白质印迹分析。通过分子量标记(右线:M)证实了Mk6P4-CCL5 c7HopQ的约50kDa的分子量。
图18.Mk6P4c-CCL5 c7HopQ V1-V4融合蛋白变体对趋化因子受体CCR5的生物活性。
使用NanoLuc-竞争测定在HEK293T细胞中监测以不同稀释度(A)或Ni-NTA纯化后(B)大肠杆菌周质中产生的趋化因子融合蛋白变体诱导的miniGi到CCR5的募集。将HEK293T中产生的并稀释100倍的重组可溶性6P4-CCL5趋化因子用作阳性对照。将结果表示为优于未处理样品的发光的倍数增加。
使用NanoLuc-竞争测定在HEK293T细胞中监测以不同稀释度(C)或Ni-NTA纯化后(D)大肠杆菌周质中产生的趋化因子融合蛋白变体诱导的β-抑制蛋白-1到CCR5的募集。将HEK293T中产生的并稀释100倍的重组可溶性6P4-CCL5趋化因子用作阳性对照。将结果表示为优于未处理样品的发光的倍数增加。
图19.从***连接CXCL12趋化因子的β-链β2和β3的β-转角中的HopQ的环状排列变
体构建的50kDa CXCL12融合蛋白的模型。
(A)趋化因子融合蛋白的模型,由CXCL12(顶部)和幽门螺杆菌的HopQ的粘附素结构域的环状排列变体(底部)通过连接趋化因子和支架的两个肽键或接头融合而成。(B)将编码幽门螺杆菌株G27的1型HopQ的粘附素结构域的环状排列基因(底部,PDB 5LP2,SEQ IDNO:2,c7HopQ)***CXCL12(顶部,SEQ ID NO:22)的连接β-链β2和β3的β-转角(β-转角β2-β3)中。(C)所得到的CXCL12趋化因子融合蛋白的氨基酸序列(MkCXCL12 c7HopQ,SEQ ID NO:23)。源自趋化因子的序列以粗体表示。源自HopQ的序列是普通文本。包括6xHis和EPEA的C-末端标签是虚线下划线的。
图20.从***连接6P4-CCL5趋化因子的β-链β2和β3的β-转角中的环状排列c1YgjK
变体构建的Mk6P4-CCL5 c1YgjKV1,94kDa 6P4-CCL5融合蛋白的模型。
(A)趋化因子融合蛋白的模型,由趋化因子6P4-CCL5(顶部)和大肠杆菌的YgjK糖苷酶的环状排列变体(底部)通过连接趋化因子和支架的两个肽键或接头融合而成。(B)将编码大肠杆菌的YgjK糖苷酶的环状排列变体1基因(底部,PDB 3W7S,SEQ ID NO:36,c1YgjK)***6P4-CCL5(顶部,PDB 5UIW,SEQ ID NO:1)的连接β-链β2和β3的β-转角(β-转角β2-β3)中。(C)所得到的趋化因子嵌合蛋白的氨基酸序列(Mk6P4-CCL5 c1YgjKV1,SEQ ID NO:38)。源自趋化因子的序列以粗体表示。两个氨基酸肽接头是下划线的。源自c1YgjK的序列在两者之间。
图21.从***连接6P4-CCL5趋化因子的β-链β2和β3的β-转角中的环状排列c1YgjK
变体构建的Mk6P4-CCL5 c1YgjKV2,94kDa 6P4-CCL5融合蛋白的模型。
(A)趋化因子融合蛋白的模型,由趋化因子6P4-CCL5(顶部)和大肠杆菌的YgjK糖苷酶的环状排列变体(底部)通过连接趋化因子和支架的两个肽键或接头融合而成。(B)将编码大肠杆菌的YgjK糖苷酶的环状排列变体1基因(底部,PDB 3W7S,SEQ ID NO:36,c1YgjK)***6P4-CCL5(顶部,PDB 5UIW,SEQ ID NO:1)的连接β-链β2和β3的β-转角(β-转角β2-β3)中。(C)所得到的趋化因子嵌合蛋白的氨基酸序列(Mk6P4-CCL5 c1YgjKV1,SEQ ID NO:39)。源自趋化因子的序列以粗体表示。一个氨基酸肽接头是下划线的。源自c1YgjK的序列在两者之间。
图22.从***连接6P4-CCL5趋化因子的β-链β2和β3的β-转角中的环状排列c1YgjK
变体构建的Mk6P4-CCL5 c1YgjKV3,94kDa 6P4-CCL5融合蛋白的模型。
(A)趋化因子融合蛋白的模型,由趋化因子6P4-CCL5(顶部)和大肠杆菌的YgjK糖苷酶的环状排列变体(底部)通过连接趋化因子和支架的两个肽键或接头融合而成。(B)将编码大肠杆菌的YgjK糖苷酶的环状排列变体1基因(底部,PDB 3W7S,SEQ ID NO:36,c1YgjK)***6P4-CCL5(顶部,PDB 5UIW,SEQ ID NO:1)的连接β-链β2和β3的β-转角(β-转角β2-β3)中。(C)所得到的趋化因子嵌合蛋白的氨基酸序列(Mk6P4-CCL5 c1YgjKV1,SEQ ID NO:40)。源自趋化因子的序列以粗体表示。源自c1YgjK的序列在之间。
图23.从***连接6P4-CCL5趋化因子的β-链β2和β3的β-转角中的环状排列c2YgjK
变体构建的Mk6P4-CCL5 c2YgjKV1,94kDa 6P4-CCL5融合蛋白的模型。
(A)趋化因子融合蛋白的模型,由趋化因子6P4-CCL5(顶部)和大肠杆菌的YgjK糖苷酶的环状排列变体(底部)通过连接趋化因子和支架的两个肽键或接头融合而成。(B)将编码大肠杆菌的YgjK糖苷酶的环状排列变体B基因(底部,PDB 3W7S,SEQ ID NO:37,c2YgjK)***6P4-CCL5(顶部,PDB 5UIW,SEQ ID NO:1)的连接β-链β2和β3的β-转角(β-转角β2-β3)中。(C)所得到的趋化因子嵌合蛋白的氨基酸序列(Mk6P4-CCL5 c2YgjKV1,SEQ ID NO:41)。源自趋化因子的序列以粗体表示。两个氨基酸肽接头是下划线的。源自c2YgjK的序列在两者之间。
图24.从***连接6P4-CCL5趋化因子的β-链β2和β3的β-转角中的环状排列c2YgjK
变体构建的Mk6P4-CCL5 c2YgjKV3,94kDa 6P4-CCL5融合蛋白的模型。
(A)趋化因子融合蛋白的模型,由趋化因子6P4-CCL5(顶部)和大肠杆菌的YgjK糖苷酶的环状排列变体(底部)通过连接趋化因子和支架的两个肽键或接头融合而成。(B)将编码大肠杆菌的YgjK糖苷酶的环状排列变体B基因(底部,PDB 3W7S,SEQ ID NO:37,c2YgjK)***6P4-CCL5(顶部,PDB 5UIW,SEQ ID NO:1)的连接β-链β2和β3的β-转角(β-转角β2-β3)中。(C)所得到的趋化因子嵌合蛋白的氨基酸序列(Mk6P4-CCL5 c2YgjKV3,SEQ ID NO:42)。源自趋化因子的序列以粗体表示。源自c2YgjK的序列在两者之间。
图25.通过二维流式细胞术定性分析EBY100酵母细胞表面上具有不同接头和拓扑
结构的五个不同的趋化因子融合蛋白的展示。
用编码与Aga2p和ACP融合的趋化因子融合蛋白Mk6P4-CCL5 c1YgjKV1-V3(A至C,分别是SEQ ID NO:43-45)以及与Aga2p和ACP融合的趋化因子融合蛋白Mk6P4-CCL5 c2YgjKV1/V3(D至E,分别是SEQ ID NO:46-47)的pCTCON2衍生物转化的单独的EBY100酵母细胞的相对荧光强度的点图表示。将展示megakine Mk6P4-CCL5 c7HopQV4(SEQ ID NO:10)的酵母细胞用作阳性对照(F,SEQ ID NO:11)。在这个实验中,包括展示MegaBody MbNb207 cHopQ的酵母细胞(G,SEQ IDNO:11)和未转化的EBY100酵母细胞(H)作为阴性对照。使用SFP合酶(1μM)用CoA-547(2μM)将转化和未转化的酵母细胞同等地正交染色。
图26.在EBY100酵母细胞表面上展示的Mk6P4-CCL5 c1/2YgjK融合蛋白变体的功能性的
流式细胞分析。
用pCTCON2衍生物转化的单独的EBY100酵母细胞的相对荧光强度的点图表示,所述衍生物编码与Aga2p和ACP融合的Mk6P4-CCL5 c1YgjK V1-V3(A至C,分别是SEQ ID NO:43-45)以及与Aga2p和ACP融合的Mk6P4-CCL5 c2YgjK V1/V3(D至E,分别是SEQ ID NO:46-47)。将展示megakine Mk6P4-CCL5 c7HopQV4(SEQ ID NO:10)的酵母细胞用作阳性对照(F,SEQ ID NO:11)。在这个实验中,包括展示MegaBody MbNb207 cHopQ的酵母细胞(G,SEQ ID NO:11)和未转化的EBY100酵母细胞(H)作为阴性对照。使用SFP合酶(1μM)用CoA-547(2μM)将酵母克隆诱导并正交染色,并用80ng/mL浓度的Alexa647抗人RANTES(CCL5)抗体孵育。y-轴展示了相对CoA-547荧光(Megakine展示水平)。x-轴展示了相对Alexa647抗人荧光RANTES(CCL5)抗体结合。
图27.从***连接IL-1β白介素的β-链β6和β7的β-转角中的支架蛋白的环状排列
变体构建白介素融合蛋白的工程化原理
该方案显示了如何经由连接趋化因子结构域和支架的两个肽键或两个短接头可以将白介素嫁接到大的支架蛋白上。剪刀指示必须在白介素和支架中切割哪些暴露的转角。虚线表示白介素和支架的剩余部分必须如何通过使用肽键或短肽接头连接来构建白介素嵌合蛋白。
图28.结合IL-1R1和IL-1RAcP的胞外结构域的IL-1β的晶体结构。
IL-1β·IL-1R·IL-1RAcP复合物以两个视图呈现,围绕垂直轴旋转90°。IL-1RII和IL 1RAcP表示为表面,IL-1β表示为带状结构。连接β-折叠β6和β7的β-转角由箭头突出显示。
图29.从***连接IL-1β白介素的β-链β6和β7的β-转角中的环状排列HopQ变体构
建的MkIL-1β c7HopQV1,58kDa IL-1β融合蛋白的模型。
(A)趋化因子融合蛋白的模型,由人IL-1β白介素(顶部)和幽门螺杆菌(H.pylori)的HopQ的粘附素结构域的环状排列变体(底部)经由连接白介素和支架的两个肽键或接头融合而成。(B)将编码幽门螺杆菌HopQ的粘附素结构域的环状排列基因(底部,PDB 5LP2,SEQ ID NO:2,c7HopQ)***IL-1β白介素(顶部,PDB 3O4O,SEQ ID NO:48)的连接β-链β6和β7的β-转角(β-转角β6-β7)中。(C)所得到的白介素嵌合蛋白的氨基酸序列(MkIL-1β c7HopQV1,SEQ ID NO:49)。源自白介素的序列以粗体表示。两个氨基酸肽接头是下划线的。源自HopQ的序列在两者之间。
图30.从***连接IL-1β白介素的β-链β6和β7的β-转角中的环状排列HopQ变体构
建的MkIL-1β c7HopQV2,58kDa IL-1β融合蛋白的模型。
(A)趋化因子融合蛋白的模型,由人IL-1β白介素(顶部)和幽门螺杆菌(H.pylori)的HopQ的粘附素结构域的环状排列变体(底部)经由连接白介素和支架的两个肽键或接头融合而成。(B)将编码幽门螺杆菌HopQ的粘附素结构域的环状排列基因(底部,PDB 5LP2,SEQ ID NO:2,c7HopQ)***IL-1β白介素(顶部,PDB 3O4O,SEQ ID NO:48)的连接β-链β6和β7的β-转角(β-转角β6-β7)中。(C)所得到的白介素嵌合蛋白的氨基酸序列(MkIL-1β c7HopQV2,SEQ ID NO:50)。源自白介素的序列以粗体表示。一个氨基酸肽接头是下划线的。源自HopQ的序列在两者之间。
图31.从***连接IL-1β白介素的β-链β6和β7的β-转角中的环状排列HopQ变体构
建的MkIL-1β c7HopQV3,58kDa IL-1β融合蛋白的模型。
(A)趋化因子融合蛋白的模型,由人IL-1β白介素(顶部)和幽门螺杆菌(H.pylori)的HopQ的粘附素结构域的环状排列变体(底部)经由连接白介素和支架的两个肽键或接头融合而成。(B)将编码幽门螺杆菌HopQ的粘附素结构域的环状排列基因(底部,PDB 5LP2,SEQ ID NO:2,c7HopQ)***IL-1β白介素(顶部,PDB 3O4O,SEQ ID NO:48)的连接β-链β6和β7的β-转角(β-转角β6-β7)中。(C)所得到的白介素嵌合蛋白的氨基酸序列(MkIL-1β c7HopQV3,SEQ ID NO:51)。源自白介素的序列以粗体表示。源自HopQ的序列在之间。
详述
本发明将关于特定实施方案并参考某些附图进行描述,但本发明不限于此,而仅受权利要求的限制。权利要求中的任何附图标记不应被解释为限制范围。当然,应当理解,根据本发明的任何特定实施方案,不一定可以实现所有方面或优点。因此,例如本领域技术人员将认识到,本发明可以以实现或优化如本文所教导的一个或一组优点而不必实现如本文所教导或建议的其他方面或优点的方式来体现或实施。
当结合附图阅读以下详细描述时,通过参考以下详述,关于组织和操作方法,连同其特征和优点,可以最好地理解本发明。参考下文描述的实施方案,本发明的方面和优点将变得明显并被阐明。在整个说明书中对“一个(one)实施方案”或“一个(an)实施方案”的提及意味着结合本发明的至少一个实施方案中包括的实施方案描述的特定特征、结构或特性。因此,在本说明书中的各个地方出现的短语“在一个(one)实施方案中”或“在一个(an)实施方案中”不一定都指相同的实施方案,而是可以。类似地,应当理解,在对本发明的示例性实施方案的描述中,有时将本发明的各种特征组合在单个实施方案、图或对其的描述中,用于简化公开并帮助理解各个创造性方面中的一个或多个的目的。然而,这种公开方法不应被解释为反映要求保护的发明需要比每个权利要求中明确叙述的特征更多的特征的意图。相反,如以下权利要求所反映的,创造性方面在于少于单个前述公开的实施方案的所有特征。
定义
当指代单数名词时使用不定冠词或定冠词的情况中,例如“一个(a)”或“一个(an)”、“该(the)”,除非另有特定说明,否则包括该名词的复数形式。在本说明书和权利要求中使用术语“包括(comprising)”时,它不排除其他元件或步骤。此外,说明书和权利要求中的术语第一、第二、第三等用于区分相似的元件,并不一定用于描述顺序或时间顺序。应当理解,如此使用的术语在适当情况下是可互换的,并且本文描述的本发明的实施方案能够以不同于本文描述或说明的其他顺序进行操作。提供以下术语或定义仅用于帮助理解本发明。除非在此特别定义,否则在此使用的所有术语都具有本发明领域的技术人员已知的相同含义。从业者特别针对Sambrook等,Molecular Cloning:A Laboratory Manual,第4版,Cold Spring Harbor Press,Plainsview,纽约(2012);和Ausubel等,CurrentProtocols in Molecular Biology(增刊114),John Wiley&Sons,纽约(2016),用于本领域的定义和术语。不应将本文提供的定义解释为具有低于本领域普通技术人员理解的范围。
当涉及诸如含量、时间持续之类的可测量值时,本文所使用的“约”意指包括距指定值±20%或±10%,更优选±5%,甚至更优选±1%,并且更优选±0.%的变化,因为这样的变化适合于执行所公开的方法。如本文所用的,“相似的”与一样、类似、相当、相应和如同可互换,并且意指具有相同或共同的特征,和/或以可量化的方式显示相当的结果,即具有20%、10%,更优选5%或甚至更优选1%或更少的最大变化。
如本文所用的,“核苷酸序列”、“DNA序列”或“核酸分子”是指任何长度的核苷酸(核糖核苷酸或脱氧核糖核苷酸)的聚合形式。该术语仅指分子的一级结构。因此,该术语包括双链和单链DNA以及RNA。它还包括已知类型的修饰,例如甲基化,一个或多个天然存在的核苷酸被类似物“加帽”取代。“核酸构建体”是指已经构建来包含一个或多个自然界中未一起发现的功能单元的核酸序列。实例包括环状、线性、双链、染色体外DNA分子(质粒)、粘粒(含有来自λ噬菌体的COS序列的质粒)、包含非天然核酸序列的病毒基因组等。
“编码序列”是置于适当调控序列的控制下时被转录成mRNA和/或翻译成多肽的核苷酸序列。编码序列的边界由5'-末端的翻译起始密码子和3'-末端的翻译终止密码子确定。编码序列可以包括但不限于mRNA、cDNA、重组核苷酸序列或基因组DNA,而在某些情况下内含子也可以存在。
如本文所用的,“基因的启动子区”是指功能性DNA序列单元,可操作地连接编码序列并可能置于适当的诱导条件下时,该DNA单元足以促进所述编码序列的转录。“可操作地连接”是指一种并置,其中所述的组成部分处于允许它们以其预期的方式起作用的关系中。以在与启动子序列相容的条件下实现编码序列表达的方式,启动子序列“可操作地连接”编码序列。如本文所用的,“基因”包括基因的启动子区域以及编码序列。它既指基因组序列(包括可能的内含子),也指可操作地连接启动子序列的衍生自剪接信使的cDNA。术语“终止子”或“转录终止信号”包括其是在转录单元末端的DNA序列的控制序列,其指示初级转录物的3'加工和聚腺苷酸化以及转录终止。终止子可以衍生自天然基因、各种其他植物基因或T-DNA。待添加的终止子可以衍生自例如胭脂碱合酶或章鱼碱合酶基因,或替代地衍生自另一种植物基因,或更优选地衍生自任何其他真核基因。
“遗传构建体”、“嵌合基因”、“嵌合构建体”或“嵌合基因构建体”是指其中启动子或调控核酸序列可操作地连接或结合编码mRNA的核酸序列的重组核酸序列,使得调控核酸序列能够调控相关核酸编码序列的转录或表达。嵌合基因的调控核酸序列不与天然发现的相关核酸序列可操作地连接。特别地,如本文使用的术语“遗传融合构建体”是指编码翻译成本文公开的本发明的融合蛋白的mRNA的遗传构建体。
本文所用的术语“载体”、“载体构建体”、“表达载体”或“基因转移载体”旨在指能够运输与其连接的另一核酸分子的核酸分子,并且包括本领域技术人员已知的任何载体,包括任何合适的类型,包括但不限于质粒载体、粘粒载体、噬菌体载体(如λ噬菌体),病毒载体(如腺病毒、AAV或杆状病毒载体)或人工染色体载体(如细菌人工染色体(BAC)、酵母人工染色体(YAC)或P1人工染色体(PAC))。表达载体包括质粒以及病毒载体,并且通常含有所需的编码序列以及在特定宿主生物(例如细菌、酵母、植物、昆虫或哺乳动物)中或在体外表达***中表达可操作地连接的编码序列所必需的合适的DNA序列。表达载体能够在引入它们的宿主细胞中自主复制(例如,具有在宿主细胞中起作用的复制起点的载体)。在将其他载体引入宿主细胞时,其可以整合到宿主细胞的基因组中,从而与宿主基因组一起复制。合适的载体根据需要并根据特定的宿主生物(例如细菌细胞、酵母细胞)具有调控序列,如启动子、增强子、终止子序列等。克隆载体通常用于工程化和扩增某些所需的DNA片段,并且可能缺少表达所需DNA片段需要的功能序列。用于转染原核细胞的表达载体的构建在本领域中也是公知的,并且因此可以通过标准技术来完成(参见,例如,Sambrook等,MolecularCloning:ALaboratory Manual,第4版,Cold Spring Harbor Press,Plainsview,New York(2012);和Ausubel等,Current Protocols in Molecular Biology(增补114),JohnWiley&Sons,New York(2016),以获取本领域的定义和术语。
“宿主细胞”可以是原核或真核的。细胞可以是瞬时或稳定转染的。可以通过本领域已知的任何技术将表达载体转染到原核和真核细胞中,包括但不限于标准细菌转化、磷酸钙共沉淀、电穿孔或脂质体介导-、DEAE葡聚糖介导-、聚阳离子介导-或病毒介导的转染。对于所有标准技术,参见,例如,Sambrook等,Molecular Cloning:A Laboratory Manual,第4版,Cold Spring Harbor Press,Plainsview,New York(2012);和Ausubel等,CurrentProtocols in Molecular Biology(增补114),John Wiley&Sons,New York(2016)。在本文中,重组宿主细胞是已经被遗传修饰以含有本发明分离的DNA分子、核酸分子或表达构建体或载体的那些。可以通过本领域已知的适合特定细胞类型的任何方式引入DNA,包括但不限于转化、脂转染、电穿孔或病毒介导的转导。通过本领域已知的技术,如克隆、杂交筛选和聚合酶链反应(PCR),可以容易地制备能够表达本发明的嵌合蛋白的DNA构建体。用于克隆、DNA分离、扩增和纯化,用于涉及DNA连接酶、DNA聚合酶、限制性核酸内切酶等的酶促反应的标准技术,以及各种分离技术是本领域技术人员已知的和常用的那些技术。Sambrook等(2012),Wu(编辑)(1993)和Ausubel等(2016)描述了许多标准技术。可用于本发明的代表性宿主细胞包括但不限于细菌细胞、酵母细胞、植物细胞和动物细胞。适用于本发明的细菌宿主细胞包括埃希氏菌属(Escherichia)细胞、芽孢杆菌属(Bacillus)细胞、链霉菌属(Streptomyces)细胞、欧文氏菌属(Erwinia)细胞、克雷伯菌属(Klebsiella)细胞、沙雷氏菌属(Serratia)细胞、假单胞菌属(Pseudomonas)细胞和沙门氏菌属(Salmonella)细胞。适用于本发明的动物宿主细胞包括昆虫细胞和哺乳动物细胞(最特别地衍生自中国仓鼠(例如CHO),以及人类细胞系,如HeLa。适用于本发明的酵母宿主细胞包括酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)(例如巴斯德毕赤酵母(Pichia pastoris))、汉逊酵母属(Hansenula)(例如多形汉逊酵母(Hansenula polymorpha))、Yarowia、施氏酵母属(Schwaniomyces)、裂殖酵母属(Schizosaccharomyces)、接合酵母属(Zygosaccharomyces)等内的种。酿酒酵母(Saccharomyces cerevisiae)、卡尔酵母(S.carlsbergensis)和乳酸克鲁维酵母(K.lactis)是最常用的酵母宿主。宿主细胞可以以悬浮或烧瓶培养物、组织培养物、器官培养物等形式提供。或者,宿主细胞也可以是转基因动物。
术语“蛋白质”、“多肽”、“肽”在本文中进一步可互换使用,是指氨基酸残基的聚合物以及其变体和合成类似物。因此,这些术语适用于其中一个或多个氨基酸残基是合成的非天然存在氨基酸(如相应天然存在的氨基酸的化学类似物)的氨基酸聚合物,以及天然存在的氨基酸聚合物。该术语还包括多肽的翻译后修饰,如糖基化、磷酸化和乙酰化。基于氨基酸序列和修饰,多肽的原子或分子量或重量以(千)道尔顿(kDa)表示。“重组多肽”是指使用重组技术,即通过表达重组或合成多核苷酸制备的多肽。重组生产嵌合多肽或其生物活性部分时,也优选基本上不含培养基,即培养基占少于约20%,更优选少于约10%,且最优选少于约5%蛋白质制剂的体积。“分离的”是指基本上或实质上没有通常在其天然状态下伴随其的组分的材料。例如,“分离的多肽”是指已经从天然存在状态下伴随其的分子中纯化的多肽,例如已经从与所述多肽相邻的生产宿主中存在的分子取出的如本文公开的融合蛋白。分离的嵌合体可以通过氨基酸化学合成来产生,或者可以通过重组产生来产生。表述“异源蛋白质”可以表示该蛋白质不是来自用于展示或表达该蛋白质的相同物种或品系。
“同源物”,蛋白质的“同源物”包括相对于所讨论的未修饰的蛋白质具有氨基酸取代、缺失和/或***并且与衍生它们的未修饰的蛋白质具有相似的生物学和功能活性的肽、寡肽、多肽、蛋白质和酶。如本文所用的,术语“氨基酸同一性”是指在比较窗口中,在氨基酸对氨基酸的基础上,序列相同的程度。因此,通过在比较窗口中比较两个最佳比对的序列,确定两个序列中均出现的相同氨基酸残基(例如,Ala、Pro、Ser、Thr、Gly、Val、Leu、Ile、Phe、Tyr、Trp、Lys、Arg、His、Asp、Glu、Asn、Gln、Cys和Met,在本文中也用一个字母代码表示),以产生匹配的位置数,将匹配的位置数除以比较窗口中的位置总数(即窗口大小),然后将结果乘以100,获得序列同一性的百分比,从而计算“序列同一性的百分比”。与亲本蛋白质或其片段的氨基酸序列或核苷酸序列相比,本文所用的“取代”或“突变”是分别由一个或多个氨基酸或核苷酸被不同的氨基酸或核苷酸替换引起的。可以理解,蛋白质或其片段可以具有保守的氨基酸取代,其对蛋白质的活性基本上没有影响。
术语“野生型”是指从天然产生来源分离的基因或基因产物。野生型基因是在群体中最常观察到的基因,因此该基因的“正常”或“野生型”形式被任意设计。相反,术语“修饰的”、“突变体”或“变体”是指与野生型基因或基因产物相比时,在序列、翻译后修饰和/或功能特性(即改变的特征)上显示出修饰的基因或基因产物。应当指出,可以分离天然存在的突变体;通过与野生型基因或基因产物相比,它们具有改变的特征这一事实来鉴定它们。
“蛋白质结构域”是蛋白质中不同的功能和/或结构单元。通常,蛋白质结构域负责特定功能或相互作用,有助于蛋白质的整体作用。结构域可以存在于多种生物环境中,其中在具有不同功能的蛋白质中可以发现相似的结构域。蛋白质二级结构元件(SSE)通常在蛋白质折叠成其三维三级结构之前自发地作为中间体形成。蛋白质的两种最常见的二级结构元件是α螺旋和beta(β)折叠,尽管也会出现β-转角和ω环。β-桶是由串联重复组成的β折叠,所述串联重复扭曲和卷曲形成闭合的环形结构,其中第一链结合最后的链(氢键)。许多β-桶中的β链以反平行的方式排列。β折叠由通过至少两个或三个骨架氢键侧向连接的beta链(也称为β链)组成,形成了大致扭曲的褶状片层。β-链是一条通常3至10个氨基酸长的多肽链,其主链呈延伸构象。β-转角是蛋白质中一种不规则的二级结构,其引起多肽链方向的变化。Bata转角(β转角、β-转角、β-弯头、紧弯、反向弯头或β-环(本文也称为环))是蛋白质和多肽中非常常见的基序,主要用于连接β-链。
术语“蛋白质的环状排列”或“环状排列的蛋白质”是指与野生型蛋白质序列相比,其氨基酸序列中的氨基酸顺序改变的蛋白质,因此获得具有不同的连通性,但总体上三维(3D)形状相似的蛋白质。蛋白质的环状排列类似于环状排列的数学概念,从某种意义上说,野生型蛋白质的第一部分的序列(与N-末端相邻)与所得的环状排列蛋白质的第二部分的序列(接近其C-末端)有关,如例如Bliven和Prlic(2012)中所述的。通过蛋白质序列的遗传或人工工程化,获得与其野生蛋白质相比的蛋白质环状排列,其中野生型蛋白质的N-和C-末端“相连”,并且蛋白质序列在另一个位点被打断,以形成所述蛋白质的新的N-和C-末端。本发明的环状排列支架蛋白是野生型蛋白序列连接的N-和C-末端以及所述支架蛋白的可接近或暴露位点(优选β-转角或环)处切割或打断序列的结果,从而与野生型蛋白的折叠相比,环状排列的支架蛋白的折叠得以保留或相似。所述环状排列的支架蛋白中N-和C-末端的所述连接可以是肽键连接或引入肽接头的结果,或者如果是野生型蛋白,是原始N-和C-末端附近的肽段的缺失,接着是肽键或其余氨基酸的结果。
如本文所用的,术语“融合”,以及在本文中可互换地用作“结合”,“缀合”,“连接”,尤其是指“遗传融合”,例如通过重组DNA技术,以及是指导致稳定的共价连接的“化学和/或酶结合”。
术语“嵌合多肽”、“嵌合蛋白”、“嵌合体”、“融合多肽”、“融合蛋白”或“非天然存在的蛋白质”在本文中可互换使用,并且是指包含至少两个可能来自或可能不来自同一蛋白质的单独的且不同的多肽成分。该术语还指非天然存在的分子,这意味着它是人造的。涉及嵌合多肽(如本文所定义的)时,术语“融合”和其他语法等同形式,如“共价连接”,“结合”,“附上”,“连接”,“缀合”,是指连接两个或多个多肽成分的任何化学或重组机制。两个或更多个多肽组分的融合可以是序列的直接融合,或者可以是间接融合,例如使用***氨基酸序列或接头序列或化学接头。如本文所述的,两个多肽或细胞因子(如趋化因子)与支架蛋白的融合也可以指通过化学连接获得的非共价融合。例如,趋化因子核心结构域的β2β-链的C-末端和β3β-链的N-末端都可以连接化学单元,该化学单元能够在暴露或可及位点结合与部分或全长(环状排列)支架蛋白连接或融合的互补化学单元或结合口袋。
如本文所用的,术语“蛋白质复合物”或“复合物”是指一组两个或更多个结合的大分子,其中至少一个大分子是蛋白质。如本文所用的,蛋白质复合物通常是指可以在生理条件下形成的大分子缔合。蛋白质复合物的各个成员通过非共价相互作用连接。蛋白质复合物可以是仅蛋白质的非共价相互作用,因此被称为蛋白质-蛋白质复合物;例如,两种蛋白质、三种蛋白质、四种蛋白质等的非共价相互作用。更具体地,是融合蛋白和趋化因子受体的复合物,或趋化因子或包含趋化因子的配体蛋白质(如融合蛋白)与其特异性结合的互动物的复合物,所述互动物如能够结合细胞因子或趋化因子配体的细胞因子或趋化因子受体。基于趋化因子的融合蛋白的蛋白质复合物,通过其趋化因子受体相互作用区(其N-末端)结合趋化因子受体,因此成为结合所述趋化因子配体,结合趋化因子受体,将是本文使用的所形成的复合物。或者,基于白介素-1型配体的融合蛋白的蛋白质复合物,通过其IL-1受体结合,可以是本文使用的复合物。例如,其可以用于3D结构分析中,其中目的在于分辩细胞因子配体受体和细胞因子相互作用位点(其是融合蛋白的一部分)之间的结构和相互作用。更具体地,其中在结构上分析趋化因子和趋化因子受体的相互作用或结合位点。不太相关的是是否确定融合蛋白的整个结构。将理解蛋白质复合物可以是多聚的。蛋白质复合物装配可导致同型多聚或杂多聚复合物的形成。此外,相互作用可以是稳定的或短暂的。术语“多聚体”、“多聚复合物”或“多聚蛋白质白”包括多个相同或异源的多肽单体。
如本文所用的,术语“确定”、“测量”、“评估”和“测定”可互换使用,并且包括定量和定性测定。
术语“合适的条件”是指环境因素,如温度、运动、其他成分和/或“缓冲条件”,其中,“缓冲条件”具体是指在其中进行测定的溶液的组成。所述组合物包括缓冲溶液和/或溶质,如pH缓冲物质、水、盐水、生理盐溶液、甘油、防腐剂等,本领域技术人员知道将其合适地用于获得最佳测定性能。
“结合”是指任何相互作用,无论是直接的还是间接的。直接的相互作用互意味着结合伴侣之间的接触。间接的相互作用是指相互作用伴侣在多于两个分子的复合物中相互作用的任何相互作用。在一个或多个桥接分子的帮助下,相互作用可以是完全间接的,或者在伴侣之间仍然存在直接接触的情况下,可以是部分间接的,这通过一个或多个分子的额外相互作用而得以稳定。通常,结合结构域可以是基于免疫球蛋白的或免疫球蛋白样的,或者可以基于蛋白质中存在的结构域,包括但不限于微生物蛋白、蛋白酶抑制剂、毒素、纤连蛋白、脂质运载蛋白、单链反平行卷曲螺旋蛋白或重复基序蛋白。结合还包括配体与其受体之间的相互作用,如对于趋化因子和趋化因子受体相互作用。术语“特异性结合”是指识别特定靶标但基本上不识别或结合样品中的其他分子的结合结构域。对于趋化因子,已知用于特异性结合趋化因子受体的配体,因此结合其受体是特异性的。然而,在许多情况中,一个亚家族的趋化因子可以结合相同家族的受体,因此特异性结合部排除结合另一个趋化因子受体。因此,特异性结合不是表示排他性结合。然而,特异性结合确实表示这样的配体或反之这样的受体对一个或几个趋化因子受体或反之配体具有一定增加的亲和力或偏好。如本文所用的,术语“亲和力”通常是指配体(如本文进一步定义的)与靶蛋白结合的程度,以使靶蛋白和配体的平衡向着由它们的结合形成的复合物的存在转移。因此,例如,在受体和配体以相对相等的浓度结合的情况下,高亲和力的配体将结合受体,从而使平衡向着高浓度的所得复合物移动。
确定氨基酸的空间构象的方法是本领域已知的,并且包括例如X射线晶体学和多维核磁共振。蛋白质的“构象”或“构象状态”通常是指蛋白质在任何瞬间都可以采用的结构范围。本领域技术人员将认识到,构象或构象状态的决定簇包括如蛋白质的氨基酸序列(包括修饰的氨基酸)所反映的蛋白质的一级结构和蛋白质周围的环境。蛋白质的构象或构象状态还涉及结构特征,如蛋白质二级结构(例如,α-螺旋、β-折叠等)、三级结构(例如,多肽链的三维折叠)和四级结构(例如,多肽链与其他蛋白质亚基的相互作用)。多肽链的翻译后修饰和其他修饰,如配体结合、磷酸化、硫酸化、糖基化或疏水基团的连接等,可能会影响蛋白质的构象。此外,环境因素,如pH、盐浓度、离子强度和周围溶液的重量克分子渗透压摩尔浓度,以及与其他蛋白质和辅助因子的相互作用等,都可以影响蛋白质构象。蛋白质的构象状态可以通过针对活性或与另一分子的结合的功能测定或通过物理方法(如X射线晶体学,NMR或自旋标记)来确定。对于蛋白质构象和构象状态的一般性讨论,可以参考Cantor和Schimmel,Biophysical Chemistry,第I部分:The Conformation ofBiological.Macromolecules,.W.H.Freeman and Company,1980,和Creighton,Proteins:Structures and Molecular Properties,W.H.Freeman and Company,1993。
最后,在本发明的内容中,术语“功能性融合蛋白”或“构象选择性融合蛋白”是指任选以构象选择性的方式在结合其细胞因子或特别地白介素-或趋化因子-受体蛋白中和/或在这种受体的激活/灭活中(取决于已知的配体:激动剂、拮抗剂、反向激动剂)起作用的融合蛋白。选择性结合靶蛋白的特定构象的结合域是指与靶标采取的其他构象相比,构象子集中以更高亲和力结合靶标的结合结构域。本领域技术人员将认识到,选择性结合靶标的特定构象的结合域将使靶标稳定或保留在这个特定构象中。例如,活性状态构象-选择性结合结构域将优先结合处于活性构象状态的靶标,并且将不结合或以较小的程度结合非活性构象状态的靶标,且因此对所述活性构象状态将具有更高的亲和力;或反之亦然。术语“特异性地结合”、“选择性地结合”、“优先结合”及其语法等效表述在本文中可互换使用。术语“构象特异性”或“构象选择性”在本文中也可互换使用。
详述
本文提出了设计刚性融合的含细胞因子的功能性融合蛋白的新概念。新的融合蛋白源自细胞因子和支架蛋白之间的融合体的生成,其中支架蛋白是打断了细胞因子的拓扑结构的折叠蛋白,以这样的方式,所述细胞因子仍然以其典型的折叠出现,并与非融合的细胞因子配体相比,以相似的方式起作用,特异性地结合其同源受体。新的融合蛋白在本文被证明为源自具有基于保守的二级β-链的核心结构域或基序的细胞因子的融合体,所述细胞因子如趋化因子细胞因子或白介素(IL)-1家族。所述“含β-链核心结构域”或“含β-链结构域”细胞因子在本文可互换使用,它们的氨基酸序列被支架蛋白***,导致改变的细胞因子蛋白的拓扑结构,尽管如此,它仍然令人惊讶地以其典型的折叠出现,并与非融合的细胞因子配体相比,以相似的方式起作用,特异性地结合其受体。虽然在其天然状态下通常不连接,但多肽组分的经典连接通过直接或通过肽键连接它们各自的氨基(N-)和羧基(C-)末端以形成单个连续多肽来进行。这些融合体常常通过柔性接头制得,或者至少以柔性方式连接,这意味着融合伙伴彼此之间并没有处于稳定的位置或构象。如图1A中呈现的,通过N-和C-末端连接蛋白质,简单的线性串联,融合很容易,但可能不稳定,容易降解,因此在某些情况下会导致非功能性配体蛋白。另一方面,本文提出的刚性嵌合/融合蛋白在两个或多个蛋白质的一级拓扑结构内具有一个或多个融合点或连接,具有至少一个非柔性融合点(图1B)。本发明固有地包含细胞因子配体蛋白,其中通过形成数个融合体来禁止细胞因子蛋白相对于其融合伙伴(支架蛋白)旋转或弯曲。通过在同一嵌合体中存在几个融合体,获得了本发明的新嵌合体改进的刚性,这是完美设计融合位点以允许仍然可以保留其细胞因子结构域折叠的融合体及其结合其靶标的功能的结果。蛋白质的刚性实际上是蛋白质(在这种情况下是新型嵌合体)(三级)结构所固有的。已经表明,通过改变已知蛋白质折叠的拓扑结构可以获得增加的刚度(King等,2015)。在本发明的融合蛋白中形成的融合体的刚性因此提供了足够强的刚性以“定向”或“固定”融合细胞因子配体特异性结合的细胞因子受体,尽管大部分刚性仍将低于靶标本身的刚性。然而,本发明的刚性融合蛋白仍然保持其受体结合和激活功能性的事实是令人惊讶的观察,因为初级拓扑结构的打断可能已经导致结构域或蛋白质折叠的改变,影响三级拓扑结构和受体结合或激活。尽管技术人员有能力使用用于涉及此类融合体的结构信息,但从外源引入细胞中的新核酸构建体翻译的融合蛋白的实际折叠仍然是不可预测的。本文已经证明了这种一级拓扑结构的打断没有影响受体结合或激活,导致涉及细胞因子受体结构生物学和药物发现领域中的功能性和治疗相关途径的开辟,如本文具体在趋化因子和IL受体领域中显示的。本发明涉及提供独特的下一代融合技术和高亲和力和/或构象选择性趋化因子/IL-受体结合潜力的新组合,以允许蛋白质的非共价结合。根据细胞因子家族的类型,如趋化因子或趋化因子变体,一级IL或IL-1受体型白介素,或用于产生融合蛋白的折叠支架蛋白的类型,这种新型功能性融合蛋白有助于多种有价值的应用。优势是众多的,可直接用于结构生物学中,促进冷冻电镜和X射线晶体学,用于难处理的蛋白质,如7跨膜蛋白,作为GPCR。通过使用这种下一代融合技术,可以在GPCR和IL-受体复合物的结构生物学中预见到跳跃性的前进,因为刚***工具是目前可用的并且在完全执行中,也可以使用这些工具来研发改进的、更稳固的治疗和诊断分子,如通过基于结构的药物设计和基于结构的新化合物筛选。时尚,在细胞因子受体的构象选择性识别中时,如活性构象,更具体地激动剂、部分激动剂或偏向激动剂构象。根据细胞因子配体或配体变体,基于特定的细胞因子(趋化因子或IL)配体发现了本发明的融合蛋白的更多应用,所述配体描述为特异性地稳定可施药(druggable)信号构象使得能够筛选途径选择性激动剂。随着生物技术中此类技术的快速发展,可预见本发明将影响新型蛋白质疗法的创造和当前蛋白质药物的性能改进。
在第一个方面中,本发明涉及包含与支架蛋白融合的细胞因子的功能性融合蛋白,其中所述支架蛋白连接细胞因子蛋白,使得通过所述细胞因子结构折叠中可及的至少一个或多个氨基酸位点的融合打断所述细胞因子的拓扑结构。所述融合蛋白是“功能性的”,因为与未与所述支架蛋白融合的,其天然或野生型形式的细胞因子配体相比,其保留了相似方式的受体结合功能性。在一个实施方案中,所述融合蛋白是构象选择性结合结构域。细胞因子包含非常多样的配体超家族,优选的细胞因子超家族是具有基于β-链或含β-链的保守核心结构域或基序的那些,揭示了在使这些β-链相互连接的β-转角或环中存在的暴露区域的可及氨基酸位点。新的融合体应当包含离细胞因子的受体结合位点足够远的可及位点,这样不会扰乱受体结合以保留其功能性。事实是细胞因子是相对小的蛋白质,给设计这样的功能性融合体增加了一层复杂性,并且因此本文所呈现的提供了一种令人惊讶的解决方法,使得技术人员在这些基于β-链的细胞因子保守的核心结构域暴露的β-转角衍生可及位点。
在第一个实施方案中,本发明涉及包含属于趋化因子超家族的细胞因子的融合蛋白,所述细胞因子与支架蛋白融合,其中所述支架蛋白是至少50个氨基酸的折叠蛋白,并且与趋化因子核心结构域连接,使得通过在折叠其暴露的β-转角的所述趋化因子核心结构域中可及的至少一个或多个氨基酸位点的融合打断所述核心结构域的拓扑结构。所述融合蛋白的再一个特征在于与未与所述支架蛋白融合的,其天然或野生型形式的趋化因子相比,其保留了相似方式的受体结合功能性。因此,在一个实施方案中,所述融合蛋白是构象选择性结合结构域。
已经根据成熟蛋白质N-末端邻近的半胱氨酸残基的特征性模式,将趋化因子蛋白质配体分成四个亚家族CC、CXC、C和CX3C,其中X是任何氨基酸。然而,所有趋化因子的基础三级结构或构造都含有无序的N-末端“信号结构域”,接着是结构化的“核心结构域”,其含有N-环、三条链的β-折叠和C-末端螺旋(图2)。
在每个亚家族内,许多趋化因子结合多个受体并且几个受体结合许多趋化因子。已知趋化因子二聚化,并且不同亚家族之间的不同二聚化基序最初被认为是定义受体特异性。然而,功能分析表明,实际上单体结合并激活受体,而寡聚化似乎对结合葡糖胺聚糖至关重要。通常,趋化因子核心结构域与趋化因子受体的N-末端形成相互作用位点或趋化因子识别位点1(CRS1),而趋化因子的N-末端与受体的受体-配体结合口袋相互作用(趋化因子识别位点2,CRS2)。第一个相互作用是受体N-末端与趋化因子核心结构域(CRS1)的结合,允许正确定位趋化因子N-末端信号结构域,使其与CRS2 TM口袋相互作用。许多结构研究已经表明了受体结合和激活至少可以部分解耦。然而,需要对具有完整受体的构象特异性复合物进行进一步的高分辨率结构分析。从历史上看,由于跨膜受体的性质和因此分析更易处理的可溶性复合物的限制,这在大多数使用NMR方法的情况下一直是极具挑战性的。
磺基酪氨酸在受体中的结构作用已经确定,它允许与趋化因子的β2-β3发夹或环中的同源碱性残基形成盐桥。认为与受体的趋化因子界面涉及核心结构域的β-折叠的N-环和β2-β3链。尽管事实是CRS1结合后的结构重排在复合物与复合物之间不同,但禁止简化识别和激活机制,强调需要更好的结构确定工具。事实上,许多修饰的趋化因子也已被应用于阐明特定受体在疾病中的作用,表明细胞因子领域内的配体药理学,并且更特定的趋化因子将受益于对受体保持高亲和力的微妙操作,但导致适应的功能结果,如激动剂、反向激动剂、拮抗剂或超激动剂/拮抗剂特征。事实上,一般的原型伴侣,如本文提出的融合蛋白,提供了一种解决方案来剖析趋化因子配体/受体相互作用和激活机制特征。已知伴侣蛋白(如纳米抗体)有助于稳定膜受体构象(Manglik等,2017年),尽管在某种构象中,这些类型的伴侣不允许迫使受体进入其中受体仅与特定配体结合的构象。此外,新型趋化因子融合蛋白还可以为针对完整受体的某些受体构象状态的药物筛选提供优势。到目前为止,很少有使用完整受体(CXCR4/vMIP-II、US28/CX3CL1)确定趋化因子/受体复合物结构,以及最近使用蛋白质抑制剂的CCR5受体,如5P7-CCL5为导致HIV抑制的趋化因子受体信号传导提供了新的见解。后者已经证明了配体5P7-CCL5与CCR5相互作用的方式不是从双位点模型中准确预测的,如上所述,因为5P7-CCL5的N-环、β1-链和30s-环是与受体的主要相互作用位点。以前,使用例如受体的N-末端肽和配体(CXCL8/CXCR1肽;CXCL12/CXCR4硫肽、CCL11/CCR3肽)获得了更多的结构数据,但有仅获得对结构天然内容的局部视图的风险。
另一个实施方案涉及新的融合蛋白,其中所述细胞因子是白介素,其中所述支架蛋白在所述β-桶核心基序暴露的β-转角中的一个或多个可及位点打断了白介素β-桶核心基序的拓扑结构。更具体地,融合蛋白中的所述细胞因子是IL-1受体白介素。细胞因子的白介素1(IL-1)超家族是先天性和获得性免疫的重要调节剂,在对抗感染的宿主防御、炎症、损伤和应激中起着关键作用。本文可互换使用的“IL-1受体型白介素”超家族或“IL-1家族”白介素包括白介素IL-1、IL-1α、IL-1β、IL-18、IL18BP、IL1F5、IL1F6、IL1F7、IL1F8、IL1F10、IL-33和IL-36、IL36B和IL-37。这些细胞因子彼此在来源、受体结构和信号传导途径方面相关。IL-1超家族白介素的受体共享相似的构造,由其胞外结构域中的三个Ig-样结构域和Toll样受体中也发现的胞内Toll/IL-1R(TIR)结构域组成。细胞因子信号传导的启动需要两个受体,主要的特异性受体和在一些情况中可以共享的辅助受体。主要受体负责特异性的细胞因子结合,而辅助受体自身不结合细胞因子,但与从细胞因子和主要受体预先装配的二元复合物结合。细胞因子与其各自的受体的结合导致信号传导三元复合物,导致两种受体的TIR结构域的二聚化。这通过激活有丝***原激活的蛋白激酶(MAPK)和激活的B细胞的核因子κ-轻链增强子(NF-κB)启动胞内信号传导。该信号传导诱导了炎症应答,如2型环加氧酶的诱导,增加的粘附分子的表达和一氧化氮的合成。
已经测定了IL-1超家族的几种白介素细胞因子的三维结构,并且证明了尽管具有有限的序列相似性,但这些细胞因子采用由以三重折叠对称模式排列的12条反平行β-链组成的保守特征性β-三叶形折叠。β-桶核心基序被每个细胞因子结构中的不同含量的螺旋包装。每个人细胞因子的Cα原子的叠加揭示了保守的疏水性核心,在环区域中具有显著的灵活性。β-链之间的表面残基和环没有显示出对于整体稳定性是重要的并且在细胞因子之间明显不同,这与它们低的序列相似性一致,并且部分地解释了它们对各自受体的独特识别(涉及特定的环)。例如,人IL-18与鼠IL-18共享~65%序列同一性,而与人IL-1α和人IL-1β分别仅共享15%和18%同一性。尽管如此,IL-18在其三维结构中与其他IL-1细胞因子显示出惊人的相似性。因此,这种IL-1样受体白介素提供了细胞因子内超家族的第二个实例,其具有基于β链的保守结构核心结构域,该结构域通过灵活的β转角或环相互连接,其中一些参与受体识别,和其他可能参与连接折叠的支架蛋白,如本文所示的,以获得新的扩大的融合配体。
一个实施方案提供了细胞因子融合蛋白,其中基于β-链的保守核心结构域以支架蛋白“打断”核心结构域的拓扑结构的方式与支架蛋白融合。一般来说,蛋白质的“拓扑结构”是指在三维空间中规则的二级结构相对于彼此的取向。蛋白质折叠主要由多肽链拓扑结构来定义(Orengo等,1994)。因此,在最基本的层面上,“一级拓扑结构”被定义为二级结构元件(SSE)的序列,其负责蛋白质折叠识别基序,从而负责二级和三级蛋白质/结构域折叠。因此,就蛋白质结构而言,真正的或主要的拓扑结构是SSE的序列,即如果想象能够保持蛋白质链的N-和C-末端,并将其拉直,则拓扑结构不会改变任何蛋白质折叠。然后将蛋白质折叠描述为三级拓扑结构,类似于蛋白质的一级和三级结构(还参见Martin,2000)。
具体而言,如本文所述的,本发明的趋化因子功能性融合蛋白的趋化因子核心结构域因此在其一级拓扑结构中被打断,通过在趋化因子核心结构域的β2和β3β-链之间暴露的β-转角或环的可及位点引入支架蛋白融合体,其允许保留其3D折叠,并且出乎意料地,所述趋化因子还保留了其三级结构,从而允许保留其功能性受体结合能力。类似地,IL-1样受体白介素IL-1β具有保守的β-桶核心基序,如本文所述的,通过***折叠支架蛋白,在保守核心的2条β-链之间的暴露的β-转角处,从保守的β-桶核心基序打断一级拓扑结构,令人惊讶地保留了结合能力,从而提供了正确折叠的或功能性的融合蛋白。
如本文所述的,“支架蛋白”是指具有允许与另一种蛋白(特别是与细胞因子或趋化因子)融合的结构的任何类型的蛋白。蛋白质折叠的经典原理是蛋白质采用正确的三维构象所需的所有信息都由其氨基酸序列提供,从而通过各种分子相互作用将特定的折叠蛋白结合在一起。为了在本文中用作支架,支架蛋白必须折叠成不同的三维构象。因此,所述支架蛋白在本文中被定义为“折叠的”蛋白,将氨基酸长度限制到有一个最小值,因为对于短肽,众所周知它们非常灵活,并且不提供折叠结构。因此,用于新型功能性融合蛋白的支架蛋白本质上不同于肽或非常小的多肽,如由40个或更少氨基酸组成的那些,不被认为是合适的融合为Megakine的支架蛋白。因此,本文定义的“支架蛋白”是至少200个氨基酸,或150个氨基酸,或至少100个氨基酸,或至少50个氨基酸,或更优选至少40个氨基酸,至少30个氨基酸、至少20个氨基酸、至少10个氨基酸、至少9个氨基酸的折叠蛋白。接头或肽,特别是8个或更少氨基酸的接头,不适合作为用于本发明目的的支架蛋白。此外,这种“支架”、“连接”或“融合伙伴(fusion partner)”蛋白优选在其三级结构中具有至少一个暴露区域,以提供至少一个可及位点,以切割作为用于细胞因子或趋化因子的融合点。支架多肽用于与细胞因子或趋化因子核心结构域组装,从而形成呈对接构型的融合蛋白,以增加质量、提供对称性和/或提供扩大的配体,以诱导等价受体的特定构象状态和/或提高或增加对受体的功能性。因此,根据所使用的支架蛋白的类型,可以预见到所得到的融合蛋白的不同目的。支架蛋白的类型和性质无关紧要,因为它可以是任何蛋白质,并且根据其结构、大小、功能或存在,与所述细胞因子或趋化因子核心结构域融合的支架蛋白,如在本发明的融合蛋白中的,将用于不同的应用领域中。支架蛋白的结构将影响最终的嵌合结构,因此本领域技术人员应在支架蛋白上实施已知的结构信息,并在选择支架时考虑合理的预期。本申请实施例中提供了支架蛋白的实例,并且非限制数量的支架蛋白是酶、膜蛋白、受体、适体蛋白、分子伴侣、转录因子、核蛋白、抗原结合蛋白本身,如纳米抗体等,可用作支架蛋白以产生本发明的融合蛋白。在优选实施方案中,所述支架蛋白的3D结构是已知的或者可以由技术人员预测,因此可以由所述技术人员确定与细胞因子或其保守核心结构域融合的可及位点。
新的嵌合或融合蛋白以独特的方式融合,以避免连接是嵌合蛋白结构内的柔性、松散、弱连接/区域。连接或融合两个多肽的方便方法是通过从重组核酸分子作为融合蛋白来表达它们,该重组核酸分子包括以经典的已知方式与编码第二多肽的第二多核苷酸可操作地连接的编码第一多肽的第一多核苷酸。然而,在本发明的重组核酸分子中,所述支架打断细胞因子或其保守的核心结构域的拓扑结构也反映在表达所述融合蛋白的基因融合体的设计中。因此,在一个实施方案中,功能性融合蛋白由嵌合基因编码,所述嵌合基因通过将编码细胞因子或具体的趋化因子或IL的基因的一部分与编码支架蛋白的基因的一部分重组而形成,其中所述编码的支架蛋白通过至少两个或多个直接融合或由编码的肽接头形成的融合在所述暴露的β-转角中的结构域的一个或多个可及位点打断编码的细胞因子,或具体的所述趋化因子或IL保守核心结构域的一级拓扑结构。因此,将编码待融合多肽的多核苷酸片段化和重组,以这样的方式提供融合蛋白,该融合蛋白在所述蛋白质之间提供刚性的非柔性连接、结合或融合。通过将支架蛋白与细胞因子或具体的保守的趋化因子或IL核心结构域融合制得新的嵌合体,以这样的方式使得细胞因子或保守核心结构域的一级拓扑结构被打断,这意味着细胞因子核心结构域的氨基酸序列在可及位点被打断并与支架蛋白的可及氨基酸连接,因此该序列也可能被打断。连接在分子内进行,换句话说,在氨基酸序列内内部进行(参见实施例和附图)。因此,本发明的重组融合不仅产生了在N-或C-末端融合的功能性嵌合体,而且包括至少一个内部融合位点,其中这些位点直接融合或通过接头肽融合。将环状排列的支架用于产生融合蛋白的情况中,通过连接N-和C-末端,然后在支架蛋白序列内的另一个位点(对应于其三级结构中的可及位点)切割或分离氨基酸序列,与细胞因子或趋化因子/IL部分的氨基酸序列融合,可以改变所述支架蛋白的氨基酸序列。用于获得环状排列的所述N-和C-末端连接可以通过直接融合、接头肽,或者甚至通过N-和C-末端附近区域的短缺失,然后通过末端的肽键来实现。
术语“可及位点”、“融合位点”或“融合点”或“连接位点”或“暴露位点”在本文中可互换使用,并且均指结构上可及的蛋白质序列的氨基酸位点,优选位于蛋白质表面,或暴露于表面,更优选位于暴露的β-转角或环区域。从本文提供的公开内容,本领域技术人员将能够得出用于趋化因子的那些位点。细胞因子(如趋化因子或IL)的受体-结合或激活位点常常涉及这样的暴露区域,如例如趋化因子的无序N-末端信号结构域或N-环,或IL-1的β-链4和β-链5之间的β-转角。然而,那些用于将趋化因子与支架蛋白融合的位点的打断可以导致受体-结合或激活能力的丢失,这不适用于本发明的融合蛋白,并且因此不打算在本文用作可及融合位点。因此,如本文所述的,作为“环”或“β转角”的“可及位点”和“暴露区域”是指那些不是受***点或区域的位点和区域,或可能不扰乱受体结合位点(例如,在空间上)。所述结合位点可能在靶向的受体方面不同,但通常将涉及趋化因子的N-末端信号结构域和N-环以及相应的IL-1型受体白介素的β4和β5之间的β-转角。在大部分情况中,蛋白质的N-末端或C-末端也是蛋白质3D-结构的“松散”末端,并且因此从表面是可及的。可以认为这些是本发明的嵌合体中的可及位点,除非受体结合或激活需要这样的末端是游离的,并且条件是细胞因子/趋化因子核心结构域中的至少一个其他的可及位点用于融合,这导致在可及位点的打断/***,打断了拓扑结构,因为这后一种可及位点融合将给新的前合体提供刚性。因此,可及位点可以因此包括蛋白质的氨基-和/或羧基-末端位点,但嵌合体不能仅基于由N-或C-末端组成的可及位点的融合。将趋化因子/IL核心结构域的至少一个或多个位点用于与支架蛋白融合,从而导致已知常规结构域折叠的拓扑结构的打断。因此,在一个实施方案中,如果至少一个是一个,至少一个可及位点不是所述结构域的N-末端和/或C-末端位点,和/或不包括所述结构域的N-或C-末端位点。在特定的实施方案中,至少一个位点不是所述结构域的N-或C-末端氨基酸。在另一个实施方案中,至少一个以上的位点用于与支架蛋白融合时,可及位点可以是保守核心结构域的N-或C-末端位点。支架蛋白也通过从其三级结构可见的可及位点融合,为此,在一个实施方案中,所述至少一个位点不是支架蛋白的N-或C-末端,而在可替换的实施方案中,至少一个位点是所述支架的N-或C-末端。在一些实施方案中,融合蛋白包含在所述保守核心结构域的暴露区域中的打断处融合的所述支架蛋白的N-末端片段以及与所述保守核心附近的C-末端融合的所述支架蛋白的C-末端片段。
在本发明的一些实施方案中,融合体可以是直接融合体,或通过接头肽形成的融合体,所述融合体被完美地设计,以获得刚性的、非柔性的融合蛋白。除了选择的可及位点的位置,接头肽的长度和类型也有助于所得嵌合蛋白的刚性以及可能有助于功能性。在本发明的内容中,将构成融合蛋白的多肽彼此通过经由肽键的连接直接融合,或间接融合,由此通过经由短肽接头的连接间接偶联装配两个多肽。优选的“接头分子”、“接头”或“短多肽接头”是具有最大十个氨基酸的长度的肽,更可能是四个氨基酸,通常仅为三个氨基酸长度,但优选仅两个或甚至更优选仅单个氨基酸,以给可及位点的融合连接提供所需的刚性。合适的接头序列的非限制性实例在实施例部分中描述,其可以是随机的,并且其中已经成功地选择了接头以保持结构域之间的固定距离,以及保持融合伙伴的独立功能(例如,受体结合)。在涉及使用刚性接头的实施方案中,通常已知这些通过采用α-螺旋结构或通过含有多个脯氨酸残基而呈现出独特的构象。在许多情况下,它们与也可能是合适的柔性接头相比,更有效地分离功能性结构域,优选短的仅有1-4个氨基酸的长度。
在可替换的实施方案中,将融合蛋白描述为刚性融合蛋白,其包含i)细胞因子(如趋化因子或IL)的N-末端氨基酸序列,ii)功能性支架蛋白,和iii)缺少所述i)的N-末端氨基酸序列的细胞因子(如趋化因子或IL)序列,其中i)和iii)连接所述ii)的支架蛋白。在优选实施方案中,所述刚性融合蛋白包含N-末端氨基酸序列,其对应于趋化因子N-末端信号结构域,接着是含有β-折叠的头两条β-链的趋化因子核心结构域的部分,与支架蛋白或环状排列支架蛋白的氨基酸序列融合,其在其序列中被打断并在对应于暴露的表面环或转角中的位点的可及位点融合,最后与趋化因子的剩余部分融合,其含有核心结构域的β3链,和所述结构域的C-末端螺旋。因此,在一个打断的氨基酸序列位点获得支架蛋白掺入趋化因子蛋白序列中,所述位点对应于趋化因子核心结构域的β2-β3转角或环中的可及位点,其在趋化因子的结构术语学中也称为40s-环。
在一个实施方案中,趋化因子核心结构域的可及位点在结构域折叠的暴露区域中。所述暴露区域鉴定为不太固定的氨基酸链,其主要位于蛋白质的表面,或在结构的边缘上。优选,暴露的区域呈现为蛋白质结构的环或β转角。趋化因子核心结构域的“暴露区域”的最直接鉴定是暴露的环,优选β-转角,其是位于β-折叠3D-结构边缘的暴露环。对于三条链的β-折叠结构,可能的是包含β1-β2转角或环,也称为30s环,或β2-β3转角或环,也称为40s-环。在某些趋化因子受体复合物中,已知30s-环涉及受体结合,并且因此与40s-环相比,对于支架融合时的打断,不太优选。
在另一个实施方案中,支架蛋白具有环状排列。在优选实施方案中,所述支架蛋白的环状排列存在于支架蛋白的N-和/或C-末端,或最优选存在于支架蛋白的N-和C-末端之间。另一个实施方案提供了包含至少2条反平行β链的支架蛋白。
在一个实施方案中,通过在其对应于β2-β3转角的序列中的切割可及位点打断细胞因子或趋化因子核心结构域,通过在对应于其结构(其中所述暴露的或可及位点不是N-或C-末端)的暴露区域的序列中的切割可及位点与环状排列的支架蛋白融合,将细胞因子或趋化因子核心结构域连接支架获得融合蛋白(使用两个肽键或两个短接头)。因此,在其中支架蛋白的环状排列在N-和C-末端的特定实施方案中(如图2中),可以将支架蛋白序列与细胞因子或趋化因子片段重组融合成为整体(如图7中)。在特定的实施方案中,所述融合蛋白通过另外产生由位于细胞因子或趋化因子内的半胱氨酸残基形成的加强二硫桥使得其刚性增强。
本发明的再一个方面涉及包含与支架蛋白融合的细胞因子的新型功能性融合蛋白,所述细胞因子如包含趋化因子或IL核心结构域的细胞因子,其中所述支架蛋白打断所述细胞因子趋化因子/IL保守核心结构域的拓扑结构,和其中支架蛋白的总质量或分子量为至少30kDa,使得通过融合体与靶标(如配体的受体)的结合增加质量和结构特征将是重要的并且足以允许非共价结合所述前合体时靶标的三维结构分析。在另一个实施方案中,支架蛋白的总质量或分子量为至少40,至少45,至少50或至少60kDa。这种特定的尺寸或质量增加将影响图像中的信噪比降低。其次,嵌合体将通过提供足够的特征来提供结构指导,用于小或难以结晶的蛋白质的精确图像对齐,以使用冷冻电镜和X射线晶体学达到足够高的分辨率。
本发明的再一个方面涉及编码本发明所述融合蛋白的核酸分子。所述核酸分子包含所述细胞因子、趋化因子或白介素和所述支架蛋白,和/或其片段的编码序列,其中所述结构域打断的拓扑结构反映在所述结构域序列将含有支架蛋白序列(或环状排列的序列,或其片段)***的事实中,使得N-末端细胞因子、趋化因子,或IL-片段和C-末端细胞因子、趋化因子或IL-保守核心结构域片段在所述核酸分子内被支架蛋白序列或其片段隔开。在另一个实施方案中,嵌合基因被描述为具有至少启动子,所述编码融合蛋白的核酸分子和含有转录终止信号的3'端区域。另一个实施方案涉及编码本发明的所述融合蛋白的表达盒,或包含编码所述融合蛋白的核酸分子或嵌合基因的表达盒。在某些实施方案中,所述表达盒以通用形式作为文库应用,含有大量细胞因子(如趋化因子或白介素)融合体以选择最合适的受体或抗体或可替换的靶标或相互作用伴侣的结合剂。进一步的实施方案涉及包含编码本发明融合蛋白的所述表达盒或核酸分子的载体。在特定的实施方案中,用于在大肠杆菌中表达的载体允许产生融合蛋白并在其靶标存在或不存在的情况下纯化。可替换的实施方案涉及宿主细胞,其包含本发明的融合蛋白,或编码本发明的融合蛋白的核酸分子或表达盒或载体。在特定实施方案中,所述宿主细胞进一步共表达靶蛋白或例如特异性结合融合蛋白的细胞因子(如趋化因子或IL)的受体。另一个实施方案公开了所述宿主细胞或其分离的膜制剂或从中分离的蛋白质用于配体筛选、药物筛选、蛋白质捕获和纯化或生物物理研究的用途。提供所述载体的本发明进一步包括在通用融合载体中进行高通量克隆的选择。在另外的实施方案中描述了所述通用载体,其中所述载体特别适合在酵母、噬菌体、细菌或病毒中的表面展示。此外,所述载体可应用于选择和筛选包含具有大量不同配体,特别是具有例如不同接头的此类通用载体或表达盒的文库。因此,为筛选用于特定受体的新型融合蛋白而构建的所述文库中的差异序列由接头序列的差异或替换地其他区域中的差异提供。
在一个实施方案中,本发明的载体适用于涉及在细胞群的胞外表面上展示细胞因子融合蛋白集合的方法中。表面展示方法概述于Hoogenboom(2005;Nature Biotechol 23,1105-16),并且包括细菌展示、酵母展示、(细菌)噬菌体展示。优选,细胞群是酵母细胞。不同的酵母表面展示方法都提供紧密连接由文库编码的每个融合蛋白与携带编码该蛋白的质粒的酵母细胞的胞外表面的方式。迄今为止描述的大部分酵母展示方法使用酿酒酵母(Saccharomyces cerevisiae),但其他酵母种,例如,巴斯德毕赤酵母,也可以使用。更具体地,在一些实施方案中,酵母株来自选自酵母属、毕赤酵母属、汉逊酵母属、裂殖酵母属、克鲁维酵母属、耶氏酵母属和假丝酵母属的属。在一些实施方案中,酵母种选自酿酒酵母、巴斯德毕赤酵母、多形汉逊酵母、粟酒裂殖酵母、乳酸克鲁维酵母、解脂耶氏酵母和白色假丝酵母。大部分酵母表达融合蛋白基于GPI(羰基-磷脂酰-肌醇)锚定蛋白,其在细胞表面蛋白的表面表达中起着重要作用,并且对于酵母的生活力至关重要。一种这样的蛋白质,α-凝集素,由AGA1编码的核心亚基组成并且通过二硫化物桥连接AGA2编码的小结合亚基。由核酸文库编码的蛋白质可以引至AGA1的N-末端区域上或AGA2的C-末端或N-末端区域上。两种融合模式都将导致多肽在酵母细胞表面上的展示。
本文公开的载体还适用于原核宿主细胞在表面上展示蛋白质。用于这个目的的合适的原核生物包括真细菌,如革兰氏阴性或革兰氏阳性生物体,例如,肠杆菌科(Enterobacteriaceae),如埃希氏菌属(Escherichia),例如大肠埃希氏菌(E.coli),肠杆菌属(Enterobacter),欧文氏菌属(Erwinia),克雷伯菌属(Klebsiella),变形杆菌属(Proteus),沙门氏菌属(Salmonella),例如鼠伤寒沙门氏菌(Salmonella typhimurium),沙雷氏菌属(Serratia),例如粘质沙雷氏菌(Serratia marcescans)和志贺氏菌属(Shigella),以及芽孢杆菌属(Bacilli),例如枯草芽孢杆菌(B.subtilis)和地衣芽孢杆菌(B.licheniformis)(例如,在1989年4月12日公开的DD266,710中公开的地衣芽孢杆菌41P),假单胞菌属(Pseudomonas),如铜绿假单胞菌(P.aeruginosa)和链霉菌属(Streptomyces)。一种优选的大肠埃希氏菌克隆宿主是大肠埃希氏菌294(ATCC 31,446),尽管其他株,如大肠埃希氏菌B、大肠埃希氏菌1776(ATCC 31,537)和大肠埃希氏菌W3110(ATCC 27,325),是合适的。这些实例是说明性的,而非限制性的。宿主细胞是原核细胞时,合适的细胞表面蛋白的实例包括合适的细菌外膜蛋白。这样的外膜蛋白包括菌毛和鞭毛、脂蛋白、冰核蛋白和自转运蛋白。用于异源蛋白质展示的示例性细菌蛋白包括LamB(Charbit等,EMBO J,5(11):3029-37(1986))、OmpA(Freudl,Gene,82(2):229-36(1989))和内膜蛋白(Wentzel等,J Biol Chem,274(30):21037-43,(1999))。另外的示例性外膜蛋白包括但不限于FliC、支链淀粉酶、OprF、OprI、PhoE、MisL和溶细胞素。Lee等,TrendsBiotechnol,21(1):45-52(2003),Jose,Appl Microbiol Biotechnol,69(6):607-14(2006)和Daugherty,Curr Opin Struct Biol,17(4):474-80(2007)中详细介绍了已用于表面展示的细菌膜蛋白的广泛列表。
此外,为了进行深入的筛选选择,可将载体应用于酵母和/或噬菌体展示,然后分别进行FACS和淘选。例如,酵母细胞上细胞因子或趋化因子融合蛋白的显示结合荧光激活细胞分选(FACS)的分辨能力,提供了一种优选的选择方法。在酵母展示中,每种细胞因子或趋化因子融合蛋白例如都以与Aga2p蛋白的融合体形式展示,在单个细胞表面上~50,000个拷贝。对于通过FACS的选择,用不同荧光染料标记将决定选择程序。接下来,可以用所用荧光蛋白的混合物将展示抗原结合嵌合体的酵母文库染色。然后可以使用双色FACS来分析在特定酵母细胞上展示的每种融合蛋白的特性,以分辨不同的细胞群。展示高度适合于靶向目标蛋白质的融合蛋白的酵母细胞将结合,并可以在双色FACS中沿对角线进行分类。例如,需要筛选特异性靶向瞬时蛋白-蛋白相互作用或构象选择性结合状态的融合蛋白时,最优选将载体用于这种选择方法。类似地,施加用于噬菌体展示的载体,并用于在噬菌体上展示融合蛋白,然后淘选。例如可以通过使所述通用载体内的细胞因子或趋化因子融合蛋白与噬菌体衣壳蛋白III融合而在M13颗粒上进行展示(Hoogenboom,2000;Immunology.5699:371-378)。例如,为了选择特异性结合某些构象和/或瞬时蛋白-蛋白相互作用的融合蛋白,仅将相互作用的原体之一固定在固相上。然后通过淘选噬菌体展示的融合蛋白来进行生物选择,该方法是在过量的剩余可溶性原体存在下进行的。任选,可以从固定在固相上的交联复合物或蛋白质的一轮淘选开始。
本发明的另一个方面涉及包含所述融合蛋白和受体蛋白的复合物,其中所述受体蛋白特异性地结合细胞因子,如趋化因子或白介素,其中包括其他类型的细胞因子及其同源受体。更特别地,一个实施方案涉及其中所述受体蛋白结合所述融合蛋白的细胞因子部分的蛋白质复合物。一个实施方案公开了如本文所述的复合物,其中所述融合蛋白的细胞因子或趋化因子或IL是构象选择性配体。更特别地,公开了其中融合蛋白的细胞因子或趋化因子或IL部分稳定功能性构象的受体蛋白的复合物。更具体地,其中,所述功能性构象可以涉及激动剂构象,可以涉及部分激动剂构象,或偏向激动剂构象。或者,公开了本发明的复合物,其中融合蛋白的细胞因子或趋化因子或IL稳定功能性构象的受体蛋白,其中所述功能性构象是无活性构象,或其中所述功能性构象涉及反向激动剂构象。另一个实施方案涉及与其受体的复合物中的所述细胞因子融合蛋白或趋化因子或IL融合蛋白,其中受体在结合融合蛋白后被激活。如本文之前所述的,各种细胞因子受体,包括趋化因子和/或IL受体,需要几个界面来结合配体,以获得激活的状态。
本发明的另一个实施方案涉及生产根据本发明的细胞因子功能性融合蛋白的方法,包括步骤(a)在有助于融合蛋白表达的条件下,培养包含本发明的载体、表达盒、嵌合基因或核酸序列的宿主,和(b)任选,回收表达的多肽。
更具体的实施方案涉及用于生产如本文所述的趋化因子融合蛋白的方法,包括步骤:(a)选择趋化因子配体和支架蛋白,其3-D结构揭示了暴露区域(如环或转角)中的可及位点,用于打断氨基酸序列,而没有打断一级拓扑结构,(b)设计遗传融合构建体,其中设计核酸序列以编码由核酸序列分子编码的蛋白质序列,其中:
1.趋化因子序列的打断存在于对应于趋化因子蛋白保守核心结构域结构的β-链β2和β-链β3之间的可及位点的位置,
2.用于通过融合其5’和3’核酸序列端***的支架序列(因此作为整体),或用于通过融合所述支架的可替换的打断位点***的支架蛋白,其序列存在于所述支架蛋白的可及位点序列,如环或β-转角,
3.趋化因子的最5’打断的序列3’端(对应于β-链β2的氨基酸残基C-末端)与支架蛋白的最5’-(打断的)位点的5’起始融合,且趋化因子的最C-末端打断的位点的5’起始(对应于β-链β3的氨基酸残基N-末端)与支架蛋白的最C-末端打断的位点的3’端融合,
(c)在表达***中引入所述遗传融合构建体,以获得融合蛋白,其中所述趋化因子在其核心结构域的两个或更多个位点与支架蛋白融合。
可替换的实施方案公开了一种用于生产或产生如本文所述的功能蛋白的方法,包括步骤:(a)选择趋化因子配体和在其三级结构中具有可及环或转角的支架蛋白,其可以打断以形成融合蛋白而没不打断趋化因子的一级拓扑结构和/或支架蛋白的一级拓扑结构,
(b)设计遗传融合构建体,其中设计核酸序列以编码表达宿主中的蛋白质,其中:
1.趋化因子的蛋白质序列在对应于核心结构域的β-链β2和β-链β3之间的可及位点的氨基酸处被中断,
2.将支架蛋白的N-末端和C-末端融合,得到环状排列的支架蛋白,
3.2.的环状排列支架蛋白然后在其对应于三级序列的暴露环或转角中的可及位点的氨基酸序列中被打断,其是不同于步骤2中融合的氨基酸的打断位点。
4.将趋化因子N-末端部分的C-末端(即β-链β2趋化因子C-末端的打断位点)与环状排列支架蛋白的N-末端融合,和趋化因子C-末端部分的N-末端起始(即β-链β3的趋化因子N-末端的打断位点)与环状排列支架蛋白的C-末端融合,
(c)将所述遗传融合构建体引入表达***,以获得融合蛋白,其中所述趋化因子在其核心结构域的两个或更多个位点与环状排列支架蛋白融合。
另一个方面涉及本发明的细胞因子功能性融合蛋白的用途或核酸分子、嵌合基因、表达盒、载体或复合物的用途,所述用途在其同源受体蛋白的结构分析中。特别地,基于β-链核心结构域的细胞因子融合蛋白在受体蛋白的结构分析中的用途,其中所述受体蛋白是特异性结合所述融合蛋白的所述细胞因子的蛋白质。如本文使用的,“分解结构”或“结构分析”是指确定蛋白质的原子排列或原子坐标,并且通常通过生物物理方法来完成,如X射线晶体学或冷冻电子显微镜(冷冻电镜)。具体地,一个实施方案涉及在结构分析中的用途,包括单颗粒冷冻电镜或包括晶体学。本发明的这些细胞因子融合蛋白在结构生物学中的使用提供了可以用作结晶助剂的主要优势,即起晶体接触的作用并增加对称性,甚至更多地用作冷冻电镜中的刚性工具,冷冻电镜对于分解大型的难点靶标的结构将非常有价值,以减少当今所应付的尺寸障碍,还增加了对称性,并稳定和观察与所述细胞因子或趋化因子融合蛋白的复合物中的靶标的特异性构象状态。
与更传统的方法(如X射线晶体学)相比,使用冷冻电镜进行结构确定具有多个优势。特别是,冷冻电镜在纯度、均质性和数量方面对待分析样品的要求不那么严格。重要的是,冷冻电镜可以应用于不会形成合适的用于结构确定的晶体的靶标。可以将单独的或与其他蛋白质分子(如本发明的细胞因子融合蛋白)或非蛋白质分子(如核酸)复合物中的纯化的或未纯化的蛋白质的悬浮液施加于碳网上,以通过冷冻电镜成像。涂覆的格栅通常在液态乙烷中闪冻,以将悬浮液中的颗粒保持为冷冻水合状态。较大的颗粒可以通过冷冻固定玻璃化。可以在冷冻超薄切片机中将玻璃化的样品切成薄片(通常为40至200nm厚),并将这些切片放在电子显微镜栅格上进行成像。通过使用平行照明和更好的显微镜对准可以获得高达的分辨率,从而改善从图像获得的数据的质量。在这样的高分辨率下,从头开始建立完整原子结构的模型是可能的。然而,在可以使用选定的或紧密相关的靶蛋白和选定的异源蛋白或紧密同源物的原子分辨率的结构数据可用于约束比较建模的情况下,则较低分辨率的成像可能就足够了。为了进一步提高数据质量,可以仔细对准显微镜,以揭示在用于成像的相同条件下记录的碳膜图像的傅里叶变换中,可见对比度传递函数(CTF)环超过然后可以使用如CTFFIND之类的软件确定每张显微照片的散焦值。
此外,本文公开了用于确定配体/受体复合物的三维结构的方法,包括步骤:(i)提供根据本发明的融合蛋白,和提供受体,以形成复合物,其中所述受体蛋白结合本发明的融合蛋白的细胞因子部分,或提供如上文所述的复合物;(ii)在合适的条件下展示所述复合物,用于结构分析,其中在高分辨率下确定所述蛋白质复合物的3D结构。
在特定的实施方案中,通过X-射线晶体学进行所述结构分析。在另一个实施方案中,所述3D分析包括冷冻电镜。更具体地,本文如下描述了一种用于冷冻电镜分析的方法。印迹前将样品(例如,在与目标受体的复合物中的选择的融合蛋白)施加到选择的性能最佳的放电网格上(碳涂层铜网格,C-Flat,1.2/1.3 200目):Electron Microscopy Sciences;金R1.2/1.330目UltraAuFoil网格:Quantifoil等),然后在液态乙烷中急冻(VitrobotMarkIV(FEI)或选择的其他急冻机)。单个网格的数据是在配备有选择的探测器(例如,Falcon 3EC直接探测器)的300kV电子显微镜(以Krios300kV为例,带有选择的补充相板)下收集的。显微照片以电子计数模式以适合预期的配体/受体复合物大小的适当放大倍率收集。手动检查收集的显微照片,然后再进行进一步的图像处理。通过选择的软件(例如RELION,SPHIRE包)应用漂移校正、射束感应运动、剂量加权、CTF拟合和相移估计。使用选择的软件挑选粒子,并将其用于2D分类。手动检查2D分类,并消除假阳性。根据数据收集设置对粒子进行分类。通过应用适当的低通滤波器来生成初始3D参考模型,并生成多个(以六个为例)3D分类。使用原始粒子进行3D细化(如果需要,使用软蒙板)。通过使用傅立叶壳相关(FSC)=0.143标准来估计重建分辨率。本地分辨率可以通过Scipion中的MonoRes实施来计算。重建的冷冻电镜图谱可以使用UCSF Chimera和Coot软件进行分析。最初可以使用UCSFChimera拟合设计模型,然后通过选择的软件(UCSF Chimera,PyMOL或Coot)进行分析。
本发明方法的另一个优点是,由于使用细胞因子融合蛋白,以常规方式只能用高纯度蛋白质才能进行的结构分析对纯度的要求不那么严格了。这样的细胞因子配体融合蛋白,更特别地此类基于β-链保守核心结构域的细胞因子融合蛋白,如趋化因子或IL-融合蛋白,将通过在复杂混合物中的高亲和力结合位点而特异性地滤出目标受体。受体蛋白可以通过这种方式被捕获、冷冻并通过冷冻电镜进行分析。
所述方法在可替换的实施方案中也适用于3D分析,其中受体蛋白是瞬时蛋白-蛋白复合物或处于瞬时特定的构象状态。另外,所述融合蛋白分子也可以用于确定受体的三维结构的方法中以稳定作为靶标的瞬时蛋白-蛋白相互作用以进行其结构分析。
另一个实施方案涉及选择或筛选与相同受体蛋白的不同构象结合的一组融合蛋白的方法,包括步骤:(i)设计结合受体蛋白的融合蛋白的配体文库,和(ii)通过表面酵母展示、噬菌体展示或细菌噬菌体选择融合蛋白以获得包含与所述受体蛋白的几个相关构象状态结合的蛋白质的融合蛋白组,从而允许在分开的图像中例如在冷冻电镜中分析受体蛋白的几种构象。为了获得特定的或某些构象状态,可以使用基于细胞的***,其中受体在膜上,其中可以根据实验目的处理或操纵所述细胞。
在另一个实施方案中,本发明的所述方法和所述融合蛋白用于基于结构的药物设计和基于结构的药物筛选。基于结构的药物设计的迭代过程通常会经过多个周期,然后才能将优化的先导引入I期临床试验。第一个周期包括通过三种主要方法之一的受体蛋白或核酸的克隆、纯化和结构测定:X射线晶体学、NMR或同源性建模。使用计算机算法,将数据库中的化合物或化合物片段置于结构的选定区域中。可以使用本发明的融合蛋白来固定或稳定受体的某些结构构象。根据所选化合物与该靶标位点的空间和静电相互作用对其进行评分和排名,并通过生化分析测试最佳化合物。在第二个周期中,对与来自第一个周期的具有前景的先导(在体外至少具有微摩尔抑制作用)的复合物中的靶标进行结构测定,揭示了可以优化以提高效力的化合物上的位点。同样在这一点上,本发明的融合蛋白可以发挥作用,因为它有助于对某种构象状态的所述靶受体蛋白进行结构分析。其他周期包括优化先导的合成,确定新靶标:先导复合物的结构以及进一步优化先导化合物。在药物设计过程的几个循环后,优化的化合物通常在结合并且常常在针对靶标的特异性方面表现出显著提高。文库筛选会导致命中,并将其进一步发展为先导,对于这些先导的结构信息以及用于结构-活性-关系分析的药物化学是必不可少的。
另一个实施方案涉及鉴定(构象选择性)化合物的方法,包括步骤:
i)提供靶受体蛋白和特异性结合所述靶受体蛋白的本发明的融合蛋白
ii)提供测试化合物
iii)评估测试化合物与靶受体蛋白的选择性结合。
根据特别优选的实施方案,以上所述的鉴定构象选择性化合物的方法通过配体结合试验或竞争试验来进行,甚至更优选通过放射性配体结合或竞争试验来进行。最优选,以上所述的鉴定构象选择性化合物的方法在比较试验中进行,更具体地,在比较配体竞争试验中进行,甚至更具体地,在比较放射性配体竞争试验中进行。
应当理解,尽管本文已经针对根据本发明的工程化细胞和方法讨论了特定的实施方案、特定的构造以及材料和/或分子,但是可以在形式和细节上进行各种改变或修改而不背离本发明的范围和精神。提供以下实施例以更好地说明特定实施方案,并且不应将其视为限制本申请。本申请仅受权利要求的限制。
实施例
概述
我们已经设计了新型功能性刚性融合蛋白,也称为“MegakineTM”(Mk),由细胞因子和支架蛋白组成,其中细胞因子的基于β-链保守核心结构域或基序,或特定的细胞因子亚家族,通过两个或三个短接头,或通过两个或三个直接连接,与支架蛋白连接。本文针对细胞因子的2个超家族,包括趋化因子(具体是CCL5和CXCL12)和白介素,更具体地是IL-1型受体白介素,举例说明了原理,这两个超家族对于这样的包含基于β-链保守核心结构域的细胞因子是代表性的。根据趋化因子或白介素与其受体的作用和结合模式的机制,这些刚性融合蛋白结合并固定特定的和不同的趋化因子-或白介素-受体的构象状态。那些融合蛋白实际上代表扩大的趋化因子或白介素配体,并且对于确定趋化因子或白介素复合物(例如,与其受体)的蛋白质结构是有帮助的,并且有助于几个应用,包括X-射线晶体学和冷冻电镜应用。Megakine通过降低结合的同源细胞因子受体的构象灵活性和通过扩展易于形成晶体接触的表面,以及通过提供额外的定相信息,起到下一代伴侣的作用。通过将特定的Megakine蛋白与趋化因子-或白介素-特异性受体混合,它们的特异性结合相互作用导致“质量”增加并固定受体的特定构象状态。
作为这种方法概念的证明,我们***了基因的环状排列变体(c7HopQ)作为折叠支架蛋白,所述基因编码趋化因子CCL5变体6P4(超激动剂)的趋化因子核心结构域(图2)(实施例1)和趋化因子CXCL12的趋化因子核心结构域(图19)(实施例7)的β-链2(β2)和β-链3(β3)之间的β-转角中的HopQ(幽门螺杆菌的周质蛋白,PDB 5LP2)的粘附结构域。或者,我们在白介素IL-1β的β-桶核心基序或结构域的β-链6(β6)和β-链7(β7)之间的β-转角中***所述c7HopQ支架(图27)(实施例10)。此外,对于CCL5趋化因子,使用较大的支架蛋白大肠杆菌Ygjk(PDB密码子3W7S;Kurakava等,2008)产生了替代的Megakine,为此设计了2个环状排列变体(C1Ygjk和C2Ygjk),以在所述与CCL5 6P4的Megakine融合体中测试(实施例8)。
使用了Modeler软件(https://salilab.org/modeller)设计了构建体,并且使用不同的短接头制得了不同的融合体。
我们进行了几个不同的融合蛋白构建体的酵母表面展示,其含有不同的接头(实施例6、8、10),这证明了用于基于细胞因子的Megakine的所有不同构建体能够结合细胞因子配体特异性单克隆抗体(实施例2、9和11)。我们在酵母(实施例3)和大肠杆菌周质(实施例4)中将这些融合蛋白表达为分泌蛋白。此外,在实施例5中,我们显示了在基于细胞的测定中应用的纯化蛋白质或周质提取物能够激活CCR5受体,甚至在一些情况中,达到对于6P4-CCL5趋化因子激动剂自身观察到的水平。
实施例1:从***6P4-CCL5-趋化因子的连接β-链β2-β3的β-转角中的c7HopQ支架构建的50kDa融合蛋白的设计和产生。
作为获得刚性融合蛋白“Megakine”概念的第一个证明,根据图2,经由连接6P4-CCL5与支架的两个肽键,将称为6P4-CCL5趋化因子的改进的CCL5趋化因子嫁接到大的支架蛋白上,以构建刚性Megakine。
此处描述的50kDa Megakine是一种嵌合多肽,由根据图2至6连接的趋化因子的部分和支架蛋白的部分连接而成。在此,使用的趋化因子是6P4-CCL5,源自天然CCL5配体,属于CC-趋化因子的亚家族,其修饰为如SEQ ID NO:1中所示的CCR5 GPCR的超激动剂(6P4-CCL5是拮抗剂CCL5-5P7的类似物;Zheng等,2017;PDB代码CCL5-5P7:5UIW)。将连接6P4-CCL5的β-链2和β-链3的β-转角打断,用于与支架蛋白融合。支架蛋白是幽门螺杆菌株G27的粘附素结构域(PDB:5LP2;SEQ ID NO:2),称为HopQ(Javaheri等,2016)。将HopQ的N-和C-末端连接,尽管在环状排列区域中截短了7个氨基酸后(称为c7HopQ),其在晶体结构的电子密度中显示为永远不会完全可见的一个环。这种截短的融合产生了HopQ的环状排列变体,称为c7HopQ,其中氨基酸序列内的切割发生在其序列的其他地方(即,在对应于所述支架蛋白暴露区域中可及位点的位置)。为了设计功能性Megakine融合蛋白变体,在计算机分子建模中使用Modeler软件(https://salilab.org/modeller)以及定制编写的Python脚本。结果,产生了四个低自由能Mk6P4-CCL5 c7HopQ模型,其中所有部分通过肽键以以下给出的顺序从氨基(N-)至羧基(C-)末端彼此连接:
Mk6P4-CCL5 c7HopQ V1(SEQ ID NO:3):6P4-CCL5趋化因子的直至β-链2的N-末端(SEQID NO:1的1-43),HopQ的C-末端部分(SEQ ID NO:2的残基193-411),HopQ的N-末端部分(SEQ ID NO:2的残基18-185),6P4-CCL5趋化因子从β-链3直至末尾的C-末端部分(SEQ IDNO:1的47-69),6xHis标签和EPEA标签(US 9518084 B2;SEQ ID NO:21)。
Mk6P4-CCL5 c7HopQ V2(SEQ ID NO:4):6P4-CCL5趋化因子的直至β-链2的N-末端(SEQID NO:1的1-44),Thr一氨基酸接头,HopQ的C-末端部分(SEQ ID NO:2的残基194-411),HopQ的N-末端部分(SEQ ID NO:2的残基18-185),6P4-CCL5趋化因子从β-链3直至末尾的C-末端部分(SEQ ID NO:1的47-69),6xHis标签和EPEA标签。
Mk6P4-CCL5 c7HopQ V3(SEQ ID NO:5):6P4-CCL5趋化因子的直至β-链2的N-末端2(SEQID NO:1的1-45),HopQ的C-末端部分(SEQ ID NO:2的残基192-411),HopQ的N-末端部分(SEQ ID NO:2的残基18-185),6P4-CCL5趋化因子从β-链3直至末尾的C-末端部分(SEQ IDNO:1的47-69),6xHis标签和EPEA标签(US 9518084 B2)。
Mk6P4-CCL5 c7HopQ V4(SEQ ID NO:6):6P4-CCL5趋化因子的直至β-链2的N-末端(SEQID NO:1的1-44),HopQ的C-末端部分(SEQ ID NO:2的残基193-411),HopQ的N-末端部分(SEQ ID NO:2的残基18-185),6P4-CCL5趋化因子从β-链3直至末尾的C-末端部分(SEQ IDNO:1的47-69),6xHis标签和EPEA标签。
实施例2.从***6P4-CCL5-趋化因子的连接β-链β2-β3的β-转角中的c7HopQ支架构建的50kDa融合蛋白的酵母展示。
为了证明四种Mk6P4-CCL5 c7HopQV1-V4 Megakine变体(SEQ ID NO:3-6)可以表达为折叠良好和功能性的蛋白质,我们在酵母表面展示了这种蛋白质(Boder,1997)。通过使用与功能性6P4-CCL5趋化因子结合的荧光偶联单克隆抗体(来自Biolegend的Alexa647抗人RANTES(CCL5)抗体,参考号515506;抗CCL5-mAb647)检查6P4-CCL5趋化因子部分的正确折叠。为了在酵母上展示Mk6P4-CCL5 c7HopQV1-V4 Megakine变体,我们使用标准方法构建了开放阅读框,其编码与各种辅助肽和蛋白质融合的Megakine(SEQ ID NO:7-10):指导在酵母中胞外分泌的appS4前导序列(Rakestraw,2009),Mk6P4-CCL5 c7HopQ Megakine变体,柔性肽接头,Aga2p(酵母凝集素蛋白Aga2p的粘附亚基,它通过与Aga1p的二硫键连接到酵母细胞壁蛋白),酰基载体蛋白(用于展示的融合蛋白的正交荧光染色(Johnsson,2005)),然后是cMyc标签。这个开放阅读框在半乳糖诱导型GAL1/10启动子的转录控制下放入pCTCON2载体中(Chao,2006)并引入酵母菌株EBY100中。
将携带这个质粒的EBY100酵母细胞在富含半乳糖的培养基中生长和诱导过夜,以触发Mk6P4-CCL5 c7HopQ-Aga2p-ACP融合体的表达和分泌。对于ACP的正交染色,细胞在荧光标记的CoA类似物(CoA-547,2μM)和催化量的SFP合酶(1μM)存在下孵育1小时。为了分析展示的Megakine的功能性,我们通过流式细胞术检测了其被Alexa647荧光标记的抗CCL5单克隆抗体(抗CCL5-mAb647)识别的能力。因此,诱导EBY100酵母细胞并与CoA547正交荧光染色,以监测Mk6P4-CCL5 c7HopQ-Aga2p-ACP融合体的显示。这些正交染色的酵母细胞随后在不同浓度的抗CCL5-mAb647(15、31、62、125和250ng/mL)存在下孵育1小时。在这些实验中,洗涤诱导的酵母细胞并进行流式细胞术以通过将CoA547荧光水平与展示MegaBody MbNb207 cHopQ-Aga2p-ACP融合体(SEQ ID NO:11,其中MegaBody类似于Megakine,但纳米抗体(Nb)替代了趋化因子与支架蛋白融合,本文中Nb207作为GFP特异性Nb)并以相同方式正交染色的酵母细胞进行比较来测量每个细胞的Megakine展示水平。随后,通过检查647-荧光水平来分析抗CCL5-mAb647的结合,该水平应与酵母表面上的MbNb207 cHopQ表达水平呈线性相关。事实上,二维流式细胞术分析证实了抗CCL5-mAb647(高647荧光水平)仅与具有显著Megakine展示水平(高CoA547荧光水平)的酵母细胞结合(图9和图10-14)。相比之下,抗CCL5-mAb647不与展示MegaBody MbNb207 cHopQ-Aga2p-ACP融合体(SEQ ID NO:11)的并以相同方式染色的酵母细胞结合。
我们从这些实验得出结论,所有四种Mk6P4 c7HopQV1-V4 Megakine变体(SEQ ID NO:3-6)都可以在酵母表面上表达为折叠良好的和功能性的嵌合蛋白。
实施例3:从***6P4-CCL5-趋化因子的连接β-链β2-β3的β-转角中的c7HopQ支架构建的50kDa融合蛋白的酵母表达和纯化。
因为我们能够在酵母表面上展示功能性Megakine,我们开始在EBY100细胞中将这些50kDa融合蛋白表达为可溶性分泌蛋白,将它们纯化至同质并确定它们的特性。
为了表达四种Megakines Mk6P4-CCL5 c7HopQV1-V4 Megakine变体(SEQ ID NO:3-6),我们使用标准方法来构建开放阅读框,其编码与多种辅助肽和蛋白质融合的Megakine(SEQID NO:12-15):指导在酵母中胞外分泌的appS4前导序列(Rakestraw,2009)、Mk6P4-CCL5 c7HopQMegakine变体、6xHis标签、EPEA标签和完成翻译的终止密码子。将这个开放阅读框放入pCTCON2载体中置于半乳糖诱导型GAL1/10启动子的转录控制下(Chao,2006)并引入酵母株EBY100中。将携带这个质粒的EBY100酵母细胞在富含半乳糖的培养基中生长和诱导过夜,以在30℃下触发Mk6P4-CCL5 c7HopQV1-V4变体(SEQ ID NO:12-15)的表达和分泌。在HisTrap(NiNTA)FF 5mL预装柱上从培养基中回收重组Megakine融合蛋白。接着通过应用500mM咪唑从NiNTA树脂上洗脱蛋白质,并通过使用NMWL过滤器(Nominal Molecular Weight Limit)以10kDa的截留进行离心浓缩(图15-16)。
我们从这些实验中得出结论,Mk6P4-CCL5 c7HopQV1-V4 Megakine变体(SEQ ID NO:3-6)中的几个可以表达为折叠良好的和功能性的嵌合蛋白,并通过常规纯化方法进行纯化。
实施例4:从***6P4-CCL5-趋化因子的连接β-链β2-β3的β-转角中的c7HopQ支架构建的50kDa融合蛋白的细菌表达和纯化。
由于我们能够在酵母表面上展示功能性Megakine并将它们在酵母中表达为可溶性蛋白,我们开始在大肠杆菌的周质中表达这种50kDa融合蛋白,将它们纯化至同质并确定它们的特性。为了在大肠杆菌的周质中表达Megakine Mk6P4-CCL5 c7HopQV1-V4 Megakine变体蛋白(SEQ ID NO:3-6),我们使用标准方法构建了允许表达6P4-CCL5 megakine的载体:可以将支架***连接6P4-CCL5趋化因子的β-链2(β2)和β-链3(β3)的β-转角中。这个载体是pMESy4的衍生物(Pardon,2014)并包含编码以下多肽的开放阅读框:指导Megakine分泌到大肠杆菌周质中的DsbA前导序列,6P4-CCL5趋化因子的直至β-链β2的N末端,多克隆位点(对于这个实施例,其中克隆了HopQ的环状排列变体(c7HopQ)),6P4-CCL5趋化因子的从β-链β3起的C-末端,6xHis标签和EPEA标签,接着是Amber终止密码子。可以在这个载体的多克隆位点中克隆任何其他合适的支架。
为了在大肠杆菌周质中表达Megakine并将这个重组蛋白纯化至同质,我们使用了标准方法构建载体,其中DsbA前导序列指导四种His标签和EPEA标签的Mk6P4-CCL5 c7HopQV1-V4Megakine变体(SEQ ID NO:16-19)在pLac启动子的转录控制下在大肠杆菌周质中表达。WK6细菌细胞(WK6是su-非遏制株)在3升2xTY培养基中于37℃生长,并在细胞达到对数生长期时通过IPTG进行诱导。带His-标签和EPEA-标签的Mk6P4-CCL5 c7HopQV1-V4 Megakine变体(SEQID NO:16-19)的周质表达在28℃下持续过夜。通过离心收获细胞,并使用渗透休克从周质中释放重组Megakine(Pardon等,2014)。然后通过离心将重组Megakine与原生质体分离,并在HisTrap FF 5mL预装柱上从澄清的上清液中回收。接着通过应用500mM咪唑从NiNTA树脂上洗脱蛋白质,并使用NMWL过滤器(Nominal Molecular Weight Limit)以10kDa的截留进行离心浓缩(图17)。表达并纯化至同质的MegaBody MbNb207 c7HopQ(SEQ ID NO:20)用作功能实验的对照。
我们从这些实验得出结论,一些Mk6P4-CCL5 c7HopQV1-V4 Megakine变体(SEQ ID NO:3-6)可以在大肠杆菌中表达为折叠良好的和功能性的嵌合蛋白,并通过常规纯化方法进行纯化。
实施例5.基于细胞的测定证实了从***6P4-CCL5-趋化因子的连接β-链β2-β3的β-转角(40s环)中的c7HopQ支架构建的50kDa融合蛋白的功能性。
通过Mk6P4-CCL5 c7HopQV1-V4 Megakine变体激活CCR5(CCL5的同源受体)的能力来评估在c7HopQ支架中呈现时6P4-CCL5的功能性/正确折叠的保留。在基于细胞的测定中评估活性,所述测定基于***的纳米荧光素酶(NanoBiT-Promega)的互补(Dixon AS等,2016ACSChem Biol.)监测β-抑制蛋白-1或miniGi(Gα亚基的工程化GTPase结构域;Wan等,2018)在激动剂刺激后向CCR5的募集。
将5×106HEK293T细胞接种在10cm培养皿中,24小时后用pNBe2和pNBe3载体(Promega)共转染,这两个载体分别编码C-末端与由15Gly/Ser接头(GSSGGGGSGGGGSSG)隔开的SmBiT(VTGYRLFEEIL)(纳米荧光素酶亚基I)融合的人CCR5,和与N-末端与后跟15Gly/Ser接头的LgBiT(纳米荧光素酶亚基II,残基1-156)融合的人β-抑制蛋白-1或miniGi。收集转染后24小时的细胞,在37℃下与稀释100倍的Nano-Glo Live Cell底物一起孵育25分钟,然后按5×104个细胞/孔分配到白色96孔板中。通过纳米荧光素酶互补评估β-抑制蛋白-1或miniGi在添加Megakine后向CCR5的募集,并因此用Mithras LB940光度计(BertholdTechnologies)测量催化活性恢复。将未纯化的周质提取物和选自酵母展示的纯化Mk6P4-CCL5 c7HopQV1-V4 Megakine变体(SEQ ID NO:16-19)的活性与未纯化的使用pIRES-嘌呤霉素载体在CMV启动子依赖性下在哺乳动物细胞(HEK293T)中产生的重组可溶性6P4-CCL5趋化因子(SEQ ID NO:33)的活性进行比较。
6P4-CCL5趋化因子在将c7HopQ支架***其连接β2-β3的β-链后保留其功能性,正如通过Mk6P4-CCL5 c7HopQV1-V4 Megakine变体诱导浓度依赖性β-抑制蛋白-1和miniGi募集到CCR5的能力所证明的(图18)。
实施例6.通过体内选择设计和产生其他从***6P4-CCL5-趋化因子的连接β-链β2-β3的β-转角中的c7HopQ支架构建的50kDa融合蛋白。
由于Megakine的折叠能力以及稳定性和刚性可能依赖于连接趋化因子与支架的多肽键的组成和长度,我们引入了体外进化技术,如果需要,可用于微调特定的Megakine形式。从实施例1中描述的Megakine开始,我们构建了具有类似设计的编码Megakine的文库,其中根据图2,可变长度和混合氨基酸组成的两个短肽将趋化因子连接支架,其适于体内选择。
这里描述的50kDa Megakine是一种嵌合多肽,根据图2和3,由趋化因子的部分和支架蛋白的部分连接而成。在此,使用的趋化因子是6P4-CCL5,CCR5 GPCR的激动剂,如SEQID NO:1中所示(6P4-CCL5是拮抗剂CCL5-5P7的类似物;Zheng等,2017;PDB编码CCL5-5P7:5UIW)。将连接6P4-CCL5的β-链2和β-链3的β-转角打断,用于与支架蛋白融合。支架蛋白是幽门螺杆菌株G27的粘附素结构域(PDB:5LP2;SEQ ID NO:2),称为HopQ(Javaheri等,2016)。将HopQ的N-和C-末端连接,尽管在环状排列区域中截短了7个氨基酸后(称为c7HopQ),其在晶体结构的电子密度中显示为永远不会完全可见的一个环。这种截短的融合产生了HopQ的环状排列变体,称为c7HopQ,其中氨基酸序列内的切割发生在其序列的其他地方(即,在对应于所述支架蛋白暴露区域中可及位点的位置)。所有部分通过肽键以以下给出的顺序从氨基至羧基末端彼此连接:6P4-CCL5趋化因子的直至β-链2的N-末端(SEQ IDNO:1的1-44),具有随机组成的一个或两个氨基酸的肽接头,HopQ的C-末端部分(SEQ IDNO:2的残基195-411),HopQ的N-末端部分(SEQ ID NO:2的残基18-183),具有随机组成的一个或两个氨基酸的肽接头,6P4-CCL5趋化因子从β-链3直至末尾的C-末端部分(SEQ ID NO:1的47-69)。
为了展示和选择实施例1至5中所述的Megakine的功能性变体,这些变体在酵母上连接趋化因子与支架的接头的组成和长度上不同,根据图7,我们使用标准方法构建了开放阅读框文库,其编码与若干辅助肽和蛋白质融合的各种Megakine(SEQ ID NO:25-28):指导在酵母中胞外分泌的appS4前导序列(Rakestraw,2009),6P4-CCL5趋化因子的直至β-链2的N-末端(SEQ ID NO:1的1-44),具有随机组成的一个或两个氨基酸的肽接头,HopQ的C-末端部分(SEQ ID NO:2的残基195-411),HopQ的N-末端部分(SEQ ID NO:2的残基18-183),具有随机组成的一个或两个氨基酸的肽接头,6P4-CCL5趋化因子从β-链3直至末尾的C-末端部分(SEQ ID NO:1的47-69),柔性(GGSG)n肽接头,Aga2p(酵母凝集素蛋白Aga2p的粘附亚基,它通过与Aga1p的二硫键连接到酵母细胞壁蛋白),酰基载体蛋白(用于展示的融合蛋白的正交荧光染色(Johnsson,2005)),然后是cMyc标签。这个开放阅读框在半乳糖诱导型GAL1/10启动子的转录控制下放入pCTCON2载体中(Chao,2006),以构建编码176400个不同的Megakine变体的酵母展示文库(参见图7)。
为了体外选择,将这个文库引入酵母株EBY100中。将转化的细胞在富含半乳糖的培养基中生长和诱导过夜。使用SFP合酶(1μM)用coA-547(2μM)将诱导的细胞正交染色,并用0.25μg/mL Alexa647荧光标记的抗CCL5单克隆抗体(抗CCL5-mAb647)孵育。接着,洗涤这些细胞并进行2参数FACS分析以鉴定展示高水平Megakine表达(高CoA-547荧光)和结合抗CCL5-mAb647(高Alexa647荧光)的酵母细胞。将展示高水平抗CCL5-mAb647结合的细胞在富含葡萄糖的培养基中进行分选和扩增,以通过酵母展示和双参数FACS分析进行后续轮的选择(图8)。
经过两轮选择后,将CoA-547和Alexa647通道中具有代表性数量的高荧光细胞作为单菌落生长,并进行DNA测序以确定代表性数量的连接趋化因子与支架蛋白的肽接头的序列。具有1-1、1-2、2-1和2-2氨基酸短接头变体的每种类型接头的两个代表性克隆列于表1中。
表1.某些酵母展示优化的连接支架蛋白c7HopQ与趋化因子的肽接头的组成和长度
这证明了趋化因子和支架蛋白之间的不同短肽连接可以通过使用酵母展示的体内选择从Megakine文库中选择出来,并在酵母细胞表面上展示为功能性趋化因子嵌合蛋白。
实施例7:从***CXCL12趋化因子的连接β-链β2-β3的β-转角中的c7HopQ支架构建的50kDa融合蛋白的细菌表达和纯化。
作为获得刚性融合蛋白“Megakine”概念的第二个证明,根据图2,通过连接CXCL12与支架的两个肽键,将CXCL12趋化因子(属于CXC-趋化因子的亚家族)嫁接到大的支架蛋白上,以构建刚性Megakine。
此处描述的50kDa Megakine是一种嵌合多肽,根据图2和3由连接的趋化因子的部分和支架蛋白的部分连接而成。在此,使用的趋化因子是CXCL12,如SEQ ID NO:22中所示的(PDB代码:3HP3),也称为SDF-1,其结合并激活CXCR4 GPCR以及ACKR3 GPCR。将支架蛋白***CXCL12的连接β-链2和β-链3的β-转角中。支架蛋白是幽门螺杆菌株G27的粘附素结构域(PDB:5LP2;SEQ ID NO:2),称为HopQ(Javaheri等,2016)。将HopQ的N-和C-末端连接,尽管在环状排列区域中截短了7个氨基酸后(称为c7HopQ),其在晶体结构的电子密度中显示为永远不会完全可见的一个环。这种截短的融合产生了HopQ的环状排列变体,称为c7HopQ,其中氨基酸序列内的切割发生在其序列的其他地方(即,在对应于所述支架蛋白暴露区域中可及位点的位置)。与实施例1类似,产生了低自由能MkCXCL12 c7HopQ(SEQ ID NO:23),其中所有部分如下连接:CXCL12趋化因子的直至β-链2的N-末端(SEQ ID NO:22的1-43),HopQ的C-末端部分(SEQ ID NO:2的残基192-411),HopQ的N-末端部分(SEQ ID NO:2的残基18-184),CXCL12趋化因子从β-链3直至末尾的的C-末端部分(SEQ ID NO:22的45-68),6xHis标签和EPEA标签(US 9518084 B2)。
我们开始在大肠杆菌的周质中表达这种50kDa融合蛋白,将它们纯化至同质并确定它们的特性。为了在大肠杆菌的周质中表达Megakine MkCXCL12 c7HopQ,我们使用标准方法构建了允许表达MkCXCL12 c7HopQ Megakine的载体:可以将支架***连接CXCL12趋化因子的β-链2(β2)和β-链3(β3)的β-转角中。这个载体是pMESy4的衍生物(Pardon,2014)并含有编码以下多肽的开放阅读框:指导Megakine分泌到大肠杆菌周质中的DsbA前导序列,CXCL12趋化因子的直至β-链β2的N末端,多克隆位点(对于这个实施例,其中克隆了HopQ的环状排列变体(c7HopQ)),CXCL12趋化因子的从β-链β3起的C-末端,6xHis标签和EPEA标签,接着是Amber终止密码子(SEQ ID NO:24)。可以在这个载体的多克隆位点中克隆任何其他合适的支架。MkCXCL12 c7HopQ表达如实施例4中所述。
实施例8:从***6P4-CCL5-趋化因子的连接β-链β2-β3的β-转角中的YgjK支架构建的94kDa融合蛋白的设计和产生。
在从嫁接到c7HopQ上的6P4-CCL5趋化因子成功设计了我们的第一个Megakine的基础上(实施例1至6),我们还旨在开发其他Megakine设计,这些设计从连接到较大的支架蛋白的趋化因子构建。
此处描述的94kDa Megakine是一种嵌合多肽,根据图2,由趋化因子的部分和支架蛋白的部分连接而成。在此,使用的趋化因子是6P4-CCL5,与之前实施例中使用的相同,并且如SEQ ID NO:1中所示。将连接6P4-CCL5的β-链2和β-链3的β-转角打断,用于与支架蛋白融合。支架蛋白是大肠杆菌的86kDA周质蛋白(PDB代码3W7S,SEQ ID NO:34),称为YgjK(Kurakave等,2008)。在YgjK的三级结构中,鉴定了两条反平行的具有表面可及β-转角的β-链:β-转角A’S1-A’S2和β-转角NS6-NS7。为了产生不同的94kDa MW的Megakine,其中拓扑结构被(不同地)打断,将这两个β-转角截短并且引入另外的环状排列来产生两个支架蛋白:
c1YgiK(SEQ ID NO:36):YgiK的C-末端部分(SEQ ID NO:34的残基464-760),连接YgiK的C-末端和N-末端产生支架蛋白的环状排列的短肽接头(SEQ ID NO:35),YgiK的N-末端部分(SEQ ID NO:34的残基1-461)
c1YgiK(SEQ ID NO:37):YgiK的C-末端部分(SEQ ID NO:34的残基105-760),连接YgiK的C-末端和N-末端产生支架蛋白的环状排列的短肽接头(SEQ ID NO:35),YgiK的N-末端部分(SEQ ID NO:34的残基1-102)
为了设计功能性Megakine融合蛋白变体,进行了使用可及晶体结构(PDB代码CCL5-5P7:5UIW,PDB代码YgjK:3W7S)的计算机分子建模。结果是,产生了三个MegakineMk6P4-CCL5 c1YgjK和两个Mk6P4-CCL5 c2YgjK模型,其中所有部分通过肽键以以下给出的顺序从氨基(N-)至羧基(C-)末端彼此连接:
Mk6P4-CCL5 c1YgjK V1(SEQ ID NO:38,图20):6P4-CCL5趋化因子的直至β-链2的N-末端(SEQ ID NO:1的1-45),Gly-Gly双氨基酸接头,c1YgjK支架蛋白(SEQ ID NO:36),Gly-Gly双氨基酸接头,6P4-CCL5趋化因子从β-链3直至末尾的的C-末端部分(SEQ ID NO:1的47-69)
Mk6P4-CCL5 c1YgjKV2(SEQ ID NO:39,图21):6P4-CCL5趋化因子的直至β-链2的N-末端(SEQ ID NO:1的1-45),Gly一个氨基酸接头,c1YgjK支架蛋白(SEQ ID NO:36),Gly一个氨基酸接头,6P4-CCL5趋化因子从β-链3直至末尾的的C-末端部分(SEQ ID NO:1的47-69)
Mk6P4-CCL5 c1YgjKV3(SEQ ID NO:40,图22):6P4-CCL5趋化因子的直至β-链2的N-末端(SEQ ID NO:1的1-45),c1YgjK支架蛋白(SEQ ID NO:36),6P4-CCL5趋化因子从β-链3直至末尾的的C-末端部分(SEQ ID NO:1的47-69)
Mk6P4-CCL5 c2YgjKV1(SEQ ID NO:41,图23):6P4-CCL5趋化因子的直至β-链2的N-末端(SEQ ID NO:1的1-45),Gly-Gly两个氨基酸接头,c2YgjK支架蛋白(SEQ ID NO:37),Gly-Gly两个氨基酸接头,6P4-CCL5趋化因子从β-链3直至末尾的的C-末端部分(SEQ ID NO:1的47-69)
Mk6P4-CCL5 c2YgjKV3(SEQ ID NO:42,图24):6P4-CCL5趋化因子的直至β-链2的N-末端(SEQ ID NO:1的1-45),c2YgjK支架蛋白(SEQ ID NO:37),6P4-CCL5趋化因子从β-链3直至末尾的的C-末端部分(SEQ ID NO:1的47-69)
实施例9.从***6P4-CCL5-趋化因子的连接β-链β2-β3的β-转角中的c1YgjK和c2YgjK支架构建的94kDa融合蛋白的酵母展示。
为了证明这五个Mk6P4-CCL5 c1YgjKV1-V3和Mk6P4-CCL5 c2YgjKV1/V3Megakine变体(SEQ IDNO:38-42)可以表达为折叠良好和功能性的蛋白质,我们按照对Mk6P4-CCL5 c7HopQV1-V4Megakine变体进行的(实施例2),在酵母表面展示了这些蛋白质(Boder,1997)。通过使用与功能性6P4-CCL5趋化因子结合的荧光偶联单克隆抗体(来自Biolegend的Alexa647抗人RANTES(CCL5)抗体,参考号515506;抗CCL5-mAb647)检查6P4-CCL5趋化因子部分的正确折叠。为了在酵母上展示Mk6P4-CCL5 c1YgjKV1-V3和Mk6P4-CCL5 c2YgjKV1/V3 Megakine变体,我们使用标准方法构建了开放阅读框,其编码与用于酵母展示的各种辅助肽和蛋白质融合的Megakine(SEQ ID NO:43-47):指导在酵母中胞外分泌的appS4前导序列(Rakestraw,2009),Mk6P4-CCL5 c1YgjK或Mk6P4-CCL5 c2YgjKMegakine变体,柔性肽接头,Aga2p(酵母凝集素蛋白Aga2p的粘附亚基,它通过与Aga1p的二硫键连接到酵母细胞壁蛋白),酰基载体蛋白(用于展示的融合蛋白的正交荧光染色(Johnsson,2005)),然后是cMyc标签。这个开放阅读框在半乳糖诱导型GAL1/10启动子的转录控制下放入pCTCON2载体中(Chao,2006)并引入酵母菌株EBY100中。
将携带这个质粒的EBY100酵母细胞在富含半乳糖的培养基中生长和诱导过夜,以触发Mk6P4-CCL5 c1/2YgjK-Aga2p-ACP融合体的表达和分泌。对于ACP的正交染色,细胞在荧光标记的CoA类似物(CoA-547,2μM)和催化量的SFP合酶(1μM)存在下孵育1小时。为了分析展示的Megakine的功能性,我们通过流式细胞术检测了其被Alexa647荧光标记的抗CCL5单克隆抗体(抗CCL5-mAb647)识别的能力。因此,诱导EBY100酵母细胞并与CoA547正交荧光染色,以监测Mk6P4-CCL5 c1/2YgjK-Aga2p-ACP融合体的显示。这些正交染色的酵母细胞随后在抗CCL5-mAb647(浓度为80ng/mL)存在下孵育1小时。在这些实验中,洗涤诱导的酵母细胞并进行流式细胞术以通过将CoA547荧光水平与展示MegaBody MbNb207 cHopQ-Aga2p-ACP融合体(SEQ ID NO:11,其中MegaBody类似于Megakine,但纳米抗体(Nb)替代了趋化因子与支架蛋白融合,本文中Nb207作为GFP特异性Nb)的酵母细胞进行比较来测量每个细胞的Megakine展示水平,并以相同方式正交染色。实际上,对于所有5种Mk6P4-CCL5 c1/2YgjK变体,Mk6P4-CCL5 c1/2YgjK-Aga2p-ACP融合体的定量展示水平大约为70%(图25)。
接着,通过检查647-荧光水平来分析抗CCL5-mAb647的结合,该水平应与酵母表面上的Mk6P4-CCL5 c1/2YgjK表达水平呈线性相关。二维流式细胞术分析证实了抗CCL5-mAb647(高647荧光水平)仅与具有显著Megakine展示水平(高CoA547荧光水平)的酵母细胞结合,最高的线性拟合为Mk6P4-CCL5 c2YgjKV1(SEQ ID NO:46)和Mk6P4-CCL5 c2YgjKV3(SEQ ID NO:47),可能是由于被抗CCL5-mAb647识别的表位的最佳可及性引起的。相比之下,抗CCL5-mAb647不与展示MegaBody MbNb207 cHopQ-Aga2p-ACP融合体(SEQ ID NO:11;作为阴性对照的GFP特异性Megabody)的并以相同方式染色的酵母细胞结合。
我们从这些实验得出结论,具有两种不同融合支架的所有五种Mk6P4-CCL5 c1YgjKV1-V3和Mk6P4-CCL5 c2YgjKV1/V3 Megakine变体(SEQ ID NO:38-42)都可以在酵母表面上表达为折叠良好的和功能性的嵌合蛋白。
实施例10:从***IL-1β白介素的连接β-链β6-β7的β-转角中的HopQ支架构建的58kDa融合蛋白的设计和产生。
在从嫁接到c7HopQ(实施例1至7)和c1YgjK/c2YgjK(实施例8和9)支架上的6P4-CCL5和CXCL12趋化因子成功设计了我们的第一个Megakine的基础上,我们还旨在开发其他Megakine设计,这些设计从连接到较大支架的另一类细胞因子(特别是白介素)构建。
此处描述的58kDa Megakine是一种嵌合多肽,根据图27,由白介素的部分和支架蛋白的部分连接而成。在此,使用的白介素是IL-1β(SEQ NO:48),属于通过I型IL-1受体(IL-1RI)和IL-1受体辅助蛋白(IL-1RAcP)发挥其作用的白介素亚家族(PDB 3O4O,Wang等,2010)。在功能性IL-1β·IL-1RI·IL-1RAcP复合物中,连接IL-1β的β-链β6和β-链β7的β-转角是暴露于溶剂的,并且因此,对于支架蛋白融合是可及的(图28)。支架蛋白是用于产生基于6P4-CCL5趋化因子的Megakine的c7HopQ支架(实施例1至6)。为了设计功能性MkIL-1βc7HopQ Megakine融合蛋白变体,进行了使用可及晶体结构(PDB代码IL-1β:3O4O,PDB代码HopQ:5LP2)的计算机分子建模。作为结果,产生了三个MkIL-1β c7HopQ模型,其中所有部分通过肽键以以下给出的顺序从氨基(N-)至羧基(C-)末端彼此连接:
MkIL-1β c7HopQ V1(SEQ ID NO:49,图29):人IL-1β白介素的直至β-链β6的N-末端(SEQID NO:48的1-73),Gly-Gly两个氨基酸接头,HopQ的C-末端部分(SEQ ID NO:2的残基193-411),HopQ的N-末端部分(SEQ ID NO:2的残基18-185),Gly-Gly两个氨基酸接头,人IL-1β白介素的从β-链β7起的C-末端(SEQ ID NO:48的78-153)
MkIL-1β c7HopQ V2(SEQ ID NO:50,图30):人IL-1β白介素的直至β-链β6的N-末端(SEQID NO:48的1-73),Gly一个氨基酸接头,HopQ的C-末端部分(SEQ ID NO:2的残基193-411),HopQ的N-末端部分(SEQ ID NO:2的残基18-185),Gly一个氨基酸接头,人IL-1β白介素的从β-链β7起的C-末端(SEQ ID NO:48的78-153)
MkIL-1β c7HopQ V3(SEQ ID NO:51,图31):人IL-1β白介素的直至β-链β6的N-末端(SEQID NO:48的1-73),HopQ的C-末端部分(SEQ ID NO:2的残基193-411),HopQ的N-末端部分(SEQ ID NO:2的残基18-185),人IL-1β白介素的从β-链β7起的C-末端(SEQ ID NO:48的78-153)
实施例11.从***IL-1β白介素的连接β-链β6-β7的β-转角中的HopQ支架构建的58kDa融合蛋白的酵母展示。
为了证明这三个MkIL-1β c7HopQ Megakine变体(SEQ ID NO:49-51)可以表达为折叠良好和功能性的蛋白质,按照对Mk6P4-CCL5 c7HopQ Megakine变体(实施例2)和Mk6P4-CCL5 cYgjkA/BMegakine变体(实施例9)进行的,需要这些蛋白质的酵母表面展示(Boder,1997)。通过使用与功能性IL-1β结合的荧光偶联单克隆抗体(来自Life Technologies的Alexa647抗人IL-1β抗体(CRM46),参考号51-7018-42)检查IL-1β白介素部分的正确折叠。为了在酵母上展示MkIL-1β c7HopQ V1-V3 Megakine变体,我们使用标准方法构建了开放阅读框,其编码与若干辅助肽和蛋白质融合的Megakine(SEQ ID NO:52-54):指导在酵母中胞外分泌的appS4前导序列(Rakestraw,2009),MkIL-1β c7HopQ Megakine变体,柔性肽接头,Aga2p(酵母凝集素蛋白Aga2p的粘附亚基,它通过与Aga1p的二硫键连接到酵母细胞壁蛋白),酰基载体蛋白(用于展示的融合蛋白的正交荧光染色(Johnsson,2005)),然后是cMyc标签。这个开放阅读框在半乳糖诱导型GAL1/10启动子的转录控制下放入pCTCON2载体中(Chao,2006)并引入酵母菌株EBY100中。将携带这个质粒的EBY100酵母细胞在富含半乳糖的培养基中生长和诱导过夜,以触发MkIL-1β c7HopQ-Aga2p-ACP融合体的表达和分泌。对于ACP的正交染色,如之前实施例中所示的,细胞在荧光标记的CoA类似物(CoA-547,2μM)和催化量的SFP合酶(1μM)存在下孵育1小时。为了分析展示的Megakine的功能性,我们通过流式细胞术监测其被Alexa647荧光标记的IL-1β单克隆抗体(抗人IL-1β抗体CRM46)识别的能力。因此,诱导EBY100酵母细胞并与CoA547正交荧光染色,以监测MkIL-1β c7HopQ-Aga2p-ACP融合体的展示。展示IL-1β白介素(SEQ ID NO:55)的酵母细胞形成了另外的阳性对照。这些正交染色的酵母细胞随后在抗人IL-1β抗体CRM46(浓度为80ng/mL)存在下孵育1小时。在这些实验中,洗涤诱导的酵母细胞并进行流式细胞术以通过将CoA547荧光水平与展示MegaBody MbNb207 cHopQ-Aga2p-ACP融合体(SEQ ID NO:11,其中MegaBody类似于Megakine,但纳米抗体(Nb)替代了白介素与支架蛋白融合,本文中Nb207作为GFP特异性Nb)并以相同方式正交染色的酵母细胞进行比较来测量每个细胞的Megakine展示水平。接着,通过检查647-荧光水平来分析抗人IL-1β抗体CRM46的结合,该水平应与酵母表面上的MkIL-1β c7HopQ变体表达水平呈线性相关。二维流式细胞术分析证实了抗人IL-1β抗体CRM46(高647荧光水平)仅与具有显著Megakine展示水平(高CoA547荧光水平)的酵母细胞结合。相比之下,抗人IL-1β抗体CRM46不与展示MegaBody MbNb207 cHopQ-Aga2p-ACP融合体(SEQ ID NO:11)的并以相同方式染色的酵母细胞结合。
参考文献
Bliven,S.,Prlic,A.(2012).Circular permutation in proteins.PLOSComput.Biol.8(3):e1002445.
Boder,E.T.,和Wittrup,K.D.(1997).Yeast surface display for screeningcombinatorial polypeptide libraries.Nat Biotechnol 15,553-557.
Chao,G.,Lau,W.L.,Hackel,B.J.,Sazinsky,S.L.,Lippow,S.M.,和Wittrup,K.D.(2006).Isolating and engineering human antibodies using yeast surfacedisplay.Nat Protoc 1,755-768.
Dixon AS等,2016.NanoLuc Complementation Reporter Optimized forAccurate Measurement of Protein Interactions in Cells.ACS Chem Biol,11(2):400-8
Gustavsson M.等,2017.Structural basis of ligand interaction withatypical chemokine receptor 3.Nature Comm.8:14135.
Javaheri,A.,Kruse,T.,Moonens,K.,Mejías-Luque,R.,Debraekeleer,A.,Asche,C.I.,Tegtmeyer,N.,Kalali,B.,Bach,N.C.,Sieber,S.A.,Hill,D.J.,V.,Hauck,C.R.,Moskalenko,R.,Haas,R.,Busch,D.H.,Klaile,E.,Slevogt,H.,Schmidt,A.,Backert,S.,Remaut,H.,Singer,B.B.和Gerhard,M.(2016).Helicobacter pyloriadhesin HopQ engages in a virulence-enhancing interaction with humanCEACAMs.Nature Microbiology 2,16189.
Johnsson,N.,George,N.和Johnsson,K.(2005).Protein chemistry on thesurface of living cells.Chembiochem:a European journal of chemical biology 6,47-52.King I.C.,Gleixner,J.,Doyle,L.,Kuzin,A.,Hunt,J.F.,Xiao,R.,Montelione,G.T.,Stoddard,B.L.,DiMaio,F.和Baker,D.(2015).Precise assembly of complex betasheet topologies from de novo designed building blocks.eLife 4:e11012.doi:10.7554/eLife.11012.
Koide,S.(2009).Engineering of recombinant crystallizationchaperones.Curr Opin Struct Biol 19(4):449-457.
Kufareva I.等,2015.Chemokine and chemokine receptor structure andinteractions:implications for therapeutic strategies.Immunol Cell Biol.93(4):372–383.
Kurakata,Y.Uechi,A.Yoshida,H.Kamitori,S.Sakano,Y.Nishikawa,A.Tonozuka,T.(2008).Structural Insights into the Substrate Specificity andFunction of Escherichia coli K12 YgjK,a Glucosidase Belonging to theGlycoside Hydrolase Family 63.J.Mol.Biol.381,116–128.
Manglik,A.,Kobilka,B.K.和Steyaert,J.(2017).Nanobodies to StudyGProtein-Coupled Receptor Structure and Function.Annu Rev PharmacolToxicol.57:19-37.
Martin AC.(2000).The ups and downs of protein topology;rapidcomparison of protein structure.Protein Eng.13(12):829-37.
Nogales,E.(2016).The development of cryo-EM into a mainstreamstructural biology technique.Nature Methods 13,24-27.
Orengo等(1994).Protein superfamilies and domain superfolds.Nature.15;372(6507):631-4.
Pardon,E.,Laeremans,T.,Triest,S.,Rasmussen,S.G.,Wohlkonig,A.,Ruf,A.,Muyldermans,S.,Hol,
W.G.,Kobilka,B.K.和Steyaert,J.(2014).Ageneral protocol for thegeneration of Nanobodies for structural biology.Nature Protocols.9:674-693.
Proudfoot A.E.I.等,2015.Targeting chemokines:Pathogens can,why can’twe?Cytokine 74(2015)259–267
Rakestraw J,Sazinsky S,Piatesi A,Antipov E,Wittrup K.(2009).Directedevolution of a secretory leader for the improved expression of heterologousproteins and full-length antibodies in Saccharomyces cerevisiae.Biotechnol.Bioeng.103,1192–1201.
Ramesh,G.等,Cytokines and Chemokines at the crossroads ofneuroinflammation,neurodegeneration,and neuropathic pain.Hinawi PublishingGroup,Mediators of Inflammation ID480739,(2013)
Wan,Q.等,(2018)Mini G protein probes for active G protein-coupledreceptors(GPCRs)in live cells.J Biol Chem 293,7466-7473.
Wang,D.Zhang,S.Li,L.Liu,X.Mei,K.Wang,X.(2010).Structural insightsinto the assembly and activation of IL-1βwith its receptors.NatureImmunology,11,905–911.
Zheng等,(2017)Structure of CC Chemokine Receptor 5 with a PotentChemokine Antagonist Reveals Mechanisms of Chemokine Recognition andMolecular Mimicry by HIV.Immunity,46:1005-1017.
Claims (18)
1.一种功能性融合蛋白,其包含与支架蛋白融合的细胞因子,其中所述支架蛋白是至少50个氨基酸的折叠蛋白质,其通过至少两个或更多个直接融合或由接头形成的融合在所述细胞因子的含β-链结构域的暴露β-转角中的一个或多个可及位点打断细胞因子的拓扑结构。
2.根据权利要求1的功能性融合蛋白,其中细胞因子是趋化因子和其中所述支架蛋白在所述核心结构域的暴露β-转角中的一个或多个可及位点打断趋化因子核心结构域的拓扑结构。
3.权利要求2的功能性融合蛋白,其中所述趋化因子核心结构域包含N-末端环,包含3条β-链的β-折叠和C-末端螺旋,和其中所述支架蛋白***连接所述趋化因子核心结构域的β-链β2和β-链β3的暴露β-转角中。
4.权利要求1的功能性融合蛋白,其中所述细胞因子是白介素并且其中所述支架蛋白在所述β-桶核心基序的暴露β-转角中的一个或多个可及位点打断白介素β-桶核心基序的拓扑结构。
5.权利要求4的功能性融合蛋白,其中所述白介素是IL-1家族白介素。
6.权利要求1至5任一项的功能性融合蛋白,其中所述支架蛋白是环状排列的蛋白质。
7.权利要求1至6任一项的功能性融合蛋白,其中支架蛋白具有至少30kDa的总分子量。
8.一种编码权利要求1至7任一项的融合蛋白的核酸分子。
9.一种包含权利要求8的核酸分子的载体。
10.根据权利要求9的载体,用于在大肠杆菌中的表达,用于在酵母、噬菌体、细菌或病毒中的表面展示。
11.一种宿主细胞,包含权利要求1至7任一项的融合蛋白。
12.根据权利要求11的宿主细胞,其中所述融合蛋白和细胞因子受体是共同表达的。
13.一种复合物,包含
(i)权利要求1至7任一项的融合蛋白,和
(ii)受体蛋白,
其中所述受体蛋白结合所述融合蛋白的细胞因子。
14.根据权利要求13的复合物,其中受体在结合融合蛋白时被激活。
15.一种用于确定配体/受体复合物的三维结构的方法,包括步骤:
(i)提供权利要求1至7任一项的融合蛋白和受体,以形成复合物,其中所述受体蛋白结合融合蛋白的细胞因子部分,或提供根据权利要求13或14的复合物;
(ii)在合适的条件下展示所述复合物,用于结构分析,
其中以高分辨率确定所述配体/受体复合物的3D结构。
16.权利要求1至7的融合蛋白、权利要求8的核酸分子、权利要求9或10的载体、权利要求11或12的宿主细胞、权利要求13或14的复合物用于细胞因子/受体复合物的结构分析的用途。
17.根据权利要求16的融合蛋白的用途,其中所述结构分析包括单颗粒冷冻电镜或晶体学。
18.一种用于生产根据权利要求3的融合蛋白的方法,包括步骤:
(i)选择趋化因子和支架蛋白,所述支架蛋白具有用于打断趋化因子蛋白序列而没有打断趋化因子核心结构域拓扑结构的可及β-转角;
(ii)设计遗传融合构建体来编码:
a)在核心结构域的β-链β2和β-链β3之间打断的趋化因子的蛋白质序列,
b)支架蛋白的N-和C-末端融合以获得环状排列的支架蛋白,
c)b)的环状排列支架蛋白在其氨基酸序列中的可及位点被打断,所述可及位点如环或转角,不同于原始N-或C-末端,
d)与环状排列支架蛋白的最N-末端打断的位点的氨基酸融合的β-链β2的趋化因子C-末端的打断位点的氨基酸,以及与环状排列支架蛋白的打断位点的最C-末端氨基酸融合的β-链β3的趋化因子N-末端的打断位点的氨基酸;
(iii)将所述遗传融合构建体引入表达***中,以获得融合蛋白,其中所述趋化因子在其核心结构域的两个位点与环状排列支架蛋白融合。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP18215463.3 | 2018-12-21 | ||
EP18215463 | 2018-12-21 | ||
PCT/EP2019/086696 WO2020127983A1 (en) | 2018-12-21 | 2019-12-20 | Fusion proteins comprising a cytokine and scaffold protein |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113811542A true CN113811542A (zh) | 2021-12-17 |
Family
ID=65030869
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980092808.8A Pending CN113811542A (zh) | 2018-12-21 | 2019-12-20 | 包含细胞因子和支架蛋白的融合蛋白 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20220064245A1 (zh) |
EP (1) | EP3898664A1 (zh) |
JP (1) | JP2022515150A (zh) |
CN (1) | CN113811542A (zh) |
CA (1) | CA3122045A1 (zh) |
WO (1) | WO2020127983A1 (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002095652A1 (en) * | 2001-05-18 | 2002-11-28 | Smithkline Beecham Corporation | Crystallized human xenobiotic nuclear receptor pxr/sxr ligand binding domain polypeptide and screening methods employing same |
CN1826527A (zh) * | 2003-05-23 | 2006-08-30 | 洛桑生态综合技术联合公司 | 基于酰基载体蛋白的蛋白标记方法 |
CN101622274A (zh) * | 2006-12-12 | 2010-01-06 | 比奥雷克西斯药物公司 | 转铁蛋白融合蛋白库 |
TW201323446A (zh) * | 2011-12-06 | 2013-06-16 | Shiow-Her Chiou | 趨化素-細胞素融合蛋白和其應用 |
CN104053667A (zh) * | 2011-06-21 | 2014-09-17 | 非营利性组织佛兰芒综合大学生物技术研究所 | 针对gpcr:g蛋白复合物的结合结构域及来自其的用途 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DD266710A3 (de) | 1983-06-06 | 1989-04-12 | Ve Forschungszentrum Biotechnologie | Verfahren zur biotechnischen Herstellung van alkalischer Phosphatase |
AT504685B1 (de) * | 2006-12-20 | 2009-01-15 | Protaffin Biotechnologie Ag | Fusionsproteine |
PL2310509T3 (pl) * | 2008-07-21 | 2015-08-31 | Apogenix Ag | Jednołańcuchowe cząsteczki TNFSF |
GB201008682D0 (en) | 2010-05-25 | 2010-07-07 | Vib Vzw | Epitope tag for affinity based applications |
WO2014183649A1 (zh) * | 2013-05-14 | 2014-11-20 | 上海亨臻实业有限公司 | 针对低免疫原性蛋白的表位疫苗及其制法和用途 |
WO2019086548A1 (en) * | 2017-10-31 | 2019-05-09 | Vib Vzw | Novel antigen-binding chimeric proteins and methods and uses thereof |
-
2019
- 2019-12-20 US US17/415,355 patent/US20220064245A1/en active Pending
- 2019-12-20 WO PCT/EP2019/086696 patent/WO2020127983A1/en unknown
- 2019-12-20 CA CA3122045A patent/CA3122045A1/en active Pending
- 2019-12-20 CN CN201980092808.8A patent/CN113811542A/zh active Pending
- 2019-12-20 JP JP2021535663A patent/JP2022515150A/ja active Pending
- 2019-12-20 EP EP19832112.7A patent/EP3898664A1/en active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002095652A1 (en) * | 2001-05-18 | 2002-11-28 | Smithkline Beecham Corporation | Crystallized human xenobiotic nuclear receptor pxr/sxr ligand binding domain polypeptide and screening methods employing same |
CN1826527A (zh) * | 2003-05-23 | 2006-08-30 | 洛桑生态综合技术联合公司 | 基于酰基载体蛋白的蛋白标记方法 |
CN101622274A (zh) * | 2006-12-12 | 2010-01-06 | 比奥雷克西斯药物公司 | 转铁蛋白融合蛋白库 |
CN104053667A (zh) * | 2011-06-21 | 2014-09-17 | 非营利性组织佛兰芒综合大学生物技术研究所 | 针对gpcr:g蛋白复合物的结合结构域及来自其的用途 |
CN107857810A (zh) * | 2011-06-21 | 2018-03-30 | 非营利性组织佛兰芒综合大学生物技术研究所 | 针对gpcr:g蛋白复合物的结合结构域及来自其的用途 |
TW201323446A (zh) * | 2011-12-06 | 2013-06-16 | Shiow-Her Chiou | 趨化素-細胞素融合蛋白和其應用 |
Also Published As
Publication number | Publication date |
---|---|
CA3122045A1 (en) | 2020-06-25 |
WO2020127983A1 (en) | 2020-06-25 |
JP2022515150A (ja) | 2022-02-17 |
EP3898664A1 (en) | 2021-10-27 |
US20220064245A1 (en) | 2022-03-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102142385B1 (ko) | 대체 결합 표면을 가진 피브로넥틴 유형 iii 반복체 기반의 단백질 스캐폴드 | |
CN111315784A (zh) | 新的抗原结合嵌合蛋白及其方法和用途 | |
US20180194819A1 (en) | Novel binding proteins based on di-ubiquitin muteins and methods for generation | |
JP2009509535A (ja) | タンパク様薬剤およびその使用 | |
KR20120110171A (ko) | 리간드 결합능력을 가진 헤테로-다량체 변형 유비퀴틴 단백질을 확인하는 방법 | |
WO2011043834A1 (en) | Combinatorial libraries based on c-type lectin domain | |
JP2009501517A (ja) | Il−6結合タンパク質 | |
CN113811542A (zh) | 包含细胞因子和支架蛋白的融合蛋白 | |
JP2019163270A (ja) | 親和性タンパク質及びその使用 | |
Dower | Targeting growth factor and cytokine receptors with recombinant peptide libraries | |
AU2017226955B2 (en) | Polypeptide library | |
US20220073574A1 (en) | Fusion protein with a toxin and scaffold protein | |
US20090203541A1 (en) | Msp and its domains as frameworks for novel binding molecules | |
EP3325515B1 (en) | Novel binding proteins based on di-ubiquitin muteins and methods for generation | |
CA3224586A1 (en) | Human fibronectin type iii protein scaffolds | |
WO2011132938A2 (ko) | Gpcr에 특이적으로 결합하는 gpcr-bpb | |
WO2008024128A2 (en) | Loop-variant pdz domains as biotherapeutics, diagnostics and research reagents | |
KR20110116930A (ko) | 이온채널에 특이적으로 결합하는 이온채널―bpb | |
Overstreet | Protein engineering by Bordetella bronchiseptica bacteriophage | |
WO2011132939A2 (ko) | Rtk에 특이적으로 결합하는 rtk-bpb |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |