CN114480534B - 基于转肽酶的化学酶法的蛋白质半合成 - Google Patents
基于转肽酶的化学酶法的蛋白质半合成 Download PDFInfo
- Publication number
- CN114480534B CN114480534B CN202210184235.5A CN202210184235A CN114480534B CN 114480534 B CN114480534 B CN 114480534B CN 202210184235 A CN202210184235 A CN 202210184235A CN 114480534 B CN114480534 B CN 114480534B
- Authority
- CN
- China
- Prior art keywords
- polypeptide
- protein
- amino acid
- threonine
- modification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 152
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 152
- 238000000034 method Methods 0.000 title claims abstract description 61
- 108090000279 Peptidyltransferases Proteins 0.000 title claims abstract description 46
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 248
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 204
- 229920001184 polypeptide Polymers 0.000 claims abstract description 195
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Natural products NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 claims abstract description 73
- 150000001413 amino acids Chemical class 0.000 claims abstract description 63
- 230000004048 modification Effects 0.000 claims abstract description 41
- 238000012986 modification Methods 0.000 claims abstract description 41
- 239000004471 Glycine Substances 0.000 claims abstract description 37
- 108090000250 sortase A Proteins 0.000 claims abstract description 18
- 150000001875 compounds Chemical class 0.000 claims abstract description 15
- 125000003396 thiol group Chemical group [H]S* 0.000 claims abstract description 14
- 125000001433 C-terminal amino-acid group Chemical group 0.000 claims abstract description 13
- 210000004899 c-terminal region Anatomy 0.000 claims abstract description 13
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 claims abstract description 6
- 230000009471 action Effects 0.000 claims abstract description 4
- 108010075254 C-Peptide Proteins 0.000 claims abstract description 3
- 235000018102 proteins Nutrition 0.000 claims description 148
- 238000006243 chemical reaction Methods 0.000 claims description 77
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 claims description 44
- 239000004473 Threonine Substances 0.000 claims description 44
- 235000001014 amino acid Nutrition 0.000 claims description 44
- 229960002898 threonine Drugs 0.000 claims description 44
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 claims description 42
- 229940024606 amino acid Drugs 0.000 claims description 42
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 claims description 38
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 claims description 38
- 229960003136 leucine Drugs 0.000 claims description 38
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 claims description 37
- 229960002429 proline Drugs 0.000 claims description 37
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 claims description 31
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 claims description 30
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 claims description 30
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 claims description 29
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 claims description 29
- 229960001153 serine Drugs 0.000 claims description 29
- 235000004400 serine Nutrition 0.000 claims description 29
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 claims description 28
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 claims description 28
- 235000004279 alanine Nutrition 0.000 claims description 28
- 229960002433 cysteine Drugs 0.000 claims description 28
- 235000018417 cysteine Nutrition 0.000 claims description 28
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 claims description 28
- 229960005190 phenylalanine Drugs 0.000 claims description 28
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 claims description 28
- 229960004441 tyrosine Drugs 0.000 claims description 28
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 claims description 28
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 claims description 26
- 229960003767 alanine Drugs 0.000 claims description 26
- 239000004475 Arginine Substances 0.000 claims description 22
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 claims description 22
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 claims description 22
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 claims description 22
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims description 22
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 claims description 22
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 claims description 22
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 claims description 22
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 claims description 22
- 239000004472 Lysine Substances 0.000 claims description 22
- 229960003121 arginine Drugs 0.000 claims description 22
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 claims description 22
- 229960001230 asparagine Drugs 0.000 claims description 22
- 235000009582 asparagine Nutrition 0.000 claims description 22
- 229960005261 aspartic acid Drugs 0.000 claims description 22
- 235000003704 aspartic acid Nutrition 0.000 claims description 22
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 claims description 22
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 claims description 22
- 229960002885 histidine Drugs 0.000 claims description 22
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 claims description 22
- 229960000310 isoleucine Drugs 0.000 claims description 22
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 claims description 22
- 235000018977 lysine Nutrition 0.000 claims description 22
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 claims description 21
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 claims description 21
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 claims description 21
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 claims description 21
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 claims description 21
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 claims description 21
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 claims description 21
- 235000013922 glutamic acid Nutrition 0.000 claims description 21
- 239000004220 glutamic acid Substances 0.000 claims description 21
- 229930182817 methionine Natural products 0.000 claims description 21
- 229960004295 valine Drugs 0.000 claims description 21
- 239000004474 valine Substances 0.000 claims description 21
- PZBFGYYEXUXCOF-UHFFFAOYSA-N TCEP Chemical compound OC(=O)CCP(CCC(O)=O)CCC(O)=O PZBFGYYEXUXCOF-UHFFFAOYSA-N 0.000 claims description 20
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 claims description 19
- LRQKBLKVPFOOQJ-YFKPBYRVSA-N L-norleucine Chemical compound CCCC[C@H]([NH3+])C([O-])=O LRQKBLKVPFOOQJ-YFKPBYRVSA-N 0.000 claims description 18
- MKIJJIMOAABWGF-UHFFFAOYSA-N methyl 2-sulfanylacetate Chemical compound COC(=O)CS MKIJJIMOAABWGF-UHFFFAOYSA-N 0.000 claims description 18
- 239000011780 sodium chloride Substances 0.000 claims description 15
- 238000006467 substitution reaction Methods 0.000 claims description 12
- 238000002156 mixing Methods 0.000 claims description 9
- 230000026731 phosphorylation Effects 0.000 claims description 8
- 238000006366 phosphorylation reaction Methods 0.000 claims description 8
- 238000000746 purification Methods 0.000 claims description 7
- 230000004481 post-translational protein modification Effects 0.000 claims description 6
- 229940071127 thioglycolate Drugs 0.000 claims description 6
- ORXSLDYRYTVAPC-UHFFFAOYSA-N 2-(4-sulfanylphenyl)acetic acid Chemical compound OC(=O)CC1=CC=C(S)C=C1 ORXSLDYRYTVAPC-UHFFFAOYSA-N 0.000 claims description 5
- 230000017730 intein-mediated protein splicing Effects 0.000 claims description 5
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 claims description 4
- 239000003638 chemical reducing agent Substances 0.000 claims description 4
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 claims description 4
- 229920001223 polyethylene glycol Polymers 0.000 claims description 4
- 239000003381 stabilizer Substances 0.000 claims description 4
- 239000002202 Polyethylene glycol Substances 0.000 claims description 3
- BNLLHLUAOXAUNQ-UHFFFAOYSA-N n-methylethanethioamide Chemical compound CNC(C)=S BNLLHLUAOXAUNQ-UHFFFAOYSA-N 0.000 claims description 3
- GNBVPFITFYNRCN-UHFFFAOYSA-M sodium thioglycolate Chemical compound [Na+].[O-]C(=O)CS GNBVPFITFYNRCN-UHFFFAOYSA-M 0.000 claims description 3
- YICAEXQYKBMDNH-UHFFFAOYSA-N 3-[bis(3-hydroxypropyl)phosphanyl]propan-1-ol Chemical compound OCCCP(CCCO)CCCO YICAEXQYKBMDNH-UHFFFAOYSA-N 0.000 claims description 2
- DKIDEFUBRARXTE-UHFFFAOYSA-N 3-mercaptopropanoic acid Chemical compound OC(=O)CCS DKIDEFUBRARXTE-UHFFFAOYSA-N 0.000 claims description 2
- 230000021736 acetylation Effects 0.000 claims description 2
- 238000006640 acetylation reaction Methods 0.000 claims description 2
- 125000002355 alkine group Chemical group 0.000 claims description 2
- IVRMZWNICZWHMI-UHFFFAOYSA-N azide group Chemical group [N-]=[N+]=[N-] IVRMZWNICZWHMI-UHFFFAOYSA-N 0.000 claims description 2
- LBCGPWDWIQGOCW-UHFFFAOYSA-N borane phenylphosphane Chemical compound B.Pc1ccccc1 LBCGPWDWIQGOCW-UHFFFAOYSA-N 0.000 claims description 2
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 claims description 2
- LDTLDBDUBGAEDT-UHFFFAOYSA-N methyl 3-sulfanylpropanoate Chemical compound COC(=O)CCS LDTLDBDUBGAEDT-UHFFFAOYSA-N 0.000 claims description 2
- 230000011987 methylation Effects 0.000 claims description 2
- 238000007069 methylation reaction Methods 0.000 claims description 2
- 239000001103 potassium chloride Substances 0.000 claims description 2
- 235000011164 potassium chloride Nutrition 0.000 claims description 2
- 230000008569 process Effects 0.000 claims description 2
- CWERGRDVMFNCDR-UHFFFAOYSA-N thioglycolic acid Chemical compound OC(=O)CS CWERGRDVMFNCDR-UHFFFAOYSA-N 0.000 claims description 2
- 238000005809 transesterification reaction Methods 0.000 claims description 2
- 230000034512 ubiquitination Effects 0.000 claims description 2
- 238000010798 ubiquitination Methods 0.000 claims description 2
- LRNNYBXLESRLOS-UHFFFAOYSA-N boron;diphenylphosphane Chemical compound [B].C=1C=CC=CC=1PC1=CC=CC=C1 LRNNYBXLESRLOS-UHFFFAOYSA-N 0.000 claims 1
- 230000015572 biosynthetic process Effects 0.000 abstract description 18
- 238000003786 synthesis reaction Methods 0.000 abstract description 18
- 230000002427 irreversible effect Effects 0.000 abstract description 13
- 108090000790 Enzymes Proteins 0.000 abstract description 10
- 102000004190 Enzymes Human genes 0.000 abstract description 10
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 abstract description 4
- 239000000126 substance Substances 0.000 abstract description 4
- 239000012634 fragment Substances 0.000 description 38
- 150000007970 thio esters Chemical group 0.000 description 32
- 229960002449 glycine Drugs 0.000 description 29
- 239000000243 solution Substances 0.000 description 28
- PECYZEOJVXMISF-UHFFFAOYSA-N 3-aminoalanine Chemical compound [NH3+]CC(N)C([O-])=O PECYZEOJVXMISF-UHFFFAOYSA-N 0.000 description 26
- 238000002360 preparation method Methods 0.000 description 22
- 238000004237 preparative chromatography Methods 0.000 description 21
- LPXPTNMVRIOKMN-UHFFFAOYSA-M sodium nitrite Chemical compound [Na+].[O-]N=O LPXPTNMVRIOKMN-UHFFFAOYSA-M 0.000 description 20
- 230000002255 enzymatic effect Effects 0.000 description 18
- 229960002743 glutamine Drugs 0.000 description 15
- 229960003646 lysine Drugs 0.000 description 15
- 238000004108 freeze drying Methods 0.000 description 14
- 229960002989 glutamic acid Drugs 0.000 description 14
- 229960004452 methionine Drugs 0.000 description 14
- 239000007790 solid phase Substances 0.000 description 14
- 229960004799 tryptophan Drugs 0.000 description 14
- 239000000337 buffer salt Substances 0.000 description 13
- AHLPHDHHMVZTML-BYPYZUCNSA-N L-Ornithine Chemical compound NCCC[C@H](N)C(O)=O AHLPHDHHMVZTML-BYPYZUCNSA-N 0.000 description 12
- AHLPHDHHMVZTML-UHFFFAOYSA-N Orn-delta-NH2 Natural products NCCCC(N)C(O)=O AHLPHDHHMVZTML-UHFFFAOYSA-N 0.000 description 12
- UTJLXEIPEHZYQJ-UHFFFAOYSA-N Ornithine Natural products OC(=O)C(C)CCCN UTJLXEIPEHZYQJ-UHFFFAOYSA-N 0.000 description 12
- 230000001404 mediated effect Effects 0.000 description 12
- 229960003104 ornithine Drugs 0.000 description 12
- UJOYFRCOTPUKAK-MRVPVSSYSA-N (R)-3-ammonio-3-phenylpropanoate Chemical compound OC(=O)C[C@@H](N)C1=CC=CC=C1 UJOYFRCOTPUKAK-MRVPVSSYSA-N 0.000 description 11
- FZTIWOBQQYPTCJ-UHFFFAOYSA-N 4-[4-(4-carboxyphenyl)phenyl]benzoic acid Chemical compound C1=CC(C(=O)O)=CC=C1C1=CC=C(C=2C=CC(=CC=2)C(O)=O)C=C1 FZTIWOBQQYPTCJ-UHFFFAOYSA-N 0.000 description 10
- 235000010288 sodium nitrite Nutrition 0.000 description 10
- 230000000694 effects Effects 0.000 description 9
- 238000002474 experimental method Methods 0.000 description 9
- 239000000843 powder Substances 0.000 description 9
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 8
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 8
- DBLXOVFQHHSKRC-UHFFFAOYSA-N ethanesulfonic acid;2-piperazin-1-ylethanol Chemical compound CCS(O)(=O)=O.OCCN1CCNCC1 DBLXOVFQHHSKRC-UHFFFAOYSA-N 0.000 description 8
- 239000012460 protein solution Substances 0.000 description 8
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 8
- 230000000052 comparative effect Effects 0.000 description 7
- 239000002994 raw material Substances 0.000 description 7
- OAKJQQAXSVQMHS-UHFFFAOYSA-N Hydrazine Chemical compound NN OAKJQQAXSVQMHS-UHFFFAOYSA-N 0.000 description 6
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 6
- 238000012544 monitoring process Methods 0.000 description 6
- 238000005070 sampling Methods 0.000 description 6
- 239000000872 buffer Substances 0.000 description 5
- 229960000789 guanidine hydrochloride Drugs 0.000 description 5
- PJJJBBJSCAKJQF-UHFFFAOYSA-N guanidinium chloride Chemical compound [Cl-].NC(N)=[NH2+] PJJJBBJSCAKJQF-UHFFFAOYSA-N 0.000 description 5
- 229910000403 monosodium phosphate Inorganic materials 0.000 description 5
- 235000019799 monosodium phosphate Nutrition 0.000 description 5
- 230000002035 prolonged effect Effects 0.000 description 5
- 230000035484 reaction time Effects 0.000 description 5
- 230000002441 reversible effect Effects 0.000 description 5
- 238000000926 separation method Methods 0.000 description 5
- AJPJDKMHJJGVTQ-UHFFFAOYSA-M sodium dihydrogen phosphate Chemical compound [Na+].OP(O)([O-])=O AJPJDKMHJJGVTQ-UHFFFAOYSA-M 0.000 description 5
- 229960004635 mesna Drugs 0.000 description 4
- 238000007789 sealing Methods 0.000 description 4
- 102100034533 Histone H2AX Human genes 0.000 description 3
- 101710195517 Histone H2AX Proteins 0.000 description 3
- XOGTZOOQQBDUSI-UHFFFAOYSA-M Mesna Chemical compound [Na+].[O-]S(=O)(=O)CCS XOGTZOOQQBDUSI-UHFFFAOYSA-M 0.000 description 3
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 3
- 102000035118 modified proteins Human genes 0.000 description 3
- 108091005573 modified proteins Proteins 0.000 description 3
- 239000011347 resin Substances 0.000 description 3
- 229920005989 resin Polymers 0.000 description 3
- CWERGRDVMFNCDR-UHFFFAOYSA-M thioglycolate(1-) Chemical compound [O-]C(=O)CS CWERGRDVMFNCDR-UHFFFAOYSA-M 0.000 description 3
- 241000588724 Escherichia coli Species 0.000 description 2
- 108010033040 Histones Proteins 0.000 description 2
- 102000006947 Histones Human genes 0.000 description 2
- BIVUUOPIAYRCAP-UHFFFAOYSA-N aminoazanium;chloride Chemical compound Cl.NN BIVUUOPIAYRCAP-UHFFFAOYSA-N 0.000 description 2
- 238000006482 condensation reaction Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 239000004033 plastic Substances 0.000 description 2
- 229920003023 plastic Polymers 0.000 description 2
- 238000001243 protein synthesis Methods 0.000 description 2
- 238000010926 purge Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 229940046307 sodium thioglycolate Drugs 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 230000014616 translation Effects 0.000 description 2
- 108010002156 Depsipeptides Proteins 0.000 description 1
- -1 P4 is not leucine Chemical class 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 108090000251 Sortase B Proteins 0.000 description 1
- 108050000719 Sortase F Proteins 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- CXPMZQMROVUSQV-UHFFFAOYSA-N boranyl(diphenyl)phosphane Chemical compound C=1C=CC=CC=1P(B)C1=CC=CC=C1 CXPMZQMROVUSQV-UHFFFAOYSA-N 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 230000009920 chelation Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 235000019833 protease Nutrition 0.000 description 1
- 238000002818 protein evolution Methods 0.000 description 1
- 238000004366 reverse phase liquid chromatography Methods 0.000 description 1
- 108090000824 sortase C Proteins 0.000 description 1
- 108010056057 sortase D Proteins 0.000 description 1
- 108090000825 sortase E Proteins 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 150000003573 thiols Chemical class 0.000 description 1
- 125000000341 threoninyl group Chemical group [H]OC([H])(C([H])([H])[H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K7/00—Peptides having 5 to 20 amino acids in a fully defined sequence; Derivatives thereof
- C07K7/04—Linear peptides containing only normal peptide links
- C07K7/06—Linear peptides containing only normal peptide links having 5 to 11 amino acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Microbiology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biophysics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
本发明涉及一种基于转肽酶的化学酶法的蛋白质半合成方法,可以用于多肽和/或蛋白的修饰和合成。该方法包含:将第一多肽与第二多肽在转肽酶的作用下进行连接处理,以便获得连接肽,所述第一多肽的C末端与所述第二多肽的N末端连接;其中,所述第一多肽的C末端氨基酸的羧基与带有游离巯基的化合物通过硫酯键相连,且C末端的四个氨基酸不再局限为其固有识别序列(比如对于Sortase A,固有识别序列为L‑P‑x‑T),可以为固有识别序列的衍生序列;所述第二多肽的N末端为甘氨酸。该方法中转肽酶对第一多肽的C末端的四个氨基酸的依赖性低,可耐受多种的衍生序列,并且,该反应不可逆,可进一步提高蛋白样品的产率。
Description
技术领域
本发明属于多肽和/或蛋白质合成技术领域,具体涉及一种基于转肽酶的化学酶法的蛋白质半合成,更具体涉及一种连接多肽或蛋白的方法。
背景技术
带有功能性分子修饰(比如亲和标签、荧光基团、聚乙二醇(简称PEG)等)蛋白样品以及带有翻译后修饰蛋白样品的获取,对于蛋白相关的基础和应用研究具有极大的促进作用,例如带有亲和标签的蛋白能够用于蛋白富集和组学筛查,带有荧光基团的蛋白能够用于细胞成像及其抑制剂的筛选,带有翻译后修饰的蛋白能够用于研究蛋白的互作及其功能机制。
目前,由于化学酶法反应条件更加温和,连接效率更加高效,常用来获取修饰的蛋白样品,其中,转肽酶(又称转肽酶sortase)是目前实验室中常用的一种蛋白连接工具酶,其通过形成肽键连接两个多肽/蛋白片段,在蛋白的标记和合成方面都有丰富的应用案例。但是,转肽酶在蛋白合成过程中存在反应可逆、极度依赖识别序列的缺陷。
因此,转肽酶介导的多肽/蛋白连接方法有待改进或优化。
发明内容
本发明旨在改进转肽酶连接方法的局限,发展高效的转肽酶连接策略。为此,本发明将多肽/蛋白识别序列的C末端提前构建成硫酯结构,从而发展了一种高效的蛋白半合成方法。该方法中转肽酶对识别序列依赖性低,可识别多种序列,并且,该反应不可逆,可进一步提高蛋白样品的产率。
本发明是基于发明人的下列发现而完成的:
目前,蛋白的酶促合成方法中,转肽酶存在反应可逆(酶促反应的产率仅有50%)、极度依赖识别序列(例如sortase A酶依赖L-P-X-T-G序列,L为亮氨酸、P为脯氨酸、X表示任何氨基酸、T为苏氨酸、G为甘氨酸)的缺陷。
针对上述反应可逆的特点,前人发展了很多方法:1)将其中一个片段加入大过量,促使反应完全进行,但是对于难获取或者难溶解的样品,该方法并不适用;2)采用透析、螯合等方式除去离去基团,促使反应完全,但是,除去离去基团过程中需要花费大量时间,极大地增加时间成本;3)通过使产物形成特殊的二级结构来抑制逆向反应,但二级结构的引入可能会影响理化特性;4)使用缩肽作为底物来克服反应的可逆性,但该方法只能获取N端修饰的蛋白。
针对上述依赖识别序列的特点,研究者通过定向进化的方式来拓展能够识别不同序列的转肽酶的种类,但是,这些酶的种类和数量仍然有限。目前的方法都只克服了转肽酶酶促连接反应中的可逆性和识别序列依赖性中的某一方面的局限,尚无一种策略能同时克服这两种局限。
发明人经过大量实验,将蛋白左边的片段(第一多肽或第一蛋白)C末端氨基酸与带有游离巯基的化合物通过硫酯键相连,带有游离巯基的化合物可选自巯基乙酸甲酯(MTG)、巯基乙酸(TGA)、N-甲基-硫代乙酰胺(MMA)、巯基乙基磺酸钠(MESNa)或4-巯基苯基乙酸(MPAA)等。发明人惊喜地发现,在引入硫酯结构之后,不仅能够提升转肽酶反应的转化率,还能降低对识别序列的依赖性。因此,本发明中对转肽酶介导的连接方法进行改进,能够为修饰蛋白的合成带来更多的机遇。
基于此,在本发明的一个方面,本发明提出了一种连接多肽或蛋白的方法。根据本发明的实施例,所述方法包含:将第一多肽或第一蛋白与第二多肽或第二蛋白在转肽酶的作用下进行连接处理,以便获得连接肽(又称多肽)或蛋白,所述第一多肽或第一蛋白的C末端与所述第二多肽或第二蛋白的N末端连接;其中,所述第一多肽或第一蛋白的C末端氨基酸P1的羧基与带有游离巯基的化合物通过硫酯键相连;所述第二多肽或第二蛋白的N末端为甘氨酸。
发明人通过大量实验发现,将第一多肽或第一蛋白的C末端氨基酸P1的羧基与带有游离巯基的化合物通过硫酯键相连,也能够被转肽酶识别,并能被转肽酶介导与N末端为甘氨酸的第二多肽或第二蛋白进行连接反应。该方法中转肽酶对第一多肽或第一蛋白的C末端的四个氨基酸的识别序列依赖性低;并且,该反应不可逆,可使原料完全反应,进一步提高多肽的产率。
示例性地,sortase A酶能够耐受大量的L-P-x-T的衍生序列。需要说明的是,L-P-x-T的衍生序列是指,氨基酸序列为L-P-x-T中的L、P和T中的至少有一个氨基酸进行替换后得到的序列,其中,T位于P1位置。
此外,发明人可根据目标多肽和/或蛋白的氨基酸序列,选择P1-甘氨酸序列(即为L-P-x-T-G的衍生序列)为转肽酶的识别序列,该识别序列的位置为第一多肽和第二多肽、第一多肽和第二蛋白、第一蛋白和第二多肽或者第一蛋白和第二蛋白的连接位点,基于连接位点设计并制备第一多肽和第二多肽或者第一蛋白和第二蛋白,其中,第一多肽或第一蛋白的C末端为P1,第二多肽或第二蛋白的N末端为甘氨酸。转肽酶可识别第一多肽或第一蛋白C末端带有硫酯键的序列,并使第一多肽和第二多肽之间、第一蛋白和第二蛋白之间、第一多肽和第二蛋白或第一蛋白之间或第二多肽之间发生缩合反应,将第一多肽和第二多肽、第一蛋白和第二蛋白、第一多肽和第二蛋白或第一蛋白或第二多肽之间连接。上述方法中转肽酶对识别序列依赖性低,可识别多种序列,并且,该反应不可逆,可进一步提高连接肽样品(或称多肽样品)和/或蛋白样品的产率。
需要说明的是,“连接位点”与连接肽或蛋白的识别序列相同,例如识别序列为L-P-x-T-G的衍生序列。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明实施例1中基于MTG硫酯结构的短肽的酶连反应随时间变化的色谱图;
图2为本发明实施例2中基于MMA硫酯结构的短肽的酶连反应随时间变化的色谱图;
图3为本发明实施例3中基于TGA硫酯结构的短肽的酶连反应随时间变化的色谱图;
图4为本发明实施例4中基于MESNa硫酯结构的短肽的酶连反应随时间变化的色谱图;
图5为本发明实施例5中基于MPAA硫酯结构的短肽的酶连反应随时间变化的色谱图;
图6为本发明实施例6中识别序列单位点替换的短肽硫酯的酶连反应随时间变化的色谱图;
图7为本发明实施例7中识别序列双位点替换的短肽硫酯的酶连反应随时间变化的色谱图;
图8为本发明实施例8中基于硫酯结构的酶连反应获取天然的H3;
图9为本发明实施例9中基于硫酯结构的酶连反应获取S139磷酸化修饰的H2AX;
图10为本发明对比例1中非硫酯短肽的酶连反应随时间变化的色谱图;
图11为本发明对比例2中识别序列单位点替换非硫酯短肽的酶连反应随时间变化的色谱图;
图12为本发明对比例3中识别序列双位点替换非硫酯短肽的酶连反应随时间变化的色谱图。
具体实施方式
下面详细描述本发明的实施例。下面描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
需要说明的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。进一步地,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
本发明提出了一种连接多肽的方法及多肽和/或蛋白的合成方法,下面将分别对其进行详细描述。
连接多肽的方法
本发明提出了一种连接多肽或蛋白的方法。根据本发明的实施例,所述方法包含:将第一多肽或第一蛋白与第二多肽或第二蛋白在转肽酶的作用下进行连接处理,以便获得连接肽或蛋白,所述第一多肽或第一蛋白的C末端与所述第二多肽或第二蛋白的N末端连接;其中,所述第一多肽或第一蛋白的C末端氨基酸P1的羧基与带有游离巯基的化合物通过硫酯键相连;所述第二多肽或第二蛋白的N末端为甘氨酸。
发明人通过大量实验发现,将C末端氨基酸P1的羧基与带有游离巯基的化合物通过硫酯键相连,其可被转肽酶识别,并能与被转肽酶介导与N末端为甘氨酸的第二多肽或第二蛋白进行连接反应。由此,该方法中转肽酶对识别序列依赖性低,可识别多种序列;并且,该反应不可逆,可进一步提高多肽样品的产率。
根据本发明的实施例,所述带有游离巯基的化合物包括选自巯基乙酸甲酯、巯基乙酸、N-甲基-硫代乙酰胺、巯基乙基磺酸钠、4-巯基苯基乙酸、2,2,2-三氟乙硫醇、2-巯基乙酸乙酯、3-巯基丙酸和3-巯基丙酸甲酯中的任意一种。发明人经过试验发现,采用上述带有游离巯基的化合物和与氨基酸P1反应生产硫酯键,通过第一多肽或第一蛋白中硫酯键的加入,可降低转肽酶对识别序列依赖性,识别多种序列,并使反应不可逆,进一步提高多肽样品的产率。
根据本发明的实施例,所述转肽酶包括sortase A、sortase B、sortase C、sortase D、sortase E、sortase F中的至少之一,优选为sortase A。采用本发明的方法,sortase A酶能够耐受大量的L-P-x-T的衍生序列。
根据本发明的实施例,所述转肽酶选自sortase A,所述第一多肽或第一蛋白的C末端氨基酸前四位氨基酸序列为P4P3P2P1;其中,所述P2选自任意一种氨基酸,所述P4为亮氨酸,所述P3为脯氨酸,所述P1为苏氨酸,或所述P4、P3和P1中的至少一个氨基酸发生替换。
发明人经过大量实验发现,转肽酶可识别C末端含有上述序列的第一多肽或第一蛋白,并使第一多肽或第一蛋白和N末端带有甘氨酸的第二多肽或第二蛋白发生缩合反应,由此,可降低转肽酶对识别序列依赖性以及促使反应不可逆,进一步提高多肽样品的产率。
需要说明的是,多肽片段(例如第一多肽或第一蛋白)的C末端到N末端的顺序依次为P1、P2、P3和P4,即为N末端-P4-P3-P2-P1-C末端。
需要说明的是,“P4、P3和P1中的至少一个氨基酸发生替换”是指,在P4为亮氨酸、P3为脯氨酸、P1为苏氨酸的基础上,P4、P3和P1中存在其中一个氨基酸发生替换、其中两个氨基酸发生替换或者三个氨基酸都发生替换。
需要说明的是,“发生替换”是指P4、P3或P1中的氨基酸与其分别对应的原始氨基酸不同,即为,P4不为亮氨酸、P3不为脯氨酸或P1不为苏氨酸。其中,P4的原始氨基酸为亮氨酸,P3的原始氨基酸为脯氨酸,P1的原始氨基酸为苏氨酸。
根据本发明的实施例,所述P4、P3和P1中的一个氨基酸发生替换,其中,所述P2选自任意一种氨基酸,所述P4的亮氨酸替换为赖氨酸、天冬氨酸、半胱氨酸、丝氨酸、甘氨酸、酪氨酸、苯丙氨酸、丙氨酸、精氨酸、天冬酰胺、谷氨酰胺、谷氨酸、组氨酸、异亮氨酸、蛋氨酸、脯氨酸、苏氨酸、色氨酸、缬氨酸、β-苯丙氨酸、2,3-二氨基丙酸、正亮氨酸或鸟氨酸,所述P3为脯氨酸,所述P1为苏氨酸;或,所述P2选自任意一种氨基酸,所述P3的脯氨酸替换为赖氨酸、天冬氨酸、半胱氨酸、丝氨酸、甘氨酸、酪氨酸、苯丙氨酸、丙氨酸、精氨酸、天冬酰胺、谷氨酰胺、谷氨酸、组氨酸、异亮氨酸、蛋氨酸、亮氨酸、苏氨酸、色氨酸、缬氨酸、β-苯丙氨酸、2,3-二氨基丙酸、正亮氨酸或鸟氨酸,所述P4为亮氨酸,所述P1为苏氨酸;或,所述P2选自任意一种氨基酸,所述P1的苏氨酸替换为赖氨酸、天冬氨酸、半胱氨酸、丝氨酸、甘氨酸、酪氨酸、苯丙氨酸、丙氨酸、精氨酸、天冬酰胺、谷氨酰胺、谷氨酸、组氨酸、异亮氨酸、蛋氨酸、亮氨酸、脯氨酸、色氨酸、缬氨酸、β-苯丙氨酸、2,3-二氨基丙酸、正亮氨酸或鸟氨酸,P4为亮氨酸,P3为脯氨酸。
根据本发明的实施例,所述P4、P3和P1中的一个氨基酸发生替换,其中,所述P2选自任意一种氨基酸,所述P4的亮氨酸替换为赖氨酸、天冬氨酸、半胱氨酸、丝氨酸、甘氨酸、酪氨酸、苯丙氨酸、丙氨酸、精氨酸、天冬酰胺、谷氨酰胺、谷氨酸、组氨酸、异亮氨酸、蛋氨酸、脯氨酸、苏氨酸、色氨酸或缬氨酸,所述P3为脯氨酸,所述P1为苏氨酸;或,所述P2选自任意一种氨基酸,P3的脯氨酸替换为赖氨酸、天冬氨酸、半胱氨酸、丝氨酸、甘氨酸、酪氨酸、苯丙氨酸、丙氨酸、精氨酸、天冬酰胺、谷氨酰胺、谷氨酸、组氨酸、异亮氨酸、蛋氨酸、亮氨酸、苏氨酸、色氨酸或缬氨酸,P4为亮氨酸,P1为苏氨酸;或,所述P2选自任意一种氨基酸,P1的苏氨酸替换为赖氨酸、天冬氨酸、半胱氨酸、丝氨酸、甘氨酸、酪氨酸、苯丙氨酸、丙氨酸、精氨酸、天冬酰胺、谷氨酰胺、谷氨酸、组氨酸、异亮氨酸、蛋氨酸、亮氨酸、脯氨酸、色氨酸或缬氨酸,P4为亮氨酸,P3为脯氨酸。
根据本发明的实施例,所述P4、P3和P1中的两个氨基酸发生替换,其中,所述P2选自任意一种氨基酸,所述P4为亮氨酸,所述P3的脯氨酸替换为赖氨酸、天冬氨酸、半胱氨酸、丝氨酸、甘氨酸、酪氨酸、苯丙氨酸、丙氨酸、精氨酸、天冬酰胺、谷氨酰胺、谷氨酸、组氨酸、异亮氨酸、蛋氨酸、亮氨酸、苏氨酸、色氨酸、缬氨酸、β-苯丙氨酸、2,3-二氨基丙酸、正亮氨酸或鸟氨酸,所述P1的苏氨酸替换为赖氨酸、天冬氨酸、半胱氨酸、丝氨酸、甘氨酸、酪氨酸、苯丙氨酸、丙氨酸、精氨酸、天冬酰胺、谷氨酰胺、谷氨酸、组氨酸、异亮氨酸、蛋氨酸、亮氨酸、脯氨酸、色氨酸、缬氨酸、β-苯丙氨酸、2,3-二氨基丙酸、正亮氨酸或鸟氨酸;或,所述P2选自任意一种氨基酸,所述P3为脯氨酸,所述P4的亮氨酸替换为赖氨酸、天冬氨酸、半胱氨酸、丝氨酸、甘氨酸、酪氨酸、苯丙氨酸、丙氨酸、精氨酸、天冬酰胺、谷氨酰胺、谷氨酸、组氨酸、异亮氨酸、蛋氨酸、脯氨酸、苏氨酸、色氨酸、缬氨酸、β-苯丙氨酸、2,3-二氨基丙酸、正亮氨酸或鸟氨酸,所述P1的苏氨酸替换为赖氨酸、天冬氨酸、半胱氨酸、丝氨酸、甘氨酸、酪氨酸、苯丙氨酸、丙氨酸、精氨酸、天冬酰胺、谷氨酰胺、谷氨酸、组氨酸、异亮氨酸、蛋氨酸、亮氨酸、脯氨酸、色氨酸、缬氨酸、β-苯丙氨酸、2,3-二氨基丙酸、正亮氨酸或鸟氨酸;或,所述P2选自任意一种氨基酸,所述P1为苏氨酸,所述P4的亮氨酸替换为赖氨酸、天冬氨酸、半胱氨酸、丝氨酸、甘氨酸、酪氨酸、苯丙氨酸、丙氨酸、精氨酸、天冬酰胺、谷氨酰胺、谷氨酸、组氨酸、异亮氨酸、蛋氨酸、脯氨酸、苏氨酸、色氨酸、缬氨酸、β-苯丙氨酸、2,3-二氨基丙酸、正亮氨酸或鸟氨酸,所述P3的脯氨酸替换为赖氨酸、天冬氨酸、半胱氨酸、丝氨酸、甘氨酸、酪氨酸、苯丙氨酸、丙氨酸、精氨酸、天冬酰胺、谷氨酰胺、谷氨酸、组氨酸、异亮氨酸、蛋氨酸、亮氨酸、苏氨酸、色氨酸、缬氨酸、β-苯丙氨酸、2,3-二氨基丙酸、正亮氨酸或鸟氨酸。
根据本发明的实施例,所述P4、P3和P1中的两个氨基酸发生替换,其中,所述P2选自任意一种氨基酸,所述P4为亮氨酸,所述P3的脯氨酸替换为丙氨酸、甘氨酸、丝氨酸、半胱氨酸、苏氨酸、苯丙氨酸或酪氨酸,所述P1的苏氨酸替换为丙氨酸、甘氨酸、丝氨酸、半胱氨酸、苏氨酸、苯丙氨酸或酪氨酸;或,所述P2选自任意一种氨基酸,所述P3为脯氨酸,所述P4的亮氨酸替换为丙氨酸、甘氨酸、丝氨酸、半胱氨酸、苏氨酸、苯丙氨酸或酪氨酸,所述P1的苏氨酸替换为丙氨酸、甘氨酸、丝氨酸、半胱氨酸、苏氨酸、苯丙氨酸或酪氨酸;或,所述P2选自任意一种氨基酸,所述P1为苏氨酸,所述P4的亮氨酸替换为丙氨酸、甘氨酸、丝氨酸、半胱氨酸、苏氨酸、苯丙氨酸或酪氨酸,所述P3的脯氨酸替换为丙氨酸、甘氨酸、丝氨酸、半胱氨酸、苏氨酸、苯丙氨酸或酪氨酸。
根据本发明的实施例,所述P4、P3和P1中的三个氨基酸均发生替换,其中,所述P2选自任意一种氨基酸,所述P4的亮氨酸替换为赖氨酸、天冬氨酸、半胱氨酸、丝氨酸、甘氨酸、酪氨酸、苯丙氨酸、丙氨酸、精氨酸、天冬酰胺、谷氨酰胺、谷氨酸、组氨酸、异亮氨酸、蛋氨酸、脯氨酸、苏氨酸、色氨酸、缬氨酸、β-苯丙氨酸、2,3-二氨基丙酸、正亮氨酸或鸟氨酸,所述P3的脯氨酸替换为赖氨酸、天冬氨酸、半胱氨酸、丝氨酸、甘氨酸、酪氨酸、苯丙氨酸、丙氨酸、精氨酸、天冬酰胺、谷氨酰胺、谷氨酸、组氨酸、异亮氨酸、蛋氨酸、亮氨酸、苏氨酸、色氨酸、缬氨酸、β-苯丙氨酸、2,3-二氨基丙酸、正亮氨酸或鸟氨酸,所述P1的苏氨酸替换为赖氨酸、天冬氨酸、半胱氨酸、丝氨酸、甘氨酸、酪氨酸、苯丙氨酸、丙氨酸、精氨酸、天冬酰胺、谷氨酰胺、谷氨酸、组氨酸、异亮氨酸、蛋氨酸、亮氨酸、脯氨酸、色氨酸、缬氨酸、β-苯丙氨酸、2,3-二氨基丙酸、正亮氨酸或鸟氨酸。
需要说明的是,sortase A具体参见Irwin Chen,A general strategy for theevolution of bond-forming enzymes using yeast display,Proc.Natl.Acad.Sci.U.S.A.,2011,108(28):11399-404;sortase B-F具体参见Alex WJacobitz,Sortase Transpeptidases:Structural Biology and Catalytic Mechanism,Adv Protein Chem Struct Biol.,2017;109:223-264。其中,sortase A-F还可以为上述文献中提到的氨基酸序列或者具有至少80%同源性的氨基酸序列,或者说,sortase A-F可以为上述文献中提到的酶或者其可接受的变体,sortase A-F不受具体限制。
根据本发明的实施例,所述第一多肽或第一蛋白和所述第二多肽或第二蛋白与转肽酶混合之前,预先将所述第一多肽或第一蛋白和所述第二多肽或第二蛋白与还原剂和稳定剂进行混合处理,并调节pH值至6-8。由此,多肽连接的效果较佳。
根据本发明的实施例,所述还原剂包括选自氯化钠、氯化钾中的至少之一。由此,多肽连接的效果较佳。
根据本发明的实施例,所述稳定剂包括选自三(2-羧乙基)膦、三(3-羟丙基)膦、双(3-丙酸甲酯)苯基膦硼烷络合物、(3-丙酸甲酯)二苯基膦硼烷络合物中的至少之一。由此,可提高反应的稳定性,多肽连接的效果较佳。
根据本发明的实施例,所述连接处理的反应温度为20-40℃。由此,多肽连接的效果较佳。
根据本发明的实施例,所述第一多肽或第一蛋白和所述第二多肽或第二蛋白的摩尔比为(1-20):(1-20)。发明人经过大量实验得到上述较优配比,由此,多肽连接的效果较佳。
根据本发明的实施例,所述第一多肽或第一蛋白和所述第二多肽或第二蛋白的摩尔比为(1-20):(1-20)。由此,多肽连接的效果较佳。
根据本发明的实施例,所述第一多肽或第一蛋白和所述第二多肽或第二蛋白总摩尔数与所述转肽酶的摩尔比为(1-600):1。发明人经过大量实验得到上述较优配比,由此,多肽连接的效果较佳。
根据本发明的实施例,所述第一多肽或第一蛋白和所述第二多肽或第二蛋白总摩尔数与所述转肽酶的摩尔比为(1-600):1。由此,多肽连接的效果较佳。
根据本发明的实施例,若P4、P3和P1中氨基酸的替换个数越多,转肽酶的添加量越多。
根据本发明的实施例,所述连接处理后,进一步包括将所述连接肽进行纯化处理。由此,可去除多肽样品中的杂质,提高多肽的纯度。
根据本发明的实施例,第一多肽或第一蛋白是通过如下方式获得:将第三多肽或第三蛋白与带有所述游离巯基的化合物进行酰肼硫酯化反应,所述第三多肽或第三蛋白的C末端氨基酸具有-NHNH2,所述第三多肽或第三蛋白的氨基酸序列与第一多肽或第一蛋白的氨基酸序列相同。由此,可制备得到C末端带有硫酯键的第一多肽或第一蛋白。
根据本发明的实施例,第一多肽或第一蛋白是通过如下方式获得:将第三多肽或第三蛋白与带有所述游离巯基的化合物进行转硫酯反应,所述第三多肽或第三蛋白的C末端氨基酸带有intein基团,所述第三多肽或第三蛋白的氨基酸序列与第一多肽或第一蛋白的氨基酸序列相同。由此,可制备得到C末端带有硫酯键的第一多肽或第一蛋白。
需要说明的是,第三片段或第三蛋白的氨基酸序列是指不包含intein基团的氨基酸序列。
在本文中,术语“intein基团”是指融合表达内含肽,可以通过自切割获取目标片段,具体参考N.H.Shah,T.W.Muir,Inteins:Nature's Gift to ProteinChemists.Chem.Sci.2014,5,446-461。
根据本发明的实施例,所述多肽上携带修饰基团。发明人经过大量实验发现,该方法尤其适用于制备带有修饰基团的多肽(尤其是制备带有修饰基团的蛋白),具有降低转肽酶对识别序列依赖性、促使反应不可逆、提高修饰多肽样品的产率等优点。
根据本发明的实施例,第一多肽或第一蛋白和第二多肽或第二蛋白连接之前,将修饰基团添加到第一多肽或第一蛋白和/或第二多肽或第二蛋白上。发明人可根据多肽(或蛋白)的氨基酸序列,设计并制备第一多肽或第一蛋白和第二多肽或第二蛋白,然后将修饰基团添加到第一多肽或第一蛋白和/或第二多肽或第二蛋白上,进而得到带有修饰基团的多肽(或蛋白)。该方法中转肽酶可识别多个识别序列,制得的多肽样品(或蛋白样品)的产率高。
根据本发明的实施例,所述修饰基团的类型包括功能性分子修饰和/或翻译后修饰。由此,本发明可制备得到带有上述修饰基团的多肽(或蛋白)。
根据本发明的实施例,所述功能性分子修饰包括亲和标签修饰、荧光基团修饰、聚乙二醇修饰、叠氮基团或炔烃基团修饰和非天然氨基酸中的至少之一。由此,本发明可制备得到带有上述修饰基团的多肽(或蛋白)。
根据本发明的实施例,所述翻译后修饰包括甲基化修饰、乙酰化修饰、磷酸化修饰和泛素化修饰中的至少之一。由此,本发明可制备得到带有上述修饰基团的多肽(或蛋白)。
根据本发明的实施例,所述修饰基团位于所述第一多肽或第一蛋白和/或所述第二多肽或第二蛋白。发明人经过大量实验发现,本发明的方法可制备单端具有修饰基团的多肽(尤其是制备带有修饰基团的蛋白),也可制备双端具有修饰基团的样品。
下面将结合实施例对本发明的方案进行解释。本领域技术人员将会理解,下面的实施例仅用于说明本发明,而不应视为限定本发明的范围。实施例中未注明具体技术或条件的,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。
实施例1
1、C末端为硫酯的第一多肽片段的制备:
(1)用肼树脂,通过固相多肽合成获取序列为Tyr-Ala-Leu-Pro-Glu-Thr-NHNH2的短肽,通过制备型色谱分离纯化,并冻干,得到短肽干粉;
(2)用缓冲液(6M盐酸胍,100mM磷酸二氢钠,pH=3)溶解短肽干粉,在冰盐浴(-15℃)下孵育,加入亚硝酸钠氧化20min,之后加入MTG,调节pH=5,反应30min后,用制备型色谱分离纯化,并冻干,得到样品1。其中,亚硝酸钠的添加量为短肽摩尔量的10倍,MTG的添加量为短肽摩尔量的500倍。
2、N末端为甘氨酸的第二多肽片段的制备:
(1)用Rink酰胺树脂,通过固相多肽合成获取序列为Gly-Leu-Arg-Asp-Tyr-Pro-Ala的短肽,通过制备型色谱分离纯化,并冻干,得到样品2。
3、Sortase介导的两片段连接
(1)用缓冲盐(20mM 4-羟乙基哌嗪乙磺酸(Hepes),100mM氯化钠,pH=6.0)分别溶解样品1和样品2两种多肽,至终浓度为4mM,;
(2)将溶解后的样品1和样品2等当量混合,加入氯化钙溶液至终浓度为10mM,加入三(2-羧乙基)膦(TCEP)溶液至终浓度为1mM,然后用缓冲盐调节至样品1和样品2总量的终浓度为500uM,并调节pH=7.5;
(3)向反应液中加入sortase A蛋白溶液,至终浓度为1uM;
(4)将反应液置于25℃水浴中进行反应,隔时取样;
(5)进分析型高效反相液相色谱(岛津LC-20AT)监测。
结果如图1所示,20min后随着反应的进行,反应20min后原料峰基本消失,全都转化生成产物,继续延长反应时间,产物峰几乎不再增加,表明硫酯协助的sortase A酶连接反应不可逆,且在反应20min时几乎反应完全。
实施例2
按照实施例1的方法制备,区别在于,C末端为硫酯的第一多肽片段的制备的步骤(2)中,将MTG用MMA替换。
结果如图2所示,20min后随着反应的进行,反应20min后原料峰基本消失,全都转化生成产物,继续延长反应时间,产物峰几乎不再增加,表明硫酯协助的sortase A酶连接反应不可逆,且在反应20min时几乎反应完全。
实施例3
按照实施例1的方法制备,区别在于,C末端为硫酯的第一多肽片段的制备的步骤(2)中,将MTG用TGA。
结果如图3所示,60min后随着反应的进行,反应60min后原料峰基本消失,全都转化生成产物,继续延长反应时间,产物峰几乎不再增加,表明硫酯协助的sortase A酶连接反应不可逆,且在反应60min时几乎反应完全。
实施例4
按照实施例1的方法制备,区别在于,C末端为硫酯的第一多肽片段的制备的步骤(2)中,将MTG用MESNa。
结果如图4所示,40min后随着反应的进行,反应40min后原料峰基本消失,全都转化生成产物,继续延长反应时间,产物峰几乎不再增加,表明硫酯协助的sortase A酶连接反应不可逆,且在反应40min时几乎反应完全。
实施例5
按照实施例1的方法制备,区别在于,C末端为硫酯的第一多肽片段的制备的步骤(2)中,将MTG用MPAA。
结果如图5所示,60min后随着反应的进行,反应60min后原料峰基本消失,全都转化生成产物,继续延长反应时间,产物峰几乎不再增加,表明硫酯协助的sortase A酶连接反应不可逆,且在反应60min时几乎反应完全。
实施例6:带有单位点替换的识别序列的短肽硫酯的酶连反应
1、带有替换序列的C末端为硫酯的第一多肽片段的制备:
(1)用肼树脂,通过固相多肽合成获取序列为Tyr-Ala-Gly-Pro-Glu-Thr-NHNH2(其中将天然识别序列Leu-Pro-Glu-Thr中的Leu替换成了Gly)的短肽,通过制备型色谱分离纯化,并冻干,得到短肽干粉;
(2)用缓冲液(6M盐酸胍,100mM磷酸二氢钠,pH=3)溶解短肽干粉,在冰盐浴(-15℃)下孵育,加入亚硝酸钠氧化20min,之后加入MTG,调节pH=5,反应30min后,用制备型色谱分离纯化,并冻干,得到样品1。其中,亚硝酸钠的添加量为短肽摩尔量的10倍,MTG的添加量为短肽摩尔量的500倍。
2、N末端为G的第二多肽片段的制备:
(1)用Rink酰胺树脂,通过固相多肽合成获取序列为Gly-Gly-Ser-Leu-Tyr-Ala的短肽,通过制备型色谱分离纯化,并冻干,得到样品2。
3、Sortase介导的两片段连接
(1)用缓冲盐(20mM 4-羟乙基哌嗪乙磺酸(Hepes),100mM氯化钠(NaCl),pH=6.0)分别溶解样品1和样品2两种多肽,至终浓度为4mM;
(2)将溶解后的样品1和样品2等当量混合,加入氯化钙溶液至终浓度为10mM,加入三(2-羧乙基)膦(TCEP)溶液至终浓度为1mM,然后用缓冲盐调节至样品1和样品2总量的终浓度为500uM,并调节pH=7.5;
(3)向反应液中加入sortase A蛋白溶液,至终浓度为50uM;
(4)将反应液置于25℃水浴中进行反应,隔时取样;
(5)进分析型色谱监测,过夜能完全反应。
结果如图6所示,在反应9h后的产率达到了90%以上,因此,本实施例的方法适用于单位点替换的识别序列。
实施例7:带有双位点替换的识别序列的短肽硫酯的酶连反应
1、带有替换序列的C末端为硫酯的第一多肽片段的制备:
(1)用肼树脂,通过固相多肽合成获取序列为Tyr-Ala-Ala-Ala-Glu-Thr-NHNH2(其中将天然识别序列Leu-Pro-Glu-Thr中的Leu替换成了Ala,Pro替换成了Ala)的短肽,通过制备型色谱分离纯化,并冻干,得到短肽干粉;
(2)用缓冲液(6M盐酸胍,100mM磷酸二氢钠,pH=3)溶解短肽干粉,在冰盐浴(-15℃)下孵育,加入亚硝酸钠氧化20min,之后加入MTG,调节pH=5,反应30min后,用制备型色谱分离纯化,并冻干,得到样品1。其中,亚硝酸钠的添加量为短肽摩尔量的10倍,MTG的添加量为短肽摩尔量的500倍。
2、N末端为G的第二多肽片段的制备:
(1)用Rink酰胺树脂,通过固相多肽合成获取序列为Gly-Leu-Arg-Asp-Tyr-Pro-Ala的短肽,通过制备型色谱分离纯化,并冻干,得到样品2。
3、Sortase介导的两片段连接
(1)用缓冲盐(20mM 4-羟乙基哌嗪乙磺酸(Hepes),100mM氯化钠(NaCl),pH=6.0)分别溶解样品1和样品2两种多肽,至终浓度为4mM;
(2)将溶解后的样品1和样品2等当量混合,加入氯化钙溶液至终浓度为10mM,加入三(2-羧乙基)膦(TCEP)溶液至终浓度为1mM,然后用缓冲盐调节至样品1和样品2总量的终浓度为500uM,并调节pH=7.5;
(3)向反应液中加入sortase A蛋白溶液,至终浓度为50uM;
(4)将反应液置于25℃水浴中进行反应,隔时取样;
(5)进分析型色谱监测,过夜能完全反应。
结果如图7所示,与3h的反应色谱图相比,9h的产物峰明显增加,因此,本实施例的方法适用于双位点替换的识别序列。
实施例8:组蛋白H3的制备
1、C末端为硫酯的第一多肽片段的制备:
(1)将第一多肽片段的氨基酸序列后面加个Cys,构建到pet系列载体中,通过大肠杆菌表达,纯化获取该片段;
(2)将蛋白浓度控制在20mg/mL,按照每1mL体积加入100mg MESNa、5mg TCEP和50mg盐酸肼,调节pH=7.0,然后用N2排净管中的空气,用塑封膜封口,放入摇床中,于50℃、100rpm的条件下反应60h,待完全反应后进行半制备分离,获取C末端为酰肼的片段。
(3)用缓冲液(6M盐酸胍,100mM磷酸二氢钠,pH=3)溶解蛋白干粉,在冰盐浴(-15℃)下孵育,加入亚硝酸钠氧化20min,之后加入MTG,调节pH=5,反应30min后,用制备型色谱分离纯化,并冻干,得到样品1。其中,亚硝酸钠的添加量为短肽摩尔量的10倍,MTG的添加量为短肽摩尔量的500倍。
2、N末端为G的第二多肽片段的制备:
(1)用Rink酰胺树脂,通过固相多肽合成获取右边的带有磷酸化修饰的短肽,通过制备型色谱分离纯化,并冻干,得到样品2。
3、sortase介导的两片段连接
(1)用缓冲盐(20mM 4-羟乙基哌嗪乙磺酸(Hepes),100mM氯化钠,pH=6.0)分别溶解样品1和样品2两种多肽,至终浓度为50mM;
(2)将溶解后的样品1和样品2溶液混合,加入氯化钙溶液至终浓度为10mM,加入三(2-羧乙基)膦(TCEP)溶液至终浓度为1mM,最终至样品1的终浓度为100uM、样品2的终浓度为1mM,调节pH=7.5;
(3)向反应液中加入sortase A蛋白溶液,至终浓度为50uM;
(4)将反应液置于25℃水浴中进行反应;
(5)过夜反应,通过制备型色谱进行分离纯化。
结果如图8所示,最终得到了组蛋白H3(简称H3)。
实施例9:合成带有翻译后修饰的天然的序列的组蛋白H2AX
1、C末端为硫酯的第一多肽片段的制备:
(1)将第一多肽片段的氨基酸序列后面加个Cys,构建到pet系列载体中,通过大肠杆菌表达,纯化获取该片段;
(2)将蛋白浓度控制在20mg/mL,按照每1mL体积加入100mg MESNa、5mg TCEP和50mg盐酸肼,调节pH=7.0,然后用N2排净管中的空气,用塑封膜封口,放入摇床中,于50℃、100rpm的条件下反应60h,待完全反应后进行半制备分离,获取C末端为酰肼的片段。
(3)用缓冲液(6M盐酸胍,100mM磷酸二氢钠,pH=3)溶解蛋白干粉,在冰盐浴(-15℃)下孵育,加入亚硝酸钠氧化20min,之后加入MTG,调节pH=5,反应30min后,用制备型色谱分离纯化,并冻干,得到样品1。其中,亚硝酸钠的添加量为短肽摩尔量的10倍,MTG的添加量为短肽摩尔量的500倍。
2、N末端为G的第二多肽片段的制备:
(1)用Rink酰胺树脂,通过固相多肽合成获取右边的带有磷酸化修饰的短肽,通过制备型色谱分离纯化,并冻干,得到样品2。
3、sortase介导的两片段连接
(1)用缓冲盐(20mM 4-羟乙基哌嗪乙磺酸(Hepes),100mM氯化钠,pH=6.0)分别溶解样品1和样品2两种多肽,至终浓度为50mM;
(2)将溶解后的样品1和样品2溶液混合,加入氯化钙溶液至终浓度为10mM,加入三(2-羧乙基)膦(TCEP)溶液至终浓度为1mM,最终至样品1的终浓度为100uM、样品2的终浓度为1mM,调节pH=7.5;
(3)向反应液中加入sortase A蛋白溶液,至终浓度为50uM;
(4)将反应液置于25℃水浴中进行反应;
(5)过夜反应,通过制备型色谱进行分离纯化。
结果如图9所示,最终得到了S139磷酸化修饰的组蛋白H2AX(简称H2AX),其中,S139磷酸化修饰是指组蛋白H2AX的第139位的苏氨酸上带有磷酸化修饰,具体参见图9。
对比例1:识别序列的非硫酯短肽的酶连反应
1、第一多肽片段的制备:
(1)用Rink酰胺树脂,通过固相多肽合成获取序列为Tyr-Ala-Leu-Pro-Glu-Thr-NH2的短肽,通过制备型色谱分离纯化,并冻干。
2、第二多肽片段的制备:
(1)用Rink酰胺树脂,通过固相多肽合成获取序列为Gly-Leu-Arg-Asp-Tyr-Pro-Ala的短肽,通过制备型色谱分离纯化,并冻干。
3、Sortase介导的两片段连接
(1)用缓冲盐(20mM 4-羟乙基哌嗪乙磺酸(Hepes),100mM氯化钠(NaCl),pH=6.0)分别溶解两种多肽,至终浓度为4mM;
(2)将两种溶液1和2等当量混合至终浓度为500uM,加入氯化钙(CaCl2)溶液至终浓度为10mM,加入三(2-羧乙基)膦(TCEP)溶液至终浓度为1mM,调节pH=7.5;
(3)向反应液中加入sortase A蛋白溶液,至终浓度为1uM;
(4)将反应液置于25℃水浴中进行反应,隔时取样;
(5)进分析型色谱监测。
结果如图10所示,该连接反应在前20分钟,产物峰逐渐上升,在20min后产物峰保持不变,因此,该反应可逆,并于20min时反应达到平衡。
对比例2:带有单位点替换的识别序列的非硫酯短肽的酶连反应
1、带有替换序列的C末端为非硫酯的第一多肽片段的制备:
(1)用Rink酰胺树脂,通过固相多肽合成获取序列为Tyr-Ala-Gly-Pro-Glu-Thr-NH2(其中将天然识别序列Leu-Pro-Glu-Thr中的Leu替换成了Gly)的短肽,通过制备型色谱分离纯化,并冻干,得到短肽干粉;
2、N末端为G的第二多肽片段的制备:
(1)用Rink酰胺树脂,通过固相多肽合成获取序列为Gly-Gly-Ser-Leu-Tyr-Ala的短肽,通过制备型色谱分离纯化,并冻干,得到样品2。
3、Sortase介导的两片段连接
(1)用缓冲盐(20mM 4-羟乙基哌嗪乙磺酸(Hepes),100mM氯化钠(NaCl),pH=6.0)分别溶解样品1和样品2两种多肽,至终浓度为4mM;
(2)将溶解后的样品1和样品2等当量混合,加入氯化钙溶液至终浓度为10mM,加入三(2-羧乙基)膦(TCEP)溶液至终浓度为1mM,然后用缓冲盐调节至样品1和样品2总量的终浓度为500uM,并调节pH=7.5;
(3)向反应液中加入sortase A蛋白溶液,至终浓度为50uM;
(4)将反应液置于25℃水浴中进行反应,隔时取样;
(5)进分析型色谱监测,过夜能完全反应。
结果如图11所示,反应9h后几乎没有产物生成,因此,本对照例表明带有单位点替换的非硫酯短肽不能被sortase酶连接。
对比例3:带有双位点替换的识别序列的非硫酯短肽的酶连反应
1、带有替换序列的C末端为硫酯的第一多肽片段的制备:
(1)用肼树脂,通过固相多肽合成获取序列为Tyr-Ala-Ala-Ala-Glu-Thr-NHNH2(其中将天然识别序列Leu-Pro-Glu-Thr中的Leu替换成了Ala,Pro替换成了Ala)的短肽,通过制备型色谱分离纯化,并冻干,得到样品1。
2、N末端为G的第二多肽片段的制备:
(1)用Rink酰胺树脂,通过固相多肽合成获取序列为Gly-Leu-Arg-Asp-Tyr-Pro-Ala的短肽,通过制备型色谱分离纯化,并冻干,得到样品2。
3、Sortase介导的两片段连接
(1)用缓冲盐(20mM 4-羟乙基哌嗪乙磺酸(Hepes),100mM氯化钠(NaCl),pH=6.0)分别溶解样品1和样品2两种多肽,至终浓度为4mM;
(2)将溶解后的样品1和样品2等当量混合,加入氯化钙溶液至终浓度为10mM,加入三(2-羧乙基)膦(TCEP)溶液至终浓度为1mM,然后用用缓冲盐调节至终浓度为500uM,并调节pH=7.5;
(3)向反应液中加入sortase A蛋白溶液,至终浓度为50uM;
(4)将反应液置于25℃水浴中进行反应,隔时取样;
(5)进分析型色谱监测,过夜能完全反应。
结果如图12所示,与3h的反应色谱图相比,9h的产物峰并未发生变化,因此,该对比例的方法不适用于双位点替换的识别序列。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (18)
1.一种连接多肽或蛋白的方法,其特征在于,将第一多肽或第一蛋白与第二多肽或第二蛋白在转肽酶的作用下进行连接处理,以便获得连接肽或蛋白,所述第一多肽或第一蛋白的C末端与所述第二多肽或第二蛋白的N末端连接;
其中,所述第一多肽或第一蛋白的C末端氨基酸P1的羧基与带有游离巯基的化合物通过硫酯键相连;
所述第二多肽或第二蛋白的N末端为甘氨酸;
所述转肽酶为sortase A,所述第一多肽或第一蛋白的C末端氨基酸前四位氨基酸序列为P1、P2、P3、P4,所述P1、P2、P3、P4依次为C末端起的第一位、第二位、第三位和第四位;其中,所述P2选自任意一种氨基酸,所述P4为亮氨酸,所述P3为脯氨酸,所述P1为苏氨酸;或在此基础上所述P4、P3和P1中的一个氨基酸发生替换、所述P4和P1两个氨基酸发生替换、所述P4和P3两个氨基酸发生替换;
1)所述P4、P3和P1中的一个氨基酸发生替换:
所述P2选自任意一种氨基酸,所述P4的亮氨酸替换为赖氨酸、天冬氨酸、半胱氨酸、丝氨酸、甘氨酸、酪氨酸、苯丙氨酸、丙氨酸、精氨酸、天冬酰胺、谷氨酰胺、谷氨酸、组氨酸、异亮氨酸、蛋氨酸、脯氨酸、苏氨酸、色氨酸、缬氨酸或正亮氨酸,所述P3为脯氨酸,所述P1为苏氨酸;或,
所述P2选自任意一种氨基酸,所述P3的脯氨酸替换为赖氨酸、天冬氨酸、半胱氨酸、丝氨酸、甘氨酸、酪氨酸、苯丙氨酸、丙氨酸、精氨酸、天冬酰胺、谷氨酰胺、谷氨酸、组氨酸、异亮氨酸、蛋氨酸、亮氨酸、苏氨酸、色氨酸、缬氨酸或正亮氨酸,所述P4为亮氨酸,所述P1为苏氨酸;或,
所述P2选自任意一种氨基酸,所述P1的苏氨酸替换为赖氨酸、天冬氨酸、半胱氨酸、丝氨酸、甘氨酸、酪氨酸、苯丙氨酸、丙氨酸、精氨酸、天冬酰胺、谷氨酰胺、谷氨酸、组氨酸、异亮氨酸、蛋氨酸、亮氨酸、脯氨酸、色氨酸、缬氨酸或正亮氨酸,P4为亮氨酸,P3为脯氨酸;
2)所述P4和P1两个氨基酸发生替换:
其中,所述P2选自任意一种氨基酸,所述P3为脯氨酸,所述P4的亮氨酸替换为赖氨酸、天冬氨酸、半胱氨酸、丝氨酸、甘氨酸、酪氨酸、苯丙氨酸、丙氨酸、精氨酸、天冬酰胺、谷氨酰胺、谷氨酸、组氨酸、异亮氨酸、蛋氨酸、脯氨酸、苏氨酸、色氨酸、缬氨酸或正亮氨酸,所述P1的苏氨酸替换为赖氨酸、天冬氨酸、半胱氨酸、丝氨酸、甘氨酸、酪氨酸、苯丙氨酸、丙氨酸、精氨酸、天冬酰胺、谷氨酰胺、谷氨酸、组氨酸、异亮氨酸、蛋氨酸、亮氨酸、脯氨酸、色氨酸、缬氨酸或正亮氨酸;
3)所述P4和P3两个氨基酸发生替换:
所述P2选自任意一种氨基酸,所述P1为苏氨酸,所述P4的亮氨酸替换为赖氨酸、天冬氨酸、半胱氨酸、丝氨酸、甘氨酸、酪氨酸、苯丙氨酸、丙氨酸、精氨酸、天冬酰胺、谷氨酰胺、谷氨酸、组氨酸、异亮氨酸、蛋氨酸、脯氨酸、苏氨酸、色氨酸、缬氨酸或正亮氨酸,所述P3的脯氨酸替换为赖氨酸、天冬氨酸、半胱氨酸、丝氨酸、甘氨酸、酪氨酸、苯丙氨酸、丙氨酸、精氨酸、天冬酰胺、谷氨酰胺、谷氨酸、组氨酸、异亮氨酸、蛋氨酸、亮氨酸、苏氨酸、色氨酸、缬氨酸或正亮氨酸。
2.根据权利要求1所述的方法,其特征在于,所述带有游离巯基的化合物包括选自巯基乙酸甲酯、巯基乙酸、N-甲基-硫代乙酰胺、巯基乙基磺酸钠、4-巯基苯基乙酸、2,2,2-三氟乙硫醇、2-巯基乙酸乙酯、3-巯基丙酸和3-巯基丙酸甲酯中的任意一种。
3.根据权利要求1所述的方法,其特征在于,所述第一多肽或第一蛋白和所述第二多肽或第二蛋白与转肽酶混合之前,预先将所述第一多肽或第一蛋白和所述第二多肽或第二蛋白与还原剂和稳定剂进行混合处理,并调节pH值至6-8。
4.根据权利要求3所述的方法,其特征在于,所述稳定剂包括选自氯化钠、氯化钾中的至少之一。
5.根据权利要求3所述的方法,其特征在于,所述还原剂包括选自三(2-羧乙基)膦、三(3-羟丙基)膦、双(3-丙酸甲酯)苯基膦硼烷络合物、(3-丙酸甲酯)二苯基膦硼烷络合物中的至少之一。
6.根据权利要求1所述的方法,其特征在于,所述连接处理的反应温度为20-40℃。
7.根据权利要求1所述的方法,其特征在于,所述第一多肽或第一蛋白和所述第二多肽或第二蛋白的摩尔比为(1-100):(1-100)。
8.根据权利要求1所述的方法,其特征在于,所述第一多肽或第一蛋白和所述第二多肽或第二蛋白总摩尔数与所述转肽酶的摩尔比为(1-1000):1。
9.根据权利要求1所述的方法,其特征在于,所述第一多肽或第一蛋白和所述第二多肽或第二蛋白的摩尔比为(1-20):(1-20)。
10.根据权利要求1所述的方法,其特征在于,所述第一多肽或第一蛋白和所述第二多肽或第二蛋白总摩尔数与所述转肽酶的摩尔比为(1-600):1。
11.根据权利要求1所述的方法,其特征在于,所述连接处理后,进一步包括将所述连接肽进行纯化处理。
12.根据权利要求1所述的方法,其特征在于,所述第一多肽或第一蛋白是通过如下方式获得:
将第三多肽或第三蛋白与带有所述游离巯基的化合物进行酰肼硫酯化反应,所述第三多肽或第三蛋白的C末端氨基酸具有-NHNH2,所述第三多肽或第三蛋白的氨基酸序列与所述第一多肽或第一蛋白的氨基酸序列相同。
13.根据权利要求1所述的方法,其特征在于,所述第一多肽或第一蛋白是通过如下方式获得:
将第三多肽或第三蛋白与带有所述游离巯基的化合物进行转硫酯反应,所述第三多肽或第三蛋白的C末端氨基酸带有intein基团,所述第三多肽或第三蛋白的氨基酸序列与所述第一多肽或第一蛋白的氨基酸序列相同。
14.根据权利要求1~13任一项所述的方法,其特征在于,所述多肽或蛋白上携带修饰基团。
15.根据权利要求14所述的方法,其特征在于,所述修饰基团的类型包括功能性分子修饰和/或翻译后修饰。
16.根据权利要求15所述的方法,其特征在于,所述功能性分子修饰包括亲和标签修饰、荧光基团修饰、聚乙二醇修饰、叠氮基团或炔烃基团修饰和非天然氨基酸中的至少之一。
17.根据权利要求15所述的方法,其特征在于,所述翻译后修饰包括甲基化修饰、乙酰化修饰、磷酸化修饰和泛素化修饰中的至少之一。
18.根据权利要求14所述的方法,其特征在于,所述修饰基团位于所述第一多肽或所述第二多肽上;或者,
所述修饰基团位于所述第一蛋白或所述第二蛋白上。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210184235.5A CN114480534B (zh) | 2022-02-24 | 2022-02-24 | 基于转肽酶的化学酶法的蛋白质半合成 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210184235.5A CN114480534B (zh) | 2022-02-24 | 2022-02-24 | 基于转肽酶的化学酶法的蛋白质半合成 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114480534A CN114480534A (zh) | 2022-05-13 |
CN114480534B true CN114480534B (zh) | 2024-02-13 |
Family
ID=81484909
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210184235.5A Active CN114480534B (zh) | 2022-02-24 | 2022-02-24 | 基于转肽酶的化学酶法的蛋白质半合成 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114480534B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005051976A2 (en) * | 2003-11-20 | 2005-06-09 | Ansata Therapeutics, Inc. | Protein and peptide ligation processes and one-step purification processes |
WO2017050874A1 (en) * | 2015-09-25 | 2017-03-30 | F. Hoffmann-La Roche Ag | Process for producing thioesters employing a sortase a |
CN106924753A (zh) * | 2015-12-30 | 2017-07-07 | 北京大学 | 制备蛋白质‑聚氨基酸环状偶联物的方法 |
-
2022
- 2022-02-24 CN CN202210184235.5A patent/CN114480534B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005051976A2 (en) * | 2003-11-20 | 2005-06-09 | Ansata Therapeutics, Inc. | Protein and peptide ligation processes and one-step purification processes |
WO2017050874A1 (en) * | 2015-09-25 | 2017-03-30 | F. Hoffmann-La Roche Ag | Process for producing thioesters employing a sortase a |
CN108138204A (zh) * | 2015-09-25 | 2018-06-08 | 豪夫迈·罗氏有限公司 | 使用分选酶a生产硫酯的方法 |
CN106924753A (zh) * | 2015-12-30 | 2017-07-07 | 北京大学 | 制备蛋白质‑聚氨基酸环状偶联物的方法 |
CN106924752A (zh) * | 2015-12-30 | 2017-07-07 | 北京大学 | 制备蛋白质‑聚氨基酸偶联物的方法 |
Non-Patent Citations (2)
Title |
---|
Broadening the scope of sortagging;Xiaolin Dai等;《RSC Adv.》;第9卷;4700–4721 * |
Thioester-Assisted Sortase-A-Mediated Ligation;Chong Zuo等;《Angew. Chem. Int. Ed.》;第61卷;e202201887,第1-7页 * |
Also Published As
Publication number | Publication date |
---|---|
CN114480534A (zh) | 2022-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2880336T3 (es) | Métodos y productos para la síntesis de proteínas de fusión | |
Huang et al. | Chemical synthesis of proteins using hydrazide intermediates | |
Johnson et al. | Towards the total chemical synthesis of integral membrane proteins: a general method for the synthesis of hydrophobic peptide-αthioester building blocks | |
FI113272B (fi) | Parannettu proteiinien laskostamismenetelmä | |
Kang et al. | Peptide and protein thioester synthesis via N→ S acyl transfer | |
Yang et al. | Native chemical ubiquitination using a genetically incorporated azidonorleucine | |
Hou et al. | Progress in chemical synthesis of peptides and proteins | |
Yang et al. | Recent developments in peptide ligation independent of amino acid side-chain functional group | |
US20220325260A1 (en) | Mirror nucleic acid replication system | |
AU613348B2 (en) | A process for enzymatic production of dipeptides | |
Malins et al. | Modern extensions of native chemical ligation for chemical protein synthesis | |
JPS642360B2 (zh) | ||
Li et al. | Preparation of peptide selenoesters from their corresponding acyl hydrazides | |
JPH0570433B2 (zh) | ||
Qi et al. | Total chemical synthesis of the site-selective azide-labeled [I66A] HIV-1 protease | |
Ullmann et al. | The specificity of clostripain from Clostridium histolyticum: Mapping the S′ subsites via acyl transfer to amino acid amines and peptides | |
CN114480534B (zh) | 基于转肽酶的化学酶法的蛋白质半合成 | |
EP1651664B1 (en) | Ligation method | |
Zheng et al. | An Enzyme‐Cleavable Solubilizing‐Tag Facilitates the Chemical Synthesis of Mirror‐Image Proteins | |
WO2015068532A1 (ja) | ペプチドヒドラジド、ペプチドアミド及びペプチドチオエステルの製造方法 | |
JP5730197B2 (ja) | ペプチドチオエステル体の製造方法 | |
Masuda et al. | Synthesis of neurosecretory protein GM composed of 88 amino acid residues by native chemical ligation | |
Titani et al. | The Amino Acid Sequence of a λ Type Bence-Jones Protein: I. TRYPTIC PEPTIDES | |
Rosa et al. | Introduction to chemical ligation reactions | |
Liu et al. | Protein chemical synthesis in drug discovery |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |