KR20230002766A - 내분비 교란물질 수용체에 상호작용하는 핵산 및 그의 이용 - Google Patents
내분비 교란물질 수용체에 상호작용하는 핵산 및 그의 이용 Download PDFInfo
- Publication number
- KR20230002766A KR20230002766A KR1020227039939A KR20227039939A KR20230002766A KR 20230002766 A KR20230002766 A KR 20230002766A KR 1020227039939 A KR1020227039939 A KR 1020227039939A KR 20227039939 A KR20227039939 A KR 20227039939A KR 20230002766 A KR20230002766 A KR 20230002766A
- Authority
- KR
- South Korea
- Prior art keywords
- ser
- ala
- leu
- gly
- pro
- Prior art date
Links
- 102000039446 nucleic acids Human genes 0.000 title claims abstract description 96
- 108020004707 nucleic acids Proteins 0.000 title claims abstract description 96
- 150000007523 nucleic acids Chemical class 0.000 title claims abstract description 96
- 239000000598 endocrine disruptor Substances 0.000 title claims abstract description 84
- 231100000049 endocrine disruptor Toxicity 0.000 title claims abstract description 80
- 239000002773 nucleotide Substances 0.000 claims abstract description 62
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 62
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 166
- 229930014550 juvenile hormone Natural products 0.000 claims description 96
- 239000002949 juvenile hormone Substances 0.000 claims description 96
- 150000003633 juvenile hormone derivatives Chemical class 0.000 claims description 94
- 108090000623 proteins and genes Proteins 0.000 claims description 69
- 108091008039 hormone receptors Proteins 0.000 claims description 61
- 239000000126 substance Substances 0.000 claims description 56
- 238000012360 testing method Methods 0.000 claims description 55
- 108020003175 receptors Proteins 0.000 claims description 50
- 230000014509 gene expression Effects 0.000 claims description 46
- 108700008625 Reporter Genes Proteins 0.000 claims description 45
- 241000238578 Daphnia Species 0.000 claims description 41
- 238000000034 method Methods 0.000 claims description 37
- 229940088597 hormone Drugs 0.000 claims description 29
- 239000013598 vector Substances 0.000 claims description 28
- 239000005556 hormone Substances 0.000 claims description 27
- 102000004169 proteins and genes Human genes 0.000 claims description 23
- 241000238424 Crustacea Species 0.000 claims description 18
- 241000238421 Arthropoda Species 0.000 claims description 16
- 241000238631 Hexapoda Species 0.000 claims description 15
- 230000002103 transcriptional effect Effects 0.000 claims description 15
- 230000010632 Transcription Factor Activity Effects 0.000 claims description 13
- 239000000556 agonist Substances 0.000 claims description 12
- 239000005557 antagonist Substances 0.000 claims description 8
- 206010016256 fatigue Diseases 0.000 claims description 5
- 238000010168 coupling process Methods 0.000 claims description 4
- 238000005859 coupling reaction Methods 0.000 claims description 4
- 230000003993 interaction Effects 0.000 claims description 4
- 125000003275 alpha amino acid group Chemical group 0.000 claims 6
- 125000003483 juvenile hormone group Chemical group 0.000 claims 1
- 230000004044 response Effects 0.000 abstract description 106
- 230000035945 sensitivity Effects 0.000 abstract description 6
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 164
- 108020004414 DNA Proteins 0.000 description 117
- PKVWNYGXMNWJSI-CIUDSAMLSA-N Gln-Gln-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O PKVWNYGXMNWJSI-CIUDSAMLSA-N 0.000 description 90
- 239000013612 plasmid Substances 0.000 description 56
- 241000282326 Felis catus Species 0.000 description 52
- 230000000694 effects Effects 0.000 description 41
- 102000005962 receptors Human genes 0.000 description 40
- 230000000052 comparative effect Effects 0.000 description 29
- 238000011156 evaluation Methods 0.000 description 23
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 23
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 21
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 21
- 150000001413 amino acids Chemical group 0.000 description 20
- 108091035710 E-box Proteins 0.000 description 19
- 230000009471 action Effects 0.000 description 19
- 108010050848 glycylleucine Proteins 0.000 description 19
- 241001494246 Daphnia magna Species 0.000 description 17
- 108010079364 N-glycylalanine Proteins 0.000 description 15
- 231100000507 endocrine disrupting Toxicity 0.000 description 15
- 108091028043 Nucleic acid sequence Proteins 0.000 description 14
- 230000000295 complement effect Effects 0.000 description 14
- 229930191400 juvenile hormones Natural products 0.000 description 14
- 239000000243 solution Substances 0.000 description 14
- 239000002299 complementary DNA Substances 0.000 description 13
- 238000011144 upstream manufacturing Methods 0.000 description 13
- ACRYGQFHAQHDSF-ZLUOBGJFSA-N Asn-Asn-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ACRYGQFHAQHDSF-ZLUOBGJFSA-N 0.000 description 12
- 108010026333 seryl-proline Proteins 0.000 description 12
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 11
- ZNNNYCXPCKACHX-DCAQKATOSA-N His-Gln-Gln Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZNNNYCXPCKACHX-DCAQKATOSA-N 0.000 description 11
- 108010077112 prolyl-proline Proteins 0.000 description 11
- 241001465754 Metazoa Species 0.000 description 10
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 10
- 108091008146 restriction endonucleases Proteins 0.000 description 10
- 241000880493 Leptailurus serval Species 0.000 description 9
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 9
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 9
- 108010025306 histidylleucine Proteins 0.000 description 9
- 108010034529 leucyl-lysine Proteins 0.000 description 9
- GPISLLFQNHELLK-DCAQKATOSA-N Gln-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N GPISLLFQNHELLK-DCAQKATOSA-N 0.000 description 8
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 8
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 8
- JURQXQBJKUHGJS-UHFFFAOYSA-N Ser-Ser-Ser-Ser Chemical compound OCC(N)C(=O)NC(CO)C(=O)NC(CO)C(=O)NC(CO)C(O)=O JURQXQBJKUHGJS-UHFFFAOYSA-N 0.000 description 8
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 8
- 102000040945 Transcription factor Human genes 0.000 description 8
- 108091023040 Transcription factor Proteins 0.000 description 8
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 8
- 108010038633 aspartylglutamate Proteins 0.000 description 8
- 150000001875 compounds Chemical class 0.000 description 8
- 238000010276 construction Methods 0.000 description 8
- 108010073101 phenylalanylleucine Proteins 0.000 description 8
- QYRMBFWDSFGSFC-OLHMAJIHSA-N Asn-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QYRMBFWDSFGSFC-OLHMAJIHSA-N 0.000 description 7
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 7
- 108010087924 alanylproline Proteins 0.000 description 7
- 108010089804 glycyl-threonine Proteins 0.000 description 7
- 108010028295 histidylhistidine Proteins 0.000 description 7
- XIXADJRWDQXREU-UHFFFAOYSA-M lithium acetate Chemical compound [Li+].CC([O-])=O XIXADJRWDQXREU-UHFFFAOYSA-M 0.000 description 7
- 238000005259 measurement Methods 0.000 description 7
- 239000000203 mixture Substances 0.000 description 7
- 230000035897 transcription Effects 0.000 description 7
- 238000013518 transcription Methods 0.000 description 7
- 230000001131 transforming effect Effects 0.000 description 7
- PCDUALPXEOKZPE-DXCABUDRSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-hydroxypropanoyl]amino]-3-hydroxypropanoyl]amino]-3-hydroxypropanoyl]amino]-3-hydroxypropanoyl]amino]-3-hydroxypropanoyl]amino]-3-hydroxypropanoyl]amino]-3-hydroxypropanoic acid Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O PCDUALPXEOKZPE-DXCABUDRSA-N 0.000 description 6
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 6
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 6
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 6
- 241000255925 Diptera Species 0.000 description 6
- YPMDZWPZFOZYFG-GUBZILKMSA-N Gln-Leu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YPMDZWPZFOZYFG-GUBZILKMSA-N 0.000 description 6
- PBYFVIQRFLNQCO-GUBZILKMSA-N Gln-Pro-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O PBYFVIQRFLNQCO-GUBZILKMSA-N 0.000 description 6
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 6
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 6
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 6
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 6
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 6
- FLONGDPORFIVQW-XGEHTFHBSA-N Ser-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FLONGDPORFIVQW-XGEHTFHBSA-N 0.000 description 6
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 6
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 6
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 6
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 6
- -1 for example Substances 0.000 description 6
- 108010078144 glutaminyl-glycine Proteins 0.000 description 6
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 6
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 6
- 239000001963 growth medium Substances 0.000 description 6
- 108010085325 histidylproline Proteins 0.000 description 6
- 108010018006 histidylserine Proteins 0.000 description 6
- 230000006698 induction Effects 0.000 description 6
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 6
- 239000000575 pesticide Substances 0.000 description 6
- 108010048818 seryl-histidine Proteins 0.000 description 6
- 108010061238 threonyl-glycine Proteins 0.000 description 6
- 241000254173 Coleoptera Species 0.000 description 5
- 241000588724 Escherichia coli Species 0.000 description 5
- IVCOYUURLWQDJQ-LPEHRKFASA-N Gln-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O IVCOYUURLWQDJQ-LPEHRKFASA-N 0.000 description 5
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 5
- 241000257303 Hymenoptera Species 0.000 description 5
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 5
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 5
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 5
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 5
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 5
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 5
- 239000004480 active ingredient Substances 0.000 description 5
- 239000012634 fragment Substances 0.000 description 5
- 239000002609 medium Substances 0.000 description 5
- 238000010998 test method Methods 0.000 description 5
- IGFHQQFPSIBGKE-UHFFFAOYSA-N 4-nonylphenol Chemical compound CCCCCCCCCC1=CC=C(O)C=C1 IGFHQQFPSIBGKE-UHFFFAOYSA-N 0.000 description 4
- AAQGRPOPTAUUBM-ZLUOBGJFSA-N Ala-Ala-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O AAQGRPOPTAUUBM-ZLUOBGJFSA-N 0.000 description 4
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 4
- BTBUEVAGZCKULD-XPUUQOCRSA-N Ala-Gly-His Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CN=CN1 BTBUEVAGZCKULD-XPUUQOCRSA-N 0.000 description 4
- GSHKMNKPMLXSQW-KBIXCLLPSA-N Ala-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C)N GSHKMNKPMLXSQW-KBIXCLLPSA-N 0.000 description 4
- XWFWAXPOLRTDFZ-FXQIFTODSA-N Ala-Pro-Ser Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O XWFWAXPOLRTDFZ-FXQIFTODSA-N 0.000 description 4
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 4
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 4
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 4
- KTXKIYXZQFWJKB-VZFHVOOUSA-N Ala-Thr-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O KTXKIYXZQFWJKB-VZFHVOOUSA-N 0.000 description 4
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 4
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 4
- ULBHWNVWSCJLCO-NHCYSSNCSA-N Arg-Val-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N ULBHWNVWSCJLCO-NHCYSSNCSA-N 0.000 description 4
- PQAIOUVVZCOLJK-FXQIFTODSA-N Asn-Gln-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PQAIOUVVZCOLJK-FXQIFTODSA-N 0.000 description 4
- REQUGIWGOGSOEZ-ZLUOBGJFSA-N Asn-Ser-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N REQUGIWGOGSOEZ-ZLUOBGJFSA-N 0.000 description 4
- SNYCNNPOFYBCEK-ZLUOBGJFSA-N Asn-Ser-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O SNYCNNPOFYBCEK-ZLUOBGJFSA-N 0.000 description 4
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 4
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 4
- CJUKAWUWBZCTDQ-SRVKXCTJSA-N Asp-Leu-Lys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O CJUKAWUWBZCTDQ-SRVKXCTJSA-N 0.000 description 4
- WMLFFCRUSPNENW-ZLUOBGJFSA-N Asp-Ser-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O WMLFFCRUSPNENW-ZLUOBGJFSA-N 0.000 description 4
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 4
- 108700004685 Drosophila y Proteins 0.000 description 4
- 101150094690 GAL1 gene Proteins 0.000 description 4
- 102100021736 Galectin-1 Human genes 0.000 description 4
- 102100024637 Galectin-10 Human genes 0.000 description 4
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 4
- XFAUJGNLHIGXET-AVGNSLFASA-N Gln-Leu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XFAUJGNLHIGXET-AVGNSLFASA-N 0.000 description 4
- FKXCBKCOSVIGCT-AVGNSLFASA-N Gln-Lys-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FKXCBKCOSVIGCT-AVGNSLFASA-N 0.000 description 4
- UWMDGPFFTKDUIY-HJGDQZAQSA-N Gln-Pro-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O UWMDGPFFTKDUIY-HJGDQZAQSA-N 0.000 description 4
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 4
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 4
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 4
- KAJAOGBVWCYGHZ-JTQLQIEISA-N Gly-Gly-Phe Chemical compound [NH3+]CC(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KAJAOGBVWCYGHZ-JTQLQIEISA-N 0.000 description 4
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 4
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 4
- UROVZOUMHNXPLZ-AVGNSLFASA-N His-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 UROVZOUMHNXPLZ-AVGNSLFASA-N 0.000 description 4
- PFPUFNLHBXKPHY-HTFCKZLJSA-N Ile-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)O)N PFPUFNLHBXKPHY-HTFCKZLJSA-N 0.000 description 4
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 4
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 4
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 4
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 4
- BOFAFKVZQUMTID-AVGNSLFASA-N Leu-Gln-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N BOFAFKVZQUMTID-AVGNSLFASA-N 0.000 description 4
- CIVKXGPFXDIQBV-WDCWCFNPSA-N Leu-Gln-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CIVKXGPFXDIQBV-WDCWCFNPSA-N 0.000 description 4
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 4
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 4
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 4
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 4
- 108700026244 Open Reading Frames Proteins 0.000 description 4
- NAXPHWZXEXNDIW-JTQLQIEISA-N Phe-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 NAXPHWZXEXNDIW-JTQLQIEISA-N 0.000 description 4
- FUVBEZJCRMHWEM-FXQIFTODSA-N Pro-Asn-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FUVBEZJCRMHWEM-FXQIFTODSA-N 0.000 description 4
- FISHYTLIMUYTQY-GUBZILKMSA-N Pro-Gln-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 FISHYTLIMUYTQY-GUBZILKMSA-N 0.000 description 4
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 4
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 4
- FDMKYQQYJKYCLV-GUBZILKMSA-N Pro-Pro-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 FDMKYQQYJKYCLV-GUBZILKMSA-N 0.000 description 4
- KBUAPZAZPWNYSW-SRVKXCTJSA-N Pro-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KBUAPZAZPWNYSW-SRVKXCTJSA-N 0.000 description 4
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 4
- CXGLFEOYCJFKPR-RCWTZXSCSA-N Pro-Thr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O CXGLFEOYCJFKPR-RCWTZXSCSA-N 0.000 description 4
- JXVXYRZQIUPYSA-NHCYSSNCSA-N Pro-Val-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JXVXYRZQIUPYSA-NHCYSSNCSA-N 0.000 description 4
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 4
- RJKFOVLPORLFTN-LEKSSAKUSA-N Progesterone Chemical compound C1CC2=CC(=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H](C(=O)C)[C@@]1(C)CC2 RJKFOVLPORLFTN-LEKSSAKUSA-N 0.000 description 4
- 241000235343 Saccharomycetales Species 0.000 description 4
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 4
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 4
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 4
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 4
- DINQYZRMXGWWTG-GUBZILKMSA-N Ser-Pro-Pro Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DINQYZRMXGWWTG-GUBZILKMSA-N 0.000 description 4
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 4
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 4
- CUXJENOFJXOSOZ-BIIVOSGPSA-N Ser-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CO)N)C(=O)O CUXJENOFJXOSOZ-BIIVOSGPSA-N 0.000 description 4
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 4
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 4
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 4
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 4
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 4
- OLFOOYQTTQSSRK-UNQGMJICSA-N Thr-Pro-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLFOOYQTTQSSRK-UNQGMJICSA-N 0.000 description 4
- NSGZILIDHCIZAM-KKUMJFAQSA-N Tyr-Leu-Ser Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NSGZILIDHCIZAM-KKUMJFAQSA-N 0.000 description 4
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 4
- CELJCNRXKZPTCX-XPUUQOCRSA-N Val-Gly-Ala Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O CELJCNRXKZPTCX-XPUUQOCRSA-N 0.000 description 4
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 4
- 108010005233 alanylglutamic acid Proteins 0.000 description 4
- 108010047495 alanylglycine Proteins 0.000 description 4
- 210000004027 cell Anatomy 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000001747 exhibiting effect Effects 0.000 description 4
- 239000013613 expression plasmid Substances 0.000 description 4
- 108010001064 glycyl-glycyl-glycyl-glycine Proteins 0.000 description 4
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 4
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 4
- 108010057821 leucylproline Proteins 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 4
- 108010051242 phenylalanylserine Proteins 0.000 description 4
- 108010031719 prolyl-serine Proteins 0.000 description 4
- 108010090894 prolylleucine Proteins 0.000 description 4
- 230000004043 responsiveness Effects 0.000 description 4
- 230000009261 transgenic effect Effects 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- 210000005253 yeast cell Anatomy 0.000 description 4
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 3
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 3
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 3
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 3
- 241001302161 Ceriodaphnia Species 0.000 description 3
- 241000255601 Drosophila melanogaster Species 0.000 description 3
- RBWKVOSARCFSQQ-FXQIFTODSA-N Gln-Gln-Ser Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O RBWKVOSARCFSQQ-FXQIFTODSA-N 0.000 description 3
- SJJHXJDSNQJMMW-SRVKXCTJSA-N Glu-Lys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SJJHXJDSNQJMMW-SRVKXCTJSA-N 0.000 description 3
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 3
- IDQNVIWPPWAFSY-AVGNSLFASA-N His-His-Gln Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O IDQNVIWPPWAFSY-AVGNSLFASA-N 0.000 description 3
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 3
- 241000124008 Mammalia Species 0.000 description 3
- 241000238633 Odonata Species 0.000 description 3
- CYQQWUPHIZVCNY-GUBZILKMSA-N Pro-Arg-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CYQQWUPHIZVCNY-GUBZILKMSA-N 0.000 description 3
- POQFNPILEQEODH-FXQIFTODSA-N Pro-Ser-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O POQFNPILEQEODH-FXQIFTODSA-N 0.000 description 3
- 108091027981 Response element Proteins 0.000 description 3
- HBZBPFLJNDXRAY-FXQIFTODSA-N Ser-Ala-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O HBZBPFLJNDXRAY-FXQIFTODSA-N 0.000 description 3
- VQBCMLMPEWPUTB-ACZMJKKPSA-N Ser-Glu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VQBCMLMPEWPUTB-ACZMJKKPSA-N 0.000 description 3
- MUMGGOZAMZWBJJ-DYKIIFRCSA-N Testosterone Natural products O=C1CC[C@]2(C)[C@H]3CC[C@](C)([C@H](CC4)O)[C@@H]4[C@@H]3CCC2=C1 MUMGGOZAMZWBJJ-DYKIIFRCSA-N 0.000 description 3
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 3
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 3
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 3
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 3
- 108010044940 alanylglutamine Proteins 0.000 description 3
- 108010070783 alanyltyrosine Proteins 0.000 description 3
- NWKXNIPBVLQYAB-UHFFFAOYSA-N all-trans methylfarnesoate Natural products COC(=O)C=C(C)CCC=C(C)CCC=C(C)C NWKXNIPBVLQYAB-UHFFFAOYSA-N 0.000 description 3
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 3
- 229940024606 amino acid Drugs 0.000 description 3
- 108010093581 aspartyl-proline Proteins 0.000 description 3
- IISBACLAFKSPIT-UHFFFAOYSA-N bisphenol A Chemical compound C=1C=C(O)C=CC=1C(C)(C)C1=CC=C(O)C=C1 IISBACLAFKSPIT-UHFFFAOYSA-N 0.000 description 3
- 238000009395 breeding Methods 0.000 description 3
- 230000001488 breeding effect Effects 0.000 description 3
- 230000021615 conjugation Effects 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 3
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 3
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 3
- 108010015792 glycyllysine Proteins 0.000 description 3
- 108010077515 glycylproline Proteins 0.000 description 3
- 239000004615 ingredient Substances 0.000 description 3
- 239000002917 insecticide Substances 0.000 description 3
- 229930002227 methyl farnesoate Natural products 0.000 description 3
- NWKXNIPBVLQYAB-VDQVFBMKSA-N methyl farnesoate Chemical compound COC(=O)\C=C(/C)CC\C=C(/C)CCC=C(C)C NWKXNIPBVLQYAB-VDQVFBMKSA-N 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 239000000843 powder Substances 0.000 description 3
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 3
- 239000000018 receptor agonist Substances 0.000 description 3
- 229940044601 receptor agonist Drugs 0.000 description 3
- 125000006850 spacer group Chemical group 0.000 description 3
- WQZGKKKJIJFFOK-SVZMEOIVSA-N (+)-Galactose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-SVZMEOIVSA-N 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 2
- HKZAAJSTFUZYTO-LURJTMIESA-N (2s)-2-[[2-[[2-[[2-[(2-aminoacetyl)amino]acetyl]amino]acetyl]amino]acetyl]amino]-3-hydroxypropanoic acid Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O HKZAAJSTFUZYTO-LURJTMIESA-N 0.000 description 2
- VOXZDWNPVJITMN-ZBRFXRBCSA-N 17β-estradiol Chemical compound OC1=CC=C2[C@H]3CC[C@](C)([C@H](CC4)O)[C@@H]4[C@@H]3CCC2=C1 VOXZDWNPVJITMN-ZBRFXRBCSA-N 0.000 description 2
- CASLETQIYIQFTQ-UHFFFAOYSA-N 3-[[5-(difluoromethoxy)-1-methyl-3-(trifluoromethyl)pyrazol-4-yl]methylsulfonyl]-5,5-dimethyl-4h-1,2-oxazole Chemical compound CN1N=C(C(F)(F)F)C(CS(=O)(=O)C=2CC(C)(C)ON=2)=C1OC(F)F CASLETQIYIQFTQ-UHFFFAOYSA-N 0.000 description 2
- 229930024421 Adenine Natural products 0.000 description 2
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 2
- 229920001817 Agar Polymers 0.000 description 2
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 2
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 2
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 2
- ZEXDYVGDZJBRMO-ACZMJKKPSA-N Ala-Asn-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZEXDYVGDZJBRMO-ACZMJKKPSA-N 0.000 description 2
- JYEBJTDTPNKQJG-FXQIFTODSA-N Ala-Asn-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N JYEBJTDTPNKQJG-FXQIFTODSA-N 0.000 description 2
- SHYYAQLDNVHPFT-DLOVCJGASA-N Ala-Asn-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SHYYAQLDNVHPFT-DLOVCJGASA-N 0.000 description 2
- XCVRVWZTXPCYJT-BIIVOSGPSA-N Ala-Asn-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N XCVRVWZTXPCYJT-BIIVOSGPSA-N 0.000 description 2
- PBAMJJXWDQXOJA-FXQIFTODSA-N Ala-Asp-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PBAMJJXWDQXOJA-FXQIFTODSA-N 0.000 description 2
- WXERCAHAIKMTKX-ZLUOBGJFSA-N Ala-Asp-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O WXERCAHAIKMTKX-ZLUOBGJFSA-N 0.000 description 2
- MCKSLROAGSDNFC-ACZMJKKPSA-N Ala-Asp-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MCKSLROAGSDNFC-ACZMJKKPSA-N 0.000 description 2
- LZRNYBIJOSKKRJ-XVYDVKMFSA-N Ala-Asp-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LZRNYBIJOSKKRJ-XVYDVKMFSA-N 0.000 description 2
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 2
- KRHRBKYBJXMYBB-WHFBIAKZSA-N Ala-Cys-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O KRHRBKYBJXMYBB-WHFBIAKZSA-N 0.000 description 2
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 2
- PUBLUECXJRHTBK-ACZMJKKPSA-N Ala-Glu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O PUBLUECXJRHTBK-ACZMJKKPSA-N 0.000 description 2
- WMYJZJRILUVVRG-WDSKDSINSA-N Ala-Gly-Gln Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O WMYJZJRILUVVRG-WDSKDSINSA-N 0.000 description 2
- SIGTYDNEPYEXGK-ZANVPECISA-N Ala-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 SIGTYDNEPYEXGK-ZANVPECISA-N 0.000 description 2
- KMGOBAQSCKTBGD-DLOVCJGASA-N Ala-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CN=CN1 KMGOBAQSCKTBGD-DLOVCJGASA-N 0.000 description 2
- CBCCCLMNOBLBSC-XVYDVKMFSA-N Ala-His-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O CBCCCLMNOBLBSC-XVYDVKMFSA-N 0.000 description 2
- CFPQUJZTLUQUTJ-HTFCKZLJSA-N Ala-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](C)N CFPQUJZTLUQUTJ-HTFCKZLJSA-N 0.000 description 2
- RZZMZYZXNJRPOJ-BJDJZHNGSA-N Ala-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C)N RZZMZYZXNJRPOJ-BJDJZHNGSA-N 0.000 description 2
- LXAARTARZJJCMB-CIQUZCHMSA-N Ala-Ile-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LXAARTARZJJCMB-CIQUZCHMSA-N 0.000 description 2
- LNNSWWRRYJLGNI-NAKRPEOUSA-N Ala-Ile-Val Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O LNNSWWRRYJLGNI-NAKRPEOUSA-N 0.000 description 2
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 2
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 2
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 2
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 2
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 2
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 2
- WQLDNOCHHRISMS-NAKRPEOUSA-N Ala-Pro-Ile Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WQLDNOCHHRISMS-NAKRPEOUSA-N 0.000 description 2
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 2
- YYAVDNKUWLAFCV-ACZMJKKPSA-N Ala-Ser-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYAVDNKUWLAFCV-ACZMJKKPSA-N 0.000 description 2
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 2
- HIIJOGIBQXHFKE-HHKYUTTNSA-N Ala-Thr-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O HIIJOGIBQXHFKE-HHKYUTTNSA-N 0.000 description 2
- AOAKQKVICDWCLB-UWJYBYFXSA-N Ala-Tyr-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N AOAKQKVICDWCLB-UWJYBYFXSA-N 0.000 description 2
- BVLPIIBTWIYOML-ZKWXMUAHSA-N Ala-Val-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BVLPIIBTWIYOML-ZKWXMUAHSA-N 0.000 description 2
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 2
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 2
- VYSRNGOMGHOJCK-GUBZILKMSA-N Arg-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N VYSRNGOMGHOJCK-GUBZILKMSA-N 0.000 description 2
- UXJCMQFPDWCHKX-DCAQKATOSA-N Arg-Arg-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UXJCMQFPDWCHKX-DCAQKATOSA-N 0.000 description 2
- BHSYMWWMVRPCPA-CYDGBPFRSA-N Arg-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCN=C(N)N BHSYMWWMVRPCPA-CYDGBPFRSA-N 0.000 description 2
- SQKPKIJVWHAWNF-DCAQKATOSA-N Arg-Asp-Lys Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(O)=O SQKPKIJVWHAWNF-DCAQKATOSA-N 0.000 description 2
- YSUVMPICYVWRBX-VEVYYDQMSA-N Arg-Asp-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YSUVMPICYVWRBX-VEVYYDQMSA-N 0.000 description 2
- ASQYTJJWAMDISW-BPUTZDHNSA-N Arg-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N ASQYTJJWAMDISW-BPUTZDHNSA-N 0.000 description 2
- YWENWUYXQUWRHQ-LPEHRKFASA-N Arg-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O YWENWUYXQUWRHQ-LPEHRKFASA-N 0.000 description 2
- KBBKCNHWCDJPGN-GUBZILKMSA-N Arg-Gln-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KBBKCNHWCDJPGN-GUBZILKMSA-N 0.000 description 2
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 2
- DJAIOAKQIOGULM-DCAQKATOSA-N Arg-Glu-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O DJAIOAKQIOGULM-DCAQKATOSA-N 0.000 description 2
- GOWZVQXTHUCNSQ-NHCYSSNCSA-N Arg-Glu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GOWZVQXTHUCNSQ-NHCYSSNCSA-N 0.000 description 2
- AUFHLLPVPSMEOG-YUMQZZPRSA-N Arg-Gly-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AUFHLLPVPSMEOG-YUMQZZPRSA-N 0.000 description 2
- HAVKMRGWNXMCDR-STQMWFEESA-N Arg-Gly-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HAVKMRGWNXMCDR-STQMWFEESA-N 0.000 description 2
- ZATRYQNPUHGXCU-DTWKUNHWSA-N Arg-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ZATRYQNPUHGXCU-DTWKUNHWSA-N 0.000 description 2
- FLYANDHDFRGGTM-PYJNHQTQSA-N Arg-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FLYANDHDFRGGTM-PYJNHQTQSA-N 0.000 description 2
- OOIMKQRCPJBGPD-XUXIUFHCSA-N Arg-Ile-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O OOIMKQRCPJBGPD-XUXIUFHCSA-N 0.000 description 2
- DNUKXVMPARLPFN-XUXIUFHCSA-N Arg-Leu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DNUKXVMPARLPFN-XUXIUFHCSA-N 0.000 description 2
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 2
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 2
- AOHKLEBWKMKITA-IHRRRGAJSA-N Arg-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AOHKLEBWKMKITA-IHRRRGAJSA-N 0.000 description 2
- HNJNAMGZQZPSRE-GUBZILKMSA-N Arg-Pro-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O HNJNAMGZQZPSRE-GUBZILKMSA-N 0.000 description 2
- HGKHPCFTRQDHCU-IUCAKERBSA-N Arg-Pro-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HGKHPCFTRQDHCU-IUCAKERBSA-N 0.000 description 2
- UULLJGQFCDXVTQ-CYDGBPFRSA-N Arg-Pro-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UULLJGQFCDXVTQ-CYDGBPFRSA-N 0.000 description 2
- ATABBWFGOHKROJ-GUBZILKMSA-N Arg-Pro-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O ATABBWFGOHKROJ-GUBZILKMSA-N 0.000 description 2
- DNLQVHBBMPZUGJ-BQBZGAKWSA-N Arg-Ser-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O DNLQVHBBMPZUGJ-BQBZGAKWSA-N 0.000 description 2
- LRPZJPMQGKGHSG-XGEHTFHBSA-N Arg-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)O LRPZJPMQGKGHSG-XGEHTFHBSA-N 0.000 description 2
- OQPAZKMGCWPERI-GUBZILKMSA-N Arg-Ser-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OQPAZKMGCWPERI-GUBZILKMSA-N 0.000 description 2
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 2
- HZPSDHRYYIORKR-WHFBIAKZSA-N Asn-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O HZPSDHRYYIORKR-WHFBIAKZSA-N 0.000 description 2
- ORXCYAFUCSTQGY-FXQIFTODSA-N Asn-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N ORXCYAFUCSTQGY-FXQIFTODSA-N 0.000 description 2
- NUHQMYUWLUSRJX-BIIVOSGPSA-N Asn-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N NUHQMYUWLUSRJX-BIIVOSGPSA-N 0.000 description 2
- VDCIPFYVCICPEC-FXQIFTODSA-N Asn-Arg-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O VDCIPFYVCICPEC-FXQIFTODSA-N 0.000 description 2
- YNSCBOUZTAGIGO-ZLUOBGJFSA-N Asn-Asn-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N)C(=O)N YNSCBOUZTAGIGO-ZLUOBGJFSA-N 0.000 description 2
- NVGWESORMHFISY-SRVKXCTJSA-N Asn-Asn-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NVGWESORMHFISY-SRVKXCTJSA-N 0.000 description 2
- PAXHINASXXXILC-SRVKXCTJSA-N Asn-Asp-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)O PAXHINASXXXILC-SRVKXCTJSA-N 0.000 description 2
- HLTLEIXYIJDFOY-ZLUOBGJFSA-N Asn-Cys-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O HLTLEIXYIJDFOY-ZLUOBGJFSA-N 0.000 description 2
- GWNMUVANAWDZTI-YUMQZZPRSA-N Asn-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N GWNMUVANAWDZTI-YUMQZZPRSA-N 0.000 description 2
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 2
- SUEIIIFUBHDCCS-PBCZWWQYSA-N Asn-His-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SUEIIIFUBHDCCS-PBCZWWQYSA-N 0.000 description 2
- YYSYDIYQTUPNQQ-SXTJYALSSA-N Asn-Ile-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YYSYDIYQTUPNQQ-SXTJYALSSA-N 0.000 description 2
- SEKBHZJLARBNPB-GHCJXIJMSA-N Asn-Ile-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O SEKBHZJLARBNPB-GHCJXIJMSA-N 0.000 description 2
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 2
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 2
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 2
- UYRPHDGXHKBZHJ-CIUDSAMLSA-N Asn-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N UYRPHDGXHKBZHJ-CIUDSAMLSA-N 0.000 description 2
- VITDJIPIJZAVGC-VEVYYDQMSA-N Asn-Met-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VITDJIPIJZAVGC-VEVYYDQMSA-N 0.000 description 2
- PLTGTJAZQRGMPP-FXQIFTODSA-N Asn-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(N)=O PLTGTJAZQRGMPP-FXQIFTODSA-N 0.000 description 2
- HPBNLFLSSQDFQW-WHFBIAKZSA-N Asn-Ser-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O HPBNLFLSSQDFQW-WHFBIAKZSA-N 0.000 description 2
- DOURAOODTFJRIC-CIUDSAMLSA-N Asn-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N DOURAOODTFJRIC-CIUDSAMLSA-N 0.000 description 2
- MKJBPDLENBUHQU-CIUDSAMLSA-N Asn-Ser-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O MKJBPDLENBUHQU-CIUDSAMLSA-N 0.000 description 2
- ZNYKKCADEQAZKA-FXQIFTODSA-N Asn-Ser-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O ZNYKKCADEQAZKA-FXQIFTODSA-N 0.000 description 2
- UXHYOWXTJLBEPG-GSSVUCPTSA-N Asn-Thr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UXHYOWXTJLBEPG-GSSVUCPTSA-N 0.000 description 2
- XLDMSQYOYXINSZ-QXEWZRGKSA-N Asn-Val-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N XLDMSQYOYXINSZ-QXEWZRGKSA-N 0.000 description 2
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 2
- VTYQAQFKMQTKQD-ACZMJKKPSA-N Asp-Ala-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O VTYQAQFKMQTKQD-ACZMJKKPSA-N 0.000 description 2
- NJIKKGUVGUBICV-ZLUOBGJFSA-N Asp-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O NJIKKGUVGUBICV-ZLUOBGJFSA-N 0.000 description 2
- FANQWNCPNFEPGZ-WHFBIAKZSA-N Asp-Asp-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FANQWNCPNFEPGZ-WHFBIAKZSA-N 0.000 description 2
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 2
- XJQRWGXKUSDEFI-ACZMJKKPSA-N Asp-Glu-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XJQRWGXKUSDEFI-ACZMJKKPSA-N 0.000 description 2
- YNCHFVRXEQFPBY-BQBZGAKWSA-N Asp-Gly-Arg Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N YNCHFVRXEQFPBY-BQBZGAKWSA-N 0.000 description 2
- KHGPWGKPYHPOIK-QWRGUYRKSA-N Asp-Gly-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KHGPWGKPYHPOIK-QWRGUYRKSA-N 0.000 description 2
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 2
- SCQIQCWLOMOEFP-DCAQKATOSA-N Asp-Leu-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SCQIQCWLOMOEFP-DCAQKATOSA-N 0.000 description 2
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 2
- HKEZZWQWXWGASX-KKUMJFAQSA-N Asp-Leu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HKEZZWQWXWGASX-KKUMJFAQSA-N 0.000 description 2
- IVPNEDNYYYFAGI-GARJFASQSA-N Asp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N IVPNEDNYYYFAGI-GARJFASQSA-N 0.000 description 2
- QNMKWNONJGKJJC-NHCYSSNCSA-N Asp-Leu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O QNMKWNONJGKJJC-NHCYSSNCSA-N 0.000 description 2
- DONWIPDSZZJHHK-HJGDQZAQSA-N Asp-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)O DONWIPDSZZJHHK-HJGDQZAQSA-N 0.000 description 2
- WWOYXVBGHAHQBG-FXQIFTODSA-N Asp-Met-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O WWOYXVBGHAHQBG-FXQIFTODSA-N 0.000 description 2
- IOXWDLNHXZOXQP-FXQIFTODSA-N Asp-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N IOXWDLNHXZOXQP-FXQIFTODSA-N 0.000 description 2
- IDDMGSKZQDEDGA-SRVKXCTJSA-N Asp-Phe-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 IDDMGSKZQDEDGA-SRVKXCTJSA-N 0.000 description 2
- HJZLUGQGJWXJCJ-CIUDSAMLSA-N Asp-Pro-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJZLUGQGJWXJCJ-CIUDSAMLSA-N 0.000 description 2
- AHWRSSLYSGLBGD-CIUDSAMLSA-N Asp-Pro-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AHWRSSLYSGLBGD-CIUDSAMLSA-N 0.000 description 2
- MVRGBQGZSDJBSM-GMOBBJLQSA-N Asp-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)O)N MVRGBQGZSDJBSM-GMOBBJLQSA-N 0.000 description 2
- ZQFRDAZBTSFGGW-SRVKXCTJSA-N Asp-Ser-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZQFRDAZBTSFGGW-SRVKXCTJSA-N 0.000 description 2
- MNQMTYSEKZHIDF-GCJQMDKQSA-N Asp-Thr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O MNQMTYSEKZHIDF-GCJQMDKQSA-N 0.000 description 2
- JJQGZGOEDSSHTE-FOHZUACHSA-N Asp-Thr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JJQGZGOEDSSHTE-FOHZUACHSA-N 0.000 description 2
- 244000063299 Bacillus subtilis Species 0.000 description 2
- 235000014469 Bacillus subtilis Nutrition 0.000 description 2
- 108010040163 CREB-Binding Protein Proteins 0.000 description 2
- 102100021975 CREB-binding protein Human genes 0.000 description 2
- 108091033409 CRISPR Proteins 0.000 description 2
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 2
- FMDCYTBSPZMPQE-JBDRJPRFSA-N Cys-Ala-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMDCYTBSPZMPQE-JBDRJPRFSA-N 0.000 description 2
- VZKXOWRNJDEGLZ-WHFBIAKZSA-N Cys-Asp-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O VZKXOWRNJDEGLZ-WHFBIAKZSA-N 0.000 description 2
- VCIIDXDOPGHMDQ-WDSKDSINSA-N Cys-Gly-Gln Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O VCIIDXDOPGHMDQ-WDSKDSINSA-N 0.000 description 2
- UPURLDIGQGTUPJ-ZKWXMUAHSA-N Cys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N UPURLDIGQGTUPJ-ZKWXMUAHSA-N 0.000 description 2
- XTHUKRLJRUVVBF-WHFBIAKZSA-N Cys-Gly-Ser Chemical compound SC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O XTHUKRLJRUVVBF-WHFBIAKZSA-N 0.000 description 2
- SSNJZBGOMNLSLA-CIUDSAMLSA-N Cys-Leu-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O SSNJZBGOMNLSLA-CIUDSAMLSA-N 0.000 description 2
- XBELMDARIGXDKY-GUBZILKMSA-N Cys-Pro-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CS)N XBELMDARIGXDKY-GUBZILKMSA-N 0.000 description 2
- YNJBLTDKTMKEET-ZLUOBGJFSA-N Cys-Ser-Ser Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O YNJBLTDKTMKEET-ZLUOBGJFSA-N 0.000 description 2
- FCXJJTRGVAZDER-FXQIFTODSA-N Cys-Val-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O FCXJJTRGVAZDER-FXQIFTODSA-N 0.000 description 2
- MHYHLWUGWUBUHF-GUBZILKMSA-N Cys-Val-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CS)N MHYHLWUGWUBUHF-GUBZILKMSA-N 0.000 description 2
- 241000147173 Daphnia longispina Species 0.000 description 2
- 241000238576 Daphnia pulex Species 0.000 description 2
- 241000238557 Decapoda Species 0.000 description 2
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 2
- 101100510416 Drosophila melanogaster Kr-h1 gene Proteins 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- 101150038242 GAL10 gene Proteins 0.000 description 2
- 101001011019 Gallus gallus Gallinacin-10 Proteins 0.000 description 2
- 101001011021 Gallus gallus Gallinacin-12 Proteins 0.000 description 2
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 2
- REJJNXODKSHOKA-ACZMJKKPSA-N Gln-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N REJJNXODKSHOKA-ACZMJKKPSA-N 0.000 description 2
- UWZLBXOBVKRUFE-HGNGGELXSA-N Gln-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N UWZLBXOBVKRUFE-HGNGGELXSA-N 0.000 description 2
- XXLBHPPXDUWYAG-XQXXSGGOSA-N Gln-Ala-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XXLBHPPXDUWYAG-XQXXSGGOSA-N 0.000 description 2
- KWUSGAIFNHQCBY-DCAQKATOSA-N Gln-Arg-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O KWUSGAIFNHQCBY-DCAQKATOSA-N 0.000 description 2
- WOACHWLUOFZLGJ-GUBZILKMSA-N Gln-Arg-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O WOACHWLUOFZLGJ-GUBZILKMSA-N 0.000 description 2
- RGRMOYQUIJVQQD-SRVKXCTJSA-N Gln-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N RGRMOYQUIJVQQD-SRVKXCTJSA-N 0.000 description 2
- KJRXLVZYJJLUCV-DCAQKATOSA-N Gln-Arg-Met Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O KJRXLVZYJJLUCV-DCAQKATOSA-N 0.000 description 2
- OETQLUYCMBARHJ-CIUDSAMLSA-N Gln-Asn-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OETQLUYCMBARHJ-CIUDSAMLSA-N 0.000 description 2
- TWHDOEYLXXQYOZ-FXQIFTODSA-N Gln-Asn-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N TWHDOEYLXXQYOZ-FXQIFTODSA-N 0.000 description 2
- KWLMLNHADZIJIS-CIUDSAMLSA-N Gln-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N KWLMLNHADZIJIS-CIUDSAMLSA-N 0.000 description 2
- CYTSBCIIEHUPDU-ACZMJKKPSA-N Gln-Asp-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O CYTSBCIIEHUPDU-ACZMJKKPSA-N 0.000 description 2
- ULXXDWZMMSQBDC-ACZMJKKPSA-N Gln-Asp-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ULXXDWZMMSQBDC-ACZMJKKPSA-N 0.000 description 2
- NVEASDQHBRZPSU-BQBZGAKWSA-N Gln-Gln-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O NVEASDQHBRZPSU-BQBZGAKWSA-N 0.000 description 2
- NPTGGVQJYRSMCM-GLLZPBPUSA-N Gln-Gln-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPTGGVQJYRSMCM-GLLZPBPUSA-N 0.000 description 2
- LWDGZZGWDMHBOF-FXQIFTODSA-N Gln-Glu-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O LWDGZZGWDMHBOF-FXQIFTODSA-N 0.000 description 2
- ZQPOVSJFBBETHQ-CIUDSAMLSA-N Gln-Glu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZQPOVSJFBBETHQ-CIUDSAMLSA-N 0.000 description 2
- MAGNEQBFSBREJL-DCAQKATOSA-N Gln-Glu-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N MAGNEQBFSBREJL-DCAQKATOSA-N 0.000 description 2
- CLPQUWHBWXFJOX-BQBZGAKWSA-N Gln-Gly-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O CLPQUWHBWXFJOX-BQBZGAKWSA-N 0.000 description 2
- BVELAHPZLYLZDJ-HGNGGELXSA-N Gln-His-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O BVELAHPZLYLZDJ-HGNGGELXSA-N 0.000 description 2
- GFLNKSQHOBOMNM-AVGNSLFASA-N Gln-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)N)N GFLNKSQHOBOMNM-AVGNSLFASA-N 0.000 description 2
- IWUFOVSLWADEJC-AVGNSLFASA-N Gln-His-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IWUFOVSLWADEJC-AVGNSLFASA-N 0.000 description 2
- OOLCSQQPSLIETN-JYJNAYRXSA-N Gln-His-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)N)N)O OOLCSQQPSLIETN-JYJNAYRXSA-N 0.000 description 2
- FYAULIGIFPPOAA-ZPFDUUQYSA-N Gln-Ile-Met Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(O)=O FYAULIGIFPPOAA-ZPFDUUQYSA-N 0.000 description 2
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 2
- VUVKKXPCKILIBD-AVGNSLFASA-N Gln-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VUVKKXPCKILIBD-AVGNSLFASA-N 0.000 description 2
- LHMWTCWZARHLPV-CIUDSAMLSA-N Gln-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N LHMWTCWZARHLPV-CIUDSAMLSA-N 0.000 description 2
- KFHASAPTUOASQN-JYJNAYRXSA-N Gln-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)N)N KFHASAPTUOASQN-JYJNAYRXSA-N 0.000 description 2
- WLRYGVYQFXRJDA-DCAQKATOSA-N Gln-Pro-Pro Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 WLRYGVYQFXRJDA-DCAQKATOSA-N 0.000 description 2
- KUBFPYIMAGXGBT-ACZMJKKPSA-N Gln-Ser-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KUBFPYIMAGXGBT-ACZMJKKPSA-N 0.000 description 2
- OKARHJKJTKFQBM-ACZMJKKPSA-N Gln-Ser-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OKARHJKJTKFQBM-ACZMJKKPSA-N 0.000 description 2
- UTOQQOMEJDPDMX-ACZMJKKPSA-N Gln-Ser-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O UTOQQOMEJDPDMX-ACZMJKKPSA-N 0.000 description 2
- OKQLXOYFUPVEHI-CIUDSAMLSA-N Gln-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N OKQLXOYFUPVEHI-CIUDSAMLSA-N 0.000 description 2
- JILRMFFFCHUUTJ-ACZMJKKPSA-N Gln-Ser-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O JILRMFFFCHUUTJ-ACZMJKKPSA-N 0.000 description 2
- VOUSELYGTNGEPB-NUMRIWBASA-N Gln-Thr-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O VOUSELYGTNGEPB-NUMRIWBASA-N 0.000 description 2
- YRHZWVKUFWCEPW-GLLZPBPUSA-N Gln-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O YRHZWVKUFWCEPW-GLLZPBPUSA-N 0.000 description 2
- SYTFJIQPBRJSOK-NKIYYHGXSA-N Gln-Thr-His Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 SYTFJIQPBRJSOK-NKIYYHGXSA-N 0.000 description 2
- HLRLXVPRJJITSK-IFFSRLJSSA-N Gln-Thr-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HLRLXVPRJJITSK-IFFSRLJSSA-N 0.000 description 2
- CMBXOSFZCFGDLE-IHRRRGAJSA-N Gln-Tyr-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O CMBXOSFZCFGDLE-IHRRRGAJSA-N 0.000 description 2
- ZZLDMBMFKZFQMU-NRPADANISA-N Gln-Val-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O ZZLDMBMFKZFQMU-NRPADANISA-N 0.000 description 2
- SDSMVVSHLAAOJL-UKJIMTQDSA-N Gln-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)N)N SDSMVVSHLAAOJL-UKJIMTQDSA-N 0.000 description 2
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 2
- IYAUFWMUCGBFMQ-CIUDSAMLSA-N Glu-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)CN=C(N)N IYAUFWMUCGBFMQ-CIUDSAMLSA-N 0.000 description 2
- GCYFUZJHAXJKKE-KKUMJFAQSA-N Glu-Arg-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GCYFUZJHAXJKKE-KKUMJFAQSA-N 0.000 description 2
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 2
- WATXSTJXNBOHKD-LAEOZQHASA-N Glu-Asp-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O WATXSTJXNBOHKD-LAEOZQHASA-N 0.000 description 2
- FLQAKQOBSPFGKG-CIUDSAMLSA-N Glu-Cys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FLQAKQOBSPFGKG-CIUDSAMLSA-N 0.000 description 2
- CLROYXHHUZELFX-FXQIFTODSA-N Glu-Gln-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O CLROYXHHUZELFX-FXQIFTODSA-N 0.000 description 2
- PXHABOCPJVTGEK-BQBZGAKWSA-N Glu-Gln-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O PXHABOCPJVTGEK-BQBZGAKWSA-N 0.000 description 2
- VOORMNJKNBGYGK-YUMQZZPRSA-N Glu-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N VOORMNJKNBGYGK-YUMQZZPRSA-N 0.000 description 2
- GXMXPCXXKVWOSM-KQXIARHKSA-N Glu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N GXMXPCXXKVWOSM-KQXIARHKSA-N 0.000 description 2
- LZMQSTPFYJLVJB-GUBZILKMSA-N Glu-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N LZMQSTPFYJLVJB-GUBZILKMSA-N 0.000 description 2
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 2
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 2
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 2
- IOUQWHIEQYQVFD-JYJNAYRXSA-N Glu-Leu-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IOUQWHIEQYQVFD-JYJNAYRXSA-N 0.000 description 2
- SWRVAQHFBRZVNX-GUBZILKMSA-N Glu-Lys-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SWRVAQHFBRZVNX-GUBZILKMSA-N 0.000 description 2
- UJMNFCAHLYKWOZ-DCAQKATOSA-N Glu-Lys-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O UJMNFCAHLYKWOZ-DCAQKATOSA-N 0.000 description 2
- YKBUCXNNBYZYAY-MNXVOIDGSA-N Glu-Lys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YKBUCXNNBYZYAY-MNXVOIDGSA-N 0.000 description 2
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 2
- ZGEJRLJEAMPEDV-SRVKXCTJSA-N Glu-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N ZGEJRLJEAMPEDV-SRVKXCTJSA-N 0.000 description 2
- ZQYZDDXTNQXUJH-CIUDSAMLSA-N Glu-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(=O)O)N ZQYZDDXTNQXUJH-CIUDSAMLSA-N 0.000 description 2
- MRWYPDWDZSLWJM-ACZMJKKPSA-N Glu-Ser-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O MRWYPDWDZSLWJM-ACZMJKKPSA-N 0.000 description 2
- IDEODOAVGCMUQV-GUBZILKMSA-N Glu-Ser-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IDEODOAVGCMUQV-GUBZILKMSA-N 0.000 description 2
- HZISRJBYZAODRV-XQXXSGGOSA-N Glu-Thr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O HZISRJBYZAODRV-XQXXSGGOSA-N 0.000 description 2
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 2
- HJTSRYLPAYGEEC-SIUGBPQLSA-N Glu-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)O)N HJTSRYLPAYGEEC-SIUGBPQLSA-N 0.000 description 2
- HBMRTXJZQDVRFT-DZKIICNBSA-N Glu-Tyr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O HBMRTXJZQDVRFT-DZKIICNBSA-N 0.000 description 2
- GZUKEVBTYNNUQF-WDSKDSINSA-N Gly-Ala-Gln Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GZUKEVBTYNNUQF-WDSKDSINSA-N 0.000 description 2
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 2
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 2
- QSTLUOIOYLYLLF-WDSKDSINSA-N Gly-Asp-Glu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QSTLUOIOYLYLLF-WDSKDSINSA-N 0.000 description 2
- LLXVQPKEQQCISF-YUMQZZPRSA-N Gly-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN LLXVQPKEQQCISF-YUMQZZPRSA-N 0.000 description 2
- FZQLXNIMCPJVJE-YUMQZZPRSA-N Gly-Asp-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FZQLXNIMCPJVJE-YUMQZZPRSA-N 0.000 description 2
- PMNHJLASAAWELO-FOHZUACHSA-N Gly-Asp-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PMNHJLASAAWELO-FOHZUACHSA-N 0.000 description 2
- YYQGVXNKAXUTJU-YUMQZZPRSA-N Gly-Cys-His Chemical compound NCC(=O)N[C@@H](CS)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O YYQGVXNKAXUTJU-YUMQZZPRSA-N 0.000 description 2
- AQLHORCVPGXDJW-IUCAKERBSA-N Gly-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN AQLHORCVPGXDJW-IUCAKERBSA-N 0.000 description 2
- QPDUVFSVVAOUHE-XVKPBYJWSA-N Gly-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)CN)C(O)=O QPDUVFSVVAOUHE-XVKPBYJWSA-N 0.000 description 2
- QSVCIFZPGLOZGH-WDSKDSINSA-N Gly-Glu-Ser Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QSVCIFZPGLOZGH-WDSKDSINSA-N 0.000 description 2
- QPTNELDXWKRIFX-YFKPBYRVSA-N Gly-Gly-Gln Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O QPTNELDXWKRIFX-YFKPBYRVSA-N 0.000 description 2
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 2
- AYBKPDHHVADEDA-YUMQZZPRSA-N Gly-His-Asn Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O AYBKPDHHVADEDA-YUMQZZPRSA-N 0.000 description 2
- LPCKHUXOGVNZRS-YUMQZZPRSA-N Gly-His-Ser Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O LPCKHUXOGVNZRS-YUMQZZPRSA-N 0.000 description 2
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 2
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 2
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 2
- FJWSJWACLMTDMI-WPRPVWTQSA-N Gly-Met-Val Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O FJWSJWACLMTDMI-WPRPVWTQSA-N 0.000 description 2
- JPVGHHQGKPQYIL-KBPBESRZSA-N Gly-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 JPVGHHQGKPQYIL-KBPBESRZSA-N 0.000 description 2
- IEGFSKKANYKBDU-QWHCGFSZSA-N Gly-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)CN)C(=O)O IEGFSKKANYKBDU-QWHCGFSZSA-N 0.000 description 2
- ZZJVYSAQQMDIRD-UWVGGRQHSA-N Gly-Pro-His Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O ZZJVYSAQQMDIRD-UWVGGRQHSA-N 0.000 description 2
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 2
- YABRDIBSPZONIY-BQBZGAKWSA-N Gly-Ser-Met Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O YABRDIBSPZONIY-BQBZGAKWSA-N 0.000 description 2
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 2
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 2
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 2
- FFALDIDGPLUDKV-ZDLURKLDSA-N Gly-Thr-Ser Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O FFALDIDGPLUDKV-ZDLURKLDSA-N 0.000 description 2
- RIYIFUFFFBIOEU-KBPBESRZSA-N Gly-Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 RIYIFUFFFBIOEU-KBPBESRZSA-N 0.000 description 2
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 2
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- KZTLOHBDLMIFSH-XVYDVKMFSA-N His-Ala-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O KZTLOHBDLMIFSH-XVYDVKMFSA-N 0.000 description 2
- QIVPRLJQQVXCIY-HGNGGELXSA-N His-Ala-Gln Chemical compound C[C@H](NC(=O)[C@@H](N)Cc1cnc[nH]1)C(=O)N[C@@H](CCC(N)=O)C(O)=O QIVPRLJQQVXCIY-HGNGGELXSA-N 0.000 description 2
- ZNPRMNDAFQKATM-LKTVYLICSA-N His-Ala-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZNPRMNDAFQKATM-LKTVYLICSA-N 0.000 description 2
- ZIMTWPHIKZEHSE-UWVGGRQHSA-N His-Arg-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O ZIMTWPHIKZEHSE-UWVGGRQHSA-N 0.000 description 2
- JBJNKUOMNZGQIM-PYJNHQTQSA-N His-Arg-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JBJNKUOMNZGQIM-PYJNHQTQSA-N 0.000 description 2
- CJGDTAHEMXLRMB-ULQDDVLXSA-N His-Arg-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O CJGDTAHEMXLRMB-ULQDDVLXSA-N 0.000 description 2
- HRGGKHFHRSFSDE-CIUDSAMLSA-N His-Asn-Ser Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N HRGGKHFHRSFSDE-CIUDSAMLSA-N 0.000 description 2
- VLPMGIJPAWENQB-SRVKXCTJSA-N His-Cys-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O VLPMGIJPAWENQB-SRVKXCTJSA-N 0.000 description 2
- LCNNHVQNFNJLGK-AVGNSLFASA-N His-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N LCNNHVQNFNJLGK-AVGNSLFASA-N 0.000 description 2
- NELVFWFDOKRTOR-SDDRHHMPSA-N His-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O NELVFWFDOKRTOR-SDDRHHMPSA-N 0.000 description 2
- IMPKSPYRPUXYAP-SZMVWBNQSA-N His-Gln-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC3=CN=CN3)N IMPKSPYRPUXYAP-SZMVWBNQSA-N 0.000 description 2
- VBOFRJNDIOPNDO-YUMQZZPRSA-N His-Gly-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N VBOFRJNDIOPNDO-YUMQZZPRSA-N 0.000 description 2
- OEROYDLRVAYIMQ-YUMQZZPRSA-N His-Gly-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O OEROYDLRVAYIMQ-YUMQZZPRSA-N 0.000 description 2
- STOOMQFEJUVAKR-KKUMJFAQSA-N His-His-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CNC=N1 STOOMQFEJUVAKR-KKUMJFAQSA-N 0.000 description 2
- BZKDJRSZWLPJNI-SRVKXCTJSA-N His-His-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O BZKDJRSZWLPJNI-SRVKXCTJSA-N 0.000 description 2
- YAALVYQFVJNXIV-KKUMJFAQSA-N His-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 YAALVYQFVJNXIV-KKUMJFAQSA-N 0.000 description 2
- ZVKDCQVQTGYBQT-LSJOCFKGSA-N His-Pro-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O ZVKDCQVQTGYBQT-LSJOCFKGSA-N 0.000 description 2
- KAXZXLSXFWSNNZ-XVYDVKMFSA-N His-Ser-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KAXZXLSXFWSNNZ-XVYDVKMFSA-N 0.000 description 2
- ZHHLTWUOWXHVQJ-YUMQZZPRSA-N His-Ser-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZHHLTWUOWXHVQJ-YUMQZZPRSA-N 0.000 description 2
- PFOUFRJYHWZJKW-NKIYYHGXSA-N His-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O PFOUFRJYHWZJKW-NKIYYHGXSA-N 0.000 description 2
- ZHMZWSFQRUGLEC-JYJNAYRXSA-N His-Tyr-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZHMZWSFQRUGLEC-JYJNAYRXSA-N 0.000 description 2
- FFYYUUWROYYKFY-IHRRRGAJSA-N His-Val-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O FFYYUUWROYYKFY-IHRRRGAJSA-N 0.000 description 2
- 229940123502 Hormone receptor antagonist Drugs 0.000 description 2
- NKVZTQVGUNLLQW-JBDRJPRFSA-N Ile-Ala-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)O)N NKVZTQVGUNLLQW-JBDRJPRFSA-N 0.000 description 2
- VSZALHITQINTGC-GHCJXIJMSA-N Ile-Ala-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VSZALHITQINTGC-GHCJXIJMSA-N 0.000 description 2
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 2
- FVEWRQXNISSYFO-ZPFDUUQYSA-N Ile-Arg-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FVEWRQXNISSYFO-ZPFDUUQYSA-N 0.000 description 2
- YOTNPRLPIPHQSB-XUXIUFHCSA-N Ile-Arg-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOTNPRLPIPHQSB-XUXIUFHCSA-N 0.000 description 2
- FJWYJQRCVNGEAQ-ZPFDUUQYSA-N Ile-Asn-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N FJWYJQRCVNGEAQ-ZPFDUUQYSA-N 0.000 description 2
- HDODQNPMSHDXJT-GHCJXIJMSA-N Ile-Asn-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O HDODQNPMSHDXJT-GHCJXIJMSA-N 0.000 description 2
- LJKDGRWXYUTRSH-YVNDNENWSA-N Ile-Gln-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LJKDGRWXYUTRSH-YVNDNENWSA-N 0.000 description 2
- OVPYIUNCVSOVNF-ZPFDUUQYSA-N Ile-Gln-Pro Natural products CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O OVPYIUNCVSOVNF-ZPFDUUQYSA-N 0.000 description 2
- HTDRTKMNJRRYOJ-SIUGBPQLSA-N Ile-Gln-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HTDRTKMNJRRYOJ-SIUGBPQLSA-N 0.000 description 2
- XLCZWMJPVGRWHJ-KQXIARHKSA-N Ile-Glu-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N XLCZWMJPVGRWHJ-KQXIARHKSA-N 0.000 description 2
- NHJKZMDIMMTVCK-QXEWZRGKSA-N Ile-Gly-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N NHJKZMDIMMTVCK-QXEWZRGKSA-N 0.000 description 2
- SJLVSMMIFYTSGY-GRLWGSQLSA-N Ile-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SJLVSMMIFYTSGY-GRLWGSQLSA-N 0.000 description 2
- GLLAUPMJCGKPFY-BLMTYFJBSA-N Ile-Ile-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 GLLAUPMJCGKPFY-BLMTYFJBSA-N 0.000 description 2
- KBAPKNDWAGVGTH-IGISWZIWSA-N Ile-Ile-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KBAPKNDWAGVGTH-IGISWZIWSA-N 0.000 description 2
- YGDWPQCLFJNMOL-MNXVOIDGSA-N Ile-Leu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YGDWPQCLFJNMOL-MNXVOIDGSA-N 0.000 description 2
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 2
- MASWXTFJVNRZPT-NAKRPEOUSA-N Ile-Met-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)O)N MASWXTFJVNRZPT-NAKRPEOUSA-N 0.000 description 2
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 2
- VISRCHQHQCLODA-NAKRPEOUSA-N Ile-Pro-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)O)N VISRCHQHQCLODA-NAKRPEOUSA-N 0.000 description 2
- FQYQMFCIJNWDQZ-CYDGBPFRSA-N Ile-Pro-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 FQYQMFCIJNWDQZ-CYDGBPFRSA-N 0.000 description 2
- KTNGVMMGIQWIDV-OSUNSFLBSA-N Ile-Pro-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O KTNGVMMGIQWIDV-OSUNSFLBSA-N 0.000 description 2
- JHNJNTMTZHEDLJ-NAKRPEOUSA-N Ile-Ser-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JHNJNTMTZHEDLJ-NAKRPEOUSA-N 0.000 description 2
- YBKKLDBBPFIXBQ-MBLNEYKQSA-N Ile-Thr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)O)N YBKKLDBBPFIXBQ-MBLNEYKQSA-N 0.000 description 2
- FXJLRZFMKGHYJP-CFMVVWHZSA-N Ile-Tyr-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N FXJLRZFMKGHYJP-CFMVVWHZSA-N 0.000 description 2
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 2
- AUIYHFRUOOKTGX-UKJIMTQDSA-N Ile-Val-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N AUIYHFRUOOKTGX-UKJIMTQDSA-N 0.000 description 2
- YWCJXQKATPNPOE-UKJIMTQDSA-N Ile-Val-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YWCJXQKATPNPOE-UKJIMTQDSA-N 0.000 description 2
- JZBVBOKASHNXAD-NAKRPEOUSA-N Ile-Val-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N JZBVBOKASHNXAD-NAKRPEOUSA-N 0.000 description 2
- QVJMXSGZTCGLHZ-VWADHSNXSA-N Juvenile hormone III Natural products O=C(OC)/C=C(\CC/C=C(\CC[C@H]1C(C)(C)O1)/C)/C QVJMXSGZTCGLHZ-VWADHSNXSA-N 0.000 description 2
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 2
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 2
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 2
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- 241000255777 Lepidoptera Species 0.000 description 2
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 2
- UILIPCLTHRPCRB-XUXIUFHCSA-N Leu-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(C)C)N UILIPCLTHRPCRB-XUXIUFHCSA-N 0.000 description 2
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 2
- OXKYZSRZKBTVEY-ZPFDUUQYSA-N Leu-Asn-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OXKYZSRZKBTVEY-ZPFDUUQYSA-N 0.000 description 2
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 2
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 2
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 2
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 2
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 2
- PPTAQBNUFKTJKA-BJDJZHNGSA-N Leu-Cys-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PPTAQBNUFKTJKA-BJDJZHNGSA-N 0.000 description 2
- ZTLGVASZOIKNIX-DCAQKATOSA-N Leu-Gln-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZTLGVASZOIKNIX-DCAQKATOSA-N 0.000 description 2
- AXZGZMGRBDQTEY-SRVKXCTJSA-N Leu-Gln-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O AXZGZMGRBDQTEY-SRVKXCTJSA-N 0.000 description 2
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 2
- CQGSYZCULZMEDE-SRVKXCTJSA-N Leu-Gln-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CQGSYZCULZMEDE-SRVKXCTJSA-N 0.000 description 2
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 2
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 2
- BKTXKJMNTSMJDQ-AVGNSLFASA-N Leu-His-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BKTXKJMNTSMJDQ-AVGNSLFASA-N 0.000 description 2
- WRLPVDVHNWSSCL-MELADBBJSA-N Leu-His-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N WRLPVDVHNWSSCL-MELADBBJSA-N 0.000 description 2
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 2
- AUBMZAMQCOYSIC-MNXVOIDGSA-N Leu-Ile-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O AUBMZAMQCOYSIC-MNXVOIDGSA-N 0.000 description 2
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 2
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 2
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 2
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 2
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 2
- FKQPWMZLIIATBA-AJNGGQMLSA-N Leu-Lys-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FKQPWMZLIIATBA-AJNGGQMLSA-N 0.000 description 2
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 2
- KXCMQWMNYQOAKA-SRVKXCTJSA-N Leu-Met-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N KXCMQWMNYQOAKA-SRVKXCTJSA-N 0.000 description 2
- FZMNAYBEFGZEIF-AVGNSLFASA-N Leu-Met-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(=O)O)N FZMNAYBEFGZEIF-AVGNSLFASA-N 0.000 description 2
- HDHQQEDVWQGBEE-DCAQKATOSA-N Leu-Met-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O HDHQQEDVWQGBEE-DCAQKATOSA-N 0.000 description 2
- FYPWFNKQVVEELI-ULQDDVLXSA-N Leu-Phe-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 FYPWFNKQVVEELI-ULQDDVLXSA-N 0.000 description 2
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 2
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 2
- MUCIDQMDOYQYBR-IHRRRGAJSA-N Leu-Pro-His Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N MUCIDQMDOYQYBR-IHRRRGAJSA-N 0.000 description 2
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 2
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 2
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 2
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 2
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 2
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 2
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 2
- LJBVRCDPWOJOEK-PPCPHDFISA-N Leu-Thr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LJBVRCDPWOJOEK-PPCPHDFISA-N 0.000 description 2
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 2
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 2
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 2
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 2
- JCFYLFOCALSNLQ-GUBZILKMSA-N Lys-Ala-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JCFYLFOCALSNLQ-GUBZILKMSA-N 0.000 description 2
- UWKNTTJNVSYXPC-CIUDSAMLSA-N Lys-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN UWKNTTJNVSYXPC-CIUDSAMLSA-N 0.000 description 2
- CLBGMWIYPYAZPR-AVGNSLFASA-N Lys-Arg-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O CLBGMWIYPYAZPR-AVGNSLFASA-N 0.000 description 2
- JGAMUXDWYSXYLM-SRVKXCTJSA-N Lys-Arg-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O JGAMUXDWYSXYLM-SRVKXCTJSA-N 0.000 description 2
- WALVCOOOKULCQM-ULQDDVLXSA-N Lys-Arg-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WALVCOOOKULCQM-ULQDDVLXSA-N 0.000 description 2
- DNEJSAIMVANNPA-DCAQKATOSA-N Lys-Asn-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DNEJSAIMVANNPA-DCAQKATOSA-N 0.000 description 2
- OVIVOCSURJYCTM-GUBZILKMSA-N Lys-Asp-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O OVIVOCSURJYCTM-GUBZILKMSA-N 0.000 description 2
- AAORVPFVUIHEAB-YUMQZZPRSA-N Lys-Asp-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O AAORVPFVUIHEAB-YUMQZZPRSA-N 0.000 description 2
- MRWXLRGAFDOILG-DCAQKATOSA-N Lys-Gln-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MRWXLRGAFDOILG-DCAQKATOSA-N 0.000 description 2
- MQMIRLVJXQNTRJ-SDDRHHMPSA-N Lys-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N)C(=O)O MQMIRLVJXQNTRJ-SDDRHHMPSA-N 0.000 description 2
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 2
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 2
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 2
- PAMDBWYMLWOELY-SDDRHHMPSA-N Lys-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O PAMDBWYMLWOELY-SDDRHHMPSA-N 0.000 description 2
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 2
- WAIHHELKYSFIQN-XUXIUFHCSA-N Lys-Ile-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O WAIHHELKYSFIQN-XUXIUFHCSA-N 0.000 description 2
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 2
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 2
- VSTNAUBHKQPVJX-IHRRRGAJSA-N Lys-Met-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O VSTNAUBHKQPVJX-IHRRRGAJSA-N 0.000 description 2
- OBZHNHBAAVEWKI-DCAQKATOSA-N Lys-Pro-Asn Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O OBZHNHBAAVEWKI-DCAQKATOSA-N 0.000 description 2
- MGKFCQFVPKOWOL-CIUDSAMLSA-N Lys-Ser-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N MGKFCQFVPKOWOL-CIUDSAMLSA-N 0.000 description 2
- SQXZLVXQXWILKW-KKUMJFAQSA-N Lys-Ser-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQXZLVXQXWILKW-KKUMJFAQSA-N 0.000 description 2
- DIBZLYZXTSVGLN-CIUDSAMLSA-N Lys-Ser-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O DIBZLYZXTSVGLN-CIUDSAMLSA-N 0.000 description 2
- 101150105382 MET gene Proteins 0.000 description 2
- WXHHTBVYQOSYSL-FXQIFTODSA-N Met-Ala-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O WXHHTBVYQOSYSL-FXQIFTODSA-N 0.000 description 2
- HUKLXYYPZWPXCC-KZVJFYERSA-N Met-Ala-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HUKLXYYPZWPXCC-KZVJFYERSA-N 0.000 description 2
- CAODKDAPYGUMLK-FXQIFTODSA-N Met-Asn-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CAODKDAPYGUMLK-FXQIFTODSA-N 0.000 description 2
- WGBMNLCRYKSWAR-DCAQKATOSA-N Met-Asp-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN WGBMNLCRYKSWAR-DCAQKATOSA-N 0.000 description 2
- YLLWCSDBVGZLOW-CIUDSAMLSA-N Met-Gln-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O YLLWCSDBVGZLOW-CIUDSAMLSA-N 0.000 description 2
- FWTBMGAKKPSTBT-GUBZILKMSA-N Met-Gln-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FWTBMGAKKPSTBT-GUBZILKMSA-N 0.000 description 2
- GPAHWYRSHCKICP-GUBZILKMSA-N Met-Glu-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GPAHWYRSHCKICP-GUBZILKMSA-N 0.000 description 2
- BCRQJDMZQUHQSV-STQMWFEESA-N Met-Gly-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BCRQJDMZQUHQSV-STQMWFEESA-N 0.000 description 2
- AFFKUNVPPLQUGA-DCAQKATOSA-N Met-Leu-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O AFFKUNVPPLQUGA-DCAQKATOSA-N 0.000 description 2
- JYPITOUIQVSCKM-IHRRRGAJSA-N Met-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCSC)N JYPITOUIQVSCKM-IHRRRGAJSA-N 0.000 description 2
- DBXMFHGGHMXYHY-DCAQKATOSA-N Met-Leu-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O DBXMFHGGHMXYHY-DCAQKATOSA-N 0.000 description 2
- XDGFFEZAZHRZFR-RHYQMDGZSA-N Met-Leu-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XDGFFEZAZHRZFR-RHYQMDGZSA-N 0.000 description 2
- WPTHAGXMYDRPFD-SRVKXCTJSA-N Met-Lys-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O WPTHAGXMYDRPFD-SRVKXCTJSA-N 0.000 description 2
- IRVONVRHHJXWTK-RWMBFGLXSA-N Met-Lys-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N IRVONVRHHJXWTK-RWMBFGLXSA-N 0.000 description 2
- WUYLWZRHRLLEGB-AVGNSLFASA-N Met-Met-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O WUYLWZRHRLLEGB-AVGNSLFASA-N 0.000 description 2
- VSJAPSMRFYUOKS-IUCAKERBSA-N Met-Pro-Gly Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O VSJAPSMRFYUOKS-IUCAKERBSA-N 0.000 description 2
- NHXXGBXJTLRGJI-GUBZILKMSA-N Met-Pro-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O NHXXGBXJTLRGJI-GUBZILKMSA-N 0.000 description 2
- WRXOPYNEKGZWAZ-FXQIFTODSA-N Met-Ser-Cys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(O)=O WRXOPYNEKGZWAZ-FXQIFTODSA-N 0.000 description 2
- RMLLCGYYVZKKRT-CIUDSAMLSA-N Met-Ser-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O RMLLCGYYVZKKRT-CIUDSAMLSA-N 0.000 description 2
- SMVTWPOATVIXTN-NAKRPEOUSA-N Met-Ser-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SMVTWPOATVIXTN-NAKRPEOUSA-N 0.000 description 2
- PHURAEXVWLDIGT-LPEHRKFASA-N Met-Ser-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N PHURAEXVWLDIGT-LPEHRKFASA-N 0.000 description 2
- KZKVVWBOGDKHKE-QTKMDUPCSA-N Met-Thr-His Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 KZKVVWBOGDKHKE-QTKMDUPCSA-N 0.000 description 2
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 2
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 2
- 108010034522 NNQQ peptide Proteins 0.000 description 2
- BJEYSVHMGIJORT-NHCYSSNCSA-N Phe-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BJEYSVHMGIJORT-NHCYSSNCSA-N 0.000 description 2
- FPTXMUIBLMGTQH-ONGXEEELSA-N Phe-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 FPTXMUIBLMGTQH-ONGXEEELSA-N 0.000 description 2
- UUWCIPUVJJIEEP-SRVKXCTJSA-N Phe-Asn-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N UUWCIPUVJJIEEP-SRVKXCTJSA-N 0.000 description 2
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 2
- ZLGQEBCCANLYRA-RYUDHWBXSA-N Phe-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O ZLGQEBCCANLYRA-RYUDHWBXSA-N 0.000 description 2
- MJQFZGOIVBDIMZ-WHOFXGATSA-N Phe-Ile-Gly Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O MJQFZGOIVBDIMZ-WHOFXGATSA-N 0.000 description 2
- HTXVATDVCRFORF-MGHWNKPDSA-N Phe-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N HTXVATDVCRFORF-MGHWNKPDSA-N 0.000 description 2
- YKUGPVXSDOOANW-KKUMJFAQSA-N Phe-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKUGPVXSDOOANW-KKUMJFAQSA-N 0.000 description 2
- METZZBCMDXHFMK-BZSNNMDCSA-N Phe-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N METZZBCMDXHFMK-BZSNNMDCSA-N 0.000 description 2
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 2
- WURZLPSMYZLEGH-UNQGMJICSA-N Phe-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=CC=C1)N)O WURZLPSMYZLEGH-UNQGMJICSA-N 0.000 description 2
- PBWNICYZGJQKJV-BZSNNMDCSA-N Phe-Phe-Cys Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CS)C(O)=O PBWNICYZGJQKJV-BZSNNMDCSA-N 0.000 description 2
- BSJCSHIAMSGQGN-BVSLBCMMSA-N Phe-Pro-Trp Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O BSJCSHIAMSGQGN-BVSLBCMMSA-N 0.000 description 2
- MCIXMYKSPQUMJG-SRVKXCTJSA-N Phe-Ser-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MCIXMYKSPQUMJG-SRVKXCTJSA-N 0.000 description 2
- FXEKNHAJIMHRFJ-ULQDDVLXSA-N Phe-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N FXEKNHAJIMHRFJ-ULQDDVLXSA-N 0.000 description 2
- DRVIASBABBMZTF-GUBZILKMSA-N Pro-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@@H]1CCCN1 DRVIASBABBMZTF-GUBZILKMSA-N 0.000 description 2
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 description 2
- XROLYVMNVIKVEM-BQBZGAKWSA-N Pro-Asn-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O XROLYVMNVIKVEM-BQBZGAKWSA-N 0.000 description 2
- XKHCJJPNXFBADI-DCAQKATOSA-N Pro-Asp-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O XKHCJJPNXFBADI-DCAQKATOSA-N 0.000 description 2
- XUSDDSLCRPUKLP-QXEWZRGKSA-N Pro-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 XUSDDSLCRPUKLP-QXEWZRGKSA-N 0.000 description 2
- CKXMGSJPDQXBPG-JYJNAYRXSA-N Pro-Cys-Trp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O CKXMGSJPDQXBPG-JYJNAYRXSA-N 0.000 description 2
- CMOIIANLNNYUTP-SRVKXCTJSA-N Pro-Gln-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O CMOIIANLNNYUTP-SRVKXCTJSA-N 0.000 description 2
- LANQLYHLMYDWJP-SRVKXCTJSA-N Pro-Gln-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O LANQLYHLMYDWJP-SRVKXCTJSA-N 0.000 description 2
- SKICPQLTOXGWGO-GARJFASQSA-N Pro-Gln-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O SKICPQLTOXGWGO-GARJFASQSA-N 0.000 description 2
- XZONQWUEBAFQPO-HJGDQZAQSA-N Pro-Gln-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XZONQWUEBAFQPO-HJGDQZAQSA-N 0.000 description 2
- JMVQDLDPDBXAAX-YUMQZZPRSA-N Pro-Gly-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 JMVQDLDPDBXAAX-YUMQZZPRSA-N 0.000 description 2
- FKLSMYYLJHYPHH-UWVGGRQHSA-N Pro-Gly-Leu Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O FKLSMYYLJHYPHH-UWVGGRQHSA-N 0.000 description 2
- FEVDNIBDCRKMER-IUCAKERBSA-N Pro-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEVDNIBDCRKMER-IUCAKERBSA-N 0.000 description 2
- CLJLVCYFABNTHP-DCAQKATOSA-N Pro-Leu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O CLJLVCYFABNTHP-DCAQKATOSA-N 0.000 description 2
- GURGCNUWVSDYTP-SRVKXCTJSA-N Pro-Leu-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GURGCNUWVSDYTP-SRVKXCTJSA-N 0.000 description 2
- XYSXOCIWCPFOCG-IHRRRGAJSA-N Pro-Leu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XYSXOCIWCPFOCG-IHRRRGAJSA-N 0.000 description 2
- HBBBLSVBQGZKOZ-GUBZILKMSA-N Pro-Met-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O HBBBLSVBQGZKOZ-GUBZILKMSA-N 0.000 description 2
- WIPAMEKBSHNFQE-IUCAKERBSA-N Pro-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@@H]1CCCN1 WIPAMEKBSHNFQE-IUCAKERBSA-N 0.000 description 2
- GFHXZNVJIKMAGO-IHRRRGAJSA-N Pro-Phe-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O GFHXZNVJIKMAGO-IHRRRGAJSA-N 0.000 description 2
- SVXXJYJCRNKDDE-AVGNSLFASA-N Pro-Pro-His Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CN=CN1 SVXXJYJCRNKDDE-AVGNSLFASA-N 0.000 description 2
- RCYUBVHMVUHEBM-RCWTZXSCSA-N Pro-Pro-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RCYUBVHMVUHEBM-RCWTZXSCSA-N 0.000 description 2
- RTQKBZIRDWZLDF-BZSNNMDCSA-N Pro-Pro-Trp Chemical compound C([C@H]1C(=O)N[C@@H](CC=2C3=CC=CC=C3NC=2)C(=O)O)CCN1C(=O)[C@@H]1CCCN1 RTQKBZIRDWZLDF-BZSNNMDCSA-N 0.000 description 2
- OWQXAJQZLWHPBH-FXQIFTODSA-N Pro-Ser-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O OWQXAJQZLWHPBH-FXQIFTODSA-N 0.000 description 2
- BJCXXMGGPHRSHV-GUBZILKMSA-N Pro-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BJCXXMGGPHRSHV-GUBZILKMSA-N 0.000 description 2
- PRKWBYCXBBSLSK-GUBZILKMSA-N Pro-Ser-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O PRKWBYCXBBSLSK-GUBZILKMSA-N 0.000 description 2
- RMJZWERKFFNNNS-XGEHTFHBSA-N Pro-Thr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMJZWERKFFNNNS-XGEHTFHBSA-N 0.000 description 2
- FUOGXAQMNJMBFG-WPRPVWTQSA-N Pro-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FUOGXAQMNJMBFG-WPRPVWTQSA-N 0.000 description 2
- 241001302207 Scapholeberis Species 0.000 description 2
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 2
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 2
- DWUIECHTAMYEFL-XVYDVKMFSA-N Ser-Ala-His Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 DWUIECHTAMYEFL-XVYDVKMFSA-N 0.000 description 2
- IDQFQFVEWMWRQQ-DLOVCJGASA-N Ser-Ala-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IDQFQFVEWMWRQQ-DLOVCJGASA-N 0.000 description 2
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 2
- UGJRQLURDVGULT-LKXGYXEUSA-N Ser-Asn-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UGJRQLURDVGULT-LKXGYXEUSA-N 0.000 description 2
- MESDJCNHLZBMEP-ZLUOBGJFSA-N Ser-Asp-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MESDJCNHLZBMEP-ZLUOBGJFSA-N 0.000 description 2
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 2
- BTPAWKABYQMKKN-LKXGYXEUSA-N Ser-Asp-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BTPAWKABYQMKKN-LKXGYXEUSA-N 0.000 description 2
- SNNSYBWPPVAXQW-ZLUOBGJFSA-N Ser-Cys-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)O)N)O SNNSYBWPPVAXQW-ZLUOBGJFSA-N 0.000 description 2
- IXUGADGDCQDLSA-FXQIFTODSA-N Ser-Gln-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N IXUGADGDCQDLSA-FXQIFTODSA-N 0.000 description 2
- SQBLRDDJTUJDMV-ACZMJKKPSA-N Ser-Glu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQBLRDDJTUJDMV-ACZMJKKPSA-N 0.000 description 2
- UFKPDBLKLOBMRH-XHNCKOQMSA-N Ser-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)C(=O)O UFKPDBLKLOBMRH-XHNCKOQMSA-N 0.000 description 2
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 2
- SVWQEIRZHHNBIO-WHFBIAKZSA-N Ser-Gly-Cys Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CS)C(O)=O SVWQEIRZHHNBIO-WHFBIAKZSA-N 0.000 description 2
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 2
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 2
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 2
- FYUIFUJFNCLUIX-XVYDVKMFSA-N Ser-His-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O FYUIFUJFNCLUIX-XVYDVKMFSA-N 0.000 description 2
- RIAKPZVSNBBNRE-BJDJZHNGSA-N Ser-Ile-Leu Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O RIAKPZVSNBBNRE-BJDJZHNGSA-N 0.000 description 2
- YMDNFPNTIPQMJP-NAKRPEOUSA-N Ser-Ile-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(O)=O YMDNFPNTIPQMJP-NAKRPEOUSA-N 0.000 description 2
- MOINZPRHJGTCHZ-MMWGEVLESA-N Ser-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N MOINZPRHJGTCHZ-MMWGEVLESA-N 0.000 description 2
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 2
- KCNSGAMPBPYUAI-CIUDSAMLSA-N Ser-Leu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KCNSGAMPBPYUAI-CIUDSAMLSA-N 0.000 description 2
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 2
- GJFYFGOEWLDQGW-GUBZILKMSA-N Ser-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GJFYFGOEWLDQGW-GUBZILKMSA-N 0.000 description 2
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 2
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 2
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 2
- XXNYYSXNXCJYKX-DCAQKATOSA-N Ser-Leu-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O XXNYYSXNXCJYKX-DCAQKATOSA-N 0.000 description 2
- PTWIYDNFWPXQSD-GARJFASQSA-N Ser-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N)C(=O)O PTWIYDNFWPXQSD-GARJFASQSA-N 0.000 description 2
- FPCGZYMRFFIYIH-CIUDSAMLSA-N Ser-Lys-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O FPCGZYMRFFIYIH-CIUDSAMLSA-N 0.000 description 2
- JUTGONBTALQWMK-NAKRPEOUSA-N Ser-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CO)N JUTGONBTALQWMK-NAKRPEOUSA-N 0.000 description 2
- RXSWQCATLWVDLI-XGEHTFHBSA-N Ser-Met-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RXSWQCATLWVDLI-XGEHTFHBSA-N 0.000 description 2
- RHAPJNVNWDBFQI-BQBZGAKWSA-N Ser-Pro-Gly Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O RHAPJNVNWDBFQI-BQBZGAKWSA-N 0.000 description 2
- GZGFSPWOMUKKCV-NAKRPEOUSA-N Ser-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO GZGFSPWOMUKKCV-NAKRPEOUSA-N 0.000 description 2
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 2
- AZWNCEBQZXELEZ-FXQIFTODSA-N Ser-Pro-Ser Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O AZWNCEBQZXELEZ-FXQIFTODSA-N 0.000 description 2
- CKDXFSPMIDSMGV-GUBZILKMSA-N Ser-Pro-Val Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O CKDXFSPMIDSMGV-GUBZILKMSA-N 0.000 description 2
- FZXOPYUEQGDGMS-ACZMJKKPSA-N Ser-Ser-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZXOPYUEQGDGMS-ACZMJKKPSA-N 0.000 description 2
- GYDFRTRSSXOZCR-ACZMJKKPSA-N Ser-Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GYDFRTRSSXOZCR-ACZMJKKPSA-N 0.000 description 2
- NVNPWELENFJOHH-CIUDSAMLSA-N Ser-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CO)N NVNPWELENFJOHH-CIUDSAMLSA-N 0.000 description 2
- OZPDGESCTGGNAD-CIUDSAMLSA-N Ser-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CO OZPDGESCTGGNAD-CIUDSAMLSA-N 0.000 description 2
- OLKICIBQRVSQMA-SRVKXCTJSA-N Ser-Ser-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OLKICIBQRVSQMA-SRVKXCTJSA-N 0.000 description 2
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 2
- LLSLRQOEAFCZLW-NRPADANISA-N Ser-Val-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LLSLRQOEAFCZLW-NRPADANISA-N 0.000 description 2
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 2
- ANOQEBQWIAYIMV-AEJSXWLSSA-N Ser-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ANOQEBQWIAYIMV-AEJSXWLSSA-N 0.000 description 2
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 2
- 241001302208 Simocephalus Species 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 238000002105 Southern blotting Methods 0.000 description 2
- 102000007451 Steroid Receptors Human genes 0.000 description 2
- 108010085012 Steroid Receptors Proteins 0.000 description 2
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 2
- DFTCYYILCSQGIZ-GCJQMDKQSA-N Thr-Ala-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DFTCYYILCSQGIZ-GCJQMDKQSA-N 0.000 description 2
- NJEMRSFGDNECGF-GCJQMDKQSA-N Thr-Ala-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O NJEMRSFGDNECGF-GCJQMDKQSA-N 0.000 description 2
- XVNZSJIKGJLQLH-RCWTZXSCSA-N Thr-Arg-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCSC)C(=O)O)N)O XVNZSJIKGJLQLH-RCWTZXSCSA-N 0.000 description 2
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 2
- QGXCWPNQVCYJEL-NUMRIWBASA-N Thr-Asn-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGXCWPNQVCYJEL-NUMRIWBASA-N 0.000 description 2
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 2
- PQLXHSACXPGWPD-GSSVUCPTSA-N Thr-Asn-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PQLXHSACXPGWPD-GSSVUCPTSA-N 0.000 description 2
- NLJKZUGAIIRWJN-LKXGYXEUSA-N Thr-Asp-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N)O NLJKZUGAIIRWJN-LKXGYXEUSA-N 0.000 description 2
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 2
- GNHRVXYZKWSJTF-HJGDQZAQSA-N Thr-Asp-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GNHRVXYZKWSJTF-HJGDQZAQSA-N 0.000 description 2
- KRPKYGOFYUNIGM-XVSYOHENSA-N Thr-Asp-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O KRPKYGOFYUNIGM-XVSYOHENSA-N 0.000 description 2
- VUVCRYXYUUPGSB-GLLZPBPUSA-N Thr-Gln-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O VUVCRYXYUUPGSB-GLLZPBPUSA-N 0.000 description 2
- GUZGCDIZVGODML-NKIYYHGXSA-N Thr-Gln-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O GUZGCDIZVGODML-NKIYYHGXSA-N 0.000 description 2
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 2
- WPSDXXQRIVKBAY-NKIYYHGXSA-N Thr-His-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O WPSDXXQRIVKBAY-NKIYYHGXSA-N 0.000 description 2
- KRGDDWVBBDLPSJ-CUJWVEQBSA-N Thr-His-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O KRGDDWVBBDLPSJ-CUJWVEQBSA-N 0.000 description 2
- ZBKDBZUTTXINIX-RWRJDSDZSA-N Thr-Ile-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZBKDBZUTTXINIX-RWRJDSDZSA-N 0.000 description 2
- XTCNBOBTROGWMW-RWRJDSDZSA-N Thr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XTCNBOBTROGWMW-RWRJDSDZSA-N 0.000 description 2
- GMXIJHCBTZDAPD-QPHKQPEJSA-N Thr-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N GMXIJHCBTZDAPD-QPHKQPEJSA-N 0.000 description 2
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 2
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 2
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 2
- SPVHQURZJCUDQC-VOAKCMCISA-N Thr-Lys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O SPVHQURZJCUDQC-VOAKCMCISA-N 0.000 description 2
- XSEPSRUDSPHMPX-KATARQTJSA-N Thr-Lys-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O XSEPSRUDSPHMPX-KATARQTJSA-N 0.000 description 2
- PUEWAXRPXOEQOW-HJGDQZAQSA-N Thr-Met-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(O)=O PUEWAXRPXOEQOW-HJGDQZAQSA-N 0.000 description 2
- WTMPKZWHRCMMMT-KZVJFYERSA-N Thr-Pro-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WTMPKZWHRCMMMT-KZVJFYERSA-N 0.000 description 2
- NYQIZWROIMIQSL-VEVYYDQMSA-N Thr-Pro-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O NYQIZWROIMIQSL-VEVYYDQMSA-N 0.000 description 2
- JAJOFWABAUKAEJ-QTKMDUPCSA-N Thr-Pro-His Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O JAJOFWABAUKAEJ-QTKMDUPCSA-N 0.000 description 2
- YGCDFAJJCRVQKU-RCWTZXSCSA-N Thr-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O YGCDFAJJCRVQKU-RCWTZXSCSA-N 0.000 description 2
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 2
- PRTHQBSMXILLPC-XGEHTFHBSA-N Thr-Ser-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PRTHQBSMXILLPC-XGEHTFHBSA-N 0.000 description 2
- STUAPCLEDMKXKL-LKXGYXEUSA-N Thr-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O STUAPCLEDMKXKL-LKXGYXEUSA-N 0.000 description 2
- DOBIBIXIHJKVJF-XKBZYTNZSA-N Thr-Ser-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O DOBIBIXIHJKVJF-XKBZYTNZSA-N 0.000 description 2
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 2
- NQQMWWVVGIXUOX-SVSWQMSJSA-N Thr-Ser-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NQQMWWVVGIXUOX-SVSWQMSJSA-N 0.000 description 2
- IEZVHOULSUULHD-XGEHTFHBSA-N Thr-Ser-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O IEZVHOULSUULHD-XGEHTFHBSA-N 0.000 description 2
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 2
- PELIQFPESHBTMA-WLTAIBSBSA-N Thr-Tyr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 PELIQFPESHBTMA-WLTAIBSBSA-N 0.000 description 2
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 2
- AKHDFZHUPGVFEJ-YEPSODPASA-N Thr-Val-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AKHDFZHUPGVFEJ-YEPSODPASA-N 0.000 description 2
- 108700009124 Transcription Initiation Site Proteins 0.000 description 2
- CXUFDWZBHKUGKK-CABZTGNLSA-N Trp-Ala-Gly Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O)=CNC2=C1 CXUFDWZBHKUGKK-CABZTGNLSA-N 0.000 description 2
- RNFZZCMCRDFNAE-WFBYXXMGSA-N Trp-Asn-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O RNFZZCMCRDFNAE-WFBYXXMGSA-N 0.000 description 2
- OJKVFAWXPGCJMF-BPUTZDHNSA-N Trp-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)N[C@@H](CO)C(=O)O OJKVFAWXPGCJMF-BPUTZDHNSA-N 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- XLMDWQNAOKLKCP-XDTLVQLUSA-N Tyr-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N XLMDWQNAOKLKCP-XDTLVQLUSA-N 0.000 description 2
- ADBDQGBDNUTRDB-ULQDDVLXSA-N Tyr-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O ADBDQGBDNUTRDB-ULQDDVLXSA-N 0.000 description 2
- CKKFTIQYURNSEI-IHRRRGAJSA-N Tyr-Asn-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CKKFTIQYURNSEI-IHRRRGAJSA-N 0.000 description 2
- XQYHLZNPOTXRMQ-KKUMJFAQSA-N Tyr-Glu-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XQYHLZNPOTXRMQ-KKUMJFAQSA-N 0.000 description 2
- SLCSPPCQWUHPPO-JYJNAYRXSA-N Tyr-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 SLCSPPCQWUHPPO-JYJNAYRXSA-N 0.000 description 2
- JHORGUYURUBVOM-KKUMJFAQSA-N Tyr-His-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O JHORGUYURUBVOM-KKUMJFAQSA-N 0.000 description 2
- ILTXFANLDMJWPR-SIUGBPQLSA-N Tyr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N ILTXFANLDMJWPR-SIUGBPQLSA-N 0.000 description 2
- QARCDOCCDOLJSF-HJPIBITLSA-N Tyr-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QARCDOCCDOLJSF-HJPIBITLSA-N 0.000 description 2
- BSCBBPKDVOZICB-KKUMJFAQSA-N Tyr-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BSCBBPKDVOZICB-KKUMJFAQSA-N 0.000 description 2
- CDBXVDXSLPLFMD-BPNCWPANSA-N Tyr-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDBXVDXSLPLFMD-BPNCWPANSA-N 0.000 description 2
- XJPXTYLVMUZGNW-IHRRRGAJSA-N Tyr-Pro-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O XJPXTYLVMUZGNW-IHRRRGAJSA-N 0.000 description 2
- RCMWNNJFKNDKQR-UFYCRDLUSA-N Tyr-Pro-Phe Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 RCMWNNJFKNDKQR-UFYCRDLUSA-N 0.000 description 2
- QFXVAFIHVWXXBJ-AVGNSLFASA-N Tyr-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O QFXVAFIHVWXXBJ-AVGNSLFASA-N 0.000 description 2
- HRHYJNLMIJWGLF-BZSNNMDCSA-N Tyr-Ser-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 HRHYJNLMIJWGLF-BZSNNMDCSA-N 0.000 description 2
- SYFHQHYTNCQCCN-MELADBBJSA-N Tyr-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O SYFHQHYTNCQCCN-MELADBBJSA-N 0.000 description 2
- UMSZZGTXGKHTFJ-SRVKXCTJSA-N Tyr-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 UMSZZGTXGKHTFJ-SRVKXCTJSA-N 0.000 description 2
- TYFLVOUZHQUBGM-IHRRRGAJSA-N Tyr-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TYFLVOUZHQUBGM-IHRRRGAJSA-N 0.000 description 2
- PWKMJDQXKCENMF-MEYUZBJRSA-N Tyr-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O PWKMJDQXKCENMF-MEYUZBJRSA-N 0.000 description 2
- 101150050575 URA3 gene Proteins 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- IZFVRRYRMQFVGX-NRPADANISA-N Val-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N IZFVRRYRMQFVGX-NRPADANISA-N 0.000 description 2
- REJBPZVUHYNMEN-LSJOCFKGSA-N Val-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N REJBPZVUHYNMEN-LSJOCFKGSA-N 0.000 description 2
- HNWQUBBOBKSFQV-AVGNSLFASA-N Val-Arg-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HNWQUBBOBKSFQV-AVGNSLFASA-N 0.000 description 2
- GXAZTLJYINLMJL-LAEOZQHASA-N Val-Asn-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N GXAZTLJYINLMJL-LAEOZQHASA-N 0.000 description 2
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 2
- ZSZFTYVFQLUWBF-QXEWZRGKSA-N Val-Asp-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N ZSZFTYVFQLUWBF-QXEWZRGKSA-N 0.000 description 2
- YCMXFKWYJFZFKS-LAEOZQHASA-N Val-Gln-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCMXFKWYJFZFKS-LAEOZQHASA-N 0.000 description 2
- PGBJAZDAEWPDAA-NHCYSSNCSA-N Val-Gln-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N PGBJAZDAEWPDAA-NHCYSSNCSA-N 0.000 description 2
- BEGDZYNDCNEGJZ-XVKPBYJWSA-N Val-Gly-Gln Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O BEGDZYNDCNEGJZ-XVKPBYJWSA-N 0.000 description 2
- OVBMCNDKCWAXMZ-NAKRPEOUSA-N Val-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N OVBMCNDKCWAXMZ-NAKRPEOUSA-N 0.000 description 2
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 2
- JVGHIFMSFBZDHH-WPRPVWTQSA-N Val-Met-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N JVGHIFMSFBZDHH-WPRPVWTQSA-N 0.000 description 2
- UZFNHAXYMICTBU-DZKIICNBSA-N Val-Phe-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UZFNHAXYMICTBU-DZKIICNBSA-N 0.000 description 2
- JQTYTBPCSOAZHI-FXQIFTODSA-N Val-Ser-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N JQTYTBPCSOAZHI-FXQIFTODSA-N 0.000 description 2
- KRAHMIJVUPUOTQ-DCAQKATOSA-N Val-Ser-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KRAHMIJVUPUOTQ-DCAQKATOSA-N 0.000 description 2
- QZKVWWIUSQGWMY-IHRRRGAJSA-N Val-Ser-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QZKVWWIUSQGWMY-IHRRRGAJSA-N 0.000 description 2
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 2
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 2
- DLRZGNXCXUGIDG-KKHAAJSZSA-N Val-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O DLRZGNXCXUGIDG-KKHAAJSZSA-N 0.000 description 2
- DVLWZWNAQUBZBC-ZNSHCXBVSA-N Val-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N)O DVLWZWNAQUBZBC-ZNSHCXBVSA-N 0.000 description 2
- YLBNZCJFSVJDRJ-KJEVXHAQSA-N Val-Thr-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O YLBNZCJFSVJDRJ-KJEVXHAQSA-N 0.000 description 2
- ZHWZDZFWBXWPDW-GUBZILKMSA-N Val-Val-Cys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(O)=O ZHWZDZFWBXWPDW-GUBZILKMSA-N 0.000 description 2
- VVIZITNVZUAEMI-DLOVCJGASA-N Val-Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O VVIZITNVZUAEMI-DLOVCJGASA-N 0.000 description 2
- SSKKGOWRPNIVDW-AVGNSLFASA-N Val-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N SSKKGOWRPNIVDW-AVGNSLFASA-N 0.000 description 2
- JSOXWWFKRJKTMT-WOPDTQHZSA-N Val-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N JSOXWWFKRJKTMT-WOPDTQHZSA-N 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 229960000643 adenine Drugs 0.000 description 2
- 239000003470 adrenal cortex hormone Substances 0.000 description 2
- UCTWMZQNUQWSLP-UHFFFAOYSA-N adrenaline Chemical compound CNCC(O)C1=CC=C(O)C(O)=C1 UCTWMZQNUQWSLP-UHFFFAOYSA-N 0.000 description 2
- 239000008272 agar Substances 0.000 description 2
- 108010031014 alanyl-histidyl-leucyl-leucine Proteins 0.000 description 2
- 108010011559 alanylphenylalanine Proteins 0.000 description 2
- GZCGUPFRVQAUEE-SLPGGIOYSA-N aldehydo-D-glucose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C=O GZCGUPFRVQAUEE-SLPGGIOYSA-N 0.000 description 2
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 2
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 2
- 235000011130 ammonium sulphate Nutrition 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 108010008355 arginyl-glutamine Proteins 0.000 description 2
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 2
- 108010091092 arginyl-glycyl-proline Proteins 0.000 description 2
- 108010068380 arginylarginine Proteins 0.000 description 2
- 108010062796 arginyllysine Proteins 0.000 description 2
- 108010060035 arginylproline Proteins 0.000 description 2
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 2
- 108010077245 asparaginyl-proline Proteins 0.000 description 2
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 2
- 238000002869 basic local alignment search tool Methods 0.000 description 2
- USRKFGIXLGKMKU-ABAIWWIYSA-N benthiavalicarb-isopropyl Chemical compound C1=C(F)C=C2SC([C@@H](C)NC(=O)[C@H](C(C)C)NC(=O)OC(C)C)=NC2=C1 USRKFGIXLGKMKU-ABAIWWIYSA-N 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 230000003081 coactivator Effects 0.000 description 2
- 230000001268 conjugating effect Effects 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 210000004748 cultured cell Anatomy 0.000 description 2
- 108010069495 cysteinyltyrosine Proteins 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- DFBKLUNHFCTMDC-PICURKEMSA-N dieldrin Chemical compound C([C@H]1[C@H]2[C@@]3(Cl)C(Cl)=C([C@]([C@H]22)(Cl)C3(Cl)Cl)Cl)[C@H]2[C@@H]2[C@H]1O2 DFBKLUNHFCTMDC-PICURKEMSA-N 0.000 description 2
- VYFYYTLLBUKUHU-UHFFFAOYSA-N dopamine Chemical compound NCCC1=CC=C(O)C(O)=C1 VYFYYTLLBUKUHU-UHFFFAOYSA-N 0.000 description 2
- 235000013601 eggs Nutrition 0.000 description 2
- 230000002124 endocrine Effects 0.000 description 2
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 2
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 2
- 108010079547 glutamylmethionine Proteins 0.000 description 2
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 2
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 2
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 2
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 2
- 108010043293 glycyl-prolyl-glycyl-glycine Proteins 0.000 description 2
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 2
- 108010010147 glycylglutamine Proteins 0.000 description 2
- 108010020688 glycylhistidine Proteins 0.000 description 2
- 108010087823 glycyltyrosine Proteins 0.000 description 2
- 239000003163 gonadal steroid hormone Substances 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 108010040030 histidinoalanine Proteins 0.000 description 2
- 108010050343 histidyl-alanyl-glutamine Proteins 0.000 description 2
- 230000006801 homologous recombination Effects 0.000 description 2
- 238000002744 homologous recombination Methods 0.000 description 2
- 230000003054 hormonal effect Effects 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- 108010031424 isoleucyl-prolyl-proline Proteins 0.000 description 2
- QVJMXSGZTCGLHZ-HONBPKQLSA-N juvenile hormone III Chemical compound COC(=O)\C=C(/C)CC\C=C(/C)CC[C@H]1OC1(C)C QVJMXSGZTCGLHZ-HONBPKQLSA-N 0.000 description 2
- 239000002950 juvenile hormone derivative Substances 0.000 description 2
- 229930000772 juvenile hormones III Natural products 0.000 description 2
- 108010053037 kyotorphin Proteins 0.000 description 2
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 2
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 2
- 108010000761 leucylarginine Proteins 0.000 description 2
- 239000003446 ligand Substances 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 108010054155 lysyllysine Proteins 0.000 description 2
- 108010022588 methionyl-lysyl-proline Proteins 0.000 description 2
- 108010005942 methionylglycine Proteins 0.000 description 2
- 108010085203 methionylmethionine Proteins 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 108010012581 phenylalanylglutamate Proteins 0.000 description 2
- 239000000186 progesterone Substances 0.000 description 2
- 229960003387 progesterone Drugs 0.000 description 2
- 108010087846 prolyl-prolyl-glycine Proteins 0.000 description 2
- 108010079317 prolyl-tyrosine Proteins 0.000 description 2
- 108010070643 prolylglutamic acid Proteins 0.000 description 2
- 108010029020 prolylglycine Proteins 0.000 description 2
- 108010015796 prolylisoleucine Proteins 0.000 description 2
- CRFYLQMIDWBKRT-LPYMAVHISA-N pyribencarb Chemical compound C1=C(Cl)C(CNC(=O)OC)=CC(C(\C)=N\OCC=2N=C(C)C=CC=2)=C1 CRFYLQMIDWBKRT-LPYMAVHISA-N 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 239000006152 selective media Substances 0.000 description 2
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 2
- 108010007375 seryl-seryl-seryl-arginine Proteins 0.000 description 2
- 230000020509 sex determination Effects 0.000 description 2
- 239000011734 sodium Substances 0.000 description 2
- 108010005652 splenotritin Proteins 0.000 description 2
- 239000008223 sterile water Substances 0.000 description 2
- 229960003604 testosterone Drugs 0.000 description 2
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 108010084932 tryptophyl-proline Proteins 0.000 description 2
- 108010051110 tyrosyl-lysine Proteins 0.000 description 2
- 108010003137 tyrosyltyrosine Proteins 0.000 description 2
- SFLSHLFXELFNJZ-QMMMGPOBSA-N (-)-norepinephrine Chemical compound NC[C@H](O)C1=CC=C(O)C(O)=C1 SFLSHLFXELFNJZ-QMMMGPOBSA-N 0.000 description 1
- KPSTXQYTZBZXMM-UHFFFAOYSA-N 2-[8-chloro-4-(4-methoxyphenyl)-3-oxoquinoxaline-2-carbonyl]cyclohexane-1,3-dione Chemical compound C1=CC(OC)=CC=C1N1C(=O)C(C(=O)C2C(CCCC2=O)=O)=NC2=C(Cl)C=CC=C21 KPSTXQYTZBZXMM-UHFFFAOYSA-N 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 1
- FXKNPWNXPQZLES-ZLUOBGJFSA-N Ala-Asn-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FXKNPWNXPQZLES-ZLUOBGJFSA-N 0.000 description 1
- NZGRHTKZFSVPAN-BIIVOSGPSA-N Ala-Ser-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N NZGRHTKZFSVPAN-BIIVOSGPSA-N 0.000 description 1
- KUFVXLQLDHJVOG-SHGPDSBTSA-N Ala-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C)N)O KUFVXLQLDHJVOG-SHGPDSBTSA-N 0.000 description 1
- 241000219195 Arabidopsis thaliana Species 0.000 description 1
- 241000239223 Arachnida Species 0.000 description 1
- OZNSCVPYWZRQPY-CIUDSAMLSA-N Arg-Asp-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OZNSCVPYWZRQPY-CIUDSAMLSA-N 0.000 description 1
- KRQSPVKUISQQFS-FJXKBIBVSA-N Arg-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N KRQSPVKUISQQFS-FJXKBIBVSA-N 0.000 description 1
- KWTQSFXGGICVPE-WCCKRBBISA-N Arginine hydrochloride Chemical compound Cl.OC(=O)[C@@H](N)CCCN=C(N)N KWTQSFXGGICVPE-WCCKRBBISA-N 0.000 description 1
- ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N Asn-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N 0.000 description 1
- KXFCBAHYSLJCCY-ZLUOBGJFSA-N Asn-Asn-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O KXFCBAHYSLJCCY-ZLUOBGJFSA-N 0.000 description 1
- PIWWUBYJNONVTJ-ZLUOBGJFSA-N Asn-Asp-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N PIWWUBYJNONVTJ-ZLUOBGJFSA-N 0.000 description 1
- GJFYPBDMUGGLFR-NKWVEPMBSA-N Asn-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC(=O)N)N)C(=O)O GJFYPBDMUGGLFR-NKWVEPMBSA-N 0.000 description 1
- NKLRWRRVYGQNIH-GHCJXIJMSA-N Asn-Ile-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O NKLRWRRVYGQNIH-GHCJXIJMSA-N 0.000 description 1
- DAYDURRBMDCCFL-AAEUAGOBSA-N Asn-Trp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N DAYDURRBMDCCFL-AAEUAGOBSA-N 0.000 description 1
- YDJVIBMKAMQPPP-LAEOZQHASA-N Asp-Glu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O YDJVIBMKAMQPPP-LAEOZQHASA-N 0.000 description 1
- QHHVSXGWLYEAGX-GUBZILKMSA-N Asp-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N QHHVSXGWLYEAGX-GUBZILKMSA-N 0.000 description 1
- BYLPQJAWXJWUCJ-YDHLFZDLSA-N Asp-Tyr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O BYLPQJAWXJWUCJ-YDHLFZDLSA-N 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 108010001572 Basic-Leucine Zipper Transcription Factors Proteins 0.000 description 1
- 102000000806 Basic-Leucine Zipper Transcription Factors Human genes 0.000 description 1
- 241000255789 Bombyx mori Species 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 238000010354 CRISPR gene editing Methods 0.000 description 1
- 241001126412 Ceriodaphnia cornuta Species 0.000 description 1
- 241000235856 Ceriodaphnia dubia Species 0.000 description 1
- 241000481607 Ceriodaphnia pulchella Species 0.000 description 1
- 241000890169 Ceriodaphnia reticulata Species 0.000 description 1
- 241001456553 Chanodichthys dabryi Species 0.000 description 1
- 241000258920 Chilopoda Species 0.000 description 1
- 101100449641 Chlorobium chlorochromatii (strain CaD3) hemL gene Proteins 0.000 description 1
- 241000238586 Cirripedia Species 0.000 description 1
- 241000238571 Cladocera Species 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 102100030497 Cytochrome c Human genes 0.000 description 1
- CKLJMWTZIZZHCS-UHFFFAOYSA-N D-OH-Asp Natural products OC(=O)C(N)CC(O)=O CKLJMWTZIZZHCS-UHFFFAOYSA-N 0.000 description 1
- UCNVFOCBFJOQAL-UHFFFAOYSA-N DDE Chemical group C=1C=C(Cl)C=CC=1C(=C(Cl)Cl)C1=CC=C(Cl)C=C1 UCNVFOCBFJOQAL-UHFFFAOYSA-N 0.000 description 1
- 241000252212 Danio rerio Species 0.000 description 1
- 241001302539 Daphnia ambigua Species 0.000 description 1
- 241000912870 Daphnia cristata Species 0.000 description 1
- 241001124339 Daphnia galeata Species 0.000 description 1
- 241000147113 Daphnia longiremis Species 0.000 description 1
- 241001494242 Daphnia pulicaria Species 0.000 description 1
- 241001494248 Daphnia similis Species 0.000 description 1
- 241001302223 Daphniidae Species 0.000 description 1
- 108700030071 Drosophila TAI Proteins 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- DNXHEGUUPJUMQT-CBZIJGRNSA-N Estrone Chemical compound OC1=CC=C2[C@H]3CC[C@](C)(C(CC4)=O)[C@@H]4[C@@H]3CCC2=C1 DNXHEGUUPJUMQT-CBZIJGRNSA-N 0.000 description 1
- OTMSDBZUPAUEDD-UHFFFAOYSA-N Ethane Chemical compound CC OTMSDBZUPAUEDD-UHFFFAOYSA-N 0.000 description 1
- 241000239366 Euphausiacea Species 0.000 description 1
- 241000276423 Fundulus heteroclitus Species 0.000 description 1
- 108010011145 Fushi Tarazu Transcription Factors Proteins 0.000 description 1
- SHERTACNJPYHAR-ACZMJKKPSA-N Gln-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O SHERTACNJPYHAR-ACZMJKKPSA-N 0.000 description 1
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 1
- DRNMNLKUUKKPIA-HTUGSXCWSA-N Gln-Phe-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)CCC(N)=O)C(O)=O DRNMNLKUUKKPIA-HTUGSXCWSA-N 0.000 description 1
- KVQOVQVGVKDZNW-GUBZILKMSA-N Gln-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N KVQOVQVGVKDZNW-GUBZILKMSA-N 0.000 description 1
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 1
- FHPXTPQBODWBIY-CIUDSAMLSA-N Glu-Ala-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHPXTPQBODWBIY-CIUDSAMLSA-N 0.000 description 1
- 108010060309 Glucuronidase Proteins 0.000 description 1
- 102000053187 Glucuronidase Human genes 0.000 description 1
- FKJQNJCQTKUBCD-XPUUQOCRSA-N Gly-Ala-His Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O FKJQNJCQTKUBCD-XPUUQOCRSA-N 0.000 description 1
- GGEJHJIXRBTJPD-BYPYZUCNSA-N Gly-Asn-Gly Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GGEJHJIXRBTJPD-BYPYZUCNSA-N 0.000 description 1
- QPCVIQJVRGXUSA-LURJTMIESA-N Gly-Gly-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QPCVIQJVRGXUSA-LURJTMIESA-N 0.000 description 1
- WDEHMRNSGHVNOH-VHSXEESVSA-N Gly-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)CN)C(=O)O WDEHMRNSGHVNOH-VHSXEESVSA-N 0.000 description 1
- LPHQAFLNEHWKFF-QXEWZRGKSA-N Gly-Met-Ile Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LPHQAFLNEHWKFF-QXEWZRGKSA-N 0.000 description 1
- HJARVELKOSZUEW-YUMQZZPRSA-N Gly-Pro-Gln Chemical compound [H]NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJARVELKOSZUEW-YUMQZZPRSA-N 0.000 description 1
- YOBGUCWZPXJHTN-BQBZGAKWSA-N Gly-Ser-Arg Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YOBGUCWZPXJHTN-BQBZGAKWSA-N 0.000 description 1
- 108010051696 Growth Hormone Proteins 0.000 description 1
- 102100020948 Growth hormone receptor Human genes 0.000 description 1
- 101150009006 HIS3 gene Proteins 0.000 description 1
- 101100246753 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) pyrF gene Proteins 0.000 description 1
- 101710113848 Heat shock protein 83 Proteins 0.000 description 1
- SYMSVYVUSPSAAO-IHRRRGAJSA-N His-Arg-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O SYMSVYVUSPSAAO-IHRRRGAJSA-N 0.000 description 1
- CSTNMMIHMYJGFR-IHRRRGAJSA-N His-His-Arg Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CN=CN1 CSTNMMIHMYJGFR-IHRRRGAJSA-N 0.000 description 1
- JMSONHOUHFDOJH-GUBZILKMSA-N His-Ser-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 JMSONHOUHFDOJH-GUBZILKMSA-N 0.000 description 1
- JGFWUKYIQAEYAH-DCAQKATOSA-N His-Ser-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JGFWUKYIQAEYAH-DCAQKATOSA-N 0.000 description 1
- 101000726355 Homo sapiens Cytochrome c Proteins 0.000 description 1
- 101000974343 Homo sapiens Nuclear receptor coactivator 4 Proteins 0.000 description 1
- 101000974345 Homo sapiens Nuclear receptor coactivator 7 Proteins 0.000 description 1
- 101150028525 Hsp83 gene Proteins 0.000 description 1
- 206010020649 Hyperkeratosis Diseases 0.000 description 1
- QYOGJYIRKACXEP-SLBDDTMCSA-N Ile-Asn-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N QYOGJYIRKACXEP-SLBDDTMCSA-N 0.000 description 1
- DFJJAVZIHDFOGQ-MNXVOIDGSA-N Ile-Glu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DFJJAVZIHDFOGQ-MNXVOIDGSA-N 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- 102000004877 Insulin Human genes 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- 102000003746 Insulin Receptor Human genes 0.000 description 1
- 108010001127 Insulin Receptor Proteins 0.000 description 1
- 101150064297 Kr-h1 gene Proteins 0.000 description 1
- CKLJMWTZIZZHCS-UWTATZPHSA-N L-Aspartic acid Natural products OC(=O)[C@H](N)CC(O)=O CKLJMWTZIZZHCS-UWTATZPHSA-N 0.000 description 1
- FFEARJCKVFRZRR-UHFFFAOYSA-N L-Methionine Natural products CSCCC(N)C(O)=O FFEARJCKVFRZRR-UHFFFAOYSA-N 0.000 description 1
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 1
- BVHLGVCQOALMSV-JEDNCBNOSA-N L-lysine hydrochloride Chemical compound Cl.NCCCC[C@H](N)C(O)=O BVHLGVCQOALMSV-JEDNCBNOSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- 229930195722 L-methionine Natural products 0.000 description 1
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 1
- QMKFDEUJGYNFMC-AVGNSLFASA-N Leu-Pro-Arg Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QMKFDEUJGYNFMC-AVGNSLFASA-N 0.000 description 1
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 1
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 1
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 1
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- BRSGXFITDXFMFF-IHRRRGAJSA-N Lys-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N BRSGXFITDXFMFF-IHRRRGAJSA-N 0.000 description 1
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 1
- HYSVGEAWTGPMOA-IHRRRGAJSA-N Lys-Pro-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O HYSVGEAWTGPMOA-IHRRRGAJSA-N 0.000 description 1
- YTJFXEDRUOQGSP-DCAQKATOSA-N Lys-Pro-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YTJFXEDRUOQGSP-DCAQKATOSA-N 0.000 description 1
- 241000252069 Megalops Species 0.000 description 1
- 239000005805 Mepanipyrim Substances 0.000 description 1
- DSWOTZCVCBEPOU-IUCAKERBSA-N Met-Arg-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCNC(N)=N DSWOTZCVCBEPOU-IUCAKERBSA-N 0.000 description 1
- CIDICGYKRUTYLE-FXQIFTODSA-N Met-Ser-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O CIDICGYKRUTYLE-FXQIFTODSA-N 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 102100022927 Nuclear receptor coactivator 4 Human genes 0.000 description 1
- 102100022930 Nuclear receptor coactivator 7 Human genes 0.000 description 1
- CIVRYZXHHXXSII-UHFFFAOYSA-N OC1=CC=CC=C1.OC1=CC=CC=C1.CCCCCCCCCC1=CC=C(O)C=C1 Chemical compound OC1=CC=CC=C1.OC1=CC=CC=C1.CCCCCCCCCC1=CC=C(O)C=C1 CIVRYZXHHXXSII-UHFFFAOYSA-N 0.000 description 1
- 241001250072 Oryctes rhinoceros Species 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- BONHGTUEEPIMPM-AVGNSLFASA-N Phe-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O BONHGTUEEPIMPM-AVGNSLFASA-N 0.000 description 1
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 1
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 1
- FRKBNXCFJBPJOL-GUBZILKMSA-N Pro-Glu-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FRKBNXCFJBPJOL-GUBZILKMSA-N 0.000 description 1
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 1
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 1
- 244000184734 Pyrus japonica Species 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 1
- 241001168443 Scapholeberis mucronata Species 0.000 description 1
- MWMKFWJYRRGXOR-ZLUOBGJFSA-N Ser-Ala-Asn Chemical compound N[C@H](C(=O)N[C@H](C(=O)N[C@H](C(=O)O)CC(N)=O)C)CO MWMKFWJYRRGXOR-ZLUOBGJFSA-N 0.000 description 1
- BRKHVZNDAOMAHX-BIIVOSGPSA-N Ser-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N BRKHVZNDAOMAHX-BIIVOSGPSA-N 0.000 description 1
- PZZJMBYSYAKYPK-UWJYBYFXSA-N Ser-Ala-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PZZJMBYSYAKYPK-UWJYBYFXSA-N 0.000 description 1
- HBOABDXGTMMDSE-GUBZILKMSA-N Ser-Arg-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O HBOABDXGTMMDSE-GUBZILKMSA-N 0.000 description 1
- UOLGINIHBRIECN-FXQIFTODSA-N Ser-Glu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UOLGINIHBRIECN-FXQIFTODSA-N 0.000 description 1
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 1
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 1
- ZFVFHHZBCVNLGD-GUBZILKMSA-N Ser-His-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZFVFHHZBCVNLGD-GUBZILKMSA-N 0.000 description 1
- MQUZANJDFOQOBX-SRVKXCTJSA-N Ser-Phe-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O MQUZANJDFOQOBX-SRVKXCTJSA-N 0.000 description 1
- NMZXJDSKEGFDLJ-DCAQKATOSA-N Ser-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CCCCN)C(=O)O NMZXJDSKEGFDLJ-DCAQKATOSA-N 0.000 description 1
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 1
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 1
- JZRYFUGREMECBH-XPUUQOCRSA-N Ser-Val-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O JZRYFUGREMECBH-XPUUQOCRSA-N 0.000 description 1
- 241001168730 Simo Species 0.000 description 1
- 241001096222 Simocephalus exspinosus Species 0.000 description 1
- 241000235857 Simocephalus serrulatus Species 0.000 description 1
- 241001215203 Simocephalus vetuloides Species 0.000 description 1
- 241001302205 Simocephalus vetulus Species 0.000 description 1
- 102100038803 Somatotropin Human genes 0.000 description 1
- 108010068542 Somatotropin Receptors Proteins 0.000 description 1
- 241000255588 Tephritidae Species 0.000 description 1
- VIBXMCZWVUOZLA-OLHMAJIHSA-N Thr-Asn-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O VIBXMCZWVUOZLA-OLHMAJIHSA-N 0.000 description 1
- CTONFVDJYCAMQM-IUKAMOBKSA-N Thr-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H]([C@@H](C)O)N CTONFVDJYCAMQM-IUKAMOBKSA-N 0.000 description 1
- UBDDORVPVLEECX-FJXKBIBVSA-N Thr-Gly-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O UBDDORVPVLEECX-FJXKBIBVSA-N 0.000 description 1
- TZJSEJOXAIWOST-RHYQMDGZSA-N Thr-Lys-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N TZJSEJOXAIWOST-RHYQMDGZSA-N 0.000 description 1
- WFAUDCSNCWJJAA-KXNHARMFSA-N Thr-Lys-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(O)=O WFAUDCSNCWJJAA-KXNHARMFSA-N 0.000 description 1
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- AUYYCJSJGJYCDS-LBPRGKRZSA-N Thyrolar Chemical class IC1=CC(C[C@H](N)C(O)=O)=CC(I)=C1OC1=CC=C(O)C(I)=C1 AUYYCJSJGJYCDS-LBPRGKRZSA-N 0.000 description 1
- 239000007984 Tris EDTA buffer Substances 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- TZXFLDNBYYGLKA-BZSNNMDCSA-N Tyr-Asp-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 TZXFLDNBYYGLKA-BZSNNMDCSA-N 0.000 description 1
- GULIUBBXCYPDJU-CQDKDKBSSA-N Tyr-Leu-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 GULIUBBXCYPDJU-CQDKDKBSSA-N 0.000 description 1
- 241000700618 Vaccinia virus Species 0.000 description 1
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 1
- 241000269368 Xenopus laevis Species 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- OIPILFWXSMYKGL-UHFFFAOYSA-N acetylcholine Chemical compound CC(=O)OCC[N+](C)(C)C OIPILFWXSMYKGL-UHFFFAOYSA-N 0.000 description 1
- 229960004373 acetylcholine Drugs 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 239000003098 androgen Substances 0.000 description 1
- 102000001307 androgen receptors Human genes 0.000 description 1
- 108010080146 androgen receptors Proteins 0.000 description 1
- 230000001548 androgenic effect Effects 0.000 description 1
- 229940030486 androgens Drugs 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 231100000671 aquatic toxicology Toxicity 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 229960005261 aspartic acid Drugs 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 229940041514 candida albicans extract Drugs 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 239000006285 cell suspension Substances 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 210000002230 centromere Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 239000013601 cosmid vector Substances 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- NGPMUTDCEIKKFM-UHFFFAOYSA-N dieldrin Natural products CC1=C(Cl)C2(Cl)C3C4CC(C5OC45)C3C1(Cl)C2(Cl)Cl NGPMUTDCEIKKFM-UHFFFAOYSA-N 0.000 description 1
- 229950006824 dieldrin Drugs 0.000 description 1
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 1
- 229960003638 dopamine Drugs 0.000 description 1
- 230000036267 drug metabolism Effects 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- 230000000775 effect on neurotransmitter Effects 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 229960005309 estradiol Drugs 0.000 description 1
- 239000000262 estrogen Substances 0.000 description 1
- 229940011871 estrogen Drugs 0.000 description 1
- 102000015694 estrogen receptors Human genes 0.000 description 1
- 108010038795 estrogen receptors Proteins 0.000 description 1
- 230000001076 estrogenic effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 235000019688 fish Nutrition 0.000 description 1
- 238000010362 genome editing Methods 0.000 description 1
- 229960002989 glutamic acid Drugs 0.000 description 1
- 239000000122 growth hormone Substances 0.000 description 1
- 229960002885 histidine Drugs 0.000 description 1
- 210000004276 hyalin Anatomy 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- JEIPFZHSYJVQDO-UHFFFAOYSA-N iron(III) oxide Inorganic materials O=[Fe]O[Fe]=O JEIPFZHSYJVQDO-UHFFFAOYSA-N 0.000 description 1
- 230000000366 juvenile effect Effects 0.000 description 1
- 101150066555 lacZ gene Proteins 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000002101 lytic effect Effects 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 108020004084 membrane receptors Proteins 0.000 description 1
- 102000006240 membrane receptors Human genes 0.000 description 1
- CIFWZNRJIBNXRE-UHFFFAOYSA-N mepanipyrim Chemical compound CC#CC1=CC(C)=NC(NC=2C=CC=CC=2)=N1 CIFWZNRJIBNXRE-UHFFFAOYSA-N 0.000 description 1
- 230000029052 metamorphosis Effects 0.000 description 1
- 229960004452 methionine Drugs 0.000 description 1
- VOEYXMAFNDNNED-UHFFFAOYSA-N metolcarb Chemical compound CNC(=O)OC1=CC=CC(C)=C1 VOEYXMAFNDNNED-UHFFFAOYSA-N 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 229930014626 natural product Natural products 0.000 description 1
- 229960002748 norepinephrine Drugs 0.000 description 1
- SFLSHLFXELFNJZ-UHFFFAOYSA-N norepinephrine Natural products NCC(O)C1=CC=C(O)C(O)=C1 SFLSHLFXELFNJZ-UHFFFAOYSA-N 0.000 description 1
- 230000012223 nuclear import Effects 0.000 description 1
- 239000003973 paint Substances 0.000 description 1
- 230000008186 parthenogenesis Effects 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 229940050929 polyethylene glycol 3350 Drugs 0.000 description 1
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 102000003998 progesterone receptors Human genes 0.000 description 1
- 108090000468 progesterone receptors Proteins 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 230000033458 reproduction Effects 0.000 description 1
- 230000001850 reproductive effect Effects 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 108700004121 sarkosyl Proteins 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 229960001153 serine Drugs 0.000 description 1
- 239000013605 shuttle vector Substances 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- KSAVQLQVUXSOCR-UHFFFAOYSA-M sodium lauroyl sarcosinate Chemical compound [Na+].CCCCCCCCCCCC(=O)N(C)CC([O-])=O KSAVQLQVUXSOCR-UHFFFAOYSA-M 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001954 sterilising effect Effects 0.000 description 1
- 238000004659 sterilization and disinfection Methods 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 229960002898 threonine Drugs 0.000 description 1
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 239000005495 thyroid hormone Substances 0.000 description 1
- 229940036555 thyroid hormone Drugs 0.000 description 1
- 102000004217 thyroid hormone receptors Human genes 0.000 description 1
- 108090000721 thyroid hormone receptors Proteins 0.000 description 1
- 231100000820 toxicity test Toxicity 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 229960004295 valine Drugs 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 239000012138 yeast extract Substances 0.000 description 1
- 239000007222 ypd medium Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/43504—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
- C07K14/43509—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from crustaceans
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
- C12N15/1138—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against receptors or cell surface proteins
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/43504—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
- C07K14/43563—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from insects
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
- C07K14/72—Receptors; Cell surface antigens; Cell surface determinants for hormones
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6897—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids involving reporter genes operably linked to promoters
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2330/00—Production
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/142—Toxicological screening, e.g. expression profiles which identify toxicity
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Wood Science & Technology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Gastroenterology & Hepatology (AREA)
- Toxicology (AREA)
- Medicinal Chemistry (AREA)
- Plant Pathology (AREA)
- Mycology (AREA)
- Immunology (AREA)
- Tropical Medicine & Parasitology (AREA)
- Insects & Arthropods (AREA)
- Endocrinology (AREA)
- Cell Biology (AREA)
- Analytical Chemistry (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
여러가지 내분비 교란물질을 저용량이더라도 고감도로 평가할 수 있는 핵산을 제공한다. 상기 핵산은 서열번호 1로 나타내는 염기서열을 포함하고, 전체 길이가 20개 내지 60개 염기길이이며, 다양한 내분비 교란물질에 대하여 우수한 응답성을 나타낸다.
Description
본 발명은 내분비 교란물질(endocrine dusruptor) 수용체와 상호작용하는, 즉 내분비 교란물질 수용체를 통해 내분비 교란물질에 대한 응답성을 나타내는 핵산, 상기 핵산을 포함하는 벡터 및 형질전환체 및 상기 핵산을 이용한 시험물질의 평가방법에 관한 것이다.
내분비 교란물질은 생물의 내분비 작용을 교란하여 생식기능의 저해나 악성 종양 등을 일으킬 수 있는 물질이다. 내분비 교란물질은 "호르몬 유사 작용물질(hormonally active agent)"이라고도 불리며, 생체 내로 유입되면 극미량이라도 정상적인 호르몬 작용에 영향을 준다. 내분비 교란물질은 예를 들어, 본래 호르몬이 결합해야 할 수용체에 결합함으로써 생체에 대한 작용을 발현한다. 내분비 교란물질에 의한 생체 작용으로는 호르몬과 유사한 작용이 초래되는 경우와 상기 호르몬과 반대되는 작용이 초래될 수 있다.
예를 들어, 농약이나 살충제, 도료, 방청제 등의 성분에는 에스트로젠 작용 또는 안드로젠 작용을 나타내는 내분비 교란물질로 알려진 화합물이 포함되어 있어 인체에 대한 영향이 우려되고 있다.
한편, 절지동물(arthropod)에 특유한 유약 호르몬(juvenile hormone: JH)의 기능을 제어하는 화학물질이 살충제로 개발되고 있다. 유약 호르몬은 다양한 절지동물에서 변태나 생식을 제어하는 특징적인 호르몬이다. 곤충에서는 유약 호르몬을 Methoprene-tools(MET) 수용체(초파리에서는 Gce(Germ-cell-expressed)도 존재)가 수용하면, 하류의 Kruppel homolog 1(Kr-h1)의 전사 활성화를 통해 최종 생리기능을 발휘하게 된다. 따라서, 유약 호르몬이 정상적으로 작동하지 않으면, 유약 호르몬을 가지는 절지동물은 생존할 수 없다. 포유동물은 유약 호르몬이 없기 때문에, 유약 호르몬의 기능을 제어하는 화학물질을 살충제로 이용하더라도 사람에 대한 안전성이 높은 것으로 여겨져 왔다. 또한, 유약 호르몬에는 여러 종류가 있는데, 딱정벌레목(Coleoptera)과 막시목(Hymenoptera), 쌍날개목(Diptera) 등의 많은 곤충에서는 JHIII가, 비늘날개목(Lipidoptera)에서는 JHI와 JHII가, 갑각류(Crustacea)에서는 파르네센산 메틸(methyl farnesoate)이 알려져 있다.
예를 들어, 특허문헌 1에는 유약 호르몬(JH)에 응답하여 하류 유전자의 전사를 활성화하는 응답서열(JH 응답서열))을 누에에서 발견한 것, 상기 JH 응답서열을 리포터 유전자와 조합하여 사용함으로써 JH 응답성을 평가하는 리포터 평가방법을 구축한 것 등이 개시되어 있다. 상기 JH 응답서열은 E-box라 불리는 CACGTG의 염기를 가지고 있다. 그 외, Kr-h1의 상류에 존재하여 C-box라 불리는 CACGCG도 JH 응답서열로서 기능하는 것이 밝혀졌다(참조: 비특허문헌 1).
일반적으로, 물벼룩은 통상 단위생식(parthenogenesis)으로 암컷 개체만을 산출하지만, 환경이 악화되면 수컷 개체를 출산하고 수정하여, "내구란(resisting egg)"이라는 환경 변화에 강한 알을 산출하는 특성을 갖는 것으로 알려져 있다. 물벼룩 등의 갑각류에서는 JHII의 전구체인 파르네센산 메틸을 유약 호르몬으로 사용하는데, 물벼룩에 관하여 유약 호르몬 혹은 유약 호르몬 유사 작용물질에 노출되거나 물벼룩 체내의 유약 호르몬량이 증가하면 수컷 개체를 출산한다고 보고되었으며(참조: 비특허문헌 2 및 비특허문헌 3), 유약 호르몬 수용체에 리간드로 작용하거나 유약 호르몬 수용체의 기능을 저해하는 물질도 새롭게 내분비 교란물질로 고려될 수 있다.
유약 호르몬 작용을 평가하는 방법으로는 큰 물벼룩 개체를 사용한 번식 독성 시험이 있는데, 시험 기간에 장기간 필요로 하는 것이나 사육·평가에 기술을 필요로 하는 문제가 있고(참조: 비특허문헌 4), 배양세포를 이용하여 유약 호르몬 작용을 평가하는 시스템도 확립되어 있지만, 사육·계대에 기술을 필요로 하는 문제가 있다. 또한, 비특허문헌 5나 비특허문헌 6에는 큰 물벼룩에서의 유약 호르몬 수용체 유전자(MET 유전자) 및 JH 응답서열의 후보가 되는 염기서열이 개시되어 있으나, 실용적인 평가 시스템의 구축까지는 이르지 못하였다.
[비특허문헌 1] Qianyu He, et al., Heat Shock Protein 83 (Hsp83) Facilitates Methoprene-tools(Met) Nuclear Import to Modulate Juvenile Hormone Signaling Journal of Biological Chemistry.289, (2014) p.27874-27885.
[비특허문헌 2] Norihisa Tatarazako, et al., Juvenile hormone agonists affect the occurrence of male Daphnia. Chemosphere.53, (2003) p.827-833.
[비특허문헌 3] Kenji Toyota, et al., Methyl farnesoate synthesis is necessary for the environmental sex determination in the water flea Daphnia pulex. Journal of Insect Physiology.80, (2015) p.22-30
[비특허문헌 4] Helen Ying Wang, et al., The screening of chemicals for juvenoid-related endocrine activity using the water flea Daphnia magna, Aquatic Toxicology 74, (2005) p.193-204
[비특허문헌 5] Tomas A. Gorr, et al., Acandidate juvenoid hormone receptor cis-element in the Daphnia magna hb2 hemoglobingene promoter, Molecular and Cellular Endocrinology 247, (2006) p.91-102
[비특허문헌 6] Nur Syafiqah Mohamad Ishak, et al., Co-option of the bZIP transcription factor Vrille as the activator of Doublesex 1 in environmental sex determination of the crustacean Daphnia magna 13, (2017) e1006953.
상술한 바와 같이, 유약 호르몬을 포함하는 각종 호르몬 각각에 대하여 내분비 교란물질이 존재한다. 따라서, 어떤 화합물이 어떤 내분비 교란작용을 가지는지는 각종 호르몬 각각에 대해 평가 시스템을 준비할 필요가 있었다. 이와 같이 어떤 화합물에 있어서의 내분비 교란작용을 평가하려면 많은 단계가 필요하게 되어, 평가에 필요한 비용이 높아지는 문제가 있었다. 더욱이 상술한 바와 같이 내분비 교란물질은 극히 미량이라도 생체에 영향을 미치기 때문에, 저용량이라도 고감도로 내분비 교란작용 검출이 가능한 평가방법이 요구되어 왔다.
이에, 본 발명은 상술한 실정에 비추어 여러 가지 내분비 교란작용을 저용량이라도 고감도로 평가하는 평가 시스템에 사용할 수 있는 핵산, 상기 핵산을 포함하는 벡터 및 형질전환체 및 상기 핵산을 이용한 시험물질의 평가방법을 제공하는 것을 목적으로 한다.
상술한 목적을 달성하기 위하여 본 발명자들이 예의 검토한 결과, 여러 가지 내분비 교란물질에 대하여 우수한 응답성을 나타내는 핵산을 특정하는데 성공하고, 본 발명을 완성하기에 이르렀다.
본 발명은 다음을 포함한다:
(1) 서열번호 1로 나타내는 염기서열을 포함하고, 전체 길이가 20개 내지 60개 염기길이를 가지는 핵산.
(2) 서열번호 1로 나타내는 염기서열에 포함되는 임의의 4개의 염기(nnnn)가 kmkk(단, k는 G 또는 T, m은 A 또는 C를 의미한다)인 것을 특징으로 하는 (1)에 기재된 핵산.
(3) 서열번호 1로 나타내는 염기서열에 포함되는 임의의 4개의 염기(nnnn)가 GCGG 또는 TATT인 것을 특징으로 하는 (1)에 기재된 핵산.
(4) 상기 서열번호 1로 나타내는 염기서열의 3'-말단 및 5'-말단에 소정 길이의 염기서열을 가지는 것을 특징으로 하는 (1) 내지 (3)의 어느 하나에 기재된 핵산.
(5) 서열번호 2, 5, 8, 34, 37, 40, 43, 46, 49 및 52로 구성되는 군으로부터 선택되는 1개의 염기서열로 구성된 것을 특징으로 하는 (1)에 기재된 핵산.
(6) 상기 (1) 내지 (5)의 어느 하나에 기재된 핵산을 포함하는 벡터.
(7) 상기 핵산을 1 단위로 하고 복수 단위의 상기 핵산이 연결되는 것을 특징으로 하는 (6)에 기재된 벡터.
(8) 상기 핵산의 센스 사슬 3'-말단에 리포터 유전자를 포함하는 것을 특징으로 하는 (6)에 기재된 벡터.
(9) (1) 내지 (5)의 어느 하나에 기재된 핵산을 숙주에 도입한 형질전환체.
(10) 상기 핵산을 1 단위로 하고 복수 단위의 상기 핵산이 연결되는 것을 특징으로 하는 (9)에 기재된 형질전환체.
(11) 상기 핵산의 센스 사슬 3'-말단 측에 리포터 유전자를 포함하는 것을 특징으로 하는 (9)에 기재된 형질전환체.
(12) 상기 핵산에 대하여 상호작용하는 내분비 교란물질 수용체를 암호화하는 핵산이 도입되는 것을 특징으로 하는 (9)에 기재된 형질전환체.
(13) 상기 내분비 교란물질 수용체는 절지동물의 유약 호르몬 수용체인 것을 특징으로 하는 (12)에 기재된 형질전환체.
(14) 상기 절지동물에서의 유약 호르몬 수용체는 갑각류 또는 곤충류의 유약 호르몬 수용체인 것을 특징으로 하는 (13)에 기재된 형질전환체.
(15) 상기 갑각류의 유약 호르몬 수용체는 물벼룩의 유약 호르몬 수용체인 것을 특징으로 하는 (14)에 기재된 형질전환체.
(16) 상기 물벼룩의 유약 호르몬 수용체는 이하 (a) 또는 (b)의 단백질인 것을 특징으로 하는 (15)에 기재된 형질전환체:
(a) 서열번호 12로 나타내는 아미노산 서열로 구성된 단백질
(b) 서열번호 12로 나타내는 아미노산 서열에 대해 70% 이상의 동일성을 갖는 아미노산 서열로 구성되고, 유약 호르몬 수용체 전사인자 활성을 가지는 단백질.
(17) 전사 공역인자(transcription-coupling factor)를 암호화하는 핵산을 추가로 도입한 것을 특징으로 하는 (9)에 기재된 형질전환체.
(18) 상기 숙주는 효모인 것을 특징으로 하는 (9)에 기재된 형질전환체.
(19) 상기 (1) 내지 (5)의 어느 하나에 기재된 핵산과 상기 핵산의 센스 사슬 3'-말단 측에 리포터 유전자를 숙주에 도입하고, 상기 핵산에 상호 작용하는 내분비 교란물질 수용체를 발현하는 형질전환체에 시험물질을 접촉시키는 단계; 및, 상기 리포터 유전자의 발현을 측정하는 단계를 포함하고,
상기 리포터 유전자의 발현량에 근거하여 상기 시험물질과 상기 내분비 교란물질 수용체의 상호작용을 평가하는 것을 특징으로 하는 시험물질의 평가방법.
(20) 상기 리포터 유전자의 발현량이 시험물질의 접촉 후 증가하는 경우, 상기 내분비 교란물질 수용체의 작용물질(agonist)로 판단하는 것을 특징으로 하는 (19)에 기재된 평가방법.
(21) 상기 시험물질을 상기 내분비 교란물질 수용체에 상호작용하는 내분비 교란물질, 호르몬 및 내분비 교란물질 수용체의 작용물질로 구성되는 군으로부터 선택되는 적어도 하나의 물질과 함께 상기 형질전환체에 접촉시켜, 상기 리포터 유전자의 발현량이 상기 물질을 단독으로 접촉시켰을 때와 비교하여 저하된 경우, 상기 시험물질을 상기 내분비 교란물질 수용체의 길항물질(antagonist)로 판단하는 것을 특징으로 하는 (19)에 기재된 평가방법.
(22) 상기 핵산을 1 단위로 하고 복수 단위의 상기 핵산이 연결되는 것을 특징으로 하는 (19)에 기재된 평가방법.
(23) 상기 형질전환체에는 상기 내분비 교란물질 수용체를 암호화하는 핵산이 도입되는 것을 특징으로 하는 (19)에 기재된 평가방법.
(24) 상기 내분비 교란물질 수용체는 절지동물의 유약 호르몬 수용체인 것을 특징으로 하는 (19)에 기재된 평가방법.
(25) 상기 절지동물의 유약 호르몬 수용체는 갑각류 또는 곤충류의 유약 호르몬 수용체인 것을 특징으로 하는 (24)에 기재된 평가방법.
(26) 상기 갑각류의 유약 호르몬 수용체는 물벼룩의 유약 호르몬 수용체인 것을 특징으로 하는 (25)에 기재된 평가방법.
(27) 상기 물벼룩의 유약 호르몬 수용체는 이하 (a) 또는 (b)의 단백질인 것을 특징으로 하는 (26)에 기재된 평가방법:
(a) 서열번호 12로 나타내는 아미노산 서열로 구성된 단백질
(b) 서열번호 12로 나타내는 아미노산 서열에 대해 70% 이상의 동일성을 가지는 아미노산 서열로 구성되고, 유약 호르몬 수용체 전사인자 활성을 가지는 단백질.
(28) 상기 형질전환체에는 전사 공역인자를 암호화하는 핵산이 추가로 도입되는 것을 특징으로 하는 (19)에 기재된 평가방법.
(29) 상기 숙주는 효모인 것을 특징으로 하는 (19)에 기재된 평가방법.
(30) 상기 (8)에 기재된 벡터 또는 상기 (11)에 기재된 형질전환체를 포함하는 내분비 교란물질 측정용 키트.
본 발명에 따르면, 저용량의 내분비 교란물질에 대해서도 응답성을 나타내는 핵산, 상기 핵산을 포함하는 벡터 및 형질전환체를 제공한다.
또한, 본 발명에 따른 핵산을 이용하여 리포터 유전자의 발현을 해석함으로써 시험물질의 내분비 교란작용을 평가할 수 있다.
[응답서열]
본 발명에 따른 핵산(이하, '응답서열'이라 하기도 함)은 서열번호 1로 나타내는 염기서열을 포함하고, 전체 길이가 20개 내지 60개 염기길이를 가지는 핵산이다. 이하에서, "응답서열(response element)"이라 함은 정보로서의 서열 자체를 의미하는 것이 아니라, 아데닌(A), 구아닌(G), 티민(T) 및 시토신(C)의 4종류 뉴클레오티드가 소정의 순서로 결합하여 이루어지는 핵산을 의미한다. 이 응답서열은 유약 호르몬과 결합된 큰 물벼룩(Daphnia magna)의 유약 호르몬 수용체(MET 단백질)와 상호작용하여, 하류 유전자의 발현을 전사수준에서 바르게 제어하는 기능을 갖는다. 서열번호 1로 나타내는 염기서열은 CACGCG(C-box)와 CACGTG(E-box) 사이에 임의의 4개의 염기(즉, NNNN)를 가지고 있다. 이 임의의 4개의 염기는 특별히 한정되지는 않으나, kmkk(단, k는 G 또는 T, m은 A 또는 C를 의미한다)인 것이 바람직하다. kmkk로 표시되는 서열은 예를 들어 GAGG, GCGG, TATT, TCTT, TAGG, TCGG, GATT 및 GCTT 등을 포함하는 16종류를 의미한다. 즉, CACGCG(C-box)와 CACGTG(E-box) 사이의 4개의 염기는 이들 16종류의 서열에서 선택되는 하나의 서열인 것이 바람직하다. 이들 중에서도 CACGCG(C-box)와 CACGTG(E-box) 사이의 4개의 염기는 GCGG 또는 TATT로 하는 것이 바람직하다. 서열번호 1로 나타내는 염기서열의 임의의 4개 염기를 GCGG로 한 염기서열(즉, CACG CGGC GGCA CGTG)은, 예를 들어 큰 물벼룩(Daphnia magna)의 Vrille 유전자 상류에 위치하는 프로모터 서열에 포함된다. 응답서열에서 서열번호 1을 제외한 영역의 염기는 임의로 선택할 수 있다. 응답서열의 전체 길이는 20개 내지 60개 염기길이지만, 30개 내지 60개 염기길이가 바람직하고, 40개 내지 60개 염기길이가 보다 바람직하며, 40개 내지 50개 염기길이가 보다 더 바람직하다.
응답서열에서의 서열번호 1로 나타내는 염기서열(16개 염기)은 전체 길이 20개 내지 60개 염기길이 중 양단부를 제외한 위치로 하는 것이 바람직하다. 즉, 응답서열은 서열번호 1로 나타내는 염기서열의 3'-말단 및 5'-말단에 소정 길이의 염기서열을 가지는 것이 바람직하다. 소정 염기길이란 예를 들면 1개 내지 43 개 염기길이이고, 5개 내지 30개 염기길이가 바람직하며, 5개 내지 20개 염기길이가 보다 바람직하고, 7개 내지 20개 염기길이가 보다 더 바람직하다.
응답서열에 있어서, 서열번호 1을 제외한 영역의 염기서열은 특별히 한정되지 않고 임의의 염기서열로 할 수 있다. 일례로는 큰 물벼룩에서의 Vrille 유전자 상류 영역에 존재하는 염기서열(즉, CACG CGGC GGCA CGTG)에 인접한 염기서열 중에서 선택하는 것이 바람직하다.
일례로, 서열번호 1로 나타내는 염기서열을 포함하는 응답서열은 서열번호 2, 5, 8, 34 및 37로 구성되는 군으로부터 선택되는 염기서열로 구성되는 핵산으로 할 수 있다. 그 중에서도 응답서열로는 서열번호 2로 나타내는 염기서열로 구성되는 것이 바람직하다.
본 발명에 따른 응답서열은 큰 물벼룩의 Vrille 유전자 상류영역에 존재하는 염기서열(즉, CACGCGGCGGCACGTG)에 인접한 영역을 포함하는 염기서열에 대하여 75% 이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상의 동일성을 갖는 염기서열로 할 수도 있다. 그 중에서도 서열번호 2에 대하여 3개의 염기가 다른 서열번호 40 및 서열번호 43, 4개의 염기가 다른 서열번호 49, 6개의 염기가 다른 서열번호 46 및 10개의 염기가 다른 서열번호 52로 나타내는 염기서열이 바람직하다.
본 발명에 따른 응답서열은 단독으로 그 하류(센스 사슬의 3'-말단 방향)에 위치하는 유전자의 발현을 전사수준에서 바르게 제어하되, 복수의 응답서열을 배치한 구성이라도 무방하다. 구체적으로, 상술한 염기서열을 1 단위로 하여 복수 단위가 직접 인접하도록 배치되거나 복수 단위가 스페이서를 통해 배치됨으로써, 전사수준에서 발현을 제어하는 유전자의 상류에 복수의 응답서열을 배치할 수 있다.
응답서열을 복수 배치함으로써 하류 유전자의 발현을 보다 강력하고 바르게 제어할 수 있다. 소정의 유전자 상류에 배치하는 응답서열의 수는 특별히 한정되지는 않으나, 예를 들어 2개 내지 8개로 할 수 있고, 2개 내지 5개로 하는 것이 바람직하며, 3개 내지 4개로 하는 것이 보다 바람직하다.
또한, 복수의 응답서열을 배치할 경우 각각 동일한 염기서열로 구성되는 응답서열을 배치해도 되고, 서로 다른 염기서열로 구성되는 응답서열을 배치해도 되며, 일부가 같은 염기서열로 구성된 나머지가 다른 염기서열로 구성되는 응답서열을 배치해도 된다.
더욱이 응답서열 간에 배치되는 스페이서로서는 특별히 한정되지 않으나, 1개 내지 복수개의 임의의 염기서열로 할 수 있다. 스페이서의 염기길이는 특별히 한정되지 않고 1개 내지 100개 염기길이로 할 수 있으며, 1개 내지 90개 염기길이가 바람직하고, 1개 내지 70개 염기길이가 보다 바람직하며, 1개 내지 60개 염기길이가 보다 더 바람직하고, 1개 내지 40개 염기길이가 더욱 바람직하며, 1개 내지 30개 염기길이가 더욱 더 바람직하고, 1개 내지 20개 염기길이가 더욱 더 바람직하며, 1개 내지 10개 염기길이가 가장 바람직하다.
[벡터]
한편, 본 발명에 따른 벡터는 상술한 응답서열을 포함한다. 이 벡터는 상기 응답서열에 의해 전사수준에서 발현을 바르게 제어하는 대상 유전자를 삽입할 수 있다. 구체적으로, 벡터는 상기 응답서열의 하류에 전사수준에서 발현을 바르게 제어하는 대상의 유전자를 삽입하기 위한 클로닝 사이트를 가지고 있다. 본 발명에 따른 벡터는 적당한 숙주세포 내에서 상기 응답서열에 의해 하류 유전자의 전사를 제어할 수 있는 것이라면 특별히 한정되지 않는다. 이러한 벡터로는 예를 들어, 플라스미드 벡터, 파지 벡터, 코스미드 벡터 외에 게놈 편집에 사용되는 도너 벡터 등을 들 수 있으며, 다른 숙주와의 사이에서 유전자 교환이 가능한 셔틀 벡터도 사용할 수 있다.
플라스미드로는 대장균(E. coli) 유래의 플라스미드, 고초균(Bacillus subtilis) 유래의 플라스미드, 효모(yeast) 유래의 플라스미드 등을 들 수 있으며, 파지로는 람다 파지를 예로 들 수 있다. 또한, 레트로바이러스, 배시니아바이러스 또는 아데노바이러스 등의 동물 바이러스, 베큘로바이러스 등의 곤충 바이러스 벡터를 이용할 수도 있다.
벡터에 응답서열(response element)을 삽입하기 위해서는, 우선 정제된 응답서열을 적당한 제한효소로 절단하고 적당한 벡터의 제한효소 부위 또는 멀티클로닝 사이트에 삽입하여 벡터에 연결하는 방법 등이 채택되며, 제한효소를 이용하지 않는 방법으로는 CRISPR/Cas9, Red/ET 또는 Gateway법 등의 상동 재조합 기법도 채택된다.
본 발명에 따른 벡터에 있어서, 상기 응답서열은 하류 유전자의 전사를 제어하는 발현제어 영역(expression regulatory region)에 배치된다. 발현제어 영역은 하류 유전자의 전사를 제어하고 있는 영역으로, 통상 유전자의 상류(센스 사슬의 5'-말단측 영역) 영역을 의미한다. 보다 구체적으로, 발현제어 영역은 통상 하류 유전자의 전사시작 부위에서 상류측의 수천개의 염기 범위로 할 수 있으며, 예를 들어 전사시작 부위로부터 상류 5,000개 염기 이내, 바람직하게는 4,000개 염기 이내, 3,000개 염기 이내, 2,000개 염기 이내, 1,000개 염기 이내, 500개 염기 이내, 300개 염기 이내로 할 수 있다.
한편, 발현제어 영역에는 상술한 응답서열 외에 전사인자가 결합하는 영역, 인핸서 영역 등이 포함되어도 된다. 예를 들어, 상술한 응답서열을 포함하는 발현제어 영역은 상기 응답서열을 포함하는 소정 길이의 영역, 예를 들어, 상기 응답서열을 포함하는 50개 염기의 영역, 60개 염기의 영역, 70개 염기의 영역, 80개 염기의 영역, 90개 염기의 영역, 100개 염기, 120개 염기, 150개 염기 또는 200개 염기의 영역으로 할 수 있다.
본 발명에 따른 벡터는 이상과 같이 구성된 응답서열을 가지는 발현제어 영역의 하류에 발현제어 대상 유전자를 포함할 수 있다. 발현제어 대상 유전자로는 리포터 유전자를 들 수 있다. 리포터 유전자로는 특별히 한정되지 않으며, 예를 들어 클로람페니콜 아세틸트랜스퍼라제(CAT) 유전자, lacZ 유전자, 루시퍼라제 유전자, 베타글루쿠로니다제(GUS) 유전자 및 녹색 형광 단백질(GFP) 유전자, 약제내성 유전자, 영양 요구성 유전자 등을 들 수 있다. 아울러, 리포터 유전자로는 상술한 종래 공지의 유전자에 한정되지 않고, 상술한 Vrille 유전자를 리포터 유전자로 사용해도 무방하다. 즉, 어떤 유전자든 전사수준의 발현량을 모니터링할 수 있으면, 리포터 유전자로 사용할 수 있다.
[형질전환체]
본 발명에 따른 형질전환체는 상술한 응답서열을 숙주에게 도입한 것이다. 형질전환체로서는 예를 들어, 유약 호르몬과 결합한 큰 물벼룩의 유약 호르몬 수용체와 상기 응답서열이 상호작용함으로써 상기 응답서열의 하류에 위치한 유전자의 발현이 전사수준(transcription level)에서 항진하게 된다. 상술한 응답서열은 예를 들어 상술한 벡터를 사용하여 숙주에게 도입할 수 있다. 특히, 본 발명에 따른 형질전환체는 상술한 응답서열 및 상기 응답서열에 의해 전사수준에서 발현이 항진되는 유전자(예를 들어, 리포터 유전자)와, 상기 응답서열에 상호작용하는 유약 호르몬 수용체 등의 내분비 교란물질 수용체를 암호화하는 핵산이 도입되는 것이 바람직하다.
본원에서 "내분비 교란물질 수용체(receptor for endocrine disrupting chemical)"란 특정 호르몬이 리간드로 작용하는 수용체, 및 상기 호르몬과 같이 작용하는 내분비 교란물질이 작용하는 수용체를 의미한다. 내분비 교란물질 수용체는 세포막 수용체(cell membrane receptor) 및 핵 내 수용체(intranuclaer receptor)를 모두 포함하는 의미다. 내분비 교란물질 수용체로는 특정 호르몬 또는 내분비 교란물질의 존재 하에 상술한 응답서열에 상호 작용하여 전사인자 활성을 나타내는 수용체가 바람직하다.
내분비 교란물질로는 특별히 한정되지 않고 내분비 교란작용을 갖는 것이 알려진 물질, 내분비 교란물질을 갖는 것으로 추정되는 물질 모두를 포함하는 의미다. 예를 들어, 내분비 교란물질의 예로서는 여성 호르몬(난포 호르몬: 에스트로젠 및 황체 호르몬: 프로게스테론)에 대한 작용물질(agonist) 또는 길항물질(antagonist), 남성 호르몬(안드로젠)에 대한 작용물질 또는 길항물질을 들 수 있다. 또한, 내분비 교란물질로는 이들 여성 호르몬 또는 남성 호르몬에 대한 교란작용을 가진 물질로 한정되지 않으며, 예를 들어 갑상선 호르몬, 성장 호르몬, 부신피질 호르몬 또는 인슐린 등의 호르몬이나 아세틸콜린, 노르아드레날린, 아드레날린 또는 도파민 등의 신경전달 물질에 대한 교란작용을 가진 물질도 포함하는 의미이다.
따라서, 내분비 교란물질 수용체란 상술한 각종 호르몬에 대한 수용체인 에스트로젠 수용체, 안드로젠 수용체, 프로게스테론 수용체, 갑상선 호르몬 수용체, 성장 호르몬 수용체, 부신피질 호르몬 수용체 또는 인슐린 수용체를 들 수 있다.
또한, 내분비 교란물질에는 절지동물이 특이적으로 가지고 있는 유약 호르몬에 대한 작용물질 또는 길항물질이 포함된다. 따라서, 특히 내분비 교란물질 수용체로는 유약 호르몬 수용체(MET)인 것이 바람직하다.
유약 호르몬 수용체로는 특별히 한정되지 않으나, 곤충류, 갑각류, 거미류 및 지네류를 포함하는 절지동물(arthropod)의 유약 호르몬 수용체를 포함한다. 그 중에서도 절지동물의 유약 호르몬 수용체로는, 갑각류 또는 곤충류의 유약 호르몬 수용체가 바람직하다.
곤충류로는 장수풍뎅이 및 먼지벌레 등을 포함하는 딱정벌레목(Coleoptera,칼집시목), 나비 및 나방을 포함하는 나비목(Lepidtera, 비늘시목), 파리, 모기 및 소가죽 파리를 포함하는 파리목(Diptera, 쌍날개목), 벌 및 개미를 포함하는 벌목(Hymenoptera, 막시목), 매미 및 노린재를 포함하는 노린재목(Hemiptera, 반시목), 메뚜기 및 귀뚜라미를 포함하는 메뚜기목(Orthoptera, 직시목), 잠자리를 포함하는 잠자리목(Odonata, 잠자리목)을 들 수 있다. 본 발명에 따른 형질전환체에는 이들 곤충류 유래의 유약 호르몬 수용체를 암호화하는 핵산을 사용할 수 있다.
보다 구체적으로, 파리목에 속하는 노랑 초파리(Drosophila melanogaster)의 유약 호르몬 수용체를 암호화하는 핵산을 사용할 수 있다(참조: He Q et al., J. Biol. Chem. 289(40), pp.27874-27885(2014)).
또한, 갑각류로는 새우, 게, 크릴새우, 따개비 및 물벼룩을 포함하는 갑각아문(Crustacea)에 포함된 동물을 들 수 있다. 본 발명에 따른 형질전환체에는 이들 갑각류 유래의 유약 호르몬 수용체를 암호화하는 핵산을 사용할 수 있다.
특히, 갑각류 유래의 유약 호르몬 수용체를 암호화하는 핵산 중에서도 특히 물벼룩과(Daphniidae)에 속하는 동물 유래의 유약 호르몬 수용체를 암호화하는 핵산을 사용하는 것이 바람직하다.
물벼룩과에 속하는 동물로서는,
1) Ceriodaphnia 속에 속하는 동물: 뾰족코 물벼룩(Ceriodaphnia cornuta), 빗가시 물벼룩(Ceriodaphnia reticulata), 너도민코 물벼룩(Ceriodaphnia dubia), Ceriodaphnia megalops, 두줄가시 물벼룩(Ceriodaphnia pulchella) 및 Ceriodaphnia quadrangular 등;
2) Daphnia 속에 속하는 동물: Daphnia similis, 큰 물벼룩(Daphnia magna), 참 물벼룩(Daphnia pulex), Daphnia pulicaria, Daphnia ambigua, Daphnia obtuse, Daphnia biwaensis, 바늘목 물벼룩(Daphnia longispina), Daphnia rosea, Daphnia hyaline, 유리 물벼룩(Daphnia galeata), Daphnia ezoensis, Daphnia cuculata, Daphnia cristata 및 Daphnia longiremis 등;
3) Scapholeberis 속에 속하는 동물: 곱사등 물벼룩(Scapholeberis mucronata) 및 송장헤엄 물벼룩(Scapholeberis kingi) 등; 및,
4) Simocephalus 속에 속하는 동물: 털이마시모 물벼룩(Simocephalus serrulatus), 가시시모 물벼룩(Simocephalus exspinosus), 긴눈시모 물벼룩(Simocephalus vetulus), Simocephalus vetuloides 및 Simocephalus japonica 등을 들 수 있다.
이들 중에서도 특히 물벼룩속(Daphnia)에 속하는 동물의 유약 호르몬 수용체를 암호화하는 핵산을 사용하는 것이 바람직하고, 큰 물벼룩(Daphnia magna)의 유약 호르몬 수용체를 암호화하는 핵산을 사용하는 것이 더 바람직하다. 큰 물벼룩의 유약 호르몬 수용체의 아미노산 서열을 서열번호 12로 나타내고, 상기 유약 호르몬 수용체를 암호화하는 핵산의 염기서열을 서열번호 11로 나타내었다.
본 발명에 따른 형질전환체는 서열번호 12로 나타내는 아미노산 서열로 구성되는 유약 호르몬 수용체를 암호화하는 핵산을 포함하는 것에 한정되지 않으며, 서열번호 12로 나타내는 아미노산 서열에 대해 70% 이상의 동일성, 바람직하게는 90% 이상의 동일성, 보다 바람직하게는 95% 이상의 동일성, 가장 바람직하게는 98% 이상의 동일성을 갖는 아미노산 서열로 이루어져 유약 호르몬 수용체 전사인자 활성을 가지는 단백질을 암호화하는 핵산을 포함해도 무방하다.
또한, 아미노산 서열 간의 동일성은 Basic Local Alignment Search Tool(BLAST) 알고리즘을 운용하는 BLASTN이나 BLASTX 프로그램 등에 의해 산출할 수 있다(디폴트 설정). 또한, 동일성 값은 한 쌍의 아미노산 서열을 비교 정렬(pair wise alignment) 분석했을 때, 완전히 일치하는 아미노산 잔기를 산출하고 비교한 전체 아미노산 잔기 중의 비율로 산출된다.
아울러, 본 발명에 따른 형질전환체는 서열번호 12로 나타내는 아미노산 서열로 구성된 유약 호르몬 수용체를 암호화하는 핵산을 포함하는 것에 한정되지 않으며, 서열번호 11의 염기서열로 구성된 핵산의 상보 사슬의 전부 또는 일부에 대하여 스트린젠트한 조건하에서 혼성화하는 핵산에 의해 암호화되고, 또한 유약 호르몬 수용체 전사인자 활성을 가지는 단백질을 암호화하는 핵산을 포함하는 것이어도 무방하다. "스트린젠트한 조건(stringent condition)"이란 특이적 하이브리드가 형성되고 비특이적 하이브리드가 형성되지 않는 조건을 의미하며, 예를 들어 [Molecular Cloning: A Laboratory Manual(Third Edition)]을 참조하여 적절히 결정할 수 있다. 구체적으로는 서던 하이브리다이제이션(Southern hybridization)시 온도나 용액에 포함되는 염농도 및 서던 하이브리다이제이션 세정시의 온도나 용액에 포함되는 염농도에 따라 스트리젠시를 설정할 수 있다. 보다 구체적으로, 스트린젠트한 조건으로는, 예를 들어 나트륨 농도가 25~500mM, 바람직하게는 25~300mM이며, 온도가 42~68℃, 바람직하게는 42~65℃이다. 보다 더 구체적으로는 5×SSC(83mM NaCl, 83mM 구연산 나트륨), 온도 42℃의 조건이다.
여기서, 서열번호 11과 다른 소정의 염기서열로 구성된 핵산에 의해 암호화되는 단백질 혹은 서열번호 12와는 다른 아미노산을 포함하는 단백질이 유약 호르몬 수용체 전사인자 활성을 가지는지는 다음과 같이 평가할 수 있다: 우선, 평가 대상의 핵산 또는 평가 대상의 단백질을 암호화하는 핵산과, 상술한 응답서열 및 그 하류에 위치한 리포터 유전자를 도입한 형질전환체를 준비한다. 이어, 형질전환체를 유약 호르몬 존재 또는 비존재 하에서 배양하여 리포터 유전자의 발현을 측정한다. 유약 호르몬 존재 하에서 리포터 유전자의 발현량이 유약 호르몬의 비존재 하에서 리포터 유전자의 발현량보다 유의미하게 크다면, 평가대상 핵산이 유약 호르몬 수용체 전사인자 활성을 가지는 단백질을 암호화하고 있어, 평가대상 단백질이 유약 호르몬 수용체 전사인자 활성을 갖게 된다.
따라서, 상술한 유약 호르몬 수용체 전사인자 활성은 상술한 본 발명에 따른 응답서열에 대하여 상호작용하는 활성으로 바꾸어 말할 수 있다. 또한, 상술한 유약 호르몬 수용체 전사인자 활성은 유약 호르몬과 결합하여, 상술한 본 발명에 따른 응답서열에 대하여 상호작용하는 활성이라 할 수도 있다.
본 발명에 따른 형질전환체는 상술한 핵산이나 응답서열 및 리포터 유전자에 더하여 전사 공역인자(transcription-coupling factor)를 암호화하는 핵산을 추가로 포함할 수도 있다. 전사 공역인자로는 특별히 한정되지 않지만, Taiman(Tai), Steroid receptor coactivator(SRC), β-FTZ-F1(fushi tarazu binding factor 1), interacting steroid receptor coactivator(FISC), CREB binding protein(CBP), P300, transcriptional mediators/intermediary factor 2(TIF2), amplified in breast cancer(AIB), 70kDa androgen receptor coactivator(ARA70), activating signal co-integrator 2(ASC2) 및 140kDa estrogen receptor-associated protein(ERAP 140)을 들 수 있다. 이들 전사 공역인자를 암호화하는 핵산을 도입함으로써, 내분비 교란물질 수용체에 의한 리포터 유전자의 전사촉진 활성을 더욱 활성화할 수 있다.
이들 중에서도 특히 SRC 또는 Tai를 암호화하는 핵산을 도입하는 것이 바람직하고, 큰 물벼룩(Daphnia magna)의 SRC를 암호화하는 핵산을 도입하는 것이 더 바람직하다. 큰 물벼룩 SRC의 아미노산 서열을 서열번호 14로 나타내고, 상기 SRC를 암호화하는 핵산의 염기서열을 서열번호 13으로 나타내었다.
본 발명에 따른 형질전환체에 사용될 수 있는 전사 공역인자는 서열번호 14로 나타내는 아미노산 서열로 구성된 단백질에 한정되지 않고, 서열번호 14로 나타내는 아미노산 서열에 대해 70% 이상의 동일성, 바람직하게는 80% 이상의 동일성, 보다 바람직하게는 95% 이상의 동일성, 가장 바람직하게는 98% 이상의 동일성을 갖는 아미노산 서열로 이루어져 전사 공역인자 활성을 가지는 단백질이어도 무방하다.
한편, 본 발명에 따른 형질전환체에서의 숙주는 대장균, 고초균(Bacillus subtilis), 출아효모(budding yeast), 절지동물이나 포유류 유래의 배양세포, 식물미분화 세포(callus), 선충(C. elegans), 물벼룩류나 초파리 등의 절지동물, 제브라 피쉬나 송사리 등의 어류, 아프리카 손톱개구리(Xenopus laevis)나 이모리(newt) 등의 양서류, 마우스나 래트 등의 포유류, 흰냉이(Arabidopsis thaliana)나 벼 등의 고등식물 등을 고려할 수 있는데, 출아효모가 바람직하다. 숙주 내에 상술한 핵산이나 응답서열 및 리포터 유전자, 벡터 등을 도입하는 방법으로는 특별히 한정되지 않고, 종래 공지된 방법을 적용할 수 있다. 핵산의 도입방법으로는 예를 들면, 초산 리튬법, 인산칼슘법, 리포좀을 이용한 방법, 일렉트로포레이션, 바이러스 벡터를 이용하는 방법 및 마이크로피펫 인젝션법 등을 들 수 있다. 또한, 본 발명에 따른 형질전환체에서 상술한 핵산이나 응답서열 및 리포터 유전자 등의 도입은 분석에 이용할 수 있다면, 일과성(transient)의 도입도 좋고 숙주의 염색체에 삽입하여 도입해도 되며, 자율복제·분열 가능한 인공 염색체 또는 플라스미드의 도입도 무방하다.
이상과 같이 구성된 본 발명에 따른 형질전환체에서는 소정의 호르몬이나 내분비 교란물질이 결합된 내분비 교란물질 수용체가 응답서열에 상호작용함으로써 상기 응답서열의 하류에 위치한 유전자(예를 들어, 리포터 유전자)의 발현이 전사수준에서 항진하게 된다. 따라서, 응답서열의 하류에 위치하는 유전자의 발현을 측정함으로써, 내분비 교란물질 수용체와 응답서열과의 상호작용을 평가할 수 있다. 이 현상을 바탕으로 소정의 물질(시험물질)이 내분비 교란물질 수용체와 응답서열과의 상호작용에 어떻게 영향을 미치는지 평가할 수 있다. 구체적으로는, 예를 들어 시험물질의 내분비 교란물질 수용체에 대한 결합능 평가, 내분비 교란물질 수용체와 그의 작용물질와의 결합에 대한 시험물질 영향 평가를 응답서열 하류에 위치한 유전자의 발현에 기초하여 수행할 수 있다. 특히, 본 발명에 따른 형질전환체를 이용할 경우, 상술한 응답서열을 사용하기 때문에 특정 내분비 교란작용에 한정되지 않고, 시험물질에 대해 내분비 교란작용 여부를 평가할 수 있다.
여기서, 시험물질(test substance)로는 특별히 한정되지 않고 어떠한 물질이라도 무방하다. 시험물질로는 예를 들어 저분자 화합물, 고분자 화합물, 펩타이드, 단일 화합물, 복수의 화합물을 포함하는 조성물, 배양물, 추출물, 천연물 및 합성 화합물을 들 수 있다.
구체적으로, 시험물질의 존재 또는 비존재 하에서 형질전환체를 배양하고, 각각의 경우에 있어서 응답서열의 하류에 위치하는 리포터 유전자의 발현을 측정한다. 시험물질의 존재 하에서 리포터 유전자의 발현량이 시험물질의 비존재 하에서 리포터 유전자의 발현량과 비교하여 유의하게 큰 경우, 상기 시험물질은 내분비 교란물질 수용체와 상호작용하며, 상술한 응답서열을 통해 유전자 발현을 바르게 제어하는 작용물질(agonist)로서의 기능을 갖는다고 판단할 수 있다. 즉, 이 경우 시험물질이 작용물질로서의 기능을 하는 내분비 교란물질일 가능성이 높다고 판단할 수 있다.
또한, 시험물질 및 내분비 교란물질 수용체에 대한 작용물질의 존재 또는 비존재 하에 형질전환체를 배양하고, 각각의 경우에 응답서열 하류에 위치한 리포터 유전자의 발현을 측정한다. 시험물질의 존재 하에서 리포터 유전자의 발현량이 시험물질의 비존재 하에서 리포터 유전자의 발현량과 비교하여 유의하게 작은 경우, 상기 시험물질은 내분비 교란물질 수용체에 대한 작용물질로서의 기능을 저해하고, 상술한 응답서열을 통한 유전자 발현을 음으로 제어하는 길항물질(antagonist)로서의 기능을 한다고 판단할 수 있다. 즉, 이 경우 시험물질이 길항물질로서의 기능을 하는 내분비 교란물질일 가능성이 높다고 판단할 수 있다. 또한, "내분비 교란물질 수용체에 대한 작용물질"이란 내분비 교란물질 수용체에 작용하는 호르몬, 상기 호르몬에 대응하는 내분비 교란물질, 내분비 교란물질 수용체에 대한 작용물질 등으로부터 선택되는 물질을 의미한다.
이상과 같이 본 발명에 따른 형질전환체를 사용함으로써, 매우 간편한 조작에 의해 시험물질에 관한 내분비 교란작용을 평가할 수 있다. 즉, 본 발명에 따른 형질전환체는 내분비 교란물질의 측정·평가 용도로 이용할 수 있으며, 시험물질에 관한 내분비 교란작용을 평가하는 내분비 교란물질 측정용 키트로 할 수 있다.
특히, 내분비 교란물질 수용체로서 큰 물벼룩에서의 유약 호르몬 수용체를 암호화하는 핵산과, 상술한 응답서열 및 리포터 유전자를 도입한 형질전환체를 사용한 경우에는, 큰 물벼룩과에 속하는 동물, 특히 큰 물벼룩에 대한 시험물질의 내분비 교란작용을 정확하게 평가할 수 있다.
나아가, 본 발명에 따른 형질전환체는 숙주로서 효모를 이용한 경우에는 동물세포가 가지고 있는 p450 등의 약물대사계에 의한 시험물질 분해와 같은 영향을 배제하고, 시험물질의 내분비 교란작용을 정확하게 평가할 수 있다.
이하에서는, 실시예에 의해 본 발명을 더욱 상세하게 설명하지만, 본 발명의 기술적 범위는 이하의 실시예에 한정되지 않는다.
[형질전환 효모의 작제]
본 실시예에서는 아래에 제시된 각 리포터 플라스미드, 각 전사인자(내분비 교란물질 수용체) 플라스미드, 각 전사 공역인자 플라스미드를 각각 작제하여 출아효모주에 도입함으로써 형질전환 효모를 작제하였다.
[리포터 플라스미드의 작제]
서열번호 2로 나타내는 염기서열로 구성된 응답서열(43개 염기)을 포함하는 올리고 DNA(서열번호 3) 및 서열번호 3에 일부 상보적인 올리고 DNA(서열번호 4)를 작제하여 이들 올리고 DNA를 어닐링하였다. 어닐링 시에는 95℃에서 2분간 배양한 뒤 90℃에서 37℃까지 30분에 걸쳐 서서히 온도를 낮췄다. 또한, 본 실시예에 있어서, 두개의 서열이 "일부 상보적(partially complementary)"이란 서열번호로 특정되는 염기서열의 5'-말단 몇개 염기를 제외한 부분이 상보적인 것을 의미한다.
어닐링한 후, 1개, 2개, 3개, 4개 또는 5개의 응답서열을 연속하여 어닐링한 올리고 DNA를 각각 정제하였다. 그런 다음, [Wolf S S et al., Biotechniques. 20(4), p.568-573(1996)]에 기재된 방법에 준하여 작제한 β-갈락토시다제 유전자를 갖는 pRW95-3 플라스미드의 SpeI 절단부위에, 서열번호 2로 나타내는 응답서열이 1개, 2개, 3개, 4개 또는 5개 연속해서 어닐링한 올리고 DNA를 각각 삽입하였다.
동일한 방법으로 서열번호 5로 나타내는 염기서열로 구성된 응답서열(54개의 염기), 서열번호 8로 나타내는 염기서열로 구성된 응답서열(30개 염기), 서열번호 34로 나타내는 염기서열로 구성된 응답서열(22개 염기), 서열번호 37로 나타내는 염기서열로 구성된 응답서열(43개 염기), 서열번호 43으로 나타내는 염기서열로 구성된 응답서열(43개 염기), 서열번호 49로 나타내는 염기서열로 구성된 응답서열(43개 염기) 또는 서열번호 52로 나타내는 염기서열로 구성된 응답서열(43개 염기)을 삽입한 플라스미드를 작제하였다. 작제방법은 상기 서열번호 3의 올리고 DNA를 서열번호 6, 서열번호 9, 서열번호 35, 서열번호 38, 서열번호 41, 서열번호 44, 서열번호 47, 서열번호 50 또는 서열번호 53의 올리고 DNA로, 및
상기 서열번호 4의 올리고 DNA를 서열번호 6에 일부 상보적인 올리고 DNA(서열번호 7), 서열번호 9에 일부 상보적인 올리고 DNA(서열번호 10), 서열번호 35에 일부 상보적인 올리고 DNA(서열번호 36), 서열번호 38에 일부 상보적인 올리고 DNA(서열번호 39), 서열번호 41에 일부 상보적인 올리고 DNA(서열번호 42), 서열번호 44에 일부 상보적인 올리고 DNA(서열번호 45), 서열번호 47에 일부 상보적인 올리고 DNA(서열번호 48), 서열번호 50에 일부 상보적인 올리고 DNA(서열번호 51) 또는 서열번호 53에 일부 상보적인 올리고 DNA(서열번호 54)로 변경한 것 외에는 동일하게 행하였으며,
서열번호 5로 나타내는 응답서열이 3개 연속 삽입된 플라스미드,
서열번호 8로 나타내는 응답서열이 1개, 2개, 3개 또는 4개 연속 삽입된 플라스미드,
서열번호 34로 나타내는 응답서열이 1개, 2개, 3개, 4개 또는 5개 연속 삽입된 플라스미드,
서열번호 37로 나타내는 응답서열이 1개, 2개, 3개 또는 4개 연속 삽입된 플라스미드,
서열번호 40으로 나타내는 응답서열이 1개, 2개, 3개 또는 4개 연속 삽입된 플라스미드,
서열번호 43으로 나타내는 응답서열이 1개, 2개 또는 3개 연속 삽입된 플라스미드,
서열번호 46으로 나타내는 응답서열이 1개, 2개 또는 3개 연속 삽입된 플라스미드,
서열번호 49로 나타내는 응답서열이 1개, 2개, 3개 또는 4개 연속 삽입된 플라스미드,
서열번호 52로 나타내는 응답서열이 1개, 2개 또는 3개 연속 삽입된 플라스미드를 작제하였다.
또한, 서열번호 2, 서열번호 5, 서열번호 8, 서열번호 34 및 서열번호 37으로 나타내는 염기서열은 큰 물벼룩의 Vrille 유전자 상류 영역에 존재하는 염기서열이고,
서열번호 40으로 나타내는 염기서열은 서열번호 2의 염기서열에 대해 C-box(CACGCG)의 5'-말단 외측의 3개 염기를 바꾼 염기서열이며,
서열번호 43으로 나타내는 염기서열은 서열번호 2의 염기서열에 대해 E-box(CACGTG) 부의 3'-말단 외측의 3개 염기를 바꾼 염기서열이고,
서열번호 46으로 나타내는 염기서열은 서열번호 2의 염기서열에 대해 C-box(CACGCG)의 5'-말단 외측의 3개 염기 및 E-box(CACGTG) 부의 3'-말단 외측의 3개 염기를 바꾼 염기서열이며,
서열번호 49로 나타내는 염기서열은 서열번호 2의 염기서열에 대해 C-box(CACGCG)부와 E-box 부위(CACGTG) 사이(링커부)의 4개 염기를 바꾼 염기서열이고,
서열번호 52로 나타내는 염기서열은 서열번호 2의 염기서열에 대해 C-box(CACGCG)의 5'-말단 외측의 3개 염기, E-box(CACGTG) 부의 3'-말단 외측의 3개 염기 및 C-box 부위와 E-box 부위 사이(링커부)의 4개 염기를 모두 바꾼 염기서열이다.
본 응답서열을 포함하는 리포터 플라스미드와의 대조군으로서, 큰 물벼룩에서의 Vrille 유전자 상류 영역에 존재하는 16개 염기만으로 이루어진 핵산(즉, CACGCGGCGGCACGTG)만을 삽입한 플라스미드를 작제하였다. 이 16개 염기에는 많은 곤충종에서 유약 호르몬 응답서열로 알려진 E-box(CACGTG) 및 C-box(CACGCG)가 포함된다. 이 플라스미드의 작제방법은 상기 방법에 준하여, 이 16개 염기로 이루어진 핵산이 1개, 2개, 3개 또는 4개 연속 삽입된 플라스미드를 작제하였다.
추가적인 비교를 위하여, 노랑 초파리(Drosophila melanogaster)의 Kr-h1 유전자의 유약 호르몬 응답서열을 포함하는 영역(DmJHRR)을 삽입한 플라스미드를 작제하였다. DmJHRR에 대해서는 [He Q et al., J. Biol. Chem. 289(40), pp. 27874-27885(2014)]에 기재되어 있다. 작제방법은 상기 서열번호 3의 올리고 DNA를 DmJHRR 서열을 포함하는 올리고 DNA(서열번호 15) 및 상기 서열번호 4의 올리고 DNA를 서열번호 15에 일부 상보적인 올리고 DNA(서열번호 16)로 변경한 것을 제외하고는, 상술한 방법에 준하여 DmJHRR 서열이 3개 연속해서 삽입된 플라스미드로 작제하였다.
또한, 서열번호 2의 염기서열 중에 포함된 C-box(CACGCG) 및 E-box(CACGTG)의 유무에 의한 리포터 활성의 비교를 위하여, 서열번호 2의 C-box 부위가 다른 염기서열(서열번호 25), E-box 부위가 다른 염기서열(서열번호 28), C-box 부위 및 E-box 부위가 모두 다른 염기서열(서열번호 31)를 작제하였다. 구체적으로, 서열번호 25로 나타내는 염기서열을 포함하는 올리고 DNA(서열번호 26) 및 서열번호 26에 일부 상보적 DNA(서열번호 27), 서열번호 28로 나타내는 염기서열을 포함하는 올리고 DNA(서열번호 29) 및 서열번호 29에 일부 상보적 DNA(서열번호 30), 서열번호 31로 나타내는 염기서열을 포함하는 올리고 DNA(서열번호 32) 및 서열번호 32에 일부 상보적 DNA(서열번호 33)를 작제하고, 상술한 방법에 준하여 서열번호 25로 나타내는 염기서열을 4개 연속해서 삽입한 플라스미드, 서열번호 28로 나타내는 염기서열을 4개 연속해서 삽입한 플라스미드, 서열번호 31로 나타내는 염기서열을 4개 연속해서 삽입한 플라스미드를 각각 작제하였다.
[전사인자 발현 플라스미드의 작제]
큰 물벼룩 유약 호르몬 수용체 발현 플라스미드(이하, "DampaMET 플라스미드"라 함)의 작제를 위하여, 우선, CEN6/ARS4 단편을 작제하였다. 효모의 자율적 복제 기점(autonomously replicating sequence, ARS)과 센트로미어 서열(centromere sequence, CEN)을 포함하는 DNA 단편을, 리포터 플라스미드 pYTβ을 주형으로 CEN/ARS 증폭용 프라이머 pUdp6 I-SceI CEN6 FW(서열번호 17) 및 pUdp6 I-SceI ARS4 RE(서열번호 18)을 이용하여 PCR에 의해 증폭하였다. PCR은 94℃에서 20초, 58℃에서 20초, 72℃에서 1분 30초 사이클을 35사이클 실시하였다.
PCR로 증폭시킨 PCR 단편을 제한효소 AatII로 절단하고, 직쇄상으로 만든 플라스미드 pUdp6과 함께, 효모 야생주(Saccharomyces cerevisiae) W303a(MATa, ade2, his3, leu2, trp1, ura3)에 초산 리튬법에 의해 도입하였다. pUdp6은 양방향 프로모터 영역 gal1, gal10 및 gal10의 하류에 CYC 터미네이터를 가지고, 또한 gal1의 하류에 ADH 터미네이터를 갖고 있으며, 우라실 선택 마커 URA3 유전자를 가지는 플라스미드이다. 상동 재조합에 의해 CEN6/ARS4 단편이 pUdp6에 삽입된 플라스미드를 효모에서 추출하고, 또한 대장균 DH5α 주에 도입하여 저-복제 에피솜 벡터(low-copy episomal vector) pUdp13를 수득하였다. 또한, CEN6/ARS4 서열의 외측에는 18bp의 제한효소 I-SceI의 인식서열이 도입되었는데, 다클론 부위(multicloning cite)의 목적 유전자의 클로닝 후, I-SceI로 절단하고 CEN6/ARS4 단편을 추출하여 용이하게 게놈 삽입형으로 변환할 수 있다.
다음으로, DampaMET 유전자의 cDNA의 개방 해독틀(open reading frame, ORF)을 가지는 큰 물벼룩 성체의 cDNA을 주형으로 하고, DampaMET용 프라이머로 MET FW2(서열번호 19) 및 MET REV-3(서열번호 20)을 이용하여 PCR에 의해 증폭하였다. PCR은 94℃에서 20초, 58℃에서 20초, 72℃에서 2분 30초 사이클을 35사이클 실시하였다.
증폭시킨 DampaMET 유전자의 cDNA를 제한효소 BamHI 및 Hind III로 절단하여상기 플라스미드 pUdp13과 함께 야생 효모주 W303a에 초산 리튬법으로 도입하였다. 이 방법에 의해 DampaMET 유전자의 cDNA를 플라스미드 pUdp13의 GAL10 프로모터의 하류에 삽입한 것을 pUdp13-DapmaMet라 명명하였다. 효모세포 내에서 구축된 pUdp13-DapmaMet을 회수하여 대장균 DH5α주에 도입하고 증폭하였다.
이어, pUdp13-DapmaMet을 I-SceI 제한효소로 절단하여 CEN6/ARS4 서열을 수득하고, 유전체 삽입형(genome-insertion type) 플라스미드로 변환하였다. 이에 따라, DampaMET 유전자를 갖고, 그 상류에 프로모터를 갖는 DampaMET 플라스미드를 수득하였다.
동일한 방법으로 노랑 초파리(Drosophila melanogaster)의 유약 호르몬 수용체 발현 플라스미드(이하 "DmMET 플라스미드"라고 함)를 작제하였다. 우선 DmMET 유전자인 cDNA의 ORF를, 노랑 초파리 유충 cDNA(Clontech사제)를 주형으로 DmMET용 프라이머 DmMET Fwd(서열번호 21) 및 DmMET Rev(서열번호 22)를 이용한 PCR에 의해 증폭되었다. PCR은 98℃에서 10초, 55℃에서 30초, 68℃에서 1분 30초의 사이클을 25사이클 실시하였다.
증폭시킨 DmMET 유전자의 cDNA를 제한효소 SmaI 및 EcoRI로 절단하였다. 절단한 상기 DmMET 유전자의 cDNA를 제한효소 SmaI 및 EcoRI로 절단한 플라스미드 pUdp6의 GAL10 프로모터의 하류에 삽입하였다. 이에 따라, DmMET 유전자를 가지고, 그 상류에 프로모터를 갖는 DmMET 플라스미드를 수득하였다.
[전사 공역인자 발현 플라스미드의 작제]
본 실시예에서는 특히 노랑 초파리 Tai(DmTai) 유전자를 포함하는 전사인자(transcription factor) 발현 플라스미드(이하, "DmTai 플라스미드"라 함)와 큰 물벼룩의 전사 공역인자 발현(transcription-coupling factor, SRC) 플라스미드(이하 "DampaSRC 플라스미드"라 함)를 작제하여 이용하였다. DmTai 플라스미드는 [Ito-Harashima S et al. FEBS Open Bio.7(7): pp.995-1008(2017)]에 준하여 작제하였다.
한편, DampaSRC 플라스미드는 이하의 방법으로 작제하였다. 우선 큰 물벼룩 SRC(DampaSRC) 유전자의 cDNA ORF를 포함하는 큰 물벼룩 성체의 cDNA를 주형으로 SRC-F1F-pESC(서열번호 23) 및 SRC-F4short-pESC(서열번호 24)를 이용하여 PCR에 의해 증폭하였다. PCR은 94℃에서 20초, 58℃에서 10초, 72℃에서 7분의 사이클을 35사이클 실시하였다.
다음으로, 플라스미드 pESC-Leu(Agilent Technology사제)를 제한효소 SpeI 및 PacI로 절단하고, 증폭시킨 DampaSRC 유전자의 cDNA를 야생 효모주 W303a에 초산 리튬법으로 도입함으로써, 플라스미드 pESC-Leu의 gal1 프로모터 영역 하류에 상기 DampaSRC 유전자인 cDNA를 삽입한 DampaSRC 플라스미드를 수득하였다. 효모세포 내에서 구축된 DampaSRC 플라스미드를 회수하고, 대장균 DH5α주에 도입하여 증폭하였다.
[형질전환체 효모의 작제]
우선, 출아 효모주 W303a의 균체를 YPD 배지(1% 효모 추출물, 2% 펩톤, 2% D(+)-글루코스) 중에서 탁도(O.D.595)가 0.7 내지 0.8이 될 때까지 30℃에서 배양하였다. 배양한 균체를 멸균수로 2회 세정한 다음, 전 배양액의 10분의 1량인 0.1mol/L 초산 리튬용액에 피펫을 이용하여 재현탁하였다. 균체의 현탁액을 1.5mL 마이크로 튜브에 100μL씩 분주하여 원심집균하여 상청을 제거하였다. 제한효소 EcoRV로 처리하여 직쇄상으로 만든 DampaMET 플라스미드 1μg, 캐리어 DNA(상품명 SALMON TESDNA for hybridization, SIGMA사제) 50μg을 함유한 TE 완충용액(10mM Tris, 1mM EDTA, pH 8.0)를 75μL 첨가하고, 50% 폴리에틸렌 글리콜 3350 용액 240μL와 0.1mol/L 초산 리튬용액 36μL를 첨가하여 충분히 혼합하였다.
상기 혼합액을 30℃에서 30분 배양하고 42℃에서 22분간 열처리한 다음, 9,000rpm에서 1분간 원심분리하고 상기 혼합액에서 효모균체를 집균하였다. 집균한 효모균체를 300μL의 멸균수에 현탁하고 현탁액 100μL을 하기 표 1 및 표 2에 나타낸 배지에 트립토판 42mg과 류신 62mg, 2%의 한천을 가한 선택배지에 도포하고 배양하였다. 우라실 비요구성(uracil-nonrequiring) 효모주를 gal1 프로모터 및 MET 유전자의 cDNA 영역이 염색체 상에 재조합된 형질전환 효모로 선택하였다.
다음으로, 상기 DampaMET 플라스미드를 도입한 형질전환 효모에 DampaSRC 플라스미드를 도입하였다. 이때, 형질전환 효모의 선택배지는 표 1 및 표 2에 나타낸 전배양배지에 트립토판을 100mg 첨가한 배양배지를 사용하였다.
성 분 | 배합량 |
아미노산과 황산 암모늄이 제거된 효모 질소 베이스 | 1.7g |
(NH4)2SO4 | 5g |
드롭아웃 파우더(표 2) | 1.3g |
5M NaOH | 500μL |
D(+)-글루코스 | 20g |
물 | 1L |
* 고형배지는 상기 조성에 한천을 2% 가하고, 고압살균 후에 샬레에 옮겨 제조하였다.
성 분 | 배합량 |
Adenine | 2.5g |
L-Aspartic acid | 6.0g |
L-Histidine | 1.2g |
L-Arginine-HCl | 1.2g |
L-Methionine | 1.2g |
L-Lysine-HCl | 1.8g |
L-Glutamic acid | 6.0g |
L-Valine | 9.0g |
L-Serine | 22.5g |
L-Threonine | 12.0g |
다음으로, 상기 DampaMET 플라스미드 및 DampaSRC 플라스미드를 도입한 효모에 서열번호 2의 염기서열을 1개 삽입한 리포터 플라스미드를 초산 리튬법으로 도입하였다. 선택배지로는 표 1 및 2의 전배양배지를 사용하였다. 이로써, 본 발명의 효모 1을 얻었다. 동일한 방법으로, 표 3에 나타내는 본 발명과 관련된 응답서열을 가지는 본 발명의 효모 2 내지 38 및 비교 효모 1 내지 9를 각각 작제하였다.
응답서열의 종류 | 응답서열의 단위 | 전사인자 | 공역인자 | |
본 발명의 효모 1 | 서열번호2 | 1 | DampaMET | DampaSRC |
본 발명의 효모 2 | 서열번호2 | 2 | DampaMET | DampaSRC |
본 발명의 효모 3 | 서열번호2 | 3 | DampaMET | DampaSRC |
본 발명의 효모 4 | 서열번호2 | 4 | DampaMET | DampaSRC |
본 발명의 효모 5 | 서열번호2 | 5 | DampaMET | DampaSRC |
본 발명의 효모 6 | 서열번호 5 | 3 | DampaMET | DampaSRC |
본 발명의 효모 7 | 서열번호 8 | 3 | DampaMET | DampaSRC |
본 발명의 효모 8 | 서열번호 2 | 4 | DmMET | DmTai |
본 발명의 효모 9 | 서열번호 34 | 1 | DampaMET | DampaSRC |
본 발명의 효모 10 | 서열번호 34 | 2 | DampaMET | DampaSRC |
본 발명의 효모 11 | 서열번호 34 | 3 | DampaMET | DampaSRC |
본 발명의 효모 12 | 서열번호 34 | 4 | DampaMET | DampaSRC |
본 발명의 효모 13 | 서열번호 34 | 5 | DampaMET | DampaSRC |
본 발명의 효모 14 | 서열번호 8 | 1 | DampaMET | DampaSRC |
본 발명의 효모 15 | 서열번호 8 | 2 | DampaMET | DampaSRC |
본 발명의 효모 16 | 서열번호 8 | 4 | DampaMET | DampaSRC |
본 발명의 효모 17 | 서열번호 37 | 1 | DampaMET | DampaSRC |
본 발명의 효모 18 | 서열번호 37 | 2 | DampaMET | DampaSRC |
본 발명의 효모 19 | 서열번호 37 | 3 | DampaMET | DampaSRC |
본 발명의 효모 20 | 서열번호 37 | 4 | DampaMET | DampaSRC |
본 발명의 효모 21 | 서열번호 40 | 1 | DampaMET | DampaSRC |
본 발명의 효모 22 | 서열번호 40 | 2 | DampaMET | DampaSRC |
본 발명의 효모 23 | 서열번호 40 | 3 | DampaMET | DampaSRC |
본 발명의 효모 24 | 서열번호 40 | 4 | DampaMET | DampaSRC |
본 발명의 효모 25 | 서열번호 43 | 1 | DampaMET | DampaSRC |
본 발명의 효모 26 | 서열번호 43 | 2 | DampaMET | DampaSRC |
본 발명의 효모 27 | 서열번호 43 | 3 | DampaMET | DampaSRC |
본 발명의 효모 28 | 서열번호 43 | 4 | DampaMET | DampaSRC |
본 발명의 효모 29 | 서열번호 46 | 1 | DampaMET | DampaSRC |
본 발명의 효모 30 | 서열번호 46 | 2 | DampaMET | DampaSRC |
본 발명의 효모 31 | 서열번호 46 | 3 | DampaMET | DampaSRC |
본 발명의 효모 32 | 서열번호 49 | 1 | DampaMET | DampaSRC |
본 발명의 효모 33 | 서열번호 49 | 2 | DampaMET | DampaSRC |
본 발명의 효모 34 | 서열번호 49 | 3 | DampaMET | DampaSRC |
본 발명의 효모 35 | 서열번호 49 | 4 | DampaMET | DampaSRC |
본 발명의 효모 36 | 서열번호 52 | 1 | DampaMET | DampaSRC |
본 발명의 효모 37 | 서열번호 52 | 2 | DampaMET | DampaSRC |
본 발명의 효모 38 | 서열번호 52 | 3 | DampaMET | DampaSRC |
비교 효모 1 | cacgcggcggcacgtg | 1 | DampaMET | DampaSRC |
비교 효모 2 | cacgcggcggcacgtg | 2 | DampaMET | DampaSRC |
비교 효모 3 | cacgcggcggcacgtg | 3 | DampaMET | DampaSRC |
비교 효모4 | cacgcggcggcacgtg | 4 | DampaMET | DampaSRC |
비교 효모 5 | DmJHRR | 3 | DampaMET | DmTai |
비교 효모 6 | DmJHRR | 3 | DmMET | DmTai |
비교 효모 7 | 서열번호 25 | 4 | DampaMET | DampaSRC |
비교 효모 8 | 서열번호 28 | 4 | DampaMET | DampaSRC |
비교 효모 9 | 서열번호 31 | 4 | DampaMET | DampaSRC |
이들 형질전환 효모를 이용하여 다음과 같은 시험예를 실시하였다.
[시험예 1] 유약 호르몬에 대한 형질전환 효모 리포터 활성측정
본 발명의 효모 1을 이용하여 유약 호르몬 물질인 파르네센산 메틸(methyl farnesoate)에 대한 리포터 활성을 측정하였다. 우선, 본 발명의 효모 1을 표 1의 전배양 배지를 이용하여, 전배양 배지의 탁도(O.D.595)가 1.0 정도가 되도록 30℃에서 18시간 전배양을 실시하였다. 전배양한 균체액 10μL와 디메틸설폭시드(DMSO)로 각 농도로 희석한 파르네센산 메틸 용액 1μL을 하기 표 4에 나타낸 본 배양배지 90μL와 96웰 플레이트 내에서 혼합하고, 30℃에서 18시간 동안 정치배양(static culture)을 실시하여 반응액을 제조하였다. 이를 처리구(test group)로 하였다.
성 분 | 배합량 |
아미노산과 황산 암모늄이 제거된 효모 질소 베이스 | 1.7g |
(NH4)2SO4 | 5.0g |
드롭아웃 파우더(표2) | 1.3g |
5M NaOH | 500μL |
D(+)-갈락토스 | 10g |
물 | 1L |
대조구(control group)로서, 파르네센산 메틸의 희석 용액 대신에 DMSO 1㎕를 첨가한 반응액을 제조하였다. 제조한 각 반응액을 10㎛씩 취하여 96웰 플레이트의 각 웰에 분주한 다음, 각 웰에 용균액(lytic solution)(Z 완충용액: 60mM Na2HPO4, 40mM NaH2PO4, 1mM MgCl2, 10mM KCl, 2mM 디티오트레이톨(dithiothreitol), 0.20% N-lauroylsarcosine sodium salt)와 1mg/mL ONPG(orthonitrophenylgalactopyranoside)를 혼합한 측정시약을 100㎕ 분주하고, 37℃에서 30분간 반응시켰다. 그런 다음, 마이크로플레이트 리더(상품명 iMark microplate reader, Bio-Rad Laboratories사제)를 이용하여, 각 반응액의 파장 405nm에서의 흡광도(O.D.405) 및 탁도(O.D.595)를 측정하였다. 그리고, 하기 식으로 나타내는 유도 증가량(increase of induction)을 산출하였다.
유도 증가량 = (처리구의 O.D.405/처리구의 O.D.595)-(대조구의 O.D.405/대조구의 O.D.595)
유도 증가량은 [Ito-Harashima S et al., FEBS Open Bio.7(7): pp.995-1008 (2017)]에 기재되어 있으며, 유도 증가량이 양의 수일 경우 상기 물질에 대해 리포터 활성을 가지는 것으로 해석된다. 시험은 1회, 3회, 5회 또는 15회로 실시하여, 평균 유도 증가량을 산출하였다. 비교 효모 1에 대해서도 동일하게 처리하여 리포터 활성을 비교하고, 그 결과를 표 5에 나타내었다.
시험한 형질전환 효모 |
유약 호르몬 (파르네센산 메틸) 처리량 | |
100pM | 1nM | |
본 발명의 효모 1 | 0.10 | 0.08 |
비교 효모 1 | 0.01 | 0.00 |
상기 표 5에 나타낸 바와 같이, 본 응답서열을 가지는 본 발명의 효모 1은 유약 호르몬 물질인 파르네센산 메틸의 존재 하에서 리포터 유전자의 발현이 유도되고 있음을 알 수 있다. 반면, 비교 효모 1에서는 리포터 활성은 거의 측정할 수 없었다.
[시험예 2] 유약 호르몬에 대한 형질전환 효모 리포터 활성측정
시험예 1과 마찬가지로, 본 발명의 효모 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 및 20에 대해 파르네센산 메틸에 대한 리포터 활성을 측정하였다. 시험예 1에 준한 시험방법으로, 비교 효모 2, 3 및 4와 리포터 활성을 비교하고, 그 결과를 표 6 및 표 7에 나타내었다.
시험한 형질전환 효모 |
유약 호르몬 (파르네센산 메틸) 처리량 | ||||
10nM | 100nM | 1μM | 10μM | 100μM | |
본 발명의 효모 2 | 0.54 | 1.26 | 1.45 | 1.64 | 1.57 |
본 발명의 효모 3 | 2.05 | 4.35 | 4.45 | 4.07 | 4.29 |
본 발명의 효모 4 | 5.13 | 7.55 | 7.12 | 7.44 | 7.47 |
본 발명의 효모 5 | 1.33 | 3.29 | 3.72 | 3.76 | 4.05 |
본 발명의 효모 6 | 0.33 | 1.19 | 1.18 | 1.33 | 1.33 |
본 발명의 효 모7 | 0.06 | 0.26 | 0.32 | 0.36 | 0.34 |
비교 효모 2 | -0.29 | -0.27 | -0.34 | -0.21 | -0.14 |
비교 효모 3 | -0.12 | -0.21 | -0.27 | -0.17 | -0.17 |
비교 효모 4 | -0.84 | -1.49 | -1.82 | -1.05 | -2.06 |
시험한 형질전환 효모 |
유약 호르몬 (파르네센산 메틸) 처리량 | |
100nM | 10μM | |
본 발명의 효모 9 | 0.19 | 0.16 |
본 발명의 효모 10 | 0.08 | 0.20 |
본 발명의 효모 11 | 0.22 | 0.24 |
본 발명의 효모 12 | 1.43 | 2.55 |
본 발명의 효모 13 | - | 0.09 |
본 발명의 효모 14 | - | 0.09 |
본 발명의 효모 15 | 0.09 | 0.16 |
본 발명의 효모 16 | 0.65 | 1.32 |
본 발명의 효모 17 | 0.06 | 0.09 |
본 발명의 효모 18 | 0.10 | - |
본 발명의 효모 19 | 1.53 | 2.27 |
본 발명의 효모 20 | 1.55 | 1.85 |
표 6 및 표 7에 나타낸 바와 같이, 본 발명의 효모 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 및 20은 유약 호르몬(파르네센산 메틸)의 존재 하에서 리포터 유전자의 발현이 확실히 강하게 유도되고 있음을 알 수 있다.반면, 비교 효모 2, 3 및 4는 모든 처리량에서 유도 증가량이 음의 수치를 보여 리포터 활성을 나타내지 않음을 알 수 있었다. 이 결과로부터, 서열번호 1로 나타내는 염기서열을 포함하고, 전체 길이가 20개 내지 60개인 염기서열을 응답서열로 함으로써, 고감도로 유약 호르몬의 하나인 파르네센산 메틸에 대하여 리포터 활성을 평가할 수 있음이 밝혀졌다.
[시험예 3] 형질전환 효모의 리포터 활성에 미치는 코아서열의 영향
본 발명의 효모 4에 대하여, 응답서열 중 C-box(CACGCG) 부위를 서로 다른 염기서열로 한 비교 효모 7, E-box(CACGTG) 부위를 서로 다른 염기서열로 한 비교 효모 8, C-box 부위와 E-box 부위 모두를 서로 다른 염기서열로 한 비교 효모 9를 이용하여, 파르네센산 메틸에 대한 리포터 활성에 미치는 코아서열(core sequence)의 영향을 평가하였다. 시험방법은 시험예 1에 준하였다. 결과를 표 8에 나타냈다.
시험한 형질전환 효모 |
유약 호르몬(파르네센산 메틸)의 처리량 |
|
100nM | 10μM | |
본 발명효모 4 | 0.42 | 0.51 |
비교효모 7 | -0.42 | -0.12 |
비교효모 8 | 0.00 | -0.02 |
비교효모 9 | -0.42 | -0.12 |
표 8에 나타낸 바와 같이, 본 발명의 효모 4에서는 파르네센산 메틸에 대하여 높은 리포터 활성이 유도되었다. 한편, C-box 부위 및/또는 E-box 부위의 염기서열이 서로 다른 비교 효모 7, 8, 9는, 본 발명의 효모 4와 비교하여 뚜렸하게 리포터 활성이 저하되는 것으로 나타났다.
[시험예 4] 성호르몬 및 내분비 교란작용이 의심되는 화학물질에 대한 형질전환 효모의 리포터 활성측정
본 발명의 효모 4 및 8을 이용하여, 성호르몬인 17β-에스트라디올 및 테스토스테론, 곤충류의 유약 호르몬인 유약 호르몬 III, 내분비 교란작용을 가진 것으로 추정되는 화학물질인 4-노닐페놀, 비스페놀 A, 1,1,1-트리클로로-2,2-비스(4-클로로페닐)에탄(DDT), 2,2-비스(4-클로로페닐)-1,1-디클로로에틸렌(DDE)에 대한 리포터 활성을 측정하였다. 시험방법은 시험예 1에 준하였으며, 시험물질은 모두 10μM으로 처리하였다. 대조군으로서 기존에 알려진 유약 호르몬 수용체 응답서열인 노랑 초파리의 JH 응답서열을 조합한 비교 효모 5 및 6을 이용하여, 각 화합물에 대한 리포터 활성을 측정하고, 그 결과를 표 9에 나타냈다.
시험한 효모 형질전환체 | 유도증가량 | |||||||
17β-에스 트라디올 |
테스토 스테론 |
유약 호르몬 Ⅲ |
4-노닐페놀 | 비스페놀 A | DDT | DDE | 딜드린 | |
본 발명의 효모 4 | 1.97 | 1.78 | 6.20 | 2.16 | 1.14 | 0.65 | 2.15 | 3.85 |
본 발명의 효모 8 |
1.01 | 0.98 | 1.45 | 1.81 | 0.52 | 0.37 | 1.23 | 0.89 |
비교효모 5 | -0.14 | -0.02 | 0.41 | 0.74 | -0.38 | -0.07 | -0.08 | 0.00 |
비교효모 6 | -0.29 | -0.22 | 0.58 | 3.05 | -0.23 | -0.24 | -0.19 | -0.02 |
표 9에 나타낸 바와 같이, 본 발명의 효모 4 및 8은 내분비 교란물질의 종류에 관계없이 모든 계에서 리포터 유전자의 발현이 유도되고 있으며, 시험한 모든 내분비 교란물질에 대해 본 발명에서의 응답서열이 응답성을 나타내는 것을 확인할 수 있었다. 본 발명의 효모 8은 노랑 초파리 전사인자(DmMET)를 갖는 형질전환체인데, 본 발명의 응답서열은 갑각류 뿐만 아니라 곤충류의 1종인 노랑 초파리 전사인자라 하더라도 응답성을 나타내었다. 이에 반해, 노랑 초파리의 유약 호르몬 응답서열(DmJHR)을 갖는 비교 효모 5 및 6은 유약 호르몬 III 및 4-노닐페놀을 이용한 계에서 리포터 유전자의 발현이 유도되었을 뿐, 기타 내분비 교란물질에 대해 DmJHR이 응답성을 나타내지 않았다. 이 결과로부터, 본 발명의 응답서열을 이용한 리포터 시험에 의해 다양한 작용을 나타내는 내분비 교란물질을 검출할 수 있었다.
[시험예 5] 유약 호르몬 수용체 길항물질(antagonist)에 대한 리포터 활성 측정
본 발명의 효모 4를 이용하여 엔도린(endorin), 알드린(aldrin), 딜드린(dieldrin) 10㎛에서의 유약 호르몬 수용체 길항물질 활성을 평가하였다. 시험방법은 10nM의 파르네센산 메틸 존재 하에서 실시하고, 그 외는 시험예 1에 준하였다. 결과를 표 10에 나타냈다.
시험한 형질전환 효모 |
유도증가량 | ||
엔도린 | 알드린 | 딜드린 | |
본 발명의 효모 4 | -0.03 | -9.02 | -12.46 |
파르네센산 메틸 10nM 단독 처리구를 0으로 한다(농도: 10μM).
표 10에 나타낸 바와 같이, 본 발명의 효모 4는 시험한 모든 물질에 대해 파르네센산 메틸에 의한 리포터 활성의 증가가 감소되는 것으로 나타났다. 이러한 결과로부터, 본 발명의 응답서열을 조합한 형질전환체를 이용하여, 길항물질 활성을 나타내는 내분비 교란물질을 검출할 수 있었다.
[시험예 6] 기존 농약활성 성분에 대한 형질전환 효모 리포터 활성측정
시험예 1에 준하여 기존의 농약활성 성분인 메파니피림(mepanipyrinm), 벤티아발리카브이소프로필(Benthiavalicarb-isopropyl), 피리벤카브(pyribencarb), 피록사술폰(pyroxasulfone), 펜키노트리온(fenquinotrione)에 대하여, 본 발명의 효모 4를 이용하여 내분비 교란작용을 각각 측정하였다. 기존 농약활성 성분의 처리 농도는 모두 100μM로 하였다. 또한, 시험한 기존 농약활성 성분은 모두 내분비 교란작용을 나타내지 않는 것으로 밝혀진 물질이다. 결과를 표 11에 나타내었다.
시험한 형질전환 효모 |
유도증가량 | ||||
메파니피림 | 벤티아발리카브 이소프로필 |
피리벤카브 | 피록사술폰 | 펜키노트리온 | |
본 발명의 효모 4 | -0.76 | -0.37 | -0.24 | -0.50 | -0.24 |
농도: 100μM
표 11에 나타낸 바와 같이, 본 발명의 응답서열을 가지는 형질전환체에서 시험한 모든 기존 농약활성 성분에 대해 100㎛의 농도로 리포터 유전자의 발현 유도를 볼 수 없었다. 이 결과로부터, 전사인자 활성을 가지는 내분비 교란물질 수용체를 암호화하는 핵산과, 본 발명에 따른 응답서열 및 리포터 유전자를 도입한 형질전환체는 내분비 교란물질을 선택적으로 검출할 수 있는 것으로 나타났다.
[시험예 7] 형질전환 효모의 리포터 활성에 미치는 코아서열 주변 및 링커부의 영향
서열번호 2의 염기서열에 대하여 응답서열 중 C-box(CACGCG)의 5'-말단 외측의 3개 염기를 다른 염기서열로 한 본 발명의 효모 21, 22, 23, 24, E-box(CACGTG) 부위의 3'-말단 외측 3개 염기를 다른 염기서열로 한 본 발명의 효모 25, 26, 27, 28, C-box(CACGCG)의 5'-말단 외측의 3개 염기 및 E-box(CACGTG) 부위의 3'-말단보다 다른 염기서열로 하였다. 서로 다른 염기서열로 한 본 발명의 효모 36, 37, 38을 이용하여 파르네센산 메틸에 대한 리포터 활성에 미치는 코아서열의 영향을 평가하였다. 파르네센산 메틸의 처리 농도는 100nM 및 10μM으로 하였다. 시험방법은 시험예 1에 준하였다. 결과를 표 12에 나타냈다.
시험한 형질전환 효모 |
유약 호르몬 (파르네센산 메틸) 처리량 | |
100nM | 10μM | |
본 발명의 효모 21 | 0.20 | 0.19 |
본 발명의 효모 22 | 0.10 | 0.20 |
본 발명의 효모 23 | 0.49 | 1.09 |
본 발명의 효모 24 | 0.93 | 1.66 |
본 발명의 효모 25 | 0.06 | 0.15 |
본 발명의 효모 26 | 0.35 | 0.38 |
본 발명의 효모 27 | 0.03 | 0.64 |
본 발명의 효모 28 | 1.87 | 2.51 |
본 발명의 효모 29 | 0.07 | 0.07 |
본 발명의 효모 30 | 0.16 | 0.07 |
본 발명의 효모 31 | 0.09 | 0.23 |
본 발명의 효모 32 | 0.11 | 0.31 |
본 발명의 효모 33 | 0.42 | 0.22 |
본 발명의 효모 34 | 0.66 | 2.15 |
본 발명의 효모 35 | 1.44 | 1.05 |
본 발명의 효모 36 | 0.06 | 1.38 |
본 발명의 효모 37 | 0.17 | 0.13 |
본 발명의 효모 38 | 0.09 | 0.04 |
표 12에 나타낸 바와 같이, 본 발명의 효모 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37 및 38은 유약 호르몬(파르네센산 메틸) 존재 하에서 리포터 유전자의 발현이 명백히 강하게 유도되고 있음을 알 수 있다. 이러한 결과로부터, C-box(CACGCG)와 E-box(CACGCG) 사이(링커부)의 4개의 염기는 kmkk(단, k는 G 또는 T, m은 A 또는 C를 의미한다), 예를 들어 GCGG 이외에 TATT라 하더라도, 전체 길이가 20개 내지 60개 염기서열이라면 고감도로 유약 호르몬의 하나인 파르네센산 메틸에 대해 리포터 활성을 평가할 수 있음이 밝혀졌다. 아울러, 서열번호 1로 나타내는 염기서열 주변의 염기서열이 서열번호 2로 나타내는 염기서열과 다른 경우에도, 마찬가지로 고감도로 유약 호르몬 유사물질(Juvenile hormone analogue)에 대해 리포터 활성의 평가가 가능하다.
SEQUENCE LISTING
<110> KUMIAI CHEMICAL INDUSTRY CO., LTD.
University Public Corporation Osaka
<120> A nucleic acid capable of interacting with Endocrine disruptor
receptor and a use the same
<130> PH-8793-PCT
<150> JP 2020-075196
<151> 2020-04-21
<160> 54
<170> PatentIn version 3.5
<210> 1
<211> 16
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<220>
<221> misc_feature
<222> (7)..(10)
<223> n is a, c, g, or t
<400> 1
cacgcgnnnn cacgtg 16
<210> 2
<211> 43
<212> DNA
<213> Daphnia magna
<400> 2
caaagaaaat acgcacacgc ggcggcacgt gtgtgcatcc cat 43
<210> 3
<211> 49
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 3
ctagtcaaag aaaatacgca cacgcggcgg cacgtgtgtg catcccatt 49
<210> 4
<211> 49
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 4
ctagaatggg atgcacacac gtgccgccgc gtgtgcgtat tttctttga 49
<210> 5
<211> 54
<212> DNA
<213> Daphnia magna
<400> 5
caaagaaaat acgcacacgc ggcggcacgt gtgtgcatcc catcttccgt tcgg 54
<210> 6
<211> 60
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 6
ctagtcaaag aaaatacgca cacgcggcgg cacgtgtgtg catcccatct tccgttcggt 60
<210> 7
<211> 60
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 7
ctagaccgaa cggaagatgg gatgcacaca cgtgccgccg cgtgtgcgta ttttctttga 60
<210> 8
<211> 30
<212> DNA
<213> Daphnia magna
<400> 8
atacgcacac gcggcggcac gtgtgtgcat 30
<210> 9
<211> 36
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 9
ctagtatacg cacacgcggc ggcacgtgtg tgcatt 36
<210> 10
<211> 36
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 10
ctagaatgca cacacgtgcc gccgcgtgtg cgtata 36
<210> 11
<211> 2088
<212> DNA
<213> Daphnia magna
<220>
<221> CDS
<222> (1)..(2088)
<400> 11
atg gac aaa atg agc gag aca tta cca agt tcg agc cgg gag atg cgg 48
Met Asp Lys Met Ser Glu Thr Leu Pro Ser Ser Ser Arg Glu Met Arg
1 5 10 15
aat cgt gcg gag aag caa cgg cgt gac aag ctc aat gcc tac att tcg 96
Asn Arg Ala Glu Lys Gln Arg Arg Asp Lys Leu Asn Ala Tyr Ile Ser
20 25 30
gag ctt tat agt ctc gtt ccg tca gcg gct gcc gcc cct agg aag ctg 144
Glu Leu Tyr Ser Leu Val Pro Ser Ala Ala Ala Ala Pro Arg Lys Leu
35 40 45
gac aag acg agc acg ctc cgt ctt tcg gca aat ttt ttg cgc atc cat 192
Asp Lys Thr Ser Thr Leu Arg Leu Ser Ala Asn Phe Leu Arg Ile His
50 55 60
caa aat atg gat cta cga atg aag ccg tac aac cga tgg aat gct tta 240
Gln Asn Met Asp Leu Arg Met Lys Pro Tyr Asn Arg Trp Asn Ala Leu
65 70 75 80
gct ggt cat tca atc tta gag aaa ttg gac tcc ttt ttg ctt gtc gtc 288
Ala Gly His Ser Ile Leu Glu Lys Leu Asp Ser Phe Leu Leu Val Val
85 90 95
tcg tgc tgc tct ggc aag atc atc tac gtc acg gat cga gtg gag aaa 336
Ser Cys Cys Ser Gly Lys Ile Ile Tyr Val Thr Asp Arg Val Glu Lys
100 105 110
ttg ctc gga cat gcg cag gtc gat atg atg ggc tac cag tta tcc tgt 384
Leu Leu Gly His Ala Gln Val Asp Met Met Gly Tyr Gln Leu Ser Cys
115 120 125
ttt gtc cac cag gca gat caa gat gca att gaa aaa cgg ctc agt gct 432
Phe Val His Gln Ala Asp Gln Asp Ala Ile Glu Lys Arg Leu Ser Ala
130 135 140
ttt gct gca caa gtg gct gct aat cca gat gct tca gat tct gcc gat 480
Phe Ala Ala Gln Val Ala Ala Asn Pro Asp Ala Ser Asp Ser Ala Asp
145 150 155 160
gga caa gtc tat tca ttc gaa tgt cgc cta gcc gga cgc caa ctc agt 528
Gly Gln Val Tyr Ser Phe Glu Cys Arg Leu Ala Gly Arg Gln Leu Ser
165 170 175
cgg ggc gaa ccg acc gtc tat gaa cgg gtc agt gtc tca ggg act ttt 576
Arg Gly Glu Pro Thr Val Tyr Glu Arg Val Ser Val Ser Gly Thr Phe
180 185 190
cga ggc cct cgg aga aga cgt gac tgg gct gat ctc aaa agc agt gat 624
Arg Gly Pro Arg Arg Arg Arg Asp Trp Ala Asp Leu Lys Ser Ser Asp
195 200 205
aga tct gtg gca act gtt caa caa cac aac gac tac agc gag ccg ctt 672
Arg Ser Val Ala Thr Val Gln Gln His Asn Asp Tyr Ser Glu Pro Leu
210 215 220
ttt att ggc ttg gtg cgc att tta caa aca ccc aac act tta cct cca 720
Phe Ile Gly Leu Val Arg Ile Leu Gln Thr Pro Asn Thr Leu Pro Pro
225 230 235 240
ttg acg atc atg caa gct gtt cag gac gag tat atc act cag cac aca 768
Leu Thr Ile Met Gln Ala Val Gln Asp Glu Tyr Ile Thr Gln His Thr
245 250 255
acc ggt ggc acc att ata caa acc gat cat cgc atc gcc atc att gct 816
Thr Gly Gly Thr Ile Ile Gln Thr Asp His Arg Ile Ala Ile Ile Ala
260 265 270
ggt tat ctg agt ggc gag gtg acg ggc atg tca gca tac gat tat gtt 864
Gly Tyr Leu Ser Gly Glu Val Thr Gly Met Ser Ala Tyr Asp Tyr Val
275 280 285
tat agc gaa gat ttg gag tac act ctc aaa gct caa agc ctc atg tta 912
Tyr Ser Glu Asp Leu Glu Tyr Thr Leu Lys Ala Gln Ser Leu Met Leu
290 295 300
act cgg agt gaa gga atg gtg act tat cgc cta aaa acc agt acg ggt 960
Thr Arg Ser Glu Gly Met Val Thr Tyr Arg Leu Lys Thr Ser Thr Gly
305 310 315 320
cgt ttg att ttc ctt cga tca aga ggt ttc atc caa tac gat gaa aac 1008
Arg Leu Ile Phe Leu Arg Ser Arg Gly Phe Ile Gln Tyr Asp Glu Asn
325 330 335
acg aag gaa att gtc agc ttc ttc tgc atc aat tca ctc atc gac gaa 1056
Thr Lys Glu Ile Val Ser Phe Phe Cys Ile Asn Ser Leu Ile Asp Glu
340 345 350
gag caa gga atg aag gaa atg cag gaa atg cgg gcc atg tta gac aaa 1104
Glu Gln Gly Met Lys Glu Met Gln Glu Met Arg Ala Met Leu Asp Lys
355 360 365
ctt aac att gca act gtt acg cca gcg ata gcg tca tcg cca acg agc 1152
Leu Asn Ile Ala Thr Val Thr Pro Ala Ile Ala Ser Ser Pro Thr Ser
370 375 380
acg att gaa cca gtt gga gca gct tct act caa gag cca ctt tct cgt 1200
Thr Ile Glu Pro Val Gly Ala Ala Ser Thr Gln Glu Pro Leu Ser Arg
385 390 395 400
tgt gtt cgg gcg tca gtg ggg aaa cca ccg cct tct ttt tct tct aat 1248
Cys Val Arg Ala Ser Val Gly Lys Pro Pro Pro Ser Phe Ser Ser Asn
405 410 415
ggc tgc cac ctt gcg aat ggg tct agg gtc tcg ggc ctg cct aga tcc 1296
Gly Cys His Leu Ala Asn Gly Ser Arg Val Ser Gly Leu Pro Arg Ser
420 425 430
agt att atg ccc aac gga cat aac agt tta tgc att tca ccc tcc tct 1344
Ser Ile Met Pro Asn Gly His Asn Ser Leu Cys Ile Ser Pro Ser Ser
435 440 445
gaa ctt cag tac tcc cct tca gga tcg tct tcg tct tct ttc agt gaa 1392
Glu Leu Gln Tyr Ser Pro Ser Gly Ser Ser Ser Ser Ser Phe Ser Glu
450 455 460
gaa cgt tgc caa tct tct aca ccg cat tcg ctc gtg tca tct ccc atg 1440
Glu Arg Cys Gln Ser Ser Thr Pro His Ser Leu Val Ser Ser Pro Met
465 470 475 480
gaa att cct aat tta gtt gct gtt tcc tac cca ttt gca ccc ata cct 1488
Glu Ile Pro Asn Leu Val Ala Val Ser Tyr Pro Phe Ala Pro Ile Pro
485 490 495
ttc cca tgg cga cca tcg aca gac tgt tct ccg atc acc acg aca tct 1536
Phe Pro Trp Arg Pro Ser Thr Asp Cys Ser Pro Ile Thr Thr Thr Ser
500 505 510
aac ggt cac gtt aac act aga gaa gtt agc aaa tcc ccc gat gtc gat 1584
Asn Gly His Val Asn Thr Arg Glu Val Ser Lys Ser Pro Asp Val Asp
515 520 525
cag agc gat cct ctt ggt gaa cca gga ttg ctg gct ctt acg ctg gat 1632
Gln Ser Asp Pro Leu Gly Glu Pro Gly Leu Leu Ala Leu Thr Leu Asp
530 535 540
cat caa tgg gaa acg gct ccc aat agt cag agc atg atc gtc cag cac 1680
His Gln Trp Glu Thr Ala Pro Asn Ser Gln Ser Met Ile Val Gln His
545 550 555 560
aat ggg cca caa agt cat cag cag tcc ttg gta gcc gtc agt ccc ctt 1728
Asn Gly Pro Gln Ser His Gln Gln Ser Leu Val Ala Val Ser Pro Leu
565 570 575
caa gct cat ttg ctt cag tca tcg cca aac gat aac ata gaa ccg att 1776
Gln Ala His Leu Leu Gln Ser Ser Pro Asn Asp Asn Ile Glu Pro Ile
580 585 590
cgg tcc acc ctg aaa tcg ccg cca tcg tcc acc agc tgt ccc gtt caa 1824
Arg Ser Thr Leu Lys Ser Pro Pro Ser Ser Thr Ser Cys Pro Val Gln
595 600 605
cct ccc cac caa tat cag gaa gat gct ctg aaa atc tcg att ccc gat 1872
Pro Pro His Gln Tyr Gln Glu Asp Ala Leu Lys Ile Ser Ile Pro Asp
610 615 620
cgt tgt ccg acg aat gaa ctg agt cga aac aac tgt ctc aac ggc tac 1920
Arg Cys Pro Thr Asn Glu Leu Ser Arg Asn Asn Cys Leu Asn Gly Tyr
625 630 635 640
atc att tgg cct caa aag atg tcg ccc aaa aat cga aag gag aat ctt 1968
Ile Ile Trp Pro Gln Lys Met Ser Pro Lys Asn Arg Lys Glu Asn Leu
645 650 655
ata ttg tcg tac ttg gac gtc gac aag cat gcc tac aaa cag cca gag 2016
Ile Leu Ser Tyr Leu Asp Val Asp Lys His Ala Tyr Lys Gln Pro Glu
660 665 670
att acc gga act gct gac cag cac tac tat cat agt gat tta aaa gtg 2064
Ile Thr Gly Thr Ala Asp Gln His Tyr Tyr His Ser Asp Leu Lys Val
675 680 685
aat gct gga acc aac agt gca tag 2088
Asn Ala Gly Thr Asn Ser Ala
690 695
<210> 12
<211> 695
<212> PRT
<213> Daphnia magna
<400> 12
Met Asp Lys Met Ser Glu Thr Leu Pro Ser Ser Ser Arg Glu Met Arg
1 5 10 15
Asn Arg Ala Glu Lys Gln Arg Arg Asp Lys Leu Asn Ala Tyr Ile Ser
20 25 30
Glu Leu Tyr Ser Leu Val Pro Ser Ala Ala Ala Ala Pro Arg Lys Leu
35 40 45
Asp Lys Thr Ser Thr Leu Arg Leu Ser Ala Asn Phe Leu Arg Ile His
50 55 60
Gln Asn Met Asp Leu Arg Met Lys Pro Tyr Asn Arg Trp Asn Ala Leu
65 70 75 80
Ala Gly His Ser Ile Leu Glu Lys Leu Asp Ser Phe Leu Leu Val Val
85 90 95
Ser Cys Cys Ser Gly Lys Ile Ile Tyr Val Thr Asp Arg Val Glu Lys
100 105 110
Leu Leu Gly His Ala Gln Val Asp Met Met Gly Tyr Gln Leu Ser Cys
115 120 125
Phe Val His Gln Ala Asp Gln Asp Ala Ile Glu Lys Arg Leu Ser Ala
130 135 140
Phe Ala Ala Gln Val Ala Ala Asn Pro Asp Ala Ser Asp Ser Ala Asp
145 150 155 160
Gly Gln Val Tyr Ser Phe Glu Cys Arg Leu Ala Gly Arg Gln Leu Ser
165 170 175
Arg Gly Glu Pro Thr Val Tyr Glu Arg Val Ser Val Ser Gly Thr Phe
180 185 190
Arg Gly Pro Arg Arg Arg Arg Asp Trp Ala Asp Leu Lys Ser Ser Asp
195 200 205
Arg Ser Val Ala Thr Val Gln Gln His Asn Asp Tyr Ser Glu Pro Leu
210 215 220
Phe Ile Gly Leu Val Arg Ile Leu Gln Thr Pro Asn Thr Leu Pro Pro
225 230 235 240
Leu Thr Ile Met Gln Ala Val Gln Asp Glu Tyr Ile Thr Gln His Thr
245 250 255
Thr Gly Gly Thr Ile Ile Gln Thr Asp His Arg Ile Ala Ile Ile Ala
260 265 270
Gly Tyr Leu Ser Gly Glu Val Thr Gly Met Ser Ala Tyr Asp Tyr Val
275 280 285
Tyr Ser Glu Asp Leu Glu Tyr Thr Leu Lys Ala Gln Ser Leu Met Leu
290 295 300
Thr Arg Ser Glu Gly Met Val Thr Tyr Arg Leu Lys Thr Ser Thr Gly
305 310 315 320
Arg Leu Ile Phe Leu Arg Ser Arg Gly Phe Ile Gln Tyr Asp Glu Asn
325 330 335
Thr Lys Glu Ile Val Ser Phe Phe Cys Ile Asn Ser Leu Ile Asp Glu
340 345 350
Glu Gln Gly Met Lys Glu Met Gln Glu Met Arg Ala Met Leu Asp Lys
355 360 365
Leu Asn Ile Ala Thr Val Thr Pro Ala Ile Ala Ser Ser Pro Thr Ser
370 375 380
Thr Ile Glu Pro Val Gly Ala Ala Ser Thr Gln Glu Pro Leu Ser Arg
385 390 395 400
Cys Val Arg Ala Ser Val Gly Lys Pro Pro Pro Ser Phe Ser Ser Asn
405 410 415
Gly Cys His Leu Ala Asn Gly Ser Arg Val Ser Gly Leu Pro Arg Ser
420 425 430
Ser Ile Met Pro Asn Gly His Asn Ser Leu Cys Ile Ser Pro Ser Ser
435 440 445
Glu Leu Gln Tyr Ser Pro Ser Gly Ser Ser Ser Ser Ser Phe Ser Glu
450 455 460
Glu Arg Cys Gln Ser Ser Thr Pro His Ser Leu Val Ser Ser Pro Met
465 470 475 480
Glu Ile Pro Asn Leu Val Ala Val Ser Tyr Pro Phe Ala Pro Ile Pro
485 490 495
Phe Pro Trp Arg Pro Ser Thr Asp Cys Ser Pro Ile Thr Thr Thr Ser
500 505 510
Asn Gly His Val Asn Thr Arg Glu Val Ser Lys Ser Pro Asp Val Asp
515 520 525
Gln Ser Asp Pro Leu Gly Glu Pro Gly Leu Leu Ala Leu Thr Leu Asp
530 535 540
His Gln Trp Glu Thr Ala Pro Asn Ser Gln Ser Met Ile Val Gln His
545 550 555 560
Asn Gly Pro Gln Ser His Gln Gln Ser Leu Val Ala Val Ser Pro Leu
565 570 575
Gln Ala His Leu Leu Gln Ser Ser Pro Asn Asp Asn Ile Glu Pro Ile
580 585 590
Arg Ser Thr Leu Lys Ser Pro Pro Ser Ser Thr Ser Cys Pro Val Gln
595 600 605
Pro Pro His Gln Tyr Gln Glu Asp Ala Leu Lys Ile Ser Ile Pro Asp
610 615 620
Arg Cys Pro Thr Asn Glu Leu Ser Arg Asn Asn Cys Leu Asn Gly Tyr
625 630 635 640
Ile Ile Trp Pro Gln Lys Met Ser Pro Lys Asn Arg Lys Glu Asn Leu
645 650 655
Ile Leu Ser Tyr Leu Asp Val Asp Lys His Ala Tyr Lys Gln Pro Glu
660 665 670
Ile Thr Gly Thr Ala Asp Gln His Tyr Tyr His Ser Asp Leu Lys Val
675 680 685
Asn Ala Gly Thr Asn Ser Ala
690 695
<210> 13
<211> 6672
<212> DNA
<213> Daphnia magna
<220>
<221> CDS
<222> (1)..(6672)
<400> 13
atg ctg acg gat acc gca ttc ctg gat gat gca cag agt ttg ggt gca 48
Met Leu Thr Asp Thr Ala Phe Leu Asp Asp Ala Gln Ser Leu Gly Ala
1 5 10 15
att cca tgc gag tca cta tcg tcc gag ccg tgc tgg gcc aac atg aat 96
Ile Pro Cys Glu Ser Leu Ser Ser Glu Pro Cys Trp Ala Asn Met Asn
20 25 30
acg ctc agc agc ggc ggc gga ggt ggt ggc ggc agc ggt ggt agc agc 144
Thr Leu Ser Ser Gly Gly Gly Gly Gly Gly Gly Ser Gly Gly Ser Ser
35 40 45
aat agc aac agc cca ggt ctc ggc agc aac aac aac aat cat acg acg 192
Asn Ser Asn Ser Pro Gly Leu Gly Ser Asn Asn Asn Asn His Thr Thr
50 55 60
tcg tcg gcc tca ccg acg acg acg acg acg acc ggc aac agc aac agc 240
Ser Ser Ala Ser Pro Thr Thr Thr Thr Thr Thr Gly Asn Ser Asn Ser
65 70 75 80
agc ggc ggt ggc gct ggc ggc agc aac ggc ctc acc ggc acc tcg gcg 288
Ser Gly Gly Gly Ala Gly Gly Ser Asn Gly Leu Thr Gly Thr Ser Ala
85 90 95
gcc gcc atc aaa aag cga cgc aaa tcc gac acg aag ccg ctg tcg caa 336
Ala Ala Ile Lys Lys Arg Arg Lys Ser Asp Thr Lys Pro Leu Ser Gln
100 105 110
atc aac aag tgt ctc aac gaa aaa aga cgt cgc gaa cag gaa aac gtc 384
Ile Asn Lys Cys Leu Asn Glu Lys Arg Arg Arg Glu Gln Glu Asn Val
115 120 125
tac att gaa gag ttg gct gaa ttg att tcg gtg agc att gcc gac gtg 432
Tyr Ile Glu Glu Leu Ala Glu Leu Ile Ser Val Ser Ile Ala Asp Val
130 135 140
aac tcg ctg tct gtg aaa ccg gac aag tgc gcc att tta caa gag acg 480
Asn Ser Leu Ser Val Lys Pro Asp Lys Cys Ala Ile Leu Gln Glu Thr
145 150 155 160
gtc aat cag atc cga aag atc cgt gaa cag gaa gaa gac gga cga agt 528
Val Asn Gln Ile Arg Lys Ile Arg Glu Gln Glu Glu Asp Gly Arg Ser
165 170 175
tcg agt agc agt agt agc agc agc agc agc acc agt tcg aat ggt agt 576
Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Thr Ser Ser Asn Gly Ser
180 185 190
agc acc aac agt tct ggc acg agt tca gcc aat agc gga aca gga gga 624
Ser Thr Asn Ser Ser Gly Thr Ser Ser Ala Asn Ser Gly Thr Gly Gly
195 200 205
acc gta gga gct gta ggg gca gga gga gca gga gga gcc gta gga gcc 672
Thr Val Gly Ala Val Gly Ala Gly Gly Ala Gly Gly Ala Val Gly Ala
210 215 220
gta gga gcc gta gga gga ggt gga cag ggc aac aac acg acg tcg ccc 720
Val Gly Ala Val Gly Gly Gly Gly Gln Gly Asn Asn Thr Thr Ser Pro
225 230 235 240
ggc gga gtg act gat ggc ggc gtc ggg ccg ctg ctc caa cag ggc gac 768
Gly Gly Val Thr Asp Gly Gly Val Gly Pro Leu Leu Gln Gln Gly Asp
245 250 255
gtt tca tca tcg aaa ccg gcc ctg cta gac acg caa ctt ttg ggt acg 816
Val Ser Ser Ser Lys Pro Ala Leu Leu Asp Thr Gln Leu Leu Gly Thr
260 265 270
ttc ctg ctc gaa gcc ctt gac ggc ttc ctg ttt gtc gtc aac acg gaa 864
Phe Leu Leu Glu Ala Leu Asp Gly Phe Leu Phe Val Val Asn Thr Glu
275 280 285
ggg aaa acg gag tat gtc tct gaa aat gtc gcc cat ttt cta cac tac 912
Gly Lys Thr Glu Tyr Val Ser Glu Asn Val Ala His Phe Leu His Tyr
290 295 300
caa ccg caa gat ctc gtc ggc aaa tcc atc tac aat ttt atc cac cac 960
Gln Pro Gln Asp Leu Val Gly Lys Ser Ile Tyr Asn Phe Ile His His
305 310 315 320
gga gat cac gcc cgt ttt tcg tcg tcg ctc tta ccc acg gcc atc gcg 1008
Gly Asp His Ala Arg Phe Ser Ser Ser Leu Leu Pro Thr Ala Ile Ala
325 330 335
tgg ccg agt gaa atg gca cca acg tct cag aac agg ata ggt cgc tgt 1056
Trp Pro Ser Glu Met Ala Pro Thr Ser Gln Asn Arg Ile Gly Arg Cys
340 345 350
ttc aat tgc cga tta ctg atc cag ccg ctt ggc gag caa gac gaa acg 1104
Phe Asn Cys Arg Leu Leu Ile Gln Pro Leu Gly Glu Gln Asp Glu Thr
355 360 365
atg gag gag aag cag cag cga gtc gaa cac tat gag aac atg caa ata 1152
Met Glu Glu Lys Gln Gln Arg Val Glu His Tyr Glu Asn Met Gln Ile
370 375 380
tct gcc gtt ctc cag ccg tat cca gcg gac ggt ggc cag cag cag cag 1200
Ser Ala Val Leu Gln Pro Tyr Pro Ala Asp Gly Gly Gln Gln Gln Gln
385 390 395 400
cag cca aca aag aaa atc agc ggg gca gcg gca gct gcg gcc gca gcc 1248
Gln Pro Thr Lys Lys Ile Ser Gly Ala Ala Ala Ala Ala Ala Ala Ala
405 410 415
gca gcc gcc gtc ggc ttg gag acg tcc gat ttg gaa ctg gcg ctg acg 1296
Ala Ala Ala Val Gly Leu Glu Thr Ser Asp Leu Glu Leu Ala Leu Thr
420 425 430
tct gtg gct agc ggc tcg ctc gca ggt gat ccg cag cac tgc ctc gtg 1344
Ser Val Ala Ser Gly Ser Leu Ala Gly Asp Pro Gln His Cys Leu Val
435 440 445
tgc gta gcc agg cgc att ccg tcg acg gag aaa atg gct gcc gcc aac 1392
Cys Val Ala Arg Arg Ile Pro Ser Thr Glu Lys Met Ala Ala Ala Asn
450 455 460
ccg acg gtt gga ggt cca atc gtg gaa cag ttc acc acc aaa ttg gac 1440
Pro Thr Val Gly Gly Pro Ile Val Glu Gln Phe Thr Thr Lys Leu Asp
465 470 475 480
ccg agt ggc aag ata gta gcc gtc gat gtg acg ggc gtt tct tcg ccc 1488
Pro Ser Gly Lys Ile Val Ala Val Asp Val Thr Gly Val Ser Ser Pro
485 490 495
tac agt tcc tac ttg agc aaa gag gcg ctc gtc tcg tgt acg atc cag 1536
Tyr Ser Ser Tyr Leu Ser Lys Glu Ala Leu Val Ser Cys Thr Ile Gln
500 505 510
gag ctc tgc tac ccc gac gat ttg ccc gtt ttc cag gcg cat cta cag 1584
Glu Leu Cys Tyr Pro Asp Asp Leu Pro Val Phe Gln Ala His Leu Gln
515 520 525
gaa acg ctg cat tcc ggc tgc ggc atc agc tcc aga tat cgg ctc aga 1632
Glu Thr Leu His Ser Gly Cys Gly Ile Ser Ser Arg Tyr Arg Leu Arg
530 535 540
ttg acc ggc gcc tcc acc ccg atg ggt cac cgt ggt ggc gcc ggc gga 1680
Leu Thr Gly Ala Ser Thr Pro Met Gly His Arg Gly Gly Ala Gly Gly
545 550 555 560
ggc agc gga ggc ttt ctc gtc gtt caa acc aag tcg aaa cgt ttc att 1728
Gly Ser Gly Gly Phe Leu Val Val Gln Thr Lys Ser Lys Arg Phe Ile
565 570 575
cac ggt gac acg cac gag acg gac ttt atc atg gcc acg cat tcc atc 1776
His Gly Asp Thr His Glu Thr Asp Phe Ile Met Ala Thr His Ser Ile
580 585 590
atc gtc gat gac gac ggt gaa gat gtc gac act ggc aac agc agc agc 1824
Ile Val Asp Asp Asp Gly Glu Asp Val Asp Thr Gly Asn Ser Ser Ser
595 600 605
agc aac acc aac acc aac acc agc cga atg atg ttg ttg gcg gcc gcg 1872
Ser Asn Thr Asn Thr Asn Thr Ser Arg Met Met Leu Leu Ala Ala Ala
610 615 620
agc gac acg ctc aac gac cat cac cgt cta tcg gaa tcg acg ggc agt 1920
Ser Asp Thr Leu Asn Asp His His Arg Leu Ser Glu Ser Thr Gly Ser
625 630 635 640
atc atc agt cag ccg cag caa cag cag caa cag cag cag cag cag cag 1968
Ile Ile Ser Gln Pro Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln
645 650 655
cag cag cag cag agc aac ccg gtg ctc acc agc gtc gtc cgc cac gat 2016
Gln Gln Gln Gln Ser Asn Pro Val Leu Thr Ser Val Val Arg His Asp
660 665 670
gtg ata tca gcc acc agt ttc ggc aac agc ggc tgc agt ggt ggc gcc 2064
Val Ile Ser Ala Thr Ser Phe Gly Asn Ser Gly Cys Ser Gly Gly Ala
675 680 685
acg acg gca acc act tcc tcc acc tcc tcc tcc tcc tac tcc agt acc 2112
Thr Thr Ala Thr Thr Ser Ser Thr Ser Ser Ser Ser Tyr Ser Ser Thr
690 695 700
ttc gcc gga ctc agt ctg gga acg agc ggc gat ctt ctc aat gac ttt 2160
Phe Ala Gly Leu Ser Leu Gly Thr Ser Gly Asp Leu Leu Asn Asp Phe
705 710 715 720
gtc gtg ccc gac ttg ttc atg gct tca ccg ccc tgg gat ttc aat aac 2208
Val Val Pro Asp Leu Phe Met Ala Ser Pro Pro Trp Asp Phe Asn Asn
725 730 735
agc gag tcg agc ctg gac gac ggc ggc agc ggc gtc gcg ctg gcc gcc 2256
Ser Glu Ser Ser Leu Asp Asp Gly Gly Ser Gly Val Ala Leu Ala Ala
740 745 750
gcc tcg gct gcc gct tcg gcc gct gtt gcc gcc gct gct caa atc acc 2304
Ala Ser Ala Ala Ala Ser Ala Ala Val Ala Ala Ala Ala Gln Ile Thr
755 760 765
aac agt cac cac ttg cag gcc gtc acg gcc acg tcc agc ctg cag ctc 2352
Asn Ser His His Leu Gln Ala Val Thr Ala Thr Ser Ser Leu Gln Leu
770 775 780
tcg gtt ccg tcg cct ctc tcc ctc atc ccg tcg ggc ggt cct ctc ttg 2400
Ser Val Pro Ser Pro Leu Ser Leu Ile Pro Ser Gly Gly Pro Leu Leu
785 790 795 800
gcc ggc cac cta ccc cat cat tct gtt ggc gga atg atc aac tgg ggc 2448
Ala Gly His Leu Pro His His Ser Val Gly Gly Met Ile Asn Trp Gly
805 810 815
agc cct ccg ccg tcg gcc ggt gcc ggg gga gta gga caa cga gcc ggc 2496
Ser Pro Pro Pro Ser Ala Gly Ala Gly Gly Val Gly Gln Arg Ala Gly
820 825 830
tcg aca ccg tgc gga caa atg gcg acc gtc atg ggc tcg tcg agg ccc 2544
Ser Thr Pro Cys Gly Gln Met Ala Thr Val Met Gly Ser Ser Arg Pro
835 840 845
agc tcg aga caa agc gcc tcg tcg aca ccg cga ccg ccc agc gtg tct 2592
Ser Ser Arg Gln Ser Ala Ser Ser Thr Pro Arg Pro Pro Ser Val Ser
850 855 860
tca gcc ttc agt ccg gct ccc aat tcc gtc ctg ggc gtc gtt cat ccg 2640
Ser Ala Phe Ser Pro Ala Pro Asn Ser Val Leu Gly Val Val His Pro
865 870 875 880
tca ccc gtg ctc agt cca gtc ggc gcc acc agc atc cat tca gcc gca 2688
Ser Pro Val Leu Ser Pro Val Gly Ala Thr Ser Ile His Ser Ala Ala
885 890 895
atg tct tgc acc agc ggt ttg gtc act ggc tcc acg tcg tcg tca tcg 2736
Met Ser Cys Thr Ser Gly Leu Val Thr Gly Ser Thr Ser Ser Ser Ser
900 905 910
gct ggc cag caa caa ccc agt ccg gcc agt atg acg aca ccc ttt agc 2784
Ala Gly Gln Gln Gln Pro Ser Pro Ala Ser Met Thr Thr Pro Phe Ser
915 920 925
aac aat ttc ccg ttc agt cca ctc caa gat ccc att cct cag cat ccg 2832
Asn Asn Phe Pro Phe Ser Pro Leu Gln Asp Pro Ile Pro Gln His Pro
930 935 940
gca acg gct ccg cag acc cat aat ccg gcc acc cct ttc ctg gac gaa 2880
Ala Thr Ala Pro Gln Thr His Asn Pro Ala Thr Pro Phe Leu Asp Glu
945 950 955 960
gtc cgt gac acc aag gac gga atc atc tcg tcc ggc cct ggt ggt agt 2928
Val Arg Asp Thr Lys Asp Gly Ile Ile Ser Ser Gly Pro Gly Gly Ser
965 970 975
gtt agc cac ggt cac aac tac ctg tct ggt gga tct cac cac cag cag 2976
Val Ser His Gly His Asn Tyr Leu Ser Gly Gly Ser His His Gln Gln
980 985 990
cag cat cat cat cat cat caa caa caa caa cag caa caa caa cag caa 3024
Gln His His His His His Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln
995 1000 1005
caa cac gcg acc gac aaa caa atg agc gct ctc agt agt tta ttg 3069
Gln His Ala Thr Asp Lys Gln Met Ser Ala Leu Ser Ser Leu Leu
1010 1015 1020
aac tgt aac gac gct gcc aca tca tcg tcg tcg tct tcg tcg tcc 3114
Asn Cys Asn Asp Ala Ala Thr Ser Ser Ser Ser Ser Ser Ser Ser
1025 1030 1035
tct tcg tct tct tca tct tct tcc tcg ttg gcc gaa tct ggc cgg 3159
Ser Ser Ser Ser Ser Ser Ser Ser Ser Leu Ala Glu Ser Gly Arg
1040 1045 1050
tta cgc att ttg ctc atg caa aga ccg ggc aac gct ccg cca ccc 3204
Leu Arg Ile Leu Leu Met Gln Arg Pro Gly Asn Ala Pro Pro Pro
1055 1060 1065
tca gcc cat cag cag cca ggt cat tct agc agt ggt agt agt agt 3249
Ser Ala His Gln Gln Pro Gly His Ser Ser Ser Gly Ser Ser Ser
1070 1075 1080
agt agt agt agt aca agt aca agt aca agt aca agt aca agt aca 3294
Ser Ser Ser Ser Thr Ser Thr Ser Thr Ser Thr Ser Thr Ser Thr
1085 1090 1095
agt aca aat aca aat aca aat act aat agt agc aac aac aat aac 3339
Ser Thr Asn Thr Asn Thr Asn Thr Asn Ser Ser Asn Asn Asn Asn
1100 1105 1110
aac aac aac aac aac gct agc ggc aac aac aac agc agt agt gtc 3384
Asn Asn Asn Asn Asn Ala Ser Gly Asn Asn Asn Ser Ser Ser Val
1115 1120 1125
aac ggg agc cat ctg ttg gcg gct ttg ggc gac gct gag gcc gtc 3429
Asn Gly Ser His Leu Leu Ala Ala Leu Gly Asp Ala Glu Ala Val
1130 1135 1140
aaa cgc gaa aaa gat gaa aat agc ggt gcg ccc tct tgt ggc tcg 3474
Lys Arg Glu Lys Asp Glu Asn Ser Gly Ala Pro Ser Cys Gly Ser
1145 1150 1155
ttg agc gtc acc aaa ggc agt cac ggc aac cgc att ctc aaa ggg 3519
Leu Ser Val Thr Lys Gly Ser His Gly Asn Arg Ile Leu Lys Gly
1160 1165 1170
ttg ctg aac cag gac gat ggc gat gaa gct gat caa gcg gac gat 3564
Leu Leu Asn Gln Asp Asp Gly Asp Glu Ala Asp Gln Ala Asp Asp
1175 1180 1185
acg agc aat cat cgc ttc ttg ttg acg gcc aga ggc aac ctt tct 3609
Thr Ser Asn His Arg Phe Leu Leu Thr Ala Arg Gly Asn Leu Ser
1190 1195 1200
gga gac gga gtc aag acc agt agt agc gcg ggc aac aac aac aac 3654
Gly Asp Gly Val Lys Thr Ser Ser Ser Ala Gly Asn Asn Asn Asn
1205 1210 1215
aac acc acc aac acc aac aac aat aac acc aac aac aac aac aac 3699
Asn Thr Thr Asn Thr Asn Asn Asn Asn Thr Asn Asn Asn Asn Asn
1220 1225 1230
atg ctg cac aaa ttg ttg aat gtg cgg agc gac gac gat gcc gag 3744
Met Leu His Lys Leu Leu Asn Val Arg Ser Asp Asp Asp Ala Glu
1235 1240 1245
cag cgg atg ggt ctg cgc aag ccc aac gaa ttg ctc aag aaa ctt 3789
Gln Arg Met Gly Leu Arg Lys Pro Asn Glu Leu Leu Lys Lys Leu
1250 1255 1260
ctc aag gac ccc gaa gag gat cac caa cag gca agt gga aac ggc 3834
Leu Lys Asp Pro Glu Glu Asp His Gln Gln Ala Ser Gly Asn Gly
1265 1270 1275
agc agc agt gcc tgt ggc ggc acc gga agc ggt ggc acg gcc aac 3879
Ser Ser Ser Ala Cys Gly Gly Thr Gly Ser Gly Gly Thr Ala Asn
1280 1285 1290
cag ctc caa caa ttt cac cac caa cgt caa cag cag cag cag caa 3924
Gln Leu Gln Gln Phe His His Gln Arg Gln Gln Gln Gln Gln Gln
1295 1300 1305
caa cag caa cac cag caa cac cag caa cac cag caa cac caa caa 3969
Gln Gln Gln His Gln Gln His Gln Gln His Gln Gln His Gln Gln
1310 1315 1320
agt cag cag caa cag caa cag aat caa cat cat cat tca gat cag 4014
Ser Gln Gln Gln Gln Gln Gln Asn Gln His His His Ser Asp Gln
1325 1330 1335
gtg tcg ttc cag gaa gag caa tta ctg aaa tcg ttt ggt ttc cca 4059
Val Ser Phe Gln Glu Glu Gln Leu Leu Lys Ser Phe Gly Phe Pro
1340 1345 1350
tca ccg aca gcc tcg tca ggt tcg tct acg gca gca acg gtt gca 4104
Ser Pro Thr Ala Ser Ser Gly Ser Ser Thr Ala Ala Thr Val Ala
1355 1360 1365
acg gga tct ttg gcc aac atg ttg gct acc agt caa atg act cat 4149
Thr Gly Ser Leu Ala Asn Met Leu Ala Thr Ser Gln Met Thr His
1370 1375 1380
ctc aga tct cct caa ccg cca ggc atg tcg agc cat tgc gac gga 4194
Leu Arg Ser Pro Gln Pro Pro Gly Met Ser Ser His Cys Asp Gly
1385 1390 1395
ttg ttg gag ttt ggc gga gtt gtt tgt agc agt acg acc gcc agt 4239
Leu Leu Glu Phe Gly Gly Val Val Cys Ser Ser Thr Thr Ala Ser
1400 1405 1410
ggc atg gtg ttt ggt ggc aat gct gcc gtt ggt gga gct agt ggg 4284
Gly Met Val Phe Gly Gly Asn Ala Ala Val Gly Gly Ala Ser Gly
1415 1420 1425
atg cgg ggc acg aaa agg cac agc gaa gaa gct cgt gac gag gtg 4329
Met Arg Gly Thr Lys Arg His Ser Glu Glu Ala Arg Asp Glu Val
1430 1435 1440
aaa gcc agc aaa gag ccc atg ctg agc gcc gac cac ctg atg atg 4374
Lys Ala Ser Lys Glu Pro Met Leu Ser Ala Asp His Leu Met Met
1445 1450 1455
tcc gca ggc gga ggc ggg gtc ttg cac cag ctg ttg ggt cct ccg 4419
Ser Ala Gly Gly Gly Gly Val Leu His Gln Leu Leu Gly Pro Pro
1460 1465 1470
cca ctg tcg acg gcg tcg acg tca tcc tct tct tcc gca tct tcc 4464
Pro Leu Ser Thr Ala Ser Thr Ser Ser Ser Ser Ser Ala Ser Ser
1475 1480 1485
tcg tct gcc tgc tct tct tcg gct gcg ttg tct tcg tcg ttg gcg 4509
Ser Ser Ala Cys Ser Ser Ser Ala Ala Leu Ser Ser Ser Leu Ala
1490 1495 1500
cca tcg aat gcg cac agt gtt gca gcc acg act ctt gcg ata gcc 4554
Pro Ser Asn Ala His Ser Val Ala Ala Thr Thr Leu Ala Ile Ala
1505 1510 1515
gcg ttg caa cat caa cct ctt tcg tcg cca tcg aca gca gct gcc 4599
Ala Leu Gln His Gln Pro Leu Ser Ser Pro Ser Thr Ala Ala Ala
1520 1525 1530
gtc gcg gcc gcc acg tcg gcc gtg gct gcg gcc gca gct acg gcc 4644
Val Ala Ala Ala Thr Ser Ala Val Ala Ala Ala Ala Ala Thr Ala
1535 1540 1545
aac gcg atg gct tct caa ttg caa gca gcg cct agt gcc cag tca 4689
Asn Ala Met Ala Ser Gln Leu Gln Ala Ala Pro Ser Ala Gln Ser
1550 1555 1560
gcc gcc gct gcc gtt gct gct gcc gcc gcc gcc gcc gcc gcc gcc 4734
Ala Ala Ala Ala Val Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala
1565 1570 1575
gcc gct gct gct gct gcc aat ctg ccg gcc agc agt aaa ttg tgc 4779
Ala Ala Ala Ala Ala Ala Asn Leu Pro Ala Ser Ser Lys Leu Cys
1580 1585 1590
gaa aaa aat aag atg ttg gct tcg tta ttg gcc aag acg ccc gtg 4824
Glu Lys Asn Lys Met Leu Ala Ser Leu Leu Ala Lys Thr Pro Val
1595 1600 1605
atg ccg tcg ccg tcg tcg acc aat att gcc tcg ccc aaa ccg tca 4869
Met Pro Ser Pro Ser Ser Thr Asn Ile Ala Ser Pro Lys Pro Ser
1610 1615 1620
gcg ttg cct cag gag aaa ttg cct aag gat ttg aag gag aaa att 4914
Ala Leu Pro Gln Glu Lys Leu Pro Lys Asp Leu Lys Glu Lys Ile
1625 1630 1635
ctt cag acg ccg cca gtc agt gga acg tcg gct ccg ggc gcc cat 4959
Leu Gln Thr Pro Pro Val Ser Gly Thr Ser Ala Pro Gly Ala His
1640 1645 1650
tgg gct gga ggc tcg gtg caa acc cag ccc ccg acg act atg caa 5004
Trp Ala Gly Gly Ser Val Gln Thr Gln Pro Pro Thr Thr Met Gln
1655 1660 1665
ttg ccc ccg cat ccg gcg atc caa caa cct cag caa cag caa caa 5049
Leu Pro Pro His Pro Ala Ile Gln Gln Pro Gln Gln Gln Gln Gln
1670 1675 1680
cac gtt ctt aac cag caa caa cag cag cag caa cag cag cag cag 5094
His Val Leu Asn Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln
1685 1690 1695
cag cag caa cag caa cag caa cag caa cag caa cag caa caa cag 5139
Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln
1700 1705 1710
caa cga cat ccg gcc atg caa caa tca cag cag cat cag tta cac 5184
Gln Arg His Pro Ala Met Gln Gln Ser Gln Gln His Gln Leu His
1715 1720 1725
cct cga tct cag cat ctt cca caa caa cat cag cat ttg aac ctc 5229
Pro Arg Ser Gln His Leu Pro Gln Gln His Gln His Leu Asn Leu
1730 1735 1740
ggt cag aag caa cag cag caa cca act cct caa acc ggt gga ttc 5274
Gly Gln Lys Gln Gln Gln Gln Pro Thr Pro Gln Thr Gly Gly Phe
1745 1750 1755
ttg aat tct ctc ctg aac cgg ccc ata gat tcc gcc tcg ggt ccc 5319
Leu Asn Ser Leu Leu Asn Arg Pro Ile Asp Ser Ala Ser Gly Pro
1760 1765 1770
aat att atc gga gag tct caa caa cag gcc aat cag cag cag cag 5364
Asn Ile Ile Gly Glu Ser Gln Gln Gln Ala Asn Gln Gln Gln Gln
1775 1780 1785
cag cag caa caa caa caa caa caa caa cta tat tta gct gct caa 5409
Gln Gln Gln Gln Gln Gln Gln Gln Gln Leu Tyr Leu Ala Ala Gln
1790 1795 1800
cag cct ccg cct gtc caa ctt cag cat cga ccc aat cag acg gta 5454
Gln Pro Pro Pro Val Gln Leu Gln His Arg Pro Asn Gln Thr Val
1805 1810 1815
cag aaa ttg tcg ctc aac aac caa caa cag ctt tcg gcg gct atg 5499
Gln Lys Leu Ser Leu Asn Asn Gln Gln Gln Leu Ser Ala Ala Met
1820 1825 1830
aac tcg tct ggt ggt ttc aac att tct ctt cat cct caa caa cac 5544
Asn Ser Ser Gly Gly Phe Asn Ile Ser Leu His Pro Gln Gln His
1835 1840 1845
cag cag cag cag cag cag cat cat cac cac ctt caa cag cag cag 5589
Gln Gln Gln Gln Gln Gln His His His His Leu Gln Gln Gln Gln
1850 1855 1860
cag caa caa caa caa cac cat cag cag cag cag cag cag cag cag 5634
Gln Gln Gln Gln Gln His His Gln Gln Gln Gln Gln Gln Gln Gln
1865 1870 1875
caa caa caa caa caa caa caa caa caa caa caa cag cat cat caa 5679
Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln His His Gln
1880 1885 1890
ctg cag cat caa ctc tct ggt tct atg ctg gcc gat cgt ggc ctt 5724
Leu Gln His Gln Leu Ser Gly Ser Met Leu Ala Asp Arg Gly Leu
1895 1900 1905
ttg caa gct ggc gga gga ccg ggc caa cga tcc ggc atg tcg atc 5769
Leu Gln Ala Gly Gly Gly Pro Gly Gln Arg Ser Gly Met Ser Ile
1910 1915 1920
cag ccg caa cag cag acg tcg cat gcc aat tcc atg att gca gcc 5814
Gln Pro Gln Gln Gln Thr Ser His Ala Asn Ser Met Ile Ala Ala
1925 1930 1935
gcc agt ttg gaa agc agc gat ggc agc tac agc gtt cac gcc gac 5859
Ala Ser Leu Glu Ser Ser Asp Gly Ser Tyr Ser Val His Ala Asp
1940 1945 1950
ttt atg act ccg ctg gac gtc caa atg gct tct gtg gcc ggc tgg 5904
Phe Met Thr Pro Leu Asp Val Gln Met Ala Ser Val Ala Gly Trp
1955 1960 1965
ggt gac acg cct tcc atg gat ccg gag ctt tcc gac atc att gag 5949
Gly Asp Thr Pro Ser Met Asp Pro Glu Leu Ser Asp Ile Ile Glu
1970 1975 1980
cag gtc atc gac atg gat gag cgc tac gag agc gat tcg atg att 5994
Gln Val Ile Asp Met Asp Glu Arg Tyr Glu Ser Asp Ser Met Ile
1985 1990 1995
ttc ggc gaa ttg aca tcg gtc acg cca ccg cca gtc gcc atc cag 6039
Phe Gly Glu Leu Thr Ser Val Thr Pro Pro Pro Val Ala Ile Gln
2000 2005 2010
ccc gtc ctg tcc gtt cag tcg tcg caa gcg atc gct tcg gtg gct 6084
Pro Val Leu Ser Val Gln Ser Ser Gln Ala Ile Ala Ser Val Ala
2015 2020 2025
caa gcg act gcc att gtc ggc cca cta ggc ccg cac ctt caa atg 6129
Gln Ala Thr Ala Ile Val Gly Pro Leu Gly Pro His Leu Gln Met
2030 2035 2040
gac atg tcg aaa gag aaa ctg gcc atc acg gcc att caa aag tcg 6174
Asp Met Ser Lys Glu Lys Leu Ala Ile Thr Ala Ile Gln Lys Ser
2045 2050 2055
ctc atg tcc tac gag aag att ccc acc gta gct caa agt cct ccg 6219
Leu Met Ser Tyr Glu Lys Ile Pro Thr Val Ala Gln Ser Pro Pro
2060 2065 2070
gcc tac aat ctg ccc ggc tac gca caa cag ggt caa gga gca ccg 6264
Ala Tyr Asn Leu Pro Gly Tyr Ala Gln Gln Gly Gln Gly Ala Pro
2075 2080 2085
acg aga atg tcc act cca act tac ggc atg aat tca gca ccg gcc 6309
Thr Arg Met Ser Thr Pro Thr Tyr Gly Met Asn Ser Ala Pro Ala
2090 2095 2100
agt tca ttg ccc atg gcg aat caa caa ctg caa acc aac ttg acg 6354
Ser Ser Leu Pro Met Ala Asn Gln Gln Leu Gln Thr Asn Leu Thr
2105 2110 2115
atg ccg gga gct aga aaa cag aaa tta ccc gtt cag caa aga cga 6399
Met Pro Gly Ala Arg Lys Gln Lys Leu Pro Val Gln Gln Arg Arg
2120 2125 2130
ctg gct aat aga caa cag caa cag cag cag cag caa cag cag cag 6444
Leu Ala Asn Arg Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln
2135 2140 2145
cag caa cag cag cag caa cag caa cag caa cag cag cag cag cag 6489
Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln
2150 2155 2160
tca tcg tcg caa gaa caa caa caa caa caa caa caa cca gct cct 6534
Ser Ser Ser Gln Glu Gln Gln Gln Gln Gln Gln Gln Pro Ala Pro
2165 2170 2175
cag cag cag cta cta ggc gtc ttg ctg aat gaa tcg tct gta caa 6579
Gln Gln Gln Leu Leu Gly Val Leu Leu Asn Glu Ser Ser Val Gln
2180 2185 2190
cac acc caa ggg gca cag ctc tca ccc gga gcc ttg caa att atg 6624
His Thr Gln Gly Ala Gln Leu Ser Pro Gly Ala Leu Gln Ile Met
2195 2200 2205
gat gac cta ctt aac gcg atc cca ccc aac atg acg ata tcc agg 6669
Asp Asp Leu Leu Asn Ala Ile Pro Pro Asn Met Thr Ile Ser Arg
2210 2215 2220
taa 6672
<210> 14
<211> 2223
<212> PRT
<213> Daphnia magna
<400> 14
Met Leu Thr Asp Thr Ala Phe Leu Asp Asp Ala Gln Ser Leu Gly Ala
1 5 10 15
Ile Pro Cys Glu Ser Leu Ser Ser Glu Pro Cys Trp Ala Asn Met Asn
20 25 30
Thr Leu Ser Ser Gly Gly Gly Gly Gly Gly Gly Ser Gly Gly Ser Ser
35 40 45
Asn Ser Asn Ser Pro Gly Leu Gly Ser Asn Asn Asn Asn His Thr Thr
50 55 60
Ser Ser Ala Ser Pro Thr Thr Thr Thr Thr Thr Gly Asn Ser Asn Ser
65 70 75 80
Ser Gly Gly Gly Ala Gly Gly Ser Asn Gly Leu Thr Gly Thr Ser Ala
85 90 95
Ala Ala Ile Lys Lys Arg Arg Lys Ser Asp Thr Lys Pro Leu Ser Gln
100 105 110
Ile Asn Lys Cys Leu Asn Glu Lys Arg Arg Arg Glu Gln Glu Asn Val
115 120 125
Tyr Ile Glu Glu Leu Ala Glu Leu Ile Ser Val Ser Ile Ala Asp Val
130 135 140
Asn Ser Leu Ser Val Lys Pro Asp Lys Cys Ala Ile Leu Gln Glu Thr
145 150 155 160
Val Asn Gln Ile Arg Lys Ile Arg Glu Gln Glu Glu Asp Gly Arg Ser
165 170 175
Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Thr Ser Ser Asn Gly Ser
180 185 190
Ser Thr Asn Ser Ser Gly Thr Ser Ser Ala Asn Ser Gly Thr Gly Gly
195 200 205
Thr Val Gly Ala Val Gly Ala Gly Gly Ala Gly Gly Ala Val Gly Ala
210 215 220
Val Gly Ala Val Gly Gly Gly Gly Gln Gly Asn Asn Thr Thr Ser Pro
225 230 235 240
Gly Gly Val Thr Asp Gly Gly Val Gly Pro Leu Leu Gln Gln Gly Asp
245 250 255
Val Ser Ser Ser Lys Pro Ala Leu Leu Asp Thr Gln Leu Leu Gly Thr
260 265 270
Phe Leu Leu Glu Ala Leu Asp Gly Phe Leu Phe Val Val Asn Thr Glu
275 280 285
Gly Lys Thr Glu Tyr Val Ser Glu Asn Val Ala His Phe Leu His Tyr
290 295 300
Gln Pro Gln Asp Leu Val Gly Lys Ser Ile Tyr Asn Phe Ile His His
305 310 315 320
Gly Asp His Ala Arg Phe Ser Ser Ser Leu Leu Pro Thr Ala Ile Ala
325 330 335
Trp Pro Ser Glu Met Ala Pro Thr Ser Gln Asn Arg Ile Gly Arg Cys
340 345 350
Phe Asn Cys Arg Leu Leu Ile Gln Pro Leu Gly Glu Gln Asp Glu Thr
355 360 365
Met Glu Glu Lys Gln Gln Arg Val Glu His Tyr Glu Asn Met Gln Ile
370 375 380
Ser Ala Val Leu Gln Pro Tyr Pro Ala Asp Gly Gly Gln Gln Gln Gln
385 390 395 400
Gln Pro Thr Lys Lys Ile Ser Gly Ala Ala Ala Ala Ala Ala Ala Ala
405 410 415
Ala Ala Ala Val Gly Leu Glu Thr Ser Asp Leu Glu Leu Ala Leu Thr
420 425 430
Ser Val Ala Ser Gly Ser Leu Ala Gly Asp Pro Gln His Cys Leu Val
435 440 445
Cys Val Ala Arg Arg Ile Pro Ser Thr Glu Lys Met Ala Ala Ala Asn
450 455 460
Pro Thr Val Gly Gly Pro Ile Val Glu Gln Phe Thr Thr Lys Leu Asp
465 470 475 480
Pro Ser Gly Lys Ile Val Ala Val Asp Val Thr Gly Val Ser Ser Pro
485 490 495
Tyr Ser Ser Tyr Leu Ser Lys Glu Ala Leu Val Ser Cys Thr Ile Gln
500 505 510
Glu Leu Cys Tyr Pro Asp Asp Leu Pro Val Phe Gln Ala His Leu Gln
515 520 525
Glu Thr Leu His Ser Gly Cys Gly Ile Ser Ser Arg Tyr Arg Leu Arg
530 535 540
Leu Thr Gly Ala Ser Thr Pro Met Gly His Arg Gly Gly Ala Gly Gly
545 550 555 560
Gly Ser Gly Gly Phe Leu Val Val Gln Thr Lys Ser Lys Arg Phe Ile
565 570 575
His Gly Asp Thr His Glu Thr Asp Phe Ile Met Ala Thr His Ser Ile
580 585 590
Ile Val Asp Asp Asp Gly Glu Asp Val Asp Thr Gly Asn Ser Ser Ser
595 600 605
Ser Asn Thr Asn Thr Asn Thr Ser Arg Met Met Leu Leu Ala Ala Ala
610 615 620
Ser Asp Thr Leu Asn Asp His His Arg Leu Ser Glu Ser Thr Gly Ser
625 630 635 640
Ile Ile Ser Gln Pro Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln
645 650 655
Gln Gln Gln Gln Ser Asn Pro Val Leu Thr Ser Val Val Arg His Asp
660 665 670
Val Ile Ser Ala Thr Ser Phe Gly Asn Ser Gly Cys Ser Gly Gly Ala
675 680 685
Thr Thr Ala Thr Thr Ser Ser Thr Ser Ser Ser Ser Tyr Ser Ser Thr
690 695 700
Phe Ala Gly Leu Ser Leu Gly Thr Ser Gly Asp Leu Leu Asn Asp Phe
705 710 715 720
Val Val Pro Asp Leu Phe Met Ala Ser Pro Pro Trp Asp Phe Asn Asn
725 730 735
Ser Glu Ser Ser Leu Asp Asp Gly Gly Ser Gly Val Ala Leu Ala Ala
740 745 750
Ala Ser Ala Ala Ala Ser Ala Ala Val Ala Ala Ala Ala Gln Ile Thr
755 760 765
Asn Ser His His Leu Gln Ala Val Thr Ala Thr Ser Ser Leu Gln Leu
770 775 780
Ser Val Pro Ser Pro Leu Ser Leu Ile Pro Ser Gly Gly Pro Leu Leu
785 790 795 800
Ala Gly His Leu Pro His His Ser Val Gly Gly Met Ile Asn Trp Gly
805 810 815
Ser Pro Pro Pro Ser Ala Gly Ala Gly Gly Val Gly Gln Arg Ala Gly
820 825 830
Ser Thr Pro Cys Gly Gln Met Ala Thr Val Met Gly Ser Ser Arg Pro
835 840 845
Ser Ser Arg Gln Ser Ala Ser Ser Thr Pro Arg Pro Pro Ser Val Ser
850 855 860
Ser Ala Phe Ser Pro Ala Pro Asn Ser Val Leu Gly Val Val His Pro
865 870 875 880
Ser Pro Val Leu Ser Pro Val Gly Ala Thr Ser Ile His Ser Ala Ala
885 890 895
Met Ser Cys Thr Ser Gly Leu Val Thr Gly Ser Thr Ser Ser Ser Ser
900 905 910
Ala Gly Gln Gln Gln Pro Ser Pro Ala Ser Met Thr Thr Pro Phe Ser
915 920 925
Asn Asn Phe Pro Phe Ser Pro Leu Gln Asp Pro Ile Pro Gln His Pro
930 935 940
Ala Thr Ala Pro Gln Thr His Asn Pro Ala Thr Pro Phe Leu Asp Glu
945 950 955 960
Val Arg Asp Thr Lys Asp Gly Ile Ile Ser Ser Gly Pro Gly Gly Ser
965 970 975
Val Ser His Gly His Asn Tyr Leu Ser Gly Gly Ser His His Gln Gln
980 985 990
Gln His His His His His Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln
995 1000 1005
Gln His Ala Thr Asp Lys Gln Met Ser Ala Leu Ser Ser Leu Leu
1010 1015 1020
Asn Cys Asn Asp Ala Ala Thr Ser Ser Ser Ser Ser Ser Ser Ser
1025 1030 1035
Ser Ser Ser Ser Ser Ser Ser Ser Ser Leu Ala Glu Ser Gly Arg
1040 1045 1050
Leu Arg Ile Leu Leu Met Gln Arg Pro Gly Asn Ala Pro Pro Pro
1055 1060 1065
Ser Ala His Gln Gln Pro Gly His Ser Ser Ser Gly Ser Ser Ser
1070 1075 1080
Ser Ser Ser Ser Thr Ser Thr Ser Thr Ser Thr Ser Thr Ser Thr
1085 1090 1095
Ser Thr Asn Thr Asn Thr Asn Thr Asn Ser Ser Asn Asn Asn Asn
1100 1105 1110
Asn Asn Asn Asn Asn Ala Ser Gly Asn Asn Asn Ser Ser Ser Val
1115 1120 1125
Asn Gly Ser His Leu Leu Ala Ala Leu Gly Asp Ala Glu Ala Val
1130 1135 1140
Lys Arg Glu Lys Asp Glu Asn Ser Gly Ala Pro Ser Cys Gly Ser
1145 1150 1155
Leu Ser Val Thr Lys Gly Ser His Gly Asn Arg Ile Leu Lys Gly
1160 1165 1170
Leu Leu Asn Gln Asp Asp Gly Asp Glu Ala Asp Gln Ala Asp Asp
1175 1180 1185
Thr Ser Asn His Arg Phe Leu Leu Thr Ala Arg Gly Asn Leu Ser
1190 1195 1200
Gly Asp Gly Val Lys Thr Ser Ser Ser Ala Gly Asn Asn Asn Asn
1205 1210 1215
Asn Thr Thr Asn Thr Asn Asn Asn Asn Thr Asn Asn Asn Asn Asn
1220 1225 1230
Met Leu His Lys Leu Leu Asn Val Arg Ser Asp Asp Asp Ala Glu
1235 1240 1245
Gln Arg Met Gly Leu Arg Lys Pro Asn Glu Leu Leu Lys Lys Leu
1250 1255 1260
Leu Lys Asp Pro Glu Glu Asp His Gln Gln Ala Ser Gly Asn Gly
1265 1270 1275
Ser Ser Ser Ala Cys Gly Gly Thr Gly Ser Gly Gly Thr Ala Asn
1280 1285 1290
Gln Leu Gln Gln Phe His His Gln Arg Gln Gln Gln Gln Gln Gln
1295 1300 1305
Gln Gln Gln His Gln Gln His Gln Gln His Gln Gln His Gln Gln
1310 1315 1320
Ser Gln Gln Gln Gln Gln Gln Asn Gln His His His Ser Asp Gln
1325 1330 1335
Val Ser Phe Gln Glu Glu Gln Leu Leu Lys Ser Phe Gly Phe Pro
1340 1345 1350
Ser Pro Thr Ala Ser Ser Gly Ser Ser Thr Ala Ala Thr Val Ala
1355 1360 1365
Thr Gly Ser Leu Ala Asn Met Leu Ala Thr Ser Gln Met Thr His
1370 1375 1380
Leu Arg Ser Pro Gln Pro Pro Gly Met Ser Ser His Cys Asp Gly
1385 1390 1395
Leu Leu Glu Phe Gly Gly Val Val Cys Ser Ser Thr Thr Ala Ser
1400 1405 1410
Gly Met Val Phe Gly Gly Asn Ala Ala Val Gly Gly Ala Ser Gly
1415 1420 1425
Met Arg Gly Thr Lys Arg His Ser Glu Glu Ala Arg Asp Glu Val
1430 1435 1440
Lys Ala Ser Lys Glu Pro Met Leu Ser Ala Asp His Leu Met Met
1445 1450 1455
Ser Ala Gly Gly Gly Gly Val Leu His Gln Leu Leu Gly Pro Pro
1460 1465 1470
Pro Leu Ser Thr Ala Ser Thr Ser Ser Ser Ser Ser Ala Ser Ser
1475 1480 1485
Ser Ser Ala Cys Ser Ser Ser Ala Ala Leu Ser Ser Ser Leu Ala
1490 1495 1500
Pro Ser Asn Ala His Ser Val Ala Ala Thr Thr Leu Ala Ile Ala
1505 1510 1515
Ala Leu Gln His Gln Pro Leu Ser Ser Pro Ser Thr Ala Ala Ala
1520 1525 1530
Val Ala Ala Ala Thr Ser Ala Val Ala Ala Ala Ala Ala Thr Ala
1535 1540 1545
Asn Ala Met Ala Ser Gln Leu Gln Ala Ala Pro Ser Ala Gln Ser
1550 1555 1560
Ala Ala Ala Ala Val Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala
1565 1570 1575
Ala Ala Ala Ala Ala Ala Asn Leu Pro Ala Ser Ser Lys Leu Cys
1580 1585 1590
Glu Lys Asn Lys Met Leu Ala Ser Leu Leu Ala Lys Thr Pro Val
1595 1600 1605
Met Pro Ser Pro Ser Ser Thr Asn Ile Ala Ser Pro Lys Pro Ser
1610 1615 1620
Ala Leu Pro Gln Glu Lys Leu Pro Lys Asp Leu Lys Glu Lys Ile
1625 1630 1635
Leu Gln Thr Pro Pro Val Ser Gly Thr Ser Ala Pro Gly Ala His
1640 1645 1650
Trp Ala Gly Gly Ser Val Gln Thr Gln Pro Pro Thr Thr Met Gln
1655 1660 1665
Leu Pro Pro His Pro Ala Ile Gln Gln Pro Gln Gln Gln Gln Gln
1670 1675 1680
His Val Leu Asn Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln
1685 1690 1695
Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln
1700 1705 1710
Gln Arg His Pro Ala Met Gln Gln Ser Gln Gln His Gln Leu His
1715 1720 1725
Pro Arg Ser Gln His Leu Pro Gln Gln His Gln His Leu Asn Leu
1730 1735 1740
Gly Gln Lys Gln Gln Gln Gln Pro Thr Pro Gln Thr Gly Gly Phe
1745 1750 1755
Leu Asn Ser Leu Leu Asn Arg Pro Ile Asp Ser Ala Ser Gly Pro
1760 1765 1770
Asn Ile Ile Gly Glu Ser Gln Gln Gln Ala Asn Gln Gln Gln Gln
1775 1780 1785
Gln Gln Gln Gln Gln Gln Gln Gln Gln Leu Tyr Leu Ala Ala Gln
1790 1795 1800
Gln Pro Pro Pro Val Gln Leu Gln His Arg Pro Asn Gln Thr Val
1805 1810 1815
Gln Lys Leu Ser Leu Asn Asn Gln Gln Gln Leu Ser Ala Ala Met
1820 1825 1830
Asn Ser Ser Gly Gly Phe Asn Ile Ser Leu His Pro Gln Gln His
1835 1840 1845
Gln Gln Gln Gln Gln Gln His His His His Leu Gln Gln Gln Gln
1850 1855 1860
Gln Gln Gln Gln Gln His His Gln Gln Gln Gln Gln Gln Gln Gln
1865 1870 1875
Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln His His Gln
1880 1885 1890
Leu Gln His Gln Leu Ser Gly Ser Met Leu Ala Asp Arg Gly Leu
1895 1900 1905
Leu Gln Ala Gly Gly Gly Pro Gly Gln Arg Ser Gly Met Ser Ile
1910 1915 1920
Gln Pro Gln Gln Gln Thr Ser His Ala Asn Ser Met Ile Ala Ala
1925 1930 1935
Ala Ser Leu Glu Ser Ser Asp Gly Ser Tyr Ser Val His Ala Asp
1940 1945 1950
Phe Met Thr Pro Leu Asp Val Gln Met Ala Ser Val Ala Gly Trp
1955 1960 1965
Gly Asp Thr Pro Ser Met Asp Pro Glu Leu Ser Asp Ile Ile Glu
1970 1975 1980
Gln Val Ile Asp Met Asp Glu Arg Tyr Glu Ser Asp Ser Met Ile
1985 1990 1995
Phe Gly Glu Leu Thr Ser Val Thr Pro Pro Pro Val Ala Ile Gln
2000 2005 2010
Pro Val Leu Ser Val Gln Ser Ser Gln Ala Ile Ala Ser Val Ala
2015 2020 2025
Gln Ala Thr Ala Ile Val Gly Pro Leu Gly Pro His Leu Gln Met
2030 2035 2040
Asp Met Ser Lys Glu Lys Leu Ala Ile Thr Ala Ile Gln Lys Ser
2045 2050 2055
Leu Met Ser Tyr Glu Lys Ile Pro Thr Val Ala Gln Ser Pro Pro
2060 2065 2070
Ala Tyr Asn Leu Pro Gly Tyr Ala Gln Gln Gly Gln Gly Ala Pro
2075 2080 2085
Thr Arg Met Ser Thr Pro Thr Tyr Gly Met Asn Ser Ala Pro Ala
2090 2095 2100
Ser Ser Leu Pro Met Ala Asn Gln Gln Leu Gln Thr Asn Leu Thr
2105 2110 2115
Met Pro Gly Ala Arg Lys Gln Lys Leu Pro Val Gln Gln Arg Arg
2120 2125 2130
Leu Ala Asn Arg Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln
2135 2140 2145
Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln
2150 2155 2160
Ser Ser Ser Gln Glu Gln Gln Gln Gln Gln Gln Gln Pro Ala Pro
2165 2170 2175
Gln Gln Gln Leu Leu Gly Val Leu Leu Asn Glu Ser Ser Val Gln
2180 2185 2190
His Thr Gln Gly Ala Gln Leu Ser Pro Gly Ala Leu Gln Ile Met
2195 2200 2205
Asp Asp Leu Leu Asn Ala Ile Pro Pro Asn Met Thr Ile Ser Arg
2210 2215 2220
<210> 15
<211> 101
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 15
ctagtccatt ttccattccc atgtgcagaa tgtgcgaaaa acgttgcacg tcctctcgat 60
ggcgtcgaaa atcgttgcac ggccgccacg cgaactctgc t 101
<210> 16
<211> 101
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 16
ctagagcaga gttcgcgtgg cggccgtgca acgattttcg acgccatcga gaggacgtgc 60
aacgtttttc gcacattctg cacatgggaa tggaaaatgg a 101
<210> 17
<211> 78
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 17
aataggggtt ccgcgcacat ttccccgaaa agtgccacct attaccctgt tatccctagg 60
tccttttcat cacgtgct 78
<210> 18
<211> 78
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 18
tatttttata ggttaatgtc atgataataa tggtttctta tagggataac agggtaatag 60
gacggatcgc ttgcctgt 78
<210> 19
<211> 72
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 19
tttgcgtcca tccaaaaaaa aagtaagaat ttttgaaagg ggatccaaca aaatggacaa 60
aatgagcgag ac 72
<210> 20
<211> 60
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 20
cggttagagc ggatgtggga ggagggcgtg aatgtaagct tctatgcact gttggttcca 60
<210> 21
<211> 40
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 21
cccccccggg aacaaaatgg cagcaccaga gacgggcaac 40
<210> 22
<211> 35
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 22
ccccgaattc ctcatcgcag cgtgctggtc agggt 35
<210> 23
<211> 73
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 23
tttgaaaatt cgaattcaac cctcactaaa gggcggccgc actagtaaaa acatgctgac 60
ggataccgca ttc 73
<210> 24
<211> 69
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 24
cttgattgga gacttgacca aacctctggc gaagaattgt taattaatta cctggatatc 60
gtcatgttg 69
<210> 25
<211> 43
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 25
caaagaaaat acgcagggcc cgcggcacgt gtgtgcatcc cat 43
<210> 26
<211> 49
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 26
ctagtcaaag aaaatacgca gggcccgcgg cacgtgtgtg catcccatt 49
<210> 27
<211> 49
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 27
ctagaatggg atgcacacac gtgccgcggg ccctgcgtat tttctttga 49
<210> 28
<211> 43
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 28
caaagaaaat acgcacacgc ggcggaggcc ttgtgcatcc cat 43
<210> 29
<211> 49
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 29
ctagtcaaag aaaatacgca cacgcggcgg aggccttgtg catcccatt 49
<210> 30
<211> 49
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 30
ctagaatggg atgcacaagg cctccgccgc gtgtgcgtat tttctttga 49
<210> 31
<211> 43
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 31
caaagaaaat acgcagggcc cgcggaggcc ttgtgcatcc cat 43
<210> 32
<211> 49
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 32
ctagtcaaag aaaatacgca gggcccgcgg aggccttgtg catcccatt 49
<210> 33
<211> 49
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 33
ctagaatggg atgcacaagg cctccgcggg ccctgcgtat tttctttga 49
<210> 34
<211> 22
<212> DNA
<213> Daphnia magna
<400> 34
gcacacgcgg cggcacgtgt gt 22
<210> 35
<211> 28
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 35
ctagtgcaca cgcggcggca cgtgtgtt 28
<210> 36
<211> 28
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 36
ctagaacaca cgtgccgccg cgtgtgca 28
<210> 37
<211> 36
<212> DNA
<213> Daphnia magna
<400> 37
aaaatacgca cacgcggcgg cacgtgtgtg catccc 36
<210> 38
<211> 42
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 38
ctagtaaaat acgcacacgc ggcggcacgt gtgtgcatcc ct 42
<210> 39
<211> 42
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 39
ctagagggat gcacacacgt gccgccgcgt gtgcgtattt ta 42
<210> 40
<211> 43
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 40
caaagaaaat actaccacgc ggcggcacgt gtgtgcatcc cat 43
<210> 41
<211> 49
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 41
ctagtcaaag aaaatactac cacgcggcgg cacgtgtgtg catcccatt 49
<210> 42
<211> 49
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 42
ctagaatggg atgcacacac gtgccgccgc gtggtagtat tttctttga 49
<210> 43
<211> 43
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 43
caaagaaaat acgcacacgc ggcggcacgt ggtggcatcc cat 43
<210> 44
<211> 49
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 44
ctagtcaaag aaaatacgca cacgcggcgg cacgtggtgg catcccatt 49
<210> 45
<211> 49
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 45
ctagaatggg atgccaccac gtgccgccgc gtgtgcgtat tttctttga 49
<210> 46
<211> 43
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 46
caaagaaaat actaccacgc ggcggcacgt ggtggcatcc cat 43
<210> 47
<211> 49
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 47
ctagtcaaag aaaatactac cacgcggcgg cacgtggtgg catcccatt 49
<210> 48
<211> 49
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 48
ctagaatggg atgccaccac gtgccgccgc gtggtagtat tttctttga 49
<210> 49
<211> 43
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 49
caaagaaaat acgcacacgc gtattcacgt gtgtgcatcc cat 43
<210> 50
<211> 49
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 50
ctagtcaaag aaaatacgca cacgcgtatt cacgtgtgtg catcccatt 49
<210> 51
<211> 49
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 51
ctagaatggg atgcacacac gtgaatacgc gtgtgcgtat tttctttga 49
<210> 52
<211> 43
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 52
caaagaaaat actaccacgc gtattcacgt ggtggcatcc cat 43
<210> 53
<211> 49
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 53
ctagtcaaag aaaatactac cacgcgtatt cacgtggtgg catcccatt 49
<210> 54
<211> 49
<212> DNA
<213> Artificial
<220>
<223> Synthetic DNA
<400> 54
ctagaatggg atgccaccac gtgaatacgc gtggtagtat tttctttga 49
Claims (30)
- 서열번호 1로 나타내는 염기서열을 포함하고, 전체 길이가 20개 내지 60개 염기길이를 가지는 핵산.
- 제1항에 있어서,
서열번호 1로 나타내는 염기서열에 포함되는 임의의 4개의 염기(nnnn)가 kmkk(단, k는 G 또는 T, m은 A 또는 C를 의미한다)인 것을 특징으로 하는
핵산.
- 제1항에 있어서,
서열번호 1로 나타내는 염기서열에 포함되는 임의의 4개의 염기(nnnn)가 GCGG 또는 TATT인 것을 특징으로 하는
핵산.
- 제1항 내지 제3항 중 어느 한 항에 있어서,
서열번호 1로 나타내는 염기서열의 3'-말단 및 5'-말단에 소정 길이의 염기서열을 가지는 것을 특징으로 하는
핵산.
- 제1항에 있어서,
서열번호 2, 5, 8, 34, 37, 40, 43, 46, 49 및 52로 구성되는 군으로부터 선택되는 1개의 염기서열로 구성된 것을 특징으로 하는
핵산.
- 제1항 내지 제5항 중 어느 한 항에 기재된 핵산을 포함하는 벡터.
- 제6항에 있어서,
상기 핵산을 1 단위로 하고 복수 단위의 상기 핵산이 연결되는 것을 특징으로 하는
벡터.
- 제6항에 있어서,
상기 핵산의 센스 사슬 3'-말단 측에 리포터 유전자를 포함하는 것을 특징으로 하는
벡터.
- 제1항 내지 제5항 중 어느 한 항에 기재된 핵산을 숙주에 도입한 형질전환체.
- 제9항에 있어서,
상기 핵산을 1 단위로 하고 복수 단위의 상기 핵산이 연결되는 것을 특징으로 하는
형질전환체.
- 제9항에 있어서,
상기 핵산의 센스 사슬 3'-말단 측에 리포터 유전자를 포함하는 것을 특징으로 하는
형질전환체.
- 제9항에 있어서,
상기 핵산에 대하여 상호작용하는 내분비 교란물질 수용체를 암호화하는 핵산이 도입되는 것을 특징으로 하는
형질전환체.
- 제12항에 있어서,
상기 내분비 교란물질 수용체는 절지동물의 유약 호르몬 수용체임을 특징으로 하는
형질전환체.
- 제13항에 있어서,
상기 절지동물의 유약 호르몬 수용체는 갑각류 또는 곤충류의 유약 호르몬 수용체임을 특징으로 하는
형질전환체.
- 제14항에 있어서,
상기 갑각류의 유약 호르몬 수용체는 물벼룩의 유약 호르몬 수용체임을 특징으로 하는
형질전환체.
- 제15항에 있어서,
상기 물벼룩의 유약 호르몬 수용체는 이하의 (a) 또는 (b)의 단백질인 것을 특징으로 하는 형질전환체:
(a) 서열번호 12로 나타내는 아미노산 서열로 구성된 단백질;
(b) 서열번호 12로 나타내는 아미노산 서열에 대해서 70% 이상의 동일성을 가지는 아미노산 서열로 구성되고, 유약 호르몬 수용체 전사인자 활성을 가지는 단백질.
- 제9항에 있어서,
전사 공역인자(transcription-coupling factor)를 암호화하는 핵산을 추가로 도입한 것을 특징으로 하는
형질전환체.
- 제9항에 있어서,
상기 숙주는 효모인 것을 특징으로 하는
형질전환체.
- 제1항 내지 제5항 중 어느 한항에 기재된 핵산과 상기 핵산의 센스 사슬 3'-말단 측에 리포터 유전자를 숙주에 도입하고, 상기 핵산에 상호 작용하는 내분비 교란물질 수용체를 발현하는 형질전환체에 시험물질을 접촉시키는 단계; 및,
상기 리포터 유전자의 발현을 측정하는 단계를 포함하고,
상기 리포터 유전자의 발현량에 근거하여 상기 시험물질과 상기 내분비 교란물질 수용체와의 상호작용을 평가하는 것을 특징으로 하는 시험물질의 평가방법.
- 제19항에 있어서,
상기 리포터 유전자의 발현량이 시험물질의 접촉 후 증가하는 경우, 상기 내분비 교란물질 수용체의 작용물질(agonist)로 판단하는 것을 특징으로 하는
평가방법.
- 제19항에 있어서,
상기 시험물질을 상기 내분비 교란물질 수용체에 상호작용하는 내분비 교란물질, 호르몬 및 내분비 교란물질 수용체의 작용물질(agonist)로 구성된 군으로부터 선정되는 적어도 하나의 물질과 함께 상기 형질전환체에 접촉시켜, 상기 리포터유전자의 발현량이 상기 물질을 단독으로 접촉시켰을 때와 비교하여 저하된 경우, 상기 시험물질을 상기 내분비 교란물 질수용체의 길항물질(antagonist)로 판단하는 것을 특징으로 하는
평가방법.
- 제19항에 있어서,
상기 핵산을 1 단위로 하고 복수 단위의 상기 핵산이 연결되는 것을 특징으로 하는
평가방법.
- 제19항에 있어서,
상기 형질전환체에 상기 내분비 교란물질 수용체를 암호화하는 핵산이 도입되는 것을 특징으로 하는
평가방법.
- 제19항에 있어서,
상기 내분비 교란물질 수용체는 절지동물의 유약 호르몬 수용체인 것을 특징으로 하는
평가방법.
- 제24항에 있어서,
상기 절지동물의 유약 호르몬 수용체는 갑각류 또는 곤충류의 유약 호르몬 수용체인 것을 특징으로 하는
평가방법.
- 제25항에 있어서,
상기 갑각류의 유약 호르몬 수용체는 물벼룩의 유약 호르몬 수용체인 것을 특징으로 하는
평가방법.
- 제26항에 있어서,
상기 물벼룩의 유약 호르몬 수용체는 이하의 (a) 또는 (b)의 단백질인 것을 특징으로 하는
평가방법:
(a) 서열번호 12로 나타내는 아미노산 서열로 구성된 단백질;
(b) 서열번호 12로 나타내는 아미노산 서열에 대해서 70% 이상의 동일성을 가지는 아미노산 서열로 구성되고, 유약 호르몬 수용체 전사인자 활성을 가지는 단백질.
- 제19항에 있어서,
상기 형질전환체에는 전사 공역인자를 암호화하는 핵산이 추가로 도입되는 것을 특징으로 하는
평가방법.
- 제19항에 있어서,
상기 숙주는 효모인 것을 특징으로 하는
평가방법.
- 제8항에 기재된 벡터 또는 제11항에 기재된 형질전환체를 포함하는 내분비 교란물질 측정용 키트.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020075196 | 2020-04-21 | ||
JPJP-P-2020-075196 | 2020-04-21 | ||
PCT/JP2021/016086 WO2021215451A1 (ja) | 2020-04-21 | 2021-04-20 | 内分泌攪乱物質受容体に相互作用する核酸及びその利用 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230002766A true KR20230002766A (ko) | 2023-01-05 |
Family
ID=78269152
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227039939A KR20230002766A (ko) | 2020-04-21 | 2021-04-20 | 내분비 교란물질 수용체에 상호작용하는 핵산 및 그의 이용 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20230250436A1 (ko) |
EP (1) | EP4141102A4 (ko) |
JP (1) | JPWO2021215451A1 (ko) |
KR (1) | KR20230002766A (ko) |
WO (1) | WO2021215451A1 (ko) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5754681B2 (ko) | 1977-12-23 | 1982-11-19 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002000272A (ja) * | 2000-06-21 | 2002-01-08 | Mitsubishi-Tokyo Pharmaceuticals Inc | ファージディスプレイ法で使用するための発現ベクター及びその利用 |
JP5754681B2 (ja) * | 2008-05-14 | 2015-07-29 | 国立研究開発法人農業生物資源研究所 | 幼若ホルモン応答エレメント |
JP2020039279A (ja) * | 2018-09-07 | 2020-03-19 | クミアイ化学工業株式会社 | 形質転換体及び当該形質転換体を用いた供試物質の評価方法 |
-
2021
- 2021-04-20 EP EP21792725.0A patent/EP4141102A4/en active Pending
- 2021-04-20 JP JP2022517061A patent/JPWO2021215451A1/ja active Pending
- 2021-04-20 KR KR1020227039939A patent/KR20230002766A/ko active Search and Examination
- 2021-04-20 US US17/920,250 patent/US20230250436A1/en active Pending
- 2021-04-20 WO PCT/JP2021/016086 patent/WO2021215451A1/ja unknown
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5754681B2 (ko) | 1977-12-23 | 1982-11-19 |
Non-Patent Citations (6)
Title |
---|
[비특허문헌 1] Qianyu He, et al., Heat Shock Protein 83 (Hsp83) Facilitates Methoprene-tools(Met) Nuclear Import to Modulate Juvenile Hormone Signaling Journal of Biological Chemistry.289, (2014) p.27874-27885. |
[비특허문헌 2] Norihisa Tatarazako, et al., Juvenile hormone agonists affect the occurrence of male Daphnia. Chemosphere.53, (2003) p.827-833. |
[비특허문헌 3] Kenji Toyota, et al., Methyl farnesoate synthesis is necessary for the environmental sex determination in the water flea Daphnia pulex. Journal of Insect Physiology.80, (2015) p.22-30 |
[비특허문헌 4] Helen Ying Wang, et al., The screening of chemicals for juvenoid-related endocrine activity using the water flea Daphnia magna, Aquatic Toxicology 74, (2005) p.193-204 |
[비특허문헌 5] Tomas A. Gorr, et al., Acandidate juvenoid hormone receptor cis-element in the Daphnia magna hb2 hemoglobingene promoter, Molecular and Cellular Endocrinology 247, (2006) p.91-102 |
[비특허문헌 6] Nur Syafiqah Mohamad Ishak, et al., Co-option of the bZIP transcription factor Vrille as the activator of Doublesex 1 in environmental sex determination of the crustacean Daphnia magna 13, (2017) e1006953. |
Also Published As
Publication number | Publication date |
---|---|
EP4141102A4 (en) | 2024-05-29 |
JPWO2021215451A1 (ko) | 2021-10-28 |
EP4141102A1 (en) | 2023-03-01 |
WO2021215451A1 (ja) | 2021-10-28 |
US20230250436A1 (en) | 2023-08-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Tobaben et al. | A trimeric protein complex functions as a synaptic chaperone machine | |
AU686685B2 (en) | Methods for screening for antimycotics | |
DE60029107T2 (de) | Luziferase expressionskassetten und methoden zu ihrer verwendung | |
US8563293B2 (en) | Bacteriocin based methods to control lactic acid bacterial growth | |
KR20230002766A (ko) | 내분비 교란물질 수용체에 상호작용하는 핵산 및 그의 이용 | |
JP2020039279A (ja) | 形質転換体及び当該形質転換体を用いた供試物質の評価方法 | |
JP2000516085A (ja) | 超気門(Ultraspiracle)阻害剤のためのスクリーン | |
WO2004070038A1 (de) | Mevalonat kinase als target für fungizide | |
WO1997045737A9 (en) | Screen for ultraspiracle inhibitors | |
Nuckolls et al. | S. pombe wtf genes use dual transcriptional regulation and selective protein exclusion from spores to cause meiotic drive | |
DE10061872A1 (de) | Hefestamm zur Prüfung der Geno- und Zytotoxizität komplexer Umweltkontaminationen | |
WO2005042734A1 (de) | An der autophagozytose beteiligte ser/thr-kinase als target für fungizide | |
EP1319715B1 (de) | IMP Dehydrogenase und deren Verwendung zum Identifizieren von fungizid wirksamen Verbindungen | |
Tremblay et al. | NAD‐dependent methylenetetrahydrofolate dehydrogenase‐methenyltetrahydrofolate cyclohydrolase is targeted to the cytoplasm in insect cell lines | |
DE10232773A1 (de) | Proteine des Ubiquitin Proteasom Stoffwechsels als Targets für Fungizide | |
WO2019163796A1 (ja) | 被験物質の標的遺伝子の同定方法 | |
WO2023172727A1 (en) | Cells derived from polypedilum vanderplanki and odor sensor equipped therewith | |
WO1998003676A1 (de) | Verfahren zum nachweis für effektoren intra- und/oder interzellulärer protein-protein-wechselwirkungen | |
CN113564169A (zh) | 一种日本鳗鲡抗菌肽Cathelicidin2基因启动子及其应用 | |
EP1098985A1 (de) | Gene der dead box proteinfamilie, deren expressionsprodukte und verwendung | |
Fang et al. | Identification of the proteins related to cytochrome P450 induced by fenvalerate in a Trichoplusia ni cell line | |
KR20210069015A (ko) | 크립토코커스 네오포만스의 독성을 조절하는 신규 유전자 및 이의 용도 | |
Elizur-Chandler | Molecular Biological Studies of the Topaz Gene Region from the Sheep Blowfly, Lucilia Cuprina | |
DE10222714B4 (de) | Kofaktoren, die spezifisch mit dem Glukokortikoidrezeptor interagieren sowie Verfahren zu deren Identifizierung | |
DE102004062196A1 (de) | Polynukleotide, kodierend für Insekten-Phosphatidylinositol-4-P-5-kinase und Verwendung davon |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination |