CN115023608B - 预测受试者患有糖尿病的可能性的标记物及其应用 - Google Patents
预测受试者患有糖尿病的可能性的标记物及其应用 Download PDFInfo
- Publication number
- CN115023608B CN115023608B CN202180010184.8A CN202180010184A CN115023608B CN 115023608 B CN115023608 B CN 115023608B CN 202180010184 A CN202180010184 A CN 202180010184A CN 115023608 B CN115023608 B CN 115023608B
- Authority
- CN
- China
- Prior art keywords
- subject
- predictive model
- marker
- model
- predictive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000003550 marker Substances 0.000 title claims abstract description 72
- 206010012601 diabetes mellitus Diseases 0.000 title abstract description 101
- HZAXFHJVJLSVMW-UHFFFAOYSA-N 2-Aminoethan-1-ol Chemical compound NCCO HZAXFHJVJLSVMW-UHFFFAOYSA-N 0.000 claims abstract description 124
- XOAAWQZATWQOTB-UHFFFAOYSA-N taurine Chemical compound NCCS(O)(=O)=O XOAAWQZATWQOTB-UHFFFAOYSA-N 0.000 claims abstract description 124
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 claims abstract description 81
- MPCAJMNYNOGXPB-SLPGGIOYSA-N 1,5-anhydro-D-glucitol Chemical compound OC[C@H]1OC[C@H](O)[C@@H](O)[C@@H]1O MPCAJMNYNOGXPB-SLPGGIOYSA-N 0.000 claims abstract description 71
- 229960003067 cystine Drugs 0.000 claims abstract description 62
- 229960003080 taurine Drugs 0.000 claims abstract description 62
- 229940031098 ethanolamine Drugs 0.000 claims abstract description 61
- YDGMGEXADBMOMJ-LURJTMIESA-N N(g)-dimethylarginine Chemical compound CN(C)C(\N)=N\CCC[C@H](N)C(O)=O YDGMGEXADBMOMJ-LURJTMIESA-N 0.000 claims abstract description 52
- CKLJMWTZIZZHCS-UHFFFAOYSA-N D-OH-Asp Natural products OC(=O)C(N)CC(O)=O CKLJMWTZIZZHCS-UHFFFAOYSA-N 0.000 claims abstract description 42
- CKLJMWTZIZZHCS-UWTATZPHSA-N L-Aspartic acid Natural products OC(=O)[C@H](N)CC(O)=O CKLJMWTZIZZHCS-UWTATZPHSA-N 0.000 claims abstract description 42
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims abstract description 42
- 229960005261 aspartic acid Drugs 0.000 claims abstract description 42
- LCWXJXMHJVIJFK-UHFFFAOYSA-N Hydroxylysine Natural products NCC(O)CC(N)CC(O)=O LCWXJXMHJVIJFK-UHFFFAOYSA-N 0.000 claims abstract description 41
- YSMODUONRAFBET-UHFFFAOYSA-N delta-DL-hydroxylysine Natural products NCC(O)CCC(N)C(O)=O YSMODUONRAFBET-UHFFFAOYSA-N 0.000 claims abstract description 41
- YSMODUONRAFBET-UHNVWZDZSA-N erythro-5-hydroxy-L-lysine Chemical compound NC[C@H](O)CC[C@H](N)C(O)=O YSMODUONRAFBET-UHNVWZDZSA-N 0.000 claims abstract description 41
- QJHBJHUKURJDLG-UHFFFAOYSA-N hydroxy-L-lysine Natural products NCCCCC(NO)C(O)=O QJHBJHUKURJDLG-UHFFFAOYSA-N 0.000 claims abstract description 41
- 229960003136 leucine Drugs 0.000 claims abstract description 41
- 239000004395 L-leucine Substances 0.000 claims abstract description 40
- 235000019454 L-leucine Nutrition 0.000 claims abstract description 40
- IFGCUJZIWBUILZ-UHFFFAOYSA-N sodium 2-[[2-[[hydroxy-(3,4,5-trihydroxy-6-methyloxan-2-yl)oxyphosphoryl]amino]-4-methylpentanoyl]amino]-3-(1H-indol-3-yl)propanoic acid Chemical compound [Na+].C=1NC2=CC=CC=C2C=1CC(C(O)=O)NC(=O)C(CC(C)C)NP(O)(=O)OC1OC(C)C(O)C(O)C1O IFGCUJZIWBUILZ-UHFFFAOYSA-N 0.000 claims abstract description 39
- AFENDNXGAFYKQO-UHFFFAOYSA-N 2-hydroxybutyric acid Chemical compound CCC(O)C(O)=O AFENDNXGAFYKQO-UHFFFAOYSA-N 0.000 claims abstract description 10
- LEVWYRKDKASIDU-QWWZWVQMSA-N D-cystine Chemical compound OC(=O)[C@H](N)CSSC[C@@H](N)C(O)=O LEVWYRKDKASIDU-QWWZWVQMSA-N 0.000 claims abstract 11
- 230000035945 sensitivity Effects 0.000 claims description 77
- 208000004104 gestational diabetes Diseases 0.000 claims description 61
- 238000010200 validation analysis Methods 0.000 claims description 28
- 238000012549 training Methods 0.000 claims description 26
- 239000000203 mixture Substances 0.000 claims description 8
- 239000003153 chemical reaction reagent Substances 0.000 claims description 7
- 238000004519 manufacturing process Methods 0.000 claims description 3
- YDGMGEXADBMOMJ-UHFFFAOYSA-N asymmetrical dimethylarginine Natural products CN(C)C(N)=NCCCC(N)C(O)=O YDGMGEXADBMOMJ-UHFFFAOYSA-N 0.000 abstract description 44
- 239000003795 chemical substances by application Substances 0.000 abstract description 3
- LEVWYRKDKASIDU-IMJSIDKUSA-N L-cystine Chemical compound [O-]C(=O)[C@@H]([NH3+])CSSC[C@H]([NH3+])C([O-])=O LEVWYRKDKASIDU-IMJSIDKUSA-N 0.000 description 51
- 238000013103 analytical ultracentrifugation Methods 0.000 description 50
- 238000000034 method Methods 0.000 description 37
- 230000000875 corresponding effect Effects 0.000 description 24
- 238000007410 oral glucose tolerance test Methods 0.000 description 20
- 239000002207 metabolite Substances 0.000 description 18
- 239000000126 substance Substances 0.000 description 17
- 210000002381 plasma Anatomy 0.000 description 16
- 230000035935 pregnancy Effects 0.000 description 16
- 150000002500 ions Chemical class 0.000 description 13
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 12
- WRIDQFICGBMAFQ-UHFFFAOYSA-N (E)-8-Octadecenoic acid Natural products CCCCCCCCCC=CCCCCCCC(O)=O WRIDQFICGBMAFQ-UHFFFAOYSA-N 0.000 description 11
- LQJBNNIYVWPHFW-UHFFFAOYSA-N 20:1omega9c fatty acid Natural products CCCCCCCCCCC=CCCCCCCCC(O)=O LQJBNNIYVWPHFW-UHFFFAOYSA-N 0.000 description 11
- QSBYPNXLFMSGKH-UHFFFAOYSA-N 9-Heptadecensaeure Natural products CCCCCCCC=CCCCCCCCC(O)=O QSBYPNXLFMSGKH-UHFFFAOYSA-N 0.000 description 11
- ZQPPMHVWECSIRJ-UHFFFAOYSA-N Oleic acid Natural products CCCCCCCCC=CCCCCCCCC(O)=O ZQPPMHVWECSIRJ-UHFFFAOYSA-N 0.000 description 11
- 239000005642 Oleic acid Substances 0.000 description 11
- 238000001514 detection method Methods 0.000 description 11
- QXJSBBXBKPUZAA-UHFFFAOYSA-N isooleic acid Natural products CCCCCCCC=CCCCCCCCCC(O)=O QXJSBBXBKPUZAA-UHFFFAOYSA-N 0.000 description 11
- ZQPPMHVWECSIRJ-KTKRTIGZSA-N oleic acid Chemical compound CCCCCCCC\C=C/CCCCCCCC(O)=O ZQPPMHVWECSIRJ-KTKRTIGZSA-N 0.000 description 11
- 238000012216 screening Methods 0.000 description 11
- UYPYRKYUKCHHIB-UHFFFAOYSA-N trimethylamine N-oxide Chemical compound C[N+](C)(C)[O-] UYPYRKYUKCHHIB-UHFFFAOYSA-N 0.000 description 11
- HVPFXCBJHIIJGS-LURJTMIESA-N N(omega),N'(omega)-dimethyl-L-arginine Chemical compound CN\C(=N/C)NCCC[C@H](N)C(O)=O HVPFXCBJHIIJGS-LURJTMIESA-N 0.000 description 10
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 9
- 238000012795 verification Methods 0.000 description 9
- -1 alpha-HB) Chemical compound 0.000 description 8
- 229940093740 amino acid and derivative Drugs 0.000 description 8
- 238000004803 parallel plate viscometry Methods 0.000 description 8
- 229920000553 poly(phenylenevinylene) Polymers 0.000 description 8
- 238000007477 logistic regression Methods 0.000 description 7
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 6
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 6
- 239000003814 drug Substances 0.000 description 6
- 238000010828 elution Methods 0.000 description 6
- 235000019253 formic acid Nutrition 0.000 description 6
- 239000008103 glucose Substances 0.000 description 6
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 6
- 238000004949 mass spectrometry Methods 0.000 description 6
- 229940079593 drug Drugs 0.000 description 5
- 238000001819 mass spectrum Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012544 monitoring process Methods 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 229940122199 Insulin secretagogue Drugs 0.000 description 4
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 4
- 238000000585 Mann–Whitney U test Methods 0.000 description 4
- 229940024606 amino acid Drugs 0.000 description 4
- 235000001014 amino acid Nutrition 0.000 description 4
- 150000001413 amino acids Chemical class 0.000 description 4
- 238000002290 gas chromatography-mass spectrometry Methods 0.000 description 4
- 238000004128 high performance liquid chromatography Methods 0.000 description 4
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 4
- 238000001840 matrix-assisted laser desorption--ionisation time-of-flight mass spectrometry Methods 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 239000000047 product Substances 0.000 description 4
- 238000012706 support-vector machine Methods 0.000 description 4
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 3
- 230000002411 adverse Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000011088 calibration curve Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000004807 desolvation Methods 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 238000000132 electrospray ionisation Methods 0.000 description 3
- 239000004047 hole gas Substances 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000002347 injection Methods 0.000 description 3
- 239000007924 injection Substances 0.000 description 3
- 238000012417 linear regression Methods 0.000 description 3
- 230000004060 metabolic process Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000005507 spraying Methods 0.000 description 3
- 238000010998 test method Methods 0.000 description 3
- 238000004704 ultra performance liquid chromatography Methods 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- NWGZOALPWZDXNG-LURJTMIESA-N (2s)-5-(diaminomethylideneamino)-2-(dimethylamino)pentanoic acid Chemical compound CN(C)[C@H](C(O)=O)CCCNC(N)=N NWGZOALPWZDXNG-LURJTMIESA-N 0.000 description 2
- QDGAVODICPCDMU-UHFFFAOYSA-N 2-amino-3-[3-[bis(2-chloroethyl)amino]phenyl]propanoic acid Chemical compound OC(=O)C(N)CC1=CC=CC(N(CCCl)CCCl)=C1 QDGAVODICPCDMU-UHFFFAOYSA-N 0.000 description 2
- 206010000060 Abdominal distension Diseases 0.000 description 2
- 206010067484 Adverse reaction Diseases 0.000 description 2
- 229940123208 Biguanide Drugs 0.000 description 2
- QNAYBMKLOCPYGJ-UHFFFAOYSA-N D-alpha-Ala Natural products CC([NH3+])C([O-])=O QNAYBMKLOCPYGJ-UHFFFAOYSA-N 0.000 description 2
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 2
- 206010019233 Headaches Diseases 0.000 description 2
- 102000004877 Insulin Human genes 0.000 description 2
- 108090001061 Insulin Proteins 0.000 description 2
- 206010022489 Insulin Resistance Diseases 0.000 description 2
- QNAYBMKLOCPYGJ-UWTATZPHSA-N L-Alanine Natural products C[C@@H](N)C(O)=O QNAYBMKLOCPYGJ-UWTATZPHSA-N 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- 229930182844 L-isoleucine Natural products 0.000 description 2
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 2
- 206010028813 Nausea Diseases 0.000 description 2
- 238000000692 Student's t-test Methods 0.000 description 2
- 229940100389 Sulfonylurea Drugs 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 2
- 206010047700 Vomiting Diseases 0.000 description 2
- 230000006838 adverse reaction Effects 0.000 description 2
- 229960003767 alanine Drugs 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 150000004283 biguanides Chemical class 0.000 description 2
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000006911 enzymatic reaction Methods 0.000 description 2
- 210000003754 fetus Anatomy 0.000 description 2
- 229960004580 glibenclamide Drugs 0.000 description 2
- 150000002303 glucose derivatives Chemical class 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- ZNNLBTZKUZBEKO-UHFFFAOYSA-N glyburide Chemical compound COC1=CC=C(Cl)C=C1C(=O)NCCC1=CC=C(S(=O)(=O)NC(=O)NC2CCCCC2)C=C1 ZNNLBTZKUZBEKO-UHFFFAOYSA-N 0.000 description 2
- 231100000869 headache Toxicity 0.000 description 2
- 239000012535 impurity Substances 0.000 description 2
- 229940125396 insulin Drugs 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 229960003646 lysine Drugs 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000002503 metabolic effect Effects 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 229960004452 methionine Drugs 0.000 description 2
- 230000008693 nausea Effects 0.000 description 2
- BNYHRGTXRPWASY-UHFFFAOYSA-N nonylsulfonylurea Chemical compound CCCCCCCCCS(=O)(=O)NC(N)=O BNYHRGTXRPWASY-UHFFFAOYSA-N 0.000 description 2
- 150000007524 organic acids Chemical class 0.000 description 2
- 150000002894 organic compounds Chemical class 0.000 description 2
- HYAFETHFCAUJAY-UHFFFAOYSA-N pioglitazone Chemical compound N1=CC(CC)=CC=C1CCOC(C=C1)=CC=C1CC1C(=O)NC(=O)S1 HYAFETHFCAUJAY-UHFFFAOYSA-N 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- YROXIXLRRCOBKF-UHFFFAOYSA-N sulfonylurea Chemical class OC(=N)N=S(=O)=O YROXIXLRRCOBKF-UHFFFAOYSA-N 0.000 description 2
- 229960002898 threonine Drugs 0.000 description 2
- 229960004799 tryptophan Drugs 0.000 description 2
- 208000001072 type 2 diabetes mellitus Diseases 0.000 description 2
- 230000008673 vomiting Effects 0.000 description 2
- XUFXOAAUWZOOIT-SXARVLRPSA-N (2R,3R,4R,5S,6R)-5-[[(2R,3R,4R,5S,6R)-5-[[(2R,3R,4S,5S,6R)-3,4-dihydroxy-6-methyl-5-[[(1S,4R,5S,6S)-4,5,6-trihydroxy-3-(hydroxymethyl)-1-cyclohex-2-enyl]amino]-2-oxanyl]oxy]-3,4-dihydroxy-6-(hydroxymethyl)-2-oxanyl]oxy]-6-(hydroxymethyl)oxane-2,3,4-triol Chemical compound O([C@H]1O[C@H](CO)[C@H]([C@@H]([C@H]1O)O)O[C@H]1O[C@@H]([C@H]([C@H](O)[C@H]1O)N[C@@H]1[C@@H]([C@@H](O)[C@H](O)C(CO)=C1)O)C)[C@@H]1[C@@H](CO)O[C@@H](O)[C@H](O)[C@H]1O XUFXOAAUWZOOIT-SXARVLRPSA-N 0.000 description 1
- BOVGTQGAOIONJV-BETUJISGSA-N 1-[(3ar,6as)-3,3a,4,5,6,6a-hexahydro-1h-cyclopenta[c]pyrrol-2-yl]-3-(4-methylphenyl)sulfonylurea Chemical compound C1=CC(C)=CC=C1S(=O)(=O)NC(=O)NN1C[C@H]2CCC[C@H]2C1 BOVGTQGAOIONJV-BETUJISGSA-N 0.000 description 1
- LLJFMFZYVVLQKT-UHFFFAOYSA-N 1-cyclohexyl-3-[4-[2-(7-methoxy-4,4-dimethyl-1,3-dioxo-2-isoquinolinyl)ethyl]phenyl]sulfonylurea Chemical compound C=1C(OC)=CC=C(C(C2=O)(C)C)C=1C(=O)N2CCC(C=C1)=CC=C1S(=O)(=O)NC(=O)NC1CCCCC1 LLJFMFZYVVLQKT-UHFFFAOYSA-N 0.000 description 1
- 229940077274 Alpha glucosidase inhibitor Drugs 0.000 description 1
- 208000024172 Cardiovascular disease Diseases 0.000 description 1
- 206010070538 Gestational hypertension Diseases 0.000 description 1
- FAEKWTJYAYMJKF-QHCPKHFHSA-N GlucoNorm Chemical compound C1=C(C(O)=O)C(OCC)=CC(CC(=O)N[C@@H](CC(C)C)C=2C(=CC=CC=2)N2CCCCC2)=C1 FAEKWTJYAYMJKF-QHCPKHFHSA-N 0.000 description 1
- 102000017011 Glycated Hemoglobin A Human genes 0.000 description 1
- 108010014663 Glycated Hemoglobin A Proteins 0.000 description 1
- VPNYRYCIDCJBOM-UHFFFAOYSA-M Glycopyrronium bromide Chemical compound [Br-].C1[N+](C)(C)CCC1OC(=O)C(O)(C=1C=CC=CC=1)C1CCCC1 VPNYRYCIDCJBOM-UHFFFAOYSA-M 0.000 description 1
- 108010023302 HDL Cholesterol Proteins 0.000 description 1
- 201000005624 HELLP Syndrome Diseases 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- RHGKLRLOHDJJDR-BYPYZUCNSA-N L-citrulline Chemical compound NC(=O)NCCC[C@H]([NH3+])C([O-])=O RHGKLRLOHDJJDR-BYPYZUCNSA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- 229930182821 L-proline Natural products 0.000 description 1
- 108010028554 LDL Cholesterol Proteins 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 208000001145 Metabolic Syndrome Diseases 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- RHGKLRLOHDJJDR-UHFFFAOYSA-N Ndelta-carbamoyl-DL-ornithine Natural products OC(=O)C(N)CCCNC(N)=O RHGKLRLOHDJJDR-UHFFFAOYSA-N 0.000 description 1
- 208000031662 Noncommunicable disease Diseases 0.000 description 1
- 208000008589 Obesity Diseases 0.000 description 1
- 208000002193 Pain Diseases 0.000 description 1
- 241000702619 Porcine parvovirus Species 0.000 description 1
- 208000005347 Pregnancy-Induced Hypertension Diseases 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 206010040613 Shoulder Dystocia Diseases 0.000 description 1
- 229940123464 Thiazolidinedione Drugs 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 238000001772 Wald test Methods 0.000 description 1
- 201000000690 abdominal obesity-metabolic syndrome Diseases 0.000 description 1
- 229960002632 acarbose Drugs 0.000 description 1
- XUFXOAAUWZOOIT-UHFFFAOYSA-N acarviostatin I01 Natural products OC1C(O)C(NC2C(C(O)C(O)C(CO)=C2)O)C(C)OC1OC(C(C1O)O)C(CO)OC1OC1C(CO)OC(O)C(O)C1O XUFXOAAUWZOOIT-UHFFFAOYSA-N 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 239000003888 alpha glucosidase inhibitor Substances 0.000 description 1
- 230000036772 blood pressure Effects 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 235000012000 cholesterol Nutrition 0.000 description 1
- 229960002173 citrulline Drugs 0.000 description 1
- 235000013477 citrulline Nutrition 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001212 derivatisation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000035487 diastolic blood pressure Effects 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 230000035622 drinking Effects 0.000 description 1
- 230000001610 euglycemic effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 229960000346 gliclazide Drugs 0.000 description 1
- 229960004346 glimepiride Drugs 0.000 description 1
- WIGIZIANZCJQQY-RUCARUNLSA-N glimepiride Chemical compound O=C1C(CC)=C(C)CN1C(=O)NCCC1=CC=C(S(=O)(=O)NC(=O)N[C@@H]2CC[C@@H](C)CC2)C=C1 WIGIZIANZCJQQY-RUCARUNLSA-N 0.000 description 1
- 229960001381 glipizide Drugs 0.000 description 1
- ZJJXGWJIGJFDTL-UHFFFAOYSA-N glipizide Chemical compound C1=NC(C)=CN=C1C(=O)NCCC1=CC=C(S(=O)(=O)NC(=O)NC2CCCCC2)C=C1 ZJJXGWJIGJFDTL-UHFFFAOYSA-N 0.000 description 1
- 229960003468 gliquidone Drugs 0.000 description 1
- 238000007446 glucose tolerance test Methods 0.000 description 1
- 229960002989 glutamic acid Drugs 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 229960002743 glutamine Drugs 0.000 description 1
- 150000002327 glycerophospholipids Chemical class 0.000 description 1
- 229960004956 glycerylphosphorylcholine Drugs 0.000 description 1
- 229940015042 glycopyrrolate Drugs 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000002649 immunization Methods 0.000 description 1
- 230000003053 immunization Effects 0.000 description 1
- 230000000968 intestinal effect Effects 0.000 description 1
- 210000004153 islets of langerhan Anatomy 0.000 description 1
- 238000001294 liquid chromatography-tandem mass spectrometry Methods 0.000 description 1
- XZWYZXLIPXDOLR-UHFFFAOYSA-N metformin Chemical compound CN(C)C(=N)NC(N)=N XZWYZXLIPXDOLR-UHFFFAOYSA-N 0.000 description 1
- 229960003105 metformin Drugs 0.000 description 1
- 230000007269 microbial metabolism Effects 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- OELFLUMRDSZNSF-BRWVUGGUSA-N nateglinide Chemical compound C1C[C@@H](C(C)C)CC[C@@H]1C(=O)N[C@@H](C(O)=O)CC1=CC=CC=C1 OELFLUMRDSZNSF-BRWVUGGUSA-N 0.000 description 1
- 229960000698 nateglinide Drugs 0.000 description 1
- 235000020925 non fasting Nutrition 0.000 description 1
- 238000001807 normal pulse voltammetry Methods 0.000 description 1
- 235000020824 obesity Nutrition 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 229960005095 pioglitazone Drugs 0.000 description 1
- 201000011461 pre-eclampsia Diseases 0.000 description 1
- 208000036335 preeclampsia/eclampsia 1 Diseases 0.000 description 1
- 229960002429 proline Drugs 0.000 description 1
- 230000006920 protein precipitation Effects 0.000 description 1
- 229960002354 repaglinide Drugs 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- SUFUKZSWUHZXAV-BTJKTKAUSA-N rosiglitazone maleate Chemical compound [H+].[H+].[O-]C(=O)\C=C/C([O-])=O.C=1C=CC=NC=1N(C)CCOC(C=C1)=CC=C1CC1SC(=O)NC1=O SUFUKZSWUHZXAV-BTJKTKAUSA-N 0.000 description 1
- 229960003271 rosiglitazone maleate Drugs 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 238000000551 statistical hypothesis test Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000000528 statistical test Methods 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 239000007939 sustained release tablet Substances 0.000 description 1
- 230000035488 systolic blood pressure Effects 0.000 description 1
- 238000012353 t test Methods 0.000 description 1
- 239000013076 target substance Substances 0.000 description 1
- 150000001467 thiazolidinediones Chemical class 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- UFTFJSFQGQCHQW-UHFFFAOYSA-N triformin Chemical compound O=COCC(OC=O)COC=O UFTFJSFQGQCHQW-UHFFFAOYSA-N 0.000 description 1
- 229960004441 tyrosine Drugs 0.000 description 1
- 238000001195 ultra high performance liquid chromatography Methods 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 229960004295 valine Drugs 0.000 description 1
- 230000036266 weeks of gestation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6803—General methods of protein analysis not limited to specific proteins or families of proteins
- G01N33/6806—Determination of free amino acids
- G01N33/6812—Assays for specific amino acids
- G01N33/6815—Assays for specific amino acids containing sulfur, e.g. cysteine, cystine, methionine, homocysteine
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/04—Preparation or injection of sample to be analysed
- G01N30/06—Preparation
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/86—Signal analysis
- G01N30/8675—Evaluation, i.e. decoding of the signal into analytical information
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/88—Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2800/00—Detection or diagnosis of diseases
- G01N2800/04—Endocrine or metabolic disorders
- G01N2800/042—Disorders of carbohydrate metabolism, e.g. diabetes, glucose metabolism
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2800/00—Detection or diagnosis of diseases
- G01N2800/50—Determining the risk of developing a disease
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Chemical & Material Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Molecular Biology (AREA)
- Physics & Mathematics (AREA)
- Hematology (AREA)
- Urology & Nephrology (AREA)
- General Physics & Mathematics (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- Cell Biology (AREA)
- Food Science & Technology (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biophysics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Library & Information Science (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本申请提供了预测受试者患有糖尿病的可能性的标记物及其应用。所述标记物可以包括α‑羟基丁酸(α‑HB)、1,5‑脱水葡萄糖醇(1,5‑AG)、非对称性二甲基精氨酸(ADMA)、胱氨酸、乙醇胺、牛磺酸、L‑亮氨酸、L‑色氨酸、羟赖氨酸、L‑天冬氨酸中的至少一种。可以基于所述标志物的浓度,使用与所述标记物相关的预测模型(例如,预测模型2‑5)预测所述受试者患有糖尿病的可能性。所述预测模型2与α‑HB有关。所述预测模型3与1,5‑AG和ADMA有关。所述预测模型4与胱氨酸、乙醇胺、牛磺酸、L‑亮氨酸、L‑色氨酸和羟赖氨酸有关。所述预测模型5与α‑HB、1,5‑AG、胱氨酸、乙醇胺、牛磺酸和L‑天冬氨酸有关。
Description
技术领域
本申请涉及糖尿病检测领域,特别涉及一种预测受试者患有糖尿病的可能性的标记物及其应用。
背景技术
糖尿病是世界四大非传染性疾病之一,近年来患病人数逐渐增多。目前,对于妊娠期糖尿病,口服葡萄糖耐量试验(Oral glucose tolerance test,OGTT)是早起筛查是否患有糖尿病的主要方法,但该方法存在一些缺点。例如,进行OGTT需要至少8小时的隔夜禁食和5分钟内饮用含有75克葡萄糖的液体,但一些人(例如,孕妇)不能轻易应用隔夜禁食,对葡萄糖饮料难以耐受,可能会引起不良反应,包括恶心、呕吐、腹胀和头痛。此外,检测结果为正常的人也不得不进行OGTT,但是并没有获得任何临床益处。因此,鉴于目前筛选方法的缺陷,亟需一种更客观、更方便且无不良反应的糖尿病检测方法。
发明内容
根据本申请的一方面,提供标记物在制备用于预测受试者患有糖尿病的可能性的试剂、组合物或试剂盒中的应用。所述预测可以包括:基于来自所述受试者的样品,确定所述标记物的浓度,其中,所述标记物包括α-羟基丁酸(α-hydroxybutyric acid,α-HB)、1,5-脱水葡萄糖醇(1,5-Anhydroglucitol,1,5-AG)、非对称性二甲基精氨酸(Asymmetricdimethylarginine,ADMA)、胱氨酸、乙醇胺、牛磺酸、L-亮氨酸、L-色氨酸、羟赖氨酸、L-天冬氨酸中的至少一种;以及基于所述标记物的浓度,使用与所述标记物相关的预测模型预测所述受试者患有糖尿病的可能性。
在一些实施例中,所述糖尿病可以包括一型糖尿病、二型糖尿病或妊娠期糖尿病(gestational diabetes mellitus,GDM)。
在一些实施例中,所述标记物可以包括α-HB。
在一些实施例中,所述标记物可以包括1,5-AG和ADMA。
在一些实施例中,所述标记物可以包括胱氨酸、乙醇胺、牛磺酸、L-亮氨酸、L-色氨酸和羟赖氨酸。
在一些实施例中,所述标记物可以包括α-HB、1,5-AG、胱氨酸、乙醇胺、牛磺酸和L-天冬氨酸。
在一些实施例中,基于所述标记物的浓度,使用与所述标记物相关的预测模型预测所述受试者患有糖尿病的可能性可以包括:所述标记物的浓度作为所述预测模型的输入,所述预测模型输出预测值;以及通过比较所述预测值和阈值,预测所述受试者患有糖尿病的可能性。
在一些实施例中,通过比较所述预测值和阈值预测所述受试者患有糖尿病的可能性可以包括:若所述预测值大于或等于所述阈值,预测所述受试者患有糖尿病的可能性较高;或若所述预测值小于所述阈值,预测所述受试者患有糖尿病的可能性较低。
在一些实施例中,所述预测模型还可以与所述受试者的年龄和BMI相关。
在一些实施例中,所述预测模型由公式
表示,其中,p表示所述受试者为糖尿病的概率值,表示对数优势比,α-HB表示α-HB的浓度,单位为μmol/L。
在一些实施例中,所述预测模型由公式
表示,其中,p表示所述受试者为糖尿病的概率值,表示对数优势比,1,5-AG和ADMA分别表示1,5-AG和ADMA的浓度,单位为μmol/L。
在一些实施例中,所述预测模型由公式
表示,其中,p表示所述受试者为糖尿病的概率值,表示对数优势比,胱氨酸、乙醇胺、L-亮氨酸、L-色氨酸、羟赖氨酸和牛磺酸分别表示胱氨酸、乙醇胺、L-亮氨酸、L-色氨酸、羟赖氨酸和牛磺酸的浓度,单位为μmol/L。
在一些实施例中,所述预测模型由公式
表示,其中,p表示所述受试者为糖尿病的概率值,表示对数优势比,1,5-AG、α-HB、牛磺酸、L-天冬氨酸、胱氨酸和乙醇胺分别表示1,5-AG、α-HB、牛磺酸、L-天冬氨酸、胱氨酸和乙醇胺的浓度,单位为μmol/L。
在一些实施例中,所述预测模型在验证集中AUC值均大于0.7,在验证集中的敏感度和特异度均大于65%。
根据本申请的另一方面,还提供了用于预测受试者患有糖尿病的可能性的标记物,其特征在于,所述标记物包括α-HB、1,5-AG、ADMA、胱氨酸、乙醇胺、牛磺酸、L-亮氨酸、L-色氨酸、羟赖氨酸、L-天冬氨酸中的至少一个。
根据本申请的再一方面,还提供了预测模型在制备用于预测受试者患有糖尿病的可能性的试剂、组合物或试剂盒中的应用。所述预测模型与预测受试者患有糖尿病的可能性的标记物相关,其中,所述标记物包括α-HB、1,5-AG、ADMA、胱氨酸、乙醇胺、牛磺酸、L-亮氨酸、L-色氨酸、羟赖氨酸、L-天冬氨酸中的至少一个;所述预测模型的输入为所述标记物的浓度,所述预测模型的输出为预测值,将所述预测值与阈值比较,预测所述受试者患有糖尿病的可能性。
根据本申请的再一方面,提供了一种用于治疗糖尿病的方法。所述方法可以包括:基于来自受试者的样品,确定标记物的浓度,其中,所述标记物包括α-HB、1,5-AG、ADMA、胱氨酸、乙醇胺、牛磺酸、L-亮氨酸、L-色氨酸、羟赖氨酸、L-天冬氨酸中的至少一种;基于所述标记物的浓度,使用与所述标记物相关的预测模型预测所述受试者患有糖尿病的可能性;以及若预测结果为所述受试者患有糖尿病,对所述受试者施用治疗糖尿病的药物。
根据本申请的再一方面,提供了一种用于预测受试者患有糖尿病的可能性的***。所述***可以包括获取模块,用于获取受试者样品的标记物的浓度,其中,所述标记物包括α-HB、1,5-AG、ADMA、胱氨酸、乙醇胺、牛磺酸、L-亮氨酸、L-色氨酸、羟赖氨酸、L-天冬氨酸中的至少一种;训练模块,用于利用训练集训练初始模型获得预测模型,所述预测模型与所述标记物相关;以及预测模块,用于基于所述标记物的浓度,使用预测模型预测所述受试者患有糖尿病的可能性。
附图说明
本说明书将以示例性实施例的方式进一步说明,这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的,在这些实施例中,相同的编号表示相同的结构,其中:
图1A和图1B分别是根据本申请一些实施例所示的25种氨基酸及其衍生物的标准品和血浆样品中25种氨基酸及其衍生物的总离子流色谱图;
图2A和图2B分别是根据本申请一些实施例所示的1,5-AG、TMAO、ADMA和SDMA的标准品总离子流色谱图和血浆样本中1,5-AG、TMAO、ADMA和SDMA的总离子流色谱图;
图3A和图3B分别是根据本申请一些实施例所示的α-HB、OA和LGPC的标准品总离子流色谱图和血浆中α-HB、OA和LGPC的总离子流色谱图;
图4A到图4L是根据本申请一些实施例所示的5个预测模型的全部变量与GDM显著关系的分布图,其中,黑色表示GDM,白色表示非GDM;
图5A到图5J是根据本申请一些实施例所示的5个预测模型在训练集和验证集中的ROC曲线图。
具体实施方式
为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将本申请应用于其它类似情景。除非从语言环境中显而易见或另做说明,图中相同标号代表相同结构或操作。
应当理解,尽管术语“第一”、“第二”、“第三”等可以在本文中用于描述各种元素,但这些元素不应受这些术语的限制。这些术语仅用于将一个元素与另一个元素区分开来。例如,第一产物可以被称为第二产物,并且类似地,在不脱离本申请的示例性实施例的范围的情况下,第二产物可以被称为第一产物。
如本申请和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。
本申请中使用了流程图用来说明根据本申请的实施例的***所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
本申请提供了用于预测受试者患有糖尿病的可能性的标记物,还提供了标记物在制备用于预测受试者患有糖尿病的可能性的试剂、组合物或试剂盒中的应用,还提供了预测模型在制备用于预测受试者患有糖尿病的可能性的试剂、组合物或试剂盒中的应用,还提供了一种用于治疗糖尿病的方法,还提供了一种用于预测受试者患有糖尿病的可能性的***。在本申请中,标记物可以包括α-HB、1,5-AG、ADMA、胱氨酸、乙醇胺、牛磺酸、L-亮氨酸、L-色氨酸、羟赖氨酸、L-天冬氨酸中的至少一个。标记物可以应用到预测模型中,以预测受试者患有糖尿病的可能性。这里的糖尿病包括一型糖尿病、二型糖尿病或GDM。在一些实施例中,糖尿病为GDM。GDM被定义为在妊娠期间首次诊断出的葡萄糖耐量障碍。患有GDM的母亲患妊娠高血压和先兆子痫的风险更高,GDM母亲的胎儿可能出生体重增加(例如巨大儿),因此增加肩难产的风险,而肩难产是分娩的严重不良结果。此外,GDM会促进代谢并发症的发展,包括肥胖、代谢综合征、二型糖尿病(T2DM)和母亲及后代晚年的心血管疾病。因此,GDM在全球范围内给孕妇、胎儿和社会增加了极大的负担。
根据2014年中国GDM指南,基于IADPSG标准和国际糖尿病联合会,建议所有妊娠24~28周的孕妇进行“一步”2小时75g口服葡萄糖耐量试验(OGTT)。但是OGTT存在一些缺点,首先是OGTT的程序,包括至少8小时的隔夜禁食和5分钟内饮用含有75克葡萄糖的液体,很多孕妇不能轻易应用隔夜禁食,而且一些孕妇对葡萄糖饮料难以耐受,可能会引起不良反应,包括恶心、呕吐、腹胀和头痛;此外,一项基于3098名中国孕妇的研究发现,75.8%的血糖正常的妇女不得不接受OGTT,但是并没有获得任何临床益处,因此,“一步法”OGTT并未被统一采用。美国通常使用两步测试,先进行非空腹50克筛查,然后对筛查呈阳性的人进行100克OGTT,而风险因素筛查是由意大利国家卫生***提倡的,只有高危女性接受诊断性75g OGTT。然而,这两种方法的诊断价值都低于OGTT。而在本申请中,能够根据受试者样本中的标记物的浓度,通过预测模型来预测受试者患有糖尿病的风险,使受试者(尤其是孕妇)无需隔夜禁食,无需口服葡萄糖进行葡萄糖耐量试验,对受试者身体友好,不会对受试者造成不良反应,且更为客观也更方便。
如本申请中所使用的,“受试者”(也可称为“个体”、“对象”)为接受糖尿病检测或预测的对象。在一些实施例中,受试者可以是脊椎动物。在一些实施例中,脊椎动物为哺乳动物。哺乳动物包括但不限于灵长类(包括人和非人灵长类)以及啮齿动物(例如,小鼠和大鼠)。在一些实施例中,受试者可以是人。在一些实施例中,受试者为孕妇。
根据本申请的一方面,提供了用于预测受试者患有糖尿病的可能性的标记物。糖尿病可以包括一型糖尿病、二型糖尿病或GDM。在一些实施例中,糖尿病可以是一型糖尿病。在一些实施例中,糖尿病可以是二型糖尿病。在一些实施例中,糖尿病可以是GDM。
在一些实施例中,标记物可以与糖尿病相关的代谢有关,例如,与胰岛素抵抗相关的代谢、肠道微生物代谢、甘油磷脂代谢等。在一些实施例中,标记物可以包括葡萄糖类似物、有机酸、有机化合物、氨基酸等。在一些实施例中,葡萄糖类似物可以包括1,5-AG。有机酸可以包括α-HB。有机化合物可以包括乙醇胺、氧化三甲胺(trimethylamine Oxide,TMAO)。氨基酸可以包括L-苯丙氨酸、L-色氨酸、L-酪氨酸、L-异亮氨酸、L-亮氨酸、L-缬氨酸、瓜氨酸、胱氨酸、谷氨酰胺、谷氨酸、羟赖氨酸、L-天冬氨酸、L-丙氨酸、L-脯氨酸、L-苏氨酸、赖氨酸、蛋氨酸、牛磺酸等。在一些实施例中,标记物还可以包括其他化合物,例如,ADMA、对称性二甲基精氨酸(symmetric dimethylarginine,SDMA)、油酸(oleic acid,OA)、亚油酰甘油磷酸胆碱(linoleylglycerophosphocholine,LPGC)等。
在一些实施例中,所述标记物可以包括α-HB、1,5-AG、ADMA、胱氨酸、乙醇胺、牛磺酸、L-亮氨酸、L-色氨酸、羟赖氨酸、L-天冬氨酸中的至少一个。在一些实施例中,所述标记物可以是α-HB。在一些实施例中,所述标记物可以包括1,5-AG和ADMA中的至少一个。在一些实施例中,所述标记物可以包括1,5-AG和ADMA中的全部。在一些实施例中,所述标记物可以包括胱氨酸、乙醇胺、牛磺酸、L-亮氨酸、L-色氨酸和羟赖氨酸中的至少一个。在一些实施例中,所述标记物可以包括胱氨酸、乙醇胺、牛磺酸、L-亮氨酸、L-色氨酸和羟赖氨酸中的全部。在一些实施例中,所述标记物可以包括α-HB、1,5-AG、胱氨酸、乙醇胺、牛磺酸、L-天冬氨酸中的至少一个。在一些实施例中,所述标记物可以包括α-HB、1,5-AG、胱氨酸、乙醇胺、牛磺酸、L-天冬氨酸中的全部。
在一些实施例中,所述标记物可以作为模型的变量应用在预测模型中。预测模型可以包括多个预测模型,例如,实施例中的预测模型2-5。每个预测模型可以与上述标记物中的至少一个有关(例如,作为预测模型的变量)。在一些实施例中,预测模型2可以与α-HB有关。在一些实施例中,预测模型3可以与1,5-AG和ADMA有关。在一些实施例中,预测模型4可以与胱氨酸、乙醇胺、牛磺酸、L-亮氨酸、L-色氨酸和羟赖氨酸有关。在一些实施例中,预测模型5可以与α-HB、1,5-AG、胱氨酸、乙醇胺、牛磺酸、L-天冬氨酸有关。在一些实施例中,预测模型还可以包括其他变量,例如,常规变量(例如,受试者的年龄、BMI)。在一些实施例中,预测模型2-5还可以与受试者的年龄和BMI相关。在一些实施例中,预测模型还可以包括预测模型1,其仅与受试者的年龄、BMI有关。应当注意的是,对于受试者为妊娠期女性,BMI则为孕前BMI。在一些实施例中,预测模型还可以是一个模型,该模型整合有上述多个预测模型。
可以基于上述标记物的浓度,预测模型可以输出概率值,以预测受试者患有糖尿病的可能性。具体地,这些标记物可以作为相关预测模型的变量,将受试者的标记物的浓度输入到相关的预测模型中,预测模型可以输出概率值,将概率值与模型对应的阈值相比较,即可判断出受试者患有糖尿病的可能性。若概率值大于等于阈值,则预测受试者患有糖尿病的可能性较大。否则,预测受试者患有糖尿病的可能性较小。
根据本申请的另一方面,提供了标记物在制备用于预测受试者患有糖尿病的可能性的试剂、组合物或试剂盒中的应用。该预测包括如下步骤:
基于来自所述受试者的样品,确定所述标记物的浓度,其中,所述标记物包括α-HB、1,5-AG、ADMA、胱氨酸、乙醇胺、牛磺酸、L-亮氨酸、L-色氨酸、羟赖氨酸、L-天冬氨酸中的至少一种;以及
基于所述标记物的浓度,使用与所述标记物相关的预测模型预测所述受试者患有糖尿病的可能性。
在一些实施例中,受试者可以是患有或不患有糖尿病的个体。在一些实施例中,受试者可以是孕妇。受试者的样品可以是血清样品、血浆样品、唾液样品、尿液样品等。在一些实施例中,样品可以是血清样品或血浆样品。
在一些实施例中,所述标记物包括上文描述的标记物。在一些实施例中,标记物可以包括α-HB、1,5-AG、ADMA、胱氨酸、乙醇胺、牛磺酸、L-亮氨酸、L-色氨酸、羟赖氨酸、L-天冬氨酸中的至少一种。在一些实施例中,所述标记物可以是α-HB。在一些实施例中,所述标记物可以包括1,5-AG和ADMA中的至少一个。所述标记物可以包括1,5-AG和ADMA中的全部。在一些实施例中,所述标记物可以包括胱氨酸、乙醇胺、牛磺酸、L-亮氨酸、L-色氨酸和羟赖氨酸中的至少一个。在一些实施例中,所述标记物可以包括胱氨酸、乙醇胺、牛磺酸、L-亮氨酸、L-色氨酸和羟赖氨酸中的全部。在一些实施例中,所述标记物可以包括α-HB、1,5-AG、胱氨酸、乙醇胺、牛磺酸、L-天冬氨酸中的至少一个。在一些实施例中,所述标记物可以包括α-HB、1,5-AG、胱氨酸、乙醇胺、牛磺酸、L-天冬氨酸中的全部。
在一些实施例中,标记物的浓度可以通过质谱法(例如,液相色谱-质谱法(liquidchromatography-mass spectrometry,LC-MS)、气相色谱-质谱法(gas chromatography-mass spectrometry,GC-MS)、基质辅助激光解吸/电离飞行时间质谱(matrix-assistedlaser desorption/ionization time-of-flight mass spectrometry,MALDI-TOF MS)、免疫法、酶法等在样品中进行测定。在一些实施例中,标记物的浓度可以通过LC-MS确定。关于标记物的浓度确定方法可以参考实施例中“代谢物浓度测定”部分。
在一些实施例中,不同的预测模型的变量可以包括不同的标记物。每个预测模型可以与上述标记物中的至少一个标记物相关。在一些实施例中,预测模型可以包括多个预测模型,例如,实施例中的预测模型2-5。每个预测模型可以与上述标记物中的至少一个有关。在一些实施例中,预测模型2可以与α-HB有关。在一些实施例中,预测模型3可以与1,5-AG和ADMA有关。在一些实施例中,预测模型4可以与胱氨酸、乙醇胺、牛磺酸、L-亮氨酸、L-色氨酸和羟赖氨酸有关。在一些实施例中,预测模型5可以与α-HB、1,5-AG、胱氨酸、乙醇胺、牛磺酸、L-天冬氨酸有关。在一些实施例中,预测模型还可以包括其他变量,例如,常规变量(例如,受试者的年龄、BMI)。在一些实施例中,预测模型还可以包括预测模型1,其与受试者的年龄、BMI有关。在一些实施例中,预测模型还可以包括一个模型,该模型整合有上述多个预测模型。
在一些实施例中,预测模型(例如,预测模型2)可以由公式(1)表示:
在一些实施例中,预测模型(例如,预测模型3)可以由公式(2)表示:
在一些实施例中,预测模型(例如,预测模型4)可以由公式(3)表示:
在一些实施例中,预测模型(例如,预测模型5)可以由公式(4)表示:
在上述公式中,p值为受试者为糖尿病的概率值,为对数优势比,各个标记物的名称均表示各个标记物的浓度,单位为μmol/L。这里的单位μmol/L仅为示例,还可以是本领域人员所知悉的其他浓度单位,例如,mol/L、ug/mL、g/L等,本申请并不对此做出限制。应当注意的是,对于受试者为妊娠期女性,上述公式中的BMI为孕前BMI。
在一些实施例中,预测模型可以通过模型训练获得。可以用训练集来获得和训练初始模型,得到训练后模型。训练集可以包括样本标记物的浓度、受试者常规特征(例如,年龄、BMI)样本受试者是否患有糖尿病(例如,妊娠糖尿病)的分类数据。在一些实施例中,还可以使用验证集来测试训练后模型,并不断调整模型参数。在一些实施例中,还可以使用验证集来验证预测模型。
在一些实施例中,可以通过逻辑回归方法、基于支持向量机(SVM)的方法、基于贝叶斯分类器的方法、基于K-最近邻(KNN)的方法、决策树方法等或其任何组合来建立预测模型。在一些实施例中,预测模型可以是逻辑回归模型。
接收者操作特性(Receiver operating characteristics,ROC)曲线可以用于评估预测模型的性能。ROC曲线可以说明预测模型的预测能力。ROC曲线以敏感度(真阳性率)为纵坐标,特异度(真阴性率)为横坐标绘制的曲线。可以基于ROC曲线确定曲线下面积(area under the curve,AUC)。AUC可以用来表示预测模型的准确性,AUC值越高,预测模型预测的准确率越高。
在一些实施例中,预测模型的AUC可以大于0.7。在一些实施例中,预测模型的AUC可以大于0.75。在一些实施例中,预测模型的AUC可以大于0.8。在一些实施例中,预测模型的AUC可以大于0.85。在一些实施例中,预测模型的AUC可以大于0.9。具体地,在一些实施例中,预测模型2的AUC可以大于0.7。在一些实施例中,预测模型3的AUC可以大于0.75。在一些实施例中,预测模型4的AUC可以大于0.85。在一些实施例中,预测模型5的AUC可以大于0.85。在一些实施例中,预测模型5的AUC可以大于0.9。在一些实施例中,预测模型2-5的AUC均大于0.7,均有一定的准确度,但预测模型2-5可以具有不同的AUC值。例如,预测模型2-5的AUC依次递增,即,预测模型5的准确率优于预测模型4的准确率优于预测模型3的准确率优于预测模型2的准确率。
图5C-5J是根据本申请一些实施例所示的预测模型2-5分别在训练集和验证集中的ROC。示例性的,预测模型2在验证集中的AUC为0.734,预测模型3在验证集中的AUC为0.773,预测模型4在验证集中的AUC为0.852,预测模型5在验证集中的AUC为0.887。
在一些实施例中,预测模型的敏感度可以大于65%。在一些实施例中,预测模型的敏感度可以大于70%。在一些实施例中,预测模型的敏感度可以大于75%。在一些实施例中,预测模型的敏感度可以大于80%。在一些实施例中,预测模型的敏感度可以大于85%。在一些实施例中,预测模型的敏感度可以大于90%。具体地,在一些实施例中,预测模型2的敏感度可以大于65%。在一些实施例中,预测模型2的敏感度可以大于65%。在一些实施例中,预测模型3的敏感度可以大于70%。在一些实施例中,预测模型4的敏感度可以大于70%。在一些实施例中,预测模型5的敏感度可以大于70%。
在一些实施例中,预测模型的特异度可以大于65%。在一些实施例中,预测模型的特异度可以大于70%。在一些实施例中,预测模型的特异度可以大于75%。在一些实施例中,预测模型的特异度可以大于80%。在一些实施例中,预测模型的特异度可以大于85%。在一些实施例中,预测模型的特异度可以大于90%。具体地,在一些实施例中,预测模型2的特异度可以大于65%。在一些实施例中,预测模型3的特异度可以大于70%。在一些实施例中,预测模型4的特异度可以大于80%。在一些实施例中,预测模型5的特异度可以大于85%。
图5C-5J是根据本申请一些实施例所示的预测模型2-5分别在训练集和验证集中的ROC。示例性的,预测模型2在验证集中的敏感度为68.6%,特异度为67.9%;预测模型3在验证集中的敏感度为72%,特异度为71.9%,预测模型4在验证集中的敏感度为73.7%,特异度为83%,预测模型5在验证集中的敏感度为74.6%,特异度为87.5%。
关于预测模型的更详细的内容可以参考实施例“预测模型的确定”部分。
在一些实施例中,基于所述标记物中的至少一个标记物的浓度,使用与所述标记物中的至少一个标记物相关的预测模型预测所述受试者患有糖尿病的可能性可以包括:将每个预测模型对应的标记物的浓度作为输入,输出预测值。通过比较预测值和阈值,可以预测所述受试者患有糖尿病的可能性。以预测模型5为例,将预测模型5相关的标志物的浓度(单位为μmol/L)输入到公式(4)中,预测模型5可以输出预测值(即,概率值p),并与预测模型5对应的阈值进行比较,从而预测所述受试者患有糖尿病的可能性。
在一些实施例中,预测模型的阈值可以是通过约登指数(Youden's index)计算的阈值。例如,只考虑敏感度和特异度这2个指标分别对应的单个值,使用约登指数(Youden'sindex)可以计算ROC曲线上的阈值。在一些实施例中,预测模型2的阈值为0.336。在一些实施例中,预测模型3的阈值为0.336。在一些实施例中,预测模型4的阈值为0.363。在一些实施例中,预测模型5的阈值为0.413。
在一些实施例中,预测模型的阈值可以是选定阈值范围中的任一数值。在一些实施例中,阈值范围可以根据敏感度和特异度范围确定。例如,根据敏感度和特异度的范围,选择阈值范围。预测模型的阈值可以从阈值范围中确定。在一些实施例中,可以选择预测模型5的敏感度和特异度在[0.8,0.85]对应的阈值范围,例如,[0.288597,0.323644]。在一些实施例中,可以选择预测模型4的敏感度和特异度在[0.75,0.8]对应的阈值范围,例如,[0.274613,0.323241]。在一些实施例中,可以选择预测模型3的敏感度和特异度在[0.7,0.75]对应的阈值范围,例如,[0.317268,0.360159]。在一些实施例中,可以选择预测模型2的敏感度和特异度在[0.65,0.7]对应的阈值范围,例如,[0.309508,0.374544]。
在一些实施例中,若所述预测值大于或等于所述阈值,预测所述受试者患有糖尿病的可能性较高。若所述预测值小于所述阈值,预测所述受试者患有糖尿病的可能性较低。受试者患有糖尿病的可能性较高指的是受试者患有糖尿病的概率大于等于80%、85%、90%、95%、98%、100%。在一些实施例中,受试者患有糖尿病的可能性较高为受试者患有糖尿病。受试者患有糖尿病的可能性较低指的是受试者不患有糖尿病的概率大于等于80%、85%、90%、95%、98%、100%。在一些实施例中,受试者患有糖尿病的可能性较低为受试者不患有糖尿病。
关于预测模型预测受试者患有糖尿病的可能性的更详细的内容可以参考实施例“预测模型的应用”部分。
根据本申请的又一方面,提供了预测模型在制备用于预测受试者患有糖尿病的可能性的试剂、组合物或试剂盒中的应用。预测模型可以与所述标记物相关。在一些实施例中,所述标记物可以包括α-HB、1,5-AG、ADMA、胱氨酸、乙醇胺、牛磺酸、L-亮氨酸、L-色氨酸、羟赖氨酸、L-天冬氨酸中的至少一个。在一些实施例中,预测模型可以包括多个预测模型,例如,实施例中的预测模型2-5。每个预测模型可以与上述标记物中的至少一个有关(例如,作为预测模型的变量)。在一些实施例中,预测模型2可以与α-HB有关。在一些实施例中,预测模型3可以与1,5-AG和ADMA有关。在一些实施例中,预测模型4可以与胱氨酸、乙醇胺、牛磺酸、L-亮氨酸、L-色氨酸和羟赖氨酸有关。在一些实施例中,预测模型5可以与α-HB、1,5-AG、胱氨酸、乙醇胺、牛磺酸、L-天冬氨酸有关。在一些实施例中,预测模型还可以包括其他变量,例如,常规变量(例如,受试者的年龄、BMI)。
在一些实施例中,预测模型还可以包括预测模型1,其与受试者的年龄、BMI有关。在一些实施例中,预测模型还可以包括一个模型,该模型整合有上述多个预测模型。在一些实施例中,预测模型2-5分别由上述公式(1)-(4)表示。应当注意的是,对于受试者为妊娠期女性,BMI则为孕前BMI。
在一些实施例中,可以通过逻辑回归方法、基于支持向量机(SVM)的方法、基于贝叶斯分类器的方法、基于K-最近邻(KNN)的方法、决策树方法等或其任何组合来建立预测模型。在一些实施例中,预测模型可以是逻辑回归模型。
在一些实施例中,预测模型的AUC可以大于0.7。在一些实施例中,预测模型的AUC可以大于0.75。在一些实施例中,预测模型的AUC可以大于0.8。在一些实施例中,预测模型的AUC可以大于0.85。在一些实施例中,预测模型的AUC可以大于0.9。具体地,在一些实施例中,预测模型2的AUC可以大于0.7。在一些实施例中,预测模型3的AUC可以大于0.75。在一些实施例中,预测模型4的AUC可以大于0.85。在一些实施例中,预测模型5的AUC可以大于0.85。在一些实施例中,预测模型5的AUC可以大于0.9。在一些实施例中,预测模型2-5的AUC均大于0.7,均有一定的准确度,但预测模型2-5可以具有不同的AUC值。例如,预测模型2-5的AUC依次递增,即,预测模型5的准确率优于预测模型4的准确率优于预测模型3的准确率优于预测模型2的准确率。
图5C-5J是根据本申请一些实施例所示的预测模型2-5分别在训练集和验证集中的ROC。示例性的,预测模型2在验证集中的AUC为0.734,预测模型3在验证集中的AUC为0.773,预测模型4在验证集中的AUC为0.852,预测模型5在验证集中的AUC为0.887。
在一些实施例中,预测模型的敏感度可以大于65%。在一些实施例中,预测模型的敏感度可以大于70%。在一些实施例中,预测模型的敏感度可以大于75%。在一些实施例中,预测模型的敏感度可以大于80%。在一些实施例中,预测模型的敏感度可以大于85%。在一些实施例中,预测模型的敏感度可以大于90%。具体地,在一些实施例中,预测模型2的敏感度可以大于65%。在一些实施例中,预测模型2的敏感度可以大于65%。在一些实施例中,预测模型3的敏感度可以大于70%。在一些实施例中,预测模型4的敏感度可以大于70%。在一些实施例中,预测模型5的敏感度可以大于70%。
在一些实施例中,预测模型的特异度可以大于65%。在一些实施例中,预测模型的特异度可以大于70%。在一些实施例中,预测模型的特异度可以大于75%。在一些实施例中,预测模型的特异度可以大于80%。在一些实施例中,预测模型的特异度可以大于85%。在一些实施例中,预测模型的特异度可以大于90%。具体地,在一些实施例中,预测模型2的特异度可以大于65%。在一些实施例中,预测模型3的特异度可以大于70%。在一些实施例中,预测模型4的特异度可以大于80%。在一些实施例中,预测模型5的特异度可以大于85%。
图5C-5J是根据本申请一些实施例所示的预测模型2-5分别在训练集和验证集中的ROC。示例性的,预测模型2在验证集中的敏感度为68.6%,特异度为67.9%;预测模型3在验证集中的敏感度为72%,特异度为71.9%,预测模型4在验证集中的敏感度为73.7%,特异度为83%,预测模型5在验证集中的敏感度为74.6%,特异度为87.5%。
本申请中构建的预测模型均有较好的准确度,能够准确预测受试者是否为糖尿病。关于预测模型的更多内容可以参考本申请其他地方所述,在此不再赘述。
根据本申请的再一方面,提供了一种用于治疗糖尿病的方法。所述方法可以包括:
基于来自所述受试者的样品,确定所述标记物的浓度,其中,所述标记物包括α-HB、1,5-AG、ADMA、胱氨酸、乙醇胺、牛磺酸、L-亮氨酸、L-色氨酸、羟赖氨酸、L-天冬氨酸中的至少一个。在一些实施例中,所述标记物可以包括α-HB、1,5-AG、ADMA、胱氨酸、乙醇胺、牛磺酸、L-亮氨酸、L-色氨酸、羟赖氨酸、L-天冬氨酸中的至少一个。在一些实施例中,所述标记物可以是α-HB。在一些实施例中,所述标记物可以包括1,5-AG和ADMA中的至少一个。所述标记物可以包括1,5-AG和ADMA中的全部。在一些实施例中,所述标记物可以包括胱氨酸、乙醇胺、牛磺酸、L-亮氨酸、L-色氨酸和羟赖氨酸中的至少一个。在一些实施例中,所述标记物可以包括胱氨酸、乙醇胺、牛磺酸、L-亮氨酸、L-色氨酸和羟赖氨酸中的全部。在一些实施例中,所述标记物可以包括α-HB、1,5-AG、胱氨酸、乙醇胺、牛磺酸、L-天冬氨酸中的至少一个。在一些实施例中,所述标记物可以包括α-HB、1,5-AG、胱氨酸、乙醇胺、牛磺酸、L-天冬氨酸中的全部。
在一些实施例中,标记物的浓度可以通过质谱法(例如,液相色谱-质谱法、气相色谱-质谱法、基质辅助激光解吸/电离飞行时间质谱)、免疫法、酶法等在样品中进行测定。在一些实施例中,标记物的浓度可以通过液相色谱串联质谱确定。
基于所述标记物的浓度,使用与所述标记物相关的预测模型预测所述受试者患有糖尿病的可能性。
在一些实施例中,可以使用上文描述的预测模型(例如,预测模型2-5)来预测受试者患有糖尿病的可能性。关于该步骤的更多内容可参考上文描述,在此不再赘述。
若预测结果为所述受试者患有糖尿病(例如,预测模型输出的概率值大于等于对应的阈值),对于不同的受试者,可以采取不同的处理方式。
在一些实施例中,若受试者为妊娠期女性,且预测结果为该受试者患有糖尿病,则对该受试者采用OGTT进行进一步诊断,若OGTT结果也为该受试者患有糖尿病,则可以对该受试者施用治疗糖尿病的药物。通过本申请的预测模型,可以筛选掉无需做OGTT的非GDM的妊娠期女性,减少妊娠期女性在进行OGTT检查时的痛苦和不便。预测模型的预测结果能够为后续的诊断和治疗提供了可靠且准确的参考。
在一些实施例中,若受试者为非妊娠期女性,且预测结果为该受试者患有糖尿病,则可以对该受试者施用治疗糖尿病的药物。在一些实施例中,若受试者为妊娠期女性,可以对该受试者进行后续诊断(例如,OGTT)来进一步确诊,再对受试者施用治疗糖尿病的药物。
在一些实施例中,治疗糖尿病的药物可以包括胰岛素、磺脲类胰岛素促分泌剂、非磺脲类胰岛素促分泌剂、双胍类药物、α-葡萄糖苷酶抑制剂(例如,阿卡波糖(拜糖平))、噻唑烷二酮类(例如,吡格列酮、马来酸罗格列酮)等。磺脲类胰岛素促分泌剂可以包括格列苯脲(优降糖)、格列吡嗪(美吡哒)、格列齐特(达美康)、格列喹酮(糖适平)、格列美脲等。非磺脲类胰岛素促分泌剂可以包括瑞格列奈(诺和龙、孚来迪)、那格列奈(唐力)等。双胍类药物可以包括二甲双胍缓释片、迪化糖锭、格化止等。
根据本申请的再一方面,提供了一种用于预测受试者患有糖尿病的可能性的***。该***可以包括:获取模块、训练模块和预测模块。
该获取模块可用于获取受试者样品的标记物的浓度。所述标记物可以包括α-HB、1,5-AG、ADMA、胱氨酸、乙醇胺、牛磺酸、L-亮氨酸、L-色氨酸、羟赖氨酸、L-天冬氨酸中的至少一种。在一些实施例中,所述标记物可以是α-HB。在一些实施例中,所述标记物可以包括1,5-AG和ADMA中的至少一个。所述标记物可以包括1,5-AG和ADMA中的全部。在一些实施例中,所述标记物可以包括胱氨酸、乙醇胺、牛磺酸、L-亮氨酸、L-色氨酸和羟赖氨酸中的至少一个。在一些实施例中,所述标记物可以包括胱氨酸、乙醇胺、牛磺酸、L-亮氨酸、L-色氨酸和羟赖氨酸中的全部。在一些实施例中,所述标记物可以包括α-HB、1,5-AG、胱氨酸、乙醇胺、牛磺酸、L-天冬氨酸中的至少一个。在一些实施例中,所述标记物可以包括α-HB、1,5-AG、胱氨酸、乙醇胺、牛磺酸、L-天冬氨酸中的全部。该获取模块还可用于获取受试者的常规特征,例如,年龄、BMI、身高、体重等。
该训练模块可以用于利用训练集训练初始模型获得预测模型。在一些实施例中,训练模块可以用于利用训练集训练初始模型获得多个预测模型,例如,预测模型2-5。所述预测模型与所述标记物中的至少一个标记物相关,例如,预测模型2-5与不同的标记物有关。所述预测模型还可以与受试者的年龄与BMI相关。在一些实施例中,预测模型2可以与α-HB有关。在一些实施例中,预测模型3可以与1,5-AG和ADMA有关。在一些实施例中,预测模型4可以与胱氨酸、乙醇胺、牛磺酸、L-亮氨酸、L-色氨酸和羟赖氨酸有关。在一些实施例中,预测模型5可以与α-HB、1,5-AG、胱氨酸、乙醇胺、牛磺酸、L-天冬氨酸有关。关于预测模型的更多内容可以参考本申请其他地方的描述,在此不再赘述。
该预测模块可以用于基于所述标记物中的至少一个标记物的浓度,使用预测模型预测所述受试者患有糖尿病的可能性。例如,将与预测模型对应的标记物的浓度输入到预测模型中,预测模型可以输出预测值。将预测值与预测模型的阈值相比较,当预测值大于等于阈值时,预测模块可以预测受试者患有糖尿病的可能性较高;当预测值小于阈值时,预测模块可以预测受试者患有糖尿病的可能性较低。
应当理解,该用于预测受试者患有糖尿病的可能性的***及其模块可以利用各种方式来实现。例如,在一些实施例中,***及其模块可以通过硬件、软件或者软件和硬件的结合来实现。其中,硬件部分可以利用专用逻辑来实现;软件部分则可以存储在存储器中,由适当的指令执行***,例如微处理器或者专用设计硬件来执行。本领域技术人员可以理解上述的方法和***可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本申请的***及其模块不仅可以有诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用例如由各种类型的处理器所执行的软件实现,还可以由上述硬件电路和软件的结合(例如,固件)来实现。
实施例
GDM组和非GDM组的临床变量的显著性检验
本研究将369名受试者(例如,孕妇)进行使用75g的OGTT,并将测试结果分成两组,GDM组和非GDM组。并对两组中的受试者检测下表1中显示的临床变量,并进行显著性统计检验,以发现在两组中明显有区别的变量。年龄、收缩压和舒张压使用的显著性统计检验方法为学生t检验(Student's t-test),其它临床变量使用的显著性统计检验方法为曼-惠特尼U检验(Mann-Whitney U test)。P值小于0.05为显著。
表1 GDM组与非GDM组的临床特征
其中,上述数据为平均值(标准差)或中值(四分位数范围);P值为诊断为GDM和非GDM的患者之间的差异;*表示分析前对数变换。
从上表1中的结果可知,相比于非GDM组,GDM组中受试者的年龄、孕前BMI(p<0.001)显著较大,血压、甘油三酯、糖化血红蛋白、胰岛素抵抗的指标(p<0.02)均显著升高,高密度脂蛋白胆固醇和胰岛细胞功能指标(均p<0.01)显著降低,总胆固醇、低密度脂蛋白胆固醇和空腹胰岛素则无显著差异(p>0.05)。
代谢物浓度测定
通过LC-MS测量与上述确定的具有显著差异的变量(除年龄与孕前BMI的其他临床变量)相关的代谢物浓度,以进行显著性差异分析。
具体地,获取369名受试者的血浆样本并使之通过蛋白沉淀后,振荡、离心取上清衍生后进样,先利用超高效液相色谱将待测代谢物进行分离,再利用质谱同位素内标定量法,以标准品与内标物的浓度比为X轴,标准品与内标物的峰面积比为Y轴,建立校准曲线,从而能够计算相关代谢物的含量。但不同的代谢物高效液相色谱条件和质谱条件不同,具体条件如下。
一、25种氨基酸及其衍生物检测
(1)高效液相色谱条件:
流动相A:水(含0.1%甲酸);
流动相B:乙腈(含0.1%甲酸);
色谱柱:ACQUITY UPLC BEH C18(2.1×100mm,1.7μm);
采用梯度洗脱的方式,见表2;
流速为0.4mL/min,柱温为50℃,进样体积为1μL;
表2流动相梯度洗脱参数
(2)质谱条件:
在电喷雾电离正离子检测模式下,采用多反应监测的质谱扫描模式;喷雾电压为3.0kV;去溶剂温度为120℃;雾化气温度为400℃,雾化气流速为800L/h,锥孔气流速为150L/h;同时监测了待测代谢物及其内标;各个待测代谢物的去簇电压和碰撞电压参数见表3。
表3氨基酸及其衍生物质谱参数
/>
图1A和图1B分别示出了25种氨基酸及其衍生物的标准品和血浆样品中25种氨基酸及其衍生物的总离子流色谱图。如图中所示,25种氨基酸及其衍生物的标准品和血浆样品的峰形比较对称,且没有杂峰干扰,说明在此条件下能够得到良好的检测。
采用同位素内标定量法,利用TargetLynx软件以标准物与内标物的浓度比为X轴,标准物与内标物峰面积比为Y轴,建立校准曲线,25种氨基酸及其衍生物在各自浓度范围内的线性方程的线性良好,相关系数在0.99以上,满足定量要求,具体见表4。根据标准曲线的线性方程,计算出血浆中待测代谢物的浓度。
表4 25种氨基酸及其衍生物线性回归方程及线性相关系数
/>
二、1,5-AG、TMAO、ADMA和SDMA检测
(1)高效液相色谱条件:
流动相A:水(含0.1%甲酸);
流动相B:乙腈(含0.1%甲酸);
色谱柱:ACQUITY UPLC BEH Amide(2.1×100mm,1.7μm);
采用梯度洗脱的方式,见表5;
流速为0.4mL/min,柱温为50℃,进样体积为1μL;
表5流动相梯度洗脱参数
(2)质谱条件:
采用电喷雾电离正负离子切换多反应监测的质谱扫描模式;喷雾电压为ESI(+)3.0kV/ESI(-)2.5kV;去溶剂温度为120℃;雾化气温度为400℃,雾化气流速为800L/h,锥孔气流速为150L/h;同时监测了待测代谢物及其内标;各个待测代谢物的去簇电压和碰撞电压参数见表6。
表6待测代谢物质谱参数
图2A和图2B分别为1,5-AG、TMAO、ADMA和SDMA的标准品总离子流色谱图和血浆样本中1,5-AG、TMAO、ADMA和SDMA的总离子流色谱图。如图所示,1,5-AG、TMAO、ADMA和SDMA的标准品和血浆样品的峰形比较对称,且没有杂峰干扰,说明在此条件下能够得到良好的检测。
采用同位素内标定量法,利用TargetLynx软件以标准物与内标物的浓度比为X轴,标准物与内标物峰面积比为Y轴,建立校准曲线,1,5-AG、TMAO、ADMA和SDMA在各自浓度范围内的线性拟合方程,线性良好,相关系数在0.99以上,满足定量要求,见表7。根据标准曲线的线性方法,计算出血浆中待测物的浓度。
表7 1,5-AG、TMAO、ADMA和SDMA线性回归方程及线性相关系数
三、α-HB、OA和LGPC检测
(1)高效液相色谱条件:
流动相A:水(含0.1%甲酸);
流动相B:乙腈(含0.1%甲酸);
色谱柱:ACQUITY UPLC BEH C18(2.1×50mm,1.7μm);
采用梯度洗脱的方式,见表8;
流速为0.5mL/min,柱温为50℃,进样体积为1μL;
表8流动相梯度洗脱参数
(2)质谱条件:
采用电喷雾电离正负离子切换多反应监测的质谱扫描模式;喷雾电压为ESI(+)3.0kV/ESI(-)2.5kV;去溶剂温度为120℃;雾化气温度为400℃,雾化气流速为800L/h,锥孔气流速为150L/h;同时监测了目标物及其内标;各个目标物的去簇电压和碰撞电压参数见表9。
表9目标物质谱参数
图3A和图3B示出了α-HB、OA和LGPC的标准品总离子流色谱图和血浆中α-HB、OA和LGPC的总离子流色谱图。如图所示,α-HB、OA和LGPC的标准品和血浆样品的峰形比较对称,且没有杂峰干扰,说明在此条件下能够得到良好的检测。
采用同位素内标定量法,利用TargetLynx软件以标准物与内标物的浓度比为X轴,标准物与内标物峰面积比为Y轴,建立校准曲线,α-HB、OA和LGPC在各自浓度范围内的线性拟合方程,线性良好,相关系数在0.99以上,满足定量要求,见表10。根据标准曲线的线性方程,计算出血浆中待测代谢物物的浓度。
表10 α-HB、OA和LGPC线性回归方程及线性相关系数
GDM组和非GDM组的代谢物的显著性检验
通过上述标准曲线可以确定出各个代谢物的浓度,之后进行显著性统计分析,以确定显著差异的代谢物。在GDM组和非GDM组中显著性统计检验方法为曼-惠特尼U检验(Mann-Whitney U test),P值小于0.05为显著。具体代谢物及其路径以及P值结果如下表11所示。
表11 GDM组和非GDM组受试者的代谢物水平
/>
/>
根据表11可知,相比于非GDM组,GDM组的胱氨酸、羟赖氨酸、α-HB和油酸水平显著升高(其p<0.001);而1,5-AG、乙醇胺、L-苯丙氨酸、L-色氨酸、L-异亮氨酸、L-亮氨酸、L-天冬氨酸、L-丙氨酸、L-苏氨酸、赖氨酸、蛋氨酸、牛磺酸、非对称性二甲基精氨酸、对称二甲基精氨酸和谷氨酸均显著降低(所有p<0.01)。
预测模型的确定
模型获取概述
本实施例采用的预测模型为逻辑回归模型,适用于二分类问题。使用该模型可以用于预测受试者是否为GDM。
逻辑回归模型是广义线性模型,假设因变量y服从二项分布,线性模型的拟合形式如下公式(5)所示:
其中,p值为受试者为GDM概率值,为对数优势比,β0为截距,xi为纳入的各种变量(例如,各种标记物、年龄、孕前BMI等),βi为斜率。
将369名受试者的代谢物浓度数据以及年龄、孕前BMI、分类信息(即,受试者是否为GDM)等作为样本数据集。使用10次重复*10折交叉验证方法将上述样本数据集分为训练集、验证集。训练集和验证集用于估计公式(5)中β0和βi参数。具体地,首先根据训练集,即提供变量数据xi和样本分类信息,结合最大似然估计方法评估最优β0和βi参数。确定β0和βi,即得到训练后的模型(即,预测模型)。根据验证集中的数据和训练后的模型,可对验证集中的受试者进行预测,并将预测结果和真实分类信息进行比较。最后,根据训练集和验证集的计算结果,绘制ROC曲线,并计算ROC曲线的AUC值(Area Under the Curve of ROC)以及模型中各变量的优势比(Odds Ratio)和显著性P值。Logistic regression模型中变量的显著性检验方法使用Wald test,统计显著标准P<0.05。
各个预测模型中变量的显著性检验
具体地,年龄和孕前BMI是已知与GDM发生显著相关的危险因子(在表1中P<0.001),需要纳入所有多变量模型中作为校正因子。将变量只有年龄和孕前BMI的预测模型记为预测模型1,作为对照。其它代谢物根据其属性归类(见表11)依次纳入模型中,根据上述步骤的描述依次分析每个多变量模型的ROC曲线、AUC值和多变量模型中各变量的优势比和显著性P值。
根据上述数据结果,基于筛选原则筛选出合适的多变量模型。筛选原则是模型对应的AUC值最高,并且模型中各变量的优势比是统计显著(统计显著标准P<0.05)。最终筛选得到符合筛选原则的多变量模型分别命名为:预测模型2、预测模型3、预测模型4、预测模型5。这5个预测模型各变量的优势比见下表12。
表12 5个模型中纳入的变量和各变量的P值和优势比
/>
其中,P值*表示显著,P值**表示很显著,P值***非常显著,CI表示置信区间。
根据表12可知,筛选出的这5个模型的各变量的优势比均显著,均符合筛选原则。其中,年龄和孕前BMI(均p<0.01)在所有5个预测模型中均显著。预测模型2的变量包括常规风险因素(即,年龄和孕前BMI)和α-HB(p<0.001)。预测模型3的变量包括常规风险因素、1,5-AG和ADMA(均p<0.001)。预测模型4包括常规风险因素和氨基酸,包括胱氨酸、乙醇胺、牛磺酸、L-亮氨酸、L-色氨酸和羟赖氨酸(所有p<0.05)。预测模型5包括常规风险因素、α-HB、1,5-AG、胱氨酸、乙醇胺、牛磺酸和L-天冬氨酸(所有P<0.05)。使用多变量调整模型,α-HB、1,5-AG、ADMA、胱氨酸、乙醇胺、牛磺酸、亮氨酸、色氨酸、L-天冬氨酸和羟赖氨酸的水平与GDM发生显著相关。
图4A到图4L是5个预测模型的全部变量与GDM显著关系的分布图。5个预测模型所涉及到的12个变量在GDM和非GDM组的数据分布见图4A到图4L,从图中可知,这些变量均与GDM显著相关。
预测模型参数的确定
根据公式(5),分别输入不同模型的变量xi。预测模型1的变量为年龄和孕前BMI,预测模型2的变量为年龄、孕前BMI和α-HB,预测模型3的变量为年龄、孕前BMI、1,5-AG、ADMA,预测模型4的变量为年龄、孕前BMI、胱氨酸、乙醇胺、牛磺酸、L-亮氨酸、L-色氨酸和羟赖氨酸,预测模型5的变量为年龄、孕前BMI、α-HB、1,5-AG、胱氨酸、乙醇胺、牛磺酸和L-天冬氨酸。
根据上述变量以及训练集中受试者的真实分组数据,结合最大似然估计方法评估5个模型中的各个β0和βi参数的最优值,即可得到训练后的各个模型(即,预测模型)。5个预测模型如下表13所示。
表13 5个预测模型的公式
/>
计算各个预测模型的敏感度(sensitivity)和特异度(specificity)和阳性预测
值(PPV)和阴性预测值(NPV)
将369个样本数据分别代入上表13中的各个预测模型的公式中,以计算各个预测模型的敏感度(sensitivity)和特异度(specificity)和阳性预测值(positivepredictive value,PPV)和阴性预测值(negative predictive value,NPV)。以预测模型1为例,进行说明。根据每个样本的年龄和孕前BMI和预测模型1公式,可以计算每个样本属于GDM的概率值p。概率值取值范围在[0,1]之间,对[0,1]之间数值划分201个分位数(第0个分位数是0.0th,第1个分位数是0.5th,第2个分位数1.0th,第3分位数1.5th,第4个分位数2.0th,...,第200个分位数100th),每个分位数对应一个值叫阈值(Threshold)。对于第一个样本p值,如果p值大于等于该0个分位数对应的阈值,预测诊断该样本为GDM,小于该阈值,预测诊断该样本为非GDM。同样的,随后对第二个样本到第369个样本,分别比较各样本p值和0个分位数对应的阈值的大小关系,预测每个样本是否为GDM。将预测诊断的GDM和非GDM的样本与真实分组类别进行比较,计算敏感度和特异度和阳性预测值和阴性预测值。按照第0个分位数对应的阈值预测样本是否为GDM的过程,分别计算第1个和第200个分位数对应阈值条件下,预测369个样本是否为GDM,随后计算各阈值的敏感度、特异度、阳性预测值和阴性预测值。剩余的模型依次按照上述过程计算敏感度和特异度和阳性预测值和阴性预测值。
表14是5个预测模型的各阈值和对应的敏感度、特异度、PPV、NPV的比较结果。如下表14所示,在敏感度和特异度均大于等于85%的条件下,5个预测模型未筛选到相关阈值,都未达到该标准(即,敏感度和特异度均大于等于85%)。但是敏感度或特异度达到85%,5个模型可筛选到相关阈值(数据未示出)。
敏感度和特异度均在[0.8,0.85]之间条件下,预测模型5筛选到的阈值范围为[0.288597,0.323644],即在此阈值范围内任意选一个值,均可保证模型的敏感度和特异度在[0.8,0.85]之间。
敏感度和特异度均在[0.75,0.8]之间条件下,预测模型4和预测模型5筛选到相关阈值,并且预测模型5阈值范围更宽,表示预测模型5较预测模型4更稳定。敏感度、特异度、PPV和NPV均在[0.75,0.8]之间的条件下,只有预测模型5筛选到相关阈值。
在敏感度和特异度均在[0.70,0.75]之间,预测模型3、预测模型4和预测模型5筛选到相关阈值范围,阈值范围宽度为预测模型3<预测模型4<预测模型5。敏感度、特异度、PPV和NPV均在[0.70,0.75]之间的条件下,预测模型4和预测模型5筛选到相关阈值范围,预测模型3未筛选到。
在敏感度和特异度均在[0.65,0.7]之间的条件下,5个模型均筛选到相关阈值,阈值范围宽度是预测模型1<预测模型2<预测模型3<预测模型4<预测模型5;在敏感度、特异度、PPV和NPV均在[0.65,0.7]之间的条件下,模型4和模型5筛选到相关阈值。
在敏感度和特异度均在[0.60,0.65]之间的条件下,5个预测模型均筛选到相关阈值,阈值范围宽度依然是预测模型1<预测模型2<预测模型3<预测模型4<预测模型5;在敏感度、特异度、PPV和NPV均在[0.60,0.65]之间的条件下,预测模型3、预测模型4和预测模型5筛选到相关阈值,阈值范围宽度是预测模型3<预测模型4<预测模型5。
表14 5个预测模型的阈值范围比较
阈值、敏感度和特异度的3者关系是阈值越大,特异度越高,敏感度越低;阈值越小,敏感度越高,特异度越低。可以根据敏感度和特异度来选择阈值范围。例如,预测模型5的敏感度和特异度在[0.8,0.85],选择预测模型5在[0.8,0.85]的阈值范围[0.288597,0.323644]。模型4的敏感度和特异度在[0.75,0.8],选择预测模型4在[0.75,0.8]的阈值范围[0.274613,0.323241]。预测模型3的敏感度和特异度在[0.7,0.75],选择预测模型3在[0.7,0.75]的阈值范围[0.317268,0.360159]。预测模型2的敏感度和特异度在[0.65,0.7],选择预测模型2在[0.65,0.7]的阈值范围[0.309508,0.374544]。预测模型1的敏感度和特异度在[0.65,0.7],选择预测模型1在[0.65,0.7]的阈值范围[0.329666,0.332614]。各个预测模型的阈值可以根据需要来选择阈值范围内的任一数值。
各个预测模型的性能评估
根据上述步骤确定的各个预测模型的敏感度和特异度,绘制ROC曲线。图5A到图5J是5个预测模型的ROC曲线图。
根据图5A到图5J,5个预测模型性能评估数据见表15。预测模型1的验证集AUC为0.683(0.624-0.743)。预测模型2在预测模型1变量基础上再加入α-HB,验证集AUC为0.734(0.679-0.789)。预测模型3在预测模型1变量基础上再加入1,5-AG和ADMA,验证集AUC为0.773。预测模型4在预测模型1变量基础上再加入胱氨酸、乙醇胺、牛磺酸、L-亮氨酸、L-色氨酸和羟赖氨酸,验证集AUC为0.852(0.808-0.898)。特别的,预测模型5在预测模型1变量基础上再加入α-HB、1,5-AG、胱氨酸、乙醇胺、牛磺酸和L-天冬氨酸后,验证集AUC为0.887(0.849-0.926)。验证集的AUC值越高,表示预测模型的预测准确率最好。5个模型的AUC值由高到低排序依次预测模型5、预测模型4、预测模型3、预测模型2和预测模型1。预测模型2-5均可以用于预测受试者是否患有糖尿病。
表15 5个预测模型的训练集AUC值和验证集AUC值
根据图5A到图5J,只考虑敏感度和特异度这2个指标分别对应的单个值,使用约登指数可以确定各个预测模型的阈值,及其对应的敏感度、特异度、阳性预测值和阴性预测值。表16列出5个预测模型的阈值及其对应的敏感度、特异度、阳性预测值和阴性预测值的结果。
表16.5个预测模型在验证集中的敏感度、特异度、阳性预测值和阴性预测值结果
模型 | 敏感度(%) | 特异度(%) | PPV(%) | NPV(%) | 阈值 |
预测模型1 | 56.8 | 75.0 | 54.5 | 76.7 | 0.370 |
预测模型2 | 68.6 | 67.9 | 52.9 | 80.4 | 0.336 |
预测模型3 | 72.0 | 71.9 | 57.4 | 83.0 | 0.336 |
预测模型4 | 73.7 | 83.0 | 69.6 | 85.7 | 0.363 |
预测模型5 | 74.6 | 87.5 | 75.9 | 86.7 | 0.413 |
可以看出预测模型5约登指数计算的阈值对应的4个指标结果最好,其对应的特异度为87.5%,敏感度为74.6%,阳性预测值为75.9%,阴性预测值为86.7%,阈值为0.413。
预测模型的应用
对于GDM分类未知的受试者,使用确定的这5个预测模型预测该受试者是否为GDM。
首先,对新的受试者进行采血取样,之后检测5个预测模型所对应的变量的代谢分子的浓度值(例如,单位为μmol/L),并获取受试者的年龄和孕前BMI值。将这些变量输入到对应的各个预测模型中,各个预测模型可以输出概率值p。将概率值p与各个预测模型对应的阈值(约登指数确定的阈值或从阈值范围内选定)进行比较,若概率值大于等于阈值,则预测受试者患有糖尿病,即为GDM;若概率值小于阈值,则预测受试者不患有糖尿病,即为非GDM。将5个预测模型结果进行比较,查看结果是否一致。其中,预测模型5的准确度最高。
预测模型的预测结果能够为医生对受试者的后续诊断/治疗提供准确参考。例如,若预测模型的预测结果为孕妇患有GDM,则可以对孕妇进行进一步的OGTT检测。之后,医生可以将检测结果与孕妇临床信息结合分析,可对孕妇今后生活方式给予进一步指导或提供药物治疗。
上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅仅作为示例,而并不构成对本说明书的限定。虽然此处并没有明确说明,本领域技术人员可能会对本说明书进行各种修改、改进和修正。该类修改、改进和修正在本说明书中被建议,所以该类修改、改进、修正仍属于本说明书示范实施例的精神和范围。
同时,本说明书使用了特定词语来描述本说明书的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本说明书至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外,本说明书的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。
一些实施例中使用了描述成分、属性数量的数字,应当理解的是,此类用于实施例描述的数字,在一些示例中使用了修饰词“大约”、“近似”或“大体上”来修饰。除非另外说明,“大约”、“近似”或“大体上”表明所述数字允许有±20%的变化。相应地,在一些实施例中,说明书和权利要求中使用的数值参数均为近似值,该近似值根据个别实施例所需特点可以发生改变。在一些实施例中,数值参数应考虑规定的有效数位并采用一般位数保留的方法。尽管本说明书一些实施例中用于确认其范围广度的数值域和参数为近似值,在具体实施例中,此类数值的设定在可行范围内尽可能精确。
针对本说明书引用的每个专利、专利申请、专利申请公开物和其他材料,如文章、书籍、说明书、出版物、文档等,特此将其全部内容并入本说明书作为参考。与本说明书内容不一致或产生冲突的申请历史文件除外,对本说明书权利要求最广范围有限制的文件(当前或之后附加于本说明书中的)也除外。需要说明的是,如果本说明书附属材料中的描述、定义、和/或术语的使用与本说明书所述内容有不一致或冲突的地方,以本说明书的描述、定义和/或术语的使用为准。
最后,应当理解的是,本说明书中所述实施例仅用以说明本说明书实施例的原则。其他的变形也可能属于本说明书的范围。因此,作为示例而非限制,本说明书实施例的替代配置可视为与本说明书的教导一致。相应地,本说明书的实施例不仅限于本说明书明确介绍和描述的实施例。
Claims (6)
1.标记物在制备用于预测受试者患有妊娠期糖尿病的可能性的试剂、组合物或试剂盒中的应用,其特征在于,所述预测包括:
基于来自所述受试者的样品,确定所述标记物的浓度,其中,所述标记物选自以下组合中的一种:
(ⅰ)由1,5-脱水葡萄糖醇和非对称性二甲基精氨酸组成;
(ⅱ)由胱氨酸、乙醇胺、牛磺酸、L-亮氨酸、L-色氨酸和羟赖氨酸组成;以及
(ⅲ)由α-羟基丁酸、1,5-脱水葡萄糖醇、胱氨酸、乙醇胺、牛磺酸和L-天冬氨酸组成;
以及基于所述标记物的浓度,使用与所述标记物相关的预测模型预测所述受试者患有妊娠期糖尿病的可能性;
其中:
标记物(ⅰ)相关的预测模型由以下公式表示:
标记物(ⅱ)相关的预测模型由以下公式表示:
标记物(ⅲ)相关的预测模型由以下公式表示:
其中,p表示所述受试者为妊娠期糖尿病的概率值,表示对数优势比,1,5-脱水葡萄糖醇、非对称性二甲基精氨酸、胱氨酸、乙醇胺、L-亮氨酸、L-色氨酸、羟赖氨酸、牛磺酸、α-羟基丁酸和L-天冬氨酸分别表示1,5-脱水葡萄糖醇、非对称性二甲基精氨酸、胱氨酸、乙醇胺、L-亮氨酸、L-色氨酸、羟赖氨酸、牛磺酸、α-羟基丁酸和L-天冬氨酸的浓度,单位为μmol/L。
2.根据权利要求1所述的应用,其中,基于所述标记物的浓度,使用与所述标记物相关的预测模型预测所述受试者患有妊娠期糖尿病的可能性包括:
所述标记物的浓度作为所述预测模型的输入,所述预测模型输出预测值;以及
通过比较所述预测值和阈值,预测所述受试者患有妊娠期糖尿病的可能性。
3.根据权利要求2所述的应用,其中,通过比较所述预测值和阈值预测所述受试者患有妊娠期糖尿病的可能性包括:
若所述预测值大于或等于所述阈值,预测所述受试者患有妊娠期糖尿病的可能性较高;或
若所述预测值小于所述阈值,预测所述受试者患有妊娠期糖尿病的可能性较低。
4.根据权利要求1所述的应用,其中,所述预测模型还与所述受试者的年龄和BMI相关。
5.根据权利要求1所述的应用,其中,所述预测模型在验证集中AUC值均大于0.7,在验证集中的敏感度和特异度均大于65%。
6.一种用于预测受试者患有妊娠期糖尿病的可能性的***,包括:
获取模块,用于获取受试者样品的标记物的浓度,其中,所述标记物选自以下组合中的一种:
(ⅰ)由1,5-脱水葡萄糖醇和非对称性二甲基精氨酸组成;
(ⅱ)由胱氨酸、乙醇胺、牛磺酸、L-亮氨酸、L-色氨酸和羟赖氨酸组成;以及
(ⅲ)由α-羟基丁酸、1,5-脱水葡萄糖醇、胱氨酸、乙醇胺、牛磺酸和L-天冬氨酸组成;
训练模块,用于利用训练集训练初始模型获得预测模型,所述预测模型与所述标记物相关;以及
预测模块,用于基于所述标记物的浓度,使用预测模型预测所述受试者患有妊娠期糖尿病的可能性;
其中:
标记物(ⅰ)相关的预测模型由以下公式表示:
标记物(ⅱ)相关的预测模型由以下公式表示:
标记物(ⅲ)相关的预测模型由以下公式表示:
其中,p表示所述受试者为妊娠期糖尿病的概率值,表示对数优势比,1,5-脱水葡萄糖醇、非对称性二甲基精氨酸、胱氨酸、乙醇胺、L-亮氨酸、L-色氨酸、羟赖氨酸、牛磺酸、α-羟基丁酸和L-天冬氨酸分别表示1,5-脱水葡萄糖醇、非对称性二甲基精氨酸、胱氨酸、乙醇胺、L-亮氨酸、L-色氨酸、羟赖氨酸、牛磺酸、α-羟基丁酸和L-天冬氨酸的浓度,单位为μmol/L。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311778563.9A CN117741023A (zh) | 2021-11-30 | 2021-11-30 | 预测受试者患有糖尿病的可能性的标记物及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2021/134625 WO2023097510A1 (zh) | 2021-11-30 | 2021-11-30 | 预测受试者患有糖尿病的可能性的标记物及其应用 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311778563.9A Division CN117741023A (zh) | 2021-11-30 | 2021-11-30 | 预测受试者患有糖尿病的可能性的标记物及其应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115023608A CN115023608A (zh) | 2022-09-06 |
CN115023608B true CN115023608B (zh) | 2024-01-19 |
Family
ID=83064673
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311778563.9A Pending CN117741023A (zh) | 2021-11-30 | 2021-11-30 | 预测受试者患有糖尿病的可能性的标记物及其应用 |
CN202180010184.8A Active CN115023608B (zh) | 2021-11-30 | 2021-11-30 | 预测受试者患有糖尿病的可能性的标记物及其应用 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311778563.9A Pending CN117741023A (zh) | 2021-11-30 | 2021-11-30 | 预测受试者患有糖尿病的可能性的标记物及其应用 |
Country Status (3)
Country | Link |
---|---|
US (2) | US20230258648A1 (zh) |
CN (2) | CN117741023A (zh) |
WO (1) | WO2023097510A1 (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1837657A1 (en) * | 2006-03-24 | 2007-09-26 | Metanomics GmbH | Means and method for predicting or diagnosing diabetes |
CN102901790A (zh) * | 2012-09-21 | 2013-01-30 | 中国人民解放军***南京总医院 | 糖尿病肾病早期诊断的尿液代谢标志物测定方法 |
WO2015109116A1 (en) * | 2014-01-15 | 2015-07-23 | The Regents Of The University Of California | Metabolic screening for gestational diabetes |
CN106093430A (zh) * | 2016-06-06 | 2016-11-09 | 上海阿趣生物科技有限公司 | 可用于检测糖尿病的标志物及其用途 |
CN108508055A (zh) * | 2018-03-27 | 2018-09-07 | 广西医科大学 | 一种基于代谢组学的广西瑶山甜茶抗糖尿病潜在标志物代谢通路及研究方法 |
JP2019027885A (ja) * | 2017-07-28 | 2019-02-21 | 国立大学法人千葉大学 | 妊娠糖尿病の発症リスクの診断用バイオマーカー |
WO2020105562A1 (en) * | 2018-11-20 | 2020-05-28 | Okinawa Institute Of Science And Technology School Corporation | Method for evaluating risk of type 2 diabetes using blood metabolites as an index |
CN112903885A (zh) * | 2019-12-03 | 2021-06-04 | 中国科学院大连化学物理研究所 | 一种筛查糖尿病的联合型代谢标志物的应用及其试剂盒 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2291912A1 (en) * | 1998-12-11 | 2000-06-11 | Kyowa Medex Co., Ltd. | Method and reagent for quantitative determination of 1,5-anhydroglucitol |
MX341954B (es) * | 2007-07-17 | 2016-09-08 | Metabolon Inc | Biomarcadores para prediabetes, enfermedades cardiovasculares y otros transtornos relacionados con sindrome metabolico, y metodos de uso de los mismos. |
EP2943789A1 (en) * | 2013-01-11 | 2015-11-18 | Health Diagnostic Laboratory, Inc. | Method of detection of occult pancreatic beta cell dysfunction in normoglycemic patients |
WO2016081534A1 (en) * | 2014-11-19 | 2016-05-26 | Metabolon, Inc. | Biomarkers for fatty liver disease and methods using the same |
US10884005B2 (en) * | 2015-10-18 | 2021-01-05 | Wei Jia | Diabetes-related biomarkers and treatment of diabetes-related conditions |
CA3024000A1 (en) * | 2016-05-16 | 2017-11-23 | The Governing Council Of The University Of Toronto | Method for predicting the development of type 2 diabetes |
CN109709228B (zh) * | 2019-01-14 | 2022-06-14 | 上海市内分泌代谢病研究所 | 脂质联合标志物在制备诊断糖尿病的检测试剂或检测物的用途 |
-
2021
- 2021-11-30 CN CN202311778563.9A patent/CN117741023A/zh active Pending
- 2021-11-30 CN CN202180010184.8A patent/CN115023608B/zh active Active
- 2021-11-30 WO PCT/CN2021/134625 patent/WO2023097510A1/zh unknown
-
2023
- 2023-04-16 US US18/301,249 patent/US20230258648A1/en active Pending
- 2023-07-20 US US18/356,209 patent/US20230358754A1/en active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1837657A1 (en) * | 2006-03-24 | 2007-09-26 | Metanomics GmbH | Means and method for predicting or diagnosing diabetes |
CN102901790A (zh) * | 2012-09-21 | 2013-01-30 | 中国人民解放军***南京总医院 | 糖尿病肾病早期诊断的尿液代谢标志物测定方法 |
WO2015109116A1 (en) * | 2014-01-15 | 2015-07-23 | The Regents Of The University Of California | Metabolic screening for gestational diabetes |
CN106093430A (zh) * | 2016-06-06 | 2016-11-09 | 上海阿趣生物科技有限公司 | 可用于检测糖尿病的标志物及其用途 |
JP2019027885A (ja) * | 2017-07-28 | 2019-02-21 | 国立大学法人千葉大学 | 妊娠糖尿病の発症リスクの診断用バイオマーカー |
CN108508055A (zh) * | 2018-03-27 | 2018-09-07 | 广西医科大学 | 一种基于代谢组学的广西瑶山甜茶抗糖尿病潜在标志物代谢通路及研究方法 |
WO2020105562A1 (en) * | 2018-11-20 | 2020-05-28 | Okinawa Institute Of Science And Technology School Corporation | Method for evaluating risk of type 2 diabetes using blood metabolites as an index |
CN112903885A (zh) * | 2019-12-03 | 2021-06-04 | 中国科学院大连化学物理研究所 | 一种筛查糖尿病的联合型代谢标志物的应用及其试剂盒 |
Non-Patent Citations (2)
Title |
---|
妊娠期糖尿患者的尿液代谢组学研究;陈丹妮 等;临床和实验医学杂志;第16卷(第10期);第973-977页 * |
妊娠期糖尿病非对称性二甲基精氨酸水平的检测及其临床意义;李盛 等;湖南师范大学学报(医学版);第12卷(第04期);第57-59页 * |
Also Published As
Publication number | Publication date |
---|---|
CN117741023A (zh) | 2024-03-22 |
US20230258648A1 (en) | 2023-08-17 |
CN115023608A (zh) | 2022-09-06 |
US20230358754A1 (en) | 2023-11-09 |
WO2023097510A1 (zh) | 2023-06-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Rist et al. | Metabolite patterns predicting sex and age in participants of the Karlsruhe Metabolomics and Nutrition (KarMeN) study | |
US11268966B2 (en) | Biomarkers of autism spectrum disorder | |
US20100129919A1 (en) | Methods and biomarkers for diagnosing and monitoring psychotic disorders | |
US20140297195A1 (en) | Method and Use of Metabolites for the Diagnosis of Inflammatory Brain Injury in Preterm Born Infants | |
RoyChoudhury et al. | Serum metabolomics of Indian women with polycystic ovary syndrome using 1 H NMR coupled with a pattern recognition approach | |
US20150090010A1 (en) | Method for diagnosing heart failure | |
CA2608988A1 (en) | Biomarkers for psychotic disorders | |
Sánchez-Illana et al. | Small molecule biomarkers for neonatal hypoxic ischemic encephalopathy | |
Primiano et al. | A specific urinary amino acid profile characterizes people with kidney stones | |
Goncharov et al. | Metabolomics: on the way to an integration of biochemistry, analytical chemistry, and informatics | |
EP3401683A1 (en) | Diagnosing metabolic disease by the use of a biomarker | |
CN115023608B (zh) | 预测受试者患有糖尿病的可能性的标记物及其应用 | |
EP3746796A1 (en) | Diagnosis and treatment of autism spectrum disorders based on amine containing metabotypes | |
US11923082B2 (en) | Method and system for rapid prediction offast blood glucose level in pregnant subjects | |
CN114166977B (zh) | 预测妊娠个体血糖值的*** | |
US8206986B2 (en) | Methods for detecting Alzheimer's disease | |
Saini et al. | Global metabolomic profiling reveals hepatic biosignatures that reflect the unique metabolic needs of late‐term mother and fetus | |
WO2021072351A1 (en) | Diagnosis and treatment of autism spectrum disorders using altered ratios of metabolite concentrations | |
Chen et al. | Metabonomics and diabetes mellitus | |
EP3963323A1 (en) | Diagnosis and treatment of autism spectrum disorders associated with altered metabolic pathways | |
KR101847403B1 (ko) | 비타민 a 관련 대사체를 이용한 당뇨병의 진단 방법 및 키트 | |
WO2015183917A2 (en) | Metabolic biomarkers for memory loss | |
Muresan et al. | Circulating amino acids as fingerprints of visceral adipose tissue independent of insulin resistance: a targeted metabolomic research in women | |
Primiano et al. | Research Article A Specific Urinary Amino Acid Profile Characterizes People with Kidney Stones | |
장혜린 | Identification of biomarkers in food allergy using metabolomics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40085329 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |