CN116469554A - 一种2型糖尿病发病综合风险预测模型的构建方法和*** - Google Patents

一种2型糖尿病发病综合风险预测模型的构建方法和*** Download PDF

Info

Publication number
CN116469554A
CN116469554A CN202310274882.XA CN202310274882A CN116469554A CN 116469554 A CN116469554 A CN 116469554A CN 202310274882 A CN202310274882 A CN 202310274882A CN 116469554 A CN116469554 A CN 116469554A
Authority
CN
China
Prior art keywords
type
diabetes
risk
model
genetic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310274882.XA
Other languages
English (en)
Inventor
魏凤江
叶群
李卫东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Medical University
Original Assignee
Tianjin Medical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Medical University filed Critical Tianjin Medical University
Priority to CN202310274882.XA priority Critical patent/CN116469554A/zh
Publication of CN116469554A publication Critical patent/CN116469554A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/40Population genetics; Linkage disequilibrium
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Public Health (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Genetics & Genomics (AREA)
  • Data Mining & Analysis (AREA)
  • Analytical Chemistry (AREA)
  • Epidemiology (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical & Material Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Ecology (AREA)
  • Primary Health Care (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Physiology (AREA)
  • Artificial Intelligence (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了一种2型糖尿病发病综合风险预测模型的构建方法和***,方法包括获取2型糖尿病发病的独立风险因子,计算非遗传风险评分,从而构建2型糖尿病非遗传因素风险预测模型;对2型糖尿病进行全基因组关联分析,获取2型糖尿病关联性SNPs位点,计算遗传风险评分,从而构建2型糖尿病遗传因素风险预测模型;通过2型糖尿病非遗传因素风险预测模型以及2型糖尿病遗传因素风险预测模型的和构建2型糖尿病发病综合风险预测模型。本发明提高了2型糖尿病发病预测效率以及准确度,并且简单易测,利于模型的推广应用。

Description

一种2型糖尿病发病综合风险预测模型的构建方法和***
技术领域
本发明属于疾病的遗传风险评估技术领域,尤其是涉及一种2型糖尿病发病综合风险预测模型的构建方法和***。
背景技术
2型糖尿病(Type of 2 diabetes mellitus,T2MD)是一组通过异常高的血糖水平诊断的临床和基因异质性疾病,是全球最常见和增长最快的疾病之一,预计到2045年将影响6.93亿成年人,比2017年增加50%。由于2型糖尿病的发病率以及其并发症的致残率不断攀升,全球许多国家和地区都有展开对2型糖尿病的流行病学研究,对其发病危险因素的探究和遗传易感性位点的研究逐步深入。现有技术中并没有针对某特定地区或人群展开2型糖尿病的流行病学研究,无法建立具有普遍适用性的疾病预测模型。
发明内容
有鉴于此,本发明提出了一种2型糖尿病发病综合风险预测模型的构建方法和***,提高了2型糖尿病发病预测效率以及准确度,并且简单易测,利于模型的推广应用。
为达到上述目的,本发明的技术方案是这样实现的:
一种2型糖尿病发病综合风险预测模型的构建方法:包括
步骤1:获取2型糖尿病发病的独立风险因子,计算非遗传风险评分,从而构建2型糖尿病非遗传因素风险预测模型;
步骤2:对2型糖尿病进行全基因组关联分析,获取2型糖尿病关联性SNPs位点,计算遗传风险评分,从而构建2型糖尿病遗传因素风险预测模型;
步骤3:通过2型糖尿病非遗传因素风险预测模型以及2型糖尿病遗传因素风险预测模型的和构建2型糖尿病发病综合风险预测模型。
进一步的,所述步骤1包括,
基于实验室建立的慢性病队列,采用多因素Cox比例回归模型获取2型糖尿病发病的独立风险因子;
基于2型糖尿病发病的独立风险因子计算非遗传风险评分NGRS;
基于非遗传风险评分NGRS构建2型糖尿病非遗传因素风险预测模型,模型为
其中,βk为第k个相应的非遗传危险因素的权重;Sk为第k个非遗传危险因素的状态,如果个体有危险因素,则值为1,如果个体无危险因素,则值为0;α是logistic回归的常量。
进一步的,所述实验室建立的慢性病队列共纳入297人进行2型糖尿病随访,年龄分布65.61±13.55岁,平均随访时间10.4年,共98人发生2型糖尿病。
进一步的,所述采用多因素Cox比例回归模型获取2型糖尿病发病的独立风险因子包括高密度脂蛋白HDL、尿酸UA、和稳态模型胰岛素抵抗指数HOMA-IR。
进一步的,根据稳态模型胰岛素抵抗指数HOMA-IR正常高值、尿酸UA正常高值和高密度脂蛋白HDL正常高值再加上血糖因素FPG>5mmol/L构建非遗传风险评分NGRS。
进一步的,所述步骤2包括
对2型糖尿病进行病例-对照阈值性状的全基因组关联分析和对空腹血糖FPG、糖化血红蛋白HbA1c、空腹胰岛素Fins、稳态模型胰岛素抵抗指数HOMA-IR、定量胰岛素敏感性指数QUICKI这5个数量性状的全基因组关联分析,筛选与2型糖尿病相关SNPs位点;
根据Logistic回归最优筛选最终纳入13个SNP位点构建遗传风险评分GRS;
基于遗传风险评分GRS构建2型糖尿病遗传因素风险预测模型,模型为
其中,是第i个SNP位点的权重,/>是第i个SNP位点上等位基因的数量,赋值为0,1,2。
进一步的,所述根据Logistic回归最优筛选最终纳入13个SNP位点为:rs_1_12637399,rs76616810,rs10164462,rs_kgp9798346,rs11931598,rs62375492,rs79535454,rs80314016,rs16925187,rs1547287,rs4755984,rs1427793,rs_17_9691529。
进一步的,所述方法还包括根据2型糖尿病发病综合风险预测模型计算出每个人的风险评分总分,然后将风险评分总分放入具有因变量的二元逻辑回归模型中,计算模型的ROC曲线下的面积,从而判断模型的诊断价值。
本发明还提供一种2型糖尿病发病综合风险预测模型的构建***,包括
2型糖尿病非遗传因素风险预测模型构建模块,用于获取2型糖尿病发病的独立风险因子,计算非遗传风险评分,从而构建2型糖尿病非遗传因素风险预测模型;
2型糖尿病遗传因素风险预测模型构建模块,用于对2型糖尿病进行全基因组关联分析,获取2型糖尿病关联性SNPs位点,计算遗传风险评分,从而构建2型糖尿病遗传因素风险预测模型;
2型糖尿病发病综合风险预测模型构建模块,用于通过2型糖尿病非遗传因素风险预测模型以及2型糖尿病遗传因素风险预测模型的和构建2型糖尿病发病综合风险预测模型。
相对于现有技术,本发明所述的一种2型糖尿病发病综合风险预测模型的构建方法和***具有以下优势:
1、本发明进行了前瞻性的队列研究,对疾病结局的获取是通过多年的随访获得的,与现有方法相比可以更好的控制混杂因素,结果资料更加的真实可靠;并且以往在中国汉族人群的纵向队列中发现的与疾病患病相关位点较少,本研究通过GWAS探究中国汉族人群纵向队列中2型糖尿病发病相关的新SNP位点,从而建立风险预测模型;
2、本发明基于队列研究,采用Cox回归的方法,纳入遗传因素和非遗传因素,在队列人群中分别建立遗传因素、非遗传因素、综合因素作为预测因子的2型糖尿病发病综合风险预测模型;分别建立了不同模型,适合不同筛选预测,既可以精准全面的使用综合因素模型进行个体发病概率预测,又可以使用单独非遗传预测模型,节省人力、物力,适合大规模的流行病学筛查;
3、本发明建立的2型糖尿病发病预测模型具有更高的早期预测价值;现有技术中只显示了在预测模型中加入SNPs时AUC增长幅度较小,而本发明建立的模型加入疾病相关的SNPs之后AUC明显改善(0.764 至0.908),本发明的模型中包含的SNPs并不是欧洲人群中常见的报道位点,而是通过我们自己建立的前瞻性队列研究的GWAS分析筛选出来的,在预测模型中加入了胰岛素抵抗表型和中国汉族人群特有的与糖尿病发病相关的SNPs;
4、本发明建立的模型的预测效力、敏感度、特异度同其他国内外模型相比均较高平;本发明纳入SNPs基因组基因评分高,纳入的非遗传因素跟疾病相关性强且简单易测,利于模型的进一步推广应用。
附图说明
构成本发明的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明实施例中的结局是否患2型糖尿病全基因组关联研分析的曼哈顿图;
图2为本发明实施例中的空腹血糖(FPG)全基因组关联分析的曼哈顿图;
图3为本发明实施例中的糖化血红蛋白(HbA1c)全基因组关联分析的曼哈顿图;
图4为本发明实施例中的空腹胰岛素(Fins)全基因组关联分析的曼哈顿图;
图5为本发明实施例中的稳态模型胰岛素抵抗指数(HOMA-IR)全基因组关联分析的曼哈顿图;
图6为本发明实施例中的定量胰岛素敏感性指数(QUICKI)全基因组关联分析的曼哈顿图;
图7为本发明实施例中的不同模型的ROC曲线下的面积(AUC)示意图;
图8为本发明实施例中的采用LASSO回归10倍交叉验证缩减自变量的结果示意图;
图9为本发明的方法流程示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”等的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以通过具体情况理解上述术语在本发明中的具体含义。
下面将参考附图并结合实施例来详细说明本发明。
如图9所示,本发明基于“实验室建立的慢性病队列”,研究对象选取2006-2010年间首次参加体检不患2型糖尿病,无重要信息缺失,且有血液样本者作为基线人群,共纳入297人进行2型糖尿病随访,年龄分布65.61±13.55岁,平均随访时间10.4年,截止2019年,98人患2型糖尿病。2型糖尿病累计发病率32.9%(其中男性27.3%,女性为5.7%)。
基于该队列,本发明提供了一种2型糖尿病发病综合风险预测模型的构建方法,包括
步骤1:获取2型糖尿病发病的独立风险因子,计算非遗传风险评分,从而构建2型糖尿病非遗传因素风险预测模型;
步骤2:对2型糖尿病进行全基因组关联分析,获取2型糖尿病关联性SNPs位点,计算遗传风险评分,从而构建2型糖尿病遗传因素风险预测模型;
步骤3:通过2型糖尿病非遗传因素风险预测模型以及2型糖尿病遗传因素风险预测模型的和构建2型糖尿病发病综合风险预测模型。
在一个实施例中,步骤1采用多因素Cox比例回归模型分析2型糖尿病发病的独立风险因子,纳入独立风险因子计算非遗传风险评分(NGRS),进而构建2型糖尿病非遗传因素风险预测模型。
多因素Cox比例回归模型分析结果显示:高密度脂蛋白(HDL),尿酸(UA),稳态模型胰岛素抵抗指数(HOMA-IR)为2型糖尿病发病的独立预测因子,具体见表1,表1为2型糖尿病多因素Cox回归分析。
表1
然后根据HOMA-IR正常高值,UA正常高值和HDL正常高值构建非遗传风险评分,从而建立2型糖尿病非遗传预测模型,模型为
其中,βk为第k个相应的非遗传危险因素的权重;Sk为第 k个非遗传危险因素的状态,如果个体的危险因素测量值大于HOMA-IR正常高值、UA正常高值和HDL正常高值,则将Sk值赋为1,如果个体的危险因素测量值不大于HOMA-IR正常高值、UA正常高值和HDL正常高值,则将Sk值赋为0;α是logistic回归的常量。
2型糖尿病非遗传预测模型的ROC曲线下面积(AUC)为0.678(95%CI:0.614-0.742),灵敏度与特异度分别为0.52与0.764;
预测方程为
Logit p1=-0.504+(0.166×S1+0.004×S2+(-0.842×S3),
S1=HOMA-IR正常高值(0:<2.94;1:≥2.94),S2=UA正常高值(0:<383μmol/L;1:≥383μmol/L),S3=HDL正常高值(0:<1.57mmol/L;1:≥1.57mmol/L)。在上述优选出的传统风险基础上再加入血糖因素,空腹血糖四分位数(P75),空腹血糖>5.0mmol/L赋值为“1”,空腹血糖≤5.0mmol/L赋值为“0”,记录为NGRS3糖,其ROC曲线下面积(AUC)为0.764(95%CI:0.709-0.818),灵敏度与特异度分别为0.837与0.608,加上空腹血糖后的预测方程为:
Logit P1=-2.323+(0.166×S1+0.004×S2+(-0.842)×S3+1.970 ×S4。
具体见图7,表4。
在一个实施例中,步骤2中,用Infinium Asian Screening Array-24 v1.0芯片对本研究参与者进行了约60万个SNPs位点的基因分型检测,然后将基因型数据与队列中记录的阈值性状表型,质量性状表型进行全基因组关联分析,从而筛选出我们这个人群中与2型糖尿病相关的SNPs位点,然后再将这些位点纳入风险预测模型,计算风险评分。具体为以98例2型糖尿病患者和199例血糖正常为对照,对2型糖尿病进行病例-对照阈值性状的全基因组关联分析和对空腹血糖(FPG),糖化血红蛋白(HbA1c),空腹胰岛素(Fins),稳态模型胰岛素抵抗指数(HOMA-IR),定量胰岛素敏感性指数(QUICKI)5个数量性状的全基因组关联分析。结果发现尚未有SNPs达到全基因组显著性阈值(P<5×10-8),我们选择P<1×10-4且重复出现的,共26个SNP作为候选位点,如图1-6所示,表2所示,表2为与糖代谢相关指标的全基因组关联分析。图1-6中,采用Manhattan plot(曼哈顿图),把GWAS分析之后所有SNP位点的p-value在整个基因组上从左到右依次画出来。为了可以更加直观地表达结果,将p-value转换为-log10(p-value)。这样基因位点-log10(p-value)在Y轴的高度就对应了与表型性状或者疾病的关联程度,关联度越强(即,p-value越低)就越高。
表2
根据Logistic回归最优筛选最终纳入13个SNP构建遗传风险评分(GRS13)建立2型糖尿病遗传因素风险预测模型,如表3,图8所示,表3为SNP位点与2型糖尿病的Logistic回归分析结果,模型为
其中,是第i个SNP位点的权重,/>是第i个SNP位点上等位基因的数量,赋值为0,1,2。
图8是用LASSO回归缩减自变量产生的。我们筛选出26个SNP,最后纳入13个SNP进去模型是为了用更少的自变量达到更好的预测效果。
表3
注:Genotype中粗体字母是效应等位基因,染色体(CHR)和碱基对位置(Base-pairPosition)参照GRCh37基因组参考序列。
2型糖尿病遗传因素风险预测模型的ROC曲线下面积(AUC)为0.892(95%CI:0.853-0.932),灵敏度与特异度分别为0.784与0.896;预测方程为
Logit P2=-6.597+(0.618×rs_1_12637399Gi+1.497×rs76616810Gi+1.494×rs10164462Gi+0.869×rs_kgp9798346Gi+0.764×rs11931598Gi+0.47×rs62375492Gi+1.602×rs79535454Gi+0.844×rs80314016Gi+1.03×rs16925187Gi+0.746×rs1547287Gi+0.83×rs4755984Gi+1.385×rs1427793Gi+0.962×rs_17_9691529Gi),具体见图7,表4,表4为2型糖尿病相关NGRS,GRS及综合预测模型预测效力比较。
表4
另一个实施例中,2型糖尿病发病综合风险预测模型是2型糖尿病非遗传因素风险预测模型以及2型糖尿病遗传因素风险预测模型的算数和。预测方程为
Logit P=-7.156+(0.618×rs_1_12637399Gi+
1.497×rs76616810Gi+1.494×rs10164462Gi+0.869×rs_kgp9798346Gi+0.764×rs11931598Gi+0.47×rs62375492Gi+1.602×rs79535454Gi+0.844×rs80314016Gi+1.03×rs16925187Gi+0.746×rs1547287Gi+0.83×rs4755984Gi+1.385×rs1427793Gi+0.962×rs_17_9691529Gi+0.166×S1+0.004×S2+(-0.842)×S3+1.970×S4)。2型糖尿病综合预测模型G13NG3的预测能力高于非遗传或遗传预测模型:AUC为0.898(95%CI 0.860–0.936),敏感性为0.763,特异性为0.901。加入空腹血糖因素的2型糖尿病综合预测模型G13NG3糖,其AUC为0.908(95%CI 0.872–0.944),敏感性为0.845,特异性为0.839。具体见图7,表4。
参照图7,GRS13是用13个SNP建立的遗传风险预测模型,NGRS3是用HOMA-IR,UA,HDL这三个指标建立的非遗传风险预测模型,NGRS3糖是在HOMA-IR,UA,HDL这三个指标基础上再加上FPG>5mmol/L建立的非遗传风险预测模型,G13NG3和G13NG3糖是综合风险预测模型。
我们根据综合风险预测模型计算出了每个人的风险评分总分,然后将总风险评分放入具有因变量的二元逻辑回归模型中,统计出每个模型的ROC曲线下的面积(AUC)。通过分别计算各个模型的ROC曲线下的面积(AUC)进行比较,哪一种模型的AUC最大,则哪一种模型的诊断价值最佳。最后得出,相较于单独的遗传或者非遗传因素风险预测模型,综合风险预测模型G13NG3糖的诊断效果是最好的,其AUC值为0.908,灵敏度为84.5%,特异度为83.9%。
本发明还提供一种2型糖尿病发病综合风险预测模型的构建***,包括
2型糖尿病非遗传因素风险预测模型构建模块,用于获取2型糖尿病发病的独立风险因子,计算非遗传风险评分,从而构建2型糖尿病非遗传因素风险预测模型;
2型糖尿病遗传因素风险预测模型构建模块,用于对2型糖尿病进行全基因组关联分析,获取2型糖尿病关联性SNPs位点,计算遗传风险评分,从而构建2型糖尿病遗传因素风险预测模型;
2型糖尿病发病综合风险预测模型构建模块,用于通过2型糖尿病非遗传因素风险预测模型以及2型糖尿病遗传因素风险预测模型的和构建2型糖尿病发病综合风险预测模型。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种2型糖尿病发病综合风险预测模型的构建方法,其特征在于:包括
步骤1:获取2型糖尿病发病的独立风险因子,计算非遗传风险评分,从而构建2型糖尿病非遗传因素风险预测模型;
步骤2:对2型糖尿病进行全基因组关联分析,获取2型糖尿病关联性SNPs位点,计算遗传风险评分,从而构建2型糖尿病遗传因素风险预测模型;
步骤3:通过2型糖尿病非遗传因素风险预测模型以及2型糖尿病遗传因素风险预测模型的和构建2型糖尿病发病综合风险预测模型。
2.根据权利要求1所述的一种2型糖尿病发病综合风险预测模型的构建方法,其特征在于:所述步骤1包括,
基于实验室建立的慢性病队列,采用多因素Cox比例回归模型获取2型糖尿病发病的独立风险因子;
基于2型糖尿病发病的独立风险因子计算非遗传风险评分NGRS;
基于非遗传风险评分NGRS构建2型糖尿病非遗传因素风险预测模型,模型为
其中,βk为第k个相应的非遗传危险因素的权重;Sk为第k个非遗传危险因素的状态,如果个体有危险因素,则值为1,如果个体无危险因素,则值为0;α是logistic回归的常量。
3.根据权利要求2所述的一种2型糖尿病发病综合风险预测模型的构建方法,其特征在于:所述实验室建立的慢性病队列共纳入297人进行2型糖尿病随访,年龄分布65.61±13.55岁,平均随访时间10.4年,共98人发生2型糖尿病。
4.根据权利要求2所述的一种2型糖尿病发病综合风险预测模型的构建方法,其特征在于:所述采用多因素Cox比例回归模型获取2型糖尿病发病的独立风险因子包括高密度脂蛋白HDL、尿酸UA、和稳态模型胰岛素抵抗指数HOMA-IR。
5.根据权利要求4所述的一种2型糖尿病发病综合风险预测模型的构建方法,其特征在于:根据稳态模型胰岛素抵抗指数HOMA-IR 正常高值、尿酸UA正常高值和高密度脂蛋白HDL正常高值再加上血糖因素FPG>5mmol/L构建非遗传风险评分NGRS。
6.根据权利要求1所述的一种2型糖尿病发病综合风险预测模型的构建方法,其特征在于:所述步骤2包括
对2型糖尿病进行病例-对照阈值性状的全基因组关联分析和对空腹血糖FPG、糖化血红蛋白HbA1c、空腹胰岛素Fins、稳态模型胰岛素抵抗指数HOMA-IR、定量胰岛素敏感性指数QUICKI这5个数量性状的全基因组关联分析,筛选与2型糖尿病相关SNPs位点;
根据Logistic回归最优筛选最终纳入13个SNP位点构建遗传风险评分GRS;
基于遗传风险评分GRS构建2型糖尿病遗传因素风险预测模型,模型为
其中,是第i个SNP位点的权重,/>是第i个SNP位点上等位基因的数量,赋值为0,1,2。
7.根据权利要求6所述的一种2型糖尿病发病综合风险预测模型的构建方法,其特征在于:所述根据Logistic回归最优筛选最终纳入13个SNP位点为:rs_1_12637399,rs76616810,rs10164462,rs_kgp9798346,rs11931598,rs62375492,rs79535454,rs80314016,rs16925187,rs1547287,rs4755984,rs1427793,rs_17_9691529。
8.根据权利要求1所述的一种2型糖尿病发病综合风险预测模型的构建方法,其特征在于:所述方法还包括根据2型糖尿病发病综合风险预测模型计算出每个人的风险评分总分,然后将风险评分总分放入具有因变量的二元逻辑回归模型中,计算模型的ROC曲线下的面积,从而判断模型的诊断价值。
9.一种2型糖尿病发病综合风险预测模型的构建***,其特征在于:包括
2型糖尿病非遗传因素风险预测模型构建模块,用于获取2型糖尿病发病的独立风险因子,计算非遗传风险评分,从而构建2型糖尿病非遗传因素风险预测模型;
2型糖尿病遗传因素风险预测模型构建模块,用于对2型糖尿病进行全基因组关联分析,获取2型糖尿病关联性SNPs位点,计算遗传风险评分,从而构建2型糖尿病遗传因素风险预测模型;
2型糖尿病发病综合风险预测模型构建模块,用于通过2型糖尿病非遗传因素风险预测模型以及2型糖尿病遗传因素风险预测模型的和构建2型糖尿病发病综合风险预测模型。
CN202310274882.XA 2023-03-21 2023-03-21 一种2型糖尿病发病综合风险预测模型的构建方法和*** Pending CN116469554A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310274882.XA CN116469554A (zh) 2023-03-21 2023-03-21 一种2型糖尿病发病综合风险预测模型的构建方法和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310274882.XA CN116469554A (zh) 2023-03-21 2023-03-21 一种2型糖尿病发病综合风险预测模型的构建方法和***

Publications (1)

Publication Number Publication Date
CN116469554A true CN116469554A (zh) 2023-07-21

Family

ID=87172558

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310274882.XA Pending CN116469554A (zh) 2023-03-21 2023-03-21 一种2型糖尿病发病综合风险预测模型的构建方法和***

Country Status (1)

Country Link
CN (1) CN116469554A (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113192637A (zh) * 2021-04-20 2021-07-30 山东大学齐鲁医院 个体化定量评估进展为2型糖尿病的风险预测方法及装置
CN113593630A (zh) * 2021-08-23 2021-11-02 北京果壳生物科技有限公司 一种家庭冠心病患病风险评估及其风险因素鉴定***

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113192637A (zh) * 2021-04-20 2021-07-30 山东大学齐鲁医院 个体化定量评估进展为2型糖尿病的风险预测方法及装置
CN113593630A (zh) * 2021-08-23 2021-11-02 北京果壳生物科技有限公司 一种家庭冠心病患病风险评估及其风险因素鉴定***

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
张愿: "慢性肾病的危险因素分析及发病风险预测模型建立", 《中国优秀硕士学位论文全文数据库医药卫生科技辑》, no. 2, 15 February 2020 (2020-02-15), pages 1 *
李金金: "天津市慢性病队列研究及风险预测模型的建立", 《中国博士学位论文全文数据库医药卫生科技辑》, no. 1, 15 January 2019 (2019-01-15), pages 053 - 7 *

Similar Documents

Publication Publication Date Title
Talmud et al. Sixty-five common genetic variants and prediction of type 2 diabetes
Tester et al. Genetic testing for potentially lethal, highly treatable inherited cardiomyopathies/channelopathies in clinical practice
Meyre et al. A genome-wide scan for childhood obesity–associated traits in French families shows significant linkage on chromosome 6q22. 31-q23. 2
CN113012761B (zh) 脑卒中多基因遗传风险综合评分的构建方法与装置及应用
Ergen et al. Angiotensin-I converting enzyme gene polymorphism in Turkish type 2 diabetic patients
CN109585017B (zh) 一种年龄相关性黄斑变性的风险预测算法模型和装置
US20230383349A1 (en) Methods of assessing risk of developing a disease
CN115029431B (zh) 一种2型糖尿病基因检测试剂盒以及2型糖尿病遗传风险评估***
WO2022179637A1 (zh) 脑卒中多基因遗传风险评分及发病风险评估装置及其应用
CN105940116A (zh) 药物引发毒性的风险性筛检方法
CN115011687A (zh) 预测缺血性脑卒中患者不良预后的生物标志物组、试剂盒和***
Zhou et al. Analysis of cell-free fetal DNA in 16,843 pregnant women from a single center in China using targeted sequencing approach
Craigen et al. Exome sequencing of a patient with suspected mitochondrial disease reveals a likely multigenic etiology
CN113506594A (zh) 冠心病的多基因遗传风险综合评分的构建方法与装置及应用
CN116469554A (zh) 一种2型糖尿病发病综合风险预测模型的构建方法和***
Liu et al. A machine learning model based on genetic and traditional cardiovascular risk factors to predict premature coronary artery disease
WO2022247903A1 (zh) 冠心病多基因遗传风险评分及其构建方法与联合临床风险评估应用
Konno et al. Phenotypic differences between electrocardiographic and echocardiographic determination of hypertrophic cardiomyopathy in genetically affected subjects
CN113643753B (zh) 冠心病多基因遗传风险评分及联合临床风险评估应用
CN114236123B (zh) 标志物在预测妊娠期糖尿病风险中的应用
Chikowore et al. Common variants associated with type 2 diabetes in a black South African population of Setswana descent: African populations diverge
CN111681709B (zh) 一种设计高密度基因芯片上基因位点的方法
Barna et al. A multifactor dimensionality reduction model of gene polymorphisms and an environmental interaction analysis in type 2 diabetes mellitus study among Punjabi, a North India population
US8445208B2 (en) Multivariate analysis involving genetic polymorphisms related to mediators of inflammatory response for prediction of outcome of critcally ill patients
Fan et al. Hypertension as a novel link for shared heritability in age at menarche and cardiometabolic traits

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination