CN108257673A - 患病风险值预测方法及电子设备 - Google Patents

患病风险值预测方法及电子设备 Download PDF

Info

Publication number
CN108257673A
CN108257673A CN201810031397.9A CN201810031397A CN108257673A CN 108257673 A CN108257673 A CN 108257673A CN 201810031397 A CN201810031397 A CN 201810031397A CN 108257673 A CN108257673 A CN 108257673A
Authority
CN
China
Prior art keywords
risk
user
value
data
weight
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810031397.9A
Other languages
English (en)
Inventor
钱旦敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nantong University
Original Assignee
Nantong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nantong University filed Critical Nantong University
Priority to CN201810031397.9A priority Critical patent/CN108257673A/zh
Publication of CN108257673A publication Critical patent/CN108257673A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了一种患病风险值预测方法及电子设备,应用于高血压分析。所述患病风险值预测方法包括:采集用户的静态数据和动态数据;对所述静态数据和动态数据进行预处理;通过逻辑学回归以及动态向量机,构建动态预警模型;根据所述预处理后的数据,应用所述动态预警模型对用户进行分类;根据所述用户的分类,计算对应的风险值;所述风险值表示用户患有高血压的风险。该方法采用双数据体系,通过改良Logistic回归和支持向量机,建立用户慢病风险动态预警混合模型,提供精确的患病风险概率值。

Description

患病风险值预测方法及电子设备
技术领域
本发明涉及数学建模技术领域,尤其涉及一种患病风险值预测方法及电子设备。
背景技术
根据国家卫计委官员公布的一份数据称,截至2015年底,全国因慢性病导致的死亡人数达到所有死亡人数的88.38%。慢病已然成为中国首要的健康威胁。不少研究表明,慢性疾病与生活习惯密切相关,因此它又被称为“生活习惯病”或“生活方式病”。因此,采集动态和静态全方位健康数据构建一个慢病风险动态预警模型,是时代发展所趋。
经过大量的文献研究,申请人发现疾病风险预警模型已经引起国内外研究学者的广泛关注。国内构建模型的方法主要有:①Logistic回归(逻辑学回归),例如马立伟等(2015年)建立7种单一的癌症(肺癌,肝癌,胃癌,直肠癌,食管癌,乳腺癌和***)风险预测模型。②Cox回归模型,如依托山东健康管理队列,苏萍等(2017年)构建2型糖尿病预测模型。③人工神经网络,如曹文君等(2015年)构建高血压、糖尿病、冠心病及患任一慢性病患者预测模型。④竞争风险模型,如刘龙等(2016年)分性别构建老年人群心血管疾病的短期(5年)风险评估工具。⑤决策树,如信中等(2014年)建立简易预警模型和筛查工具,只用年龄、BMI和是否有高血压3个因素即可预测个体患糖尿病 (DM)或糖尿病前期(PDM)的危险性。⑥混合模型,依托山东健康管理队列,李吉庆等(2017年)基于Cox回归模型对影响心血管事件发生的因素进行变量筛选,利用部分分布竞争风险模型建立心血管事件预测模型。
国外构建疾病预测模型的方法主要有:①Cox回归模型,如Park S等(2013 年)利用Cox回归模型建立个人肺癌预测模型,据称这是亚洲第一个性能较好的预测模型。②人工神经网络,如Xie N N等(2014年)组合Fisher和Relief F两个特征算法选择危险因素,通过人工神经网络测算肺癌风险值,提出LCRP (肺癌风险预测)算法。③支持向量机(SVM),如Barakat NH等(2010年) 针对糖尿病利用支持向量机(SVM)建立风险预测模型,额外使用解释模块,将SVM的“黑箱”模型转化为SVM诊断(分类)决策的可理解表示。④贝叶斯信息准则,如Chiuve SE1等(2014年)针对心血管疾病使用贝叶斯信息准则开发了一种基于生活方式的20年风险预测模型。⑤Gail模型,如Park B等 (2013年)基于Gail模型开发了一种KoBCRAT(韩国乳腺癌风险评估工具),使用韩国多中心癌症队列(KMCC)和国家癌症中心(NCC)队列验证了KoBCRAT。⑥随机森林算法,如Sun J1等(2014年)利用电子健康记录中的数据来预测患高血压的过渡点,利用信息增益标准转化时间变量,再利用随机森林算法计算转换点预测模型。⑦混合模型,如A Wang等(2015年)将Logistic回归与人工神经网络结合起来选择危险因素和预测慢性病发病风险。
通过前期大样本文献的调研,申请人发现现有文献公开的技术方案中存在如下的不足:①各种经典模型都有其自身特点,单独使用会存在一些弊端。如 Cox回归模型通常只考虑一种状态的时间长短的问题,而疾病是多状态的; Logistic回归边际值太小以致无法确定阈值;人工神经网络易陷入局部极小点; SVM难以选择合适的核函数。②虽然已有文献混合使用两模型,能规避一些模型自有的弊端,但是测算精准度不高。如前文提到的李吉庆等利用部分分布竞争风险模型建立心血管事件预测模型,男性和女性预测模型AUC分别为0.836 和0.886;A Wang等将Logistic回归与人工神经网络结合起来选择危险因素和预测慢性病发病风险,该方法的预测精确度刚超过72%;Lebròn-Aldea D 等(2015年)基于Framingham心脏研究的原始和后代队列的研究数据通过拟合Logistic回归和贝叶斯正则化神经网络建立二型糖尿病的预测模型,然后通过十折交叉验证法评估预测能力,该模型最高AUC仅为0.75。③在已建的疾病预防模型中,指标有所缺失。如吕鸿杰和王重建各自建立的个体原发性高血压发病概率预测模型虽然精确度都高于90%,但是都未将吸烟这一重要指标纳入模型中,而WHO在报告中明确指出,四大慢性病(心血管疾病、癌症、慢性呼吸道疾病、糖尿病)的共同首要危险因素即为吸烟。④正负指标相悖。如吕鸿杰在纳入模型的指标中,将饮酒作为高血压的保护因素,而A Briasoulis 等和马玉霞等研究得出饮酒为高血压的危险因素。⑤虽然也存在可穿戴设备对疾病预防的研究成果,但未将其指标数据纳入模型构建中,且输出变量大都没有对个人患慢病风险给出准确的概率值。
因此,现有技术还有待发展。
发明内容
鉴于上述现有技术的不足之处,本发明的目的在于提供一种患病风险值预测方法及电子设备,应用于高血压预测,旨在解决现有技术中数学预测模型对于患病概率预测计算结果不准确的问题。
为了达到上述目的,本发明采取了以下技术方案:
一种患病风险值预测方法,应用于高血压分析。其中,所述方法包括:
采集用户的静态数据和动态数据;
对所述静态数据和动态数据进行预处理;
通过逻辑学回归以及动态向量机,构建动态预警模型;
根据所述预处理后的数据,应用所述动态预警模型对用户进行分类;
根据所述用户的分类,计算对应的风险值;所述风险值表示用户患有高血压的风险。
所述的患病风险值预测方法,其中,所述采集用户的静态数据和动态数据,具体包括:
确定所述静态数据和所述动态数据包含的若干个衡量指标;
通过问卷调查的方式采集用户的静态数据,并通过可穿戴设备的方式采集用户的动态数据。
所述的患病风险值预测方法,其中,所述通过逻辑学回归以及支持向量机,构建动态预警模型,具体包括:
利用所述支持向量机中的二次核函数、线性内核函数以及逻辑学回归对不确定是否患高血压的人群进行分类;
根据所述二次核函数的第一分类结果、所述线性内核函数的第二分类结果以及所述逻辑学回归的第三分类结果,将用户划分为真或非真两类。
所述的患病风险值预测方法,其中,所述根据所述二次核函数的第一分类结果、所述线性内核函数的第二分类结果以及所述逻辑学回归的第三分类结果,将用户划分为真或非真两类,具体包括:
当所述第一分类结果、第二分类结果以及第三分类结果中存在两个以上的判断结果为真时,确定用户的分类为真;
当不存在时,判断所述用户的分类为非真。
所述的患病风险值预测方法,其中,所述根据所述用户的分类,计算对应的风险值,具体包括:
定义一个单调连续的概率函数,所述概率函数的取值范围为0-1之间;
将所述用户的分类映射到所述概率函数;
结合综合权重,计算所述风险值,用于表示当前用户的患病概率。
所述的患病风险值预测方法,其中,所述综合权重通过如下方法计算:
利用逻辑学回归,确定每个衡量指标的静态权重;
计算所述衡量指标的动态权重;
赋予所述动态权重和所述静态权重对应的比例系数,加权获得综合权重;所述比例系数为0至1之间的比例系数。
所述的患病风险值预测方法,其中,所述利用逻辑学回归,确定每个衡量指标的静态权重,具体包括:
设因变量为自变量为Xi(i=1,2,…,k)
其中,p为所述风险值,Xi为衡量指标;
建立如下线性回归方程:
其中,ω0、ω1…ωk为回归系数;
计算每个衡量指标的回归系数,并归一化处理后获得所述静态权重。
所述的患病风险值预测方法,其中,所述计算所述衡量指标的动态权重,具体包括:
假设判别问题的辨识框架为Ω={Hj,Ω}
其中,j=1,…,N,存在L个衡量指标ei,i=1,…,L;所述衡量指标的静态权重为ωi;并且每个衡量指标在各个命题下的初始信度为βij,没有被评价到任何等级的信度为β;计算所述静态权重时的总体信度为βi
所述初始信度和信度满足:βij≤1并且βij=1;
当在其他命题中初始信度βj小于等于在前的初始信度βj-1时,保持静态权重的数值不变;
在其他命题中初始信度βj大于之前的初始信度βj-1时,通过如下方法计算所述动态权重:
基于静态权重折扣后的衡量指标记为在命题下的概率分派为所有衡量指标的加权平均记为 在命题Hj下的概率分派为 与加权平均指标间的距离通过欧式距离表示;
与加权平均指标的相似性测度定义为:si=1-di
将si归一化,得到衡量指标ei的动态权重为:
所述的患病风险值预测方法,其中,所述结合综合权重,计算所述风险值,用于表示当前用户的患病概率,具体包括:
所述风险值通过如下算式计算:
其中,当新采集到的动态数据的权重值初始信度βj大于在先的初始信度βj-1时,通过如下算式计算所述风险值:
其中,综合权重αi=γωi+(1-γ)Si;综合权重αi满足0≤αi≤1,且 为比例系数,a为原始数据量,b为新采集数据量。
一种电子设备,包括处理器和存储器;所述存储器存储有计算机可执行程序;当所述计算机可执行程序被所述处理器调用时,以使所述处理器执行如上所述的患病风险值预测方法,应用于用户的高血压患病风险预测。
有益效果:本发明提供的患病风险值预测方法,通过构建疾病影响因素指标体系,再针对指标体系设计调查问卷采集用户静态数据,选取合适的可穿戴设备采集动态数据,并对釆集到的健康数据进行包括数据清洗和数据转化等预处理后,通过改良Logistic回归和支持向量机,建立用户慢病风险动态预警混合模型,对个人患慢病风险进行分类且提供精确的患病风险概率值,为识别高危个体提供数据支持。
附图说明
图1为本发明实施例提供的患病风险值预测方法的方法流程图;
图2为本发明实施例提供的动态衡量指标的赋值表格;
图3为本发明实施例提供的动态衡量指标的变化趋势图;
图4为本发明实施例提供的前24个人的衡量指标的值以及对应的患病风险概率值的示意图。
具体实施方式
本发明提供一种患病风险值预测方法及电子设备。为使本发明的目的、技术方案及效果更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
图1为本发明具体实施例的患病风险值预测方法的方法流程图。在本实施例中,该患病风险值预测方法可以作为疾病风险动态预警模型,应用于高血压患病概率的预测。当然,该患病风险值预测方法还可以对输入数据进行相应的调整后,应用于其他不同的任何合适领域或者问题风险值的预测计算。
在本实施例提供的患病风险值预测方法中,如图1所示,主要包括:构建数据指标(S100)、数据采集和数据预处理(S200)、权重计算(S300)以及风险值计算(S400)四个主要步骤,以下以高血压患病风险预测为例,详细描述各个步骤的具体实现过程:
S100:在《中国高血压防治指南(2016年修订版)》的基础上,通过阅读大量文献后,补充相应的指标,最终确定高血压影响因素的衡量指标体系。
该体系中,将高血压的影响因素归纳为6个一级指标以及34个二级指标。其中,一级指标包括:基本因素、生活习惯、遗传因素、心理社会因素、检查指标以及药物影响因素。
每个一级指标下的二级指标依次如下:
基本因素:年龄、腰臀比值(腰围和臀围)、血压、心率、BMI以及性别;
生活习惯:食盐、饮酒、吸烟、体力活动量、睡眠时间、每天饮奶量、每天饮水量、饮食(吃饭是否规律、是否按时吃早餐、是否每天吃咸菜、水果、蔬菜);
遗传因素:高血压、糖尿病、血脂异常;
心理社会因素:家庭情况、婚姻状况、职业类型、经济收入、工作环境(包括噪声、空气质量等)、文化程度、有无焦虑症、抑郁症、躁狂症、长期精神紧张、药物依赖性;
检查指标:血常规、尿液分析、糖代谢(空腹血糖)、脂肪代谢、电解质检查等;
药物影响因素:是否服用使血压升高的药物,例如口服避孕药、非甾体类抗炎药、中药甘草等。
S200:为了更好的反映测试者的试剂情况,在本实施例中可以采集双数据 (静态和动态两类数据)进行模型构建。其中,静态数据通过调查问卷采集所得,而动态数据利用智能手环等可穿戴设备采集获得。
通过围绕上述影响因素的衡量指标体系设计调查问卷,然后采用线上(如互联网上的问卷星平台)和线下(如在社区发放调查问卷,一对一采访等)双结合的方式采集用户相对稳定的信息。而不确定的信息,例如心率、血压、运动量等指标,可以由相应的可穿戴设备获取,然后对采集到的健康数据进行清洗、集成、转化等数据预处理操作。
S300:在本实施例中,考虑的是在数据动态环境中判断新采集数据权重的可信度,然后结合之前初始指标得到的静态权重,将两类权重分别赋予一个大小在[0,1]间的比例系数后,计算得到最终的综合指标权重。
具体的,所述静态权重和所述动态权重的计算过程如下:
1)设因变量为自变量为Xi(i=1,2,…,k)其中,p为所述风险值,Xi为衡量指标。
可以建立如算式(1)所示的线性回归方程:
其中,ω0、ω1…ωk为回归系数。
最后,计算每个衡量指标的回归系数,并归一化处理后获得所述静态权重。
2)假设判别问题的辨识框架为Ω={Hj,Ω};其中,j=1,…,N,存在L个衡量指标ei,i=1,…,L;所述衡量指标的静态权重为ωi;并且每个衡量指标在各个命题下的初始信度为βij,没有被评价到任何等级的信度为β;计算所述静态权重时的总体信度为βi
所述初始信度和信度满足如下条件:βij≤1并且βij=1。
当在其他命题中初始信度βj小于等于在前的初始信度βj-1时,保持静态权重的数值不变。
3)在其他命题中初始信度βj大于之前的初始信度βj-1时,通过如下方法计算所述动态权重:
基于静态权重折扣后的衡量指标记为 在命题下的概率分派为所有衡量指标的加权平均记为 在命题Hj下的概率分派为
与加权平均指标间的距离通过欧式距离表示:
欧氏距离
与加权平均指标的相似性测度定义为:si=1-di
若当与加权平均指标间的距离越小,则说明它们的相似性程度就越大。这一思路是模仿了专家法,即当某个专家打分与大多数专家打分相悖时,认为是不可信的,此分值会被舍去。这种采用加权平均值的方法,可以预防因某些外加因素导致的分值异常情况出现。
最后,将si归一化,得到衡量指标ei的动态权重为:
在通过上述方法确定静态权重和动态权重以后,便可以通过如下算式计算综合权重αi=γωi+(1-γ)Si
其中,αi满足0≤αi≤1,且γ为所述比例系数(0≤γ≤1)。考虑到数据集大小对权重影响程度,在一些实施例中,利用静动态样本量的不同调节彼此之间的比重,即令其中,a表示原始数据量, b表示新采集到的数据量。
S400:在本实施例中,通过逻辑学回归以及支持向量机,构建动态预警模型并且基于综合权重来完成最终的风险值计算过程。
由于传统的Logistic回归(逻辑学回归)对处于分界点附近的样本可能存在误判风险。因此,在本实施中,使用SVM的输出结果可以修正Logistic 的结果,提高样本的分类精度。
在一些实施例中,所述构件动态预警模型的过程包括:
首先,依次利用支持向量机中二次核函数对不确定是否患高血压的人群进行分类,利用支持向量机中线性内核函数对不确定是否患高血压的人群进行分类并利用Logistic回归进行分类,同时利用Logistic自带函数计算患高血压风险的概率。
然后,利用以上三步分类结果,判断训练集和测试集中不确定是否患高血压的人群。最终可以归纳得出八种结果,用y表示患高血压情况(即真或非真): y=1患高血压;y=0不患高血压。具体的分类结果如下表格所示:
在本实施例中,对于三个分类结果的判定以多数为准。亦即,当两个及以上分类结果为1,则结论Result(T)为1。当两个及以上分类结果为0,则结论 Result(T)为0。
由于上述实施例中,因变量取值只有0和1两种情况,无法用线性回归分析,因此采用二分类Logistic回归分析进行映射处理。
该映射处理的具体过程如下:
首先,定义一个单调连续的概率函数π,π的取值范围为[0,1],此时的 Logistic回归模型如算式(2)所示:
然后对原始数据进行映射处理:
当P(y=0)=0,当P(y=1)=1,
接着用线性回归的方法得到回归系数β0、β1…βk
最后,再根据π和P的映射关系进行反映射得到Ф的值。即π到Ф的映射关系:
结合以上的公式,可以通过算式(3)计算得出风险值P(即某个测试者的高血压患病概率)为:
若结合综合权重考虑,在当新采集到的动态数据权重值初始信度βj大于之前的βj-1时,风险值P通过算式(4)计算获得:
应用上述方法实施例公开的患病风险值预测方法对某地人群的高血压患病风险预测实例具体如下:
1)关于数据采集的可行性和有效性等因素,最终选定影响值较高且易采集数据的26个二级指标,制定调查问卷,采集静态数据。
其中,问卷除身高和体重的填写为开放性的,其余为封闭式的。以高血压影响因素指标体系为指导,问卷内容包含基本因素、生活习惯、遗传因素、心理社会因素、检查指标、药物影响因素6个一级维度,并在此基础上形成条目池,条目数量为30-50个。问卷设计遵循清晰性、单一性、中立性、简单性、可靠性、间接性、排他性、敏感性、完整性、规范性等原则。
动态数据使用已有的可穿戴智能设备,将动态血压监测和家庭血压监测合二为一,弥补诊室血压监测的不足,实时动态监测,了解被调查者生活常态下的血压水平,以便检出白大衣高血压、隐蔽性高血压、潜在性高血压等。
虽然现在市面上的健康智能设备很多,但是考虑到本模型特点,把能够实时测量血压这一指标作为第一筛选标准,同时结合性价比。在本实施例中,最终选定utalife E26智能手环采集动态数据,包括血压、心率、睡眠时间、运动计步、血氧饱和度、疲劳度等六个二级指标,同时还可通过蓝牙连接手机APP 实时同步信息,APP采集用户电话号码、性别、身高、体重等静态信息。
选择总共36个社区作为研究对象。以青少年(<35周岁)、中年(35~64周岁)、老年(≥65周岁)为分层依据,居民自愿报名为主,社区抽取为辅,每个社区的调查对象不少于800人。建立9人的研究小组,组成3支小分队,选择每周的周末包括周六周日两天联系社区居委会***调查会,每周采访约 400人,每两周采访同一个社区,每个社区总共采访约800人。现场使用欧姆龙台式汞柱血压计为部分不确定的调查对象测量血压,要求受试者在测血压前,至少坐位安静休息5分钟,30分钟内禁止吸烟、饮咖啡和茶,排空膀胱。间隔 1-2min重复测量,取2次读数的平均值。
整个实验历时6个月,总共收到28971份问卷,排除没有回答完全和大面积出现相同选项的问卷为废卷共253份,剩余有效问卷28718份问卷,有效率达99.13%。其中小于35周岁有13141人,35至64周岁有12208人,65周岁及以上有3369人。男性14301人,占比49.8%,女性14417人,占比50.2%。将调查对象分为两类:高血压患者和“不确定者”,“不确定者”指的是调查问卷中第五题“是否患高血压”填写“否”的人,包括不知道自己是否患高血压和不患高血压的人。
2)采集相关数据,建立被调查人员的个体信息数据库,并对采集到的个人日常数据信息进行数据清洗、数据赋值转换等处理。
例如,本模型动态数据指标主要包括血压、心率、睡眠时间、运动计步、血氧饱和度、疲劳度等。
已有研究表明,如果可穿戴设备定点测量的血压负荷值(即白天血压值大于135/85和夜晚血压值大于125/75)的次数超过50%次可定义此人患高血压。每日步数≤1951为低等运动强度,每日步数在1952-5724之间为中等运动强度,每日步数在5725以上为高等运动强度,对应纳入模型的数据指标为“运动强度”。血氧饱和度(SpO2)是血液中血氧的浓度,它是呼吸循环的重要生理参数。作为单独指标处理,大于等于95%为正常,86%-95%为低氧血症,小于等于85%为严重低氧血症。根据已有的研究成果,对动态衡量指标赋值(如图2所示的表格)。
并且,设计程序代码将手环动态数据自动传输到App后台数据库。在App 界面上显示个人从早上6点到晚上21点之间的动态衡量指标变化的趋势图(如图3所示)。
3)经过数据处理总共得到28718条数据,其中包括14301条女性数据, 14417条男性数据。考虑到性别对高血压的影响,在本实施例中,将男女分开进行研究。
首先以女性数据为例建立女性慢性病风险动态预警模型,取其中的9073 条数据为训练集,5228条数据为测试集(此为“不确定患病者”)。在训练集中,前3710条数据是患病者,后5363个是不患病者。先将训练集分别运用到支持向量机的二次核函数的和线性内核函数来进行学习,然后再分别对测试集进行分类。同理,logistic回归模型也是先对训练集进行学习然后对测试集进行分类,最后将这三种函数的分类结果按照上述实施例中的组合(A-F)进行组合。最终,获得的女性分组结果如下表格所示:
然后,根据回归分析法的思路,将29个自变量(26个静态数据指标和3 个动态数据指标)相关数据及其是否患高血压为因变量(高血压患者为y=1,不患高血压患者为y=0),代入算式(2)按照一定的计算机程序和算法,求出回归系数。最终计算获得的回归系数如下表格所示:
最后,根据上面所求出的回归系数,连同29个指标的相关数据,代入算式(3)或(4)即可求出女性患高血压风险概率P。当然,基于上述相同的计算方式,也可以求出男性患高血压的风险概率。
4)风险概率结果验证:
为验证疾病风险动态预警混合模型的实际效果,对样本中的“不确定者”根据模型测算结果随机抽样,A组60人,B组80人,C组80人,E组120人, F组160人,因D组人数过少,故不进行随访,总共500人作为实证研究对象。
成立测试小组包含计算机程序员,数据统计人员,医学相关人员共计10 人。将“健康状况调查问卷”编辑成电子版放入项目组自建的“健康管家”App 中,连接到后台数据库,采集用户静态数据。结合动态监测数据,利用已建的疾病风险动态预警模型测算用户患高血压的概率。图4为显示截取的前24个人的各个指标的值以及对应的患病风险概率值示例图。
为每一位受试者的手机下载“健康管家”App并且提供智能手环,面对面告知使用方法,对500个受试对象随访调查1年。
最终选择包括临床医学、公共卫生和卫生管理等领域的10位专家对500 名受试者进行长达一年的随访调查,要求专家对研究对象患高血压的风险进行打分,在“不确定者”中筛选出高血压患者并与模型预测结果比对,判断模型精确度。其具体的评判结果如下表格所示,可以看到,模型的风险预测准确度高达96.27%。
综上所述,本发明实施例提供的患病风险值预测方法以高血压为例,通过静态数据和动态数据构建相应的疾病风险动态预警模型,预测“不确定者”高血压患病风险概率并对概率值进行分级,为识别高危人群提供数据支持且对每个指标的发展趋势进行可视化分析,为干预危险因素指明方向。
通过对受试群体的随访发现,本患病风险值预测方法的预测结果具有较高的精准度,有助于识别潜在高血压高危人群,及时干预健康危险因素,预防或延缓慢病的发生。本患病风险值预测方法还可以进一步的拓展应用到各个不同地区或者到其他不同种类的慢性病患病风险预测。
可以理解的是,对本领域普通技术人员来说,可以根据本发明的技术方案及本发明构思加以等同替换或改变,而所有这些改变或替换都应属于本发明所附的权利要求的保护范围。

Claims (10)

1.一种患病风险值预测方法,应用于高血压分析,其特征在于,包括:
采集用户的静态数据和动态数据;
对所述静态数据和动态数据进行预处理;
通过逻辑学回归以及动态向量机,构建动态预警模型;
根据所述预处理后的数据,应用所述动态预警模型对用户进行分类;
根据所述用户的分类,计算对应的风险值;所述风险值表示用户患有高血压的风险。
2.根据权利要求1所述的患病风险值预测方法,其特征在于,所述采集用户的静态数据和动态数据,具体包括:
确定所述静态数据和所述动态数据包含的若干个衡量指标;
通过问卷调查的方式采集用户的静态数据,并通过可穿戴设备的方式采集用户的动态数据。
3.根据权利要求2所述的患病风险值预测方法,其特征在于,所述通过逻辑学回归以及支持向量机,构建动态预警模型,具体包括:
利用所述支持向量机中的二次核函数、线性内核函数以及逻辑学回归对不确定是否患高血压的人群进行分类;
根据所述二次核函数的第一分类结果、所述线性内核函数的第二分类结果以及所述逻辑学回归的第三分类结果,将用户划分为真或非真两类。
4.根据权利要求3所述的患病风险值预测方法,其特征在于,所述根据所述二次核函数的第一分类结果、所述线性内核函数的第二分类结果以及所述逻辑学回归的第三分类结果,将用户划分为真或非真两类,具体包括:
当所述第一分类结果、第二分类结果以及第三分类结果中存在两个以上的判断结果为真时,确定用户的分类为真;
当不存在时,判断所述用户的分类为非真。
5.根据权利要求4所述的患病风险值预测方法,其特征在于,所述根据所述用户的分类,计算对应的风险值,具体包括:
定义一个单调连续的概率函数,所述概率函数的取值范围为0-1之间;
将所述用户的分类映射到所述概率函数;
结合综合权重,计算所述风险值,用于表示当前用户的患病概率。
6.根据权利要求5所述的患病风险值预测方法,其特征在于,所述综合权重通过如下方法计算:
利用逻辑学回归,确定每个衡量指标的静态权重;
计算所述衡量指标的动态权重;
赋予所述动态权重和所述静态权重对应的比例系数,加权获得综合权重;所述比例系数为0至1之间的比例系数。
7.根据权利要求6所述的患病风险值预测方法,其特征在于,所述利用逻辑学回归,确定每个衡量指标的静态权重,具体包括:
设因变量为自变量为Xi(i=1,2,…,k)
其中,p为所述风险值,Xi为衡量指标;
建立如下线性回归方程:
其中,ω0、ω1…ωk为回归系数;
计算每个衡量指标的回归系数,并归一化处理后获得所述静态权重。
8.根据权利要求6所述的患病风险值预测方法,其特征在于,所述计算所述衡量指标的动态权重,具体包括:
假设判别问题的辨识框架为Ω={Hj,Ω}
其中,j=1,…,N,存在L个衡量指标ei,i=1,…,L;所述衡量指标的静态权重为ωi;并且每个衡量指标在各个命题下的初始信度为βij,没有被评价到任何等级的信度为β;计算所述静态权重时的总体信度为βi
所述初始信度和信度满足:βij≤1并且βij=1;
当在其他命题中初始信度βj小于等于在前的初始信度βj-1时,保持静态权重的数值不变;
在其他命题中初始信度βj大于之前的初始信度βj-1时,通过如下方法计算所述动态权重:
基于静态权重折扣后的衡量指标记为在命题下的概率分派为所有衡量指标的加权平均记为ω=ω1…,ωL在命题Hj下的概率分派为 与加权平均指标间的距离通过欧式距离表示;
与加权平均指标的相似性测度定义为:si=1-di
将si归一化,得到衡量指标ei的动态权重为:
9.根据权利要求6所述的患病风险值预测方法,其特征在于,所述结合综合权重,计算所述风险值,用于表示当前用户的患病概率,具体包括:
所述风险值通过如下算式计算:
其中,当新采集到的动态数据的权重值初始信度βj大于在先的初始信度βj-1时,通过如下算式计算所述风险值:
其中,综合权重αi=γωi+(1-γ)Si;综合权重αi满足0≤αi≤1,且 为比例系数,a为原始数据量,b为新采集数据量。
10.一种电子设备,其特征在于,包括处理器和存储器;所述存储器存储有计算机可执行程序;当所述计算机可执行程序被所述处理器调用时,以使所述处理器执行如权利要求1-9任一所述的患病风险值预测方法,应用于用户的高血压患病风险预测。
CN201810031397.9A 2018-01-12 2018-01-12 患病风险值预测方法及电子设备 Pending CN108257673A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810031397.9A CN108257673A (zh) 2018-01-12 2018-01-12 患病风险值预测方法及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810031397.9A CN108257673A (zh) 2018-01-12 2018-01-12 患病风险值预测方法及电子设备

Publications (1)

Publication Number Publication Date
CN108257673A true CN108257673A (zh) 2018-07-06

Family

ID=62727221

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810031397.9A Pending CN108257673A (zh) 2018-01-12 2018-01-12 患病风险值预测方法及电子设备

Country Status (1)

Country Link
CN (1) CN108257673A (zh)

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109119167A (zh) * 2018-07-11 2019-01-01 山东师范大学 基于集成模型的脓毒症死亡率预测***
CN109411062A (zh) * 2018-09-30 2019-03-01 天津科技大学 一种基于深度学习技术利用生理参数自动判断糖尿病及其并发症的方法
CN109636055A (zh) * 2018-12-21 2019-04-16 中国安全生产科学研究院 一种非煤矿山安全生产风险预测预警平台
CN110379522A (zh) * 2019-07-23 2019-10-25 四川骏逸富顿科技有限公司 一种疾病流行趋势预测***及方法
CN110442035A (zh) * 2019-08-22 2019-11-12 梅钟可 一种多通道人体信息采集分析智能家居***
CN110634541A (zh) * 2019-06-26 2019-12-31 山西医科大学 一种口腔健康数据采集及分析方法
CN110767313A (zh) * 2019-10-23 2020-02-07 苏州大学 基于多水平贝叶斯模型的高血压风险评估装置
CN110853756A (zh) * 2019-11-08 2020-02-28 郑州轻工业学院 基于som神经网络和svm的食管癌风险预测方法
CN111105075A (zh) * 2019-11-25 2020-05-05 上海建科工程咨询有限公司 一种基于案例推理的塔吊风险事故预测方法及***
CN111292853A (zh) * 2020-01-15 2020-06-16 长春理工大学 基于多参数的心血管疾病风险预测网络模型及其构建方法
CN111599473A (zh) * 2020-05-21 2020-08-28 北京因普乐健康科技有限公司 一种血糖相关指标信息处理方法、装置及电子设备
CN111696667A (zh) * 2020-06-11 2020-09-22 吾征智能技术(北京)有限公司 一种常见妇科疾病预测模型构建方法和预测***
CN111738302A (zh) * 2020-05-28 2020-10-02 华南理工大学 一种基于多模态数据对阿尔茨海默病进行分类诊断的***
CN111798984A (zh) * 2020-07-07 2020-10-20 章越新 一种基于傅里叶变换的疾病预测方案
CN112509697A (zh) * 2020-12-04 2021-03-16 南京大学 一种多模块智慧健康管理信息***
CN112614590A (zh) * 2020-12-10 2021-04-06 浙江大学 一种基于机器学习的老年人失能风险预测方法和***
CN112750532A (zh) * 2019-10-30 2021-05-04 宏碁股份有限公司 特征识别方法与电子装置
CN112768074A (zh) * 2021-01-19 2021-05-07 大禹(上海)医疗健康科技有限公司 一种基于人工智能的重疾风险预测方法及***
CN113257421A (zh) * 2021-05-31 2021-08-13 吾征智能技术(北京)有限公司 一种高血压预测模型的构建方法和***
CN114391827A (zh) * 2022-01-06 2022-04-26 普昶钦 一种基于卷积神经网络的院前肺气肿诊断装置
CN115512842A (zh) * 2022-10-20 2022-12-23 南京鼓楼医院 一种用于多发性骨髓瘤患者预后评估的智能网页工具
CN115862853A (zh) * 2022-08-12 2023-03-28 内蒙古自治区综合疾病预防控制中心 一种***癌患者的心血管疾病发生风险的评估方法
CN117497166A (zh) * 2023-12-29 2024-02-02 深圳三基同创电子有限公司 一种基于云计算的智能手表生理体征参数监测方法及***

Cited By (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109119167A (zh) * 2018-07-11 2019-01-01 山东师范大学 基于集成模型的脓毒症死亡率预测***
CN109119167B (zh) * 2018-07-11 2020-11-20 山东师范大学 基于集成模型的脓毒症死亡率预测***
CN109411062A (zh) * 2018-09-30 2019-03-01 天津科技大学 一种基于深度学习技术利用生理参数自动判断糖尿病及其并发症的方法
CN109636055A (zh) * 2018-12-21 2019-04-16 中国安全生产科学研究院 一种非煤矿山安全生产风险预测预警平台
CN110634541A (zh) * 2019-06-26 2019-12-31 山西医科大学 一种口腔健康数据采集及分析方法
CN110379522B (zh) * 2019-07-23 2022-08-12 四川骏逸富顿科技有限公司 一种疾病流行趋势预测***及方法
CN110379522A (zh) * 2019-07-23 2019-10-25 四川骏逸富顿科技有限公司 一种疾病流行趋势预测***及方法
CN110442035A (zh) * 2019-08-22 2019-11-12 梅钟可 一种多通道人体信息采集分析智能家居***
CN110767313A (zh) * 2019-10-23 2020-02-07 苏州大学 基于多水平贝叶斯模型的高血压风险评估装置
CN112750532A (zh) * 2019-10-30 2021-05-04 宏碁股份有限公司 特征识别方法与电子装置
CN112750532B (zh) * 2019-10-30 2024-01-19 宏碁股份有限公司 特征识别方法与电子装置
CN110853756A (zh) * 2019-11-08 2020-02-28 郑州轻工业学院 基于som神经网络和svm的食管癌风险预测方法
CN111105075A (zh) * 2019-11-25 2020-05-05 上海建科工程咨询有限公司 一种基于案例推理的塔吊风险事故预测方法及***
CN111292853A (zh) * 2020-01-15 2020-06-16 长春理工大学 基于多参数的心血管疾病风险预测网络模型及其构建方法
CN111292853B (zh) * 2020-01-15 2023-05-26 长春理工大学 基于多参数的心血管疾病风险预测网络模型及其构建方法
CN111599473A (zh) * 2020-05-21 2020-08-28 北京因普乐健康科技有限公司 一种血糖相关指标信息处理方法、装置及电子设备
CN111738302A (zh) * 2020-05-28 2020-10-02 华南理工大学 一种基于多模态数据对阿尔茨海默病进行分类诊断的***
CN111696667A (zh) * 2020-06-11 2020-09-22 吾征智能技术(北京)有限公司 一种常见妇科疾病预测模型构建方法和预测***
CN111798984A (zh) * 2020-07-07 2020-10-20 章越新 一种基于傅里叶变换的疾病预测方案
CN112509697B (zh) * 2020-12-04 2023-08-22 南京大学 一种多模块智慧健康管理信息***
CN112509697A (zh) * 2020-12-04 2021-03-16 南京大学 一种多模块智慧健康管理信息***
CN112614590A (zh) * 2020-12-10 2021-04-06 浙江大学 一种基于机器学习的老年人失能风险预测方法和***
CN112768074A (zh) * 2021-01-19 2021-05-07 大禹(上海)医疗健康科技有限公司 一种基于人工智能的重疾风险预测方法及***
CN113257421A (zh) * 2021-05-31 2021-08-13 吾征智能技术(北京)有限公司 一种高血压预测模型的构建方法和***
CN113257421B (zh) * 2021-05-31 2023-09-15 吾征智能技术(北京)有限公司 一种高血压预测模型的构建方法和***
CN114391827A (zh) * 2022-01-06 2022-04-26 普昶钦 一种基于卷积神经网络的院前肺气肿诊断装置
CN115862853A (zh) * 2022-08-12 2023-03-28 内蒙古自治区综合疾病预防控制中心 一种***癌患者的心血管疾病发生风险的评估方法
CN115862853B (zh) * 2022-08-12 2023-11-21 内蒙古自治区综合疾病预防控制中心 一种***癌患者的心血管疾病发生风险的评估方法
CN115512842A (zh) * 2022-10-20 2022-12-23 南京鼓楼医院 一种用于多发性骨髓瘤患者预后评估的智能网页工具
CN117497166A (zh) * 2023-12-29 2024-02-02 深圳三基同创电子有限公司 一种基于云计算的智能手表生理体征参数监测方法及***
CN117497166B (zh) * 2023-12-29 2024-04-19 深圳三基同创电子有限公司 一种基于云计算的智能手表生理体征参数监测方法及***

Similar Documents

Publication Publication Date Title
CN108257673A (zh) 患病风险值预测方法及电子设备
Liu et al. Assessment of the association between habitual salt intake and high blood pressure: methodological problems
Argiropoulou et al. Validity and reliability of physical activity measures in Greek high school age children
RU2757048C1 (ru) Способ и система оценки здоровья тела человека на основе данных большого объема о сне
Ervin Prevalence of metabolic syndrome among adults 20 years of age and over, by sex, age, race and ethnicity, and body mass index: United States, 2003-2006
Midanik Perspectives on the validity of self‐reported alcohol use
Silva et al. Accuracy and measures of association of anthropometric indexes of obesity to identify the presence of hypertension in adults: a population-based study in Southern Brazil
Dijkstra et al. Construct validity of the Nursing Care Dependency Scale.
CN109145113B (zh) 一种基于机器学习的学生贫困程度预测方法
RU2712395C1 (ru) Способ выдачи рекомендаций по поддержанию здорового образа жизни на основе параметров ежедневной деятельности пользователя, автоматически отслеживаемых в реальном времени, и соответствующая система (варианты)
CN106250680A (zh) 心脏健康指数检测***及模型构建方法
Geller et al. Transtheoretical model constructs for physical activity behavior are invariant across time among ethnically diverse adults in Hawaii
Okunseri et al. Self‐reported dental visits among adults in Benin City, Nigeria
Pan et al. Quality of urban life among older adults in the world major metropolises: A cross-cultural comparative study
CN106295202B (zh) 基于Hale指数的青少年健康状况动态分析方法
JP2003067489A (ja) 検査結果データ出力システム
Eichenbaum et al. Item response theory analysis of the Triarchic Psychopathy Measure.
Karasu An overview of the complexities in obesity: Limitations and challenges
Cabrero-García et al. Aggregated measures of functional disability in a nationally representative sample of disabled people: analysis of dimensionality according to gender and severity of disability
KR101274431B1 (ko) 설문 정보를 이용한 건강 상태 판단 장치 및 방법, 건강 분류 함수 생성 장치 및 그 방법
Hirschberg Individual differences in social judgment: A multivariate approach
Dong et al. An Examination of Veterans’ Diet Quality
Granberg et al. The role of body size in mate selection among African American young adults
CN113871014A (zh) 一种自主健康的辅助方法和装置
Mohapatra et al. Service Quality in Indian Hospitals

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180706

RJ01 Rejection of invention patent application after publication