CN116564521A - 一种慢性病风险评估模型建立方法、介质及*** - Google Patents
一种慢性病风险评估模型建立方法、介质及*** Download PDFInfo
- Publication number
- CN116564521A CN116564521A CN202310531805.8A CN202310531805A CN116564521A CN 116564521 A CN116564521 A CN 116564521A CN 202310531805 A CN202310531805 A CN 202310531805A CN 116564521 A CN116564521 A CN 116564521A
- Authority
- CN
- China
- Prior art keywords
- chronic disease
- disease risk
- risk assessment
- risk
- layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 208000017667 Chronic Disease Diseases 0.000 title claims abstract description 175
- 238000012502 risk assessment Methods 0.000 title claims abstract description 103
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000012549 training Methods 0.000 claims abstract description 104
- 238000013528 artificial neural network Methods 0.000 claims abstract description 32
- 238000005457 optimization Methods 0.000 claims abstract description 8
- 230000006870 function Effects 0.000 claims description 42
- 201000010099 disease Diseases 0.000 claims description 34
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 34
- 235000005911 diet Nutrition 0.000 claims description 24
- 230000037213 diet Effects 0.000 claims description 24
- 230000001684 chronic effect Effects 0.000 claims description 22
- 230000001788 irregular Effects 0.000 claims description 18
- 230000004913 activation Effects 0.000 claims description 16
- 239000013598 vector Substances 0.000 claims description 13
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 claims description 12
- 230000000694 effects Effects 0.000 claims description 12
- 238000011156 evaluation Methods 0.000 claims description 12
- 230000007774 longterm Effects 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 10
- 238000013135 deep learning Methods 0.000 claims description 10
- 230000037081 physical activity Effects 0.000 claims description 9
- 238000003860 storage Methods 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 238000012795 verification Methods 0.000 claims description 8
- 230000033001 locomotion Effects 0.000 claims description 7
- 239000008280 blood Substances 0.000 claims description 6
- 210000004369 blood Anatomy 0.000 claims description 6
- 230000036772 blood pressure Effects 0.000 claims description 6
- 235000012000 cholesterol Nutrition 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 6
- 230000001186 cumulative effect Effects 0.000 claims description 4
- 238000011478 gradient descent method Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 4
- 238000001514 detection method Methods 0.000 claims description 3
- 235000013305 food Nutrition 0.000 claims description 3
- 230000001766 physiological effect Effects 0.000 claims description 3
- 230000009286 beneficial effect Effects 0.000 description 8
- 230000006872 improvement Effects 0.000 description 7
- 238000010606 normalization Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 5
- 230000036541 health Effects 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 235000009508 confectionery Nutrition 0.000 description 1
- 238000013501 data transformation Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000035622 drinking Effects 0.000 description 1
- 210000002216 heart Anatomy 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 230000000391 smoking effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/50—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Public Health (AREA)
- Biomedical Technology (AREA)
- Medical Informatics (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Epidemiology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Databases & Information Systems (AREA)
- Primary Health Care (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Pathology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明提供了一种慢性病风险评估模型建立方法、介质及***,属于风险评估技术领域,该慢性病风险评估模型建立方法、介质及***获取慢性病患者和健康人群的相关数据,建立初始神经网络;根据所述慢性病影响因素计算风险等级,所述风险等级以所述慢性病患病的可能性进行划分,分为超危、高危、中危、低危四个等级;根据所述风险等级进行风险分析,获取慢性病患病风险的风险事件,根据所述风险事件获取慢性病风险分析结果;对所述初始神经网络进行优化训练,得到慢性病风险评估模型,将待分析对象的样本参数输入至慢性病风险评估模型中进行慢性病风险评估;根据慢性病风险评估模型的输出数据得到所述待分析对象的慢性病风险评估结果。
Description
技术领域
本发明属于风险评估技术领域,具体而言,涉及一种慢性病风险评估模型建立方法、介质及***。
背景技术
随着社会经济的快速发展,慢性病已经成为影响居民健康的重大医疗问题。现代社会生活节奏加快,人们往往忽视健康,摄入过多的高热量、高脂肪、高糖食物,缺乏运动,熬夜,吸烟和饮酒等不良生活习惯增加了慢性病的风险。据***统计,我国目前已确诊的慢性病患者超过2.6亿人,且每年死于慢性病的人数超过300万人。慢性病的危害主要是造成脑、心、肾等重要脏器的损害,易造成伤残,影响劳动能力和生活质量,且医疗费用极其昂贵,增加了社会和家庭的经济负担。我国慢性病患者技术庞大,慢性病管理难度巨大,如何有效评估慢性病具有重要意义。
随着医学技术的发展,对慢性病的诊断能力和意识得到提高,使得许多慢性病在早期就被发现和诊断,进而增加了患病年龄段的统计数据,但由于慢性病致病因素多,变量间关系错综复杂,采用传统的风险评估方法难以发现病变的内在规律,严重影响了慢性病精准防控措施的有效实施。
发明内容
有鉴于此,本发明提供一种慢性病风险评估模型建立方法、介质及***,能够根据待检测者的日常生活习惯判断是否患病,解决慢性病在日常生活中容易被忽视的问题,可以实现人们能够独立判断是否患有慢性病。
本发明是这样实现的:
本发明第一方面提供一种慢性病风险评估模型建立方法,其中,
S10,获取样本参数,所述样本参数包括慢性病患者参数和健康人群参数的相关数据,所述样本参数用于分析常见慢性病影响因素,所述慢性病影响因素包括饮食、运动、熬夜以及遗传,所述相关数据包括所述慢性病患者和所述健康人群的年龄、性别、体重指数、血压、血糖、胆固醇指标;
S20,获取慢性病患者和健康人群的相关数据,建立初始神经网络;
S30,根据所述慢性病影响因素计算风险等级,所述风险等级以所述慢性病患病的可能性进行划分,分为超危、高危、中危、低危四个等级;
S40,根据所述风险等级进行风险分析,获取慢性病患病风险的风险事件,根据所述风险事件获取慢性病风险分析结果,所述风险事件为所述慢性病潜在影响因素中,包括不合理饮食、缺乏运动、长期熬夜以及遗传;
S50,对所述初始神经网络进行优化训练,得到慢性病风险评估模型,将待分析对象的样本参数输入至慢性病风险评估模型中进行慢性病风险评估;
S60,根据慢性病风险评估模型的输出数据得到所述待分析对象的慢性病风险评估结果。
本发明提供的一种慢性病风险评估模型建立方法、介质及***的技术效果如下:通过卷积神经网络,可以建立所述慢性病风险评估模型,具体步骤是:
获取所述慢性病患者的相关数据,输入是所述慢性病患者的训练数据,输出是所述医生判断的患病风险轻重,建立所述初始神经网络,利用所述初始神经网络,可以经过所述训练集和所述验证集,
对所述慢性病风险评估模型进行验证和测试,通过反向传播对参数进行优化,可以实时更新所述骨干层的参数,将所述初始神经网络参数进行转化,实现由低精度到高精度的操作过程,获得更为精确的所述参数,由此得到与所述医生判断的患病风险轻重更相近的所述慢性病风险评估模型,通过交叉熵损失函数的计算可以计算损失函数值,对参数进行优化,可以使所述慢性病风险评估模型更精确,通过建立所述慢性病风险评估模型可以根据所述待分析对象的样本参数对所述待分析对象进行风险评估,根据所述慢性病风险评估模型的输出数据得到所述待分析对象的慢性病风险评估结果。
在上述技术方案的基础上,本发明的一种慢性病风险评估模型建立方法、介质及***还可以做如下改进:
其中,建立所述慢性病风险评估模型,具体步骤为:
获取所述慢性病影响因素以及持续时间的相关数据,作为训练数据;
所述训练数据具体为:随机采集100个慢性病患者的100天机体活动测评,所述慢性病患者包括重度慢性病患者以及轻度慢性病患者;
根据所训练数据提取所述慢性病潜在影响因素并确定所述相关数据具体数值,所述相关数据包括所述慢性病患者的年龄、性别、体重指数、血压、血糖、胆固醇指标;
基于所述训练数据以及医生判断的患病风险轻重作为深度学习网络训练样本,将深度学习网络训练样本按6:4的比例划分为训练集、验证集,构建所述初始神经网络;
采用所述训练集对所述初始神经网络通过训练得到所述慢性病风险评估模型;
采用所述验证集对所述慢性病风险评估模型进行验证和测试,优化所述慢性病风险评估模型;
其中,所述慢性病潜在影响因素包括:不合理饮食、缺乏运动、长期熬夜以及遗传。
采用上述改进方案的有益效果为:通过采集所述重度慢性病患者以及所述轻度慢性病患者的所述训练数据,可以对所述慢性病潜在影响因素进行风险分析,获得所述慢性病潜在影响因素对慢性病患病的影响程度;
通过将深度学习网络训练样本划分为所述训练集、所述验证集,可以通过训练得到所述慢性病风险评估模型并对所述初始神经网络进行训练和测试,并对得到的所述慢性病风险评估模型进行优化。
进一步的,所述采用所述训练集对所述初始神经网络通过训练得到所述慢性病风险评估模型,具体步骤为:
获取所述训练数据,其中,所述慢性病潜在影响因素根据所述持续时间对应标记分数,根据统计,我们将所述慢性病潜在影响定义为标记积分1,其他情况标记积分为0;
所述慢性病潜在影响因素包括不合理饮食、缺乏运动、长期熬夜;
其中,所述不合理饮食为在所述100天机体活动测评中,累计超过40天饮食时间不规律,所述标记分数为1;其中,所述饮食时间不规律包括时间上不规律以及结构上不规律,所述时间上不规律是指未按时进食,所述结构上不规律指饮食结构单一或不能满足人体生理活动需求;
所述缺乏运动为在所述100天机体活动测评中,累计超过40天未进行运动活动,所述标记积分为1;
所述长期熬夜为在所述100天机体活动测评中,累计超过40天在11:00后入睡,标记分数为1;
以所述训练数据作为样本,并以对应的所述标记分数作为标签,对所述机体活动测评结果进行向量计算;
获取所述积分向量以及对应所述医生判断的患病风险轻重,对所述积分向量的权重对由所述慢性病风险评估模型的所述医生判断的患病风险轻重的输出进行加权,以及将所述加权医生输出求和,输出的慢性病患病风险即为所述加权医生输出求和;
对所述初始神经网络进行训练,以获得慢性病风险评估模型。
采用上述改进方案的有益效果为:通过将所述慢性病潜在影响分别进行标记积分,可以将所述慢性病影响因素进行定义,将所述慢性病潜在影响定义为标记积分1,其他情况标记积分为0,通过所述标记积分可以获得所述慢性病影响因素对应的所述医生判断的患病风险轻重;
通过对积分向量的权重由所述慢性病风险评估模型的所述医生判断的患病风险轻重的输出进行加权,以及将加权医生输出求和,可以得到输出的慢性病患病风险为多个结果的平均值,使所述输出的慢性病患病风险评估更为精确。
其中,所述初始神经网络网络包含1个输入层、1个骨干层以及1个输出层,当所述慢性病风险评估模型输出结果与所述医生判断的患病风险轻重相差超过10%,通过反向传播对参数进行优化,所述参数优化通过梯度下降法进行反向传播网络训练,更新所述骨干层的参数;
其中,所述参数为W和b,所述W和b分别连接所述输入层和所述骨干层,所述骨干层和所述输出层;所述W表示权重,所述b表示偏差。
采用上述改进方案的有益效果为:通过所述梯度下降法对所述参数进行更新,所述慢性病风险评估模型学习的速度取决于两个值:一、学习率;二、偏导值;其中,所述学习率为设置的超参数,所述偏导值的大小取决于xo和[e(s)-y],所述[e(s)-y]的大小反应模型的错误程度,其中,所述xo为所述输入层的第o个元素,所述y为所述慢性病风险评估模型的输出;
该值越大,说明模型效果越差,模型学习速度更快,结合交叉熵当损失函数时,在模型效果差的时候学习速度快,在模型效果好的时候学习速度慢。
进一步的,所述骨干层用于处理所述训练数据,对所述训练数据进行预处理,得到的预处理数据集;
所述训练数据由所述输入层转换到所述骨干层,通过矩阵运算公式为:
H=X×W1+b1;
其中,所述H为所述骨干层;所述X为所述输入层;所述W1和b1连接所述输入层和所述骨干层;所述训练数据由所述骨干层转换到所述输出层,通过矩阵运算公式为:
Y=H×W2+b2;
其中,所述Y为所述输出层;所述H为所述骨干层;所述W2和b2连接所述骨干层和所述输出层。
采用上述改进方案的有益效果为:通过对所述训练数据进行预处理,包括标准化、归一化,可以对所述训练数据进行正规化,把数据的延展控制在一定范围内,可以加速所述初始神经网络训练,提高稳定性,在所述初始神经网络中使用标准化后的数据进行训练。
进一步的,所述骨干层中包含激活层,所述激活层中的激活函数对所述矩形运算后的结果进行非线性转换,所述非线性转换通过ReLU函数进行,所述ReLU函数公式为:
f(V)=max(0,V);
所述f(V)为所述激活函数ReLU函数,所述max为所述矩形运算后的结果,所述V为所述输入层的所述训练数据;所述ReLU函数输出结果为:
R=max(0,WV+B);
其中,所述R为所述ReLU函数输出结果,所述max为所述矩形运算后的结果,所述W和b为连接所述输入层和所述骨干层系数。
采用上述改进方案的有益效果为:通过所述激活层中的所述激活函数对矩形运算后的结果进行所述非线性转换,通过所述ReLU函数进行所述非线性转换,所述ReLU函数的具体步骤为:
在所述深度学习网络的所述骨干层添加ReLU激活函数,次前向传播过程中,层与层之间在做stack操作;两层之间,上一层经过ReLU后,传入下一层,下一层的每个神经元里面含有了上一层的add操作;stack和add操作相互交融,使得ReLU有了非线性表达能力;
最终实现将矩形运算后的结果的线性不可分变成高维空间的线性可分的数据,将所述矩形运算后的结果映射到高斯分布,可以稳定方差并最小化偏差。
进一步的,所述输出层中包含Softmax层,所述Softmax层将所述输出层中的所述ReLU函数输出结果正规化,具体操作公式为:
其中,所述Si为所述正规化输出结果,所述i表示所述训练函数序号,所述el表示以e为底所有训练数据的指数幂,所述ej表示所有指数幂求和,所述j表示所述训练函数个数;
通过交叉熵损失计算所述正规化输出结果的准确性,以降低所述交叉熵损失,以提高结果准确性,所述交叉熵损失计算方法为计算所述正规化输出结果对数的负数。
采用上述改进方案的有益效果为:通过交叉熵损失计算所述正规化输出结果的准确性,可以计算损失函数值,交叉熵损失函数可以捕捉到所述初始神经网络与所述慢性病风险评估模型之间预测效果的差异,降低所述交叉熵损失可以提高结果准确性。
其中,所述患病风险值,计算公式为:
S=P×Q;
其中:所述S为所述患病风险值事件发生的可能性;所述P为所述患病风险值事件发生的频率;所述Q指所述患病风险值事件发生时的影响程度;
所述可能性依据所述慢性病影响因素发生频率由低到高分为四个等级,其中,等级一为极少发生或不太可能发生;等级二为可能发生或在检测期间有可能发生不超过一次;等级三为很可能发生或在整个作业期间很可能多次发生;等级四为经常有发生。
采用上述改进方案的有益效果为:通过计算所述患病风险值,可以根据所述患病风险值事件发生的频率以及所述患病风险值事件发生时的影响程度评价所述风险等级,所述患病风险值对所述风险等级的评价按照所述患病风险值由大到小对所述风险等级进行排序;依次排序为超危、高危、中危、低危四个等级。
本发明第二方面提供一种计算机可读存储介质,其中,所述计算机可读存储介质中存储有程序指令,所述程序指令运行时,用于执行上述的一种慢性病风险评估模型建立方法。
本发明第三方面提供一种慢性病风险评估模型建立方法,包括上述的一种计算机可读存储介质。
与现有技术相比较,本发明提供的一种慢性病风险评估模型建立方法、介质及***的有益效果是:获取慢性病患者和健康人群的相关数据,建立初始神经网络;根据所述慢性病影响因素计算风险等级,所述风险等级以所述慢性病患病的可能性进行划分,分为超危、高危、中危、低危四个等级;根据所述风险等级进行风险分析,获取慢性病患病风险的风险事件,根据所述风险事件获取慢性病风险分析结果;对所述初始神经网络进行优化训练,得到慢性病风险评估模型,将待分析对象的样本参数输入至慢性病风险评估模型中进行慢性病风险评估。能够根据待检测者的日常生活习惯判断是否患病,能够解决慢性病在日常生活中容易被忽视的问题,可以实现人们能够独立判断是否患有慢性病。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明第一方面提供一种慢性病风险评估模型建立方法的流程图。
具体实施方式
为使本发明实施方式的目的、技术方案和优点更加清楚,下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
因此,以下对在附图中提供的本发明的实施方式的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”、“顺时针”、“逆时针”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的设备或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
如图1所示,是本发明提供的一种慢性病风险评估模型建立方法的流程图,本方法包括,
S10,获取样本参数,样本参数包括慢性病患者参数和健康人群参数的相关数据,样本参数用于分析常见慢性病影响因素,慢性病影响因素包括饮食、运动、熬夜以及遗传,相关数据包括慢性病患者和健康人群的年龄、性别、体重指数、血压、血糖、胆固醇指标;
S20,获取慢性病患者和健康人群的相关数据,建立初始神经网络;
S30,根据慢性病影响因素计算风险等级,风险等级以慢性病患病的可能性进行划分,分为超危、高危、中危、低危四个等级;
S40,根据风险等级进行风险分析,获取慢性病患病风险的风险事件,根据风险事件获取慢性病风险分析结果,风险事件为慢性病潜在影响因素中,包括不合理饮食、缺乏运动、长期熬夜以及遗传;
S50,对初始神经网络进行优化训练,得到慢性病风险评估模型,将待分析对象的样本参数输入至慢性病风险评估模型中进行慢性病风险评估;
S60,根据慢性病风险评估模型的输出数据得到待分析对象的慢性病风险评估结果。
其中,计算风险等级,具体步骤为:
对常见慢性病影响因素制定风险等级,根据慢性病影响因素来基于***方法和慢性病风险评估经验赋予量值;
进行风险分析,获取慢性病风险的主要风险事件;
计算出患病风险值;
根据患病风险值评价风险等级,患病风险值评价按照患病风险值由大到小对风险等级进行排序;
风险值由大到小依次划分为超危、高危、中危、低危四个等级,
超危为风险值超过80%,高危为风险值超过60%,中危为风险值超过40%,低危为风险值低于40%。
其中,在上述技术方案中,建立慢性病风险评估模型,具体步骤为:
获取慢性病影响因素以及持续时间的相关数据,作为训练数据;
训练数据具体为:随机采集100个慢性病患者的100天机体活动测评,慢性病患者包括重度慢性病患者以及轻度慢性病患者;
根据所训练数据提取慢性病潜在影响因素并确定相关数据具体数值,相关数据包括慢性病患者的年龄、性别、体重指数、血压、血糖、胆固醇指标;
基于训练数据以及医生判断的患病风险轻重作为深度学习网络训练样本,将深度学习网络训练样本按6:4的比例划分为训练集、验证集,构建初始神经网络;
采用训练集对初始神经网络通过训练得到慢性病风险评估模型;
采用验证集对慢性病风险评估模型进行验证和测试,优化慢性病风险评估模型;
其中,慢性病潜在影响因素包括:不合理饮食、缺乏运动、长期熬夜以及遗传。
进一步的,在上述技术方案中,采用训练集对初始神经网络通过训练得到慢性病风险评估模型,具体步骤为:
获取训练数据,其中,慢性病潜在影响因素根据持续时间对应标记分数,根据统计,我们将慢性病潜在影响定义为标记积分1,其他情况标记积分为0;
慢性病潜在影响因素包括不合理饮食、缺乏运动、长期熬夜;
其中,不合理饮食为在100天机体活动测评中,累计超过40天饮食时间不规律,标记分数为1;其中,饮食时间不规律包括时间上不规律以及结构上不规律,时间上不规律是指未按时进食,结构上不规律指饮食结构单一或不能满足人体生理活动需求;
缺乏运动为在100天机体活动测评中,累计超过40天未进行运动活动,标记积分为1;
长期熬夜为在100天机体活动测评中,累计超过40天在11:00后入睡,标记分数为1;
以训练数据作为样本,并以对应的标记分数作为标签,对机体活动测评结果进行向量计算;
获取积分向量以及对应医生判断的患病风险轻重,对积分向量的权重对由慢性病风险评估模型的医生判断的患病风险轻重的输出进行加权,以及将加权医生输出求和,输出的慢性病患病风险即为加权医生输出求和;
对初始神经网络进行训练,以获得慢性病风险评估模型。
其中,在上述技术方案中,初始神经网络网络包含1个输入层、1个骨干层以及1个输出层,当慢性病风险评估模型输出结果与医生判断的患病风险轻重相差超过10%,通过反向传播对参数进行优化,参数优化通过梯度下降法进行反向传播网络训练,更新骨干层的参数;
其中,参数为W和b,W和b分别连接输入层和骨干层,骨干层和输出层;W表示权重,b表示偏差。
梯度下降法,具体运算步骤为:
第一步:计算训练数据的参数W和b对于损失函数的梯度,计算所有参数W的梯度的总和,计算所有参数b的训练数据的梯度的总和;
第二步:计算所有训练数据的参数W和参数b的梯度的平均值;
第三步:通过计算更新训练数据的权重和偏差,
计算公式为:
其中,a为学习率,Wt+1为更新后的权重,Wt为权重的初始值,t为训练数据的序号;
其中,a为学习率,bt+1为更新后的偏差,bt为偏差的初始值,t为训练数据的序号。
进一步的,在上述技术方案中,骨干层用于处理训练数据,对训练数据进行预处理,得到的预处理数据集;
训练数据由输入层转换到骨干层,通过矩阵运算公式为:
H=X×W1+b1;
其中,H为骨干层;X为输入层;W1和b1连接输入层和骨干层;训练数据由骨干层转换到输出层,通过矩阵运算公式为:
Y=H×W2+b2;
其中,Y为输出层;H为骨干层;W2和b2连接骨干层和输出层。
对训练数据预处理后得到的预处理数据集的步骤具体包括
获取训练数据,对训练数据进行数据清洗,即缺失值、异常值处理;
对持续时间的相关数据进行差分运算,对训练数据进行数据归一化处理,数据归一化处理通过最大最小标准化进行,最大最小标准化公式为:
其中,X′为进行数据归一化处理后的训练数据,x为训练数据,Xmin为训练数据最小值,Xmax为训练数据最大值;
通过统计方法进行选择训练数据,训练数据用于建模和分析;
通过指数变换对训练数据进行数据变换,完成预处理数据集。
进一步的,在上述技术方案中,骨干层中包含激活层,激活层中的激活函数对矩形运算后的结果进行非线性转换,非线性转换通过ReLU函数进行,ReLU函数公式为:
f(V)=max(0,V);
f(V)为激活函数ReLU函数,max为矩形运算后的结果,V为输入层的训练数据;ReLU函数输出结果为:
R=max(0,WV+B);
其中,R为ReLU函数输出结果,max为矩形运算后的结果,W和b为连接输入层和骨干层系数。
进一步的,在上述技术方案中,输出层中包含Softmax层,Softmax层将输出层中的ReLU函数输出结果正规化,具体操作公式为:
其中,所述Si为所述正规化输出结果,所述i表示所述训练函数序号,所述ei表示以e为底所有训练数据的指数幂,所述ej表示所有指数幂求和,所述j表示所述训练函数个数;
通过交叉熵损失计算正规化输出结果的准确性,以降低交叉熵损失,以提高结果准确性,交叉熵损失计算方法为计算正规化输出结果对数的负数。
其中,Softmax是一种激活函数,理解为归一化,可以将一个数值向量归一化为一个概率分布向量,且各个向量之和为1;Softmax层作为卷积神经网络的最后一层,用于输出;
交叉熵损失计算,具体公式为:
L=-[y log y+(1-y)log(1-y)];
其中,L为损失函数结果,y为正规化输出结果。
其中,在上述技术方案中,患病风险值,计算公式为:
S=P×Q;
其中:S为患病风险值事件发生的可能性;P为患病风险值事件发生的频率;Q指患病风险值事件发生时的影响程度;
可能性依据慢性病影响因素发生频率由低到高分为四个等级,其中,等级一为极少发生或不太可能发生;等级二为可能发生或在检测期间有可能发生不超过一次;等级三为很可能发生或在整个作业期间很可能多次发生;等级四为经常有发生。
本发明第二方面提供一种计算机可读存储介质,其中,所述计算机可读存储介质中存储有程序指令,所述程序指令运行时,用于执行上述的一种慢性病风险评估模型建立方法。
本发明第三方面提供一种慢性病风险评估模型建立方法,包括上述的一种计算机可读存储介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种慢性病风险评估模型建立方法、介质及***,其特征在于,
S10,获取样本参数,所述样本参数包括慢性病患者参数和健康人群参数的相关数据,所述样本参数用于分析常见慢性病影响因素,所述慢性病影响因素包括饮食、运动、熬夜以及遗传,所述相关数据包括所述慢性病患者和所述健康人群的年龄、性别、体重指数、血压、血糖、胆固醇指标;
S20,获取慢性病患者和健康人群的相关数据,建立初始神经网络;
S30,根据所述慢性病影响因素计算风险等级,所述风险等级以所述慢性病患病的可能性进行划分,分为超危、高危、中危、低危四个等级;
S40,根据所述风险等级进行风险分析,获取慢性病患病风险的风险事件,根据所述风险事件获取慢性病风险分析结果,所述风险事件为所述慢性病潜在影响因素中,包括不合理饮食、缺乏运动、长期熬夜以及遗传;
S50,对所述初始神经网络进行优化训练,得到慢性病风险评估模型,将待分析对象的样本参数输入至慢性病风险评估模型中进行慢性病风险评估;
S60,根据慢性病风险评估模型的输出数据得到所述待分析对象的慢性病风险评估结果。
2.根据权利要求1所述的一种慢性病风险评估模型建立方法、介质及***,其特征在于,建立所述慢性病风险评估模型,具体步骤为:
获取所述慢性病影响因素以及持续时间的相关数据,作为训练数据;
所述训练数据具体为:随机采集100个慢性病患者的100天机体活动测评,所述慢性病患者包括重度慢性病患者以及轻度慢性病患者;
根据所训练数据提取所述慢性病潜在影响因素并确定所述相关数据具体数值,所述相关数据包括所述慢性病患者的年龄、性别、体重指数、血压、血糖、胆固醇指标;
基于所述训练数据以及医生判断的患病风险轻重作为深度学习网络训练样本,将深度学习网络训练样本按6:4的比例划分为训练集、验证集,构建所述初始神经网络;
采用所述训练集对所述初始神经网络通过训练得到所述慢性病风险评估模型;
采用所述验证集对所述慢性病风险评估模型进行验证和测试,优化所述慢性病风险评估模型;
其中,所述慢性病潜在影响因素包括:不合理饮食、缺乏运动、长期熬夜以及遗传。
3.根据权利要求2所述的一种慢性病风险评估模型建立方法、介质及***,其特征在于,所述采用所述训练集对所述初始神经网络通过训练得到所述慢性病风险评估模型,具体步骤为:
获取所述训练数据,其中,所述慢性病潜在影响因素根据所述持续时间对应标记分数,根据统计,我们将所述慢性病潜在影响定义为标记积分1,其他情况标记积分为0;
所述慢性病潜在影响因素包括不合理饮食、缺乏运动、长期熬夜;
其中,所述不合理饮食为在所述100天机体活动测评中,累计超过40天饮食时间不规律,所述标记分数为1;其中,所述饮食时间不规律包括时间上不规律以及结构上不规律,所述时间上不规律是指未按时进食,所述结构上不规律指饮食结构单一或不能满足人体生理活动需求;
所述缺乏运动为在所述100天机体活动测评中,累计超过40天未进行运动活动,所述标记积分为1;
所述长期熬夜为在所述100天机体活动测评中,累计超过40天在11:00后入睡,标记分数为1;
以所述训练数据作为样本,并以对应的所述标记分数作为标签,对所述机体活动测评结果进行向量计算;
获取所述积分向量以及对应所述医生判断的患病风险轻重,对所述积分向量的权重对由所述慢性病风险评估模型的所述医生判断的患病风险轻重的输出进行加权,以及将所述加权医生输出求和,输出的慢性病患病风险即为所述加权医生输出求和;
对所述初始神经网络进行训练,以获得慢性病风险评估模型。
4.根据权利要求1所述的一种慢性病风险评估模型建立方法、介质及***,其特征在于,所述初始神经网络网络包含1个输入层、1个骨干层以及1个输出层,当所述慢性病风险评估模型输出结果与所述医生判断的患病风险轻重相差超过10%,通过反向传播对参数进行优化,所述参数优化通过梯度下降法进行反向传播网络训练,更新所述骨干层的参数;
其中,所述参数为W和b,所述W和b分别连接所述输入层和所述骨干层,所述骨干层和所述输出层;所述W表示权重,所述b表示偏差。
5.根据权利要求4所述的一种慢性病风险评估模型建立方法、介质及***,其特征在于,所述骨干层用于处理所述训练数据,对所述训练数据进行预处理,得到的预处理数据集;
所述训练数据由所述输入层转换到所述骨干层,通过矩阵运算公式为:
H=X×W1+b1;
其中,所述H为所述骨干层;所述X为所述输入层;所述W1和b1连接所述输入层和所述骨干层;所述训练数据由所述骨干层转换到所述输出层,通过矩阵运算公式为:
Y=H×W2+b2;
其中,所述Y为所述输出层;所述H为所述骨干层;所述W2和b2连接所述骨干层和所述输出层。
6.根据权利要求4所述的一种慢性病风险评估模型建立方法、介质及***,其特征在于,所述骨干层中包含激活层,所述激活层中的激活函数对所述矩形运算后的结果进行非线性转换,所述非线性转换通过ReLU函数进行,所述ReLU函数公式为:
f(V)=max(0,V);
所述f(V)为所述激活函数ReLU函数,所述max为所述矩形运算后的结果,所述V为所述输入层的所述训练数据;所述ReLU函数输出结果为:
R=max(0,WV+B);
其中,所述R为所述ReLU函数输出结果,所述max为所述矩形运算后的结果,所述W和b为连接所述输入层和所述骨干层系数。
7.根据权利要求6所述的一种慢性病风险评估模型建立方法、介质及***,其特征在于,所述输出层中包含Softmax层,所述Softmax层将所述输出层中的所述ReLU函数输出结果正规化,具体操作公式为:
其中,所述Si为所述正规化输出结果,所述i表示所述训练函数序号,所述ei表示以e为底所有训练数据的指数幂,所述ej表示所有指数幂求和,所述j表示所述训练函数个数;
通过交叉熵损失计算所述正规化输出结果的准确性,以降低所述交叉熵损失,以提高结果准确性,所述交叉熵损失计算方法为计算所述正规化输出结果对数的负数。
8.根据权利要求1所述的一种慢性病风险评估模型建立方法、介质及***,其特征在于,所述患病风险值,计算公式为:
S=P×Q;
其中:所述S为所述患病风险值事件发生的可能性;所述P为所述患病风险值事件发生的频率;所述Q指所述患病风险值事件发生时的影响程度;
所述可能性依据所述慢性病影响因素发生频率由低到高分为四个等级,其中,等级一为极少发生或不太可能发生;等级二为可能发生或在检测期间有可能发生不超过一次;等级三为很可能发生或在整个作业期间很可能多次发生;等级四为经常有发生。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有程序指令,所述程序指令运行时,用于执行权利要求1-8任一项所述的一种慢性病风险评估模型建立方法。
10.一种慢性病风险评估模型建立方法,其特征在于,包括权利要求9所述的一种计算机可读存储介质。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310531805.8A CN116564521A (zh) | 2023-05-11 | 2023-05-11 | 一种慢性病风险评估模型建立方法、介质及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310531805.8A CN116564521A (zh) | 2023-05-11 | 2023-05-11 | 一种慢性病风险评估模型建立方法、介质及*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116564521A true CN116564521A (zh) | 2023-08-08 |
Family
ID=87494123
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310531805.8A Pending CN116564521A (zh) | 2023-05-11 | 2023-05-11 | 一种慢性病风险评估模型建立方法、介质及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116564521A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117558460A (zh) * | 2024-01-11 | 2024-02-13 | 卓世未来(天津)科技有限公司 | 基于小样本学习和大语言模型的慢性病管理方法及*** |
-
2023
- 2023-05-11 CN CN202310531805.8A patent/CN116564521A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117558460A (zh) * | 2024-01-11 | 2024-02-13 | 卓世未来(天津)科技有限公司 | 基于小样本学习和大语言模型的慢性病管理方法及*** |
CN117558460B (zh) * | 2024-01-11 | 2024-04-05 | 卓世未来(天津)科技有限公司 | 基于小样本学习和大语言模型的慢性病管理方法及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107153774A (zh) | 慢性病风险评估双曲线模型的构建及应用该模型的疾病预测*** | |
CN110706822B (zh) | 基于逻辑回归模型和决策树模型的健康管理方法 | |
CN114023441A (zh) | 基于可解释机器学习模型的严重aki早期风险评估模型、装置及其开发方法 | |
CN112967803A (zh) | 基于集成模型的急诊患者早期死亡率预测方法及*** | |
CN107145715B (zh) | 一种基于推举算法的临床医学智能判别装置 | |
Jalali et al. | Advanced analytics for outcome prediction in intensive care units | |
CN113838577B (zh) | 便捷化分层老年mods早期死亡风险评估模型、装置及建立方法 | |
CN112786203A (zh) | 一种机器学习糖尿病视网膜病变发病风险预测方法及应用 | |
CN115862850B (zh) | 基于纵向多维数据的肝细胞癌监测模型的建模方法及装置 | |
CN116564521A (zh) | 一种慢性病风险评估模型建立方法、介质及*** | |
CN113744877A (zh) | 一种带有疾病相关因素提取模块的慢性病评估及干预*** | |
CN114974585A (zh) | 一种妊娠期代谢综合征早期风险预测评估模型构建方法 | |
JP2023036652A (ja) | 人体の健康状態を推定するシステム | |
CN116864104A (zh) | 基于人工智能的慢性血栓栓塞性肺动脉高压风险分级*** | |
CN117116477A (zh) | 基于随机森林和XGBoost的***癌患病风险预测模型的构建方法及*** | |
TWI688371B (zh) | 心房顫動信號型態擷取及輔助診斷智能裝置 | |
CN112768074A (zh) | 一种基于人工智能的重疾风险预测方法及*** | |
CN116864062B (zh) | 一种基于互联网的健康体检报告数据分析管理*** | |
CN113096127A (zh) | 一种脑网络演化模型的生成***及方法 | |
CN110610766A (zh) | 基于症状特征权重推导疾病概率的装置和存储介质 | |
CN116417141A (zh) | 基于人工智能的1型糖尿病健康评估模型及方法 | |
CN114864086A (zh) | 一种基于肺功能报告模板的疾病预测方法 | |
CN115273176A (zh) | 一种基于生命体征和表情的疼痛多算法客观评估方法 | |
CN109192306A (zh) | 一种糖尿病的判断装置、设备及计算机可读存储介质 | |
CN112086130B (zh) | 一种基于测序和数据分析的肥胖风险预测装置的预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |