CN116564521A - 一种慢性病风险评估模型建立方法、介质及*** - Google Patents

一种慢性病风险评估模型建立方法、介质及*** Download PDF

Info

Publication number
CN116564521A
CN116564521A CN202310531805.8A CN202310531805A CN116564521A CN 116564521 A CN116564521 A CN 116564521A CN 202310531805 A CN202310531805 A CN 202310531805A CN 116564521 A CN116564521 A CN 116564521A
Authority
CN
China
Prior art keywords
chronic disease
disease risk
risk assessment
risk
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310531805.8A
Other languages
English (en)
Inventor
刘仲春
张迎迎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Community Health Service Center Of Zhenjiang Road Shibei District Qingdao
Original Assignee
Community Health Service Center Of Zhenjiang Road Shibei District Qingdao
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Community Health Service Center Of Zhenjiang Road Shibei District Qingdao filed Critical Community Health Service Center Of Zhenjiang Road Shibei District Qingdao
Priority to CN202310531805.8A priority Critical patent/CN116564521A/zh
Publication of CN116564521A publication Critical patent/CN116564521A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • Medical Informatics (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Epidemiology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Databases & Information Systems (AREA)
  • Primary Health Care (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Pathology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明提供了一种慢性病风险评估模型建立方法、介质及***,属于风险评估技术领域,该慢性病风险评估模型建立方法、介质及***获取慢性病患者和健康人群的相关数据,建立初始神经网络;根据所述慢性病影响因素计算风险等级,所述风险等级以所述慢性病患病的可能性进行划分,分为超危、高危、中危、低危四个等级;根据所述风险等级进行风险分析,获取慢性病患病风险的风险事件,根据所述风险事件获取慢性病风险分析结果;对所述初始神经网络进行优化训练,得到慢性病风险评估模型,将待分析对象的样本参数输入至慢性病风险评估模型中进行慢性病风险评估;根据慢性病风险评估模型的输出数据得到所述待分析对象的慢性病风险评估结果。

Description

一种慢性病风险评估模型建立方法、介质及***
技术领域
本发明属于风险评估技术领域,具体而言,涉及一种慢性病风险评估模型建立方法、介质及***。
背景技术
随着社会经济的快速发展,慢性病已经成为影响居民健康的重大医疗问题。现代社会生活节奏加快,人们往往忽视健康,摄入过多的高热量、高脂肪、高糖食物,缺乏运动,熬夜,吸烟和饮酒等不良生活习惯增加了慢性病的风险。据***统计,我国目前已确诊的慢性病患者超过2.6亿人,且每年死于慢性病的人数超过300万人。慢性病的危害主要是造成脑、心、肾等重要脏器的损害,易造成伤残,影响劳动能力和生活质量,且医疗费用极其昂贵,增加了社会和家庭的经济负担。我国慢性病患者技术庞大,慢性病管理难度巨大,如何有效评估慢性病具有重要意义。
随着医学技术的发展,对慢性病的诊断能力和意识得到提高,使得许多慢性病在早期就被发现和诊断,进而增加了患病年龄段的统计数据,但由于慢性病致病因素多,变量间关系错综复杂,采用传统的风险评估方法难以发现病变的内在规律,严重影响了慢性病精准防控措施的有效实施。
发明内容
有鉴于此,本发明提供一种慢性病风险评估模型建立方法、介质及***,能够根据待检测者的日常生活习惯判断是否患病,解决慢性病在日常生活中容易被忽视的问题,可以实现人们能够独立判断是否患有慢性病。
本发明是这样实现的:
本发明第一方面提供一种慢性病风险评估模型建立方法,其中,
S10,获取样本参数,所述样本参数包括慢性病患者参数和健康人群参数的相关数据,所述样本参数用于分析常见慢性病影响因素,所述慢性病影响因素包括饮食、运动、熬夜以及遗传,所述相关数据包括所述慢性病患者和所述健康人群的年龄、性别、体重指数、血压、血糖、胆固醇指标;
S20,获取慢性病患者和健康人群的相关数据,建立初始神经网络;
S30,根据所述慢性病影响因素计算风险等级,所述风险等级以所述慢性病患病的可能性进行划分,分为超危、高危、中危、低危四个等级;
S40,根据所述风险等级进行风险分析,获取慢性病患病风险的风险事件,根据所述风险事件获取慢性病风险分析结果,所述风险事件为所述慢性病潜在影响因素中,包括不合理饮食、缺乏运动、长期熬夜以及遗传;
S50,对所述初始神经网络进行优化训练,得到慢性病风险评估模型,将待分析对象的样本参数输入至慢性病风险评估模型中进行慢性病风险评估;
S60,根据慢性病风险评估模型的输出数据得到所述待分析对象的慢性病风险评估结果。
本发明提供的一种慢性病风险评估模型建立方法、介质及***的技术效果如下:通过卷积神经网络,可以建立所述慢性病风险评估模型,具体步骤是:
获取所述慢性病患者的相关数据,输入是所述慢性病患者的训练数据,输出是所述医生判断的患病风险轻重,建立所述初始神经网络,利用所述初始神经网络,可以经过所述训练集和所述验证集,
对所述慢性病风险评估模型进行验证和测试,通过反向传播对参数进行优化,可以实时更新所述骨干层的参数,将所述初始神经网络参数进行转化,实现由低精度到高精度的操作过程,获得更为精确的所述参数,由此得到与所述医生判断的患病风险轻重更相近的所述慢性病风险评估模型,通过交叉熵损失函数的计算可以计算损失函数值,对参数进行优化,可以使所述慢性病风险评估模型更精确,通过建立所述慢性病风险评估模型可以根据所述待分析对象的样本参数对所述待分析对象进行风险评估,根据所述慢性病风险评估模型的输出数据得到所述待分析对象的慢性病风险评估结果。
在上述技术方案的基础上,本发明的一种慢性病风险评估模型建立方法、介质及***还可以做如下改进:
其中,建立所述慢性病风险评估模型,具体步骤为:
获取所述慢性病影响因素以及持续时间的相关数据,作为训练数据;
所述训练数据具体为:随机采集100个慢性病患者的100天机体活动测评,所述慢性病患者包括重度慢性病患者以及轻度慢性病患者;
根据所训练数据提取所述慢性病潜在影响因素并确定所述相关数据具体数值,所述相关数据包括所述慢性病患者的年龄、性别、体重指数、血压、血糖、胆固醇指标;
基于所述训练数据以及医生判断的患病风险轻重作为深度学习网络训练样本,将深度学习网络训练样本按6:4的比例划分为训练集、验证集,构建所述初始神经网络;
采用所述训练集对所述初始神经网络通过训练得到所述慢性病风险评估模型;
采用所述验证集对所述慢性病风险评估模型进行验证和测试,优化所述慢性病风险评估模型;
其中,所述慢性病潜在影响因素包括:不合理饮食、缺乏运动、长期熬夜以及遗传。
采用上述改进方案的有益效果为:通过采集所述重度慢性病患者以及所述轻度慢性病患者的所述训练数据,可以对所述慢性病潜在影响因素进行风险分析,获得所述慢性病潜在影响因素对慢性病患病的影响程度;
通过将深度学习网络训练样本划分为所述训练集、所述验证集,可以通过训练得到所述慢性病风险评估模型并对所述初始神经网络进行训练和测试,并对得到的所述慢性病风险评估模型进行优化。
进一步的,所述采用所述训练集对所述初始神经网络通过训练得到所述慢性病风险评估模型,具体步骤为:
获取所述训练数据,其中,所述慢性病潜在影响因素根据所述持续时间对应标记分数,根据统计,我们将所述慢性病潜在影响定义为标记积分1,其他情况标记积分为0;
所述慢性病潜在影响因素包括不合理饮食、缺乏运动、长期熬夜;
其中,所述不合理饮食为在所述100天机体活动测评中,累计超过40天饮食时间不规律,所述标记分数为1;其中,所述饮食时间不规律包括时间上不规律以及结构上不规律,所述时间上不规律是指未按时进食,所述结构上不规律指饮食结构单一或不能满足人体生理活动需求;
所述缺乏运动为在所述100天机体活动测评中,累计超过40天未进行运动活动,所述标记积分为1;
所述长期熬夜为在所述100天机体活动测评中,累计超过40天在11:00后入睡,标记分数为1;
以所述训练数据作为样本,并以对应的所述标记分数作为标签,对所述机体活动测评结果进行向量计算;
获取所述积分向量以及对应所述医生判断的患病风险轻重,对所述积分向量的权重对由所述慢性病风险评估模型的所述医生判断的患病风险轻重的输出进行加权,以及将所述加权医生输出求和,输出的慢性病患病风险即为所述加权医生输出求和;
对所述初始神经网络进行训练,以获得慢性病风险评估模型。
采用上述改进方案的有益效果为:通过将所述慢性病潜在影响分别进行标记积分,可以将所述慢性病影响因素进行定义,将所述慢性病潜在影响定义为标记积分1,其他情况标记积分为0,通过所述标记积分可以获得所述慢性病影响因素对应的所述医生判断的患病风险轻重;
通过对积分向量的权重由所述慢性病风险评估模型的所述医生判断的患病风险轻重的输出进行加权,以及将加权医生输出求和,可以得到输出的慢性病患病风险为多个结果的平均值,使所述输出的慢性病患病风险评估更为精确。
其中,所述初始神经网络网络包含1个输入层、1个骨干层以及1个输出层,当所述慢性病风险评估模型输出结果与所述医生判断的患病风险轻重相差超过10%,通过反向传播对参数进行优化,所述参数优化通过梯度下降法进行反向传播网络训练,更新所述骨干层的参数;
其中,所述参数为W和b,所述W和b分别连接所述输入层和所述骨干层,所述骨干层和所述输出层;所述W表示权重,所述b表示偏差。
采用上述改进方案的有益效果为:通过所述梯度下降法对所述参数进行更新,所述慢性病风险评估模型学习的速度取决于两个值:一、学习率;二、偏导值;其中,所述学习率为设置的超参数,所述偏导值的大小取决于xo和[e(s)-y],所述[e(s)-y]的大小反应模型的错误程度,其中,所述xo为所述输入层的第o个元素,所述y为所述慢性病风险评估模型的输出;
该值越大,说明模型效果越差,模型学习速度更快,结合交叉熵当损失函数时,在模型效果差的时候学习速度快,在模型效果好的时候学习速度慢。
进一步的,所述骨干层用于处理所述训练数据,对所述训练数据进行预处理,得到的预处理数据集;
所述训练数据由所述输入层转换到所述骨干层,通过矩阵运算公式为:
H=X×W1+b1;
其中,所述H为所述骨干层;所述X为所述输入层;所述W1和b1连接所述输入层和所述骨干层;所述训练数据由所述骨干层转换到所述输出层,通过矩阵运算公式为:
Y=H×W2+b2;
其中,所述Y为所述输出层;所述H为所述骨干层;所述W2和b2连接所述骨干层和所述输出层。
采用上述改进方案的有益效果为:通过对所述训练数据进行预处理,包括标准化、归一化,可以对所述训练数据进行正规化,把数据的延展控制在一定范围内,可以加速所述初始神经网络训练,提高稳定性,在所述初始神经网络中使用标准化后的数据进行训练。
进一步的,所述骨干层中包含激活层,所述激活层中的激活函数对所述矩形运算后的结果进行非线性转换,所述非线性转换通过ReLU函数进行,所述ReLU函数公式为:
f(V)=max(0,V);
所述f(V)为所述激活函数ReLU函数,所述max为所述矩形运算后的结果,所述V为所述输入层的所述训练数据;所述ReLU函数输出结果为:
R=max(0,WV+B);
其中,所述R为所述ReLU函数输出结果,所述max为所述矩形运算后的结果,所述W和b为连接所述输入层和所述骨干层系数。
采用上述改进方案的有益效果为:通过所述激活层中的所述激活函数对矩形运算后的结果进行所述非线性转换,通过所述ReLU函数进行所述非线性转换,所述ReLU函数的具体步骤为:
在所述深度学习网络的所述骨干层添加ReLU激活函数,次前向传播过程中,层与层之间在做stack操作;两层之间,上一层经过ReLU后,传入下一层,下一层的每个神经元里面含有了上一层的add操作;stack和add操作相互交融,使得ReLU有了非线性表达能力;
最终实现将矩形运算后的结果的线性不可分变成高维空间的线性可分的数据,将所述矩形运算后的结果映射到高斯分布,可以稳定方差并最小化偏差。
进一步的,所述输出层中包含Softmax层,所述Softmax层将所述输出层中的所述ReLU函数输出结果正规化,具体操作公式为:
其中,所述Si为所述正规化输出结果,所述i表示所述训练函数序号,所述el表示以e为底所有训练数据的指数幂,所述ej表示所有指数幂求和,所述j表示所述训练函数个数;
通过交叉熵损失计算所述正规化输出结果的准确性,以降低所述交叉熵损失,以提高结果准确性,所述交叉熵损失计算方法为计算所述正规化输出结果对数的负数。
采用上述改进方案的有益效果为:通过交叉熵损失计算所述正规化输出结果的准确性,可以计算损失函数值,交叉熵损失函数可以捕捉到所述初始神经网络与所述慢性病风险评估模型之间预测效果的差异,降低所述交叉熵损失可以提高结果准确性。
其中,所述患病风险值,计算公式为:
S=P×Q;
其中:所述S为所述患病风险值事件发生的可能性;所述P为所述患病风险值事件发生的频率;所述Q指所述患病风险值事件发生时的影响程度;
所述可能性依据所述慢性病影响因素发生频率由低到高分为四个等级,其中,等级一为极少发生或不太可能发生;等级二为可能发生或在检测期间有可能发生不超过一次;等级三为很可能发生或在整个作业期间很可能多次发生;等级四为经常有发生。
采用上述改进方案的有益效果为:通过计算所述患病风险值,可以根据所述患病风险值事件发生的频率以及所述患病风险值事件发生时的影响程度评价所述风险等级,所述患病风险值对所述风险等级的评价按照所述患病风险值由大到小对所述风险等级进行排序;依次排序为超危、高危、中危、低危四个等级。
本发明第二方面提供一种计算机可读存储介质,其中,所述计算机可读存储介质中存储有程序指令,所述程序指令运行时,用于执行上述的一种慢性病风险评估模型建立方法。
本发明第三方面提供一种慢性病风险评估模型建立方法,包括上述的一种计算机可读存储介质。
与现有技术相比较,本发明提供的一种慢性病风险评估模型建立方法、介质及***的有益效果是:获取慢性病患者和健康人群的相关数据,建立初始神经网络;根据所述慢性病影响因素计算风险等级,所述风险等级以所述慢性病患病的可能性进行划分,分为超危、高危、中危、低危四个等级;根据所述风险等级进行风险分析,获取慢性病患病风险的风险事件,根据所述风险事件获取慢性病风险分析结果;对所述初始神经网络进行优化训练,得到慢性病风险评估模型,将待分析对象的样本参数输入至慢性病风险评估模型中进行慢性病风险评估。能够根据待检测者的日常生活习惯判断是否患病,能够解决慢性病在日常生活中容易被忽视的问题,可以实现人们能够独立判断是否患有慢性病。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明第一方面提供一种慢性病风险评估模型建立方法的流程图。
具体实施方式
为使本发明实施方式的目的、技术方案和优点更加清楚,下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
因此,以下对在附图中提供的本发明的实施方式的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”、“顺时针”、“逆时针”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的设备或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
如图1所示,是本发明提供的一种慢性病风险评估模型建立方法的流程图,本方法包括,
S10,获取样本参数,样本参数包括慢性病患者参数和健康人群参数的相关数据,样本参数用于分析常见慢性病影响因素,慢性病影响因素包括饮食、运动、熬夜以及遗传,相关数据包括慢性病患者和健康人群的年龄、性别、体重指数、血压、血糖、胆固醇指标;
S20,获取慢性病患者和健康人群的相关数据,建立初始神经网络;
S30,根据慢性病影响因素计算风险等级,风险等级以慢性病患病的可能性进行划分,分为超危、高危、中危、低危四个等级;
S40,根据风险等级进行风险分析,获取慢性病患病风险的风险事件,根据风险事件获取慢性病风险分析结果,风险事件为慢性病潜在影响因素中,包括不合理饮食、缺乏运动、长期熬夜以及遗传;
S50,对初始神经网络进行优化训练,得到慢性病风险评估模型,将待分析对象的样本参数输入至慢性病风险评估模型中进行慢性病风险评估;
S60,根据慢性病风险评估模型的输出数据得到待分析对象的慢性病风险评估结果。
其中,计算风险等级,具体步骤为:
对常见慢性病影响因素制定风险等级,根据慢性病影响因素来基于***方法和慢性病风险评估经验赋予量值;
进行风险分析,获取慢性病风险的主要风险事件;
计算出患病风险值;
根据患病风险值评价风险等级,患病风险值评价按照患病风险值由大到小对风险等级进行排序;
风险值由大到小依次划分为超危、高危、中危、低危四个等级,
超危为风险值超过80%,高危为风险值超过60%,中危为风险值超过40%,低危为风险值低于40%。
其中,在上述技术方案中,建立慢性病风险评估模型,具体步骤为:
获取慢性病影响因素以及持续时间的相关数据,作为训练数据;
训练数据具体为:随机采集100个慢性病患者的100天机体活动测评,慢性病患者包括重度慢性病患者以及轻度慢性病患者;
根据所训练数据提取慢性病潜在影响因素并确定相关数据具体数值,相关数据包括慢性病患者的年龄、性别、体重指数、血压、血糖、胆固醇指标;
基于训练数据以及医生判断的患病风险轻重作为深度学习网络训练样本,将深度学习网络训练样本按6:4的比例划分为训练集、验证集,构建初始神经网络;
采用训练集对初始神经网络通过训练得到慢性病风险评估模型;
采用验证集对慢性病风险评估模型进行验证和测试,优化慢性病风险评估模型;
其中,慢性病潜在影响因素包括:不合理饮食、缺乏运动、长期熬夜以及遗传。
进一步的,在上述技术方案中,采用训练集对初始神经网络通过训练得到慢性病风险评估模型,具体步骤为:
获取训练数据,其中,慢性病潜在影响因素根据持续时间对应标记分数,根据统计,我们将慢性病潜在影响定义为标记积分1,其他情况标记积分为0;
慢性病潜在影响因素包括不合理饮食、缺乏运动、长期熬夜;
其中,不合理饮食为在100天机体活动测评中,累计超过40天饮食时间不规律,标记分数为1;其中,饮食时间不规律包括时间上不规律以及结构上不规律,时间上不规律是指未按时进食,结构上不规律指饮食结构单一或不能满足人体生理活动需求;
缺乏运动为在100天机体活动测评中,累计超过40天未进行运动活动,标记积分为1;
长期熬夜为在100天机体活动测评中,累计超过40天在11:00后入睡,标记分数为1;
以训练数据作为样本,并以对应的标记分数作为标签,对机体活动测评结果进行向量计算;
获取积分向量以及对应医生判断的患病风险轻重,对积分向量的权重对由慢性病风险评估模型的医生判断的患病风险轻重的输出进行加权,以及将加权医生输出求和,输出的慢性病患病风险即为加权医生输出求和;
对初始神经网络进行训练,以获得慢性病风险评估模型。
其中,在上述技术方案中,初始神经网络网络包含1个输入层、1个骨干层以及1个输出层,当慢性病风险评估模型输出结果与医生判断的患病风险轻重相差超过10%,通过反向传播对参数进行优化,参数优化通过梯度下降法进行反向传播网络训练,更新骨干层的参数;
其中,参数为W和b,W和b分别连接输入层和骨干层,骨干层和输出层;W表示权重,b表示偏差。
梯度下降法,具体运算步骤为:
第一步:计算训练数据的参数W和b对于损失函数的梯度,计算所有参数W的梯度的总和,计算所有参数b的训练数据的梯度的总和;
第二步:计算所有训练数据的参数W和参数b的梯度的平均值;
第三步:通过计算更新训练数据的权重和偏差,
计算公式为:
其中,a为学习率,Wt+1为更新后的权重,Wt为权重的初始值,t为训练数据的序号;
其中,a为学习率,bt+1为更新后的偏差,bt为偏差的初始值,t为训练数据的序号。
进一步的,在上述技术方案中,骨干层用于处理训练数据,对训练数据进行预处理,得到的预处理数据集;
训练数据由输入层转换到骨干层,通过矩阵运算公式为:
H=X×W1+b1;
其中,H为骨干层;X为输入层;W1和b1连接输入层和骨干层;训练数据由骨干层转换到输出层,通过矩阵运算公式为:
Y=H×W2+b2;
其中,Y为输出层;H为骨干层;W2和b2连接骨干层和输出层。
对训练数据预处理后得到的预处理数据集的步骤具体包括
获取训练数据,对训练数据进行数据清洗,即缺失值、异常值处理;
对持续时间的相关数据进行差分运算,对训练数据进行数据归一化处理,数据归一化处理通过最大最小标准化进行,最大最小标准化公式为:
其中,X′为进行数据归一化处理后的训练数据,x为训练数据,Xmin为训练数据最小值,Xmax为训练数据最大值;
通过统计方法进行选择训练数据,训练数据用于建模和分析;
通过指数变换对训练数据进行数据变换,完成预处理数据集。
进一步的,在上述技术方案中,骨干层中包含激活层,激活层中的激活函数对矩形运算后的结果进行非线性转换,非线性转换通过ReLU函数进行,ReLU函数公式为:
f(V)=max(0,V);
f(V)为激活函数ReLU函数,max为矩形运算后的结果,V为输入层的训练数据;ReLU函数输出结果为:
R=max(0,WV+B);
其中,R为ReLU函数输出结果,max为矩形运算后的结果,W和b为连接输入层和骨干层系数。
进一步的,在上述技术方案中,输出层中包含Softmax层,Softmax层将输出层中的ReLU函数输出结果正规化,具体操作公式为:
其中,所述Si为所述正规化输出结果,所述i表示所述训练函数序号,所述ei表示以e为底所有训练数据的指数幂,所述ej表示所有指数幂求和,所述j表示所述训练函数个数;
通过交叉熵损失计算正规化输出结果的准确性,以降低交叉熵损失,以提高结果准确性,交叉熵损失计算方法为计算正规化输出结果对数的负数。
其中,Softmax是一种激活函数,理解为归一化,可以将一个数值向量归一化为一个概率分布向量,且各个向量之和为1;Softmax层作为卷积神经网络的最后一层,用于输出;
交叉熵损失计算,具体公式为:
L=-[y log y+(1-y)log(1-y)];
其中,L为损失函数结果,y为正规化输出结果。
其中,在上述技术方案中,患病风险值,计算公式为:
S=P×Q;
其中:S为患病风险值事件发生的可能性;P为患病风险值事件发生的频率;Q指患病风险值事件发生时的影响程度;
可能性依据慢性病影响因素发生频率由低到高分为四个等级,其中,等级一为极少发生或不太可能发生;等级二为可能发生或在检测期间有可能发生不超过一次;等级三为很可能发生或在整个作业期间很可能多次发生;等级四为经常有发生。
本发明第二方面提供一种计算机可读存储介质,其中,所述计算机可读存储介质中存储有程序指令,所述程序指令运行时,用于执行上述的一种慢性病风险评估模型建立方法。
本发明第三方面提供一种慢性病风险评估模型建立方法,包括上述的一种计算机可读存储介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种慢性病风险评估模型建立方法、介质及***,其特征在于,
S10,获取样本参数,所述样本参数包括慢性病患者参数和健康人群参数的相关数据,所述样本参数用于分析常见慢性病影响因素,所述慢性病影响因素包括饮食、运动、熬夜以及遗传,所述相关数据包括所述慢性病患者和所述健康人群的年龄、性别、体重指数、血压、血糖、胆固醇指标;
S20,获取慢性病患者和健康人群的相关数据,建立初始神经网络;
S30,根据所述慢性病影响因素计算风险等级,所述风险等级以所述慢性病患病的可能性进行划分,分为超危、高危、中危、低危四个等级;
S40,根据所述风险等级进行风险分析,获取慢性病患病风险的风险事件,根据所述风险事件获取慢性病风险分析结果,所述风险事件为所述慢性病潜在影响因素中,包括不合理饮食、缺乏运动、长期熬夜以及遗传;
S50,对所述初始神经网络进行优化训练,得到慢性病风险评估模型,将待分析对象的样本参数输入至慢性病风险评估模型中进行慢性病风险评估;
S60,根据慢性病风险评估模型的输出数据得到所述待分析对象的慢性病风险评估结果。
2.根据权利要求1所述的一种慢性病风险评估模型建立方法、介质及***,其特征在于,建立所述慢性病风险评估模型,具体步骤为:
获取所述慢性病影响因素以及持续时间的相关数据,作为训练数据;
所述训练数据具体为:随机采集100个慢性病患者的100天机体活动测评,所述慢性病患者包括重度慢性病患者以及轻度慢性病患者;
根据所训练数据提取所述慢性病潜在影响因素并确定所述相关数据具体数值,所述相关数据包括所述慢性病患者的年龄、性别、体重指数、血压、血糖、胆固醇指标;
基于所述训练数据以及医生判断的患病风险轻重作为深度学习网络训练样本,将深度学习网络训练样本按6:4的比例划分为训练集、验证集,构建所述初始神经网络;
采用所述训练集对所述初始神经网络通过训练得到所述慢性病风险评估模型;
采用所述验证集对所述慢性病风险评估模型进行验证和测试,优化所述慢性病风险评估模型;
其中,所述慢性病潜在影响因素包括:不合理饮食、缺乏运动、长期熬夜以及遗传。
3.根据权利要求2所述的一种慢性病风险评估模型建立方法、介质及***,其特征在于,所述采用所述训练集对所述初始神经网络通过训练得到所述慢性病风险评估模型,具体步骤为:
获取所述训练数据,其中,所述慢性病潜在影响因素根据所述持续时间对应标记分数,根据统计,我们将所述慢性病潜在影响定义为标记积分1,其他情况标记积分为0;
所述慢性病潜在影响因素包括不合理饮食、缺乏运动、长期熬夜;
其中,所述不合理饮食为在所述100天机体活动测评中,累计超过40天饮食时间不规律,所述标记分数为1;其中,所述饮食时间不规律包括时间上不规律以及结构上不规律,所述时间上不规律是指未按时进食,所述结构上不规律指饮食结构单一或不能满足人体生理活动需求;
所述缺乏运动为在所述100天机体活动测评中,累计超过40天未进行运动活动,所述标记积分为1;
所述长期熬夜为在所述100天机体活动测评中,累计超过40天在11:00后入睡,标记分数为1;
以所述训练数据作为样本,并以对应的所述标记分数作为标签,对所述机体活动测评结果进行向量计算;
获取所述积分向量以及对应所述医生判断的患病风险轻重,对所述积分向量的权重对由所述慢性病风险评估模型的所述医生判断的患病风险轻重的输出进行加权,以及将所述加权医生输出求和,输出的慢性病患病风险即为所述加权医生输出求和;
对所述初始神经网络进行训练,以获得慢性病风险评估模型。
4.根据权利要求1所述的一种慢性病风险评估模型建立方法、介质及***,其特征在于,所述初始神经网络网络包含1个输入层、1个骨干层以及1个输出层,当所述慢性病风险评估模型输出结果与所述医生判断的患病风险轻重相差超过10%,通过反向传播对参数进行优化,所述参数优化通过梯度下降法进行反向传播网络训练,更新所述骨干层的参数;
其中,所述参数为W和b,所述W和b分别连接所述输入层和所述骨干层,所述骨干层和所述输出层;所述W表示权重,所述b表示偏差。
5.根据权利要求4所述的一种慢性病风险评估模型建立方法、介质及***,其特征在于,所述骨干层用于处理所述训练数据,对所述训练数据进行预处理,得到的预处理数据集;
所述训练数据由所述输入层转换到所述骨干层,通过矩阵运算公式为:
H=X×W1+b1;
其中,所述H为所述骨干层;所述X为所述输入层;所述W1和b1连接所述输入层和所述骨干层;所述训练数据由所述骨干层转换到所述输出层,通过矩阵运算公式为:
Y=H×W2+b2;
其中,所述Y为所述输出层;所述H为所述骨干层;所述W2和b2连接所述骨干层和所述输出层。
6.根据权利要求4所述的一种慢性病风险评估模型建立方法、介质及***,其特征在于,所述骨干层中包含激活层,所述激活层中的激活函数对所述矩形运算后的结果进行非线性转换,所述非线性转换通过ReLU函数进行,所述ReLU函数公式为:
f(V)=max(0,V);
所述f(V)为所述激活函数ReLU函数,所述max为所述矩形运算后的结果,所述V为所述输入层的所述训练数据;所述ReLU函数输出结果为:
R=max(0,WV+B);
其中,所述R为所述ReLU函数输出结果,所述max为所述矩形运算后的结果,所述W和b为连接所述输入层和所述骨干层系数。
7.根据权利要求6所述的一种慢性病风险评估模型建立方法、介质及***,其特征在于,所述输出层中包含Softmax层,所述Softmax层将所述输出层中的所述ReLU函数输出结果正规化,具体操作公式为:
其中,所述Si为所述正规化输出结果,所述i表示所述训练函数序号,所述ei表示以e为底所有训练数据的指数幂,所述ej表示所有指数幂求和,所述j表示所述训练函数个数;
通过交叉熵损失计算所述正规化输出结果的准确性,以降低所述交叉熵损失,以提高结果准确性,所述交叉熵损失计算方法为计算所述正规化输出结果对数的负数。
8.根据权利要求1所述的一种慢性病风险评估模型建立方法、介质及***,其特征在于,所述患病风险值,计算公式为:
S=P×Q;
其中:所述S为所述患病风险值事件发生的可能性;所述P为所述患病风险值事件发生的频率;所述Q指所述患病风险值事件发生时的影响程度;
所述可能性依据所述慢性病影响因素发生频率由低到高分为四个等级,其中,等级一为极少发生或不太可能发生;等级二为可能发生或在检测期间有可能发生不超过一次;等级三为很可能发生或在整个作业期间很可能多次发生;等级四为经常有发生。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有程序指令,所述程序指令运行时,用于执行权利要求1-8任一项所述的一种慢性病风险评估模型建立方法。
10.一种慢性病风险评估模型建立方法,其特征在于,包括权利要求9所述的一种计算机可读存储介质。
CN202310531805.8A 2023-05-11 2023-05-11 一种慢性病风险评估模型建立方法、介质及*** Pending CN116564521A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310531805.8A CN116564521A (zh) 2023-05-11 2023-05-11 一种慢性病风险评估模型建立方法、介质及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310531805.8A CN116564521A (zh) 2023-05-11 2023-05-11 一种慢性病风险评估模型建立方法、介质及***

Publications (1)

Publication Number Publication Date
CN116564521A true CN116564521A (zh) 2023-08-08

Family

ID=87494123

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310531805.8A Pending CN116564521A (zh) 2023-05-11 2023-05-11 一种慢性病风险评估模型建立方法、介质及***

Country Status (1)

Country Link
CN (1) CN116564521A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117558460A (zh) * 2024-01-11 2024-02-13 卓世未来(天津)科技有限公司 基于小样本学习和大语言模型的慢性病管理方法及***

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117558460A (zh) * 2024-01-11 2024-02-13 卓世未来(天津)科技有限公司 基于小样本学习和大语言模型的慢性病管理方法及***
CN117558460B (zh) * 2024-01-11 2024-04-05 卓世未来(天津)科技有限公司 基于小样本学习和大语言模型的慢性病管理方法及***

Similar Documents

Publication Publication Date Title
CN107153774A (zh) 慢性病风险评估双曲线模型的构建及应用该模型的疾病预测***
CN110706822B (zh) 基于逻辑回归模型和决策树模型的健康管理方法
CN114023441A (zh) 基于可解释机器学习模型的严重aki早期风险评估模型、装置及其开发方法
CN112967803A (zh) 基于集成模型的急诊患者早期死亡率预测方法及***
CN107145715B (zh) 一种基于推举算法的临床医学智能判别装置
Jalali et al. Advanced analytics for outcome prediction in intensive care units
CN113838577B (zh) 便捷化分层老年mods早期死亡风险评估模型、装置及建立方法
CN112786203A (zh) 一种机器学习糖尿病视网膜病变发病风险预测方法及应用
CN115862850B (zh) 基于纵向多维数据的肝细胞癌监测模型的建模方法及装置
CN116564521A (zh) 一种慢性病风险评估模型建立方法、介质及***
CN113744877A (zh) 一种带有疾病相关因素提取模块的慢性病评估及干预***
CN114974585A (zh) 一种妊娠期代谢综合征早期风险预测评估模型构建方法
JP2023036652A (ja) 人体の健康状態を推定するシステム
CN116864104A (zh) 基于人工智能的慢性血栓栓塞性肺动脉高压风险分级***
CN117116477A (zh) 基于随机森林和XGBoost的***癌患病风险预测模型的构建方法及***
TWI688371B (zh) 心房顫動信號型態擷取及輔助診斷智能裝置
CN112768074A (zh) 一种基于人工智能的重疾风险预测方法及***
CN116864062B (zh) 一种基于互联网的健康体检报告数据分析管理***
CN113096127A (zh) 一种脑网络演化模型的生成***及方法
CN110610766A (zh) 基于症状特征权重推导疾病概率的装置和存储介质
CN116417141A (zh) 基于人工智能的1型糖尿病健康评估模型及方法
CN114864086A (zh) 一种基于肺功能报告模板的疾病预测方法
CN115273176A (zh) 一种基于生命体征和表情的疼痛多算法客观评估方法
CN109192306A (zh) 一种糖尿病的判断装置、设备及计算机可读存储介质
CN112086130B (zh) 一种基于测序和数据分析的肥胖风险预测装置的预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination