CN112185566B - 一种基于机器学习预测预警感染性疾病就医人数突增的方法 - Google Patents
一种基于机器学习预测预警感染性疾病就医人数突增的方法 Download PDFInfo
- Publication number
- CN112185566B CN112185566B CN202011099761.9A CN202011099761A CN112185566B CN 112185566 B CN112185566 B CN 112185566B CN 202011099761 A CN202011099761 A CN 202011099761A CN 112185566 B CN112185566 B CN 112185566B
- Authority
- CN
- China
- Prior art keywords
- infectious diseases
- early warning
- hospitalized
- sudden increase
- predicting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/50—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/80—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
Landscapes
- Engineering & Computer Science (AREA)
- Public Health (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- Pathology (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Primary Health Care (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Epidemiology (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明是一种基于机器学习预测预警感染性疾病就医人数突增的方法,实现多点监测,多特征的患感染性疾病疫情突增的动态分析预测和灵敏预警。该方法涉及数据统计学、人工智能等领域。本发明方法包括:选取多个医疗机构的每日就医感染性疾病人数和每日的最低气温作为输入特征;选用机器学习模型LightGBM作为训练模型动态预测来日的感染性疾病就医人数;对就医人数的预测值与前M天的真实值进行数据统计分析,提出感染性疾病就医人数突增的预警算法。本发明方法避免了基于单监测点、单一特征时间序列或时态事件对疾病演化过程建模信息损失问题,有效提升了对感染性疾病就医人数预测的精准性和就医人数突增预警的灵敏性。
Description
技术领域
本发明属于数据统计学、人工智能、医疗信息化等领域,涉及一种基于机器学习预测预警感染性疾病就医人数突增的方法。
背景技术
近年来,利用机器学习技术实现对流感等疾病的预测已经成为热点研究问题,特别是今年新冠状病毒肺炎大流行为全人类带来了巨大灾难。如何做到“早发现,早预防,早治疗,早控制”,特别是“早发现”是一项紧迫任务。目前,业内技术的主要问题是单点静态数据研究多,没有形成多点协同触发、动态灵敏的预警研判模式;缺少环境气候关键数据特征等。造成预测精度不高,预警灵敏度低等问题。
发明内容
本发明的目的在于提供一种基于机器学习预测预警感染性疾病就医人数突增的方法,实现多点监测,多特征的患感染性疾病疫情突增的动态分析预测和灵敏预警。
为了达到上述目的,本发明的实现方式是:
使用K个医疗机构的前N年每日感染性疾病就医人数和前N年每日最低气温作为特征,构成K*(2*N*365)个数据特征训练样本集。
使用上述训练样本,训练构建机器学习LightGBM模型,形成了基于机器学习的预测感染性疾病就医人数的方法。LigthGBM是一种梯度提升框架,采用损失函数的负梯度作为当前决策树的残差近似值,去拟合新的决策树。
使用K个医疗机构的前M天的感染性疾病就医人数和最低气温作为训练后的LightGBM动态模型的输入,动态预测来日的感染性疾病就医人数P预测。
依据预测的感染性疾病就医人数,计算其预警指数,如下:
Q=(P预测-P前日)/STD(P前m日)
其中,Q为预警指数,P预测为来日T的预测值,P前日为T-1天的真实数据,STD(P前M日)为T-1,T-2,。。。T-M天的真实数据的样本标准差。
依据预警指数Q≥σ,σ为预警指数阈值,判断为来日的感染性疾病就医人数将会出现突增。
将来日的感染性疾病就医人数突增告警通过建设基于机器学***台进行及时发布预警。
可选地,所述的基于机器学习预测预警感染性疾病就医人数突增可视化***进行多点动态分析预测,灵敏预警和告警呈现的设计思路。
可选地,所述的样本数据通过网络及自定义的接口协议,上传到基于机器学***台。
可选地,所述的使用前M=9天的感染性疾病就医人数和最低气温作为训练后的LightGBM模型的输入,动态预测来日的感染性疾病就医人数的准确性和预警灵敏度最高。
可选地,所述的预警指数阈值σ,在基于机器学***台中设定为100%,即预警指数Q为样本标准差的一倍以上的,判断为突增。
可选地,所述的基于机器学习预测预警感染性疾病就医人数突增可视化***已实现网络化、***化,可实时在线实现同地或异地的多家医疗机构对感染性疾病就医人数突增预测预警。
由于采用上述方法,本发明的有益效果是:本发明是一种基于机器学习预测预警感染性疾病就医人数突增的方法,实现多点监测,多特征的患感染性疾病疫情突增的动态分析预测和灵敏预警。本发明方法包括:选取多个医疗机构的每日感染性疾病就医人数和每日的最低气温作为输入特征;选用机器学习模型LightGBM作为训练模型预测来日的就医感染性疾病人数;对就医人数预测值与前M天的真实值进行数据统计分析,提出感染性疾病就医人数突增的预警算法。本发明方法避免了基于单监测点、单一特征时间序列或时态事件对疾病演化过程建模信息损失问题,有效提升了对感染性疾病就医人数的预测精准性和就医人数突增预警的灵敏性。是建设协同综合、灵敏可靠的公共卫生监测预警体系的核心技术。
附图说明
图1是本发明一种基于机器学习预测预警感染性疾病就医人数突增方法的总流程图;
图2是本发明基于机器学习预测感染性疾病就医人数突增的动态更新预测模型流程图;
具体实施方式
以下结合附图所示实施例对本发明作进一步的说明。
以下实例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
本发明提供一种基于机器学***台上的告警窗口呈现。该方法包括以下步骤:
(1)使用K个医疗机构的前N年每日感染性疾病就医人数和前N年每日最低气温作为特征,构成K*(2*N*365)个数据特征训练样本集。
本实施例中,计算所述的每日感染性疾病就医人数与当日的最低气温的Pearson相关系数其中,Cov(X,Y)为X、Y的协方差,Var[X]为X的方差,Var[Y]为Y的方差。可得出每日感染性疾病就医人数与当日的最低气温有较强的负相关性。
(2)使用上述训练样本,训练构建机器学习LightGBM模型,形成了基于机器学习的预测感染性疾病就医人数的方法。LigthGBM是一种梯度提升框架,采用损失函数的负梯度作为当前决策树的残差近似值,去拟合新的决策树。
本实施例中,LightGBM的目标函数是:
其中式中的n代表样本个数,yi代表第i个样本的真实值,·1(yi,Yi)代表第i个样本的训练损失,对于回归任务通常选择平方误差损失函数,Ω(fk(xi))是正则化惩罚项,K代表树的总数。γ是叶子节点数量的惩罚系数,T是叶子节点的个数,wt是第t个叶子节点的得分,λ是L2正则化系数。因为叶子节点过多时,会有过拟合的风险,因此γT项是为了限制叶子节点的数量。LightGBM在每轮训练中加入一个新的决策树至模型,对于决策树的训练,利用信息增益选择树节点的***点。
(3)使用K个医疗机构的前M天的感染性疾病就医人数和最低气温作为训练后的LightGBM模型的输入,预测来日的感染性疾病就医人数P预测。
本实施例中,采用动态预测模型:在测试集上的预测,利用了动态模型,每次有新的测试数据时,加入已有数据重新训练模型,再进行预测。其步骤框图,如图2所示。
可选地,使用前M=9天的感染性疾病就医人数和最低气温作为训练后的LightGBM模型的输入,动态预测来日的感染性疾病就医人数的准确性和预警灵敏度最高。
(4)依据预测的感染性疾病就医人数,计算其预警指数。
本实施例中,采用下式计算,Q=(P预测-P前日)/STD(P前m日)
其中,Q为预警指数,P预测为来日T的预测值,P前日为T-1天的真实数据,STD(P前M日)为T-1,T-2,。。。T-M天的真实数据的样本标准差。
(5)依据预警指数Q≥σ,σ为预警指数阈值,判断为来日的感染性疾病就医人数将会出现突增。
本实施例中,所述的预警指数阈值σ,在基于机器学***台中设定为100%,即预警指数Q为样本标准差的一倍以上的,判断为突增。
(6)将来日的感染性疾病就医人数突增告警通过建设基于机器学***台进行及时发布预警。
本实施例中,所述的基于机器学习预测预警感染性疾病就医人数突增可视化***已实现网络化、***化,可实时在线实现同地或异地的多家医疗机构对感染性疾病就医人数突增预测预警。
可选地,所述的基于机器学习预测预警感染性疾病就医人数突增可视化***进行多点动态分析预测,灵敏预警和告警呈现的设计思路。
可选地,所述的样本数据通过网络及自定义的接口协议,上传到基于机器学***台。
上述对实施例的描述是为便于该技术领域的普通技术人员能理解和应用本发明。熟悉本领域技术的人员显然可以容易地对这些实施例做出各种修改,并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此,本发明不限于这里的实施例,本领域技术人员根据本发明的揭示,不脱离本发明范畴所做出的改进和修改都应该在本发明的保护范围之内。
Claims (3)
1.一种基于机器学习预测预警感染性疾病就医人数突增的方法,实现多点监测,多特征的患感染性疾病疫情突增的动态分析预测和灵敏预警,其特征在于,包括以下几个步骤:
步骤一:使用K个医疗机构的前N年每日感染性疾病就医人数和前N年每日最低气温作为特征,构成K*(2*N*365)个训练输入特征样本数据;
步骤二:所述的训练输入特征样本数据通过网络及自定义的接口协议,上传到基于机器学***台,对机器学习模型LightGBM(Light Gradient Boosting Machine)进行训练,形成了预测感染性疾病就医人数的模型及参数;
步骤三:使用K个医疗机构的前m天的感染性疾病就医人数和最低气温作为预测输入特征数据,将所述的预测输入特征数据通过网络及自定义的接口协议,上传到基于机器学***台,对所述的预测感染性疾病就医人数的模型进行重新学习训练,优化模型参数,得到预测感染性疾病就医人数的动态模型及优化参数;
将所述的预测输入特征数据作为所述的预测感染性疾病就医人数的动态模型的输入,得到预测感染性疾病的就医人数;
步骤四:依据所述的预测感染性疾病的就医人数,计算其预警指数,
Q=(P预测—P前日)/STD(P前m日)
其中,Q为预警指数,P预测为来日T的预测值,P前日为T-1天的真实数据,STD(P前m日)为T-1,T-2,…T-m天的真实数据的样本标准差;
步骤五:依据所述的预警指数Q≥σ,σ为预警指数阈值,判断为来日的感染性疾病就医人数将会出现突增;
步骤六:将来日的感染性疾病就医人数突增告警由所述的基于机器学***台进行及时发布预警。
3.根据权利要求1所述的基于机器学习预测预警感染性疾病就医人数突增的 方法,其特征在于,还包括:
所述的基于机器学***台已实现网络化、***化,有如下步骤:
K家医疗机构将训练和预测感染性疾病就医人数特征数据通过网络及自定义的接口协议,上传到基于机器学***台;
所述***平台实时在线实现同地或异地的多家医疗机构的感染性疾病就医人数突增的机器学习建模和预测预警。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011099761.9A CN112185566B (zh) | 2020-10-14 | 2020-10-14 | 一种基于机器学习预测预警感染性疾病就医人数突增的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011099761.9A CN112185566B (zh) | 2020-10-14 | 2020-10-14 | 一种基于机器学习预测预警感染性疾病就医人数突增的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112185566A CN112185566A (zh) | 2021-01-05 |
CN112185566B true CN112185566B (zh) | 2021-08-13 |
Family
ID=73950182
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011099761.9A Active CN112185566B (zh) | 2020-10-14 | 2020-10-14 | 一种基于机器学习预测预警感染性疾病就医人数突增的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112185566B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112735598A (zh) * | 2021-01-21 | 2021-04-30 | 山东健康医疗大数据有限公司 | 一种对新冠疫情和呼吸道症候群进行分析预警的方法 |
CN112951441B (zh) * | 2021-02-25 | 2023-05-30 | 平安科技(深圳)有限公司 | 基于多维度的监测预警方法、装置、设备及存储介质 |
CN113035352B (zh) * | 2021-04-27 | 2022-06-21 | 河南科技大学 | 基于bp神经网络的糖尿病视网膜病变预警方法 |
CN113707336B (zh) * | 2021-08-26 | 2024-06-21 | 深圳平安智慧医健科技有限公司 | 基于数据分析的传染病防治预警方法、装置、设备及介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108417274A (zh) * | 2018-03-06 | 2018-08-17 | 东南大学 | 流行病预测方法、***及设备 |
CN109656918A (zh) * | 2019-01-04 | 2019-04-19 | 平安科技(深圳)有限公司 | 流行病发病指数的预测方法、装置、设备及可读存储介质 |
CN110111902A (zh) * | 2019-04-04 | 2019-08-09 | 平安科技(深圳)有限公司 | 急性传染病的发病周期预测方法、装置及存储介质 |
CN111462917A (zh) * | 2020-03-02 | 2020-07-28 | 珠海中科先进技术研究院有限公司 | 基于空间地理分析和机器学习的疫情预警方法及*** |
CN111554408A (zh) * | 2020-04-27 | 2020-08-18 | 中国科学院深圳先进技术研究院 | 城市内部登革热时空预测方法、***及电子设备 |
CN111653368A (zh) * | 2020-05-08 | 2020-09-11 | 梁步阁 | 一种人工智能疫情大数据防控预警*** |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190148023A1 (en) * | 2017-11-16 | 2019-05-16 | Google Llc | Machine-Learned Epidemiology |
CN108172301B (zh) * | 2018-01-31 | 2021-02-02 | 中国科学院软件研究所 | 一种基于梯度提升树的蚊媒传染病疫情预测方法及*** |
CN111415752B (zh) * | 2020-03-01 | 2023-05-12 | 集美大学 | 一种融合气象因素和搜索指数的手足口病预测方法 |
CN111681774B (zh) * | 2020-08-11 | 2020-11-27 | 南京云联数科科技有限公司 | 用于流行性传染病预测的方法、计算设备和介质 |
-
2020
- 2020-10-14 CN CN202011099761.9A patent/CN112185566B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108417274A (zh) * | 2018-03-06 | 2018-08-17 | 东南大学 | 流行病预测方法、***及设备 |
CN109656918A (zh) * | 2019-01-04 | 2019-04-19 | 平安科技(深圳)有限公司 | 流行病发病指数的预测方法、装置、设备及可读存储介质 |
CN110111902A (zh) * | 2019-04-04 | 2019-08-09 | 平安科技(深圳)有限公司 | 急性传染病的发病周期预测方法、装置及存储介质 |
CN111462917A (zh) * | 2020-03-02 | 2020-07-28 | 珠海中科先进技术研究院有限公司 | 基于空间地理分析和机器学习的疫情预警方法及*** |
CN111554408A (zh) * | 2020-04-27 | 2020-08-18 | 中国科学院深圳先进技术研究院 | 城市内部登革热时空预测方法、***及电子设备 |
CN111653368A (zh) * | 2020-05-08 | 2020-09-11 | 梁步阁 | 一种人工智能疫情大数据防控预警*** |
Non-Patent Citations (1)
Title |
---|
基于深度学习的传染病预测技术研究;骆建香;《中国优秀硕士学位论文全文数据库 基础科学辑》;20200815(第8期);第14-29页 * |
Also Published As
Publication number | Publication date |
---|---|
CN112185566A (zh) | 2021-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112185566B (zh) | 一种基于机器学习预测预警感染性疾病就医人数突增的方法 | |
Venna et al. | A novel data-driven model for real-time influenza forecasting | |
Wang et al. | Causalgnn: Causal-based graph neural networks for spatio-temporal epidemic forecasting | |
Yan et al. | An improved method for the fitting and prediction of the number of covid-19 confirmed cases based on lstm | |
Toth et al. | The role of heterogeneity in contact timing and duration in network models of influenza spread in schools | |
CN104933841B (zh) | 一种基于自组织神经网络的火灾预测方法 | |
CN109166630B (zh) | 一种传染病数据监控处理方法和*** | |
CN110085327A (zh) | 基于注意力机制的多通道lstm神经网络流感疫情预测方法 | |
Kiamari et al. | COVID-19 Risk Estimation using a Time-varying SIR-model | |
CN111145917B (zh) | 一种面向流行病防控的大规模人口接触网络建模方法 | |
CN112700885B (zh) | 一种基于卡尔曼滤波辨识新冠病毒传播模型参数的方法 | |
Mittal et al. | Application of Bayesian Belief Networks for context extraction from wireless sensors data | |
CN111081379A (zh) | 一种疾病概率决策方法及其*** | |
Manocha et al. | Dew computing-inspired health-meteorological factor analysis for early prediction of bronchial asthma | |
Zhang et al. | A unified framework for epidemic prediction based on poisson regression | |
Raizada et al. | Vector borne disease outbreak prediction by machine learning | |
Rodner et al. | Data-driven generation of rule-based behavior models for an ambient assisted living system | |
Liu et al. | Coronavirus epidemic (covid-19) prediction and trend analysis based on time series | |
Aziz et al. | Initialization of adaptive neuro-fuzzy inference system using fuzzy clustering in predicting primary triage category | |
CN114912354B (zh) | 一种预测蚊媒传染病风险的方法、装置及介质 | |
JP2020098476A (ja) | データ構造 | |
Srinivas et al. | Artificial intelligence based forecasting techniques for the covid-19 pandemic | |
Matern et al. | Adaptive and automated ambiance surveillance and event detection for ambient assisted living | |
Keyvanpour et al. | Augmented feature-state sensors in human activity recognition | |
Sunthornwat et al. | Reproduction number, discrete forecasting model, and chaos analytics for Coronavirus Disease 2019 outbreak in India, Bangladesh, and Myanmar |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |