CN107145715B - 一种基于推举算法的临床医学智能判别装置 - Google Patents
一种基于推举算法的临床医学智能判别装置 Download PDFInfo
- Publication number
- CN107145715B CN107145715B CN201710236776.7A CN201710236776A CN107145715B CN 107145715 B CN107145715 B CN 107145715B CN 201710236776 A CN201710236776 A CN 201710236776A CN 107145715 B CN107145715 B CN 107145715B
- Authority
- CN
- China
- Prior art keywords
- clinical medical
- clinical
- algorithm
- indexes
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明实施例公开了一种基于推举算法的临床医学信息智能判别装置,通过计算机处理,执行临床指标筛选单元从历史数据中,选取患病人群和普通人群共同具有的多个临床医学指标,获取所选指标上述两种人群的检测值,并根据获取的检测值,筛选出满足预定条件的临床医学指标;通过模型构建单元将这些指标作为属性,对应的检测值作为属性值,基于预设的推举算法构建二分类模型;最后通过信息识别单元来获取待测人员对应于筛选出的临床医学指标的检测值,将检测值导入二分类模型中,智能识别就诊者临床医学相关信息。实施本发明,能一定程度上实现临床医学相关信息诊判过程的自动化及标准化,提高客观性,降低误差。
Description
技术领域
本发明涉及计算机临床辅助决策技术领域,尤其涉及一种基于推举算法的临床医学信息智能判别装置。
背景技术
随着医疗的数字化,医疗机构中大量医疗数据被精确统计和保存,这些医学信息资源对于疾病诊断、治疗、预防的研究极具价值。
目前,机器学习技术得到广泛应用,涉及商业活动和科学研究的各个领域。若在临床医学领域,采用机器学习技术,通过对医学数据库中大量历史数据的分析和处理,挖掘出有价值的医疗诊断规则,用于计算机临床辅助决策,将具有较广阔的前景。
目前绝大多数医院临床疾病的诊断依然依靠医生据其个人医学知识和其有限的行医经验对就诊人员的健康信息做出判断,疾病的诊断具有一定的主观性,诊判的精度依赖于医生的行医水平。
发明内容
本发明实施例的目的在于通过大数据进行***训练、学习和建模,提供一种基于推举算法的临床医学信息智能判别装置,一定程度上实现临床医学信息诊判过程的自动化及标准化,提高客观性,降低误差。
为了解决上述技术问题,本发明实施例提供了一种基于推举算法的临床医学智能判别装置,所述装置包括:
临床指标筛选单元,用于从历史数据中,选取患病人群和普通人群共有的多个临床医学指标,并获取患病人群和普通人群共有临床医学指标对应的检测值,且根据上述获取到的患病人群和普通人群共有临床医学指标的检测值,筛选出满足预定条件的临床医学指标;
模型构建单元,用于将所筛选出的临床医学指标作为属性,将患病人群和普通人群对应所筛选出的临床医学指标的检测值作为属性值,基于预设的推举算法构建二分类模型;
信息识别单元,用于获取待测人员对应所筛选出的临床医学指标的检测值,并将所获取到的待测人员的检测值导入所述构建后的二分类模型中,自动识别所对应的待测人员相应临床信息。
其中,所述多个临床医学指标包括血常规、肝功能、肾功能、尿检、粪检和血液金属含量等检查涉及的医学指标。
其中,所述“预设的推举算法”包括LogitBoost算法和Adaboost算法。
实施本发明实施例,具有如下有益效果:
本发明结合机器学习技术,通过对成千上万甚至更多人群在极长时间段内的临床体检或疾病诊疗数据进行***训练和学习,建立带有人工智能性质的二分类模型来确定待测人员的临床信息分类结果,以此排除人为因素的干扰,客观性较强,可逐步实现临床医学信息诊判过程自动化、标准化,提高了客观性,且降低了误差。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,下面描述中的附图仅为本发明的实施例的摘要性附图,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,根据此附图获得的其他附图仍属于本发明的范畴。
图1为本发明实施例提供的基于推举算法的临床医学智能判别装置的***结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明了,以下结合附图及实施例,对本发明进行进一步的说明。应当理解,此处所描述的具体实施例仅用以解释本发明,而非限定本发明。
图1为本发明实施例,提供的一种基于推举算法的临床医学智能判别装置,所述装置包括:
临床指标筛选单元110,用于从历史数据中,选取患病人群和普通人群共有的多个临床医学指标,并获取患病人群和普通人群共有临床医学指标对应的检测值,且根据上述获取到的患病人群和普通人群共有临床医学指标的检测值,筛选出满足预定条件的临床医学指标;
在临床指标筛选单元110的实现过程中,装置从历史数据中,选取某种疾病患者人群和普通人群共同具有的多个临床医学指标,并获取各所选临床医学指标分别对应患者人群和普通人群的检测值;其中,多个临床医学指标指血常规、肝功能、肾功能、尿检、粪检和血液金属含量等检查可能涉及的临床检测项目。
针对各所选临床医学指标,针对某种疾病的患者人群和普通人群同一所选临床医学指标对应的检测值进行参数或非参数检验,一般选取T检验或秩和检验,筛选出P值小于设定显著程度对应数值的临床医学指标。
作为一个例子,分别选取医院糖尿病人和普通非糖尿病体检人员的临床检测数据,包括血常规、肝功能、肾功能、尿检、粪检、血液金属含量等检测项目(即临床医学指标)的检测值。经过必要的数据处理,如去除错误检测记录,包括前后表述不一致或检测值存在明显偏差的记录,删除检测值为非数字形式的记录。若同一病人的某个检测指标存在多个检测值,则取检测值的均值或时间上最晚的检测值。而后将糖尿病人和非糖尿病人的同一检测项目(即同一临床医学指标)的检测值进行T检验或秩和检验,统计出T检验或秩和检验中p值小于设定显著程度对应数值的检测项目。
可以理解的是,若数据涉及人数较多,可认为数据近似符合正态分布,采用T检验,反之则采用秩和检验。若采用秩和检验时人数超过50,则也可采用正态近似法。
模型构建单元120,用于将所筛选出的临床医学指标作为属性,将患病人群和普通人群对应所筛选出的临床医学指标的检测值作为属性值,基于预设的推举算法构建二分类模型。
在模型构建单元120的实现过程中,装置将所筛选出的临床医学指标作为属性,对应的两大人群的检测值作为属性值,基于LogitBoost算法或AdaBoost算法构建二分类模型。
在实施例中,选取LogitBoost算法进行建模。LogitBoost算法是逻辑回归技术在AdaBoost的应用,弱分类器的选取并不是基于分类结果yi,而是基于加权最小二乘法。设迭代之前强分类器C0(x)=0,每个训练样本数据的概率估计p0(xi)=0.5,则LogitBoost算法的迭代过程为:
①计算工作响应zi(m):
式中
②计算权值wi (m):
③应用权值wi (m),基于从zi (m)到xi的加权最小二乘法回归装置,拟合弱分类器km(x);
④更新pm(xi):
⑤更新强分类器
最终强分类器为:
信息识别单元130,用于获取待测人员对应所筛选出的临床医学指标的检测值,并将所获取到的待测人员的检测值导入构建的二分类模型中,自动识别待测人员病况。
在信息标识别单元130的实现过程中,装置获取待测人员对应于所筛选出的临床医学指标的检测值,并将待测人员对应于所筛选出的临床医学指标的检测值导入二分类模型中,并识别待测人员是否患有糖尿病。
通过计算机数据处理及显示最终结果,可以用来确定待测人员临床信息为患有疾病或不患有疾病,并可以进一步通过十折交叉验证计算算法的准确性。
例如:利用2004年至2014年期间在某医院内分泌科被确诊为患有糖尿病的一万多位病人的诊疗数据及2010年至2014年在该医院进行体检的两万多位非糖尿病人员的体检数据。由于糖尿病疾病诊判有极为相关的检测项目,如血糖,糖化血红蛋白等。因此建模过程剔除了与糖尿病疾病诊断直接相关的检测项目,在此基础上采用上述装置建立的机器智能诊断装置,临床信息诊判准确率在90%以上。
实施本发明实施例,具有如下有益效果:
本发明结合机器学习技术,通过对成千上万甚至更多人群在极长时间段内的临床体检或疾病诊疗数据进行***训练和学习,建立带有人工智能性质的二分类模型来确定待测人员的临床医学信息分类情况,以此排除人为因素的干扰,客观性较强,可逐步实现临床医学相关信息诊判过程自动化、标准化,提高了客观性,且降低了误差。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (1)
1.一种基于推举算法的临床医学信息智能判别装置,其特征在于,所述装置包括:
临床指标筛选单元,用于从历史数据中,选取患病人群和普通人群共有的多个临床医学指标,并获取患病人群和普通人群共有临床医学指标对应的检测值,且根据上述获取到的患病人群和普通人群共有临床医学指标的检测值,筛选出满足预定条件的临床医学指标;针对各所选临床医学指标,针对某种疾病的患者人群和普通人群同一所选临床医学指标对应的检测值进行参数或非参数检验,选取T检验或秩和检验,筛选出P值小于设定显著程度对应数值的临床医学指标,若采用秩和检验时人数超过50,则也可采用正态近似法;
模型构建单元,用于将所筛选出的临床医学指标作为属性,将患病人群和普通人群对应所筛选出的临床医学指标的检测值作为属性值,基于预设的推举算法构建二分类模型;
信息识别单元,用于获取待测人员对应所筛选出的临床医学指标的检测值,并将所获取到的待测人员的检测值导入所构建的二分类模型中,自动识别就诊者的相关临床信息;
所述多个临床医学指标包括血常规、肝功能、肾功能、尿检、粪检和血液金属含量涉及的检测指标;
所述预设的推举算法包括LogitBoost算法和Adaboost算法;
基于预设的推举算法构建二分类模型为:基于LogitBoost算法构建,弱分类器的选取并不是基于分类结果yi,而是基于加权最小二乘法,设迭代之前强分类器C0(x)=0,每个训练样本数据的概率估计p0(xi)=0.5,则LogitBoost算法的迭代过程为:
①计算工作响应zi (m):
式中
②计算权值wi (m):
③应用权值wi (m),基于从zi (m)到xi的加权最小二乘法回归装置,拟合弱分类器km(x);
④更新pm(xi):
⑤更新强分类器
最终强分类器为:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710236776.7A CN107145715B (zh) | 2017-04-12 | 2017-04-12 | 一种基于推举算法的临床医学智能判别装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710236776.7A CN107145715B (zh) | 2017-04-12 | 2017-04-12 | 一种基于推举算法的临床医学智能判别装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107145715A CN107145715A (zh) | 2017-09-08 |
CN107145715B true CN107145715B (zh) | 2020-05-05 |
Family
ID=59773609
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710236776.7A Active CN107145715B (zh) | 2017-04-12 | 2017-04-12 | 一种基于推举算法的临床医学智能判别装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107145715B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109671507A (zh) * | 2018-12-24 | 2019-04-23 | 万达信息股份有限公司 | 一种基于电子健康档案的产科专病关联指标挖掘方法 |
CN110364259B (zh) * | 2019-05-30 | 2022-05-31 | 中国人民解放军总医院 | 一种高原疾病预测方法、***、介质及电子设备 |
CN110378389A (zh) * | 2019-06-24 | 2019-10-25 | 苏州浪潮智能科技有限公司 | 一种Adaboost分类器计算机创建装置 |
CN112233112B (zh) * | 2020-12-07 | 2021-06-01 | 深圳大学 | 一种基于深度学习分析的肝细胞癌的ck19的预测方法 |
CN116189909B (zh) * | 2023-03-06 | 2024-02-20 | 佳木斯大学 | 基于推举算法的临床医学判别方法及*** |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102298663A (zh) * | 2010-06-24 | 2011-12-28 | 上海中医药大学 | 中医自动识别证型的检测方法 |
-
2017
- 2017-04-12 CN CN201710236776.7A patent/CN107145715B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102298663A (zh) * | 2010-06-24 | 2011-12-28 | 上海中医药大学 | 中医自动识别证型的检测方法 |
Non-Patent Citations (1)
Title |
---|
logitboost及其在判别分析中的应用;富春枫 等;《中国卫生统计》;20060425;第23卷(第2期);第98-100页 * |
Also Published As
Publication number | Publication date |
---|---|
CN107145715A (zh) | 2017-09-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107145715B (zh) | 一种基于推举算法的临床医学智能判别装置 | |
Cramer et al. | Predicting the incidence of pressure ulcers in the intensive care unit using machine learning | |
Terrin et al. | External validity of predictive models: a comparison of logistic regression, classification trees, and neural networks | |
CN107785057B (zh) | 医疗数据处理方法、装置、存储介质和计算机设备 | |
CN109920547A (zh) | 一种基于电子病历数据挖掘的糖尿病预测模型构建方法 | |
JP7010946B2 (ja) | 健康状態の計算解析を容易化するシステム及び方法 | |
CN112151170A (zh) | 用于计算用作医疗决策支持的医疗建议的分数的方法 | |
CN106599553A (zh) | 疾病预警方法及装置 | |
CN111951965B (zh) | 基于时序知识图谱的全景式健康动态监测与预测*** | |
CN112967803A (zh) | 基于集成模型的急诊患者早期死亡率预测方法及*** | |
WO2022060948A1 (en) | Systems and methods for automatically notifying a caregiver that a patient requires medical intervention | |
Ghasemi et al. | Feature selection in pre-diagnosis heart coronary artery disease detection: a heuristic approach for feature selection based on information gain ratio and Gini index | |
CN107767960A (zh) | 临床检测项目的数据处理方法、装置及电子设备 | |
Wang et al. | Predictive classification of ICU readmission using weight decay random forest | |
CN117497149A (zh) | 一种基于人工智能的医院管理方法及*** | |
Adlassnig et al. | Healthcare-associated infection surveillance and bedside alerts | |
Emakhu et al. | Prediction system for heart disease based on ensemble classifiers | |
Saraei et al. | A different traditional approach for automatic comparative machine learning in multimodality COVID-19 severity recognition | |
Boag et al. | EHR safari: data is contextual | |
US20210134405A1 (en) | System for infection diagnosis | |
US20230060794A1 (en) | Diagnostic Tool | |
CN116798604A (zh) | 基于多源数据的发热呼吸道症候群监测预警方法及*** | |
Arowolo et al. | Detection of COVID-19 from Chest X-Ray Images using CNN and ANN Approach | |
Shayan et al. | Use of artificial intelligence and neural network algorithms to predict arterial blood gas items in trauma victims | |
Verma et al. | Prediction of heart disease in diabetic patients using naive bayes classification technique |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |