CN112349399B - 基于关联算法的手术缺漏自动检测方法 - Google Patents

基于关联算法的手术缺漏自动检测方法 Download PDF

Info

Publication number
CN112349399B
CN112349399B CN202011264688.6A CN202011264688A CN112349399B CN 112349399 B CN112349399 B CN 112349399B CN 202011264688 A CN202011264688 A CN 202011264688A CN 112349399 B CN112349399 B CN 112349399B
Authority
CN
China
Prior art keywords
item
charging
training set
algorithm
association
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011264688.6A
Other languages
English (en)
Other versions
CN112349399A (zh
Inventor
徐伟风
李易平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Huoshu Technology Co ltd
Original Assignee
Hangzhou Huoshu Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Huoshu Technology Co ltd filed Critical Hangzhou Huoshu Technology Co ltd
Priority to CN202011264688.6A priority Critical patent/CN112349399B/zh
Publication of CN112349399A publication Critical patent/CN112349399A/zh
Application granted granted Critical
Publication of CN112349399B publication Critical patent/CN112349399B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/20ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Probability & Statistics with Applications (AREA)
  • Epidemiology (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Algebra (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Computational Linguistics (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了一种基于关联算法的手术缺漏自动检测方法。属于病案质量的手术缺漏自动检测技术领域,病案质量手术缺漏检测劳动强度小,检测的准确性好,能较大程度减少医务人员把关病案质量工作量。手术缺漏自动检测方法实现过程如下:提取数据库中所有患者所有手术及收费项目,并按7∶3比例拆分为训练集和测试集;计算训练集中每类收费项目涉及到的手术种类占整个训练集中所有手术种类的比例,将该比例的值记为区分度阈值。

Description

基于关联算法的手术缺漏自动检测方法
技术领域
本发明涉及病案质量的手术缺漏自动检测技术领域,具体涉及一种基于关联算法的手术缺漏自动检测方法。
背景技术
病案质量是医院医疗水平和管理水平的直接体现,决定着医疗质量与安全,因此提高病案质量至关重要。目前,病案质控主要通过各级医务人员(主管医师、科主任及病案质控人员等)进行把关,这不可避免存在一定的逻辑错误、缺项、错误诊断、不合理医嘱等问题。逻辑规则校验虽在一定程度上减轻了医务人员工作量,但对于缺项、错误诊断、不合理医嘱等非逻辑问题就无能为力了。
发明内容
本发明是为了解决现有病案质量手术缺漏检测劳动强度大的不足,提供一种病案质量手术缺漏检测劳动强度小,检测的准确性好,能较大程度减少医务人员把关病案质量工作量的基于关联算法的手术缺漏自动检测方法。
为实现以上目的,本发明通过以下技术方案予以实现:
基于关联算法的手术缺漏自动检测方法,手术缺漏自动检测方法实现过程如下:
步骤A1,提取数据库中所有患者所有手术及收费项目,并按7∶3比例拆分为训练集和测试集;
步骤A2,计算训练集中每类收费项目涉及到的手术种类占整个训练集中所有手术种类的比例的值,将该比例的值记为区分度阈值,用D表示,具体计算公式如下:
D=I_i/S_i∈{1,2,…,m} (1)
其中,I_i表示第i类收费项目在训练集中关联到的手术种类数量;S表示训练集中手术种类总数量;
步骤A3,结合医学知识及数据分布特点,初步设置区分度阈值D=0.6,剔除训练集中低于该区分阈值D的收费项目;
步骤A4,获取训练集中修正后的所有手术及收费项目集合,基于独热码技术构建患者手术收费项目矩阵;
独热码是用N位状态寄存器编码N个状态,每个状态都有独立的寄存器位,且这些寄存器位中只有一位有效;
步骤A5,基于步骤4建立的患者手术收费项目矩阵,使用开源工具包mlxtend中封装的关联算法Apriori,根据支持度提取频繁项集,支持度定义如下:
Sup(A→B)=S_AB/M
其中M表示数据集中总的记录数;S_AB表示项目A和项目B一起出现的次数(项目A或项目B即可表示手术又可表示收费项目);本发明中的支持度设置为:5/M;
步骤A6,在频繁项集的基础上,修改关联算法Apriori,限制前项为收费项目的项集,在算法层次上避免无效规则的产生,并有效降低数据的存储空间,将修改后的关联算法命名为Crop-Apriori算法;优化后的关联算法保证算法仅生成前项为收费项目,后项为手术的关联规则,然后根据置信度确定最终的关联规则;置信度定义如公式2所示:
Conf(A→B)=(Sup(A→B))/(P(A)) (2)
其中P(A)表示项目A在数据集中出现的概率;
步骤A7,Crop-Apriori算法具体流程如下:
遍历步骤A5,找到的所有频繁项集,找出所有的2-项集,记为C_1,根据置信度确定符合条件的关联规则,前项为收费项目,后项为手术,记为L_1;
在L_1基础上,频繁2-项集两两组合,生成3-项集,记为C_2,根据置信度确定符合条件的关联规则,记为L_2;
在L_2基础上,频繁3-项集两两组合,生成4-项集,记为C_3,根据置信度确定符合条件的关联规则,记为L_3,依此类推,直到找到所有符合条件的关联规则;
步骤A8,使用在训练集上获得的关联规则,根据患者的收费项目检测测试集中患者可能遗漏的手术,具体策略如下:
遍历步骤7获得的所有关联规则,计算规则前项与测试患者收费项目交集的数量;
使用交集最多的关联规则的规则后项作为该测试患者可能的遗漏手术;
步骤A9,计算手术遗漏预测准确率,如果准确率达不到要求,回到步骤3,调整区分度阈值、支持度阈值及置信度阈值,直至获得满意的准确率。
本方案病案质量手术缺漏检测劳动强度小,检测的准确性好,能较大程度减少医务人员把关病案质量工作量。
作为优选,在步骤A2中,计算训练集中每类收费项目涉及到的手术种类占整个训练集中所有手术种类的比例时,需要判断比例的值是否大于区分度阈值;如果比例的值大于区分度阈值,则进行收费项目手术矩阵构建,然后进行Apriori算法训练;如果比例的值小于或等于区分度阈值则直接剔除。
本发明能够达到如下效果:
本发明使得病案质量手术缺漏检测劳动强度小,检测的准确性好,能较大程度减少医务人员把关病案质量工作量。
附图说明
图1为本发明的一种流程示意图。
具体实施方式
下面结合附图与实施例对本发明作进一步的说明。
基于关联算法的手术缺漏自动检测方法,参见图1所示,手术缺漏自动检测方法实现过程如下:
步骤A1,提取数据库中所有患者所有手术及收费项目,并按7∶3比例拆分为训练集和测试集;
步骤A2,计算训练集中每类收费项目涉及到的手术种类占整个训练集中所有手术种类的比例的值,将该比例的值记为区分度阈值,用D表示,具体计算公式如下:
D=I_i/S_i∈{1,2,…,m} (1)
其中,I_i表示第i类收费项目在训练集中关联到的手术种类数量;S表示训练集中手术种类总数量;
步骤A3,结合医学知识及数据分布特点,初步设置区分度阈值D=0.6,剔除训练集中低于该区分阈值D的收费项目;
步骤A4,获取训练集中修正后的所有手术及收费项目集合,基于独热码技术构建患者手术收费项目矩阵;
独热码是用N位状态寄存器编码N个状态,每个状态都有独立的寄存器位,且这些寄存器位中只有一位有效;
步骤A5,基于步骤4建立的患者手术收费项目矩阵,使用开源工具包mlxtend中封装的关联算法Apriori,根据支持度提取频繁项集,支持度定义如下:
Sup(A→B)=S_AB/M
其中M表示数据集中总的记录数;S_AB表示项目A和项目B一起出现的次数(项目A或项目B即可表示手术又可表示收费项目);本发明中的支持度设置为:5/M;
步骤A6,在频繁项集的基础上,修改关联算法Apriori,限制前项为收费项目的项集,在算法层次上避免无效规则的产生,并有效降低数据的存储空间,将修改后的关联算法命名为Crop-Apriori算法;优化后的关联算法保证算法仅生成前项为收费项目,后项为手术的关联规则,然后根据置信度确定最终的关联规则;置信度定义如公式2所示:
Conf(A→B)=(Sup(A→B))/(P(A)) (2)
其中P(A)表示项目A在数据集中出现的概率;
步骤A7,Crop-Apriori算法具体流程如下:
遍历步骤A5,找到的所有频繁项集,找出所有的2-项集,记为C_1,根据置信度确定符合条件的关联规则,前项为收费项目,后项为手术,记为L_1;
在L_1基础上,频繁2-项集两两组合,生成3-项集,记为C_2,根据置信度确定符合条件的关联规则,记为L_2;
在L_2基础上,频繁3-项集两两组合,生成4-项集,记为C_3,根据置信度确定符合条件的关联规则,记为L_3,依此类推,直到找到所有符合条件的关联规则;
步骤A8,使用在训练集上获得的关联规则,根据患者的收费项目检测测试集中患者可能遗漏的手术,具体策略如下:
遍历步骤7获得的所有关联规则,计算规则前项与测试患者收费项目交集的数量;
使用交集最多的关联规则的规则后项作为该测试患者可能的遗漏手术;
步骤A9,计算手术遗漏预测准确率(以电子病历***中手术记录中记录的手术为“金标准”),如果准确率达不到要求,回到步骤3,调整区分度阈值、支持度阈值及置信度阈值,直至获得满意的准确率。
在步骤A2中,计算训练集中每类收费项目涉及到的手术种类占整个训练集中所有手术种类的比例的值时,需要判断比例的值是否大于区分度阈值;如果比例的值大于区分度阈值,则进行收费项目手术矩阵构建,然后进行Apriori算法训练;如果比例的值小于或等于区分度阈值则直接剔除。
使得病案质量手术缺漏检测劳动强度小,能较大程度减少医务人员把关病案质量工作量。从数据和医疗角度剔除不具有区别性的收费项目,有效剔除冗余数据,提高算法响应性能;提出Crop-Apriori算法,保证仅生成符合条件的关联规则,有效提高Apriori算法运行效率,检测的准确性好。

Claims (2)

1.基于关联算法的手术缺漏自动检测方法,其特征在于,手术缺漏自动检测方法实现过程如下:
步骤A1,提取数据库中所有患者所有手术及收费项目,并按7∶3比例拆分为训练集和测试集;
步骤A2,计算训练集中每类收费项目涉及到的手术种类占整个训练集中所有手术种类的比例的值,将该比例的值记为区分度阈值,用D表示,具体计算公式如下:
D=I_i/S_i∈{1,2,…,m} (1)
其中,I_i表示第i类收费项目在训练集中关联到的手术种类数量;S表示训练集中手术种类总数量;
步骤A3,结合医学知识及数据分布特点,初步设置区分度阈值D=0.6,剔除训练集中低于该区分度 阈值D的收费项目;
步骤A4,获取训练集中修正后的所有手术及收费项目集合,基于独热码技术构建患者手术收费项目矩阵;
独热码是用N位状态寄存器编码N个状态,每个状态都有独立的寄存器位,且这些寄存器位中只有一位有效;
步骤A5,基于步骤4建立的患者手术收费项目矩阵,使用开源工具包mlxtend中封装的关联算法Apriori,根据支持度提取频繁项集,支持度定义如下:
Sup(A→B)=S_AB/M
其中M表示数据集中总的记录数;S_AB表示项目A和项目B一起出现的次数;步骤A5中的支持度为5/M;
步骤A6,在频繁项集的基础上,修改关联算法Apriori,限制前项为收费项目的项集,在算法层次上避免无效规则的产生,并有效降低数据的存储空间,将修改后的关联算法命名为Crop-Apriori算法;优化后的关联算法保证算法仅生成前项为收费项目,后项为手术的关联规则,然后根据置信度确定最终的关联规则;置信度定义如公式2所示:
Conf(A→B)=(Sup(A→B))/(P(A)) (2)
其中P(A)表示项目A在数据集中出现的概率;
步骤A7,Crop-Apriori算法具体流程如下:
遍历步骤A5,找到的所有频繁项集,找出所有的2-项集,记为C_1,根据置信度确定符合条件的关联规则,前项为收费项目,后项为手术,记为L_1;
在L1基础上,频繁2-项集两两组合,生成3-项集,记为C_2,根据置信度确定符合条件的关联规则,记为L_2;
在L_2基础上,频繁3-项集两两组合,生成4-项集,记为C_3,根据置信度确定符合条件的关联规则,记为L_3,依此类推,直到找到所有符合条件的关联规则;
步骤A8,使用在训练集上获得的关联规则,根据患者的收费项目检测测试集中患者可能遗漏的手术,具体策略如下:
遍历步骤7获得的所有关联规则,计算规则前项与测试患者收费项目交集的数量;
使用交集最多的关联规则的规则后项作为该测试患者可能的遗漏手术;
步骤A9,计算手术遗漏预测准确率,如果准确率达不到要求,回到步骤3,调整区分度阈值、支持度阈值及置信度阈值,直至获得满意的准确率。
2.根据权利要求1所述的基于关联算法的手术缺漏自动检测方法,其特征在于,在步骤A2中,计算训练集中每类收费项目涉及到的手术种类占整个训练集中所有手术种类的比例的值时,需要判断比例的值是否大于区分度阈值;如果比例的值大于区分度阈值,则进行收费项目手术矩阵构建,然后进行Apriori算法训练;如果比例的值小于或等于区分度阈值则直接剔除。
CN202011264688.6A 2020-11-12 2020-11-12 基于关联算法的手术缺漏自动检测方法 Active CN112349399B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011264688.6A CN112349399B (zh) 2020-11-12 2020-11-12 基于关联算法的手术缺漏自动检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011264688.6A CN112349399B (zh) 2020-11-12 2020-11-12 基于关联算法的手术缺漏自动检测方法

Publications (2)

Publication Number Publication Date
CN112349399A CN112349399A (zh) 2021-02-09
CN112349399B true CN112349399B (zh) 2022-05-24

Family

ID=74362753

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011264688.6A Active CN112349399B (zh) 2020-11-12 2020-11-12 基于关联算法的手术缺漏自动检测方法

Country Status (1)

Country Link
CN (1) CN112349399B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113823414B (zh) * 2021-08-23 2024-04-05 杭州火树科技有限公司 主诊断与主手术匹配检测方法、装置、计算设备和存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106126577A (zh) * 2016-06-17 2016-11-16 北京理工大学 一种基于数据源划分矩阵的加权关联规则挖掘方法
CN108461127A (zh) * 2018-01-12 2018-08-28 平安科技(深圳)有限公司 医疗数据关系图像获取方法、装置、终端设备及存储介质
CN108806767A (zh) * 2018-06-15 2018-11-13 中南大学 基于电子病历的疾病症状关联分析方法
CN109559822A (zh) * 2018-11-12 2019-04-02 平安科技(深圳)有限公司 智能初诊方法、装置、计算机设备及存储介质
CN111430036A (zh) * 2020-03-23 2020-07-17 平安医疗健康管理股份有限公司 异常手术行为的医疗信息识别方法及装置
CN111428198A (zh) * 2020-03-23 2020-07-17 平安医疗健康管理股份有限公司 一种确定异常医疗清单的方法、装置、设备和存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106126577A (zh) * 2016-06-17 2016-11-16 北京理工大学 一种基于数据源划分矩阵的加权关联规则挖掘方法
CN108461127A (zh) * 2018-01-12 2018-08-28 平安科技(深圳)有限公司 医疗数据关系图像获取方法、装置、终端设备及存储介质
CN108806767A (zh) * 2018-06-15 2018-11-13 中南大学 基于电子病历的疾病症状关联分析方法
CN109559822A (zh) * 2018-11-12 2019-04-02 平安科技(深圳)有限公司 智能初诊方法、装置、计算机设备及存储介质
CN111430036A (zh) * 2020-03-23 2020-07-17 平安医疗健康管理股份有限公司 异常手术行为的医疗信息识别方法及装置
CN111428198A (zh) * 2020-03-23 2020-07-17 平安医疗健康管理股份有限公司 一种确定异常医疗清单的方法、装置、设备和存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Apriori Algorithm for Surgical Consumable Material Standardization;Christoforus Yohannes等;《IOSR Journal of Computer Engineering》;20161231;第18卷(第6期);全文 *
基于Apriori算法的个人医疗费用关联规则分析;尚有为;《中华医学图书情报杂志》;20191130;第28卷(第11期);全文 *
病案首页遗漏疾病诊断和手术操作填写情况分析;王文达;《中国病案》;20081231;第9卷(第7期);全文 *

Also Published As

Publication number Publication date
CN112349399A (zh) 2021-02-09

Similar Documents

Publication Publication Date Title
Mccarty et al. Incidence of systemic lupus erythematosus race and gender differences
CN102947832B (zh) 患者记录的身份匹配
Birnbaum et al. Failure to validate the San Francisco Syncope Rule in an independent emergency department population
US7653227B2 (en) Hierarchical modeling in medical abnormality detection
CN112164460A (zh) 一种基于医疗知识图谱的智能疾病辅助诊断***
JP2006500075A (ja) 肺がん判別のための患者データマイニング
CN113808738B (zh) 一种基于自识别影像的疾病识别***
CN112349399B (zh) 基于关联算法的手术缺漏自动检测方法
US20230401466A1 (en) Method for temporal knowledge graph reasoning based on distributed attention
CN112401915A (zh) 一种新冠肺炎ct复查的图像融合比对方法
CN113342973A (zh) 一种基于疾病二分类器的辅助诊断模型的诊断方法
CN115205601A (zh) 一种基于人工智能与知识图谱的医学检验结果审核***
CN116844733B (zh) 一种基于人工智能的医疗数据完整性分析方法
CN112151174A (zh) 一种基于体检数据的用户健康信息分析方法、***
CN115424741B (zh) 基于因果发现的药物不良反应信号发现方法及***
CN112669973B (zh) 基于大数据深度学习的疾病协同递进预测方法和机器人
CN113642669B (zh) 基于特征分析的防欺诈检测方法、装置、设备及存储介质
CN109493975A (zh) 基于xgboost模型的慢性病复发预测方法、装置和计算机设备
CN115587333A (zh) 一种基于多分类模型的失效分析故障点预测方法及***
CN114242239B (zh) 一种vte风险监测及结果质控***
CN114913979A (zh) 一种疾病风险等级预测模型及其构建方法和应用
CN114300158A (zh) 一种药品不良反应的识别方法及装置
Liu et al. Application of the clinical decision support systems in the management of chronic diseases
Rabelo Jr et al. An expert system for diagnosis of acute myocardial infarction with ECG analysis
CN114613520B (zh) 一种基于时态逻辑的多来源围术期时序数据的治理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant