CN106650232A - 一种根据药物计算疾病发生概率的方法及其*** - Google Patents

一种根据药物计算疾病发生概率的方法及其*** Download PDF

Info

Publication number
CN106650232A
CN106650232A CN201610996966.4A CN201610996966A CN106650232A CN 106650232 A CN106650232 A CN 106650232A CN 201610996966 A CN201610996966 A CN 201610996966A CN 106650232 A CN106650232 A CN 106650232A
Authority
CN
China
Prior art keywords
probability
disease
medical treatment
resolution data
checked
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610996966.4A
Other languages
English (en)
Inventor
刘立
李玉杰
吴诗展
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Haoyundao Information Technology Co Ltd
Original Assignee
Beijing Haoyundao Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Haoyundao Information Technology Co Ltd filed Critical Beijing Haoyundao Information Technology Co Ltd
Priority to CN201610996966.4A priority Critical patent/CN106650232A/zh
Publication of CN106650232A publication Critical patent/CN106650232A/zh
Pending legal-status Critical Current

Links

Classifications

    • G06F19/326
    • G06F19/328

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明提供一种根据药物计算疾病发生概率的方法及其***,其中根据药物计算疾病发生概率的方法包括以下步骤:基于医疗理赔数据,利用朴素贝叶斯算法计算待检药物组合在所述医疗理赔数据中疾病的发生概率。本发明所提供的计算方法和***解决了由于药物名称和疾病的复杂多样性使得理赔工作人员很难根据经验来判断医保报销单上所列的药物组合是否用于所列疾病,是否有借开药以套保费的现象,为理赔人员提供了便利。

Description

一种根据药物计算疾病发生概率的方法及其***
技术领域
本发明涉及通信技术领域,更具体地,涉及一种根据药物计算疾病发生概率的方法及其***。
背景技术
在医疗保险理赔运营管理中,至关重要的一个环节就是及时发现欺诈、浪费、滥用等费用风险。理赔人员往往仅根据责任保险条款及医保报销目录进行理赔,缺乏对医疗服务临床合理性的判断,从而漏失对大部分欺诈、不合理医疗行为的监测。现今医保药品报销通常要求诊断的疾病与药名相匹配,而药物名称的复杂多样性,常使得理赔工作人员感到困扰,很难根据经验判断医保报销单上所列的药物组合是否用于治疗医保报销单上所列的疾病,是否有借开药以套保费的现象。
发明内容
为了帮助理赔工作人员根据客户所提供的药物组合来判断该客户可能得的疾病,本发明提供一种根据药物计算疾病发生概率的方法及其***。
根据本发明的一个方面,提供一种根据药物计算疾病发生概率的方法,包括以下步骤:
基于医疗理赔数据,利用朴素贝叶斯算法计算待检药物组合对应所述医疗理赔数据中疾病的发生概率。
优选地,所述朴素贝叶斯算法的具体步骤包括:
根据所述医疗理赔数据中的所有疾病发生次数,计算每一种疾病的发生频率,并相应记为每一种疾病对应的第一概率;
基于医疗理赔数据,计算待检药物组合中所有药品对应所述医疗理赔数据中与第一概率对应的疾病的条件概率,并记为第二概率;
利用朴素贝叶斯公式,计算第一概率与第二概率的乘积;
遍历所述医疗理赔数据中的所有疾病,并将所对应的乘积构建向量模型,得到在待检药物组合下疾病的发生概率。
优选地,构建向量模型后将其归一化,从而得到在待检药物组合下疾病的发生概率。
优选地,在第二概率的计算中,具体步骤包括:
使用TF-IDF,对所述医疗理赔数据中所有药品在与第一概率对应的疾病中分别分配权重:
其中,TF指所述医疗理赔数据中所有药品在与第一概率对应的疾病的药物中出现的频率;
IDF指所述医疗理赔数据中所有药品的重要性的度量;
计算TF-IDF值并将其归一化;
将待检药物组合中所有药品所对应的TF-IDF归一化值取乘积,即得第二概率。
优选地,所述IDF具体获取包括:所述医疗理赔数据中所有疾病种数除以包括在医疗理赔数据中该药品的疾病数,再将得到的商取2的对数;
优选地,还包括以下步骤:在使用朴素贝叶斯算法之前,判断待检药物组合中所有药品中是否存在于所述医疗理赔数据的所有药物中:若存在,则进行朴素贝叶斯算法;若不存在,则直接输出结果。
本发明还提供了一种根据药物计算疾病发生概率的***,包括:
数据采集模块,用于采集待检药物组合的数据和医疗理赔数据;
发生概率计算模块,用于读取待检药物组合的数据和医疗理赔数据,利用朴素贝叶斯算法计算待检药物组合在所述医疗理赔数据中疾病的发生概率;
数据输出模块,用于输出基于理赔医疗数据下待检药物组合能治疗的疾病的名称、在理赔医疗数据中相应的疾病代码和发生概率。
优选地,所述发生概率计算模块包括:
第一概率计算单元,用于根据所述医疗理赔数据中的所有疾病发生频率计算每一种疾病的发生频率;
第二概率计算单元,用于根据所述医疗理赔数据计算待检药物组合中药品的条件概率;
发生概率计算单元,用于利用朴素贝叶斯公式计算第一概率与第二概率的乘积;
空间向量单元,用于将待检药物组合中所有药品以及所述医疗理赔数据中所有疾病所对应的所述乘积构建向量模型,得到在待检药物组合下疾病的发生概率。
优选地,所述数据输出模块还包括用于输出不存在于医疗理赔数据中所有药物的待检药物。
本申请提出的根据药物计算疾病发生概率的方法及其***有效地解决了理赔人员难以根据经验来判断所列药物组合是否用于所列疾病,理赔人员只需在本发明的***中输入每种药品名称,将输出的疾病发生概率结果与医保报销单上所列疾病比较,即可判断是否存在套保费的现象。
附图说明
图1为根据本发明一个优选实施例的根据药物计算疾病发生概率的***的总体结构示意图;
图2为根据本发明一个优选实施例的根据药物计算疾病发生概率的***的界面图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
本发明所使用的数据为理赔数据,每一条记录代表患者的一次就诊,每一列分别代表样本文件名、就诊医院、疾病代码、费用项目、费用明细和费用总额等数据。
本发明提供一种根据药物计算疾病发生概率的方法,包括以下步骤:
基于医疗理赔数据,利用朴素贝叶斯算法计算待检药物组合对应所述医疗理赔数据中疾病的发生概率。
其中,所述朴素贝叶斯算法的具体步骤包括:根据所述医疗理赔数据中的所有疾病发生频率,计算每一种疾病的发生频率,并记为第一概率;
在本发明的一种实施方式中,第一概率的计算步骤为:统计医疗理赔数据中所有疾病的名称yj以及每一种P(yj),并将其计为第一概率;
基于医疗理赔数据,计算待检药物组合中所有药品对应所述医疗理赔数据中与第一概率对应的疾病的条件概率,并记为第二概率;
利用朴素贝叶斯公式,计算第一概率与第二概率的乘积;
遍历所述医疗理赔数据中的所有疾病,并将所对应的乘积构建向量模型,得到在待检药物组合下疾病的发生概率。
其中,对于第一概率的计算:假设在原始医疗理赔数据中有100万次就诊记录,每一次就诊记录都对应一种病,在这100万次中,统计出A病出现10万次,B病出现40万次,C病出现30万次,D病出现20万次,那么ABCD四种病每一种病的发生频率分别为10%、40%、30%、20%。在统计学中,当数据量很大的时候,频率可以代替概率,因此可以认为ABCD四种病的概率y1、y2、y3、y4分另为10%、40%、30%、20%。按上述方法统计医疗理赔数据中所有疾病名称yj以及相应的第一概率。
本发明的一种实施方式中,使用TF-IDF权重的方法对待检药物组合中每一种药物分别分配权重:
其中,TF指待检药物组合中药品在治疗每一种疾病的药物中出现的频率;以某种疾病yj为例,针对待检药物组合中第i个药品,TFj的第i个元素表示ai在疾病yj所用药物中出现的频率。
IDF指待检药物组合中药品的重要性的度量,具体公式为所述医疗理赔数据中所有疾病种数除以包括在医疗理赔数据中该药品的疾病数,再将得到的商取2的对数。
本发明的一种实施方式中,针对待检药物组合中第i个药品,IDF的第i个元素的计算公式为
其中,N为医疗理赔数据中所有的疾病数,ni表示包含药物ai的疾病数。其中,当该种药物不在医疗理赔数据的所有药物中时,本发明的另一实施方式中,直接进入输出模块,将结果输出。
本发明的一种实施方式中,以第i个药品,第yj个疾病为例,计算TFj·IDF值并归一化,归一化的值作为P(ai|yj)的值。
遍历医疗理赔数据中针对该疾病yj所有药品的P(ai|yj)值。
本发明的一种实施方式中,待检药物组合设为将不在医疗理赔数据中的药品输出后,将其它存在于医疗理赔数据中的药品所对应的P(ai|yj)值取乘积,算出药物组合中yj对应的Pj
重复上述步骤,遍历医疗保险数据中的所有疾病,并将其结果构建向量模型即得到P=(P1,P2,……,Pj,……),并归一化,得到P′=(P′1,P′2,……,P′j,……),则P′j表示在药品名称组合下疾病yj发生的概率。
本发明提供了一种根据药物计算疾病发生概率的***,如图1所示,包括:
数据采集模块S1,用于采集待检药物组合的数据和医疗理赔数据;
发生概率计算模块S2,用于读取待检药物组合的数据和医疗理赔数据,利用朴素贝叶斯算法计算待检药物组合在所述医疗理赔数据中疾病的发生概率;
数据输出模块S3,用于输出基于理赔医疗数据下待检药物组合能治疗的疾病的名称、在理赔医疗数据中相应的疾病代码和发生概率。
其中,数据采集模块包括输入端,输入端采集的数据为药品的名称,可以手动输入,也可以根据下拉菜单选择药品名称;数据输出模块包括将包含该药物组合的可能的疾病名称、疾病在医疗理赔数据中的代码以及包含该药物组合的可能的疾病的发生概率输出,并以本领域中公知的方式给出,优选以列表方式给出,如图2所示;在另一种实施方式中,还可包括将不包含在医疗理赔数据中的待检药品名称输出。
其中,所述发生概率计算模块包括:
第一概率计算单元,用于根据所述医疗理赔数据中的所有疾病发生频率计算每一种疾病的发生频率;
第二概率计算单元,用于根据所述医疗理赔数据计算待检药物组合中每种药品的条件概率;
发生概率计算单元,用于利用朴素贝叶斯公式计算第一概率与第二概率的乘积;
空间向量单元,用于将待检药物组合中所有药品以及所述医疗理赔数据中所有疾病所对应的所述乘积构建向量模型,得到在待检药物组合下疾病的发生概率。
在一个优选的实施方式中,将向量模型中的值归一化得到在待检药物组合下疾病的发生概率,从而使输出的值更加直观且合理。
理赔人员利用本发明的根据药物计算疾病发生概率的方法及***,只需输入药品名称,以本发明的一个优选实施方式的界面图2为例,理赔人员在左边输入药物组合中药品的名称,也可通过下拉菜单选择药品名称,点击“确定”按钮,在界面的右边便可显示包含输入药品的所有的疾病代码、名称以及概率,理赔人员将输出的结果与医保报销单中所列疾病比较,若医保报销单中所列疾病有没有出现在输出结果中,或该疾病出现在输出结果中但概率值低于理赔人员的承受范围,则可认为存在套保费现象。反之,若医保报销单中所列疾病出现在输出结果中并且概率值高于理赔人员承受范围,则可认为不存在套保费现象。
最后,本申请的方法仅为较佳的实施方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种根据药物计算疾病发生概率的方法,包括以下步骤:
基于医疗理赔数据,利用朴素贝叶斯算法计算待检药物组合对应所述医疗理赔数据中疾病的发生概率。
2.根据权利要求1所述的方法,其特征在于,所述朴素贝叶斯算法的具体步骤包括:
根据所述医疗理赔数据中的所有疾病发生次数,计算每一种疾病的发生频率,并相应记为每一种疾病对应的第一概率;
基于医疗理赔数据,计算待检药物组合中所有药品对应所述医疗理赔数据中与第一概率对应的疾病的条件概率,并记为第二概率;
利用朴素贝叶斯公式,计算第一概率与第二概率的乘积;
遍历所述医疗理赔数据中的所有疾病,并将所对应的乘积构建向量模型,得到在待检药物组合下疾病的发生概率。
3.根据权利要求2所述的方法,其特征在于,在第二概率的计算中,具体步骤包括:
使用TF-IDF,对所述医疗理赔数据中所有药品在与第一概率对应的疾病中分别分配权重:
其中,TF指所述医疗理赔数据中所有药品在与第一概率对应的疾病的药物中出现的频率;
IDF指所述医疗理赔数据中所有药品的重要性的度量;
计算TF-IDF值并将其归一化;
将待检药物组合中所有药品所对应的TF-IDF归一化值取乘积,即得第二概率。
4.根据权利要求3所述的方法,其特征在于,所述IDF具体获取包括:每一种药品的IDF值为所述医疗理赔数据中所有疾病种数除以包括在医疗理赔数据中该种药品的疾病数,再将得到的商取2的对数。
5.根据权利要求1-4中任一项所述的方法,其特征在于,还包括以下步骤:在使用朴素贝叶斯算法之前,判断待检药物组合中所有药品中是否存在于所述医疗理赔数据的所有药物中:若存在,则进行朴素贝叶斯算法;若不存在,则直接输出结果。
6.一种根据药物计算疾病发生概率的***,包括:
数据采集模块,用于采集待检药物组合的数据和医疗理赔数据;
发生概率计算模块,用于读取待检药物组合的数据和医疗理赔数据,利用朴素贝叶斯算法计算待检药物组合在所述医疗理赔数据中疾病的发生概率;
数据输出模块,用于输出基于理赔医疗数据下待检药物组合能治疗的疾病的名称、在理赔医疗数据中相应的疾病代码和发生概率。
7.根据权利要求6所述的***,其特征在于,所述发生概率计算模块包括:
第一概率计算单元,用于根据所述医疗理赔数据中的所有疾病发生频率计算每一种疾病的发生频率;
第二概率计算单元,用于根据所述医疗理赔数据计算待检药物组合中每种药品的条件概率;
发生概率计算单元,用于利用朴素贝叶斯公式计算第一概率与第二概率的乘积;
空间向量单元,用于将待检药物组合中所有药品以及所述医疗理赔数据中所有疾病所对应的所述乘积构建向量模型,得到在待检药物组合下疾病的发生概率。
8.根据权利要求6所述的***,其特征在于,所述数据输出模块还包括用于输出不存在于医疗理赔数据中所有药物的待检药物。
CN201610996966.4A 2016-11-09 2016-11-09 一种根据药物计算疾病发生概率的方法及其*** Pending CN106650232A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610996966.4A CN106650232A (zh) 2016-11-09 2016-11-09 一种根据药物计算疾病发生概率的方法及其***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610996966.4A CN106650232A (zh) 2016-11-09 2016-11-09 一种根据药物计算疾病发生概率的方法及其***

Publications (1)

Publication Number Publication Date
CN106650232A true CN106650232A (zh) 2017-05-10

Family

ID=58806327

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610996966.4A Pending CN106650232A (zh) 2016-11-09 2016-11-09 一种根据药物计算疾病发生概率的方法及其***

Country Status (1)

Country Link
CN (1) CN106650232A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109544372A (zh) * 2018-10-30 2019-03-29 平安医疗健康管理股份有限公司 基于人工智能的门诊慢性病资质监控方法及相关装置
CN109545371A (zh) * 2018-10-27 2019-03-29 平安医疗健康管理股份有限公司 基于数据处理的***增生资质认证方法、设备及服务器
CN110085307A (zh) * 2019-04-04 2019-08-02 华东理工大学 一种基于多源知识图谱融合的智能导诊方法和***
WO2020119112A1 (zh) * 2018-12-13 2020-06-18 平安医疗健康管理股份有限公司 保费定价模型的建立方法、装置、设备及存储介质
CN112200704A (zh) * 2020-07-21 2021-01-08 重庆市中迪医疗信息科技股份有限公司 基于gis的健康宣传方法、***、服务器及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102507883A (zh) * 2011-11-16 2012-06-20 上海生物信息技术研究中心 一种基于生物过程预测药物新疗效的方法及应用
CN103095485A (zh) * 2012-10-26 2013-05-08 中国航天科工集团第二研究院七〇六所 基于贝叶斯算法及矩阵方法相结合的网络风险评估方法
CN103514576A (zh) * 2013-09-06 2014-01-15 深圳民太安信息技术有限公司 一种社保就诊违规套现的筛查方法
CN105631235A (zh) * 2016-03-10 2016-06-01 深圳市前海安测信息技术有限公司 基于医疗大数据的医疗保险精算***及方法
CN105844527A (zh) * 2016-03-18 2016-08-10 深圳市前海安测信息技术有限公司 医疗保险费折扣精算***及方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102507883A (zh) * 2011-11-16 2012-06-20 上海生物信息技术研究中心 一种基于生物过程预测药物新疗效的方法及应用
CN103095485A (zh) * 2012-10-26 2013-05-08 中国航天科工集团第二研究院七〇六所 基于贝叶斯算法及矩阵方法相结合的网络风险评估方法
CN103514576A (zh) * 2013-09-06 2014-01-15 深圳民太安信息技术有限公司 一种社保就诊违规套现的筛查方法
CN105631235A (zh) * 2016-03-10 2016-06-01 深圳市前海安测信息技术有限公司 基于医疗大数据的医疗保险精算***及方法
CN105844527A (zh) * 2016-03-18 2016-08-10 深圳市前海安测信息技术有限公司 医疗保险费折扣精算***及方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109545371A (zh) * 2018-10-27 2019-03-29 平安医疗健康管理股份有限公司 基于数据处理的***增生资质认证方法、设备及服务器
CN109545371B (zh) * 2018-10-27 2024-05-17 平安医疗健康管理股份有限公司 基于数据处理的***增生资质认证方法、设备及服务器
CN109544372A (zh) * 2018-10-30 2019-03-29 平安医疗健康管理股份有限公司 基于人工智能的门诊慢性病资质监控方法及相关装置
CN109544372B (zh) * 2018-10-30 2024-04-09 平安医疗健康管理股份有限公司 基于人工智能的门诊慢性病资质监控方法及相关装置
WO2020119112A1 (zh) * 2018-12-13 2020-06-18 平安医疗健康管理股份有限公司 保费定价模型的建立方法、装置、设备及存储介质
CN110085307A (zh) * 2019-04-04 2019-08-02 华东理工大学 一种基于多源知识图谱融合的智能导诊方法和***
CN112200704A (zh) * 2020-07-21 2021-01-08 重庆市中迪医疗信息科技股份有限公司 基于gis的健康宣传方法、***、服务器及介质

Similar Documents

Publication Publication Date Title
CA3099002C (en) Managing data objects for graph-based data structures
US8670997B2 (en) Quality metric extraction and editing for medical data
CN106529177B (zh) 一种基于医疗大数据的患者画像方法及装置
US20200303047A1 (en) Methods and systems for a pharmacological tracking and representation of health attributes using digital twin
Dimitrov Medical internet of things and big data in healthcare
US8626533B2 (en) Patient data mining with population-based analysis
CN106650232A (zh) 一种根据药物计算疾病发生概率的方法及其***
US20080275731A1 (en) Patient data mining improvements
US20130332194A1 (en) Methods and systems for adaptive ehr data integration, query, analysis, reporting, and crowdsourced ehr application development
US20060265253A1 (en) Patient data mining improvements
US20140095201A1 (en) Leveraging Public Health Data for Prediction and Prevention of Adverse Events
US20110295621A1 (en) Healthcare Information Technology System for Predicting and Preventing Adverse Events
CN105190634A (zh) 用于计算用作医疗决策支持的医疗建议的分数的方法
US20210183486A1 (en) Biological information processing method, biological information processing apparatus, and biological information processing system
US8918462B2 (en) Using user-attribute ontologies to calculate user-anonymity degrees
US20210241871A1 (en) Systems and Methods for Reducing Patient Readmission to Acute Care Facilities
Kristianson et al. Data extraction from a semi-structured electronic medical record system for outpatients: a model to facilitate the access and use of data for quality control and research
Gupta et al. A novel approach based on computing with words for monitoring the heart failure patients
Assaf et al. 30-day hospital readmission prediction using MIMIC data
WO2022229964A1 (en) Method of generating a diseases database, usage of the diseases database, and system therefor
Bogie D Phil et al. Development of predictive informatics tool using electronic health records to inform personalized evidence-based pressure injury management for Veterans with spinal cord injury
CN116453641B (zh) 一种中医辅助分析信息的数据处理方法及***
WO2023240837A1 (zh) 基于病患数据的服务包生成方法、装置、设备及存储介质
CN106447500A (zh) 一种根据疾病和药物的匹配度进行打分的方法及其***
US20220051802A1 (en) System and method for detection and monitoring of over sedation to prevent harm to patients

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170510