CN111696659A - 基于医保大数据的肿瘤发病信息监测方法及装置 - Google Patents

基于医保大数据的肿瘤发病信息监测方法及装置 Download PDF

Info

Publication number
CN111696659A
CN111696659A CN201910857603.6A CN201910857603A CN111696659A CN 111696659 A CN111696659 A CN 111696659A CN 201910857603 A CN201910857603 A CN 201910857603A CN 111696659 A CN111696659 A CN 111696659A
Authority
CN
China
Prior art keywords
medical insurance
data
insurance data
tumor
groups
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910857603.6A
Other languages
English (en)
Inventor
柯杨
何忠虎
田洪瑞
刘震
杨伟
雷亮
郭传海
潘雅琪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute for Cancer Research
Original Assignee
Beijing Institute for Cancer Research
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute for Cancer Research filed Critical Beijing Institute for Cancer Research
Priority to CN201910857603.6A priority Critical patent/CN111696659A/zh
Publication of CN111696659A publication Critical patent/CN111696659A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开一种基于医保大数据的肿瘤发病信息监测方法及装置,方法包括:获取多组医保数据,每组医保数据包括:疾病诊断数据和对应的疾病编码数据;根据肿瘤关键字库,从所述多组医保数据中选取疾病诊断数据包含肿瘤关键字的一组或多组第一医保数据;根据肿瘤编码数据库,从所述多组医保数据中选取疾病编码数据包含肿瘤编码的一组或多组第二医保数据;将选取的第一医保数据和第二医保数据进行比对,根据比对结果从所述多组医保数据中选择一组或多组医保数据,根据所述一组或多组医保数据进行肿瘤发病信息监测。不需要对肿瘤发病数据进行人工登记核查,通过医保数据提取肿瘤发病事件,获得肿瘤发病信息,节省人力物力,提高效率,保障数据时效性。

Description

基于医保大数据的肿瘤发病信息监测方法及装置
技术领域
本发明涉及医疗技术领域,尤其涉及基于医保大数据的肿瘤发病信息监测方法及装置。
背景技术
作为第二大死因的慢性非传染性疾病,肿瘤对人类的健康构成了严重威胁。准确、动态、实时的肿瘤发病数据可为肿瘤防控工作的政策制定、资源配置等工作提供重要的科学依据。
目前,肿瘤发病数据的获得主要通过肿瘤登记实现。由各地区定点医疗机构根据医保数据进行人工填报,登记处工作人员定期对各机构的登记工作质量进行全面的检查、评估与反馈,例如是否漏报、报告卡项目是否填写完整,各机构根据反馈结果对登记资料进行核实、补充、修改与再次上报。整个肿瘤登记核查工作需要耗费大量人力物力,工作效率极低,且数据汇总过程所需时间较长,缺乏时效性。
发明内容
本发明实施例提供一种基于医保大数据的肿瘤发病信息监测方法,用以提高肿瘤登记及核查的工作效率,获得具有时效性的肿瘤发病数据,该方法包括:
获取多组医保数据,每组医保数据包括:疾病诊断数据和对应的疾病编码数据;
根据肿瘤关键字库,从所述多组医保数据中选取疾病诊断数据包含肿瘤关键字的一组或多组第一医保数据;
根据肿瘤编码数据库,从所述多组医保数据中选取疾病编码数据包含肿瘤编码的一组或多组第二医保数据;
将选取的第一医保数据和第二医保数据进行比对,根据比对结果从所述多组医保数据中选择一组或多组医保数据,根据所述一组或多组医保数据进行肿瘤发病信息监测。
本发明实施例提供一种基于医保大数据的肿瘤发病信息监测装置,用以提高肿瘤登记及核查的工作效率,获得具有时效性的肿瘤发病数据,该方法包括:
数据获取模块,用于获取多组医保数据,每组医保数据包括:疾病诊断数据和对应的疾病编码数据;
第一选取模块,用于根据肿瘤关键字库,从所述多组医保数据中选取疾病诊断数据包含肿瘤关键字的一组或多组第一医保数据;
第二选取模块,用于根据肿瘤编码数据库,从所述多组医保数据中选取疾病编码数据包含肿瘤编码的一组或多组第二医保数据;
数据比对模块,用于将选取的第一医保数据和第二医保数据进行比对,根据比对结果从所述多组医保数据中选择一组或多组医保数据,根据所述一组或多组医保数据进行肿瘤发病信息监测。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于医保大数据的肿瘤发病信息监测方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述基于医保大数据的肿瘤发病信息监测方法的计算机程序。
相对于现有技术中人工登记核查肿瘤发病数据的方案而言,本发明实施例通过获取多组医保数据,每组医保数据包括:疾病诊断数据和对应的疾病编码数据;根据肿瘤关键字库,从所述多组医保数据中选取疾病诊断数据包含肿瘤关键字的一组或多组第一医保数据;根据肿瘤编码数据库,从所述多组医保数据中选取疾病编码数据包含肿瘤编码的一组或多组第二医保数据;将选取的第一医保数据和第二医保数据进行比对,根据比对结果从所述多组医保数据中选择一组或多组医保数据,根据所述一组或多组医保数据进行肿瘤发病信息监测。本发明实施例分别根据肿瘤关键字库和肿瘤编码数据库对医保数据进行筛选,通过比对核查两次选出的医保数据是否能够对应上,从而确定肿瘤发病数据,不需要逐一对肿瘤发病数据进行人工登记及核查,仅通过医保数据可以提取肿瘤发病事件,从而获得各肿瘤发病信息,节省大量人力物力,提高工作效率,保障数据时效性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本发明实施例中基于医保大数据的肿瘤发病信息监测方法示意图;
图2为本发明一具体实施例中基于医保大数据的肿瘤发病信息监测方法示意图;
图3为本发明一具体实施例中新发肿瘤病例数据库示意图;
图4为本发明一具体实施例中肿瘤发病主要指标结果示意图;
图5为本发明一具体实施例中肿瘤发病趋势示意图;
图6为本发明实施例中基于医保大数据的肿瘤发病信息监测装置结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
如前所述,目前肿瘤发病数据的获得主要通过肿瘤登记实现。“肿瘤登记”模式采取的是在全国部分地区设立登记点(主要依托医院)的方式,数据获取依赖这些“登记点”上报,“肿瘤登记”是一个庞大的体系,需要大量人力物力,工作效率极低,且数据汇总过程所需时间较长,缺乏时效性。发明人发现,仅利用医保报销数据,可以提取肿瘤发病事件,从而获得各肿瘤发病数量等信息,节省大量人力物力,提高工作效率,保障数据时效性,是在大数据时代倡导的新的方式。
为了提高肿瘤登记及核查的工作效率,获得具有时效性的肿瘤发病数据,本发明实施例提供一种基于医保大数据的肿瘤发病信息监测方法,如图1所示,该方法可以包括:
步骤101、获取多组医保数据,每组医保数据包括:疾病诊断数据和对应的疾病编码数据;
步骤102、根据肿瘤关键字库,从所述多组医保数据中选取疾病诊断数据包含肿瘤关键字的一组或多组第一医保数据;
步骤103、根据肿瘤编码数据库,从所述多组医保数据中选取疾病编码数据包含肿瘤编码的一组或多组第二医保数据;
步骤104、将选取的第一医保数据和第二医保数据进行比对,根据比对结果从所述多组医保数据中选择一组或多组医保数据,根据所述一组或多组医保数据进行肿瘤发病信息监测。
由图1所示可以得知,本发明实施例通过获取多组医保数据,每组医保数据包括:疾病诊断数据和对应的疾病编码数据;根据肿瘤关键字库,从所述多组医保数据中选取疾病诊断数据包含肿瘤关键字的一组或多组第一医保数据;根据肿瘤编码数据库,从所述多组医保数据中选取疾病编码数据包含肿瘤编码的一组或多组第二医保数据;将选取的第一医保数据和第二医保数据进行比对,根据比对结果从所述多组医保数据中选择一组或多组医保数据,根据所述一组或多组医保数据进行肿瘤发病信息监测。本发明实施例分别根据肿瘤关键字库和肿瘤编码数据库对医保数据进行筛选,通过比对核查两次选出的医保数据是否能够对应上,从而确定肿瘤发病数据,不需要逐一对肿瘤发病数据进行人工登记及核查,仅通过医保数据可以提取肿瘤发病事件,从而获得各肿瘤发病信息,节省大量人力物力,提高工作效率,保障数据时效性。
具体实施时,获取多组医保数据,每组医保数据包括:疾病诊断数据和对应的疾病编码数据。
实施例中,疾病诊断数据可以为诊断报告中的文字信息,疾病编码数据可以为ICD-10疾病编码,ICD-10疾病编码为《国际疾病分类》第10版(InternationalClassification of Diseases-10th revision)中对于疾病的编码。
实施例中,所述每组医保数据还包括:疾病诊断数据对应的患者身份数据;在获取多组医保数据之后,对每组医保数据中的患者身份数据进行加密;或每获取一组医保数据,对该组医保数据中的患者身份数据进行加密。发明人发现,数据安全与隐私保护是公共大数据开发的第一要务,也是医保数据分析工作的重要基础和前提。因此本发明实施例在获取数据之后或获取数据的同时,对患者身份数据进行加密,可以有效保护患者隐私。患者身份数据可以包括姓名、身份证号、医疗证号、联系方式及具体家庭住址等个人敏感数据。本实施例中,可以采用十六进制加密算法,生成无意义唯一识别代码对患者身份进行标记,用于数据传输及清理。
实施例中,所述每组医保数据还包括:疾病诊断数据对应的就诊医院等级;在获取多组医保数据之后,选取多组医保数据中就诊医院等级大于预设等级的医保数据;或每获取一组医保数据,判断该组医保数据中就诊医院等级是否大于预设等级,若大于预设等级,则选取该组医保数据。发明人发现,一些低资质的就诊医院出具的疾病诊断数据缺乏准确性,在医保数据分析工作中采用这些数据将严重影响分析结果的准确性,因此,本发明实施例参照中华人民共和国国家卫生健康委员会的官方数据(hqms.org.cn/usp/roster/index.jsp),将就诊医院等级按诊治资质从高到低标定为“三级”、“二级”和“一级或未分级”,在获取多组医保数据之后,选取多组医保数据中就诊医院等级大于预设等级的医保数据;或每获取一组医保数据,判断该组医保数据中就诊医院等级是否大于预设等级,若大于预设等级,则选取该组医保数据。例如,排除一级或未分级医院的医保数据,从而确保疾病诊断数据的准确。
实施例中,根据待分析的肿瘤发病时段,可以设置在该时段之前且与该时段相邻的时间窗,在获取多组医保数据时,除了获取待分析时段的医保数据,还需要获取时间窗内的医保数据,将同时出现在待分析时段和时间窗内的医保数据去除,从而排除现患病例的影响。发明人发现,待分析的肿瘤发病时段中的医保数据存在现患病例,如果在分析中加入这部分数据,获得的发病率结果将高于实际发病率。因此,本发明实施例通过设置时间窗,将同时出现在待分析时段和时间窗内的医保数据去除,从而排除现患病例的影响。
实施例中,根据待分析的肿瘤发病时段,可以设置在该时段之后且与该时段相邻的时间窗,在获取多组医保数据时,除了获取待分析时段的医保数据,还需要获取时间窗内的医保数据,通过加入出现在时间窗内的医保数据,去除报销延迟影响。发明人发现,存在当年入院但在次年报销的病例,如果在分析中遗漏这部分数据,获得的发病率结果将低于实际发病率。因此,本发明实施例通过设置时间窗,加入出现在时间窗内的医保数据,从而排除报销延迟的影响。
具体实施时,根据肿瘤关键字库,从所述多组医保数据中选取疾病诊断数据包含肿瘤关键字的一组或多组第一医保数据。
实施例中,根据ICD-10中文版,提取文字诊断中所有提示肿瘤的关键字,建立肿瘤关键字库,例如:“癌”、“肉瘤”、“恶性肿瘤”、“白血病”、“淋巴瘤”、“霍奇金”、“富兰克林疾病”、“阿尔法重链疾病”等。然后根据肿瘤关键字库,从多组医保数据中选取疾病诊断数据包含肿瘤关键字的一组或多组第一医保数据。
具体实施时,根据肿瘤编码数据库,从所述多组医保数据中选取疾病编码数据包含肿瘤编码的一组或多组第二医保数据。
实施例中,根据ICD-10中文版,提取所有肿瘤相关代码,建立肿瘤编码数据库,如以C00-C97开头的代码。然后根据肿瘤关键字库,从多组医保数据中选取疾病编码数据包含肿瘤编码的一组或多组第二医保数据。
具体实施时,将选取的第一医保数据和第二医保数据进行比对,根据比对结果从所述多组医保数据中选择一组或多组医保数据,根据所述一组或多组医保数据进行肿瘤发病信息监测。
实施例中,所述根据比对结果从所述多组医保数据中选择一组或多组医保数据,包括:对于每一组医保数据,若医保数据分别被选取为第一医保数据和第二医保数据,且医保数据中疾病诊断数据和疾病编码数据对应的疾病名称数据相同,则选择该组医保数据。
实施例中,所述根据比对结果从所述多组医保数据中选择一组或多组医保数据,包括:对于每一组医保数据,若医保数据仅被选取为第一医保数据或仅被选取为第二医保数据,或者医保数据虽然分别被选取为第一医保数据和第二医保数据,但是医保数据中疾病诊断数据和疾病编码数据对应的疾病名称数据不相同,则进行人工复核环节。通过小组讨论、专家咨询进行人工判读与复核以确定诊断。
实施例中,可以利用选出的医保数据进行统计,按照性别和年龄组分别计算人口数。例如,以5岁年龄别,将发病年龄划分为19组:不满1岁、1~4岁、5~9岁、10~14岁……75~79岁、80~84岁、85岁及以上。
实施例中,可以按如下公式计算反映当年当地实际的肿瘤发病情况与疾病负担的粗发病率:
Figure BDA0002195718090000061
实施例中,可以按如下公式计算反映肿瘤的高发年龄段和性别差异的性别、年龄别发病率,绘制性别、年龄别发病率曲线:
Figure BDA0002195718090000062
实施例中,年龄调整率可消除年龄结构差异对于粗发病率的影响,便于比较同一地区不同时期或不同地区的发病水平。中国标准人口参照2000年全国第五次人口普查的人口构成,世界标准人口参照Segi’s标准人口构成。可以按如下公式计算年龄调整率,即标准化率:
Figure BDA0002195718090000063
实施例中,可以按如下公式计算反映当地常见的肿瘤种类及其对居民的健康负担的分类构成,即各类新发肿瘤病例数所占的构成百分比:
Figure BDA0002195718090000064
实施例中,可以按如下方式计算用于分析肿瘤发病的时间趋势的年度变化百分比(APC)。设y年发病率为Ry,根据回归模型:log(Ry)=b0+b1y,其中b0为截距,b1为斜率,y为年份,计算从y年到y+1年的APC的公式如下:
Figure BDA0002195718090000065
其中,Ry+1为y+1年的发病率,Ry为y年的发病率,e为自然常数,b1为斜率。
实施例中,采用Stata 15.0进行数据处理,采用MS-Excel 2016计算发病率。采用Joinpoint 4.6.0.0检验发病趋势。Joinpoint模型假设发病率的自然对数与发病年份呈线性关系。
下面给出一个具体实施例,说明本发明实施例中基于医保大数据的肿瘤发病信息监测方法的具体应用。在本具体实施例中,假设需统计A城市2017年全瘤种发病率、常见肿瘤性别、年龄别分布及2014~2017年肿瘤发病趋势。需要获取的医保数据时间跨度为2012年1月1日~2018年6月30日。2014~2017年A城市医保数据分析方法如图2所示。将肿瘤发病部位分为27类,包括26个主要部位以及1个其他部位。对于每个患者的每种肿瘤诊断,只保留入院时间最早的一条记录,以排除重复诊断。2014~2017年当地新发肿瘤病例数据库如3所示。在图3中,“a”表示除外鼻咽癌,“b”表示除外C16.0。进而,进行统计分析,得到分析结果中2017年A城市肿瘤发病主要指标结果如图4所示。2014~2017年肿瘤发病趋势如图5所示。
基于同一发明构思,本发明实施例还提供了一种基于医保大数据的肿瘤发病信息监测装置,如下面的实施例所述。由于这些解决问题的原理与基于医保大数据的肿瘤发病信息监测方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
图6为本发明实施例中基于医保大数据的肿瘤发病信息监测装置的结构图,如图6所示,该装置包括:
数据获取模块201,用于获取多组医保数据,每组医保数据包括:疾病诊断数据和对应的疾病编码数据;
第一选取模块202,用于根据肿瘤关键字库,从所述多组医保数据中选取疾病诊断数据包含肿瘤关键字的一组或多组第一医保数据;
第二选取模块203,用于根据肿瘤编码数据库,从所述多组医保数据中选取疾病编码数据包含肿瘤编码的一组或多组第二医保数据;
数据比对模块204,用于将选取的第一医保数据和第二医保数据进行比对,根据比对结果从所述多组医保数据中选择一组或多组医保数据,根据所述一组或多组医保数据进行肿瘤发病信息监测。
一个实施例中,所述数据比对模块204进一步用于:
对于每一组医保数据,若医保数据分别被选取为第一医保数据和第二医保数据,且医保数据中疾病诊断数据和疾病编码数据对应的疾病名称数据相同,则选择该组医保数据。
一个实施例中,所述每组医保数据还包括:疾病诊断数据对应的患者身份数据;
在获取多组医保数据之后,对每组医保数据中的患者身份数据进行加密;或
每获取一组医保数据,对该组医保数据中的患者身份数据进行加密。
一个实施例中,所述每组医保数据还包括:疾病诊断数据对应的就诊医院等级;
在获取多组医保数据之后,选取多组医保数据中就诊医院等级大于预设等级的医保数据;或
每获取一组医保数据,判断该组医保数据中就诊医院等级是否大于预设等级,若大于预设等级,则选取该组医保数据。
综上所述,本发明实施例通过获取多组医保数据,每组医保数据包括:疾病诊断数据和对应的疾病编码数据;根据肿瘤关键字库,从所述多组医保数据中选取疾病诊断数据包含肿瘤关键字的一组或多组第一医保数据;根据肿瘤编码数据库,从所述多组医保数据中选取疾病编码数据包含肿瘤编码的一组或多组第二医保数据;将选取的第一医保数据和第二医保数据进行比对,根据比对结果从所述多组医保数据中选择一组或多组医保数据,根据所述一组或多组医保数据进行肿瘤发病信息监测。本发明实施例分别根据肿瘤关键字库和肿瘤编码数据库对医保数据进行筛选,通过比对核查两次选出的医保数据是否能够对应上,从而确定肿瘤发病数据,不需要逐一对肿瘤发病数据进行人工登记及核查,仅通过医保数据可以提取肿瘤发病事件,从而获得各肿瘤发病信息,节省大量人力物力,提高工作效率,保障数据时效性。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于医保大数据的肿瘤发病信息监测方法,其特征在于,包括:
获取多组医保数据,每组医保数据包括:疾病诊断数据和对应的疾病编码数据;
根据肿瘤关键字库,从所述多组医保数据中选取疾病诊断数据包含肿瘤关键字的一组或多组第一医保数据;
根据肿瘤编码数据库,从所述多组医保数据中选取疾病编码数据包含肿瘤编码的一组或多组第二医保数据;
将选取的第一医保数据和第二医保数据进行比对,根据比对结果从所述多组医保数据中选择一组或多组医保数据,根据所述一组或多组医保数据进行肿瘤发病信息监测。
2.如权利要求1所述的方法,其特征在于,所述根据比对结果从所述多组医保数据中选择一组或多组医保数据,包括:
对于每一组医保数据,若医保数据分别被选取为第一医保数据和第二医保数据,且医保数据中疾病诊断数据和疾病编码数据对应的疾病名称数据相同,则选择该组医保数据。
3.如权利要求1所述的方法,其特征在于,所述每组医保数据还包括:疾病诊断数据对应的患者身份数据;
在获取多组医保数据之后,对每组医保数据中的患者身份数据进行加密;或
每获取一组医保数据,对该组医保数据中的患者身份数据进行加密。
4.如权利要求1所述的方法,其特征在于,所述每组医保数据还包括:疾病诊断数据对应的就诊医院等级;
在获取多组医保数据之后,选取多组医保数据中就诊医院等级大于预设等级的医保数据;或
每获取一组医保数据,判断该组医保数据中就诊医院等级是否大于预设等级,若大于预设等级,则选取该组医保数据。
5.一种基于医保大数据的肿瘤发病信息监测装置,其特征在于,包括:
数据获取模块,用于获取多组医保数据,每组医保数据包括:疾病诊断数据和对应的疾病编码数据;
第一选取模块,用于根据肿瘤关键字库,从所述多组医保数据中选取疾病诊断数据包含肿瘤关键字的一组或多组第一医保数据;
第二选取模块,用于根据肿瘤编码数据库,从所述多组医保数据中选取疾病编码数据包含肿瘤编码的一组或多组第二医保数据;
数据比对模块,用于将选取的第一医保数据和第二医保数据进行比对,根据比对结果从所述多组医保数据中选择一组或多组医保数据,根据所述一组或多组医保数据进行肿瘤发病信息监测。
6.如权利要求5所述的装置,其特征在于,所述数据比对模块进一步用于:
对于每一组医保数据,若医保数据分别被选取为第一医保数据和第二医保数据,且医保数据中疾病诊断数据和疾病编码数据对应的疾病名称数据相同,则选择该组医保数据。
7.如权利要求5所述的装置,其特征在于,所述每组医保数据还包括:疾病诊断数据对应的患者身份数据;
在获取多组医保数据之后,对每组医保数据中的患者身份数据进行加密;或
每获取一组医保数据,对该组医保数据中的患者身份数据进行加密。
8.如权利要求5所述的装置,其特征在于,所述每组医保数据还包括:疾病诊断数据对应的就诊医院等级;
在获取多组医保数据之后,选取多组医保数据中就诊医院等级大于预设等级的医保数据;或
每获取一组医保数据,判断该组医保数据中就诊医院等级是否大于预设等级,若大于预设等级,则选取该组医保数据。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至4任一所述方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有执行权利要求1至4任一所述方法的计算机程序。
CN201910857603.6A 2019-09-09 2019-09-09 基于医保大数据的肿瘤发病信息监测方法及装置 Pending CN111696659A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910857603.6A CN111696659A (zh) 2019-09-09 2019-09-09 基于医保大数据的肿瘤发病信息监测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910857603.6A CN111696659A (zh) 2019-09-09 2019-09-09 基于医保大数据的肿瘤发病信息监测方法及装置

Publications (1)

Publication Number Publication Date
CN111696659A true CN111696659A (zh) 2020-09-22

Family

ID=72476112

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910857603.6A Pending CN111696659A (zh) 2019-09-09 2019-09-09 基于医保大数据的肿瘤发病信息监测方法及装置

Country Status (1)

Country Link
CN (1) CN111696659A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112509659A (zh) * 2020-11-27 2021-03-16 北京市肿瘤防治研究所 基于医保与死因监测数据的肿瘤患者生存监测方法及装置
CN112635068A (zh) * 2020-11-27 2021-04-09 北京市肿瘤防治研究所 基于医保与死因监测数据的肿瘤现患监测方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107731269A (zh) * 2017-10-25 2018-02-23 山东众阳软件有限公司 基于原始诊断数据和病历文件数据的疾病编码方法及***
CN109243551A (zh) * 2017-07-11 2019-01-18 河南省肿瘤医院 一种肿瘤登记随访网络直报***
CN109545297A (zh) * 2018-10-30 2019-03-29 平安医疗健康管理股份有限公司 一种基于大数据的病种编码方法及计算设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109243551A (zh) * 2017-07-11 2019-01-18 河南省肿瘤医院 一种肿瘤登记随访网络直报***
CN107731269A (zh) * 2017-10-25 2018-02-23 山东众阳软件有限公司 基于原始诊断数据和病历文件数据的疾病编码方法及***
CN109545297A (zh) * 2018-10-30 2019-03-29 平安医疗健康管理股份有限公司 一种基于大数据的病种编码方法及计算设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
HONGRUI TIAN等: "Identification of cancer patients using claims data from health insurance systems: A real-world comparative study" *
刘丹等: "计算机数据挖掘城镇居民大病保险中的应用分析" *
赖雪峰等: "医疗保险数据与传统登记途径对肿瘤病例的捕获比较分析:以内蒙古队列人群为例" *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112509659A (zh) * 2020-11-27 2021-03-16 北京市肿瘤防治研究所 基于医保与死因监测数据的肿瘤患者生存监测方法及装置
CN112635068A (zh) * 2020-11-27 2021-04-09 北京市肿瘤防治研究所 基于医保与死因监测数据的肿瘤现患监测方法及装置

Similar Documents

Publication Publication Date Title
Brooke et al. The Swedish cause of death register
US7725330B2 (en) Systems and methods for automated extraction and processing of billing information in patient records
US20050137910A1 (en) Systems and methods for automated extraction and processing of billing information in patient records
Fair Generalized record linkage system–Statistics Canada’s record linkage software
Gnanamanickam et al. Dental insurance, service use and health outcomes in Australia: a systematic review
Brown et al. Distance to an abortion provider and its association with the abortion rate: a multistate longitudinal analysis
CN111696659A (zh) 基于医保大数据的肿瘤发病信息监测方法及装置
Campbell et al. Economic, racial and ethnic disparities in breast cancer in the US: towards a more comprehensive model
CN108986873A (zh) 一种可追溯的诊疗数据处理方法及***
Li et al. Breathing exercises in the treatment of COPD: an overview of systematic reviews
Williamson et al. Individual patient data meta‐analysis of randomized anti‐epileptic drug monotherapy trials
Baldwin Linked record medical information systems
Sweeney 11 Computational Disclosure Control for Medi-cal Microdata: The Datafly System
Li et al. Chinese multicentre prospective registry of breast cancer patient-reported outcome-reconstruction and oncoplastic cohort (PRO-ROC): a study protocol
Li et al. Pediatric cancer surveillance in China: A hospital-based introduction
Cao et al. Social participation as a mediator of the relationships of socioeconomic factors and longevity after traumatic spinal cord injury
Kashada et al. The impact of perceived usefulness & perceived ease of use on the successful adoption of information systems in developing countries
CN113591154B (zh) 诊疗数据去标识化方法、装置及查询***
CN114783557A (zh) 肿瘤患者数据的处理方法和装置、存储介质及处理器
KR100556283B1 (ko) 다양한 분석서비스를 제공하는 병원관리시스템
Howe et al. A vision for cancer incidence surveillance in the United States
CN112635068A (zh) 基于医保与死因监测数据的肿瘤现患监测方法及装置
CN112509659A (zh) 基于医保与死因监测数据的肿瘤患者生存监测方法及装置
Stevens et al. A review of hospital medical record audits: implications for funding and training
Mack Cancers in the urban environment: how malignant diseases are caused and distributed among the diverse people and neighborhoods of a major global metropolis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination