CN105005683A - 一种解决区域医疗***数据规范化问题的缓存***及方法 - Google Patents

一种解决区域医疗***数据规范化问题的缓存***及方法 Download PDF

Info

Publication number
CN105005683A
CN105005683A CN201510337211.9A CN201510337211A CN105005683A CN 105005683 A CN105005683 A CN 105005683A CN 201510337211 A CN201510337211 A CN 201510337211A CN 105005683 A CN105005683 A CN 105005683A
Authority
CN
China
Prior art keywords
data
business
template
metadata
normalization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510337211.9A
Other languages
English (en)
Inventor
李轶强
马国耀
蔡军
肖华
杨帆
孙勇韬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING REALESOFT SOFTWARE TECHNOLOGY Co Ltd
Original Assignee
BEIJING REALESOFT SOFTWARE TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING REALESOFT SOFTWARE TECHNOLOGY Co Ltd filed Critical BEIJING REALESOFT SOFTWARE TECHNOLOGY Co Ltd
Priority to CN201510337211.9A priority Critical patent/CN105005683A/zh
Publication of CN105005683A publication Critical patent/CN105005683A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种解决区域医疗***数据规范化问题的缓存***及方法,该***包括模板管理单元、数据处理单元和数据管理单元;方法包括定义数据结构规范化模板以及模板中的业务数据模型;利用定义的数据结构规范化模板对采集的区域医疗数据进行数据结构规范化处理,从结构上使区域医疗数据符合业务规范;利用定义的数据结构规范化模板对采集得到的区域医疗数据进行关联校验、重复数据处理以及缺损数据补全处理;对数据结构规范化模板规范化过程中的数据进行缓存并输出处理后的规范化区域医疗数据。本发明是实现基于数据结构规范化模板的数据缓存功能,实现对医疗业务数据的规范化处理,提升数据质量,使得数据符合业务归档要求。

Description

一种解决区域医疗***数据规范化问题的缓存***及方法
技术领域
本发明属于医疗行业数据缓存技术领域,具体涉及一种解决区域医疗***数据规范化问题的缓存***及方法。
背景技术
在医疗数据的处理过程中,数据的处理过程总体上可分为采集清洗和分析利用两个主要阶段,在采集清洗阶段主体上完成数据的采集、清洗、转换、校验;在分析利用阶段主体上完成对数据的挖掘、分析、展现。分析阶段以采集清洗阶段提供的数据作为基础,而采集清洗阶段以分析利用阶段定义数据需求作为采集条件,二阶段互相依赖。由于所采集到的医疗数据形式的多样性,在进行分析利用前,需要对数据进行缓存处理,以作为后续清洗、转换和校验的数据资源。缓存***作为一个数据缓冲层,部署在大数据采集清洗阶段的中,缓存采集、清洗、转换步骤执行的结果数据。
而该缓存***的建设是基于对医疗业务契合性基础上,得到的医疗业务数据模型,该模型具有医疗业务规范性和稳定性的特点,一方面符合医院***数据库的结构,另一方面符合对数据上报时对数据内容的要求。
发明内容
针对现有技术存在的问题,本发明提供一种解决区域医疗***数据规范化问题的缓存***及方法。
一种解决区域医疗***数据规范化问题的缓存***,包括:
模板管理单元:用于定义和管理数据结构规范化模板以及模板中的业务数据模型,利用定义的数据结构规范化模板对采集的区域医疗数据进行数据结构规范化处理,从结构上使区域医疗数据符合业务规范;
数据处理单元:利用定义的数据结构规范化模板对采集得到的区域医疗数据进行关联校验、重复数据处理以及缺损数据补全处理;
数据管理单元:用于对数据结构规范化模板规范化过程中的数据进行缓存并输出处理后的规范化区域医疗数据。
所述模板管理单元包括业务模型管理模块和元数据管理模块;
业务数据模型管理模块:实现对业务数据模型结构的定义,包括业务间以及业务与元数据间关联关系,在业务数据模型中定义的业务及业务元数据的关联关系对数据处理单元中执行的数据处理过程提供依据;
元数据管理模块:实现对业务元数据内容的定义,业务元数据是业务数据模型中的最小单元,业务元数据一方面用于组成数据结构规范化模板,另一方面用于定义数据管理单元中的缓存数据库结构。
所述数据处理单元包括数据校验模块、数据去重模块和数据补全模块;
数据校验模块:根据模板管理单元提供的业务数据模型对数据管理单元缓存的数据进行关联校验处理,校验当前缓存数据是否满足业务要求;
数据去重模块:对数据管理单元缓存的数据进行数据重复性校验,并删除重复数据;
数据补全模块:对数据管理单元缓存的数据进行补全,将缺损的数据内容根据数据字典、业务规范进行逐一补全,使数据满足完整性要求。
所述数据管理单元包括发送模块、存储模块和缓存数据库;
发送模块:执行发送缓存数据库中数据任务;
存储模块:执行缓存数据库中数据的存储任务;
缓存数据库:用于在缓存在对数据结构规范化模板规范化过程中的数据处理各阶段得到的数据处理执行结果。
所述模板管理单元实现对业务数据模型和业务元数据结构进行定义和管理;
其中,业务元数据结构为数据管理单元中缓存数据库在执行数据缓存过程中所具有的数据结构,业务元数据结构是基于缓存数据库二维关系以二维链表结构进行定义的。
所述业务数据模型管理模块定义业务数据模型结构的业务关联关系,使用二维链表结构描述业务项与业务项间的关联关系,对所关联的业务项与所关联使用的元数据结构进行指定。
所述存储模块用于根据业务数据模型和业务元数据结构来构建缓存数据库,并实现对于数据处理单元数据处理各阶段数据处理执行结果的存储,向缓存数据库发送执行数据存储请求,并保证数据存储的正确执行。
所述数据校验模块根据模板管理单元中提供的业务数据模型及业务元数据结构,对缓存数据库中缓存的数据进行业务关联性校验。
所述数据补全模块根据业务数据模型中定义的业务及业务元数据的关联关系,使用数据字典及业务数据模型所定义的业务信息,对缓存数据库内不完备或缺失的数据进行补全。
采用所述的解决区域医疗***数据规范化问题的缓存***进行医疗数据缓存的方法,包括以下步骤:
步骤1:定义数据结构规范化模板以及模板中的业务数据模型;
步骤1-1:定义业务元数据结构,业务元数据结构中的元素包括表名称、版本号码、表字段名称、电子病历标识代码字段、表字段描述、是否主键、是否业务主键、是否为空、是否索引、管理字段名称;
步骤1-2:定义数据结构规范化模板中的业务数据模型;
对业务数据模型结构的定义,包括业务间以及业务与元数据间关联关系,在业务数据模型中定义的业务及业务元数据的关联关系,对数据处理单元中执行的数据处理过程提供依据;
步骤2:利用定义的数据结构规范化模板对采集的区域医疗数据进行数据结构规范化处理,从结构上使区域医疗数据符合业务规范;
步骤2-1:根据步骤1-1中定义的业务元数据结构,在缓存数据库中创建该业务元数据结构中的数据库表结构;
步骤2-2:将采集的区域医疗数据根据步骤2-1中创建的表结构进行存储;
步骤3:利用定义的数据结构规范化模板对采集得到的区域医疗数据进行关联校验、重复数据处理以及缺损数据补全处理;
步骤3-1:对缓存数据库中的数据进行校验,以判断缓存数据库中保存的数据是否满足数据结构规范化模板中业务数据模型的业务关联性校验,并生成数据质量校验报告以及业务模板结构符合性报告;
步骤3-2:在步骤3-1执行无误后,首先根据业务数据模型逐步对数据管理单元存储的数据进行校验,根据业务模型结构中定义的业务关联关系,对所引用的元数据结构内容进行缺损校验,根据数据字典及业务模型结构的定义,对缺损数据内容进行补全;
步骤3-3:在步骤3-2执行无误后,根据元数据结构中的管理字段对重复的数据记录进行校验,将重复的记录从缓存数据库中删除;
步骤4:对数据结构规范化模板规范化过程中的数据进行缓存并输出处理后的规范化区域医疗数据。
有益效果:
本发明的缓存***是实现基于数据结构规范化模板的数据缓存功能,实现对医疗业务数据的规范化处理,提升数据质量,使得数据符合业务归档要求。数据结构规范化模板的设立是基于医疗业务的标准规范来创建的,该规范包含医疗行业国家标准、院内业务规范,同样包含数据编码规范和数据存储格式规范。由于医疗行业对规范依赖的特殊性,使得医疗数据规范化的价值在实际应用中尤为突出。
本发明所提解决区域医疗***数据规范化问题的缓存***旨在解决医疗***内异构数据的标准化存储问题,使得数据存储符合业务规范和标准约束,使存储的数据具有较强的业务符合性和规范性,从而提升数据质量。本解决区域医疗***数据规范化问题的缓存***及方法目前已经成功实施在医疗信息的处理项目中,使得业务数据获得高质量的处理和存储,从而推动医疗卫生体系的建设和管理,为区域医疗***的构建提供有力支撑。
附图说明
图1为本发明一种实施方式的解决区域医疗***数据规范化问题的缓存***结构框图;
图2为本发明一种实施方式模块管理单元结构示意框图;
图3为本发明一种实施方式数据管理单元结构示意框图;
图4为本发明一种实施方式数据处理单元结构示意框图;
图5为本发明一种实施方式业务元数据结构图;
图6为本发明一种实施方式业务数据模型结构图;
图7为本发明一种实施方式缓存***应用结构示意图;
图8为本发明一种实施方式门诊业务ER图;
图9为本发明一种实施方式患者基本信息业务元数据结构图;
图10为本发明一种实施方式门诊诊疗业务数据模型结构图;
图11 为本发明一种实施方式解决区域医疗***数据规范化问题的缓存方法流程图。
具体实施方式
下面结合附图对本发明的具体实施方式做详细说明。
本方法实现对卫生医疗数据的规范化缓存处理,提升数据质量,使其符合卫生规范标准。在卫生医疗数据的利用过程中,医疗数据由于其所在应用***和机构的特殊性,彼此间不具有通用性和一致性,而对于区域卫生平台却需要获取标准通用的医疗业务数据,从而掌握一个区域内的医疗机构运行状况。本发明所述缓存***目的在于解决区域内医疗数据的规范化问题,通过业务数据模型和元数据结构的定义来实现区域内异构医疗数据的一致性和统一性,使其符合区域卫生平台对数据标准性的要求,为医疗数据的应用提供支撑。
本发明在实施过程中,也适用于医疗机构数据源变更,以及区域卫生平台标准变更的实施条件。当医疗机构数据源变更时,需调整业务元数据的字段内容;而对于区域卫生平台标准变更需调整业务数据模型结构,并丰富数据字典内容。由于业务数据模型的由于其对业务规范的遵循和支持,使得本缓存***在实际应用过程中需调整的概率极低,从而具有较高的***稳定性及极低的建设成本。
在本实施例中,以对门诊数据的标准化缓存过程为例,数据结构规范化模板为门诊业务模板,实现医院端门诊数据的标准化缓存过程。本发明的***根据区域卫生平台所定义医疗规范,将异构医疗机构中采集得到的业务数据进行规范化处理并缓存。
本发明所述***根据业务模型结构所描述的业务规则,将医疗***中数据进行规范化缓存处理,并将处理后的数据上报到区域卫生平台。
本发明解决的区域医疗数据规范化问题,其过程基于数据模型中对元数据及其实体的定义。元数据模型定义了与医疗***可进行采集操作的数据结构,元数据的基本单元为元数据元素,元数据元素是从医疗***采集得到的数据集内容是抽象分解与描述。当一组元数据元素具有相同的业务特性时,该组元数据元素可定义为元数据实体,而元数据实体又可包含1或多个元数据实体,元数据实体的业务特性来源于(医疗)行业业务标准及规范。缓存数据库作为数据模型的实际物理存储介质而存在,其存储的数据是元数据元素及元数据实体到数据库表的实际映射。缓存数据库所存储的数据最终上报到区域平台,同时缓存数据库也缓存了数据进行校验、去重、补全处理过程所产生的过程数据,并在数据稳定后将数据发送到区域平台。而所定义的元数据元素及元数据实体,是构建缓存数据库的条件和原则,同时也是对数据进行校验、去重、补全处理的依据。数据处理过程其实质的使得数据在内容上更准确并减少冗余,在结构上完全与元数据元素及元数据实体一致为原则,因此数据的处理过程是一个逐步向元数据趋近的过程。
在本发明中,元数据实体的定义基于医疗卫生的实际业务,本实施例以门诊业务为例介绍本发明的业务数据模型的创建过程以及业务数据规范化缓存过程。
本发明所述***根据业务数据模型所描述的业务规则,将区域医疗***中数据进行规范化缓存处理,并将处理后的数据上报到区域卫生平台。本发明应用结构如图7所示。
本发明解决的区域医疗***数据规范化问题,其过程基于业务数据模型中对业务元数据及其实体的定义。业务元数据定义了与区域医疗***可进行采集操作的数据结构,业务元数据的基本单元为元数据元素,元数据元素是从区域医疗***采集得到的数据集内容是抽象分解与描述。当一组元数据元素具有相同的业务特性时,该组元数据元素可定义为元数据实体,而元数据实体又可包含1或多个元数据实体,元数据实体的业务特性来源于(医疗)行业业务标准及规范。缓存数据库作为业务数据模型的实际物理存储介质而存在,其存储的数据是元数据元素及元数据实体到数据库表的实际映射。缓存数据库所存储的数据最终上报到区域医疗平台,同时缓存数据库也缓存了数据进行校验、去重、补全处理过程所产生的过程数据,并在数据稳定后将数据发送到区域医疗平台。而所定义的元数据元素及元数据实体,是构建缓存数据库的条件和原则,同时也是对数据进行校验、去重、补全处理的依据。数据处理过程其实质的使得数据在内容上更准确并减少冗余,在结构上完全与元数据元素及元数据实体一致为原则,因此数据的处理过程是一个逐步向元数据趋近的过程。
如图1所示,一种解决区域医疗***数据规范化问题的缓存***,包括:
模板管理单元:用于定义和管理数据结构规范化模板以及模板中的业务数据模型,利用定义的数据结构规范化模板对采集的区域医疗数据进行数据结构规范化处理,从结构上使区域医疗数据符合业务规范;
数据处理单元:利用定义的数据结构规范化模板对采集得到的区域医疗数据进行关联校验、重复数据处理以及缺损数据补全处理;
数据管理单元:用于对数据结构规范化模板规范化过程中的数据进行缓存并输出处理后的规范化区域医疗数据。
如图2所示,模板管理单元包括业务模型管理模块和元数据管理模块;
业务数据模型管理模块:实现对业务数据模型结构的定义,包括业务间以及业务与元数据间关联关系,在业务数据模型中定义的业务及业务元数据的关联关系对数据处理单元中执行的数据处理过程提供依据;首先定义业务项以及业务项彼此间的关联关系,之后所关联的业务项与所关联使用的元数据进行指定。
元数据管理模块:实现对业务元数据内容的定义,业务元数据是业务数据模型中的最小单元,业务元数据一方面用于组成数据结构规范化模板,另一方面用于定义数据管理单元中的缓存数据库结构。
模板管理单元实现对业务数据模型和业务元数据结构进行定义和管理;
其中,业务元数据结构为数据管理单元中缓存数据库在执行数据缓存过程中所具有的数据结构,业务元数据结构是基于缓存数据库二维关系以二维链表结构进行定义的。
业务数据模型管理模块定义业务数据模型结构的业务关联关系,使用二维链表结构描述业务项与业务项间的关联关系,对所关联的业务项与所关联使用的元数据结构进行指定。
本实施方式的业务元数据结构如图5所示,业务元数据结构是向区域卫生平台所上报数据的最小粒度描述,其所蕴含信息是向区域卫生平台最终要求的内容,也是进行数据补全和去重处理的基础和依据。本实施方式的业务数据模型结构如图6所示,其中,业务数据模型是业务数据间关联关系的定义和描述,是对数据进行校验和处理的基础和依据。在本实施方式中,业务数据模型和业务元数据结构的定义参考区域卫生平台中该业务标准进行。
如图4所示,数据处理单元包括数据校验模块、数据去重模块和数据补全模块;
数据校验模块:根据模板管理单元提供的业务数据模型对数据管理单元缓存的数据进行关联校验处理,校验当前缓存数据是否满足业务要求;
数据去重模块:对数据管理单元缓存的数据进行数据重复性校验,并删除重复数据;
数据补全模块:对数据管理单元缓存的数据进行补全,将缺损的数据内容根据数据字典、业务规范进行逐一补全,使数据满足完整性要求。
数据处理单元对缓存数据内容进行校验、去重和补全处理,使数据在内容上符合业务规范。数据校验模块首先根据模板管理单元中提供的业务数据模型及元数据,对缓存数据库中暂存的数据进行业务关联性校验。之后,数据补全模块根据数据业务关联关系,使用数据字典及业务模型所定义的业务信息,对缓存数据库内不完备或缺失的数据进行补全。最后,数据去重模块对满足缓存数据库中业务关联规则的数据进行重复性校验,将重复记录进行删除,同时将重复校验中存在的异常信息进行日志记录。
如图3所示,数据管理单元包括发送模块、存储模块和缓存数据库;
发送模块:执行发送缓存数据库中数据任务;
存储模块:执行缓存数据库中数据的存储任务;
缓存数据库:用于在缓存在对数据结构规范化模板规范化过程中的数据处理各阶段得到的数据处理执行结果。
存储模块用于根据业务数据模型和业务元数据结构来构建缓存数据库,并实现对于数据处理单元数据处理各阶段数据处理执行结果的存储,向缓存数据库发送执行数据存储请求,并保证数据存储的正确执行。
数据校验模块根据模板管理单元中提供的业务数据模型及业务元数据结构,对缓存数据库中缓存的数据进行业务关联性校验。
数据补全模块根据业务数据模型中定义的业务及业务元数据的关联关系,使用数据字典及业务数据模型所定义的业务信息,对缓存数据库内不完备或缺失的数据进行补全。
下面对本方法所涉及的名称进行定义。
(1)业务元数据:定义和描述其他数据的数据;业务元数据是业务数据模型中的最小单元,业务元数据一方面用于组成数据结构规范化模板,另一方面用于定义数据管理单元中的缓存数据库结构;
(2)数据集:具有一定主题,可以标识并可以被计算机处理的数据集合;
(3)元数据元素:元数据的基本单元;
(4)元数据实体:一组说明数据相同特征的元数据元素。可以包含一个或多个元数据实体;
(5)元数据子集:元数据的子集合,由相关的元数据子集合元数据元素组成。
采用解决区域医疗***数据规范化问题的缓存***进行医疗数据缓存的方法,如图11所示,包括以下步骤:
步骤1:定义数据结构规范化模板以及模板中的业务数据模型;
对医疗机构***中门诊业务的描述通常可以通过ER图的方式来进行抽象化描述,该业务关系的描述如图8所示。该ER图描述了区域医疗***中HIS***数据库及表的存储关系,其所描述的关系是本发明所构建的业务数据模型及元数据结构具有有效的指导意义,但ER图只是一种关系的描述形式,本发明所涉结构创建过程的输入不仅限于ER图。
步骤1-1:定义业务元数据结构,业务元数据结构中的元素包括表名称(TName)、版本号码(Version)、表字段名称(Fields)、电子病历标识代码字段(DE_Fields)、表字段描述(F_Desc)、是否主键(Primary)、是否业务主键(B_Primary)、是否为空(isNull)、是否索引(isIndex)、管理字段名称(Mana_F);本实施方式的业务元数据结构如图5所示。
定义门诊元数据结构,M门诊业务=<M 患者基本信息M 门诊挂号M 门诊就诊M 门诊处方M 门诊费用明细M 门诊费用***>,M为元数据结构,根据图5业务元数据结构的定义,以“患者基本信息”为例,其M 患者基本信息可以定义为如图9所示的患者基本信息元数据结构。
患者基本信息元数据创建过程,以元数据结构为框架约束,以实际异构***中数据项为内容。以图9为例,该元数据的二维链表结构描述了该患者基本信息,包括表名称TName为R_MPI_PATIENTINFO;版本号码Version为2_0;表字段名称Fields为AUTO_ID、LP_MPI_PATIENT、PATIENT_ID、NAME等;表字段描述F_Desc为对Fields的相关描述解释;DE_Fields为该字段对应的电子病历标识代码,电子病历标识代码为在进行数据上报过程中,必须要求上报及处理的字段,而电子病历标识是根据中国国家标准GB/T1.1-2009起草的WS445.2-2014系列标准所述内容;而其中是否主键Primary、是否业务主键B_Primary、是否为空isNull、是否索引inIndex根据Fields的特性进行设置;管理字段名称Mana_F为RECORD_DTIME、RECORD_UPDATE_DTIME,用于记录档期元数据内容生成时间以及更新时间。
构建门诊诊疗业务中其余元数据,M 门诊挂号M 门诊就诊M 门诊处方M 门诊费用明细M 门诊费用***。元数据彼此间的业务关联关系,通过业务数据模型结构进行描述,对于业务数据模型结构的创建过程,一方面基于元数据项内容,另一方面基于数据ER关系图。
门诊诊疗业务数据模型结构描述了门诊业务元数据彼此间的关联关系,业务数据模型结构中通过模型主表名项TN记录其引用的业务元数据名称,而关联表项LTN和关联字段项LKCol记录了与TN项所关联的表及表字段。同时,主从表关联关系通过项L和项R进行描述,描述其主从关联表间的一对一(1:1)或一对多(1:N)的关联关系。
业务数据模型引用元数据结构中定义的表名称TName、表字段Fields等信息,在业务数据模型中不创建新的元数据项信息,而是描述元数据间的业务关联关系。
步骤1-2:定义数据结构规范化模板中的业务数据模型;
对业务数据模型结构的定义,包括业务间以及业务与元数据间关联关系,在业务数据模型中定义的业务及业务元数据的关联关系,对数据处理单元中执行的数据处理过程提供依据;
业务数据模型中的业务元数据是对步骤1-1中业务元数据中元素的引用及重组,业务数据模型结构即一系列具有相同业务特征的元数据的组合,即元数据实体。 在此元数据实体的定义过程,目的是将步骤1-1中定义的元数据结构根据业务特性进行组织和关联,其中实体中的元素包括模型描述(Desc)、主表名(TN)、关联表(LTN)、表关联字段(LKCol)、与主表关联关系(1或N)、与关联表关联关系(1或N)。
业务数据模型结构引用元数据结构中定义的表名称TName、表字段Fields等信息,在业务数据模型中不创建新的元数据项信息,而是描述元数据间的业务关联关系。
在完成对门诊诊疗业务数据模型的定义以后,本***根据元数据及业务数据模型中定义的信息构成数据结构规范化模板。在本***中,元数据结构及业务数据模型通过Excel表格的方式来进行存储和描述,以Excel中分页Sheet来定义元数据名称,在Sheet中的单元格Cell来记录模型中项的信息。当然,利用Excel表单二位关系的特性来记录数据模型的方式是一种在实际应用中最为便捷的方式,同时可以使用其他方式进行记录和描述,在此不做限制,仅以本***中最为常用的方式进行举例。
本***的模板管理单元中的元数据管理模块及业务模型管理模块实现对上述元数据及业务数据模型的管理和维护,上述两个模块中提供文件访问接口,完成与Excel文件的I/O操作,同时将文件中数据进行提取及校验,以判断元数据及业务数据模型间关联描述是否准确。
步骤2:利用定义的数据结构规范化模板对采集的区域医疗数据进行数据结构规范化处理,从结构上使区域医疗数据符合业务规范;
步骤2-1:根据步骤1-1中定义的业务元数据结构,在缓存数据库中创建该业务元数据结构中的数据库表结构;
步骤2-2:将采集的区域医疗数据根据步骤2-1中创建的表结构进行存储;
数据管理单元根据模板管理单元中业务元数据结构的定义,将元数据结构转换成数据库表的结构形式,并将其创建在缓存数据库中。
步骤3:利用定义的数据结构规范化模板对采集得到的区域医疗数据进行关联校验、重复数据处理以及缺损数据补全处理;
步骤3-1:对缓存数据库中的数据进行校验,以判断缓存数据库中保存的数据是否满足数据结构规范化模板中业务数据模型的业务关联性校验,并生成数据质量校验报告以及业务模板结构符合性报告;
校验过程分为数据主键关联校验和患者业务数据完整性校验,数据主键关联校验即对业务数据主键间关联关系进行校验,以判断是否出现环形关联或交叉关联,以防止在进行笛卡尔计算时出现大量冗余信息;患者业务数据完整性校验是一类以业务场景为主的业务校验,其校验以患者数据信息为核心,包括对费用信息的校验、患者业务信息完整性校验,以校验患者数据是否满足业务数据模型所定义的业务关联关系。
业务校验的过程由数据校验模块进行,其处理过程以模板管理单元中业务模型结构所定义的业务关联关系为条件进行。
步骤3-2:在步骤3-1执行无误后,根据业务数据模型逐步对数据管理单元存储的数据进行校验,根据业务模型结构中定义的业务关联关系,对所引用的元数据结构内容进行缺损校验,根据数据字典及业务模型结构的定义,对缺损数据内容进行补全;
数据补全包括三类数据补全操作,字典补全、业务补全和项目补全,字段补全根据数据字典内容将残缺数据进行补全;业务补全根据业务数据模型中所定义的关联关系,对存在数据残缺的元数据内容进行补全,业务补全过程会调用字典补全过程;项目补全,是以某个定制的项目或业务特定背景下的缺失数据进行补全,该补全过程根据特定背景下的数据特征来进行,项目补全过程会调用业务补全和字典补全过程。
数据字典记录一系列固化的业务信息,用于根据数据项所含逻辑来对缺损数据进行补全。数据字典以数据库表的形式保存在数据管理单元中。
步骤3-3:在步骤3-2执行无误后,根据元数据结构中的管理字段(Mana_F)对重复的数据记录进行校验,将重复的记录从缓存数据库中删除;
数据的去重处理是对本***在采集过程、业务数据处理过程中存在的重复数据进行删除清理,包括抽取重复性清理和业务重复性数据清理。抽取重复性清理,是指其所执行的数据去重处理根据对采集得到的医疗业务数据重复性进行,根据元数据结构中Mana_F项定义的管理字段内容来进行处理。业务重复性数据清理,是B_Primary项定义的业务主键来进行处理,业务主键是每条业务数据的唯一标识。
对于的去重过程中校验得到的重复记录,其清理过程会记录到本***的日志中,以实现人工方式的参与,对存在错误的去重处理及时进行回滚,并调整去重处理执行过程。
步骤4:对数据结构规范化模板规范化过程中的数据进行缓存并输出处理后的规范化区域医疗数据。
对数据处理完毕后的数据,进行上报,同时清空缓存数据库中业务数据内容。
本发明的主旨是实现基于数据结构规范化模板的数据缓存功能,实现针对区域卫生平台的医疗数据处理及缓存,使得医疗数据在缓存过程中数据质量能够得到有效提升,实现数据的规划化和标准化处理。业务数据模型结构是基于区域医疗***的医疗数据特点构建,根据医疗业务流程特性,将医疗业务流程各执行过程中的元数据及关联关系映射至业务数据模型及元数据结构中,使其具有较强的业务符合性和规范性。在进行医疗业务数据规划化缓存过程中,业务模型其标准化的特征与其采集对象异构医疗***和上报对象区域卫生平台,都可实现对标准业务的依赖和关联,同时又具有其特殊性,而业务数据模型及缓存***目的在于对区域医疗***与区域卫生平台间通用的业务数据及其关联关系进行定义描述,而屏蔽彼此***间的特殊细节,从而通过本***实现区域医疗***和区域医疗平台间的数据解耦,以通用的结构来实现差异化***和数据间的数据处理和传输。
本发明中所述***将区域医疗***与区域医疗平台进行解耦的实现方式,在进行医疗数据采集过程中,其业务数据模型及元数据结构可以应用于多个医疗数据采集的规范化建设场景中,在节约建设成本的同时,模型的业务特性也将在实际使用过程中得到补充和优化,从而达到良性循环的目标。
虽然以上描述了本发明的具体实施方式,但是本领域内的熟练的技术人员应当理解,这些仅是举例说明,可以对这些实施方式做出多种变更或修改,而不背离本发明的原理和实质。本发明的范围仅由所附权利要求书限定。

Claims (10)

1.一种解决区域医疗***数据规范化问题的缓存***,其特征在于,包括:
模板管理单元:用于定义和管理数据结构规范化模板以及模板中的业务数据模型,利用定义的数据结构规范化模板对采集的区域医疗数据进行数据结构规范化处理,从结构上使区域医疗数据符合业务规范;
数据处理单元:利用定义的数据结构规范化模板对采集得到的区域医疗数据进行关联校验、重复数据处理以及缺损数据补全处理;
数据管理单元:用于对数据结构规范化模板规范化过程中的数据进行缓存并输出处理后的规范化区域医疗数据。
2.根据权利要求1所述的解决区域医疗***数据规范化问题的缓存***,其特征在于,所述模板管理单元包括业务模型管理模块和元数据管理模块;
业务数据模型管理模块:实现对业务数据模型结构的定义,包括业务间以及业务与元数据间关联关系,在业务数据模型中定义的业务及业务元数据的关联关系对数据处理单元中执行的数据处理过程提供依据;
元数据管理模块:实现对业务元数据内容的定义,业务元数据是业务数据模型中的最小单元,业务元数据一方面用于组成数据结构规范化模板,另一方面用于定义数据管理单元中的缓存数据库结构。
3.根据权利要求1所述的解决区域医疗***数据规范化问题的缓存***,其特征在于,所述数据处理单元包括数据校验模块、数据去重模块和数据补全模块;
数据校验模块:根据模板管理单元提供的业务数据模型对数据管理单元缓存的数据进行关联校验处理,校验当前缓存数据是否满足业务要求;
数据去重模块:对数据管理单元缓存的数据进行数据重复性校验,并删除重复数据;
数据补全模块:对数据管理单元缓存的数据进行补全,将缺损的数据内容根据数据字典、业务规范进行逐一补全,使数据满足完整性要求。
4.根据权利要求1所述的解决区域医疗***数据规范化问题的缓存***,其特征在于,所述数据管理单元包括发送模块、存储模块和缓存数据库;
发送模块:执行发送缓存数据库中数据任务;
存储模块:执行缓存数据库中数据的存储任务;
缓存数据库:用于在缓存在对数据结构规范化模板规范化过程中的数据处理各阶段得到的数据处理执行结果。
5.根据权利要求1所述的解决区域医疗***数据规范化问题的缓存***,其特征在于,所述模板管理单元实现对业务数据模型和业务元数据结构进行定义和管理;
其中,业务元数据结构为数据管理单元中缓存数据库在执行数据缓存过程中所具有的数据结构,业务元数据结构是基于缓存数据库二维关系以二维链表结构进行定义的。
6.根据权利要求2所述的解决区域医疗***数据规范化问题的缓存***,其特征在于,所述业务数据模型管理模块定义业务数据模型结构的业务关联关系,使用二维链表结构描述业务项与业务项间的关联关系,对所关联的业务项与所关联使用的元数据结构进行指定。
7.根据权利要求4所述的解决区域医疗***数据规范化问题的缓存***,其特征在于,所述存储模块用于根据业务数据模型和业务元数据结构来构建缓存数据库,并实现对于数据处理单元数据处理各阶段数据处理执行结果的存储,向缓存数据库发送执行数据存储请求,并保证数据存储的正确执行。
8.根据权利要求3所述的解决区域医疗***数据规范化问题的缓存***,其特征在于,所述数据校验模块根据模板管理单元中提供的业务数据模型及业务元数据结构,对缓存数据库中缓存的数据进行业务关联性校验。
9.根据权利要求3所述的解决区域医疗***数据规范化问题的缓存***,其特征在于,所述数据补全模块根据业务数据模型中定义的业务及业务元数据的关联关系,使用数据字典及业务数据模型所定义的业务信息,对缓存数据库内不完备或缺失的数据进行补全。
10.采用权利要求1所述的解决区域医疗***数据规范化问题的缓存***进行医疗数据缓存的方法,其特征在于,包括以下步骤:
步骤1:定义数据结构规范化模板以及模板中的业务数据模型;
步骤1-1:定义业务元数据结构,业务元数据结构中的元素包括表名称、版本号码、表字段名称、电子病历标识代码字段、表字段描述、是否主键、是否业务主键、是否为空、是否索引、管理字段名称;
步骤1-2:定义数据结构规范化模板中的业务数据模型;
对业务数据模型结构的定义,包括业务间以及业务与元数据间关联关系,在业务数据模型中定义的业务及业务元数据的关联关系,对数据处理单元中执行的数据处理过程提供依据;
步骤2:利用定义的数据结构规范化模板对采集的区域医疗数据进行数据结构规范化处理,从结构上使区域医疗数据符合业务规范;
步骤2-1:根据步骤1-1中定义的业务元数据结构,在缓存数据库中创建该业务元数据结构中的数据库表结构;
步骤2-2:将采集的区域医疗数据根据步骤2-1中创建的表结构进行存储;
步骤3:利用定义的数据结构规范化模板对采集得到的区域医疗数据进行关联校验、重复数据处理以及缺损数据补全处理;
步骤3-1:对缓存数据库中的数据进行校验,以判断缓存数据库中保存的数据是否满足数据结构规范化模板中业务数据模型的业务关联性校验,并生成数据质量校验报告以及业务模板结构符合性报告;
步骤3-2:在步骤3-1执行无误后,首先根据业务数据模型逐步对数据管理单元存储的数据进行校验,根据业务模型结构中定义的业务关联关系,对所引用的元数据结构内容进行缺损校验,根据数据字典及业务模型结构的定义,对缺损数据内容进行补全;
步骤3-3:在步骤3-2执行无误后,根据元数据结构中的管理字段对重复的数据记录进行校验,将重复的记录从缓存数据库中删除;
步骤4:对数据结构规范化模板规范化过程中的数据进行缓存并输出处理后的规范化区域医疗数据。
CN201510337211.9A 2015-06-17 2015-06-17 一种解决区域医疗***数据规范化问题的缓存***及方法 Pending CN105005683A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510337211.9A CN105005683A (zh) 2015-06-17 2015-06-17 一种解决区域医疗***数据规范化问题的缓存***及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510337211.9A CN105005683A (zh) 2015-06-17 2015-06-17 一种解决区域医疗***数据规范化问题的缓存***及方法

Publications (1)

Publication Number Publication Date
CN105005683A true CN105005683A (zh) 2015-10-28

Family

ID=54378355

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510337211.9A Pending CN105005683A (zh) 2015-06-17 2015-06-17 一种解决区域医疗***数据规范化问题的缓存***及方法

Country Status (1)

Country Link
CN (1) CN105005683A (zh)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105550511A (zh) * 2015-12-11 2016-05-04 北京锐软科技股份有限公司 一种基于数据校验技术的数据质量测评***及方法
CN105631044A (zh) * 2016-01-29 2016-06-01 四川长虹电器股份有限公司 网络视频资源的汇聚方法
CN106066929A (zh) * 2016-05-25 2016-11-02 中南大学 一种新型临床医学对象组织方法
CN106777970A (zh) * 2016-12-15 2017-05-31 北京锐软科技股份有限公司 一种医疗信息***数据模板化的集成***及方法
CN107016561A (zh) * 2016-10-28 2017-08-04 阿里巴巴集团控股有限公司 一种信息处理方法和装置
CN107103196A (zh) * 2017-04-26 2017-08-29 成都中医药大学 一种中医临床数据清洗方法
CN107729556A (zh) * 2017-11-08 2018-02-23 山东浪潮云服务信息科技有限公司 一种业务数据归档方法和***
CN108268462A (zh) * 2016-12-30 2018-07-10 广东精点数据科技股份有限公司 一种关系完整性的数据质量检测***
CN108877920A (zh) * 2018-06-15 2018-11-23 申艳莉 诊疗数据管理方法及***
CN109144990A (zh) * 2018-09-03 2019-01-04 国网浙江省电力有限公司信息通信分公司 一种基于元数据驱动的电力通信大数据质量管理方法
CN109582666A (zh) * 2018-09-29 2019-04-05 阿里巴巴集团控股有限公司 数据主键生成方法、装置、电子设备及存储介质
CN109582286A (zh) * 2018-07-04 2019-04-05 福州震旦计算机技术有限公司 基于Freemarker技术的数据规范性校验方法及其装置
CN109616180A (zh) * 2018-11-07 2019-04-12 平安科技(深圳)有限公司 数据分析方法、装置、终端及存储介质
CN110289058A (zh) * 2019-06-06 2019-09-27 北京市天元网络技术股份有限公司 一种电子病历规范化匹配方法以及装置
CN110309124A (zh) * 2019-05-23 2019-10-08 深圳宏崎达技术有限公司 数据管理方法及***
CN111651442A (zh) * 2020-05-15 2020-09-11 京东数字科技控股有限公司 一种数据报送方法、装置、电子设备及存储介质
CN111988896A (zh) * 2020-08-05 2020-11-24 薛亮 基于边缘计算网关的物联网设备管理方法及大数据云平台
CN112286912A (zh) * 2020-08-12 2021-01-29 上海柯林布瑞信息技术有限公司 医疗数据质量核查方法及装置、终端、存储介质
CN112328576A (zh) * 2020-11-13 2021-02-05 浙江卡易智慧医疗科技有限公司 一种基于多数据源的通用数据模型的表示方法
CN112631785A (zh) * 2020-12-31 2021-04-09 新奥数能科技有限公司 基于bpmn的业务数据加工方法和装置
CN116860741A (zh) * 2023-08-31 2023-10-10 成都智慧锦城大数据有限公司 基于消息队列的数据标准自动检验和同步***及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101452503A (zh) * 2008-11-28 2009-06-10 上海生物信息技术研究中心 一种异构临床医疗信息共享***和方法
CN102509012A (zh) * 2011-11-04 2012-06-20 厦门市智业软件工程有限公司 将电子病历的内容映射电子病历标准数据库的方法
CN104361221A (zh) * 2014-10-31 2015-02-18 沈阳锐易特软件技术有限公司 基于异构***数据映射模板的医疗数据采集***及方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101452503A (zh) * 2008-11-28 2009-06-10 上海生物信息技术研究中心 一种异构临床医疗信息共享***和方法
CN102509012A (zh) * 2011-11-04 2012-06-20 厦门市智业软件工程有限公司 将电子病历的内容映射电子病历标准数据库的方法
CN104361221A (zh) * 2014-10-31 2015-02-18 沈阳锐易特软件技术有限公司 基于异构***数据映射模板的医疗数据采集***及方法

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105550511B (zh) * 2015-12-11 2018-02-09 北京锐软科技股份有限公司 一种基于数据校验技术的数据质量测评***及方法
CN105550511A (zh) * 2015-12-11 2016-05-04 北京锐软科技股份有限公司 一种基于数据校验技术的数据质量测评***及方法
CN105631044A (zh) * 2016-01-29 2016-06-01 四川长虹电器股份有限公司 网络视频资源的汇聚方法
CN106066929B (zh) * 2016-05-25 2018-10-02 中南大学 一种基于元网络的临床医学对象组织方法
CN106066929A (zh) * 2016-05-25 2016-11-02 中南大学 一种新型临床医学对象组织方法
CN107016561A (zh) * 2016-10-28 2017-08-04 阿里巴巴集团控股有限公司 一种信息处理方法和装置
CN106777970A (zh) * 2016-12-15 2017-05-31 北京锐软科技股份有限公司 一种医疗信息***数据模板化的集成***及方法
CN106777970B (zh) * 2016-12-15 2018-12-07 北京锐软科技股份有限公司 一种医疗信息***数据模板化的集成***及方法
CN108268462A (zh) * 2016-12-30 2018-07-10 广东精点数据科技股份有限公司 一种关系完整性的数据质量检测***
CN107103196A (zh) * 2017-04-26 2017-08-29 成都中医药大学 一种中医临床数据清洗方法
CN107729556A (zh) * 2017-11-08 2018-02-23 山东浪潮云服务信息科技有限公司 一种业务数据归档方法和***
CN108877920A (zh) * 2018-06-15 2018-11-23 申艳莉 诊疗数据管理方法及***
CN109582286A (zh) * 2018-07-04 2019-04-05 福州震旦计算机技术有限公司 基于Freemarker技术的数据规范性校验方法及其装置
CN109582286B (zh) * 2018-07-04 2021-11-26 福州震旦计算机技术有限公司 基于Freemarker技术的数据规范性校验方法及其装置
CN109144990A (zh) * 2018-09-03 2019-01-04 国网浙江省电力有限公司信息通信分公司 一种基于元数据驱动的电力通信大数据质量管理方法
CN109582666A (zh) * 2018-09-29 2019-04-05 阿里巴巴集团控股有限公司 数据主键生成方法、装置、电子设备及存储介质
CN109616180A (zh) * 2018-11-07 2019-04-12 平安科技(深圳)有限公司 数据分析方法、装置、终端及存储介质
CN110309124A (zh) * 2019-05-23 2019-10-08 深圳宏崎达技术有限公司 数据管理方法及***
CN110309124B (zh) * 2019-05-23 2021-12-03 深圳宏崎达技术有限公司 数据管理方法及***
CN110289058A (zh) * 2019-06-06 2019-09-27 北京市天元网络技术股份有限公司 一种电子病历规范化匹配方法以及装置
CN111651442A (zh) * 2020-05-15 2020-09-11 京东数字科技控股有限公司 一种数据报送方法、装置、电子设备及存储介质
CN111988896A (zh) * 2020-08-05 2020-11-24 薛亮 基于边缘计算网关的物联网设备管理方法及大数据云平台
CN112286912A (zh) * 2020-08-12 2021-01-29 上海柯林布瑞信息技术有限公司 医疗数据质量核查方法及装置、终端、存储介质
CN112328576A (zh) * 2020-11-13 2021-02-05 浙江卡易智慧医疗科技有限公司 一种基于多数据源的通用数据模型的表示方法
CN112631785A (zh) * 2020-12-31 2021-04-09 新奥数能科技有限公司 基于bpmn的业务数据加工方法和装置
CN116860741A (zh) * 2023-08-31 2023-10-10 成都智慧锦城大数据有限公司 基于消息队列的数据标准自动检验和同步***及方法
CN116860741B (zh) * 2023-08-31 2023-11-10 成都智慧锦城大数据有限公司 基于消息队列的数据标准自动检验和同步***及方法

Similar Documents

Publication Publication Date Title
CN105005683A (zh) 一种解决区域医疗***数据规范化问题的缓存***及方法
CN110489313B (zh) 基于区块链的操作日志记录方法、装置及存储介质
CN103377100B (zh) 一种数据备份方法、网络节点及***
CN106777970A (zh) 一种医疗信息***数据模板化的集成***及方法
CN106503912A (zh) 一种数据服务***
CN105144080A (zh) 用于元数据管理的***
CN106164865A (zh) 用于数据复制的依赖性感知的事务批处理
CN104641614A (zh) 用于可扩展的结构化数据分布的***和方法
CN102760206A (zh) 一种跨区域医疗影像信息共享***及方法
CN103279542A (zh) 数据导入处理方法及数据处理装置
CN108228755A (zh) 基于日志解析技术的MySQL数据库到Hadoop平台的数据同步复制方法
CN104933173A (zh) 一种用于异构多数据源的数据处理方法、装置和服务器
JP6328768B2 (ja) メタデータ自動化システム
KR102141784B1 (ko) 전력 계통 온톨로지 데이터 관리 시스템
CN104991785A (zh) 一种标准化临床数据业务支撑***及方法
US8099663B2 (en) Apparatus and method for document synchronization
CN113641659A (zh) 医疗特征数据库构建方法、装置、设备及存储介质
Xu et al. Research on diagnostic information of smart medical care based on big data
CN103729455B (zh) 一种基于主副本存储模式的主数据存储方法
Zhu et al. Data modeling for big data
KR101508068B1 (ko) 데이터 중복성 제거 장치 및 그 방법
KR101543506B1 (ko) 데이터 웨어하우스 시스템 및 그 구축 방법
CN103488693A (zh) 数据处理装置和数据处理方法
CN114706625A (zh) 构建患者信息全局查询插件的方法、装置及存储介质
CN106874493A (zh) 一种数据转换方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20151028

RJ01 Rejection of invention patent application after publication