CN104573074A - 基于医院数据的高速计算分析方法 - Google Patents

基于医院数据的高速计算分析方法 Download PDF

Info

Publication number
CN104573074A
CN104573074A CN201510040167.5A CN201510040167A CN104573074A CN 104573074 A CN104573074 A CN 104573074A CN 201510040167 A CN201510040167 A CN 201510040167A CN 104573074 A CN104573074 A CN 104573074A
Authority
CN
China
Prior art keywords
data
intermediate result
hospital
analyzing
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510040167.5A
Other languages
English (en)
Inventor
刘文豪
黎志文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Dihong Data Technology Co Ltd
Original Assignee
Guangdong Dihong Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Dihong Data Technology Co Ltd filed Critical Guangdong Dihong Data Technology Co Ltd
Priority to CN201510040167.5A priority Critical patent/CN104573074A/zh
Publication of CN104573074A publication Critical patent/CN104573074A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了基于医院数据的高速计算分析方法,将医院中各个应用***的数据通过ETL模块完成提取、转化及加载,然后通过HDFS分布式存储模块进行三备份分布式存储,再由算法处理模块对转化后的数据进行数据预处理操作,形成中间结果数据,并将其存储在中间结果数据存储模块中;再利用不同的WEB应用模块由操作用户提交分析请求,直接从中间结果数据存储模块中调用所需的指标数据,并通过简单的运算即能完成对用户分析请求的结果反馈。发明能快速有效的得到真实的、准确的分析运算结果,实时为各个管理人员提供运营决策依据;有效的提高了海量数据的分析运算效率,同时节省大量的硬件设备资源及人员成。

Description

基于医院数据的高速计算分析方法
技术领域
本发明涉及一种数据分析方法,具体是基于医院数据的高速计算分析方法。
背景技术
目前医院各个应用***由多个应用软件厂商提供,各厂商***信息存储在SQL Server、Oracel、Sybase、Access 等异构的数据库***中,且数据各自分布存储。医院现有的数据计算分析技术,主要是先通过各个子***数据库查询、运算、分析,得出各自的分析结果,然后在汇总得到一个总的报表。由于所有的分析、计算都要从庞大的海量数据中进行查询及运算,使得查询运算的效率大大降低,分析一个复合的指标就需要从多个数据库中进行查询,以获得所需指标,再综合计算,分往往查询与运算的时间都是好几个小时,甚至十几个小时,随着数据量的增加,效率会更低,只能通过添加高性能的运算服务器,以提高查询运算的效率。现有的海量数据计算分析技术根本无法做到对海量数据的实时分析与计算,且需要投入大量的高性能服务器资源以配合分析与计算。医院难以及时掌控运营全貌,且还存在手工进行一些报表的加工,比如计算、合并等,速度非常缓慢。对于医院特别是大型三甲医院的管理者和决策者来说,如何对医院运行的情况进行快速的了解和相应是目前医院要解决的一个重大问题。
发明内容
本发明的目的在于提供效率高、成本低的基于医院数据的高速计算分析方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
基于医院数据的高速计算分析方法,将医院中HIS、CIS、CRM、EMR、LIS应用***的数据通过ETL模块完成提取、转化及加载,然后将转化后的数据统一通过HDFS分布式存储模块进行三备份分布式存储,然后再由算法处理模块对转化后的数据通过优化组合的算法包及数据模型进行数据预处理操作,形成中间结果数据,并将中间结果数据存储在中间结果数据存储模块中;再利用不同的WEB应用模块由操作用户提交分析请求,直接从中间结果数据存储模块中调用所需的指标数据,并通过简单的运算即能完成对用户分析请求的结果反馈。
与现有技术相比,本发明的有益效果是:本发明主要解决的是面对不断增长的业务数据,将各个***中不同格式的数据,经过ETL模块对数据提取、转换和加载之后,统一存储到HDFS分布式存储服务器中,由医疗行业专用优化组合算法将各类业务数据进行高效的数据预处理,形成一系列的中间结果数据集。再通过WEB应用模块调用相关的中间结果数据集,以实现为医院不同角色秒级提供所需实时计算分析结果。通过该方法可使医院各类管理人员充分利用现有各个***数据资源,快速有效的得到真实的、准确的分析运算结果,实时为各个管理人员提供运营决策依据。有效的提高了海量数据的分析运算效率。同时在资源利用率上,较现有的海量数据分析技术可节省大量的硬件设备资源及人员成本。
附图说明
图1是本发明原理图。
具体实施方式
下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
请参阅图1,本发明实施例中,基于医院数据的高速计算分析方法,将医院中HIS、CIS、CRM、EMR、LIS应用***的数据通过ETL模块完成提取、转化及加载,然后统一通过HDFS分布式存储模块进行三备份分布式存储,然后再由算法处理模块对转化后的数据通过优化组合的算法包及数据模型进行数据预处理操作,最终形成一系列的中间结果数据,并存储在中间结果数据存储模块中。最后利用不同的WEB应用模块由操作用户提交分析请求,直接从中间结果数据存储模块中调用所需的指标数据,并通过简单的运算即可完成对用户分析请求的结果反馈。对操作用户的指标分析请求响应时间达到秒级,甚至毫秒级的实时响应。
本发明中HIS,Hospital Information System,是医院管理和医疗活动中进行信息管理和联机操作计算机应用***
CIS,Clinical Information System 临床信息***。
CRM,Customer Relationship Management客户关系管理***,是一种旨在改善企业与客户关系的新型管理机制。
EMR,Electronic Medical Record电子病历,也叫计算机化的病案***或称基于计算机的病人记录。
LIS,Laboratory Information System即实验室(检验科)信息***,主要是在医务***方面。
本发由于采用了优化组合的算法包及数据模型进行数据预处理操作,每次的操作用户指标查询请求,只需要从经过数据预处理模块的中间结果数据中提取相关数据参与运算,不需要从完整的原始数据中进行查询和运算,分析运算效率由现有技术所需的几个小时,十几个小时的漫长等待时间,提升为秒级,甚至毫秒级的实时响应,大大提高了分析运算效率,同时整个分析运算过程只需要普通的PC服务器资源即可完成,大大节省了硬件服务器资源的投入。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

Claims (1)

1. 基于医院数据的高速计算分析方法,其特征在于,将医院中HIS、CIS、CRM、EMR、LIS应用***的数据通过ETL模块完成提取、转化及加载,然后将转化后的数据统一通过HDFS分布式存储模块进行三备份分布式存储,然后再由算法处理模块对转化后的数据通过优化组合的算法包及数据模型进行数据预处理操作,形成中间结果数据,并将中间结果数据存储在中间结果数据存储模块中;再利用不同的WEB应用模块并由操作用户提交分析请求,能够直接从中间结果数据存储模块中调用所需的指标数据,并通过简单的运算即能完成对用户分析请求的结果反馈。
CN201510040167.5A 2015-01-27 2015-01-27 基于医院数据的高速计算分析方法 Pending CN104573074A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510040167.5A CN104573074A (zh) 2015-01-27 2015-01-27 基于医院数据的高速计算分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510040167.5A CN104573074A (zh) 2015-01-27 2015-01-27 基于医院数据的高速计算分析方法

Publications (1)

Publication Number Publication Date
CN104573074A true CN104573074A (zh) 2015-04-29

Family

ID=53089136

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510040167.5A Pending CN104573074A (zh) 2015-01-27 2015-01-27 基于医院数据的高速计算分析方法

Country Status (1)

Country Link
CN (1) CN104573074A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512470A (zh) * 2015-12-01 2016-04-20 苏州登顶医疗科技有限公司 一种基于Hadoop平台的灌肠仪数据处理***
CN106295220A (zh) * 2016-08-19 2017-01-04 京东方科技集团股份有限公司 一种医疗数据管理方法、装置及医疗数据***
CN107329852A (zh) * 2017-06-09 2017-11-07 广州虎牙信息科技有限公司 基于Hive的数据处理的方法、***及终端设备
CN107657578A (zh) * 2017-11-14 2018-02-02 广州市行心信息科技有限公司 一种智慧养老云平台
CN108763281A (zh) * 2018-04-12 2018-11-06 合肥天源迪科信息技术有限公司 一种基于etl的业务智能分析平台及***

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102521246A (zh) * 2011-11-11 2012-06-27 国网信息通信有限公司 一种云数据仓库***
US8676750B2 (en) * 2010-02-22 2014-03-18 International Business Machines Corporation Efficient data synchronization in a distributed data recovery system
CN102737134B (zh) * 2012-06-29 2014-06-18 电子科技大学 适用于大规模实时数据流的查询处理方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8676750B2 (en) * 2010-02-22 2014-03-18 International Business Machines Corporation Efficient data synchronization in a distributed data recovery system
CN102521246A (zh) * 2011-11-11 2012-06-27 国网信息通信有限公司 一种云数据仓库***
CN102737134B (zh) * 2012-06-29 2014-06-18 电子科技大学 适用于大规模实时数据流的查询处理方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512470A (zh) * 2015-12-01 2016-04-20 苏州登顶医疗科技有限公司 一种基于Hadoop平台的灌肠仪数据处理***
CN106295220A (zh) * 2016-08-19 2017-01-04 京东方科技集团股份有限公司 一种医疗数据管理方法、装置及医疗数据***
WO2018032976A1 (zh) * 2016-08-19 2018-02-22 京东方科技集团股份有限公司 一种医疗数据管理方法、装置及医疗数据***
CN107329852A (zh) * 2017-06-09 2017-11-07 广州虎牙信息科技有限公司 基于Hive的数据处理的方法、***及终端设备
CN107657578A (zh) * 2017-11-14 2018-02-02 广州市行心信息科技有限公司 一种智慧养老云平台
CN108763281A (zh) * 2018-04-12 2018-11-06 合肥天源迪科信息技术有限公司 一种基于etl的业务智能分析平台及***

Similar Documents

Publication Publication Date Title
CN106407278B (zh) 一种大数据平台的架构设计***
Wong et al. The top 10 challenges in extreme-scale visual analytics
CN104573074A (zh) 基于医院数据的高速计算分析方法
Fadiya et al. Advancing big data for humanitarian needs
Ruan et al. Workload time series prediction in storage systems: a deep learning based approach
CN105427193A (zh) 一种基于分布式时序数据服务的大数据分析装置及方法
CN103430144A (zh) 数据源分析
Roy et al. Big Data Optimization Techniques: A Survey.
CN111159180A (zh) 一种基于数据资源目录构建的数据处理方法及***
CN106933859B (zh) 一种医疗数据的迁移方法和装置
CN106202566A (zh) 一种基于大数据的海量用电数据混合存储***及方法
US20190050435A1 (en) Object data association index system and methods for the construction and applications thereof
Kun et al. Application of big data technology in scientific research data management of military enterprises
CN111274256A (zh) 基于时序数据库的资源管控方法、装置、设备及存储介质
CN112002403A (zh) 用于医疗设备的量化评估方法、装置、设备及存储介质
CN111489135A (zh) 一种稽核数据的分析管理***及方法
CN111062603B (zh) 企业生命周期的分析方法、装置及存储介质
Martin et al. Multi-temperate logical data warehouse design for large-scale healthcare data
Hu Research on monitoring system of daily statistical indexes through big data
CN103455556B (zh) 存储单元数据裁剪方法
CN110837970A (zh) 一种区域卫生平台质控方法和***
US20230185817A1 (en) Multi-model and clustering database system
CN113344604A (zh) 一种基于用户行为数据及流计算的用户细分方法
CN104778253A (zh) 一种提供数据的方法和装置
CN109828983A (zh) Pg数据库处理方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20150429

RJ01 Rejection of invention patent application after publication