CN108846040A - 一种基于olap的处方笺多维分析方法及*** - Google Patents

一种基于olap的处方笺多维分析方法及*** Download PDF

Info

Publication number
CN108846040A
CN108846040A CN201810533696.2A CN201810533696A CN108846040A CN 108846040 A CN108846040 A CN 108846040A CN 201810533696 A CN201810533696 A CN 201810533696A CN 108846040 A CN108846040 A CN 108846040A
Authority
CN
China
Prior art keywords
data
dimension
prescription
analysis
olap
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810533696.2A
Other languages
English (en)
Inventor
徐光伟
王文涛
马永东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Donghua University
National Dong Hwa University
Original Assignee
Donghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Donghua University filed Critical Donghua University
Priority to CN201810533696.2A priority Critical patent/CN108846040A/zh
Publication of CN108846040A publication Critical patent/CN108846040A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明涉及一种基于OLAP的处方笺多维分析方法及***,方法包括:模型度量分析:从数据源中读取处方数据,分析医疗处方数据所需统计指标,确定数据分析维度与层次;数据立方体建模:根据所述数据分析维度与层次建立数据立方体;数据立方体预计算:给定一个高位数据集,把维划分为不可交的维片段,把每个维片段转换成倒排索引表示,然后构建立方体外壳片段,并保证与立方体单元相关联的倒排索引;多维分析处理:通过使用OLAP引擎进行查询分析,从多个维度和层次进行数据分析和处理。***基于B/S架构,采用SpringMVC架构,通过使用Java语言开发。本发明有效地实现各种数据源的对接和提高了多维数据查询分析的效率。

Description

一种基于OLAP的处方笺多维分析方法及***
技术领域
本发明涉及海量数据分析的技术领域,特别是涉及一种基于OLAP的处方笺多维分析方法及***。
背景技术
处方笺是医生为预防和治疗疾病而给患者开具的取药凭证,是患者进行药物治疗和药物流向的原始记录。对于医院分析决策者而言,从处方数据中获取有用的参考信息是非常重要的。处方数据的多维分析、高效使用是提升医疗水平的重要组成部分。
近年来医疗机构各种处方笺数据积累越来越多,激增的数据背后隐藏着许多重要的有用信息。但目前,医院累积数据的处理大多停留在基于数据库技术的操作型事务处理的水平上,进行一般的数据指标的统计和汇总的操作,包括更新、删除、减少数据等。在处方数据的复杂查询和多维分析方面的操作相关研究及应用较少。因此,无法发现数据中存在的关系和规则,无法根据现有的数据预测未来的发展趋势,无法挖掘数据背后隐藏的有价值信息和知识。同时,在医院的实际应用中,医疗数据起到辅助决策和提高医治效率的作用。因此,医院对所存储的处方数据进行多维分析和处理,从中获取有价值的信息和创新的治疗方法是有效途径之一。
发明内容
本发明所要解决的技术问题是提供一种基于OLAP的处方笺多维分析方法及***,充分利用数据立方体模型来提高负责数据运算的响应时间,有效地实现各种数据源的对接和提高了多维数据查询分析的效率。
本发明解决其技术问题所采用的技术方案是:提供一种基于OLAP的处方笺多维分析方法,包括以下步骤:
(1)模型度量分析:从数据源中读取处方数据,分析医疗处方数据所需统计指标,确定数据分析维度与层次;
(2)数据立方体建模:根据所述数据分析维度与层次建立数据立方体;
(3)数据立方体预计算:给定一个高位数据集,把维划分为不可交的维片段,把每个维片段转换成倒排索引表示,然后构建立方体外壳片段,并保证与立方体单元相关联的倒排索引;
(4)多维分析处理:通过使用OLAP引擎进行查询分析,从多个维度和层次进行数据分析和处理。
所述步骤(2)具体为将数据源中的数据分为实物表和维表,然后建立立方体模型。
所述步骤(3)具体为:基于数据和分布查询的基础上,将维度集合划分为个片段的集合;扫描数据立方体,将每个片段(TID,measure)***数组ID_measure,对每个维的每个属性建立一个倒排索引项;对每一个片段,取对应的TID列表的交并计算它们的度量,构造局部片段立方体。
所述步骤(4)后还包括选出所需的维度或维度成员组成自己所需的报表的步骤。
本发明解决其技术问题所采用的技术方案是:还提供一种基于OLAP的处方笺多维分析***,基于B/S架构,采用SpringMVC架构,通过使用Java语言开发,包括:需求分析模块,运用原型法对医院的需求进行迭代式分析;***设计模块,采用维度建模的方式构建数据仓库和数据集市;多维数据分析模块,运用ETL工具将数据转化成维表,采用了OLAP的核心引擎Mondrian框架,并运用MDX语言实现在客户端展示多维分析结果;公式自定义模块,通过使用数据立方体模型,从中提取出所需要的维表,再通过报表公式实现医疗处方数据的多维分析和报表的自定义设计。
所述数据集市采用星型模式为主、雪花模型为辅的设计模式。
所述的基于OLAP的处方笺多维分析***还包括报表自定义模块,通过数据立方体模型提取所需属性列,对属性列的自定义和数据进行筛选,最后生成满足医院个性化需求的报表。
有益效果
由于采用了上述的技术方案,本发明与现有技术相比,具有以下的优点和积极效果:本发明真正做到了多角度进行医疗处方数据的分析,并根据医院的个性化需求生成所需的报表内容和形式,为各个医疗机构的决策者的决策提供了有效的借鉴作用,同时也促进了医院处方数据的管理效率。
附图说明
图1为基于OLAP的处方数据分析方法及自定义报表***整体流程图;
图2为基于OLAP的处方数据分析***体系结构图;
图3为基于OLAP的处方数据分析平台访问结构图;
图4为数据报表自定义设计流程图;
图5为基于OLAP的处方数据多维分析示意图;
图6为各科室处方合格率统计结果图;
图7为各科室处方存在问题统计结果图;
图8为季度辅助用药统计***结果图。
具体实施方式
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
如图1所示,为本发明实施提供的是一种基于OLAP的处方数据分析方法及自定义报表***整体流程图,该方法包括以下步骤:
步骤001、从数据源中读取处方数据,检索需要的原始数据,然后对处方数据进行清理;本实施例中,定义的维度有时间、科室、医嘱细类别、病患、付款方式、业务类型、医生。其中医嘱细类别维度是桥联多值维里面,包含药理分类、抗生素类别、收据类别。其中药理分类是一个父子结构,度量值是用量、总价、单价、就诊号。它的指标为抗生素使用率。
步骤002、进行多维分析建模,分析处方数据维度和层次,选取需要建立维度(Dimension);具体的说,可将数据数据源中的数据分为实物表(Phys_table)和维表(Dim_table)。然后建立立方体模型。
步骤003、进行数据立方体预计算,通过使用立方体片段法,把维划分为不可交的维片段,把每个片段转换成倒排索引表示,然后构建立方体外壳片段,并保证与立方体单元相关联的倒排索引。
外壳片段立方体(Shell Fragments Cube)对于一个高维的数据立方体Cube(D,M),将维度集合按照互不相交的原则,分割为个独立片段的度量集合,此方法包括以下步骤:
步骤1.1、基于数据和分布查询的基础上,将维度集合划分为个片段的集合。
步骤1.2、ScannerCube B一次,执行下面步骤:
将每个(TID,measure)***数组ID_measure。
对每个维的每个属性建立一个倒排索引项:
步骤1.3、对每一个片段,执行下面步骤:
取对应的TID列表的交并计算它们的度量,构造局部片段立方体。
其中,其中,(TID,measure)表示为划分的一个片段,其中TID表示片段的序列,measure表示该序列所对应的值。
例:对于60个维的基本立方体,根据以上外壳片段划分方法,只需要计算7*20=140个立方体,而计算大小为3的立方体外壳为36050个立方体。计算效率上得到了极大地提高。
步骤004、进行多维分析,通过使用OLAP引擎进行查询分析,从多个维度和层次进行数据分析和处理。
在医疗处方数据中,数据可以分为不同的层次。定义的维度有时间、科室、医嘱细类别、病患、付款方式、业务类型、医生。其中医嘱细类别维度是桥联多值维里面,包含药理分类、抗生素类别、收据类别。其中药理分类是一个父子结构,度量值是用量、总价、单价、就诊号。它的指标为抗生素使用率。此指标是一个反向指标越低越好,反之则越坏。它反映了医院对于抗生素的管理水平的一个指标。药品收入占业务收入比例,该指标越低反映在减轻病患不合理用药和担负上做的越好。药品收入分析主题:定义的维度有时间、科室、药品类别、院内费用类别、收据类别、病患、医生、业务类型、付款方式。度量有用量、总价。指标有西药占药品收入比率,中药占药品收入比率,中成药占药品收入比率。通过分析能了解医院药品收入的分配情况。
步骤005、自定义报表,通过步骤004可以选出所需的维度或维度成员(如时间为一个维度,年份、季度、月份、日期为维度成员)。然后组成自己所需的报表。
步骤006、可视化数据,通过使用折线图,饼状图,柱状图等形式进行报表图示化展示。
如图2所示,本***是基于B/S架构,采用MVC架构,并运用Java高级编程语言自主开发平台,以数据仓库建模和OLAP的多维数据分析来实现***功能,包括:需求分析模块,运用原型法对医院的需求进行迭代式分析。***设计模块,在***设计上采用维度建模的方式构建数据仓库和数据集市,在数据集市设计上采用星型模式为主、雪花模型为辅的设计模式,实现了处方数据的多维分析和报表的自定义设计。多维数据分析模块,运用ETL工具将数据转化成维表,采用了OLAP(联机分析处理)的核心引擎Mondrian框架,并运用MDX语言实现在客户端展示多维分析结果。公式自定义模块,通过使用CubeModel(数据立方体模型),从中提取出所需要的维表(属性列),再通过报表公式实现了医疗处方数据的多维分析和报表的自定义设计。报表自定义模块,通过CubeMode提取所需属性列,对属性列的自定义和数据进行筛选,最后生成满足医院个性化需求的报表。图形化展示模块,通过调用echarts接口,实现数据的图示化展示。
如图3所示,本发明采用基于Web的OLAP应用,其采用自顶向下的的设计过程,首先确定医院如何在浏览器上得到报表信息,然后再给出一系列的过程完成基于Web的OLAP操作。这些过程包括发布信息,提供HTTP对数据库或应用服务器动态数据访问请求以及设计支持分析功能的界面。
如图4所示,在报表的生成中,有些指标并不是直接筛选出来的。而是通过其他属性列计算所得的,如使用率,合格率等。因此需要实现四则运算。公式中的参数可以是数据库表中的字段,也可以是数据库表字段相互运算的结果集。此外,对于整个报表可能不止一个公式,公式的计算顺序也是不固定的,就有可能有多种计算顺序,从而导致了最后的计算结果可能不一致,因此还需要对公式的优先级进行设置。公式计算获得的数据通过报表的形式进行展现。
如图5所示,对数据进行多维分析,多维数据模型为了满足各个医院从多角度多层次进行数据查询和分析,将数据集分为目录(Catalog)、模式(Schema)、立方体(Cube)、维度(Dimension)、层次(Hierarchy)、成员(Member)等层次,每个维度的层次(Hierarchy)可以定义为多个级别,每个级别中会有一个成员。如就诊时间(time)这一维度可以定义多套层次,如年、月、日和年、季、月各建立一套层次。根据不同的层架包含着不同的维度成员,如时间跨度为2015年至2017年(假设每一天都要数据),那么日期这一级别(最低的级别)的成员(Members)是维度表所有的日期(2015-1-1,2015-1-2...2017-12-31)(1千多个成员),月份这一级别的成员是1-12(12个),季度的成员是1-4(4个),年份的成员是2015-2017(3个)。这样便可以对处方数据实现多角度分析和处理。
对于数据的可视化模块在进行前期的数据分析后,***根据用户需求选择需要展示的数据集,通过echart插件实现对数据的自定义展示。首先,选取恰当的图表模型(如饼状图,柱状图和折线图等)进行展示,然后根据不同的条件生成相应的效果图,最终实现对数据的图形化展示功能。该部分主要是将平台中的数据进行封装为json数据格式,然后通过调用echarts插件便可以实现数据的最后展示。如图6-8为处方报表***结果图效果展示,其中图6为各科室处方笺合格率统计结果图,反应了一段时间内医生所开处方笺的合格率统计,医院管理者可以通过该数据分析出这段时间里医生所开处方的情况。图7为各科室处方存在问题统计结果图;图8为季度辅助用药统计结果图。
综上所述,本发明一种基于OLAP的处方笺多维分析方法及处方报表***解决了医疗处方数据未能高效多维分析的不足。真正做到了多角度进行医疗处方数据的分析,并根据医院的个性化需求生成所需的报表内容和形式,为各个医疗机构的决策者的决策提供了有效的借鉴作用,同时也促进了医院处方数据的管理效率。

Claims (7)

1.一种基于OLAP的处方笺多维分析方法,其特征在于,包括以下步骤:
(1)模型度量分析:从数据源中读取处方数据,分析医疗处方数据所需统计指标,确定数据分析维度与层次;
(2)数据立方体建模:根据所述数据分析维度与层次建立数据立方体;
(3)数据立方体预计算:给定一个高位数据集,把维划分为不可交的维片段,把每个维片段转换成倒排索引表示,然后构建立方体外壳片段,并保证与立方体单元相关联的倒排索引;
(4)多维分析处理:通过使用OLAP引擎进行查询分析,从多个维度和层次进行数据分析和处理。
2.根据权利要求1所述的基于OLAP的处方笺多维分析方法,其特征在于,所述步骤(2)具体为将数据源中的数据分为实物表和维表,然后建立立方体模型。
3.根据权利要求1所述的基于OLAP的处方笺多维分析方法,其特征在于,所述步骤(3)具体为:基于数据和分布查询的基础上,将维度集合划分为个片段的集合;扫描数据立方体,将每个片段(TID,measure)***数组ID_measure,对每个维的每个属性建立一个倒排索引项;对每一个片段,取对应的TID列表的交并计算它们的度量,构造局部片段立方体。
4.根据权利要求1所述的基于OLAP的处方笺多维分析方法,其特征在于,所述步骤(4)后还包括选出所需的维度或维度成员组成自己所需的报表的步骤。
5.一种基于OLAP的处方笺多维分析***,其特征在于,基于B/S架构,采用SpringMVC架构,通过使用Java语言开发,包括:需求分析模块,运用原型法对医院的需求进行迭代式分析;***设计模块,采用维度建模的方式构建数据仓库和数据集市;多维数据分析模块,运用ETL工具将数据转化成维表,采用了OLAP的核心引擎Mondrian框架,并运用MDX语言实现在客户端展示多维分析结果;公式自定义模块,通过使用数据立方体模型,从中提取出所需要的维表,再通过报表公式实现医疗处方数据的多维分析和报表的自定义设计。
6.根据权利要求5所述的基于OLAP的处方笺多维分析***,其特征在于,所述数据集市采用星型模式为主、雪花模型为辅的设计模式。
7.根据权利要求5所述的基于OLAP的处方笺多维分析***,其特征在于,还包括报表自定义模块,通过数据立方体模型提取所需属性列,对属性列的自定义和数据进行筛选,最后生成满足医院个性化需求的报表。
CN201810533696.2A 2018-05-29 2018-05-29 一种基于olap的处方笺多维分析方法及*** Pending CN108846040A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810533696.2A CN108846040A (zh) 2018-05-29 2018-05-29 一种基于olap的处方笺多维分析方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810533696.2A CN108846040A (zh) 2018-05-29 2018-05-29 一种基于olap的处方笺多维分析方法及***

Publications (1)

Publication Number Publication Date
CN108846040A true CN108846040A (zh) 2018-11-20

Family

ID=64209882

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810533696.2A Pending CN108846040A (zh) 2018-05-29 2018-05-29 一种基于olap的处方笺多维分析方法及***

Country Status (1)

Country Link
CN (1) CN108846040A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109408514A (zh) * 2018-10-30 2019-03-01 河海大学 一种基于封闭外壳片段立方体的水利普查数据挖掘方法
CN110851442A (zh) * 2019-10-23 2020-02-28 中国科学院国家空间科学中心 科学实验卫星任务数据的多维数据立方体构建***及方法
CN111125264A (zh) * 2019-12-12 2020-05-08 跬云(上海)信息科技有限公司 基于扩展olap模型的超大集合分析方法及装置
CN111881224A (zh) * 2020-08-06 2020-11-03 广东省信息工程有限公司 一种多维数据分析方法及***
CN112328706A (zh) * 2020-11-03 2021-02-05 成都中科大旗软件股份有限公司 数仓体系下的维度建模计算方法、计算机设备和存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107704600A (zh) * 2017-10-16 2018-02-16 上海康云科技有限公司 一种结核检测云数据管理分析***

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107704600A (zh) * 2017-10-16 2018-02-16 上海康云科技有限公司 一种结核检测云数据管理分析***

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
唐珊珊,万定生,朱跃龙,余宇峰,朱 凯: "水利普查成果数据立方体并行计算方法研究", 《水利信息化》 *
张子轩,万定生,朱凯: "层次维编码片段立方体生成算法应用研究", 《计 算 机 技 术 与 发 展》 *
张明主编: "《现代医院市场化成功动作模式与操作技巧实务全书 第4卷》", 28 February 2005 *
张烨: "基于物化数据立方体的营销数据在线分析平台设计与实现", 《中国优秀硕士学位论文全文数据库信息科技辑》 *
陆世伟: "分层模版架构技术在企业级报表开发中的应用", 《浙江工商职业技术学院学报》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109408514A (zh) * 2018-10-30 2019-03-01 河海大学 一种基于封闭外壳片段立方体的水利普查数据挖掘方法
CN110851442A (zh) * 2019-10-23 2020-02-28 中国科学院国家空间科学中心 科学实验卫星任务数据的多维数据立方体构建***及方法
CN110851442B (zh) * 2019-10-23 2022-07-12 中国科学院国家空间科学中心 科学实验卫星任务数据的多维数据立方体构建***及方法
CN111125264A (zh) * 2019-12-12 2020-05-08 跬云(上海)信息科技有限公司 基于扩展olap模型的超大集合分析方法及装置
CN111881224A (zh) * 2020-08-06 2020-11-03 广东省信息工程有限公司 一种多维数据分析方法及***
CN112328706A (zh) * 2020-11-03 2021-02-05 成都中科大旗软件股份有限公司 数仓体系下的维度建模计算方法、计算机设备和存储介质
CN112328706B (zh) * 2020-11-03 2023-10-24 成都中科大旗软件股份有限公司 数仓体系下的维度建模计算方法、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
CN108846040A (zh) 一种基于olap的处方笺多维分析方法及***
Bender-deMoll et al. The art and science of dynamic network visualization
US9075859B2 (en) Parameterized database drill-through
Iñiguez et al. Dynamics of ranking
Yang et al. Analysis and visualization implementation of medical big data resource sharing mechanism based on deep learning
Tian Mapping suburbs based on spatial interactions and effect analysis on ecological landscape change: A case study of Jiangsu Province from 1998 to 2018, Eastern China
Schulz et al. Generative data models for validation and evaluation of visualization techniques
Giacalone et al. BIG DATA: ISSUES AND AN OVERVIEW IN SOME STRATEGIC SECTORS.
Lapura et al. Development of a University Financial Data Warehouse and its Visualization Tool
CA3105048C (en) Academic search and analytics system and method therefor
Cho et al. Determinants of bank closures: what ensures sustainable profitability in mobile banking?
van Doremalen Process Mining in Healthcare Systems: An evaluation and refinement of a methodology
Yadav et al. Big data analytics for health systems
Hamoud et al. Design and implementing cancer data warehouse to support clinical decisions
CN109101544A (zh) 热力图生成方法、装置、计算设备和可读存储介质
CN107679096A (zh) 数据集市间指标共享的方法和装置
Schlüter Knowledge discovery from time series
Muraina et al. Healthcare business intelligence: The case of university’s health center
Dunlop Beginning Big Data with Power BI and Excel 2013: Big Data Processing and Analysis Using PowerBI in Excel 2013
Zhu et al. Visualizing fuzzy sets using opacity-varying freeform diagrams
US9128908B2 (en) Converting reports between disparate report formats
CN111062751A (zh) 一种基于药品自动关联耗材的计费***及方法
Kong [Retracted] Mental Health Evaluation Based on Visual Analysis Technology
CN108229715A (zh) 市场模拟优化***
Orcajo Hernández et al. Business intelligence’s Self-Service tools evaluation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20181120

RJ01 Rejection of invention patent application after publication