CN102222088A - 按多维度属性检核数据质量并汇总、展示的***和方法 - Google Patents

按多维度属性检核数据质量并汇总、展示的***和方法 Download PDF

Info

Publication number
CN102222088A
CN102222088A CN2011101408921A CN201110140892A CN102222088A CN 102222088 A CN102222088 A CN 102222088A CN 2011101408921 A CN2011101408921 A CN 2011101408921A CN 201110140892 A CN201110140892 A CN 201110140892A CN 102222088 A CN102222088 A CN 102222088A
Authority
CN
China
Prior art keywords
module
data
coordinate system
rule
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011101408921A
Other languages
English (en)
Inventor
许文
潘明道
王昭
石立军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DALIAN BANK CO LTD
Original Assignee
DALIAN BANK CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DALIAN BANK CO LTD filed Critical DALIAN BANK CO LTD
Priority to CN2011101408921A priority Critical patent/CN102222088A/zh
Publication of CN102222088A publication Critical patent/CN102222088A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种实现对技术过程或者技术项目的数据质量检核规则(10)多维度分类以及对技术过程或者技术项目数据(60)按照多维度属性对应关系汇总、展示的***和方法。规则对应模块(50)使用组合选择模块(40)中组合属性条件对数据质量检核规则(10)进行了多维度属性分类。数据对应模块(70)对应用***的源(60)实施转换模块(20)中SQL表述的规则检核,被筛选项由汇总显示模块(80)处理,在坐标系生成模块(30)形成的直角坐标系中生成参数与被筛选项数目成函数的对称几何体。在层级展示模块(90)分层次的展示按照多维度属性分类的检核规则和在每个检核规则下筛选出的应用***数据质量项。

Description

按多维度属性检核数据质量并汇总、展示的***和方法
技术领域
本发明涉及计算机领域,是一种实现对技术过程或者技术项目的数据质量检核规则(也称检核规则)多维度分类以及对技术过程或者技术项目数据(也称应用***数据)按照多维度属性对应关系汇总、展示的***和方法。
背景技术
为了提高应用***数据质量,需要:1、制定数据质量检核规则,2、对于检测到的问题,需选取恰当的角度开展治理。检核规则的制定依赖于使用数据的环境(也称为数据质量维度),不能独立于数据使用者而存在,也就是数据质量检核规则具有与使用者环境相关的多重属性。提供一种能同时展现数据质量规则多种属性以及将具备同样多种属性的数据质量问题汇总的***和方法,有利于数据使用者从多个方面展开应用***数据质量的治理,提高数据治理质量和效率。
发明内容
本发明所基于的任务在于说明一种***和一种方法,用于将技术过程或者技术项目的数据质量检核规则多维度分类以及对技术过程或者技术项目数据按照多维度属性对应关系汇总、展示。
根据本发明通过具有权利要求1中所说明特征的开始时所述方式的一种***完成该任务。在其它的权利要求中和在说明书中,说明了本发明***的有利扩展方案和改进方案以及用于实施该***的一种方法。
用于将技术过程或者技术项目的数据质量检核规则多维度分类以及对技术过程或者技术项目数据按照多维度属性对应关系汇总、展示的本发明***包括一个属性组合选择模块,它与规则对应模块协作确定了数据质量检核规则分类与组合属性对应机制。属性组合选择模块将不同维度中的属性加以组合,规则对应模块使用上述的组合属性作为条件,执行筛选操作,将检核规则与组合属性对应起来。
数据对应模块和转换模块、规则对应模块协作。该数据投射模块筛选符合检核规则的应用***数据,以检核规则-组合属性的对应关系为参考,进行数据和组合属性的对应。
坐标系生成模块和汇总显示模块生成直角坐标系,连同检核规则、***数据与多维度属性对应的结果在输出设备加以展示。坐标系生成模块在输入设备与用户交互,提取用户选择维度和选择顺序信息,据此建立直角坐标系的轴,根据各维度属性分类生成轴上坐标点。汇总显示模块将被筛选并投射的数据在直角坐标系中展示出来-在直角坐标系中,以被筛选数据对应的组合属性坐标点为对称中心,生成半径或边长与被筛选数据总数目成函数关系的对称几何体。
层级展示模块则按照使用者需求展示出深度为两层以上的树形结构。第一层是所有具有坐标系此有意义点组合属性的检核规则,第二层是在第一层检核规则下对应应用***详细检核结果。从权利要求7中可以获悉一种用于对技术过程或者技术项目的数据质量检核规则多维度分类以及对技术过程或者技术项目数据按照多维度属性对应关系汇总、展示的方法,还用该方法解决该任务。
本发明方法基于,选取若干不同数据使用的环境(维度)。在每一维度中所有检核规则按照属性可以分成有限的类。选取2或3个维度作为轴线建立直角坐标系。直角坐标系中有意义的是一些离散点,这些点在各维度的投影是各维度的属性坐标点。使用检核规则筛选应用***数据,按照规则投射到直角坐标系上有意义的离散点上,使用对称几何体代表投射到此有意义离散点的应用***数据的数量。为此:
1)确定N(N大于等于2)个不同数据使用的环境-也称数据质量维度,且确保这些维度不相关。
2)对于制定的数据质量检核规则,它在每个维度至少有一个属性。
3)按照使用者需求,取步骤1中的2个或3个维度作为坐标轴,构成一个2维或3维直角坐标系。坐标轴上有意义的点是离散的,代表步骤2)中的每个属性。坐标系中的有意义点也是离散的,是组合属性对应的坐标,它必须满足在各坐标轴线的投影是有意义的属性点。
4)将检核规则-与坐标空间建立对应关系,如一条检核规则的属性集合包含一个坐标系有意义点对应在坐标轴上投影后的属性集。则此检核规则与此坐标点建立了对应关系。全部规则与有意义点对应完成后,每个有意义点对应的所有检核规则归为一类,它们具有相同的多维组合属性。
5)使用检核规则对应用***进行数据质量检核,当一个应用***项被检核规则筛选出来,它与直角坐标的对应关系与检核规则和直角坐标的对应关系一致。
6)在坐标系每一有意义点,使用对称几何体例如圆、球或长方形、正方体显示对应到此有意义点的被检核规则筛选出来的应用***项,几何体的半径或边长与投射到此有意义点的应用***被筛选项数量成函数关系。
7)用户选择显示***的两个时间参数如果不一致,则在坐标系用两个不同系列几何体分别表现出这两个不同时期被筛选项,以便于使用者直观观察数据质量变化及治理效果。
8)更换坐标轴选项也就是更新维度,则步骤2至6重新执行。
9)点击由步骤6在直角坐标系某有意义点形成的几何体,则展示出深度为两层以上的树形结构。第一层是所有具有坐标系此有意义点组合属性的检核规则,第二层是在第一层检核规则下对应应用***详细检核结果。
附图说明
借助在附图中所示出的本发明实施例采详细阐述和说明本发明,本发明的有利扩展方案和改进方案,以及本发明的特别优点.
附图1:展示了本发明一种示范性的方法流程图.
具体实施方式
图1所示的方法用于将数据质量检核规则10进行多维度分类,将应用***的数据源60按照多维度属性检核、汇总展示。其中转换模块20将文字表述的数据质量检核规则10转换为SQL语句。借助属性组合选择模块40和规则对应模块50进行数据质量检核规则10与直角坐标系中坐标的对应。记住这种规则-坐标对应关系,借助数据对应模块70对应用***的源60实施转换模块20中的SQL规则检核,形成检核被筛选项-坐标对应;被筛选出项对应的坐标点与相应的检核规则对应的坐标点一致。应用***被筛选并与坐标对应的项由汇总显示模块80处理,在坐标系生成模块30形成的直角坐标系中生成半径或边长与被筛选项数目成函数关系的对称几何体并展示。使用层级展示模块90,可以按照使用者需求分层次的展示按照多维度属性分类的检核规则和在每个检核规则下筛选出的应用***数据质量项。
以下示范性地示出了本发明方法的方法步骤.
在第一步骤中借助转换模块20实现数据质量检核规则10从文字表达到用SQL语句表达的转变。
在下一个步骤中根据坐标系生成模块30与用户交互获取的用户选择维度和选择顺序信息,建立直角坐标系并在输出设备展示。各维度上的属性分布在相应维度轴线上。
在下一个步骤中属性组合选择模块40生成以不同坐标轴属性组合为条件的SQL语句。以数据质量检核规则10为输入,在规则对应模块50中执行模块40生成的SQL语句,选择出来的检核规则与坐标对应,对应到的坐标点在各坐标轴投影属性与选择出这条检核规则的SQL语句的组合属性条件相同。每条SQL语句选择出的检核规则汇总为一类,它们具有相同多维属性。
在下一个步骤数据对应模块70以应用***数据60为源,执行模块20中生成的每一条检核规则SQL语句,结果对应到坐标系中与此检核规则相同的坐标点。在汇总显示模块80中,坐标系中每个有意义点生成对称中心在此点的对称几何体并在输出设备展示,几何体的一个参数与投射到此有意义点的应用***数据源数目成函数关系。例如二维坐标生成的几何体是圆、长方形,三维坐标生成的几何体是球、长方体等。圆、球的半径或长方形、长方体的边长与对应到此有意义点的应用***数据的总数目成函数关系。
下一个步骤是一系列的条件判断,首先判断户设置的两个时间参数
●一致(进入分支1,进行用户坐标变换判断)
●不一致(进入分支2,进行两次成像完成判断)
如果进入分支1用户坐标变换判断
●变换(进入分支4,即返回模块30再次执行)
●未变换(进入分支5,进行用户点击成像几何体判断)
如果进入分支2,进行两次成像判断步骤
●完成(进入分支1,进行用户坐标变换判断)
●未完成(进入分支3,即返回模块70执行)
如果进入分支5,进行用户点击成像几何体判断
●点击(进入分支6,执行模块90)
●未点击(进入分支7,本发明方法结束,执行后续动作)
如果进入分支6步骤,即使用层级展示模块90。将已经按照多属性对应关系进行分类的规则和应用***数据展示深度为两层以上的树形结构。第一层是具有用户点击图形的中心坐标点组合属性的所有检核规则,第二层是在第一层每个检核规则下应用***详细检核结果。

Claims (10)

1.用于将一个或多个相关技术过程或者技术项目的数据质量检核规则多维度分类以及对技术过程或者技术项目数据按照多维度属性对应关系汇总、展示的***,其包括:
-一属性组合选择模块(40),用于将不同维度中的属性加以组合,规则对应模块(50)执行以上述的组合属性为条件的选择操作,将检核规则与多个组合属性对应起来;在选定维度中具有相同多属性的检核规则规为同一类;
-一数据对应模块(70),其与转换模块(20)、规则对应模块(50)协作,该数据对应模块筛选符合检核规则的应用***数据,以检核规则-组合属性的对应关系为参考,进行数据和组合属性的对应;
-一汇总显示模块(80),其使用有限个对称几何体方式代表将被筛选并投射的应用***数据,按照规则或者在坐标系生成模块(30)或者层级模块(90)展示出来;其中,
-所述的坐标系生成模块(30)与用户交互,提取用户选择维度和选择顺序信息,建立直角坐标系;
-所述的层级展示模块(90)分层次以树形方式展示按照多维度属性分类的检核规则和在每个检核规则下筛选出的应用***数据质量项。
2.根据权利要求1的***,其特征是:所述的被分类检核规则使用文字描述,所述应用***数据是任意标记和结构化的数据。
3.根据权利要求1的***,其特征是:所述的直角坐标系的轴线坐标有意义点是离散的,是各维度相应属性,其坐标空间有意义点是离散的,其在各坐标轴线的投影是有意义的属性点。
4.根据权利要求3的***,其特征是:以直角坐标系每个有意义点对应的组合属性为条件,对数据质量检核规则进行筛选,筛选出的规则规为同一类。
5.根据权利要求3或4的***,其特征是:所述的有限个对称几何体对称中心在坐标系中每个有意义点,几何体的一个参数与对应到此有意义点的应用***数据源数目成函数关系,二维坐标生成的几何体是圆形或长方形,三维坐标生成的几何体是球体或长方体,圆形、球体的半径或长方形、长方体的边长与按照对应到此有意义点的所有检核规则检核到的应用***数据的总数目成函数关系。
6.根据权利要求4或5的***,其特征是:可按照用户选择,对按照多维度属性分类后的规则和/或应用***数据进行树形展示。
7.将一个或多个相关相关技术过程或者技术项目的数据质量检核规则多维度分类以及对技术过程或者技术项目数据按照多维度属性对应关系汇总、展示的方法,其包括:
-借助转换模块(20)将文字表到的数据质量检核规则(10)转换为SQL语句表达方式;
-借助属性组合选择模块(40)将不同维度中的属性加以组合,生成以组合属性为条件的SQL语句,借助规则对应模块(50),将数据质量检核规则(10)作为输入,执行模块(40)生成的SQL语句,被相同SQL语句选择出来的检核规则归结为一类,均与相同多属性对应;
-借助数据对应模块(70),将应用***数据(60)作为输入,执行模块(20)中生成的以SQL表达的检核规则语句,筛选结果借助模块(50)产生的对应关系,对应到坐标系中与筛选检核规则相同的对应点;
-借助坐标系生成模块(30)与采样用户选择的维度、选择顺序以及维度上的属性,然后建立具有属性刻度的直角坐标系。
8.根据权利要求7的方法,其特征是:直角坐标系各维度具有属性离散分散在相应的坐标轴上,构成各坐标轴全部有意义点,移动坐标系产生新坐标系,新坐标系各轴线与原坐标系相应轴线平行,当新坐标系坐标轴或其延长线与原坐标所有轴线上的属性都相交时,新坐标系原点确定了原坐标系一个有意义离散点。
9.根据权利要求7或8的方法,其特征是:每执行以直角坐标系一个有意义点对应的组合属性为条件的筛选流程,筛选出的检核规则构成具有同样多维度属性的一个类。
10.根据权利要求9的方法,其特征是:生成可直观表示应用***数据项按多维度属性分类后的对称几何体,几何体对称中心位于直角坐标系每一有意义点,几何体的参数与对应的应用***数据源数目成函数关系。
CN2011101408921A 2011-05-30 2011-05-30 按多维度属性检核数据质量并汇总、展示的***和方法 Pending CN102222088A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011101408921A CN102222088A (zh) 2011-05-30 2011-05-30 按多维度属性检核数据质量并汇总、展示的***和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011101408921A CN102222088A (zh) 2011-05-30 2011-05-30 按多维度属性检核数据质量并汇总、展示的***和方法

Publications (1)

Publication Number Publication Date
CN102222088A true CN102222088A (zh) 2011-10-19

Family

ID=44778640

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011101408921A Pending CN102222088A (zh) 2011-05-30 2011-05-30 按多维度属性检核数据质量并汇总、展示的***和方法

Country Status (1)

Country Link
CN (1) CN102222088A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609817A (zh) * 2012-02-14 2012-07-25 北京久其软件股份有限公司 企业数据的显示方法及装置
CN104281713A (zh) * 2014-10-28 2015-01-14 用友软件股份有限公司 数据汇总方法和数据汇总装置
CN104462450A (zh) * 2014-12-15 2015-03-25 北京国双科技有限公司 基于数据立方体的可视化数据的二维显示方法和装置
CN105488162A (zh) * 2015-11-30 2016-04-13 用友优普信息技术有限公司 数据处理方法及装置
CN106326290A (zh) * 2015-07-01 2017-01-11 华为技术有限公司 一种组合数据业务展示的方法及装置
CN107392978A (zh) * 2017-06-13 2017-11-24 中国石油天然气股份有限公司 油井开发方法和装置
CN111159171A (zh) * 2019-12-31 2020-05-15 中国铁塔股份有限公司 一种数据稽核方法及***
CN112199359A (zh) * 2020-09-18 2021-01-08 中国建设银行股份有限公司 数据检核方法、装置、电子设备和存储介质
CN112306997A (zh) * 2019-07-23 2021-02-02 杭州中软安人网络通信股份有限公司 数据质量管理***

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609817A (zh) * 2012-02-14 2012-07-25 北京久其软件股份有限公司 企业数据的显示方法及装置
CN104281713A (zh) * 2014-10-28 2015-01-14 用友软件股份有限公司 数据汇总方法和数据汇总装置
CN104281713B (zh) * 2014-10-28 2018-10-19 用友网络科技股份有限公司 数据汇总方法和数据汇总装置
CN104462450A (zh) * 2014-12-15 2015-03-25 北京国双科技有限公司 基于数据立方体的可视化数据的二维显示方法和装置
CN106326290A (zh) * 2015-07-01 2017-01-11 华为技术有限公司 一种组合数据业务展示的方法及装置
CN105488162A (zh) * 2015-11-30 2016-04-13 用友优普信息技术有限公司 数据处理方法及装置
CN105488162B (zh) * 2015-11-30 2019-04-16 用友优普信息技术有限公司 数据处理方法及装置
CN107392978A (zh) * 2017-06-13 2017-11-24 中国石油天然气股份有限公司 油井开发方法和装置
CN112306997A (zh) * 2019-07-23 2021-02-02 杭州中软安人网络通信股份有限公司 数据质量管理***
CN111159171A (zh) * 2019-12-31 2020-05-15 中国铁塔股份有限公司 一种数据稽核方法及***
CN112199359A (zh) * 2020-09-18 2021-01-08 中国建设银行股份有限公司 数据检核方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
CN102222088A (zh) 按多维度属性检核数据质量并汇总、展示的***和方法
US10817534B2 (en) Systems and methods for interest-driven data visualization systems utilizing visualization image data and trellised visualizations
CN107256265B (zh) 一种搜索引擎结果数据可视化展示方法及***
Park et al. Atom: A grammar for unit visualizations
Stolte et al. Polaris: a system for query, analysis, and visualization of multidimensional databases
US9934299B2 (en) Systems and methods for interest-driven data visualization systems utilizing visualization image data and trellised visualizations
US20070260582A1 (en) Method and System for Visual Query Construction and Representation
US8965866B2 (en) Optimizing data transfer time on graphics processor units
CN111542813A (zh) 使用异构数据的对象模型来便于建立数据可视化
Ong et al. Crystalclear: Active visualization of association rules
Schirski et al. Vista flowlib-framework for interactive visualization and exploration of unsteady flows in virtual environments
Siirtola Combining parallel coordinates with the reorderable matrix
US20150205840A1 (en) Dynamic Data Analytics in Multi-Dimensional Environments
Singh et al. Data Visualization for Developing Effective Performance Dashboard with Power BI
US10747506B2 (en) Customizing operator nodes for graphical representations of data processing pipelines
CN110362591B (zh) 一种报表展现方法和装置
Spear et al. An approach to creating performance visualizations in a parallel profile analysis tool
US11275485B2 (en) Data processing pipeline engine
CN104462440A (zh) 基于数据立方体的可视化数据的二维显示方法和装置
CN104462450A (zh) 基于数据立方体的可视化数据的二维显示方法和装置
Chen et al. Interpretation-oriented information interface for manufacturing enterprises
CN104408196A (zh) 基于数据立方体的可视化数据的二维显示方法和装置
CN104408184A (zh) 基于数据立方体的可视化数据的二维显示方法和装置
CN111291107B (zh) 一种基于虚拟现实技术的渐进沉浸式视觉数据分析方法
CN108647260A (zh) 一种个性化大数据分析***和方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
DD01 Delivery of document by public notice

Addressee: Dalian Bank Co.,Ltd. Wang Zhao

Document name: Notification of Publication of the Application for Invention

C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20111019