CN111008197A - 一种电力营销服务***数据中台设计方法 - Google Patents

一种电力营销服务***数据中台设计方法 Download PDF

Info

Publication number
CN111008197A
CN111008197A CN201911141584.3A CN201911141584A CN111008197A CN 111008197 A CN111008197 A CN 111008197A CN 201911141584 A CN201911141584 A CN 201911141584A CN 111008197 A CN111008197 A CN 111008197A
Authority
CN
China
Prior art keywords
data
business
service
extraction
management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911141584.3A
Other languages
English (en)
Inventor
王锦志
许道强
朱平飞
张才俊
郭翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201911141584.3A priority Critical patent/CN111008197A/zh
Publication of CN111008197A publication Critical patent/CN111008197A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Databases & Information Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • General Engineering & Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • Probability & Statistics with Applications (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Fuzzy Systems (AREA)
  • Water Supply & Treatment (AREA)
  • Computational Linguistics (AREA)
  • Public Health (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种电力营销服务***数据中台设计方法,包括:步骤1,数据汇聚:包含数据指标梳理、业务主数据梳理、企业级数据库表建立和规范更新,并构建电力营销服务***的数据基础;步骤2,数据融合:将业务不同主题域进行数据组织,形成公共数据层模型,开展代码研发和部署运维;步骤3,数据萃取为上层服务提供数据基础;步骤4,分析结果沉淀;步骤5,数据服务提炼及全过程数据运营。该设计方法遵从相应的方法论、标准规范和要求,前后环节之间相互验证迭代。通过数据汇聚、融合、萃取后为数据服务提供数据支撑,通过数据服务和数据运营管理,实现数据价值挖掘,反向赋能业务。

Description

一种电力营销服务***数据中台设计方法
技术领域
本发明涉及电力营销技术领域,尤其涉及一种电力营销服务***数据中台设计方法。
背景技术
现有的电力行业多种IT***之间的层层壁垒使得公司内外部的各种信息无法有效流通,众多高价值数据也只能在自身***的小圈子里转,无法在更大的格局和链条上发挥价值。在企业内,无论是专题、报表或取数,当前基本是烟囱式数据生产模式或者是项目制建设方式,导致数据知识得不到沉淀和持续发展,从而造成模型不能真正成为可重用的组件,无法支撑数据分析的快速响应和创新。
电力营销信息***运行多年沉淀的数据资源广泛分散在各个异构***中,相关业务的数据模型和标准不统一,数据一致性和流通性较差,不能实现有效共享,无法最大限度地挖掘数据价值。企业中台核心包括业务中台和数据中台,支撑企业业务的数字化企业数据的业务化,构建企业的数字化运营能力,支撑企业业务的灵活迭代。企业中台不单指中台信息***支撑,还包括与中台匹配的管理体系和标准。
数据中台是指通过数据技术,对海量数据进行采集、计算、存储、加工,同时统一数据标准和口径,同时还包括构建数据中台过程中的所需要模型服务,算法服务,建设数据中台需要的组织、流程、标准和规范和管理制度等。数据中台把数据统一之后,会形成标准数据,再进行存储,形成大数据资产层,通过数据挖掘和分析工具实现数据服务能力,进而为客户或生态提供高效服务。同时这些服务跟企业的业务有较强的关联性,是这个企业独有的且能复用的,它是企业业务和数据的沉淀,其不仅能降低重复建设、减少烟囱式协作的成本,也是差异化竞争优势所在,增强企业快速创新和,助力企业构筑业务生态。
数据中台的核心是赋能,通过企业数据能力的汇集和IT新技术的支撑,有效增强企业运营、延伸和创造业务的能力,以数据流动为连接,以市场化反应为驱动,全域快速数据反馈,让试错成本更低,反应速度更快,助力企业构筑业务生态。数据中台是面向市场化竞争企业的数字化转型推动力,不断演化产生全新的企业创新服务和产品,结合业务中台的协作联动,有效促进企业业务能力和运营效率的两维度成长,构建“搭台唱戏”的支撑新模式,促进业务延展百花齐放,高效助力智慧运营。
发明内容
针对现有技术中存在的问题,本发明的目的在于提供一种电力营销服务***数据中台设计方法,可采用OneData、OneID、OneService体系方法论作为数据中台的建设方法论,建成包括基础数据中心、全域数据中心、萃取数据中心、数据服务中心等在内的数据中台服务体系,构建总体遵照“双线推进、迭代演进、运营驱动”的建设思路开展,一是自下而上开展数据接入准备及数据标准化存储,实现营销全域数据的融合沉淀;二是自上而下的数据分析模型构建及数据服务提炼,逐步实现对业务的服务化支撑,提炼营销数据共享服务能力。
为达到上述目的,本发明采用以下技术方案予以实现。
一种电力营销服务***数据中台设计方法,包括以下步骤:
步骤1,数据汇聚:包含数据指标梳理、业务主数据梳理、企业级数据库表建立和规范更新;通过在线的数据采集接入工具,对接各业务和外部数据,完成存量和增量数据同步协同,基于业务驱动逐步将数据时效由T+1提升到准实时,构建电力营销服务***的数据基础;
步骤2,数据融合:通过数据统一体系方法论,在中台规范设计的基础上,将业务不同主题域进行数据组织,形成公共数据层模型,开展代码研发和部署运维;
步骤3,数据萃取:以业务需求分析为导向,建立面向业务的多维度体系和面向业务场景应用的数据应用层,完成数据萃取,为上层服务提供数据基础;
步骤4,分析结果沉淀:依据业务需求、业务应用查询要求、数据维护需求进行沉淀总结;
步骤5,数据服务提炼及全过程数据运营:业务人员设计数据质量检查规则及数据运营机制,数据团队利用梳理完成后数据资产目录及数据质量规则进行信息化实现,定期扫描;随着业务发展和时间推移,检查规则不断迭代。
与现有技术相比,本发明的有益效果为:
本发明提供的电力营销服务***数据中台设计方法建成了包括基础数据中心、全域数据中心、萃取数据中心、数据服务中心等在内的数据中台服务体系,设计过程遵从相应的方法论、标准规范和要求,前后环节之间相互验证迭代。通过数据汇聚、融合、萃取后为数据服务提供数据支撑,通过数据服务和数据运营管理,实现数据价值挖掘,反向赋能业务。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的电力营销服务***数据中台设计方法的一种实施例的流程示意图;
图2为本发明提供的数据开发实施流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参考图1,本发明提供了一种电力营销服务***业务中台设计方法,设计过程分为数据汇聚、数据融合、数据萃取、分析结果沉淀、数据服务提炼以及全过程数据运营5个步骤,过程中遵从相应的方法论、标准规范和要求,前后环节之间相互验证迭代。通过数据汇聚、融合、萃取后为数据服务提供数据支撑,通过数据服务和数据运营管理,实现数据价值挖掘,反向赋能业务。
具体如下:
步骤1,数据汇聚:包含数据指标梳理、业务主数据梳理、企业级数据库表建立和规范更新;通过在线的数据采集接入工具,对接各业务和外部数据,完成存量和增量数据同步协同,基于业务驱动逐步将数据时效由T+1提升到准实时,构建电力营销服务***的数据基础。
步骤2,数据融合:通过数据统一体系方法论,在中台规范设计的基础上,将业务不同主题域进行数据组织,形成公共数据层模型,开展代码研发和部署运维;
步骤3,数据萃取:以业务需求分析为导向,建立面向业务的多维度体系和面向业务场景应用的数据应用层,完成数据萃取,为上层服务提供数据基础;
步骤4,分析结果沉淀:依据业务需求、业务应用查询要求、数据维护需求进行沉淀总结;
步骤5,数据服务提炼及全过程数据运营:业务人员设计数据质量检查规则及数据运营机制,数据团队利用梳理完成后数据资产目录及数据质量规则进行信息化实现,定期扫描;随着业务发展和时间推移,检查规则不断迭代。
进一步的,步骤1中,数据汇聚是一个动态的过程,应对不同的数据更新频率,需要兼容批式汇聚、流式汇聚、局部增量汇聚、流式转批式汇聚、流式转局部增量汇聚、流式转拉链表汇聚六种数据输入方式,并根据实际需求选择适合的汇聚方法。
其中,批式汇聚是最常用的离线数据汇聚方式。此方式按照一定频率读取源端的全量数据快照,批量写入目标端,即可覆盖写入,也可添加日期分区写入。
流式汇聚是最常用的实时数据汇聚方式。此方式由数据源端的数据变更(新增、修改)触发,将变更的数据传送至目标端。在目标端中,变更的数据以追加的方式写入,或者按照变更日期分区存储。
局部增量汇聚是较常用的增量数据汇聚方式。此方式按照一定频率抓取数据源端变更的数据(新增、修改)。在目标端,对于新增的数据,写入到新的日期分区中;对于修改的数据,在原数据所在分区中直接修改。对于不支持修改操作的目标端,可通过“刷新”的方式,即将修改的数据连同未修改的数据一起覆盖重写的方式写入。
流式转批式汇聚是流式与批式汇聚的结合,可在流式汇聚基础上建设。在数据源端,以流式方式读取,即由数据变更驱动,将变更的数据传送至目标端。当变更的数据积累到一定规模,或者按照一定频率,在目标端合并历史数据与变更记录,以批式方式写入新的分区。
流式转局部增量汇聚是流式与局部增量汇聚的结合,可在流式汇聚基础上建设。在数据源端,以流式方式读取,即由数据变更驱动,将变更的数据传送至目标端。当变更的数据积累到一定规模,或者按照一定频率,写入目标端。对于新增的数据,写入到新的日期分区中;对于修改的数据,在原数据所在分区中直接修改。对于不支持修改操作的目标端,可通过“刷新”的方式,即将修改的数据连同未修改的数据一起覆盖重写的方式写入。
流式拉链表汇聚是流式汇聚的扩展,可在流式汇聚基础上建设。在数据源端,以流式方式读取,即由数据变更驱动,将变更的数据传送至目标端。当变更的数据积累到一定规模,或者按照一定频率,写入目标端。写入的数据仅包含有变更的数据,并维护与原记录的映射关系。
进一步的,参考图2,在构建公共数据层模型时,首先要进行充分的数据调研;其次,按照维度建模理论对数据域进行划分,构建总线矩阵,抽象出业务过程和维度,同时把分析挖掘业务需求进行抽象整理;最后,进行物理模型的设计,开展代码研发和部署运维。
具体的,包含以下子步骤:
子步骤2.1,数据调研:对业务***中的业务进行调研,并进行需求分析。
数据调研包括业务调研和需求分析。业务调研在项目正式启动前后,需要请相关业务人员详细介绍具体业务,以便于对各个团队的分析人员、运营人员的需求做出理解与文档化整理需求分析的途径有两种:一是根据与分析师、运营人员的沟通获知需求;二是把报表***中现有的报表进行研究分析。通过需求调研分析后,理清数据将来的格式、样式。很多时候,是具体的数据需求驱动数据仓库团队去了解业务***的业务,这两者并没有严格的先后顺序。其最终目的是让数据仓库团队更好的了解业务数据,数据、格式样式。
子步骤2.2,数据域划分:根据数据调研的结果,将业务过程或维度进行抽象的集合,并按照维度建模理论进行数据域划分。
数据域是指面向业务分析,将业务过程或者维度进行抽象的集合。其中,业务过程可以概括为一个个不可拆分的行为事件,如用户登录、收藏、订阅。为保障整个体系的生命力,数据域需要抽象提炼、并且长期维护和定期更新,但不轻易变动。划分数据域的基本要求,既能涵盖当前所有的业务需求,又能在新业务开展时无影响的被包含进已有的数据域或者扩展新的数据域。数据域的划分工作可以在业务调研之后进行,需要分析各个业务模块中有哪些业务活动。
子步骤2.3,构建总线矩阵:包含明确业务过程所述的数据域和明确业务过程与维度的关系。
在进行了充分的业务调研和需求调研后,需要构建总线矩阵,在构建过程中需要做两件事情:一是明确每个数据域下面有哪些业务过程;二是业务过程与哪些维度相关。
子步骤2.4,明确统计指标:包含明确原子指标和明确派生指标。
明确统计指标包括:(1)指标分为原子指标与派生指标。原子指标=业务过程+度量;派生指标=时间周期+修饰词+原子指标。原子指标的创建需要在业务过程定义后才能确认创建,而业务过程在前面定义度量时已明确。(2)创建派生指标的一般需要在了解具体报表需求之后展开,无需在前期创建。
子步骤2.5,规范定义:根据在总线矩阵中的调研和整理,设计一致性维度;根据在总线矩阵中的业务过程,抽象业务过程中包含的度量。
子步骤2.6,设计明细模型:首先设计一致性维表,再设计一致性明细事实表。
具体按照以下步骤进行:(1)维表设计,在规范定义中,已经定义好维度及其属性,接下来的事情就是要把‘维表’设计出来。(2)明细事实表设计,在一致性度量中,定义好把采购业务过程及其度量,明细事实表本质上是针对业务过程而进行的模型设计。在设计明细事实表时,我们按照事实表设计的四个步骤进行:选择业务过程--->确定粒度--->选择维度--->确定事实(度量)。粒度,更多是在维度未展开的情况下记录业务活动的粒度的语义描述。在企业数据团队建设明细事实表时,需要选择基于那张现有的表进行明细层数据的开发,这个表可称之为“基表”,所以必须事前对基表进行业务过程分析及标注。
子步骤2.7,设计汇总模型:首先设计公用汇总模型,再设计应用汇总模型。
汇总表主要分两类,一类是DWS,一类是ADS。这两类汇总表建表模型的过程基本相同。二者使用模型工具创建的步骤流程几乎一样,只是存放的指标类型有所区别(其中,DWS汇总层指标加工的范围包括:规范定义中定义的事务型指标、存量类指标(可选),这一层主要对应于公共数据中心。ADS汇总层指标加工范围包括:规范定义中定义的复合型指标,外加用户自定义的非规范指标),这一层主要对应于萃取数据中心。
子步骤2.8,开展代码开发和部署运维。
进一步的,步骤3中,数据中台的萃取体系整体上可分为三种方式:一是参考互联网企业成熟方法论以业务过程驱动的数据萃取;二是以运营或管理指标驱动的数据萃取;三是以业务分析需求为导向的数据萃取,然后以标签、模型、指标等形式沉淀到萃取中心,为上层服务化提供支撑。
其中,业务过程驱动的数据萃取,根据全业务模型输入,梳理公共数据中心实体间关系,完成实体关系逻辑表,为后续萃取分析提供清晰的数据脉络,具体步骤如下:(1)在业务人员配合下,根据业务模型、数据模型梳理形成以各主要分析对象为核心的业务实体关系视图,如客户ID实体关系视图、设备ID实体关系视图等。图包含业务对象实体、业务过程和结果实体。(2)根据业务实体关系视图,结合公共数据中心数据模型,梳理数据对象的主键及关联字段,确定业务过程中相关的数据对象以及对象间的依赖关系。(3)以步骤二中数据对象及关系作为输入,确定以分析对象为核心的关系视图,并完成对象实体关系逻辑表,并在萃取层沉淀成以用户ID为视角的数据关联分析模型。
其中,运营或管理指标驱动的数据萃取,分为知识萃取和数据指标驱动萃取:(1)知识萃取,以实体概念为节点,以关系为边,提供一种从关系的视角对客户进行描述的方式,其总体的萃取融合过程包括业务概念梳理、知识抽取、知识融合、知识计算的总体过程。
其中,以业务分析需求为导向的数据萃取,通过对业务需求进行分析,进行数据萃取指标溯源信息的梳理,然后围绕指标的溯源信息,依次进行数据萃取任务开发、数据萃取任务执行等关键过程,完成数据的萃取,为上层服务提供数据基础。
(1)数据萃取指标溯源:根据业务需求,确定所需要统计的指标,围绕指标展开数据的萃取。首先需要对指标进行溯源,梳理指标的基本信息,包括指标名称、所属类别、指标定义、业务口径、分析颗粒度、对应支撑的数据实体、分析维度对应支撑数据属性、指标计算数据公式等关键信息。
以下列出关键信息进行说明:
Figure BDA0002281086540000111
(2)数据萃取任务开发:首先,通过指标定义、业务口径以及数据模型,确定指标分析对应支撑的数据实体、字段以及指标计算公式;其次,结合分析维度对应支撑的数据属性,确定分析维度;最后,根据计算公式、分析维度以及其他指标需求信息(如计量单位、指标精度等)指导数据萃取任务的开发。
(3)数据萃取任务执行:通过溯源信息中的统计周期,决定指标的分析颗粒度,如年/月/周/日/小时,然后依次作为执行周期进行任务调度,完成数据萃取,并将数据沉淀形成数据萃取中心。
进一步的,步骤4中,分析结果沉淀依据业务需求、业务应用查询要求、数据维护需求等进行沉淀总结,进行物理存储的业务应用结果,此类结果会利用服务形式统一提供至相关业务应用。分析结果包括但不限于客户标签、分析模型及结果、客户关系图谱、自助分析页面等,数据中台通过数据、标签、模型、策略、分析能力等,建立数据中台的服务能力体系。
其中,以数据服务为例,随着数据中台理念和方法的不断演进,快速构建轻量化的微服务API,并采用Serverless的架构体系,实现自动弹性伸缩,成为了新一代的数据服务化解决方案。由于采用了微服务架构,API的开发者只需要关注API本身的逻辑,无需关心API服务基础设施,通过可视化的API生成向导或者自定义API查询SQL即可生成一个数据API。对于逻辑特别复杂的API,还可以通过诸如Python语言编写函数实现,实现函数即服务(Function as a Service)。因此,新一代的数据服务可大大提升API的开发效率,降低服务运维成本,方便统一管理和规划,从而避免“烟囱式”的低效定制化,让业务需求可以灵活、及时得到满足。数据中台采用统一数据服务总线,开展业务域建模、服务架构建模、服务设计实现和治理及演进。
进一步的,步骤5中,数据服务提炼及全过程数据运营支持提供数据从集成、加工、管理、监控、输出服务的全流程所有功能。具有可视化工作流程设计器功能,可以多人协同作业机制,分角色进行任务开发、线上调度、运维、数据权限管理等功能,数据及任务无需落地即可完成复杂的操作流程。只需关心数据计算逻辑、函数化方式规范定义统计指标,即可完成建模研发、***自动生成代码执行运算等开发模式,包括元数据管理、数据质量管理、数据安全管理。
具体的,
(1)元数据管理:元数据管理是数据管理的核心管控手段,其作为业务、技术、管理的桥梁,为数据安全、数据架构与标准、数据生命周期管理提供辅助支撑,促进实现数据价值创造的目标。
管理目标:
形成企业级统一的指标体系:以建立企业级指标体系为切入点,逐步将业务分类、业务规则等纳入业务元数据管理,提供业务处理的统一解释,提高数据可信性。
对数据追根溯源、实现数据影响分析:梳理数据***内数据来源、数据定义、数据存放位置、存储类型和数据间关系等,形成统一的元数据管理,实现数据的追根溯源
保证数据处理过程的有序进行:展示数据和处理的相关性,全面、真实、直观、及时地反映***业务逻辑和实际技术实现,将***技术实现的全过程透明化、可视化,保证数据处理过程的有序进行。
协助数据的集成:利用元数据***可以帮助***之间对于数据的深入理解,找到数据集成的有效手段和方法,验证相应的合理性,保证数据集成的有序的进行。
支持需求的变化:利用元数据管理可以使业务人员方便的了解业务或***的现状,增加需求提出的合理性。
管理对象:
为有效支撑企业生产运营活动,需要将企业各项目全生命周期生成的元数据对象纳入企业元数据管理范畴。元数据根据其所阐述的主体对象的不同,可划分为业务元数据、技术元数据和管理元数据。
业务元数据是对业务领域相关概念、关系的描述,包括业务管理规范(业务定义、业务管理规则、业务流程)、业务需求、指标三类。
技术元数据是对技术领域相关概念、关系的描述,包括***规划、***需求、架构类元数据、模型类元数据、设计类元数据、程序类元数据、接口类元数据、数据封装类元数据、应用类元数据、环境类元数据等元数据类型。
管理元数据是对管理领域相关概念、关系的描述,包括角色类元数据、权限类元数据、管理员类、管理规范流程类元数据等元数据类型。
管理组织:
元数据管理是企业数据管理的重要组成部分,元数据的管理责任体系遵循企业级的数据管理组织体系架构。
管理流程:
元数据的管控流程主要包括利用阶段性计划指导元数据日常问题收集和建设,动员业务部门、支撑部门协同管理元数据,进而对相关的结果进行评估,形成循环的、不断进步的过程,元数据管理流程共有7个,包括:①元数据获取流程:根据元数据管理对象内容要求,在***整个生命周期中,各相关部门发起元数据新增/变更的流程;②元数据日常管理流程:根据各相关部门的业务需求,在***整个生命周期中,各相关部门发起元数据变更的流程;③元数据质量管理流程:描述元数据管控对象数据质量审核评估过程,保证元数据质量可靠性;④元数据考核流程:考核流程对元数据管理***支撑能力和组织支撑能力进行考核,从元数据源头上、过程中、组织上进行全面考核,确保元数据质量可靠性、有效性和权威性。⑤元数据下线流程:元数据显现流程实现元数据与实际***的同步,保障元数据与实际***的映射关系有效性。⑥元数据应用授权流程:元数据应用授权流程实现元数据应用管理的可控性,保障元数据信息的安全。⑦元数据问题后评估流程:元数据问题后评估流程描述了对于元数据工作周期内相关问题的评估流程,该流程旨在完成对工作中发现的元数据质量问题的评估,并对相应问题提出整改建议后完成元数据工作整改。
考核办法:
元数据质量考核综合考虑过程性与结果性考核,对元数据质量结果与元数据质量管理过程进行综合性考核,分为元数据质量健康水平与元数据质量管理水平两大类指标。
(2)数据质量管理:
管理目标:
建立跨专业、全过程数据质量管控体系:建立日常数据质量管理流程;建立数据质量管理组织责任体系;制定专业内及跨专业数据稽核规则;制定数据产生、获取、加工、发布及使用全过程的质量监控方法;建立数据质量检查考核制度。
确保数据准确、规范、完整、一致:通过跨专业的数据稽核管理、应用企业级统一的指标体系,逐步实现企业级统一的数据口径,保障数据服务准确、规范、一致。
管理内容:
数据质量管理的基本对象包括接口、作业、实体、指标、数据应用及环境信息等类型。
围绕数据质量管理的对象,数据质量管理内容框架划分为业务类、技术类和管理类三个层次。
业务类完成数据质量管理对象和稽核规则的定义,是数据质量管理的业务依据,包括质量需求、稽核规则等。
技术类是对数据质量管理对象的监控、预警、问题解决等工作的实施。
管理类是对数据质量管理工作的支撑与保障,包括管理组织、管理制度、考核办法等。
管理组织:
数据质量的提升不能仅仅依靠一个数据管理部门、或是专业生产部门就能完成,而必须依托于企业级数据管理组织责任体系。数据质量管理分为业务部门、数据服务、数据管理、数据质量管理等8个角色
管理流程:
数据质量管理是通过环环相扣的管控流程和措施,对现有的业务数据进行收集评估,最终提高企业数据的质量水平。具体通过11个管理流程反应工作执行过程
质量数据采集流程:各数据提供部门按质量数据规范要求提交质量数据文件,是数据质量管理的数据来源。
监控流程:对各类监控数据按照稽核规则实施监控,并将监控报告分发至相关各部门,确保质量数据得到实时有效监控。
预警流程:对各类监控异常数据按照预警规则实施预警,将预警数据分发至各部门。
申告流程:申告流程执行过程的有效性和可控性,从根本上保证了申告问题的解决。这一流程规范了申告的流转过程,确保任务处理到位。流程对申告处理的各环节进行时间、质量上的控制,有利于对申告处理过程的跟踪分析和问题的及时发现。进一步提高了解决问题、分析问题的能力。
问题解决流程:问题处理流程可以根据具体情况,把问题分类提供多种数据质量问题处理方式;由数据质量管理部门协调其它各个部门解决数据质量问题。
数据质量报告流程:数据质量部门定期发起收集需求,由各个相关部门提交相关材料(异常监控报告、问题解决报告等),经数据质量部门分析汇总后出具阶段性数据质量报告。
数据质量管理考核流程:对数据质量管理***支撑能力和组织支撑能力进行考核,从数据源头上、过程中、组织上进行全面考核,确保数据质量可靠性、有效性和权威性。
数据质量规则管理流程:数据质量管理角色接收包括管理需求、业务需求后牵头组织形成不同类型的数据质量管理的过程,目的是制定不同类的规则,保证规则管理工作秩序和效率。
质量需求变更管理流程:质量需求变更管理是数据质量管理的业务依据,质量需求管理包括质量需求的新增和变更管理,质量需求管理可有效控制质量需求版本,保障数据质量管理工作的有序进行。
数据质量专题管理流程:数据质量管理角色接收来自业务部门、数据服务、***维护、省分公司信息化部的数据质量专题需求(重大问题申告、关键业务数据质量专题需求等),以协调各相关部门人员讨论并解决数据质量问题,保证数据的及时、完整和准确性。
数据质量后评估流程:该流程旨在完成对工作中发现的数据质量问题的评估,并对相应问题提出整改建议后完成数据质量工作整改。
考核办法:
数据质量考核综合考虑过程性与结果性考核,对数据质量结果与数据质量管理过程进行综合性考核,分为数据质量健康水平与数据质量管理水平两大类指标
(3)数据安全管理:
管理目标:
数据安全管理的目标是,针对各类数据从人员、环境和技术三方面入手,建立数据管理全过程的安全管控体系,确保数据资产的安全、可靠。
管理对象:
数据安全管理对象包括人员、数据、环境三类。
人员类对象,分为公司用户和第三方人员
数据类对象,根据重要性将数据类对象分为核心数据和非核心数据
环境类对象,主要指数据存储、传输、加工所依赖的软、硬件环境
管理组织:
数据安全管理是企业数据管理的重要组成部分,数据安全管理组织角色主要包业务部门、数据管理、数据服务、数据安全管理、***建设、***运维、基础设施管理
管理流程:
数据安全管理是通过了解和衡量目前数据的安全状况,采取一系列的管控手段,最终提高企业数据的安全水平,并持续地维持数据安全向健康状况发展。具体工作的展开主要由管理流程反映。
考核办法:
数据安全管理的考核办法遵循公开性、客观性、开放性和常规性原则,考核指标分为结果类和过程类。
基于以上实施例,本发明开发出了一种电力营销***数据中台设计方法,采用OneData、OneID、OneService体系方法论作为数据中台的建设方法论,建成了包括基础数据中心、全域数据中心、萃取数据中心、数据服务中心等在内的数据中台服务体系。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (7)

1.一种电力营销服务***数据中台设计方法,其特征在于,包括以下步骤:
步骤1,数据汇聚:包含数据指标梳理、业务主数据梳理、企业级数据库表建立和规范更新;通过在线的数据采集接入工具,对接各业务和外部数据,完成存量和增量数据同步协同,基于业务驱动逐步将数据时效由T+1提升到准实时,构建电力营销服务***的数据基础;
步骤2,数据融合:通过数据统一体系方法论,在中台规范设计的基础上,将业务不同主题域进行数据组织,形成公共数据层模型,开展代码研发和部署运维;
步骤3,数据萃取:以业务需求分析为导向,建立面向业务的多维度体系和面向业务场景应用的数据应用层,完成数据萃取,为上层服务提供数据基础;
步骤4,分析结果沉淀:依据业务需求、业务应用查询要求、数据维护需求进行沉淀总结;
步骤5,数据服务提炼及全过程数据运营:业务人员设计数据质量检查规则及数据运营机制,数据团队利用梳理完成后数据资产目录及数据质量规则进行信息化实现,定期扫描;随着业务发展和时间推移,检查规则不断迭代。
2.根据权利要求1所述的电力营销服务***数据中台设计方法,其特征在于,步骤1中,所述数据汇聚的方法包含批式汇聚、流式汇聚、局部增量汇聚、流式转批式汇聚、流式转局部增量汇聚、流式转拉链表汇聚。
3.根据权利要求1所述的电力营销服务***数据中台设计方法,其特征在于,在步骤1的数据汇聚的过程中,数据输入的方式包含兼容批式和流式。
4.根据权利要求1所述的电力营销服务***数据中台设计方法,其特征在于,步骤2包含以下子步骤:
子步骤2.1,数据调研:对业务***中的业务进行调研,并进行需求分析;
子步骤2.2,数据域划分:根据数据调研的结果,将业务过程或维度进行抽象的集合,并按照维度建模理论进行数据域划分;
子步骤2.3,构建总线矩阵:包含明确业务过程所述的数据域和明确业务过程与维度的关系;
子步骤2.4,明确统计指标:包含明确原子指标和明确派生指标;
子步骤2.5,规范定义:根据在总线矩阵中的调研和整理,设计一致性维度;根据在总线矩阵中的业务过程,抽象业务过程中包含的度量;
子步骤2.6,设计明细模型:首先设计一致性维表,再设计一致性明细事实表;
子步骤2.7,设计汇总模型:首先设计公用汇总模型,再设计应用汇总模型;
子步骤2.8,开展代码开发和部署运维。
5.根据权利要求4所述的电力营销服务***数据中台设计方法,其特征在于,子步骤2.1中,所述数据调研包括业务调研和需求分析。
6.根据权利要求1所述的电力营销服务***数据中台设计方法,其特征在于,步骤3中的数据萃取采用以下三种方式:以业务过程驱动的数据萃取、以运营或管理指标驱动的数据萃取和以业务分析需求为导向的数据萃取。
7.根据权利要求6所述的电力营销服务***数据中台设计方法,其特征在于,步骤3具体包含以下子步骤:
子步骤3.1,数据萃取指标溯源:根据业务需求,确定所需要统计的指标,对指标进行溯源,梳理指标的基本信息;
子步骤3.2,数据萃取任务开发:首先,通过指标定义、业务口径以及数据模型,确定指标分析对应支撑的数据实体、字段以及指标计算公式;其次,结合分析维度对应支撑的数据属性,确定分析维度;最后,根据计算公式、分析维度以及其余指标需求信息指导数据萃取任务的开发;
子步骤3.3,数据萃取任务执行:通过溯源信息中的统计周期,决定指标的分析颗粒度,依次作为执行周期进行任务调度,完成数据萃取。
CN201911141584.3A 2019-11-20 2019-11-20 一种电力营销服务***数据中台设计方法 Pending CN111008197A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911141584.3A CN111008197A (zh) 2019-11-20 2019-11-20 一种电力营销服务***数据中台设计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911141584.3A CN111008197A (zh) 2019-11-20 2019-11-20 一种电力营销服务***数据中台设计方法

Publications (1)

Publication Number Publication Date
CN111008197A true CN111008197A (zh) 2020-04-14

Family

ID=70113636

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911141584.3A Pending CN111008197A (zh) 2019-11-20 2019-11-20 一种电力营销服务***数据中台设计方法

Country Status (1)

Country Link
CN (1) CN111008197A (zh)

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111679814A (zh) * 2020-05-24 2020-09-18 杭州云徙科技有限公司 一种数据驱动的数据中台***
CN112085366A (zh) * 2020-09-01 2020-12-15 远光软件股份有限公司 一种对企业组织指标数据进行中台化处理的装置及方法
CN112148261A (zh) * 2020-09-27 2020-12-29 中船第九设计研究院工程有限公司 一种智能船厂数字化服务平台的数据中台设计方法
CN112182077A (zh) * 2020-09-11 2021-01-05 杭州优云软件有限公司 一种基于数据中台技术的智能运维***
CN112199430A (zh) * 2020-10-15 2021-01-08 苏州龙盈软件开发有限公司 一种基于数据中台的业务数据处理***及方法
CN112241543A (zh) * 2020-10-27 2021-01-19 国网福建省电力有限公司信息通信分公司 一种基于数据中台的敏感数据梳理方法
CN112396404A (zh) * 2020-11-27 2021-02-23 广州光点信息科技有限公司 一种数据中台***
CN112434932A (zh) * 2020-11-20 2021-03-02 广东电网有限责任公司佛山供电局 基于电力行业数据中台的智能分析***的构建方法及该智能分析***
CN112487333A (zh) * 2020-11-30 2021-03-12 深圳供电局有限公司 一种基于微服务的数据中台的设计方法及***
CN112527774A (zh) * 2020-12-18 2021-03-19 通号智慧城市研究设计院有限公司 数据中台搭建方法、***及存储介质
CN112700083A (zh) * 2020-11-30 2021-04-23 北京中电普华信息技术有限公司 构建资源综合利用和服务指数指标体系场景的方法及装置
CN112711594A (zh) * 2021-01-15 2021-04-27 科技谷(厦门)信息技术有限公司 一种轨道交通数据集成方法
CN112783931A (zh) * 2020-07-21 2021-05-11 南方电网调峰调频发电有限公司信息通信分公司 基于多视角数据目录实现数据共享服务的***及方法
CN112817938A (zh) * 2021-01-28 2021-05-18 北京易莱信科技有限公司 一种基于数据产品化的通用数据服务构建方法及***
CN112926858A (zh) * 2021-02-26 2021-06-08 国网安徽省电力有限公司信息通信分公司 电力营销业务运营指标设计方法及装置
CN112965948A (zh) * 2020-12-30 2021-06-15 中科环森智慧科技(苏州)有限公司 一种基于数据的管理服务中台***
CN113590607A (zh) * 2021-09-29 2021-11-02 国网江苏省电力有限公司营销服务中心 一种基于报表因子的电力营销报表实现方法和***
CN113743885A (zh) * 2021-08-11 2021-12-03 南方电网数字电网研究院有限公司 一种企业级数据服务访问的建设方法
CN114510534A (zh) * 2022-01-28 2022-05-17 广东航宇卫星科技有限公司 数据同步方法、装置、设备及存储介质
CN114706575A (zh) * 2022-06-07 2022-07-05 杭州比智科技有限公司 一种迁移和复用数据模型的方法及***
CN115422169A (zh) * 2022-11-04 2022-12-02 暨南大学 基于商业广告场景的数据仓库构建方法及装置
US11783374B2 (en) 2021-02-05 2023-10-10 Boe Technology Group Co., Ltd. Method and device for providing real-time data service
CN117369813A (zh) * 2023-10-13 2024-01-09 湖北华中电力科技开发有限责任公司 一种基于数据中台的用能监测指标体系可视化展示方法
US11983193B2 (en) 2020-12-25 2024-05-14 Boe Technology Group Co., Ltd. Data processing method, platform, computer-readable storage medium and electronic device

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111679814A (zh) * 2020-05-24 2020-09-18 杭州云徙科技有限公司 一种数据驱动的数据中台***
CN112783931A (zh) * 2020-07-21 2021-05-11 南方电网调峰调频发电有限公司信息通信分公司 基于多视角数据目录实现数据共享服务的***及方法
CN112085366A (zh) * 2020-09-01 2020-12-15 远光软件股份有限公司 一种对企业组织指标数据进行中台化处理的装置及方法
CN112182077A (zh) * 2020-09-11 2021-01-05 杭州优云软件有限公司 一种基于数据中台技术的智能运维***
CN112182077B (zh) * 2020-09-11 2022-06-07 杭州优云软件有限公司 一种基于数据中台技术的智能运维***
CN112148261A (zh) * 2020-09-27 2020-12-29 中船第九设计研究院工程有限公司 一种智能船厂数字化服务平台的数据中台设计方法
CN112199430A (zh) * 2020-10-15 2021-01-08 苏州龙盈软件开发有限公司 一种基于数据中台的业务数据处理***及方法
CN112241543A (zh) * 2020-10-27 2021-01-19 国网福建省电力有限公司信息通信分公司 一种基于数据中台的敏感数据梳理方法
CN112434932A (zh) * 2020-11-20 2021-03-02 广东电网有限责任公司佛山供电局 基于电力行业数据中台的智能分析***的构建方法及该智能分析***
CN112396404A (zh) * 2020-11-27 2021-02-23 广州光点信息科技有限公司 一种数据中台***
CN112700083A (zh) * 2020-11-30 2021-04-23 北京中电普华信息技术有限公司 构建资源综合利用和服务指数指标体系场景的方法及装置
CN112487333A (zh) * 2020-11-30 2021-03-12 深圳供电局有限公司 一种基于微服务的数据中台的设计方法及***
CN112527774A (zh) * 2020-12-18 2021-03-19 通号智慧城市研究设计院有限公司 数据中台搭建方法、***及存储介质
US11983193B2 (en) 2020-12-25 2024-05-14 Boe Technology Group Co., Ltd. Data processing method, platform, computer-readable storage medium and electronic device
CN112965948A (zh) * 2020-12-30 2021-06-15 中科环森智慧科技(苏州)有限公司 一种基于数据的管理服务中台***
CN112711594A (zh) * 2021-01-15 2021-04-27 科技谷(厦门)信息技术有限公司 一种轨道交通数据集成方法
CN112817938A (zh) * 2021-01-28 2021-05-18 北京易莱信科技有限公司 一种基于数据产品化的通用数据服务构建方法及***
US11783374B2 (en) 2021-02-05 2023-10-10 Boe Technology Group Co., Ltd. Method and device for providing real-time data service
CN112926858A (zh) * 2021-02-26 2021-06-08 国网安徽省电力有限公司信息通信分公司 电力营销业务运营指标设计方法及装置
CN113743885A (zh) * 2021-08-11 2021-12-03 南方电网数字电网研究院有限公司 一种企业级数据服务访问的建设方法
CN113743885B (zh) * 2021-08-11 2024-04-19 南方电网数字电网研究院有限公司 一种企业级数据服务访问的建设方法
CN113590607A (zh) * 2021-09-29 2021-11-02 国网江苏省电力有限公司营销服务中心 一种基于报表因子的电力营销报表实现方法和***
CN114510534A (zh) * 2022-01-28 2022-05-17 广东航宇卫星科技有限公司 数据同步方法、装置、设备及存储介质
CN114510534B (zh) * 2022-01-28 2022-09-06 广东航宇卫星科技有限公司 数据同步方法、装置、设备及存储介质
CN114706575A (zh) * 2022-06-07 2022-07-05 杭州比智科技有限公司 一种迁移和复用数据模型的方法及***
CN115422169A (zh) * 2022-11-04 2022-12-02 暨南大学 基于商业广告场景的数据仓库构建方法及装置
CN117369813A (zh) * 2023-10-13 2024-01-09 湖北华中电力科技开发有限责任公司 一种基于数据中台的用能监测指标体系可视化展示方法

Similar Documents

Publication Publication Date Title
CN111008197A (zh) 一种电力营销服务***数据中台设计方法
González López de Murillas et al. Connecting databases with process mining: a meta model and toolset
US9460171B2 (en) Processing data in data migration
CA3001304C (en) Systems, methods, and devices for an enterprise internet-of-things application development platform
Paim et al. DWARF: An approach for requirements definition and management of data warehouse systems
US7574379B2 (en) Method and system of using artifacts to identify elements of a component business model
Tribelsky et al. An empirical study of information flows in multidisciplinary civil engineering design teams using lean measures
CN110728422A (zh) 用于施工项目的建筑信息模型、方法、装置和结算***
Aljumaili Data quality assessment: Applied in maintenance
Tytenko et al. Software and information support for business analysis in enterprise management
US20140149186A1 (en) Method and system of using artifacts to identify elements of a component business model
Juan et al. Systematic approach for the gap analysis of business processes
Surnin et al. Digital transformation of public services based on a content management system
RU98832U1 (ru) Информационно-аналитическая система для моделирования процессов формирования и развития малого бизнеса
Shikhli et al. Data Acquisition Model for Analyzing Schedule Delays Using KDD: Knowledge Discovery and Datamining
Braungarten et al. An approach to classify software measurement storage facilities
Makaleng A framework for implementing a scalable business intelligence system
Tyrychtr et al. EM-OLAP Framework: Econometric Model Transformation Method for OLAP Design in Intelligence Systems
Tang et al. Applying software engineering principles to develop parcel delay forecasting models using tracking data: A study of the models ARIMA, BSTS, and GAM
CN103489069A (zh) 基于网络的rdmp研发管理平台***
Coello Escobar Dashboard for multistore eCommerce company
Ayyavaraiah Data Mining For Business Intelligence
Hahto Supplier Data Analysis and Utilization in Supply Chain Management: Case ABB Smart Power
Arenas Contreras Data science use cases in the manufacturing industry: from theory to practice
Krajčovič et al. New Approach to the Analysis of Manufacturing Processes with the Support of Data Science

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination