CN113076305A - 一种数据处理方法、装置、电子设备及存储介质 - Google Patents

一种数据处理方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113076305A
CN113076305A CN202110426542.5A CN202110426542A CN113076305A CN 113076305 A CN113076305 A CN 113076305A CN 202110426542 A CN202110426542 A CN 202110426542A CN 113076305 A CN113076305 A CN 113076305A
Authority
CN
China
Prior art keywords
data
service source
source data
target service
metadata
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110426542.5A
Other languages
English (en)
Inventor
冯歆尧
彭泽武
谢瀚阳
梁盈威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Power Grid Co Ltd
Original Assignee
Guangdong Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Power Grid Co Ltd filed Critical Guangdong Power Grid Co Ltd
Priority to CN202110426542.5A priority Critical patent/CN113076305A/zh
Publication of CN113076305A publication Critical patent/CN113076305A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/211Schema design and management
    • G06F16/212Schema design and management with details for data modelling support
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Economics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Water Supply & Treatment (AREA)
  • Mathematical Physics (AREA)
  • Public Health (AREA)
  • Fuzzy Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种数据处理方法、装置、电子设备及存储介质,该方法包括:将与预设数据分析场景关联的业务源数据通过设定方式进行收集,获得目标业务源数据;基于所述目标业务源数据以及所述预设数据分析场景构建数据标识;将所述数据标识与所述目标业务源数据进行关联存储,其中,所述数据标识用于用户获取所述目标业务源数据。通过本发明实施例的技术方案,实现了对业务源数据按照设定维度进行统计存储的目的,进而方便用户查找并使用,降低了用户使用数据的难度。

Description

一种数据处理方法、装置、电子设备及存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种数据处理方法、装置、电子设备及存储介质。
背景技术
随着电网公司全面数字化转型工作的进一步加深,向大屏监控、专题分析、即席报表、明细清单、数据挖掘以及自助查询等数据应用提供统一数据服务能力的需求日益增长。
然而电网数据本身具备数据量大、业务***多样化、数据类型多样化、应用场景丰富等特点,随着业务部门对挖掘数据资产价值需求的迫切提升,快速且精准地获取目标数据资产成为制约各业务部门数据分析人员进行自助分析、数据挖掘的技术难点,也是制约数据驱动业务、流程和经营决策,驱动企业生产、经营、服务业态变革的屏障。
因此,如何将各业务***的数据资产精准且清晰地提供给数据分析人员,是对数据资产进行高效利用的关键。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本发明提供了一种数据处理方法、装置、电子设备及存储介质,实现了对业务源数据按照设定维度进行统计存储的目的,进而方便用户查找并使用,降低了用户使用数据的难度。
第一方面,本发明实施例提供了一种数据处理方法,该方法包括:
将与预设数据分析场景关联的业务源数据通过设定方式进行收集,获得目标业务源数据;
基于所述目标业务源数据以及所述预设数据分析场景构建数据标识;
将所述数据标识与所述目标业务源数据进行关联存储,其中,所述数据标识用于用户获取所述目标业务源数据。
第二方面,本发明实施例还提供了一种数据处理装置,该装置包括:
收集模块,用于将与预设数据分析场景关联的业务源数据通过设定方式进行收集,获得目标业务源数据;
构建模块,用于基于所述目标业务源数据以及所述预设数据分析场景构建数据标识;
存储模块,用于将所述数据标识与所述目标业务源数据进行关联存储,其中,所述数据标识用于用户获取所述目标业务源数据。
第三方面,本发明实施例还提供了一种设备,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明实施例任一所述的数据处理方法。
第四方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如本发明实施例任一所述的数据处理方法。
本发明实施例提供的技术方案与现有技术相比具有如下优点:
通过将与预设数据分析场景关联的业务源数据通过设定方式进行收集,获得目标业务源数据;基于目标业务源数据以及预设数据分析场景构建数据标识;将数据标识与目标业务源数据进行关联存储,其中,所述数据标识用于用户获取所述目标业务源数据,实现了对业务源数据按照设定维度(例如数据分析场景)进行统计存储的目的,进而方便用户查找并使用,降低了用户使用数据的难度。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例所提供的一种数据处理方法流程示意图;
图2为本发明实施例所提供的一种血缘关系图的示意图;
图3为本发明实施例所提供的一种数据处理装置结构示意图;
图4为本发明实施例所提供的一种电子设备的结构示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面将对本发明的方案进行进一步描述。需要说明的是,在不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但本发明还可以采用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本发明的一部分实施例,而不是全部的实施例。
下面将参照附图更详细地描述本发明的实施例。虽然附图中显示了本发明的某些实施例,然而应当理解的是,本发明可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本发明。应当理解的是,本发明的附图及实施例仅用于示例性作用,并非用于限制本发明的保护范围。
应当理解,本发明的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本发明的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本发明中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本发明中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
图1为本发明实施例所提供的一种数据处理方法流程示意图。该方法可适用于对大数据资产进行处理,以使每种数据资产的内容和含义可视化,让用户较轻松直观地了解数据资产的内容,当用户需要使用数据时,可从可视化的数据资产中轻松地选择自己想要的数据,降低了用户使用数据时的复杂度。所述数据处理方法可以由数据处理装置来执行,该装置可以通过软件和/或硬件的形式实现。
如图1所示,本实施例提供的数据处理方法包括如下步骤:
步骤110、将与预设数据分析场景关联的业务源数据通过设定方式进行收集,获得目标业务源数据。
其中,预设数据分析场景例如可以是停电分析场景或者用户满意度分析场景等,或者是其它具体场景。在一种实施方式中,与停电分析场景关联的业务源数据例如包括停电时间、停电区域或者停电区域内各电线路数据(例如电压、电流等)等。在另一种实施方式中,与用户满意度分析场景关联的业务源数据例如包括一段时间内的平均停电时间或者一段时间内的平均停电次数等。
在一种实施方式中,将与预设数据分析场景关联的业务源数据通过设定方式进行收集,获得目标业务源数据,包括:根据预设数据分析场景确定数据字段;基于数据字段通过数据库SQL搜索或者数据立方搜索获得目标业务源数据。具体的,基于数据库SQL或者数据立方关联一个或者多个数据源,选择预设数据分析场景下用户可能会用到的多个字段,进行运算或者指标派生(例如计算平均值,派生出字段是“平均值”对应的源数据),生成针对预设数据分析场景下用户进行数据分析时会用到的数据集或者生成数据表存储到数据库,可以将生成的数据集或者数据表称为数据资产卡片,数据资产卡片中数据的实质为针对预设数据分析场景,用户进行数据分析时会用到的目标业务源数据。
步骤120、基于所述目标业务源数据以及所述预设数据分析场景构建数据标识。
其中,数据标识可以是用于表示数据内容或者数据含义的信息,通过数据标识可以使用户轻松、直观地了解数据的内容与含义,从而降低用户使用数据时的难度。
在一种实施方式中,基于目标业务源数据以及预设数据分析场景构建数据标识,包括:基于目标业务源数据以及预设数据分析场景分别构建一级元数据和/或二级元数据;其中,数据标识包一级元数据和/或二级元数据。
在一种实施方式中基于目标业务源数据以及预设数据分析场景构建一级元数据,包括下述至少一种:
根据预设数据分析场景所属的业务域构建业务域标识;
根据预设数据分析场景所针对的业务对象构建业务对象标识;
根据目标业务源数据的获取时间构建时间标识;
对应的,一级元数据包括业务域标识、业务对象标识和时间标识中的至少一种。示例性的,业务域标识包括下述至少一种:营销域、物资域或者人资域;业务对象标识包括下述至少一种:停电分析或者用户满意度分析。一级元数据还可以包括数据资产卡片(即数据集或者数据表)的创建时间、发布时间、更新时间、数据资产卡片的描述信息(例如“按月份汇总某区域的平均停电时间以及人工复核后的平均停电时间,可作为客户抱怨、停电分析等主要参考数据”)、创建者信息、管理者信息、数据标准责任部门、数据质量责任部门、一级数据主题和二级数据主题(例如按照部门和业务事项分类进行划分)、关键指标(业务相关的关键分析指标,例如在自动抄表分析业务中,关键分析指标为自动抄表率)以及与其相关的其它数据资产卡片(可以是利用关联规则算法推荐的、用户会同时查看的其它数据资产卡片)。
在一种实施方式中,所述数据处理方法还包括:将数据标识以数据资产卡片的形式存储。示例性的,参考如下表1所示的一种数据资产卡片的示意图,其一级元数据包括数据资产卡片名称“自动抄表情况”、业务域标识“营销域”、业务对象“抄表管理”、创建时间“2020-1-1”、发布时间“2020-2-3”、更新时间“2020-2-20”、卡片的描述信息“自动抄表情况汇总了自动抄表率,并且比较自动抄表和手动抄表在重要指标之间的差异”、创建者“AAA”、管理者“BBB”、数据标准责任部门“市场营销部”、数据质量责任部门“信息中心”、一级数据主题“市场营销部”、二级数据主题“营业管理”、关键指标“自动抄表率”、相关数据资产卡片1“抄表率统计”、相关数据资产卡片2“发行率统计”、相关数据资产卡片3“抄表区段维护”、字段数“10”、记录数“1000”以及大小“15K”。
在一种实施方式中,基于所述目标业务源数据以及预设数据分析场景构建二级元数据,包括下述至少一种:
确定目标业务源数据的每个字段的元数据;将每个字段的元数据确定为二级元数据。示例性的,每个字段的元数据包括下述至少一种:业务元数据、第一技术元数据(从数据库视角划分的数据)以及第二技术元数据(从数据分析视角划分的数据)。业务元数据包括下述至少一种:字段名称、业务规则以及编码;第一技术元数据包括下述至少一种:数据类型、测量类型、数据单位、取值范围、数据长度、数据精度、是否是主键、是否可空以及是否是外键;第二技术元数据包括下述至少一种:有效记录、名义值、名义值个数、最大值、最小值、平均值以及标准差。
表1:一种数据资产卡片的示意图
Figure BDA0003029799650000071
步骤130、将所述数据标识与所述目标业务源数据进行关联存储,其中,所述数据标识用于用户获取所述目标业务源数据。
在一种实施方式中,将数据标识与目标业务源数据进行关联存储,包括:以存储目标业务源数据的表为主表,分别关联用于存储一级元数据的第一数据表以及用于存储二级元数据的第二数据表。例如,以存储目标业务源数据的表为主表,左联第一数据表,再左联第二数据表,即可实现对数据资产卡片全面的语义化和可视化
本实施例的技术方案,通过针对特定的数据分析场景,将与具体数据分析场景中有关的数据整理到一起,形成数据资产卡片,将数据资产卡片和其中包含的目标业务源数据进行语义化,例如显示数据资产卡片的名称、责任部门、数据描述、共享范围、涉及的业务事项、数据资产卡片所包括的目标业务源数据的字段数、字段名称、每个字段的业务含义、数据的类型、长度、精度等等,使得数据资产的内容一目了然,用户能够简单、清晰而且全面地了解该数据资产卡片的全貌,从而降低用户使用数据的复杂度,提高用户使用数据的效率。
在一种实施方式中,所述数据处理方法还包括:
基于共有字段建立目标业务源数据所在数据表之间的血缘关系图,并展示所述血缘关系图。通过以图的形式展示资产卡片下所有相关表之间的关联关系,可使用户非常明了地了解数据资产卡片的内容以及各数据表之间的关系。
示例性的,可以参考如图2所示的一种血缘关系图的示意图,其中,目标业务源数据所在数据表包括:供应商数据表(该数据表包括的字段有供应商编号、供应商公司名称、供应商地址等)、顾客数据表(该数据表包括的字段有客户编号、公司名称等)、产品目录数据表(该数据表包括的字段有产品目录编号、产品目录名称、产品目录描述等)、产品数据表(该数据表包括的字段有产品编号、产品名称、供应商编号、产品目录编号等)、订单数据表(该数据表包括的字段有订单编号、客户编号、雇员编号等)、订单明细数据表(该数据表包括的字段包括订单编号、产品编号等)以及雇员数据表(该数据表包括的字段有年龄、雇员编号等)。其中,因为供应商数据表以及产品数据表中都包括字段“供应商编号”,即“供应商编号”是供应商数据表与产品数据表的共有字段,因此供应商数据表与产品数据表之间存在关联,建立供应商数据表与产品数据表之间的血缘关系图。同样的,因为产品目录数据表以及产品数据表中都包括字段“产品目录编号”,即“产品目录编号”是产品目录数据表与产品数据表的共有字段,因此产品目录数据表与产品数据表之间存在关联,建立产品目录数据表与产品数据表之间的血缘关系图。因为订单明细数据表以及产品数据表中都包括字段“产品编号”,即“产品编号”是订单明细数据表与产品数据表的共有字段,因此订单明细数据表与产品数据表之间存在关联,建立订单明细数据表与产品数据表之间的血缘关系图。因为订单明细数据表以及订单数据表中都包括字段“订单编号”,即“订单编号”是订单明细数据表与订单数据表的共有字段,因此订单明细数据表与订单数据表之间存在关联,建立订单明细数据表与订单数据表之间的血缘关系图。因为订单数据表以及顾客数据表中都包括字段“客户编号”,即“客户编号”是订单数据表与顾客数据表的共有字段,因此订单数据表与顾客数据表之间存在关联,建立订单数据表与顾客数据表之间的血缘关系图。因为订单数据表以及雇员数据表中都包括字段“雇员编号”,即“雇员编号”是订单数据表与雇员数据表的共有字段,因此订单数据表与雇员数据表之间存在关联,建立订单数据表与雇员数据表之间的血缘关系图。
通过创建数据资产卡片一级元数据、二级元数据和血缘关系图,将数据资产卡片的内容、用途、管理特征、业务含义和各字段的业务含义以及数据特征全面展示出来;通过数据资产卡片和一级元数据一级二级元数据、字段元数据的关联并且展示给用户,从而将数据资产卡片的全貌全面地展现出来,使用户非常明了地获知数据资产卡片中源数据的含义和内容。
在一种实施方式中,所述数据处理方法还包括:
响应于用户的搜索指令,基于接收到的搜索关键字确定匹配的第一数据表或者第二数据表;基于匹配的第一数据表或者匹配的第二数据表确定匹配的主表;将主表中存储的目标业务源数据提供给用户。
在一种实施方式中,所述数据处理方法还包括:基于用户的历史浏览记录,和/或当前浏览信息向用户推荐业务源数据。
通过本实施的技术方案生成的数据资产卡片的业务针对性更强,更能满足用户的需求,通过将数据的业务含义和技术特征全方位地展示出来,有利于降低用户使用数据的门槛。
图3为本发明实施例提供的一种数据处理装置结构示意图,该装置包括:收集模块310、构建模块320和存储模块330。
其中,收集模块310,用于将与预设数据分析场景关联的业务源数据通过设定方式进行收集,获得目标业务源数据;构建模块320,用于基于所述目标业务源数据以及所述预设数据分析场景构建数据标识;存储模块330,用于将所述数据标识与所述目标业务源数据进行关联存储,其中,所述数据标识用于用户获取所述目标业务源数据。
在上述技术方案的基础上,收集模块310包括:
第一确定单元,用于根据所述预设数据分析场景确定数据字段;搜索单元,用于基于所述数据字段通过数据库SQL搜索或者数据立方搜索获得所述目标业务源数据。
在上述各技术方案的基础上,构建模块320包括:
构建单元,用于基于所述目标业务源数据以及所述预设数据分析场景分别构建一级元数据和/或二级元数据;其中,所述数据标识包括所述一级元数据和/或所述二级元数据。
在上述各技术方案的基础上,所述构建单元具体用于下述至少一种:
根据所述预设数据分析场景所属的业务域构建业务域标识;
根据所述预设数据分析场景所针对的业务对象构建业务对象标识;
根据所述目标业务源数据的获取时间构建时间标识;
对应的,所述一级元数据包括所述业务域标识、业务对象标识和时间标识中的至少一种。
在上述各技术方案的基础上,所述业务域标识包括下述至少一种:营销域、物资域或者人资域;
所述业务对象标识包括下述至少一种:停电分析或者用户满意度分析。
在上述各技术方案的基础上,所述构建单元具体用于:
确定所述目标业务源数据的每个字段的元数据;
将每个字段的元数据确定为所述二级元数据。
在上述各技术方案的基础上,所述每个字段的元数据包括下述至少一种:业务元数据、第一技术元数据以及第二技术元数据。
在上述各技术方案的基础上,所述业务元数据包括下述至少一种:字段名称、业务规则以及编码;
所述第一技术元数据包括下述至少一种:数据类型、测量类型、数据单位、取值范围、数据长度、数据精度、是否是主键、是否可空以及是否是外键;
所述第二技术元数据包括下述至少一种:有效记录、名义值、名义值个数、最大值、最小值、平均值以及标准差。
在上述各技术方案的基础上,所述装置还包括:建立模块,用于建立所述目标业务源数据所在数据表之间的血缘关系图,并展示所述血缘关系图。
在上述各技术方案的基础上,存储模块330,还用于将所述数据标识以数据资产卡片的形式存储。
在上述各技术方案的基础上,存储模块330具体还用于:以存储所述目标业务源数据的表为主表,分别关联用于存储所述一级元数据的第一数据表以及用于存储所述二级元数据的第二数据表。
在上述各技术方案的基础上,所述装置还包括:
第一确定模块,用于响应于用户的搜索指令,基于接收到的搜索关键字确定匹配的所述第一数据表或者所述第二数据表;
第二确定模块,用于基于匹配的所述第一数据表或者匹配的所述第二数据表确定匹配的所述主表;
返回模块,用于将所述主表中存储的目标业务源数据提供给用户。
在上述各技术方案的基础上,所述装置还包括:
推荐模块,用于基于用户的历史浏览记录,和/或当前浏览信息向用户推荐业务源数据。
本发明实施例的技术方案,通过针对特定的数据分析场景,将与具体数据分析场景中有关的数据整理到一起,形成数据资产卡片,将数据资产卡片和其中包含的目标业务源数据进行语义化,例如显示数据资产卡片的名称、责任部门、数据描述、共享范围、涉及的业务事项、数据资产卡片所包括的目标业务源数据的字段数、字段名称、每个字段的业务含义、数据的类型、长度、精度等等,使得数据资产的内容一目了然,用户能够简单、清晰而且全面地了解该数据资产卡片的全貌,从而降低用户使用数据的复杂度,提高用户使用数据的效率。
本发明实施例所提供的数据处理装置可执行本发明任意实施例所提供的数据处理方法,具备执行方法相应的功能模块和有益效果。
值得注意的是,上述装置所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明实施例的保护范围。
下面参考图4,其示出了适于用来实现本发明实施例的电子设备(例如图4中的终端设备或服务器)400的结构示意图。本发明实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图4示出的电子设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图4所示,电子设备400可以包括处理装置(例如中央处理器、图形处理器等)401,其可以根据存储在只读存储器(ROM)402中的程序或者从存储装置408加载到随机访问存储器(RAM)403中的程序而执行各种适当的动作和处理。在RAM 403中,还存储有电子设备400操作所需的各种程序和数据。处理装置401、ROM 402以及RAM403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。
通常,以下装置可以连接至I/O接口405:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置406;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置407;包括例如磁带、硬盘等的存储装置408;以及通信装置409。通信装置409可以允许电子设备400与其他设备进行无线或有线通信以交换数据。虽然图4示出了具有各种装置的电子设备400,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本发明的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置409从网络上被下载和安装,或者从存储装置408被安装,或者从ROM 402被安装。在该计算机程序被处理装置401执行时,执行本发明实施例的方法中限定的上述功能。
本发明实施例提供的终端与上述实施例提供的数据处理方法属于同一发明构思,未在本发明实施例中详尽描述的技术细节可参见上述实施例,并且本发明实施例与上述实施例具有相同的有益效果。
本发明实施例还提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述实施例所提供的数据处理方法。
需要说明的是,本发明上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:
将与预设数据分析场景关联的业务源数据通过设定方式进行收集,获得目标业务源数据;
基于所述目标业务源数据以及所述预设数据分析场景构建数据标识;
将所述数据标识与所述目标业务源数据进行关联存储,其中,所述数据标识用于用户获取所述目标业务源数据。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本发明各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,可编辑内容显示单元还可以被描述为“编辑单元”。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上***(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本发明的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
以上描述仅为本发明的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本发明中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本发明中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所述的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (16)

1.一种数据处理方法,其特征在于,包括:
将与预设数据分析场景关联的业务源数据通过设定方式进行收集,获得目标业务源数据;
基于所述目标业务源数据以及所述预设数据分析场景构建数据标识;
将所述数据标识与所述目标业务源数据进行关联存储,其中,所述数据标识用于用户获取所述目标业务源数据。
2.根据权利要求1所述的方法,其特征在于,所述将与预设数据分析场景关联的业务源数据通过设定方式进行收集,获得目标业务源数据,包括:
根据所述预设数据分析场景确定数据字段;
基于所述数据字段通过数据库SQL搜索或者数据立方搜索获得所述目标业务源数据。
3.根据权利要求1所述的方法,其特征在于,所述基于所述目标业务源数据以及所述预设数据分析场景构建数据标识,包括:
基于所述目标业务源数据以及所述预设数据分析场景分别构建一级元数据和/或二级元数据;
其中,所述数据标识包括所述一级元数据和/或所述二级元数据。
4.根据权利要求3所述的方法,其特征在于,所述基于所述目标业务源数据以及所述预设数据分析场景构建一级元数据,包括下述至少一种:
根据所述预设数据分析场景所属的业务域构建业务域标识;
根据所述预设数据分析场景所针对的业务对象构建业务对象标识;
根据所述目标业务源数据的获取时间构建时间标识;
对应的,所述一级元数据包括所述业务域标识、业务对象标识和时间标识中的至少一种。
5.根据权利要求4所述的方法,其特征在于,所述业务域标识包括下述至少一种:营销域、物资域或者人资域;
所述业务对象标识包括下述至少一种:停电分析或者用户满意度分析。
6.根据权利要求3所述的方法,其特征在于,所述基于所述目标业务源数据以及所述预设数据分析场景构建二级元数据,包括:
确定所述目标业务源数据的每个字段的元数据;
将每个字段的元数据确定为所述二级元数据。
7.根据权利要求6所述的方法,其特征在于,所述每个字段的元数据包括下述至少一种:业务元数据、第一技术元数据以及第二技术元数据。
8.根据权利要求7所述的方法,其特征在于,所述业务元数据包括下述至少一种:字段名称、业务规则以及编码;
所述第一技术元数据包括下述至少一种:数据类型、测量类型、数据单位、取值范围、数据长度、数据精度、是否是主键、是否可空以及是否是外键;
所述第二技术元数据包括下述至少一种:有效记录、名义值、名义值个数、最大值、最小值、平均值以及标准差。
9.根据权利要求1-8任一项所述的方法,其特征在于,所述方法还包括:
基于共有字段建立所述目标业务源数据所在数据表之间的血缘关系图,并展示所述血缘关系图。
10.根据权利要求1-8任一项所述的方法,其特征在于,所述方法还包括:
将所述数据标识以数据资产卡片的形式存储。
11.根据权利要求3-8任一项所述的方法,其特征在于,所述将所述数据标识与所述目标业务源数据进行关联存储,包括:
以存储所述目标业务源数据的表为主表,分别关联用于存储所述一级元数据的第一数据表以及用于存储所述二级元数据的第二数据表。
12.根据权利要求11所述的方法,其特征在于,还包括:
响应于用户的搜索指令,基于接收到的搜索关键字确定匹配的所述第一数据表或者所述第二数据表;
基于匹配的所述第一数据表或者匹配的所述第二数据表确定匹配的所述主表;
将所述主表中存储的目标业务源数据提供给用户。
13.根据权利要求12所述的方法,其特征在于,还包括:
基于用户的历史浏览记录,和/或当前浏览信息向用户推荐业务源数据。
14.一种数据处理装置,其特征在于,包括:
收集模块,用于将与预设数据分析场景关联的业务源数据通过设定方式进行收集,获得目标业务源数据;
构建模块,用于基于所述目标业务源数据以及所述预设数据分析场景构建数据标识;
存储模块,用于将所述数据标识与所述目标业务源数据进行关联存储,其中,所述数据标识用于用户获取所述目标业务源数据。
15.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-13中任一项所述的数据处理方法。
16.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-13中任一项所述的数据处理方法。
CN202110426542.5A 2021-04-20 2021-04-20 一种数据处理方法、装置、电子设备及存储介质 Pending CN113076305A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110426542.5A CN113076305A (zh) 2021-04-20 2021-04-20 一种数据处理方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110426542.5A CN113076305A (zh) 2021-04-20 2021-04-20 一种数据处理方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN113076305A true CN113076305A (zh) 2021-07-06

Family

ID=76618194

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110426542.5A Pending CN113076305A (zh) 2021-04-20 2021-04-20 一种数据处理方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113076305A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113986932A (zh) * 2021-12-28 2022-01-28 恒生电子股份有限公司 数据处理方法、装置、计算机设备及可读存储介质
CN114254081A (zh) * 2021-12-22 2022-03-29 中冶赛迪重庆信息技术有限公司 企业大数据搜索***、方法及电子设备
CN115328569A (zh) * 2022-07-18 2022-11-11 易保网络技术(上海)有限公司 处理数据冲突的方法、***、电子设备及计算机可读存储介质
CN117151496A (zh) * 2023-11-01 2023-12-01 广东电网有限责任公司 一种企业架构对齐方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110347343A (zh) * 2019-07-16 2019-10-18 珠海格力电器股份有限公司 数据管理方法和装置
CN110765321A (zh) * 2019-10-28 2020-02-07 北京明略软件***有限公司 一种数据存储路径的生成方法、生成装置及可读存储介质
CN110909010A (zh) * 2019-11-25 2020-03-24 杭州晨鹰军泰科技有限公司 一种数据智能分析配置管理方法、装置、设备及存储介质
CN112463954A (zh) * 2020-11-11 2021-03-09 远光软件股份有限公司 基于语义识别的可视化多维数据展示***及方法
CN112559524A (zh) * 2020-12-14 2021-03-26 中国建设银行股份有限公司 一种指标数据库建立方法、装置及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110347343A (zh) * 2019-07-16 2019-10-18 珠海格力电器股份有限公司 数据管理方法和装置
CN110765321A (zh) * 2019-10-28 2020-02-07 北京明略软件***有限公司 一种数据存储路径的生成方法、生成装置及可读存储介质
CN110909010A (zh) * 2019-11-25 2020-03-24 杭州晨鹰军泰科技有限公司 一种数据智能分析配置管理方法、装置、设备及存储介质
CN112463954A (zh) * 2020-11-11 2021-03-09 远光软件股份有限公司 基于语义识别的可视化多维数据展示***及方法
CN112559524A (zh) * 2020-12-14 2021-03-26 中国建设银行股份有限公司 一种指标数据库建立方法、装置及存储介质

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114254081A (zh) * 2021-12-22 2022-03-29 中冶赛迪重庆信息技术有限公司 企业大数据搜索***、方法及电子设备
CN114254081B (zh) * 2021-12-22 2024-06-04 中冶赛迪信息技术(重庆)有限公司 企业大数据搜索***、方法及电子设备
CN113986932A (zh) * 2021-12-28 2022-01-28 恒生电子股份有限公司 数据处理方法、装置、计算机设备及可读存储介质
CN115328569A (zh) * 2022-07-18 2022-11-11 易保网络技术(上海)有限公司 处理数据冲突的方法、***、电子设备及计算机可读存储介质
CN115328569B (zh) * 2022-07-18 2024-03-15 易保网络技术(上海)有限公司 处理数据冲突的方法、***、电子设备及计算机可读存储介质
CN117151496A (zh) * 2023-11-01 2023-12-01 广东电网有限责任公司 一种企业架构对齐方法、装置、设备及存储介质
CN117151496B (zh) * 2023-11-01 2024-03-15 广东电网有限责任公司 一种企业架构对齐方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN113076305A (zh) 一种数据处理方法、装置、电子设备及存储介质
CN107679211B (zh) 用于推送信息的方法和装置
US11310324B2 (en) System and method for determining relevance of social content
CN111522927B (zh) 基于知识图谱的实体查询方法和装置
US20120331391A1 (en) User interface for managing questions and answers across multiple social media data sources
US9043413B2 (en) System and method for extracting, collecting, enriching and ranking of email objects
CN104462113A (zh) 搜索方法、装置及电子设备
CN112528595A (zh) 文档处理方法、装置和电子设备
CN111950857A (zh) 基于业务指标的指标体系管理方法、装置以及电子设备
CN105430071A (zh) 一种推送信息的方法及装置
CN114092056A (zh) 项目管理方法、装置、电子设备、存储介质及产品
CN112395022A (zh) 信息显示方法、装置、电子设备及计算机可读存储介质
CN111382365B (zh) 用于输出信息的方法和装置
CN113360790A (zh) 信息推荐方法、装置及电子设备
CN112100216A (zh) 创意关键词的处理方法和装置
CN104240107A (zh) 社群数据筛选***及其方法
CN110633411A (zh) 一种筛选房源的方法、装置、电子设备及存储介质
Kontogianni et al. Smart tourism through social network user modeling: a literature review
KR20210016845A (ko) 투자정보 큐레이션 제공방법
KR20200086057A (ko) 법안 모니터링 시스템 및 법안 모니터링 방법
CN114202389A (zh) 用户评价的管控方法、装置、电子设备及存储介质
US20140129576A1 (en) Analysis of meeting content and agendas
CN111783440A (zh) 意图识别方法、装置、可读介质及电子设备
CN111222048A (zh) 用户数量的查询计算方法、装置、电子设备、及存储介质
CN112667755B (zh) 基于Kudu的数据分析装置和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination