CN112328604A - 面向时空画像标签管理的数据中台构建方法、***及介质 - Google Patents

面向时空画像标签管理的数据中台构建方法、***及介质 Download PDF

Info

Publication number
CN112328604A
CN112328604A CN202011344108.4A CN202011344108A CN112328604A CN 112328604 A CN112328604 A CN 112328604A CN 202011344108 A CN202011344108 A CN 202011344108A CN 112328604 A CN112328604 A CN 112328604A
Authority
CN
China
Prior art keywords
data
user
spatiotemporal
database
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011344108.4A
Other languages
English (en)
Inventor
张帝
唐海国
张志丹
朱吉然
邓威
彭涛
游金梁
康童
康泰峰
谢小平
易洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
Electric Power Research Institute of State Grid Hunan Electric Power Co Ltd
State Grid Hunan Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
Electric Power Research Institute of State Grid Hunan Electric Power Co Ltd
State Grid Hunan Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, Electric Power Research Institute of State Grid Hunan Electric Power Co Ltd, State Grid Hunan Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN202011344108.4A priority Critical patent/CN112328604A/zh
Publication of CN112328604A publication Critical patent/CN112328604A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及电网数据分析处理领域,公开一种面向时空画像标签管理的数据中台构建方法、***及介质,以整合各类时空数据资源来促进更优质的服务。本发明方法包括:采集离散的用户数据;汇集各用户数据并以统一的标准进行预处理及过滤,使与用户画像相关的所有信息以数值形式体现;对标准化后的数据进行特征分析和数据挖掘,进而根据数据的不同种类,依据用户时空画像数据存储标准进行数据的分类存储并生成相应的标签内容,以形成能构建不同数据模型及模型参数以区分不同客户群体时空画像的基础标签库。

Description

面向时空画像标签管理的数据中台构建方法、***及介质
技术领域
本发明涉及电网数据分析处理领域,尤其涉及一种面向时空画像标签管理的数据中台构建方法、***及介质。
背景技术
数据时代,信息和知识在经济与社会发展中发挥越来越重要的作用,有效获取和利用信息资源成为信息时代个人、企业和国家发展最为重要的体现和保障。在企业规模和数据量急速增长的环境下,传统存储的关系型数据库和数据集成及整合分析方式已经无法满足业务应用的需求,需引入大数据标签体系技术来解决目前的技术瓶颈。为提高大数据平台上数据检索、数据管理、数据分析效率,基于标签技术开展业务数据辨识、数据治理、数据加工,相较于传统数据存储和治理模式,标签***具备速度快、灵活性高、针对性强的特点,当整个数据架构越复杂,越是需要多个计算存储资源组合使用的场景下,标签***的价值就越为明显。
随着生产生活高度信息化,地理信息服务在公共交通、社交平台、购物娱乐以及智慧城市、政府决策等领域逐渐成为各类服务所依托的基础模块。各行业各部门积累了大量的带有时间属性和空间属性的数据资源和服务应用,但由于缺乏有效整合,形成了为数众多的“资源孤岛”,造成了资源浪费和***重复建设等问题。因此,为了提高资源利用效率和降低生产、管理成本,通过引入“资源整合”技术,形成多维度的时空信息资源共享服务体系成为解决问题的关键,同时,由于时空数据来源和引接方式的不同,形成了基于不同平台、不同协议,种类繁多,结构各异的数据形态,在时空信息资源共享平台的服务互操作、数据同步、实体文件传输等模块面临诸多技术瓶颈。因此,解决各类时空数据资源、服务资源整合过程中遇到的问题愈发重要。
数据中台围绕数据生命周期的各个阶段而建立,能够有效实现对企业数据的全方位治理,使得数据的开发和利用化繁为简,同时推动了前台业务创新的速度加快。在这个过程中,数据中台同时在为多个对象服务,例如产品经理、分析师、研发工程师等。数据中台的构建不仅是为了使数据更好地沉淀、再开发,还是企业在产业互联网时代立足的根本,更是企业决策的重要支撑和内部管理精益化的关键指引。目前,数据中台的思想已被多个领域的企业所采用。因此,企业在从“互联网+”向产业互联网转型的过程中,数据中台的构建具有十分重要的现实意义。
企业与用户之间的通信要求以智能客户服务为主要通信桥梁,促进国家电网及时了解用户用电需求,从而对智能客户服务的服务质量提出了更高的要求。但就目前的智能客服***而言,主要采用自然处理技术来实现***深层次的自动问答服务模式,并以语音和文本为关键词进行处理。虽然可以缓解人工客服的工作压力,但其服务质量远低于智能化。此外,许多电网企业还缺乏相对完善的知识管理体系结构,这也影响了智能客户服务***的有效应用性能。
发明内容
本发明目的在于公开一种面向时空画像标签管理的数据中台构建方法、***及介质,以整合各类时空数据资源来促进更优质的服务。
为达上述目的,本发明公开一种面向时空画像标签管理的数据中台构建方法,包括:
采集离散的用户数据;
汇集各用户数据并以统一的标准进行预处理及过滤,使与用户画像相关的所有信息以数值形式体现;
对标准化后的数据进行特征分析和数据挖掘,进而根据数据的不同种类,依据用户时空画像数据存储标准进行数据的分类存储并生成相应的标签内容,以形成能构建不同数据模型及模型参数以区分不同客户群体时空画像的基础标签库。
为达上述目的,本发明还公开一种面向时空画像标签管理的数据中台构建***,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现上述方法的步骤。
进一步的,本发明还公开一种计算机存储介质,其上存储有计算机程序,其中,所述程序被处理器执行时实现上述方法中的步骤。
本发明具有以下有益效果:
采用离业务更近的数据中台,通过数据中台对海量数据进行采集、计算、存储、加工,同时统一标准和口径形成标准数据,再进行存储,形成可追溯、更精准的大数据资产层,能更快速地响应业务和应用开发的需求,进而为不同客户群体提供差异化且更优质的服务。同时,本发明数据中台跟业务有较强的关联性,通过复用能进一步降低重复建设、减少烟囱式协作的成本,也是差异化竞争优势所在。
下面将参照附图,对本发明作进一步详细的说明。
附图说明
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明优选实施例的面向时空画像标签管理的数据中台构建方法流程示意图。
具体实施方式
以下结合附图对本发明的实施例进行详细说明,但是本发明可以由权利要求限定和覆盖的多种不同方式实施。
实施例1
本实施例公开一种面向时空画像标签管理的数据中台构建方法,如图1所示,包括:
步骤S1、采集离散的用户数据。
在该步骤中,以智能客服业务为例,可选的,可采集的用户数据包括但不限于:客服需求数量数据,用户的客服需求类型数据、用户的客户投诉数据、用户在需求客服时的空间位置数据,以及用户对客服需求的时间点数据等。
步骤S2、汇集各用户数据并以统一的标准进行预处理及过滤,使与用户画像相关的所有信息以数值形式体现。
在该步骤中,预处理包括数据稽查、数据清理和数据转换等。例如:核查字段值及内容是否一致、对明显错误值、缺失值、异常值、可疑数据进行“清理”,使“脏”数据变为“干净”数据。
步骤S3、对标准化后的数据进行特征分析和数据挖掘,进而根据数据的不同种类,依据用户时空画像数据存储标准进行数据的分类存储并生成相应的标签内容,以形成能构建不同数据模型及模型参数以区分不同客户群体时空画像的基础标签库。
在该步骤中,可选的,对标准化后的数据进行特征分析和数据挖掘包括聚类分析。在存储过程中,结构型数据以关系型数据库形式存储,非结构型数据以信息资源目录形式存储。
在该步骤中,分类存储以电网智能客服业务为例,用于依据用户时空画像数据存储标准进行数据的分类存储的数据库包括:用户空间画像数据库、用户用电行为数据库、用户预测数据库、客户属性数据库、客户诉求数据库、用户信用数据库、用户缴费行为数据库、标签生命周期数据库及标签评价数据库;其中,所述标签生命周期数据库和所述标签评价数据库用于配套实现标签管理。
进一步的,在该步骤中,在生成标签内容的过程中具体可结合客户档案信息、数据库分析结果、用电信息、设备工况信息、以及出用户异常分析的标签体系规则生成相应的标签内容,进而形成基础标签库。
优选地,本实施例基础标签库和/或所得出的不同客户群体的时空画像数据对数据应用***提供统一的数据接口,以提高数据的复用率。如上述举例,所述数据应用***的后端应用可以是电网智能客服应用,以通过数据中台提取用户的数据标签,构建用户时空画像。例如:电网智能客服能快速的去基础标签库中提取用户标签,根据标签组合去快速筛选出特定标签组合的批量用户进行定制服务,比如对特定地区喜欢投诉但信用又很好的客户进行费用白条服务。
实施例2
与上述实施例1相对应的,本实施例公开一种面向时空画像标签管理的数据中台构建***,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现上述方法的步骤。
实施例3
本实施例公开一种计算机存储介质,其上存储有计算机程序,其中,所述程序被处理器执行时实现上述方法中的步骤。
综上,本发明上述各实施例所分别公开的面向时空画像标签管理的数据中台构建方法、***及介质,至少具有以下有益效果:
采用离业务更近的数据中台,通过数据中台对海量数据进行采集、计算、存储、加工,同时统一标准和口径形成标准数据,再进行存储,形成可追溯、更精准的大数据资产层,能更快速地响应业务和应用开发的需求,进而为不同客户群体提供差异化且更优质的服务。同时,本发明数据中台跟业务有较强的关联性,通过复用能进一步降低重复建设、减少烟囱式协作的成本,也是差异化竞争优势所在。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种面向时空画像标签管理的数据中台构建方法,其特征在于,包括:
采集离散的用户数据;
汇集各用户数据并以统一的标准进行预处理及过滤,使与用户画像相关的所有信息以数值形式体现;
对标准化后的数据进行特征分析和数据挖掘,进而根据数据的不同种类,依据用户时空画像数据存储标准进行数据的分类存储并生成相应的标签内容,以形成能构建不同数据模型及模型参数以区分不同客户群体时空画像的基础标签库。
2.根据权利要求1所述的面向时空画像标签管理的数据中台构建方法,其特征在于,在存储过程中,结构型数据以关系型数据库形式存储,非结构型数据以信息资源目录形式存储。
3.根据权利要求1所述的面向时空画像标签管理的数据中台构建方法,其特征在于,所述预处理包括数据稽查、数据清理和数据转换。
4.根据权利要求1所述的面向时空画像标签管理的数据中台构建方法,其特征在于,所述对标准化后的数据进行特征分析和数据挖掘包括聚类分析。
5.根据权利要求1至4任一所述的面向时空画像标签管理的数据中台构建方法,其特征在于,还包括:
所述基础标签库和/或所得出的不同客户群体的时空画像数据对数据应用***提供统一的数据接口。
6.根据权利要求5所述的面向时空画像标签管理的数据中台构建方法,其特征在于,所述数据应用***的后端应用包括电网智能客服应用,以通过数据中台提取用户的数据标签,构建用户时空画像。
7.根据权利要求6所述的面向时空画像标签管理的数据中台构建方法,其特征在于,用于依据用户时空画像数据存储标准进行数据的分类存储的数据库包括:
用户空间画像数据库、用户用电行为数据库、用户预测数据库、客户属性数据库、客户诉求数据库、用户信用数据库、用户缴费行为数据库、标签生命周期数据库及标签评价数据库;其中,所述标签生命周期数据库和所述标签评价数据库用于配套实现标签管理。
8.一种面向时空画像标签管理的数据中台构建***,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至7任一所述方法的步骤。
9.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现上述权利要求1至7任一所述方法中的步骤。
CN202011344108.4A 2020-11-25 2020-11-25 面向时空画像标签管理的数据中台构建方法、***及介质 Pending CN112328604A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011344108.4A CN112328604A (zh) 2020-11-25 2020-11-25 面向时空画像标签管理的数据中台构建方法、***及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011344108.4A CN112328604A (zh) 2020-11-25 2020-11-25 面向时空画像标签管理的数据中台构建方法、***及介质

Publications (1)

Publication Number Publication Date
CN112328604A true CN112328604A (zh) 2021-02-05

Family

ID=74308722

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011344108.4A Pending CN112328604A (zh) 2020-11-25 2020-11-25 面向时空画像标签管理的数据中台构建方法、***及介质

Country Status (1)

Country Link
CN (1) CN112328604A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115114647A (zh) * 2022-08-26 2022-09-27 湖南华菱电子商务有限公司 一种基于数字中台构建客户画像的客户信息管理方法及***

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106504099A (zh) * 2015-09-07 2017-03-15 国家计算机网络与信息安全管理中心 一种构建用户画像的***
CN110796354A (zh) * 2019-10-21 2020-02-14 国网湖南省电力有限公司 一种企业电费回收风险画像方法及***

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106504099A (zh) * 2015-09-07 2017-03-15 国家计算机网络与信息安全管理中心 一种构建用户画像的***
CN110796354A (zh) * 2019-10-21 2020-02-14 国网湖南省电力有限公司 一种企业电费回收风险画像方法及***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张海旭: "基于话单数据的移动通信用户画像研究" *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115114647A (zh) * 2022-08-26 2022-09-27 湖南华菱电子商务有限公司 一种基于数字中台构建客户画像的客户信息管理方法及***
CN115114647B (zh) * 2022-08-26 2022-11-11 湖南华菱电子商务有限公司 一种基于数字中台构建客户画像的客户信息管理方法及***

Similar Documents

Publication Publication Date Title
CN105045820B (zh) 一种处理海量级数据的视频图像信息的方法及数据库***
CN109272155A (zh) 一种基于大数据的企业行为分析***
CN111552813A (zh) 一种基于电网全业务数据的电力知识图谱构建方法
CN114416855A (zh) 一种基于电力大数据的可视化平台及方法
CN113064866A (zh) 一种电力业务数据整合***
CN102508919A (zh) 数据处理方法及***
CN107103064A (zh) 数据统计方法及装置
CN115423429A (zh) 基于图像和声音信息的多模态一体化配网运营***
CN112650803A (zh) 一种基于商业智能的数据分析***
CN115564071A (zh) 一种电力物联网设备数据标签生成方法及***
CN111126852A (zh) 一种基于大数据建模的bi应用***
CN112328604A (zh) 面向时空画像标签管理的数据中台构建方法、***及介质
CN105912723A (zh) 一种自定义字段的存储方法
CN114862282B (zh) 一种基于数据分析的业财协同管理方法及***
Bharti et al. A Review on Big Data Analytics Tools in Context with Scalability
CN113886465A (zh) 一种用于汽车物流的大数据分析平台
CN114707835A (zh) 一种数据处理方法、装置、电子设备及计算机可读介质
Jiadi et al. Research on Data Center Operation and Maintenance Management Based on Big Data
CN114881603A (zh) 一种基于bim的道路施工信息化处理方法
CN110928938B (zh) 一种接口中间件***
CN114443427A (zh) 一种基于大数据分析的云资源效能评估方法
Zhou et al. Research Review on Big Data of the Smart Grid
Ning et al. A data oriented analysis and design method for smart complex software systems of IoT
CN112667740A (zh) 一种基于问题导向的创新数据分析平台
CN111813873A (zh) 一种实体关系自动发现方法与***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210205