CN115422169B - 基于商业广告场景的数据仓库构建方法及装置 - Google Patents

基于商业广告场景的数据仓库构建方法及装置 Download PDF

Info

Publication number
CN115422169B
CN115422169B CN202211372840.1A CN202211372840A CN115422169B CN 115422169 B CN115422169 B CN 115422169B CN 202211372840 A CN202211372840 A CN 202211372840A CN 115422169 B CN115422169 B CN 115422169B
Authority
CN
China
Prior art keywords
service
layer
data
business
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211372840.1A
Other languages
English (en)
Other versions
CN115422169A (zh
Inventor
刘冠
黄斐然
支庭荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jinan University
Original Assignee
Jinan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jinan University filed Critical Jinan University
Priority to CN202211372840.1A priority Critical patent/CN115422169B/zh
Publication of CN115422169A publication Critical patent/CN115422169A/zh
Application granted granted Critical
Publication of CN115422169B publication Critical patent/CN115422169B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/211Schema design and management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Software Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例公开了一种基于商业广告场景的数据仓库构建方法,包括:对目标业务进行调研以获取不同目标业务所分别对应的业务流程;根据所述业务流程确定每一个目标业务中的业务事件或者业务动作,以获取对应的业务过程;建立目标业务的数据仓库,所述数据仓库至少包括维表、明细表和汇总表,所述维表用于统一目标业务的计算算法以及确定目标业务的关联表格,所述明细表用于记录每一个目标业务对应的业务过程,所述汇总表用于记录目标业务的主题域和数据域。充分考虑移动商业广告数据杂乱、数据量大、格式混乱等特点,通过获取业务流程,并据此获取对应的业务过程,然后建立数据仓库,可以高效管理广告业务数据。

Description

基于商业广告场景的数据仓库构建方法及装置
技术领域
本发明涉及计算机数据管理技术领域,具体涉及一种基于商业广告场景的数据仓库构建方法及装置。
背景技术
目前,随着移动互联网的快速发展,一种新生事物-移动广告应运而生,它以其精准性、即时性、互动性、扩散性、整合性和可测性等优点而得到广告商的青睐,从而得以快速发展。与此同时,也就有了移动广告平台的产生,移动广告平台是一个平台或中介,连接着应用开发者和广告主。在平台上,开发者提供应用,广告主提供广告,而移动广告平台就会提供相应手机***的 SDK。开发者下载 SDK,通过使用 SDK 中的工具,可将广告嵌入应用中,并将这些应用通过其他渠道上传到移动互联网,最终用户下载应用,浏览或点击广告后,广告主就会根据相应的计费方式付费给开发者。
数据分析这个部分主要是对现有的移动广告平台在运营中产生的数据进行分析,并产生报表供相关人员查看。根据查看报表数据的人员的不同,主要可分为三个方面,一是从开发者角度做的报表统计,对于开发者来讲,他们主要想知道在平台投放的各个应用每天收入了多少钱;二是从广告主角度做的报表统计,对于广告主来讲,他们主要想知道他们的广告每天在平台展示了多少次,被点击了多少次,他们因此付给了开发者多少的费用;三是从决策者角度做的报表统计,对于公司的决策者来说,他们主要关心平台每天增加了多少广告主和开发者,每天活跃的应用有多少,每天展示和点击的广告有多少,哪种类型的广告被点击的最多,哪款应用的用户最多等等。由此可知,对于不同的用户,***需要从不同的维度对这些大量的异构的数据进行多层次的分析,如果用数据仓库,那么随着数据的快速增长,传统的数据仓库正面临着信息***的新挑战。如此巨大的数据单纯靠传统数据仓库架构来分析将是非常耗时的,并难以高效管理这些数据。
发明内容
针对所述缺陷,本发明实施例公开了一种基于商业广告场景的数据仓库构建方法及装置,其可以高效管理庞大复杂的广告业务数据。
本发明实施例第一方面公开了基于商业广告场景的数据仓库构建方法,包括:
对目标业务进行调研以获取不同目标业务所分别对应的业务流程;
根据所述业务流程确定每一个目标业务中的业务事件或者业务动作,以获取对应的业务过程;
建立目标业务的数据仓库,所述数据仓库至少包括维表、明细表和汇总表,所述维表用于统一目标业务的计算算法以及确定目标业务的关联表格,所述明细表用于记录每一个目标业务对应的业务过程,所述汇总表用于记录目标业务的主题域和数据域。
作为一种可选的实施方式,在本发明实施例第一方面中,所述数据仓库包括ODS层级、DW层级、DMA层级、DMT层级和DA层级,所述ODS层级为原始数据的接入层,所述DW层级用于存储目标业务的业务过程,所述DMA层级用于对数据进行融合汇总,所述DMT层级用于对目标业务主题进行汇总,所述DA层级用于响应个性化数据需求。
作为一种可选的实施方式,在本发明实施例第一方面中,所述数据仓库的ODS层级、DW层级、DMA层级、DMT层级和DA层级之间按照预设规则进行调用。
作为一种可选的实施方式,在本发明实施例第一方面中,所述根据所述业务流程确定每一个目标业务中的业务事件或者业务动作,以获取对应的业务过程,包括:
根据业务流程确定对应的目标业务的业务操作节点,所述业务操作节点包括业务事件和业务动作;
整理所述业务事件和业务动作,提取必要业务操作节点,并按照所述必要业务操作节点在所述业务流程中的次序生成对应的业务过程。
作为一种可选的实施方式,在本发明实施例第一方面中,将所述业务过程进行抽象集合形成目标业务的数据域。
作为一种可选的实施方式,在本发明实施例第一方面中,采集目标业务的主体内容以获得所述目标业务对应的业务主题,生成目标业务的主题域。
作为一种可选的实施方式,在本发明实施例第一方面中,还包括:
基于目标业务的所述数据域和所述主题域生成所述目标业务的行为域总线矩阵。
本发明实施例第二方面公开一种基于商业广告场景的数据仓库构建装置,包括:
业务调研模块:用于对目标业务进行调研以获取不同目标业务所分别对应的业务流程;
过程获取模块:用于根据所述业务流程确定每一个目标业务中的业务事件或者业务动作,以获取对应的业务过程;
仓库创建模块:用于建立目标业务的数据仓库,所述数据仓库至少包括维表、明细表和汇总表,所述维表用于统一目标业务的计算算法以及确定目标业务的关联表格,所述明细表用于记录每一个目标业务对应的业务过程,所述汇总表用于记录目标业务的主题域和数据域。
作为一种可选的实施方式,在本发明实施例第二方面中,所述数据仓库包括ODS层级、DW层级、DMA层级、DMT层级和DA层级,所述ODS层级为原始数据的接入层,所述DW层级用于存储目标业务的业务过程,所述DMA层级用于对数据进行融合汇总,所述DMT层级用于对目标业务主题进行汇总,所述DA层级用于响应个性化数据需求。
作为一种可选的实施方式,在本发明实施例第二方面中,所述数据仓库的ODS层级、DW层级、DMA层级、DMT层级和DA层级之间按照预设规则进行调用。
作为一种可选的实施方式,在本发明实施例第二方面中,所述根据所述业务流程确定每一个目标业务中的业务事件或者业务动作,以获取对应的业务过程,包括:
根据业务流程确定对应的目标业务的业务操作节点,所述业务操作节点包括业务事件和业务动作;
整理所述业务事件和业务动作,提取必要业务操作节点,并按照所述必要业务操作节点在所述业务流程中的次序生成对应的业务过程。
作为一种可选的实施方式,在本发明实施例第二方面中,将所述业务过程进行抽象集合形成目标业务的数据域。
作为一种可选的实施方式,在本发明实施例第二方面中,采集目标业务的主体内容以获得所述目标业务对应的业务主题,生成目标业务的主题域。
作为一种可选的实施方式,在本发明实施例第二方面中,还包括:
基于目标业务的所述数据域和所述主题域生成所述目标业务的行为域总线矩阵。
本发明实施例第三方面公开一种电子设备,包括:存储有可执行程序代码的存储器;与所述存储器耦合的处理器;所述处理器调用所述存储器中存储的所述可执行程序代码,用于执行本发明实施例第一方面公开的基于商业广告场景的数据仓库构建方法。
本发明实施例第四方面公开一种计算机可读存储介质,其存储计算机程序,其中,所述计算机程序使得计算机执行本发明实施例第一方面公开的基于商业广告场景的数据仓库构建方法。
与现有技术相比,本发明实施例具有以下有益效果:
本发明实施例公开的基于商业广告场景的数据仓库构建方法充分考虑移动商业广告数据杂乱、数据量大、格式混乱等特点,通过获取业务流程,并据此获取对应的业务过程,然后建立数据仓库,实施例可以高效管理广告业务数据。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的基于商业广告场景的数据仓库构建方法的流程示意图;
图2是本发明实施例提供的一种基于商业广告场景的数据仓库构建装置的结构示意图;
图3是本发明实施例提供的一种电子设备的结构示意图;
图4是本发明实施例提供的层级调用流向图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书中的术语“第一”、“第二”、“第三”、“第四”等是用于区别不同的对象,而不是用于描述特定顺序。本发明实施例的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,示例性地,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例公开了基于商业广告场景的数据仓库构建方法、装置、电子设备及存储介质,充分考虑移动商业广告数据杂乱、数据量大、格式混乱等特点,通过获取业务流程,并据此获取对应的业务过程,然后建立数据仓库,实施例可以高效管理广告业务数据。
实施例一
请参阅图1,图1是本发明实施例公开的基于商业广告场景的数据仓库构建方法的流程示意图。其中,本发明实施例所描述的方法的执行主体为由软件或/和硬件组成的执行主体,该执行主体可以通过有线或/和无线方式接收相关信息,并可以发送一定的指令。当然,其还可以具有一定的处理功能和存储功能。该执行主体可以控制多个设备,例如远程的物理服务器或云服务器以及相关软件,也可以是对某处安置的设备进行相关操作的本地主机或服务器以及相关软件等。在一些场景中,还可以控制多个存储设备,存储设备可以与设备放置于同一地方或不同地方。如图1所示,该基于基于商业广告场景的数据仓库构建方法包括以下步骤:
101、对目标业务进行调研以获取不同目标业务所分别对应的业务流程。
实施例根据业务线情况可分为业务调研和需求调研,包括构建大数据的数据仓库和两种需求调研途径,并梳理出业务的整体业务架构和整体数据框架。其中,业务调研是构建大数据数据仓库的前提,需要了解各个业务线的业务有什么异同,以及各个业务线可以细分为哪几个业务模块,每个业务模块具有的业务流程是怎样的。而需求调研的凸筋包括两种,一是与相关的工作人员了解数据诉求,二是对报表***中现有的报表进行研究分析。基于调研结果输出调研包括,梳理出业务线的整体业务架构、各个业务模块之间的联系与信息流动的流程;梳理出业务线的整体数据框架、各个业务模块中的主要业务功能和数据类型。
102、根据所述业务流程确定每一个目标业务中的业务事件或者业务动作,以获取对应的业务过程。
实施例结合业务线调研报告,确定业务模块/项目以及每个模块中的事件或者动作,抽象出业务过程。例如,商业化数仓业务过程包括有曝光、请求、点击、下载、计费、充值、消费、激活、留存、注册、登录、安装等,则整合为商业化广告的项目对应的业务过程包括曝光、请求、点击、下载、计费、充值、消费、激活、留存、注册、登录、安装。
实施例中,本步骤具体是根据业务流程确定对应的目标业务的业务操作节点,所述业务操作节点包括业务事件和业务动作;整理所述业务事件和业务动作,提取必要业务操作节点,并按照所述必要业务操作节点在所述业务流程中的次序生成对应的业务过程。
其中,将所述业务过程进行抽象集合形成目标业务的数据域。采集目标业务的主体内容以获得所述目标业务对应的业务主题,生成目标业务的主题域。
数据域的划分原则是面向业务数据,将业务过程或者维度进行抽象的几何,需要长期维护,不轻易变换和频繁修改,数据域必须具有扩展性,新增业务能不影响的扩展或者新增,把业务相近、粒度兼容的维度和度量值进行抽象整合。示例性的,如下表所示,对移动商业广告业务线进行数据域划分:
Figure 27778DEST_PATH_IMAGE001
主题域的划分原则是面向数据应用分析,针对具体的业务分析主体,如商品分析、订单分析,数据具备一定的相关性或者业务相近,突出分析的主题。
示例性的,如下表示出的移动商业广告业务线的主题域划分:
Figure 568350DEST_PATH_IMAGE002
在此基础上,实施例还包括基于目标业务的所述数据域和所述主题域生成所述目标业务的行为域总线矩阵。
实施例明确每个数据域下有哪些业务过程后,即可构建总线矩阵。明确业务过程与哪些维度相关,并定义每个数据域下的业务过程和维度。
示例性的,下表示出了某业务线的行为域总线矩阵:
Figure 569804DEST_PATH_IMAGE003
103、建立目标业务的数据仓库,所述数据仓库至少包括维表、明细表和汇总表,所述维表用于统一目标业务的计算算法以及确定目标业务的关联表格,所述明细表用于记录每一个目标业务对应的业务过程,所述汇总表用于记录目标业务的主题域和数据域。
实施例中,数据仓库包括ODS层级、DW层级、DMA层级、DMT层级和DA层级,所述ODS层级为原始数据的接入层,所述DW层级用于存储目标业务的业务过程,所述DMA层级用于对数据进行融合汇总,所述DMT层级用于对目标业务主题进行汇总,所述DA层级用于响应个性化数据需求。并且,数据仓库的ODS层级、DW层级、DMA层级、DMT层级和DA层级之间按照预设规则进行调用。
实施例的创建数据仓库也即是创建模型,或者的创建不同的表格。主要包括维度及属性的规范定义,维表、明细事实表和汇总事实表的模型设计。其中,维表设计是基于维度建模理念,建立数据维表,以降低数据计算口径和算法不统一的风险。维表设计结合业务,确定维表使用范围,完成维度的初步定义,并保证维度的一致性。确定主维表,主维表通常是ODS表,直接与业务***同步,确定相关维表,确定哪些表和主维表存在关联关系,并选择其中的某些表用于生成维度属性,确定维度属性,从主维表以及相关维表中选择维度属性或生成新的维度属性。实施例的维表设计原则是优先使用公共维表,维表设计考虑复用性和一致性,维度属性尽量覆盖业务的数据统计、分析、探查等需求,维度属性除编码字段外,还应尽可能包含文字性描述字段,避免过于频繁的更新维表的数据。
明细表作为数据仓库维度建模的核心,紧紧围绕着业务过程进行设计。结合业务数据情况,可以为每个业务过程建立一个事实表,也可以将多个相近或者相似的业务过程建立一个事实表。针对业务过程确定一个粒度,就确定了事实表中每一行所表达的细节层次。保证所有的事实按照同样的细节层次记录。如果有字段可以表达这个粒度,可以定义为事实表的主键。应该尽量选择最细级别的粒度,以确保事实表的应用具有最大的灵活性。选定好业务过程并且确定粒度后,就可以确定维度信息,选择能够描述清楚业务过程的维度信息。选定好业务过程并且确定粒度后,就可以确定维度信息,选择能够描述清楚业务过程的维度信息。事实表应该包含与业务过程描述有关的所有事实,且事实的粒度要与所确定的事实表的粒度一致。确定需要哪些相关维度,进行维度冗余。在事实表中存储各种类型的常用维度信息,减少下游用户使用时关联多个表的操作,减少计算开销,提高使用效率。明细表的设计原则是尽可能包含所有与业务过程相关的事实、只选择与业务过程相关的事实、在同一个事实表中,不能包含多种不同粒度的事实。事实表中所有事实的粒度需要与表声明的粒度保持一致、事实的单位要保持一致、对事实的 null值要做统一处理。
汇总表以分析的主题对象作为建模驱动,基于上层的应用和产品的指标需求构建公共粒度的汇总表。其设计步骤是确定汇总的主题域/数据域、确定汇总的维度、确定汇总的事实。汇总表的设计原则是数据公用性,维度和事实尽可能覆盖相关业务使用数据的场景、尽量不要在同一个表中存储不同粒度的汇总数据,如有必要,可用分区存储、模型复用性,尽可能多地覆盖下游使用数据的场景、指标加工范围尽量不包含复合型指标。
实施例中,还包括层级的调用,参见图4,预设规则可以包括DW层深度不大于2;DMA层深度不大于2;DMT层深度不大于1,不允许层级回流调用,应用层优先调用DMA/DMT数据集市汇总层,已经存在DMA/DMT层数据,不允许应用层跨过从ODS/DW层重复加工数据。公共层团队应该积极了解应用层数据的建设要求,将公用的数据沉淀到DM层,为其他团队提供数据服务。应用层团队也需积极配合公共层团队进行持续的DM层建设的改造和迁移。必须避免出现过度的ODS层引用和不合理的数据复制和子集合冗余。
并且还有退维处理,退维是指在模型物理实现中将各维度的常用属性退化到事实表中,以大大提高对事实表的过滤查询、统计聚合等操作的效率,下游层级模型使用的维度属性数据下沉本层模型中进行,在这里指 DW/DMA/DMT/DA层模型中的维度属性下沉,将维度属性从上一层级下沉到1-n层级模型表。其中,DW层降维是将下游DMA/DMT/DA层常规且稳定的维度下沉在该层进行存放,方便使用,减少重复关联维表,需考虑数据回溯计算成本因素,易变动的维度不建议退到该层。DMT层降维是将下游DA层的维度属性退到该层,将能够关联使用的维度尽可能下沉到该层,解决易变动维度问题,灵活应用,DIM降维是将维表做扁平化处理,维度打横,扁平化处理就是将能够整合的维度全部以字段的形式放到一个模型表里,包含易变动维度。
示例性的,广告曝光、点击、计费表comm_dw.dw_ssp_expo_click_hi,将广告(dim_ad_marketing_ad_info_hf)、广告位(comm_dim.dim_ad_pst_info_h)、创意(comm_dim.dim_adad_info_h)、广告组(dim_ad_marketing_ad_group_info_hf)、计划(dim_ad_plan_info_hf)、广告主(dim_ad_advertiser_info_h)的稳定维度属性(媒体ID,广告付费形式、广告组ID、OCPC转换目标、计划ID、广告推广形式、广告位类型等)退化到明细表。
实施例二
请参阅图2,图2是本发明实施例公开的基于商业广告场景的数据仓库构建装置的结构示意图。如图2所示,该基于商业广告场景的数据仓库构建装置可以包括:业务调研模块201、过程获取模块202、仓库创建模块203,其中,业务调研模块201:用于对目标业务进行调研以获取不同目标业务所分别对应的业务流程;过程获取模块202:用于根据所述业务流程确定每一个目标业务中的业务事件或者业务动作,以获取对应的业务过程;仓库创建模块203:用于建立目标业务的数据仓库,所述数据仓库至少包括维表、明细表和汇总表,所述维表用于统一目标业务的计算算法以及确定目标业务的关联表格,所述明细表用于记录每一个目标业务对应的业务过程,所述汇总表用于记录目标业务的主题域和数据域。
实施例中,数据仓库包括ODS层级、DW层级、DMA层级、DMT层级和DA层级,所述ODS层级为原始数据的接入层,所述DW层级用于存储目标业务的业务过程,所述DMA层级用于对数据进行融合汇总,所述DMT层级用于对目标业务主题进行汇总,所述DA层级用于响应个性化数据需求。数据仓库的ODS层级、DW层级、DMA层级、DMT层级和DA层级之间按照预设规则进行调用。
本实施例与实施例一的技术手段及技术效果本质相同,在此不再赘述。
实施例三
请参阅图3,图3是本发明实施例公开的一种电子设备的结构示意图。电子设备可以是计算机以及服务器等,当然,在一定情况下,还可以是手机、平板电脑以及监控终端等智能设备,以及具有处理功能的图像采集装置。如图3所示,该电子设备可以包括:
存储有可执行程序代码的存储器301;
与存储器301耦合的处理器302;
其中,处理器302调用存储器301中存储的可执行程序代码,执行实施例一中的基于商业广告场景的数据仓库构建方法中的部分或全部步骤。
本发明实施例公开一种计算机可读存储介质,其存储计算机程序,其中,该计算机程序使得计算机执行实施例一中的基于商业广告场景的数据仓库构建方法中的部分或全部步骤。
本发明实施例还公开一种计算机程序产品,其中,当计算机程序产品在计算机上运行时,使得计算机执行实施例一中的基于商业广告场景的数据仓库构建方法中的部分或全部步骤。
本发明实施例还公开一种应用发布平台,其中,应用发布平台用于发布计算机程序产品,其中,当计算机程序产品在计算机上运行时,使得计算机执行实施例一中的基于商业广告场景的数据仓库构建方法中的部分或全部步骤。
在本发明的各种实施例中,应理解,所述各过程的序号的大小并不意味着执行顺序的必然先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物单元,即可位于一个地方,或者也可以分布到多个网络单元上。可根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。所述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元若以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可获取的存储器中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或者部分,可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干请求用以使得一台计算机设备(可以为个人计算机、服务器或者网络设备等,具体可以是计算机设备中的处理器)执行本发明的各个实施例所述方法的部分或全部步骤。
在本发明所提供的实施例中,应理解,“与A对应的B”表示B与A相关联,根据A可以确定B。但还应理解,根据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或其他信息确定B。
本领域普通技术人员可以理解所述实施例的各种方法中的部分或全部步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
以上对本发明实施例公开的基于商业广告场景的数据仓库构建方法、装置、电子设备及存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (6)

1.一种基于商业广告场景的数据仓库构建方法,其特征在于,包括:
对目标业务进行调研以获取不同目标业务所分别对应的业务流程;
根据业务流程确定对应的目标业务的业务操作节点,所述业务操作节点包括业务事件和业务动作;整理所述业务事件和业务动作,提取必要业务操作节点,并按照所述必要业务操作节点在所述业务流程中的次序生成对应的业务过程;
建立目标业务的数据仓库,所述数据仓库至少包括维表、明细表和汇总表,所述维表用于统一目标业务的计算算法以及确定目标业务的关联表格,所述明细表用于记录每一个目标业务对应的业务过程,所述汇总表用于记录目标业务的主题域和数据域,所述数据仓库包括ODS层级、DW层级、DMA层级、DMT层级和DA层级,所述ODS层级为原始数据的接入层,所述DW层级用于存储目标业务的业务过程,所述DMA层级用于对数据进行融合汇总,所述DMT层级用于对目标业务主题进行汇总,所述DA层级用于响应个性化数据需求,所述数据仓库的ODS层级、DW层级、DMA层级、DMT层级和DA层级之间按照预设规则进行调用,将所述业务过程进行抽象集合形成目标业务的数据域;
所述预设规则包括所述DW层级的深度不大于第一设定值、 所述DMA层级深度不大于第二设定值、所述DMT层级深度不大于第三设定值、不允许层级回流调用、不允许应用层在DMA/DMT层级数据已经存在的情况下从ODS/DW层级重复加工数据。
2.根据权利要求1所述的数据仓库构建方法,其特征在于,采集目标业务的主体内容以获得所述目标业务对应的业务主题,生成目标业务的主题域。
3.根据权利要求2所述的数据仓库构建方法,其特征在于,还包括:
基于目标业务的所述数据域和所述主题域生成所述目标业务的行为域总线矩阵。
4.一种基于商业广告场景的数据仓库构建装置,其特征在于,包括:
业务调研模块:用于对目标业务进行调研以获取不同目标业务所分别对应的业务流程;
过程获取模块:用于根据业务流程确定对应的目标业务的业务操作节点,所述业务操作节点包括业务事件和业务动作;整理所述业务事件和业务动作,提取必要业务操作节点,并按照所述必要业务操作节点在所述业务流程中的次序生成对应的业务过程;
仓库创建模块:用于建立目标业务的数据仓库,所述数据仓库至少包括维表、明细表和汇总表,所述维表用于统一目标业务的计算算法以及确定目标业务的关联表格,所述明细表用于记录每一个目标业务对应的业务过程,所述汇总表用于记录目标业务的主题域和数据域,所述数据仓库包括ODS层级、DW层级、DMA层级、DMT层级和DA层级,所述ODS层级为原始数据的接入层,所述DW层级用于存储目标业务的业务过程,所述DMA层级用于对数据进行融合汇总,所述DMT层级用于对目标业务主题进行汇总,所述DA层级用于响应个性化数据需求,所述数据仓库的ODS层级、DW层级、DMA层级、DMT层级和DA层级之间按照预设规则进行调用,将所述业务过程进行抽象集合形成目标业务的数据域;
所述预设规则包括所述DW层级的深度不大于第一设定值、 所述DMA层级深度不大于第二设定值、所述DMT层级深度不大于第三设定值、不允许层级回流调用、不允许应用层在DMA/DMT层级数据已经存在的情况下从ODS/DW层级重复加工数据。
5.一种电子设备,其特征在于,包括:存储有可执行程序代码的存储器;与所述存储器耦合的处理器;所述处理器调用所述存储器中存储的所述可执行程序代码,用于执行权利要求1至3任一项所述的基于商业广告场景的数据仓库构建方法。
6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储计算机程序,其中,所述计算机程序使得计算机执行权利要求1至3任一项所述的基于商业广告场景的数据仓库构建方法。
CN202211372840.1A 2022-11-04 2022-11-04 基于商业广告场景的数据仓库构建方法及装置 Active CN115422169B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211372840.1A CN115422169B (zh) 2022-11-04 2022-11-04 基于商业广告场景的数据仓库构建方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211372840.1A CN115422169B (zh) 2022-11-04 2022-11-04 基于商业广告场景的数据仓库构建方法及装置

Publications (2)

Publication Number Publication Date
CN115422169A CN115422169A (zh) 2022-12-02
CN115422169B true CN115422169B (zh) 2023-07-14

Family

ID=84207677

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211372840.1A Active CN115422169B (zh) 2022-11-04 2022-11-04 基于商业广告场景的数据仓库构建方法及装置

Country Status (1)

Country Link
CN (1) CN115422169B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116629718B (zh) * 2023-07-24 2023-09-29 清华四川能源互联网研究院 一种工业数据回溯方法、装置、电子设备及存储介质
CN117763059A (zh) * 2023-12-27 2024-03-26 江苏金融租赁股份有限公司 一种数据仓库和数据集市的模型构建方法及***
CN118051503A (zh) * 2024-04-16 2024-05-17 长城信息股份有限公司 一种基于指标体系的数据仓库构建方法及设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112783887A (zh) * 2019-11-07 2021-05-11 北京沃东天骏信息技术有限公司 一种基于数据仓库的数据处理方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070021992A1 (en) * 2005-07-19 2007-01-25 Srinivas Konakalla Method and system for generating a business intelligence system based on individual life cycles within a business process
CN109669934B (zh) * 2018-12-11 2023-08-01 江苏瑞中数据股份有限公司 一种切合电力客服业务的数据仓库***及其构建方法
CN111008197A (zh) * 2019-11-20 2020-04-14 王锦志 一种电力营销服务***数据中台设计方法
CN111460045A (zh) * 2020-03-02 2020-07-28 心医国际数字医疗***(大连)有限公司 数据仓库建设的建模方法、模型、计算机设备和存储介质
CN112860659B (zh) * 2021-01-18 2023-09-01 北京奇艺世纪科技有限公司 数据仓库的构建方法、装置、设备及存储介质

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112783887A (zh) * 2019-11-07 2021-05-11 北京沃东天骏信息技术有限公司 一种基于数据仓库的数据处理方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一个数据仓库建模工具的设计与实现;王海峰等;《计算机工程》(第13期);220-222 *

Also Published As

Publication number Publication date
CN115422169A (zh) 2022-12-02

Similar Documents

Publication Publication Date Title
CN115422169B (zh) 基于商业广告场景的数据仓库构建方法及装置
JP7201730B2 (ja) 意図推薦方法、装置、機器及び記憶媒体
CN102713965B (zh) 数据源的可缩放主题聚集
Costa-Montenegro et al. Which App? A recommender system of applications in markets: Implementation of the service for monitoring users’ interaction
CN107229708A (zh) 一种个性化出行服务大数据应用***及方法
Beheshti et al. iprocess: Enabling iot platforms in data-driven knowledge-intensive processes
CN110647512B (zh) 一种数据存储和分析方法、装置、设备和可读介质
CN103793465A (zh) 基于云计算的海量用户行为实时分析方法及***
CN109918478A (zh) 基于知识图谱获取地理产品数据的方法和装置
CN102708130A (zh) 计算用户微细分以用于要约匹配的可扩展引擎
US9069880B2 (en) Prediction and isolation of patterns across datasets
CN113609374A (zh) 基于内容推送的数据处理方法、装置、设备及存储介质
CN112052387A (zh) 一种内容推荐方法、装置和计算机可读存储介质
Wu et al. Mobile contextual recommender system for online social media
CN114429364A (zh) 业务数据管理方法和装置、存储介质及电子设备
CN109918678A (zh) 一种字段含义识别方法和装置
CN114637903A (zh) 一种针对定向目标数据拓展的舆情数据采集***
CN111930927B (zh) 评价信息展示方法、装置、电子设备及可读存储介质
CN109614500A (zh) 一种自动创建多层次事件和场景图谱特征的方法、装置及其应用
CN109255385A (zh) 一种自动创建多层次事件和场景图谱特征的方法、装置及其应用
Wu et al. Affective contextual mobile recommender system
CN106570174A (zh) 运行于cmmb超级热点业务平台的大数据分析方法及***
CN114510639A (zh) 一种智慧城市用基于大数据的个人定制推荐平台及方法
CN104636412A (zh) 用于设备数据个性化的方法和***
CN115292330B (zh) 一种数据收集方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant