CN105630475B - 一种数据标签组织***及组织方法 - Google Patents

一种数据标签组织***及组织方法 Download PDF

Info

Publication number
CN105630475B
CN105630475B CN201410624275.2A CN201410624275A CN105630475B CN 105630475 B CN105630475 B CN 105630475B CN 201410624275 A CN201410624275 A CN 201410624275A CN 105630475 B CN105630475 B CN 105630475B
Authority
CN
China
Prior art keywords
data
label
tag
data tag
data label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410624275.2A
Other languages
English (en)
Other versions
CN105630475A (zh
Inventor
沈金
甘云锋
黄晓婧
李小健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Tmall Technology Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201410624275.2A priority Critical patent/CN105630475B/zh
Publication of CN105630475A publication Critical patent/CN105630475A/zh
Application granted granted Critical
Publication of CN105630475B publication Critical patent/CN105630475B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供一种数据标签组织***,包括:数据标签申请模块,用于根据用户指令申请所需业务数据标签;数据标签编译模块,用于依据定义的元数据信息将所需业务数据标签编译为基于标准SQL的SQL语句;以及执行存储模块,用于执行并存储编译后的基于标准SQL的SQL语句。本申请还提供一种数据标签组织方法,包括:申请数据标签;定义元数据信息;依据元数据信息将所需业务数据标签编译为基于标准SQL的SQL语句;以及执行并存储基于标准SQL的SQL语句。本申请通过一次定义数据业务过滤规则,便可自动获取各种数据平台中指定的数据标签,从而可满足用户简便、高效、准确地从不同数据平台获取各种数据的要求。

Description

一种数据标签组织***及组织方法
技术领域
本申请涉及一种数据标签管理技术,尤其涉及一种数据标签组织***及组织方法。
背景技术
目前,在开放的数据平台交易市场,存在许多不同的数据供应商,提供着上千万的数据标签。要获得指定的数据标签通常需要经过人工进行数据处理,而数据处理大致分为两大类:联机事务处理(OLTP)和联机分析处理(OLAP),OLTP是关系型数据库的主要应用,性能上由响应时间为衡量标准;OLAP是数据仓库***的主要应用,以吞吐量为主要衡量标准。在这两种数据应用环境中,都必须耗费大量人力物力,通过人工大量运行业务逻辑代码,才能支持各种复杂多变的数据标签需求。
前述方法在从需求描述业务到最终结果,需要第三方技术人员介入,难免会因业务理解差异导致最终开发结果与需求不同;或者存在尽管不同需求存在共性,仍然需要重复开发,致使开发效率不高,可通用性差的缺陷。
有鉴于此,有必要提供一种适用于不同数据平台的,可进行数据标签化组织的***及方法,以满足用户简便、高效、准确地从不同数据平台获取各种数据的要求。
发明内容
本申请提供了一种数据标签组织***,包括:数据标签申请模块,用于根据用户指令申请所需业务数据标签;以及数据标签编译模块,用于依据定义的元数据信息将所需业务数据标签编译为基于标准SQL的SQL语句。
本申请还提供了一种数据标签组织方法,包括:申请数据标签;定义元数据信息;以及依据所述元数据信息将所需业务数据标签编译为基于标准SQL的SQL语句。
采用本申请的数据标签组织***与组织方法,可以通过一次定义数据业务过滤规则,便可自动获取各种数据平台中指定的数据标签,从而可满足用户简便、高效、准确地从不同数据平台获取各种数据的要求。
附图说明
读者在参照附图阅读了本申请的具体实施方式以后,将会更清楚地了解本申请的各个方面。其中,
图1为本申请的数据标签组织***的模块示意图;
图2为图1的数据标签组织***中的模块121的子模块示意图;
图3为本申请的数据标签组织***中的数据标签信息参数E-R示意图;
图4为图3的数据标签信息参数SQL列表示意图;
图5为本申请的数据标签组织方法的优选流程示意图;
图6为图5的数据标签组织方法中的步骤200的优选流程示意图;
图7为图5的数据标签组织方法中的步骤300的优选流程示意图。
具体实施方式
为了使本申请所揭示的技术内容更加详尽与完备,可参照附图以及本申请的下述各种具体实施例,附图中相同的标记代表相同或相似的组件。然而,本领域的普通技术人员应当理解,下文中所提供的实施例并非用来限制本申请所涵盖的范围。此外,附图仅仅用于示意性地加以说明,并未依照其原尺寸进行绘制。
在本申请一个典型的配置中,终端、服务网络的设备和可信方均包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的子单元或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁硬盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
下面参照附图,对本申请各个方面的具体实施方式作进一步的详细描述。
请参阅图1,所示为本申请的数据标签组织***的模块示意图。所述数据标签组织***1与用户2通过可视化界面交互通信,可依据用户2的指令,依据用户2对数据标签的需求组织编译,从而为用户2提供可供查询的基于标准SQL的SQL语句。
在本申请的一个优选实施例中,所述数据标签组织***1包括数据标签申请模块11,数据标签编译模块12以及执行存储模块13。其中,数据标签申请模块11用于根据用户指令申请所需业务数据标签,数据标签编译模块12用于依据定义的元数据信息将所需业务数据标签编译为基于标准SQL的SQL语句,执行存储模块13用于执行并存储编译后的基于标准SQL的SQL语句。
具体地,在本申请的另一优选实施例中,数据标签编译模块12还包括:数据标签定义模块120以及程序模块121。其中,数据标签定义模块120用于依据所述元数据信息定义预设数据标签信息,程序模块121用于依据所述预设数据标签信息将所需业务数据标签编译为基于标准SQL的SQL语句。
执行存储模块13还进一步包括执行模块130,以及存储模块131。其中,执行模块130用于执行编译后的基于标准SQL的SQL语句,存储模块131用于存储编译后的基于标准SQL的SQL语句。
在本实施例中,数据标签定义模块120依据所述元数据信息定义预设数据标签信息。其中所述元数据信息包括构建数据标签实体-联系图(Entity Relationship Diagram,E-R图),并依据该E-R图设置数据标签的逻辑信息以及物理信息。举例而言,所述E-R图包含预设数据标签信息定义如下:
数据标签数据源,用于确定基础数据标签的存储信息;
数据标签融合方式,用于确定所述基础数据标签的融合方式;
数据标签因子逻辑,用于确定所述数据标签与基础数据标签的关系及所述基础数据标签的过滤规则;
数据标签的业务逻辑,用于确定所述数据标签与所述数据标签因子的业务逻辑联系;所申请的数据标签需求,用于确定所申请的数据标签与数据标签的聚合维度。
数据标签容器,用于确定所述数据标签的存储位置;以及
数据标签质量,用于确定所述数据标签的数据质量符合所述元数据信息的要求。
具体地,请配合同时参阅图1与图3,图3所示为本申请另一实施例中定义所述预设数据标签信息示意图,简明地示出了在预设的E-R图中标签实体的联系关系实例。其中,数据标签因子逻辑与数据标签数据源为多对多(M:N)引用联系类型;数据标签因子逻辑与数据标签融合方式为多对多(M:N)约束联系类型;数据标签因子逻辑与数据标签业务逻辑多对多(M:N)定义联系类型。所申请的数据标签需求与数据标签业务逻辑为1对多(1:N)定义联系类型;所申请的数据标签需求与标签容器为1对1(1:1)存放联系类型,所申请的数据标签需求与标签质量为1对1(1:1)监控联系类型。
进一步地,对所述E-R图中各实体数据标签信息进行逻辑设置,请配合参阅图3与图4,简要示出了所述逻辑设置内容。在本实施例中,所述逻辑设置包括依据所述数据标签因子逻辑设置数据标签因子逻辑表、依据所述数据标签业务逻辑设置数据标签业务逻辑表、依据所述数据标签需求设置数据标签需求表、依据所述数据标签数据源设置基础标签容器表、依据所述标签融合方式设置基础标签融合表、依据所述数据标签设置数据标签容器表以及依据所述数据标签质量设置数据标签质量表。
其中,数据标签因子逻辑表与数据标签业务逻辑表为多对多(M:N)联系。在本实施例中,依据所述数据标签因子逻辑表命名为[tags_factor_tab],用于确定标签因子和基础标签的关系以及基础标签的存放位置,基础标签的业务过滤规则。其中至少可以包括数据标签因子标识(factor_id),基础标签容器表标识(src_tab_id)以及有效性判定(is_validate),用以判断所述关系和存放位置的有效性。在本申请的其他实施方式中,所述数据标签因子逻辑表还可进一步包括其他内容,例如连续性判定(is_constant)等。
数据标签业务逻辑表与数据标签需求表为多对1(N:1)联系。在本实施例中,所述数据标签业务逻辑表命名为[tags_expr_tab],用于确定数据标签和标签因子的逻辑关系、数据标签别名以及是否可聚合,包括至少数据标签表达式定义及类型(控制在TAB或者COL上)。在本实施例中,所述数据标签业务逻辑表至少包括数据标签业务逻辑标识(expr_id),业务逻辑类型(expr_type)、业务逻辑因子(expr_factor)及有效性判定(is_validate)。在本申请的其他实施方式中,数据标签业务逻辑表还可以进一步包括聚合维度判定(is_aggregate)等。
数据标签需求表与数据标签容器表为1对1联系。在本实施例中,所述数据标签需求表命名为[tags_demand_tab],用于确定数据标签的表达式列表及标签聚合的表达式列表,同时定义数据标签的数据存放位置。在本实施例中,所述数据标签需求表至少包括数据标签业务逻辑标识(expr_id),聚合业务逻辑标识(aggre_expr_id)、数据标签容器表标识(target_tab_id)及有效性判定(is_validate),用于判断所述表达式以及所述存放位置是否有效。在本申请的其他实施方式中,数据标签需求表还可以进一步包括其他数据标签数据信息。
基础标签容器表与数据标签因子逻辑表为多对多(M:N)联系。在本实施例中,所述基础标签容器表命名为[tags_src_tab],用于确定基础标签的具体存放位置。在本实施例中,所述基础标签容器表至少包括该表的标识(tab_id)、表名(tab_name)及有效性判定(is_validate)。在本申请的其他实施方式中,基础标签容器表还可以进一步包括其他基础标签数据信息。
基础标签融合表与数据标签因子逻辑表为多对多(M:N)联系。在本实施例中,所述基础标签容器表命名为[tags_join_tab],用于确定基础标签的数据融合方式,即确定通过自然关联,或者外关联、字段关联之一者进行关联及其关联条件。在本实施例中,所述基础标签融合表至少包括左表标识(left_tab_id)、右表标识(right_tab_id)、融合类型(join_type)及有效性判定(is_validate)。在本申请的其他实施方式中,基础标签融合表还可以进一步包括其他基础标签融合数据信息。
数据标签容器表与数据标签需求表为1对1(1:1)联系。在本实施例中,所述数据标签容器表命名为[tags_target_tab],用于确定数据标签的具体存放位置。在本实施例中,所述数据标签容器表至少包括该表的标识(tab_id)、表名(tab_name)、表类型(tab_type)、及有效性判定(is_validate)。在本申请的其他实施方式中,数据标签容器表还可以进一步包括例如分区判定(is_partition)、分区名(partition_name)、分区期间(partition_period)等其他数据标签数据信息。
数据标签质量表与数据标签需求表为1对1(1:1)联系。在本实施例中,所述数据标签容器表命名为[tags_quality_tab],用于确定数据标签的数据质量。在本实施例中,所述数据标签质量表至少包括数据标签需求表的标识(demand_id)、数据标签质量表名(qa_name)及表值(qa_value)。在本申请的其他实施方式中,数据标签质量表还可以进一步包括其他数据标签的质量数据信息。
应当说明的是,在本实施例中,前述各表均设置为相应的预设的数据标签信息参数经逻辑设置后的,适于标准化SQL操作的ANSI SQL列表。进一步地,对前述各ANSI SQL表及其具体参数进行物理设置。在本实施例中,在所有列表中均设置主键标识(id);数据标签创建时间记录(gmt-created),以获取所述数据标签创建时间参数;以及数据标签修改时间记录(gmt-modified),以获取所述数据标签修改时间参数。在本实施例中,前述各表中的数据标签参数均设置为字符串(STRING)类型,主键标识设置为整数(INT)类型,所述数据标签创建及修改时间记录设置为日期(DATE)类型。在本申请的其他实施方式中,所述参数的字符类型设置可以依据实际需求以及平台要求予以变通,本实施例中所列举的上述方式不应视为对本申请的任何限制或约束。
为简明阐述本申请之要旨,以详细阐明本实施例中各模块的关系及功能,请同时参阅图1与图2,图2所示为图1中数据标签组织***中模块121的子模块示意图。在本实施例中,预先设定的元数据以及数据标签参数均支持SQL类型设定,并以相应的列表形式存储于可运行SQL的计算机硬件、软件及网络中。本实施例仅以ANSI SQL的表类为例予以说明。
在本实施例中,程序模块121进一步包括选择模块1211、源模块1213、条件模块1215、聚合模块1217、***模块1219以及封包模块1220。其中,选择模块1211用于获取所述数据标签信息参数对应的SQL列表的输出字段,以获取所述数据标签的输出字段参数。选择模块1211可通过[select]指令与用户交互。
源模块1213用于获取所述ANSI SQL表格(table)中数据标签的元数据,并根据所述数据标签数据信息确定所述数据标签的关联方式参数,包括动态获得需要关联的表格,并依据前述的元数据信息动态获得所述表格的正确关联顺序等。源模块1213可通过[from]指令与用户交互。举例而言,根据数据标签需求,需要关联A、B、C、D、E5个表,且AB通过内连接关联,B与D、E通过左外连接关联,B与A、C通过左外连接关联,根据前述E-R图设置,以及相应的算法,例如通过有向图的宽度优先搜索算法,遍历所有节点最终得到如下表一所示的五种关联方式:
表一
其中能覆盖所有表格顺序的为最终关联顺序,因而第5种表关联方式会被选择,从而确定其中数据标签的关联方式参数。
条件模块1215用于获取所述ANSI SQL表格中其数据标签的选择条件,确定所述数据标签的过滤规则参数。条件模块1215可通过[where]指令与用户交互。
聚合模块1217用于获取所述ANSL SQL表格中其数据标签的聚合信息,确定所述数据标签的聚合维度参数。聚合模块1217可通过[group]指令与用户交互;。
***模块1219用于依据所述ANSL SQL表格中其数据标签的***确定所述目标表格中数据标签的详细参数。***模块1219可通过[group]指令与用户交互。
封包模块1220用于控制所述选择模块1211、源模块1213、条件模块1215、聚合模块1217以及***模块1219依据前述数据标签的输出字段、数据标签关联方式、过滤规则、聚合维度以及目标数据标签的详细参数进行编译,以获得基于标准SQL的SQL语句。封包模块1220可通过[package]指令与用户交互。
从而,用户2通过通用的可视化界面与标准ANSI SQL交互,数据标签组织***通过接受标签需求指令,并反馈目标数据标签至用户2。
由此,藉由本申请的数据标签组织***,可以通过一次定义数据业务过滤规则,便可获取各种数据平台中指定的数据标签,从而可满足用户简便、高效、准确地从不同数据平台获取各种数据的要求。
请参阅图5所示,为本申请一实施例中数据标签组织方法的优选流程示意图。请同时参阅图1~图5,下文结合图1~图4的数据标签组织***对图5予以阐明。
在本实施例中,所述数据标签组织方法包括以下步骤:
步骤100,申请数据标签。在本实施例中,所述申请的数据标签系通过所述数据标签申请模块根据用户指令申请所需业务数据标签。
步骤200,定义元数据信息。在本实施例中,所述元数据信息系通过所述数据标签定义模块定义,定义所述元数据信息包括构建数据标签实体-联系图(EntityRelationship Diagram,E-R图),并依据该E-R图定义数据标签参数逻辑设置的SQL列表以及物理设置。
请配合参阅图6,所示为图5中步骤200的优选流程示意图。在本申请的另一优选实施例中,所述步骤200进一步包括依据所述元数据信息定义预设数据标签信息的步骤,具体地:
步骤2001,定义数据标签数据源,以确定基础数据标签的存储信息。在本实施例中,所述数据标签数据源藉由经逻辑设置的基础标签容器表实现。在本实施例中,所述经逻辑设置的对应数据标签参数列表均为适用于ANSI SQL的参数列表,其中相应的数据标签参数均设置为字符串(STRING)类型,其具体实现方式请参阅前文结合图1、图2、图3及图4的具体阐述,在此不再赘述。
步骤2003,定义数据标签融合方式,以确定所述基础数据标签的融合方式。在本实施例中,所述数据标签的融合方式藉由经逻辑设置的数据标签融合表实现。其具体实现方式亦请参阅前述,在此不再赘述。
步骤2005,定义数据标签因子逻辑,以确定所述数据标签与基础数据标签的关系及所述基础数据标签的过滤规则。在本实施例中,所述数据标签因子逻辑由经逻辑设置的数据标签因子逻辑表实现。其具体实现方式亦请参阅前述,在此不再赘述。
步骤2007,定义数据标签的业务逻辑,以确定所述数据标签与所述数据标签因子的业务逻辑联系。在本实施例中,所述数据标签的业务逻辑藉由经逻辑设置的数据标签业务逻辑表实现。其具体实现方式亦请参阅前述,在此不再赘述。
步骤2009,定义所申请的数据标签需求,以确定所申请的数据标签与所述数据标签聚合的表达参数。在本实施例中,定义所申请的数据标签需求还进一步确定了数据标签的数据存储位置。所述数据标签的聚合维度藉由经逻辑设置的数据标签需求表实现。其具体实现方式亦请参阅前述,在此不再赘述。
步骤2011,定义数据标签容器,以确定所述数据标签的存储位置。在本实施例中,所述数据标签容器藉由经逻辑设置的数据标签容器表实现。其具体实现方式请参阅前述,在此不再赘述。
步骤2013,定义数据标签质量,以确定所述数据标签的数据质量符合所述元数据信息的要求。在本实施例中,所述数据标签质量藉由经逻辑设置的数据标签质量表实现。其具体实现方式亦请参阅前述,在此不再赘述。
优选地,在本申请的另一实施例中,还可对前述经定义的数据标签参数及其相应SQL列表进行物理设置,所述物理设置内容参阅前述,在此不再赘述。所述物理设置还进一步包括以下步骤:
步骤2015,定义所述SQL表的主键标识。在本实施例中,步骤2001~2013的预设数据标签信息参数藉由经逻辑设置的相应SQL参数列表实现,则本实施例中,所述主键标识相应设置于所述数据标签信息参数SQL表中,且所述主键标识设置为整数(INT)类型,以便用户与所述数据标签组织***交互,及对相应列表进行维护。
步骤2017,定义数据标签创建时间记录,以获取所述数据标签创建时间参数,以便对相应SQL表进行维护。
步骤2019,定义数据标签创建时间记录,以获取所述数据标签创建时间参数,以便对相应SQL表进行维护。在本实施例中,所述数据标签创建及修改时间记录设置为日期(DATE)类型。
步骤300,依据所述元数据信息将所需业务数据标签编译为基于标准SQL的SQL语句。
请配合参阅图7,所示为本申请另一实施例中的步骤300的优选流程示意图。在本申请的另一优选实施例中,所述步骤300进一步包括依据所述预设数据标签信息将所需业务数据标签编译为基于标准SQL的SQL语句的步骤,具体地:
步骤3001,获取所述数据标签的输出字段参数。在本实施例中,该步骤通过选择模块1211获取所述数据标签的输出字段参数。所述选择模块的具体工作方式请参阅前文阐述,在此不再赘述。
步骤3003,获取所述数据标签的元数据,并根据所述预设数据标签信息确定所述数据标签的关联方式参数。在本实施例中,源模块1213用于获取所述数据标签的元数据,并根据所述预设数据标签信息确定所述数据标签的关联方式参数。包括动态获得需要关联的表格,并依据前述的元数据信息动态获得所述表格的正确关联顺序等,其具体工作方式请参阅前文阐述,在此不再赘述。
步骤3005,获取所述数据标签的选择条件,确定所述数据标签的过滤规则参数。在本实施例中,条件模块1215用于获取数据标签的选择条件,确定所述数据标签的过滤规则参数,其具体工作方式请参阅前文阐述,在此不再赘述。
步骤3007,获取所述数据标签的聚合信息,确定所述数据标签的聚合维度参数。在本实施例中,聚合模块1217用于获取所述ANSL SQL表格中其数据标签的聚合信息,确定所述数据标签的聚合维度参数,其具体工作方式请参阅前文阐述,在此不再赘述。
步骤3009,依据所述数据标签的***确定所述目标数据标签的详细参数。在本实施例中,聚合模块1217用于获取所述ANSL SQL表格中其数据标签的聚合信息,确定所述数据标签的聚合维度参数,其具体工作方式请参阅前文阐述,在此不再赘述。
步骤3011,依据所述数据标签的***确定所述数据标签的详细参数。在本实施例,封包模块1220用于控制所述选择模块1211、源模块1213、条件模块1215、聚合模块1217以及***模块1219依据前述数据标签的输出字段、数据标签关联方式、过滤规则、聚合维度以及目标数据标签的详细参数进行编译,以获得所述标准化SQL。其具体工作方式请参阅前文阐述,在此不再赘述。
有鉴于此,用户2通过通用的可视化界面与标准ANSI SQL交互,通过所述数据标签组织方法接受标签需求指令,并反馈目标数据标签至用户2。
进一步地,在本申请的又一优选实施例中,还包括步骤400,以执行并存储所述编译后的基于标准SQL的SQL语句。
从上述可知,藉由本申请的数据标签组织***及方法,可以通过一次定义数据业务过滤规则,便可自动获取各种数据平台中指定的数据标签,从而可满足用户简便、高效、准确地从不同数据平台获取各种数据的要求。
上文中,参照附图描述了本申请的具体实施方式。但是,本领域中的普通技术人员能够理解,在不偏离本申请的精神和范围的情况下,还可以对本申请的具体实施方式作各种变更和替换。这些变更和替换都落在本申请权利要求书所限定的范围内。

Claims (7)

1.一种数据标签组织***,用于可进行数据标签交互的数据平台,以依据用户需求获取指定的数据标签,其特征在于,所述数据标签组织***包括:
数据标签申请模块,用于根据用户指令申请所需业务数据标签;以及数据标签定义模块,用于依据元数据信息定义预设数据标签信息;
程序模块,用于依据所述预设数据标签信息将所需业务数据标签编译为基于标准SQL的SQL语句;
其中,所述预设数据标签信息定义如下:
数据标签数据源,用于确定基础数据标签的存储信息;
数据标签融合方式,用于确定所述基础数据标签的融合方式;
数据标签因子逻辑,用于确定所述数据标签与基础数据标签的关系及所述基础数据标签的过滤规则;
数据标签的业务逻辑,用于确定所述数据标签与所述数据标签因子的业务逻辑联系;
所申请的数据标签需求,用于确定所申请的数据标签与数据标签的聚合维度;
数据标签容器,用于确定所述数据标签的存储位置;以及
数据标签质量,用于确定所述数据标签的数据质量符合所述元数据信息的要求。
2.根据权利要求1所述的数据标签组织***,其特征在于,所述数据标签组织***还包括执行存储模块,用于执行并存储编译后的基于标准SQL的SQL语句。
3.根据权利要求1所述的数据标签组织***,其特征在于,所述程序模块还包括:
选择模块,用于获取所述数据标签的输出字段参数;
源模块,用于获取所述数据标签的元数据,并根据所述预设数据标签信息确定所述数据标签的关联方式参数;
条件模块,用于获取所述数据标签的选择条件,确定所述数据标签的过滤规则参数;
聚合模块,用于获取所述数据标签的聚合信息,确定所述数据标签的聚合维度参数;
***模块,用于依据所述数据标签的***确定所述数据标签的详细参数;以及
封包模块,用于控制所述选择模块、源模块、条件模块、聚合模块以及***模块进行编译,以获得所述基于标准SQL的SQL语句。
4.一种数据标签组织方法,用于可进行数据标签交互的数据平台,以依据用户需求获取指定的数据标签,其特征在于,所述数据标签组织方法包括:
申请数据标签;
定义元数据信息;以及
依据所述元数据信息定义预设数据标签信息;以及
依据所述预设数据标签信息将所需业务数据标签编译为基于标准SQL的SQL语句;
其中,所述预设数据标签信息定义如下:
数据标签数据源,用于确定基础数据标签的存储信息;
数据标签融合方式,用于确定所述基础数据标签的融合方式;
数据标签因子逻辑,用于确定所述数据标签与基础数据标签的关系及所述基础数据标签的过滤规则;
数据标签的业务逻辑,用于确定所述数据标签与所述数据标签因子的业务逻辑联系;
所申请的数据标签需求,用于确定所申请的数据标签与数据标签的聚合维度;
数据标签容器,用于确定所述数据标签的存储位置;以及
数据标签质量,用于确定所述数据标签的数据质量符合所述元数据信息的要求。
5.根据权利要求4所述的数据标签组织方法,其特征在于,还包括:
执行并存储编译后的基于标准SQL的SQL语句。
6.根据权利要求4所述的数据标签组织方法,其特征在于,上述依据所述预设数据标签信息将所需求的业务数据标签编译为基于标准SQL的SQL语句还包括:
获取所述数据标签的输出字段参数;
获取所述数据标签的元数据,并根据所述预设数据标签信息确定所述数据标签的关联方式参数;
获取所述数据标签的选择条件,确定所述数据标签的过滤规则参数;
获取所述数据标签的聚合信息,确定所述数据标签的聚合维度参数;
依据所述数据标签的***确定所述数据标签的详细参数;以及
依据所述数据标签的输出字段参数、关联方式参数、过滤规则参数、聚合维度参数以及详细参数进行编译,以获得所述基于标准SQL的SQL语句。
7.根据权利要求4所述的数据标签组织方法,其特征在于,上述依据所述元数据信息定义预设数据标签信息进一步包括:
设置所述数据标签的信息参数SQL列表,并定义其主键标识;
定义数据标签创建时间记录,以获取所述数据标签的创建时间参数;以及
定义数据标签修改时间记录,以获取所述数据标签的修改时间参数。
CN201410624275.2A 2014-11-06 2014-11-06 一种数据标签组织***及组织方法 Active CN105630475B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410624275.2A CN105630475B (zh) 2014-11-06 2014-11-06 一种数据标签组织***及组织方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410624275.2A CN105630475B (zh) 2014-11-06 2014-11-06 一种数据标签组织***及组织方法

Publications (2)

Publication Number Publication Date
CN105630475A CN105630475A (zh) 2016-06-01
CN105630475B true CN105630475B (zh) 2018-12-21

Family

ID=56045465

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410624275.2A Active CN105630475B (zh) 2014-11-06 2014-11-06 一种数据标签组织***及组织方法

Country Status (1)

Country Link
CN (1) CN105630475B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108874971B (zh) * 2018-06-07 2021-09-24 北京赛思信安技术股份有限公司 一种应用于海量标签化实体数据存储的工具和方法
CN108809770A (zh) * 2018-07-26 2018-11-13 郑州云海信息技术有限公司 一种资源监控方法和***
CN109063151B (zh) * 2018-08-08 2022-07-12 中国建设银行股份有限公司 一种商业银行数据融合方法及装置
CN109189774A (zh) * 2018-09-14 2019-01-11 南威软件股份有限公司 一种基于脚本规则的用户标签转化方法及***
CN110765100B (zh) * 2019-09-09 2022-08-02 天云软件技术有限公司 标签的生成方法、装置、计算机可读存储介质及服务器
CN111858280B (zh) * 2020-07-16 2024-02-27 中国工商银行股份有限公司 一种sql信息处理方法、装置、设备及***
CN112785368A (zh) * 2020-12-24 2021-05-11 江苏苏宁云计算有限公司 一种标签生产方法、管理方法、装置及***
CN116361341B (zh) * 2023-03-20 2024-02-13 北京白驹易行科技有限公司 一种人群包圈选方法、装置、计算机设备及介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040254948A1 (en) * 2003-06-12 2004-12-16 International Business Machines Corporation System and method for data ETL in a data warehouse environment
CN101076793A (zh) * 2004-08-31 2007-11-21 国际商业机器公司 企业数据集成***的体系结构
CN101324846A (zh) * 2008-07-08 2008-12-17 国电南瑞科技股份有限公司 根据asn.1信息动态创建数据模型的方法
CN101788992A (zh) * 2009-05-06 2010-07-28 厦门东南融通***工程有限公司 一种数据库查询语句的转换方法和转换***
CN102254008A (zh) * 2011-07-18 2011-11-23 深圳证券信息有限公司 动态数据标签的设置方法和***
CN103177008A (zh) * 2011-12-22 2013-06-26 北大方正集团有限公司 一种生成及执行sql语句的方法和***
CN103559243A (zh) * 2013-10-28 2014-02-05 陶睿 一种在移动设备中基于标签搜索用户的方法及***

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040254948A1 (en) * 2003-06-12 2004-12-16 International Business Machines Corporation System and method for data ETL in a data warehouse environment
CN101076793A (zh) * 2004-08-31 2007-11-21 国际商业机器公司 企业数据集成***的体系结构
CN101324846A (zh) * 2008-07-08 2008-12-17 国电南瑞科技股份有限公司 根据asn.1信息动态创建数据模型的方法
CN101788992A (zh) * 2009-05-06 2010-07-28 厦门东南融通***工程有限公司 一种数据库查询语句的转换方法和转换***
CN102254008A (zh) * 2011-07-18 2011-11-23 深圳证券信息有限公司 动态数据标签的设置方法和***
CN103177008A (zh) * 2011-12-22 2013-06-26 北大方正集团有限公司 一种生成及执行sql语句的方法和***
CN103559243A (zh) * 2013-10-28 2014-02-05 陶睿 一种在移动设备中基于标签搜索用户的方法及***

Also Published As

Publication number Publication date
CN105630475A (zh) 2016-06-01

Similar Documents

Publication Publication Date Title
CN105630475B (zh) 一种数据标签组织***及组织方法
CN110674228B (zh) 数据仓库模型构建和数据查询方法、装置及设备
US11138169B2 (en) Method and system for migrating content between enterprise content management systems
EP3353672B1 (en) Method and apparatus for transferring data between databases
CN105183735B (zh) 数据的查询方法及查询装置
US10268633B2 (en) System and method for database migration with target platform scalability
US9542469B2 (en) Data warehouse data model adapters
CN108959510B (zh) 一种分布式数据库的分区级连接方法和装置
US8364723B1 (en) Apparatus and method for realizing big data into a big object and non-transitory tangible machine-readable medium thereof
CN110895544B (zh) 一种接口数据处理方法、装置、***及存储介质
CN111813804A (zh) 一种数据查询方法、装置、电子设备及存储介质
CN112487083A (zh) 一种数据校验方法和设备
CN112015754A (zh) 数据查询方法、装置与***
CN114297204A (zh) 一种异构数据源的数据存储、检索方法及装置
CN108241622B (zh) 一种查询脚本的生成方法及装置
CN111078905A (zh) 一种数据处理方法、装置、介质以及设备
US11100131B2 (en) Simulation of a synchronization of records
CN114138745A (zh) 数据的集成方法、装置、存储介质及处理器
CN108228604B (zh) 基于内存对象的模型构建方法、信息查询方法及装置
CN112948389A (zh) 基于md5的数据库表数据比对方法及设备
CN108062329B (zh) 一种数据导入方法及装置
CN114880394B (zh) 一种sql脚本的共享方法、设备及介质
CN110019448A (zh) 一种数据交互方法及装置
Gajendra Product recall in supply chain management using Neo4j graph database
CN114138646A (zh) Cad资源的验证方法及装置、存储介质和处理器

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20211104

Address after: Room 507, floor 5, building 3, No. 969, Wenyi West Road, Wuchang Street, Yuhang District, Hangzhou City, Zhejiang Province

Patentee after: ZHEJIANG TMALL TECHNOLOGY Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Patentee before: ALIBABA GROUP HOLDING Ltd.