CN114925092B - 一种数据处理方法、装置、电子设备及存储介质 - Google Patents

一种数据处理方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN114925092B
CN114925092B CN202210498840.XA CN202210498840A CN114925092B CN 114925092 B CN114925092 B CN 114925092B CN 202210498840 A CN202210498840 A CN 202210498840A CN 114925092 B CN114925092 B CN 114925092B
Authority
CN
China
Prior art keywords
node
nodes
rule
tree
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210498840.XA
Other languages
English (en)
Other versions
CN114925092A (zh
Inventor
李昂
吴兆跃
张型龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN202210498840.XA priority Critical patent/CN114925092B/zh
Publication of CN114925092A publication Critical patent/CN114925092A/zh
Application granted granted Critical
Publication of CN114925092B publication Critical patent/CN114925092B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24564Applying rules; Deductive queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开关于一种数据处理方法、装置、电子设备及存储介质,包括:根据预先获取的数据处理规则,生成初始规则树;对初始规则树中的节点进行遍历,根据对应的标签规则,对父节点相同的叶子节点进行合并处理,得到简化规则树;依次确定目标计算引擎,并按照由上到下的顺序,对简化规则树中的节点进行遍历,在任一未标记的节点满足目标计算引擎的适用条件情况下,将任一未标记的节点标记为目标计算引擎的计算节点,直至简化规则树中的根节点标记完成;将简化规则树转换为执行计划树;基于执行计划树,对待处理数据进行处理,得到处理结果。这样,基于多种计算引擎的特点,对不同节点选择合适的计算引擎,从而提升计算速度和资源利用率。

Description

一种数据处理方法、装置、电子设备及存储介质
技术领域
本公开涉及数据分析领域,尤其涉及一种数据处理方法、装置、电子设备及存储介质。
背景技术
在很多业务场景中,业务人员需要根据自定义规则,通过指定标签名、运算符、标签值等信息,根据不同对象的对象属性圈选出对象群,进而可以对对各对象群开展相应的业务活动。
现有的技术方案,在进行对象圈选时,使用hive sql(hive Structured QueryLanguage,基于hive存储引擎的结构化查询语言)方式,将所有的圈选条件拼接为一个sql语句,执行sql语句后得到最终结果。
但是,对于复杂的圈选规则,会拼接为一条较长的sql语句,其中会嵌套多个查询,使用hive引擎进行查询,少则1-2小时,多则10多个小时,查询速度慢,而且资源占用情况严重,可能造成其他查询的阻塞。
发明内容
本公开提供一种数据处理方法、装置、电子设备及存储介质,以至少解决相关技术中查询速度慢,而且资源占用情况严重,可能造成其他查询的阻塞的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种数据处理方法,包括:
根据预先获取的数据处理规则,生成初始规则树,其中,所述数据处理规则包括至少一项标签规则及所述标签规则之间的逻辑关系,所述初始规则树中包括叶子节点及非叶子节点,所述叶子节点用于表征所述标签规则,所述非叶子节点用于表征所连接的子节点之间的逻辑关系;
按照由下到上的顺序,对所述初始规则树中的节点进行遍历,根据对应的标签规则,对父节点相同的叶子节点进行合并处理,得到简化规则树;
按照预设优先级顺序,依次确定目标计算引擎,并按照由上到下的顺序,对所述简化规则树中的节点进行遍历,在任一未标记的节点满足所述目标计算引擎的适用条件情况下,将所述任一未标记的节点标记为所述目标计算引擎的计算节点,直至所述简化规则树中的根节点标记完成;
根据所述节点标记,将所述简化规则树转换为执行计划树,所述执行计划树的叶子节点用于表征计算单元,所述执行计划树的非叶子节点用于表征所连接的子节点之间的逻辑关系;
基于所述执行计划树,对待处理数据进行处理,得到处理结果。
可选的,所述按照由下到上的顺序,对所述初始规则树中的节点进行遍历,根据对应的标签规则,对父节点相同的叶子节点进行合并处理,得到简化规则树,包括:
按照由下到上的顺序,对所述初始规则树中的节点进行遍历,将当前遍历到的节点作为目标节点;
在所述目标节点的子节点中包括多个叶子节点的情况下,获取所包括的叶子节点对应的标签规则,所述标签规则包括标签名、运算规则及标签值;
将所包括的叶子节点中标签名相同的节点作为候选节点,在所述候选节点的运算规则及标签值满足合并条件的情况下,对所述候选节点进行合并,得到简化规则树。
可选的,所述按照由上到下的顺序,对所述简化规则树中的节点进行遍历,在任一未标记的节点满足所述目标计算引擎的适用条件情况下,将所述任一未标记的节点标记为所述目标计算引擎的计算节点,直至所述简化规则树中的根节点标记完成,包括:
按照由上到下的顺序,对所述简化规则树中的节点进行遍历,将当前遍历到的节点作为目标节点;
在所述目标节点未标记的情况下,若所述目标节点满足所述目标计算引擎的适用条件,则将所述目标节点标记为所述目标计算引擎的计算节点;
在所述目标节点已标记的情况下,遍历下一节点,直至不存在未标记的子节点,对根节点进行标记处理。
可选的,在所述目标节点未标记的情况下,若所述目标节点不满足所述目标计算引擎的适用条件,还包括:
在所述目标节点的下层节点满足所述目标计算引擎的调整条件的情况下,将满足所述调整条件的下层节点合并为所述目标节点的合并子节点,并将所述合并子节点标记为所述目标计算引擎的计算节点。
可选的,所述根据所述节点标记,将所述简化规则树转换为执行计划树,包括:
根据所述节点标记,将所述简化规则树中的任一节点转换为所述任一节点对应的计算引擎的执行节点,得到执行计划树。
根据本公开实施例的第二方面,提供一种数据处理装置,包括:
生成单元,被配置为执行根据预先获取的数据处理规则,生成初始规则树,其中,所述数据处理规则包括至少一项标签规则及所述标签规则之间的逻辑关系,所述初始规则树中包括叶子节点及非叶子节点,所述叶子节点用于表征所述标签规则,所述非叶子节点用于表征所连接的子节点之间的逻辑关系;
合并单元,被配置为执行按照由下到上的顺序,对所述初始规则树中的节点进行遍历,根据对应的标签规则,对父节点相同的叶子节点进行合并处理,得到简化规则树;
标记单元,被配置为执行按照预设优先级顺序,依次确定目标计算引擎,并按照由上到下的顺序,对所述简化规则树中的节点进行遍历,在任一未标记的节点满足所述目标计算引擎的适用条件情况下,将所述任一未标记的节点标记为所述目标计算引擎的计算节点,直至所述简化规则树中的根节点标记完成;
转换单元,被配置为执行根据所述节点标记,将所述简化规则树转换为执行计划树,所述执行计划树的叶子节点用于表征计算单元,所述执行计划树的非叶子节点用于表征所连接的子节点之间的逻辑关系;
处理单元,被配置为执行基于所述执行计划树,对待处理数据进行处理,得到处理结果。
可选的,所述合并单元,被配置为执行:
按照由下到上的顺序,对所述初始规则树中的节点进行遍历,将当前遍历到的节点作为目标节点;
在所述目标节点的子节点中包括多个叶子节点的情况下,获取所包括的叶子节点对应的标签规则,所述标签规则包括标签名、运算规则及标签值;
将所包括的叶子节点中标签名相同的节点作为候选节点,在所述候选节点的运算规则及标签值满足合并条件的情况下,对所述候选节点进行合并,得到简化规则树。
可选的,所述标记单元,还被配置为执行:
按照由上到下的顺序,对所述简化规则树中的节点进行遍历,将当前遍历到的节点作为目标节点;
在所述目标节点未标记的情况下,若所述目标节点满足所述目标计算引擎的适用条件,则将所述目标节点标记为所述目标计算引擎的计算节点;
在所述目标节点已标记的情况下,遍历下一节点,直至不存在未标记的子节点,对根节点进行标记处理。
可选的,所述标记单元,还被配置为执行:
在所述目标节点未标记的情况下,若所述目标节点不满足所述目标计算引擎的适用条件,则在所述目标节点的下层节点满足所述目标计算引擎的调整条件的情况下,将满足所述调整条件的下层节点合并为所述目标节点的合并子节点,并将所述合并子节点标记为所述目标计算引擎的计算节点。
可选的,所述转换单元,被配置为执行:
根据所述节点标记,将所述简化规则树中的任一节点转换为所述任一节点对应的计算引擎的执行节点,得到执行计划树。
根据本公开实施例的第三方面,提供一种数据处理电子设备,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现上述任一项所述的数据处理方法。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,当所述计算机可读存储介质中的指令由数据处理电子设备的处理器执行时,使得数据处理电子设备能够执行上述任一项所述的数据处理方法。
根据本公开实施例的第五方面,提供一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现上述任一项所述的数据处理方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
根据预先获取的数据处理规则,生成初始规则树,其中,数据处理规则包括至少一项标签规则及标签规则之间的逻辑关系,初始规则树中包括叶子节点及非叶子节点,叶子节点用于表征标签规则,非叶子节点用于表征所连接的子节点之间的逻辑关系;按照由下到上的顺序,对初始规则树中的节点进行遍历,根据对应的标签规则,对父节点相同的叶子节点进行合并处理,得到简化规则树;按照预设优先级顺序,依次确定目标计算引擎,并按照由上到下的顺序,对简化规则树中的节点进行遍历,在任一未标记的节点满足目标计算引擎的适用条件情况下,将任一未标记的节点标记为目标计算引擎的计算节点,直至简化规则树中的根节点标记完成;根据节点标记,将简化规则树转换为执行计划树,执行计划树的叶子节点用于表征计算单元,执行计划树的非叶子节点用于表征所连接的子节点之间的逻辑关系;基于执行计划树,对待处理数据进行处理,得到处理结果。
这样,基于多种计算引擎的特点,在不改变运算结果的前提下,对初始规则树中的节点进行合并、拆分、移动等结构调整,对不同节点选择合适的计算引擎,分别执行,得到数据处理结果,从而可以充分发挥各个计算引擎的优势,提升计算速度和资源利用率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种数据处理方法的流程图。
图2是根据一示例性实施例中,对初始规则树进行合并处理,得到简化规则树的流程示意图。
图3是根据一示例性实施例中,对简化规则树进行标记的流程示意图。
图4是根据一示例性实施例示出的一种逻辑示意图。
图5是根据一示例性实施例示出的一种数据处理装置的框图。
图6是根据一示例性实施例示出的一种用于数据处理的电子设备的框图。
图7是根据一示例性实施例示出的一种用于数据处理的装置的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种数据处理方法的流程图,如图1所示,该数据处理方法包括以下步骤。
在步骤S11中,根据预先获取的数据处理规则,生成初始规则树,其中,数据处理规则包括至少一项标签规则及标签规则之间的逻辑关系,初始规则树中包括叶子节点及非叶子节点,叶子节点用于表征标签规则,非叶子节点用于表征所连接的子节点之间的逻辑关系。
其中,标签是指用于进行数据处理的数据项,举例而言,在对象群圈选业务中,标签可以是指对象的属性,例如性别、年龄、兴趣,也就是说,标签规则是指用于进行数据处理的条件,业务人员进行规则圈选时,会指定标签名、运算符、标签值,比如,对象的年龄范围等等。一次圈选可以包含多个标签,多个标签间可以有交、并、差以及嵌套的组合关系。
在本公开中,通过解析业务人员输入的数据处理规则,可以将标签规则转封装为叶子节点,将标签间条件封装为非叶子节点,递归的组合成一颗初始规则树。在初始规则树中,包括叶子节点及非叶子节点,叶子节点用于表征标签规则,非叶子节点用于表征所连接的子节点之间的逻辑关系,比如,可以将业务人员输入的圈选规则映射为一颗树,树的叶子节点是标签规则,包括标签名、运算符、标签值,非叶子节点是逻辑关系,可以为交、并、差等等。
在步骤S12中,按照由下到上的顺序,对初始规则树中的节点进行遍历,根据对应的标签规则,对父节点相同的叶子节点进行合并处理,得到简化规则树。
一种实现方式中,按照由下到上的顺序,对初始规则树中的节点进行遍历,根据对应的标签规则,对父节点相同的叶子节点进行合并处理,得到简化规则树,包括:
按照由下到上的顺序,对初始规则树中的节点进行遍历,将当前遍历到的节点作为目标节点;在目标节点的子节点中包括多个叶子节点的情况下,获取所包括的叶子节点对应的标签规则,标签规则包括标签名、运算规则及标签值;将所包括的叶子节点中标签名相同的节点作为候选节点,在候选节点的运算规则及标签值满足合并条件的情况下,对候选节点进行合并,得到简化规则树。
如图2所示,为对初始规则树进行合并处理,得到简化规则树的流程示意图。也就是说,如果该节点的子节包含多个叶子节点,并且其中有标签名相同的叶子节点,判断同标签名的叶子节点是否满足合并条件,如果满足,则将满足条件的节点合并为一个节点。例如,条件【性别=男 or 性别=女】可以合并为 【性别 in (男,女)】。
可以理解,经过对初始规则树的遍历,对各个叶子节点表征的标签规则进行了梳理和合并,这样,原本根据初始规则树,两个叶子节点表征不同的标签规则,需要进行两次判断过程,而在本步骤得到的简化规则树中,仅对应了一个叶子节点,也就是只需要一次处理即可得到相同的处理结果,因此,可以进一步提高对象圈选的效率。
在步骤S13中,按照预设优先级顺序,依次确定目标计算引擎,并按照由上到下的顺序,对简化规则树中的节点进行遍历,在任一未标记的节点满足目标计算引擎的适用条件情况下,将任一未标记的节点标记为目标计算引擎的计算节点,直至简化规则树中的根节点标记完成。
其中,计算引擎是指能够使用特定方法在某一存储介质中进行数据处理的工具,在不同的业务中,可以预先生成自定义的计算引擎,进一步提高计算效率,也就是说,计算引擎的适用条件可以自定义进行设置,比如对于clickhouse bitmap(位图)计算引擎,适用于枚举类规则条件,比如对对象的性别、地域等标签的筛选;对于clickhouse sql计算引擎,适用于连续数值类规则条件,比如对对象的支付金额、在线时长等标签的筛选,等等。
其中,bitmap是一种高效的数据结构,使用连续的二进制位(bit)存储,用于对大量整型数据做查询和去重,在索引,数据压缩等方面有广泛应用,Clickhouse则是一种存储引擎,特点是计算速度快,不适合进行复杂计算。
一种实现方式中,本步骤可以包括:
按照由上到下的顺序,对简化规则树中的节点进行遍历,将当前遍历到的节点作为目标节点;在目标节点未标记的情况下,若目标节点满足目标计算引擎的适用条件,则将目标节点标记为目标计算引擎的计算节点;在目标节点已标记的情况下,遍历下一节点,直至不存在未标记的子节点,对根节点进行标记处理。
也就是说,对简化规则树进行遍历,并根据每个节点的具体情况,为该节点选择适用的计算引擎,直到简化规则树中的每个节点都标记完毕,即简化规则树中的每个节点都寻找到了对应的计算引擎,这样,在后续的处理过程中,每个节点的运算都可以调用其适用的计算引擎,适用性越高,则计算效果越快越好,有利于提高对象圈选的效率。
一种实现方式中,在目标节点未标记的情况下,若目标节点不满足目标计算引擎的适用条件,还包括:
在目标节点的下层节点满足目标计算引擎的调整条件的情况下,将满足调整条件的下层节点合并为目标节点的合并子节点,并将合并子节点标记为目标计算引擎的计算节点。其中,调整条件与前述适用条件类似,可以自定义进行设置,本公开对此不作限定。
可以理解,简化规则树为多层树结构,因此,在遍历过程中,在目标节点不满足目标计算引擎的适用条件的情况下,可以进一步遍历目标节点的子节点,以确保每一层的节点都可以确定其适用的计算引擎,从而进一步提高对象圈选的效率。
如图3所示,为对简化规则树进行标记的流程示意图。也就是说,按照优先级由高到低遍历所有自定义计算引擎,对于每个计算引擎,自顶向下遍历简化规则树。对于简化规则树的每个节点,进行以下逻辑处理:判断该节点是否标记完毕,如果没有,继续判断是否适用当前计算引擎,如果适用,则标记当前节处理完毕,并标记为当前计算引擎处理。如果当前节点不适用,并且当前节点包含子节点,尝试对当前节点下层节点进行调整,将满足条件的下层节点合并为当前节点的一个子节点,标记处理完毕且为当前计算引擎处理。如果当前节点所有子节点标记完毕,则标记当前节点处理完毕。循环进行标记调整,直至根节点标记完毕,退出循环。
在步骤S14中,根据节点标记,将简化规则树转换为执行计划树,执行计划树的叶子节点用于表征计算单元,执行计划树的非叶子节点用于表征所连接的子节点之间的逻辑关系。
一种实现方式中,根据节点标记,将简化规则树转换为执行计划树,包括:
根据节点标记,将简化规则树中的任一节点转换为任一节点对应的计算引擎的执行节点,得到执行计划树。
也就是说,遍历简化规则树,对标记了计算引擎的节点,转换为执行计划节点,其中,执行计划节点是计算引擎能够直接识别的计算单元,执行计划树的叶子节点为计算单元,非叶子节点为逻辑关系,这样,便于后续对执行计划树的处理,进一步提高对象圈选效率。
在步骤S15中,基于执行计划树,对待处理数据进行处理,得到处理结果。
在本步骤中,进行数据处理时,通过遍历执行计划树的叶子节点,利用自定义执行引擎执行计算单元,得到子结果。根据执行计划树的运算规则,将子结果递归的汇集成为最终结果。
这样,通过对初始规则树的结构调整,得到简化规则树,简化规则树相比于初始规则树的复杂度较低,进而,按照不同的适用的计算引擎,将简化规则树中的节点进行聚合,得到执行计划树,进一步提高了对象圈选的效率。
如图4所示,为本方案的逻辑示意图。相比于传统hive sql方式,将本方案应用于对象圈选业务中,对象圈选的平均速度从2小时减低到5分钟,大大提升了计算速度和资源利用率。
具体来说,首先,可以根据对象圈选规则,生成初始规则树,其中,“relation”节点为非叶子节点,用于表征所连接的子节点之间的逻辑关系,“label”节点为叶子节点,用于表征标签规则。然后,可以按照由下到上的顺序,对初始规则树中的节点进行遍历,根据对应的标签规则,对父节点相同的叶子节点进行合并处理,得到简化规则树,如图4所示,虚线内的两个“label”节点表示可以进行合并处理的两个叶子节点,将这两个叶子节点合并之后,就得到了简化规则树。进而,按照预设优先级顺序,依次确定目标计算引擎,并按照由上到下的顺序,对简化规则树中的节点进行遍历,在任一未标记的节点满足目标计算引擎的适用条件情况下,将任一未标记的节点标记为目标计算引擎的计算节点,直至简化规则树中的根节点标记完成,如图4所示,虚线内的“relation”节点及其对应的“label”叶子节点,以及另一侧的“label”叶子节点,均为计算引擎“engine 1”适用的节点,基于此,可以对这三个节点和适用于其他计算引擎的节点分开进行标记。接着,根据节点标记,将简化规则树转换为执行计划树,执行计划树的叶子节点用于表征计算单元,执行计划树的非叶子节点用于表征所连接的子节点之间的逻辑关系,如图4所示,简化规则树中计算引擎标记相同的节点对应执行计划树中的一个节点,每个节点由不同的计算单元进行处理,分别为calculate1、calculate2和calculate3。最后,可以基于执行计划树,对待处理数据进行处理,得到处理结果,具体来说,先分别得到每个计算单元对应的计算结果sub result,然后,对计算结果进行汇聚,就可以得到对象圈选规则对应的处理结果final result。
由以上可见,本公开的实施例提供的技术方案,基于多种计算引擎的特点,在不改变运算结果的前提下,对初始规则树中的节点进行合并、拆分、移动等结构调整,对不同节点选择合适的计算引擎,分别执行,得到数据处理结果,从而可以充分发挥各个计算引擎的优势,提升计算速度和资源利用率。
图5是根据一示例性实施例示出的一种数据处理装置框图,该装置包括:
生成单元,被配置为执行根据预先获取的数据处理规则,生成初始规则树,其中,所述数据处理规则包括至少一项标签规则及所述标签规则之间的逻辑关系,所述初始规则树中包括叶子节点及非叶子节点,所述叶子节点用于表征所述标签规则,所述非叶子节点用于表征所连接的子节点之间的逻辑关系;
合并单元,被配置为执行按照由下到上的顺序,对所述初始规则树中的节点进行遍历,根据对应的标签规则,对父节点相同的叶子节点进行合并处理,得到简化规则树;
标记单元,被配置为执行按照预设优先级顺序,依次确定目标计算引擎,并按照由上到下的顺序,对所述简化规则树中的节点进行遍历,在任一未标记的节点满足所述目标计算引擎的适用条件情况下,将所述任一未标记的节点标记为所述目标计算引擎的计算节点,直至所述简化规则树中的根节点标记完成;
转换单元,被配置为执行根据所述节点标记,将所述简化规则树转换为执行计划树,所述执行计划树的叶子节点用于表征计算单元,所述执行计划树的非叶子节点用于表征所连接的子节点之间的逻辑关系;
处理单元,被配置为执行基于所述执行计划树,对待处理数据进行处理,得到处理结果。
一种实现方式中,所述合并单元,被配置为执行:
按照由下到上的顺序,对所述初始规则树中的节点进行遍历,将当前遍历到的节点作为目标节点;
在所述目标节点的子节点中包括多个叶子节点的情况下,获取所包括的叶子节点对应的标签规则,所述标签规则包括标签名、运算规则及标签值;
将所包括的叶子节点中标签名相同的节点作为候选节点,在所述候选节点的运算规则及标签值满足合并条件的情况下,对所述候选节点进行合并,得到简化规则树。
一种实现方式中,所述标记单元,还被配置为执行:
按照由上到下的顺序,对所述简化规则树中的节点进行遍历,将当前遍历到的节点作为目标节点;
在所述目标节点未标记的情况下,若所述目标节点满足所述目标计算引擎的适用条件,则将所述目标节点标记为所述目标计算引擎的计算节点;
在所述目标节点已标记的情况下,遍历下一节点,直至不存在未标记的子节点,对根节点进行标记处理。
一种实现方式中,所述标记单元,还被配置为执行:
在所述目标节点未标记的情况下,若所述目标节点不满足所述目标计算引擎的适用条件,则在所述目标节点的下层节点满足所述目标计算引擎的调整条件的情况下,将满足所述调整条件的下层节点合并为所述目标节点的合并子节点,并将所述合并子节点标记为所述目标计算引擎的计算节点。
一种实现方式中,所述转换单元,被配置为执行:
根据所述节点标记,将所述简化规则树中的任一节点转换为所述任一节点对应的计算引擎的执行节点,得到执行计划树。
由以上可见,本公开的实施例提供的技术方案,本公开的实施例提供的技术方案,基于多种计算引擎的特点,在不改变运算结果的前提下,对初始规则树中的节点进行合并、拆分、移动等结构调整,对不同节点选择合适的计算引擎,分别执行,得到数据处理结果,从而可以充分发挥各个计算引擎的优势,提升计算速度和资源利用率。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图6是根据一示例性实施例示出的一种用于数据处理的电子设备的框图。
在示例性实施例中,还提供了一种包括指令的计算机可读存储介质,例如包括指令的存储器,上述指令可由电子设备的处理器执行以完成上述方法。可选地,计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供一种计算机程序产品,当其在计算机上运行时,使得计算机实现上述数据处理的方法。
由以上可见,本公开的实施例提供的技术方案,本公开的实施例提供的技术方案,基于多种计算引擎的特点,在不改变运算结果的前提下,对初始规则树中的节点进行合并、拆分、移动等结构调整,对不同节点选择合适的计算引擎,分别执行,得到数据处理结果,从而可以充分发挥各个计算引擎的优势,提升计算速度和资源利用率。
图7是根据一示例性实施例示出的一种用于数据处理的装置800的框图。
例如,装置800可以是移动电话,计算机,数字广播电子设备,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图7,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电力组件806,多媒体组件808,音频组件810,输入/输出(I/ O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件807为装置800的各种组件提供电力。电源组件807可以包括电源管理***,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜***或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/ O接口812为处理组件802和***接口模块之间提供接口,上述***接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到设备800的打开/关闭状态,组件的相对定位,例如所述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,运营商网络(如2G、3G、4G或5G),或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理***的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行第一方面和第二方面所述的方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述方法。可选地,例如,存储介质可以是非临时性计算机可读存储介质,例如,所述非临时性非临时性计算机可读存储介质计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的数据处理方法。
由以上可见,本公开的实施例提供的技术方案,本公开的实施例提供的技术方案,基于多种计算引擎的特点,在不改变运算结果的前提下,对初始规则树中的节点进行合并、拆分、移动等结构调整,对不同节点选择合适的计算引擎,分别执行,得到数据处理结果,从而可以充分发挥各个计算引擎的优势,提升计算速度和资源利用率。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (9)

1.一种数据处理方法,其特征在于,包括:
根据预先获取的数据处理规则,生成初始规则树,其中,所述数据处理规则包括至少一项标签规则及所述标签规则之间的逻辑关系,所述初始规则树中包括叶子节点及非叶子节点,所述叶子节点用于表征所述标签规则,所述非叶子节点用于表征所连接的子节点之间的逻辑关系,标签是指用于进行数据处理的数据项,所述标签规则是指用于进行数据处理的条件,所述初始规则树是通过解析业务人员输入的所述数据处理规则,将所述标签规则转封装为叶子节点,将所述标签规则之间的逻辑关系封装为非叶子节点,递归组合成的;
按照由下到上的顺序,对所述初始规则树中的节点进行遍历,根据对应的标签规则,对父节点相同的叶子节点进行合并处理,得到简化规则树,包括:按照由下到上的顺序,对所述初始规则树中的节点进行遍历,将当前遍历到的节点作为目标节点,在所述目标节点的子节点中包括多个叶子节点的情况下,获取所包括的叶子节点对应的标签规则,所述标签规则包括标签名、运算规则及标签值,将所包括的叶子节点中标签名相同的节点作为候选节点,在所述候选节点的运算规则及标签值满足合并条件的情况下,对所述候选节点进行合并,得到简化规则树;
按照预设优先级顺序,依次确定目标计算引擎,并按照由上到下的顺序,对所述简化规则树中的节点进行遍历,在任一未标记的节点满足所述目标计算引擎的适用条件情况下,将所述任一未标记的节点标记为所述目标计算引擎的计算节点,直至所述简化规则树中的根节点标记完成,所述目标计算引擎的计算节点通过标记合并子节点得到,所述合并子节点是通过在任一未标记的节点不满足所述目标计算引擎的适用条件,且所述未标记的节点的下层节点满足所述目标计算引擎的调整条件的情况下,将满足所述调整条件的下层节点与所述未标记的节点合并得到的;
根据所述节点标记,将所述简化规则树转换为执行计划树,所述执行计划树的叶子节点用于表征计算单元,所述执行计划树的非叶子节点用于表征所连接的子节点之间的逻辑关系;
基于所述执行计划树,对待处理数据进行处理,得到处理结果。
2.根据权利要求1所述的数据处理方法,其特征在于,所述按照由上到下的顺序,对所述简化规则树中的节点进行遍历,在任一未标记的节点满足所述目标计算引擎的适用条件情况下,将所述任一未标记的节点标记为所述目标计算引擎的计算节点,直至所述简化规则树中的根节点标记完成,包括:
按照由上到下的顺序,对所述简化规则树中的节点进行遍历,将当前遍历到的节点作为目标节点;
在所述目标节点未标记的情况下,若所述目标节点满足所述目标计算引擎的适用条件,则将所述目标节点标记为所述目标计算引擎的计算节点;
在所述目标节点已标记的情况下,遍历下一节点,直至不存在未标记的子节点,对根节点进行标记处理。
3.根据权利要求1所述的数据处理方法,其特征在于,所述根据所述节点标记,将所述简化规则树转换为执行计划树,包括:
根据所述节点标记,将所述简化规则树中的任一节点转换为所述任一节点对应的计算引擎的执行节点,得到执行计划树。
4.一种数据处理装置,其特征在于,包括:
生成单元,被配置为执行根据预先获取的数据处理规则,生成初始规则树,其中,所述数据处理规则包括至少一项标签规则及所述标签规则之间的逻辑关系,所述初始规则树中包括叶子节点及非叶子节点,所述叶子节点用于表征所述标签规则,所述非叶子节点用于表征所连接的子节点之间的逻辑关系,标签是指用于进行数据处理的数据项,所述标签规则是指用于进行数据处理的条件,所述初始规则树是通过解析业务人员输入的所述数据处理规则,将所述标签规则转封装为叶子节点,将所述标签规则之间的逻辑关系封装为非叶子节点,递归组合成的;
合并单元,被配置为执行按照由下到上的顺序,对所述初始规则树中的节点进行遍历,根据对应的标签规则,对父节点相同的叶子节点进行合并处理,得到简化规则树,所述合并单元,被配置为执行:按照由下到上的顺序,对所述初始规则树中的节点进行遍历,将当前遍历到的节点作为目标节点,在所述目标节点的子节点中包括多个叶子节点的情况下,获取所包括的叶子节点对应的标签规则,所述标签规则包括标签名、运算规则及标签值,将所包括的叶子节点中标签名相同的节点作为候选节点,在所述候选节点的运算规则及标签值满足合并条件的情况下,对所述候选节点进行合并,得到简化规则树;
标记单元,被配置为执行按照预设优先级顺序,依次确定目标计算引擎,并按照由上到下的顺序,对所述简化规则树中的节点进行遍历,在任一未标记的节点满足所述目标计算引擎的适用条件情况下,将所述任一未标记的节点标记为所述目标计算引擎的计算节点,直至所述简化规则树中的根节点标记完成,所述目标计算引擎的计算节点通过标记合并子节点得到,所述合并子节点是通过在任一未标记的节点不满足所述目标计算引擎的适用条件,且所述未标记的节点的下层节点满足所述目标计算引擎的调整条件的情况下,将满足所述调整条件的下层节点与所述未标记的节点合并得到的;
转换单元,被配置为执行根据所述节点标记,将所述简化规则树转换为执行计划树,所述执行计划树的叶子节点用于表征计算单元,所述执行计划树的非叶子节点用于表征所连接的子节点之间的逻辑关系;
处理单元,被配置为执行基于所述执行计划树,对待处理数据进行处理,得到处理结果。
5.根据权利要求4所述的数据处理装置,其特征在于,所述标记单元,还被配置为执行:
按照由上到下的顺序,对所述简化规则树中的节点进行遍历,将当前遍历到的节点作为目标节点;
在所述目标节点未标记的情况下,若所述目标节点满足所述目标计算引擎的适用条件,则将所述目标节点标记为所述目标计算引擎的计算节点;
在所述目标节点已标记的情况下,遍历下一节点,直至不存在未标记的子节点,对根节点进行标记处理。
6.根据权利要求4所述的数据处理装置,其特征在于,所述转换单元,被配置为执行:
根据所述节点标记,将所述简化规则树中的任一节点转换为所述任一节点对应的计算引擎的执行节点,得到执行计划树。
7.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至3中任一项所述的数据处理方法。
8.一种计算机可读存储介质,其特征在于,当所述计算机可读存储介质中的指令由数据处理电子设备的处理器执行时,使得数据处理电子设备能够执行如权利要求1至3中任一项所述的数据处理方法。
9.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-3任一项所述的数据处理方法。
CN202210498840.XA 2022-05-09 2022-05-09 一种数据处理方法、装置、电子设备及存储介质 Active CN114925092B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210498840.XA CN114925092B (zh) 2022-05-09 2022-05-09 一种数据处理方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210498840.XA CN114925092B (zh) 2022-05-09 2022-05-09 一种数据处理方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN114925092A CN114925092A (zh) 2022-08-19
CN114925092B true CN114925092B (zh) 2023-05-30

Family

ID=82808182

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210498840.XA Active CN114925092B (zh) 2022-05-09 2022-05-09 一种数据处理方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN114925092B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117038002B (zh) * 2023-10-08 2024-02-13 之江实验室 一种药物评价研究中生成观察变量的方法及装置
CN117675507A (zh) * 2023-11-13 2024-03-08 北京国电通网络技术有限公司 异常节点终端告警方法、电子设备和计算机可读介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7539691B2 (en) * 2004-02-20 2009-05-26 Microsoft Corporation Systems and methods for updating a query engine opcode tree
CN103678589B (zh) * 2013-12-12 2017-02-01 用友网络科技股份有限公司 一种基于等价类的数据库内核查询优化方法
CN107943929B (zh) * 2017-11-22 2021-09-28 福州大学 基于dom树抽象的包装器自动生成方法
CN108038215A (zh) * 2017-12-22 2018-05-15 上海达梦数据库有限公司 数据处理方法及***
US10831733B2 (en) * 2017-12-22 2020-11-10 International Business Machines Corporation Interactive adjustment of decision rules
CN109815389A (zh) * 2019-02-02 2019-05-28 北京三快在线科技有限公司 应用规则引擎的节点匹配方法、装置以及计算机设备
CN112464620A (zh) * 2020-09-23 2021-03-09 航天信息股份有限公司企业服务分公司 一种财务规则引擎的实现方法及实现***

Also Published As

Publication number Publication date
CN114925092A (zh) 2022-08-19

Similar Documents

Publication Publication Date Title
US11120078B2 (en) Method and device for video processing, electronic device, and storage medium
US20210232847A1 (en) Method and apparatus for recognizing text sequence, and storage medium
CN114925092B (zh) 一种数据处理方法、装置、电子设备及存储介质
EP2457183B1 (en) System and method for tagging multiple digital images
US20220272161A1 (en) Method and device for displaying group
CN109961094B (zh) 样本获取方法、装置、电子设备及可读存储介质
CN109255128B (zh) 多层级标签的生成方法、装置和存储介质
EP3767488A1 (en) Method and device for processing untagged data, and storage medium
CN112949983B (zh) 一种根因确定方法及装置
CN110781323A (zh) 多媒体资源的标签确定方法、装置、电子设备及存储介质
CN110930984A (zh) 一种语音处理方法、装置和电子设备
EP3734472A1 (en) Method and device for text processing
CN111046927B (zh) 标注数据的处理方法、装置、电子设备及存储介质
CN113609380B (zh) 标签体系更新方法、搜索方法、装置以及电子设备
CN116822924A (zh) 工作流配置方法、装置、设备及存储介质
CN113849723A (zh) 搜索方法及搜索装置
CN113779257A (zh) 文本分类模型的解析方法、装置、设备、介质及产品
CN112783779A (zh) 测试用例的生成方法、装置、电子设备和存储介质
CN112328809A (zh) 实体分类方法、装置及计算机可读存储介质
CN111275089A (zh) 一种分类模型训练方法及装置、存储介质
CN114219443A (zh) 单据数据处理方法、装置及设备
CN115376504A (zh) 智能产品的语音交互方法、装置及可读存储介质
CN114338587B (zh) 一种多媒体数据处理方法、装置、电子设备及存储介质
CN115303218B (zh) 语音指令处理方法、设备及存储介质
CN114154465B (zh) 结构图的结构重构方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant