CN110569252A - 一种数据处理***及方法 - Google Patents
一种数据处理***及方法 Download PDFInfo
- Publication number
- CN110569252A CN110569252A CN201810470200.1A CN201810470200A CN110569252A CN 110569252 A CN110569252 A CN 110569252A CN 201810470200 A CN201810470200 A CN 201810470200A CN 110569252 A CN110569252 A CN 110569252A
- Authority
- CN
- China
- Prior art keywords
- task set
- task
- queue
- result
- service module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例提供了一种数据处理***及方法,数据处理***包括:交互分析服务模块、调度服务模块和计算模块;交互分析服务模块接收各个客户端发送的数据请求,对接收的数据请求包括的处理逻辑进行处理,得到任务集,将得到的任务集缓存至任务集队列;主调度服务模块从任务集队列中获取任务集,将获取的任务集发送至计算模块;计算模块对接收的任务集进行计算,得到计算结果,将得到的计算结果发送给主调度模块;主调度服务模块对接收的计算结果进行封装,得到结果集,将得到的结果集缓存至结果集队列;交互分析服务模块从结果集队列中获取结果集,将获取的结果集发送给对应的客户端。应用本申请实施例,能够提高数据交互分析处理的并发性。
Description
技术领域
本申请涉及大数据处理技术领域,特别是涉及一种数据处理***及方法。
背景技术
目前,传统数据分析处理采用分布式框架,屏蔽掉后端复杂的数据处理实现和千差万别的接口,为用户提供统一标准SQL(Structured Query Language,结构化查询语言)来操作数据平台,给用户带来了良好的用户体验。
在大数据处理领域,分布式架构诸如批处理***MapReduce、内存计算引擎Spark、分布式数据库Hbase、以及流式处理框架Storm等都有着自己的编程模型。分布式架构的使用,对于用户来说,学***滑迁移。因而近年来开始构建与传统数据分析处理类似的交互式分析处理。诸如SQL On Hadoop***中的Hive、Impala、Phoenix以及Spark生态的Spark SQL等架构就是该类兴起技术。在交互式分析处理架构中,数据以表的形式存在。交互式分析处理架构提供标准的SQL接口,能够达到高并发、低延迟的线上分析效果。
然而,上述交互式分析处理架构在实际应用场景中效果不够理想,其中并发支持度是瓶颈之一。原因是当前大数据交互分析处理架构的SQL解析、分析、优化以及计划生成及评估等阶段的交互分析服务都在单个节点上进行,这制约了高并发特性。因此需要一种新型处理架构解决该瓶颈实现高并发的交互分析需求。
发明内容
本申请实施例的目的在于提供一种数据处理***及方法,以提高数据交互分析处理的并发性。具体技术方案如下:
为实现上述目的,本申请实施例提供了一种数据处理方法,应用于数据处理***,所述数据处理***包括:多个交互分析服务模块、多个调度服务模块和多个计算模块;所述方法包括:
所述多个交互分析服务模块接收各个客户端发送的数据请求;对接收的数据请求包括的处理逻辑进行处理,得到任务集;将得到的任务集缓存至任务集队列;
所述多个调度服务模块中的主调度服务模块从所述任务集队列中获取任务集;将获取的任务集发送至所述多个计算模块;
所述多个计算模块对接收的任务集进行计算,得到计算结果;将得到的计算结果发送给所述主调度模块;
所述主调度服务模块对接收的计算结果进行封装,得到结果集;将得到的结果集缓存至结果集队列;
所述多个交互分析服务模块从所述结果集队列中获取结果集;将获取的结果集发送给对应的客户端。
可选的,所述多个交互分析服务模块对接收的数据请求包括的处理逻辑进行处理,得到任务集,包括:
所述多个交互分析服务模块对接收的数据请求包括的处理逻辑进行SQL解析与优化、计划生成和资源预估处理,得到处理结果;对得到的处理结果进行序列化和封装,得到任务集。
可选的,所述多个交互分析服务模块将得到的任务集缓存至任务集队列,包括:
所述多个交互分析服务模块获取接收的数据请求所包括的处理逻辑的属性信息,将得到的任务集与获取的属性信息对应的缓存至任务集队列。
可选的,所述属性信息包括优先级;
所述主调度服务模块从所述任务集队列中获取任务集,包括:
所述主调度服务模块按照优先级从高到低的顺序,遍历并获取所述任务集队列中的各个任务集。
可选的,所述主调度服务模块按照优先级从高到低的顺序,遍历并获取所述任务集队列中的各个任务集,包括:
所述主调度服务模块按照优先级从高到低的顺序,遍历所述任务集队列中的各个任务集,并判断任务集所需的计算资源是否超过所述多个计算模块中当前剩余的计算资源;若否,则从所述任务集队列中获取该任务集;若是,则将该任务集缓存至所述任务集队列中与该任务集的优先级相同的所有任务集之后。
可选的,所述主调度服务模块从所述任务集队列中获取任务集,包括:
所述主调度服务模块遍历所述任务集队列中的各个任务集,获取未被标记为已调度的任务集;
在所述主调度服务模块获取未被标记为已调度的任务集之后,还包括:
所述主调度服务模块将获取的任务集标记为已调度。
可选的,所述主调度服务模块从所述任务集队列中获取任务集,包括:
所述主调度服务模块遍历所述任务集队列中的各个任务集,获取未被标记为终止的任务集的任务集;
所述方法还包括:
所述多个交互分析服务模块若在将得到的任务集缓存至任务集队列的预设时长后,检测到所述结果集队列中不存在获取的任务集所对应的结果集,则将获取的任务集标记为终止。
可选的,所述数据处理***还包括:删除模块;所述方法还包括:
所述删除模块检测所述结果集队列中是否存在缓存时长达到第一预设时长的第一结果集;若存在,删除所述第一结果集;或者,
所述删除模块检测所述结果集队列中是否存在最后一次访问至当前时刻的时长达到第二预设时长的第二结果集;若存在,删除所述第二结果集。
可选的,所述多个交互分析服务模块对接收的数据请求包括的处理逻辑进行处理,得到任务集,包括:
所述多个交互分析服务模块检测结果集队列中是否存在接收的数据请求所包括的处理逻辑对应结果集;若不存在,则对接收的数据请求包括的处理逻辑进行数据处理,得到任务集。
可选的,所述方法还包括:
所述多个交互分析服务模块若确定所述结果集队列中存在接收的数据请求所包括的处理逻辑对应结果集,则从所述结果集队列中获取接收的数据请求所包括的处理逻辑对应结果集;将获取的结果集发送给对应的客户端。
可选的,所述交互分析服务模和所述调度服务模块位于同一进程中。
为实现上述目的,本申请实施例还提供了一种数据处理***,所述数据处理***包括:多个交互分析服务模块、多个调度服务模块和多个计算模块;
所述多个交互分析服务模块,用于接收各个客户端发送的数据请求;对接收的数据请求包括的处理逻辑进行处理,得到任务集;将得到的任务集缓存至任务集队列;
所述多个调度服务模块中的主调度服务模块,用于从所述任务集队列中获取任务集;将获取的任务集发送至所述多个计算模块;
所述多个计算模块,用于对接收的任务集进行计算,得到计算结果;将得到的计算结果发送给所述主调度模块;
所述主调度服务模块,用于接收的计算结果进行封装,得到结果集;将得到的结果集缓存至结果集队列;
所述多个交互分析服务模块,用于从所述结果集队列中获取结果集;将获取的结果集发送给对应的客户端。
可选的,所述多个交互分析服务模块具体用于:
对接收的数据请求包括的处理逻辑进行SQL解析与优化、计划生成和资源预估处理,得到处理结果;对得到的处理结果进行序列化和封装,得到任务集。
可选的,所述多个交互分析服务模块具体用于:获取接收的数据请求所包括的处理逻辑的属性信息,将得到的任务集与获取的属性信息对应的缓存至任务集队列。
可选的,所述属性信息包括优先级;
所述主调度服务模块具体用于:按照优先级从高到低的顺序,遍历并获取所述任务集队列中的各个任务集。
可选的,所述主调度服务模块具体用于:
按照优先级从高到低的顺序,遍历所述任务集队列中的各个任务集,并判断任务集所需的计算资源是否超过所述多个计算模块中当前剩余的计算资源;若否,则从所述任务集队列中获取该任务集;若是,则将该任务集缓存至所述任务集队列中与该任务集的优先级相同的所有任务集之后。
可选的,所述主调度服务模块具体用于:遍历所述任务集队列中的各个任务集,获取未被标记为已调度的任务集;
所述主调度服务模块,还用于将获取的任务集标记为已调度。
可选的,所述主调度服务模块具体用于:遍历所述任务集队列中的各个任务集,获取未被标记为终止的任务集的任务集;
所述多个交互分析服务模块,还用于若在将得到的任务集缓存至任务集队列的预设时长后,检测到所述结果集队列中不存在获取的任务集所对应的结果集,则将获取的任务集标记为终止。
可选的,所述数据处理***还包括:删除模块;
所述删除模块,用于检测所述结果集队列中是否存在缓存时长达到第一预设时长的第一结果集;若存在,删除所述第一结果集;或者,
所述删除模块,用于检测所述结果集队列中是否存在最后一次访问至当前时刻的时长达到第二预设时长的第二结果集;若存在,删除所述第二结果集。
可选的,所述多个交互分析服务模块具体用于:
检测结果集队列中是否存在接收的数据请求所包括的处理逻辑对应结果集;若不存在,则对接收的数据请求包括的处理逻辑进行数据处理,得到任务集。
可选的,所述多个交互分析服务模块,还用于若确定所述结果集队列中存在接收的数据请求所包括的处理逻辑对应结果集,则从所述结果集队列中获取接收的数据请求所包括的处理逻辑对应结果集;将获取的结果集发送给对应的客户端。
可选的,所述交互分析服务模和所述调度服务模块位于同一进程中。
为实现上述目的,本申请实施例还提供了一种机器可读存储介质,所述机器可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一数据处理方法步骤。
本申请实施例中,在数据处理***中包括了任务集队列和结果集队列,交互分析服务模块将任务集缓存至任务集队列,调度服务模块从任务集队列中获取任务集。另外,调度服务模块将结果集缓存至结果集队列,交互分析服务模块从结果集队列中获取结果集,并将结果集发送给客户端。可见,交互分析服务模块和调度服务模块,通过任务集队列和结果集队列实现了交互分析服务模块和调度服务模块的解耦,数据交互分析处理可以在多个节点上进行,提高了数据交互分析处理的并发性。当然,实施本申请的任一产品或方法必不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本申请实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的数据处理***的一种结构示意图;
图2为本申请实施例提供的交互分析服务模块的请求处理流程的一种示意图;
图3为本申请实施例提供的调度服务模块的任务调度处理流程的一种示意图;
图4为本申请实施例提供的数据处理方法的一种流程示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为解决SQL解析、分析、优化以及计划生成及评估等阶段的交互分析服务都在单个节点上进行,制约了高并发特性的问题,本申请实施例提供了一种数据处理***。
该数据处理***包括:多个交互分析服务模块、多个调度服务模块和多个计算模块。交互分析服务模块将任务集缓存至任务集队列,调度服务模块从任务集队列中获取任务集,并发送给计算模块进行计算,得到结果集。另外,调度服务模块将结果集缓存至结果集队列,交互分析服务模块从结果集队列中获取结果集,并将结果集发送给客户端。
可见,交互分析服务模块和调度服务模块,通过任务集队列和结果集队列实现了交互分析服务模块和调度服务模块的解耦,数据交互分析处理可以在多个节点上进行,提高了数据交互分析处理的并发性。
下面通过具体实施例,对本申请进行说明。
参考图1,图1为本申请实施例提供的数据处理***的一种结构示意图。该数据处理***包括:多个交互分析服务模块101-103、多个调度服务模块201-203和多个计算模块301-305。这里,仅以3个交互分析服务模块、3个调度服务模块和5个计算模块为例进行说明,本申请实施例并不限定交互分析服务模块、调度服务模块和计算模块的个数。
本申请实施例中,交互分析服务模块和调度服务模块可位于同一进程中,即交互分析服务模块和调度服务模块可为同一进程中的两个模块。交互分析服务模块之间关系对等的,即多个交互分析服务模块可以同时接收并处理客户端发送的数据请求。调度服务模块是主从式结构,只有一个主调度服务模块提供服务,其它为备用调度服务模块,以避免出现数据不同步的问题。在主调度服务模块挂掉后,从备用调度服务模块中选举出一个主调度服务模块。
本申请实施例中,数据处理***可依赖相关的zookeeper等分布式协同组件技术,来实现主调度服务模块的选举和主备切换功能,以及交互分析服务模块的负载均衡功能。
交互分析服务模块为数据处理***的数据请求处理及任务集产生层,调度服务模块为任务集的消费调度执行层。交互分析服务模块和调度服务模块之间通过分布式缓存队列进行解耦交互。
计算模块可单独位于一个进程中。计算模块隶属分布式计算框架,例如Spark,主要完成调度服务模块分发的计算任务。交互分析服务模块和调度服务模块与计算模块可以位于同一节点上,也可以位于不同的节点上。
本申请实施例中,数据处理***中包括任务集队列和结果集队列。任务集队列和结果集队列均为分布式缓存队列,可通过相关的分布式缓存技术实现,以使用数据处理***的全部内存资源。
多个交互分析服务模块101-103接收各个客户端发送的数据请求。
多个交互分析服务模块可同时接收并处理相同或不同的数据请求。例如,在某一时刻,交互分析服务模块101接收并处理数据请求1,交互分析服务模块102接收并处理数据请求2,交互分析服务模块103接收并处理数据请求3。
多个交互分析服务模块101-103对接收的数据请求包括的处理逻辑进行处理,得到任务集。
数据请求中包括处理逻辑,交互分析服务模块对数据请求进行处理,即为交互分析服务模块对数据请求包括的处理逻辑进行处理。
可选的,交互分析服务模块对处理逻辑的处理包括:SQL解析与优化、计划生成和资源预估等。其中,计划生成为根据SQL解析与优化的处理结果,生成逻辑计划和物理计划。资源预估为估算完成逻辑计划和物理计划所需的计算资源。
如图2所示的交互分析服务模块请求处理流程,包括如下步骤。
步骤201,交互分析服务模块对接收的数据请求包括的处理逻辑进行SQL解析与优化处理。
步骤202,交互分析服务模块对接收的数据请求包括的处理逻辑进行计划生成处理。
步骤203,交互分析服务模块对接收的数据请求包括的处理逻辑进行资源预估处理。
步骤204,交互分析服务模块得到处理结果,对得到的处理结果进行序列化和封装,得到任务集。
步骤205,交互分析服务模块将任务集加入任务集队列。
多个交互分析服务模块101-103将得到的任务集缓存至任务集队列。
可选的,交互分析服务模块在将任务集缓存至任务集队列时,可以先获取数据请求所包括的处理逻辑的属性信息,将获取的属性信息与数据请求的任务集对应的缓存至任务集队列。
这里,属性信息可以为用户根据需要预先配置的。属性信息为主调度服务模块调度任务集的依据。例如,属性信息可包括优先级,任务集对应的优先级越高,主调度服务模块越优先调度该任务集。
以属性信息包括优先级为例,为了便于主调度服务模块调度任务集,任务集队列可以按照优先级划分为多个子队列,每一优先级对应一个子队列。此时,交互分析服务模块将获取的属性信息与数据请求的任务集对应的缓存至任务集队列,可以为:将数据请求的任务集缓存至获取的优先级对应的子队列。例如,交互分析服务模块101得到优先级1的任务集1,则将任务集1缓存至优先级1对应的子队列的尾部。
交互分析服务模块将任务集缓存至任务集队列后,定时检测结果集队列中是否存在该任务集所对应的结果集。若检测到结果集队列中存在该任务集所对应的结果集,则交互分析服务模块获取该任务集所对应的结果集,并将获取的结果集发送给客户端。
若将任务集缓存至任务集队列的预设时长后,交互分析服务模块检测结果集队列中还是不存在该任务集的所对应的结果集,则将该任务集标记为终止,以告知主调度服务模块停止对该任务集的调度,节约计算资源。
多个调度服务模块201-203中的主调度服务模块从任务集队列中获取任务集,将获取的任务集发送至多个计算模块301-305。
调度服务模块将任务集从任务集队列中获取并发送给计算模块的过程,即为一次任务集的调度。
可选的,任务集队列中缓存有优先级与任务集的对应关系。主调度服务模块按照优先级从高到低的顺序,遍历并获取任务集队列中的各个任务集。例如,任务集队列中包括任务集1、任务集2和任务集3,任务集1的优先级1>任务集2的优先级2>任务集3的优先级3。主调度服务模块按照优先级从高到低的顺序,遍历并获取任务集队列中的各个任务集时,先获取任务集1,再获取任务集2,最后获取任务集3。
可选的,为了便于主调度服务模块调度任务集,任务集队列可以按照优先级划分为多个子队列,每一优先级对应一个子队列。此时,主调度服务模块按照优先级从高到低的顺序,遍历各个子队列中的任务集,并获取子队列中的任务集。
可选的,为避免同一任务集重复调度,主调度服务模块在将一任务集发送给计算模块后,将该任务集标记为已调度。此时,主调度服务模块遍历任务集队列中的各个任务集,获取未被标记为已调度的任务集,将获取的任务集发送给计算模块。之后,主调度服务模块再将该获取的任务集标记为已调度。
可选的,为节约计算资源,多个交互分析服务模块若将任务集缓存至任务集队列的预设时长后,检测到结果集队列中不存在获取的任务集所对应的结果集,则将获取的任务集标记为终止。主调度服务模块遍历任务集队列中的各个任务集,获取未被标记为终止的任务集,将获取的任务集发送给计算模块。之后,主调度服务模块在未获得获取的任务集的结果集的情况下,检测到获取的任务集被标记为终止,则停止对该获取的任务集的调度,计算模块停止对该获取的任务集计算。
本申请实施例中,主调度服务模块可根据实际需要调整从任务集队列中获取任务集的方式,即任务集调度策略为可插拔式的,上述3种主调度服务模块获取任务集的方式可以任意结合。例如,主调度服务模块可按照优先级从任务集队列中获取任务集,还可以依据任务集的标记获取任务集,例如,获取未被标记为已调度的任务集,获取未被标记为终止的任务集,获取未被标记为已调度且未被标记为终止的任务集,或者按照优先级获取未被标记为已调度且未被标记为终止的任务集等。
可选的,为提高数据处理***的数据处理效率,主调度服务模块获取到任务集时,判断该任务集所需的计算资源是否超过多个计算模块中当前剩余的计算资源。这里,任务集所需的计算资源可为交互分析服务模块在对数据请求包括的处理逻辑进行资源评估时获取到的。多个计算模块中当前剩余的计算资源为:多个计算模块中每个计算模块剩余计算资源的总和。
主调度服务模块若判定该任务集所需的计算资源未超过多个计算模块中当前剩余的计算资源,则将获取该任务集。之后,将获取的任务集发送至多个计算模块。主调度服务模块在将获取的任务集发送至多个计算模块时,可以将完整的一个任务集发送给一个计算模块进行计算,也可以将任务集拆分为多份,发送给多个计算模块进行计算。本申请实施例不进行限定。
主调度服务模块若判定该任务集所需的计算资源超过多个计算模块中当前剩余的计算资源,则将获取的任务集缓存至任务集队列中与获取的任务集的优先级相同的所有任务集之后。
例如,优先级x1的子队列中包括任务集x1→任务集x2→任务集x3。主调度服务模块遍历到优先级x1的任务集x1后,若判定任务集x1所需的计算资源超过多个计算模块中当前剩余的计算资源,则主调度服务模块将任务集x1加入优先级x1的子队列的尾部,即优先级x1的子队列为:任务集x2→任务集x3→任务集x1。若判定任务集x1所需的计算资源未超过多个计算模块中当前剩余的计算资源,则主调度服务模块获取任务集x1。
一个示例中,如图3所示的调度服务模块的任务调度处理流程,可包括如下步骤。
步骤301,主调度服务模块按照优先级从高到低的顺序,遍历任务集队列中的各个任务集。
步骤302,主调度服务模块检测任务集是否被标记为终止。若未被标记为终止,执行步骤303。若被标记为终止,则继续遍历任务集队列中的各个任务集,直至遍历结束。
这里,遍历结束可以理解为任务集队列均为被标记为终止和/或已调度的任务集。
步骤303,主调度服务模块检测任务集是否被标记为已调度。若未被标记为已调度,执行步骤304。若被标记为已调度,则继续遍历任务集队列中的各个任务集,直至遍历结束。
本申请实施例不限定步骤302和步骤303的执行顺序。
步骤304,主调度服务模块检测执行任务集所需的计算资源是否超过当前剩余的计算资源。若未超过当前剩余的计算资源,则执行步骤305。若超过当前剩余的计算资源,则执行步骤306。
步骤305,主调度服务模块将任务集调度至计算模块。
步骤306,主调度服务模块将任务集加入任务集队列中该任务集的优先级对应的子队列的尾部。之后,继续遍历任务集队列中的各个任务集,直至遍历结束。
多个计算模块301-305对接收的任务集进行计算,得到计算结果;将得到的计算结果发送给主调度模块。
主调度服务模块对接收的计算结果进行封装,得到结果集,将得到的结果集缓存至结果集队列。
主调度服务模块对接收的计算结果进行序列化和封装,得到结果集。主调度服务模块将得到的结果集缓存至结果集队列。
多个交互分析服务模块101-103从结果集队列中获取结果集;将获取的结果集发送给对应的客户端。
本申请实施例中,数据请求由哪个交互分析服务模块接收的,数据请求的结果集就由哪个交互分析服务模块获取,并发送给对应的客户端。这里,对应的客户端即为发送获取的结果集对应的数据请求的客户端。
可选的,上述数据处理***还可包括删除模块。为了节约存储资源,删除模块检测结果集队列中是否存在缓存时长达到第一预设时长的第一结果集。若存在,删除模块删除第一结果集。
或者,为了节约存储资源,删除模块检测结果集队列中是否存在最后一次访问至当前时刻的时长达到第二预设时长的第二结果集。若存在,删除模块删除第二结果集。
可选的,为了节约计算资源,交互分析服务模块在接收到数据请求后,检测结果集队列中是否存在该数据请求所包括的处理逻辑对应结果集。若不存在,则交互分析服务模块对该数据请求包括的处理逻辑进行处理,得到任务集。若存在,则交互分析服务模块直接从结果集队列中获取该数据请求所包括的处理逻辑对应的结果集,并将获取的结果集发送给对应的客户端。
为了便于交互分析服务模块检测结果集队列中是否存在该数据请求所包括的处理逻辑对应结果集,交互分析服务模块在接收到数据请求后,可以生成能够唯一表示数据请求所包括的处理逻辑的标识。处理逻辑的标识可以通过MD5算法等计算生成。任务集队列中缓存有标识与任务集的对应关系,结果集队列中缓存有标识与结果集的对应关系。
交互分析服务模块检测结果集队列中是否存在接收的数据请求所包括的处理逻辑的标识(例如第一标识)。若存在,则交互分析服务模块确定结果集队列中存在该数据请求所包括的处理逻辑对应结果集,从结果集队列中获取第一标识对应的结果集,并发送给对应的客户端。否则,交互分析服务模块确定结果集队列中不存在该数据请求所包括的处理逻辑对应结果集,对该数据请求包括的处理逻辑进行处理,得到任务集。
应用本申请实施例,在数据处理***中包括了任务集队列和结果集队列,交互分析服务模块将任务集缓存至任务集队列,调度服务模块从任务集队列中获取任务集。另外,调度服务模块将结果集缓存至结果集队列,交互分析服务模块从结果集队列中获取结果集,并将结果集发送给客户端。可见,交互分析服务模块和调度服务模块,通过任务集队列和结果集队列实现了交互分析服务模块和调度服务模块的解耦,数据交互分析处理可以在多个节点上进行,提高了数据交互分析处理的并发性。
基于相同的发明构思,根据上述数据处理***实施例,本申请实施例还提供了一种数据处理方法。参考图4,图4为本申请实施例提供的数据处理方法的一种流程示意图。该方法应用于数据处理***,数据处理***包括:多个交互分析服务模块、多个调度服务模块和多个计算模块。
本申请实施例中,交互分析服务模块和调度服务模块可位于同一进程中,即交互分析服务模块和调度服务模块可为同一进程中的两个模块。交互分析服务模块之间关系对等的,即多个交互分析服务模块可以同时接收并处理客户端发送的数据请求。调度服务模块是主从式结构,只有一个主调度服务模块提供服务,其它为备用调度服务模块,以避免出现数据不同步的问题。在主调度服务模块挂掉后,从备用调度服务模块中选举出一个主调度服务模块。
本申请实施例中,数据处理***可依赖相关的zookeeper等分布式协同组件技术,来实现主调度服务模块的选举和主备切换功能,以及交互分析服务模块的负载均衡功能。
交互分析服务模块为数据处理***的数据请求处理及任务集产生层,调度服务模块为任务集的消费调度执行层。交互分析服务模块和调度服务模块之间通过分布式缓存队列进行解耦交互。
计算模块可单独位于一个进程中。计算模块隶属分布式计算框架,例如Spark,主要完成调度服务模块分发的计算任务。交互分析服务模块和调度服务模块与计算模块可以位于同一节点上,也可以位于不同的节点上。
本申请实施例中,数据处理***中包括任务集队列和结果集队列。任务集队列和结果集队列均为分布式缓存队列,可通过相关的分布式缓存技术实现,以使用数据处理***的全部内存资源。
上述数据处理方法包括如下步骤。
步骤401,多个交互分析服务模块接收各个客户端发送的数据请求;对接收的数据请求包括的处理逻辑进行处理,得到任务集;将得到的任务集缓存至任务集队列。
一个实施例中,多个交互分析服务模块对接收的数据请求包括的处理逻辑进行处理,得到任务集,可包括:对接收的数据请求包括的处理逻辑进行SQL解析与优化、计划生成和资源预估处理,得到处理结果;对得到的处理结果进行序列化和封装,得到任务集。可参考图2所示的交互分析服务模块的请求处理流程。
一个实施例中,多个交互分析服务模块将得到的任务集缓存至任务集队列,可包括:获取接收的数据请求所包括的处理逻辑的属性信息,将得到的任务集与获取的属性信息对应的缓存至任务集队列。
步骤402,多个调度服务模块中的主调度服务模块从任务集队列中获取任务集;将获取的任务集发送至多个计算模块。
一个实施例中,任务集队列缓存了任务集与属性信息的对应关系,属性信息包括优先级。这种情况下,主调度服务模块从任务集队列中获取任务集,可为:按照优先级从高到低的顺序,遍历并获取任务集队列中的各个任务集。
另一个实施例中,主调度服务模块按照优先级从高到低的顺序,遍历并获取任务集队列中的各个任务集,可包括:按照优先级从高到低的顺序,遍历任务集队列中的各个任务集,并判断任务集所需的计算资源是否超过所述多个计算模块中当前剩余的计算资源;若否,则从任务集队列中获取该任务集;若是,则将该任务集缓存至任务集队列中与该任务集的优先级相同的所有任务集之后。
一个实施例中,主调度服务模块从任务集队列中获取任务集,可包括:遍历任务集队列中的各个任务集,获取未被标记为已调度的任务集。
在主调度服务模块获取未被标记为已调度的任务集之后,主调度服务模块将获取的任务集标记为已调度。
一个实施例中,主调度服务模块从任务集队列中获取任务集,可包括:遍历任务集队列中的各个任务集,获取未被标记为终止的任务集的任务集。
另外,多个交互分析服务模块若在将得到的任务集缓存至任务集队列的预设时长后,检测到结果集队列中不存在获取的任务集所对应的结果集,则将获取的任务集标记为终止。
步骤403,多个计算模块对接收的任务集进行计算,得到计算结果;将得到的计算结果发送给主调度模块。
步骤404,主调度服务模块对接收的计算结果进行封装,得到结果集;将得到的结果集缓存至结果集队列。
主调度服务模块对接收的计算结果进行序列化和封装,得到结果集。主调度服务模块将得到的结果集缓存至结果集队列。
步骤405,多个交互分析服务模块从结果集队列中获取结果集;将获取的结果集发送给对应的客户端。
本申请实施例中,数据请求由哪个交互分析服务模块接收的,数据请求的结果集就由哪个交互分析服务模块获取,并发送给对应的客户端。这里,对应的客户端即为发送获取的结果集对应的数据请求的客户端。
一个实施例中,数据处理***还可包括:删除模块;上述数据处理方法还可包括:
删除模块检测结果集队列中是否存在缓存时长达到第一预设时长的第一结果集;若存在,删除第一结果集;或者,
删除模块检测结果集队列中是否存在最后一次访问至当前时刻的时长达到第二预设时长的第二结果集;若存在,删除第二结果集。
一个实施例中,多个交互分析服务模块对接收的数据请求包括的处理逻辑进行处理,得到任务集,可包括:检测结果集队列中是否存在接收的数据请求所包括的处理逻辑对应结果集;若不存在,则对接收的数据请求包括的处理逻辑进行数据处理,得到任务集。
若确定结果集队列中存在接收的数据请求所包括的处理逻辑对应结果集,则从结果集队列中获取接收的数据请求所包括的处理逻辑对应结果集;将获取的结果集发送给对应的客户端。
应用本申请实施例,在数据处理***中包括了任务集队列和结果集队列,交互分析服务模块将任务集缓存至任务集队列,调度服务模块从任务集队列中获取任务集。另外,调度服务模块将结果集缓存至结果集队列,交互分析服务模块从结果集队列中获取结果集,并将结果集发送给客户端。可见,交互分析服务模块和调度服务模块,通过任务集队列和结果集队列实现了交互分析服务模块和调度服务模块的解耦,数据交互分析处理可以在多个节点上进行,提高了数据交互分析处理的并发性。
基于相同的发明构思,根据上述数据处理***实施例,本申请实施例还提供了一种机器可读存储介质,机器可读存储介质内存储有计算机程序,计算机程序被处理器执行时实现上述图4所示的数据处理方法。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于数据处理方法和机器可读存储介质实施例而言,由于其基本相似于数据处理***实施例,所以描述的比较简单,相关之处参见数据处理***实施例的部分说明即可。
以上所述仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本申请的保护范围内。
Claims (23)
1.一种数据处理方法,其特征在于,应用于数据处理***,所述数据处理***包括:多个交互分析服务模块、多个调度服务模块和多个计算模块;所述方法包括:
所述多个交互分析服务模块接收各个客户端发送的数据请求;对接收的数据请求包括的处理逻辑进行处理,得到任务集;将得到的任务集缓存至任务集队列;
所述多个调度服务模块中的主调度服务模块从所述任务集队列中获取任务集;将获取的任务集发送至所述多个计算模块;
所述多个计算模块对接收的任务集进行计算,得到计算结果;将得到的计算结果发送给所述主调度模块;
所述主调度服务模块对接收的计算结果进行封装,得到结果集;将得到的结果集缓存至结果集队列;
所述多个交互分析服务模块从所述结果集队列中获取结果集;将获取的结果集发送给对应的客户端。
2.根据权利要求1所述的方法,其特征在于,所述多个交互分析服务模块对接收的数据请求包括的处理逻辑进行处理,得到任务集,包括:
所述多个交互分析服务模块对接收的数据请求包括的处理逻辑进行结构化查询语言SQL解析与优化、计划生成和资源预估处理,得到处理结果;对得到的处理结果进行序列化和封装,得到任务集。
3.根据权利要求1所述的方法,其特征在于,所述多个交互分析服务模块将得到的任务集缓存至任务集队列,包括:
所述多个交互分析服务模块获取接收的数据请求所包括的处理逻辑的属性信息,将得到的任务集与获取的属性信息对应的缓存至任务集队列。
4.根据权利要求3所述的方法,其特征在于,所述属性信息包括优先级;
所述主调度服务模块从所述任务集队列中获取任务集,包括:
所述主调度服务模块按照优先级从高到低的顺序,遍历并获取所述任务集队列中的各个任务集。
5.根据权利要求4所述的方法,其特征在于,所述主调度服务模块按照优先级从高到低的顺序,遍历并获取所述任务集队列中的各个任务集,包括:
所述主调度服务模块按照优先级从高到低的顺序,遍历所述任务集队列中的各个任务集,并判断任务集所需的计算资源是否超过所述多个计算模块中当前剩余的计算资源;若否,则从所述任务集队列中获取该任务集;若是,则将该任务集缓存至所述任务集队列中与该任务集的优先级相同的所有任务集之后。
6.根据权利要求1所述的方法,其特征在于,所述主调度服务模块从所述任务集队列中获取任务集,包括:
所述主调度服务模块遍历所述任务集队列中的各个任务集,获取未被标记为已调度的任务集;
在所述主调度服务模块获取未被标记为已调度的任务集之后,还包括:
所述主调度服务模块将获取的任务集标记为已调度。
7.根据权利要求1所述的方法,其特征在于,所述主调度服务模块从所述任务集队列中获取任务集,包括:
所述主调度服务模块遍历所述任务集队列中的各个任务集,获取未被标记为终止的任务集的任务集;
所述方法还包括:
所述多个交互分析服务模块若在将得到的任务集缓存至任务集队列的预设时长后,检测到所述结果集队列中不存在获取的任务集所对应的结果集,则将获取的任务集标记为终止。
8.根据权利要求1所述的方法,其特征在于,所述数据处理***还包括:删除模块;所述方法还包括:
所述删除模块检测所述结果集队列中是否存在缓存时长达到第一预设时长的第一结果集;若存在,删除所述第一结果集;或者,
所述删除模块检测所述结果集队列中是否存在最后一次访问至当前时刻的时长达到第二预设时长的第二结果集;若存在,删除所述第二结果集。
9.根据权利要求1所述的方法,其特征在于,所述多个交互分析服务模块对接收的数据请求包括的处理逻辑进行处理,得到任务集,包括:
所述多个交互分析服务模块检测结果集队列中是否存在接收的数据请求所包括的处理逻辑对应结果集;若不存在,则对接收的数据请求包括的处理逻辑进行数据处理,得到任务集。
10.根据权利要求9所述的方法,其特征在于,所述方法还包括:
所述多个交互分析服务模块若确定所述结果集队列中存在接收的数据请求所包括的处理逻辑对应结果集,则从所述结果集队列中获取接收的数据请求所包括的处理逻辑对应结果集;将获取的结果集发送给对应的客户端。
11.根据权利要求1-10任一项所述的方法,其特征在于,所述交互分析服务模和所述调度服务模块位于同一进程中。
12.一种数据处理***,其特征在于,所述数据处理***包括:多个交互分析服务模块、多个调度服务模块和多个计算模块;
所述多个交互分析服务模块,用于接收各个客户端发送的数据请求;对接收的数据请求包括的处理逻辑进行处理,得到任务集;将得到的任务集缓存至任务集队列;
所述多个调度服务模块中的主调度服务模块,用于从所述任务集队列中获取任务集;将获取的任务集发送至所述多个计算模块;
所述多个计算模块,用于对接收的任务集进行计算,得到计算结果;将得到的计算结果发送给所述主调度模块;
所述主调度服务模块,用于接收的计算结果进行封装,得到结果集;将得到的结果集缓存至结果集队列;
所述多个交互分析服务模块,用于从所述结果集队列中获取结果集;将获取的结果集发送给对应的客户端。
13.根据权利要求12所述的***,其特征在于,所述多个交互分析服务模块具体用于:
对接收的数据请求包括的处理逻辑进行结构化查询语言SQL解析与优化、计划生成和资源预估处理,得到处理结果;对得到的处理结果进行序列化和封装,得到任务集。
14.根据权利要求12所述的***,其特征在于,所述多个交互分析服务模块具体用于:获取接收的数据请求所包括的处理逻辑的属性信息,将得到的任务集与获取的属性信息对应的缓存至任务集队列。
15.根据权利要求14所述的***,其特征在于,所述属性信息包括优先级;
所述主调度服务模块具体用于:按照优先级从高到低的顺序,遍历并获取所述任务集队列中的各个任务集。
16.根据权利要求15所述的***,其特征在于,所述主调度服务模块具体用于:
按照优先级从高到低的顺序,遍历所述任务集队列中的各个任务集,并判断任务集所需的计算资源是否超过所述多个计算模块中当前剩余的计算资源;若否,则从所述任务集队列中获取该任务集;若是,则将该任务集缓存至所述任务集队列中与该任务集的优先级相同的所有任务集之后。
17.根据权利要求12所述的***,其特征在于,所述主调度服务模块具体用于:遍历所述任务集队列中的各个任务集,获取未被标记为已调度的任务集;
所述主调度服务模块,还用于将获取的任务集标记为已调度。
18.根据权利要求12所述的***,其特征在于,所述主调度服务模块具体用于:遍历所述任务集队列中的各个任务集,获取未被标记为终止的任务集的任务集;
所述多个交互分析服务模块,还用于若在将得到的任务集缓存至任务集队列的预设时长后,检测到所述结果集队列中不存在获取的任务集所对应的结果集,则将获取的任务集标记为终止。
19.根据权利要求12所述的***,其特征在于,所述数据处理***还包括:删除模块;
所述删除模块,用于检测所述结果集队列中是否存在缓存时长达到第一预设时长的第一结果集;若存在,删除所述第一结果集;或者,
所述删除模块,用于检测所述结果集队列中是否存在最后一次访问至当前时刻的时长达到第二预设时长的第二结果集;若存在,删除所述第二结果集。
20.根据权利要求12所述的***,其特征在于,所述多个交互分析服务模块具体用于:
检测结果集队列中是否存在接收的数据请求所包括的处理逻辑对应结果集;若不存在,则对接收的数据请求包括的处理逻辑进行数据处理,得到任务集。
21.根据权利要求20所述的***,其特征在于,
所述多个交互分析服务模块,还用于若确定所述结果集队列中存在接收的数据请求所包括的处理逻辑对应结果集,则从所述结果集队列中获取接收的数据请求所包括的处理逻辑对应结果集;将获取的结果集发送给对应的客户端。
22.根据权利要求12-21任一项所述的***,其特征在于,所述交互分析服务模和所述调度服务模块位于同一进程中。
23.一种机器可读存储介质,其特征在于,所述机器可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-11任一所述的方法步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810470200.1A CN110569252B (zh) | 2018-05-16 | 2018-05-16 | 一种数据处理***及方法 |
PCT/CN2019/086847 WO2019219005A1 (zh) | 2018-05-16 | 2019-05-14 | 一种数据处理***及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810470200.1A CN110569252B (zh) | 2018-05-16 | 2018-05-16 | 一种数据处理***及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110569252A true CN110569252A (zh) | 2019-12-13 |
CN110569252B CN110569252B (zh) | 2023-04-07 |
Family
ID=68539471
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810470200.1A Active CN110569252B (zh) | 2018-05-16 | 2018-05-16 | 一种数据处理***及方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN110569252B (zh) |
WO (1) | WO2019219005A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111694640A (zh) * | 2020-06-10 | 2020-09-22 | 北京奇艺世纪科技有限公司 | 数据处理方法、装置、电子设备及存储介质 |
CN113626176A (zh) * | 2020-05-08 | 2021-11-09 | 北京沃东天骏信息技术有限公司 | 一种业务请求处理方法及装置 |
CN116775584A (zh) * | 2023-07-12 | 2023-09-19 | 常德职业技术学院 | 一种基于云服务Hadoop的数据挖掘方法 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111858047B (zh) * | 2020-07-14 | 2024-03-22 | 中国工商银行股份有限公司 | 文件交互方法、装置及*** |
CN112256451A (zh) * | 2020-10-19 | 2021-01-22 | 北京达佳互联信息技术有限公司 | 定时业务消息生成方法、装置、电子设备及存储介质 |
CN116302574B (zh) * | 2023-05-23 | 2023-08-18 | 北京前景无忧电子科技股份有限公司 | 一种基于MapReduce的并发处理方法 |
Citations (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002049602A (ja) * | 2000-08-02 | 2002-02-15 | Ricoh Co Ltd | 検索システム |
WO2003100648A1 (en) * | 2002-05-28 | 2003-12-04 | Dai Nippon Printing Co., Ltd. | Parallel processing system |
CA2565596A1 (en) * | 2004-05-11 | 2005-11-24 | Mistletoe Technologies, Inc. | Semantic processor storage server architecture |
JP2005346563A (ja) * | 2004-06-04 | 2005-12-15 | Mitsubishi Electric Corp | 並列処理システムおよび並列処理方法 |
US20060242300A1 (en) * | 2005-04-25 | 2006-10-26 | Hitachi, Ltd. | Load balancing server and system |
US20070124731A1 (en) * | 2002-02-08 | 2007-05-31 | Jp Morgan Chase & Co. | System architecture for distributed computing |
CA2683192A1 (en) * | 2007-05-15 | 2008-11-15 | Tivo Inc. | Media data content search system |
US20090077246A1 (en) * | 2007-09-19 | 2009-03-19 | The Chinese University Of Hong Kong | Load balancing and admission scheduling in pull-based parallel video servers |
US20090319474A1 (en) * | 2008-06-19 | 2009-12-24 | Robert Joseph Bestgen | Aggregating Database Queries |
CN102063336A (zh) * | 2011-01-12 | 2011-05-18 | 国网电力科学研究院 | 一种分布式计算多应用功能异步并发调度方法 |
CN102763086A (zh) * | 2012-01-18 | 2012-10-31 | 华为技术有限公司 | 分布式计算任务处理***和任务处理方法 |
CN102831012A (zh) * | 2011-06-16 | 2012-12-19 | 日立(中国)研究开发有限公司 | 多节点分布式***中的任务调度装置和任务调度方法 |
CN102880503A (zh) * | 2012-08-24 | 2013-01-16 | 新浪网技术(中国)有限公司 | 数据分析***及数据分析方法 |
CN102915254A (zh) * | 2011-08-02 | 2013-02-06 | 中兴通讯股份有限公司 | 任务管理方法及装置 |
JP2013069189A (ja) * | 2011-09-26 | 2013-04-18 | Hitachi Ltd | 並列分散処理方法および並列分散処理システム |
CA2806110A1 (en) * | 2012-02-17 | 2013-08-17 | Research In Motion Corporation | Method and system for distributing one or more server-based services |
CN103377087A (zh) * | 2012-04-27 | 2013-10-30 | 北大方正集团有限公司 | 一种数据任务处理方法、装置及*** |
CN103905531A (zh) * | 2014-03-14 | 2014-07-02 | 浪潮电子信息产业股份有限公司 | 一种集群存储***中转换节点间负载均衡方法 |
CN104133724A (zh) * | 2014-04-03 | 2014-11-05 | 腾讯科技(深圳)有限公司 | 并发任务调度方法及装置 |
CN104253850A (zh) * | 2014-01-07 | 2014-12-31 | 深圳市华傲数据技术有限公司 | 一种任务分布式调度方法和*** |
CN104268007A (zh) * | 2014-01-07 | 2015-01-07 | 深圳市华傲数据技术有限公司 | 一种事件请求分布式调度方法和*** |
CN104468649A (zh) * | 2013-09-16 | 2015-03-25 | 北大方正集团有限公司 | 服务器、终端、数据推送***和数据推送方法 |
CN104462370A (zh) * | 2014-12-09 | 2015-03-25 | 北京百度网讯科技有限公司 | 分布式任务调度***及方法 |
CN104519140A (zh) * | 2015-01-08 | 2015-04-15 | 浪潮(北京)电子信息产业有限公司 | 一种分布式并行计算的服务器***及其管理方法 |
CN104615487A (zh) * | 2015-01-12 | 2015-05-13 | 中国科学院计算机网络信息中心 | 并行任务优化***和方法 |
CN104734902A (zh) * | 2013-12-23 | 2015-06-24 | 展讯通信(上海)有限公司 | 测试***及其服务端 |
CN105429718A (zh) * | 2015-10-28 | 2016-03-23 | 西安电子科技大学 | 基于多并发的无线频谱监测方法 |
CN106170016A (zh) * | 2016-07-28 | 2016-11-30 | 深圳市创梦天地科技有限公司 | 一种处理高并发数据请求的方法和*** |
CN106909451A (zh) * | 2017-02-28 | 2017-06-30 | 郑州云海信息技术有限公司 | 一种分布式任务调度***及方法 |
CN106991339A (zh) * | 2017-05-05 | 2017-07-28 | 国信嘉宁数据技术有限公司 | 一种金融业务数据保全方法、服务器、客户端和*** |
CN107329814A (zh) * | 2017-06-16 | 2017-11-07 | 电子科技大学 | 一种基于rdma的分布式内存数据库查询引擎*** |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070250681A1 (en) * | 2006-04-10 | 2007-10-25 | International Business Machines Corporation | Independent programmable operation sequence processor for vector processing |
CN103077074B (zh) * | 2012-12-26 | 2016-08-03 | 深圳先进技术研究院 | 一种三维空间数据并行调度方法和*** |
CN104657214A (zh) * | 2015-03-13 | 2015-05-27 | 华存数据信息技术有限公司 | 一种基于多队列和多优先级的大数据任务管理***和方法 |
CN106095572B (zh) * | 2016-06-08 | 2019-12-06 | 东方网力科技股份有限公司 | 一种大数据处理的分布式调度***及方法 |
CN107665144B (zh) * | 2016-07-29 | 2021-02-26 | 北京京东尚科信息技术有限公司 | 分布式任务的均衡调度中心、方法、***和装置 |
-
2018
- 2018-05-16 CN CN201810470200.1A patent/CN110569252B/zh active Active
-
2019
- 2019-05-14 WO PCT/CN2019/086847 patent/WO2019219005A1/zh active Application Filing
Patent Citations (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002049602A (ja) * | 2000-08-02 | 2002-02-15 | Ricoh Co Ltd | 検索システム |
US20070124731A1 (en) * | 2002-02-08 | 2007-05-31 | Jp Morgan Chase & Co. | System architecture for distributed computing |
WO2003100648A1 (en) * | 2002-05-28 | 2003-12-04 | Dai Nippon Printing Co., Ltd. | Parallel processing system |
CA2565596A1 (en) * | 2004-05-11 | 2005-11-24 | Mistletoe Technologies, Inc. | Semantic processor storage server architecture |
JP2005346563A (ja) * | 2004-06-04 | 2005-12-15 | Mitsubishi Electric Corp | 並列処理システムおよび並列処理方法 |
US20060242300A1 (en) * | 2005-04-25 | 2006-10-26 | Hitachi, Ltd. | Load balancing server and system |
CA2683192A1 (en) * | 2007-05-15 | 2008-11-15 | Tivo Inc. | Media data content search system |
US20090077246A1 (en) * | 2007-09-19 | 2009-03-19 | The Chinese University Of Hong Kong | Load balancing and admission scheduling in pull-based parallel video servers |
US20090319474A1 (en) * | 2008-06-19 | 2009-12-24 | Robert Joseph Bestgen | Aggregating Database Queries |
CN102063336A (zh) * | 2011-01-12 | 2011-05-18 | 国网电力科学研究院 | 一种分布式计算多应用功能异步并发调度方法 |
CN102831012A (zh) * | 2011-06-16 | 2012-12-19 | 日立(中国)研究开发有限公司 | 多节点分布式***中的任务调度装置和任务调度方法 |
CN102915254A (zh) * | 2011-08-02 | 2013-02-06 | 中兴通讯股份有限公司 | 任务管理方法及装置 |
JP2013069189A (ja) * | 2011-09-26 | 2013-04-18 | Hitachi Ltd | 並列分散処理方法および並列分散処理システム |
CN102763086A (zh) * | 2012-01-18 | 2012-10-31 | 华为技术有限公司 | 分布式计算任务处理***和任务处理方法 |
CA2806110A1 (en) * | 2012-02-17 | 2013-08-17 | Research In Motion Corporation | Method and system for distributing one or more server-based services |
CN103377087A (zh) * | 2012-04-27 | 2013-10-30 | 北大方正集团有限公司 | 一种数据任务处理方法、装置及*** |
US20130290412A1 (en) * | 2012-04-27 | 2013-10-31 | Beijing Founder Apabi Technology Ltd. | Method, apparatus, and system for data task processing |
CN102880503A (zh) * | 2012-08-24 | 2013-01-16 | 新浪网技术(中国)有限公司 | 数据分析***及数据分析方法 |
CN104468649A (zh) * | 2013-09-16 | 2015-03-25 | 北大方正集团有限公司 | 服务器、终端、数据推送***和数据推送方法 |
CN104734902A (zh) * | 2013-12-23 | 2015-06-24 | 展讯通信(上海)有限公司 | 测试***及其服务端 |
CN104253850A (zh) * | 2014-01-07 | 2014-12-31 | 深圳市华傲数据技术有限公司 | 一种任务分布式调度方法和*** |
CN104268007A (zh) * | 2014-01-07 | 2015-01-07 | 深圳市华傲数据技术有限公司 | 一种事件请求分布式调度方法和*** |
CN103905531A (zh) * | 2014-03-14 | 2014-07-02 | 浪潮电子信息产业股份有限公司 | 一种集群存储***中转换节点间负载均衡方法 |
CN104133724A (zh) * | 2014-04-03 | 2014-11-05 | 腾讯科技(深圳)有限公司 | 并发任务调度方法及装置 |
CN104462370A (zh) * | 2014-12-09 | 2015-03-25 | 北京百度网讯科技有限公司 | 分布式任务调度***及方法 |
CN104519140A (zh) * | 2015-01-08 | 2015-04-15 | 浪潮(北京)电子信息产业有限公司 | 一种分布式并行计算的服务器***及其管理方法 |
CN104615487A (zh) * | 2015-01-12 | 2015-05-13 | 中国科学院计算机网络信息中心 | 并行任务优化***和方法 |
CN105429718A (zh) * | 2015-10-28 | 2016-03-23 | 西安电子科技大学 | 基于多并发的无线频谱监测方法 |
CN106170016A (zh) * | 2016-07-28 | 2016-11-30 | 深圳市创梦天地科技有限公司 | 一种处理高并发数据请求的方法和*** |
CN106909451A (zh) * | 2017-02-28 | 2017-06-30 | 郑州云海信息技术有限公司 | 一种分布式任务调度***及方法 |
CN106991339A (zh) * | 2017-05-05 | 2017-07-28 | 国信嘉宁数据技术有限公司 | 一种金融业务数据保全方法、服务器、客户端和*** |
CN107329814A (zh) * | 2017-06-16 | 2017-11-07 | 电子科技大学 | 一种基于rdma的分布式内存数据库查询引擎*** |
Non-Patent Citations (2)
Title |
---|
WEININGWANG: "An efficient image aesthetic analysis system using Hadoop" * |
刘书健: "基于协程的高并发的分析与研究" * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113626176A (zh) * | 2020-05-08 | 2021-11-09 | 北京沃东天骏信息技术有限公司 | 一种业务请求处理方法及装置 |
CN111694640A (zh) * | 2020-06-10 | 2020-09-22 | 北京奇艺世纪科技有限公司 | 数据处理方法、装置、电子设备及存储介质 |
CN111694640B (zh) * | 2020-06-10 | 2023-04-21 | 北京奇艺世纪科技有限公司 | 数据处理方法、装置、电子设备及存储介质 |
CN116775584A (zh) * | 2023-07-12 | 2023-09-19 | 常德职业技术学院 | 一种基于云服务Hadoop的数据挖掘方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2019219005A1 (zh) | 2019-11-21 |
CN110569252B (zh) | 2023-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110569252B (zh) | 一种数据处理***及方法 | |
CN112162865B (zh) | 服务器的调度方法、装置和服务器 | |
Ge et al. | GA-based task scheduler for the cloud computing systems | |
WO2021159638A1 (zh) | 集群队列资源的调度方法、装置、设备及存储介质 | |
CN106933664B (zh) | 一种Hadoop集群的资源调度方法及装置 | |
CN111367630A (zh) | 一种基于云计算的多用户多优先级的分布式协同处理方法 | |
US20200285508A1 (en) | Method and Apparatus for Assigning Computing Task | |
CN112134909B (zh) | 时序数据处理方法、装置、***、服务器及可读存储介质 | |
CN108241539B (zh) | 基于分布式***的交互式大数据查询方法、装置、存储介质和终端设备 | |
CN110781180B (zh) | 一种数据筛选方法和数据筛选装置 | |
CN112130966A (zh) | 任务调度方法和*** | |
Wang et al. | Task scheduling algorithm based on improved Min-Min algorithm in cloud computing environment | |
CN113296874B (zh) | 一种任务的调度方法、计算设备及存储介质 | |
CN108170417B (zh) | 一种在mesos集群中集成高性能的作业调度框架的方法和装置 | |
Yun et al. | An integrated approach to workflow mapping and task scheduling for delay minimization in distributed environments | |
CN109871270B (zh) | 调度方案生成方法及装置 | |
CN114816709A (zh) | 任务调度方法、装置、服务器及可读存储介质 | |
CN109032779B (zh) | 任务处理方法、装置、计算机设备及可读存储介质 | |
WO2019029721A1 (zh) | 任务的调度方法、装置、设备及存储介质 | |
CN117076133B (zh) | 云游戏平台异构资源分配方法、计算机装置及存储介质 | |
CN111930485B (zh) | 一种基于性能表现的作业调度方法 | |
CN108446169B (zh) | 一种作业调度方法及装置 | |
WO2016197858A1 (zh) | 一种消息通知方法和设备 | |
CN116974994A (zh) | 一种基于集群的高效能文件协作*** | |
CN116737370A (zh) | 一种多资源调度方法、***、存储介质及终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |