WO2020019315A1

WO2020019315A1 - 一种基于图数据的计算运行调度方法、***、计算机可读介质及设备

Info

Publication number: WO2020019315A1
Application number: PCT/CN2018/097517
Authority: WO
Inventors: 樊文飞; 于文渊; 徐静波; 罗小简
Original assignee: 浙江天猫技术有限公司
Priority date: 2018-07-27
Filing date: 2018-07-27
Publication date: 2020-01-30
Also published as: CN112912849A; US20210149746A1

Abstract

一种基于图数据的计算运行调度方法、调度***、计算机可读介质及设备，所述调度方法包括：将图数据划分成多个分区（S1）；调度所述分区分配给多个处理器（S2）；根据每个分区的关键程度将所述分区先后交给所述处理器对应的线程计算（S3）；判断是否存在空闲处理器，当所述处理器包括一个或多个空闲线程时，则所述处理器为空闲处理器（S4）；将所述空闲处理器和其它处理器进行通信，寻找所述其它处理器对应的待计算分区（S5）；选择确定所述待计算分区（S6）；将所述确定的待计算分区绑定到所述空闲处理器的线程处理（S7）。

Description

一种基于图数据的计算运行调度方法、***、计算机可读介质及设备

技术领域

本发明属于数据资源分配技术领域，尤其涉及一种基于图数据的计算运行调度方法、***、计算机可读介质及设备。

背景技术

随着信息技术的发展以及互联网的普及，数据呈***式增长，尤其是近年来社交网络的快速发展使得图数据急剧增长。图数据是一种以图为数据结构进行存储的数据，其被抽象成节点和节点的连线。在现实世界中，图数据广泛存在且体量巨大，例如微博中的人际关系图、搜索引擎中的网页指向图和交通***中的地理信息图等等。分析并挖掘图数据中的信息对于商务管理，生产控制，市场分析，工程设计和科学探索等领域的工作具有重要意义。

当运行图数据时，在任何给定的处理时间，可能有多个用户线程等待在计算机***的处理器或CPU上执行。现有技术中，当一个线程计算完一个任务后，该线程会随机去执行下一个任务，并不会去评估该任务的关键程度；并且不同的处理器或者CPU之间不进行通信，例如CPU1线程下的任务已经全部执行完毕，CPU2线程全部处于运行中，并且还有待处理任务在等待执行，这样就会出现CPU2执行时间较长，CPU1等待时间较长的问题，从而浪费计算资源。

有鉴于此，如今迫切需要设计一种基于图数据的计算运行调度方法，以便克服现有图数据运行的不足之处。

发明内容

本发明实施例提供了一种基于图数据的计算运行调度方法、***、计算机可读介质及设备，以解决现有图数据运行时浪费计算资源的技术问题。

本发明实施例提供一种基于图数据的计算运行调度方法，包括如下步骤：

将图数据划分成多个分区；

调度所述分区分配给多个处理器；

根据每个分区的关键程度将所述分区先后交给所述处理器对应的线程计算；

判断是否存在空闲处理器，当所述处理器包括一个或多个空闲线程时，则所述处理器为空闲处理器；

将所述空闲处理器和其它处理器进行通信，寻找所述其它处理器对应的待计算分区；

选择确定所述待计算分区；

将所述确定的待计算分区迁移绑定到所述空闲处理器的线程处理。

进一步的，分配给每个处理器的分区数量大于所述每个处理器对应的线程数量。

进一步的，若所述待计算分区数量为多个时，选择确定所述待计算分区的方法包括：

考虑每个所述待计算分区的执行时间以及所述待计算分区之间的迁移开销，评估损失和利益；

根据评估结果确定具体哪些所述待计算分区分配到所述空闲处理器；

确定所述待计算分区数据迁移到所述空闲处理器的方式。

同时，本发明实施例还提供一种基于图数据的计算运行调度***，包括：

划分模块，用于将图数据划分成多个分区；

调配模块，用于调度所述分区分配给多个处理器；

提交模块，用于根据每个分区的关键程度将所述分区先后交给所述处理器对应的线程计算；

判断模块，用于判断是否存在空闲处理器，当所述处理器包括一个或多个空闲线程时，则所述处理器为空闲处理器：

通信模块，用于将所述空闲处理器和其它处理器之间进行通信，找到所述其它处理器对应的待计算分区；

选择模块，用于选择确定所述待计算分区；

迁移模块，用于将所述确定的待计算分区迁移绑定到所述空闲处理器的线程处理。

进一步的，所述调配模块分配给每个处理器的分区数量大于所述每个处理器对应的线程数量。

进一步的，若所述待计算分区数量为多个时，所述选择模块选择确定所述待计算分区具体包括：

考虑每个所述待计算分区的执行时间以及所述待计算分区之间的迁移开销，评估损失和利益，获得一评估结果；

根据所述评估结果确定具体哪些所述待计算分区分配到所述空闲处理器；

确定所述待计算分区数据迁移到所述空闲处理器的方式。

另外，本发明实施例还提供一种存储用于图数据运行的计算机程序的计算机可读介质，所述计算机程序包括指令，用于使计算机***进行以下操作：

将图数据划分成多个分区；

调度所述分区分配给多个处理器；

选择确定所述待计算分区；

确定所述待计算分区数据迁移到所述空闲处理器的方式。

另外，本发明实施例还提供一种电子设备，包括处理器和存储器；存储器用于存储计算机程序，处理器用于执行存储器存储的计算机程序，以使所述电子设备执行上述任一项所述的基于图数据的计算运行调度方法。

本发明实施例的上述方案与现有技术相比，至少具有以下有益效果：

第一，处理器之间进行通信，能够减少每个处理器的等待时间；

第二，在线程执行计算分区前先评估分区的关键程度，能够减少某一处理器的执行时间，避免执行时间较长；

第三，对多个待计算分区进行评估选择，能够加速收敛，保证数据计算运行的正确性和终止性。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简要介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一个实施例所述基于图数据的计算运行调度方法的流程图；

图2是本发明一个实施例所述基于图数据的计算运行调度方法中选择待计算分区的方法流程图。

图3是本发明一个实施例所述基于图数据的计算运行调度***的结构示意图；

图4是本发明一个实施例所述电子设备的结构示意图；

图标：21-划分模块；22-调配模块；23-提交模块；24-判断模块；25-通信模块；26-选择模块；27-迁移模块。

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明作进一步地详细描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

下面结合附图详细说明本发明的优选实施例。

实施例1

本发明实施例提供一种基于图数据的计算运行调度方法，如图1所示，包括以下步骤：

S1，将图数据划分成多个分区。

对所述图数据进行分区的方式不限，只要满足分区的数量远大于线程数量即可，这样能够实现线程调度分区的情景。所述分区的数量多可以减小每个分区的大小，从而避免出现某些分区的计算量远大于其他分区的情况。优选的，所述分区可采用分区算法实现，例如，METIS。所述分区算法可以遵循保证跨分区边最少、跨分区点最少等原则。

本实施例中，结合非统一内存访问架构(NUMA)的处理***，对所述图数据进行三级分区。具体的，所述处理***包括至少一个计算设备，每个计算设备对应多个存储器，每个存储器对应多个处理器，三级分区具体方法包括：

根据所述计算设备的个数及计算设备之间的通信开销，对所述图数据进行分区，获得多个第一级分区；

根据所述每个计算设备中NUMA节点的个数及NUMA节点之间的通信开销，将所述每一个第一级分区分为多个第二级分区；

根据所述每个NUMA节点内工作节点数量及每个工作节点之间的通信开销，将所述每一个第二级分区分为多个第三级分区，其中，工作节点包括处理器或处理器线程。

形成的每个第三级分区内的数据是关联程度较高的数据；相连两个第三级分区的数据会存在共用边数据，一旦一个分区更新了边数据，需要通过消息去通知相邻的分区进行更新。

所述图数据是用图来存储数据，是最接近高性能的一种用于存储数据的数据结构方式之一。一个图由无数的节点和关系组成，节点之间的关系是图数据库很重要的一部分，通过关系可以找到很多关联的数据，比如节点集合，关系集合以及他们的属性集合。

S2，调度所述分区分配给多个处理器。

在步骤S1完成分区后，由于每个分区的数据大小不同，可以给每个处理器调度分配不同数量的分区。所述每个处理器可以对应多个线程，分配给每个处理器的分区数量可以大于所述每个处理器对应的线程数量。所述调度可以采用现有的调度算法来执行。本实施例中，调度器控制所述处理器调取不同的分区。

S3，根据每个分区的关键程度将所述分区先后交给所述处理器对应的线程计算。

每个线程从所述处理器中调取分区数据去执行计算，当执行完成后，可以继续在所述处理器中调取下一个分区进行执行，此时，需要去评估每个分区的关键程度，确定出关键分区并调取执行，使线程先计算关键分区，这样可以减少分区的执行时间。

所述关键分区是根据数据运行时参数及其统计信息来评估的。如第一个分区、第二个分区均与第三个分区的数据相关联，此时就可以确定所述第三个分区为关键分区，所述线程可以优先执行计算所述第三个分区。

S4，判断是否存在空闲处理器，当所述处理器包括一个或多个空闲线程时，则所述处理器为空闲处理器；

S5，将所述空闲处理器和其它处理器进行通信，寻找所述其它处理器对应的待计算分区。

所述其它处理器是指除所述空闲处理器之外的其它处理器。该其它处理器线程可能均处于运行状态，也可能有空闲线程。

当判断存在空闲处理器时，所述空闲处理器可以向其他任意一个其它处理器发送有空闲线程的消息。当其它处理器接收到消息时，若其它处理器存在待计算分区时，该其它处理器可以将所述待计算分区分配给空闲处理器进行计算。所述待计算分区是指线程还未执行的分区。

S6，选择确定所述待计算分区；

当所述待计算分区数量为多个时，具体需要分配几个分区、哪几个分区迁移到空闲处理器，需要对其进行具体评估。如图2所示，选择确定所述待计算分区的评估方法具体包括：

S61，考虑每个所述待计算分区的执行时间以及所述待计算分区之间的迁移开销，评估损失和利益，获得一评估结果。

所述待计算分区的数据大小不同，需要执行计算的时间也会不同，此时需要整体考虑处理器下的分区执行时间，防止执行时间长的分区都分配到同一处理器。除了考虑分区的执行时间，还需要考虑所述待计算分区之间的迁移开销，该迁移开销包括将待计算分区的数据从一台机器传输到另一台机器(通信开销)和在目的机器上重建待计算分区两部分，这两部分的时间开销构成了迁移开销。

所述评估结果包括每个待计算分区的损失和利益数据。评估过程中可以采用评估算法进行计算，如贪心算法。

S62，根据评估结果确定具体哪些所述待计算分区分配到所述空闲处理器。

根据比较所述每个待计算分区的损失和利益数据来确定哪些待计算分区可分配到所述空闲处理器。比如可以将利益大于损失的分区分配给空闲处理器。

S63，确定所述待计算分区数据迁移到所述空闲处理器的方式。

所述空闲处理器可以从磁盘或者其它处理器复制所述待计算分区的数据，并绑定到空闲线程中进行计算。

S7，将所述确定的待计算分区迁移绑定到所述空闲处理器的线程处理。

具体的，所述迁移的过程是将待计算分区的数据从一台机器传输到另一台机器(通信)，并在目的机器上重建待计算分区，该待计算分区被绑定到所述空闲处理器的线程进行处理。

本发明实施例提供的基于图数据的计算运行调度方法中，将各个处理器之间进行通信，重新分配待计算分区，能够减少每个处理器的等待时间；在线程执行计算分区前先评估分区的关键程度，能够减少某一处理器的执行时间，避免执行时间较长；对多个待计算分区进行评估选择，能够加速收敛，保证数据计算运行的正确性和终止性。

实施例2

如图3所示，本发明实施例提供一种基于图数据的计算运行调度***，包括：

划分模块21，用于将图数据划分成多个分区。

调配模块22，用于调度所述分区分配给多个处理器。所述划分模块21完成分区后，由于每个分区的数据大小不同，可以给每个服务器分配不同数量的分区。所述每个处理器可以对应多个线程，分配给每个处理器的分区数量可以大于所述每个处理器对应的线程数量。所述调配模块22可以采用现有的调度算法来执行。调度器控制所述处理器调取不同的分区。

提交模块23，用于根据每个分区的关键程度将所述分区先后交给所述处理器对应的线程计算。每个线程从所述处理器中调取分区数据去执行计算，当执行完成后，可以继续在所述处理器中调取下一个分区进行执行，此时，需要去评估每个分区的关键程度，确定关键分区并调取执行，使线程先计算关键分区，这样可以减少分区的执行时间。

判断模块24，用于判断是否存在空闲处理器，当所述处理器包括一个或多个空闲线程时，则判断所述处理器为空闲处理器。

通信模块25，用于将所述空闲处理器和其它处理器之间进行通信，找到所述其它处理器对应的待计算分区。当存在空闲处理器时，所述空闲处理器可以向任意一个其它处理器发送有空闲线程的消息。当其它处理器接收到消息时，若其它处理器下存在待计算分区时，该其它处理器可以将所述待计算分区分配给空闲处理器进行计算。

选择模块26，用于选择确定所述待计算分区。当所述待计算分区数量为多个时，具体需要分配几个分区、哪几个分区到空闲处理器，所述选择模块26需要对多个待计算分区进行具体评估。所述选择模块具体包括：

考虑每个所述待计算分区的执行时间以及所述待计算分区之间的迁移开销，评估损失和利益，获得一评估结果。所述待计算分区的数据大小不同，需要执行计算的时间也会不同，此时需要整体考虑处理器下的分区执行时间，防止执行时间长的分区都分配到同一处理器。除了考虑分区的执行时间，还需要考虑所述待计算分区之间的迁移开销，该迁移开销包括将待计算分区的数据从一台机器传输到另一台机器(通信开销)和在目的机器上重建待计算分区两部分，这两部分的时间开销构成了迁移开销。

根据评估结果确定具体哪些所述待计算分区分配到所述空闲处理器。具体的，根据比较所述每个待计算分区的损失和利益数据来确定哪些待计算分区可分配到所述空闲处理器，比如可以将利益大于损失的分区分配给空闲处理器。

确定所述待计算分区数据迁移到所述空闲处理器的方式。具体的，所述空闲处理器可以从磁盘或者其它处理器复制所述待计算分区的数据。

迁移模块27，用于将上述确定的待计算分区迁移绑定到所述空闲处理器的线程处理。具体的，所述迁移的过程是将待计算分区的数据从一台机器传输到另一台机器(通信)，并在目的机器上重建待计算分区，该待计算分区被绑定到所述空闲处理器的线程进行处理。

本发明实施例提供的基于图数据的计算运行调度***中，将各个处理器之间进行通信，重新分配待计算分区，能够减少每个处理器的等待时间；在线程执行计算分区前先评估分区的关键程度，能够减少某一处理器的执行时间，避免执行时间较长；对多个待计算分区进行评估选择，能够加速收敛，保证数据计算运行的正确性和终止性。

实施例3

本发明实施例提供一种存储用于图数据运行的计算机程序的计算机可读介质，所述计算机程序包括指令，用于使计算机***进行以下操作：

将图数据划分成多个分区；

调度所述分区分配给多个处理器；

选择确定所述待计算分区；

其中，分配给每个处理器的分区数量大于所述每个处理器对应的线程数量。

其中，若所述待计算分区数量为多个时，选择确定所述待计算分区的方法包括：

确定所述待计算分区数据迁移到所述空闲处理器的方式。

所述计算机可读存储介质可以为ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

本发明实施例提供的存储用于图数据运行的计算机程序的计算机可读介质，将各个处理器之间进行通信，重新分配待计算分区，能够减少每个处理器的等待时间；在线程执行计算分区前先评估分区的关键程度，能够减少某一处理器的执行时间，避免执行时间较长；对多个待计算分区进行评估选择，能够加速收敛，保证数据计算运行的正确性和终止性。

实施例4

本发明实施例还提供一种电子设备，包括处理器41和存储器42；存储器42用于存储计算机程序，处理器41用于执行存储器存储的计算机程序，以使所述电子设备执行上述任一项所述的基于图数据的计算运行调度方法。

该基于图数据的计算运行调度方法的具体原理如上述实施例所述，在此不再一一赘述。

本发明实施例的电子设备以多种形式存在，包括但不限于:

(1)移动通信设备:这类设备的特点是具备移动通信功能，并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手机、功能性手机，以及低端手机等。

(2)超移动个人计算机设备:这类设备属于个人计算机的范畴，有计算和处理功能，一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等，例如iPad。

(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器(例如iPod)，掌上游戏机，电子书，以及智能玩具和便携式车载导航设备。

(4)服务器以及个人计算机、云服务计算节点:提供计算服务的设备，服务器的构成包括处理器、硬盘、内存、***总线等，服务器和通用的计算机架构类似，但是由于需要提供高可靠的服务，因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。

本发明实施例提供的电子设备将各个处理器之间进行通信，重新分配待计算分区，能够减少每个处理器的等待时间；在线程执行计算分区前先评估分区的关键程度，能够减少某一处理器的执行时间，避免执行时间较长；对多个待计算分区进行评估选择，能够加速收敛，保证数据计算运行的正确性和终止性。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

一种基于图数据的计算运行调度方法，其特征在于，包括：

将图数据划分成多个分区；

调度所述分区分配给多个处理器；

根据每个分区的关键程度将所述分区先后交给所述处理器对应的线程计算；

判断是否存在空闲处理器，当所述处理器包括一个或多个空闲线程时，则所述处理器为空闲处理器；

将所述空闲处理器和其它处理器进行通信，寻找所述其它处理器对应的待计算分区；

选择确定所述待计算分区；

将所述确定的待计算分区迁移绑定到所述空闲处理器的线程处理。
根据权利要求1所述的基于图数据的计算运行调度方法，其特征在于，分配给每个处理器的分区数量大于所述每个处理器对应的线程数量。
根据权利要求1所述的基于图数据的计算运行调度方法，其特征在于，若所述待计算分区数量为多个时，选择确定所述待计算分区的方法包括：

考虑每个所述待计算分区的执行时间以及所述待计算分区之间的迁移开销，评估损失和利益，获得一评估结果；

根据所述评估结果确定具体哪些所述待计算分区分配到所述空闲处理器；

确定所述待计算分区数据迁移到所述空闲处理器的方式。
一种基于图数据的计算运行调度***，其特征在于，包括：

划分模块，用于将图数据划分成多个分区；

调配模块，用于调度所述分区并分配给多个处理器；

提交模块，用于根据每个分区的关键程度将所述分区先后交给所述处理器对应的线程计算；

判断模块，用于判断是否存在空闲处理器，当所述处理器包括一个或多个空闲线程时，则所述处理器为空闲处理器；

通信模块，用于将所述空闲处理器和其它处理器之间进行通信，找到所述其它处理器对应的待计算分区；

选择模块，用于选择确定所述待计算分区；

迁移模块，用于将所述确定的待计算分区迁移绑定到所述空闲处理器的线程处理。
根据权利要求4所述的基于图数据的计算运行调度***，其特征在于，所述调配模块分配给每个处理器的分区数量大于所述每个处理器对应的线程数量。
根据权利要求4所述的基于图数据的计算运行调度***，其特征在于，若所述待计算分区数量为多个时，所述选择模块选择确定所述待计算分区具体包括：

考虑每个所述待计算分区的执行时间以及所述待计算分区之间的迁移开销，评估损失和利益，获得一评估结果；

根据所述评估结果确定具体哪些所述待计算分区分配到所述空闲处理器；

确定所述待计算分区数据迁移到所述空闲处理器的方式。
一种存储用于图数据运行的计算机程序的计算机可读介质，其特征在于，所述计算机程序包括指令，用于使计算机***进行以下操作：

将图数据划分成多个分区；

调度所述分区分配给多个处理器；

根据每个分区的关键程度将所述分区先后交给所述处理器对应的线程计算；

判断是否存在空闲处理器，当所述处理器包括一个或多个空闲线程时，则所述处理器为空闲处理器；

将所述空闲处理器和其它处理器进行通信，寻找所述其它处理器对应的待计算分区；

选择确定所述待计算分区；

将所述确定的待计算分区迁移绑定到所述空闲处理器的线程处理。
根据权利要求7所述的计算机可读介质，其特征在于，分配给每个处理器的分区数量大于所述每个处理器对应的线程数量。
根据权利要求7所述的计算机可读介质，其特征在于，若所述待计算分区数量为多个时，选择确定所述待计算分区的方法包括：

考虑每个所述待计算分区的执行时间以及所述待计算分区之间的迁移开销，评估损失和利益，获得一评估结果；

根据所述评估结果确定具体哪些所述待计算分区分配到所述空闲处理器；

确定所述待计算分区数据迁移到所述空闲处理器的方式。
一种电子设备，其特征在于，包括处理器和存储器；存储器用于存储计算机程序，处理器用于执行存储器存储的计算机程序，以使所述电子设备执行上述任一项所述的基于图数据的计算运行调度方法。