WO2017035813A1

WO2017035813A1 - 一种数据访问方法、装置及***

Info

Publication number: WO2017035813A1
Application number: PCT/CN2015/088872
Authority: WO
Inventors: 汪涛; 张广飞; 宋风龙
Original assignee: 华为技术有限公司
Priority date: 2015-09-02
Filing date: 2015-09-02
Publication date: 2017-03-09
Also published as: CN107209761B; CN107209761A

Abstract

一种数据访问方法、装置及***，涉及计算机领域，可降低GPU访问数据时的访问延时。该方法包括：GPU获取第一内存页的访问请求，该访问请求中携带有第一内存页的物理地址（101）；GPU根据第一内存页的物理地址以及预置的物理地址与内存页的标识之间的对应关系，查找最近最多访问MRU表中与第一内存页的物理地址对应的MRU表项中是否包含第一内存页的标识（102）；若第一内存页的物理地址对应的MRU表项中不包含第一内存页的标识，则GPU向中央处理器CPU发送页搬运请求，以使得CPU根据页搬运请求将第一内存页存储至显存中（103）；GPU从显存中访问第一内存页（104）。

Description

一种数据访问方法、装置及***

技术领域

本发明涉及计算机领域，尤其涉及一种数据访问方法、装置及***。

背景技术

图形处理器(Graphics Processing Unit，GPU)，是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上进行图像运算工作的微处理器。

通常，GPU需要处理的数据分别存放在显存和内存中，如图1所示，显存直接与GPU相连接，而内存与中央处理器(Central Processing Unit，CPU)直接连接，当GPU需要获取内存中的数据时，由于，GPU与CPU之间通过AGP(Accelerated Graphic Ports，一种图形***接口)总线或者PCI-E(Peripheral Component Interconnect-Express，新一代的总线接口)总线连接，因此，GPU可以通过CPU从内存中访问相应的数据。

其中，GPU与显存之间的通信带宽通常在200GB/S左右，CPU与内存之间的通信带宽通常在80GB/S左右，但内存的容量通常是显存容量的8倍左右，因此，通常在安装程序的同时，使用编译器预测访问次数较高的热点数据，并将该热点数据分配在显存内，这样，在程序运行时，由于存储在显存中的热点数据的访问频率较高，因此，GPU可以较为快速的从显存中获取需要的数据。

然而，这种数据分配方法在安装程序时就已经将预测得到的热点数据分配至显存中，一旦程序运行时显存中存储的数据便无法修改，而随着多核技术的发展，在程序运行的过程中GPU的访问数据具有突发性、不规则性和不可预测性等特征，原本存储在内存中的数据也有可能成为热点数据，此时，GPU只能通过CPU从通信带宽较低的内存中访问数据，导致GPU访问数据时的访问延时增加。

发明内容

本发明的实施例提供一种数据访问方法、装置及***，可降低GPU访问数据时的访问延时。

为达到上述目的，本发明的实施例采用如下技术方案：

第一方面，本发明的实施例提供一种数据访问方法，包括：

GPU获取第一内存页的访问请求，所述访问请求中携带有所述第一内存页的物理地址；

所述GPU根据所述第一内存页的物理地址以及预置的物理地址与内存页的标识之间的对应关系，查找最近最多访问MRU表中与所述第一内存页的物理地址对应的MRU表项中是否包含所述第一内存页的标识，所述MRU表中包含每个内存页组中存储在显存中的内存页的标识，所述第一内存页的标识为所述第一内存页在所属的内存页组中的唯一标识；

若所述第一内存页的物理地址对应的MRU表项中不包含所述第一内存页的标识，则所述GPU向中央处理器CPU发送页搬运请求，以使得所述CPU根据所述页搬运请求将所述第一内存页存储至所述显存中；

所述GPU从所述显存中访问所述第一内存页。

结合第一方面，在第一方面的第一种可能的实现方式中，所述MRU表由多个MRU表项组成，所述MRU表项与所述内存页组之间一一对应，其中，

所述GPU根据所述第一内存页的物理地址以及预置的物理地址与内存页的标识之间的对应关系，查找MRU表中与所述第一内存页的物理地址对应的MRU表项中是否包含所述第一内存页的标识，包括:

所述GPU根据所述第一内存页的物理地址中的X个比特位，在所述MRU表中确定与所述第一内存页的物理地址对应的第一MRU表项，所述X个比特位用于唯一表示所述第一内存页所属的第一内存页组，X≥1；

所述GPU根据所述第一内存页的物理地址和所述第一MRU表项中存储的第二内存页的标识，确定所述第一MRU表项中是否包含所述第一内存页的标识。

结合第一方面的第一种可能的实现方式，在第一方面的第二种可能的实现方式中，所述GPU根据所述第一内存页的物理地址和所述第一MRU表项中存储的第二内存页的标识，确定所述第一MRU表项中是否包含所述第一内存页的标识，包括：

所述GPU将所述第一内存页的物理地址中的Z个比特位作为所述第一内存页的标识，所述Z个比特位用于唯一表示在所述第一内存页组中所述第一内存页的标识，Z≥1；

若所述第二内存页的标识与所述第一内存页的标识相同，所述GPU则确定所述第一MRU表项中包含所述第一内存页的标识；

若所述第二内存页的标识与所述第一内存页的标识不同，所述GPU则确定所述第一MRU表项中不包含所述第一内存页的标识。

结合第一方面的第一或第二种可能的实现方式，在第一方面的第三种可能的实现方式中，若所述第一MRU表项中不包含所述第一内存页的标识，所述方法还包括：

所述GPU将所述第一MRU表项中所述第二内存页的标识修改为所述第一内存页的标识。

结合第一方面的第三种可能的实现方式，在所述GPU将所述第一MRU表项中所述第二内存页的标识修改为所述第一内存页的标识之后，还包括：

所述GPU通过所述CPU将所述第二内存页存储至所述内存；

所述GPU将所述显存中存储的所述第二内存页删除。

结合第一方面的第一至第四种可能的实现方式，在第一方面的第五种可能的实现方式中，若所述第一MRU表项中包含所述第一内存页的标识，则所述方法还包括：

所述GPU从所述显存中访问所述第一内存页。

第二方面，本发明的实施例提供一种数据访问装置，包括：

获取单元，用于获取第一内存页的访问请求，所述访问请求中携带有所述第一内存页的物理地址；

查找单元，用于根据所述第一内存页的物理地址以及预置的物理地址与内存页的标识之间的对应关系，查找最近最多访问MRU表中与所述第一内存页的物理地址对应的MRU表项中是否包含所述第一内存页的标识，所述MRU表中包含每个内存页组中存储在显存中的内存页的标识，所述第一内存页的标识为所述第一内存页在所属的内存页组中的唯一标识；

发送单元，用于所述第一内存页的物理地址对应的MRU表项中不包含所述第一内存页的标识，则所述GPU向中央处理器CPU发送页搬运请求，以使得所述CPU根据所述页搬运请求将所述第一内存页存储至所述显存中；

访问单元，用于从所述显存中访问所述第一内存页。

结合第二方面，在第二方面的第一种可能的实现方式中，所述装置还包括：

确定单元，用于根据所述第一内存页的物理地址中的X个比特位，在所述MRU表中确定与所述第一内存页的物理地址对应的第一MRU表项，所述X个比特位用于唯一表示所述第一内存页所属的第一内存页组，X≥1；以及，根据所述第一内存页的物理地址和所述第一MRU表项中存储的第二内存页的标识，确定所述第一MRU表项中是否包含所述第一内存页的标识；

其中，所述MRU表由多个MRU表项组成，所述MRU表项与所述内存页组之间一一对应。

结合第二方面的第一种可能的实现方式，在第二方面的第二种可能的实现方式中，

所述确定单元，具体用于根据所述第一内存页的物理地址和所述第一MRU表项中存储的第二内存页的标识，确定所述第一MRU表项中是否包含所述第一内存页的标识；若所述第二内存页的标识与所述第一内存页的标识相同，所述GPU则确定所述第一MRU表项中包含所述第一内存页的标识；若所述第二内存页的标识与所述第一内存页的标识不同，所述GPU则确定所述第一MRU表项中不包含所述第一内存页的标识。

结合第二方面的第一或第二种可能的实现方式，在第二方面的第三种可能的实现方式中，所述装置还包括：

修改单元，用于将所述第一MRU表项中所述第二内存页的标识修改为所述第一内存页的标识。

结合第二方面的第三种可能的实现方式，在第二方面的第四种可能的实现方式中，所述装置还包括：

存储单元，用于通过CPU将所述第二内存页存储至所述内存；

删除单元，用于将所述显存中存储的所述第二内存页删除。

结合第二方面的第一至第四种可能的实现方式，在第二方面的第五种可能的实现方式中，

所述访问单元，还用于若所述第一MRU表项中包含所述第一内存页的标识，则从所述显存中访问所述第一内存页。

结合第二方面的第一至第五种可能的实现方式，在第二方面的第五种可能的实现方式中，所述数据访问装置为GPU。

第三方面，本发明的实施例提供一种数据访问***，所述***包括图形处理器GPU、与所述GPU均相连的中央处理器CPU和显存、以及与所述CPU相连的内存；其中，

所述GPU用于：获取第一内存页的访问请求，所述访问请求中携带有所述第一内存页的物理地址；根据所述第一内存页的物理地址以及预置的物理地址与内存页的标识之间的对应关系，查找最近最多访问MRU表中与所述第一内存页的物理地址对应的MRU表项中是否包含所述第一内存页的标识，所述MRU表中包含每个内存页组中存储在显存中的内存页的标识，所述第一内存页的标识为所述第一内存页在所属的内存页组中的唯一标识；若所述第一内存页的物理地址对应的MRU表项中不包含所述第一内存页的标识，则所述GPU向中央处理器CPU发送页搬运请求，以使得所述CPU根据所述页搬运请求将所述第一内存页存储至所述显存中；并从所述显存中访问所述第一内存页。

结合第三方面，在第三方面的第一种可能的实现方式中，所述MRU表由多个MRU表项组成，所述MRU表项与所述内存页组之间一一对应，其中，

所述GPU还用于：根据所述第一内存页的物理地址中的X个比特位，在所述MRU表中确定与所述第一内存页的物理地址对应的第一MRU表项，所述X个比特位用于唯一表示所述第一内存页所属的第一内存页组，X≥1；以及，根据所述第一内存页的物理地址和所述第一MRU表项中存储的第二内存页的标识，确定所述第一MRU表项中是否包含所述第一内存页的标识。

结合第三方面的第一种可能的实现方式，在第三方面的第二种可能的实现方式中，

结合第三方面的第一或第二种可能的实现方式，在第三方面的第三种可能的实现方式中，

所述GPU还用于：将所述第一MRU表项中所述第二内存页的标识修改为所述第一内存页的标识。

结合第三方面的第一或第二种可能的实现方式，在第三方面的第四种可能的实现方式中，

所述GPU还用于：通过所述CPU将所述第二内存页存储至所述内存；以及，将所述显存中存储的所述第二内存页删除。

结合第三方面的第一或第四种可能的实现方式，在第三方面的第五种可能的实现方式中，

所述GPU还用于：若所述第一MRU表项中包含所述第一内存页的标识，则从所述显存中访问所述第一内存页。

本发明的实施例提供一种数据访问方法、装置及***，其中，GPU获取第一内存页的访问请求，该访问请求中携带有第一内存页的物理地址；进而，GPU根据该物理地址以及预置的物理地址与内存页的标识之间的对应关系，查找MRU表中与第一内存页的物理地址对应的MRU表项中是否存储有第一内存页的标识，其中，该MRU表中包含每个内存页组中存储在显存中的内存页的标识；若该MRU表中与第一内存页的物理地址对应的MRU表项中不包含所述第一内存页的标识，即该第一内存页存储在内存中，而没有存储在显存中，此时，GPU向CPU发送页搬运请求，以使得CPU根据页搬运请求将第一内存页存储至显存中；以便于GPU从显存中访问第一内存页。这样一来，由于内存中的各个内存页组中均有一个内存页存储在显存中，因此，GPU可以根据待访问的第一内存页的物理地址，在程序运行的过程中动态的将每个内存页组中待访问的内存页搬运到显存中进行访问，这样，GPU可以充分利用显存的高通信带宽和内存的高容量的特点，根据访问需求动态的修改显存中的存放的内存页，降低GPU从内存和显存中访问数据的访问延时。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。

图1为现有技术中GPU、CPU、显存和内存之间的连接示意图；

图2为本发明实施例提供的一种数据访问方法的流程示意图一；

图3为本发明实施例提供的内存中的多个内存页组的示意图；

图4为本发明实施例提供的一种数据访问方法的流程示意图二；

图5为本发明实施例提供的一种数据访问装置的结构示意图一；

图6为本发明实施例提供的一种数据访问装置的结构示意图二；

图7为本发明实施例提供的一种数据访问装置的结构示意图三；

图8为本发明实施例提供的一种数据访问装置的结构示意图四；

图9为本发明实施例提供的一种数据访问***的结构示意图一；

图10为本发明实施例提供的一种数据访问***的结构示意图二。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。

另外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中，除非另有说明，“多个”的含义是两个或两个以上。

本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

实施例1

本发明的实施例提供一种数据访问方法，如图2所示，包括：

101、GPU获取第一内存页的访问请求，该访问请求中携带有第一内存页的物理地址。

102、GPU根据该第一内存页的物理地址以及预置的物理地址与内存页的标识之间的对应关系，查找MRU表中与该第一内存页的物理地址对应的MRU表项中是否包含该第一内存页的标识。

103、若该MRU表中不包含该第一内存页的标识，则GPU向CPU发送页搬运请求，以使得CPU根据页搬运请求将第一内存页存储至显存中。

104、GPU从该显存中访问该第一内存页。

具体的，GPU需要通过调取存储在显存或内存中的数据，实现图像运算工作，而显存或内存中的数据均是以页为单位进行管理和访问，即显存或内存中的数据可以分为多个内存页。例如，一个内存页的大小为64KB，即一个内存页包括64KB的数据，那么一个8G的内存中便含有131072个内存页，而每个内存页均与一个物理地址(Physical Address)相对应，GPU或者CPU可以通过物理地址进行寻址操作，查找并访问该物理地址所指示的内存页。

在步骤101中，GPU在运行过程中，可以从CPU处获取第一内存页的访问请求，以实现针对第一内存页中存储的数据的图像运算工作，例如，用户触发3D显示指令时，CPU根据该3D显示指令生成第一内存页的访问请求后通过总线发送至GPU，以便于GPU根据该访问请求获取第一内存页，进行3D显示。

其中，该访问请求中携带有第一内存页的物理地址。

在步骤102中，GPU根据步骤101中获取的该第一内存页的物理地址以及预置的物理地址与内存页的标识之间的对应关系，查找预先存储的MRU(Most Recently Used，最近最多使用的)表中，与该第一内存页的物理地址对应的MRU表项中是否包含第一内存页的标识。

其中，该MRU表中包含每个内存页组中存储在显存中的内存页的标识，该第一内存页的标识为该第一内存页在所属的内存页组中的唯一标识。

具体的，由于GPU需要处理的数据分别存放在显存和内存中，GPU可以快速的直接从显存中访问数据，或者，GPU需要通过CPU从容量较大但通信带宽较小的内存中访问数据。为了降低GPU从内存和显存中访问数据的访问延时，同时充分利用显存的高通信带宽和内存的高容量的特点，可以在GPU运行的***中预先存储MRU表，其中，该MRU表中至少记录有每个内存页组中存储在显存中的内存页的标识。

示例性的，如图3所示，可以将64G的内存划分为多个内存页组，例如A、B、C、D、E、F、G和H共8个内存页为一个内存页组，以一个内存页组为64KB举例，那么64G的内存中共有131072个内存页组，其中，MRU表中记录了每个内存页组中存储在显存中的内存页的标识，例如，MRU表也设置有131072个MRU表项，与内存页组的个数相同，当内存页A存储在显存中，那么如果内存页A的标识为000，则MRU表的第一MRU表项内便存储有内存页A的标识000。

其中，MRU表中可以包括该预置的物理地址与内存页的标识之间的对应关系，如表1所示的MRU表，GPU可以根据第一内存页的物理地址，确定该第一内存页的物理地址落入哪个内存页组的地址范围之中，进而确定该第一内存页所属的内存页组(即确定与第一内存页的物理地址所对应的MRU表项)，以及在该MRU表项中存储在显存中的内存页的标识。

表1

内存页组的地址范围	内存页的标识
内存页组的地址范围	内存页的标识	第一内存页组的地址范围	000
第二内存页组的地址范围	101	第一内存页组的地址范围	000
第二内存页组的地址范围	101	……	……

这样，当GPU获取到第一内存页的物理地址时，GPU可以根据该物理地址以及预置的物理地址与内存页的标识之间的对应关系，在与第一内存页的物理地址对应的MRU表项中，查找显存中是否存储有第一内存页的标识，如果第一内存页的标识记录在MRU表中与第一内存页的物理地址对应的MRU表项中，则说明显存中存储有该第一内存页；如果第一内存页的标识未记录在MRU表中与第一内存页的物理地址对应的MRU表项中，则说明显存中没有存储该第一内存页。

另外，可以在GPU所在的***内单独设置一个存储装置(例如寄存器等)用于存放该MRU表，这样，当GPU获取到第一内存页的物理地址时，可直接从该存储装置中访问该MRU表，避免GPU从内存或显存中访问该MRU表所带来的访问延时。

需要说明的是，图3中仅仅是举例说明将64G的内存划分为多个内存页组的方式，应当理解的是，将内存划分为多个内存页组的方式可以有多种，例如按照内存的物理地址进行划分，或者按照内存页的访问频率进行划分等，本发明实施例对此不做限定。

在步骤103中，若显存中不包括该第一内存页，即第一内存页的标识未记录在该第一内存页的物理地址对应的MRU表项中，则说明内存中存储有该第一内存页，此时，GPU可以向CPU发送页搬运请求，以使得CPU根据页搬运请求将第一内存页存储至显存中。

当然，当CPU根据页搬运请求将第一内存页存储至显存之后，由于第一内存页存储在显存中，因此GPU还可以对MRU表中，与第一内存页的物理地址对应的MRU表项进行修改，在该MRU表项中记录存储在显存中的第一内存页的标识，以建立该第一内存页的标识与该第一内存页的物理地址的对应关系，以方便后续GPU再次获取到该第一内存页中的数据的物理地址时，直接查找MRU表以确定该第一内存页存储在显存中。

可以看出，GPU根据待访问的第一内存页的物理地址，确定第一内存页的标识是否存储在第一内存页的物理地址所对应的MRU表项中，进而确定第一内存页的标识是否存储在显存中，如果第一内存页的标识未记录在MRU表中与第一内存页的物理地址对应的MRU表项中，则说明显存中没有存储该第一内存页，GPU可以将第一内存页搬运到显存中进行访问，这样，可以在程序执行的过程中，动态的将每个内存页组中最近最多使用的内存页搬运至显存中，使得GPU可以充分利用显存的高通信带宽和内存的高容量的特点，根据访问需求动态的修改显存中的存放的内存页，降低GPU访问数据的访问延时。

最后，在步骤104中，由于在步骤103中已经将第一内存页存储至显存中，因此，GPU可以直接从通信带宽较高的显存中访问该第一内存页。

本发明的实施例提供一种数据访问方法，其中，GPU获取第一内存页的访问请求，该访问请求中携带有第一内存页的物理地址；进而，GPU根据该物理地址以及预置的物理地址与内存页的标识之间的对应关系，查找MRU表中与第一内存页的物理地址对应的MRU表项中是否存储有第一内存页的标识，其中，该MRU表中包含每个内存页组中存储在显存中的内存页的标识；若该MRU表中与第一内存页的物理地址对应的MRU表项中不包含所述第一内存页的标识，即该第一内存页存储在内存中，而没有存储在显存中，此时，GPU向CPU发送页搬运请求，以使得CPU根据页搬运请求将第一内存页存储至显存中；以便于GPU从显存中访问第一内存页。这样一来，由于内存中的各个内存页组中均有一个内存页存储在显存中，因此，GPU可以根据待访问的第一内存页的物理地址，在程序运行的过程中动态的将每个内存页组中待访问的内存页搬运到显存中进行访问，这样，GPU可以充分利用显存的高通信带宽和内存的高容量的特点，根据访问需求动态的修改显存中的存放的内存页，降低GPU从内存和显存中访问数据的访问延时。

实施例2

本发明的实施例提供一种数据访问方法，如图4所示，包括：

201、GPU获取第一内存页的访问请求，该访问请求中携带有第一内存页的物理地址。

202、GPU根据该第一内存页的物理地址中的X个比特位，在MRU表中确定与该第一内存页的物理地址对应的第一MRU表项，该X个比特位用于唯一表示该第一内存页所属的第一内存页组。

203、GPU将该第一内存页的物理地址中的Z个比特位作为该第一内存页的标识，该Z个比特位用于唯一表示在该第一内存页组中该第一内存页的标识。

204、若该第一内存页的标识与该第一MRU表项中存储的第二内存页的标识不同，GPU则向CPU发送页搬运请求，以使得CPU根据页搬运请求将第一内存页存储至显存中。

205、GPU在该MRU表中将第一MRU表项中该第二内存页的标识修改为该第一内存页的标识。

206、GPU通过CPU将第二内存页存储至内存；并且，将显存中存储的第二内存页删除。

207、GPU从显存中访问该第一内存页。

在步骤201中，GPU在运行过程中，可以从CPU处获取第一内存页的访问请求，以实现针对第一内存页中数据的图像运算工作，其中，该访问请求中携带有第一内存页的物理地址。

具体的，GPU所在的***中预先存储有MRU表，该MRU表由多个MRU表项组成，一个MRU表项与一个内存页组之间一一对应，并且，任意一个MRU表项中均存储有一个内存页的标识，该内存页的标识为其所在的MRU表项对应的内存页组中存储在显存中的内存页的标识。

在步骤202中，GPU根据步骤201中获取的该第一内存页的物理地址中的X个比特位(X≥1)，在MRU表中确定该第一内存页的物理地址所对应的第一MRU表项，由于一个MRU表项与一个内存页组之间一一对应，因此，可以根据该物理地址中的X个比特，确定该第一内存页所在的第一内存页组。

仍以实施例1中图3所示的64G内存和8G显存为例进行说明，A、B、C、D、E、F、G和H共8个内存页为一个内存页组，64G的内存中共有131072个内存页组，对应的，如表2所示，MRU表也设置有131072个MRU表项(即2¹⁷个MRU表项)，与内存页组的个数相同，该MRU表中每一个MRU表项内存储有对应的内存页组中存储在显存中的内存页的标识，例如，第一MRU表项中存储有内存页A的标识000，即A、B、C、D、E、F、G和H组成的内存页组中内存页A存储在显存中。

表2

此时，若从步骤201中获取的物理地址为Y个比特位，那么，GPU可以从这Y个比特位的物理地址中的X个比特位中，确定在MRU表中该物理地址所对应的第一MRU表项，即确定该第一内存页所在的第一内存页组，其中，该第一MRU表项中存储有第二内存页的标识，Y≥X≥1。

示例性的，从步骤201中获取的第一内存页的物理地址为36位，假设每个内存页的大小为64Kb，其中，这36位物理地址中的1-16个比特位用于指示一个内存页的页内偏移量，而这36位物理地址中的17-33个比特位作为该X个比特，用于指示该第一内存页所属的第一MRU表项，即该第一内存页所属的第一内存页组。

那么GPU可以根据这36位物理地址中的16-33个比特位，在131072个MRU表项组成的MRU表中，确定该物理地址指示的MRU表项是哪一个(即第一MRU表项)，进而，该第一MRU表项中存储的内存页的标识即为上述第二内存页的标识。

例如，第一内存页的物理地址为E0000FFFF(16进制)，转换为2进制即为111000000000000000001111111111111111共36位，那么，GPU可以根据其中的17-33位确定在MRU表中该物理地址所指示的MRU表项，即根据00000000000000000确定在MRU表中该物理地址所指示的MRU表项为第一MRU表项(如表2所示)。

此时，在步骤203中，GPU可以将该36位物理地址中的Z个比特位作为该第一内存页的标识，其中，该Z个比特位用于唯一表示在该第一内存页组中该第一内存页的标识，例如，若一个内存页组中共有8个内存页，那么，3个比特位即可以唯一表示8个内存页中任一个内存页的标识，示例性的，可以用该物理地址中的第34-36个比特位作为该第一内存页的标识。

进一步地，在步骤204中，GPU将步骤203中作为该第一内存页的标识的Z个比特位，与步骤202中第一MRU表项内存储的第二内存页的标识进行比较，若Z个比特位与第二内存页的标识相同，则MRU表中第一MRU表项所指示的第二内存页与第一内存页相同，说明该第一内存页存储在显存中；若Z个比特位与第二内存页的标识不同，则MRU表中第一MRU表项所指示的第二内存页与第一内存页不相同，说明该第一内存页存储在内存中。

仍以上述36位物理地址为例，GPU可以将该36位物理地址中第34至36个比特位(即111)，与表2中第一MRU表项中存储的第二内存页的标识(即000)进行比较，可以看出，111与000并不相同，因此，可以确定GPU需要访问的第一内存页存储在内存中，并且，该第一内存页所在的内存页组中，存储在显存中的内存页是标识为111的第二内存页。

具体的，若该第一内存页的标识与该第一MRU表项中存储的第二内存页的标识不同，即内存中存储有该第一内存页，在显存中并未存储该第一内存页。此时，GPU可以向CPU发送页搬运请求，以使得CPU根据页搬运请求将第一内存页存储至显存中。

在步骤205中，在CPU根据页搬运请求将第一内存页存储至显存之后，GPU可以在该MRU表中，将第一MRU表项内该第二内存页的标识修改为该第一内存页的标识。这样，在程序运行的过程中可以动态的根据GPU接收的访问请求，将带访问的内存页搬运至显存中，并通过修改MRU表方便后续GPU再次获取到该第一内存页中的数据的物理地址时，直接查找MRU表以确定该第一内存页存储在显存中。

在步骤206中，若该第二内存页与第一内存页不相同，即内存中存储有该第一内存页，此时，由于GPU需要通过CPU将第一内存页搬运至显存中进行存储，因此，GPU可以通过CPU将显存中原来存储的第二内存页存储至内存；并且，将显存中已经存储的第二内存页删除，这样，GPU便可以通过CPU将第一内存页搬运至显存中原来存储第二内存页的位置进行存储。

当然，如果该第二内存页与第一内存页相同，即说明该第一内存页存储在显存中，那么，GPU便无需发送页搬运请求或修改MRU表中的第一MRU表项，可直接从显存中访问该第一内存页。

最后，在步骤206中，由于在步骤203中已经将第一内存页存储至显存中，因此，GPU可以直接从通信带宽较高的显存中访问该第一内存页。

进一步需要说明的是，本发明实施例并不限定步骤204-206之间的执行顺序，也就是说，若该第二内存页的标识与第一内存页的标识不相同，GPU可以先在该MRU表中将该第二内存页的标识修改为该第一内存页的标识，进而向CPU发送页搬运请求，并将第二内存页存储至内存，将显存中存储的第二内存页删除，或者，若该第二内存页的标识与第一内存页的标识不相同，GPU可以同时执行步骤204-206中的每个步骤，本发明实施例对此不作任何限制。

本发明的实施例提供一种数据访问方法，其中，GPU获取第一内存页的访问请求，该访问请求中携带有第一内存页的物理地址；进而，GPU根据该物理地址以及预置的物理地址与内存页的标识之间的对应关系，查找MRU表中与第一内存页的物理地址对应的MRU表项中是否存储有第一内存页的标识，其中，该MRU表中包含每个内存页组中存储在显存中的内存页的标识；若该MRU表中不包含所述第一内存页的标识，即该第一内存页存储在内存中，而没有存储在显存中，此时，GPU向CPU发送页搬运请求，以使得CPU根据页搬运请求将第一内存页存储至显存中；以便于GPU从显存中访问第一内存页。这样一来，由于内存中的各个内存页组中均有一个内存页存储在显存中，因此，GPU可以根据待访问的第一内存页的物理地址，在程序运行的过程中动态的将每个内存页组中待访问的内存页搬运到显存中进行访问，这样，GPU可以充分利用显存的高通信带宽和内存的高容量的特点，根据访问需求动态的修改显存中的存放的内存页，降低GPU从内存和显存中访问数据的访问延时。

实施例3

本发明的实施例提供一种数据访问装置，如图5所示，包括：

获取单元01，用于获取第一内存页的访问请求，所述访问请求中携带有所述第一内存页的物理地址；

查找单元02，用于根据所述第一内存页的物理地址以及预置的物理地址与内存页的标识之间的对应关系，查找最近最多访问MRU表中与所述第一内存页的物理地址对应的MRU表项中是否包含所述第一内存页的标识，所述MRU表中包含每个内存页组中存储在显存中的内存页的标识，所述第一内存页的标识为所述第一内存页在所属的内存页组中的唯一标识；

发送单元03，用于所述第一内存页的物理地址对应的MRU表项中不包含所述第一内存页的标识，则所述GPU向中央处理器CPU发送页搬运请求，以使得所述CPU根据所述页搬运请求将所述第一内存页存储至所述显存中；

访问单元04，用于从所述显存中访问所述第一内存页。

进一步地，如图6所示，所述装置还包括：

确定单元05，用于根据所述第一内存页的物理地址中的X个比特位，在所述MRU表中确定与所述第一内存页的物理地址对应的第一MRU表项，所述X个比特位用于唯一表示所述第一内存页所属的第一内存页组，X≥1；以及，根据所述第一内存页的物理地址和所述第一MRU表项中存储的第二内存页的标识，确定所述第一MRU表项中是否包含所述第一内存页的标识；

进一步地，所述确定单元05，具体用于根据所述第一内存页的物理地址和所述第一MRU表项中存储的第二内存页的标识，确定所述第一MRU表项中是否包含所述第一内存页的标识；若所述第二内存页的标识与所述第一内存页的标识相同，所述GPU则确定所述第一MRU表项中包含所述第一内存页的标识；若所述第二内存页的标识与所述第一内存页的标识不同，所述GPU则确定所述第一MRU表项中不包含所述第一内存页的标识。

进一步地，如图7所示，所述装置还包括：

修改单元06，用于用于将所述第一MRU表项中所述第二内存页的标识修改为所述第一内存页的标识。

进一步地，如图8所示，所述装置还包括：

存储单元07，用于通过CPU将所述第二内存页存储至所述内存；

删除单元08，用于将所述显存中存储的所述第二内存页删除。

进一步地，所述访问单元04，还用于若所述第一MRU表项中包含所述第一内存页的标识，则从所述显存中访问所述第一内存页。

可选的，所述数据访问装置为GPU。

本发明的实施例提供一种数据访问装置，该装置获取第一内存页的访问请求，该访问请求中携带有第一内存页的物理地址；进而，GPU根据该物理地址以及预置的物理地址与内存页的标识之间的对应关系，查找MRU表中与第一内存页的物理地址对应的MRU表项中是否存储有第一内存页的标识，其中，该MRU表中包含每个内存页组中存储在显存中的内存页的标识；若该MRU表中与第一内存页的物理地址对应的MRU表项中不包含所述第一内存页的标识，即该第一内存页存储在内存中，此时，GPU向CPU发送页搬运请求，以使得CPU根据页搬运请求将第一内存页存储至显存中；以便于GPU从显存中访问第一内存页。这样一来，由于内存中的各个内存页组中均有一个内存页存储在显存中，因此，GPU可以根据待访问的第一内存页的物理地址，在程序运行的过程中动态的将每个内存页组中待访问的内存页搬运到显存中进行访问，这样，GPU可以充分利用显存的高通信带宽和内存的高容量的特点，根据访问需求动态的修改显存中的存放的内存页，降低GPU从内存和显存中访问数据的访问延时。

实施例4

本发明的实施例提供一种数据访问***，如图9所示，所述***包括GPU 11、与所述GPU 11均相连的CPU 12和显存13、以及与所述CPU 12相连的内存14；其中，

所述GPU 11用于：获取第一内存页的访问请求，所述访问请求中携带有所述第一内存页的物理地址；根据所述第一内存页的物理地址以及预置的物理地址与内存页的标识之间的对应关系，查找最近最多访问MRU表中与所述第一内存页的物理地址对应的MRU表项中是否包含所述第一内存页的标识，所述MRU表中包含每个内存页组中存储在显存13中的内存页的标识，所述第一内存页的标识为所述第一内存页在所属的内存页组中的唯一标识；若所述第一内存页的物理地址对应的MRU表项中不包含所述第一内存页的标识，则所述GPU 11向中央处理器CPU 12发送页搬运请求，以使得所述CPU 12根据所述页搬运请求将所述第一内存页存储至所述显存13中；并从所述显存13中访问所述第一内存页。

进一步地，如图10所示，所述***还包括与GPU 11相连的寄存器15，该寄存器15中存储有该MRU表，这样，当GPU 11获取到第一内存页的物理地址时，可直接从该存储装置中访问该MRU表，避免GPU 11从内存14或显存13中访问该MRU表所带来的访问延时。

具体的，所述MRU表由多个MRU表项组成，所述MRU表项与所述内存页组之间一一对应，其中，

所述GPU 11还用于：根据所述第一内存页的物理地址中的X个比特位，在所述MRU表中确定与所述第一内存页的物理地址对应的第一MRU表项，所述X个比特位用于唯一表示所述第一内存页所属的第一内存页组，X≥1；以及，根据所述第一内存页的物理地址和所述第一MRU表项中存储的第二内存页的标识，确定所述第一MRU表项中是否包含所述第一内存页的标识。

进一步地，所述GPU 11还用于：将所述第一内存页的物理地址中的Z个比特位作为所述第一内存页的标识，所述Z个比特位用于唯一表示在所述第一内存页组中所述第一内存页的标识，Z≥1；若所述第二内存页的标识与所述第一内存页的标识相同，所述GPU 11则确定所述第一MRU表项中包含所述第一内存页的标识；若所述第二内存页的标识与所述第一内存页的标识不同，所述GPU 11则确定所述第一MRU表项中不包含所述第一内存页的标识。

进一步地，所述GPU 11还用于：将所述第一MRU表项中所述第二内存页的标识修改为所述第一内存页的标识。

进一步地，所述GPU 11还用于：通过所述CPU 12将所述第二内存页存储至所述内存14；以及，将所述显存13中存储的所述第二内存页删除。

进一步地，所述GPU 11还用于：若所述第一MRU表项中包含所述第一内存页的标识，则从所述显存13中访问所述第一内存页。

本发明的实施例提供一种数据访问***，其中，GPU获取第一内存页的访问请求，该访问请求中携带有第一内存页的物理地址；进而，GPU根据该物理地址以及预置的物理地址与内存页的标识之间的对应关系，查找MRU表中与第一内存页的物理地址对应的MRU表项中是否存储有第一内存页的标识，其中，该MRU表中包含每个内存页组中存储在显存中的内存页的标识；若该MRU表中与第一内存页的物理地址对应的MRU表项中不包含所述第一内存页的标识，即该第一内存页存储在内存中，此时，GPU向CPU发送页搬运请求，以使得CPU根据页搬运请求将第一内存页存储至显存中；以便于GPU从显存中访问第一内存页。这样一来，由于内存中的各个内存页组中均有一个内存页存储在显存中，因此，GPU可以根据待访问的第一内存页的物理地址，在程序运行的过程中动态的将每个内存页组中待访问的内存页搬运到显存中进行访问，这样，GPU可以充分利用显存的高通信带宽和内存的高容量的特点，根据访问需求动态的修改显存中的存放的内存页，降低GPU从内存和显存中访问数据的访问延时。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。上述描述的***，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的***，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

Claims

一种数据访问方法，其特征在于，包括：

图形处理器GPU获取第一内存页的访问请求，所述访问请求中携带有所述第一内存页的物理地址；

所述GPU根据所述第一内存页的物理地址以及预置的物理地址与内存页的标识之间的对应关系，查找最近最多访问MRU表中与所述第一内存页的物理地址对应的MRU表项中是否包含所述第一内存页的标识，所述MRU表中包含每个内存页组中存储在显存中的内存页的标识，所述第一内存页的标识为所述第一内存页在所属的内存页组中的唯一标识；

若所述第一内存页的物理地址对应的MRU表项中不包含所述第一内存页的标识，则所述GPU向中央处理器CPU发送页搬运请求，以使得所述CPU根据所述页搬运请求将所述第一内存页存储至所述显存中；

所述GPU从所述显存中访问所述第一内存页。
根据权利要求1所述的方法，其特征在于，所述MRU表由多个MRU表项组成，所述MRU表项与所述内存页组之间一一对应，其中，

所述GPU根据所述第一内存页的物理地址以及预置的物理地址与内存页的标识之间的对应关系，查找MRU表中与所述第一内存页的物理地址对应的MRU表项中是否包含所述第一内存页的标识，包括:

所述GPU根据所述第一内存页的物理地址中的X个比特位，在所述MRU表中确定与所述第一内存页的物理地址对应的第一MRU表项，所述X个比特位用于唯一表示所述第一内存页所属的第一内存页组，X≥1；

所述GPU根据所述第一内存页的物理地址和所述第一MRU表项中存储的第二内存页的标识，确定所述第一MRU表项中是否包含所述第一内存页的标识。
根据权利要求2所述的方法，其特征在于，所述GPU根据所述第一内存页的物理地址和所述第一MRU表项中存储的第二内存页的标识，确定所述第一MRU表项中是否包含所述第一内存页的标识，包括：

所述GPU将所述第一内存页的物理地址中的Z个比特位作为所述第一内存页的标识，所述Z个比特位用于唯一表示在所述第一内存页组中所述第一内存页的标识，Z≥1；

若所述第二内存页的标识与所述第一内存页的标识相同，所述GPU则确定所述第一MRU表项中包含所述第一内存页的标识；

若所述第二内存页的标识与所述第一内存页的标识不同，所述GPU则确定所述第一MRU表项中不包含所述第一内存页的标识。
根据权利要求2或3所述的方法，其特征在于，若所述第一MRU表项中不包含所述第一内存页的标识，所述方法还包括：

所述GPU将所述第一MRU表项中所述第二内存页的标识修改为所述第一内存页的标识。
根据权利要求4所述的方法，其特征在于，在所述GPU将所述第一MRU表项中所述第二内存页的标识修改为所述第一内存页的标识之后，还包括：

所述GPU通过所述CPU将所述第二内存页存储至所述内存；

所述GPU将所述显存中存储的所述第二内存页删除。
根据权利要求2-5中任一项所述的方法，其特征在于，若所述第一MRU表项中包含所述第一内存页的标识，则所述方法还包括：

所述GPU从所述显存中访问所述第一内存页。
一种数据访问装置，其特征在于，包括：

获取单元，用于获取第一内存页的访问请求，所述访问请求中携带有所述第一内存页的物理地址；

查找单元，用于根据所述第一内存页的物理地址以及预置的物理地址与内存页的标识之间的对应关系，查找最近最多访问MRU表中与所述第一内存页的物理地址对应的MRU表项中是否包含所述第一内存页的标识，所述MRU表中包含每个内存页组中存储在显存中的内存页的标识，所述第一内存页的标识为所述第一内存页在所属的内存页组中的唯一标识；

发送单元，用于所述第一内存页的物理地址对应的MRU表项中不包含所述第一内存页的标识，则所述GPU向中央处理器CPU发送页搬运请求，以使得所述CPU根据所述页搬运请求将所述第一内存页存储至所述显存中；

访问单元，用于从所述显存中访问所述第一内存页。
根据权利要求7所述的装置，其特征在于，所述装置还包括：

确定单元，用于根据所述第一内存页的物理地址中的X个比特位，在所述MRU表中确定与所述第一内存页的物理地址对应的第一MRU表项，所述X个比特位用于唯一表示所述第一内存页所属的第一内存页组，X≥1；以及，根据所述第一内存页的物理地址和所述第一MRU表项中存储的第二内存页的标识，确定所述第一MRU表项中是否包含所述第一内存页的标识；

其中，所述MRU表由多个MRU表项组成，所述MRU表项与所述内存页组之间一一对应。
根据权利要求8所述的装置，其特征在于，

所述确定单元，具体用于根据所述第一内存页的物理地址和所述第一MRU表项中存储的第二内存页的标识，确定所述第一MRU表项中是否包含所述第一内存页的标识；若所述第二内存页的标识与所述第一内存页的标识相同，所述GPU则确定所述第一MRU表项中包含所述第一内存页的标识；若所述第二内存页的标识与所述第一内存页的标识不同，所述GPU则确定所述第一MRU表项中不包含所述第一内存页的标识。
根据权利要求8或9所述的装置，其特征在于，所述装置还包括：

修改单元，用于将所述第一MRU表项中所述第二内存页的标识修改为所述第一内存页的标识。
根据权利要求10所述的装置，其特征在于，所述装置还包括：

存储单元，用于通过CPU将所述第二内存页存储至所述内存；

删除单元，用于将所述显存中存储的所述第二内存页删除。
根据权利要求7-11中任一项所述的装置，其特征在于，

所述访问单元，还用于若所述第一MRU表项中包含所述第一内存页的标识，则从所述显存中访问所述第一内存页。
根据权利要求7-12中任一项所述的装置，其特征在于，所述数据访问装置为图形处理器GPU。
一种数据访问***，其特征在于，所述***包括图形处理器GPU、与所述GPU均相连的中央处理器CPU和显存、以及与所述CPU相连的内存；其中，

所述GPU用于：获取第一内存页的访问请求，所述访问请求中携带有所述第一内存页的物理地址；根据所述第一内存页的物理地址以及预置的物理地址与内存页的标识之间的对应关系，查找最近最多访问MRU表中与所述第一内存页的物理地址对应的MRU表项中是否包含所述第一内存页的标识，所述MRU表中包含每个内存页组中存储在显存中的内存页的标识，所述第一内存页的标识为所述第一内存页在所属的内存页组中的唯一标识；若所述第一内存页的物理地址对应的MRU表项中不包含所述第一内存页的标识，则所述GPU向中央处理器CPU发送页搬运请求，以使得所述CPU根据所述页搬运请求将所述第一内存页存储至所述显存中；并从所述显存中访问所述第一内存页。
根据权利要求14所述的***，其特征在于，所述MRU表由多个MRU表项组成，所述MRU表项与所述内存页组之间一一对应，其中，

所述GPU还用于：根据所述第一内存页的物理地址中的X个比特位，在所述MRU表中确定与所述第一内存页的物理地址对应的第一MRU表项，所述X个比特位用于唯一表示所述第一内存页所属的第一内存页组，X≥1；以及，根据所述第一内存页的物理地址和所述第一MRU表项中存储的第二内存页的标识，确定所述第一MRU表项中是否包含所述第一内存页的标识。
根据权利要求15所述的***，其特征在于，

所述GPU还用于：将所述第一内存页的物理地址中的Z个比特位作为所述第一内存页的标识，所述Z个比特位用于唯一表示在所述第一内存页组中所述第一内存页的标识，Z≥1；若所述第二内存页的标识与所述第一内存页的标识相同，所述GPU则确定所述第一MRU表项中包含所述第一内存页的标识；若所述第二内存页的标识与所述第一内存页的标识不同，所述GPU则确定所述第一MRU表项中不包含所述第一内存页的标识。
根据权利要求15或16所述的***，其特征在于，

所述GPU还用于：将所述第一MRU表项中所述第二内存页的标识修改为所述第一内存页的标识。
根据权利要求17所述的***，其特征在于，

所述GPU还用于：通过所述CPU将所述第二内存页存储至所述内存；以及，将所述显存中存储的所述第二内存页删除。
根据权利要求14-18中任一项所述的***，其特征在于，

所述GPU还用于：若所述第一MRU表项中包含所述第一内存页的标识，则从所述显存中访问所述第一内存页。