CN115424435B

CN115424435B - 一种跨link道路识别网络的训练方法、识别跨link道路的方法

Info

Publication number: CN115424435B
Application number: CN202210956434.3A
Authority: CN
Inventors: 郭翊麟; 杜舒; 唐俊杰
Original assignee: Alibaba China Co Ltd
Current assignee: Alibaba China Co Ltd
Priority date: 2022-08-10
Filing date: 2022-08-10
Publication date: 2024-01-23
Anticipated expiration: 2042-08-10
Also published as: CN115424435A

Abstract

本说明书提供了一种跨link道路识别网络的训练方法及一种识别跨link道路的方法，获取道路数据集合，所述道路数据集合包括训练数据子集和测试数据子集；通过所述训练数据子集训练跨link道路识别网络；所述跨link道路识别网络的输入为道路关系图，道路关系图包括多个节点以及连接节点的边，每个节点用于表征三元组，每条边用于表征两个三元组之间的道路关系；根据所述跨link道路识别网络对所述测试数据子集进行预测，确定所述测试数据子集中所述跨link道路识别网络的识别结果与标签不符的错分数据；针对所述错分数据，获取所述道路关系图的更新信息，基于所述更新信息重新训练所述跨link道路识别网络。

Description

一种跨link道路识别网络的训练方法、识别跨link道路的方法

技术领域

本说明书一个或多个实施例涉及计算机应用技术领域，尤其涉及一种跨link道路识别网络的训练方法、识别跨link道路的方法。

背景技术

在导航应用的为车辆导航的过程中，可能存在以下问题：如图1所示，导航路线为a_link(link即代表一段路)到b_link再转到c_link，但是由于b_link的长度较短，使得用户在车辆走到b_link听到“右转到c_link”的引导语音时无法立刻反应过来，那么用户的车辆可能会从b_link直行至c’-link上，这样用户错过了正确的导航路线，给用户造成了不便。存在上述问题的三元组(即三条连续的link组成的一个组，比如a_link、b_link和c_link)称之为跨link道路。而相关技术中缺少一种能准确识别存在跨link道路的方法。

发明内容

有鉴于此，本说明书一个或多个实施例提供一种跨link道路识别网络的训练方法、识别跨link道路的方法。

根据本说明书一个或多个实施例的第一方面，提出了一种跨link道路识别网络的训练方法，所述方法包括：

获取道路数据集合，所述道路数据集合包含多个三元组的道路信息，及每个三元组分别对应的标签，所述标签用于表示所述三元组是否为跨link道路数据；所述道路数据集合包括训练数据子集和测试数据子集；所述三元组包括相连接的三条link；

通过所述训练数据子集训练跨link道路识别网络；所述跨link道路识别网络的输入为道路关系图，输出为跨link道路的识别结果；所述道路关系图包括多个节点以及连接节点的边，每个节点用于表征三元组，每条边用于表征两个三元组之间的道路关系；所述道路关系用于表征两个三元组的是否存在相同的道路信息或用于表征两个三元组中link的位置关系；

根据所述跨link道路识别网络对所述测试数据子集进行预测，确定所述测试数据子集中所述跨link道路识别网络的识别结果与标签不符的错分数据；

针对所述错分数据，获取所述道路关系图的更新信息，所述更新信息包括：错分数据对应的节点数据、以及错分数据对应的边数据；

基于所述更新信息重新训练所述跨link道路识别网络。

根据本说明书一个或多个实施例的第二方面，提出了一种识别跨link道路的方法，包括：

获取待检测数据，并根据所述待检测数据构建待检测道路关系图；

通过跨link道路识别网络对所述待检测道路关系图进行识别处理，得到所述待检测道路关系图中的节点是否是跨link道路数据的识别结果；其中，所述跨link道路识别网络是通过前述的跨link道路识别网络的训练方法训练得到。

根据本说明书实施例的第三方面，提供一种跨link道路识别网络的训练装置，包括：

道路数据集合获取单元，用于获取道路数据集合，所述道路数据集合包含多个三元组的道路信息，及每个三元组分别对应的标签，所述标签用于表示所述三元组是否为跨link道路数据；所述道路数据集合包括训练数据子集和测试数据子集；所述三元组包括相连接的三条link；

跨link道路识别网络训练单元，用于通过所述训练数据子集训练跨link道路识别网络；所述跨link道路识别网络的输入为道路关系图，输出为跨link道路的识别结果；所述道路关系图包括多个节点以及连接节点的边，每个节点用于表征三元组，每条边用于表征两个三元组之间的道路关系；所述道路关系用于表征两个三元组的是否存在相同的道路信息或用于表征两个三元组中link的位置关系；

测试数据子集预测单元，用于根据所述跨link道路识别网络对所述测试数据子集进行预测，确定所述测试数据子集中所述跨link道路识别网络的识别结果与标签不符的错分数据；

更新信息获取单元，用于针对所述错分数据，获取所述道路关系图的更新信息，所述更新信息包括：错分数据对应的节点数据、以及错分数据对应的边数据；

跨link道路识别网络重新训练单元，用于基于所述更新信息重新训练所述跨link道路识别网络。

根据本说明书实施例的第四方面，提供一种识别跨link道路的装置，包括：

待检测道路关系图构建单元，用于获取待检测数据，并根据所述待检测数据构建待检测道路关系图；

识别结果获取单元，用于通过跨link道路识别网络对所述待检测道路关系图进行识别处理，得到所述待检测道路关系图中的节点是否是跨link道路数据的识别结果；其中，所述跨link道路识别网络是通过前述的跨link道路识别网络的训练方法训练得到。

根据本说明书实施例的第五方面，提供一种计算机可读存储介质，其上存储有计算机指令，该指令被处理器执行时实现前述的跨link道路识别网络的训练方法或识别跨link道路方法。

根据本说明书实施例的第六方面，提供一种计算机设备，所述计算机设备包括：

处理器；

用于存储处理器可执行指令的存储器；

所述处理器通过运行所述可执行指令以实现前述的跨link道路识别网络的训练方法或识别跨link道路方法。

本说明书提供了一种跨link道路识别网络的训练方法及一种识别跨link道路的方法，获取道路数据集合，所述道路数据集合包含多个三元组的道路信息，及每个三元组分别对应的标签，所述标签用于表示所述三元组是否为跨link道路数据；所述道路数据集合包括训练数据子集和测试数据子集；所述三元组包括相连接的三条link；通过所述训练数据子集训练跨link道路识别网络；所述跨link道路识别网络的输入为道路关系图，输出为跨link道路的识别结果；所述道路关系图包括多个节点以及连接节点的边，每个节点用于表征三元组，每条边用于表征两个三元组之间的道路关系；所述道路关系用于表征两个三元组的是否存在相同的道路信息或用于表征两个三元组中link的位置关系；根据所述跨link道路识别网络对所述测试数据子集进行预测，确定所述测试数据子集中所述跨link道路识别网络的识别结果与标签不符的错分数据；针对所述错分数据，获取所述道路关系图的更新信息，所述更新信息包括：错分数据对应的节点数据、以及错分数据对应的边数据；基于所述更新信息重新训练所述跨link道路识别网络。

通过对错分数据(被跨link道路识别网络分类错误的数据)进行处理，可以确定错分数据中由于道路信息不准确而被错误分类的数据的正确的道路信息，并通过这部分正确的道路信息来更新跨link道路识别网络，从而通过上述自适应反馈机制使的网络迭代学习到更准确的知识，使得网络训练可以排除已有道路数据集合不准确的影响，以使得到的跨link道路识别网络更加准确，从而使得跨link的识别结果更加准确，从而能对跨link道路数据的导航进行修正，减少用户偏航损失，提升用户的使用体验。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本说明书。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本说明书的实施例，并与说明书一起用于解释本说明书的原理。

图1是本说明书示出的一种跨link问题的示意图。

图2是本说明书根据一示例性实施例示出的一种跨link道路识别网络的训练方法的流程图。

图3是本说明书根据一示例性实施例示出的一种道路关系图。

图4是本说明书根据一示例性实施例示出的一种识别跨link道路的方法的流程图。

图5是本说明书根据一具体实施例示出的一种跨link道路识别网络的训练方法的结构图。

图6是本说明书根据一示例性实施例示出的一种跨link道路识别网络的训练装置的框图。

图7是本说明书根据一示例性实施例示出的一种识别跨link道路的装置的框图。

图8是本说明书根据一示例性实施例示出的一种跨link道路识别网络的训练装置或一种识别跨link道路的装置所在计算机设备的一种硬件结构图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书一个或多个实施例相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本说明书一个或多个实施例的一些方面相一致的装置和方法的例子。

需要说明的是：在其他实施例中并不一定按照本说明书示出和描述的顺序来执行相应方法的步骤。在一些其他实施例中，其方法所包括的步骤可以比本说明书所描述的更多或更少。此外，本说明书中所描述的单个步骤，在其他实施例中可能被分解为多个步骤进行描述；而本说明书中所描述的多个步骤，在其他实施例中也可能被合并为单个步骤进行描述。

导航应用一般具有车辆导航功能，车辆导航功能用于在用户驾驶车辆的过程中，通过语音引导信息或其他形式的引导动作(比如屏幕上显示的标识等)，帮助用户行驶到通往目的地的更短/更快/更方便的道路。

在地图应用中，首先会按照一定规则将路网划分为多段，每一段路即可以视为一个link，导航规划时，会根据用户的出发地和目的地按照相应的link给用户提供导航路线，并在行驶过程中提醒用户按导航路线行走，避免用户走错路造成相应的损失。

而有些情况下，导航路线中存在跨link道路数据，跨link道路数据可能会使得用户偏航。具体而言，如图1所示，导航路线中存在一个包括三个连续link的三元组，a_link、b_link和c_link组成的三元组，该三元组为跨link道路数据，将会产生以下问题：在经过a_link时，会提醒用户向右前方行驶，在从b_link到c_link时会提醒用户“右转”，而由于b_link的长度较短，使得用户在车辆走到b_link听到“右转到c_link”的引导动作(可以是语音或者其他形式)时，用户车速太快或者用户在聊天等原因使得用户无法立刻反应过来，那么用户驾驶的车辆可能会从b_link直行至c’-link上，这样用户偏离了导航路线(即偏航)，给用户造成了不便。

因此，需要识别地图中的跨link道路数据，才能给用户更好的使用体验。

相关技术存在以下识别跨link道路数据的方法：相关技术中会通过一定的策略来筛选出跨link道路数据，比如在三元组中间link的长度小于一定的长度阈值(比如可以是50米)，且三元组中间link与其余任一link的角度的最小夹角大于一定值，则确定三元组为跨link道路数据，但是这样可能会筛选的跨link道路数据不准确，比如筛选出来的数据有部分并非跨link道路数据，且可能无法识别一些跨link道路数据。

可见，相关技术中缺少一种可以准确识别跨link道路数据的方法。

为了解决上述问题，考虑到可以通过神经网络来识别，进一步地，三元组对应的道路数据为非结构化数据，因此可以通过图神经网络来对跨link道路数据来识别。进一步地，只通过图神经网络来对跨link道路数据来识别的结果并不准确，究其原因发现，有些情况下，道路的实际情况更新了，但是存储的用于训练的数据并没有更新(比如某个道路在修理后道路宽度变了，或者是道路的道路构成等信息变了，但是存储的用于训练的数据并没有更新这个信息)，或者本来收集的道路的信息就不准确，这导致训练的图神经网络是基于不准确的数据训练得到，影响训练完成的图神经网络的准确性。

而如果人工对每个训练数据进行修正，将会浪费较多的时间。为了解决上述问题，考虑到可以通过自适应反馈的方法来对训练数据进行更新，以使得用于训练的数据可以和现实实际情况更加接近，从而使得训练得到的图神经网络更加准确。即在训练图神经网络完成后，可以找到被上述图神经网络错误分类的数据(下文称之为错分数据，即跨link道路识别过程中，跨link道路的识别结果错误的数据)，并对错分数据进行分析，获取到更新信息，即错分数据的和现实更为接近的信息，从而，将得到的更新后的错分数据作为训练数据来更新(重新训练)图神经网络，以使得图神经网络能学习到正确的图结构。

换言之，本说明书提供了一种跨link道路识别网络的训练方法及装置，获取道路数据集合，所述道路数据集合包含多个三元组的道路信息，及每个三元组分别对应的标签，所述标签用于表示所述三元组是否为跨link道路数据；所述道路数据集合包括训练数据子集和测试数据子集；所述三元组包括相连接的三条link；通过所述训练数据子集训练跨link道路识别网络；所述跨link道路识别网络的输入为道路关系图，输出为跨link道路的识别结果；所述道路关系图包括多个节点以及连接节点的边，每个节点用于表征三元组，每条边用于表征两个三元组之间的道路关系；所述道路关系用于表征两个三元组的是否存在相同的道路信息或用于表征两个三元组中link的位置关系；根据所述跨link道路识别网络对所述测试数据子集进行预测，确定所述测试数据子集中所述跨link道路识别网络的识别结果与标签不符的错分数据；针对所述错分数据，获取所述道路关系图的更新信息，所述更新信息包括：错分数据对应的节点数据、以及错分数据对应的边数据；基于所述更新信息重新训练所述跨link道路识别网络。

接下来将对本说明书示出的一种跨link道路识别网络的训练方法进行详细说明。

如图2所示，图2是本说明书示出的一种跨link道路识别网络的训练方法的流程图，包括以下步骤：

步骤201，获取道路数据集合。

其中，所述道路数据集合包含多个三元组的道路信息，及每个三元组分别对应的标签，所述标签用于表示所述三元组是否为跨link道路数据；所述道路数据集合包括训练数据子集和测试数据子集；所述三元组包括相连接的三条link。

步骤203，通过所述训练数据子集训练跨link道路识别网络。

其中，所述跨link道路识别网络的输入为道路关系图，输出为跨link道路的识别结果；所述道路关系图包括多个节点以及连接节点的边，每个节点用于表征三元组，每条边用于表征两个三元组之间的道路关系；所述道路关系用于表征两个三元组的是否存在相同的道路信息或用于表征两个三元组中link的位置关系。

接下来将对步骤201和步骤203进行说明。

首先对步骤201和步骤203中的名词进行说明。

Link也即一段路，在地图导航应用中，往往会根据道路的属性信息(比如长度、名字、车道数、道路等级、道路构成、限速、方向、所属城市等)来对现实路网进行划分，得到不同的link段。具体的划分方法可以参见相关技术中的方法，在此不再赘述。

三元组也即包括了三条顺序连接的link的道路数据组合，本说明书中，根据跨link问题出现的原因，将三元组作为跨link问题的识别单位。需要说明的是，本说明书中之所以选择三元组，而不选择三元组中间link或者三元组中后两个link作为识别跨link问题的单位，是因为，仅依靠这两个而没有其他的信息并不能判断是否存在跨link问题，且跨link问题的存在和三元组的三个link都有关，缺少任何一者的信息都不能准确判断是否存在跨link问题。

本说明书中的跨link道路识别网络至少包括一个图神经网络。对于一般的图神经网络而言，输入是包括若干节点和边的图(比如可以如图3所示)，图神经网络对输入进行处理的过程中，会在多层的处理中，对图中的节点和边进行不断更新(更新一般是通过节点周围的其他节点和边以及权重卷积相乘得到)，最终得到输出的图中的节点向量。此外，有时候为了实现相应的目的，还会在图神经网络后面接一个分类子网络，比如在本说明书的场景下，子网络以节点向量为输入，以该节点对应的三元组是否是跨link道路的结果作为输出。

对于本说明书而言，跨link道路识别网络可以包括一个图神经网络(图神经网络包括一个用于更新节点向量的子网络和一个分类子网络，训练过程中两个子网络是作为一个整体一起训练的)。跨link道路识别网络也可以是包括一个用于更新道路关系图中节点向量的图神经网络，和一个分类网络(两个网络单独训练)。当然，跨link道路识别网络也可以是其他结构，本说明书中对于跨link道路识别网络的具体结构不做限定。

对于图神经网络的训练而言，图神经网络的训练，也就是通过训练数据来构建图，并通过构建的图来训练得到图神经网络的权重的过程。需要说明的是，本说明书中可以根据道路数据构建相应的道路关系图，并且可以根据训练数据子集的标签来进行有监督学习，以使得网络可以学习到图结构之间的关系和道路交互信息(注意力)。具体的训练方法可以参见相关技术中的训练方法，本说明书中对于图神经网络的具体训练方法不做限定。

还需要说明的是，上述图神经网络可以是常见的任何图神经网络，比如可以是图卷积网络(Graph Convolutional Network,GCN)，也可以是图注意力网络(GraphAttention Network,GAT)，还可以是图自编码网络(Graph Auto-Encoders，GAE)，当然这里只是举出几个图神经网络的例子，本说明书对于图神经网络的具体形式不做限定。

道路关系图也就是通过道路数据集合或训练数据子集构建的图，具体的构建图的方法可以参见相关技术中的方法，本说明书在不再赘述。本说明书中为了解决导航场景下所存在的问题，构建的道路关系图中，节点代表了三元组，节点的特征向量即用于表征三元组的道路信息的向量，边代表了三元组和三元组之间的道路关系，边的特征向量即用于表征两个三元组之间的道路关系。关于道路信息和道路关系的具体含义将在下文进行详述，在此暂不赘述。

此外，本说明书中存在上述问题的原因在于道路数据集合中的道路数据与实际情况不相符，换言之，本说明书中的道路数据集合存在不准确的问题，或者本说明书中的道路数据集合不能完全反映真实的道路情况。

还需要说明的是，训练数据子集只是在本次迭代中作为训练数据，测试数据也只是在本次迭代中作为测试数据，在步骤209执行完成后，测试数据子集中的数据也可以重新作为训练数据来重新训练图神经网络，训练数据子集中的数据也可以重新作为测试数据。本说明书中的测试数据子集和训练数据子集并不表示数据用于都是测试数据或永远都是训练数据。此外，训练数据和测试数据的划分可以是随机的。

在对步骤201和步骤203中的名词进行说明后，接下来将对上述步骤的具体实现方式进行说明。

对于道路数据的具体获取而言，步骤201获取道路数据可以是从存储道路数据的数据库中随机选取部分数据作为道路数据，也可以是将上述数据库的全量的数据作为道路数据集合。

道路数据的具体获取除了上述方法之外，还可以是：由于对于网络而言，如果是和跨link数据差别很大的数据，比如三元组中三条link的方向完全相同，那么网络可以很容易区分这种三元组和跨link道路对应的三元组。换言之，本说明书中更希望网络具备筛选跨link道路三元组和与跨link道路很相似的三元组的能力。因此在训练过程中，为了使得更多的训练数据是能让模型学习到更多图结构的数据，进而减少训练成本避免噪声影响，以最少的数据达到最优的训练效果，获取的道路数据可以是包括跨link道路三元组、和与跨link道路很相似的三元组的数据。

基于上述分析，步骤201中，可以先依据相关技术中筛选跨link道路的策略来筛选道路数据，将筛选得到的道路数据作为训练数据。

换言之，步骤201包括：获取相连接的三条link；在所述三条link符合预设道路条件的情况下，将所述三条link作为所述道路数据集合中的所述三元组，所述预设道路条件包括：所述三条link中的中间link的道路长度小于长度阈值(比如可以是50m)，且中间link与三条link中的任一其他link的夹角大于预设的夹角阈值(比如可以是30度)。

需要说明的是，相连接的三条link也即顺序相连的三条link，这里的夹角指的是两个link之间的最小夹角。此外，除了可以根据上述条件来筛选，还可以在满足上述条件下，进一步根据以下方式筛选得到符合要求的道路数据，比如可以根据道路类型、道路等级、道路构成等有关道路属性的信息，来筛选道路数据。

其中，道路类型可以包括：单向道、双向道等；道路等级可以包括：国道、省道、城快、主/次要道路、小路等；道路构成可以包括：上下线分离、环岛、服务区、主路、辅路等。之所以需要通过有关道路属性的信息来筛选道路数据，是因为某些属性下不存在跨link问题，比如小路和服务区就不存在跨link问题。

此外，在获取了道路数据集合后，如果是通过筛选的方式获取的，那么为了丰富道路数据，以使得训练过程中跨link道路识别网络可以学习到更丰富的知识，在获取了道路数据后，还可以获取道路数据的前后link的三元组(即与三元组中任一link相连的link所组成的三元组)。这样，在构建道路关系图中，三元组和与其相连的三元组会存在相连的关系，那么筛选出的三元组的更新会考虑到相连三元组的信息，从而使得跨link道路识别网络在更新训练数据对应的道路关系图的过程中，可以学习到更丰富的图结构。

换言之，在步骤201后，所述方法还包括：根据所述道路数据集合中三元组中link的位置，获取位置与所述link的位置相邻的相邻三元组；在所述道路数据集合中增加所述相邻三元组。

最后还需要说明的是，为了使得图神经网络可以学习到更丰富的图结构，构建道路关系图时可以不止用训练数据子集来构建，可以用全量的道路数据来构建，这样构建的图中的关系更加全面且丰富，使得网络学习结果可以更加准确。

换言之，步骤203包括：根据训练数据子集和测试数据子集构建道路关系图，根据道路关系图训练数据子集中三元组的标签，训练得到跨link道路识别网络。当然，仅根据训练数据子集构建图神经网络也是可行的。

通过获取包括训练数据子集和测试数据子集的道路数据，并通过训练数据子集来进行有监督学习直至网络收敛，训练得到了一个跨link道路识别网络。但是该网络的识别效果并不好，需要通过步骤205-步骤209来进一步提升该网络的识别效果。

步骤205，根据所述跨link道路识别网络对所述测试数据子集进行预测，确定所述测试数据子集中所述跨link道路识别网络的识别结果与标签不符的错分数据。

步骤207，针对所述错分数据，获取所述道路关系图的更新信息。

其中，所述更新信息包括：错分数据对应的节点数据、以及错分数据对应的边数据。

步骤205和步骤207即闭环反馈(自适应反馈)的反馈过程。接下来将对步骤205和步骤207进行统一说明。

首先对步骤205和步骤207的名词进行说明。

错分数据即测试数据子集中，跨link道路识别网络识别错误的数据，由于测试数据也是具有标签的，因此可以根据测试数据子集中测试数据的标签和跨link道路识别网络的识别结果进行比对，找出错分数据。

由于错分数据分类错的原因，可能跨link道路识别网络没有学习到正确的节点与节点的关系，也可能是针对边与节点的关系学习错误，因此为了使得跨link道路识别网络有更好的识别效果，步骤205中更新的包括节点数据和边数据。也即更新信息用于更新道路关系图中节点和边的特征向量，当然有些情况下，由于边的特征向量变了，图的结构也可能产生变化。

根据跨link道路识别网络对测试数据子集进行预测，也就是通过跨link道路识别网络更新测试数据对应的道路关系图的节点特征向量，并得到针对每个节点是否是跨link道路的识别结果，错分数据即识别结果和测试数据标签不一致的数据。

在对步骤205和步骤207涉及的名词进行说明后，下面将对步骤205和步骤207的具体实现方式进行说明。

对于步骤205而言，用于预测的数据可以是测试数据子集中的全部数据，在测试数据子集中数据较多的情况下，可以只用部分测试数据就能达到较好的测试效果，因此为了提升整体效率，用于测试的数据也可以是测试数据子集中的部分数据。

对于后者而言，步骤205包括：从所述测试数据子集中选出预测数据；通过所述跨link道路识别网络对所述预测数据进行预测，确定所述预测数据中所述跨link道路识别网络的识别结果与标签不符的错分数据。

对于上述的具体的选择预测数据的方法而言，可以是从测试数据子集中随机选择部分数据作为预测数据。

此外，考虑到如果随机筛选预测数据，那么可能会使得预测结果产生偏差，比如该网络只能对部分道路数据有较好的识别效果，对于其他道路数据的识别效果不好。比如在道路关系包括多种关系时(道路关系包括多种关系的情况将在下文进行详述，在此暂不赘述)，该网络可能只能对有部分道路关系的数据有较好的预测效果，因此为了准确判断网络的预测效果，应该保证数据在道路关系方面无偏，也即筛选预测数据应该从每种关系中都筛选出一部分数据，这样才能确定网络是否对所有道路关系都具有较好的预测效果。

换言之，在道路关系图的边用于表征两个三元组之间的多种道路关系的情况下，上述从所述测试数据子集中选出预测数据，包括：针对所述测试数据子集，从每个的道路关系对应的道路数据中抽取部分道路数据，将抽取出的道路数据组成预测数据。

除此之外，为了确定上述网络对所有车流量的三元组都有较好的预测效果，还应该保证预测数据在车流量分层无偏，即每个车流量都有对应的预测数据。

换言之，上述从所述测试数据子集中选出预测数据，包括：针对所述测试数据子集，统计每个三元组包括的link的车流量，确定每个三元组包括的三个link的车流量平均值所属的车流量范围；在每个车流量范围对应的道路数据中抽取出部分道路数据，将抽取出的道路数据组成预测数据。

其中车流量可以是基于日流量进行统计，也可以是基于月流量、季流量或者年流量进行统计。当然也可以是基于日流量、月流量、季流量、年流量都进行统计，然后从每个统计方法对应的所有车流量范围中都抽取出部分数据。比如可以从年流量对应的多个车流量范围内抽取部分数据，再从季流量对应的多个车流量范围内抽取部分数据，以此类推。

对于步骤207的执行时机而言，更新错分数据可以是只要有错分数据就进行更新。此外，为了提高网络训练效率，可以只在错分数据占预测数据(用于预测的数据，可以是测试数据子集中的全部数据，也可以是测试数据子集中的部分数据)的比例大于一定值时再进行更新，这样在错分数据不多的情况下，可以任务网络的训练已经达到可以使用的精度，可以通过减少更新来提高网络训练效率。

换言之，步骤207包括：确定错分数据占预测数据的错分比例；所述预测数据为测试数据子集的一部分或全部；在所述错分比例大于预设比例阈值的情况下，获取所述道路关系图的更新信息。

在上述情况下，考虑到不同车流量的情况下，如果错分数据的数量相同，对于车流量范围更大的数据，其错分数据将会导致更多的车辆偏航，而本申请是为了尽可能减少偏航的汽车的数量。因此，在判断错分比例是否大于比例阈值的情况下，可以根据车流量范围将错分数据划分为多组数据，车流量越大的组，其错分比例更低，这样可以使得网络对于车流量更大的组有更好的跨link道路识别效果，从而防止大部分车辆的偏航。

换言之，所述方法还包括：针对所述测试数据子集，统计每个三元组包括的link的车流量，确定每个三元组包括的三个link的车流量平均值所属的车流量范围。上述确定错分数据占预测数据的错分比例；在所述错分比例大于预设比例阈值的情况下，获取所述道路关系图的更新信息包括：针对每个车流量范围，执行：确定该车流量范围对应的错分数据占预测数据的错分比例；在该错分比例大于该车流量范围对应的的比例阈值的情况下，获取所述道路关系图的更新信息；其中，车流量范围对应的道路数据的车流量平均值越大，该车流量范围对应的比例阈值越低。

在对步骤207的执行时机进行详述之后，接下来将对具体的更新错分数据的方法进行说明。

更新错分数据可以是通过人工对错分数据进行分析，确定正确的边数据和节点数据(节点数据用于表征节点对应的三元组的道路信息，边数据用于表征三元组和三元组之间的道路关系)。

除了通过人工分析的方法来识别，考虑到对于道路信息或者道路关系而言，如果存在多个道路信息或者多种道路关系，任一种道路信息或者道路关系的变化，都与其余道路信息或者道路关系相关的。比如道路如果从单向道变成了双向道，可能是由于道路变宽而使得道路可以是双向道，因此在道路信息或道路关系中部分信息准确而部分信息不准确的情况下，可以通过关系网络学习到不同道路信息或者不同道路关系之间的相互作用，从而可以通过关系网络判断每个道路信息或者道路关系是否正确。换言之，步骤207还可以通过关系网络来实现。

换言之，步骤207包括：通过关系网络，获取所述道路关系图的更新信息；其中，所述关系网络的输入为道路关系图中节点或边的特征向量，输出为更新后的节点数据或边数据。

接下来将对关系网络进行进一步说明。关系网络的输出可以为：节点或边的特征向量中每一位特征值是否准确。在道路关系图中存在多种道路关系或者节点存在多种道路信息的情况下，特征向量的特征值即表征了一种道路关系或者一种道路信息，那么关系网络的输出可以理解为：每种道路关系或者每种道路信息是否准确。

对于道路关系而言，因为边往往表征两者之间是否存在该关系，那么边的特征向量中，每一特征值的取值一般是非0即1，因此通过关系网络不仅可以输出特征值是否准确，还可以通过关系网络的识别结果确定准确的边的特征向量究竟是什么。

此外，对于节点而言，节点的道路信息为节点的属性信息，每一种属性信息一般包括几个分类，比如道路类型这种道路信息而言，其一般包括单向道和双向道，因此节点的特征向量也可以通过关系网络完成更新。具体而言，仍沿用上例，关系网络的输出可以是，该节点的道路类型是否为单向道、该节点的道路类型是否为双向道等等。可见关系网络可以很好地更新节点和边的特征向量。

当然还需要说明的是，也可以先通过关系网络来判断错分数据错分原因是否是因为节点或边的特征向量不准确导致的，如果是的话，可以不通过关系网络来更新节点或边的特征向量，可以通过人工分析的方法来更新，这样也能实现较好的更新效果。

此外，为了使得关系网络可以更好地实现对错分数据的更新，还可以在每次通过关系网络更新节点或者边的特征向量的之前，先通过错分数据的识别结果更新(重新训练)关系网络，使得关系网络可以更适用于当前场景。

换言之，上述通过关系网络，获取所述道路关系图的更新信息，包括：从所述错分数据中选取部分数据，并获取选取的部分数据的关系标签，所述关系标签用于表征所述错分数据对应的准确边或节点数据；将选取的部分数据作为关系训练数据，通过所述关系训练数据更新预先训练的关系网络；针对所述错分数据中除所述关系训练数据之外的剩余数据，通过更新后的所述关系网络获取所述剩余数据对应的更新信息。

其中，准确的边或节点数据，可以通过每个特征值是否准确的结果来表征，也可以通过该特征值是否是A或者是否是B来表征(即对应于上述的该节点的道路类型是否为单向道、该节点的道路类型是否为双向道)。

步骤209，基于所述更新信息重新训练所述跨link道路识别网络。

具体而言，先将更新了的错分数据加入训练数据子集(同时将这部分数据从测试数据子集中剔除)，基于更新了的错分数据更新构建的道路关系图，并基于新的道路关系图重新训练跨link道路识别网络，以使得该网络取得较好的跨link识别效果。

此外，还需要说明的是，在执行完步骤201到步骤209之后，为了使得网络有更好的识别效果，还可以重复执行步骤201-步骤209，以使得网络可以通过不断反馈的过程来更新模型，学习到更丰富的信息进一步提升模型的识别效果。

在对上述方法进行整体说明后，接下来还将对可以提高网络识别准确度的做法进行说明。

对于通过图神经网络来进行跨link道路的识别而言，道路关系可以是一种道路关系，也可以是多种道路关系，类似的，道路信息可以包括一种道路信息也可以包括多种道路信息。

如果采用多种道路信息和多种道路关系，可以构建关系更复杂的图，由于神经网络学习的实际上是不同的数据之间的组合关系，训练数据中数据的种类越多，边和节点的内容越丰富，训练完成的上述跨link道路识别网络的识别效果就越好，因此多种道路关系的道路关系图可以生成更加丰富的道路关系图，通过该道路关系图使得图神经网络可以学习到图的更丰富的结构信息，从而使得训练得到的图神经网络对于跨link道路具有更好的识别效果。

换言之，本说明书中的道路关系可以包括多种关系，当然与此同时道路信息也可以包括多种信息。即所述道路关系图包括多个道路关系子图，每个道路关系子图包括多个节点和以及连接节点的边，不同道路关系子图中的所述连接节点的边代表不同道路关系。具有上述关系的道路关系图如图3所示。

需要说明的是，图3中的框代表了一种关系对应的子图，不同框之间节点的连线即代表了两个节点是同一个节点，以及图三中节点的连接是全连接关系，即如果节点A与节点B相连，节点B与节点C相连，那么在图中节点C和节点A之间虽然没有画出连线，但是两者实际上也是相连的。上述道路关系子图即图3中的框所表征的区域。

图3中的其他关系，即代表了上述关系中两种及以上道路关系的组合，比如两个三元组之间的道路类型一致，且道路等级一致，那么可以认为两个三元组之间存在一个其他关系。该其他关系可以是预设的，也可以是通过前文的获取更新信息时获取的。比如可以通过人工分析，发现两种或多种道路关系的组合和跨link道路更加相关，则可以在道路关系图中增加其他关系。

还需要说明的是，图3并不是计算机所实际会使用的图，而是一个为了方便用户阅读查看训练结果所画的图。同时，虽然图3中同一个节点通过图中多个节点来表示出来了，但是在实际图神经网络的训练过程中，多个节点是特征向量是相同的，变化也是同步变化的。

接下来首先对道路关系和道路信息进行说明，道路信息可以是用于表征道路基本属性的信息，比如可以包括以下至少一项道路等级、道路类型、道路构成、道路所属城市、和其他三元组的上下游关系、道路长度、道路宽度、车道数、道路出度、道路入度、道路方向、道路角度等等。

道路等级、道路类型、道路构成在上文已经说过了，在此不再赘述。道路所属城市即表征道路的位置位于哪个城市。道路长度即表征三元组中每个link的长度，道路宽度即表征三元组中每个道路的宽度，道路出度和道路入度表征一条道路下游能通行的道路的数量以及一条道路上游能进入当前道路的道路数量。道路方向和道路角度类似，即表征道路的方位信息。需要说明的是，上述信息如果是数值，那么可以直接将数值作为节点的特征向量中的特征值，如果不是数值(比如是类别特征)，则需要进行编码后进行处理。

和道路信息类似，道路关系表征两个三元组是否具有相同的某个特定的道路信息，比如两个三元组的全部link都是双向道，则认为两个三元组之间具有道路类别的道路关系。道路关系也可以表征三元组与三元组之间的位置关系。比如如果两个三元组之间具有相同link，则可以认为两个三元组具有上下游关系。

道路关系可以包括以下至少一项：是否是同一道路类型、是否是同一道路构成、是否是同一道路类型、是否属于同一城市或是否具有上下游关系。

需要说明的是，上下游关系不仅代表两个三元组包括相同的link，还包括两个三元组都在相同的区域范围内，且从一个三元组可以走到另一个三元组，这种情况也称两个三元组之间具有上下游关系。

需要说明的是，图神经网络学习的是多种信息组合和输出之间的关系，上述多种信息的组合和跨link道路之间存在一定关系，因此可以通过上述包括多种关系和/或包括多种道路信息的数据训练得到识别跨link道路的图神经网络。

在对跨link道路识别网络的训练方法进行说明后，接下来将对本说明书中示出的一种识别跨link道路的方法进行说明。

如图4所示，图4是本说明书根据一示例性实施例示出的一种识别跨link道路的方法的流程图，包括：

步骤401，获取待检测数据，并根据所述待检测数据构建待检测道路关系图。

待检测数据可以是人工输入的，根据待检测数据构建待检测道路关系图的方法可以和相关技术中构建图的方法类似，在此不再赘述。待检测数据可以是地图的全部数据，进而可以提前标记跨link道路。待检测数据也可以是在生成导航路线时，将导航路线中每个顺序相连的三个link的组合看做一个三元组，并将所有三元组看做待检测数据，从而能有针对性的快速识别出导航路线中的跨link道路，从而能对跨link道路对应的引导动作进行针对性提示。

步骤403，通过跨link道路识别网络对所述待检测道路关系图进行识别处理，得到所述待检测道路关系图中的节点是否是跨link道路数据的识别结果。

其中，所述跨link道路识别网络是前述跨link道路识别网络的训练方法训练得到。

将上述构建的待检测道路关系图输入上述网络，便可以得到待检测道路关系图中每个节点是否是跨link道路数据的识别结果，便可以完成跨link道路的识别。

在发现导航路线中存在跨link道路数据时，需要对跨link道路对应的三元组的引导动作进行处理，比如将三元组的两个引导动作同时播报或显示，这样才能避免用户偏航，提升用户的使用体验。

接下来将通过一具体实施例来对本说明书示出的一种跨link道路识别网络的训练方法进行说明。

图神经网络的训练方法的整体架构如图5所示，包括数据获取模块、关系构建模块、深度学习模型模块和关系更新模块。数据获取模块用于获取训练数据和测试数据；关系构建模块用于构建包括多种道路关系的道路关系图。另外，当闭环反馈机制中关系更新判断结果为“是”时，会构建新的关系图并更新训练数据；深度学习模型模块用于从不同的关系图中学习信息提升模型识别效果；关系更新模块由专家经验模块和关系生成模块组成，专家经验模块用于抽取部分测试数据并对这部分数据进行质量评判(判断错分比例是否小于比例阈值)，关系生成模块用于从错分数据中重新确定新的道路关系，最后，基于是否有新关系来反馈到关系构建模块，从而实现闭环让模型学习更丰富的图关系信息提升模型识别效果。

接下来将对上述模块的具体功能进行详细说明。

数据获取模块：从数据库中获取道路数据，并根据一定策略筛选出跨link数据，按照三元组表示为，这里的筛选策略一般会根据道路类型、道路等级、道路构成等方法根据经验产生，同时获取这批数据的前后link数据。并给这些数据提供给人工标注，标签含义为是否跨link道路数据，剩余的数据作为测试数据用于预测，这样便得到了道路数据集合、测试数据子集和训练数据子集。当使用上述策略筛选得到一批数据后，其中会存在真实跨link道路数据和非跨link道路数据，需要通过下述模块从中识别出真实跨link道路。

关系构建模块：通过道路数据集合，根据不同的道路关系类型构建不同的道路关系子图，其中点表示一个三元组，边的类型主要由以下几种关系构成：上下游关系、同一道路类型、同一道路构成、同一城市等。每个节点还包含三元组中每条道路link的基础信息，比如道路长度、道路宽度、车道数、道路出度、道路入度、道路方向、道路角度等信息，这些信息都会用于后续深度学习模型模块中进行处理，其中数值特征直接使用，类别特征作相应编码处理。这样，通过关系构建模块可以构建出包括多种道路关系的道路关系子图，多个子图共同组成了道路关系图。

深度学习模型模块：当关系构建模块把整个关系图构建完之后，可以利用一些图模型，比如：GCN、GAT、GAE等来学习整个图结构关系以及道路交互信息，然后针对训练数据进行有监督学习，直至模型收敛。

关系更新模块主要由筛选测试数据、专家经验子模块、关系生成子模块构成，这里，专家经验模块主要是对测试数据进行质量评判，关系生成模块主要是根据质量评判结果进行分析生成新的关系并反馈给关系构建模块。

当深度学习模型模块中模型学习收敛后，进行是否是测试数据的筛选，得到道路数据集合中的测试数据子集，并得到测试数据的分类结果。

专家经验子模块用来从测试数据子集中抽取部分数据作为预测数据，并对预测数据进行质量评判，这里的抽取方法如下：

第一步，根据关系构建模块，从不同关系中随机抽取一部分数据，假设为data_A；

第二步，统计data_A中每个三元组的车流量，比如日流量、月流量、季流量、年流量等，从中随机抽取一部分数据，假设为data_B。

然后对data_B数据进行评测，将dataB的上述分类结果与标签进行比较找出错分数据。并判断错分数据对应的错分比例是否小于预设的比例阈值，如果小于预设的比例阈值，则无需对错分数据进行更新，如果大于预设的比例阈值，则需要通过关系生成子模块对错分数据进行更新。

关系生成子模块用于对错分数据进行分析，得到错分数据的边和节点的准确的特征向量。分析可以通过人工进行分析，也可以通过关系网络进行分析。在分析完成后，需要通过更新的信息更新道路关系图，并且将这部分数据增加至训练数据，通过训练数据重新训练上述跨link道路识别网络，这样可以提升网络的识别效果。

与前述方法的实施例相对应，本说明书还提供了装置及其所应用的终端的实施例。

如图6所示，图6是本说明书根据一示例性实施例示出的一种跨link道路识别网络的训练装置的框图，所述装置包括：

道路数据集合获取单元610，用于获取道路数据集合，所述道路数据集合包含多个三元组的道路信息，及每个三元组分别对应的标签，所述标签用于表示所述三元组是否为跨link道路数据；所述道路数据集合包括训练数据子集和测试数据子集；所述三元组包括相连接的三条link；

网络训练单元620，用于通过所述训练数据子集训练跨link道路识别网络；所述跨link道路识别网络的输入为道路关系图，输出为跨link道路的识别结果；所述道路关系图包括多个节点以及连接节点的边，每个节点用于表征三元组，每条边用于表征两个三元组之间的道路关系；所述道路关系用于表征两个三元组的是否存在相同的道路信息或用于表征两个三元组中link的位置关系；

测试数据子集预测单元630，用于根据所述跨link道路识别网络对所述测试数据子集进行预测，确定所述测试数据子集中所述跨link道路识别网络的识别结果与标签不符的错分数据；

更新信息获取单元640，用于针对所述错分数据，获取所述道路关系图的更新信息，所述更新信息包括：错分数据对应的节点数据、以及错分数据对应的边数据；

网络重新训练单元650，用于基于所述更新信息重新训练所述跨link道路识别网络。

在一可选实施例中，道路数据集合获取单元610，用于获取相连接的三条link；在所述三条link符合预设道路条件的情况下，将所述三条link作为所述道路数据集合中的所述三元组，所述预设道路条件包括：所述三条link中的中间link的道路长度小于长度阈值，且中间link与三条link中的任一其他link的夹角大于预设的夹角阈值。

在一可选实施例中，还包括道路数据集合增加单元660(图中未示出)，用于根据所述道路数据集合中三元组中link的位置，获取位置与所述link的位置相邻的相邻三元组；在所述道路数据集合中增加所述相邻三元组。

在一可选实施例中，所述道路关系图包括多个道路关系子图，每个道路关系子图包括多个节点和以及连接节点的边，不同道路关系子图中的所述连接节点的边代表不同道路关系。

在一可选实施例中，所述道路关系包括以下至少一项：是否是同一道路类型、是否是同一道路构成、是否是同一道路类型、是否属于同一城市或是否具有上下游关系；和/或；所述道路信息包括以下至少一项：道路等级、道路类型、道路构成、道路所属城市、和其他三元组的上下游关系、道路长度、道路宽度、车道数、道路出度、道路入度、道路方向、道路角度。

在一可选实施例中，测试数据子集预测单元630，包括：预测数据筛选子单元631(图中未示出)，用于从所述测试数据子集中选出预测数据；预测数据预测子单元632(图中未示出)，用于：通过所述跨link道路识别网络对所述预测数据进行预测，确定所述预测数据中所述跨link道路识别网络的识别结果与标签不符的错分数据。

在一可选实施例中，所述道路关系图的边用于表征两个三元组之间的多种道路关系；预测数据筛选子单元631，用于针对所述测试数据子集，从每个的道路关系对应的道路数据中抽取部分道路数据，将抽取出的道路数据组成预测数据。

在一可选实施例中，预测数据筛选子单元631，用于针对所述测试数据子集，统计每个三元组包括的link的车流量，确定每个三元组包括的三个link的车流量平均值所属的车流量范围；在每个车流量范围对应的道路数据中抽取出部分道路数据，将抽取出的道路数据组成预测数据。

在一可选实施例中，更新信息获取单元640，用于确定错分数据占预测数据的错分比例；所述预测数据为测试数据子集的一部分或全部；在所述错分比例大于预设比例阈值的情况下，获取所述道路关系图的更新信息。

在一可选实施例中，还包括车流量统计模块670(图中未示出)，用于针对所述测试数据子集，统计每个三元组包括的link的车流量，确定每个三元组包括的三个link的车流量平均值所属的车流量范围；更新信息获取单元640，用于针对每个车流量范围，执行：确定该车流量范围对应的错分数据占预测数据的错分比例；在该错分比例大于该车流量范围对应的的比例阈值的情况下，获取所述道路关系图的更新信息；其中，车流量范围对应的道路数据的车流量平均值越大，该车流量范围对应的比例阈值越低。

在一可选实施例中，更新信息获取单元640，用于通过关系网络，获取所述道路关系图的更新信息；其中，所述关系网络的输入为道路关系图中节点或边的特征向量，输出为更新后的节点数据或边数据。

在一可选实施例中，更新信息获取单元640，用于将选取的部分数据作为关系训练数据，通过所述关系训练数据更新预先训练的关系网络；针对所述错分数据中除所述关系训练数据之外的剩余数据，通过更新后的所述关系网络获取所述剩余数据对应的更新信息。

如图7所示，图7是本说明书根据一示例性实施例示出的一种识别跨link道路的装置的框图，所述装置包括：

待检测道路关系图构建单元710，用于获取待检测数据，并根据所述待检测数据构建待检测道路关系图；

识别结果获取单元720，用于通过跨link道路识别网络对所述待检测道路关系图进行识别处理，得到所述待检测道路关系图中的节点是否是跨link道路数据的识别结果；其中，所述跨link道路识别网络是前述跨link道路识别网络的训练方法训练得到。

上述装置中各个模块的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程，在此不再赘述。

对于装置实施例而言，由于其基本对应于方法实施例，所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理模块，即可以位于一个地方，或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本说明书方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

如图8所示，图8示出了实施例跨link道路识别网络的训练装置或识别跨link道路的装置所在计算机设备的一种硬件结构图，该设备可以包括：处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。

处理器1010可以采用通用的CPU(Central Processing Unit，中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit，ASIC)、或者一个或多个集成电路等方式实现，用于执行相关程序，以实现本说明书实施例所提供的技术方案。

存储器1020可以采用ROM(Read Only Memory，只读存储器)、RAM(Random AccessMemory，随机存取存储器)、静态存储设备，动态存储设备等形式实现。存储器1020可以存储操作***和其他应用程序，在通过软件或者固件来实现本说明书实施例所提供的技术方案时，相关的程序代码保存在存储器1020中，并由处理器1010来调用执行。

输入/输出接口1030用于连接输入/输出模块，以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出)，也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等，输出设备可以包括显示器、扬声器、振动器、指示灯等。

通信接口1040用于连接通信模块(图中未示出)，以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信，也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。

总线1050包括一通路，在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。

需要说明的是，尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050，但是在具体实施过程中，该设备还可以包括实现正常运行所必需的其他组件。此外，本领域的技术人员可以理解的是，上述设备中也可以仅包含实现本说明书实施例方案所必需的组件，而不必包含图中所示的全部组件。

本说明书实施例还提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现前述的跨link道路识别网络的训练方法或识别跨link道路方法。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

本说明书还提供一种计算机程序，用于实现前述的跨link道路识别网络的训练方法或识别跨link道路方法。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

Claims

1.一种跨link道路识别网络的训练方法，所述方法包括：

获取道路数据集合，所述道路数据集合包含多个三元组的道路信息，及每个三元组分别对应的标签，所述标签用于表示所述三元组是否为跨link道路数据；所述道路数据集合包括训练数据子集和测试数据子集；所述三元组包括相连接的三条link，所述三条link中的中间link的道路长度小于长度阈值，且中间link与三条link中的任一其他link的夹角大于预设的夹角阈值；

基于所述更新信息重新训练所述跨link道路识别网络。

2.根据权利要求1所述的方法，所述道路关系图包括多个道路关系子图，每个道路关系子图包括多个节点和以及连接节点的边，不同道路关系子图中的所述连接节点的边代表不同道路关系。

3.根据权利要求2所述的方法，所述根据所述跨link道路识别网络对所述测试数据子集进行预测，确定所述测试数据子集中所述跨link道路识别网络的识别结果与标签不符的错分数据，包括：

针对所述测试数据子集，从每个的道路关系对应的道路数据中抽取部分道路数据，将抽取出的道路数据组成预测数据；

根据所述跨link道路识别网络对所述预测数据进行预测，确定所述预测数据中所述跨link道路识别网络的识别结果与标签不符的错分数据。

4.根据权利要求1所述的方法，

所述道路关系包括以下至少一项：是否是同一道路类型、是否是同一道路构成、是否属于同一城市或是否具有上下游关系；和/或；

所述道路信息包括以下至少一项：道路等级、道路类型、道路构成、道路所属城市、和其他三元组的上下游关系、道路长度、道路宽度、车道数、道路出度、道路入度、道路方向、道路角度。

5.根据权利要求1所述的方法，所述针对所述错分数据，获取所述道路关系图的更新信息，包括：

确定错分数据占预测数据的错分比例；所述预测数据为测试数据子集的一部分或全部；

在所述错分比例大于预设比例阈值的情况下，获取所述道路关系图的更新信息。

6.根据权利要求1所述的方法，

所述方法还包括：针对所述测试数据子集，统计每个三元组包括的link的车流量，确定每个三元组包括的三个link的车流量平均值所属的车流量范围；

所述针对所述错分数据，获取所述道路关系图的更新信息，包括：

针对每个车流量范围，执行：

确定该车流量范围对应的错分数据占预测数据的错分比例；

在该错分比例大于该车流量范围对应的的比例阈值的情况下，获取所述道路关系图的更新信息；

其中，车流量范围对应的道路数据的车流量平均值越大，该车流量范围对应的比例阈值越低。

7.根据权利要求1所述的方法，所述获取所述道路关系图的更新信息，包括：

通过关系网络，获取所述道路关系图的更新信息；其中，所述关系网络的输入为道路关系图中节点或边的特征向量，输出为更新后的节点数据或边数据。

8.根据权利要求7所述的方法，所述通过关系网络，获取所述道路关系图的更新信息，包括：

从所述错分数据中选取部分数据，并获取选取的部分数据的关系标签，所述关系标签用于表征准确的边或节点数据；

将选取的部分数据作为关系训练数据，通过所述关系训练数据更新预先训练的关系网络；

针对所述错分数据中除所述关系训练数据之外的剩余数据，通过更新后的所述关系网络获取所述剩余数据对应的更新信息。

9.一种识别跨link道路的方法，包括：

通过跨link道路识别网络对所述待检测道路关系图进行识别处理，得到所述待检测道路关系图中的节点是否是跨link道路数据的识别结果；其中，所述跨link道路识别网络是通过权利要求1至8中任一项所述的方法训练得到。

10.一种跨link道路识别网络的训练装置，包括：

道路数据集合获取单元，用于获取道路数据集合，所述道路数据集合包含多个三元组的道路信息，及每个三元组分别对应的标签，所述标签用于表示所述三元组是否为跨link道路数据；所述道路数据集合包括训练数据子集和测试数据子集；所述三元组包括相连接的三条link；所述三条link中的中间link的道路长度小于长度阈值，且中间link与三条link中的任一其他link的夹角大于预设的夹角阈值；

11.一种识别跨link道路的装置，包括：

识别结果获取单元，用于通过跨link道路识别网络对所述待检测道路关系图进行识别处理，得到所述待检测道路关系图中的节点是否是跨link道路数据的识别结果；其中，所述跨link道路识别网络是通过权利要求1至8中任一项所述的方法训练得到。

12.一种计算机设备，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器通过运行所述可执行指令以实现如权利要求1-9中任一项所述的方法。

13.一种计算机可读存储介质，所述可读存储介质上存储有计算机指令，所述计算机指令被处理器执行时实现如权利要求1-9中任一项所述的方法。