CN118070683A

CN118070683A - 基于数字孪生的物流运输大数据采集方法及***

Info

Publication number: CN118070683A
Application number: CN202410479382.4A
Authority: CN
Inventors: 郭欣青
Original assignee: Shandong Normal University
Current assignee: Shandong Normal University
Priority date: 2024-04-22
Filing date: 2024-04-22
Publication date: 2024-05-24
Anticipated expiration: 2044-04-22
Also published as: CN118070683B

Abstract

本发明涉及物流运输时长预测技术领域，具体涉及基于数字孪生的物流运输大数据采集方法及***。方法包括：获取待分析物流运输路线在历史时间段每次运输以及当前运输对应的行程曲线；根据待分析行程曲线的每个数据段对应的路程差、每个数据段的每个行驶路程与标准行程曲线上同一行驶路程对应的横坐标的差异，筛选异常数据段；根据每个数据段与标准行程曲线对应的标准段的斜率差异和时长的差异得到每个数据段的异常评价值；根据每个待分析行程曲线的异常数据段在所有待分析行程曲线上对应的数据段的异常评价值的相似情况，筛选目标曲线，对数字孪生模型进行训练，进而获得当前运输的行驶时长。本发明提高了物流运输时长预测结果的准确度。

Description

基于数字孪生的物流运输大数据采集方法及***

技术领域

本发明涉及物流运输时长预测技术领域，具体涉及基于数字孪生的物流运输大数据采集方法及***。

背景技术

数字孪生模型是一种基于物理实体的数字化模型，通过将实际数据收集、仿真和分析结合起来，实现对实体***的全面建模和实时监控，数字孪生技术在工业制造、城市管理、物流运输等领域已得到了广泛的应用。例如在物流运输领域可以通过整合实时数据，监控车辆、货物和路况等信息进行预测和分析，帮助管理者在制定运输计划时做出更好的决策。

在利用数字孪生模型对物流运输时长进行预测分析时，车辆运输情况出现异常可能是由于单个车辆出现问题造成的个别异常或者由于交通状况改变造成的大量异常，例如，某个车辆在物流运输过程中出现抛锚现象导致运输时长增加，司机在驾驶过程中出现问题或意外情况，雨雪天气造成的堵车导致车辆速度低于预期值等。由于交通状况等因素改变造成的大量异常时的异常数据对数字孪生模型预测的参考度较高，而单个车辆出现问题造成的个别异常的异常数据对数字孪生模型预测的参考度较低，若参与到对数字孪生模型的训练过程中则会导致物流运输时长的预测结果的准确度较低。

发明内容

为了解决现有方法对数字孪生模型进行训练进而预测物流运输时长时不对数据集进行筛选，进而导致物流运输时长的预测结果的准确度较低的问题，本发明的目的在于提供一种基于数字孪生的物流运输大数据采集方法及***，所采用的技术方案具体如下：

第一方面，本发明提供了一种基于数字孪生的物流运输大数据采集方法，该方法包括以下步骤：

获取待分析物流运输路线在历史时间段每次运输过程中以及当前运输过程中每个采集时刻的行驶路程，构建每次运输对应的行程曲线，所述行程曲线的横坐标为采集时刻，纵坐标为行驶路程；

基于历史时间段每次运输过程中的行驶路程筛选待分析行程曲线；基于标准行程曲线上数据点的斜率获得标准行程曲线的标准段和待分析行程曲线的数据段；根据每个数据段对应的路程差、每个数据段的每个行驶路程对应的横坐标与标准行程曲线上同一行驶路程对应的横坐标之间的差异，获得每个数据段的差异指标，基于差异指标筛选每条待分析行程曲线的异常数据段；

根据每个数据段与对应的标准段的斜率差异、时长的差异和所述差异指标，得到每个数据段的异常评价值；根据每个待分析行程曲线的异常数据段在所有待分析行程曲线上对应的数据段的异常评价值的相似情况，得到每个待分析行程曲线的参考度，基于所述参考度筛选目标曲线；

基于所述目标曲线对数字孪生模型进行训练获得训练好的数字孪生模型，将当前运输对应的行程曲线输入训练好的数字孪生模型中，获得当前运输的行驶时长。

优选的，所述基于历史时间段每次运输过程中的行驶路程筛选待分析行程曲线，包括：

对于历史时间段第i次运输过程：

将所述第i次运输过程中的行驶路程与待分析物流运输路线的总路程的差值的绝对值，记为路程差异；若所述路程差异与待分析物流运输路线的总路程的比值小于预设占比阈值，则将所述第i次运输对应的行程曲线作为待分析行程曲线。

优选的，所述基于标准行程曲线上数据点的斜率获得标准行程曲线的标准段和待分析行程曲线的数据段，包括：

基于标准行程曲线上每个数据点的斜率，采用层次聚类算法对标准行程曲线上数据点进行聚类，获得标准行程曲线的标准段；

按照标准行程曲线的每个标准段的长度分别对每个待分析行程曲线进行划分，获得待分析行程曲线的数据段。

优选的，所述根据每个数据段对应的路程差、每个数据段的每个行驶路程对应的横坐标与标准行程曲线上同一行驶路程对应的横坐标之间的差异，获得每个数据段的差异指标，包括：

对于第b个待分析行程曲线的第p个数据段：

将所述第p个数据段的两个端点对应的行驶路程之间的差异，作为第p个数据段对应的路程差；

将所述第p个数据段的每个行驶路程对应的横坐标与标准行程曲线上同一行驶路程对应的横坐标之间的差异，记为第p个数据段的每个行驶路程对应的时间差异；

根据所述路程差和所述时间差异，得到所述第p个数据段的差异指标，所述路程差与所述差异指标呈负相关关系，所述时间差异与所述差异指标呈正相关关系。

优选的，所述基于差异指标筛选每条待分析行程曲线的异常数据段，包括：

将差异指标大于预设差异阈值的数据段作为异常数据段。

优选的，所述根据每个数据段与对应的标准段的斜率差异、时长的差异和所述差异指标，得到每个数据段的异常评价值，包括：

对于第b个待分析行程曲线：

基于第b个待分析行程曲线上每个数据点的斜率，采用层次聚类算法对第b个待分析行程曲线上数据点进行聚类，获得第b个待分析行程曲线的特征段；

对于第b个待分析行程曲线的第p个数据段，采用如下公式计算第b个待分析行程曲线的第p个数据段的异常评价值：

其中，表示第b个待分析行程曲线的第p个数据段的异常评价值，/>表示第b个待分析行程曲线的第p个数据段的差异指标，/>表示第b个待分析行程曲线的第p个数据段对应的时长，/>表示第b个待分析行程曲线的第p个数据段的路程在标准行程曲线上所对应的时长，/>表示第b个待分析行程曲线的第p个数据段上所有数据点的斜率的平均值，表示标准行程曲线的第p个标准段上所有数据点的斜率的平均值，/>表示第b个待分析行程曲线的第p个数据段中包含的特征段的端点的数量，/>表示符号函数，/>表示取绝对值符号。

优选的，所述根据每个待分析行程曲线的异常数据段在所有待分析行程曲线上对应的数据段的异常评价值的相似情况，得到每个待分析行程曲线的参考度，包括：

对于第b个待分析行程曲线：

对于第b个待分析行程曲线的第k个异常数据段：分别获取每个待分析行程曲线上与第b个待分析行程曲线的第k个异常数据段对应的位置的数据段，并记为每个待分析行程曲线的参考段；按照所有待分析行程曲线对应的起始时刻的先后顺序对所有待分析行程曲线的参考段进行排序，获得所述第k个异常数据段对应的参考段序列；根据所述参考段序列中每个参考段与其相邻的参考段的异常评价值之间的差异，得到所述第k个异常数据段对应的相似度；

根据第b个待分析行程曲线的所有异常数据段对应的相似度，获得第b个待分析行程曲线的参考度。

优选的，采用如下公式计算第b个待分析行程曲线的参考度：

其中，表示第b个待分析行程曲线的参考度，/>表示第b个待分析行程曲线的异常数据段的数量，R表示第b个待分析行程曲线的第k个异常数据段对应的参考段序列中参考段的数量，/>表示第b个待分析行程曲线的第k个异常数据段对应的参考段序列中第r个参考段的异常评价值，/>表示第b个待分析行程曲线的第k个异常数据段对应的参考段序列中第r-1个参考段的异常评价值，/>表示第b个待分析行程曲线的第k个异常数据段对应的参考段序列中第r+1个参考段的异常评价值，/>表示取绝对值符号，exp( )表示以自然常数为底数的指数函数。

优选的，所述基于所述参考度筛选目标曲线，包括：

将参考度大于预设参考阈值的待分析行程曲线作为目标曲线。

第二方面，本发明提供了一种基于数字孪生的物流运输大数据采集***，包括存储器和处理器，所述处理器执行所述存储器存储的计算机程序，以实现上述所述的一种基于数字孪生的物流运输大数据采集方法。

本发明至少具有如下有益效果：

本发明首先基于行驶路程从历史时间段每次运输对应的行程曲线中筛选出了待分析行程曲线，对数字孪生模型的训练集进行了初步筛选，由于物流运输车辆在运输过程中出现异常可能是个别车辆抛锚或者是司机的驾驶造成的，而并非堵车情况造成的，因此这类数据若参与到对数字孪生模型的训练中，则会影响后续运输时长预测结果的准确度，本发明又结合每个数据段的每个行驶路程对应的横坐标与标准行程曲线上同一行驶路程对应的横坐标之间的差异、每个数据段与对应的标准段的斜率差异和时长的差异，再次对行程曲线进行了筛选获得了多条目标曲线，将目标曲线作为数字孪生模型的训练集，对数字孪生模型进行训练，本发明提供的方法当交通状况等因素改变造成的大量异常时，及时对数字孪生模型进行更新优化，避免因模型数据滞后而出现过多不必要的异常反馈，进而利用训练好的数字孪生模型对物流的运输时长进行预测，提高了物流运输时长预测结果的准确度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案和优点，下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它附图。

图1为本发明实施例所提供的一种基于数字孪生的物流运输大数据采集方法的流程图。

具体实施方式

为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效，以下结合附图及较佳实施例，对依据本发明提出的一种基于数字孪生的物流运输大数据采集方法及***进行详细说明如下。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。

下面结合附图具体的说明本发明所提供的基于数字孪生的物流运输大数据采集方法及***的具体方案。

基于数字孪生的物流运输大数据采集方法实施例：

本实施例所针对的具体场景为：在对物流运输过程中的车辆的运输时长进行预测时，由于不同时间段内的路况情况不同，例如途中有道路施工造成长期堵车等，因此为了提高预测结果的准确度，需要结合道路的实际情况对车辆的运输时长进行预测，本实施例将从历史时间段每次运输过程中的车辆信息数据中筛选参考价值较大的数据对数字孪生模型进行训练，利用训练好的数字孪生模型对前运输的行驶时长进行预测，提高数字孪生模型的预测结果的准确度。

本实施例提出了基于数字孪生的物流运输大数据采集方法，如图1所示，本实施例的基于数字孪生的物流运输大数据采集方法包括以下步骤：

步骤S1，获取待分析物流运输路线在历史时间段每次运输过程中以及当前运输过程中每个采集时刻的行驶路程，构建每次运输对应的行程曲线，所述行程曲线的横坐标为采集时刻，纵坐标为行驶路程。

本实施例首先采集待分析物流运输路线在历史时间段每次运输过程中的车辆信息数据，本实施例中的历史时间段为与当前时刻的时间间隔小于等于预设时长的所有历史时刻构成的集合，需要说明的是，本实施例中待分析物流运输路线在历史时间段的运输过程均为已经完成的完整的物流运输过程；本实施例设置每分钟采集一次车辆信息数据，本实施例的预设时长为三个月，在具体应用中，实施者可根据具体情况设置预设时长和车辆信息数据的采样频率。同时，采集车辆在当前运输过程中的车辆信息数据，本实施例中的车辆信息数据包括行驶路程。

至此，本实施例获取了待分析物流运输路线在历史时间段每次运输过程中以及当前运输过程中每个采集时刻的行驶路程。对于任意一次运输过程：基于该次运输过程中每个采集时刻的行驶路程，对该次运输过程中每个采集时刻的行驶路程进行曲线拟合，获得该次运输对应的行程曲线，行程曲线的横坐标为采集时刻，纵坐标为行驶路程。采用上述方法，能够获得每次运输对应的行程曲线。曲线拟合为现有技术，此处不再过多赘述。

步骤S2，基于历史时间段每次运输过程中的行驶路程筛选待分析行程曲线；基于标准行程曲线上数据点的斜率获得标准行程曲线的标准段和待分析行程曲线的数据段；根据每个数据段对应的路程差、每个数据段的每个行驶路程对应的横坐标与标准行程曲线上同一行驶路程对应的横坐标之间的差异，获得每个数据段的差异指标，基于差异指标筛选每条待分析行程曲线的异常数据段。

在采用数字孪生技术对物流运输过程中车辆的行驶时长进行预测和分析时，对于因驾驶员走错路或出现意外情况等偶然因素造成的个别车辆运输情况异常，针对个别情况进行调整即可；而对于集中出现的大量异常，例如途中有道路施工造成长期堵车，此时应及时对预测模型进行更新优化，避免因模型数据滞后而出现过多不必要的异常反馈。

由于本实施例是以物流运输过程中的一条线路为例进行说明的，也即起点和终点相同，且行驶路线基本相同，因此每一条行程曲线的终点对应的路程应与标准行程曲线的终点对应的路程差别不大，将终点的路程过大或过小的曲线记为终点异常的噪声曲线。筛选出终点异常的噪声曲线，避免对后续分析造成干扰。标准行程曲线是基于经验拟合获得的曲线，标准行程曲线的横坐标仍为采集时刻，纵坐标仍为行驶路程。

对于历史时间段第i次运输过程：将所述第i次运输过程中的行驶路程与待分析物流运输路线的总路程的差值的绝对值，记为路程差异；路程差异与待分析物流运输路线的总路程的比值越大，说明对应的行程曲线越可能为异常曲线，为了提高后续数字孪生模型预测结果的准确度，本实施例将基于路程差异与待分析物流运输路线的总路程的比值对历史时间段的运输过程对应的行程曲线进行筛选，若所述路程差异与待分析物流运输路线的总路程的比值小于预设占比阈值，则将所述第i次运输对应的行程曲线作为待分析行程曲线。采用上述方法，能够从历史时间段所有运输过程对应的行程曲线中筛选出多条待分析行程曲线。预设占比阈值为0.05，在具体应用中，实施者可根据具体情况进行设置。

由于市区道路、普通公路、高速公路等不同道路类型的道路限速不同，因此可以通过车辆行驶的平均速度将标准行程曲线划分为多段。车辆运输时在不同路段上行驶速度不同，例如车辆在市区或山区道路行驶时速度在0~50 km/h，在普通公路行驶时速度在50~80km/h，在高速公路行驶时速度在80~100km/h，在休息区休息时速度为0，因此本实施例将根据车辆的行驶速度对行程曲线进行分段，由于本实施例中行程曲线的斜率为车速，因此本实施例将根据速度对行程曲线进行分段。首先基于标准行程曲线上每个数据点的斜率，采用层次聚类算法对标准行程曲线上数据点进行聚类，获得多个聚类簇，将此时获取到每个聚类簇作为一个标准段，也即获得了标准行程曲线的多个标准段；按照标准行程曲线的每个标准段的长度分别对每个待分析行程曲线进行划分，获得每个待分析行程曲线的多个数据段。待分析行程曲线的数据段与标准行程曲线的标准段的长度存在一一对应的关系。曲线上数据点的斜率以及层次聚类算法均为现有技术，此处不再过多赘述。本实施例接下来将根据每个数据段对应的路程差、每个数据段的每个行驶路程对应的横坐标与标准行程曲线上同一行驶路程对应的横坐标之间的差异情况，获得每个数据段的差异指标。

具体地，对于第b个待分析行程曲线的第p个数据段：

将所述第p个数据段的两个端点对应的行驶路程之间的差异，作为第p个数据段对应的路程差；将所述第p个数据段的每个行驶路程对应的横坐标与标准行程曲线上同一行驶路程对应的横坐标之间的差异，记为第p个数据段的每个行驶路程对应的时间差异，也即第p个数据段上的每个数据点的纵坐标均获得了一个对应的时间差异。根据所述路程差和所述时间差异，得到所述第p个数据段的差异指标，所述路程差与所述差异指标呈负相关关系，所述时间差异与所述差异指标呈正相关关系。其中，正相关关系表示因变量会随着自变量的增大而增大，因变量会随着自变量的减小而减小，具体关系可以为相乘关系、相加关系、指数函数的幂等，由实际应用进行确定；负相关关系表示因变量会随着自变量的增大而减小，因变量会随着自变量的减小而增大，可以为相减关系、相除关系等，由实际应用进行确定。作为一个具体实施方式，给出差异指标的计算公式，第b个待分析行程曲线的第p个数据段的差异指标具体计算公式为：

其中，表示第b个待分析行程曲线的第p个数据段的差异指标，/>表示第b个待分析行程曲线的第p个数据段的左端点对应的行驶路程，/>表示第b个待分析行程曲线的第p个数据段的右端点对应的行驶路程，J表示第b个待分析行程曲线的第p个数据段上行驶路程的数量，/>表示第b个待分析行程曲线的第p个数据段的第j个行驶路程对应的采集时刻，/>表示标准行程曲线的第p个标准段的第j个行驶路程对应的采集时刻，/>表示归一化函数，/>为预设调整参数，/>大于0。

表示第p个数据段的第j个行驶路程对应的时间差异，/>表示第p个数据段对应的路程差；差异指标的计算公式中引入预设调整参数是为了防止分母为0，本实施例中预设调整参数为0.01，在具体应用中，实施者可根据具体情况进行设置。当路程差越小、第p个数据段的行驶路程对应的时间差异越大时，也/>的值越大时，说明第b个待分析曲线的第p个数据段与标准行程曲线的第p个标准段之间的偏差越大，即第b个待分析行程曲线的第p个数据段的差异指标越大。

采用上述方法，能够获得每个数据段的差异指标，差异指标越大，说明对应数据段中的数据与其他数据之间的差异越大，因此本实施例将差异指标大于预设差异阈值的数据段作为异常数据段，因此获得了多个异常数据段。本实施例中预设差异阈值为0.5，在具体应用中，实施者可根据具体情况进行设置。

步骤S3，根据每个数据段与对应的标准段的斜率差异、时长的差异和所述差异指标，得到每个数据段的异常评价值；根据每个待分析行程曲线的异常数据段在所有待分析行程曲线上对应的数据段的异常评价值的相似情况，得到每个待分析行程曲线的参考度，基于所述参考度筛选目标曲线。

通过差异指标初步筛选获得的异常数据段无法准确反映行程曲线的具体异常情况，因此本实施例将结合每个数据段与对应的标准段的斜率差异、时长的差异和差异指标，对每个数据段的异常情况进行评价，获得每个数据段的异常评价值。

对于第b个待分析行程曲线：基于第b个待分析行程曲线上每个数据点的斜率，采用层次聚类算法对第b个待分析行程曲线上数据点进行聚类，获得多个聚类簇，将此时获得的每个聚类簇对应的数据段记为第b个待分析行程曲线的特征段，也即将第b个待分析行程曲线划分为了多个特征段。第b个待分析行程曲线的每个数据段与对应的标准段的差异指标越大，说明第b个待分析行程曲线的速度异常情况越大。若第b个待分析行程曲线的第p个数据段前的某一段出现异常导致车辆进入和离开第p个数据段最后一个时刻对应的路程的时刻发生整体变化也可能造成第p个数据段的差异指标偏大，可以通过车辆在第p个数据段的行驶时间与经验行驶时间的差异来区分这种情况，当差异指标偏大而行驶时间与经验行驶时间相近且曲线速度没有较大异常时，说明导致差异指标偏大的异常并非由第p个数据段引起的。将第b个待分析行程曲线的第p个数据段平均速度与标准行程曲线的第p个标准段平均速度之间的异常越大，说明该段上车辆速度偏低或是偏高。基于此，本实施例将结合每个数据段与对应的标准段的斜率差异、时长的差异和差异指标，对每个数据段的异常情况进行评价，获得每个数据段的异常评价值。

具体地，对于第b个待分析行程曲线的第p个数据段，采用如下公式计算第b个待分析行程曲线的第p个数据段的异常评价值：

用于反映第b个待分析行程曲线的第p个数据段对应的时长与第b个待分析行程曲线的第p个数据段的路程在标准行程曲线上对应的时长之间的差异情况，该值越大，说明第b个待分析行程曲线的第p个数据段可能越异常；/>能够体现第b个待分析行程曲线的第p个数据段上速度严重偏离标准行程曲线的程度，加1是为了防止分子等于0导致特征丧失；/>的结果为负，说明第b个待分析行程曲线的第p个数据段车速偏低；结果为正，说明第b个待分析行程曲线的第p个数据段车速偏高；/>的结果作为调整系数，将调整系数与第b个待分析行程曲线的第p个数据段的差异指标相乘，获得第b个待分析行程曲线的第p个数据段的异常评价值，异常评价值体现第b个待分析行程曲线的第p个数据段的异常表现情况，/>的绝对值越大，说明第b个待分析行程曲线的第p个数据段表现越异常，/>为负时，说明第b个待分析行程曲线的第p个数据段速度偏低，为正时，说明第b个待分析行程曲线的第p个数据段速度偏高。

采用上述方法，能够获得每个待分析行程曲线的每个数据段的异常评价值。

标准行程曲线的标准段是由标准行程曲线以速度为依据分段获得的，可以近似视为不同标准段就是车辆在不同类型的路段上行驶的情况，对比历史时间段内每一次行程在一个路段上行驶出现的异常情况，例如若某一路段在进行道路施工，导致历史时间段内多次行程都在这一路段出现堵车情况，那么历史时间段内多次运输对应的行程曲线都在这一标准段对应的数据段出现异常且这些行程曲线在对应的数据段的异常评价值均相近，即异常的相似度高。基于此，本实施例将根据每个待分析行程曲线的异常数据段在所有待分析行程曲线上对应的数据段的异常评价值的相似情况，得到每个待分析行程曲线的参考度。

对于第b个待分析行程曲线：

对于第b个待分析行程曲线的第k个异常数据段：分别获取每个待分析行程曲线上与第b个待分析行程曲线的第k个异常数据段对应的位置的数据段，并记为每个待分析行程曲线的参考段；按照所有待分析行程曲线对应的起始时刻的先后顺序对所有待分析行程曲线的参考段进行排序，获得所述第k个异常数据段对应的参考段序列；根据所述参考段序列中每个参考段与其相邻的参考段的异常评价值之间的差异，得到所述第k个异常数据段对应的相似度。采用该方法，能够获得第b个待分析行程曲线的每个异常数据段对应的相似度。根据第b个待分析行程曲线的所有异常数据段对应的相似度，获得第b个待分析行程曲线的参考度。第b个待分析行程曲线的参考度的具体计算公式为：

用于反映第b个待分析行程曲线的第k个异常数据段对应的参考段序列中第r个参考段与其相邻的两个参考段的异常评价值之间的差异，该值越小，说明第r个参考段与其相邻的两个参考段的异常情况越相似，需要说明的是，当r-1=0或r+1=R+1时，认为/>与/>相等，取其中一边计算即可。表示第b个待分析行程曲线的第k个异常数据段对应的参考段序列中每个参考段与其相邻的参考度的异常评价值的差异的平均值，表示第b个待分析行程曲线的第k个异常数据段对应的相似度，异常数据段对应的相似度较低，说明出现的异常是偶然性异常，对行程预测的参考度较低，不适合用于数字孪生模型的更新；异常数据段对应的相似度较高，说明出现的异常是长期异常，对行程预测的参考度较高，可用于模型更新。第b个待分析行程曲线的第k个异常数据段对应的参考段序列中每个参考段与其相邻的参考度的异常评价值的差异的平均值越小，第b个待分析行程曲线的第k个异常数据段对应的相似度越大，说明物流在运输到对应路段出现的异常越相似，第b个待分析行程曲线越适合用于对数字孪生模型的训练，第b个待分析行程曲线的参考度越大。

采用上述方法，能够获得每个待分析行程曲线的参考度，参考度越大的待分析行程曲线越适合用于对数字孪生模型的训练，因此本实施例将参考度大于预设参考阈值的待分析行程曲线作为目标曲线。本实施例中的预设参考阈值为0.75，在具体应用中，实施者可根据具体情况进行设置。

至此，基于每个待分析行程曲线的参考度对待分析行程曲线进行了筛选，获得了多个目标曲线。

步骤S4，基于所述目标曲线对数字孪生模型进行训练获得训练好的数字孪生模型，将当前运输对应的行程曲线输入训练好的数字孪生模型中，获得当前运输的行驶时长。

本实施例基于历史时间段内每次运输对应的行程曲线呈现的特征，从所有行程曲线中筛选了多个目标曲线，用于对数字孪生模型的训练，也即对数字孪生模型的训练集进行了优化，进而获得更准确的预测结果。

将步骤S3中筛选出的目标曲线作为数字孪生模型的训练集，对数字孪生模型进行训练，避免数字孪生模型在采集新的行程数据时，因模型数据滞后出现过多不必要的异常反馈，从而提升数据处理的效率，提升行程时间预测的预测效果，完成对数字孪生模型***数据的更新优化，数字孪生模型用于预测当前运输的行驶时长，数字孪生模型的输入为目标曲线，数字孪生模型的输出为行驶时长，获得训练好的数字孪生模型。数字孪生模型的训练过程为现有技术，此处不再过多赘述。将当前运输对应的行程曲线输入训练好的数字孪生模型中，数字孪生模型输出当前运输的行驶时长，也即对当前次物流运输时长进行了预测。

至此，采用本实施例提供的方法完成了对物流运输时长的预测。

本实施例首先基于行驶路程从历史时间段每次运输对应的行程曲线中筛选出了待分析行程曲线，对数字孪生模型的训练集进行了初步筛选，由于物流运输车辆在运输过程中出现异常可能是个别车辆抛锚或者是司机的驾驶造成的，而并非堵车情况造成的，因此这类数据若参与到对数字孪生模型的训练中，则会影响后续运输时长预测结果的准确度，本实施例又结合每个数据段的每个行驶路程对应的横坐标与标准行程曲线上同一行驶路程对应的横坐标之间的差异、每个数据段与对应的标准段的斜率差异和时长的差异，再次对行程曲线进行了筛选获得了多条目标曲线，将目标曲线作为数字孪生模型的训练集，对数字孪生模型进行训练，本实施例提供的方法当交通状况等因素改变造成的大量异常时，及时对数字孪生模型进行更新优化，避免因模型数据滞后而出现过多不必要的异常反馈，进而利用训练好的数字孪生模型对物流的运输时长进行预测，提高了物流运输时长预测结果的准确度。

基于数字孪生的物流运输大数据采集***实施例：

本实施例基于数字孪生的物流运输大数据采集***包括存储器和处理器，所述处理器执行所述存储器存储的计算机程序，以实现上述所述的基于数字孪生的物流运输大数据采集方法。

由于基于数字孪生的物流运输大数据采集方法已经在基于数字孪生的物流运输大数据采集方法实施例中进行了说明，所以本实施例不再对基于数字孪生的物流运输大数据采集方法进行赘述。

需要说明的是：以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于数字孪生的物流运输大数据采集方法，其特征在于，该方法包括以下步骤：

2.根据权利要求1所述的基于数字孪生的物流运输大数据采集方法，其特征在于，所述基于历史时间段每次运输过程中的行驶路程筛选待分析行程曲线，包括：

对于历史时间段第i次运输过程：

3.根据权利要求1所述的基于数字孪生的物流运输大数据采集方法，其特征在于，所述基于标准行程曲线上数据点的斜率获得标准行程曲线的标准段和待分析行程曲线的数据段，包括：

4.根据权利要求1所述的基于数字孪生的物流运输大数据采集方法，其特征在于，所述根据每个数据段对应的路程差、每个数据段的每个行驶路程对应的横坐标与标准行程曲线上同一行驶路程对应的横坐标之间的差异，获得每个数据段的差异指标，包括：

对于第b个待分析行程曲线的第p个数据段：

5.根据权利要求1所述的基于数字孪生的物流运输大数据采集方法，其特征在于，所述基于差异指标筛选每条待分析行程曲线的异常数据段，包括：

将差异指标大于预设差异阈值的数据段作为异常数据段。

6.根据权利要求3所述的基于数字孪生的物流运输大数据采集方法，其特征在于，所述根据每个数据段与对应的标准段的斜率差异、时长的差异和所述差异指标，得到每个数据段的异常评价值，包括：

对于第b个待分析行程曲线：

，

其中，表示第b个待分析行程曲线的第p个数据段的异常评价值，/>表示第b个待分析行程曲线的第p个数据段的差异指标，/>表示第b个待分析行程曲线的第p个数据段对应的时长，/>表示第b个待分析行程曲线的第p个数据段的路程在标准行程曲线上所对应的时长，/>表示第b个待分析行程曲线的第p个数据段上所有数据点的斜率的平均值，/>表示标准行程曲线的第p个标准段上所有数据点的斜率的平均值，/>表示第b个待分析行程曲线的第p个数据段中包含的特征段的端点的数量，/>表示符号函数，/>表示取绝对值符号。

7.根据权利要求1所述的基于数字孪生的物流运输大数据采集方法，其特征在于，所述根据每个待分析行程曲线的异常数据段在所有待分析行程曲线上对应的数据段的异常评价值的相似情况，得到每个待分析行程曲线的参考度，包括：

对于第b个待分析行程曲线：

8.根据权利要求7所述的基于数字孪生的物流运输大数据采集方法，其特征在于，采用如下公式计算第b个待分析行程曲线的参考度：

，

9.根据权利要求1所述的基于数字孪生的物流运输大数据采集方法，其特征在于，所述基于所述参考度筛选目标曲线，包括：

10.一种基于数字孪生的物流运输大数据采集***，包括存储器和处理器，其特征在于，所述处理器执行所述存储器存储的计算机程序，以实现如权利要求1-9任一项所述的基于数字孪生的物流运输大数据采集方法。