CN115269573A - 车辆数据的缺失补全方法、装置、车辆及存储介质 - Google Patents

车辆数据的缺失补全方法、装置、车辆及存储介质 Download PDF

Info

Publication number
CN115269573A
CN115269573A CN202210858665.0A CN202210858665A CN115269573A CN 115269573 A CN115269573 A CN 115269573A CN 202210858665 A CN202210858665 A CN 202210858665A CN 115269573 A CN115269573 A CN 115269573A
Authority
CN
China
Prior art keywords
data
sampling
actual
value
moment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210858665.0A
Other languages
English (en)
Inventor
邓鹏�
罗咏刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Changan Automobile Co Ltd
Original Assignee
Chongqing Changan Automobile Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Changan Automobile Co Ltd filed Critical Chongqing Changan Automobile Co Ltd
Priority to CN202210858665.0A priority Critical patent/CN115269573A/zh
Publication of CN115269573A publication Critical patent/CN115269573A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Traffic Control Systems (AREA)

Abstract

本申请涉及车辆技术领域,特别涉及车辆数据的缺失补全方法、装置、车辆及存储介质,其中,方法包括:识别车辆数据中任意数据值的实际采样时刻和所处的实际采样周期;判断在实际采样周期内的预设采样时刻是否采样数据,其中,预设采样时刻与实际采样时刻之间的时间差值小于预设值;如果在预设采样时刻没有采样数据,则将任意数据值输入与实际采样周期匹配的预测模型,输出预设采样时刻的预测数据,并将预测数据填充至采样时刻的数据位置处。由此,解决了相关技术中,缺失值的补全对未缺失数据依赖性强、要求较高,数据补全范围局限,应用场景局限,填充数据的可靠性差,补全结果精度较低,无法满足实际使用的需要等问题。

Description

车辆数据的缺失补全方法、装置、车辆及存储介质
技术领域
本申请涉及车辆技术领域,特别涉及一种车辆数据的缺失补全方法、装置、车辆及存储介质。
背景技术
对于机器学习所需要的数据,并不是所有的数据都能做到数据完整、规格统一,因此,缺失值补全是机器学习中非常重要的一个环节。
相关技术中,缺失值的补全可以使用直接删除整个缺失数据的样本、使用固定值填充缺失值、热卡填充、回归插值和多重插补等方法。然而,上述方法在某些场景中并不符合实际情况,其填充的数据有限,只能对缺失数据中间的值进行填充,无法对数据的边缘进行扩展填充,且在数据极为稀疏的场景下,无法完成整个缺失值填充方案,使得数据缺失的问题还有待解决。
发明内容
本申请提供一种车辆数据的缺失补全方法、装置、车辆及存储介质,以解决相关技术中,缺失值的补全对未缺失数据依赖性强、要求较高,数据补全范围局限,应用场景局限,填充数据的可靠性差,补全结果精度较低,无法满足实际使用的需要等问题。
本申请第一方面实施例提供一种车辆数据的缺失补全方法,包括以下步骤:识别所述车辆数据中任意数据值的实际采样时刻和所处的实际采样周期;判断在所述实际采样周期内的预设采样时刻是否采样数据,其中,所述预设采样时刻与所述实际采样时刻之间的时间差值小于预设值;如果在所述预设采样时刻没有采样数据,则将所述任意数据值输入与所述实际采样周期匹配的预测模型,输出所述预设采样时刻的预测数据,并将所述预测数据填充至所述采样时刻的数据位置处。
根据上述技术手段,本申请实施例可以判断数据是否缺失,并通过遍历真实采集的数据值,利用预测数据模型对周围的数据进行辐射填充,以对缺失的数据进行填充;由此,本申请实施例可以最大程度补全数据缺失值,并可对边缘数据以外的数据进行填充,消除数据缺失对于车辆的影响,提升安全性,满足实际使用的需要,提升用户使用体验。
可选地,所述预测模型基于携带有采样周期标签的训练数据预先构建得到,包括:获取携带有采样周期标签的训练数据;根据所述训练数据进行曲线拟合,得到所述训练数据的数据变化曲线;根据所述数据变化曲线和所述训练数据的采样周期,生成不同采样周期的所述预测模型。
根据上述技术手段,本申请实施例可以通过使用真实采样数据进行的训练拟合,得到和任意汽车数据相匹配的预测模型,保证了数据的有效性和可靠性,提升了结果的精确度,满足实际使用的需要。
可选地,识别所述车辆数据中任意数据值所处的实际采样周期,包括:获取所述实际采样时刻附近的至少一个数据值;根据所述任意数据值与所述至少一个数据值的数据变化趋势匹配所述任意数据值所处的实际采样周期。
根据上述技术手段,本申请实施例可以采样附近的至少一个数据值,并结合该任意数据和附近采样数据结,根据数据的变化趋势匹配上述数据所在的实际采样周期。
可选地,所述识别所述车辆数据中任意数据值的实际采样时刻和所处的实际采样周期之前,还包括:判断所述车辆数据的实际采样类型,其中,所述实际采样类型为周期性采样类型和变化采样类型;如果所述实际采样类型为所述周期性采样类型,则识别所述实际采样时刻和所述实际采样周期;如果所述实际采样类型为所述变化采样类型,则在识别到所述车辆数据中任意时刻未采样数据时,将所述任意时刻的前一个时刻的数据值填充至所述任意时刻的数据位置处。
根据上述技术手段,本申请实施例可以根据不同类型的采样数据对每个有效数据分周期进行填补,并根据某个有效数据的相邻数据或同一时间其他的特征数据对该数据进行不同周期划分,在具有周期变化的数据场景中拥有很强的拟合性,并为周期变化数据的填补提供了指导意义;且本申请实施例不用等到匹配预测模型前再进行判断,提升智能化,有效避免对数据的处理过程冗余,节约运算成本,提升效率。
本申请第二方面实施例提供一种车辆数据的缺失补全装置,包括:识别模块,用于识别所述车辆数据中任意数据值的实际采样时刻和所处的实际采样周期;第一判断模块,用于判断在所述实际采样周期内的预设采样时刻是否采样数据,其中,所述预设采样时刻与所述实际采样时刻之间的时间差值小于预设值;执行模块,用于如果在所述预设采样时刻没有采样数据,则将所述任意数据值输入与所述实际采样周期匹配的预测模型,输出所述预设采样时刻的预测数据,并将所述预测数据填充至所述采样时刻的数据位置处。
可选地,所述预测模型基于携带有采样周期标签的训练数据预先构建得到,所述执行模块用于:获取携带有采样周期标签的训练数据;根据所述训练数据进行曲线拟合,得到所述训练数据的数据变化曲线;根据所述数据变化曲线和所述训练数据的采样周期,生成不同采样周期的所述预测模型。
可选地,所述识别模块用于:获取所述实际采样时刻附近的至少一个数据值;根据所述任意数据值与所述至少一个数据值的数据变化趋势匹配所述任意数据值所处的实际采样周期。
可选地,所述车辆数据的缺失补全装置还包括第二判断模块,用于:判断所述车辆数据的实际采样类型,其中,所述实际采样类型为周期性采样类型和变化采样类型;如果所述实际采样类型为所述周期性采样类型,则识别所述实际采样时刻和所述实际采样周期;如果所述实际采样类型为所述变化采样类型,则在识别到所述车辆数据中任意时刻未采样数据时,将所述任意时刻的前一个时刻的数据值填充至所述任意时刻的数据位置处。
本申请第三方面实施例提供一种车辆,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如上述实施例所述的车辆数据的缺失补全方法。
本申请第四方面实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,以用于实现如上述实施例所述的车辆数据的缺失补全方法。
由此,本申请至少具有如下有益效果:
(1)本申请实施例可以判断数据是否缺失,并通过遍历真实采集的数据值,利用预测数据模型对周围的数据进行辐射填充,以对缺失的数据进行填充;由此,本申请实施例可以最大程度补全数据缺失值,并可对边缘数据以外的数据进行填充,消除数据缺失对于车辆的影响,提升安全性,满足实际使用的需要,提升用户使用体验;
(2)本申请实施例可以通过使用真实采样数据进行的训练拟合,得到和任意汽车数据相匹配的预测模型,保证了数据的有效性和可靠性,提升了结果的精确度,满足实际使用的需要;
(3)本申请实施例可以采样附近的至少一个数据值,并结合该任意数据和附近采样数据结,根据数据的变化趋势匹配上述数据所在的实际采样周期;
(4)本申请实施例可以根据不同类型的采样数据对每个有效数据分周期进行填补,并根据某个有效数据的相邻数据或同一时间其他的特征数据对该数据进行不同周期划分,在具有周期变化的数据场景中拥有很强的拟合性,并为周期变化数据的填补提供了指导意义;且本申请实施例不用等到匹配预测模型前再进行判断,提升智能化,有效避免对数据的处理过程冗余,节约运算成本,提升效率。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本申请实施例提供的数据样本缺失数据分布示意图;
图2为根据本申请实施例提供的一种车辆数据的缺失补全方法的流程图;
图3为根据本申请实施例提供的未开空调车内温度升温随时间变化曲线图;
图4为根据本申请实施例提供的开空调车内温度降温随时间变化曲线图;
图5为根据本申请实施例提供的室外温度随时间变化曲线图;
图6为根据本申请实施例提供的本专利数据缺失值填值流程;
图7为根据本申请实施例提供的车辆数据的缺失补全装置的示例图;
图8为根据本申请实施例提供的车辆的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
对于汽车传感器采集的数据,相关技术中主要有两种采集方式,即变化采样和周期采样。其中,变化采样即当数值或状态发生变化时,记录其变化信息及变化时间;周期采样即按照固定的频率触发采集请求,记录当前数值或状态以及时间信息。变化采样和周期采样适用场景不尽相同,对于一些状态信号,例如正常或异常、开启或关闭等,可以采用变化采样;对于具有连续变化的数值,因为是连续数值,即使使用了变化采样,最终也会变成周期采样,因此可以采用周期采样;变化采样和周期采样的使用可以根据实际情况进行具体选择,对此不做过多限定。
由于汽车上的***非常复杂,涉及到的器件很多,因此,在进行一些分析的时候,可能需要使用汽车的不同传感器乃至不同记录设备的数据;当所有数据汇总到一起时,由于采样方式和采样周期的不同,同一时间点获取的样本数据不一定全部完整,其中,数据样本缺失数据分布可以如图1所示;因此,对缺失值进行填值就成为了必不可少的环节。
对于机器学习所需要的数据,并不是所有的数据都能做到数据完整、规格统一,而数据丢失在数据样本较小的场景中,对整个机器学习或深度学习的结果影响巨大;针对部分样本数据中含有缺失值的情况,如果采用粗暴的方式对缺失值进行删除处理,那么可能还会丢失缺失信息样本中未缺失数据的相关信息。因此,缺失值补全是机器学习中非常重要的一个环节。
相关技术中,缺失值补全方法大概有以下几种方法:(1)直接删除整个缺失数据的样本,可以用于数据样本集较大且缺失样本比例控制在一定的阈值内的情况;(2)使用固定值填充缺失值,常用的固定值可以有:0、均值、中位数、众数等;(3)热卡填充,使用与缺失样本相似的样本或者邻近的样本数据对缺失样本进行填值;(4)回归插值,对缺失数据的特征建立回归方程,使用回归方程对缺失值进行预测填值;(5)多重插补,可以理解为更加复杂且考虑因素更多的回归插值方法。
上述相关技术的缺失值填充方法,主要是基于缺失数据集中的已经存在的数据,使用预估或统计学的手段对缺失值进行填充;但是,对于矩阵相当稀疏的数据,相关技术中使用的FM(Matrix Factorization,矩阵分解)技术和降维技术,例如PCA(principalcomponents analysis,主成分分析技术)和LDA(Linear Discriminant Analysis,线性判别式分析技术)等,并不能解决本申请场景所遇到的问题。并且,在以上列出的缺失值填充方案中,使用任一填充方案,都无法代表实际环境中变化的规律,例如,以某个数值如车内温度变化举例,如图1所示,在某些时间周期区间只有几个值,这几个值显然无法正确模拟出一条正确的曲线去对缺失数据进行预测,此时参数的缺失值填充无法进行插值或使用固定值。
下面参考将附图描述本申请实施例的车辆数据的缺失补全方法、装置、车辆及存储介质。
具体而言,图2为本申请实施例所提供的一种车辆数据的缺失补全方法的流程示意图。
如图2所示,该车辆数据的缺失补全方法包括以下步骤:
在步骤S101中,识别车辆数据中任意数据值的实际采样时刻和所处的实际采样周期。
其中,车辆数据可以是本车各种类型的任意数据值,比如可以是温度数据等,实际采样周期可以对应采样数据的数据类型,根据实际情况得到,对此不做具体限定。
需要说明的是,为便于叙述,以下实施例中,本申请实施例将以温度数据为例进行阐述。其中,当车辆数据为温度数据时,本申请的实际采样周期可以包括四类:不开空***况下,汽车发动机启动,汽车内温度的变化曲线(升温或降温);不开空***况下,汽车发动机未启动,汽车内温度的变化曲线(升温或降温);开空***况下,汽车发动机启动,汽车内温度的变化曲线(升温或降温);开空***况下,汽车发动机未启动,汽车内温度的变化曲线(升温或降温)。
可以理解的是,本申请实施例可以选择任意车辆数据的数据值进行识别,得到该数据的实际采样时刻,且得到该数据采样时所处的实际采样周期,以用于后续步骤对可能存在的预测数据的生成。
在本申请实施例中,识别车辆数据中任意数据值所处的实际采样周期,包括:获取实际采样时刻附近的至少一个数据值;根据任意数据值与至少一个数据值的数据变化趋势匹配任意数据值所处的实际采样周期。
可以理解的是,本申请实施例可以通过识别到的任意车辆数据的实际采样时刻,获取该时刻附近至少一个其他数据值,并利用上述数据体现的变化趋势,匹配数据值的实际采样周期。
举例而言,以车内温度为例,找到一个含有温度数据的值与该值所处的时间位置,检测该值附近的值中与当前温度值的相关状态,例如可以检查驾驶员设置温度与当前温度值的相关状态、空调开启与否的状态、空调压缩机状态和室外环境温度值等,再根据温度值与至少一个相关状态值所体现的数据变化趋势,对该温度值所处的模型周期(开空调降温、开空调升温、不开空调降维、不开空调升温等)进行判断。
在本申请实施例中,识别车辆数据中任意数据值的实际采样时刻和所处的实际采样周期之前,还包括:判断车辆数据的实际采样类型,其中,实际采样类型为周期性采样类型和变化采样类型;如果实际采样类型为周期性采样类型,则识别实际采样时刻和实际采样周期;如果实际采样类型为变化采样类型,则在识别到车辆数据中任意时刻未采样数据时,将任意时刻的前一个时刻的数据值填充至任意时刻的数据位置处。
可以理解的是,本申请实施例还可以在识别车辆任意数据的实际采样时刻和所处的实际采样周期之前,首先判断车辆数据的实际采样类型,根据数据的采样类型选择对数据进行的进一步操作,而不用等到匹配预测模型前再进行判断,使方案更智能化,有效避免对数据的处理过程冗余,节约运算成本,提升效率。
具体而言,本申请实施例可以获取并识别任意车辆数据的实际采样类型,当该数据是变化采样时,由于变化采样是每次变化才记录数据,本申请无需使用温度场变化模型对数据进行预测,中间的空缺数据可以使用上一次的数据进行填充;当该数据是周期采样时,则执行上述步骤S101,并执行后续步骤S102和步骤S103。
在步骤S102中,判断在实际采样周期内的预设采样时刻是否采样数据,其中,预设采样时刻与实际采样时刻之间的时间差值小于预设值。
其中,预设采样时刻可以根据上述步骤S101中获取的任意数据的实际采样时刻进行设置,比如预设采样时刻可以是任意数据所在采样周期内,距离任意数据时间最近的目标采样时刻等;预设值可以根据实际情况具体设置,对此不做具体限定。
可以理解的是,本申请实施例可以设置预设采样时刻和预设值,并判断预设采样时刻是否对数据进行了采样,如果预设采样时刻采样数据了,则可以理解为该时刻没有数据空缺;如果预设时刻没有采样数据,则可以理解为该时刻数据空缺。
需要说明的是,当任意数据的实际采样时刻与预设采样时间的时间差小于预设值时,可以理解为任意数据近似预设采样时间的数据,同样能够体现预设采样时刻数据代表的变化趋势,由此可以应用到后续步骤;当任意数据的实际采样时刻与预设采样时间的时间差大于预设值时,则本申请实施例可以返回步骤S101,继续识别其他任意车辆数据,直到得到满足要求的数据。
在步骤S103中,如果在预设采样时刻没有采样数据,则将任意数据值输入与实际采样周期匹配的预测模型,输出预设采样时刻的预测数据,并将预测数据填充至采样时刻的数据位置处。
可以理解的是,如果在预设采样时刻没有采样数据,则可以理解为该时刻数据空缺,因此本申请实施例可以在对当前数据的周期状态进行判断后,对该数据值附近时间的缺失数据进行预测及填充,将满足上述步骤S102的任意数据输入相应的预测模型,以得到预测采样时刻的预测数据,并使用该预测数据填充上述时刻的数据空缺。
在本申请实施例中,预测模型基于携带有采样周期标签的训练数据预先构建得到,包括:获取携带有采样周期标签的训练数据;根据训练数据进行曲线拟合,得到训练数据的数据变化曲线;根据数据变化曲线和训练数据的采样周期,生成不同采样周期的预测模型。
可以理解的是,本申请实施例可以通过带有采样周期标签的训练数据的拟合,生成数据变化曲线,再基于该变化曲线和上述训练数据的采样周期生成采样周期的预测模型。
举例而言,以温度数据为例,本申请实施例的周期可以如上述四大类变化周期所示,在四种周期状态下,分别对汽车内温度变化数据进行数据采样,并对采样后的数据使用深度学习模型进行拟合,得到8个关于汽车内温度场随时间变化的拟合模型(四个场景分别有升温或降温),其中,得到的未开空调车内温度升温随时间变化曲线可以如图3所示,开空调车内温度降温随时间变化曲线可以如图4所示;同理,本申请实施例可以对环境温度变化进行温度的采集,拟合环境温度随时间升温或降温的数据,并使用深度学习拟合两个模型;其中,室外温度随时间变化曲线可以如图5所示。
下面将通过一个具体实施例对本申请的数据缺失值填值流程进行阐述,该实施例中车辆数据为温度数据,如图6所示,具体如下:
(1)流程开始,确定数据的采样类型,即属于变化采样类型还是周期采样类型;
(2)判断数据是否为周期采样数据,如果是周期采样数据,则继续步骤(3);如果不是周期采样数据,则判断该数据为变化采样数据,使用上一个有效采集的数据为后面的数据填值;
(3)当数据为周期采样数据,根据当前数据的邻近数据或当前数据的其他信号值,判断当前数据属于哪一个周期;
(4)在确定周期之后,找到该周期内的预估模型,为该数据辐射范围内的空缺时间点的数据及逆行填值;
(5)将数据输入到驾驶员空调温度设置推荐***,为***提供更加全面准确的数据集;流程结束。
综上,本申请实施例可以在同一个周期内预测该周期内缺失的温度值,并根据汽车数据采样的模式,使用不同的填值方法对缺失的数据进行填充,由此,本申请实施例可以通过遍历所有真实采集的数据值,并对周围的数据进行辐射填充,达到对数据缺失值最大化,得到最准确的填充效果;并可对边缘数据以外的数据进行填充,输入到后续的深度学习模型中,提升深度学习模型的学习效果;满足实际场景中数据缺失的变化规律,提高得到的数据结果的精准性,提升用户使用体验。
根据本申请实施例提出的车辆数据的缺失补全方法,其有益效果具体如下:
(1)本申请实施例可以判断数据是否缺失,并通过遍历真实采集的数据值,利用预测数据模型对周围的数据进行辐射填充,以对缺失的数据进行填充;由此,本申请实施例可以最大程度补全数据缺失值,并可对边缘数据以外的数据进行填充,消除数据缺失对于车辆的影响,提升安全性,满足实际使用的需要,提升用户使用体验;
(2)本申请实施例可以通过使用真实采样数据进行的训练拟合,得到和任意汽车数据相匹配的预测模型,保证了数据的有效性和可靠性,提升了结果的精确度,满足实际使用的需要;
(3)本申请实施例可以采样附近的至少一个数据值,并结合该任意数据和附近采样数据结,根据数据的变化趋势匹配上述数据所在的实际采样周期;
(4)本申请实施例可以根据不同类型的采样数据对每个有效数据分周期进行填补,并根据某个有效数据的相邻数据或同一时间其他的特征数据对该数据进行不同周期划分,在具有周期变化的数据场景中拥有很强的拟合性,并为周期变化数据的填补提供了指导意义;且本申请实施例不用等到匹配预测模型前再进行判断,提升智能化,有效避免对数据的处理过程冗余,节约运算成本,提升效率。
其次参照附图描述根据本申请实施例提出的车辆数据的缺失补全装置。
图7是本申请实施例的车辆数据的缺失补全装置的方框示意图。
如图7所示,该车辆数据的缺失补全装置10包括:识别模块100、第一判断模块200和执行模块300。
其中,识别模块100用于识别车辆数据中任意数据值的实际采样时刻和所处的实际采样周期;第一判断模块200用于判断在实际采样周期内的预设采样时刻是否采样数据,其中,预设采样时刻与实际采样时刻之间的时间差值小于预设值;执行模块300用于如果在预设采样时刻没有采样数据,则将任意数据值输入与实际采样周期匹配的预测模型,输出预设采样时刻的预测数据,并将预测数据填充至采样时刻的数据位置处。
在本申请实施例中,预测模型基于携带有采样周期标签的训练数据预先构建得到,执行模块300用于:获取携带有采样周期标签的训练数据;根据训练数据进行曲线拟合,得到训练数据的数据变化曲线;根据数据变化曲线和训练数据的采样周期,生成不同采样周期的预测模型。
在本申请实施例中,识别模块100用于:获取实际采样时刻附近的至少一个数据值;根据任意数据值与至少一个数据值的数据变化趋势匹配任意数据值所处的实际采样周期。
在本申请实施例中,车辆数据的缺失补全装置10还包括第二判断模块,用于:判断车辆数据的实际采样类型,其中,实际采样类型为周期性采样类型和变化采样类型;如果实际采样类型为周期性采样类型,则识别实际采样时刻和实际采样周期;如果实际采样类型为变化采样类型,则在识别到车辆数据中任意时刻未采样数据时,将任意时刻的前一个时刻的数据值填充至任意时刻的数据位置处。
需要说明的是,前述对车辆数据的缺失补全方法实施例的解释说明也适用于该实施例的车辆数据的缺失补全装置,此处不再赘述。
根据本申请实施例提出的车辆数据的缺失补全装置,可以在同一个周期内根据汽车数据采样的模式,使用不同的填值方法对缺失的数据进行填充。由此,本申请实施例可以通过遍历所有真实采集的数据值,并对周围的数据进行辐射填充,达到对数据缺失值最大化,得到最准确的填充效果;并可对边缘数据以外的数据进行填充,输入到后续的深度学习模型中,提升深度学习模型的学习效果;满足实际场景中数据缺失的变化规律,提高得到的数据结果的精准性,提升用户使用体验。
图8为本申请实施例提供的车辆的结构示意图。该车辆可以包括:
存储器801、处理器802及存储在存储器801上并可在处理器802上运行的计算机程序。
处理器802执行程序时实现上述实施例中提供的车辆数据的缺失补全方法。
可选地,车辆还包括:
通信接口803,用于存储器801和处理器802之间的通信。
存储器801,用于存放可在处理器802上运行的计算机程序。
存储器801可能包含高速RAM(Random Access Memory,随机存取存储器)存储器,也可能还包括非易失性存储器,例如至少一个磁盘存储器。
如果存储器801、处理器802和通信接口803独立实现,则通信接口803、存储器801和处理器802可以通过总线相互连接并完成相互间的通信。总线可以是ISA(IndustryStandard Architecture,工业标准体系结构)总线、PCI(Peripheral Component,外部设备互连)总线或EISA(Extended Industry Standard Architecture,扩展工业标准体系结构)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图8中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果存储器801、处理器802及通信接口803,集成在一块芯片上实现,则存储器801、处理器802及通信接口803可以通过内部接口完成相互间的通信。
处理器802可能是一个CPU(Central Processing Unit,中央处理器),或者是ASIC(Application Specific Integrated Circuit,特定集成电路),或者是被配置成实施本申请实施例的一个或多个集成电路。
本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上的车辆数据的缺失补全方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不是必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或N个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“N个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更N个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,N个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列,现场可编程门阵列等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种车辆数据的缺失补全方法,其特征在于,包括以下步骤:
识别所述车辆数据中任意数据值的实际采样时刻和所处的实际采样周期;
判断在所述实际采样周期内的预设采样时刻是否采样数据,其中,所述预设采样时刻与所述实际采样时刻之间的时间差值小于预设值;
如果在所述预设采样时刻没有采样数据,则将所述任意数据值输入与所述实际采样周期匹配的预测模型,输出所述预设采样时刻的预测数据,并将所述预测数据填充至所述采样时刻的数据位置处。
2.根据权利要求1所述的方法,其特征在于,所述预测模型基于携带有采样周期标签的训练数据预先构建得到,包括:
获取携带有采样周期标签的训练数据;
根据所述训练数据进行曲线拟合,得到所述训练数据的数据变化曲线;
根据所述数据变化曲线和所述训练数据的采样周期,生成不同采样周期的所述预测模型。
3.根据权利要求1所述的方法,其特征在于,识别所述车辆数据中任意数据值所处的实际采样周期,包括:
获取所述实际采样时刻附近的至少一个数据值;
根据所述任意数据值与所述至少一个数据值的数据变化趋势匹配所述任意数据值所处的实际采样周期。
4.根据权利要求1-3任意一项所述的方法,其特征在于,所述识别所述车辆数据中任意数据值的实际采样时刻和所处的实际采样周期之前,还包括:
判断所述车辆数据的实际采样类型,其中,所述实际采样类型为周期性采样类型和变化采样类型;
如果所述实际采样类型为所述周期性采样类型,则识别所述实际采样时刻和所述实际采样周期;
如果所述实际采样类型为所述变化采样类型,则在识别到所述车辆数据中任意时刻未采样数据时,将所述任意时刻的前一个时刻的数据值填充至所述任意时刻的数据位置处。
5.一种车辆数据的缺失补全装置,其特征在于,包括:
识别模块,用于识别所述车辆数据中任意数据值的实际采样时刻和所处的实际采样周期;
第一判断模块,用于判断在所述实际采样周期内的预设采样时刻是否采样数据,其中,所述预设采样时刻与所述实际采样时刻之间的时间差值小于预设值;
执行模块,用于如果在所述预设采样时刻没有采样数据,则将所述任意数据值输入与所述实际采样周期匹配的预测模型,输出所述预设采样时刻的预测数据,并将所述预测数据填充至所述采样时刻的数据位置处。
6.根据权利要求5所述的装置,其特征在于,所述预测模型基于携带有采样周期标签的训练数据预先构建得到,所述执行模块用于:
获取携带有采样周期标签的训练数据;
根据所述训练数据进行曲线拟合,得到所述训练数据的数据变化曲线;
根据所述数据变化曲线和所述训练数据的采样周期,生成不同采样周期的所述预测模型。
7.根据权利要求5所述的装置,其特征在于,所述识别模块用于:
获取所述实际采样时刻附近的至少一个数据值;
根据所述任意数据值与所述至少一个数据值的数据变化趋势匹配所述任意数据值所处的实际采样周期。
8.根据权利要求5-7任意一项所述的装置,其特征在于,所述车辆数据的缺失补全装置还包括第二判断模块,用于:
判断所述车辆数据的实际采样类型,其中,所述实际采样类型为周期性采样类型和变化采样类型;
如果所述实际采样类型为所述周期性采样类型,则识别所述实际采样时刻和所述实际采样周期;
如果所述实际采样类型为所述变化采样类型,则在识别到所述车辆数据中任意时刻未采样数据时,将所述任意时刻的前一个时刻的数据值填充至所述任意时刻的数据位置处。
9.一种车辆,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如权利要求1-4任一项所述的车辆数据的缺失补全方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行,以用于实现如权利要求1-4任一项所述的车辆数据的缺失补全方法。
CN202210858665.0A 2022-07-20 2022-07-20 车辆数据的缺失补全方法、装置、车辆及存储介质 Pending CN115269573A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210858665.0A CN115269573A (zh) 2022-07-20 2022-07-20 车辆数据的缺失补全方法、装置、车辆及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210858665.0A CN115269573A (zh) 2022-07-20 2022-07-20 车辆数据的缺失补全方法、装置、车辆及存储介质

Publications (1)

Publication Number Publication Date
CN115269573A true CN115269573A (zh) 2022-11-01

Family

ID=83767303

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210858665.0A Pending CN115269573A (zh) 2022-07-20 2022-07-20 车辆数据的缺失补全方法、装置、车辆及存储介质

Country Status (1)

Country Link
CN (1) CN115269573A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117874435A (zh) * 2024-03-11 2024-04-12 中国电子科技集团公司第十五研究所 分布式边缘数据采集方法、装置、电子设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117874435A (zh) * 2024-03-11 2024-04-12 中国电子科技集团公司第十五研究所 分布式边缘数据采集方法、装置、电子设备及存储介质
CN117874435B (zh) * 2024-03-11 2024-06-25 中国电子科技集团公司第十五研究所 分布式边缘数据采集方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN111401609B (zh) 车流量时间序列的预测方法及预测装置
US6829515B2 (en) Method and device for determining changes in technical systems such as electric motors caused by ageing
US10324004B2 (en) Methods and devices for adaptive autonomous polynomial interpolation of time series data
EP1835426A1 (en) Estimating software power consumption
US20080059020A1 (en) Data Recorder For Vehicle
US11199419B2 (en) Method for reducing exhaust gas emissions of a drive system of a vehicle including an internal combustion engine
CN115269573A (zh) 车辆数据的缺失补全方法、装置、车辆及存储介质
CN112560974B (zh) 一种信息融合、车辆信息获取方法及装置
CN112271359A (zh) 基于电池的加热***控制方法、装置以及电子设备
CN112149908A (zh) 车辆驾驶预测方法、***、计算机设备及可读存储介质
US20210390802A1 (en) Method, Computer Program And Device For Processing Signals
CN116821638B (zh) Ai芯片应用优化设计的数据分析方法及***
EP2778640B1 (en) Outside air temperature measurement device and method
CN114312213B (zh) 车辆的制冷剂容量异常预测方法、装置、设备及介质
CN115655753A (zh) 电动汽车续航里程测试方法、***、装置及存储介质
CN113378304B (zh) 一种车辆性能目标的确定方法、装置、存储介质及设备
US20220215138A1 (en) Method for Validating System Parameters of an Energy System, Method for Operating an Energy System, and Energy Management System for an Energy System
CN114327557A (zh) 一种车辆ota升级时间评估方法及装置
CN111340349A (zh) 产品可靠性评估方法、装置、计算机设备和存储介质
CN116993396B (zh) 基于车辆用户标签的风险预警方法、计算机设备
US20240142916A1 (en) Method and control unit for automatically selecting data sets for a method for machine learning
CN112906953B (zh) 人流量预测方法、装置、计算机设备和可读存储介质
CN116383016B (zh) 一种磁盘状态监控及故障预测方法、装置及设备
CN115100757A (zh) 汽车数据的存储方法、装置、车辆及存储介质
CN117301795A (zh) 控制车辆空调的方法、装置、电子设备和车辆

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination