CN117252713A

CN117252713A - 一种新能源车的风险识别方法、装置、设备及存储介质

Info

Publication number: CN117252713A
Application number: CN202311160199.XA
Authority: CN
Inventors: 喻芳
Original assignee: Ping An Property and Casualty Insurance Company of China Ltd
Current assignee: Ping An Property and Casualty Insurance Company of China Ltd
Priority date: 2023-09-08
Filing date: 2023-09-08
Publication date: 2023-12-19

Abstract

本申请公开一种新能源车的风险识别方法、装置、设备及存储介质，属于人工智能技术领域和金融科技领域。本申请通过获取车辆数据，车辆数据包括车辆信息、用车数据和充电数据，基于用车数据生成用车时序数据，以及基于充电数据生成充电时序数据，基于车辆信息、用车时序数据和充电时序数据构建第一输入数据，将第一输入数据输入到决策树模型，得到初始风险识别结果，将初始风险识别结果添加到第一输入数据中，生成第二输入数据，将第二输入数据输入到车辆风险识别模型，输出风险识别结果。本申请还涉及区块链技术领域，用车数据可存储于区块链节点上。本申请结合了决策树模型和神经网络模型对新能源车的风险进行综合识别，提高风险识别的准确性。

Description

一种新能源车的风险识别方法、装置、设备及存储介质

技术领域

本申请属于人工智能技术领域和金融科技领域，具体涉及一种新能源车的风险识别方法、装置、设备及存储介质。

背景技术

新能源汽车是指使用新型能源替代传统燃油的汽车，包括电动汽车、混合动力汽车、燃料电池汽车等，新能源汽车的发展具有趋势性和前景性，未来将继续受到政策、技术、市场和应用等多重因素的推动，成为汽车产业转型升级和可持续发展的重要方向，随着全球对环境保护和能源安全的重视，新能源汽车正成为未来汽车发展的趋势。

新能源汽车销量在过去几年内快速增长，对于经营车险的保险公司来说，需要应对新业务形态带来的机会和挑战。由于新能源汽车产品及用车模式的变化，新能源汽车的风险识别成为保险公司关注的重点。目前，为了实现简单的风险识别，一种常用的方法是使用决策树模型进行预测，然而，由于新能源汽车行业的快速发展和复杂性，通过简单的决策树模型实现的风险预测准确度不高，无法用于保险公司的决策支持。

发明内容

本申请实施例的目的在于提出一种新能源车的风险识别方法、装置、计算机设备及存储介质，以解决现有新能源汽车的风险识别方法存在的预测准确度不高的技术问题。

为了解决上述技术问题，本申请实施例提供一种新能源车的风险识别方法，采用了如下所述的技术方案：

一种新能源车的风险识别方法，包括：

获取待识别风险车辆的车辆数据，其中，车辆数据包括车辆信息、用车数据和充电数据；

基于用车数据生成用车时序数据，以及基于充电数据生成充电时序数据；

基于车辆信息、用车时序数据和充电时序数据构建第一输入数据；

将第一输入数据输入到预设的决策树模型，得到初始风险识别结果；

将初始风险识别结果添加到第一输入数据中，生成第二输入数据；

将第二输入数据输入到预设的车辆风险识别模型，输出待识别风险车辆的风险识别结果。

进一步地，基于用车数据生成用车时序数据，以及基于充电数据生成充电时序数据，具体包括：

获取与用车数据匹配的第一时间戳序列；

根据第一时间戳序列为用车数据进行时间戳标记；

使用预设的第一滑动窗口在完成时间戳标记后的用车数据上进行数据截取，得到用车时序数据；

获取与充电数据匹配的第二时间戳序列；

根据第二时间戳序列为充电数据进行时间戳标记；

使用预设的第二滑动窗口在完成时间戳标记后的充电数据上进行数据截取，得到充电时序数据。

进一步地，将第一输入数据输入到预设的决策树模型，得到初始风险识别结果，具体包括：

对第一输入数据进行特征提取，得到第一输入特征；

识别决策树模型的树节点和叶子节点，并获取决策树模型的节点***规则；

根据节点***规则将第一输入特征划分到树节点和叶子节点中；

获取决策树模型中决策树最底层的叶子节点的标签值，得到初始风险识别结果。

进一步地，在将第一输入数据输入到预设的决策树模型，得到初始风险识别结果之前，还包括：

获取历史车辆数据，其中，车辆数据包括历史车辆信息、历史用车数据和历史充电数据；

基于历史用车数据生成历史用车时序数据，以及基于历史充电数据生成历史充电时序数据；

基于历史车辆信息、历史用车时序数据和历史充电时序数据构建第一训练数据集；

将第一训练数据集构建初始决策树模型，并获取初始决策树模型输出的第一风险识别结果；

将第一风险识别结果添加到第一训练数据集中，生成第二训练数据集；

将第二训练数据集输入到预设的神经网络模型，输出第二风险识别结果；

组合初始决策树模型和神经网络模型构建风险联合预测模型；

基于第一风险识别结果和第二风险识别结果对风险联合预测模型进行参数调优，直至模型拟合，得到训练完成的决策树模型和车辆风险识别模型。

进一步地，第一训练数据集包括第一训练样本集和第一测试样本集，将第一训练数据集构建初始决策树模型，并获取初始决策树模型输出的第一风险识别结果，具体包括：

对第一训练样本集进行特征提取，得到第一样本特征；

基于第一样本特征和预设的决策树算法构建初始决策树模型；

基于第一测试样本集对初始决策树模型进行模型测试，得到第一风险识别结果。

进一步地，第二训练数据集包括第二训练样本集和第二测试样本集，将第二训练数据集输入到预设的神经网络模型，输出第二风险识别结果，具体包括：

对第二训练样本集进行特征提取，得到第二样本特征；

通过神经网络模型对第二样本特征进行特征学习，得到特征学习结果；

基于特征学习结果对神经网络模型进行迭代更新，得到训练完成的神经网络模型；

基于第二测试样本集对训练完成的神经网络模型进行模型测试，得到第二风险识别结果。

进一步地，基于第一风险识别结果和第二风险识别结果对风险联合预测模型进行参数调优，直至模型拟合，得到训练完成的决策树模型和车辆风险识别模型，具体包括：

对第一风险识别结果和第二风险识别结果进行加权求和处理，得到风险联合预测结果；

构建风险联合预测模型的损失函数；

基于风险联合预测模型的损失函数计算风险联合预测结果与预设标准结果的之间的误差，得到预测误差；

在风险联合预测模型中传递预测误差，并将预测误差与预设误差阈值进行比对；

当预测误差大于预设误差阈值时，对风险联合预测模型进行参数调优，直至预测误差小于或等于预设误差阈值为止，得到训练完成的决策树模型和车辆风险识别模型。

为了解决上述技术问题，本申请实施例还提供一种新能源车的风险识别装置，采用了如下所述的技术方案：

一种新能源车的风险识别装置，包括：

车辆数据获取模块，用于获取待识别风险车辆的车辆数据，其中，车辆数据包括车辆信息、用车数据和充电数据；

时序数据生成模块，用于基于用车数据生成用车时序数据，以及基于充电数据生成充电时序数据；

第一输入数据模块，用于基于车辆信息、用车时序数据和充电时序数据构建第一输入数据；

初始风险识别模块，用于将第一输入数据输入到预设的决策树模型，得到初始风险识别结果；

第二输入数据模块，用于将初始风险识别结果添加到第一输入数据中，生成第二输入数据；

车辆风险识别模块，用于将第二输入数据输入到预设的车辆风险识别模型，输出待识别风险车辆的风险识别结果。

为了解决上述技术问题，本申请实施例还提供一种计算机设备，采用了如下所述的技术方案：

一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机可读指令，所述处理器执行所述计算机可读指令时实现如上述任一项所述的新能源车的风险识别方法的步骤。

为了解决上述技术问题，本申请实施例还提供一种计算机可读存储介质，采用了如下所述的技术方案：

一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机可读指令，所述计算机可读指令被处理器执行时实现如上述中任一项所述的新能源车的风险识别方法的步骤。

与现有技术相比，本申请实施例主要有以下有益效果：

本申请公开一种新能源车的风险识别方法、装置、设备及存储介质，属于人工智能技术领域和金融科技领域。本申请通过获取待识别风险车辆的车辆数据，其中，车辆数据包括车辆信息、用车数据和充电数据，基于用车数据生成用车时序数据，以及基于充电数据生成充电时序数据，基于车辆信息、用车时序数据和充电时序数据构建第一输入数据，将第一输入数据输入到预设的决策树模型，得到初始风险识别结果，将初始风险识别结果添加到第一输入数据中，生成第二输入数据，将第二输入数据输入到预设的车辆风险识别模型，输出待识别风险车辆的风险识别结果。本申请综合了决策树模型和神经网络模型的优点，先利用决策树模型对车辆风险进行初步预测，然后将初步结果作为新的特征输入到神经网络模型中，以进一步提高风险识别的准确性和精度。

附图说明

为了更清楚地说明本申请中的方案，下面将对本申请实施例描述中所需要使用的附图作一个简单介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了本申请可以应用于其中的示例性***架构图；

图2示出了根据本申请的新能源车的风险识别方法的一个实施例的流程图；

图3示出了根据本申请的新能源车的风险识别装置的一个实施例的结构示意图；

图4示出了根据本申请的计算机设备的一个实施例的结构示意图。

具体实施方式

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同；本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本申请；本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形，意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

为了使本技术领域的人员更好地理解本申请方案，下面将结合附图，对本申请实施例中的技术方案进行清楚、完整地描述。

如图1所示，***架构100可以包括终端设备101、102、103，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互，以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用，例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。

终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备，包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture ExpertsGroup Audio Layer III，动态影像专家压缩标准音频层面3)、MP4(Moving PictureExperts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。

服务器105可以是提供各种服务的服务器，例如对终端设备101、102、103上显示的页面提供支持的后台服务器，服务器可以是独立的服务器，也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network，CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。

需要说明的是，本申请实施例所提供的新能源车的风险识别方法一般由服务器执行，相应地，新能源车的风险识别装置一般设置于服务器中。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

继续参考图2，示出了根据本申请的新能源车的风险识别方法的一个实施例的流程图。本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中，人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。

人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

目前，为了实现简单的风险识别，一种常用的方法是使用决策树模型进行预测，然而，由于新能源汽车行业的快速发展和复杂性，通过简单的决策树模型实现的风险预测准确度不高，无法用于保险公司的决策支持。

为了解决上述技术问题，本申请公开一种新能源车的风险识别方法、装置、设备及存储介质，属于人工智能技术领域和金融科技领域，本申请综合了决策树模型和神经网络模型的优点，先利用决策树模型对车辆风险进行初步预测，然后将初步结果作为新的特征输入到神经网络模型中，以进一步提高风险识别的准确性和精度，通过这种混合模型的方法，可以更全面、综合地考虑车辆的信息和行为数据，从而更好地进行风险识别和预测，以便后续根据风险识别结果预警高风险新能源新车辆，以及根据预警高风险新能源新车辆给出管控建议。

所述的新能源车的风险识别方法，包括以下步骤：

S201，获取待识别风险车辆的车辆数据，其中，车辆数据包括车辆信息、用车数据和充电数据。

在本实施例中，获取待识别风险车辆的车辆数据，车辆数据包括车辆信息、用车数据和充电数据，车辆信息包括车辆的型号、制造商、电池容量、电池寿命等，用车数据包括用车时刻、用车时长等，充电数据包括充电时刻、充电时长、充电方式等。

新能源车的充电数据和用车数据是预测新能源车风险的关键数据，充电数据包括车辆的充电频率、充电时段、充电位置、充电桩类型等信息，用车数据可以提供关于车辆的行驶里程、使用环境、路况等信息，这些数据将有助于构建全面、准确的新能源车风险识别模型。

需要说明的是，获取车辆数据后，还需要对车辆数据进行预处理，预处理包括对车辆数据进行清洗和去除异常值，对车辆数据进行标准化或归一化，确保车辆数据在相同的尺度上进行比较。

S202，基于用车数据生成用车时序数据，以及基于充电数据生成充电时序数据。

新能源车的用车数据和充电数据往往具有时序性和关联性，可以利用这些特点进行数据处理和特征提取。例如，可以通过滑动窗口或滞后特征的方式，将历史时间步的数据与当前时间步的数据关联起来，以捕捉到时间序列的动态关系，对充电数据和用车数据之间的关系进行建模和分析。

在本实施例中，对原始的用车数据和充电数据进行处理，包括时间戳的添加和数据的整理与清洗，通过生成时序数据，能够更好地反映车辆的使用情况和充电情况。

获取与用车数据匹配的第一时间戳序列；

根据第一时间戳序列为用车数据进行时间戳标记；

获取与充电数据匹配的第二时间戳序列；

根据第二时间戳序列为充电数据进行时间戳标记；

在本实施例中，为了得到时序数据，根据预设的时间戳序列和滑动窗口，对用车数据和充电数据进行处理，得到用车时序数据和充电时序数据，将原始的用车数据和充电数据根据预设的时间戳序列和滑动窗口进行处理，得到用车时序数据和充电时序数据，以便后续的分析和建模。需要说明的是，具体的时间戳序列和滑动窗口的选择需要根据具体的需求和数据特点进行调整和优化。

在本申请一种具体的实施例中，假设有以下示例用车数据：

第一时间戳序列为[10,20,30,40,50,60,70,80,90,100]；

用车数据为[5,10,8,15,20,12,18,25,30,22]；

将用车数据中的每个数据点与第一时间戳序列进行匹配，得到标记后的用车数据，即：

[(10,5),(20,10),(30,8),(40,15),(50,20),(60,12),(70,18),(80,25),(90,30),(100,22)]；

假设第一滑动窗口大小为3，从标记后的用车数据的第一个数据点开始，每次滑动3个数据点，得到用车时序数据：

[(10,5),(20,10),(30,8)],[(20,10),(30,8),(40,15)],...,[(80,25),(90,30),(100,22)]；

在上述实施例中，将原始的用车数据和充电数据根据预设的时间戳序列和滑动窗口进行处理，得到用车时序数据和充电时序数据，这些时序数据可以用于后续的分析和建模，例如用于预测用车行为和充电行为的模式、趋势等。

S203，基于车辆信息、用车时序数据和充电时序数据构建第一输入数据。

在本实施例中，基于车辆信息、用车时序数据和充电时序数据构建第一输入数据，将多个数据源进行整合，形成一个综合的数据集，该数据集作为决策树模型的输入，用于进行初始风险识别。

S204，将第一输入数据输入到预设的决策树模型，得到初始风险识别结果。

在本实施例中，将第一输入数据输入到预设的决策树模型，得到初始风险识别结果，决策树模型是一种基于树形结构进行分类的机器学习模型，决策树模型通过对特征进行划分，最终给出目标变量的分类结果，该模型的优点是易于理解和解释，适用于简单的风险识别需求。

对第一输入数据进行特征提取，得到第一输入特征；

在本实施例中，提取车辆信息、用车时序数据和充电时序数据的特征，并按照决策树的***规则将提取到的车辆信息、用车时序数据和充电时序数据的特征划分到决策树的树节点和叶子节点中，获取决策树模型中决策树最底层的叶子节点的标签值，得到初始风险识别结果。

在本申请一种具体的实施例中，假设决策树的一个节点的***条件是“充电次数>10”，则对于一个待预测的样本：

如果该样本的充电次数大于10次，将该样本划分到节点的右子节点；

如果该样本的充电次数小于等于10次，将该样本划分到节点的左子节点。

节点的左子节点和右子节点可能继续存在***特征，需要继续进行判断和划分，直到到达叶子节点。最终，到达叶子节点后，叶子节点上的标签值即为预测的结果，可以根据需要进行进一步的处理和解释。例如，可以将叶子节点标签为高风险、中风险、低风险，或者使用概率值表示风险程度。

S205，将初始风险识别结果添加到第一输入数据中，生成第二输入数据。

在本实施例中，将初始风险识别结果添加到第一输入数据中，生成第二输入数据，将决策树模型的识别结果与原始数据进行合并，为后续的模型提供更丰富的输入，这样的处理可以帮助提升后续模型的预测准确性。

S206，将第二输入数据输入到预设的车辆风险识别模型，输出待识别风险车辆的风险识别结果。

在本实施例中，将第二输入数据输入到预设的车辆风险识别模型，输出待识别风险车辆的风险识别结果，车辆风险识别模型基于神经网络模型训练得到，神经网络模型是一种能够通过学习数据中的复杂模式和关联关系来提高预测准确性的模型，相较于决策树模型，神经网络模型在处理非线性、复杂的数据关系上更具优势。

需要说明的是，车辆风险识别模型可以使用以下几种常见的神经网络模型任意一种来实现：多层感知机(Multilayer Perceptron,MLP)、卷积神经网络(ConvolutionalNeural Network,CNN)、循环神经网络(Recurrent Neural Network,RNN)、注意力机制(Attention Mechanism)。

在上述实施例中，本申请综合了决策树模型和神经网络模型的优点，先利用决策树模型对车辆风险进行初步预测，然后将初步结果作为新的特征输入到神经网络模型中，以进一步提高风险识别的准确性和精度，通过这种混合模型的方法，可以更全面、综合地考虑车辆的信息和行为数据，从而更好地进行风险识别和预测。

进一步地，在本申请的实施例中，在将第一输入数据输入到预设的决策树模型，得到初始风险识别结果之前，还包括：

在本实施例中，获取历史车辆数据，其中，车辆数据包括历史车辆信息、历史用车数据和历史充电数据。需要确保收集到充足、全面、高质量的数据，包括新能源车的事故数据、车辆信息、维修记录、保险索赔数据等，在进行模型训练之前，对数据进行预处理，包括数据清洗、去除异常值、特征选择和数据标准化等步骤。

获取历史用车数据和历史充电数据的时间戳序列，以便生成历史用车时序数据和历史充电时序数据，时序数据能够更好地反映车辆的使用情况和充电情况。基于历史车辆信息、历史用车时序数据和历史充电时序数据构建第一训练数据集，并使用第一训练数据集进行决策树的构建。决策树构建过程中，通过选择最佳的***特征和***点来最大化节点的纯度或最小化节点的不确定性，这个过程会递归地将数据集划分成不同的子集，直到达到预设的条件停止，得到多棵决策树，并组合这些决策树构建初始决策树模型。

获取初始决策树模型输出的第一风险识别结果，将第一风险识别结果添加到第一训练数据集中，生成第二训练数据集，利用第二训练数据集训练神经网络模型，并组合组合初始决策树模型和神经网络模型构建风险联合预测模型，基于第一风险识别结果和第二风险识别结果对风险联合预测模型进行参数调优，直至模型拟合，得到训练完成的决策树模型和车辆风险识别模型。

需要说明的是，风险联合预测模型充分利用了决策树和神经网络的优点，决策树具有可解释性和易于理解的特点，能够通过一系列决策规则对风险进行初步分类，而神经网络则可以学习更复杂的非线性关系，对数据进行深层次的特征学习和风险评估。本申请通过结合这两种模型，可以充分发挥它们的优势，提高整体新能源车风险识别的准确性和鲁棒性。

此外，风险联合预测模型的权重和集成策略是可以调节的，可以根据实际需求进行优化，通过调整不同模型的权重，可以对各个模型的贡献进行灵活控制，以获得最佳的综合效果，这使得混合模型具有更大的灵活性和适应性，能够适应不同的数据和问题。

对第一训练样本集进行特征提取，得到第一样本特征；

在本实施例中，对第一训练样本集进行特征提取，得到第一样本特征，基于第一样本特征和预设的决策树算法构建初始决策树模型，基于第一测试样本集对初始决策树模型进行模型测试，得到第一风险识别结果。

在上述实施例中，本申请通过第一训练样本集构建初始决策树模型，并将第一测试样本集输入到初始决策树模型进行模型测试，得到第一风险识别结果。

进一步地，基于第一测试样本集对初始决策树模型进行模型测试，得到第一风险识别结果，具体包括：

对第一验证样本集进行特征提取，得到第三样本特征；

将第三样本特征导入初始决策树模型，获取初始决策树模型中决策树最底层的叶子节点的标签值，得到第一风险识别结果。

在本实施例中，在进行模型测试时，对第一验证样本集中的数据进行特征提取，得到第三样本特征，将第三样本特征导入初始决策树模型，基于初始决策树模型的决策树***规则对第三样本特征进行划分，获取初始决策树模型中决策树最底层的叶子节点的标签值，得到第一风险识别结果。

对第二训练样本集进行特征提取，得到第二样本特征；

在本实施例中，对第二训练样本集进行特征提取，得到第二样本特征，通过神经网络模型对第二样本特征进行特征学习，得到特征学习结果，基于特征学习结果对神经网络模型进行迭代更新，得到训练完成的神经网络模型，基于第二测试样本集对训练完成的神经网络模型进行模型测试，得到第二风险识别结果。

需要说明的是，可以先对神经网络模型进行迭代更新，后续再通过第一风险识别结果和第二风险识别结果对风险联合预测模型进行参数调优，进一步提升模型性能。

构建风险联合预测模型的损失函数；

在本实施例中，风险联合预测模型的损失函数如下：

L＝α*L1+(1-α)*L2

式中，L为风险联合预测模型的损失函数，L1为初始决策树模型的损失函数，L2为神经网络模型的损失函数，α为损失函数的权重参数，α取值范围为0到1。

对第一风险识别结果和第二风险识别结果进行加权求和处理，得到风险联合预测结果，通过加权用来调整第一风险识别结果和第二风险识别结果在风险联合预测结果中的贡献程度的参数，加权权重需要根据具体情况进行设定，可以根据实际需求和数据特点来确定取值。基于风险联合预测模型的损失函数计算风险联合预测结果与预设标准结果的之间的误差，得到预测误差，并通过反向传播算法来实现模型迭代。

具体来说，在风险联合预测模型中的各个网络层传递预测误差，并将预测误差与预设误差阈值进行比对，当预测误差大于预设误差阈值时，对风险联合预测模型进行参数调优，直至预测误差小于或等于预设误差阈值为止，得到训练完成的决策树模型和车辆风险识别模型。

在上述实施例中，本申请公开一种新能源车的风险识别方法，属于人工智能技术领域和金融科技领域。本申请通过获取待识别风险车辆的车辆数据，其中，车辆数据包括车辆信息、用车数据和充电数据，基于用车数据生成用车时序数据，以及基于充电数据生成充电时序数据，基于车辆信息、用车时序数据和充电时序数据构建第一输入数据，将第一输入数据输入到预设的决策树模型，得到初始风险识别结果，将初始风险识别结果添加到第一输入数据中，生成第二输入数据，将第二输入数据输入到预设的车辆风险识别模型，输出待识别风险车辆的风险识别结果。本申请综合了决策树模型和神经网络模型的优点，先利用决策树模型对车辆风险进行初步预测，然后将初步结果作为新的特征输入到神经网络模型中，以进一步提高风险识别的准确性和精度。

在本实施例中，新能源车的风险识别方法运行于其上的电子设备(例如图1所示的服务器)可以通过有线连接方式或者无线连接方式接收指令或者获取数据。需要指出的是，上述无线连接方式可以包括但不限于3G/4G连接、WiFi连接、蓝牙连接、WiMAX连接、Zigbee连接、UWB(ultra wideband)连接、以及其他现在已知或将来开发的无线连接方式。

需要强调的是，为进一步保证上述车辆数据的私密和安全性，上述车辆数据还可以存储于一区块链的节点中。

本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机可读指令来指令相关的硬件来完成，该计算机可读指令可存储于一计算机可读取存储介质中，该计算机可读指令在执行时，可包括如上述各方法的实施例的流程。其中，前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)等非易失性存储介质，或随机存储记忆体(Random Access Memory，RAM)等。

应该理解的是，虽然附图的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，其可以以其他的顺序执行。而且，附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，其执行顺序也不必然是依次进行，而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

进一步参考图3，作为对上述图2所示方法的实现，本申请提供了一种新能源车的风险识别装置的一个实施例，该装置实施例与图2所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。

如图3所示，本实施例所述的新能源车的风险识别装置300，包括：

车辆数据获取模块301，用于获取待识别风险车辆的车辆数据，其中，车辆数据包括车辆信息、用车数据和充电数据；

时序数据生成模块302，用于基于用车数据生成用车时序数据，以及基于充电数据生成充电时序数据；

第一输入数据模块303，用于基于车辆信息、用车时序数据和充电时序数据构建第一输入数据；

初始风险识别模块304，用于将第一输入数据输入到预设的决策树模型，得到初始风险识别结果；

第二输入数据模块305，用于将初始风险识别结果添加到第一输入数据中，生成第二输入数据；

车辆风险识别模块306，用于将第二输入数据输入到预设的车辆风险识别模型，输出待识别风险车辆的风险识别结果。

进一步地，时序数据生成模块302具体包括：

第一时间戳单元，用于获取与用车数据匹配的第一时间戳序列；

第一标记单元，用于根据第一时间戳序列为用车数据进行时间戳标记；

第一滑动单元，用于使用预设的第一滑动窗口在完成时间戳标记后的用车数据上进行数据截取，得到用车时序数据；

第二时间戳单元，用于获取与充电数据匹配的第二时间戳序列；

第二标记单元，用于根据第二时间戳序列为充电数据进行时间戳标记；

第二滑动单元，用于使用预设的第二滑动窗口在完成时间戳标记后的充电数据上进行数据截取，得到充电时序数据。

进一步地，初始风险识别模块304具体包括：

输入特征提取单元，用于对第一输入数据进行特征提取，得到第一输入特征；

***规则获取单元，用于识别决策树模型的树节点和叶子节点，并获取决策树模型的节点***规则；

输入特征划分单元，用于根据节点***规则将第一输入特征划分到树节点和叶子节点中；

标签值获取单元，用于获取决策树模型中决策树最底层的叶子节点的标签值，得到初始风险识别结果。

进一步地，新能源车的风险识别装置300还包括：

历史数据模块，用于获取历史车辆数据，其中，车辆数据包括历史车辆信息、历史用车数据和历史充电数据；

历史时序模块，用于基于历史用车数据生成历史用车时序数据，以及基于历史充电数据生成历史充电时序数据；

第一训练集模块，用于基于历史车辆信息、历史用车时序数据和历史充电时序数据构建第一训练数据集；

决策树构建模块，用于将第一训练数据集构建初始决策树模型，并获取初始决策树模型输出的第一风险识别结果；

第二训练集模块，用于将第一风险识别结果添加到第一训练数据集中，生成第二训练数据集；

模型训练模块，用于将第二训练数据集输入到预设的神经网络模型，输出第二风险识别结果；

模型组合模块，用于组合初始决策树模型和神经网络模型构建风险联合预测模型；

模型迭代模块，用于基于第一风险识别结果和第二风险识别结果对风险联合预测模型进行参数调优，直至模型拟合，得到训练完成的决策树模型和车辆风险识别模型。

进一步地，第一训练数据集包括第一训练样本集和第一测试样本集，决策树构建模块具体包括：

第一特征提取单元，用于对第一训练样本集进行特征提取，得到第一样本特征；

决策树构建单元，用于基于第一样本特征和预设的决策树算法构建初始决策树模型；

决策树测试单元，用于基于第一测试样本集对初始决策树模型进行模型测试，得到第一风险识别结果。

进一步地，第二训练数据集包括第二训练样本集和第二测试样本集，模型训练模块具体包括：

第二特征提取单元，用于对第二训练样本集进行特征提取，得到第二样本特征；

特征学习单元，用于通过神经网络模型对第二样本特征进行特征学习，得到特征学习结果；

模型迭代更新单元，用于基于特征学习结果对神经网络模型进行迭代更新，得到训练完成的神经网络模型；

模型测试单元，用于基于第二测试样本集对训练完成的神经网络模型进行模型测试，得到第二风险识别结果。

进一步地，模型迭代模块具体包括：

识别结果加权单元，用于对第一风险识别结果和第二风险识别结果进行加权求和处理，得到风险联合预测结果；

损失函数构建单元，用于构建风险联合预测模型的损失函数；

预测误差计算单元，用于基于风险联合预测模型的损失函数计算风险联合预测结果与预设标准结果的之间的误差，得到预测误差；

预测误差比对单元，用于在风险联合预测模型中传递预测误差，并将预测误差与预设误差阈值进行比对；

模型参数调优单元，用于当预测误差大于预设误差阈值时，对风险联合预测模型进行参数调优，直至预测误差小于或等于预设误差阈值为止，得到训练完成的决策树模型和车辆风险识别模型。

在上述实施例中，本申请公开一种新能源车的风险识别装置，属于人工智能技术领域和金融科技领域。本申请通过获取待识别风险车辆的车辆数据，其中，车辆数据包括车辆信息、用车数据和充电数据，基于用车数据生成用车时序数据，以及基于充电数据生成充电时序数据，基于车辆信息、用车时序数据和充电时序数据构建第一输入数据，将第一输入数据输入到预设的决策树模型，得到初始风险识别结果，将初始风险识别结果添加到第一输入数据中，生成第二输入数据，将第二输入数据输入到预设的车辆风险识别模型，输出待识别风险车辆的风险识别结果。本申请综合了决策树模型和神经网络模型的优点，先利用决策树模型对车辆风险进行初步预测，然后将初步结果作为新的特征输入到神经网络模型中，以进一步提高风险识别的准确性和精度。

为解决上述技术问题，本申请实施例还提供计算机设备。具体请参阅图4，图4为本实施例计算机设备基本结构框图。

所述计算机设备4包括通过***总线相互通信连接存储器41、处理器42、网络接口43。需要指出的是，图中仅示出了具有组件41-43的计算机设备4，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。其中，本技术领域技术人员可以理解，这里的计算机设备是一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的设备，其硬件包括但不限于微处理器、专用集成电路(ApplicationSpecific Integrated Circuit，ASIC)、可编程门阵列(Field－Programmable GateArray，FPGA)、数字处理器(Digital Signal Processor，DSP)、嵌入式设备等。

所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。

所述存储器41至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，所述存储器41可以是所述计算机设备4的内部存储单元，例如该计算机设备4的硬盘或内存。在另一些实施例中，所述存储器41也可以是所述计算机设备4的外部存储设备，例如该计算机设备4上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(FlashCard)等。当然，所述存储器41还可以既包括所述计算机设备4的内部存储单元也包括其外部存储设备。本实施例中，所述存储器41通常用于存储安装于所述计算机设备4的操作***和各类应用软件，例如新能源车的风险识别方法的计算机可读指令等。此外，所述存储器41还可以用于暂时地存储已经输出或者将要输出的各类数据。

所述处理器42在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器42通常用于控制所述计算机设备4的总体操作。本实施例中，所述处理器42用于运行所述存储器41中存储的计算机可读指令或者处理数据，例如运行所述新能源车的风险识别方法的计算机可读指令。

所述网络接口43可包括无线网络接口或有线网络接口，该网络接口43通常用于在所述计算机设备4与其他电子设备之间建立通信连接。

在上述实施例中，本申请公开一种计算机设备，属于人工智能技术领域和金融科技领域。本申请通过获取待识别风险车辆的车辆数据，其中，车辆数据包括车辆信息、用车数据和充电数据，基于用车数据生成用车时序数据，以及基于充电数据生成充电时序数据，基于车辆信息、用车时序数据和充电时序数据构建第一输入数据，将第一输入数据输入到预设的决策树模型，得到初始风险识别结果，将初始风险识别结果添加到第一输入数据中，生成第二输入数据，将第二输入数据输入到预设的车辆风险识别模型，输出待识别风险车辆的风险识别结果。本申请综合了决策树模型和神经网络模型的优点，先利用决策树模型对车辆风险进行初步预测，然后将初步结果作为新的特征输入到神经网络模型中，以进一步提高风险识别的准确性和精度。

本申请还提供了另一种实施方式，即提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可读指令，所述计算机可读指令可被至少一个处理器执行，以使所述至少一个处理器执行如上述的新能源车的风险识别方法的步骤。

在上述实施例中，本申请公开一种计算机可读存储介质，属于人工智能技术领域和金融科技领域。本申请通过获取待识别风险车辆的车辆数据，其中，车辆数据包括车辆信息、用车数据和充电数据，基于用车数据生成用车时序数据，以及基于充电数据生成充电时序数据，基于车辆信息、用车时序数据和充电时序数据构建第一输入数据，将第一输入数据输入到预设的决策树模型，得到初始风险识别结果，将初始风险识别结果添加到第一输入数据中，生成第二输入数据，将第二输入数据输入到预设的车辆风险识别模型，输出待识别风险车辆的风险识别结果。本申请综合了决策树模型和神经网络模型的优点，先利用决策树模型对车辆风险进行初步预测，然后将初步结果作为新的特征输入到神经网络模型中，以进一步提高风险识别的准确性和精度。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各个实施例所述的方法。

本申请可用于众多通用或专用的计算机***环境或配置中。例如：个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器***、基于微处理器的***、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何***或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

显然，以上所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例，附图中给出了本申请的较佳实施例，但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现，相反地，提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明，对于本领域的技术人员来而言，其依然可以对前述各具体实施方式所记载的技术方案进行修改，或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构，直接或间接运用在其他相关的技术领域，均同理在本申请专利保护范围之内。

Claims

1.一种新能源车的风险识别方法，其特征在于，包括：

获取待识别风险车辆的车辆数据，其中，所述车辆数据包括车辆信息、用车数据和充电数据；

基于所述用车数据生成用车时序数据，以及基于所述充电数据生成充电时序数据；

基于所述车辆信息、所述用车时序数据和所述充电时序数据构建第一输入数据；

将所述第一输入数据输入到预设的决策树模型，得到初始风险识别结果；

将所述初始风险识别结果添加到所述第一输入数据中，生成第二输入数据；

将所述第二输入数据输入到预设的车辆风险识别模型，输出待识别风险车辆的风险识别结果。

2.如权利要求1所述的新能源车的风险识别方法，其特征在于，所述基于所述用车数据生成用车时序数据，以及基于所述充电数据生成充电时序数据，具体包括：

获取与所述用车数据匹配的第一时间戳序列；

根据所述第一时间戳序列为所述用车数据进行时间戳标记；

使用预设的第一滑动窗口在完成时间戳标记后的所述用车数据上进行数据截取，得到所述用车时序数据；

获取与所述充电数据匹配的第二时间戳序列；

根据所述第二时间戳序列为所述充电数据进行时间戳标记；

使用预设的第二滑动窗口在完成时间戳标记后的所述充电数据上进行数据截取，得到所述充电时序数据。

3.如权利要求1所述的新能源车的风险识别方法，其特征在于，所述将所述第一输入数据输入到预设的决策树模型，得到初始风险识别结果，具体包括：

对所述第一输入数据进行特征提取，得到第一输入特征；

识别所述决策树模型的树节点和叶子节点，并获取所述决策树模型的节点***规则；

根据所述节点***规则将所述第一输入特征划分到所述树节点和所述叶子节点中；

获取所述决策树模型中决策树最底层的叶子节点的标签值，得到所述初始风险识别结果。

4.如权利要求1所述的新能源车的风险识别方法，其特征在于，在所述将所述第一输入数据输入到预设的决策树模型，得到初始风险识别结果之前，还包括：

获取历史车辆数据，其中，所述车辆数据包括历史车辆信息、历史用车数据和历史充电数据；

基于所述历史用车数据生成历史用车时序数据，以及基于所述历史充电数据生成历史充电时序数据；

基于所述历史车辆信息、所述历史用车时序数据和所述历史充电时序数据构建第一训练数据集；

将所述第一训练数据集构建所述初始决策树模型，并获取所述初始决策树模型输出的第一风险识别结果；

将所述第一风险识别结果添加到所述第一训练数据集中，生成第二训练数据集；

将所述第二训练数据集输入到预设的神经网络模型，输出第二风险识别结果；

组合所述初始决策树模型和所述神经网络模型构建风险联合预测模型；

基于所述第一风险识别结果和所述第二风险识别结果对所述风险联合预测模型进行参数调优，直至模型拟合，得到训练完成的所述决策树模型和所述车辆风险识别模型。

5.如权利要求4所述的新能源车的风险识别方法，其特征在于，所述第一训练数据集包括第一训练样本集和第一测试样本集，所述将所述第一训练数据集构建所述初始决策树模型，并获取所述初始决策树模型输出的第一风险识别结果，具体包括：

对所述第一训练样本集进行特征提取，得到第一样本特征；

基于所述第一样本特征和预设的决策树算法构建所述初始决策树模型；

基于所述第一测试样本集对所述初始决策树模型进行模型测试，得到所述第一风险识别结果。

6.如权利要求4所述的新能源车的风险识别方法，其特征在于，所述第二训练数据集包括第二训练样本集和第二测试样本集，所述将所述第二训练数据集输入到预设的神经网络模型，输出第二风险识别结果，具体包括：

对所述第二训练样本集进行特征提取，得到第二样本特征；

通过所述神经网络模型对所述第二样本特征进行特征学习，得到特征学习结果；

基于所述特征学习结果对所述神经网络模型进行迭代更新，得到训练完成的神经网络模型；

基于所述第二测试样本集对训练完成的神经网络模型进行模型测试，得到所述第二风险识别结果。

7.如权利要求4所述的新能源车的风险识别方法，其特征在于，所述基于所述第一风险识别结果和所述第二风险识别结果对所述风险联合预测模型进行参数调优，直至模型拟合，得到训练完成的所述决策树模型和所述车辆风险识别模型，具体包括：

对所述第一风险识别结果和所述第二风险识别结果进行加权求和处理，得到风险联合预测结果；

构建所述风险联合预测模型的损失函数；

基于所述风险联合预测模型的损失函数计算风险联合预测结果与预设标准结果的之间的误差，得到预测误差；

在所述风险联合预测模型中传递所述预测误差，并将所述预测误差与预设误差阈值进行比对；

当所述预测误差大于预设误差阈值时，对所述风险联合预测模型进行参数调优，直至所述预测误差小于或等于预设误差阈值为止，得到训练完成的所述决策树模型和所述车辆风险识别模型。

8.一种新能源车的风险识别装置，其特征在于，包括：

车辆数据获取模块，用于获取待识别风险车辆的车辆数据，其中，所述车辆数据包括车辆信息、用车数据和充电数据；

时序数据生成模块，用于基于所述用车数据生成用车时序数据，以及基于所述充电数据生成充电时序数据；

第一输入数据模块，用于基于所述车辆信息、所述用车时序数据和所述充电时序数据构建第一输入数据；

初始风险识别模块，用于将所述第一输入数据输入到预设的决策树模型，得到初始风险识别结果；

第二输入数据模块，用于将所述初始风险识别结果添加到所述第一输入数据中，生成第二输入数据；

车辆风险识别模块，用于将所述第二输入数据输入到预设的车辆风险识别模型，输出待识别风险车辆的风险识别结果。

9.一种计算机设备，其特征在于，包括存储器和处理器，所述存储器中存储有计算机可读指令，所述处理器执行所述计算机可读指令时实现如权利要求1至7中任一项所述的新能源车的风险识别方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机可读指令，所述计算机可读指令被处理器执行时实现如权利要求1至7中任一项所述的新能源车的风险识别方法的步骤。