CN116257663A - 面向无人地面车辆的异常检测与关联分析方法及相关设备 - Google Patents

面向无人地面车辆的异常检测与关联分析方法及相关设备 Download PDF

Info

Publication number
CN116257663A
CN116257663A CN202310103919.2A CN202310103919A CN116257663A CN 116257663 A CN116257663 A CN 116257663A CN 202310103919 A CN202310103919 A CN 202310103919A CN 116257663 A CN116257663 A CN 116257663A
Authority
CN
China
Prior art keywords
data
index
indexes
association rule
state information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310103919.2A
Other languages
English (en)
Inventor
姚秋彦
杨辉
李翔
包博文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CN202310103919.2A priority Critical patent/CN116257663A/zh
Publication of CN116257663A publication Critical patent/CN116257663A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T90/00Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Databases & Information Systems (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Computational Linguistics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本申请提供一种面向无人地面车辆的异常检测与关联分析方法及相关设备,获取多个时刻的无人地面车辆的状态信息数据。采用聚类算法对所述状态信息数据进行聚类,根据聚类结果对所述多个指标数据进行标注,得到指标标注数据。基于所述指标标注数据采用关联规则算法计算得到所述多个指标之间的关联规则,基于预先确定的目标指标对所述关联规则进行筛选,得到目标关联规则。采用相关系数算法分别计算所述目标指标与所述多个指标中其他指标的相关系数,得到相关系数表,基于所述指标标注数据、所述目标关联规则和所述相关系数表对所述无人地面车辆的异常数据进行分析,为后续无人地面车辆的维护决策提供依据。

Description

面向无人地面车辆的异常检测与关联分析方法及相关设备
技术领域
本申请涉及无人车辆检测技术领域,尤其涉及一种面向无人地面车辆的异常检测与关联分析方法及相关设备。
背景技术
近年来,随着人工智能技术的快速发展,无人地面车辆日益受到各国政府及社会公众的关注。它们能够为执行任务人员提供急需的现场感知能力并具备多样化的突破手段,能大力提升人员的战斗力、防御力和生存能力,是实现未来无人化、智能化、自主化战场的主要装备之一。
无人地面车辆具有复杂的结构特征,环境感知、数据处理、决策执行等多个分***协同保障其正常运行,各***多组件间存在复杂关联,故障的发生受多重因素综合影响。如何挖掘多特征属性间的内在关联规则,以及如何根据关联规则实现动态的自主故障预测,是目前亟需解决的问题之一。
发明内容
有鉴于此,本申请的目的在于提出一种面向无人地面车辆的异常检测与关联分析方法及相关设备。
基于上述目的,本申请的第一方面提供了一种面向无人地面车辆的异常检测与关联分析方法,包括:
获取多个时刻的无人地面车辆的状态信息数据,所述状态信息数据中包含多个指标对应的多个指标数据;
采用聚类算法对所述状态信息数据进行聚类,根据聚类结果对所述多个指标数据进行标注,得到指标标注数据;
基于所述指标标注数据采用关联规则算法计算得到所述多个指标之间的关联规则;
基于预先确定的目标指标对所述关联规则进行筛选,得到目标关联规则,所述目标指标为所述多个指标中的一个指标;
采用相关系数算法分别计算所述目标指标与所述多个指标中其他指标的相关系数,得到相关系数表;
基于所述指标标注数据、所述目标关联规则和所述相关系数表对所述无人地面车辆的异常数据进行分析。
本申请的第二方面提供了一种面向无人地面车辆的异常检测与关联分析装置,包括:
获取模块,被配置为获取多个时刻的无人地面车辆的状态信息数据,所述状态信息数据中包含多个指标对应的多个指标数据;
聚类模块,被配置为采用聚类算法对所述状态信息数据进行聚类,根据聚类结果对所述多个指标数据进行标注,得到指标标注数据;
关联模块,被配置为基于所述指标标注数据采用关联规则算法计算得到所述多个指标之间的关联规则;
筛选模块,被配置为基于预先确定的目标指标对所述关联规则进行筛选,得到目标关联规则,所述目标指标为所述多个指标中的一个指标;
计算模块,被配置为采用相关系数算法分别计算所述目标指标与所述多个指标中其他指标的相关系数,得到相关系数表;
分析模块,被配置为基于所述指标标注数据、所述目标关联规则和所述相关系数表对所述无人地面车辆的异常数据进行分析。
本申请的第三方面提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可由所述处理器执行的计算机程序,所述处理器在执行所述计算机程序时实现如上所述的方法。
本申请的第四方面提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使计算机执行如上所述的方法。
从上面所述可以看出,本申请提供的面向无人地面车辆的异常检测与关联分析方法和相关设备,获取多个时刻的无人地面车辆的状态信息数据,所述状态信息数据中包含多个指标对应的多个指标数据,全面获取无人地面车辆的多个指标数据,为后续指标数据之间的关联分析提供数据基础。采用聚类算法对所述状态信息数据进行聚类,根据聚类结果对所述多个指标数据进行标注,得到指标标注数据,通过聚类算法对多个指标数据进行分类,对不同类别的指标数据进行标记,对状态信息数据中的异常数据进行识别。基于所述指标标注数据采用关联规则算法计算得到所述多个指标之间的关联规则,基于预先确定的目标指标对所述关联规则进行筛选,得到目标关联规则,所述目标指标为所述多个指标中的一个指标,挖掘目标指标与其他指标的强关联关系。采用相关系数算法分别计算所述目标指标与所述多个指标中其他指标的相关系数,得到相关系数表,基于所述指标标注数据、所述目标关联规则和所述相关系数表对所述无人地面车辆的异常数据进行分析,实现复杂车辆数据环境的异常分析,更直观、准确的体现多维指标之间所蕴藏的关系,实现面向多指标关联的无人地面车辆的状态精准评估和异常检测,为后续无人地面车辆的维护决策提供依据。
附图说明
为了更清楚地说明本申请或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例的面向无人地面车辆的异常检测与关联分析方法的流程示意图;
图2为本申请实施例的关联规则挖掘示意图;
图3为本申请实施例的面向无人地面车辆的异常检测与关联分析装置的结构示意图;
图4为本申请实施例的电子设备硬件结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本申请进一步详细说明。
需要说明的是,除非另外定义,本申请实施例使用的技术术语或者科学术语应当为本申请所属领域内具有一般技能的人士所理解的通常意义。本申请实施例中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。
如背景技术所述,近年来,随着人工智能技术的快速发展,无人地面车辆日益受到各国政府及社会公众的关注。无人地面车辆***包含多种传感器、数据处理单元、车载电源等,每个组成部分的属性呈现多样化、差异化特征。在面对日益复杂的作战环境,无人作战车辆的应对能力有限,为了应对执行任务的过程中发生的不可预测情况,保证车辆的安全运行,对无人车辆数据的故障感知变得非常重要,特别是需要高效全能地识别数据的异常行为。
无人地面车辆具有复杂的结构特征,环境感知、数据处理、决策执行等多个分***协同保障其正常运行,各***多组件间存在复杂关联,故障的发生受多重因素综合影响。采用单指标检测分析往往不能取得很好的效果,而现有面向无人地面车辆的故障预测方法难以精确获取各分***关键组件间关联关系,使得故障预测精度低下。
有鉴于此,本申请提供了一种面向无人地面车辆的异常检测与关联分析方法和相关设备,利用基于密度空间的多特征动态聚类算法对车辆状态数据进行聚类分析,筛选出噪声数据进行标注,并基于关联规则算法分析组件挖掘多维指标间的关联,计算各指标间的斯皮尔曼关联度。从而实现当前复杂车辆数据环境的异常分析,更直观、准确的体现多维指标之间所蕴藏的关系,为后续无人地面车辆的维护决策提供依据。
以下结合附图来详细说明本申请的实施例。
本申请提供了一种面向无人地面车辆的异常检测与关联分析方法,参考图1,包括以下步骤:
步骤102、获取多个时刻的无人地面车辆的状态信息数据,所述状态信息数据中包含多个指标对应的多个指标数据。
具体的,无人地面车辆具备计算单元、存储单元和控制单元。计算单元能够为装备提供计算资源,存储单元能够为装备提供存储资源,控制单元能够执行计算单元输出的指令信息。无人地面车辆的存储单元均设有数据收集模块,例如事件记录仪(EventDataRecords)和车载诊断***(On-Board Diagnostic),能够对车辆运行过程中的各种状态信息数据进行记录,并将记录结果存储在该单元中,方便其他单元使用历史状态信息数据。
状态信息数据应包括车辆运行过程中的操控数据、使用数据、性能数据、环境数据、工况数据等,具体包括多个指标,例如速度、油门、温度、轮胎转速、发动机扭矩、油门位置、刹车位置、路况、天气、光照、车载设备工作情况以及车辆故障信息等。获取包括多个指标的状态信息数据能够确保较为全面的对无人地面车辆的异常数据进行检测和分析。
步骤104、采用聚类算法对所述状态信息数据进行聚类,根据聚类结果对所述多个指标数据进行标注,得到指标标注数据。
无监督学习聚类算法种类较多,其中,DBSCAN算法是一个优秀的基于密度的聚类算法,可以发现任意形状的聚类,能有效发现噪声点和离群点,十分适合于处理不规则的数据样本。本实施例中的聚类算法即为DBSCAN算法。将聚类结果中的噪声点和离群点标记为异常数据,实现对异常数据的自动标注。
步骤106、基于所述指标标注数据采用关联规则算法计算得到所述多个指标之间的关联规则。通过关联规则算法实现多维指标关联规则分析,更直观、准确的体现多维指标之间所蕴藏的强关联关系。当几个指标互为强关联关系时,其中一个指标发生变化,其他指标会相应发生变化。有助于快速发现车辆复杂数据之间的关联关系。
步骤108、基于预先确定的目标指标对所述关联规则进行筛选,得到目标关联规则,所述目标指标为所述多个指标中的一个指标。目标指标是用户根据实际分析需求提前确定的,确定了目标指标后,在关联规则中筛选与目标指标关联的关联规则作为目标关联规则,可以对目标关联规则进行重点分析。
步骤110、采用相关系数算法分别计算所述目标指标与所述多个指标中其他指标的相关系数,得到相关系数表。相关系数可以体现出两个指标之间的关联关系,关联关系至少包括不相关、强负相关、弱负相关、弱正相关和强正相关。计算目标指标与每个其他指标的相关系数,形成相关系数表。
步骤112、基于所述指标标注数据、所述目标关联规则和所述相关系数表对所述无人地面车辆的异常数据进行分析。
经过前述步骤依次得到所述指标标注数据、所述目标关联规则和所述相关系数表,结合上述数据对无人地面车辆的异常数据和状态进行检测,提高后续车辆状态分析的准确性和效率。
基于上述步骤102至步骤112,获取多个时刻的无人地面车辆的状态信息数据,所述状态信息数据中包含多个指标对应的多个指标数据,全面获取无人地面车辆的多个指标数据,为后续指标数据之间的关联分析提供数据基础。采用聚类算法对所述状态信息数据进行聚类,根据聚类结果对所述多个指标数据进行标注,得到指标标注数据,通过聚类算法对多个指标数据进行分类,对不同类别的指标数据进行标记,对状态信息数据中的异常数据进行识别。基于所述指标标注数据采用关联规则算法计算得到所述多个指标之间的关联规则,基于预先确定的目标指标对所述关联规则进行筛选,得到目标关联规则,所述目标指标为所述多个指标中的一个指标,挖掘目标指标与其他指标的强关联关系。采用相关系数算法分别计算所述目标指标与所述多个指标中其他指标的相关系数,得到相关系数表,基于所述指标标注数据、所述目标关联规则和所述相关系数表对所述无人地面车辆的异常数据进行分析,实现复杂车辆数据环境的异常分析,更直观、准确的体现多维指标之间所蕴藏的关系,实现面向多指标关联的无人地面车辆的状态精准评估和异常检测,为后续无人地面车辆的维护决策提供依据。
在一些实施例中,所述聚类结果包括核心点、边界点和噪声点,所述指标标注数据包括正常数据、告警数据和异常数据;
所述采用聚类算法对所述状态信息数据进行聚类,根据聚类结果对所述多个指标数据进行标注,得到指标标注数据,包括:
基于所述状态信息数据计算得到距离矩阵Dn*n
Dn*n={d(i,j),1≤i≤N,1≤j≤N}
Figure BDA0004074138880000061
其中,d(i,j)表示i时刻的状态信息数据与j时刻的状态信息数据之间的距离,N表示所述多个时刻的数量,n表示所述多个指标的数量;基于所述距离矩阵计算得到搜索半径,基于所述搜索半径计算得到密度阈值;基于所述搜索半径和所述密度阈值,对所述状态信息数据进行聚类,根据聚类结果将所述多个指标数据划分为所述核心点、所述边界点和所述噪声点;将所述核心点、所述边界点和所述噪声点分别标记为所述正常数据、所述告警数据和所述异常数据。
具体的,本实施例中的聚类算法为DBSCAN算法。DBSCAN算法以每个数据点为圆心,计算以Eps为搜索半径的圈包含数据点的个数为该点密度值。然后选取一个密度阈值MinPts,圈内点数小于MinPts的圆心点为低密度的点,而大于或等于MinPts的圆心点记为高密度的点。如果有一个高密度的点在另一个高密度的点的圈内,就把这两个点连接起来,从而不断地串联数据点。如果有低密度的点在高密度的点的圈内,把它连到最近的高密度点上作为边界点。所有连到一起的点形成一个簇,不在任何簇内的低密度点即标记为异常点。高密度点也即核心点,异常点也即噪声点。
DBSCAN算法最重要的两个参数是Eps(搜索半径)和Minpts(密度阈值)。为了确定两个参数值,首先定义数据集X={x1,x2,…,xi,…,xN},含有N个状态信息数据点,每个状态信息数据点对应一个采集时刻。xi=(xi1,xi2,…,xik,…,xin)代表其中一个状态信息数据点,xik表示数据xi的第k维指标的指标数据,例如xi1代表数据在第i个时刻的振动信息指标的指标数据,n表示多维指标的总数。定义状态信息数据点间的距离d(i,j)表示xi与xj间的距离。
Figure BDA0004074138880000071
由每两个不同时刻的状态信息数据点间的距离可以确定一个距离矩阵
Dn*n={d(i,j),1≤i≤N,1≤j≤N}
求出矩阵后,利用极大似然估计法得出搜索半径EPs:
Figure BDA0004074138880000072
每个EPs内的点数,取其平均值得到:
Figure BDA0004074138880000073
其中,Pi为第m个邻域半径内的点数。在确定搜索半径Eps和密度阈值Minpts后,从状态信息数据点中任选一个未被访问的核心对象,以该对象作为起始对象建立一个新类,递归地找出所有从该对象密度可达的对象,加入到该类中,并标记为已访问。其中,将处在半径内的数据点xi称为核心点。如果数据点xi满足条件|Eps(xi)|=Minpts,则称为边界点,该状态信息数据中的其余点称为异常点或者噪声点。将所述核心点、所述边界点和所述噪声点分别标记为所述正常数据、所述告警数据和所述异常数据。示例性的,如下表1所示,为经过标注的指标标注数据。
表1指标标注数据
Figure BDA0004074138880000074
Figure BDA0004074138880000081
表1中序号表示数据采集时刻,A、B、C、D、E分别为5个指标,也即每个时刻采集的状态信息数据包括5个指标。
在一些实施例中,所述指标标注数据包括正常数据、告警数据和异常数据;
所述基于所述指标标注数据采用关联规则算法计算得到所述多个指标之间的关联规则,包括:提取所述指标标注数据中的所述异常数据和所述告警数据形成异常数据集;基于所述异常数据集采用apriori算法计算得到所述多个指标之间的关联规则。
具体的,通过apriori算法实现指标与指标之间关联规则挖掘。关联规则挖掘指的是针对事务数据挖掘频繁项集,从而在大型数据库中发现变量之间相互关系的方法。项集即若干项的集合,项集的长度就是项集含有项目的数量,对于项集C如果其支持度大于等于指定的最小支持度,则称为频繁项集Lk,其中k表示该项集的长度。支持度定义为前项X和后项Y同时出现的概率,是产生最大频繁项集的依据。关联规则指示两个项集X和Y之间的特定关系。
将表1中的告警状态和异常状态均视为非正常状态,将非正常状态的数据作为异常数据进行提取,形成异常数据集。如图2所示,异常数据集中有4条记录,分别是4个时刻出现非正常状态的指标:第1个时刻为ACD、第2个时刻为BCE、第3个时刻为ABCE、第4个时刻为BE。本实施例中,通过apriori算法寻找频繁k项集,最小支持度设置为50%。首先生成频繁项集L1:由异常数据集中的5个指标生成候选1项集(当k=1时,候选1项集是由异常数据集中的单指标数据直接构成),候选1项集中的数量表示某个指标在4个时刻中出现的异常的次数。计算其中5个指标的支持度,计算完毕后进行剪枝,指标D由于支持度只有1/4=25%,小于设定的50%阈值而被剪掉,生成的频繁1项集为图2中L1所示。然后链接生成候选频繁2项集(当k等于2时,候选2项集中的数据是由频繁项集L1中的数据两两组合得到的),候选2项集包括{AB}、{AC}、{AE}、{BC}、{BE}、{CE}共6组。计算候选频繁2项集的支持度,接着进行剪枝,由于AB和AE的支持度只有25%小于设定的50%阈值而被筛除,得到频繁2项集L2,包括{AC}、{BC}、{BE}和{CE}。链接生成候选3项集,将频繁2项集中第1项相同的数据进行拼接(当k大于2时,候选k项集,是由频繁k-1项集中前k-2项相同的数据拼接生成的)。在L2中,项集{B C}和{B E}的第1项相同,将这两个项集链接,得到候选3项集。由于此时无法再进行数据链接得到候选频繁4项集,最终的结果即为频繁3项集{B C E},也即关联规则为{B C E}。
在一些实施例中,所述基于预先确定的目标指标对所述关联规则进行筛选,得到目标关联规则,包括:在所述关联规则中选取包含所述目标指标的关联规则作为所述目标关联规则。由于在前述实施例中得到了关联规则为{B C E},本实施例中的目标指标为B,关联规则{B C E}中包含B,则关联规则{B C E}为目标关联规则。
在一些实施例中,所述采用相关系数算法分别计算所述目标指标与所述多个指标中其他指标的相关系数,得到相关系数表,包括:
基于所述多个指标系数采用斯皮尔曼相关系数算法分别计算得到所述目所述目标指标与所述多个指标中其他指标的相关系数,得到相关系数表。
具体的,将指标B作为目标指标,将其和A、C、D和E的具体指标数据进行斯皮尔曼相关系数分析。以指标B和指标D为例子进行说明如下:分别获取指标B和指标D的指标数据,B={B1,B2,…,Bn}={90,98,96,95,95},D={D1,D2,…,Dn}={35,39,38,39,37},把指标B、D看为两个变量,其元素个数均为5,且两个变量取的第i(1≤i≤5)个值分别表示为Bi、Di。对B、D同时进行升或降排序,分别得到如下表2所示两个对元素进行排行后的新集合b、d,其中元素bi为Bi在B中的排行、di为Di在D中的排行,将集合b、d中的元素对应相减得到一个排行差分集合si=bi-di
表2斯皮尔曼相关系数等级表
B D b d si
90 35 1 1 0
98 39 5 4.5 0.5
96 38 4 3 1
95 39 2.5 4.5 -2
95 37 2.5 2 0.5
根据如下公式计算斯皮尔曼等级相关系数
Figure BDA0004074138880000091
Figure BDA0004074138880000092
得到最终相关系数值ρ=0.725。以此类推,计算指标B与其他指标的相关系数,如表3所示。
表3相关系数表
相关指标 相关系数
A 0.287
C 0.836
D 0.725
E 0.778
其中,相关系数取值全集范围是[-1,1],当取值为0时表示不相关,取值为[-1,-0.5)表示强负相关,取值为[-0.5,0)表示弱负相关,取值为(0,0.5]表示弱正相关,取值为(0.5,1]表示强正相关。
在一些实施例中,在采用聚类算法对所述状态信息数据进行聚类之前,还包括:对所述状态信息数据进行归一化处理。
具体的,将状态信息数据按指标进行读取,以时间顺序编排为列表格式文件,并作为地面无人车辆的历史状态信息数据保存到存储单元中。数据的组织格式转化之后,再采用线性标准化的方法对数据做归一化处理。首先遍历其中一项指标数据集中的所有数值,找出该指标数据集中的最大值与最小值。然后再次遍历该项数据,依据下列公式对各个数值进行归一化计算。如果各项指标数据集全部遍历完成,则完成全部历史状态信息数据的归一化处理。
Figure BDA0004074138880000101
其中,min为最小值,max为最大值,
Figure BDA0004074138880000102
为归一化后的历史状态信息数据x为归一化前的历史状态信息数据。
在一些实施例中,在对所述状态信息数据进行归一化处理之前,还包括:对所述状态信息数据进行缺失数据处理,以对所述状态信息数据中的缺失数据进行填充。
具体的,由于复杂环境中的干扰,车辆采集到的状态信息数据可能存在缺失的情况,本实施例采用均值法进行缺失数据处理。首先选择一项需要缺失处理的指标数据,读取该数据的时序坐标,记录该时刻上一时刻和下一时刻非空数据。计算两者的均值填补当前缺失数据。当该指标数据集处理完成后,选择下一个缺失数据进行处理。所有指标数据处理完成后,缺失数据处理完成。
需要说明的是,通过基于apriori算法和斯皮尔曼多维指标关联规则分析,得到两个指标之间的关联度,帮助综合分析车辆异常数据和当前装备的状态,提高后续装备分析的准确性与效率。以基于长短期记忆网络(LSTM,Long Short-Term Memory)的异常检测模型为例,LSTM是一种有监督的深度学习方式,应用于有标签时间序列预测场景。
将本申请的方法运用于LSTM检测前的数据预处理部分,可以对一部分不具有异常标签的车辆数据进行离群性检测,给训练样本加入特征和标签信息。将不相关变量作为预测模型的输入会影响深度神经网络模型的精确度。利用本申请提供的方法对各指标进行分析和对各指标与目标指标的关联度大小进行计算,对指标进行筛选,用于异常预测。例如,根据前述实施例中的分析结果,B、C、E指标构成频繁3项集,这就意味着当车辆指标B发生异常时,指标C和E往往也会发生异常。由表3可知,在4个指标与B的相关度中,A的关联度较小应予以剔除,而C、D、E的关联较为密切。因此,LSTM训练选取B、C、E、D作为异常预测模型的输入变量,以对LSTM进行训练。
需要说明的是,本申请实施例的方法可以由单个设备执行,例如一台计算机或服务器等。本实施例的方法也可以应用于分布式场景下,由多台设备相互配合来完成。在这种分布式场景的情况下,这多台设备中的一台设备可以只执行本申请实施例的方法中的某一个或多个步骤,这多台设备相互之间会进行交互以完成所述的方法。
需要说明的是,上述对本申请的一些实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于上述实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本申请还提供了一种面向无人地面车辆的检测与关联分析装置。
参考图3,所述面向无人地面车辆的异常检测与关联分析装置,包括:
获取模块302,被配置为获取多个时刻的无人地面车辆的状态信息数据,所述状态信息数据中包含多个指标对应的多个指标数据;
聚类模块304,被配置为采用聚类算法对所述状态信息数据进行聚类,根据聚类结果对所述多个指标数据进行标注,得到指标标注数据;
关联模块306,被配置为基于所述指标标注数据采用关联规则算法计算得到所述多个指标之间的关联规则;
筛选模块308,被配置为基于预先确定的目标指标对所述关联规则进行筛选,得到目标关联规则,所述目标指标为所述多个指标中的一个指标;
计算模块310,被配置为采用相关系数算法分别计算所述目标指标与所述多个指标中其他指标的相关系数,得到相关系数表;
分析模块312,被配置为基于所述指标标注数据、所述目标关联规则和所述相关系数表对所述无人地面车辆的异常数据进行分析。
在一些实施例中,所述聚类结果包括核心点、边界点和噪声点,所述指标标注数据包括正常数据、告警数据和异常数据;所述聚类模块304还被配置为基于所述状态信息数据计算得到距离矩阵Dn*n
Dn*n={d(i,j),1≤i≤N,1≤j≤N}
Figure BDA0004074138880000121
其中,d(i,j)表示i时刻的状态信息数据与j时刻的状态信息数据之间的距离,N表示所述多个时刻的数量,n表示所述多个指标的数量;
基于所述距离矩阵计算得到搜索半径,基于所述搜索半径计算得到密度阈值;
基于所述搜索半径和所述密度阈值,对所述状态信息数据进行聚类,根据聚类结果将所述多个指标数据划分为所述核心点、所述边界点和所述噪声点;
将所述核心点、所述边界点和所述噪声点分别标记为所述正常数据、所述告警数据和所述异常数据。
在一些实施例中,所述指标标注数据包括正常数据、告警数据和异常数据;关联模块306,还被配置为提取所述指标标注数据中的所述告警数据和所述异常数据形成异常数据集;基于所述异常数据集采用apriori算法计算得到所述多个指标之间的关联规则。
在一些实施例中,所述筛选模块308还被配置为在所述关联规则中选取包含所述目标指标的关联规则作为所述目标关联规则。
在一些实施例中,所述计算模块310还被配置为基于所述多个指标系数采用斯皮尔曼相关系数算法分别计算得到所述目所述目标指标与所述多个指标中其他指标的相关系数,得到相关系数表。
在一些实施例中,在采用聚类算法对所述状态信息数据进行聚类之前,还包括:对所述状态信息数据进行归一化处理。
在一些实施例中,在对所述状态信息数据进行归一化处理之前,还包括:对所述状态信息数据进行缺失数据处理,以对所述状态信息数据中的缺失数据进行填充。
为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本申请时可以把各模块的功能在同一个或多个软件和/或硬件中实现。
上述实施例的装置用于实现前述任一实施例中相应的面向无人地面车辆的异常检测与关联分析方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
基于同一发明构思,与上述任意实施例方法相对应的,本申请还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上任意一实施例所述的面向无人地面车辆的异常检测与关联分析方法。
图4示出了本实施例所提供的一种更为具体的电子设备硬件结构示意图,该设备可以包括:处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。
处理器1010可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的技术方案。
存储器1020可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作***和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行。
输入/输出接口1030用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。
需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。
上述实施例的电子设备用于实现前述任一实施例中相应的面向无人地面车辆的异常检测与关联分析方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
基于同一发明构思,与上述任意实施例方法相对应的,本申请还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行如上任一实施例所述的面向无人地面车辆的异常检测与关联分析方法。
本实施例的计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
上述实施例的存储介质存储的计算机指令用于使所述计算机执行如上任一实施例所述的面向无人地面车辆的异常检测与关联分析方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本申请的范围(包括权利要求)被限于这些例子;在本申请的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本申请实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。
另外,为简化说明和讨论,并且为了不会使本申请实施例难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本申请实施例难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本申请实施例的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本申请的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本申请实施例。因此,这些描述应被认为是说明性的而不是限制性的。
尽管已经结合了本申请的具体实施例对本申请进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。
本申请实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本申请实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种面向无人地面车辆的异常检测与关联分析方法,其特征在于,包括:
获取多个时刻的无人地面车辆的状态信息数据,所述状态信息数据中包含多个指标对应的多个指标数据;
采用聚类算法对所述状态信息数据进行聚类,根据聚类结果对所述多个指标数据进行标注,得到指标标注数据;
基于所述指标标注数据采用关联规则算法计算得到所述多个指标之间的关联规则;
基于预先确定的目标指标对所述关联规则进行筛选,得到目标关联规则,所述目标指标为所述多个指标中的一个指标;
采用相关系数算法分别计算所述目标指标与所述多个指标中其他指标的相关系数,得到相关系数表;
基于所述指标标注数据、所述目标关联规则和所述相关系数表对所述无人地面车辆的异常数据进行分析。
2.根据权利要求1所述的方法,其特征在于,所述聚类结果包括核心点、边界点和噪声点,所述指标标注数据包括正常数据、告警数据和异常数据;
所述采用聚类算法对所述状态信息数据进行聚类,根据聚类结果对所述多个指标数据进行标注,得到指标标注数据,包括:
基于所述状态信息数据计算得到距离矩阵Dn*n
Dn*n={d(i,j),1≤i≤N,1≤j≤N}
Figure FDA0004074138870000011
其中,d(i,j)表示i时刻的状态信息数据与j时刻的状态信息数据之间的距离,N表示所述多个时刻的数量,n表示所述多个指标的数量;
基于所述距离矩阵计算得到搜索半径,基于所述搜索半径计算得到密度阈值;
基于所述搜索半径和所述密度阈值,对所述状态信息数据进行聚类,根据聚类结果将所述多个指标数据划分为所述核心点、所述边界点和所述噪声点;
将所述核心点、所述边界点和所述噪声点分别标记为所述正常数据、所述告警数据和所述异常数据。
3.根据权利要求1所述的方法,其特征在于,所述指标标注数据包括正常数据、告警数据和异常数据;
所述基于所述指标标注数据采用关联规则算法计算得到所述多个指标之间的关联规则,包括:
提取所述指标标注数据中的所述告警数据和所述异常数据形成异常数据集;
基于所述异常数据集采用apriori算法计算得到所述多个指标之间的关联规则。
4.根据权利要求1所述的方法,其特征在于,所述基于预先确定的目标指标对所述关联规则进行筛选,得到目标关联规则,包括:
在所述关联规则中选取包含所述目标指标的关联规则作为所述目标关联规则。
5.根据权利要求1所述的方法,其特征在于,所述采用相关系数算法分别计算所述目标指标与所述多个指标中其他指标的相关系数,得到相关系数表,包括:
基于所述多个指标系数采用斯皮尔曼相关系数算法分别计算得到所述目标指标与所述多个指标中其他指标的相关系数,得到相关系数表。
6.根据权利要求1所述的方法,其特征在于,在采用聚类算法对所述状态信息数据进行聚类之前,还包括:
对所述状态信息数据进行归一化处理。
7.根据权利要求6所述的方法,其特征在于,在对所述状态信息数据进行归一化处理之前,还包括:
对所述状态信息数据进行缺失数据处理,以对所述状态信息数据中的缺失数据进行填充。
8.一种面向无人地面车辆的异常检测与关联分析装置,其特征在于,包括:
获取模块,被配置为获取多个时刻的无人地面车辆的状态信息数据,所述状态信息数据中包含多个指标对应的多个指标数据;
聚类模块,被配置为采用聚类算法对所述状态信息数据进行聚类,根据聚类结果对所述多个指标数据进行标注,得到指标标注数据;
关联模块,被配置为基于所述指标标注数据采用关联规则算法计算得到所述多个指标之间的关联规则;
筛选模块,被配置为基于预先确定的目标指标对所述关联规则进行筛选,得到目标关联规则,所述目标指标为所述多个指标中的一个指标;
计算模块,被配置为采用相关系数算法分别计算所述目标指标与所述多个指标中其他指标的相关系数,得到相关系数表;
分析模块,被配置为基于所述指标标注数据、所述目标关联规则和所述相关系数表对所述无人地面车辆的异常数据进行分析。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任意一项所述的方法。
10.一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,其特征在于,所述计算机指令用于使计算机执行权利要求1至7任一所述方法。
CN202310103919.2A 2023-01-30 2023-01-30 面向无人地面车辆的异常检测与关联分析方法及相关设备 Pending CN116257663A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310103919.2A CN116257663A (zh) 2023-01-30 2023-01-30 面向无人地面车辆的异常检测与关联分析方法及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310103919.2A CN116257663A (zh) 2023-01-30 2023-01-30 面向无人地面车辆的异常检测与关联分析方法及相关设备

Publications (1)

Publication Number Publication Date
CN116257663A true CN116257663A (zh) 2023-06-13

Family

ID=86685836

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310103919.2A Pending CN116257663A (zh) 2023-01-30 2023-01-30 面向无人地面车辆的异常检测与关联分析方法及相关设备

Country Status (1)

Country Link
CN (1) CN116257663A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116957421A (zh) * 2023-09-20 2023-10-27 山东济宁运河煤矿有限责任公司 一种基于人工智能的洗选生产智能化监测***
CN117312807A (zh) * 2023-11-29 2023-12-29 浙江万胜智能科技股份有限公司 一种断路器的控制状态分析方法及***

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116957421A (zh) * 2023-09-20 2023-10-27 山东济宁运河煤矿有限责任公司 一种基于人工智能的洗选生产智能化监测***
CN116957421B (zh) * 2023-09-20 2024-01-05 山东济宁运河煤矿有限责任公司 一种基于人工智能的洗选生产智能化监测***
CN117312807A (zh) * 2023-11-29 2023-12-29 浙江万胜智能科技股份有限公司 一种断路器的控制状态分析方法及***
CN117312807B (zh) * 2023-11-29 2024-02-06 浙江万胜智能科技股份有限公司 一种断路器的控制状态分析方法及***

Similar Documents

Publication Publication Date Title
CN111860872B (zh) 用于异常检测的***和方法
CN116257663A (zh) 面向无人地面车辆的异常检测与关联分析方法及相关设备
CN108182515B (zh) 智能规则引擎规则输出方法、设备及计算机可读存储介质
WO2017191625A1 (en) Method of detecting anomalies on appliances and system thereof
CN113884961B (zh) Soc校准方法、建模方法、建模装置、计算机设备及介质
US11710082B2 (en) Systems and methods for utilizing machine learning and feature selection to classify driving behavior
EP3443482B1 (en) Classifying entities in digital maps using discrete non-trace positioning data
Fel et al. Xplique: A deep learning explainability toolbox
KR102028930B1 (ko) 움직임 정보를 이용한 인공지능 학습기반의 이동객체 영상 분류처리 방법
CN113168403A (zh) 设备消息框架
CN103106394A (zh) 一种视频监控中的人体行为识别方法
CN110708285A (zh) 流量监控方法、装置、介质及电子设备
Taylor et al. Data mining for vehicle telemetry
CN116579697A (zh) 冷链全链路数据信息管理方法、装置、设备及存储介质
CN115062200A (zh) 基于人工智能的用户行为挖掘方法及***
Mandala Predictive Failure Analytics in Critical Automotive Applications: Enhancing Reliability and Safety through Advanced AI Techniques
Geissler et al. A low-cost strategic monitoring approach for scalable and interpretable error detection in deep neural networks
CN112784008B (zh) 案件相似度确定方法及装置、存储介质、终端
CN116451081A (zh) 数据漂移的检测方法、装置、终端及存储介质
CN111882135B (zh) 一种物联网设备入侵检测方法及相关装置
Tronchin et al. Explainable ai for car crash detection using multivariate time series
CN113065428A (zh) 基于特征选择的自动驾驶目标识别方法
CN112906824A (zh) 车辆聚类方法、***、设备及存储介质
Nanditha et al. Optimized defect prediction model using statistical process control and Correlation-Based feature selection method
Breuß et al. Energy-Efficient Driving Model by Clustering of GPS Information

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination