CN114997341A - 一种信息融合处理方法及装置 - Google Patents

一种信息融合处理方法及装置 Download PDF

Info

Publication number
CN114997341A
CN114997341A CN202210915497.4A CN202210915497A CN114997341A CN 114997341 A CN114997341 A CN 114997341A CN 202210915497 A CN202210915497 A CN 202210915497A CN 114997341 A CN114997341 A CN 114997341A
Authority
CN
China
Prior art keywords
uncertainty
determining
system state
action
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210915497.4A
Other languages
English (en)
Inventor
黄安付
郭伟
吴嘉阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baiyang Times Beijing Technology Co ltd
Original Assignee
Baiyang Times Beijing Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baiyang Times Beijing Technology Co ltd filed Critical Baiyang Times Beijing Technology Co ltd
Priority to CN202210915497.4A priority Critical patent/CN114997341A/zh
Publication of CN114997341A publication Critical patent/CN114997341A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01DMEASURING NOT SPECIALLY ADAPTED FOR A SPECIFIC VARIABLE; ARRANGEMENTS FOR MEASURING TWO OR MORE VARIABLES NOT COVERED IN A SINGLE OTHER SUBCLASS; TARIFF METERING APPARATUS; MEASURING OR TESTING NOT OTHERWISE PROVIDED FOR
    • G01D21/00Measuring or testing not otherwise provided for
    • G01D21/02Measuring two or more variables by means not covered by a single other subclass
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种信息融合处理方法及装置。通过获取第一数据,根据所述第一数据确定***状态,根据所述***状态确定第一不确定度和第二不确定度,根据所述第一不确定度和所述第二不确定度确定奖励值;根据所述奖励值确定第一选择值,根据所述第一选择值确定第一动作,根据所述第一动作处理所述第一数据对应的融合结果。由此,分别考虑两个不确定度,度量以上两个的不确定度,衡量信息质量。通过强化学习和两两不确定度的组合进行自适应冲突处理,选择对应的处理动作。实现了冲突证据的自适应管理,而且提高了多传感器信息融合的准确性,减少了信息损失。

Description

一种信息融合处理方法及装置
技术领域
本申请涉及作战信息融合技术领域,尤其涉及一种信息融合处理方法及装置。
背景技术
Dempster-Shafer(证据融合法)是一种不确定性推理理论,可以在没有先验概率的情况下处理不确定信息。由于Dempster-Shafer理论的特点,它在军事和民用领域都得到了广泛的应用。Dempster组合规则作为多源信息融合的经典组合规则,在应用中存在一些问题。比如当要结合的证据高度冲突时,它可能会产生与直觉相反的结果。
当前,现有的方法冲突证据处理方法,主要聚焦于在原始基本概率分配上,在现有方法中并没有考虑逆基本概率分配的应用,逆基本概率分配也是一种从反面角度观察事物的信息表示方式。因此,数据不全面,并且不能解决实时的冲突处理,当数据量较大时,计算就及其复杂。
发明内容
有鉴于此,本申请实施例提供了一种信息融合处理方法及装置,旨在实现信息融合的处理。
第一方面,一种信息融合处理方法,所述方法包括:
获取第一数据,所述第一数据为由若干个检测设备获取的基于识别框架的基本概率分配值,所述识别框架包括若干个识别目标;
根据所述第一数据确定***状态,所述***状态与融合结果相互对应;
根据所述***状态确定第一不确定度和第二不确定度,所述第一不确定度用于指示基本概率分配的不确定性,所述第二不确定度用于指示逆基本概率分配的不确定性;
根据所述第一不确定度和所述第二不确定度确定奖励值;
根据所述奖励值确定第一选择值,根据所述第一选择值确定第一动作,所述第一选择值用于确定第一时刻对应的处理动作;
根据所述第一动作处理所述第一数据对应的融合结果。
可选的,所述根据所述第一数据确定***状态包括:
获取动作集,所述动作集用于指示对所述***状态的不同处理动作,所述动作集包括多个动作元素;
根据所述动作集和所述第一数据确定***状态集合,所述***状态集合包括多个***状态。
可选的,所述根据所述第一不确定度和所述第二不确定度确定奖励值包括:
根据所述第一初时不确定度与所述第一延后不确定度,所述第二初时不确定度和所述第二延后不确定度之间的大小关系,获取所述第一时刻对应的奖励值。
可选的,所述方法还包括:
获取质量值集合,所述质量值集合包括所述识别框架对应的若干个质量值;
根据所述质量值集合和第一基准组合确定所述识别目标对应的相关系数集合;
获取第一相关系数,所述第一相关系数为所述相关系数集合中数值最大的相关系数;
确定所述第一相关系数对应的识别目标为最终决策结果。
可选的,所述根据所述第一动作处理所述第一数据对应的融合结果包括:
响应于所述第一动作指示所述第一数据对应的***状态处于冲突状态,删除所述第一数据对应的***状态。
第二方面,本申请实施例提供了一种信息融合处理装置,包括:
第一数据获取模块,用于获取第一数据,所述第一数据为由若干个检测设备获取的基于识别框架的基本概率分配值,所述识别框架包括若干个识别目标;
***状态确定模块,用于根据所述第一数据确定***状态,所述***状态与融合结果相互对应;
不确定度确定模块,用于根据所述***状态确定第一不确定度和第二不确定度,所述第一不确定度用于指示基本概率分配的不确定性,第二不确定度用于指示逆基本概率分配的不确定性;
奖励值确定模块,用于根据所述第一不确定度和所述第二不确定度确定奖励值;
第一选择值确定模块,用于根据所述奖励值确定第一选择值;
第一动作确定模块,用于根据所述奖励值确定第一选择值,根据所述第一选择值确定第一动作,所述第一选择值用于确定第一时刻对应的处理动作;
处理模块,用于根据所述第一动作处理所述第一数据对应的融合结果。
可选的,所述***状态确定模块包括:
动作集获取模块,用于获取动作集,所述动作集用于指示对所述***状态的不同处理动作,所述动作集包括多个动作元素;
状态确定执行模块,用于根据所述动作集和所述第一数据确定***状态集合,所述***状态集合包括多个***状态。
可选的,所述不确定度确定模块包括:
时刻***状态获取模块,用于获取所述第一时刻对应的第一***状态和第二时刻对应的第二***状态,所述第一时刻早于所述第二时刻;
不确定度确定执行模块,用于获取所述第一***状态对应的第一初时不确定度和第二初时不确定度,所述第二***状态对应的第一延后不确定度和第二延后不确定度。
可选的,所述装置还包括:
质量值获取模块,用于获取质量值集合,所述质量值集合包括所述识别框架对应的若干个质量值;
相关系数集合确定模块,用于根据所述质量值集合和第一基准组合确定所述识别目标对应的相关系数集合;
第一相关系数获取模块,用于获取第一相关系数,所述第一相关系数为所述相关系数集合中数值最大的相关系数;
决策结果确定模块,用于确定所述第一相关系数对应的识别目标为最终决策结果。
本申请实施例提供了一种信息融合处理方法及装置。在执行所述方法时,分别考虑两个不确定度:基本概率分配的不确定性和逆基本概率分配不确定性。度量以上两个的不确定度,用来衡量信息质量。通过强化学习和两两不确定度的组合进行自适应冲突处理,选择对应的处理动作。由此,实现了计算证据的逆基本概率分配,衡量证据的不确定性,利用强化学习来实现数据删除。通过对原基本概率分配和逆基本概率分配的研究,可以使所获得的信息更加全面。创新性将强化学习与不确定度相结合对冲突证据进行处理,将逆证据引入到强化学习中,用来实现信息质量的评估。实现了冲突证据的自适应管理,而且提高了多传感器信息融合的准确性,减少了信息损失。
附图说明
为更清楚地说明本实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的信息融合处理的方法的一种方法流程图;
图2为本申请实施例提供的信息融合处理的方法的一种方法流程图;
图3为本申请实施例提供的信息融合处理的装置的一种结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
正如前文所述,由于Dempster-Shafer理论的特点,它在军事和民用领域都得到了广泛的应用。Dempster组合规则作为多源信息融合的经典组合规则,广泛应用于信息融合的Dempster-Shafer理论可以在没有先验信息的情况下处理不确定信息。但是,发明人经过研究发现,但当要组合的证据高度冲突时,可能会导致与直觉相反的结果。现有的方法不足以处理实时和在线的相互冲突的证据。
为了解决这一问题,本申请实施例提供了一种信息融合处理方法及装置。在执行所述方法时,分别考虑两个不确定度:基本概率分配的不确定性和逆基本概率分配不确定性。度量以上两个的不确定度,用来衡量信息质量。通过强化学习和两两不确定度的组合进行自适应冲突处理,选择对应的处理动作。由此,达成了以下有益效果:考虑了原始基本概率分配和逆基本概率分配,证据的正面信息可以从原始基本概率分配中获得,证据的负面信息可以从逆基本概率分配中获得。通过对原基本概率分配和逆基本概率分配的研究,可以使所获得的信息更加全面。将逆证据引入到强化学习中,用来实现信息质量的评估。通过利用邓氏熵得到了原始证据及其逆证据的不确定性。然后综合的不确定度来区分证据信息质量,从而有助于实现信息的获取。为了实现自适应的在线信息融合,将强化学习与不确定度相结合对冲突证据进行处理。在这个过程中,建立了马尔可夫决策过程模型,并用Q学习算法进行求解,实现了证据的融合。总体看来,本方案实现了冲突证据的自适应管理,而且提高了多传感器信息融合的准确性,减少了信息损失。
本申请实施例提供的方法执行主体可以为传感器和处理***,假设在战场中有五 个传感器同时检测到同一个目标,设置辨识框架为Θ={A,B,C},即目标可能是A(战斗机)、B (无人机)、C(飞鸟)中的一个。从五个传感器获得的基本概率分配值分别为
Figure 123823DEST_PATH_IMAGE001
。而后,处理***可以根据从传感器处获得的基本概率分配值以及方法 参数的设置情况(如折现因子、学习率、周期数)进行各个证据的处理过程。
以下通过一个实施例,对本申请提供的信息融合处理方法进行说明。请参考图1,图1为本申请实施例所提供的信息融合处理方法的一种方法流程图,包括:
S101:获取第一数据。
其中,所述第一数据为由检测设备获取的基本概率分配值。
举例说明,在实际应用场景中,在战场中有五个传感器同时检测到同一个目标,可 以设置辨识框架为
Figure 288088DEST_PATH_IMAGE002
,即目标可能是A(战斗机)、B(无人机)、C(飞鸟)中的一个。 从五个传感器获得的基本概率分配值分别为
Figure 795293DEST_PATH_IMAGE001
其中,m(A)对应传感器1数据,传感器2数据,传感器3数据,传感器4数据,传感器5数据分别为0.41,0,0.58,0.55,0.60。传感器1数据为m1,其中,m(A),m(B),m(C),m(A,C)分别为0.41,0.29,0.30。
数据可以如下表1所示。
表1. 传感器侦测数据(BPA)
Figure 132733DEST_PATH_IMAGE003
S102:根据所述第一数据确定***状态。
其中,所述***状态对应融合结果。
在融合决策***中,通过选择当前***状态下的动作来获得下一个状态。建立了多传感器信息融合决策***的MDP模型。
由于实际环境的影响,多传感器信息融合决策***可能具有较高的冲突性,因此 需要制定合理的动作策略来实现对冲突数据的有效处理。在我们提出的方法中,动作集
Figure 510625DEST_PATH_IMAGE004
被定义为:
Figure DEST_PATH_IMAGE005
证据可以通过动作
Figure 376950DEST_PATH_IMAGE006
保留,其信息可以在以后进行融合。通过
Figure 135565DEST_PATH_IMAGE007
动作可以删除高 冲突证据,避免了冲突证据对融合结果的不利影响。冲突程度较低或信息量较少的证据可 通过动作
Figure 11117DEST_PATH_IMAGE008
暂时保留,即“待处理”。在接下来的步骤中,将会操作一个“待处理”的证据。在 对所有证据进行第一轮筛选后,将再次对“待处理”的证据进行处理。具体地说,第一轮保留 的所有证据都被融合并表示为
Figure 243515DEST_PATH_IMAGE009
。然后重新考虑“待处理”的证据,直到通过合并获得的证 据的不确定性得到满足为止。
在强化学习中,当采取一个动作时,***的状态将在另一个状态中改变。在融合***中,当***行为发生变化时,融合结果也会发生变化。因此,可以将当前融合结果定义为***状态,即,
Figure 546321DEST_PATH_IMAGE010
其中,
Figure DEST_PATH_IMAGE011
表示在时间
Figure 293697DEST_PATH_IMAGE012
的融合结果,
Figure 910623DEST_PATH_IMAGE013
是在时间
Figure 794265DEST_PATH_IMAGE014
的传感器证据,并且
Figure 533551DEST_PATH_IMAGE015
表 示在时间
Figure 705907DEST_PATH_IMAGE014
采取的动作。基于以上分析,***状态集可以定义为:
Figure 923261DEST_PATH_IMAGE016
S103:根据所述***状态确定第一不确定度和第二不确定度。
奖励是环境在一定的状态
Figure 130252DEST_PATH_IMAGE017
和一定的动作
Figure 774860DEST_PATH_IMAGE018
下给出的反馈值,本文中的环境主要 包含每个时刻的传感器信息和融合结果。***使用奖励值来确定每次的最佳操作。在本方 法中可以使用邓熵评价融合结果的质量,从而设置奖励函数。原始基本概率分配的不确定 度定义为
Figure 434511DEST_PATH_IMAGE019
。同时,还利用邓熵计算
Figure 691442DEST_PATH_IMAGE020
的否定的不确定性,定义为
Figure 815256DEST_PATH_IMAGE021
。这两个不确定 性被表示为:
Figure 834028DEST_PATH_IMAGE022
S104:根据所述第一不确定度和所述第二不确定度确定奖励值。
奖励是环境在一定的状态
Figure 43292DEST_PATH_IMAGE017
和一定的动作
Figure 540133DEST_PATH_IMAGE018
下给出的反馈值,本文中的环境主要 包含每个时刻的传感器信息和融合结果。***使用奖励值来确定每次的最佳操作。在本方 法中我们使用邓熵来评价融合结果的质量,从而设置奖励函数。原始基本概率分配的不确 定度定义为
Figure 518453DEST_PATH_IMAGE019
。同时,还利用邓熵来计算
Figure 708126DEST_PATH_IMAGE020
的否定的不确定性,定义为
Figure 404687DEST_PATH_IMAGE021
。这两个不 确定性被表示为
Figure 705218DEST_PATH_IMAGE023
然后结合
Figure 538045DEST_PATH_IMAGE024
Figure DEST_PATH_IMAGE025
来判断信息的质量。具体地说,可以分为以下几种情况:
情况1:如果
Figure 695356DEST_PATH_IMAGE026
这表明新的状态
Figure 816896DEST_PATH_IMAGE027
无论从正反两方面都具有较 小的不确定性,应该给予积极的奖励,因为添加新的证据会导致更确定的融合结果。
情况2:如果
Figure 717856DEST_PATH_IMAGE028
, 这表明新的状态
Figure 608452DEST_PATH_IMAGE027
无论从正反两方面都具有 较大的不确定性,应该给予惩罚奖励,因为添加新的证据会导致更多的不确定的融合结果。
情况3:如果
Figure 429341DEST_PATH_IMAGE029
或者
Figure 834914DEST_PATH_IMAGE030
, 这表明,新状态
Figure 742827DEST_PATH_IMAGE027
的效 果无法确定,不会受到奖励或惩罚。因此,此案的证据正在等待处理。
通过设置上述三种情况,我们可以对传感器采取不同的策略(即删除、保留或等待处理),从而删除高冲突证据并保留有效证据。基于上述分析,本文中的奖励函数定义为:
Figure 550246DEST_PATH_IMAGE031
S105:根据所述奖励值确定第一选择值,根据所述第一选择值确定第一动作。
在对MDP进行建模后,本方法采用一种与模型无关的Q学习算法来获得最优策略。Q 学习通过删除冲突的基本概率分配来得出高质量的证据。在时间t时,***从不同的传感器 接收信息源发送过来的基本概率分配值,然后使用动作选择策略来选择动作。此处利用
Figure 252623DEST_PATH_IMAGE032
策略来选择动作,用
Figure 145493DEST_PATH_IMAGE033
的概率探索新的动作,并以
Figure 325938DEST_PATH_IMAGE034
的概率选择当前考虑的最 优动作。
Figure 253443DEST_PATH_IMAGE032
策略保证了算法的探索和利用之间的平衡。具体定义如下:
Figure DEST_PATH_IMAGE035
其中
Figure 923459DEST_PATH_IMAGE020
表示所有可选动作,
Figure 38045DEST_PATH_IMAGE036
表示
Figure 22182DEST_PATH_IMAGE037
函数在状态
Figure 804193DEST_PATH_IMAGE017
和动作
Figure 848373DEST_PATH_IMAGE018
中的
Figure 217299DEST_PATH_IMAGE037
值。然后,融 合***在处执行操作并获得新的融合结果(即,新的BPA)。在时间
Figure 5127DEST_PATH_IMAGE012
用邓熵测量原始基本概 率分配和逆基本概率分配的不确定度,并与时间
Figure 641644DEST_PATH_IMAGE038
的不确定度进行比较,根据奖励函数 得到时间
Figure 856725DEST_PATH_IMAGE012
的奖励值。通过下面的公式来计算当前Q值,并将该Q值存储在Q表中:
Figure 945904DEST_PATH_IMAGE039
其中
Figure 537422DEST_PATH_IMAGE040
是折现因子。融合***根据Q值函数选择动作,然后***状态转移到下一个 状态
Figure 28446DEST_PATH_IMAGE027
。随着Q学习的不断探索,我们使用下面的公式来更新Q值函数:
Figure 414428DEST_PATH_IMAGE041
其中
Figure 256482DEST_PATH_IMAGE042
是学习率。
S106:根据所述第一动作处理所述第一数据对应的融合结果。
随后通过下面的公式就可以得到最优动作。***会以一定的概率随机选择一个动作,保证算法具有一定的探索性。最后,得到了最优策略:
Figure 182850DEST_PATH_IMAGE043
根据上述过程,融合***通过反复计算和更新Q值来获得最优动作。结果,删除了冲突的BPA,保留了一致的BPA,实现自适应的在线信息处理。
在实际应用过程中,根据表1传感器侦测数据(BPA)以及对应的方法参数设置折现因子(γ)= 0.9,学习率(α)= 0.1,周期数(M)= 100。
对各个证据的处理结果如下表2所示,得出了最终结果保留了传感器1、传感器3、传感器4、传感器5,而删除了传感器2,因为它的BPA与其他传感器的BPA非常不同,更容易造成冲突。对证据体处理后通过计算可得每个保留传感器的逆基本概率分配值。
表2. 逆基本概率分配结果
Figure 466064DEST_PATH_IMAGE044
其中,⨂指利用Dempster组合规则进行融合,后续可以将该表运用到基于相关系数的决策方案中,计算每个baseline BPA与合并得到的BPA之间的相关系数,确定相应命题为决策结果。
下面对本申请实施例提供的信息融合处理方法进行详细介绍。参见图2所示,图2为本申请实施例提供的信息融合处理方法的另一种流程示意图。其具体过程如下:
S201:获取第一数据。
第一数据为由检测设备获取的基本概率分配值。
S202:获取动作集。
所述动作集用于指示对所述***状态的不同处理动作,所述动作集包括多个动作元素。
在实际应用过程中,动作集
Figure DEST_PATH_IMAGE045
被定义为:
Figure 85264DEST_PATH_IMAGE046
,其 中,a1,a2,a3为动作集中的动作元素,指示动作保留,删除,待处理。
S203:根据所述动作集和所述第一数据确定***状态集合。
根据上述动作集中的各个动作元素与第一数据结合共同确定融合结果,将当前融合结果定义为***状态,即,
Figure 149035DEST_PATH_IMAGE010
其中,
Figure 816777DEST_PATH_IMAGE047
表示在时间
Figure 780928DEST_PATH_IMAGE048
的融合结果,
Figure 102188DEST_PATH_IMAGE013
是在时间
Figure 122097DEST_PATH_IMAGE014
的传感器证据,并且
Figure 859109DEST_PATH_IMAGE015
表 示在时间
Figure 179232DEST_PATH_IMAGE014
采取的动作。
基于以上分析,***状态集可以定义为:
Figure 77917DEST_PATH_IMAGE049
S204:获取第一时刻对应的第一***状态和第二时刻对应的第二***状态。
因为***状态集为
Figure 116281DEST_PATH_IMAGE050
,其中St对应为t时刻的融合结果,St+1 对应为t+1时刻的融合结果。因此在该步骤中可以根据时刻值从所述***状态集合中确定 对应的***状态
其中,所述第一时刻早于所述第二时刻。
S205:获取所述第一***状态对应的第一初时不确定度和第二初时不确定度,所述第二***状态对应的第一延后不确定度和第二延后不确定度。
详细根据***状态确定不确定度的过程参见前述实施例,在此不做赘述。
Figure 188142DEST_PATH_IMAGE022
S206:根据所述第一初时不确定度与所述第一延后不确定度,所述第二初时不确定度和第二延后不确定度之间的大小关系,获取所述第一时刻对应的奖励值。
Figure DEST_PATH_IMAGE051
详细结合第一确定度和第二确定度大小关系确定奖励值的过程详见步骤S104,在此不做赘述。
S207:根据所述奖励值确定第一选择值,根据所述第一选择值确定第一动作。
利用得到的奖励值确定第一选择值及第一动作,具体过程详述参见步骤S105,在此不做赘述。
S208:根据所述第一动作处理所述第一数据对应的融合结果。
在对融合结果进行处理应用时,在应用场景中响应于所述第一动作指示所述第一数据对应的***状态处于冲突状态,删除所述第一数据对应的***状态。
S209:获取质量值集合。
基本概率分配
Figure 97192DEST_PATH_IMAGE052
的质量值完全分配给辨识框架中的每一个元素,即
Figure 730561DEST_PATH_IMAGE053
S210:根据所述质量值集合和第一基准组合确定所述识别目标对应的相关系数集合。
S211:获取第一相关系数。
计算每个baseline BPA与合并得到的BPA之间的相关系数。
在实际应用过程中,通过计算
Figure 928324DEST_PATH_IMAGE054
Figure 69455DEST_PATH_IMAGE055
,
Figure 301854DEST_PATH_IMAGE056
与每个 baseline BPA组合得到相关系数。如下表所示:
表3. 决策结果
Figure 604659DEST_PATH_IMAGE057
S212:确定所述第一相关系数对应的识别目标为最终决策结果。
相关系数最大对应的命题即为决策结果:
Figure 555297DEST_PATH_IMAGE058
其中
Figure 234540DEST_PATH_IMAGE059
是最终决策结果,
Figure 321445DEST_PATH_IMAGE060
(·)是相关系数。
在实际应用过程中,根据步骤S211可以看出,相关系数最大的命题是A,所以最终的决策结果是A。
以上为本申请实施例提供一种信息融合处理方法的一些具体实现方式,基于此,本申请还提供了对应的装置。下面将从功能模块化的角度对本申请实施例提供的装置进行介绍。
请参考图3,图3为本申请实施例所提供的一种信息融合处理装置的结构示意图。
本实施例中,该装置可以包括:
第一数据获取模块301,用于获取第一数据,所述第一数据为由若干个检测设备获取的基于识别框架的基本概率分配值,所述识别框架包括若干个识别目标;
***状态确定模块302,用于根据所述第一数据确定***状态,所述***状态与融合结果相互对应;
不确定度确定模块303,用于根据所述***状态确定第一不确定度和第二不确定度,所述第一不确定度用于指示基本概率分配的不确定性,第二不确定度用于指示逆基本概率分配的不确定性;
奖励值确定模块304,用于根据所述第一不确定度和所述第二不确定度确定奖励值;
第一选择值确定模块305,用于根据所述奖励值确定第一选择值;
第一动作确定模块306,用于根据所述奖励值确定第一选择值,根据所述第一选择值确定第一动作,所述第一选择值用于确定第一时刻对应的处理动作;
处理模块307,用于根据所述第一动作处理所述第一数据对应的融合结果。
所述***状态确定模块包括:
动作集获取模块,用于获取动作集,所述动作集用于指示对所述***状态的不同处理动作,所述动作集包括多个动作元素;
状态确定执行模块,用于根据所述动作集和所述第一数据确定***状态集合,所述***状态集合包括多个***状态。
所述不确定度确定模块包括:
时刻***状态获取模块,用于获取所述第一时刻对应的第一***状态和第二时刻对应的第二***状态,所述第一时刻早于所述第二时刻;
不确定度确定执行模块,用于获取所述第一***状态对应的第一初时不确定度和第二初时不确定度,所述第二***状态对应的第一延后不确定度和第二延后不确定度。
所述装置还包括:
质量值获取模块,用于获取质量值集合,所述质量值集合包括所述识别框架对应的若干个质量值;
相关系数集合确定模块,用于根据所述质量值集合和第一基准组合确定所述识别目标对应的相关系数集合;
第一相关系数获取模块,用于获取第一相关系数,所述第一相关系数为所述相关系数集合中数值最大的相关系数;
决策结果确定模块,用于确定所述第一相关系数对应的识别目标为最终决策结果。
以上对本申请所提供的一种信息融合处理方法及装置进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本申请的较佳实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种信息融合处理方法,其特征在于,所述方法包括:
获取第一数据,所述第一数据为由若干个检测设备获取的基于识别框架的基本概率分配值,所述识别框架包括若干个识别目标;
根据所述第一数据确定***状态,所述***状态与融合结果相互对应;
根据所述***状态确定第一不确定度和第二不确定度,所述第一不确定度用于指示基本概率分配的不确定性,所述第二不确定度用于指示逆基本概率分配的不确定性;
根据所述第一不确定度和所述第二不确定度确定奖励值;
根据所述奖励值确定第一选择值,根据所述第一选择值确定第一动作,所述第一选择值用于确定第一时刻对应的处理动作;
根据所述第一动作处理所述第一数据对应的融合结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一数据确定***状态包括:
获取动作集,所述动作集用于指示对所述***状态的不同处理动作,所述动作集包括多个动作元素;
根据所述动作集和所述第一数据确定***状态集合,所述***状态集合包括多个***状态。
3.根据权利要求2所述的方法,其特征在于,所述根据所述***状态确定第一不确定度和第二不确定度包括:
获取所述第一时刻对应的第一***状态和第二时刻对应的第二***状态,所述第一时刻早于所述第二时刻;
获取所述第一***状态对应的第一初时不确定度和第二初时不确定度,所述第二***状态对应的第一延后不确定度和第二延后不确定度。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一不确定度和所述第二不确定度确定奖励值包括:
根据所述第一初时不确定度与所述第一延后不确定度,所述第二初时不确定度和所述第二延后不确定度之间的大小关系,获取所述第一时刻对应的奖励值。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取质量值集合,所述质量值集合包括所述识别框架对应的若干个质量值;
根据所述质量值集合和第一基准组合确定所述识别目标对应的相关系数集合;
获取第一相关系数,所述第一相关系数为所述相关系数集合中数值最大的相关系数;
确定第一相关系数对应的识别目标为最终决策结果。
6.根据权利要求1所述的方法,其特征在于,所述根据所述第一动作处理所述第一数据对应的融合结果包括:
响应于所述第一动作指示所述第一数据对应的***状态处于冲突状态,删除所述第一数据对应的***状态。
7.一种信息融合处理装置,其特征在于,包括:
第一数据获取模块,用于获取第一数据,所述第一数据为由若干个检测设备获取的基于识别框架的基本概率分配值,所述识别框架包括若干个识别目标;
***状态确定模块,用于根据所述第一数据确定***状态,所述***状态与融合结果相互对应;
不确定度确定模块,用于根据所述***状态确定第一不确定度和第二不确定度,所述第一不确定度用于指示基本概率分配的不确定性,第二不确定度用于指示逆基本概率分配的不确定性;
奖励值确定模块,用于根据所述第一不确定度和所述第二不确定度确定奖励值;
第一选择值确定模块,用于根据所述奖励值确定第一选择值;
第一动作确定模块,用于根据所述奖励值确定第一选择值,根据所述第一选择值确定第一动作,所述第一选择值用于确定第一时刻对应的处理动作;
处理模块,用于根据所述第一动作处理所述第一数据对应的融合结果。
8.根据权利要求7所述装置,其特征在于,所述***状态确定模块包括:
动作集获取模块,用于获取动作集,所述动作集用于指示对所述***状态的不同处理动作,所述动作集包括多个动作元素;
状态确定执行模块,用于根据所述动作集和所述第一数据确定***状态集合,所述***状态集合包括多个***状态。
9.根据权利要求8所述装置,其特征在于,所述不确定度确定模块包括:
时刻***状态获取模块,用于获取所述第一时刻对应的第一***状态和第二时刻对应的第二***状态,所述第一时刻早于所述第二时刻;
不确定度确定执行模块,用于获取所述第一***状态对应的第一初时不确定度和第二初时不确定度,所述第二***状态对应的第一延后不确定度和第二延后不确定度。
10.根据权利要求7所述的装置,其特征在于,所述装置还包括:
质量值获取模块,用于获取质量值集合,所述质量值集合包括所述识别框架对应的若干个质量值;
相关系数集合确定模块,用于根据所述质量值集合和第一基准组合确定所述识别目标对应的相关系数集合;
第一相关系数获取模块,用于获取第一相关系数,所述第一相关系数为所述相关系数集合中数值最大的相关系数;
决策结果确定模块,用于确定第一相关系数对应的识别目标为最终决策结果。
CN202210915497.4A 2022-08-01 2022-08-01 一种信息融合处理方法及装置 Pending CN114997341A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210915497.4A CN114997341A (zh) 2022-08-01 2022-08-01 一种信息融合处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210915497.4A CN114997341A (zh) 2022-08-01 2022-08-01 一种信息融合处理方法及装置

Publications (1)

Publication Number Publication Date
CN114997341A true CN114997341A (zh) 2022-09-02

Family

ID=83022278

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210915497.4A Pending CN114997341A (zh) 2022-08-01 2022-08-01 一种信息融合处理方法及装置

Country Status (1)

Country Link
CN (1) CN114997341A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120233102A1 (en) * 2011-03-11 2012-09-13 Toyota Motor Engin. & Manufact. N.A.(TEMA) Apparatus and algorithmic process for an adaptive navigation policy in partially observable environments
CN107967487A (zh) * 2017-11-27 2018-04-27 重庆邮电大学 一种基于证据距离和不确定度的冲突数据融合方法
CN113283516A (zh) * 2021-06-01 2021-08-20 西北工业大学 一种基于强化学习和d-s证据理论的多传感器数据融合方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120233102A1 (en) * 2011-03-11 2012-09-13 Toyota Motor Engin. & Manufact. N.A.(TEMA) Apparatus and algorithmic process for an adaptive navigation policy in partially observable environments
CN107967487A (zh) * 2017-11-27 2018-04-27 重庆邮电大学 一种基于证据距离和不确定度的冲突数据融合方法
CN113283516A (zh) * 2021-06-01 2021-08-20 西北工业大学 一种基于强化学习和d-s证据理论的多传感器数据融合方法

Similar Documents

Publication Publication Date Title
CN107016464B (zh) 基于动态贝叶斯网络的威胁估计方法
Pietraszek et al. The estimation of accuracy for the neural network approximation in the case of sintered metal properties
CN115617882B (zh) 基于gan的带有结构约束的时序图数据生成方法及***
Krishnamurthy How to schedule measurements of a noisy Markov chain in decision making?
CN115795535A (zh) 一种提供自适应梯度的差分私有联邦学习方法及装置
CN115293235A (zh) 建立风险识别模型的方法及对应装置
KR102120150B1 (ko) 뉴럴 네트워크를 이용한 변분 추론 학습 방법 및 학습 장치, 그리고 이를 이용한 변분 추론 방법 및 장치
Liu et al. Information fusion to automatically classify post-event building damage state
CN114997341A (zh) 一种信息融合处理方法及装置
CN106228029B (zh) 基于众包的量化问题求解方法和装置
CN113065395A (zh) 一种基于生成对抗网络的雷达目标新类检测方法
Pekaslan et al. Noise parameter estimation for non-singleton fuzzy logic systems
CN110309562B (zh) 一种人为热增温效应的分析方法、装置及存储介质
CN112469072B (zh) 基于贝塞尔曲线更新的节点行为监测时长自适应调整方法
Pourabdollah et al. Real-world utility of non-singleton fuzzy logic systems: A case of environmental management
Hofmann A fuzzy belief-desire-intention model for agent-based image analysis
McNaught et al. Representing variable source credibility in intelligence analysis with Bayesian networks
Glinton et al. A markov random field model of context for high-level information fusion
JP2020035042A (ja) データ判定装置、方法、及びプログラム
US9858527B1 (en) Algorithmic method for modeling human decision-making
CN115497028B (zh) 基于事件驱动的动态隐匿目标检测与识别方法及装置
CN115424429B (zh) 基于深度强化学习的eco-cacc控制方法及***
CN113537299B (zh) 基于期望最大化高斯混合缩减的分布式贝叶斯滤波器目标跟踪方法
US20230126695A1 (en) Ml model drift detection using modified gan
Child et al. Rule value reinforcement learning for cognitive agents

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20220902