CN106953879A - 最优反应动态演化博弈模型的网络防御策略选取方法 - Google Patents

最优反应动态演化博弈模型的网络防御策略选取方法 Download PDF

Info

Publication number
CN106953879A
CN106953879A CN201710335128.7A CN201710335128A CN106953879A CN 106953879 A CN106953879 A CN 106953879A CN 201710335128 A CN201710335128 A CN 201710335128A CN 106953879 A CN106953879 A CN 106953879A
Authority
CN
China
Prior art keywords
defender
strategy
defence
best response
response dynamics
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710335128.7A
Other languages
English (en)
Inventor
张恒巍
王晋东
黄健明
韩继红
和志鸿
李福林
王衡军
张畅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PLA Information Engineering University
Original Assignee
PLA Information Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PLA Information Engineering University filed Critical PLA Information Engineering University
Priority to CN201710335128.7A priority Critical patent/CN106953879A/zh
Publication of CN106953879A publication Critical patent/CN106953879A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/20Network architectures or network communication protocols for network security for managing network security; network security policies in general
    • H04L63/205Network architectures or network communication protocols for network security for managing network security; network security policies in general involving negotiation or determination of the one or more network security mechanisms to be used, e.g. by negotiation between the client and the server or between peers or by selection according to the capabilities of the entities involved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1441Countermeasures against malicious traffic

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于计算机网络安全防御技术领域,具体的涉及一种最优反应动态演化博弈模型的网络防御策略选取方法包括:基于有限理性条件,利用最优反应动态学习机制,构建基于最优反应动态的攻防演化博弈模型;利用防御方策略选取动态演化过程及防御演化均衡点,对不同防御者之间防御策略选取问题进行了研究;在建立的最优反应动态演化博弈模型基础上,通过具体的算例对该模型进行分析与求解,推广演化博弈模型。本发明建立了有限理性条件下的非合作网络攻防演化博弈模型,通过安排防御方策略选取初始状态,经过不断演化,最优反应动态最终将会使博弈***达到某个稳定状态,从而得到最优防御策略,本发明提出的方法能够很好的应用于网络安全防御策略选取问题,对网络安全研究能够提供一定的指导意义。

Description

最优反应动态演化博弈模型的网络防御策略选取方法
技术领域
本发明属于计算机网络安全防御技术领域,具体的涉及一种最优反应动态演化博弈模型的网络防御策略选取方法。
背景技术
近年来,互联网的迅猛发展给人们的社会生活带来了巨大的变化,特别是“互联网+”战略将互联网的发展推向一个新的高潮。随着互联网的快速发展,网络空间安全问题也日益突出。网络安全问题已经非常严峻,针对境内外的各类网络攻击行为,如何加强网络安全防御成为当今时代亟需解决的问题,亟需能够对网络攻防行为进行分析和预测,进而实施主动安全防御的新技术。由于网络安全状态在本质上由攻防双方的对抗行为及其结果决定,并且网络攻防对抗中所具有的目标对立性、策略依存性和关系非合作性正是博弈论的基本特征,因此博弈论在网络安全领域的研究和应用日渐兴起,并且以采用经典传统博弈模型对网络安全行为进行分析为主。
但是,已有研究成果大都以传统博弈理论为基础,建立在参与者完全理性假设的前提下,而这样的假设与实际情况并不相符。其博弈模型与现实偏差较大,从而降低了安全防御策略选取方法的准确性和指导意义。针对以上问题,部分学者以有限理性为前提,采用演化博弈论应用于网络攻防分析。通过分析,演化博弈更加符合网络攻防对抗动态演化的现实,将攻防双方的行为模型化为具有某种适应性学习能力的渐进演化过程,采用典型的复制动态方程进行求解与分析。但复制动态学习机制存在学习速度慢、策略选取效率低等问题。
发明内容
本发明针对现有研究成果大都以传统博弈理论为基础,建立在参与者完全理性假设的前提下,而这样的假设与实际情况并不相符,存在若将其直接应用于网络攻防对抗演化博弈分析,将会存在学习周期过长、学习效率不高,这将很大程度上降低模型和方法的适用性问题,提出一种最优反应动态演化博弈模型的网络防御策略选取方法。
本发明的技术方案是:一种最优反应动态演化博弈模型的网络防御策略选取方法,包括以下步骤:
步骤1:基于有限理性条件,利用最优反应动态学习机制,构建基于最优反应动态的攻防演化博弈模型;
步骤2:利用防御方策略选取动态演化过程及防御演化均衡点,对不同防御者之间防御策略选取问题进行了研究;
步骤3:在建立的最优反应动态演化博弈模型基础上,通过具体的算例对该模型进行分析与求解,推广演化博弈模型。
所述的最优反应动态演化博弈模型的网络防御策略选取方法,所述步骤1中最优反应动态演化博弈模型可表示为四元组,BRDEGM=(D,DS,P,U)
D={d1,d2,…dn}表示防御参与者空间,其中,di表示防御者i,不同的防御者可以选取不同的防御策略;
DS={DS1,DS2,…DSm}表示防御者策略空间,不同的防御者共同享有该防御策略集;
P={p1,p2,…pm}表示防御者信念集合,其中,pi表示防御者选取防御策略DSi的概率;
U={U1,U2,…Um}表示收益函数集合,其中,Ui表示防御者选取防御策略DSi所获取的收益。
所述的最优反应动态演化博弈模型的网络防御策略选取方法,所述最优反应动态方程为其中Nt表示n个防御者中选取策略DS1的个数,DS1是可选策略集中的任意一个防御策略。
所述的最优反应动态演化博弈模型的网络防御策略选取方法,所述步骤2中防御方策略选取动态演化过程为:在网络攻防对抗过程中,不同防御策略之间存在一种竞争关系,高收益的防御策略将会淘汰掉收益较低的策略。
所述的最优反应动态演化博弈模型的网络防御策略选取方法,所述高收益的防御策略将会淘汰掉收益较低的策略中,收益矩阵为:其中,u1、u2分别为策略DS1、DS2的收益,a为u1、u2的差值。
所述的最优反应动态演化博弈模型的网络防御策略选取方法,所述步骤3中推广演化博弈模型主要为,当防御方存在任意n个防御者时,基于最优反应动态演化博弈模型,对任意两个防御策略DSi和DSj进行演化博弈分析,假设DSi是相对于DSj的优势策略,且i≠j,随着时间的推移,最终得到一定的演化规律。
所述的最优反应动态演化博弈模型的网络防御策略选取方法,所述演化规律为:对于存在n个防御者的防御方,当所有防御者在初次博弈中都选取防御策略DSi或者策略DSj时,采用最优反应动态学习机制,整个网络防御方的策略选取最终达到的稳定状态则为所有的防御者均选取策略DSi或者策略DSj
所述的最优反应动态演化博弈模型的网络防御策略选取方法,所述演化规律为:对于存在n个防御者的防御方,当n为奇数时,在初次博弈中,只要有一个防御者选取了策略DSi,通过最优反应动态学习机制对自身策略经过多个时期的反复调整,最终都会收敛于所有防御者选取策略DSi的稳定状态。
所述的最优反应动态演化博弈模型的网络防御策略选取方法,所述演化规律为:对于存在n个防御者的防御方,当n为偶数时,在初次博弈中,有一个防御者选取了防御策略DSi,其他防御者均选取策略DSj,那么,最优反应动态无法使所有防御者收敛于某个稳定状态,随着时间的演化,各防御者对策略的调整只能陷入周期循环变动。
所述的最优反应动态演化博弈模型的网络防御策略选取方法,所述演化规律为:对于存在n个防御者的防御方,在初次博弈中,只要存在两个相邻防御者同时选取了策略DSi,在最优反应动态学习机制下,随着时间的演化,最终会收敛于所有防御者全部选取策略DSi的稳定状态。
本发明的有益效果是:本发明建立了有限理性条件下的非合作网络攻防演化博弈模型,并对该模型进行了均衡分析与求解。在此基础上,从防御者角度出发,针对不同防御者之间的策略学习调整过程,采用最优反应动态学习机制,建立了防御者之间的多阶段重复动态演化博弈模型,对不同防御者之间防御策略选取问题进行了研究。在建立的最优反应动态演化博弈模型基础上,通过具体的算例对该模型进行了分析与求解,并将该模型作进一步推广,提高了模型的通用性。针对防御者个数奇偶性的不同,以及防御方策略选取初始状态的不同,都会影响整个博弈***的最终演化结果。通过安排防御方策略选取初始状态,经过不断演化,最优反应动态最终将会使博弈***达到某个稳定状态,从而得到最优防御策略。说明本发明提出的方法能够很好的应用于网络安全防御策略选取问题,对网络安全研究能够提供一定的指导意义。
附图说明
图1本发明的方法步骤示意框图;
图2网络防御者博弈树示意图;
图3初次博弈1个DS1的最优反应动态示意图;
图4初次博弈两个DS1的最优反应动态策略调整过程示意图;
图5初次博弈三个DS1的最优反应动态策略调整过程示意图;
图6当n为奇数,初始状态只有一个选DS1仿真效果示意图;
图7当n为奇数,初始状态存在两个相邻防御者选DS1仿真效果示意图。
具体实施方式
实施例1,结合图1-图7,一种最优反应动态演化博弈模型的网络防御策略选取方法,包括以下步骤:
步骤1:基于有限理性条件,利用最优反应动态学习机制,构建基于最优反应动态的攻防演化博弈模型;
步骤1中最优反应动态演化博弈模型可表示为四元组,BRDEGM=(D,DS,P,U)
D={d1,d2,…dn}表示防御参与者空间,其中,di表示防御者i,不同的防御者可以选取不同的防御策略;
DS={DS1,DS2,…DSm}表示防御者策略空间,不同的防御者共同享有该防御策略集;
P={p1,p2,…pm}表示防御者信念集合,其中,pi表示防御者选取防御策略DSi的概率;
U={U1,U2,…Um}表示收益函数集合,其中,Ui表示防御者选取防御策略DSi所获取的收益。
最优反应动态方程为其中Nt表示n个防御者中选取策略DS1的个数,DS1是可选策略集中的任意一个防御策略。
步骤2:利用防御方策略选取动态演化过程及防御演化均衡点,对不同防御者之间防御策略选取问题进行了研究;
步骤2中防御方策略选取动态演化过程为:在网络攻防对抗过程中,不同防御策略之间存在一种竞争关系,高收益的防御策略将会淘汰掉收益较低的策略;高收益的防御策略将会淘汰掉收益较低的策略中,收益矩阵为:其中,u1、u2分别为策略DS1、DS2的收益,a为u1、u2的差值。
步骤3:在建立的最优反应动态演化博弈模型基础上,通过具体的算例对该模型进行分析与求解,推广演化博弈模型。
步骤3中推广演化博弈模型主要为,当防御方存在任意n个防御者时,基于最优反应动态演化博弈模型,对任意两个防御策略DSi和DSj进行演化博弈分析,假设DSi是相对于DSj的优势策略,且i≠j,随着时间的推移,最终得到一定的演化规律。
进一步的:演化规律为:对于存在n个防御者的防御方,当所有防御者在初次博弈中都选取防御策略DSi或者策略DSj时,采用最优反应动态学习机制,整个网络防御方的策略选取最终达到的稳定状态则为所有的防御者均选取策略DSi或者策略DSj
进一步的,演化规律为:对于存在n个防御者的防御方,当n为奇数时,在初次博弈中,只要有一个防御者选取了策略DSi,通过最优反应动态学习机制对自身策略经过多个时期的反复调整,最终都会收敛于所有防御者选取策略DSi的稳定状态。
进一步的,演化规律为:对于存在n个防御者的防御方,当n为偶数时,在初次博弈中,有一个防御者选取了防御策略DSi,其他防御者均选取策略DSj,那么,最优反应动态无法使所有防御者收敛于某个稳定状态,随着时间的演化,各防御者对策略的调整只能陷入周期循环变动。
进一步的,演化规律为:对于存在n个防御者的防御方,在初次博弈中,只要存在两个相邻防御者同时选取了策略DSi,在最优反应动态学习机制下,随着时间的演化,最终会收敛于所有防御者全部选取策略DSi的稳定状态。
实施例2,结合图1-图7,一种最优反应动态演化博弈模型的网络防御策略选取方法,用于分析网络攻防演化博弈过程。由于常用的复制动态学习机制存在学习速度较慢,学习效率不高等问题,本发明仍然采用演化博弈的思想,基于有限理性条件,利用最优反应动态学习机制,构建基于最优反应动态的攻防演化博弈模型,分析防御方策略选取动态演化过程及防御演化均衡点,对不同防御者之间防御策略选取问题进行了研究。在建立的最优反应动态演化博弈模型基础上,通过具体的算例对该模型进行了分析与求解,并将该模型作进一步推广,提高了模型的通用性。本发明提出的方法能够很好的应用于网络安全防御策略选取问题,对网络安全研究能够提供一定的指导意义。
在网络攻防博弈***中,决策者通过不断试错、模仿和策略调整,从初始状态随着时间不断演化,最终能够达到某个演化稳定均衡,而决策者的策略学习方法及过程直接影响到最终的演化稳定状态。针对防御方,假设不同的防御者共享同一个防御策略集。由于不同的防御策略会给防御者带来不同的收益,在收益差异的牵引和学习机制的驱动下,低收益防御者不断学习收益高的防御者的策略。随着时间的演化,低收益的策略将会被高收益的策略所淘汰。针对现实的网络攻击行为,从防御方角度出发,根据不同防御者之间的协同关系,将最优反应动态学习机制运用于不同防御策略之间的博弈,建立多阶段最优反应动态重复演化博弈模型。在上述“学习—改进”机制的推动下,不同防御策略的选取概率呈现动态演化趋势,最终可以分析得到网络安全防御策略选取方法。
最优反应动态演化博弈模型
针对网络防御方,以演化博弈理论为基础,在有限理性的条件下,采用最优反应动态快速学习机制,构建不同防御者之间的最优反应动态演化博弈模型。
定义1最优反应动态演化博弈模型BRDEGM(Best-response DynamicsEvolutionary Game Model)可以表示为四元组,BRDEGM=(D,DS,P,U),其中
①D={d1,d2,…dn}表示防御参与者空间。其中,di表示防御者i,不同的防御者可以选取不同的防御策略。
②DS={DS1,DS2,…DSm}表示防御者策略空间。不同的防御者共同享有该防御策略集。
③P={p1,p2,…pm}表示防御者信念集合。其中,pi表示防御者选取防御策略DSi的概率。
④U={U1,U2,…Um}表示收益函数集合。其中,Ui表示防御者选取防御策略DSi所获取的收益。
在网络攻防对抗过程中,不同防御策略之间存在一种竞争关系,高收益的防御策略将会淘汰掉收益较低的策略。针对任意两个防御者d1和d2,假设DS1、DS2是可选策略集中的任意两个防御策略,其中DS1是相较DS2的优势策略,即策略DS1比DS2有更好的防御效果,会带来更高的防御收益,但DS1所对应的防御成本比DS2高。采用最优反应动态快速学习机制,建立有限理性条件下的演化博弈模型。博弈树如图2所示。
当博弈双方分别选取策略DS1和DS2时,选取DS1将获取更高的防御收益,记成本高出部分为α,此时,选取策略DS1的防御者获得收益u2-α,而选取策略DS2的防御者因为搭便车等行为则获取了更高的收益,记为u2+a。其中,u1-u2>>a。
从得益矩阵可以看出,该博弈中存在两个纯策略纳什均衡(DS1,DS1)和(DS2,DS2),其中(DS1,DS1)是帕累托上策均衡。但是如果还要考虑防御者之间的信任关系,或者对风险敏感性等因素,则均衡(DS2,DS2)出现的可能性会更大。
基于以上博弈条件,假设所有的防御者都处于一个圆周之上,每个防御者与各自的左右邻居进行重复博弈,学习比自身策略收益高的防御策略。记博弈双方所获的收益分别为∏1和∏2,设pi(t)为在t时期,博弈者i的邻居中选取策略DS1的数量,该数量可能的取值有0、1、2三种情况。由此可得,博弈者选取策略DS1时所获收益为∏1=u1×pi(t)+(u2-a)×[2-pi(t)],选取策略DS2时所获收益为∏2=(u2-a)×pi(t)+u2×[2-pi(t)]。根据最优反应动态机制可知,当∏1>∏2,即时,博弈者将在下一博弈阶段选取策略DS2。由此可以得到以下最优反应动态方程。
其中,Nt表示n个防御者中选取策略DS1的个数。通过该博弈动态方程可知,网络防御策略选取的最终稳定状态将是对于防御策略选取的某种趋势。
演化博弈模型分析与求解
基于以上建立的最优反应动态演化博弈模型,对防御者之间的策略学习过程进行详细的描述与分析。在网络攻防对抗中,由于防御者都是有限理性的,并且具有快速学习的能力,能够对上一阶段的博弈结果进行分析总结,并立刻做出相应的策略调整,实现下一阶段的防御收益最大化。随着时间的推移,整个防御方的策略选取将会达到一个稳定的状态。
下面将采用从特殊到一般的思路,采用最优反应动态学习机制,对圆周博弈进行具体分析。
假设防御方具有5个防御者,且5个防御者分布于圆周上5个不同的位置,如图3所示,每个位置上的防御者既可以选取策略DS1,也可以选取策略DS2,因此,该博弈具有32个初始状态,其中包括一个全部选取策略DS1,一个全部选取策略DS2,剩下30个均包含DS1和DS2两种策略。
pi(t)为在t时期,博弈者i的邻居中选取策略DS1的数量,该数量可能的取值有0、1、2三种情况。相应地,选取策略DS2的邻居数量为1-pi(t),同样存在0、1、2三种取值。根据最优反应动态机制可知,当∏1>∏2,即时,博弈者将在下一博弈阶段选取策略DS2。已知u1-u2>>α,则由于pi(t)只存在0、1、2三种取值,如果在t时期博弈者i的两个邻居中只要有一个选取了策略DS1,则博弈者i在t+1时期就会选取DS1策略;如果两个邻居都没有选取策略DS1,则博弈者i在t+1时期就会选取DS2策略。由此可以得出,当5个防御者初次全部选取DS1策略(DS2策略)时,最终的稳定状态为所有防御者均选取DS1策略(DS2策略)。
如果在初次博弈中有1个防御者选取了DS1策略,而其他防御者均采用DS2策略的时,那么这5个防御者经过4个时期的反复策略调整,最终收敛到了所有防御者都采用DS1策略的稳定状态。如图3所示,对于给定防御方的初始状态(DS1,DS2,DS2,DS2,DS2),经过4次的阶段演化,防御方最终达到了稳定状态(DS1,DS1,DS1,DS1,DS1)。
由图3中的最优反应动态调整过程可以看出,已经包含了有两个不相邻防御者采用DS1、三个非相邻博弈者采用DS1、四个防御者采用DS1这几种初次博弈情况的最优反应动态调整过程,它们分别需要三个、两个和一个阶段的调整即可达到全部采用DS1策略的稳定状态。下面对初次博弈中有两个非相邻防御者和三个相邻防御者采用DS1的情况进行分析。
由图4可知,两个相邻防御者采用DS1的最优反应动态策略调整过程只需两个阶段即可达到所有防御者选取DS1策略的稳定状态。由图5可知,三个相邻防御者采用DS1的最优反应动态策略调整过程只需一个阶段即可达到所有防御者选取DS1策略的稳定状态。
由以上分析可知,32种可能的初次博弈情况中,只有一种是演化稳定于所有防御者选取策略DS2,其余31种最终都会收敛于全部选取DS1的状态。说明所有防御者选取策略DS1或DS2属于该博弈过程中的稳定状态,但收敛于DS1的概率要远远大于DS2
进一步理解上述两个演化稳定状态,如果防御方在达到所有防御者选取策略DS1的稳定状态下,出现少数防御者偏离策略DS1的情况,最优反应动态会使防御者的策略很快收敛到都选取DS1的状态。因此,所有防御者都选取DS1的稳定状态是具有稳定性的。相反,当达到所有防御者选取DS2的稳定状态却不是稳健的,因为一旦某个防御者偏离DS2,最优反应动态会使防御方的状态离该稳定状态越来越远,因此该均衡并不是真正稳定的。随着长时间的演化,防御者最终将都会选取策略DS1
演化博弈模型的推广
由于在实际的网络防御过程中,防御方由多个防御者构成,因此必须对该博弈模型作进一步推广,即当防御方存在任意n个防御者时,基于以上快速反应动态演化博弈模型,对任意两个防御策略DSi和DSj进行演化博弈分析(假设DSi是相对于DSj的优势策略,且i≠j),随着时间的推移,最终得到一定的演化规律。针对以上特定数目网络防御者的演化博弈分析,通过进一步分析总结,可以得到以下命题。
命题1:对于存在n个防御者的防御方,当所有防御者在初次博弈中都选取防御策略DSi(策略DSj)时,采用最优反应动态学习机制,整个网络防御方的策略选取最终达到的稳定状态则为所有的防御者均选取策略DSi(策略DSj)。
命题2:对于存在n个防御者的防御方,当n为奇数时,在初次博弈中,只要有一个防御者选取了策略DSi,通过最优反应动态学习机制对自身策略经过多个时期的反复调整,最终都会收敛于所有防御者选取策略DSi的稳定状态。
命题3:对于存在n个防御者的防御方,当n为偶数时,在初次博弈中,有一个防御者选取了防御策略DSi,其他防御者均选取策略DSj,那么,最优反应动态无法使所有防御者收敛于某个稳定状态,随着时间的演化,各防御者对策略的调整只能陷入周期循环变动。
命题4:对于存在n个防御者的防御方,在初次博弈中,只要存在两个相邻防御者同时选取了策略DSi,在最优反应动态学习机制下,随着时间的演化,最终会收敛于所有防御者全部选取策略DSi的稳定状态。
命题5:对于存在n个防御者的防御方,如果通过安排防御者在初次博弈中的策略,经过不断的动态演化,使得该博弈***到达某一阶段时,出现了上述四个命题中的某个情形,后期将会出现同样的演化过程。
数值仿真
基于以上建立的网络攻防演化博弈,利用***动力学进行实验仿真,验证网络攻防演化博弈模型和最优反应动态演化博弈模型的有效性与合理性。防御方选取不同的防御初始状态,整个博弈***将会产生不同的演化结果。下面将针对防御方的不同防御初始状态,进行具体的数值仿真。本发明将以命题2和命题4作为仿真对象。
(1)当n为奇数,且防御方初始状态为只有一个防御者选取策略DS1,其他防御者均选取策略DS2时,取n=21,则选取策略DS1的防御者所占比例为选取策略DS2的防御者所占比例为此时,该博弈***中防御者之间存在调整改变自身策略的动力。通过***仿真,发现防御方选取策略DS1的防御者比例成线性增长,而选取策略的DS2防御者比例成线性减少,且在第10次仿真结果中就已经达到了最终的演化稳定状态。具体如图6所示。该演化结果可以是***稳定状态中的一种,此时DS1为最优防御策略。
(2)当n为奇数,且防御方初始状态中存在两个相邻防御者同时选取策略DS1,其他防御者均选取策略DS2时,取n=21,则选取策略DS1的防御者所占比例为选取策略DS2的防御者所占比例为此时,该博弈***中防御者之间存在调整改变自身策略的动力。通过不断演化,防御方选取策略DS1的防御者比例成线性增长,而选取策略的DS2防御者比例成线性减少,且在第10次仿真结果中达到最终演化稳定状态。具体如图7所示。该演化结果可以是***稳定状态中的一种,此时DS1为最优防御策略。
根据以上仿真结果可知,针对防御者个数奇偶性的不同,以及防御方策略选取初始状态的不同,都会影响整个博弈***的最终演化结果。通过安排防御方策略选取初始状态,经过不断演化,最优反应动态最终将会使博弈***达到某个稳定状态。将实验结果与本文模型推理进行对比,可以看出实验***中的演化结果与文中的理论分析保持一致,说明该演化博弈模型符合现实***演化规律,从而验证了本模型的现实有效性。可以将其应用于现实的网络攻防对抗中,对防御方的联合防御进行具体分析与预测,为防御方的策略选取提供有力的支撑。

Claims (10)

1.一种最优反应动态演化博弈模型的网络防御策略选取方法,其特征在于:包括以下步骤:
步骤1:基于有限理性条件,利用最优反应动态学习机制,构建基于最优反应动态的攻防演化博弈模型;
步骤2:利用防御方策略选取动态演化过程及防御演化均衡点,对不同防御者之间防御策略选取问题进行了研究;
步骤3:在建立的最优反应动态演化博弈模型基础上,通过具体的算例对该模型进行分析与求解,推广演化博弈模型。
2.根据权利要求1所述的最优反应动态演化博弈模型的网络防御策略选取方法,其特征在于:所述步骤1中最优反应动态演化博弈模型可表示为四元组,BRDEGM=(D,DS,P,U)
D={d1,d2,…dn}表示防御参与者空间,其中,di表示防御者i,不同的防御者可以选取不同的防御策略;
DS={DS1,DS2,…DSm}表示防御者策略空间,不同的防御者共同享有该防御策略集;
P={p1,p2,…pm}表示防御者信念集合,其中,pi表示防御者选取防御策略DSi的概率;
U={U1,U2,…Um}表示收益函数集合,其中,Ui表示防御者选取防御策略DSi所获取的收益。
3.根据权利要求1所述的最优反应动态演化博弈模型的网络防御策略选取方法,其特征在于:所述最优反应动态方程为其中Nt表示n个防御者中选取策略DS1的个数,DS1是可选策略集中的任意一个防御策略。
4.根据权利要求1所述的最优反应动态演化博弈模型的网络防御策略选取方法,其特征在于:所述步骤2中防御方策略选取动态演化过程为:在网络攻防对抗过程中,不同防御策略之间存在一种竞争关系,高收益的防御策略将会淘汰掉收益较低的策略。
5.根据权利要求4所述的最优反应动态演化博弈模型的网络防御策略选取方法,其特征在于:所述高收益的防御策略将会淘汰掉收益较低的策略中,收益矩阵为:
其中,u1、u2分别为策略DS1、DS2的收益,a为u1、u2的差值。
6.根据权利要求1所述的最优反应动态演化博弈模型的网络防御策略选取方法,其特征在于:所述步骤3中推广演化博弈模型主要为,当防御方存在任意n个防御者时,基于最优反应动态演化博弈模型,对任意两个防御策略DSi和DSj进行演化博弈分析,假设DSi是相对于DSj的优势策略,且i≠j,随着时间的推移,最终得到一定的演化规律。
7.根据权利要求6所述的最优反应动态演化博弈模型的网络防御策略选取方法,其特征在于:所述演化规律为:对于存在n个防御者的防御方,当所有防御者在初次博弈中都选取防御策略DSi或者策略DSj时,采用最优反应动态学习机制,整个网络防御方的策略选取最终达到的稳定状态则为所有的防御者均选取策略DSi或者策略DSj
8.根据权利要求6所述的最优反应动态演化博弈模型的网络防御策略选取方法,其特征在于:所述演化规律为:对于存在n个防御者的防御方,当n为奇数时,在初次博弈中,只要有一个防御者选取了策略DSi,通过最优反应动态学习机制对自身策略经过多个时期的反复调整,最终都会收敛于所有防御者选取策略DSi的稳定状态。
9.根据权利要求6所述的最优反应动态演化博弈模型的网络防御策略选取方法,其特征在于:所述演化规律为:对于存在n个防御者的防御方,当n为偶数时,在初次博弈中,有一个防御者选取了防御策略DSi,其他防御者均选取策略DSj,那么,最优反应动态无法使所有防御者收敛于某个稳定状态,随着时间的演化,各防御者对策略的调整只能陷入周期循环变动。
10.根据权利要求6所述的最优反应动态演化博弈模型的网络防御策略选取方法,其特征在于:所述演化规律为:对于存在n个防御者的防御方,在初次博弈中,只要存在两个相邻防御者同时选取了策略DSi,在最优反应动态学习机制下,随着时间的演化,最终会收敛于所有防御者全部选取策略DSi的稳定状态。
CN201710335128.7A 2017-05-12 2017-05-12 最优反应动态演化博弈模型的网络防御策略选取方法 Pending CN106953879A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710335128.7A CN106953879A (zh) 2017-05-12 2017-05-12 最优反应动态演化博弈模型的网络防御策略选取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710335128.7A CN106953879A (zh) 2017-05-12 2017-05-12 最优反应动态演化博弈模型的网络防御策略选取方法

Publications (1)

Publication Number Publication Date
CN106953879A true CN106953879A (zh) 2017-07-14

Family

ID=59479620

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710335128.7A Pending CN106953879A (zh) 2017-05-12 2017-05-12 最优反应动态演化博弈模型的网络防御策略选取方法

Country Status (1)

Country Link
CN (1) CN106953879A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107483486A (zh) * 2017-09-14 2017-12-15 中国人民解放军信息工程大学 基于随机演化博弈模型的网络防御策略选取方法
CN107566387A (zh) * 2017-09-14 2018-01-09 中国人民解放军信息工程大学 基于攻防演化博弈分析的网络防御行动决策方法
CN108182536A (zh) * 2017-12-28 2018-06-19 东北大学 一种基于有限理性的配电网cps安全防御方法
CN108541071A (zh) * 2018-04-10 2018-09-14 清华大学 基于双层博弈的无线通信***多用户资源分配***
CN108833402A (zh) * 2018-06-11 2018-11-16 中国人民解放军战略支援部队信息工程大学 一种基于有限理性博弈理论的网络最优防御策略选取方法及装置
CN110087194A (zh) * 2019-04-25 2019-08-02 东华大学 车联网中基于博弈的位置数据中毒攻击原型***
CN110381020A (zh) * 2019-06-13 2019-10-25 长沙理工大学 一种ids资源配置方法、装置和计算机可读存储介质
CN111224966A (zh) * 2019-12-31 2020-06-02 中国人民解放军战略支援部队信息工程大学 基于演化网络博弈的最优防御策略选取方法
CN111245857A (zh) * 2020-01-17 2020-06-05 安徽师范大学 一种区块链环境下通道网络稳态演化博弈方法
CN112989357A (zh) * 2021-03-09 2021-06-18 中国人民解放军空军工程大学 基于信号博弈模型的多阶段平台动态防御方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101808020A (zh) * 2010-04-19 2010-08-18 吉林大学 基于不完全信息动态博弈的入侵响应决策方法
CN103152345A (zh) * 2013-03-07 2013-06-12 南京理工大学常熟研究院有限公司 一种攻防博弈的网络安全最优攻防决策方法
CN103384384A (zh) * 2013-07-19 2013-11-06 哈尔滨工程大学 一种基于动态演化的认知中继网络信任管理装置及方法
CN105682174A (zh) * 2016-01-15 2016-06-15 哈尔滨工业大学深圳研究生院 促进节点合作的机会网络演化算法及装置
US9471777B1 (en) * 2012-02-24 2016-10-18 Emc Corporation Scheduling of defensive security actions in information processing systems
CN106550373A (zh) * 2016-09-30 2017-03-29 天津大学 基于演化博弈的无线传感器网络数据融合精确度模型

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101808020A (zh) * 2010-04-19 2010-08-18 吉林大学 基于不完全信息动态博弈的入侵响应决策方法
US9471777B1 (en) * 2012-02-24 2016-10-18 Emc Corporation Scheduling of defensive security actions in information processing systems
CN103152345A (zh) * 2013-03-07 2013-06-12 南京理工大学常熟研究院有限公司 一种攻防博弈的网络安全最优攻防决策方法
CN103384384A (zh) * 2013-07-19 2013-11-06 哈尔滨工程大学 一种基于动态演化的认知中继网络信任管理装置及方法
CN105682174A (zh) * 2016-01-15 2016-06-15 哈尔滨工业大学深圳研究生院 促进节点合作的机会网络演化算法及装置
CN106550373A (zh) * 2016-09-30 2017-03-29 天津大学 基于演化博弈的无线传感器网络数据融合精确度模型

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107566387B (zh) * 2017-09-14 2020-01-10 中国人民解放军信息工程大学 基于攻防演化博弈分析的网络防御行动决策方法
CN107566387A (zh) * 2017-09-14 2018-01-09 中国人民解放军信息工程大学 基于攻防演化博弈分析的网络防御行动决策方法
CN107483486A (zh) * 2017-09-14 2017-12-15 中国人民解放军信息工程大学 基于随机演化博弈模型的网络防御策略选取方法
CN107483486B (zh) * 2017-09-14 2020-04-03 中国人民解放军信息工程大学 基于随机演化博弈模型的网络防御策略选取方法
CN108182536A (zh) * 2017-12-28 2018-06-19 东北大学 一种基于有限理性的配电网cps安全防御方法
CN108182536B (zh) * 2017-12-28 2021-11-16 东北大学 一种基于有限理性的配电网cps安全防御方法
CN108541071A (zh) * 2018-04-10 2018-09-14 清华大学 基于双层博弈的无线通信***多用户资源分配***
CN108541071B (zh) * 2018-04-10 2019-03-01 清华大学 基于双层博弈的无线通信***多用户资源分配***
CN108833402A (zh) * 2018-06-11 2018-11-16 中国人民解放军战略支援部队信息工程大学 一种基于有限理性博弈理论的网络最优防御策略选取方法及装置
CN108833402B (zh) * 2018-06-11 2020-11-24 中国人民解放军战略支援部队信息工程大学 一种基于有限理性博弈理论的网络最优防御策略选取方法及装置
CN110087194B (zh) * 2019-04-25 2021-05-11 东华大学 车联网中基于博弈的位置数据中毒攻击原型***
CN110087194A (zh) * 2019-04-25 2019-08-02 东华大学 车联网中基于博弈的位置数据中毒攻击原型***
CN110381020A (zh) * 2019-06-13 2019-10-25 长沙理工大学 一种ids资源配置方法、装置和计算机可读存储介质
CN111224966A (zh) * 2019-12-31 2020-06-02 中国人民解放军战略支援部队信息工程大学 基于演化网络博弈的最优防御策略选取方法
CN111224966B (zh) * 2019-12-31 2021-11-02 中国人民解放军战略支援部队信息工程大学 基于演化网络博弈的最优防御策略选取方法
CN111245857A (zh) * 2020-01-17 2020-06-05 安徽师范大学 一种区块链环境下通道网络稳态演化博弈方法
CN111245857B (zh) * 2020-01-17 2021-11-26 安徽师范大学 一种区块链环境下通道网络稳态演化博弈方法
CN112989357A (zh) * 2021-03-09 2021-06-18 中国人民解放军空军工程大学 基于信号博弈模型的多阶段平台动态防御方法

Similar Documents

Publication Publication Date Title
CN106953879A (zh) 最优反应动态演化博弈模型的网络防御策略选取方法
Holcomb et al. Overview on deepmind and its alphago zero ai
CN107566387B (zh) 基于攻防演化博弈分析的网络防御行动决策方法
CN110334814A (zh) 用于构建风险控制模型的方法和***
Brzezinski In quest of national security
Deng et al. Stratified and maximum information item selection procedures in computer adaptive testing
CN110083748A (zh) 一种基于自适应动态规划与蒙特卡罗树搜索的搜索方法
CN105678401A (zh) 一种基于策略适应性差分进化的全局优化方法
CN110417733A (zh) 基于qbd攻防随机演化博弈模型的攻击预测方法、装置及***
Ji et al. Effects of dynamical grouping on cooperation in n-person evolutionary snowdrift game
Chartier et al. Bracketology: How can math help?
CN114070655B (zh) 网络流量检测规则生成方法及装置、电子设备、存储介质
CN112870722A (zh) 对战格斗类ai游戏模型的生成方法、装置、设备及介质
Li et al. Nonlinear Random Matrix Model and Research for Quantitative Representation of Volleyball Attacker’s Action Links
Li et al. Amazon Chess Based on UCT-PVS Hybrid Algorithm
CN115187409A (zh) 能源投资策略的确定方法、装置、电子设备及存储介质
POLAT et al. An examination of the us-china trade war within the framework of game theory
Zhang et al. Discussion on the design of computer games system based on surakarta
CN114169098B (zh) 基于捕食者策略和粒子群算法的先进安注箱参数优化方法
Chen et al. An Empirical Evaluation of Applying Deep Reinforcement Learning to Taiwanese Mahjong Programs
Chen et al. Research on turn-based war chess game based on reinforcement learning
Ye et al. COOPERATION AND COMPETITION IN HISTORY-DEPENDENT PARRONDO'S GAME ON NETWORKS
Fu et al. Amazon game system design and realization based on staged UCT algorithm
McLean Challenges in the Asia-Pacific Strategic Environment & Imperatives for Cooperation.
Mei et al. Research on modular evaluation system of computer game code

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170714

RJ01 Rejection of invention patent application after publication