基于多智能体的编队协同空战战术规划
来源:六九路网
第17卷第2期 2010年2月 电光与控制 V01.17 No.2 Feb.2010 Electronics Optics&Control 基于多智能体的编队协同空战战术规划 欧建军,钟麟 710038) (空军工程大学工程学院,西安摘要:把编队看成一个多Agent系统,编队中的长机和僚机都看成是Agent。首先叙述了BDOTI—Agent的逻辑结 构,然后提出基于多Agent的编队协同空战战术规划合作求解的方法,合作求解过程分为任务形成、合作产生、团队初 步形成、任务分解、团队最终形成、角色指定和子任务分配、执行任务等7个阶段。最后举例说明了合作求解的过程。 关键词:飞机编队;协同空战;战术规划;多智能体 中图分类号:V271.4;TP182 文献标志码:A 文章编号:1671—637X(2010)02—0035一o4 Tactical Planning for Cooperative Air Combat of Formation Based on Multi--Agent System OU Jianjun,ZHONG Lin (Engineering Institute,Air Force Engineering University,Xi’/in 710038,China) Abstract:In our study,the aircraft formation is regarded as one multi—Agent system,and each one in the formation,including command plane and wing plane,is taken as one Agent.First,the logic structure of BDOTI—Agent is presented.Then,the solving method of the tactical planning for cooperative air combat based on multi-Agent system is put forward,which consists of seven phases.The seven phases are:mission forming,cooperation generating,original team forming,mission decomposition,final team forming,role appointment and sub-mission assignment,and mission execution.An example is given to illuminate the joint plan and solving method of tactical planning. Key words:aircraft formation;cooperative air combat;tactic planning;multi—Agent system 0引言 空战战术研究一直受到各国学者的高度重视。为 了充分发挥编队协同空战系统中己方各战斗机的潜 能,针对具体态势,编队和各机都产生相应的规划。如 何合理、高效地实施编队战术一直是编队协同空战的 源、攻击目标/规避目标并释放干扰、评估效果、再次攻 击、退出攻击。每架飞机在编队中具有不同的责任。 根据飞行员作战过程及在编队中的责任,建立基于 BDOTI—Agent(信念、愿望、责任、战术意图)单机Agent 的结构,如图1所示,它由7个模块组成:信念模块、目 标模块、责任模块、战术意图模块、解释器、计戈Ⅱ库和作 战协调模块。 热点之一…。文献[2—3]利用多智能体的理论来研 究多机协同空战,把编队中每一架飞机都可以看作一 1)信念模块。根据机载传感器对战场环境的探 测信息以及友机通过机载数据链传输的战场信息,主 要包括航向、位置、与其他飞机的相对方向、与其他飞 机之间的距离、其他飞机的航向、其他飞机的类型及气 个智能体,并提出了基于MAS的多机协同空战指挥控 制系统。在此基础上,本文进一步研究,提出基于多 Agent的编队协同空战战术规划合作求解的方法。 1单机智能体的结构 飞行员在空战中的决策过程可描述为:搜索目标、 截获目标、选择攻击方式和武器、选择规避方式和干扰 收稿日期:2008—11—24 火力指挥与控制。 象信息。Agent所掌握的信息都是以Agent为中心的, 同时它的信念的变化依赖于它的角色和位置感知。例 如,一架飞机被指定为僚机,它可能具有长机的位置和 航向的信念,同时其他的友机也可能会传输有关长机 的状态信息,这些都会影响到Agent的信念。 修回日期:2009一O1—14 作者简介:欧建军(1974一),男,陕西凤翔人,讲师,研究方向为航空 2)目标模块。存放本机所接受的上级下达的作 战任务信息和友机发出的请求支援信息。 36 电光与控制 第l7卷 3)责任模块。存放本机在当前状态下在编队中 的责任。 4)计划库。战术计划的集合。 5)解释器。根据我机当前对战场环境的信念、我 机作战任务或友机的协同请求以及作战准则和战术作 战的机动策略,推理出我机当前的作战意图,包括攻击 目标的选择和排序、机动攻击飞行路线选择、武器资源 的分配和武器投放、威胁规避方法和干扰源的选择与 释放、向友机发出协同请求或给下属作战飞机下达的 攻击指令。 6)意图模块。根据解释器的推理结果,将决策信 息输入到飞行控制、武器投放、电子干扰等执行机构, 并通过作战协调模块以及机载数据链传递给友机或下 属作战飞机。 7)作战协调模块。通过通信数据链,与友机(其 他Agent)进行协调,避免与友机产生冲突。 图1 BDOTI.Agent结构图 Fig.1 BDOTI—Agent logic stmcture 2群体Agent合作求解过程 群体Agent执行合作求解过程是对任务进行分解 分配,并根据已有的规则库,产生合作求解策略,共同 实现最终的目标。具体过程如下: 1)出现任务,产生合作需求; 2)形成初步团队; 3)如果任务可以分解,则执行4),否则,跳转到 6); 4)把任务分解成子任务; 5)重组团队,跳转到3); 6)形成最终团队,执行合作规划。 3编队协同战术规划 根据编队协同空战的特点,将基于多智能体的编 队协同战术规划的合作求解过程分为任务形成、合作 产生、团队初步形成、任务分解、团队最终形成、角色指 定和子任务分配、执行任务等7个阶段,流程图见图2。 图2合作求解流程图 Fig.2 Cooperative solving method 任务可能是预先制定的,也有可能是根据某些特 殊情况临时制定的。在描述合作动机产生过程时,首 先引入Able、Fit和Can 3个算子,并给出相应的性质。 然后利用模态算子描述编队的初步形成、任务分解、角 色指定和子任务分配以及团队的最终形成等阶段。特 别注明,文中用到的未定义的算子,如Achieves、M— Bel、Agt、Goal等算子在文献[3]中都有定义。 3.1 战术规划的合作求解动机的产生 先定义Able、Fit和Can 3个算子,它们的数学描 述如下。 定义1 (Able i )l= ∈Act(i)A(Achieves ) 如果Agent i有能力实现目标 ,则说明在i的计 划库中存在一个计划 ,使得当 执行以后, 会成立。 与文献[4]中有关Able算子的定义相比,该定义除去 了Agent的主观部分,将Agent的客观能力单独剥离出 来进行描述。 定义2(Agt g )f=(一(M_Bel g ) (LT/g ) 群体Agent g(多架飞机)参与目标 的实现,当且 仅当群体g中不存在关于 的相互信念,就会产生关 于 的群体战术意图,当g中的元素个数为1时,就退 化为Able算子。 定义3 (Fit i )I=Yp((Agt i )^ (Coal i ))一(Bel i P)一(Coal i P) 当Agent i参与到实现目标 时,对于任何可能产 生的后果P,都不是i不希望得到的。 定义4 (Can i )I=(Able i )^(Fit i ) 如果Agent i可以实现目标 ,则说明i既有能力, 第2期 欧建军等: 基于多智能体的编队协同空战战术规划 37 也适合实现目标 。这里引入Fit算子的目的在于描 Agent都承诺会实现目标 ,除非合作发起者i本身放 述Agent是否适合完成某目标,并在Fit和Able算子的 弃目标 或者预警机(地面指挥所)认为最终的任务 基础上,定义Can算子,引入“可以做”的概念,用于区 分配中不需要i,这里的群体g仅仅初步形成,不需要 分这3种不同的能力表现形式,进一步完善文献[4] 联合承诺。 对Agent能力的定义。 3.3任务分解、分配和角色指定 根据定义1和定义2,群体g的Able可以表示为 任务是否可分解是协同完成任务的关键,它可以 (J_- ble g )f=j Ej_Act(g)^(Achieves ) 描述为 如果Agent群体g有能力实现目标 ,则说明在g (Pre—Deci g)I= 口l,02,(Achieves口l;o2 )V 的联合计划库中存在一个联合计划 ,使得当 执行以 (Achieves口l 102 ) 后, 会成立。 这表明一个任务对于群体g是可分解的,当且仅当存 根据定义3,群体g的Fit算子可以表示为 在两个相对独立的计划,通过同时或者顺序执行,能实 (j_Fit g )l:V ∈g(Fit i ) 现目标 。利用前面的定义,可以将任务分解分配形 当且仅当g中每个Agent都适合实现目标 ,群体g适 式化表示如下: 合实现目标 。 (T_Deci g)l=(Can i )VS 根据定义4,群体g的Fit算子可以表示为 S=j i√Eg,o1,02∈ ct(g)(Bel (Pre Deci g) R) (j_Cal ̄g(D)I=(M_Bel g(j_Able g )^( Fit g )) R=((Achieves 0l l 02 )V(Achieves 01;口2 )^(Ml^ 如果Agent群体g可以实现目标 ,说明g相互相 ) 信自己既有能力,也适合实现目标 。由前面的叙述 Ml=]g。Cg(i∈g。)^(j_Can g。 )八 可知,如果Agent i希望通过合作完成目标 ,则需要满 (r_Deci(Do 0。)g1) 足以下条件: M2= g2Cg(i∈g )^(j_Cang )^ 1)Agent 有实现当前目标 的意图; ( ec (Do 02)g2) 2)Agent i认为不能单独完成目标 ,即没有能力 以上表明当Agent i分配任务时,如果能独立去做,则 独立完成目标 或不适合独立完成目标 ; 分配成功,如果Agent i认为任务可分解成。。和o 两 3)Agent i相信组成一个编队能完成目标妒,这个 个子任务,则从g中找出i和-『,使它们分别组织g的子 编队必须有能力完成目标而且适合独立完成。 集,继续分解和分配 。和o:。任务分解分配过程是一 根据以上描述,编队合作求解动机的产生表示为 个递归过程,它解决了文献[4]有关最小分配单元不 (Motive i )I=(Bel i一(Can i )^ 能独立完成的问题。对于编队协同空战必须指定长机 jg(止 g ))^(Coal i ) (L)、僚机(w)以及长机(LT)、僚机编队(wT)的角 Motive算子能描述Agent对完成目标后可能产生 色。根据协同作战能力(cca)的大小,指定角色。具体 的连锁反应的考虑,并决定是否“可以”完成目标。而 指定形式如下: 文献[3]设定的算子仅能描述Agent对完成目标所采 (cc。 >c∞岛)_(日eZ (Obl gl g2 LT c∞ )^ 取具体动作的考虑,对于如果Agent有能力单独完成, (Obl g2 gl WT cc0 )) 但认为不适合单独去完成且需要合作的情况,则无法 (CCtlj>cc0。)一÷(Bel i(Obl cc0 )^(Obl i L 给出其描述。 c。 ))。 3.2编队的初步产生 3.4编队的最终形成 动机产生后,就可以参与完成任务形成一个初步 编队的最终形成可以描述为 的编队,它可以表示为 (Team g f)l= (Pre—Team g i)I= (M_Bel g(j_Commit g (Goal i ))^(j_Can g Q)) (g_Bel g Q八(j_Can g p)) 此定义比Pre_Team条件更强,增加了联合承诺,且保 Q=Vj∈gj.一Commit(j R) 证g中每个成员都能对目标 的实现做出贡献。 R=Coal(i )^ (Bel (j g ∈g 八(Team g i))) 4战术规划合作求解举例 当Agent i产生了合作意向,向预警机(地面指挥 假设我方在预警机指挥下有3个编队在某区域进 所)发出请求,由预警机(地面指挥所)根据具体情况 行巡逻,其中编队1和编队2都有两架飞机,编队3有 和任务类型合理分配资源,形成初步群体g,g中的 4架飞机。当预警机发现有敌方两架飞机入侵此区 38 电光与控制 第17卷 一 ∞.Ⅲ)/稍 赠巡域,决定进行钳形拦截。把3个编队组成一个初步团 队,预警机发现编队1油量不足不具备拦截能力,编队 参考文献 ∞ ∞ 卯 O 卯3具备完成这项任务的能力,但距离目标和其他编队 较远不适合完成这项任务,只有编队2既有这种能力 也适合,预警机把任务下达给编队2。编队2把钳形拦 截任务分解成子任务:从左、右两个方向的捷径拦截, 钟麟.复杂条件下编队协同空战智能决策研究[D]. 西安:西北工业大学,2008. 刘金星,佟明安.基于Multi—Agent System的群机协同 空战指挥控制系统模型的研究[J].电光与控制,2001 (增刊):49-54. 然后攻击目标。子任务再分解为捷径机动、攻击机动、 发射导弹、制导导弹。根据协同作战能力,指定各机的 刘金星.基于MAS的多机协同空战指挥系统[D].西 安:西北工业大学,2004. SYCARA J K,WOOLDRIDGE M.A roadmap of agent 角色(长机和僚机)和各编队的角色(长机编队和僚机 编队),并把各子任务分配给各机和各编队。各机和各 编队根据任务制定计划和联合计划,执行各计戈Ⅱ。 research and development[J].Journal of Autonomous Agents and Multi—Agent Systems,1998(1):275—306. 5结束语 空战是一个极其复杂的过程。利用多智能体对编 _【_l-【r【r;彭军,吴敏.基于行为预测的多智能体协作模型[J]. 计算机工程与应用,2005,41(9):23-25. 刘金星,佟明安.编队作战的信息交互策略[J].系 rl 队协同指挥系统进行建模,很好地描述了空战指挥过 1 2 3 1J 4 5 6 7 1J 1J 1J1』统仿真学报,2003,15(12):1729-1732. 1j 8 程。本文根据BDOTI—Agent的逻辑结构,提出基于多 张雄安.2020年前机载武器火控系统发展战略研究 [J].电光与控制,2001(增刊):1-5. Agent的编队协同空战战术规划合作求解的方法,实现 了编队协同空战战术规划的模型化。今后研究的重点 蓝伟华.多目标攻击的基本概念及关键技术[J].电光 与控制,2000,7(4):19-22. 是模型的仿真和实现。 (上接第17页) Y坐标滤波误差均在100 m以内, 坐标滤波误差在 新的战斗机作战方式奠定了基础。 参考文献 [1] 文吉.机问数据链核心问题的分析与探讨[J].电讯技 术,2007(10):89-93. [2] 于雷.航空数据链支持下的战斗机战术引导理论与方 100 m以内,这样战斗机对目标机的定位几何精度就 达到了245 m,这对于空战普遍使用的空空导弹来说, 完全可以满足发射要求¨ ,证明在空战中借助于机间 数据链实现静默攻击方式是可行的。 方向速度滤波误差 法[D].西安:西北工业大学,2008. [3]张安,周志刚.航空综合火力控制原理[M].西安:西 北工业大学出版社,1997:9-59. [4]杨万海.多传感器数据融合及其应用[M].西安:西 安电子科技大学出版社,2004:23—51. [5]顾潮琪,周德云,曲艺海.一种精确跟踪机动目标的滤 波算法研究[J].电光与控制,2007,14(2):8-11. [6] 陈嘉鸿,韩九强,张新曼.机动目标跟踪的一种自适应 “当前”模型[J].控制与决策,2007(11):1213—1217. 图9 X方向速度滤波误差 Fig.9 Curve of speed filtering error in coordinate [7] 邵凝宁,姜长生.基于数据链的空战目标运动参数的 转换[J].电光与控制,2006,13(6):15-19. [8]张宗麟.惯性导航与组合导航[M].北京:航空工业 出版社,2000:259-260. 4结论 本文对基于数据链的战斗机引导误差进行了矢量 [9] 朱海.中远程空空导弹弹载数据链战技指标研究[J]. 飞行力学,2008(4):59-61. 分析,并对误差进行了处理,研究结果表明,此种攻击引 导方式可以达到较高的精度(245 m),在一定程度上验 证了静默攻击方式的可行性,同时为寻求网络化条件下 [10] 巴宏欣,赵宗贵,杨飞,等.机动目标的模糊自适应跟 踪算法[J].系统仿真学报,2004(6):1181—1183.