基于累积前景理论和三支决策的无人机态势评估
Unmanned Aerial Vehicle Situation Assessment Based on Cumulative Prospect Theory and Three-Way Decision
责任编辑: 孙伟
收稿日期: 2021-10-8
基金资助: |
|
Received: 2021-10-8
作者简介 About authors
李伟湋(1981-),女,湖北省宜昌市人,副研究员,从事机器学习、软件智能化等方向研究;E-mail:
现有的无人机态势评估方法没有考虑复杂外界环境对决策者的影响,并且通常只能得到评估的排序结果,决策者需要在短时间内进行决策,常出现误判或错失打击窗口期.针对该问题,提出一种基于累积前景理论的三支决策模型.首先,通过直觉模糊接近于理想值的排序方法求取目标的条件概率, 得到态势评估结果;之后基于累积前景理论对无人机获取的直觉模糊态势信息进行计算,得到每个目标执行不同动作时对应的累积前景价值;最后,基于累积前景价值最大化的原则,推导出新的三支决策规则,对态势评估结果进行三支划分.实验分析表明:该方法不仅得到了目标威胁排序,而且对目标威胁等级进行客观分类;同时在评估过程中考虑决策者的心理,得到符合决策者特质的目标威胁评估结果,为复杂多变的空战提供一种合理的决策支持.
关键词:
General uninhabited aerial vehicle (UAV) situation assessment methods do not consider the influence of complex external environment on the decision-maker, and usually only get the ranking results of the evaluation. Since the decision-maker needs to make decisions in a short period of time, misjudgments or missing strike windows often occur. To address this problem, a three-way decision model based on the cumulative prospect theory is proposed. First, the method the utilizes intuitionistic fuzzy technique for order preference by similarity to an ideal solution to estimate the conditional probability of each target and obtains the situation assessment result. Next, the method calculates the intuitionistic fuzzy situation information obtained by the UAV based on the cumulative prospect theory, and obtains the corresponding cumulative prospect value when each target performs different actions. Finally, based on the principle of maximizing the cumulative prospect value, a new three-way decision rule is derived to divide the situational assessment results into three regions. The experimental analysis shows that the method not only obtains the target threat ranking, but also classifies the target threat level objectively. At the same time, it considers the psychology of the decision-maker in the assessment process, and obtains the target threat assessment results that meet the traits of the decision-maker, providing a reasonable decision support for the complex and changing air combat.
Keywords:
本文引用格式
李伟湋, 高培雪, 陈进, 路玉卿.
LI Weiwei, GAO Peixue, CHEN Jin, LU Yuqing.
随着科技发展,无人机作战成为现代战争中不可或缺的一环,已逐步应用于战争中的侦查、评估和监听等各个方面.无人机态势评估是指评估敌我双方的战斗力要素,对整体战场态势进行判断,帮助飞行员做出正确决策.对敌机态势进行合理评估是进行火力分配和机动决策的前提,在战争中发挥着关键作用.在评估过程中,无人机本身动力较小,容易受天气、地形等环境因素影响.同时,无人机控制系统难以自主处理飞行过程中的突发事件[1].因此,深入研究无人机态势评估刻不容缓.
近年来,众多学者对无人机态势评估展开研究,提出了多种态势评估方法.较为常见的有以下几种:文献[2]提出了一种基于贝叶斯网络的态势评估方法;文献[3]构建云模型得到目标威胁评估云图,实现了威胁评估;文献[4]为了提高空战中目标威胁评估模型的精度,构建极限学习机来解决态势评估问题.无人机态势评估是信息融合的过程,将多种低层次的信息融合为高层次的信息,从而对目标进行态势评估,得到威胁排序结果.因此,在一些研究中,将无人机态势评估视为一种群体决策[5]或多属性决策[6]的问题.由于作战环境日趋复杂,且无人机容易受到环境影响,导致态势信息具有明显的不确定性和模糊性.为解决该问题,文献[6]用直觉模糊集来处理信息的不确定性,使用隶属度函数精确地描述了不确定信息,将其用于评估空中目标威胁程度.文献[7]采用直觉模糊熵计算目标属性权重,引入直觉模糊多准则妥协解排序(VIKOR)方法用以解决多目标威胁评估问题.文献[5]将群体决策模型应用到目标威胁评估上,之后,文献[8]针对目标威胁评估只能得到威胁排序需要进一步研究是否应该攻击目标的问题,在直觉模糊环境下提出了一种基于三支决策的目标威胁评估算法.同时,文献[9]将前景理论引入到决策问题中,文献[10]将前景理论运用到空战目标威胁评估中,文献[11]进而提出一种基于前景理论和VIKOR法的威胁评估方法.
但当前的无人机态势评估过程仍然存在以下两个问题:其一,当前多数的态势评估方法只能得到评估的排序结果,仍需飞行员主观地选择优先攻击的目标和数量,并且飞行员在决策过程中多为二支决策,即判断是否对敌机进行攻击,对于中等威胁的目标,需要更多的信息进行判断,评估过程复杂,容易出现误判,易导致决策错误;其二,外界的复杂环境会影响飞行员的个人偏好,不同的飞行员心理偏好不同,在整个空战过程中,同一飞行员的心理倾向也会发生变化,而以往的评估过程中没有考虑决策者的主观偏好和风险态度,不能反映出真实的作战场景.
针对上述问题,提出一种基于三支决策和累积前景价值理论的态势评估方法.首先利用三支决策模型进行态势评估,该模型在传统决策问题的基础上,为不确定性结果增加了延迟决策的选择,更加符合人的决策认知;然后引入累积前景理论体现飞行员偏好的不确定性,在此过程中使用记分函数将直觉模糊数转换为实数,从而计算指标平均值,利用指标平均值和正负理想点得到参考点;为建立基于累积前景理论的三支决策模型,根据损失和结果之间的数量关系,得到对应的结果矩阵,之后通过比较一个目标的3种累积前景价值进行快速决策.此外,为了考虑不同类型飞行员面对相同战场态势时的区别,得出与实战情景相符的评估结果,对3种类型的飞行员进行实验,得到不同的评估结果.
1 相关理论
1.1 直觉模糊集
直觉模糊集中的元素被称为直觉模糊数.设E=(μE, vE)和F=(μF, vF)是两个直觉模糊数,与直觉模糊集的定义类似,μE、vE和πE分别为直觉模糊数E的隶属度、非隶属度和犹豫度,μF、vF和πF分别为直觉模糊数F的隶属度、非隶属度和犹豫度;其中,πE=1-μE-vE,πF=1-μF-vF.常见运算为
式中:d(E, F)为距离函数,用于计算两个直觉模糊数之间的距离;S(E)为记分函数.
1.2 三支决策
三支决策理论的基本思想是在实体评价函数上引入两个阈值,并构造所需的3个域,分别为正域、负域和边界域,这3个域可以分别解释为接受、拒绝和不承诺.根据贝叶斯决策过程,决策粗糙集由2个状态和3种行动组成[12], 构造状态集和动作集,状态集Ω={C, ¬C}表示对象属于集合C和不属于集合C,动作集AC={aP, aB, aN},aP、aB和aN分别表示接受、进一步研究和拒绝动作,下标P、B和N分别为对象x采取接受、进一步研究和拒绝动作.不同状态下执行不同的动作会存在不同的损失,对应的损失函数矩阵如表1所示.其中,λPP、λBP和λNP分别为在状态C中的对象采取接受、进一步研究和拒绝动作时的损失;λPN、λBN和λNN分别为不在状态C中的对象采取接受、进一步研究和拒绝动作时的损失.同时,存在一个合理的损失函数条件:λPP≤λBP≤λNP, λNN≤λBN≤λPN.
对于某一个对象x,其在状态C中的概率为P(C|x),又称为条件概率,根据条件概率大小可得到决策排序结果.对象x执行不同的动作有不同的期望损失,如R(aP|x)为对象采取接受动作时的期望损失;R(aB|x)为对象采取进一步研究动作时的期望损失,R(aN|x)为对象采取拒绝动作时的期望损失.通过比较其执行不同动作时的期望损失将对象划分到正域、边界域和负域中,分别用POS(C)、BND(C)和NEG(C)表示.由此可得决策规则(P)、(B)、(N)如下:
(P)如果R(aP|x)≤R(aB|x)和R(aP|x)≤R(aN|x),则x∈POS(C).
(B)如果R(aB|x)≤R(aP|x)和R(aB|x)≤R(aN|x),则x∈BND(C).
(N)如果R(aN|x)≤R(aB|x)和R(aN|x)≤R(aP|x),则x∈NEG(C).
1.3 改进累积前景理论
1.3.1 累积前景理论
Tversky等[13]提出了累积前景理论,其核心为累积前景价值,它由累积权重函数和价值函数两部分组成,假设共有a1+a2+1个结果,记为x=
式中:πh为累积权重函数,用来衡量风险对决策者的影响;v'(xh)为价值函数,用来衡量决策者的主观感受,其表达式为
式中:θ为损失规避系数,当θ>1时表示决策者对损失更加敏感,经典取值为θ=2.25;a和b为风险态度系数,经典取值为a=b=0.88;
计算累积权重函数时,首先计算单个概率权重函数.由于人们通常更倾向于去做小概率事件,所以概率权重函数为
式中:w+(ph)和w-(ph)分别为决策者面对收益和损失的概率权重函数;ph为xh的概率;φ和δ分别为风险收益态度系数和风险损失态度系数,经典取值为φ=0.61,δ=0.69.
为了对权重进行累加,将a1+a2+1个结果按升序排序为
1.3.2 改进累积前景理论
对于式(4),一般情况下决策者对损失更加敏感,但在现实生活中,也存在决策者对收益更加敏感的场景,因此引入收益敏感系数ζ,表达决策者对收益的敏感度.同时扩大a和b的取值范围,将其由前景理论认定的 0<a, b<1扩展到a, b=1和a, b>1,分别对应决策者为冒险型、中间型和保守型,从而根据决策者的风险类型得出不同的决策结果.参照文献[14],改进的价值函数为
式中:当θ=1, ζ>1时表示相对于损失,决策者对收益更加敏感;当θ>1, ζ=1时表示相对于收益,决策者对损失更加敏感.
2 基于累积前景理论和三支决策的态
势评估方法 针对以往的决策方法认为决策者处于完全理性的状态并且只能得到威胁排序结果的问题,提出一种基于累积前景理论和三支决策的无人机态势威胁评估方法.
该方法的数学描述和实现过程如下:假设敌机目标集合为T={T1, T2, …, Tm},每架敌机有n个指标:A={A1, A2, …, An}.评估矩阵为Z=(zij)m×n,目标为i∈{1, 2, …, m},指标为j∈{1, 2, …, n},zij为第i个目标在第j个指标上的值.Z为一个直觉模糊矩阵,每个数值都是直觉模糊数,zij=<μij, vij>.其中,uij和 vij分别为直觉模糊数zij的隶属度和非隶属度.该方法首先利用直觉模糊逼近于理想值的排序(TOPSIS)方法计算每个目标的条件概率,从而得到威胁排序结果;之后利用结果矩阵和损失矩阵之间的关系计算每个目标的结果矩阵;最后根据相关公式计算每个目标执行不同动作时的累积前景价值,构建新的三支决策规则进行比较,得到威胁分类结果.
2.1 计算三支决策的条件概率
步骤一 确定目标的正负理想解.
正负理想解分别为
Z+={
Z-={
其中:
不同类型的指标有不同的取值,效益型指标是指其值越大结果越好的指标,成本型指标是指其值越小结果越好的指标.
对于效益型指标,其正负理想解分别为
对于成本型指标,其正负理想解分别为
步骤二 计算每个目标的相对贴近度.
首先,计算第i个目标到正负理想点的距离,计算公式为
式中:D(Ti, Z+)和D(Ti, Z-)分别为目标Ti到正理想解和负理想解的距离;wj为第j个指标的权重.
之后,计算第i个目标的相对贴近度为
式中:Pr(C|Ti)为第i个目标在状态C中的条件概率;RC(Ti)为第i个目标的相对贴近度.
2.2 计算结果矩阵
结果矩阵的构造方法与三支决策中的损失函数矩阵类似,矩阵中各元素分别表示在不同状态下执行3种操作的结果,矩阵中各元素可以表示为 X=[xPPxPNxBPxBNxNPxNN].与损失函数不同的是,结果矩阵的值既可以为正也可以为负.
步骤一 计算目标在每个指标下的损失函数矩阵.
指标的最大值和最小值分别用zmax和zmin表示.对于直觉模糊数表示的指标值,效益型指标的最大值和最小值分别为zmax=(1, 0), zmin=(0, 1),成本型指标的最大值和最小值分别为zmax=(0, 1), zmin=(1, 0).
式中:λ(zij)为第i个目标的第j个指标对应的损失函数矩阵,矩阵内的值为不同条件下的损失;
步骤二 计算目标在每个指标下的结果矩阵.
式中:X(zij)为第i个目标的第j个指标对应的结果矩阵;
步骤三 计算目标在多个指标下的综合结果矩阵.
式中:Xi为第i个目标的综合结果矩阵;
2.3 计算每个目标的累积前景价值
步骤一 计算参考点.
首先使用记分函数将模糊矩阵转换为一般矩阵.本文采用经典的记分函数,表示为
式中:Sij为直觉模糊数zij的记分函数值.
之后,求一般矩阵的指标平均值:
为避免信息丢失,引入正负理想点作为另外两个参考点.同时,在实际空战过程中飞行员的偏好在很大程度上是模糊的,因此本文采用模糊分析法[15]来确定偏好权重.
首先根据决策者对不同参考点的偏好程度建立模糊矩阵P=[prw]u×u,u为参考点的个数,具体可表示为
之后对P进行一致化处理,先按行求和得到qr,再进行计算得到模糊一致矩阵Q=[qrw]u×u,表达式为
最后确定各参考点的偏好权重L=(l1, l2, …, lu).由参考点的值和其偏好权重计算得到最终的参考点
式中:kr为第r个参考点的初始偏好权重; lr为第r个参考点的偏好权重.
步骤二 计算每个目标的价值函数.
以矩阵的形式表示结果,矩阵内每个结果对应的价值函数为
式中:
步骤三 计算每个目标的累积权重函数.
首先计算权重函数,表达式为
式中:w+(pi)和w-(pi)分别为决策者面对收益和损失的概率权重函数;pi为第i个目标的概率.
之后,计算累积权重函数.价值函数单调递增,因此对价值函数进行排序,获得每个动作相关联的累积权重函数为
式中: Pr(C|Ti) 为第i个目标Ti属于状态C的概率;Pr(¬C|Ti)为目标Ti不属于状态C的概率;
步骤四 计算每个目标在不同操作下的累积前景价值.
由价值函数和累积权重函数可以计算3种不同操作下的累积前景价值.当价值函数不同时,累积权重函数不同,对应的计算方法也不同,具体公式为
式中:Vi(aP|Ti)、Vi(aB|Ti)和Vi(aN|Ti)分别为对目标Ti采取接受、进一步研究和拒绝动作得到的累积前景价值.
最后,根据累积前景价值最大的原则,每个目标的三支决策规则为
(P)如果满足Vi(aP|Ti)≥Vi(aB|Ti)和Vi(aP|Ti)≥Vi(aN|Ti), 则Ti∈POS(C).
(B)如果满足Vi(aB|Ti)≥Vi(aP|Ti)和Vi(aB|Ti)≥Vi(aN|Ti), 则Ti∈BND(C).
(N)如果满足Vi(aN|Ti)≥Vi(aP|Ti)和Vi(aN|Ti)≥Vi(aB|Ti), 则Ti∈NEG(C).
3 仿真及实验分析
3.1 仿真分析
表2 归一化多属性直觉模糊信息矩阵
Tab.2
目标 | T1 | T2 | T3 | T4 | T5 |
---|---|---|---|---|---|
类型 | (0.7, 0.2) | (0.7, 0.0) | (0.5, 0.1) | (0.5, 0.3) | (0.1, 0.6) |
距离 | (0.235, 0.702) | (0.281, 0.662) | (0.194, 0.747) | (0.203, 0.759) | (0.726, 0.232) |
角度 | (0.446, 0.272) | (0.279, 0.515) | (0.223, 0.511) | (0.248, 0.584) | (0.446, 0.272) |
速度 | (0.546, 0.193) | (0.136, 0.718) | (0.579, 0.274) | (0.239, 0.637) | (0.568, 0.903) |
高度 | (0.517, 0.167) | (0.346, 0.501) | (0.041, 0.917) | (0.172, 0.824) | (0.517, 0.286) |
干扰能力 | (0.5, 0.1) | (0.7, 0.0) | (0.8, 0.1) | (0.2, 0.5) | (0.0, 0.6) |
穿透能力 | (0.8, 0.1) | (0.3, 0.4) | (0.8, 0.0) | (0.3, 0.1) | (0.3, 0.5) |
防护能力 | (0.6, 0.3) | (0.6, 0.1) | (0.8, 0.1) | (0.6, 0.3) | (0.2, 0.7) |
注:(0.7,0.2)中0.7为隶属度,0.2为非隶属度.
通过公式计算得到每个目标的条件概率、不同状态下的权重函数及结果矩阵,如表3~5所示.
表3 每个目标的条件概率
Tab.3
目标 | Pr(C|Ti) (σ=0.35) |
---|---|
T1 | 0.7431 |
T2 | 0.5411 |
T3 | 0.6208 |
T4 | 0.3409 |
T5 | 0.3070 |
表4 每个目标的权重函数
Tab.4
权重类型 | T1 | T2 | T3 | T4 | T5 |
---|---|---|---|---|---|
w+(Pr(C|Ti) | 0.5633 | 0.4420 | 0.4856 | 0.3399 | 0.3221 |
w-(Pr(C|Ti) | 0.6209 | 0.4799 | 0.5320 | 0.3542 | 0.3322 |
w+(Pr(¬C|Ti) | 0.2947 | 0.3997 | 0.3595 | 0.5081 | 0.5293 |
w-(Pr(¬C|Ti) | 0.2983 | 0.4283 | 0.3786 | 0.5583 | 0.5826 |
表5 每个目标的结果矩阵
Tab.5
目标 | 动作 | σ=0.35 | |
---|---|---|---|
C | ¬C | ||
T1 | aP | 0.2610 | -0.4570 |
aB | -0.2610 | -0.1600 | |
aN | -0.7548 | 0.1600 | |
T2 | aP | 0.2233 | -0.5823 |
aB | -0.2233 | -0.2038 | |
aN | -0.6380 | 0.2038 | |
T3 | aP | 0.2297 | -0.5079 |
aB | -0.2297 | -0.1778 | |
aN | -0.6564 | 0.1778 | |
T4 | aP | 0.1748 | -0.6923 |
aB | -0.1748 | -0.2423 | |
aN | -0.4995 | 0.2423 | |
T5 | aP | 0.1709 | -0.7054 |
aB | -0.1709 | -0.2469 | |
aN | -0.4884 | 0.2469 |
使用记分函数将直觉模糊信息矩阵转换为一般矩阵,利用公式计算得到η=(0.365,0.135, 0.5), 通过计算得到指标平均值、正理想点和负理想点,再乘以对应的偏好权重,即可得到本文需要的参考点,具体算式为
利用参考点、结果矩阵计算得到相应的价值函数,并由价值函数和权重函数计算得到相应的累积前景价值,如表6所示.其中,VP、VB和VN分别为目标采取接受、进一步研究和拒绝动作时的累积前景价值.
表6 每个目标的累积前景价值
Tab.6
累积前景 价值类型 | T1 | T2 | T3 | T4 | T5 |
---|---|---|---|---|---|
VP | 0.0480 | -0.2439 | -0.1077 | -0.5721 | -0.6275 |
VB | -0.1589 | -0.1336 | -0.1067 | -0.1251 | -0.1319 |
VN | -0.7560 | -0.3817 | -0.4889 | -0.0637 | -0.0246 |
3.2 实验对比与分析
3.2.1 评估结果对比与分析
表7 实验结果对比
Tab.7
在4种方法的评估结果中,本文方法与三支决策方法得到的排序结果一致,分类结果有所不同,说明决策者的心理态度会影响威胁评估结果.在战场中考虑决策者心理具有研究价值,验证了本文方法的正确性.本文方法与IFSMRM方法所得结果在目标T1和T3上不一致,与T3相比,T1的速度更快,类型指标的值更大,表示作战能力更强,更容易发起攻击,因此T1的威胁等级更高;IFSMRM方法预先设定了7个威胁等级,目标T1和T3在相同的威胁等级中,T2被划分到下一个威胁等级中;T3与T2相比,距离、角度和高度等略小,但T3的类型也略小,表示其作战能力稍差,因此二者的威胁程度相差不大,本文方法将T2与T3划分到同一个区间是合理的,并且将目标划分到3个区间符合人类心理认知,验证了本方法的合理性.本文方法与VIKOR方法得到的排序结果不一致,与T3相比,T1的速度更快,类型指标值更大,表示作战能力更强,更容易发起攻击,因此T1的威胁等级更高;与T4相比,T2的速度较小,距离较远,但其类型指标值远大于T4,表示其作战能力远强于T4,有能力发动突然袭击,因此T2的威胁等级更高,显然本文方法更符合客观分析.
与文献[7]使用的VIKOR方法相比,本文方法得到的威胁评估结果更符合实际认知,且能提供客观分类结果,更好地为决策者提供决策支持.与文献[8]仅使用三支决策对比,两者使用同样的方法计算三支决策的条件概率,三支决策中威胁排序结果与概率大小保持一致,因此两种方法得到的排序结果相同;同时本文方法将累积前景理论和三支决策相结合,将决策者的心理考虑到评估结果中,不同决策者可以根据自己的风险偏好选择偏好权重,得到不同的参考点;同一决策者面对不同的战场态势,得到不同的参考点;由不同的参考点得到不同的分类结果,符合真实战场环境,解决了以往态势评估未考虑决策者心理的问题.与文献[16]使用的IFSMRM方法对比,本文采用三支决策的方法,不仅得到了威胁排序结果,而且得到了对目标的具体操作,不同域的目标有不同的操作,有利于飞行员进行快速决策,解决了当前决策困难、易产生误判的问题.并且无需事先设定威胁等级,可根据新的三支决策规则实时地做出威胁分类,选择优先作战目标.
图1
3.2.2 复杂度对比与分析
根据4种方法的具体流程,可得其时间复杂度均为O(mn).随机进行10次实验,方法耗时结果如图2所示.在4种方法对比中,虽然本文方法耗时较高,但本文方法和其他方法具有相同且较低的时间复杂度,耗时仍然能够满足战场实时性要求.
图2
3.3 决策参数分析
表8 3种典型的参数组合
飞行员 类型 | 价值函数参数 | 权重函数参数 |
---|---|---|
冒险型 | a=0.37, b=0.59, ζ=1, θ=1.51 | φ=0.61, δ=0.66 |
中间型 | a=1, b=1, ζ=1, θ=2.25 | φ=0.58, δ=0.58 |
保守型 | a=1.21, b=1.21, ζ=1, θ=2.25 | φ=0.55, δ=0.49 |
为了清楚说明决策参数对目标态势评估的影响,通过数值仿真得到了3种类型下的目标态势评估关系.由表9和表10可知,在3种典型参数组合情况下,威胁评估结果总体比较稳定,但是目标分类结果不同.因为威胁评估排序结果与条件概率的排序保持一致,所以不同类型的飞行员只影响分类结果.首先,冒险型决策者认为目标T2和T3都应该攻击;中间型和保守型认为目标T2和T3需要更多的信息来判断是否需要攻击,说明不同类型的飞行员决策结果不同,受到了飞行员主观心理因素的影响.其次,中间型和保守型的分类结果相同,但累积前景价值不同,保守型的目标T4和T5的累积前景价值更小,说明其不想攻击的意愿更强烈,该决策结果符合人类认知.总体结果表明,在实际空战中要充分考虑飞行员的心理,对飞行员类型进行判断,从而使态势评估结果更符合实际作战情况.
表9 3种类型决策者的累积前景价值
Tab.9
飞行 员类 型 | 累积 前景 价值 类型 | T1 | T2 | T3 | T4 | T5 |
---|---|---|---|---|---|---|
冒险型 | VP | 0.1991 | -0.0600 | 0.0513 | -0.3253 | -0.3706 |
VB | -0.1584 | -0.2255 | -0.1767 | -0.1884 | -0.1533 | |
VN | -0.4633 | -0.1707 | -0.2638 | 0.0936 | 0.1317 | |
中间型 | VP | 0.0474 | -0.1876 | -0.0765 | -0.4531 | -0.4980 |
VB | -0.1034 | -0.0888 | -0.0660 | -0.0788 | -0.0840 | |
VN | -0.6082 | -0.2993 | -0.3837 | -0.0422 | -0.0119 | |
保守型 | VP | 0.0546 | -0.1220 | -0.0371 | -0.3254 | -0.3599 |
VB | -0.0522 | -0.0437 | -0.0299 | -0.0373 | -0.0408 | |
VN | -0.4500 | -0.2079 | -0.2703 | -0.0121 | 0.0096 |
表10 3种类型决策者的结果
Tab.10
飞行员类型 | 排序结果 | 分类结果 |
---|---|---|
冒险型 | T1>T3>T2>T4>T5 | |
中间型 | T1>T3>T2>T4>T5 | |
保守型 | T1>T3>T2>T4>T5 |
3.4 参数敏感性分析
为研究不同参数取值对态势评估结果的影响情况,分析不同参数的灵敏度,如损失规避系数θ、风险态度系数a和b,使用最大累积前景价值Vmax=max{VP, VB, VN}比较态势评估结果.损失规避系数θ对不同目标的最大累积前景价值Vmax的影响如图3所示.
图3
由图3可知,随着损失规避系数θ的不断增加,目标T1、T2、T3、T4和T5的最大累积前景价值均处于下降趋势,但目标所在的域不同,代表其威胁程度也不同.具体而言,随着θ的增大,目标T1仍处于正域,采取攻击操作的累积前景价值不断减小,说明目标T1的威胁评估结果随θ的增大而减小.随着θ的增大,目标T2和T3从正域过渡到边界域,采取不攻击操作的累积前景价值不断减小,说明目标T2和T3的威胁评估结果随θ的增大而减小.随着θ的增大,目标T4和T5仍处于负域,采取不攻击操作的累积前景价值不断减小,说明目标T4和T5的威胁评估结果随θ的增大而增大.综上说明,随着损失规避系数θ的不断增大,目标的威胁评估结果也呈现出不同的变化趋势.
图4
图5
4 结论
针对无人机态势评估决策困难及未考虑复杂外界环境对决策者的影响问题,提出一种基于累积前景理论的三支决策模型,并据此进行了仿真实验,主要结论如下:
(1) 与传统的态势评估方法相比,基于累积前景与三支决策的态势评估方法在对目标进行决策时,能够使得分类结果更加合理,有利于飞行员做出快速决策,解决了决策困难的问题,更好地满足战场快速打击的需求.
(2) 与传统的三支决策方法相比,本方法在决策过程中引入了累积前景价值,不同的决策者有不同的风险偏好,同一决策者在面对不同战场态势时心理也会发生变化,从而得到不同的参考点,可以反映出决策者的决策偏好和风险态度,使决策结果更符合现实场景.
(3) 不同类型的飞行员在面对相同目标时会得到不同的态势评估结果,表明在实际空战中要充分考虑飞行员的心理,对飞行员类型进行判断,从而使态势评估结果更符合实际作战情况.
参考文献
基于局部动态贝叶斯网络的无人机态势评估
[J].
Real-time evaluation of UAV situation based on local dynamic Bayesian network
[J].
Situation assessment based on multi-entity Bayesian network
[C]
基于云模型和改进熵权的空战多目标威胁等级评估
[J].
Target threat assessment technology for UAV air combat based on cloud model and improved entropy weight
[J].
基于PCA-MPSO-ELM的空战目标威胁评估
[J].
Target threat assessment in air combat based on PCA-MPSO-ELM algorithm
[J].
Unmanned aerial vehicle swarm distributed cooperation method based on situation awareness consensus and its information processing mechanism
[J].DOI:10.1016/j.knosys.2019.105034 URL [本文引用: 2]
基于QABC-IFMADM算法的有人/无人机编队作战威胁评估
[J].
DOI:10.3969/j.issn.0372-2112.2018.07.007
[本文引用: 2]
信息化条件下有人/无人机编队作战环境具有高度不确定性,如何对目标进行快速有效的威胁评估成为亟待解决的问题.在直觉模糊集框架下,研究决策者对方案具有偏好,目标属性值为区间数且权重未知的评估问题,提出一种量子蜂群(QABC)优化属性权重的直觉模糊多属性决策(IFMADM)的威胁评估方法.首先,建立方案偏好模型;其次,综合考虑客观优化排序和决策者方案偏好信息,建立主客观最优属性权重优化模型,并采用量子蜂群算法优化属性权重,使得属性权重更准确地反映实际情况.最后,通过编队对地作战威胁评估算例验证了所提方法的合理性与有效性.
Threat assessment of manned/unmanned aerial vehicle formation based on QABC-IFMADM algorithm
[J].
Assessment and sequencing of air target threat based on intuitionistic fuzzy entropy and dynamic VIKOR
[J].DOI:10.21629/JSEE.2018.02.11 URL [本文引用: 5]
A novel target threat assessment method based on three-way decisions under intuitionistic fuzzy multi-attribute decision making environment
[J].DOI:10.1016/j.engappai.2019.103276 URL [本文引用: 5]
一种基于前景理论的毕达哥拉斯犹豫模糊不确定语言 ELECTRE 多属性决策方法
[J].
Method for multi-attribute decision-making with Pythagorean hesitant fuzzy uncertain linguistic ELECTRE based on prospect theory
[J].
基于前景理论的空战目标威胁评估
[J].
DOI:10.3969/j.issn.1000-1093.2020.06.021
[本文引用: 1]
空战目标威胁评估是目标分配与火力分配的基础。针对目标威胁评估研究存在确定指标权重时未考虑指标间的相关性,采用单一灰色关联分析(GRA)方法和逼近理想点(TOPSIS)方法不能准确反映目标威胁大小,以及未考虑飞行员决策时面临损失和收益时的不同态度等问题,在综合GRA和TOPSIS的基础上,提出一种基于前景GRA-TOPSIS的空战目标威胁评估模型。提出灰色关联深度的概念,结合极大熵确定指标权重;利用指标之间的灰色关联度变权方法对指标权重进行修正,避免指标之间的相关性影响;利用GRA方法分析目标指标序列的曲线形状相似性,结合TOPSIS方法分析位置的相似性,基于前景理论,将飞行员面临收益以损失的态度融合到目标威胁评估中,得到能够体现飞行员特质的目标威胁评估结果。通过仿真验证了所提方法的有效性以及合理性。
Air combat target threat assessment based on prospect theory
[J].
基于前景理论和 VIKOR 法的空战威胁评估
[J].
Air combat threat assessment based on prospect theory and VIKOR method
[J].
The superiority of three-way decisions in probabilistic rough set models
[J].DOI:10.1016/j.ins.2010.11.019 URL [本文引用: 1]
Advances in prospect theory: Cumulative representation of uncertainty
[J].DOI:10.1007/BF00122574 URL [本文引用: 1]
基于效用曲线改进的前景理论价值函数
[J].针对选取前景理论函数参数时仅考虑决策的不理性而并未区分决策者的风险态度这一特点,基于效用曲线改进了前景理论价值函数的形式并扩展了其参数范围.该函数借鉴效用曲线依据曲线形状区分决策者风险态度的方法,同时对比已有的实验数据,得出价值函数曲线形状与决策者风险态度相关,为价值函数参数选取提供了一定的理论依据.计算实例表明,该方法便于参数选取,决策结果稳定、有效,此外,风险决策时决策结果受参考点变化的影响远大于决策者不同的风险态度,在实际决策时对于参考点的选取需要非常谨慎.
Modified value function in prospect theory based on utility curve
[J].According to the characteristic that irrationality of decision making is only considered and risk attitude of decision-maker is not distinguished when function parameters of value prospect theory is selected,the form of value function is modified and the range of function parameters is expanded based on utility curve.The function uses the utility curve method which distinguishes the risk attitude of decision-maker according to curve's figure for reference,and the conclusion that curve's figure of value function is related with risk attitude of decision-maker is elicited according to existed experimental data.This provides certain theoretical basis for selecting value of parameters in value function.The calculation example shows that the method is convenient for selecting parameters,and the decision-making result is stable and valid,and besides,the influence of various reference points on the result of risk decision making is bigger than various risk attitudes,thus their selection needs highly caution in actual decision-making.
Hazard assessment of potentially dangerous bodies within a cliff based on the Fuzzy-AHP method: A case study of the Mogao Grottoes, China
[J].DOI:10.1007/s10064-016-0865-7 URL [本文引用: 1]
Threat assessment method based on intuitionistic fuzzy similarity measurement reasoning with orientation
[J].
A decision-making rule for modeling travelers’ route choice behavior based on cumulative prospect theory
[J].DOI:10.1016/j.trc.2010.05.009 URL [本文引用: 1]
/
〈 |
|
〉 |
