上海交通大学学报, 2022, 56(11): 1479-1490 doi: 10.16183/j.cnki.jsjtu.2021.400

制导、导航与控制

基于累积前景理论和三支决策的无人机态势评估

李伟湋,a,b,c, 高培雪a, 陈进a, 路玉卿a

a.南京航空航天大学 航天学院,南京 210016

b.南京航空航天大学 计算机科学与技术学院/人工智能学院/软件学院,南京 210016

c.南京航空航天大学 高安全系统的软件开发与验证技术工信部重点实验室,南京 210016

Unmanned Aerial Vehicle Situation Assessment Based on Cumulative Prospect Theory and Three-Way Decision

LI Weiwei,a,b,c, GAO Peixuea, CHEN Jina, LU Yuqinga

a. College of Astronautics, Nanjing University of Aeronautics and Astronautics, Nanjing 210016, China

b. College of Computer Science and Technology/College of Artificial Intelligence/College of Software, Nanjing University of Aeronautics and Astronautics, Nanjing 210016, China

c. Key Laboratory for Safety-Critical Software Development and Verification of the Ministry of Industry and Information Technology, Nanjing University of Aeronautics and Astronautics, Nanjing 210016, China

责任编辑: 孙伟

收稿日期: 2021-10-8  

基金资助: 国家自然科学基金青年基金项目(61906090)

Received: 2021-10-8  

作者简介 About authors

李伟湋(1981-),女,湖北省宜昌市人,副研究员,从事机器学习、软件智能化等方向研究;E-mail:liweiwei@nuaa.edu.cn.

摘要

现有的无人机态势评估方法没有考虑复杂外界环境对决策者的影响,并且通常只能得到评估的排序结果,决策者需要在短时间内进行决策,常出现误判或错失打击窗口期.针对该问题,提出一种基于累积前景理论的三支决策模型.首先,通过直觉模糊接近于理想值的排序方法求取目标的条件概率, 得到态势评估结果;之后基于累积前景理论对无人机获取的直觉模糊态势信息进行计算,得到每个目标执行不同动作时对应的累积前景价值;最后,基于累积前景价值最大化的原则,推导出新的三支决策规则,对态势评估结果进行三支划分.实验分析表明:该方法不仅得到了目标威胁排序,而且对目标威胁等级进行客观分类;同时在评估过程中考虑决策者的心理,得到符合决策者特质的目标威胁评估结果,为复杂多变的空战提供一种合理的决策支持.

关键词: 无人机; 三支决策; 累积前景理论; 态势评估; 直觉模糊

Abstract

General uninhabited aerial vehicle (UAV) situation assessment methods do not consider the influence of complex external environment on the decision-maker, and usually only get the ranking results of the evaluation. Since the decision-maker needs to make decisions in a short period of time, misjudgments or missing strike windows often occur. To address this problem, a three-way decision model based on the cumulative prospect theory is proposed. First, the method the utilizes intuitionistic fuzzy technique for order preference by similarity to an ideal solution to estimate the conditional probability of each target and obtains the situation assessment result. Next, the method calculates the intuitionistic fuzzy situation information obtained by the UAV based on the cumulative prospect theory, and obtains the corresponding cumulative prospect value when each target performs different actions. Finally, based on the principle of maximizing the cumulative prospect value, a new three-way decision rule is derived to divide the situational assessment results into three regions. The experimental analysis shows that the method not only obtains the target threat ranking, but also classifies the target threat level objectively. At the same time, it considers the psychology of the decision-maker in the assessment process, and obtains the target threat assessment results that meet the traits of the decision-maker, providing a reasonable decision support for the complex and changing air combat.

Keywords: uninhabited aerial vehicle (UAV); three-way decision; cumulative prospect theory; situation assessment; intuitionistic

PDF (1395KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

李伟湋, 高培雪, 陈进, 路玉卿. 基于累积前景理论和三支决策的无人机态势评估[J]. 上海交通大学学报, 2022, 56(11): 1479-1490 doi:10.16183/j.cnki.jsjtu.2021.400

LI Weiwei, GAO Peixue, CHEN Jin, LU Yuqing. Unmanned Aerial Vehicle Situation Assessment Based on Cumulative Prospect Theory and Three-Way Decision[J]. Journal of Shanghai Jiaotong University, 2022, 56(11): 1479-1490 doi:10.16183/j.cnki.jsjtu.2021.400

随着科技发展,无人机作战成为现代战争中不可或缺的一环,已逐步应用于战争中的侦查、评估和监听等各个方面.无人机态势评估是指评估敌我双方的战斗力要素,对整体战场态势进行判断,帮助飞行员做出正确决策.对敌机态势进行合理评估是进行火力分配和机动决策的前提,在战争中发挥着关键作用.在评估过程中,无人机本身动力较小,容易受天气、地形等环境因素影响.同时,无人机控制系统难以自主处理飞行过程中的突发事件[1].因此,深入研究无人机态势评估刻不容缓.

近年来,众多学者对无人机态势评估展开研究,提出了多种态势评估方法.较为常见的有以下几种:文献[2]提出了一种基于贝叶斯网络的态势评估方法;文献[3]构建云模型得到目标威胁评估云图,实现了威胁评估;文献[4]为了提高空战中目标威胁评估模型的精度,构建极限学习机来解决态势评估问题.无人机态势评估是信息融合的过程,将多种低层次的信息融合为高层次的信息,从而对目标进行态势评估,得到威胁排序结果.因此,在一些研究中,将无人机态势评估视为一种群体决策[5]或多属性决策[6]的问题.由于作战环境日趋复杂,且无人机容易受到环境影响,导致态势信息具有明显的不确定性和模糊性.为解决该问题,文献[6]用直觉模糊集来处理信息的不确定性,使用隶属度函数精确地描述了不确定信息,将其用于评估空中目标威胁程度.文献[7]采用直觉模糊熵计算目标属性权重,引入直觉模糊多准则妥协解排序(VIKOR)方法用以解决多目标威胁评估问题.文献[5]将群体决策模型应用到目标威胁评估上,之后,文献[8]针对目标威胁评估只能得到威胁排序需要进一步研究是否应该攻击目标的问题,在直觉模糊环境下提出了一种基于三支决策的目标威胁评估算法.同时,文献[9]将前景理论引入到决策问题中,文献[10]将前景理论运用到空战目标威胁评估中,文献[11]进而提出一种基于前景理论和VIKOR法的威胁评估方法.

但当前的无人机态势评估过程仍然存在以下两个问题:其一,当前多数的态势评估方法只能得到评估的排序结果,仍需飞行员主观地选择优先攻击的目标和数量,并且飞行员在决策过程中多为二支决策,即判断是否对敌机进行攻击,对于中等威胁的目标,需要更多的信息进行判断,评估过程复杂,容易出现误判,易导致决策错误;其二,外界的复杂环境会影响飞行员的个人偏好,不同的飞行员心理偏好不同,在整个空战过程中,同一飞行员的心理倾向也会发生变化,而以往的评估过程中没有考虑决策者的主观偏好和风险态度,不能反映出真实的作战场景.

针对上述问题,提出一种基于三支决策和累积前景价值理论的态势评估方法.首先利用三支决策模型进行态势评估,该模型在传统决策问题的基础上,为不确定性结果增加了延迟决策的选择,更加符合人的决策认知;然后引入累积前景理论体现飞行员偏好的不确定性,在此过程中使用记分函数将直觉模糊数转换为实数,从而计算指标平均值,利用指标平均值和正负理想点得到参考点;为建立基于累积前景理论的三支决策模型,根据损失和结果之间的数量关系,得到对应的结果矩阵,之后通过比较一个目标的3种累积前景价值进行快速决策.此外,为了考虑不同类型飞行员面对相同战场态势时的区别,得出与实战情景相符的评估结果,对3种类型的飞行员进行实验,得到不同的评估结果.

1 相关理论

1.1 直觉模糊集

U是一个非空论域,则U上的一个直觉模糊集可以表示为:A'={<x, μA(x), vA(x)>|xU},其中,μA(x)为论域中的元素x属于A'的隶属度;vA(x)为元素x属于A'的非隶属度A(x): U→[01]和vA(x): U→[01]是论域上的两个映射,对∀xU,需满足以下3个条件:μA(x)∈[01],vA(x)∈[01]以及μA(x)+vA(x)∈[01].定义πA(x)=1-μA(x)-vA(x)为直觉模糊集A'的犹豫度.

直觉模糊集中的元素被称为直觉模糊数.设E=(μE, vE)和F=(μF, vF)是两个直觉模糊数,与直觉模糊集的定义类似,μEvEπE分别为直觉模糊数E的隶属度、非隶属度和犹豫度,μFvFπF分别为直觉模糊数F的隶属度、非隶属度和犹豫度;其中,πE=1-μE-vE,πF=1-μF-vF.常见运算为

d(E, F)=$\frac{1}{2}$(|μE-μF|+|vE-vF|+|πE-πF|)
S(E)=μE-vE

式中:d(E, F)为距离函数,用于计算两个直觉模糊数之间的距离;S(E)为记分函数.

1.2 三支决策

三支决策理论的基本思想是在实体评价函数上引入两个阈值,并构造所需的3个域,分别为正域、负域和边界域,这3个域可以分别解释为接受、拒绝和不承诺.根据贝叶斯决策过程,决策粗糙集由2个状态和3种行动组成[12], 构造状态集和动作集,状态集Ω={C, ¬C}表示对象属于集合C和不属于集合C,动作集AC={aP, aB, aN},aPaBaN分别表示接受、进一步研究和拒绝动作,下标P、B和N分别为对象x采取接受、进一步研究和拒绝动作.不同状态下执行不同的动作会存在不同的损失,对应的损失函数矩阵如表1所示.其中,λPPλBPλNP分别为在状态C中的对象采取接受、进一步研究和拒绝动作时的损失;λPNλBNλNN分别为不在状态C中的对象采取接受、进一步研究和拒绝动作时的损失.同时,存在一个合理的损失函数条件:λPPλBPλNP, λNNλBNλPN.

表1   损失函数矩阵

Tab.1  Loss function matrix

动作C¬C
aPλPPλPN
aBλBPλBN
aNλNPλNN

新窗口打开| 下载CSV


对于某一个对象x,其在状态C中的概率为P(C|x),又称为条件概率,根据条件概率大小可得到决策排序结果.对象x执行不同的动作有不同的期望损失,如R(aP|x)为对象采取接受动作时的期望损失;R(aB|x)为对象采取进一步研究动作时的期望损失,R(aN|x)为对象采取拒绝动作时的期望损失.通过比较其执行不同动作时的期望损失将对象划分到正域、边界域和负域中,分别用POS(C)、BND(C)和NEG(C)表示.由此可得决策规则(P)、(B)、(N)如下:

(P)如果R(aP|x)≤R(aB|x)和R(aP|x)≤R(aN|x),则x∈POS(C).

(B)如果R(aB|x)≤R(aP|x)和R(aB|x)≤R(aN|x),则x∈BND(C).

(N)如果R(aN|x)≤R(aB|x)和R(aN|x)≤R(aP|x),则x∈NEG(C).

1.3 改进累积前景理论

1.3.1 累积前景理论

Tversky等[13]提出了累积前景理论,其核心为累积前景价值,它由累积权重函数和价值函数两部分组成,假设共有a1+a2+1个结果,记为x=x-a1, x-a1+1, …, xa2,每个结果发生的概率记为p=p-a1, p-a1+1, …, pa2.累积前景价值为

V= h=-a1a2πhv'(xh)

式中:πh为累积权重函数,用来衡量风险对决策者的影响;v'(xh)为价值函数,用来衡量决策者的主观感受,其表达式为

v'(xh)= (xh-x)a,xhx-θ(x-xh)b,xh<x

式中:θ为损失规避系数,当θ>1时表示决策者对损失更加敏感,经典取值为θ=2.25;ab为风险态度系数,经典取值为a=b=0.88;x为参考点,不同的决策者具有不同的参考点,表示不同的决策偏好;xh为第h个结果,表示决策者获得的价值,而不是最终的财富.xhx时,表示决策者获得的价值是收益;当xh<x时,表示决策者获得的价值是损失.

计算累积权重函数时,首先计算单个概率权重函数.由于人们通常更倾向于去做小概率事件,所以概率权重函数为

w+(ph)= phφ[phφ+(1-ph)φ]1/φ
w-(ph)= phδ[phδ+(1-ph)δ]1/δ

式中:w+(ph)和w-(ph)分别为决策者面对收益和损失的概率权重函数;phxh的概率;φδ分别为风险收益态度系数和风险损失态度系数,经典取值为φ=0.61,δ=0.69.

为了对权重进行累加,将a1+a2+1个结果按升序排序为x-a1< …<x0< …<xa2,第h个结果的累积权重函数具体表示为

πh= w+(pa1),h=a2w+(ph+ph+1+ +pa2)-w+(ph+1+ph+2++pa2),0h<a2w-(p-a1+pa1+1+ +ph)-w-(p-a1+p-a1+1+ +ph-1),-a1<h<0w+(p-a1),h=-a1

1.3.2 改进累积前景理论

对于式(4),一般情况下决策者对损失更加敏感,但在现实生活中,也存在决策者对收益更加敏感的场景,因此引入收益敏感系数ζ,表达决策者对收益的敏感度.同时扩大ab的取值范围,将其由前景理论认定的 0<a, b<1扩展到a, b=1和a, b>1,分别对应决策者为冒险型、中间型和保守型,从而根据决策者的风险类型得出不同的决策结果.参照文献[14],改进的价值函数为

v(xh)= ζ(xh-x)a,xhx-θ(x-xh)b,xh<x

式中:当θ=1, ζ>1时表示相对于损失,决策者对收益更加敏感;当θ>1, ζ=1时表示相对于收益,决策者对损失更加敏感.

2 基于累积前景理论和三支决策的态

势评估方法 针对以往的决策方法认为决策者处于完全理性的状态并且只能得到威胁排序结果的问题,提出一种基于累积前景理论和三支决策的无人机态势威胁评估方法.

该方法的数学描述和实现过程如下:假设敌机目标集合为T={T1, T2, …, Tm},每架敌机有n个指标:A={A1, A2, …, An}.评估矩阵为Z=(zij)m×n,目标为i∈{1, 2, …, m},指标为j∈{1, 2, …, n},zij为第i个目标在第j个指标上的值.Z为一个直觉模糊矩阵,每个数值都是直觉模糊数,zij=<μij, vij>.其中,uijvij分别为直觉模糊数zij的隶属度和非隶属度.该方法首先利用直觉模糊逼近于理想值的排序(TOPSIS)方法计算每个目标的条件概率,从而得到威胁排序结果;之后利用结果矩阵和损失矩阵之间的关系计算每个目标的结果矩阵;最后根据相关公式计算每个目标执行不同动作时的累积前景价值,构建新的三支决策规则进行比较,得到威胁分类结果.

2.1 计算三支决策的条件概率

步骤一 确定目标的正负理想解.

正负理想解分别为

Z+={Z1+, Z2+, …, Zn+}={(μ1+, v1+), (μ2+, v2+), …, (μn+, vn+)}

Z-={Z1-, Z2-, …, Zn-}={(μ1-, v1-), (μ2-, v2-), …, (μn-, vn-)}

其中:Zj+为第j个指标的正理想解,用直觉模糊数(μj+, vj+)表示;Zj-为第j个指标的负理想解,用直觉模糊数(μj-, vj-)表示.

不同类型的指标有不同的取值,效益型指标是指其值越大结果越好的指标,成本型指标是指其值越小结果越好的指标.

对于效益型指标,其正负理想解分别为

μj+=max1im(μij), vj+=min1im(vij)

μj-=min1im(μij), vj-=max1im(vij)

对于成本型指标,其正负理想解分别为

μj+=min1im(μij), vj+=max1im(vij)

μj-=max1im(μij), vj-=min1im(vij)

步骤二 计算每个目标的相对贴近度.

首先,计算第i个目标到正负理想点的距离,计算公式为

D(Ti, Z+)= j=1nwjd(zij, Zj+)
D(Ti, Z-)= j=1nwjd(zij, Zj-)

式中:D(Ti, Z+)和D(Ti, Z-)分别为目标Ti到正理想解和负理想解的距离;wj为第j个指标的权重.

之后,计算第i个目标的相对贴近度为

Pr(C|Ti)=RC(Ti)= D(Ti,Z-)D(Ti,Z-)+D(Ti,Z+) 

式中:Pr(C|Ti)为第i个目标在状态C中的条件概率;RC(Ti)为第i个目标的相对贴近度.

2.2 计算结果矩阵

结果矩阵的构造方法与三支决策中的损失函数矩阵类似,矩阵中各元素分别表示在不同状态下执行3种操作的结果,矩阵中各元素可以表示为 X=[xPPxPNxBPxBNxNPxNN].与损失函数不同的是,结果矩阵的值既可以为正也可以为负.

步骤一 计算目标在每个指标下的损失函数矩阵.

指标的最大值和最小值分别用zmaxzmin表示.对于直觉模糊数表示的指标值,效益型指标的最大值和最小值分别为zmax=(1, 0), zmin=(0, 1),成本型指标的最大值和最小值分别为zmax=(0, 1), zmin=(1, 0).

λ(zij)= λPPijλPNijλBPijλBNijλNPijλNNij= 0d(zij,zmaxj)σd(zij,zminj)σd(zij,zmaxj)d(zij,zminj)0

式中:λ(zij)为第i个目标的第j个指标对应的损失函数矩阵,矩阵内的值为不同条件下的损失;λPPijλBPijλNPij分别为第i个目标在状态C时采取接受、进一步研究和拒绝动作时,第j个指标对应的损失;λPNijλBNijλNNij分别为第i个目标不在状态C时采取接受、进一步研究和拒绝动作时,第j个指标对应的损失;zmaxjzminj分别为第j个指标的最大值和最小值;σ为自适应的风险规避系数,取值范围为 0≤σ≤0.5,σ值越大,表示获取的目标信息越充分,态势评估的结果也越准确.

步骤二 计算目标在每个指标下的结果矩阵.

X(zij)= xPPijxPNijxBPijxBNijxNPijxNNij= λPPij-λPNij-λBPij-λBNij-λNPijλNNij= σd(zij,zminj)-d(zij,zmaxj)-σd(zij,zminj)-σd(zij,zmaxj)-d(zij,zminj)σd(zij,zmaxj)

式中:X(zij)为第i个目标的第j个指标对应的结果矩阵;xPPijxBPijxNPij分别为第i个目标在状态C时采取接受动作、进一步研究动作和拒绝动作时第j个指标对应的结果值;xPNijxBNijxNNij分别为第i个目标不在状态C时采取接受动作、进一步研究动作和拒绝动作时第j个指标对应的结果值.结果矩阵的数值与损失函数矩阵的数值存在关系,即当结果大于0时,说明结果较好,不存在损失,损失函数值为0;当结果小于0时,一定存在损失,并且两者的数值为相反数.因此,可以由损失函数值计算得到相应的结果函数值.当损失函数值为0时,结果函数的数值不能直接得到,设定xPP=-σxNP, xNN=-σxPN.

步骤三 计算目标在多个指标下的综合结果矩阵.

Xi= xPPixPNixBPixBNixNPixNNi= jwjxPPijjwjxPNijjwjxBPijjwjxBNijjwjxNPijjwjxNNij

式中:Xi为第i个目标的综合结果矩阵;xPPixBPixNPi分别为第i个目标在状态C时采取接受动作、进一步研究动作和拒绝动作时对应的综合结果值;xPNixBNixNNi分别为第i个目标不在状态C时采取接受动作、进一步研究动作和拒绝动作时对应的综合结果值.

2.3 计算每个目标的累积前景价值

步骤一 计算参考点.

首先使用记分函数将模糊矩阵转换为一般矩阵.本文采用经典的记分函数,表示为

Sij=μij-vij

式中:Sij为直觉模糊数zij的记分函数值.

之后,求一般矩阵的指标平均值:

x-= j=1ni=1m1mSijwj

为避免信息丢失,引入正负理想点作为另外两个参考点.同时,在实际空战过程中飞行员的偏好在很大程度上是模糊的,因此本文采用模糊分析法[15]来确定偏好权重.

首先根据决策者对不同参考点的偏好程度建立模糊矩阵P=[prw]u×u,u为参考点的个数,具体可表示为

prw= 1,w,r0.5,rw0,r,w

之后对P进行一致化处理,先按行求和得到qr,再进行计算得到模糊一致矩阵Q=[qrw]u×u,表达式为

qr= w=1uprw, r=1, 2, …, u
Q=[qrw]u×u= qr-qw2u+0.5u×u

最后确定各参考点的偏好权重L=(l1, l2, …, lu).由参考点的值和其偏好权重计算得到最终的参考点x.

kr= w=1uqrw-0.5
lr= krr=1ukr

式中:kr为第r个参考点的初始偏好权重; lr为第r个参考点的偏好权重.

步骤二 计算每个目标的价值函数.

以矩阵的形式表示结果,矩阵内每个结果对应的价值函数为

vPPi=v(xPPi), vPNi=v(xPNi)vBPi=v(xBPi), vBNi=v(xBNi)vNPi=v(xNPi), vNNi=v(xNNi)

式中:vPPivBPivNPi分别为第i个目标在状态C中采取接受动作、进一步研究和拒绝动作得到的价值函数;vPNivBNivNNi分别为第i个目标不在状态C中采取接受动作、进一步研究和拒绝动作得到的价值函数.

步骤三 计算每个目标的累积权重函数.

首先计算权重函数,表达式为

w+(pi)= piφ[piφ+(1-pi)φ]1/φ
w-(pi)= piδ[piδ+(1-pi)δ]1/δ

式中:w+(pi)和w-(pi)分别为决策者面对收益和损失的概率权重函数;pi为第i个目标的概率.

之后,计算累积权重函数.价值函数单调递增,因此对价值函数进行排序,获得每个动作相关联的累积权重函数为

πki(Pr(C|Ti))= w+(Pr(CTi)),0vkNivkPi1-w+(Pr(¬C|Ti)),0vkPi<vkNi1-w-(Pr(¬C|Ti)),vkNivkPi<0w-(Pr(CTi)),vkPi<vkNi<0w+(Pr(CTi)),vkNi<0vkPiw-(Pr(CTi)),vkPi<0<vkNi
πki(Pr(¬C|Ti))= 1-w+(Pr(CTi)),0vkNivkPiw+(Pr(¬C|Ti)),0vkPi<vkNiw-(Pr(¬C|Ti)),vkNivkPi<01-w-(Pr(CTi)),vkPi<vkNi<0w-(Pr(¬C|Ti)),vkNi<0vkPiw+(Pr(¬C|Ti)),vkPi<0<vkNi

式中: Pr(C|Ti) 为第i个目标Ti属于状态C的概率;Pr(¬C|Ti)为目标Ti不属于状态C的概率;vkPi为第i个目标属于状态C时采取动作k的价值函数;vkNi为第i个目标不属于状态C时采取动作k的价值函数;πki(Pr(C|Ti))为Pr(C|Ti)时第i个目标采取动作k的累积权重函数;πki(Pr(¬C|Ti))为Pr(¬C|Ti)时第i个目标采取动作k的累积权重函数;k=P,B,N.

步骤四 计算每个目标在不同操作下的累积前景价值.

由价值函数和累积权重函数可以计算3种不同操作下的累积前景价值.当价值函数不同时,累积权重函数不同,对应的计算方法也不同,具体公式为

Vi(aP|Ti)= vPPiw+(Pr(CTi))+vPNi(1-w+(Pr(CTi))),0vPNi<vPPivPPiw+(Pr(CTi))+vPNiw-(Pr(¬C|Ti)),vPNi<0vPPivPPi(1-w-(Pr(¬C|Ti)))+vPNiw-(Pr(¬C|Ti)),vPNi<vPPi<0
Vi(aB|Ti)= vBPiw+(Pr(CTi))+vBNi(1-w+(Pr(CTi))),0vBNivBPivBPi(1-w+(Pr(¬C|Ti))+vBNiw+(Pr(¬C|Ti)),0vBPi<vBNivBPi(1-w-(Pr(¬C|Ti))+vBNiw-(Pr(¬C|Ti)),vBNivBPi<0vBPiw-(Pr(CTi))+vBNi(1-w-(Pr(CTi))),vBPi<vBNi<0vBPiw+(Pr(CTi))+vBNiw-(Pr(¬C|Ti)),vBNi<0vBPivBPiw-(Pr(CTi))+vBNiw+(Pr(¬C|Ti)),vBPi<0vBNi
Vi(aN|Ti)= vNPi(1-w+(Pr(¬C|Ti)))+vNNiw+(Pr(¬C|Ti)),0vNPi<vNNivNPiw-(Pr(CTi))+vNNi(1-w-(Pr(¬C|Ti))),vNPi<vNNi<0vNPiw-(Pr(CTi))+vNNiw+(Pr(¬C|Ti)),vNPi<0vNNi

式中:Vi(aP|Ti)、Vi(aB|Ti)和Vi(aN|Ti)分别为对目标Ti采取接受、进一步研究和拒绝动作得到的累积前景价值.

最后,根据累积前景价值最大的原则,每个目标的三支决策规则为

(P)如果满足Vi(aP|Ti)≥Vi(aB|Ti)和Vi(aP|Ti)≥Vi(aN|Ti), 则Ti∈POS(C).

(B)如果满足Vi(aB|Ti)≥Vi(aP|Ti)和Vi(aB|Ti)≥Vi(aN|Ti), 则Ti∈BND(C).

(N)如果满足Vi(aN|Ti)≥Vi(aP|Ti)和Vi(aN|Ti)≥Vi(aB|Ti), 则Ti∈NEG(C).

3 仿真及实验分析

3.1 仿真分析

采用文献[16]中的无人机数据进行实验分析,具体数据如下:假设我机在空战中遭遇5架敌机,敌机目标集合表示为T={T1, T2, …, T5} ;每架敌机选取8个评估指标,即类型、距离、角度、速度、高度、干扰能力、穿透能力和防护等级,评估指标集合表示为A={A1, A2, …, A8},其中,距离、角度和高度为成本型指标,其余为效益型指标.归一化多属性直觉模糊信息矩阵Z表2所示.

表2   归一化多属性直觉模糊信息矩阵

Tab.2  Normalized multi-attribute intuitionistic fuzzy evaluation information matrix

目标T1T2T3T4T5
类型(0.7, 0.2)(0.7, 0.0)(0.5, 0.1)(0.5, 0.3)(0.1, 0.6)
距离(0.235, 0.702)(0.281, 0.662)(0.194, 0.747)(0.203, 0.759)(0.726, 0.232)
角度(0.446, 0.272)(0.279, 0.515)(0.223, 0.511)(0.248, 0.584)(0.446, 0.272)
速度(0.546, 0.193)(0.136, 0.718)(0.579, 0.274)(0.239, 0.637)(0.568, 0.903)
高度(0.517, 0.167)(0.346, 0.501)(0.041, 0.917)(0.172, 0.824)(0.517, 0.286)
干扰能力(0.5, 0.1)(0.7, 0.0)(0.8, 0.1)(0.2, 0.5)(0.0, 0.6)
穿透能力(0.8, 0.1)(0.3, 0.4)(0.8, 0.0)(0.3, 0.1)(0.3, 0.5)
防护能力(0.6, 0.3)(0.6, 0.1)(0.8, 0.1)(0.6, 0.3)(0.2, 0.7)

注:(0.7,0.2)中0.7为隶属度,0.2为非隶属度.

新窗口打开| 下载CSV


通过公式计算得到每个目标的条件概率、不同状态下的权重函数及结果矩阵,如表3~5所示.

表3   每个目标的条件概率

Tab.3  Conditional probability of each target

目标Pr(C|Ti) (σ=0.35)
T10.7431
T20.5411
T30.6208
T40.3409
T50.3070

新窗口打开| 下载CSV


表4   每个目标的权重函数

Tab.4  Weight function of each target

权重类型T1T2T3T4T5
w+(Pr(C|Ti)0.56330.44200.48560.33990.3221
w-(Pr(C|Ti)0.62090.47990.53200.35420.3322
w+(PrC|Ti)0.29470.39970.35950.50810.5293
w-(PrC|Ti)0.29830.42830.37860.55830.5826

新窗口打开| 下载CSV


表5   每个目标的结果矩阵

Tab.5  Outcome matrix of each target

目标动作σ=0.35
C¬C
T1aP0.2610-0.4570
aB-0.2610-0.1600
aN-0.75480.1600
T2aP0.2233-0.5823
aB-0.2233-0.2038
aN-0.63800.2038
T3aP0.2297-0.5079
aB-0.2297-0.1778
aN-0.65640.1778
T4aP0.1748-0.6923
aB-0.1748-0.2423
aN-0.49950.2423
T5aP0.1709-0.7054
aB-0.1709-0.2469
aN-0.48840.2469

新窗口打开| 下载CSV


使用记分函数将直觉模糊信息矩阵转换为一般矩阵,利用公式计算得到η=(0.365,0.135, 0.5), 通过计算得到指标平均值、正理想点和负理想点,再乘以对应的偏好权重,即可得到本文需要的参考点,具体算式为

x=0.040 4×0.365+0.5339×0.135-0.518 8×0.5=-0.172 6

利用参考点、结果矩阵计算得到相应的价值函数,并由价值函数和权重函数计算得到相应的累积前景价值,如表6所示.其中,VPVBVN分别为目标采取接受、进一步研究和拒绝动作时的累积前景价值.

表6   每个目标的累积前景价值

Tab.6  Cumulative prospect value of each target

累积前景
价值类型
T1T2T3T4T5
VP0.0480-0.2439-0.1077-0.5721-0.6275
VB-0.1589-0.1336-0.1067-0.1251-0.1319
VN-0.7560-0.3817-0.4889-0.0637-0.0246

新窗口打开| 下载CSV


表3可知,基于综合直觉模糊信息矩阵的态势评估的排序结果是T1>T3>T2>T4>T5.由表6可知,基于决策规则的直觉模糊信息矩阵的客观分类结果是POS(C)={T1},BND(C)={T2, T3},NEG(C)={T4, T5}.这意味着首先应该攻击和干扰T1,不攻击和干扰T4T5,需要更多的信息判断是否要攻击T2T3.

3.2 实验对比与分析

3.2.1 评估结果对比与分析

为了进一步说明本方法的有效性和优越性,本文与文献[7-8,16]的决策方法进行对比,简要对4个方案的评估结果进行分析.其中,文献[7]采用直觉模糊VIKOR方法,文献[8]采用三支决策的方法,文献[16]采用直觉模糊相似度量推理模型(IFSMRM)方法.4种决策方法仿真分析时使用同一组数据,决策结果对比如表7所示.

表7   实验结果对比

Tab.7  Comparison of experimental results

方法类型排序结果分类结果
本文方法T1>T3>T2>T4>T5POS(C)={T1}BND(C)={T3,T2}NEG(C)={T4,T5}
VIKOR[7]T3>T1>T4>T2>T5
三支决策[8]T1>T3>T2>T4>T5POS(C)={T1,T3}BND(C)={T2}NEG(C)={T4,T5}
IFSMRM[16]T3>T1>T2>T4>T5

新窗口打开| 下载CSV


在4种方法的评估结果中,本文方法与三支决策方法得到的排序结果一致,分类结果有所不同,说明决策者的心理态度会影响威胁评估结果.在战场中考虑决策者心理具有研究价值,验证了本文方法的正确性.本文方法与IFSMRM方法所得结果在目标T1T3上不一致,与T3相比,T1的速度更快,类型指标的值更大,表示作战能力更强,更容易发起攻击,因此T1的威胁等级更高;IFSMRM方法预先设定了7个威胁等级,目标T1T3在相同的威胁等级中,T2被划分到下一个威胁等级中;T3T2相比,距离、角度和高度等略小,但T3的类型也略小,表示其作战能力稍差,因此二者的威胁程度相差不大,本文方法将T2T3划分到同一个区间是合理的,并且将目标划分到3个区间符合人类心理认知,验证了本方法的合理性.本文方法与VIKOR方法得到的排序结果不一致,与T3相比,T1的速度更快,类型指标值更大,表示作战能力更强,更容易发起攻击,因此T1的威胁等级更高;与T4相比,T2的速度较小,距离较远,但其类型指标值远大于T4,表示其作战能力远强于T4,有能力发动突然袭击,因此T2的威胁等级更高,显然本文方法更符合客观分析.

与文献[7]使用的VIKOR方法相比,本文方法得到的威胁评估结果更符合实际认知,且能提供客观分类结果,更好地为决策者提供决策支持.与文献[8]仅使用三支决策对比,两者使用同样的方法计算三支决策的条件概率,三支决策中威胁排序结果与概率大小保持一致,因此两种方法得到的排序结果相同;同时本文方法将累积前景理论和三支决策相结合,将决策者的心理考虑到评估结果中,不同决策者可以根据自己的风险偏好选择偏好权重,得到不同的参考点;同一决策者面对不同的战场态势,得到不同的参考点;由不同的参考点得到不同的分类结果,符合真实战场环境,解决了以往态势评估未考虑决策者心理的问题.与文献[16]使用的IFSMRM方法对比,本文采用三支决策的方法,不仅得到了威胁排序结果,而且得到了对目标的具体操作,不同域的目标有不同的操作,有利于飞行员进行快速决策,解决了当前决策困难、易产生误判的问题.并且无需事先设定威胁等级,可根据新的三支决策规则实时地做出威胁分类,选择优先作战目标.

4种方法的目标威胁评估值如图1所示.4种方法均通过比较目标威胁值得到威胁排序结果,即表7中的排序结果.

图1

图1   4种方法的目标威胁评估值

Fig.1   Threat assessment results of 4 methods


3.2.2 复杂度对比与分析

根据4种方法的具体流程,可得其时间复杂度均为O(mn).随机进行10次实验,方法耗时结果如图2所示.在4种方法对比中,虽然本文方法耗时较高,但本文方法和其他方法具有相同且较低的时间复杂度,耗时仍然能够满足战场实时性要求.

图2

图2   4种方法的耗时

Fig.2   Time of 4 methods


3.3 决策参数分析

为了验证不同类型的飞行员在面对相同的战场环境时会有不同的态势评估结果,采用了3种典型的参数组合,如表8所示.表8中参数a=0.37, b=0.59, ζ=1, θ=1.51来源于文献[17]中的实验值;参数a=1, b=1, ζ=1, θ=2.25以及参数 a=1.21, b=1.21, ζ=1, θ=2.25来源于文献[14]中的实验值;权重函数参数均来源于文献[14]中的实验值.

表8   3种典型的参数组合

飞行员
类型
价值函数参数权重函数参数
冒险型a=0.37, b=0.59, ζ=1, θ=1.51φ=0.61, δ=0.66
中间型a=1, b=1, ζ=1, θ=2.25φ=0.58, δ=0.58
保守型a=1.21, b=1.21, ζ=1, θ=2.25φ=0.55, δ=0.49

Tab.8 3 typical parameter combinations

新窗口打开| 下载CSV


为了清楚说明决策参数对目标态势评估的影响,通过数值仿真得到了3种类型下的目标态势评估关系.由表9表10可知,在3种典型参数组合情况下,威胁评估结果总体比较稳定,但是目标分类结果不同.因为威胁评估排序结果与条件概率的排序保持一致,所以不同类型的飞行员只影响分类结果.首先,冒险型决策者认为目标T2T3都应该攻击;中间型和保守型认为目标T2T3需要更多的信息来判断是否需要攻击,说明不同类型的飞行员决策结果不同,受到了飞行员主观心理因素的影响.其次,中间型和保守型的分类结果相同,但累积前景价值不同,保守型的目标T4T5的累积前景价值更小,说明其不想攻击的意愿更强烈,该决策结果符合人类认知.总体结果表明,在实际空战中要充分考虑飞行员的心理,对飞行员类型进行判断,从而使态势评估结果更符合实际作战情况.

表9   3种类型决策者的累积前景价值

Tab.9  Cumulative prospect value of 3 types of decision makers

飞行
员类
累积
前景
价值
类型
T1T2T3T4T5
冒险型VP0.1991-0.06000.0513-0.3253-0.3706
VB-0.1584-0.2255-0.1767-0.1884-0.1533
VN-0.4633-0.1707-0.26380.09360.1317
中间型VP0.0474-0.1876-0.0765-0.4531-0.4980
VB-0.1034-0.0888-0.0660-0.0788-0.0840
VN-0.6082-0.2993-0.3837-0.0422-0.0119
保守型VP0.0546-0.1220-0.0371-0.3254-0.3599
VB-0.0522-0.0437-0.0299-0.0373-0.0408
VN-0.4500-0.2079-0.2703-0.01210.0096

新窗口打开| 下载CSV


表10   3种类型决策者的结果

Tab.10  Results of 3 types of decision makers

飞行员类型排序结果分类结果
冒险型T1>T3>T2>T4>T5POS(C)={T1,T3,T2}NEG(C)={T4,T5}
中间型T1>T3>T2>T4>T5POS(C)={T1}BND(C)={T3,T2}NEG(C)={T4,T5}
保守型T1>T3>T2>T4>T5POS(C)={T1}BND(C)={T3,T2}NEG(C)={T4,T5}

新窗口打开| 下载CSV


3.4 参数敏感性分析

为研究不同参数取值对态势评估结果的影响情况,分析不同参数的灵敏度,如损失规避系数θ、风险态度系数ab,使用最大累积前景价值Vmax=max{VP, VB, VN}比较态势评估结果.损失规避系数θ对不同目标的最大累积前景价值Vmax的影响如图3所示.

图3

图3   损失规避系数θ扰动

Fig.3   Perturbation of loss avoidance coefficient θ


图3可知,随着损失规避系数θ的不断增加,目标T1T2T3T4T5的最大累积前景价值均处于下降趋势,但目标所在的域不同,代表其威胁程度也不同.具体而言,随着θ的增大,目标T1仍处于正域,采取攻击操作的累积前景价值不断减小,说明目标T1的威胁评估结果随θ的增大而减小.随着θ的增大,目标T2T3从正域过渡到边界域,采取不攻击操作的累积前景价值不断减小,说明目标T2T3的威胁评估结果随θ的增大而减小.随着θ的增大,目标T4T5仍处于负域,采取不攻击操作的累积前景价值不断减小,说明目标T4T5的威胁评估结果随θ的增大而增大.综上说明,随着损失规避系数θ的不断增大,目标的威胁评估结果也呈现出不同的变化趋势.

图4为风险态度系数a对不同目标的最大累积前景价值Vmax的影响.图4可知,随着a不断增加,目标T2T3的累积前景价值较大值均呈现出先下降后缓慢上升的趋势;目标T1T4T5的累积前景价值较大值均呈现出下降趋势.随着a不断增大,决策者类型从冒险型不断向保守型过渡.在这个过程中,目标T2T3从正域过渡到边界域,目标T4从负域过渡到边界域;目标T3T4T5的排序发生微小变化,说明不同类型的决策者会影响排序和分类结果.

图4

图4   风险态度系数a扰动

Fig.4   Perturbation of risk-return attitude coefficient a


图5为风险态度系数b对不同目标的最大累积前景价值Vmax的影响.图5可知,随着b不断增大,目标的累积前景价值最大值均呈现出上升的趋势.但目标所在的域不同,代表其威胁程度也不同.具体而言,随着b的增大,决策者类型从冒险型向保守型不断过渡,在这个过程中,目标T1T2T3仍处于正域或边界域,采取攻击操作的累积前景价值不断增大,说明目标的威胁评估结果随b的增大而增大;目标T4T5处于负域,采取不攻击操作的累积前景价值不断增大,说明目标T4T5的威胁评估结果随b的增大而减小.综上说明,随着风险态度系数b的不断增大,目标的威胁评估结果也呈现出不同的变化趋势.

图5

图5   风险态度系数b扰动

Fig.5   Perturbation of risk-return attitude coefficient b


4 结论

针对无人机态势评估决策困难及未考虑复杂外界环境对决策者的影响问题,提出一种基于累积前景理论的三支决策模型,并据此进行了仿真实验,主要结论如下:

(1) 与传统的态势评估方法相比,基于累积前景与三支决策的态势评估方法在对目标进行决策时,能够使得分类结果更加合理,有利于飞行员做出快速决策,解决了决策困难的问题,更好地满足战场快速打击的需求.

(2) 与传统的三支决策方法相比,本方法在决策过程中引入了累积前景价值,不同的决策者有不同的风险偏好,同一决策者在面对不同战场态势时心理也会发生变化,从而得到不同的参考点,可以反映出决策者的决策偏好和风险态度,使决策结果更符合现实场景.

(3) 不同类型的飞行员在面对相同目标时会得到不同的态势评估结果,表明在实际空战中要充分考虑飞行员的心理,对飞行员类型进行判断,从而使态势评估结果更符合实际作战情况.

参考文献

袁覃恩, 慕晓冬, 易昭湘, .

基于局部动态贝叶斯网络的无人机态势评估

[J]. 火力与指挥控制, 2018, 43(4): 57-61.

[本文引用: 6]

YUAN Tianen, MU Xiaodong, YI Zhaoxiang, et al.

Real-time evaluation of UAV situation based on local dynamic Bayesian network

[J]. Fire Control and Command Control, 2018, 43(4): 57-61.

[本文引用: 6]

SHI G Q, PU J W, ZHANG L, et al.

Situation assessment based on multi-entity Bayesian network

[C]∥2020 IEEE 16th International Conference on Control & Automation. Singapore: IEEE, 2020: 702-707.

[本文引用: 1]

高阳阳, 余敏建, 王子博琳.

基于云模型和改进熵权的空战多目标威胁等级评估

[J]. 火力与指挥控制, 2018, 43(9): 35-39.

[本文引用: 1]

GAO Yangyang, YU Minjian, WANG Zibolin.

Target threat assessment technology for UAV air combat based on cloud model and improved entropy weight

[J]. Fire Control and Command Control, 2018, 43(9): 35-39.

[本文引用: 1]

奚之飞, 徐安, 寇英信, .

基于PCA-MPSO-ELM的空战目标威胁评估

[J]. 航空学报, 2020, 41(9): 216-231.

[本文引用: 1]

XI Zhifei, XU An, KOU Yingxin, et al.

Target threat assessment in air combat based on PCA-MPSO-ELM algorithm

[J]. Acta Aeronautica et Astronautica Sinica, 2020, 41(9): 216-231.

[本文引用: 1]

GAO Y, LI D.

Unmanned aerial vehicle swarm distributed cooperation method based on situation awareness consensus and its information processing mechanism

[J]. Knowledge-Based Systems, 2020, 188: 105034.

DOI:10.1016/j.knosys.2019.105034      URL     [本文引用: 2]

韩博文, 姚佩阳, 钟赟, .

基于QABC-IFMADM算法的有人/无人机编队作战威胁评估

[J]. 电子学报, 2018, 46(7): 1584-1592.

DOI:10.3969/j.issn.0372-2112.2018.07.007      [本文引用: 2]

信息化条件下有人/无人机编队作战环境具有高度不确定性,如何对目标进行快速有效的威胁评估成为亟待解决的问题.在直觉模糊集框架下,研究决策者对方案具有偏好,目标属性值为区间数且权重未知的评估问题,提出一种量子蜂群(QABC)优化属性权重的直觉模糊多属性决策(IFMADM)的威胁评估方法.首先,建立方案偏好模型;其次,综合考虑客观优化排序和决策者方案偏好信息,建立主客观最优属性权重优化模型,并采用量子蜂群算法优化属性权重,使得属性权重更准确地反映实际情况.最后,通过编队对地作战威胁评估算例验证了所提方法的合理性与有效性.

HAN B, YAO P, ZHONG Y, et al.

Threat assessment of manned/unmanned aerial vehicle formation based on QABC-IFMADM algorithm

[J]. Acta Electronica Sinica, 2018, 46(7): 1584.

[本文引用: 2]

ZHANG K, KONG W R, LIU P P, et al.

Assessment and sequencing of air target threat based on intuitionistic fuzzy entropy and dynamic VIKOR

[J]. Journal of Systems Engineering and Electronics, 2018, 29(2): 305-310.

DOI:10.21629/JSEE.2018.02.11      URL     [本文引用: 5]

GAO Y, LI D, ZHONG H.

A novel target threat assessment method based on three-way decisions under intuitionistic fuzzy multi-attribute decision making environment

[J]. Engineering Applications of Artificial Intelligence, 2020, 87: 103276.

DOI:10.1016/j.engappai.2019.103276      URL     [本文引用: 5]

赵晓冬, 王飞, 张妮.

一种基于前景理论的毕达哥拉斯犹豫模糊不确定语言 ELECTRE 多属性决策方法

[J]. 控制与决策, 2020, 35(9): 2245-2251.

[本文引用: 1]

ZHAO Xiaodong, WANG Fei, ZHANG Ni.

Method for multi-attribute decision-making with Pythagorean hesitant fuzzy uncertain linguistic ELECTRE based on prospect theory

[J]. Control and Decision, 2020, 35(9): 2245-2251.

[本文引用: 1]

奚之飞, 徐安, 寇英信, .

基于前景理论的空战目标威胁评估

[J]. 兵工学报, 2020, 41(6): 1236-1248.

DOI:10.3969/j.issn.1000-1093.2020.06.021      [本文引用: 1]

空战目标威胁评估是目标分配与火力分配的基础。针对目标威胁评估研究存在确定指标权重时未考虑指标间的相关性,采用单一灰色关联分析(GRA)方法和逼近理想点(TOPSIS)方法不能准确反映目标威胁大小,以及未考虑飞行员决策时面临损失和收益时的不同态度等问题,在综合GRA和TOPSIS的基础上,提出一种基于前景GRA-TOPSIS的空战目标威胁评估模型。提出灰色关联深度的概念,结合极大熵确定指标权重;利用指标之间的灰色关联度变权方法对指标权重进行修正,避免指标之间的相关性影响;利用GRA方法分析目标指标序列的曲线形状相似性,结合TOPSIS方法分析位置的相似性,基于前景理论,将飞行员面临收益以损失的态度融合到目标威胁评估中,得到能够体现飞行员特质的目标威胁评估结果。通过仿真验证了所提方法的有效性以及合理性。

XI Zhifei, XU An, KOU Yingxin, et al.

Air combat target threat assessment based on prospect theory

[J]. Acta Armamentraii, 2020, 41(6): 1236-1248.

[本文引用: 1]

胡涛, 王栋, 黄震宇, .

基于前景理论和 VIKOR 法的空战威胁评估

[J]. 空军工程大学学报(自然科学版), 2020, 21(5): 62-68.

[本文引用: 1]

HU Tao, WANG Dong, HUANG Zhenyu, et al.

Air combat threat assessment based on prospect theory and VIKOR method

[J]. Journal of Air Force Engineering University (Natural Science Edition), 2020, 21(5): 62-68.

[本文引用: 1]

YAO Y Y.

The superiority of three-way decisions in probabilistic rough set models

[J]. Information Sciences, 2011, 181(6): 1080-1096.

DOI:10.1016/j.ins.2010.11.019      URL     [本文引用: 1]

TVERSKY A, KAHNEMAN D.

Advances in prospect theory: Cumulative representation of uncertainty

[J]. Journal of Risk and Uncertainty, 1992, 5(4): 297-323.

DOI:10.1007/BF00122574      URL     [本文引用: 1]

马健, 孙秀霞.

基于效用曲线改进的前景理论价值函数

[J]. 信息与控制, 2011, 40(4): 501-506.

[本文引用: 3]

针对选取前景理论函数参数时仅考虑决策的不理性而并未区分决策者的风险态度这一特点,基于效用曲线改进了前景理论价值函数的形式并扩展了其参数范围.该函数借鉴效用曲线依据曲线形状区分决策者风险态度的方法,同时对比已有的实验数据,得出价值函数曲线形状与决策者风险态度相关,为价值函数参数选取提供了一定的理论依据.计算实例表明,该方法便于参数选取,决策结果稳定、有效,此外,风险决策时决策结果受参考点变化的影响远大于决策者不同的风险态度,在实际决策时对于参考点的选取需要非常谨慎.

MA Jian, SUN Xiuxia.

Modified value function in prospect theory based on utility curve

[J]. Information and Control, 2011, 40(4): 501-506.

[本文引用: 3]

According to the characteristic that irrationality of decision making is only considered and risk attitude of decision-maker is not distinguished when function parameters of value prospect theory is selected,the form of value function is modified and the range of function parameters is expanded based on utility curve.The function uses the utility curve method which distinguishes the risk attitude of decision-maker according to curve's figure for reference,and the conclusion that curve's figure of value function is related with risk attitude of decision-maker is elicited according to existed experimental data.This provides certain theoretical basis for selecting value of parameters in value function.The calculation example shows that the method is convenient for selecting parameters,and the decision-making result is stable and valid,and besides,the influence of various reference points on the result of risk decision making is bigger than various risk attitudes,thus their selection needs highly caution in actual decision-making.

GUO Z, CHEN W, ZHANG J, et al.

Hazard assessment of potentially dangerous bodies within a cliff based on the Fuzzy-AHP method: A case study of the Mogao Grottoes, China

[J]. Bulletin of Engineering Geology and the Environment, 2017, 76(3): 1009-1020.

DOI:10.1007/s10064-016-0865-7      URL     [本文引用: 1]

WANG Y, LIU S Y, NIU W, et al.

Threat assessment method based on intuitionistic fuzzy similarity measurement reasoning with orientation

[J]. China Communications, 2014, 11(6): 119-128.

[本文引用: 5]

XU H, ZHOU J, XU W.

A decision-making rule for modeling travelers’ route choice behavior based on cumulative prospect theory

[J]. Transportation Research Part C: Emerging Technologies, 2011, 19(2): 218-228.

DOI:10.1016/j.trc.2010.05.009      URL     [本文引用: 1]

/