随着信息技术的不断发展,电子商务(简称电商)已成为最受欢迎的消费方式之一.而在线交易量的急剧增加为物流网络带来了巨大压力,因此高效的商品交付是电商公司提高服务水平的关键因素之一.电商物流中的“最后一公里”交付问题,即商品从配送站到客户的配送过程是一个典型的有容量约束的车辆路径规划问题(Capacitated Vehicle Routing Problem,CVRP),可以描述为由一个配送中心向n 个客户派遣K 辆车配送货物,每个客户由一辆车服务且仅被服务一次.每辆车设有运送容量上限,而每个客户有特定的货物量需求.其目的为得到成本最低的客户配送服务路线.
目前,利用CVRP求解算法[1 ,2 ] 估算现实生活中各条道路的行驶成本较为困难,得到的优化结果存在较大误差,实际应用价值往往较低.Bertsimas等[3 ] 认为,各条道路的行驶成本之间存在相互依赖性,因此对基于最短路径或最短行驶时间成本矩阵的CVRP模型进行优化难以得到符合实际需求的路径.此外,经验丰富的驾驶员(专家)并不总是遵循最短路径成本矩阵选择配送路径,如优先避免易产生拥堵或交通信号灯多的道路.因此,在路径规划中还需要融入驾驶员的经验或偏好.Kovacs等[4 ] 研究考虑一致性的车辆路径规划问题.其中,一致性包括人员一致性,即客户希望被所熟悉的驾驶员服务[5 ] ;区域一致性,即让驾驶员在更为熟悉的服务区域进行配送[6 ,7 ] .然而,驾驶员的偏好并不总需要完全遵循一致性原则.Liu等[8 ] 通过分析驾驶员的连续数据轨迹来揭示驾驶员的操作模式.韦增欣等[9 ] 建立基于多属性决策方法的路径优化模型,并根据驾驶员的偏好调整模型参数.Pahlavani等[10 ] 利用局部线性神经模糊模型学习驾驶员偏好来预测路线.He等[11 ] 根据市区出租车司机的经验,利用协作偏好发现算法和智能司机网络生成算法计算在旅行时间变化的情况下更可靠的行驶路线.黄敏等[12 ] 根据出租车司机的经验, 提出约束深度强化学习算法,并在线计算不同时间段内的最快行驶路线.以上研究多针对特定应用场景进行数据或实验分析,因此方法的应用价值有限.
逆向优化是指已知一个优化问题的专家解(最优解),从而逆向推断优化模型的参数[13 ] .Ahuja等[13 ,14 ] 研究了基于最优性条件和对偶理论的逆线性优化问题,并将其扩展到逆向网络流问题.Zhang等[15 ,16 ] 利用牛顿法解决了在l ∞ 范数下的逆向组合问题.Heuberger[17 ] 综述了不同逆向组合优化问题的算法.随着大数据应用的发展,研究者提出在逆向优化中结合数据来设计开发算法.You 等[18 ] 对城市卡车货运量进行建模和预测,并提出利用观测数据对车辆路径规划问题的模型参数进行校准,使得优化结果更符合实际需求.牟健慧等[19 ] 将逆向优化理论和方法引入车间调度领域,建立考虑调度效率和稳定性的数学模型,以解决多目标流水车间的逆调度问题.Bärmann等[20 ] 结合逆向优化和在线学习算法的思想,将模型解决方案与专家决策之间的差异设为成本矩阵的梯度,并利用迭代法令梯度逐渐降低并收敛.Aswani等[21 ,22 ] 考虑了在凸优化问题最优解的测量结果被噪声破坏情况下的逆向优化问题.Saez-gallego等[23 ] 利用逆向优化法预测对价格敏感的消费者的电力总需求,建立电力总需求的价格响应模型,并利用广义逆向优化法估算模型参数.
综上分析,提出一种逆向优化方法.通过学习配送过程中专家的过往路径决策,逆向优化得到能够表示专家对道路选择偏好的成本矩阵,并将该矩阵应用于CVRP模型,令配送路径能够融入专家经验.
1 逆向优化模型
对“最后一公里”的配送问题进行建模,并根据该模型的对偶模型建立逆向优化数学模型.
1.1 CVRP模型
配送问题描述如下:共有K辆车为n个客户进行配送,每个客户仅由一辆车负责服务,每辆车的容量约束为Q,第i个客户的需求量为$q_i (i=1,2,…,n) $,0≤q_i≤Q.定义集合V={0,1,…,n},其中0表示配送中心. $C={c_{ij},i,j∈V}$为成本矩阵,其中$c_{ij}$ 为从客户i到客户j的行驶成本.优化目标为在满足车辆容量约束的前提下,得到总行驶成本最小的车辆配送路径.
模型的决策变量包括$x_{ij} (i,j∈V) $和车辆到达客户i时的负载$u_i(i∈V/{0})$.如果车辆直接从客户i行驶到客户j,则$x_{ij}=1$,否则$x_{ij}=0$.
(1) min ∑ i ∈ V ∑ j ∈ V c ij x ij
(2) s.t. ∑ j ∈ V x ij = 1 , ∀ i ∈ V / { 0 }
(3) ∑ i ∈ V x ij = 1 , ∀ j ∈ V / { 0 }
(4) ∑ j ∈ V x 0 j = K
(5) u i - u j + Q ( 1 - x ij ) ≥ q i
(6) ∀ i , j ∈ V / { 0 } u i ≤ Q , ∀ i ∈ V / { 0 }
(7) u i ≥ q i , ∀ i ∈ V / { 0 }
(8) x ij ∈ { 0,1 } , ∀ i , j ∈ V
目标函数式(1)使得总行驶成本最小化;式(2)和(3)确保每一位客户仅被服务一次并控制网络流守恒;式(4)确保配送车辆数目为K ;式(5)为子回路消除约束和车辆容量约束;式(6)和(7)用于定义ui ;式(8)为决策变量的属性定义.
1.2 逆向优化模型
在模型L的对偶模型基础上建立逆向优化模型,目标为给定专家解$x^*$,在满足约束的前提下,对模型中的成本矩阵C进行最小化变动,得到一个新的成本矩阵$\bar{C} = \{\bar{c}_{ij},i,j \epsilon V\}$,使得$x^*$成为模型L的最优解.
定义集合 J = { ( i , j ) | x i j * = 1 } 和 J - = ( i , j ) | x ij * = 0 . 为简化运算,假设:
其中: $x_{ij}^*$ 为$x^*$ 的决策变量; $η_{ij}$ 为$\bar{c}_{ij}$ 的增量; $σ_{ij}$ 为$c_{ij}$ 的减量.且η_ij≥0,σ_ij≥0,η_ij σ_ij≥0.η_ij 和σ_ij 即为C的变动量.则逆向优化模型(模型Inv-L)表示为
(9) min ∑ i ∈ V ∑ j ∈ V ( η ij + σ ij )
(10) s.t. ∑ i ∈ V ∑ j ∈ V ( c ij + η ij - σ ij ) x ij * - Kδ - ∑ i ∈ V ∑ j ∈ V φ ij - ∑ j ∈ V / { 0 } ∑ j ∈ V / { 0 } [ α i + β j + ( Q - q i ) γ ij + Q λ i + q i μ i ] = 0
(11) δ ≤ c 00 + η 00
(12) β j + δ ≤ c 0 j + η 0 j , ∀ ( 0 , j ) ∈ J -
(13) β j + δ + ϕ 0 j = c 0 j + η 0 j - σ 0 j
(14) ∀ 0 , j ∈ J α i ≤ c i 0 + η i 0 , ∀ ( i , 0 ) ∈ J -
(15) α i + ϕ i 0 = c i 0 + η i 0 - σ i 0 , ∀ ( i , 0 ) ∈ J
(16) α i + β j - Q γ ij ≤ c ij + η ij
(17) ∀ ( i , j ) ∈ J - , i , j ∈ V / 0 α i + β j - Q γ ij + φ ij = c ij + η ij - σ ij
(18) ∀ ( i , j ) ∈ J , i , j ∈ V / { 0 } ∑ j ∈ V / { 0 } γ ij - ∑ j ∈ V / { 0 } γ ji + λ i + μ i ≤ 0
(19) ∀ i ∈ V / { 0 } α i , β j , δ ∈ R , ∀ i , j ∈ V / { 0 }
(20) λ i , ϕ ij ≤ 0 , ∀ i , j ∈ V / { 0 }
(21) γ ij , μ i , η ij , σ ij ≥ 0 , ∀ i , j ∈ V / { 0 }
式中: α i , β j , δ , γ ij , λ i , μ i 和 ϕ ij 分别为模型L中式(2)~(8)的对偶变量.目标函数式(9)使C 的变动量最小化;式(10)确保x * 成为模型L的最优解;式(11)~(18)为对偶约束;式(19)~(21)为对偶变量的属性定义.
利用模型Inv-L的迭代算法(Inv-L Algorithm,ILA),输入过往专家解,迭代多次求解Inv-L模型,每次求解时对C 进行变动,最终得到一个能够代表专家经验的成本矩阵.然而,该算法在每次迭代时均需要对模型Inv-L求最优解,因此求解时间较长.对此,开发一种在线学习算法以实现对过往专家解的学习.
2 乘性权重更新算法
乘性权重更新(Multiplicative Weights Updates,MWU)算法[24 ] 采用迭代更新的方式,在每一次迭代中,通过定义每轮的损失成本,并利用乘法更新规则对决策进行更新,能够使得总损失成本的期望最小化.采用改进的MWU算法,将原MWU算法中基于列向量的运算扩展至基于二维矩阵的运算,并针对问题属性确定算法学习率,使得改进后的算法具备收敛性.
2.1 算法描述
MWU算法通过学习过往的专家解,使得$C_t $不断趋近于$C_{true}$.在每一次(设为第t轮)迭代中,首先根据$C_t$ 和$X(p_t) $,正向求得$x_t$.然后,将$x_t^*$ 和$x_t$ 之间的差异 $\frac{x_t^* - x_t}{||x_t^* - x_t||_∞}$ 作为$m_t$.算法依据$m_t$更新下一轮的决策权重,更新公式如下:
(22) w t + 1 = w t - μ ( w t ☉ m t )
给定初始权重w 1 =(θij )n × n , θij =1;μ = ln n 2 T . MWU算法的伪代码如下所示.
Input: (X (pt ), x t * ) , t ={1,2, …, T },w 1 , μ
xt =arg min (Ct ·xt |xt ∈X (pt ))
对于第t轮,算法首先通过标准化$w_t$ 得到$C_t$,并基于$C_t$ 和$X(p_t) $正向求得$x_t$.然后计算$m_t $.最后基于$m_t $和式(22)将$w_t$ 更新为$w_{t+1} $.经过反复迭代,得到一个成本矩阵序列$C_1,C_2,…,C_T$,其中$C_T$ 为最终学习得到的代表专家经验的成本矩阵.由于MWU算法具有收敛性,所以可以保证经过足够多次学习迭代后得到的$C_T$ 无限接近于$C_{true}$.
在 MWU算法中, 仅存在一个循环体,在每个循环中均需要调用数学优化技术CPLEX执行一次CVRP的求解.由于CPLEX求解线性规划的内置算法为分支定界算法,所以MWU算法的时间复杂度为 O ( n' 2 n' ) , 其中 n' 为输入参数.
2.2 算法收敛性
在MWU算法中, P t = w t w t 1 , 总的损失成本期望为 ∑ t = 1 T ( m t · P t ) . Arora等[25 ] 证明了MWU算法可以确保对于任何概率分布P ,均有
(23) ∑ t = 1 T ( m t · P t ) ≤ ∑ t = 1 T [ ( m t + μ abs ( m t ) ) · P ] + ln n 2 μ
定义 F = { C ∈ R n × n | C 1 = 1 , c ij ≥ 0 } 将$C_{true}$ 和$C_t$ 代入式(23),可以证明当 . μ = ln n 2 T 时 , 均有
(24) 0 ≤ 1 T ∑ t = 1 T [ ( C true - C t ) · ( x t - x t * ) ] ≤ 2 ln n 2 T
3 算例分析
利用不同维度的算法指标评价MWU算法的有效性,然后分别利用VRPLIB算例库中的随机算例和电商真实算例进行实验分析,所需计算机配置为Intel® CoreTM i7-8500@3.60 GHz,内存为8 GB.程序由MATLAB R2019b进行编译,模型求解调用CPLEX IBM 12.9.0.
VRPLIB算例库中的随机算例包括成本矩阵、车辆容量和客户需求等信息.基于给定的成本矩阵,通过更改客户需求和车辆容量能够生成多个不同算例,求得各算例的最优解并作为专家解.将同一规模下的专家解分成两部分,其中90%的专家解为训练集,10%的专家解为验证集.
3.1 算法指标
从算法的有效性、可实现性和收敛性等方面提出以下评价指标.
ε 1 = 1 M ∑ i = 1 M C true · x i * - C true · x i C true · x i *
其中:M 为验证集的数量.该指标用于衡量由逆向优化学习算法得到的最优解与真实专家解目标函数值之间的平均偏差.
ε 2 = 1 T ∑ t = 1 T [ ( C true - C t ) · ( x t - x t * ) ]
其中:Edit为求解两个变量编辑距离的函数.编辑距离为将一个字符串转换为另一个字符串所需要的最小操作数.该指标用于衡量验证集中的专家解和由逆向优化学习法得到的最优解之间的平均编辑距离.
S = 1 - 1 M ∑ i = 1 M Edit ( x i * , x i ) | H |
其中:|H|为算例规模.判断两个解的相似度需要同时考虑E和|H|.此外,评价指标还包括算法的学习时间(CPU).
3.2 基于随机算例的实验分析
3.2.1 学习效果分析 分别利用ILA和MWU算法求解具有10个客户点的算例.当训练集数(N 1 )和验证集数(N 2 )逐渐增大时,两种算法的性能分析如图1 所示.可知,在指标 ε 1 , ε 2 , S 和CPU方面,MWU算法均优于ILA.随着训练集数量的增多,两种算法的学习效果均有所提升,提升趋势均为先激增后趋于平缓,且MWU算法的提升幅度更显著.因此,在求解大规模算例时,可以考虑权衡训练时间和训练效果.虽然MWU算法需要花费较长时间学习CT ,但在后续过程中,可以直接利用CT 求解新问题.而其在求解新问题时的效率等同于求解一个CVRP问题时的效率.因此,前期训练完成后,MWU算法求解新问题的效率较高.
图1
图1
两种算法的效果对比
Fig.1
Comparison of two learning algorithms
根据上述结论,选择MWU算法求解后续算例,结果如表2 所示.可知,与验证集中已知专家解相比,MWU算法可以提供S =88.05%和ε 1 =0.16%的配送路径,表明了算法在学习专家经验方面的有效性.此外,MWU算法的ε 2 =1.40,表明算法的收敛性较好.
3.2.2 网络图结构的敏感性分析 上述随机算例均为非对称网络,而在较多配送场景中,网络结构呈对称性.因此,需要分析MWU算法应用于两种不同网络结构时的性能,结果如图2 所示.保留非对称网络成本矩阵的上半部分不变,可以将其转化为对称成本矩阵.
图2
图2
网络结构对称性敏感性分析
Fig.2
Sensitivity analysis of two networks
图2 中,与求解非对称网络的算例相比,MWU算法在求解具有对称网络结构算例时的ε 1 值略低,而ε 2 值相对一致.表明算法的收敛性不受网络对称性影响.由于对称网络中存在多个最优解,会对算法学习造成干扰,所以对其进行学习后所得求解结果的相似度较差.此外,随着算例规模增大,对称网络的训练时间呈逐渐增长趋势.
3.3 基于电商真实数据的算例分析
采用某电商在2018年9月至11月的日常家用电器配送路线进行算例分析.服务区域为上海市徐汇区,收集到包括422辆厢型货车在内的20万条订单的配送路线.数据集包括配送的车次、时间和地址等.根据企业反馈,选择工作效率较高的驾驶员,收集其配送路径,并剔除异常解和存在客户时间窗约束等不属于研究范围的解,但此时所得专家解并不等同于基于最短路径矩阵的CVRP模型最优解.将驾驶员的配送路径作为专家解进行学习,以得到能够代表驾驶员经验的成本矩阵,并用于求解新问题.
3.3.1 数据预处理 数据预处理包括缺省值、异常值和地址的经纬度转换处理.为了增加客户点的重复度,减少模型训练难度,根据客户的地理位置采用K -means算法进行聚类.从算法的可实现性、聚类合理性及其聚类指标等方面综合分析,选择聚类数为55,客户聚类情况如图3 所示.数据预处理后共得到185个真实算例.
图3
图3
研究区域的客户聚类分布
Fig.3
Clustered customer network of studied district
3.3.2 结果分析 各聚类质心的欧氏距离成本矩阵为C 1 ,算法学习过程为从185个算例中随机选择184个并利用MWU算法进行训练,将剩余的一个算例作为验证算例.将学习得到的CT 代入路径规划模型L,求解验证算例,并对比所得解与已知专家解.按上述过程训练185次,求每一次训练效果的平均值.由于真实场景下无法得到真实的成本矩阵,所以本节不考虑指标ε 1 和ε 2 .此外,利用C 1 求解算例,并对比采用算法前后的优化效果,如表3 所示.
可知,当基于CT 求解算例时,求解结果明显优于基于C 1 的求解结果,在指标E 和S 上分别优化了37.38%和24.67%.同时,所得配送路径与专家解之间的平均相似度为71.84%,表明当真实算例的数量增加时,算法的学习效应也将随之加强.
4 结语与展望
对电商物流中的“最后一公里”交付问题进行研究.在现实生活中,经验丰富的驾驶员(专家)并不总是遵循最短路径成本矩阵选择配送路径.因此,采用逆向优化法学习专家的过往路径决策方案,训练得到代表专家对路径选择偏好的成本矩阵,将其应用到路径规划模型中求解.其中,利用MWU算法实现对专家经验的学习,并设计随机算例和电商真实物流算例进行验证.结果表明:① MWU算法在收敛性、有效性和可实现性方面表现优异,利用学习所得成本矩阵可以得到近似专家的配送路径;② 算法收敛性不受网络结构非对称性和对称性的影响;③ 在求解真实算例时,MWU算法将所得解与专家解的平均相似度提升至71.84%,表明该算法能够有效利用过往经验,提供与专家解相似度极高的配送路径.
在后续研究中,可以将逆向优化法应用于具有不确定性车辆路径规划等更复杂的优化问题.同时,现实生活中的专家解集往往来源于多个专家,如何对专家解进行分类并提供全局逆向优化方案,同样值得探讨.
参考文献
View Option
[1]
范厚明 , 徐振林 , 李阳 , 等 . 混合遗传算法求解多中心联合配送路径问题
[J]. 上海交通大学学报 , 2019 , 53 (8 ):1000 -1009 .
[本文引用: 1]
FAN Houming , XU Zhenlin , LI Yang , et al . Hybrid genetic algorithm for solving multi-depot joint distribution routing problem
[J]. Journal of Shanghai Jiao Tong University , 2019 , 53 (8 ):1000 -1009 .
[本文引用: 1]
[2]
熊浩 , 鄢慧丽 , 周和平 , 等 . 多阶段动态车辆路径问题实时优化策略
[J]. 上海交通大学学报 , 2013 , 47 (3 ):450 -453 .
[本文引用: 1]
XIONG Hao , YAN Huili , ZHOU Heping , et al . Real-time optimization strategy of the multi-period dynamic vehicle routing problems
[J]. Journal of Shanghai Jiao Tong University , 2013 , 47 (3 ):450 -453 .
[本文引用: 1]
[4]
KOVACS A A , GOLDEN B L , HARTL R F , et al . Vehicle routing problems in which consistency considerations are important: A survey
[J]. Networks , 2014 , 64 (3 ):192 -213 .
DOI:10.1002/net.v64.3
URL
[本文引用: 1]
[9]
韦增欣 , 陈进来 , 罗朝晖 . 基于驾驶员偏好的最优路径选择
[J]. 交通运输系统工程与信息 , 2010 , 10 (6 ):141 -144 .
[本文引用: 1]
WEI Zengxin , CHEN Jinlai , LUO Chaohui . Optimal path selection based on driver’s preference
[J]. Journal of Transportation Systems Engineering and Information Technology , 2010 , 10 (6 ):141 -144 .
[本文引用: 1]
[10]
PAHLAVANI P , DELAVAR M R . Multi-criteria route planning based on a driver’s preferences in multi-criteria route selection
[J]. Transportation Research Part C: Emerging Technologies , 2014 , 40 :14 -35 .
DOI:10.1016/j.trc.2014.01.001
URL
[本文引用: 1]
[11]
HE Z C , CHEN K Y , CHEN X Y . A collaborative method for route discovery using taxi drivers’ experience and preferences
[J]. IEEE Transactions on Intelligent Transportation Systems , 2018 , 19 (8 ):2505 -2514 .
DOI:10.1109/TITS.2017.2753468
URL
[本文引用: 1]
[12]
黄敏 , 毛锋 , 钱宇翔 . 基于出租车司机经验的约束深度强化学习算法路径挖掘
[J]. 计算机应用研究 , 2020 , 37 (5 ):1298 -1302 .
[本文引用: 1]
HUANG Min , MAO Feng , QIAN Yuxiang . Mining fastest route using taxi drivers’ experience via constrained deep reinforcement learning
[J]. Application Research of Computers , 2020 , 37 (5 ):1298 -1302 .
[本文引用: 1]
[16]
ZHANG J Z , LIU Z H . A general model of some inverse combinatorial optimization problems and its solution method under l ∞ norm
[J]. Journal of Combinatorial Optimization , 2002 , 6 (2 ):207 -227 .
DOI:10.1023/A:1013807829021
URL
[本文引用: 1]
[18]
YOU S I , CHOW J Y J , RITCHIE S G . Inverse vehicle routing for activity-based urban freight forecast modeling and city logistics
[J]. Transportmetrica A: Transport Science , 2016 , 12 (7 ):650 -673 .
DOI:10.1080/23249935.2016.1189723
URL
[本文引用: 1]
[19]
牟健慧 , 郭前建 , 高亮 , 等 . 基于混合的多目标遗传算法的多目标流水车间逆调度问题求解方法
[J]. 机械工程学报 , 2016 , 52 (22 ):186 -197 .
[本文引用: 1]
MOU Jianhui , GUO Qianjian , GAO Liang , et al . Multi-objective genetic algorithm for solving multi-objective flow-shop inverse scheduling problems
[J]. Journal of Mechanical Engineering , 2016 , 52 (22 ):186 -197 .
[本文引用: 1]
[20]
BÄRMANN A , MARTIN A , POKUTTA S , et al . An online-learning approach to inverse optimization
[DB/OL]. (2020 -03 -29 )[2020-07-08]. https://arxiv.org/abs/1810.12997v2.
URL
[本文引用: 1]
[22]
CHAN T C Y , LEE T , TEREKHOV D . Inverse optimization: Closed-form solutions, geometry, and goodness of fit
[J]. Management Science , 2019 , 65 (3 ):1115 -1135 .
DOI:10.1287/mnsc.2017.2992
URL
[本文引用: 1]
[23]
SAEZ-GALLEGO J , MORALES J M . Short-term forecasting of price-responsive loads using inverse optimization
[J]. IEEE Transactions on Smart Grid , 2018 , 9 (5 ):4805 -4814 .
DOI:10.1109/TSG.5165411
URL
[本文引用: 1]
[24]
ARORA S , HAZAN E , KALE S . Fast algorithms for approximate semidefinite programming using the multiplicative weights update method
[C]// 46th Annual IEEE Symposium on Foundations of Computer Science (FOCS’05) . Pittsburgh, USA: IEEE , 2005 : 339 -348 .
[本文引用: 1]
[25]
ARORA S , HAZAN E , KALE S . The multiplicative weights update method: A meta-algorithm and applications
[J]. Theory of Computing , 2012 , 8 (1 ):121 -164 .
DOI:10.4086/toc
URL
[本文引用: 1]
混合遗传算法求解多中心联合配送路径问题
1
2019
... 目前,利用CVRP求解算法[1 ,2 ] 估算现实生活中各条道路的行驶成本较为困难,得到的优化结果存在较大误差,实际应用价值往往较低.Bertsimas等[3 ] 认为,各条道路的行驶成本之间存在相互依赖性,因此对基于最短路径或最短行驶时间成本矩阵的CVRP模型进行优化难以得到符合实际需求的路径.此外,经验丰富的驾驶员(专家)并不总是遵循最短路径成本矩阵选择配送路径,如优先避免易产生拥堵或交通信号灯多的道路.因此,在路径规划中还需要融入驾驶员的经验或偏好.Kovacs等[4 ] 研究考虑一致性的车辆路径规划问题.其中,一致性包括人员一致性,即客户希望被所熟悉的驾驶员服务[5 ] ;区域一致性,即让驾驶员在更为熟悉的服务区域进行配送[6 ,7 ] .然而,驾驶员的偏好并不总需要完全遵循一致性原则.Liu等[8 ] 通过分析驾驶员的连续数据轨迹来揭示驾驶员的操作模式.韦增欣等[9 ] 建立基于多属性决策方法的路径优化模型,并根据驾驶员的偏好调整模型参数.Pahlavani等[10 ] 利用局部线性神经模糊模型学习驾驶员偏好来预测路线.He等[11 ] 根据市区出租车司机的经验,利用协作偏好发现算法和智能司机网络生成算法计算在旅行时间变化的情况下更可靠的行驶路线.黄敏等[12 ] 根据出租车司机的经验, 提出约束深度强化学习算法,并在线计算不同时间段内的最快行驶路线.以上研究多针对特定应用场景进行数据或实验分析,因此方法的应用价值有限. ...
混合遗传算法求解多中心联合配送路径问题
1
2019
... 目前,利用CVRP求解算法[1 ,2 ] 估算现实生活中各条道路的行驶成本较为困难,得到的优化结果存在较大误差,实际应用价值往往较低.Bertsimas等[3 ] 认为,各条道路的行驶成本之间存在相互依赖性,因此对基于最短路径或最短行驶时间成本矩阵的CVRP模型进行优化难以得到符合实际需求的路径.此外,经验丰富的驾驶员(专家)并不总是遵循最短路径成本矩阵选择配送路径,如优先避免易产生拥堵或交通信号灯多的道路.因此,在路径规划中还需要融入驾驶员的经验或偏好.Kovacs等[4 ] 研究考虑一致性的车辆路径规划问题.其中,一致性包括人员一致性,即客户希望被所熟悉的驾驶员服务[5 ] ;区域一致性,即让驾驶员在更为熟悉的服务区域进行配送[6 ,7 ] .然而,驾驶员的偏好并不总需要完全遵循一致性原则.Liu等[8 ] 通过分析驾驶员的连续数据轨迹来揭示驾驶员的操作模式.韦增欣等[9 ] 建立基于多属性决策方法的路径优化模型,并根据驾驶员的偏好调整模型参数.Pahlavani等[10 ] 利用局部线性神经模糊模型学习驾驶员偏好来预测路线.He等[11 ] 根据市区出租车司机的经验,利用协作偏好发现算法和智能司机网络生成算法计算在旅行时间变化的情况下更可靠的行驶路线.黄敏等[12 ] 根据出租车司机的经验, 提出约束深度强化学习算法,并在线计算不同时间段内的最快行驶路线.以上研究多针对特定应用场景进行数据或实验分析,因此方法的应用价值有限. ...
多阶段动态车辆路径问题实时优化策略
1
2013
... 目前,利用CVRP求解算法[1 ,2 ] 估算现实生活中各条道路的行驶成本较为困难,得到的优化结果存在较大误差,实际应用价值往往较低.Bertsimas等[3 ] 认为,各条道路的行驶成本之间存在相互依赖性,因此对基于最短路径或最短行驶时间成本矩阵的CVRP模型进行优化难以得到符合实际需求的路径.此外,经验丰富的驾驶员(专家)并不总是遵循最短路径成本矩阵选择配送路径,如优先避免易产生拥堵或交通信号灯多的道路.因此,在路径规划中还需要融入驾驶员的经验或偏好.Kovacs等[4 ] 研究考虑一致性的车辆路径规划问题.其中,一致性包括人员一致性,即客户希望被所熟悉的驾驶员服务[5 ] ;区域一致性,即让驾驶员在更为熟悉的服务区域进行配送[6 ,7 ] .然而,驾驶员的偏好并不总需要完全遵循一致性原则.Liu等[8 ] 通过分析驾驶员的连续数据轨迹来揭示驾驶员的操作模式.韦增欣等[9 ] 建立基于多属性决策方法的路径优化模型,并根据驾驶员的偏好调整模型参数.Pahlavani等[10 ] 利用局部线性神经模糊模型学习驾驶员偏好来预测路线.He等[11 ] 根据市区出租车司机的经验,利用协作偏好发现算法和智能司机网络生成算法计算在旅行时间变化的情况下更可靠的行驶路线.黄敏等[12 ] 根据出租车司机的经验, 提出约束深度强化学习算法,并在线计算不同时间段内的最快行驶路线.以上研究多针对特定应用场景进行数据或实验分析,因此方法的应用价值有限. ...
多阶段动态车辆路径问题实时优化策略
1
2013
... 目前,利用CVRP求解算法[1 ,2 ] 估算现实生活中各条道路的行驶成本较为困难,得到的优化结果存在较大误差,实际应用价值往往较低.Bertsimas等[3 ] 认为,各条道路的行驶成本之间存在相互依赖性,因此对基于最短路径或最短行驶时间成本矩阵的CVRP模型进行优化难以得到符合实际需求的路径.此外,经验丰富的驾驶员(专家)并不总是遵循最短路径成本矩阵选择配送路径,如优先避免易产生拥堵或交通信号灯多的道路.因此,在路径规划中还需要融入驾驶员的经验或偏好.Kovacs等[4 ] 研究考虑一致性的车辆路径规划问题.其中,一致性包括人员一致性,即客户希望被所熟悉的驾驶员服务[5 ] ;区域一致性,即让驾驶员在更为熟悉的服务区域进行配送[6 ,7 ] .然而,驾驶员的偏好并不总需要完全遵循一致性原则.Liu等[8 ] 通过分析驾驶员的连续数据轨迹来揭示驾驶员的操作模式.韦增欣等[9 ] 建立基于多属性决策方法的路径优化模型,并根据驾驶员的偏好调整模型参数.Pahlavani等[10 ] 利用局部线性神经模糊模型学习驾驶员偏好来预测路线.He等[11 ] 根据市区出租车司机的经验,利用协作偏好发现算法和智能司机网络生成算法计算在旅行时间变化的情况下更可靠的行驶路线.黄敏等[12 ] 根据出租车司机的经验, 提出约束深度强化学习算法,并在线计算不同时间段内的最快行驶路线.以上研究多针对特定应用场景进行数据或实验分析,因此方法的应用价值有限. ...
Data-driven estimation in equilibrium using inverse optimization
1
2015
... 目前,利用CVRP求解算法[1 ,2 ] 估算现实生活中各条道路的行驶成本较为困难,得到的优化结果存在较大误差,实际应用价值往往较低.Bertsimas等[3 ] 认为,各条道路的行驶成本之间存在相互依赖性,因此对基于最短路径或最短行驶时间成本矩阵的CVRP模型进行优化难以得到符合实际需求的路径.此外,经验丰富的驾驶员(专家)并不总是遵循最短路径成本矩阵选择配送路径,如优先避免易产生拥堵或交通信号灯多的道路.因此,在路径规划中还需要融入驾驶员的经验或偏好.Kovacs等[4 ] 研究考虑一致性的车辆路径规划问题.其中,一致性包括人员一致性,即客户希望被所熟悉的驾驶员服务[5 ] ;区域一致性,即让驾驶员在更为熟悉的服务区域进行配送[6 ,7 ] .然而,驾驶员的偏好并不总需要完全遵循一致性原则.Liu等[8 ] 通过分析驾驶员的连续数据轨迹来揭示驾驶员的操作模式.韦增欣等[9 ] 建立基于多属性决策方法的路径优化模型,并根据驾驶员的偏好调整模型参数.Pahlavani等[10 ] 利用局部线性神经模糊模型学习驾驶员偏好来预测路线.He等[11 ] 根据市区出租车司机的经验,利用协作偏好发现算法和智能司机网络生成算法计算在旅行时间变化的情况下更可靠的行驶路线.黄敏等[12 ] 根据出租车司机的经验, 提出约束深度强化学习算法,并在线计算不同时间段内的最快行驶路线.以上研究多针对特定应用场景进行数据或实验分析,因此方法的应用价值有限. ...
Vehicle routing problems in which consistency considerations are important: A survey
1
2014
... 目前,利用CVRP求解算法[1 ,2 ] 估算现实生活中各条道路的行驶成本较为困难,得到的优化结果存在较大误差,实际应用价值往往较低.Bertsimas等[3 ] 认为,各条道路的行驶成本之间存在相互依赖性,因此对基于最短路径或最短行驶时间成本矩阵的CVRP模型进行优化难以得到符合实际需求的路径.此外,经验丰富的驾驶员(专家)并不总是遵循最短路径成本矩阵选择配送路径,如优先避免易产生拥堵或交通信号灯多的道路.因此,在路径规划中还需要融入驾驶员的经验或偏好.Kovacs等[4 ] 研究考虑一致性的车辆路径规划问题.其中,一致性包括人员一致性,即客户希望被所熟悉的驾驶员服务[5 ] ;区域一致性,即让驾驶员在更为熟悉的服务区域进行配送[6 ,7 ] .然而,驾驶员的偏好并不总需要完全遵循一致性原则.Liu等[8 ] 通过分析驾驶员的连续数据轨迹来揭示驾驶员的操作模式.韦增欣等[9 ] 建立基于多属性决策方法的路径优化模型,并根据驾驶员的偏好调整模型参数.Pahlavani等[10 ] 利用局部线性神经模糊模型学习驾驶员偏好来预测路线.He等[11 ] 根据市区出租车司机的经验,利用协作偏好发现算法和智能司机网络生成算法计算在旅行时间变化的情况下更可靠的行驶路线.黄敏等[12 ] 根据出租车司机的经验, 提出约束深度强化学习算法,并在线计算不同时间段内的最快行驶路线.以上研究多针对特定应用场景进行数据或实验分析,因此方法的应用价值有限. ...
Workforce management in periodic delivery operations
1
2013
... 目前,利用CVRP求解算法[1 ,2 ] 估算现实生活中各条道路的行驶成本较为困难,得到的优化结果存在较大误差,实际应用价值往往较低.Bertsimas等[3 ] 认为,各条道路的行驶成本之间存在相互依赖性,因此对基于最短路径或最短行驶时间成本矩阵的CVRP模型进行优化难以得到符合实际需求的路径.此外,经验丰富的驾驶员(专家)并不总是遵循最短路径成本矩阵选择配送路径,如优先避免易产生拥堵或交通信号灯多的道路.因此,在路径规划中还需要融入驾驶员的经验或偏好.Kovacs等[4 ] 研究考虑一致性的车辆路径规划问题.其中,一致性包括人员一致性,即客户希望被所熟悉的驾驶员服务[5 ] ;区域一致性,即让驾驶员在更为熟悉的服务区域进行配送[6 ,7 ] .然而,驾驶员的偏好并不总需要完全遵循一致性原则.Liu等[8 ] 通过分析驾驶员的连续数据轨迹来揭示驾驶员的操作模式.韦增欣等[9 ] 建立基于多属性决策方法的路径优化模型,并根据驾驶员的偏好调整模型参数.Pahlavani等[10 ] 利用局部线性神经模糊模型学习驾驶员偏好来预测路线.He等[11 ] 根据市区出租车司机的经验,利用协作偏好发现算法和智能司机网络生成算法计算在旅行时间变化的情况下更可靠的行驶路线.黄敏等[12 ] 根据出租车司机的经验, 提出约束深度强化学习算法,并在线计算不同时间段内的最快行驶路线.以上研究多针对特定应用场景进行数据或实验分析,因此方法的应用价值有限. ...
The efficacy of exclusive territory assignments to delivery vehicle drivers
1
2008
... 目前,利用CVRP求解算法[1 ,2 ] 估算现实生活中各条道路的行驶成本较为困难,得到的优化结果存在较大误差,实际应用价值往往较低.Bertsimas等[3 ] 认为,各条道路的行驶成本之间存在相互依赖性,因此对基于最短路径或最短行驶时间成本矩阵的CVRP模型进行优化难以得到符合实际需求的路径.此外,经验丰富的驾驶员(专家)并不总是遵循最短路径成本矩阵选择配送路径,如优先避免易产生拥堵或交通信号灯多的道路.因此,在路径规划中还需要融入驾驶员的经验或偏好.Kovacs等[4 ] 研究考虑一致性的车辆路径规划问题.其中,一致性包括人员一致性,即客户希望被所熟悉的驾驶员服务[5 ] ;区域一致性,即让驾驶员在更为熟悉的服务区域进行配送[6 ,7 ] .然而,驾驶员的偏好并不总需要完全遵循一致性原则.Liu等[8 ] 通过分析驾驶员的连续数据轨迹来揭示驾驶员的操作模式.韦增欣等[9 ] 建立基于多属性决策方法的路径优化模型,并根据驾驶员的偏好调整模型参数.Pahlavani等[10 ] 利用局部线性神经模糊模型学习驾驶员偏好来预测路线.He等[11 ] 根据市区出租车司机的经验,利用协作偏好发现算法和智能司机网络生成算法计算在旅行时间变化的情况下更可靠的行驶路线.黄敏等[12 ] 根据出租车司机的经验, 提出约束深度强化学习算法,并在线计算不同时间段内的最快行驶路线.以上研究多针对特定应用场景进行数据或实验分析,因此方法的应用价值有限. ...
Territory planning and vehicle dispatching with driver learning
1
2007
... 目前,利用CVRP求解算法[1 ,2 ] 估算现实生活中各条道路的行驶成本较为困难,得到的优化结果存在较大误差,实际应用价值往往较低.Bertsimas等[3 ] 认为,各条道路的行驶成本之间存在相互依赖性,因此对基于最短路径或最短行驶时间成本矩阵的CVRP模型进行优化难以得到符合实际需求的路径.此外,经验丰富的驾驶员(专家)并不总是遵循最短路径成本矩阵选择配送路径,如优先避免易产生拥堵或交通信号灯多的道路.因此,在路径规划中还需要融入驾驶员的经验或偏好.Kovacs等[4 ] 研究考虑一致性的车辆路径规划问题.其中,一致性包括人员一致性,即客户希望被所熟悉的驾驶员服务[5 ] ;区域一致性,即让驾驶员在更为熟悉的服务区域进行配送[6 ,7 ] .然而,驾驶员的偏好并不总需要完全遵循一致性原则.Liu等[8 ] 通过分析驾驶员的连续数据轨迹来揭示驾驶员的操作模式.韦增欣等[9 ] 建立基于多属性决策方法的路径优化模型,并根据驾驶员的偏好调整模型参数.Pahlavani等[10 ] 利用局部线性神经模糊模型学习驾驶员偏好来预测路线.He等[11 ] 根据市区出租车司机的经验,利用协作偏好发现算法和智能司机网络生成算法计算在旅行时间变化的情况下更可靠的行驶路线.黄敏等[12 ] 根据出租车司机的经验, 提出约束深度强化学习算法,并在线计算不同时间段内的最快行驶路线.以上研究多针对特定应用场景进行数据或实验分析,因此方法的应用价值有限. ...
Uncovering cabdrivers’ behavior patterns from their digital traces
1
2010
... 目前,利用CVRP求解算法[1 ,2 ] 估算现实生活中各条道路的行驶成本较为困难,得到的优化结果存在较大误差,实际应用价值往往较低.Bertsimas等[3 ] 认为,各条道路的行驶成本之间存在相互依赖性,因此对基于最短路径或最短行驶时间成本矩阵的CVRP模型进行优化难以得到符合实际需求的路径.此外,经验丰富的驾驶员(专家)并不总是遵循最短路径成本矩阵选择配送路径,如优先避免易产生拥堵或交通信号灯多的道路.因此,在路径规划中还需要融入驾驶员的经验或偏好.Kovacs等[4 ] 研究考虑一致性的车辆路径规划问题.其中,一致性包括人员一致性,即客户希望被所熟悉的驾驶员服务[5 ] ;区域一致性,即让驾驶员在更为熟悉的服务区域进行配送[6 ,7 ] .然而,驾驶员的偏好并不总需要完全遵循一致性原则.Liu等[8 ] 通过分析驾驶员的连续数据轨迹来揭示驾驶员的操作模式.韦增欣等[9 ] 建立基于多属性决策方法的路径优化模型,并根据驾驶员的偏好调整模型参数.Pahlavani等[10 ] 利用局部线性神经模糊模型学习驾驶员偏好来预测路线.He等[11 ] 根据市区出租车司机的经验,利用协作偏好发现算法和智能司机网络生成算法计算在旅行时间变化的情况下更可靠的行驶路线.黄敏等[12 ] 根据出租车司机的经验, 提出约束深度强化学习算法,并在线计算不同时间段内的最快行驶路线.以上研究多针对特定应用场景进行数据或实验分析,因此方法的应用价值有限. ...
基于驾驶员偏好的最优路径选择
1
2010
... 目前,利用CVRP求解算法[1 ,2 ] 估算现实生活中各条道路的行驶成本较为困难,得到的优化结果存在较大误差,实际应用价值往往较低.Bertsimas等[3 ] 认为,各条道路的行驶成本之间存在相互依赖性,因此对基于最短路径或最短行驶时间成本矩阵的CVRP模型进行优化难以得到符合实际需求的路径.此外,经验丰富的驾驶员(专家)并不总是遵循最短路径成本矩阵选择配送路径,如优先避免易产生拥堵或交通信号灯多的道路.因此,在路径规划中还需要融入驾驶员的经验或偏好.Kovacs等[4 ] 研究考虑一致性的车辆路径规划问题.其中,一致性包括人员一致性,即客户希望被所熟悉的驾驶员服务[5 ] ;区域一致性,即让驾驶员在更为熟悉的服务区域进行配送[6 ,7 ] .然而,驾驶员的偏好并不总需要完全遵循一致性原则.Liu等[8 ] 通过分析驾驶员的连续数据轨迹来揭示驾驶员的操作模式.韦增欣等[9 ] 建立基于多属性决策方法的路径优化模型,并根据驾驶员的偏好调整模型参数.Pahlavani等[10 ] 利用局部线性神经模糊模型学习驾驶员偏好来预测路线.He等[11 ] 根据市区出租车司机的经验,利用协作偏好发现算法和智能司机网络生成算法计算在旅行时间变化的情况下更可靠的行驶路线.黄敏等[12 ] 根据出租车司机的经验, 提出约束深度强化学习算法,并在线计算不同时间段内的最快行驶路线.以上研究多针对特定应用场景进行数据或实验分析,因此方法的应用价值有限. ...
基于驾驶员偏好的最优路径选择
1
2010
... 目前,利用CVRP求解算法[1 ,2 ] 估算现实生活中各条道路的行驶成本较为困难,得到的优化结果存在较大误差,实际应用价值往往较低.Bertsimas等[3 ] 认为,各条道路的行驶成本之间存在相互依赖性,因此对基于最短路径或最短行驶时间成本矩阵的CVRP模型进行优化难以得到符合实际需求的路径.此外,经验丰富的驾驶员(专家)并不总是遵循最短路径成本矩阵选择配送路径,如优先避免易产生拥堵或交通信号灯多的道路.因此,在路径规划中还需要融入驾驶员的经验或偏好.Kovacs等[4 ] 研究考虑一致性的车辆路径规划问题.其中,一致性包括人员一致性,即客户希望被所熟悉的驾驶员服务[5 ] ;区域一致性,即让驾驶员在更为熟悉的服务区域进行配送[6 ,7 ] .然而,驾驶员的偏好并不总需要完全遵循一致性原则.Liu等[8 ] 通过分析驾驶员的连续数据轨迹来揭示驾驶员的操作模式.韦增欣等[9 ] 建立基于多属性决策方法的路径优化模型,并根据驾驶员的偏好调整模型参数.Pahlavani等[10 ] 利用局部线性神经模糊模型学习驾驶员偏好来预测路线.He等[11 ] 根据市区出租车司机的经验,利用协作偏好发现算法和智能司机网络生成算法计算在旅行时间变化的情况下更可靠的行驶路线.黄敏等[12 ] 根据出租车司机的经验, 提出约束深度强化学习算法,并在线计算不同时间段内的最快行驶路线.以上研究多针对特定应用场景进行数据或实验分析,因此方法的应用价值有限. ...
Multi-criteria route planning based on a driver’s preferences in multi-criteria route selection
1
2014
... 目前,利用CVRP求解算法[1 ,2 ] 估算现实生活中各条道路的行驶成本较为困难,得到的优化结果存在较大误差,实际应用价值往往较低.Bertsimas等[3 ] 认为,各条道路的行驶成本之间存在相互依赖性,因此对基于最短路径或最短行驶时间成本矩阵的CVRP模型进行优化难以得到符合实际需求的路径.此外,经验丰富的驾驶员(专家)并不总是遵循最短路径成本矩阵选择配送路径,如优先避免易产生拥堵或交通信号灯多的道路.因此,在路径规划中还需要融入驾驶员的经验或偏好.Kovacs等[4 ] 研究考虑一致性的车辆路径规划问题.其中,一致性包括人员一致性,即客户希望被所熟悉的驾驶员服务[5 ] ;区域一致性,即让驾驶员在更为熟悉的服务区域进行配送[6 ,7 ] .然而,驾驶员的偏好并不总需要完全遵循一致性原则.Liu等[8 ] 通过分析驾驶员的连续数据轨迹来揭示驾驶员的操作模式.韦增欣等[9 ] 建立基于多属性决策方法的路径优化模型,并根据驾驶员的偏好调整模型参数.Pahlavani等[10 ] 利用局部线性神经模糊模型学习驾驶员偏好来预测路线.He等[11 ] 根据市区出租车司机的经验,利用协作偏好发现算法和智能司机网络生成算法计算在旅行时间变化的情况下更可靠的行驶路线.黄敏等[12 ] 根据出租车司机的经验, 提出约束深度强化学习算法,并在线计算不同时间段内的最快行驶路线.以上研究多针对特定应用场景进行数据或实验分析,因此方法的应用价值有限. ...
A collaborative method for route discovery using taxi drivers’ experience and preferences
1
2018
... 目前,利用CVRP求解算法[1 ,2 ] 估算现实生活中各条道路的行驶成本较为困难,得到的优化结果存在较大误差,实际应用价值往往较低.Bertsimas等[3 ] 认为,各条道路的行驶成本之间存在相互依赖性,因此对基于最短路径或最短行驶时间成本矩阵的CVRP模型进行优化难以得到符合实际需求的路径.此外,经验丰富的驾驶员(专家)并不总是遵循最短路径成本矩阵选择配送路径,如优先避免易产生拥堵或交通信号灯多的道路.因此,在路径规划中还需要融入驾驶员的经验或偏好.Kovacs等[4 ] 研究考虑一致性的车辆路径规划问题.其中,一致性包括人员一致性,即客户希望被所熟悉的驾驶员服务[5 ] ;区域一致性,即让驾驶员在更为熟悉的服务区域进行配送[6 ,7 ] .然而,驾驶员的偏好并不总需要完全遵循一致性原则.Liu等[8 ] 通过分析驾驶员的连续数据轨迹来揭示驾驶员的操作模式.韦增欣等[9 ] 建立基于多属性决策方法的路径优化模型,并根据驾驶员的偏好调整模型参数.Pahlavani等[10 ] 利用局部线性神经模糊模型学习驾驶员偏好来预测路线.He等[11 ] 根据市区出租车司机的经验,利用协作偏好发现算法和智能司机网络生成算法计算在旅行时间变化的情况下更可靠的行驶路线.黄敏等[12 ] 根据出租车司机的经验, 提出约束深度强化学习算法,并在线计算不同时间段内的最快行驶路线.以上研究多针对特定应用场景进行数据或实验分析,因此方法的应用价值有限. ...
基于出租车司机经验的约束深度强化学习算法路径挖掘
1
2020
... 目前,利用CVRP求解算法[1 ,2 ] 估算现实生活中各条道路的行驶成本较为困难,得到的优化结果存在较大误差,实际应用价值往往较低.Bertsimas等[3 ] 认为,各条道路的行驶成本之间存在相互依赖性,因此对基于最短路径或最短行驶时间成本矩阵的CVRP模型进行优化难以得到符合实际需求的路径.此外,经验丰富的驾驶员(专家)并不总是遵循最短路径成本矩阵选择配送路径,如优先避免易产生拥堵或交通信号灯多的道路.因此,在路径规划中还需要融入驾驶员的经验或偏好.Kovacs等[4 ] 研究考虑一致性的车辆路径规划问题.其中,一致性包括人员一致性,即客户希望被所熟悉的驾驶员服务[5 ] ;区域一致性,即让驾驶员在更为熟悉的服务区域进行配送[6 ,7 ] .然而,驾驶员的偏好并不总需要完全遵循一致性原则.Liu等[8 ] 通过分析驾驶员的连续数据轨迹来揭示驾驶员的操作模式.韦增欣等[9 ] 建立基于多属性决策方法的路径优化模型,并根据驾驶员的偏好调整模型参数.Pahlavani等[10 ] 利用局部线性神经模糊模型学习驾驶员偏好来预测路线.He等[11 ] 根据市区出租车司机的经验,利用协作偏好发现算法和智能司机网络生成算法计算在旅行时间变化的情况下更可靠的行驶路线.黄敏等[12 ] 根据出租车司机的经验, 提出约束深度强化学习算法,并在线计算不同时间段内的最快行驶路线.以上研究多针对特定应用场景进行数据或实验分析,因此方法的应用价值有限. ...
基于出租车司机经验的约束深度强化学习算法路径挖掘
1
2020
... 目前,利用CVRP求解算法[1 ,2 ] 估算现实生活中各条道路的行驶成本较为困难,得到的优化结果存在较大误差,实际应用价值往往较低.Bertsimas等[3 ] 认为,各条道路的行驶成本之间存在相互依赖性,因此对基于最短路径或最短行驶时间成本矩阵的CVRP模型进行优化难以得到符合实际需求的路径.此外,经验丰富的驾驶员(专家)并不总是遵循最短路径成本矩阵选择配送路径,如优先避免易产生拥堵或交通信号灯多的道路.因此,在路径规划中还需要融入驾驶员的经验或偏好.Kovacs等[4 ] 研究考虑一致性的车辆路径规划问题.其中,一致性包括人员一致性,即客户希望被所熟悉的驾驶员服务[5 ] ;区域一致性,即让驾驶员在更为熟悉的服务区域进行配送[6 ,7 ] .然而,驾驶员的偏好并不总需要完全遵循一致性原则.Liu等[8 ] 通过分析驾驶员的连续数据轨迹来揭示驾驶员的操作模式.韦增欣等[9 ] 建立基于多属性决策方法的路径优化模型,并根据驾驶员的偏好调整模型参数.Pahlavani等[10 ] 利用局部线性神经模糊模型学习驾驶员偏好来预测路线.He等[11 ] 根据市区出租车司机的经验,利用协作偏好发现算法和智能司机网络生成算法计算在旅行时间变化的情况下更可靠的行驶路线.黄敏等[12 ] 根据出租车司机的经验, 提出约束深度强化学习算法,并在线计算不同时间段内的最快行驶路线.以上研究多针对特定应用场景进行数据或实验分析,因此方法的应用价值有限. ...
Combinatorial algorithms for inverse network flow problems
2
2002
... 逆向优化是指已知一个优化问题的专家解(最优解),从而逆向推断优化模型的参数[13 ] .Ahuja等[13 ,14 ] 研究了基于最优性条件和对偶理论的逆线性优化问题,并将其扩展到逆向网络流问题.Zhang等[15 ,16 ] 利用牛顿法解决了在l ∞ 范数下的逆向组合问题.Heuberger[17 ] 综述了不同逆向组合优化问题的算法.随着大数据应用的发展,研究者提出在逆向优化中结合数据来设计开发算法.You 等[18 ] 对城市卡车货运量进行建模和预测,并提出利用观测数据对车辆路径规划问题的模型参数进行校准,使得优化结果更符合实际需求.牟健慧等[19 ] 将逆向优化理论和方法引入车间调度领域,建立考虑调度效率和稳定性的数学模型,以解决多目标流水车间的逆调度问题.Bärmann等[20 ] 结合逆向优化和在线学习算法的思想,将模型解决方案与专家决策之间的差异设为成本矩阵的梯度,并利用迭代法令梯度逐渐降低并收敛.Aswani等[21 ,22 ] 考虑了在凸优化问题最优解的测量结果被噪声破坏情况下的逆向优化问题.Saez-gallego等[23 ] 利用逆向优化法预测对价格敏感的消费者的电力总需求,建立电力总需求的价格响应模型,并利用广义逆向优化法估算模型参数. ...
... [13 ,14 ]研究了基于最优性条件和对偶理论的逆线性优化问题,并将其扩展到逆向网络流问题.Zhang等[15 ,16 ] 利用牛顿法解决了在l ∞ 范数下的逆向组合问题.Heuberger[17 ] 综述了不同逆向组合优化问题的算法.随着大数据应用的发展,研究者提出在逆向优化中结合数据来设计开发算法.You 等[18 ] 对城市卡车货运量进行建模和预测,并提出利用观测数据对车辆路径规划问题的模型参数进行校准,使得优化结果更符合实际需求.牟健慧等[19 ] 将逆向优化理论和方法引入车间调度领域,建立考虑调度效率和稳定性的数学模型,以解决多目标流水车间的逆调度问题.Bärmann等[20 ] 结合逆向优化和在线学习算法的思想,将模型解决方案与专家决策之间的差异设为成本矩阵的梯度,并利用迭代法令梯度逐渐降低并收敛.Aswani等[21 ,22 ] 考虑了在凸优化问题最优解的测量结果被噪声破坏情况下的逆向优化问题.Saez-gallego等[23 ] 利用逆向优化法预测对价格敏感的消费者的电力总需求,建立电力总需求的价格响应模型,并利用广义逆向优化法估算模型参数. ...
Inverse optimization
1
2001
... 逆向优化是指已知一个优化问题的专家解(最优解),从而逆向推断优化模型的参数[13 ] .Ahuja等[13 ,14 ] 研究了基于最优性条件和对偶理论的逆线性优化问题,并将其扩展到逆向网络流问题.Zhang等[15 ,16 ] 利用牛顿法解决了在l ∞ 范数下的逆向组合问题.Heuberger[17 ] 综述了不同逆向组合优化问题的算法.随着大数据应用的发展,研究者提出在逆向优化中结合数据来设计开发算法.You 等[18 ] 对城市卡车货运量进行建模和预测,并提出利用观测数据对车辆路径规划问题的模型参数进行校准,使得优化结果更符合实际需求.牟健慧等[19 ] 将逆向优化理论和方法引入车间调度领域,建立考虑调度效率和稳定性的数学模型,以解决多目标流水车间的逆调度问题.Bärmann等[20 ] 结合逆向优化和在线学习算法的思想,将模型解决方案与专家决策之间的差异设为成本矩阵的梯度,并利用迭代法令梯度逐渐降低并收敛.Aswani等[21 ,22 ] 考虑了在凸优化问题最优解的测量结果被噪声破坏情况下的逆向优化问题.Saez-gallego等[23 ] 利用逆向优化法预测对价格敏感的消费者的电力总需求,建立电力总需求的价格响应模型,并利用广义逆向优化法估算模型参数. ...
Calculating some inverse linear programming problems
1
1996
... 逆向优化是指已知一个优化问题的专家解(最优解),从而逆向推断优化模型的参数[13 ] .Ahuja等[13 ,14 ] 研究了基于最优性条件和对偶理论的逆线性优化问题,并将其扩展到逆向网络流问题.Zhang等[15 ,16 ] 利用牛顿法解决了在l ∞ 范数下的逆向组合问题.Heuberger[17 ] 综述了不同逆向组合优化问题的算法.随着大数据应用的发展,研究者提出在逆向优化中结合数据来设计开发算法.You 等[18 ] 对城市卡车货运量进行建模和预测,并提出利用观测数据对车辆路径规划问题的模型参数进行校准,使得优化结果更符合实际需求.牟健慧等[19 ] 将逆向优化理论和方法引入车间调度领域,建立考虑调度效率和稳定性的数学模型,以解决多目标流水车间的逆调度问题.Bärmann等[20 ] 结合逆向优化和在线学习算法的思想,将模型解决方案与专家决策之间的差异设为成本矩阵的梯度,并利用迭代法令梯度逐渐降低并收敛.Aswani等[21 ,22 ] 考虑了在凸优化问题最优解的测量结果被噪声破坏情况下的逆向优化问题.Saez-gallego等[23 ] 利用逆向优化法预测对价格敏感的消费者的电力总需求,建立电力总需求的价格响应模型,并利用广义逆向优化法估算模型参数. ...
A general model of some inverse combinatorial optimization problems and its solution method under l ∞ norm
1
2002
... 逆向优化是指已知一个优化问题的专家解(最优解),从而逆向推断优化模型的参数[13 ] .Ahuja等[13 ,14 ] 研究了基于最优性条件和对偶理论的逆线性优化问题,并将其扩展到逆向网络流问题.Zhang等[15 ,16 ] 利用牛顿法解决了在l ∞ 范数下的逆向组合问题.Heuberger[17 ] 综述了不同逆向组合优化问题的算法.随着大数据应用的发展,研究者提出在逆向优化中结合数据来设计开发算法.You 等[18 ] 对城市卡车货运量进行建模和预测,并提出利用观测数据对车辆路径规划问题的模型参数进行校准,使得优化结果更符合实际需求.牟健慧等[19 ] 将逆向优化理论和方法引入车间调度领域,建立考虑调度效率和稳定性的数学模型,以解决多目标流水车间的逆调度问题.Bärmann等[20 ] 结合逆向优化和在线学习算法的思想,将模型解决方案与专家决策之间的差异设为成本矩阵的梯度,并利用迭代法令梯度逐渐降低并收敛.Aswani等[21 ,22 ] 考虑了在凸优化问题最优解的测量结果被噪声破坏情况下的逆向优化问题.Saez-gallego等[23 ] 利用逆向优化法预测对价格敏感的消费者的电力总需求,建立电力总需求的价格响应模型,并利用广义逆向优化法估算模型参数. ...
Inverse combinatorial optimization: A survey on problems, methods, and results
1
2004
... 逆向优化是指已知一个优化问题的专家解(最优解),从而逆向推断优化模型的参数[13 ] .Ahuja等[13 ,14 ] 研究了基于最优性条件和对偶理论的逆线性优化问题,并将其扩展到逆向网络流问题.Zhang等[15 ,16 ] 利用牛顿法解决了在l ∞ 范数下的逆向组合问题.Heuberger[17 ] 综述了不同逆向组合优化问题的算法.随着大数据应用的发展,研究者提出在逆向优化中结合数据来设计开发算法.You 等[18 ] 对城市卡车货运量进行建模和预测,并提出利用观测数据对车辆路径规划问题的模型参数进行校准,使得优化结果更符合实际需求.牟健慧等[19 ] 将逆向优化理论和方法引入车间调度领域,建立考虑调度效率和稳定性的数学模型,以解决多目标流水车间的逆调度问题.Bärmann等[20 ] 结合逆向优化和在线学习算法的思想,将模型解决方案与专家决策之间的差异设为成本矩阵的梯度,并利用迭代法令梯度逐渐降低并收敛.Aswani等[21 ,22 ] 考虑了在凸优化问题最优解的测量结果被噪声破坏情况下的逆向优化问题.Saez-gallego等[23 ] 利用逆向优化法预测对价格敏感的消费者的电力总需求,建立电力总需求的价格响应模型,并利用广义逆向优化法估算模型参数. ...
Inverse vehicle routing for activity-based urban freight forecast modeling and city logistics
1
2016
... 逆向优化是指已知一个优化问题的专家解(最优解),从而逆向推断优化模型的参数[13 ] .Ahuja等[13 ,14 ] 研究了基于最优性条件和对偶理论的逆线性优化问题,并将其扩展到逆向网络流问题.Zhang等[15 ,16 ] 利用牛顿法解决了在l ∞ 范数下的逆向组合问题.Heuberger[17 ] 综述了不同逆向组合优化问题的算法.随着大数据应用的发展,研究者提出在逆向优化中结合数据来设计开发算法.You 等[18 ] 对城市卡车货运量进行建模和预测,并提出利用观测数据对车辆路径规划问题的模型参数进行校准,使得优化结果更符合实际需求.牟健慧等[19 ] 将逆向优化理论和方法引入车间调度领域,建立考虑调度效率和稳定性的数学模型,以解决多目标流水车间的逆调度问题.Bärmann等[20 ] 结合逆向优化和在线学习算法的思想,将模型解决方案与专家决策之间的差异设为成本矩阵的梯度,并利用迭代法令梯度逐渐降低并收敛.Aswani等[21 ,22 ] 考虑了在凸优化问题最优解的测量结果被噪声破坏情况下的逆向优化问题.Saez-gallego等[23 ] 利用逆向优化法预测对价格敏感的消费者的电力总需求,建立电力总需求的价格响应模型,并利用广义逆向优化法估算模型参数. ...
基于混合的多目标遗传算法的多目标流水车间逆调度问题求解方法
1
2016
... 逆向优化是指已知一个优化问题的专家解(最优解),从而逆向推断优化模型的参数[13 ] .Ahuja等[13 ,14 ] 研究了基于最优性条件和对偶理论的逆线性优化问题,并将其扩展到逆向网络流问题.Zhang等[15 ,16 ] 利用牛顿法解决了在l ∞ 范数下的逆向组合问题.Heuberger[17 ] 综述了不同逆向组合优化问题的算法.随着大数据应用的发展,研究者提出在逆向优化中结合数据来设计开发算法.You 等[18 ] 对城市卡车货运量进行建模和预测,并提出利用观测数据对车辆路径规划问题的模型参数进行校准,使得优化结果更符合实际需求.牟健慧等[19 ] 将逆向优化理论和方法引入车间调度领域,建立考虑调度效率和稳定性的数学模型,以解决多目标流水车间的逆调度问题.Bärmann等[20 ] 结合逆向优化和在线学习算法的思想,将模型解决方案与专家决策之间的差异设为成本矩阵的梯度,并利用迭代法令梯度逐渐降低并收敛.Aswani等[21 ,22 ] 考虑了在凸优化问题最优解的测量结果被噪声破坏情况下的逆向优化问题.Saez-gallego等[23 ] 利用逆向优化法预测对价格敏感的消费者的电力总需求,建立电力总需求的价格响应模型,并利用广义逆向优化法估算模型参数. ...
基于混合的多目标遗传算法的多目标流水车间逆调度问题求解方法
1
2016
... 逆向优化是指已知一个优化问题的专家解(最优解),从而逆向推断优化模型的参数[13 ] .Ahuja等[13 ,14 ] 研究了基于最优性条件和对偶理论的逆线性优化问题,并将其扩展到逆向网络流问题.Zhang等[15 ,16 ] 利用牛顿法解决了在l ∞ 范数下的逆向组合问题.Heuberger[17 ] 综述了不同逆向组合优化问题的算法.随着大数据应用的发展,研究者提出在逆向优化中结合数据来设计开发算法.You 等[18 ] 对城市卡车货运量进行建模和预测,并提出利用观测数据对车辆路径规划问题的模型参数进行校准,使得优化结果更符合实际需求.牟健慧等[19 ] 将逆向优化理论和方法引入车间调度领域,建立考虑调度效率和稳定性的数学模型,以解决多目标流水车间的逆调度问题.Bärmann等[20 ] 结合逆向优化和在线学习算法的思想,将模型解决方案与专家决策之间的差异设为成本矩阵的梯度,并利用迭代法令梯度逐渐降低并收敛.Aswani等[21 ,22 ] 考虑了在凸优化问题最优解的测量结果被噪声破坏情况下的逆向优化问题.Saez-gallego等[23 ] 利用逆向优化法预测对价格敏感的消费者的电力总需求,建立电力总需求的价格响应模型,并利用广义逆向优化法估算模型参数. ...
An online-learning approach to inverse optimization
1
2020
... 逆向优化是指已知一个优化问题的专家解(最优解),从而逆向推断优化模型的参数[13 ] .Ahuja等[13 ,14 ] 研究了基于最优性条件和对偶理论的逆线性优化问题,并将其扩展到逆向网络流问题.Zhang等[15 ,16 ] 利用牛顿法解决了在l ∞ 范数下的逆向组合问题.Heuberger[17 ] 综述了不同逆向组合优化问题的算法.随着大数据应用的发展,研究者提出在逆向优化中结合数据来设计开发算法.You 等[18 ] 对城市卡车货运量进行建模和预测,并提出利用观测数据对车辆路径规划问题的模型参数进行校准,使得优化结果更符合实际需求.牟健慧等[19 ] 将逆向优化理论和方法引入车间调度领域,建立考虑调度效率和稳定性的数学模型,以解决多目标流水车间的逆调度问题.Bärmann等[20 ] 结合逆向优化和在线学习算法的思想,将模型解决方案与专家决策之间的差异设为成本矩阵的梯度,并利用迭代法令梯度逐渐降低并收敛.Aswani等[21 ,22 ] 考虑了在凸优化问题最优解的测量结果被噪声破坏情况下的逆向优化问题.Saez-gallego等[23 ] 利用逆向优化法预测对价格敏感的消费者的电力总需求,建立电力总需求的价格响应模型,并利用广义逆向优化法估算模型参数. ...
Inverse optimization with noisy data
1
2018
... 逆向优化是指已知一个优化问题的专家解(最优解),从而逆向推断优化模型的参数[13 ] .Ahuja等[13 ,14 ] 研究了基于最优性条件和对偶理论的逆线性优化问题,并将其扩展到逆向网络流问题.Zhang等[15 ,16 ] 利用牛顿法解决了在l ∞ 范数下的逆向组合问题.Heuberger[17 ] 综述了不同逆向组合优化问题的算法.随着大数据应用的发展,研究者提出在逆向优化中结合数据来设计开发算法.You 等[18 ] 对城市卡车货运量进行建模和预测,并提出利用观测数据对车辆路径规划问题的模型参数进行校准,使得优化结果更符合实际需求.牟健慧等[19 ] 将逆向优化理论和方法引入车间调度领域,建立考虑调度效率和稳定性的数学模型,以解决多目标流水车间的逆调度问题.Bärmann等[20 ] 结合逆向优化和在线学习算法的思想,将模型解决方案与专家决策之间的差异设为成本矩阵的梯度,并利用迭代法令梯度逐渐降低并收敛.Aswani等[21 ,22 ] 考虑了在凸优化问题最优解的测量结果被噪声破坏情况下的逆向优化问题.Saez-gallego等[23 ] 利用逆向优化法预测对价格敏感的消费者的电力总需求,建立电力总需求的价格响应模型,并利用广义逆向优化法估算模型参数. ...
Inverse optimization: Closed-form solutions, geometry, and goodness of fit
1
2019
... 逆向优化是指已知一个优化问题的专家解(最优解),从而逆向推断优化模型的参数[13 ] .Ahuja等[13 ,14 ] 研究了基于最优性条件和对偶理论的逆线性优化问题,并将其扩展到逆向网络流问题.Zhang等[15 ,16 ] 利用牛顿法解决了在l ∞ 范数下的逆向组合问题.Heuberger[17 ] 综述了不同逆向组合优化问题的算法.随着大数据应用的发展,研究者提出在逆向优化中结合数据来设计开发算法.You 等[18 ] 对城市卡车货运量进行建模和预测,并提出利用观测数据对车辆路径规划问题的模型参数进行校准,使得优化结果更符合实际需求.牟健慧等[19 ] 将逆向优化理论和方法引入车间调度领域,建立考虑调度效率和稳定性的数学模型,以解决多目标流水车间的逆调度问题.Bärmann等[20 ] 结合逆向优化和在线学习算法的思想,将模型解决方案与专家决策之间的差异设为成本矩阵的梯度,并利用迭代法令梯度逐渐降低并收敛.Aswani等[21 ,22 ] 考虑了在凸优化问题最优解的测量结果被噪声破坏情况下的逆向优化问题.Saez-gallego等[23 ] 利用逆向优化法预测对价格敏感的消费者的电力总需求,建立电力总需求的价格响应模型,并利用广义逆向优化法估算模型参数. ...
Short-term forecasting of price-responsive loads using inverse optimization
1
2018
... 逆向优化是指已知一个优化问题的专家解(最优解),从而逆向推断优化模型的参数[13 ] .Ahuja等[13 ,14 ] 研究了基于最优性条件和对偶理论的逆线性优化问题,并将其扩展到逆向网络流问题.Zhang等[15 ,16 ] 利用牛顿法解决了在l ∞ 范数下的逆向组合问题.Heuberger[17 ] 综述了不同逆向组合优化问题的算法.随着大数据应用的发展,研究者提出在逆向优化中结合数据来设计开发算法.You 等[18 ] 对城市卡车货运量进行建模和预测,并提出利用观测数据对车辆路径规划问题的模型参数进行校准,使得优化结果更符合实际需求.牟健慧等[19 ] 将逆向优化理论和方法引入车间调度领域,建立考虑调度效率和稳定性的数学模型,以解决多目标流水车间的逆调度问题.Bärmann等[20 ] 结合逆向优化和在线学习算法的思想,将模型解决方案与专家决策之间的差异设为成本矩阵的梯度,并利用迭代法令梯度逐渐降低并收敛.Aswani等[21 ,22 ] 考虑了在凸优化问题最优解的测量结果被噪声破坏情况下的逆向优化问题.Saez-gallego等[23 ] 利用逆向优化法预测对价格敏感的消费者的电力总需求,建立电力总需求的价格响应模型,并利用广义逆向优化法估算模型参数. ...
Fast algorithms for approximate semidefinite programming using the multiplicative weights update method
1
2005
... 乘性权重更新(Multiplicative Weights Updates,MWU)算法[24 ] 采用迭代更新的方式,在每一次迭代中,通过定义每轮的损失成本,并利用乘法更新规则对决策进行更新,能够使得总损失成本的期望最小化.采用改进的MWU算法,将原MWU算法中基于列向量的运算扩展至基于二维矩阵的运算,并针对问题属性确定算法学习率,使得改进后的算法具备收敛性. ...
The multiplicative weights update method: A meta-algorithm and applications
1
2012
... 在MWU算法中, P t = w t w t 1 , 总的损失成本期望为 ∑ t = 1 T ( m t · P t ) . Arora等[25 ] 证明了MWU算法可以确保对于任何概率分布P ,均有 ...