驾驶机器人转向操纵的动态模型预测控制方法
Dynamic Model Predictive Control Method for Steering Control of Driving Robot
通讯作者: 陈刚,男,副教授,电话(Tel.):025-84315425-3;E-mail:gang0418@163.com.
责任编辑: 石易文
收稿日期: 2021-04-9
基金资助: |
|
Received: 2021-04-9
作者简介 About authors
姜俊豪(1997-)男,浙江省温州市人,硕士生,主要从事驾驶机器人研究.
为实现驾驶机器人对试验车辆进行精确的转向操纵,提出了一种驾驶机器人转向操纵的动态模型预测控制方法.建立了驾驶机器人与被操纵车辆的耦合动力学模型,并对耦合模型的可控性进行判别.利用卡尔曼滤波器对耦合模型进行状态估计,并结合估计状态设计了模型预测控制器.将最小二乘法用于路径曲率与预测时域的非线性关系的拟合,设计了具有可变预测时域的动态模型预测控制器.进行了不同驾驶工况下的驾驶机器人转向操纵仿真与试验,研究结果表明了所提方法的有效性.
关键词:
A dynamic model predictive control method for driving robots is proposed to realize accurate steering control of the test vehicle. First, the coupling dynamics model of the driving robot and the controlled vehicle is established, and the controllability of the coupling model is judged. Then, the Kalman filter is used to estimate the state of the coupled model, and a model predictive controller is designed according to the estimated state. The least square method is adapted to fit the nonlinear relationship between path curvature and prediction horizon, and a dynamic model predictive controller with variable prediction horizon is designed. Finally, the simulation and the test of the steering control of the driving robot at different conditions are conducted, and the results verify the effectiveness of the proposed method.
Keywords:
本文引用格式
姜俊豪, 陈刚.
JIANG Junhao, CHEN Gang.
作为新型的自动驾驶解决方案,有必要对驾驶机器人操纵车辆的转向操纵控制进行研究.控制器的控制效果是影响驾驶机器人精确操纵车辆的重要因素.文献[7]将纯跟踪和矢量跟踪等方法与比例-积分-微分(PID)控制相结合,进行了多工况下的驾驶机器人转向操纵仿真试验,但未就驾驶机器人转向操纵的动力学模型进行推导.文献[8]设计了路径预瞄方法,将多模式切换控制策略与模糊PID控制器相结合,用于驾驶机器人车辆的车速与转向控制.文献[9]将预瞄方法引入驾驶机器人转向操纵控制,并进行了驾驶机器人操纵车辆的仿真试验,但随着车速增加,跟踪误差显著提高.文献[10]将以数据点的形式描述车辆的期望轨迹,基于模糊控制提出了驾驶机器人的轨迹跟踪控制方法,但跟踪结果误差较大.文献[11]提出了基于驾驶员行为的驾驶机器人鲁棒迭代学习控制方法,并在控制器设计中引入模型不确定性,但未考虑实际模型输入输出的物理量.文献[12]提出了用于驾驶机器人操纵车辆进行转向的PID控制器,但控制效果较差.
传统的模型预测控制(MPC)具有固定的预测时域,而动态模型预测控制(DMPC)在模型预测控制的基础上,引入了预测时域调整方法.在路径跟踪任务下,建立路径曲率与预测时域的函数关系.根据期望路径曲率的变化,调整预测时域的大小.设计的预测时域调整方法能够在小曲率路段减小预测时域值,减少控制器求解计算复杂度;在大曲率路段增大预测时域值,以提高控制器跟踪性能.
综上,建立了驾驶机器人-被操纵车辆耦合系统的动力学模型,判定了耦合系统模型的可控性.利用卡尔曼滤波对耦合系统模型状态进行估计,并结合估计状态与耦合模型设计了增量式模型预测控制器,并在此基础上,拟合预测时域与路径曲率的关系,得到预测时域可变的动态模型预测控制器;在不同驾驶工况下,通过仿真与试验验证了提出方法的有效性.
1 转向操纵模型
1.1 转向机械手动力学模型
图1
图2
转向机械手驱动电机的等效电路如图3所示.其中:n为电机转速;kt为电机的转矩系数;M为负载力矩;μ为黏性摩擦因数;L为电枢电感;U为驱动电压;R为电枢电阻;I为电流.
图3
图3
转向机械手驱动电机等效电路
Fig.3
Equivalent circuit of driving motor for steering mechanical arm
所获得的转向机械手动力学方程如下式所示:
式中:Jm为电机的转动惯量; ke为反电动势系数;i0为转向机械手减速器传动比;Tm为转向机械手输出转矩.
1.2 被操纵车辆动力学模型
驾驶机器人转向操纵主要涉及车辆的横向运动控制,因此,以车辆二自由度模型为研究对象.被操纵车辆模型如图4所示.其中:vf、vr分别为前、后轮速度;αf、αr分别为前、后轮侧偏角;Fyf、Fyr分别为前、后轮侧偏力;lf、lr分别为前、后轴到车辆质心的距离;δf为车辆前轮转角;ω为车辆横摆角速度;vy为车辆侧向速度;vx为车辆纵向速度;x*、y*为车辆坐标系.
图4
在被操纵车辆的侧向加速度绝对值小于0.4g(g为重力加速度)时,二自由度模型的微分方程为
式中:Kf、Kr分别为车辆前、后轮的侧偏刚度; m为整车质量;Jz为车辆绕坐标系z轴的转动惯量; β为质心侧偏角,其在数值上满足β=tan vy/vx,但由于该值较小,所以可以得到β≈vy/vx.
令y为横向位移,将式(2)转化为以被操纵车辆的横向位移、侧向速度和横摆角速度为状态变量的状态空间形式如下:
被操纵车辆的转向系动力学方程为
式中:ie为转向系传动比;Me为车轮回正力矩;Je为转向系等效转动惯量;K0为转向系扭转刚度;e为轮胎拖距.考虑到M=Me, n=30i0ieδf/π, 得到初步的耦合模型如下式所示:
驾驶机器人在操纵车辆转向时,会因路面颠簸以及侧向力的作用,使其位姿出现微小变化,表现为加速机械腿对油门踏板或制动机械腿对制动踏板造成的摄动.踏板摄动的存在会使车速发生改变,低速转向时,踏板摄动与车速变化关系如下式所示[16]:
式中:v'x为踏板受到摄动后的车速;t0为摄动开始时间;t1为摄动结束时间;θ0(t)为t时刻下的摄动量,且服从高斯分布,分布函数为θ0(x';p,σ)=
1.3 驾驶机器人-被操纵车辆耦合系统模型
驾驶机器人模型输入为电压,输出为机械手抓手的转角,而车辆的输入为前轮转角,引入转向系传动比ie,可以建立起驾驶机器人与车辆的耦合系统模型.令状态向量为
X=
令输入u为转向机械手驱动电机电枢电压U,结合式(3)和(5)得到对应耦合模型的状态空间为
其中:
A=
B=[
C=
a11=
a12=
a21=
a22=
1.4 耦合模型的可控性验证
驾驶机器人-被操纵车辆耦合模型的状态可控性、输出可控性分别决定了耦合模型能否在输入作用下到达期望状态、期望输出,因此在设计控制器之前,需要对被控对象进行可控性分析.耦合系统模型的状态、输出可控性判别矩阵如下式所示:
计算得到, 判别矩阵的秩Rd(D1)=Rd(D2)=6,即状态、输出可控性判别矩阵是满秩的,耦合系统模型的状态与输出均是可控的.结果表明,通过调整与设计控制器的控制率,即加在驾驶机器人转向机械手驱动电机两端的电压,可以使驾驶机器人操纵车辆到达期望的横向位置,同时系统能到达期望状态.
2 控制方法
设计了稳定车速的比例-积分(PI)控制器,使驾驶机器人操纵车辆时能够满足等速的转向试验条件.利用卡尔曼滤波估计驾驶机器人-被操纵车辆耦合模型的状态,设定状态约束、输入约束,设计模型预测控制器.在此基础之上,设计模型预测控制器预测时域与期望路径曲率之间的函数关系.调试多种单一曲率值下的次优函数参数,并利用最小二乘法对函数参数与路径曲率之间的非线性关系进行离线拟合,最终实现模型预测控制器的预测时域能够根据路径曲率动态变化.所提出的动态模型预测控制方法的结构如图5所示.其中:T、kq分别为延时环节的时间常数和放大系数;kp、ki分别为比例系数和积分系数;ρ为路径的曲率;b0和b1为参数;C*为向上取整算子;ρ*为曲率样本集;
图5
图5
驾驶机器人-被操纵车辆动态模型预测控制结构图
Fig.5
Structure chart of dynamic model predictive control for driving robot-controlled vehicle
2.1 车速稳定控制
为使驾驶机器人操纵车辆转向时,克服因踏板摄动引起的车速变化,达到等速转向的目的,设计了车速控制的PI控制器.控制器输入为车速误差,输出为机械腿滚珠丝杠的位移.当摄动出现时,车速出现变化,PI控制器输出丝杠位移,以调整机械腿末端位姿,进而使车速稳定在期望车速.
车速误差始终存在于驾驶过程中,以文献[16]中±2 km/h的误差边界得到的误差范围,即控制器的速度控制精度指标要求为
式中:vxd为试验车速,取30 km/h;ϑ为车速跟踪误差.得到容许的车速范围为 28 km/h≤v'x≤32 km/h,即车速在该范围内变化时,式(7)可视为时不变系统.
根据文献[17]对机械腿模型的推导,得到机械腿的输入输出关系为
式中:ξ为输出踏板开度;f为非线性函数.
考虑到踏板存在死区与延时特性,结合式(6)与(11)得到如下所示的车速-丝杠位移变化关系为
式中:V(c)=
得到PI控制器的输出控制率为
式中:upi为PI控制器输出控制率.
2.2 系统状态估计
驾驶机器人的转向操纵控制,需要实时获取耦合系统模型的状态,用于模型预测控制进行优化求解.因此,利用卡尔曼滤波器对耦合系统模型的状态进行最优估计.
对驾驶机器人-车辆耦合状态进行离散化,得到离散化状态空间为
式中:k为当前采样序号;
先验估计:
后验估计:
式中:
2.3 动态模型预测控制器设计
首先,设计了驾驶机器人转向操纵的增量式模型预测控制器.令Δ
式中:ηk+i为第i个预测步下的期望横向位置;Nc为控制时域;
展开后,目标函数与约束的简化形式如下:
其中:
ε=φΔU+G
φ=
ΔU=
U0=
S=
U=
G=[
Gr=C{
wq=diag(
wr=diag(
式中:Umin为驱动电机两端最低电压;Umax为驱动电机两端最高电压;ΔUmin为最低电压增量;ΔUmax为最高电压增量;ymin为数值上横向位移最小处;ymax为数值上横向位移最大处;vymin为最小侧向速度;vymax为最大侧向速度;ωmax为最大横摆角速度;ωmin为最小横摆角速度;δfmax为最大前轮转角;δfmin为最小前轮转角;
进一步展开式(21)后,得到:
由于ΔUTφTwqG=(GTwrφΔU)T,目标函数为标量函数,所以两项在数值上相等.同时,由于耦合系统模型的状态可控,且为线性系统,因此控制率增量与状态之间存在线性关系,状态向量可进一步表示为
式中:ζ=(2GTwqφ)T;H=φTwqφ+wr;W=[
问题的最优解即为最优控制率的增量,取增量第1个元素,即为当前时刻的最优控制增量Δ
由问题模型可知,随着Np的增大,模型考虑到更多的未来状态,优化目标朝着缩小更长预测范围内的误差发展,能够提升驾驶机器人转向操纵的能力.同时矩阵S与矩阵φ的尺寸会显著增大,增加控制器的计算复杂度,其表现为求解时间的增长[13].
设定最小预测时域为Npmin和最大预测时域为Npmax,并计算出目标路径的最小曲率ρmin和最大曲率ρmax.设预测时域与期望路径曲率具有类指数的函数关系.设定参数b0、b1, 预测时域与曲率的实际函数关系为
将多种具有单曲率的路径作为期望路径,加入闭环控制系统中通过调试确定次优Np值以获得准确的跟踪结果.以式(24)为基函数,多组曲率路径以及其对应的Np进行离线的非线性拟合,得到参数b0、b1的具体值.
设定曲率样本集ρ*={ρ1 ··· ρi ··· ρN}和对应路径曲率下的次优时域集
令误差函数为
误差对参数b0、b1求偏导得到
其中:
τ1(i)=Npmax+b0(Npmax-Npmin)
τ2(i)=(Npmax-Npmin)
τ3(i)=Npmax+b0(Npmax-Npmin)
τ4(i)=
根据梯度下降法,为使误差极小化,令
b0=b00-k1
式中:b00为b0的初始值;b10为b1的初始值;k1、k2为学习率.设定阈值λ,当
3 仿真与试验验证
3.1 仿真验证
为验证驾驶机器人操纵试验车辆的路径曲率-预测时域的实际关系式(24)对等效关系式(25)的可替代性,以及得到拟合参数,将设计的模型预测控制器用于耦合系统,在多种不同曲率的单曲率路径下进行路径跟踪仿真,调整预测时域至跟踪误差幅度小于0.1 m,得到对应路径曲率下的最佳预测时域的次优解,并记录不同预测时域下,控制器单次求解所需的系统时间.不同路径曲率下的次优预测时域如表1所示.
表1 时域数据
Tab.1
ρ/m-1 | ρ/m-1 | ||
---|---|---|---|
0 | 8 | 0.14 | 12 |
0.02 | 9 | 0.16 | 13 |
0.04 | 10 | 0.18 | 14 |
0.06 | 10 | 0.20 | 15 |
0.08 | 11 | 0.22 | 17 |
0.10 | 11 | 0.24 | 18 |
0.12 | 12 |
表2 拟合结果
Tab.2
参数 | 最终值 | 95%置信区间 |
---|---|---|
b0 | 0.1016 | (0.07692, 0.1264) |
b1 | 0.1089 | (0.09469, 0.1231) |
图6
3.2 试验验证
图7
表4 关键参数
Tab.4
对象 | 参数 | 数值 | 对象 | 参数 | 数值 |
---|---|---|---|---|---|
驾驶机器人 | L/H | 0.012 | 驾驶机器人 | μ/(N·m·rpm-1) | 0.05 |
kt/(N·m·A-1) | 0.47 | R/Ω | 0.42 | ||
ke/[V·(rad·s)-1] | 0.0172 | i0 | 15 | ||
被操纵车辆 | m/kg | 1126 | 被操纵车辆 | K0/(N·m·rad-1) | 6000 |
lf/m | 1.014 | Je/(kg·m2) | 14 | ||
lr/m | 1.534 | e/m | 0.0035 | ||
Kf/(N·rad-1) | 51480 | Jz/(kg·m2) | 2697 | ||
Kr/(N·rad-1) | 87416 | ie | 20 | ||
控制器 | ΔUmax/V | 3 | 控制器 | Npmin | 8 |
ΔUmin/V | -3 | 20000 | |||
Umax/V | 24 | 0.1 | |||
Umin/V | -24 | Nc | 10 | ||
Npmax | 19 |
图8
表5 PI控制器参数调整结果
Tab.5
工况 | kp | ki |
---|---|---|
不考虑踏板特性 | 160.5 | 424.9 |
考虑踏板特性 | 193.9 | 465.9 |
图8(a)给出了卡尔曼滤波器对横向位移这一状态的估计结果,在路径曲率的变化处,即期望路径的4个角点,估计误差相对较大,而整体上实现了准确的状态估计.由图8(b)可知,模糊PID方法与提出方法均能有效跟踪期望路径,且提出方法所产生的误差更低,而人类驾驶员不能良好地跟踪期望路径,存在较大误差,主要时由于驾驶员驾驶过程中存在反应滞后以及心理因素.由图8(c)可知,驾驶机器人在模糊PID控制操纵车辆具有更大的质心侧偏角,且跟踪过程中质心侧偏角波动较大,行驶过程中的稳定性较差,该现象主要是由于模糊PID主要考虑横向位移上的误差来建立误差与控制率之间的关系,未对系统其他状态进行约束,而提出方法对系统状态的约束,尤其是对侧向速度的约束,使得驾驶机器人的转向操纵具有更小且更平稳的质心侧偏角,即在精确跟踪期望路径的基础上实现稳定转向.由图8(d)可知,设计的PI控制器能够在考虑踏板特性和不考虑踏板特性的情况下均能稳定将车速稳定在容许的范围内,但由于踏板的时延特性会延迟控制率的作用,即控制器对驾驶机械腿的调整相对于车速变化的时刻会出现滞后现象,致使车速稳定在试验车速30 km/h所需的时间增多.同时,在以不可微函数形式存在的死区特性的影响下,控制率会发生突变,使得车速变化存在如点1、2、3的不可微处.根据表5可知,考虑踏板的死区特性和时延特性后,控制器的增益值有明显增大,增加了控制器的功耗.
图9
5 结语
建立了无人驾驶机器人与被操纵车辆的耦合系统模型,并对系统的可控性进行判定.构建了适用于耦合系统模型的卡尔曼滤波器,对无人驾驶机器人车辆的横向位置进行最优估计.建立了模型预测控制器预测时域与期望路径曲率之间的关系,对预测时域进行动态调整.进行了无人驾驶机器人操纵试验车辆在不同工况下的转向操纵仿真试验,并进行了人类驾驶员操纵车辆的实车试验.仿真与试验结果表明,提出的控制方法能够准确控制驾驶机器人的转向操纵.
后续将研究方法的实时性,并将改进后的方法烧录至无人驾驶机器人硬件控制系统,进行无人驾驶机器人的道路试验,以验证提出控制方法的实时性.
参考文献
Hierarchical coordinated control method for unmanned robot applied to automotive test
[J].DOI:10.1109/TIE.2015.2477266 URL [本文引用: 1]
Second order sliding modes control for rope winch based automotive driver robot
[J].DOI:10.1504/IJVD.2013.052707 URL [本文引用: 1]
Developing robot driver etiquette based on naturalistic human driving behavior
[J].DOI:10.1109/TITS.2019.2913102 URL [本文引用: 1]
驾驶机器人机械腿动力学建模与仿真分析
[J].
Dynamics modeling and simulation analysis of robot driver’s mechanical legs
[J].
Multi-features fusion for diagnosis of pedal robot using time-speed signals
[J].DOI:10.3390/s19010163 URL [本文引用: 1]
Driver-behavior-based adaptive steering robust nonlinear control of unmanned driving robotic vehicle with modeling uncertainties and disturbance observer
[J].DOI:10.1109/TVT.2019.2922452 URL [本文引用: 1]
Development of a robotic driver for autonomous vehicle following
[J].DOI:10.1504/IJISTA.2010.030205 URL [本文引用: 1]
驾驶机器人车辆的多模式切换控制
[J].
Multi-mode switching control for robot driven vehicles
[J].
Trajectory based autonomous vehicle following using a robotic driver
[C]//
一种用于车辆道路试验的自动驾驶机器人: CN 102435442 B
[P].
Automatic drive robot used in vehicle road tests: CN 102435442 B
[P].
Lateral robust iterative learning control for unmanned driving robot vehicle
[J].DOI:10.1177/0959651820904834 URL [本文引用: 1]
Autonomous vehicle following using a robotic driver
[C]//
An adaptive-prediction-horizon model prediction control for path tracking in a four-wheel independent control electric vehicle
[J].DOI:10.1177/0954407018821527 URL [本文引用: 2]
基于高斯过程回归的车辆巡航系统学习预测控制
[J].
Learning predictive control of vehicular automated cruise systems based on Gaussian process regression
[J].
基于主动转向的车辆路径跟随广义预测控制
[J].
Generalized predictive control based on vehicle path following strategy by using active steering system
[J].
驾驶机器人车辆动态制动力矩补偿
[J].
DOI:10.19721/j.cnki.1001-7372.2020.02.017
[本文引用: 1]
为了减小长期自动驾驶过程中制动性能下降带来的影响,提出了一种驾驶机器人车辆动态制动力矩补偿方法。首先建立了以车速和制动踏板力为输入,制动力矩为输出的驾驶机器人车辆制动性能离线自学习模型。然后考虑到驾驶机器人车辆长期自动驾驶导致离线自学习模型可靠性下降,建立了以车速和制动踏板力为输入,制动力矩为输出的扩展自回归在线辨识模型,并采用模糊变遗忘因子递推最小二乘法进行参数辨识。模糊变遗忘因子递推最小二乘法通过引入遗忘因子的方式,对数据施加时变加权系数,以避免出现数据增长导致的数据饱和现象。模糊变遗忘因子控制器以制动力矩辨识误差为输入,经模糊规则推理实时输出合适的遗忘因子进行参数辨识,能够有效均衡驾驶机器人车辆制动性能参数辨识的稳定性与收敛速度。驾驶机器人车辆自动驾驶过程中,根据当前车速与目标车速的大小计算出所需的制动力矩,加上反馈回来的制动力矩误差,并结合当前时刻的车速,利用制动性能离线自学习模型与机械腿逆向运动学模型实时计算出制动电机输出位移量,实现对驾驶机器人车辆制动力矩的在线补偿。仿真与试验结果表明:利用所提出的方法对车辆动态制动力矩进行辨识时,通过调节遗忘因子,辨识结果能够快速收敛且辨识误差较小。在此基础上,控制驾驶机器人车辆进行纵向车速跟踪时,能够有效减小制动性能下降造成的影响,保证控制车速跟踪误差在±1 km·h<sup>-1</sup>之内。
Dynamic braking torque compensation for a driving robot vehicle
[J].
DOI:10.19721/j.cnki.1001-7372.2020.02.017
[本文引用: 1]
To reduce the impact of the braking performance of a driving robot vehicle during long-term automatic driving, a dynamic braking torque compensation method was proposed. First, an off-line self-learning model for the braking performance was established, which used the vehicle speed and braking pedal force as input and the braking moment as output. Then, considering the fact that the reliability of the off-line self-learning model decreased because of the long-term automatic driving of driving robotic vehicles, an extended autoregressive on-line identification model with the vehicle speed and brake pedal force used as input and the brake moment used as output was established. In addition, the parameters were identified using the fuzzy variable forgetting factor recursive least squares method. This method imposed time-varying weighting coefficients on data by introducing a forgetting factor to avoid data saturation caused by data growth. The fuzzy variable forgetting factor controller used the braking moment identification error as input, and it output the appropriate forgetting factor in real time through fuzzy rule reasoning. This could effectively balance the stability and convergence speed of the braking performance parameter identification of the driving robot vehicle. During automatic driving, the required braking moment was calculated based on the current and target speeds. On this basis, the output displacement of the brake motor was calculated in real time using the off-line self-learning model of braking performance and the inverse kinematics model of the mechanical leg combined with the feedback error of braking moment and the current vehicle speed. In this manner, on-line compensation of the braking moment of the driving robot vehicle could be realized. Simulation and experimental results show that when the dynamic braking torque of the vehicle is identified by the proposed method, the identification result can be quickly converged, and the identification error is small when the forgetting factor is adjusted. On this basis, when the driving robot vehicle is controlled to track the longitudinal speed, the impact of braking performance degradation can be effectively reduced and vehicle speed tracking error is within ±1 km·h<sup>-1</sup>.
Lateral control system for vehicle platoon considering vehicle dynamic characteristics
[J].DOI:10.1049/iet-its.2018.5504 URL [本文引用: 2]
/
〈 |
|
〉 |
