一种基于增量支配mpc的高速高精轨迹跟踪控制方法和系统-k8凯发

文档序号:37022699发布日期:2024-02-09 13:17阅读:72来源:国知局
导航:> 最新专利>
一种基于增量支配mpc的高速高精轨迹跟踪控制方法和系统

本发明属于agv轨迹跟踪控制领域,更具体地,涉及一种基于增量支配mpc的高速高精轨迹跟踪控制方法和系统。


背景技术:

1、自动驾驶及移动物流车(agv)因其独特优势倍受学术界关注。其中的关键技术包括感知、决策和控制三部分,轨迹跟踪是控制的核心目的,是保障行驶过程准确、稳定和安全的前提,具有重要研究价值。在跟踪控制中常用pid、滑模控制、自适应鲁棒控制和迭代学习等方法。上述方法均是预先设定系统控制率,而mpc采用在线求解控制量的方式,在处理轨迹跟踪等多约束最优控制问题上具有显著优势,因而在无人驾驶领域被广泛应用。

2、然而mpc在线求解控制量,难以满足高采样率快速系统的实时性要求。针对mpc实时性的改进方法主要分三类:1)显式化,利用参数化编程方法预先求解mpc的离线解并储存于系统,以便使用时查找并计算最优控制量。但该方法依赖具体模型,且控制系统参数随控制域指数增长,不仅对控制器的储存能力提出挑战,而且在求解初期搜索对应储存空间也需消耗大量时间,不适用于快速系统。2)改进求解算法,设计速度更快的算法代替原本的二次规划。此类方法需设计复杂算法,并常以降低跟踪精度为代价。3)输入参数化,禁止控制量在每个采样步长中自由变化而按预定义的规则变化。相较前两类方法,该方法不依赖于具体模型,有更强的普适性和鲁棒性。

3、总而言之,为满足高采样率快速系统的实时性要求,需要保证轨迹跟踪精度的平稳性以及控制方法有一定的可实施性,但现有的mpc控制方法在高采样率快速系统下不能同时保证控制方法难易程度、轨迹跟踪精度和控制实时性,存在轨迹跟踪实时性较差问题。


技术实现思路

1、针对现有技术中存在的以上缺陷或改进需求,本发明提出了一种基于增量支配mpc高速高精轨迹跟踪控制方法和系统,由此解决现有的mpc控制方法在高采样率快速系统下不能同时保证控制方法难易程度、轨迹跟踪精度和控制实时性,存在轨迹跟踪实时性较差问题。

2、为实现上述目的,按照本发明的第一方面,提供了一种基于增量支配mpc的高速高精轨迹跟踪控制方法,包括:

3、将控制时域nc内的nc个控制增量中距离当前时刻较近的m个控制增量设定为不受上一时刻控制增量支配且对应的支配参数均为1,距离当前时刻较远的w个控制增量设定为受上一时刻控制增量支配且对应的支配参数均为0,其余n个控制增量是否受上一时刻控制增量支配通过寻优算法确定;再将各支配参数顺序排列,构成支配关系向量drv;

4、构建一个nc阶全零矩阵,将前m行上的对角线元素赋值为1;随后的n行,若drv中第i个元素为0,则置第i行中,第i-1行为1的同列元素为1,否则置第i行中,第i-1行为1的下一列元素为1,其中i=m 1、m 2、…、m n;记录第m n行为1的元素所在的列数,置其余w行该列的后一列均为1,得到支配关系矩阵drm;

5、利用所述支配关系矩阵drm对控制增量进行变换,重构增量mpc控制器的目标函数与约束条件,形成增量支配mpc控制器,以实现高速高精轨迹跟踪控制。

6、进一步地,所述利用所述支配关系矩阵drm对控制增量进行变换,包括:将所述支配关系矩阵drm与控制增量的乘积作为新的控制增量。

7、进一步地,采用bieo算法对所述其余n个控制增量对应的支配参数进行寻优,具体为:

8、对预设数量的n维向量个体进行初始化搜索种群操作;

9、构建以所有采样点的状态分量的平均误差和在线求解平均时长作为综合评价指标的损失函数,在bieo算法迭代过程中以最小化损失函数为目标;

10、将每次优化迭代中四个迄今为止最好的个体加上四个个体的算术平均值作为平衡候选解集,每次迭代过程中以等概率从所述平衡候选解集中选取一个个体作为bieo算法最终收敛到平衡状态时的候选解。

11、进一步地,所述对预设数量的n维向量个体进行初始化搜索种群操作,包括:

12、以就近圆整运算方法处理随机产生的[0 1]之间变量,并将其作为初始化种群的向量组成,具体初始化方式如下:

13、ωjinitial=round(randj),j=1,2,…d

14、式中,ωjinitial为初始化的第j个个体,维数为n;randj为所有元素均在[0 1]之间的n维随机向量;round为就近圆整运算;d为种群中的个体总数。

15、进一步地,影响bieo算法性能的指数项包括:

16、

17、

18、式中,为hadamard积;a1和a2分别为调节全局和局部搜索能力的系数;r和λ均为n维随机向量;时间t随迭代次数的增加而逐步衰减,iter和maxiter为当前迭代次数和最大迭代次数。

19、进一步地,影响bieo算法性能的质量生成项包括:

20、

21、

22、式中,r1和r2为[0,1]中的均匀随机数;ones为n维全1向量;ω为当前解;ωeq为本次迭代在平衡候选解集中选取的候选解;g为质量生成速率;g0为初始值;gcp是生成速率控制参数,决定生成项参与更新过程的概率;gp为生成概率,决定有多少个体使用生成项来进行更新。

23、进一步地,所述bieo算法的更新规则包括:

24、

25、

26、

27、

28、式中,为t时刻第j个个体的第k个维度,s1、s2、ω1和ω2为[0,1]之间的均匀随机数,v为控制容积,在更新过程中依次计算得到变化量δω、概率p和更新量完成个体每个维度的更新。

29、按照本发明的第二方面,提供了一种基于增量支配mpc的高速高精轨迹跟踪控制系统,包括:

30、支配关系向量drv构建模块,用于将控制时域nc内的nc个控制增量中距离当前时刻较近的m个控制增量设定为不受上一时刻控制增量支配且对应的支配参数均为1,距离当前时刻较远的w个控制增量设定为受上一时刻控制增量支配且对应的支配参数均为0,其余n个控制增量是否受上一时刻控制增量支配通过寻优算法确定;再将各支配参数顺序排列,构成支配关系向量drv;

31、支配关系矩阵drm构建模块,用于构建一个nc阶全零矩阵,将前m行上的对角线元素赋值为1;随后的n行,若drv中第i个元素为0,则置第i行中,第i-1行为1的同列元素为1,否则置第i行中,第i-1行为1的下一列元素为1,其中i=m 1、m 2、…、m n;记录第m n行为1的元素所在的列数,置其余w行该列的后一列均为1,得到支配关系矩阵drm;

32、增量支配mpc控制器构建模块,用于利用所述支配关系矩阵drm对控制增量进行变换,重构增量mpc控制器的目标函数与约束条件,形成增量支配mpc控制器,以实现高速高精轨迹跟踪控制。

33、按照本发明的第三方面,提供了一种电子设备,包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如第一方面所述方法的步骤。

34、按照本发明的第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如第一方面所述方法的步骤。

35、与现有技术相比,本发明的优点在于:

36、(1)本发明针对传统mpc无法满足高采样率快速系统的实时控制问题,提出增量支配mpc。通过定义前后控制增量之间的支配关系,构建支配关系矩阵,并利用该矩阵使待求解的控制增量受限,降低在线求解的自由度,提高mpc的实时性。

37、(2)为使增量支配mpc在线求解的过程中专注于当前控制增量,实现高速高精控制,本发明利用状态量平均误差和求解平均时间构造损失函数,并基于bieo算法对支配关系矩阵中的受限部分进行二进制优化,得到有利于实时性和控制精度的支配关系矩阵。

38、(3)增量支配mpc在不影响控制平稳性的基础上,对控制精度有小幅度的提升,可实现高速高精跟踪控制。

当前第1页1  
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
网站地图