本发明涉及交通控制方法领域,具体是一种面向多主体异质路权分配的交通信号灯控制方法。
背景技术:
1、随着自主式交通系统的发展,交通主体的多样性和异质性日益增加,各种交通主体相互干扰,严重影响了交通系统的运行效率。为了提高交通运行效率,面向多主体路权分配的信号灯控制成为当前研究热点。
2、传统的基于路权分配信号灯控制方法往往采用单一策略来进行资源分基于固定的规则或预设的策略进行路权分配,实际的交通环境是动态变化的,容易受时段、天气等多方面因素影响,比如早晚高峰与普通时段,节假日与日常,下雨下雪天气与晴朗天气,车流车速并不相同,无法灵活地应对实际交通情况,同时现有方法往往没有充分考虑交通主体的异质性特征,比如公交车,轿车,货车,自行车电动车不同主体的速度、行为模式并不相同,导致传统路权分配优化结果无法真实反映实际需求。因此需要定义一个多交通主体特征模型,同时构建一个动态路权分配网络来进行信号灯控制,以实现面向多种交通主体的动态路权指派,提高路网运行效率。
技术实现思路
1、本发明提供了一种面向多主体异质路权分配的交通信号灯控制方法,以解决现有技术基于路权分配信号灯控制方法不适用于多类型交通主体的问题。
2、为了达到上述目的,本发明所采用的技术方案为:
3、一种面向多主体异质路权分配的交通信号灯控制方法,包括以下步骤:
4、步骤1、获取每个交通主体的特征信息,基于特征信息建立每个交通主体的特征向量;
5、以各个交通主体分别作为节点、任意一对交通主体的邻接矩阵作为边,并为每个边分别赋予权重后得到权重矩阵,由此构建具有权重矩阵的交通主体图;
6、基于交通主体图中权重矩阵对每个节点的特征向量进行处理,得到每个节点的初始化的特征表示;
7、然后,将各个节点的特征表示输入至图神经网络进行处理,得到每个节点即交通主体的低维特征表示;
8、步骤2、基于a2c算法模型获取路权分配策略,过程如下:
9、以步骤1得到的各个交通主体的低维特征表示构建状态矩阵,并定义每个交通主体对路权分配方案的选择为选择动作;
10、所述a2c算法模型中采用策略网络估计所述状态矩阵,得到每个交通主体的多种路权分配动作的概率分布,路权分配动作即该交通主体可能交通行为,如直行、左转、右转、停驶等,依据概率分布矩阵可以获得每个交通主体概率最高的路权分配动作并选择,以得到路权分配策略;所述a2c算法模型中采用价值网络来估计所述状态矩阵下的累计回报值,以评估路权分配策略的优劣;
11、a2c算法模型中还构建回报函数来表示交通主体在所述状态矩阵下采集选择动作后获得的即时回报,并以策略网络输出和价值网络输出的差值构建优势函数;
12、对a2c算法模型进行训练更新,训练更新时根据优势函数计算策略梯度,并对策略梯度使用梯度上升法处理以更新所述策略网络的参数;同时采用累积回报和价值网络的输出计算价值网络的均方误差,并对价值网络均方误差使用梯度下降法处理以更新所述价值网络的参数;最终基于策略梯度的梯度上升处理结果、价值网络均方误均方误差的梯度下降处理结果建立总体损失函数,并在总体损失函数达到收敛条件时结束训练,由此通过训练完成后的a2c算法模型输出每个交通主体的路权分配策略;
13、步骤3、基于步骤2得到的每个交通主体的路权分配策略,得到每个交通主体的路权分配权重,并根据每个交通主体的路权分配权重来计算交通信号灯各方向灯的绿灯信号灯时长。
14、进一步的步骤1中,每个边的权重根据该边对应的交通主体之间的距离和交互频率计算得到。
15、进一步的步骤1中,基于权重矩阵对每个节点的特征向量进行线性嵌入和非线性映射后,得到每个节点的初始化的特征表示。
16、进一步的步骤1中,先对每个节点的特征向量进行标准化后,再对标准化后的每个节点的特征向量进行线性嵌入和非线性映射。
17、进一步的步骤1中,图神经网络采用多层图卷积层对每个节点的特征表示进行处理,每层图卷积层将每个节点的特征表示与相邻节点的特征表示结合起来以得到新的特征表示,多层图卷积层中每一层的输出作为下一层的输入,由此得到每个节点的低维特征表示。
18、进一步的,步骤2中通过回报函数计算即时回报,然后累加即时回报得到累计回报。
19、与现有技术相比,本发明优点为:
20、本发明面向多样化的交通主体,基于图神经网络实现交通主体特征提取与编码,然后基于advantage actor-critic(a2c)模型实现路权分配,最后实现基于多交通主体路权分配的信号灯控制。
21、本发明能够处理不同类型的主体,例如行人、自行车、汽车、自动驾驶车辆等,依据路权分配策略,进行交叉口信号灯控制,在交通环境动态变化情况下,可以动态进行信号灯控制,降低道路拥挤程度,提高路网运行效率。
1.一种面向多主体异质路权分配的交通信号灯控制方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种面向多主体异质路权分配的交通信号灯控制方法,其特征在于,步骤1中, 每个边的权重根据该边对应的交通主体之间的距离和交互频率计算得到。
3.根据权利要求1所述的一种面向多主体异质路权分配的交通信号灯控制方法,其特征在于,步骤1中,基于权重矩阵对每个节点的特征向量进行线性嵌入和非线性映射后,得到每个节点的初始化的特征表示。
4.根据权利要求3所述的一种面向多主体异质路权分配的交通信号灯控制方法,其特征在于,步骤1中,先对每个节点的特征向量进行标准化后,再对标准化后的每个节点的特征向量进行线性嵌入和非线性映射。
5.根据权利要求1所述的一种面向多主体异质路权分配的交通信号灯控制方法,其特征在于,步骤1中,图神经网络采用多层图卷积层对每个节点的特征表示进行处理,每层图卷积层将每个节点的特征表示与相邻节点的特征表示结合起来以得到新的特征表示,多层图卷积层中每一层的输出作为下一层的输入,由此得到每个节点的低维特征表示。
6.根据权利要求1所述的一种面向多主体异质路权分配的交通信号灯控制方法,其特征在于,步骤2中通过回报函数计算即时回报,然后累加即时回报得到累计回报。