基于博弈论的自动驾驶车辆协作服务决策方法

文档序号:34581209发布日期:2023-06-28 14:23阅读:16来源:国知局
基于博弈论的自动驾驶车辆协作服务决策方法

本发明属于自动驾驶,更进一步涉及一种自动驾驶中基于联盟博弈与斯塔克尔伯格博弈的自动驾驶车辆间协作完成服务的决策方法。本发明可用于多个自动驾驶车辆有服务需求的环境中,在保证车辆用户服务体验质量的前提下可以最大化自动驾驶车辆的效益。


背景技术:

1、在自动驾驶车辆的驾驶过程中,驾驶环境和乘客要求实时发生变化,每辆自动驾驶车辆将产生大量的车辆服务,完成这些服务需要大量的计算资源、通信资源和缓存资源等服务资源。但是,单个自动驾驶车辆的资源是有限的,不能满足车载服务需求,自动驾驶车辆之间需要通过资源协作来完成各种车辆服务。具体而言,自动驾驶车辆可以分为两类:一类拥有服务资源的自动驾驶车辆,称为资源提供者;另一类需求服务资源的自动驾驶车辆,称为服务需求者。在协作服务过程中,资源提供者可以向服务需求者提供服务资源以获取收益,服务需求者可以从资源提供者购买服务资源以保证服务体验。同一路段上的多辆自动驾驶车辆通常具有相同的服务需求,这些自动驾驶车辆可以协作请求服务并共同分担服务成本。然而,在现有的协作服务方法中没有考虑到资源提供者与服务需求者如何最大化自身效益的问题,此外,在现有的协作方法中没有考虑不同服务的服务需求者协作购买服务资源的问题,这造成了车载资源的浪费和车载服务成本的增加。因此,如何最大化服务需求者和资源提供者的效益并降低车载服务成本,减少车载服务资源的浪费是一个问题。

2、长安大学在其申请的专利文献“一种异构自动驾驶车辆编队计算任务协同执行方法”(申请号202010403211.5,申请公布号cn 111615082 a)中公开了一种自动驾驶车辆协作服务决策方法。该方法中车辆编队由n+1个装有计算单元和v2v通信单元的车辆组成,由编队排头车辆逐车交换获得各车辆的车载计算和通信能力信息;当编队中有计算密集型任务需要计算时,由排头车辆逐车进行总任务的分配和计算结果回收。该发明可以充分得利用自动驾驶车辆的计算与通信资源。但是,该方法仍然存在的不足之处是:该方法没有考虑到协作服务过程中每一辆自动驾驶车辆的效益,这会导致部分自动驾驶车辆以较低的效益获取服务。

3、扬州大学在其申请的专利文献“一种基于边缘计算和群智算法的自动驾驶车辆的决策预测方法”(申请号202010736779.9,申请公布号cn 111845754 a)中公开了一种自动驾驶车辆协作服务决策方法。该方法建立了群体智能的自动驾驶车辆的决策框架,充分利用群体智能的自组织、分工和群内个体的信息交互功能,将自动驾驶车辆状态信息实时共享,实现群体智能的自动驾驶车辆的行驶决策功能。但是,该方法仍然存在的不足之处是:该方法中没有考虑到协作驾驶过程中不同服务的服务需求者协作购买服务资源可以减少车载资源的消耗,这将增加车辆的驾驶服务成本。


技术实现思路

1、本发明的目的在于针对上述已有技术的不足,提供一种基于博弈论的自动驾驶车辆协作服务决策方法,用于解决如何最大化服务需求者和资源提供者的效益并降低车载服务成本,减少车载服务资源的浪费的问题。

2、实现本发明目的的思路是:确定基本服务需求小组及需求小组领导者,分别建立服务需求者、需求小组领导者和资源提供者的效益函数。通过联盟博弈模拟多个需求小组领导者协作购买服务资源的过程:需求小组领导者基于自身效益依次更新联盟方案,迭代进行多次直至每个需求小组领导者都不再更新联盟方案。联盟博弈充分考虑到了每个需求小组领导者的效益,使得每个需求小组领导者都能找到最优联盟对象从而降低所需基本服务的成本。在联盟博弈过程中,通过斯塔克尔伯格博弈模拟需求小组领导者与资源提供者间资源买卖过程:资源提供者基于自身效益函数更新单位资源价格,需求小组领导者基于自身效益函数更新资源购买量,双方迭代更新直至单位资源价格和资源购买量都不再改变。斯塔克尔伯格博弈兼顾了服务需求者和资源提供者的效益,使得服务需求者和资源提供者的效益均可实现最大化。最后,自动驾驶车辆最优联盟方案进行协作服务。

3、为实现上述目的,本发明具体实现步骤包括如下:

4、步骤1,将同一时刻位于同一基站覆盖范围内的所有自动驾驶车辆生成一个车辆小组;

5、步骤2,确定需求小组的领导者:

6、步骤2.1,将车辆小组中请求同类车载服务的自动驾驶车辆组成一个需求小组;

7、步骤2.2,每个需求小组随机选择组内一辆自动驾驶车辆做为该需求小组领导者;

8、步骤3,建立效益函数:

9、步骤3.1,建立服务需求者效益函数如下:

10、

11、其中,表示服务需求者ir购买车载服务nm的效益,表示车载服务nm的需求小组领导者从资源提供者iv购买的资源量,由车载服务nm的需求小组领导者决定其取值,表示车载服务nm的需求小组中的成员ir对车载服务nm的满意度,由成员ir决定其取值,对成员ir而言是一个固定值,表示资源提供者iv为车载服务nm提供资源的单位资源价格,由资源提供者iv决定其取值,表示车载服务nm的需求小组成员数量,iv表示基本服务nm的资源提供者集合,log(.)表示以10为底的对数操作,|.|表示取绝对值操作;

12、步骤3.2,建立需求小组领导者效益函数如下:

13、

14、其中,表示车载服务nm的需求小组领导者效益;

15、步骤3.3,建立资源提供者效益函数如下:

16、

17、

18、其中,表示资源提供者iv提供车载服务nm的效益,表示资源提供者iv为服务nm提供资源的单位资源成本,由资源提供者iv决定其取值,对资源提供者iv而言是一个固定值,hg表示车载服务nm的需求小组领导者所在联盟,|hg|表示联盟hg中的需求小组领导者数量,表示联盟hg的紧密度,由联盟成员组成决定,表示车载服务nm的需求小组领导者;

19、步骤4,采用斯塔克尔伯格博弈和联盟博弈优化需求小组领导者联盟方案:

20、步骤4.1,将拥有需求小组领导者所需车载服务资源的自动驾驶车辆作为需求小组领导者的资源提供者;

21、步骤4.2,每个资源提供者生成其可以提供的车载服务的单位资源价格,并向需求小组领导者发送该需求小组领导者所需资源的单位资源价格;

22、步骤4.3,将每个需求小组领导者作为一个联盟,生成所有需求小组领导者互不联盟的需求小组领导者联盟方案;

23、步骤4.4,需求小组领导者向当前联盟方案下除其所在联盟之外其他联盟依次发送联盟请求;

24、步骤4.5,收到联盟请求的联盟将接受申请者的加入请求,并将申请者标记为待确定成员,申请者离开其原联盟,加入新联盟,并将更新后的联盟方案发送给所有资源提供者;

25、步骤4.6,需求小组领导者从资源提供者购买服务资源,采用需求者小组领导者效益函数,计算需求小组领导者在购买服务资源过程中的资源购买量;

26、步骤4.7,每个需求小组领导者根据资源提供者发布的单位资源价格,采用与步骤4.6相同的方式,计算资源提供者购买的资源量,将资源购买量发送给资源提供者;

27、步骤4.8,采用资源提供者效益函数,计算资源提供者在出售服务资源过程中的单位资源价格;

28、步骤4.9,每个资源提供者根据每个需求小组领导者发送的资源购买量和当前联盟方案,采用与步骤4.8相同的方式,计算提供车载服务的单位资源价格,将单位资源价格发送给需求小组领导者;

29、步骤4.10,判断是否满足单位资源价格与资源购买量迭代终止条件,若是,则将当前迭代时的需求小组领导者的资源购买量作为最优资源购买量,资源提供者的单位资源价格作为最优单位资源价格后执行步骤4.11,否则,执行步骤4.7;

30、步骤4.11,计算每个需求小组领导者在当前迭代联盟方案下的最大效益;

31、步骤4.12,采用作差法,对联盟方案进行更新;

32、步骤4.13,判断所有需求小组领导者是否都不再更新需求小组领导者联盟方案,若是,则将此时更新后的联盟方案做为最优联盟方案后执行步骤5,否则,执行步骤4.4;

33、步骤5,自动驾驶车辆进行协作服务:

34、步骤5.1,资源提供者按照最优联盟方案中需求小组领导者的最优资源购买量,为需求小组领导者提供服务资源;

35、步骤5.2,需求小组领导者按照最优联盟方案中资源提供者的最优单位资源价格,向资源提供者支付服务费用。

36、本发明与现有技术相比具有如下优点:

37、第一,本发明为服务需求者和资源提供者建立效益函数,通过斯塔克尔伯格博弈模拟服务需求者与资源提供者间资源买卖过程,克服了现有技术中无法兼顾服务需求者与资源提供者协作服务效益的缺点,使得本发明在自动驾驶车辆协作服务决策的过程中每辆自动驾驶车辆的效益。

38、第二,本发明通过联盟博弈模拟需求小组领导者协作购买服务资源的过程,克服了现有技术中不同服务的服务需求者独立购买服务资源,浪费车载服务资源并产生较高服务成本的缺点,使得本发明在自动驾驶车辆协作服务过程中减少了车载服务资源消耗并降低了服务成本。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1