1.一种多路径路由方法,其特征在于,包括:
2.如权利要求1所述的多路径路由方法,其特征在于,训练所述强化学习模型,具体包括:
3.如权利要求2所述的多路径路由方法,其特征在于,训练所述强化学习模型,具体包括:
4.如权利要求2所述的多路径路由方法,其特征在于,所述根据当前时刻的状态空间和该网络节点的动作空间,通过预先训练后并部署在该网络节点的强化学习模型,确定该网络节点在当前时刻所要转发的数据流的下一途径网络节点,具体包括:
5.如权利要求1所述的多路径路由方法,其特征在于,所述通过逐时刻多轮迭代确定各待转发的数据流从源网络节点到目标网络节点的路由路径,具体包括:
6.如权利要求2所述的多路径路由方法,其特征在于,所述方法还包括:
7.如权利要求1所述的多路径路由方法,其特征在于,所述各网络节点的状态信息包括:各网络节点间链路的剩余带宽、传输时延和丢包率。
8.一种多路径路由方法装置,其特征在于,包括:
9.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1~7任一项所述的方法。
10.一种计算机设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1~7任一所述的方法。