双向收发强化学习的定向天线邻居发现方法、设备及介质

文档序号：37417372发布日期：2024-03-25 19:05阅读：来源：国知局

技术特征：

1.一种基于双向收发强化学习的定向天线邻居发现方法，其特征在于，包括：

2.如权利要求1所述的基于双向收发强化学习的定向天线邻居发现方法，其特征在于，所述根据所述实时状态、实时动作及当前时隙中各子时隙的监听结果生成强化信号的步骤包括：

3.如权利要求2所述的基于双向收发强化学习的定向天线邻居发现方法，其特征在于，所述根据发送机的监听结果生成强化信号的步骤包括：

4.如权利要求2所述的基于双向收发强化学习的定向天线邻居发现方法，其特征在于，所述根据接收机的监听结果生成强化信号的步骤包括：

5.如权利要求1所述的基于双向收发强化学习的定向天线邻居发现方法，其特征在于，所述节点定义为单独的智能体{a,p,r,t}；

6.如权利要求1所述的基于双向收发强化学习的定向天线邻居发现方法，其特征在于，所述根据所述强化信号，更新扇区选择概率集合的步骤包括：

7.如权利要求1所述的基于双向收发强化学习的定向天线邻居发现方法，其特征在于，所述根据所述强化信号，更新扇区选择概率集合的步骤包括：

8.如权利要求1所述的基于双向收发强化学习的定向天线邻居发现方法，其特征在于，当所述时隙的值为0时，各扇区选择概率相等。

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述的方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。

技术总结
本发明公开了一种双向收发强化学习的定向天线邻居发现方法、设备及介质，涉及通信技术领域，方法包括：S1，构建无线自组织网络模型；S2，初始化无线自组织网络模型中各节点的节点状态、扇区选择概率集合及邻居列表；S3，启动学习循环，随机选择当前时隙的实时状态，再根据扇区选择概率集合选择当前时隙的实时动作；S4，根据实时状态、实时动作及当前时隙中各子时隙的监听结果生成强化信号；S5，根据强化信号，更新扇区选择概率集合；S6，根据当前学习循环所发现的邻居节点，更新各节点的邻居列表；S7，返回步骤S3进入下一学习循环，直至邻居节点发现完成。本发明利用强化学习机制，积累节点间各子时隙的观察经验，优化节点往后的行为，提高邻居发现效率。

技术研发人员：魏纵横,吴华昆,林智勇,温清机,陈昕叶,温剑丰,刘青林,邹汝豪,郭俊毅,苏泽斌,钟林耘,林展辉
受保护的技术使用者：广东技术师范大学
技术研发日：
技术公布日：2024/3/24

完整全部详细技术资料下载

当前第2页1 2