本发明涉及边缘缓存领域,特别涉及一种基于门控通信机制的多智能体协作边缘缓存方法与系统。
背景技术:
1、目前,单个边缘服务器开发的许多缓存方案可能适用于多服务器场景,但它们固有的局限性可能会阻碍最佳协作缓存的有效性。虽然整数线性规划和动态规划等技术能够提供动态和自适应的缓存框架,但它们仍然主要关注单个服务器范围内的优化。同样,虽然擅长复杂网络环境下的决策和流量优化,但单智能体强化学习模型专注于优化单个服务器的缓存决策,而不是采用整体的协作方法。这种孤立的优化范例可以在一个区域内的边缘服务器之间产生不同的服务质量,特别是在异步请求高峰期间。此外,大多数协作式边缘缓存框架使用分布式学习算法进行分散决策,或者要求所有边缘节点将数据上传到决策中心进行集中决策。
2、因此,前一种独立决策的方法可能导致热门内容被边缘服务器多次缓存。这将显著降低边缘服务器的缓存性能,特别是在高请求流量期间。后一种集中决策方式可能会由于信息上传的延迟而导致决策的准确性和及时性降低。
技术实现思路
1、鉴于上述状况,本发明的主要目的是为了提出一种基于门控通信机制的多智能体协作边缘缓存方法与系统,以解决上述技术问题。
2、本发明提出了一种基于门控通信机制的多智能体协作边缘缓存方法,所述方法包括如下步骤:
3、步骤1、客户端根据自身所在位置将请求信息发送给最近的边缘服务器;
4、步骤2、最近的边缘服务器根据描述信息确认缓存是否命中,若未命中,则根据当前边缘服务器的自身缓存状态以及网络负载向临近边缘服务器或中央服务器发送缓存请求;
5、步骤3、为每个边缘服务器部署智能体,智能体为边缘服务器生成相应的缓存管理策略,临近边缘服务器或中央服务器接收到缓存请求后;
6、采用门控模型对边缘服务器缓存状态进行判断,根据判断结果,决定是否将对应的智能体状态信息上传至中央服务器,以参与全局决策;
7、步骤4、中央服务器接收到智能体状态信息后,基于多智能体决策模型综合考虑各个智能体状态信息,通过强化学习算法确定最优缓存决策,将最优缓存决策下发到对应的边缘服务器;
8、步骤5、边缘服务器接收最优缓存决策,将文件数据传输给客户端,并根据缓存决策进行缓存管理。
9、本发明还提出一种基于门控通信机制的多智能体协作边缘缓存系统,其中,所述系统应用如上所述的基于门控通信机制的多智能体协作边缘缓存方法,所述系统包括:
10、用户端,用于:
11、客户端根据自身所在位置将请求信息发送给最近的边缘服务器;
12、边缘端,用于:
13、最近的边缘服务器根据描述信息确认缓存是否命中,若未命中,则根据当前边缘服务器的自身缓存状态以及网络负载向临近边缘服务器或中央服务器发送缓存请求;
14、为每个边缘服务器部署智能体,智能体为边缘服务器生成相应的缓存管理策略,临近边缘服务器或中央服务器接收到缓存请求后;
15、采用门控模型对边缘服务器缓存状态进行判断,根据判断结果,决定是否将对应的智能体状态信息上传至中央服务器,以参与全局决策;
16、云端,用于:
17、中央服务器接收到智能体状态信息后,基于多智能体决策模型综合考虑各个智能体状态信息,通过强化学习算法确定最优缓存决策,将最优缓存决策下发到对应的边缘服务器;
18、边缘服务器接收最优缓存决策,将文件数据传输给客户端,并根据缓存决策进行缓存管理。
19、相较于现有技术,本发明的有益效果如下:
20、1、通过门控通信机制,在边缘服务器之间建立了一种自适应的信息交换机制。不同于传统的固定信息传输模式,门控通信机制根据当前的网络状态和边缘服务器的缓存情况,决定是否进行信息上传。通过这种选择性的信息传输方式,有效减少了不必要的通信开销,降低了网络负载和数据传输延迟。同时,该机制能够根据服务器的当前负载状态灵活调整通信频率,确保系统在高效利用资源的同时,保持较高的响应速度和服务质量。
21、2、利用多智能体强化学习技术,实现了边缘服务器在动态网络环境中的自适应协作。每个边缘服务器作为一个独立的智能体,通过与其他服务器的协作学习,根据缓存状态和客户端请求动态调整缓存策略。强化学习模型通过引入奖励机制,鼓励边缘服务器之间通过共享缓存资源来最大化整体系统的缓存命中率,同时减少回程带宽的使用。这种基于强化学习的自适应性,使得边缘服务器能够自主决策,优化缓存分配,提升整体网络的运行效率。
22、3、提出的缓存策略不仅限于单个边缘服务器的缓存优化,还通过中央服务器的协调,实现了全局范围内的缓存资源优化配置。中央服务器接收来自多个边缘服务器的状态信息,利用强化学习模型制定缓存更新策略,并将缓存指令下发到各个边缘服务器。该全局优化过程确保了在区域内多个服务器之间的资源均衡分配,避免了某些服务器缓存过载或缓存冗余的情况,进一步提升了整个系统的缓存命中率和响应效率。
23、本发明的附加方面与优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实施例了解到。
1.一种基于门控通信机制的多智能体协作边缘缓存方法,其特征在于,所述方法包括如下步骤:
2.根据权利要求1所述的基于门控通信机制的多智能体协作边缘缓存方法,其特征在于,在所述步骤3中,采用门控模型对边缘服务器缓存状态进行判断过程中,当前边缘服务器根据当前网络负载以及当前缓存状态进行综合分析判断;其它边缘服务器根据相应缓存状态进行分析判断。
3.根据权利要求2所述的基于门控通信机制的多智能体协作边缘缓存方法,其特征在于,其它边缘服务器根据相应缓存状态进行分析判断具体包括如下步骤:
4.根据权利要求3所述的基于门控通信机制的多智能体协作边缘缓存方法,其特征在于,在所述步骤4中,基于多智能体决策模型综合考虑各个智能体状态信息,通过强化学习算法确定最优的协同缓存策略具体包括如下步骤:
5.根据权利要求4所述的基于门控通信机制的多智能体协作边缘缓存方法,其特征在于,根据动作向量进行相应的缓存管理操作具体包括:
6.根据权利要求5所述的基于门控通信机制的多智能体协作边缘缓存方法,其特征在于,通过最大化整体奖励值对动作向量进行优化,以获取最优的协同缓存策略具体包括如下步骤:
7.根据权利要求6所述的基于门控通信机制的多智能体协作边缘缓存方法,其特征在于,根据缓存管理操作过程中内容传输延迟和缓存空间利用率,给出相应的奖励值存在如下关系式:
8.根据权利要求7所述的基于门控通信机制的多智能体协作边缘缓存方法,其特征在于,
9.根据权利要求8所述的基于门控通信机制的多智能体协作边缘缓存方法,其特征在于,中央服务器与本地边缘服务器之间的传输速率计算过程存在如下关系式:
10.一种基于门控通信机制的多智能体协作边缘缓存系统,其特征在于,所述系统应用如权利要求1至9任意一项所述的基于门控通信机制的多智能体协作边缘缓存方法,所述系统包括: