基于个性化分组联邦学习的无线流量预测方法及系统

文档序号：33629534发布日期：2023-03-28 22:23阅读：63来源：国知局

1.本技术涉及无线通信技术领域，尤其涉及基于个性化分组联邦学习的无线流量预测方法及系统。

背景技术：

2.在城市等大规模区域范围的无线流量预测场景下，集中式的流量预测方式需要将城市全域的流量汇聚到某一个集中节点上进行全域流量预测，会导致通信负载增加以及预测模型复杂度高等问题，因此可以在此类大规模场景中采用分布式的流量预测方法。联邦学习是一种能够采用客户端/服务器架构的分布式机器学习训练框架，多个客户端在一个中心服务器的协同之下共同训练一个算法模型。将联邦学习应用于城市全域流量预测，每个客户端仅需负责部分区域级的蜂窝流量预测，多个客户端协同起来共同进行城市全域流量预测。因此，部署在客户端的流量预测模型能够保持较低的复杂度。此外，由于联邦学习是一种分布式机器学习训练框架，不需要将城市全域的流量汇聚到某一个集中节点上进行全域流量预测，因此，在预测时效性上能够保持较低的预测时延。
3.然而，将联邦学习应用于城市全域流量预测面临着一个严峻的挑战，即预测准确性问题。这是因为，现有的联邦学习算法是基于各个客户端的数据是独立同分布（independent identically distribution，iid）假设前提之上的。但是，这个前提假设在城市级蜂窝流量预测场景下并不成立。原因是，大量个体的社会化活动聚集起来形成群体的社会化活动将导致地理空间上形成功能区域（商业区、大学、办公区、公交枢纽）。功能区域反向影响了人群的活动特性，导致不同区域的蜂窝流量又呈现出差异性。因此，亟需设计一种能够提高无线流量预测准确性的方案。

技术实现要素：

4.鉴于此，本技术实施例提供了基于个性化分组联邦学习的无线流量预测方法及系统，以消除或改善现有技术中存在的一个或更多个缺陷。
5.本技术的一个方面提供了一种基于个性化分组联邦学习的无线流量预测方法，包括：获取目标区域当前的无线流量数据，若该目标区域为预设的个性化特征区域，则获取该目标区域当前的个性化特征数据；将所述无线流量数据和所述个性化特征数据均输入预先基于个性化分组联邦学习系统训练得到的本地部署的区域级个性化流量预测模型，以通过该区域级个性化流量预测模型中预设的通用层提取无线流量的时间和空间的相关性数据以及通过该区域级个性化流量预测模型中预设的个性化层提取个性化特征数据对无线流量的影响数据，并输出无线流量预测数据作为所述目标区域对应的区域级无线流量预测结果；将所述区域级无线流量预测结果发送至所述个性化分组联邦学习系统中的中心云服务器，以使该中心云服务器根据所述个性化分组联邦学习系统中的各个边缘服务器分
别发送的各个区域对应的区域级无线流量预测结果，生成由各个所述区域构成的全域范围对应的无线流量预测结果。
6.在本技术的一些实施例中，在所述获取目标区域当前的无线流量数据之前，还包括：获取本地管辖的目标区域中各个基站的历史无线流量数据及历史多源特征数据；基于分组联邦学习方式，采用历史无线流量数据及历史多源特征数据训练得到本地部署的用于预测区域无线流量的通用层；以及，基于预设的合作收益方式，采用所述历史多源特征数据及所述历史无线流量数据确定所述目标区域是否为个性化特征区域，若是，则进一步筛选出个性化特征区域的最优特征组合，生成本地部署的用于预测区域个性化特征的个性化层；对本地部署的所述通用层和所述个性化层进行融合，以得到用于输出区域个性化流量预测结果的区域级个性化流量预测模型。
7.在本技术的一些实施例中，所述基于分组联邦学习方式，采用历史无线流量数据及历史多源特征数据训练得到本地部署的用于预测区域无线流量的通用层，包括：将所述历史无线流量数据映射为时空流量数据，并对所述时空流量数据进行归一化处理以得到对应的通用层训练集，利用所述历史多源特征数据打上分组标签；接收所述中心云服务器发送的初始的全局分组级通用层模型参数；执行预设的分组联邦学习步骤，该分组联邦学习步骤包括：应用所述通用层训练集、当前的全局分组级通用层模型参数及损失函数对预设的卷积神经网络进行训练，并将训练得到的本地分组级通用层模型参数发送至所述中心云服务器，以使该中心云服务器对各个所述边缘服务器分别发送的本地分组级通用层模型参数以分组为单位进行融合以更新全局分组级通用层模型参数；接收所述中心云服务器发送的更新后的全局分组级通用层模型参数，并判断预设的迭代次数当前是否到达次数阈值，若否，则返回执行所述分组联邦学习步骤；若是，则将当前接收的所述全局分组级通用层模型参数存储为本地的用于预测区域无线流量的通用层。
8.在本技术的一些实施例中，所述基于预设的合作收益方式，采用所述历史多源特征数据及所述历史无线流量数据确定所述目标区域是否为个性化特征区域，若是，则进一步筛选出个性化特征区域的最优特征组合，生成本地部署的用于预测区域个性化特征的个性化层，包括：将所述历史多源特征数据映射为时空多源数据，并对所述时空多源数据进行归一化处理，其中，所述历史多源特征数据包括各类非流量特征各自对应的特征数据；依次引入本地的单个个性化特征数据与流量数据训练流量预测模型，比较在引入本地的个性化特征数据前后，流量预测模型预测准确性的变化；若联合所述个性化层和通用层组成的区域级的流量预测模型的预测准确性高于单独由通用层构成的区域级的流量预测模型的预测准确性，则保留该本地特征，否则，剔除该本地特征；经过筛选后的本地特征集合若为非空，则将所述目标区域确定为个性化特征区域；根据保留下来的本地特征集合，生成不同的特征组合，其中，每个特征组合至少包含一类非流量特征对应的特征数据；各特征组合输入区域级的流量预测模型进行训练时，将各特征组合数据输入所述个性化
层，并将无线流量数据输入所述通用层，训练得到的预测准确性作为特征组合的合作收益；筛选出合作收益最大的特征组合作为个性化特征区域中的最优特征组合，并将基于所述历史多源特征数据训练得到的全连接神经网络模型确定为本地部署的用于预测区域个性化特征的个性化层。
9.在本技术的一些实施例中，还包括：若确定所述目标区域不为个性化特征区域，则将本地部署的用于预测区域无线流量的通用层确定为本地的区域级流量预测模型；相对应的，在所述获取目标区域当前的无线流量数据之后，以及在所述将所述区域级无线流量预测结果发送至所述个性化分组联邦学习系统中的中心云服务器之前，还包括：将所述无线流量数据输入预先基于个性化分组联邦学习系统训练得到的本地部署的区域级流量预测模型，以使该区域级流量预测模型输出所述目标区域对应的区域级无线流量预测结果。
10.在本技术的一些实施例中，所述个性化特征数据包括：天气气候数据、基站分布密度数据、地理功能区域数据、节假日活动数据、社交数据和夜间灯光数据中的至少一种。
11.本技术的另一个方面提供了一种基于个性化分组联邦学习的无线流量预测装置，包括：数据获取模块，用于获取目标区域当前的无线流量数据，若该目标区域为预设的个性化特征区域，则获取该目标区域当前的个性化特征数据；区域级预测模块，用于将所述无线流量数据和所述个性化特征数据均输入预先基于个性化分组联邦学习系统训练得到的本地部署的区域级个性化流量预测模型，以通过该区域级个性化流量预测模型中预设的通用层提取无线流量的时间和空间的相关性数据以及通过该区域级个性化流量预测模型中预设的个性化层提取个性化特征数据对无线流量的影响数据，并输出无线流量预测数据作为所述目标区域对应的区域级无线流量预测结果；全域预测模块，用于将所述区域级无线流量预测结果发送至所述个性化分组联邦学习系统中的中心云服务器，以使该中心云服务器根据所述个性化分组联邦学习系统中的各个边缘服务器分别发送的各个区域对应的区域级无线流量预测结果，生成由各个所述区域构成的全域范围对应的无线流量预测结果。
12.本技术的另一个方面还提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现所述的基于个性化分组联邦学习的无线流量预测方法。
13.本技术的另一个方面还提供了一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现所述的基于个性化分组联邦学习的无线流量预测方法。
14.本技术的另一个方面还提供了一种用于城市全域无线流量预测的个性化分组联邦学习系统，包括：中心云服务器以及分别与该中心云服务器通信连接的多个边缘服务器；各个所述边缘服务器分别用于执行所述的基于个性化分组联邦学习的无线流量预测方法，以对城市全域内划分的一个或多个区域进行流量预测；每个所述边缘云服务器
均用于自其管辖的一个或多个区域中的各个基站接收无线流量数据；所述中心云服务器用于根据各个所述边缘服务器分别发送的各个区域对应的区域级无线流量预测结果，生成由各个所述区域构成的城市全域对应的无线流量预测结果。
15.本技术提供的基于个性化分组联邦学习的无线流量预测方法，首先获取目标区域当前的无线流量数据，若该目标区域为预设的个性化特征区域，则获取该目标区域当前的个性化特征数据，能够对存在个性化特征和不存在个性化特征的目标区域进行区别化处理，以有效提高针对目标区域进行区域级无线流量预测的针对性及智能化程度；而后通过将所述当前的无线流量数据和所述当前的个性化特征数据均输入预先基于个性化分组联邦学习系统训练得到的本地部署的区域级个性化流量预测模型，以使该区域级个性化流量预测模型通过预设的通用层输出所述无线流量数据对应的无线流量特征预测数据，并通过预设的个性化层输出所述个性化特征数据对应的个性化特征预测数据，再基于所述无线流量特征预测数据和所述个性化特征预测数据生成所述目标区域对应的区域级无线流量预测结果，能够将城市等全域范围内的各个区域的个性化特征引入无线通信流量预测过程中，以提高各个区域的区域级无线通信流量预测的准确性及针对性；再将所述区域级无线流量预测结果发送至所述个性化分组联邦学习系统中的中心云服务器，以使该中心云服务器根据所述个性化分组联邦学习系统中的各个边缘服务器分别发送的各个区域对应的区域级无线流量预测结果，生成由各个所述区域构成的全域范围对应的无线流量预测结果，能够有效提高城市等全域范围的无线通信流量预测的准确性及有效性，同时能够提高城市等全域范围的无线通信流量预测的时效性并降低针对城市等全域范围的无线通信流量预测的计算复杂度。
16.本技术的附加优点、目的，以及特征将在下面的描述中将部分地加以阐述，且将对于本领域普通技术人员在研究下文后部分地变得明显，或者可以根据本技术的实践而获知。本技术的目的和其它优点可以通过在说明书以及附图中具体指出的结构实现到并获得。
17.本领域技术人员将会理解的是，能够用本技术实现的目的和优点不限于以上具体所述，并且根据以下详细说明将更清楚地理解本技术能够实现的上述和其他目的。
附图说明
18.此处所说明的附图用来提供对本技术的进一步理解，构成本技术的一部分，并不构成对本技术的限定。附图中的部件不是成比例绘制的，而只是为了示出本技术的原理。为了便于示出和描述本技术的一些部分，附图中对应部分可能被放大，即，相对于依据本技术实际制造的示例性装置中的其它部件可能变得更大。在附图中：图1为本技术一实施例中的基于个性化分组联邦学习的无线流量预测方法的总流程示意图。
19.图2为本技术一实施例中的个性化特征筛选举例示意图。
20.图3为本技术一实施例中的基于个性化分组联邦学习的无线流量预测方法的一种具体流程示意图。
21.图4为本技术另一实施例中的基于个性化分组联邦学习的无线流量预测装置的结构示意图。
22.图5为本技术另一实施例中的用于城市全域无线通信流量预测的个性化分组联邦学习系统的结构示意图。
23.图6为本技术应用实例中提供的区域1的区域级个性化流量预测模型的举例示意图。
24.图7为本技术应用实例中提供的区域2的区域级个性化流量预测模型的举例示意图。
25.图8为本技术应用实例中提供的区域n的区域级流量预测模型的举例示意图。
26.图9为本技术应用实例中所提基于单一源特征数据的分组联邦学习举例示意图。
27.图10为本技术应用实例中所提基于多源特征数据的分组联邦学习举例示意图。
具体实施方式
28.为使本技术的目的、技术方案和优点更加清楚明白，下面结合实施方式和附图，对本技术做进一步详细说明。在此，本技术的示意性实施方式及其说明用于解释本技术，但并不作为对本技术的限定。
29.在此，还需要说明的是，为了避免因不必要的细节而模糊了本技术，在附图中仅仅示出了与根据本技术的方案密切相关的结构和/或处理步骤，而省略了与本技术关系不大的其他细节。
30.应该强调，术语“包括/包含”在本文使用时指特征、要素、步骤或组件的存在，但并不排除一个或更多个其它特征、要素、步骤或组件的存在或附加。
31.在此，还需要说明的是，如果没有特殊说明，术语“连接”在本文不仅可以指直接连接，也可以表示存在中间物的间接连接。
32.在下文中，将参考附图描述本技术的实施例。在附图中，相同的附图标记代表相同或类似的部件，或者相同或类似的步骤。
33.伴随着移动互联网的迅猛发展，移动终端数量的持续增长，以及高清视频、文件下载等数字多媒体业务的飞速普及，移动数据业务呈现爆发式增长。精准地预测城市全域尺度通信网络流量能够辅助运营商进行精细化运营、更高效地配备与部署基站资源，从而满足大量涌现的各种业务需求。
34.通信流量预测方法大致分为两类，一类是采用传统算法，基于统计概率模型或者时间序列预测模型，针对每个小区进行单独建模进行流量预测，然而，针对单个小区的流量预测模型无法直接适用于所有小区。在实际应用中，对于千万数量级别小区流量进行并行化建模，这无疑非常困难；另一类是采用深度学习算法，诸如卷积神经网络或长短时记忆网络，借助深度学习模型能够拟合复杂非线性的特点，将多个小区的流量数据整体作为训练集进行训练并产生统一模型用于多个小区的预测。然而，随着流量预测范围扩大到城市全域尺度，预测范围的扩大必然导致预测模型的复杂度提高，实际预测效果不理想。此外，在模型持续运行过程中，分散在城市全域范围的各个基站的实时流量数据需要全部汇聚到部署了全域流量预测模型的中心节点上进行演算，这不仅会导致通信负载的增加，而且还会导致预测模型的时效性较低。
35.现有的蜂窝网络流量预测算法（基于统计的算法、时间序列预测算法、机器学习算法或者深度学习算法）都是集中式算法，将其应用到单个基站或者小规模基站的流量预测
尚可接受。但是，推广到城市全域尺度的蜂窝流量预测时，集中式流量预测算法将会面临模型复杂度高、预测准确性及时效性低。因此，在城市全域流量预测场景下，需采用联邦学习的方式以在预测时效性上能够保持较低的预测时延。
36.但由于大量个体的社会化活动聚集起来形成群体的社会化活动将导致城市这类大规模区域的地理空间上形成不同的功能区域（商业区、大学、办公区、公交枢纽）。功能区域反向影响了人群的活动特性，导致不同区域的蜂窝流量又呈现出差异性。因此，本技术提出一种能够解决基于联邦学习的城市全域流量预测准确性问题的方案。
37.基于此，为了满足城市等全域范围内的不同区域的差异性并提高无线流量预测的准确性，本技术分别提供了基于个性化分组联邦学习的无线流量预测方法的实施例、用于实现基于个性化分组联邦学习的无线流量预测方法的基于个性化分组联邦学习的无线流量预测装置、电子设备（如边缘服务器等）以及计算机可读存储介质的实施例、以及包含有边缘服务器及中心云服务器等的用于城市全域无线通信流量预测的个性化分组联邦学习系统。
38.具体通过下述实施例进行详细说明。
39.基于此，本技术实施例提供一种可以由基于个性化分组联邦学习的无线流量预测装置执行的基于个性化分组联邦学习的无线流量预测方法，参见图1，所述基于个性化分组联邦学习的无线流量预测方法具体包含有如下内容：步骤100：获取目标区域当前的无线流量数据，若该目标区域为预设的个性化特征区域，则获取该目标区域当前的个性化特征数据。
40.在本技术的一个或多个实施例中，所述基于个性化分组联邦学习的无线流量预测装置可以实现在边缘服务器中，而所述目标区域专门是指执行该边缘服务器本地管辖的区域。
41.可以理解的是，本技术提及的所述全域范围是指如一个城市、多个城市或省份等大规模的全域区域范围，也可以指具备其他自定义特征的区域范围，具体可以根据实际应用情形设置。所述基站是指蜂窝基站。
42.所述全域范围被预先划分为多个区域（也可以称之为子区域），前述的目标区域是指当前执行所述基于个性化分组联邦学习的无线流量预测方法的这个边缘服务器自身管辖的区域，且每个区域仅归一个边缘服务器管辖，但一个边缘服务器可以根据其数据处理能力或者区域数据量等决定管辖一个或多个区域，所以一个边缘服务器对应的目标区域可能并不唯一。例如，一个全域范围被划分为n个区域，其中的区域1和区域n可以由同一个边缘服务器负责管辖，n≥2。
43.在本技术的一个或多个实施例中，所述无线流量可以称之为无线通信流量，所述无线流量数据也可以称之为无线通信流量数据，步骤100中的所述获取目标区域当前的无线流量数据具体可以为：边缘服务器接收本地管辖的所有区域中的各个基站在预设时段内（例如整点之间的1小时内）的无线通信流量数据，例如可以包含有基站经由终端设备获取的上网流量、短消息流量以及语音呼叫流量等数据。
44.在步骤100中，若该目标区域为预设的个性化特征区域，则获取该目标区域当前的个性化特征数据是指：在边缘服务器接收到其管辖的目标区域中的基站发送的无线流量数据之后，可以自预存储的该目标区域的信息中获知该目标区域是否为个性化特征区域，若
是，才获取该目标区域当前的个性化特征数据并执行后续步骤200的个性化流量预测操作，若不是，则采用其他步骤进行预测（后续实施例详细说明），以有效提高本技术提供的无线流量预测方法的智能化程度及适用广泛性，使得本方案能够适用于存在个性化特征的区域流量预测，也能够适用于不存在个性化特征的区域流量预测。
45.在本技术的一个或多个实施例中，所述个性化特征数据是指除无线流量数据之外的其他符合对应区域区别于其他区域且影响到该区域的无线流量预测准确性的差异性特征数据，具体可以在训练阶段从多源特征对应的历史多源特征数据中筛选。例如：在模型训练阶段，将区域1中的基站密度（也可以称之为基站分布）数据与其无线流量数据一起进行针对该区域1的无线流量预测，若其结果比单独采用区域1的无线流量数据对该区域1进行无线流量预测得到的结果准确性更好，则将基站密度作为区域1的个性化特征。
46.另外，参见图2，假设多源特征包括：基站分布特征、节假日特征、天气特征、兴趣点特征、社交特征和夜间灯光特征，若经训练过程确定区域1有多类个性化特征（如基站分布特征、兴趣点特征和社交特征），则可以将区域1确定为个性化特征区域，并将包含有基站分布特征、兴趣点特征和社交特征的组合称为区域1的特征组合或多特征组合，若区域2仅有两类个性化特征（如夜间灯光特征、社交特征），则可以将区域2确定为个性化特征区域，并将仅包含有夜间灯光特征和社交特征的组合称为区域2的两特征组合；若区域n中没有个性化特征，则可以将其称为非个性化区域。
47.步骤200：将所述无线流量数据和所述个性化特征数据均输入预先基于个性化分组联邦学习系统训练得到的本地部署的区域级个性化流量预测模型，以通过该区域级个性化流量预测模型中预设的通用层提取无线流量的时间和空间的相关性数据以及通过该区域级个性化流量预测模型中预设的个性化层提取个性化特征数据对无线流量的影响数据，并输出无线流量预测数据作为所述目标区域对应的区域级无线流量预测结果。
48.可以理解的是，所述影响数据是指个性化特征和无线流量的时空特征的叠加结果。所述无线流量的时间和空间的相关性数据是指同时捕获无线流量在时间以及空间两个维度的共性特性数据。
49.在本技术的一个或多个实施例中，所述个性化分组联邦学习系统至少包含有用于执行所述基于个性化分组联邦学习的无线流量预测方法的各个边缘服务器以及与各个边缘服务器之间分别通信连接的中心云服务器，该中心云服务器和各个边缘服务器预先协同训练得到所述区域级个性化流量预测模型，并将该区域级个性化流量预测模型分别部署在各个边缘服务器本地。所述个性化分组联邦学习系统可以称之为用于城市全域无线通信流量预测的个性化分组联邦学习系统，也可以称之为云边协同城市全域无线通信流量预测框架或系统。
50.在本技术的一个或多个实施例中，所述区域级个性化流量预测模型是指包含有通用层、个性化层以及融合层的机器学习模型，具体可以采用卷积神经网络等模型，其中，通用层用于根据输入其中的无线流量数据输出对应的无线流量特征预测数据，个性化层用于根据输入其中的个性化特征数据输出对应的个性化特征预测数据；所述通用层和个性化层分别连接至所述融合层，以使融合层用于将接收自所述通用层的无线流量特征预测数据和接收所述个性化层的个性化特征预测数据进行叠加，并将对应的叠加结果输入一个激活函数，以激活函数的输出作为所述目标区域对应的区域级无线流量预测结果。
51.在本技术的一个或多个实施例中，所述区域级流量预测模型是指仅包含有通用层的机器学习模型，具体可以采用卷积神经网络等模型，用于根据输入其中的无线流量数据输出对应的无线流量特征预测数据。
52.步骤300：将所述区域级无线流量预测结果发送至所述个性化分组联邦学习系统中的中心云服务器，以使该中心云服务器根据所述个性化分组联邦学习系统中的各个边缘服务器分别发送的各个区域对应的区域级无线流量预测结果，生成由各个所述区域构成的全域范围对应的无线流量预测结果。
53.在步骤300中，所述中心云服务器在接收到所述全域范围中的各个所述区域对应的区域级无线流量预测结果之后，汇总生成最终的全域范围的无线流量预测结果。
54.从上述描述可知，本技术实施例提供的基于个性化分组联邦学习的无线流量预测方法，能够对存在个性化特征和不存在个性化特征的目标区域进行区别化处理，以有效提高针对目标区域进行区域级无线流量预测的针对性及智能化程度；能够将城市等全域范围内的各个区域的个性化特征引入无线通信流量预测过程中，以提高各个区域的区域级无线通信流量预测的准确性及针对性；能够有效提高城市等全域范围的无线通信流量预测的准确性及有效性，同时能够提高城市等全域范围的无线通信流量预测的时效性并降低针对城市等全域范围的无线通信流量预测的计算复杂度。
55.为了进一步提高区域级个性化流量预测模型的应用可靠性及有效性，在本技术实施例提供的一种基于个性化分组联邦学习的无线流量预测方法中，参见图3，所述基于个性化分组联邦学习的无线流量预测方法中的步骤100之前还具体包含有如下内容：步骤010：获取本地管辖的目标区域中各个基站的历史无线流量数据及历史多源特征数据；基于分组联邦学习方式，采用历史无线流量数据及历史多源特征数据训练得到本地部署的用于预测区域无线流量的通用层。
56.步骤020：基于预设的合作收益方式，采用所述历史多源特征数据及所述历史无线流量数据确定所述目标区域是否为个性化特征区域，若是，则进一步筛选出个性化特征区域的最优特征组合，生成本地部署的用于预测区域个性化特征的个性化层。
57.步骤030：对本地部署的所述通用层和所述个性化层进行融合，以得到用于输出区域个性化流量预测结果的区域级个性化流量预测模型。
58.具体来说，首先，各个移动边缘计算服务器采集本区域的历史无线流量数据以及历史多源特征数据，并在中心服务器的协调下，采用分组联邦学习共同训练本地部署的区域级流量预测模型的通用层。其次，各个移动边缘计算服务器采集本区域的历史多源特征数据（天气气候、基站分布密度、节假日活动、兴趣点数据、社交数据、夜间灯光数据等），采用合作收益方法，训练本地区域级的流量预测模型的个性化层。具体地，各个边缘计算服务器将本地区的各个区域性特征作为合作的参与者，比较不同特征组合对流量预测产生的收益，根据收益进行本地区特征的筛选。
59.需要说明的是，对比现有多源流量预测模型，通常将流量数据和所有的多源特征数据直接融合在一起，以提升模型预测准确度。但是，融合的多源特征过多会加深模型训练的复杂度，导致预测效果变差。而本技术所提的基于合作收益的区域流量预测模型的个性化特征筛选方法，能够为每个区域引入合适的多源特征数据，从而达到提升模型预测效果的目的。
60.为了进一步提高通用层的应用可靠性及有效性，在本技术实施例提供的一种基于个性化分组联邦学习的无线流量预测方法中，所述基于个性化分组联邦学习的无线流量预测方法中的步骤010具体包含有如下内容：步骤011：将所述历史无线流量数据映射为时空流量数据，并对所述时空流量数据进行归一化处理以得到对应的通用层训练集，利用所述历史多源特征数据打上分组标签。
61.步骤012：接收所述中心云服务器发送的初始的全局分组级通用层模型参数。
62.步骤013：执行预设的分组联邦学习步骤，该分组联邦学习步骤包括：应用所述通用层训练集、当前的全局分组级通用层模型参数及损失函数对预设的卷积神经网络进行训练，并将训练得到的本地分组级通用层模型参数发送至所述中心云服务器，以使该中心云服务器对各个所述边缘服务器分别发送的本地分组级通用层模型参数以分组为单位进行融合以更新全局分组级通用层模型参数。
63.步骤014：接收所述中心云服务器发送的更新后的全局分组级通用层模型参数，并判断预设的迭代次数当前是否到达次数阈值，若否，则返回执行所述分组联邦学习步骤；若是，则将当前接收的所述全局分组级通用层模型参数存储为本地的用于预测区域无线流量的通用层。
64.为了进一步提高个性化层的应用可靠性及有效性，在本技术实施例提供的一种基于个性化分组联邦学习的无线流量预测方法中，所述基于个性化分组联邦学习的无线流量预测方法中的步骤020具体包含有如下内容：步骤021：将所述历史多源特征数据映射为时空多源数据，并对所述时空多源数据进行归一化处理，其中，所述历史多源特征数据包括各类非流量特征各自对应的特征数据。
65.步骤022：依次引入本地的单个个性化特征数据与流量数据训练流量预测模型，比较在引入本地的个性化特征数据前后，流量预测模型预测准确性的变化；若联合所述个性化层和通用层组成的区域级的流量预测模型的预测准确性高于单独由通用层构成的区域级的流量预测模型的预测准确性，则保留该本地特征，否则，剔除该本地特征；经过筛选后的本地特征集合若为非空，则将所述目标区域确定为个性化特征区域。
66.所述本地特征指引入本地的单个个性化特征数据。
67.步骤023：根据保留下来的本地特征集合，生成不同的特征组合，其中，每个特征组合至少包含一类非流量特征对应的特征数据；各特征组合输入区域级的流量预测模型进行训练时，将各特征组合数据输入所述个性化层，并将无线流量数据输入所述通用层，训练得到的预测准确性作为特征组合的合作收益。
68.步骤024：筛选出合作收益最大的特征组合作为个性化特征区域中的最优特征组合，并将基于所述历史多源特征数据训练得到的全连接神经网络模型确定为本地部署的用于预测区域个性化特征的个性化层。
69.为了进一步提高无线流量预测方法的智能化程度及适用广泛性，在本技术实施例提供的一种基于个性化分组联邦学习的无线流量预测方法中，若确定所述目标区域不为个性化特征区域，则将本地部署的用于预测区域无线流量的通用层确定为本地的区域级流量预测模型，则在所述基于个性化分组联邦学习的无线流量预测方法中的步骤100之后以及步骤300之前还具体包含有如下内容：步骤210：将所述无线流量数据输入预先基于个性化分组联邦学习系统训练得到
的本地部署的区域级流量预测模型，以使该区域级流量预测模型输出所述目标区域对应的区域级无线流量预测结果。
70.为了进一步提高个性化特征数据的应用可靠性及有效性，在本技术实施例提供的一种基于个性化分组联邦学习的无线流量预测方法中，所述个性化特征数据可以包含有：天气气候数据、基站分布密度数据、地理功能区域数据、节假日活动数据、社交数据和夜间灯光数据中的至少一种。
71.从软件层面来说，本技术还提供一种用于执行所述基于个性化分组联邦学习的无线流量预测方法中全部或部分内的基于个性化分组联邦学习的无线流量预测装置，参见图4，所述基于个性化分组联邦学习的无线流量预测装置具体包含有如下内容：数据获取模块10，用于获取目标区域当前的无线流量数据，若该目标区域为预设的个性化特征区域，则获取该目标区域当前的个性化特征数据。
72.区域级预测模块20，用于将所述无线流量数据和所述个性化特征数据均输入预先基于个性化分组联邦学习系统训练得到的本地部署的区域级个性化流量预测模型，以通过该区域级个性化流量预测模型中预设的通用层提取无线流量的时间和空间的相关性数据以及通过该区域级个性化流量预测模型中预设的个性化层提取个性化特征数据对无线流量的影响数据，并输出无线流量预测数据作为所述目标区域对应的区域级无线流量预测结果。
73.全域预测模块30，用于将所述区域级无线流量预测结果发送至所述个性化分组联邦学习系统中的中心云服务器，以使该中心云服务器根据所述个性化分组联邦学习系统中的各个边缘服务器分别发送的各个区域对应的区域级无线流量预测结果，生成由各个所述区域构成的全域范围对应的无线流量预测结果。
74.本技术提供的基于个性化分组联邦学习的无线流量预测装置的实施例具体可以用于执行上述实施例中的基于个性化分组联邦学习的无线流量预测方法的实施例的处理流程，其功能在此不再赘述，可以参照上述基于个性化分组联邦学习的无线流量预测方法实施例的详细描述。
75.所述基于个性化分组联邦学习的无线流量预测装置进行基于个性化分组联邦学习的无线流量预测的部分可以在服务器中执行，例如边缘服务器，而在另一种实际应用情形中，也可以所有的操作都在客户端设备中完成。具体可以根据所述客户端设备的处理能力，以及用户使用场景的限制等进行选择。本技术对此不作限定。若所有的操作都在所述客户端设备中完成，所述客户端设备还可以包括处理器，用于基于个性化分组联邦学习的无线流量预测的具体处理。
76.上述的客户端设备可以具有通信模块（即通信单元），可以与远程的服务器进行通信连接，实现与所述服务器的数据传输。所述服务器可以包括任务调度中心一侧的服务器，其他的实施场景中也可以包括中间平台的服务器，例如与任务调度中心服务器有通信链接的第三方服务器平台的服务器。所述的服务器可以包括单台计算机设备，也可以包括多个服务器组成的服务器集群，或者分布式装置的服务器结构。
77.上述服务器与所述客户端设备端之间可以使用任何合适的网络协议进行通信，包括在本技术提交日尚未开发出的网络协议。所述网络协议例如可以包括tcp/ip协议、udp/ip协议、http协议、https协议等。当然，所述网络协议例如还可以包括在上述协议之上使用
的rpc协议(remote procedure call protocol，远程过程调用协议)、rest协议(representational state transfer，表述性状态转移协议)等。
78.从上述描述可知，本技术实施例提供的基于个性化分组联邦学习的无线流量预测装置，能够对存在个性化特征和不存在个性化特征的目标区域进行区别化处理，以有效提高针对目标区域进行区域级无线流量预测的针对性及智能化程度；能够将城市等全域范围内的各个区域的个性化特征引入无线通信流量预测过程中，以提高各个区域的区域级无线通信流量预测的准确性及针对性；能够有效提高城市等全域范围的无线通信流量预测的准确性及有效性，同时能够提高城市等全域范围的无线通信流量预测的时效性并降低针对城市等全域范围的无线通信流量预测的计算复杂度。
79.基于上述基于个性化分组联邦学习的无线流量预测方法和/或基于个性化分组联邦学习的无线流量预测装置的实施例，本技术还提供一种用于城市全域无线通信流量预测的个性化分组联邦学习系统，参见图5，该用于城市全域无线通信流量预测的个性化分组联邦学习系统具体包含有如下内容：中心云服务器以及分别与该中心云服务器通信连接的多个边缘服务器；各个所述边缘服务器分别用于执行所述的基于个性化分组联邦学习的无线流量预测方法，以对城市全域内划分的一个或多个区域进行流量预测；每个所述边缘云服务器均用于自其管辖的一个或多个区域中的各个基站接收无线流量数据；所述中心云服务器用于根据各个所述边缘服务器分别发送的各个区域对应的区域级无线流量预测结果，生成由各个所述区域构成的城市全域对应的无线流量预测结果。
80.具体来说，城市全域被分割成若干个子区域。一个移动边缘计算服务器负责一个或多个子区域的流量预测。若干移动边缘计算服务器和一个中心云服务器组成整个云边协同流量预测框架。区域级个性化流量预测模型或区域级流量预测模型的训练过程以及运行过程均在移动边缘计算服务器实现，中心云服务器仅负责协调多个移动边缘计算服务器进行协同训练，并将多个移动边缘计算服务器预测的区域级流量汇总形成城市全域流量预测结果。本文所提的云边协同的城市全域流量预测框架能够以较低的复杂度、较高的实时性地实现城市全域流量预测。
81.为了进一步说明本方案，本技术还提供一种基于个性化分组联邦学习的无线流量预测方法的具体应用实例，具体包括以下步骤：（一）构建用于城市全域无线通信流量预测的个性化分组联邦学习系统构建由一个中心云服务器、若干移动边缘服务器和城市全域蜂窝基站组成的云边协同的全域无线流量预测框架。
82.步骤1，中心云服务器对城市全域范围继续区域划分。该区域划分方法，可以是按照城市的行政区域进行划分，或者将整个城市以一定的粒度（500m*500m，或者100m*100m）划分成均匀的网格，若干网格组成一个区域。
83.步骤2，移动边缘服务器管辖一个区域或者若干区域。针对地理上一个区域，在移动边缘服务器上对应部署一个区域级流量预测模型。因此，一个移动边缘服务器上将部署一个或者若干个区域级流量预测模型。
84.步骤3，移动边缘服务器的任务有如下两个。
85.步骤301，在模型训练阶段，参与中心云服务器的分组联邦学习训练。包括三个步
骤：步骤一，各个移动边缘服务器采集其管辖区域范围内的历史无线流量数据和历史多源特征数据（兴趣点数据、社交数据、夜间灯光强度数据等）。步骤二，用历史多源特征数据确定标签分组及标签分组下的具体标签。首先，确定标签分组。一种数据源的特征数据对应一个标签分组（例如：兴趣点数据对应地理功能区域标签分组；社交数据对应社交水平标签分组；夜间灯光强度数据对应光强标签分组）。其次，确定标签分组下的具体标签。依据兴趣点数据将区域标记为多类具体标签，例如旅游景点、教育培训、交通设施等标签；依据社交数据将区域标记为两类标签，包括高社交水平和低社交水平标签；根据夜间灯光数据将区域标记为两类标签，包括灯光高亮区和灯光低亮区标签。步骤三，训练区域级的无线流量预测模型的通用层。在中心云服务器的协调下本地训练一个或者若干个区域级的无线流量预测模型的通用层。步骤四，训练区域级的流量预测模型的个性化层。独自训练所负责的一个或者若干个区域级的流量预测模型的个性化层，根据训练结果确定本区域是否含有个性化层以及该区域是否为个性化区域（若经训练过程确定本区域有多类个性化特征（如兴趣点特征、社交特征和夜间灯光特征等），则可以将该区域确定为个性化区域）。步骤302，在模型运行阶段，包括三个步骤，首先，获取目标区域当前的无线流量数据，若该目标区域为预设的个性化区域，则获取该目标区域当前的个性化特征数据；其次，将无线流量数据和个性化特征数据均输入预先基于个性化分组联邦学习系统训练得到的本地部署的区域级个性化流量预测模型，并输出无线流量预测数据作为所述目标区域对应的区域级无线流量预测结果；最后将所述区域级无线流量预测结果发送至所述个性化分组联邦学习系统中的中心云服务器。
86.步骤4，中心云服务器的任务有如下两个。
87.步骤401，在模型训练阶段，负责协调多个移动边缘服务器上部署的区域级的流量预测模型进行训练。中心云服务器按照各个移动边缘服务器所管辖区域的标签分组以及每个标签分组下具体的标签数量确定联邦分组数量，并以联邦分组为单位训练区域级的流量预测模型的通用层。
88.步骤402，在模型运行阶段，将多个移动边缘服务器预测的区域级流量的预测结果汇聚起来，形成城市全域流量预测结果。
89.（二）区域级个性化流量预测模型首先，蜂窝流量在时间以及空间两个维度都具有相关性。因此，各个移动边缘计算服务器上运行的区域级个性化流量预测模型，需要同时捕获无线流量在时间以及空间两个维度的共性特性。其次，大量移动用户的社会化活动聚集起来形成群体的社会化活动将导致地理空间上形成功能区域（商业区、大学、办公区、公交枢纽）。功能区域反向影响了人群的活动特性，导致不同功能区域的蜂窝流量又呈现出差异性。因此，各移动边缘计算服务器上运行的区域级个性化流量预测模型，还需要体现出该区域的个性化特征。
90.区域级个性化流量预测模型包含通用层+个性化层。其中，通用层为通用时空特征预测模块，使用现有的联邦学习训练方法（例如联邦平均方法、联邦加权平均方法）以协作方式在中心服务器的协调下进行训练。个性化层为区域流量预测模块，在移动边缘服务器中进行本地化训练，从而能够捕获区域流量的特征。因此，区域级个性化流量预测模型既能融合各区域流量时空特征，又能够捕捉到特定地区上个性化特征信息，以进行更好的区域化预测。
91.步骤1，区域级的流量预测模型中通用层负责提取区域流量在时间和空间两个维度的特征。蜂窝流量在时间和空间两个维度都具有相关性。蜂窝流量是人群活动的反映。人群活动相似性决定了蜂窝流量具有相似性。人群的自然属性（每天的活动规律：早起晚睡）决定了蜂窝流量在时间维度具有相关性，人群的社会属性导致了流量都具有空间相关性。首先，人的自然属性（例如，每天的活动规律：早起晚睡；以及每个季节的活动规律：随着昼夜长短的变化，工作和休息时长也发生改变）导致了区域流量同样具有临近性、周期性和趋势性。其次，人的活动具有空间属性。人的社会属性驱使人在地理空间上移动（例如，每工作日往返于家和办公地点，每周末往返于家和公共娱乐场所）导致了区域流量具有空间维度上的相关性。由此可见，区域流量具有时间和空间两个维度的相关性，因此，区域级的流量预测模型中的通用层负责提取该区域流量在时间和空间两个维度的相关性。
92.步骤101，区域级的流量预测模型中通用层首先提取区域流量中的时间相关性。这一功能的实现主要靠对输入的流量数据分别以一定的依赖性进行采样。例如，将输入的区域流量按“小时”为单位进行抽样，将连续的若干小时的区域流量数据都输入通用层的“临近性”组件，由其学习区域流量在时间维度的“临近性”特征；将输入区域流量按“天”为单位进行抽样，将每天同一小时的流量数据都输入通用层的“周期性”组件，由其学习区域流量在时间维度中“周期性”特征；将输入区域流量按“周”为单位进行抽样，将每周同一小时的流量数据都输入通用层的“趋势性”组件，由其学习区域流量在时间维度中“趋势性”特征。
93.步骤102，区域级的流量预测模型中通用层再提取区域流量中的空间相关性。这一功能的实现主要靠通用层中构成“临近性”组件、“周期性”组件、以及“趋势性”组件中的各种卷积神经网络的卷积层操作实现。所属卷积神经网络可以是普通的卷积神经网络（cnn），残差网络（resnet），密集卷积网络（densenet）构成。
94.步骤103，区域级的流量预测模型中通用层最后由参数矩阵融合将“临近性”组件、“周期性”组件、“趋势性”组件到的特征融合，从而得到通用层最终的预测输出。
95.步骤2，区域级的流量预测模型的个性化层负责提取区域的个性化特征（基站分布、兴趣点数量、天气气象、社交数据、夜间灯光强度等）。不同区域的通信流量具有地区差异性。例如，区域的蜂窝基站的部署密度决定了该区域流量的上限; 区域的兴趣点信息，例如，商场数目、公交站点数目、餐馆数目等，也会影响区域的通信流量，因为兴趣点更多的区域能够吸引更多的人，因此，该地区通信流量会更高；区域的天气状态将影响人群的活跃度；夜间灯光强度以及社交数据（签到数据以及发表推文数量）都可以反映人的行为的活跃程度，也能对地区流量产生影响；总而言之，这些区域性特征（基站分布、兴趣点数量、天气气象、社交数据、夜间灯光强度等）也会对区域的流量预测产生影响。
96.步骤201，个性化区域特征筛选，具体的方法见下述应用实例（三）。各个区域性特征（基站分布、兴趣点数量、天气气象、社交数据、夜间灯光强度等）对不同区域流量的影响各不相同，采用合作收益对特征进行筛选，如图2所示。例如，对于某个区域1，基站分布特征、兴趣点特征和社交特征对该区域的流量的影响较大，形成最优特征组合，因此，对于区域1的区域级的流量预测模型的个性化层应该由基站分布特征、兴趣点特征和社交特征构成；对于某个区域2，社交特征和夜间灯光特征对该区域的流量的影响较大，而其他特征对该区域的流量的影响较小，因此，对于区域2的区域级的流量预测模型的个性化层应该由社交特征和夜间灯光特征构成；对于某个区域n，任何一个特征对该区域流量影响均不大，因
此，对于区域n的区域级的流量预测模型则没有个性化层。
97.步骤202，基于筛选出来的个性化层的输入特征数量，构建相应的数量的“个性化”组件组成区域级的流量预测模型中个性化层。由于个性化层的输入通常是静态数据，并不复杂，因此，“个性化”组件不需要用特别复杂的网络模型以提取信息。通常情况下，采用浅层的全连接神经网络模型即可。
98.步骤203，将筛选后的特征数据输入到区域级的流量预测模型的个性化层，输出个性化的预测结果，定义为。
99.步骤3，将区域级的流量预测模型的通用层的输出与个性化层输出矩阵做一个拼接操作，得到区域级的流量预测模型的最终预测输出：其中，表示叠加操作，表示sigmoid激活函数。由于输入数据已经经过min-max归一化被处理为[0,1]，但在通过模型的复杂运算后，输出预测数据的范围产生了变化，然而真实流量标签的范围为[0,1], 为了方便利用预测数据与真实数据进行误差计算，需要选取sigmoid激活函数将预测结果一一映射到[0,1]。最终形成的区域1的区域级个性化流量预测模型参见图6，区域2的区域级个性化流量预测模型参见图7，以及区域n的区域级流量预测模型如图8所示。其中，图6至图8中出现的fusion（）表示各矩阵进行哈达玛乘积之后进行融合；fusion（）表示矩阵的叠加；表示流量的预测值；y
t
表示流量的真实值；non表示输入为空；sigmoid表示激活函数；loss表示损失函数。
[0100]
综上所述，区域级个性化流量预测模型由通用层和个性化层组成。1）区域级的流量预测模型中通用层负责提取区域流量在时间和空间两个维度的特征，包含“临近性”组件、“周期性”组件以及“趋势性”组件。这些组件是由各种卷积神经网络构成。所属卷积网络可以是普通的卷积神经网络（cnn），残差网络（resnet），密集卷积网络（densenet）构成。2）区域级的流量预测模型中个性化层负责区域的个性化特征（基站分布、兴趣点数量、天气气象等），不同区域的流量预测模型的个性化层所包含个性化特征组件是不一样的。该个性化特征组件是由全连接神经网络构成。基于筛选出来的个性化层的输入特征数量，构建相应的数量的个性化特征组件组成区域级的流量预测模型中个性化层。
[0101]
（三）通用层训练方法步骤1，区域级的流量预测模型的训练准备阶段。
[0102]
步骤101，数据准备阶段。将边缘服务器集合表示为，共有个边缘服务器。个边缘服务器进行区域级的流量预测模型中通用层训练数据准备。
[0103]
（a）边缘服务器采集管辖范围的所有的基站每小时的流量数据，并持续采集一段时间（若干月、半年或者一年）。
[0104]
（b）边缘服务器将所有基站每小时的流量数据映射为时空数据。将某个区域中多个离散的基站点数据映射该区域空间范围的连续数据可以采用空间插值法。
[0105]
（c）边缘服务器将准备好的时空流量数据进行归一化。采用min-max方法将输入的区域流量数据归一化为[0,1]范围内。
[0106]
步骤102，标签分组及相应标签准备阶段。个移动边缘服务器采集其管辖区域范围内的一段时间（若干月、半年或者一年）的多源特征数据，例如，兴趣点数据、基站分布密度、社交数据、夜间灯光强度数据等，用历史多源特征数据确定标签分组及标签分组下的具体标签。首先，确定标签分组。一种数据源的特征数据对应一个标签分组（例如：兴趣点数据对应地理功能区域标签分组；社交数据对应社交水平标签分组；夜间灯光强度数据对应光强标签分组）。假设个移动边缘服务器均能够采集类多源特征数据，则共确定类标签分组。其次，确定标签分组下的具体标签。每种标签分组下的具体标签数量分别为，例如：地理功能区域标签分组包括旅游景点、教育培训、交通设施等标签；社交水平标签分组包括高社交水平和低社交水平等标签；光强标签分组包括灯光高亮区和灯光低亮区等标签。
[0107]
步骤2，中心云服务器确定联邦分组数量c。首先，中心云服务器从全部l个标签分组中挑选种标签分组，并依据个边缘服务器所管辖的区域的g标签分组的标签情况，确定联邦分组数量为。例如，如图9所示，中心云服务器决定仅仅采用单一源特征数据（兴趣点数据）进行分组联邦学习，那么中心云服务器采用地理功能区域标签分组进行联邦分组（即g=1）。隶属于地理功能区域标签分组的标签数量为个，因此，联邦分组最多为个。但是，m个移动边缘服务器所管辖的全部6个区域的地理功能区域标签分组的标签只包含{旅游景点、教育培训和交通设施}，则联邦分组数量为个。再例如，如图10所示，中心云服务器决定采用多源特征数据（兴趣点数据和夜间灯光强度数据）进行分组联邦学习，那么中心云服务器采用地理功能区域标签分组和光强标签分组进行分组（即g=2）。地理功能区域标签分组的具体标签数量为个，光强标签分组的具体标签数量为个，因此，联邦分组最多为个。但是，由于m个移动边缘服务器所管辖的全部6个区域的地理功能区域标签分组以及光强标签分组的标签只包含{（教育培训，灯光低亮区），（旅游景点，灯光高亮区），（交通设施，灯光低亮区）}，则联邦分组数量为个。
[0108]
步骤3，中心云服务器以联邦分组为单位，领导m个移动边缘服务器进行联邦学习。
[0109]
步骤301，中心云服务器将联邦分组编号与标签进行一对一映射，并将映射关系通知给m个移动边缘服务器。例如，如图9所示，隶属于联邦分组编号1的是所有标签为{旅游景点}的区域，隶属于联邦分组编号2的是所有标签为{教育培训}的区域，隶属于联邦分组编号3的是所有标签为{交通设施}的区域。如图10所示，隶属于联邦分组编号1的是所有标签为{教育培训，灯光低亮区}的区域，隶属于联邦分组编号2的是所有标签为{旅游景点，灯光高亮区}的区域，隶属于联邦分组编号3的是所有标签为{交通设施，灯光低亮区}的区域。
[0110]
步骤302，m个移动边缘服务器的区域级的流量预测模型的通用层训练需要进行轮联邦参数融合。达到最大融合次数后，边缘服务器停止对流量预测模型中分组级通用层参数更新。
[0111]
步骤303，初始时，中心云服务器初始化个全局分组级通用层模型参数，并针对每一个联邦分组，构造一条消息，其中第个分组的消息内容为{联邦分组编号，标签，该联邦分组的初始全局分组级模型参数
，并将全部c条消息广播给m个移动边缘服务器。
[0112]
步骤304，在第轮，边缘服务器接收到中心云服务广播的c条消息。首先，边缘服务器根据所管辖区域所隶属的联邦分组编号，以获取相应联邦分组的全局分组级通用层模型参数。边缘服务器管辖一个或者若干个区域，这些区域可能隶属于同一个联邦分组，也可能隶属于不同的联邦分组。边缘服务器针对所管辖的每一个区域，将该区域所隶属的联邦分组的全局分组级模型参数作为该区域的更新前区域级模型参数。其次，边缘服务器针对所管辖的每一个区域，根据本地流量数据进行模型梯度更新训练，在若干轮梯度更新训练结束后，边缘服务器得到该区域的更新后区域级模型参数。再次，边缘服务器进一步将所属同一联邦分组的区域级模型参数采用联邦平均算法或者加权联邦平均算法进行一次参数融合，最终得到第轮更新后的本地分组级模型参数。将第个分组的本地分组级模型参数表示为。最后，边缘服务器针对所管辖的每一个区域所隶属的联邦分组，构造一条消息发送到中心云服务器，消息内容为{联邦分组编号，标签，该联邦分组的本地分组级模型参数：。
[0113]
步骤305，所有个边缘服务器将消息发送至中心云服务器后，中心云服务器接收所有消息中的本地分组级模型参数，并将隶属于同一个联邦分组的本地分组级模型参数采用联邦平均算法或者加权联邦平均算法进行一次参数融合，得到个全局分组级通用层模型参数。中心云服务器针对每一个分组联邦，构造一条消息，其中，第个联邦分组的消息内容为{联邦分组编号，标签，该联邦分组的第轮全局分组级模型参数：，并将全部c条消息广播给所有个边缘服务器。
[0114]
步骤306，，重复步骤304-306，直至达到最大融合次数。
[0115]
（四）个性化层训练方法边缘计算服务器独立训练部署在本地上的区域级的流量预测模型中个性化层。移动边缘计算服务器都基于本地多源数据（基站分布、社交网、气象、社交节日活动、兴趣点等）进行单特征训练和多特征训练，最终筛选出本地区域级的流量预测模型的个性化层的最优特征组合。具体步骤如下：步骤1，各个边缘服务器进行区域级的流量预测模型中个性化层训练数据准备。
[0116]
步骤101，各个移动边缘服务器采集其管辖区域范围内的一个月连续的多源数据，例如，天气气候、基站分布密度、地理功能区域、节假日活动等。
[0117]
步骤102，各边缘服务器将流量数据与多源数据进行时间和空间维度上的对齐，从而将所有多源数据映射为时空数据。
[0118]
步骤102（a），对于多源数据中的枚举型时间数据（例如，天气气候、节假日活动），采用独热编码的形式，转换成连续型时间数据。
[0119]
步骤102（b），对于多源数据中的枚举型空间数据（例如，兴趣点），首先采用编码的形式，转换成连续型空间点数据，再采用空间插值法某个区域中空间基站点数据映射该区域空间范围的连续数据。
[0120]
步骤102（c），对于多源数据中的连续型空间点数据（例如，基站分布密度），采用空间插值法某个区域中空间基站点数据映射该区域空间范围的连续数据。
[0121]
步骤103，各个边缘服务器将所有的多源数据进行归一化。采用min-max方法将输入的区域源数据归一化为[0,1]范围内。
[0122]
步骤2，在本应用实例中引入本地多源数据（基站分布、气象、社交节日活动、地理功能区域等）联合流量数据协同进行无线流量预测。由于本地多源数据的采集和处理都需要耗费算力，因此，首先，需要确保获取的多源数据能够对流量预测贡献效益（即联合个性化层和通用层组成的区域级的流量预测模型的准确性要高于单独由通用层组成的区域级的流量预测模型的准确性），即需要筛选出能够对无线流量预测做出贡献的本地多源特征数据集合，这是多个本地多源特征数据合作的前提。其次，在筛选后本地多源特征数据集合需要进一步筛选出贡献效益相对最大的特征组合，这是多个本地多源特征数据合作的必要性。在此，引入合作收益来解决该问题。
[0123]
步骤201，依次引入单个本地多源特征数据与流量数据进行模型训练，比较引入本地特征前后，模型预测准确性的变化。若联合个性化层和通用层组成的区域级的流量预测模型的预测准确性要高于单独由通用层组成的区域级的流量预测模型的预测准确性，则保留该本地特征，否则，剔除该本地特征。
[0124]
步骤202，定义为步骤201保留下来的本地特征集合，且，即本地特征集合的基为，表示该集合中包含个本地特征，是隶属于本地特征集合的非空子集（设集合中的特征数量为，则），表示隶属于的一个特征组合，即：。定义为的特征函数，表示个本地特征合作所获得的收益。在流量预测问题中，收益为区域级的流量预测模型的准确性，由r平方性能（真实流量值与模型预测值之间的相关系数的平方）进行衡量。
[0125]
步骤3，最优特征组合筛选过程。首先，基于个本地特征中生成所有可能形成的特征组合。其次，特征组合依次进行训练得到预测结果，根据预测结果筛选出最优特征，作为区域级的流量预测模型中个性化层的最终特征构成。
[0126]
步骤301定义为特征组合所包含的特征数量。初始化。列举所有可能形成的特征组合组成特征组合集合簇，,(c为组合符号)，表示特征组合集合簇中第个特征组合。
[0127]
步骤302，初始化，以特征组合进行训练，并保存相应的收益。
[0128]
步骤303，，依次遍历特征组合集合簇中的个特征组合，重复执行步骤302，直到。
[0129]
步骤304，，重复执行步骤301-304，直到。
[0130]
步骤305，在保存的收益中选择收益最大的特征组合作为最优特征组合，作为区域级的流量预测模型中个性化层的最终特征构成。
[0131]
综上所述，各个移动边缘计算服务器采集本区域的历史无线流量数据以及历史多源特征数据，并在中心服务器的协调下，采用分组联邦学习共同训练本地部署的区域级个性化流量预测模型的通用层。其次，各个移动边缘计算服务器采集本区域的多源数据（天气气候、基站分布密度、地理功能区域、节假日活动等），采用合作收益方法，训练本地区域级的流量预测模型的个性化层。具体地，各个边缘计算服务器将本地区的各个区域性特征作为合作的参与者，比较不同特征组合对流量预测产生的收益，根据收益进行本地区特征的筛选。
[0132]
本技术实施例还提供了一种电子设备（也即电子设备），例如中心服务器，该电子设备可以包括处理器、存储器、接收器及发送器，处理器用于执行上述实施例提及的基于个性化分组联邦学习的无线流量预测方法和/或基于分组联邦学习的无线通信流量预测方法，其中处理器和存储器可以通过总线或者其他方式连接，以通过总线连接为例。该接收器可通过有线或无线方式与处理器、存储器连接。所述电子设备可自所述无线多媒体传感器网络中的传感器接收实时运动数据，并自所述视频采集装置接收原始视频序列。
[0133]
处理器可以为中央处理器（central processing unit，cpu）。处理器还可以为其他通用处理器、数字信号处理器（digital signal processor，dsp）、专用集成电路（application specific integrated circuit，asic）、现场可编程门阵列（field-programmablegate array，fpga）或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片，或者上述各类芯片的组合。
[0134]
存储器作为一种非暂态计算机可读存储介质，可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块，如本技术实施例中的基于个性化分组联邦学习的无线流量预测方法和/或基于分组联邦学习的无线通信流量预测方法对应的程序指令/模块。处理器通过运行存储在存储器中的非暂态软件程序、指令以及模块，从而执行处理器的各种功能应用以及数据处理，即实现上述方法实施例中的基于个性化分组联邦学习的无线流量预测方法和/或基于分组联邦学习的无线通信流量预测方法。
[0135]
存储器可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储处理器所创建的数据等。此外，存储器可以包括高速随机存取存储器，还可以包括非暂态存储器，例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中，存储器可选包括相对于处理器远程设置的存储器，这些远程存储器可以通过网络连接至处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0136]
所述一个或者多个模块存储在所述存储器中，当被所述处理器执行时，执行实施例中的基于个性化分组联邦学习的无线流量预测方法和/或基于分组联邦学习的无线通信流量预测方法。
[0137]
在本技术的一些实施例中，用户设备可以包括处理器、存储器和收发单元，该收发单元可包括接收器和发送器，处理器、存储器、接收器和发送器可通过总线系统连接，存储器用于存储计算机指令，处理器用于执行存储器中存储的计算机指令，以控制收发单元收发信号。
[0138]
作为一种实现方式，本技术中接收器和发送器的功能可以考虑通过收发电路或者收发的专用芯片来实现，处理器可以考虑通过专用处理芯片、处理电路或通用芯片实现。
[0139]
作为另一种实现方式，可以考虑使用通用计算机的方式来实现本技术实施例提供的服务器。即将实现处理器，接收器和发送器功能的程序代码存储在存储器中，通用处理器通过执行存储器中的代码来实现处理器，接收器和发送器的功能。
[0140]
本技术实施例还提供一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时以实现前述基于个性化分组联邦学习的无线流量预测方法和/或基于分组联邦学习的无线通信流量预测方法的步骤。该计算机可读存储介质可以是有形存储介质，诸如随机存储器（ram）、内存、只读存储器（rom）、电可编程rom、电可擦除可编程rom、寄存器、软盘、硬盘、可移动存储盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质。
[0141]
本领域普通技术人员应该可以明白，结合本文中所公开的实施方式描述的各示例性的组成部分、系统和方法，能够以硬件、软件或者二者的结合来实现。具体究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本技术的范围。当以硬件方式实现时，其可以例如是电子电路、专用集成电路（asic）、适当的固件、插件、功能卡等等。当以软件方式实现时，本技术的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中，或者通过载波中携带的数据信号在传输介质或者通信链路上传送。
[0142]
需要明确的是，本技术并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见，这里省略了对已知方法的详细描述。在上述实施例中，描述和示出了若干具体的步骤作为示例。但是，本技术的方法过程并不限于所描述和示出的具体步骤，本领域的技术人员可以在领会本技术的精神后，作出各种改变、修改和添加，或者改变步骤之间的顺序。
[0143]
本技术中，针对一个实施方式描述和/或例示的特征，可以在一个或更多个其它实施方式中以相同方式或以类似方式使用，和/或与其他实施方式的特征相结合或代替其他实施方式的特征。
[0144]
以上所述仅为本技术的优选实施例，并不用于限制本技术，对于本领域的技术人员来说，本技术实施例可以有各种更改和变化。凡在本技术的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本技术的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：林尚静马冀庄琲李月颖陈远祥
技术所有人：北京邮电大学
我是此专利的发明人

上一篇：带有旋转元件的电连接装置的制作方法
上一篇：一种KR脱硫物质及KR脱硫方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。