本发明涉及无线通信领域,特别涉及一种分布式的训练方法、系统以及终端、基站。
背景技术:
1、3gpp(3rd generation partnership project,第三代合作伙伴计划)rel-18(release 18,版本18)针对无线人工智能(artificial intelligence,简称:ai)空口关键技术进行研究,主要关注集中式机器学习与ai空口的应用。
2、基于ai/机器学习(machine learning,ml)的定位增强技术可以解决传统室内定位不准的难点和痛点问题,特别是重nlos(non line of sight,非视距)场景下传统室内定位的痛点问题,例如在3gpp inf-dh(indoor factory-denseclutter highbs,室内工厂-密集簇、高基站)场景中,定位精度大于15米。
3、传统室内定位技术是基于多站点直射径的直接测量或间接测量进行用户位置的估计计算。尽管传统的室内定位技术在某些部署场景下能提供较高的精度,但它们严重依赖于los(line of sight,视距)路径的存在,在工业环境中存在许多障碍,导致了信号的折射、反射和衍射,同时信号传播过程中存在多径传播和较长的时延,导致传统定位方法难以实现高精度定位。
4、近年来,深度学习算法因其在各个领域的良好表现而得到了迅速发展和广泛应用。深度学习方法的典型优点有处理原始数据的有效性、自动提取特征的能力、图形处理器(graphics processing unit,简称:gpu)的加速能力等等。根据目前3gpp研究评估进展,ai/ml能够显著提升室内重nlos场景的定位精度,包括直接定位、间接定位。
技术实现思路
1、经过分析,目前3gpp中基于ai/ml的定位增强方案属于集中式训练方案,需要将用于ai/ml模型训练的数据集中于基站或终端或lmf(location management function,位置管理功能)侧,需要大量用于训练的数据集(例如测量信号)在空口或接口间传递,传输开销大。
2、本发明实施例所要解决的一个技术问题是:如何降低模型训练过程中的开销。
3、根据本发明一些实施例的第一个方面,提供一种分布式的训练方法,包括:终端向基站发送第一消息,其中,终端为分布式学习的分布式节点,基站为分布式学习的中心节点,第一消息包括对终端部署的模型的训练信息;终端接收基站发送的第二消息,其中,第二消息包括模型的参数更新指示、收敛条件更新指示中的至少一种,或者包括训练停止指示;其中,第一消息和第二消息为控制信道信令,采用扰码序列加扰,扰码序列根据模型功能、模型标识、训练方式、终端所属的训练组中的至少一种确定。
4、在一些实施例中,终端所属的训练组内的多个终端使用相同的扰码序列。
5、在一些实施例中,第一消息具有根据扰码序列确定的第一信令格式;和/或,第二消息具有根据扰码序列确定的第二信令格式。
6、在一些实施例中,第一信令格式和第二信令格式包括模型标识、模型功能标识、时间戳、顺序索引、训练组标识中的至少一个字段。
7、在一些实施例中,第二信令格式包括聚合算法指示、训练停止条件、模型的参数的初始值、模型的参数更新指示、模型的梯度更新指示中的至少一个字段。
8、在一些实施例中,模型的参数更新指示、模型的梯度更新指示中的任意一种包括指示位,并且,指示位的数值与终端上一次获得的同种指示中的指示位的数值不同。
9、在一些实施例中,指示位的值为第一数值或第二数值。
10、在一些实施例中,第一信令格式和第二信令格式中的字段的大小为默认值、或者根据基站发送的配置确定。
11、在一些实施例中,训练信息包括训练后的模型的参数,或者,模型的训练状态。
12、在一些实施例中,训练方法还包括:终端接收基站发送的配置信令,其中,配置信令包括模型功能、模型标识、模型配置、训练数据的采集配置中的至少一种;终端根据配置信令,对终端部署的分布式节点进行配置。
13、在一些实施例中,模型功能表示移动性优化、定位、波束管理中的至少一种。
14、在一些实施例中,模型功能包括模型功能标识、区域码、公共陆地移动网络、运营商标识码、跟踪区、小区组、地理范围标识码中的至少一种;和/或,模型标识包括国家标识码、运营商标识码、公共陆地移动网络、跟踪区、地理范围标识码、模型标识码中的至少一种。
15、在一些实施例中,模型配置包括模型的生命周期管理配置或者模型属性配置。
16、在一些实施例中,模型生命周期管理配置包括模型训练配置、模型推理配置、模型部署配置、模型更新配置、模型监测配置中的至少一种;和/或,模型属性配置包括输入配置、输出配置、模型结构配置、接口配置、训练规则配置中的至少一种。
17、在一些实施例中,训练数据的采集配置包括采集对象、采集方法中的至少一种;或者,训练数据的采集配置包括对参考信号的上行测量的配置。
18、在一些实施例中,配置信令为物理层的下行控制信息、媒体接入层的控制单元或无线资源控制信令中的任意一种。
19、在一些实施例中,分布式学习为联邦学习。
20、在一些实施例中,模型为室内定位模型。
21、根据本发明一些实施例的第二个方面,提供一种分布式的训练方法,包括:基站接收多个终端中的任意一个终端发送的第一消息,其中,多个终端均为分布式学习的分布式节点,基站为分布式学习的中心节点,第一消息包括对终端部署的模型的训练信息;基站向多个终端中的任意一个终端发送第二消息,其中,第二消息包括模型的参数更新指示、收敛条件更新指示中的至少一种,或者包括训练停止指示;其中,第一消息和第二消息为控制信道信令,采用扰码序列加扰,扰码序列根据模型功能、模型标识、训练方式、终端所属的训练组中的至少一种确定。
22、在一些实施例中,训练方法还包括:基站根据多个终端发送的训练信息,对多个终端部署的模型进行汇聚,获得更新的模型的参数。
23、在一些实施例中,训练方法还包括:基站向多个终端中的任意一个发送配置信令,其中,配置信令包括模型功能、模型标识、模型配置、训练数据的采集配置中的至少一种。
24、根据本发明一些实施例的第三个方面,提供一种终端,包括:发送模块,被配置为向基站发送第一消息,其中,终端为分布式学习的分布式节点,基站为分布式学习的中心节点,第一消息包括对终端部署的模型的训练信息;接收模块,被配置为接收基站发送的第二消息,其中,第二消息包括模型的参数更新指示、收敛条件更新指示中的至少一种,或者包括训练停止指示;其中,第一消息和第二消息为控制信道信令,采用扰码序列加扰,扰码序列根据模型功能、模型标识、训练方式、终端所属的训练组中的至少一种确定。
25、根据本发明一些实施例的第四个方面,提供一种终端,包括:存储器;以及耦接至存储器的处理器,处理器被配置为基于存储在存储器中的指令,执行前述任意一种分布式的训练方法。
26、根据本发明一些实施例的第五个方面,提供一种基站,包括:接收模块,被配置为接收多个终端中的任意一个终端发送的第一消息,其中,多个终端均为分布式学习的分布式节点,基站为分布式学习的中心节点,第一消息包括对终端部署的模型的训练信息;发送模块,被配置为向多个终端中的任意一个终端发送第二消息,其中,第二消息包括模型的参数更新指示、收敛条件更新指示中的至少一种,或者包括训练停止指示;其中,第一消息和第二消息为控制信道信令,采用扰码序列加扰,扰码序列根据模型功能、模型标识、训练方式、终端所属的训练组中的至少一种确定。
27、根据本发明一些实施例的第六个方面,提供一种基站,包括:存储器;以及耦接至存储器的处理器,处理器被配置为基于存储在存储器中的指令,执行前述任意一种分布式的训练方法。
28、根据本发明一些实施例的第七个方面,提供一种分布式的训练系统,包括:前述任意一种终端;以及前述任意一种基站。
29、根据本发明一些实施例的第八个方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前述任意一种分布式的训练方法。
30、上述发明中的一些实施例具有如下优点或有益效果。本发明的实施例适用于5g-advanced和6g网络分布式无线网络架构进行模型训练的方法,定义了模型训练所需空口的物理层信令。通过上述分布式架构和交互过程,终端能够对本地部署的模型进行训练,并且仅告知基站训练信息、而非模型的全部信息,从而能够节约空口资源。而基站通过汇聚各个终端提供的训练信息,能够降低本地的计算压力。因此,本发明的实施例提高了模型的预测精度、泛化性、收敛速度,并且减少了通信开销。
31、通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。