一种梯度传输方法及相关装置与流程

文档序号：31870236发布日期：2022-10-21 18:54阅读：54来源：国知局

1.本技术涉及通信技术领域，尤其涉及一种梯度传输方法及相关装置。

背景技术：

2.日益成熟的(artificial intelligence，ai)技术将对未来移动通信网络技术的演进产生重要的推动作用。目前，已将ai技术应用于网络层(如网络优化，移动性管理，资源分配等)和物理层(如信道编译码，信道预测、接收机等)等方面。
3.当ai技术应用于由第一通信装置和第二通信装置组成的通信系统时，其第一通信装置和第二通信装置主体由神经网络构成。该通信系统在使用前需要对位于第一通信装置和/或第二通信装置内神经网络的参数进行训练，其训练过程包括训练数据的前向推理、损失函数的计算以及梯度的反向传输。其中，训练数据的前向推理是指第二通信装置向第一通信装置发送训练数据的过程，梯度的反向传输是指第一通信装置将该第一通信装置的梯度回传给第二通信装置。
4.然而，在上述ai技术与无线通信系统结合的情况下，第二通信装置如何获得第一通信装置回传的梯度是亟待解决的问题。

技术实现要素：

5.本技术实施例提供了一种梯度传输方法及相关装置，有利于完成ai技术应用于无线通信系统时收发端的联合训练。
6.第一方面，本技术实施例提供一种梯度传输方法。该方法中，第一通信装置接收训练数据，并根据该训练数据确定第一中间梯度，该第一中间梯度用于更新位于第二通信装置中第一神经网络的参数；第一通信装置将该第一中间梯度映射到空口资源上，生成第一梯度信号，然后向第二通信装置发送该第一梯度信号；该第一梯度信号包括一个或多个第一梯度符号，每个第一梯度符号对应第一中间梯度的一个或多个梯度值。
7.可见，本技术实施例中，第一通信装置将第一中间梯度映射到空口资源上进行传输，即通过向第二通信装置发送第一梯度信号实现对第一中间梯度的反向传输，从而有利于完成对第一通信装置和第二通信装置的联合训练。
8.一种可选的实施方式中，第一中间梯度还用于更新位于第三通信装置中第二神经网络的参数；第三通信装置与第二通信装置之间建立有通信连接。也就是说，通信系统还包括与第二通信装置之间建立有通信连接的第三通信装置时，第二通信装置可将第一中间梯度回传至第三通信装置，从而使得第三通信装置根据第一中间梯度更新第二神经网络的参数，有利于完成对第一通信装置、第二通信装置以及第三通信装置的联合训练。
9.一种可选的实施方式中，第一通信装置将第一中间梯度映射到空口资源上，生成第一梯度信号包括：将第一中间梯度的梯度值转换为一个或多个第一梯度符号；将一个或多个第一梯度符号映射到空口资源上，生成第一梯度信号。
10.可见，第一通信装置是通过将一个或多个第一梯度符号映射到空口资源上，实现
在该空口资源上对第一中间梯度的反向传输。
11.一种可选的实施方式中，第一通信装置与第二通信装置组成的通信系统传输的是实数符号时，第一梯度符号是实数符号；第一通信装置将第一中间梯度的梯度值转换为一个或多个第一梯度符号，包括：将第一中间梯度包括的p个复数梯度值转换为2m个第一实数符号；p为正整数；m为小于或等于p的正整数；或者，将第一中间梯度包括的p个实数梯度值转换为m个第二实数符号；p为正整数；m为小于或等于p的正整数。
12.也就是说，当第一通信装置与第二通信装置组成的通信系统传输的是实数符号，第一通信装置将第一中间梯度包括的梯度值转换为2m个第一实数符号或m个第二实数符号，即上述一个或多个第一梯度符号包括2m个第一实数符号或m个第二实数符号，从而第一通信装置将该2m个第一实数符号或m个第二实数符号映射到空口资源，使得第一通信装置可通过无线空口反向传输该第一中间梯度。
13.一种可选的实施方式中，第一通信装置将第一中间梯度包括的p个复数梯度值转换为2m个第一实数符号，包括：第一通信装置将第一中间梯度包括的p个复数梯度值中，任一复数梯度值的实部和虚部确定为一个第一实数符号，从而获得2m个第一实数符号。
14.一种可选的实施方式中，第一通信装置将第一中间梯度包括的p个实数梯度值转换为m个第二实数符号，包括：第一通信装置将第一中间梯包括的p个实数梯度中，m个实数梯度确定为m个第二实数符号。该实施方式无需将该p个实数梯度值进行转换，可降低第一通信装置的信令开销。
15.另一种可选的实施方式中，当第一通信装置与第二通信装置组成的通信系统传输的是复数符号时，即第一梯度符号是复数符号；第一通信装置将第一中间梯度的梯度值转换为一个或多个第一梯度符号，包括：将第一中间梯度包括的p个复数梯度值转换为m个第一复数符号；p为正整数；m小于或等于p的正整数；或者将第一中间梯度包括的p个实数梯度值转换为m个第二复数符号；p为正整数；m为小于或等于的正整数，符号表示向上取整。
16.也就是说，当第一通信装置与第二通信装置组成的通信系统传输的是复数符号时，第一通信装置将第一中间梯度包括的梯度值转换为m个第一复数符号或m个第二复数符号，即上述一个或多个第一梯度符号包括m个第一复数符号或m个第二复数符号，从而第一通信装置将该m个第一复数符号或m个第二复数符号映射到空口资源，使得第一通信装置可通过无线空口反向传输该第一中间梯度。
17.一种可选的实施方式中，第一通信装置将一个或多个第一梯度符号映射到空口资源上，生成第一梯度信号，包括：将m个第一复数符号的共轭或m个第二复数符号的共轭映射到空口资源上，生成第一梯度信号。
18.一种可选的实施方式中，第一通信装置将第一中间梯度包括的p个复数梯度值转换为m个第一复数符号，包括：第一通信装置将第一中间梯度包括的p个复数梯度值中，任一复数梯度值的实部确定为第一复数符号的实部，以及将该复数梯度值的虚部确定为该第一复数符号的虚部，获得m个第一复数符号。也就是说，确定的第一复数符号的实部和复数梯度值的实部对应，第一复数符号的虚部和复数梯度值的虚部对应。该实施方式下，第一通信装置将m个第一复数符号的共轭映射到空口资源上，生成第一梯度信号。
19.另一种可选的实施方式中，第一通信装置将第一中间梯度包括的p个复数梯度值
转换为m个第一复数符号，包括：第一通信装置将第一中间梯度包括的p个复数梯度值中，任一复数梯度值的虚部确定为第一复数符号的实部，以及将该复数梯度值的实部确定为该第一复数符号的虚部，获得m个第一复数符号。也就是说，确定的第一复数符号的实部和复数梯度值的虚部对应，第一复数符号的虚部和复数梯度值的实部对应。该实施方式下，第一通信装置将m个第一复数符号映射到空口资源上，生成第一梯度信号。
20.一种可选的实施方式中，第一通信装置将第一中间梯度包括的2p个实数梯度值转换为m个第二复数符号，包括：第一通信装置将第一中间梯度包括的2p个实数梯度值中，任两个实数梯度值确定为一个第二复数符号的实部和虚部，获得m个第二复数符号。
21.一种可选的实施方式中，映射到上述空口资源上的第一中间梯度是功率归一化后的第一中间梯度。也就是说，第一通信装置在生成第一梯度信号之前，可对第一中间梯度进行功率归一化，从而根据功率归一化后的第一中间梯度生成第一梯度信号，进而可减小第一梯度信号的误差。
22.一种可选的实施方式中，第一通信装置还可向第二通信装置发送反馈信息；该反馈信息用于确定训练数据。也就是说，第一通信装置接收的训练数据是根据该反馈信息确定的，该方式可提高训练数据的可靠性。
23.一种可选的实施方式中，当第一通信装置的数量为多个时，第一通信装置将第一中间梯度映射到空口资源上，生成第一梯度信号，包括：第一通信装置将第一中间梯度与第一权重进行处理，获得加权的第一中间梯度；第一通信装置将加权的第一中间梯度映射到空口资源上，生成第一梯度信号。其中，第一权重可表示第一中间梯度的可信程度。
24.可见，当第一通信装置的数量为多个时，每个第一通信装置可根据第一中间梯度的可信程度，对第一中间梯度进行处理，再将其映射到空口资源上。
25.第二方面，本技术还提供了一种梯度传输方法。该方面的梯度传输方法与第一方面所述的梯度传输方法相对应，该方面的梯度传输方法是从第二通信装置侧进行阐述的。该方法中，第二通信装置接收一个或多个第二梯度信号；第二梯度信号是第一梯度信号经过信道后的信号；第一梯度信号是将第一中间梯度映射到空口资源上生成的；第一梯度信号包括一个或多个第一梯度符号，每个第一梯度符号对应第一中间梯度的一个或多个梯度值；第一中间梯度是根据训练数据确定的；第一中间梯度用于更新位于第二通信装置中第一神经网络的参数；第二通信装置根据一个或多个第二梯度信号，确定第二中间梯度；第二通信装置根据第二中间梯度更新第一神经网络的参数。
26.可见，本技术实施例中，第二通信装置通过接收一个或多个第二梯度信号，接收到第一通信装置回传的第一中间梯度，并根据该一个或多个第二梯度信号，确定出第二中间梯度，然后根据该第二中间梯度更新第一神经网络的参数，从而可完成对第一通信装置和第二通信装置的联合训练。
27.一种可选的实施方式中，第二梯度信号包括2m个第三实数符号，第三实数符号是第一实数符号经过信道后的符号；m为正整数；第二通信装置根据一个或多个第二梯度信号，确定第二中间梯度，包括：第二通信装置将2m个第三实数符号转换为第二中间梯度的m个复数梯度值。
28.另一种可选的实施方式中，第二梯度信号包括m个第四实数符号，第四实数符号是第二实数符号经过信道后的符号；m为正整数；第二通信装置根据一个或多个第二梯度信
号，确定第二中间梯度，包括：第二通信装置将m个第四实数符号确定为第二中间梯度的m个实数梯度值。
29.又一种可选的实施方式中，第二梯度信号包括m个第三复数符号，第三复数符号是第一复数符号经过信道后的符号；m为正整数；第二通信装置根据一个或多个第二梯度信号，确定第二中间梯度，包括：第二通信装置将m个第三复数符号转换为第二中间梯度的m个复数梯度值。
30.又一种可选的实施方式中，第二梯度信号包括m个第四复数符号，第四复符号是第二复数符号经过信道后的符号；m为正整数；第二通信装置根据一个或多个第二梯度信号，确定第二中间梯度，包括：第二通信装置将m个第四复数符号转换为第二中间梯度的2m个实数梯度值。
31.一种可选的实施方式中，当第二通信装置还与第三通信装置之间建立有通信连接时，第二通信装置还可根据第二中间梯度生成第三中间梯度，然后将第三中间梯度映射到空口资源上，生成第三梯度信号；第三梯度信号包括一个或多个第二梯度符号，每个第二梯度符号对应第三中间梯度的一个或多个梯度值；然后向第三通信装置发送该第三梯度信号。
32.可见，当第二通信装置还与第三通信装置之间建立有通信连接时，第二通信装置还可将第三中间梯度以第三梯度信号的方式回传至第三通信装置，使得第三通信装置可根据该第二中间梯度更新位于该第三通信装置内第二神经网络的参数，从而完成对第一通信装置、第二通信装置以及第三通信装置的训练。
33.一种可选的实施方式中，第二通信装置将第三中间梯度映射到空口资源上，生成第三梯度信号，包括：将第三中间梯度的梯度值转换为一个或多个第二梯度符号；将该一个或多个第二梯度符号映射到空口资源上，生成第三梯度信号。可见，第二通信装置是通过将一个或多个第二梯度符号映射到空口资源上，实现在该空口资源上对第三中间梯度的反向传输。
34.一种可选的实施方式中，第一通信装置、第二通信装置以及第三通信装置组成的通信系统传输的是实数符号，即第二梯度符号是实数符号，第二通信装置将第三中间梯度的梯度值转换为一个或多个第二梯度符号，包括：将第三中间梯度包括的m个复数梯度值转换为2n个第五实数符号；m为正整数；n为小于或等于m的正整数；或者，将第三中间梯度包括的m个实数梯度值转换为n个第六实数符号；m为正整数；n为小于或等于m的正整数。
35.也就是说，当第一通信装置、第二通信装置以及第三通信装置组成的通信系统传输的是实数符号时，第一通信装置将第三中间梯度包括的梯度值转换为2n个第五实数符号或n个第六实数符号，即上述一个或多个第二梯度符号包括2n个第五实数符号或n个第六实数符号，从而第二通信装置将该2n个第五实数符号或n个第六实数符号映射到空口资源，使得第一通信装置可通过无线空口反向传输该第三中间梯度。
36.一种可选的实施方式中，第二通信装置将第三中间梯度包括的m个复数梯度值转换为2n个第五实数符号，包括：第二通信装置将第三中间梯度包括的m个复数梯度值中，任一复数梯度值的实部和虚部确定为一个第五实数符号，从而获得2n个第五实数符号。
37.另一种可选的实施方式中，当第一通信装置、第二通信装置以及第三通信装置组成的通信系统传输的是实数符号时，即第二梯度符号是复数符号；第二通信装置将第三中
间梯度的梯度值转换为一个或多个第二梯度符号，包括：将第三中间梯度包括的m个复数梯度值转换为n个第五复数符号；m为正整数；n小于或等于m的正整数；或者将第三中间梯度包括的m个实数梯度值转换为n个第六复数符号；m为正整数；n为小于或等于的正整数。
38.也就是说，当第一通信装置、第二通信装置以及第三通信装置组成的通信系统传输的是实数符号时，第二通信装置将第三中间梯度包括的梯度值转换为n个第五复数符号或n个第六复数符号，即上述一个或多个第二梯度符号包括n个第五复数符号或n个第六复数符号，从而第一通信装置将该n个第五复数符号或n个第六复数符号映射到空口资源，使得第二通信装置可通过无线空口反向传输该第三中间梯度。
39.一种可选的实施方式中，第二通信装置将一个或多个第二梯度符号映射到空口资源上，生成第三梯度信号，包括：将n个第五复数符号的共轭或n个第六复数符号的共轭映射到空口资源上，生成第三梯度信号。
40.一种可选的实施方式中，第二通信装置将第三中间梯度包括的m个复数梯度值转换为n个第五复数符号，包括：将第三中间梯度包括的m个复数梯度值中，任一复数梯度值的实部确定为第五复数符号的实部，以及将该复数梯度值的虚部确定为该第五复数符号的虚部，获得n个第五复数符号。也就是说，确定的第五复数符号的实部和复数梯度值的实部对应，第五复数符号的虚部和复数梯度值的虚部对应。该实施方式下，第二通信装置将n个第五复数符号的共轭映射到空口资源上，生成第三梯度信号。
41.另一种可选的实施方式中，第二通信装置将第三中间梯度包括的m个复数梯度值转换为n个第五复数符号，包括：将第三中间梯度包括的m个复数梯度值中，任一复数梯度值的虚部确定为第五复数符号的实部，以及将该复数梯度值的实部确定为该第五复数符号的虚部，获得n个第五复数符号。也就是说，确定的第五复数符号的实部和复数梯度值的虚部对应，第五复数符号的虚部和复数梯度值的实部对应。该实施方式下，第二通信装置将n个第五复数符号映射到空口资源上，生成第三梯度信号。
42.一种可选的实施方式中，第二通信装置将第三中间梯度包括的m个实数梯度值转换为n个第六实数符号，包括：第二通信装置将第三中间梯包括的m个实数梯度中，n个实数梯度确定为n个第六实数符号。该实施方式无需将该m个实数梯度值进行转换，可降低第二通信装置的信令开销。
43.一种可选的实施方式中，第二通信装置将第三中间梯度包括的2m个实数梯度值转换为n个第六复数符号，包括：将第三中间梯度包括的2m个实数梯度值中，任两个实数梯度值确定为一个第六复数符号的实部和虚部，获得n个第六复数符号。
44.第三方面，本技术还提供了一种梯度传输方法。该方法中，第一通信装置根据信道信息以及接收到的训练数据确定第四中间梯度；第四中间梯度用于更新位于第二通信装置中第一神经网络的参数；第一通信装置通过通信链路发送第三中间梯度，该通信链路是不同于第一通信装置与第二通信装置之间的通信链路。
45.可见，本技术实施例中，第一通信装置预先进行信道估计获得信道信息，然后根据信道信息和训练数据确定准确的第四中间梯度，再通过通信链路向第二通信装置发送该第四中间梯度，实现对第四中间梯度的反向传输，从而有利于实现对第一通信装置和第二通信装置的联合训练。
46.第四方面，本技术还提供了一种梯度传输方法，该方面的梯度传输方法与第三方
面所述的梯度传输方法相对应，该方面的梯度传输方法是从第二通信装置侧进行阐述的。该方法中，第二通信装置接收第四中间梯度；第四中间梯度是根据信道信息以及接收到的训练数据确定的；第四中间梯度用于更新位于第二通信装置中第一神经网络的参数；第二通信装置根据第四中间梯度，更新第一神经网络的参数。
47.可见，本技术实施例中，第二通信装置通过通信链路接收的第四中间梯度是根据信道信息和训练数据确定的，即第二通信装置获得了准确的第四中间梯度，从而可实现对第一通信装置和第二通信装置的联合训练。
48.第五方面，本技术还提供了一种梯度传输方法。该方法中，第一通信装置根据接收到的训练数据确定第一中间梯度；第一中间梯度用于更新位于第二通信装置中第一神经网络的参数；第一通信装置向第二通信装置发送第一中间梯度和控制信息。
49.可见，本技术实施例中，第一通信装置在发送第一中间梯度时，也发送了控制信息，使得第二通信装置可根据该控制信息进行信道估计，然后根据估计的信道信息和第一中间梯度获得准确的第四中间梯度，从而有利于完成对第一通信装置和第二通信装置的联合训练。
50.第六方面，本技术还提供了一种梯度传输方法，该方面的梯度传输方法与第五方面所述的梯度传输方法相对应，该方面的梯度传输方法是从第二通信装置侧进行阐述的。该方法中，第二通信装置接收第一中间梯度和控制信息；第一中间梯度是根据训练数据确定的；第一中间梯度用于更新位于第二通信装置中第一神经网络的参数；第二通信装置根据该控制信息进行信道估计，获得信道信息；第二通信装置根据第一中间梯度和信道信息，获得第五中间梯度；第二通信装置根据第五中间梯度更新位于第二通信装置中第一神经网络的参数。
51.可见，本技术实施例中，第二通信装置可根据接收的控制信息进行信道估计获得信道信息，然后根据接收的第一中间梯度和该信道信息确定第五中间梯度，从而可根据该第五中间梯度实现对第一通信装置和第二通信装置的联合训练。
52.第七方面，本技术还提供一种通信装置。该通信装置具有实现上述第一方面所述的第一通信装置的部分或全部功能，或者具有实现上述第二方面所述的第二通信装置的部分或全部功能，或者具有实现上述第三方面所述的第一通信装置的部分或全部功能，或者具有实现上述第四方面所述的第二通信装置的部分或全部功能，或者具有实现上述第五方面所述的第一通信装置的部分或全部功能，或者具有实现上述第六方面所述的第二通信装置的部分或全部功能。比如，该通信装置的功能可具备本技术中第一方面所述的第一通信装置的部分或全部实施例中的功能，也可以具备单独实施本技术中的任一个实施例的功能。所述功能可以通过硬件实现，也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的单元或模块。
53.在一种可能的设计中，该通信装置的结构中可包括处理单元和通信单元，所述处理单元被配置为支持通信装置执行上述方法中相应的功能。所述通信单元用于支持通信装置与其他通信装置之间的通信。所述通信装置还可以包括存储单元，所述存储单元用于与处理单元和收发单元耦合，其保存通信装置必要的程序指令和数据。
54.一种实施方式中，所述通信装置包括：
55.通信单元，用于接收训练数据；
56.处理单元，用于根据训练数据确定第一中间梯度；第一中间梯度用于更新位于第二通信装置中第一神经网络中的参数；
57.处理单元，还用于将第一中间梯度映射到空口资源上，生成第一梯度信号；第一梯度信号包括一个或多个第一梯度符号，每个第一梯度符号对应第一中间梯度的一个或多个梯度值；
58.通信单元，还用于向第二通信装置发送第一梯度信号。
59.另外，该方面中，通信装置其他可选的实施方式可参见上述第一方面的相关内容，此处不再详述。
60.另一种实施方式中，所述通信装置包括：
61.通信单元，用于接收一个或多个第二梯度信号；第二梯度信号是第一梯度信号经过信道后的信号；第一梯度信号是将第一中间梯度映射到空口资源上生成的；第一梯度信号包括一个或多个第一梯度符号，每个第一梯度符号对应第一中间梯度的一个或多个梯度值；
62.处理单元，用于根据一个或多个第二梯度信号，确定第二中间梯度；
63.处理单元，还用于根据第二中间梯度更新第一神经网络的参数。
64.另外，该方面中，通信装置其他可选的实施方式可参见上述第二方面的相关内容，此处不再详述。
65.又一种实施方式中，所述通信装置包括：
66.处理单元，用于根据信道信息以及接收到的训练数据确定第四中间梯度；第四中间梯度用于更新位于第二通信装置中第一神经网络的参数；
67.通信单元，用于通过通信链路发送第四中间梯度，该通信链路是不同于第一通信装置与第二通信装置之间的通信链路。
68.又一种实施方式中，所述通信装置包括：
69.通信单元，用于接收第四中间梯度；第四中间梯度是根据信道信息以及接收到的训练数据确定的；第四中间梯度用于更新位于第二通信装置中第一神经网络的参数；
70.处理单元，用于根据第四中间梯度，更新第一神经网络的参数。
71.又一种实施方式中，所述通信装置包括：
72.处理单元，用于根据接收到的训练数据确定第一中间梯度；第一中间梯度用于更新位于第二通信装置中第一神经网络的参数；
73.通信单元，用于向第二通信装置发送第一中间梯度和控制信息。
74.又一种实施方式中，所述通信装置包括：
75.通信单元，用于接收第一中间梯度和控制信息；第一中间梯度是根据训练数据确定的；第一中间梯度用于更新位于第二通信装置中第一神经网络的参数；
76.处理单元，用于根据控制信息进行信道估计，获得信道信息；
77.处理单元，还用于根据第一中间梯度和信道信息，获得第五中间梯度；
78.处理单元，还用于根据第五中间梯度更新位于第二通信装置中第一神经网络的参数。
79.作为示例，收发单元可以为收发器或通信接口，存储单元可以为存储器，处理单元可以为处理器。
80.一种实施方式中，所述通信装置包括：
81.通信接口，用于接收训练数据；
82.处理器，用于根据训练数据确定第一中间梯度；第一中间梯度用于更新位于第二通信装置中第一神经网络中的参数；
83.处理器，还用于将第一中间梯度映射到空口资源上，生成第一梯度信号；第一梯度信号包括一个或多个第一梯度符号，每个第一梯度符号对应第一中间梯度的一个或多个梯度值；
84.通信接口，还用于向第二通信装置发送第一梯度信号。
85.另外，该方面中，上行通信装置其他可选的实施方式可参见上述第一方面的相关内容，此处不再详述。
86.另一种实施方式中，所述通信装置包括：
87.通信接口，用于接收一个或多个第二梯度信号；第二梯度信号是第一梯度信号经过信道获得的；第一梯度信号是将第一中间梯度映射到空口资源上生成的；第一梯度信号包括一个或多个第一梯度符号，每个第一梯度符号对应第一中间梯度的一个或多个梯度值；
88.处理器，用于根据一个或多个第二梯度信号，确定第二中间梯度；
89.处理器，还用于根据第二中间梯度更新第一神经网络的参数。
90.另外，该方面中，通信装置其他可选的实施方式可参见上述第二方面的相关内容，此处不再详述。
91.又一种实施方式中，所述通信装置包括：
92.处理器，用于根据信道信息以及接收到的训练数据确定第四中间梯度；第四中间梯度用于更新位于第二通信装置中第一神经网络的参数；
93.通信接口，用于通过通信链路发送第四中间梯度，该通信链路是不同于第一通信装置与第二通信装置之间的通信链路。
94.又一种实施方式中，所述通信装置包括：
95.通信接口，用于接收第四中间梯度；第四中间梯度是根据信道信息以及接收到的训练数据确定的；第四中间梯度用于更新位于第二通信装置中第一神经网络的参数；
96.处理器，用于根据第四中间梯度，更新第一神经网络的参数。
97.又一种实施方式中，所述通信装置包括：
98.处理器，用于根据接收到的训练数据确定第一中间梯度；第一中间梯度用于更新位于第二通信装置中第一神经网络的参数；
99.通信接口，用于向第二通信装置发送第一中间梯度和控制信息。
100.又一种实施方式中，所述通信装置包括：
101.通信接口，用于接收第一中间梯度和控制信息；第一中间梯度是根据训练数据确定的；第一中间梯度用于更新位于第二通信装置中第一神经网络的参数；
102.处理器，用于根据控制信息进行信道估计，获得信道信息；
103.处理器，还用于根据第一中间梯度和信道信息，获得第五中间梯度；
104.处理器，还用于根据第五中间梯度更新位于第二通信装置中第一神经网络的参数。
105.另一种实施方式中，该通信装置为芯片或芯片系统。所述处理单元也可以体现为处理电路或逻辑电路；所述收发单元可以是该芯片或芯片系统上的输入/输出接口、接口电路、输出电路、输入电路、管脚或相关电路等。
106.在实现过程中，处理器可用于进行，例如但不限于，基带相关处理，收发器可用于进行，例如但不限于，射频收发。上述器件可以分别设置在彼此独立的芯片上，也可以至少部分的或者全部的设置在同一块芯片上。例如，处理器可以进一步划分为模拟基带处理器和数字基带处理器。其中，模拟基带处理器可以与收发器集成在同一块芯片上，数字基带处理器可以设置在独立的芯片上。随着集成电路技术的不断发展，可以在同一块芯片上集成的器件越来越多。例如，数字基带处理器可以与多种应用处理器(例如但不限于图形处理器，多媒体处理器等)集成在同一块芯片之上。这样的芯片可以称为系统芯片(system on a chip,soc)。将各个器件独立设置在不同的芯片上，还是整合设置在一个或者多个芯片上，往往取决于产品设计的需要。本技术实施例对上述器件的实现形式不做限定。
107.第八方面，本技术还提供一种处理器，用于执行上述各种方法。在执行这些方法的过程中，上述方法中有关发送上述信息和接收上述信息的过程，可以理解为由处理器输出上述信息的过程，以及处理器接收输入的上述信息的过程。在输出上述信息时，处理器将该上述信息输出给收发器，以便由收发器进行发射。该上述信息在由处理器输出之后，还可能需要进行其他的处理，然后才到达收发器。类似的，处理器接收输入的上述信息时，收发器接收该上述信息，并将其输入处理器。更进一步的，在收发器收到该上述信息之后，该上述信息可能需要进行其他的处理，然后才输入处理器。
108.基于上述原理，举例来说，前述方法中提及的发送第一梯度信号可以理解为处理器输出第一梯度信号。
109.对于处理器所涉及的发射、发送和接收等操作，如果没有特殊说明，或者，如果未与其在相关描述中的实际作用或者内在逻辑相抵触，则均可以更加一般性的理解为处理器输出和接收、输入等操作，而不是直接由射频电路和天线所进行的发射、发送和接收操作。
110.在实现过程中，上述处理器可以是专门用于执行这些方法的处理器，也可以是执行存储器中的计算机指令来执行这些方法的处理器，例如通用处理器。上述存储器可以为非瞬时性(non-transitory)存储器，例如只读存储器(read only memory，rom)，其可以与处理器集成在同一块芯片上，也可以分别设置在不同的芯片上，本技术实施例对存储器的类型以及存储器与处理器的设置方式不做限定。
111.第九方面，本技术还提供了一种通信系统，该系统包括上述方面的至少一个第一通信装置、至少一个第二通信装置。在另一种可能的设计中，该系统还可以包括本技术提供的方案中与第一通信装置、第二通信装置进行交互的其他设备。
112.第十方面，本技术提供了一种计算机可读存储介质，用于储存指令，当所述指令被通信装置执行时，实现上述第一方面至第六方面任一项所述的方法。
113.第十一方面，本技术还提供了一种包括指令的计算机程序产品，当其在通信装置上运行时，使得通信装置执行上述第一方面至第六方面任一项所述的方法。
114.第十二方面，本技术提供了一种芯片系统，该芯片系统包括处理器和接口，所述接口用于获取程序或指令，所述处理器用于调用所述程序或指令以实现或者支持第一通信装置实现第一方面所涉及的功能，或者用于调用所述程序或指令以实现或者支持第二通信装
置备实现第二方面所涉及的功能，用于调用所述程序或指令以实现或者支持第一通信装置实现第三方面所涉及的功能，用于调用所述程序或指令以实现或者支持第二通信装置实现第四方面所涉及的功能，用于调用所述程序或指令以实现或者支持第一通信装置实现第五方面所涉及的功能，用于调用所述程序或指令以实现或者支持第二通信装置实现第六方面所涉及的功能。例如，确定或处理上述方法中所涉及的数据和信息中的至少一种。在一种可能的设计中，所述芯片系统还包括存储器，所述存储器，用于保存终端必要的程序指令和数据。该芯片系统，可以由芯片构成，也可以包括芯片和其他分立器件。
附图说明
115.图1是本技术实施例提供的一种通信系统的结构示意图；
116.图2是本技术实施例提供的一种马尔可夫决策过程的示意图；
117.图3是本技术实施例提供的一种强化学习的示意图；
118.图4是本技术实施例提供的一种全连接神经网络的结构示意图；
119.图5是本技术实施例提供的一种神经网络的训练方式的示意图；
120.图6是本技术实施例提供的一种梯度反向传输的示意图；
121.图7是本技术实施例提供的一种神经网络结构示意图；
122.图8是本技术实施例提供的一种自编码器的结构示意图；
123.图9是本技术实施例提供的另一种通信系统的结构示意图；
124.图10是本技术实施例提供的一种梯度传输方法的流程示意图；
125.图11是本技术实施例提供的一种神经网络的结构示意图；
126.图12是本技术实施例提供的又一种通信系统的结构示意图；
127.图13是本技术实施例提供的一种无噪声反馈的情况下损耗与神经网络的参数更新次数的仿真示意图；
128.图14是本技术实施例提供的一种损耗与神经网络的参数更新次数的仿真示意图；
129.图15是本技术实施例提供的另一种损耗与神经网络的参数更新次数的仿真示意图；
130.图16是本技术实施例提供的一种梯度传输方法的实现框图；
131.图17是本技术实施例提供的另一种梯度传输方法的流程示意图；
132.图18是本技术实施例提供的另一种梯度传输方法的实现框图；
133.图19是本技术实施例提供的又一种梯度传输方法的流程示意图；
134.图20是本技术实施例提供的又一种梯度传输方法的实现框图；
135.图21是本技术实施例提供的又一种梯度传输方法的流程示意图；
136.图22是本技术实施例提供的又一种梯度传输方法的实现框图；
137.图23是本技术实施例提供的又一种梯度传输方法的流程示意图；
138.图24是本技术实施例提供的又一种梯度传输方法的实现框图；
139.图25是本技术实施例提供的一种通信装置的结构示意图；
140.图26是本技术实施例提供的另一种通信装置的结构示意图；
141.图27是本技术实施例提供的一种芯片的结构示意图。
具体实施方式
142.下面结合本技术实施例中的附图对本技术实施例中的技术方案进行清楚、完整的描述。
143.首先，为了更好的理解本技术实施例公开的梯度传输方法，对本技术实施例适用的通信系统进行描述。
144.请参见图1，图1为本技术实施例提供的一种通信系统的结构示意图。该通信系统可包括但不限于一个网络设备、两个终端设备。图1所示的设备数量和形态用于举例并不构成对本技术实施例的限定，实际应用中可以包括两个或两个以上的网络设备，两个以上的终端设备。图1所示的通信系统以一个网络设备，两个终端设备，且该网络设备能够为终端设备提供服务为例进行阐述。
145.本技术实施例的技术方案可应用于第五代移动通信(5th-generation，5g)、卫星通信及短距等无线通信系统中。本技术实施例提及的无线通信系统包括但不限于：窄带物联网系统(narrow band-internet of things，nb-iot)、长期演进系统(long term evolution，lte)、5g通信系统的三大应用场景增强移动宽带(enhanced mobile broadband，embb)，超可靠低时延通信(ultra reliable low latency communication，urllc)和海量机器类通信(massive machine type of communication，mmtc)以及随着通信技术的不断发展，还包括第六代移动通信(6th-generatio系统n，6g)等后续演进的通信系统等等。
146.本技术实施例中的无线通信系统可以由小区组成，每个小区包含一个基站(base station，bs)，且基站可向多个移动台(mobile station，ms)提供通信服务。无线通信系统也可以进行点对点通信，如多个终端设备之间互相通信。
147.本技术实施例中，网络设备是一种部署在无线接入网中为终端提供无线通信功能的装置。网络设备可以包括各种形式的宏基站，微基站(也称为小站)，中继站，接入点等。在采用不同的无线接入技术的系统中，具备基站功能的设备的名称可能会有所不同。例如，在lte系统中，称为演进的节点b(evolved nodeb，enb或者enodeb),在5g新空口(new radio，nr)系统中下一代节点b(next generation node b，gnb)或者也可以包括云接入网(cloud radio access network，cloud ran)系统中的集中式单元(centralized unit，cu)和分布式单元(distributed unit，du)，还包括设备到设备(device-to-device，d2d)、车辆外联(vehicle-to-everything，v2x)、机器到机器(machine-to-machine，m2m)通信、物联网(internet of things)通信中承担基站功能的设备，例如v2x技术中的路侧单元(road side unit，rsu)等。为方便描述，本技术所有实施例中，上述为终端提供无线通信功能的装置统称为网络设备或bs。
148.本技术实施例中，本发明方案中所涉及到的终端可以包括各种具有无线通信功能的手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其它处理设备。终端也可以称为终端设备，还可以是用户单元(subscriber unit)、蜂窝电话(cellular phone)、智能手机(smart phone)、无线数据卡、个人数字助理(personal digital assistant，pda)电脑、平板型电脑、无线调制解调器(modem)、手持设备(handset)、膝上型电脑(laptop computer)、机器类型通信(machine type communication，mtc)终端、设备到设备通信(device-to-device，d2d)终端设备、车与外界(vehicle-to-everything，v2x)终
端设备、机器到机器通信(machine-to-machine，m2m)终端设备、物联网(internet of things，iot)终端设备、虚拟现实(virtual reality，vr)终端设备、增强现实(augmented reality，ar)终端设备、工业控制(industrial control)中的终端、无人驾驶(self driving)中的终端、远程医疗(remote medical)中的终端、智能电网(smart grid)中的终端、运输安全(transportation safety)中的终端、智慧城市(smart city)中的终端、智慧家庭(smart home)中的终端等设备。还包括卫星、飞机、无人机、气球等设备。
149.为了便于理解本技术公开的实施例，作以下两点说明。
150.(1)本技术公开的实施例中场景以无线通信网络中5g nr网络的场景为例进行说明，应当指出的是，本技术公开的实施例中的方案还可以应用于其他无线通信网络中，相应的名称也可以用其他无线通信网络中的对应功能的名称进行替代。
151.(2)本技术公开的实施例将围绕包括多个设备、组件、模块等的系统来呈现本技术的各个方面、实施例或特征。应当理解和明白的是，各个系统可以包括另外的设备、组件、模块等，并且/或者可以并不包括结合附图讨论的所有设备、组件、模块等。此外，还可以使用这些方案的组合。
152.其次，对本技术实施例涉及的相关概念进行简单的介绍。
153.1.马尔可夫决策过程(markov decision process，mdp)。
154.马尔可夫决策过程是一种分析决策问题的数学模型。其mdp如图2所示，图2中的s代表当前环境状态，a代表决策，r代表奖励。若环境具有马尔可夫性质，则环境的未来状态的条件概率分布仅依赖于当前环境状态，从图2可以看出，决策者可根据当前环境的状态s做出决策a，与环境交互后得到新的状态及奖励r。
155.2.强化学习。
156.强化学习是智能体(agent)以与环境交互的方式进行学习的一种学习方式，它是将问题建模成上述mdp问题后产生的。其强化学习过程如图3所示，agent根据环境反馈的状态(state)，对环境(environment)做出动作(action)，从而获得奖励(reward)及下一个时刻的状态。强化学习的目标是使智能体在一段时间内积累的奖励最大。
157.强化学习中，是由环境提供的强化信号对产生动作的好坏作一种评价，而不是告诉强化学习系统如何去产生正确的动作。由于外部环境提供的信息很少，所以智能体必须靠自身的经历进行学习。通过这种学习方式，智能体能在行动-评价的环境中获得知识，从而改进行动方案以适应环境。
158.常见的强化学习算法有增强学习(q-learning)，政策梯度(policy gradient)，演员评判家(actor-critic)等。目前常用的强化学习算法通常为深度强化学习(deep reinforcement learning，drl)，其主要将强化学习与深度学习结合，采用神经网络对策略/价值函数进行建模，从而适应更大输入/输出维度。
159.3.监督学习。
160.监督学习是最为广泛的一种学习方式。监督学习是给定一个训练集(包含多对输入数据及标签)，学习该训练集中输入(数据)和输出(标签)的映射关系，希望其映射关系还能应用于训练集之外的数据。训练集为正确的输入输出对的集合。
161.4.全连接神经网络、神经网络的训练。
162.全连接神经网络又叫多层感知机(multilayer perceptron，mlp)。如图4所述，一
个mlp包含一个输入层，一个输出层，及多个隐藏层，且每层包括多个节点，该节点称为神经元。其中，相邻两层的神经元间两两相连。
163.对于相邻两层的神经元而言，下一层的神经元的输出h为所有与之相连的上一层神经元x的加权和并经过激活函数。用矩阵可以表示为：
164.h＝f(wx+b)
ꢀꢀ
(1)
165.其中w为权重矩阵，b为偏置向量，f为激活函数。则神经网络的输出可以递归表达为：
166.y＝fn(w
nfn-1
(...)+bn)
ꢀꢀ
(2)
167.也就是说，可将神经网络理解为一个从输入数据集合到输出数据集合的映射关系。
168.神经网络的训练是指用已有数据从随机的w和b得到这个映射关系的过程。如图5所示，神经网络的训练的具体方式为采用损失函数(loss function)对神经网络的输出结果进行评价，并将误差反向传输，通过梯度下降的方法迭代优化w和b直到损失函数达到最小值。
169.其中，梯度下降的过程可以表示为：
[0170][0171]
θ为待优化参数，如w和b，l为损失函数，η为学习效率，用于控制梯度下降的步长。
[0172]
反向传输的过程利用到求偏导的链式法则，即前一层参数的梯度可以由后一层参数的梯度递推计算得到。如图6所示，图6中神经元j与神经元i之间权重w
ij
的梯度可以表示为：
[0173][0174]
其中，si是神经元i上的输入加权和。从公式(6)可以看出神经元j与神经元i之间权重w
ij
的梯度需要根据神经元i上的梯度确定。
[0175]
5.中间梯度。
[0176]
中间梯度：是神经网络参数的梯度表达式中的一项或多项，或者是多项的乘积。当中间梯度是神经网络参数的梯度表达式中的多项时，该多项是分别回传给前一通信装置的。
[0177]
例如，如图7所示的通信系统包括神经网络#1、神经网络#2以及神经网络#3，其各神经网络对应的参数分别为θ1、θ2、θ3。a0、a1、a2分别为神经网络#1、神经网络#2、神经网络#3的输入，σ为一个或多个对数据进行处理的函数。其中，zi＝θi·ai-1
，a
i-1
＝σ
·
(z
i-1
)，i可取1、2、3。
[0178]
神经网络#3参数、神经网络#2参数以及神经网络#1参数的梯度分别为：
[0179][0180]
[0181][0182]
其中，l为损失函数。从而，神经网络#3参数的中间梯度为公式(5)中的一项或多项，或者多项的乘积。例如，神经网络#3参数的中间梯度为：再例如，神经网络#3参数的中间梯度为和神经网络#2参数的中间梯度为公式(6)中的一项或多项，或者多项的乘积。例如，神经网络#2参数的中间梯度为再例如，神经网络#2参数的中间梯度为又例如，神经网络#2参数的中间梯度为神经网络#1参数的中间梯度为公式(7)中的一项或多项，或者多项的乘积。例如，神经网络#1参数的中间梯度为再例如，神经网络#1参数的中间梯度为
[0183]
6.自编码器(auto encoder，dae)。
[0184]
自编码器是计算机科学领域常见的人工智能(artificial intelligence，ai)技术，是上述非监督学习的一种。其自编码器的结构图如图8所示，自编码器通过f函数，将输入数据x映射/压缩到隐空间(latent space)的变量，再通过g函数，从隐空间变量z中恢复出原始数据，其中f函数和g函数可以用神经网络实现。自编码器的优化目标是寻找f函数和g函数的参数，使得恢复出的数据误差最小。从自编码器完成的任务来说，也可以将其看作标签已知的监督学习过程。
[0185]
通常来说，通信系统完成的任务可以与上述自编码器类似，即可将通信系统类比与分布式实现的自编码器。对于通信系统而言，可认为发送端将隐空间变量(波形)通过信道发送，接收端再将该隐空间变量进行信息恢复。如图9所示的通信系统中，包括第二通信装置、第一通信装置以及信道，第二通信装置和第一通信装置包含神经网络(神经网络+传统信号处理模块)，x为信道的输入，y为信道的输出，θ为位于第二通信装置内的神经网络的参数，ω为位于第一通信装置内的神经网络的参数。其中，第二通信装置发送数据，第一通信装置接收并恢复数据的过程被称为神经网络的前向推理过程，也即通信系统的通信过程。该通信系统在使用前需要对神经网络的参数进行训练，其训练过程包括训练数据的前向推理、损失函数的计算以及梯度的反向传输。然而，在信道传递函数未知时，梯度的反向传输会受到阻碍。具体地，第二通信装置在更新发射机参数时，第二通信装置的最后一层神经网络需要接收第一通信装置的第一层神经网络回传的梯度，而信道传递函数未知会使得第二通信装置得不到准确的回传梯度，进而不能完成对第一通信装置和第二通信装置的联合训练。
[0186]
目前，针对图9所示的通信系统，可对信道进行数学建模，然后离线仿真第二通信装置到第一通信装置的训练，而在实际部署时仅在线更新位于第一通信装置内神经网络的参数，不更新位于第二通信装置内神经网络的参数。该方式虽然避免了梯度无法反向传输的障碍，但由于第二通信装置并未在实际部署后根据真实的信道进行训练，因此会因为真实信道与信道模型的失配而造成该通信系统的性能损失。
[0187]
或者，针对图9所示的通信系统，采用条件对抗生成网络(conditional generative adversarial networks,conditional gan)对信道分布进行建模，将信道转变为可微分神经网络/函数，从而使得梯度可以反向传输到第二通信装置。然而，gan的训练难度较大，仍无法实现梯度的反向传输，进而也不能完成对第一通信装置和第二通信装置的联合训练。
[0188]
再或者，针对图9所示的通信系统，将信道看作完全未知，在第二通信装置处采用梯度估算法，如强化学习等算法，利用第一通信装置反馈的奖励对第二通信装置进行梯度的更新。该方式中，第一通信装置向第二通信装置反馈的是奖励，第二通信装置仍得不到第一通信装置的梯度，因此仍完成对第一通信装置和第二通信装置的联合训练。
[0189]
本技术实施例中的信道相干互易是指信息在相干时间内，在信道中的前向传输和反向传输均是相同的。
[0190]
本技术实施例中梯度传输方法也适用于其他误差信息的传输，也就是说，本技术中的中间梯度也可以是其他误差信息。
[0191]
本技术实施例还可适用于其他信息的传输，不限定只适用于梯度的传输。例如，本技术实施例还可应用于控制信息的传输，也就是说，第一通信装置可将控制信息映射到空口资源上，通过空口资源传输该控制信息。
[0192]
本技术实施例中，第一通信装置、第二通信装置以及第三通信装置可为终端设备、网络设备中的一个。例如，当通信系统包括第一通信装置和第二通信装置时，第一通信装置是终端设备，第二通信装置是网络设备。再例如，当通信系统包括第一通信装置与第二通信装置时，第一通信装置和第二通信装置均为终端设备。再例如，当通信系统包括第一通信装置、第二通信装置以及与第二通信装置之间建立有通信连接的三通信装置时，第一通信装置和第二通信装置均为终端设备，第三通信装置是网络设备。
[0193]
本技术实施例提供了一种梯度传输方法100。梯度传输方法100中，第一通信装置与第二通信装置之间的信道是相干时间内互易的，第一通信装置接收训练数据，并根据该训练数据确定第一中间梯度，该第一中间梯度用于更新位于第二通信装置中第一神经网络的参数。然后，第一通信装置将该第一中间梯度映射到空口资源上，生成第一梯度信号，向第二通信装置发送该第一梯度信号，该第一梯度信号包括一个或多个第一梯度符号，每个第一梯度符号对应第一中间梯度的一个或多个梯度值。也就是说，第一通信装置将第一中间梯度映射到空口资源上进行传输，即通过向第二通信装置发送该第一梯度信号，实现第一中间梯度的反向传输，从而有利于实现对第一通信装置和第二通信装置的联合训练。
[0194]
本技术实施例还提供了一种梯度传输方法200，可应用于多用户多输入多输出的通信场景。该梯度传输方法200中，任一第一通信装置可将第一中间梯度以第一梯度信号的方式反向传输给第二通信装置，使得第二通信装置得到多个准确的第一梯度信号，从而第二通信装置根据多个第一梯度信号准确更新第一神经网络的参数，可完成对第一通信装置和第二通信装置的联合训练。
[0195]
另外，当上述图9所示的通信系统还包括与第二通信装置建立有通信连接的第三通信装置，即第二通信装置是中继节点时，第二通信装置还可根据第二中间梯度生成第三中间梯度，并将第三中间梯度以第三梯度信号的形式反向传输给第三通信装置，使得第三通信装置可根据该第三梯度信号更新位于第三通信装置中第二神经网络的参数，完成对第
一通信装置和第二通信装置的联合训练。该实施方式具体可参见下述梯度传输方法300。
[0196]
又一种实施方式中，第一通信装置根据训练数据确定第一中间梯度之前，第一通信装置还可接收来自第二通信装置的导频，并向第二通信装置发送针对该导频的反馈信息，使得第二通信装置可根据该反馈信息确定向第一通信装置发送的训练数据，从而可提高训练数据的可靠性。该实施方式具体可参见下述梯度传输方法400。
[0197]
本技术实施例还提供一种梯度传输方法500。梯度传输方法500适用于第一通信装置与第二通信装置之间的信道在相干时间内不互易的情况。该梯度传输方法500中，第一通信装置预先对信道进行信道估计，获得信道信息，然后根据该信道信息和训练数据确定第四中间梯度，再通过通信链路将第四中间梯度发送给第二通信装置。第四中间梯度是通过通信链路发送给第二通信装置的，所以第二通信装置获得了准确的第四中间梯度，从而第二通信装置可根据该第四中间梯度更新第一神经网络的参数，完成对第一通信装置和第二通信装置的联合训练。
[0198]
本技术实施例还提供一种梯度传输方法600，该方法中，第一通信装置与第二通信装置之间的信道也是在相干时间内互易的。该梯度传输方法600中，第一通信装置根据接收到的训练数据确定第一中间梯度，向第二通信装置发送第一中间梯度和控制信息，进而第二通信装置根据该控制信息确定进行信道估计，获得信道信息，再根据信号信息和第一中间梯度确定第五中间梯度，从而第五中间梯度为第二通信装置的准确梯度，进而第二通信装置可根据该第五中间梯度准确更新第一神经网络的参数，完成对第一通信装置和第二通信装置的联合训练。
[0199]
本技术实施例提出一种梯度传输方法100，该梯度传输方法适用于上述图9所示的通信系统，且该通信系统中的信道在相干时间内互易。图10是该梯度传输方法100的流程示意图。该梯度传输方法100从第一通信装置与第二通信装置之间交互的角度进行阐述。该梯度传输方法100包括但不限于以下步骤：
[0200]
s101.第一通信装置接收训练数据。
[0201]
一种可选的实施方式中，第一通信装置从第二通信装置中接收训练数据，该训练数据是第一通信装置和第二通信装置已知的数据。第一通信装置可根据该训练数据更新位于该第一通信装置内神经网络的参数，第二通信装置也可根据该训练数据更新位于该第二通信装置内第一神经网络的参数。
[0202]
s102.第一通信装置根据训练数据确定第一中间梯度；第一中间梯度用于更新位于第二通信装置中第一神经网络的参数。
[0203]
其中，第一中间梯度是第一通信装置的梯度，第一通信装置需将该第一中间梯度回传至第二通信装置，使得第二通信装置可根据该第一中间梯度更新位于第二通信装置内第一神经网络的参数。
[0204]
一种可选的实施方式中，第一通信装置根据训练数据确定第一中间梯度，包括：第一通信装置根据训练数据计算损失函数，然后根据损失函数确定第一中间梯度。
[0205]
图11为上述图9所示的通信系统对应的神经网络结构。图11中，训练数据是第二通信装置经过信道传递给第一通信装置的数据。第一通信装置接收到训练数据后，根据该训练数据计算损失函数l，然后根据该损失函数确定第一中间梯度为r为第一通信装置
的输出，y为第一通信装置的输入。
[0206]
s103.第一通信装置将第一中间梯度映射到空口资源上，生成第一梯度信号；第一梯度信号包括一个或多个梯度符号，每个梯度符号对应一个或多个梯度值。
[0207]
其中，空口资源是指时域资源、频域资源、空域资源中的其中一个。
[0208]
一种可选的实施方式中，第一通信装置将第一中间梯度映射到空口资源上，生成第一梯度信号，包括：将第一中间梯度的梯度值转换为一个或多个第一梯度符号；将一个或多个第一梯度符号映射到空口资源上，生成第一梯度信号。可见，第一通信装置是通过将一个或多个第一梯度符号映射到空口资源上，实现在该空口资源上对第一中间梯度的反向传输。
[0209]
该实施方式中，第一梯度信号包括的梯度符号中的每个梯度符号与第一中间梯度值中的一个梯度值对应，第一中间梯度值以第一梯度信号的形式存在。也就是说，第一通信装置将第一中间梯度映射到空口资源上进行传输，即通过向第二通信装置发送第一梯度信号实现对第一中间梯度的反向传输，从而有利于完成对第一通信装置和第二通信装置的联合训练。
[0210]
s104.第一通信装置向第二通信装置发送第一梯度信号。
[0211]
本技术实施例中，第一通信装置不是将第一中间梯度在应用层做信源编码，再以比特流发回物理层，由物理层进行信道编码、符号调制，再生成信号发送，而是将第一中间梯度转换为第一梯度信号，第一梯度信号包括的梯度符号与第一中间梯度的梯度值对应，从而在无线空口上反向该第一梯度信号，实现对第一中间梯度的反向传输。可见，该实施方式可提高对第一梯度反向传输的速度，进而提高第二通信装置对第一神经网络更新的速度，即提高对第一通信装置和第二通信装置联合训练的速度。
[0212]
s105.第二通信装置接收第二梯度信号；第二梯度信号是第一梯度信号经过信道传输之后的信号。
[0213]
s106.第二通信装置根据第二梯度信号，确定第二中间梯度。
[0214]
对于上述图11所示的神经网络中，第二通信装置确定第二中间梯度为其中f(h)的理论值为而本技术实施中，f(h)的值无需显示表示。
[0215]
s107.第二通信装置根据第二中间梯度更新第一神经网络的参数。
[0216]
对应的，对于上述图11所示的神经网络，第二通信装置根据第二中间梯度更新第一神经网络的参数是指根据第二中间梯度更新参数θ，第二通信装置通过第二中间梯度对θ求偏导来更新该θ，即通过来更新θ。
[0217]
一种可选的实施方式中，第二通信装置可采用来更新参数，其中是第二中间梯度，γ是学习效率。该γ可以是预设的，也可以随训练过程变化，也可以由第一通信装置进行指示。
[0218]
本技术实施例中，第一通信装置可根据第一中间梯度完成对第一通信装置的训练，第二通信装置可根据接收的第一梯度信号完成对第二通信装置的训练，即本技术实施例可实现对第一通信装置和第二通信装置的联合训练。
[0219]
本技术实施例中，当位于第一通信装置内的神经网络是复数神经网络时，第一中
间梯度的梯度值是复数梯度值；当位于第一通信装置内的神经网络是实数神经网络时，第一中间梯度的梯度值是实数梯度值。因此，s103中，第一通信装置将第一中间梯度的梯度值转换为一个或多个第一梯度符号包括以下几种可选的实施方式：
[0220]
1.第一中间梯度包括的p个复数梯度值，第一梯度符号是实数符号。
[0221]
一种可选的实施方式中，第一通信装置与第二通信装置组成的通信系统传输的是实数符号，即第一梯度符号是实数符号，那么第一通信装置将第一中间梯度的梯度值转换为一个或多个第一梯度符号，包括：将第一中间梯度包括的p个复数梯度值转换为2m个第一实数符号；p为正整数；m为小于或等于p的正整数。从而，上述一个或多个梯度符号包括2m个第一实数符号。
[0222]
可见，当第一通信装置与第二通信装置组成的通信系统传输的是实数符号，且第一中间梯度包括的p个复数梯度值时，第一通信装置将该p个复数梯度值转换为2m个第一实数符号，从而第一通信装置该2m个第一实数符号映射到空口资源上，生成第一梯度信号，使得第一通信装置通过空口资源传输该第一中间梯度。
[0223]
一种可选的实施方式中，第一通信装置将第一中间梯度包括的p个复数梯度值转换为2m个第一实数符号，包括：第一通信装置将第一中间梯度包括的p个复数梯度值中，任一复数梯度值的实部和虚部确定为一个第一实数符号，获得2m个第一实数符号。例如，第一中间梯度为gi＝mi+jni，i＝0,1,
…
p-1，当m等于p时，第一实数符号为：mi、ni。
[0224]
例如，第一中间梯度包括的复数梯度值为2+3j、5+2j、8+6j，则第一通信装置可将2+3j、5+2j转换为2、3、5、2，即第一实数符号包括2、3、5、2，从而第一通信装置将2、3、5、2映射到空口资源上，生成第一梯度信号。
[0225]
再例如，第一中间梯度包括的复数梯度值为2+3j、5+2j、8+6j，则第一通信装置可将2+3j、5+2j转换为2、3、5、2，然后取该第一梯度符号的实部或虚部作为第一实数符号，比如第一实数符号包括2和5，从而第一通信装置将2和5映射到空口资源上，生成第一梯度信号。
[0226]
另一种可选的实施方式中，第一通信装置将第一中间梯度包括的p个复数梯度值中，任一复数梯度值的实部和虚部确定为一个第一实数符号，获得2p个第一实数符号，再将该2p个第一实数符号中的2m个第一实数符号映射到空口资源上，生成第一梯度信号。
[0227]
例如，第一中间梯度包括的复数梯度值为2+3j、5+2j、8+6j，则第一通信装置可将2+3j、5+2j、8+6j转换为2、3、5、2、8、6，即第一实数符号包括2、3、5、2、8、6，然后第一通信装置将其中的5、2、8、6映射到空口资源上，生成第一梯度信号。
[0228]
再例如，第一中间梯度包括的复数梯度值为2+3j、5+2j、8+6j，则第一通信装置可将2+3j、5+2j、8+6j转换为2、3、5、2、8、6，然后取该第一梯度符号的实部或虚部作为第一实数符号，比如第一实数符号包括3、2、6，从而第一通信装置将3、2、6映射到空口资源上，生成第一梯度信号。
[0229]
2.第一中间梯度包括的p个实数梯度值，第一梯度符号是实数符号。
[0230]
一种可选的实施方式中，第一通信装置与第二通信装置组成的通信系统传输的是实数符号，即第一梯度符号是实数符号，那么第一通信装置将第一中间梯度的梯度值转换为一个或多个第一梯度符号，包括：第一通信装置将第一中间梯度包括的p个实数梯度值转换为m个第二实数符号；p为正整数；m为小于或等于p的正整数。从而，上述一个或多个梯度
符号包括m个第二实数符号。
[0231]
可见，当第一通信装置与第二通信装置组成的通信系统传输的是实数符号，且第一中间梯度包括的p个实数梯度值时，第一通信装置将p个实数梯度值转换为m个第二实数符号，从而第一通信装置该m个第二实数符号映射到空口资源上，生成第一梯度信号，使得第一通信装置通过空口资源传输该第一中间梯度。
[0232]
一种可选的实施方式中，m小于p，第一通信装置将第一中间梯度包括的p个实数梯度值转换为m个第二实数符号，包括：第一通信装置将第一中间梯包括的p个实数梯度值中，m个实数梯度值确定为m个第二实数符号。该实施方式无需将该p个实数梯度值进行转换，可降低第一通信装置的信令开销。
[0233]
也就是说，第一通信装置可以将部分梯度值转换为第一梯度信号，反向传输给第二通信装置，该部分梯度值可以是梯度功率或信噪比大于阈值的梯度值。其余未转换的梯度值不传输，那么多余的空口资源可用于控制信令的传输、导频的传输等。
[0234]
例如，第一中间梯度包括23、4、17、46、9、37，第一通信装置将其中的23、17、46映射到空口资源上，生成第一梯度信号。
[0235]
另一可选的实施方式中，m等于p，第一通信装置将第一中间梯度包括的p个实数梯度值转换为m个第二实数符号，包括：第一通信装置将第一中间梯包括的p个实数梯度值确定为p个第二实数符号。可选的，该情况下，为避免实际部分空口资源深衰时回传的梯度噪声过大影响训练的收敛，可以对反向传输的p个第二实数符号中的部分第二实数符号置0，其哪些第二实数符号置0是由第一通信装置探测或由第二通信装置指示得到。
[0236]
又一种可选的实施方式中，当第一中间梯度是功率归一化后的第一中间梯度时，第一通信装置将归一化后的第一中间梯度包括的p个实数梯度值转换为m个第二实数符号，此时m个第二实数符号与第一中间梯度包括的m个实数梯度值不相等。
[0237]
3.第一中间梯度包括的p个复数梯度，第一梯度符号是复数符号。
[0238]
一种可选的实施方式中，第一通信装置与第二通信装置组成的通信系统传输的是复数符号，即第一梯度符号是复数符号，那么第一通信装置将第一中间梯度的梯度值转换为一个或多个第一梯度符号，包括：将第一中间梯度包括的p个复数梯度值转换为m个第一复数符号；p为正整数；m小于或等于p的正整数。从而，上述一个或多个梯度符号包括m个第一复数符号。
[0239]
可见，当第一通信装置与第二通信装置组成的通信系统传输的是复数符号，且第一中间梯度包括的p个复数梯度值时，第一通信装置将该p个复数梯度值转换为m个第一复数符号，再将该m个第一复数符号映射到空口资源，生成第一梯度信号，使得第一通信装置可通过无线空口反向传输该第一中间梯度。
[0240]
一种可选的实施方式中，第一通信装置将第一中间梯度包括的p个复数梯度值转换为m个第一复数符号，包括：第一通信装置将第一中间梯度包括的p个复数梯度值中，任一复数梯度值的实部确定为第一复数符号的实部，以及将该复数梯度值的虚部确定为该第一复数符号的虚部，获得m个第一复数符号。也就是说，确定的第一复数符号的实部和复数梯度值的实部对应，第一复数符号的虚部和复数梯度值的虚部对应。该实施方式下，第一通信装置将m个第一复数符号的共轭映射到空口资源上，生成第一梯度信号。
[0241]
例如，第一中间梯度值包括2+3j、5+2j、8+6j，第一通信装置确定第二复数符号包
括5+2j、8+6j，再将5+2j、8+6j的共轭，即5-2j、8-6j映射到空口资源上，生成第一梯度信号。可见，第一梯度信号包括的5-2j与第一中间梯度包括的5+2j对应，第一梯度信号包括的8-6j与第一中间梯度包括的8+6j对应。
[0242]
另一种可选的实施方式中，第一通信装置将第一中间梯度包括的p个复数梯度值转换为m个第一复数符号，包括：第一通信装置将第一中间梯度包括的p个复数梯度值中，任一复数梯度值的虚部确定为第一复数符号的实部，以及将该复数梯度值的实部确定为该第一复数符号的虚部，获得m个第一复数符号。也就是说，确定的第一复数符号的实部和复数梯度值的虚部对应，第一复数符号的虚部和复数梯度值的实部对应。该实施方式下，第一通信装置将m个第一复数符号映射到空口资源上，生成第一梯度信号。
[0243]
例如，第一中间梯度包括2+3j、5+2j、8+6j，第一通信装置根据2+3j、5+2j、8+6j确定第二复数符号包括3+2j、2+5j、6+8j，然后将3+2j、2+5j、6+8j映射到空口资源上，生成第一梯度信号。
[0244]
4.第一中间梯度包括的p个实数梯度，第一梯度符号是复数符号。
[0245]
又一种可选的实施方式中，第一通信装置与第二通信装置组成的通信系统传输的是复数符号，即第一梯度符号是复数符号，那么第一通信装置将第一中间梯度的梯度值转换为一个或多个第一梯度符号，包括：第一通信装置将第一中间梯度包括的p个实数梯度值转换为m个第二复数符号；p为正整数；m为小于或等于的正整数，其中符号表示向上取整。从而，上述一个或多个梯度符号包括m个第二复数符号。
[0246]
例如，第一中间梯度为gi，i＝0,1,
…
,p-1，第一实数符号为：sk＝gk+g
k+p
，
[0247]
可见，当第一通信装置与第二通信装置组成的通信系统传输的是复数符号，且第一中间梯度值包括的2p个实数梯度时，第一通信装置将该2p个实数梯度值转换为m个第二复数符号，再将该m个第二复数符号映射到空口资源上，生成第一梯度信号，使得第一通信装置通过无线空口资源反向传输该第一中间梯度。
[0248]
一种可选的实施方式中，第一通信装置将第一中间梯度包括的2p个实数梯度值转换为m个第二复数符号，包括：第一通信装置将第一中间梯度包括的2p个实数梯度值中，任两个实数梯度值确定为一个第二复数符号的实部和虚部，获得m个第二复数符号。
[0249]
一种可选的实施方式中，第一通信装置确定的第二复数符号对应的梯度值不重叠。例如，第一中间梯度包括23、4、17、46、9、37，第一通信装置确定的第二复数符号包括23+4j、17+46j、9+37j，可见，每个第二复数符号的实部和虚部均是由第一中间梯度的实数梯度中不重叠的实数梯度组成。
[0250]
另一种可选的实施方式中，第一通信装置确定的第二复数符号对应的梯度值存在重叠。例如，第一中间梯度包括23、4、17、46、9、37，第一通信装置确定的第二复数符号为23+4j、4+46j、9+46j，即组成该第二复数符号的实部和虚部有重叠的实数梯度。
[0251]
s105中，第二中间梯度信号是第一中间梯度信号经过信道获得的。因此，第二中间梯度信号与第一中间梯度信号相对应。从而s106中，第二通信装置根据第二梯度信号，确定第二中间梯度有对应以下几种实施方式：
[0252]
一种实现方式中，第二梯度信号包括2m个第三实数符号，第三实数符号是第一实数符号经过信道后的符号；m为正整数；第二通信装置根据一个或多个第二梯度信号，确定第二中间梯度，包括：第二通信装置将2m个第三实数符号转换为第二中间梯度的m个复数梯
度。
[0253]
也就是说，第二通信装置将2m个第三实数符号中的每两个第三实数符号，确定为一个复数梯度，从而获得第二中间梯度的m个复数梯度。
[0254]
例如，第二梯度信号包括2、4、5、2、7、6，则第二通信装置将2、4、5、2、7、6转换为2+4j、5+2j、7+6j，即第二中间梯度包括2+4j、5+2j、7+6j。
[0255]
另一种可选的实施方式中，第二梯度信号包括m个第四实数符号，第四实数符号是第二实数符号经过信道后的符号；m为正整数；第二通信装置根据一个或多个第二梯度信号，确定第二中间梯度，包括：第二通信装置将m个第四实数符号确定为第二中间梯度的m个实数梯度值。也就是说，第二通信装置直接将m个第四实数符号确定成第二中间梯度的m个实数梯度值。
[0256]
例如，第二梯度信号包括23、4、17、46、9、37，则第二通信装置确定第二中间梯度包括23、4、17、46、9、37。
[0257]
又一种可选的实施方式中，第二梯度信号包括m个第三复数符号，第三复数符号是第一复数符号经过信道后的符号；m为正整数；第二通信装置根据一个或多个第二梯度信号，确定第二中间梯度，包括：第二通信装置将m个第三复数符号转换为第二中间梯度的m个复数梯度值。
[0258]
一种可选的实施方式中，第二通信装置将m个第三复数符号转换为第二中间梯度的m个复数梯度值，包括：第二通信装置取m个第三复数符号的共轭，然后将任一第三复数符号的共轭的实部确定为一个复数梯度的实部，将该共轭的虚部确定该复数梯度的虚部，从而获得第二中间梯度的m个复数梯度值。
[0259]
例如，第二梯度信号包括的第三复数符号为2-3j、5-2j、8-6j，则第二通信装置确定该第三复数符号的共轭为2+3j、5+2j、8+6j，因此将2+3j、5+2j、8+6j确定为第二中间梯度的3个复数梯度值。
[0260]
另一种可选的实施方式中，第二通信装置将m个第三复数符号转换为第二中间梯度的m个复数梯度值，包括：第二通信装置将m个第三复数符号中，任一第三复数符号的实部确定为一个复数梯度值的虚部，将该第三复数符号的虚部确定该复数梯度值的实部，从而获得第二中间梯度的m个复数梯度值。
[0261]
例如，第二梯度信号包括的第三复数符号为2-3j、5-2j、8-6j，则第二通信装置将2-3j、5-2j、8-6j确定为第二中间梯度的3个复数梯度。
[0262]
又一种可选的实施方式中，第二梯度信号包括m个第四复数符号，第四复符号是第二复数符号经过信道后的符号；m为正整数；第二通信装置根据一个或多个第二梯度信号，确定第二中间梯度，包括：第二通信装置将m个第四复数符号转换为第二中间梯度的2m个实数梯度值。
[0263]
第二通信装置将该m个复数符号中，任一复数符号的实部和虚部确定为两个实数梯度值，从而获得第二中间梯度的2m个实数梯度值。
[0264]
本技术实施例中，第一中间梯度和第一梯度信号的转换关系是第一通信装置和第二通信装置预先约定好的，或者是在标准中定义的。
[0265]
本技术实施例中，将第一通信装置与第二通信装置之间的信道作为神经网络的中间层，以及位于第一通信装置和位于第二通信装置内的神经网络构成一个完整的神经网
络。也就是说，本技术实施例将信道视作未知的。
[0266]
可见，本技术实施例中，第一通信装置将第一中间梯度映射到空口资源上，生成第一梯度信号，通过向第二通信装置发送该第一梯度信号，实现在信道未知情况下，在空口资源上反向传输第一中间梯度，可提高对第一中间梯度回传的准确性，从而第二通信装置可根据该第一中间梯度确定第二中间梯度，再根据该第二中间梯度更新位于第二通信装置内第一神经网络的参数，提高对第一神经网络的参数更新的准确性，进而完成对第一通信装置和第二通信装置的联合训练。
[0267]
本技术实施例中，映射到上述空口资源上的第一中间梯度是功率归一化后的第一中间梯度。也就是说，第一通信装置将第一中间梯度进行功率归一化后，再将功率归一化后的第一中间梯度映射到空口资源上生成第一梯度信号。
[0268]
一种可选的实施方式中，第一通信装置将第一中间梯度进行功率归一化包括：将第一中间梯度包括的所有梯度符号的平均功率进行归一化处理。例如，第一中间梯度为s
*
，对s
*
包括的所有梯度符号进行归一化处理为：其中p为每个空口资源上的发送功率，avg(||s
*
||2)表示对所有梯度符号的功率求平均，即将所有梯度符号的平均功率归一化到发送功率p上。
[0269]
另一种可选的实施方式中，第一通信装置将第一中间梯度进行功率归一化包括：将第一中间梯度包括的所有梯度符号的最大功率进行归一化处理。例如，第一中间梯度为s
*
，对s
*
包括的所有梯度符号进行归一化处理为：其中p为每个空口资源上的发送功率，max(||s
*
||2)表示对所有梯度符号的功率求最大值，即将所有梯度符号的最大功率归一化到发送功率p上。
[0270]
另外，本技术实施例中，第一通信装置还可对第一梯度信号进行限幅，以保证其峰均比满足系统要求。也就是说，第一通信装置将第一梯度信道的幅度限定在预设范围内，以限制其峰均比。
[0271]
本技术实施例中，第二通信装置接收第一梯度信号，还包括对第一梯度信号进行滤波、估计等信号处理，以消除噪声干扰或同步失配对第一梯度信号包括的梯度符号造成的影响，从而保证获得正确的第二中间梯度。
[0272]
上述梯度传输方法100可应用于图12所示的正交频分复用技术(orthogonal frequency division multiplexing，ofdm)通信系统中。如图12所示，该通信系统包括对数据的反向快速傅里叶变换(inverse fast fourier transform，ifft)和快速傅里叶变换(fast fourier transform，fft)。可选的，该ifft模块和fft模块可替换为其他数据处理模块。或者，在该ifft模块和/或fft模块处理之前和/或之后，该通信系统还包括其他处理模块，该处理模块用于对数据进行处理。
[0273]
可选的，本技术实施例还可应用于单载波的通信场景，以及离散傅里叶变换扩展正交频分复用(discrete fourier transform extended ofdm，dft-s-ofdm)、单载波频分复用(single carrier ofdm，sc-ofdm)、正交时频空(orthogonal time-frequency space，otfs)等通信场景中。
[0274]
当本技术实施例应用于ofdm通信系统时，系统的传播模型为：y＝hx+n，y为通信系统的输出，x为通信系统的输入，h为信道信息，n为噪声。此时，第一通信装置可将上述第一中间梯度映射到子载波上，生成第一梯度信号。
[0275]
当本技术实施例应用于单载波的通信场景中时，系统的传播模型为：y＝h*x+n，*表示卷积操作。此时第一通信装置可将上述第一中间梯度映射到时隙上，生成第一梯度信号。
[0276]
本技术实施例中，神经网络的输出和第一中间梯度的维度(即上述实数梯度和复数梯度的个数)可以相同，也可以不相同，本技术实施例不做限定。例如，神经网络的输出为2p，第一中间层梯度的维度也为2p。再例如，神经网络的输出维度为2，输出与一个已知的维度为2
×
2p的矩阵相乘，使得相乘后的维度与中间层梯度的维度相同，其中一个或多个已知矩阵相乘的操作等升降维操作保证了梯度回传维度的匹配。
[0277]
本技术实施例中，神经网络的输出可以经过线性变换再映射到空口资源上。
[0278]
本技术实施例分别仿真了信道完美、梯度传输方法100应用于ofdm通信系统以及采用强化学习的方式更新第一神经网络的参数时，无噪声反馈的情况下损耗与神经网络的参数更新次数的关系，其关系图如图13所示。如图13所示，梯度传输方法100应用于图12所示ofdm通信系统时，其关系曲线和信道完美情况下的基本曲线重合，而采用强化学习的方式更新第一神经网络的参数时，其收敛性能和更新速度都远远差于完美信道时。可见本技术实施例对第一通信装置和第二通信装置联合训练的速度较佳。
[0279]
另外，本技术实施例还分别仿真了采用强化学习的方式更新第二通信装置的参数时，以及梯度传输方法100应用于ofdm通信系统时，在无噪声反馈与反馈噪声比为-30db情况下收敛差异，其仿真图分别如图14和图15所示。从图14可以看出，采用强化学习的方式更新第二通信装置的参数时，在反馈噪声比为-30db情况下收敛性能严重下降。而从图15可以看出，梯度传输方法100应用于ofdm通信系统时，在反馈噪声比为-30db情况下收敛性能与无噪声比时的情况基本一致，即本技术实施例对抗反噪声比的能力较好。
[0280]
本技术实施例还提出一种梯度传输方法200，该梯度传输方法200适用于多输入多输出通信场景，且该多输入多输出通信场景中的信道在相干时间内互易。图16为该梯度传输方法200的实现框图。如图16所示，第二通信装置与第一通信装置的数量为多个，一个第二通信装置可与多个第一通信装置进行通信。图17为梯度传输方法200的流程示意图。该梯度传输方法200包括但不限于：
[0281]
s201.第二通信装置向第一通信装置发送训练数据。
[0282]
一种可选的实施方式中，第二通信装置在m*p空口资源单元上向第一通信装置发送训练数据，该m和p均为正整数。
[0283]
s202.第一通信装置k接收训练数据，k正整数。
[0284]
第一通信装置k为多个第一通信装置中的任一第一通信装置。
[0285]
一种可选的实施方式中，第一通信装置k在nk*p空口资源单元上接收来自第二通信装置的训练数据，nk为可由第一通信装置的天线数量确定。
[0286]
s203.第一通信装置k根据训练数据确定第一中间梯度。
[0287]
一种可选的实施方式中，第一中间梯度的维度为nk×
2p。
[0288]
一种可选的实施方式中，第一通信装置确定第一中间梯度之前，还可根据训练数
据确定损失函数，然后根据损失函数和位于第一通信装置内神经网络的参数，更新该神经网络的参数。
[0289]
第一通信装置k根据训练数据确定第一中间梯度的实施方式和上述s102中的实施方式相同，不再赘述。
[0290]
s204.第一通信装置k将第一中间梯度映射到空口资源上，生成第一梯度信号；第一梯度信号包括一个或多个梯度符号，每个梯度符号对应一个或多个梯度值。
[0291]
一种可选的实现方式中，第一通信装置k将第一中间梯度映射到空口资源上，生成第一梯度信号，包括：第一通信装置将第一中间梯度与第一权重进行处理，获得加权的第一中间梯度；第一通信装置将加权的第一中间梯度映射到空口资源上，生成第一梯度信号。
[0292]
其中，第一通信装置将第一中间梯度与第一权重进行处理，是指将第一中间梯度与第一权重做乘积处理，或者做卷积处理等。另外，加权的第一中间梯度可表示第一中间梯度的可信程度或重要程度。第一权重可由信噪比确定。第一权重可由第一通信装置确定，也可以是第二通信装置通过信令指示给第一通信装置。
[0293]
第一通信装置将加权的第一中间梯度映射到空口资源上，生成第一梯度信号的实施方式，可参见上述梯度传输方法100中的第一通信装置将第一中间梯度映射到空口资源上，生成第一梯度信号的实施方式，不再赘述。
[0294]
s205.第一通信装置k向第二通信装置发送第一梯度信号。
[0295]
s206.第二通信装置在mp空口资源上接收多个第二梯度信号；每个第二梯度信号是第一梯度信号经过信道后获得的。
[0296]
s207.第二通信装置根据多个第二梯度信号，确定第二中间梯度。
[0297]
第二通信装置将多个第二梯度信号进行叠加，再根据叠加后的第二梯度信号，确定第二中间梯度。第二通信装置将多个第二梯度信号进行叠加，是对多个第二梯度信号取加权和，或者取平均值。
[0298]
s208.第二通信装置根据第二中间梯度，更新位于第二通信装置内第一神经网络的参数。
[0299]
s205-s208和上述s104-s107的实施方式相同，不再赘述。
[0300]
本技术实施例中，第一通信装置将第一中间梯度生成第一梯度信号，并向第二通信装置发送该第一梯度信号的实施方式可参见上述s101-是s107，不再赘述。
[0301]
可见，本技术实施例中，在多用户多输入多输出的通信场景下，任一第一通信装置可将第一中间梯度以第一梯度信号的方式反向传输给第二通信装置，使得第二通信装置得到多个第一梯度信号，从而第二通信装置根据多个第一梯度信号准确更新第一神经网络的参数，完成对第一通信装置和第二通信装置的联合训练。
[0302]
上述梯度传输方法200还可应用于多用户(multi-user)，非正交多址接入(non orthogonal multiple access，noma)，协同多点传输(cooperative multipoint transmission，comp)等通信场景。
[0303]
本技术实施例还提出一种梯度传输方法300，该梯度传输方法300适用于多跳的通信场景，且该多跳的通信场景中的信道是在相干时间内互易的。图18为该梯度传输方法300的实现框图。如图18所示，该多跳的通信场景中，第二通信装置为中继节点，第一通信装置与第三通信装置传输的信号需要由第二通信装置转发。该梯度传输方法300与梯度传输方
法100的不同之处在于，第二通信装置根据第二中间梯度更新第一神经网络的参数之后，还包括但不限于图19所示的步骤：
[0304]
s301.第二通信装置根据第二中间梯度生成第三中间梯度。
[0305]
该第三中间梯度是第二通信装置需反向传输给第三通信装置的梯度。
[0306]
s302.第二通信装置将第三中间梯度映射到空口资源上，生成第三梯度信号；第三梯度信号包括一个或多个第二梯度符号，每个第二梯度符号对应一个或多个梯度值。
[0307]
一种可选的实施方式中，第二通信装置将第三中间梯度映射到空口资源上，生成第三梯度信号，包括：将第三中间梯度的梯度值转换为一个或多个第二梯度符号；将该一个或多个第二梯度符号映射到空口资源上，生成第三梯度信号。可见，第二通信装置是通过将一个或多个第二梯度符号映射到空口资源上，实现在该空口资源上对第三中间梯度的反向传输。
[0308]
第二通信装置将第三中间梯度映射到空口资源上，生成第三梯度信号的实施方式如下：
[0309]
1.第三梯度信号包括m个复数梯度，第二梯度符号是实数符号。
[0310]
第一通信装置、第二通信装置以及第三通信装置组成的通信系统传输的是实数符号，即第二梯度符号是实数符号，第二通信装置将第三中间梯度的梯度值转换为一个或多个第二梯度符号，包括：将第三中间梯度包括的m个复数梯度值转换为2n个第五实数符号；m为正整数；n为小于或等于m的正整数；n为小于或等于m的正整数。从而，上述一个或多个第二梯度符号包括2n个第一实数符号。
[0311]
可见，当第一通信装置、第二通信装置以及第三通信装置组成的通信系统传输的是实数符号，且第三中间梯度包括的m个复数梯度值时，第二通信装置将该m个复数梯度值转换为2n个第五实数符号，从而第二通信装置该2n个第五实数符号映射到空口资源上，生成第三梯度信号，使得第二通信装置通过空口资源传输该第三中间梯度。
[0312]
一种可选的实施方式中，第二通信装置将第三中间梯度包括的m个复数梯度值转换为2n个第一实数符号，包括：第二通信装置将第三中间梯度包括的m个复数梯度值中，任一复数梯度值的实部和虚部确定为一个第五实数符号，获得2n个第五实数符号。
[0313]
另一种可选的实施方式中，第二通信装置将第三中间梯度包括的m个复数梯度值中，任一复数梯度值的实部和虚部确定为一个第五实数符号，获得2n个第五实数符号，再将该2n个第五实数符号中的2n个第二实数符号映射到空口资源上，生成第三梯度信号。
[0314]
2.第三梯度信号包括m个实数梯度，第二梯度符号是实数符号。
[0315]
一种可选的实施方式中，当第一通信装置、第二通信装置以及第三通信装置组成的通信系统传输的是实数符号时，即第三梯度符号是实数符号，那么第二通信装置将第三中间梯度的梯度值转换为一个或多个第二梯度符号，包括：第二通信装置将第三中间梯度包括的m个实数梯度值转换为n个第六实数符号；m为正整数；n为小于或等于m的正整数。从而，上述一个或多个第二梯度符号包括n个第六实数符号。
[0316]
可见，当第一通信装置与第二通信装置组成的通信系统传输的是实数符号，且第三中间梯度包括的m个实数梯度值时，第一通信装置将m个实数梯度值转换为n个第二实数符号，从而第一通信装置该n个第二实数符号映射到空口资源上，生成第三梯度信号，使得第二通信装置通过空口资源传输该第三中间梯度。
[0317]
一种可选的实施方式中，n小于m，第二通信装置将第三中间梯度包括的m个实数梯度值转换为n个第六实数符号，包括：第二通信装置将第三中间梯包括的m个实数梯度值中，n个实数梯度值确定为n个第六实数符号。该实施方式无需将该m个实数梯度值进行转换，可降低第二通信装置的信令开销。
[0318]
一种可选的实施方式中，第二通信装置将第三中间梯度包括的2m个实数梯度值转换为n个第六复数符号，包括：将第三中间梯度包括的2m个实数梯度值中，任两个实数梯度值确定为一个第六复数符号的实部和虚部，获得n个第六复数符号。
[0319]
另一可选的实施方式中，n等于m，第二通信装置将第三中间梯度包括的m个实数梯度值转换为n个第六实数符号，包括：第二通信装置将第三中间梯包括的m个实数梯度值确定为n个第六实数符号。可选的，该情况下，为避免实际部分空口资源深衰时回传的梯度噪声过大影响训练的收敛，可以对反向传输的m个第六实数符号中的部分第六实数符号置0，其哪些第六实数符号置0是由第二通信装置探测或由第三通信装置指示得到。
[0320]
又一种可选的实施方式中，当第三中间梯度是功率归一化后的第三中间梯度时，第二通信装置将归一化后的第三中间梯度包括的m个实数梯度值转换为n个第六实数符号，此时n个第六实数符号与第三中间梯度包括的n个实数梯度值不相等。
[0321]
3.第三梯度信号包括m个复数梯度，第二梯度符号是实数符号。
[0322]
又一种可选的实施方式中，当第一通信装置、第二通信装置以及第三通信装置组成的通信系统传输的是实数符号时，即第二梯度符号是复数符号，第二通信装置将第一中间梯度的梯度值转换为一个或多个第二梯度符号，包括：将第三中间梯度包括的m个复数梯度值转换为n个第五复数符号；m为正整数；n小于或等于m的正整数；或者将第三中间梯度包括的m个实数梯度值转换为n个第五复数符号；m为正整数；n小于或等于m/2的正整数。从而，上述一个或多个第二梯度符号包括n个第五复数符号。
[0323]
可见，当第一通信装置、第二通信装置以及第三通信装置组成的通信系统传输的是实数符号时，且第三中间梯度包括的m个复数梯度值时，第二通信装置将该n个复数梯度值转换为n个第五复数符号，再将该n个第五复数符号映射到空口资源，生成第三梯度信号，使得第二通信装置可通过无线空口反向传输该第三中间梯度。
[0324]
一种可选的实施方式中，第二通信装置将第三中间梯度包括的m个复数梯度值转换为n个第五复数符号，包括：第二通信装置将第三中间梯度包括的m个复数梯度值中，任一复数梯度值的实部确定为第五复数符号的实部，以及将该复数梯度值的虚部确定为该第五复数符号的虚部，获得n个第五复数符号。也就是说，确定的第五复数符号的实部和复数梯度值的实部对应，第五复数符号的虚部和复数梯度值的虚部对应。该实施方式下，第二通信装置将n个第五复数符号的共轭映射到空口资源上，生成第三梯度信号。
[0325]
另一种可选的实施方式中，第二通信装置将第三中间梯度包括的m个复数梯度值转换为n个第五复数符号，包括：第二通信装置将第三中间梯度包括的m个复数梯度值中，任一复数梯度值的虚部确定为第五复数符号的实部，以及将该复数梯度值的实部确定为该第一复数符号的虚部，获得n个第五复数符号。也就是说，确定的第五复数符号的实部和复数梯度值的虚部对应，第五复数符号的虚部和复数梯度值的实部对应。该实施方式下，第二通信装置将n个第五复数符号映射到空口资源上，生成第三梯度信号。
[0326]
4.第三梯度信号包括2m个实数梯度，第二梯度符号是实数符号。
[0327]
又一种可选的实施方式中，第一通信装置、第二通信装置以及第三通信装置组成的通信系统传输的是复数符号，即第二梯度符号是复数符号，那么第二通信装置将第三中间梯度的梯度值转换为一个或多个第二梯度符号，包括：第二通信装置将第三中间梯度包括的m个实数梯度值转换为n个第六复数符号；n为正整数；n小于或等于m/2的正整数。从而，上述一个或多个第二梯度符号包括n个第六复数符号。
[0328]
可见，当第一通信装置、第二通信装置以及第三通信装置组成的通信系统传输的是复数符号，且第三中间梯度值包括的2m个实数梯度时，第二通信装置将该2m个实数梯度值转换为n个第六复数符号，再将该n个第六复数符号映射到空口资源上，生成第三梯度信号，使得第二通信装置通过无线空口资源反向传输该第三中间梯度。
[0329]
一种可选的实施方式中，第二通信装置将第三中间梯度包括的2m个实数梯度值转换为n个第六复数符号，包括：第二通信装置将第三中间梯度包括的2m个实数梯度值中，任两个实数梯度值确定为一个第六复数符号的实部和虚部，获得n个第六复数符号。
[0330]
s303.第二通信装置向第三通信装置发送第三梯度信号；第三通信装置与第二通信装置相连。
[0331]
s304.第三通信装置接收第四梯度信号；第四梯度信号是第三梯度信号经过信道获得的。
[0332]
s305.第三通信装置根据第四梯度信号确定第六中间梯度。
[0333]
第三通信装置根据第四梯度信号确定第三中间梯度的实施方式可参见上述第二通信装置根据第二梯度信号确定第二中间梯度的实施方式，不再赘述。
[0334]
s306.第三通信装置根据第六中间梯度更新位于第三通信装置内第二神经网络的参数。
[0335]
第三通信装置通过第六中间梯度对第二神经网络的参数求偏导，从而根据该偏导值更新第二神经网络的参数。
[0336]
本技术实施例中的第三中间梯度也可以是归一化后的第三中间梯度，第二通信装置对第三中间梯度进行归一化的实施方式可参见上述第一通信装置对第一中间梯度进行归一化的实施方式，不再赘述。
[0337]
可见，在多跳的通信场景中，第一通信装置可通过发送第一梯度信号的方式将第一中间梯度反向传输至第二通信装置，第二通信装置通过发送第三梯度信号的方式将根据第二中间梯度确定的第三中间梯度反向传输至第三通信装置，使得第三通信装置根据第三中间梯度更新第二神经网络的参数。该实施方式中，第二通信装置和第三通信装置均获得了反向传输的中间梯度，使得第二通信装置和第三通信装置可根据准确的梯度更新对应神经网络的参数，完成对第一通信装置和第二通信装置的联合训练。
[0338]
本技术实施例还提出一种梯度传输方法400，该梯度传输方法400适用于控制、反馈、传输、联合训练场景，且该通信场景中的信道在相干时间内互易。图20为该梯度传输方法400的一种实现框图。如图20所示，第一通信装置与第二通信装置通信之前，第二通信装置还向第一通信装置发送控制信息，第一通信装置针对该控制信息向第二通信装置反馈。从而梯度传输方法400与上述梯度传输方法100的不同之处在于，第一通信装置接收训练数据之前还包括但不限于图21所示的步骤：
[0339]
s401.第二通信装置向第一通信装置发送控制信息。
[0340]
其中，该控制信息包含导频。
[0341]
s402.第一通信装置接收控制信息。
[0342]
第一通信装置通过接收控制信息，获得导频。
[0343]
s403.第一通信装置向第二通信装置发送针对该控制信息的反馈信息。
[0344]
该反馈信息是针对控制信息的反馈信息，即第一通信装置根据控制信息包括的导频和信道，确定反馈信息，该反馈信息是信道相关函数。反馈信息用于指示训练数据的预处理。比如，反馈信息指示预编码矩阵(precoding matrix，pmi)，用于指示训练数据需根据该预编码矩阵进行预编码处理。
[0345]
s404.第二通信装置接收反馈信息；该反馈信息用于确定训练数据。
[0346]
s405.第二通信装置根据反馈信息确定训练数据，并向第一通信装置发送训练数据。
[0347]
上述图20所示的实现框图中，第一通信装置包含一个神经网络，第二通信装置包含一个神经网络。另一种可选的实施方式中，第一通信装置和第二通信装置均可包含两个神经网络，如图22所示，第一通信装置设置有神经网络#1和神经网络#3，第二通信装置设置有神经网络#2和神经网络#4。神经网络#1用于向神经网络#2发送导频，神经网络#2用于向神经网络#3发送反馈信息，神经网络#3和神经网络#4用于传输。
[0348]
可见，本技术实施例中，第二通信装置向第一通信装置发送的训练数据，是根据第一通信装置反馈的反馈信息确定的，该方式可提高训练数据的可靠性，从而有利于提高第一通信装置根据该训练数据确定的第一中间梯度的可靠性，进而当第一通信装置将第一中间梯度反向传输给第二通信装置时，有利于提高对第一神经网络更新的可靠性。
[0349]
本技术实施例还提供一种梯度传输方法500，该梯度传输方法适用于信道在相干时间内不互易的通信场景。图23为该梯度传输方法500的流程示意图。该梯度传输方法500包括但不限于以下步骤：
[0350]
s501.第一通信装置根据信道信息以及接收到的训练数据确定第四中间梯度；第四中间梯度用于更新位于第二通信装置中第一神经网络的参数。
[0351]
一种可选的实施方式中，第一通信装置确定第四中间梯度之前，还接收来自第二通信装置的导频，然后根据该导频对信道进行估计，获得信道信息。
[0352]
一种可选的实施方式中，第一通信装置根据信道信息以及接收到的训练数据确定第四中间梯度，包括：第一通信装置根据训练数据确定第一中间梯度，然后将第一中间梯度与信道信息做乘积，获得第四中间梯度。从而第四中间梯度包括信道信息，第一通信装置向第二通信装置传输的是准确的梯度。
[0353]
s502.第一通信装置通过通信链路发送第四中间梯度。
[0354]
如图23所示，发送第四中间梯度的通信链路是不同与第一通信装置与第二通信装置之间的通信链路，该通信链路可以是无损链路。
[0355]
s503.第二通信装置接收第四中间梯度。
[0356]
s504.第二通信装置根据第四中间梯度，更新第一神经网络的参数。
[0357]
本技术实施的实现框图如图24所示，该实现框图中包括ifft和fft模块。可选的，该ifft模块和fft模块可替换为其他数据处理模块。或者，在该ifft模块和/或fft模块处理之前和/或之后，该通信系统还包括其他处理模块，该处理模块用于对数据进行处理。
[0358]
从图24中可以看出第一通信装置向第二通信装置发送第四中间梯度之前，对信道进行信道估计，获得信道信息h，然后根据该信道信息和训练数据确定发送给第二通信装置的第四中间梯度。由于第四中间梯度是通过通信链路发送给第二通信装置的，所以第二通信装置能获得准确的第四中间梯度，从而可根据该第四中间梯度更新第一神经网络的参数。
[0359]
本技术实施例还提供一种梯度传输方法600，该梯度传输方法600中，第一通信装置根据接收到的训练数据确定第一中间梯度，第一中间梯度用于更新位于第二通信装置中第一神经网络的参数；然后通过接收训练数据的通信链路向第二通信装置发送第一中间梯度和导频，进而第二通信装置根据该导频进行信道估计，获得信道信息，再根据该信道信息和第一中间梯度，获得第五中间梯度，该第五中间梯度也即为第二通信装置的准确的梯度，进而第二通信装置根据该第五中间梯度准确地更新第一神经网络的参数，完成对第一通信装置和第二通信装置的联合训练。
[0360]
为了实现上述本技术实施例提供的方法中的各功能，第一通信装置或第二通信装置可以包括硬件结构和/或软件模块，以硬件结构、软件模块、或硬件结构加软件模块的形式来实现上述各功能。上述各功能中的某个功能以硬件结构、软件模块、还是硬件结构加软件模块的方式来执行，取决于技术方案的特定应用和设计约束条件。
[0361]
如图25所示，本技术实施例提供了一种通信装置2500。该通信装置2500可以是第一通信装置的部件(例如，集成电路，芯片等等)，也可以是第二通信装置的部件(例如，集成电路，芯片等等)。该通信装置2500也可以是其他通信单元，用于实现本技术方法实施例中的方法。该通信装置2500可以包括：通信单元2501和处理单元2502。可选的，还可以包括存储单元2503。
[0362]
在一种可能的设计中，如图25中的一个或者多个单元可能由一个或者多个处理器来实现，或者由一个或者多个处理器和存储器来实现；或者由一个或多个处理器和收发器实现；或者由一个或者多个处理器、存储器和收发器实现，本技术实施例对此不作限定。所述处理器、存储器、收发器可以单独设置，也可以集成。
[0363]
所述通信装置2500具备实现本技术实施例描述的第一通信装置的功能，可选的，通信装置2500具备实现本技术实施例描述的第二通信装置的功能。比如，所述通信装置2500包括第一通信装置执行本技术实施例描述的第一通信装置涉及步骤所对应的模块或单元或手段(means)，所述功能或单元或手段(means)可以通过软件实现，或者通过硬件实现，也可以通过硬件执行相应的软件实现，还可以通过软件和硬件结合的方式实现。详细可进一步参考前述对应方法实施例中的相应描述。
[0364]
在一种可能的设计中，一种通信装置2500可包括：
[0365]
通信单元2501，用于接收训练数据；
[0366]
处理单元2502，用于根据所述训练数据确定第一中间梯度；所述第一中间梯度用于更新位于第二通信装置中第一神经网络的参数；
[0367]
处理单元2502，还用于将所述第一中间梯度映射到空口资源上，生成第一梯度信号；所述第一梯度信号包括一个或多个第一梯度符号，所述每个第一梯度符号对应第一中间梯度的一个或多个梯度值；
[0368]
通信单元2501，还用于向所述第二通信装置发送所述第一梯度信号。
[0369]
一种可选的实现方式中，所述第一中间梯度还用于更新位于第三通信装置中第二神经网络的参数；所述第三通信装置与所述第二通信装置之间建立有通信连接。
[0370]
一种可选的实现方式中，处理单元2502将所述第一中间梯度映射到空口资源上，生成第一梯度信号，具体用于：将所述第一中间梯度的梯度值转换为一个或多个第一梯度符号；将所述一个或多个第一梯度符号映射到空口资源上，生成第一梯度信号。
[0371]
一种可选的实现方式中，所述第一梯度符号是实数符号，处理单元2502将所述第一中间梯度的梯度值转换为一个或多个第一梯度符号，具体用于：将所述第一中间梯度包括的p个复数梯度值转换为2m个第一实数符号；所述p为正整数；所述m为小于或等于所述p的正整数；或者，将所述第一中间梯度包括的p个实数梯度值转换为m个第二实数符号；所述p为正整数；所述m为小于或等于所述p的正整数。
[0372]
另一种可选的实现方式中，所述第一梯度符号是复数符号，处理单元2502将所述第一中间梯度的梯度值转换为一个或多个第一梯度符号，具体用于：将所述第一中间梯度包括的p个复数梯度值转换为m个第一复数符号；所述p为正整数；所述m小于或等于所述p的正整数；或者将所述第一中间梯度包括的p个实数梯度值转换为m个第二复数符号；所述p为正整数；所述m为小于或等于的正整数。
[0373]
一种可选的实现方式中，处理单元2502将所述一个或多个第一梯度符号映射到空口资源上，生成第一梯度信号，具体用于：将所述m个第一复数符号的共轭或所述m个第二复数符号的共轭映射到空口资源上，生成第一梯度信号。
[0374]
一种可选的实现方式中，映射到所述空口资源上的第一中间梯度是功率归一化后的第一中间梯度。
[0375]
一种可选的实现方式中，所述通信单元2501还用于：向所述第二通信装置发送反馈信息；所述反馈信息用于确定所述训练数据。
[0376]
一种可选的实现方式中，所述处理单元2502将所述第一中间梯度映射到空口资源上，生成第一梯度信号，具体用于：将所述第一中间梯度与第一权重进行处理，获得加权的第一中间梯度；将所述加权的第一中间梯度映射到空口资源上，生成第一梯度信号。
[0377]
本技术实施例和上述所示方法实施例基于同一构思，其带来的技术效果也相同，具体原理请参照上述所示实施例的描述，不再赘述。
[0378]
在另一种可能的设计中，一种通信装置2500可包括：
[0379]
通信单元2501，用于接收一个或多个第二梯度信号；所述第二梯度信号是第一梯度信号经过信道后的信号；所述第一梯度信号是将第一中间梯度映射到空口资源上生成的；所述第一梯度信号包括一个或多个第一梯度符号，所述每个第一梯度符号对应第一中间梯度的一个或多个梯度值；所述第一中间梯度是根据训练数据确定的；所述第一中间梯度用于更新位于所述第二通信装置中第一神经网络的参数；
[0380]
处理单元2502，用于根据所述一个或多个第二梯度信号，确定第二中间梯度；
[0381]
处理单元2502，还用于根据所述第二中间梯度更新所述第一神经网络的参数。
[0382]
一种可选的实现方式中，所述第二梯度信号包括2m个第三实数符号，所述第三实数符号是第一实数符号经过信道后的信号；所述m为正整数；所述处理单元2502根据所述一个或多个第二梯度信号，确定第二中间梯度，具体用于：将所述2m个第三实数符号转换为第二中间梯度的m个复数梯度值。
[0383]
另一种可选的实现方式中，所述第二梯度信号包括m个第四实数符号，所述第四实数符号是第二实数符号经过信道后的信号；所述m为正整数；所述处理单元2502根据所述一个或多个第二梯度信号，确定第二中间梯度，具体用于：将所述m个第四实数符号确定为第二中间梯度的m个实数梯度值。
[0384]
又一种可选的实现方式中，所述第二梯度信号包括m个第三复数符号，所述第三复数符号是第一复数符号经过信道后的信号；所述m为正整数；所述处理单元2502根据所述一个或多个第二梯度信号，确定第二中间梯度，具体用于：将所述m个第三复数符号转换为第二中间梯度的m个复数梯度值。
[0385]
又一种可选的实施方式中，所述第二梯度信号包括m个第四复数符号，所述第四复符号是第二复数符号经过信道后的信号；所述m为正整数；所述处理单元2502根据所述一个或多个第二梯度信号，确定第二中间梯度，具体用于：将所述m个第四复数符号转换为第二中间梯度的2m个实数梯度值。
[0386]
一种可选的实现方式中，所述处理单元2502还用于：根据所述第二中间梯度生成第三中间梯度；将所述第三中间梯度映射到空口资源上，生成第三梯度信号；所述第三梯度信号包括一个或多个第二梯度符号，所述每个第二梯度符号对应第三中间梯度的一个或多个梯度值；向第三通信装置发送所述第三梯度信号；所述第三通信装置与所述第二通信装置之间建立有通信连接。
[0387]
一种可选的实施方式中，所述处理单元2502将第三中间梯度映射到空口资源上，生成第三梯度信号，具体用于：将第三中间梯度的梯度值转换为一个或多个第二梯度符号；将该一个或多个第二梯度符号映射到空口资源上，生成第三梯度信号。
[0388]
一种可选的实施方式中，第二梯度符号是实数符号，所述处理单元2502将第三中间梯度的梯度值转换为一个或多个第二梯度符号，具体用于：将第三中间梯度包括的m个复数梯度值转换为2n个第五实数符号；m为正整数；n为小于或等于m的正整数；或者，将第一中间梯度包括的m个实数梯度值转换为n个第六实数符号；m为正整数；n为小于或等于m的正整数。
[0389]
另一种可选的实施方式中，第二梯度符号是复数符号；所述处理单元2502将第三中间梯度的梯度值转换为一个或多个第二梯度符号，具体用于：将第三中间梯度包括的m个复数梯度值转换为n个第五复数符号；m为正整数；n小于或等于m的正整数；或者将第三中间梯度包括的m个实数梯度值转换为n个第六复数符号；m为正整数；n为小于或等于的正整数。
[0390]
一种可选的实施方式中，所述处理单元2502将一个或多个第二梯度符号映射到空口资源上，生成第三梯度信号，具体用于：将n个第五复数符号的共轭或n个第六复数符号的共轭映射到空口资源上，生成第三梯度信号。
[0391]
本技术实施例和上述所示方法实施例基于同一构思，其带来的技术效果也相同，具体原理请参照上述所示实施例的描述，不再赘述。
[0392]
本技术实施例还提供一种通信装置2600，图26为通信装置2600的结构示意图。所述通信装置2600可以是第一通信装置或第二通信装置，也可以是支持第一通信装置实现上述方法的芯片、芯片系统、或处理器等，还可以是支持第二通信装置实现上述方法的芯片、芯片系统、或处理器等。该装置可用于实现上述方法实施例中描述的方法，具体可以参见上
述方法实施例中的说明。
[0393]
所述通信装置2600可以包括一个或多个处理器2601。所述处理器2601可以是通用处理器或者专用处理器等。例如可以是基带处理器、数字信号处理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件或中央处理器(central processing unit，cpu)。基带处理器可以用于对通信协议以及通信数据进行处理，中央处理器可以用于对通信装置(如，基站、基带芯片，终端、终端芯片，du或cu等)进行控制，执行软件程序，处理软件程序的数据。
[0394]
可选的，所述通信装置2600中可以包括一个或多个存储器2602，其上可以存有指令2604，所述指令可在所述处理器2601上被运行，使得所述通信装置2600执行上述方法实施例中描述的方法。可选的，所述存储器2602中还可以存储有数据。所述处理器2601和存储器2602可以单独设置，也可以集成在一起。
[0395]
存储器2602可包括但不限于硬盘(hard disk drive，hdd)或固态硬盘(solid-state drive，ssd)等非易失性存储器，随机存储记忆体(random access memory，ram)、可擦除可编程只读存储器(erasable programmable rom，eprom)、只读存储器(read-only memory，rom)或便携式只读存储器(compact disc read-only memory，cd-rom)等等。
[0396]
可选的，所述通信装置2600还可以包括收发器2605、天线2606。所述收发器2605可以称为收发单元、收发机、或收发电路等，用于实现收发功能。收发器2605可以包括接收器和发送器，接收器可以称为接收机或接收电路等，用于实现接收功能；发送器可以称为发送机或发送电路等，用于实现发送功能。
[0397]
所述通信装置2600为第一通信装置：收发器2605用于执行上述梯度传输方法100中的s101、s104，以及用于执行梯度传输方法200中的s202、s205，以及用于执行梯度传输方法400中的s402、s403，以及执行梯度传输方法500中的s502；处理器2601用于执行梯度传输方法100中的s102、s103，以及用于执行梯度传输方法200中的s203、s204，以及执行梯度传输方法500中的s501。
[0398]
所述通信装置2600为第二通信装置：收发器2605用于执行梯度传输方法100中的s105，以及用于执行梯度传输方法200中的s206，以及用于执行梯度传输方法300中的s303，以及用于执行梯度传输方法400中的s401、s404，以及用于执行梯度传输方法500中的s503；处理器2601用于执行梯度传输方法100中的s106、s107，以及用于执行梯度传输方法200中的s207、s208，以及用于执行梯度传输方法300中的s301、s302，以及用于执行梯度传输方法400中的s405，以及用于执行梯度传输方法500中的s504。
[0399]
所述通信装置2600为第三通信装置：收发器2605用于执行梯度传输方法300中的s303；处理器2601用于执行梯度传输方法300中的s304、s305。
[0400]
另一种可能的设计中，处理器2601中可以包括用于实现接收和发送功能的收发器。例如该收发器可以是收发电路，或者是接口，或者是接口电路。用于实现接收和发送功能的收发电路、接口或接口电路可以是分开的，也可以集成在一起。上述收发电路、接口或接口电路可以用于代码/数据的读写，或者，上述收发电路、接口或接口电路可以用于信号的传输或传递。
[0401]
又一种可能的设计中，可选的，处理器2601可以存有指令2603，指令2603在处理器2601上运行，可使得所述通信装置2600执行上述方法实施例中描述的方法。指令2603可能
固化在处理器2601中，该种情况下，处理器2601可能由硬件实现。
[0402]
又一种可能的设计中，通信装置2600可以包括电路，所述电路可以实现前述方法实施例中发送或接收或者通信的功能。本技术实施例中描述的处理器和收发器可实现在集成电路(integrated circuit，ic)、模拟ic、射频集成电路rfic、混合信号ic、专用集成电路(application specific integrated circuit，asic)、印刷电路板(printed circuit board，pcb)、电子设备等上。该处理器和收发器也可以用各种ic工艺技术来制造，例如互补金属氧化物半导体(complementary metal oxide semiconductor，cmos)、n型金属氧化物半导体(nmetal-oxide-semiconductor，nmos)、p型金属氧化物半导体(positive channel metal oxide semiconductor，pmos)、双极结型晶体管(bipolar junction transistor，bjt)、双极cmos(bicmos)、硅锗(sige)、砷化镓(gaas)等。
[0403]
以上实施例描述中的通信装置可以是第一通信装置或第二通信装置，但本技术实施例中描述的通信装置的范围并不限于此，而且通信装置的结构可以不受图26的限制。通信装置可以是独立的设备或者可以是较大设备的一部分。例如所述通信装置可以是：
[0404]
(1)独立的集成电路ic，或芯片，或，芯片系统或子系统；
[0405]
(2)具有一个或多个ic的集合，可选的，该ic集合也可以包括用于存储数据，指令的存储部件；
[0406]
(3)asic，例如调制解调器(modulator)；
[0407]
(4)可嵌入在其他设备内的模块；
[0408]
(5)接收机、终端、智能终端、蜂窝电话、无线设备、手持机、移动单元、车载设备、网络设备、云设备、人工智能设备等等；
[0409]
(6)其他等等。
[0410]
对于通信装置可以是芯片或芯片系统的情况，可参见图27所示的芯片的结构示意图。图27所示的芯片2700包括处理器2701和接口2702。其中，处理器2701的数量可以是一个或多个，接口2702的数量可以是多个。所述芯片2700还可包括存储器2703。
[0411]
一种设计中，对于芯片用于实现本技术实施例中第一通信装置的功能的情况：
[0412]
所述接口2702，用于接收训练数据；
[0413]
所述处理器2701，用于根据所述训练数据确定第一中间梯度；所述第一中间梯度用于更新位于第二通信装置中第一神经网络的参数；
[0414]
所述处理器2701，还用于将所述第一中间梯度映射到空口资源上，生成第一梯度信号；所述第一梯度信号包括一个或多个第一梯度符号，所述每个第一梯度符号对应第一中间梯度的一个或多个梯度值；
[0415]
所述接口2702，还用于向所述第二通信装置发送所述第一梯度信号。
[0416]
另一种设计中，对于芯片用于实现本技术实施例中第二通信装置的功能的情况：
[0417]
所述接口2702，用于接收一个或多个第二梯度信号；所述第二梯度信号是第一梯度信号经过信道获得的；所述第一梯度信号是将第一中间梯度映射到空口资源上生成的；所述第一梯度信号包括一个或多个第一梯度符号，所述每个第一梯度符号对应第一中间梯度的一个或多个梯度值；所述第一中间梯度是根据训练数据确定的；所述第一中间梯度用于更新位于所述第二通信装置中第一神经网络的参数；
[0418]
所述处理器2701，用于根据所述一个或多个第二梯度信号，确定第二中间梯度；
[0419]
所述处理器2701，还用于根据所述第二中间梯度更新所述第一神经网络的参数。
[0420]
本技术实施例中通信装置2600、芯片2700还可执行上述通信装置2500所述的实现方式。本领域技术人员还可以了解到本技术实施例列出的各种说明性逻辑块(illustrative logical block)和步骤(step)可以通过电子硬件、电脑软件，或两者的结合进行实现。这样的功能是通过硬件还是软件来实现取决于特定的应用和整个系统的设计要求。本领域技术人员可以对于每种特定的应用，可以使用各种方法实现所述的功能，但这种实现不应被理解为超出本技术实施例保护的范围。
[0421]
本技术实施例和上述梯度传输方法100至梯度传输方法500所示方法实施例基于同一构思，其带来的技术效果也相同，具体原理请参照上述梯度传输方法100至梯度传输方法500所示实施例的描述，不再赘述。
[0422]
本领域技术人员还可以了解到本技术实施例列出的各种说明性逻辑块(illustrative logical block)和步骤(step)可以通过电子硬件、电脑软件，或两者的结合进行实现。这样的功能是通过硬件还是软件来实现取决于特定的应用和整个系统的设计要求。本领域技术人员可以对于每种特定的应用，可以使用各种方法实现所述的功能，但这种实现不应被理解为超出本技术实施例保护的范围。
[0423]
本技术还提供了一种计算机可读存储介质，用于储存计算机软件指令，当所述指令被通信装置执行时，实现上述任一方法实施例的功能。
[0424]
本技术还提供了一种计算机程序产品，用于储存计算机软件指令，当所述指令被通信装置执行时，实现上述任一方法实施例的功能。
[0425]
本技术还提供了一种计算机程序，当其在计算机上运行时，实现上述任一方法实施例的功能。
[0426]
上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机指令时，全部或部分地产生按照本技术实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line，dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如，软盘、硬盘、磁带)、光介质(例如，高密度数字视频光盘(digital video disc，dvd))、或者半导体介质(例如，固态硬盘(solid state disk，ssd))等。
[0427]
以上所述，仅为本技术的具体实施方式，但本技术的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本技术揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本技术的保护范围之内。因此，本技术的保护范围应以所述权利要求的保护范围为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：徐晨张公正王坚李榕王俊
技术所有人：华为技术有限公司
我是此专利的发明人

上一篇：用于外科手术期间的计算机辅助导航的外科系统的制作方法
上一篇：一种可降解复合聚酯材料及其应用的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。