大规模mimo线性检测中矩阵求逆的硬件构架及方法
【技术领域】
[0001] 本发明属于计算机通信领域。特别涉及一种大规模MM0线性检测中矩阵求逆的 硬件构架及方法。
【背景技术】
[0002] 在无线通信传输环境下采用多个发送天线和多个接收天线的系统称为多输入多 输出MM0系统。研宄表明,MM0无线传输技术可以在不增大额外频谱带宽的条件下能大 大提高传输链路的可靠性,减少基站能量消耗,以及成倍地提高通信系统容量。MIM0作为无 线通信的关键技术,已经被纳入第四代移动通信标准,如3GPPLTE等。
[0003] 随着下一代移动通信技术的进一步发展和需要,MM0技术已经从传统的单用户 MMO(SU-MMO)系统扩展到了多用户MMO(MU-MMO)系统,从小规模MM0(SmallMM0)发 展到大规模MIMO(MassiveMIM0)。传统地,LTE标准支持在基站最高配置8根天线。而发 送端或接收端配置的天线数越多,传输信道能够提供更高的自由度,在吞吐率和线路稳定 上能实现更好的性能。因为多用户系统可以同时传输服务几个用户,而且在选择接待具体 用户调度方面更加灵活,所以这个增益在多用户系统中更加可观。
[0004] 对于大规模MM0系统,相对于当下已经建成的系统,其天线阵列配置更多天线, 其数量达到上百或更多。大规模MIMO需要前所未有的的天线数,同时服务相对数量小得多 的用户,这种数量上的不对称使其与现实更加吻合,而且提供了更加可靠和可操作的条件。 这种技术能保证进一步提高频谱利用率和线路稳定性。并且可以预见,在大规模MM0系统 中,每个天线单元需要极少的能量(达到毫瓦级),相比传统的小规模MIMO系统,其具有更 大的潜力降低在基站消耗的能量.
[0005] 然而,大规模MM0的优势是以在基站端的急剧增加的计算复杂度为代价,它相应 地大大增加了硬件的复杂度。信号检测,作为下一代移动通信技术的关键技术之一,其最 佳信号检测器的复杂度就随着发射天线数增大而增大。特别地,当基站天线数达到上百, 传统的小规模MM0系统变为大规模MM0系统时,我们需要新的检测理论来适应扩展到 高维的问题,可靠的上行线路检测技术就变得非常重要了。因为最佳检测方法如最大似 然检测(maximum-likelihooddetection)和球形译码(spheredecoding)等要求过高 的硬件复杂度,我们必须采取低复杂度的次最佳线性检测机制或者随机技术(stochastic technique),如基于马尔科夫链的蒙特卡罗检测方法(Markov-chainMonte-Carlo-based detectionmethods)等。
[0006] 近期的主流文献中,基于大规模MMO,且易于硬件实现的低复杂度的线性检测技 术,其主要的计算复杂度在于一个MXM阶矩阵的求逆,其中M为用户天线数。传统的矩阵求 逆方法,如QR分解法、高斯消元法和Cholesky分解法等精确求逆方法,其复杂度在于0 (M3) 数量级。在规模MIMO系统中,当M变得较大时,其复杂度将会急剧增大,会耗费系统大量计 算资源或增大延迟时间。
【发明内容】
[0007] 发明目的:本发明的目的在于针对现有技术的不足,提供了一种硬件复杂度低、计 算高效率且减少了延迟时间的大规模MMO线性检测中矩阵求逆的硬件构架及方法。
[0008] 技术方案:本发明提供了一种大规模MMO线性检测中矩阵求逆的硬件构架,包括 预计算模块和矩阵求逆子模块,其中,所述预计算模块包括下三角脉动乘法器、加法器、共 轭转置模块、倒数模块、取反模块和向量乘法器,所述下三角脉动乘法器分别与所述加法器 和共轭转置模块连接,所述加法器依次通过倒数模块和取反模块与所述向量乘法器连接, 所述共轭转置模块与所述向量乘法器连接,所述矩阵求逆子模块为IIR滤波器结构,所述 预计算模块中的向量乘法器和倒数模块分别于所述矩阵求逆子模块连接。
[0009] 进一步,所述下三角脉动乘法器中包括MXM个乘累加器,M为用户的数量。
[0010] 进一步,所述向量乘法器包括M个乘法器和M个寄存器,所述每个乘法器与一个寄 存器相连。
[0011] 本发明还提供了一种基于上述大规模MMO线性检测中矩阵求逆的硬件构架的求 逆方法,包括以下步骤:
[0012] 步骤1 :将矩阵的比特流输入预计算模块中的下三角脉动乘法器,得到矩阵G, 其中,G=HhH,H表示MMO系统的信道响应矩阵,Hh表示MMO系统的信道响应矩阵的转置 矩阵,H#表示矩阵H的共轭矩阵;
[0013] 步骤2 :矩阵G对角线上的元素输入到加法器中与噪声系数队相加,得到向量 D - ,^22 ] *
[0014] 步骤3 :矩阵G非对角线上的元素输入共轭转置模块得到MXM阶矩阵E;
[0015] 步骤4 :步骤2获得向量5依次通过倒数模块和取反模块,获得向量卜D^
[0016] 步骤5 :向量(-if1)和矩阵E输入向量乘法器,获得矩阵C;
[0017] 步骤6 :将矩阵C和矩阵IT1输入至矩阵求逆子模块,根据公5
1获 得需要求逆矩阵A,1,其中k为迭代次数,n为迭代次数的编号,矩阵IT1为以向量对应元 素构成的对角矩阵。
[0018] 进一步,所述步骤1中矩阵G的获得方法为:H#矩阵元素的比特流按列输入,每后 一列比前一列延时一个时钟输入,一个时钟内每列输入一个元素,每列元素流到对角线单 元就取共轭并转向下一层计算单元;各元素在计算单元里进行乘累加计算。
[0019] 进一步,所述步骤4中倒数模块获得向量5+1的方法为,通过FPGA查找表单元对向 量D的每个元素取倒数。
[0020] 工作原理:本发明首先提出了一种基于若依曼级数近似求逆的迭代计算硬件结 构,通过这种结构组成基本矩阵求逆子模块BM,这是IIR滤波器第一次基于诺依曼级数近 似理论计算逆矩阵的创造;然后再根据整个系统输入和BP输入需要设计了预计算模块PM; 通过将两个模块PM和BM连接,组成了可用于大规模MMO线性检测的矩阵求逆硬件架构。 本发明适用于多种大规模MMO线性检测系统,其中的基本矩阵求逆子模块BM作为一个核 心计算单元也适用于多种大规模MIMO线性预编码的系统;。
[0021] 有益效果:与现有技术相比,本发明中的计算单元为加法器和乘法器,因此非常适 合硬件实现;成功从现有技术的〇(M3)数量级的复杂度降到0(M2),大大降低了计算复杂度 和硬件代价;核心计算模块BM使用了IIR滤波器结构,这是IIR滤波器第一次基于诺依曼 级数近似理论计算逆矩阵的创造;虽然BM使用了近似求逆计算,但迭代计算可以得到任意 精度的准确度;取不同迭代次数达到不同准确度为系统性能不同配置要求提供了丰富的灵 活度,且取不同迭代次数不需要改变硬件结构,不花费额外的硬件代价。子模块BM能适用 于多种大规模MIMO线性检测和线性预编码系统,其兼容性好。
【附图说明】
[0022] 图1是本发明一种基于大规模MMO线性检测的矩阵求逆硬件架构图;
[0023] 图2是下三角脉动矩阵乘法器结构示意图;
[0024] 图3是向量乘法器结构示意图;
[0025] 图4是采用本发明近似求逆方法与Cholesky分解精确求逆方法误码率曲线对比 图。
【具体实施方式】
[0026] 下面结合附图和具体实例,对本发明提出的一种大规模MIM0线性检测中矩阵求 逆的硬件构架进行具体说明。
[0027] 首先建立一个大规模MM0系统模型:考虑一个大规模MM0系统上行线路,在基站 端配置N根天线,同时服务M个单天线用户,其中天线数N远远大于M。描述模型如下:
[0028] y=Hs+n;
[0029] 其中,H为用户到基站的NXM维度的信道传输响应矩阵,且H= [h,h2, . . .,hM], hj表示H的第j个列向量;s=[ss2, . . .,sM]T为用户