我们采用硬件功能单元精湛的流水线和时分复用(TDM)功能,以达到WiMAX OFDM符号的实时要求。
除了高数据率外,在架构设计指导过程中控制子模块时延也是一个重要的问题。我们通过引入连续信道矩阵的TDM解决了时延问题。这种方法可以延长同一信道矩阵元之间的处理时间,同时还能保持较高的数据吞吐量。构成TDM组的信道数会随着子模块的不同而变化。在TDM方案中,信道矩阵求逆过程用了5个信道,而有 15个信道在实数QR分解模块中进行了时分复用。图 2 是该系统的高级流程图。
图 2. MIMO 802.16e 宽带无线接收器的高级流程图
信道矩阵预处理
信道矩阵预处理器确定了空分复用复合信号每一层的最佳检测次序。该预处理器负责计算信道矩阵的伪逆矩阵范数,并根据这些范数,选择待处理的下一个传输流。伪 逆矩阵中范数最小的行对应着最强传输流(检波后噪声放大最小),而范数最大的行对应着质量最差的层(检波后噪声放大最大)。我们的实施方案首先检测最弱的 层,然后按最低噪声放大到最高噪声放大的次序逐层检测。对排序过程中的每一步,信道矩阵中相应的列随后会被清空,然后简化后的矩阵进入下一级的天线排序处 理流水线。
在预处理算法中,伪逆矩阵的计算要求最高。这个过程的核心是矩阵求逆,通常通过吉文斯(Givens)旋转进行QR分解来实现。常用的角度估算和平面旋转算法(如CORDIC)会造成严重的系统时延,对我们的系统来说是不可接受的。因此,我们的目标是运用FPGA的嵌入式DSP资 源(比如Virtex-5器件中的DSP48E),找出矢量旋转和相位估算的替代性解决方案。
QRD的脉动阵列结构由两种类型的处理单元构 成--对角线单元或边界单元和非对角线单元或内部单元。边界单元执行矢量函数,可以生成阵列内部单元使用的旋转角度。要想得到想要的旋转角度,可以把非对 角线单元中的值与对角线单元中的共轭复数相乘,然后除以复数的倒数即可。相除实际是用乘法的方式完成的,即在观察到函数接近线性的时候,乘以根据定义的间 隔的多项式近似值计算出的倒数。图3显示了采用这种近似值在对角线脉动单元中完成这种复杂旋转的信号流程图。