发送到非对角线单元中的数据是旋转矢量的同相部分和正交部分除以相应的近似值得出的结果。我们不仅通过在对角线单元和非对角线单元采用流水线架构实现了高数据吞吐量,同时还通过对跨5个信道的硬件进行时分复用的方式控制了近似值模块和复杂乘法器引起的时延。
对4x4矩阵,我们使用了1个对角线单元和7个非对角线单元。分解单个矩阵所花的处理时间为4x4=16个数据周期,而该设计交付数据的速度是每三个时钟周 期一个样本,因此分解单个矩阵的所用总时长为3x4x4=48个时钟周期(低于可用的64个时钟周期)。我们对分解后的矩阵使用了回代法(back substitution),同时以相同的TDM方式进一步进行了重新排序操作。
球形检测器
球形检测器采用PED单元进行范数计算。根据树的层次,我们采用了三种不同类型的PED单元。根节点PED模块负责计算所有可能的PED。二级PED模块针 对上一级计算得出的8个幸存路径计算出8个可能的PED。这样在树的下一级索引中,我们就有64个生成的PED。第三种类型的PED模块用于其它树级,负 责计算上一级计算出的所有PED的最邻近的节点PED。
球形检测器(SD)的流水线架构可以在每个时钟周期中处理数据。其结果就是树的每级只需要一个PED模块。因此,对4x4 64-QAM系统而言,PED单元的总数为8,与树的级数相等。
SD可以采用硬解码和软解码两种类型的解码技术。硬解码能够用贯穿树的各级的最小距离矩阵度量次序;软解码用对数似然比来代表输出的每个比特。对数似然比一般被当作优先输入值提供给信道解码器,比如turbo解码器。
FPGA资源占用