1、引言
在IEEE规范下光模块PAM4光眼图会进行TDECQ测试,其中有一个叫CRU(Clock Recovery Unit)的模块很不显眼。但是如果测试工程师在搭建测试平台时忽略这个模块的影响,就可能会导致测到的TDECQ不准确。
2、为何非CRU不可?
下图分别是从802.3bm标准文档中截取的TDEC测试框图、IEEE802.3bs标准中截取的TDECQ测试框图。其中CRU的目的都是从数据中恢复时钟,以提供触发给采样示波器。在之前单通道25G以下 NRZ光眼图的产线测试中似乎可以省掉CRU模块,直接从误码仪给一路触发时钟到采样示波器得到的光眼图也差不多。为什么到PAM4测试就需要了呢?
TDEC测试框图
TDECQ测试框图
造成测试结果差异的根本原因就是误码仪触发信号和模块光信号(PMD TX)会发生不同步的问题。在使用CRU从光信号中提取的时钟时,就可以避免该不同步的产生。如下是一个典型的400G光模块工作场景,我们简单看下它的信号发送部分。首先交换机中的Serdes芯片将8路50Gbps PAM4信号输入模块,该信号再经过数字处理转换为4路100Gbps PAM4信号,最后驱动激光器产生4路100Gbps光信号。
400G光模块架构
在这个结构中,速率转换芯片又被称为Gearbox IC,主要通过DSP技术实现。该芯片通过内置的数字CDR(Clock Data Recovery)进行信号整形,其高延迟的特性难以保证输入信号和输出信号之间的相位匹配。误码仪的触发时钟是和Gearbox IC输入信号同步的,而光信号是和Gearbox IC输出信号同步的,因此相位不匹配就导致了采样示波器测到眼图抖动过大。由此得出结论:单路100Gbps光模块PAM4光眼图的TDECQ测试中,CRU不能省。
数字CDR原理图
在高速NRZ光模块中虽然也存在CDR,但是都是基于模拟电路实现的。模拟CDR的延迟只有基于DSP技术的数字CDR的千分之一量级,较容易保证输入和输出信号的同步。最近比较火的Open Eye MSA中也有芯片设计厂家基于成本、功耗、时延等考量采用模拟CDR替代数字CDR的方案用于单通道50Gbps PAM4下的模块。在这些情况下,我们可以在产线测试中用误码仪时钟替代CRU以节省成本。
模拟CDR原理图
为了节省单通道100G光模块TDECQ的测试成本,有些芯片厂家会在DSP设计时就增加CDR的同步时钟输出接口,以给到采样示波器提供触发。
芯片时钟给到采样示波器触发
这种架构在原理上是可行的,但是在实际测试中发现使用芯片时钟得到的TDECQ可能比使用外置CRU的反而更好。造成这个差异的主要原因是协议规定CRU中PLL带宽只有10Mhz,会过滤掉光信号中的高频抖动成分。而芯片时钟输出可以做到和光信号完全同步。在光信号本身存在较大高频抖动分量时,用芯片时钟反而获得更好的TDECQ。以下面三幅眼图对比为例,同一个1Gbps NRZ信号在CRU PLL带宽为635kHz,1500kHz和5000kHz时的眼图存在明显差异。造成差异的原因就是这个1Gbps信号抖动频谱中包含了719kHz和1383kHz这两个高频分量。需要注意的是最终用户一般都会依据IEEE协议规范使用CRU测TDECQ,在产线使用芯片时钟输出做为触发可能会导致不符合规范要求的产品流到客户处。