与英伟达的NVlink相似,AMD则推出了其Infinity Fabric技术,AMD Infinity 架构与第二代 AMD EPYC处理器一同推出,使系统构建者和云架构师能够释放最新的服务器性能,同时又不牺牲功能、可管理性或帮助保护组织最重要资产(数据)的能力。Infinity Fabric支持芯片间、芯片对芯片,以及即将推出的节点对节点的数据传输。
英特尔则是以太网的坚实拥护者,英特尔的用于生成式AI的Gaudi AI芯片则一直沿用传统的以太网互联技术。Gaudi 2每个芯片使用了24个100Gb以太网链路;Gaudi 3也使用了24个200Gbps以太网RDMA NIC,但是他们将这些链路的带宽增加了一倍,达到200Gb/秒,使芯片的外部以太网I/O总带宽达到8.4TB/秒。
拼服务
诸如ChatGPT这样的生成式AI开发任务极其复杂,大模型需要在多台计算机上运行数十亿到数万亿个参数,它需要在多个GPU上并行执行工作,采用张量并行、流水线并行、数据并行等多种并行处理方式,以尽可能快地处理任务。
因此,如何能够帮助用户更快的开发,提供良好的服务也是关键一役。
在这方面,英伟达推出了一种新型的软件NIMS,即NVIDIA Inference Microservices(推理微服务)。黄仁勋称之为“盒子里的人工智能”,NIMS中包含了英伟达的CUDA、cuDNN、TensorRT、Triton。NIMS 不仅使部署 AI 变得更容易,只需几分钟而不是几个月,它们还构成了客户可以创建新应用程序和解决新问题的构建块。如果采用,NIMS 将有助于加速创新并缩短价值实现时间。Nvidia 还宣布,NIMS 现在可供开发人员和研究人员免费使用。在生产中部署NIMS需要AI Enterprise许可证,每个GPU的价格为4500美元。
结语
下一场AI之战已然打响,综合来看,当前AI芯片市场上,英伟达、AMD和英特尔等主要芯片巨头正在展开激烈的竞争。他们不仅在速度、技术和工艺方面竞相创新,还在互联和服务等领域积极拓展,致力于为用户提供更快、更强、更智能的AI解决方案。AI芯片争霸战仍在继续,谁能最终胜出?让我们拭目以待。
(原标题:下一代AI芯片,拼什么?)