数据爆炸式增长和信息技术发展要求更高的数据传输速度、可靠性和效率。高速互联解决方案因此诞生,通过增强带宽、降低延迟和提升吞吐量,优化传输效率和系统性能,同时降低功耗成本。
例如,在AI领域,高速互联技术能显著提高算力的利用率,降低训练时间,加速AI应用落地。在AI应用爆火的今天,高速互联解决方案成为不可缺少的一环,为AI等新兴技术的发展提供坚实基础,也是高速互联方案提供商的使命。
得益于数据中心、云计算、AI和超算应用迅速崛起,Credo Technology(以下简称Credo)在近年来也获得了加速发展。Credo Technology销售副总裁杨学贤(Simon Yang)表示:“中国有很多大型数据中心运营商希望找到128x400G端口的交换机和2X200G NIC卡的连接方案。”
针对中国市场的AI/ML网络连接需求,Credo在今年的CIOE展期间,发布了全新的AEC有源电缆产品。该电缆一端采用400G端口,另外一端是两个200G端口(2x100G Q112和4×50G Q56)。在此基础上,新AEC有源线缆支持不同类型的200G NIC和400G交换机之间的连接。除了1*400G+2*200G端口的线缆之外,该公司也可提供1*400G+1*400G(即两头都是400G)直连的AEC有源线缆。
HiWire SHIFT AEC,上图左端是400G端口,右端是两个200G端口(2x100G Q112和4×50G Q56)
针对中国市场的AEC新品
AEC是Credo在2019年推出的创新性产品。此前,业内经常用无源的DAC粗线缆来做连接,当数据速率来到400G、800G和1.6T时,DAC线缆就会变得越来越粗重,其信号也随速率提升大幅度衰减,该特点导致DAC线缆无法在高速连接中实现规模商用。因此,Credo把芯片置入线缆两端的连接头内,制造出了一种有源的AEC线缆。
在线缆两端植入芯片之后,无论是400G、800G还是1.6T,这些线缆都能保持比较细的线径,还可在这些高速率应用中大规模商用。目前,AEC线缆产品已经在一些北美互联网大厂的AI应用中得到了使用。随着国内互联网企业看到了AEC在AI应用中的价值,他们开始关注怎么把AEC用到国内数据中心中。
“我们今年专门针对中国市场AI/ML网络连接需求,根据其数据中心的速率、场景差异性和限制,开发了专门针对国内需求的、适用于400G Q112网络接口的HiWire SHIFT AEC(有源电缆Active Electrical Cables)新系列产品。”杨学贤介绍说,该系列包括400G QSFP-Q112、200G QSFP-56和200G QSFP-112等多种速率产品,相较于AOC,MTBF(平均故障间隔时间)大幅度延长,确保了极高的可靠性。它们特别适用于中国超级数据中心,支持低功耗和高可靠性,以及AI服务器与交换机之间的高速互连。
Credo的营销副总裁Chris Collins介绍道,HiWire SHIFT AEC覆盖了100G至1.6T速率,相比AOC产品,AEC在成本和功耗上具有明显优势,这归功于集成了Credo自研的采用自有DSP技术的retimer芯片的有源电缆。在AI/ML领域,AEC因其比光缆高出一到两个数量级的连接可靠性而受到互联网大厂的关注和应用,帮助客户大幅提高算力集群的利用率。
在介绍有源电缆背后的故事时,杨学贤还透露说,“在几年前,我们首次向外界介绍有源电缆(AEC)时,当时许多人并没有意识到,这是一个很有价值的产品。在经过四、五年的发展之后,AEC改变了行业的一些规则。当全球领先的厂商展示基于铜缆的AI应用时,很多人才感叹说‘想不到还有这样的创新’,而Credo五年前就在做开发和应用工作。所以说,我们的技术团队通过不断创新,改变了行业的一些游戏规则。”
凭借创新的技术,客户逐渐认识到Credo的价值,也开始采用其创新产品。他进一步解释说:“我们的客户也有类似的创新理念,他们在行业中据有颠覆性的想法。比如说,像特斯拉和微软这样的大型企业,他们在AI领域做了很多创新性的工作,我们的芯片是支撑他们创新工作的底层的砖和瓦。”
从IP、芯片,到全套高速互联解决方案
如今,Credo在行业深耕已经16年。Credo于2008在成立,在上海、香港、台湾、圣何塞、武汉、南京等地设有办公室。
Chris Collins说:“Credo的技术基础源于自有的IP,经过了16年的发展,已经形成了清晰的技术路线。我们设计平衡了性能、功耗、面积和大规模生产等因素,从28纳米到3纳米工艺的演进中不断突破技术边界,例如在SerDes产品线上提升插损极限,并已量产单波50G和100G产品。”
Credo首先推出的的IP产品,再推出芯片及系统解决方案。实际上,芯片间的互联技术和设备间的互联的技术上差距很大。其策略是“基于不同节点的互联要求,推出对应的产品系列及产品线。”
数据中心设备包括各种交换机和服务器,这些设备内置有芯片。Credo提供的IP和Chiplet可以解决芯片内部的片芯到片芯封装级别的互联;PHY芯片产品可解决设备内部PCB板存在的芯片间的连接,这种连接到背板或者前面板上;在设备外的互联中,还有芯片到模组的互联,Credo可提供不同速率的光DSP芯片;在机架间的互联需求中,Credo可提供AEC产品。
因此,Credo提供的高速互联方案,涵盖从芯片封装级的die-to-die,chip-to-chip、chip-to-module,一直到设备之间、不同机架之间的互联,都有对应的技术和产品,可提供端到端的解决方案。除了前面详细介绍的AEC产品之外,杨学贤还介绍了公司的IP、光芯片、LRO、P3盒子等产品及方案。
针对IP,Credo创始团队通过不断打磨、优化技术,到2015年迎来首个IP授权客户。
在推出IP产品之后,Credo的技术团队在大客户的支持下,再基于公司的高速串行连接技术,研发量产了PHY Retimer芯片。截至目前,该芯片仍是Credo稳定增长的产品线之一,这也为其后面的产品打下了坚实的基础。”
随着连接形态越来越多、端口也越来越复杂,比如100G、200G、400G和800G有时候混在一起,就要考虑如何能够把系统搭建得更完美。2023年,Credo发布了P3(Pluggable Patch Panel)盒子,将不同速率和端口的光模块连接集中在一起,以此来解决整个系统级互联问题的产品。
另外,在数据中心和AI基础设施不断扩大规模和提升速度的过程中,能耗问题也日益凸显。800G网络容量的增加让收发器的功耗问题成为焦点,高数据传输速率可能增加能耗,引发数据中心散热和能源成本问题。现有的LPO方案受互操作性,依赖链路和故障排除能力等技术限制,降低了大家的部署热情。
对此,Credo创新性的提出了线性接收光路(LRO)解决方案,该方案仅将DSP保留在光收发器的发射端,并移除了一半的DSP。该方案可保证光纤上拥有完美高质量、符合标准的光信号,还能达到与完整DSP方案一样的效果。这种DSP减半的方案,不但可以节省功耗,而且还能保持较好的网络性能。
Credo AEC有源电缆、IP 产品、PHY Retimer 芯片、LRO解决方案和P3盒子等产品,不仅满足了客户对高速、可靠、低功耗互联的需求,也为中国数据中心的建设和AI/ML产业的发展提供了强有力的支持。
小结
2022年1月,Credo在纳斯达克上市,这代表了该公司发展的新阶段。杨学贤介绍说:“公司在IPO时融资了2.20亿美元,在2023年12月再次融资1.75亿美元。所以,我们有非常充足的资金,来推动下一步的发展。截至最新的报告期,我们有4亿美元现金,来推动公司新的发展征程。根据Credo 2025财年Q1财报,其营业收入较去年同期同比增长了70%左右。”
杨学贤强调说:“公司非常看重在中国市场的客户。目前,Credo总共有约550名员工,在国内有完整的研发、运营、销售、技术支持团队,这是我们能够持续迭代的重要保证。随着中国数字经济的快速发展,Credo也将继续深耕中国市场,助力中国数字化转型升级。”