GPU-CPO，国内首创,国内gpu公司大盘点

在英特尔、博通、Marvell、英伟达等巨头的联手推动下，CPO（co-packaged optics：共封装光学）这个概念越来越被人熟悉。尤其是在人工智能大模型推高数据中心数据流量传输、“超节点”日渐走红的当下，CPO被提上了紧急议程。

知名分析机构Yole也预测，为了解决数据中心面临的功率、密度、可扩展性、带宽和距离限制等问题，产业界正在推动从铜缆到光纤，从可插拔光模块到CPO的转变，这将带动CPO市场规模从2024年的4600万美元跃升到2030年的81亿美元，复合年增长率达137%。有见及此，除了文章开头提到的几家厂商以外，包括台积电、格罗方德等在内的传统巨头和不少初创企业也投入到了这个轰轰烈烈的CPO浪潮中。

CPO营收预期

作为全球领先的光电混合算力提供商，曦智科技也成为了这个技术的重要推动者。在近日开幕的2025世界人工智能大会（WAIC 2025）上，曦智科技联合燧原科技推出了国内首款xPU-CPO光电共封装原型系统，为本土的数据中心互连树立了一个新标杆。

光互连，大势所趋

归根到底，CPO的诞生，本质是激增的流量需求与电信号传输瓶颈的矛盾，驱动光互连发展的必然走向。

如文章开头所说，超大规模数据中心和云服务提供商的数据流量呈指数级增长，导致对网络基础设施带宽的需求大幅增加，伴之而来的首个要求，就是驱动交换机系统和以太网光纤提供越来越高的总带宽。不过我们也清楚，由于数据中心在设定之初，对功率和能耗等参数都有一个预设。换而言之，带宽的提升，必须要在一个可控的功率范围内实现，否则带来的改动将是昂贵的。

近年来，随着数据传输量的飞增以及数据传输速度要求的指数级增长，这种矛盾越来越突出。

曦智科技联合创始人，首席技术官孟怀宇博士在接受半导体行业观察采访的时候也直言：“光进铜退是过去几十年的一个主旋律。光通信一开始发力点是长距离的跨洋通信，后来逐渐进入更短的距离，目前在数据中心内部通信中已经成为主流。随着速率越来越高，光在越来越短的距离通信上取代铜，是一个不可逆的趋势。”以数据中心的应用为例，孟怀宇告诉半导体行业观察，当前数据中心机柜之间的互连已经默认使用光。但在十几年前，它们依然是铜。

之所以会发生这样的转变，是大家意识到铜的局限性越来越明显，光互连的成本也在下降。在看到第一个厂商尝到甜头并大获成功以后，大家就纷纷效仿，进而推动行业完成变革。在孟怀宇博士看来，同样的故事，也将在近期火热的超节点上演。

当前国际主流超节点方案是通过提升单机柜功耗来部署更多GPU，但受限于数据中心机柜的功耗天花板，GPU密度提升存在瓶颈。而在引入光互连技术之后，就可以通过增加机柜数量保障GPU总量从而构建超节点网络。相比铜缆，光缆的远距离传输优势为超节点带来交付与机柜解耦的核心价值：

1.突破规模上限：摆脱单机柜功耗束缚，支持万卡级弹性扩展；

2.激活存量设施：兼容现有机房供电与散热架构，降低部署成本；

3.灵活交付模式：可按算力需求动态调整节点规模，实现分阶段建设；

4.相比电缆（粗、重），光缆部署更加友好

事实上，数据中心中使用光互连，也不是什么新鲜事。

例如早在1995年就被广泛使用的可插拔光模块（根据设计的不同，可区分为DPO和LPO），就是数据中心的宠儿。但由于这种模块被安装在PCB边缘，ASIC则在封装基底上，这就让PIC/EIC与ASIC芯片之间拥有了较远的距离，而信号损耗随着距离的增长而变得更为明显。此外，这些模块的体积较大、互连密度低、功耗较大，随着使用的增多，会给系统带来很大的功耗负担。

DPO和LPO的区别

这就驱使业界在2020年左右提出了NPO（Near packaged optics：近封装光学）。

可插拔光模块和NPO的不同

如图所示，NPO架构将光引擎与封装ASIC相邻布局于光学基板上，二者通过高性能基板互连。根据OIF标准，NPO中ASIC与光学元件的间距可达150mm，同时确保信道损耗≤13dB。

不过，这依然不能满足客户。于是，将光器件和硅片集成在单一封装基板上，旨在应对下一代带宽、功耗和成本挑战的CPO应运而生。

CPO，蓄势待发

有关注数据中心内通信的读者应该有印象，在此前，英伟达曾引发了一波“光退铜进”的讨论。起因是该公司黄仁勋当时在介绍DGX GB200 NVL72时候表示：

“英伟达在整个系统中使用了长度合2英里共5000条NVLink线缆。如果将其切换成光学器件，就必须使用收发器和重定时器。仅这些收发器和重定时器就需要20000瓦功耗。但采用现在的方案，我们通过NVLink交换机完全免费完成了这项工作，并且节省了这些功耗用于计算。”

正是这番言论，引发了大家对光互连在数据中心应用前景的担忧。

每台交换机配备288条铜缆的 NVSwitch

姑勿论我们对英伟达的这种理解是否正确，抑或在当前他们真的觉得铜缆更好。但从他们在GTC 2025大会上发布了全球领先的硅光交换系统这个消息看来，英伟达是看好CPO的方向的。据他们介绍，与传统的可插拔光模块相比，创新的共封装硅光技术具有显著优势，包括功耗降低3.5倍、延迟更低以及网络可靠性显著提升。

从英伟达的这个“风波”，更是折射出国内发展CPO的势在必行。

众所周知，在数据中心通信中，大家公认的功耗三座大山分别是交换ASIC、光模块和SerDes。当中，对于担负数据传输重任的SerDes来说，还有一个不能规避的客观事实，那就是随着速率提升，功耗也要提升。而且，受到传输材料的影响，为了保证信号传输效果，就需要把距离缩短，CPO就是实现这个目标的一个方法。由此，我们可以看到做出使用铜缆决定的英伟达在SerDes的实力。

两种不同类型的2.5D CPO

如上图所示，借助先进封装，CPO技术能将光收发模块和控制操作的ASIC芯片异构集成到一起。这个设计不但缩短了芯片与模块之间的布线距离，还通过将光学引擎和电交换芯片封装在单个芯片中，形成具有一定功能的微系统。避开了BGA和LGA的管脚密度的限制，并以更短的导线驱动收发器，显著减少通道损耗，进而降低能耗。

孟怀宇博士也告诉半导体行业观察，之所以英伟达还在选择铜缆，是因为他们本身模拟设计就是世界一流，再加上他们在对先进工艺和数字纠错能力有很高要求的SerDes上面有很深的积累。“在当前的全球竞争态势下，国内的参与者是时候选择CPO了。尤其是考虑到当前供应链的成熟度，CPO蓄势待发。”孟怀宇博士表示，“相比传统光模块，CPO可以显著提高带宽与密度，降低功耗和成本，提高光互连可靠性。”

在WAIC 2025上，曦智科技联合燧原科技推出国内首款xPU-CPO光电共封装原型系统，通过将光学引擎与计算芯片（XPU）在基板上实现光电共封装，将电芯片与光芯片的传输距离缩短，大幅提升信号完整性并降低损耗，从而提升出口带宽并降低延迟。特别是与传统可插拔光模块相比，由于光电共封装技术可以让每个GPU内部都配有一个光引擎模块，因此可省去大量光模块带来的系统功耗，同时有效提高光电转换的稳定性。

国内首创，意义重大

作为一种发展已久的技术，CPO发展至今，衍生出了多种方案。如在光引擎方面，提供了基于硅光和基于VCSEL的技术路线选择；来到硅光调制器方面，则有MZM（Mach-Zehnder Modulator）和MRM（Microring Modulator）之分；在封装和互连方面，也各有各的优势。

具体到应用场景上，作为一个物理层的技术，CPO能把光电的引擎和主芯片封装在一起，当中主芯片常见的是交换机芯片和GPU，这也让各大厂商基于各自优势，选出了最适合他们的决定。例如博通就提供了可连接到博通以太网交换机和博通XPU的CPO平台解决方案；至于另一个资深玩家英伟达则基于公司在可插拔光模块和MRM积累，利用其独特的硅光子工艺平台，打造了基于微环调制器的CPO系统。

来到曦智科技和燧原的合作，则是国内首次采用CPO技术实现GPU直接出光的成功案例。

“我们这个合作是基于短距SerDes实现的，这是全球首创。”孟怀宇博士告诉半导体行业观察，他进一步指出，这种短距方案，还没有人做过尝试。但公司做了一系列的技术验证，证明这是可行的。

“该项目验证了xPU-CPO光电共封装技术的可行性与技术方向，同时为中国人工智能基础设施建设与先进光学封装产业突破奠定了关键技术锚点。”孟怀宇博士说。

在孟怀宇看来，现在国内的CPO产业链已成熟，特别是在上游厂商开始纷纷入局以后，CPO的落地更是指日可待。在问到既然万事俱备，为何目前CPO还没有大规模落地的原因时，孟怀宇回应道：新技术和新产品必然伴随一定的风险，大多数厂商对于技术方向的选择都会有惯性，会根据自身的风险承受能力来调整节奏。因此，CPO的规模化落地会需要一些时间。但任何积极的验证都会加速这个过程。

而曦智科技的成功，必定将给大家更多信心。