泡泡网新闻频道 PCPOP首页      /      新闻频道     /      动态    /    正文

GPU通信能力出众,沐曦股份可应对超大规模算力需求

  随着大模型参数规模指数级增长,单卡有效算力难以应对超大规模的算力需求,高带宽、低延迟的卡间互连技术成为关键竞争要素,对GPU集群互连拓扑结构也提出了更高要求,驱动了纵向扩展(Scale-up)与横向扩展(Scale-out)网络架构的技术演进。于10月24日IPO过会的沐曦集成电路(上海)股份有限公司(以下简称“沐曦股份”)则凭借着领先的技术优势,在通信算力难题中交出了亮眼的答卷。

  据了解,沐曦股份具备国内稀缺的高带宽、较多卡互连能力,自主研发的MetaXLink高速互连技术支持GPU全互连,突破了传统PCIe总线在带宽和延迟方面的限制,缩短了GPU之间数据传输时的通信时间,为大规模AI模型训练提供了充足的通信带宽保证。同时,MetaXLink根据GPU之间数据交互需求优化传输协议并且支持MetaXLink端口之间数据直接转发,可以灵活适配大模型发展及其不同切分方式下对于互连延时和带宽的特定需求,满足训练和推理等不同应用场景。基于前述参数对比,沐曦股份GPU产品的互连带宽达到了与英伟达4nm制程工艺下旗舰产品(H200)相当的性能,代表了国内先进的互连技术水平。

  在互连拓扑结构方面,通过创新的架构设计,沐曦股份单颗GPU芯片拥有7个高速MetaXLink互连接口,支持Full-Mesh、Hybrid Cube Mesh等多种复杂互连拓扑结构。通过MetaXLink各端口不同连接形式,沐曦股份GPU产品支持2卡、4卡、8卡全互连拓扑,为千亿参数规模AI大模型应用高频使用到的AllReduce、AllToAll等集合通信原语提供单机内的更优拓扑形态与行业内更低时延支持。同时,凭借协议层设计创新,MetaXLink具备较强的互连拓扑重构能力,能够根据应用需求灵活调整互连拓扑,最大化接口带宽的利用效率。

  除此之外,沐曦股份GPU产品通过超节点架构可灵活适配16卡、32卡、64卡等系统规模,满足从中小型训练到超大规模集群的差异化需求,为构建高密度算力和大规模集群、处理更为复杂的人工智能任务提供了关键技术支撑。为进一步提高智算集群算力密度,沐曦股份联合合作伙伴研发并落地了高密度液冷整机柜,突破性实现单机柜128卡超高密度部署。丰富的超节点架构和较多卡拓扑结构的设计能力彰显了沐曦股份在GPU通信能力方面领先的技术实力,为未来更大规模的GPU集群部署奠定了技术基础。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。
0人已赞

关注我们

泡泡网

手机扫码关注