英伟达GPU入驻微软数据中心:创新与兼容性碰撞
据The Information独家报道,微软正计划引进英伟达最新的Blackwell B200 GPU用于其数据中心的升级项目,然而,在安装设备的过程中,双方的合作遇到了一些挑战。作为AI领域的市场领导者,英伟达CEO黄仁勋曾明确表示,公司将不再单个GPU出售,而是以NVL72机架整体打包推广,旨在提升销售效益并实现产品的标准化安装。
NVIDIA的DGX GB200系统机柜分为三个类别:DGX NVL72、NVL32和HGX B200,其中NVL72是最顶级型号,配置了72颗B200 GPU和36颗Grace CPU,配备了9台交换器,其散热系统和内部电缆设计严格统一,由NVIDIA主导,ODM厂商仅负责I/O和以太网连接部分。NVL72的性能强大,可提供720 petaflops的训练性能或1,440 petaflops的推理能力,但机柜内电缆总长度达到近2英里,拥有5000条独立线路。
市场研究机构HSBC的数据指出,Nvidia GB200 NVL36(搭载36个GB200超级芯片)的平均售价大约为180万美元,而NVL72(72个超级芯片)的售价则可能高达300万美元。这样的定价策略有利于英伟达,既保证了收入,又确保了客户按照统一标准安装。
然而,微软对英伟达的机架设计方案持有异议。英伟达副总裁安德鲁・贝尔提出的要求是,微软需为B200 GPU购置专门的服务器机架,尺寸需与微软现有数据中心机架兼容。但微软认为,这将限制他们更换其他GPU,如AMD的MI300X GPU的可能性。
经过一段时间的协商,英伟达最终同意了微软的定制化需求,允许后者设计符合自身需求的服务器机架,尽管这可能预示着双方在未来可能还会面临类似的分歧。这一事件突显了在AI硬件市场,即使是像微软和英伟达这样的行业巨头,合作过程中也需要解决技术与商业需求之间的微妙平衡。