全球最大AI训练集群投入使用! 十万块英伟达H100!

2024-07-24 11:41来源:作者:第6下载网

据相关消息,配备了10万个英伟达H100 GPU,采用液冷散热,并使用单一的RDMA网络互连架构的孟菲斯超级计算机集群(Memphis Supercluster)于当地时间凌晨4:20开始进行训练,据了解,这是全世界最强大的AI训练集群,而马斯克也于近期在社交平台上发文感谢xAI团队、X团队、英伟达及其支持公司所做的贡献。

据马斯克介绍,该集群配备了10万个英伟达H100 GPU,采用液冷散热,并使用单一的RDMA网络互连架构,是全世界最强大的AI训练集群。

从GPU规模上来看,这一集群已经全面超越了最新Top500榜单上的任何一台超级计算机,包括世界上最强的Frontier(37888个AMD GPU)、Aurora(60000个Intel GPU)和微软Eagle(14400个Nvidia H100 GPU)。

马斯克还透露,其目标是“在今年12月前训练出世界上最强大的人工智能(Grok3)”,而孟菲斯超级计算机集群正是其实现这一目标的优势所在。

在今年3月敲定协议后,这一“超级计算机工厂(Gigafactory of Compute)”几乎是立即开工。上个月,经济发展组织大孟菲斯商会也证实马斯克旗下xAI全新“超级计算机工厂”正在筹备中。

为了达成这项协议,xAI已经口头承诺将改善孟菲斯的公共基础设施,以支持数据中心的发展,包括兴建一个新的变电站和一个污水处理设施。

孟菲斯电力、天然气和水务公司的首席执行官估计,xAI孟菲斯工厂每小时可能使用高达150兆瓦的电力,相当于10万户家庭所需电量,而XAI预计每天至少需要100万加仑的散热水。

孟菲斯市议会议员Pearl Walker上周表示:“民众很害怕。他们担心水资源可能出现问题,也担心能源供应(出现问题)。”

实际上,早在5月份,xAI 就表示已获得60亿美元的资金用于AI开发。该公司目前为其孟菲斯超级计算站点发布了六个招聘信息,职位包括光纤工头、网络工程师和项目经理等。

以上,便是小编收集到的有关全球最大AI训练集群投入使用的全部内容,对此事感兴趣的朋友们可以关注一下,那么,让我们下期再见。

全球最大AI训练集群

免责声明:文章图片应用自网络,如有侵权请联系删除

热门推荐

更多
最新 热门

Copyright © 2023-2025 d6xz.com. 第6下载网 版权所有

苏ICP备2022048461号-2