自动秒收录

AMD将构建环球最大AI训练集群 集成120万片GPU (amd使用什么架构)


文章编号:12255 / 分类:Midjourney绘画 / 更新时间:2024-06-30 13:30:16 / 浏览:

AMD将构建最大AI训练集成120万片GPUamd

6月26日信息,据The Next Platform报道,近日AMD口头副总裁兼数据核心处置打算团体总经理Forrest Norrod在接受采访时示意,AMD将助力构建环球最大的单体人工默认(AI)训练集群,将集成高达120万片的GPU。

120万片GPU 是一个十分惊人的数字,要知道目前环球最强的超级计算机Frontier 所装备的 GPU 数量才只要37888片,这也象征着AMD所允许的AI训练集群的GPU规模将到达Frontier的30多倍。不过,Forrest Norrod没有泄漏哪个组织正在思考构建这种规模的AI系统,但确实提到“十分苏醒的人”正在思考在AI训练集群上破费数百亿到数千亿美元。

目前的AI训练集群理论由几千个 GPU 构建而成,这些 GPU 经过跨多个主机机架或更少的高速互连衔接。假设要创立一个领有高达 120 万个 GPU 的单体 AI 集群,象征着将会面临极为复杂的高速互连网络,并且还会有提前、功耗、配件缺点等诸多的疑问,这仿佛是难以成功的。

比如,AI上班负载对提前十分敏感,尤其是尾部提前和意外值,其中某些数据传输比其余数据传输破费的期间要长得多,并且会终止上班负载。此外,当今的超级计算机也会面临每隔几个小时就会出现的 GPU 或其余配件缺点。当裁减到当今最大的超级计算机集群的 30 倍时。更为主要的是,如此庞大的AI训练集群,将会发生极为庞大的能耗,不只稳固的供电将会是一个大难题,而且配套的散热处置打算也面临渺小应战。

编辑:芯智讯-浪客剑


相关标签: Norrod高达集群训练ForrestNorrod负载单体环球最大规模观念评论上班计算机芯智单体处置打算

本文地址:https://www.badfl.com/article/c3c9b50f05faca66067d.html

上一篇:540%月中国iPhone出货量同比增长苹果折扣促...
下一篇:闹哪出真实是顶不住了618后红米K70暴跌三百...

发表评论

温馨提示

做上本站友情链接,在您站上点击一次,即可自动收录并自动排在本站第一位!
<a href="https://www.badfl.com/" target="_blank">自动秒收录</a>