Meta加速AI芯片研发,推出性能升级的下一代MTIA

Meta加速AI芯片研发,推出性能升级的下一代MTIA

Meta 正全力推进其在人工智能领域的战略布局,不仅在人才招聘上投入巨资吸引顶尖的 AI 研究人员,还在硬件开发上投入重金,特别是针对 AI 模型的训练和运行所需的专用芯片。最近,Meta 宣布了其芯片研发项目的最新成果——下一代 Meta 训练和推理加速器(MTIA),这是对其去年推出的 MTIA v1 的重大升级,旨在提升在 Meta 旗下平台(如 Facebook)上进行广告排名和推荐的效率。

新一代 MTIA 芯片采用了先进的 5 纳米工艺,相较于前一代的 7 纳米工艺,这一进步标志着 Meta 在芯片制造技术上的显著提升。新芯片的设计更为庞大,集成了更多的处理核心,这使得它在处理复杂任务时更为高效。尽管新芯片的功耗达到了 90 瓦,高于前一代的 25 瓦,但它的内部内存容量增加到了 128MB,时钟速度也从 800MHz 提升到了 1.35GHz,这些改进使得新一代 MTIA 在性能上有显著提升。Meta 宣称,新一代 MTIA 在其 16 个数据中心区域部署后,相比前一代产品,整体性能提升了 3 倍。

然而,Meta 在其博客文章中透露,尽管新一代 MTIA 在性能上有所提升,但目前并未用于生成性 AI 训练工作负载。公司表示,正在开展多个项目,探索将新一代 MTIA 应用于生成性 AI 领域的可能。此外,Meta 也坦诚新一代 MTIA 并不会完全替代 GPU,而是作为 GPU 的补充,以提供更全面的性能优化。

Meta 在硬件发展上的谨慎态度可能源于其人工智能团队面临的成本压力。公司预计将在 2024 年底前在 GPU 上投入约 180 亿美元,用于训练和运行生成性 AI 模型。鉴于这些模型的训练成本可能高达数千万美元,开发自家硬件成为了一个具有吸引力的替代方案,有助于降低长期成本。

与此同时,Meta 的竞争对手们在 AI 芯片领域的发展速度不容小觑。谷歌已经向其云平台客户推出了第五代 TPU v5p,并且还推出了专门用于运行模型的 Axion 芯片。亚马逊也推出了多个定制 AI 芯片系列,而微软则推出了 Azure Maia AI 加速器和 Azure Cobalt 100 CPU。这些进展表明,Meta 在 AI 硬件领域面临着激烈的竞争,需要加快创新步伐,以减少对第三方 GPU 的依赖,并在竞争中保持领先地位。Meta 的目标是通过控制整个技术栈,实现比商用 GPU 更高的效率,从而在 AI 领域取得独立性,并最终与竞争对手匹敌。

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...