在近日举行的 re:Invent 2020 CEO 主题大会上,AWS 宣布了采用多达 8 个 Habana® Gaudi® 加速器的 EC2 实例,比目前 GPU 的 EC2 实例在机器学习性价比上提升了 40%1,基于 Gaudi® 的 EC2 实例计划于 2021 年上半年提供使用。
在主题大会上,AWS 首席执行官 Andy Jassy 强调了各行业对高性能、更实惠的人工智能工作的巨大需求。随着公司计划引入以 Gaudi 为特色的新 EC2 实例进行深度学习训练,AWS 将进一步降低 AI 数据集的训练成本,并降低希望利用 AI 提供业务分析、改善效率和增强用户体验的客户的运营总成本。
8 卡的 Gaudi 解决方案可以在 TensorFlow 上每秒处理 12000 张图像训练 ResNet-50 模型。每个 Gaudi 处理器集成了 32GB 的 HBM2 内存,并集成了用于服务器内部处理器互联的 RoCE 功能。凭借 AWS 弹性架构适配器(EFA)的技术可以跨服务器扩展,从而允许 AWS 及其客户无缝地扩展使用多个基于 Gaudi 的系统以实现高效和可扩展的分布式训练。
Habana 的 SynapseAI 软件套件专为在 Habana Gaudi 处理器上提供高性能的深度学习训练,SynapseAI 与 TensorFlow 和 Pythorch 等流行的深度学习框架集成,对 Gaudi 进行了优化。开发人员将可以获取开放的 Gaudi 软件、参考模型和文档。参考模型将在 Habana 的 GitHub 知识库中公开发布,并将包括各种流行的模型,如图像分类、对象检测、自然语言处理和推荐系统。SynapseAI 软件套件包括 Habana 的图形编译器和实时 Tensor Processor Core (TPC)内核库、固件和驱动程序,以及用于定制内核开发的 TPC SDK 和 SynapseAI Profiler 等开发工具。有关在 Gaudi 上使用新的 AWS EC2 实例的更多信息,请参阅我们的白皮书。
Habana 将在目前 Gaudi 效能基础上,推出下一代 TSMC 7nm 的 Gaudi2®,让 AI 训练应用和服务广大客户、数据科学家和研究人员。
了解更多Gaudi AI训练的优势,欢迎访问 EC2实例 网页,以及 Habana® AI 训练介绍。
1 该性价比由 AWS 根据 AWS 内部测试给出。 Habana® Labs 不控制或审核第三方数据;您的成本和结果可能会有所不同。
Gaudi® 性能基于 8 个 Gaudi® 处理器的服务器,HLS—1 和 0.11 版本的 SynapseAI 软件套件。