英特尔至强6处理器和英特尔锐炫Pro B 系列GPU在MLPerf Inference v6.0中展现开放、可扩展的AI性能
MLPerf Inference v6.0基准测试表明,英特尔®至强®6处理器和英特尔锐炫™ Pro B系列GPU,可为工作站和边缘系统提供强大、低延迟的AI推理能力
MLCommons发布了最新的MLPerf Inference v6.0基准测试结果,展示了英特尔GPU系统在四个关键基准测试中的表现。英特尔AI系统采用了英特尔至强6 处理器和英特尔锐炫Pro B70显卡,为高端工作站、数据中心和边缘应用等,提供了易于获取的AI工作负载解决方案。
结果显示,配备了四张英特尔锐炫 Pro B70/B65 GPU的系统拥有128GB显存,可运行1200亿高并发参数模型。其中,相较于锐炫Pro B60¹,锐炫Pro B70的推理性能提升高达1.8倍。通过在开放的容器化软件堆栈中配置软件优化,推理性能可从单节点高效扩展至多GPU企业级部署,不仅增强了性能,而且在相同的英特尔锐炫 Pro B60硬件上,相较于MLPerf v5.1²,实现了最高可达1.18倍的性能增益。
“英特尔至强6与英特尔锐炫Pro B系列GPU的结合,彰显了英特尔拓展客户选择和价值的投入和决心。这为处理LLM和传统机器学习工作负载提供了切实有效的解决方案,为遍及全球的图形处理专业人士和AI开发者带来了领先性能和卓越体验。” —Anil Nanduri,英特尔数据中心事业部副总裁,AI产品与市场拓展业务负责人
AI推理需求的激增推动着专业计算市场走向深刻变革。图形创作者和AI开发者在寻求性能和价值的同时,也迫切希望,规避数据隐私泄露和专有AI模型带来的高昂订阅费用。
搭载了全新英特尔锐炫Pro B70/B65 GPU的英特尔GPU系统,旨在满足现代AI推理的需求,并提供了一个集成全栈验证硬件与软件的一体化推理平台。该系统拥有更大的内存容量,并通过一个为Linux环境构建的容器化解决方案,来简化部署以及提高易用性。经优化,该系统可通过多GPU扩展和PCIe P2P数据传输提供卓越的推理性能,以及诸如ECC、SRIOV、遥测和远程固件更新等,巩固企业级可靠性和可管理性。例如,在多GPU配置中,与同类GPU解决方案相比,英特尔锐炫Pro B70能够处理更大的模型和上下文窗口——在运行更大的模型时,其运行的KV缓存容量最高可达1.6倍。
AI 推理的评估维度正不断拓宽,除了 GPU 吞吐量,CPU加速的系统级性能也逐渐成为关键的影响因素。CPU 不仅影响整个集群的效率和TCO,更承担着内存管理、任务编排和工作负载分配等核心职能,同时,也为现代AI基础设施的安全、稳定和持续运行提供保障。
在 MLPerf 推理基准测试中,英特尔依然是唯一提交纯 CPU 成绩的服务器处理器厂商,这充分彰显了,英特尔在推动计算和加速器平台 AI 推理发展方面的卓越领导力和坚定承诺。作为 AI 加速系统中应用最广泛的主控 CPU,MLPerf 6.0 中超过半数的提交结果均由至强赋能,这进一步巩固了至强作为行业 AI 基础设施核心的地位。这种领先优势,同样体现在芯片本身:英特尔至强 6性能核处理器在 MLPerf Inference v5.1 测试中,实现了高达 1.9 倍的代际性能提升;同时,借助AMX 和 AVX512 等内置 AI 加速技术,使得LLM推理、微调以及传统机器学习等工作负载,无需专用加速硬件即可高效运行。
Notices & Disclaimers
声明与免责条款
性能因使用方式、配置和其他因素而异。欲了解更多信息,请访问 www.Intel.com/PerformanceIndex。
性能结果基于所示配置在所示日期的测试,可能不反映所有公开可用的更新。请访问 MLCommons 获取更多详细信息。没有产品或组件能够做到绝对安全。
1基于 ML Perf Inference v6.0 基准测试,用于性能声明的英特尔锐炫 Pro B60 配置了英特尔至强 698X、2 张英特尔锐炫 Pro B60 双 GPU 显卡(等同于 4 张锐炫Pro B60),以及 8 条 16GB DDR5 6400MT/s 内存。
用于性能声明的英特尔锐炫 Pro B70 配置了英特尔至强 698X、4 张锐炫Pro B70 GPU 显卡,以及 8 条 16GB DDR5 6400MT/s 内存,截至 2026 年 2 月。
2基于 ML Perf Inference v6.0 基准测试和之前的 v5.1 基准测试,用于性能声明的英特尔锐炫Pro B60 配置了 英特尔至强698X、4 张锐炫Pro B60双 GPU 显卡(等同于 8 张锐炫 Pro B60),以及 8 条 16GB DDR5 6400MT/s 内存,截至 2026 年 2 月。