英特尔至强6处理器和英特尔锐炫Pro B 系列GPU在MLPerf Inference v6.0中展现开放、可扩展的AI性能

1 4 月, 2026 发布

人工智能

MLPerf Inference v6.0基准测试表明，英特尔®至强®6处理器和英特尔锐炫™ Pro B系列GPU，可为工作站和边缘系统提供强大、低延迟的AI推理能力

在本文中:

MLCommons发布了最新的MLPerf Inference v6.0基准测试结果，展示了英特尔GPU系统在四个关键基准测试中的表现。英特尔AI系统采用了英特尔至强6 处理器和英特尔锐炫Pro B70显卡，为高端工作站、数据中心和边缘应用等，提供了易于获取的AI工作负载解决方案。

结果显示，配备了四张英特尔锐炫 Pro B70/B65 GPU的系统拥有128GB显存，可运行1200亿高并发参数模型。其中，相较于锐炫Pro B60¹，锐炫Pro B70的推理性能提升高达1.8倍。通过在开放的容器化软件堆栈中配置软件优化，推理性能可从单节点高效扩展至多GPU企业级部署，不仅增强了性能，而且在相同的英特尔锐炫 Pro B60硬件上，相较于MLPerf v5.1²，实现了最高可达1.18倍的性能增益。

“英特尔至强6与英特尔锐炫Pro B系列GPU的结合，彰显了英特尔拓展客户选择和价值的投入和决心。这为处理LLM和传统机器学习工作负载提供了切实有效的解决方案，为遍及全球的图形处理专业人士和AI开发者带来了领先性能和卓越体验。” —Anil Nanduri，英特尔数据中心事业部副总裁，AI产品与市场拓展业务负责人

‌ AI推理需求的激增推动着专业计算市场走向深刻变革。图形创作者和AI开发者在寻求性能和价值的同时，也迫切希望，规避数据隐私泄露和专有AI模型带来的高昂订阅费用。

搭载了全新英特尔锐炫Pro B70/B65 GPU的英特尔GPU系统，旨在满足现代AI推理的需求，并提供了一个集成全栈验证硬件与软件的一体化推理平台。该系统拥有更大的内存容量，并通过一个为Linux环境构建的容器化解决方案，来简化部署以及提高易用性。经优化，该系统可通过多GPU扩展和PCIe P2P数据传输提供卓越的推理性能，以及诸如ECC、SRIOV、遥测和远程固件更新等，巩固企业级可靠性和可管理性。例如，在多GPU配置中，与同类GPU解决方案相比，英特尔锐炫Pro B70能够处理更大的模型和上下文窗口——在运行更大的模型时，其运行的KV缓存容量最高可达1.6倍。

AI 推理的评估维度正不断拓宽，除了 GPU 吞吐量，CPU加速的系统级性能也逐渐成为关键的影响因素。CPU 不仅影响整个集群的效率和TCO，更承担着内存管理、任务编排和工作负载分配等核心职能，同时，也为现代AI基础设施的安全、稳定和持续运行提供保障。

在 MLPerf 推理基准测试中，英特尔依然是唯一提交纯 CPU 成绩的服务器处理器厂商，这充分彰显了，英特尔在推动计算和加速器平台 AI 推理发展方面的卓越领导力和坚定承诺。作为 AI 加速系统中应用最广泛的主控 CPU，MLPerf 6.0 中超过半数的提交结果均由至强赋能，这进一步巩固了至强作为行业 AI 基础设施核心的地位。这种领先优势，同样体现在芯片本身：英特尔至强 6性能核处理器在 MLPerf Inference v5.1 测试中，实现了高达 1.9 倍的代际性能提升；同时，借助AMX 和 AVX512 等内置 AI 加速技术，使得LLM推理、微调以及传统机器学习等工作负载，无需专用加速硬件即可高效运行。

Notices & Disclaimers

声明与免责条款

性能因使用方式、配置和其他因素而异。欲了解更多信息，请访问 www.Intel.com/PerformanceIndex。

性能结果基于所示配置在所示日期的测试，可能不反映所有公开可用的更新。请访问 MLCommons 获取更多详细信息。没有产品或组件能够做到绝对安全。

¹基于 ML Perf Inference v6.0 基准测试，用于性能声明的英特尔锐炫 Pro B60 配置了英特尔至强 698X、2 张英特尔锐炫 Pro B60 双 GPU 显卡（等同于 4 张锐炫Pro B60），以及 8 条 16GB DDR5 6400MT/s 内存。

用于性能声明的英特尔锐炫 Pro B70 配置了英特尔至强 698X、4 张锐炫Pro B70 GPU 显卡，以及 8 条 16GB DDR5 6400MT/s 内存，截至 2026 年 2 月。

²基于 ML Perf Inference v6.0 基准测试和之前的 v5.1 基准测试，用于性能声明的英特尔锐炫Pro B60 配置了英特尔至强698X、4 张锐炫Pro B60双 GPU 显卡（等同于 8 张锐炫 Pro B60），以及 8 条 16GB DDR5 6400MT/s 内存，截至 2026 年 2 月。

英特尔至强6处理器和英特尔锐炫Pro B 系列GPU在MLPerf Inference v6.0中展现开放、可扩展的AI性能

MLPerf Inference v6.0基准测试表明，英特尔®至强®6处理器和英特尔锐炫™ Pro B系列GPU，可为工作站和边缘系统提供强大、低延迟的AI推理能力

英特尔携手长安汽车天枢智能座舱、华阳通用、面壁智能和北斗智联，以AI Box Ultra引爆端侧AI智能体上车

英特尔携手奇瑞汽车、均联智行，驶入AI智能体随行新时代

英特尔发布至强600系列工作站处理器与锐炫Pro B70 GPU，双芯联动重塑AI工作站格局

每台智能体PC，都是AI时代的新入口

MLPerf Inference v6.0基准测试表明，英特尔®至强®6处理器和英特尔锐炫™ Pro B系列GPU，可为工作站和边缘系统提供强大、低延迟的AI推理能力

相关文章

英特尔携手长安汽车天枢智能座舱、华阳通用、面壁智能和北斗智联，以AI Box Ultra引爆端侧AI智能体上车

英特尔携手奇瑞汽车、均联智行，驶入AI智能体随行新时代

英特尔发布至强600系列工作站处理器与锐炫Pro B70 GPU，双芯联动重塑AI工作站格局

每台智能体PC，都是AI时代的新入口