加速高性能计算和人工智能工作负载不断融合,英特尔以数据为中心产品组合发挥强大优势

 

英特尔公司副总裁兼企业与政府事业部总经理 Rajeeb Hazra 博士在 2019 年 6 月 17 日于德国法兰克福举行的 2019 国际超算大会上代表英特尔发表主题演讲,介绍了英特尔最新的高性能计算产品和技术突破。

 

在 2019 国际超算大会(ISC’19)上,英特尔介绍了一系列英特尔以数据为中心的产品组合如何改变下一代高性能计算(HPC)系统,并推动全行业向E级超算不断发展的最新情况。

英特尔公司副总裁兼极限计算部门总经理 Trish Damkroger 表示:“在当今以数据为中心的世界,英特尔将继续推动创新并不断提升产品性能。我们的高性能计算解决方案产品组合——包括英特尔® 至强® 铂金 9200 处理器和英特尔® 傲腾™ 数据中心级持久内存——实现了前所未有的科学探索和发现。”

如今,先进的高性能计算系统同时借助传统的高性能计算数据分析和人工智能技术,来高效处理最为复杂的科学问题。然而随着高性能计算系统对计算性能的要求越来越高,内存带宽日益成为一个瓶颈。在日前举行的 2019 国际超算大会上,英特尔展示了其以数据为中心的产品组合如何通过将高性能计算数据分析和人工智能加速整合到一个单一的计算环境中,并提供新的内存和存储模式为计算引擎提供支持,进而解决高性能计算系统面临的独特挑战。

当前,英特尔以数据为中心的产品组合为系统架构师提供了构建先进计算系统的根基,赋能这些系统能够传输、存储和处理海量数据。针对那些对计算性能有着最高要求的系统,英特尔近日还宣布,包括 Atos*、慧与(HPE)*、联想*、Penguin Computing*、Megware* 等在内的一些指定 OEM 厂商以及经过授权的英特尔经销商目前已开始出货基于英特尔® 至强® 铂金 9200 处理器的预配置系统。作为第二代英特尔® 至强® 可扩展处理器产品系列的延续,英特尔® 至强® 铂金 9200 处理器系列为广泛的工作负载和用途提供领先的性能,诸如科学模拟、财务分析、人工智能/深度学习、3D 建模与分析、密码学和数据压缩等场景。英特尔® 至强® 铂金 9200 处理器集成了英特尔® 深度学习加速(英特尔 DL Boost)技术,其人工智能性能相比上一代发布的至强® 可扩展处理器提高多达30倍。

在 2019 国际超算大会上,英特尔还与欧洲中期天气预报中心(ECMWF)*、爱丁堡大学并行计算中心(EPCC)*4、富士通*、斯洛文尼亚 IT 服务提供商 Arctur* 以及 NEXTGenIO 项目中的其它合作伙伴公布了多项不同超算应用项目中使用英特尔® 傲腾™ 数据中心级持久内存获得的最新突破性性能。

  • 欧洲中期天气预报中心(ECMWF)将其 Fields Database(保存中期天气预测的气象数据)存储于持久内存并分布在多个计算节点上之后,获得了 10 倍的更高带宽。配备英特尔® 傲腾™ 数据中心级持久内存的计算节点不仅加快了 ECMWF 的全球天气预测,还减少了运行其模型所需的 I/O 节点数量。
  • Arctur 高性能计算中心与巴塞罗那超算中心携手合作,在模拟轻型电动飞机的 3D 模型时,获得了 2 倍的速度提升,并在 16 个节点上将其 OpenFOAM 运行时间缩短了 50%3
  • 爱丁堡大学并行计算中心(EPCC)在配备英特尔® 傲腾™ 数据中心持久内存的计算节点上运行代码后,在 CASTEP* 材料科学应用上实现了 2 倍的高吞吐量,加快了跨多个领域的材料科学研究。

此外,英特尔进一步加快英特尔® 傲腾™ 数据中心级持久内存在高性能计算系统中的应用,并宣布了一项针对超算推出的,利用英特尔® 傲腾™ 数据中心级持久内存和分布式异步对象存储(DAOS)的革命性全新存储架构。其中,DAOS 是一种提供高带宽、低延迟和高 I/O 操作的开源软件定义横向扩展对象存储,专为高性能计算和人工智能工作负载的融合而设计。这一全新的软件定义存储引擎消除了目前并行文件系统中的若干局限性。

ALCF-X* 项目总监/E 级计算系统副总监 Susan Coghlan 表示:“阿贡领导力计算机构(ALCF)将作为‘极光’(Aurora)项目的一部分首次大规模生产部署 DAOS 存储系统,到 2021 年,‘极光’(Aurora)将成为美国第一个E级计算系统。DAOS 存储系统旨在提供E级系统上的 I/O 密集型工作负载所需的元数据运算速度和带宽。”

在 2019 国际超算大会上,英特尔还披露了其有关 One API 项目的更多信息。该项目将提供一个统一的编程模型,以简化多样化计算架构上的应用开发。同时,英特尔的 One API 将基于行业标准和开放规范,并可以与 OpenMP*、MPI* 和 Fortran* 等进行交互操作。

 

 

1 配备英特尔® DL Boost 获得最高 30 倍的人工智能性能,对比了 2017 年 7 月发布的英特尔® 至强® 铂金 8180 处理器。英特尔于 2019 年 2 月 26 日前进行测试。平台:Dragon rock 2 socket 英特尔® 至强® 铂金 9282(每个插槽 56 个核心),启用超线程,启用睿频,总内存 768 GB(24 个插槽/ 32 GB/ 2933 MHz),BIOS:SE5C620.86B.0D.01.0241.112020180249,Centos 7 Kernel 3.10.0-957.5.1.el7.x86_64,深度学习框架:Intel® Optimization for Caffe 版:https://github.com/intel/caffe d554cbf1, ICC 2019.2.187,MKL DNN版本:v0.17(commit hash:830a10059a018cd2634d94195140cf2d8790a75a),模型: https://github.com/intel/caffe/blob/master/models/intel_optimized_models/int8/resnet50_int8_full_conv.prototxt,BS=64,无数据层DummyData:3x224x224,56个实例/2个插槽,数据类型:INT8 vs 英特尔于2017年7月11日前测试:2S英特尔®至强®铂金8180 CPU @ 2.50GHz(28个核心),禁用超线程,禁用睿频,通过intel_pstate驱动程序把调速器设置到“高性能”,384GB DDR4-2666 ECC RAM。CentOS Linux 版本 7.3.1611 (Core),Linux 内核 3.10.0-514.10.2.el7.x86_64。固态盘:英特尔® 固态盘 DC S3700 系列(800GB,2.5in SATA 6Gb/s,25nm,MLC)。性能测量使用了:环境变量:KMP_AFFINITY=’granularity=fine, compact‘, OMP_NUM_THREADS=56, CPU Freq set with cpupower frequency-set -d 2.5G -u 3.8G -g performance。Caffe:(http://github.com/intel/caffe/),修订版 f96b759f71b2281835f690af267158b82b150b5c。推理使用“caffe time –forward_only”指令测量,训练使用“caffe time”指令测量。对于“ConvNet”拓扑,使用了虚拟数据集。对于其它拓扑,数据存储在本地存储设备上并在训练之前在内存中缓存。拓扑规格来自于 https://github.com/intel/caffe/tree/master/models/intel_optimized_models (ResNet-50)。英特尔 C++ 编译器 17.0.2 20170213 版,英特尔 MKL 小型函数库 2018.0.20170425 版。Caffe与“numactl -l”运行。

2 NEXTGenIO 项目由 671951 号 Grant Agreement 下的欧盟 Horizon 2020 研究与创新项目进行资助。

3 系统配置细节由 EPCC 提供:

  • 34 个配备英特尔至强可扩展处理器 8260M CPU的DP 节点(A0 步进),富士通主板
  • 每个插槽 96GB DDR4 DRAM(6×16 GB DIMMs,2666 速度级),加 1.5 TB 英特尔傲腾数据中心级持久内存(6×256 GB DIMMs,QS)
  • 双轨 Omni-Path 网络(每个节点 2 个 OPA 网卡),通过 2 个 48 端口 OPA 交换机连接
  • 两个运行 Lustre 的额外存储服务器节点

4 EPCC 是爱丁堡大学先进计算中心

关于英特尔

英特尔(NASDAQ: INTC)是全球半导体行业的引领者,以计算和通信技术奠定全球创新基石,塑造以数据为中心的未来。我们通过精尖制造的专长,帮助保护、驱动和连接数十亿设备以及智能互联世界的基础设施 —— 从云、网络到边缘设备以及它们之间的一切,并帮助解决世界上最艰巨的问题和挑战。如需了解更多信息,请访问英特尔中国新闻中心 newsroom.intel.cn 以及官方网站 intel.cn

英特尔和英特尔标识是英特尔公司在美国和其他国家(地区)的商标。
*文中涉及的其它名称及品牌属于各自所有者资产。