英特尔于 2021 年 9 月推出其第二代神经拟态研究芯片 Loihi 2,支持新型神经启发算法和应用,同时提供更快的处理能力,更大资源密度和更高能效。(图片来源:英特尔公司)
今天,英特尔推出第二代神经拟态研究芯片 Loihi 2 以及用于开发神经启发应用的开源软件框架 Lava,标志着英特尔在先进神经拟态技术上不断取得进展。
英特尔神经拟态计算实验室总监 Mike Davies 表示:“Loihi 2 和 Lava 软件框架从多年来使用 Loihi 的合作研究项目中收获洞察。第二代芯片极大地提高了神经拟态处理的速度、可编程性和容量,扩大了在功耗和时延受限的智能计算应用上的用途。英特尔正在开源 Lava,以满足在实践中对软件融合、基准测试和跨平台合作的需求,并加快商业可行性的进程。”
神经拟态计算借鉴了神经系统科学取得的洞察,开发出功能更类似大脑的芯片,追求在一系列边缘应用中实现能效、计算速度和学习效率的数量级提升,包括从视觉、语音和手势识别到搜索检索、机器人和约束优化问题。
迄今为止,英特尔及合作伙伴已展示了机械臂、应用神经拟态芯片的人造皮肤和嗅觉传感等应用。
关于 Loihi 2:该款研究芯片整合了过去三年使用第一代研究芯片的收获,并充分利用英特尔制程技术和异步时钟设计模式的进展。
- Loihi 2 的进步使该架构得以支持新型神经启发算法和应用,提供高达 10 倍的处理速度1,实现每个芯片最多有 100 万个神经元的高达 15 倍的资源密度2,并同时提高能效。得益于与英特尔技术开发团队的密切合作。Loihi 2 采用了预生产版本的 Intel 4 制程节点,这凸显出 Intel 4 制程工艺的良好进展。与以往的制程技术相比,Intel 4 制程节点采用的极紫外光刻(EUV)技术简化了布局设计规则,使 Loihi 2 的快速开发成为可能。
- Lava 软件框架满足了神经拟态研究社区对通用软件框架的需求。作为一个开放、模块化、可扩展的框架,Lava 将允许研究人员和应用开发人员在彼此取得的成果上进一步开发,并集中到一组通用的工具、方法和函数库中。同时,Lava 能够在跨越传统和神经拟态处理器的异构架构上无缝运行,实现跨平台执行以及与各种人工智能、神经拟态和机器人框架的互操作性。开发人员无需使用专门的神经拟态硬件即可开始构建神经拟态应用,并且可以为 Lava 代码库做出贡献,包括将其移植到其他平台上运行。
洛斯阿拉莫斯国家实验室科学家 Gerd J. Kunde 提到:“洛斯阿拉莫斯国家实验室的研究人员一直在使用 Loihi 神经拟态平台来研究量子计算与神经拟态计算之间的权衡,并在芯片级上实现学习流程。这项研究显示了脉冲神经网络和量子退火路径在解决硬优化问题上一些激动人心的等效性。除此之外,我们还证明了之前被认为无法在神经拟态架构上实现的反向传播算法(训练神经网络的基本构建模块)可以在 Loihi 上高效地实现。我们的团队很高兴能够借助 Loihi 2 芯片继续进行这项研究。”
关键突破:Loihi 2 和 Lava 为研究人员开发并塑造新的神经启发应用提供了工具,用于实时处理、问题解决、适应和学习。显著的技术亮点包括:
- 更快、更通用的优化:Loihi 2 更出色的可编程性将帮助解决更广泛的艰难优化问题,包括从边缘到数据中心系统的实时优化、规划和决策。
- 持续学习和关联学习的新方法:Loihi 2 改进了对高级学习方法的支持,包括了各种反向传播算法(深度学习的主力算法)。这扩大了适应性和数据高效学习算法的范围,使低功耗设备能支持这些在线学习算法。
- 可通过深度学习进行训练的新型神经网络:Loihi 2 中的完全可编程神经元模型和广泛的脉冲信息传递,为各种可在深度学习中进行训练的新型神经网络模型打开了大门。早期的评估表明,与在原始版本的 Loihi 上运行的标准深度网络相比,在准确性没有降低的情况下3,Loihi 2 上每次推理的运算次数减少了 60 多倍。
- 与现实世界的机器人系统、传统处理器和新型传感器无缝集成:Loihi 2 通过整合更快、更灵活和更标准的输入/输出接口,解决了 Loihi 中客观存在的一处局限。Loihi 2 芯片将支持以太网接口,与更广泛的基于事件的视觉传感器实现无胶合集成,同时 Loihi 2 芯片还拥有更大的网状网络。
关于英特尔神经拟态研究社区(INRC):英特尔神经拟态研究社区(INRC) 已增加到约 150 个成员机构,今年新增的成员包括福特(Ford)、佐治亚理工学院(Georgia Institute of Technology)、美国西南研究院(SwRI)、美国菲力尔公司(Teledyne FLIR)。新合作伙伴加入了一个由学术团体、政府实验室和行业伙伴组成的强大社区,它们将与英特尔携手推动神经拟态计算商业应用的实际落地。
“Loihi 2 和 Lava API 取得的进展是神经拟态计算的关键一环。下一代神经拟态架构对于埃森哲研究室推动类脑计算机视觉算法至关重要,这些算法用于智能边缘计算,可以对未来的扩展现实头盔或智能移动机器人的开发提供动力。新芯片提供的功能将大大提升超维计算的效率,并提供更高级的片上学习能力,而 Lava API 为开发人员提供了一个更简单、更流畅的接口来构建神经拟态系统。”——埃森哲技术研究院首席研究科学家、创新发展与战略总监 Edy Liongosari
商业化之路:先进的神经拟态计算从实验室研究走向商业应用需要“三管齐下”。首先,需要根据算法和应用研究的结果对神经拟态硬件进行持续地迭代改进。其次,还需要开发通用的跨平台软件框架,以便开发人员可以对来自不同开发群体的最佳算法理念进行基准测试、整合和改进;最后,产业界、学术界和政府领域之间要深入合作,建立一个丰富、高效的神经拟态生态系统,以探索近期可实现商业价值的落地。
英特尔今天发布的消息涵盖所有这些领域,将新工具交付到不断壮大的神经拟态生态系统研究人员手中。他们将在此基础上重新思考计算,从而实现智能信息处理方面的突破。
英特尔目前通过神经拟态研究云服务向加入英特尔神经拟态研究社区(INRC)的成员提供两个基于 Loihi 2 的神经拟态系统:用于早期评估的单芯片系统 Oheo Gulch 和即将开放的八芯片系统 Kapoho Point。Lava 软件框架可在 GitHub 上免费下载。Loihi 2 和 Lava 的演示教程将在 10 月举办的“Intel Innovation”活动中呈现。
更多背景信息:神经拟态计算——下一代 AI(新闻资料) | 英特尔神经拟态计算(新闻资料)
1 基于 2021 年 9 月对 PilotNet DNN 推理负载的 9 层变体在 Loihi 2 上作为 Sigma-Delta 神经网络进行的 Lava 模拟测试,对比了在 Loihi 上通过 SNN 频率编码实施的相同网络。两种芯片的 Lava 性能模型都基于硅的特性,使用 Nx SDK 1.0.0 版作为运行 Ubuntu 20.04.2 版的主机,其中配备了英特尔至强 E5-2699 v3 CPU @ 2.30 GHz, 32GB 内存。Loihi 测试结果使用 Nahuku-32 系统 ncl-ghrd-04。Loihi 2 测试结果使用 Oheo Gulch 系统 ncl-og-04。结果可能会有所不同。
2 基于核心大小为 0.21 mm2 的 Loihi 2,最多支持 8192 个神经元,对比了核心尺寸为 0.41 mm2 的 Loihi,最多支持 1024 个神经元。
3 根据上述 9 层 PilotNet DNN 推理负载的测试结果,Loihi 2 上的 Sigma-Delta 神经网络实施了 323,815 次突触运算,均方误差(MSE)为 0.035,而 Loihi 1 上的速率编码 SNN 实施了 20,250,023 次突触运算,均方误差(MSE)为 0.0412。