纵有疾风起
人生不言弃

高达7倍AI性能提升,AMD发布Instinct MI100加速显卡

高达7倍AI性能提升,AMD发布Instinct MI100加速显卡

2020-11-17 23:36
来源:微型计算机杂志

原标题:高达7倍AI性能提升,AMD发布Instinct MI100加速显卡

11月16日,AMD发布全新的Instinct MI100加速显卡。它剑指高性能计算和AI领域,同时也是首个突破10 teraflops(FP64)性能的x86服务器显卡。再搭配上AMD EPYC处理器ROCm 4.0开源软件平台,以及戴尔、技嘉、HPE和Supermicro这些加速计算平台的支持,Instinct MI100加速显卡让百亿亿次级计算时代离我们更近一步。

高达7倍AI性能提升,AMD发布Instinct MI100加速显卡插图

AMD发布面向高性能计算和AI领域的Instinct MI100加速显卡

多个关键功能和技术亮点

AMD发布的Instinct MI100加速显卡不仅采用特别设计、优化的CDNA架构,而且还拥有多个关键功能和技术亮点,下面我们就来逐个了解一下。

CDNA架构加持

AMD Instinct MI100加速显卡基于其今年3月发布的CDNA架构,与消费级显卡的RDNA架构不同,CDNA架构特别针对GPU计算进行设计和优化,从而加速机器学习和高性能计算。具体来说,消费级显卡的RDNA架构在实时游戏渲染性能上的表现更加出色,但将它应用在高性能计算领域并不是最优解。于是AMD特地针对数据中心高性能计算重新设计和优化,推出了更专注于计算/张量操作性能的CDNA架构。这一新架构不仅可为高性能计算加速,提供更强的AI计算性能,同时还可通过Infinity Fabric互连总线提供灵活的性能设计。

高达7倍AI性能提升,AMD发布Instinct MI100加速显卡插图1

AMD Instinct MI100加速显卡基于特别设计、优化的CDNA架构

采用全新的Matrix Core技术

AMD Instinct MI100加速显卡采用了AMD为HPC和AI打造的Matrix Core(矩阵核心)技术,可为单精度和混合精度矩阵运算(如FP32、FP16、bFloat15、Int8和Int4)提供强劲性能,并促进HPC和AI的融合。

采用第二代AMD Infinity Fabric技术

AMD Instinct MI100加速显卡在服务器中使用三个AMD Infinity Fabric链接时,可在PCIe 4.0上提供约2倍的点对点(P2P)峰值I/O带宽,以及每张显卡高达340GB/s的总带宽。不仅如此,AMD Instinct MI100加速显卡还可配备两个完全连接的Quad显卡单元,其中每个单元可为快速数据分享提供多达552GB/s的P2P I/O带宽。

高达7倍AI性能提升,AMD发布Instinct MI100加速显卡插图2

AMD Instinct MI100加速显卡亮点汇总

搭载高速HBM2内存,支持PCIe 4.0

除了上述关键技术,AMD Instinct MI100加速显卡还搭载32GB高带宽HBM2内存,其时钟速率达到1.2GHz,可提供超高的1.23TB/s内存带宽,以支持大型数据集并解决移动数据进出内存的瓶颈。此外,AMD Instinct MI100加速显卡还支持全新PCIe 4.0,理论上从CPU到GPU可提供高达64GB/s的峰值传输数据带宽。

提供出色的FP64和FP32性能

基于以上功能和技术亮点,AMD Instinct MI100加速显卡可提供11.5 TFLOPS FP64峰值性能、23.1 TFLOPS FP32峰值性能,帮助全球各地的科学家和研究人员加速他们在生命科学、能源、金融、学术、政府、国防等领域的研究和探索。

高达7倍AI性能提升,AMD发布Instinct MI100加速显卡插图3

AMD Instinct MI100加速显卡可为天文、医疗等多个领域的科学研究提供强劲性能

基于全新的AMD CDNA架构,AMD Instinct MI100加速显卡在与第二代AMD EPYC处理器搭配使用时可为HPC和AI提供性能更强的加速系统。这款加速显卡可为HPC提供高达11.5 TFLOPS的FP64峰值性能、为AI和机器学习工作负载提供多达46.1 TFLOPS的FP32 Matrix峰值性能。相比AMD的上一代加速显卡,AMD Instinct MI100加速显卡借助全新AMD Matrix Core技术,还可为AI训练工作负载带来提升近7倍的FP16理论峰值浮点性能。

高达7倍AI性能提升,AMD发布Instinct MI100加速显卡插图4

AMD Instinct MI100加速显卡拥有120个CU单元,7680个流处理器,并搭配32GB HBM2内存。

AMD数据中心与GPU加速处理全球副总裁Brad Mccredie表示:“AMD今天所推出的AMD Instinct MI100 ——业界领先的高性能HPC显卡,迈出了通往百亿亿次级计算道路上的重要一步,我们的新加速显卡直指科学计算中的工作负载,通过与AMD ROCm开源软件平台相结合,旨在为科学家和研究人员提供一个更为优越的HPC工作基础。”

为百亿亿次级时代而打造的开源软件平台

在带来强劲硬件性能的同时,AMD还提供了一站式软件解决方案——ROCm开发者软件平台。ROCm 4.0是面向HPC、ML以及AI应用开发者的全新平台,能够帮助他们打造高性能便携软件。作为一个由编译器、编程API和组成的开源工具集,ROCm可帮助百亿亿次级软件开发者们打造高性能应用程序,经过优化后的ROCm 4.0可为基于AMD Instinct MI100加速显卡的系统带来强劲性能。目前,ROCm 4.0已将编译器升级为开源且统一标准的,以支持OpenMP 5.0以及HIP.PyTorch和Tensorflow框架,这些平台框架在搭配AMD Instinct MI100加速显卡和ROCm 4.0使用时,都经过了优化并可实现更高性能。

高达7倍AI性能提升,AMD发布Instinct MI100加速显卡插图5

ROCm 4.0是面向HPC、ML以及AI应用开发者的全新平台,同时也是一款能够帮助他们打造高性能便携软件。

高达7倍AI性能提升,AMD发布Instinct MI100加速显卡插图6

ROCm 4.0特别针对AMD Instinct MI100加速显卡进行性能优化,并可提供相比ROCm 3.0和ROCm 2.0更强劲的性能。

高达7倍AI性能提升,AMD发布Instinct MI100加速显卡插图7

ROCm可帮助百亿亿次级软件开发者们打造高性能应用程序

多个服务器解决方案案例

AMD Instinct MI100加速显卡预计将于今年年底在企业级市场的主要OEM和ODM合作伙伴的系统上使用,其中包括戴尔PowerEdge R7525、技嘉G482-Z54/Z53 、HPE Apollo 6500 Gen10 Plus System,以及来自 Supermicro的AS-4124GS-TNR。

高达7倍AI性能提升,AMD发布Instinct MI100加速显卡插图8

AMD Instinct MI100加速显卡将在今年年底应用到戴尔、技嘉、HPE和Supermicro的系统上

得益于AMD Instinct MI100加速显卡全新CDNA架构所带来的计算能力,以及高内存和点对点带宽,这款加速显卡为高性能计算领域带来了巨大影响,同时和可以帮助用户更好地解决包括HPC、深度学习和分析在内的一系列复杂数据密集性工作负载。可以看出,Instinct MI100加速显卡的发布让AMD在高性能计算和AI计算领域更进一步,同时也提升了AMD在上述领域的竞争力,那么AMD Instinct MI100加速显卡在上市之后将有怎样的市场表现呢?我们拭目以待吧。返回搜狐,查看更多

责任编辑:

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
阅读 ()

未经允许不得转载:起风网 » 高达7倍AI性能提升,AMD发布Instinct MI100加速显卡
分享到: 生成海报

评论 抢沙发

评论前必须登录!

立即登录