1. XenForo 1.5.14 中文版——支持中文搜索!现已发布!查看详情
  2. Xenforo 爱好者讨论群:215909318 XenForo专区

科技 AMD Instinct MI200加速卡或拥有110组计算单元:MCM GPU架构加持

本帖由 漂亮的石头2021-09-02 发布。版面名称:新闻聚焦

  1. 漂亮的石头

    漂亮的石头 版主 管理成员

    注册:
    2012-02-10
    帖子:
    488,439
    赞:
    48
    Coelacanth's Dream 刚刚在 GitHub 上发现了一份近期提交的代码,可知其中揭示了有关即将到来的基于 AMD Aldebaran GPU 的 Instinct 加速卡的一些细节。据悉,代号为“GFX90A”的该系列 GPU 将采用 CDNA 2 架构,同时它也是 GFX 9th Family(Vega 家族)的衍生型号。

    [​IMG]

    (图 viaWCCFTech)​

    其中包括了 GFX906_60、GFX908_120 和 GFX90A_110 三个代码,预计分别对应 Instinct MI60、MI100、以及新一代 HPC 加速器 SKU 。

    从型号命名规则上来看,猜测 MI60 / MI100 分别拥有 60 / 120 组计算单元(CU)。奇怪的是,GFX90A_110 的计算单元竟然比 MI100 更少。

    [​IMG]

    (截图 viaVideoCardz)​

    虽然有消息称 Aldebaran GPU 将拥有 128 组 CU,但这与我们看到的有关AMD下一代 Instinct 加速卡的规格有些不符。

    不过考虑到厂商会按需屏蔽部分瑕疵单元(渲染引擎 / 计算单元),我们对 110 CU 的 GPU SKU 也并不感到意外。

    Coelacanth's Dream预计:MI200 的 Aldebaran GPU 采用了双拼的 MCM 设计,每边都有 56 个 CU 。分别屏蔽其中一个的话,就组成了 110 个。

    [​IMG]

    目前尚不清楚 AMD 是否计划将 CDNA 2 架构上的 FP32 内核数量增加一倍。

    假使该公司这么做,那下一代 Instinct 计算卡有望在 1500 MHz 的时钟频率下,达成 42.2 TFLOPs 的单精度算力(即 MI100 的 1.82 倍)。

    若没有这么做,则 MI200 需要将 GPU 频率至少提升至 1650 MHz,才能达到 23 TFLOPs 的 FP32 吞吐量。

    [​IMG]

    不过对于 MI200 之类的 HPC 加速卡来说,FP64 的性能显然更加重要。由早前泄露的消息可知,MI200 将具有全速率的 FP64 性能,意味其性能可达到 MI100 的两倍或四倍(具体取决于选用了怎样的架构设计)。

    如果一切顺利,AMD 或在 2021 年底前发布 MI200 。作为该公司革命性的 MCM 多芯片 HPC 加速卡,它还将板载 128GB 的 HBM2e 高带宽缓存。
     
正在加载...