1. XenForo 1.5.14 中文版——支持中文搜索!现已发布!查看详情
  2. Xenforo 爱好者讨论群:215909318 XenForo专区

科技 当64核遇上PCIe 4.0 超级算力是这样建成的

本帖由 漂亮的石头2020-09-23 发布。版面名称:新闻聚焦

  1. 漂亮的石头

    漂亮的石头 版主 管理成员

    注册:
    2012-02-10
    帖子:
    485,189
    赞:
    46
    我们现在的时代正处于一场算力革命中,大数据、5G、AI人工智能、云计算等领域都对高性能提出了更高的要求,基于所有数据的分析和最终决策都需要高性能计算,这是未来的一片蓝海。今天AMD这样的公司已经可以从多个方面来提高算力,其中最关键的部分依然是高性能CPU。

    AMD CEU苏姿丰此前在接受采访时表示,AMD的使命是提供解决方案,让所有用户都能利用高性能计算来解决世界上一些最有趣和最棘手的挑战。​

    针对高性能计算,AMD自从推出Zen架构以来的三年里,最重要的动作就是新一代EPYC 7002系列处理器,它不仅从上代的14nm工艺升级到了7nm工艺,同时还从32核升级到了64核,并带来了PCIe 4.0总线,使得高性能计算算力大涨的同时,还解决了I/O的瓶颈,可以灵活搭配新一代GPU、网络等,系统性地提升了算力。​

    [​IMG]

    EPYC 7002系列处理器使用了Zen2架构,这一代最重要的三个特点就是继续提升性能、工艺升级改善能效,同时提高CPU并行能力——更多核心、更多IO等。​

    Zen2架构升级:IPC性能大涨、浮点运算能力翻倍​

    自从2017年推出第一代Zen架构以来,AMD在处理器性能上已经鱼跃龙门,Zen相比之前的CPU就提升了52%的IPC性能提升,远超业界水平。​

    此后AMD的路线图中,Zen架构持续不断优化,不论单核还是多核,性能一直在稳步增长,在Zen2上,AMD依然提升了15%的单核IPC性能,同时优化了多核并行能力,更容易扩展。​

    [​IMG]

    在具体架构上,Zen2上继承了Zen架构的CCX+IF总线+SMT多线程技术,同时在分支预测、缓存系统、整数、浮点等单元上做了改进,并加入了新的指令,提升了安全性。​

    最终的结果达到或者说超过了AMD的预期,IPC性能提升15%,浮点运算能力翻倍,频率达提升到4.7GHz+。​

    [​IMG]

    最终在性能上,多核性能更因为翻倍的核心数而大幅领先,性能最多可以翻倍。​

    [​IMG]

    7nm工艺+chiplets小芯片设计:首发64核128线程、算力翻倍不是梦​

    在第二代EPYC处理器上,除了Zen2架构在性能上的大量改进,AMD还在业界首发了7nm CPU,先进工艺的加入也让EPYC 7002系列处理器脱胎换骨,核心面积更小,同样的功耗下性能提升25%,或者同样的性能下功耗降低了50%。​

    [​IMG]

    光有这些还不够,EPYC 7002最终能够实现64核的奇迹还离不开另外一项技术的运用——Chiplets混合小芯片设计,简单来说就是将多个芯片集成到一颗处理器里。​

    [​IMG]

    具体到EPYC 7002处理器中,它实际上就是由8组CCD核心、1组IOD核心组成,前者就是CPU核心,每个CCD内有8个CPU内核+32MB L3缓存,7nm工艺制造,总核心面积74mm2,集成38亿晶体管。​

    IOD就是专用的IO核心,集成了DDR、PCIe等子单元,有桌面版及服务器版两种,搭配的PCIe 4.0通道、内存主控是不同的,服务器版IOD核心面积高达416mm2,更为庞大。​

    [​IMG]

    采用Chiplets小芯片设计,一方面是可以将CPU、IO核心分离,分别使用不同的工艺,然后灵活搭配,避免单一大核心的制造难题,因为目前的工艺水平下,制造单一核心的64核处理器面临着很多困难,成本、良率很难控制。​

    [​IMG]

    根据AMD之前的数据,如果将16核32线程的锐龙3代作为100%基准,那么采用原生核心的16核处理器成本将超过2,至少是两倍的成本。​

    如果是EPYC霄龙处理器,那么核心数越多,成本优势就越明显,64核7nm锐龙作为基准的话,那么48核的成本就是0.9,而原生48核设计的成本至少是1.9,依然是两倍水平,而64核设计几乎就是传统CPU工艺的死穴了,几乎没法制造。​

    最终,第二代AMDEPYC 7002系列处理器,通过采用革命性的Chiplets小芯片设计,克服了制造工艺和成本的挑战,为x86服务器带来了高达64核心128线程的超强算力!​

    One More Thing:128条PCIe 4.0通道给高性能计算插上翅膀​

    全新的Zen2架构、7nm工艺、64核128线程几乎就是整个EPYC 7002系列处理器的超高起点了,上面每一点都是领先业界的,对手在短时间内都没做到,但它还不是EPYC 7002处理器的全部。​

    在EPYC 7002处理器上,AMD还重点提升了IO设计。在当前的高性能计算中,IO瓶颈实际上要比CPU性能瓶颈更为严重,提升整体的算力不能忽视IO部分,否认很难发挥出64核128线程的强大性能。​

    [​IMG]

    在EPYC 7002处理器上,AMD提供了128条PCIe 4.0通道,数量及技术双双创造了记录,这是目前已商用的处理器中最为强大的,因为PCIe 4.0能够提供2倍的PCIe 3.0性能,总带宽高达128GB/s,双向可达256GB/s。​

    128PCIe 4.0可以让EPYC 7002系列的服务器连接更多更强的GPU加速卡或者NVMe设备。从实际测试来看,在3DMark的PCIe功能测试中,PCIe4.0比上代性能提升了70%,CDM硬盘性能也提升了35%到50%,优势明显。​

    [​IMG]

    在64核及PCIe 4.0的两大独有优势下,AMD的EPYC 7002处理器已经获得新一代小型超算DGX-A100的认可——这是老对手NVIDIA的产品,但在选择芯片时,也只有EPYC 7002中的旗舰EPYC 7742才符合选择,因为它可以支持双路128核256线程、PCIe 4.0加持的15.36TB NVMe硬盘。​

    [​IMG]

    除了新一代服务器、工作站之外,AMD的EPYC 7002处理器这一年来收获不菲,在多个高性能计算系统中已经大显身手,包括全球超快的两台百亿亿次级超级计算机Frontier、EI Captian,都有EPYC霄龙的身影,以及AMD Radeon Instinct加速卡,都是受益于64核128线程及PCIe 4.0的强大。​

    [​IMG]

    总之,在高性能计算这个方向上,AMD的EPYC 7002系列处理器正在创造奇迹,从发布到现在以来,凭借64核128线程、PCIe 4.0的专属优势,它在各大性能测试中已经斩获了超过170项世界记录,目前还在持续增长中。​

    凭借这些优势,AMD的EPYC已经从高性能计算的起跑点领先。正如AMD CEO苏姿丰之前在采访中说的那样,2020年将是高性能计算的一年。​

    无论你是企业客户还是还是个人用户,从更高核心到更宽IO全方位系统性提升的高性能计算都将改变未来的工作和生活。​

    [​IMG]
     
正在加载...