返回首页  设为首页  加入收藏  今天是:
网站首页电脑主板电脑cpu电脑内存电脑硬盘电脑显卡电脑电源显示器电脑配件电脑维修
相关文章
 英伟达升级GRACE-HOPPER GPU…
 电脑蓝屏全是英文怎么解决
 LPDDR5和LPDDR4X内存还傻傻分…
 显卡发展历史ppt
 鲜为人知的显卡发展史3D篇(…
 时间简史——显卡发展简史(…
 显卡的发展历程
 时间简史——显卡发展简史(…
 铁路相关概念股票一览一看就…
 电源的功率_百度文库
 悉智科技是什么企业?悉智科…
 发电功率什么是发电功率?的…
 电源功放扬声器的额定功率是…
 机械硬盘数据如何完整恢复?…
 给电脑换了4TB的固态硬盘闲置…
 机械硬盘安装在机箱哪个位置…
 最新_存储_DIY电脑硬件频道-…
 台式机械硬盘在哪个位置笔记…
 精研科技董事长王明喜:“飞…
 神州数码:关于为子公司担保…
 正规上门维修电脑
 “暖阳驿站”让老人安享晚年
 正规电脑维修上门多少钱
 显卡业界渠道第153页_第三媒…
 显卡业界渠道第112页_第三媒…
 显卡业界渠道第7页_第三媒体
 显卡业界渠道第76页_第三媒体
 显卡业界渠道第152页_第三媒…
 笔记本电脑CPU可以升级吗?
 CPU如何升级 电脑cpu升级方法
 笔记本CPU升级攻略 将DIY精神…
 旧笔记本电脑CPU的升级方向
 联想发布高刷版笔记本处理器…
 戴尔21:9超宽显示器:心有多…
 联想49英寸超宽曲面显示器发…
 飞利浦(PHILIPS)
 飞利浦(PHILIPS)显示器 23…
 双11悦己消费季DisplayHDR60…
 主板接口大盘点细数历年主流…
 主板篇-主板上有哪些对外接口
 主板接口 - 电子发烧友网
 主板有哪些主要接口?主板诊…
 m2接口sata和nvme有什么区别…
 电脑虚拟内存什么意思什么叫…
 虚拟存储器的英文简称为____…
 计算机系统之虚拟内存
 电脑虚拟内存是什么?
 PD虚拟机如何分配内存和CPU核…
 RTX 4060显卡性能怎么样 40系…
 40系显卡上市时间表和官方售…
专题栏目
网络
您现在的位置: 电脑评测网 >> 电脑内存 >> 正文
高级搜索
英伟达升级GRACE-HOPPER GPU内存着力为大语言模型提供加持
作者:佚名 文章来源:本站原创 点击数: 更新时间:2023/10/23 13:28:16 | 【字体:

  立云购物商城原标题:英伟达升级GRACE-HOPPER GPU内存,着力为大语言模型提供加持

  如果情况真如英伟达及其他众多科技企业预料的那样,即大语言模型会成为新的编程模型基础,那么混合CPU-GPU计算引擎就将是新的通用计算平台。

  多年以来,英伟达一直为其他厂商提供高端SXM流多处理器模块或PCI-Express卡,用以构建此类混合设备。而如今凭借着最新的GH200超级芯片,也就是把基于Arm架构的“Grace”CPU同基于第六代GPU计算引擎的“Hopper”GPU相结合,英伟达正在AI基础设施领域迎头赶上,努力打造出适合运行超大规模AI推理与训练工作负载的整体系统。

  尽管英伟达从今年5月起就一直在批量销售其Grace-Hopper超级芯片,同时完成了对仅可接入Hopper GPU板的HGX形制服务器和可混合接入Grace及/或Hopper芯片的MGX形制服务器的标准化。但目前最炙手可热的行业新贵,则是英伟达最近在Siggraph 2023会议上刚刚宣布的第二代GH200超级芯片。

  在第二代GH200超级芯片上,所使用的Grace CPU及Hopper GPU与上一代完全相同。其中Grace芯片基于Arm公司的“Demeter”Neroverse Arm V2核心。三年前英伟达曾试图以400亿美元收购Arm,如今后者刚刚再次申请上市。初代Hopper SXM5 GPU计算引擎配备80 GB HBM3内存和3.35 TB/秒的内存带宽。去年Hopper GPU刚刚推出时,这款SXM5设备共搭载6个HBM3内存栈,但基点只有5个处于活动状态(我们怀疑是出于良品率的考虑),所以实际容量仅为80 GB——而非大家预期的96 GB。PCI-Express版本的Hopper拥有8个HBM3内存栈,其中同样只有5个能够工作,且内存带宽也仅为2 TB/秒(可能是为了降低耗电和发热量而在刻意控制时钟速率)。

  而在Grace-Hopper SXM5超级芯片(正式名称为GH200)刚发布时,英伟达终于成功启用了全部6个内存栈,让Hopper GPU获得了96 GB内存和4 TB/秒的内存带宽。到了第二代GH200超级芯片这边,英伟达开始将这款计算复合体中的Hopper部分升级为HBM3e内存,此举令容量提高至141 GB,带宽则提高至5 TB/秒。与去年发布的初代Hooper SXM5设备相比,新版本的内存容量增加了76.3%,内存带宽也上升了49.3%。

  英伟达超大规模与高性能计算(HPC)总经理Ian Buck在采访中表示,此番内存升级就是把HBM3换成了HBM3e。Hopper GPU在设计之初就考虑到对速度更快、容量密度更高的HBM3e内存的支持需求,因此可以交叉兼容并对接这些内存技术。我们初步判断此番容量和带宽提升并非源自HBM技术栈中内存芯片数量的增加,毕竟除非对Hopper SXM5封装进行重新设计,否则内存栈数量应该无法超过6个。

  Buck并未提及第二代GH200超级芯片中的HBM3e内存来自哪家供应商,但三星、SK海力士和美光科技都在开发HBM3e内存。所以理论上讲,其中任何一家都可以为改进后的超级芯片负责内存供应,毕竟二代GH200今年年底才开始提供样品、明年第二季度正式出货,准备时间还算充裕。而且Buck证实英伟达拥有多家HBM内存供应商。考虑到这种材料的制造成本和制造难度都比常规DRAM要高,所以英伟达的“狡兔三窟”策略非常明智。据我们了解,为了提高制造供应,所有三家供应商都在为英伟达的GPU引擎提供HBM3e内存。

  当我们问到常规Hopper SXM5和Hopper PCI-Expres卡何时迎来HBM3e升级时,Buck对这个问题保持沉默。此外,当我们提到 Grace CPU中的LPDDR5内存在升级后也能增加内存容量和传输带宽时,Buck同样表现出职业精神、不对尚未发布产品说得太多。

  英伟达尚未公布任何关于Hopper或Grace-Hopper计算引擎的定价,也未提到是否会按原本定价交付这波内存容量和内存性能都有提升的二代产品(我们严重怀疑这不太可能)。但Buck明确表示,英伟达预计之前在采购Grace-Hopper超级芯片的系统制造商将“很快”转向第二代产品。

  对于长期受到内存容量和内存带宽限制的HPC和AI应用程序,HBM3e内存的加入将极大提升这类用例的性能水平。

  Buck在谈到下一代GH200时称,“我预计以往受到带宽限制的应用将实现近1.5倍的性能提升。当然,也不是在所有场景下都能达到这样的增幅,但大致也是在这个区间。另外内存容量也有增加,意味着大家可以在单一GPU上运行体量更大的模型。而且现在通过CPU-GPU的组合,大家实际拥有近700 GB的组合内存,就是说单一GPU能处理的负载更多了。对于那些用不着两个GPU共同运行的模型,其性能肯定会节节攀升。”

  这是Siggraph会议带来的第一份公告。第二条新闻,则是英伟达推出了一款双插槽Grace-Hopper超级芯片,该芯片搭载900 GB/秒的直连NVlink端口,可相互对接以形成内存共享复合体,共包含2个Grace CPU和2个Hopper GPU。这实际上就形成了机器间的四路链接,跟传统上的四路CPU系统基本相同,其中每台设备都能与复合体中任意其他设备的内存进行通信。如果愿意,大家也可以称其为“非对称NUMA”。

  英伟达公司联合创始人兼CEO黄仁勋在Siggraph大会的主题演讲中解释道,“它基本上是把一块巨大的GPU和一块巨大的CPU,转化成一块巨大的超级芯片。其中的CPU现在拥有144个核心,GPU拥有10 TB/秒的帧缓冲带宽和282 GB的HBM3e内存。很明显,大家几乎能把自己选择的任何大语言模型直接塞进去,而它则疯狂执行推理运算。大语言模型的推理成本将因此显著降低,要知道这可是台非常小巧的计算设备。您可以将其扩展至世界各地的数据中心,可以将其接入以太网,也可以将其与InfiniBand相对接。”

  降低推理成本这一点非常关键,因为当我们必须在执行训练的相同机器上进行推理时,那么除非能把训练成本也降低到跟推理持平的状态,否则开销将太过高昂。当然,与采用Hopper SXM5单元、各单元通过NVSwitch结构互连的八路GPU复合体DGX H100服务器相比,英伟达这套Grace-Hopper方案具体能省多少钱仍有待观察。

  成本节约效果,实际上取决于Grace CPU能比英特尔或AMD的x86处理器便宜多少。我们觉得后者虽然价格更高,但也能支撑起更大的CPU内存空间和闪存存储容量,类似于DGX H100服务器及其HGX版本。再联想到可以用NVSwitch互连结构将最多256个GPU构建成MGX Grace-Hopper集群,并采用InfiniBand将多个Pod交叉耦合成一个超级Pod。这样一个拥有256 GPU的Grace-Hopper超级Pod,应该就有能力跟采用英特尔“Sapphire Rapids”至强SP CPU、配备同样256个Hopper GPU并依靠NVSwitch实现节点间互连的Hopper DGX H100超级Pod正面抗衡了,最终究竟谁更胜一筹着实令人期待。不过考虑到第二代Grace-Hopper GH200拥有高于GH100 SXM5的内存容量和内存带宽,结果大概率会是“一代新人胜旧人”。

  但如果GH100 SXM5也升级为141 GB容量加5 TB/秒的HBM3e技术栈,那胜负恐怕还未可知,具体要取决于AI训练/推理工作负载的性能、及其对内存/网络层次结构的适配效果。返回搜狐,查看更多

电脑内存录入:admin    责任编辑:admin 
  • 上一个电脑内存:

  • 下一个电脑内存: 没有了
  •  
     栏目文章
    普通电脑内存 英伟达升级GRACE-HOPPER GPU内存着力为大语言… (10-23)
    普通电脑内存 电脑蓝屏全是英文怎么解决 (10-23)
    普通电脑内存 LPDDR5和LPDDR4X内存还傻傻分不清?带你一文看… (10-23)
    普通电脑内存 电脑虚拟内存什么意思什么叫做虚拟内存 (10-23)
    普通电脑内存 虚拟存储器的英文简称为____。 (10-23)
    普通电脑内存 计算机系统之虚拟内存 (10-23)
    普通电脑内存 电脑虚拟内存是什么? (10-23)
    普通电脑内存 PD虚拟机如何分配内存和CPU核数 (10-23)
    普通电脑内存 恒生电子UF30内存交易产品正式发布 (10-22)
    普通电脑内存 巴掌大小 超高性能 办公和游戏都很行!机械师… (10-22)
    普通电脑内存 三星推出“Shinebolt”HBM3E内存 可以满足下一… (10-22)
    普通电脑内存 浙商证券给予恒生电子买入评级恒生电子点评报… (10-22)
    普通电脑内存 电脑内存条是什么 电脑内存条介绍【详解】 (10-22)
    普通电脑内存 电脑选购的时候要考虑的一些地方(一) (10-21)
    普通电脑内存 你常见的“区块链”英文缩写是什么意思? (最… (10-21)
    普通电脑内存 半导体专业术语表:中英文缩写 (10-21)
    普通电脑内存 第一章cpu、内存、缓存关系梳理 (10-21)
    普通电脑内存 4gb内存是多大 (10-21)
    普通电脑内存 电脑的组成是什么 电脑的组成介绍【详解】 (10-20)
    普通电脑内存 i7-13700KF支持什么内存频率 是几核几线程? (10-20)