如何打破内存限制融合HBM与DDR5创新

返回首页　

设为首页　

加入收藏　

今天是:

网站首页电脑主板电脑cpu 电脑内存电脑硬盘电脑显卡电脑电源显示器电脑配件电脑维修

如何打破内存限制融合HBM与D…
英伟达计划Q4推出RTX 5090显…
英伟达正准备RTX 2000 Ada 新…
性能比4090快近一倍！RTX 50…
《地狱潜兵2》更新上线华硕…
《幽灵行者》免费开玩华硕主…
酷睿i7 3960X的VID电压范围是…
购买移动硬盘有什么注意事项
极空间NAS家族又添一员极空间…
线秒钟就让它粉身碎骨
为胜利而战华硕龙骑士GTX76…
抢话费了!华硕显卡年终回馈太…
拒绝文字游戏华硕EN9600GT新…
多云发展传统渠道仍是家电销…
小家电行业由单一功能逐渐向…
吴涛：传统企业数字化转型痛…
电脑为什么用一会儿就黑屏了
Acer将推出新款489寸带鱼屏显…
华硕ROG推出新款245寸电竞显…
电脑CPU温度过高怎么办？电…
如何解决电脑cpu温度过高
cpu温度过高如何处理
主板各种插针接口全程图解pd…
电脑主板插口规格电脑主板接…
Mate50系列拆解：不支持5G主…
谷歌推出Gemini 15 Pro公共预…
谷歌推出Gemini 15 Pro公共预…
笔记本电脑显存和独显不同
GPU卖爆游戏显卡还要涨价下…
【2022年最新显卡天梯图价格…
显卡价格行情（2022年8月15日…
怎么测试开关电源的特殊波形…
纳米软件分享：NSAT-8000电源…
数据中心UPS系统运行能耗优化…
固态硬盘怎么查看大小
tp钱包app官方下载(tp钱包充…
电脑硬盘怎么看多少GB
一万八的惠普频繁死机屡修屡…
戴尔DELL电脑官方旗舰店（来…
杭州来福士戴尔DELL电脑综合…
全都是顶级配置每周二手本本…
二手平台购买电脑与描述不符…
价格更低更超值独显二手本I…
双十一轻薄PC大盘点今年流行…
华硕灵耀、无畏等轻薄本全线
京东上线华硕首款女性AI超薄…
超频三臻RZ620风冷散热器：几…
正常的电脑CPU工作温度是多少…
笔记本cpu温度多少正常笔记…
跳线接法

专题栏目

您现在的位置：电脑评测网 >> 电脑内存 >> 正文

高级搜索

如何打破内存限制融合HBM与DDR5创新

作者：佚名文章来源：本站原创点击数：更新时间：2024/4/15 21:23:20 | 【字体：小大】

　　2011快餐加盟排行榜在 2024 年，如果需要将数十个、数百个、数千个甚至数万个加速器拼接在一起，那么互连就是个大课题了。

　　英伟达（Nvidia）拥有 NVLink 和 InfiniBand。Google 的 TPU 吊舱使用光电路开关（OCS）相互通信AMD拥有 Infinity Fabric，用于芯片到芯片、芯片到芯片以及即将推出的节点到节点流量。当然，还有好的老式以太网。

　　这里的诀窍不是构建足够大的网格，而是抵御与离包相关的大量性能损失和带宽瓶颈。它也没有做任何事情来解决这样一个事实，即所有这些AI处理所依赖的 HBM 内存都以固定的比例与计算相关联。

　　“这个行业正在使用NvidiaGPU作为世界上最昂贵的内存控制器，”Dave Lazovsky说，他的公司Celestial AI刚刚在USIT和许多其他风险投资巨头支持的C轮融资中获得了1.75亿美元，以将其光子织物商业化。

　　去年夏天，我们研究了Celestial的光子结构，其中包括一系列硅光子学互连器、中介层和小芯片，旨在将AI计算从内存中分解出来。不到一年后，他们正在与几家超大规模客户和一家大型处理器制造商合作，将其技术集成到他们的产品中。Lazovsky没有指名道姓。

　　但事实上，Celestial将AMD Ventures视为其支持者之一，其高级副总裁兼产品技术架构师Sam Naffziger在公告发布的同一天讨论了共同封装硅光子小芯片的可能性，这无疑引起了一些人的注意。话虽如此，AMD为光子学初创公司提供资金并不意味着我们将永远在EpycCPU或Instinct GPU加速器中看到Celestial的小芯片。

　　虽然 Lazovsky 无法透露 Celestial 与谁合作，但他确实提供了一些关于该技术如何集成的线索，以及即将推出的 HBM 内存设备的先睹为快。

　　正如我们在最初涉足Celestial的产品战略时所讨论的那样，该公司的零件分为三大类：小芯片、中介层和英特尔EMIB或台积电CoWoS的光学旋转，称为OMIB。

　　不出所料，Celestial的大部分吸引力都集中在小芯片上。“我们没有做的是试图强迫我们的客户采用任何一种特定的产品实施。目前，为光子结构提供接口的风险最低、最快、最不复杂的方法是通过小芯片，“Lazovsky告诉 The Next Platform。

　　从广义上讲，这些小芯片可以以两种方式使用：要么增加额外的 HBM 内存容量，要么作为芯片到芯片的互连，分类或类似于光学 NVLink 或 Infinity Fabric。

　　这些小芯片比 HBM 堆栈小一点，提供光电互连，片外总带宽为 14.4 Tb/s或 1.8 GB/s。

　　话虽如此，我们被告知可以制造一个小芯片来支持更高的带宽。第一代技术可以支持每平方毫米约 1.8 Tb/s的速度。与此同时，Celestial的第二代Photonic结构将从56 Gb/s提高到112 Gb/s的PAM4 SerDes，并将通道数量从4个增加到8个，从而有效地将带宽翻两番。

　　因此，14.4 Tb/s不是上限，而是现有芯片架构能够处理的结果。这是有道理的，否则任何额外的容量都会被浪费。

　　这种连接性意味着 Celestial 可以实现类似于 NVLink 的互连速度，只是沿途的步骤更少。

　　虽然芯片到芯片的连接相对不言自明——在每个封装上放一个光子织物小芯片并对齐光纤连接——但内存扩展完全是另一种动物。虽然 14.4 Tb/s的速度并不慢，但对于多个 HBM3 或 HBM3e 堆栈来说，它仍然是一个瓶颈。这意味着添加更多的 HBM 只会让您的容量超过某个点。尽管如此，用两个 HBM3e 堆栈代替一个堆栈并不算什么。

　　Celestial 有一个有趣的解决方法，即它的内存扩展模块。由于带宽的上限为 1.8 GB/s，因此该模块将仅包含两个总计 72 GB 的 HBM 堆栈。此外，还将配备一组 4 个DDR5 DIMM，支持高达 2 TB 的额外容量。

　　Lazovsky不愿将所有豆子都洒在产品上，但确实告诉我们，它将使用Celestial的硅光子学中介层技术作为HBM，互连和控制器逻辑之间的接口。

　　说到模块的控制器，我们被告知 5nm开关ASIC有效地将 HBM 变成 DDR5 的直写缓存。“它为您提供了 DDR 的容量和成本以及带宽和 HBM 互连的 32 个伪通道的所有优势，从而隐藏了延迟，”Lazovsky 解释道。

　　他补充说，这与英特尔对至强Max所做的或英伟达对其GH200超级芯片所做的事情相去不远。“它基本上是一个增压的 Grace-Hopper，没有所有的成本开销，而且效率更高。”

　　效率提高多少？“我们的内存事务能量开销约为每比特 6.2 皮焦耳，而通过 NVLink、NVSwitch 进行远程内存事务的开销约为 62.5 皮焦耳，”Lazovsky称，并补充说延迟也不高。

　　“这些远程内存事务的总往返延迟，包括通过光子结构的两次旅行和内存读取时间，为120纳秒，”他补充道：“因此，它将比大约80纳秒的本地内存多一点，但它比去Grace并读取参数并将其拉到Hopper要快。”

　　据我们了解，这些内存模块中的 16 个可以啮合并为一个内存交换机，并且可以使用光纤随机播放连接多个这些设备。

　　这意味着，除了计算、存储和管理网络之外，使用Celestial互连构建的芯片不仅能够相互连接，而且能够共享内存池。

　　“这允许你以一种非常非常有效的方式进行机器学习操作，例如广播和减少，而无需切换，” Lazovsky说。

　　Celestial面临的挑战是时机。Lazovsky告诉我们，他预计将在 2025 年下半年的某个时候开始向客户提供光子织物小芯片的样品。然后，他预计至少还需要一年时间，我们才能看到使用该设计的产品投放市场，并在2027年实现销量增长。

　　然而，Celestial并不是唯一一家追求硅光子学的初创公司。另一家获得英特尔投资支持的光子学初创公司Ayar Labs已经将其光子学互连集成到原型加速器中。

　　然后是 Lightmatter，它在去年 12 月获得了 1.55 亿美元的 C 轮融资，并试图通过其 Passage 中介层做一些与 Celestial 非常相似的事情。当时，Lightmatter 首席执行官尼克·哈里斯（Nick Harris）声称，它有客户使用 Passage 来“扩展到 300,000 台节点的超级计算机”。当然，和拉佐夫斯基一样，哈里斯也不会告诉我们它的客户是谁。

　　还有 Eliyan，它正试图通过其 NuLink PHY 完全摆脱中介层——或者如果你必须拥有它们，可以提高中介层的性能和规模。

　　无论谁在这场竞赛中脱颖而出，向共封装光学器件和硅光子中介层的转变似乎只是时间问题。

　　声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

　　上千乃至数千的价格，加上CPU、主板等硬件支持的普及还不到位等问题，这第一批

　　控制器和DRAM上增加了均衡（EQ），而传统的仿真工具无法在这种复杂性下进行建模。图1.

　　控制器和 DRAM 上增加了均衡（EQ）。输入/输出缓冲器信息规范

　　(High Bandwidth Memory)即高带宽存储器，通过使用先进封装(如TSV硅通孔、微凸块)将多个DRAM芯片进行堆叠，并与GPU一同进行封装，形成大容量、高带宽的

　　dual-inline memory modules （DIMM）的过渡。

　　5SDRAM标准（JESD79-5），为全球计算机拉开新时代序幕。简言之，

　　作为国产存储品牌的领袖，拥有光威(Gloway)、阿斯加特(Asgard)两大品牌的嘉合劲威今天宣布，正在积极布局导入

　　条采用镁光DRAM，频率4800MHZ，电压1.1V，时序40-40-40 1.1V ，容量16G（单面）/32G（双面

　　近日，英特尔和微星分别官宣，Alder Lake 12代酷睿处理器和Z690主板即将发布，这两款产品的发布消息一出，将

　　模组数据传输速率达4800Mbps，突发长度和预取长度扩展到16位，使得存储器单一读写指令可存取的数据量是

　　不报希望的时候，结果它就悄悄的来了。从2017年就已经传出消息说JEDEC就宣称将在2018年完成

　　的CAC信号有了ODT功能，PCB布线约束可以放宽松了吗？毕竟，哪里信号质量差就可以端接哪里，So easy。带着这个

　　设备相比，数据速率和带宽提高了33%· 为未来的服务器平台提供运行速度高达6400 MT/s的

　　的早期开发，并预计在2024年之前完成设计。据悉，在近日召开的研讨会上，三星负责测试和系统封装（TSP）的副总裁透露，随着未来

　　的一些总体特点，也到了很多网友的关注，文章获得了很多的点击和阅读量。因此高速先生也应广大网友的要求，在本期增加关于

　　，FFE，DFE这些！关于高速信号的介绍就到这里，高速先生差点忘记本文其实主要想写的是

　　技术参数，最大的关注点在于都是由7nm工艺制造。7nm工艺被认为是极限，因为到了7nm节点即使是finfet也不足以在保证性能的同时抑制漏电。所以工业界用砷化铟镓取代了单晶硅沟道来提高器件性能，7nm是一项非常复杂的技术。

　　10月18日消息根据AnandTech的报道，今年早些时候，Cadence和美光进行了业界首次公开演示下一代

　　已经近在眼前，2021年就会正式上市。今天美光宣布开始向客户出样最新的

　　根据Toms Hardware的报道，SK 海力士在CES 2020上展示了最新的

　　升级的动力应该是来自对带宽有强烈需求的专业应用领域，比如云服务器、边缘计算等等，由于系统

　　据外媒报道称，由于种种原因所致，Intel和AMD两家要在明年才能拿出支持

　　原以为在肺炎病毒无情来袭的2月将是平平无奇的日常，但是随着配备LPDDR5的到来，

　　的话题再次走进大众的视野范围当中。对于目前的情况来说，我们到底应该做一个等等党等

　　将具有改进的命令总线效率，更好的刷新方案以及增加的存储体组以获得额外的性能。

　　的讨论一直沸沸扬扬，因为制造商们一直在展示各种各样的测试模块，为推出完整的产品做准备。计划使用

　　第十一代酷睿桌面版不断泄露消息，所以正式产品还没上市就让人没了新鲜感，也许正是这个原因，很多小伙伴的好奇的目光开始转向了更下一代平台，特别是

　　12 月 1 日消息根据外媒 TechPowerUp 的消息，十铨将于 2021 年发布 ELITE 系列

　　作为国产存储品牌的领袖，拥有光威（Gloway）、阿斯加特（Asgard）两大品牌的嘉合劲威今天宣布，正在积极布局导入

　　模组的工程样品开发工作。该公司目前正与华硕、微星、技嘉、华擎等主板制造商合作，对

　　威刚旗下电竞品牌XPG今天发布了超高频率的XPG龙耀D50 Xtreme

　　最快在2021年9月份，随着Intel的十二代酷睿Alder Lake的到来，

　　回顾2020年，在新基建的驱动下，数据中心正迎来发展的新契机。这一趋势加速推动了

　　近日，英特尔和微星分别官宣，Alder Lake 12代酷睿处理器和Z690主板即将发布，这两款产品的发布消息一出，将

　　与存储解决方案领导者 SMART Modular世迈科技 (“SMART”)宣布推出新型DuraMemory™

　　即4800MHz；集成PMIC电源管理芯片，电压降至1.1V，功耗更低；加入On-dieEcc纠错功能，运行更加稳定等。除了一线品牌外，老牌存储厂商朗科也在积极布局这一领域，继绝影RGB

　　颗粒测试设计，阻抗一致性优异，极低延迟，最高速率支持6.4Gbps，可以用于78pin和96pin/102pin封装的

　　运行频率,这就不得不提到存储界的领军品牌KLEVV科赋,在九月底发布的

　　带宽大小在现代计算中非常重要，在数据中心等应用场景下尤为如此。在不久的将来，

　　芯片也面临着CPU/GPU一样的微缩难题，解决办法就是上EUV光刻机，但是设备实在太贵，现在还要榨干DUV工艺最后一滴，

　　市场的发展，威刚表示，现阶段观察到需求端春燕来临，主要来自pc，随着顾客需求的明显好转和pc

　　4 3200MHz的1.6倍传输速度和1.9倍传输带宽，让用户在使用台电

　　采用了编号为“H5CG48AEBDX018”的SK海力士A-die颗粒，与市面上大部分

　　标准，但它们面向不同的应用场景，并且在设计上有一些不同。首先，让我们来了解一下LPDDR5

　　技术，它们各自在性能、功耗、带宽等方面都有不同的特点。下面将详细比较这两种

　　是为了满足高效率高性能的多种需求所设计的，不仅包括客户端系统，还有高性能服务器，为未来的数据中心和计算机改革提供全新的

　　三星将获美国66亿美元补贴，扩大美国芯片产量!全新华为太空表4月8日开售

　　【米尔-芯驰D9360商显板试用评测】成功解决QCamera的模块调用，并编写简单的查找摄像头程序

　　【米尔-芯驰D9360商显板试用评测】QT5添加 multimedia multimediawidgets，提示找不到模块

电脑内存录入：admin 责任编辑：admin
	上一个电脑内存：谷歌推出Gemini 15 Pro公共预览版！支持本地音频理解开源Gemma变种也来了下一个电脑内存：没有了

　栏目文章

如何打破内存限制融合HBM与DDR5创新 (04-15)	谷歌推出Gemini 15 Pro公共预览版！支持本地音… (04-14)
谷歌推出Gemini 15 Pro公共预览版！支持本地音… (04-14)	笔记本电脑显存和独显不同 (04-14)
“手机内存”英语怎么说？带你认识手机文件夹… (04-13)	关于内存条的“Die”你知道这是啥吗？ (04-13)
内存条品牌及其英文缩写 (04-13)	【OS】操作系统高频面试题英文版(2) (04-12)
超频资料_电子发烧友网 (04-12)	全球顶尖AI研究者中国贡献26%；1320亿参数大模… (04-12)
全系内存规格迎来大升级vivo S18 Pro让你不再… (04-10)	华为P70月底发售？4个版本全系内存12GB起步 (04-10)
全系内存规格迎来大升级vivo S18 Pro让你无需… (04-10)	什么是视频记忆？视频内存和运行内存有什么区… (04-09)
视频存储是什么 (04-09)	视频丨实拍废旧电脑“炼金术” 内存条变黄金只… (04-09)
【干货】列举 CC（ContextCapture）建模常见问… (04-08)	【睿见】胡延平：AI大模型商业化处于第一步起… (04-08)
直屏手机更有“Ai”一加Ace3V屏幕测试报告 (04-08)	电脑内存不足怎么清理？4个小妙招帮你释放内存… (04-07)

	设为首页加入收藏联系站长友情链接版权申明网站公告管理登录
	电脑评测网声明：登载内容出于传递信息之目的，绝不意味着赞同其观点或证实其描述，若侵权请来信告知，我们将及时处理！