万达信息根据官方数据公布,RTX 4090 是全球最快的游戏 GPU。性能方面,英伟达称在完整的光线追踪游戏中,与上一代采用 DLSS 2 的 RTX 3090 Ti 相比,采用 DLSS 3 的 RTX 4090 的性能提升可达 4 倍。在现代游戏中,RTX 4090 的性能提升高达 2 倍,同时保持了相同的 450W 功耗。
1.采用4nm 工艺制造。更小的工艺可以将更多的硅片塞入相同的空间,并且提高了功率和性能效率。
2.第三代光线追踪核心将光线如何与定义图像的多边形交互的计算吞吐量提高了一倍,英伟达称这将浮点运算速度提高了2.8倍。
3.驱动 Nvidia 的 DLSS 升级软件的第四代 Tensor 内核允许 DLSS 从生成单个像素跳转到更有效的基于帧的算法,用于其新的 DLSS3。从10月开始,已有超过35款游戏和应用程序注册加入 DLSS3.
4.更新后的流式多处理器提供的吞吐量是 Ampere SM 的2倍以上。
6.Shader Execution Reordering 优化了将光线追踪数据传递给 SM 以进行光栅化,该公司表示,这将着色器性能提高了2倍,帧速率提高了25%。
7.光流加速器使用像素运动数据到 DLSS 以生成新帧;Nvidia 表示,这提高了 CPU 密集型游戏(例如复杂的模拟游戏,如Microsoft Flight Simulator)的性能。
8.双 AV1编码器应该可以提高流媒体的动态视频处理质量。OBS 预计将在10月发布其流媒体软件的新版本,而 Discord 计划在今年晚些时候支持它。
9.为了配合新的处理能力,Nvidia 还引入了一些新的软件算法来提高性能。
10.Opacity Micro-Maps 预先在世界对象中创建和保存蒙版,因此不需要重新创建它们。
11.置换微网格是新 RT 内核可以处理的较小三角形的网格,无需在其他地方存储或预处理;它们提高了速度(每个 Nvidia 提高了10倍),并且在某些情况下需要的视频内存减少了20倍。
2999美元大约是2万块钱左右,这个爆料消息信的人非常少,不过业内专家预计公版的建议零营价为1899美元。因此,通常被称为“定制版”的华硕、技嘉等 变体将更加果贵,也许成本可能会超过2499美元。
如果是1899美元的线W人民币,这看上去倒是靠谱一些,然而,台积电最近提高了5nm的成本,这可能导致 RTX4090以及其他 RTX40系列卡的价格与其直接前辈相比上涨。不过,这纯粹是预测,在英伟达自己就价格发表意见之前,我们无法确定具体的价格数字。
GTC2022 主题演讲发布会将于北京时间9月20日晚11点开始,重播将于9月21日上午10点开始,据悉届时有 40 系显卡的消息发布,英伟达表示本次演讲的主题是探索我们在 AI、虚拟协作、图形及更多领域的最新突破如何加速当今各行各业中的实际成果。
截止2022年9月底,30系显卡都能运行市面上的所有游戏,更何况是40系显卡,所以如果担心40系显卡出来未来会有带不动的游戏,那完全是没必要的,其实很多游戏玩家已经发现了,游戏业界发展到这个地步,很难说有厂商会做一款不是40系显卡玩不了的游戏,那它还怎么赚钱,更何况现在2022年大部分普通人的主流配置还是1060。
PS5的游戏性能也和2060、2070这样的显卡差不多,所以未来是不会出现4090还带不动的游戏,因此RTX 4090是能玩市面所有的游戏。
1.RTX4090是用NVIDIA Ada Lovelace 架构,提供出色的游戏和创作、专业图形、人工智能和计算性能。为光线追踪和基于 AI 的神经图形提供革命性的性能。它提供了显着更高的 GPU 性能基线,并标志着光线追踪和神经图形的临界点。
3.Ada 的第三代 RT 内核具有两倍的射线-三角形相交吞吐量,将 RT-TFLOP 性能提高了2倍以上。
4.基于 Ada 架构构建的显卡采用带有 AV1编码的全新第八代 NVIDIA 编码器 (NVENC),为流媒体、广播公司和视频通话者提供了大量新的可能性。
Ampere GA102GPU 预计将配备多达7个 GPC,并且比 GA103GPU 增加了一个 GPC。每个 GPU 将由6个 TPC 和2个 SM 组成,与现有芯片的配置相同。每个 SM(流式多处理器)将容纳四个子内核,这也与 GA102GPU 相同。改变的是 FP32和 INT32核心配置。每个子核将包括128个 FP32单元,但组合的 FP32+INT32单元将达到192个。这是因为 FP32单元与 IN32单元不共享相同的子核。128个 FP32内核与64个 INT32内核是分开的。
所以总的来说,每个子核心将由32个 FP32加上16个 INT32单元组成,总共48个单元。每个 SM 将总共有128个 FP32单元加上64个 INT32单元,总共192个单元。由于共有84个 SM 单元(每个 GPC12个),我们正在查看12,288个 FP32单元和6144个 INT32单元,总共18432个内核。
据说 GPU 的尺寸约为600平方毫米,将采用台积电4N 工艺节点,这是台积电为绿色团队设计的5nm (N5) 节点的优化版本。
对来自 Ampere 和 Ada 一代的三个 xx90SKU 旗舰部件的快速比较表明,仅在这一基准测试中,RTX4090将比 RTX3090Ti 快66%,比 RTX3090快82%。传闻 RTX4090拥有16384个 CUDA 核心,比 RTX3090Ti 多52%。这意味着核心数量的增加只是使下一个旗舰更快的一个变量。这可能是由于更高的时钟或更高的 TDP,预计下一代都会增加。
|