纤丽婷此外,DirectX12Ultimate 功能保证在即将推出的视频游戏中支持硬件光线追踪、可变速率着色等。AD102图形处理器是一个大芯片,芯片面积为611mm²。与完全解锁的 GeForce RTX4090Ti 不同,后者使用相同的 GPU 但启用了所有18432着色器,NVIDIA 已禁用 GeForce RTX4090上的一些着色单元以达到产品的目标着色器数量。它具有17408个着色单元、544个纹理映射单元和192个 ROP。还包括544个张量核心,有助于提高机器学习应用程序的速度。该卡还具有136个光线追踪加速核心。NVIDIA 已将24GB GDDR6X 内存与 GeForce RTX4090配对,使用384位内存接口连接。GPU 运行频率为2055MHz,可提升至2325MHz,内存运行频率为1325MHz(21.2Gbps 有效)。
1.采用4nm 工艺制造。更小的工艺可以将更多的硅片塞入相同的空间,并且提高了功率和性能效率。
2.第三代光线追踪核心将光线如何与定义图像的多边形交互的计算吞吐量提高了一倍,英伟达称这将浮点运算速度提高了2.8倍。
3.驱动 Nvidia 的 DLSS 升级软件的第四代 Tensor 内核允许 DLSS 从生成单个像素跳转到更有效的基于帧的算法,用于其新的 DLSS3。从10月开始,已有超过35款游戏和应用程序注册加入 DLSS3.
4.更新后的流式多处理器提供的吞吐量是 Ampere SM 的2倍以上。
6.Shader Execution Reordering 优化了将光线追踪数据传递给 SM 以进行光栅化,该公司表示,这将着色器性能提高了2倍,帧速率提高了25%。
7.光流加速器使用像素运动数据到 DLSS 以生成新帧;Nvidia 表示,这提高了 CPU 密集型游戏(例如复杂的模拟游戏,如Microsoft Flight Simulator)的性能。
8.双 AV1编码器应该可以提高流媒体的动态视频处理质量。OBS 预计将在10月发布其流媒体软件的新版本,而 Discord 计划在今年晚些时候支持它。
9.为了配合新的处理能力,Nvidia 还引入了一些新的软件算法来提高性能。
10.Opacity Micro-Maps 预先在世界对象中创建和保存蒙版,因此不需要重新创建它们。
11.置换微网格是新 RT 内核可以处理的较小三角形的网格,无需在其他地方存储或预处理;它们提高了速度(每个 Nvidia 提高了10倍),并且在某些情况下需要的视频内存减少了20倍。
与完全解锁的 GeForce RTX4090Ti 不同,后者使用相同的 GPU 但启用了所有18432着色器,NVIDIA 已禁用 GeForce RTX4090上的一些着色单元以达到产品的目标着色器数量。它具有16384个着色单元、512个纹理映射单元和192个 ROP。还包括512个张量核心,有助于提高机器学习应用程序的速度。该卡还具有128个光线追踪加速核心。NVIDIA 已将24GB GDDR6X 内存与 GeForce RTX4090配对,使用384位内存接口连接。GPU 运行频率为2235MHz,可提升至2520MHz,内存运行频率为1325MHz(21.2Gbps 有效)。
GeForce RTX4090带AD102图形处理器,AD102图形处理器是一个大芯片,裸片面积为608平方毫米,有763亿个晶体管。与完全解锁的 GeForce RTX4090Ti 不同,后者使用相同的 GPU 但启用了所有18176个着色器,NVIDIA 已禁用 GeForce RTX4090上的一些着色单元以达到产品的目标着色器数量。
根据最新的小道消息,RTX4090显卡很可能至少是600W的功耗,大家要知道3090ti目前是450W的功耗,那么RTX4090显卡就得用超过1000W的电源了。
GDDR6X内存模块预计每个消耗3.4W。添加其中的12个,您将获得大约40W 的内存芯片功率。这仍然低于 RTX3090的12个12GB 模块消耗的60W。内存 VRM 的效率应该在60-70% 左右,GPU 核心 VRM (NVVDD) 达到90%。加上风扇、散热器、分流器等,这达到了150W,不分上下,构成了整体600W 的数字。
RTX4090是完全无压力带动原神全特效的,显卡需要GT1030级别或者是MX250,内存上的要求是电脑内存最低8GB RAM,系统的要求是WIN7,WIN8,WIN10,GT1030显卡发售的日子是2017年,所以4090完全是秒杀GT1030,自然就带的动原神了,多开也无压力。
此前外媒爆料40系显卡将会在9月下旬跟大家见面,因为NVIDIA GTC2022大会马上就要在9月19日开始,一直持续到9月22日,英伟达CEO黄仁勋已经确认将会在GTC2022上通过演讲带来40系显卡的相关消息,所以双十一前还是很有可能会发售的,不过自然按照惯例先发售的是4090,所以如果是等待更低型号的40系显卡比如4060这样的,就需要等到明年2023年了。
Ampere GA102GPU 预计将配备多达7个 GPC,并且比 GA103GPU 增加了一个 GPC。每个 GPU 将由6个 TPC 和2个 SM 组成,与现有芯片的配置相同。每个 SM(流式多处理器)将容纳四个子内核,这也与 GA102GPU 相同。改变的是 FP32和 INT32核心配置。每个子核将包括128个 FP32单元,但组合的 FP32+INT32单元将达到192个。这是因为 FP32单元与 IN32单元不共享相同的子核。128个 FP32内核与64个 INT32内核是分开的。
所以总的来说,每个子核心将由32个 FP32加上16个 INT32单元组成,总共48个单元。每个 SM 将总共有128个 FP32单元加上64个 INT32单元,总共192个单元。由于共有84个 SM 单元(每个 GPC12个),我们正在查看12,288个 FP32单元和6144个 INT32单元,总共18432个内核。
|