锦瑟淡月新凉近日,Arm发布了全新的Arm 2023 全面计算解决方案,涵盖了全新旗舰级 Arm ImmortalisGPU、全新的 Armv9 CPU 计算集群,它还带来了新的提升和优化,使 Arm 开发者能够更容易地访问软件。
全新的ArmImmortalis GPU基于Arm第五代GPU架构建立,这是 Arm 有史以来效率最高的 GPU 架构,在设计时还兼顾了 CPU 和系统。该架构重新定义了部分图形管道,显著减少了内存带宽,从而让总体系统效率与功耗优化高达 14%。搭载了延迟顶点着色 (DVS) 技术,重新定义了 GPU 中的图形数据流,优化内存访问与带宽使用的方法节省功耗并提高性能表现。
首款基于第五代架构的 GPU——Immortalis-G720,专为旗舰智能手机而设计,可带来 15% 的性能提升,减少了多达 40% 的内存带宽用量,相较于前一代产品,Immortalis-G720 的性能提高了 15%,而面积仅增加 2% 。
CPU部分与GPU是相辅相成的,Arm推出了全新 Armv9 Cortex 计算集群,这个集群已连续三年实现两位数的性能提升,全新的Cortex-X4 是第四代 X 内核,相比Cortex-X3 性能提高了 15%,并带来了一个可以显著降低功耗多达 40% 的高能效微架构。而面积仅增加了 10%,这是Cortex-X系列处理器中,在每平方毫米的性能方面最出类拔萃的产品。目前Arm已在 TSMC N3E 制程工艺上顺利完成了业内首个 Cortex-X4 流片。
同时还有全新的大核处理器 Cortex-A720 和全新小核 Cortex-A520,与其上一代相比,双双在能效方面都提高了 20%。
同步升级的还有DynamIQ 管理内核DSU-120,进一步提升了CPU并行性,让更多核心可以并行运转,布局到可穿戴设备、智能手机和笔记本电脑等多种不同设备当中。服务于核心的CI-700也有升级,降低延迟达25%。
值得一提的是全新的CPU全部都升级为了纯64位计算以及Armv9.2指令集,全面放弃了32位部分,这也是目前行业大势所趋。
GPU最初用在PC和移动端上运行绘图运算工作的微处理器,与CPU集成以集成显卡(核显)的形态发挥功能。NVIDIA于2007年率先推出独立GPU(独显),使其作为“协处理器”在PC和服务器端负责加速计算,承接CPU计算密集部分的工作负载,同时由CPU继续运行其余程序代码。 2019年NVIDIA的中国GTC大会设置了两大主题:AI和图形。从大会的关注重点可以看出,GPU未来趋势主要是3个:大规模扩展计算能力的高性能计算(GPGPU)、人工智能计算(AIGPU)、更加逼真的图形展现(光线追踪RayTracingGPU)。
过去,绝大部分人工智能企业和研究机构遵循算法、算力和数据三位一体的研究范式,即以一定的算力和数据为基础,使用开源算法框架训练智能模型。而这也导致了当前大部分人工智能处于“手工作坊式”阶段,面对各类行业的下游应用,AI逐渐展现出碎片化、多样化的特点,也出现了模型通用性不高的缺陷。这不仅是AI技术面临的挑战,也限制了AI的产业化进程。随着人工智能赋能实体经济进入深水区,企业通常面临数据资源有限、算力投资难度大、模型泛化能力差、高水平人才稀缺的发展瓶颈。
2017年,谷歌团队首先提出Transformer模型。该团队将Transformer概括为一句话:“Attention is AllYouNeed.”目前Transformer已经成为自然语言处理领域的主流模型,基于Transformer的预训练语言模型更是成为主流。除了NLP 之外,Transformer 也逐渐成为很多基于序列的语音应用的主流AI模型,在很多场景中已取代RNN/LSTM,比如自动语音识别、语音合成等等 。 Transformer受欢迎的主要原因是其架构引入了并行化,它利用了强大的TPU和并行训练,从而减少了训练时间。
一般来说,有市场的地方就一定会有中国品牌,但对国产GPU来说这种惯例似乎不复存在:根据某券商的报告,2022年全球独立GPU市场规模约448.3亿美元,尽管规模高达数百亿,但其中属于国产GPU品牌的份额却寥寥无几。再加上现阶段国产GPU主要面向的都是工业应用市场,其中真正能用于游戏玩家的国产GPU市场更是微乎其微。
不过就近几年国产GPU的市场的变化来看,国产GPU的曙光似乎马上就要出现了。
2022年11月3日,GPU独角兽公司摩尔线程召开秋季发布会,正式发布了基于MUSA架构的第二颗多功能GPU“春晓”以及相应的一系列硬件产品——其中既有利好开发者的MUSA开发套件,还有大众消费者期待并即将上市的中国首张游戏显卡。而这场发布会也象征着中国GPU企业在游戏市场迈出的第一步。
与此同时,以ChatGPT为首用的AI技术,为国产GPU品牌们带来了新的机遇。
根据中信证券的报告,因AI、数据中心、智能汽车、游戏等行业对GPU的需求有望高增,在国产GPU加速追赶全球头部企业的大背景下,国产GPU有望迎来“发展黄金期”。
首先,AI需求端是国产GPU独立显卡未来发展的重要机会之一。中国的AI市场正在快速发展,其中云端和终端市场都在迅速扩张。云端市场中,中国企业在机器学习、深度学习等领域有着不错的表现,国产GPU独立显卡的需求也将不断增加。而终端市场则包括智能手机、智能音箱、智能摄像头、智能家居等领域,这些终端设备都需要计算能力强、功耗低、成本优化的GPU独立显卡来支持其AI功能。国产GPU独立显卡在这些终端设备中具有较大的应用潜力,因此未来发展机会广阔。
汽车需求端也是国产GPU独立显卡未来发展的重要机会之一。随着自动驾驶和智能座舱技术的不断发展,GPU在这些领域中具有广泛的应用。以国内常见的路网协同方案为例,一个优秀的路网协同系统需要海量高时效的道路信息,同时统一的远端服务器也需要同时追踪、管理海量的车辆。而高并发、高稳定性、低时延、低功耗这正是国产GPU品牌所擅长的领域。
此外,车辆自动驾驶和智能座舱的车机娱乐也对GPU提出了更高的要求。根据盖世汽车预测,未来自动驾驶和智能座舱的市场规模将会快速扩张,为国产GPU独立显卡带来广阔的应用前景。
|