在Computex 2024正式开始前,Arm宣布推出对应消费运算产品的运算子系统(CSS),一样整合Armv9指令集,并且完成3nm制程节点与全新Arm CPU、GPU设计验证,同时更可对应下一代Cortex- X CPU设计,使其每周期指令效能(IPC)能提升达36%,并且使Immortalis GPU显示效能提升37%,另外也能藉由KleidiAI软体驱动的人工智能框架加速提升运算效能。
在此之前,Arm主要针对资料中心应用的Neoverse CPU架构导入运算子系统设计,而此次将运算子系统设计导入消费运算产品,主要因应目前人工智能运算成长趋势,借此让消费端处理器效能能大幅提升,并且能配合人工智能框架加速提升更高运算效能。
而藉由导入运算子系统设计,同时也能让客户增加更多客制化设计,并且加快运算产品进入市场脚步,借此因应成长速度日渐增长的人工智能技术发展需求。
至于此次加入运算子系统设计的消费运算产品,将对应Armv9.2版本指令集的CPU及Immortalis GPU,同时也完成3nm制程节点设计验证,并且藉由新版Corelink系统连结各运算元件。
新设计除了让CPU每周期指令效能提升达36%,并且使Immortalis GPU显示效能提升37%,更藉由KleidiAI软体驱动的人工智能框架加速提升运算效能,让整体人工智能推论效能提升打59%,可对应未来将在装置端更频繁的人工智能运算工作负载需求。
许多升级都是为了接下来的装置端人工智能运算需求
此次更新的Cortex-X925 CPU,将可藉由3nm制程实现3.8GHz运作时脉,并且对应更大快取记忆体设计,相较去年以4nm制程打造的旗舰处理器,不仅能达成36%幅度的每周期指令效能提升,在人工智能运算效能更有41%提升幅度。
除此之外,包含新款在目标人工智能与游戏应用效能提升35%的Cortex-A725 CPU,以及更新后的Cortex-A520 CPU与DSU-120,搭配新版Armv9指令集之下,更让此次推出的新CPU设计能发挥更高运算效能,同时也让能源损耗降低。
Immortalis-G925 GPU更成为Arm有史以来显示效能、能源使用效率最高的GPU设计,对应10核心起跳设计与即时光影追迹能力之余,更能在人工智能、机器学习运算提升34%效能,而此次也同步更新Mali-G725 GPU与Mali-G625 GPU,借此对应更多不同处理器设计。
另外,Arm此次推出的KleidiAI软体框架将用于推动人工智能工作负载效能,同时也透过KleidiCV对应电脑视觉应用需求。其中,KleidiAI将能在Arm架构CPU以最佳化形式运作,并且对应NEON、SVE2及SME2等可扩展向量延伸指令集,另外也相容PyTorch、Tensorflow、MediaPipe、Llama 3等常见人工智能运算框架,更可藉由相容特性支援日后推出的Arm架构产品,以利现有软体能继续用于未来推出处理器产品。
与诸多业者合作,但Qualcomm预期会以不同设计打造自主架构产品
宣布推出对应消费运算产品的运算子系统,并且更新主要CPU、GPU设计之余,Arm也宣布与Intel代工业务、联发科、三星、台积电等业者合作,而vivo也宣布将导入Arm全新运算产品设计,或许暗示下半年即将推出新机将会采用联发科新款旗舰处理器天玑9400。
不过,由于Qualcomm先前已经宣布将在下一款旗舰处理器Snapdragon 8 Gen 4导入源自NUVIA的自主架构Oryon CPU设计,意味将不会全面(或仅部分)采用Arm架构设计,因此在接下来的运算架构发展将不会特别受限于Arm提出设计,或许会有不一样的运算效能表现。