Arm第一次亲自做芯片!发布全新AGI CPU:136核心、两倍性能秒杀x86

倚天百科 百科资讯 2

3月25日消息,一直以来,Arm都是一家对外提供IP授权的芯片企业,包括CPU、GPU、NPU和各种系统IP。

后来,Arm打造了计算子平台(CSS),相当于打包各种IP的平台级解决方案,客户拿去就可以做出完整芯片(比如小米玄戒)。

如今,Arm宣布其计算平台进入全新阶段,首次涉足量产芯片领域,首款产品就是“AGI CPU”。

打个不是太精确的比方,这就类似于NVIDIA、AMD不但卖GPU芯片,也自己做公版显卡。

这是一款由Arm自主设计、面向AI数据中心的CPU芯片,旨在应对日益增长的代理式AI(Agentic AI)工作负载,同时帮助生态伙伴快速、规模化部署量产级的Arm平台。

合作伙伴可根据需求,灵活选择Arm IP授权、Arm CSS方案,或者直接购买部署Arm芯片。

Arm AGI CPU基于Armv9.2指令集、Arm Neoverse V3架构,支持bfloat16、INT8 AI指令集。

这也是当今众多数据中心级CPU的核心支撑,包括NVIDIA Vera、亚马逊Graviton、谷歌Axion、微软Azure Cobalt。

它采用台积电3nm工艺制造,提供136核心、128核心、64核心三种规格,可单路可双路,每个核心配备两个128-bit SVE单元、2MB二级缓存(最大272MB),还有128MB三级缓存,主频3.2GHz,热设计功耗300W。

内存支持12通道DDR5,每通道2条,最高速率8800MT/s,每核心内存带宽6GB/s,时延低于100ns。

I/O扩展支持96条PCIe 6.0通道,支持CXL3.0 Type 3,还可以提供六条PCIe 4.0。

Arm官方的参考设计服务器采用1OU双节点设计,基于符合OCP规范的DC-MHS 标准规格设计,每台刀片服务器配备两颗Arm AGI CPU,以及独立内存与I/O,共计272个核心。

这些刀片服务器可在标准风冷36千瓦的机架中满配部署,最多30台,总计8160个核心。

Arm还与超微合作推出了200千瓦的液冷设计方案,可容纳336颗Arm AGI CPU,总计超过45000个核心。

Arm声称,它在单核、SoC、刀片式服务器、机架各层级上,都实现行业领先的性能表现,尤其是单机架性能可以达到x86平台的两倍以上。

其中,更高性能、更高能效的单线程性能,可处理更多任务;叠加更多的可用线程,最终实现单机架性能的大幅提升;领先的内存带宽,则支持每个机架运行更多线程,避免在持续高负载下因核心争抢资源而导致性能下降。

另外,部署Arm AGI CPU之后,每吉瓦AI数据中心算力的资本支出,可以节省多达100亿美元。

客户合作方面,Arm已与Cerebras、Cloudflare、F5 Technologies、OpenAI、Positron、Meta、Rebellions、SAP、SK Telecom等达成进一步的商务合作,都会在各自的方案中部署Arm AGI CPU,覆盖加速器管理、控制平面处理、云与企业级API、任务与应用托管等领域。

Arm还与永擎电子、联想、广达电脑、超微等头部OEM/ODM厂商合作,现已推出基于Arm AGI CPU的早期系统,更广泛的商用部署预计将于今年下半年落地。

超大规模云服务商、云计算、芯片、内存、网络、软件、系统设计与制造等领域的50多家领军企业,都支持Arm进军芯片领域,包括AWS亚马逊云、博通、谷歌、Marvell、美光、微软、NVIDIA、三星、SK海力士、台积电等等。