算苗科技国产3D TokenPU完成流片 搭载16TB/s超大带宽

倚天百科 百科资讯 5

6月16日消息,算苗科技正式宣布,其全国产自研的3D TokenPU芯片顺利完成流片。这标志着国内基于3D混合堆叠工艺的AI推理芯片实现关键性突破,为大模型算力高效供给提供了全新的本土硬件方案。

该芯片采用前沿的3D混合堆叠架构,区别于传统2D平面设计的算力芯片,通过多层晶圆垂直堆叠,大幅缩短存储单元与计算单元之间的数据传输路径。

其搭载的16TB/s超大带宽,从底层有效解决了大模型推理中长期存在的带宽不足与数据交互延迟高的行业痛点,专项面向海量大模型线上推理场景进行了性能优化。

当前,国内大模型产业正快速扩张,云端与端侧推理算力需求持续激增。传统算力芯片受限于带宽瓶颈,导致大模型运行功耗偏高、推理速度受限。

3D TokenPU凭借超高带宽优势,能够显著降低数据搬运损耗,大幅提升大模型推理效率,广泛适配通用大模型、多模态生成、实时对话等高负载推理任务。

值得关注的是,该芯片实现了全流程国产化落地,从架构设计到流片制造均依托国内产业链完成,打破了海外厂商在高端3D算力芯片技术与工艺上的长期垄断。

此前,3D堆叠算力方案主要由海外主导,本土同类产品严重稀缺。此次流片成功,有效补齐了国内高端AI算力硬件领域的布局短板。