快科技 4 月 14 日消息,近日,上海棣山科技对外披露其 2nm 高端 AI GPU 芯片最新研发进展。
据悉,该公司自主攻关的这款芯片已达到国际前沿设计水平,目前核心研发工作仍处于原型验证关键阶段。
该款 2nm AI GPU 原型芯片采用 FinFET/GAA 混合制程与 Chiplet 异构集成架构,搭载公司自主研发的 " 棣山智核(DS- Core)",核心晶体管数量达 1700 亿颗,采用 2.5D CoWoS-L 先进封装技术。
性能表现上,这款芯片 FP32 单精度算力可达 50 TFLOPS,FP16 半精度算力达 100 TFLOPS,FP4 低精度算力高达 400 TFLOPS,可灵活适配不同精度需求的人工智能大模型训练、推理等高端算力场景;能效比较上一代产品提升 40%,典型功耗控制在 350W 以内,每瓦算力可达 142 GFLOPS。
同时,研发团队成功攻克高带宽内存(HBM)封装互联、超低延迟片间通信(
此外,该芯片支持 NVLink 6 兼容互连协议,单链路带宽达 1.6TB/s,多芯片互联时可实现无瓶颈协同运算,进一步提升整体算力规模,同时兼容主流 CUDA 软件生态,可大幅降低下游客户技术迁移成本。



登录后才可以发布评论哦
打开小程序可以发布评论哦