芯榜 15小时前
中昊芯英发布AI芯片「须臾®」
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

2026 年 6 月 30 日,中昊芯英正式发布新一代全自研高性能 TPU AI 专用算力芯片「须臾 ®」,同步推出搭载「须臾 ®」芯片构建的软硬件一体化智算底座——泰则 ® 2.0 AI 高性能智算平台。作为初代「刹那 ®」芯片、初代泰则 ® 智算服务器的全面升级产品,「须臾 ®」与泰则 ® 2.0 在底层架构、算力峰值、片上存储、集群互联、计算能效等方面皆实现跨越式提升。

从「刹那 ®」到「须臾 ®」:

TPU 架构全面升级,单卡算力性能提升 3 倍

作为国内最早投身于 TPU 架构 AI 专用算力芯片研发的企业之一,中昊芯英在 2023 年成功流片了国内首枚高性能 TPU AI 专用算力芯片「刹那 ®」并实现量产和产业化。基于「刹那 ®」三年规模化落地的实践经验,中昊芯英完成新一代芯片「须臾 ®」的架构革新,针对性解决超大模型、长上下文、海量词元交互场景下传统算力存在的访存延迟、能耗偏高、并行效率不足等痛点。

1.1 核心硬件算力指标全面升级

单颗「须臾 ®」芯片深度优化大模型专属张量计算逻辑,扩容寄存器与大容量片上缓存,核心性能参数实现大幅跃升:

单芯片混合精度浮点算力达 896TFLOPS,性能是上一代芯片「刹那 ®」的  3 倍;8-bit 推理算力可达 1792TOPS,适配海量词元高并发推理场景;

单卡搭载的显存及芯片内部互联速率均有大幅提升,支持超长上下文,降低多轮对话的数据反复搬运开销;

单芯片额定功耗 600W,相较于算力性能持平的传统算力芯片,功耗降低 50%,天然适配绿色低碳智算中心建设;

依托多维张量计算单元与数据复用优化设计,「须臾 ®」有效缓解深度学习领域经典存储墙难题,执行同等 AI 任务时,综合计算效能可达传统 GPU 架构数倍,在大模型计算、批量词元生成场景优势尤为突出。

1.2 全栈自主可控底层技术体系

「须臾 ®」延续中昊芯英全自研 TPU 技术路线,实现芯片 IP 核、专属指令集、底层算子加速库、整机系统软件完整自主研发,无海外核心技术依赖。公司核心技术完整覆盖芯片设计、电路开发、编译工具、模型适配全链条,可快速高效完成新模型和迭代模型的适配和部署,满足政务、金融、电网等关键行业的信息安全合规要求。

泰则 ® 2.0 AI 高性能智算平台:

单机 7.168P 算力,2048 芯片高速片间互联

本次同步推出的泰则 ® 2.0 AI 高性能智算平台中标准的最小计算单元(即「泰则 ® 2.0 智算节点」/ 单机)由两路高性能 CPU 处理器与 8 片高性能 TPU 处理单元互联构建而成,从物理形态上形成 1 台通用的 CPU 服务器外接 1 台高性能 TPU 算力加速设备,算力达  7.168P(混合精度),同等任务下整机能耗仅为传统 GPU 服务器的 80%。

在集群部署层面,泰则 ® 2.0 在构建超大规模算力资源池时,通过自研的低延迟高并行的片间通讯协议,单个超节点最高可实现  2048 片「须臾 ®」芯片直联,能够承载万亿参数大模型分布式训练、多智能体协同运算、全平台海量词元并发推理等重负载业务。

此外,该平台还配套了完整的可视化运营管理系统,集成 BMC 硬件远程管控、全链路硬件状态监控、故障短信 / 邮件预警、算力计费、用户权限、模型市场一体化功能,运维人员可实时查看芯片温度、功耗、资源使用率、系统日志等全维度信息,拥有开箱即用的运维体验。

值得一提的是,软件层面实现了全主流 AI 框架兼容,原生支持 PyTorch、vLLM、SGLang 等开发工具,训练场景适配 DeepSpeed、Megatron-LM 分布式套件;已完成 Qwen 全系列、DeepSeek、GLM、MiniMAX 等数十款大语言、多模态模型深度适配,开发者无需大规模代码改造即可快速完成模型迁移,大幅降低国产算力替换门槛。

直击词元经济与 AI 智能体产业新需求

覆盖多个垂直行业落地

2026 年行业正式迈入词元经济落地阶段,AI 产业从传统算力时租模式转向以词元为核心计价单位的 MaaS 模型即服务模式,海量对话交互、长上下文记忆、AI 智能体自主任务带来指数级词元吞吐压力。「须臾 ®」芯片与泰则 2.0 平台从硬件层面对词元生成、上下文缓存、批量并发推理做专属优化,可有效降低单词元推理成本,支撑 AI 服务商搭建自主可控的按量计费词元服务体系。

同时,产品深度适配当下主流开源 AI 智能体框架 OpenClaw,提供本地私有化部署方案,所有交互词元、业务数据本地存储不对外流出,兼顾数字员工 7 × 24 小时自动化执行能力与企业数据隐私安全,可落地报表自动化、IT 运维监控、批量数据分析、个人智能助理等场景。依托通用高效的张量算力底座,整套方案可赋能多个行业数字化智能化转型。

在商业化成本与绿色算力层面,泰则 ® 2.0 单位算力建设成本仅为海外高端算力产品的 60%,低功耗特性可显著降低智算中心电费支出与碳排放,契合各地低碳算力园区、数据中心碳中和建设政策导向。

大规模客户应用落地,驱动技术持续迭代

中昊芯英的初代「刹那 ®」芯片已在多个行业实现大规模客户交付与成熟落地。目前,公司产品已成功部署于由深圳联通、天津移动、太极股份、江西上饶等运营商、政府机构、及科技企业建设的多个超大规模智算中心,并已在高校、科研机构等的科研计算平台与教学实验环境中投入使用,辐射至金融、传媒、教育、医疗等广泛行业领域。

面向未来,中昊芯英将继续依托已有的大规模客户基础,持续进行技术迭代,优化 TPU 芯片算力、能效与片上存储架构,适配更多大规模大模型与多智能体集群的运算需求;同时联合主流大模型厂商、云服务商及系统集成商,深化软硬件协同开发,进一步扩展自主可控算力产业链的落地版图。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

芯片 ai
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论