当前,通用人工智能发展驶入快车道,大模型对算力的需求呈现爆发式增长,异构算力的高效协同成为释放算力潜能、降低算力成本的核心关键。作为国产 AI 芯片领域的重要参与者,天数智芯始终深耕算力芯片技术创新,深度融入上海人工智能实验室 DeepLink 开放计算体系,从跨域混训到多元混推,全程参与并助力 DeepLink 构建 " 训练 + 推理 " 全方位算力赋能体系,为盘活国产异构算力资源、筑牢 " 人工智能 +" 算力基座注入硬核芯片力量。
自 DeepLink 体系推出以来,天数智芯便成为其核心生态合作伙伴,依托自研智算芯片的技术优势,深度参与异构算力适配与优化。2025 年 DeepLink 超大规模跨域混训技术方案落地时,天数智芯芯片完成深度适配,凭借高算力、高吞吐特性,成为跨千公里多智算中心长稳混训千亿参数大模型的重要支撑,助力实现等效算力达单芯片单集群 95% 以上的成果,验证了国产芯片在超大规模异构集群中的稳定表现。
此次 DeepLink 多元算力混合推理加速方案的发布,进一步打通国产异构算力全链路协同,天数智芯亦完成全面适配,成为混推体系核心算力节点。长期以来,国产算力推理受限于单一芯片集群调度,异构芯片因标准不统一、通信壁垒难以协同,而天数智芯依托 DeepLink 四大原创技术底座,实现多款国产芯片混合调度与协同推理。在 DLInfer 推理中间件支撑下,芯片与上层框架无缝对接,降低适配门槛;借助 DLSlime 高速通信库,芯片间跨架构互联带宽利用率显著提升,保障异构推理低时延、高稳定。

实际应用中,天数智芯芯片与 DeepLink 混推方案的融合,充分发挥其在算力、访存密集型任务中的优势。千卡规模集群实测显示,搭载天数智芯芯片的异构集群,在多模态生成、高并发服务等场景中推理时延优化显著,科学论文处理等任务中吞吐性能大幅提升,与其他国产芯片协同实现 "1+1>2" 的效能跃升,既验证了天数智芯通用 GPU 芯片的高性能与兼容性,也彰显了 DeepLink 生态的协同潜力。
作为深耕国产智算芯片的企业,天数智芯认为开放协同是算力产业发展必然趋势,DeepLink 体系正是打破生态壁垒、实现软硬件解耦的关键。依托其标准化适配体系,天数智芯仅需一次适配,即可兼容多款主流框架与大模型,大幅降低研发适配成本,加速芯片行业落地。同时,DeepLink 芯片评测体系为天数智芯芯片迭代提供科学参考,助力优化性能、提升异构场景适配能力。
从混训到混推,DeepLink 全链路算力体系为国产智算芯片规模化应用开辟新空间。未来,天数智芯将深化与 DeepLink 生态合作,持续推进芯片技术创新与生态适配,优化异构算力训推性能,助力完善多元算力调度能力。我们将携手生态伙伴,盘活国产异构算力资源,为 " 人工智能 +" 行动提供更高效、灵活、高性价比的算力支撑,为中国新质生产力发展注入算力动能。


登录后才可以发布评论哦
打开小程序可以发布评论哦