经济观察报 07-26
阶跃星辰发布基座大模型Step 3 与多家国产芯片厂商实现联合开发
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

经济观察报 记者 钱玉娟

在 2025 世界人工智能大会(下称 "WAIC 2025")开幕前夜,7 月 25 日,中国人工智能科技企业上海阶跃星辰智能科技有限公司(下称 " 阶跃星辰 ")发布了首个全尺寸、原生多模态推理模型 Step 3,这一基座大模型将于 7 月 31 日面向全球企业和开发者开源。

阶跃星辰创始人、CEO 姜大昕接受包括经济观察报在内的媒体采访时称,当下坚持做基础大模型的公司越来越少,困难在于投入巨大。特别是当大模型产业过渡至 2.0 时代后,不少公司会放弃模型训练,去追求商业化。而他认为,模型的能力会决定应用的上限,应用也会给模型提供具体的场景、数据,因此,阶跃星辰更坚持超级模型加超级应用的路径。

姜大昕认为,最适合实际应用的大模型需要满足强智能、低成本、可开源和多模态四个特征,缺一不可。唯有模型全面发展,才能让模型真正用起来。这也是阶跃星辰研发 Step 3 基础模型的出发点:为追求性能与成本极致均衡的企业和开发者设计。

姜大昕介绍,Step 3 是在模型架构创新、算法工程协同设计上的一次大胆尝试与 Scale Up(纵向扩展、提升)。该基座大模型采用 MoE 架构,总参数量 321B(3210 亿),激活参数量 38B(380 亿),却可以在较高的推理解码效率下实现关键的成本优化过程。

Step 3 拥有视觉感知和复杂推理能力,既能准确完成跨领域的复杂知识理解、数学与视觉信息的交叉分析,还能解决日常生活中的各类视觉分析问题。

阶跃星辰联合创始人兼副总裁朱亦博对 Step 3 的表现进行技术解释,在不牺牲激活参数量、不降低注意力容量的条件下,实测 Step 3 在英伟达 H800 芯片上进行分布式推理时,相较于行业顶尖水平的模型 DeepSeek-R1 的吞吐量提升了超 70%,而在国产芯片上的推理效率最高能达 DeepSeek-R1 的 300%。

阶跃星辰与近 10 家芯片及基础设施厂商组建一个模芯生态创新联盟,旨在通过联合打通芯片、模型和平台全链路的底层技术,提升大模型适配性和算力效率。

记者在现场看到,华为昇腾、沐曦、壁仞科技、燧原科技、天数智芯、无问芯穹、寒武纪、摩尔线程、硅基流动等厂商已成为上述联盟的首批成员。其中,华为昇腾芯片首先实现 Step 3 的搭载和运行;沐曦、天数智芯和燧原科技等也初步实现运行 Step 3。

燧原科技创始人、董事长兼 CEO 赵立东一直认为国产 AI 芯片厂商面前有两座大山,一是高端芯片制造,二是生态。模型和芯片合作正是在解决生态的问题。

赵立东将阶跃星辰的 Step 3 视为一款专门为国产芯片卡开发的大模型,在他看来,芯片软件开发人员与应用或模型开发人员深度合作,开发出的国产芯片产品的性能优化和性价比等,不单是要对标英伟达的芯片,更关键的是要实现低成本、高性能,用国产算力支撑国产大模型的长远发展目标。

除了与产业上下游多厂商成立联盟共建生态,阶跃星辰还宣布与上海国有资本投资有限公司战略合作,在获得上海国投生态体系的一轮新融资后,阶跃星辰计划向全年 10 亿元人民币的收入目标冲刺。

阶跃星辰联合创始人、副总裁李璟负责商业化,他在接受包括经济观察报在内的媒体采访时明确,上述收入指确认的合同收入,该目标建立在阶跃星辰 2025 年上半年已实现数亿元合同收入且毛利水平较高的基础上。

李璟未给出营收业务各项及比例的具体数据,但他表示,在目前布局的手机、汽车、IoT 设备等关键应用场景中,阶跃星辰已经与国内超一半的手机厂商合作打造 Agent(智能体),也有吉利这样的头部车厂在共建智能座舱等,还在金融、零售等多个垂直领域与相关头部企业探索面向 C 端的场景化应用。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

芯片 创始人 华为 ceo
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论