智东西 07-28
AI员工将进入企业,新一代AI芯片崭露头角!启明创投年度AI十大展望发布
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

智东西 AI 前瞻(公众号:zhidxcomAI)

作者 | 江宇

编辑 | 漠影

智东西 AI 前瞻 7 月 28 日报道,今日,在 2025 世界人工智能大会(WAIC)期间,启明创投主管合伙人周志峰发表主题演讲《技术向上生长,应用向下扎根—— AI 共振周期暨 2025 AI 十大展望发布》,发布了 "AI 十大展望 "。

该报告覆盖了从基础模型、多模态智能体、AI 基础设施到新型交互与机器人应用等多个方向,系统梳理了未来 12 至 24 个月内值得关注的关键技术与落地趋势,构成了一份面向下一个 AI 周期的重要趋势图谱。

在这份年度报告中,启明创投将未来一到两年的发展趋势概括为 " 能力突破 " 与 " 应用深化 " 两个方面。

启明创投判断,未来 12 到 24 个月,大模型领域或将迎来一次决定性跃迁:基础模型上下文窗口或拓展至 200 万 Token,通用视频模型有望实现生成、推理、理解一体化,彻底改变内容创作与人机交互方式。

如果这些能力得以兑现,其直接产物将是 " 数字员工 " 的真正诞生—— Agent 不再只是工具,而将深入企业内部流程去交付结果;多模态智能体也将在高复杂场景中完成推理与执行。

同时,国产 AI 芯片将迎来 " 国设 "+" 国造 " 的大规模交付,AI 原生硬件或将在部分场景从手机上转移出用户的部分需求,具身智能产品如通用机器人也有望率先在制造业和物流业的拣选、搬运和组装等场景实现商业部署。

以下是周志峰演讲实录(智东西在不影响原意的前提下进行了处理):

一、AI 投资热度不减,技术与应用进入 " 共振 " 周期

一年一度,一期一会。首先特别开心,又能在 WAIC 启明创投的创业与投资论坛上,跟各位新老朋友,无论是线下参加还是线上看直播的,再次聚在一起。熟悉我们论坛的人都知道,每年都是我来开始这个 " 序曲 ",引出后续的演讲与讨论。

今年我的题目叫 " 技术向上生长,应用向下扎根 "。为什么起这个名字?我记得 2023 年我们第一次论坛的时候,我跟大家分享过我的感受:做 AI 投资人最大的感受就是 " 累 "。

当时美国大模型公司密集发布新模型,我经常凌晨三四点起床,为了抢那些公司发布会之后有限的邀请码,赶紧去试试最新的大模型技术。

去年我说,AI 越来越热闹,但在任何一个 " 大浪潮 " 热闹的时候,噪音特别多。作为一个投资人,如何 " 让自己安静下来 "?你真正能够有自己的独立判断、有自己的思考去进行布局,是一件特别不容易的事。

而今年,我觉得 AI 产业又到了一个新的阶段:一方面,技术还在往上快速增长,没有明显的天花板;另一方面,技术在性能、成本方面变得 " 可用 ",我们也看到 " 大规模的应用已经开始落地 ",就像 " 树根一样 " 深深扎根、扎实生长,在创造巨大的价值。

所以今年 AI 处在一个很特别的 " 周期 " —— "AI 技术与应用的共振周期 "。启明创投在整个 AI 产业链上有很多布局,我们投了很多中国 AI 领域的企业。

但我们的信息和观点,并不是 " 闭门造车 " 自己想出来的,而是整合了来自产业界 " 一手信息 " 的成果,这也是我今天十分钟分享的基础。从投资人角度讲,我依然愿意 " 累 ",因为这是最热门的赛道。

大家可以看看,2025 年 AI 占了全球 50% 以上的投资份额。一个领域占全球一半的投资,这说明:即使 AI 大模型已经成长了两三年,大家仍然认为 " 它的潜力依然巨大 "。越来越多投资人,用 " 真金白银去投票 ",持续投入到 AI 中。

这半年甚至一年,很多人在问:" 是不是预训练这条路快走到头了,大模型的天花板差不多了?Scaling Law 是不是不灵了?" 但从资本的 " 投票 " 来看,不是这样的。2024 年,模型公司拿到了 330 亿美元,占全年全球风险投资的近 20%。

二、大模型关键能力跃迁,推理与多模态成技术主线

这也说明,大模型依然在高速发展。过去 12 个月,大模型有了很多新突破,比如 MOE 架构、合成数据、更长的上下文窗口等等。如果让我总结一两个最关键的技术进展,第一个一定是推理能力。

以前的大模型是靠几万亿个 token 做预训练,压缩信息。当你提问时,它只是把 " 信息转移 " 给我们人类用户。而现在,有了推理能力之后,它能做更深入的逻辑思维," 向前推理,向后反思 ",具备了非常复杂的一些能力。效果非常明显。

去年这个时候,我们在讲 GPT-4o,当时,它是最强的模型。但如果用人类智商测试标准,它的成绩不到 70 分。还记得《阿甘正传》里的主角 Forest Gump 吗?他的智商是 75,是一位 " 轻度的智障者 "。所以当时的大模型,也只是 " 人类的轻度智障者 " 水平,只能做一些简单的应用,做不了复杂任务。

但现在,最新的推理模型,比如上周五发布的 " 阶跃星辰 Step-3" 模型,智商已达到 120 左右。这意味着什么?全球 80 亿人,有 87% 的人的智商在 90-120 分之间。也就是说,大模型已经超越了 80% 以上人类的智商水平。这是非常重大的进展。

另一个关键是 " 多模态 "。过去,我们说 " 大语言模型 ",但语言只是人感知和交互的一个维度。如果能融入语音、图像、视频,甚至未来的物联网多维信息,那模型对世界的感知与交互就会变得更加丰富多彩。

除了语言主导的模型外,图像和视频生成模型的进展也很大。今年 5 月,谷歌发布的 "Veo 3",已经能生成非常真实的视频,还能自动加音效、对白、背景噪音,让你感觉 " 就像是一个真实世界的视频记录 "。

我们投资的生数科技,此前也发布了新一代视频模型。它可以支持输入 " 最多七个主体 "(人、动物、汽车等)的参考图片,且在生成的视频中保持这些主体的 " 高度一致性 "。

三、Agent 进化走向 " 七月定律 ",AI 产品应用迈向全球

再来说说 Agent。这是从今年 3 月开始最火的话题。Agent 爆火,其实是因为基础模型能力提升了:上下文窗口更大、能使用外部工具,核心还是 " 推理能力 " 的增强。现在甚至出现了 " 智能体的摩尔定律 " ——任务处理复杂度每七个月翻一倍。我们可以期待 Agent 再经历一、两个 " 七个月周期 " 后,会达到什么样的智能水平。

今年 1 月,DeepSeek V3/R1 模型发布,震惊全球。它在 " 推理成本 " 上做得非常好,仅为 OpenAI 对应模型的 5%。此后,全球大模型团队都在压低成本。谷歌比 DeepSeek 还降了不少,阶跃星辰最新模型的推理成本又比 DeepSeek 更低。现在主流的大模型,即使没有做蒸馏,完整尺寸大模型的推理成本也已经降到每百万 Token 约 1 美元,比去年下降了近 100 倍。

讲完技术,我们再看应用层。大家熟悉的 ChatGPT 这个产品,是这波 AI 浪潮的点火器。2023 年 7 月,我们第一次在 WAIC 召开论坛时,ChatGPT 周活用户不到 1 亿;到 2024 年举办论坛时是 2 亿;而现在已经 " 差不多八、九亿周活用户 " 了。AI 应用发展速度非常快。

哈佛商业评论最近也总结了一个趋势—— AI 产品从辅助创意走向深层互动。过去我们用 AI 在做图、写文案时产生创意,参考它的 idea。但现在,疗愈陪伴产品成了最常用的应用,真正帮助用户寻找情绪出口,成为一个数字化的陪伴者。

Token 调用量也反映了应用热度,比如豆包,12 个月内调用量增长了超过 100 多倍。

硬件方面也有进展。我们投的 " 未来智能 " 推出的翻译耳机,用户已突破 100 万。Plaud AI 这个华人团队主攻北美市场,也刚刚突破百万用户。

人形机器人在中国开始率先落地。比如两周前,优必选刚签了全球最大的人形机器人订单;智元与宇树也中标了真实落地场景。

还有一个趋势是 " 全球化 "。过去互联网公司是 " 本地称王,再拓海外 ";但现在,AI 产品 " 生而全球 "。比如快手的可灵 AI,网页端 80% 流量来自海外。生数科技的视频生成平台 Vidu AI,上线 3 个月用户超 1000 万,其中 80% 以上也来自海外。

四、十大预测:基础突破、应用转向与硬件新形态

我们每次分享的最后,也是最重要的环节,我们再次挑战一下自己,跟大家聊聊我们对接下来 12 个月到 18 个月的十大展望。

1、基础模型上下文窗口突破

今年的展望,第一个是关于基础模型。我们认为基础模型会有很多创新,但有一点,就是 12 个月内,中国和美国的头部基础模型就会达到一个 200 万 Token 的上下文窗口。从供给端看,注意力机制等架构的创新正在推动长文本能力迅速突破;而从需求端看,只有上下文窗口更长,才能生成出真正有细节、有连贯性的、贴合语境的高质量内容。

2、通用视频模型进入实用期

第二个是关于多模态模型。其实不光是我们启明自己的判断,我们也结合了很多企业家、科学家、创新者的智慧。

在这个领域,我们判断未来一到两年之内,会出现真正的通用视频模型,可以处理在视频模态下的多种任务,包括生成、推理和任务理解,促进 " 内容生成 " 以及 " 交互方式 " 的革新。

3、Agent 迈入 " 数字员工 " 时代

那下一个是关于 AI Agent。AI Agent 也是现在非常热的话题。我们判断在未来 12 到 14 个月,Agent 的形态将从 " 工具的辅助 " 走向 " 真正的任务承接 "。

在未来,我们认为两年之内会有真正意义上的 " 首批数字员工 " 进入企业内部,广泛参与企业的研发、销售、运营和客户服务等重要环节。这意味着 AI Agent 不再仅作为助手存在,而是从 " 成本工具 " 走向了 " 价值创造 ",具备主动承担 OKR、主动反馈、协同作业等能力。

4、多模态 Agent 将不断走向实用化

多模态 Agent 将能够融合视觉、语音、传感器等多源输入,进行复杂推理、工具调用与任务执行,在医疗、金融、法律等行业率先实现突破。

5、更多国设国造的 GPU 开启批量交付

然后下面是关于 AI 的基础设施,第一个是关于芯片。我们认为未来 12 个月到 18 个月内,有望看到越来越多所谓 " 国设 " 且 " 国造 " 的 GPU 问世。

不光是中国团队设计的 GPU,而且是在中国的供应链中生产的 GPU,能够真正走向市场,批量交付。这将是对中国 AI 行业一个巨大的好消息。

但与此同时,我们也会看到很多新一代去颠覆传统 GPU 的 " 冯诺依曼架构 " 的 AI 芯片出现。比如说 3D 内存堆叠、通算融合等新一代 AI 芯片,也会慢慢走向市场、崭露头角。

6、AI Infra 侧将大幅降低 Token 成本

接下来是我们对另一个 AI 基础设施层的判断。过去两年推理成本已下降了超百倍,我们判断这个趋势还会继续。

未来 12 到 24 个月,Token 的消耗量还会再提高 1 到 2 个数量级。集群推理优化、终端推理优化,和软硬件协同优化,将成为 AI 基础设施进一步降低 Token 成本的关键路径。

7、AI 催生 " 非屏幕中心 " 的新型硬件

再说说应用,我们比较确信未来很快会看到一次 " 范式转移 "。也就是说,过去或现在我们主要的应用,都是基于手机,基于 " 人 + 屏幕 " 的人机交互方式。手机这种屏幕中心的人机交互方式,已经越来越跟不上 AI 能力的发展。

未来会出现很多更自然、更符合人性的 " 人机交互方式 ",改变我们使用手机的习惯。也许会很快出现一种 " 能承载 AI 能力、又符合人性的交互 " 的新硬件形态。就像当年手机,在 15 年前、20 年前把 PC 上的很多人类需求 " 转移 " 出来一样,新一代的硬件,也会把我们今天很多人类需求从手机上 " 转移出来 "。

8、垂类切入成为创业破局关键

从我们投资人、创业者的角度,我们其实比较喜欢 "go narrow and go deep"。我们的策略就是:应该找一个垂直细分场景,把它做深做透。这样企业才能更有效地与大厂形成差异化竞争,走出所谓大厂的 " 巨人阴影 "。

9、AI-BPO 模式崛起

另外一个关于 AI 应用的预测,我们也看到,过去几年,从卖 license,到卖订阅,各种商业模式越来越丰富。而现在我们看到一种新模式正在异军突起,即 "AIBPO" ——也就是 AI 驱动的业务外包。

AI BPO(业务外包)模式将在未来 12-24 个月实现商业化突破,从 " 交付工具 " 走向 " 交付结果 ",并通过 " 按结果付费 " 的方式,在金融、客服、营销、电商等流程标准化行业快速扩张。

10、具身智能将在三个场景率先落地

最后一个预测,是这几个月最热的 " 具身智能 "。很多媒体都在问我:" 你们觉得具身智能机器人,最先会在哪些真正有用的场景落地?而不是只是舞台表演?" 我们大胆预测,未来 12 至 18 个月内,会在挑选、搬运和组装三个场景率先落地,而且是 " 规模化落地 " ——我说的 " 规模化 " 是 " 上千台、上万台 " 的落地。

我们觉得这点非常关键。只有在一些细分场景落地之后,才会形成 " 从模型、本体到场景数据 " 的飞轮效应,推动整个具身智能技术高速向前发展。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 启明创投 ai芯片 机器人
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论