铅笔道 5小时前
94年小伙半年融资30亿,用游戏视频训练AI
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

作者 | 铅笔道 黄小贵

编辑 | 铅笔道 祝枝杉

封面图 | ChatGPT 创作

看《堡垒之夜》的游戏录像,也能训练 AI?

没错,一家靠着海量游戏录像训练 AI 的公司 General Intuition,刚刚完成 3.2 亿美元(约合人民币 21.77 亿元)融资。

本轮由科斯拉风投领投,General Catalyst、谷歌前董事长施密特、亚马逊创始人贝索斯跟投。

General Intuition 公开披露的融资总额已达 4.54 亿美元,估值 23 亿美元。

游戏数据很值钱

General Intuition 纽约办公室有一个很有画面感的场景:

屏幕上,一个 AI 智能体在类似《堡垒之夜》的游戏环境里连续运行。旁边,一台四足机器人在办公室里走动。而驱动游戏智能体和机器人的,是同一个 " 大脑 "。

这个 " 大脑 " 不是从真实世界里一点点学出来的,而是先从游戏录像里学出来的。

这也是 General Intuition 能拿到大额融资的核心原因。它背后有一个别人很难复制的数据入口:游戏剪辑平台 Medal。

Medal 原本是给玩家上传、分享游戏高光时刻的平台。玩家在游戏里跳跃、转身、开枪、躲避、攀爬、撞墙、失败、反击,这些都被记录下来。

YouTube、X 上有大量游戏视频。General Intuition 看重的是另一层东西:动作标签。

General Intuition 来源:公开资料

也就是说,它不只知道画面发生了什么,还知道玩家在那一刻按了哪个键、移动了鼠标、做了什么操作。画面和动作同时存在,AI 就能学习一个更接近真实行动的问题:在一个环境里,看到眼前这些东西,下一步应该怎么做。

这和大语言模型训练文本有点类似。

大语言模型从互联网文本里学习语言规律。它看了很多句子,知道一个词后面可能接什么词。General Intuition 想做的,是让 AI 从游戏动作里学习行动规律。它看到一个角色面对墙壁、楼梯、敌人、障碍物、阴影变化,就要学会哪些动作有效,哪些动作无效。

General Intuition 为什么能想到用游戏录像来训练 AI?

这就得从创始人讲起。

OpenAI 尝试 5 亿美元收购

General Intuition 创始人 Pim de Witte 于 1994 年出生在荷兰,早年就和游戏关系很深。

他十几岁时曾通过搭建和运营一个私人 Rune Scape 服务器赚到 150 万美元。后来,他创办了 Medal。这个平台的功能很简单:让玩家录制、上传和分享游戏里的精彩片段。

最初,这看起来是一门游戏社区生意。玩家要晒操作,平台要做分发,游戏公司要流量。可是到了 AI 时代,这些游戏片段突然有了新的价值。

因为 AI 行业正在遇到一个新问题:文本数据已经被大量使用,但机器人、无人机、自动驾驶、游戏智能体需要的不是文字,而是行动数据。

一个机器人要在仓库里绕开货架,不能只靠读几本说明书。一个无人机要进入灾害现场搜救,不能只靠看静态图片。一个游戏 NPC 要表现得像真人玩家,也不能只靠预设脚本。

它们都需要理解空间、时间和因果。

比如,前面有一堵墙,不能继续往前冲;楼梯可以上去;阴影变化意味着光源和时间在变化;对手突然从右侧出现,玩家应该转向、躲避或反击。这些判断,人类玩家每天在游戏里做无数次。Medal 记录下来的,正是这些连续判断。

这就是 General Intuition 的数据壁垒。

Medal 一年可产生数十亿级别的视频上传,覆盖大量游戏环境。更重要的是,这些数据不是单一场景,而是横跨不同游戏、不同地图、不同视角、不同操作方式。对训练 AI 来说,这种多样性很关键。

如果只在一个仿真环境里训练,AI 很容易学会 " 应付考试 "。它知道这个房间怎么走,知道这个地图的规则,却未必能迁移到新环境。General Intuition 想利用游戏世界的多样性,让模型学到更底层的空间和行动规律。

OpenAI 都关注到了 Medal,曾尝试以 5 亿美元收购 Medal。

Medal 里的游戏行为数据记录了人类如何在虚拟环境里行动。对下一代 AI 来说,这可能比普通视频更有训练价值。

不到一年,融资 30 亿

General Intuition 就是基于这个判断成立的。

2025 年 10 月,它宣布完成 1.337 亿美元种子轮融资。不到一年后,又完成 3.2 亿美元 A 轮融资。这么短时间就募集了相当于 30 多亿人民币的资金。

General Intuition 创始团队 来源:公开资料

目前,General Intuition 团队约 25 人,Medal 约 65 人。

一个团队还很小的 AI 实验室,能在短时间内连续融资,靠的不是收入规模,而是投资人相信它手里握着一种稀缺训练资源。

General Intuition 的 AI 会先服务游戏行业。比如,今天很多游戏里的机器人玩家和 NPC,仍然是脚本驱动的。它们看起来聪明,其实只是按照规则行动。玩家熟悉之后,很容易看出破绽。

General Intuition 想做的,是让游戏角色在相同信息条件下行动。它看到的只是普通玩家能看到的画面,行动方式也和玩家类似。这样训练出来的 AI,不是简单知道地图后台数据,而是像人一样根据屏幕画面做判断。更真实的 NPC、更自然的陪练、更动态的游戏世界,都可能提升游戏体验。

不过,General Intuition 真正想做的,不只是游戏。

它关注的是 "spatial-temporal reasoning",也就是空间 - 时间推理,AI 要理解物体、人和环境如何随着时间变化。

这正是今天很多 AI 系统的短板。

一个模型可以描述画面里有桌子、门、椅子,却未必不知道自己往前走会撞到桌子,左转能绕过去,门把手需要先转动才能打开。

对机器人来说,这个差别非常关键。要让机器人更可靠,就需要它具备对环境变化的预测能力。

人形机器人、无人机、自动驾驶仿真系统,本质上都可以被抽象成 " 观察—判断—动作 " 的过程。游戏也是如此。玩家通过屏幕观察环境,通过键盘、鼠标、手柄发出动作。两者的形式不同,但底层结构接近。

General Intuition 也已经开始尝试商业化。公开报道提到,公司已有一些来自游戏、仿真和机器人方向的客户,并计划扩大 API 可用范围。

General Intuition 想做底层模型供应商。就像 OpenAI 和 Anthropic 提供大语言模型能力,让别人基于它们开发应用;General Intuition 希望提供行动模型能力,让游戏公司、机器人公司、仿真公司基于它开发产品。

AI 行业三大新趋势

General Intuition 这轮融资反映了 AI 创业公司的新竞争逻辑。

第一,数据重新变成核心资产。

大语言模型时代,互联网文本、代码、图片、视频都被大量使用。越往后,公开数据越不够用,优质、私有、带标签的数据越来越贵。General Intuition 的特殊之处在于,它的数据不是简单 " 可观看 ",而是 " 可学习动作 "。

玩家每一次按键,都是一个动作标签。玩家每一次成功或失败,都是一个训练信号。对模型来说,这比只有画面的视频更有价值。

第二,算力仍然是最大成本。

GamesBeat 报道提到,Pim de Witte 谈到融资用途时直接说,GPU 很贵。General Intuition 计划把大量资金用于扩大算力,并与 CoreWeave 有合作安排。对前沿模型公司来说,融资往往不是为了慢慢花,而是为了锁定算力窗口。

第三,AI 开始向物理世界延伸。

如果说 ChatGPT 代表 AI 进入知识工作,那么 General Intuition 这类公司代表 AI 试图进入行动世界。

General Intuition 的技术演示虽然引人注目,但还不能简单理解为商业化已经成熟。

游戏到仿真,再到真实世界的大规模迁移,还没有被完全证明。真实世界数据获取慢、成本高、风险大,仍然是整个行业的难题。General Intuition 的赌注,是用游戏数据作为更便宜、更可扩展的预训练入口,然后再用少量真实数据做适配。

这个判断能否成立,还需要时间验证。

General Intuition 也在试图处理另一个敏感问题:AI 与游戏行业、劳动力、军事应用的关系。

游戏行业对 AI 一直很警惕。很多开发者担心 AI 会替代美术、设计、编剧和程序岗位。General Intuition 公开表示,不做替代游戏开发者、设计师或艺术家的技术。

它还推出了 Nerve 平台,让玩家通过数据标注、远程操作等任务获得收入。这个安排既是数据飞轮,也是对游戏社区的一种安抚。

在军事应用上,Pim de Witte 也划出边界。他表示不希望公司的智能体被用于伤害人类,但愿意用于搜索救援。

这一点和硅谷近年越来越积极拥抱国防科技的气氛并不完全一致,也让 General Intuition 有了更鲜明的公司性格。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 融资 创始人 堡垒之夜 机器人
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论