《科创板日报》10 月 17 日讯 昨日晚间,"AI 教母 " 李飞飞转发推文,公布了一款能够实时生成交互式三维世界的全新世界模型—— RTFM(Real-Time Frame Model,实时框架模型)。
据悉,这款模型由李飞飞创办的人工智能公司 World Labs 开发。据团队介绍,其设计大致围绕三个关键原则,即效率、可扩展性和持久性,这使得世界模型 RTFM 仅需在单块 H100 GPU 上运行,便能够渲染持久且一致的 3D 世界。
为何如此设计?World Labs 指出,随着世界模型技术的发展,算力需求将水涨船高,并且远远超出当今大语言模型(LLM)的算力需求。要实现 4K+60FPS 的交互式视频流,传统视频架构需要每秒生成超过十万个 token,相当于一本《弗兰肯斯坦》的文本量。World Labs 断言:" 基于当前算力基础设施,以如此频率生成 token 在经济上是不可行的。"
因此,World Labs 认为,在上述 AI 发展趋势中,能受益于计算成本指数级下降的简单方法,将在市场中获益。
随着 AI 应用的遍地开花,降低算力成本不仅被提上各硬件厂商的日程,更成为多方竞争格局下的必然趋势。10 月 13 日,OpenAI 与博通宣布战略合作,部署 10 吉瓦的 OpenAI 设计的 AI 加速器。中国银河证券指出,此次合作后,OpenAI 形成英伟达、AMD、博通多方供应的多元算力体系,不仅打破单一依赖,更通过引入竞争倒逼算力成本下降。
不过总体而言,未来算力需求增长的预期并未撼动。World Labs 在博客中表示,尽管 RTFM 目前的目标仅仅是在单个 H100 GPU 上进行实时推理,但预计针对更大推理预算的更大型模型将继续改进。
事实上," 杰文斯悖论 " 的上演素来是 AI 产业发展的题中应有之义——当 AI 模型的技术演进提高了算力利用效率时,对算力资源的总消耗量反倒增加了。例如,今年初发布的 DeepSeek R1 在硬件相对有限的前提下实现了较强的 AI 性能,但包括黄仁勋在内的一众业内人士都表示,其对算力资源的需求只会增长而不会减少。
回到世界模型本身,就在今年 9 月 16 日,World Labs 发布世界生成模型 Marble,可通过单张图片或文字提示词生成 3D 世界。相比去年底发布的前代模型,已经实现更优质的几何结构以及更多样化的风格。此前李飞飞曾表示,世界模型的意义在于其不仅能理解和推理文字信息,还能理解与推理物理世界的运作规律。
当前,从人工智能到终端厂商在内的公司均已开始布局世界模型。据悉,xAI 在今夏从英伟达挖来多名专家,加入 Meta 与谷歌等竞争对手加注世界模型的行列。国内方面,包括宇树、智元在内的机器人厂商也已开源其世界模型。
东吴证券表示,当算力更便宜、更易得时,开发者会把更复杂的模型与系统作为新基准,提升参数量、上下文与并行度。模型架构的迭代有机会减小单次推理、训练所需算力,但如 Genie3 等生成视频的世界模型,或需要跨数量级提升的算力才可满足。AI 算力更高的天花板与更好的竞争格局将支撑起 AI 算力相对 4G/5G 的更高估值框架与更强 Beta。


登录后才可以发布评论哦
打开小程序可以发布评论哦