快科技 8 月 7 日消息,据媒体报道,谷歌 DeepMind 正式发布了其新一代通用世界模型—— Genie 3。
该模型能够根据用户的文本提示,快速生成丰富多样的交互式虚拟环境。Genie 3 不仅能够以每秒 24 帧的速度生成 720p 分辨率的高清交互式 3D 世界,更创新性地引入了 " 可提示世界事件 " 功能。用户通过简单文本指令,即可实时修改虚拟环境,显著提升了沉浸感与创造力。
DeepMind 视 Genie 3 为迈向通用人工智能(AGI) 的重要里程碑。它能为 AI 智能体提供广阔、逼真的训练场,同时在游戏开发、教育模拟、创意设计等领域开辟全新应用场景。
例如,仓库机器人可在该模型生成的虚拟环境中,无风险地学习应对各种突发状况,从而提升实际部署表现。
然而,Genie 3 目前仍面临挑战:其支持的连续交互时长仅数分钟,远未达到理想状态(如数小时)。此外,AI 智能体在模拟环境中的交互能力,尤其是处理复杂多智能体交互方面,仍需大幅提升。
为优化模型并评估潜在伦理风险,DeepMind 目前以研究预览形式,向部分学者和创作者开放 Genie 3,旨在收集专业反馈以驱动后续迭代。
登录后才可以发布评论哦
打开小程序可以发布评论哦