日前,微软方面发布并开源首个世界与人类行动模型(World and Human Action Model,WHAM)Muse,并表示该模型 " 专为游戏构思而设计 ",其生成的 3D 世界能遵循设计用于电子游戏的机制。
据了解,Muse 由微软游戏智能团队、可教学人工智能体验(Tai X)团队与 Xbox 游戏工作室 Ninja Theory 合作开发,能够生成游戏画面、控制操作,以及同步完成这两项任务。该模型采用 Transformer 架构作为其序列预测的骨干网络,并使用 VQGAN 图像编码器将图像编码为离散的 token 序列,通过对真实人类游戏玩法数据的训练,能够准确预测游戏环境的 3D 结构、控制器动作的效果以及游戏的时空结构。
据悉在相关演示中,微软方面展示了 Muse 如何使用来源于 2020 年游戏《Bleeding Edge》的训练数据生成视频游戏视觉效果。具体而言,Muse 在超过 10 亿张图片和控制操作上进行训练,相当于超过 7 年的人类连续游戏时长。开发者只需提供仅 10 个初始帧(相当于 1 秒钟的游戏视频)以及整个游戏过程中的控制器操作,Muse 便能生成后续的游戏画面。
值得一提的是微软方面还透露,正在探索利用 Muse 保存和重振经典游戏。
对此微软方面表示," 如今,无数与老旧硬件绑定的经典游戏已无法被大多数人游玩。多亏了这一突破,我们正在探索利用 Muse 从我们工作室的旧游戏库中选取较老的游戏,并针对各种设备对它们进行优化。我们相信,这可能会从根本上改变我们在未来保存和体验经典游戏的方式,让更多玩家能够玩到这些游戏。想象一下,那些因时间流逝和硬件发展而被遗忘的深受喜爱的游戏,有朝一日能在任何搭载 Xbox 的屏幕上玩到,对我们来说这是一种令人兴奋的可能性 "。
【本文图片来自网络】
登录后才可以发布评论哦
打开小程序可以发布评论哦