手机中国 12-18
苹果开源SHARP模型 单张2D照片秒级生成逼真3D场景
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

【CNMO 科技消息】近日,苹果公司发布了一项名为 SHARP(Sharp Monocular View Synthesis)的开源人工智能模型,该技术仅需一张普通 2D 照片,即可在不到一秒内生成具备真实尺度感的高保真 3D 场景。相关研究成果以论文《Sharp Monocular View Synthesis in Less Than a Second》形式公开,并已在 GitHub、Hugging Face 及苹果官方项目页面同步上线,引发开发者社区广泛关注。

据苹果研究人员介绍,SHARP 通过单次神经网络前向推理,在标准 GPU 上快速回归出一个基于 3D 高斯点阵(3D Gaussian Splatting)的场景表示。该表示不仅保留了原始图像的色彩与光照细节,还能支持实时渲染,从邻近视角生成高分辨率、视觉连贯的新视图。尤为关键的是,该模型输出的 3D 结构具有度量一致性,即包含真实世界中的绝对尺度信息,可支持符合物理规律的相机移动。

传统 3D 高斯重建方法通常依赖数十甚至上百张多视角图像进行优化,而 SHARP 仅凭单张图像即可完成重建,其背后依托于在大量合成与真实数据上训练所得的深度与几何先验知识。模型首先估计初始深度图,再结合学习到的场景结构规律,一次性预测数百万个 3D 高斯点的位置、颜色与协方差参数。不过,SHARP 目前主要适用于原拍摄视角附近的视点合成,尚无法可靠生成完全未见过的场景区域。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

高斯 开源 规律 物理 苹果公司
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论