三易生活 04-08
AI是万灵药?Meta要把大模型塞进AR眼镜里
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

寻找下一块 " 屏幕 ",这无疑是最近几年科技行业的一个热门赛道。随着个人计算机点燃了互联网,智能手机让移动互联网无处不在之后,这前后两次造富神话的出现,也让所有人都在期待下一次改变的到来。那么智能手机之后的下一代通用计算设备是什么?苹果 Vision Pro 代表的混合现实 ( MR ) 、Meta Quest 2 代表的虚拟现实(VR)、华为 Vision Glass 代表的增强现实(AR),也就是扩展现实技术衍生的硬件,就成为了现阶段最被外界看好的一个方向。

只可惜,下一代通用计算设备的探索如今暂时让位于高歌猛进的 AI。作为左手 Oculus、右手 LLaMA 2 开源大模型的巨头,Meta 方面似乎准备将大模型塞进 AR 眼镜里。就在 Meta 收购 Oculus、并在后者的基础上创立 Reality Labs 十周年之际,Meta 方面发布了一篇博客文章,回顾了 Reality Labs 过去十年的历程。

尽管通常这种自卖自夸的文章无甚价值,但在文末却透露了 Meta 方面准备推出一款 AI+AR 的产品。据 Meta 方面透露,全新的 AR 设备将同时提供与物理世界和数字内容互动的体验,以及访问 Meta AI 的实用性和娱乐性。

事实上,关于 Meta 将发布一款代号为 " 真 AR 眼镜 " 的消息,早在今年年初就已经广为流传。用 AI 来赋能 AR,确实是一个解开当下 AR 硬件困境的可行性方案,因为即使有了苹果的 Vision Pro,现阶段 AR 也缺乏故事可讲。

未来物理屏幕会消失,整个世界会成为你的屏幕,眼镜就会成为一个空间的浏览器,它将改变人与人、人与世界的交互方式,这就是如今业界对于 AR 眼镜的期许。但现阶段的 AR 眼镜显然还取代不了智能手机,尽管借助 AR 帮助使用者获得额外信息,AR 硬件在工业、医疗、教育、军工、安防等企业级市场已经有了诸多案例,但就像所有面向 B 端的产品一样,在攻下几个大客户之后,中小客户才是更难啃的骨头。

因此消费级市场就不得不成为了 AR 硬件主攻的领域,可问题是用户对 AR 的新鲜感,早在 2016 年、2017 年的 "VR 元年 " 就消失殆尽。

虽然在经过了多年的发展后,从技术层面来讲,通过 " 全反射 " 原理将光传输到眼睛前方、再释放出来光波导和利用镜面反射成像的 Birdbath,都能制造出优秀的透视 ( see-through ) 效果,因此目前 AR 眼镜提供的视觉沉浸感也普遍在线,几乎不会让用户 " 出戏 "。可是 AR 内容的贫瘠就远超大家的想象了,除了基于谷歌 ARCore 和苹果 ARKit 的一批样板之外,如今市面上以 AR 为卖点的应用可以说是少之又少,或者说从未有过一款非游戏类的 AR 应用出圈。

事实上,即使是 AR 游戏,也仅有 Niantic 旗下的《Ingress》和《宝可梦 GO》这两款相对有影响力的产品。主打虚拟环境与现实地理位置信息结合的《Ingress》,早在 2013 年就已发布,它几乎是 AR 手游概念真正意义上的开拓者。但这款游戏更注重的是真人玩家在线下的活动,也就是 "AR 为皮、社交为骨 "。

而真正将 AR 游戏概念发扬光大的则是《Pok é mon Go》,并掀起了一阵在现实世界捕捉宝可梦的热潮。如果实际体验过《Pok é mon Go》就会发现,其实它本身的游戏性平平无奇、AR 效果也并不惊艳,它的成功靠的是把 " 对宝可梦进行探索捕捉、战斗以及交换 " 从屏幕搬到了现实里。

但《Pok é mon Go》是宝可梦作为头部 IP 的成功,要不然 Niantic 后续拿着哈利波特、变形金刚、Pikmin、漫威、NBA 等 IP 做的 AR 游戏,也就不会屡战屡败了。

如今的现实是自 2016 年的《Pok é mon Go》之后,后续再无一个爆款 AR 应用出现,这也是为什么苹果会率先发布一个面向开发者、而非消费者的 MR 头显。毕竟无法想象买了 AR 眼镜后能做什么,这才是绝大多数消费者对于这类产品敬谢不敏的关键。别说用 AR 观影了,视觉沉浸感更强的 VR 头显都没能做到仅纯靠 VR 影片吸引消费者,如今无论国内的 PICO、还是海外的 Meta,其实都是拿游戏和健身来做卖点。

这时候,AI 大模型与 AR 眼镜的结合,就成为了一个吸引消费者的卖点。前段时间有网友发布了一则视频,感慨在京沪高铁上打开电脑发现周围都是同类," 班味儿超过了办公室 "。这一现象的背后,无疑是移动办公已经成为了相当多人生活中的一部分,而 AI 大模型在办公场景也开始逐渐有了存在感。别的不说,以 LLaMA 2 为代表的大模型在文字工作上可以说是相当擅长。

在用户给定输入与上下文生成新的文本、提取文本信息并总结、对文本内容分类、通过提示词工程自动对文本内容纠错,大模型真真切切是能提升效率的工具。Rabbit R1、Ai Pin 等 AI 硬件为什么能在 CES 上搅动风云,甚至受到众多消费者的青睐,简化用户与技术的互动无疑才是关键。而 AI+AR 眼镜的组合同样也是如此,戴着眼镜、动动嘴就能生成 PPT、写周报,相信就会吸引不少的消费者。

但唯一的问题,是语音交互的私密性不足,毕竟对着空气自言自语曾经是导致谷歌 Google Glasses 失败的关键。君不见,苹果在展示 Vision Pro 时基本都是以家庭场景为主。所以要如何解决公共场合的使用问题,或许就是 Meta 接下来的重点课题。

【本文图片来自网络】

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

智慧云

智慧云

ZAKER旗下新媒体协同创作平台

相关标签

ai vision 智能手机 ar眼镜 ar
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论