AI是万灵药？Meta要把大模型塞进AR眼镜里

寻找下一块 " 屏幕 "，这无疑是最近几年科技行业的一个热门赛道。随着个人计算机点燃了互联网，智能手机让移动互联网无处不在之后，这前后两次造富神话的出现，也让所有人都在期待下一次改变的到来。那么智能手机之后的下一代通用计算设备是什么？苹果 Vision Pro 代表的混合现实 ( MR ) 、Meta Quest 2 代表的虚拟现实（VR）、华为 Vision Glass 代表的增强现实（AR），也就是扩展现实技术衍生的硬件，就成为了现阶段最被外界看好的一个方向。

只可惜，下一代通用计算设备的探索如今暂时让位于高歌猛进的 AI。作为左手 Oculus、右手 LLaMA 2 开源大模型的巨头，Meta 方面似乎准备将大模型塞进 AR 眼镜里。就在 Meta 收购 Oculus、并在后者的基础上创立 Reality Labs 十周年之际，Meta 方面发布了一篇博客文章，回顾了 Reality Labs 过去十年的历程。

尽管通常这种自卖自夸的文章无甚价值，但在文末却透露了 Meta 方面准备推出一款 AI+AR 的产品。据 Meta 方面透露，全新的 AR 设备将同时提供与物理世界和数字内容互动的体验，以及访问 Meta AI 的实用性和娱乐性。

事实上，关于 Meta 将发布一款代号为 " 真 AR 眼镜 " 的消息，早在今年年初就已经广为流传。用 AI 来赋能 AR，确实是一个解开当下 AR 硬件困境的可行性方案，因为即使有了苹果的 Vision Pro，现阶段 AR 也缺乏故事可讲。

未来物理屏幕会消失，整个世界会成为你的屏幕，眼镜就会成为一个空间的浏览器，它将改变人与人、人与世界的交互方式，这就是如今业界对于 AR 眼镜的期许。但现阶段的 AR 眼镜显然还取代不了智能手机，尽管借助 AR 帮助使用者获得额外信息，AR 硬件在工业、医疗、教育、军工、安防等企业级市场已经有了诸多案例，但就像所有面向 B 端的产品一样，在攻下几个大客户之后，中小客户才是更难啃的骨头。

因此消费级市场就不得不成为了 AR 硬件主攻的领域，可问题是用户对 AR 的新鲜感，早在 2016 年、2017 年的 "VR 元年 " 就消失殆尽。

虽然在经过了多年的发展后，从技术层面来讲，通过 " 全反射 " 原理将光传输到眼睛前方、再释放出来光波导和利用镜面反射成像的 Birdbath，都能制造出优秀的透视 ( see-through ) 效果，因此目前 AR 眼镜提供的视觉沉浸感也普遍在线，几乎不会让用户 " 出戏 "。可是 AR 内容的贫瘠就远超大家的想象了，除了基于谷歌 ARCore 和苹果 ARKit 的一批样板之外，如今市面上以 AR 为卖点的应用可以说是少之又少，或者说从未有过一款非游戏类的 AR 应用出圈。

事实上，即使是 AR 游戏，也仅有 Niantic 旗下的《Ingress》和《宝可梦 GO》这两款相对有影响力的产品。主打虚拟环境与现实地理位置信息结合的《Ingress》，早在 2013 年就已发布，它几乎是 AR 手游概念真正意义上的开拓者。但这款游戏更注重的是真人玩家在线下的活动，也就是 "AR 为皮、社交为骨 "。

而真正将 AR 游戏概念发扬光大的则是《Pok é mon Go》，并掀起了一阵在现实世界捕捉宝可梦的热潮。如果实际体验过《Pok é mon Go》就会发现，其实它本身的游戏性平平无奇、AR 效果也并不惊艳，它的成功靠的是把 " 对宝可梦进行探索捕捉、战斗以及交换 " 从屏幕搬到了现实里。

但《Pok é mon Go》是宝可梦作为头部 IP 的成功，要不然 Niantic 后续拿着哈利波特、变形金刚、Pikmin、漫威、NBA 等 IP 做的 AR 游戏，也就不会屡战屡败了。

如今的现实是自 2016 年的《Pok é mon Go》之后，后续再无一个爆款 AR 应用出现，这也是为什么苹果会率先发布一个面向开发者、而非消费者的 MR 头显。毕竟无法想象买了 AR 眼镜后能做什么，这才是绝大多数消费者对于这类产品敬谢不敏的关键。别说用 AR 观影了，视觉沉浸感更强的 VR 头显都没能做到仅纯靠 VR 影片吸引消费者，如今无论国内的 PICO、还是海外的 Meta，其实都是拿游戏和健身来做卖点。

这时候，AI 大模型与 AR 眼镜的结合，就成为了一个吸引消费者的卖点。前段时间有网友发布了一则视频，感慨在京沪高铁上打开电脑发现周围都是同类，" 班味儿超过了办公室 "。这一现象的背后，无疑是移动办公已经成为了相当多人生活中的一部分，而 AI 大模型在办公场景也开始逐渐有了存在感。别的不说，以 LLaMA 2 为代表的大模型在文字工作上可以说是相当擅长。

在用户给定输入与上下文生成新的文本、提取文本信息并总结、对文本内容分类、通过提示词工程自动对文本内容纠错，大模型真真切切是能提升效率的工具。Rabbit R1、Ai Pin 等 AI 硬件为什么能在 CES 上搅动风云，甚至受到众多消费者的青睐，简化用户与技术的互动无疑才是关键。而 AI+AR 眼镜的组合同样也是如此，戴着眼镜、动动嘴就能生成 PPT、写周报，相信就会吸引不少的消费者。

但唯一的问题，是语音交互的私密性不足，毕竟对着空气自言自语曾经是导致谷歌 Google Glasses 失败的关键。君不见，苹果在展示 Vision Pro 时基本都是以家庭场景为主。所以要如何解决公共场合的使用问题，或许就是 Meta 接下来的重点课题。

【本文图片来自网络】

宙世代

智慧云

相关标签