X研究媛 6小时前
AR四小龙,“危”“机”交织进行时
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

从悲观到乐观

最近 AI+AR 眼镜越来越热闹了,前有 " 掌握核心科技 " 的 JBD 获得天量融资,再有未披露具体金额却是行业今年最大单笔融资的华南某企业,春江水终于暖了,也真心为一众 AR 创业公司庆幸。

作为曾在行业里两家标杆性公司工作的野生评论家,深知消费级 AR 极不成熟又身体力行的不易。

两年前,核心微显示屏和光机占了 BOM 成本一半,但是色彩、亮度始终不能匹配需求;近眼显示光学方案复杂艰深且远未达成共识,量产一致性和良品率又十分感人,这些必须买单的高昂成本,成型终端只有羸弱的场景和极为有限的扩屏和信息提示功能。

消费级 AR 不是真 AR。要同时满足 " 消费级 ""AR",那只能是假的。

一个代表,Video-See Through 方案强大如苹果也难,无论光学模组、sensor、算法、算力再怎么推进,本质上人类要适应 " 透过摄像头以望远镜方式 " 去观察世界,这似乎要等待智人完成进化,Apple Vision Pro 在消费市场前景难测。

一群野蛮人,Optic-See Through 方案乃至部分透光的 BirdBath 方案真正能被消费者接受,但做完整的 AR 只有做成头盔,只能 2B 不能 2C。中国 AR 四小龙没有虚实交互的消费级 AR 算是啥 AR?而且 APP 几乎等同于没有,买来就吃灰,没有复购和稳定换机那就只有不断去 " 打新 "。BirdBath 方案和光波导方案为代表的消费级 AR 是一个极为早期的边缘市场,使劲表演和卖吆喝企业才能拿融资续命。

2022 年底 ChatGPT-3.5 在全球出圈,在看似毫不相关的消费级 AR 上煽起了一场完美风暴。LLM 技术演进不仅是消费级 AR 这一品类最大的关键变量,能够尝试的产品组合、场景、功能一下子丰富了太多,而且在国内外许多巨头眼里,高透光、日常佩戴可以出街的 AR 眼镜才是 LLM 落地最佳的硬件范式。

理论上,接入云端的大模型 API,实时进行语音、文字、图片和视频流的接收识别和生成,你的眼镜能在多模态层面理解世界,了解你的喜好,就像海外著名科技博客 The Verge 的编辑所说的:我感觉自己就像托尼 · 斯塔克(钢铁侠),而 Gemini(谷歌推出的大模型) 就是我的 J.A.R.V.I.S.。

大语言模型、生成扩散模型的改进是一场全球竞速。端到端训练并行调用工具的高阶智能体,能识别屏幕 " 元素 "、依靠长程规划执行多步骤任务的 GUI Agent,在应用端极富潜力。今年强化学习后训练导入了思维链扩展全新的 Scaling 范式,更进一步,能理解物理现实、预测并且生成 3D 内容的世界模型,想象空间非常大。单绿色很窄 FoV 的光波导 " 无用 " 眼镜,都能变成AI+AR 的下一代消费电子

调用随心的第二大脑,超越原来的 " 头戴计算机 " 范畴,对现实世界进行实时的视觉增强,理论上科幻片的场景会随着大模型的进步触手可及。实现长程推理、统一的多模态信息流处理架构的 GUI Agent,可能会诞生新的技术路径,大大简化原来实现 AR 功能必须的定位、建图、渲染过程,推理算力在云端,sensor 和基础的人机交互在终端,创新的空间和产品自由度一下子打开。

技术进步驱动了功能和场景扩张,让原来实现某个功能的复杂度和成本降低。这是典型的技术革新创造新品类、新需求的过程。

" 危 " 与 " 机 " 交织的四小龙

不似东邪西毒南帝北丐,但东西南北正好分布着中国消费级 AR 的四小龙。原来北方的那家拿了上海的钱,搬去了东方,还有一家在南边深圳的搬去了西边成都。

面对 AI+AR 下一代消费电子的诱惑,国外 Meta、谷歌、微软、苹果都有不懈怠的多年研发,并购关键技术公司,专利池储备深厚,都准备在市场起飞的节点亮出大招。

Meta 的 Ray-Ban 堪称神来之笔,仅仅是音频和 AI 优化到一定程度市场就爆了。Meta 还继续发挥钞能力,Orion 用碳化硅做波导基底,FoV 撑大到 70°,在一个轻量级光波导眼镜这属于前所未有,Orion 波导 Layout 扩瞳方案让人着迷,三片合色的 Micro LED 全彩光引擎亮度尚可,重点是镜片前向漏光大大减少,在阵列光波导上实现这一点非同寻常,日常佩戴看不出是一副 AR 眼镜。

Meta 先以 Orion 做出了完美的高端示范,Ray-Ban Display 再精准在配置上下刀、接力,当 Meta 一手拿着 Orion,一手推进 LLaMa(未来可能转向闭源),软硬整合 AI 和 AR 上同时发力不可小觑,如果以下一个 Apple 的预期来看,少有人察觉 Meta 的股价目前正在低位运行。

后知后觉的媒体和用户可曾发现,消费级 AR 的 iPhone 时刻也许已经降临。

国内,字节阿里腾讯百度甚至华为都开始认真看待 AI 眼镜,除此之外,还有一个擅长深入企业沟通交流再用数倍薪资挖人的网红公司,它匿在阴影中窥视,特别擅长利用高一个指数级的品牌声量快速起量,再利用这股能量在供应链议价去做极致性价比。

当众神降临,再有清道夫下场洗地,对于曾经的 AR 四小龙,严肃的市场拷问并不远。AR 四小龙的愚蠢在于,他们扮演的角色,可能正在给大厂做产品上的 MVP 验证。

南边深圳的那家是两条腿走路,X 系列与 Meta Orion 同源的三片 Micro LED 合色的全彩光引擎,但比 Meta 更早更激进,搭配单片全彩的光波导显示,这是风险极高、少有人敢于尝试的方案,经过了 2 年多迭代,行业真正量产开卖的独此一家,售价逼近万元。虽然光引擎核心组件来自供应链,这中间在量产过程中付出的努力,包括设备定制,与应用材料公司推进刻蚀工艺落地,SRG 光波导显示 Layout 的改进,值得钦佩。

但是另一条产品线 BB 方案(BirdBath)的 Air 系列的产品动作值得商榷,在那么小的镜腿上迭代那个小 Mic,真的明智吗?空间限制 Mic 鼓膜面积导致的音效天花板在那里,强调私密观影的话用户更愿意戴个蓝牙耳机。新加入的画质芯片的增益没有实际体验不好评价,但感觉噱头大于实际,去在镜片模组上做光学显示深度调校和人机工学平衡对用户来说更有价值效果更直观,而多一度少一度 FoV,多大多大的虚拟屏尺寸只能骗用户。

杭州的那家,虽然有一些真假难辨的流言,Misa 是我见过最有 Geek 范的企业家。最新的光波导眼镜光引擎还是单绿色,光舟一拖二的光引擎能很好降本,让双目方案光线耦入准直的难度降低,波导 Layout 好像后期做了一些改进,减少了一些前向漏光,可以直接贴合近视镜片,努力把眼镜做成一副正常的形态。

另一条产品线 BirdBath 中规中矩,产品的质感确实不错,在一些细节地方注重用户体验,挑不出什么毛病。只是那个来自供应链的近视调节功能我感觉有些想当然,近视用户绝大多数同时有散光症状,散光矫正不了,还是免不了夹个近视镜片。

在有限的接触中,Misa 给我的感觉是行事光明磊落,小动作很少,一直重视来自用户的反馈,在产品改进、量产和成本中走钢丝,也很早就看到了硬件的局限而尝试布局系统和软件开发生态,这点非常有前瞻性。

但是产品还是不够 " 硬 ",不够激进和终局,供应链方案的拿来主义深度改进有限,重视产品质感、工业设计、细节迭代、系统和软件生态,但起码你要做一个 " 硬件概念机 " 让外界惊艳讨论一阵,拓展企业的想象空间。在一个未来高度不确定、高风险的行业中,做一个老实人是最大的风险。

上海的那家,老板比较孤傲,但是 BB 方案上(BirdBath)确实它们做得最好,一直在关键细节上改进,技术储备最深,谷歌选择和它家联姻做 OEM 示范不单纯是营销套路。最新产品印象比较深的还是 Xprism,似乎借鉴了 Apple Vision Pro 定制多层 Pancake 透镜的灵感——超薄光学模组极短折反射光路,上海这家新品多了一片折返镜片(不确定)设计多了一层折射光路,既减少了模组厚度又放大了 FoV,以及继续改进抑制镜片底部的杂散光。

但是上海这家只有一条产品线,整个行业看 BB 方案明显是一个过渡方案,边缘市场的定位很难突破,强调主机和显示分离的分体式,自研芯片,做到了 3DoF 还是 6DoF 稳定可靠可用,但 BirdBath+AR 明显是剑走偏锋,不去做平整镜片高透光的光波导方案,在市场上意味着不进则退。

成都的那家,比较莽,老板江湖气和执行力似乎都很强,曾经的 INMO Air 2 敢为天下先,最近的产品没啥深刻印象。

四小龙在尝试不同的硬件方案,测试不同的产品路线,这个过程中跑通供应链,获得量产沉淀,以用户反馈迭代产品。风险全部自己趟一遍。

但茫茫机海中四小龙仅仅暂时是名声够大,后来者难道不可以像素级复制,有什么别人想抄又真正抄不了的东西?

这个行业的定海神针还是 JBD 的 Micro LED 或视涯多层 Micro OLED 微显示屏,以及一系列做光引擎、光学模组、波导镜片的公司,还有更底层的晶圆、刻蚀、光学设计和材料公司。定制算法 DSA 或者 SoC 芯片,端侧或者云侧的大模型门槛太高,小体量的创业公司根本够不着,真正产品的护城河你是挖不动的。

如果对硬件艰深有足够认知,积累了足够的设计制造、工程化、大规模量产 know-how 后,更能领悟算法、软件、系统、软硬一体的模式有多么高维。

英伟达是靠极致的 GPU 架构设计和工程化积淀来成为 AI 时代的世界第一吗?不,是来源于十几年在科研一线去观察算法,开发算子,以 CUDA 驱动 GPGPU,架构足够通用的同时底层的数据流计算足够高效,把复杂的逻辑控制和流水线调度和对应映射的硬件微架构留给自己,把更高效更低门槛自由度更高的算法开发留给 Coder 和模型开发者。

苹果是靠极致的产品体验和硬件性能统治了智能手机时代吗?它是靠 iOS 生态和不断扩张的应用与自己的硬件产品深度耦合、无法分离,又在出货量上来的过程中逐渐自研 SoC,尝试啃下来 Micro LED 屏、统一内存、自研基带。

个人浅见:无论消费级 AR 还是 AI 眼镜,未来可能逐渐会变成一个软件生意、生态比拼。砸大钱做产品不如做系统,深耕供应链和关键组件不如做软硬一体,有策略、有节奏、逐渐把触角伸进芯片、传感和显示的核心技术上。

创业的本质是找寻未被挖掘的 PMF,在茫茫多的组合和精心设计的结构中找到让用户舒适、上瘾的机制。

在找到 PMF 之后,还得阻挡后来者和跨界而来的巨头,它们堆积资金、人才、供应链资源都无法复制的某种独一无二的产品体验,用 Killer App 滚起雪球,用户越多网络效应越强,让剩下的人被迫进入一个封闭的体系。品牌的心智锚定是自由的,市场竞争是残酷的,而垄断才是最好的生意。

黄铮有一句话特别值得细品:那些随着时间流逝、对加深生意的护城河有利的往往是 " 资产 ",那些时间越久对自己越不利的可以看成是费用。

软件大于硬件,算法胜于商法,无法复刻的软硬件封闭体系打造出来的品牌溢价,高于没有尽头的性价比。

后话

消费级 AR 是一个技术基本够到门槛,供应链逐渐成熟,市场渐渐打开,风险投资开始管够的赛道。

最最关键的,它是 AI 最佳的硬件落地范式,万亿级的大模型投资和算力市场,只要稍微洒点水,蝴蝶轻轻扇动一下翅膀,AI 眼镜掀起的飓风能横扫全球。

作为一个科技媒体出身的硬件发烧友,在互联网大厂和各类硬科技知名创业公司漂泊了 10 多年的野生作者,看消费级 AR 特别像 2006 — 2010 年智能手机的启蒙期。

千里之行始于足下,热爱确实能破万难。但是战术上的勤奋掩盖不了战略上的懒惰。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ar 融资 the 钢铁侠 谷歌
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论