虎嗅网 5小时前
AI硬件革命来了
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

本文来自微信公众号:  格隆汇 APP ,作者:城北徐公

当达沃斯论坛的精英们还在为 AI 伦理吵得面红耳赤时,OpenAI 政策主管克里斯 · 莱恩扔出了一颗 " 硬件深水炸弹 ":

将于 2026 年下半年,推出首款 AI 设备,无屏幕、语音核心、10-15 克可穿戴设计。

年度计划出货量高达 4000 万 -5000 万台!

目前外界猜测,它可能是一支笔,也可能是一种形似豆荚的耳机(Sweetpea)……

无论如何,一旦它真的能这么快达到这个量级,"10 至 15 克 "、" 无屏幕 "、" 取代应用程序 " 等关键词,无疑是在向统治了世界近 20 年的智能手机宣战。

这本质上是一次豪赌。

赌的并不是能不能做出这款产品。

而是市场、乃至整个人类社会是否愿意放弃 " 所见即所得 " 的安全感,去拥抱 " 所说即所得 " 的未知。

最终我们看到的,到底是改变世界的黑科技,还是一坨昂贵的电子垃圾?

01 颠覆性创举

无屏幕设计的最大的难点是传感器。

无屏幕意味着无法通过视觉反馈确认用户意图,只能靠多模态传感器来 " 感知 " 外界。

也就是说,AI 设备必须形成 " 听觉 + 视觉 + 生物传感 " 的感知矩阵,实现从 " 指令响应 " 到 " 情境预判 " 的升级。

先看听觉系统,采用了高灵敏麦克风阵列与 xMEMS 超声波驱动单元。

麦克风阵列具备 360° 语音采集与 AI 降噪能力,能在嘈杂环境中精准提取用户语音,甚至区分多人对话中的目标指令。

xMEMS 的超声波发射器工作频率达 40kHz 以上,响应时间低于 10 微秒,比传统动圈单元快百倍,配合 Cypress 音频芯片的自适应均衡算法,既能实现骨传导私密输出,又能还原全频段音效,避免了语音助手声音像机器人的违和感。

在此基础上,OpenAI 还开发了全新端到端音频模型,支持边听边说。

用户中途打断时,模型能即时调整输出,而非机械等待用户说完。

只有这种类人对话节奏,才算是比较自然的交互。

再看视觉与环境传感,内置微型摄像头与多维度传感器。

摄像头并非用于拍照,而是通过计算机视觉技术实现环境感知:识别场景(如会议室、地铁、卧室)、物体(如文档、白板、路标),甚至用户手势与表情;配合加速度计、陀螺仪、温湿度传感器,还能感知用户状态(如行走、静坐、疲惫)。

比如在会议中,设备能自动识别讨论主题,实时转写语音并整理待办事项;在通勤路上感知用户疲惫,主动播放舒缓音乐并建议调整日程 ……

如果真能实现,这就超越了单纯 " 工具 " 的范畴,而是实打实的 " 贴身助理 "。

更颠覆性的是生物传感模块,肌电传感器。

主要用于捕捉用户嘴唇微动或喉部肌肉的细微电活动,实现 " 默读即输入 " 的无声语音交互。

想象一下:在图书馆或会议室,你甚至都不用发出声音,张嘴默念 " 帮我查一下这个 ",设备就能通过肌电信号识别指令,悄悄用骨传导告诉你答案。

这种技术此前仅用于医疗康复领域,OpenAI 首次将其民用化,采样率高达 2000Hz,能分辨不同用户的肌肉收缩模式,误触发率控制在 0.1% 以下。

第二个难点,是设备必须具备独立且高效的本地计算能力。

从爆料信息与供应链动态来看,这款设备的 " 大脑 " 大概率是三星定制的 2 纳米 Exynos 芯片,预计 2026 年实现稳定供货。

这颗指甲盖大小的硅片,才是实现无屏交互的核心底气。

2 纳米制程是当前的天花板级技术,晶体管密度比 3 纳米提升 30% 以上,达到 300 MTr/mm²(每平方毫米 3 亿个晶体管),漏电率降低一个数量级,性能 / 功耗比提升 34%。

只有这样,才能在 10-15 克的设备里,既塞进具备高端手机级算力的芯片,又把续航控制在 18 小时以上。

更关键的是,这颗芯片还支持本地运行 " 蒸馏版 " 大语言模型。

OpenAI 完全可以把 GPT-5 的万亿级参数压缩至十亿级别,通过量化、剪枝等技术,让设备在 8GB LPDDR5X 内存与 128GB UFS 4.0 存储的支撑下,实现离线语音理解、上下文记忆与多轮对话。

这种 " 端侧优先 " 的设计,不仅把响应延迟从云端的数百毫秒降至微秒级,更解决了隐私泄露的核心痛点——所有语音指令、环境数据都在本地处理,不会上传云端。

上面我们所描述的场景和功能,都足够美好而强大。

问题是,是不是真的能这么快就能实现,就在今年下半年?

02 即将量产?

为了这一天,OpenAI 其实早已埋下伏笔。

2025 年 5 月,OpenAI 豪掷 65 亿美元收购了苹果前首席设计官 Jony Ive 创办的硬件公司 io。

就是设计出 iPhone、iPad、iPod 的那位,号称 " 科技美学教父 "。

从目前爆料的 " 小型豆荚或笔形 " 外观来看,确实明显带着苹果产品的影子,一体成型的金属外壳、轻量化极简设计。

同时,OpenAI 还从苹果、谷歌挖角数百名硬件工程师,覆盖芯片设计、传感器集成、工业制造等核心领域。

从研发进度来看,设备原型机已进入内部测试阶段,按时间线推算:2023 年 Q4 完成概念设计,2024 年 Q2 制作首批原型机,2024 年 Q4 集成 AI 模型与传感器,2025 年 Q1 开放 API 对接生态,2026 年下半年正式发布 ……

客观来说,整个节奏比较符合硬件产品的正常研发周期,并非临时突击的炒作。

当然,能否真的量产,更重要的还是供应链。

虽然目前富士康已独家介入原型机生产,优先启用越南工厂,同时预留美国工厂产能,为全球出货做准备。

但 OpenAI 的产能目标相当激进:首年计划出货 4000-5000 万台。

而台积电 2026 年 2 纳米产能预计为每月 10 万片左右,苹果已预订一半产能用于 iPhone 与 Mac,留给 OpenAI 的产能箱单有限。

更关键的是其它两大风险点。

首先是技术磨合。

端侧大模型与硬件的适配、多模态传感器的数据融合、情境框架的精准度优化,都需要大量实测数据,若内部测试中出现重大 BUG(如误触发率过高、续航不达标),很可能会推迟发布时间。

比如,上面提到的肌电传感器与 xMEMS 超声波单元。

这两类组件并非通用零部件,需要供应商定制生产,良率爬坡周期可能长达 3-6 个月。

若良率不及预期,必然会导致成本上升。

有分析师测算,若核心组件良率从 80% 提升至 95%,单台设备成本可降低约 30 美元,这对定价策略(预计售价 299-399 美元)至关重要。

其次是合规问题。

AI 设备必须要能够全天候环境感知与语音采集能力,这是它强大的体现,也是对隐私法规的挑战。

比如欧盟《通用数据保护条例》要求用户明确授权数据采集,禁止无差别监听;美国加州《消费者隐私法》则要求用户有权删除本地数据。

OpenAI 只能针对不同地区优化隐私设置,获取对应市场的合规认证,这一过程可能需要半年时间。

若合规进度滞后,一样会导致发布推迟。

综上所述,2026 年下半年推出 "Beta 版 " 或 " 开发者版 "AI 硬件是可能的,但要实现全球大规模消费级量产,至少要推迟到 2027 年。

对我们消费者而言,全球首款 AI 硬件不论是今年下半年还是明年量产,其实区别并不大。

因为无论如何,这个时间点都太近了。

届时," 人机交互 " 这回事将被重新定义。

03 新纪元

现有的互联网经济,实际上是建立在屏幕时长之上;而无屏的 AI 设备明显是一种 " 反注意力经济 "。

比如,如果我不需要看屏幕,那么广告商的广告该怎么展示?

这就直接动摇了当下互联网大厂的根基。

一旦 AI 设备真的成为主流入口,传统的 SEO(搜索引擎优化)将彻底死亡,取而代之的是 AIO(AI Optimization)。

简单来说,品牌商需要讨好的或许不再是用户,而是那个能够推荐产品的 AI 本身。

如果真如 OpenAI 宣传的那样,该设备在第一年就达到 5000 万用户存量,全球移动广告市场将在一年内就萎缩 5%-10%,价值数百亿美元的广告预算将转移到 AI 推荐算法的竞价排名中。

更深远的影响在于,它将重新定义可穿戴设备的价值核心:从 " 健康监测 + 娱乐 " 转向 "AI 协同 + 效率提升 "。

这必然会倒逼其他跟进:苹果可能加速无屏 AI 设备研发,谷歌可能升级 Pixel Buds 的端侧 AI 能力,小米、华为等国产厂商则可能推出性价比版本,引发新一轮技术竞赛。

预计到 2028 年,全球无屏 AI 可穿戴设备市场规模将突破 500 亿美元,占整个可穿戴设备市场的 25%,形成 " 有屏 + 无屏 " 双轨并行的格局。

上游核心组件的需求也将因此爆发:2 纳米芯片、xMEMS 超声波单元、柔性肌电传感器的市场需求将大幅增长,台积电、三星、xMEMS 等企业将直接受益。

下游则会催生新的应用生态,开发者不再围绕 APP 开发,而是基于 AI 的情境框架设计场景化服务,比如医疗领域的实时健康建议、教育领域的个性化辅导、商务领域的智能会议助手等,形成全新的 " 硬件 + 算法 + 服务 " 生态闭环 ……

手机 APP 的时代可能将迅速消亡,这对我们每个人的影响都是巨大的。

先说好的一面:效率提升将覆盖多个场景。

在办公领域,语音转写、实时翻译、笔记整理等功能,能将会议效率提升 40% 以上。

据统计,全球职场人士每天平均花 1.5 小时记录会议内容、整理邮件,若这些工作由 AI 自动完成,每年可节省约 375 小时的工作时间,相当于增加 47 个工作日。

在教育领域,设备能实时记录课堂内容,生成个性化笔记,帮助学生专注听讲。

对老年人而言,无屏设计还降低了使用门槛,语音交互能帮助老人查询健康知识、联系家人、导航出行,缩小数字鸿沟。

预计到 2030 年,全球 60 岁以上老人中,无屏 AI 设备的渗透率将达 20%。

目前,全球普遍进入深度老龄化社会,这个数字有多么庞大,不言而喻。

再说坏的一面。

首先还是老生常谈的就业问题。

据世界经济论坛预测,到 2027 年,AI 将替代全球约 8500 万个工作岗位,其中行政助理、翻译、秘书等岗位的替代率最高,达 30% 以上。

AI 设备的普及,毫无疑问会加速这一进程。

更重要的是,技术从来不是中立的。

当每个人胸前都挂着一个长了耳朵和眼睛的智能时,社会契约将发生剧烈变动。

OpenAI 声称会注重隐私,但 " 环境感知 " 本质上就是持续监视,它收集到的数据必然会被拿去训练下一代模型。

据皮尤研究中心数据,78% 的用户担心 AI 设备的无差别监听,65% 的用户反对设备采集生物特征数据。

若 OpenAI 无法建立完善的隐私防护体系,可能引发信任危机,甚至被大部分国家限制使用。

人们的担心是很有道理的。

04 尾声

当笔记可以实时转写,当记忆可以随时回溯,当思考可以外包给 GPT……

一旦所有人真的对 AI 公司毫无保留,人将不再是人。

如果 AI 总是给出 " 最优解 ",绝大部分人将不会再去记忆任何东西,也不会主动去思考任何问题,人类整体的记忆力和智力都将明显退化。

我们可能变成被算法饲养的宠物,虽然生活极其便利,但大脑却日益平滑。

……

仅仅只看技术和资金层面,AI 硬件快速大规模落地持无疑是很乐观的。

但如果再考虑到社会接受度,我们不得不再谨慎一点。

毕竟,让人类把隐私完全交给商业公司,并习惯对着空气自言自语,这需要的不仅仅是技术突破,更是一场深刻的文化洗脑。

这需要时间。

希望到时候,我们还有隐私可言。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 传感器 生物 超声波 视觉技术
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论