根据弗若斯特沙利文的预测,全球端侧 AI 市场将在 2025 年至 2029 年间从 3,219 亿元跃升至 12,230 亿元,复合年均增长率(CAGR)高达 39.6%,相当于四年翻四倍的市场爆发。在这个宏观数据的映衬下,一级市场的体感同样火热:2025 年上半年,中国具身智能与 AI 硬件投融资达 114 起,融资总额超 145 亿元,远超 2024 年全年。在资本的推波助澜下," 大厂中高层 + 供应链 " 的组合成为了这一波 AI 硬件创业潮的标准画像。
然而,在宏大的叙事和狂热的资本背后,做智能硬件的创业者几乎每天都在回答同一个具体的问题:什么要,什么不要?模型做多大?功能做多少?哪些能力留在设备上,哪些丢给云端?定价面向哪类用户?每一个选择背后,都是成本、体验、功耗的三角博弈。没有人能做到全部,取舍才是这个行业的基本功。
云端模型越来越强,但这个 " 强 " 本身并没有让取舍变容易,反而让取舍更重要了——因为你手里能用的算力、电量、成本预算始终有限。端侧智能真正的命题不是 " 怎么把云端能力搬到设备上 ",而是 " 云端的能力已经这么强了,设备上到底该放什么、不放什么 "。
6 月 12 日,在 Singapore AI Week 期间,钛媒体「Talk To The World」组织了一场关于端侧智能全球化的讨论。五位分别来自语音可穿戴、智能戒指与眼镜、宠物健康数据、情感陪伴饰品和 AIoT 平台的代表,从不同的生态切口,带来了一线创业者的微观体感。
他们给出了一致的建议:端侧智能的全球化落地,本质上不是在"强能力 "上做加法,而是在 "真场景 "上做减法。

「Talk To The World」@Singapore AI Week 现场图片
云端的能力边界,恰恰是端侧的起点
一个看似矛盾的事实正在发生:GPT、Claude、Gemini 的模型能力越来越强,行业反而开始重注端侧。这不是因为云端不够强,而是因为 " 强 " 本身解决不了落地的痛点。
Wavenote 创始人华琨的判断很直接。作为从 AI infra 到 AI 应用,再到现在智能语音可穿戴设备的连续创业者,他指出一个被忽视的现实:尽管 ChatGPT 的周活跃用户已超 7 亿,但这仅占全球成年人的 10% 左右。这意味着全球绝大多数人并未深度接触过大模型产品。对这近 90% 的人群来说,云端的 " 强 " 毫无意义——他们既不会下载复杂的 App,也看不懂如何编写 Prompt。" 让普通人以他们熟悉的方式用上 AI",唯一可行的路径是先把硬件送到他们手里:一键操作,不用学就会用。端侧的价值不在"替代云端 ",而在 "创造入口 "。
从硅谷回到深圳的创业者 Grace,则从情感计算的角度揭示了另一个 " 云端够不着 " 的场景。她创立的 VerylovingAI 主要做家庭情感陪伴,第一代产品形态是 AI 情感陪伴饰品。她认为,在这个场景的核心刚需是情感交互,需要 " 活人感 " ——而 " 活人感 " 对时延的要求极其苛刻。行业数据显示,理想的对话交互延迟应在 200 至 500 毫秒之间,超过 1.5 秒用户就会产生明显的迟滞感并放弃交互。" 云端模型再强,网络传输的物理延迟降不下来,情感交互就成立不了。"
在宠物健康管理领域," 在线 " 比 " 智能 " 更紧迫。SATELLAI 的联合创始人顾岩表示:" 云端大模型很强,但它不在现场。" 宠物情绪、行为习惯的洞察,需要连续的数据支持," 先保证在线,再逐步变聪明 "。这也是 SATELLAI 选择宠物项圈这个硬件形态的原因,它是 24 小时不间断收集宠物健康数据的 " 最落地方式 "。这不是技术路线的选择,而是场景属性的决定——有些数据,错过了就永远补不回来。
TuyaSmart(涂鸦智能)APAC 市场创新负责人屠熙蔚基于 Tuya 平台连接的全球近 200 万开发者和数以亿计的智能设备,给出了总结:" 凡是延时、可靠性与安全敏感的场景,端侧或边缘侧就更刚需。" 例如安防、养老、医疗——这些场景相对于模型有多强,更看重响应有多快、多稳、多安全。
端侧智能不是在跟云端比 " 谁更强 ",而是在回答一个云端答不了的问题——当用户需要 AI 在现场、在当下、在毫秒级响应时,你怎么做到?
形态之争的本质:以最无感的方式交付最大价值
当端侧成为共识,下一个问题变得具体:选什么硬件形态?端侧硬件的竞争,已经从比拼功能丰富度,转向了比拼 " 谁能让用户以最无感的方式获得最大价值 "。
Gyges Labs 的联合创始人邓旭东选择了智能戒指。Vocci Ring 是 Gyges Labs 在 AI 智能眼镜之后的第二个 AI 硬件产品形态。有趣的是,Vocci Ring 没有选择健康监测这一已被 Oura Ring(2025 年预计销量破 400 万枚)验证过的红海赛道。在邓旭东看来,戒指的价值在于成为 "Agent 调用的最短路径 "。无论是眼镜还是戒指,都是 Gyges Labs 用 AI 能力服务核心目标人群(年轻商务人群)的介质。商务交流是更共性的刚需场景,在会议中点一下戒指进行高亮标记、长按触发对话,交互负担极低。
华琨的 Wavenote 则走了一条更极简的路。在全球更广泛的年龄偏长人群中,他们 " 不追求黑科技,只要把几个场景做到极致 "。他们投入极高的研发成本,将复杂的按键精简为一个,一键开启,甚至主动去掉了那些可能炫技但会增加学习成本的功能。" 真正难的不是往上加功能,是往下压门槛。"
Grace 的选择同样体现了 " 减法逻辑 "。她没有做功能繁杂的智能手表,而是选了手镯、项链、耳饰这些情感属性更强的形态。因为目标人群(独居者)的核心诉求不是 " 功能多 ",而是 " 有人陪 " 和 " 有人救 "。AI 手镯的一键报警功能极简,但安全与情感的价值极高。
这些形态选择背后有一条暗线:邓旭东说得很直白:" 眼镜就该像普通眼镜好戴、戒指就该像普通戒指好戴;让智能融入 16 到 24 小时的日常。" 当一个 AI 硬件能让用户忘记它是 AI 硬件时,它才算真正成立了。这也回答了商业模式的终极拷问——用户不会为 "AI" 这个词付费,但会为 " 非 AI 做不到的结果 "(如实时转写、情感陪伴、行为洞察、场景自动化)持续买单。
端云协同不仅是技术架构,更是商业取舍
端侧和云端的关系到底怎么摆?这不仅是技术问题,更是残酷的商业算账。
屠熙蔚认为,云端协同的难点不在于模型放在哪里,而在于如何分配好智能的能力。以涂鸦平台为例,现实世界里的设备并非整齐划一:摄像头、网关、传感器、插座、空调,它们的算力、成本、功耗、使用频率完全不同。不是每一个设备都适合跑大模型,也不是每一个场景都需要大模型。因此,涂鸦的逻辑是做 " 分层智能 ":
第一层是设备端的基础感知和执行(稳定、低功耗、低成本);
第二层是边缘侧 / 网关侧的本地协同(本地联动、场景规则和部分 AI 判断);
第三层是云端 AI 和平台能力(复杂模型训练、数据分析、跨设备协同)。
但这个框架落到具体产品上,就变成了真金白银的取舍。华琨算过一笔账:除了硬件 BOM 成本,还有持续的订阅与 Token 成本。日本用户会非常在意是否能过滤 " 无效语音 " 来省 Token;巴西、中亚市场的支付能力又完全不同。" 作为做过 infra 的人,我们有义务把推理成本持续降下来,让订阅可负担。" 他选择在全球化调度中 " 选性价比最佳的模型 " ——这不是技术最优解,而是商业可行解。
顾岩的取舍更为极端。宠物项圈 24 小时在线联网,先天需要运营商网络费用,订阅是生存的基础。但他 " 不想把云服务和 Token 成本简单转嫁给用户 ",而是通过提供 " 有用的能力与价值 " 来收费——基于连续的行为数据给出喂养、营养、作息建议。" 用户为结果付费,不为 'AI' 付费。"
这引出了一个更深层的问题:当每个设备商都开始跑自己的端侧模型,平台会不会退化成 " 连接管道 "?屠熙蔚的答案是反直觉的——设备商越跑模型,平台越有价值。因为 " 市场不会自然变简单,只会更碎片化 "。用户家里不可能只买一个品牌,真正的问题变成了:这些智能设备如何协同?数据如何打通?场景如何统一?" 单个设备可以很智能,但用户要的是一个完整场景。"
全球化不是 " 复制粘贴 ",是 " 重新做一遍 "
几乎所有的 AI 端侧产品都是生而全球化的,但 " 全球化 " 背后的坑,远比想象中多。全球化落地真正的门槛,不是技术适配,不是合规隐私,而是 " 理解差异 " ——理解不同市场的用户到底在为什么付费,以及他们愿意付多少。
屠熙蔚的第一个提醒是:" 不要以为一个产品在中国跑通,就可以直接复制到海外。" 家庭结构、居住环境、网络环境、安装习惯、售后体系全不一样。东南亚用户对价格敏感但实用价值要求高;新加坡则高度重视合规、政府背书和长期运维。
华琨在全球化运营中感受到的是 " 付费心智 " 的差异。如前所述,日本用户极度在意 Token 消耗,而新兴市场的订阅价格必须打到极低。" 我们要做全球化的算力与模型调度 " ——同一个产品,背后的成本结构需要为每个市场重新设计。
邓旭东遇到的则是物理层面的约束。眼镜的第一视角显示与信息采集无可替代,但重量与续航限制了普及速度。" 接下来会持续寻找采集方便、交互自然、长期佩戴无感的形态 " ——全球化不是同一个产品卖全球,而是在不同市场找最适合当地的形态。
顾岩补充了一个常被忽视的维度:"AI 的本地化不是翻译语言这么简单。" 不同国家的用户习惯、表达方式、家庭场景、服务期待都不同。" 真正的本地化是产品逻辑、服务逻辑和商业逻辑的本地化。" 这需要本地合作伙伴、标准化平台能力和可复制行业方案的叠加。
结语
这次讨论最锋利的观点,或许是顾岩的一句话:"不要为 '上智能而上智能'。"
端侧智能的全球化落地,不缺热情,不缺技术,甚至不缺资金。缺的是对场景的深刻理解,在功耗、成本、体验约束下的清醒取舍,以及对不同市场用户需求的细腻洞察。
云端模型会越来越强,但这恰恰会让端侧的 " 真需求 " 更加凸显——不是每个设备都需要完整的 Agent,但每个场景都需要 " 刚好够用 " 的智能。当 AI 创业者停止在云端能力上做加法,转而在用户痛点上做减法,找到那个 " 非你不可 " 的刚需场景时,端侧智能的全球化,才算真正开始落地。
「Talk to The World」是钛媒体打造的全球科技对话品牌,致力于在全球最重要的科技创新场景中搭建中国与世界对话的桥梁。此次 Singapore AI Week 期间的对话,是「Talk to The World」继 CES、IFA、MWC 之后的又一重要站点,链接改变全球创新趋势的前沿领袖。
(本文根据活动现场速记整理,经嘉宾审阅授权发布)


登录后才可以发布评论哦
打开小程序可以发布评论哦