
在杭州科技圈," 杭州六小龙 " 一直是一个响亮的代号,代表着这座城市最具活力的 ToB 独角兽力量。然而,当 SaaS 增长见顶的焦虑与 AI 大模型的狂热在 2025 年交织碰撞时,这些明星公司正站在十字路口。
这是一场关于商业上限的极限测试。
一方面,中国 SaaS 行业长期面临着 " 付费意愿低、定制化重、增长见顶 " 的结构性困境。群核科技(酷家乐母公司)CEO 陈航在交流中直言不讳地指出了这种尴尬:" 美国 SaaS 本来就赚钱,加 AI 是锦上添花;中国软件行业本来就不赚钱,再加个 AI,也不知道能不能赚钱。"
另一方面,AI 虽然描绘了宏大的未来,但对于大多数企业而言,仅仅在软件里加一个对话框并不能带来真金白银的增量收入。
在这个充满不确定性的周期节点,这家成立 14 年的独角兽没有选择跟风做一个 " 套壳 " 的聊天机器人,而是试图利用通用大模型的弱点,以 " 空间智能 " 重写物理世界的运行规则。
当 Sora 撞上 " 物理墙 "
当下的 AI 赛道,正陷入一种 " 大力出奇迹 " 的迷思。ChatGPT 和 Sora 的惊艳表现,让人们误以为通用大模型可以解决一切。
但在陈航看来,通用大模型在面对真实物理世界时,存在着一个致命的盲区。他在演讲中抛出了一个耐人寻味的隐喻:如果你让现在的 AI 画一只手表,指针永远指向 10 点 10 分。
这并非因为 AI 理解时间的流逝,而是因为它是互联网数据的 " 复读机 " ——在电商广告和精美海报中,为了视觉美感,手表通常都被定格在这个时刻。AI 学到了像素的排列,却完全不懂机械齿轮的咬合逻辑。
这种 " 不懂物理 " 的缺陷,在视频生成领域尤为明显。群核科技 AI 产品总监龙天泽在现场展示了一系列令人啼笑皆非的 "AI 穿帮 " 视频:咖啡倒出来又诡异地吸回去,酱油透过锅盖直接煮杯子,甚至香水从人的嘴巴里喷出来。
这些 " 物理幻觉 " 之所以产生,是因为现有的视频模型本质上是在二维像素层面猜测三维规律,这种 " 降维学习 " 注定无法理解深度、遮挡和重力。而这个痛点,恰恰成了群核科技试图建立的战略护城河——利用过去 14 年积累的 5 亿个 3D 结构化场景数据,让 AI 从 " 猜世界 " 进化到 " 算世界 "。
为了解决通用模型的不可控,群核科技发布了对标 Sora 的视频生成工具 LuxReal。
龙天泽用了一个生动的比喻来拆解其技术逻辑:" 把大象放进冰箱分三步,做可控的商业视频也是三步:第一步选主角,第二步搭舞台,第三步拍视频。"
与 Sora 单纯预测下一帧像素不同,LuxReal 的逻辑是先用 AI 生成一个包含真实物理属性的 3D 商品(主角)和场景(舞台),然后再在这个虚拟空间里安排灯光和运镜进行拍摄。龙天泽指出,虽然目前市面上的 AI 工具降低了门槛,但缺乏商业级的可控性,而群核选择这条 " 先建后拍 " 的技术路线,正是为了确保视频里的商品不变形、光影符合物理规律,让 AI 视频从 " 玩具 " 变成电商营销和短剧制作的 " 工具 "。
更大的野心:" 卖水人 "
如果说 LuxReal 是解决了 " 造梦 " 的问题,那么同期发布的工业 AI 孪生平台 SpatialTwin 和空间智能训练平台 SpatialVerse,则暴露了群核更大的野心——做机器人时代的 " 卖水人 "。
群核科技董事长黄晓煌算了一笔账:在现实世界搭建一个测试空间,装修成本就要 10 万到 20 万,而在数字世界里成本极低;现实中机器人训练一小时就是一小时,而在数字世界里,一小时的训练量几分钟就能跑完,还可以无数台设备并发。
这实际上已经能够推动商业模式发生质变。
长期以来,软件公司习惯了按 " 人头 " 收年费。但在黄晓煌看来,未来世界将发生巨大变化:" 机器调用的数量会比人用的更多。" 当一家机器人公司调用群核的场景数据进行百万次训练时,收费模式也将从单一的订阅制,转向 " 订阅 +Token/ 算力 " 的混合模式。
最后,黄晓煌讲了一个他在卡塔尔出差时的故事。
当地一位身穿白袍的贵族告诉他,他们国家依靠大量外劳,实现了 "10 个人服务 1 个人 " 的幸福生活。黄晓煌认为,中国不可能靠人力实现这种生活,未来想要过上这种日子," 肯定要靠机器人,可能会有 10 台机器人服务一个人。"
但前提是,这些机器人不能只在屏幕里陪聊,它们必须走进物理世界,去端茶倒水、去搬运货物。而这,正是群核科技押注 " 空间智能 " 的逻辑:在那个机器大爆炸的未来到来之前,先造好一个懂物理、可计算的数字世界。


登录后才可以发布评论哦
打开小程序可以发布评论哦