"新发布具身智能平台‘悟能’能够为各类终端提供强大的感知、视觉导航及多模态交互能力。"
作者:苏打
编辑:tuya
出品:财经涂鸦(ID:caijingtuya)
" 很多人会问,AI 作为工具到底能不能赚钱?这也是我最常被问到的问题。作为商业化落地,我有一个很有意思的思考。"
公司情报专家《财经涂鸦》获悉,7 月 27 日,商汤科技董事长兼首席执行官徐立在 " 大爱无疆 · 模塑未来 "WAIC 2025 大模型论坛上,针对 AI 商业化背后的核心逻辑,从新的维度做出诠释。
让 AI 成为生产力本身
1950 年,最早的人工智能图灵对人工智能的判别式定义是," 如果我不能区分对面的是人还是机器,那它就是有智能的 "。彼时,人工智能的本质定义的是人的能力。而当大部分的任务都不能区分是人还是机器时,人工智能就变成了通用人工智能。
" 最初,大家觉得 10 年内便能解决模仿人的智能问题。但实际上, 真正在做的都是工具。于是预期被渐渐降到谷底。今天,当大家觉得不管是代码编程还自然语言处理和文稿生成方面,已经渐渐可以触达 AGI 时,新的高期待又产生了。" 徐立介绍道。
这种期待又带来一个问题,目前的人工智能工具是否已经足够好用,或者足够触达普遍定义的 " 人 " 的标准?AI 发展一定带来工具的演进,但工具的演进是否必然能带来效用的增加?
"我们在说商业化的时候,会发现一个很有意思的问题,即‘工具的陷阱’。很多时候,生产力工具能够带来结果变好,但也有可能会带来工作量变大"。
徐立坦言,比如,如果过往没有那么好的数据、编辑工具、图片编辑工具,大家可能工作也不用那么辛苦;如果如果没有电,可能也不用加班。" 我们团队经常说,如果没有 Word 和 Excel,原来的一些表格、处理文件可能只要几页就能完成," 但是现在就非常卷,比如招股书必须完成 300 页才能算是一个完整的报告 "。
原因在于,生产力工具推动的是行业平均水平的发展,这使得行业对于标准的要求越来越高,导致参与者掉进工具陷阱,工作量逐渐变大。
" 所以,很多商业化场景中,如果以工具来做付费诉求,其实会面临挑战,因为很多人不会为过程买单。这导致行业的共识正在逐渐从过程、成本导向,向效用导向转化。"
徐立在分享其思考时表示,人工智能带来的究竟是生产力工具还是生产力,是当下的一个新命题。"如果是生产力工具,现在很多 To B 的商业模式将会继续面临进程缓慢的问题,如同此前的 SaaS 一样 "。
" 但是我们仍旧能看到,在一些垂直领域上,特别如今被熟知的 WebCoding、数据分析等层面,生产力工具已经在向软性的生产力,甚至是数字生产力转化,形成端到端结果的呈现 "。
「悟能」具身智能平台将充分赋能各类终端
论坛期间,徐立代表商汤科技重磅发布 " 悟能 " 具身智能平台。
该平台以商汤具身世界模型为核心引擎,依托商汤大装置提供端侧和云侧算力支持,能够为机器人、智能设备提供强大的感知、视觉导航及多模态交互能力,推动智能终端向更高层次的自主化与智能化演进。
针对平台能力,徐立做出了进一步解释。
首先,视觉感知。这是识别和理解世界万物的第一步。" 这部分能力上,商汤适配了大量端侧芯片,包括云和端处理的能力,完全可以嵌入到机器人核心芯片中 "。
其次,视觉导航。目前,全自主的机器狗、机器人尚未出现,但无人驾驶的车辆已经出现。商汤驾驶赋车企的经验同样可以适配到机器狗、机器人,以及各种不同的基础硬件身上。
第三,多模态交互。现场,徐立展示了搭载具身世界引擎的人形机器人,生动讲解 " 长安的荔枝 "PPT 的效果,语言自然,风趣幽默,不仅可以自动翻页,还能回答各类问题,并进行阶段性小结。
此外,商汤具身世界模型还能够生成多视角视频,并确保良好的时间一致性和空间一致性,让机器能够理解、生成、编辑真实世界,在空间层面实现世界交互,让 " 在真实的街道场景中玩‘极品飞车’ " 成为可能。同时,该模型还能构建面向人、物、场的 4D 真实世界。用户仅需要输入简单的提示词,比如 " 在厨房区域的架子上找东西 "," 进入娱乐室、向右转,然后打开通往院子的门 " 等等,模型就能自主进行位姿、动作骨架和指令的生成。
徐立表示," 商汤希望 " 悟能 " 具身智能平台能够帮助各种具身智能企业,帮助他们完成和现实世界交互的梦想。"
本文由公众号财经涂鸦(ID:caijingtuya)原创撰写,如需转载请联系涂鸦君。
添加涂鸦君个人微信(ID:tuyaclub)
加入【公司情报社群】
参与资本市场讨论
获取一手情报
登录后才可以发布评论哦
打开小程序可以发布评论哦