雷锋网 3小时前
对话顾嘉唯:AI正在从虚拟世界,开始进入物理世界
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

11 月 17 号,AI+ 消费机器人公司灵宇宙宣布,已于近期完成 2 亿元 PreA 轮系列融资,投资方包括滴滴出行、拉卡拉、上海国际、国泰海通、广发信德等。这是灵宇宙继去年包括三七互娱、商汤科技、线性资本等资本加码后的又一轮系列融资。

不久前,我们在北京望京的办公室,见到灵宇宙创始人顾嘉唯,并与他进行了一次深度对话。

" 微软亚研院研究员 "" 百度少帅 ",百度 IDL(深度学习实验室)主任研发构架师,麻省理工媒体评论 MIT TR35 科技创新者,这是顾嘉唯曾经的标签。

2016 年,顾嘉唯加盟 A 股上市公司,出任副总裁,并担任旗下公司物灵科技联合创始人。彼时,顾嘉唯曾经接受雷峰网专访,分享他对 " 万物有灵 " 的设想。2023 年,顾嘉唯重新创业,创办灵宇宙,延续他的创业愿景。

新的公司 " 麻雀虽小,但五脏俱全 "。在不足百十平方米的会议室,有一幅漫画格外显眼,它被放置于房间门口。这幅画畅想了人类未来的生活:机器人可以端茶倒水,可以成为育儿嫂,可以做几乎一切人所需要的服务。

顾嘉唯说,这是他从第一次创业就想做的事情,但当时的时间点比较早。当下,随着大模型的快速发展,到了做这件事的 timing。

顾嘉唯这样解释他在做的事情,"World as prompt, World as interface。(把世界变成一个提示词,把世界变成一个交互界面 ) "。

在顾嘉唯看来,今天最大的一个机会就是,AI 从虚拟世界和电脑屏幕,走到下一个阶段,解决物理世界的问题,利用物理世界的数据来让 AI 进入智能涌现的下一步。

在商业化路径上,灵宇宙选择以消费级 AI 硬件先行切入家庭场景,优先于复杂人形机器人实现规模化落地,构建起类比特斯拉 FSD 的 " 南坡路径 "。

顾嘉唯表示,以前其实从大模型 GPT 3 ,到今天我们看到的所有发展,是来自于涌现于线上的文本数据,人类创造的互联网数据跟模型的关系。

一旦我们能走到下一步,我们定义的这套空间交互大模型,基于空间的行为动作模型关系去构建,就能实现说今天所说的具身也好,空间智能也好,最稀缺的一部分数据供给。但前提是我们得像特斯拉做 FSD 一样,能够先铺量,先把足够多的设备布出来,才能构建这个闭环。

顾嘉唯坦言:" 我是很笃信这件事的。因为对我来说,未来我要最终实现海报上面那样的场景,你的养老,你的育儿,都是可以让机器人去辅助完成。用 AI 机器人来解决人和家庭的关系变得更简单,把重复劳作和娱乐陪伴各方面都分担一部分给出去,让成长快乐和天伦之乐回归人性的简化,这是我认为再往下发展很有可能会出现的一个变化,它会改造人类家庭常规的交互方式。"

从绘本阅读机器人的开创者 Luka(卢卡),到随身 AI 终端 " 灵宇宙小方机 ",顾嘉唯以及灵宇宙正沿着他们的既定路线,不断向着未来的愿景前进。

以下是雷峰网 AI 科技评论等媒体与顾嘉唯的对话

一、融资主要用于团队升级,但不追求公司规模

Q:首先恭喜完成新的融资。您能否透露本轮融资主要将用于哪些重点方向?比如是技术研发、市场推广还是海外扩张?

A:我们的资金主要用于研发,市场投入等方面,包括人才招聘,主要是要招人。因为我们原来的团队其实是上一个周期迭代经验沉淀下来的资源和人脉,也确实是适配于今天这个大模型做 AI 硬件或者 AI 消费电子或者 AI 机器人的路径。

这个赛道不像纯 AI 软件,来一个新的玩家就能够快速做起来,因为现在积累厚度还是蛮厚的。但是我今天也遇到新的一些挑战和问题,比如海外,我们现在要更加速我们的海外整个商业化落地,那我们要去找到更多的海外跨境的人才。以及当商业化的时候,我们发现我们 GTM ( go to market)做商业化规划这部分能力要求,不论是国内还是海外,我需新的打法,因为这个品类是新品类,以前没有过。

Q:具体要怎么做新品类的市场推广?

A:比如怎么以一个像苹果一样方式去落地商业化。我们要有很强的发布能力,把所有每次软件功能的升级和硬件的版本都能发布出去,以及下面能承载专营店、体验店。因为新品类是重体验。

举个例子,比如说 Apple Vison Pro,要先用手机、用苹果先注册完人脸验证之后,然后到线下才能体验预约才能实现。

那人才维度也需要升级,我们也希望说能够在这次不断地拿到新的资本来加持的时候,能够引入这样的品类创新人才。我们目前 40 人 + 团队,已经实现了这样一个阶段性成果,我觉得这也是未来 AI 公司的一个普遍情况,用 AI 赋能团队,然后持续找到创新人才。

Q:之前物灵科技有几百人,这次创业人好像少了很多。未来团队规模未来预计扩大到多少人?有怎样的考量?

A:目前没有太明确的数字,因为说实在我觉得现在跟以前不一样。以前公司成立第一天,我们就 300 号人的团队,是因为当时有孵化的项目以及并购的项目弄到一起了。现在,我对于人员和对于控制要求都比较高,你能感受到,我们其实是很紧凑高效的一个创业氛围,跟上一个周期是不一样的。这跟今天的外部环境,以及跟我的经历都有关系。

我走过这些中间的起起伏伏的路之后,我再选择这边,对人员的整体规划是没有的,我更希望是一个人能多用的,因为大模型时代, AI native 的公司一定是很多东西不需要自己干,模型就可以帮你解决。但我会找到关键人,有些关键的需求的人员是对我比较重要,通过原来的人脉没有 reach 到的,通过资本市场的获得更大的股东的人脉,以及说我们通过更多人知道我们在今天这个公司在做什么,我们可以吸引到更多这样的人才。

Q:和投资人或机构交流的过程当中,您最大的感受是什么?现在具身智能这么火的市场环境下,您会有危机感吗?

A:我觉得可能今天在我们这个公司的股东结构里面,这些机构有一个让我印象特别深的地方,就是从质疑到最后印证的一个过程。

一开始当我说要去走一个特斯拉 FSD 的南坡路径,去铺硬件、收数据,可能最终我也要去做端茶倒水这种机器人形态时候,大家觉得好像没有一个连接线过去。但当大家看到我们产品落地的过程,使用的交互形式和它开始铺量不断做增长这个过程,当大家发现 Meta 小扎和 Google 等前沿实验室最近的关键动作的时候,大家发现这件事情其实是一个有通路的东西,我觉得这反而是我认为大家印证了一个终局思维的方式做一家公司的一些不一样的路径。

Q:怎么理解这个终局思维?

A:其实,我先去定义的一个终局思考,然后回过来再画出两个 roadmaps,然后一点点走过去的,这其实是个非共识的过程。我觉得今天我感受到这些股东能加码,也有老股东加持,也有新的进来。

大家看到了一个机会,他发现其实一开始被质疑的和不确定的这些东西逐渐一点点被印证出来,我觉得这是我感触最深的一点。

中间我们每一步的这个过程,让大家看到了说这件事真的是在发生的,这个南坡路径是在发生的,这种轻量级的终端能采集数据,完成构建今天具身智能和世界模型里面最缺失的真实数据闭环,是我觉得可能大家逐渐已经从一个从非共识到加注的一个重要因素。

Q:作为公司老股东,您也提到与商汤的合作,能不能具体展开介绍一下这方面的合作有哪些关键性进展?下一步还会有没有什么延伸?

A:商汤的优势在于他们能够把以前的计算机视觉这部分的数据源和计算机视觉基因搭建的这种多模态大模型引擎和模型的能力赋能给我们,所以在我们看到的 real time 的实时交互的大模型上面,能做到这么好的体验,换任何一个非深度合作的模型公司是很难做到的。所以对我的好处在于,启动的时候有一些全新的多模态的交互数据体验是在别的基模(比如字节的豆包或者是阿里的通义)实现不到的深度的体验。另外一个比较重要的优势,大家知道其实最早启动的时候,商汤的集群卡也比较多,所以我们会比较在意是怎么应用它现在最新的 SenseNova 模型,怎么能够通过算力的加速尽快应用到消费电子里面,这是我们可能一起会耦合去迭代的一个方式。

二、预测未来最好方式就是去做它

Q:商业化这一块有什么具体战略上面的想法吗?

A:国内的抖音是很强大的一个过去的积累,你会发现视频电商的算法推荐以及说视频内容的展现效率 3 ~ 10 秒钟,进来捕捉完之后持续结单和下单,这种效率在国外其实反而学中国的。

因为抖音我们其实过去也做过好多年,反而北美那边或者说东南亚那边,或者说像欧洲有点难,还没有完全起来,在视频电商和兴趣电商的这个环节,我们反而是有过经验之后,只要复制这个经验,找对那边的人就行。我觉得这个套路其实是可以通达的。

其实像我们这样重体验的产品不是一个标品,我觉得国内已经有过积累的公司是反而会弯道超车的,我觉得这是有好的一面的可能性。我们往下走,海外市场是有积累的能力的,因为妈妈类的产品、母婴类产品,这两个都打得是很透的。其实既有做过微商,也有做过抖音的直播带货的流量模式,都打过一遍实操的经验。

Q:我们如何维持产品的壁垒和厚度?

A:今天这个大模型时代有两个关键词。

第一是极致个性化适合每个人,绝对做到千人千面。以前千人千面,字节时代是推荐算法,一个内容创造出来,在云端通过推荐函数连接给你,今天我们把它定义叫 " 关系算法 ",也就是说这个角色更懂你,因为这个角色跟你共同经历。跟你互动更多的 Agent 智能体,他会更懂你的情况,他会主动来和你交互。我们在过去把所有的角色主动适配的能力建立起来,让每个角色可以主动的适合每个人。然后,他长期的记忆,主动的意识都可以交互起来。那我觉得是今天大模型跟随的公司没有这样的技术积累能力是做不到的这点的。

第二是数据的伴随 AI 原住民成长的长期周期。为什么我们能做到小方机,就是用过去卢卡积累过数据和用户洞察。当年人口红利高峰期的产品用户,今天长大了,正好从卢卡过渡到小方机,我们会通过灵宇宙的 AI 终端不断迭代升级去灵性陪伴这一波 Alpha 世代人群(10 后)共同成长,卢卡的数据已经在这边放量成为了一个看得见的结果,那进一步就在堆积这个产品,下一步的数据源来让他继续领跑和成为下一个闭环的优势。

Q:漫画里面机器人绕膝左右场景,您觉得未来多长时间会实以实现这样一个场景?

A:我觉得我很喜欢 Alan key (连线杂志作者)的两句话。

第一句话是,"The best way to predict the future is to invent it."(预测未来最好方式就是去发明它。)

我觉得这是让我自己比较幸福的一句话,因为我觉得时间轴很难预判,人们对技术的科技发展很容易高估短期,低估长期做的事情。所以我觉得这个时间线我觉得挺难判断,但我会一直在履行实践、试错、迭代这件事。

从卢卡,到今天的小方机。大家会说你不是做机器人吗?怎么搞了一个这个玩意出来?我其实在用我的时间路径再去履行这样事情。

第二句话是,"People who are serious about software should make their own hardware."(如果你执念要去做出好的软件体验来,请去做硬件。)

所以你会发现,如果从投入度和价值资产的角度来看,我们是软件占 80% 的公司,硬件反而只占 20%。但是,我们产品是以硬件的方式在这个人群里面有专有需求。做 AI 硬件要离手机远,一种离手机远的方式就是干这种端茶倒水的这种实体硬件解决原子交互问题。第二种是要离手机远,是那个人群没有手机或者家长不想给他手机,他需要专业设备。例如今天家长想给孩子用豆包,又担忧给了手机会去打游戏的痛点,这两个都是我觉得比较重要的做 AI 硬件的底层思考。

回过头来,我会觉得,既然是软件,我不怕迭代,我只要高密度的锚准我认为的核心逻辑去迭代软件,我一定是会排活在牌桌上,成为做成这家公司的人,所以你会发现其实 " 穿越周期有韧性 " 是很关键的," 识别机会和 timing" 又是很关键的。

Q:如何解决大模型 " 幻觉 " 在具身机器人上的风险?

A:幻觉问题在过去的一年多时间是有大规模的降低的,其实有很多解法基模已经在解了,底层的基模都在帮你解决,所以它是个时代给予的机会。我们还有过去那么多年做卢卡积累的模型微调和数据经验。

Q:您目前创业做家用机器人,比较担心的是什么 ?

A:我会担心的是,当这个摄像头在真实界你交互的时候,你会发现其实这个数据源的优势是会被场景的割裂而影响,因为孩子会各种跑动、遮挡环境等,这部分东西是不可控的,而且有很多好的模型,高算力的方案,放到家长买给孩子产品也有难度。有很多最新的模型未必能用得上,所以每一项的环节体验都有可能出现打折的地方,遇到很多挑战,这种挑战是把事做好的,一个会有的难度和微妙的痛苦,我觉得这痛苦是一个创业者要去解决的。

另外我觉得孩子类的东西,他反而对数据隐私是很敏感的。这东西是会持续收集,会把一天当中所有的东西记下来压缩,然后整理,跟你互动,其实今天会有很多这样的隐私的不确定性。比起跟别人同质化竞争,这是我更在意的东西。

本文作者代聪飞,既看产品,也看人与业务的故事,持续关注 AI 行业的潮水方向。欢迎各位读者添加作者微信 Congc_a 交流。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 物理 机器人 育儿 融资
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论