经济观察报 09-11
对话出门问问李志飞:人类需要一个AI“影子”
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

经济观察报 记者 钱玉娟

一款薄如卡片,可以磁吸在手机背面的 AI 录音夹,面市四个月,卖出了 3 万台。这是 AI 企业出门问问自研的、AI 软硬件结合的产品 TicNote。

与其他 AI 硬件动辄百万的销量相比,TicNote 的出货量不算大,但产品在亚马逊评分 4.8 分、京东录音同品类热卖榜排名第一的成绩,让出门问问创始人兼 CEO 李志飞感到踏实。

" 以前做硬件的研发投入太大,任何一个产品发出去,卖不到 100 万台,基本上就很难坚持了。" 李志飞说,现在出门问问的模式变了,70% 的精力在软件研发上,硬件则与合作伙伴一起做。

李志飞曾是谷歌机器翻译重点实验室的科学家,痴迷语音交互技术的他,萌生了开发一款 " 语音助手 " 的想法。他在 2012 年放弃百万美元的年薪,成为硅谷第一批回国创业的人之一。

真格基金创始合伙人兼 CEO 方爱之在硅谷的一场活动中认识了李志飞," 他是最早关注并介绍 NLP(自然语言处理)的创业者之一。" 方爱之对李志飞深耕行业的科学家气质印象深刻,在李志飞开发的出门问问还只是一个 Demo App 时,决定投资他。李志飞是真格基金投资的第一位来自谷歌的创业者。

2014 年,李志飞曾作为创业者,走访大疆、比亚迪等深圳硬件企业,彼时,同行的人里有美团创始人王兴和今日头条创始人张一鸣。

此行前,李志飞研究过眼镜、车载、机器人和智能手表,这一次的硬件之旅让他明确了语音交互的硬件载体——智能手表。

第二年,出门问问的首款 TicWatch 面市,之后智能耳机、智能音箱、智能车载后视镜等硬件产品逐个立项、开发、面市。

那时的出门问问因拿下谷歌的投资蜚声全球,它还定位为以 AI 为核心的软硬结合的中国科技企业,在 2017 年将团队规模从三百多人扩张至千人,同步迈向国际化。

科学家创业,全身心投入在技术创新侧,往往会忽略钱袋子。一年烧走数亿元人民币,智能音箱还面临谷歌、亚马逊、阿里巴巴、百度等海内外巨头的市场争夺。2018 年末,李志飞直接砍掉了智能音箱产品线。

翌年三月,出门问问系统性裁员,李志飞决定不再做新硬件项目开发,团队聚焦在软件创新上。

在语音交互技术领域创业 8 年后,李志飞在 2020 年初的公司年会上首次提出了 " 生成式 AI ( AIGC)是未来 "。彼时 ChatGPT 还没火进中国,AI 大模型也只是 OpenAI 这样的海外潜行者在钻研,那时的李志飞带着团队开发出了一款叫 " 魔音工坊 " 的 AIGC 产品,从 2021 年日入几万块发展到 2023 年的每天几十万的收入水平。

自研 AIGC 产品在 2023 年已经能为出门问问贡献超亿元的年收入,那一年初,国内有不少受新一波 AI 技术影响,计划投身其中创业的人,李志飞也不例外,他决定 "All in 大模型 ",出门问问也推出了自研大模型 " 序列猴子 "。

因为拥有许多大模型能力可落地应用的软件、硬件产品,出门问问面向 B、C 两端提供 AIGC 相关解决方案和产品服务,这也让出门问问在 2024 年成为港股 "AIGC 第一股 "。

2025 年 8 月末,出门问问中报显示,其已接近盈亏平衡。

从 AI 语音到智能手表,从大模型到 AI Agent,出门问问经历 13 年长跑,数次转型。

2024 年,出门问问放弃了 " 序列猴子 " 的迭代,还砍掉了 To B 业务中不赚钱的项目,专注 AI 软硬件结合的商业化模式,锚定了 " 录音背夹 "TicNote 这个 AI 硬件。

TicNote 不只是一个转录设备,李志飞将它视为一个随身的 AI 思考伙伴,是出门问问面向 AI Agent(智能体)打造的入口级产品。在确定这一产品形态前期,李志飞和众多企业 CEO、高管交流,发现这类会议较多的人群渴望能随身带个实习生,帮自己做记录和总结。

投资界的分析师是这款产品的重度用户之一,有用户反馈,以往参加美股发布会需要耗费大量时间整理和翻译,现在使用 TicNote 既可以转录、总结,还能通过内嵌的 Shadow AI 单独入口进行聊天、提问,AI 可以基于多方信息给出全年指引,标注资料来源,同时还包括思维导图、顿悟和深度研究功能。

8 月 25 日,阿里巴巴旗下的钉钉推出了 AI 录音硬件 DingTalk A1,同样的卡片形态,还打出了 "AI 助理 " 的标签。

谈及大厂布局同类 AI 硬件,李志飞说,谁也挡不住。早在去年带队调研、确定硬件形态时,他就得知不少巨头玩家有此尝试的打算。

外界一度质疑出门问问的战略定力,而李志飞找到了一个与不确定性共处的方式:抛下历史包袱,不停适应新环境去创新。这或许是一名技术极客向一位成熟 CEO 的蜕变。

以下为经济观察报与李志飞的对话:

理性的战略转型

经济观察报:百模大战时,你 All in 大模型自研 " 序列猴子 ",之后又停止了模型迭代。这个决策使你遭遇外界质疑,当时没有顾虑吗?

李志飞:2023 年(大模型)刚出来时,大家都看不清楚,都想在最前沿的地方尝试。把模型做好了,自身就具备了这方面的能力。毕竟那时没有一个直接能用得好的模型,没有谁愿意坐等。

这也决定了我们早期会去做模型自研这件事。但做着做着,巨头都进来了,竞争非常激烈,市场上也慢慢出现了比我们做得更好的模型。调用一个第三方模型,技术成熟且成本比自研便宜。我们再坚持去做模型,价值不大,出门问问主要还是去做产品和商业化。

放弃模型迭代,这肯定是一个比较沮丧的过程。不少人说我们没有战略定力,我觉得这些都很正常。背后主要还是因为 AI 发展太快了,谁也看不清楚。但别人看是一回事,我作为公司的负责人,是要对这件事情最终负责的。

今天哪怕你投 1 亿人民币去做大模型,别人会为此投入 100 亿,这时候你投进去的钱一定是打水漂的,可这笔钱对公司来说是很大的一笔支出。在这种情况下,放弃才是理性的决定。

经济观察报:出门问问也考虑过产模结合,在模型迭代节奏上不追求速度,同时投入做模型应用。但这个路线最终也放弃了。

李志飞:2023 年我们是坚决要自己做模型的,投入了算力和人力资源等,那时候我们就没怎么做应用。当年底决定产模结合,基于自研模型去做产品,一年后发现再去纠结模型本身的话,公司已经支撑不住了,硬要用自己的模型,产品也不一定能做出好效果,这让我们开始转向去做应用产品。

这是从模型到产模结合,再到完全的产品驱动的过程。这个过程也符合行业变化,2023 年所有人都在关注模型,包括投资侧也在看模型公司,后来才转投具有模型能力的产品公司,但现在基本上只投纯应用公司了。

所以我们做这些事情是非常理性的,比较早地看透技术演进的本质,不再坚持纯投入模型,基本方向自然就改变了。

经济观察报:2025 年中报显示,出门问问接近盈亏平衡,除了软件和硬件的收入增长,运营管理上大幅降本,这是通过哪些举措实现的?

李志飞:主要是两方面,首先是砍项目,砍掉未来很难有竞争力且很难做出好的增长的项目或团队。像那些 To B 需要定制的项目,需要很多人力成本,周期还长,基本上做到最后都是亏钱,团队规模还要被动做大。

其次是降低公司的复杂度,提升人效。组织会因研发项目聚焦而变化,当我们不需要那么多产品线、项目和人后,人与人的协作摩擦减少,团队也不停简化。

我们现在的研发极度简单,核心就是做 Agent,上面有纯软件或硬件的应用,这才是承载商业化以及跟用户交互的关键。最后就是内部一个更直观的变化,人效上升。

经济观察报:内部提效涉及组织的转型,这背后经历了怎样的过程?

李志飞:业务太复杂,所谓的 AI 很难应用得起来。砍项目并降低组织复杂度,然后引入 AI 工作流,才是比较适合当下的。这些动作是关联且互有帮助的。

其实内部调整并不是最近才开始的,一直都在做,财报体现的也是过去几个月的效果。从去年四五月份开始,我们就一直在想:到底应该做什么样的核心业务?

出门问问的历史比较长,过去做了很多业务,智能硬件、 To B、 To C 都做,一直在寻找商业化的落地。但 AI 变化很快,从去年下半年开始,我们意识到如果像过去那么搞下去会很累,公司既赚不着钱,又很难建立核心竞争力。我们在思考怎么降低组织复杂度,怎样在组织工作中更多引入 AI。

经济观察报:你如何让团队利用 AI 原生工作流协作?

李志飞:刚开始是我自己用 Cursor 编代码,觉得效果很好,就去跟研发说,让他们必须都用起来。很多人都反馈在用,但我感到奇怪,怎么用了效率还是这么低?我用 Cursor 半小时就能做完的事,几个工程师一周了还做不出来。

直到我坐在同事旁边,看他打开电脑演示使用过程,才突然意识到,他用了 Cursor 却还是亲自敲或改写代码,这相当于,明明一个 L4 级别的自动驾驶,结果被搞成了 L2,效率被主动降低了。

像我们这样的 AI 公司都会遇到如此大的阻力,不难想象其他公司在 AI 转型上的遭遇。相对而言,推动工程师们用 Coding Agent 解决问题,要比我自己去做难多了。我一个人再加上公司的几十个工程师,效率反而大打折扣。

开发虚拟组织协作就是要解决这些问题。2 个我可以抵 10 个人的产能,5 个我能抵得上 25 个人的产能,相当于把我自己复制了 5 份," 我 " 就更容易规模化。现在内部的效率跟两三个月前比,量化的话,我觉得能有 4 倍差距。同一个功能开发,以前团队可能要五六个人一周才能搞完,现在只要两个人参与就能快速搞定。

经济观察报:团队接下来的重点是什么?你期待复制多个 "AI 化的李志飞 ",是有哪些亟待解决的问题吗?

李志飞:现在是一个智能大变革的时代,我亲身体会到了 AI 带来的变量,光编程就发生了巨变。我花大量时间做这个工作流,你可以认为是 "Cursor+ 飞书 ",简单讲就是一个可以协作的 Coding Agent,它会是我们这类公司的一个基石。目前这个产品直接促进出门问问内部的研发或者协作模式转型,让人逐渐变成 " 超级个体 "。

不只是我需要这个协作工具,有了这种 AI 原生工作流以后,TicNote 基于这种 Coding Agent 的方式去做,会有不一样的体验,否则就会面临各种各样的竞争,最后都是同质化的竞争。

AI 硬件要做人的 " 影子 "

经济观察报:国内已有很多语音转录相关的厂商,既有硬件也有免费的软件服务,出门问问做 TicNote 这样一个纸片录音设备,经历了怎样的过程?

李志飞:在录音产品方向上,出门问问此前做过两次尝试,2019 年时做会议的录音音箱,当时还考虑过做录音工牌,出过一些原型设计,有的甚至上线了,但后来发现,在当时那个情景下,语音转写的自然语言总结并没有达到用户想要的体验。当时我们有十几个 NLP 的工程师,只做这一件事情,也做不好,压根没有大模型的能力支持。

选择 TicNote 这个产品形态,除了我们在语音交互上的能力,我觉得最基础的还是兴趣使然。我总结过自己,如果开发一个我不感兴趣的东西,就算产品能打市场,我也不想去做。创业已经很难了,不要硬做折磨自己的事情。

经济观察报:TicNote 主要的应用场景是?

李志飞:2020 年到 2021 年的技术,很难支持做出一个好的录音转写和总结的产品,但大模型之后,我们明显感觉到这件事可以做好。很多人没有意识到这个核心点:并不是语音识别技术比以前好了,而是大模型的脑补能力或幻觉能力比较强,它大概听一下人类说了什么,就能总结出大概,并没有什么新鲜事。

我在去年就发现了这个技术变量的出现,其次才是需求。大模型要用起来,需要用户给大模型提供上下文。传统意义上的录音笔,给某一类垂直人群用,它帮你记录上下文,甚至 24 小时一直录的那种设备,这类厂商的产品并不是 TicNote 的竞争者。

我们规划 TicNote 这个产品线时,叫它 " 随身思考伙伴 ",希望用户录音以后,除了做一些简单的转写总结,还能随时随地获得一些决策指引。这款产品内有一个 Shadow AI 系统,类似亚马逊 CEO 贝索斯提出的 " 影子 " 管理理念,企业 CEO 能有个 Shadow,就像一个 VP 或任何一个 CXO ,能在未来做出和 CEO 本人一致的决策。换句话说,未来这个 " 影子 " 完全可以代替人。

经济观察报:你判断 TicNote 能成为 AI Agent 的入口,但使用这个产品,仍难以脱离手机这个终端设备。

李志飞:过去我们做的所有的智能设备,最大的竞争对手都是手机。手机在中国一年有接近两亿的出货量,如果做一个设备能做 200 万,已经是非常好的起点。换句话说,未来两年里,没有哪个设备能有希望取代手机,但是十年之后呢?手机的使用时间是有可能下降的,那时再去寻找能取代它的产品,对很多人来说,就没机会了。

出门问问在国内率先推出这一背夹形态的 AI 录音硬件产品,已经迭代起来,就不建议纠结它是不是会跟手机形成绝对的替代关系,毕竟今天市场上还没有哪个设备能与手机在同等数量级。

经济观察报:你曾提出 2024 年— 2025 年的 AI 应用市场将迎来淘汰阶段,如今行业的整体情况如何?应对竞争或巨头随时可能展开的抢食,你准备了怎样的武器?

李志飞:不存在巨头抢食,它们本来就一直在里边。

我觉得 AI 应用或者 Agent,真正能用也就是今年才开始的事情。2023 年— 2024 年,大家更关注大模型本身,而 Coding 变得好用,是近半年的事情。整个行业相对来说还处于较早期,这要求每家公司选择一个擅长也有兴趣的产品去开发,即便有竞争,也尽量在未来避开与巨头的血拼。

出门问问选择去做的产品,面临用户需求、技术成熟度以及竞争的多重偶然性。如果明知道技术是不确定的,就尽量不要去折腾;用户若没需求,你想去教育用户也是很难的;至于竞争,很多时候你也挡不住(巨头),只能说拥抱偶然性。

技术人创业的特质

经济观察报:你回国基于语音智能技术创业至今,见证了 AI 行业企业的兴衰交替。出门问问在 2024 年 IPO,支持它抵挡产业风浪的关键因素是什么?

李志飞:我们公司曾经总结了两个关键词:理性与创新。首先要清楚自身的业务靠什么支撑,既要理性看待自己,还要理性取舍。如果别人的看法是活下去的理由,那我们早就倒下无数次了。

十几年踩坑无数,最后我们才知道,能支撑团队活下去的就是认识自己,认识公司,包括想想今天 AI 技术到底能给自身带来什么样的杠杆。

能够理性地、求真地去做一些选择,不要硬扛,才是出门问问活得久的原因。还能有一些成绩,则是因为我们在不停地适应新环境去创新。

经济观察报:生活中的你也是一个极理性的人?你有做过 MBTI 测试吗?

李志飞:我可能是理性的吧。我不太相信这类测试,因为那些问题有很多歧义,我答的时候也有歧义。

经济观察报:技术人创业总被认为会走很多弯路,你有哪些时刻会辗转难眠?

李志飞:首先焦虑是常态,毕竟我选择了科技行业,而且是比较 To C 的方向,完全是我自己的能力、兴趣在这里,别的我也做不好。

在科技领域创业,没有人不焦虑,主要还是因为竞争激烈、技术发展快以及不确定性极高。人焦虑的本质就是没有确定性,顾虑这个,担忧那个。

即便如此,对我们来说也只有面向未来,尽量避免过去的坑,做未来有机会的技术开发、创新产品,不要管别人怎么看待这件事情。如果都要别人来告诉你哪里是对是错,凭什么你能成功?如果是大家都达成了共识的方向,所有人都会去做,哪有你的机会?

经济观察报:你觉得是 AI 技术创新冲关还是某些转折点上的灵活决策,让出门问问能数次转舵成功?

李志飞:所有的公司都有历史包袱,即便成立只有两年的公司也会有很重的包袱,比如 2023 年成立的大模型公司,因为发展问题不得不转型成一个完全偏应用的公司,创业者往往面临当初讲的故事、人才梯队都要切换,这都很难。

别看出门问问是一家成立了 13 年的公司,我的包袱却越来越轻,基本上随时做好准备能成立一个独立个体公司。

对未来我有这样一个判断:AI 的执行力是完全过剩的,过去我们所有的经验,都是能让人类具备跟 AI 一起做选择的能力,像我就有很多想法却做不出来,或者做得慢,主要问题在组织能力上。而今 AI 解决了长期困扰我的团队执行力等痛点,让我甩掉包袱,带领团队面向未来去做一个巨大的变化。

虽然出门问问不是近来成立的 AI native(AI 原生)企业,但我们也做到了这类公司的灵活性,又有以前与行业共振十几年的经验,能将这两者结合起来,才让我们呈现出一个好的发展状态。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

李志 出门问问 ai 谷歌 语音交互
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论