量子位 前天
对话全民AI应用平台Agnes AI
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

以下文章来源于量子位智库 ,作者量子位智库

今年以来,多智能体(Multi Agent)成为AI领域最热门的话题之一。

"让AI自己组队干活",成为基础大模型能力升级之外,另一个让AI系统效果提升的新解法。

这股浪潮也在AI产品上得以体现:

Manus于8月初推出「Wide Research」功能,支持上百个Agent同时工作;纳米AI「多智能体蜂群」8月上线,可让多个推理型智能体灵活拉群、多层嵌套、组队协作,完成超长复杂任务;快手9月推出「Kwali」,可将视频生成需求拆解并分配给不同Agent完成,如意图解析、脚本生成、镜头匹配和剪辑合成等……

那么,多智能体在任务完成的效率和效果上真的超过单智能体吗?多智能体框架在AI产品中是如何应用的,又为AI产品创造了哪些价值?相比于单智能体,多智能体适合什么样的使用场景呢?

带着这些疑问,量子位智库邀请到以Multi Agent架构为核心的全民可用的AI应用Agnes AI,听创始人Bruce Yang深入聊一聊这款上线四个月日活用户即突破20万的高潜AI产品。

Agnes访谈直播

在这次访谈中,Bruce分享了Agnes AI背后的多智能体架构设计,以及Agnes如何确认产品的PMF(产品市场契合)、如何找到种子用户,还分享了对于市场空间、产品路线、核心场景、功能设计等方面的思考。

关于Agnes AI:

新加坡初创公司SapiensAl,推出一款更"全民性"的通用产品:Agnes Al,自7月在Product Hunt正式发布以来,Agnes海外注册用户数突破300万,日活过20万。

Agnes将研究、搜索、设计、演示和团队协同整合到同一工作流里,聚焦于年轻用户在移动端快速办公的场景需求,推崇Web Work(网络办公)的轻量化生活方式。

除了基础的搜索与研究能力外,Agnes AI的核心功能还包括:

深度研究(Deep Research):通过多轮迭代、自我评估与优化,结合多模态数据(如文本、图像、视频)生成详细内容,常用于复杂问题的系统性研究。

广度研究(Wide Research):基于自研CodeAgents框架,可调度上百个智能体并行工作,擅长处理复杂、多维度的大规模研究任务。

AI设计(AI Design):提供图像、视频生成能力,支持深度设计(Deep Design)模式。根据用户输入的需求自动生成初稿,并通过多轮迭代优化,从构图、风格等维度提升作品质量,最终输出高分作品。

AI幻灯片(AI Slides):根据研究内容或用户需求自动生成专业PPT,支持多人实时协作编辑,可添加评论、批注,修改后即时同步。

AI表格(AI Sheet):支持上传多种格式文件,并自动完成数据处理、公式运算与深度分析,支持生成图表及可视化的数据报告、导出Excel文件,并直接回答关于数据的各类问题。

Agnes网站主页Key Takeaway:

访谈实录分割线1、Agnes的核心功能有哪些?分别适合哪些使用场景?

量子位智库:Agnes既提供AI用户熟悉的「Deep Research」功能,也提供更具特色的「Wide Research」功能,这两项功能有什么区别?

Agnes AI: Deep Research从Planning到Research的多步骤研究,会把复杂问题拆分成细分子问题,每次得到答案后,再把当前答案和用户需求比对,寻找最短路径,接着思考下一个该问的问题。一直到穷尽需要提问的所有范围,或是设定最长部署,通过这些方式在网页上找到对应信息。

目前Deep Research在移动端、PC端用得比较多,但移动端占比已在下降,原因是我们提供了性能出色更轻量的单纯「Research」功能。当然如果用户想做比较深度的分享,还是可以开Deep Research。

所谓Wide Research,会涉及更多Multi Agent(多智能体)框架,从单个任务拆分成50个不同的Threads(线程),每个线程可能是一个Agent,独立做信息搜索,再把搜索到的信息回收。

Agnes还有个优势:用户不用选具体选项,大部分逻辑能自己Auto Routing(自动路由),会根据用户意图选择使用什么工具,组建什么样的多智能体团队完成任务。

区分任务归属的核心是用户意图理解和任务复杂度不同:

基础问题、用户希望快速回答的,比如移动端默认用单纯Research,时长能控制在一分钟以内,比现在所有Research产品都快。

如果用户明确说要做深度研究,就启动Deep Research。它的整个Iteration(迭代)更长,需要多步骤,多次分解问题,通过反应(React)、每次分解后反思(Reflection),确认与最终目标的距离,再寻找下一个问题,是更有深度的多迭代研究。

当需要快速获得答案,且数量超过阈值(比如20个以上,像20/50张图片、20所大学、100个科学家这样的研究),就会自动默认用Wide Research。虽然会多消耗成本、Token,但能压缩时间,效率更高、速度更快。

总体来说,Deep Research更追求精准、深度,Wide Research更追求速度、广度。

量子位智库:目前Research、PPT、Design这三个是主打场景吗?产品迭代速度是怎样的?

Agnes AI:对,PC端目前这三个是已上线版本。我们每周都会有新功能上线,在移动端也会有小更新和大版本更新,以周为单位做迭代。

除了刚才介绍的Research,我们出PPT速度很快,一般在2分钟左右,UI也不错,虽然还有提升空间,主要生成速度在市场上比较领先。且全程基本是并行过程——每一页都相当于开一个线程(Thread),基于每一页的信息找对应内容、模板,再把内容展示在页面中。

Agnes AI幻灯片功能介绍

这些内容是Interactive(可互动的),鼠标能点击图表触发交互效果,也能手动编辑修改文字,或通过自然语言对话框操作。

整体我们比较追求产品的丝滑程度和速度,不希望用户等待,希望能快速响应、快速让用户得到想要的信息。

当然这里有个Balance(平衡):如何更快的同时效果更好?我们面临一个"不可能三角"——既要成本低,又要速度快,还要效果最好,这是公司对生成Artifact(成果物)的要求。

另外,我们整个Multi-Agent架构用到了自由度较高的Deep Design(深度设计)。Deep Design的逻辑是:生图时先生成Candidates(候选图),再让Agent从几个核心维度给候选图打分,根据分数判断候选图是否合适、是否大概率满足用户需求。分数高的推上去,分数低的留在候选区域。

这解决了一个问题:现在很多生图模型需要"抽卡"——生成十张图再选一张,很浪费时间。但这个逻辑完全可以自动化,我们把Reviewer(审核者)、Evaluator(评估者)的Feedback(反馈)融入到整个Workflow(工作流)中。

还会告知,比如Prompt Fidelity(与提示词的一致性),以及对区域的描述和具体分数。

这种思路有点像在里面加了强化学习的反馈。因为强化学习有个重要概念:以参数形式做梯度学习。

但在多智能体场景中,Agent之间的反馈从实际效果看,也类似强化学习的Feedback。不过如何把这种Multi-Agent Feedback(多智能体反馈)融入到模型训练的参数微调中,是很有意思的研究方向,我们最近也在探索。

还有一点,我们的产品可以生成中英文海报。在接入Nano Banana的同时,通过多智能体架构中间的Tree Arch(树形架构),判断生成内容中有中文还是全英文,再Auto Routing(自动路由)选择对应模型生成Candidate(候选图),这样就规避了Nano Banana在中文生成上的问题。

2、单智能体和多智能体在任务完成上有哪些方面的差别?

量子位智库:像"设计50个创意海报"这种复杂度的任务,对单智能体来说无法完成,还是完成效果有差异?

Agnes AI:也不是完全不可能做到,只是多智能体效率更高。Multi Agent(多智能体),你可以理解成"三个臭皮匠胜过一个诸葛亮"。如果真有一个"诸葛亮"级别的单智能体,多智能体也未必能比得过,但这需要很高的能耗、算力,包括模型的精准度、准确性,得比现有模型高一个level。

在不大规模提升模型基础的前提下,想达到更好效果,多智能体协作是很好的框架。前段时间Andrew Ng(吴恩达)也说,多智能体是超越polynomial(多项式)提升模型性能的方式,从原理上看属于一种梯度学习。

量子位智库:以生成海报为例,单智能体和多智能体在效果上有什么差别?单智能体还有哪些限制?

Agnes AI:差别很多。

首先是速度问题:单智能体串行解决问题,一步一步执行,效率和速度会下降;多智能体大部分任务并行执行,尤其是对非Mission Critical(关键任务)的问题,能各自探索答案,过程中收拢更多信息。

第二个是Specialization(分工):需要明确每个智能体的角色和核心要求。以生图为例,涉及三个Agent:

Prompt Agent:基于用户Intention(意图),把需求转化为Diffusion Model(扩散模型)、Auto Regression(自回归模型)(主要以Diffusion Model为主)能理解的产品细节。因为理解用户意图和生图是完全不同的角色,目前单模型很难把两者结合。

Image Generating Agent(图像生成Agent):根据Prompt的情况选择模型——比如调用Nano Banana,或中文效果更好的模型,或考虑成本选择低成本模型实现类似效果。这个模块的Management Control(管理控制)在Image Generating Agent中。

Evaluating Agent(评估Agent):评估、审核、评判图片好坏,说明原因,并把Feedback同时给到Prompt Agent和Image Generating Agent。两个Agent会根据反馈重新调整Prompt、选择不同模型,通过恰当分工协作,快速并行生成最佳内容。

当然,把这些能力整合到一个大模型、一个Agent里,理论上有可能性,但难度很大。因为Diffusion Model和LLM(大语言模型)的原理完全不同:大语言模型更擅长理解用户意图,包括Latent Requirement(潜在需求)。

但深度模型需要非常明确的描述,不擅长理解用户意图和目标,用户如果没说清图片想表达的意思,即使是Nano Banana也会"变笨"。

人与人沟通不需要说太多细节,因为有共识和共鸣感。比如我说"一个收音的耳机",设计师会自然想到画面中有人讲话才能收音;但如果把同样提示词给到生图模型,它只会理解"收音的耳机",不会想到要加"人讲话"的元素。

所以,要把不同模型的优势整合到一个系统中,目前效率最高的就是Multi Agent

量子位智库:能不能通俗理解:单Agent是"通才",整体效果60分;Multi Agent是把任务分给"专才",每个专才90分,最终产出90分?

Agnes AI:对,你理解非常到位。我再补充一句,这种"专才"(专家模型)对比DeepSeek-R1这类解决所有问题的MoE(Mixture of Expert,混合专家模型),在特定工作中表现更好,但只适合做这个工作。

对很多创业公司来说,因为选择了垂直领域、垂直场景,或在多主体框架中单任务垂直,完全可以用自己的垂类Agent,甚至训练自己的模型来完成工作。

当然,在Multi Agent体系下,也可以把不同Agent背后的模型统一,把这些专家模型蒸馏成一个MoE大模型,每个单Agent的能力变成MoE模型中一个激活的专家参数,这样就能把小模型的能力统一到一个大模型里。

这种方式有好有坏:好处是大模型往往会涌现出意想不到的能力,举一反三能力强——比如学会骑车、开车后,可能自动学会骑摩托车;坏处是单任务表现不一定有专家模型好。

量子位智库:现在单个大模型能力提升不如去年惊艳,未来会不会有一个大模型能达到多智能体的效果?这个时间窗口大概多久?

Agnes AI:你这个问题相当于"超级诸葛亮"对比"多个臭皮匠"——如果Multi Agent是三个臭皮匠,一个超级诸葛亮可能超越它,但我们的架构有个有意思的点:可以把"臭皮匠"换成"诸葛亮"。新模型出来后,我们的Multi Agent就能变成三个诸葛亮,甚至三个超级诸葛亮。

多智能体的团队协作、分工,与模型本身的能力提升是相辅相成的,不是互相替代的关系。即便单个Agent因基础模型升级而变强,多智能体也会同步进一步提升。

3、多智能体产品的卓越与否可以通过哪些维度评估?为保障任务执行的速度和质量,有哪些工程化设计?

量子位智库:国内不少产品说自己是Multi Agent,但用户难区分好坏。除了成本、速度,还有哪些维度能评判多智能体产品的最终效果?

Agnes AI:可以从几个维度讨论,每个公司定位不同,关注的维度也不同。有些公司会关注任务完整度,包括Corner Case(极端案例)、Edge Case(边缘案例)——这些是平时不太常用的功能,但很考验模型解决问题的能力。

很多公司会放弃,我们也会放弃,因为这不是我们的Optimize(优化)重点,但这确实是衡量多智能体系统的指标之一。

我们比较关注的指标是Efficiency(效率),可以理解为速度。因为速度和成本往往成正比:速度快说明用的Token少、Iteration(迭代)少,成本自然下降。

我们看重移动端体验,希望做可用、能全民化的产品,会追求速度更快、模型使用成本更低,在这两个方面比市场上同类型玩家都有优势,因为只有这样才能让AI更易被大众负担和接受,让更多还没接触过AI的人体验到AI,这是我们的愿景。

量子位智库:Agnes是怎么做到"速度更快"的?

Agnes AI:未来还能更快,我们还在优化,优化后可能成为全球最快的AI Mainstream(主流)应用产品。主要从两个维度入手:

第一个维度来自我读博期间以第一作者发表的论文《CodeAgents》(《CodeAgents: A Token-Efficient Framework for Codified Multi-Agent Reasoning in LLMs》,论文地址:https://arxiv.org/abs/2507.03254)。我们让多智能体之间的沟通不用自然语言,而是用类似代码的形式。比如"向你借一把伞",会写成"a borrowed(雨伞)"这样的伪代码或代码——有些可执行,有些不可执行。

自然语言存在的原因是人类无法像AI那样快速读取信息,需要转化为人类能接受的形式;但机器之间的底层沟通很多用代码实现,且现在大模型的语料库中大量加入代码训练,机器读代码比读自然语言更快、效率更高、准确性更强,因为代码的Degree of Freedom(自由度)更低。

通过这种方式,我们在论文中得出结论:能把多智能体框架中解决问题流程的Token消耗下降40%到70%,速度大幅提升,准确性也有提升——在Gaia、Hotpot等Open Benchmark(开放基准测试)中,准确性和Recall Rate(召回率)提升5%到10%,这是很大的突破。

第二个维度是用自己的模型替代闭源和开源模型。我们训练的模型不会特别大,都是专家模型——从7B到10B,再到几十B的Post-Training(后训练)模型,专门解决PPT、Research这类专业问题。这样一来,速度更快、成本更低,而且Small Model(小模型)每次会完全激活,对Memory(内存)的要求也更少。

量子位智库:很多Agent产品"能做很多任务但做不精",Agnes除了用自己训练的模型,在产品工程化上做了哪些优化,保证Design、Research等功能的质量? 

Agnes AI:首先是产品Sense(判断力),这是产品经理或公司的决策取舍。上很多功能会导致每个功能都只达目标、不达SOTA(当前最佳)水平。

我们上功能很克制,每个功能都要达到很好的水平才上线,这是最主要的原因——不追求多功能,但每个功能要达SOTA效果,无论是速度、美观度还是准确度。

第二是框架设计:我们的框架不是写死的。很多多智能体框架是固定的——承担任务时分配多少Agent做a、b、c,多少做d、e、f,执行、计划、编排、反馈的角色和任务强绑定。

但我们的设计是"大框架+自由角色":框架包含编排、计划、执行、Feedback、Review、写Report(报告),但Agent会根据系统提示词、MCP(主控制程序)对应的工具,自动对号入座找到角色。任务结束后,Agent会重新梳理情况,有新的MCP工具、新的TC(任务指令)上来,就重新编排角色。

所以在一个任务下,我们能不断出新任务——不是只能做PPT或只能做Research,做完Research能立刻做PPT,做完PPT能立刻出图,出图后能立刻总结。原因是多智能体不与特定角色强绑定,能自由编排,还能记住前面的工作内容。这种自由度让我们上线速度更快,功能也更稳定。

4、Agnes的主要目标人群是什么?在核心使用场景的差异化优势是什么?

量子位智库:Agnes主要目标人群是什么?目前三个场景中最受好评、用户用着最爽的是哪个部分?

Agnes AI:PC端我们希望扮演AI Native(原生AI)的办公角色,现在已在和个人Pro User(专业用户)、企业用户洽谈。

很多企业认为我们的产品能替代办公三件套中的PPT、画图功能,下一步AI sheet(Excel)即将上线,目前在内测(截至发稿时已正式上线);还有AI doc(可协作文档),这些都是AI native的办公组件。

我们的目标用户包括白领、大学生,以及行研、投研从业者,能给他们提供很多帮助。从数据看,Research和PPT的用户都很多——晚上12点以后(非主流时间,可能是海外用户),每小时都有几百人在做PPT。

用户疯狂使用的原因,一是速度快,二是Quota(额度)高:有些产品做一两次PPT就要付费,我们的免费Quota每月能做10到20次,因为我们把成本降得很低。

量子位智库:办公套件是红海市场,国内Skywork等也在做多智能体办公套件。Agnes的AI Native办公套件,对比上一代办公套件,用户需求和"好产品"的标准有什么变化? Agnes的差异化优势是什么?

Agnes AI:首先,目前主流用户还在使用传统office、WPS,虽然有Skywork等竞争对手,但我们都是后来者,存量市场仍被传统产品垄断,暂时没遇到太多AI Native产品的直接竞争。

市场足够大,90%以上用户用传统产品,我们各自在快速拓展,定位也不同。

有些产品更重,像软件;我们更轻,像Webbook(网页应用),更强调AI Native,希望用户随时随地办公。我们在移动端花了很多精力,追求体验丝滑、速度快、效果达SOTA。

差异化优势在于场景聚焦:我们侧重移动端、年轻用户,以及Webwork(网络办公)的生活方式——不是"必须在办公室办公",而是"需要快速出Proposal(方案)给领导"、"3分钟内做好PPT去Pitch(提案)"这类即时产出、碎片化的场景。我们在这些场景中投入更多时间和精力,争取对应的市场。

5、AI办公未来市场规模如何?Agnes这样的AI原生产品和WPS这类传统办公产品路线有何不同?

量子位智库:对AI办公市场的未来规模有预期吗?

Agnes AI:现在不能用传统方式评估AI市场,AI正在颠覆办公、SaaS等场景,甚至ChatGPT在推电商、搜索、企业用户场景——所有互联网时代的事情都可能被AI重写,速度比想象中快。谷歌都在假设AI时代搜索流量会清零,可见变革之大。

虽然没法明确评估我们拓展的市场规模,但可以参考两个数据——

一方面,传统Office产品每个季度毛利达几百亿美元,这是很大的市场基础;

另一方面,AI产品估值很高,10年前百万日活的移动产品估值约2亿美元,现在百万日活的AI Native产品估值可能达100亿美元。

全球超过百万日活的AI Native APP(海外市场)可能只有5个左右,比如:

ChatGPT(Conversation AI龙头),周活7亿,总用户过10亿,付费用户2000万(占比不到2%),估值已过5000亿美元;

Perplexity(搜索领域龙头),月活3000到4000万,日活200万以上,估值180亿美元,基本是"1万日活对应1亿估值";

Character AI(AI社交产品,类似AI时代的Myspace)也是全球流量最大的AI产品之一。

除了少数突出的AI产品,其他产品都不算大模型驱动的Mainstream(主流)AI应用。如果能快速进入场景,成为头部玩家,想象力很大,可能成为AI时代的字节、Instagram。

量子位智库:上一代办公产品(如WPS、博思白板)是"单点功能+AI",Agnes是"整体工作流+AI"。这两种路线是适合不同场景,还是市场需要教育?未来一定会走向Multi Agent吗?

Agnes AI:这是两个阵营的不同想法。

传统办公产品(如Office、WPS)是"改良派":它们有90%的存量用户,很难直接推出颠覆自己的产品,只能在现有产品中加AI能力,抗衡AI Native产品,类似"保皇派";

我们是"革命派":认为AI Native产品完全能颠覆传统使用习惯,只是时间问题。我们的产品不需要传统办公的纯互联网或重软件能力,上来就能通过提示词解决问题——我自己写论文,只提供大纲和想法,所有文字都让AI润色,完全不用Word,靠AI和人的思路整合,能达到甚至超越传统方式的效果。

我在新加坡国立大学读博时,几门课考了博士班全班第一,包括Robotics(机器人)。老师很开明,允许用谷歌的NotebookLM读文章——把文章丢进去,问几个问题就能了解大概。我能取得好成绩,不是比同学聪明或精力多(我年龄比他们大10岁,还要创业),而是擅长用AI工具。

这种Human AI Symbiosis(人机共生)形态,能迸发比传统能力更强的效果。换句话说,我可能不是全班智商最高的,但擅长用AI,就是AI时代全班"智商最高"的人。

基于这个理念和亲身经历,我坚信AI Native产品会颠覆所有传统非AI native、半AI产品,市场上还有很多人和我一样是Strong Believer(坚定信徒)。

量子位智库:做好AI Native产品有哪些容易被忽略但很重要的点?

Agnes AI:很多,我分享几个。

首先,把AI从Productivity(生产力)中剥离,拓展到更广泛的应用场景——很多人对AI的刻板印象是"提升效率",导致AI在社交、智能硬件等场景中没充分发挥。市场还在早期,很多人对AI的理解不到位。

比如AI+社交、AI+智能硬件,完全能颠覆传统互联网产品。现在ChatGPT像AI时代的雅虎,Perplexity想做AI时代的谷歌,但AI时代的Facebook、AI时代的Office还没出现。

很多公司想做AI Office,但做到Office那样的市占率很难——有Office能力的公司不少(如WPS),但达到80%、90%市占率的极少。

另一个被忽略的点是"产品+市场"双驱动:到底是Product Led Growth(产品驱动增长),还是Market Led Growth(市场驱动增长)?

AI时代没有先后顺序,必须既有好产品,又有强市场,才能快速进入Mainstream(主流)应用,而不是在细分领域尝试开新分支。很多人没想清楚这一点,其实AI时代的机会远比现在看到的多。

6、Agnes最开始如何确认产品具备PMF(产品市场匹配)的?是怎么获得前500个用户的?

量子位智库:Agnes是革新性产品,当时怎么判断它的PMF(产品市场匹配),有信心成为Mainstream产品?

Agnes AI:一个关键信号是获客成本低——海外某些区域获客成本低至0.2到0.3美元。我10年前做海外社交产品时,获客成本低于1美元就很好了,低于0.5美元的几乎没见过。

这说明很多想接触AI的人还没接触到,市场普及率比想象中低。

全球很多人不仅没接触过AI,甚至没接触过互联网。有些区域的人第一次成为网民时,就会成为AI原住民——他们可能连网络都没有,AI能解决"跨越"问题,就像中国没普及信用卡直接进入移动支付一样。

AI的Accessibility(可及性)很高,不需要学会复杂应用,能打字就行;未来甚至不用打字,能聊天就行。很多地方的人第一个智能硬件是安卓手机,未来可能不用手机,通过某个智能硬件就能接触AI。

我们看到了大机会:低成本获客能让我们占据全球大量未接触AI的用户心智。就像"结婚后再离婚很难",先占据用户心智,后面别人想抢就很难。

我们要快速获取市场、占据心智,成为很多区域的主流AI应用——这是巨大机会,窗口期很短,等很多公司想清楚时,我们可能已经完成布局了。

量子位智库:Agnes是怎么获得前500个用户的?怎么找到特定位置和姿态?

Agnes AI:很多海外产品(如Perplexity)侧重移动端,但功能有限——比如只能做搜索,想做Research要每月付19.99美元。我们的免费产品比Perplexity的免费产品好,即便它的付费功能可能比我们好,但我们的用户基数来自免费用户

在一定转化率下,免费用户越多,基数越大,口碑越好,马太效应、Network Effect(网络效应)越强。

现在很多办公产品、通用型Agent关注ARR(年度可预测收入)、付费用户数,但我认为未来一年的最好机会是抢占免费用户——这部分市场没被开拓,占据后别人很难抢走,哪怕他们有10倍好的产品,我们也会同步提升。

先占住位置很重要,这是我们早期获客的核心逻辑:用更好的免费权益,吸引Perplexity、ChatGPT等产品的存量用户,尤其是他们忽视的市场。

7、最关心哪些产品指标?如何推动指标增长?

量子位智库:除了DAU(日活),Agnes还关注哪些核心指标?

Agnes AI:北极星指标肯定是DAU。如果现在有100万日活,我们就是一家100亿美元的公司,但目前很少有公司能做到。

所以第二个关键指标是多久达到目标DAU:半年后,能达到百万日活的AI产品会变多,可能进不了全球前五,但能进前10或前20;一年后,可能连全球前50都进不了。

在这两个指标之后,才会关注ARR——更多是向投资人证明能力。如果投资人相信我们,不用证明最好;但很多投资人需要说服IC(投资决策委员会),所以我们会适当关注ARR。

ARR的逻辑很简单,基本是DAU乘转化率。ChatGPT的付费用户占总用户的1%到2%(周活7亿,总用户过10亿,付费用户2000万),这已经是市场上很好的水平,我们的转化率不会比它高。

靠订阅提升ARR只有两种可能:一是免费用户不增长,在现有池子里转化;二是免费用户量足够大,靠自然流量转化。

想达到ChatGPT接近2%的转化率都不容易,所以ChatGPT也在探索电商、搜索、企业用户等新商业模式。AI的商业模式远不止Subscription(订阅),投资人也可以多关注其他方向。

量子位智库:Agnes日活已突破20万,除了产品力,还有哪些因素帮助推动DAU增长?

Agnes AI:核心是第一性原理——以DAU为目标,所以更关注移动端、用户体验(速度快)、免费用户权益。我们的免费用户权益和别人的付费用户权益差不多,因为成本可控。

此外,我们不只关注付费区域(如欧美、日韩,这些区域获客成本高),还覆盖大量非发达国家、非高付费意愿国家的用户。

我们认为这是更伟大的事情:让发展中国家没接触过AI、ChatGPT和Perplexity不愿覆盖、没有付费能力的人,最快体验到和ChatGPT、Perplexity一样的智能能力,帮他们完成工作、提升效率,甚至推动区域经济。

这既是长期愿景,也是短期商业模式选择——可能和国内主流Agent产品想法不同,但这套思路如果走通,完全能跑得更快。

量子位智库:国内有些产品认为"第一天没收钱,后面难收钱",且"早期收费能攒资金建壁垒",Agnes怎么看?

Agnes AI:每个人想法不同,不能说他们错,但AI发展太快,等想清楚这些,机会可能就没了。我们的核心是先占领用户心智,这有窗口期——要以最快速度、最低成本、近乎免费的方式,让大量用户体验AI。

不是所有投资人都认可这个思路,也不是所有AI创业者都有同样Vision(愿景),但我们会吸引有同样愿景的人和投资人。我们希望用愿景、机会、好产品、低成本、高权益,让发展中国家、新兴国家的人第一次用安卓手机时就体验Agnes——他们可能连电脑都没有,未来甚至不用手机就能接触Agnes。

很庆幸不是所有人都这么想,否则我们的使命会更难完成,竞争压力也更大。我甚至希望有一天我是错的,让其他人按他们的速度跑,这样我们才有足够窗口期达到目标。

8、在设计功能时如何挖掘用户需求?是否会对标其他成功产品?

量子位智库:Agnes以周为单位迭代,怎么挖掘用户需求和反馈?不做Corner Case,怎么确定最值得做的需求并做精?

Agnes AI:我们的产品原理和很多AI创业者不同,核心是不做太多,避免稀释用户心智——高度聚焦几个产品,创新不用"大而全",只要在模块中找到合适创新点,快速占领心智,抢主流产品的用户就行,不用靠创新制造Hype(热度)获客,这种方式效率低。

先说说获客逻辑:我们就是抢ChatGPT和Perplexity的用户。他们的高级功能要付费,我们免费,单这一点不用创新,就能在当地低成本获客。

技术创新也聚焦:比如我们有Agentic Workflow(智能体工作流),速度和Perplexity一样快,Research功能和它一样好(但它的Research要付费),还能做PPT(它做不了)。一两个功能就足够饱和,再多功能会稀释品牌。

举个例子,Perplexity是我很喜欢的公司,值得学习。如果要对标,我希望对标它。Perplexity去年只有搜索一个功能,搜索不算创新(所有基模都有搜索能力),但它定位清晰、专注,在搜索领域做到市场最好——谷歌的AI搜索质量都不如它,Grok连接Twitter也不如它。

它建立了"AI Native搜索产品中最好"的简单心智,一年时间月活从1000多万涨到3000多万,日活200万以上。虽然所有人都能做搜索,但它占据了用户心智,别人想撼动很难。

对我们来说,不需要用复杂方式撬动市场,只要在几个功能上比别人好一点,快速获取存量市场用户,抢别人忽视的市场,就能完成目标。目前在奔跑路上没遇到太多竞争对手,可能是定位不同,或他们的故事和我们不一样,这个窗口期非常好且稀缺——半年后达到目标,无论别人做什么功能,都很难撼动我们,就像Perplexity现在这样。

9、Agnes的产品定位是什么?将来的100分状态会是什么样子?

量子位智库:用一句话重申Agnes的定位,再描述下Agnes达到100分的状态?

Agnes AI:Agnes立志于做有Agent能力的Mainstream(主流)全民应用。我们不把自己定位成Agent产品——Agent不是全民应用,使用场景相对小众,对比搜索、Conversation(对话)、日常工作场景,覆盖范围有限。

没有产品能真正达到100分,但我希望Agnes能做到:

首先,覆盖ChatGPT和Perplexity的所有能力,且只能匹配或超过它们,不能比它们差;

其次,有额外的优势能力,所有上线功能都达到Agnes的标准,成为未来全球TOP5的AI Consumer APP(消费级应用);

最后,不推出大量功能让用户选择,而是把每个功能做到极致。这是我们的Conviction(信条)。

量子位智库:如果回到做Agnes的第一天,有哪条经验想告诉当年的自己,能改善产品发展?过去创建Agnes的过程中,想最多、最头疼的问题是什么?

Agnes AI:第一个问题我回答不了,因为做Agent以来很顺利,没因为决策错误或信息丢失走弯路。时间越长变数越多,我们希望压缩快速成长期,减少市场变数。

第二个问题,没有特别头疼的问题。每天会遇到很多挑战——产品、市场、未知问题、招聘、融资,但这些挑战不会让我Live under Stress(活在压力下)。原因是做这件事的兴奋感超过了压力:我们聚焦在做好产品、快速达成目标,已经进入心流状态。

团队也一样,没太多时间思考"做错了怎么办",更多时候觉得在"冲浪"——作为弄潮儿站在市场前沿,是AI的Innovator(创新者)、创造者,不是被动接受者。我是AI博士,每天读论文,还是AI博主,能获取最新信息,融入创业过程,避免错误决策。

这种兴奋感超越了压力,我们在Savor(享受)创业过程,遇到问题就用最快速度、最优解、第一性原理去解决,不担心。目前没感到疲惫、困难,挑战肯定有,但更多是"乘风破浪、迎难而上"的兴奋感和成就感。

量子位智库:最后请给观众安利下Agnes AI,分享想交流的内容?

Agnes AI:大家可以体验我们的产品,目前PC端和移动端都已上线,移动端功能比PC端稍少,但体验很丝滑。我们每周都有新功能,敬请期待。

最后想分享我们的长期愿景:希望通过公司的科技能力和产品优势,让全球范围(包括很多发展中国家)更多人接触到人工智能。为了这个目标,所有努力都值得,也希望更多伙伴加入我们、支持我们实现这个目标。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 量子位 deep 效果 创始人
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论