
" 让 AI 骡子去干那些重复、琐碎、耗人的活,人类就做点更‘人’的事。"
9 月 16 日,全球首个 AI Agent 交易市场 MuleRun (骡子快跑)正式上线,面向所有用户开放使用。 MuleRun 的 Logo 是一个像素风骡子,平台上集合了不同类型的多个 Agent 。
Agent 的创作者多为各领域中懂得某个具体流程、有经验的人,他们将自己的技能变为工作流后做成 Agent。 而用户可以根据自身需求在平台上找到相应的 Agent 随租随用、按需付费,比如 3D 桌面人物创作,其实就是基于 Nano Banana 做的一个 Agent ,每用一次 50 积分(约 0.5 美元)。而 MuleRun 作为三方平台,负责流量、交易、收美元和持续分红。所以 MuleRun 也被很多人称为 AI 界的淘宝或闲鱼。
很关键的一点,创作者可以在这里赚钱。一个被说过多次的典型案例——刚才提到的 3D 桌面人物创作,就在 Nano Banana 发酵之时,创作者将这个 Agent 部署到 MuleRun,用户只需要上传一张照片,然后点击 "run",两步就能生成一张手办图片,这让创作者 3 天赚了 1200 美元。
一个小而具体的时髦需求,叠加上极低的使用门槛,流量和钱就都来了。据 MuleRun 团队介绍,截止到 9 月 25 日,MuleRun 注册用户已达到 21 万,申请注册创作者 4000 多人,有 500 多人已经过审核。
MuleRun 创始人兼 CEO 陈宇森其实早就参透了这一点——真正能破圈的 AI,不是展示 AI 有多强,而是能解决一个具体、真实的问题。

● MuleRun 宣传图
陈宇森曾是国内的顶级黑客,在浙江大学竺可桢学院求是科学班读本科时就组队打 CTF 网络安全技术竞赛,后来加入该领域成绩最为突出的国际知名战队 " 蓝莲花 ",该团队多由清华学生组成。
2014 年,陈宇森和其他三位蓝莲花队员创立长亭科技,做 Web 安全防护,5 年后被阿里收购;此后陈宇森又连续创立数据安全公司薮猫、以及做游戏领域的公司交给猫吧。但他总觉得这条赛道不够大,想到天花板更高的领域试一试,于是,今年初他开始组建团队做 AI 领域的创业,MuleRun 获得阿里早期投资。
MuleRun 的 CTO 束骏亮与 CPO 付铖也分别在网络安全和元宇宙领域创过业,加上陈宇森,三个曾经的 CEO 开始一起寻找更大更新的赛道。
探寻过程中他们都很清楚,AI 在帮人做事这件事上,还远远没有到位,因为幻觉。不过陈宇森后来发现了一条确定性很强的路径,就是用较大比例的 SOP 结合少量模型能力,比如 80% 的 SOP+20% 的大模型,那至少能将 Agent 推进到真正可用、能复用、能变现。
而将此想法延伸出去,就是他们想以此取代 " 人类重复且没有那么高门槛的电脑操作工作 ",成为全球最大的劳动力外包公司。" 让 AI 骡子去干那些重复、琐碎、耗人的活,人类就做点更‘人’的事:看书、听音乐、陪猫,过生活。" 陈宇森说。
9 月 25 日,云栖大会期间,MuleRun 创始团队陈宇森、束骏亮、付铖和 CMO 李昕瑜,首次对外接受了包括 " 未来人类实验室 " 在内的群访。之后我们又向陈宇森和李昕瑜补充了一些问题,完成了这次访谈。
以下为访谈内容,经 " 未来人类实验室 " 整理发布——
谈机会:这是个几乎没有上限的市场
MuleRun 这个项目是什么时候启动的?平台的方向是怎么确定的?
陈宇森(Mulerun CEO ) :今年 1、2 月份团队就已经在筹备了,那会儿想做的还是 vibe coding,我们当时觉得能做出更好的 bolt.new 或者 lovable,但做出来之后发现能做到差不多一样好,但做晚了的同类产品几乎没有机会,所以就找找新方向。
我们看到的机会是创作 Agent 那边其实已经有很丰富的供给了,但是 Agent 的部署和交易平台是有空白的,所以我们看到的机会在这里。
很多人说你们是 Agent 的淘宝,你们想把 MuleRun 做成一个什么样的平台?
陈宇森:我们的核心价值和早期想解决的问题,就是你工作里面有一个特定的场景,你生活里面有一个高频重复的场景,能够在这个平台找到解法,你天天来用。比如说公司初级的招聘 HR 这个岗位,每天大量地去 boos 直聘、linkedin 上面发简历,这个过程其实是一个高度重复化且比较好被 AI 替代的。
我们希望的是成为一个面向专业人士,解决他工作中一部分高度重复场景的标准化的应用平台。这部分价值是非常大的,而且渗透率非常快。我过去有很多年 To B 的创业经验,太慢了,在 AI 时代 To B 显然是小于 To C 的渗透程度。
但是当前的大模型能力,还没有办法直接以模型作为产品本身去解决 80% 的人类工作,我们认为这个时间窗口还有 2-3 年。以当前的大模型能力想要高成功率地解决特定问题,需要做的事情是大量的 SOP 加少量的大模型。

● MuleRun 官网截图
大概半年前,我跟一个自动驾驶厂商里质量管控的负责人聊,他当时给了我一个很让我惊讶的数字,他们用大模型加上他们积累非常好的一些 SOP,去做他们企业内部的 unit test,就是写代码的时候做单元测试的工作,他们大概一年内生成 4000 万行的代码,大概替代了 200 个人一年的工作,相当于给公司省了大几千万人民币。
那个时候 coding 模型能力还没有现在这么好,我就问他,我们让它写代码稳定性都不好,你怎么做到的?他们最核心的是积累了非常多的质量测试过程中的标准,他们最终生产 unit test 代码的 Agent 大概是 80% 的 SOP 加上 20% 的大语言模型。这给我了很好的启发,我们就说应该用类似的方式稳定的解决问题。
在这样的前提下,过去只懂一些特定领域的知识,但没有代码能力的人就可以把特定领域的知识变成特定领域的应用,这是巨大的机会。我们希望成为 AI 时代全球最大的劳动力外包,或者是劳动力的供应商,这个是几乎没有上限的市场。

谈关键决策:框架中立,以及让一部分先富起来
你们在做这个项目过程中有什么关键的决策点吗?
陈宇森:我们大概在几个月前做了一个关键决策,决定几乎不在创作者工具那里做投入,我们做一个 " 框架中立 "。首先大部分人开发 Agent 现在可以直接用 vibe coding,对所有人类最友好的方式就是描述清楚自己的需求,AI 直接给你干出来。关于框架中立让我们的产品负责人付铖讲一下。
付铖(MuleRun CPO):现在的 AI 和 Agent 市场工具已经太多了,但是这个市场缺平台或者是专门用来做变现的平台,我们不做这个平台绑定的一种原生的工具,我们支持其他的工具创作出来的东西上到我们这里来卖就行了。
这样的能够节省大量的时间资源和产业资源,我们把一部分部署的工作和完整的交易链路做好,同时还把那些做工具的公司变成了我们的上下游合作伙伴,所以我们不是想跟 dify 或者是 n8n 竞争,我们想跟他做联合宣发,他们社群里的好的创作者能够在我们这里得到变现和收益,这个是多赢的决策,对于我们在团队非常小,或者是资源非常紧张的早期还是比较关键的。
如果做工具有可能今天还在研发呢,也不会有一个已经上线并且有大量用户访问的现状。

● 2025 云栖大会现场,左二陈宇森
怎么吸引用户和 Agent 创作者入驻?
陈宇森:这个飞轮早期转起来一定需要一些初始推动力的,你还是要解决一些 certain 的问题,包括找到一些让两边都兴奋的点,或者让一批人先富起来,才能把这个事情推动起来。
一开始我们是有种子的 creator,比如基于 Nano Banana 做 3D 桌面人物创作的开发者,他确实是上线了 3 天就赚到 1000 多刀,这个是很真实的案例,所以就会穿透很多开发者的市场。而且我们线下会有推动很多创作者的 workshop,让大家知道有这样的地方你可以做东西,然后帮你卖向全球。我们也有激励计划,赚的越多我们给你更多的激励。
过去很多 Agent 平台都专注在怎么帮你开发 Agent,但这个层面其实有很多的可选项。在国内来讲更关注的是用户在哪,我们就要做让用户很简单用起来的平台。
之前一些开源的项目,它对用户来说门槛是很高的,比如说你要从云端铺一个 docker 回来,把环境跑起来,把 Agent 的所谓描述文件放进去,这个对于懂一点技术的人 OK,但是对于普通人来讲每多一个步骤 90% 的人就消失掉了,他不会用这些东西。所以当你渗透向一个更广泛的人群的时候,门槛每降低一步都会带来 AI 对人群的 10 倍扩大。
在现在的大语言模型的能力下可以用 Agent 解决很多问题了,但是我跟身边不是 AI 领域的人的聊的时候,我说你对 AI 用了什么?他说 DeepSeek 问了几个问题,或者是豆包问了几个问题,他也不用海外的东西,他对国内的这种 AI 的使用仅限于问几个问题,这个认知的差是非常大的,如果我们能打破这个认知差,就能让我们很多 Agent 的产品扩大很大的用户量。
我们现在还比较早期,包括我们的基础建设也需要一定的时间积累,平台上足够好用的 Agent 还不足够多,我们在等一个大概的 Agent ready 的时间。一段时间之后,就跟当年移动互联网百团大战、电商大战一样,我们肯定要经历一个更残酷更艰难的战斗。大家都对这个赛道有很深的信仰和认知,我们觉得是非常值得做的事情,未来在这个赛道上,不来个几十家厂商就说明我们对这个事情看错了。
李昕瑜(MuleRun CMO):我们现在 official launch 了 10 天,整个的用户数是 21 万,全球已经有将近 4000 多个创作者报名使用我们的平台,我们在审核。他们的质量非常非常高,各行各业的专家,所以这个双边效应我们认为这个阶段已经开始起来了,我们后面平台整个 Agent 的节奏会越来越快。
什么样的 Agent 和创作者可以进入你们平台?有怎样的审核机制?
陈宇森:早期靠人。这里面有一个非常好玩的特性,大语言模型解决一个问题的能力远远低于它评价一个问题是否被很好解决的能力。在这个前提下我们正在做一套自动化的 evaluation 的过程,评价每一个 Agent 能完成的任务和它设计的目的有多大偏差,当偏差足够小的时候我们认为是一个好的 Agent。长期这个工作一定是自动化或者是半人工的方式完成,早期全部是人肉上,逐步用更优雅的方式解决它。
对 Agent 的评估主要是成功率,定义的目标和我们跑一百次,一千次能不能稳定的按照预期把结果输出出来。还有一个市场的指标,因为平台用户会使用,包括收藏点赞使用数量这个也是 Agent 是不是易用,能不能转付费的一些客观标准。

● MuleRun 线下分享会
李昕瑜:创作者方面我们现在审核通过率是比较严的,大概是在 40% 左右的通过率。
提交的报名表比较复杂,你得讲清楚你的目标用户以及你的核心的竞争力,包括有没有竞品、有没有 demo,他要给我一个完整的东西,我们才会把它审核进来。上来了以后我们也会他上传的作品有审核,比如跑 10 次稳定性怎么样,这是技术审核,因为很多开发者用 workflow 做出来以后,稳定性不好,C 端的用户可能用了 10 次 7 次跑失败了,这个产品就会影响我们平台的口碑。
现在在你们平台上哪些类型的 Agent 表现比较好?
李昕瑜:我们现在有两类付费能力比较强的,第一类是完全 To C 的,比如说 Nano Banana(3D 桌面人物创作),这次热点我们就赶上了,流量涨得很快。第二种偏专家经验的 workflow 类,比如投研的 web3 他们是币圈,可能去给你抓币圈最新的币,团队背后有数据库,真的很牛。
还有一个也是投研的工具 FundaAI,他们原来美股做投资的,以前 repo 的都是给那种大的美股公司来用的,其实他们团队不太会玩互联网流量,他们是搞线下的,所以他们愿意跟我们合作,我们可以给他带来很多的用户。

谈竞争:所有垂直的公司很难打过我们
MuleRun 一个月前在海外 beta 上线,在这一个月内都收到了怎样的反馈?并且做出了调整?
陈宇森:太多了,我们这一个月产品都完全重构了。
速度是很需要的,我不能说等到万事皆备才上,我们一定是非常小步快跑,我们内部也有很强的共识,一定是先跑起来有问题再改,AI 这个时代速度是一切。所以早期在产品初步构想 ready 且产品基础架构 ready,一定要上线,之后再慢慢调整。
上线之后我们发现非常好,大家对这个事情超级期待,而且很多人跑过来说,宇森我一年前就想到要做这个事情了。我心里想的 10 万个人可能都一年前想过这个事情,但是谁真的做出来,而且做出来还保持它越跑越好,这是非常难的。
因为想到这 idea 很简单,一看 coze 什么都不变现,我们是不是做一个带变现功能的 Agent 创作平台很好?当然很好,但是做出来没有那么简单,可能是做一个 Manus 和 Lovart 的立方或者是平方起,不是单纯做一个 Agent 就好了,所以我们的认知是要跑的足够快,我们也接受早期的问题足够多,你产品优化的不够好、有点卡,出 bug 太正常了,跑起来再高速上换轮胎就可以了。

● MuleRun 宣传视频截图:Get Mule Run Your Messes
在你观察中,其他家没做成功的共性是什么?
陈宇森:两点最核心的,他们没有意识到交易在这个里面的重要性,一定要让他们(创作者)赚钱,没有人天天做好玩的东西不赚钱。还有平台做出来一个 Agent,用的时候要自己申请一些 key 填进去,每给用户增加一个步骤用户就受不了,所以交易和门槛我觉得是第一位的。
第二个事情是过去的 Agent 大多是 chatbox like,能做的事情很有限,本来大多数的任务不是通过聊天完成的,后端提供的 runtime 的供给有限。
还有时机。把这个事做成的前提,首先大语言模型得到一个还不错的水平。如果这个事情在一年前做可能也很难做,包括 cursor 全球最火的 IDE,它在 ChatGPT 出来之前就创业了,2022 年用的时候就觉得很非常弱智,很难用,但从 2023 年年末到去年就是超快的爆发。所以有大量的基建 ready,有很多很好的 Agent,大量的 SOP 沉淀,在未来大语言能力再往前进一步半步的时候就变成超好用的平台,所以大量的东西提前做,但是很难提前太久。
有很多垂直领域也会有类似的模式,比如 Fancytech 把设计上线,他们作为平台方提供稳定的客户需求。这个环境下你们对于场景的定位和通用的边界是什么?
陈宇森:我们上面都会有很好玩的创作者做出跟这些所谓的垂直领域解决方案类似的东西。没有任何垂直领域的电商网站可以存活,只有平台性电商网站可以存活。在 Agent 这个领域只要需求是足够离散的,最终没有任何一家垂直领域的解决方案可以干得过我们。
这里有一个例外,它做一个特定领域足够闭环的长解决方案的时候,它其实是一家 to B 公司,跟我们不竞争,我们服务的是专业的工作人员,或者是一些人的特定需求中的某一个环节,我们希望高度标准化且重复使用的。你只要陷入到 2B 里面,这个事情我们太熟练了,你始终会被大量的需求拖慢速度的。我们跟它也是差异化竞争。
当大语言模型继续发展,上面的专家足够好的时候,比如说它的功能是很长的链条,但是我们这里有人把其中每一个链条分别做了不同的 Agent,我们后续会有连接和组合的能力,让你在别的地方做的事情这儿也能做,可能会更便宜,而且是甲方自己干活,他对需求的理解会比乙方更好。
如果这场战争不快进到 AGI 解决一切问题的话,我觉得所有垂直的公司很难打过我们,只要我们做的足够好。
MuleRun 的护城河在哪?创作者不一定忠诚,假设我是创作者肯定是哪好去哪。
陈宇森:平台来讲你还是要提供一定的价值,我们好用的基础设施是一个价值,足够丰富的生态在长期是很强的壁垒,因为用户都在了,我去别的地方做,如果平台没有足够多的用户,他去那做也没有意义。所以短期壁垒一定是平台自身提供的,长期壁垒就是生态本身,这是两个阶段。
撰文 | 巴芮
编辑 | 薇薇子
封面图源 | AI 生成
你有什么需要用到骡子快跑 Agent 的场景吗?
本文来自微信公众号" 未来人类实验室 ",作者:巴芮,36 氪经授权发布。


