2025 年,AI 领域发生了很多标志性事件,它们共同指向了一个特性:一句话生成。
文字方面,年初 DeepSeek 让我们见识了什么是普惠级的 "One-Shot"(少样本甚至零样本)文字生成,ChatGPT 领衔的 Canvas 模式可以指哪打哪做局部文字编辑;
图像方面,Nano Banana 和 SeeDream 等模型让少提示词出图,以及动嘴 P 图成为标配,而且量大管饱,四舍五入都是免费;
视频方面,Sora 2 让一句话生成的视频具备了起承转合的剧情;
音频方面,Suno 4 更是进化到了可以精准修改音轨的专业级工具。
行业对于 AI 编写 Web 前端和后端需求比较多,但直到 Gemini 3 ," 一句话生成(基本能跑的)Web App" 这个时代终于普惠地来到了所有人的面前。
这里我说个暴论:需要编程能力的,有钱用 Claude,没钱用 Gemini 就行了。白嫖或者拼车 Google One 的路径满坑满谷,而大部分你对 Gemini 的需求,特别是 " 一句话 " 类的需求,都可以在聊天框里而不是 API 就能解决。
提示词工程正在消亡,自然语言统治一切。当模型能力强到一定程度,那些曾经必须特别注重的提示词技巧、复杂的工程外壳,都可以不用管了。正如 Manus 所言:"Less structure, more intelligence" 。
为什么强调 " 一句话 "
永远不要小看 " 一句话 " 带来的心理暗示。
正如之前测试 Nano Banana 2 时我发现的,之前网上给出的案例基本是调用模型原本的世界知识,以 one-shot 生成信息图,如 " 生成图片说明咖啡机的工作原理 "。


看到很多 " 只需一句话 " 就能搞定的案例被疯传,它降低的不是技术门槛,而是心理门槛。在很多垂直行业,缺乏 AI 体验的专家们往往掌握着极深的专精知识。过去他们被代码拦在门外,即使实际上真的很简单,要想突破自己也不容易。
现在," 只需一句话 " 给了他们向前一步的勇气。他们使用 AI 时,用法可能和主流不尽相同,自己摸索才能有自己专属的用法,哪怕别人培训也达不到这个效果。而他们所需要的往往只是一种勇气。
这件事重度依赖基底模型的智商
一句话手搓应用这一点,给我本人带来的就是一种高中数学考 30 分的文科生也可以编程的勇气。
在 Gemini 3 之前,Claude 的一些模型号称编程能力很强,但我一直用不了直连 Claude Code,只能通过 Manus 使用。我甚至花了 10000 多个点来翻新我的个人网站。

当时我最直观的感受是:多次修改诉求极度耗费 Token,而且模型只要降智就不能用,所以就得忍受高级推理模型,一点点耗着。
我已经看到用 Gemini 3 制作一些 WebApp 的单页案例,确实让人眼前一亮,目测其可用性与 Claude 持平或者比其更强,这让我更有信心让出品更可控,即使我还没有专门测试 Gemini 3 的用例。我相信当初我让 Manus 做的事情,它也可以做。
但是我真去体验了蚂蚁的新产品 " 灵光 ",因为它们在办一句话生成 AI 应用的大赛。灵光将这种 WebApp 称为 " 闪应用 "。

蚂蚁的前端和工程能力毋庸置疑,我看到推理过程被优雅地包裹在一个框里面,思维链既不冗长又可以提示关键进度。遗憾的是,决定成品质量的似乎依然是模型本身的智商。
我尝试制作的闪应用是一个 " 可以生成闪应用提示词的闪应用 ",也就是 " 元应用 "(meta-app)。我希望用一个游戏化的方式将它包裹起来,一开始规划的是赌场摇骰子,生成一张闪卡,上面写着提示词,点一下一键复制就可以贴到灵光里,生成新的闪应用。

为了确保稳妥,我让文本能力本身就很强的 Gemini 3 读取我的诉求并优化了提示词,对方方面面都做了规定。



初始版本,点击骰子本身无反应,下面六个按钮才有反应。
弹窗第一次点击不会出现,奇葩的是需要点击一下 " 问号 " 弹出操作说明,关闭后等待一秒钟才出现原本要有的弹窗。
另外,这个版本的创意名称都跟我框定的按钮标签一样,比如点 " 养生局 " 就出 " 养生轮盘 ",这并不是我想要的结果。
第一次测试确实大差不差地出了个样子,然而致命的是修改环节。我发现,只要对话超过 3 轮,模型就开始 " 老年痴呆 " 丢失上下文,忘记了我制作这个 " 闪应用 " 的核心初衷。比如,我一开始让它解决生成的骰子和筹码不太拟真的问题,最后它给改成了一个纯粹猜点数的游戏。
为了解决这个问题,我尝试一次性把所有需求写进提示词,结果又因为信息过载导致生成失败,最终输出的结果也体现了模型不太听得懂人话。我甚至忘记之后要写稿了,在愤怒之下删除了之前的聊天记录
因为牌桌可能太复杂了,我又改让它做 Gemini 3 顺手拈来的咕咕机,结果也一样磕磕绊绊。
这个聊天记录保留下来了,大家可以鉴赏:




下面开始崩了:


我返回上一次的指令直接修改,结果完全崩坏了:

最后我让它只实现核心功能——优化提示词,并且改为输入框输入诉求来优化提示词,总算达到了目的,但是这东西也过于简单了。



实际上我们在 " 闪应用 " 大赛里面看到的也是如此,卡路里计算器,飞机大战这些,都是已经非常成熟的应用,但未免是 " 为了做(参赛)而做 " 的东西,受能力所限,距离实用会有点远。
蚂蚁做的前端是比较到位的,遗憾的是模型能力不足。还是回到了 "Less structure, more intelligence"。
说了这么多,如果让 Gemini 3 自己做自己写的提示词,最后会做成什么样子呢?
如下:





截图过程中发现一些 Bug,但根据它的表现,完全能修。


稍后我将会把它部署在我的个人网站,方便上不去 Gemini 的同学体验。(可在官网查看本文)
应用商店的 "Youtube 时刻 "?
尽管技术还有瑕疵,但这并不妨碍资本讲故事。一句话驱动 AI 生成应用的 C 端领域早已是一片红海。
第一类,像 Manus、MiniMax、字节的扣子空间、Replit 这些,它们不仅生成代码,还可以托管生成的网页应用,并且执行一些简单的非静态功能。
第二类,Claude Artifacts 或者 ChatGPT Canvas,这是纯聊天机器人 " 顺手一做 ",增加一个功能也不费事。最近阿里的千问 App 也在大力宣传 " 一句话生成应用 "。而同室操戈的蚂蚁灵光则推出了 " 闪应用 "。这几家都在办大赛,跟当初火爆一时的 AI 生图大赛一样,只能用自家的模型和产品,开发者的目的是收集样本,并且探索模型的能力边界和局限。
第三类,Wabi、Pico、Websim 以及百度的 " 秒哒 " 等,是专门锚定 C 端的、进一步降低专业性的类型。比如 Wabi,作为陪伴应用 Replika 联合创始人的新项目,目标是做 "App 界的 YouTube"。Websim 则把网页生成变得游戏化。这些平台有的像 Manus 一样允许随意切换第三方模型,有的则锁死自家模型。
在我看来,无论平台怎么花哨,基底模型的能力是决定性因素。如果模型听不懂人话,所谓的 " 无代码平台 " 不过是堆砌了一堆漂亮的垃圾而已。
做给自己用,而不是卖出去
用 AI 一句话手搓应用,不太应该考虑上架赚钱,但是它对个人的生产力提升是实打实的。
以前我想做一个真 · 应用,甚至哪怕是一年前就基本已经没难度的 Chrome 浏览器扩展,往往都会卡在 " 发布 " 环节:Edge 的应用商店我都搞不定。APK 需要签名,iOS 更是要交保护费上架,欧盟以外的地方都没法侧载。但如果做的人和用的人都明确这是 WebApp,那就简单多了,只要是个浏览器就能跑,GitHub Pages、Vercel、Cloudflare 这些 " 赛博菩萨 " 提供了白嫖的托管服务。
下面这句话是我在制作 WebApp 时候唯一需要吟唱的固定咒语:
您需要假设 WebApp 环境是可以在 GitHub Pages(全静态)或者联网的本机浏览器(注意跨域问题)都可以使用现代浏览器正常打开运行的,同时也支持手机和平板访问。
这句话也说明了一切。对 AI 浪潮越熟悉的人,就越是会增加浏览器的使用率,减少在原生 App 里的停留时间。
但是对于小白用户来说,他们好像跟浏览器有仇一样,连解压文件都不会,而且因为 XX 网盘解压要钱,还要咒骂给资源的人 …… 这种事情都做得出来,你怎么指望他们用除了系统自带应用商店和小程序之外的其他任何东西?
这又跟上面说的对上了——只要门槛降低到一个阈值以下(比如提示词从无数次微调,到一段话,最后缩减到一句话),这个功能就会一下子涌进来很多人用。
至于所谓 "AI 应用商店 " 或者 " 应用界的 YouTube" 之类,我认为这里面有些门道,最终会影响整体生态的付费意愿。
首先,我用 AI 手搓应用,很多本来是为了替代在成熟应用商店里,在 AI 出现之前已经用人工做出来的高端收费应用,比如用 AI 做一个剪映这种需求。
如果我能用 AI 做得比较好,我的第一个念头不是 " 这能卖多少钱 ",而是——既然我能做,别人问一下模型是不是也能复刻一个?护城河在哪里?
反过来,哪怕我知道你这个 App 是在上架前微调了好几天的,但我自己做也就是重新微调一次的事。相比于花几块钱买你的现成产品,我宁愿花点 Token、花点时间自己 " 抽卡 "。因为在心理上,我觉得这类简单的工具 " 不值钱 "。
当然,从 ComfyUI 到 n8n 再到扣子空间,总有人能把工作流封装得很好,把 " 展示页 " 变成 " 新的应用商店 ",确实有人用工作流赚到了钱。只是我评估后觉得,我自己做不了这个生意。这本质是卖 " 信息差 " 和服务,而不是卖什么真正的稀缺性,是闲鱼代下单这种事情的进阶版本而已。
所以," 一句话做应用 " 的终局,大概率是 " 自给自足 ",而不是一个新的 App Store 淘金热。
最后说一句,对你自己来说,有时候还是需要一个 " 应用 " 层面的东西,将一个工作流固定下来。尽管从理论上讲,以后你还可以快进到用提示词直接指挥模型干,但固定为 " 应用 " 可以少烧 Token,在保护环境的同时,也可以确保结果是稳定可预期的。
当你需要一把锤子时,你不再需要去五金店买,而是对着空气喊一声:" 给我来把锤子 ",它就出现在了你手里。你也可以选择对着空气喊一声:" 给我把眼前这些钉子砸进去!",它不是不能干。
但有时候我就是喜欢锤子,不行吗?


