为何Gemini体验越来越拧巴？好AI越用越贵，免费AI集体降智

最近这段时间，如果你只看谷歌的宣传资料，大概率会觉得 Gemini 已经快要无敌了。

论视频生成有 Omni，图片生成有 Nano Banana，Gemini 3.5 Flash 性能比 3.1 Pro 还强，Gemini Spark 还能帮你自动完成任务。从发布会到官方博客，Gemini 给人的感觉就像一个六边形战士，几乎每个方向都在进步。

其实前段时间雷科技在报道 Google I/O 时也给出了盛赞。但这段时间真正用下来之后，小雷却越来越觉得 Gemini 3.5 Flash 有点拉。

（图源：谷歌）

不是那种跑分不行的拉，也不是能力垫底的拉。恰恰相反，它很多能力依然属于行业第一梯队。

问题在于，当宣传里的各种新功能真正落到日常体验上时，总会出现一种说不上来的别扭感。你明明知道它很强，却总感觉没那么好用；你明明知道很多功能已经上线了，却总有种自己没用到的感觉。

这种割裂感在最近的大模型圈其实并不少见：厂商展示的是能力上限，用户接触到的却是实际体验。前者越来越惊艳，后者却未必同步提升。

而 Gemini 3.5 Flash，可能就是这种矛盾最明显的代表之一，槽点太多，不吐不快。

先说最容易感受到的问题。

额度。

谷歌在 I/O 2026 大会前夕悄悄修改了会员订阅的额度规则，从固定消息数，改成了基于计算资源的配额（compute-based quota）。

简单来说，以前 Gemini 只看互动次数，图像、视频、音频和文字大模型的使用次数都是互相独立的，每 24 小时重置一次。

体感下来，Pro 会员视频一天能生成 5 次，图片能生成 50 张，而文本根本用不完。

（图源：雷科技）

而在修改之后，谷歌同时设定了每周限额和每五小时重置的临时限额。

现在所有的任务用量都会结合 Token 消耗等进行计算，如果让模型思考得多，那即使它给你回复的内容不变，花的钱也比以前更多。

问题是，我怎么知道一个任务会让模型消耗多少算力？

不仅如此，之前分门别类的各项功能，现在都被统一归类为这个用量限额的一部分，不论是视频、图片、深度研究还是 Agent，只要其中一个功能耗完限额，接下来几个小时你就啥也别想着干了。

就我自己的体验，用 Omni Flash 生成一个视频，差不多会消耗 Pro 订阅的 1/3 额度，如果希望修改视频，那至少要用到 Pro 订阅的 1/2 额度，真就不够用的。

比额度更影响体验的，其实是路由问题。

这可不是我的个人感受，最近不少用户都遇到过类似情况。前面还在正常生成图片，但是聊着聊着，Gemini 突然开始表示自己无法生成图片，直接告诉你自己只是一个文本模型，对于这类任务无能为力。

最搞笑的是，甚至会出现仅提供文本不出图的情况。

这种情况偶尔出现还能理解，但频率高了之后，用户真的很难搞清楚到底是功能失效了，还是模型切换错了。

能力层面其实也有类似的问题。

Gemini 3.5 Flash 给人的感觉一直是能做，但经常做得不够稳。同一道数学题或者推理题，有时候回答得相当漂亮，隔几个小时再问一次，结果可能完全不同。

我测试过几道经典逻辑题，很多时候它前面的分析过程都没有问题，推导链条看起来也很完整，可到了最后一步，经常会出现一些莫名其妙的失误。最离谱的是，它还特别自信，答案错了语气却一点没变。

至于更简单的计算题，该错还是错。

我知道，这种问题对于聊天来说无伤大雅，但如果放到学习、工作甚至编程场景里，影响就完全不一样了。

如果说前面的问题属于体验层面，那更深层的问题其实来自谷歌最近的产品和定价策略。

要我说，今年谷歌最喜欢讲的故事就是 Agent。

从发布会到官方宣传，几乎所有重点都围绕着 Gemini Spark 展开。自动搜索资料、整理信息、执行任务，甚至帮用户完成跨应用操作，听起来确实很有未来感，也很符合大家对 Agent 的想象。

问题在于，你 Gemini Spark 居然需要 Ultra 订阅用户才能使用，该订阅起价每月 99.99 美元，最高级别订阅限时价每月 199.99 美元（约 1352.98 元）。

要知道，OpenAI 和天下无敌的 Codex，只需要每月 20 美元即可启用。

于是就出现了一个很有意思的现象：大家看发布会的时候觉得 Gemini 天下无敌，打开产品之后第一眼看到的却是升级按钮。

这种落差其实比功能缺失更容易影响口碑。因为用户知道能力存在，也知道效果不错，但偏偏自己碰不到。

至于编程的价格，其实也没便宜到哪去。

要知道，在 I/O 2026 大会上，谷歌 CEO 皮查伊可没少强调 Gemini 3.5 Flash 的成本优势。

按照官方价格，Gemini 3.5 Flash 每百万输入 Token 收费 1.5 美元，每百万输出 Token 收费 9 美元。作为对比，Claude Opus 4.7 的 API 定价为每百万输入 Token 收费 5 美元，GPT-5.5 Pro 则直接来到了每百万输入 Token 收费 30 美元。

单看价格表，确实便宜不少，甚至有一种薄利多销的味道。

但价格表这东西看看就好，对于真正用模型的人来说，更重要的是完成同一个任务到底要花多少钱。

Artificial Analysis 在 Agent 评测里做过统计，Gemini 3.5 Flash 跑完整套任务的成本超过 1500 美元，而 Gemini 3 Flash 只用了不到 300 美元，差距直接来到了五倍以上。即便和 Gemini 3.1 Pro 相比，Flash 的整体成本也高出一大截，甚至比 GPT-5.5 还贵。

问题出在哪？

答案很简单：太能聊了。

在 Agent 测试里，Gemini 3.5 Flash 平均完成一个任务要接近 50 轮对话，而很多竞品二十来轮就已经收工。别小看这几十轮差距，每进行一次新对话，模型都要重新读取之前的历史记录，轮次越多，Token 就烧得越快。

这就像打车一样，单公里价格确实便宜，可架不住你绕城跑三圈。最后结账的时候，用户看到的永远是总价，而不是起步价。

说到底，我并不觉得 Gemini 3.5 Flash 是一个失败的模型。

事实上，它依然属于行业第一梯队。多模态能力依旧很强，视频生成依旧不错，搜索整合能力依旧是 Google 的看家本领。很多单项能力放到整个行业里看，依然相当能打。

问题在于强制缩水的用量限额，和因为算力短缺而频繁出现的降智问题。

不论谷歌怎么宣传，普通用户并不关心排行榜，也不关心 Gemini 3.5 Flash 有多省算力，他们关心的是能不能顺利完成任务，能不能稳定输出结果，能不能不用研究复杂的规则，也不用担心额度什么时候突然归零。

这也是为什么最近越来越多人开始怀念某些老版本模型。

要知道在大概半年前，Google AI Studio 每天还会给免费用户发放 50 次 Pro 模型交互量，令人无限唏嘘。

对于 Gemini 来说，未来最大的希望依然是 Agent。

毕竟谷歌拥有全行业最完整的生态资源，只要未来真的能够打通搜索、邮件、日历、文档和安卓系统，让 Agent 帮用户完成更多真实任务，那它依然有机会建立起其他厂商难以复制的优势。

只是现阶段，小雷对 Gemini 3.5 Flash 的评价显然不会变。

宙世代

一起剪

相关标签