最近这段时间,如果你只看谷歌的宣传资料,大概率会觉得 Gemini 已经快要无敌了。
论视频生成有 Omni,图片生成有 Nano Banana,Gemini 3.5 Flash 性能比 3.1 Pro 还强,Gemini Spark 还能帮你自动完成任务。从发布会到官方博客,Gemini 给人的感觉就像一个六边形战士,几乎每个方向都在进步。
其实前段时间雷科技在报道 Google I/O 时也给出了盛赞。但这段时间真正用下来之后,小雷却越来越觉得 Gemini 3.5 Flash 有点拉。

(图源:谷歌)
不是那种跑分不行的拉,也不是能力垫底的拉。恰恰相反,它很多能力依然属于行业第一梯队。
问题在于,当宣传里的各种新功能真正落到日常体验上时,总会出现一种说不上来的别扭感。你明明知道它很强,却总感觉没那么好用;你明明知道很多功能已经上线了,却总有种自己没用到的感觉。
这种割裂感在最近的大模型圈其实并不少见:厂商展示的是能力上限,用户接触到的却是实际体验。前者越来越惊艳,后者却未必同步提升。
而 Gemini 3.5 Flash,可能就是这种矛盾最明显的代表之一,槽点太多,不吐不快。
先说最容易感受到的问题。
额度。
谷歌在 I/O 2026 大会前夕悄悄修改了会员订阅的额度规则,从固定消息数,改成了基于计算资源的配额(compute-based quota)。
简单来说,以前 Gemini 只看互动次数,图像、视频、音频和文字大模型的使用次数都是互相独立的,每 24 小时重置一次。
体感下来,Pro 会员视频一天能生成 5 次,图片能生成 50 张,而文本根本用不完。

(图源:雷科技)
而在修改之后,谷歌同时设定了每周限额和每五小时重置的临时限额。
现在所有的任务用量都会结合 Token 消耗等进行计算,如果让模型思考得多,那即使它给你回复的内容不变,花的钱也比以前更多。
问题是,我怎么知道一个任务会让模型消耗多少算力?

不仅如此,之前分门别类的各项功能,现在都被统一归类为这个用量限额的一部分,不论是视频、图片、深度研究还是 Agent,只要其中一个功能耗完限额,接下来几个小时你就啥也别想着干了。
就我自己的体验,用 Omni Flash 生成一个视频,差不多会消耗 Pro 订阅的 1/3 额度,如果希望修改视频,那至少要用到 Pro 订阅的 1/2 额度,真就不够用的。
比额度更影响体验的,其实是路由问题。
这可不是我的个人感受,最近不少用户都遇到过类似情况。前面还在正常生成图片,但是聊着聊着,Gemini 突然开始表示自己无法生成图片,直接告诉你自己只是一个文本模型,对于这类任务无能为力。

最搞笑的是,甚至会出现仅提供文本不出图的情况。

这种情况偶尔出现还能理解,但频率高了之后,用户真的很难搞清楚到底是功能失效了,还是模型切换错了。
能力层面其实也有类似的问题。
Gemini 3.5 Flash 给人的感觉一直是能做,但经常做得不够稳。同一道数学题或者推理题,有时候回答得相当漂亮,隔几个小时再问一次,结果可能完全不同。
我测试过几道经典逻辑题,很多时候它前面的分析过程都没有问题,推导链条看起来也很完整,可到了最后一步,经常会出现一些莫名其妙的失误。最离谱的是,它还特别自信,答案错了语气却一点没变。
至于更简单的计算题,该错还是错。

我知道,这种问题对于聊天来说无伤大雅,但如果放到学习、工作甚至编程场景里,影响就完全不一样了。
如果说前面的问题属于体验层面,那更深层的问题其实来自谷歌最近的产品和定价策略。
要我说,今年谷歌最喜欢讲的故事就是 Agent。
从发布会到官方宣传,几乎所有重点都围绕着 Gemini Spark 展开。自动搜索资料、整理信息、执行任务,甚至帮用户完成跨应用操作,听起来确实很有未来感,也很符合大家对 Agent 的想象。
问题在于,你 Gemini Spark 居然需要 Ultra 订阅用户才能使用,该订阅起价每月 99.99 美元,最高级别订阅限时价每月 199.99 美元(约 1352.98 元)。

要知道,OpenAI 和天下无敌的 Codex,只需要每月 20 美元即可启用。
于是就出现了一个很有意思的现象:大家看发布会的时候觉得 Gemini 天下无敌,打开产品之后第一眼看到的却是升级按钮。
这种落差其实比功能缺失更容易影响口碑。因为用户知道能力存在,也知道效果不错,但偏偏自己碰不到。
至于编程的价格,其实也没便宜到哪去。
要知道,在 I/O 2026 大会上,谷歌 CEO 皮查伊可没少强调 Gemini 3.5 Flash 的成本优势。
按照官方价格,Gemini 3.5 Flash 每百万输入 Token 收费 1.5 美元,每百万输出 Token 收费 9 美元。作为对比,Claude Opus 4.7 的 API 定价为每百万输入 Token 收费 5 美元,GPT-5.5 Pro 则直接来到了每百万输入 Token 收费 30 美元。

单看价格表,确实便宜不少,甚至有一种薄利多销的味道。
但价格表这东西看看就好,对于真正用模型的人来说,更重要的是完成同一个任务到底要花多少钱。
Artificial Analysis 在 Agent 评测里做过统计,Gemini 3.5 Flash 跑完整套任务的成本超过 1500 美元,而 Gemini 3 Flash 只用了不到 300 美元,差距直接来到了五倍以上。即便和 Gemini 3.1 Pro 相比,Flash 的整体成本也高出一大截,甚至比 GPT-5.5 还贵。
问题出在哪?
答案很简单:太能聊了。
在 Agent 测试里,Gemini 3.5 Flash 平均完成一个任务要接近 50 轮对话,而很多竞品二十来轮就已经收工。别小看这几十轮差距,每进行一次新对话,模型都要重新读取之前的历史记录,轮次越多,Token 就烧得越快。
这就像打车一样,单公里价格确实便宜,可架不住你绕城跑三圈。最后结账的时候,用户看到的永远是总价,而不是起步价。
说到底,我并不觉得 Gemini 3.5 Flash 是一个失败的模型。
事实上,它依然属于行业第一梯队。多模态能力依旧很强,视频生成依旧不错,搜索整合能力依旧是 Google 的看家本领。很多单项能力放到整个行业里看,依然相当能打。
问题在于强制缩水的用量限额,和因为算力短缺而频繁出现的降智问题。

不论谷歌怎么宣传,普通用户并不关心排行榜,也不关心 Gemini 3.5 Flash 有多省算力,他们关心的是能不能顺利完成任务,能不能稳定输出结果,能不能不用研究复杂的规则,也不用担心额度什么时候突然归零。
这也是为什么最近越来越多人开始怀念某些老版本模型。
要知道在大概半年前,Google AI Studio 每天还会给免费用户发放 50 次 Pro 模型交互量,令人无限唏嘘。
对于 Gemini 来说,未来最大的希望依然是 Agent。
毕竟谷歌拥有全行业最完整的生态资源,只要未来真的能够打通搜索、邮件、日历、文档和安卓系统,让 Agent 帮用户完成更多真实任务,那它依然有机会建立起其他厂商难以复制的优势。
只是现阶段,小雷对 Gemini 3.5 Flash 的评价显然不会变。


登录后才可以发布评论哦
打开小程序可以发布评论哦