雷科技 3小时前
为何Gemini体验越来越拧巴?好AI越用越贵,免费AI集体降智
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

最近这段时间,如果你只看谷歌的宣传资料,大概率会觉得 Gemini 已经快要无敌了。

论视频生成有 Omni,图片生成有 Nano Banana,Gemini 3.5 Flash 性能比 3.1 Pro 还强,Gemini Spark 还能帮你自动完成任务。从发布会到官方博客,Gemini 给人的感觉就像一个六边形战士,几乎每个方向都在进步。

其实前段时间雷科技在报道 Google I/O 时也给出了盛赞。但这段时间真正用下来之后,小雷却越来越觉得 Gemini 3.5 Flash 有点拉。

(图源:谷歌)

不是那种跑分不行的拉,也不是能力垫底的拉。恰恰相反,它很多能力依然属于行业第一梯队。

问题在于,当宣传里的各种新功能真正落到日常体验上时,总会出现一种说不上来的别扭感。你明明知道它很强,却总感觉没那么好用;你明明知道很多功能已经上线了,却总有种自己没用到的感觉。

这种割裂感在最近的大模型圈其实并不少见:厂商展示的是能力上限,用户接触到的却是实际体验。前者越来越惊艳,后者却未必同步提升。

而 Gemini 3.5 Flash,可能就是这种矛盾最明显的代表之一,槽点太多,不吐不快。

先说最容易感受到的问题。

额度。

谷歌在 I/O 2026 大会前夕悄悄修改了会员订阅的额度规则,从固定消息数,改成了基于计算资源的配额(compute-based quota)。

简单来说,以前 Gemini 只看互动次数,图像、视频、音频和文字大模型的使用次数都是互相独立的,每 24 小时重置一次。

体感下来,Pro 会员视频一天能生成 5 次,图片能生成 50 张,而文本根本用不完。

(图源:雷科技)

而在修改之后,谷歌同时设定了每周限额和每五小时重置的临时限额。

现在所有的任务用量都会结合 Token 消耗等进行计算,如果让模型思考得多,那即使它给你回复的内容不变,花的钱也比以前更多。

问题是,我怎么知道一个任务会让模型消耗多少算力?

不仅如此,之前分门别类的各项功能,现在都被统一归类为这个用量限额的一部分,不论是视频、图片、深度研究还是 Agent,只要其中一个功能耗完限额,接下来几个小时你就啥也别想着干了。

就我自己的体验,用 Omni Flash 生成一个视频,差不多会消耗 Pro 订阅的 1/3 额度,如果希望修改视频,那至少要用到 Pro 订阅的 1/2 额度,真就不够用的。

比额度更影响体验的,其实是路由问题。

这可不是我的个人感受,最近不少用户都遇到过类似情况。前面还在正常生成图片,但是聊着聊着,Gemini 突然开始表示自己无法生成图片,直接告诉你自己只是一个文本模型,对于这类任务无能为力。

最搞笑的是,甚至会出现仅提供文本不出图的情况。

这种情况偶尔出现还能理解,但频率高了之后,用户真的很难搞清楚到底是功能失效了,还是模型切换错了。

能力层面其实也有类似的问题。

Gemini 3.5 Flash 给人的感觉一直是能做,但经常做得不够稳。同一道数学题或者推理题,有时候回答得相当漂亮,隔几个小时再问一次,结果可能完全不同。

我测试过几道经典逻辑题,很多时候它前面的分析过程都没有问题,推导链条看起来也很完整,可到了最后一步,经常会出现一些莫名其妙的失误。最离谱的是,它还特别自信,答案错了语气却一点没变。

至于更简单的计算题,该错还是错。

我知道,这种问题对于聊天来说无伤大雅,但如果放到学习、工作甚至编程场景里,影响就完全不一样了。

如果说前面的问题属于体验层面,那更深层的问题其实来自谷歌最近的产品和定价策略。

要我说,今年谷歌最喜欢讲的故事就是 Agent。

从发布会到官方宣传,几乎所有重点都围绕着 Gemini Spark 展开。自动搜索资料、整理信息、执行任务,甚至帮用户完成跨应用操作,听起来确实很有未来感,也很符合大家对 Agent 的想象。

问题在于,你 Gemini Spark 居然需要 Ultra 订阅用户才能使用,该订阅起价每月 99.99 美元,最高级别订阅限时价每月 199.99 美元(约 1352.98 元)。

要知道,OpenAI 和天下无敌的 Codex,只需要每月 20 美元即可启用。

于是就出现了一个很有意思的现象:大家看发布会的时候觉得 Gemini 天下无敌,打开产品之后第一眼看到的却是升级按钮。

这种落差其实比功能缺失更容易影响口碑。因为用户知道能力存在,也知道效果不错,但偏偏自己碰不到。

至于编程的价格,其实也没便宜到哪去。

要知道,在 I/O 2026 大会上,谷歌 CEO 皮查伊可没少强调 Gemini 3.5 Flash 的成本优势。

按照官方价格,Gemini 3.5 Flash 每百万输入 Token 收费 1.5 美元,每百万输出 Token 收费 9 美元。作为对比,Claude Opus 4.7 的 API 定价为每百万输入 Token 收费 5 美元,GPT-5.5 Pro 则直接来到了每百万输入 Token 收费 30 美元。

单看价格表,确实便宜不少,甚至有一种薄利多销的味道。

但价格表这东西看看就好,对于真正用模型的人来说,更重要的是完成同一个任务到底要花多少钱。

Artificial Analysis 在 Agent 评测里做过统计,Gemini 3.5 Flash 跑完整套任务的成本超过 1500 美元,而 Gemini 3 Flash 只用了不到 300 美元,差距直接来到了五倍以上。即便和 Gemini 3.1 Pro 相比,Flash 的整体成本也高出一大截,甚至比 GPT-5.5 还贵。

问题出在哪?

答案很简单:太能聊了。

在 Agent 测试里,Gemini 3.5 Flash 平均完成一个任务要接近 50 轮对话,而很多竞品二十来轮就已经收工。别小看这几十轮差距,每进行一次新对话,模型都要重新读取之前的历史记录,轮次越多,Token 就烧得越快。

这就像打车一样,单公里价格确实便宜,可架不住你绕城跑三圈。最后结账的时候,用户看到的永远是总价,而不是起步价。

说到底,我并不觉得 Gemini 3.5 Flash 是一个失败的模型。

事实上,它依然属于行业第一梯队。多模态能力依旧很强,视频生成依旧不错,搜索整合能力依旧是 Google 的看家本领。很多单项能力放到整个行业里看,依然相当能打。

问题在于强制缩水的用量限额,和因为算力短缺而频繁出现的降智问题。

不论谷歌怎么宣传,普通用户并不关心排行榜,也不关心 Gemini 3.5 Flash 有多省算力,他们关心的是能不能顺利完成任务,能不能稳定输出结果,能不能不用研究复杂的规则,也不用担心额度什么时候突然归零。

这也是为什么最近越来越多人开始怀念某些老版本模型。

要知道在大概半年前,Google AI Studio 每天还会给免费用户发放 50 次 Pro 模型交互量,令人无限唏嘘。

对于 Gemini 来说,未来最大的希望依然是 Agent。

毕竟谷歌拥有全行业最完整的生态资源,只要未来真的能够打通搜索、邮件、日历、文档和安卓系统,让 Agent 帮用户完成更多真实任务,那它依然有机会建立起其他厂商难以复制的优势。

只是现阶段,小雷对 Gemini 3.5 Flash 的评价显然不会变。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

谷歌 flash spark nano
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论