量子位 前天
小杯Gemini战胜GPT5.2,1分钟模拟Windows操作系统
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

谷歌丢出Gemini 3 Flash,给 AI 圈示范了啥叫:小孩子才做选择题,成年人当然是全都要(doge)。

一个公式来形容这款新模型:Gemini 3 Flash=Pro 级智能 +Flash 级速度 + 更低价格

比速度,它几乎是 Gemini 2.5 Pro 的 3 倍,实测更是丝滑到起飞:

比智能,它更是在多个经典测试中,战胜了包括 Gemini 3 Pro、GPT5.2 在内的一众顶尖模型。

数图中有多少根手指,GPT5.2 张口就来 "5 根 ",而 Gemini 3 Flash 成功识破陷阱并给出正确答案 "6 根 "。

画一张骑车的鹈鹕,Gemini 3 Flash(右上)的表现明显优于 Gemini 2.5 Pro(左)和 Gemini 3 Pro(右下),而且这些还都是反复测试后抽取的最佳结果。

考察眼力环节,看模型们是否认识 " 谷歌宣传委员 "Logan kilpatrick。

Gemini 3 Flash 率先答对,而 Gemini 3 Pro 将他误认为 Gemini 前负责人 Jack Krawczyk(已于今年 4 月离职并转投 Meta)。

在更多测试中,Gemini 3 Flash 都展示出自己不俗的综合实力。

虽然叫 "Flash",但其实是谷歌迄今最强智能体模型

敲黑板,这款模型即日起已面向全球所有用户推出

普通用户可通过 Gemini 应用以及谷歌搜索的 AI 模式使用;专业开发者可在 Google AI Studio、Gemini CLI 以及谷歌全新的智能体开发平台 Google Antigravity 中,通过 Gemini API 进行调用和集成。

同时,企业客户也可通过 Vertex AI 和 Gemini Enterprise 两大平台获取其服务。

整体而言,Gemini 3 Flash 还是继承了 Gemini 3 Pro 的复杂推理能力、多模态和视觉理解能力、Vibe 编程能力,以及处理智能体任务的能力,只不过响应速度更快。

谷歌官方表示,这是他们迄今为止 " 在智能体工作流程方面最出色的模型 "。

话不多说,我们这就看看 Gemini 3 Flash 能做什么以及实际表现如何?

比如让它创建一个功能完整、美观的 Windows 操作系统,核心环节几乎用时不到一分钟(视频未加速)。

分享该测试的网友表示," 这是一款令人叹为观止的模型 "。

还能用来直接生成游戏,网友所使用的提示词如下:

用代码为我创建一个《侠盗猎车手 6》游戏,并尽可能使其逼真,添加您选择的任何功能。

游戏的感觉有了,只不过画面仍有一定提升空间。

不过如果换成一些难度稍低一点的小游戏,效果倒还不错。

而用它来生成一张天气卡的效果 be like:

肉眼可见设计更高级,并且交互效果更丰富。

最后我们简单上手实测一下,让它给自己生成一个介绍网站。

经过实测,网站上面的测速功能可以正常使用,不只是个空有前端的 " 花架子 ":

而且点击 " 立即体验 " 按钮后,也确实能跳转到 Gemini 的官网网页。

这波看下来,你觉得 Gemini 3 Flash 表现如何?

性能速度双双超越 2.5 Pro,价格却低得多

此外,官方测评显示,Gemini 3 Flash 主打一个 " 加速不降智 "。

性能上不仅显著超越 Gemini 2.5 Pro,而且在专业多模态测试 MMMU Pro、复杂推理测试 ARC-AGI-2 等方面,还能略胜 Gemini 3 Pro。

更重要的是,它还在性能、成本和速度方面突破了帕累托极限——速度比 Gemini 2.5 Pro 快 3 倍,平均使用的 token 数量却少 30%。

价格方面,Gemini 3 Flash 相比前几代模型更具性价比。

其每百万输入 token 为 0.5 美元,每百万输出 token 为 3 美元(音频输入价格仍为每百万输入 token 1 美元)。

虽然略贵于 Gemini 2.5 Flash(每百万输入 0.3 美元 / 每百万输出 2.5 美元),但考虑到其性能和速度,这一价格仍然相当具有吸引力。

(Gemini 2.5 Pro 价格为,每百万输入 1.25 美元 / 每百万输出 10 美元。)

至此,谷歌 Gemini 3 算是集齐了全部家族成员,包括之前的 Pro 和 Deep Think 深度思考版。

而且说到思考模式,根据开发者文档,这次的 Gemini 3 Flash 一共有四档思考模式——minimal、low、medium、high

只需看一眼图片效果演进,你就知道这几档的区别了(doge):

One More Thing

有意思的是,Gemini 3 Flash 发布后,谷歌这边还立马开了一个《宝可梦:水晶版》的直播。

两位对战选手分别是 Gemini 3 Flash 和 Gemini 3 Pro。

虽然最终结果还没有出来,但初步来看 Gemini 3 Pro 暂处于领先地位。

有网友还惊喜发现,Gemini 3 Pro 在游戏中似乎已经展现出某种系统级思考能力。

感兴趣的童鞋也可以蹲一波结果了 ~ 以及坐等一个反转。

参考链接:

[ 1 ] https://x.com/OfficialLoganK/status/2001428651121025391?s=20

[ 2 ] https://x.com/simonw/status/2001424152763470238?s=2

[ 3 ] https://blog.google/products/gemini/gemini-3-flash/

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—    —

专属 AI 产品从业者的实名社群,只聊 AI 产品最落地的真问题   扫码添加小助手,发送「姓名 + 公司 + 职位」申请入群~

进群后,你将直接获得:

  最新最专业的 AI 产品信息及分析  

   不定期发放的热门产品内测码

   内部专属内容与专业讨论

点亮星标

科技前沿进展每日见

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

谷歌 ai 公式 鹈鹕
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论