终于,Gemini 3 正式发布。
虽然不想做炸裂标题党,
但还是想说一句,
这特么才是真的全球最强。
讲真,
很少看到有这样一个模型备受大家期待,
在它正式发布前几周,
已经真真假假的消息传播了不少,
用全 AI 圈为它发癫来形容
真的一点不为过。
光看 Benchmark 跑分,
基本屠榜。

20 项 Benchmark,19 项领先于 Claude Sonnet 4.5 和 GPT-5.1。
唯一一项稍稍落后的是这项代码任务,SWE-Bench Verified。
所以, Anthropic 到底给 Claude 用了什么魔法。。。

但是尼玛,这里可是有 20 项 Benchmark,
包含了多模态图像、视频、数学、工具调用、推理、代码、长文本等等
它不像 Claude 那样只能做代码,也不像 GPT-5.1 所展示的那样平庸的全面,
它做到的是全面又极致的强。
在 LM Arena 上,
也是几乎所有主流的榜单都是第一。

文本、视觉、网页开发、代码、数学等都是第一,断档领先。

除了这些,
他们还借着这次 Gemini 3 的发布,
也同时发了一个 IDE,
AntiGravity。
可以看得出来,
这次他们是真的很自信了。
我其实之前 Gemini 3 偷跑的时候,
已经测过两次,
提前感受过它的牛逼,
但还是想再给大家带来一些不一样的东西。
一波实测 SVG
过往静态的 SVG 其实我觉得对 Gemini 3 来说没什么难度了。
现在你可以很轻松的让模型做出一些 SVG 动画,

特别是做一些科普片段 ,
再比如做一个滚动洗衣机的原理,

我其实给了一个挺复杂的提示词,
它完成的非常好,
就属于一看就明白原理的那种。
我还让它试试生成一个可以 360 度拖拽的 Macbook Pro SVG 动画。

非常离谱的是,
它不仅把苹果标给还原了,
甚至还特么把 MacBook Pro 的刘海屏也给还原了,
以及还有 MacBook Pro 那标志性的太空灰也做出来了。
也真的太细了。。。

网页设计
这次 Gemini 3 提升最大的就是前端网页的能力,
特别是整个页面的美观程度。
Try a new version with not gradients and super super high end and beautiful, unique and modern design

这个效果真的绝了,
再看一个例子:
Creat an esthetic website for criminal minds characters.

一句话生成一个高端网页真的不是梦。
除了 " 简简单单 " 的网页生成,
多模态上,Gemini 3 的能力也相当牛逼。
比如,现在让它做网页复刻就会容易的多。
先复刻一个 B 站首页试试。
我直接把 B 站首页截图喂给 Gemini 3.
prompt 很简单,直接跟它说复刻就好
使用 HTML,CSS,JS 复刻一个 B 站首页

除了那些封面图,基本该有的元素一个不落下。
再来看一个赛博知识卡片的展现,
就选用 Gemini 3 发布的官方文档。
**1. 目标 ( Objective ) **
构建一个 ** 赛博风交互式信息图 **,聚焦于用户上传的信息内容。重点是 ** 动态视觉冲击与光感 UI**。
**2. 核心主题与风格 ( Core Theme & Style ) **
主题:AI、虚拟城市、未来经济。
风格:闪烁、锐利、发光。
关键美学:** 霓虹线条与网格矩阵 **,界面像透明玻璃层叠;
次要特征:** 动态粒子与渐变流动 **,暗示能量流。
**3. 布局与结构 ( Layout & Structure ) **
- 顶部为 LOGO 与系统状态栏(时间、电量、连接状态)。
- 主体为三行卡片区域:统计面板、对比分析、结论可视图。
- 每个卡片都有 hover 高亮和淡入动画。
- 页脚包含霓虹描边的 CTA 按钮和版权。
**4. 设计元素与视觉细节 ( Design Elements & Visual Details ) **
- 背景:深蓝到紫的渐变 ( #05091a → #1a1245 ) 。
- 主色:电蓝 ( #3b82f6 ) 、荧光紫 ( #a855f7 ) 、酸绿 ( #84cc16 ) 。
- 光效:外发光、内阴影、玻璃模糊 ( backdrop-filter: blur ) 。
- 字体:Orbitron / Roboto Mono。
- 线条动画:使用 keyframes 产生呼吸灯效果。
- 圆角极小,整体几何感强。
**5. 最终交付 ( Final Delivery ) **
单文件 HTML,含少量内嵌 CSS 动画。重点在用户上传的信息内容的展现以及视觉动效与未来科技氛围。

效果不错,而且关键有效信息都提取出来了。
视频理解
我个人最最最喜欢 Gemini 的能力,
视频理解,
这个绝对是比任何其他模型都牛逼。
最直接有效的,
让它根据视频内容,来生成一个知识卡片。
测试的视频链接在这儿:https://www.youtube.com/watch?v=emWgP_fr04k

我觉得它这个比较牛逼的是,
不止把视频内容中的关键内容提取出来,
还提取出了视频中的主要人物,还有视频的链接可以进行跳转。
上下文窗口长就是任性啊,
这个视频长 40 多分钟,
Gemini 处理起来一点问题都没有。
再看一个视频理解经常会用到的场景,
短剧拆剧。
这个 prompt 有点长,就不放在这儿了。
感兴趣的小伙伴可以后台私信我。
视频选用的是短剧《桃花马上请长缨》第 1 集,
我放在这里了,
下面是 Gemini 3 Pro 的回答,
大家可以感受一下这个拆剧的细节程度:
[
{
"time_range": "00:00:00-00:00:36",
"time": " 日 ",
"location": " 战场 ",
"roles": [
" 宋惜惜 ",
" 敌军 "
] ,
"dialogs": [
{
"desc": [
" 战场上硝烟弥漫,遍地尸体与燃烧的战火,气氛肃杀。",
" 宋惜惜身披铠甲,满脸血污,骑着白马在战场上冲杀,眼神坚毅。",
" 屏幕左侧出现字幕介绍:镇北侯之女 宋惜惜。",
" 宋惜惜挥舞长枪,击退围攻的敌军,回忆起母亲的嘱托。"
] ,
"sub_dialog": [
{
"role": null,
"text": " 惜惜,你阿父阿兄已战死沙场。阿母要你隐藏军功,不得杀敌为将。以后如上京贵女一样,觅个良婿,成婚生子,安稳一生。"
},
{
"role": " 宋惜惜 ",
"text": " 阿母,若女儿能活着带回阿父阿兄,便答应你。嫁良婿,安稳一生。"
}
]
},
{
"desc": [
" 宋惜惜骑马冲出城门,身后是紧追不舍的敌军。",
" 画面定格,出现剧名:《桃花马上请长缨》。"
] ,
"sub_dialog": [ ]
}
]
},
{
"time_range": "00:00:36-00:01:17",
"time": " 夜 ",
"location": " 文熙居外 ",
"roles": [
" 宋惜惜 ",
" 战北望 "
] ,
"dialogs": [
{
"desc": [
" 镜头转至夜晚,府邸挂着红绸,牌匾上写着 " 文熙居 "。",
" 宋惜惜身着红色嫁衣,为一身戎装即将出征的战北望整理盔甲。",
" 战北望深情地抓住宋惜惜的手,看着她。"
] ,
"sub_dialog": [
{
"role": " 战北望 ",
"text": " 我战北望只爱惜惜一人,绝不纳妾。等我平安归来,定与夫人厮守一生。"
}
]
},
{
"desc": [
" 宋惜惜眼中含泪,看着战北望,神情温柔而坚定。",
" 战北望将宋惜惜拥入怀中,两人在红绸下相拥。"
] ,
"sub_dialog": [
{
"role": " 宋惜惜 ",
"text": " 夫君放心,我一定会替你照顾好阿母,守好将军府。等夫君平安归来。"
}
]
}
]
},
{
"time_range": "00:01:17-00:02:06",
"time": " 日 ",
"location": " 文熙居外 ",
"roles": [
" 宋惜惜 ",
" 战北望 ",
" 侍女 "
] ,
"dialogs": [
{
"desc": [
" 屏幕出现字幕 " 翌年 "。",
" 宋惜惜身着淡青色常服,带着侍女站在文熙居门口迎接。",
" 战北望身穿铠甲归来,神色冷淡,与之前的深情判若两人。"
] ,
"sub_dialog": [
{
"role": " 战北望 ",
"text": " 惜惜,我与易昉在战场上情投意合,特以军功求来赐婚。如今赐婚旨意已下,她会以平妻入门,与你无分大小。"
}
]
},
{
"desc": [
" 宋惜惜听到这番话,难以置信地看着战北望,眼中满是震惊和失望。"
] ,
"sub_dialog": [
{
"role": " 宋惜惜 ",
"text": " 夫君可曾记得,你答应过我,绝不纳妾。"
}
]
},
{
"desc": [
" 战北望表情淡漠,甚至带着一丝不耐烦,丝毫没有愧疚之意。"
] ,
"sub_dialog": [
{
"role": " 战北望 ",
"text": " 那样的话便忘了吧。当时我不懂情爱,只是觉得你合适当我的夫人。直到我遇到了阿昉,她和我见过的所有女子都不一样,我爱极了她。"
},
{
"role": " 宋惜惜 ",
"text": " 我要见易昉将军。"
}
]
}
]
}
]
这个 case 我其实 1 年前测过,
那个时候效果真的不行。
经常内容少读取,或者出现台词和人物匹配不上的情景,导致业务没法使用。
但今天 Gemini 3 的这个效果,
真的好到夸张。。。
写在最后
坦白说,
一篇文章根本无法尽善尽美的体现 Gemini3 的全部能力,
后面有机会还会多测点不同维度,
但希望这几个 case 能给正在看文章的你,
带来一些不一样的感受。
我自己也从没这么期待过一个模型,
但是之前,
我其实一直不知道我期待的是什么,
是一个更牛逼的模型?
还是只是 Benchmark 刷榜的狂欢?
但今天正式发布后,
测完我才明白
这份期待早已超越模型本身。
我觉得当终局的钟声在 AI 的圣殿响起,
那个最有资格推开 ASI 大门的声音,
大概率,
也会从 Google 这里传出。


