终于,Gemini 3 正式发布。
虽然不想做炸裂标题党,
但还是想说一句,
这特么才是真的全球最强。
讲真,
很少看到有这样一个模型备受大家期待,
在它正式发布前几周,
已经真真假假的消息传播了不少,
用全 AI 圈为它发癫来形容
真的一点不为过。
光看 Benchmark 跑分,
基本屠榜。

20 项 Benchmark,19 项领先于 Claude Sonnet 4.5 和 GPT-5.1。
唯一一项稍稍落后的是这项代码任务,SWE-Bench Verified。
所以, Anthropic 到底给 Claude 用了什么魔法。。。

但是尼玛,这里可是有 20 项 Benchmark,
包含了多模态图像、视频、数学、工具调用、推理、代码、长文本等等
它不像 Claude 那样只能做代码,也不像 GPT-5.1 所展示的那样平庸的全面,
它做到的是全面又极致的强。
在 LM Arena 上,
也是几乎所有主流的榜单都是第一。

文本、视觉、网页开发、代码、数学等都是第一,断档领先。

除了这些,
他们还借着这次 Gemini 3 的发布,
也同时发了一个 IDE,
AntiGravity。
可以看得出来,
这次他们是真的很自信了。
我其实之前 Gemini 3 偷跑的时候,
已经测过两次,
提前感受过它的牛逼,
但还是想再给大家带来一些不一样的东西。
一波实测 SVG
过往静态的 SVG 其实我觉得对 Gemini 3 来说没什么难度了。
现在你可以很轻松的让模型做出一些 SVG 动画,

特别是做一些科普片段 ,
再比如做一个滚动洗衣机的原理,

我其实给了一个挺复杂的提示词,
它完成的非常好,
就属于一看就明白原理的那种。
我还让它试试生成一个可以 360 度拖拽的 Macbook Pro SVG 动画。

非常离谱的是,
它不仅把苹果标给还原了,
甚至还特么把 MacBook Pro 的刘海屏也给还原了,
以及还有 MacBook Pro 那标志性的太空灰也做出来了。
也真的太细了。。。

网页设计
这次 Gemini 3 提升最大的就是前端网页的能力,
特别是整个页面的美观程度。
Try a new version with not gradients and super super high end and beautiful, unique and modern design

这个效果真的绝了,
再看一个例子:
Creat an esthetic website for criminal minds characters.

一句话生成一个高端网页真的不是梦。
除了 " 简简单单 " 的网页生成,
多模态上,Gemini 3 的能力也相当牛逼。
比如,现在让它做网页复刻就会容易的多。
先复刻一个 B 站首页试试。
我直接把 B 站首页截图喂给 Gemini 3.
prompt 很简单,直接跟它说复刻就好
使用 HTML,CSS,JS 复刻一个 B 站首页

除了那些封面图,基本该有的元素一个不落下。
再来看一个赛博知识卡片的展现,
就选用 Gemini 3 发布的官方文档。
**1. 目标 ( Objective ) **
构建一个 ** 赛博风交互式信息图 **,聚焦于用户上传的信息内容。重点是 ** 动态视觉冲击与光感 UI**。
**2. 核心主题与风格 ( Core Theme & Style ) **
主题:AI、虚拟城市、未来经济。
风格:闪烁、锐利、发光。
关键美学:** 霓虹线条与网格矩阵 **,界面像透明玻璃层叠;
次要特征:** 动态粒子与渐变流动 **,暗示能量流。
**3. 布局与结构 ( Layout & Structure ) **
- 顶部为 LOGO 与系统状态栏(时间、电量、连接状态)。
- 主体为三行卡片区域:统计面板、对比分析、结论可视图。
- 每个卡片都有 hover 高亮和淡入动画。
- 页脚包含霓虹描边的 CTA 按钮和版权。
**4. 设计元素与视觉细节 ( Design Elements & Visual Details ) **
- 背景:深蓝到紫的渐变 ( #05091a → #1a1245 ) 。
- 主色:电蓝 ( #3b82f6 ) 、荧光紫 ( #a855f7 ) 、酸绿 ( #84cc16 ) 。
- 光效:外发光、内阴影、玻璃模糊 ( backdrop-filter: blur ) 。
- 字体:Orbitron / Roboto Mono。
- 线条动画:使用 keyframes 产生呼吸灯效果。
- 圆角极小,整体几何感强。
**5. 最终交付 ( Final Delivery ) **
单文件 HTML,含少量内嵌 CSS 动画。重点在用户上传的信息内容的展现以及视觉动效与未来科技氛围。

效果不错,而且关键有效信息都提取出来了。
视频理解
我个人最最最喜欢 Gemini 的能力,
视频理解,
这个绝对是比任何其他模型都牛逼。
最直接有效的,
让它根据视频内容,来生成一个知识卡片。
测试的视频链接在这儿:https://www.youtube.com/watch?v=emWgP_fr04k

我觉得它这个比较牛逼的是,
不止把视频内容中的关键内容提取出来,
还提取出了视频中的主要人物,还有视频的链接可以进行跳转。
上下文窗口长就是任性啊,
这个视频长 40 多分钟,
Gemini 处理起来一点问题都没有。
再看一个视频理解经常会用到的场景,
短剧拆剧。
这个 prompt 有点长,就不放在这儿了。
感兴趣的小伙伴可以后台私信我。
视频选用的是短剧《桃花马上请长缨》第 1 集,
我放在这里了,
下面是 Gemini 3 Pro 的回答,
大家可以感受一下这个拆剧的细节程度:
[
{
"time_range": "00:00:00-00:00:36",
"time": " 日 ",
"location": " 战场 ",
"roles": [
" 宋惜惜 ",
" 敌军 "
] ,
"dialogs": [
{
"desc": [
" 战场上硝烟弥漫,遍地尸体与燃烧的战火,气氛肃杀。",
" 宋惜惜身披铠甲,满脸血污,骑着白马在战场上冲杀,眼神坚毅。",
" 屏幕左侧出现字幕介绍:镇北侯之女 宋惜惜。",
" 宋惜惜挥舞长枪,击退围攻的敌军,回忆起母亲的嘱托。"
] ,
"sub_dialog": [
{
"role": null,
"text": " 惜惜,你阿父阿兄已战死沙场。阿母要你隐藏军功,不得杀敌为将。以后如上京贵女一样,觅个良婿,成婚生子,安稳一生。"
},
{
"role": " 宋惜惜 ",
"text": " 阿母,若女儿能活着带回阿父阿兄,便答应你。嫁良婿,安稳一生。"
}
]
},
{
"desc": [
" 宋惜惜骑马冲出城门,身后是紧追不舍的敌军。",
" 画面定格,出现剧名:《桃花马上请长缨》。"
] ,
"sub_dialog": [ ]
}
]
},
{
"time_range": "00:00:36-00:01:17",
"time": " 夜 ",
"location": " 文熙居外 ",
"roles": [
" 宋惜惜 ",
" 战北望 "
] ,
"dialogs": [
{
"desc": [
" 镜头转至夜晚,府邸挂着红绸,牌匾上写着 " 文熙居 "。",
" 宋惜惜身着红色嫁衣,为一身戎装即将出征的战北望整理盔甲。",
" 战北望深情地抓住宋惜惜的手,看着她。"
] ,
"sub_dialog": [
{
"role": " 战北望 ",
"text": " 我战北望只爱惜惜一人,绝不纳妾。等我平安归来,定与夫人厮守一生。"
}
]
},
{
"desc": [
" 宋惜惜眼中含泪,看着战北望,神情温柔而坚定。",
" 战北望将宋惜惜拥入怀中,两人在红绸下相拥。"
] ,
"sub_dialog": [
{
"role": " 宋惜惜 ",
"text": " 夫君放心,我一定会替你照顾好阿母,守好将军府。等夫君平安归来。"
}
]
}
]
},
{
"time_range": "00:01:17-00:02:06",
"time": " 日 ",
"location": " 文熙居外 ",
"roles": [
" 宋惜惜 ",
" 战北望 ",
" 侍女 "
] ,
"dialogs": [
{
"desc": [
" 屏幕出现字幕 " 翌年 "。",
" 宋惜惜身着淡青色常服,带着侍女站在文熙居门口迎接。",
" 战北望身穿铠甲归来,神色冷淡,与之前的深情判若两人。"
] ,
"sub_dialog": [
{
"role": " 战北望 ",
"text": " 惜惜,我与易昉在战场上情投意合,特以军功求来赐婚。如今赐婚旨意已下,她会以平妻入门,与你无分大小。"
}
]
},
{
"desc": [
" 宋惜惜听到这番话,难以置信地看着战北望,眼中满是震惊和失望。"
] ,
"sub_dialog": [
{
"role": " 宋惜惜 ",
"text": " 夫君可曾记得,你答应过我,绝不纳妾。"
}
]
},
{
"desc": [
" 战北望表情淡漠,甚至带着一丝不耐烦,丝毫没有愧疚之意。"
] ,
"sub_dialog": [
{
"role": " 战北望 ",
"text": " 那样的话便忘了吧。当时我不懂情爱,只是觉得你合适当我的夫人。直到我遇到了阿昉,她和我见过的所有女子都不一样,我爱极了她。"
},
{
"role": " 宋惜惜 ",
"text": " 我要见易昉将军。"
}
]
}
]
}
]
这个 case 我其实 1 年前测过,
那个时候效果真的不行。
经常内容少读取,或者出现台词和人物匹配不上的情景,导致业务没法使用。
但今天 Gemini 3 的这个效果,
真的好到夸张。。。
写在最后
坦白说,
一篇文章根本无法尽善尽美的体现 Gemini3 的全部能力,
后面有机会还会多测点不同维度,
但希望这几个 case 能给正在看文章的你,
带来一些不一样的感受。
我自己也从没这么期待过一个模型,
但是之前,
我其实一直不知道我期待的是什么,
是一个更牛逼的模型?
还是只是 Benchmark 刷榜的狂欢?
但今天正式发布后,
测完我才明白
这份期待早已超越模型本身。
我觉得当终局的钟声在 AI 的圣殿响起,
那个最有资格推开 ASI 大门的声音,
大概率,
也会从 Google 这里传出。


登录后才可以发布评论哦
打开小程序可以发布评论哦