谷歌深夜放性价比“猛兽”！Gemini 3.1 Flash轻量版干翻前辈，价格打骨折

智东西

作者｜王涵

编辑｜李水青

智东西 3 月 4 日报道，今日凌晨，Gemini 3.1 Flash-Lite 正式发布，谷歌官方介绍该模型为 Gemini 3 系列中速度最快、性价比最高的模型，专为应对大规模开发者工作负载而设计。

根据 Artificial Analysis 基准测试，Gemini 3.1 Flash-Lite 的首 Token 响应速度较 2.5 Flash 提升 2.5 倍，每秒输出 Tokens 数达 389 个，排名第一，较 2.5 Flash 提升 45%，同时保持了与 2.5 Flash 相近或更高的生成质量。

Artificial Analysis 生成速度榜单（来源：Artificial Analysis）

与 2.5 Flash 生成速度对比

该模型在 Arena.ai 排行榜取得 1432 分的 Elo 评分，在推理基准测试 GPQA Diamond 中获得 86.9% 的分数，在多模态理解测试 MMMU Pro 的成绩达 76.8%，超越前代大型模型如 2.5 Flash。

基准测试成绩

Gemini 3.1 Flash-Lite 定价为输入每百万 tokens 0.25 美元（约合人民币 1.73 元），输出每百万 tokens1.5 美元（约合人民币 10.35 元）。

价格对比

即日起，Gemini 3.1 Flash-Lite 预览版将通过 Google AI Studio 的 Gemini API 向开发者开放，同时企业用户可通过 Vertex AI 平台使用。

除原始性能外，Gemini 3.1 Flash-Lite 在 AI Studio 和 Vertex AI 平台标配 " thinking levels" 调节功能，开发者可灵活控制模型在任务中的 " 思考深度 "。

Gemini 3.1 Flash-Lite 既能处理大规模成本优先任务，如批量翻译、内容审核等，也能处理如生成用户界面 / 仪表盘、创建模拟仿真、执行多步指令等需要深度推理的复杂场景。

例如，Gemini 3.1 Flash-Lite 可以在很短的时间内将数百个不同类别的商品填入一个电商网站的线框原型中。

该模型还可以用来创建一个能够为企业执行多种多步骤任务的 SaaS Agent。

Gemini 3.1 Flash-Lite 能够利用实时预报和历史数据，实时生成动态的气象仪表盘。

其也可以快速分析和排序大量的多模态内容，例如图像。

在谷歌的官宣推文下方，有不少外网网友都对这款模型的低成本、高效益表示赞叹。

有网友说：" 思维水平功能彻底改变了游戏。" 用户可以将简单的查询路由到低思维模式，将复杂的任务路由到高思维模式。这不仅节省了成本，还提高了架构的灵活性。

网友评论（来源：X）

更有网友直接将 Gemini 3.1 Flash-Lite 比喻成了 " 野兽 "，并称 " 这不仅仅是迭代，它是开发者的生产力倍增器。"

网友评论（来源：X）

结语：谷歌追求极致性价比

在这个追求降本增效的时代，Gemini 3.1 Flash-Lite 既要质量，又要速度，还要低成本，为 AI 应用的规模化落地提供了一种新解法。

Gemini 3.1 Flash-Lite 在价格上拉低了大模型高频调用的门槛。其可调节的 " 思考深度 "，也让开发者能根据任务的实际需要灵活分配计算资源，避免了不必要的账单。

从行业应用的角度看，这种 " 够用且不贵 " 的模型往往比一味追求参数规模的方案更具落地价值。谷歌本质上是在有限预算内，把 " 可用 " 和 " 够用 " 做了更务实的结合。

宙世代

一起剪

相关标签