驱动之家 04-18
谷歌首推Gemini 2.5 Flash:成本爆降600%
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

快科技 4 月 18 日消息,据报道,谷歌发布了突破性混合推理模型 Gemini 2.5 Flash,该模型创新性地引入可调节 " 思考预算 " 功能,在保持高性能的同时显著降低使用成本。

在闭源思考模式下,其成本仅为 0.6 美元 / 百万 tokens,相比全功能思考模式(3.5 美元 / 百万 tokens)大幅降低 600%。值得注意的是,即便在基础模式下运行,其性能依然超越前代 Gemini 2.0 Flash。

性能表现方面,Gemini 2.5 Flash 在大模型排行榜中以 1392 分 ELO 评分高居第二,仅次于 GPT-4.5-preview,与 Grok-3 表现相当。

具体任务测试中,该模型展现出显著优势:在 GPQA 知识问答中,24K 思考预算可带来 6% 的性能提升;在 LiveCodeBench 代码基准测试中,16K 思考预算时达到最佳表现。

对比测试结果显示,Gemini 2.5 Flash 在多模态推理和数学任务上明显优于 Claude 3.7 Sonnet,综合性能与 OpenAI 最新 o4-mini 模型不相上下。在模拟人类综合能力的 " 人类最后一次考试 " 基准测试中,该模型以 12.1% 的高分位列第二,再次印证其强大实力。

此次发布的 Gemini 2.5 Flash 通过创新的 " 思考预算 " 机制,在性能与成本之间实现了突破性平衡,为 AI 应用开发提供了更灵活、更经济的选择。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

flash 谷歌 考试 数学
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论