快科技 4 月 2 日消息,开源 AI 大模型目前是中国科技公司主导,美国的科技巨头在 AI 时代基本转向了闭源,但为了不让中国公司完全占据市场,美国巨头也会象征性拿出开源大模型,谷歌的 Gemma 4 很快要发了。
Gemma 4 要发布的消息传了有段时间了,现在谷歌 Deepmind 创始人、CEO Demis Hassabis 也发推暗示——他的内容是 4 颗钻石,而 Gemma 大模型的名称就是来自拉丁语宝石 Gemma,因此这一暗示是非常明确了。

当前的 Gemma 3 大模型是去年 3 月份发布的,基于谷歌的 Gemini 2.0,正好一年了,也是时候发布了,Gemini 3.0 发布半年多了,甚至 Gemini 3.1 都已经发布了,这个时间差也不会影响谷歌的闭源大模型收费赚钱。
最让人关心的还是 Gemma 4 大模型的能力,当前的 Gemma 3 算是轻量级的,最大参数量也就 27B,可以用单卡 GPU 运行,也支持多模态能力,能力当然没法跟谷歌主力大模型相比,但在开源社区口碑还是不错的。
Gemma 4 此前传闻除了之前的小参数量模型之外,还会增加一个 120B 参数的新模型,是上代的 4 倍规模,但会采用 MoE 架构,激活参数 15B,可以降低要求,依然能本地离线运行。

让谷歌自己的 Gemini 分析了下 Gemma 4 的能力预测,它给的答案很好很强大,甚至连深度思考能力也给了,上下文能力翻 1-2 倍,具备执行复杂逻辑能力。
不过也别期待太高,谷歌、Meta 等美国科技公司做开源大模型并不会有多高优先级,也不会让开源模型能力影响到自己赚钱,Gemma 4 能在本地离线运行的话,能力上限就不会太高,同参数量下也很难说能比得过国产开源的大模型。



登录后才可以发布评论哦
打开小程序可以发布评论哦