驱动之家 01-14
印度也有自己的“DeepSeek”大模型Alpie了:性能超越GPT-4o、Claude等
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

快科技 1 月 14 日消息,目前 AI 技术的领头羊是中美两国,但其他国家也不想缺席这场被视为有史以来最大的科技革命的盛宴,韩国喊出了要做全球第三 AI 大国,印度当然也想分一杯羹。

最近印度 169PI 公司发布的 Alpie 大模型引起了注意,它被称为印度版的 DeepSeek,目前已经开源在多个平台,还开放了 API,在线体验的话可以到这个页面体验下。

这款模型只是一个 320 亿参数的小模型,主打 4bit 量化,但 AI 榜单上表现非常强,GSM8K 数学榜单上超过了 DeepSeek V3,跟 GPT-4o、Qwen 2.5-30B 一个档次,略低于 Cluade 3.5。

在 SWE 软件工程榜单上则力压其他大模型,包括 Claude 3.5 等,表现非常强。

BBH 榜单上也超过了 GPT-4o、Qwen 2.5、Calude 3.5 等大模型,略低于 DeepSeek V3。

不过 Alpie 的榜单表现很好很强大,但它的争议不少,因为它其实不是印度工程师自己训练出来的大模型,而是 DeepSeek-R1-Distill-Qwen-32B 二次深度开发的,是中国开源大模型基础上蒸馏 + 量化出来的。

这样做的好处不少,比如大幅降低了成本,只有 GPT-4o 的 1/10,显存占用降低了 75%,16-24GB 的显卡就能流畅运行。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 印度 开源 韩国 数学
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论