ZAKER科技 2024-07-24
开源大模型新的里程碑!Llama 3.1模型准时发布
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

ZAKER 科技 7 月 24 日消息,今日凌晨,Meta 官方正式发布了 Llama 3.1 模型。

本次 Llama 3.1 模型共有三个版本,分别是 8B、70B 和 405B。

从基准测试结果来看,超大杯 Llama 3.1 405B 与 OpenAI 的 GPT-4o 和 Claude 3.5 Sonnet 在多个项目上能够媲美。

在 GSM8K 任务中,Llama 3.1 405B 得分 96.8,高于 GPT-4o 的 96.1 和 Claude 3.5 Sonnet 的 96.4。MATH 任务成绩仅次于 GPT-4o。这证明 Llama 3.1 405B 拥有很强的数学能力。

当然,Llama 3.1 模型的代码生成能力同样不俗。在评估 Python 生成的 HumanEval 和其它编程语言的 MBPP EvalPlus 测试中,8B 和 70B 继续大幅领先同级别模型,但大参数模型上表现最佳的还是 Claude 3.5 Sonnet。

从上述多项基准测试结果来看,Llama 3.1 模型的出现正在不断缩小开源大模型和闭源大模型之间的差距。

图源:网络

其中 Human Evaluation 主要用于评估模型在理解和生成代码、解决抽象逻辑问题方面的能力。在与其他大型模型的竞争中,Llama 3.1 405B 显得略胜一筹。

图源:网络

斯坦福大学计算机科学系和电子工程系副教授、人工智能实验室主任吴恩达(Andrew Ng)在社交媒体上称赞 "Meta 和 Llama 团队对开源的巨大贡献 "。 他表示: "Llama 3.1 增加了上下文长度和改进了功能,是送给每个人的奇妙礼物。 "

图源:网络

总的来说,Llama 3.1 模型有以下几个特点:

1. 包含 8B、70B 和 405B 三个尺寸,最大上下文提升到了 128K,支持多语言,代码生成性能优秀,具有复杂的推理能力;

2. 从基准测试结果来看,Llama 3.1 超过了 GPT-4 0125,与 GPT-4o、Claude 3.5 互有胜负;

3. 提供开放 / 免费的模型权重和代码,许可证允许用户进行微调,将模型蒸馏到其他形式,并支持在任何地方部署;

4. 提供 Llama Stack API,便于集成使用,支持协调多个组件,包括调用外部工具。

图源:网络

最后,Meta CEO 扎克伯格在今日长文中曾这样描述 Llama 3.1 模型," 我相信 Llama 3.1 版本将成为行业的一个转折点,大多数开发人员将开始转向主要使用开源技术,我期待这一趋势从现在开始持续发展 …… 共同致力于将 AI 的福祉带给全球的每一个人。"

参考资料:

《赶超 GPT-4o,最强大模型 Llama 3.1 405B 一夜封神,扎克伯格:开源引领新时代》

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论