【太平洋科技快讯】Meta 近日推出了其最新的 Llama 4 系列人工智能模型,包括 Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth。这一系列模型首次采用了混合专家 ( MoE ) 架构,通过将任务分配给多个专注于特定任务的 " 专家 " 子模型,显著提升了训练和推理的效率。
据悉,Llama 4 系列模型经过大量未标注的文本、图像和视频数据的训练,具备了广泛的视觉理解能力。它们能够处理和整合各种类型的数据,包括文本、视频、图像和音频,并在这些格式之间实现内容转换,展现了强大的多模态处理能力。
Llama 4 系列模型具备非常长的上下文窗口,其中 Llama 4 Maverick 的上下文窗口为 100 万个 token,Llama 4 Scout 更是达到 1000 万个 token。这一特点使得它们能够处理长达 7500 页的文本输入,为医学、科学、工程、数学和文学等信息密集型领域提供了强大的支持。
目前,Llama 4 Scout 和 Llama 4 Maverick 已在 Llama.com 网站、Meta 的合作伙伴处以及 WhatsApp、Messenger、Instagram Direct 等平台上公开获取,而 Llama 4 Behemoth 仍在训练中。
Llama 4 系列模型参数:
Llama 4 Scout:配备 170 亿活跃参数和 16 个 " 专家 " 模型,总参数达 1090 亿。该模型擅长文档总结和代码推理,且可在单个 NVIDIA H100 GPU 上运行,适用于高效信息提取和复杂逻辑推理任务。
Llama 4 Maverick:拥有 170 亿活跃参数和 128 个 " 专家 " 模型,总参数量高达 4000 亿。在创意写作、翻译和图像处理等方面表现优异,超越了许多竞品模型。
Llama 4 Behemoth:作为系列中最强大的模型,具备 2880 亿活跃参数和接近 2 万亿的总参数。在多个 STEM 基准测试中表现卓越,展现了强大的问题解决能力。
登录后才可以发布评论哦
打开小程序可以发布评论哦