快科技 3 月 28 日消息,日前,DeepSeek 宣布 DeepSeek V3 模型完成小版本升级,版本号为 DeepSeek-V3-0324。
27 日晚,摩尔线程宣布,其迅速响应并完成了对 DeepSeek-V3 的无缝升级,实现了零报错、零兼容性问题的光速部署。
摩尔线程表示,在 Deepseek-V3-0324 模型上的光速适配,再次有力验证了国产全功能 GPU 在推动大模型产业化落地方面的巨大潜力。
据了解,DeepSeek-V3-0324 模型参数从初代 V3 的 6710 亿小幅增至 6850 亿,依然采用混合专家 ( MoE ) 架构,每个 token 激活约 370 亿参数,在推理、编程、数学、中文处理等多个领域达到行业领先水平。
根据 DeepSeek 官方发布的测试报告,DeepSeek-V3-0324 在各项能力评测中表现出色。
DeepSeek-V3-0324 不仅全面超越 Claude-3.7-Sonnet 与 Qwen-Max 等同类型优质模型,更在数学、代码类等相关评测集上胜过了 GPT-4.5。
登录后才可以发布评论哦
打开小程序可以发布评论哦