全天候科技 03-25
网友热评Deepseek新版V3:编程堪比最强AI,期待更强R2!
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

闷声干大事!DeepSeek 悄然发布 V3 新版本。

没有发布会,没有媒体宣传,3 月 24 日晚间,DeepSeek 就这样 " 悄悄地 " 将其最新版 V3-0324 模型上传至 Hugging Face。

根据社区测试和分析,此次更新虽然不是全新一代模型,仅属于 " 小版本升级 ",但其编程能力已达到与 Claude 3.7 Sonnet 相当的水平,在某些测试场景中甚至表现更佳。

有网友表示,新版 V3 较上一代来说,相当于 Sonnet 3.6 之于 Sonnet 3.5 的飞跃。

还有网友指出,新版 V3 模型的编码能力完全超预期,堪称目前最强大的免费 AI 模型。

负载均衡策略:更高效的 Moe 架构

据介绍,DeepSeek V3-0324 不是推理模型,采用了具有 6710 亿参数的专家混合模型(MoE),激活参数 370 亿。

为解决传统 MoE 模型中的负载不均衡问题,DeepSeek 团队引入了创新性的 " 偏差项 " 机制,旨在帮助 V3 在训练过程中有效平衡专家负载,提升模型性能。

此外,V3 还采用了节点受限的路由机制,以减少跨节点通信开销,提高训练效率,这对于大规模分布式训练至关重要。

这些技术创新使得新版 V3 在推理速度上实现了显著提升,使 V3 能在保持高效计算的同时,扩展到更多节点和专家。

编程能力再进化:一个提示词生成完整前端页面

根据国外开源评测平台 kcores-llm-arena 的最新测试数据,V3-0324 的代码能力达到了 328.3 分,超过了普通版的 Claude 3.7 Sonnet(322.3 分),接近思维链版本的 334.8 分。

这一成绩意味着,新版 V3 已成为目前编程能力最强的开源模型之一。

实际测试中,用户用一个简单的提示词就让 V3-0324 生成了整个登录页面。

还有用户直观地指出,只是点了两次 "continue",看看生成的代码量有多恐怖!

再加上不限时、完全免费的 " 杀手锏 ",可以说在前端开发层面,新版 V3 已经打败了 OpenAI 的 o1-pro 和 GPT-4.5。

新版 V3 的审美也很在线,用户用同样的 prompt 生成的网页画面,新版 V3 的设计明显比上一版要好看得多。

根据 prompt:" 写一个精美的落地页,内容是 deepseek v3 发布 ",这是上一版 V3 生成的网页:

新版 V3 的落地页则是这样:

开源协议升级:商业应用门槛大幅降低

不仅技术能力提升,DeepSeek 还将 V3-0324 的开源许可与 R1 一样更新为 MIT 开源许可,这意味着新版 V3 有着比初代 V3 更宽松的开源使用条件。

公开资料显示,MIT 许可以商业友好著称,使用该许可的项目可以与商业和专有软件自由集成。

这一变化对希望在商业项目中应用高性能 AI 模型的开发者和公司来说,可能是本次更新最具战略意义的改变。它进一步降低了 AI 技术的使用门槛,加速了技术普惠进程。

开源浪潮涌动,商业模型 " 瑟瑟发抖 "

DeepSeek V3-0324 的出现表明,开源 AI 模型正在以惊人的速度追赶甚至在某些方面超越顶级闭源商业模型。这种趋势正在给 OpenAI、Anthropic 等商业 AI 公司带来前所未有的压力。

正如海外用户所评论的:" 很高兴看到这些开源模型继续给大公司施压,促使它们以更低的成本构建更好的模型。"

随着 DeepSeek 这样的开源模型不断提升性能并放宽使用条件,AI 技术的民主化和普惠化进程正在加速,一个更加开放、创新的 AI 生态系统正在形成。

网友不禁感叹:DeepSeek 简直让科技普惠成为现实!

还有网友大胆猜测:新版 V3 来了,R2 还会远吗?

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

编程 开源 技术创新 美的
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论