元力社 03-27
DeepSeek小更新,拿下全球第一!
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

3 月 24 日晚,DeepSeek 小版本升级,新版本型号为 DeepSeek-V3-0324,同样免费且开源。

网友在下面唱起了歌。

现在登录 DeepSeek 官网,在对话页面后,关闭深度思考模式即可体验。

DeepSeek-V3-0324 与之前的 DeepSeek-V3 使用同样的 base 模型,仅改进了后训练方法。

虽然对于 DeepSeek 来说只是一次小升级,但还是给 AI 圈带来了亿点点的震撼。

据第三方 AI 基准测试和分析平台统计,DeepSeek-V3-0324 性能全球第一!

这也是第一次由开源模型,拿下第一。

这标志着开源模型首次成为领先的非推理模型。

开源 AI 的里程碑!

作为一个没有思维链的非推理模型,DeepSeek-V3-0324 在推理类任务、前端开发、中文写作、中文搜索等功能上,均较前一代有明显提升。

尤其是代码和数学能力,已经超过 GPT-4.5。

网友直接替奥尔特曼回复:

苹果机器学习工程师 Awni Hannun,已经在 Mac Studio512GB M3 Ultra 上成功部署,实现了超过 20 token/s 的速度。

硅谷投资人 @AICapital 称其 " 改写行业游戏规则 "。

当前版本在 GitHub 星标数已达 38k(更新后日均 +2k),企业级 API 调用量周环比增长 170%,显示市场对「轻量化 + 商用友好」路线的强烈认可。

代码能力评测得分 328.3(Claude 3.7 为 322.3)。网友实测,可一次性生成 800 行无错代码,支持动态响应式布局和交互效果实现。

在 HTML 等代码前端任务上,新版 V3 模型生成的代码可用性更高,视觉效果也更加美观。

DeepSeek 新模型,已经完爆每月 200 美元会员费的 GPT-4.5。

在 KCORES 大模型竞技场中,新模型以 328.3 分排名第三,超过非推理版 Claude-3.7 Sonnet,推理速度更快。

Claude-3.7 Sonnet 是目前代码能力最强的大语言模型,不过为闭源模型,且每个月订阅费高达 20 美元。

在火星任务测试中,新模型图例均渲染正确,发射和返回窗口计算也有了很大进步,所有模型中位列第三。

而九大行星模拟测试中,DeepSeek-V3-0324 是测试的 25 个模型中唯一一个画了土环星的大模型,作出了完整的太阳系图。其他模型没画出土环星,这意味着没有写对地球轨道周期。

中文写作升级

在中文写作任务方面,新版 V3 模型,特别提升了中长篇文本创作的内容质量。

能力上的提升还不算完,DeepSeek 又带来了一次价格震撼。

新模型每百万 tokens 的输入成本仅为 0.14 美元,是 Claude-3.7 的 1/21;输出成本为 0.28 美元,是 Claude-3.7 的 1/53。

且 DeepSeek-V3-0324 开源免费,允许商业用途,这波太大气了。

来源:奇偶工作室

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

开源 ai 机器学习 投资人 效果
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论