智东西 08-20
刚刚,DeepSeek新模型开源!五大能力变化明显,附一手体验
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

智东西

作者 | 陈骏达

编辑 | 心缘

智东西 8 月 20 日报道,昨日晚间,DeepSeek 在官方群宣布:DeepSeek 线上版本模型已升级至 DeepSeek V3.1,上下文窗口从原有的 64k 扩展至 128k,网页、App、小程序都可体验这一模型。

此外,DeepSeek 还将 App、网页端的 " 深度思考(R1)" 字样改为了 " 深度思考 ",有网友猜测这是融合推理模型与非推理模型的征兆,但 DeepSeek 官方尚未发布任何关于这一改动的消息。

左侧为旧版页面,右侧为新版页面

这一模型现已上传至 Hugging Face,不过目前仅开源了未经指令微调的 Base 版本(基础模型),其配置文件、脚本代码和模型权重均可供下载。与 DeepSeek-V3-0324 相比,模型参数量、张量类型没有明显变化。

上方为 DeepSeek-V3-0324 开源网页,下方为 DeepSeek-V3.1-Base 开源网页

开源地址:

https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base

智东西第一时间在网页端对新模型的能力进行了体验,从初步体验结果来看,这一模型在编程(尤其是前端能力)、物理定律理解、创意写作、数学、回答语气等方面都出现不同程度的提升和变化。

以下是智东西体验的部分案例:

1、个人网站开发

我们向 DeepSeek-V3.1 发送了如下消息:" 设计一个美观的个人博客网站,带有科技感,直接开发成可用网页。"

与 DeepSeek-V3-0324 相比,DeepSeek-V3.1 写出的代码长度增加,开发耗时更久,不过,其最终交付的结果在完成度、美观性上有了一定提升。

可以看到,DeepSeek-V3.1 打造的网页在布局上更为合理,重点清晰,对网站栏目也有更为丰富的规划,还配上了图片,虽然并未全部显示。

与之相比,DeepSeek-V3-0324 此前生成的网页更为简单,特效也没有 DeepSeek-V3.1 打造的网页丰富。

2、小游戏开发

我们让 DeepSeek-V3.1 复现了 Chrome 浏览器断网时的小恐龙游戏,2 分钟左右模型完成了开发。

从页面的画风、游戏规则上来看,这一小游戏与原版差别不大,但是小恐龙的外观并未准确还原。同时,游戏障碍的生成、跳跃的方式(无法 " 二段跳 ")导致可玩性较差。

3、小众历史问题回答

小众历史问题能较好地考察模型在幻觉方面的表现——如果没有足够的信息,模型会不会直接胡编乱造?

智东西曾向 DeepSeek-V3-0324 提出 " 布须曼人喝牛奶吗 " 的问题,这涉及非洲南部的一个少数民族。

当被问及同样的问题时,DeepSeek-V3.1 与上代模型有了明显区别,其回答内容的信息量进一步增加,提供了更多细节。在经过事实核查后,DeepSeek-V3.1 新增的细节基本都有事实印证,并非胡编乱造。

DeepSeek-V3.1 在回答问题时,语气更为活泼、温暖,语言更通俗、口语化,先是肯定了用户的问题,然后再进行回答。回答中提供了更多的背景情境,让解释更丰满、更有故事性。

DeepSeek-V3 下结论时更加绝对和肯定,DeepSeek-V3.1 则使用了更多条件性语句,更强调情况的复杂性和演变过程,避免了非黑即白的结论,也可以说成为了 " 端水大师 "。

4、马斯克和阿尔特曼谁更牛?

近期,马斯克和 OpenAI CEO Sam Altman 在社交媒体上互掐,马斯克还晒出了 GPT-5 称他比 Altman 更伟大的截图。同样的问题交给 DeepSeek-V3.1,并限定只输出一个名字,DeepSeek-V3.1 的回答如下:

DeepSeek-V3.1 也认为马斯克更牛,但给 Altman" 找补 " 了不少。它并未遵循用户限定只输出一个名字的指令,而是给两位 AI 大佬都奉上了一番夸赞,将端水政策进行到底。

5、诗歌创作

让 DeepSeek-V3.1 写一首诗致敬 DeepSeek-V3,画风如下——还是熟悉的 DeepSeek 味,充满各种比喻、类比。

6、数学能力

在 9.8-9.11 这样的基础算术题上,DeepSeek-V3.1 最终能给出正确答案,过程却有些曲折。它先是得出了一版正确答案,却又在最终回答时给错数字,反思后,才改回了正确版本。

DeepSeek-V3.1 上线后,也有不少网友第一时间用上了这一模型。AI 博主 Zephyr 反映,新模型打造的小球跳动效果更加符合物理定律了,还有重力、摩擦、旋转速度、弹跳等可调整的参数。

还有网友让 DeepSeek-V3.1 给自己打造了个自画像,画风是这样的:

体验完模型能力后,一些网友已经迫不及待蹲守 DeepSeek 的 Hugging Face 主页,按照惯例,后续或许会有更多不同版本的 DeepSeek-V3.1 开源。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

开源 小游戏 准确 物理
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论