驱动之家 03-09
网友实测DeepSeek V4 Lite能力:《三体》全文都塞下 很聪明
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

快科技 3 月 9 日消息,此前传闻 DeepSeek V4 在上周发布,遗憾的是这事也没有发生,目前 DeepSeek 依然是官网更新了一个小模型,被网友成为 DeepSeek V4 Lite。

DeepSeek V4 Lite 的参数量据说只有 2000 亿,相比 V3 版本的 6700 多亿小了很多,而传闻中的 DeepSeek V4 满血版参数量达到 1 万亿级别,因此这次的 DeepSeek V4 Lite 被认为是在做测试验证,方便后续微调。

DeepSeek V4 Lite 的官方介绍不多,提升的主要是上下文能力,从上代的 128K 提升到了 1M,虽然比有些 AI 大模型的 2M 上下文还差一些,但网友实测这个 1M 上下文是实打实的,实际上还不止。

当然,最受关注的还是 DeepSeek V4 Lite 的能力,之前已经有过不少测试,知乎网友给出的反馈还可以看到更多的。

网友 @帅得自然表示网页版的编程能力比之前强了 10 倍,几乎没幻觉了,而且扔给 1MB 的 txt 代码文本让它修改都能基本一次过,最多三次。

另一个网友 @起名困难症晚期提供了一个更好玩的测试,他扔给 DeepSeek V4 Lite 一个 2.9MB 的《三体》全集文档,但在其中随机加入了几个密钥,让 AI 给找出来,这是验证上下文能力的一个关键。

结果 DeepSeek V4 Lite 真的给找出来了,第一次有些顺序不对,但提醒之后就给出了更详细的说明,而且每个密钥的出现位置也给详细标明了。

《三体》全集大约 80 万字,虽然文字数并就是 AI 的上下文能力,但通过这个测试可以看出 DeepSeek V4 Lite 现在的体量已经可以处理百万级文本,再加上编程能力的大幅提升,实用性就强出太多了。

完整版的 DeepSeek V4 啥时候发布还是个迷,具体的能力当然也不好说,但是从现有的表现来看 DeepSeek V4 还是有不鸣则已一鸣惊人的能力,大家的期待值也是拉满的。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

三体 ai 编程 知乎
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论