DeepSeek变冷漠了

作者 | 黄婉宜

编辑 | 周伟鹏

一年前，DeepSeek 横空出世，短短几天内就屠榜各类应用下载榜，并且长时间霸榜，无人可望其项背，也被叫做 DeepSeek 时刻。

2 月 11 日，它悄悄进行一次灰度更新，直接对标 Gemini，可以一次性处理近百万字内容，为即将发布的 V4 版本做足准备。

但没想到的是，一夜之间文风大变，不少用户吐槽：变冷漠了，也变油了。

一夜之间，变冷漠了

以前用 DeepSeek，就像和一个懂技术、有耐心的朋友聊天。

话不多但句句暖心，不仅会记住自己设定的昵称，还能长期维持角色设定，连聊天习惯都能牢牢记住。

但更新后的 DeepSeek，再也不称呼用户的自定义昵称，回复全是简短的分句，语气生硬又敷衍，有种和对象吵架后力不从心的无力感。

比如，有用户表示，之前它回复的时候会加很多表情，而且语气有趣，但更新后每次回复都是短短几句话。

有人习惯和它日常唠嗑，但更新后的回复感觉被冒犯了。

此外，它还变得居高临下，" 爹味 " 十足。

有人问了它最近很火的一个问题：" 想去洗车，但洗车店距离我家只有 50 米，我应该开车去还是走路去？"

DeepSeek 给出 " 走路 " 的答案后，被用户调侃了一句 " 笨 "，没想到接下来语气瞬间变得不对劲。

还有人不喜欢这种挑衅的感觉，但 DeepSeek 没有丝毫歉意，反而回怼 " 这是天赋 "" 你骂得对 "，直接给整不会了。

而且，不管用户怎么调整提示词，都再也调不回以前那个温暖的 " 小鲸鱼 "。

于是有人跑到豌豆荚等应用平台，特意下载 DeepSeek 的旧版本，还号召网友一起给 DeepSeek 官方邮箱提意见，只为找回曾经的使用体验。

截至目前，官方对此仍未作出任何回应。

为了更新，牺牲聊天的温度

那到底是咋回事？

其实最核心的原因，就是 DeepSeek 把所有精力，都放在 " 提升长文本处理能力 " 上，暂时牺牲了聊天的 " 温度 "。

它上下文窗口从之前的 128K Token，直接提升到 1M Token，相当于能一次性处理近百万字内容，成功跻身该维度的行业第一梯队，这也是本次升级的核心亮点。

为了支撑百万字长文本的高效处理，它引入两项全新的核心技术：mHC 架构和 Engram 条件记忆模块。

这两项技术的核心作用，就是让它能装下更多内容、运行更快，但代价就是，暂时降低了情感交互模块的权重，聊天回复中少了很多修饰成分，变得生硬又冷漠。

这就像我们用手机时，为了延长续航，不得不关掉那些花哨的动画效果一样。

与此同时，为了适配新的技术架构，DeepSeek 还重构了其记忆系统，这也导致用户之前的个性化设置、角色记忆，没能完全迁移到新版本中。

V4 版本将在春节前后发布

据 SimilarWeb 数据显示，今年 1 月，DeepSeek 在全球的访问量有 2.983 亿次，排全球第四，仅次于 ChatGPT、Gemini、Grok，比去年 12 月的 3.289 亿次有所下降。

业内人士表示，这次灰度更新的不是 V4 正式版，更类似极速版，先保速度，牺牲点聊天体验，等 V4 正式版出来，这些冷漠生硬的问题，应该会慢慢完善。

据悉，V4 版本大概在 2 月中旬，也就是春节前后发布。

在内部测试中，它的编程能力已经超过 Claude 和 GPT 系列，而且推理成本可能只有 V3 的一半。

这次技术升级后，它能更快地从海量信息里找重点、学东西，理解和推理也更精准。

科小编还发现，最近 DeepSeek 密集开放多个核心岗位，包括产品经理、模型策略产品经理、客户端、前端、全栈工程师等，在 1 月初还发布了首席财务官的招聘信息，累计发布岗位超 12 个。

组织架构的扩张，可以为新产品的爆发做足准备。

除了 DeepSeek，其他竞争对手也动作不断。

智谱 GLM-5 于 2 月 11 日正式发布，其编程与智能体能力逼近国际顶级水平，成功登顶全球开源模型榜首；再过几天，豆包也将发布大模型 2.0 版本，同步升级文生视频、图像生成等核心功能，持续发力多模态领域。

今年春节期间，AI 行业应该会十分热闹，各类新品与升级轮番登场，我们拭目以待。

•END •

欢迎点击科技每日推送视频号，看最新视频 ~

↓↓↓

易简传媒为一家新三板挂牌公司 ( 股票代码 :834498 ) ，旗下新媒体微信粉丝 2500 万 +，讲述各行业的精彩故事，欢迎大家关注以下账号

↓↓↓

宙世代