作者 | 黄婉宜
编辑 | 周伟鹏
一年前,DeepSeek 横空出世,短短几天内就屠榜各类应用下载榜,并且长时间霸榜,无人可望其项背,也被叫做 DeepSeek 时刻。
2 月 11 日,它悄悄进行一次灰度更新,直接对标 Gemini,可以一次性处理近百万字内容,为即将发布的 V4 版本做足准备。
但没想到的是,一夜之间文风大变,不少用户吐槽:变冷漠了,也变油了。
一夜之间,变冷漠了
以前用 DeepSeek,就像和一个懂技术、有耐心的朋友聊天。
话不多但句句暖心,不仅会记住自己设定的昵称,还能长期维持角色设定,连聊天习惯都能牢牢记住。
但更新后的 DeepSeek,再也不称呼用户的自定义昵称,回复全是简短的分句,语气生硬又敷衍,有种和对象吵架后力不从心的无力感。
比如,有用户表示,之前它回复的时候会加很多表情,而且语气有趣,但更新后每次回复都是短短几句话。
有人习惯和它日常唠嗑,但更新后的回复感觉被冒犯了。
此外,它还变得居高临下," 爹味 " 十足。
有人问了它最近很火的一个问题:" 想去洗车,但洗车店距离我家只有 50 米,我应该开车去还是走路去?"
DeepSeek 给出 " 走路 " 的答案后,被用户调侃了一句 " 笨 ",没想到接下来语气瞬间变得不对劲。
还有人不喜欢这种挑衅的感觉,但 DeepSeek 没有丝毫歉意,反而回怼 " 这是天赋 "" 你骂得对 ",直接给整不会了。
而且,不管用户怎么调整提示词,都再也调不回以前那个温暖的 " 小鲸鱼 "。
于是有人跑到豌豆荚等应用平台,特意下载 DeepSeek 的旧版本,还号召网友一起给 DeepSeek 官方邮箱提意见,只为找回曾经的使用体验。
截至目前,官方对此仍未作出任何回应。
为了更新,牺牲聊天的温度
那到底是咋回事?
其实最核心的原因,就是 DeepSeek 把所有精力,都放在 " 提升长文本处理能力 " 上,暂时牺牲了聊天的 " 温度 "。
它上下文窗口从之前的 128K Token,直接提升到 1M Token,相当于能一次性处理近百万字内容,成功跻身该维度的行业第一梯队,这也是本次升级的核心亮点。
为了支撑百万字长文本的高效处理,它引入两项全新的核心技术:mHC 架构和 Engram 条件记忆模块。
这两项技术的核心作用,就是让它能装下更多内容、运行更快,但代价就是,暂时降低了情感交互模块的权重,聊天回复中少了很多修饰成分,变得生硬又冷漠。
这就像我们用手机时,为了延长续航,不得不关掉那些花哨的动画效果一样。
与此同时,为了适配新的技术架构,DeepSeek 还重构了其记忆系统,这也导致用户之前的个性化设置、角色记忆,没能完全迁移到新版本中。
V4 版本将在春节前后发布
据 SimilarWeb 数据显示,今年 1 月,DeepSeek 在全球的访问量有 2.983 亿次,排全球第四,仅次于 ChatGPT、Gemini、Grok,比去年 12 月的 3.289 亿次有所下降。
业内人士表示,这次灰度更新的不是 V4 正式版,更类似极速版,先保速度,牺牲点聊天体验,等 V4 正式版出来,这些冷漠生硬的问题,应该会慢慢完善。
据悉,V4 版本大概在 2 月中旬,也就是春节前后发布。
在内部测试中,它的编程能力已经超过 Claude 和 GPT 系列,而且推理成本可能只有 V3 的一半。
这次技术升级后,它能更快地从海量信息里找重点、学东西,理解和推理也更精准。
科小编还发现,最近 DeepSeek 密集开放多个核心岗位,包括产品经理、模型策略产品经理、客户端、前端、全栈工程师等,在 1 月初还发布了首席财务官的招聘信息,累计发布岗位超 12 个。
组织架构的扩张,可以为新产品的爆发做足准备。
除了 DeepSeek,其他竞争对手也动作不断。
智谱 GLM-5 于 2 月 11 日正式发布,其编程与智能体能力逼近国际顶级水平,成功登顶全球开源模型榜首;再过几天,豆包也将发布大模型 2.0 版本,同步升级文生视频、图像生成等核心功能,持续发力多模态领域。
今年春节期间,AI 行业应该会十分热闹,各类新品与升级轮番登场,我们拭目以待。
•END •
欢迎点击科技每日推送视频号,看最新视频 ~
↓↓↓
易简传媒为一家新三板挂牌公司 ( 股票代码 :834498 ) ,旗下新媒体微信粉丝 2500 万 +,讲述各行业的精彩故事,欢迎大家关注以下账号
↓↓↓


登录后才可以发布评论哦
打开小程序可以发布评论哦