驱动之家 昨天
新一代旗舰级人工智能模型!曝DeepSeekV4春节前后发布
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

快科技 1 月 10 日消息,"The Information" 报道,两位直接知情人士透露,深度求索(DeepSeek)预计将在未来几周内推(2 月中旬农历新年前后)出代号为 V4 的新一代旗舰级人工智能模型,该模型主打强劲的代码生成能力。

据悉,DeepSeekV4 在超长代码提示词的处理与解析上实现了关键突破,支持百万级 tokens 上下文窗口。

可一次性消化整个中型项目的代码库、技术文档与需求说明,精准理解跨文件依赖关系,解决复杂软件项目开发中的上下文断裂问题,这对开发大型系统、重构遗留代码、理解复杂技术文档具有革命性价值。

V4 还解决了 AI 训练中的一个常见难题 ——数据模式理解能力在训练全阶段无衰减,这与传统模型随着训练次数增加性能下降的情况形成鲜明对比。

该突破使模型能更高效地从海量数据中学习,摆脱单纯记忆数据的局限,形成更深刻的抽象理解能力。

DeepSeek 员工基于公司内部基准开展的初步测试显示,该模型在代码生成领域的表现优于 Anthropic、Claude、生成式预训练变换器系列(OpenAI GPT)等现有主流模型。

还有行业消息称,V4 可能采用全新的 mHC 架构,具备更好的并行计算效率和国产芯片适配能力,有望降低部署成本,提高推理速度,为大规模商业化应用奠定基础。

值得一提的是,就在本月 4 日,DeepSeek 在 arXiv 上更新了 R1 论文,页数从 22 页扩展到 86 页,新增完整训练管线拆解、20 多个评测基准的详细数据,被视为给 V4 的发布做好了技术准备。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

人工智能 the 芯片
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论