快科技 3 月 1 日消息,据国外媒体最新报道,DeepSeek 计划于下周正式发布全新的多模态大语言模型 V4 版本。
这款备受期待的新模型将原生支持图片、视频以及文本的生成功能。这也是 DeepSeek 自今年 1 月推出 R1 推理模型以来的首次重大版本迭代,有望进一步填补国内低成本开源模型的需求。
然而,比技术升级更引人注目的是 DeepSeek 在这一版本测试阶段采取的特殊举措。据知情人士透露,DeepSeek 已经向包括华为在内的国内硬件供应商提供了 V4 模型的测试权限。
令人意外的是,DeepSeek 此次打破了行业惯例,并未向英伟达和 AMD 这两家全球领先的芯片供应商提供预发布版本的访问权限,这一策略在业内引发了广泛讨论。
在人工智能开发领域,开发者通常会与领先的芯片制造商共享模型预发布版,以确保软件能在主流硬件上高效运行。DeepSeek 此前也曾与英伟达技术团队保持过紧密合作。
此次 DeepSeek 选择优先支持国产硬件,却将英伟达和 AMD 拒之门外,背后的策略考量非常耐人寻味。
通过这种差异化的授权方式,以华为为代表的中国芯片制造商能够获得宝贵的领先时间。他们可以提前数周针对自家处理器进行软件层面的深度优化,从而在模型适配与运行效率上占据先机。



登录后才可以发布评论哦
打开小程序可以发布评论哦