快科技拟 8 月 15 日消息,GPT5 都已经发布了,为什么 DeepSeek R2 迟迟没有来呢?
据国内媒体报道称,DeepSeek 在使用昇腾芯片训练 R2 的过程中遇到了持续的技术问题,促使其使用英伟达芯片进行训练,并使用华为芯片进行推理。
报道中提到,华为已派了一个工程师团队前往 DeepSeek,帮助使用昇腾芯片开发 R2 模型,不过目前进展已经缓慢,遇到的问题比较多(应该主要是散热方面所致)。
之所以进展缓慢,主要因昇腾平台在训练任务中的稳定性不足、软硬件支持不完善,以及芯片之间通信速度较慢等。
不过,DeepSeek 仍在与华为进行合作,以确保其模型与昇腾兼容以完成推理任务。
此外,对于 R2 模型为何迟迟未能面世,还有消息称尽管研发团队已投入数月高强度开发,但公司 CEO 梁文锋对新模型的性能表现尚不满意,同时 DeepSeek 公司或面临算力储备紧缺的困境。
登录后才可以发布评论哦
打开小程序可以发布评论哦