钛媒体 App 9 月 12 日消息,外滩大会上,蚂蚁集团和中国人民大学联合研发原生 MoE 架构扩散语言模型(dLLM ) LLaDA-MoE,在约 20T 数据上完成了从零训练 MoE 架构的扩散语言模型,验证了工业级大规模训练的扩展性和稳定性。该模型将在近期完全开源。(广角观察)
钛媒体 App 9 月 12 日消息,外滩大会上,蚂蚁集团和中国人民大学联合研发原生 MoE 架构扩散语言模型(dLLM ) LLaDA-MoE,在约 20T 数据上完成了从零训练 MoE 架构的扩散语言模型,验证了工业级大规模训练的扩展性和稳定性。该模型将在近期完全开源。(广角观察)
登录后才可以发布评论哦
打开小程序可以发布评论哦