钛媒体 App 9 月 9 日消息,阿联酋穆罕默德 · 本 · 扎耶德人工智能大学与 G42 共同推出低成本推理模型 "K2 Think",宣称仅需 320 亿参数,性能超越规模大 20 倍的模型;该模型基于阿里巴巴开源 Qwen 2.5 构建,采用长链式思维监督微调和推理阶段扩展等方法提升性能,为数学、科学等特定应用领域而设计。(广角观察)
钛媒体 App 9 月 9 日消息,阿联酋穆罕默德 · 本 · 扎耶德人工智能大学与 G42 共同推出低成本推理模型 "K2 Think",宣称仅需 320 亿参数,性能超越规模大 20 倍的模型;该模型基于阿里巴巴开源 Qwen 2.5 构建,采用长链式思维监督微调和推理阶段扩展等方法提升性能,为数学、科学等特定应用领域而设计。(广角观察)
登录后才可以发布评论哦
打开小程序可以发布评论哦