【阿里通义千问发布并开源 Qwen3】财联社 4 月 29 日电,阿里巴巴通义千问发布新版 Qwen3 系列模型,包括 2 个 MoE 模型和 6 个 dense 模型,参数量从 0.6B 到 235B。与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等其他顶级模型相比,旗舰模型 Qwen3-235B-A22B 在编码、数学、通用能力等基准评估中取得了有竞争力的结果。通义千问还表示,Qwen3 模型推理能力大幅提升,在数学、代码和逻辑推理等评测中,达到同规模业界 SOTA 水平。
登录后才可以发布评论哦
打开小程序可以发布评论哦