3 月 30 日,阿里发布千问新一代全模态大模型 Qwen3.5-Omni,在音视频理解、识别、交互等 215 项任务中取得 SOTA(性能最佳),超越 Gemini-3.1 Pro,成为目前全球最强的全模态大模型之一。新模型拥有极强的音视频理解与实时交互能力,能够对音视频内容生成详细且可控的结构化描述,可识别语言和方言数量多达 113 种,还惊喜地涌现出了音视频 Vibe Coding 能力。
目前,阿里云百炼已上新 Qwen3.5-Omni 的 Plus、Flash、Light 三种 API,可广泛应用于短视频 / 直播平台、游戏、自媒体等行业。普通用户也可前往 Qwen Chat 免费体验,开发者和企业可通过阿里云百炼平台调用 Qwen3.5-Omni 模型,每百万 Tokens(词元)输入不到 0.8 元。
每日经济新闻


登录后才可以发布评论哦
打开小程序可以发布评论哦