AI 视频生成,正在追求变得好玩?
12 月 16 日,阿里千问 App(应用程序)同步上线最新视频生成模型万相 2.6,并向所有用户免费开放。《每日经济新闻》记者了解到,基于该模型的核心能力,千问 App 上线了 "AI 小剧场 " 功能(即基于该模型的角色扮演新功能),在国内首次实现了 " 角色合拍 " 玩法。
记者体验千问 App 后发现,点进 "AI 小剧场 ",的确可以和知名角色、历史人物合拍视频。
根据示例,输入简单描述," 苏轼 " 就能穿越时空被高考难到崩溃;只要上传自己的照片录入角色,就能和美国队长出现在同一视频中,接受他送的玫瑰花。此外,视频生成后,还可以一键分享链接到微信好友、朋友圈和 QQ 好友。
值得注意的是,这一功能对标的正是 Open AI 旗下的 Sora2。"AI 小剧场 " 玩法目前仅 Sora2 大模型有类似功能,而 Sora2 的优势便在于,其同步上线了内容社区,开启了 AI 内容社区化时代。
当前,在 AI 视频生成领域,中国企业和美国企业正展开激烈竞争。根据招商证券统计,目前 , 该领域已有 15 个以上被广泛认可的模型。在此大背景下,阿里持续加码视频生成赛道意欲何为?

对标 Sora2,阿里持续加码视频生成
事实上,今年以来,阿里持续布局视频生成赛道。
2 月,据阿里云披露消息,阿里云视频生成大模型万相 2.1(Wan)重磅开源,此次开源采用 Apache2.0 协议,14B 和 1.3B 两个参数规格的全部推理代码和权重全部开源,同时支持文生视频和图生视频任务。
而在今年 9 月的云栖大会上,阿里发布通义万相 Wan2.5 preview 系列模型,首次实现音画同步的视频生成能力,视频时长从 5S 提升至 10S,支持 24 帧每秒的 1080P 高清输出,通义 App 第一时间接入了视频生成模型。
11 月 17 日,阿里正式宣布 " 千问 " 项目,全力进军 AI to C 市场," 通义 "App 正式改名为 " 千问 "App。12 月初,千问 App 便已接入万相系列当时的最新模型 Wan2.5。
这一次,千问 App 第一时间接入的万相 2.6 视觉大模型,支持音画同步、多镜头生成及声音驱动等功能,号称是全球功能最全的视频生成模型,也是国内首个支持角色扮演功能的视频生成模型。阿里方面表示,这次更新的万相 2.6,有的功能比如音频驱动生成视频,Sora2 尚未实现。
为何这次千问卯足了劲对标 Sora2,双方之间究竟差距何在?
根据华泰证券相关研报,9 月 30 日,Open AI 发布最新音视频生成模型 Sora2,并同步试运行由该模型驱动的 iOS 社交应用 Sora。
该研报认为,Sora 此次较大的突破在于推出 AI 社交平台,有望通过双边效应实现自我强化,进一步降低内容创作的门槛,吸引全球开发者与普通用户共创内容生产,并通过垂直分发机制提升内容消费效率,有望创造新型社交场景。
有观点认为,Sora2 及其配套社交应用的发布,标志着 AI 视频生成与社交互动进入融合阶段,或迎来 AI 视频生成的 "ChatGPT 时刻 "。
工信部信息通信经济专家委员会委员盘和林对《每日经济新闻》记者表示,如今,在 AI 大模型算法能力上,中国相对较强,具备追上 Sora2 的能力,且阿里本身具备比较丰富的数据资源和算力资源,即便短期有些性能差距,阿里千问也能通过持续的算力和数据投入来解决问题。
" 性能上应该是能够无限接近 Sora2。当然,现阶段还是有些差距的,多是一些生成细节上的差距。" 盘和林说。
记者在千问 App 实测 "AI 小剧场 " 功能发现,在选择现存示例进行 "AI 翻拍 " 的情况下,其视频生成时间一般在 2 到 5 分钟,可生成一段 10 秒视频。
不过,当记者输入描述,要求 " 孙悟空和财神拥抱 " 时,千问 App 的理解并不到位,给出了前后不相关的数个视频画面,包括孙悟空举起玫瑰花、两个财神拥抱。
千问 App 月内狂推 18 个版本,阿里 " 硬刚 "Open AI 背后的豪赌
就视频生成赛道而言,千问 App 在国内也有不少竞争对手。
同样在 12 月 16 日,字节跳动旗下 " 即梦 AI" 网页版官宣全面升级,打造一站式 "AI 片场 "。此次升级核心是即梦 AI 最新视频生成能力 " 视频 3.5 Pro",支持视频与音频同时生成,人物口型、乐器演奏、环境音效等元素无需再后期配音,提升视频的真实感与沉浸感。
今年 12 月,快手旗下 " 可灵 AI" 推出视频生成 2.6 模型。据介绍,该模型提供了 " 音画同出 " 能力,能够在单次生成中,输出包含自然语言、动作音效以及环境氛围音的完整视频。目前,其语音支持生成中文与英文,生成的视频长度最长可达 10 秒。12 月 5 日,可灵 AI 宣布,可灵 O1 主体库和对比模板两大功能全新上线。
盘和林认为,各大视频生成 AI 之间,差距都比较小。" 千问视频生成能力应该和即梦、可灵在同一起跑线。" 他表示,因为各家在算法、算力、数据等基础上处于近似的水平,AI 视频生成应用是这些基础的结果而已。
值得一提的是,这些大厂共同争夺的,是一个广阔的市场前景。
招商证券相关研报提及,根据 Grand View Horizon,2025 年全球 AI 视频生成市场规模预计达 8 亿美元。在其基本情形假设中,预计 AI 视频生成可触达市场规模接近 400 亿美元,包含 B 端规模 360 亿美元(90% 占比)和 C 端规模 40 亿美元(10% 占比)。
不过,12 月 13 日,据《中国经营报》报道,近日,硅谷风投机构 a16z 合伙人 Olivia Moore 在社交媒体爆料称,Sora 的下载量仍在增长,但早期用户留存率数据看起来相当疲软。他晒出了一张 App 数据监测服务 SensorTower 的数据截图:Sora 的 1 天、7 天、30 天和 60 天用户留存率分别为 10%、2%、1% 和 0%。
不过,就阿里在 AI 上的整体布局来看,千问 App 上线 "AI 小剧场 " 的诉求未必是剑指 AI 视频生成市场这么简单。千问 App 刚上线时,阿里便宣称,其要与 ChatGPT 展开全面竞争,此次推出视频生成新玩法,或是试图缩小与 Open AI 的综合差距,为正面抗衡铺路。
截至 12 月 17 日,千问 App 公测已满一个月。一个月来,这款 App 共计更新 18 个版本,正加强创作、学习、办公三大场景能力。12 月 10 日,阿里官方信息显示,自 11 月 17 日公测仅 23 天,千问月活跃用户数(含 App、Web、PC 端)已突破 3000 万,成为当前全球增长最快的 AI 应用。
组织架构的调整也在进行中。12 月 9 日消息,阿里已成立千问 C 端事业群,由阿里巴巴集团副总裁吴嘉负责。据媒体报道,阿里在内部沟通中提及,千问 C 端事业群的首要目标是将千问打造成为一款超级 App,成为 AI 时代用户的第一入口。
AI 视频生成的战场硝烟弥漫,时至如今,这场较量不仅是技术参数的比拼,更是各家生态能力与用户洞察的对决。在此大背景下,在 AI 赛道上,阿里若想 " 硬刚 "Open AI,需要做的还有很多。
每日经济新闻


登录后才可以发布评论哦
打开小程序可以发布评论哦