智东西
作者 | 江宇
编辑 | 漠影
智东西 9 月 24 日报道,阿里巴巴旗下夸克今日发布全新 AI 创作平台 " 造点 ",集成图像与视频生成能力,并接入最新版本的通义万相模型 Wan2.5,成为目前国内首个支持 " 音画同步 " 生成的公开平台。
用户可通过输入文本,一键生成图像或视频。此外,在视频生成方面,通义万相 Wan2.5 支持 10 秒长度、24 帧每秒、1080P 分辨率,并可同步生成语音、音效与背景音乐,实现更完整的故事表达。
通义万相 Wan2.5 还具备较强的指令响应能力,可在生成过程中呈现运镜等连续变化效果。
图像生成方面," 造点 " 引入了 Midjourney V7 模型,并结合夸克自研算法进行本地化优化,突出亚洲人像、中文文字及国风视觉表现能力。该平台支持多图参考、风格代码、精细参数调节等功能,还面向电商设计、影游内容创作等专业场景开放使用。
目前,用户可访问官网或通过夸克 PC 端 "AI 生图 " 入口进入 " 造点 "。移动端则支持 " 一句话 P 图 ""AI 创意视频 "" 风格转化 " 等功能。截止至 9 月 30 日,通义万相 Wan2.5 视频生成功能将面向用户开放免费体验。
相比单一模型或单一模态的工具," 造点 " 在一个平台内集成图像与视频生成能力,尝试覆盖更多创作需求。依托通义万相与 Midjourney 等主流模型的集成,该平台在提升生成质量的同时,也降低了内容创作的门槛。
从当前开放功能来看,其在画质呈现、音画同步上的表现已有初步完成度,但在长视频生成、多轮调整等方面仍有待后续观察。
登录后才可以发布评论哦
打开小程序可以发布评论哦