
智东西
作者 | 程茜
编辑 | 漠影
全民低成本自制爽剧的时代真来了?
短剧行业正迎来爆发式增长,去年微短剧市场规模首超电影票房。
同时眼下,AI 也正颠覆短剧产业,深度渗透至短剧创作全链路,瞄准了分钟级出片,和 " 一人剧组 " 的工业化生产模式。
但对于短剧观众而言,很多 AI 短剧目前还未能彻底解决口型对不上、剧情存在逻辑硬伤等槽点;尤其是纯 AI 驱动的创作,往往还会带来超长剧本架构失控、角色场景设定前后矛盾等等问题。这让观众不得不陷入 " 边骂边追更 " 的状态,恨不得自己上手改剧本。
今天,商汤科技在产品发布周上,推出了全新升级的行业首个创编一体、多剧集生成智能体—— Seko 2.0 版本,其围绕着上述痛点全面更新,高效率、低门槛的特征,让个人创作者也能秒变 " 一人剧组 "。
今年 7 月上线以来,Seko 已经成为诸多视频创作者的必备工具。其联合专业团队打造的《婉心计》登上抖音 AI 短剧榜断层第一,热度超 200 万。
下面正是创作者使用 Seko 创作出的视频效果:
从 Seko 2.0 的重磅更新出发,我们试图拆解商汤科技在 AI 视频创作领域的独特打法,解析其底层技术布局。
一、灵感成真!Seko 2.0 让 AI 短剧创作一步到位
主打一步成片的 Seko 这次更新,将视频生成的高交互性与低门槛拉满了。其更新围绕着三大功能:UI 升级、支持 100 集以内剧本连续创作、Agent 智能调度。
首先是 UI 升级,Seko 提供了沉浸式的创意体验,用户在生成过程中对人物、分镜、图片、场景的编辑、交互性增强。
打开 Seko 可以发现,交互界面包含的元素增多。在对话框下方,用户可以直接选择提示灵感,或者可以自行输入提示词。在对话框中,用户还可以直接上传剧本、选择模型、添加主体、添加画风。
在对话框右下角就是另一个重要更新多剧集 Agent,打开 " 多剧集 ",用户就能进行长剧集多文本创作。

该 Agent 会分析文本、给出多剧集大纲、塑造整个剧集的人物和场景塑造,商汤科技 Seko 产品负责人王子彬称,相比于 Seko 1.0,2.0 可以直接在编辑界面对所有人物和场景进行精确控制和剪辑。
可以看到在画面左侧,用户能点击 + 号生成下一集,其会延续第一集的故事设定,保持人物和场景一致。用户还能进行更为细节的交互式处理,如每一个图片、分镜、口型、画布等都可以进行修改。

在上述更新之上,Seko 2.0 可以支持多达 100 集的剧本连续创作。
这波更新,一方面为专业创作者提供了更全面的工具支持,另一方面让非专业人士也能快速上手,轻松将创意想法转化为实际视频。
智东西也体验了下 Seko 2.0 的生成效果,在没有结合其他视频创作工具的同时,从输入灵感、生成大纲、分镜到调整分镜图、生成视频、导出,智东西在十几分钟内就得到了 1 分钟左右的一集 AI 短剧。
生成分镜后,用户可以点击分镜图上方的画布编辑和对口型,对应修改这一部分的视频内容,或者直接在左下角的对话框输入提示词重新生成图片。

生成的短剧视频中,女主角的形象在不同场景切换、不同表情变化的过程中始终保持高度一致,无违和感与割裂感。
并且主角人物表情变化十分细腻,在女主角内心独白时,其通过皱眉到低头、神色缓和的表情变化,将人物内心变化准确刻画了出来。
此次版本更新后,我们在 Seko 2.0 平台上的整体操作更加流畅自然,它中间还支持用户对细节的自定义修改,生成内容更加契合用户需求。从生成的结果来看,不仅剧情连贯,人物、场景能前后保持一致。更关键的是,对于专业创作者而言,一次就可以完成 100 集的超长制作!
二、四大核心技术加持,AI 短剧告别换脸穿帮、口型对不上
从上面的视频生成效果来看,Seko 2.0 已经支持在多人连续对话时精准匹配口型,且能在切换场景与剧集时保证人物表情、形象全程一致,且生成速度高效快捷。
这背后是商汤科技针对性的技术全栈升级。
第一是角色一致性技术 SekoIDX,其通过扩散模型优化,平衡参考图相似性与提示词响应性,使得生成效果精准可控。
短剧创作中,换脸式穿帮问题会因为人脸变形、特征失真等瑕疵破坏画面真实感,影响观众的沉浸式观看体验,同时在保证一致性的同时还要让人脸随场景、表情变化更加自然、真实。
基于此,其会提供正向和反向的参考图,适当加入副参考图,以兼顾主体的多样性和一致性,避免直接像复制粘贴主体形象。
第二是多人对口型方案 SekoTalk,这也是业内首个支持超过 2 人对口型的方案。对于短剧而言,多人对口型是强需求,且往往在制作过程中会面临多人对话、连续切换说话人、口癖还原等核心痛点。
商汤科技的实时语音驱动数字人技术 SekoTalk,可以在 8 卡服务器上达到 25 FPS 的生成速度,首帧延迟低至 3.5 秒,同时做到多人、多语言的口型精准匹配和超长时间稳定生成。
第三是效率提升技术 Phased DMD 蒸馏,进一步降低多剧集生成成本。
扩散模型低步数生成的质量受限于等效模型质量,如果等效模型容量不足,低步数生成的视频就会出现模糊、细节缺失、逻辑混乱等问题。主流 SOTA 视频生成模型已经验证了 MoE 技术的优势,不需要增加推理阶段的计算开销。
商汤科技研究团队创新性提出 Phased DMD 技术,既能提升蒸馏模型生成的动态效果和多样性,使 SekoTalk 推理开销在降低 1/25 的同时,仍保持教师模型良好的肢体运动效果和情绪表现力。
同时 Seko 2.0 已经支持性价比更高的寒武纪芯片适配方案。
最后是商汤开源的行业首个能够达到实时视频生成的推理框架 LightX2V,其与模型协同设计,支持低资源部署。
商汤科技在模型和系统设计之初,就让它们融入低比特量化感知训练、稀疏注意力等原生优化,配合自研 "SPARSE+NVFP4+ 低比特通信 " 高效注意力算子,模型训练完成后可直接低资源部署。这一开源框架的累计下载量已超 350 万次。
总的来看,Seko 2.0 的升级正是聚焦短剧行业痛点,真正达成生成质量与效率的双向平衡。其能实现分钟级出片,还能通过多剧集一致性保证生成视频的质量,更将成本压至最优,破解行业的产能与质量焦虑。
三、Seko 进化:让 AI 短剧进入分分钟出片、零基础上手的全民时代
以 Seko 为代表的 AI 视频创作平台的出现与升级迭代,让 AI 短剧迎来风口。
谈及 Seko 的产品迭代理念,王子彬谈道,他们的产品定位是和创作者做朋友、为创作者提供便利、满足创作者的需求,也就是真正把 " 一切围绕创作者 " 落到实处。
这也可以从 Seko 的用户画像看出来,他补充说,其有固定创作需求的用户占比在 50%~60% 之间,这类用户分两类,一类是专业高频创作者,他们对自己的内容有高度把控性和要求,更看重工具易用性;另一类是 MCN 创作者,其对视频创作有自己的理解,有固定每周 1~2 个视频创作需求。
王子彬谈道,《婉心计》就是专业创作团队基于 Seko 打造的 AI 短剧,创作团队会使用 Seko 完成大部分流程,然后调用其他工具进行高精修完善创作。
AI 短剧《婉心计》片段
最后一部分是完全没有创作经验的用户,其占比达到 30%-40%,这部分用户一般而言没有二次创作需求,很难长期留存。
无论是具备 AI 视频创作基础的进阶用户,还是意欲尝鲜体验的入门群体,Seko 均可全面覆盖其差异化需求。
如今 Seko 再度更新,为 AI 短剧创作门槛带来一场降维革命。
此前视频制作需要专业的创作团队,且成本甚至高达百万元级别,如今普通人就可以在家用 PC 制作一部成片,让视频创作应用到了更为广泛的场景。
如山西一位语文老师通过 Seko,将学生的作文直接转换成了视频,在播放的过程中,通过视频形式增强学生对好的作文内容的认同感与共鸣感,同时能进一步增强其创造力和想象力。
此外还有不少跨界创作热潮,如程序员借 Seko 圆了武侠梦、作家让笔下小说一键变身可视化影像、公务员用它制作生动的历史动画 …… 使得 AI 视频工具打破行业壁垒,释放更大的产业价值。
在视频创作领域,新人入门难、产能低的难题也被破解。
过去漫剧新人需掌握分镜设计、剪辑、模型适配等专业技能,上手周期长且易因操作失误影响产出;而 Seko 通过简化交互、智能调度模型等功能,让新人无需复杂学习就能快速启动创作。据了解,已经有漫剧工作室新人通过 Seko 快速上手,日均产出 3-4 集成片。
产业发展有一大规律是,当创作工具实现普惠,必将催生行业增长的正向循环。
Seko 进一步拉低视频创作的门槛,使得更多元化的创作者团队入局,让更多创意大神将脑洞变成新颖的视频,缓解短剧剧情同质化的困境,带动产业规模化增长。
结语:AI 视频制作工具,正加速拆掉短剧创作门槛
伴随 AI 技术进阶,视频生成正在打破视频生成的壁垒,从此前依赖高端、专业团队的创作形式,向普通人也能轻松参与其中的方式扩展。
从 Seko 的发展轨迹来看,AI 视频生成工具正朝着推动视频生成产业实现质量与规模同步提升发展,既通过多维度的技术优化保障内容输出的高质量,又以高效生成能力支撑规模化生成创意视频,人人都是创作者的时代真要来了。


登录后才可以发布评论哦
打开小程序可以发布评论哦