IT之家 9小时前
清华开源TurboDiffusion:AI视频生成最高提速200倍
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_font3.html

 

IT 之家 12 月 25 日消息,清华大学 TSAIL 实验室联合生数科技推出开源视频生成加速框架 TurboDiffusion,该框架能在保持视频质量的前提下,将端到端扩散生成的推理速度提升 100 至 200 倍。

在技术方面,TurboDiffusion 为实现极致的推理速度,采用了 SageAttention 和 SLA(稀疏线性注意力机制)来加速注意力计算,显著降低了模型处理高分辨率视频时的算力开销。

其次,团队引入了 rCM(时间步蒸馏)技术,有效减少了扩散模型的采样步数。这些技术方案的深度融合,让模型在保持生成效果一致性的基础上,大幅削减了计算延迟。

GitHub 页面公布的实测数据展示了惊人的性能跃升。在单张 RTX 5090 显卡上测试 Wan-2.1-T2V-1.3B-480P 模型,生成 5 秒视频的原版耗时为 184 秒,而 TurboDiffusion 仅需 1.9 秒。

对于参数量更大的 Wan-2.2-I2V-A14B-720P 模型,原版生成耗时高达 4549 秒(约 1.2 小时),TurboDiffusion 将其压缩至 38 秒。IT 之家附上相关截图如下:

即便是在 Wan-2.1-14B-480P 模型上,耗时也从 1676 秒骤降至 9.9 秒,速度远超目前市面上的 FastVideo 等加速方案。

TurboDiffusion 目前已提供多种规格的模型权重下载,并针对不同硬件进行了针对性优化。针对 RTX 5090、RTX 4090 等显存有限的消费级显卡,团队提供了量化版(Quantized)权重,并建议开启线性层量化功能;而对于拥有 80GB 以上显存的 H100 等工业级显卡,则推荐使用非量化版本以获得最佳效果。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

开源 效果 it之家 清华大学
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论