LTXV-13B革命性AI视频生成

使用LTXV-13B技术进行先进的AI驱动视频创作

LTXV-13B于2025年5月发布，代表着AI视频生成领域的重大进步，拥有130亿参数，能以前所未有的速度创建高质量视频。

在Hugging Face上探索 GitHub仓库

LTXV-13B技术规格

模型架构

•
基于DiT架构:
增强型多尺度渲染技术，实现速度与质量的最佳平衡
•
模型大小:
总大小28.6 GB，使用Git大文件存储(LFS)存储
•
参数数量:
130亿参数，较上一代LTX Video模型的20亿参数显著提升

性能指标

•
分辨率和帧率:
支持1216×704分辨率，30帧每秒，适合实时生成
•
生成速度:
LTXV-13B压缩版使用4-8步扩散步骤，仅需12秒即可生成高质量视频
•
硬件要求:
针对消费级GPU如NVIDIA 4090和5090优化，至少需要8GB显存

LTXV-13B生成能力

多尺度渲染技术

LTXV-13B的核心是其革命性的多尺度渲染技术，该技术最初以较低细节草绘视频以捕捉粗略动作，然后逐步细化细节，实现最佳质量和速度。

并行处理架构

利用GPU优化的并行处理同时渲染视频的多个方面，显著减少生成时间。

减少扩散步骤

压缩版本仅需4-8个扩散步骤即可实现高质量结果，而传统模型需要25-50步。

自适应细节生成

智能分配计算资源到需要更多细节的区域，优化质量与速度平衡。

性能比较

与其他模型相比的生成时间（越低越好）

LTXV-13B压缩版12秒

LTXV-13B基础版30秒

标准视频模型360秒

集成与资源

社区与开源

LTXV-13B作为开源项目提供，鼓励社区参与和创新。

加入社区

LTXV-13B
革命性AI视频生成

在Hugging Face上探索 GitHub仓库

LTXV-13B革命性AI视频生成

使用LTXV-13B技术进行先进的AI驱动视频创作

参数量

更快生成

生成时间

FPS输出

LTXV-13B技术规格

模型架构

性能指标

LTXV-13B生成能力

文本到视频

图像到视频

关键帧动画

视频扩展

视频到视频

自定义LoRA支持