CES 2026 で、Lightricks は待望の LTX-2 オーディオ ビデオ モデルのオープン重みを公開し、AI 動画と音声生成分野での大きな前進を示しました。 NVIDIA GPU 向けに最適化された LTX-2 は、業界をリードするオープン重みのオーディオ ビデオ モデルであり、最大 4K 解像度、50 FPS、最大 20 秒のクリップを生成できます。
モデルは BF16 精度でダウンロード可能になりました。 ベース モデルは、モデル サイズを約 30% 削減し、RTX GPU で最大 2 倍のパフォーマンスを発揮する量子化された NVFP8 重みでも利用可能になります。
このガイドでは、RTX 最適化 ComfyUI ワークフローを数分で実行できます。
LTX-2 は、音声付きの動画を生成するオーディオ ビデオ モデルのファミリーです。 発売時には 5 つのチェックポイントが用意されています。
最先端モデルとして、LTX-2 は大量のビデオ メモリ (VRAM) を使用し、高品質な成果を提供します。解像度、フレームレート、長さ、またはステップを増加させると、メモリ使用量が増加します。 幸いなことに、ComfyUI と NVIDIA は重みストリーミング機能の最適化で協力しており、GPU の VRAM が不足した場合でも、ワークフローの一部をシステム メモリにオフロードできます。ただし、これはパフォーマンスの低下を伴う可能性があります。
ご使用の GPU とユースケースによっては、生成時間が妥当な範囲に収まるように、これらの要因を制限することを検討してください。 たとえば、GeForce RTX 5090 GPU は 32GB の VRAM を搭載しており、GPU メモリ内で約 25 秒で 720p 24 fps 4 秒のクリップを生成できます。 ただし、ユーザーがより長い 8 秒の動画を生成したい場合、32GB 以上の VRAM が必要となり、自動的に重みストリーミングが開始されるため、生成時間が 3 分間に延びます。
推奨: 動画の反復処理には低い設定を使用して、設定を上げて必要な品質に調整します。 経験上、以下のことが最善です。
LTX-2 は、驚異的な動画を生成できる高度なモデルです。 ただし、他のモデルと同様に、設定を微調整すると品質に大きな影響を及ぼす場合があります。 モデル ウェイトが利用可能になると、コミュニティは素晴らしい推奨事項を提案します。しかし、テストで最も役立つことが判明したプロのヒントを以下に紹介します。