Lightricks 在 CES 2026 發布眾所期待的 LTX-2 音訊-視訊模型開放權重,象徵 AI 影音生成技術的一大進展。LTX-2 針對 NVIDIA GPU 最佳化,是領先的開放權重音訊-視訊模型,最高能夠生成 4K 解析度、50 FPS 且長達 20 秒的短片。
BF16 精度的模型現已開放下載。基本模型也提供量化的 NVFP8 權重,將模型縮小約 30%,而且最高可在 RTX GPU 提供快 2 倍的效能。
本指南讓您在幾分鐘內就能用 RTX 最佳化 ComfyUI 工作流程作業。
LTX-2 這個音訊-視訊模型系列以音訊生成視訊。發布時將有五個檢查點:
LTX-2 這款尖端模型運用大量影片記憶體 (VRAM) 實現優質結果。記憶體用量會隨解析度、畫格率、長度或步驟增加而提升。所幸,對於使用者而言,ComfyUI 與 NVIDIA 已合作將 Weight Streaming 功能最佳化,讓使用者在耗盡 GPU VRAM 時,可將部分工作流程卸載至系統記憶體,但必須犧牲效能。
視 GPU 和使用案例而定,您不妨約束這些因素,確保生成時間在合理範圍內。舉例而言,GeForce RTX 5090 GPU 有 32 GB 的 VRAM,可於大約 25 秒內在 GPU 記憶體生成 720p 24fps 的 4 秒短片。然而,如果使用者需要較長的 8 秒影片,生成時間將增至三分鐘,因為需要 32 GB 以上的 VRAM 並自動啟用權重串流。
建議:使用較低的設定迭代影片,然後調高設定,視需要調整品質。根據經驗,最佳實務如下:
LTX-2 是能夠生成非凡影片的先進模型。但與任何模型一樣,調整設定也會嚴重影響品質。模型權重釋出後,社群一定會分享各種優秀的建議,但我們在測試中發現,以下專業訣竅最為實用: