Add FlashVSR chunked decoding for long videos avoid OOM #1443

anastasiuspernat · 2025-10-16T00:12:19Z

Add FlashVSR context window support for long videos

Problem

FlashVSR video upscaling with context windows on long videos (500+ frames) causes:

OOM errors during decoding (115+ latent frames)
Visible transitions at chunk boundaries due to latent blending if directly using context window

Solution

New flashvsr fuse method (context_windows/context.py)
No-blend mode for FlashVSR: overlap provides temporal context, but predictions are discarded (not blended).

WanVideoDecode uses context_window settings passed from Wan Context Window options and does
chunked decoding with overlap trimming (nodes.py)

Decode chunks with overlap for temporal context
Discard overlap frames (no blending)
Key fix: Proportional overlap calculation accounts for FlashVSR's frames_to_trim=3 behavior (outputs 41 frames from 11 latent, not 44 if context_frames is set to 44)
Calculation: actual_overlap = decoder_output × (latent_overlap / latent_context_frames)

Usage Example specific for FlashVSR

  context_schedule: "static_standard"
  context_frames: 44  # Adjust for VRAM
  context_overlap: 16
  fuse_method: "flashvsr"  # NEW

Add FlashVSR chunked decoding for long videos

785d529

anastasiuspernat mentioned this pull request Oct 16, 2025

FlashVSR - OOM on 32GB VRAM on long videos #1439

Open

Fix decode chunking threshold to use latent frames

f48c261

Provide feedback