Add missing files

2025-12-06 07:12:10 +01:00 · 2025-11-27 15:56:58 -08:00 · 2025-11-27 15:56:58 -08:00 · 9e33c6bfb7
parent 666816a773
commit 9e33c6bfb7
2 changed files with 189 additions and 0 deletions
--- a/modules/image_model_settings.py
+++ b/modules/image_model_settings.py
@ -0,0 +1,108 @@
+# modules/image_model_settings.py
+import os
+from pathlib import Path
+
+import yaml
+
+import modules.shared as shared
+from modules.logging_colors import logger
+
+
+DEFAULTS = {
+    'model_name': 'None',
+    'dtype': 'bfloat16',
+    'attn_backend': 'sdpa',
+    'cpu_offload': False,
+    'compile_model': False,
+}
+
+
+def get_settings_path():
+    """Get the path to the image model settings file."""
+    return Path(shared.args.image_model_dir) / 'settings.yaml'
+
+
+def load_yaml_settings():
+    """Load raw settings from yaml file."""
+    settings_path = get_settings_path()
+
+    if not settings_path.exists():
+        return {}
+
+    try:
+        with open(settings_path, 'r') as f:
+            saved = yaml.safe_load(f)
+            return saved if saved else {}
+    except Exception as e:
+        logger.warning(f"Failed to load image model settings: {e}")
+        return {}
+
+
+def get_effective_settings():
+    """
+    Get effective settings with precedence:
+    1. CLI flag (if provided)
+    2. Saved yaml value (if exists)
+    3. Hardcoded default
+
+    Returns a dict with all settings.
+    """
+    yaml_settings = load_yaml_settings()
+
+    effective = {}
+
+    # model_name: CLI --image-model > yaml > default
+    if shared.args.image_model:
+        effective['model_name'] = shared.args.image_model
+    else:
+        effective['model_name'] = yaml_settings.get('model_name', DEFAULTS['model_name'])
+
+    # dtype: CLI --image-dtype > yaml > default
+    if shared.args.image_dtype is not None:
+        effective['dtype'] = shared.args.image_dtype
+    else:
+        effective['dtype'] = yaml_settings.get('dtype', DEFAULTS['dtype'])
+
+    # attn_backend: CLI --image-attn-backend > yaml > default
+    if shared.args.image_attn_backend is not None:
+        effective['attn_backend'] = shared.args.image_attn_backend
+    else:
+        effective['attn_backend'] = yaml_settings.get('attn_backend', DEFAULTS['attn_backend'])
+
+    # cpu_offload: CLI --image-cpu-offload > yaml > default
+    # For store_true flags, check if explicitly set (True means it was passed)
+    if shared.args.image_cpu_offload:
+        effective['cpu_offload'] = True
+    else:
+        effective['cpu_offload'] = yaml_settings.get('cpu_offload', DEFAULTS['cpu_offload'])
+
+    # compile_model: CLI --image-compile > yaml > default
+    if shared.args.image_compile:
+        effective['compile_model'] = True
+    else:
+        effective['compile_model'] = yaml_settings.get('compile_model', DEFAULTS['compile_model'])
+
+    return effective
+
+
+def save_image_model_settings(model_name, dtype, attn_backend, cpu_offload, compile_model):
+    """Save image model settings to yaml."""
+    settings_path = get_settings_path()
+
+    # Ensure directory exists
+    settings_path.parent.mkdir(parents=True, exist_ok=True)
+
+    settings = {
+        'model_name': model_name,
+        'dtype': dtype,
+        'attn_backend': attn_backend,
+        'cpu_offload': cpu_offload,
+        'compile_model': compile_model,
+    }
+
+    try:
+        with open(settings_path, 'w') as f:
+            yaml.dump(settings, f, default_flow_style=False)
+        logger.info(f"Saved image model settings to {settings_path}")
+    except Exception as e:
+        logger.error(f"Failed to save image model settings: {e}")
--- a/modules/image_models.py
+++ b/modules/image_models.py
@ -0,0 +1,81 @@
+# modules/image_models.py
+import time
+import torch
+
+import modules.shared as shared
+from modules.logging_colors import logger
+from modules.utils import resolve_model_path
+from modules.torch_utils import get_device
+
+
+def load_image_model(model_name, dtype='bfloat16', attn_backend='sdpa', cpu_offload=False, compile_model=False):
+    """
+    Load a diffusers image generation model.
+
+    Args:
+        model_name: Name of the model directory
+        dtype: 'bfloat16' or 'float16'
+        attn_backend: 'sdpa', 'flash_attention_2', or 'flash_attention_3'
+        cpu_offload: Enable CPU offloading for low VRAM
+        compile_model: Compile the model for faster inference (slow first run)
+    """
+    from diffusers import ZImagePipeline
+
+    logger.info(f"Loading image model \"{model_name}\"")
+    t0 = time.time()
+
+    dtype_map = {"bfloat16": torch.bfloat16, "float16": torch.float16}
+    target_dtype = dtype_map.get(dtype, torch.bfloat16)
+
+    model_path = resolve_model_path(model_name, image_model=True)
+
+    try:
+        pipe = ZImagePipeline.from_pretrained(
+            str(model_path),
+            torch_dtype=target_dtype,
+            low_cpu_mem_usage=False,
+        )
+
+        if not cpu_offload:
+            pipe.to(get_device())
+
+        # Set attention backend
+        if attn_backend == 'flash_attention_2':
+            pipe.transformer.set_attention_backend("flash")
+        elif attn_backend == 'flash_attention_3':
+            pipe.transformer.set_attention_backend("_flash_3")
+        # sdpa is the default, no action needed
+
+        if compile_model:
+            logger.info("Compiling model (first run will be slow)...")
+            pipe.transformer.compile()
+
+        if cpu_offload:
+            pipe.enable_model_cpu_offload()
+
+        shared.image_model = pipe
+        shared.image_model_name = model_name
+
+        logger.info(f"Loaded image model \"{model_name}\" in {(time.time()-t0):.2f} seconds.")
+        return pipe
+
+    except Exception as e:
+        logger.error(f"Failed to load image model: {str(e)}")
+        return None
+
+
+def unload_image_model():
+    """Unload the current image model and free VRAM."""
+    if shared.image_model is None:
+        return
+
+    del shared.image_model
+    shared.image_model = None
+    shared.image_model_name = 'None'
+
+    # Clear CUDA cache
+    if torch.cuda.is_available():
+
+        torch.cuda.empty_cache()
+
+    logger.info("Image model unloaded.")