Changing transformers_loader.py to Match User Expectations for --bf16 and Flash Attention 2 (#7217)

2025-12-06 07:12:10 +01:00 · 2025-09-17 14:39:04 -05:00 · 2025-09-17 14:39:04 -05:00 · dd6d2223a5
parent 9e9ab39892
commit dd6d2223a5
1 changed files with 1 additions and 0 deletions
--- a/modules/transformers_loader.py
+++ b/modules/transformers_loader.py
@ -137,6 +137,7 @@ def load_model_HF(model_name):
    params = {
        'low_cpu_mem_usage': True,
        'attn_implementation': shared.args.attn_implementation,
+        'torch_dtype': torch.bfloat16 if shared.args.bf16 else torch.float16,
    }

    if shared.args.trust_remote_code: