Revert "Remove non-HF ExLlamaV2 loader (#5431)"

This reverts commit cde000d478.
2026-04-05 06:35:15 +00:00 · 2024-02-06 06:21:17 -08:00 · 2024-02-06 06:21:17 -08:00 · 2a1063eff5
commit 2a1063eff5
parent 8c35fefb3b
9 changed files with 220 additions and 18 deletions
--- a/modules/models.py
+++ b/modules/models.py
@ -65,6 +65,7 @@ def load_model(model_name, loader=None):
        'GPTQ-for-LLaMa': GPTQ_loader,
        'llama.cpp': llamacpp_loader,
        'llamacpp_HF': llamacpp_HF_loader,
+        'ExLlamav2': ExLlamav2_loader,
        'ExLlamav2_HF': ExLlamav2_HF_loader,
        'ctransformers': ctransformers_loader,
        'AutoAWQ': AutoAWQ_loader,
@ -375,6 +376,13 @@ def AutoGPTQ_loader(model_name):
    return modules.AutoGPTQ_loader.load_quantized(model_name)


+def ExLlamav2_loader(model_name):
+    from modules.exllamav2 import Exllamav2Model
+
+    model, tokenizer = Exllamav2Model.from_pretrained(model_name)
+    return model, tokenizer
+
+
 def ExLlamav2_HF_loader(model_name):
    from modules.exllamav2_hf import Exllamav2HF