Make llama.cpp the default loader

2025-12-06 07:12:10 +01:00 · 2025-04-21 16:36:35 -07:00 · 2025-04-21 16:36:35 -07:00 · 15989c2ed8
parent 86c3ed3218
commit 15989c2ed8
2 changed files with 18 additions and 18 deletions
--- a/modules/loaders.py
+++ b/modules/loaders.py
@ -4,6 +4,23 @@ from collections import OrderedDict
 import gradio as gr

 loaders_and_params = OrderedDict({
+    'llama.cpp': [
+        'n_gpu_layers',
+        'threads',
+        'threads_batch',
+        'batch_size',
+        'n_ctx',
+        'cache_type',
+        'tensor_split',
+        'rope_freq_base',
+        'compress_pos_emb',
+        'flash_attn',
+        'row_split',
+        'no_kv_offload',
+        'no_mmap',
+        'mlock',
+        'numa',
+    ],
    'Transformers': [
        'gpu_split',
        'cpu_memory',
@ -23,23 +40,6 @@ loaders_and_params = OrderedDict({
        'trust_remote_code',
        'no_use_fast',
    ],
-    'llama.cpp': [
-        'n_gpu_layers',
-        'threads',
-        'threads_batch',
-        'batch_size',
-        'n_ctx',
-        'cache_type',
-        'tensor_split',
-        'rope_freq_base',
-        'compress_pos_emb',
-        'flash_attn',
-        'row_split',
-        'no_kv_offload',
-        'no_mmap',
-        'mlock',
-        'numa',
-    ],
    'ExLlamav3_HF': [
        'max_seq_len',
        'gpu_split',
--- a/server.py
+++ b/server.py
@ -85,7 +85,7 @@ def create_interface():

    # Force some events to be triggered on page load
    shared.persistent_interface_state.update({
-        'loader': shared.args.loader or 'Transformers',
+        'loader': shared.args.loader or 'llama.cpp',
        'mode': shared.settings['mode'] if shared.settings['mode'] == 'instruct' else gr.update(),
        'character_menu': shared.args.character or shared.settings['character'],
        'instruction_template_str': shared.settings['instruction_template_str'],