text-generation-webui/modules/utils.py

import os
import re
from datetime import datetime
from pathlib import Path

from modules import shared
from modules.logging_colors import logger


# Helper function to get multiple values from shared.gradio
def gradio(*keys):
    if len(keys) == 1 and type(keys[0]) in [list, tuple]:
        keys = keys[0]

    return [shared.gradio[k] for k in keys]


def save_file(fname, contents):
    if fname == '':
        logger.error('File name is empty!')
        return

    root_folder = Path(__file__).resolve().parent.parent
    abs_path_str = os.path.abspath(fname)
    rel_path_str = os.path.relpath(abs_path_str, root_folder)
    rel_path = Path(rel_path_str)
    if rel_path.parts[0] == '..':
        logger.error(f'Invalid file path: \"{fname}\"')
        return

    with open(abs_path_str, 'w', encoding='utf-8') as f:
        f.write(contents)

    logger.info(f'Saved \"{abs_path_str}\".')


def delete_file(fname):
    if fname == '':
        logger.error('File name is empty!')
        return

    root_folder = Path(__file__).resolve().parent.parent
    abs_path_str = os.path.abspath(fname)
    rel_path_str = os.path.relpath(abs_path_str, root_folder)
    rel_path = Path(rel_path_str)
    if rel_path.parts[0] == '..':
        logger.error(f'Invalid file path: \"{fname}\"')
        return

    if rel_path.exists():
        rel_path.unlink()
        logger.info(f'Deleted \"{fname}\".')


def current_time():
    return f"{datetime.now().strftime('%Y-%m-%d_%Hh%Mm%Ss')}"


def atoi(text):
    return int(text) if text.isdigit() else text.lower()


# Replace multiple string pairs in a string
def replace_all(text, dic):
    for i, j in dic.items():
        text = text.replace(i, j)

    return text


def natural_keys(text):
    return [atoi(c) for c in re.split(r'(\d+)', text)]


def check_model_loaded():
    if shared.model_name == 'None' or shared.model is None:
        if len(get_available_models()) == 0:
            error_msg = "No model is loaded.\n\nTo get started:\n1) Place a GGUF file in your user_data/models folder\n2) Go to the Model tab and select it"
            logger.error(error_msg)
            return False, error_msg
        else:
            error_msg = "No model is loaded. Please select one in the Model tab."
            logger.error(error_msg)
            return False, error_msg

    return True, None


def get_available_models():
    # Get all GGUF files
    gguf_files = get_available_ggufs()

    # Filter out non-first parts of multipart GGUF files
    filtered_gguf_files = []
    for gguf_path in gguf_files:
        filename = os.path.basename(gguf_path)

        match = re.search(r'-(\d+)-of-\d+\.gguf$', filename)

        if match:
            part_number = match.group(1)
            # Keep only if it's part 1
            if part_number.lstrip("0") == "1":
                filtered_gguf_files.append(gguf_path)
        else:
            # Not a multi-part file
            filtered_gguf_files.append(gguf_path)

    model_dir = Path(shared.args.model_dir)

    # Find top-level directories containing GGUF files
    dirs_with_gguf = set()
    for gguf_path in gguf_files:
        path = Path(gguf_path)
        if len(path.parts) > 0:
            dirs_with_gguf.add(path.parts[0])

    # Find directories with safetensors files
    dirs_with_safetensors = set()
    for item in os.listdir(model_dir):
        item_path = model_dir / item
        if item_path.is_dir():
            if any(file.lower().endswith(('.safetensors', '.pt')) for file in os.listdir(item_path) if (item_path / file).is_file()):
                dirs_with_safetensors.add(item)

    # Find valid model directories
    model_dirs = []
    for item in os.listdir(model_dir):
        item_path = model_dir / item
        if not item_path.is_dir():
            continue

        # Include directory if it either doesn't contain GGUF files
        # or contains both GGUF and safetensors files
        if item not in dirs_with_gguf or item in dirs_with_safetensors:
            model_dirs.append(item)

    model_dirs = sorted(model_dirs, key=natural_keys)

    return filtered_gguf_files + model_dirs


def get_available_ggufs():
    model_list = []
    model_dir = Path(shared.args.model_dir)

    for dirpath, _, files in os.walk(model_dir, followlinks=True):
        for file in files:
            if file.lower().endswith(".gguf"):
                model_path = Path(dirpath) / file
                rel_path = model_path.relative_to(model_dir)
                model_list.append(str(rel_path))

    return sorted(model_list, key=natural_keys)


def get_available_mmproj():
    mmproj_dir = Path('user_data/mmproj')
    if not mmproj_dir.exists():
        return ['None']

    mmproj_files = []
    for item in mmproj_dir.iterdir():
        if item.is_file() and item.suffix.lower() in ('.gguf', '.bin'):
            mmproj_files.append(item.name)

    return ['None'] + sorted(mmproj_files, key=natural_keys)


def get_available_presets():
    return sorted(set((k.stem for k in Path('user_data/presets').glob('*.yaml'))), key=natural_keys)


def get_available_prompts():
    notebook_dir = Path('user_data/logs/notebook')
    notebook_dir.mkdir(parents=True, exist_ok=True)

    prompt_files = list(notebook_dir.glob('*.txt'))
    sorted_files = sorted(prompt_files, key=lambda x: x.stat().st_mtime, reverse=True)
    prompts = [file.stem for file in sorted_files]
    return prompts


def get_available_characters():
    paths = (x for x in Path('user_data/characters').iterdir() if x.suffix in ('.json', '.yaml', '.yml'))
    return sorted(set((k.stem for k in paths)), key=natural_keys)


def get_available_instruction_templates():
    path = "user_data/instruction-templates"
    paths = []
    if os.path.exists(path):
        paths = (x for x in Path(path).iterdir() if x.suffix in ('.json', '.yaml', '.yml'))

    return ['None'] + sorted(set((k.stem for k in paths)), key=natural_keys)


def get_available_extensions():
    # User extensions (higher priority)
    user_extensions = []
    user_ext_path = Path('user_data/extensions')
    if user_ext_path.exists():
        user_exts = map(lambda x: x.parts[2], user_ext_path.glob('*/script.py'))
        user_extensions = sorted(set(user_exts), key=natural_keys)

    # System extensions (excluding those overridden by user extensions)
    system_exts = map(lambda x: x.parts[1], Path('extensions').glob('*/script.py'))
    system_extensions = sorted(set(system_exts) - set(user_extensions), key=natural_keys)

    return user_extensions + system_extensions


def get_available_loras():
    return ['None'] + sorted([item.name for item in list(Path(shared.args.lora_dir).glob('*')) if not item.name.endswith(('.txt', '-np', '.pt', '.json'))], key=natural_keys)


def get_datasets(path: str, ext: str):
    # include subdirectories for raw txt files to allow training from a subdirectory of txt files
    if ext == "txt":
        return ['None'] + sorted(set([k.stem for k in list(Path(path).glob('*.txt')) + list(Path(path).glob('*/')) if k.stem != 'put-trainer-datasets-here']), key=natural_keys)

    return ['None'] + sorted(set([k.stem for k in Path(path).glob(f'*.{ext}') if k.stem != 'put-trainer-datasets-here']), key=natural_keys)


def get_available_chat_styles():
    return sorted(set(('-'.join(k.stem.split('-')[1:]) for k in Path('css').glob('chat_style*.css'))), key=natural_keys)


def get_available_grammars():
    return ['None'] + sorted([item.name for item in list(Path('user_data/grammars').glob('*.gbnf'))], key=natural_keys)
Sort dropdowns numerically 2023-05-06 04:14:56 +02:00			`import os`
			`import re`
Allow API requests to use parameter presets 2023-06-14 01:34:35 +02:00			`from datetime import datetime`
Sort dropdowns numerically 2023-05-06 04:14:56 +02:00			`from pathlib import Path`

Reorganize the Session tab 2025-06-08 18:20:21 +02:00			`from modules import shared`
Add menus for saving presets/characters/instruction templates/prompts (#2621) 2023-06-11 17:19:18 +02:00			`from modules.logging_colors import logger`


Implement sessions + add basic multi-user support (#2991) 2023-07-04 05:03:30 +02:00			`# Helper function to get multiple values from shared.gradio`
			`def gradio(*keys):`
Unify the 3 interface modes (#3554) 2023-08-13 06:12:15 +02:00			`if len(keys) == 1 and type(keys[0]) in [list, tuple]:`
Implement sessions + add basic multi-user support (#2991) 2023-07-04 05:03:30 +02:00			`keys = keys[0]`

			`return [shared.gradio[k] for k in keys]`


Add menus for saving presets/characters/instruction templates/prompts (#2621) 2023-06-11 17:19:18 +02:00			`def save_file(fname, contents):`
			`if fname == '':`
			`logger.error('File name is empty!')`
			`return`

			`root_folder = Path(__file__).resolve().parent.parent`
Allow symlinked folder within root directory (#4863) 2023-12-13 22:08:21 +01:00			`abs_path_str = os.path.abspath(fname)`
			`rel_path_str = os.path.relpath(abs_path_str, root_folder)`
			`rel_path = Path(rel_path_str)`
Add menus for saving presets/characters/instruction templates/prompts (#2621) 2023-06-11 17:19:18 +02:00			`if rel_path.parts[0] == '..':`
Change some log messages when deleting files 2024-01-09 12:32:01 +01:00			`logger.error(f'Invalid file path: \"{fname}\"')`
Add menus for saving presets/characters/instruction templates/prompts (#2621) 2023-06-11 17:19:18 +02:00			`return`

Allow symlinked folder within root directory (#4863) 2023-12-13 22:08:21 +01:00			`with open(abs_path_str, 'w', encoding='utf-8') as f:`
Add menus for saving presets/characters/instruction templates/prompts (#2621) 2023-06-11 17:19:18 +02:00			`f.write(contents)`

Change some log messages when deleting files 2024-01-09 12:32:01 +01:00			`logger.info(f'Saved \"{abs_path_str}\".')`
Add menus for saving presets/characters/instruction templates/prompts (#2621) 2023-06-11 17:19:18 +02:00

			`def delete_file(fname):`
			`if fname == '':`
			`logger.error('File name is empty!')`
			`return`

			`root_folder = Path(__file__).resolve().parent.parent`
Allow symlinked folder within root directory (#4863) 2023-12-13 22:08:21 +01:00			`abs_path_str = os.path.abspath(fname)`
			`rel_path_str = os.path.relpath(abs_path_str, root_folder)`
			`rel_path = Path(rel_path_str)`
Add menus for saving presets/characters/instruction templates/prompts (#2621) 2023-06-11 17:19:18 +02:00			`if rel_path.parts[0] == '..':`
Change some log messages when deleting files 2024-01-09 12:32:01 +01:00			`logger.error(f'Invalid file path: \"{fname}\"')`
Add menus for saving presets/characters/instruction templates/prompts (#2621) 2023-06-11 17:19:18 +02:00			`return`

Fix deleting chat logs (#4914) 2023-12-14 01:54:43 +01:00			`if rel_path.exists():`
			`rel_path.unlink()`
Change some log messages when deleting files 2024-01-09 12:32:01 +01:00			`logger.info(f'Deleted \"{fname}\".')`
Sort dropdowns numerically 2023-05-06 04:14:56 +02:00

Allow API requests to use parameter presets 2023-06-14 01:34:35 +02:00			`def current_time():`
Better filenames for new prompts in the Notebook tab 2025-06-18 00:10:44 +02:00			`return f"{datetime.now().strftime('%Y-%m-%d_%Hh%Mm%Ss')}"`
Allow API requests to use parameter presets 2023-06-14 01:34:35 +02:00

Sort dropdowns numerically 2023-05-06 04:14:56 +02:00			`def atoi(text):`
			`return int(text) if text.isdigit() else text.lower()`


Remove duplicate code 2023-05-10 06:34:04 +02:00			`# Replace multiple string pairs in a string`
			`def replace_all(text, dic):`
			`for i, j in dic.items():`
			`text = text.replace(i, j)`

			`return text`


Sort dropdowns numerically 2023-05-06 04:14:56 +02:00			`def natural_keys(text):`
			`return [atoi(c) for c in re.split(r'(\d+)', text)]`


UI: More friendly message when no model is loaded 2025-05-09 16:21:05 +02:00			`def check_model_loaded():`
			`if shared.model_name == 'None' or shared.model is None:`
Better detect when no model is available 2025-05-29 19:49:29 +02:00			`if len(get_available_models()) == 0:`
UI: More friendly message when no model is loaded 2025-05-09 16:21:05 +02:00			`error_msg = "No model is loaded.\n\nTo get started:\n1) Place a GGUF file in your user_data/models folder\n2) Go to the Model tab and select it"`
			`logger.error(error_msg)`
			`return False, error_msg`
			`else:`
			`error_msg = "No model is loaded. Please select one in the Model tab."`
			`logger.error(error_msg)`
			`return False, error_msg`

			`return True, None`


Sort dropdowns numerically 2023-05-06 04:14:56 +02:00			`def get_available_models():`
Allow for model subfolder organization for GGUF files (#6686) --------- Co-authored-by: oobabooga <112222186+oobabooga@users.noreply.github.com> 2025-04-18 07:53:59 +02:00			`# Get all GGUF files`
			`gguf_files = get_available_ggufs()`

UI: show only part 00001 of multipart GGUF models in the model menu 2025-04-23 04:56:42 +02:00			`# Filter out non-first parts of multipart GGUF files`
			`filtered_gguf_files = []`
			`for gguf_path in gguf_files:`
			`filename = os.path.basename(gguf_path)`

			`match = re.search(r'-(\d+)-of-\d+\.gguf$', filename)`

			`if match:`
			`part_number = match.group(1)`
			`# Keep only if it's part 1`
			`if part_number.lstrip("0") == "1":`
			`filtered_gguf_files.append(gguf_path)`
			`else:`
			`# Not a multi-part file`
			`filtered_gguf_files.append(gguf_path)`

Allow for model subfolder organization for GGUF files (#6686) --------- Co-authored-by: oobabooga <112222186+oobabooga@users.noreply.github.com> 2025-04-18 07:53:59 +02:00			`model_dir = Path(shared.args.model_dir)`

			`# Find top-level directories containing GGUF files`
			`dirs_with_gguf = set()`
			`for gguf_path in gguf_files:`
			`path = Path(gguf_path)`
Restructure the repository (#6904) 2025-04-26 13:56:54 +02:00			`if len(path.parts) > 0:`
UI: show only part 00001 of multipart GGUF models in the model menu 2025-04-23 04:56:42 +02:00			`dirs_with_gguf.add(path.parts[0])`
Allow for model subfolder organization for GGUF files (#6686) --------- Co-authored-by: oobabooga <112222186+oobabooga@users.noreply.github.com> 2025-04-18 07:53:59 +02:00
UI: show only part 00001 of multipart GGUF models in the model menu 2025-04-23 04:56:42 +02:00			`# Find directories with safetensors files`
Allow for model subfolder organization for GGUF files (#6686) --------- Co-authored-by: oobabooga <112222186+oobabooga@users.noreply.github.com> 2025-04-18 07:53:59 +02:00			`dirs_with_safetensors = set()`
			`for item in os.listdir(model_dir):`
			`item_path = model_dir / item`
			`if item_path.is_dir():`
Consider files with .pt extension in the new model menu function 2025-04-18 08:10:43 +02:00			`if any(file.lower().endswith(('.safetensors', '.pt')) for file in os.listdir(item_path) if (item_path / file).is_file()):`
Allow for model subfolder organization for GGUF files (#6686) --------- Co-authored-by: oobabooga <112222186+oobabooga@users.noreply.github.com> 2025-04-18 07:53:59 +02:00			`dirs_with_safetensors.add(item)`

			`# Find valid model directories`
			`model_dirs = []`
			`for item in os.listdir(model_dir):`
			`item_path = model_dir / item`
			`if not item_path.is_dir():`
			`continue`

UI: show only part 00001 of multipart GGUF models in the model menu 2025-04-23 04:56:42 +02:00			`# Include directory if it either doesn't contain GGUF files`
			`# or contains both GGUF and safetensors files`
Allow for model subfolder organization for GGUF files (#6686) --------- Co-authored-by: oobabooga <112222186+oobabooga@users.noreply.github.com> 2025-04-18 07:53:59 +02:00			`if item not in dirs_with_gguf or item in dirs_with_safetensors:`
			`model_dirs.append(item)`

			`model_dirs = sorted(model_dirs, key=natural_keys)`

Remove the 'None' option from the model menu 2025-05-17 02:53:20 +02:00			`return filtered_gguf_files + model_dirs`
Add a "llamacpp_HF creator" menu (#5519) 2024-02-16 16:43:24 +01:00

			`def get_available_ggufs():`
			`model_list = []`
Allow for model subfolder organization for GGUF files (#6686) --------- Co-authored-by: oobabooga <112222186+oobabooga@users.noreply.github.com> 2025-04-18 07:53:59 +02:00			`model_dir = Path(shared.args.model_dir)`

			`for dirpath, _, files in os.walk(model_dir, followlinks=True):`
			`for file in files:`
			`if file.lower().endswith(".gguf"):`
			`model_path = Path(dirpath) / file`
			`rel_path = model_path.relative_to(model_dir)`
			`model_list.append(str(rel_path))`
Don't show oobabooga_llama-tokenizer in the model dropdown 2023-08-10 19:01:12 +02:00
Allow for model subfolder organization for GGUF files (#6686) --------- Co-authored-by: oobabooga <112222186+oobabooga@users.noreply.github.com> 2025-04-18 07:53:59 +02:00			`return sorted(model_list, key=natural_keys)`
Sort dropdowns numerically 2023-05-06 04:14:56 +02:00

Add multimodal support (llama.cpp) (#7027) 2025-08-10 06:27:25 +02:00			`def get_available_mmproj():`
			`mmproj_dir = Path('user_data/mmproj')`
			`if not mmproj_dir.exists():`
			`return ['None']`

			`mmproj_files = []`
			`for item in mmproj_dir.iterdir():`
			`if item.is_file() and item.suffix.lower() in ('.gguf', '.bin'):`
			`mmproj_files.append(item.name)`

			`return ['None'] + sorted(mmproj_files, key=natural_keys)`


Sort dropdowns numerically 2023-05-06 04:14:56 +02:00			`def get_available_presets():`
Restructure the repository (#6904) 2025-04-26 13:56:54 +02:00			`return sorted(set((k.stem for k in Path('user_data/presets').glob('*.yaml'))), key=natural_keys)`
Sort dropdowns numerically 2023-05-06 04:14:56 +02:00

			`def get_available_prompts():`
Autosave generated text in the Notebook tab (#7079) 2025-06-16 22:36:05 +02:00			`notebook_dir = Path('user_data/logs/notebook')`
Revert "Safer usage of mkdir across the project" This reverts commit 0d1597616ff9be86d70a5eae49b021f65fc4457f. 2025-06-17 16:11:59 +02:00			`notebook_dir.mkdir(parents=True, exist_ok=True)`
Autosave generated text in the Notebook tab (#7079) 2025-06-16 22:36:05 +02:00
			`prompt_files = list(notebook_dir.glob('*.txt'))`
Optimize the UI (#6251) 2024-07-21 05:01:42 +02:00			`sorted_files = sorted(prompt_files, key=lambda x: x.stat().st_mtime, reverse=True)`
			`prompts = [file.stem for file in sorted_files]`
Sort dropdowns numerically 2023-05-06 04:14:56 +02:00			`return prompts`


			`def get_available_characters():`
Restructure the repository (#6904) 2025-04-26 13:56:54 +02:00			`paths = (x for x in Path('user_data/characters').iterdir() if x.suffix in ('.json', '.yaml', '.yml'))`
Multiple histories for each character (#4022) 2023-09-21 22:19:32 +02:00			`return sorted(set((k.stem for k in paths)), key=natural_keys)`
Sort dropdowns numerically 2023-05-06 04:14:56 +02:00

			`def get_available_instruction_templates():`
Restructure the repository (#6904) 2025-04-26 13:56:54 +02:00			`path = "user_data/instruction-templates"`
Sort dropdowns numerically 2023-05-06 04:14:56 +02:00			`paths = []`
			`if os.path.exists(path):`
			`paths = (x for x in Path(path).iterdir() if x.suffix in ('.json', '.yaml', '.yml'))`
Remove duplicate code 2023-05-10 06:34:04 +02:00
Add a menu for customizing the instruction template for the model (#5521) 2024-02-16 18:21:17 +01:00			`return ['None'] + sorted(set((k.stem for k in paths)), key=natural_keys)`
Sort dropdowns numerically 2023-05-06 04:14:56 +02:00

			`def get_available_extensions():`
Support installing user extensions in user_data/extensions/ 2025-07-07 02:29:29 +02:00			`# User extensions (higher priority)`
			`user_extensions = []`
			`user_ext_path = Path('user_data/extensions')`
			`if user_ext_path.exists():`
			`user_exts = map(lambda x: x.parts[2], user_ext_path.glob('*/script.py'))`
			`user_extensions = sorted(set(user_exts), key=natural_keys)`

			`# System extensions (excluding those overridden by user extensions)`
			`system_exts = map(lambda x: x.parts[1], Path('extensions').glob('*/script.py'))`
			`system_extensions = sorted(set(system_exts) - set(user_extensions), key=natural_keys)`

			`return user_extensions + system_extensions`
Sort dropdowns numerically 2023-05-06 04:14:56 +02:00

			`def get_available_loras():`
Bump to latest gradio (3.47) (#4258) 2023-10-11 03:20:49 +02:00			`return ['None'] + sorted([item.name for item in list(Path(shared.args.lora_dir).glob('*')) if not item.name.endswith(('.txt', '-np', '.pt', '.json'))], key=natural_keys)`
Sort dropdowns numerically 2023-05-06 04:14:56 +02:00

			`def get_datasets(path: str, ext: str):`
Add ability to load all text files from a subdirectory for training (#1997) * Update utils.py returns individual txt files and subdirectories to getdatasets to allow for training from a directory of text files * Update training.py minor tweak to training on raw datasets to detect if a directory is selected, and if so, to load in all the txt files in that directory for training * Update put-trainer-datasets-here.txt document * Minor change * Use pathlib, sort by natural keys * Space --------- Co-authored-by: oobabooga <112222186+oobabooga@users.noreply.github.com> 2023-07-12 16:44:30 +02:00			`# include subdirectories for raw txt files to allow training from a subdirectory of txt files`
			`if ext == "txt":`
Training: fix .txt files now showing in dropdowns 2023-11-07 23:41:11 +01:00			`return ['None'] + sorted(set([k.stem for k in list(Path(path).glob('.txt')) + list(Path(path).glob('/')) if k.stem != 'put-trainer-datasets-here']), key=natural_keys)`
Add ability to load all text files from a subdirectory for training (#1997) * Update utils.py returns individual txt files and subdirectories to getdatasets to allow for training from a directory of text files * Update training.py minor tweak to training on raw datasets to detect if a directory is selected, and if so, to load in all the txt files in that directory for training * Update put-trainer-datasets-here.txt document * Minor change * Use pathlib, sort by natural keys * Space --------- Co-authored-by: oobabooga <112222186+oobabooga@users.noreply.github.com> 2023-07-12 16:44:30 +02:00
Sort dropdowns numerically 2023-05-06 04:14:56 +02:00			`return ['None'] + sorted(set([k.stem for k in Path(path).glob(f'*.{ext}') if k.stem != 'put-trainer-datasets-here']), key=natural_keys)`
Add support for custom chat styles (#1917) 2023-05-08 17:35:03 +02:00

			`def get_available_chat_styles():`
			`return sorted(set(('-'.join(k.stem.split('-')[1:]) for k in Path('css').glob('chat_style*.css'))), key=natural_keys)`
Add grammar to llama.cpp loader (closes #4019) 2023-09-24 16:08:41 +02:00

			`def get_available_grammars():`
Restructure the repository (#6904) 2025-04-26 13:56:54 +02:00			`return ['None'] + sorted([item.name for item in list(Path('user_data/grammars').glob('*.gbnf'))], key=natural_keys)`