Fix the new llama.cpp loader failing to unload models

2026-04-04 14:17:28 +00:00 · 2025-04-18 17:10:26 -07:00 · 2025-04-18 17:10:26 -07:00 · 5135523429
commit 5135523429
parent 8d481ef9d5
1 changed files with 10 additions and 6 deletions
--- a/modules/llama_cpp_server.py
+++ b/modules/llama_cpp_server.py
@ -280,13 +280,17 @@ class LlamaServer:
            bufsize=1
        )

-        def filter_stderr():
-            for line in iter(self.process.stderr.readline, ''):
-                if not line.startswith(('srv ', 'slot ')) and 'log_server_r: request: GET /health' not in line:
-                    sys.stderr.write(line)
-                    sys.stderr.flush()
+        def filter_stderr(process_stderr):
+            try:
+                for line in iter(process_stderr.readline, ''):
+                    if not line.startswith(('srv ', 'slot ')) and 'log_server_r: request: GET /health' not in line:
+                        sys.stderr.write(line)
+                        sys.stderr.flush()
+            except (ValueError, IOError):
+                # Handle pipe closed exceptions
+                pass

-        threading.Thread(target=filter_stderr, daemon=True).start()
+        threading.Thread(target=filter_stderr, args=(self.process.stderr,), daemon=True).start()

        # Wait for server to be healthy
        health_url = f"http://localhost:{self.port}/health"