Merge pull request #393 from mefich/main

Unloading vision model of VLMs for Exllamav3 backend
2026-05-25 15:14:50 +00:00 · 2025-11-19 22:46:59 -05:00
parent fece4791ad 37aea9de83
commit df724fdc78
1 changed files with 4 additions and 0 deletions
--- a/backends/exllamav3/model.py
+++ b/backends/exllamav3/model.py
@@ -563,6 +563,10 @@ class ExllamaV3Container(BaseModelContainer):
                self.draft_config = None
                self.draft_cache = None

+            if self.use_vision:
+                self.vision_model.unload()
+                self.vision_model = None
+
            # Cleanup the generator from any pending jobs
            if self.generator is not None:
                await self.generator.close()