From e12bb2178093019dd4a0ecbb67d2c45c231a1fcd Mon Sep 17 00:00:00 2001
From: Jaret Burkett <jaretburkett@gmail.com>
Date: Thu, 14 Aug 2025 09:59:58 -0600
Subject: [PATCH] Quantize blocks sequentialls without a ARA

---
 toolkit/util/quantize.py | 6 +++---
 1 file changed, 3 insertions(+), 3 deletions(-)

diff --git a/toolkit/util/quantize.py b/toolkit/util/quantize.py
index 641c8ae9..f421190c 100644
--- a/toolkit/util/quantize.py
+++ b/toolkit/util/quantize.py
@@ -283,9 +283,9 @@ def quantize_model(
         all_blocks: List[torch.nn.Module] = []
         transformer_block_names = base_model.get_transformer_block_names()
         for name in transformer_block_names:
-            block = getattr(model_to_quantize, name, None)
-            if block is not None:
-                all_blocks.append(block)
+            block_list = getattr(model_to_quantize, name, None)
+            if block_list is not None:
+                all_blocks += list(block_list)
         base_model.print_and_status_update(
             f" - quantizing {len(all_blocks)} transformer blocks"
         )