[GPTQ] fix imports of moved add ons (#44)

yannicks1 · web-flow · commit c720b8fca410 · 2025-03-28T13:15:16.000+01:00
* fixing import for gptq functionalities

Signed-off-by: Yannick Schnider &lt;Yannick.Schnider1@ibm.com&gt;

* fix formatting

Signed-off-by: Yannick Schnider &lt;Yannick.Schnider1@ibm.com&gt;

* warning gptq not working on CPU

Signed-off-by: Yannick Schnider &lt;Yannick.Schnider1@ibm.com&gt;

* removing unused aiu-fms package

Signed-off-by: Yannick Schnider &lt;Yannick.Schnider1@ibm.com&gt;

* format fixing

Signed-off-by: Yannick Schnider &lt;Yannick.Schnider1@ibm.com&gt;

* adding fms-mo as dependency

Signed-off-by: Yannick Schnider &lt;Yannick.Schnider1@ibm.com&gt;

* dont specify version

Signed-off-by: Yannick Schnider &lt;Yannick.Schnider1@ibm.com&gt;

* removing fms-mo in requirements

Signed-off-by: Yannick Schnider &lt;Yannick.Schnider1@ibm.com&gt;

---------

Signed-off-by: Yannick Schnider &lt;Yannick.Schnider1@ibm.com&gt;
diff --git a/vllm_spyre/model_executor/model_loader/spyre.py b/vllm_spyre/model_executor/model_loader/spyre.py
@@ -1,6 +1,5 @@
 """Utilities for selecting and loading Spyre models."""
 import os
-import sys
 from typing import Optional
 
 import torch
@@ -121,19 +120,14 @@ def load_weights(self, model_config: ModelConfig, max_prompt_length: int,
                 model_config.dtype, self.dtype)
 
         if model_config.quantization == "gptq":
-
-            # note, we have to find a better way to package this
-            # shouldn't it be part of FMS?
-            sys.path.append("/home/senuser/aiu-fms")
-
             if envs_spyre.VLLM_SPYRE_DYNAMO_BACKEND == "sendnn_decoder":
-                from aiu_as_addon import aiu_adapter, aiu_linear  # noqa: F401
+                from fms_mo.aiu_addons.gptq import (  # noqa: F401
+                    gptq_aiu_adapter, gptq_aiu_linear)
                 linear_type = "gptq_aiu"
-                logger.info("Loaded `aiu_as_addon` functionalities")
+                logger.info("Loaded `aiu_addons` functionalities")
             else:
-                from cpu_addon import cpu_linear  # noqa: F401
                 linear_type = "gptq_cpu"
-                logger.info("Loaded `cpu_addon` functionalities")
+                logger.warning("GPTQ is not expected to work on CPU.")
 
             quant_cfg = model_config._parse_quant_hf_config()