minor fixes

sony · Sep 16, 2024 · ef39522 · ef39522
1 parent 0ea601a
commit ef39522
Show file tree

Hide file tree

Showing 6 changed files with 20 additions and 14 deletions.
diff --git a/model_compression_toolkit/gptq/common/gptq_config.py b/model_compression_toolkit/gptq/common/gptq_config.py
@@ -70,7 +70,7 @@ class QFractionLinearAnnealingConfig:
 
     def __post_init__(self):
         if not (0 <= self.initial_q_fraction < self.target_q_fraction <= 1):
-            raise ValueError(f'0 <= self.initial_q_fraction < self.target_q_fraction <= 1, received initial_q_fraction '
+            raise ValueError(f'Expected 0 <= initial_q_fraction < target_q_fraction <= 1, received initial_q_fraction '
                              f'{self.initial_q_fraction} and target_q_fraction {self.target_q_fraction}.')
         if self.start_step < 0:
             raise ValueError(f'Expected start_step >= 0. received {self.start_step}.')

diff --git a/model_compression_toolkit/gptq/pytorch/quantizer/regularization_factory.py b/model_compression_toolkit/gptq/pytorch/quantizer/regularization_factory.py
@@ -20,6 +20,8 @@
 from model_compression_toolkit.trainable_infrastructure.pytorch.annealing_schedulers import LinearAnnealingScheduler
 
 
+WARMUP_STEP_FRACTION = 0.2
+
 def get_regularization(gptq_config: GradientPTQConfig, get_total_grad_steps_fn: Callable[[], int]) -> Callable:
     """
     Returns a function that computes the regularization term for GPTQ training based on the given
@@ -35,7 +37,7 @@ def get_regularization(gptq_config: GradientPTQConfig, get_total_grad_steps_fn:
     """
     if gptq_config.rounding_type == RoundingType.SoftQuantizer:
         total_gradient_steps = get_total_grad_steps_fn()
-        t_start = int(0.2 * total_gradient_steps)
+        t_start = int(WARMUP_STEP_FRACTION * total_gradient_steps)
         scheduler = LinearAnnealingScheduler(t_start=t_start, t_end=total_gradient_steps, initial_val=20, target_val=2)
         return SoftQuantizerRegularization(scheduler)
     else:

diff --git a/tests/pytorch_tests/model_tests/test_feature_models_runner.py b/tests/pytorch_tests/model_tests/test_feature_models_runner.py
@@ -617,7 +617,10 @@ def test_gptq(self):
                               weights_quant_method=QuantizationMethod.UNIFORM,
                               params_learning=False).run_test()  # TODO: When params learning is True, the uniform quantizer gets a min value  > max value
 
-        # gradual activation quantization
+    def test_gptq_with_gradual_activation(self):
+        """
+        This test checks the GPTQ feature with gradual activation quantization.
+        """
         GPTQAccuracyTest(self, gradual_activation_quantization=True).run_test()
         GPTQAccuracyTest(self, rounding_type=RoundingType.SoftQuantizer,
                          gradual_activation_quantization=True).run_test()

diff --git a/tests_pytest/pytorch/gptq/test_annealing_cfg.py b/tests_pytest/pytorch/gptq/test_annealing_cfg.py
@@ -18,23 +18,23 @@
 
 
 def test_linear_annealing_cfg_validation():
-    with pytest.raises(ValueError, match='Expected.* initial_factor <= 1'):
-        QFractionLinearAnnealingConfig(initial_factor=1.1, target_factor=0.1, start_step=0, end_step=None)
+    with pytest.raises(ValueError, match='Expected.* target_q_fraction <= 1'):
+        QFractionLinearAnnealingConfig(initial_q_fraction=0.1, target_q_fraction=1.1, start_step=0, end_step=None)
 
-    with pytest.raises(ValueError, match='Expected.* 0 <= target_factor'):
-        QFractionLinearAnnealingConfig(initial_factor=0.9, target_factor=-0.1, start_step=0, end_step=100)
+    with pytest.raises(ValueError, match='Expected.* 0 <= initial_q_fraction'):
+        QFractionLinearAnnealingConfig(initial_q_fraction=-0.1, target_q_fraction=-0.9, start_step=0, end_step=100)
 
-    with pytest.raises(ValueError, match='Expected.* target_factor < initial_factor'):
-        QFractionLinearAnnealingConfig(initial_factor=0.1, target_factor=0.1, start_step=0, end_step=100)
+    with pytest.raises(ValueError, match='Expected.* initial_q_fraction < target_q_fraction'):
+        QFractionLinearAnnealingConfig(initial_q_fraction=0.1, target_q_fraction=0.1, start_step=0, end_step=100)
 
-    with pytest.raises(ValueError, match='Expected.* target_factor < initial_factor'):
-        QFractionLinearAnnealingConfig(initial_factor=0.1, target_factor=0.2, start_step=0, end_step=100)
+    with pytest.raises(ValueError, match='Expected.* initial_q_fraction < target_q_fraction'):
+        QFractionLinearAnnealingConfig(initial_q_fraction=0.2, target_q_fraction=0.1, start_step=0, end_step=100)
 
     with pytest.raises(ValueError, match='Expected.* start_step >= 0'):
-        QFractionLinearAnnealingConfig(initial_factor=1, target_factor=0, start_step=-1, end_step=100)
+        QFractionLinearAnnealingConfig(initial_q_fraction=0, target_q_fraction=1, start_step=-1, end_step=100)
 
     with pytest.raises(ValueError, match='Expected.* start_step < end_step'):
-        QFractionLinearAnnealingConfig(initial_factor=1, target_factor=0, start_step=100, end_step=100)
+        QFractionLinearAnnealingConfig(initial_q_fraction=0, target_q_fraction=1, start_step=100, end_step=100)
 
     with pytest.raises(ValueError, match='Expected.* start_step < end_step'):
-        QFractionLinearAnnealingConfig(initial_factor=1, target_factor=0, start_step=100, end_step=99)
+        QFractionLinearAnnealingConfig(initial_q_fraction=0, target_q_fraction=1, start_step=100, end_step=99)
diff --git a/tests_pytest/pytorch/gptq/test_gradual_act_quantization.py b/tests_pytest/pytorch/gptq/test_gradual_act_quantization.py
@@ -91,6 +91,7 @@ def test_factory_linear_common_case(self, x):
         assert torch.allclose(y_last, quantizer(x, True))
 
     def _run_factory_test(self, qdrop_cfg, get_grad_steps_fn):
+        # Mocks are used to just pass anything
         gptq_cfg = GradientPTQConfig(n_epochs=5, optimizer=Mock(), loss=Mock(),
                                      gradual_activation_quantization_config=qdrop_cfg)
         factory = get_gradual_activation_quantizer_wrapper_factory(gptq_cfg, get_grad_steps_fn)

diff --git a/...rainable_infrastructure/test_annealing.py → ...e_infrastructure/test_linear_annealing.py b/...rainable_infrastructure/test_annealing.py → ...e_infrastructure/test_linear_annealing.py