fixed export

Signed-off-by: yiliu30 <[email protected]>
intel · yiliu30 · Jul 11, 2024 · Jul 11, 2024 · Jul 11, 2024 · Jul 11, 2024
commit e508c942a63bd323be0d0ff1f120c408da9af83e
diff --git a/neural_compressor/torch/algorithms/weight_only/teq.py b/neural_compressor/torch/algorithms/weight_only/teq.py
@@ -290,7 +290,11 @@ def quantize(self, **kwargs):
                 weight = m.weight.detach()
             if isinstance(m, torch.nn.Linear):  # pragma: no cover
                 int_weight, scale, zp = quant_tensor(
-                    weight.data, num_bits=num_bits, group_size=group_size, scheme=scheme
+                    weight.data,
+                    num_bits=num_bits,
+                    group_size=group_size,
+                    scheme=scheme,
+                    return_int=True,
                 )
                 int_weight = int_weight.t_().contiguous() if transpose else int_weight
                 scale = scale.t_().contiguous() if transpose else scale