Fix result for fms generate inference

flaviabeo · flaviabeo · commit 3d30a85cee9b · 2025-07-15T15:19:06.000-03:00
Signed-off-by: Flavia Beo &lt;flavia.beo@ibm.com&gt;
diff --git a/scripts/generate_layers_metrics.py b/scripts/generate_layers_metrics.py
@@ -174,13 +174,13 @@ def __infer_layer(model, max_len, device, max_new_tokens, batch_size, tokenizer)
                     contiguous_cache=True,
                     extra_kwargs={},
                 )
+                result, timings = result
             if args.model_loader == "hf":
                 result = model.generate(ids,
                                 max_length=max_seq_len,
                                 max_new_tokens=max_new_token,
                                 do_sample=do_sample,
                                 use_cache=use_cache)
-            result, timings = result
             logger.info(f"Generation completed: Result len is {len(result)}")
             if len(result.shape) == 1:
                 result = result.unsqueeze(0)