CarperAI · Dahoas · Jun 5, 2023 · Jun 16, 2023 · Jun 16, 2023 · Jun 16, 2023
diff --git a/trlx/trainer/accelerate_base_trainer.py b/trlx/trainer/accelerate_base_trainer.py
@@ -10,6 +10,7 @@
 
 import ray
 import torch
+from torch.nn.utils.rnn import pad_sequence
 from accelerate import Accelerator  # type: ignore
 from ray.air import session
 from rich.console import Console
@@ -288,8 +289,8 @@ def generate(self, input_ids, attention_mask=None, chunk_size=None, **kwargs):
                     input_ids=input_ids[chunk_idx], attention_mask=attention_mask[chunk_idx], **generate_kwargs
                 )
             samples.append(sample)
-        # Concat samples
-        samples = torch.cat(samples, 0)
+        # Concat padded samples
+        samples = pad_sequence(samples, batch_first=True, self.tokenizer.pad_token_id)
         return samples
 
     def save_pretrained(self, directory: Optional[str] = None, **kwargs):