vllm-project · bmullick-amd · Jan 6, 2025 · Jan 30, 2025 · Jan 30, 2025 · Feb 3, 2025
diff --git a/vllm/inputs/preprocess.py b/vllm/inputs/preprocess.py
@@ -157,7 +157,7 @@ def _prepare_decoder_input_ids_for_generation(
         if decoder_input_ids is None:
             # no decoder prompt input ->
             # use decoder_start_token_id as decoder_input_ids
-            decoder_input_ids = self._get_default_enc_dec_decoder_prompt()
+            decoder_input_ids = [decoder_start_token_id]
 
         if (len(decoder_input_ids) == 0
                 or decoder_input_ids[0] != decoder_start_token_id):

diff --git a/vllm/model_executor/models/registry.py b/vllm/model_executor/models/registry.py
@@ -103,6 +103,9 @@
     "BartModel": ("bart", "BartForConditionalGeneration"),
     "BartForConditionalGeneration": ("bart", "BartForConditionalGeneration"),
     "Florence2ForConditionalGeneration": ("florence2", "Florence2ForConditionalGeneration"),  # noqa: E501
+    "T5Model": ("t5", "T5ForConditionalGeneration"),
+    "T5ForConditionalGeneration": ("t5", "T5ForConditionalGeneration"),
+    "T5WithLMHeadModel": ("t5", "T5ForConditionalGeneration")
 }
 
 _EMBEDDING_MODELS = {