Strictly check the number of placeholder tokens

Signed-off-by: DarkLight1337 <[email protected]>
vllm-project · Dec 23, 2024 · 6337c08 · 6337c08
1 parent 4873ff8
commit 6337c08
Showing 1 changed file with 9 additions and 12 deletions.
diff --git a/vllm/multimodal/processing.py b/vllm/multimodal/processing.py
@@ -1128,18 +1128,15 @@ def get_dummy_data(
         prompt_token_ids = mm_inputs["prompt_token_ids"]
         placeholders_by_modality = mm_inputs["mm_placeholders"]
 
-        total_placeholders_by_modality = dict[str, int]()
-        for modality, placeholders in placeholders_by_modality.items():
-            num_placeholders = sum(item["length"] for item in placeholders)
-            max_tokens = mm_max_tokens[modality]
-
-            if num_placeholders != max_tokens:
-                logger.warning(
-                    "The processed dummy data has a total of %d placeholder "
-                    "tokens for the '%s' modality, which is not the expected "
-                    "%d tokens.", num_placeholders, modality, max_tokens)
-
-            total_placeholders_by_modality[modality] = num_placeholders
+        total_placeholders_by_modality = {
+            modality: sum(item["length"] for item in placeholders)
+            for modality, placeholders in placeholders_by_modality.items()
+        }
+        if total_placeholders_by_modality != mm_max_tokens:
+            raise RuntimeError(
+                f"The processed dummy data has a total of "
+                f"{total_placeholders_by_modality} placeholder tokens, "
+                f"which is not the expected {mm_max_tokens} tokens.")
 
         total_len = len(prompt_token_ids)
         if total_len > seq_len: