vllm-project · niuzheng168 · Jul 7, 2024 · Jul 7, 2024 · Jul 8, 2024 · Jul 9, 2024
diff --git a/benchmarks/backend_request_func.py b/benchmarks/backend_request_func.py
@@ -31,7 +31,8 @@ class RequestFuncInput:
 
 @dataclass
 class RequestFuncOutput:
-    generated_text: str = ""
+    generated_text: str = "",
+    output_tokens: Union[List[int], List[List[int]]] = [],
     success: bool = False
     latency: float = 0.0
     ttft: float = 0.0  # Time to first token