From 664439864e8424f8a4e2efe5449311acaa4d842a Mon Sep 17 00:00:00 2001
From: Hyunjae Woo <hwoo@nvidia.com>
Date: Tue, 3 Oct 2023 16:56:10 -0700
Subject: [PATCH] Update sample output

---
 src/c++/perf_analyzer/docs/llm.md | 6 +++---
 1 file changed, 3 insertions(+), 3 deletions(-)

diff --git a/src/c++/perf_analyzer/docs/llm.md b/src/c++/perf_analyzer/docs/llm.md
index b4102952e..ccd16eaea 100644
--- a/src/c++/perf_analyzer/docs/llm.md
+++ b/src/c++/perf_analyzer/docs/llm.md
@@ -122,7 +122,7 @@ python profile.py -m vllm --prompt-size-range 100 500 200 --max-tokens 256 --ign
 
 # Sample output
 # [ Benchmark Summary ]
-#   Prompt size: 100, Average first-token latency: 0.0436 sec, Average token-token latency: 0.0070 sec
-#   Prompt size: 300, Average first-token latency: 0.0311 sec, Average token-token latency: 0.0071 sec
-#   Prompt size: 500, Average first-token latency: 0.0875 sec, Average token-token latency: 0.0073 sec
+#   Prompt size: 100, Average first-token latency: 0.0388 sec, Average token-token latency: 0.0066 sec
+#   Prompt size: 300, Average first-token latency: 0.0431 sec, Average token-token latency: 0.0071 sec
+#   Prompt size: 500, Average first-token latency: 0.0400 sec, Average token-token latency: 0.0070 sec
 ```