Add link to LLM docs from PA Readme

triton-inference-server · Nov 27, 2023 · 6f4b27e · 6f4b27e
1 parent 2a125ee
commit 6f4b27e
Showing 1 changed file with 3 additions and 0 deletions.
diff --git a/src/c++/perf_analyzer/README.md b/src/c++/perf_analyzer/README.md
@@ -73,6 +73,9 @@ changes in performance as you experiment with different optimization strategies.
   [TorchServe](docs/benchmarking.md#benchmarking-torchserve) can be used as the
   inference server in addition to the default Triton server
 
+- [LLMs](docs/llm.md) can also be measured and charcterized with specific metrics
+  like token-to-token latency
+
 <br>
 
 # Quick Start