Releases · runpod-workers/worker-vllm

31 Dec 01:47

pandyamarut

v1.8.0

8e3c26b

v1.8.0 Latest

Latest

Update vllm version from v0.6.4 --> v0.6.6.
Support for DeepSeek V3 Model.

Assets 2

20 Nov 22:57

pandyamarut

v1.7.0

2df915a

v1.7.0

Update vllm to 0.6.4.

Assets 2

16 Oct 00:37

pandyamarut

v1.6.0

ce47c41

v1.6.0

Merge pull request #125 from runpod-workers/up-0.6.3

update vllm

Assets 2

01 Oct 18:23

pandyamarut

v1.5.0

d3ee323

v1.5.0

vllm version update 0.6.1 --> 0.6.2.
Supports llama 3.2 Models.

Assets 2

17 Sep 06:22

pandyamarut

v1.4.0

b1554ea

v1.4.0: Merge pull request #109 from runpod-workers/0.5.5-update

vllm version update 0.5.5 --> 0.6.1

Assets 2

06 Sep 19:42

pandyamarut

v1.3.1

b1554ea

v1.3.1

vLLm version: 0.5.5

OpenAI Completion Requests Bug fix.

Assets 2

29 Aug 06:34

pandyamarut

v1.3.0

286d6ba

v1.3.0

Version upgrade from vllm v0.5.4 -> v0.5.5

Various improvements and bug fixes.
[Known Issue]: OpenAI Completion Requests error.

Assets 2

09 Aug 21:59

pandyamarut

v1.2.0

eb75a3a

v1.2.0

Version upgrade from vllm v0.5.3 -> v0.5.4

Various improvements and bug fixes.
[Known Issue]: OpenAI Completion Requests error.

Assets 2

02 Aug 23:54

pandyamarut

v1.1

37d140a

v1.1.0

Major update from vllm v0.4.2 -> v0.5.3.
supports Llama 3.1 version models.
Various improvements and bug fixes.
[Known Issue]: OpenAI Completion Requests error.

Assets 2

13 Jun 17:52

alpayariyak

1.0.1

0e1e383

1.0.1

Hotfix adding backwards compatibility for deprecated max_context_len_to_capture engine argument

Assets 2

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Releases: runpod-workers/worker-vllm

v1.8.0

v1.7.0

v1.6.0

v1.5.0

v1.4.0: Merge pull request #109 from runpod-workers/0.5.5-update

v1.3.1

v1.3.0

v1.2.0

v1.1.0

1.0.1