Add GPU resource request to ray_serve_vllm_vicuna13b_manifest_v27.yaml #1

sfc-gh-jsummer · 2023-12-22T14:40:21Z

spec:
  containers:
  - name: vllm
    image: <<repository_url>>/rayservevllmvicuna13b
    resources:
      requests:
        nvidia.com/gpu: 1
      limits:
        nvidia.com/gpu: 1
    volumeMounts:
    - name: dshm
      mountPath: /dev/shm
    env:
      HF_TOKEN: <<hf_token>>
      HF_MODEL: lmsys/vicuna-13b-v1.5-16k
    args:
      - python3
      - main.py
      - deploy_app
      - "--url=ray://spcs-ray-custom-head-service:10001"
  volumes:
  - name: dshm
    source: memory
    size: 10.16Gi
  endpoints:
  - name: api
    port: 8000
    public: true
  networkPolicyConfig:
    allowInternetEgress: true

The text was updated successfully, but these errors were encountered:

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Add GPU resource request to ray_serve_vllm_vicuna13b_manifest_v27.yaml #1

Add GPU resource request to ray_serve_vllm_vicuna13b_manifest_v27.yaml #1

sfc-gh-jsummer commented Dec 22, 2023

Add GPU resource request to ray_serve_vllm_vicuna13b_manifest_v27.yaml #1

Add GPU resource request to ray_serve_vllm_vicuna13b_manifest_v27.yaml #1

Comments

sfc-gh-jsummer commented Dec 22, 2023