Skip to content

Commit

Permalink
Create 2024-04-02-AWS 시작하기
Browse files Browse the repository at this point in the history
  • Loading branch information
kihoon71 authored Apr 2, 2024
1 parent d0dcd95 commit 4f3b05b
Showing 1 changed file with 26 additions and 0 deletions.
26 changes: 26 additions & 0 deletions _posts/2024-04-02-AWS 시작하기
Original file line number Diff line number Diff line change
@@ -0,0 +1,26 @@
---
title : AWS 시작하기
date : 2024-04-02
categories : [AWS]
tags : [AWS]
---

# AWS 시작하기

## INTRO

본격적으로 시작하기 앞서서, 개인적으로 AWS 공부를 시작하는 이유에 대해 간략하게 적어두고 싶어서 먼저 들어가는 글로 남깁니다.
주니어 인공지능 엔지니어로서 커리어를 보내면서, 모델을 학습할 때에도 많은 고민과 실험이 뒤따르지만, '모델을 어떤 형태로 서빙을 하느냐?'라는 고민이 더 중요하다는 생각이 들고 있기 때문입니다.
최근에는 TensorRT라던가 quantization, pruning등 모델을 경량화해서 최대한 적은 리소스를 사용하면서 빠르게 사용자에게 서비스를 제공하려는 시도가 늘어나고 있고 아마 대부분 조직에서
사용하는 방식이라고 생각이 들기 때문입니다.

하지만, 위와 같이 모델을 경량화하더라도 해당 모델에 대한 요청을 다 cpu runtime에서 돌리는 건 상당한 무리가 따르고,
대규모 사용자가 제한된 GPU 자원을 통해 서비스를 경험하는 상황에서 코드를 통해 리퀘스트를 잘 스케쥴링하여 제어하는 것은 상대적으로 한계가 있기 떄문입니다.
결국 백엔드와 인프라적인 고민이 들어가야 하는 부분이라고 생각하기 때문입니다.
이때, AWS는 상당히 매력적입니다. 비용만 충분하다면, 손쉽게 서버 자원을 확장할 수 있기 때문입니다.






0 comments on commit 4f3b05b

Please sign in to comment.