대학내일연구소에 의하면 20대의 절반이상은 오늘 점심 메뉴를 고민하는 것을 가장 어려운 고민으로 뽑는데요. 메뉴 선택에 어려움을 겪는 젊은 세대를 위해 장소 내에서 강력하게 점심을 추천해주는 서비스을 기획했습니다.
-
식당 정보 및 유저 리뷰 정보: 네이버 My Place 및 네이버 에서 웹 스크랩핑
-
식당 위치 정보 : Naver api 지역 정보 검색 기능으로 식당 및 유저의 좌표 값 수집
-
서울시 내 총 41460 개의 식당, 382939 명의 유저 데이터 수집
모델을 오프라인 테스트 하기 위해서 데이터를 train data, test data 로 나눠야하는데 이 때 두가지 방법으로 분할 하였습니다. random 분할은 유저의 리뷰 중 무작위로 test data로 뽑아냈고 time 분할은 유저가 마지막으로 리뷰한 데이터를 test data로 뽑아냈습니다
모델명 | recall@20(Rand) | recall@20(Rand) | Personalization |
---|---|---|---|
SASRec | 5.65% | 5.96% | 0.00669 |
MuiltiVAE | 11.23% | 10.02% | 0.00253 |
EASE | 29.10% | 24.29% | 0.00334 |
단순 인기도 모델 | 0.03% | 0.03% | |
단순 랜덤 추천 | 0.01% | 0.01% |
📦level3_productserving-level3-recsys-04
┣ 📂airflow
┃ ┣ 📂dags
┃ ┣ 📂ease
┃ ┣ 📂multi_vae
┃ ┣ 📂sasrec
┃ ┗ 📜batch_modeling.py
┣ 📂backend
┃ ┣ 📂app
┃ ┃ ┣ 📂models
┃ ┃ ┃ ┣ 📂data
┃ ┃ ┃ ┣ 📂ease
┃ ┃ ┃ ┣ 📂multivae
┃ ┃ ┃ ┗ 📂sasrec
┃ ┃ ┣ 📜main.py
┃ ┃ ┣ 📜type.py
┃ ┃ ┣ 📜__init__.py
┃ ┃ ┗ 📜__main__.py
┃ ┣ 📜README.md
┃ ┗ 📜requirements.txt
┣ 📂crawings
┃ ┣ 📂user_csv
┃ ┣ 📂area_csv
┃ ┣ 📜1.Kcrawling_rest_server.ipynb
┃ ┣ 📜2.Kcrwaling_concat.ipynb
┃ ┣ 📜3.Kcrawling_user_review.ipynb
┃ ┣ 📜3.Kcrawling_user_review.py
┃ ┣ 📜3_1.Kcrawling_user_review.py
┃ ┣ 📜4.Kcrawling_user_review_failed.ipynb
┃ ┣ 📜5.Kcrawling_get_rest_info.ipynb
┃ ┣ 📜chromedriver.exe
┃ ┣ 📜Kcsv_concat.ipynb
┃ ┗ 📜requirements.txt
┣ 📂database
┃ ┣ 📜DB_test.py
┃ ┣ 📜HowToUse.ipynb
┃ ┗ 📜HowToUse_local.ipynb
┣ 📂frontend
┃ ┣ 📂public
┃ ┃ ┣ 📂img
┃ ┃ ┗ 📜index.html
┃ ┣ 📂src
┃ ┃ ┣ 📂pages
┃ ┃ ┣ 📜index.js
┃ ┃ ┣ 📜setupProxy.js
┃ ┃ ┗ 📜style.css
┃ ┣ 📜README.md
┣ 📂model
┃ ┣ 📂cos_sim
┃ ┃ ┣ 📜cos_sim.ipynb
┃ ┣ 📂data
┃ ┃ ┣ 📜rest.csv
┃ ┃ ┗ 📜user.csv
┃ ┣ 📂EASE
┃ ┃ ┣ 📜EASE.ipynb
┃ ┃ ┣ 📜main.py
┃ ┃ ┗ 📜model.py
┃ ┣ 📂Multi-VAE
┃ ┃ ┣ 📜multi_vae.py
┃ ┃ ┗ 📜Multi_VAE_&_Multi_DAE.ipynb
┃ ┗ 📂sasrec
┃ ┃ ┣ 📜datasets.py
┃ ┃ ┣ ...
┃ ┃ ┗ 📜utils.py
┣ 📜.gitignore
┗ 📜README.md
김성연 | 배성재 | 양승훈 | 조수연 | 황선태 | 홍재형 |
- 김성연: 모델링, 데이터베이스(SQLite), 데이터 전처리, metric 정의, airflow
- 배성재: 데이터 크롤링, 프론트엔드(React), 서비스 배포, 식당 좌표 수집, MLflow
- 양승훈: 모델링, 백엔드(FastAPI), 서비스 배포, MLflow, airflow
- 조수연: 모델링, 백엔드(FastAPI), PPT
- 홍재형: 데이터 크롤링, 데이터베이스(SQLite), 프론트엔드(React), 백엔드(FastAPI), airflow
- 황선태: 모델링, 프론트엔드(React), 발표