๋ชฉ์ฐจ
๊น๋์_4028 | ๋ฏผ๋ณต๊ธฐ_T4074 | ๋ฐ๊ฒฝ์ค_T4076 | ์คํฌ์ _T4129 | ์ฉํฌ์_T4130 |
- public
- private
-
ํ๋ก์ ํธ ์ฃผ์
์ฌ์ฉ์์ ์ํ ์์ฒญ ์ด๋ ฅ ๋ฐ์ดํฐ๋ฅผ ๋ฐํ์ผ๋ก ์ฌ์ฉ์๊ฐ ๋ค์์ ์์ฒญํ ์ํ ๋ฐ ์ข์ํ ์ํ๋ฅผ ์์ธกํ๋ ๊ฒ
- timestamp๋ฅผ ๊ณ ๋ คํ ์ฌ์ฉ์์ ์์ฐจ์ ์ธ ์ด๋ ฅ
- implicit feedback
- ์์ดํ (์ํ)๊ณผ ๊ด๋ จ๋ content (side-information)์ ํ์ฉ๋ฐฉ์
-
ํ๋ก์ ํธ ๊ฐ์
- input:ย user์ implicit ๋ฐ์ดํฐ, item(movie)์ meta๋ฐ์ดํฐ
- output:ย user์๊ฒ ์ถ์ฒํ๋ item์ user, item์ด ','๋ก ๊ตฌ๋ถ๋ ํ์ผ(csv) ๋ก ์ ์ถ
- metrics : normalized Recall@K
-
๋ฐ์ดํฐ์
-
์๋ณธ ๋ฐ์ดํฐ๊ฐ ์๋ค๋ฉด ํน์ ์์ ์ดํ์ ๋ฐ์ดํฐ (sequential)์ ํน์ ์์ ์ด์ ์ ์ผ๋ถ ๋ฐ์ดํฐ(static) ๋ฐ์ดํฐ๋ฅผ ์์๋ก ์ถ์ถํ์ฌ, ์ ๋ต (ground-truth) ๋ฐ์ดํฐ๋ก ์ฌ์ฉ
-
๋ฐ์ดํฐ์ ๊ตฌ์กฐ
train โโโ Ml_item2attributes.json # item๊ณผ genre์ mapping ๋ฐ์ดํฐ โโโ directors.tsv # item, director โโโ genres.tsv # item, genre -> 1:N โโโ titles.tsv # item, title โโโ train_ratings.csv # user, item, timestamp โโโ writers.tsv # item, writer โโโ years.tsv # item, year
-
-
๋ฒ ์ด์ค๋ผ์ธ ๊ตฌ์กฐ (๋ํ ์ ๊ณต )
code โโโ datasets.py # โ โโโ PretrainDataset โ โโโ SASRecDataset โ โโโ models.py # โ โโโ S3RecModel โโโ modules.py # โ โโโ LayerNorm โ โโโ Embeddings โ โโโ SelfAttention โ โโโ Intermediate โ โโโ Layer โ โโโ Encoder โ โโโ trainers.py # โ โโโ Trainer โ โโโ PretrainTrainer โ โโโ FinetuneTrainer โ โโโ inference.py # โ โโโ preprocessing.py # โโโ utils.py # โ โโโ run_pretrain.py # โโโ run_train.py # โโโ sample_submission.ipynb # โโโ requirements.txt # โโโ output โโโ most_popular_submission.csv
-
RecBole ๋ฒ ์ด์ค๋ผ์ธ ๊ตฌ์กฐ
-
๋ฒ ์ด์ค๋ผ์ธ
### Installation conda create -n movie_rec conda activate movie_rec pip install -r requirements.txt ### Pretraining python run_pretrain.py ### Fine-tuning (Main Training) # without pre-trained weight python run_train.py # with pre-trained weight python run_train.py --using_pretrain ### Inference python inference.py
-
RecBole