ProbSpace Real State Price Prediction Challenge 2

リアルなテーブルデータを用いたコンペを開催してくださったProbspace様に感謝いたします。

コンペURLは here。

結果

Public: 0.26099（7位）, Private: 0.26221（8位）

解法概要

特徴量 : よく出てくる日本語はフラグにして使用 (e.g. 'usage'), 欠損自体に意味がある気がしたので'is_nan' as a feature, など（スコア改善しなかったのでpublished_land_price.csvは使ってないです）
Validation Strategy: 5 KFold with shuffle=True.
Model : LightGBMシングル
'Leaked data'は訓練にも使用し、提出時に値を置き換えました.

評価指標はRMSLEだったので, ターゲットはnp.log1pで変換し、予測値をnp.expm1で戻しました.

Train、testは「取引時点」で分かれていたので、分布がTrainとtestが被ってなかったので「このまま使ったら推論時にモデルに外挿を求めることになる？辛い？」と躊躇したのですが、何も考えずそのまま入れた方がスコアはよかったです。シードによって予測が結構ぶれるので、3回seed averageしたものを提出しました。

謎

テーブルデータだったのでNNとGBDTのstackingが絶対効くじゃんと思っていたが、Overfitしただけだった。
NN (MLP)が雑魚すぎた（欠損値が多すぎてうまく学習させられなかった？）。
XGB、LGBは良かったが、CatBoostは、取引時点をそのまま使うと予測値がふっとんだ（「（2000万くらいの家に）この家60億円〜！！！」）

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
code		code
input		input
output		output
.gitignore		.gitignore
Dockerfile		Dockerfile
README.mdwn		README.mdwn
docker-compose.yml		docker-compose.yml
project.env		project.env
requirements.txt		requirements.txt
run_all.sh		run_all.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ProbSpace Real State Price Prediction Challenge 2

結果

解法概要

謎

About

Releases

Packages

Languages

katsu1110/ProbSpace-RealEstate2-MySolution

Folders and files

Latest commit

History

Repository files navigation

ProbSpace Real State Price Prediction Challenge 2

結果

解法概要

謎

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages