(선행 과정) python & ML preprocessing
일종의 프로그램. Spam filter, Auto-driving 등을 기존 explicit programming으로 처리하기에 한계를 느끼고, Arther Samuel 이 자동으로 상황에 따라 학습하는 프로그램을 제시.
- Supervised : traing set 존재. 데이터(labeled table)로부터 학습한다. (예, Image labeling, Email spam filter, Predicting exam score)
- Unsupervised : 위와 반대의 개념. unlabeld data를 이용한다. (예, Google news grouping, Word clustering)
X (factor) | Y |
---|---|
3, 5, 9 | 3 |
2, 5, 7 | 2 |
2, 3, 5 | 1 |
=> Model 을 생성. 생성된 모델로 부터 Y를 유추할 수 있다. (예, x(9, 3, 6) -> Y)
- AlphaGo : 기보(training set)을 통해 학습
- 시험 성적 예측 : Regression
- Pass / Non-pass 예측 : Binary Classification
- Letter Grade (A,B,C,D,F) : multi-label classification
X (hours) | Y (Score) |
---|---|
10 | 90 |
9 | 80 |
3 | 50 |
2 | 30 |
공부한 시간(X)에 따른 성적(Y) 결과는 선형적이므로 Regression 문제로 간주할 수 있다.
Python coding 가능한 deep learning 라이브러리. 많은 deep learing library 가 존재하나 tensorflow 가 압도적으로 사용자가 많다.