* nb_conda를 설치
- EDA (탐색적 데이터 분석) => 데이터 분석의 가장 기본 -> 사실(data)를 바탕으로 그 안에 내재된 내용을 알아내는 것 -> 통계적 가설검증(statistical hyphotheisis testing) 사용 _ (일원분석, 이원분석, 아노바 등..)
- Machine Learning => prediction : 기존에 있는 데이터를 바탕으로 학습하는것 _ 여기부터는 예측(prediction)이 들어간다.
- Deep learning (Machine learning 심화)
-> 파일로 넘어가서 설명합니다.
-
Data 분석이 왜 필요한가?
- Amazon의 서적 추천 시스템 : 전체 매출의 30%이상
- NETFLIX의 추천시스템
- 자율주행
- 석유 정제과정 학습
-
Why python?
- 상대적으로 쉬운 언어
- Interactive Programming이 가능
- 강력한 데이터 분석 Library
- Open source
- R언어에 비해 범용적 사용이 가능
- 주의) 하위 호완성 없음 (python 2 vs. python 3)
R은 분석만 하기에 좋고, python은 분석 결과를 확장하기에 좋다.