Skip to content

Latest commit

 

History

History
64 lines (35 loc) · 1.42 KB

Day1.md

File metadata and controls

64 lines (35 loc) · 1.42 KB

1일차


1. 환경설정

1) Anconda 설치 및 가상환경 설정

2) 라이브러리 설치

​ * nb_conda를 설치

3) 작업 디렉토리 설정 및 경로설정

4) Jupyter-notebook 환경설정 및 실행


2. Data-analysis 기초 이론

1) 빅데이터 정의

2) 빅데이터 분석

  1. EDA (탐색적 데이터 분석) => 데이터 분석의 가장 기본 -> 사실(data)를 바탕으로 그 안에 내재된 내용을 알아내는 것 -> 통계적 가설검증(statistical hyphotheisis testing) 사용 _ (일원분석, 이원분석, 아노바 등..)
  2. Machine Learning => prediction : 기존에 있는 데이터를 바탕으로 학습하는것 _ 여기부터는 예측(prediction)이 들어간다.
  3. Deep learning (Machine learning 심화)

3) Python

-> 파일로 넘어가서 설명합니다.


+a

  1. Data 분석이 왜 필요한가?

    1. Amazon의 서적 추천 시스템 : 전체 매출의 30%이상
    2. NETFLIX의 추천시스템
    3. 자율주행
    4. 석유 정제과정 학습
  2. Why python?

    1. 상대적으로 쉬운 언어
    2. Interactive Programming이 가능
    3. 강력한 데이터 분석 Library
    4. Open source
    5. R언어에 비해 범용적 사용이 가능
    6. 주의) 하위 호완성 없음 (python 2 vs. python 3)

    R은 분석만 하기에 좋고, python은 분석 결과를 확장하기에 좋다.