Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

YBIGTA - 빅데이터 수집&분석&활용 #16

Open
jiyoung14 opened this issue Jan 29, 2018 · 0 comments
Open

YBIGTA - 빅데이터 수집&분석&활용 #16

jiyoung14 opened this issue Jan 29, 2018 · 0 comments

Comments

@jiyoung14
Copy link

jiyoung14 commented Jan 29, 2018

참석자 정보

동아리 소개

  • YBIGTA는 2012년 설립된 연세대학교 공과대학 소속 빅데이터 학술 동아리입니다. 현재 우리 세대가 맞이하고 있는 현실은 빅데이터, AI-인공지능이라는 키워드를 배제할 수 없고, 앞으로도 그러한 미래를 향해 나아가고 있기 때문에 이를 위한 기술의 연구 및 학습을 목적으로 모인 학술 모임입니다.
  • 데이터 수집부터 처리, 분석, 구현의 일련의 과정을 통해 기존에 발견하지 못했던 새로운 함의를 도출해내고, 이를 바탕으로 현실의 여러 문제들을 풀어내는 것을 목적으로 합니다. 학회 내의 전반적인 스터디 분야는 데이터 수집, 저장 및 처리, 분석, 시각화, 활용까지 데이터와 관련된 거의 모든 프로세스입니다.
  • 공통적으로는 먼저 Python 및 관련 라이브러리(Pandas, Numpy etc)를 학습하고, 이를 토대로 EDA, Machine Learning, Deep Learning, Crawling, DB-SQL을 학습하여 데이터 분석 및 처리 전반에 대해서도 학습하게 됩니다. 이후에는 3가지 특화된 팀에 소속되어 좀 더 세분화된 심화 학습 및 프로젝트를 진행합니다. 3가지 팀은 데이터 엔지니어링, 데이터 사이언스, 데이터 디자인으로 구성되며 이를 중심으로 빅데이터 처리, 분석 및 활용 등의 각 단계에 대해 좀 더 체계적이고 전문적인 스터디가 진행됩니다.

<각 팀 별 공부 분야에 대한 설명>

**데이터 엔지니어링**팀은 엄청난 양의 데이터를 수집하는 방법론, 이를 효율적으로 관리하기 위한 데이터베이스, 분산처리 프레임워크와 이를 위한 가상환경 등에 대한 기술을 배우고 연구합니다. 크롤링, SQL, HADOOP, SPARK, EMR 등의 기술 스택을 JAVA 및 Python 언어 기반으로 대용량 데이터의 안정적인 저장과 처리를 집중적으로 공부합니다. 특히 실제 현업에서 진짜 ‘빅데이터’를 처리하는 Spark와 Hadoop이 Main Study입니다.

**데이터 사이언스** 팀은 데이터의 종류와 도메인에 따른 효과적인 분석 기법 및 모델링을 공부하며 이를 직접 구현해보는 다양한 실습 프로젝트를 수행합니다. 기본적인 Statistical Learning부터 베이지안 머신러닝, RNN, CNN, GAN, AE 등 Machine/Deep Learning에 대해 이론적/수학적으로 심도 있게 학습하고 있으며, 사용하는 기술 스택은 Tensorflow, Keras, Pytorch입니다. 

**데이터 디자인** 팀은 데이터 분석 및 인터렉티브 시각화를 통한 효과적인 전달 방법을 연구합니다. 사용하는 기술 스택으로는 Data Mining, EDA, Feature Engineering, JavaScript, Flask, D3.js, Web 등이 있으며, 데이터 분석 전과 후의 효과적인 시각 전달을 깊게 연구하고 있습니다.

2017년 동아리 활동 및 수상 내역 <!-- 공개할 산출물이 있다면 함께 남겨주세요 --!>

  • 2017.10.13. BIG CONTEST 2017(대출관련 연체, 상환 예측 및 개봉예정 영화 관객수 예측) 공모전 참가 및 일부 팀 수상
  • 2017.12.29. 2017 하반기 YBIGTA OPEN SESSION 개최 (온오프믹스 – 외부 공개)
  • 2018.01.05. 신입기수(12기) 리크루팅 완료
  • 2018.01.06~07. 신입기수와 기존기수의 친목도모 MT
  • 2018.01.09~(진행중). 신입기수 방학 교육세션 진행
  • 2018.01.13~(진행중). 팀 별 세션 및 스터디 진행
  • 2018.01.25. 연세 의료원 의료 빅데이터 공모전 참가
  • 2018.01.27. 신입기수 방학 프로젝트 주제 및 조 선정, 선배 기수와 연계 및 친목도모 활동

2018 상반기 활동계획

  • 학기 중: 팀 별 세션 및 스터디 진행
    : 빅데이터 분석 공모전 참가 또는 산학협력 프로젝트 예정(계획 중, 추후 변동 가능)
    : 프로젝트 주제 선정하여 프로젝트 진행
  • 7월말: 2018 상반기 YBIGTA OPEN SESSION 개최
  • 7월말~8월초: 신입기수(13기) 리크루팅 예정

기타 <!-- 다른 동아리에 궁금한 점이나 다른 동아리와 함께 해보고 싶은 행사 등이 있다면 남겨주세요 --!>

  • (네이버 D2의 애정어린 관심과 지원이 가능함과 동시에 많은 학회가 관심이 있다는 전제 하에) 각 학회마다 자신들의 스터디 분야과 관련한 아주 큰 프로젝트를 하나씩 준비하여 박람회 같은 형식으로 서로의 결과물들을 공유해볼 수 있는 큰 행사를 주최하는 건 어떨까요?
@jiyoung14 jiyoung14 changed the title YBIGTA - 빅데이터 수집-분석-처리 YBIGTA - 빅데이터 수집&분석&활용 Jan 29, 2018
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant