https://climbing-consonant-0d5.notion.site/Elasticsearch-6ce03943b83c472380229c6700b746be
- 프로젝트 기간: 2022년 9월 5일 ~ 2022년 11월 25일
- 목표: ElasticSearch를 활용하여 Frontend ↔ Backend 간 검색 기능을 제공하는 간단한 웹 검색 서비스를 구축하는 것.
- Frontend: React, CSS
- Backend: Node.js, Express
- Data Crawling: Scrapy(python)
- Deployment: AWS EC2
- Containerization: Docker, Docker-Compose
- 검색 기능: Client의 검색 요청을 받아 검색 결과를 렌더링.
- 조건별 필터링: 가격 범위, 카테고리 등 조건에 따른 검색 결과 필터링.
- 다양한 검색 옵션: 체크박스와 라디오 버튼을 통한 조건 검색.
- 상세 페이지로 이동: 검색 결과 중 하나의 아이템 클릭 시 상세 정보 페이지로 이동.
- 동의어 검색 및 정교한 검색 기능.
- 데이터 수집: KOBIS데이터 기반으로 Naver 영화 수집(크롤링)
- 데이터 전처리: NLP로 리뷰 데이터 토큰화 및 인코딩.
- 모델 학습: LSTM 모델을 사용하여 긍/부정 리뷰 분류.
- 분석 데이터 인덱싱: 예측된 긍/부정 리뷰와 명사 추출 데이터를 Elasticsearch에 인덱싱.
- 검색 기능: 검색어 포함 제목 검색.
- 캐러셀: 장르별 추천 영화 캐러셀.
- 자동 완성 기능: 검색어 입력 시 자동 완성 및 하이라이트 표시.
- WordCloud: 영화의 키워드로 구성된 WordCloud 제공.
- 검색 기능: 검색어가 포함된 제목으로 검색.
- 캐러셀: 10가지 장르 중 3개를 무작위로 선정해 해당 영화 10개를 캐러셀로 보여줌.
- 검색어 자동완성: 사용자가 입력한 검색어에 따른 자동완성 구현 및 하이라이팅.
- 반응형 레이아웃: 다양한 기기에서의 UI 최적화.
- 필터링 기능: 개봉 날짜, 상영시간, 최신순, 평점순 등의 필터를 지원.
- 무한스크롤: 스크롤 시 새로운 데이터 로딩.
- 로딩 스켈레톤 UI: 로딩 중 스켈레톤 화면을 표시.
- 반응형 레이아웃: 다양한 기기에서의 UI 최적화.
- 영화 포스터 및 상세 정보 표시: 포스터, 감독, 출연진 등 영화 상세 정보 표시.
- 리뷰 박스: 긍정적/부정적 리뷰를 구분하여 표시.
- WordCloud: 해당 영화의 주요 키워드를 WordCloud 형태로 시각화.
- Modal: 감독/출연진 이름을 클릭 시 해당 인물의 다른 작품을 모달로 표시.
- Graph data modeling: 영화 전체 노드를 중심으로 그룹(장르, 카테고리 등), 하위 그룹, 영화 노드를 연결하여 영화와 관련된 데이터를 시각화 (해당 부분은 front-end라이브러리 이슈로 화면에는 보여지지 않습니다.)
- AWS EC2: 메모리 제한으로 인해 Elasticsearch만 Docker 컨테이너로 배포.
이 프로젝트는 전체 Docker 컨테이너 환경을 구축하고 Elasticsearch를 활용해 다양한 조건 필터링, 자동완성 및 키워드 기반 영화 검색 기능을 지원하는 데 중점을 두었습니다.