1. ELK 설치
brew install elastic/tap/kibana-full
brew install elastic/tap/elasticsearch-full
brew install elastic/tap/filebeat-full
brew install elastic/tap/logstash-full
brew services start elastic/tap/kibana-full
brew services start elastic/tap/elasticsearch-full
brew services start elastic/tap/filebeat-full
brew services start elastic/tap/logstash-full
- localhost:9200 접속
1. 엘라스틱서치 기본 개념 정리
- 왼쪽 데이터 형태로 들어왔을 때 엘라스틱 서치는 오른쪽 테이블 형태로 저장을 한다.
- 구글링을 할때 Text단위로 검색하는 것을 가정했을때 Elastic search를 사용했을 경우 훨씬 빠르게 데이터를 가져올 수 있다.
- index 안에 type을 갖는다.
- type안에 여러개의 document를 갖는다.
- document들은 같은 property를 갖고 있는다.
- Elastic Search는 REST API를 사용한다.
2. 엘라스틱서치 데이터 입력 조회 삭제 (GET, POST, PUT, DELETE)
- classes index가 있는지 조회 (아직은 생성안해서 조회 안되는게 맞음)
curl -XGET http://localhost:9200/classes
- 조회할 때 이쁘게 보기
curl -XGET http://localhost:9200/classes?pretty
- index가 없다는 것을 확인했으니, 인덱스 생성 해보자.
curl -XPUT http://localhost:9200/classes
- 생성된것을 조회
curl -XGET http://localhost:9200/classes?pretty
"classes" : {
"aliases" : { },
"mappings" : { },
"settings" : {
"index" : {
"routing" : {
"allocation" : {
"include" : {
"_tier_preference" : "data_content"
"number_of_shards" : "1",
"provided_name" : "classes",
"creation_date" : "1637410676372",
"number_of_replicas" : "1",
"uuid" : "sTOr1fWFTIe0JKaThOQ4LQ",
"version" : {
"created" : "7150299"
- 생성한 index 지우기
curl -XDELETE http://localhost:9200/classes
- document 생성하기
curl -XPOST http://localhost:9200/classes/class/1/ -H 'Content-Type: application/json' -d '
{"title":"Algorithm", "professor":"John"}'
index가 생성된 상태에서 해도 되고, 생성안된 상태에서 해도 된다.
index를 생성 안된상태에서 하면, 알아서 index 생성까지 해준다.
- 생성된것을 조회
curl -XGET http://localhost:9200/classes?pretty
"classes" : {
"aliases" : { },
"mappings" : {
"properties" : {
"professor" : {
"type" : "text",
"fields" : {
"keyword" : {
"type" : "keyword",
"ignore_above" : 256
"title" : {
"type" : "text",
"fields" : {
"keyword" : {
"type" : "keyword",
"ignore_above" : 256
"settings" : {
"index" : {
"routing" : {
"allocation" : {
"include" : {
"_tier_preference" : "data_content"
"number_of_shards" : "1",
"provided_name" : "classes",
"creation_date" : "1637411566405",
"number_of_replicas" : "1",
"uuid" : "HCTipXo6Stqya6SKmAXlsw",
"version" : {
"created" : "7150299"
- json파일로 document 생성
curl -XPOST http://localhost:9200/classes/class/1/ -H 'Content-Type: application/json' -d @oneclass.json
3. 엘라스틱서치 데이터 업데이트 (UPDATE)
- 업데이트할 데이터를 위해서 document 생성
curl -XPOST http://localhost:9200/classes/class/1/ -H 'Content-Type: application/json' -d '{"title": "Algorithm", "professor": "John"}'
- 1학점이라는 필드를 추가
curl -XPOST http://localhost:9200/classes/class/1/_update -H 'Content-Type: application/json' -d '{"doc" : {"unit" : 1}}'
- 추가 된 것 확인
curl -XGET http://localhost:9200/classes/class/1?pretty
- 학점을 1에서 2로 수정
curl -XPOST http://localhost:9200/classes/class/1/_update -H 'Content-Type: application/json' -d '{"doc" : {"unit" : 2}}'
- 학점에 script로 +5 시키기
curl -XPOST http://localhost:9200/classes/class/1/_update -H 'Content-Type: application/json' -d '{"script": "ctx._source.unit += 5"}'
4. 엘라스틱서치 - 벌크 (Bulk)
curl -XPOST http://localhost:9200/_bulk --data-binary @classes.json -H 'Content-Type: application/json'
- bulk 확인
curl -XGET http://localhost:9200/classes/class/2?pretty
5. 엘라스틱서치 매칭 (Mapping)
- 매핑은 데이터베이스의 스키마와 동일하다.
- 엘라스틱서치는 매핑없이도 insert 할 수 있다.
- 실제 일할때는 매핑 없이 데이터를 넣는것은 상당히 위험한 일이다.
- 매핑이 없다면 날짜를 문자열로 인식할 수 있다.
- 매핑이 없다면 숫자를 넣을때도 문자열로 인식할 수 있다.
- 그렇다면, 평균을 낼 때도 문자열로 인식되면 잘 안될 수 있다.
- 데이터를 넣을때에는 매핑을 먼저 추가해야 된다.
- 인덱스 생성
curl -XPUT 'http://localhost:9200/classes'
- 매핑 생성
curl -XPUT 'http://localhost:9200/classes/class/_mapping' -H 'Content-Type: application/json' -d @classesRating_mapping.json
curl -XPOST http://localhost:9200/_bulk --data-binary @classes.json -H 'Content-Type: application/json'
- bulk 확인
curl -XGET http://localhost:9200/classes/class/2?pretty
- 지금 실습에서는 mapping없이 bulk했을 때와의 차이점은 크게 없는 것 같다. (데이터 형식을 생각보다 알아서 잘 매칭해주는 듯함)
- 하지만, 데이터형식을 언제 다르게 해줄지 모르니, 항상 mapping을 먼저 생성해주는 것이 좋은 것 같다.
6. 엘라스틱서치 데이터 조회 (Search)
- 데이터 생성
curl -XPOST http://localhost:9200/_bulk --data-binary @simple_basketball.json -H 'Content-Type: application/json'
- 데이터 확인
curl -XGET http://localhost:9200/basketball/record/_search?pretty
- uri옵션으로 데이터 확인
curl -XGET http://localhost:9200/basketball/record/_search?q=points:30&pretty
- REQUEST BODY 로 데이터 확인
curl -XGET http://localhost:9200/basketball/record/_search?pretty -H 'Content-Type: application/json' -d '
"query": {
"term" : {"points": 30}
7. 엘라스틱서치 메트릭 어그리게이션 (Metric Aggregation)
- 평균, 합산 등을 구하는 것이 Metric Aggregation
- 데이터 생성
curl -XPOST http://localhost:9200/_bulk --data-binary @simple_basketball.json -H 'Content-Type: application/json'
- average aggregation
curl -XGET http://localhost:9200/_search?pretty --data-binary @avg_points_aggs.json -H 'Content-Type: application/json'
- max aggregation
curl -XGET http://localhost:9200/_search?pretty --data-binary @max_points_aggs.json -H 'Content-Type: application/json'
- min aggregation
curl -XGET http://localhost:9200/_search?pretty --data-binary @min_points_aggs.json -H 'Content-Type: application/json'
- sum aggregation
curl -XGET http://localhost:9200/_search?pretty --data-binary @sum_points_aggs.json -H 'Content-Type: application/json'
- stats aggregation (지금까지 한 모든 aggregation을 한번에)
curl -XGET http://localhost:9200/_search?pretty --data-binary @stats_points_aggs.json -H 'Content-Type: application/json'
8. 엘라스틱서치 버켓 어그리게이션 (Bucket Aggregation)
- group by같은 기능을 사용하는것이 Bucket Aggregation
- Bucket key로 식별되는 여러 Bucket 쿼리 컨텍스트(테이블)에서 정의된 문제의 데이터를 분할하며 Document를 그룹화하는 것이다.
- INDEX 생성
curl -XPUT localhost:9200/basketball
- mapping 적용
curl -XPUT 'localhost:9200/basketball/record/_mapping?include_type_name=true&pretty' -H'Content-Type: application/json' -d @basketball_mapping.json
- 데이터 삽입(bulk)
curl -XPOST http://localhost:9200/_bulk?pretty -H'Content-Type: application/json' --data-binary @twoteam_basketball.json
- bucket aggregation
curl -XGET http://localhost:9200/_search?pretty --data-binary @terms_aggs.json -H 'Content-Type: application/json'
- 팀별로 스코어 통계
curl -XGET http://localhost:9200/_search?pretty --data-binary @stats_by_team.json -H 'Content-Type: application/json'
2. 키바나 매니지먼트 (Kibana management)
- 이전에 진행한 index 제거
curl -XDELETE localhost:9200/basketball
- 새로 index 생성
curl -XPUT localhost:9200/basketball
- mapping정보 입력
curl -XPUT 'localhost:9200/basketball/record/_mapping?include_type_name=true&pretty' -H'Content-Type: application/json' -d @basketball_mapping.json
- 데이터 삽입(bulk)
curl -XPOST http://localhost:9200/_bulk?pretty -H 'Content-Type: application/json' --data-binary @bulk_basketball.json
3. 키바나 디스커버(Kibana discover)
- Kibana에서 디스커버 탭으로 들어가서, 2016년까지의 데이터 (2021년기준으론 약 6년전까지로 설정)를 검색
- 2016~2017까지의 데이터 보기
4. 키바나 비주얼라이즈(Kibana Visualize) - 막대 그래프, 파이차트
- Analytics에서 Visualize Library 클릭
- Create new visualization 클릭
- Explore options 클릭
- Vertical Bar(막대그래프) 또는 파이차트 검색 후 클릭
막대 그래프
5. 키바나 비주얼라이즈(Kibana Visualize) - 타일 맵, 지포에 표시
- classes index생성
curl -XPUT http://localhost:9200/classes
- mapping 정보 등록(매핑을 통해서 단순 스트링이아닌, 지도에 표시할 수 있는 값임을 나타내주어야 함)
curl -XPUT http://localhost:9200/classes/class/_mapping?include_type_name=true&pretty -H 'Content-Type: application/json' -d @classesRating_mapping.json
- bulk insert
curl -XPOST http://localhost:9200/_bulk?pretty -H 'Content-Type: application/json' --data-binary @classes.json
- 데이터 확인
curl -XGET http://localhost:9200/classes/class/1/?pretty
- kibana에서 Management의 StackManagement 클릭
- Index Pattern 클릭
- Create index Pattern 클릭
- classes* index 생성
- Visualize에서 Maps 클릭
- Add layer -> Clusters and grids
- index pattern를 classes로 적용
6. 키바나 대시보드(Dashboard)
- 대시보드에 여태까지 만든 visualize들을 원하는 위치, 원하는 크기만큼으로 지정해서 만들어 놓을수 있다.
1. 로그스태시 인스톨 셋업(logstash install)
- ELK중에서 인풋을 담당
- 로그스테시에서 받은 인풋은 변환되어서 elasticsearch로 들어간다.
- 로그스태시에서 받은 인풋은 원하는 형태로 데이터 형태를 변환한다. (ex: csv -> 수치로 변경) / 변환된 데이터는 elasticsearch로 들어간다.
- cd /usr/local/bin
- vi logstash-simple.conf 에 ch04/logstash-simple.conf 내용입력
- ./logstash -f logstash-simple.conf
1. 실전 인구 분석
- logstash 실행
./logstash -f /Users/singyeongdeog/Documents/github_code/ELK/1.elk-stack-data-analysis/ch05/logstash.conf
2. 실전 주식 분석
- conf파일의 start_position
- end: 데이터가 스트리밍형식으로 계속해서 들어올경우 사용가능, 끝에서부터 데이터를 읽음
- begining: 데이터를 처음부터 읽어야할 경우 사용가능, csv파일 등에서 읽을때 사용, 앞에서부터 읽음
- logstash 실행
sudo /usr/local/bin/logstash -f /Users/singyeongdeog/Documents/github_code/ELK/1.elk-stack-data-analysis/ch05/logstash_stock.conf
1. ELK 스택 - 클라우드 로그 분석 시스템 아키텍처
- ElasticSearch
- log를 저장하는 데이터베이스로 활요
- Logstash
- 발생된 로그를 전달받아서 엘라스틱서치에 저장하는 용도
- Kibana
- ElasticSearch에 저장된 로그를 브라우저에 출력하는 용도(시각화)
- 각각의 서버에 설치되어서, 로그 파일에 변화가 있을 때 변화된 로그 파일을 Logstash로 전송한다.
- ELK스택을 운영시에 오래된 데이터를 삭제하지않아서, 디스크 공간 문제가 생길 수 있는데, 이것을 해결해주는것이 Curator이다.
- 손쉽게 데이터 보증기간 및 데이터 최대 사용량을 설정해서 ELK스택의 디스크 공간 문제가 없도록 해준다.
2. FileBeat으로 분산 서버 로그 ELK 스택에 전달하기
- tomcat 설치
brew install tomcat
- 톰캣 실행 (brew services start로 하면 catalina.out이 안보임)
/usr/local/Cellar/tomcat/10.0.13/bin/catalina start
- catalina.out 확인
tail -f /usr/local/Cellar/tomcat/10.0.13/libexec/logs/catalina.out
- logstash 실행
/usr/local/bin/logstash -f /Users/singyeongdeog/Documents/github_code/ELK/1.elk-stack-data-analysis/ch06/logstash.conf
- filebeat yml 설정 (filebeat.prospectors는 최신버전에선 지원 안함)
vi /usr/local/etc/filebeat/filebeat.yml
- filebeat 실행
/usr/local/bin/filebeat -e
3. 큐레이터로 ELK스택 디스크 공간 자동으로 관리하기
- curator 설치
wget https://bootstrap.pypa.io/get-pip.py
sudo python get-pip.py
sudo pip install elasticsearch-curator==5.8.4
- curator 30일 기준 데이터삭제 실행
/Library/Frameworks/Python.framework/Versions/3.9/bin/curator /Users/singyeongdeog/Documents/github_code/ELK/1.elk-stack-data-analysis/ch06/delete_indices_time_base.yml --config /Users/singyeongdeog/Documents/github_code/ELK/1.elk-stack-data-analysis/ch06/curator.yml
- curator 300기가 용량 기준 데이터 삭제 실행
/Library/Frameworks/Python.framework/Versions/3.9/bin/curator /Users/singyeongdeog/Documents/github_code/ELK/1.elk-stack-data-analysis/ch06/delete_indices_size_base.yml --config /Users/singyeongdeog/Documents/github_code/ELK/1.elk-stack-data-analysis/ch06/curator.yml
- curator를 cron으로 주기적으로 실행하게 설정할 수 있다.
4. S3를 활용한 ELK 스택 로그 백업 및 복원
- s3 repository plugin 설치
cd /usr/local/bin
./elasticsearch-plugin install repository-s3
brew services restart elasticsearch-full
- elasticsearch BACKUP 설정 (curl_backup_config.sh)
curl -XPUT 'http://localhost:9200/_snapshot/s3_elk_backup' -H 'Content-Type: application/json' -d '{
"type": "s3",
"settings": {
"access_key": "[YOUR_ACCESS_KEY]",
"secret_key": "YOUR_SECRET_KEY",
"bucket": "YOUR_BUCKET",
"region": "YOUR_REGION",
"base_path": "elasticsearch",
"max_retries": 3
- BACKUP 설정 cron (s3_backup_cron)
# daily
0 0 * * * ec2-user /home/ec2-user/daily_elk_backup.sh > /home/ec2-user/log/elk_backup.log 2>&1
- 3번의 cron에서 돌리고있는 daily_elk_backup.sh
TODAY=$(date +'%Y.%m.%d')
YESTERDAY=$(date --date="1 days ago" +'%Y.%m.%d')
echo Today is $TODAY
echo Yesterday $YESTERDAY indices will be stored in S3
INDEX_PREFIXES+='tomcat- '
#INDEX_PREFIXES+='filebeat- '
#INDEX_PREFIXES+='database- '
for prefix in $INDEX_PREFIXES;
echo Start Snapshot $INDEX_NAME
curl -XPUT "http://localhost:9200/_snapshot/s3_elk_backup/$SNAPSHOT_NAME?wait_for_completion=true" -d '{
"indices": "'"$INDEX_NAME"'",
"ignore_unavailable": "true",
"include_global_state": false
echo Successfully completed storing "$INDEX_NAME" in S3
- backup 설정 확인
curl -XGET localhost:9200/_snapshot/s3_elk_backup/_all\?pretty
- backup한 index 삭제
curl -XDELETE 'localhost:9200/tomcat-2017.08.06
- index 복원하기 (elk_restore.sh)
sh elk_restore.sh tomcat-2017.08.06