KylinESAutoInstaller 该项目使用 Ansible 自动化工具,实现在银河麒麟V10-SP3 x86架构版本上对 Elasticsearch 的一键式离线环境安装。该项目包含所有必要的安装文件,使安装过程简单快速。
- 一键式安装:使用 Ansible 简化 Elasticsearch 安装流程。
- 集成所有安装文件:将所有必需的安装文件(例如 Asnsble、Elasticsearch 和 Supervisor)集成在一起。
- 简化配置:提供简单的配置选项,以适应各种环境。
- 自动化:自动化安装过程,减少手动工作量。
- 常用功能:集群扩容节点、滚动重启、全面重启、节点下线、节点上线、节点销毁、插件安装等。
- 快速安装,节省时间。
- 简化管理,降低成本。
- 可扩展性,可以扩展到大型环境。
- 可维护性,易于维护。
- 服务器要求:银河麒麟V10-SP3 X86架构
- ansible服务器1台【172.168.0.125】
- ES master节点服务器3台
- ES data节点服务器4台
- ES coordinating节点服务器2台
- root权限
角色 | ip | 名称 |
---|---|---|
master节点 | 172.168.0.126 | node-126-master |
master节点 | 172.168.0.127 | node-127-master |
master节点 | 172.168.0.128 | node-128-master |
data节点 | 172.168.0.129 | node-129-data |
data节点 | 172.168.0.130 | node-130-data |
data节点 | 172.168.0.131 | node-131-data |
data节点 | 172.168.0.132 | node-132-data |
coordinating节点 | 172.168.0.133 | node-133-coord |
coordinating节点 | 172.168.0.134 | node-134-coord |
- 创建目录/root/yogoo_es_ansible
- 工作目录结构
Yogoo-KylinES7.16.3AutoInstaller
├─ ansible_install.sh # ansible一键安装脚本
├─ elk_pkg # ES部署相关安装包
│ └─ elk
│ └─ README.txt # 需要的安装包列表,可前往交流群下载
├─ playbook # ansible剧本文件
│ ├─ inventory # ansible剧本配置文件
│ │ ├─ all # 配置节点ip及别名
│ │ ├─ es_7.16.3 # ES安装基础配置文件
│ │ ├─ es_7.16.3_add # ES安装扩容配置文件
│ │ ├─ es_7.16.3_more # ES安装单机多实例配置文件
│ │ └─ kibana_7.16.3 # kibana安装配置文件
│ ├─ playbooks # ansible剧本目录
│ │ ├─ roles # 各安装项剧本
│ │ │ ├─ elasticsearch # ES安装相关剧本
│ │ │ ├─ kibana # kibana安装相关剧本
│ │ │ └─ supervisor # supervisor安装相关剧本
│ └─ script_bash # 剧本一键执行脚本
├─ portable-ansible-v0.4.0-py3.tar.bz2 # ansible离线包
└─ soft_pkg # 部署所需相关程序安装包
关闭防火墙,启动文件下载服务
# 查看防火墙
systemctl status firewalld
# 关闭防火墙
systemctl stop firewalld
# 启动文件下载服务
cd /root/yogoo_es_ansible/elk_pkg
nohup python3 -m http.server 8080 &
# 浏览器访问服务器ip对应地址,即可查看到 /root/yogoo_es_ansible/elk_pkg/elk 目录下文件
http://172.168.0.125:8080/elk
# 备份 /etc/hosts.bk
cp /etc/hosts /etc/hosts.bk
# 编辑hosts增加ES节点服务器ip 别名
vi /etc/hosts
# 内容为 IP地址 别名,如下所示配置所有es服务器的别名
172.168.0.126 es_126
172.168.0.127 es_127
172.168.0.128 es_128
172.168.0.129 es_129
172.168.0.130 es_130
172.168.0.131 es_131
172.168.0.132 es_132
172.168.0.133 es_133
172.168.0.134 es_134
安装sshpass 用于配置服务免密登录
cd /root/yogoo_es_ansible/soft_pkg
rpm -ivh sshpass-1.06-8.ky10.x86_64.rpm
sshpass -V
# 生成公钥,执行命令,回车直到结束
ssh-keygen
# 通过以下方式指定每台es服务器的别名配置免密登录
sshpass -p '服务器登录密码' ssh-copy-id -o StrictHostKeyChecking=no es_126
sshpass -p '服务器登录密码' ssh-copy-id -o StrictHostKeyChecking=no es_127
sshpass -p '服务器登录密码' ssh-copy-id -o StrictHostKeyChecking=no es_128
sshpass -p '服务器登录密码' ssh-copy-id -o StrictHostKeyChecking=no es_129
sshpass -p '服务器登录密码' ssh-copy-id -o StrictHostKeyChecking=no es_130
sshpass -p '服务器登录密码' ssh-copy-id -o StrictHostKeyChecking=no es_131
sshpass -p '服务器登录密码' ssh-copy-id -o StrictHostKeyChecking=no es_132
sshpass -p '服务器登录密码' ssh-copy-id -o StrictHostKeyChecking=no es_133
sshpass -p '服务器登录密码' ssh-copy-id -o StrictHostKeyChecking=no es_134
安装sshpass 用于配置服务免密登录
# 连接远程
ssh es_134
#退出远程
logout
cd /root/yogoo_es_ansible
# ansible_install.sh 增加可执行权限
chmod +x ansible_install.sh
# 执行安装 ansible 脚本
./ansible_install.sh
source /etc/profile
# 版本:2.9.0
ansible --version
在各服务器执行查看系统时间命令,如各服务器时间不一致,需进行时间同步
date +"%F %T"
在各服务器执行查看系统时间命令,如各服务器时间不一致,需进行时间同步
cd /root/yogoo_es_ansible/playbook/inventory
# 编辑all文件,内容如下
vi all
es126 ansible_host=172.168.0.126
es127 ansible_host=172.168.0.127
es128 ansible_host=172.168.0.128
es129 ansible_host=172.168.0.129
es130 ansible_host=172.168.0.130
es131 ansible_host=172.168.0.131
es132 ansible_host=172.168.0.132
es133 ansible_host=172.168.0.133
es134 ansible_host=172.168.0.134
# 执行系统时间同步 -i后跟要执行的服务器,多个服务用“,”隔开
ansible all -i 172.168.0.126,172.168.0.127,172.168.0.128,172.168.0.129,172.168.0.130,172.168.0.131,172.168.0.132,172.168.0.133,172.168.0.134 -m shell -a "date -s '2024-06-03 10:43:00'"
cd /root/yogoo_es_ansible/playbook/script_bash
chmod +x do_elasticsearch-setup.sh
chmod +x do_elasticsearch-rolling-reconfigure.sh
chmod +x do_elasticsearch-full-reconfigure.sh
chmod +x do_elasticsearch-stop-all.sh
chmod +x do_elasticsearch-start-all.sh
chmod +x do_elasticsearch-plugin.sh
chmod +x do_destroy.sh
chmod +x do_elasticsearch-add-cert.sh
chmod +x do_kibana-setup.sh
ES配置文件位置:/root/yogoo_es_ansible/playbook/inventory
cd /root/yogoo_es_ansible/playbook/inventory
#修改配置文件中的url地址为elk地址:http://172.168.0.125:8080/elk。
vi es_7.16.3
vi es_7.16.3_add
# 插件配置,根据实际需要增加或删减
plugins=[{"name": "analysis-ik", "url": "file:///opt/elk/tmp/elasticsearch-analysis-ik-7.16.3.zip"},{"name" : "analysis-pinyin","url":"file:///opt/elk/tmp/elasticsearch-analysis-pinyin-7.16.3.zip"}]
# 节点服务器配置
根据实际情况配置服务器ip、节点名称
执行脚本安装ES-7.16.3,安装结束务必记录输出的es相关登录账号和密码
脚本位置:/root/yogoo_es_ansible/playbook/script_bash
# 执行完成后记录es登录账号和密码,后续登录需要使用elastic账号
cd /root/yogoo_es_ansible/playbook/script_bash
bash do_elasticsearch-setup.sh -i es_7.16.3
# 安装完成输出内容如下:
ok: [node-126-master] => {
"output": [
"",
"### ### ### ### ### ### #",
"# es coordinating hosts #",
"### ### ### ### ### ### #",
"http://172.168.0.129:9200",
"",
"### ### ### ### ### ### ### ### ##",
"# username and passwords #",
"### ### ### ### ### ### ### ### ##",
" user: beats_system password: IMq******NkM ",
" user: logstash_system password: jxO******64M ",
" user: kibana password: Fg9******lIJ ",
" user: elastic password: t1F******0o8 ",
"",
"### ### ### ### ### ### #",
"# Running Status #",
"### ### ### ### ### ### #",
"cluster_testarm-node-126-master RUNNING pid 444336, uptime 0:00:47",
"cluster_testarm-node-127-master RUNNING pid 214721, uptime 0:00:47",
"cluster_testarm-node-128-master RUNNING pid 349138, uptime 0:00:47",
"cluster_testarm-node-129-data RUNNING pid 296113, uptime 0:00:47",
"cluster_testarm-node-130-data RUNNING pid 284565, uptime 0:00:47",
"cluster_testarm-node-131-data RUNNING pid 236536, uptime 0:00:47",
"cluster_testarm-node-132-data RUNNING pid 216559, uptime 0:00:47",
"cluster_testarm-node-133-coord RUNNING pid 236516, uptime 0:00:47",
"cluster_testarm-node-134-coord RUNNING pid 364102, uptime 0:00:47"
]
}
# 浏览器访问查看节点
# 账号密码:elastic/t1F******0o8
http://172.168.0.126:9200/_cat/nodes
各服务器确保系统时间一致,否则会引发服务器证书错误。
脚本参数说明
- -i 指定使用的ES配置文件
- -s 指定需要执行节点名称,多个节点名称使用英文逗号隔开
- -h 指定host读取文件,仅用于集群销毁脚本
# 注意:扩容的集群需要在ES配置文件中配置
cd /root/yogoo_es_ansible/playbook/script_bash
bash do_elasticsearch-setup.sh -i es_7.16.3_add -s node-132-data,node-133-coord,node-134-coord
cd /root/yogoo_es_ansible/playbook/script_bash
bash do_elasticsearch-rolling-reconfigure.sh -i es_7.16.3_add
cd /root/yogoo_es_ansible/playbook/script_bash
bash do_elasticsearch-full-reconfigure.sh -i es_7.16.3_add
cd /root/yogoo_es_ansible/playbook/script_bash
bash do_elasticsearch-stop-all.sh -i es_7.16.3_add
cd /root/yogoo_es_ansible/playbook/script_bash
bash do_elasticsearch-start-all.sh -i es_7.16.3_add
# 将节点从集群路由策略中排除(适用于持续写入ES集群)
curl -X PUT -H "Content-Type: application/json" -u "elastic:t1F******0o8" http://172.168.0.126:9200/_cluster/settings -d '
{"transient" : {"cluster.routing.allocation.exclude._ip" : "172.168.0.132,172.168.0.130"}}';
# 查看配置
curl -X GET -u "elastic:t1F******0o8" http://172.168.0.126:9200/_cluster/settings
# 等待所有分区与数据迁移完成 等待集群green/验证集群状态是否green
curl -u elastic:t1F******0o8 172.168.0.132:9200/_cat/health
# 登录对应节点所在服务器,使用supervisord工具停止es节点服务[目标节点服务器下执行]
cd /opt/elk/supervisor
#查看当前es服务状态及es服务名[目标节点服务器下执行]
supervisorctl status
#停止es节点服务[目标节点服务器下执行]
supervisorctl stop [es服务名]
# 等待集群green/验证集群状态是否green
curl -u elastic:t1F******0o8 172.168.0.126:9200/_cat/health
# 查看节点是否下线,也可通过浏览器查看
curl -X GET -u "elastic:t1F******0o8" http://172.168.0.126:9200/_cat/nodes?
# 恢复集群路由策略(适用于持续写入ES集群)
curl -X PUT -H "Content-Type: application/json" -u "elastic:t1F******0o8" http://172.168.0.126:9200/_cluster/settings -d '
{"transient" : {"cluster.routing.allocation.exclude._ip" : null}}';
# 登录对应节点所在服务器,使用supervisord工具启动es节点服务 查看当前es服务状态及es服务名
supervisorctl status
#启动es节点服务
supervisorctl start [es服务名]
# 等待集群green/验证集群状态是否green
curl -u elastic:t1F******0o8 172.168.0.126:9200/_cat/health
# 确认es配置文件中的配置
vi /root/yogoo_es_ansible/playbook/inventory/es_7.16.3_add
# plugins下载剧本确认,确保需要下载的插件都在/root/yogoo_es_ansible/elk_pkg/elk目录下
vi /root/yogoo_es_ansible/playbook/playbooks/roles/elasticsearch/tasks/plugin/download.yml
# 执行剧本
bash do_elasticsearch-plugin.sh -i es_7.16.3_add
# 验证 访问http://172.168.0.126:9200/_cat/plugins 查看各节点插件版本
# 编辑all文件
vi /root/yogoo_es_ansible/playbook/inventory/all
# 编辑内容如下,将所有es节点服务器按照 服务器别名 服务器ip 形式配置
es126 ansible_host=172.168.0.126
es127 ansible_host=172.168.0.127
# 将节点从集群路由策略中排除(适用于持续写入ES集群)
curl -X PUT -H "Content-Type: application/json" -u "elastic:t1F******0o8" http://172.168.0.126:9200/_cluster/settings -d '
{"transient" : {"cluster.routing.allocation.exclude._ip" : "172.168.0.134"}}';
# 执行销毁
bash do_destroy.sh -h all -s es134
# 恢复集群路由策略配置
curl -X PUT -H "Content-Type: application/json" -u "elastic:t1F******0o8" http://172.168.0.126:9200/_cluster/settings -d '
{"transient" : {"cluster.routing.allocation.exclude._ip" : null}}';
cd /root/yogoo_es_ansible/playbook/script_bash
bash do_elasticsearch-add-cert.sh -i es_7.16.3_add
# 结果查看[在节点服务器查看]
cd /opt/elk/cluster_testarm/elasticsearch/node-134-coord/config/certs
openssl pkcs12 -in elastic-certificates.p12 -clcerts -nodes | openssl x509 -noout -enddate
# 浏览器访问查看
http://172.168.0.126:9200/_ssl/certificates
# 编辑配置文件 例:es_7.16.3_more
vi /root/yogoo_es_ansible/playbook/inventory/es_7.16.3_more
# 在节点配置中增加节点信息
# ansible_host指定为同一个ip;节点名称为不同名称;分别指定http_port、transport_port为不同的端口;jvm_heap_memory根据具体情况分配,如合计超过服务器内存则会导致节点无法启动。示例如下:
node-131-data ansible_host=172.168.0.131 node_name=node-131-data path_data=/data/elasticsearch/node-131-data path_logs=/data/elasticsearch/logs/node-131-data http_port=9201 transport_port=9301 jvm_heap_memory=1g
node-131-data-02 ansible_host=172.168.0.131 node_name=node-131-data-02 path_data=/data/elasticsearch/node-131-data-02 path_logs=/data/elasticsearch/logs/node-131-data-02 http_port=9202 transport_port=9302 jvm_heap_memory=1g
# 如果是新的节点直接执行扩容剧本
bash do_elasticsearch-setup.sh -i es_7.16.3_more -s node-131-data,node-131-data-02
# 如果是在已部署节点服务器上新增,则需销毁服务器节点后,再执行扩容
# 配置kibana_7.16.3
vi /root/yogoo_es_ansible/playbook/inventory/kibana_7.16.3
# 主要修改内容:
修改download_url、supervisor_download_url的ip地址为elk地址:172.168.0.125:8080
修改kibana_password为部署的ES kibana账号密码
修改es_hosts指定多台节点服务器
修改kibana ansible_host 指定一台master节点服务器安装
# 内容如下:
[all:vars]
download_url=http://172.168.0.125:8080/elk
supervisor_download_url=http://172.168.0.125:8080/elk
version=7.16.3
project_name=cluster_testarm
path_base=/opt/elk
supervisor_use_systemd=true
running_user=elk
url_username=elk
url_password=e******01
kibana_username=kibana
kibana_password=Fg9******lIJ
xpack_security=true
[kibana:vars]
es_hosts=['http://172.168.0.133:9200', 'http://172.168.0.134:9200']
server_host=0.0.0.0
server_port=15601
[kibana]
kibana ansible_host=172.168.0.126
cd /root/yogoo_es_ansible/playbook/script_bash
bash do_kibana-setup.sh -i kibana_7.16.3
# 访问地址:http://172.168.0.126:15601/
# 进入kibana 的开发工具页面执行以下命令
PUT _security/role/writer
{
"cluster": ["monitor","read_ilm","manage_ingest_pipelines","manage_ilm","manage_index_templates"],
"indices": [
{
"names": [ "*" ],
"privileges": ["create","create_index","index","write","manage_ilm","view_index_metadata","manage"]
}
]
}
PUT _security/user/writer
{
"password" : "wr******01",
"roles" : [ "writer"],
"full_name" : "writer",
"email" : "w****[email protected]"
}
# 进入kibana 的开发工具页面执行以下命令
PUT _cluster/settings
{
"persistent": {
"xpack": {
"monitoring": {
"collection": {
"enabled": "true"
}
}
}
}
}
# 进入kibana 的开发工具页面执行以下命令
PUT _cluster/settings
{
"persistent" : {
"cluster.routing.allocation.awareness.attributes": null
}
}