grafana和prometheus是现在最常用的组合,grafana提供了监控kubernetes集群的插件。
Kubernetes集群的
Promehtues的使用在新型监控告警工具prometheus(普罗米修斯)入门使用中已经做了介绍,这里就不重复了。
这里使用的Prometheus配置文件如下:
这里直接下载二进制包:
wget https://s3-us-west-2.amazonaws.com/grafana-releases/release/grafana-5.2.3.linux-amd64.tar.gz
tar -zxvf grafana-5.2.3.linux-amd64.tar.gz
解压以后得到的文件:
$ ls grafana-5.2.3
LICENSE.md NOTICE.md README.md VERSION bin conf public scripts tools
启动:
ln -s `pwd`/conf /etc/grafana
./bin/grafana-server -config /etc/grafana/defaults.ini &
然可以通过ip:3000
访问grafana,初始用户名和密码均为admin
。
grafana的使用比较简单,页面做的很友好。
首先添加数据源,grafana支持的有:
CloudWatch
Elasticsearch
Graphite
InfluxDB
Microsoft SQL Server
MySQL
OpenTSDB
PostgreSQL
Prometheus
...
这里以添加Prometheus为例,直接填入Prometheus的地址即可,如果有账号和证书,一并添加。
测试通过之后,可以添加DashBoard。
DashBoard可以自己进行定制,也可以直接到grafana dashboards查找其他人共享的Dashboard,然后在grafana中导入即可。
Grafana有很多插件,grafana-kubernetes-app是一个比较好用的kubernetes插件:
$ ./bin/grafana-cli --pluginsDir ./data/plugins/ plugins install grafana-kubernetes-app
installing grafana-kubernetes-app @ 1.0.1
from url: https://grafana.com/api/plugins/grafana-kubernetes-app/versions/1.0.1/download
into: ./data/plugins
✔ Installed grafana-kubernetes-app successfully
Restart grafana after installing plugins . <service grafana-server restart>
安装plugin之后需要重启grafana。
重启以后,进入grafana首页,将kubernetes enable
之后,左侧边栏就会多处一个kubernetes的图标。
进入DashBoard之后,点击右上角的Setting图标
,进入DashBoard的设置页面,然后点击左侧Variables
,在右侧会看到所有的变量,
点击要修改的变量,重新设置All的默认值即可。
参考:grafana dashboard variables
可以考虑自己修改代码:
$ cd data/plugins/grafana-kubernetes-app/
$ npm install
$ npm install grunt-cli
修改之后重新编译代码:
grunt default