配置“监视器监视器”系统来监控 InfluxDB 1.x 服务器
InfluxData 的 TICK 堆栈的灵活性和可移植性使其易于在不同的监控解决方案中使用,包括使用另一个 TICK 堆栈监控 TICK 堆栈。本指南将引导您设置一个外部 TICK 堆栈监视器,将重要指标发送到该监视器并进行监控。
本指南中使用的术语如下
- Primary - 被监控的 TICK 堆栈或集群,其正常运行时间最为重要。
- Monitor - 监控的 TICK 堆栈,将监控数据发送到该堆栈并进行处理。
本指南假定已运行主节点或集群。
安装监视器
安装一个单独的 TICK 堆栈作为您的监视器。您的监视器应位于与主集群不同的硬件上。TICK 堆栈的安装说明在安装指南中提供。
为了让您的监视器能够接收来自主集群的数据,主集群必须能够通过 HTTP 或 UDP 连接到您的监视器的 API 端点。
在每个节点上安装 Telegraf
安装 telegraf 代理在您要监控的主 InfluxDB 集群的每个节点上。
将 Telegraf 收集的数据发送到您的监视器
生成 Telegraf 配置文件并修改 InfluxDB 输出 url 设置,以包含您监视器的 InfluxDB API 端点的 URL。
telegraf.conf
# ...
[[outputs.influxdb]]
## The full HTTP or UDP URL for your InfluxDB instance.
urls = ["http://monitor-url.com:8086"]
# ...配置 Telegraf 输入插件
默认情况下,Telegraf 配置为从主机收集以下系统指标
- CPU
- Disk
- 磁盘 IO
- Memory
- Processes
- Swap
- 系统(负载、CPU 数量、用户数量、正常运行时间等)
使用其他Telegraf 输入插件收集各种指标。
监控 InfluxDB 性能指标
要监控 InfluxDB 的内部性能,请在用于在**InfluxDB 实例**上运行 Telegraf 的 Telegraf 配置文件中启用 InfluxDB 输入插件。InfluxDB 输入插件从本地 InfluxDB /debug/vars 端点拉取InfluxDB 内部指标。
# ...
[[inputs.influxdb]]
# ...
## Multiple URLs from which to read InfluxDB-formatted JSON
## Default is "https://:8086/debug/vars".
urls = [
"https://:8086/debug/vars"
]
# ...监控 Kapacitor 性能指标
要监控 Kapacitor 的内部性能,请在用于在**Kapacaitor 实例**上运行 Telegraf 的 Telegraf 配置文件中启用 Kapacitor 输入插件。Kapacitor 输入插件从本地 Kapacitor /debug/vars 端点拉取Kapactor 内部指标。
# ...
[[inputs.kapacitor]]
# ...
## Multiple URLs from which to read Kapacitor-formatted JSON
## Default is "https://:9092/kapacitor/v1/debug/vars".
urls = [
"https://:9092/kapacitor/v1/debug/vars"
]
# ...(可选)命名空间监控数据
如果 Telegraf 在您的监视器实例上运行,它将默认将您的监视器自己的指标存储在 telegraf 数据库中。为了将您的监视器内部数据与您的其他监控数据分开,请通过在 telelgraf.conf 中的 [[outputs.influxdb]] 下使用 database 设置,配置本地 Telegraf 代理写入一个不同于 telegraf 的数据库。
# ...
[[outputs.influxdb]]
# ...
## The target database for metrics; will be created as needed.
database = "monitor_local"
# ...(可选)更新主主机名
Telegraf 的默认行为是使用主机提供的 os.hostname 在每个数据点上包含一个 host 标签。通过在 telegraf.conf 的 [agent] 部分下更新 hostname 设置来自定义主机名。
telegraf.conf 中自定义主机名的示例
[agent]
# ...
## Override default hostname, if empty use os.Hostname()
hostname = "primary_influxdb_1"
# ...启动 Telegraf
在您的主节点上安装并配置 Telegraf 后,使用自定义配置文件启动 Telegraf。
telegraf -config path/to/telegraf.conf创建 Kapacitor 监控警报
监控数据现在应该从您的主集群流向您的监视器,在那里可以被您的监视器的 Kapacitor 组件处理。创建 Kapacitor 警报,以在监控到的任何指标中检测到问题时通知您。
此页面是否有帮助?
感谢您的反馈!