配置监视器系统以监控 InfluxDB 1.x 服务器
InfluxData 的 TICK stack 的灵活性和可移植性使其易于在不同的监控解决方案中使用,包括使用另一个 TICK stack 监控 TICK stack。本指南将引导您设置一个外部 TICK stack 监视器,重要的指标将被发送到该监视器并进行监控。
本指南通篇使用以下术语
- Primary - 被监控的 TICK stack 或集群,其正常运行时间最为重要。
- Monitor - 监控 TICK stack,监控数据被发送到该 stack 并进行处理。
本指南假设主节点或集群已在运行。
安装监视器
安装一个单独的 TICK stack 作为您的监视器。您的监视器应位于与主集群不同的硬件上。TICK stack 的安装说明在安装指南中提供。
为了使您的监视器能够从主集群接收数据,主集群必须能够通过 HTTP 或 UDP 连接到您监视器的 API 端点。
在每个节点上安装 Telegraf
在您要监控的主 InfluxDB 集群中的每个节点上安装 telegraf
代理。
将 Telegraf 收集的数据发送到您的监视器
生成 Telegraf 配置文件并修改 InfluxDB 输出 url
设置,以包含您监视器的 InfluxDB API 端点的 URL。
telegraf.conf
# ...
[[outputs.influxdb]]
## The full HTTP or UDP URL for your InfluxDB instance.
urls = ["http://monitor-url.com:8086"]
# ...
配置 Telegraf 输入插件
默认情况下,Telegraf 配置为从主机收集以下系统指标
- CPU
- 磁盘
- 磁盘 IO
- 内存
- 进程
- 交换
- 系统(负载、CPU 数量、用户数量、正常运行时间等)
使用其他Telegraf 输入插件来收集各种指标。
监控 InfluxDB 性能指标
要监控 InfluxDB 的内部性能,请在用于在 InfluxDB 实例上运行 Telegraf 的 Telegraf 配置文件中启用 InfluxDB 输入插件。InfluxDB 输入插件从本地 InfluxDB /debug/vars
端点拉取InfluxDB 内部指标。
# ...
[[inputs.influxdb]]
# ...
## Multiple URLs from which to read InfluxDB-formatted JSON
## Default is "http://localhost:8086/debug/vars".
urls = [
"http://localhost:8086/debug/vars"
]
# ...
监控 Kapacitor 性能指标
要监控 Kapacitor 的内部性能,请在用于在 Kapacaitor 实例上运行 Telegraf 的 Telegraf 配置文件中启用 Kapacitor 输入插件。Kapacitor 输入插件从本地 Kapacitor /debug/vars
端点拉取Kapacitor 内部指标。
# ...
[[inputs.kapacitor]]
# ...
## Multiple URLs from which to read Kapacitor-formatted JSON
## Default is "http://localhost:9092/kapacitor/v1/debug/vars".
urls = [
"http://localhost:9092/kapacitor/v1/debug/vars"
]
# ...
(可选)命名空间监控数据
如果 Telegraf 在您的监视器实例上运行,默认情况下它会将您监视器自身的指标存储在 telegraf
数据库中。为了使您监视器的内部数据与您的其他监控数据分开,请配置您的本地 Telegraf 代理以使用 telelgraf.conf
中 [[outputs.influxdb]]
下的 database
设置写入除 telegraf
之外的数据库。
# ...
[[outputs.influxdb]]
# ...
## The target database for metrics; will be created as needed.
database = "monitor_local"
# ...
(可选)更新主hostname
Telegraf 的默认行为是在每个数据点上包含一个 host
标签,该标签使用主机机器提供的 os.hostname
。通过更新 telegraf.conf
中 [agent]
部分下的 hostname
设置来自定义 hostname。
telegraf.conf 中的自定义 hostname 示例
[agent]
# ...
## Override default hostname, if empty use os.Hostname()
hostname = "primary_influxdb_1"
# ...
启动 Telegraf
在您的每个主节点上安装并配置 Telegraf 后,使用您的自定义配置文件启动 Telegraf。
telegraf -config path/to/telegraf.conf
创建 Kapacitor 监控警报
监控数据现在应该从您的主集群流向您的监视器,在那里它可以被您监视器的 Kapacitor 组件处理。创建 Kapacitor 警报,以便在任何被监控的指标中检测到问题时向您发出警报。
此页面是否对您有帮助?
感谢您的反馈!