配置监视器系统以监控 InfluxDB 1.x 服务器
InfluxData 的 TICK 栈的灵活性和可移植性使其易于在不同的监控解决方案中使用,包括使用另一个 TICK 栈监控 TICK 栈。本指南将引导您完成设置外部 TICK 栈监视器,重要指标将发送到该监视器并进行监控。
本指南通篇使用以下术语
- Primary(主要) - 被监控的 TICK 栈或集群,其正常运行时间最为重要。
- Monitor(监视器) - 监控 TICK 栈,监控数据将发送到该栈并进行处理。
本指南假设主节点或集群已在运行。
安装监视器
安装单独的 TICK 栈以充当您的监视器。您的监视器应位于与主集群不同的硬件上。《安装指南》中提供了 TICK 栈的安装说明。
为了使您的监视器能够从主集群接收数据,主集群必须能够通过 HTTP 或 UDP 连接到您的监视器的 API 端点。
在每个节点上安装 Telegraf
在您要监控的主 InfluxDB 集群中的每个节点上安装 telegraf
代理。
将 Telegraf 收集的数据发送到您的监视器
生成 Telegraf 配置文件并修改 InfluxDB 输出 url
设置,以包含您的监视器的 InfluxDB API 端点的 URL。
telegraf.conf
# ...
[[outputs.influxdb]]
## The full HTTP or UDP URL for your InfluxDB instance.
urls = ["http://monitor-url.com:8086"]
# ...
配置 Telegraf 输入插件
默认情况下,Telegraf 配置为从主机收集以下系统指标
- CPU
- Disk
- Disk IO
- Memory
- Processes
- Swap
- System(负载、CPU 数量、用户数量、正常运行时间等)
使用其他 Telegraf 输入插件来收集各种指标。
监控 InfluxDB 性能指标
要监控 InfluxDB 的内部性能,请在用于在 InfluxDB 实例上运行 Telegraf 的 Telegraf 配置文件中启用 InfluxDB 输入插件。InfluxDB 输入插件从本地 InfluxDB /debug/vars
端点拉取 InfluxDB 内部指标。
# ...
[[inputs.influxdb]]
# ...
## Multiple URLs from which to read InfluxDB-formatted JSON
## Default is "https://127.0.0.1:8086/debug/vars".
urls = [
"https://127.0.0.1:8086/debug/vars"
]
# ...
监控 Kapacitor 性能指标
要监控 Kapacitor 的内部性能,请在用于在 Kapacaitor 实例上运行 Telegraf 的 Telegraf 配置文件中启用 Kapacitor 输入插件。Kapacitor 输入插件从本地 Kapacitor /debug/vars
端点拉取 Kapacitor 内部指标。
# ...
[[inputs.kapacitor]]
# ...
## Multiple URLs from which to read Kapacitor-formatted JSON
## Default is "https://127.0.0.1:9092/kapacitor/v1/debug/vars".
urls = [
"https://127.0.0.1:9092/kapacitor/v1/debug/vars"
]
# ...
(可选)命名空间监控数据
如果 Telegraf 在您的监视器实例上运行,默认情况下它会将您监视器自身的指标存储在 telegraf
数据库中。为了将您的监视器内部数据与您的其他监控数据分开,请配置您的本地 Telegraf 代理以写入除 telegraf
之外的数据库,方法是在您的 telelgraf.conf
中的 [[outputs.influxdb]]
下使用 database
设置。
# ...
[[outputs.influxdb]]
# ...
## The target database for metrics; will be created as needed.
database = "monitor_local"
# ...
(可选)更新主hostname
Telegraf 的默认行为是在每个数据点上包含一个 host
标签,使用主机提供的 os.hostname
。通过更新您的 telegraf.conf
中 [agent]
部分下的 hostname
设置来自定义 hostname。
telegraf.conf 中的自定义 hostname 示例
[agent]
# ...
## Override default hostname, if empty use os.Hostname()
hostname = "primary_influxdb_1"
# ...
启动 Telegraf
在您的每个主节点上安装并配置 Telegraf 后,使用您的自定义配置文件启动 Telegraf。
telegraf -config path/to/telegraf.conf
创建 Kapacitor 监控警报
监控数据现在应该从您的主集群流向您的监视器,在那里它可以由您的监视器的 Kapacitor 组件处理。创建 Kapacitor 警报,以便在任何受监控的指标中检测到问题时向您发出警报。
此页面是否对您有帮助?
感谢您的反馈!