文档文档

配置监视器系统以监控 InfluxDB 1.x 服务器

InfluxData 的 TICK 栈的灵活性和可移植性使其易于在不同的监控解决方案中使用,包括使用另一个 TICK 栈监控 TICK 栈。本指南将引导您完成设置外部 TICK 栈监视器,重要指标将发送到该监视器并进行监控。

本指南通篇使用以下术语

  • Primary(主要) - 被监控的 TICK 栈或集群,其正常运行时间最为重要。
  • Monitor(监视器) - 监控 TICK 栈,监控数据将发送到该栈并进行处理。

本指南假设主节点或集群已在运行。

安装监视器

安装单独的 TICK 栈以充当您的监视器。您的监视器应位于与主集群不同的硬件上。《安装指南》中提供了 TICK 栈的安装说明。

为了使您的监视器能够从主集群接收数据,主集群必须能够通过 HTTP 或 UDP 连接到您的监视器的 API 端点。

在每个节点上安装 Telegraf

您要监控的主 InfluxDB 集群中的每个节点上安装 telegraf 代理

将 Telegraf 收集的数据发送到您的监视器

生成 Telegraf 配置文件并修改 InfluxDB 输出 url 设置,以包含您的监视器的 InfluxDB API 端点的 URL。

telegraf.conf

# ...

[[outputs.influxdb]]
  ## The full HTTP or UDP URL for your InfluxDB instance.
  urls = ["http://monitor-url.com:8086"]

# ...

配置 Telegraf 输入插件

默认情况下,Telegraf 配置为从主机收集以下系统指标

  • CPU
  • Disk
  • Disk IO
  • Memory
  • Processes
  • Swap
  • System(负载、CPU 数量、用户数量、正常运行时间等)

使用其他 Telegraf 输入插件来收集各种指标。

监控 InfluxDB 性能指标

要监控 InfluxDB 的内部性能,请在用于在 InfluxDB 实例上运行 Telegraf 的 Telegraf 配置文件中启用 InfluxDB 输入插件。InfluxDB 输入插件从本地 InfluxDB /debug/vars 端点拉取 InfluxDB 内部指标

# ...

[[inputs.influxdb]]
  # ...
  ## Multiple URLs from which to read InfluxDB-formatted JSON
  ## Default is "https://127.0.0.1:8086/debug/vars".
  urls = [
    "https://127.0.0.1:8086/debug/vars"
  ]

# ...

监控 Kapacitor 性能指标

要监控 Kapacitor 的内部性能,请在用于在 Kapacaitor 实例上运行 Telegraf 的 Telegraf 配置文件中启用 Kapacitor 输入插件。Kapacitor 输入插件从本地 Kapacitor /debug/vars 端点拉取 Kapacitor 内部指标

# ...

[[inputs.kapacitor]]
  # ...
  ## Multiple URLs from which to read Kapacitor-formatted JSON
  ## Default is "https://127.0.0.1:9092/kapacitor/v1/debug/vars".
  urls = [
    "https://127.0.0.1:9092/kapacitor/v1/debug/vars"
  ]

# ...

(可选)命名空间监控数据

如果 Telegraf 在您的监视器实例上运行,默认情况下它会将您监视器自身的指标存储在 telegraf 数据库中。为了将您的监视器内部数据与您的其他监控数据分开,请配置您的本地 Telegraf 代理以写入除 telegraf 之外的数据库,方法是在您的 telelgraf.conf 中的 [[outputs.influxdb]] 下使用 database 设置。

# ...

[[outputs.influxdb]]
  # ...
  ## The target database for metrics; will be created as needed.
  database = "monitor_local"

  # ...

(可选)更新主hostname

Telegraf 的默认行为是在每个数据点上包含一个 host 标签,使用主机提供的 os.hostname。通过更新您的 telegraf.conf[agent] 部分下的 hostname 设置来自定义 hostname。

telegraf.conf 中的自定义 hostname 示例

[agent]

  # ...

  ## Override default hostname, if empty use os.Hostname()
  hostname = "primary_influxdb_1"

  # ...

启动 Telegraf

在您的每个主节点上安装并配置 Telegraf 后,使用您的自定义配置文件启动 Telegraf。

telegraf -config path/to/telegraf.conf

创建 Kapacitor 监控警报

监控数据现在应该从您的主集群流向您的监视器,在那里它可以由您的监视器的 Kapacitor 组件处理。创建 Kapacitor 警报,以便在任何受监控的指标中检测到问题时向您发出警报。


此页面是否对您有帮助?

感谢您的反馈!


Flux 的未来

Flux 即将进入维护模式。您可以继续像目前一样使用它,而无需对您的代码进行任何更改。

了解更多

InfluxDB 3 开源现已发布 Public Alpha 版本

InfluxDB 3 开源版本现已可用于 Alpha 测试,根据 MIT 或 Apache 2 许可获得许可。

我们正在发布作为 Alpha 版本一部分的两款产品。

InfluxDB 3 Core 是我们的全新开源产品。它是用于时间序列和事件数据的最新数据引擎。InfluxDB 3 Enterprise 是一个商业版本,它建立在 Core 的基础上,增加了历史查询功能、读取副本、高可用性、可扩展性和细粒度的安全性。

有关如何开始使用的更多信息,请查看