文档文档

使用模板监控 InfluxDB OSS

使用 InfluxDB CloudInfluxDB 开源 (OSS) 指标模板Telegraf 来监控一个或多个 InfluxDB OSS 实例。

执行以下操作

  1. 查看要求
  2. 安装 InfluxDB OSS 监控模板
  3. 设置 InfluxDB OSS 以进行监控
  4. 设置 Telegraf
  5. 查看监控仪表盘
  6. (可选)当指标停止报告时发出警报
  7. (可选)创建通知端点和规则

查看要求

在开始之前,请确保您有权访问以下内容

  • InfluxDB Cloud 帐户(在此免费注册
  • 运行 InfluxDB OSS 2.x 的机器的命令行访问权限以及在该机器上安装 Telegraf 的权限
  • 从运行 InfluxDB OSS 2.x 和 Telegraf 的机器到 InfluxDB Cloud 的互联网连接
  • 安装模板的足够资源可用性(InfluxDB Cloud 免费计划帐户包括 资源限制

安装 InfluxDB OSS 监控模板

InfluxDB OSS 监控模板包含一个 Telegraf 配置,该配置将 InfluxDB OSS 指标发送到 InfluxDB 端点,以及一个可视化指标的仪表盘。

  1. 登录到您的 InfluxDB Cloud 帐户.

  2. 转到左侧导航栏中的 设置 > 模板

  3. 粘贴模板资源清单文件的 URL 下,输入以下模板 URL

    https://raw.githubusercontent.com/influxdata/community-templates/master/influxdb2_oss_metrics/influxdb2_oss_metrics.yml
    
  4. 单击 查找模板,然后单击 安装模板。InfluxDB Cloud 导入模板,其中包括以下资源

    • 仪表盘 InfluxDB OSS 指标
    • Telegraf 配置 scrape-influxdb-oss-telegraf
    • Bucket oss_metrics
    • 检查 InfluxDB OSS Deadman
    • 标签 influxdb2prometheus

设置 InfluxDB OSS 以进行监控

默认情况下,InfluxDB OSS 2.x 具有可用的 /metrics 端点,该端点以 Prometheus 格式导出内部 InfluxDB 指标。

  1. 确保 /metrics 端点 已启用。如果您已更改默认设置以禁用 /metrics 端点,请 重新启用这些设置
  2. 导航到您的 InfluxDB OSS 实例的 /metrics 端点,以在浏览器中查看 InfluxDB OSS 系统指标

设置 Telegraf

设置 Telegraf 以从 InfluxDB OSS 抓取指标并发送到您的 InfluxDB Cloud 帐户。

在您要监控的每个 InfluxDB OSS 实例上,执行以下操作

  1. 安装 Telegraf.

  2. 在您的 Telegraf 环境中设置以下环境变量

  3. 在 InfluxDB Cloud UI 中,转到左侧导航栏中的 加载数据 > Telegraf

  4. 单击 抓取 InfluxDB OSS 指标 下的 设置说明

  5. 完成 Telegraf 设置说明,以使用存储在 InfluxDB Cloud 中的抓取 InfluxDB OSS 指标 Telegraf 配置来启动 Telegraf。

    对于您的 API 令牌,生成新令牌或使用现有的所有访问令牌。如果您以服务形式运行 Telegraf,请编辑您的 init 脚本以设置环境变量并确保服务可用。

Telegraf 在后台静默运行(不显示立即输出),并开始将指标推送到您的 InfluxDB Cloud 帐户中的 oss_metrics Bucket。

查看监控仪表盘

要实时查看您的数据,请查看监控仪表盘。

  1. 在您的 InfluxDB Cloud 帐户中选择 仪表盘

  2. 单击 InfluxDB OSS 指标。指标将显示在您的仪表盘中。

  3. 根据需要自定义您的监控仪表盘。例如,在以下情况下发送警报

当指标停止报告时发出警报

监控模板包含一个 deadman 检查,用于验证指标是否按规律的时间间隔报告。

要在数据停止从 InfluxDB OSS 实例流向您的 InfluxDB Cloud 帐户时发出警报,请执行以下操作

  1. 自定义 deadman 检查 以识别您要监控的字段。
  2. 创建通知端点和规则,以便在触发 deadman 检查时接收通知。

自定义 deadman 检查

  1. 要查看 deadman 检查,请单击您的 InfluxDB Cloud 帐户导航栏中的 警报

  2. 为您的 deadman 警报选择一个 InfluxDB OSS 字段或创建一个新的 OSS 字段

    1. 单击 创建 并在下拉菜单中选择 Deadman 检查
    2. 使用至少一个字段定义您的查询。
    3. 单击 提交配置检查。当指标停止报告时,您将收到警报。
  3. 计划时间间隔 下开始,设置检查数据的时间量。

  4. 设置切换到严重警报之前等待的时间量。

  5. 单击 以保存检查。

创建通知端点和规则

要在触发 deadman 检查时接收通知消息,请创建一个 通知端点规则

创建通知端点

InfluxData 支持不同的端点:Slack、PagerDuty 和 HTTP。Slack 对所有用户免费,而 PagerDuty 和 HTTP 专用于按使用量计费的计划。

向 Slack 发送通知

  1. 创建 Slack Webhooks

  2. 转到左侧导航菜单中的 警报 > 警报,然后单击 通知端点

  3. 单击 创建,然后输入您的 Slack 端点的名称和描述。

  4. 传入 Webhook URL 下输入您的 Slack Webhook,然后单击 创建通知端点

向 PagerDuty 或 HTTP 发送通知

通过 升级您的 InfluxDB Cloud 帐户,向 PagerDuty 或 HTTP 端点(其他 webhook)发送通知。

创建通知规则

创建通知规则,以设置何时向您的通知端点发送 deadman 警报消息的规则。

  1. 转到左侧导航菜单中的 警报 > 警报,然后单击 通知规则

  2. 单击 创建,然后提供所需的信息。

  3. 单击 创建通知规则


此页内容是否对您有帮助?

感谢您的反馈!


Flux 的未来

Flux 即将进入维护模式。您可以继续像现在这样使用它,而无需对代码进行任何更改。

阅读更多

现已全面上市

InfluxDB 3 Core 和 Enterprise

快速启动。更快扩展。

获取更新

InfluxDB 3 Core 是一个开源、高速、近实时数据引擎,可实时收集和处理数据,并将其持久化到本地磁盘或对象存储。InfluxDB 3 Enterprise 构建在 Core 的基础上,增加了高可用性、只读副本、增强的安全性以及数据压缩,以实现更快的查询和优化的存储。InfluxDB 3 Enterprise 的免费层级可供非商业家庭或业余爱好者使用。

有关更多信息,请查看