使用模板监控 InfluxDB OSS
使用 InfluxDB Cloud、InfluxDB 开源 (OSS) 指标模板 和 Telegraf 来监控一个或多个 InfluxDB OSS 实例。
执行以下操作
查看要求
在开始之前,请确保您有权访问以下内容
- InfluxDB Cloud 帐户(在此免费注册)
- 对 运行 InfluxDB OSS 2.x 的机器的命令行访问权限以及在该机器上安装 Telegraf 的权限
- 从运行 InfluxDB OSS 2.x 和 Telegraf 的机器到 InfluxDB Cloud 的互联网连接
- 安装模板的足够资源可用性(InfluxDB Cloud 免费计划帐户包括 资源限制)
安装 InfluxDB OSS 监控模板
InfluxDB OSS 监控模板包含一个 Telegraf 配置,该配置将 InfluxDB OSS 指标发送到 InfluxDB 端点,以及一个可视化指标的仪表盘。
转到左侧导航栏中的 设置 > 模板
在 粘贴模板资源清单文件的 URL 下,输入以下模板 URL
https://raw.githubusercontent.com/influxdata/community-templates/master/influxdb2_oss_metrics/influxdb2_oss_metrics.yml
单击 查找模板,然后单击 安装模板。InfluxDB Cloud 导入模板,其中包括以下资源
- 仪表盘
InfluxDB OSS 指标
- Telegraf 配置
scrape-influxdb-oss-telegraf
- Bucket
oss_metrics
- 检查
InfluxDB OSS Deadman
- 标签
influxdb2
和prometheus
- 仪表盘
设置 InfluxDB OSS 以进行监控
默认情况下,InfluxDB OSS 2.x 具有可用的 /metrics
端点,该端点以 Prometheus 格式导出内部 InfluxDB 指标。
- 确保
/metrics
端点 已启用。如果您已更改默认设置以禁用/metrics
端点,请 重新启用这些设置。 - 导航到您的 InfluxDB OSS 实例的
/metrics
端点,以在浏览器中查看 InfluxDB OSS 系统指标
设置 Telegraf
设置 Telegraf 以从 InfluxDB OSS 抓取指标并发送到您的 InfluxDB Cloud 帐户。
在您要监控的每个 InfluxDB OSS 实例上,执行以下操作
在您的 Telegraf 环境中设置以下环境变量
INFLUX_URL
:您的 InfluxDB Cloud 区域 URLINFLUX_ORG
:您的 InfluxDB Cloud 组织名称
在 InfluxDB Cloud UI 中,转到左侧导航栏中的 加载数据 > Telegraf。
单击 抓取 InfluxDB OSS 指标 下的 设置说明。
完成 Telegraf 设置说明,以使用存储在 InfluxDB Cloud 中的抓取 InfluxDB OSS 指标 Telegraf 配置来启动 Telegraf。
对于您的 API 令牌,生成新令牌或使用现有的所有访问令牌。如果您以服务形式运行 Telegraf,请编辑您的 init 脚本以设置环境变量并确保服务可用。
Telegraf 在后台静默运行(不显示立即输出),并开始将指标推送到您的 InfluxDB Cloud 帐户中的 oss_metrics
Bucket。
查看监控仪表盘
要实时查看您的数据,请查看监控仪表盘。
在您的 InfluxDB Cloud 帐户中选择 仪表盘。
单击 InfluxDB OSS 指标。指标将显示在您的仪表盘中。
根据需要自定义您的监控仪表盘。例如,在以下情况下发送警报
- 用户创建新任务或 Bucket
- 您正在测试机器限制
- 指标停止报告
当指标停止报告时发出警报
监控模板包含一个 deadman 检查,用于验证指标是否按规律的时间间隔报告。
要在数据停止从 InfluxDB OSS 实例流向您的 InfluxDB Cloud 帐户时发出警报,请执行以下操作
- 自定义 deadman 检查 以识别您要监控的字段。
- 创建通知端点和规则,以便在触发 deadman 检查时接收通知。
自定义 deadman 检查
要查看 deadman 检查,请单击您的 InfluxDB Cloud 帐户导航栏中的 警报。
为您的 deadman 警报选择一个 InfluxDB OSS 字段或创建一个新的 OSS 字段
- 单击 创建 并在下拉菜单中选择 Deadman 检查。
- 使用至少一个字段定义您的查询。
- 单击 提交 和 配置检查。当指标停止报告时,您将收到警报。
在 计划时间间隔 下开始,设置检查数据的时间量。
设置切换到严重警报之前等待的时间量。
单击 以保存检查。
创建通知端点和规则
要在触发 deadman 检查时接收通知消息,请创建一个 通知端点 和 规则。
创建通知端点
InfluxData 支持不同的端点:Slack、PagerDuty 和 HTTP。Slack 对所有用户免费,而 PagerDuty 和 HTTP 专用于按使用量计费的计划。
向 Slack 发送通知
创建 Slack Webhooks。
转到左侧导航菜单中的 警报 > 警报,然后单击 通知端点。
单击 创建,然后输入您的 Slack 端点的名称和描述。
在 传入 Webhook URL 下输入您的 Slack Webhook,然后单击 创建通知端点。
向 PagerDuty 或 HTTP 发送通知
通过 升级您的 InfluxDB Cloud 帐户,向 PagerDuty 或 HTTP 端点(其他 webhook)发送通知。
创建通知规则
创建通知规则,以设置何时向您的通知端点发送 deadman 警报消息的规则。
转到左侧导航菜单中的 警报 > 警报,然后单击 通知规则。
单击 创建,然后提供所需的信息。
单击 创建通知规则。
此页内容是否对您有帮助?
感谢您的反馈!