Intel RDT 输入插件
此插件收集由 Intel Resource Director Technology 的监控功能提供的信息。Intel Resource Director Technology 是一种硬件框架,用于监控和控制共享资源(例如最后一级缓存、内存带宽)的使用情况。
Intel 的资源目录技术 (RDT) 框架包括:
- 缓存监控技术 (CMT)
- 内存带宽监控 (MBM)
- 缓存分配技术 (CAT)
- 代码和数据优先级 (CDP)
随着多线程和多核平台架构的出现,最后一级缓存和内存带宽是管理单线程、多线程或复杂虚拟机环境中运行的工作负载的关键资源。Intel 引入了 CMT、MBM、CAT 和 CDP 来管理这些跨共享资源的工作负载。
首次引入: Telegraf v1.16.0 标签: hardware, system 操作系统支持: linux, freebsd, macos
要求
该插件需要安装并配置 pqos 命令行工具 v4.0+ 以在 OS Interface 模式下工作。该工具是 Intel(R) RDT 软件套件 的一部分。
pqos 二进制文件需要以 root 权限运行。如果 telegraf 没有以 root 权限运行,您需要为 pqos 启用 sudo,并将 use_sudo 选项设置为 true。
要正确设置 pqos,请查看 安装指南。有关如何配置该工具的帮助,请访问 wiki 并阅读 资源控制文档。
服务输入
此插件是服务输入。普通插件收集由 interval 设置确定的指标。服务插件启动一个服务来监听并等待指标或事件发生。服务插件与普通插件的两个主要区别是:
- 全局或插件特定的
interval设置可能不适用 --test、--test-wait和--once的 CLI 选项可能不会为此插件生成输出
全局配置选项
插件支持其他全局和插件配置设置,用于修改指标、标签和字段,创建别名以及配置插件顺序等任务。更多详情请参阅 CONFIGURATION.md。
配置
# Read Intel RDT metrics
# This plugin ONLY supports non-Windows
[[inputs.intel_rdt]]
## Optionally set sampling interval to Nx100ms.
## This value is propagated to pqos tool. Interval format is defined by pqos itself.
## If not provided or provided 0, will be set to 10 = 10x100ms = 1s.
# sampling_interval = "10"
## Optionally specify the path to pqos executable.
## If not provided, auto discovery will be performed.
# pqos_path = "/usr/local/bin/pqos"
## Optionally specify if IPC and LLC_Misses metrics shouldn't be propagated.
## If not provided, default value is false.
# shortened_metrics = false
## Specify the list of groups of CPU core(s) to be provided as pqos input.
## Mandatory if processes aren't set and forbidden if processes are specified.
## e.g. ["0-3", "4,5,6"] or ["1-3,4"]
# cores = ["0-3"]
## Specify the list of processes for which Metrics will be collected.
## Mandatory if cores aren't set and forbidden if cores are specified.
## e.g. ["qemu", "pmd"]
# processes = ["process"]
## Specify if the pqos process should be called with sudo.
## Mandatory if the telegraf process does not run as root.
# use_sudo = false故障排除
指向不存在的核心将导致 pqos 抛出错误,并且插件将无法正常工作。请务必检查提供的核心编号在所需系统中是否存在。
请注意,pqos 无法同时在同一资源上读取 Intel RDT 指标。请勿在工作系统中使用任何其他正在监视相同核心或 PID 的 pqos 实例。无法在不同组上监视相同核心或 PID。
可以通过 pidof 命令手动检查给定进程的关联 PID。例如:
pidof PROCESS其中 PROCESS 是进程名。
Metrics
| 名称 | 全称 | 描述 |
|---|---|---|
| MBL | 本地 NUMA 节点上的内存带宽 | 相关 CPU 核心/进程在本地 NUMA 内存通道上的内存带宽利用率 |
| MBR | 远程 NUMA 节点上的内存带宽 | 相关 CPU 核心/进程在远程 NUMA 内存通道上的内存带宽利用率 |
| MBT | 总内存带宽 | CPU 核心/进程在本地和远程 NUMA 内存通道上使用的总内存带宽 |
| LLC | L3 缓存占用 | CPU 核心/进程的总最后一级缓存占用 |
| LLC_Misses* | L3 缓存未命中 | CPU 核心/进程的总最后一级缓存未命中 |
| IPC* | 每周期指令数 | CPU 核心/进程执行的总每周期指令数 |
*可选
示例输出
rdt_metric,cores=12\,19,host=r2-compute-20,name=IPC,process=top value=0 1598962030000000000
rdt_metric,cores=12\,19,host=r2-compute-20,name=LLC_Misses,process=top value=0 1598962030000000000
rdt_metric,cores=12\,19,host=r2-compute-20,name=LLC,process=top value=0 1598962030000000000
rdt_metric,cores=12\,19,host=r2-compute-20,name=MBL,process=top value=0 1598962030000000000
rdt_metric,cores=12\,19,host=r2-compute-20,name=MBR,process=top value=0 1598962030000000000
rdt_metric,cores=12\,19,host=r2-compute-20,name=MBT,process=top value=0 1598962030000000000此页面是否有帮助?
感谢您的反馈!
支持和反馈
感谢您成为我们社区的一员!我们欢迎并鼓励您对 Telegraf 和本文档提出反馈和 bug 报告。要获取支持,请使用以下资源
具有年度合同或支持合同的客户可以 联系 InfluxData 支持。