InfluxDB _internal 1.x 测量和字段
默认情况下,InfluxDB 会生成内部指标并将其保存到 _internal 数据库。使用这些指标来监控 InfluxDB 和 InfluxDB Enterprise,并创建警报,在出现问题时通知您。
在生产环境中禁用 _internal 数据库
InfluxData **不** 建议在生产集群中使用 _internal 数据库。它会产生不必要的开销,尤其对于繁忙的集群,可能会使已经负载过重的集群不堪重负。存储在 _internal 数据库中的指标主要用于衡量工作负载性能,应仅在非生产环境中进行测试。
要禁用 _internal 数据库,请在 InfluxDB 配置文件的 [monitor] 部分下将 store-enabled 设置为 false。
# ...
[monitor]
# ...
# Whether to record statistics internally.
store-enabled = false
#...将内部指标存储在外部监控系统中
要监控生产集群中的 InfluxDB _internal 指标,请使用 Telegraf 和 influxdb 输入插件从 InfluxDB /debug/vars 端点捕获这些指标,并将它们存储在外部 InfluxDB 监控实例中。有关更多信息,请参阅 配置 Watcher of Watchers。
使用“watcher of watcher (WoW)”配置时,InfluxDB 指标字段键会以 infuxdb_ 为前缀,但否则与 下方列出的键相同。
可视化 InfluxDB 内部指标
使用 InfluxDB OSS Monitor 仪表板或 InfluxDB Enterprise Monitor 仪表板可视化 InfluxDB _internal 指标。
InfluxDB _internal 测量和字段
ae (仅限 Enterprise)
cluster (仅限 Enterprise)
hh (仅限 Enterprise)
hh_database (仅限 Enterprise)
hh_node (仅限 Enterprise)
hh_processor (仅限 Enterprise)
rpc (仅限 Enterprise)
- cacheCompactionDuration
- cacheCompactionErr
- cacheCompactions
- cacheCompactionsActive
- tsmFullCompactionDuration
- tsmFullCompactionErr
- tsmFullCompactionQueue
- tsmFullCompactions
- tsmFullCompactionsActive
- tsmLevel1CompactionDuration
- tsmLevel1CompactionErr
- tsmLevel1CompactionQueue
- tsmLevel1Compactions
- tsmLevel1CompactionsActive
- tsmLevel2CompactionDuration
- tsmLevel2CompactionErr
- tsmLevel2CompactionQueue
- tsmLevel2Compactions
- tsmLevel2CompactionsActive
- tsmLevel3CompactionDuration
- tsmLevel3CompactionErr
- tsmLevel3CompactionQueue
- tsmLevel3Compactions
- tsmLevel3CompactionsActive
- tsmOptimizeCompactionDuration
- tsmOptimizeCompactionErr
- tsmOptimizeCompactionQueue
- tsmOptimizeCompactions
- tsmOptimizeCompactionsActive
- pointReq
- pointReqHH (仅限 Enterprise)
- pointReqLocal (仅限 Enterprise)
- pointReqRemote (仅限 Enterprise)
- pointsWrittenOK
- req
- subWriteDrop
- subWriteOk
- valuesWrittenOK
- writeDrop
- writeError
- writeOk
- writePartial (仅限 Enterprise)
- writeTimeout
ae (仅限 Enterprise)
InfluxDB Enterprise 集群中与反熵(AE)引擎相关的指标统计信息。
bytesRx
数据节点接收的字节数。
errors
导致错误的全局反熵作业总数。
jobs
数据节点执行的作业总数。
jobsActive
正在执行的作业(当前正在执行)的数量。
cluster (仅限 Enterprise)
cluster 测量跟踪与 InfluxDB Enterprise 中数据节点的集群功能相关的统计信息。序列上的标签指示统计信息的源主机。
copyShardReq
将分片从一个数据节点复制到另一个数据节点的内部请求数。
createIteratorReq
来自集群中其他数据节点的读取请求数。
expandSourcesReq
从其他数据节点发出的请求数,用于在该节点上查找与特定正则表达式匹配的测量。表示从不同数据节点发起的 SELECT(使用正则表达式)查询,该查询会向此节点发送内部请求。目前没有跟踪在特定节点上启动的、使用正则表达式而非固定测量名的查询数量的统计信息。
fieldDimensionsReq
来自其他数据节点的请求数,用于获取有关此数据节点上的测量值的字段、关联类型和标签键的信息。
iteratorCostReq
迭代器成本的内部请求数。
openConnections
跟踪数据节点正在处理的打开连接数(包括计算在单个 yamux 连接上复用的逻辑连接)。
removeShardReq
从该数据节点删除分片的内部请求数。仅通过 influxd-ctl remove shard 命令递增。
writeShardFail
来自远程节点的所有内部写入请求失败的总数。它是 InfluxDB 分片统计信息 writeReqErr 的相关项。通过 HTTP 收到的写入请求首先到达节点 A。节点 A 本地没有该分片,因此它会创建一个内部请求给节点 B,指示要写入什么以及写入哪个分片。如果节点 B 看到该请求并且出现任何问题,节点 B 会递增其自身的 writeShardFail。根据出现的问题,在大多数情况下,节点 B 还会递增其从 InfluxDB OSS 继承的 writeReqErr 统计信息。如果节点 A 本地拥有该分片,则不会有写入数据的内部请求到远程节点,因此 writeShardFail 不会递增。
writeShardPointsReq
来自任何远程节点的所有内部写入请求的点数,无论成功与否。
writeShardReq
来自远程数据节点的所有内部写入请求数,无论成功与否。
cq
与连续查询(CQ)相关的指标统计信息。
queryFail
执行但失败的连续查询总数。
queryOk
成功执行的连续查询总数。请注意,在某些情况下,即使 CQ 被触发但未实际运行(例如,由于重采样间隔配置错误),此值也可能被递增。
database
numMeasurements
指定数据库中当前测量值的数量。
系列基数(cardinality)值是基于 HyperLogLog++ (HLL++) 的估计值。当存在数千或数百万个测量或系列时,估计值返回的数字应该在相对较小的误差范围内精确。
numSeries
指定数据库的当前系列基数。系列基数值是基于 HyperLogLog++ (HLL++) 的估计值。当存在数千或数百万个测量或系列时,估计值返回的数字应该在相对较小的误差范围内精确。
hh (仅限 Enterprise)
hh 测量指标跟踪 InfluxDB Enterprise 中导致新的提示符(hinted handoff, HH)处理器事件的统计信息。hh 测量有一个额外的标签。
path- 磁盘上持久化提示符(hinted handoff)队列的路径。
writeShardReq
为远程节点由提示符(hinted handoff)引擎处理的初始写入请求数。发送到同一远程节点的后续写入请求不会递增此统计信息。此统计信息在 influxd 重启后会重置为 0,无论进程上次存活时的状态如何。当 HH “超级系统”被指示将写入排队到某个节点,而该节点的“子系统”不存在且需要创建,并且“子系统”创建成功时,此项会递增。如果进程启动时磁盘上存在远程节点的 HH 文件,则不会触及递增此统计信息的代码分支。
writeShardReqPoints
为远程节点由提示符(hinted handoff)引擎处理的初始请求中的每个点数写入请求数。
hh_database (仅限 Enterprise)
hh_database 测量聚合了单个数据库和节点的所有提示符(hinted handoff)队列。这允许准确报告单个数据库到目标节点的总队列大小。
hh_database 测量有两个额外的标签。
db— 数据库名称node— 节点标识符
bytesRead
从提示符(hinted handoff)队列读取并发送到其目标数据节点的数据点的大小(以字节为单位)。请注意,如果数据节点进程在 HH 队列中有数据时重启,bytesRead 可能会显示比 bytesWritten 更大的数字。提示符(hinted handoff)写入以并发批次进行,具体由 retry-concurrency 设置决定。如果单个写入成功,则该指标会递增。如果整个批次中的任何写入失败,则整个批次将被视为不成功,并且批次中的每个部分将在稍后重试。这并不是此统计信息的预期行为。bytesRead 可能大于 bytesWritten 的另一个情况是在进程重启后。例如,在启动时,HH 中仍有来自前一个进程运行的 1000 字节。重启后立即将 bytesRead 和 bytesWritten 都设置为零。假设 HH 被正确清空,并且没有将来的写入需要 HH,那么统计数据将显示读取 1000 字节,写入 0 字节。
在崩溃或重启后重置为零,即使 HH 队列非空。
bytesWritten
写入提示符(hinted handoff)队列的总字节数。请注意,此统计信息仅跟踪当前进程生命周期内写入的字节数。重启或崩溃后,此统计信息会重置为零,即使提示符(hinted handoff)队列非空。
queueBytes
提示符(hinted handoff)队列中剩余的总字节数。此统计信息应准确地、绝对地跟踪等待发送到远程节点的数据字节数。
此统计信息应在重启后保持正确,与 bytesRead 和 bytesWritten 不同(请参阅 #780)。
queueDepth
提示符(hinted handoff)队列中的总段数。HH 队列是一系列 10MB 的“段”文件。这是一个粗粒度的统计信息,大致表示排队等待远程节点的数据量。queueDepth 值可以让你了解队列是正在增长还是缩小。
writeBlocked
由于并发 HH 请求数量超过限制而导致写入被阻止的数量。
writeDropped
由于写入似乎已损坏而从 HH 队列中删除的写入数量。
writeNodeReq
成功将批次写入目标节点的所有写入请求总数。
writeNodeReqFail
从提示符(hinted handoff)队列写入数据批次到目标节点失败的所有写入请求总数。
writeNodeReqPoints
从 HH 队列成功写入目标节点的点数总数(fr)
writeShardReq
所有写入批次请求的总数,这些请求已排入提示符(hinted handoff)队列。
writeShardReqPoints
所有点数总数,已排入提示符(hinted handoff)队列。
hh_node (仅限 Enterprise)
在 InfluxDB Enterprise 1.9.8 及更高版本中可用。hh_node 测量存储给定节点的所有队列(分片)的提示符(hinted handoff)统计信息。
hh_node 测量有一个额外的标签。
node- 记录指标的目标节点。
queueTotalSize
单个节点的所有提示符(hinted handoff)队列使用的总磁盘空间。跟踪给定节点所有提示符(hinted handoff)队列的磁盘使用情况(而不是等待处理的字节数)。由于提示符(hinted handoff)队列的实现方式,字节被处理和它们从磁盘中删除之间存在延迟。
queueTotalSize 用于确定节点提示符(hinted handoff)队列是否已达到 hinted-handoff max-size 参数中配置的最大大小。
hh_processor (仅限 Enterprise)
hh_processor 测量存储单个队列(分片)的统计信息。在 InfluxDB Enterprise 中,每个数据节点都有一个提示符(hinted handoff)处理器。
hh_processor 测量有两个额外的标签。
node- 记录指标的目标节点。path- 磁盘上持久化提示符(hinted handoff)队列的路径。
针对主机的 hh_processor 统计信息仅在当前进程的生命周期内有效。如果进程崩溃或重启,bytesRead 和 bytesWritten 将重置为零,即使 HH 队列非空。
bytesRead
从提示符(hinted handoff)队列读取并发送到其目标数据节点的数据点的大小(以字节为单位)。请注意,如果数据节点进程在 HH 队列中有数据时重启,bytesRead 可能会显示比 bytesWritten 更大的数字。提示符(hinted handoff)写入以并发批次进行,具体由 retry-concurrency 设置决定。如果单个写入成功,则该指标会递增。如果整个批次中的任何写入失败,则整个批次将被视为不成功,并且批次中的每个部分将在稍后重试。这并不是此统计信息的预期行为。bytesRead 可能大于 bytesWritten 的另一个情况是在进程重启后。例如,在启动时,HH 中仍有来自前一个进程运行的 1000 字节。重启后立即将 bytesRead 和 bytesWritten 都设置为零。假设 HH 被正确清空,并且没有将来的写入需要 HH,那么统计数据将显示读取 1000 字节,写入 0 字节。
在崩溃或重启后重置为零,即使 HH 队列非空。
bytesWritten
写入提示符(hinted handoff)队列的总字节数。请注意,此统计信息仅跟踪当前进程生命周期内写入的字节数。重启或崩溃后,此统计信息会重置为零,即使提示符(hinted handoff)队列非空。
queueBytes
提示符(hinted handoff)队列中剩余的总字节数。此统计信息应准确地、绝对地跟踪等待发送到远程节点的数据字节数。
此统计信息应在重启后保持正确,与 bytesRead 和 bytesWritten 不同(请参阅 #780)。
queueDepth
提示符(hinted handoff)队列中的总段数。HH 队列是一系列 10MB 的“段”文件。这是一个粗粒度的统计信息,大致表示排队等待远程节点的数据量。queueDepth 值可以让你了解队列是正在增长还是缩小。
writeBlocked
由于并发 HH 请求数量超过限制而导致写入被阻止的数量。
writeDropped
由于写入似乎已损坏而从 HH 队列中删除的写入数量。
writeNodeReq
成功将批次写入目标节点的所有写入请求总数。
writeNodeReqFail
从提示符(hinted handoff)队列写入数据批次到目标节点失败的所有写入请求总数。
writeNodeReqPoints
从 HH 队列成功写入目标节点的点数总数(fr)
writeShardReq
所有写入批次请求的总数,这些请求已排入提示符(hinted handoff)队列。
writeShardReqPoints
所有点数总数,已排入提示符(hinted handoff)队列。
httpd
httpd 测量存储与 InfluxDB HTTP 服务器相关的字段。
authFail
由于需要身份验证但未提供或提供不正确而导致 HTTP 请求被中止的数量。
clientError
由于客户端错误导致 HTTP 响应的数量,HTTP 状态码为 4XX。
fluxQueryReq
为 Flux 查询请求提供的数量。
fluxQueryReqDurationNs
执行 Flux 查询请求所花费的时间(挂钟时间),以纳秒为单位。
fluxQueryRespBytes
Flux 查询响应中返回的所有字节总和。
pingReq
InfluxDB HTTP 服务器提供 /ping HTTP 端点的次数。
pointsWrittenDropped
存储引擎丢弃的点数。
pointsWrittenFail
HTTP /write 端点接受但无法持久化的点数。
pointsWrittenOK
HTTP /write 端点成功接受并持久化的点数。
promReadReq
Prometheus /read 端点的读取请求数。
promWriteReq
Prometheus /write 端点的写入请求数。
queryReq
查询请求数。
queryReqDurationNs
总查询请求持续时间,以纳秒(ns)为单位。
queryRespBytes
查询响应中返回的总字节数。
recoveredPanics
HTTP 处理程序恢复的总恐慌(panic)数。
req
提供的总 HTTP 请求数。
reqActive
当前活动请求数。
reqDurationNs
在 HTTP 请求内部花费的时间(挂钟时间),以纳秒为单位。
serverError
由于服务器错误导致 HTTP 响应的数量。
statusReq
使用 HTTP /status 端点提供的状态请求数。
valuesWrittenOK
HTTP /write 端点成功接受并持久化的值(字段)的数量。
writeReq
使用 HTTP /write 端点提供的写入请求数。
writeReqActive
当前活动写入请求数。
writeReqBytes
通过 HTTP /write 端点接收的写入请求的行协议数据总字节数。
writeReqDurationNs
使用 /write HTTP 端点提供的写入请求的持续时间(挂钟时间),以纳秒为单位。
queryExecutor
与 InfluxDB 引擎的查询执行器使用相关的 queryExecutor 统计信息。
queriesActive
当前正在处理的活动查询数。
queriesExecuted
已执行(已开始)的查询数。
queriesFinished
已完成执行的查询数。
queryDurationNs
每个已执行查询的持续时间(挂钟时间),以纳秒为单位。如果一个查询从开始到结束花费了 1000 ns,而另一个查询从开始到结束花费了 500 ns 并且在第一个查询完成之前运行,那么统计信息将增加 1500。
recoveredPanics
查询执行器恢复的恐慌(panic)数量。
rpc (仅限 Enterprise)
rpc 测量统计信息与 InfluxDB Enterprise 集群中的 RPC 调用使用相关。
idleStreams
所有活动 TCP 连接上的空闲复用流数量。
liveConnections
到其他节点的当前活动 TCP 连接数。
liveStreams
所有活动 TCP 连接上的当前活动复用流数量。
rpcCalls
到远程节点的所有 RPC 调用总数。
rpcFailures
RPC 失败的总数,这些 RPC 未能恢复。
rpcReadBytes
读取的 RPC 字节总数。
rpcRetries
至少重试过一次的 RPC 调用总数。
rpcWriteBytes
写入的 RPC 字节总数。
singleUse
使用 Dial 打开的单次使用连接总数。
singleUseOpen
当前打开的单次使用连接数。
totalConnections
已建立的 TCP 连接总数。
totalStreams
已建立的流总数。
runtime
runtime 测量统计信息包括 MemStats 记录的 Go 内存分配器统计信息的子集。runtime 统计信息可用于确定不良的内存分配策略和相关的性能问题。
Go runtime package 包含与 Go 运行时系统交互的操作,包括用于控制 goroutine 的函数。它还包括 Go reflect package 使用到的低级类型信息。
Alloc
堆对象当前分配的字节数。
Frees
已释放(活动)堆对象的累积数量。
HeapAlloc
所有堆对象的大小(以字节为单位)。
HeapIdle
空闲堆对象的字节数。
HeapInUse
使用中的 span 中的字节数。
HeapObjects
已分配的堆对象数量。
HeapReleased
返回给操作系统的物理内存字节数。
HeapSys
从操作系统获取的堆内存字节数。衡量为堆保留的虚拟地址空间量。
Lookups
运行时执行的指针查找次数。主要用于调试运行时内部。
Mallocs
已分配的堆对象总数。活动对象的总数是 Frees。
NumGC
已完成的 GC(垃圾回收)循环次数。
NumGoroutine
Go 例程总数。
PauseTotalNs
总 GC(垃圾回收)暂停的总持续时间(以纳秒为单位)。
Sys
从操作系统获取的总内存字节数。衡量 Go 运行时为堆、栈和其他内部数据结构保留的虚拟地址空间。
TotalAlloc
为堆对象分配的总字节数。释放对象时,此统计信息不会减少。
shard
shard 测量统计信息与在 InfluxDB OSS 和 InfluxDB Enterprise 中使用分片相关。
diskBytes
分片的大小(以字节为单位),包括数据目录和 WAL 目录的大小。
fieldsCreate
创建的字段数。
indexType
索引类型 inmem 或 tsi1。
seriesCreate
创建的系列数量。
writeBytes
写入分片的字节数。
writePointsDropped
写入点时因时间戳不匹配任何现有保留策略而被丢弃的请求数。也 http.pointsWrittentDropped 在点从写入中被丢弃时递增(请参阅 #780)。
writePointsErr
因错误而无法写入的点数写入请求数。
writePointsOk
成功写入的点数。
writeReq
写入请求总数。
writeReqErr
因错误而失败的写入请求总数。
writeReqOk
成功的写入请求总数。
subscriber
subscriber 测量统计信息与 InfluxDB 订阅的使用相关。
createFailures
未能创建的订阅数。
pointsWritten
成功写入订阅者的点数总数。
writeFailures
未能写入订阅者的批次数总数。
tsm1_cache
tsm1_cache 测量统计信息与 TSM 缓存的使用相关。以下查询示例计算了与 TSM 缓存相关的各种有用测量。
SELECT
max(cacheAgeMs) / 1000.000 AS CacheAgeSeconds,
max(memBytes) AS MaxMemBytes, max(diskBytes) AS MaxDiskBytes,
max(snapshotCount) AS MaxSnapShotCount,
(last(cachedBytes) - first(cachedBytes)) / (last(WALCompactionTimeMs) - first(WALCompactionTimeMs)) - 1000.000 AS CompactedBytesPerSecond,
last(cachedBytes) AS CachedBytes,
(last(cachedBytes) - first(cachedBytes))/300 as CacheThroughputBytesPerSecond
FROM _internal.monitor.tsm1_cache
WHERE time > now() - 1h
GROUP BY time(5m), pathcacheAgeMs
自上次在采样时间进行缓存快照以来的持续时间(以毫秒为单位)。此统计信息表明缓存的繁忙程度。较大的数字表示与写入无关的空闲缓存。
cachedBytes
已写入快照的总字节数。此统计信息在创建快照时更新。此统计信息用于允许计算任意两个时间点之间的缓存吞吐量。此统计信息两次采样之间的差值除以两次采样之间的时间间隔,即缓存吞吐量(更准确地说,是数据被快照化的速率)。与 diskBytes 和 memBytes 统计信息结合使用时,还可以用于计算数据进入缓存的速率以及数据从缓存中清除的速率。如果进入速率在一段时间内持续超过退出速率,则存在需要解决的问题。
diskBytes
磁盘上快照的大小(以字节为单位)。
memBytes
内存中缓存的大小(以字节为单位)。
snapshotCount
活动快照的当前级别(数量)。在一个健康的系统中,这个数字应该在 0 和 1 之间。遇到临时写入错误的系统可能会看到这个数字上升。
WALCompactionTimeMs
在压缩快照时持有提交锁的时间(以毫秒为单位)。表达式 (cachedBytes - diskBytes) / WALCompactionTime 提供了 WAL 日志提交到 TSM 文件速度的指示。在一段时间内,“WALCompactionTime”值的开始和结束之间的差值除以时间间隔的长度,提供了消耗最大缓存吞吐量多少的指示。
writeDropped
由于超时而丢弃的写入总数。
writeErr
因错误而写入失败的总数。
writeOk
成功写入的总数。
tsm1_engine
tsm1_engine 测量统计信息与使用具有压缩块的 TSM 存储引擎相关。
cacheCompactionDuration
在缓存压缩中花费的时间(挂钟时间),以纳秒为单位。
cacheCompactionErr
由于错误而失败的缓存压缩次数。
cacheCompactions
曾经运行过的缓存压缩总次数。
cacheCompactionsActive
当前正在运行的缓存压缩次数。
tsmFullCompactionDuration
在完全压缩中花费的时间(挂钟时间),以纳秒为单位。
tsmFullCompactionErr
因错误而失败的 TSM 完全压缩总次数。
tsmFullCompactionQueue
待处理 TSM 完全压缩的当前数量。
tsmFullCompactions
曾经运行过的 TSM 完全压缩总次数。
tsmFullCompactionsActive
当前正在运行的 TSM 完全压缩次数。
tsmLevel1CompactionDuration
在 TSM 级别 1 压缩中花费的时间(挂钟时间),以纳秒为单位。
tsmLevel1CompactionErr
因错误而失败的 TSM 级别 1 压缩总次数。
tsmLevel1CompactionQueue
待处理 TSM 级别 1 压缩的当前数量。
tsmLevel1Compactions
曾经运行过的 TSM 级别 1 压缩总次数。
tsmLevel1CompactionsActive
当前正在运行的 TSM 级别 1 压缩次数。
tsmLevel2CompactionDuration
在 TSM 级别 2 压缩中花费的时间(挂钟时间),以纳秒为单位。
tsmLevel2CompactionErr
因错误而失败的 TSM 级别 2 压缩次数。
tsmLevel2CompactionQueue
待处理 TSM 级别 2 压缩的当前数量。
tsmLevel2Compactions
曾经运行过的 TSM 级别 2 压缩总次数。
tsmLevel2CompactionsActive
当前正在运行的 TSM 级别 2 压缩次数。
tsmLevel3CompactionDuration
在 TSM 级别 3 压缩中花费的时间(挂钟时间),以纳秒为单位。
tsmLevel3CompactionErr
因错误而失败的 TSM 级别 3 压缩次数。
tsmLevel3CompactionQueue
待处理 TSM 级别 3 压缩的当前数量。
tsmLevel3Compactions
曾经运行过的 TSM 级别 3 压缩总次数。
tsmLevel3CompactionsActive
当前正在运行的 TSM 级别 3 压缩次数。
tsmOptimizeCompactionDuration
在 TSM 优化压缩中花费的时间(挂钟时间),以纳秒为单位。
tsmOptimizeCompactionErr
因错误而失败的 TSM 优化压缩总次数。
tsmOptimizeCompactionQueue
待处理 TSM 优化压缩的当前数量。
tsmOptimizeCompactions
曾经运行过的 TSM 优化压缩总次数。
tsmOptimizeCompactionsActive
当前正在运行的 TSM 优化压缩次数。
tsm1_filestore
tsm1_filestore 测量统计信息与 TSM 文件存储的使用相关。
diskBytes
TSM 文件存储使用的磁盘空间(以字节为单位)。
numFiles
TSM 文件存储中的文件总数。
tsm1_wal
tsm1_wal 测量统计信息与 TSM 预写日志(WAL)的使用相关。
currentSegmentDiskBytes
当前段磁盘大小(以字节为单位)。
oldSegmentDiskBytes
段磁盘大小(以字节为单位)。
writeErr
因错误而写入失败的总数。
writeOK
成功写入的总数。
write
write 测量统计信息是关于写入数据节点的情况,无论写入的来源如何。
pointReq
发送到此数据节点的总点数请求。传入的写入必须经过几次检查才能到达这一点(点已正确解析,提供了正确的身份验证等)。通过这些检查后,无论来源如何(HTTP、UDP、_internal 统计信息、OpenTSDB 插件等),都应递增此统计信息。
pointReqHH (仅限 Enterprise)
此节点接收并为目标节点排入提示符(hinted handoff)的写入点总数。
pointReqLocal (仅限 Enterprise)
已尝试写入同一(本地)节点上分点的点请求总数。
pointReqRemote (仅限 Enterprise)
此节点接收到的但需要转发到远程节点上的分点的写入点总数。pointReqRemote 统计信息在尝试远程写入之前立即递增,这仅在不存在该节点的 HH 时发生。然后,如果写入失败,我们会再次检查 HH 是否存在,如果存在,则将点添加到 HH。
此统计信息不区分直接写入目标节点或排入目标节点提示符(hinted handoff)队列的请求。
pointsWrittenOK
写入 HTTP /write 端点并成功持久化的点数。
req
请求写入此节点的所有点批次总数。
subWriteDrop
未能发送到订阅调度程序的点批次数总数。
subWriteOk
成功发送到订阅调度程序的点批次数总数。
valuesWrittenOK
写入 HTTP /write 端点并成功持久化的值(字段)的数量。
writeDrop
因时间戳不匹配任何现有保留策略而被丢弃的点写入请求总数。
writeError
因本地或远程分片写入失败而未能成功发送的点批次数总数。
writeOk
按请求的一致性级别写入的点批次数总数。
writePartial (仅限 Enterprise)
至少写入一个节点但未满足所请求一致性级别的点批次数总数。
writeTimeout
在默认写入超时期间未能完成的写入请求总数。这可能表明磁盘 I/O 严重降低或存在竞争,或者到远程节点的网络拥堵。对于通过 HTTP 或其他输入方法接收的单个写入请求,如果整个批次未在超时期间内写入,writeTimeout 将递增 1,无论批次中的点是否可以在本地或远程写入。
此页面是否有帮助?
感谢您的反馈!