术语表
A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z
A
抽象语法树(AST)
源代码的树形表示,显示了编程语句的结构、内容和规则,并丢弃了额外的语法元素。该树是分层的,程序语句的元素被分解为其各个部分。
有关AST设计的更多信息,请参阅维基百科上的抽象语法树。
代理
由用户(或代表用户)启动的后台进程,通常需要用户输入。
Telegraf 是一个需要用户输入(配置文件)的代理,它从声明的输入插件中收集指标,并根据配置启用的插件将指标发送到声明的输出插件。
聚合插件
从输入插件接收指标,创建聚合指标,然后将聚合指标传递给配置的输出插件。
聚合
一个函数,它返回一组点的聚合值。有关可用的聚合函数列表,请参阅SQL 聚合函数。
API
应用程序编程接口,它促进了两个或更多计算机程序之间的通信和标准化。
参数
传递给函数或命令的值,决定了进程的操作方式。
相关条目:参数
B
批量
行协议格式中点的集合,由换行符(0x0A
)分隔。通过单个HTTP请求向写入端点提交点批量可显著提高性能,因为它减少了HTTP开销。InfluxData通常建议批量大小为5,000-10,000点。在某些用例中,性能可能随着批量大小的显著减小或增大而提高。
批量大小
行协议批处理中的行数或单个数据点的数量。Telegraf代理将指标批量发送到输出插件,而不是逐个发送。批量大小控制Telegraf发送到输出插件每个写入批的大小。
相关条目:输出插件
bin
在累积直方图中,一个bin包含所有小于或等于指定上界的数据点。在正常直方图中,一个bin包含所有位于上界和下界之间的数据点。直方图bin有时也称为“桶”。
布尔值
具有两种可能值的类型:true或false。按照惯例,您可以将true
表示为整数1
,将false表示为整数0
(零)。
bucket
“Bucket”是InfluxDB 2.x和InfluxDB Cloud Serverless中用于指代时间序列数据存储的命名位置的术语。当使用InfluxDB Clustered时,bucket与“数据库”同义。
相关条目:数据库
C
CSV
逗号分隔值(CSV)使用逗号分隔文本以分隔值。CSV文件以纯文本格式存储表格数据(数字和文本)。文件的每一行是一个数据行。每一行由一个或多个列组成,列之间由逗号分隔。CSV文件格式并未完全标准化。
基数
基数是集合中唯一值的数量。系列基数是整个数据库中唯一系列的数量。使用InfluxDB v3存储引擎时,高系列基数不会影响性能。
集群
一组协同工作作为单个单元的服务器或进程。InfluxDB集群是一组专门为单个客户工作负载服务的InfluxDB服务器。
收集
使用行协议和以下任何工具收集和写入时间序列数据到InfluxDB
- Telegraf
- InfluxDB v1 或 v2 HTTP API
- v1 或 v2
influx
命令行界面(CLI) - InfluxDB 客户端库
收集间隔
从每个 Telegraf 输入插件收集数据的默认全局间隔。收集间隔可以被每个单独的输入插件的配置覆盖。
相关条目:输入插件
收集抖动
收集抖动防止每个输入插件同时收集指标,这可能会对系统产生可测量的影响。对于每个收集间隔,每个 Telegraf 输入插件在收集指标之前会随机睡眠零到收集抖动的时间。
列
InfluxDB 数据存储在行和列组成的表中。列存储标签集、字段集和时间值。唯一必需的列是 time,它存储时间戳并包含在所有 InfluxDB 表中。
通用日志格式(CLF)
一个标准的文本文件格式,由 InfluxDB 服务器在生成服务器日志文件时创建日志条目使用。
压缩
压缩时序数据以优化磁盘使用。
连续查询(CQ)
连续查询是 InfluxDB 1.x 的一个特性,用于定期下采样或处理时序数据。
D
守护进程
一个在无需用户输入的情况下运行的背景进程。
仪表板
一组数据可视化,用于查询和显示时序数据。有许多专门用于创建仪表板的工具,包括 Grafana,Apache Superset,Tableau 和其他工具。
数据模型
数据模型组织数据元素并标准化它们相互之间以及与现实世界实体的属性之间的关系。
有关 InfluxDB 数据模型的信息,请参阅 InfluxDB 数据组织
数据服务
存储时序数据并处理写入和查询。
数据源
InfluxDB 收集或查询数据的数据源。
相关条目:数据库
数据类型
数据类型由它可以取的值、使用的编程语言或可以对其执行的操作定义。
InfluxDB 支持以下数据类型
- 字符串
- 布尔值
- 浮点数(64位)
- 整数(64位)
- 无符号整数(64位)
- 时间
有关不同数据类型的更多信息,请参阅
数据库
存储时序数据的命名位置。
InfluxDB 1.x 中,数据库代表用户、保留策略、连续查询和时序数据的逻辑容器。在 InfluxDB 2.x 中,此概念的对应物是 InfluxDB 桶。
日期时间
InfluxDB 将每个数据点的日期时间格式存储在带有纳秒级精度的 Unix 时间戳中。指定时间戳是可选的。如果未指定数据点的时间戳,InfluxDB 使用服务器本地的 UTC 纳秒级时间戳。
下采样
将高分辨率数据聚合为低分辨率数据以节省磁盘空间。
持续时间
表示时间持续量的数据类型,例如 1s
,1m
,1h
,1d
。保留期使用持续时间设置。
相关条目:保留期
E
事件
以不规则时间间隔收集的指标。
表达式
一个或多个常量、变量、运算符和函数的组合。
以下SQL示例中,now() - INTERVAL '7 days'
是一个表达式,用于计算 now()
函数表达式与 INTERVAL '7 days'
表示的持续时间之间的差异。
SELECT *
FROM home
WHERE
time >= now() - INTERVAL '7 days'
F
字段
在InfluxDB数据结构中记录数据值的键值对。通常,字段值随时间变化。字段是InfluxDB数据结构所必需的。
字段键
键值对的键。字段键是字符串。
字段集
字段键值对的集合。
字段值
键值对的值。字段值是实际数据;它们可以是字符串、浮点数、整数、无符号整数或布尔值。字段值始终与时间戳相关联。
文件块
文件块是在应用程序请求时读入内存的固定长度数据块。
浮点数
以小数点分隔整数部分和小数部分的实数(1.0
、3.14
、-20.1
)。InfluxDB支持64位浮点数值。
刷新间隔
将数据从每个Telegraf输出插件刷新到其目的地的全局间隔。此值不应低于收集间隔。
刷新抖动
刷新抖动防止每个Telegraf输出插件同时发送写操作,这可能会压倒某些数据接收器。每个刷新间隔,每个Telegraf输出插件都会在发出度量之前随机休眠一定时间。刷新抖动可以平滑运行大量Telegraf实例时的写入峰值。
函数
函数是执行特定任务的运算。函数接受输入,在输入上操作,然后返回输出。有关可用SQL函数的完整列表,请参阅 SQL函数。
G
gzip
gzip是一种数据压缩类型,它压缩数据块,通过解压缩压缩的gzip文件来恢复。gzip文件扩展名是.gz
。
H
直方图
使用矩形表示数据项在连续、相等间隔或箱子中的频率的统计信息可视化表示。
I
标识符
标识符是引用特定数据库对象(如数据库名称、字段键、测量名称、标签键等)的标记。
influx
influx
是与InfluxDB v1.x和v2.x服务器交互的命令行界面(CLI)。
influxctl
influxctl
是一个 CLI 工具,用于执行 InfluxDB 集群的 管理任务。
influxd
influxd
是 InfluxDB OSS v1.x 和 v2.x 的守护进程,它运行 InfluxDB 服务器和其他所需进程。
InfluxDB
InfluxData 开发的开源时序数据库(TSDB)。使用 Go 语言编写,针对快速、高可用性的时序数据存储和检索进行了优化,适用于操作监控、应用指标、物联网传感器数据和实时分析等领域。
InfluxQL
用于查询 InfluxDB 中数据的类似 SQL 的查询语言。
输入插件
Telegraf 输入插件积极收集指标并将它们发送到核心代理,在那里聚合器、处理器和输出插件可以对指标进行操作。为了激活输入插件,需要在 Telegraf 的配置文件中启用并配置它。
实例
由服务器(或云计算中的虚拟服务器)上的数据组成的实体。
整数
一个正数、负数或零(0
、-5
、143
)。InfluxDB 支持 64 位整数(最小:-9223372036854775808
,最大:9223372036854775807
)。
相关条目: 无符号整数
IOx
IOx(InfluxDB v3)存储引擎是一个基于 Apache Arrow 和 DataFusion 的 Rust 构建的实时、列式数据库,针对时序数据进行了优化。IOx 替换了 TSM(时间结构合并树) 存储引擎。
J
JWT
通常,JSON 网络令牌(JWT)用于在身份提供者和服务提供者之间进行用户认证。服务器可以生成 JWT 来断言任何业务流程。例如,发送给客户端的“admin”令牌可以证明客户端已以管理员身份登录。令牌由一方(通常是服务器)的私钥签名。私钥由双方使用以验证令牌的有效性。
JWT 使用在 RFC 7519 中指定的开放标准。
Jaeger
用于分布式系统的开源跟踪工具,用于监控和调试事务。
JSON
JavaScript 对象表示法(JSON)是一个开放标准文件格式,使用人类可读的文本来传输由属性-值对和数组数据类型组成的数据对象。
K
关键字
关键字被程序保留,因为它具有特殊含义。每种编程语言都有一组关键字(保留名称),这些关键字不能用作标识符——例如,您不能在 SQL 查询中将 SELECT
(一个 SQL 关键字)用作变量名。
参见关键字列表
L
字面量
字面量是表达式中的值,包括数字、字符、字符串、函数、记录或数组。字面量值按定义进行解释。
负载均衡
改善网络中多个计算资源的工作负载分布。负载均衡优化资源使用,最大化吞吐量,最小化响应时间,并避免单个资源过载。使用具有负载均衡的多个组件而不是单个组件可以增加可靠性和可用性。如果网络中任何服务器的请求增加,请求将被转发到具有更多容量的另一个服务器。负载均衡还可以指通信通道本身。
日志
日志记录信息。事件日志描述系统事件和活动,有助于描述和诊断问题。事务日志描述存储数据的变化,有助于在数据库崩溃或其他错误发生时恢复数据。
行协议(LP)
写入 InfluxDB 的基于文本的格式。参见 行协议。
M
测量
描述存储在关联字段中的InfluxDB数据结构的部分。度量值是字符串。
度量值
随时间跟踪的数据。
度量值缓冲区
当Telegraf输出插件写入失败时,度量值缓冲区会缓存单个度量值。Telegraf会在成功写入输出时尝试刷新缓冲区。当缓冲区满时,最先的度量值会被删除。
相关条目:输出插件
缺失值
由空值表示。标识缺失信息,可能有助于包含在错误消息中。
N
节点
集群中的一个独立进程或服务器。
now
本地服务器的纳秒时间戳。
null
表示缺失或未知值的 数据类型。由 null
值表示。标签和字段的值可以是 null
,但时间戳值永远不会是 null
。
O
运算符
通常表示动作或过程的符号。例如: +
,-
,>
。
相关条目: 操作数
操作数
位于 运算符 两边的对象或值。
相关条目: 运算符
组织
InfluxDB v2的一个概念,描述了一组用户的 工作区。所有的InfluxDB v2仪表板、任务、桶、成员等,都属于一个组织。组织不是InfluxDB集群的一部分。
所有者
用户的一种角色类型。所有者有读写权限。用户可以为数据库和其他资源拥有所有者角色。
角色权限与API令牌权限分开。有关API令牌的更多信息,请参阅 令牌。
输出插件
Telegraf输出插件将度量值发送到其配置的目标。要激活输出插件,请在Telegraf的配置文件中启用并配置插件。
P
参数
键值对,用于将信息传递给一个函数,该函数确定函数的操作方式。
相关条目: 参数
管道
将信息从一个进程传递到另一个进程的方法。例如,一个进程的输出参数被另一个进程作为输入。通过管道传递的信息保留到接收进程读取信息为止。
点
由其 度量,标签键,标签值,字段键 和 时间戳 确定的单个数据记录。
在一个 系列 中,每个点都有一个唯一的时间戳。如果您将一个点写入一个具有与现有点匹配的时间戳的系列,则字段集成为旧字段集和新字段集的并集,其中任何平局都归新字段集。
主键
在InfluxDB v3存储引擎中,主键是用于唯一标识表中每一行的列的列表。行由其时间戳和标签集唯一标识。一行的主键标签集不包括具有null值的标签。
精度
精度配置设置确定保留输入数据点的精度。所有传入的时间戳都截断到指定的精度。有效的精度是 ns
,us
或 µs
,ms
和 s
。
在Telegraf中,截断的时间戳会填充零以创建纳秒级时间戳。Telegraf输出插件以纳秒为单位发出时间戳。例如,如果精度设置为ms
,纳秒级纪元时间戳1480000000123456789
在毫秒精度下被截断为1480000000123
,并用零填充以创建一个新的、精度较低的新纳秒时间戳1480000000123000000
。Telegraf输出插件不会进一步修改时间戳。对于服务输入插件,忽略精度设置。
相关条目:聚合插件、输入插件、输出插件、处理器插件、服务输入插件
谓词表达式
谓词表达式比较两个值,并根据两个值之间的关系返回true
或false
。谓词表达式由一个左操作数、一个比较运算符和一个右操作数组成。
处理
一组预定的规则。处理可以指计算机处理器执行的指令,也可以指操纵数据的行为。
处理器插件
Telegraf处理器插件将输入插件收集的指标进行转换、装饰和过滤,然后将转换后的指标传递给输出插件。
Prometheus格式
用于暴露指标并将它们导入Prometheus的简单文本格式。
Q
查询
对信息的请求。InfluxDB查询返回时间序列数据。
查询计划
一组步骤(节点),InfluxDB查询器设计并执行这些步骤以在最短时间内计算查询结果。一个逻辑计划是查询的高级表示,不考虑集群配置或数据组织。一个物理计划表示查询执行计划和数据通过计划节点(读取(扫描)、去重、合并、过滤和排序)的流动。物理计划针对集群配置和数据组织进行了优化。
见查询计划。
R
REPL
Read-Eval-Print Loop(REPL)是一个交互式编程环境,您输入一个命令并立即看到结果。
正则表达式
正则表达式(regex或regexp)用于匹配字符串中的字符组合。
拒绝的点
在数据批次中,InfluxDB无法将其写入数据库的点。字段类型冲突是拒绝点的一个常见原因。
保留期
数据库保留数据的时间长度。InfluxDB丢弃其数据库的保留期相对于现在较早的时间戳的点。最小保留期是一小时。
相关条目:桶,
保留策略(RP)
保留策略是InfluxDB 1.x数据模型的一部分,描述了InfluxDB保留数据的时间(持续时间)、在集群中存储数据的副本数量(复制因子)以及分片组覆盖的时间范围(分片组持续时间)。RP对于每个数据库都是唯一的,与测量和标记集一起定义了一个系列。
在InfluxDB集群中,等价的概念是保留期,然而保留期不是数据模型的一部分。保留期描述了数据库的数据持久化行为。
相关条目:保留期,
RFC3339时间戳
使用RFC 3339中提出的可读DateTime格式的时间戳(例如:2020-01-01T00:00:00.00Z
)。
相关条目:RFC3339Nano时间戳,时间戳,Unix时间戳
RFC3339Nano时间戳
一个Golang的RFC 3339 DateTime格式表示,使用纳秒分辨率——例如:2006-01-02T15:04:05.999999999Z07:00
。
InfluxDB客户端可以在日志事件和CSV格式的查询结果中返回RFC3339Nano时间戳。
相关条目:RFC3339时间戳,时间戳,Unix时间戳
行
在表格中的一行代表一个特定的记录或数据实例。行中的列值代表实例的特定属性或属性。每一行都有一个主键,使该行在表中的其他行中独一无二。
S
模式
数据在InfluxDB中的组织方式。InfluxDB模式的基本要素是数据库、度量、标签键、标签值和字段键。
秘密
秘密是包含您想要控制访问的信息的键值对,例如API密钥、密码或证书。
选择器
一个函数,它从指定的点集中返回单个点。有关可用SQL选择器函数的完整列表,请参阅SQL选择器函数。
系列
在InfluxDB数据结构中,具有共同度量、标签集和字段键的数据集合。
系列基数
InfluxDB数据库中唯一度量、标签集和字段键组合的数量。
例如,假设一个InfluxDB数据库有一个度量。这个单一的度量有两个标签键:email
和status
。如果有三个不同的email
,并且每个电子邮件地址都与两种不同的status
相关联,则该度量的系列基数是6(3 × 2 = 6)
status | |
---|---|
lorr@influxdata.com | start |
lorr@influxdata.com | finish |
marv@influxdata.com | start |
marv@influxdata.com | finish |
cliff@influxdata.com | start |
cliff@influxdata.com | finish |
在某些情况下,由于存在依赖标签,执行此乘法可能会高估系列基数。依赖标签由另一个标签限定,并且不会增加系列基数。如果我们向上述示例中添加标签firstname
,系列基数将不会是18(3 × 2 × 3 = 18)。系列基数将保持不变,为6,因为firstname
已经由email
标签限定
status | firstname | |
---|---|---|
lorr@influxdata.com | start | lorraine |
lorr@influxdata.com | finish | lorraine |
marv@influxdata.com | start | marvin |
marv@influxdata.com | finish | marvin |
cliff@influxdata.com | start | clifford |
cliff@influxdata.com | finish | clifford |
系列键
系列键通过度量、标签集和字段键标识特定的系列。
例如
# measurement, tag set, field key
h2o_level, location=santa_monica, h2o_feet
相关条目:系列
服务器
运行InfluxDB的计算机,虚拟或物理。
服务输入插件
在Telegraf代理运行时以被动收集模式运行的Telegraf输入插件。服务输入插件监听套接字以接收已知协议输入,或在将指标发送到Telegraf代理之前应用自己的逻辑来处理摄入的指标。
字符串
用于表示文本的数据类型。
T
TCP
传输控制协议。
表
一组以结构化方式组织的相关数据,包含预定义的列和数据类型。表中的每一行代表特定的记录或数据实例,每一列代表数据的特定属性或属性。
在InfluxDB集群中,表表示一个度量。
tag
记录元数据的关键值对。标签是InfluxDB数据结构的一个可选部分,但它们对于存储常用元数据非常有用。
tag key
标签键值对的关键。标签键是字符串,用于存储元数据。
tag set
一个点上的标签键和标签值的集合。
tag value
标签键值对中的值。标签值是字符串,用于存储元数据。
Telegraf
一个由插件驱动的代理,用于收集、处理、聚合和写入指标。
相关条目: Telegraf插件、使用Telegraf收集数据,
时间(数据类型)
一种表示具有纳秒级精度的单一时间点的数据类型。
时间序列数据
数据点的序列,通常由同一源在时间间隔内连续测量的结果组成。时间序列数据显示了数据随时间的变化。在时间序列数据图中,一个轴总是时间。时间序列数据可以是规则的或不规则的。规则的时间序列数据在恒定间隔内变化。不规则的时间序列数据在非恒定间隔内变化。
时间戳
与一个点相关联的日期和时间。InfluxDB中的时间使用UTC。
有关在写入数据时指定时间的信息,请参阅行协议元素。
相关条目: 点、Unix时间戳、RFC3339时间戳
token
令牌提供在InfluxDB中执行特定操作的授权。存在不同类型的API令牌
- 数据库令牌:授予对数据库的读写访问权限。
- 管理令牌:一种短期令牌,授予客户端对InfluxDB集群的行政访问权限。
相关条目: 管理令牌
transformation
数据转换是指将输入数据从一种格式、值或结构转换为另一种格式、值或结构的过程。
InfluxQL 的 转换函数 修改并返回查询数据中每一行的值,但不会返回这些行之间的聚合值。
TSM(时间结构化合并树)
InfluxDB v1 和 v2 的数据存储格式,比 B+ 或 LSM 树实现具有更高的压缩率和读写吞吐量。TSM 存储引擎已被 InfluxDB v3 存储引擎(IOx) 替换。
相关条目:IOx
U
UDP
用户数据报协议是一个信息包。当发起请求时,会向接收方发送一个 UDP 包。发送方不验证包是否被接收。发送方继续发送下一个包。这意味着计算机可以更快地通信。此协议在需要速度且不需要错误纠正时使用。
Unix 纪元
Unix 系统时间测量的日期和时间。Unix 纪元是 1970-01-01T00:00:00Z
。
Unix 时间戳
从 Unix 纪元(1970-01-01T00:00:00Z UTC) 计算时间,单位为指定的单位(精度)。在 将数据写入 InfluxDB 时指定时间戳精度。InfluxDB 支持以下 Unix 时间戳精度
精度 | 描述 | 示例 |
---|---|---|
ns | 纳秒 | 1577836800000000000 |
us | 微秒 | 1577836800000000 |
ms | 毫秒 | 1577836800000 |
s | 秒 | 1577836800 |
上述示例表示 2020-01-01T00:00:00Z UTC。
相关条目:时间戳,RFC3339 时间戳
无符号整数
一个正数或零(0
,143
)。也称为“无符号整数”。InfluxDB 支持 64 位无符号整数(最小值:0
,最大值:18446744073709551615
)。
相关条目:整数
用户
InfluxDB 用户被授予访问 InfluxDB 的权限。
V
每秒值
这是数据持久保存到 InfluxDB 的速率的推荐测量方法。写入速度通常以每秒值来表示。
要计算每秒值速率,将每秒写入的点数乘以每点存储的值数。例如,如果每个点有四个字段,并且每批 5000 个点每秒写入 10 次,则每秒值速率是
每个点的 4 个字段值 × 每批 5000 个点 × 每秒 10 批 = 每秒 200,000 个值
变量
一个存储位置(由内存地址标识)与一个相关的符号名称(一个标识符)配对。变量包含一些已知或未知数量的信息,称为值。
变量赋值
一个设置或更新存储在变量中的值的语句。
W
WAL(写入前日志)
最近写入的点的临时缓存。为了减少永久存储文件被访问的频率,InfluxDB 将新点缓存到 WAL 中,直到其总大小或年龄触发刷新到更持久的存储。这允许高效地将写入批量写入存储引擎。
WAL 中的点是可以查询的,并且可以在系统重启后持久存在。在进程启动时,必须在系统接受新写入之前将 WAL 中的所有点刷新。
相关条目:tsm
窗口化
根据指定的时间间隔对数据进行分组。这也被称为“时间分箱”或“日期分箱”。
这个页面有帮助吗?
感谢您的反馈!