InfluxDB 术语表
本页记录了 InfluxDB OSS 的早期版本。最新稳定版本为 InfluxDB OSS v2。有关等效的 InfluxDB v2 文档,请参阅:术语表 Glossary。
聚合
InfluxQL 函数,可返回一组数据点的聚合值。有关可用和即将推出的聚合的完整列表,请参阅 InfluxQL 函数。
批处理
在 InfluxDB 行协议格式中,由换行符(0x0A
)分隔的数据点集合。可以使用单个 HTTP 请求将数据点批发送到数据库的写入端点。这通过大幅减少 HTTP 开销,使使用 InfluxDB API 的写入性能大幅提高。InfluxData 建议批量大小为 5,000-10,000 个点,尽管不同的用例可能需要显著较小或较大的批次。
相关条目: InfluxDB 行协议,数据点
桶
桶是 InfluxDB 2.0 中存储时间序列数据的命名位置。在 InfluxDB 1.8+ 中,每个数据库和保留策略的组合(数据库/保留策略)代表一个桶。使用 InfluxDB 1.8+ 中包含的 InfluxDB 2.x API 兼容端点 与桶交互。
连续查询(CQ)
在数据库中自动和定期运行的 InfluxQL 查询。连续查询需要在 SELECT
子句中包含一个函数,并且必须包含 GROUP BY time()
子句。请参阅 连续查询。
相关条目: 函数
数据库
用户、保留策略、连续查询和时间序列数据的一个逻辑容器。
持续时间
保留策略的属性,用于确定 InfluxDB 存储数据的时间长度。超过持续时间的旧数据将自动从数据库中删除。请参阅 数据库管理 了解如何设置持续时间。
相关条目: 保留策略
字段
InfluxDB 数据结构中的键值对,记录元数据和实际数据值。字段在 InfluxDB 数据结构中是必需的,并且它们未进行索引 - 字段值查询将扫描所有匹配指定时间范围的数据点,因此相对于标签查询,性能较低。
查询提示:将字段与标签进行比较;标签是已索引的。
字段键
构成字段的键值对中的键部分。字段键是字符串,并存储元数据。
字段集
一个点上的字段键和字段值的集合。
字段值
构成字段的关键字值对中的值部分。字段值是实际数据;它们可以是字符串、浮点数、整数或布尔值。字段值始终与时间戳相关联。
字段值不被索引 - 对字段值的查询会扫描所有匹配指定时间范围的点,因此性能不佳。
查询技巧: 将字段值与标签值进行比较;标签值是索引的。
函数
InfluxQL 聚合、选择器和转换。有关 InfluxQL 函数的完整列表,请参阅 InfluxQL 函数。
标识符
指代连续查询名称、数据库名称、字段键、测量名称、保留策略名称、订阅名称、标签键和用户名称的标记。有关查询语言规范的更多信息,请参阅 查询语言规范。
InfluxDB 行协议
写入 InfluxDB 点的基于文本的格式。请参阅 InfluxDB 行协议。
测量
InfluxDB 数据结构中描述存储在相关字段中的数据的部分。测量是字符串。
元数据存储
包含有关系统状态的内部信息。元数据存储包含用户信息、数据库、保留策略、分片元数据、连续查询和订阅。
节点
一个独立的 influxd
进程。
相关条目: 服务器
now()
本地服务器的纳秒时间戳。
点
在 InfluxDB 中,一个点表示一个单独的数据记录,类似于 SQL 数据库表中的一行。每个点
- 具有一个测量、一个标签集、一个字段键、一个字段值和一个时间戳;
- 由其系列和时间戳唯一标识。
您不能在系列中存储具有相同时间戳的多个点。如果您将点写入具有匹配现有点的时间戳的系列,字段集将成为旧字段集和新字段集的并集,任何平局将偏向新字段集。有关重复点的更多信息,请参阅 InfluxDB 如何处理重复点?
每秒点数
一个已废弃的度量,用于表示数据持久化到 InfluxDB 的速率。该架构允许并鼓励每个点记录多个度量值,使得每秒点数变得模糊。
通常以每秒的值来引用写入速度,这是一个更精确的度量。
查询
从 InfluxDB 中检索数据的操作。请参阅 数据探索,模式探索,数据库管理。
副本因子
保留策略的一个属性,它决定了在集群中同时存储(或保留)数据副本的数量。复制副本确保当数据节点(或更多)不可用时数据仍然可用。
对于三个或更少的节点,默认副本因子等于数据节点数。对于超过三个节点的集群,默认副本因子为 3。要更改默认副本因子,在保留策略中指定副本因子 n
。
保留策略(RP)
描述了 InfluxDB 保留数据的时间(持续时间)、在集群中存储数据副本的数量(副本因子)以及分片组覆盖的时间范围(分片组持续时间)。RPs 对每个数据库都是唯一的,并与测量值和标签集一起定义了一个序列。
当你创建数据库时,InfluxDB 会创建一个名为 autogen
的保留策略,其持续时间为无限期,副本因子设置为 1,分片组持续时间设置为 7 天。有关更多信息,请参阅 保留策略管理。
相关条目:持续时间,测量值,副本因子,序列,分片持续时间,标签集
模式
数据在 InfluxDB 中的组织方式。InfluxDB 模式的基本元素包括数据库、保留策略、序列、测量值、标签键、标签值和字段键。有关更多信息,请参阅 模式设计。
相关条目:数据库,字段键,测量值,保留策略,序列,标签键,标签值
选择器
一个 InfluxQL 函数,它从指定的点范围内返回一个单一的数据点。请参阅 InfluxQL 函数 获取所有可用和即将推出的选择器的完整列表。
序列
由共享测量值、标签集和字段键定义的逻辑数据分组。
序列基数
一个 InfluxDB 实例中唯一数据库、测量值、标签集和字段键组合的数量。
例如,假设一个InfluxDB实例只有一个数据库和一个度量。这个单一度量有两个标签键:email
和status
。如果有三个不同的email
,并且每个电子邮件地址都与两个不同的status
相关联,那么度量的序列基数是6(3 * 2 = 6)
status | |
---|---|
[email protected] | start |
[email protected] | finish |
[email protected] | start |
[email protected] | finish |
[email protected] | start |
[email protected] | finish |
注意,在某些情况下,仅仅进行这种乘法可能会因为存在依赖标签而高估序列基数。依赖标签是受另一个标签范围限制的标签,它不会增加序列基数。如果我们向上面的例子中添加firstname
标签,序列基数将不会是18(3 * 2 * 3 = 18)。它将保持不变,为6,因为firstname
已经由email
标签限制
status | firstname | |
---|---|---|
[email protected] | start | lorraine |
[email protected] | finish | lorraine |
[email protected] | start | marvin |
[email protected] | finish | marvin |
[email protected] | start | clifford |
[email protected] | finish | clifford |
查看SHOW CARDINALITY了解关于InfluxQL命令的序列基数。
序列键
序列键通过度量、标签集和字段键来标识特定的序列。
例如
# measurement, tag set, field key
h2o_level, location=santa_monica, h2o_feet
相关条目:序列
服务器
运行InfluxDB的机器,虚拟或物理的。每个服务器应该只有一个InfluxDB进程。
相关条目:节点
碎片
碎片包含实际编码和压缩的数据,并在磁盘上以TSM文件的形式表示。每个碎片只属于一个碎片组。单个碎片组中可以存在多个碎片。每个碎片包含一组特定的序列。在给定碎片组中给定序列的所有点都将存储在磁盘上的相同碎片(TSM文件)中。
碎片持续时间
碎片持续时间确定每个碎片组跨越的时间量。具体的间隔由保留策略的SHARD DURATION
确定。有关更多信息,请参阅保留策略管理。
例如,给定一个保留策略,其中SHARD DURATION
设置为1w
,每个碎片组将跨越一周,并包含该周的所有时间戳点。
碎片组
碎片组是碎片的逻辑容器。碎片组按时间和保留策略组织。每个包含数据的保留策略至少有一个相关联的碎片组。给定的碎片组包含所有为碎片组覆盖的间隔提供数据的碎片。每个碎片组跨越的间隔是碎片持续时间。
订阅
订阅允许 Kapacitor 以推送模式接收来自 InfluxDB 的数据,而不是基于查询数据的拉模式。当 Kapacitor 配置为与 InfluxDB 一起工作时,订阅将自动将订阅数据库的每个写操作从 InfluxDB 推送到 Kapacitor。订阅可以使用 TCP 或 UDP 来传输写操作。
标签
在 InfluxDB 数据结构中记录元数据的关键值对。标签是数据结构的一个可选部分,但它们对于存储常用查询的元数据非常有用;标签是可索引的,因此基于标签的查询是高效的。查询提示:将标签与字段进行比较;字段不可索引。
标签键
构成标签的关键值对的关键部分。标签键是字符串,它们存储元数据。标签键是可索引的,因此基于标签键的查询是高效的。
查询提示:将标签键与字段键进行比较;字段键不可索引。
标签集
一个点上的标签键和标签值的集合。
标签值
构成标签的关键值对的值部分。标签值是字符串,它们存储元数据。标签值是可索引的,因此基于标签值的查询是高效的。
时间戳
与一个点相关联的日期和时间。InfluxDB 中的所有时间都是 UTC。
有关编写数据时如何指定时间的说明,请参阅 写入语法。有关查询数据时如何指定时间的说明,请参阅 数据探索。
相关条目:点
转换
一个 InfluxQL 函数,它返回从指定点计算出的值或值集,但不返回这些点的聚合值。有关可用的和即将推出的聚合的完整列表,请参阅 InfluxQL 函数。
TSM(时间结构化合并树)
InfluxDB 的专用数据存储格式。TSM 允许比现有的 B+ 或 LSM 树实现提供更大的压缩和更高的读写吞吐量。有关更多信息,请参阅 存储引擎。
用户
InfluxDB 中有两种类型的用户
- 管理员用户 对所有数据库具有
READ
和WRITE
访问权限,并对管理查询和用户管理命令具有完全访问权限。 - 非管理员用户 每个数据库具有
READ
、WRITE
或ALL
(即READ
和WRITE
)访问权限。
当启用身份验证时,InfluxDB 只执行带有有效用户名和密码发送的 HTTP 请求。有关详细信息,请参阅 身份验证和授权。
每秒值
衡量数据持久化到 InfluxDB 速率的首选度量。通常以每秒值来引用写入速度。
要计算每秒值率,请将每秒写入的点数乘以每点存储的值数。例如,如果每个点有四个字段,并且每秒写入5000个点的批次10次,那么每秒值率是每点4个字段值 * 每批5000个点 * 每秒10批 = 每秒200,000个值
。
WAL(写入前日志)
最近写入的点的临时缓存。为了减少永久存储文件访问的频率,InfluxDB 将新点缓存在 WAL 中,直到它们的总大小或年龄触发刷新到更持久的存储。这允许高效地将写入批量处理到 TSM 中。
WAL 中的点可以进行查询,并且它们在系统重启后仍然存在。在进程启动时,必须在系统接受新写入之前将 WAL 中的所有点刷新。
相关条目:tsm
这个页面有帮助吗?
感谢您的反馈!