术语表
聚合
一个InfluxQL函数,它返回一组数据点上的聚合值。有关可用和即将推出的聚合的完整列表,请参阅InfluxQL函数。
批量
一组以换行符(0x0A
)分隔的数据点,在InfluxDB行协议格式中。可以单个HTTP请求到写入端点提交一批点。这通过大幅减少HTTP开销,使InfluxDB API的写入性能大大提高。InfluxData建议批量大小为5,000-10,000点,尽管不同的用例可能需要显著较小或较大的批量。
相关条目: InfluxDB行协议,点
桶
桶是在InfluxDB 2.0中存储时间序列数据的命名位置。在InfluxDB 1.8+中,数据库和保留策略(数据库/保留策略)的每个组合代表一个桶。使用InfluxDB 1.8+中包含的InfluxDB 2.0 API兼容性端点与桶交互。
连续查询(CQ)
在数据库中自动和定期运行的InfluxQL查询。连续查询需要在SELECT子句中包含一个函数,并且必须包含一个GROUP BY time()子句。请参阅连续查询。
相关条目: 函数
数据节点
运行数据服务的节点。
为了高可用性,安装必须至少有两个数据节点。您的集群中数据节点的数量必须与您的最高复制因子相同。任何大于两个的复制因子都会在集群中提供额外的容错性和查询能力。
数据节点的大小将取决于您的需求。Amazon EC2 m4.large或m4.xlarge是良好的起点。
数据服务
存储所有时间序列数据并处理所有写入和查询。
相关条目: 数据节点
数据库
用户、保留策略、连续查询和时间序列数据的逻辑容器。
持续时间
保留策略的属性,用于确定InfluxDB存储数据的时间长度。超过持续时间的旧数据将从数据库中自动删除。有关如何设置持续时间的信息,请参阅数据库管理。
相关条目: 保留策略
字段
InfluxDB数据结构中记录元数据和实际数据值的键值对。字段是InfluxDB数据结构的必要组成部分,并且它们没有被索引 - 对字段值进行的查询会扫描所有符合指定时间范围内的点,因此相对于标签来说性能较低。
查询技巧:将字段与标签进行比较;标签是有索引的。
字段键
字段键值对的键部分,它构成了字段。字段键是字符串,它们存储元数据。
字段集合
在点上集合的字段键和字段值。
字段值
字段键值对的值部分,它构成了字段。字段值是实际数据;它们可以是字符串、浮点数、整数或布尔值。字段值始终与时间戳相关联。
字段值没有索引 - 对字段值进行的查询会扫描所有符合指定时间范围内的点,因此性能较低。
查询技巧:将字段值与标签值进行比较;标签值是有索引的。
函数
InfluxQL聚合、选择器和转换。有关InfluxQL函数的完整列表,请参阅InfluxQL函数。
标识符
指代连续查询名称、数据库名称、字段键、测量名称、保留策略名称、订阅名称、标签键和用户名的标记。请参阅查询语言规范。
InfluxDB行协议
将点写入InfluxDB的基于文本的格式。请参阅InfluxDB行协议。
测量
InfluxDB数据结构的部分,用于描述存储在相关字段中的数据。测量是字符串。
元节点
运行元服务的节点。
为了高可用性,安装必须具有三个元节点。元节点可以是非常小的实例,如EC2 t2.micro,甚至nano。为了额外的容错能力,安装可能使用五个元节点;元节点的数量必须是奇数。
相关条目: 元服务
元服务
一致的数据库,用于存储有关集群状态的信息,包括哪些服务器、数据库、用户、连续查询、保留策略、订阅和时间块存在。
相关条目: 元节点
元数据存储
包含关于系统状态的内部信息。元数据存储包含用户信息、数据库、保留策略、分片元数据、连续查询和订阅。
节点
一个独立的 influxd
进程。
相关条目: 服务器
now()
本地服务器的纳秒级时间戳。
被动节点(实验性)
被动节点充当负载均衡器——它们接受写调用、执行分片查找和RPC调用(在活动数据节点上),并将写操作分配给活动数据节点。它们不拥有分片也不接受写操作。注意:这是一个实验性功能。
点
在InfluxDB中,一个点代表一个单一的数据记录,类似于SQL数据库表中的一行。每个点
- 都有一个度量、一个标签集、一个字段键、一个字段值和一个时间戳;
- 由其系列和时间戳唯一标识。
您不能在系列中存储具有相同时间戳的多个点。如果您向具有与现有点匹配的时间戳的系列写入点,则字段集成为旧字段集和新字段集的并集,任何平局都归新字段集。有关重复点的更多信息,请参阅 InfluxDB如何处理重复点?
每秒点数
一个过时的度量,表示数据持久化到InfluxDB的速率。该架构允许并鼓励每个点记录多个度量值,使每秒点数变得模糊。
写入速度通常以每秒值数表示,这是一个更精确的度量。
查询
一个从InfluxDB检索数据的操作。请参阅 数据探索、架构探索、数据库管理。
副本因子(RF)
保留策略的属性,确定在集群中存储数据的副本数量。复制副本确保在至少一个数据节点不可用时数据仍然可访问。InfluxDB在 N
个数据节点上复制数据,其中 N
是副本因子。
为了保持查询的数据可用性,副本因子应小于或等于集群中的数据节点数量
- 当副本因子大于不可用数据节点的数量时,数据完全可用。
- 当副本因子小于不可用数据节点的数量时,数据可能不可用。
任何大于两个的副本因子都会在集群中提供额外的容错性和查询容量。
保留策略(RP)
描述InfluxDB保留数据的时间(持续时间)、在集群中存储数据的副本数量(副本因子)以及分片组覆盖的时间范围(分片组持续时间)。RP对每个数据库都是唯一的,与度量值和标签集一起定义了一个系列。
创建数据库时,InfluxDB会创建一个名为 autogen
的保留策略,其持续时间为无限,副本因子设置为1,分片组持续时间设置为7天。有关更多信息,请参阅 保留策略管理。
相关条目: 持续时间、度量、副本因子、系列、分片持续时间、标签集
架构
数据在InfluxDB中的组织方式。InfluxDB架构的基本要素是数据库、保留策略、系列、度量、标签键、标签值和字段键。有关更多信息,请参阅 架构设计。
相关条目: 数据库,字段键,测量,保留策略,系列,标签键,标签值
选择器
InfluxQL函数,用于从指定的点集中返回单个点。有关可用和即将推出的选择器的完整列表,请参阅InfluxQL函数。
系列
由共享测量、标签集和字段键定义的逻辑数据分组。
系列基数
InfluxDB实例中唯一的数据库、测量、标签集和字段键组合的数量。
例如,假设一个InfluxDB实例有一个数据库和一个测量。单个测量有两个标签键:email
和status
。如果有三个不同的email
,每个电子邮件地址与两个不同的status
相关联,那么该测量的系列基数是6(3 * 2 = 6)
status | |
---|---|
[email protected] | 开始 |
[email protected] | 结束 |
[email protected] | 开始 |
[email protected] | 结束 |
[email protected] | 开始 |
[email protected] | 结束 |
请注意,在某些情况下,简单地执行该乘法可能会由于存在依赖标签而高估系列基数。依赖标签是由另一个标签范围定义的标签,不会增加系列基数。如果我们向上面的例子中添加标签firstname
,系列基数将不会是18(3 * 2 * 3 = 18)。它将保持不变为6,因为firstname
已经被email
标签范围
status | firstname | |
---|---|---|
[email protected] | 开始 | lorraine |
[email protected] | 结束 | lorraine |
[email protected] | 开始 | marvin |
[email protected] | 结束 | marvin |
[email protected] | 开始 | clifford |
[email protected] | 结束 | clifford |
有关系列基数的InfluxQL命令,请参阅SHOW CARDINALITY。
系列键
系列键通过测量、标签集和字段键来标识特定的系列。
例如
# measurement, tag set, field key
h2o_level, location=santa_monica, h2o_feet
相关条目: 系列
服务器
运行InfluxDB的机器,虚拟或物理的。每个服务器上应该只有一个InfluxDB进程。
相关条目: 节点
分片
分片包含实际的编码和压缩数据,并在磁盘上表示为TSM文件。每个分片只属于一个分片组。单个分片组中可以存在多个分片。每个分片包含一组特定的系列。落在给定分片组给定系列上的所有点都将存储在磁盘上的同一个分片(TSM文件)中。
分片持续时间
分片持续时间确定每个分片组跨越的时间长度。具体间隔由保留策略的SHARD DURATION
确定。有关更多信息,请参阅保留策略管理。
例如,给定一个将SHARD DURATION
设置为1w
的保留策略,每个分片组将跨越一周,并包含该周的所有时间戳点。
分片组
分片组是分片的逻辑容器。分片组按时间和保留策略组织。每个包含数据的保留策略至少有一个相关联的分片组。一个特定的分片组包含分片组覆盖的时间间隔内的所有具有数据的分片。每个分片组跨越的间隔是分片持续时间。
订阅
订阅允许 Kapacitor 以推送模式从 InfluxDB 接收数据,而不是基于查询数据的拉模式。当 Kapacitor 配置与 InfluxDB 一起工作时,订阅将自动将订阅数据库的每个写操作从 InfluxDB 推送到 Kapacitor。订阅可以使用 TCP 或 UDP 传输写操作。
标签
在 InfluxDB 数据结构中记录元数据的键值对。标签是数据结构的可选部分,但它们用于存储常用查询的元数据很有用;标签被索引,因此对标签的查询是高效的。查询提示:将标签与字段进行比较;字段没有索引。
标签键
构成标签的键值对中的键部分。标签键是字符串,它们存储元数据。标签键被索引,因此对标签键的查询是高效的。
查询提示:将标签键与字段键进行比较;字段键没有索引。
标签集
一个点上的标签键和标签值的集合。
标签值
构成标签的键值对中的值部分。标签值是字符串,它们存储元数据。标签值被索引,因此对标签值的查询是高效的。
时间戳
与点相关联的日期和时间。InfluxDB 中的所有时间都是 UTC。
有关写入数据时指定时间的说明,请参阅写入语法。有关查询数据时指定时间的说明,请参阅数据探索。
相关条目:点
转换
一个 InfluxQL 函数,它返回从指定的点计算出的值或值集,但不返回这些点的聚合值。有关可用的和即将推出的聚合的完整列表,请参阅InfluxQL 函数。
TSM(时间结构化合并树)
InfluxDB 定制的专用数据存储格式。TSM 与现有的 B+ 或 LSM 树实现相比,允许更大的压缩和更高的写入和读取吞吐量。有关更多信息,请参阅存储引擎。
用户
InfluxDB Enterprise 有三种类型的用户
- 全局管理员用户 拥有所有权限。
- 管理员用户 拥有对所有数据库的
READ
和WRITE
访问权限,以及对管理查询和用户管理命令的完全访问权限。 - 非管理员用户 每个数据库都有
READ
、WRITE
或ALL
(即READ
和WRITE
)访问权限。
当启用身份验证时,InfluxDB 只执行带有有效用户名和密码发送的 HTTP 请求。请参阅身份验证和授权。
每秒值
数据持久化到 InfluxDB 的速率的最佳度量。通常以每秒值来表示写入速度。
要计算每秒值的速率,将每秒写入的点数乘以每点存储的值数。例如,如果每个点有四个字段,每批5000个点每秒写入10次,则每秒值的速率是 每点4个字段值 * 每批5000个点 * 每秒10批 = 每秒200,000个值
。
WAL(写入前日志)
最近写入的点的临时缓存。为了减少永久存储文件访问的频率,InfluxDB 将新点缓存到 WAL 中,直到它们的总大小或年龄触发刷新到更持久的存储。这允许将写入有效地批处理到 TSM 中。
WAL 中的点可以进行查询,并且它们在系统重启后仍然持久。在进程启动时,必须在系统接受新写入之前将 WAL 中的所有点刷新。
相关条目:tsm
Web 控制台
InfluxDB Enterprise 的传统用户界面。
此接口已被弃用。我们建议使用 Chronograf。
如果您正在从企业 Web 控制台过渡到 Chronograf,请参阅如何将 Chronograf 连接到 InfluxDB Enterprise 集群。
本页面有帮助吗?
感谢您的反馈!