文档

InfluxDB Cloud 数据持久性

InfluxDB Cloud 在云区域内的两个可用区中复制存储层中的所有数据,自动创建备份,并验证复制数据的完整性和可读性。

本页面内容

数据复制

InfluxDB Cloud 在写入层和存储层中复制数据。

  • 写入层:所有写入 InfluxDB 的数据都通过一个持久化消息队列进行处理。消息队列根据系列键分区每个数据点批次,然后在消息队列中的其他物理节点上复制每个分区。
  • 存储层:云区域内的两个可用区中复制了底层存储层中的所有数据。

备份流程

InfluxDB Cloud 以以下方式备份所有数据

写入时备份

所有传入 InfluxDB Cloud 的写入请求都添加到持久化消息队列。消息队列执行以下操作

  1. 缓存每个写入请求的行协议
  2. 将数据写入存储层。
  3. 定期将缓存的行协议持久化到对象存储作为带外备份。

消息队列备份提供了用于从存储层或对象存储服务的灾难性故障或意外删除中恢复的原始行协议。消息队列的持久性为 96 小时,这意味着 InfluxDB Cloud 可以在没有数据丢失的情况下承受其底层存储层或对象存储服务的最长 96 小时的故障。

为了最大限度地减少 InfluxDB Cloud 服务中引入的缺陷导致的数据丢失的可能性,我们尽量减少数据摄入和备份过程之间的代码使用。

压缩后备份

InfluxDB 存储引擎通过称为压缩的过程随时间压缩数据。当每个压缩周期完成后,InfluxDB Cloud 将压缩的 TSM 文件存储在对象存储中。

定期 TSM 快照

为了提供多个数据恢复点,InfluxDB Cloud 对上传到对象存储的 TSM 文件进行每周快照。TSM 快照包括在快照创建时所有(非删除)数据的副本。这些快照保留 100 天。

恢复

InfluxDB Cloud 使用以下存储在对象存储中的带外备份来恢复数据

  • 消息队列备份:过去 96 小时内传入写入请求的行协议
  • 压缩备份:TSM 文件
  • TSM 快照:对象存储中 TSM 文件的每周快照

恢复点目标(RPO)是指任何接受的写入操作。恢复时间目标(RTO)由于可能的故障模式多样,难以准确预测。尽管大多数常见的故障模式可以在几分钟或几小时内解决,但关键故障模式可能需要更长时间。例如,如果我们需要从TSM快照和消息队列备份中重建所有数据,可能需要24小时或更长时间。

数据验证

InfluxDB Cloud始终运行两个数据验证服务

  • 熵检测:确保复制数据的一致性
  • 数据验证:验证写入InfluxDB的数据是否可读

InfluxDB Cloud状态

InfluxDB Cloud区域及其底层服务始终处于监控状态。有关InfluxDB Cloud当前状态的信息,请参阅InfluxDB Cloud状态页面


这个页面有帮助吗?

感谢您的反馈!


Flux的未来

Flux将进入维护模式。您可以在不更改代码的情况下继续按当前方式使用它。

阅读更多

InfluxDB v3增强功能和InfluxDB Clustered现在已普遍可用

新功能包括更快的查询性能和管理工具,推动了InfluxDB v3产品线的进步。InfluxDB Clustered现在已普遍可用。

InfluxDB v3性能和功能

InfluxDB v3产品线在查询性能方面取得了重大提升,并提供了新的管理工具。这些增强包括一个操作仪表板来监控InfluxDB集群的健康状况,InfluxDB Cloud专用版中的单点登录(SSO)支持,以及用于令牌和数据库的新管理API。

了解新的v3增强功能


InfluxDB Clustered普遍可用

InfluxDB Clustered现在已普遍可用,为您在自管理的堆栈中提供了InfluxDB v3的功能。

与我们讨论InfluxDB Clustered

由TSM驱动的InfluxDB Cloud