InfluxDB 设计见解与权衡
此页面记录了早期版本的 InfluxDB OSS。InfluxDB OSS v2 是最新的稳定版本。请参阅等效的 InfluxDB v2 文档: InfluxDB 设计原则。
InfluxDB 是一个时间序列数据库。为此用例进行优化需要进行一些权衡,主要是以牺牲功能为代价来提高性能。以下是一些导致权衡的设计见解列表
对于时间序列用例,我们假设如果相同的数据被多次发送,那么它就是客户端多次发送的完全相同的数据。
优点: 简化的 冲突解决 提高了写入性能。
缺点: 无法存储重复数据;在极少数情况下可能会覆盖数据。删除操作很少发生。当它们发生时,几乎总是针对大量旧数据,这些数据对于写入是冷数据。
优点: 限制对删除的访问可以提高查询和写入性能。
缺点: 删除功能受到显著限制。更新现有数据很少发生,并且不会发生有争议的更新。时间序列数据主要是从未更新过的新数据。
优点: 限制对更新的访问可以提高查询和写入性能。
缺点: 更新功能受到显著限制。绝大多数写入都是针对时间戳非常新的数据,并且数据按时间升序添加。
优点: 按时间升序添加数据性能显著提高。
缺点: 写入具有随机时间或时间非升序的点性能显著降低。规模至关重要。数据库必须能够处理高读取和写入量。
优点: 数据库可以处理高读取和写入量。
缺点: InfluxDB 开发团队被迫进行权衡以提高性能。能够写入和查询数据比具有强一致性视图更重要。
优点: 多个客户端可以在高负载下完成数据库的写入和查询。
缺点: 如果数据库在高负载下运行,查询返回可能不包含最新的点。许多时间序列是短暂的。经常会出现仅存在几个小时然后消失的时间序列,例如,启动并报告一段时间然后关闭的新主机。
优点: InfluxDB 擅长管理非连续数据。
缺点: 无模式设计意味着某些数据库功能不受支持,例如,没有跨表连接。没有哪个点过于重要。
优点: InfluxDB 拥有非常强大的工具来处理聚合数据和大型数据集。
缺点: 点在传统意义上没有 ID,它们通过时间戳和序列来区分。
此页面是否对您有帮助?
感谢您的反馈!