文档说明

histogram() 函数

histogram() 通过对一系列区间中的数据频率进行计数来近似数据集的累积分布。

一个区间由一个上界定义,其中所有小于或等于该界的所有数据点都被计入该区间。区间计数是累积的。

每个输入表被转换为一个表示单个直方图的单个输出表。每个输出表具有与相应输入表相同的分组键。不属于分组键的列将被删除。输出表包括用于上界和区间计数的附加列。

函数类型签名
(
    <-tables: stream[A],
    bins: [float],
    ?column: string,
    ?countColumn: string,
    ?normalize: bool,
    ?upperBoundColumn: string,
) => stream[B] where A: Record, B: Record

有关更多信息,请参阅 函数类型签名

参数

包含输入值的列。列必须是浮点类型。默认为 _value

upperBoundColumn

用于存储区间上界的列。默认为 le

countColumn

用于存储区间计数的列。默认为 _value

bins

(必需) 当计算直方图频率时使用的上界列表。

区间应包含一个区间,其界限是数据集的最大值。如果不知道最大值,此值可以设置为正无穷大。

区间辅助函数

以下辅助函数可用于生成区间。

  • linearBins()
  • logarithmicBins()

normalize

将计数转换为介于 0 和 1 之间的频率值。默认为 false

注意:归一化直方图无法通过求和其计数进行聚合。

tables

输入数据。默认为管道前传数据 (<-)。

示例

创建累积直方图

import "sampledata"

sampledata.float()
    |> histogram(bins: [0.0, 5.0, 10.0, 20.0])

查看示例输入和输出

创建具有动态生成区间的累积直方图

import "sampledata"

sampledata.float()
    |> histogram(bins: linearBins(start: 0.0, width: 4.0, count: 3))

查看示例输入和输出


这个页面有帮助吗?

感谢您的反馈!


Flux 的未来

Flux 正在进入维护模式。您可以继续像现在一样使用它,而无需对您的代码进行任何更改。

了解更多

InfluxDB v3 增强功能和 InfluxDB 集群版现在已普遍可用

新功能包括更快的查询性能和管理工具,推动了 InfluxDB v3 产品线的进步。InfluxDB 集群版现在已普遍可用。

InfluxDB v3 性能和功能

InfluxDB v3 产品线在查询性能方面取得了重大提升,并提供了新的管理工具。这些增强包括一个操作仪表板来监控您的 InfluxDB 集群的健康状态,InfluxDB Cloud 专用版中的单点登录 (SSO) 支持,以及新的令牌和数据库管理 API。

了解 v3 新增强功能


InfluxDB 集群版普遍可用

InfluxDB 集群版现在已普遍可用,为您在自行管理的堆栈中提供了 InfluxDB v3 的功能。

与我们讨论 InfluxDB 集群版