median() 函数
median()
返回输入表的 median _value
或输入表中所有非空记录的中位数,这些记录的值落在 0.5 分位数(50 百分位)范围内。
函数行为
median()
根据 method
的指定作为聚合或选择转换。
- 聚合:当使用
estimate_tdigest
或exact_mean
方法时,median()
作为聚合转换,输出落在 0.5 分位数(50 百分位)内的非空记录的平均值。 - 选择:当使用
exact_selector
方法时,median()
作为选择转换,输出代表 0.5 分位数(50 百分位)的非空记录。
函数类型签名
(<-tables: stream[A], ?column: string, ?compression: float, ?method: string) => stream[A] where A: Record
参数
column
用于计算中位数的列。默认为 _value
。
method
计算方法。默认为 estimate_tdigest
。
可用方法:
- estimate_tdigest:使用 t-digest 数据结构 的聚合方法,在大型数据源上计算准确的中位数估计。
- exact_mean:聚合方法,取最接近中值的两点的平均值。
- exact_selector:选择方法,返回至少 50% 的点小于该值的行。
compression
压缩数据集时使用的中心点数量。默认为 0.0
。
较大的数字会产生更准确的结果,但会增加内存需求。
tables
输入数据。默认为管道转发的数据(<-
)。
示例
将 median 用作聚合转换
import "sampledata"
sampledata.float()
|> median()
将 median 用作选择转换
import "sampledata"
sampledata.float()
|> median(method: "exact_selector")
这个页面有帮助吗?
感谢您的反馈!