median() 函数
median()
返回输入表中 _value
的中位数,或输入表中所有非空记录中值落在 0.5 分位数(第 50 百分位数)内的值。
函数行为
median()
根据指定的 method
充当聚合或选择器转换。
- 聚合:当使用
estimate_tdigest
或exact_mean
方法时,median()
充当聚合转换,并输出值落在 0.5 分位数(第 50 百分位数)内的非空记录的平均值。 - 选择器:当使用
exact_selector
方法时,median()
充当选择器转换,并输出值代表 0.5 分位数(第 50 百分位数)的非空记录。
函数类型签名
(<-tables: stream[A], ?column: string, ?compression: float, ?method: string) => stream[A] where A: Record
有关更多信息,请参阅函数类型签名。
参数
column
用于计算中位数的列。默认为 _value
。
method
计算方法。默认为 estimate_tdigest
。
可用方法:
- estimate_tdigest:聚合方法,使用 t-digest 数据结构 来计算大型数据源上准确的中位数估计值。
- exact_mean:聚合方法,取最接近中位数值的两个点的平均值。
- exact_selector:选择器方法,返回行值,该行值至少有 50% 的点小于该值。
compression
压缩数据集时要使用的质心数。默认为 0.0
。
较大的数字会产生更准确的结果,但会增加内存需求。
tables
输入数据。默认为管道转发数据 (<-
)。
示例
使用中位数作为聚合转换
import "sampledata"
sampledata.float()
|> median()
使用中位数作为选择器转换
import "sampledata"
sampledata.float()
|> median(method: "exact_selector")
此页内容对您有帮助吗?
感谢您的反馈!