experimental.histogram() 函数
experimental.histogram()
随时可能更改。
experimental.histogram()
通过计算一组桶的数据频率来近似数据集的累积分布。
一个桶由一个上限定义,所有小于或等于该上限的数据点都计入该桶。桶计数是累积的。
函数行为
- 为每个输入表输出一个表。
- 每个输出表代表一个唯一的直方图。
- 输出表与相应的输入表具有相同的分组键。
- 删除不属于分组键的列。
- 添加一个
le
列来存储上限值。 - 将桶计数存储在
_value
列中。
函数类型签名
(<-tables: stream[{A with _value: float}], bins: [float], ?normalize: bool) => stream[{A with le: float, _value: float}]
有关更多信息,请参阅函数类型签名。
参数
bins
(必需)用于计算直方图频率的上限列表,包括数据集的最大值。
如果不知道最大值,则此值可以设置为正无穷大 (float(v: "+Inf")
)。
桶辅助函数
以下辅助函数可用于生成桶。
linearBins()
logarithmicBins()
normalize
将计数转换为 0 到 1 之间的频率值。默认为 false
。
注意:归一化的直方图不能通过求和它们的计数来聚合。
tables
输入数据。默认为管道转发数据 (<-
)。
示例
从输入数据创建直方图
import "experimental"
import "sampledata"
sampledata.float()
|> experimental.histogram(
bins: [
0.0,
5.0,
10.0,
15.0,
20.0,
],
)
此页面是否对您有帮助?
感谢您的反馈!