join.tables() 函数

Flux 0.172.0+
查看 InfluxDB 支持

join.tables() 使用指定的方法、谓词和一个函数来连接两个输入流，以连接来自每个输入流的两个对应记录。

join.tables() 仅比较具有相同分组键的记录。输出表与输入表具有相同的分组。

函数类型签名

(
    <-left: stream[A],
    as: (l: A, r: B) => C,
    method: string,
    on: (l: A, r: B) => bool,
    right: stream[B],
) => stream[C] where A: Record, B: Record, C: Record

有关更多信息，请参阅函数类型签名。

参数

left

左侧输入流。默认为管道转发数据 (<-)。

right

(必需) 右侧输入流。

on

(必需) 接受左侧和右侧记录（分别为 l 和 r）并返回布尔值的函数。

函数体必须是单个布尔表达式，由 l 的属性和 r 的属性之间的一个或多个相等比较组成，每个比较都由 and 运算符链接在一起。

as

(必需) 接受左侧和右侧记录（分别为 l 和 r）并返回记录的函数。返回的记录包含在最终输出中。

method

(必需) 指定连接方法的字符串。

支持的方法

inner
left
right
full

执行内连接

import "sampledata"
import "join"

ints = sampledata.int()
strings = sampledata.string()

join.tables(
    method: "inner",
    left: ints,
    right: strings,
    on: (l, r) => l._time == r._time,
    as: (l, r) => ({l with label: r._value}),
)

查看示例输出

_time	_value	label	*tag
2021-01-01T00:00:00Z	-2	smpl_g9qczs	t1
2021-01-01T00:00:10Z	10	smpl_0mgv9n	t1
2021-01-01T00:00:20Z	7	smpl_phw664	t1
2021-01-01T00:00:30Z	17	smpl_guvzy4	t1
2021-01-01T00:00:40Z	15	smpl_5v3cce	t1
2021-01-01T00:00:50Z	4	smpl_s9fmgy	t1

_time	_value	label	*tag
2021-01-01T00:00:00Z	19	smpl_b5eida	t2
2021-01-01T00:00:10Z	4	smpl_eu4oxp	t2
2021-01-01T00:00:20Z	-3	smpl_5g7tz4	t2
2021-01-01T00:00:30Z	19	smpl_sox1ut	t2
2021-01-01T00:00:40Z	13	smpl_wfm757	t2
2021-01-01T00:00:50Z	1	smpl_dtn2bv	t2

执行左外连接

如果连接方法不是 inner，请特别注意如何在 as 函数中构造输出记录。

由于 Flux 处理外连接的方式，l 或 r 可能为默认记录。这意味着非分组键列中的任何值都可能为空。

有关外连接行为的更多信息，请参阅 join 包文档中的外连接部分。

在左外连接的情况下，保证 l 不是默认记录。为确保输出记录对于任何非分组键列都具有非空值，请使用来自 l 的值。使用来自 r 的非分组键值可能会导致该值为空。

下面的示例几乎完全从 l 的属性构造输出记录。唯一的例外是 v_right 列，它从 r._value 获取其值。在这种情况下，请理解并预期 v_right 有时会为空。

import "array"
import "join"

left =
    array.from(
        rows: [
            {_time: 2022-01-01T00:00:00Z, _value: 1, label: "a"},
            {_time: 2022-01-01T00:00:00Z, _value: 2, label: "b"},
            {_time: 2022-01-01T00:00:00Z, _value: 3, label: "d"},
        ],
    )
right =
    array.from(
        rows: [
            {_time: 2022-01-01T00:00:00Z, _value: 0.4, id: "a"},
            {_time: 2022-01-01T00:00:00Z, _value: 0.5, id: "c"},
            {_time: 2022-01-01T00:00:00Z, _value: 0.6, id: "d"},
        ],
    )

join.tables(
    method: "left",
    left: left,
    right: right,
    on: (l, r) => l.label == r.id and l._time == r._time,
    as: (l, r) => ({_time: l._time, label: l.label, v_left: l._value, v_right: r._value}),
)

查看示例输出

_time	label	v_left	v_right
2022-01-01T00:00:00Z	a	1	0.4
2022-01-01T00:00:00Z	b	2
2022-01-01T00:00:00Z	d	3	0.6

执行右外连接

下一个示例与上一个示例几乎相同，但使用 right 连接方法。使用此方法，保证 r 不是默认记录，但 l 可能是默认记录。由于 l 更可能包含空值，因此输出记录几乎完全从 r 的属性构建，但 v_left 除外，我们预计它有时会为空。

import "array"
import "join"

left =
    array.from(
        rows: [
            {_time: 2022-01-01T00:00:00Z, _value: 1, label: "a"},
            {_time: 2022-01-01T00:00:00Z, _value: 2, label: "b"},
            {_time: 2022-01-01T00:00:00Z, _value: 3, label: "d"},
        ],
    )
right =
    array.from(
        rows: [
            {_time: 2022-01-01T00:00:00Z, _value: 0.4, id: "a"},
            {_time: 2022-01-01T00:00:00Z, _value: 0.5, id: "c"},
            {_time: 2022-01-01T00:00:00Z, _value: 0.6, id: "d"},
        ],
    )

join.tables(
    method: "right",
    left: left,
    right: right,
    on: (l, r) => l.label == r.id and l._time == r._time,
    as: (l, r) => ({_time: r._time, label: r.id, v_left: l._value, v_right: r._value}),
)

查看示例输出

_time	label	v_left	v_right
2022-01-01T00:00:00Z	a	1	0.4
2022-01-01T00:00:00Z	c		0.5
2022-01-01T00:00:00Z	d	3	0.6

执行全外连接

在全外连接中，无法保证 l 或 r。它们中的任何一个都可能是默认记录，但它们永远不会同时成为默认记录。

要获取输出记录的非空值，请检查 l 和 r，以查看哪个包含所需的值。

下面的示例为 as 参数定义了一个函数，该函数适当地处理了全外连接的不确定性。

v_left 和 v_right 仍然直接使用来自 l 和 r 的值，因为我们预计它们有时在输出表中为空。

import "array"
import "join"

left =
    array.from(
        rows: [
            {_time: 2022-01-01T00:00:00Z, _value: 1, label: "a"},
            {_time: 2022-01-01T00:00:00Z, _value: 2, label: "b"},
            {_time: 2022-01-01T00:00:00Z, _value: 3, label: "d"},
        ],
    )
right =
    array.from(
        rows: [
            {_time: 2022-01-01T00:00:00Z, _value: 0.4, id: "a"},
            {_time: 2022-01-01T00:00:00Z, _value: 0.5, id: "c"},
            {_time: 2022-01-01T00:00:00Z, _value: 0.6, id: "d"},
        ],
    )

join.tables(
    method: "full",
    left: left,
    right: right,
    on: (l, r) => l.label == r.id and l._time == r._time,
    as: (l, r) => {
        time = if exists l._time then l._time else r._time
        label = if exists l.label then l.label else r.id

        return {_time: time, label: label, v_left: l._value, v_right: r._value}
    },
)

查看示例输出

_time	label	v_left	v_right
2022-01-01T00:00:00Z	a	1	0.4
2022-01-01T00:00:00Z	b	2
2022-01-01T00:00:00Z	c		0.5
2022-01-01T00:00:00Z	d	3	0.6

转换

此页面是否对您有帮助？

感谢您的反馈！

支持和反馈

感谢您成为我们社区的一份子！我们欢迎并鼓励您对 Flux 和此文档提供反馈和错误报告。要获得支持，请使用以下资源

拥有年度或支持合同的客户可以联系 InfluxData 支持。

编辑此页面提交文档问题提交 Flux 问题

join.tables() 函数

函数类型签名

参数

left

right

on

as

method

示例

执行内连接

输出数据

执行左外连接

输出数据

执行右外连接

输出数据

执行全外连接

输出数据

支持和反馈

Flux 的未来

InfluxDB 3 Core 和 Enterprise

join.tables() 函数

函数类型签名

参数

left

right

on

as

method

示例

执行内连接

输出数据

执行左外连接

输出数据

执行右外连接

输出数据

执行全外连接

输出数据

相关内容

支持和反馈

您在哪里运行 InfluxDB？

AWS

GCP

Azure

默认

自定义

感谢您的反馈！

InfluxDB 对 join.tables() 的支持

InfluxDB 开源 (OSS)

InfluxDB Enterprise

Flux 的未来

InfluxDB 3 Core 和 Enterprise

InfluxDB 对 `join.tables()` 的支持