执行完全外连接

使用 join.full() 执行两个数据流的完全外连接。完全外连接为 left 和 right 输入流中的所有行输出一行，并根据 on 谓词连接匹配的行。

查看完全外连接的表格图示


r1	●	●
r2	●	●


r1	▲	▲
r3	▲	▲
r4	▲	▲


r1	●	●	▲	▲
r2	●	●
r3			▲	▲
r4			▲	▲

使用 join.full 连接您的数据

导入 join 包。
定义要连接的 left 和 right 数据流
- 每个流必须有一个或多个具有公共值的列。列标签不需要匹配，但列值需要匹配。
- 每个流应具有相同的分组键。
有关更多信息，请参阅连接数据要求。
使用 join.full() 将两个流连接在一起。提供以下必需的参数
- left: 表示连接左侧的数据流。
- right: 表示连接右侧的数据流。
- on: 连接谓词。例如：(l, r) => l.column == r.column。
- as: 连接输出函数，返回包含来自每个输入流的值的记录。
  考虑缺失的非分组键值
  在完全外连接中，左 (l) 或右 (r) 可能包含用于连接操作的列的 *null* 值，并默认为默认记录（填充分组键列，其他列为 *null*）。l 和 r 永远不会同时使用默认记录。
  为确保非分组键列的输出中包含非空值，请检查 l 或 r 记录中是否存在值，并返回存在的值
```
(l, r) => {
    id = if exists l.id then l.id else r.id

    return {_time: l.time, location: r.location, id: id}
}
```

以下示例使用来自 machineProduction 示例数据集的过滤选择作为 left 数据流，并使用 array.from() 创建的临时表作为 right 数据流。

示例数据分组

以下示例取消分组 left 流以匹配 right 流的分组。在两个流连接在一起后，连接的数据按 stationID 分组，并按 _time 排序。

import "array"
import "influxdata/influxdb/sample"
import "join"

left =
    sample.data(set: "machineProduction")
        |> filter(fn: (r) => r.stationID == "g1" or r.stationID == "g2" or r.stationID == "g3")
        |> filter(fn: (r) => r._field == "oil_temp")
        |> limit(n: 5)

right =
    array.from(
        rows: [
            {station: "g1", opType: "auto", last_maintained: 2021-07-15T00:00:00Z},
            {station: "g2", opType: "manned", last_maintained: 2021-07-02T00:00:00Z},
            {station: "g4", opType: "auto", last_maintained: 2021-08-04T00:00:00Z},
        ],
    )

join.full(
    left: left |> group(),
    right: right,
    on: (l, r) => l.stationID == r.station,
    as: (l, r) => {
        stationID = if exists l.stationID then l.stationID else r.station

        return {
            stationID: stationID,
            _time: l._time,
            _field: l._field,
            _value: l._value,
            opType: r.opType,
            maintained: r.last_maintained,
        }
    },
)
    |> group(columns: ["stationID"])
    |> sort(columns: ["_time"])

查看示例输入和输出数据

输入

left

_start 和 _stop 列已被省略。

_time	_measurement	stationID	_field	_value
2021-08-01T00:00:00Z	machinery	g1	oil_temp	39.1
2021-08-01T00:00:11.51Z	machinery	g1	oil_temp	40.3
2021-08-01T00:00:19.53Z	machinery	g1	oil_temp	40.6
2021-08-01T00:00:25.1Z	machinery	g1	oil_temp	40.72
2021-08-01T00:00:36.88Z	machinery	g1	oil_temp	40.8

_time	_measurement	stationID	_field	_value
2021-08-01T00:00:00Z	machinery	g2	oil_temp	40.6
2021-08-01T00:00:27.93Z	machinery	g2	oil_temp	40.6
2021-08-01T00:00:54.96Z	machinery	g2	oil_temp	40.6
2021-08-01T00:01:17.27Z	machinery	g2	oil_temp	40.6
2021-08-01T00:01:41.84Z	machinery	g2	oil_temp	40.6

_time	_measurement	stationID	_field	_value
2021-08-01T00:00:00Z	machinery	g3	oil_temp	41.4
2021-08-01T00:00:14.46Z	machinery	g3	oil_temp	41.36
2021-08-01T00:00:25.29Z	machinery	g3	oil_temp	41.4
2021-08-01T00:00:38.77Z	machinery	g3	oil_temp	41.4
2021-08-01T00:00:51.2Z	machinery	g3	oil_temp	41.4

right

station	opType	last_maintained
g1	auto	2021-07-15T00:00:00Z
g2	manned	2021-07-02T00:00:00Z
g4	auto	2021-08-04T00:00:00Z

输出

_time	stationID	_field	_value	maintained	opType
2021-08-01T00:00:00Z	g1	oil_temp	39.1	2021-07-15T00:00:00Z	auto
2021-08-01T00:00:11.51Z	g1	oil_temp	40.3	2021-07-15T00:00:00Z	auto
2021-08-01T00:00:19.53Z	g1	oil_temp	40.6	2021-07-15T00:00:00Z	auto
2021-08-01T00:00:25.1Z	g1	oil_temp	40.72	2021-07-15T00:00:00Z	auto
2021-08-01T00:00:36.88Z	g1	oil_temp	40.8	2021-07-15T00:00:00Z	auto

_time	stationID	_field	_value	maintained	opType
2021-08-01T00:00:00Z	g2	oil_temp	40.6	2021-07-02T00:00:00Z	manned
2021-08-01T00:00:27.93Z	g2	oil_temp	40.6	2021-07-02T00:00:00Z	manned
2021-08-01T00:00:54.96Z	g2	oil_temp	40.6	2021-07-02T00:00:00Z	manned
2021-08-01T00:01:17.27Z	g2	oil_temp	40.6	2021-07-02T00:00:00Z	manned
2021-08-01T00:01:41.84Z	g2	oil_temp	40.6	2021-07-02T00:00:00Z	manned

_time	stationID	_field	_value
2021-08-01T00:00:00Z	g3	oil_temp	41.4
2021-08-01T00:00:14.46Z	g3	oil_temp	41.36
2021-08-01T00:00:25.29Z	g3	oil_temp	41.4
2021-08-01T00:00:38.77Z	g3	oil_temp	41.4
2021-08-01T00:00:51.2Z	g3	oil_temp	41.4

_time	stationID	_field	_value	maintained	opType
	g4			2021-08-04T00:00:00Z	auto

关于连接输出的注意事项

由于右侧流没有带有 g3 stationID 标签的行，因此连接的输出包括来自左侧流的带有 g3 stationID 标签的行，这些行在从 right 流填充的列中包含 *null* 值。
由于左侧流没有带有 g4 stationID 标签的行，因此连接的输出包括来自右侧流的带有 g4 stationID 标签的行，这些行在从 left 流填充的列中包含 *null* 值。

此页是否对您有帮助？

感谢您的反馈！

支持和反馈

感谢您成为我们社区的一份子！我们欢迎并鼓励您提供关于 Flux 和本文档的反馈和错误报告。要获得支持，请使用以下资源

拥有年度合同或支持合同的客户 可以联系 InfluxData 支持。

编辑此页提交文档问题提交 Flux 问题

执行完全外连接

left

right

完全外连接结果

使用 join.full 连接您的数据

考虑缺失的非分组键值

示例数据分组

输入

left

right

输出

关于连接输出的注意事项

支持和反馈

Flux 的未来

InfluxDB 3 Core 和 Enterprise

执行完全外连接

left

right

完全外连接结果

使用 join.full 连接您的数据

考虑缺失的非分组键值

示例数据分组

输入

left

right

输出

关于连接输出的注意事项

相关内容

支持和反馈

您在哪里运行 InfluxDB？

AWS

GCP

Azure

默认

自定义

感谢您的反馈！

Flux 的未来

InfluxDB 3 Core 和 Enterprise