子查询可以分为相关子查询和非相关子查询。相关子查询指该子查询的执行依赖了外部查询的变量,这种子查询通常会执行多次。非相关子查询指该子查询的执行不依赖外部查询的变量,这种子查询一般只需要计算一次。对于非相关子查询与部分相关子查询,可以通过改写进行子查询消除,实现嵌套子查询的展开。
如果子查询中的列与外层查询中的列具有相同列名,必须在外层查询中在重复列名前加上表名或使用别名。
当上层查询引用到子查询中相关列时,将执行子查询,上层查询可以是SELECT
,UPDATE
或 DELETE
语句,各语句中使用子查询方式:
- 定义要插入到
INSERT
或CREATE TABLE
语句的目标表中的行集。 - 在
CREATE VIEW
或CREATE MATERIALIZED VIEW
语句中定义要包含在视图或物化视图中的行集。 - 在
UPDATE
中定义要分配给现有行的一个或多个值。 - 在
WHERE
子句、HAVING
子句或START WITH
中提供条件值。 - 定义包含查询操作的表。
以下情况数据库将进行嵌套子查询的展开:
- 不相关的
IN
子查询。 IN
和EXISTS
中的相关子查询不包含聚合函数或GROUP BY
子句。
可以通过 Hint UNNEST
控制是否展开嵌套子查询。
以下语句创建了表 table_a和表 table_b,并向表中插入数据:
CREATE TABLE table_a(PK INT, name VARCHAR(25));
INSERT INTO table_a VALUES(1,'福克斯');
INSERT INTO table_a VALUES(2,'警察');
INSERT INTO table_a VALUES(4,'林肯');
INSERT INTO table_a VALUES(5,'亚利桑那州');
INSERT INTO table_a VALUES(6,'华盛顿');
INSERT INTO table_a VALUES(7,'戴尔');
INSERT INTO table_a VALUES(10,'朗讯');
CREATE TABLE table_b(PK INT, name VARCHAR(25));
INSERT INTO table_b VALUES(1,'福克斯');
INSERT INTO table_b VALUES(3,'的士');
INSERT INTO table_b VALUES(6,'华盛顿');
INSERT INTO table_b VALUES(7,'戴尔');
INSERT INTO table_b VALUES(8,'微软');
INSERT INTO table_b VALUES(9,'苹果');
INSERT INTO table_b VALUES(11,'苏格兰威士忌');
查询结果如下:
+------+-----------+
| PK | NAME |
+------+-----------+
| 1 | 福克斯 |
| 2 | 警察 |
| 3 | 的士 |
| 6 | 华盛顿 |
| 7 | 戴尔 |
+------+-----------+
有依赖关系的子查询,子查询中用到了外层查询变量 T1.PK,执行以下语句:
查询结果如下:
+------+-----------+
+------+-----------+
| 1 | 福克斯 |
| 2 | 警察 |
| 3 | 的士 |
| 7 | 戴尔 |
+------+-----------+
查询结果如下:
+------------------------------------+
| Query Plan |
+------------------------------------+
=============================================
|ID|OPERATOR |NAME|EST. ROWS|COST|
---------------------------------------------
|0 |HASH RIGHT SEMI JOIN| |8 |107 |
|1 | TABLE SCAN |T2 |8 |38 |
|2 | TABLE SCAN |T1 |8 |38 |
=============================================
Outputs & filters:
-------------------------------------
0 - output([T1.PK], [T1.NAME]), filter(nil),
equal_conds([T1.PK = T2.NAME], [T2.NAME = T1.NAME]), other_conds(nil)
1 - output([T2.NAME]), filter(nil),
access([T2.NAME]), partitions(p0)
2 - output([T1.NAME], [T1.PK]), filter(nil),
+------------------------------------+