使用关联子查询解决组内筛选的过程

导读：本文主要介绍SQL环境下的关联子查询，如何理解关联子查询，以及如何使用关联子查询解决组内筛选的问题。

什么是关联子查询

关联子查询是指和外部查询有关联的子查询，具体来说就是在这个子查询里使用了外部查询包含的列。

因为这种可以使用关联列的灵活性，将SQL查询写成子查询的形式往往可以极大的简化SQL语句，也使得SQL查询语句更方便理解。

关联子查询的执行逻辑

在关联子查询中，对于外部查询返回的每一行数据，内部查询都要执行一次。另外，在关联子查询中是信息流是双向的。外部查询的每行数据传递一个值给子查询，然后子查询为每一行数据执行一次并返回它的记录。然后，外部查询根据返回的记录做出决策。

关联子查询主要分为三步进行处理：

1、外部查询得到一条记录并传递到内部查询中；

2、内部查询基于输入值执行，并将返回值传递到外部查询中；

3、外部查询基于这个返回值再进行查询，并做出决策。

关联子查询与普通子查询的区别

在普通子查询中，执行顺序是由内到外，先执行内部查询再执行外部查询。内部查询的执行不依赖于外部查询，且内部查询只处理一次，外部查询基于内部查询返回值再进行查询，就查询完毕了。

而在关联子查询中，信息传播是双向而不是单向的。内部查询利用关联子查询涉及外部查询提供的信息，外部查询也会根据内部查询返回的记录进行决策。内部查询的执行依赖于外部查询，不能单独执行。

在细分的组内进行比较时，需要使用关联子查询。

比如查询三门课程分数相同的学生，需要将各科考试成绩的记录按照学生进行分组，同一个学生的三科成绩分为一组，对组内的三科成绩进行比较是否相同，来筛选满足条件的学生。

再比如查询价格低于该品类平均价格的商品，需要将各品类的商品信息按照品类进行分组，同一个品类的商品记录分为一个组，对组内的多个商品计算平均价格，来筛选满足条件的商品。

员工表的表结构如下：

表中数据如下：

要解决的问题：

查询工资高于同职位的平均工资的员工信息

遇到此类问题，首先想到的思路是对职位分组，这样就能分别得到各个职位的平均工资，再比较每个员工的工资与其对应职位的平均工资，大于则被筛选出来。

因此，第一步：分组统计各职位的平均工资

第二步：比较每个员工的工资与其对应职位的平均工资

因为子查询返回结果是5行，因此这段代码根本无法执行。

通过设置表别名的方法，将一个表虚拟成两个表进行自连接，并且使用关联子查询，内部查询返回的结果，传递给外部查询进行比较筛选。

这段代码的执行步骤如下：

第一步：先执行外部查询，select* from emp e也就是遍历表中的每一条记录，而因为子查询中用到了自连接（where job=e.job），所以将外部查询的第一条记录，也就是

传递给子查询。

第二步：进入子查询后，传递给子查询的这条记录的job是clerk，子查询执行select avg(sal) from empwhere job=e.job 时，就会筛选出所有job=’clerk’的员工，计算出平均工资。相当于执行了

将这个计算值传递给外部查询。

第三步：外部查询基于1037.5进行筛选，找出同职位工资高于1037.5的员工。相当于执行了

循环执行：

第一步：执行外部查询，即select* from emp e将外部查询的第二条记录，也就是

传递给子查询。

第二步：进入子查询后，传递给子查询的这条记录的job是salesman，子查询执行select avg(sal) from empwhere job=e.job时，就会筛选出所有job=’salesman’的员工，计算出平均工资。相当于执行了

将这个计算值传递给外部查询。

第三步：外部查询基于1400进行筛选，找出同职位工资高于1400的员工。相当于执行了

继续循环直到表中的最后一条记录，最终返回满足条件的员工信息。

普通子查询的内部查询独立于外部查询，可以单独执行，但子查询仅执行一次，外部查询基于返回值再进行查询和筛选，整个查询过程就结束了。

在关联子查询中，内部查询依赖于外部查询，不能单独执行。外部查询执行一次并传递一条记录给子查询，子查询就要执行一次并将返回值传递给外部查询，外部查询再执行筛选并决策，如此循环直到表中最后一条记录。

MySQL REPLACE INTO语句 MySQL之 join