SQL是IT行业很多岗位都要求具备的一项能力,对于数据岗位而言更是如此,甚至说扎实的SQL基础也往往是入职这些岗位的必备技能。而在SQL面试中,一道出镜频率很高的题目就是行转列和列转行的问题,可以说这也是一道经典的SQL题目,本文就这一问题做以介绍分享。
给定如下模拟数据集,这也是SQL领域经典的学生成绩表问题。两张期望的数据表分别如下:1)长表:
2)宽表:
考察的问题就是通过SQL语句实现在这两种形态间转换,其中长表转为宽表即行转列,宽表转为长表即列转行。
在行转列中,经典的解决方案是条件聚合,即sum+if组合。其基本的思路是这样的:
按照这一思路,一句SQL实现行转列的写法如下:
SELECT uid,
sum(if(course='语文', score, NULL)) as `语文`,
sum(if(course='数学', score, NULL)) as `数学`,
sum(if(course='英语', score, NULL)) as `英语`,
sum(if(course='物理', score, NULL)) as `物理`,
sum(if(course='化学', score, NULL)) as `化学`
FROM scoreLong
GROUP BY uid
查询结果当然是预期的行转列后的结果:
其中,if(course=’语文’, score, NULL)语句实现了当且仅当课程为语文时取值为课程成绩,否则取值为空,这相当于衍生了一个新的列字段,且对于每个uid而言,其所有成绩就只有特定课程的结果非空,其余均为空。这样,无论使用任何聚合函数,都可以得到该uid下指定课程的成绩结果。这里是用了sum函数,其实用min、max效果也是一样的,因为待聚合的数值中就只有那一个值非空。
列转行是上述过程的逆过程,所以其思路也比较直观:
按照这一思路,给出SQL实现如下
SELECT uid, '语文' as course, `语文` as scoreFROM scoreWideWHERE `语文` IS NOT NULL
UNION
SELECT uid, '数学' as course, `数学` as scoreFROM scoreWideWHERE `数学` IS NOT NULL
UNION
SELECT uid, '英语' as course, `英语` as scoreFROM scoreWideWHERE `英语` IS NOT NULL
UNION
SELECT uid, '物理' as course, `物理` as scoreFROM scoreWideWHERE `物理` IS NOT NULL
UNION
SELECT uid, '化学' as course, `化学` as scoreFROM scoreWideWHERE `化学` IS NOT NULL
查询结果当然是预期的长表。这里重点解释其中的三个细节:
这实际上对应的一个知识点是:在SQL中字符串的引用用单引号(其实双引号也可以),而列字段名称的引用则是用反引号