神奇的 SQL 之 CASE表达式,妙用多多 !

  • 时间:
  • 浏览:0

前言

  历史考试选用 题:黄花岗起义第一枪谁开的? A宋教仁 B孙中山 C黄兴 D徐锡麟,考生选C。

  又看第二题:黄花岗起义第二枪谁开的? 考生傻了,就选了个B。

  接着看第三题:黄花岗起义中,第三枪谁开的? 考生疯了,胡乱选了A。

  考试出来就去找出卷老师。老师玩转信用卡 课本说:黄兴连开三枪,揭开了黄花岗起义的序幕。考生:......

CASE表达式 之概念

  相信一帮人 都用过CASE表达式,尤其是做或多或少统计功能的但是,用的一阵一阵多,可真要说那些是 CASE表达式,我估计还真没几当事人能清楚的表述出来。CASE表达式和 “2+1” 可能性 “120/3” 从前的表达式一样,是这些进行运算的功能,正如CASE(清况 )这些 词的含义一样,用于区分清况 ,在有条件分歧的但是使用它。CASE表达式是从 SQL-92 标准开始英文英文英语 被引入的,可能性可能性它是相对较新的技术,就说 尽管使用起来非常便利,但其真正的价值却不要 为社 为人所知。就说 人不用它,可能性用它的简略版函数,类式 DECODE(Oracle)、IF(MySQL)等。然而,CASE表达式我知道你是 SQL-92 标准里加入的最有用的底部形态,可能性能用好它,那末 SQL 能处置的疑问就会更广泛,写法也会更加漂亮,但是,可能性 CASE表达式 是不依赖于具体数据库的技术,就说 还能够提高 SQL 代码的可移植性。

  基本格式如下

-- 简单 CASE表达式
CASE 列(或表达式)
     WHEN <匹配值1> THEN <表达式>
     WHEN <匹配值2> THEN <表达式>
     ......
     ELSE <表达式>
END

-- 搜索 CASE表达式
CASE WHEN <判断表达式> THEN <表达式>
     WHEN <判断表达式> THEN <表达式>
     WHEN <判断表达式> THEN <表达式>
     ......
     ELSE <表达式>
END


-- 简单 CASE表达式 示例
CASE sex
    WHEN '1' THEN ''
    WHEN '2' THEN ''
    ELSE '或多或少' 
END

-- 搜索CASE表达式 示例
CASE WHEN sex = '1' THEN ''
     WHEN sex = '2' THEN ''
     ELSE '或多或少' 
END

  CASE表达式 的 ELSE子句 还能够省略,但推荐不要 省略,省略了可能性会出先一帮人 意料之外的结果。END非要省,需要有。当 WHEN子句 为真时,CASE表达式 的真假值判断就会中止,而剩余的 WHEN子句会被忽略。为了处置引起不要 要的混乱,使用 WHEN子句 需要注意条件的排他性。

  简单CASE表达式正如其名,写法简单,但能实现的功能比较有限。简单CASE表达式能写的条件,搜索CASE表达式能够写,就说 基本上采用搜索CASE表达式的写法。

CASE表达式 之妙用

  里边讲了 CASE表达式 的理论知识,感觉不痛不痒,那末 接下来一帮人 进入实战篇,结合或多或少场景来看看 CASE表达式 的妙用

  行转列

    可能性一帮人 用的更多的是 IF(MySQL)或 DECODE(Oracle),但这两者都都在标准的 SQL,更推荐一帮人 用 CASE表达式,移植性更高

    假设一帮人 有如下表,以及如下数据

CREATE TABLE t_customer_credit (
    id INT(11) UNSIGNED NOT NULL AUTO_INCREMENT COMMENT '自增主键',
    login_name VARCHAR(400) NOT NULL COMMENT '登录名',
    credit_type TINYINT(1) NOT NULL COMMENT '额度类型,1:自由资金,2:冻结资金,3:优惠',
    amount DECIMAL(22,6) NOT NULL DEFAULT '0.00000' COMMENT '额度值',
    create_by VARCHAR(400) NOT NULL COMMENT '创建者',
    create_time DATETIME NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '创建时间',
    update_time DATETIME NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '创建时间',
    update_by VARCHAR(400) NOT NULL COMMENT '修改者',
  PRIMARY KEY (id)
);
INSERT INTO `t_customer_credit` VALUES (1, 'zhangsan', 1, 5400.000000, 'system', '2019-7-7 11:400:09', '2019-7-8 20:21:05', 'system');
INSERT INTO `t_customer_credit` VALUES (2, 'zhangsan', 2, 0.000000, 'system', '2019-7-7 11:400:09', '2019-7-7 11:400:09', 'system');
INSERT INTO `t_customer_credit` VALUES (3, 'zhangsan', 3, 0.000000, 'system', '2019-7-7 11:400:09', '2019-7-7 11:400:09', 'system');
INSERT INTO `t_customer_credit` VALUES (4, 'lisi', 1, 0.000000, 'system', '2019-7-7 11:400:09', '2019-7-7 11:400:09', 'system');
INSERT INTO `t_customer_credit` VALUES (5, 'lisi', 2, 0.000000, 'system', '2019-7-7 11:400:09', '2019-7-7 11:400:09', 'system');
INSERT INTO `t_customer_credit` VALUES (6, 'lisi', 3, 0.000000, 'system', '2019-7-7 11:400:09', '2019-7-7 11:400:09', 'system');
View Code

    可能性一帮人 要一行显示用户的六个 额度,而都在 3 条记录显示 3 个额度,一帮人 应该为社 做,土依据有就说 种,这里提供如下 3 种

-- 1、最容易想到的IF,不具备移植性,不推荐
SELECT login_name,
    MAX(IF(credit_type=1, amount, 0)) freeAmount,
    MAX(IF(credit_type=2, amount, 0)) freezeAmount,
    MAX(IF(credit_type=3, amount, 0)) promotionAmount
FROM t_customer_credit GROUP BY login_name;

-- 2、CASE表达式,标准的 SQL 规范,具备移植性,推荐使用
SELECT login_name,
    MAX(CASE WHEN credit_type = 1 THEN amount ELSE 0 END) freeAmount,
    MAX(CASE WHEN credit_type = 2 THEN amount ELSE 0 END) freezeAmount,
    MAX(CASE WHEN credit_type = 3 THEN amount ELSE 0 END) promotionAmount
FROM t_customer_credit GROUP BY login_name;

-- 3、自连接,数据量大的清况

下,结合索引,下行速率

不错,具备移植性
SELECT
    a.login_name,a.amount freeAmount,
    b.amount freezeAmount,
    c.amount promotionAmount
FROM (
    SELECT login_name, amount FROM t_customer_credit WHERE credit_type = 1
)a
LEFT JOIN t_customer_credit b ON a.login_name = b.login_name AND b.credit_type = 2
LEFT JOIN t_customer_credit c ON a.login_name = c.login_name AND c.credit_type = 3;
View Code

    无论是 IF 还是 CASE表达式,都结合了 GROUP BY 与聚合函数,下行速率 是个疑问,而自连接是下行速率 最高的,不管在都那末 login_name 加上索引

  转换统计

    将已有编号土依据转换为新的土依据并统计,在进行非定制化统计时,一帮人 总爱会遇到将已有编号土依据转换为另外这些便于分析的土依据并进行统计的需求。假设一帮人 有如下表

DROP TABLE t_province_population;
CREATE TABLE t_province_population (
  id tinyint(2) unsigned NOT NULL AUTO_INCREMENT COMMENT '自增主键',
  province_name varchar(400) NOT NULL COMMENT '省份名',
  sex tinyint(1) NOT NULL COMMENT '性别,1:男,2:女',
  population int(11) NOT NULL COMMENT '人口数',
  PRIMARY KEY (id)
);

INSERT INTO t_province_population(province_name,sex,population)
VALUES
("黑龙江", 1 ,20),
("黑龙江", 2 ,18),
("内蒙古", 1 ,7),
("内蒙古", 2 ,8),
("海南", 1 ,20),
("海南", 2 ,22),
("西藏", 1 ,8),
("西藏", 2 ,7),
("浙江", 1 ,35),
("浙江", 2 ,35),
("台湾", 1 ,26),
("台湾", 2 ,23),
("河南", 1 ,40),
("河南", 2 ,38),
("湖北", 1 ,27),
("湖北", 2 ,24);

SELECT * FROM t_province_population;
View Code

    一帮人 需要按各个省所在的位置,统计出东南西北中,各个区域内的人口数量

      东:浙江、台湾,西:西藏,南:海南,北:黑龙江、内蒙古,中:湖北、河南

    可能性一帮人觉得这些 表设计的不合理,应该在设计之初就应该多加六个 区域字段(district)来标明各省所属区域。最好的做法觉得是从前,但这得需要一帮人 在设计之初的以还能够考虑得到,可能性有从前的需求,假设一帮人 设计之初那末 从前的需求,而一帮人 也没考虑到,那末 有那末 那些土依据来实现了? 一帮人 还能够从前来写 SQL

    结果如下

    假设一帮人 需要对各个省份做六个 人口数级别的统计,统计出各个级别的数量

      level_1:population < 20,level_2:20 <= population < 400 ,level_3:400 <= population < 70 ,level_4:>= 70;统计出 level_1 ~ level_4 的数量各有几块

    SQL 与执行结果如下

    这些 转换统计还是比较常用的,重点就说 GROUP BY 子句的写法。

  条件分支

    SELECT 条件分支

      还是以里边的 t_province_population 为例,可能性一帮人 你要直观的知道各个省份的男、女数量清况 ,类式如下

      一帮人 要为社 写 SQL? 有如下这些土依据

      觉得就说 行转列,行转列更容易懂

    UPDATE 条件分支

      一帮人 有一张薪资表,如下

CREATE TABLE t_user_salaries(
  id int(11) unsigned NOT NULL AUTO_INCREMENT COMMENT '自增主键',
  name varchar(400) NOT NULL COMMENT '姓名',
    sex tinyint(1) NOT NULL COMMENT '性别,1:男,2:女',
  salary int(11) NOT NULL COMMENT '薪资',
  PRIMARY KEY (id)
);

INSERT INTO t_user_salaries(name, sex,salary) VALUES
("张三", 1, 40000),
("李四", 1, 27000),
("王五", 1, 24000),
("菲菲", 2, 24000),
("赵六", 1, 29000);

SELECT * FROM t_user_salaries;
View Code

      假设现在需要根据以下条件对该表的数据进行更新:1、对当前工资为 40000 元以上的员工,降薪 10%,2、对当前工资为 240000 元以上且不满 240000 元的员工,加薪 20%。调整但是的薪资如下所示

      乍一看,分别执行下面六个 UPDATE 操作好像就还能够做到,但是一帮人 执行下看看结果

      一帮人 发现张三的薪资不降反升了! 这是可能性执行 条件1的SQL后,张三的薪资又满足条件2了,就说 又更新了一遍,是因为他的薪资变多了,一帮人可能性会说,把条件1和条件2的SQL换下顺序不就好哪天,一帮人 来试试

      张三的薪资是降对了,可李四的薪资却涨错了!这是可能性李四的薪资满足条件2,升了 20% 但是又满足条件1,又降了 10%。难道就那末 就那末 正确的土依据了? 一帮人 来看看这些 SQL

      完美不? 一阵一阵完美,这些 技巧的应用范围很广,值得一帮人 掌握

  CHECK 约束

    注意:CHECK 是标准的 SQL,但是 MySQL 却那末 实现它,就说 CHECK 在 MySQL 中是不起作用的!

    回到一帮人 的薪资表,假设某个公司有从前六个 无理的规定:四十岁的女人 员工的工资不得高于400000,一帮人 可能性实现它? 土依据有这些:1、代码层面控制 、2、数据库表加约束。

    代码层面控制就不要 说了,这些帮人 平时最能想到的,实际也是用的最多的;那从表约束,一帮人 该怎么才能 才能 实现了,像从前吗?

    那末 实现就你要发现公司的男同事都在提着刀来找你了,可能性那末 一帮人 的薪资,这些 约束会是因为录入不了男性的薪资! 可能性一帮人 的约束是:sex=2 AND salary < = 400000 表示 “是四十岁的女人 ,但是薪资非要高于400000”,而都在:“可能性是四十岁的女人 ,薪资不高于400000”。正确的约束条件应该那末 写

  CASE表达式还有就说 或多或少的用处,强大的不得了,但是深度灵活;用好它,能让一帮人 写出更加契合的 SQL。

总结

  1、CASE表达式 是支撑 SQL 声明式编程的根基之一,也是灵活运用 SQL 时不可或缺的基础技能。作为表达式,CASE 表达式在执行都在被判定为六个 固定值,但是它还能够写在聚合函数内内外部;也正可能性它是表达式,就说 还还能够写在SELECE 子句、GROUP BY 子句、WHERE 子句、ORDER BY 子句里。简单点说,在能写列名和常量的地方,通常都还能够写 CASE 表达式

  2、写 CASE表达式 的注意点

    a、各个分支返回的数据类型要一致

    b、养成写 ELSE 的好习惯

    c、不要 忘了写 END

  3、多条件时,用 OR 、AND 等谓词,IF 函数也一样

参考

  《SQL基础教程》

  《SQL进阶教程》