MySQL自定义变量

Posted 爱数据原统计网

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了MySQL自定义变量相关的知识,希望对你有一定的参考价值。

来源:数师兄


相信大家对join,where 以及子查询等等操作已经非常熟悉,在此基础上如果对于mysql的用户自定义变量再熟练掌握了,那么对于数据分析来说就又多了一个工具。虽然这个功能不是经常用,但是学来扩展一下自己的知识库也是好的,免得书到用时方恨少。


今天有机会请到了自定义变量本量来给大家现场说法,咱天就唠叨唠叨自定义变量是个啥,是咋工作的。


01

自定义变量:自我介绍

大家好,我是mysql自定义变量,和其他的自定义变量一样,你们可以把我当作一个小盒子,如果想要召唤我只要大喊一声

set @ver:='x'

就可以召唤出自定义变量本量,顺便把x放装进了盒子。


心中默念  set @ver:='b'  就可以装成功,如果心情不好我还可以啥也不装,比如set @ver:=0,如果召唤我请珍惜我,因为我在一次mysql链接中有效。

不要以为我只能散装,把我安装在生产线上照样能行。比如某条sql生产出来一个指标需要存一下,只需要把结果into我就行了,具体操作如下:select count(1)  into @ver from table想跟装进去的东西确认眼神么?select @ver,马上告诉你盒子里现在装了个啥


我一般不会单独存在,而是内嵌到sql语句里面作为一个存储中间变量的容器,如果想知道和我sql语句之间是怎么配合的,就不得不了解一下我的小老弟—sql


02

SQL的自我简介

大家好,我是SQL,是一种数据库操作的工具,也是自定义变量的好大哥。如果能配合EXCEL来了解我,就会发现我不是一个慢热的人。能动手咱就不bb,举个栗子让你看一下我们俩有多像


栗子如下:

selectidfrom(select id from table1 ) ajoin(select id from table2) bon a.id=b.idwhere a.id>=100order by id

首先我要执行子查询,也就是把a和b两个中间表搞出来(ab两个表可以理解为excle的两个sheet)


然后我再执行join语句,对两个表根据id进行笛卡尔乘积,得到两个表的全部信息(主键唯一的情况下可以理解为excel的vlookup)


当然有些信息并不是我们需要的,怎么过滤呢,用where语句(相当于excel的筛选功能)


最终以order  by  对最终结果进行排序(对应excel的排序功能)


下面说一点细节可以加深我和自定义标量之间的合作方式


当我select  想要的列时候(select id from table)可以看成是读取了一列id,也可以看成是一行一行读取id列,每取一条记录,游标往下走一格,当遍历完所有的数据之后再呈现给我们一列id。按照第二种方式相当于是python遍历数组,中间自然可以加一些变量来存储一些数据。


有点抽象?举个例子~


03

举几个例子

 某个数据表格记录了AB两个店每个小时的营业额,原始数据如下

CREATE TABLE `wk_test` (`date` varchar(20) NOT NULL COMMENT '日期',`shop` varchar(255) NOT NULL COMMENT '商店',`hour` int(11) NOT NULL COMMENT '小时',`income` int(11) NOT NULL COMMENT '收入',PRIMARY KEY (`date`,`shop`,`hour`)ENGINE=InnoDB DEFAULT CHARSET=utf8    

        

MySQL自定义变量


1.如何观察每天某个时间点A,B两个店的分别的累计营业额?

按照上面所说的原理,如果每读出一条记录相当于游标往下走一下,我们在遍历数据的过程中用变量对中间结果进行记录和判断,那么就能实现上述需求,代码如下:

 
   
   
 
--初始化变量set @cosum:=0;set @dates:='';set @shop:='';
selectdate,shop,hour,income,
@group_income:=--判断是否是同一天的同一个商店case when @dates=a.date and @shop=a.shop--是一个则累加then @cosum:=@cosum+income--不是则将第一个小时的值赋值给累加量else @cosum:=a.incomeend as group_income,--保存当前用于判断的变量@dates:=a.date,@shop:=a.shopfrom(select * from wk_test order by date,shop,hour) a


结果如下:


2.用自定义变量实现row_number()over 开窗

mysq不支持开窗函数,但是引入自定义变量就能实现相同的效果,具体实现代码如下:

set @row_number:=0;set @dates:='';set @shop:='';
selectdate,shop,hour,income,@num:=case when @dates=a.date and @shop=a.shopthen @row_number:=@row_number+1else @row_number:=1end as group_income,
@dates:=a.date,@shop:=a.shopfrom(select * from wk_test order by date,shop,hour) a

结果如下:


04

后记

Mysql的自定义变量是一个不太常用的功能,因为大数据基本上是存储在hadoop上,操作一般用hive,spark或者impala,他们都自带一些开窗函数在一定程度上可以取代自定义变量。但是如果懂自定义变量有可能会解决一些不太好解决的问题。

以上是关于MySQL自定义变量的主要内容,如果未能解决你的问题,请参考以下文章

VSCode自定义代码片段(vue主模板)

VSCode自定义代码片段——声明函数

VSCode自定义代码片段——.vue文件的模板

VSCode自定义代码片段——git命令操作一个完整流程

VSCode自定义代码片段8——声明函数

VSCode自定义代码片段1——vue主模板