使用数据处理函数
Posted 霖行
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了使用数据处理函数相关的知识,希望对你有一定的参考价值。
使用数据处理函数
本章介绍什么是函数,mysql支持哪种函数,以及如何使用这些函数。
函数
与绝大多数计算机语言一样,SQL支持利用函数来处理数据。函数一般在数据上执行,它给数据的转换和处理提供了方便。
例如,去掉尾空格的RTrim()函数。
- 函数没有SQL的可移植性强 能运行在多个系统上的代码称为可移植的(portable)。相对来说,多数SQL语句是可移植的,在SQL实现间有差异时,这些差异通常容易处理。但函数的可移植性不强,每种主要的DBMS的实现都有其他实现不支持的函数。为了代码的可移植性,不赞成使用特殊实现的功能。如果使用函数,应保证做好代码注释,以便能确切地知道所编写SQL代码的含义。
使用函数
大多数SQL实现支持以下类型的函数:
- 处理文本串(如,删除或填充值,转换值为大小写)的文本函数。
- 在数值数据上进行算数操作(如,返回绝对值,进行代数运算)的数值函数。
- 处理日期和时间值并从这些值中提取特定成分(如,返回两个日期差,检查日期有效性等)的日期和时间函数。
- 返回DBMS正使用的特殊信息(如,返回用户登录信息,检查版本细节)的系统函数。
文本处理函数
上章(MySQL必知必会——第十章创建计算字段)中的RTrim()函数就是一个文本处理函数。我们再来看另一个Upper()函数:
mysql> SELECT vend_name, Upper(vend_name) AS vend_name_upcase
-> FROM vendors
-> ORDER BY vend_name;
+----------------+------------------+
| vend_name | vend_name_upcase |
+----------------+------------------+
| ACME | ACME |
| Anvils R Us | ANVILS R US |
| Furball Inc. | FURBALL INC. |
| Jet Set | JET SET |
| Jouets Et Ours | JOUETS ET OURS |
| LT Supplies | LT SUPPLIES |
+----------------+------------------+
6 rows in set (0.02 sec)
Upper()将文本转换为大写。
常用的文本处理函数:
函数 | 说明 |
---|---|
Left() | 返回串左边的字符 |
Length() | 返回串的长度 |
Locate() | 找出串的一个子串 |
Lower() | 将串转换为小写 |
LTrim() | 去掉串左边的空格 |
Right() | 返回串右边的字符 |
RTrim() | 去掉串右边的空格 |
Soundex() | 返回串的SOUNDEX值 |
SubString() | 返回子串的字符 |
Upper() | 将串转换为大写 |
SOUNDEX是一个将任何文本串转换为描述其语音表示的字母数字模式的算法。
例如,我们要找联系名为Y.Lie是顾客,但表中数据人为输入错误成Y.Lee的查询
直接查询:
mysql> SELECT cust_name, cust_contact
-> FROM customers
-> WHERE cust_contact = 'Y.Lie';
Empty set (0.01 sec)
很显然,并没有查到,我们来尝试使用Soundex()函数:
mysql> SELECT cust_name, cust_contact
-> FROM customers
-> WHERE Soundex(cust_contact) = Soundex('Y.Lie');
+-------------+--------------+
| cust_name | cust_contact |
+-------------+--------------+
| Coyote Inc. | Y Lee |
+-------------+--------------+
1 row in set (0.00 sec)
因为Y.Lie与Y Lee发音相似,所有我们成功的匹配到了数据。
日期和时间处理函数
日期和时间采用相应的数据类型和特殊的格式存储,以便能快速和有效地排序或过滤,并且节省物理存储空间。
一般应用程序不使用这种特殊格式,所以日期和时间处理函数在MySQL语言中具有重要作用。
常用的日期和时间处理函数:
函数 | 说明 |
---|---|
AddDate() | 增加一个日期(天、周等) |
AddTime() | 增加一个时间(时、分等) |
CurDate() | 返回当前日期 |
CurTime() | 返回当前时间 |
Date() | 返回日期时间的日期部分 |
DateDiff() | 计算两个日期差 |
Date_Add() | 高度灵活的日期运算函数 |
Date_Format() | 返回格式化的日期或时间串 |
Day() | 返回日期的天数部分 |
DayOfWeek() | 对于日期,返回对应的星期几 |
Hour() | 返回时间的小时部分 |
Minute() | 返回时间的分钟部分 |
Month() | 返回日期的月份部分 |
Now() | 返回当前日期和时间 |
Second() | 返回时间的秒部分 |
Time() | 返回日期时间的时间部分 |
Year() | 返回日期的年份部分 |
MySQL使用的日期格式,不论是插入或更新还是用WHERE子句进行过滤,格式都必须为yyyy-mm-dd。例如,2022年1月20日,格式为2022-01-20。可能有其他的格式,但yyyy-mm-dd排除了多义性,应该首选这个格式。
- 应该总是使用4位数字的年份 MySQL支持两位数字的年份,将00-69处理为2000-2069,将70-99处理为1970-1999。但为了避免多义性,不使用该方式。
基本日期比较:
mysql> SELECT cust_id, order_num
-> FROM orders
-> WHERE order_date = '2005-09-01';
+---------+-----------+
| cust_id | order_num |
+---------+-----------+
| 10001 | 20005 |
+---------+-----------+
1 row in set (0.01 sec)
此SELECT语句正常运行。它检索出一个order_date为2005-09-01的订单记录。
但使用WHERE order_date = '2005-09-01’并不可靠,order_date的数据类型为datetime,这种类型存储日期和时间值。样例中的时间值全部为00:00:00,但现实中不总是。如果order_date的时间值不为00:00:00,那WHERE order_date = '2005-09-01’将匹配失败。
我们可以使用Date()函数将日期值取出进行对比:
mysql> SELECT cust_id, order_num
-> FROM orders
-> WHERE Date(order_date) = '2005-09-01';
+---------+-----------+
| cust_id | order_num |
+---------+-----------+
| 10001 | 20005 |
+---------+-----------+
1 row in set (0.00 sec)
这种日期比较更为可靠。除等值操作符外,其他操作符(MySQL必知必会——第六章过滤数据)也可以用于日期时间类。
- 如果需要的是日期,请使用Date() 如果仅想要日期,使用Date()是一个良好的习惯。如果想要时间,则使用Time()。
检索2005年9月的所有订单:
mysql> SELECT cust_id, order_num
-> FROM orders
-> WHERE Date(order_date) BETWEEN '2005-09-01' AND '2005-09-30';
+---------+-----------+
| cust_id | order_num |
+---------+-----------+
| 10001 | 20005 |
| 10003 | 20006 |
| 10004 | 20007 |
+---------+-----------+
3 rows in set (0.00 sec)
BETWEEN操作符把2005-09-01和2005-09-30定义为一个要匹配的范围值。
还有一种不需要记住每月有多少天或不用操心闰年2月的办法:
mysql> SELECT cust_id, order_num
-> FROM orders
-> WHERE Year(order_date) = 2005 AND Month(order_date) = 9;
+---------+-----------+
| cust_id | order_num |
+---------+-----------+
| 10001 | 20005 |
| 10003 | 20006 |
| 10004 | 20007 |
+---------+-----------+
3 rows in set (0.00 sec)
Year()从日期中返回年份,Month()从日期中返回月份。
数值处理函数
数值处理函数仅处理数值数据。这些函数一般主要用于代数、三角或几何运算,因此使用频率不是很高。
讽刺的是,在主要的DBMS的函数中,数值函数是最一致最统一的函数。
常用的数值处理函数:
函数 | 说明 |
---|---|
Abs() | 返回一个数的绝对值 |
Cos() | 返回一个角度的余弦 |
Exp() | 返回一个数的指数值 |
Mod() | 返回除操作的余数 |
Pi() | 返回圆周率 |
Rand() | 返回随机数 |
Sin() | 返回一个角度的正弦 |
Sqrt() | 返回一个数的平方根 |
Tan() | 返回一个角度的正切 |
以上是关于使用数据处理函数的主要内容,如果未能解决你的问题,请参考以下文章
pandas使用max函数和min函数计算dataframe日期(时间)数据列中最大日期和最小日期对应的数据行(maximum and minimum date or time row)
R语言用户自定义函数的语法结构编写自定义统计值计算函数(使用ifelse结构计算均值和标准差等)编写自定义日期格式化(format)函数(switch函数使用不同分枝格式化日期数据)应用自定函数
pandas使用max函数和min函数计算dataframe日期(时间)数据列中最大日期和最小日期(maximum and minimum date or time in dataframe)