使用数据处理函数

Posted 霖行

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了使用数据处理函数相关的知识,希望对你有一定的参考价值。

使用数据处理函数

本章介绍什么是函数,mysql支持哪种函数,以及如何使用这些函数。

函数

与绝大多数计算机语言一样,SQL支持利用函数来处理数据。函数一般在数据上执行,它给数据的转换和处理提供了方便。

例如,去掉尾空格的RTrim()函数。

  • 函数没有SQL的可移植性强 能运行在多个系统上的代码称为可移植的(portable)。相对来说,多数SQL语句是可移植的,在SQL实现间有差异时,这些差异通常容易处理。但函数的可移植性不强,每种主要的DBMS的实现都有其他实现不支持的函数。为了代码的可移植性,不赞成使用特殊实现的功能。如果使用函数,应保证做好代码注释,以便能确切地知道所编写SQL代码的含义。

使用函数

大多数SQL实现支持以下类型的函数:

  • 处理文本串(如,删除或填充值,转换值为大小写)的文本函数
  • 在数值数据上进行算数操作(如,返回绝对值,进行代数运算)的数值函数
  • 处理日期和时间值并从这些值中提取特定成分(如,返回两个日期差,检查日期有效性等)的日期和时间函数
  • 返回DBMS正使用的特殊信息(如,返回用户登录信息,检查版本细节)的系统函数。

文本处理函数

上章(MySQL必知必会——第十章创建计算字段)中的RTrim()函数就是一个文本处理函数。我们再来看另一个Upper()函数:

mysql> SELECT vend_name, Upper(vend_name) AS vend_name_upcase
    -> FROM vendors
    -> ORDER BY vend_name;
+----------------+------------------+
| vend_name      | vend_name_upcase |
+----------------+------------------+
| ACME           | ACME             |
| Anvils R Us    | ANVILS R US      |
| Furball Inc.   | FURBALL INC.     |
| Jet Set        | JET SET          |
| Jouets Et Ours | JOUETS ET OURS   |
| LT Supplies    | LT SUPPLIES      |
+----------------+------------------+
6 rows in set (0.02 sec)

Upper()将文本转换为大写。

常用的文本处理函数:

函数说明
Left()返回串左边的字符
Length()返回串的长度
Locate()找出串的一个子串
Lower()将串转换为小写
LTrim()去掉串左边的空格
Right()返回串右边的字符
RTrim()去掉串右边的空格
Soundex()返回串的SOUNDEX值
SubString()返回子串的字符
Upper()将串转换为大写

SOUNDEX是一个将任何文本串转换为描述其语音表示的字母数字模式的算法。
例如,我们要找联系名为Y.Lie是顾客,但表中数据人为输入错误成Y.Lee的查询
直接查询:

mysql> SELECT cust_name, cust_contact
    -> FROM customers
    -> WHERE cust_contact = 'Y.Lie';
Empty set (0.01 sec)

很显然,并没有查到,我们来尝试使用Soundex()函数:

mysql> SELECT cust_name, cust_contact
    -> FROM customers
    -> WHERE Soundex(cust_contact) = Soundex('Y.Lie');
+-------------+--------------+
| cust_name   | cust_contact |
+-------------+--------------+
| Coyote Inc. | Y Lee        |
+-------------+--------------+
1 row in set (0.00 sec)

因为Y.Lie与Y Lee发音相似,所有我们成功的匹配到了数据。

日期和时间处理函数

日期和时间采用相应的数据类型和特殊的格式存储,以便能快速和有效地排序或过滤,并且节省物理存储空间。

一般应用程序不使用这种特殊格式,所以日期和时间处理函数在MySQL语言中具有重要作用。

常用的日期和时间处理函数:

函数说明
AddDate()增加一个日期(天、周等)
AddTime()增加一个时间(时、分等)
CurDate()返回当前日期
CurTime()返回当前时间
Date()返回日期时间的日期部分
DateDiff()计算两个日期差
Date_Add()高度灵活的日期运算函数
Date_Format()返回格式化的日期或时间串
Day()返回日期的天数部分
DayOfWeek()对于日期,返回对应的星期几
Hour()返回时间的小时部分
Minute()返回时间的分钟部分
Month()返回日期的月份部分
Now()返回当前日期和时间
Second()返回时间的秒部分
Time()返回日期时间的时间部分
Year()返回日期的年份部分

MySQL使用的日期格式,不论是插入或更新还是用WHERE子句进行过滤,格式都必须为yyyy-mm-dd。例如,2022年1月20日,格式为2022-01-20。可能有其他的格式,但yyyy-mm-dd排除了多义性,应该首选这个格式。

  • 应该总是使用4位数字的年份 MySQL支持两位数字的年份,将00-69处理为2000-2069,将70-99处理为1970-1999。但为了避免多义性,不使用该方式。

基本日期比较:

mysql> SELECT cust_id, order_num
    -> FROM orders
    -> WHERE order_date = '2005-09-01';
+---------+-----------+
| cust_id | order_num |
+---------+-----------+
|   10001 |     20005 |
+---------+-----------+
1 row in set (0.01 sec)

此SELECT语句正常运行。它检索出一个order_date为2005-09-01的订单记录。

但使用WHERE order_date = '2005-09-01’并不可靠,order_date的数据类型为datetime,这种类型存储日期和时间值。样例中的时间值全部为00:00:00,但现实中不总是。如果order_date的时间值不为00:00:00,那WHERE order_date = '2005-09-01’将匹配失败。
我们可以使用Date()函数将日期值取出进行对比:

mysql> SELECT cust_id, order_num
    -> FROM orders
    -> WHERE Date(order_date) = '2005-09-01';
+---------+-----------+
| cust_id | order_num |
+---------+-----------+
|   10001 |     20005 |
+---------+-----------+
1 row in set (0.00 sec)

这种日期比较更为可靠。除等值操作符外,其他操作符(MySQL必知必会——第六章过滤数据)也可以用于日期时间类。

  • 如果需要的是日期,请使用Date() 如果仅想要日期,使用Date()是一个良好的习惯。如果想要时间,则使用Time()。

检索2005年9月的所有订单:

mysql> SELECT cust_id, order_num
    -> FROM orders
    -> WHERE Date(order_date) BETWEEN '2005-09-01' AND '2005-09-30';
+---------+-----------+
| cust_id | order_num |
+---------+-----------+
|   10001 |     20005 |
|   10003 |     20006 |
|   10004 |     20007 |
+---------+-----------+
3 rows in set (0.00 sec)

BETWEEN操作符把2005-09-01和2005-09-30定义为一个要匹配的范围值。

还有一种不需要记住每月有多少天或不用操心闰年2月的办法:

mysql> SELECT cust_id, order_num
    -> FROM orders
    -> WHERE Year(order_date) = 2005 AND Month(order_date) = 9;
+---------+-----------+
| cust_id | order_num |
+---------+-----------+
|   10001 |     20005 |
|   10003 |     20006 |
|   10004 |     20007 |
+---------+-----------+
3 rows in set (0.00 sec)

Year()从日期中返回年份,Month()从日期中返回月份。

数值处理函数

数值处理函数仅处理数值数据。这些函数一般主要用于代数、三角或几何运算,因此使用频率不是很高。

讽刺的是,在主要的DBMS的函数中,数值函数是最一致最统一的函数。

常用的数值处理函数:

函数说明
Abs()返回一个数的绝对值
Cos()返回一个角度的余弦
Exp()返回一个数的指数值
Mod()返回除操作的余数
Pi()返回圆周率
Rand()返回随机数
Sin()返回一个角度的正弦
Sqrt()返回一个数的平方根
Tan()返回一个角度的正切

以上是关于使用数据处理函数的主要内容,如果未能解决你的问题,请参考以下文章

pandas使用max函数和min函数计算dataframe日期(时间)数据列中最大日期和最小日期对应的数据行(maximum and minimum date or time row)

R语言用户自定义函数的语法结构编写自定义统计值计算函数(使用ifelse结构计算均值和标准差等)编写自定义日期格式化(format)函数(switch函数使用不同分枝格式化日期数据)应用自定函数

pandas使用max函数和min函数计算dataframe日期(时间)数据列中最大日期和最小日期(maximum and minimum date or time in dataframe)

ABAP - 日期格式转换 & ABAP经常使用日期处理函数

DQL---条件查询单行函数多行函数分组函数数据类型

PLSQL中SQL语句怎样转换日期型函数为字符型?