HiveSql--基本运算符实战及注意点总结

Posted 扫地增

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了HiveSql--基本运算符实战及注意点总结相关的知识,希望对你有一定的参考价值。

Hive中的运算符主要分为关系运算,数学运算,逻辑运算。

关系运算

1、等值比较: =

  • 语法: A=B
  • 操作类型: 所有基本类型
  • 描述: 如果表达式A与表达式B相等,则为TRUE;否则为FALSE
select 1 
from test.student_score 
where 1=1;

2、不等值比较: <>

  • 语法: A <> B**
  • 操作类型: 所有基本类型
  • 描述:
    如果表达式ANULL,或者表达式BNULL,返回NULL
    如果表达式A与表达式B不相等,则为TRUE;否则为FALSE
select 1 
from test.student_score  
where 1 <> 2;

3、小于比较: <

语法: A < B
操作类型: 所有基本类型
描述:
如果表达式ANULL,或者表达式BNULL,返回NULL
如果表达式A小于表达式B,则为TRUE;否则为FALSE

 select 1 
 from test.student_score 
 where 1 < 2;

4、小于等于比较: <=

语法: A <= B
操作类型: 所有基本类型
描述:
如果表达式ANULL,或者表达式BNULL,返回NULL
如果表达式A小于或者等于表达式B,则为TRUE;否则为FALSE

 select 1 
 from test.student_score  
 where 1 < = 1;

5、大于比较: >

语法: A > B
操作类型: 所有基本类型
描述:
如果表达式ANULL,或者表达式BNULL,返回NULL
如果表达式A大于表达式B,则为TRUE;否则为FALSE

select 1 
from test.student_score 
where 2 > 1;

6、大于等于比较: >=

语法: A >= B
操作类型: 所有基本类型
描述:
如果表达式ANULL,或者表达式BNULL,返回NULL
如果表达式A大于或者等于表达式B,则为TRUE;否则为FALSE

select 1
from test.student_score 
where 1 >= 1;

注意:String的比较要注意(常用的时间比较可以先to_date 之后再比较)

select * 
from test.student_score ;

2011111209 00:00:00     2011111209

select a, b, a<b, a>b, a=b 
from test.student_score ;

2011111209 00:00:00     2011111209      false   true    false

7、空值判断: IS NULL

语法: A IS NULL
操作类型: 所有类型
描述:
如果表达式A的值为NULL,则为TRUE;否则为FALSE

select 1 
from test.student_score 
where null is null;

8、非空判断: IS NOT NULL

语法: A IS NOT NULL
操作类型: 所有类型
描述:
如果表达式A的值为NULL,则为FALSE;否则为TRUE

select 1 
from test.student_score  
where 1 is not null;

9、LIKE比较: LIKE

语法: A LIKE B
操作类型: string
描述:
如果字符串A或者字符串BNULL,则返回NULL
如果字符串A符合表达式B的正则语法,则为TRUE;否则为FALSEB中字符”_”表示任意单个字符,而字符”%”表示任意数量的字符

select 1 
from test.student_score  
where 'football' like 'foot%';

select 1 
from test.student_score  
where 'football' like 'foot____';

--注意:否定比较时候用NOT A LIKE B
select 1 
from test.student_score  
where NOT 'football' like 'fff%';

10、JAVA的LIKE操作: RLIKE

语法: A RLIKE B
操作类型: string
描述:
如果字符串A或者字符串BNULL,则返回NULL
如果字符串A符合JAVA正则表达式B的正则语法,则为TRUE;否则为FALSE

select 1 
from test.student_score  
where 'footbar' rlike '^f.*r$';

--注意:判断一个字符串是否全为数字:
select 1 
from test.student_score  
where '123456' rlike '^\\\\d+$';

select 1 
from test.student_score  
where '123456aa' rlike '^\\\\d+$';

11、REGEXP操作: REGEXP

语法: A REGEXP B
操作类型: string
描述: 功能与RLIKE相同

select 1 
from test.student_score 
where 'footbar' REGEXP '^f.*r$';

数学运算:

1、加法操作: +

语法: A + B
操作类型:所有数值类型
说明:
返回AB相加的结果。
结果的数值类型等于A的类型和B的类型的最小父类型(详见数据类型的继承关系)。比如,int + int 一般结果为int类型,而 int + double一般结果为double类型。

 select 1 + 9 
 from test.student_score ;

create table test.student_score  as 
select 1 + 1.2 
from test.student_score ;

describe test.student_score ;
_c0     double

2、减法操作: -

语法: A – B
操作类型: 所有数值类型
说明:
返回AB相减的结果。结果的数值类型等于A的类型和B的类型的最小父类型(详见数据类型的继承关系)。比如,int – int
一般结果为int类型,而 int – double 一般结果为double类型

select 105 
from test.student_score;

create table test.student_score as 
select 5.64 
from test.student_score;

describe test.student_score;
_c0     double

3、乘法操作: *

语法: A * B
操作类型: 所有数值类型
说明:
返回AB相乘的结果。结果的数值类型等于A的类型和B的类型的最小父类型(详见数据类型的继承关系)。注意,如果A乘以B的结果超过默认结果类型的数值范围,则需要通过cast将结果转换成范围更大的数值类型

select 40 * 5 
from test.student_score ;

4、除法操作: /

语法: A / B
操作类型: 所有数值类型
说明:
返回A除以B的结果。结果的数值类型为double

select 40 / 5 
from test.student_score ;

注意:hive中最高精度的数据类型是double,只精确到小数点后16位,在做除法运算的时候要特别注意

select ceil(28.0/6.999999999999999999999) 
from test.student_score  
limit 1;    

select ceil(28.0/6.99999999999999) 
from test.student_score  
limit 1;           

5、取余操作: %

语法: A % B
操作类型: 所有数值类型
说明:
返回A除以B的余数。
结果的数值类型等于A的类型和B的类型的最小父类型(详见数据类型的继承关系)。

select 41 % 5 
from test.student_score ;

select 8.4 % 4 
from test.student_score ;

--注意:精度在hive中是个很大的问题,类似这样的操作最好通过round指定精度
select round(8.4 % 4 , 2) 
from test.student_score ;

6、位与操作: &

语法: A & B
操作类型:所有数值类型
说明:
返回AB按位进行与操作的结果。
结果的数值类型等于A的类型和B的类型的最小父类型(详见数据类型的继承关系)。

select 4 & 8 
from test.student_score ;

select 6 & 4 
from test.student_score ;

7、位或操作: |

语法: A | B
操作类型: 所有数值类型
说明:
返回AB按位进行或操作的结果。
结果的数值类型等于A的类型和B的类型的最小父类型(详见数据类型的继承关系)。

select 4 | 8 
from test.student_score ;

select 6 | 8 
from test.student_score ;

8、位异或操作: ^

语法: A ^ B
操作类型: 所有数值类型
说明:
返回AB按位进行异或操作的结果。
结果的数值类型等于A的类型和B的类型的最小父类型(详见数据类型的继承关系)。

select 4 ^ 8 
from test.student_score ;

select 6 ^ 4 
from test.student_score ;

9.位取反操作: ~

语法: ~A
操作类型: 所有数值类型
说明:
返回A按位取反操作的结果。结果的数值类型等于A的类型。

select ~6 
from test.student_score ;

select ~4 
from test.student_score ;

逻辑运算:

1、逻辑与操作: AND

语法: A AND B
操作类型:boolean
说明:
如果AB均为TRUE,则为TRUE;否则为FALSE
如果ANULLBNULL,则为NULL

select 1 
from test.student_score 
where 1=1 
and 2=2;

2、逻辑或操作: OR

语法: A OR B
操作类型:boolean
说明:
如果ATRUE,或者BTRUE,或者AB均为TRUE,则为TRUE;否则为FALSE

select 1 
from iteblog 
where 1=2 
or 2=2;

3、逻辑非操作: NOT

语法: NOT A
操作类型: boolean
说明: 如果AFALSE,或者ANULL,则为TRUE;否则为FALSE

select 1 
from iteblog 
where not 1=2;

以上是关于HiveSql--基本运算符实战及注意点总结的主要内容,如果未能解决你的问题,请参考以下文章

一文速学-HiveSQL解析JSON数据详解+代码实战

HiveSql&SparkSql —— 自定义UDFUDAFUDTF函数实战总结

Hive3 - HiveSQL 特征及操作

Hive3 - HiveSQL 特征及操作

spi总线注意事项和linux下使用实战

BIM入门实战Revit 2018模型设计阶段重点及注意事项总结