关于Hive正则匹配中文字符串的问题

Posted lakerschampionship

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了关于Hive正则匹配中文字符串的问题相关的知识,希望对你有一定的参考价值。

首先,中文字符集为 ‘^[\4e00-\u9fa5]$‘

1.如果直接在Hive命令行中使用, 则直接使用 ‘^[\u4e00-\u9fa5]$’ 进行匹配

 

2.如果在终端调用,则需叫上转义符,如

hive -e "select ‘中国‘  rlike ‘^[\u4e00-\u9fa5]$’"

 

3.在scala和java中使用 同1;

val regex = new Regex("[\u4e00-\u9fa5]")
val a = regex.findFirstMatchIn("中国")
println(a)

 

以上是关于关于Hive正则匹配中文字符串的问题的主要内容,如果未能解决你的问题,请参考以下文章

Hive正则表达式

循环通过 python 正则表达式匹配

hive正则表达式

hive正则表达式

Hive正则表达式

hive 实现类似 contain 包含查询