关于Hive正则匹配中文字符串的问题
Posted lakerschampionship
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了关于Hive正则匹配中文字符串的问题相关的知识,希望对你有一定的参考价值。
首先,中文字符集为 ‘^[\4e00-\u9fa5]$‘
1.如果直接在Hive命令行中使用, 则直接使用 ‘^[\u4e00-\u9fa5]$’ 进行匹配
2.如果在终端调用,则需叫上转义符,如
hive -e "select ‘中国‘ rlike ‘^[\u4e00-\u9fa5]$’"
3.在scala和java中使用 同1;
val regex = new Regex("[\u4e00-\u9fa5]") val a = regex.findFirstMatchIn("中国") println(a)
以上是关于关于Hive正则匹配中文字符串的问题的主要内容,如果未能解决你的问题,请参考以下文章