hive中 regexp_replace的用法,替换特殊字符问题

Posted woshimrf

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了hive中 regexp_replace的用法,替换特殊字符问题相关的知识,希望对你有一定的参考价值。

数据仓库中有的字段不合格,有特殊字符,比如换行符。

poi_name

19013

12013

怎么把换行符替换掉呢?

https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF#LanguageManualUDF-StringOperators

regexp_replace(string INITIAL_STRING, string PATTERN, string REPLACEMENT)

Returns the string resulting from replacing all substrings in INITIAL_STRING that match the java regular expression syntax defined in PATTERN with instances of REPLACEMENT. For example, regexp_replace("foobar", "oo|ar", "") returns ‘fb.‘ Note that some care is necessary in using predefined character classes: using ‘s‘ as the second argument will match the letter s; ‘s‘ is necessary to match whitespace, etc.

官网说用两个反斜杠代替一个,即一个反斜杠用来转义。

实践了一下,不行,得4个

````
select regexp_replace(poi_name,‘\n‘,‘‘)

poi_name
19013
12013
```

以上是关于hive中 regexp_replace的用法,替换特殊字符问题的主要内容,如果未能解决你的问题,请参考以下文章

hive函数REGEXP_REPLACE用法

hive函数REGEXP_REPLACE用法

hive函数REGEXP_REPLACE用法

如何在 Hive 中使用 regexp_replace() 一次删除多个字符?

Hive SQL 查询中 Regexp_replace 的奇怪行为

Hive:regexp_replace 方括号