Hive中split函数分隔符为分号时报错问题

Posted 冷漠;

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hive中split函数分隔符为分号时报错问题相关的知识,希望对你有一定的参考价值。

问题

今天写 SQL 的时候遇到一个问题,就是使用 split() 函数时,分隔符用 ; 就会报错,语句如下:

select split(str, ';');

报错如下:

Error while compiling statement: FAILED: ParseException line 1:17 cannot recognize input near '<EOF>' '<EOF>' '<EOF>' in select expression

一开始以为是转义字符的问题,但是无论是使用 '\\;',还是 '\\\\;',或者将单引号 '' 换为双引号 "",都是不行的,然后上网查了一些资料,说 Hive 解析语句的时候,只要遇到分号就认为语句结束,无论是否用引号包含起来,还是是否使用转义字符,其对分号的识别是没有那么智能,都会将语句识别为 select split(str, ';,这样就导致 SQL 不完整了,所以才会报错。

解决方法

解决的办法是,使用分号的八进制的 ASCII 码(分号十进制的 ASCII 码为 59)进行转义,那么上述语句应写成:

select split(str, '\\073');

如 CREATE TABLE 中需要定义分隔符,那么对不可见字符做分隔符就需要用八进制的 ASCII 码来转义。

以上是关于Hive中split函数分隔符为分号时报错问题的主要内容,如果未能解决你的问题,请参考以下文章

hive中对带分号的字符串做split分割

hive sql split 分隔符

hive split 如何取最后一个分隔符

Hive 分隔符使用:

hive udaf 用maven打包运行create temporary function 时报错

启动Hive时报错