子查询中的子查询在配置单元中不起作用

Posted

技术标签:

【中文标题】子查询中的子查询在配置单元中不起作用【英文标题】:Subquery within Subquery is not working in hive 【发布时间】:2017-07-06 10:38:15 【问题描述】:

我有一个复杂的查询,我在这里给出它的简化版本。想知道为什么它不起作用。

select * from ((select 1) t1 union (select 2) t2);

得到以下错误

NoViableAltException(290@[147:5: ( ( Identifier LPAREN )=> partitionedTableFunction | tableSource | subQuerySource | virtualTableSource )])
at org.antlr.runtime.DFA.noViableAlt(DFA.java:158)
at org.antlr.runtime.DFA.predict(DFA.java:144)
at org.apache.hadoop.hive.ql.parse.HiveParser_FromClauseParser.fromSource(HiveParser_FromClauseParser.java:3654)
at org.apache.hadoop.hive.ql.parse.HiveParser_FromClauseParser.joinSource(HiveParser_FromClauseParser.java:1836)
at org.apache.hadoop.hive.ql.parse.HiveParser_FromClauseParser.fromClause(HiveParser_FromClauseParser.java:1488)
at org.apache.hadoop.hive.ql.parse.HiveParser.fromClause(HiveParser.java:44869)
at org.apache.hadoop.hive.ql.parse.HiveParser.singleSelectStatement(HiveParser.java:42035)
at org.apache.hadoop.hive.ql.parse.HiveParser.selectStatement(HiveParser.java:41720)
at org.apache.hadoop.hive.ql.parse.HiveParser.regularBody(HiveParser.java:41657)
at org.apache.hadoop.hive.ql.parse.HiveParser.queryStatementExpressionBody(HiveParser.java:40710)
at org.apache.hadoop.hive.ql.parse.HiveParser.queryStatementExpression(HiveParser.java:40586)
at org.apache.hadoop.hive.ql.parse.HiveParser.execStatement(HiveParser.java:1529)
at org.apache.hadoop.hive.ql.parse.HiveParser.statement(HiveParser.java:1065)
at org.apache.hadoop.hive.ql.parse.ParseDriver.parse(ParseDriver.java:201)
at org.apache.hadoop.hive.ql.parse.ParseDriver.parse(ParseDriver.java:166)
at org.apache.hadoop.hive.ql.Driver.compile(Driver.java:418)
at org.apache.hadoop.hive.ql.Driver.compile(Driver.java:312)
at org.apache.hadoop.hive.ql.Driver.compileInternal(Driver.java:1201)
at org.apache.hadoop.hive.ql.Driver.runInternal(Driver.java:1296)
at org.apache.hadoop.hive.ql.Driver.run(Driver.java:1127)
at org.apache.hadoop.hive.ql.Driver.run(Driver.java:1115)
at org.apache.hadoop.hive.cli.CliDriver.processLocalCmd(CliDriver.java:220)
at org.apache.hadoop.hive.cli.CliDriver.processCmd(CliDriver.java:172)
at org.apache.hadoop.hive.cli.CliDriver.processLine(CliDriver.java:383)
at org.apache.hadoop.hive.cli.CliDriver.executeDriver(CliDriver.java:775)
at org.apache.hadoop.hive.cli.CliDriver.run(CliDriver.java:693)
at org.apache.hadoop.hive.cli.CliDriver.main(CliDriver.java:628)
at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57)
at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
at java.lang.reflect.Method.invoke(Method.java:606)
at org.apache.hadoop.util.RunJar.run(RunJar.java:221)
at org.apache.hadoop.util.RunJar.main(RunJar.java:136)

失败:ParseException line 1:15 无法识别来自源的 '(' '(' 'select' in from source 附近的输入

【问题讨论】:

【参考方案1】:

1

与某些数据库不同,Hive 不接受围绕查询的括号。 例如。 select 1 是 hive 中的有效查询,但不是 (select 1)

附言 即使是接受括号括起来的查询的数据库,在通过 UNION 组合时也不接受这些查询的别名。 例如。 (select 1) union (select 2) 在某些数据库中是有效的查询,但不是 (select 1) t1 union (select 2) t2

2

与某些数据库不同,Hive 需要子查询的别名。 例如。 select * from (select 1) t 是 hive 中的有效查询,但不是 select * from (select 1)


编写 OP 查询的正确方法是 -select * from (select 1 union select 2) t;


+-----+
| _c0 |
+-----+
|   1 |
|   2 |
+-----+

【讨论】:

我试了一下,最后一个查询出现异常。请再次检查。 在 Hive 2.1 上测试(当我发布结果时,它始终是执行代码的复制粘贴)。我猜您对仅从 1.2.0 版本支持的 UNION 有疑问。试试 UNION ALL。 是的,做到了。我正在使用 1.1.0。我想union 不支持? 我已将版本信息添加到我之前的评论中 :-) 无论如何 - cwiki.apache.org/confluence/display/Hive/LanguageManual+Union

以上是关于子查询中的子查询在配置单元中不起作用的主要内容,如果未能解决你的问题,请参考以下文章

Update 语句中的子查询在 Snowflake 中不起作用

Oracle SQL - 多级相关子查询不起作用

使用子查询更新在雪花中不起作用

为同一个表编写子查询以访问不同的记录

试图从 2 个正在加入的子查询中获取一列并且分组不起作用

QueryDSL 子查询不起作用 - IllegalArgumentException:参数值与预期类型不匹配