Spark无法读取hive 3.x的表数据

Posted ppw25

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Spark无法读取hive 3.x的表数据相关的知识,希望对你有一定的参考价值。

 

通过Ambari2.7.3安装HDP3.1.0成功之后,通过spark sql去查询hive表的数据发现竟然无法查询

 

HDP3.0 集成了hive 3.0和 spark 2.3,然而spark却读取不了hive表的数据,准确来说是内表的数据。

 

原因
hive 3.0之后默认开启ACID功能,而且新建的表默认是ACID表。而spark目前还不支持hive的ACID功能,因此无法读取ACID表的数据.
请看:https://issues.apache.org/jira/browse/SPARK-15348

 

解决办法
修改以下参数让新建的表默认不是acid表。

 

hive.strict.managed.tables=false 
hive.create.as.insert.only=false 
metastore.create.as.acid=false

 

 

 

以上是关于Spark无法读取hive 3.x的表数据的主要内容,如果未能解决你的问题,请参考以下文章

Spark SQL - Hive“无法覆盖表”解决方法

spark读取数据写入hive数据表

通过 Spark 加载的表在 Hive 中无法访问

hdp3.1 hive 3.0的使用记录

Spark上的Hive如何从jdbc读取数据?

Spark 整合hive 实现数据的读取输出