Spark 临时表未在直线中显示

Posted

技术标签:

【中文标题】Spark 临时表未在直线中显示【英文标题】:Spark temporary table is not shown in beeline 【发布时间】:2016-02-24 13:40:14 【问题描述】:

我在 AWS EMR 有一个 Spark 集群,并尝试使用 thrift-server 启动以下代码:

...
JavaSparkContext jsc = new JavaSparkContext(SparkContext.getOrCreate());
HiveContext hiveContext = new HiveContext(jsc);
JavaRDD<Person> people = jsc.textFile("people.txt").map(
  new Function<String, Person>() 
    public Person call(String line) throws Exception 
      ...
    
);
DataFrame schemaPeople = hiveContext.createDataFrame(people, Person.class);
schemaPeople.registerTempTable("people_temp");
schemaPeople.saveAsTable("people");

HiveThriftServer2.startWithContext(hiveContext);
...

我使用以下命令运行此代码: sudo ./sbin/start-thriftserver.sh --jars /home/ec2-user/some.jar --class spark.jobs.thrift.ThriftServerInit

thrift 服务器启动后,我使用直线连接到它: !connect jdbc:hive2://localhost:10001,运行 show tables; 并得到结果:

+--------------+--------------+--+
|  tableName   | isTemporary  |
+--------------+--------------+--+
| people       | false        |
+--------------+--------------+--+

我也希望看到一个临时表people_temp。为什么people_temp 不见了?

【问题讨论】:

【参考方案1】:

在最新的 Spark 1.6.* 上,我发现需要将配置标志显式设置为单个会话以使其与临时表一起使用:spark.sql.hive.thriftServer.singleSession=true 看看迁移指南 http://spark.apache.org/docs/latest/sql-programming-guide.html#upgrading-from-spark-sql-15-to-16 希望这会有所帮助

【讨论】:

以上是关于Spark 临时表未在直线中显示的主要内容,如果未能解决你的问题,请参考以下文章

无法从直线访问 Spark 2.0 临时表

UIAction 工作表未在 iPad 中单击条形按钮项目时关闭

对 Spark Thrift Server 的直线查询未在 Spark History UI 中显示任何内容

Spark:通过对临时表执行 sql 查询来创建临时表

由于语法错误表未在 DB 中创建

MySQL 集群表未在数据节点上复制