使用 Java 的 Spark 和 Spark SQL 新手

Posted

技术标签:

【中文标题】使用 Java 的 Spark 和 Spark SQL 新手【英文标题】:New to Spark and Spark SQL with Java 【发布时间】:2017-08-10 22:41:43 【问题描述】:

我是 Spark 和 Spark SQL 的新手,但了解 Java 和 SQL。

如何专门使用 Spark SQL 将一组 Oracle 存储过程转换为使用 Spark SQL 的 Spark。请举例。

【问题讨论】:

【参考方案1】:

以下代码是 Spark SQL 示例;你能问我吗

import org.apache.spark.sql.Dataset;
import org.apache.spark.sql.Row;
import org.apache.spark.sql.SparkSession;

public class SparkSQL 

    public static void main(String[] args) 
        SparkSession sparkSession = SparkSession.builder().master("local").getOrCreate();
        Dataset<Row> peopleDS = sparkSession.read().json("C:\\people.json");
        peopleDS.createOrReplaceTempView("people");

        Dataset<Row> sql = sparkSession.sql("select city,avg(age) from people group by city");

        sql.show();



    


【讨论】:

以上是关于使用 Java 的 Spark 和 Spark SQL 新手的主要内容,如果未能解决你的问题,请参考以下文章

Spark中使用Java编程的常用方法

Jerry's spark demo application

org.apache.spark.sql.AnalysisException:无法解析“S.SID”

Spark算法实例:词频统计

使用 Java 类的 Spark Scala 数据集

使用 Java 的 Spark 和 Spark SQL 新手