IT常识
技术 Python PHP JavaScript IOS Android Java 数据库 资源 公众号 代码片段 github
  • IT常识
  • web服务器

大数据学习笔记:SparkSQL入门

Posted 2022-01-20 howard2005

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了大数据学习笔记:SparkSQL入门相关的知识,希望对你有一定的参考价值。

文章目录

  • 一、SparkSQL概述
    • (一)SparkSQL简史
    • (二)SparkSQL的特点
    • (三)SparkSQL执行流程
  • 二、使用SparkSQL
    • (一)创建DataFrame
      • 1、将rdd转换成df
        • 案例1、生成单列的数据帧
        • 案例2、生成多列的数据帧
      • 2、将txt文件转换为df
      • 3、将json文件转换为df
      • 4、将parquet文件转换df
      • 5、利用jdbc将关系型数据中的数据转换为df
    • (二)通过方法来使用DataFrame
      • 1、投影查询 - select()方法
      • 2、带条件的查询 - where()方法

以上是关于大数据学习笔记:SparkSQL入门的主要内容,如果未能解决你的问题,请参考以下文章

大数据学习:Spark SQL入门简介

大数据高级开发工程师——Spark学习笔记

入门大数据---SparkSQL联结操作

入门大数据---SparkSQL常用聚合函数

:SparkSQL快速入门

大数据Spark SQL 快速入门(第二集)

(c)2006-2024 SYSTEM All Rights Reserved IT常识