01初识spark

Posted 一条coding

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了01初识spark相关的知识,希望对你有一定的参考价值。

大家好,我是一条~

5小时推开Spark的大门,正式开始,第一个小时,我们主要学习以下内容:

  • 什么是Spark?
  • Spark和Hadoop什么关系?
  • Spark有什么优点?
  • Spark适合做什么?
  • Spark的核心模块
  • Spark的系统架构

一条会用简单通俗的语言帮大家理解spark的一些核心概念,以便于后面的应用。

什么是spark?

我们先开看看官网怎么说。

What is Apache Spark ?

什么是 Apache Spark ?

Apache Spark is a multi-language engine for executing data engineering, data science, and machine learning on single-node machines or clusters.

Apache Spark是一种多语言引擎,用于在单节点机器或集群上执行数据工程、数据科学和机器学习。

简单来说,Spark是一种大数据计算框架,是一种基于内存快速处理计算大数据的引擎。支持多种语言的API接口,可以单击也可以集群部署,其又提供了用于数据分析,机器学习的库。

以上是关于01初识spark的主要内容,如果未能解决你的问题,请参考以下文章

Spark 初识(01)

初识Spark程序

Spark 初识

根据 Spark 中的小时数拆分时间戳间隔

5小时推开spark的大门,打卡有奖

1小时看懂Spark的基本原理