快学Spark 2.0(新特性含真实项目纯Scala语言开发CDH5.7)

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了快学Spark 2.0(新特性含真实项目纯Scala语言开发CDH5.7)相关的知识,希望对你有一定的参考价值。

快学Spark 2.0(新特性、含真实项目、纯Scala语言开发、CDH5.7)


分享下载地址——https://pan.baidu.com/s/1jHVvIAi 密码: sirk


本课程从基础开始,紧抓重点、言简意赅、深入浅出的讲解Spark 2.0,旨在学员能快速上手并灵活掌握。
课程以实操为主,提供完整详细的源码,供学员学习或应用到项目中。


课程的课件也很详细,在学员不方便看视频的时候直接看课件并结合源码,同样可以达到很好的学习效果,并能大幅节省学习时间。


课程中编程语言采用当前较有前景的Scala,Hadoop采用Cloudera Hadoop的5.7.1版本,Kafka的0.10版本.
课程中对RDD操作、SQL、Streaming开发有非常深入系统的讲解,且围绕企业需求场景逐级展开和深化。
课程里不涉及当今企业里还比较少用的数据挖掘算法包MLlib和图计算模块部分。



01 Spark架构体系,应用场景
02 Spark 2.0新特性一览
03 把Spark-examples导入到IntelliJ IDEA
04 Cloudera Manager安装
05 CDH5.7.1 集群安装
06 CDH5.7.1 集群安装-续
07 Spark 2.0集群部署和测试
08 RDD详解和创建RDD方式
09 RDD操作之Transform
10 RDD的Action操作和持久化persist()
11 Pair RDD操作
12 Pair RDD常用函数详解
13.Join和cogroup
14 添加Hive服务及设置mysql元数据库
15 [项目案例]网站流量UV和PV的统计
16 [项目案例]会话二跳率的统计
17 Spark Sql基础练习
18 SparkSesion语法练习
19 [项目案例]使用SparkSesion进行流量分析
20 [项目案例]SparkSesion操作Hive
21 Idea里打包部署,作业结果验证
22 Spark Cli命令spark-sql的使用
23 spark-sql支持传参数的封装
24 spark-sql支持传参数的封装-续
25 UDF开发和运用
26 Spark读写Json、parquet文件
27 优化篇-控制数据分区和分布
28 Spark Streaming架构和概念
29 DStream的两种类型,API介绍
30 Kafka架构体系和概念
31 Kafka集群搭建和测试
32 Streaming读Kafka开发WordCount案例
33 使用updateStateByKey完善案例
34 按天计算地区销售额
35 时间窗口
36 去重类计算案例,以计算UV为例
37 [流计算项目]需求说明和架构设计
38 [流计算项目]HBase DAO类开发和测试
39 [流计算项目]Spark和Servlet代码详解
40 [流计算项目]Highcharts代码详解,项目运行


以上是关于快学Spark 2.0(新特性含真实项目纯Scala语言开发CDH5.7)的主要内容,如果未能解决你的问题,请参考以下文章

分享两套csdn下载的Spark企业级项目实战,源码深度剖析视频教程

Spark原理 V3.0 新特性

Spark的RDD原理以及2.0特性的介绍

一篇文章看懂spark 1.3+各版本特性

Spring boot 2.0 新特性之动态 Banner

Kafka 2.0重磅发布,新特性独家解读