大数据离线计算路线图-Hadoop工程师,数据分析师

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了大数据离线计算路线图-Hadoop工程师,数据分析师相关的知识,希望对你有一定的参考价值。

针对Hadoop工程师和数据分析师所涉及到的工作环境和内容,涉及集群调度框架、Hadoop框架、Hive框架、Hbase框架的全面深入讲解,为了能轻松

参考技术A 针对Hadoop工程师和数据分析师所涉及到的工作环境和内容,涉及集群调度框架、Hadoop框架、Hive框架、Hbase框架的全面深入讲解,为了能轻松掌握相关知识,学习MapReduce开发的20个经典案例讲解以及部分Hadoop源代码的分析,借此深入学习内核原理。

方法/步骤

Zookeeper入门到精通视频教程

详细讲解Zookeeper的安装配置、命令使用、存储结构以及具体在开发中如何使用Zookeeper。

Hadoop(2.x)视频-从入门到实战视频教程

详细讲解Hadoop的背景发展过程,Hadoop是什么?Hadoop可以解决什么问题?Hadoop集群如何搭建?如何进行Hadoop框架上面的开发工作?Hadoop运行原理是什么?Hadoop HDFS框架结构怎么样的?HDFS运行原理是什么?MapReduce运行机理?HDFS shell操作、HDFS API操作、MapReduce案例剖析与API操作等进行了详尽的剖析讲解。

Hadoop案例实战课程-20个经典案例视频教程

轻松掌握MapReduce各种应用场景的开发手段和优化技巧,并能对MapReduce相关的所有源代码进行深入了解,全面掌握MapReduce的运行原理和机制,帮助快速提升MapReduce开发能力。

Hive从入门到实战

讲解Hive是什么,Hive的体系结构,Hive和Hadoop的关系,Hive的元数据存储、Hive的数据存储、Hive和RDBMS的区别,Hive命令行语法,Hive表创建、删除、更改,增加分区、删除分析、加载数据到指定分区讲解和案例操作,从文件加载到Hive表讲解和案例操作、从查询插入数据到Hive表讲解和案例操作,Array、Map、Struct操作案例讲解,查询语句操作,已经Hive UDF、UDTF、UDAF实战开发,Hive优化详解。

贵阳如何学习大数据?大数据学习路线安排

很多朋友不知道怎么入手学习大数据,今天科多大数据带你进入大数据的世界。

一、Hadoop入门,了解什么是hadoop

1Hadoop产生背景

2Hadoop在大数据、云计算中的位置和关系

3、国内外Hadoop应用案例介绍

4、国内Hadoop的就业情况分析及课程大纲介绍

5、分布式系统概述

6Hadoop生态圈以及各组成部分的简介

7Hadoop核心MapReduce例子说明

二、分布式文件系统HDFS,是数据库管理员的基础课程

1、分布式文件系统HDFS简介

2HDFS的系统组成介绍

3HDFS的组成部分详解

4、副本存放策略及路由规则

5NameNode Federation

6、命令行接口

7Java接口

8、客户端与HDFS的数据流讲解

9HDFS的可用性(HA

三、初级MapReduce,成为Hadoop开发人员的基础课程

1、如何理解mapreduce计算模型

2、剖析伪分布式下MapReduce作业的执行过程

3Yarn模型

4、序列化

5MapReduce的类型与格式

6MapReduce开发环境搭建

7MapReduce应用开发

8、更多示例讲解,熟悉MapReduce算法原理

四、高级MapReduce,高级Hadoop开发人员的关键课程

1、使用压缩分隔减少输入规模

2、利用Combiner减少中间数据

3、编写Partitioner优化负载均衡

4、如何自定义排序规则

5、如何自定义分组规则

6MapReduce优化

7、编程实战

五、Hadoop集群与管理,是数据库管理员的高级课程

1Hadoop集群的搭建

2Hadoop集群的监控

3Hadoop集群的管理

4、集群下运行MapReduce程序

六、ZooKeeper基础知识,构建分布式系统的基础框架

1ZooKeeper体现结构

2ZooKeeper集群的安装

3、操作ZooKeeper

七、Hbase基础知识,面向列的实时分布式数据库

1hbase定义

2HBaseRDBMS的对比

3、数据模型

4、系统架构

5HBase上的MapReduce

6、表的设计

八、HBase集群及其管理

1、集群的搭建过程讲解

2、集群的监控

3、集群的管理

九、HBase客户端

1HBase Shell以及演示

2Java客户端以及代码演示

十、Pig基础知识,进行Hadoop计算的另一种框架

1Pig概述

2、安装Pig

3、使用Pig完成手机流量统计业务

十一、Hive,使用SQL进行计算的Hadoop框架

1、数据仓库基础知识

2hive定义

3Hive体系结构简介

4Hive集群

5、客户端简介

6HiveQL定义

7HiveQLSQL的比较

8、数据类型

9、表与表分区概念

10、表的操作与CLI客户端演示

11、数据导入与CLI客户端演示

12、查询数据与CLI客户端演示

13、数据的连接与CLI客户端演示

14、用户自定义函数(UDF)的开发与演示

十二、SqoopHadooprdbms进行数据转换的框架

1、配置Sqoop

2、使用Sqoop把数据从MySQL导入到HDFS

3、使用Sqoop把数据从HDFS导出到mysql

十三、Storm

1Storm基础知识:包括Storm的基本概念和Storm应用

场景,体系结构与基本原理,StormHadoop的对比

2Storm集群搭建:详细讲述Storm集群的安装和安装时常见问题

3Storm组件介绍: spoutboltstream groupings

4Storm消息可靠性:消息失败的重发

5Hadoop 2.0Storm的整合:Storm on YARN

6Storm编程实战

 

现在还不清楚自己是否适合学习大数据的朋友点击以下链接或者扫描二维码,测试一下自己的智商是否适合学习大数据

http://www.101test.com/cand/index?paperId=UAWFKY


以上是关于大数据离线计算路线图-Hadoop工程师,数据分析师的主要内容,如果未能解决你的问题,请参考以下文章

好程序员大数据学习路线Hadoop学习干货分享

新手友好 | Hadoop-架构原理实时计算和离线计算

大数据技术流式计算与Storm

贵阳如何学习大数据?大数据学习路线安排

贵阳如何学习大数据?大数据学习路线安排

大数据演变轨迹