培训Hadoop大数据最佳实践研修班(广州)

Posted PPV课数据科学社区

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了培训Hadoop大数据最佳实践研修班(广州)相关的知识,希望对你有一定的参考价值。


一、培训课程简介

课程名称:Hadoop大数据分析最佳实践研修班

培训天数:3

培训费用:1880/人     

培训时间:2016年6月4-5日,6月18日

培训地点:广州


需要了解大数据,或者需要熟知大数据管理、维护、开发和数据分析的人

学员基础无需具备Hadoop基础和经验,只需要基本的数据库基础

培训资料:培训讲义

培训方式:全程上机练习,理论与案例相结合,资深顾问授课及辅导,小班授课保证质量



二、培训目标:

熟悉Hadoop分布式文件系统

懂得hdfs分布式文件系统的使用

了解MapReduce工作原理

熟知Hadoop集群硬件配置规划

懂得Hadoop集群配置及优化

学会如何维护和监测Hadoop集群

学会怎么使用Sqoop连接关系数据库进行数据导入导出

了解Hive数据仓库的开发和应用

Hue的web页面的数据库开发

精通Hbase列式数据库的开发

掌握大数据挖掘分析基础

了解数据挖掘常见的几种工具和对比

了解几种常用的挖掘算法原理

了解大公司对大数据的应用场景和未来方向



三、讲师介绍

陈老师:九年相关项目经历,长期从事大数据相关的工作,精通大数据技术,熟悉关系型数据库oracle10G\mysql等;精通Hbase、HDFS、Hive、Pig等开源技术,对实时处理Storm、Impala有较深的认识,熟悉分布式计算MapReduce。非常精通数据挖掘算法和解决方案,比如决策树、K-means、预测分析、Logistc线性回归、Apriori算法应用熟悉电信、移动、电力、证券、网络、物流等业务。


四、培训大纲:

 

第一天:

第一部分:如何构建分布式数据仓库平台

1.怎么样才算是真正意义的大数据平台

2.开源Hadoop生态系统的介绍

3.数据采集过程与分布式存储

1)ETL原理

2)Sqoop

3)HDFS

4.数据仓库与数据分析介绍

1)MapReduce

2)Hive

3)Pig

4)HBase

5)Impala

5.集群监控与调度组件

1)Hadoop集群权限管理

2)Hbase列数据库监控

3)Hive集群监控

4)Oozie介绍

6.Hue介绍和例子讲解

7.日志收集工具

1)flume

2)kafka

8.练习

9.案例讲解

1)运营商全国用户上网记录案例介绍

2)IBM网上舆情分析


第二天:

第二部分:大数据平台部署及案例

1.我们应该选哪种Hadoop

1)选哪个版本?为什么?

2)优点和缺点

2.集群硬件应该如何选配?

1)网络拓扑

2)内存

3)硬盘

4)CPU

5)价格

3.部署案例讲解

1)英特尔Hadoop发行版详解

2)某省级通信运营商清帐单查询系统介绍


第三部分:Hbase列数据库及应用案例

1.Hbase感性认识

1)Hbase简介

2)Hbase特点

3)HBase与RDBMS对比

4)HBase体系结构

5)Hbase常见概念

2.Hbase主要组成

          Hmaster

          Region

          Hfile

          RowKey的原理

         HMaster与备用HMaster间的切换原理

         Oracle Rac等进行对比

         RowKey设计原则


第三天:

第四部分:大数据挖掘介绍

1.大数据挖掘几种方法

1)传统数据挖掘

2)SPSS_Modeler14.2

3)SAS简介

4)Mahout简介

5)R语言详解

6)Rhadoop\Rhive

2.算法介绍和应用

1)关联分析

2)K-Means

3)决策树C5.0

4)Logistic回归

5)主成分/因子分析

6)Apriori算法

7)预测算法

8)神经网络

9)协同过滤挖掘算法

3.例子和练习


第五部分:大数据挖掘应用案例详解

1.项目案例详解

1)TF-IDF与余弦相似性的应用

2)电力行业的大数据应用

2.大数据在电信行业应用

1)用户行为编好分析

2)电信客户流失预测分析

3.大数据在零售行业应用

   1)销售产品关联分析

   2)营销产品推荐系统

   3)门店客流量预测案例




五、可颁发证书:工信部NTC中心《大数据技术》证书 

自愿办理,费用200元/人

六、报名方式 

点击原文连接报名



以上是关于培训Hadoop大数据最佳实践研修班(广州)的主要内容,如果未能解决你的问题,请参考以下文章

Hadoop 大数据的最佳实践

推荐:网络爬虫与文本挖掘核心技术案例实战高级研修班

视频干货分析实战|10-Impala性能调优

专项培训可靠性设计与失效分析试验技术最新标准应用高级研修班

通知 | 2018政务大数据理论与实践高级研修班(第二期)即将开班!

AI Ops高级研修班-金融行业AI Ops最佳落地实践不被人工智能所取代的唯一方法就是去驾驭人工智能!