培训Hadoop大数据最佳实践研修班(广州)
Posted PPV课数据科学社区
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了培训Hadoop大数据最佳实践研修班(广州)相关的知识,希望对你有一定的参考价值。
一、培训课程简介
课程名称:Hadoop大数据分析最佳实践研修班
培训天数:3天
培训费用:1880元/人
培训时间:2016年6月4-5日,6月18日
培训地点:广州
培训对象:需要了解大数据,或者需要熟知大数据管理、维护、开发和数据分析的人
学员基础:无需具备Hadoop基础和经验,只需要基本的数据库基础
培训资料:培训讲义
培训方式:全程上机练习,理论与案例相结合,资深顾问授课及辅导,小班授课保证质量
二、培训目标:
熟悉Hadoop分布式文件系统
懂得hdfs分布式文件系统的使用
了解MapReduce工作原理
熟知Hadoop集群硬件配置规划
懂得Hadoop集群配置及优化
学会如何维护和监测Hadoop集群
学会怎么使用Sqoop连接关系数据库进行数据导入导出
了解Hive数据仓库的开发和应用
Hue的web页面的数据库开发
精通Hbase列式数据库的开发
掌握大数据挖掘分析基础
了解数据挖掘常见的几种工具和对比
了解几种常用的挖掘算法原理
了解大公司对大数据的应用场景和未来方向
三、讲师介绍:
陈老师:九年相关项目经历,长期从事大数据相关的工作,精通大数据技术,熟悉关系型数据库oracle10G\mysql等;精通Hbase、HDFS、Hive、Pig等开源技术,对实时处理Storm、Impala有较深的认识,熟悉分布式计算MapReduce。非常精通数据挖掘算法和解决方案,比如决策树、K-means、预测分析、Logistc线性回归、Apriori算法应用熟悉电信、移动、电力、证券、网络、物流等业务。
四、培训大纲:
第一天:
第一部分:如何构建分布式数据仓库平台
1.怎么样才算是真正意义的大数据平台
2.开源Hadoop生态系统的介绍
3.数据采集过程与分布式存储
1)ETL原理
2)Sqoop
3)HDFS
4.数据仓库与数据分析介绍
1)MapReduce
2)Hive
3)Pig
4)HBase
5)Impala
5.集群监控与调度组件
1)Hadoop集群权限管理
2)Hbase列数据库监控
3)Hive集群监控
4)Oozie介绍
6.Hue介绍和例子讲解
7.日志收集工具
1)flume
2)kafka
8.练习
9.案例讲解
1)运营商全国用户上网记录案例介绍
2)IBM网上舆情分析
第二天:
第二部分:大数据平台部署及案例
1.我们应该选哪种Hadoop?
1)选哪个版本?为什么?
2)优点和缺点
2.集群硬件应该如何选配?
1)网络拓扑
2)内存
3)硬盘
4)CPU
5)价格
3.部署案例讲解
1)英特尔Hadoop发行版详解
2)某省级通信运营商清帐单查询系统介绍
第三部分:Hbase列数据库及应用案例
1.Hbase感性认识
1)Hbase简介
2)Hbase特点
3)HBase与RDBMS对比
4)HBase体系结构
5)Hbase常见概念
2.Hbase主要组成
Hmaster
Region
Hfile
RowKey的原理
HMaster与备用HMaster间的切换原理
Oracle Rac等进行对比
RowKey设计原则
第三天:
第四部分:大数据挖掘介绍
1.大数据挖掘几种方法
1)传统数据挖掘
2)SPSS_Modeler14.2
3)SAS简介
4)Mahout简介
5)R语言详解
6)Rhadoop\Rhive
2.算法介绍和应用
1)关联分析
2)K-Means
3)决策树C5.0
4)Logistic回归
5)主成分/因子分析
6)Apriori算法
7)预测算法
8)神经网络
9)协同过滤挖掘算法
3.例子和练习
第五部分:大数据挖掘应用案例详解
1.项目案例详解
1)TF-IDF与余弦相似性的应用
2)电力行业的大数据应用
2.大数据在电信行业应用
1)用户行为编好分析
2)电信客户流失预测分析
3.大数据在零售行业应用
1)销售产品关联分析
2)营销产品推荐系统
3)门店客流量预测案例
五、可颁发证书:工信部NTC中心《大数据技术》证书
自愿办理,费用200元/人
六、报名方式
点击原文连接报名
以上是关于培训Hadoop大数据最佳实践研修班(广州)的主要内容,如果未能解决你的问题,请参考以下文章