Hadoop基础与电商行为日志分析 新手入门大数据
Posted spyssor
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hadoop基础与电商行为日志分析 新手入门大数据相关的知识,希望对你有一定的参考价值。
第1章 大数据概述
本章将从故事说起,让大家明白大数据是与我们的生活息息相关的,并不是遥不可及的,还会介绍大数据的特性,以及大数据对我们带来的技术变革,大数据处理过程中涉及到的技术以及大数据典型应用。
第2章 初识Hadoop
本章节将带领大家认识Hadoop以及Hadoop生态系统、Hadoop的发展史、Hadoop的优势、Hadoop的三个核心组件、Hadoop发行版的选择,为后续深入讲解Hadoop打下坚实的基础。
第3章 分布式文件系统HDFS
本章将从Hadoop的设计目标、架构及文件系统命令空间出发,快速搭建单节点伪分布式HDFS的实验环境,通过讲解使用hdfs shell以及Java API的方式操作HDFS文件系统,详细分析HDFS文件的读写流程,并通过HDFS API来实现词频统计案例,使得大家对Hadoop分布式文件系统HDFS有深刻的认识以及实战。 ...
第4章 分布式计算框架MapReduce
本章将从架构、编程模型等角度带大家认识Hadoop的分布式计算框架MapReduce,掌握MapReduce各个核心组件编程,并通过两个案例让大家深入掌握MapReduce编程的方方面面。
第5章 资源调度框架YARN
本章将从YARN的产生背景、YARN的架构及执行流程的角度带大家认知Hadoop的资源调度框架YARN,快速搭建单节点伪分布式YARN的实验环境并掌握如何提交MapReduce作业提交到YARN上运行。
第6章 电商项目实战Hadoop实现
本章将通过电商用户行为日志分析的项目实战,来将前面几个章节讲解的知识点串联起来,综合使用Hadoop的技术进行离线统计分析。
第7章 数据仓库Hive
本章将从Hive的产生背景、体系架构、Hive部署、DDL以及DML来掌握Hive使用的方方面面。
第8章 电商项目实战Hive实现
本章将使用Hive对电商用户行为日志分析进行重新实现,让大家对MapReduce编程和Hive实现的方式进行对比,体会Hive在生产上使用的便捷性。
第9章 Hadoop分布式集群搭建
本章将带领大家搭建一个三个节点的分布式Hadoop集群环境,让大家对于Hadoop集群的安装有更深入的认识,并将项目实战案例运行在分布式集群环境中。
下载地址:Hadoop基础与电商行为日志分析 新手入门大数据
以上是关于Hadoop基础与电商行为日志分析 新手入门大数据的主要内容,如果未能解决你的问题,请参考以下文章
大数据入门第一课 Hadoop基础知识与电商网站日志数据分析
基于hadoop的电商日志分析系统的设计与实现选题依据怎么写
[Spark/Scala] 180414|大数据实战培训 Spark大型项目实战:电商用户行为分析大数据平台 大数据视频教程