大数据离线分析之企业实战分享

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了大数据离线分析之企业实战分享相关的知识,希望对你有一定的参考价值。


本次内容结合大数据行业技术栈现状,为大家讲解企业中常用的离线分析。从如何使用大数据管理平台Cloudera Manager,到主流常用的分析模型,由浅入深逐步介绍,零基础小白也能看懂。

一、大数据管理平台Cloudera Manager

大数据的生态圈

大数据离线分析之企业实战分享_数据仓库

Cloudera Manager

大数据离线分析之企业实战分享_数据仓库_02

大数据离线分析之企业实战分享_分析模型_03

Cloudera Manager(简称CM)是Cloudera公司开发的一款大数据集群安装部署利器.

这款利器具有集群自动化安装、中心化管理、集群监控、报警等功能,使得安装集群从几天的时间缩短在几小时以内,运维人员从数十人降低到几人以内,极大的提高集群管理的效率。

cloudera manager有四大功能:

(1)管理:对集群进行管理,如添加、删除节点等操作。

(2)监控:监控集群的健康情况,对设置的各种指标和系统运行情况进行全面监控。

(3)诊断:对集群出现的问题进行诊断,对出现的问题给出建议解决方案。

(4)集成:对hadoop的多组件进行整合。

大数据离线分析之企业实战分享_数据仓库_04

二、大数据分析引擎Presto

Presto

大数据离线分析之企业实战分享_分析模型_05

大数据离线分析之企业实战分享_大数据_06

大数据离线分析之企业实战分享_大数据_07

大数据离线分析之企业实战分享_分析模型_08

三、大数据离线分析模型

分析模型

大数据离线分析之企业实战分享_大数据_09

​美团点评酒旅数据仓库建设实践​

​干货 | 携程机票数据仓库建设之路​

大数据离线分析之企业实战分享_分析模型_10

以上是关于大数据离线分析之企业实战分享的主要内容,如果未能解决你的问题,请参考以下文章

Spark进阶 大数据离线与实时项目实战 Spark-Hbase-Redis-Hadoop 大技术栈的企业级应用 网盘云分享

基于Hadoop离线大数据分析平台项目实战

大型企业级云产品-数据统计分析系统(离线处理-流处理-批处理)

spark项目实战(一~~九)

大数据运营之数据分析

Spark 2.x企业级大数据项目实战(实时统计离线分析和实时ETL)