大数据从0到一(Hadoop)
Posted 粪乧
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了大数据从0到一(Hadoop)相关的知识,希望对你有一定的参考价值。
大数据挑战与应对措施
| 系统瓶颈 | Google大数据技术 |
| 储存容量 | BigTable |
| 读写速度 | GFS |
| 计算效率 | MapReduce |
如何学习大数据
- 在官方网站进行学习
- 在官方网站学习英文文档进行学习
- 项目实战对知识点进行巩固和融会贯通
- 社区活动 MeetUp INFOQ
初始Hadoop
- Hadoop http://hadoop.apache.org/ 分布式存储、计算 可拓展 稳定的开源框架
- 可以做 搭建大型数据仓库 PB级数据额存储.处理.分析.统计等业务 — 搜索 日志分析 商业智能 数据挖掘
Hadoop 核心组件之分布式文件系统HDFS
源自于Google 的GFS 论文 论文发布于2003年10月
HDFS是GFS的克隆版
HDFS是特点扩展性&容错性&海量数据存储
将文件切分指定大小的数据块并以多副本的储存在多个机器上
数据切分 多副本 容错是对用户不可见的 操作的对象依然是文件YARN
负责整个集群资源的管理和调度 内存 cpu 进行控制
扩展性 容错性 多框架资源统一管理- MapReduce
拓展性&容错性&海量数据离线处理 - Hadoop生态圈
开源 社区 活跃
囊括大数据处理的方方面面
成熟生态圈 - 常用版本与选型
Apache Hadoop 发行版
CDH 升级方便 sparck合作 配置简单 文档全面
HDP - 企业利益最大化
用户画像 用户信息推荐 广告 等
拥抱美丽的大数据吧!
以上是关于大数据从0到一(Hadoop)的主要内容,如果未能解决你的问题,请参考以下文章