强-大数据第三讲

Posted zac1010

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了强-大数据第三讲相关的知识,希望对你有一定的参考价值。

Hadoop的背景起源二:MapReduce

一、什么是大数据,本质?
(1)数据的存储:分布式文件系统(分布式存储)-----> HDFS: Hadoop Distributed File System
(2)数据的计算:分布式计算

二、如何解决大数据的计算?分布式计算
(1)什么是PageRank(MapReduce的问题的来源)
(*) 搜索排名

(2)MapReduce(Java语言实现)基础编程模型: 把一个大任务拆分成小任务,再进行汇总
(*) 更简单一点例子

 

技术图片

 

技术图片

以上是关于强-大数据第三讲的主要内容,如果未能解决你的问题,请参考以下文章

新年新姿势第一弹腾讯云EMR数仓建设教程发布——与尚硅谷强强联手带你全方位了解大数据组件

新年新姿势第一弹腾讯云EMR数仓建设教程发布——与尚硅谷强强联手带你全方位了解大数据组件

清北2021级新生大数据对比!北大强基计划超30%为竞赛破格录取

清北2021级新生大数据对比!北大强基计划超30%为竞赛破格录取

视觉SLAM十四讲笔记-- 第三讲

视觉SLAM十四讲笔记-- 第三讲