《大数据技术原理与应用》学习

Posted 笨鸟居士的博客

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了《大数据技术原理与应用》学习相关的知识,希望对你有一定的参考价值。

http://study.163.com/course/courseMain.htm?courseId=1002887002

先看了11章Spark

 

逻辑回归,需要迭代多,所以尤其适用Spark,100多倍

 

企业的应用:

1. 批量数据处理(数分钟与数小时,ETL),比如MapReduce

2. 基于历史数据的交互查询,比如Impala,Hive还不是

3. 实时数据流处理,比如Storm。比如返利的实时数据,以前通过数据库备库方式来处理,扩展性差。

 

而Spark提供了一站式解决。

 

一句话概括RDD,分布式内存的一个抽象概念,提供了一种高度受限的共享内存模型。

 

以上是关于《大数据技术原理与应用》学习的主要内容,如果未能解决你的问题,请参考以下文章

大数据技术之HBase原理分析

大数据主要学习啥知识

大数据技术原理与应用 第三版 林子雨 期末复习大数据概述 第一章 P2

大数据技术原理与应用----大数据概述

了解大数据技术原理与应用(复习知识点)

学习笔记大数据原理与技术 —— HBase大数据数据库