大数据原理与应用笔记

Posted pokefade

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了大数据原理与应用笔记相关的知识,希望对你有一定的参考价值。

大数据、物联网,云计算共同构建了数据信息时代。

大数据的4个特性:大量化,多样化,快速化,价值密度低。

大数据技术的4个层次:数据采集,数据存储与管理,数据处理与分析,数据隐私与安全。

大数据的两大核心技术:分布式存储,分布式处理。

大数据典型的4个计算模式:批处理计算,流计算,图计算,查询分析计算。
批处理计算主要是针对大规模数据做批量处理,代表的技术产品有mapreduce、spark;
流计算是针对流数据的实时计算,代表的技术产品有storm、s4、flume等;
图计算是针对大规模图结构数据的处理,主要代表技术产品有:pregel、graphx等;
查询分析计算是针对大规模数据的存储管理和查询分析,主要代表技术产品有:hive、dremel、cassandra、impala;

以上是关于大数据原理与应用笔记的主要内容,如果未能解决你的问题,请参考以下文章

《大数据技术原理与应用》 复习笔记 (桂林电子科技大学)

数据库原理与技术学习笔记

大型网站技术架构:核心原理与案例分析笔记

《大型网站技术架构 核心原理与案例分析》读书笔记

《大型网站技术架构——核心原理与案例分析》读书笔记

数据库原理与应用技术原理阅读笔记