[第二章]了解storm

Posted suwy

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了[第二章]了解storm相关的知识,希望对你有一定的参考价值。

1、什么是storm

Apache Storm is a free and open source distributed realtime computation system.

     免费、开源、分布式、实时计算系统

Storm makes it easy to reliably process unbounded streams of data

     unbounded:无界,源源不断

     bounded:Hadoop/spark SQL  离线 (input-->output)

doing for realtime processing what Hadoop did for batch processing

     storm:实时流处理

     Hadoop:离线批处理

2、storm能做什么?

Storm has many use cases:

    realtime analytics:实时分析

    online machine learning:在线机器学习

    continuous computation:持续计算

    distributed RPC,

     ETL:

    and more.

3、storm的特点

     fast: over a million tuples processed per second per node. 

      scalable(可添加机器)

      fault-tolerant

      guarantees your data will be processed

      easy to set up and operate.            

storm能实现高频数据和大规模数据的实时处理          

4、storm发展历史

storm产生于twitter    

   需求:大户数的实时处理

   实时系统要考虑:

   1)健壮性

    2)拓展性/分布式

    3)数据不丢失不重复

    4)高性能低延时

 5、storm和Hadoop的区别

处理过程

Hadoop    map       reduce

storm      spout      bolt    

storm进程不杀死不结束

Hadoop进程完成就结束                                                                                     

6、发展趋势

看:

    社区的发展、活跃度

    企业的需求

    大数据的相关大会,如storm的数量上升

    互联网技术分享图片公司使用度

以上是关于[第二章]了解storm的主要内容,如果未能解决你的问题,请参考以下文章

穆迪分析在Chartis Research STORM50综合排名中名列第二

Storm 系列—— Storm 项目三种打包方式对比分析

大数据-storm理论

Storm的BaseBasicBolt源码解析ack机制

57.storm拓扑结构调整

STORM_0008_Structure-of-the-codebase_Storm的代码库的结构