且构网

分享程序员开发的那些事...
且构网 - 分享程序员编程开发的那些事

《Storm企业级应用:实战、运维和调优》——第3章 核心概念和数据流模型

更新时间:2022-05-05 17:25:49

本节书摘来自华章计算机《Storm企业级应用:实战、运维和调优》一书中的第3章,作者:马延辉 陈书美 雷葆华著, 更多章节内容可以访问云栖社区“华章计算机”公众号查看。

第3章 核心概念和数据流模型

本章从细节入手,了解Storm的核心概念,包括Stream、Spout、Bolt、Tuple、Task、Worker、Stream Grouping和Topology。Stream是被处理的数据,Spout是数据源,Bolt处理数据,Tuple是数据单元,Task是运行Spout或Bolt中的线程,Worker是运行这些线程的进程,Stream Grouping规定了Bolt接收何种类型数据作为输入。Topology是由Stream Grouping连接起来的Spout和Bolt节点网络。
另外,除了核心概念,本章还介绍数据流模型,从整体上介绍Storm,这样从微观和宏观的角度了解Storm之后,就可以更好地利用Storm这个工具来开展实时处理分析的项目。