风暴履带中铲斗号码的用途是什么?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了风暴履带中铲斗号码的用途是什么?相关的知识,希望对你有一定的参考价值。

在使用分区“host”抓取多个网站时,也会根据主机生成也称为存储桶的分区密钥。并且每个spout实例都有一个桶来获取URL。如果我只抓取一个网站会怎么样?在这种情况下,我只有一个桶,这意味着只有一个喷口的实例将访问我的桶?如果一个存储桶中的所有网址都被抓取,则会抓取许多网站。如果spout实例移动到下一个存储桶,是不是?

答案

如果您抓取一个站点然后是,则只有一个喷口处于活动状态。如果您对许多站点进行爬网,它们将分布在多个存储桶中,并且相同数量的spout实例将处于活动状态。当没有更多的URL来获取分片时,相应的spout将不会在拓扑中发送URL。其他spout实例将继续处理URL,直到没有其他操作为止。

以上是关于风暴履带中铲斗号码的用途是什么?的主要内容,如果未能解决你的问题,请参考以下文章

头脑风暴法整理大量观点用啥工具

卡夫卡与风暴:卡夫卡和风暴的明智比较

如何用事件风暴构建领域模型?

如何用事件风暴构建领域模型?

红警2闪电风暴代码是啥啊

BaseStatefulBolt(风暴核心)与 StateFactory(风暴三叉戟)