流分析恢复行为

Posted

技术标签:

【中文标题】流分析恢复行为【英文标题】:Stream analytics resume behavior 【发布时间】:2016-09-12 14:04:19 【问题描述】:

我有一个 EventHub 流作为输入,一个 Service Bus Queue 作为输出。

我的查询使用TUMBLINGWINDOW 聚合事件以从流中输出到队列。

如果我必须暂停 流分析 并稍后从停止点恢复,这是否意味着我的数据窗口现在将被延迟?或者它会赶上从最后一个停止日期到现在在第一个窗口中的事件?

E.G. 我停止分析一小时并从停止点恢复,所以从现在开始它总是会在一小时后处理新事件。

我停止分析一小时并从停止点恢复,第一个输出将包含一小时前到现在的数据,新窗口将实时处理新数据。

【问题讨论】:

【参考方案1】:

由于流分析将继续从上次中断的地方读取数据,它只会立即摄取所有可以接收的数据,并在完成所有传入的数据后几乎立即开始生成实时数据暂停之后。

【讨论】:

我写了一个快速测试应用程序,它同意你的看法。谢谢。【参考方案2】:

当我创建流分析作业时,我也在想同样的事情。当您第一次开始作业时,您只会看到作业输出开始时间的 2 个选项,即现在和自定义。

但是当您在第一次之后开始工作时,您会得到另一个选项:上次停止的时间。

要恢复已停止的作业而不丢失数据,请选择上次停止(注意 如果您是第一次运行作业,则此选项不可用 时间)。

【讨论】:

不要相信我的话,但我记得它第一次处理历史数据时也是如此(取决于我猜的输入)。无论如何,使用 EventHubs 很容易测试。

以上是关于流分析恢复行为的主要内容,如果未能解决你的问题,请参考以下文章

安装模流分析软件对电脑有啥要

流分析和流位置

具有事件中心输入流位置的 Azure 流分析

Azure 流分析 - 沿流查询

点击流日志分析

分析如何减少肖特基二极管的压降