流分析恢复行为
Posted
技术标签:
【中文标题】流分析恢复行为【英文标题】:Stream analytics resume behavior 【发布时间】:2016-09-12 14:04:19 【问题描述】:我有一个 EventHub 流作为输入,一个 Service Bus Queue 作为输出。
我的查询使用TUMBLINGWINDOW
聚合事件以从流中输出到队列。
如果我必须暂停 流分析 并稍后从停止点恢复,这是否意味着我的数据窗口现在将被延迟?或者它会赶上从最后一个停止日期到现在在第一个窗口中的事件?
E.G. 我停止分析一小时并从停止点恢复,所以从现在开始它总是会在一小时后处理新事件。
或
我停止分析一小时并从停止点恢复,第一个输出将包含一小时前到现在的数据,新窗口将实时处理新数据。
【问题讨论】:
【参考方案1】:由于流分析将继续从上次中断的地方读取数据,它只会立即摄取所有可以接收的数据,并在完成所有传入的数据后几乎立即开始生成实时数据暂停之后。
【讨论】:
我写了一个快速测试应用程序,它同意你的看法。谢谢。【参考方案2】:当我创建流分析作业时,我也在想同样的事情。当您第一次开始作业时,您只会看到作业输出开始时间的 2 个选项,即现在和自定义。
但是当您在第一次之后开始工作时,您会得到另一个选项:上次停止的时间。
要恢复已停止的作业而不丢失数据,请选择上次停止(注意 如果您是第一次运行作业,则此选项不可用 时间)。
【讨论】:
不要相信我的话,但我记得它第一次处理历史数据时也是如此(取决于我猜的输入)。无论如何,使用 EventHubs 很容易测试。以上是关于流分析恢复行为的主要内容,如果未能解决你的问题,请参考以下文章