Azure Data PlatformETL工具(10)——ADF 集成运行时(Integration Runtimes,IR)

Posted 發糞塗牆

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Azure Data PlatformETL工具(10)——ADF 集成运行时(Integration Runtimes,IR)相关的知识,希望对你有一定的参考价值。

本文属于【Azure Data Platform】系列。
接上文:【Azure Data Platform】ETL工具(9)——ADF性能优化案例分享(1)
本文介绍ADF 的集成运行时

前言

Integration Runtime(IR)是ADF中很重要的一个组成部分,也是在很多性能问题的瓶颈所在。 IR指定用于执行活动的硬件类型、硬件的物理位置、硬件的所有者和维护者以及硬件可以连接到的数据存储和服务。每个链接服务都需要指定IR。 而每个管道也需要链接服务,所以链接服务和IR是组合在一起起到数据源和目标连接的作用。链接服务实现指定数据存储,IR实现运行操作。

IR种类

Azure IR

Azure IR使用的硬件资源及其基础架构都由微软托管。在使用时才付费。但是仅能访问公网的源。可以通过下图所示来创建Azure IR,注意图中红圈部分是一个逗号,说明它可以创建Azure IR和另外一种稍后介绍的自承载IR。


点进去之后可以选择对应的IR及其简介:

进行一些必要的配置,特别是区域选择:

还可以进行一些数据流配置,具体的每个项目说明轻自行查看:

AutoResolveIntegrationRuntime

它是内置的,默认的IR。这个IR不需要创建,它会根据你的源,目标和活动类型来决定所运行的区域。 这是不可控的,如果由于法规等因素你要限制在特定区域,则选择Azure IR。

自承载IR,Self-Hosted Integration Runtimes, SHIR

它跟Azure IR相对应,Azure IR由微软托管,SHIR由用户自己管理。而且它很重要的一点是:本地。Azure IR是对云上资源进行访问,要跟本地资源进行交互,则需要SHIR。 它像一个网关,在本地网络安装后,就可以打通Azure跟SHIR所在的机器的网络。
比如我就在自己的电脑上装了,然后把自己的电脑作为SHIR的服务器:

创建SHIR:

创建SHIR时,可以看到类型是自承载,并且不可改。


SHIR是需要下载一个安装包,同时使用下图打码的其中一个key进行注册,这个在前面【Azure Data Platform】ETL工具(3)——Azure Data Factory 从本地数据源复制到Azure 已经演示过。

Azure-SSIS Integration Runtimes

它是由微软托管的,运行 SQL Server Integration Services (SSIS) 引擎的VM群集。用于执行SSIS 包来访问公网和私网的资源。

每种IR的适用场景

  • Azure IR:因为其只支持云环境,所以是云中数据复制,数据转换的首选。
  • SHIR: 特别适合本地与云的交互,注意SHIR还能支持本地跟本地的使用,只是中间通过了Azure Data Factory进行一些数据传输和转换而已。
  • SSIS IR:如果你有已经在用的SSIS包,那么可以通过ADF来执行。

如果一个活动使用了多个种类的IR。 会选择其中一种来使用,优先级来说,SHIR→Azure IR

以上是关于Azure Data PlatformETL工具(10)——ADF 集成运行时(Integration Runtimes,IR)的主要内容,如果未能解决你的问题,请参考以下文章

Azure Data PlatformETL工具(19)——Azure Databricks

Azure Data PlatformETL工具(20)——创建Azure Databricks

Azure Data PlatformETL工具(20)——创建Azure Databricks

Azure Data PlatformETL工具——重新认识Azure Data Factory

Azure Data PlatformETL工具(11)——ADF 数据流

Azure Data PlatformETL工具——使用Azure Data Factory数据流传输数据