将存储安全地连接到 Azure Data Lake Analytics 或数据工厂

Posted

技术标签:

【中文标题】将存储安全地连接到 Azure Data Lake Analytics 或数据工厂【英文标题】:Connecting storage securely to Azure Data Lake Analytics or Data Factory 【发布时间】:2018-12-19 08:57:25 【问题描述】:

我正在设置一个新的 Azure Data Lake Analytics (ADLA) PAAS 服务来针对 blob 存储中的一些现有数据集运行 USQL。为了安全起见,blob 存储被防火墙保护,当我尝试将存储帐户添加到 ADLA 中的数据源时,我收到以下错误。数据工厂也有类似情况。

InvalidArgument:存储帐户 '' 或其 accessKey 无效。

如果我禁用防火墙,可以成功添加存储帐户。我尝试添加相关的Azure Data Center IP Address ranges,但连接仍然失败。我还勾选了“允许受信任的 Microsoft 服务”框,但这是 does not seem include data lake or data factory。如何从 ADLA 访问我的存储帐户,但仍对其进行保护?

【问题讨论】:

【参考方案1】:

您可以安装 selfhosted IR 来访问您的 Blob 存储。将托管您自托管 IR 的计算机的 IP 列入白名单。

【讨论】:

这绝对是一种选择,但我不想承担管理 VM 的成本和开销。

以上是关于将存储安全地连接到 Azure Data Lake Analytics 或数据工厂的主要内容,如果未能解决你的问题,请参考以下文章

搜索存储在 Azure Data Lake 中的数据

Azure Data Lake 是不是仅临时存储用于分析的数据?

使用 Azure Web API 应用程序中的 C# 从 Azure Data Lake 查询 parquet 数据

Usql 与 Azure Data Lake Store .net SDK

通过 OData 公开的 Azure Data Lake Store

无法对 Azure Data Lake Gen2 文件使用通配符