将存储安全地连接到 Azure Data Lake Analytics 或数据工厂
Posted
技术标签:
【中文标题】将存储安全地连接到 Azure Data Lake Analytics 或数据工厂【英文标题】:Connecting storage securely to Azure Data Lake Analytics or Data Factory 【发布时间】:2018-12-19 08:57:25 【问题描述】:我正在设置一个新的 Azure Data Lake Analytics (ADLA) PAAS 服务来针对 blob 存储中的一些现有数据集运行 USQL。为了安全起见,blob 存储被防火墙保护,当我尝试将存储帐户添加到 ADLA 中的数据源时,我收到以下错误。数据工厂也有类似情况。
InvalidArgument:存储帐户 '' 或其 accessKey 无效。
如果我禁用防火墙,可以成功添加存储帐户。我尝试添加相关的Azure Data Center IP Address ranges,但连接仍然失败。我还勾选了“允许受信任的 Microsoft 服务”框,但这是 does not seem include data lake or data factory。如何从 ADLA 访问我的存储帐户,但仍对其进行保护?
【问题讨论】:
【参考方案1】:您可以安装 selfhosted IR 来访问您的 Blob 存储。将托管您自托管 IR 的计算机的 IP 列入白名单。
【讨论】:
这绝对是一种选择,但我不想承担管理 VM 的成本和开销。以上是关于将存储安全地连接到 Azure Data Lake Analytics 或数据工厂的主要内容,如果未能解决你的问题,请参考以下文章
Azure Data Lake 是不是仅临时存储用于分析的数据?
使用 Azure Web API 应用程序中的 C# 从 Azure Data Lake 查询 parquet 数据
Usql 与 Azure Data Lake Store .net SDK