我的公司要求直接从 Azure DW 进行转换和报告 - 这看起来是个好主意吗?

Posted

技术标签:

【中文标题】我的公司要求直接从 Azure DW 进行转换和报告 - 这看起来是个好主意吗?【英文标题】:My company is asking to do transformations & reporting directly from Azure DW - does this seem like a good idea? 【发布时间】:2019-10-09 15:02:35 【问题描述】:

我的公司希望加快提交报告的流程。在内部,我们有一个由 12 人组成的团队负责构建报告。该公司是一家拥有10,000多名员工的大型公司。我们经常被要求处理临时报告,但交付这些报告平均需要 1-2 周。高级管理人员表示,交付时间太慢了。一家外部咨询公司进来做一些发现工作,他们建议业务用户应该可以访问 Azure 数据仓库,以便他们可以直接在 Azure 分析服务和 Power BI 中构建模型。

他们建议的设计如下:

    将数据从 SAP 直接加载到 Azure 数据仓库。 在 Azure DW 中构建我们的数据模型 - 这意味着所有转换工作都直接在 Azure DW 中完成(暂存、清理、星型架构构建)。 在 Azure Analysis Services 中构建模型。 在 Power BI 中使用。

这看起来是个好策略吗?我是 Azure 数据仓库的新手,我们的技术负责人正在担任陪产假,因此我们无法寻求他的帮助。

我问外部顾问将所有转换工作负载直接应用到 Azure DW 会有什么影响,他说“它是 mpp,所以处理速度非常快”。

有人可以帮忙吗?我的团队技术负责人在陪护,所以我们无法找到他。

【问题讨论】:

【参考方案1】:

Azure 对于现代数据仓库和分析目的来说无疑是一个很好的平台,但 ADW 与否需要更多的研究。一般来说,您可以考虑两种选择:

体积不大(

SAP -> SSIS/ADF -> Azure SQL DB -> 带有 DAX 的 Azure 分析服务(作为语义层)表格模型 -> Power BI

容量很大(> 10TB):

SAP -> SSIS/ADF -> Azure SQL DW -> Azure 分析服务语义层 -> Power BI

当然,体积只是您决定架构时要考虑的众多因素之一,但它是众多实际经验中的一个重要因素,而 MPP 可能并不是真正需要的。实际的架构和规模需要更多的努力来研究。以上几点是非常笼统的供您参考,有一些东西可以开始和进一步探索。

如果您想了解更多将 SAP 数据引入 Azure 的技术细节,可以查看我们的博客:http://www.aecorsoft.com/blog/2018/2/18/extract-sap-data-to-azure-data-lake-for-scale-out-analytics-in-the-cloud 和http://www.aecorsoft.com/blog/2018/4/26/use-azure-data-factory-to-bring-sap-data-to-azure。

【讨论】:

以上是关于我的公司要求直接从 Azure DW 进行转换和报告 - 这看起来是个好主意吗?的主要内容,如果未能解决你的问题,请参考以下文章

从 Azure Synapse 中的 Apache Spark 将数据写入 SQL DW

使用 ADF 复制 Azure SQL DW 中的数据(根据文档,使用 Polybase 进行分阶段复制不起作用)

如何在写入 Redshift DW 之前从 S3 存储桶转换数据?

Azure SQL DW DWC 单元比较/与 vCore、内存等效

Azure Databricks 到 Azure SQL DW:长文本列

DW:polybase访问Azure Blob Storage