我的公司要求直接从 Azure DW 进行转换和报告 - 这看起来是个好主意吗?
Posted
技术标签:
【中文标题】我的公司要求直接从 Azure DW 进行转换和报告 - 这看起来是个好主意吗?【英文标题】:My company is asking to do transformations & reporting directly from Azure DW - does this seem like a good idea? 【发布时间】:2019-10-09 15:02:35 【问题描述】:我的公司希望加快提交报告的流程。在内部,我们有一个由 12 人组成的团队负责构建报告。该公司是一家拥有10,000多名员工的大型公司。我们经常被要求处理临时报告,但交付这些报告平均需要 1-2 周。高级管理人员表示,交付时间太慢了。一家外部咨询公司进来做一些发现工作,他们建议业务用户应该可以访问 Azure 数据仓库,以便他们可以直接在 Azure 分析服务和 Power BI 中构建模型。
他们建议的设计如下:
-
将数据从 SAP 直接加载到 Azure 数据仓库。
在 Azure DW 中构建我们的数据模型 - 这意味着所有转换工作都直接在 Azure DW 中完成(暂存、清理、星型架构构建)。
在 Azure Analysis Services 中构建模型。
在 Power BI 中使用。
这看起来是个好策略吗?我是 Azure 数据仓库的新手,我们的技术负责人正在担任陪产假,因此我们无法寻求他的帮助。
我问外部顾问将所有转换工作负载直接应用到 Azure DW 会有什么影响,他说“它是 mpp,所以处理速度非常快”。
有人可以帮忙吗?我的团队技术负责人在陪护,所以我们无法找到他。
【问题讨论】:
【参考方案1】:Azure 对于现代数据仓库和分析目的来说无疑是一个很好的平台,但 ADW 与否需要更多的研究。一般来说,您可以考虑两种选择:
体积不大(
SAP -> SSIS/ADF -> Azure SQL DB -> 带有 DAX 的 Azure 分析服务(作为语义层)表格模型 -> Power BI容量很大(> 10TB):
SAP -> SSIS/ADF -> Azure SQL DW -> Azure 分析服务语义层 -> Power BI当然,体积只是您决定架构时要考虑的众多因素之一,但它是众多实际经验中的一个重要因素,而 MPP 可能并不是真正需要的。实际的架构和规模需要更多的努力来研究。以上几点是非常笼统的供您参考,有一些东西可以开始和进一步探索。
如果您想了解更多将 SAP 数据引入 Azure 的技术细节,可以查看我们的博客:http://www.aecorsoft.com/blog/2018/2/18/extract-sap-data-to-azure-data-lake-for-scale-out-analytics-in-the-cloud 和http://www.aecorsoft.com/blog/2018/4/26/use-azure-data-factory-to-bring-sap-data-to-azure。
【讨论】:
以上是关于我的公司要求直接从 Azure DW 进行转换和报告 - 这看起来是个好主意吗?的主要内容,如果未能解决你的问题,请参考以下文章
从 Azure Synapse 中的 Apache Spark 将数据写入 SQL DW
使用 ADF 复制 Azure SQL DW 中的数据(根据文档,使用 Polybase 进行分阶段复制不起作用)
如何在写入 Redshift DW 之前从 S3 存储桶转换数据?
Azure SQL DW DWC 单元比较/与 vCore、内存等效