BI 架构建议
Posted
技术标签:
【中文标题】BI 架构建议【英文标题】:BI architecture advice 【发布时间】:2014-08-26 14:29:19 【问题描述】:我想就我们的 BI 架构获得一些建议,该架构维护起来相当复杂。
我在一家电子购物公司工作,我们的产品在 LAMP 系统(Linux Apache mysql php)上工作。
每晚:
我们的 prod DB (MySQL) 中的数据使用 Talend 提取,然后插入另一个名为 DWH 的 MySQL 数据库用于数据仓库 然后由 Jedox/Palo 提取来自该 DWH 的数据以加载 OLAP 多维数据集,Excel 使用这些多维数据集和插件进行恢复 Access/Excel 一次性报告也可以访问此 DWH 中的数据,但这不是很好每次我们需要修改现有工作流程或创建新报告时,都需要使用很多步骤和不同的技术,这导致我们进入一个相当复杂的平台。
我可以做些什么来简化这个过程?
【问题讨论】:
有什么问题? hum sorry :),我们如何才能获得更轻、更高效的架构? 【参考方案1】:您应该能够使用 Talend 加载 Palo OLAP 表,作为使用提供的 Palo 组件的数据仓库加载过程的一部分,这应该减少以与主 ETL 流程分开的方式进行 ETL 工作。
Roberto Machetto 的博客有一些 interesting tutorials 关于如何做到这一点,我相信互联网上有更多的例子,当然你可以在这里询问你遇到的任何具体问题。
一旦您的所有数据都正确加载到数据仓库和任何 OLAP 多维数据集,那么您的用户应该能够在数据存储时对数据运行任何定制或其他查询。如果您看到用户无法访问适当数据以进行分析的情况,那么应该通过正确理解维度建模在初始数据仓库/OLAP 多维数据集加载中解决该问题。
【讨论】:
【参考方案2】:给出关于做什么或不做什么的建议有点困难,这取决于你的最终目标或目标。我可以建议您在交付 OLAP 多维数据集之前将您的数据分成几个阶段。
例如,您可以在您拥有的 DW 数据库中创建事实和维度,这样您就可以将数据分成多个主题,这可以使您的报告构建变得更加容易,因为任何人都可以根据需要对这些数据进行分组。您可以有一个仅用于销售的事实表,另一个用于客户流失,另一个用于新客户,然后继续...
试着看看事实和维度表,或者只是维度建模,它会让你的日常工作轻松很多。
一些链接: http://en.wikipedia.org/wiki/Dimensional_modeling http://www.learndatamodeling.com/ddm.php
【讨论】:
以上是关于BI 架构建议的主要内容,如果未能解决你的问题,请参考以下文章
如何选型商业智能和分析(BI&A)平台,Gartner给了这些建议!
数据中台应用实战50篇-带你概览BI数据仓库数据湖与数据中台之间有什么关联关系?(建议收藏)