为 Excel Pivot 提供支持的 OLAP 多维数据集。啥是更好的解决方案?

Posted

技术标签:

【中文标题】为 Excel Pivot 提供支持的 OLAP 多维数据集。啥是更好的解决方案?【英文标题】:OLAP cube powering Excel Pivot. What's a better solution?为 Excel Pivot 提供支持的 OLAP 多维数据集。什么是更好的解决方案? 【发布时间】:2015-08-07 18:54:52 【问题描述】:

我希望为非技术营销人员构建一个动态数据环境。 我想以 Excel 数据透视表形式提供大量数据,这样即使没有分析/技术背景的营销人员也可以访问相关的绩效信息。我正在尝试避免使用非 excel 前端,因为我不希望用户在需要以某种方式操作数据时必须不断地导出数据。

我的第一个想法是把一个填充了预聚合数据的 OLAP 多维数据集放在一起,但由于 OLAP 已经“过时”,我遭到了 IT 团队的反对。我不反对他们——肯定有更快的数据处理架构。

所以我的问题是:是否有任何其他方法来构建数据,以便营销人员可以轻松访问它,但仍然可以在 Excel 中进行一定程度的操作?我正在处理大约 50-100m 行数据,并且需要扩展维度的能力。

【问题讨论】:

【参考方案1】:

这只是我的想法。

确实,问题可能会回到您的 IT 团队。您的第一个想法是拼凑一个 OLAP 多维数据集。它不喜欢这样。如果他们非常时髦,以至于认为 OLAP“过时”,那么他们建议什么作为更好、更新的替代方案?

或者,换一种说法——他们反对 OLAP 解决方案的实质是什么? (我假设除了“MS 向我们展示了 PowerPivot/Azure 表格的精彩演示,还有非常棒的免费小吃和咖啡”之外还有其他内容。

您的要求很明确:

    非技术人员可以轻松访问 结构化数据,因此他们不必解释原始数据 通过 Excel 访问 可扩展性

我会密切关注您问题的任何其他答案,因为我总是有兴趣发现我不知道的东西;但就我个人而言,我还没有找到比 OLAP 更好的解决方案。

让我怀疑“后 OLAP”情绪的原因与上面列表中的第 (2) 点有关。非技术用户可能倾向于认为他们使用的多维数据集数据是通过某种魔法以某种方式毫不费力地生成的。这本身就是成功的一个指标,表明用户可以轻松地从设计良好的 OLAP 系统中获得他们想要的东西。

但这种毫不费力是一种错觉:将原始数据结构化为这种形式需要设计工作,并且最终的结构包含设计决策和断言:这就是它易于使用的原因,因为硬的东西已经封装在立方体设计。

我对“后 OLAP”有一种明显的 Han Solo 式的不好感觉:它等于迎合这种将数据轻松转换为可用形式的错觉,并传播进一步的错觉。

在 OLAP 下,用户得到了他们奇妙的、神奇的可用数据结构,而这些艰苦的工作在你我这样的开发人员的视线之外完成。也许我们做错了什么,以至于他们无法完全按照他们的意愿查看数据 - 但至少用户可以与我们交谈并询问他们想要什么。

我对“后 OLAP”推销的印象是它试图省去设计工作。我们不需要那些讨厌的昂贵的开发人员,我们不需要做出特定的设计决策(这必然会启用某些功能,同时排除某些其他功能),我们不需要多维数据集处理时滞。我们可以通过某种方式实现这一点:

输入您喜欢的任何数据。如果它完全没有结构或充满污垢,请不要担心! 任何规模 立即访问分析,没有 ETL/处理延迟 不知何故,输出是可用的结构化数据。由……特别是没有人构成。用户可以根据自己的喜好构建它,但不知何故这很容易

称我为愤世嫉俗者,但这对我来说听起来很神奇。

【讨论】:

以上是关于为 Excel Pivot 提供支持的 OLAP 多维数据集。啥是更好的解决方案?的主要内容,如果未能解决你的问题,请参考以下文章

以编程方式排除 olap pivot 中的页面项目

OLAP进阶:Excel可直接分析的大数据语义层

阿里云数据库产品HybridDB简介——OLAP数据库,支持行列混合存储,为用户提供基于开源 OLTPOLAPBigData 生态的一站式解决方案

power pivot 数据导出到excel吗

数据分析—一文看懂数据透视表(Excel&Pandas-pivot_table实现)

用于 NodeJS 的 OLAP 服务器