大数据应用技术系列:大数据应用技术之数据仓库技术

Posted 正正杂说

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了大数据应用技术系列:大数据应用技术之数据仓库技术相关的知识,希望对你有一定的参考价值。

正正所在的团队,从原来主要完成mis系统的开发,到目前逐步开始涉猎大数据层面的数据分析,因此需要对数据仓库的概念进行基本的了解。

本文主要讲解数据仓库的基本概念。

那什么是数据仓库呢?

其实我认为数据仓库跟传统的关系型数据库没有本质的区别,更多的时候是一种表结构设计。

在多维分析的商业智能解决方案中,根据事实表和维度表的关系,又可将常见的模型分为星型模型和雪花型模型。在设计逻辑型数据的模型的时候,就应考虑数据是按照星型模型还是雪花型模型进行组织。
当所有维表都直接连接到“ 事实表”上时,整个图解就像星星一样,故将该模型称为星型模型,

目前正正所在的团队主要采用的就是星型模型。


典型的应用场景如下:
       在做数据报表的过程中,可以首先进行全维度的统计分析。然后针对不同维度的数据进行钻取和展示。

比如:我们一个指标填报系统,可以从填报用户的机构作为机构维度。按照指标级别启动指标维度。按照填报时间作为时间维度等,然后最后可以进行机构、时间、指标的三维的统计分析。


以上是关于大数据应用技术系列:大数据应用技术之数据仓库技术的主要内容,如果未能解决你的问题,请参考以下文章

大数据系列之数据仓库Hive原理

大数据入门-大数据技术概述

大数据技术之_18_大数据离线平台_04_数据分析 + Hive 之 hourly 分析 + 常用 Maven 仓库地址

奇点云数据中台技术汇| DataSimba系列之计算引擎篇

Flink系列之Flink的应用场景(一)

机器学习大数据数据仓库CSDN互助