数据仓库小记

Posted wyfloveyanqi

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据仓库小记相关的知识,希望对你有一定的参考价值。

什么是数据仓库?

宽泛地讲,数据仓库是一种数据库,它与单位的操作数据库分别维护。数据库允许将各种应用系统集成在一起,为统一的历史数据分析提供坚实的平台,对信息处理提供支持。

William H.Inmon 说过(数据仓库是一个面向主题的、集成的、时变的、非易失的数据集合,支持管理者的决策过程)

 技术分享图片技术分享图片

操作数据库系统与数据仓库的区别?

联机操作数据库系统的主要任务是执行联机事务和查询处理。这种系统称作联机事务处理(OLTP)系统。它们涵盖了单位的大部分日常操作。

数据仓库系统在数据分析和决策方面为用户或”知识工人”提供服务。这种系统可以用不同的格式组织和提供数据,以便满足不同用户形形色色的需求。这种系统称作联机分析处理(OLAP)系统(知识工人指的是例如经理、分析人员和主管)

 技术分享图片

OLTP系统和OLAP系统的比较:

技术分享图片

数据仓库:一种多层体系结构。

通常,数据仓库采用三层体系结构,如下图:

底层是仓库数据库服务器,中间层是OLAP服务器,顶层是前段客户层

 技术分享图片

数据仓库模型:企业仓库、数据集市、虚拟仓库

从结构的角度来看,有三种数据仓库模型:企业仓库、数据集市和虚拟仓库。

企业仓库:企业仓库搜集了关于主题的所有信息,跨越整个企业。它提供企业范围内的数据集成,通常来自一个或多个操作数据库系统或外部信息提供者,并且是多功能的。

企业数据仓库可以在传统的大型机、超级计算机服务器或并行结构平台上实现。它需要广泛的商务建模,可能需要多年涉及和建设。

数据集市:数据集市包含企业范围数据的一个子集,对于特定的用户群是有用的。有范围限于选定的主题。例如,销售数据集市可能限定其主题为顾客、商品和销售。包括在数据集市中的数据通常是汇总的。

根据数据来源不同,数据集市分为独立和依赖的两类。在独立的数据集市中,数据是来自一个或多个操作数据库系统或外部信息提供者,或者来自在一个特定的部门或地区局部产生的数据。依赖的数据集市的数据直接来自企业数据仓库。

数据集市可以在低价格的部门服务器上实现,基于UNIX/LinuxWindows。数据集市的实现周期一般是数以周计的。

虚拟仓库:虚拟仓库是操作数据库上视图的集合。为了有效地处理查询,只有一些可能的汇总视图被物化。虚拟仓库易于建立,但需要操作数据库服务器还有余力。

 

以上是关于数据仓库小记的主要内容,如果未能解决你的问题,请参考以下文章

Mac 编译jdk源码小记

Mac 编译jdk源码小记

SQL DDL—— droptruncate和delete(mysql)的区别理解小记

git使用小记

什么叫数据仓库?

数据仓库是啥呢