数据仓库入门 一

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据仓库入门 一相关的知识,希望对你有一定的参考价值。

操作型数据 特点:细节化,分散化(数据库)

决策型数据 特点:综合化,集成化(数据仓库)

企业对应用集成的需求:实时监控,决策支持,预测

数据仓库是一个面向主题的,集成的,非易失的,随时间变化的用来支持管理人员决策的数据集合.

典型的主题域有:顾客、产品、交易或活动、政策、索赔、账目等.

 

元数据:关于数据的数据(可以看做数据仓库的字典).在数据仓库系统中,元数据可以帮助数据仓库管理员和数据仓库的开发人员非常方便的找到他们所关心的数据;

元数据是描述数据仓库内数据的结构和建立方法的数据;可以分为技术元数据和业务元数据.

 

技术元数据: 存储关于数据仓库系统技术细节的数据,是用于开发和管理数据仓库使用的数据,它主要包括:数据仓库结构的描述,

包括仓库模式、视图、维、层次结构和导出数据的定义,以及数据集市的位置和内容.

 

业务元数据:从业务角度描述了数据仓库的数据,它提供了介于使用者和实际系统之间的语义层,使得不同计算机技术的业务人员也能读懂数据仓库的数据.

业务元数据主要包括以下信息:使用者的业务术语所表达的数据模型、对象名和属性名;访问数据的原则和数据的来源;系统所提供的的

分析方法以及公式和报表的信息;具体包括:企业概念模型、多维数据模型、业务概念模型和物理数据模型之间的依赖.

ETL:抽取(Extract)、清洗转换(transform)、加载(load)

OLAP是满足决策支持或多维环境特定的查询和报表需求,它的技术核心是"维"这个概念,因此OLAP是多维数据分析工具的集合.

OLTP是原始的,细节性的,当前值的,可更新的,一次处理的数据量小的,面向应用,事务驱动,面向操作人员,支持日常操作.

OLAP是导出数据,综合性和提炼性数据,历史数据,不可更新,但周期性刷新,一次处理数据量大,面向分析,分析驱动,面向决策人员,支持管理需要.

 

以上是关于数据仓库入门 一的主要内容,如果未能解决你的问题,请参考以下文章

超详细入门精讲数据仓库原理&实战 一步一步搭建数据仓库 内附相应实验代码和镜像数据和脚本

大数据入门知识总结

从Hadoop框架来入门学习数据仓库概念

数据仓库入门介绍

Hive入门知识

Hive快速入门