数据仓库术语介绍
Posted i 说数据
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据仓库术语介绍相关的知识,希望对你有一定的参考价值。
前面的文章《数据中台产品链》一文中
提到了结果数据库与应用数据库
这两类数据库从大数据理念上
都可称为数据仓库
接下来给大家分享一下
数据仓库的常用术语
让你与专业的大牛进行无障碍沟通
01
数据仓库 Data Warehouse
数据仓库,英文名称为Data Warehouse,可简写为DW。数据仓库是一个支持管理决策的数据集合。数据是面向主题的、集成的、不易丢失的并且是时变的。
02
数据集市 Data marketplace
为了特定的应用目的或应用范围,而从数据仓库中独立出来的一部分经过加工过的维度数据,也可称为部门数据或主题数据;
03
ETL
ETL是Extraction-Transformation-Loading的缩写,中文名称是数据提取、转换和加载。ETL是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据, ETL是BI(商业智能)项目重要的一个环节;
04
切片 Slice
一种用来在数据仓库中将一个维度中的分析空间限制为数据子集的技术。
05
切块 Dice
一种用来在数据仓库中将多个维度中的分析空间限制为数据子集的技术。
06
维度 Dimension
维度是用来反映业务的一类属性,这类属性的集合构成一个维度。例如,某个地理维度可能包括国家、地区、省、市、区县、街道、小区的级别。一个时间维度可能包括年、季、月、周、日、时分秒的级别。
07
粒度 Granularity
粒度将直接决定所构建仓库系统能够提供决策支持的细节级别。粒度越高表示仓库中的数据较粗,反之,较细。粒度是与具体指标相关的,具体表现在描述此指标的某些可分层次维的维值上。例如,办件量这个指标,从时间维度提供分析决策,时间可以分成年、季、月、周、日等。
08
度量值 Metricvalue
在多维数据集中,度量值是一组值,这些值基于多维数据集的事实数据表中的一 列,而且通常为数字。此外,度量值是所分析的多维数据集的中心值。即,度量值是最终用户浏览多维数据集时重点查看的数字数据(如成本、办件量、收益)。所选择的度量值取决于最终用户所请求的信息类型。
09
联机分析处理(OLAP Online Analytical Processing )
联机分析处理简称OLAP,它是一种多维分析技术,用来满足决策用户在大量的业务数据中,从多角度探索业务活动的规律性、市场的运作趋势的分析需求,并辅助他们进行战略发展决策的制定。按照数据的存储方式分OLAP又分为ROLAP、MOLAP和HOLAP。在客户信息数据仓库CCDW的数据环境下,OLAP提供上钻、下钻、切片、旋转等在线分析机制。完成的功能包括多角度实时查询、简单的数据分析,并辅之于各种图形展示分析结果。
10
星型模式
它是数据仓库应用程序的最佳设计模式。它的命名是因其在物理上表现为中心实体,典型内容包括指标数据、辐射数据,通常是有助于浏览和聚集指标数据的维度。星形图模型得到的结果常常是查询式数据结构,能够为快速响应用户的查询要求提供最优的数据结构。星形图还常常产生一种包含维度数据和指标数据的两层模型。
11
雪花模式
它指一种扩展的星形图。星形图通常生成一个两层结构,即只有维度和指标,雪花图生成了附加层。实际数据仓库系统建设过程中,通常只扩展三层:维度(维度实体)、指标(指标实体)和相关的描述数据(类目细节实体)超过三层的雪花图模型在数据仓库系统中应该避免。因为它们开始像更倾向于支持OLTP应用程序的规格化结构,而不是为数据仓库和OLAP应用程序而优化的非格式化结构。
文字:Andy
编辑:Andy | 审核:李江
转载请注明出处
<END>
扫码关注 探讨数据的奥秘
以上是关于数据仓库术语介绍的主要内容,如果未能解决你的问题,请参考以下文章
数据仓库 - OLAP vs OLTP vs 维度模型 vs 关系模型