下面列出的条目中,哪些是数据仓库的基本特征
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了下面列出的条目中,哪些是数据仓库的基本特征相关的知识,希望对你有一定的参考价值。
Infobright是一款基于独特的专利知识网格技术的列式数据库。Infobright是开源的mysql数据仓库解决方案,引入了列存储方案,高强度的数据压缩,优化的统计计算(类似sum/avg/group by之类),infobright 是基于mysql的,但不装mysql亦可,因为它本身就自带了一个。mysql可以粗分为逻辑层和物理存储引擎,infobright主要实现的就是一个存储引擎,但因为它自身存储逻辑跟关系型数据库根本不同,所以,它不能像InnoDB那样直接作为插件挂接到mysql,它的逻辑层是mysql的逻辑层加上它自身的优化器。
Infobright特征
优点:
大数据量查询性能强劲、稳定:百万、千万、亿级记录数条件下,同等的SELECT查询语句,速度比MyISAM、InnoDB等普通的MySQL存储引擎快5~60倍。高效查询主要依赖特殊设计的存储结构对查询的优化,但这里优化的效果还取决于数据库结构和查询语句的设计。
存储数据量大:TB级数据大小,几十亿条记录。数据量存储主要依赖自己提供的高速数据加载工具(百G/小时)和高数据压缩比(>10:1)
高数据压缩比:号称平均能够达到 10:1 以上的数据压缩率。甚至可以达到40:1,极大地节省了数据存储空间。高数据压缩比主要依赖列式存储和 patent-pending 的灵活压缩算法.
基于列存储:无需建索引,无需分区。即使数据量十分巨大,查询速度也很快。用于数据仓库,处理海量数据没一套可不行。不需要建索引,就避免了维护索引及索引随着数据膨胀的问题。把每列数据分块压缩存放,每块有知识网格节点记录块内的统计信息,代替索引,加速搜 索。
快速响应复杂的聚合类查询:适合复杂的分析性SQL查询,如SUM, COUNT, AVG, GROUP BY
(1)数据的存储是面向主题的:在操作型系统中,数据集合是以单独的应用程序为中心专门组织存放的,数据是面向应用程序事务的,而数据仓库中数据的是按商业主题存放的,商业主题会随着企业的不同而不同。
(2)数据是集成的:数据仓库的数据是来源于不同的操作型系统,其中文件布局、编码表示方式、命名习惯和度量单位等都有可能不同,还有一些企业除了从操作系统获取内部数据,外部系统数据也是很重要的。
(3)数据的时间特性:操作型系统存储的数据一般包含当前值,反映的是当前信息,而数据仓库中是供分析和决策使用的,决策者必须根据数据趋势进行决策,这不但需要当前数据,也需要历史数据。所以,数据仓库的目的决定了它包含当前数据之外,也必须包含历史数据。数据仓库中的数据结构都包含时间特性对于设计阶段和实现阶段都具有重要意义。
(4)数据的稳定性:操作型系统的数据是实时更新的,数据仓库中的数据在载入之后几乎不会再更新,只要是查询分析使用。
另外,数据仓库中数据粒度与操作型系统中的数据粒度也不一样,在操作型系统中数据存储通常数据非常详细,但是数据仓库中是按不同的粒度层次来存放数据的。本回答被提问者和网友采纳
以上是关于下面列出的条目中,哪些是数据仓库的基本特征的主要内容,如果未能解决你的问题,请参考以下文章