大数据概念解析:分布式存储与数据库
Posted 驾驭大数据查询
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了大数据概念解析:分布式存储与数据库相关的知识,希望对你有一定的参考价值。
大数据技术当中,在海量数据的存储环节,涉及到两个重要的概念,就是分布式数据存储与数据库,稳定高效安全的数据存储,才能为后续的计算分析环节,提供稳固的支持。今天的大数据概念解析,我们来讲讲分布式存储与数据库。
进入大数据时代,数据特征发生了明显的变化,数据规模大、非结构化/半结构化的数据多,使得大数据存储本身也需要克服很多的问题。
要实现大规模数据的计算分析加工等问题,对于企业而言,需要通过各种手段来解决相关的问题,比如说通过优化存储基础设施,或者搭建高性能的大数据存储框架等等。
海量数据的存储任务,针对于不同的应用场景,往往需要因地制宜地选择存储方案,因此有了对象存储、块存储、文件系统存储等。
分布式文件/对象存储系统
分布式存储系统面向海量数据的存储访问与共享需求,提供基于多存储节点的高性能,高可靠和可伸缩性的数据存储和访问能力,实现分布式存储节点上多用户的访问共享。
目前业界比较流行的分布式存储系统包括:HDFS、OpenStack Swift、Ceph、GlusterFS、Lustre、AFS、OSS等。
分布式关系型数据库
关系型数据库是建立在关系模型基础上的数据库,借助于集合代数等数学概念和方法来处理数据库中的数据。
目前业界比较流行的分布式关系型数据库包括:DRDS、TiDB、GreenPlum、Cobar、Aurora、Mycat等。
分析型数据库
分析数据库是面向分析应用的数据库,与传统的数据库不同,它可以对数据进行在线统计、数据在线分析、即席查询等发掘信息数据价值的工作。
目前业界比较流行的分析型数据库包括:Kylin、AnalyticDB、Druid、Clickhouse、Vertica、MonetDB、InfiniDB、LucidDB等。
图数据库
图数据库的基本含义是以“图”这种数据结构存储和查询数据,而不是存储图片的数据库。
目前业界比较流行的图数据库包括:Titan、Neo4J、ArangoDB、OrientDB、MapGraph、ALLEGROGRAPH等。
列存储数据库
列式数据库是以列相关存储架构进行数据存储的数据库,主要适合于批量数据处理和即时查询。
目前业界比较流行的列存储数据库包括:Phoenix、Cassandra、Hbase、Kudu、Hypertable等。
文档数据库
文档型数据库是NoSQL中非常重要的一个分支,它主要用来存储、索引并管理面向文档的数据或者类似的半结构化数据。
目前业界比较流行的文档型数据库包括:MongoDb、CouchDB、OrientDB、MarkLogic等。
键值存储数据库
键值存储(Key-Value)是NoSQL中,数据模型中比较简单的一个了,主要就是用哈希表,通过对于键(Key)的查找来找到特定的数据。
目前业界比较流行的键值存储数据库包括:Redis、Memcached、Tair等。
关于大数据概念解析,分布式存储与数据库,以上就为大家做了一个简单的介绍了。大数据存储环节,涉及到分布式与数据库,是需要重点去掌握的一部分,对于主流的技术架构也需要有相应程度的掌握。
以上是关于大数据概念解析:分布式存储与数据库的主要内容,如果未能解决你的问题,请参考以下文章