大数据框架小组自学(第三周)
Posted In big data learning
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了大数据框架小组自学(第三周)相关的知识,希望对你有一定的参考价值。
一·Hadoop集群中的Hbase
1· 本周我们小组成员开始逐步依靠第一个hadoop集群在个个成员的电脑里转移安装hadoop框架。部分小组成员安装了Hadoop框架的Hbase。并且开始学习Hbase数据库的使用。
2· HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。
3 ·上图描述了Hadoop EcoSystem中的各层系统,其中HBase位于结构化存储层,Hadoop HDFS为HBase提供了高可靠性的底层存储支持,Hadoop MapReduce为HBase提供了高性能的计算能力,Zookeeper为HBase提供了稳定服务和failover机制。
4·使用Habase shell创建表
二·查找数据集
查找到一个有关青少年疾病的数据集
三·开始Java的学习
HBase是一个开源的非关系型分布式数据库,实现的编程语言为Java。所以小组成员开始学习Java。
四·遇到的困难
1·小组其他成员电脑中转移hadoop是发现节点缺少的问题,使用了一些教程比如初始化hdfs等均无效。
2·数据源查找困难 。想要的数据集基本都有权限设置。
以上是关于大数据框架小组自学(第三周)的主要内容,如果未能解决你的问题,请参考以下文章
自学it18大数据笔记-第二阶段HBase-day3——会持续更新……
自学it18大数据笔记-第二阶段HBase-day5——会持续更新……