大数据框架小组自学(第三周)

Posted In big data learning

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了大数据框架小组自学(第三周)相关的知识,希望对你有一定的参考价值。

一·Hadoop集群中的Hbase

      1·  本周我们小组成员开始逐步依靠第一个hadoop集群在个个成员的电脑里转移安装hadoop框架。部分小组成员安装了Hadoop框架的Hbase。并且开始学习Hbase数据库的使用。

       2· HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。

        3 ·上图描述了Hadoop EcoSystem中的各层系统,其中HBase位于结构化存储层,Hadoop HDFS为HBase提供了高可靠性的底层存储支持,Hadoop MapReduce为HBase提供了高性能的计算能力,Zookeeper为HBase提供了稳定服务和failover机制。

 

4·使用Habase shell创建表

 二·查找数据集

查找到一个有关青少年疾病的数据集

 三·开始Java的学习

HBase是一个开源的非关系型分布式数据库,实现的编程语言为Java。所以小组成员开始学习Java。

四·遇到的困难

1·小组其他成员电脑中转移hadoop是发现节点缺少的问题,使用了一些教程比如初始化hdfs等均无效。

2·数据源查找困难 。想要的数据集基本都有权限设置。

以上是关于大数据框架小组自学(第三周)的主要内容,如果未能解决你的问题,请参考以下文章

自学大数据第十天~Hbase

自学it18大数据笔记-第二阶段HBase-day3——会持续更新……

自学it18大数据笔记-第二阶段HBase-day5——会持续更新……

云HBase小组成功抢救某公司自建HBase集群,挽救30+T数据

如何自学大数据 自学大数据方法

第三周大数据学习进度