HBase终于找到好老师了!《HBase进阶》第一期, 搜狗刘俊宏主讲,9月22日开班

Posted 小象

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了HBase终于找到好老师了!《HBase进阶》第一期, 搜狗刘俊宏主讲,9月22日开班相关的知识,希望对你有一定的参考价值。

第一期 9月22日开课,共8周

适用版本:

兼顾所有HBase版本,包括Apache、Hortonworks和CDH发行版,源码分析部分使用0.89-fb或0.94.6。


课程大纲:
当前HBase已经成为相对成熟的分布式开源数据库,网络中的资料不可谓不丰富。本课程会在全面介绍HBase的基础上尽可能加入HBase日常使用与开发的经验,此外对于网上已有详尽资料的部分会避免过多的介绍并给出参考链接。


第一周 浅尝辄止

  1. 什么是HBase——HBase的起源与基本架构

  2. HBase在哪——HBase的获取

  3. 那些莫名的文件——HBase的安装、目录结构以及启动

  4. 操作数据之前——基于HBase shell的DDL操作

  5. 练手——基于Java API的DDL与DML操作


第二周 渐入佳境

  1. 莫名的配置文件——了解原理前HBase常用配置整理

  2. 数据怎么存——官方文档之外的HBase表结构设计建议

  3. 更加高大上——复杂API介绍与举例

  4. 不会Java也要用——Thrift Server及使用

  5. 瞎子摸象——深入理解前的简单运维:HBase Web UI介绍、log的查看、hbck的使用、HBase监控

  6. 乾坤大挪移——数据迁移工具:bulkload、distcp+addTable.rb、Exporter+Importer

  7. 分身––replication配置及原理

学过以上两周的课程后,同学们应该可以将hbase用起来,希望通过先用起来再了解原理,能将反馈提前,提高学习动力。


第三周 知其所以然

  1. 身在庐山——HBase架构具体分析

  2. 换个视角——通过客户端请求处理过程再次了解HBase原理


第四周 运用自如

  1. 很快再相见——根据原理深入理解配置

  2. 奥林匹克精神——性能调优举例

  3. 披荆斩棘方法论——复杂故障处理经验

  4. 披荆斩棘实例——复杂故障处理举例

学过以上两周的课程后,同学们应当对原理有所了解,第三周对原理从两方面进行讲解,第四周通过调优和排错再次重复描述相关原理,希望同学们可以彻底理解。



第五周 源码初探

  1. 众里寻他——源码的获取

  2. 以管窥豹——源码目录结构

  3. 第一眼——常用工具类源码分析举例


第六周 自己动手

  1. META没了——meta表误删

  2. 混乱之治——split导致的region重叠

  3. 不许动——多用户快照扫库

学过以上两周的课程后,同学们应当已经对HBase源码走有了初步的了解,掌握了从meta表与hdfs中提取和处理重要信息。出现严重故障时往往只有持久化数据出错无法通过重启恢复,这对复杂故障恢复,防止数据丢失有重要作用。


第七周 源码分析经验举例

  1. 就是举例——region server源码分析举例



第八周 可借鉴代码分析

  1. 桶——Bucket cache

  2. 高效沟通——RPC框架

学过以上两周的课程后,同学们应当已经掌握大规模代码阅读的基本方法。此外Bucket cache可以进一步应用到ssd缓存或其他项目的缓存设计中。rpc框架可以普遍应用于java的分布式通信中,其中的多路复用的java nio使用方式更是值得大家借鉴。


点击阅读原文进行报名

以上是关于HBase终于找到好老师了!《HBase进阶》第一期, 搜狗刘俊宏主讲,9月22日开班的主要内容,如果未能解决你的问题,请参考以下文章

第五章:大数据 の HBase 进阶

终于知道了Zookeeper在hbase集群中的作用

终于知道了Zookeeper在hbase集群中的作用

大数据技术之HBaseHBase简介HBase快速入门HBase进阶

大数据技术之HBaseHBase简介HBase快速入门HBase进阶

大数据技术之HBaseHBase简介HBase快速入门HBase进阶