importSTV的使用

Posted 曹军

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了importSTV的使用相关的知识,希望对你有一定的参考价值。

一:由HDFS将数据直接导入到HBase中

1.生成TSV文件

  

 

2.内容

  

 

3.上传到HDFS

   

 

4.运行

  export HBASE_HOME=/etc/opt/modules/hbase-0.98.6-hadoop2
  export HADOOP_CLASSPATH=`$HBASE_HOME/bin/hbase mapredcp`
  export HADOOP_HOME=/etc/opt/modules/hadoop-2.5.0

  $HADOOP_HOME/bin/yarn jar lib/hbase-server-0.98.6-hadoop2.jar importtsv  -Dimporttsv.columns=HBASE_ROW_KEY,info:age,info:name,info:sex  nstest1:tb1  /imp/import.tsv

  重要的是:

    )HBASE_ROW_KEY

    )info:name,等都要和import.tsv相对应

    )目录是HDFS的目录

    )表名是将要书写进去的表名

 

5.结果

  

 

二:将数据转换为HFile

1.将数据转为HFile

  hbase-0.98.6-hadoop2]$ $HADOOP_HOME/bin/yarn jar lib/hbase-server-0.98.6-hadoop2.jar importtsv  -Dimporttsv.bulk.output=/impout -Dimporttsv.columns=HBASE_ROW_KEY,info:age,info:name,info:sex  nstest1:tb2  /imp/import.tsv  

  其中:nstest1:tb2的作用是按照这个表的格式进行转换HFile

  /impout 是HFile的路径。

  

2.将HFile保存进HBase

  $HADOOP_HOME/bin/yarn jar lib/hbase-server-0.98.6-hadoop2.jar   completebulkload  /impout nstest1:tb2

  

3.结果

  HDFS中的HFile数据不再存在

  

 

  HBase的结果

   

 

三:自定义分隔符

1.新定义文件

  

 

2.删除以前的文件,再重新上传文件

3.运行

   $HADOOP_HOME/bin/yarn jar lib/hbase-server-0.98.6-hadoop2.jar importtsv -Dimporttsv.separator=,

-Dimporttsv.columns=HBASE_ROW_KEY,info:age,info:name,info:sex nstest1:tb2 /imp/import.tsv

3.结果

  

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  

以上是关于importSTV的使用的主要内容,如果未能解决你的问题,请参考以下文章

使用“使用严格”作为“使用强”的备份

在使用加载数据流步骤的猪中,使用(使用 PigStorage)和不使用它有啥区别?

Sqlmap的使用

Kettle java脚本组件的使用说明(简单使用升级使用)

PageHelp的使用getParameter的使用zpage-nav的使用QRcode的使用wxpay微信支付的使用jackson-xml数据的转换

hbs使用手册