利用Python调用HBASE

Posted 2020-09-29

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了利用Python调用HBASE相关的知识，希望对你有一定的参考价值。

利用Python调用HBASE的需要安装thrift hbase-thrift

启动hbase的thrift服务：bin/hbase-daemon.sh start thrift 默认端口是9090

mysql 到hbase的数据同步：

1、put

2、Importtsv

3、编写MapReduce Job导入

4、sqoop

简单code:

#!/usr/bin/env python

#coding=utf-8

import sys

sys.path.append(‘/usr/lib/python2.6/site-packages/hbase‘)

from thrift import Thrift

from thrift.transport import TSocket

from thrift.transport import TTransport

from thrift.protocol import TBinaryProtocol

from hbase import Hbase

from hbase.ttypes import *

import csv

from hbase.ttypes import ColumnDescriptor, Mutation, BatchMutation, TRegionInfo

from hbase.ttypes import IOError, AlreadyExists

######

def client_conn():

transport=TSocket.TSocket("172.16.10.87",9090)

transport=TTransport.TBufferedTransport(transport)

protocol=TBinaryProtocol.TBinaryProtocol(transport)

client=Hbase.Client(protocol)

transport.open()

return client

def __del__():

transport.close()

if __name__=="__main__":

client=client_conn()

#获取表名字

print client.getTableNames()

##创建表

#client.createTable(‘name2‘,[ColumnDescriptor(name="user_id:",maxVersions=1),ColumnDescriptor(name="user_name"),])

#写入数据

client.mutateRow(‘name2‘,‘a1‘,[Mutation(column=‘user_id:1‘,value="1")])

client.mutateRow(‘ca_record‘,‘1‘,[Mutation(column=‘user_id:0‘,value=‘5‘)])

##获取数据

aa=client.getRow(‘name2‘,‘a1‘)

for r in aa:

print ‘row‘,r.row

print ‘\br‘

print ‘value‘,r.columns.get("user_id:1").value

##删除表

#client.disableTable("t1")

#client.deleteTable("t1")

print client.getTableNames()

###获取表的行键值

#print client.scannerGet(client.scannerOpen(‘t2‘,"cmd",["a"]))

print client.scannerGet(client.scannerOpen(‘t2‘,"",["a"])) #当row key为空取第一个

print "------"

print client.getColumnDescriptors(‘t3‘)

#在自己开发环境只要安装好thrift 及hbase-thrift的包，在import的时候不会出问题

本文出自 “DBAspace” 博客，请务必保留此出处http://dbaspace.blog.51cto.com/6873717/1950002

以上是关于利用Python调用HBASE的主要内容，如果未能解决你的问题，请参考以下文章

利用IDA Python静态分析函数调用路径

利用Python 调用turtle函数库绘制奥运五环。

利用python3 调用zabbix接口完成批量加聚合图形（screens)

利用Python实现百度API的调用

如何利用Python调用一些搜索引擎网站？

利用boost将C++携程python可以调用的库