Python3 操作 HDFS

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python3 操作 HDFS相关的知识,希望对你有一定的参考价值。

【第三方包】


【功能】


#encoding: utf-8
#author: walker
#date: 2018-03-17 
#summary: 利用 pyhdfs 重命名 hdfs 文件或目录

import os, sys, time
from pyhdfs import HdfsClient

SrcPath = '/test/xxx'
DstPath = '/test/yyy'
NameNode = 'nn1.example.com:50070,nn2.example.com:50070'


# 将 SrcPath 改名为 DstPath
def Rename(SrcPath, DstPath):
	fs = HdfsClient(hosts=NameNode)
	if not fs.exists(SrcPath):
		print('Error: not found %s' % SrcPath)
		sys.exit(-1)
		
	print('Reanme ... \n%s\n -> \n%s \n' % (SrcPath, DstPath))
	
	fs.rename(SrcPath, DstPath)
	
	
if __name__ == '__main__':
	Rename(SrcPath, DstPath)


*** walker ***




以上是关于Python3 操作 HDFS的主要内容,如果未能解决你的问题,请参考以下文章

scrapy主动退出爬虫的代码片段(python3)

scrapy按顺序启动多个爬虫代码片段(python3)

如何使用 fs.HadoopFileSystem 对 HDFS 文件进行常用操作?

python常用代码片段总结

HDFS的Java客户端操作代码(HDFS的查看创建)

VSCode自定义代码片段——git命令操作一个完整流程