hadoop操作

Posted Braveliberty

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了hadoop操作相关的知识,希望对你有一定的参考价值。

1.将文件从本地放到hdfs上

scp /Documents/nearwest.csv [email protected] 10.10.10.140:Documents   //将文件放到集群centos系统上,scp(secure copy),linux下远程复制文件命令

//hadoop是分布式计算框架,有对hdfs的操作接口,所以通过hadoop命令来操作hdfs
hadoop fs -put Documents/nearwest.csv /user/cjj 
//将文件放到对应的hdfs文件系统上,/user/cjj是centos用户对应的文件,两者权限应该是对应的,至于hdfs上其他用户的文件夹,我们可以对其写入,但是可能不能更改(不太了解),说到底还是权限问题
hadoop fs -put
hadoop fs -mkdir

2.hive中创建table

//hive中创建table
create table if not exists nearwestlake_2
(
  vehicle_id varchar(30),
  longi varchar(30),
  lati varchar(30),
  state varchar(30),
  speed_time string
         ) 
  row format delimited fields terminated by ‘,‘
//hive默认的table分隔符是tab,通过最后一句自定义

3.将hdfs表导入hive

//加载数据
load data inpath "hdfs上文件路径" into table 表名
也可以从本地系统文件导入
load data local inpath "  文件" into table 表名

以上是关于hadoop操作的主要内容,如果未能解决你的问题,请参考以下文章

VSCode自定义代码片段15——git命令操作一个完整流程

VSCode自定义代码片段15——git命令操作一个完整流程

VSCode 如何操作用户自定义代码片段(快捷键)

代码片段 - Golang 实现集合操作

Apollo Codegen 没有找到生成代码的操作或片段

操作栏标签片段中的片段?