hive导出到rds 时间字段string
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了hive导出到rds 时间字段string相关的知识,希望对你有一定的参考价值。
参考技术A 1、粘贴就能用。获取基础时间数据(注意我的数据是导出到桌面上,你可以导出到HDFS上也可以请细看代码注释)。2、上传文件到Linux建表转存到Hive中。
3、建时间维度表。
4、经过Hsql时间函数转换得到各种各样的时间导入数据到Hive的时间维表中。
5、检查数据。
6、mysql建表,使用sqoop导出数据。
7、检查Mysql数据即可导出时间字段string。
Sqoop导出Hive数据到Mysql时异常问题解决
Sqoop导出Hive数据到Mysql时异常问题解决
报错信息如下:
原因:
- 报错信息显示:NumberFormatException,初步判断是数据类型,检测Mysql与Hive的建表语句,确认无误,于是手动将Mysql所有字段类型改为varchar,发现DT字段从建表语句之前跑到了后面
- 当前数据库采用mysql8.0+,之前导数时采用的是mysql5.7,可能是sqoop的bug
解决方案:
因为sqoop不再维护,因此有两种方案
3. 更换导数组件,不使用sqoop,采用datax/spark/flink等
4. 添加参数 columns 字段,将导出的每张表字段进行固定
# 示例
hive_db_name=hive_db
mysql_db_name=mysql_db
export_data()
$SQOOP_HOME export \\
--connect "jdbc:mysql://hdp:3306/$mysql_db_name?useUnicode=true&characterEncoding=utf-8" \\
--username username\\
--password passward\\
--table $1 \\
--num-mappers 1 \\
--export-dir /datawarehouse/$hive_db_name/ads/$1 \\
--input-fields-terminated-by "\\t" \\
--update-mode allowinsert \\
--update-key $2 \\
--input-null-string '\\\\N' \\
--input-null-non-string '\\\\N' \\
--columns $3
case $1 in
"adsIT_traffic_web_pv" )
export_data "ads_table1" "dt,Column1" "dt,Column1,Column2,Column3"
;;
"adsIT_traffic_product_downloadInstallActivateCount" )
export_data "ads_table2" "dt" "dt,Column1,Column2,Column3.."
;;
"all" )
export_data "ads_table1" "dt,Column1" "dt,Column1,Column2,Column3"
export_data "ads_table2" "dt" "dt,Column1,Column2,Column3.."
...省略
;;
esac
以上是关于hive导出到rds 时间字段string的主要内容,如果未能解决你的问题,请参考以下文章