hive导出到rds 时间字段string

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了hive导出到rds 时间字段string相关的知识,希望对你有一定的参考价值。

参考技术A 1、粘贴就能用。获取基础时间数据(注意我的数据是导出到桌面上,你可以导出到HDFS上也可以请细看代码注释)。
2、上传文件到Linux建表转存到Hive中。
3、建时间维度表。
4、经过Hsql时间函数转换得到各种各样的时间导入数据到Hive的时间维表中。
5、检查数据。
6、mysql建表,使用sqoop导出数据。
7、检查Mysql数据即可导出时间字段string。

Sqoop导出Hive数据到Mysql时异常问题解决

Sqoop导出Hive数据到Mysql时异常问题解决

报错信息如下:

原因:

  1. 报错信息显示:NumberFormatException,初步判断是数据类型,检测Mysql与Hive的建表语句,确认无误,于是手动将Mysql所有字段类型改为varchar,发现DT字段从建表语句之前跑到了后面
  2. 当前数据库采用mysql8.0+,之前导数时采用的是mysql5.7,可能是sqoop的bug

解决方案:
因为sqoop不再维护,因此有两种方案
3. 更换导数组件,不使用sqoop,采用datax/spark/flink等
4. 添加参数 columns 字段,将导出的每张表字段进行固定

# 示例
hive_db_name=hive_db
mysql_db_name=mysql_db

export_data() 
$SQOOP_HOME export \\
--connect "jdbc:mysql://hdp:3306/$mysql_db_name?useUnicode=true&characterEncoding=utf-8"  \\
--username username\\
--password passward\\
--table $1 \\
--num-mappers 1 \\
--export-dir /datawarehouse/$hive_db_name/ads/$1 \\
--input-fields-terminated-by "\\t" \\
--update-mode allowinsert \\
--update-key $2 \\
--input-null-string '\\\\N'    \\
--input-null-non-string '\\\\N' \\
--columns $3

case $1 in
  "adsIT_traffic_web_pv" )
    export_data "ads_table1" "dt,Column1" "dt,Column1,Column2,Column3"
  ;;
  "adsIT_traffic_product_downloadInstallActivateCount" )
    export_data "ads_table2" "dt" "dt,Column1,Column2,Column3.."
  ;;
"all" )
    export_data "ads_table1" "dt,Column1" "dt,Column1,Column2,Column3"
    export_data "ads_table2" "dt" "dt,Column1,Column2,Column3.."
    ...省略
  ;;
esac

以上是关于hive导出到rds 时间字段string的主要内容,如果未能解决你的问题,请参考以下文章

hive 导出数据到本地

hive之表属性操作

数据仓库 数据可视化 Hive导出到MySql

Sqoop导出Hive数据到Mysql时异常问题解决

Sqoop导出Hive数据到Mysql时异常问题解决

Sqoop导出Hive数据到Mysql时异常问题解决