在Hive中,如何将string 类的 时间戳,转换成日期?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了在Hive中,如何将string 类的 时间戳,转换成日期?相关的知识,希望对你有一定的参考价值。

比如1396277350724是一个UNIX时间戳,但是载入表中是以string类,现在我想用日期查询某时间点的数据,应该如何操作。

from_unixtime(bigint unixtime[, string format])转换成日期格式,如果需要制定是日期可以在这个基础上套一层to_date(from_unixtime())追问

还要一个问题,现在我想查询一个时间点附近2小时的数据,我该如何实现?
比如,1396277350724时间戳我有了, 我也用from_unixtime 转换成了 string的日期格式了。我想找这个时间附近2小时的语句Hive语句应该如何写呢? 谢谢。

参考技术A hive是没法修改的,只有把数据读出来,然后建表,以时间戳的字段类型,然后再将数据写进去。 参考技术B 你在这个时间加7200秒和减7200秒范围内就行了

hive中如何将13位bigint类型的时间戳的转化为毫秒标准时间格式

首先,我们先了解13位时间戳13位的时间戳其实数据的时间单位就是ms。基于此我们来分析问题原因和实现方式。

要点:

13位时间戳因为时间单位为毫秒所以我们可以很容易知道转化成标准毫秒时间格式毫秒部分必然与13位时间戳一致。

举个例子方便大家理解。

bigint(13)1571709884123
毫秒时间标准格式:2019-10-22 10:22:44.123

解决方案:

首选方案:

那么就此我们开始分析我们该如何实现,首先容易想到的就是hive中默认的转换函数FROM_UNIXTIME(unix_timestamp/1000,format)。我们知道unix_timestamp时间戳的精度默认为s,而我们要转为ms所以将unix_timestamp/1000来将单位转换为ms。format我们设置成时间格式'yyyy-MM-dd HH:dd:ss.sss'为毫秒。

SELECT FROM_UNIXTIME(1571709884123/1000,'yyyy-MM-dd HH:dd:ss.sss');

2019-10-22 10:22:44.044

说明:13位的整型除以1000等于时间戳timestamp单位才是毫秒,将时间戳类型转化为日期类型使用from_unixtime
FROM_UNIXTIME(unix_timestamp/1000,format)参数介绍:
unix_timestamp :单位为秒
unix_timestamp/1000:单位为毫秒。
formatyyyy-MM-dd HH:dd:ss.sss(毫秒)、yyyy-MM-dd HH:dd:ss(秒)、yyyy-MM-dd(日期)等

我们发现毫秒值在转换时毫秒部分并不准确。这是什么原因呢?笔者经过调研发现可能为如下原因造成。

原因:Javadate默认精度是毫秒,由date转换成的时间戳是13位的,而c,php生成的时间默认就是10位的,精度是

方案调整:

由于hive本身自带的时间戳转换函数毫秒存在精度问题无法使用,所以我们需要想办法解决毫秒部分的精度问题。由此我们发现只有毫秒部分存在问题而秒及以上的部分是没有问题,所以我们使用FROM_UNIXTIME(unix_timestamp/1000,format)函数并将毫秒部分拼接在from_unixtime函数结果之后。

select
    concat(t,".",substring(1571709884123,11,13))
from(
select from_unixtime(cast(substring(1571709884123,0,10) as bigint),'yyyy-MM-dd HH:dd:ss') as t
)tmp;

执行结果如下:

扩展:

如果想转换成"yyyy-MM-dd HH:dd:ss",需要将13位时间戳转换成11位时间戳,注意转换过程中函数入参数据类型

以上是关于在Hive中,如何将string 类的 时间戳,转换成日期?的主要内容,如果未能解决你的问题,请参考以下文章

Hive日期格式转换详解(包含13位时间戳转毫秒时间)

如何在 Hive 中使用正则表达式来解析 Apache 日志时间戳?

如何将 Hive 表中的所有时间戳转换为 EAT

Hive时间操作[转]

时间戳以字符串类型(带有小数点)存储在hive里,现在要把时间戳字段转换成时间,要用啥函数,求转换!

Hive日期函数处理