redshift 删除时间戳为星期六的记录

Posted

技术标签:

【中文标题】redshift 删除时间戳为星期六的记录【英文标题】:redshift delete records with timestamp of saturday 【发布时间】:2016-08-18 11:23:49 【问题描述】:

大家好,我是红移新手,需要帮助 要求是使用工作日为星期六的 dw_created_date 从表中删除记录。 请帮忙

【问题讨论】:

【参考方案1】:

我还没有使用过 Amazon Redshift,但是在阅读了 documentation 之后,您应该可以使用以下方式找到您的记录:

SELECT *, to_char(dw_created_date, 'D') dayofweek FROM table

“dayofweek”中的数字 6 表示星期六,因此这将删除记录:

DELETE FROM table WHERE to_char(dw_created_date, 'D') = 6

祝你好运!

【讨论】:

很高兴听到!而且我可以推荐阅读更多文档,也会有一些更有趣的主题可供阅读!【参考方案2】:

Amazon Redshift 函数TO_CHAR 允许您从 Redshift 中提取日期部分以及有关日期和时间戳的信息,并获取日期部分。

您可以找到有关TO_CHAR function here 的信息。

为了从 TO_CHAR 函数中提取您需要的信息,您需要使用适当的日期时间格式字符串。例如,“D”返回星期几号,DY 返回工作日名称的缩写,DAY 提供完整的完整拼写的工作日名称。

您可以找到有关date time format strings for Redshift here的信息。

下面我提供了一个快速的 sn-p 代码,它显示了 TO_CHAR 函数的工作原理。

create table tba (colint integer, colts timestamp) distkey (colint) sortkey (colts);
insert into tba (colint, colts) values (1, '2016-08-08 08:08:08');
insert into tba (colint, colts) values (1, '2016-08-09 09:09:09');
insert into tba (colint, colts) values (1, '2016-08-10 10:10:10');
insert into tba (colint, colts) values (1, '2016-08-11 10:11:11');
insert into tba (colint, colts) values (12, '2016-08-12 12:12:12');
insert into tba (colint, colts) values (13, '2016-08-13 13:13:13');
insert into tba (colint, colts) values (14, '2016-08-14 14:14:14');
insert into tba (colint, colts) values (15, '2016-08-15 15:15:15');
insert into tba (colint, colts) values (16, '2016-08-16 16:16:16');
insert into tba (colint, colts) values (17, '2016-08-17 17:17:17');
insert into tba (colint, colts) values (18, '2016-08-18 18:18:18');
insert into tba (colint, colts) values (20, '2016-08-20 20:20:20');
insert into tba (colint, colts) values (6, '2016-08-06 06:06:06');
select *
, to_char(colts,'D') day_of_week_number 
, to_char(colts,'DAY') day_of_week_name 
, to_char(colts,'DY') day_of_week_abbrev
from tba;

 colint |        colts        | day_of_week_number | day_of_week_name | day_of_week_abbrev 
--------+---------------------+--------------------+------------------+--------------------
     15 | 2016-08-15 15:15:15 | 2                  | MONDAY           | MON
     16 | 2016-08-16 16:16:16 | 3                  | TUESDAY          | TUE
     18 | 2016-08-18 18:18:18 | 5                  | THURSDAY         | THU
      1 | 2016-08-08 08:08:08 | 2                  | MONDAY           | MON
      1 | 2016-08-09 09:09:09 | 3                  | TUESDAY          | TUE
      1 | 2016-08-10 10:10:10 | 4                  | WEDNESDAY        | WED
      1 | 2016-08-11 10:11:11 | 5                  | THURSDAY         | THU
     12 | 2016-08-12 12:12:12 | 6                  | FRIDAY           | FRI
     13 | 2016-08-13 13:13:13 | 7                  | SATURDAY         | SAT
     14 | 2016-08-14 14:14:14 | 1                  | SUNDAY           | SUN
     17 | 2016-08-17 17:17:17 | 4                  | WEDNESDAY        | WED
     20 | 2016-08-20 20:20:20 | 7                  | SATURDAY         | SAT
      6 | 2016-08-06 06:06:06 | 7                  | SATURDAY         | SAT
(13 rows)

最后但并非最不重要的一点是,如果您是 Redshift 新手,您应该注意两件非常重要的事情。每次删除或更新大量数据时,您应该始终做两件事:

    VACUUM - 当“删除”或“更新”数据时,Amazon Redshift 会“逻辑”删除数据。因此,如果您更改了大量记录,您应该运行vacuum 以从表中物理删除数据。我的“经验法则”是每当超过 5% 的数据被删除或更新时,就该运行VACUUM。您应该运行诸如vacuum full tab; 之类的命令。 You can find more info about VACUUM here. ANALYZE- Amazon Redshift 依赖于表数据和分布的准确统计数据来创建最有效的查询计划。如果您删除、插入或更改数据的“重要”部分。您应该在表上运行ANALYZE 命令以确保数据库具有最新的统计信息。示例命令是 ANALYZE VERBOSE TBA; 。 You can find more information about ANALYZE here.

【讨论】:

以上是关于redshift 删除时间戳为星期六的记录的主要内容,如果未能解决你的问题,请参考以下文章

Redshift 是不是存储上次访问的时间戳?

mongoose schema 设置更新时间戳为unix时间

mongoose schema 设置更新时间戳为unix时间

mongoose schema 设置更新时间戳为unix时间

mongoose schema 设置更新时间戳为unix时间

Redshift sql根据某个记录之前的时间戳识别记录