redshift 删除时间戳为星期六的记录
Posted
技术标签:
【中文标题】redshift 删除时间戳为星期六的记录【英文标题】:redshift delete records with timestamp of saturday 【发布时间】:2016-08-18 11:23:49 【问题描述】:大家好,我是红移新手,需要帮助 要求是使用工作日为星期六的 dw_created_date 从表中删除记录。 请帮忙
【问题讨论】:
【参考方案1】:我还没有使用过 Amazon Redshift,但是在阅读了 documentation 之后,您应该可以使用以下方式找到您的记录:
SELECT *, to_char(dw_created_date, 'D') dayofweek FROM table
“dayofweek”中的数字 6 表示星期六,因此这将删除记录:
DELETE FROM table WHERE to_char(dw_created_date, 'D') = 6
祝你好运!
【讨论】:
很高兴听到!而且我可以推荐阅读更多文档,也会有一些更有趣的主题可供阅读!【参考方案2】:Amazon Redshift 函数TO_CHAR 允许您从 Redshift 中提取日期部分以及有关日期和时间戳的信息,并获取日期部分。
您可以找到有关TO_CHAR function here 的信息。
为了从 TO_CHAR 函数中提取您需要的信息,您需要使用适当的日期时间格式字符串。例如,“D”返回星期几号,DY 返回工作日名称的缩写,DAY 提供完整的完整拼写的工作日名称。
您可以找到有关date time format strings for Redshift here的信息。
下面我提供了一个快速的 sn-p 代码,它显示了 TO_CHAR 函数的工作原理。
create table tba (colint integer, colts timestamp) distkey (colint) sortkey (colts);
insert into tba (colint, colts) values (1, '2016-08-08 08:08:08');
insert into tba (colint, colts) values (1, '2016-08-09 09:09:09');
insert into tba (colint, colts) values (1, '2016-08-10 10:10:10');
insert into tba (colint, colts) values (1, '2016-08-11 10:11:11');
insert into tba (colint, colts) values (12, '2016-08-12 12:12:12');
insert into tba (colint, colts) values (13, '2016-08-13 13:13:13');
insert into tba (colint, colts) values (14, '2016-08-14 14:14:14');
insert into tba (colint, colts) values (15, '2016-08-15 15:15:15');
insert into tba (colint, colts) values (16, '2016-08-16 16:16:16');
insert into tba (colint, colts) values (17, '2016-08-17 17:17:17');
insert into tba (colint, colts) values (18, '2016-08-18 18:18:18');
insert into tba (colint, colts) values (20, '2016-08-20 20:20:20');
insert into tba (colint, colts) values (6, '2016-08-06 06:06:06');
select *
, to_char(colts,'D') day_of_week_number
, to_char(colts,'DAY') day_of_week_name
, to_char(colts,'DY') day_of_week_abbrev
from tba;
colint | colts | day_of_week_number | day_of_week_name | day_of_week_abbrev
--------+---------------------+--------------------+------------------+--------------------
15 | 2016-08-15 15:15:15 | 2 | MONDAY | MON
16 | 2016-08-16 16:16:16 | 3 | TUESDAY | TUE
18 | 2016-08-18 18:18:18 | 5 | THURSDAY | THU
1 | 2016-08-08 08:08:08 | 2 | MONDAY | MON
1 | 2016-08-09 09:09:09 | 3 | TUESDAY | TUE
1 | 2016-08-10 10:10:10 | 4 | WEDNESDAY | WED
1 | 2016-08-11 10:11:11 | 5 | THURSDAY | THU
12 | 2016-08-12 12:12:12 | 6 | FRIDAY | FRI
13 | 2016-08-13 13:13:13 | 7 | SATURDAY | SAT
14 | 2016-08-14 14:14:14 | 1 | SUNDAY | SUN
17 | 2016-08-17 17:17:17 | 4 | WEDNESDAY | WED
20 | 2016-08-20 20:20:20 | 7 | SATURDAY | SAT
6 | 2016-08-06 06:06:06 | 7 | SATURDAY | SAT
(13 rows)
最后但并非最不重要的一点是,如果您是 Redshift 新手,您应该注意两件非常重要的事情。每次删除或更新大量数据时,您应该始终做两件事:
-
VACUUM - 当“删除”或“更新”数据时,Amazon Redshift 会“逻辑”删除数据。因此,如果您更改了大量记录,您应该运行vacuum 以从表中物理删除数据。我的“经验法则”是每当超过 5% 的数据被删除或更新时,就该运行VACUUM。您应该运行诸如
vacuum full tab;
之类的命令。 You can find more info about VACUUM here.
ANALYZE- Amazon Redshift 依赖于表数据和分布的准确统计数据来创建最有效的查询计划。如果您删除、插入或更改数据的“重要”部分。您应该在表上运行ANALYZE 命令以确保数据库具有最新的统计信息。示例命令是 ANALYZE VERBOSE TBA;
。 You can find more information about ANALYZE here.
【讨论】:
以上是关于redshift 删除时间戳为星期六的记录的主要内容,如果未能解决你的问题,请参考以下文章
mongoose schema 设置更新时间戳为unix时间
mongoose schema 设置更新时间戳为unix时间
mongoose schema 设置更新时间戳为unix时间