如何从日期范围查询中查找表中的一组缺失日期

Posted

技术标签:

【中文标题】如何从日期范围查询中查找表中的一组缺失日期【英文标题】:How to find a set of missing dates in a table from date range query 【发布时间】:2012-12-17 05:32:37 【问题描述】:

有一些与我的问题相关的 *** 帖子,但不是全部相似。

我想要一个高效且有点优雅(如果可能)的解决方案,以便在将用户指定的日期范围与 postgresql 中的汇总表进行比较后获取缺失日期的数组。我知道的一种方法是将范围放入日期列表中,然后通过查询 EXIST 或 if result == nil?/empty? 等单独与所有日期进行比较。但是如果用户要做一个大范围,这可能会消耗资源并且速度很慢。

除了目前列出的方法之外,还有其他方法吗?

谢谢

【问题讨论】:

【参考方案1】:

首先,我们需要对日期进行排序。在 ruby​​ 中,这很简单

sorted_dates = dates.sort

如果您知道日期已排序,则只需从第一个日期开始,并在您遍历日期范围时递增一个。如果您的数组中的下一个日期不是您预期的日期,请将缺少的日期添加到您的 missing_dates 数组中,并继续递增直到您到达包含的日期。

此代码可能如下所示:

def find_missing_dates(sorted_dates)
  current_date = sorted_dates[0]
  missing_dates = Set.new
  sorted_dates.each do |date|
    while current_date != date
      missing_dates << current_date
      current_date += 1.day
    end
    current_date += 1.day
  end
end

对于一般情况,这是 O(N),因此为了提高效率,我们可以一分为二并递归。

def dates_between(lower, upper)
  (lower..upper).to_a - [lower,upper]
end

def find_missing_dates(sorted_dates, missing_dates = Set.new)
    min_date = sorted_dates[0]
    max_date = sorted_dates[-1]
    if (min_date - max_date).to_i == (sorted_dates.count - 1)
      missing_dates
    else
      middle_date_lower = sorted_dates[sorted_dates.count / 2 - 1]
      middle_date_upper = sorted_dates[sorted_dates.count / 2]
      unless (middle_date_upper - middle_date_lower) == 1
        missing_dates.merge(dates_between(middle_date_lower, middle_date_upper))
      end
      find_missing_dates(sorted_dates[0..(sorted_dates.count/2 - 1)], missing_dates).merge(find_missing_dates(sorted_dates[(sorted_dates.count/2)..-1]))
    end
end

find_missing_dates(sorted_dates)

这仍然是最坏情况 O(N),但平均情况是 O(log N)

【讨论】:

以上是关于如何从日期范围查询中查找表中的一组缺失日期的主要内容,如果未能解决你的问题,请参考以下文章

SQL如何编写返回缺失日期范围的查询?

从 Redshift 中的表中获取缺失的日期

从 Postgres 中的非结束日期范围列表中查找未覆盖的日期范围

Oracle Join 表与第一个表中的日期范围和第二个表中的日期

如何使用查询在 mysql 数据库中插入日期范围?

SQL从日期范围内的同一表中的不同记录中获取多个项目的总和(ORACLE)