尝试使用子查询计算时差时出错

Posted

技术标签:

【中文标题】尝试使用子查询计算时差时出错【英文标题】:Error when trying to use Subquery in calculating time difference 【发布时间】:2019-01-12 00:48:33 【问题描述】:

我跟踪人们在特定页面上花费的时间(我就这个问题提出了几个问题here)。我注册了页面加载的时间('Enter' 事件)。在一个单独的模型中,我注册了所有“退出”:提交表单时,卸载页面时等。这个“退出事件”模型通过 ForeignKey 连接到 EnterEvent 模型,因为一个 Enter 事件可以而且通常确实有几个相应的退出事件。

EXITTYPES = [(0, 'form submitted'), (1, 'page unloaded'), (2, 'client disconnected')]


class EnterEvent(models.Model):
    page_name = models.CharField(max_length=1000)
    user = models.ForeignKey(to=User, related_name='enters')
    timestamp = models.DateTimeField()
    closed = models.BooleanField(default=False)


class ExitEvent(models.Model):
    enter_event = models.ForeignKey(to=EnterEvent, related_name='exits')
    timestamp = models.DateTimeField()
    exit_type = models.IntegerField(choices=EXITTYPES)

为了计算用户在页面上花费的时间,我使用了以下正常工作的代码:

def get_time_per_page(user, page_name):
    earliest = ExitEvent.objects.filter(enter_event=OuterRef('pk')).order_by('timestamp')
    delta = timedelta(days=1)

    a = EnterEvent.objects.filter(closed=True,
                                  user=user,
                                  page_name=page_name).annotate(
        earliest_exit=Subquery(earliest.values('timestamp')[:1]),
    ).values()
    sum_diff = sum([i['earliest_exit'] - i['timestamp'] for i in a], timedelta())

    return sum_diff

但是,当我尝试在以下注释查询中使用子查询的结果时,它会失败:

b = EnterEvent.objects.filter(closed=True,
                              participant=player.participant,
                              page_name=page_name).annotate(
    earliest_exit=Subquery(earliest.values('timestamp')[:1]),
).annotate(timespent=ExpressionWrapper(F('earliest_exit') - F('timestamp'), output_field=DurationField()))

错误日志:

Exception Type: TypeError
Exception Value: can only concatenate tuple (not "list") to tuple
Exception Location: /Users/chapkovski/otree2/lib/python3.6/site-packages/django/db/backends/sqlite3/operations.py in subtract_temporals, line 280

我做错了什么?

更新:::

当 Django 尝试减去两个日期时会导致错误,其中一个是由子查询产生的。 这特别是由于来自“正常”字段的参数是一个元组,而子查询返回一个列表,所以当 Django(在subtract_temporals 函数中)尝试对这两者求和时会导致错误:

 internal_type   'DateTimeField'
 lhs_params  ()
 rhs_params  []

【问题讨论】:

有趣的是,添加工作。但是,不是减法。 【参考方案1】:

这个月我两次遇到这个问题,最后我得到了一个对我有用的破解方法。我想在 QuerySet 中进行计算,这样我就可以从数据库排序中受益,而当用户想要按持续时间字段排序时,我不必编写自定义排序。

所以我找到的解决方案是通过子查询对两列进行注释,因此最终结果将是两列在内部都是一个列表,因此 Django 将成功连接/正确计算持续时间,而不会产生 ValueError 异常。

这是使用您的代码的示例:

from django.db.models import Subquery, OuterRef, F, ExpressionWrapper, DurationField

earliest = ExitEvent.objects.filter(enter_event=OuterRef('pk')).order_by('timestamp')
enter_timestamp = EnterEvent.objects.filter(pk=OuterRef('pk')).annotate(enter_timestamp=F('timestamp'))

EnterEvent.objects.filter(closed=True, participant=player.participant, page_name=page_name) \
    .annotate(earliest_exit=Subquery(earliest.values('timestamp')[:1])) \
    .annotate(enter_timestamp=Subquery(enter_timestamp.values('enter_timestamp')[:1])) \
    .annotate(timespent=ExpressionWrapper(F('earliest_exit') - F('enter_timestamp'), output_field=DurationField()))

【讨论】:

【参考方案2】:

做到了。它正在工作。

在子查询中使用 output_field=DurationField() 而不是 DateTimeField()。并在减去两个字段时使用 output_field=DurationField() 添加 ExpressionWrapper。

ModelA.objects.filter()\
.annotate(jct=Subquery(ModelB.objects.filter(model_a_id=OuterRef('pk')).values_list('created_at',flat=True)[:1], output_field=DurationField()))\
.annotate(ans=ExpressionWrapper(F('jct') - F('created_at'), output_field=DurationField()))

【讨论】:

以上是关于尝试使用子查询计算时差时出错的主要内容,如果未能解决你的问题,请参考以下文章

使用子查询时出错

尝试将子表单记录源设置为 sql 查询时出错

使用子查询对房间价格求和时出错

创建函数时出错 - 如果不使用 EXISTS 引入子查询,则选择列表中只能指定一个表达式

使用 SQL Server 将子查询结果重用于其他计算

Hive 子查询出错 - 不支持的子查询表达式