尝试使用子查询计算时差时出错
Posted
技术标签:
【中文标题】尝试使用子查询计算时差时出错【英文标题】:Error when trying to use Subquery in calculating time difference 【发布时间】:2019-01-12 00:48:33 【问题描述】:我跟踪人们在特定页面上花费的时间(我就这个问题提出了几个问题here)。我注册了页面加载的时间('Enter' 事件)。在一个单独的模型中,我注册了所有“退出”:提交表单时,卸载页面时等。这个“退出事件”模型通过 ForeignKey 连接到 EnterEvent 模型,因为一个 Enter 事件可以而且通常确实有几个相应的退出事件。
EXITTYPES = [(0, 'form submitted'), (1, 'page unloaded'), (2, 'client disconnected')]
class EnterEvent(models.Model):
page_name = models.CharField(max_length=1000)
user = models.ForeignKey(to=User, related_name='enters')
timestamp = models.DateTimeField()
closed = models.BooleanField(default=False)
class ExitEvent(models.Model):
enter_event = models.ForeignKey(to=EnterEvent, related_name='exits')
timestamp = models.DateTimeField()
exit_type = models.IntegerField(choices=EXITTYPES)
为了计算用户在页面上花费的时间,我使用了以下正常工作的代码:
def get_time_per_page(user, page_name):
earliest = ExitEvent.objects.filter(enter_event=OuterRef('pk')).order_by('timestamp')
delta = timedelta(days=1)
a = EnterEvent.objects.filter(closed=True,
user=user,
page_name=page_name).annotate(
earliest_exit=Subquery(earliest.values('timestamp')[:1]),
).values()
sum_diff = sum([i['earliest_exit'] - i['timestamp'] for i in a], timedelta())
return sum_diff
但是,当我尝试在以下注释查询中使用子查询的结果时,它会失败:
b = EnterEvent.objects.filter(closed=True,
participant=player.participant,
page_name=page_name).annotate(
earliest_exit=Subquery(earliest.values('timestamp')[:1]),
).annotate(timespent=ExpressionWrapper(F('earliest_exit') - F('timestamp'), output_field=DurationField()))
错误日志:
Exception Type: TypeError
Exception Value: can only concatenate tuple (not "list") to tuple
Exception Location: /Users/chapkovski/otree2/lib/python3.6/site-packages/django/db/backends/sqlite3/operations.py in subtract_temporals, line 280
我做错了什么?
更新:::
当 Django 尝试减去两个日期时会导致错误,其中一个是由子查询产生的。
这特别是由于来自“正常”字段的参数是一个元组,而子查询返回一个列表,所以当 Django(在subtract_temporals
函数中)尝试对这两者求和时会导致错误:
internal_type 'DateTimeField'
lhs_params ()
rhs_params []
【问题讨论】:
有趣的是,添加工作。但是,不是减法。 【参考方案1】:这个月我两次遇到这个问题,最后我得到了一个对我有用的破解方法。我想在 QuerySet 中进行计算,这样我就可以从数据库排序中受益,而当用户想要按持续时间字段排序时,我不必编写自定义排序。
所以我找到的解决方案是通过子查询对两列进行注释,因此最终结果将是两列在内部都是一个列表,因此 Django 将成功连接/正确计算持续时间,而不会产生 ValueError 异常。
这是使用您的代码的示例:
from django.db.models import Subquery, OuterRef, F, ExpressionWrapper, DurationField
earliest = ExitEvent.objects.filter(enter_event=OuterRef('pk')).order_by('timestamp')
enter_timestamp = EnterEvent.objects.filter(pk=OuterRef('pk')).annotate(enter_timestamp=F('timestamp'))
EnterEvent.objects.filter(closed=True, participant=player.participant, page_name=page_name) \
.annotate(earliest_exit=Subquery(earliest.values('timestamp')[:1])) \
.annotate(enter_timestamp=Subquery(enter_timestamp.values('enter_timestamp')[:1])) \
.annotate(timespent=ExpressionWrapper(F('earliest_exit') - F('enter_timestamp'), output_field=DurationField()))
【讨论】:
【参考方案2】:做到了。它正在工作。
在子查询中使用 output_field=DurationField() 而不是 DateTimeField()。并在减去两个字段时使用 output_field=DurationField() 添加 ExpressionWrapper。
ModelA.objects.filter()\
.annotate(jct=Subquery(ModelB.objects.filter(model_a_id=OuterRef('pk')).values_list('created_at',flat=True)[:1], output_field=DurationField()))\
.annotate(ans=ExpressionWrapper(F('jct') - F('created_at'), output_field=DurationField()))
【讨论】:
以上是关于尝试使用子查询计算时差时出错的主要内容,如果未能解决你的问题,请参考以下文章