如何按计算的 属性 的总和对 Django 模型进行排序?
How do I sort Django models by sum of calculated property?
我有两个模型,Project 和 Session。一个项目有多个会话,一个用户有多个项目:
class Project(models.Model):
class Meta:
ordering = [models.functions.Lower("name")]
name = models.CharField(max_length=255)
user = models.ForeignKey(User, on_delete=models.CASCADE)
class Session(models.Model):
start = models.DateTimeField()
end = models.DateTimeField()
timezone = TimeZoneField()
breaks = models.IntegerField(default=0, validators=[MinValueValidator(0)])
project = models.ForeignKey(Project, on_delete=models.CASCADE)
def duration(self):
# returns minutes in (end - start)
我想要一种方法来获取给定用户的所有项目,并按其所有会话的持续时间总和排序。由于 session.duration()
不是数据库字段,而是根据数据库字段计算得出的,因此我无法在单个数据库查询中获取此信息。
我目前的解决方案是:
sessions = Session.objects.filter(project__user=self)
groups = [[a, sum([s.duration() for s in b])] for a, b in groupby(
sessions, key=lambda s: s.project
)]
groups = sorted(groups, key=lambda g: g[1], reverse=True)
return [g[0] for g in groups]
这会在一个查询中获取所有相关会话,但随后我按项目对它们进行分组,这花费的时间太长了——当有大约 100 个项目时大约需要一秒钟。有没有一种方法可以花费更少的时间来完成此任务?理想情况下不需要为每个项目调用数据库?
我正在使用 Django 2.0。
您可以使用注释和聚合来实现这一点。首先,通过更改此行稍微修改 Session 模型:
project = models.ForeignKey(Project, on_delete=models.CASCADE)
对此:
project = models.ForeignKey(Project, related_name='sessions', on_delete=models.CASCADE)
-现在每个 Project
实例都有一个 sessions
字段,它将包含与 Project
.[=31= 相关的所有 Session
的查询集]
您可以获取所有用户的项目并循环遍历每个项目的会话,而不是像现在这样获取所有用户会话:
projects = Project.objects.filter(user=self)
for p in projects:
sessions = p.sessions.all()
然后您可以操作 sessions
查询集,用表达式字段注释它们,例如:
from django.db.models import ExpressionWrapper, F, fields
duration_ = ExpressionWrapper(F('end') - F('start'), output_field=fields.DurationField())
sessions = p.sessions.annotate(d=duration_)
此时 sessions
查询集的每个成员都有一个名为 d
的字段,其中包含相应 Session
的持续时间。
为了对持续时间求和,我们可以使用 Django 查询集的 聚合 功能,如下所示:
from django.db.models import Sum
total = sessions.aggregate(total_duration=Sum('d'))["total_duration"]
我们在第 2 行所做的是从查询集("aggregating" 中创建单个元素,方法是将 [=] 中的所有值相加24=] 字段,并将结果分配给名为 total_duration
的字段。该表达式的结果:
sessions.aggregate(total_duration=Sum('d'))
是一个只有一个键(total_duration
)的dict
,我们从中获取值。
接下来,您可以构建项目和持续时间列表,然后按持续时间对其进行排序,例如像这样:
import operator
plist = []
for p in projects:
sessions = p.sessions.annotate(d=duration_)
total = sessions.aggregate(total_duration=Sum('d'))["total_duration"]
# total holds the sum of this project's sessions
plist.append({'p':p,'total':total})
plist.sort(key=operator.itemgetter('total'))
projects = [item['p'] for item in plist]
总结一下:
import operator
from django.db.models import F, Sum, ExpressionWrapper, fields
duration_ = ExpressionWrapper(F('end') - F('start'), output_field=fields.DurationField())
projects = Project.objects.filter(user=self)
plist = []
for p in projects:
sessions = p.sessions.annotate(d=duration_)
total = sessions.aggregate(total_duration=Sum('d'))["total_duration"]
# total holds the sum of this project's sessions
plist.append({'p':p,'total':total})
plist.sort(key=operator.itemgetter('total'))
projects = [item['p'] for item in plist]
参考:this answer, Django Query Expressions, Django Aggregation
我有两个模型,Project 和 Session。一个项目有多个会话,一个用户有多个项目:
class Project(models.Model):
class Meta:
ordering = [models.functions.Lower("name")]
name = models.CharField(max_length=255)
user = models.ForeignKey(User, on_delete=models.CASCADE)
class Session(models.Model):
start = models.DateTimeField()
end = models.DateTimeField()
timezone = TimeZoneField()
breaks = models.IntegerField(default=0, validators=[MinValueValidator(0)])
project = models.ForeignKey(Project, on_delete=models.CASCADE)
def duration(self):
# returns minutes in (end - start)
我想要一种方法来获取给定用户的所有项目,并按其所有会话的持续时间总和排序。由于 session.duration()
不是数据库字段,而是根据数据库字段计算得出的,因此我无法在单个数据库查询中获取此信息。
我目前的解决方案是:
sessions = Session.objects.filter(project__user=self)
groups = [[a, sum([s.duration() for s in b])] for a, b in groupby(
sessions, key=lambda s: s.project
)]
groups = sorted(groups, key=lambda g: g[1], reverse=True)
return [g[0] for g in groups]
这会在一个查询中获取所有相关会话,但随后我按项目对它们进行分组,这花费的时间太长了——当有大约 100 个项目时大约需要一秒钟。有没有一种方法可以花费更少的时间来完成此任务?理想情况下不需要为每个项目调用数据库?
我正在使用 Django 2.0。
您可以使用注释和聚合来实现这一点。首先,通过更改此行稍微修改 Session 模型:
project = models.ForeignKey(Project, on_delete=models.CASCADE)
对此:
project = models.ForeignKey(Project, related_name='sessions', on_delete=models.CASCADE)
-现在每个 Project
实例都有一个 sessions
字段,它将包含与 Project
.[=31= 相关的所有 Session
的查询集]
您可以获取所有用户的项目并循环遍历每个项目的会话,而不是像现在这样获取所有用户会话:
projects = Project.objects.filter(user=self)
for p in projects:
sessions = p.sessions.all()
然后您可以操作 sessions
查询集,用表达式字段注释它们,例如:
from django.db.models import ExpressionWrapper, F, fields
duration_ = ExpressionWrapper(F('end') - F('start'), output_field=fields.DurationField())
sessions = p.sessions.annotate(d=duration_)
此时 sessions
查询集的每个成员都有一个名为 d
的字段,其中包含相应 Session
的持续时间。
为了对持续时间求和,我们可以使用 Django 查询集的 聚合 功能,如下所示:
from django.db.models import Sum
total = sessions.aggregate(total_duration=Sum('d'))["total_duration"]
我们在第 2 行所做的是从查询集("aggregating" 中创建单个元素,方法是将 [=] 中的所有值相加24=] 字段,并将结果分配给名为 total_duration
的字段。该表达式的结果:
sessions.aggregate(total_duration=Sum('d'))
是一个只有一个键(total_duration
)的dict
,我们从中获取值。
接下来,您可以构建项目和持续时间列表,然后按持续时间对其进行排序,例如像这样:
import operator
plist = []
for p in projects:
sessions = p.sessions.annotate(d=duration_)
total = sessions.aggregate(total_duration=Sum('d'))["total_duration"]
# total holds the sum of this project's sessions
plist.append({'p':p,'total':total})
plist.sort(key=operator.itemgetter('total'))
projects = [item['p'] for item in plist]
总结一下:
import operator
from django.db.models import F, Sum, ExpressionWrapper, fields
duration_ = ExpressionWrapper(F('end') - F('start'), output_field=fields.DurationField())
projects = Project.objects.filter(user=self)
plist = []
for p in projects:
sessions = p.sessions.annotate(d=duration_)
total = sessions.aggregate(total_duration=Sum('d'))["total_duration"]
# total holds the sum of this project's sessions
plist.append({'p':p,'total':total})
plist.sort(key=operator.itemgetter('total'))
projects = [item['p'] for item in plist]
参考:this answer, Django Query Expressions, Django Aggregation