Django ORM 在注释多个聚合列时删除不需要的组

Django ORM remove unwanted Group by when annotate multiple aggregate columns

我想在 Django ORM 中创建类似这样的查询。

SELECT COUNT(CASE WHEN myCondition THEN 1 ELSE NULL end) as numyear
FROM myTable

以下是我写的djang ORM查询

year_case = Case(When(added_on__year = today.year, then=1), output_field=IntegerField())

qs = (ProfaneContent.objects
                    .annotate(numyear=Count(year_case))
                    .values('numyear'))

这是由 django orm 生成的查询。

SELECT COUNT(CASE WHEN "analyzer_profanecontent"."added_on" BETWEEN 2020-01-01 00:00:00+00:00 AND 2020-12-31 23:59:59.999999+00:00 THEN 1 ELSE NULL END) AS "numyear" FROM "analyzer_profanecontent" GROUP BY "analyzer_profanecontent"."id"

所有其他事情都很好,但 django 在最后放置了一个 GROUP BY 导致多行和不正确的答案。我根本不想这样。现在只有一栏,但我会放置更多这样的栏。

根据评论进行编辑 我将使用 qs 变量来获取当前年、月、周的分类值。

更新 根据我得到的评论和答案,让我澄清一下。我只想在数据库端执行此操作(显然使用 Django ORM 而不是 RAW SQL)。它是一个简单的 sql 查询。在 Python 的末尾做任何事情都是低效的,因为数据可能太大了。这就是为什么我希望数据库根据 CASE 条件获取记录总和。 以后我会添加更多这样的列,所以像 len() 或 .count 之类的东西将不起作用。

我只想使用 Django ORM 创建上述查询(没有自动附加的 GROUP BY)。

列表理解怎么样:

# get all the objects
profane = ProfaneContent.objects.all()

# Something like this 
len([pro for pro in profane if pro.numyear=today.year])

如果年数相等,它会将其添加到列表中,因此您可以检查 len()

获取计数

希望对您有所帮助!

这就是我在 SQL 中的写法。

SELECT SUM(CASE WHEN myCondition THEN 1 ELSE 0 END) as numyear
FROM myTable

SELECT 
    SUM(CASE WHEN "analyzer_profanecontent"."added_on" 
                 BETWEEN 2020-01-01 00:00:00+00:00 
                     AND 2020-12-31 23:59:59.999999+00:00 
             THEN 1 
             ELSE 0 
         END) AS "numyear" 
FROM "analyzer_profanecontent" 
GROUP BY "analyzer_profanecontent"."id"

如果您打算在 SELECT 子句中使用其他项目,我建议您也使用 group by,如下所示:

SELECT SUM(CASE WHEN myCondition THEN 1 ELSE 0 END) as numyear
FROM myTable
GROUP BY SUM(CASE WHEN myCondition THEN 1 ELSE 0 END)

如果您只需要汇总一行,那么您应该使用 .aggregate() 方法而不是 annotate()。

result = ProfaneContent.objects.aggregate(
    numyear=Count(year_case),
    # ... more aggregated expressions are possible here
)

您会得到一个简单的结果列字典:

>>> result
{'numyear': 7, ...}

生成的 SQL 查询没有分组,具体要求是:

SELECT
  COUNT(CASE WHEN myCondition THEN 1 ELSE NULL end) as numyear
  -- and more possible aggregated expressions
FROM myTable

在注解中使用聚合时,django 需要进行某种分组,否则默认为主键。所以,你需要在.annotate()之前使用.values()Please see django docs.

但是要完全删除 group by 你可以使用静态值,django 足够聪明,可以完全删除它,所以你可以像这样使用 ORM 查询得到你的结果:

year_case = Case(When(added_on__year = today.year, then=1), output_field=IntegerField())

qs = (ProfaneContent.objects
                    .annotate(dummy_group_by = Value(1))
                    .values('dummy_group_by')
                    .annotate(numyear=Count(year_case))
                    .values('numyear'))