Django ORM 在注释多个聚合列时删除不需要的组
Django ORM remove unwanted Group by when annotate multiple aggregate columns
我想在 Django ORM 中创建类似这样的查询。
SELECT COUNT(CASE WHEN myCondition THEN 1 ELSE NULL end) as numyear
FROM myTable
以下是我写的djang ORM查询
year_case = Case(When(added_on__year = today.year, then=1), output_field=IntegerField())
qs = (ProfaneContent.objects
.annotate(numyear=Count(year_case))
.values('numyear'))
这是由 django orm 生成的查询。
SELECT COUNT(CASE WHEN "analyzer_profanecontent"."added_on" BETWEEN 2020-01-01 00:00:00+00:00 AND 2020-12-31 23:59:59.999999+00:00 THEN 1 ELSE NULL END) AS "numyear" FROM "analyzer_profanecontent" GROUP BY "analyzer_profanecontent"."id"
所有其他事情都很好,但 django 在最后放置了一个 GROUP BY 导致多行和不正确的答案。我根本不想这样。现在只有一栏,但我会放置更多这样的栏。
根据评论进行编辑
我将使用 qs 变量来获取当前年、月、周的分类值。
更新
根据我得到的评论和答案,让我澄清一下。我只想在数据库端执行此操作(显然使用 Django ORM 而不是 RAW SQL)。它是一个简单的 sql 查询。在 Python 的末尾做任何事情都是低效的,因为数据可能太大了。这就是为什么我希望数据库根据 CASE 条件获取记录总和。
以后我会添加更多这样的列,所以像 len() 或 .count 之类的东西将不起作用。
我只想使用 Django ORM 创建上述查询(没有自动附加的 GROUP BY)。
列表理解怎么样:
# get all the objects
profane = ProfaneContent.objects.all()
# Something like this
len([pro for pro in profane if pro.numyear=today.year])
如果年数相等,它会将其添加到列表中,因此您可以检查 len()
获取计数
希望对您有所帮助!
这就是我在 SQL 中的写法。
SELECT SUM(CASE WHEN myCondition THEN 1 ELSE 0 END) as numyear
FROM myTable
SELECT
SUM(CASE WHEN "analyzer_profanecontent"."added_on"
BETWEEN 2020-01-01 00:00:00+00:00
AND 2020-12-31 23:59:59.999999+00:00
THEN 1
ELSE 0
END) AS "numyear"
FROM "analyzer_profanecontent"
GROUP BY "analyzer_profanecontent"."id"
如果您打算在 SELECT 子句中使用其他项目,我建议您也使用 group by,如下所示:
SELECT SUM(CASE WHEN myCondition THEN 1 ELSE 0 END) as numyear
FROM myTable
GROUP BY SUM(CASE WHEN myCondition THEN 1 ELSE 0 END)
如果您只需要汇总一行,那么您应该使用 .aggregate() 方法而不是 annotate()。
result = ProfaneContent.objects.aggregate(
numyear=Count(year_case),
# ... more aggregated expressions are possible here
)
您会得到一个简单的结果列字典:
>>> result
{'numyear': 7, ...}
生成的 SQL 查询没有分组,具体要求是:
SELECT
COUNT(CASE WHEN myCondition THEN 1 ELSE NULL end) as numyear
-- and more possible aggregated expressions
FROM myTable
在注解中使用聚合时,django 需要进行某种分组,否则默认为主键。所以,你需要在.annotate()
之前使用.values()
。 Please see django docs.
但是要完全删除 group by 你可以使用静态值,django 足够聪明,可以完全删除它,所以你可以像这样使用 ORM 查询得到你的结果:
year_case = Case(When(added_on__year = today.year, then=1), output_field=IntegerField())
qs = (ProfaneContent.objects
.annotate(dummy_group_by = Value(1))
.values('dummy_group_by')
.annotate(numyear=Count(year_case))
.values('numyear'))
我想在 Django ORM 中创建类似这样的查询。
SELECT COUNT(CASE WHEN myCondition THEN 1 ELSE NULL end) as numyear
FROM myTable
以下是我写的djang ORM查询
year_case = Case(When(added_on__year = today.year, then=1), output_field=IntegerField())
qs = (ProfaneContent.objects
.annotate(numyear=Count(year_case))
.values('numyear'))
这是由 django orm 生成的查询。
SELECT COUNT(CASE WHEN "analyzer_profanecontent"."added_on" BETWEEN 2020-01-01 00:00:00+00:00 AND 2020-12-31 23:59:59.999999+00:00 THEN 1 ELSE NULL END) AS "numyear" FROM "analyzer_profanecontent" GROUP BY "analyzer_profanecontent"."id"
所有其他事情都很好,但 django 在最后放置了一个 GROUP BY 导致多行和不正确的答案。我根本不想这样。现在只有一栏,但我会放置更多这样的栏。
根据评论进行编辑 我将使用 qs 变量来获取当前年、月、周的分类值。
更新 根据我得到的评论和答案,让我澄清一下。我只想在数据库端执行此操作(显然使用 Django ORM 而不是 RAW SQL)。它是一个简单的 sql 查询。在 Python 的末尾做任何事情都是低效的,因为数据可能太大了。这就是为什么我希望数据库根据 CASE 条件获取记录总和。 以后我会添加更多这样的列,所以像 len() 或 .count 之类的东西将不起作用。
我只想使用 Django ORM 创建上述查询(没有自动附加的 GROUP BY)。
列表理解怎么样:
# get all the objects
profane = ProfaneContent.objects.all()
# Something like this
len([pro for pro in profane if pro.numyear=today.year])
如果年数相等,它会将其添加到列表中,因此您可以检查 len()
获取计数
希望对您有所帮助!
这就是我在 SQL 中的写法。
SELECT SUM(CASE WHEN myCondition THEN 1 ELSE 0 END) as numyear
FROM myTable
SELECT
SUM(CASE WHEN "analyzer_profanecontent"."added_on"
BETWEEN 2020-01-01 00:00:00+00:00
AND 2020-12-31 23:59:59.999999+00:00
THEN 1
ELSE 0
END) AS "numyear"
FROM "analyzer_profanecontent"
GROUP BY "analyzer_profanecontent"."id"
如果您打算在 SELECT 子句中使用其他项目,我建议您也使用 group by,如下所示:
SELECT SUM(CASE WHEN myCondition THEN 1 ELSE 0 END) as numyear
FROM myTable
GROUP BY SUM(CASE WHEN myCondition THEN 1 ELSE 0 END)
如果您只需要汇总一行,那么您应该使用 .aggregate() 方法而不是 annotate()。
result = ProfaneContent.objects.aggregate(
numyear=Count(year_case),
# ... more aggregated expressions are possible here
)
您会得到一个简单的结果列字典:
>>> result
{'numyear': 7, ...}
生成的 SQL 查询没有分组,具体要求是:
SELECT
COUNT(CASE WHEN myCondition THEN 1 ELSE NULL end) as numyear
-- and more possible aggregated expressions
FROM myTable
在注解中使用聚合时,django 需要进行某种分组,否则默认为主键。所以,你需要在.annotate()
之前使用.values()
。 Please see django docs.
但是要完全删除 group by 你可以使用静态值,django 足够聪明,可以完全删除它,所以你可以像这样使用 ORM 查询得到你的结果:
year_case = Case(When(added_on__year = today.year, then=1), output_field=IntegerField())
qs = (ProfaneContent.objects
.annotate(dummy_group_by = Value(1))
.values('dummy_group_by')
.annotate(numyear=Count(year_case))
.values('numyear'))