SQLite SELECT 跨具有重复分组行的多列查询
SQLite SELECT query across multiple columns with duplicate grouped rows
我不完全确定如何将单个 SQLite 查询放在一起来实现以下目标。我可以让点点滴滴的工作,但似乎无法将它们全部融合成一个。
我有一个table是这样的(真实数据集有好几GB):
| ID | ColumnA | ColumnB | ColumnC | ColumnD |
| 1 | 21 | 34 | 10 | 0.12654 |
| 2 | 21 | 34 | 20 | 0.25478 |
| 3 | 21 | 46 | 10 | 0.43564 |
| 4 | 21 | 46 | 20 | 1.02487 |
| 5 | 34 | 21 | 10 | 0.01476 |
| 6 | 34 | 21 | 20 | 0.87265 |
| 7 | 34 | 46 | 10 | 0.46478 |
| 8 | 34 | 46 | 20 | 0.13665 |
| 9 | 46 | 21 | 10 | 0.04189 |
| 10 | 46 | 21 | 20 | 0.91754 |
| 11 | 46 | 34 | 10 | 0.73688 |
| 12 | 46 | 34 | 20 | 0.24299 |
此数据是由我正在执行的某些模拟的嵌套 do-loop 生成的。
从这个 table 中,我基本上需要提取一个如下所示的 table,这样我就可以绘制一个 color/heatmap.
| ID | ColumnA | ColumnB | ColumnC | ColumnD |
| 1 | 21 | 34 | 10 | 0.12654 |
| 3 | 21 | 46 | 10 | 0.43564 |
| 5 | 34 | 21 | 10 | 0.01476 |
| 8 | 34 | 46 | 20 | 0.13665 |
| 9 | 46 | 21 | 10 | 0.04189 |
| 12 | 46 | 34 | 20 | 0.24299 |
因此,这将使我能够使用二维数组基于 ColumnD 值制作颜色图(对角线应设置为零,因为对于给定行,ColumnA 和 ColumnB 的值永远不相等;因此数据为数据库中不存在对角线):
| 21 | 34 | 46
------------------
21 | 0 | |
------------------
34 | | 0 |
------------------
46 | | | 0
我的问题基本上是如何设置单个查询来聚合进入二维数组以生成颜色图的所有数据。
请务必注意,ColumnA 和 ColumnB 基本上由同一组整数填充。我可以使用 DISTINCT 获取唯一的整数值列表。我发现了一些关于跨多个列 selecting DISTINCT 的 SO 线程,但是 none 示例显示了如何使用聚合器来选择其他列中的值。在这种情况下,对于 ColumnA 和 ColumnB 中的每对 id,我想使用 min() 来 select ColumnD 中的最低值。在单个列上选择 DISTINCT 不起作用,因为它是不同的坐标对 (ColumnA,ColumnB)。
如有任何帮助,我们将不胜感激!
您应该能够使用 GROUP BY 子句对要为其整理行并执行聚合计算的字段进行分组:
SELECT ColumnA, ColumnB, Min(ColumnC), Min(ColumnD)
FROM Table1
GROUP BY ColumnA, ColumnB
对我来说,您似乎想要 ColumnA
和 ColumnB
对的最小值 ColumnD
。如果你不关心 id
或 ColumnC
,一个简单的 group by
就足够了:
select ColumnA, ColumnB, min(ColumnD)
from table t
group by ColumnA, ColumnB;
如果您确实需要该行中的所有值,您可以join
返回以获取它们:
select t.*
from table t join
(select ColumnA, ColumnB, min(ColumnD) as ColumnD
from table t
group by ColumnA, ColumnB
) tt
on t.ColumnA = tt.ColumnA and t.ColumnB = tt.ColumnB and
t.ColumnD = tt.ColumnD;
这假设 ColumnD
永远不会与 ColumnA
和 ColumnB
中的值重复。
我不完全确定如何将单个 SQLite 查询放在一起来实现以下目标。我可以让点点滴滴的工作,但似乎无法将它们全部融合成一个。
我有一个table是这样的(真实数据集有好几GB):
| ID | ColumnA | ColumnB | ColumnC | ColumnD |
| 1 | 21 | 34 | 10 | 0.12654 |
| 2 | 21 | 34 | 20 | 0.25478 |
| 3 | 21 | 46 | 10 | 0.43564 |
| 4 | 21 | 46 | 20 | 1.02487 |
| 5 | 34 | 21 | 10 | 0.01476 |
| 6 | 34 | 21 | 20 | 0.87265 |
| 7 | 34 | 46 | 10 | 0.46478 |
| 8 | 34 | 46 | 20 | 0.13665 |
| 9 | 46 | 21 | 10 | 0.04189 |
| 10 | 46 | 21 | 20 | 0.91754 |
| 11 | 46 | 34 | 10 | 0.73688 |
| 12 | 46 | 34 | 20 | 0.24299 |
此数据是由我正在执行的某些模拟的嵌套 do-loop 生成的。
从这个 table 中,我基本上需要提取一个如下所示的 table,这样我就可以绘制一个 color/heatmap.
| ID | ColumnA | ColumnB | ColumnC | ColumnD |
| 1 | 21 | 34 | 10 | 0.12654 |
| 3 | 21 | 46 | 10 | 0.43564 |
| 5 | 34 | 21 | 10 | 0.01476 |
| 8 | 34 | 46 | 20 | 0.13665 |
| 9 | 46 | 21 | 10 | 0.04189 |
| 12 | 46 | 34 | 20 | 0.24299 |
因此,这将使我能够使用二维数组基于 ColumnD 值制作颜色图(对角线应设置为零,因为对于给定行,ColumnA 和 ColumnB 的值永远不相等;因此数据为数据库中不存在对角线):
| 21 | 34 | 46
------------------
21 | 0 | |
------------------
34 | | 0 |
------------------
46 | | | 0
我的问题基本上是如何设置单个查询来聚合进入二维数组以生成颜色图的所有数据。
请务必注意,ColumnA 和 ColumnB 基本上由同一组整数填充。我可以使用 DISTINCT 获取唯一的整数值列表。我发现了一些关于跨多个列 selecting DISTINCT 的 SO 线程,但是 none 示例显示了如何使用聚合器来选择其他列中的值。在这种情况下,对于 ColumnA 和 ColumnB 中的每对 id,我想使用 min() 来 select ColumnD 中的最低值。在单个列上选择 DISTINCT 不起作用,因为它是不同的坐标对 (ColumnA,ColumnB)。
如有任何帮助,我们将不胜感激!
您应该能够使用 GROUP BY 子句对要为其整理行并执行聚合计算的字段进行分组:
SELECT ColumnA, ColumnB, Min(ColumnC), Min(ColumnD)
FROM Table1
GROUP BY ColumnA, ColumnB
对我来说,您似乎想要 ColumnA
和 ColumnB
对的最小值 ColumnD
。如果你不关心 id
或 ColumnC
,一个简单的 group by
就足够了:
select ColumnA, ColumnB, min(ColumnD)
from table t
group by ColumnA, ColumnB;
如果您确实需要该行中的所有值,您可以join
返回以获取它们:
select t.*
from table t join
(select ColumnA, ColumnB, min(ColumnD) as ColumnD
from table t
group by ColumnA, ColumnB
) tt
on t.ColumnA = tt.ColumnA and t.ColumnB = tt.ColumnB and
t.ColumnD = tt.ColumnD;
这假设 ColumnD
永远不会与 ColumnA
和 ColumnB
中的值重复。