内部联接中的临时表与子查询

Question

两者SQL、return结果相同。我的第一个连接在子查询上，第二个最终查询是一个临时连接，之前我 create/populate 他们

SELECT COUNT(*) totalCollegiates, SUM(getFee(c.collegiate_id, dateS)) totalMoney
FROM collegiates c
LEFT JOIN (
    SELECT collegiate_id FROM collegiateRemittances r
    INNER JOIN remittances r1 USING(remittance_id)
    WHERE r1.type_id = 1 AND r1.name = remesa   
) hasRemittance ON hasRemittance.collegiate_id = c.collegiate_id
WHERE hasRemittance.collegiate_id IS NULL AND c.typePayment = 1 AND c.active = 1 AND c.exentFee = 0 AND c.approvedBoard = 1 AND IF(notCollegiate, c.collegiate_id NOT IN (notCollegiate), '1=1');



DROP TEMPORARY TABLE IF EXISTS hasRemittance;

CREATE TEMPORARY TABLE hasRemittance
    SELECT collegiate_id FROM collegiateRemittances r
    INNER JOIN remittances r1 USING(remittance_id)
    WHERE r1.type_id = 1 AND r1.name = remesa;

SELECT COUNT(*) totalCollegiates, SUM(getFee(c.collegiate_id, dateS)) totalMoney
FROM collegiates c
LEFT JOIN hasRemittance ON hasRemittance.collegiate_id = c.collegiate_id
WHERE hasRemittance.collegiate_id IS NULL AND c.typePayment = 1 AND c.active = 1 AND c.exentFee = 0 AND c.approvedBoard = 1 AND IF(notCollegiate, c.collegiate_id NOT IN (notCollegiate), '1=1');

对于几千条记录，哪个性能更好？

Answer 1

这要视情况而定。您必须测试每个选项的性能。在我的网站上，我有 2 个表格，其中包含文章和评论。事实证明，为每篇文章调用评论计数 20 次比使用单个联合查询更快。 MySQL（与其他数据库一样）缓存查询，因此小型简单查询可以运行惊人地快。

Answer 2

我没有看到您将问题标记为 mysql，所以我最初回答了 Oracle。这是我对 mySQL.

的看法

MySQL 关于临时 tables 内存或磁盘，有两种选择。对于磁盘，您可以拥有 MyIsam - 非事务性和 InnoDB 事务性。当然，对于非事务型存储，您可以期待更好的性能。

此外，您还需要弄清楚您要处理的结果集有多大。对于小结果集，内存选项会更快；对于大结果集，磁盘选项会更快。

最后，正如我最初的回答，您需要弄清楚什么样的性能足够好，然后选择最具描述性和易于阅读的选项。

甲骨文

这取决于您处理的是哪种临时 table。

您可以拥有基于会话的临时 tables - 数据一直保留到注销，或者基于事务 - 数据一直保留到提交。最重要的是，他们可以支持或不支持事务日志记录。根据配置，您可以从临时 table.

获得更好的性能

因为世界上的一切性能都是相对的。很可能对于几千条记录，它不会在两个查询之间产生显着差异。在这种情况下，我不会选择性能最高的，而是选择最容易阅读和理解的。

Answer 3

除了您的显式 temp table 版本是 3 个 sql 语句而不是 1 个之外，这两个公式是相同的。也就是说，来回服务器的开销使其变慢.但是...

由于隐式临时 table 在 LEFT JOIN 中，可以通过以下两种方式之一评估该子查询...

MySQL 的旧版本是 'dump' 并重新评估了它。因此很慢。
较新的版本会自动创建索引。因此快。

同时，您可以通过添加 suitable 索引来加速显式 temp table 版本。它将是 PRIMARY KEY(collegiate_id)。如果 INNER JOIN 有可能产生重复，那么说 SELECT DISTINCT.

对于 "a few thousand" 行，您通常不需要担心性能问题。

Oracle 拥有无数的选择。 MySQL 很少，默认值（通常）是最好的。因此，请忽略讨论您可以在 MySQL.

中使用的各种选项的答案

有问题

AND  IF(notCollegiate,
        c.collegiate_id NOT IN (notCollegiate),
        '1=1')

我分不清table notCollegiate在哪个里面。notCollegiate不能是列表，为什么要用IN？而是简单地使用 !=。最后，'1=1' 是一个 3 个字符的字符串；你真的想要那个吗？

性能（任一版本）

remittances 需要 INDEX(type_id, name, remittance_id) 最后 remittance_id。
collegiateRemittances需要INDEX(remittance_id)（除非是PK）。
collegiates 需要 INDEX(typePayment, active, exentFee , approvedBoard) 任意顺序。

底线：比您如何制定查询更担心索引。

哎呀。又一条皱纹。什么是 getFee()？如果它是存储函数，也许我们需要担心优化它？什么是 dateS？

内部联接中的临时表与子查询

Temp tables vs subqueries in inner join

mysql

performance

subquery

temp-tables