如何提高带有 NULL 的 MySQL 查询的性能?

How do I improve performance on a MySQL query with NULL?

我在下面有几百万条记录table:

CREATE TABLE `customers` (
  `id` int(11) unsigned NOT NULL AUTO_INCREMENT,
  `store_id` int(10) unsigned DEFAULT NULL,
  `first_name` varchar(64) DEFAULT NULL,
  `middle_name` varchar(64) DEFAULT NULL,
  `last_name` varchar(64) DEFAULT NULL,
  `email` varchar(128) DEFAULT NULL,
  `phone` varchar(20) DEFAULT NULL,
  PRIMARY KEY (`id`),
  KEY `index_store_email` (`store_id`,`email`),
  KEY `index_store_phone` (`store_id`,`phone`)
) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8;

查询 #1 需要大约 800 毫秒:
SELECT COUNT(*) FROM `customers` WHERE `store_id` = 1;

查询 #2 需要大约 1.5 毫秒:
SELECT COUNT(*) FROM `customers` WHERE `store_id` = 1 AND `email` IS NULL;

查询 #3 花费了惊人的 5 秒:
SELECT COUNT(*) FROM `customers` WHERE `store_id` = 1 AND `email` IS NOT NULL;

备注:

我在这里发现了一些奇怪的事情:

  1. 查询 #1 最简单!只有几个可能的 INT 值。应该不是最快的吧?
  2. 为什么查询 #3 这么慢?我可以通过执行其他两个查询并从 #2 中减去 #1 来将时间缩短一半,但我不应该这样做。

对这个看似基本的问题有什么想法吗?感觉就像我错过了一些简单的东西。我在 db 学校睡过 class 吗?

有时 MySQL 查询解析器在决定使用哪个索引时会猜错。对于这些情况,索引提示可能很有用 (http://dev.mysql.com/doc/refman/5.7/en/index-hints.html)

强制使用索引:

SELECT * FROM table1 USE INDEX (col1_index,col2_index)
  WHERE col1=1 AND col2=2 AND col3=3;

强制使用索引,包括替换 table 扫描:

SELECT * FROM table1 FORCE INDEX (col1_index,col2_index)
  WHERE col1=1 AND col2=2 AND col3=3;

要忽略某个索引:

SELECT * FROM table1 IGNORE INDEX (col3_index)
  WHERE col1=1 AND col2=2 AND col3=3;

要调试正在使用哪个索引,可以使用 EXPLAIN 语句:(https://dev.mysql.com/doc/refman/5.7/en/explain-output.html)

EXPLAIN SELECT * FROM table1
  WHERE col1=1 AND col2=2 AND col3=3;

仅使用 (store_id) 删除索引;它与其他两个索引是多余的。

这可能还会避免 FORCE INDEX 等的需要

INDEX(store_id, email) 适用于所有三个查询。