如何优化这个 MySql 查询 - 连接 3 个表?

Posted

技术标签:

【中文标题】如何优化这个 MySql 查询 - 连接 3 个表?【英文标题】:How to optimize this MySql query - joins 3 tables? 【发布时间】:2016-12-08 15:24:46 【问题描述】:

这个查询很慢。它非常简单,使用的 3 个表在 JOIN 和 WHERE 子句中的所有列上都建立了索引。如何优化我的查询或我的表以用于此查询?

这是慢查询。运行需要 15-20 秒。

 SELECT
    user.id,
    user.name,
    user.key,
    user.secret,
    account.id,
    account.name,
    account.admin,
    setting.attribute,
    setting.value
  FROM        user
  INNER JOIN  account ON account.id       = user.account_id
  INNER JOIN  setting ON setting.user_id  = user.id
    AND setting.deleted = 0
  WHERE user.deleted = 0

这很可能是由于设置表上的连接引起的,因为以下两个查询总共需要大约 5 秒。虽然,5秒似乎还是有点长?

  SELECT
    user.id,
    user.name,
    user.user_key,
    user.secret,
    account.id,
    account.name,
    account.admin
  FROM        user
  INNER JOIN  account ON account.user_id = user.id
  WHERE user.deleted = 0

  SELECT
    setting.user_id,
    setting.attribute,
    setting.value
  FROM setting
  WHERE setting.deleted = 0

慢查询的解释:

id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra

1, 'SIMPLE', 'user', 'ALL', 'PRIMARY,idx_id,idx_deleted', null, null, null, 600, 'Using where'
1, 'SIMPLE', 'account', 'eq_ref', 'PRIMARY', 'PRIMARY', '8', 'user.account_id', 1, null
1, 'SIMPLE', 'setting', 'ref', 'attribute_version_unique,idx_user_id,indx_deleted', 'attribute_version_unique', '8', 'user.id', 35, 'Using where'

架构:

CREATE TABLE user
(
    id BIGINT(20) unsigned PRIMARY KEY NOT NULL AUTO_INCREMENT,
    name VARCHAR(45) NOT NULL,
    user_key VARCHAR(45) NOT NULL,
    secret VARCHAR(16),
    account_id BIGINT(20) unsigned NOT NULL,
    name VARCHAR(40) NOT NULL,
    demo TINYINT(1) DEFAULT '0' NOT NULL,
    details VARCHAR(4000),
    date_created DATETIME NOT NULL,
    date_modified DATETIME NOT NULL,
    deleted TINYINT(1) DEFAULT '0' NOT NULL
);
CREATE INDEX idx_date_modified ON user (date_modified);
CREATE INDEX idx_deleted ON user (deleted);
CREATE INDEX idx_id ON pub_application (id);
CREATE UNIQUE INDEX idx_name_unique ON user (user_key);
CREATE TABLE account
(
    id BIGINT(20) unsigned PRIMARY KEY NOT NULL AUTO_INCREMENT,
    name VARCHAR(100) NOT NULL,
    display_name VARCHAR(100),
    admin TINYINT(1) DEFAULT '0' NOT NULL,
    visibility VARCHAR(15) DEFAULT 'public',
    cost DOUBLE,
    monthly_fee VARCHAR(300),
    date_created DATETIME NOT NULL,
    date_modified DATETIME NOT NULL,
    deleted TINYINT(1) DEFAULT '0'
);
CREATE INDEX idx_date_modified ON account (date_modified);
CREATE TABLE setting
(
    id BIGINT(20) unsigned PRIMARY KEY NOT NULL AUTO_INCREMENT,
    user_id BIGINT(20) unsigned NOT NULL,
    attribute VARCHAR(45) NOT NULL,
    value VARCHAR(4000),
    date_created DATETIME NOT NULL,
    date_modified DATETIME NOT NULL,
    deleted TINYINT(1) DEFAULT '0' NOT NULL
);
CREATE UNIQUE INDEX attribute_version_unique ON setting (user_id, attribute);
CREATE INDEX idx_user_id ON setting (user_id);
CREATE INDEX idx_date_modified ON setting (date_modified);
CREATE INDEX indx_deleted ON setting (deleted);

【问题讨论】:

这是一个关于查询性能的良构问题。加油! users 中只有 600 行,并且所有连接都使用索引,因此查询必须快速执行。也许你的服务器有问题? 我不太确定,但我在users 表中找不到account_id 的索引,据我所知,它与account 表的关系的外键。在加入 ON account.id = user.account_id 时,它可能会减慢整个查询的速度。 慢查询的结果集中有多少行?似乎您将获得至少与settings 表大小一样多的行。每张表有多少行?您是否想过为什么需要高速获取每个用户的所有设置?没有什么神奇的方法可以将大型结果集从 mysql 服务器传输到客户端的速度非常快。 SQL 擅长大海捞针。将整个干草堆从一个地方复制到另一个地方,不是那么多。 我问自己,“如果我有一百万,这会有多好?”我正在处理的任何事情。如果您有一百万个用户设置,那么您问题中的方法将是一个很大的瓶颈。每分钟 160K 行并不慢。但它比交互式慢。 15 秒现在可能对你有用,但随着系统的增长,它只会变得更糟。 【参考方案1】:

恕我直言,您偶然发现了一个常见的反模式。索引“所有列”通常是一个无用的举动。 MySQL(截至 2016 年底)在满足查询时最多可以利用每个表的一个索引。所以额外的索引可能不会帮助查询,并且肯定会增加 INSERTUPDATE 操作的开销。

这个查询可能会通过一些专门设计的复合覆盖索引来改进。

在您的 user 表上尝试此索引。这是一个覆盖索引:旨在包含满足查询所需的所有列。它的组织顺序与您的 WHERE 子句相匹配。

CREATE INDEX idx_user_account_setting 
          ON user (deleted , account_id, id, name, key, secret);

此覆盖索引可能对您的 setting 表有所帮助

CREATE INDEX idx_setting_user 
          ON setting (user_id, deleted , attribute, value);

如果第一列没有帮助,也试试这个,切换前两列的顺序。

CREATE INDEX idx_setting_user_alt
          ON setting (deleted, user_id, attribute, value);

最后在account上试试这个。

CREATE INDEX idx_account_user 
          ON account (id, name, admin);

如果这些建议有帮助,请留下简短的评论,说明它们有多大帮助。

阅读本文。 http://use-the-index-luke.com/

【讨论】:

感谢您的详细建议,我会尝试并报告。我是否需要删除其他索引以确保使用覆盖索引? 覆盖的索引没有太大的区别。我发现从没有 where 子句的设置表中选择所有内容需要大约 5 秒,它有大约 40k 行。 5秒似乎很长?如果该查询需要 5 秒,那么连接需要 15 秒并不令人震惊?

以上是关于如何优化这个 MySql 查询 - 连接 3 个表?的主要内容,如果未能解决你的问题,请参考以下文章

PHP Codeigniter MySQL 查询 - 将 4 个表连接在一起,其中 3 个表使用每个表中的一列分组

条件检查之间的Mysql中有多个条件?有没有办法优化这个查询?

在 3 个大表上使用内连接优化 SQL 查询

如何优化 3 个表的 m:n 关系查询

mysql 千万级数据库如何进行多张结构相同的表联合查询?如何优化或设置提高查询速度?

使用 graphql 查询连接 3 个表