如何优化此查询...?
Posted
技术标签:
【中文标题】如何优化此查询...?【英文标题】:How can I optimize this query...? 【发布时间】:2009-06-26 15:32:12 【问题描述】:我有两张桌子,一张用于路线,一张用于机场。
Routes 包含刚刚超过 9000 行,并且我已对每一列进行了索引。 机场只有 2000 行,我还为每一列编制了索引。
当我运行此查询时,最多可能需要 35 秒才能返回 300 行:
SELECT routes.* , a1.name as origin_name, a2.name as destination_name FROM routes
LEFT JOIN airports a1 ON a1.IATA = routes.origin
LEFT JOIN airports a2 ON a2.IATA = routes.destination
WHERE routes_build.carrier = "Carrier Name"
使用“DESCRIBE”运行它,我得到以下信息,但我不能 100% 确定它告诉我什么。
id | Select Type | Table | Type | possible_keys | Key | Key_len | ref | rows | Extra
--------------------------------------------------------------------------------------------------------------------------------------
1 | SIMPLE | routes_build | ref | carrier,carrier_2 | carrier | 678 | const | 26 | Using where
--------------------------------------------------------------------------------------------------------------------------------------
1 | SIMPLE | a1 | ALL | NULL | NULL | NULL | NULL | 5389 |
--------------------------------------------------------------------------------------------------------------------------------------
1 | SIMPLE | a2 | ALL | NULL | NULL | NULL | NULL | 5389 |
--------------------------------------------------------------------------------------------------------------------------------------
我能想到的唯一选择是运行两个单独的查询并将它们与 php 连接起来,但我无法相信这样的事情会杀死 mysql 服务器。所以像往常一样,我怀疑我在做一些愚蠢的事情。 SQL 是我的第一个弱点。
【问题讨论】:
您确定您已按原样发布查询吗?您的表是一个地方的路线和另一个地方的 route_build。在执行计划方面,每个逗号都可能很重要。 抱歉,我确实更改了名称以保持查询详细。现在修好了。 【参考方案1】:就个人而言,我会首先删除左连接并用内连接替换它们,因为每条路线都必须有一个起点和终点。
【讨论】:
那么我该如何处理别名。我试过这个... SELECT routes.* , a1.name as origin_name, a2.name as destination_name FROM routes_build, airports as a1, airports as a2 WHERE a1.IATA = routes_build.origin AND a1.IATA = routes_build.destination AND routes_build.carrier = 'Ryanair' 但我没有得到任何结果。 只要去掉 LEFT 这个词,你的原始 SQL 就会运行 啊啊啊,谢谢。 35 秒降至 919 毫秒。完美!很快我将不得不认真阅读一本 MySQL 书籍。【参考方案2】:它告诉您它没有使用索引来连接 airports 表。看看“行”列是如何如此巨大的,有 5000 多个?这就是它必须读取多少行才能回答您的查询。
我不知道为什么,因为您声称您已为每一列编制索引。什么是国际航空运输协会?它是独一无二的吗?我相信如果mysql认为索引效率低下它可能会忽略它。
编辑:如果 IATA 是一个唯一的字符串,也许尝试只索引它的一半? (你可以选择索引多少个字符)这可能会给mysql一个它可以使用的索引。
【讨论】:
啊,所以 IATA 是一个唯一的字符串。所以你的索引是无用的,因为你的索引与你的表有完全相同的条目数。您需要遇到一种情况,即您的索引的行数大大少于您的表,因为这样 mysql 将通过使用它来提高速度。尝试仅索引 IATA 列的一半。例如机场代码是 4 个字符,如果我记得的话,所以只有索引 2 个字符。 我说的是机场表上的 IATA 列 - 抱歉没有说清楚 不用担心。你实际上指出了我的数据的一个大问题,因为一些机场共享相同的 IATA 代码。有时这是一个错误,有时是 IATA 和 FAA 系统的问题。无论如何,我检查并修复了所有重复项,添加了唯一索引并将查询从 919 毫秒缩短到 425 毫秒。谢谢你。【参考方案3】:SELECT routes.*, a1.name as origin_name, a2.name as destination_name
FROM routes_build
LEFT JOIN
airports a1
ON a1.IATA = routes_build.origin
LEFT JOIN
airports a2
ON a2.IATA = routes_build.destination
WHERE routes_build.carrier = "Carrier Name"
从您的EXPLAIN PLAN
可以看出,您在airports.IATA
上没有索引。
您应该创建它以使查询快速工作。
名称还表明它应该是一个UNIQUE
索引,因为IATA
代码是唯一的。
更新:
请发布您的表格定义。发出此查询以显示它:
SHOW CREATE TABLE airports
另外我应该注意,除非您将 ft_max_word_len
设置为 MySQL
配置为 3
或更少,否则您在 IATA
上的 FULLTEXT
索引是无用的。
默认为4
。
IATA
代码的长度为 3
个字符,MySQL
在默认设置下不会使用 FULLTEXT
搜索如此短的单词。
【讨论】:
Question 声称他为机场的每一列都编制了索引。但是,是的,解释看起来没有索引。那里发生了一些奇怪的事情。 这很奇怪,因为我在 airports.IATA 上有一个索引,实际上我有两个,一个索引和一个全文索引。 能否请您发布您的表格定义:SHOW CREATE TABLE airports; 我不知道索引在 MySQL 内部是如何工作的,但全文索引可能会减慢连接速度。典型的全文索引基于词法分析,这意味着这可能类似于使用“a1.IATA LIKE '%' + routes_build.origin + '%'” @Matthew:不应该有所作为:你可以在他的解释输出中看到没有使用索引。它正在手动加载所有行【参考方案4】:在您实施 Martin Robins 的出色建议后(即从查询中删除单词 LEFT
的每个实例),尝试在 carrier
、origin
和 destination
上为 routes_build
提供复合索引。
【讨论】:
【参考方案5】:这实际上取决于您要获取的信息。您可能不需要两次加入机场,也可能不需要使用左连接。此外,如果您可以搜索数字字段而不是文本字段,那也会加快速度。
那么你想获取什么?
【讨论】:
我正在尝试获取路线,但它是机场代码以及机场名称。我有加入,因为我需要两次获得机场名称。一次为起点,一次为目的地。以上是关于如何优化此查询...?的主要内容,如果未能解决你的问题,请参考以下文章