在 MySQL 8 中使用点数据类型和 st_distance_sphere 查找最近的地方

Posted

技术标签:

【中文标题】在 MySQL 8 中使用点数据类型和 st_distance_sphere 查找最近的地方【英文标题】:Finding nearest places using point datatype and st_distance_sphere in MySQL 8 【发布时间】:2018-10-30 11:49:11 【问题描述】:

我有一张桌子叫place:

id | name       | coordinates (longitude, latitude)
1  | London     | -0.12574, 51.50853
2  | Manchester | -2.25, 53.41667
3  | Glasgow    | -4.25, 55.86667

coordinates 列属于 point 数据类型。我使用以下方法将点插入place 表中:

st_geomfromtext('point($longitude $latitude)', 4326)

请注意,我已经使用了 SRID。

给定任何坐标,我想找到离它最近的地方(按升序排列)。我目前提出的解决方案(通过阅读 mysql 文档)如下所示:

select
    *,
    st_distance_sphere(`place`.`coordinates`, st_geomfromtext('Point($longitude $latitude)', 4326)) as distance
from place
order by distance asc;

在这里和其他地方查看了无数类似的问题后,很明显这是一种鲜为人知(且更新的方式)的做事方式,因此没有太多内容,因此我正在寻找一些澄清.

我的问题是:

    这是最好的解决方案吗/我这样做对吗? 这种方法会利用我在coordinates 列上的空间索引吗? 使用st_distance_sphere时,是否需要指定地球的半径才能得到准确的结果? (编辑:不,它默认使用地球的半径)

编辑,以下是这些答案:

explain select ...; 返回:

id | select_type | table | partitions | type | possible_keys | key  | key_len | ref  | rows   | filtered | Extra
1  | SIMPLE      | place | NULL       | ALL  | NULL          | NULL | NULL    | NULL | 115687 | 100.00   | Using filesort

flush status; select ...; show session status like 'Handler%'; 返回:

Variable_name              | Value
Handler_commit             | 1
Handler_delete             | 0
Handler_discover           | 0
Handler_external_lock      | 2
Handler_mrr_init           | 0
Handler_prepare            | 0
Handler_read_first         | 1
Handler_read_key           | 1001
Handler_read_last          | 0
Handler_read_next          | 0
Handler_read_prev          | 0
Handler_read_rnd           | 1000
Handler_read_rnd_next      | 119395
Handler_rollback           | 0
Handler_savepoint          | 0
Handler_savepoint_rollback | 0
Handler_update             | 0
Handler_write              | 0

【问题讨论】:

***.com/questions/39338167/… 这个问题是针对 sql-server 的,答案要么反映了这一点,要么建议使用 hasrsine 公式。 使用 lat/long 的最近位置几乎需要使用半正弦公式。 SQL Server 在语法方面与 Mysql 几乎相同。 不幸的是 sql-server 在这种情况下非常不同。几年前确实如此,haversine 是唯一的方法,但如果你进行一些挖掘,你会发现 MySQL 引入了一系列全新的函数,这些函数有助于存储和查询空间点/多边形/等。跨度> 你使用什么版本的 MySQL?这是相关的,因为较新的版本提供了更完整的st_... 功能。 【参考方案1】:

可能是最好的解决方案。让我们先得到一些其他的答案......

EXPLAIN SELECT ... 说什么? (这可能会回答您的 Q2)。

无论其他答案如何,您的查询都会扫描整个表格。也许你最后想要LIMIT ...

另一件可能有用的事情(取决于您的应用和优化器):在WHERE 子句中添加一个边界框。

无论如何,请执行以下操作以准确了解实际触摸了多少行:

FLUSH STATUS;
SELECT ...;
SHOW SESSION STATUS LIKE 'Handler%';

返回这些答案;那么也许我们可以进一步迭代。

显示状态后

好吧,Handler_read_rnd_next 说这是一次全表扫描。 1000 和 1001 -- 你有LIMIT 1000吗?

我推断LIMIT 没有考虑到SPATIAL 的工作方式。也就是说,它做了简单的事情——(1)检查所有行,(2)排序,(3)LIMIT

那么,该怎么办?

计划 A:决定您不希望结果超过 X 英里 (km),并在查询中添加“边界框”。

B 计划:放弃 Spatial 并挖掘更复杂的方式来完成任务:http://mysql.rjweb.org/doc.php/latlng

【讨论】:

以上是关于在 MySQL 8 中使用点数据类型和 st_distance_sphere 查找最近的地方的主要内容,如果未能解决你的问题,请参考以下文章

使用空间点类型在 MySQL 中存储 Lat Lng 值

从工作台向 MySQL 8.0 中插入一个点

MySQL笔记:数据类型

MySQL数据类型 - 空间数据类型

MySQL 数据库在 8 小时后断开连接。如何预防?

如何将 csv 中的纬度和经度数据导入 MySQL 中的点数据类型列