MySQL 大圆距离(Haversine 公式)
Posted
技术标签:
【中文标题】MySQL 大圆距离(Haversine 公式)【英文标题】:MySQL Great Circle Distance (Haversine formula) 【发布时间】:2010-10-09 03:35:32 【问题描述】:我有一个有效的 php 脚本,它获取经度和纬度值,然后将它们输入到 mysql 查询中。我想只做MySQL。这是我当前的 PHP 代码:
if ($distance != "Any" && $customer_zip != "") //get the great circle distance
//get the origin zip code info
$zip_sql = "SELECT * FROM zip_code WHERE zip_code = '$customer_zip'";
$result = mysql_query($zip_sql);
$row = mysql_fetch_array($result);
$origin_lat = $row['lat'];
$origin_lon = $row['lon'];
//get the range
$lat_range = $distance/69.172;
$lon_range = abs($distance/(cos($details[0]) * 69.172));
$min_lat = number_format($origin_lat - $lat_range, "4", ".", "");
$max_lat = number_format($origin_lat + $lat_range, "4", ".", "");
$min_lon = number_format($origin_lon - $lon_range, "4", ".", "");
$max_lon = number_format($origin_lon + $lon_range, "4", ".", "");
$sql .= "lat BETWEEN '$min_lat' AND '$max_lat' AND lon BETWEEN '$min_lon' AND '$max_lon' AND ";
有谁知道如何使这个完全 MySQL ?我浏览了一些互联网,但大多数关于它的文献都很混乱。
【问题讨论】:
基于以下所有优秀答案,here is working sample of the Haversine formula in action ***.com/a/40272394/1281385 有一个如何确保索引被命中的例子 【参考方案1】:来自Google Code FAQ - Creating a Store Locator with PHP, MySQL & Google Maps:
下面的 SQL 语句将查找距离 37, -122 坐标 25 英里半径范围内最近的 20 个位置。它根据该行的纬度/经度和目标纬度/经度计算距离,然后仅询问距离值小于 25 的行,按距离对整个查询进行排序,并将其限制为 20 个结果。要按公里而不是英里搜索,请将 3959 替换为 6371。
SELECT id, ( 3959 * acos( cos( radians(37) ) * cos( radians( lat ) )
* cos( radians( lng ) - radians(-122) ) + sin( radians(37) ) * sin(radians(lat)) ) ) AS distance
FROM markers
HAVING distance < 25
ORDER BY distance
LIMIT 0 , 20;
【讨论】:
sql语句确实不错。但是我在哪里可以将我的坐标传递到这个语句中?我看不到坐标已经通过的任何地方 将 37 和 -122 替换为您的坐标。 我想知道如果有数百万个地方(+数千名访客),这对性能的影响...... 您可以缩小查询范围以获得更好的性能,如本文档中所述:tr.scribd.com/doc/2569355/Geo-Distance-Search-with-MySQL @FosAvance 是的,如果您有带有 id、lan 和 lng 字段的markers
表,则此查询将起作用。【参考方案2】:
$greatCircleDistance = acos( cos($latitude0) * cos($latitude1) * cos($longitude0 - $longitude1) + sin($latitude0) * sin($latitude1));
以弧度表示的纬度和经度。
所以
SELECT
acos(
cos(radians( $latitude0 ))
* cos(radians( $latitude1 ))
* cos(radians( $longitude0 ) - radians( $longitude1 ))
+ sin(radians( $latitude0 ))
* sin(radians( $latitude1 ))
) AS greatCircleDistance
FROM yourTable;
是你的 SQL 查询
要获得以公里或英里为单位的结果,请将结果乘以地球的平均半径(3959
英里、6371
公里或3440
海里)
您在示例中计算的是一个边界框。 如果您将坐标数据放在spatial enabled MySQL column 中,则可以使用MySQL's build in functionality 查询数据。
SELECT
id
FROM spatialEnabledTable
WHERE
MBRWithin(ogc_point, GeomFromText('Polygon((0 0,0 3,3 3,3 0,0 0))'))
【讨论】:
【参考方案3】:如果在坐标表中添加辅助字段,可以提高查询的响应时间。
像这样:
CREATE TABLE `Coordinates` (
`id` INT(10) UNSIGNED NOT NULL COMMENT 'id for the object',
`type` TINYINT(4) UNSIGNED NOT NULL DEFAULT '0' COMMENT 'type',
`sin_lat` FLOAT NOT NULL COMMENT 'sin(lat) in radians',
`cos_cos` FLOAT NOT NULL COMMENT 'cos(lat)*cos(lon) in radians',
`cos_sin` FLOAT NOT NULL COMMENT 'cos(lat)*sin(lon) in radians',
`lat` FLOAT NOT NULL COMMENT 'latitude in degrees',
`lon` FLOAT NOT NULL COMMENT 'longitude in degrees',
INDEX `lat_lon_idx` (`lat`, `lon`)
)
如果您使用的是 TokuDB,如果添加集群,您将获得更好的性能 对任一谓词的索引,例如,如下所示:
alter table Coordinates add clustering index c_lat(lat);
alter table Coordinates add clustering index c_lon(lon);
对于每个点,您需要以度为单位的基本 lat 和 lon 以及以弧度表示的 sin(lat)、以弧度表示的 cos(lat)*cos(lon) 以弧度表示的 cos(lat)*sin(lon) . 然后你创建一个mysql函数,像这样:
CREATE FUNCTION `geodistance`(`sin_lat1` FLOAT,
`cos_cos1` FLOAT, `cos_sin1` FLOAT,
`sin_lat2` FLOAT,
`cos_cos2` FLOAT, `cos_sin2` FLOAT)
RETURNS float
LANGUAGE SQL
DETERMINISTIC
CONTAINS SQL
SQL SECURITY INVOKER
BEGIN
RETURN acos(sin_lat1*sin_lat2 + cos_cos1*cos_cos2 + cos_sin1*cos_sin2);
END
这会给你距离。
不要忘记在纬度/经度上添加索引,这样边界框可以帮助搜索而不是减慢搜索速度(索引已经添加到上面的 CREATE TABLE 查询中)。
INDEX `lat_lon_idx` (`lat`, `lon`)
给定一个只有纬度/经度坐标的旧表,您可以设置一个脚本来更新它,如下所示:(使用 meekrodb 的 php)
$users = DB::query('SELECT id,lat,lon FROM Old_Coordinates');
foreach ($users as $user)
$lat_rad = deg2rad($user['lat']);
$lon_rad = deg2rad($user['lon']);
DB::replace('Coordinates', array(
'object_id' => $user['id'],
'object_type' => 0,
'sin_lat' => sin($lat_rad),
'cos_cos' => cos($lat_rad)*cos($lon_rad),
'cos_sin' => cos($lat_rad)*sin($lon_rad),
'lat' => $user['lat'],
'lon' => $user['lon']
));
然后您优化实际查询以仅在真正需要时进行距离计算,例如通过从内部和外部限制圆形(嗯,椭圆形)。 为此,您需要为查询本身预先计算几个指标:
// assuming the search center coordinates are $lat and $lon in degrees
// and radius in km is given in $distance
$lat_rad = deg2rad($lat);
$lon_rad = deg2rad($lon);
$R = 6371; // earth's radius, km
$distance_rad = $distance/$R;
$distance_rad_plus = $distance_rad * 1.06; // ovality error for outer bounding box
$dist_deg_lat = rad2deg($distance_rad_plus); //outer bounding box
$dist_deg_lon = rad2deg($distance_rad_plus/cos(deg2rad($lat)));
$dist_deg_lat_small = rad2deg($distance_rad/sqrt(2)); //inner bounding box
$dist_deg_lon_small = rad2deg($distance_rad/cos(deg2rad($lat))/sqrt(2));
鉴于这些准备,查询是这样的(php):
$neighbors = DB::query("SELECT id, type, lat, lon,
geodistance(sin_lat,cos_cos,cos_sin,%d,%d,%d) as distance
FROM Coordinates WHERE
lat BETWEEN %d AND %d AND lon BETWEEN %d AND %d
HAVING (lat BETWEEN %d AND %d AND lon BETWEEN %d AND %d) OR distance <= %d",
// center radian values: sin_lat, cos_cos, cos_sin
sin($lat_rad),cos($lat_rad)*cos($lon_rad),cos($lat_rad)*sin($lon_rad),
// min_lat, max_lat, min_lon, max_lon for the outside box
$lat-$dist_deg_lat,$lat+$dist_deg_lat,
$lon-$dist_deg_lon,$lon+$dist_deg_lon,
// min_lat, max_lat, min_lon, max_lon for the inside box
$lat-$dist_deg_lat_small,$lat+$dist_deg_lat_small,
$lon-$dist_deg_lon_small,$lon+$dist_deg_lon_small,
// distance in radians
$distance_rad);
对上述查询的解释可能会说它没有使用索引,除非有足够的结果来触发它。当坐标表中有足够的数据时,将使用索引。 你可以加 强制索引 (lat_lon_idx) 到 SELECT 以使其使用索引而不考虑表大小,因此您可以使用 EXPLAIN 验证它是否正常工作。
使用上面的代码示例,您应该能够以最小的错误实现按距离进行对象搜索的工作且可扩展的实现。
【讨论】:
【参考方案4】:我不得不详细地解决这个问题,所以我会分享我的结果。这使用 zip
表和 latitude
和 longitude
表。它不依赖于谷歌地图;相反,您可以将其调整为任何包含纬度/经度的表格。
SELECT zip, primary_city,
latitude, longitude, distance_in_mi
FROM (
SELECT zip, primary_city, latitude, longitude,r,
(3963.17 * ACOS(COS(RADIANS(latpoint))
* COS(RADIANS(latitude))
* COS(RADIANS(longpoint) - RADIANS(longitude))
+ SIN(RADIANS(latpoint))
* SIN(RADIANS(latitude)))) AS distance_in_mi
FROM zip
JOIN (
SELECT 42.81 AS latpoint, -70.81 AS longpoint, 50.0 AS r
) AS p
WHERE latitude
BETWEEN latpoint - (r / 69)
AND latpoint + (r / 69)
AND longitude
BETWEEN longpoint - (r / (69 * COS(RADIANS(latpoint))))
AND longpoint + (r / (69 * COS(RADIANS(latpoint))))
) d
WHERE distance_in_mi <= r
ORDER BY distance_in_mi
LIMIT 30
查看查询中间的这一行:
SELECT 42.81 AS latpoint, -70.81 AS longpoint, 50.0 AS r
这将搜索zip
表中距离纬度/经度点 42.81/-70.81 50.0 英里范围内最近的 30 个条目。当您将其构建到应用程序中时,您可以在其中放置自己的点和搜索半径。
如果您想以公里而不是英里为单位,请在查询中将69
更改为111.045
并将3963.17
更改为6378.10
。
这里有详细的文章。我希望它可以帮助某人。 http://www.plumislandmedia.net/mysql/haversine-mysql-nearest-loc/
【讨论】:
【参考方案5】: SELECT *, (
6371 * acos(cos(radians(search_lat)) * cos(radians(lat) ) *
cos(radians(lng) - radians(search_lng)) + sin(radians(search_lat)) * sin(radians(lat)))
) AS distance
FROM table
WHERE lat != search_lat AND lng != search_lng AND distance < 25
ORDER BY distance
FETCH 10 ONLY
25公里的距离
【讨论】:
最后一个(弧度(lat)必须是sin(弧度(lat)) 我得到一个错误“未知的列距离”这是为什么? @JillJohn 如果您只想要距离,那么您可以完全按距离删除订单。如果你想对结果进行排序,你可以使用这个 - ORDER BY ( 6371 * acos(cos(radians(search_lat)) * cos(radians(lat) ) * cos(radians(lng) - radians(search_lng)) + sin(radians (search_lat)) * sin(弧度(lat)))。【参考方案6】:我写了一个可以计算相同的程序, 但您必须在相应的表格中输入纬度和经度。
drop procedure if exists select_lattitude_longitude;
delimiter //
create procedure select_lattitude_longitude(In CityName1 varchar(20) , In CityName2 varchar(20))
begin
declare origin_lat float(10,2);
declare origin_long float(10,2);
declare dest_lat float(10,2);
declare dest_long float(10,2);
if CityName1 Not In (select Name from City_lat_lon) OR CityName2 Not In (select Name from City_lat_lon) then
select 'The Name Not Exist or Not Valid Please Check the Names given by you' as Message;
else
select lattitude into origin_lat from City_lat_lon where Name=CityName1;
select longitude into origin_long from City_lat_lon where Name=CityName1;
select lattitude into dest_lat from City_lat_lon where Name=CityName2;
select longitude into dest_long from City_lat_lon where Name=CityName2;
select origin_lat as CityName1_lattitude,
origin_long as CityName1_longitude,
dest_lat as CityName2_lattitude,
dest_long as CityName2_longitude;
SELECT 3956 * 2 * ASIN(SQRT( POWER(SIN((origin_lat - dest_lat) * pi()/180 / 2), 2) + COS(origin_lat * pi()/180) * COS(dest_lat * pi()/180) * POWER(SIN((origin_long-dest_long) * pi()/180 / 2), 2) )) * 1.609344 as Distance_In_Kms ;
end if;
end ;
//
delimiter ;
【讨论】:
【参考方案7】:我无法对上述答案发表评论,但请注意@Pavel Chuchuva 的答案。如果两个坐标相同,该公式将不会返回结果。在这种情况下,距离为空,因此该行将不会按原样返回该公式。
我不是 MySQL 专家,但这似乎对我有用:
SELECT id, ( 3959 * acos( cos( radians(37) ) * cos( radians( lat ) ) * cos( radians( lng ) - radians(-122) ) + sin( radians(37) ) * sin( radians( lat ) ) ) ) AS distance
FROM markers HAVING distance < 25 OR distance IS NULL ORDER BY distance LIMIT 0 , 20;
【讨论】:
如果位置相同,它不应该为 NULL,而是为零(因为ACOS(1)
为 0)。您可能看到 xaxis * xaxis + yaxis * yaxis + zaxis * zaxis 的舍入问题超出了 ACOS 的范围,但您似乎并未对此有所防范?【参考方案8】:
我认为我的 javascript 实现将是一个很好的参考:
/*
* Check to see if the second coord is within the precision ( meters )
* of the first coord and return accordingly
*/
function checkWithinBound(coord_one, coord_two, precision)
var distance = 3959000 * Math.acos(
Math.cos( degree_to_radian( coord_two.lat ) ) *
Math.cos( degree_to_radian( coord_one.lat ) ) *
Math.cos(
degree_to_radian( coord_one.lng ) - degree_to_radian( coord_two.lng )
) +
Math.sin( degree_to_radian( coord_two.lat ) ) *
Math.sin( degree_to_radian( coord_one.lat ) )
);
return distance <= precision;
/**
* Get radian from given degree
*/
function degree_to_radian(degree)
return degree * (Math.PI / 180);
【讨论】:
【参考方案9】:在Mysql中计算距离
SELECT (6371 * acos(cos(radians(lat2)) * cos(radians(lat1) ) * cos(radians(long1) -radians(long2)) + sin(radians(lat2)) * sin(radians(lat1)))) AS distance
由此计算距离值,任何人都可以根据需要申请。
【讨论】:
以上是关于MySQL 大圆距离(Haversine 公式)的主要内容,如果未能解决你的问题,请参考以下文章
MySQL 函数 ST_Distance_Sphere 没有使用 Haversine 公式?