如何将数据帧中的数据调用到Haversine函数中[重复]
Posted
技术标签:
【中文标题】如何将数据帧中的数据调用到Haversine函数中[重复]【英文标题】:How to call data from a dataframe into Haversine function [duplicate] 【发布时间】:2016-11-25 14:31:27 【问题描述】:我有一个名为 lat_long 的数据框,其中包含一些位置的纬度和经度。我想找出以下每个位置之间的区别。当我使用示例 haversine 函数时,出现错误。 KeyError: ('1', u'发生在索引 0')。
1 2
0 -6.081689 145.391881
1 -5.207083 145.788700
2 -5.826789 144.295861
3 -6.569828 146.726242
4 -9.443383 147.220050
def haversine(row):
lon1 = lat_long['1']
lat1 = lat_long['2']
lon2 = row['1']
lat2 = row['2']
lon1, lat1, lon2, lat2 = map(radians, [lon1, lat1, lon2, lat2])
dlon = lon2 - lon1
dlat = lat2 - lat1
a = sin(dlat/2)**2 + cos(lat1) * cos(lat2) * sin(dlon/2)**2
c = 2 * arcsin(sqrt(a))
km = 6367 * c
return km
lat_long['distance'] = lat_long.apply(lambda row: haversine(row), axis=1)
lat_long
【问题讨论】:
“每行的距离”是什么意思? 我想找出下面每一行之间的区别。 @AmyRose,that 你想要什么? @MaxU 是的,但它一直告诉我 'float' 对象没有属性 'radians' 我已经导入了数学和 numpy.. @AmyRose,我在答案中添加了一个包含您的数据的演示 - 请检查... 【参考方案1】:试试this solution:
def haversine_np(lon1, lat1, lon2, lat2):
"""
Calculate the great circle distance between two points
on the earth (specified in decimal degrees)
All args must be of equal length.
"""
lon1, lat1, lon2, lat2 = map(np.radians, [lon1, lat1, lon2, lat2])
dlon = lon2 - lon1
dlat = lat2 - lat1
a = np.sin(dlat/2.0)**2 + np.cos(lat1) * np.cos(lat2) * np.sin(dlon/2.0)**2
c = 2 * np.arcsin(np.sqrt(a))
km = 6367 * c
return km
演示:
In [17]: df
Out[17]:
lat lon
0 -6.081689 145.391881
1 -5.207083 145.788700
2 -5.826789 144.295861
3 -6.569828 146.726242
4 -9.443383 147.220050
In [18]: df['dist'] = \
...: haversine_np(df.lon.shift(), df.lat.shift(), df.ix[1:, 'lon'], df.ix[1:, 'lat'])
In [19]: df
Out[19]:
lat lon dist
0 -6.081689 145.391881 NaN
1 -5.207083 145.788700 106.638117
2 -5.826789 144.295861 178.907364
3 -6.569828 146.726242 280.904983
4 -9.443383 147.220050 323.913612
【讨论】:
非常感谢mcuh @AmyRose,不客气 :)以上是关于如何将数据帧中的数据调用到Haversine函数中[重复]的主要内容,如果未能解决你的问题,请参考以下文章
Spark Java 将数据帧中的每个值四舍五入到小数点后两位。
如何将 Google Cloud Storage 中的千兆字节数据加载到 pandas 数据帧中?
如何从 Spark 数据帧中的 When 子句将多个列发送到 udf?