如何将数据帧中的数据调用到Haversine函数中[重复]

Posted

技术标签:

【中文标题】如何将数据帧中的数据调用到Haversine函数中[重复]【英文标题】:How to call data from a dataframe into Haversine function [duplicate] 【发布时间】:2016-11-25 14:31:27 【问题描述】:

我有一个名为 lat_long 的数据框,其中包含一些位置的纬度和经度。我想找出以下每个位置之间的区别。当我使用示例 haversine 函数时,出现错误。 KeyError: ('1', u'发生在索引 0')。

    1         2
0  -6.081689  145.391881
1  -5.207083  145.788700
2  -5.826789  144.295861
3  -6.569828  146.726242
4  -9.443383  147.220050

def haversine(row):
    lon1 = lat_long['1']
    lat1 = lat_long['2']
    lon2 = row['1']
    lat2 = row['2']
    lon1, lat1, lon2, lat2 = map(radians, [lon1, lat1, lon2, lat2])
    dlon = lon2 - lon1 
    dlat = lat2 - lat1 
    a = sin(dlat/2)**2 + cos(lat1) * cos(lat2) * sin(dlon/2)**2
    c = 2 * arcsin(sqrt(a)) 
    km = 6367 * c
    return km

lat_long['distance'] = lat_long.apply(lambda row: haversine(row), axis=1)
lat_long

【问题讨论】:

“每行的距离”是什么意思? 我想找出下面每一行之间的区别。 @AmyRose,that 你想要什么? @MaxU 是的,但它一直告诉我 'float' 对象没有属性 'radians' 我已经导入了数学和 numpy.. @AmyRose,我在答案中添加了一个包含您的数据的演示 - 请检查... 【参考方案1】:

试试this solution:

def haversine_np(lon1, lat1, lon2, lat2):
    """
    Calculate the great circle distance between two points
    on the earth (specified in decimal degrees)

    All args must be of equal length.    

    """
    lon1, lat1, lon2, lat2 = map(np.radians, [lon1, lat1, lon2, lat2])

    dlon = lon2 - lon1
    dlat = lat2 - lat1

    a = np.sin(dlat/2.0)**2 + np.cos(lat1) * np.cos(lat2) * np.sin(dlon/2.0)**2

    c = 2 * np.arcsin(np.sqrt(a))
    km = 6367 * c
    return km

演示:

In [17]: df
Out[17]:
        lat         lon
0 -6.081689  145.391881
1 -5.207083  145.788700
2 -5.826789  144.295861
3 -6.569828  146.726242
4 -9.443383  147.220050

In [18]: df['dist'] = \
    ...:     haversine_np(df.lon.shift(), df.lat.shift(), df.ix[1:, 'lon'], df.ix[1:, 'lat'])

In [19]: df
Out[19]:
        lat         lon        dist
0 -6.081689  145.391881         NaN
1 -5.207083  145.788700  106.638117
2 -5.826789  144.295861  178.907364
3 -6.569828  146.726242  280.904983
4 -9.443383  147.220050  323.913612

【讨论】:

非常感谢mcuh @AmyRose,不客气 :)

以上是关于如何将数据帧中的数据调用到Haversine函数中[重复]的主要内容,如果未能解决你的问题,请参考以下文章

Spark Java 将数据帧中的每个值四舍五入到小数点后两位。

如何将 Google Cloud Storage 中的千兆字节数据加载到 pandas 数据帧中?

如何从 Spark 数据帧中的 When 子句将多个列发送到 udf?

python 将函数应用于pandas数据帧中的两列

组合2个字符串的最快方法,将字符串从第二列交错到整个数据帧中的第一列

将其他数据帧中的值获取到新数据帧的循环中