我无法在 python 中的数据系列中创建新列,以便对 hasrsine 公式进行赋值

Posted

技术标签:

【中文标题】我无法在 python 中的数据系列中创建新列,以便对 hasrsine 公式进行赋值【英文标题】:I cannot create new column in my data series in python for an assignment on the haversine formula 【发布时间】:2021-02-16 19:38:50 【问题描述】:

我正在尝试创建一个新列来操作数据集:

df['longitude'] = df['longitude'].astype(float)
df['latitude'] = df['latitude'].astype(float)

然后运行 ​​hasrsine 的函数: from math 导入弧度、cos、sin、asin、sqrt

def haversine(lon1,lat1,lat2,lon2):
    """
    Calculate the great circle distance between two points 
    on the earth (specified in decimal degrees)
    """
    # convert decimal degrees to radians 
    lon1, lat1, lon2, lat2 = map(radians, [lon1, lat1, lon2, lat2])
    # haversine formula 
    dlon = lon2 - lon1 
    dlat = lat2 - lat1 
    a = sin(dlat/2)**2 + cos(lat1) * cos(lat2) * sin(dlon/2)**2
    c = 2 * asin(sqrt(a)) 
    km = 6367 * c
    return km

但是当我运行这段代码时:

df['d_centre']=haversine(lon1,
                         lat1,
                         df.longitude.astype(float),
                         df.latitude.astype(float))

要在我的 df 中创建一个新列,我收到此错误:

Error: cannot convert the series to <class 'float'>

我也试过了:

df['d_centre']= haversine(lon1,lat1,lat2,lon2)

harsine 正在工作,但是当我尝试在我的 df 中创建新列时,我收到了这个错误。我也尝试过转换为列表,但我得到了相同的结果

【问题讨论】:

使用np.sin 而不是math.sin 我也试过了,我相信我的函数工作正常,但是当我尝试创建一个新列时,'d_centre' 表明系列不能转换为类浮点数 【参考方案1】:

我找到了答案:必须使用 numpy 进行所有数学运算并使用 df 编写新列的代码

从数学导入弧度、cos、sin、asin、sqrt def hasrsine_np(lon1,lat1,lon2,lat2): """ 计算两点之间的大圆距离 在地球上(以十进制度数指定) """ # 十进制度转换为弧度 lon1, lat1, lon2, lat2 = map(np.radians, [lon1, lat1, lon2, lat2]) # 半正弦公式 dlon = lon2 - lon1 dlat = lat2 - lat1 a = np.sin(dlat/2)**2 + np.cos(lat1) * np.cos(lat2) * np.sin(dlon/2)**2 c = 2 * np.arcsin(np.sqrt(a)) 公里 = 6367 * c 返回公里

创建一个新列: df2['d_centre'] =haversine_np(df2['lon1'],df2['lat1'],df2['lon2'],df2['lat2'])

【讨论】:

以上是关于我无法在 python 中的数据系列中创建新列,以便对 hasrsine 公式进行赋值的主要内容,如果未能解决你的问题,请参考以下文章

如何根据 Python Pandas 中的其他列在 DataFrame 中创建新列? [复制]

检查字符串以在 spark 数据框中创建新列

如何在R中的空数据框中创建新列[重复]

使用正则表达式在 Pandas 数据框中创建新列 [重复]

使用 foreach 循环容器在表中创建新列 - 无法解决“'@P1' 附近的语法错误”错误

基于一百列对在 Spark 数据框中创建新列