我无法在 python 中的数据系列中创建新列,以便对 hasrsine 公式进行赋值
Posted
技术标签:
【中文标题】我无法在 python 中的数据系列中创建新列,以便对 hasrsine 公式进行赋值【英文标题】:I cannot create new column in my data series in python for an assignment on the haversine formula 【发布时间】:2021-02-16 19:38:50 【问题描述】:我正在尝试创建一个新列来操作数据集:
df['longitude'] = df['longitude'].astype(float)
df['latitude'] = df['latitude'].astype(float)
然后运行 hasrsine 的函数: from math 导入弧度、cos、sin、asin、sqrt
def haversine(lon1,lat1,lat2,lon2):
"""
Calculate the great circle distance between two points
on the earth (specified in decimal degrees)
"""
# convert decimal degrees to radians
lon1, lat1, lon2, lat2 = map(radians, [lon1, lat1, lon2, lat2])
# haversine formula
dlon = lon2 - lon1
dlat = lat2 - lat1
a = sin(dlat/2)**2 + cos(lat1) * cos(lat2) * sin(dlon/2)**2
c = 2 * asin(sqrt(a))
km = 6367 * c
return km
但是当我运行这段代码时:
df['d_centre']=haversine(lon1,
lat1,
df.longitude.astype(float),
df.latitude.astype(float))
要在我的 df 中创建一个新列,我收到此错误:
Error: cannot convert the series to <class 'float'>
我也试过了:
df['d_centre']= haversine(lon1,lat1,lat2,lon2)
harsine 正在工作,但是当我尝试在我的 df 中创建新列时,我收到了这个错误。我也尝试过转换为列表,但我得到了相同的结果
【问题讨论】:
使用np.sin
而不是math.sin
我也试过了,我相信我的函数工作正常,但是当我尝试创建一个新列时,'d_centre' 表明系列不能转换为类浮点数
【参考方案1】:
我找到了答案:必须使用 numpy 进行所有数学运算并使用 df 编写新列的代码
从数学导入弧度、cos、sin、asin、sqrt def hasrsine_np(lon1,lat1,lon2,lat2): """ 计算两点之间的大圆距离 在地球上(以十进制度数指定) """ # 十进制度转换为弧度 lon1, lat1, lon2, lat2 = map(np.radians, [lon1, lat1, lon2, lat2]) # 半正弦公式 dlon = lon2 - lon1 dlat = lat2 - lat1 a = np.sin(dlat/2)**2 + np.cos(lat1) * np.cos(lat2) * np.sin(dlon/2)**2 c = 2 * np.arcsin(np.sqrt(a)) 公里 = 6367 * c 返回公里
创建一个新列: df2['d_centre'] =haversine_np(df2['lon1'],df2['lat1'],df2['lon2'],df2['lat2'])
【讨论】:
以上是关于我无法在 python 中的数据系列中创建新列,以便对 hasrsine 公式进行赋值的主要内容,如果未能解决你的问题,请参考以下文章
如何根据 Python Pandas 中的其他列在 DataFrame 中创建新列? [复制]