使熊猫数据框中的 H3 单元格转换更快

Posted

技术标签:

【中文标题】使熊猫数据框中的 H3 单元格转换更快【英文标题】:make the H3 cell conversion faster in a pandas dataframe 【发布时间】:2021-05-31 15:04:23 【问题描述】:

我有一个表名Rides

start_lat start_long end _lat end_long
29.682413 78.997065 27.682413 76.997065
25.682413 74.997065 24.682413 76.997065

我想将它们转换为 h3 单元格并将它们添加回表格。我正在使用以下代码:

lst1=[]
lst2=[]
for i in range(rides.shape[0]):
    hex1,hex2=0,0
    hex1 = h3.geo_to_h3(rides['start_lat'][i],rides['start_long'][i], 8)
    hex2 = h3.geo_to_h3(rides['end_lat'][i],rides['end_long'][i], 8)
    lst1.append(hex1)
    lst2.append(hex2)
rides['hex_ID1'] = lst1
rides['hex_ID1'] = lst2

这需要很多时间,我在想是否有更快的方法来做到这一点。

【问题讨论】:

【参考方案1】:

我用了pandas的@​​987654321@函数,可能更合适:

df.apply(lambda x: h3.geo_to_h3(x.lng, x.lat, resolution=7),axis=1)

【讨论】:

以上是关于使熊猫数据框中的 H3 单元格转换更快的主要内容,如果未能解决你的问题,请参考以下文章

熊猫数据框中的分割行

从最后一行熊猫数据框中获取第一个单元格[重复]

从熊猫数据框单元格中的凌乱字符串中删除换行符?

将熊猫数据框单元格中的字典解析为新行单元格(新列)

如何迭代数据列的每个单元格,转换和附加每个单元格?

根据数据框中单元格中的值将颜色应用于单元格