如何将 Pandas 查找表应用于 numpy 数组?

Posted

技术标签:

【中文标题】如何将 Pandas 查找表应用于 numpy 数组?【英文标题】:How to apply a Pandas lookup table to a numpy array? 【发布时间】:2018-07-11 06:46:02 【问题描述】:

我有一个这样的熊猫系列:

      measure
0    0.3
6    0.6
9    0.2
11   0.3
14   0.0
17   0.1
23   0.9

还有一个像这样的 numpy 数组:

array([[ 0,  0,  9, 11],
       [ 6, 14,  6, 17]])

如何从 numpy 数组中的值到系列中的索引进行查找以获得此:

array([[ 0.3,  0.3,  0.2, 0.3],
       [ 0.6,  0.0,  0.6, 0.1]])

【问题讨论】:

【参考方案1】:

通过np.vectorize,带有系列s和数组a

np.vectorize(s.get)(a)

【讨论】:

【参考方案2】:

使用replace

a=np.array([[ 0,  0,  9, 11],
       [ 6, 14,  6, 17]])
pd.DataFrame(a).replace(df.measure.to_dict()).values
Out[214]: 
array([[0.3, 0.3, 0.2, 0.3],
       [0.6, 0. , 0.6, 0.1]])

【讨论】:

【参考方案3】:

使用np.bincount的有趣方式

np.bincount(s.index.values, s.values)[a]

array([[ 0.3,  0.3,  0.2,  0.3],
       [ 0.6,  0. ,  0.6,  0.1]])

设置

s = pd.Series(
    [.3, .6, .2, .3, .0, .1, .9],
    [0, 6, 9, 11, 14, 17, 23]
)

a = np.array([
    [0, 0, 9, 11],
    [6, 14, 6, 17]
])

【讨论】:

【参考方案4】:

你可以使用 loc 和 reshape:

s = pd.Series(0: 0.3, 6: 0.6, 9: 0.2, 11: 0.3, 14: 0.0, 17: 0.1, 23: 0.9)

a = np.array([[ 0,  0,  9, 11],
             [ 6, 14,  6, 17]])

s.loc[a.flatten()].values.reshape(a.shape)
Out[192]: 
array([[ 0.3,  0.3,  0.2,  0.3],
       [ 0.6,  0. ,  0.6,  0.1]])

或者:

pd.DataFrame(a).applymap(lambda x: s.loc[x]).values
Out[200]: 
array([[ 0.3,  0.3,  0.2,  0.3],
       [ 0.6,  0. ,  0.6,  0.1]])

【讨论】:

以上是关于如何将 Pandas 查找表应用于 numpy 数组?的主要内容,如果未能解决你的问题,请参考以下文章

如何将 5Hz 的低通滤波器应用于 pandas 数据帧?

如何在不使用 Pandas 的情况下创建等效于 numpy.nan 的日期时间对象?

如何用python将dataframe更新原来的sql表

快速在所有行中应用函数时如何在pandas numpy中使用if else

pandas 基础

numpy pandas2