Pandas 通过插入源数据帧中的数据来填充新数据帧

Posted

技术标签:

【中文标题】Pandas 通过插入源数据帧中的数据来填充新数据帧【英文标题】:Pandas fill a new dataframe by interpolating data from source dataframe 【发布时间】:2020-04-07 14:24:44 【问题描述】:

我有一个类似arr=[[0.5,1.0],[1.5,7.0],[2.5,5.0]] 的数组。哪个包(pandas/scipy)具有在整数 x 值处插入值的方法?

来自 x _ | _ y 0.5 | 1.0 1.5 | 7.0 2.5 | 5.0

x_|_y 1 | 4 2 | 3

【问题讨论】:

条件是什么? @ManojK 线性插值。输入 x 是浮点数。输出 x 是整数位置。如果 Xn 和 X(n+1) 点之间存在整数,则通过线性插值计算整数位置的值。 您不想根据输入 xy 拟合回归模型,然后将其应用于任何新的输入数据吗? 【参考方案1】:

Numpy 可以做到这一点

import numpy as np

xp = [1.5, 2.5, 3.5]
fp = [3, 2, 0]
new_x = range(1,3)
interp_y=np.interp([new_x, xp, fp)

【讨论】:

以上是关于Pandas 通过插入源数据帧中的数据来填充新数据帧的主要内容,如果未能解决你的问题,请参考以下文章

在 pandas 数据帧中使用前向和后向填充填充缺失值(ffill 和 bfill)

通过在两个 Pandas 数据帧之间迭代来识别相似的值。

当列表值与Pyspark数据帧中的列值的子字符串匹配时,填充新列

使用read_fwf()读取pandas数据帧中的伪造数据

Pandas:在多索引数据帧中重新索引和插值

R - 数据帧中的条件更新坐标列