熊猫数据帧功能

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了熊猫数据帧功能相关的知识,希望对你有一定的参考价值。

我想使用excel电子表格作为源数据创建数据帧。我需要将数据系列从用于存储excel电子表格中的数据的格式转换为数据帧变量最终产品。

我想知道用户是否有使用各种python方法来完成以下任务的经验:

-data series transform:我有一个系列,每月包含一个数据值,但是想要扩展值表,使用索引(或者可能是带有日期值的列)每天包含一个值。因此,如果table1具有基于月份的索引并且table2具有每日索引,那么如何将table1值转换为基于table2的索引。

-dataframe sculpting:我正在使用的数据长度不相似,有些数据集比其他数据集长。通过什么方法可以在多列数据帧的上下文中找到列中最短的序列长度?

本质上,我想从工作簿中获取单个表,并将它们组合成一个数据帧,该数据帧使用单个索引值作为其表示的基础。我的工作簿表可能具有每日,每周或每月的数据点频率,我想构建一个数据框,该数据框使用每日索引作为表元素的基础,同时包括每周和每月系列的元素。

我正在查看Pandas库,但也许还有其他库,我忽略了其他功能。

谢谢你的帮助!

答案

对于您的第一个问题,请尝试以下方法:

df1 = df1.resample('1d').first()
df2.merge(df1)

这将对您的每月或每周数据框进行上采样,并将其与您的每日数据框合并。看看interpolate method来填补缺失的值。要获取最短列的名称,请尝试以下操作:

df.count().idxmin()

希望有所帮助!

以上是关于熊猫数据帧功能的主要内容,如果未能解决你的问题,请参考以下文章

熊猫,无法连接数据帧

按间隔合并两个熊猫数据帧

将熊猫数据帧转换为火花数据帧时收到错误

从多个熊猫数据帧创建 HDF5

如何根据字节大小拆分熊猫数据帧

不能连接相同长度的熊猫数据帧?