在 Python 中使用 Pandas 合并时间序列数据帧及其集体附加注释

Posted

技术标签:

【中文标题】在 Python 中使用 Pandas 合并时间序列数据帧及其集体附加注释【英文标题】:Merge time series dataframes and their collective additional annotation using Pandas in Python 【发布时间】:2021-09-23 16:24:36 【问题描述】:

我有 2 个数据框,并希望将它们组合/合并/连接以创建多个或一个新数据框以用于模型训练。在这种情况下如何使用 pandas 合并这些文件?

第一个是时间序列数据的 csv 文件列表,如下所示:

File name: Data1:
Col1  Col2        Col3
Time  SignalA     SignalB
1     1           4
2     5           3
.     .           .
50    3           1

第二个包含所有这些文件的附加信息,格式如下:

File name: Ann:
Col1          Col2       Col3       Col4
              Data1      Data2      Data3
pH            7          7.2        6  
Negative1     0          1          1
Negative2     0          0          1
Week          35         36         34

【问题讨论】:

【参考方案1】:

如果 DataFrames 被命名为文件,那么 Data1 和 Ann 我想出了一个快速的解决方案,可能不漂亮但速度很快。我会这样做:

Data1['Col4'] = np.nan
new_df = Ann.append(Data1).reset_index(drop=True)

希望对你有帮助

【讨论】:

我找到了一个解决方法,即在所有行上插入一个值为Data1的Name列,然后像正常一样合并2个文件 是的,这是因为您必须添加一列,然后这两个 df 具有相同的尺寸。如果它们都有 4 列,则可以轻松合并它们。我添加了带有 NaN 的列,因为我不知道可以有带有名称的列。如果你必须有一列什么都没有,你可以像这样添加:Data1['Col4'] = ''

以上是关于在 Python 中使用 Pandas 合并时间序列数据帧及其集体附加注释的主要内容,如果未能解决你的问题,请参考以下文章

如何通过 python 中的 pandas 合并重现 R 中 foverlaps 的相同输出?

如何在 Pandas Python 中合并时避免笛卡尔坐标

按 ID 合并两个 Excel 文件并合并具有相同名称的列(python、pandas)

在 Python 中合并 Pandas 数据帧

python--pandas合并与连接

在 Pandas/Python 中合并两个数据框,保留数据框 1 中的所有列