在 Python 中使用 Pandas 合并时间序列数据帧及其集体附加注释
Posted
技术标签:
【中文标题】在 Python 中使用 Pandas 合并时间序列数据帧及其集体附加注释【英文标题】:Merge time series dataframes and their collective additional annotation using Pandas in Python 【发布时间】:2021-09-23 16:24:36 【问题描述】:我有 2 个数据框,并希望将它们组合/合并/连接以创建多个或一个新数据框以用于模型训练。在这种情况下如何使用 pandas 合并这些文件?
第一个是时间序列数据的 csv 文件列表,如下所示:
File name: Data1:
Col1 Col2 Col3
Time SignalA SignalB
1 1 4
2 5 3
. . .
50 3 1
第二个包含所有这些文件的附加信息,格式如下:
File name: Ann:
Col1 Col2 Col3 Col4
Data1 Data2 Data3
pH 7 7.2 6
Negative1 0 1 1
Negative2 0 0 1
Week 35 36 34
【问题讨论】:
【参考方案1】:如果 DataFrames 被命名为文件,那么 Data1 和 Ann 我想出了一个快速的解决方案,可能不漂亮但速度很快。我会这样做:
Data1['Col4'] = np.nan
new_df = Ann.append(Data1).reset_index(drop=True)
希望对你有帮助
【讨论】:
我找到了一个解决方法,即在所有行上插入一个值为Data1的Name
列,然后像正常一样合并2个文件
是的,这是因为您必须添加一列,然后这两个 df 具有相同的尺寸。如果它们都有 4 列,则可以轻松合并它们。我添加了带有 NaN 的列,因为我不知道可以有带有名称的列。如果你必须有一列什么都没有,你可以像这样添加:Data1['Col4'] = ''
以上是关于在 Python 中使用 Pandas 合并时间序列数据帧及其集体附加注释的主要内容,如果未能解决你的问题,请参考以下文章
如何通过 python 中的 pandas 合并重现 R 中 foverlaps 的相同输出?