在保留标题的同时附加 2 个数据集

Posted

技术标签:

【中文标题】在保留标题的同时附加 2 个数据集【英文标题】:Appending 2 data sets whilst keeping the header 【发布时间】:2021-11-28 06:44:15 【问题描述】:

我正在尝试从 Excel 文件中提取一些项目,然后将它们保存到单独的 Excel 文件中。

例如,我正在尝试:

    从 G 列中仅选择 500 及以上的交易 从原始Excel文件的剩余项目中随机选择3笔交易 将这些交易保存到新的 Excel 文件中 我需要这个新 Excel 文件中的标题(第一行)
A  B  C  D  E  F   G
x  x  x  x  x  x  100
x  x  x  x  x  x  10
x  x  x  x  x  x  500
x  x  x  x  x  x  1000
x  x  x  x  x  x  20
x  x  x  x  x  x  10
x  x  x  x  x  x  10
x  x  x  x  x  x  30
x  x  x  x  x  x  50

我在想是否可以使用 Append 功能?我不确定如何处理它。

import pandas as pd 
import numpy as np 
import openpyxl 
from numpy.random import choice

df = pd.read_excel('filepath', sheet_name = 'Sheet1')

df1 = df[df['G'] >= 500]
df2 = df.loc[choice(df.index,3)]

## After appending df1 and df2
.to_excel('filename.xlsx',index=False) # to save to new Excel file

我不确定如何在保留标题(第一行)的同时附加 df1df2。 请告知我该怎么做?

谢谢!

【问题讨论】:

没有尝试你的数据,但你可能可以使用 df = df1.append(df2) 获得你想要的数据框 【参考方案1】:

你想使用concat。

combined_df = pd.concat([df1, df2], ignore_index=True)
combined_df.to_excel('filename.xlsx',index=False)

【讨论】:

以上是关于在保留标题的同时附加 2 个数据集的主要内容,如果未能解决你的问题,请参考以下文章

将浮点数组写入和附加到 C++ 中 hdf5 文件中的唯一数据集

从 2 个数据集填充表。在同一个 td 中添加数据数据

附加到表功能不起作用

如何链接 Django 查询集以保留单个顺序

应用 group_by 并汇总数据,同时保留所有列的信息

使用模糊逻辑连接两个数据集