将多标题 DataFrame 保存到 Excel 文件中时如何避免写入空行?

Posted

技术标签:

【中文标题】将多标题 DataFrame 保存到 Excel 文件中时如何避免写入空行?【英文标题】:How to avoid writing an empty row when I save a multi-header DataFrame into Excel file? 【发布时间】:2022-01-22 14:52:25 【问题描述】:

我想将一个多头数据框保存为 Excel 文件。以下是示例代码:

import pandas as pd
import numpy as np

header = pd.MultiIndex.from_product([['location1','location2'],
                                     ['S1','S2','S3']],
                                    names=['loc','S'])

df = pd.DataFrame(np.random.randn(5, 6), 
                  index=['a','b','c','d','e'], 
                  columns=header)

df.to_excel('result.xlsx')

excel文件中有两个问题如下图所示:

问题 1:

标题下有一个空行。请告诉我如何避免 Pandas 在 Excel 文件中写入/插入空行。

问题 2:

我想保存没有索引的 DataFrame。但是,当我设置index=False 时,出现以下错误:

 df.to_excel('result.xlsx', index=False)

错误:

NotImplementedError: Writing to Excel with MultiIndex columns and no index ('index'=False) is not yet implemented.

【问题讨论】:

【参考方案1】:

您可以创建 2 个数据框 - 仅标题和默认标题,并使用 startrow 参数将两者写入同一张表:

header = df.columns.to_frame(index=False)
header.loc[header['loc'].duplicated(), 'loc'] = ''
header = header.T
print (header)
             0   1   2          3   4   5
loc  location1          location2        
S           S1  S2  S3         S1  S2  S3


df1 = df.set_axis(range(len(df.columns)), axis=1)
print (df1)
          0         1         2         3         4         5
a -1.603958  1.067986  0.474493 -0.352657 -2.198830 -2.028590
b -0.989817 -0.621200  0.010686 -0.248616  1.121244  0.727779
c -0.851071 -0.593429 -1.398475  0.281235 -0.261898 -0.568850
d  1.414492 -1.309289 -0.581249 -0.718679 -0.307876  0.535318
e -2.108857 -1.870788  1.079796  0.478511  0.613011 -0.441136

with pd.ExcelWriter('output.xlsx') as writer:  
    header.to_excel(writer, sheet_name='Sheet_name_1', header=False, index=False)
    df1.to_excel(writer, sheet_name='Sheet_name_1', header=False, index=False, startrow=2)

【讨论】:

谢谢。有什么办法可以避免重复列名“location1”和“location2”? (就像我上传的图片)。 @Mohammad - 答案已编辑,部分header

以上是关于将多标题 DataFrame 保存到 Excel 文件中时如何避免写入空行?的主要内容,如果未能解决你的问题,请参考以下文章

如何通过python将多页数据导出到excel中?

python 把新的dataframe保存到现有的excel新的sheet里面

将多个 DataFrame 附加到多个现有的 Excel 工作表

将多线程输出保存到txt文件

php将多选标签保存到文本文件

一个dataframe只能储存一个excel子表吗