使用 pandas [Python] 提取 xls 文件后如何从输出中删除编号

Posted

技术标签:

【中文标题】使用 pandas [Python] 提取 xls 文件后如何从输出中删除编号【英文标题】:How remove numbering from output after extract xls file with pandas [Python] 【发布时间】:2020-01-17 10:52:53 【问题描述】:

我有一个 Python 脚本,它从 Excel .xls 文件中提取特定列,但输出在提取的信息旁边有一个编号,所以我想知道如何格式化输出,这样它们就不会出现。

我的实际代码是这样的:

for i in sys.argv:
    file_name = sys.argv[1]

workbook = pd.read_excel(file_name)
df = pd.DataFrame(workbook, columns=['NOM_LOGR_COMPLETO'])
df = df.drop_duplicates()
df = df.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)
print(df)

我目前的输出:

1 Street Alpha <br>
2 Street Bravo

但我需要的结果是:

Street Alpha <br>
Street Bravo

没有编号,只有街道的名称。

谢谢!

【问题讨论】:

【参考方案1】:

我相信你想要一个没有索引的数据框。请注意,没有索引就不能拥有DataFrame,它们是DataFrame 的重点。因此,对于您的情况,您可以采用:

print(df.values)

查看没有索引列的数据框。要保存不带索引的输出,请使用:

writer = pd.ExcelWriter("dataframe.xlsx", engine='xlsxwriter')
df.to_excel(writer, sheet_name = df, index=False)
writer.save() 

file_name = "dataframe.xlsx" 适合您的情况。

更多参考资料见:

How to print pandas DataFrame without index

Printing a pandas dataframe without row number/index

disable index pandas data frame

Python to_excel without row names (index)?

【讨论】:

@Vinicius Donatto 如果您发现该解决方案有用并且解决了您的问题,如果您可以将答案标记为已接受,那就太好了。 :) 否则请更新社区,我们可以尽力提供进一步的帮助。 我将使用 to_string 函数的“打印没有行号/索引的熊猫数据帧”的解决方案与您的提示结合使用“打印(df.values)”设置索引仅打印值参数为False,结果非常好,谢谢!我的输出代码如下所示:print(df.to_string(index=False)) @ViniciusDonatto 感谢您的更新!很高兴它对您有所帮助。 :)

以上是关于使用 pandas [Python] 提取 xls 文件后如何从输出中删除编号的主要内容,如果未能解决你的问题,请参考以下文章

Python:Pandas read_excel 无法打开 .xls 文件,不支持 xlrd

python+pandas+openpyxl下载xls illegalCharacterError

python中如何将csv文件转为xls文件

使用 pandas 读取 Excel XML .xls 文件

50_Pandas读取 Excel 文件 (xlsx, xls)

时间序列特征提取的Python和Pandas代码示例