使用 pandas [Python] 提取 xls 文件后如何从输出中删除编号
Posted
技术标签:
【中文标题】使用 pandas [Python] 提取 xls 文件后如何从输出中删除编号【英文标题】:How remove numbering from output after extract xls file with pandas [Python] 【发布时间】:2020-01-17 10:52:53 【问题描述】:我有一个 Python 脚本,它从 Excel .xls
文件中提取特定列,但输出在提取的信息旁边有一个编号,所以我想知道如何格式化输出,这样它们就不会出现。
我的实际代码是这样的:
for i in sys.argv:
file_name = sys.argv[1]
workbook = pd.read_excel(file_name)
df = pd.DataFrame(workbook, columns=['NOM_LOGR_COMPLETO'])
df = df.drop_duplicates()
df = df.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)
print(df)
我目前的输出:
1 Street Alpha <br>
2 Street Bravo
但我需要的结果是:
Street Alpha <br>
Street Bravo
没有编号,只有街道的名称。
谢谢!
【问题讨论】:
【参考方案1】:我相信你想要一个没有索引的数据框。请注意,没有索引就不能拥有DataFrame
,它们是DataFrame
的重点。因此,对于您的情况,您可以采用:
print(df.values)
查看没有索引列的数据框。要保存不带索引的输出,请使用:
writer = pd.ExcelWriter("dataframe.xlsx", engine='xlsxwriter')
df.to_excel(writer, sheet_name = df, index=False)
writer.save()
file_name = "dataframe.xlsx"
适合您的情况。
更多参考资料见:
How to print pandas DataFrame without index
Printing a pandas dataframe without row number/index
disable index pandas data frame
Python to_excel without row names (index)?
【讨论】:
@Vinicius Donatto 如果您发现该解决方案有用并且解决了您的问题,如果您可以将答案标记为已接受,那就太好了。 :) 否则请更新社区,我们可以尽力提供进一步的帮助。 我将使用 to_string 函数的“打印没有行号/索引的熊猫数据帧”的解决方案与您的提示结合使用“打印(df.values)”设置索引仅打印值参数为False,结果非常好,谢谢!我的输出代码如下所示:print(df.to_string(index=False))
@ViniciusDonatto 感谢您的更新!很高兴它对您有所帮助。 :)以上是关于使用 pandas [Python] 提取 xls 文件后如何从输出中删除编号的主要内容,如果未能解决你的问题,请参考以下文章
Python:Pandas read_excel 无法打开 .xls 文件,不支持 xlrd
python+pandas+openpyxl下载xls illegalCharacterError
使用 pandas 读取 Excel XML .xls 文件