熊猫将数据框列写入 csv

Posted

技术标签:

【中文标题】熊猫将数据框列写入 csv【英文标题】:Pandas Writing Dataframe Columns to csv 【发布时间】:2014-03-28 00:06:39 【问题描述】:

我正在编写一个脚本来将带有标题的大型 .xlsx 文件缩减为 csv,然后根据标题名称编写一个仅包含所需列的新 csv 文件。

import pandas
import csv

df = pandas.read_csv('C:\\Python27\\Work\\spoofing.csv')

time = df["InviteTime (Oracle)"]
orignum = df["Orig Number"]
origip = df["Orig IP Address"]
destnum = df["Dest Number"]

df.to_csv('output.csv', header=[time,orignum,origip,destnum])

我得到的错误是最后一段代码,它说

ValueError: Writing 102 cols but got 4 aliases

我确定我忽略了一些愚蠢的东西,但我已经阅读了 pandas 网站上的 to_csv 文档,但我仍然不知所措。我知道我错误地使用了 to_csv 参数,但我似乎无法理解我猜想的文档。

感谢任何帮助,谢谢!

【问题讨论】:

【参考方案1】:

选择特定列的方法是这样的-

header = ["InviteTime (Oracle)", "Orig Number", "Orig IP Address", "Dest Number"]
df.to_csv('output.csv', columns = header)

【讨论】:

这里是information from the documentation的参数。 似乎是列名不匹配。您可以使用 df.columns 检查您的列 只有当一个人不合理地重复它时:) df.to_csv 中有附加功能吗? 参考这个-***.com/questions/17530542/…

以上是关于熊猫将数据框列写入 csv的主要内容,如果未能解决你的问题,请参考以下文章

如何将数据作为列写入熊猫

如何将小时添加到熊猫数据框列

熊猫 datetime64 到字符串

将熊猫数据框列列表值拆分为重复行[重复]

当列数事先未知时如何访问 Pandas 数据框列

熊猫将数据框列单元格初始化为空列表