使用 Python Pandas 写入 to_csv:选择要插入新数据的列索引

Posted

技术标签:

【中文标题】使用 Python Pandas 写入 to_csv:选择要插入新数据的列索引【英文标题】:Write to_csv with Python Pandas: Choose which column index to insert new data 【发布时间】:2015-10-19 04:10:59 【问题描述】:

我的程序中有一组数据输出,我想写入 .csv 文件。我可以使用旧输入数据创建一个新文件,然后是右侧最后一列中的新数据。如何操作我的输出数据到哪一列?另外,如何选择不在新文件中包含旧输入数据?我是熊猫新手。

谢谢!

【问题讨论】:

pandas.pydata.org/pandas-docs/stable/generated/… 有一种方法可以使用你的 pandas 数据框来做到这一点 【参考方案1】:

从文件加载:

import pandas as pd
df = pd.read_csv('D:\\Apps\\Coursera\\Kaggle-Titanic\\Data\\train.csv', header = 0)

一些操作:

df['Gender'] = df.Sex.map(lambda x: 0 if x=='female' else 1)
df['FamilySize'] = df.SibSp + df.Parch

复制一些字段到新的:

result = df[['Sex', 'Survived', 'Age']]

删除不需要的字段:

del result['Sex']

保存到文件:

result.to_csv('D:\\Apps\\Coursera\\Kaggle-Titanic\\Swm\\result.csv', index=False)

或者,如果您只想保存某些字段或按特定顺序:

df[['Sex', 'Survived', 'Age']].to_csv('D:\\Apps\\Coursera\\Kaggle-Titanic\\Swm\\result.csv', index=False)

【讨论】:

感谢您全面了解如何操作 .csv 文件中的数据!这应该完全符合我的目的。

以上是关于使用 Python Pandas 写入 to_csv:选择要插入新数据的列索引的主要内容,如果未能解决你的问题,请参考以下文章

使用 python 和 pandas 传输和写入 Parquet 得到时间戳错误

Python之Pandas的常用技能写入数据

使用 Python/Pandas 将多索引数据写入 excel 文件

python pandas dataframe 写入hdfs

Python:在多张工作表上将 Pandas DataFrame 写入 Excel 的最快方法

关于在python中使用pandas模块将列表list/元组tuple写入excel中