使用 Python Pandas 写入 to_csv:选择要插入新数据的列索引
Posted
技术标签:
【中文标题】使用 Python Pandas 写入 to_csv:选择要插入新数据的列索引【英文标题】:Write to_csv with Python Pandas: Choose which column index to insert new data 【发布时间】:2015-10-19 04:10:59 【问题描述】:我的程序中有一组数据输出,我想写入 .csv 文件。我可以使用旧输入数据创建一个新文件,然后是右侧最后一列中的新数据。如何操作我的输出数据到哪一列?另外,如何选择不在新文件中包含旧输入数据?我是熊猫新手。
谢谢!
【问题讨论】:
pandas.pydata.org/pandas-docs/stable/generated/… 有一种方法可以使用你的 pandas 数据框来做到这一点 【参考方案1】:从文件加载:
import pandas as pd
df = pd.read_csv('D:\\Apps\\Coursera\\Kaggle-Titanic\\Data\\train.csv', header = 0)
一些操作:
df['Gender'] = df.Sex.map(lambda x: 0 if x=='female' else 1)
df['FamilySize'] = df.SibSp + df.Parch
复制一些字段到新的:
result = df[['Sex', 'Survived', 'Age']]
删除不需要的字段:
del result['Sex']
保存到文件:
result.to_csv('D:\\Apps\\Coursera\\Kaggle-Titanic\\Swm\\result.csv', index=False)
或者,如果您只想保存某些字段或按特定顺序:
df[['Sex', 'Survived', 'Age']].to_csv('D:\\Apps\\Coursera\\Kaggle-Titanic\\Swm\\result.csv', index=False)
【讨论】:
感谢您全面了解如何操作 .csv 文件中的数据!这应该完全符合我的目的。以上是关于使用 Python Pandas 写入 to_csv:选择要插入新数据的列索引的主要内容,如果未能解决你的问题,请参考以下文章
使用 python 和 pandas 传输和写入 Parquet 得到时间戳错误
使用 Python/Pandas 将多索引数据写入 excel 文件
python pandas dataframe 写入hdfs