在使用 read_csv 构建的 Pandas DataFrame 中手动设置键

Posted

技术标签:

【中文标题】在使用 read_csv 构建的 Pandas DataFrame 中手动设置键【英文标题】:Manually set the keys in Pandas DataFrame built with read_csv 【发布时间】:2020-04-28 08:58:49 【问题描述】:

我有一个 .tsv 文件数据集,我使用 Pandas 将其转换为 DataFrame。 想象一下 my_tsv_file 是这样的:

A Apple
B Orange
C Pear

构建我使用的 DataFrame:

df = pandas.read_csv(my_tsv_file, sep='\t')

现在,my_tsv_file 的第一行原本是数据的行部分,但在新的 DataFrame 中已经转化为“关键行”。所以现在 Dataframe 是这样的:

      A Apple
   0  B Orange
   1  C Pear

因为“A”和“Apple”是键,而实际上它们不是。我想添加正确的“关键行”,以获得类似:

      ID Fruit
   0  A  Apple
   1  B  Orange
   2  C  Pear

我怎样才能做到这一点? 我无法修改原始 .tsv 文件。 请提醒我,我刚开始接触 Python 和 Pandas。

【问题讨论】:

这能回答你的问题吗? How to add header row to a pandas DataFrame 【参考方案1】:

你试过了吗

df = pandas.read_csv(my_tsv_file, sep='\t', names=['ID', 'Fruit'])

【讨论】:

我认为你不需要这样做,通过提供names pandas 会明白没有标题 谢谢!我不知道这个选项,正是我正在寻找的

以上是关于在使用 read_csv 构建的 Pandas DataFrame 中手动设置键的主要内容,如果未能解决你的问题,请参考以下文章

如何使用 pandas.read_csv 在双引号之间读取带有千位分隔符的数字 [重复]

pandas read_csv,最后一列包含逗号

处理 Pandas read_csv 中的缺失数据

pandas read_csv 列 dtype 设置为十进制但转换为字符串

pandas 使用 read_csv 打开 txt 文件

pandas使用read_csv函数读取文件最后N行数据并保留表头pandas使用read_csv函数读取网络url链接数据