Pandas读取csv

Posted youzhouliu

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Pandas读取csv相关的知识,希望对你有一定的参考价值。

对于文件的操作中,读写csv操作是一个比较常见的操作,很多时候可能会选择使用python中的文件读取的方式对csv文件操作,这种方式并没有什么问题,但读写的效率不高,编写的代码量也偏多。

这里介绍使用pandas进行简单的读。写也基本类似。

一、Pandas读取表头:

使用pandas读取表头很简单,一行代码搞定,如下:

    # 读取表头
    head_row = pd.read_csv('123.csv', nrows=0)

这一行代码读取的是一个对象,如果要以列表形式输出,可以增加如下一行代码:


    # 表头列转为 list
    head_row_list = list(head_row)

二、读取具体数据:

以文件读取的方式读取具体数据,需要的代码量比较多,也需要做循环遍历,使用pandas操作如下:

    # 读取
    csv_result = pd.read_csv('123.csv', usecols=head_row_list)
    row_list = csv_result.values.tolist()
    print(f"行读取结果:row_list")

上面展示的是打印行读取的结果。使用pandas,还可以很方便的将行转换为列,并打印出行转列的结果,如下代码段:

    col_obj = csv_result.T
    col_list = col_obj.values.tolist()
    print(f"行转列读取结果:col_list")
    return head_row_list, col_list

完整的代码如下:

import pandas as pd


def csv_file_read():
    # 读取表头
    head_row = pd.read_csv('123.csv', nrows=0)
    print(list(head_row))
    # 表头列转为 list
    head_row_list = list(head_row)

    # 读取
    csv_result = pd.read_csv('123.csv', usecols=head_row_list)
    row_list = csv_result.values.tolist()
    print(f"行读取结果:row_list")
    col_obj = csv_result.T
    col_list = col_obj.values.tolist()
    print(f"行转列读取结果:col_list")
    return head_row_list, col_list



if __name__ == '__main__':
    csv_file_read()

是不是很简单,十几行代码即可搞定。

以上是关于Pandas读取csv的主要内容,如果未能解决你的问题,请参考以下文章

pandas读取csv文件时避免科学计数法(xxxe+09)

使用 pandas 读取 CSV 日期会返回 datetime 而不是 Timestamp

pandas读取csv文件时报错:ParserError: Error tokenizing data. C error

在 pandas 中读取 csv 文件时出错 [CParserError: 标记数据时出错。 C 错误:捕获缓冲区溢出 - 可能是格式错误的输入文件。]

使用 pandas 或其他 python 模块读取特定列

Pandas读取csv文件报错UnicodeDecodeError