Python 读取csv的某行

Posted 2020-09-29

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Python 读取csv的某行相关的知识，希望对你有一定的参考价值。

站长用Python写了一个可以提取csv任一列的代码，欢迎使用。Github链接

csv是Comma-Separated Values的缩写，是用文本文件形式储存的表格数据，比如如下的表格：

技术分享

就可以存储为csv文件，文件内容是：
No.,Name,Age,Score 1,Apple,12,98 2,Ben,13,97 3,Celia,14,96 4,Dave,15,95
假设上述csv文件保存为"A.csv"，如何用Python像操作Excel一样提取其中的一行，也就是一条记录，利用Python自带的csv模块，有两种方法可以实现：

第一种方法使用reader函数，接收一个可迭代的对象（比如csv文件），能返回一个生成器，就可以从其中解析出csv的内容：比如下面的代码可以读取csv的全部内容，以行为单位：import csv with open(‘A.csv‘,‘rb‘) as csvfile:     reader = csv.reader(csvfile)     rows = [row for row in reader] print rows得到：[[‘No.‘, ‘Name‘, ‘Age‘, ‘Score‘], [‘1‘, ‘Apple‘, ‘12‘, ‘98‘], [‘2‘, ‘Ben‘, ‘13‘, ‘97‘], [‘3‘, ‘Celia‘, ‘14‘, ‘96‘], [‘4‘, ‘Dave‘, ‘15‘, ‘95‘]]
要提取其中第二行，可以用下面的代码：
import csv with open(‘A.csv‘,‘rb‘) as csvfile:     reader = csv.reader(csvfile)     for i,rows in enumerate(reader):         if i == 2:             row = rows print row 得到：[‘2‘, ‘Ben‘, ‘13‘, ‘97‘]这种方法是通用的方法，要事先知道行号，比如Ben的记录在第2行，而不能根据‘Ben‘这个名字查询。这时可以采用第二种方法：

第二种方法是使用DictReader，和reader函数类似，接收一个可迭代的对象，能返回一个生成器，但是返回的每一个单元格都放在一个字典的值内，而这个字典的键则是这个单元格的标题（即列头）。用下面的代码可以看到DictReader的结构：
import csv with open(‘A.csv‘,‘rb‘) as csvfile:     reader = csv.DictReader(csvfile)     rows = [row for row in reader] print rows得到：
[{‘Age‘: ‘12‘, ‘No.‘: ‘1‘, ‘Score‘: ‘98‘, ‘Name‘: ‘Apple‘}, {‘Age‘: ‘13‘, ‘No.‘: ‘2‘, ‘Score‘: ‘97‘, ‘Name‘: ‘Ben‘}, {‘Age‘: ‘14‘, ‘No.‘: ‘3‘, ‘Score‘: ‘96‘, ‘Name‘: ‘Celia‘}, {‘Age‘: ‘15‘, ‘No.‘: ‘4‘, ‘Score‘: ‘95‘, ‘Name‘: ‘Dave‘}]
如果我们想用DictReader读取csv的某一列，就可以用列的标题查询：
import csv with open(‘A.csv‘,‘rb‘) as csvfile:     reader = csv.DictReader(csvfile)     for row in reader:         if row[‘Name‘]==‘Ben‘:             print row就得到：
{‘Age‘: ‘13‘, ‘No.‘: ‘2‘, ‘Score‘: ‘97‘, ‘Name‘: ‘Ben‘}可见，DictReader很适合读取csv的的行（记录）。

CSV

csv文件格式是一种通用的电子表格和数据库导入导出格式。最近我调用RPC处理服务器数据时，经常需要将数据做个存档便使用了这一方便的格式。

简介

Python csv模块封装了常用的功能，使用的简单例子如下:

# 读取csv文件
import csv
with open(‘some.csv‘, ‘rb‘) as f:        # 采用b的方式处理可以省去很多问题
    reader = csv.reader(f)
    for row in reader:
        # do something with row, such as row[0],row[1]


import csv
with open(‘some.csv‘, ‘wb‘) as f:      # 采用b的方式处理可以省去很多问题
    writer = csv.writer(f)
    writer.writerows(someiterable)

默认的情况下, 读和写使用逗号做分隔符(delimiter)，用双引号作为引用符(quotechar)，当遇到特殊情况是，可以根据需要手动指定字符, 例如:

import csv
with open(‘passwd‘, ‘rb‘) as f:
    reader = csv.reader(f, delimiter=‘:‘, quoting=csv.QUOTE_NONE)
    for row in reader:
        print row

上述示例指定冒号作为分隔符，并且指定quote方式为不引用。这意味着读的时候都认为内容是不被默认引用符(")包围的。quoting的可选项为: QUOTE_ALL, QUOTE_MINIMAL, QUOTE_NONNUMERIC, QUOTE_NONE.

有点需要注意的是，当用writer写数据时， None 会被写成空字符串，浮点类型会被调用 repr() 方法转化成字符串。所以非字符串类型的数据会被 str() 成字符串存储。所以当涉及到unicode字符串时，可以自己手动编码后存储或者使用csv提供的 UnicodeWriter, 具体可参见这里。

字典方式地读写

csv还提供了一种类似于字典方式的读写，方式如下:

格式如下:

class csv.DictReader(csvfile, fieldnames=None, restkey=None, restval=None, dialect=‘excel‘, *args, **kwds)

class csv.DictWriter(csvfile, fieldnames, restval=‘‘, extrasaction=‘raise‘, dialect=‘excel‘, *args, **kwds)

其中fieldnames指定字典的key值，如果reader里没有指定那么默认第一行的元素，在writer里一定要指定这个。

使用示例

# 读
>>> import csv
>>> with open(‘names.csv‘) as csvfile:
...     reader = csv.DictReader(csvfile)
...     for row in reader:
...         print(row[‘first_name‘], row[‘last_name‘])
...
Baked Beans
Lovely Spam
Wonderful Spam


# 写

import csv
with open(‘names.csv‘, ‘w‘) as csvfile:
    fieldnames = [‘first_name‘, ‘last_name‘]
    writer = csv.DictWriter(csvfile, fieldnames=fieldnames)

    writer.writeheader()
    writer.writerow({‘first_name‘: ‘Baked‘, ‘last_name‘: ‘Beans‘})
    writer.writerow({‘first_name‘: ‘Lovely‘, ‘last_name‘: ‘Spam‘})
    writer.writerow({‘first_name‘: ‘Wonderful‘, ‘last_name‘: ‘Spam‘})

其它

csv模块还涉及了其它的概念，比如 Dialects, 还提供了供错误处理的 exception csv.Error 等，因为实际使用较少及就不累赘在此。更多参考官方文档。

以上是关于Python 读取csv的某行的主要内容，如果未能解决你的问题，请参考以下文章

java操作csv文件

Python读取csv文件中的某一列

Python 哪个库可以删除Excel表格的某行或某列

fortran如何读入文本文件中的某行的指定部分

python 按二维数组的某行或列排序 (numpy lexsort)

python 读取多个csv文件中某一列，并生成一个新csv文件