Python csv库整理(部分)

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python csv库整理(部分)相关的知识,希望对你有一定的参考价值。

参考技术A

近期,笔者到一些数据竞赛网站进行观察学习,发现很多数据是以csv文件处理的(废话).因而,磨刀不误砍柴工,笔者先对Python的csv库进行学习.

csv模块实现了CSV格式表单数据的读写.这可以以一个兼容Excel的方式读写其数据文件,csv模块中的reader和writer类被用来读写序列化的数据.也可以使用DictReader类和DictWriter类以字典的方式读取数据.

返回一个reader对象,该对象逐行遍历csvfile(文件和列表均适用,但是文件的话应该newline=\'\'.
默认每一行读取一个字符串组成的列表(而非数值,除非修改QUOTE_NONUMERIC).

返回一个writer对象,负责将数据在给定的文件类对象上转换成带分隔符的字符串.csvfile(只要该对象有write()方法,文件的话应该newline=\'\'.)


这两个方法可以把name字符串和dialect关联/脱钩.dialect可以是Dialect的子类,或者fmtparams的关键字参数.

返回一个Dialect对象为name的变种,若其未注册,抛出Error.

返回已经注册的所有变种的 名称

返回当前解析器允许的最大字段大小,如果制定了参数,参数将成为新的最大字段大小.

该对象操作上类似reader,但是把每行中的信息映射到一个字典,字典的键由fieldnames给出
fieldname的参数是一个序列sequence [1] ,如果参数缺省,默认第一行的值作为字段名.
如果某一行中的字段多于字段名(比如说约定有5项属性,但是这一行却出现了6个数据),则其余字段将放入列表中,字段名由 restkey 指定(默认为 None)。如果非空白行的字段少于字段名,则缺少的值将用 None 填充。
#其实这玩意应该就跟各种填表里面的备注用法差不多.
3.8中返回的行是dict类型.

该对象操作上类似reader,但是把每行中的信息映射到一个字典,字典的键由fieldnames给出,fieldname参数是不可缺省的.restval用来指定字典缺少键的时候要写入的值.extrasaction用于指定关键键在fieldname中找不到的情况的处理机制.\'raise\'引发ValueError,而\'ignore\'则会被忽略.


这个类被用来瑞段csv文件的格式

以下诸类均在括号中标注了在其变种注册表中的名称

定义了Excel生成的csv文件的常规属性.(\'excel\')

定义了Excel生成的,tab分割的csv文件的常规属
性.(\'excel-tab\')

定义了UNIX系统上生成的csv文件的常规属性(\'unix\'):

任意可能发生的csv库函数错误.

参考链接
Python3.8.2文档中关于csv库的相关文档

把Python的200个标准库分类整理了下,供参考


大家好,欢迎来到 Crossin的编程教室!

Python有一套很有用的标准库(standard library),会随着Python解释器一起安装在你的电脑中的。它是Python的一个组成部分,不需要额外安装即可直接调用。这些标准库是Python为你准备好的利器,可以让编程事半功倍。

在这里我们将200个内置标准库进行了分类整理,大家可以收藏起来,在开发中需要用到的时候可以方便查找。


文本

string:通用字符串操作

re:正则表达式操作

difflib:差异计算工具

textwrap:文本填充

unicodedata:Unicode字符数据库

stringprep:互联网字符串准备工具

readline:GNU按行读取接口

rlcompleter:GNU按行读取的实现函数

struct:将字节解析为打包的二进制数据

codecs:注册表与基类的编解码器

数据类型

datetime:基于日期与时间工具

calendar:通用月份函数

collections:容器数据类型

collections.abc:容器虚基类

heapq:堆队列算法

bisect:数组二分算法

array:高效数值数组

weakref:弱引用

types:内置类型的动态创建与命名

copy:浅拷贝与深拷贝

reprlib:交替repr()的实现

数学

numbers:数值的虚基类

math:数学函数

cmath:复数的数学函数

decimal:定点数与浮点数计算

fractions:有理数

random:生成伪随机数

函数式编程

itertools:为高效循环生成迭代器

functools:可调用对象上的高阶函数与操作

operator:针对函数的标准操作

文件与目录

os.path:通用路径名控制

fileinput:从多输入流中遍历行

stat:解释stat()的结果

filecmp:文件与目录的比较函数

tempfile:生成临时文件与目录

glob:Unix风格路径名格式的扩展

fnmatch:Unix风格路径名格式的比对

linecache:文本行的随机存储

shutil:高级文件操作

macpath:MacOS 9路径控制函数

持久化

pickle:Python对象序列化

copyreg:注册机对pickle的支持函数

shelve:Python对象持久化

marshal:内部Python对象序列化

dbm:Unix“数据库”接口

sqlite3:针对SQLite数据库的API2.0

压缩

zlib:兼容gzip的压缩

gzip:对gzip文件的支持

bz2:对bzip2压缩的支持

lzma:使用LZMA算法的压缩

zipfile:操作ZIP存档

tarfile:读写tar存档文件

加密

hashlib:安全散列与消息摘要

hmac:针对消息认证的键散列

操作系统工具

os:多方面的操作系统接口

io:流核心工具

time:时间的查询与转化

argparser:命令行选项、参数和子命令的解析器

optparser:命令行选项解析器

getopt:C风格的命令行选项解析器

logging:Python日志工具

logging.config:日志配置

logging.handlers:日志处理器

getpass:简易密码输入

curses:字符显示的终端处理

curses.textpad:curses程序的文本输入域

curses.ascii:ASCII字符集工具

curses.panel:curses的控件栈扩展

platform:访问底层平台认证数据

errno:标准错误记号

ctypes:Python外部函数库

并发

threading:基于线程的并行

multiprocessing:基于进程的并行

concurrent:并发包

concurrent.futures:启动并行任务

subprocess:子进程管理

sched:事件调度

queue:同步队列

select:等待I / O完成

dummy_threading:threading模块的替代(当_thread不可用时)

_thread:底层的线程API(threading基于其上)

_dummy_thread:_thread模块的替代(当_thread不可用时)

进程间通信

socket:底层网络接口

ssl:socket对象的TLS / SSL填充器

asyncore:异步套接字处理器

asynchat:异步套接字命令 / 响应处理器

signal:异步事务信号处理器

mmap:内存映射文件支持

互联网

email:邮件与MIME处理包

json:JSON编码与解码

mailcap:mailcap文件处理

mailbox:多种格式控制邮箱

mimetypes:文件名与MIME类型映射

base64:RFC3548:Base16、Base32、Base64编码

binhex:binhex4文件编码与解码

binascii:二进制码与ASCII码间的转化

quopri:MIMEquoted - printable数据的编码与解码

uu:uuencode文件的编码与解码

互联网协议与支持

webbrowser:简易Web浏览器控制器

cgi:CGI支持

cgitb:CGI脚本反向追踪管理器

wsgiref:WSGI工具与引用实现

urllib:URL处理模块

urllib.request:打开URL连接的扩展库

urllib.response:urllib模块的响应类

urllib.parse:将URL解析成组件

urllib.error:urllib.request引发的异常类

urllib.robotparser:robots.txt的解析器

http:HTTP模块

http.client:HTTP协议客户端

ftplib:FTP协议客户端

poplib:POP协议客户端

imaplib:IMAP4协议客户端

nntplib:NNTP协议客户端

smtplib:SMTP协议客户端

smtpd:SMTP服务器

telnetlib:Telnet客户端

uuid:RFC4122的UUID对象

socketserver:网络服务器框架

http.server:HTTP服务器

http.cookies:HTTPCookie状态管理器

http.cookiejar:HTTP客户端的Cookie处理

xmlrpc:XML - RPC服务器和客户端模块

xmlrpc.client:XML - RPC客户端访问

xmlrpc.server:XML - RPC服务器基础

ipaddress:IPv4 / IPv6控制库

多媒体

audioop:处理原始音频数据

aifc:读写AIFF和AIFC文件

sunau:读写Sun AU文件

wave:读写WAV文件

chunk:读取IFF大文件

colorsys:颜色系统间转化

imghdr:指定图像类型

sndhdr:指定声音文件类型

ossaudiodev:访问兼容OSS的音频设备

国际化

gettext:多语言的国际化服务

locale:国际化服务

编程框架

turtle:Turtle图形库

cmd:基于行的命令解释器支持

shlex:简单词典分析

Tk图形用户接口

tkinter:Tcl / Tk接口

tkinter.ttk:Tk主题控件

tkinter.tix:Tk扩展控件

tkinter.scrolledtext:滚轴文本控件

开发工具

pydoc:文档生成器和在线帮助系统

doctest:交互式Python示例

unittest:单元测试框架

unittest.mock:模拟对象库

test:Python回归测试包

test.support:Python测试工具套件

venv:虚拟环境搭建

调试

bdb:调试框架

faulthandler:Python反向追踪库

pdb:Python调试器

timeit:小段代码执行时间测算

trace:Python执行状态追踪

运行时

sys:系统相关的参数与函数

sysconfig:访问Python配置信息

builtins:内置对象

main:顶层脚本环境

warnings:警告控制

contextlib:with状态的上下文工具

abc:虚基类

atexit:出口处理器

traceback:打印或读取一条栈的反向追踪

future:未来状态定义

gc:垃圾回收接口

inspect:检查存活的对象

site:址相关的配置钩子(hook)

fpectl:浮点数异常控制

distutils:生成和安装Python模块

解释器

code:基类解释器

codeop:编译Python代码

导入模块

imp:访问import模块的内部

zipimport:从ZIP归档中导入模块

pkgutil:包扩展工具

modulefinder:通过脚本查找模块

runpy:定位并执行Python模块

importlib:import的一种实施

Python语言

parser:访问Python解析树

ast:抽象句法树

symtable:访问编译器符号表

symbol:Python解析树中的常量

token:Python解析树中的常量

keyword:Python关键字测试

tokenize:Python源文件分词

tabnany:模糊缩进检测

pyclbr:Python类浏览支持

py_compile:编译Python源文件

compileall:按字节编译Python库

dis:Python字节码的反汇编器

pickletools:序列化开发工具

其他

formatter:通用格式化输出

Windows相关

msilib:读写Windows的Installer文件

msvcrt:MS VC + + Runtime的有用程序

winreg:Windows注册表访问

winsound:Windows声音播放接口

Unix相关

posix:最常用的POSIX调用

pwd:密码数据库

spwd:影子密码数据库

grp:组数据库

crypt:Unix密码验证

termios:POSIX风格的tty控制

tty:终端控制函数

pty:伪终端工具

fcntl:系统调用fcntl()和ioctl()

pipes:shell管道接口

resource:资源可用信息

nis:Sun的NIS的接口

syslog:Unix 日志服务

以上就是对Python内置各个模块的简要总结,建议收藏此文,后面做项目时再从中检索。欢迎大家在留言中补充你常用的Python模块。

如果文章对你有帮助,欢迎转发/点赞/收藏~

来源:Python与算法社区


_往期文章推荐_





以上是关于Python csv库整理(部分)的主要内容,如果未能解决你的问题,请参考以下文章

python 部分第三方库使用整理(PyInstallerjiebawordcloud自动化安装脚本)

python:datetime库相关整理

把Python的200个标准库分类整理了下,供参考

python转换xsl到csv与整理json

python的pandas库读取csv

如何在没有csv库python的情况下写入csv文件