pandas.read_csv() 部分参数解释

Posted bigtreei

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了pandas.read_csv() 部分参数解释相关的知识,希望对你有一定的参考价值。

read_csv()所有参数

pandas.read_csv(     
  filepath_or_buffer,     
  sep=‘,‘,     
  delimiter=None,     
  header=‘infer‘,     
  names=None,     
  index_col=None,     
  usecols=None,     
  squeeze=False,     
  prefix=None,     
  mangle_dupe_cols=True,     
  dtype=None,     
  engine=None,     
  converters=None,     
  true_values=None,     
  false_values=None,     
  skipinitialspace=False,     
  skiprows=None,     
  nrows=None,     
  na_values=None,     
  keep_default_na=True,     
  na_filter=True,     
  verbose=False,     
  skip_blank_lines=True,     
  parse_dates=False,     
  infer_datetime_format=False,     
  keep_date_col=False,     
  date_parser=None,     
  dayfirst=False,     
  iterator=False,     
  chunksize=None,     
  compression=‘infer‘,     
  thousands=None,     
  decimal=b‘.‘,     
  lineterminator=None,     
  quotechar=‘"‘,     
  quoting=0,     
  escapechar=None,     
  comment=None,     
  encoding=None,     
  dialect=None,     
  tupleize_cols=None,     
  error_bad_lines=True,     
  warn_bad_lines=True,       
  skipfooter=0,     
  doublequote=True,     
  delim_whitespace=False,     
  low_memory=True,     
  memory_map=False,     
  float_precision=None

参数用法

sep=,   # 以 “,” 作为数据的分隔符
shkiprows= 10   # 跳过前十行
nrows = 10   # 只取前10行
parse_dates = [col_name]   # 指定某行读取为日期格式
index_col = [col_1,col_2]   # 读取指定的几列
error_bad_lines = False   # 当某行数据有问题时,不报错,直接跳过,处理脏数据时使用
na_values = NULL   # 将NULL识别为空值

(后续补充)

 

  

 

以上是关于pandas.read_csv() 部分参数解释的主要内容,如果未能解决你的问题,请参考以下文章

pandas.read_csv

pandas中的read_csv参数详解

Python Pandas 中的引擎 read_csv

Pandas.read_csv:需要反斜杠分隔符?

是否可以将打开的文件传递给pandas read_csv

大 TSV 文件中主要为整数的字符串列的不一致 pandas read_csv dtype 推断