将数据从excel导入Python时排除第一行
Posted
技术标签:
【中文标题】将数据从excel导入Python时排除第一行【英文标题】:Exclude first row when importing data from excel into Python 【发布时间】:2017-08-26 06:33:32 【问题描述】:我有部分代码可以将 excel 作为字符串导入 Python。将数据从excel导入Python时如何排除第一行?
import pandas as pd
data = pd.read_excel(".xlsx", parse_cols="A,C,E,G, I, K, M, O, Q, S, U, W, Y, AA, AC, AE, AG, AI, AK, AM, AO, AQ, AS, AU, AW, AY, BA, BC, BE, BG, BI, BK, BM, BO, BQ, BS, BU, BW, BY, CA, CC, CE, CG, CI, CK, CM, CO, CQ, CS, CU, CW, CY, DA, DC, DE, DG, DI, DK, DM, DO, DQ, DS, DU, DW, DY, EA, EC, DE, EG, EI, EK, EM, EO, EQ, ES, EU, EW, EY")
data = data.to_string()
【问题讨论】:
您是否希望避免使用data
中的标题?或者您在 excel 中是否有不必要的行。使用skiprows()
来避免读取标题可能不是正确的方法。你可以这样做:data.to_string(header=False)
避免使用标题。
只要skiprows()
就可以了,谢谢。
【参考方案1】:
pd.read_excel
方法的 pandas 文档提到了一个 skiprows
参数,您可以使用它来排除 excel 文件的第一行。
示例
import pandas as pd
data = pd.read_excel("file.xlsx", parse_cols="A,C,E,G", skiprows=[0])
来源:pandas docs
【讨论】:
嗨@Onel Harrison,你能帮忙解决这个问题吗? ***.com/questions/46751996/…【参考方案2】:为 read_excel 函数赋值给skiprows
参数。它会忽略标题
【讨论】:
注意:skiprows
并不意味着header
不是从第一个未跳过的行创建的,header=None
将避免从数据中创建header
【参考方案3】:
parse_cols 参数自 0.21.0 版起已弃用。相反,您应该使用 usecols:
usecols : int 或 list,默认无
如果 None 则解析所有列,如果 int 则指示最后一列 被解析 If list of ints then 表示要被解析的列号列表 parsed If string then表示Excel列的逗号分隔列表 字母和列范围(例如“A:E”或“A,C,E:F”)。范围是 包括双方。要排除第一行,请使用 skiprows=[0] 参数。
【讨论】:
以上是关于将数据从excel导入Python时排除第一行的主要内容,如果未能解决你的问题,请参考以下文章
SQL Server2014 任务导入数据导入Excel表操作无法完成