使用 Pandas 删除 Python 中的多余行 [重复]

Posted

技术标签:

【中文标题】使用 Pandas 删除 Python 中的多余行 [重复]【英文标题】:Deleting Excess Rows in Python with Pandas [duplicate] 【发布时间】:2021-04-18 19:19:15 【问题描述】:

我有一个 python 脚本,它使用 python 的 pylightxl 将我们组织的数据重组为不同的形状。但是这个脚本只适用于数据少于 5000 行的 excel 文件,这是标准格式。但是有些文件会达到 65000 行,在 5000 索引之后包含不必要的数据。

我想要的是在第 5000 个索引之后删除多余的行。 Pylightxl 无法做到这一点。只有 pandas 可以,我已经在互联网上搜索了如何使用 pandas 删除行,但到目前为止我找到的答案并没有让我受益。

问题是我如何使用 python pandas 删除多余的行(我们可能不知道它的限制,它可以达到 200000),但截止索引是 5000 行。

如果你知道 pandas 以外的其他 python 方式,也请回答。

【问题讨论】:

到目前为止你有什么尝试? 请提供文件输入格式 你在使用pandas.read_excel吗?它有一个nrows 参数。 我在 pandas 数据框中尝试了 drop 方法。输入文件是 csv 或 xls read_excelread_csv 都有 nrows 【参考方案1】:

您可以只获取前 5000 行并使用它,而不是删除它

【讨论】:

pd.read_csv("my_file.csv", nrows=5000) 好吧,你是对的......让我看看 请添加示例说明如何操作。 nrows 参数也可用于pd.read_excel() 对不起,我以为我做到了,如果您仍然需要一个***评论应该这样做

以上是关于使用 Pandas 删除 Python 中的多余行 [重复]的主要内容,如果未能解决你的问题,请参考以下文章

根据列值删除Python Pandas中的DataFrame行[重复]

如何从 Python 中的数据中删除多余的逗号

python--pandas删除

pandas如何删除指定行

在 Python Pandas 中删除多列中的所有重复行

在 Python Pandas 中删除多列中的所有重复行