根据行号删除数据框的行

Posted

技术标签:

【中文标题】根据行号删除数据框的行【英文标题】:Remove rows of a dataframe based on the row number 【发布时间】:2019-09-15 00:49:58 【问题描述】:

假设我有一个数据框 (DF) 并且我有一个这样的数组:

rm_indexes = np.array([1, 2, 3, 4, 34, 100, 154, 155, 199])

我想从DF 中删除rm_indexes 中的行号。 rm_indexes 中的一个表示第一行(DF 的第二行),三表示数据帧的第三行,依此类推(第一行为 0)。该数据帧的索引列是时间戳

PS。我有许多相同的时间戳作为数据帧的索引。

【问题讨论】:

【参考方案1】:

试试:

df.drop(df.index[rm_indexes])

示例

import pandas as pd

df = pd.DataFrame("A":[0,1,2,3,4,5,6,7,8],
                   "B":[0,1,2,3,4,5,6,7,8],
                   "C":[0,1,2,3,4,5,6,7,8])

pos = [0,2,4]
df.drop(df.index[pos], inplace=True)

输出

    A   B   C
1   1   1   1
3   3   3   3
5   5   5   5
6   6   6   6
7   7   7   7
8   8   8   8

编辑,在 OP 提供的进一步规范之后:具有相同索引的多行

df = pd.DataFrame("A":[0,1,2,3,4,5,6,7,8],
                   "B":[0,1,2,3,4,5,6,7,8],
                   "C":[0,1,2,3,4,5,6,7,8],,
                   index=["a","b","b","a","b","c","c","d","e"])
df['idx'] = df.index

pos = [1]
df.reset_index(drop=True, inplace=True)
df.drop(df.index[pos], inplace=True)
df.set_index('idx', inplace=True)

输出

    A   B   C
idx         
a   0   0   0
b   2   2   2
a   3   3   3
b   4   4   4
c   5   5   5
c   6   6   6
d   7   7   7
e   8   8   8

【讨论】:

我检查了这个。我认为这里的问题是我的时间戳与我的索引相同。因此,假设我通过您的方法删除了第 2 行。它不仅会删除第二行,还会删除所有其他类似的时间戳。【参考方案2】:

您可以简单地按索引删除。这将通过索引 1、2、3、4..etc 删除 df 中的条目。199。

df.reset_index()    #this will change the index from timestamp to 0,1,2...n-1
df.drop([1, 2, 3, 4, 34, 100, 154, 155, 199])  # will drop the rows
df.index = df['myTimeStamp']  # this will restore the index back to timestamp

【讨论】:

这个数据框的索引列是时间戳 哦..你改变了SO问题。索引是时间戳。让我编辑一下。 df.reset_index(inplace=True)drop 也是如此。 我应该添加一个名为myTimeStamp 的新列吗?我认为第三行应该是df.index = df['time']

以上是关于根据行号删除数据框的行的主要内容,如果未能解决你的问题,请参考以下文章

从数据框的行中删除仅包含数字的字符串

Pandas - Python,根据日期列删除行

根据某个(非零)值删除数据帧(熊猫)中的行[重复]

根据条件对 BigQuery 中的行进行重复数据删除

plsql怎样根据表的行号查询数据

如何根据要删除的行调整其他行数据