根据列子字符串删除记录

Posted

技术标签:

【中文标题】根据列子字符串删除记录【英文标题】:Drop records based on column sub-string 【发布时间】:2022-01-01 20:02:03 【问题描述】:

目标:根据第 2 列 index 1 子字符串从 Dataframe 中删除记录。

我试过了:

df = df[df[1] != '305-1']
df = df[df[1] != '305-2']

但是,这是一个绝对值,而不是子字符串。

df:

    1   2   3
0   Emissions   305-1~GHG emissions in metric tons of CO2e~Gro...   Emissions for Gross direct (Scope 1) GHG emiss...
1   Emissions   305-3~GHG emissions in metric tons of CO2e~Bio...   Emissions for Biogenic CO2 emissions was 14681...
2   Emissions   305-2~Direct (Scope 1) GHG emissions by gas~CO2 Emissions for CO2 was 107973 tons in year 2014...
3   Emissions   305-2~Direct (Scope 1) GHG emissions by gas~N20 Emissions for N20 was 91661 tons in year 2014,...
4   Emissions   305-3~Direct (Scope 1) GHG emissions by gas~HFCs    Emissions for HFCs was 31744 tons in year 2014...

期望的输出df:

1   Emissions   305-3~GHG emissions in metric tons of CO2e~Bio...   Emissions for Biogenic CO2 emissions was 14681...
4   Emissions   305-3~Direct (Scope 1) GHG emissions by gas~HFCs    Emissions for HFCs was 31744 tons in year 2014...

如果还有什么我可以添加到帖子中的,请告诉我。

【问题讨论】:

【参考方案1】:

Series.str.contains| 一起用于按位or~ 的反转掩码:

df[~df[1].str.contains('305-1|305-2')]

或在[] 中指定值:

df[~df[1].str.contains('305-[12]')]

【讨论】:

有效!谢谢@jezrael :) 将在 12 分钟内接受 Ty 更新;使其成为单线

以上是关于根据列子字符串删除记录的主要内容,如果未能解决你的问题,请参考以下文章

根据列子集删除重复项,保留列 E 中具有最高值的行,如果 E 中的值相等,则列 B 中具有最高值的行

查询及删除重复记录

Oracle SQL 根据列删除重复记录

MySql根据字段名查询重复记录并删除!只保留一条

根据查询输出删除记录

我想根据id批量删除几条记录,该怎么写sql语句,我用的数据库是mysql!