4、pandas的数据筛选之isin和str.contains函数

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了4、pandas的数据筛选之isin和str.contains函数相关的知识,希望对你有一定的参考价值。

参考技术A 筛选是在平时的工作中使用非常频繁的功能,前文介绍了loc和iloc的筛选方法,现在继续介绍一些筛选的方法。

以>,<,==,>=,<=来进行选择(“等于”一定是用‘==’,如果用‘=’就不是判断大小了):

使用 &(且) 和 |(或) 时每个条件都要用小括号括起来。

选取多列一定是 两个 方括号,其中内侧方括号代表是一个list:

如果要选择某列等于多个数值或者字符串时,要用到.isin(), 我们把df修改了一下( isin()括号里面应该是个list ):

平时使用最多的筛选应该是字符串的模糊筛选,在SQL语句里用的是like,在pandas里我们可以用.str.contains()来实现。

也可以使用  '|'  来进行多个条件的筛选:

注意,这个‘|’是在引号内的,而不是将两个字符串分别引起来。 ’&‘在这里不能用。

如果中间的.str不用的话,就会出错,提示‘Series’数组没有‘contains'函数。

其实.str的作用就是将’Series‘转换为类似Strings的结构,然后就可以用contains函数了。

以上是关于4、pandas的数据筛选之isin和str.contains函数的主要内容,如果未能解决你的问题,请参考以下文章

pandas基于列表内容对dataframe数据行进行筛选(isin函数)实战:Filter DataFrame rows on a list of values

14.pandas里面按条件筛选

pandas DataFrame数据筛选和切片

100天精通Python(数据分析篇)——第69天:Pandas常用数据筛选方法(betweenisinlociloc)

Pandas经典用法:数据筛选之iloc和loc

Pandas高级数据分析快速入门之数据筛选——分组排序筛选实践笔记