pandas根据数据类型筛选数据
Posted Data+Science+Insight
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了pandas根据数据类型筛选数据相关的知识,希望对你有一定的参考价值。
pandas根据数据类型筛选数据
pandas根据数据类型筛选对应的特征列,因为不同的数据类型列往往对应不同的后续特征处理方法。
select_dtypes是我们使用的主要函数,其中包含两个核心参数,include和exclude
我们将学习如何使用Pandas根据它们的数据类型选择列。例如,如果我们有多个数据类型的Pandas dataframe,
比如数值型和对象型,我们将学习如何选择数值型列,单独进行分析或者特征工程处理。
Syntax: DataFrame.select_dtypes(include=None, exclude=None)
Parameters :
include, exclude : A selection of dtypes or strings to be included/excluded. At least one of these parameters must be supplied.
Return : The subset of the frame including the dtypes in include and excluding the dtypes in exclude.
import pandas as pd
import numpy as np
data = {'产品':['肉类','盐铁','纺织','木材']*2,
'年份':[1046,1046,1046,1046,1047,1047,1047,1047],
'诸侯':['秦','齐','楚','燕','赵','魏','韩','西周'],
'产量':[180,140,300,200,150,60,80,320]}
df=pd.DataFrame(data, columns=['产品','年份','诸侯','产量'])
df
df.dtypes
# df.loc[:, df.dtypes == np.float64].head()
df.loc[:, df.dtypes == np.int64].head()
df.select_dtypes(include='number').head()
df.select_dtypes(include='object').head()
df.select_dtypes(exclude='object').head()
df.select_dtypes('float').head()
无返回内容
df.select_dtypes('int64').head()
integer_columns = df.select_dtypes(include=['int64']).columns
float_columns = df.select_dtypes(include=['float64']).columns
object_columns = df.select_dtypes(include=['object']).columns
need_columns = df.select_dtypes(include=['object','int64']).columns
need_columns
df.select_dtypes(include=['number']).head()
df.select_dtypes(include=['integer']).head()
df.select_dtypes(include=['floating']).head()
df.select_dtypes(include=[np.float64,np.int64]).head()
for i in df.columns[df.dtypes == 'object']:
print(i)
参考:Select Columns with Specific Data Types in Pandas Dataframe
参考:Select Columns with Specific Data Types in Pandas Dataframe
参考:Selecting Pandas Columns by dtype
以上是关于pandas根据数据类型筛选数据的主要内容,如果未能解决你的问题,请参考以下文章
请教用pandas处理数据时,如何对行数据进行筛选并赋值处理
pandas 日期数据处理大全,按照年、季度、月、周、日筛选数据
pandas获取dataframe数据列的数据类型获取dataframe每类数据类型数据列的个数使用select_dtypes函数include参数以及exclude参数按照数据类型筛选数据