python中dataframe常见操作:取行列切片统计特征值
Posted 子非鱼安知我命
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python中dataframe常见操作:取行列切片统计特征值相关的知识,希望对你有一定的参考价值。
mport numpy as np
import pandas as pd
# iloc 主要用于索引取值
df = pd.DataFrame(np.arange(20).reshape(5, 4), index=list(‘ABCDE‘), columns=list(‘wxyz‘))
print(df)
# 取指定行
print(df.head(2))
print(df[1:2])
print(df.tail(4))
# 统计列数
print(df.columns.size)
# 统计数据行数
print(len(df))
# 打印行名
print(df.index)
# 打印列名
print(df.columns)
# 指定行数
print(df.describe().iloc[3])
# 指定某列
print(df[‘z‘])
# 指定某行
print(df.loc[‘C‘])
# 切片所有行,指定列
print(df.loc[:,[‘x‘,‘y‘]])
# 切片指定行,指定列
print(df.loc[[‘A‘,‘D‘],[‘w‘,‘z‘]])
# 连续切片 iloc 不连续用loc
print(df.iloc[2:4,2:4])
# 根据数字比较 只打印大于2的数字
print(df[df>2])
# 根据列名比较 只打印大于2的行数
print(df[df.x>5])
# 复制数组
df2 = df.copy()
print(df2)
#表显示满足条件:指定列x中的值包含‘5‘和‘13‘的所有行
print(df2[df2[‘x‘].isin([‘5‘,‘13‘])])
# 计算列平均值
print(df.mean())
# 计算指定列中数字出现的个数
print(df[‘x‘].value_counts())
转:https://blog.csdn.net/tanlangqie/article/details/78656588
以上是关于python中dataframe常见操作:取行列切片统计特征值的主要内容,如果未能解决你的问题,请参考以下文章