07-pandas双索引

Posted wcymiracle

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了07-pandas双索引相关的知识,希望对你有一定的参考价值。

import numpy as np
import pandas as pd
from  matplotlib import  pyplot as plt
nasa=pd.read_table(r"Y:WorkplaceBigDatapercent-bachelors-degrees-women-usa.txt")
def str2float(tallstr):#测试数据转换
    try:
        return float(tallstr)
    except:
        return np.nan

nasa["身高"]=nasa["身高"].map(str2float)#遍历数据且清理
print(nasa["身高"].isnull().sum())#统计nan
print(nasa[nasa["身高"].isnull()].index)#统计哪一行非法

newnasa=nasa.dropna()#去除垃圾数据
result=newnasa.groupby("年龄")["身高"]#根据年龄和身高分组

def age_mean(group):#判断每一组
    if group.size<100:#小于100cm当作nan
        return np.nan
    else:
        return group.mean()#返回平均值
last_retult=result.apply(age_mean)#保存结果,调用函数处理年龄身高分组
last_retult.head(10)#查看前十个

last_retult[0:30].plot()#画图,前30个

  

以上是关于07-pandas双索引的主要内容,如果未能解决你的问题,请参考以下文章

为什么在转换const双索引参数时会得到-Wincompatible-pointer-types警告

LeetCode443-压缩字符串(双索引)

python高级算法与数据结构:使用treap实现双索引1

python高级算法与数据结构:使用treap实现双索引1

python高级算法与数据结构:使用treap实现双索引2

20160219.CCPP体系详解(0029天)