Pandas基础——一文详不尽

Posted Pigou_

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Pandas基础——一文详不尽相关的知识,希望对你有一定的参考价值。

Transforming DataFrames

本节主要是将pandas处理数据的基本内容,为后面的内容打好基础。
本文大致可以分为探索性分析,数据集如何拆分,数据如何筛选,如何运用符等

import pandas as pd
DF = pd.DataFrame(xxxx)

# 我只是想告诉你DataFrame被简化为DF,后文简称DF [Dog.jpg]

探索DF整体

这里主要是看数据集里的整体部分,当你拿到数据集后应该是先对数据集的整体进行一个观察和探索

  • 看数据的前几行就用head()

  • 观察每列的信息用info()

  • DF的数据大小用shape

  • 描述性统计每列用describe()

!值得注意的是,df.shape 后面没有括号!

------------------------------手动分割------------------------------

探索DF细节

这里是要告诉你可以用如下的methods去看看df里面

values 就是生成一个二维的numpy数组

columns 查看每列的名称

index 可以查看每行的行名称

------------------------------手动分割------------------------------

行排序

sort.values里面如果需要降序需要用到 ascending,默认是True(升序),ascending = False就是降序了

注意:sort_values()是小括号不是中括号,如果选择的是一列直接用引号,多列就要把这些列再用中括号框起来。

如果有要求说,先对x1列进行升序排列,再按x2列进行降序排列,用一行写出来,那就是:

df.sort_values(["x1", "x2"], ascending=[True, False])
------------------------------手动分割------------------------------

选取对自己有用的 列

这里就是分别列举了取一列和多列之间的区别

------------------------------手动分割------------------------------

选取对自己有用的 行

总得来说 行列的区别其实就是一个是特征维度,一个是在该特征下的数值。所以选取行不仅要将列选出来,也要给予特定的条件让python去选取行,为什么这么选

多条件筛选的话记得用 & 作为连接,用&说明的是两个条件都需要满足,是交集。不同的条件需要用()括起来表示这个为其中一个筛选条件

------------------------------手动分割------------------------------

行处理相关的操作符

Subsetting rows by categorical variables

用 ” | “ 代表or,表示条件 ”或者“,这表示满足其中一个条件即可,为并集。

isin()的含义就是字面上的意思:is in。表示在这个数据里面,包含了什么什么,要筛选出来。

比如下面的代码和结果。代码将根据列表‘canu’去找在‘state’列下包含列表中的内容。

这里值的注意的是isin()里面是一个列表

# The Mojave Desert states
canu = ["California", "Arizona", "Nevada", "Utah"]

# Filter for rows in the Mojave Desert states
mojave_homelessness = homelessness[homelessness['state'].isin(canu)]

# See the result
print(mojave_homelessness)

------------------------------手动分割------------------------------

添加新的列

# 固定搭配
df['new_column'] = xxxxx

添加新的列就直接在df后面框起来写上列的名字就完成一半了,等号后面一般可以接一下其他筛选条件和计算条件。

Reference

学习网站:datacamp
链接地址:https://campus.datacamp.com/

以上是关于Pandas基础——一文详不尽的主要内容,如果未能解决你的问题,请参考以下文章

一文真正搞懂Java中的自然排序和定制排序,到底升序还是降序

如何使用pandas groupby对一些行降序和一些行升序排序

#yyds干货盘点#登天之梯——Pandas快速入门(下)

MySQL查询基础

Pandas_简单排序复杂排序

select语句对对查询结果排序时,用( )子句指定排序字段,使用( )指定升序,使用( )降序。