Pandas的应用

Posted yuello

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Pandas的应用相关的知识,希望对你有一定的参考价值。

pandas:是一个数据分析的类库

dataframe数据读入
read_json
html
csv
excel
sql
数据写出 to_json
html
csv
excel
sql

数据结构

第一个 series :是一个一维的ndarray , 带有标签 可以通过标签作为索引
尺度不能改变,里面的数据可以改变
series
import pandas as pd
s=pd.Series([1,2,3,45],index=[‘a‘,‘b‘,‘c‘,‘d‘,‘e‘])
print(s[2])
print(s[‘c‘])
可以通过标签获取数据,也可以通过索引下标来获取(前提需要导入包)


第二个 dataframe :是一个二维的ndarray ,带有标签(行 ,列) 可以通过行列标签索引,
尺度可变,数据可变
创建csv文件,esc shift +zz 保存
查看文件 cat +文件名
在pandas里读取 df = pd.read_csv(‘students.csv‘)
df.head() #显示数据

a = df[["name","score"]] #取得名称和分数 sclect
a.head()

b = df[df["sex"] == ‘男‘] #取得男生信息 where
b.head()

c = df.iloc[:3] limit # loc 以标签索引 显示三条数据 iloc 以下标索引 显示四条数据
c.head()

遍历只能得到列 得不到元素
for c in df: df.iteritems(): #得到元素
print(c)
name
age
sex
score


数据访问和变换,统计
select
where
limit
loc 以标签索引
iloc 以下标索引

数据展示

保存文件 单独保存付费的文件
import pandas as pd

df = pd.read_csv("kgc.csv")
df1 = df[df[‘price‘]!=‘免费‘]
df1.to_csv(‘付费.csv‘,encoding=‘utf-8‘)
















































以上是关于Pandas的应用的主要内容,如果未能解决你的问题,请参考以下文章

对 Pandas 数据框逐元素应用条件

Pandas库:从入门到应用

使用 pandas 将 Flask 应用程序部署到 Elastic Beanstalk

Pandas - 在循环中应用多索引标签

Pandas的应用

为啥 Pandas 应用可以比矢量化内置函数更快 [重复]