Pandas的使用

Posted Harris-H

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Pandas的使用相关的知识,希望对你有一定的参考价值。

Pandas的使用

1.读取数据

读取数据的类型:

  • csv文件
  • txt文件
  • xlsx格式excel文件
  • mysql数据表

读取csv

import pandas as pd
# 读取csv
fpath = "./datas/ml-latest-small/ratings.csv"
# 使用pd.read_csv读取数据
ratings = pd.read_csv(fpath)
# 查看前几行数据
ratings.head()
# 查看数据的形状,返回(行数、列数)
ratings.shape
# 查看列名列表
ratings.columns
# 查看索引列
ratings.index
# 查看每列的数据类型
ratings.dtypes

在这里插入图片描述

读取txt

fpath = "./datas/crazyant/access_pvuv.txt"
pvuv = pd.read_csv(
    fpath,
    sep="\\t",
    header=None,
    names=['pdate', 'pv', 'uv']
)
pvuv

在这里插入图片描述

读取excel

fpath = "./datas/crazyant/access_pvuv.xlsx"
pvuv = pd.read_excel(fpath)
pvuv

在这里插入图片描述

读取mysql数据库

import pymysql
conn = pymysql.connect(
        host='127.0.0.1',
        user='root',
        password='xxxxxx',
        database='test',
        charset='utf8'
    )
mysql_page = pd.read_sql("select * from crazyant_pvuv", con=conn)
mysql_page

在这里插入图片描述


2.数据结构

  • Series

    • Series是一种类似于一维数组的对象,它由一组数据(不同数据类型)以及一组与之相关的数据标签(即索引)组成。
  • DataFrame

    • DataFrame是一个表格型的数据结构

      • 每列可以是不同的值类型(数值、字符串、布尔值等)
      • 既有行索引index,也有列索引columns
      • 可以被看做由Series组成的字典

      创建dataframe最常用的方法,见02节读取纯文本文件、excel、mysql数据库

    Series的相关操作

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述


DataFrame的相关操作

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

loc是返回指定 i n d e x index index的行数据。

注意:与python切片不同,loc 的切片是包含末尾的!!!


3.查询数据

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

pandas使用loc函数可以较为方便的查询数据。


学习视频

传送门

以上是关于Pandas的使用的主要内容,如果未能解决你的问题,请参考以下文章

text [检查特定的数据片段]取自论文但有意思应用。 #python #pandas

Python:用于元组的 Pandas DataFrame

pandas 求两个时间差, 转化秒,判断时间差是否大于阈值

将pandas列中的列表列表转换为字符串

微信小程序代码片段

webstorm代码片段的创建