pandas从数据库读取数据

Posted wangcc7

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了pandas从数据库读取数据相关的知识,希望对你有一定的参考价值。

因为本周有一个是需要使用pandos做一个数据分析的需求,所以在这里做一下记录。

Python中用Pandas进行数据分析,最常用的就是Dataframe数据结构,
这里我们主要介绍Pandas如何读取数据到Dataframe。

  1. Pandas读取mysql数据要读取Mysql中的数据,首先要安装Mysqldb包。假设我数据库安装在本地,用户名位myusername,密码为mypassword,要读取mydb数据库中的数据,那么对应的代码如下:
import pandas as pd
import MySQLdb
mysql_cn= MySQLdb.connect(host=‘localhost‘, port=3306,user=‘myusername‘, passwd=‘mypassword‘, db=‘mydb‘)
df = pd.read_sql(‘select * from test;‘, con=mysql_cn)    
mysql_cn.close()

上面的代码读取了test表中所有的数据到df中,而df的数据结构为Dataframe。

  1. Pandas读取csv文件数据Pandas读取csv文件中的数据要简单的多,不用额外安装程序包,假设我们要读取test.csv中的数据, 对应的代码如下:
df = pd.read_csv(loggerfile, header=None, sep=‘,‘)

header=None表示没有头部,sep=’,’表示字段之间的分隔符为逗号。


关于对数据分析的思考
这里的需求是根据本周的数据得到对比上周的数据的环比趋势等信息。但是由于数据一直都是增量更新到数据库,所以需要用需要使用时间字段控制查询范围,
这里补充几个关于数据库查询的sql
查询今天的数据
select * from tj where to_days(now()) = to_days(tjsj)
查询z昨天的数据
select * from tj where to_days(now()) - to_days(tjsj) = 1
查询本周数据
select * from tj where tjsj >= subdate(curdate(),date_format(curdate(),‘%w‘)-1) and tjsj <= subdate(curdate(),date_format(curdate(),‘%w‘)-7)
查询上周数据
select * from tj where tjsj >= subdate(curdate(),date_format(curdate(),‘%w‘)+6) and tjsj <= subdate(curdate(),date_format(curdate(),‘%w‘)-0)

需求完成阶段如下:
1、使用数据库查询sql,查询出符合条件的上周数据。 查询创建时间是上周,或者更新时间是上周的数据。
2、使用数据库查询sql,查询出符合条件的本周数据。 查询创建时间是本周,或者更新时间是本周的数据。
3、进行数据分析的工作,得到想要的数据。分析1、2 得到的数据,并且进行运算。
计划本工作两日完成。

以上是关于pandas从数据库读取数据的主要内容,如果未能解决你的问题,请参考以下文章

我无法从 android 的片段中读取活动中的数据库信息

使用 pandas Python (pandas.io.parsers.TextFileReader) 从文件中读取数据时出现问题

官方推荐:6种Pandas读取Excel的方法,正确答案都写在源代码里了~太方便了

将文件从私有 S3 存储桶读取到 pandas 数据帧

pandas从excel读取数据数字类型过长出现科学计数法的问题

Pandas从入门到实战(day1)