pandas读取大文件(chunksize)并通过sqlalchemy写入MySQL数据库

Posted Data+Science+Insight

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了pandas读取大文件(chunksize)并通过sqlalchemy写入MySQL数据库相关的知识,希望对你有一定的参考价值。

pandas读取大文件(chunksize)并通过sqlalchemy写入MySQL数据库

 

在pandas中读取表类文件的时候有一个参数chunksize,只要指定了这个参数的数值,那么得到的结果就不是一个DataFrame对象,而是一个TextFileReader,这个对象是一个生成器对象。

ORM 全称 Object Relational Mapping, 翻译过来叫对象关系映射。简单的说,ORM 将数据库中的表与面向对象语言中的类建立了一种对应关系。这样,我们要操作数据库,数据库中的表或者表中的一条记录就可以直接通过操作类或者类实例来完成。

 

SQLAlchemy 是Python 社区最知名的 ORM 工具之一,为高效和高性能的数据库访问设计,实现了完整的企业级持久模型。

 

使用pip安装必须的python包;

pip install pandas
pip install matplotlib
pip install sqlalchemy

import相应的类库或者函数:

import pandas as pd
import mysql.connector
from sqlalchemy import types, create_engine

建立数据库连接:

# MySQL Connection
MYSQL_USER 		= \'root\'
MYSQL_PASSWORD 	= \'root\'
MYSQL_HOST_IP 	= \'127.0.0.1\'
MY

以上是关于pandas读取大文件(chunksize)并通过sqlalchemy写入MySQL数据库的主要内容,如果未能解决你的问题,请参考以下文章

从数据库读取并写入本地驱动器,大数据

如何在不连接的情况下读取 Python 数据框中的数据?

在R中将大文件分成小文件

读取大文件(> 2GB)(文本文件包含以太网数据)并通过不同参数随机访问数据的最佳方法是啥?

python pandas使用chunksize异步拆分固定行数的文件

如何在 Python 数据框中分块读取数据?