管理 MySQL 数据的最快方法是啥?熊猫与 fetch_row

Posted

技术标签:

【中文标题】管理 MySQL 数据的最快方法是啥?熊猫与 fetch_row【英文标题】:What is a fastest way to manage MySQL data? pandas vs fetch_row管理 MySQL 数据的最快方法是什么?熊猫与 fetch_row 【发布时间】:2018-09-11 18:56:12 【问题描述】:

我想知道我从 mysql 收到的管理数据的常用和更好的方法是什么。

db = MySQLdb.connect(host="####", user="####", passwd="####", db="####", charset='utf8')
db.query(sql)
result = db.use_result()

我使用 use_result() 因为数据非常大(大约 9000000 行)而且我没有太多 RAM。

之后,我将按每行处理此数据行

line = result.fetch_row(maxrows=1, how=1)[0]
#creating objects from lines 

但我找到了另一种使用 pandas DataFrame 管理 MySQL 数据的方法

df = pd.read_sql_query('SQL QUERY', con= db)

所以问题很简单——什么更好?

附:我无法真正测试我便宜的笔记本电脑上什么速度更快,因为这个程序的执行时间从 170 秒到 250 秒波动。

【问题讨论】:

【参考方案1】:

在较小的数据集上进行测试。

如果您不使用极小的数据集进行测试,性能将是相同的。

【讨论】:

以上是关于管理 MySQL 数据的最快方法是啥?熊猫与 fetch_row的主要内容,如果未能解决你的问题,请参考以下文章

用二维窗口计算滚动函数的最快方法是啥?

在 MySQL 数据库中进行 REGEXP 查找和替换的最快方法是啥?

过滤熊猫数据框中值的最快方法

从熊猫数据框中消除特定日期的最快方法

70GB数据库 最快导入,导出成sql文件的方法是啥?

从属性中建立核心数据关系的最快方法是啥?