python pandas使用chunksize异步拆分固定行数的文件

Posted hailuo

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python pandas使用chunksize异步拆分固定行数的文件相关的知识,希望对你有一定的参考价值。

import pandas as pd
import asyncio
from collections import defaultdict


collect = defaultdict(list)

#######创建处理一个对象的方法,并返回期物
async def dealone(chunk,sas):
	path=‘/data/chaifen/testphone_%d.txt‘%sas
	chunk.to_csv(path,index=False)
	return path

async def submitor(chunk,sas):
	future = await dealone(chunk,sas)
	collect[‘res‘].append(future)
	#print(future)


chunks = pd.read_csv(‘/data/testphone.txt‘,dtype=‘object‘,chunksize=3)

loop = asyncio.get_event_loop()
tasks = asyncio.wait([submitor(chunk,index) for index,chunk in enumerate(chunks,1)])
loop.run_until_complete(tasks)
print(collect[‘res‘])

  

以上是关于python pandas使用chunksize异步拆分固定行数的文件的主要内容,如果未能解决你的问题,请参考以下文章

使用pandas的Python多处理并非所有进程都一次运行

pandas读取大文件(chunksize)并通过sqlalchemy写入MySQL数据库

pandas read_csv读取大文件的Memory error问题

100天精通Python(数据分析篇)——第58天:Pandas读写数据库(read_sqlto_sql)

如何在 Python 数据框中分块读取数据?

将一个pandas数据帧列表连接在一起