python pandas使用chunksize异步拆分固定行数的文件
Posted hailuo
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python pandas使用chunksize异步拆分固定行数的文件相关的知识,希望对你有一定的参考价值。
import pandas as pd import asyncio from collections import defaultdict collect = defaultdict(list) #######创建处理一个对象的方法,并返回期物 async def dealone(chunk,sas): path=‘/data/chaifen/testphone_%d.txt‘%sas chunk.to_csv(path,index=False) return path async def submitor(chunk,sas): future = await dealone(chunk,sas) collect[‘res‘].append(future) #print(future) chunks = pd.read_csv(‘/data/testphone.txt‘,dtype=‘object‘,chunksize=3) loop = asyncio.get_event_loop() tasks = asyncio.wait([submitor(chunk,index) for index,chunk in enumerate(chunks,1)]) loop.run_until_complete(tasks) print(collect[‘res‘])
以上是关于python pandas使用chunksize异步拆分固定行数的文件的主要内容,如果未能解决你的问题,请参考以下文章
pandas读取大文件(chunksize)并通过sqlalchemy写入MySQL数据库
pandas read_csv读取大文件的Memory error问题