Python:azure-storage-blob 需要 6 分钟才能将 20MB 文件下载到本地

Posted

技术标签:

【中文标题】Python:azure-storage-blob 需要 6 分钟才能将 20MB 文件下载到本地【英文标题】:Python: azure-storage-blob takes 6 min to download a 20MB file to local 【发布时间】:2020-12-02 05:20:50 【问题描述】:

我必须从 Azure 存储下载 .parqeat 文件并分析数据。 所以我开始使用带有 azure-storage-blob 库和 Pandas 的 python 代码来存储 DataFrames 和烧瓶来创建响应 API。 但是现在 Azure 存储中的文件大小已增加到 30MB(一天文件),并且经过测试,将 20MB 文件下载到我的本地需要 6 分钟,这是我负担不起的,因为我必须分析一个月中每一天的文件,每个将有 20 MB。这几乎是 3020MB 大小。 有什么建议吗?

【问题讨论】:

【参考方案1】:

你找到答案了吗?如果没有代码 sn-p,就很难诊断出您的问题。 Azure Blob 存储支持并行读取。如果您有BatchServiceClient 服务,那将很简单。否则,请尝试Multiprocessing 模块。氪

【讨论】:

以上是关于Python:azure-storage-blob 需要 6 分钟才能将 20MB 文件下载到本地的主要内容,如果未能解决你的问题,请参考以下文章

在 azure 中创建 webjob 时出现 python 包安装错误

如何在 Python 中生成 Azure blob SAS URL?

如何检查/取消天蓝色的存储容器删除操作

尝试上传文件时出现异常

将多个 Blob 上传到 Azure 存储

代写python,代写python编程,python代写,python编程代写,留学生python代写