Python - 读取 JSON 大尺寸数据

Posted

技术标签:

【中文标题】Python - 读取 JSON 大尺寸数据【英文标题】:Python -Reading JSON large size data 【发布时间】:2013-11-29 02:27:10 【问题描述】:

我想在 Python/R 中读取 JSON 数据(12 GB)。

如果我使用 json.loads() 函数,它会出现内存错误。

我对数据一无所知。是否可以读取部分数据?

请帮忙

【问题讨论】:

如果您的 RAM 至少没有超过 12 GB,您将无法读取 12 GB。 看看这个:pymotw.com/2/json/#working-with-streams-and-files 数据是单个JSON对象吗?或者你能分成更小的块吗? 回答@Hamish的问题,很重要。 如果文件是不同行上的一堆 json 对象,那么单独解析每一行是微不足道的。如果没有,您将不得不使用流式解析器(qiangwang 和 PepperoniPizza 的建议),它可以让您在解析数据时观察数据,保留您需要的数据,然后丢弃其余数据。 【参考方案1】:

https://pypi.python.org/pypi/ijson/这可能会有所帮助。

搜索“python json sax parser”,可以得到其他解决方案。

【讨论】:

以上是关于Python - 读取 JSON 大尺寸数据的主要内容,如果未能解决你的问题,请参考以下文章

python json及mysql——读取json文件存sql数据库日期类型转换终端操纵mysql及python codecs读取大文件问题

下载大尺寸json时如何解决Uncaught RangeError

加快在python中读取非常大的netcdf文件

python读取大词向量文件

python读取大词向量文件

如何将各种尺寸的数组的Python列表保存到mat文件[重复]