从 tar.gz 文件夹中读取 json 文件并转换为 pandas 数据框 [重复]

Posted

技术标签:

【中文标题】从 tar.gz 文件夹中读取 json 文件并转换为 pandas 数据框 [重复]【英文标题】:Read json files from tar.gz folders and convert to pandas dataframe [duplicate] 【发布时间】:2019-11-23 14:56:03 【问题描述】:

我从未使用过 json 文件,我的问题是我有几个文件夹 tar.gz 包含不同的 json 文件。从每个压缩文件夹中,我只需要读取 AAjson 文件,追加并转换为 pandas 数据框。我是这样尝试的

import os, re
import pandas as pd

import pandas as pd 
import tarfile
import json
from pandas.io.json import json_normalize

cd = "my_path"

dfList = []

for root, dirs, files in os.walk(cd):
 with tarfile.open("dirs", "r:*") as tar:
    for fname in files:
        if re.match("AA_*.json$", fname):
            data = json.load(fname)
            frame = pd.DataFrame.from_dict(json_normilized(data), 
orient='columns')
            dfList.append(frame)    

 df = pd.concat(dfList) 

我发现了错误

FileNotFoundError: [Errno 2] 没有这样的文件或目录:'dirs'

【问题讨论】:

【参考方案1】:
import pandas as pd
data = pd.read_json('filepath/filename')
data

【讨论】:

以上是关于从 tar.gz 文件夹中读取 json 文件并转换为 pandas 数据框 [重复]的主要内容,如果未能解决你的问题,请参考以下文章

java怎么将json文件读取进来并转成map

如何在水壶中解压缩和导入 .tar.gz 文件?

Gson使用google的JsonReader读取Json文件并转化成对象

读取 tar.gz 中的文件名或文件数

如何使用带有 gzip 压缩选项的 pandas read_csv 读取 tar.gz 文件?

.net core2.0添加json文件并转化成类注入控制器使用