如何从DataFrame在谷歌存储中创建一个Json文件?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何从DataFrame在谷歌存储中创建一个Json文件?相关的知识,希望对你有一定的参考价值。

我有以下代码(Python 2.7):

import pandas as pd
....
pd.DataFrame(response2.json())['results'].to_json('orders.json', orient='records')

这会在我的本地项目中保存orders.json文件。我希望将文件写入我的Bucket on Google Storage而不是本地计算机。

是否可以直接生成文件到存储,还是必须在本地创建然后上传?

我知道应该是这样的:

from google.cloud import storage
storage_client = storage.Client()
bucket = storage_client.get_bucket("MyTestBucket")
blob = bucket.blob("folderName/" + blob?!)
blob.upload_from_filename("orders.json")  # Or something with writing the DataFrame?

有人可以帮忙吗?

答案

我发现使用datalab.storage可以更方便地将数据写入Google云端存储。

import datalab.storage as storage
import pandas as pd

# Define sample dataframe to write
df = pd.DataFrame(data=[{1,'product1','description1'},{2,'product2','description2'}],columns=['id','name','description'])

# Define your bucket and write to GCS
storage.Bucket('{your-bucket-name}').item('{folder}/{your-file}.json').write_to(df.to_json(),'text/json')

以上是关于如何从DataFrame在谷歌存储中创建一个Json文件?的主要内容,如果未能解决你的问题,请参考以下文章

如何在谷歌地图中创建一个带有气泡聊天背景的自定义标记,以及像调情地图这样的图像右上角的数字?

如何使用 C# 中的 Nuget 包在谷歌分析中创建自定义维度和自定义指标

如何使用 Java API 在谷歌云存储桶中创建一个空文件夹

如何在 Python 中创建DataFrame

如何使用我的 JSON 数据在谷歌地图 API 上创建标记?

如何从 Scala 中的 DataFrame 在 Spark 中创建分布式稀疏矩阵