从aws glue pyspark作业中的s3加载JSON

Question

我正在尝试从glue pyspark脚本中的s3存储桶中检索JSON文件。

我在aws glue里面的工作中运行这个函数：

def run(spark):
    s3_bucket_path = 's3://bucket/data/file.gz'

    df = spark.read.json(s3_bucket_path)
    df.show()

在此之后我得到：AnalysisException：u'Path不存在：s3：//bucket/data/file.gz;'

我搜索了这个问题，并没有找到任何类似的东西来推断出问题的位置。我认为访问存储桶可能存在权限问题，但错误消息应该不同。