PHP - 从 AWS 存储桶下载的文件的文件编码问题

Posted

技术标签:

【中文标题】PHP - 从 AWS 存储桶下载的文件的文件编码问题【英文标题】:PHP - file encoding issue with files downloaded from AWS bucket 【发布时间】:2016-05-30 09:54:24 【问题描述】:

php 中使用以下代码,我正在尝试从 AWS 存储桶下载文件。 我能够成功下载文件,但下载的文件不可读。文件编码设置为 ANSI。

在 AWS 存储桶中,该文件的元数据如下 内容类型:文本/csv;%20charset=utf-16le 内容编码:gzip



    require '/aws/aws-autoloader.php'; 
    use Aws\S3\S3Client;

    // Instantiate the S3 client with your AWS credentials
    $key = [access_key];
    $secret = [secret_key];

    $client = S3Client::factory(array(
        'credentials' => array(
            'key'    => $key,
            'secret' => $secret
        )
    ));


    $bucket = [bucket_name];
    $file=[bucket_file_location];
    $fileSaveAs = [download_file_location];

    // Get an object using the getObject operation & download file
    $result = $client->getObject(array(
        'Bucket' => $bucket,
        'Key'    => $file,
        'SaveAs' => $fileSaveAs
    ));

谁能解释一下,这里出了什么问题?

编辑 1: 当我直接从 AWS 存储桶下载此文件时,它下载得很好。

编辑 2: 我刚刚注意到下载的 CSV 文件总是 1KB 大小。

下载的文件损坏模式: `‹½”ÍJÃ@F¿µOÑPi+h]V[Tð§hâFÚ4HÐjI¬Ð—W¿¤

编辑 3: 所有这些文件都是使用 gsutil 从 Google play bucket 传输的

【问题讨论】:

您获得的内容可能已被压缩(如Content-Encoding 中所述)? gzdecode(file_get_contents($fileSaveAs)) 是否返回正确的内容? 是的,这解决了我的问题 【参考方案1】:

从 AWS 存储桶接收的文件是 gzip。 (内容编码:gzip)

所以需要使用gzdecode函数解码gzip压缩字符串

以下代码解决问题



    $content = gzdecode(file_get_contents($fileSaveAs));
    file_put_contents($fileSaveAs,$content);

【讨论】:

@Zudwa:感谢您的解决方案

以上是关于PHP - 从 AWS 存储桶下载的文件的文件编码问题的主要内容,如果未能解决你的问题,请参考以下文章

如何使用aws java sdk将文件从S3存储桶从一个区域复制到另一个区域?

Spring Boot Amazon AWS S3 存储桶文件下载 - 拒绝访问

从亚马逊s3桶下载文件的Javascript?

AWS:无法使用流从 SSE-KMS 加密存储桶下载文件

如何使用 gsutil 通过 http 链接从谷歌云存储下载到 AWS 实例或 s3 存储桶?

从客户端下载 AWS S3 文件