如何使用 lambda 函数从 AWS s3 获取文本文件的内容?

Posted

技术标签:

【中文标题】如何使用 lambda 函数从 AWS s3 获取文本文件的内容?【英文标题】:How to get contents of a text file from AWS s3 using a lambda function? 【发布时间】:2015-08-19 12:24:28 【问题描述】:

我想知道是否可以为 AWS 设置一个 lambda 函数,只要将新文本文件上传到 s3 存储桶中就会触发。在函数中,我想获取文本文件的内容并以某种方式处理它。我想知道这是否可能......?

例如,如果我上传 foo.txt,内容为 foobarbaz,我想以某种方式在我的 lambda 函数中获取 foobarbaz,以便我可以用它做一些事情。我知道我可以从 getObject 或类似方法中获取元数据。

谢谢!

【问题讨论】:

【参考方案1】:

S3 对象键和存储桶名称通过 event 参数传递到您的 Lambda 函数。然后,您可以从 S3 获取对象并读取其内容。

从 Lambda event 中检索存储桶和对象键的基本代码如下:

exports.handler = function(event, context, callback) 
   const bkt = event.Records[0].s3.bucket.name;
   const key = decodeURIComponent(event.Records[0].s3.object.key.replace(/\+/g, ' '));
;

一旦你有了bucket和key,你就可以调用getObject来检索对象了:

const AWS = require('aws-sdk');
const s3 = new AWS.S3();

exports.handler = function(event, context, callback) 
    
    // Retrieve the bucket & key for the uploaded S3 object that
    // caused this Lambda function to be triggered
    const Bucket = event.Records[0].s3.bucket.name;
    const Key = decodeURIComponent(event.Records[0].s3.object.key.replace(/\+/g, ' '));

    // Retrieve the object
    s3.getObject( Bucket, Key , function(err, data) 
        if (err) 
            console.log(err, err.stack);
            callback(err);
         else 
            console.log("Raw text:\n" + data.Body.toString('ascii'));
            callback(null, null);
        
    );
;

这是一个更新的 javascript 示例,使用 ES6 风格的代码和承诺,减去错误处理:

const AWS = require('aws-sdk');
const s3 = new AWS.S3();

exports.handler = async (event, context) => 
  const Bucket = event.Records[0].s3.bucket.name;
  const Key = decodeURIComponent(event.Records[0].s3.object.key.replace(/\+/g, ' '));
  const data = await s3.getObject( Bucket, Key ).promise();
  console.log("Raw text:\n" + data.Body.toString('ascii'));
;

许多发帖人要求使用 Java 中的等价物,所以这里有一个示例:

package example;

import java.net.URLDecoder;

import com.amazonaws.services.lambda.runtime.Context;
import com.amazonaws.services.lambda.runtime.RequestHandler;
import com.amazonaws.services.lambda.runtime.events.S3Event;
import com.amazonaws.services.s3.AmazonS3;
import com.amazonaws.services.s3.AmazonS3Client;
import com.amazonaws.services.s3.event.S3EventNotification.S3EventNotificationRecord;

public class S3GetTextBody implements RequestHandler<S3Event, String> 
 
    public String handleRequest(S3Event s3event, Context context) 
        try 
            S3EventNotificationRecord record = s3event.getRecords().get(0);

            // Retrieve the bucket & key for the uploaded S3 object that
            // caused this Lambda function to be triggered
            String bkt = record.getS3().getBucket().getName();
            String key = record.getS3().getObject().getKey().replace('+', ' ');
            key = URLDecoder.decode(key, "UTF-8");

            // Read the source file as text
            AmazonS3 s3Client = new AmazonS3Client();
            String body = s3Client.getObjectAsString(bkt, key);
            System.out.println("Body: " + body);
            return "ok";
         catch (Exception e) 
            System.err.println("Exception: " + e);
            return "error";
        
    

【讨论】:

对,但除非我弄错了,data 不是在 console.log('CONTENT TYPE:', data.ContentType); 元数据中,而不是文件的内容吗? 它为您提供事件数据,但不提供文件本身的数据,iirc。 @jstnchng 是的,那是元数据。但我认为您要求的是“foobarbaz”,它是实际 S3 对象的内容,因此您必须调用 GetObject 来检索该对象。 我想尝试与问题中指定的相同的方法,但改用 java,有人可以指定一些 java 示例的链接吗? @cedzz 这是完整的 S3 密钥,例如 archive/cats/fluffykins.jpg。【参考方案2】:

您可以使用data.Body.toString('ascii') 来获取文本文件的内容,假设文本文件是使用ascii 格式编码的。您还可以将其他编码类型传递给该函数。查看Node-Buffer了解更多详情。

【讨论】:

工作就像一个魅力,顺便说一句,你能看看我的类似问题吗? ***.com/questions/34056133/… 嗨,我想将相同的数据写入 DynamoDB,以便我想直接从回调函数返回数据对象(在 s3.getObject 方法中传递)我如何从这里的函数中提取数据?【参考方案3】:

我在 python 3.6 环境中使用 lambda 函数。 下面的代码将读取存储桶 my_s3_bucket 中文件 main.txt 的内容。确保根据您的需要替换存储桶的名称和文件名。

def lambda_handler(event, context):
    # TODO implement
    import boto3

    s3 = boto3.client('s3')
    data = s3.get_object(Bucket='my_s3_bucket', Key='main.txt')
    contents = data['Body'].read()
    print(contents)

【讨论】:

以上是关于如何使用 lambda 函数从 AWS s3 获取文本文件的内容?的主要内容,如果未能解决你的问题,请参考以下文章

AWS Lambda 返回权限被拒绝尝试从 S3 存储桶获取对象

AWS Lambda 函数写入 S3

AWS Lambda使用S3

在 AWS Lambda 函数中从 S3 获取对象并发送到 Api Gateway

如何从AWS Lambda检索数据并将其显示在AWS S3托管的静态网站上?

当从 s3 获取对象时,aws lambda 函数被拒绝访问