AWS Lambda相关概念与实现思路
Posted Liatsce
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了AWS Lambda相关概念与实现思路相关的知识,希望对你有一定的参考价值。
前言
本文将会介绍关于AWS Lambda(后文统称为Lambda)的基础概念以及一些编写技巧。本文适合人群为对无服务化(Serverless)感兴趣以及需要使用Lambda实现需求的工程师们。
通常,我们在实现某些业务需求时往往都会选择将其服务化,并使其对外或对内提供相应的业务服务。在服务化时,一般都会使用Web框架来做为底层进行功能实现;其次,还需要为服务化后的工程分配相应的运行载体(VM或实体服务器等)。使用的Web框架如果选型不好,则会出现类似于"实现的服务实际上就只使用到框架提供的一小部分功能"的问题,即Web框架提供的功能过于冗余,没有完全利用起来;而为工程为配运行载体则有可能会增加运维成本和资源成本。
针对上述的服务化过程中可能会出现的问题,无服务化(Serverless)可以解决的更好。通过在业务功能进行细化拆分为一个一个的方法(函数),使得最终对外或对内提供业务功能者从服务变为方法(函数)。这样的好处在于,我们无需在学习和配置底层的Web框架,而只需要专心一致的去编写业务逻辑即可。这些方法(函数)如何对外提供服务和如何接受业务请求的事情都交给无服务化(Serverless)平台去处理就好了,开发者可以不用再花时间和精力去实现这些功能。这大大节省了我们的研发压力和工期。同时,这些方法(函数)的运行方式也都完全交给无服务化(Serverless)平台去处理,包括建立,运行和回收等操作。往往无服务化(Serverless)平台还能够提供稳定的并发功能,使得编写的业务功能都能承受住大流量请求的考验。有着上述这些功能的保证,也就从而减少了增加运维成本和资源成本。
Lambda作为云平台中提供无服务化(Serverless)的先驱者,学习和使用其能够帮助我们更好的体验、理解以及设计无服务化(Serverless)。本文不是鼓励大家一定要使用AWS Lambda去做实现需求,而是鼓励大家去学习无服务化(Serverless)的相关概念和知识点
。用哪家云平台的无服务化(Serverless)产品去实现功能不重要,重要的是理解其背后的设计理念和优势。
笔者也会将自己的理解在文中进行阐述,这也算是在和大家交流心得的一个过程。若文中有错误的理解和概念,请大家及时纠正;吸纳大家的建议,对于我来说也是很重要的学习过程之一。
1.相关概念
1.1 部署方式
Lambda提供了两种部署方式:
-
压缩包
即将源码和其依赖的第三方包都压缩在一个Zip包中,并将该包上传至Lambda计算平台上。 - 容器
即将源码和其依赖的第三方包都打进一个容器镜像中,并将该容器镜像上传至Amazon ECR容器镜像仓库。
不同编程语言构建容器的方式详情请查看官方文档。AWS同时也提供了的各类编程语言基础镜像的下载。
无论使用哪种方式进行部署,在部署后还需要为Lambda增加和修改一些重要配置
:
- 按需修改Lambda的超时时间。如果Lambda的超时时间过长和过短都有可能会导致出现异常情况。
- 为Lambda配置VPC。如果Lambda需要通过网络访问AWS中的其他资源(例如EC2),则需要为其配置所属VPC。VPC子网以及安全组的配置与EC2配置方法相同,按需配置即可。
- 调整事件的最长保留时间。由于Lambda是基于事件驱动的方式运行的,用于触发的事件的保留时间如果不合理,则可能会导致Lambda遗漏请求等问题的发生。
- 调整重试次数。可以通过Lambda平台提供的重试机制来实现业务功能的重试功能。这里需要注意实现的Lambda是否支持幂等性以及其内部是否已经实现了重试机制。
- 启用死信队列。死信队列可以用来保存那些无法被Lambda所执行的事件(请求)。这些请求可以在后续中被用来做故障分析以及自动化处理异常请求的数据源。
- 为其分配IAM权限。如果Lambda需要调用或访问AWS的其他功能服务,可以通过为其配置相应的IAM即可。
1.2 调试方式
针对于不同的部署方式,调试的方式也些许不同:
-
压缩包
由于Lambda的实现方式实际上就是在编写方法(函数),类似于使用面向过程的方式去编写脚本。若方法(函数)中没有涉及到调用其他Lambda的逻辑,则可以通过在本地以Debug方法(函数)的形式进行调试。
其中,如果有涉及到调用AWS的相关服务,可以通过为SDK Client或API提供access key和secret_access_key来进行授权访问调用。这里需要注意一点,在正式部署之前应将关于配置认证信息的代码段删除,因为Lambda在运行时可以通过在其绑定的IAM中获取到相应的服务访问权限。这也是Lambda的优势之一,即无需将重要的账号认证信息明文暴露在编码或配置文件中。
其次,如果有调用其他自研服务的需求,则可以通过在本地搭建这些服务或直接调用相应测试环境的服务即可。
最后,通过模拟构造Lambda入口方法(函数)的入参,即可对其进行本地调试。 -
容器
AWS提供的基本镜像包括中Lambda运行时接口模拟器,因此是可以在本地测试Lambda的。
相关操作例如:- 运行Docker映像。从项目目录中,运行docker run 命令:
# docker run -p 9000:8080 hello-world:latest - 测试Lambda函数。在新的终端窗口中,运行curl命令来调用函数:
# curl -XPOST "http://localhost:9000/2015-03-31/functions/function/invocations" -d
- 运行Docker映像。从项目目录中,运行docker run 命令:
1.3 调用方式
1.3.1 原理
在之前的章节中也提到过,Lambda是基于事件驱动运转的,因此Lambda是需要有相应的事件来触发的
。事件可以分为两大类,一类是是AWS功能服务中发生某些动作后所触发的事件,另一类是用户自定义的事件。
通过为Lambda添加相应AWS功能服务所对应的触发器,使得这些服务在发生了某些特定动作的同时也会像指定的Lambda发送相应事件。这种方式中所触发的事件内容往往都是有统一规格的。
用户自定义事件可通过使用AWS EventBridge服务来进行推送。通过将自定义的事件发送到相应的AWS EventBridge Bus中,之后EventBridge会使用绑定在该Bus上的转发规则将事件转发到相应的Lambda。在为Bus配置相应的转发规则时,AWS会自动的为Lambda添加相应的注册器。
1.3.2 同步调用
可以通过使用AWS CLI或相应语言SDK中的方法来同步调用Lambda。这种同步调用的方式需要调用方一直等待Lambda执行完后才算调用操作完成
。可以通过结合上述方式,实现Lambda调用Lambda的功能,即构造Lambda调用链。
1.3.3 异步调用
如同章节1.3开头的图所示,可以通过AWS中的相关很多服务或自行构建事件驱动队列来异步调用Lambda。这种调用方式可以使得调用方无需等待Lambda执行完即可完成调用操作。但在使用异步方式调用Lambda时,要注意调用的Lambda是否满足幂等性或通过其它方式解决重复数据的问题
。引入异步调用的概念后,我们还能通过配置失败队列来实现事件触发重试机制,即将处理失败的事件发送到失败队列中,并将失败队列的执行者指定为相应的Lambda即可。
2.实现思路
本章节中会介绍一些笔者设计和实现Lambda的一些实践经验。希望这些思路和经验能够帮助大家更好的设计和调用Lambda。
后续若涉及到具体的代码示例,均会使用Python来演示。虽然文章中使用的编程语言可能不是读者最熟悉的语言,但无需担心,因为示例中的逻辑流程在所有语言中是通用的。并且AWS针对每种语言所提供的SDK中,入口方法的使用都是相似的。
2.1 面向对象设计的使用
Lambda往往会选择使用编程语言中的方法(函数)来实现。例如AWS官方所给出的范例中,通过编写lambda_handler这类的方法(函数)来实现处理事件的相关逻辑。基于上述概念,大多数人通常可能就会选择使用封装方法(函数)的方式来编写Lambda,即使用面向过程设计的方法来编写。
而经过笔者实践,我们也可以使用面向对象设计的思路来编写Lambda;即对主要业务逻辑进行抽象,并且封装为功能类,最终在lambda_handler方法(函数)来创建这些类的实例对象并调用其相关的实例方法实现业务逻辑
即可。使用面向对象设计来编写lambda_handler方法(函数),可以使一些底层功能逻辑复用起来更加方便(结合Lambda Layer功能),同时还能使Lambda工程有着更好的耦合度和可读性。
2.2 日志打印
由于Lambda是一种即用即开的服务类型,因此Lambda服务不提供用于数据永久落地的存储设备。基于上述情况,使用相关日志文件来记录Lambda的过程日志就无法实现了。
但Lambda的屏幕打印输出会被采集到Amazon CloudWatch服务中,因此我们可以利用这一点来变向实现我们的日志记录需求。可以通过将原本输出至指定日志文件的日志流,更改为输出到stdout或stderr中
。这样日志流就会被自动的采集到Amazon CloudWatch服务中了。因为Amazon CloudWatch服务本身可以用来做日志分析,这样还顺便解决了日志采集和分析的需求。
例如使用Python自带的logging进行日志记录:
import logging
import sys
logger = logging.getLogger(zmebula)
formatter = logging.Formatter(
"%(asctime)s [%(levelname)s] %(funcName)s:%(lineno)d %(message)s"
)
sh = logging.StreamHandler(stream=sys.stdout)
sh.setFormatter(formatter)
sh.setLevel(logging.INFO)
logger.addHandler(sh)
2.3 异常处理
为了保证项目能够长时间稳定的运行,通常会选择在捕获到异常后,选择对其进行记录并进行临时处理,以保证程序不会因抛出异常而意外停止。
AWS判断一个Lambda是否执行成功,主要是监控其有无正常退出。如果Lambda正常退出,则视为执行成功;若有异常抛出导致程序意外停止,则认为其执行失败。
因此,建议在处理Lambda中的异常时,在进行异常记录后,可以再次将其抛出
,以来通知AWS当前Lambda执行失败了。在这样设计和实现后,就会避免AWS监控平台上出现Lambda执行结果误报的问题,同时还能对于Lambda真实的运行状态进行统计和分析。
2.4 权限配置
由于Lambda为AWS的产物,因此其和AWS其他服务的结合使用是极其便利的,AWS官方也推荐使用者将Lambda和AWS的其他服务配合使用。
既然要调用AWS的其他服务,那么就必然会牵扯到调用这些服务的权限问题。在一般开发中,我们会通过在调用AWS的SDK的相关逻辑中加入身份认证信息(ak,ask)以表明操作的用户身份。同时会为这个用户绑定相应的AWS IAM,以保证其拥有操作指定服务的权限。
同样,在Lambda中也会通过调用AWS的SDK来操作其他服务。但有一点不同的是,在Lambda无需录入相关用户的身份信息(ak,ask)。可以通过直接为Lambda绑定相应的AWS IAM来实现权限分配
。这样的做法可以防止用户身份信息(ak,ask)通过硬编码或明文配置文件的方式暴露在Lambda中。
2.5 数据落地
这里将会分为数据永久落地和数据临时落地两种情况进行讨论。
对于Lambda产出数据的永久落地,建议使用Lambda与AWS相关的数据库服务来解决数据永久落地的需求。在之前的章节中也曾提到过,Lambda本身是不提供用于数据永久落地的存储设备,因此需要借助外界的服务实现该需求。
对于在Lambda运行中所产出的临时性数据落地,AWS提供了用于缓存临时数据的存储。Lambda有权访问/tmp目录中的本地存储,因此Lambda中如果有需要缓存的逻辑,则可以利用/tmp目录来实现。
2.6 提供Web Service
在前言章节中层提到过,Lambda是无服务化(Serverless)实现的一种途径。将每一个子功能看作服务并对外提供业务。对外提供功能(服务)的形式通常都会选择使用Web Service的形式,即通过HTTP/HTTPS协议来对外提供业务功能。
对于Lambda而言,实现上述需求有两种方式:
- 结合AWS API Gateway
通过和AWS API Gateway服务结合使用,可以为Lambda提供创建、发布、维护、监控和保护任意规模的REST、HTTP和WebSocket API。 - 内置HTTPS终端节点
通过使用Lambda的内置HTTPS终端节点功能,也可以使Lambda对外能够提供Web Service。
总结
笔者想通过本文中所介绍的Lambda相关概念以及一些经过笔者实践过的设计经验来告诉大家,无服务化(Serverless)实现起来并没有我们想象中的那么困难了。无服务化(Serverless)可以使我们更加关注于业务逻辑的实现,这一点在实际工作中的体现就是:
- 与公司的成本控制和业务发展结合度高
在无服务化(Serverless)的实践中,更多的人力可以用于去实现业务逻辑,而不再像微服务化时需要有专业的团队专注于设计和实现底层框架。这大大能够节省公司的人力成本,而且使得研发团队能更够专注于业务上的功能开发。 -
减少开发成本
使用无服务化(Serverless)后,开发人员不用再考虑底层框架的相关实现。这一点笔者深有体会,平常在实现新工程时,我们需要先将底层框架实现好,然后在其上实现业务逻辑。即使能够通过拷贝原有工程的底层框架部分,但拷贝后的细节配置更改依旧会消耗时间和精力。但这些问题在无服务化(Serverless)中就不复存在了,开发人员从一开始就可以直接针对业务需求进行设计和研发,无需再花费时间去搭建,对接底层框架。当然,不是所有的场景都适合无服务化(Serverless)。推行无服务化(Serverless)一个是需要合适的业务场景,一个是需要整个研发团队有着不错的接受度和设计理念。但这不影响我们去学习这一概念,通过学习新的概念和其原理,也能够帮助我们在设计其他事物中起到参考和拓展思路的作用。
以上是关于AWS Lambda相关概念与实现思路的主要内容,如果未能解决你的问题,请参考以下文章
AWS Lambda 与 Elastic Beanstalk