Elastic Beanstalk Worker 的 SQS 守护程序在 1 分钟后获得 504 网关超时

Posted

技术标签:

【中文标题】Elastic Beanstalk Worker 的 SQS 守护程序在 1 分钟后获得 504 网关超时【英文标题】:Elastic Beanstalk Worker's SQS daemon getting 504 gateway timeout after 1 minute 【发布时间】:2016-05-13 13:11:12 【问题描述】:

我有一个 Elastic Beanstalk 工作线程,它一次只能运行一个任务,并且需要一些时间(从几分钟到,希望不到 30 分钟),所以我将我的任务排队SQS。

在我的工作人员配置中,我有:

HTTP connections: 1
Visibility timeout: 3600
Error visibility timeout: 300

(On "Advanced")
Inactivity timeout: 1800

问题是似乎有 1 分钟的超时(在 nginx 上?)覆盖“不活动超时”,返回 504(网关超时)。

这是我可以在 aws-sqsd.log 文件中找到的内容:

2016-02-03T16:16:27Z init: initializing aws-sqsd 2.0 (2015-02-18)
2016-02-03T16:16:27Z start: polling https://sqs.eu-central-1.amazonaws.com/855381918026/jitt-publisher-queue
2016-02-03T16:23:36Z message: sent to %[http://localhost:80]
2016-02-03T16:24:36Z http-err: 1444d1ba-ecb5-46f8-82d6-d0bf19b91fad (1) 504 - 60.006
2016-02-03T16:28:54Z message: sent to %[http://localhost:80]
2016-02-03T16:29:54Z http-err: 1b7514d3-689a-4e8b-a569-5ef1ac32ed0c (1) 504 - 60.029
2016-02-03T16:29:54Z message: sent to %[http://localhost:80]
2016-02-03T16:29:54Z http-err: 1444d1ba-ecb5-46f8-82d6-d0bf19b91fad (2) 500 - 0.006
2016-02-03T16:33:49Z message: sent to %[http://localhost:80]
2016-02-03T16:34:49Z http-err: 3a43e80f-a8d3-46b2-b2a0-9d898ad4f2a6 (1) 504 - 60.023
2016-02-03T16:34:54Z message: sent to %[http://localhost:80]
2016-02-03T16:34:54Z http-err: 1b7514d3-689a-4e8b-a569-5ef1ac32ed0c (2) 500 - 0.004
2016-02-03T16:34:54Z message: sent to %[http://localhost:80]
2016-02-03T16:34:54Z http-err: 1444d1ba-ecb5-46f8-82d6-d0bf19b91fad (3) 500 - 0.003
2016-02-03T16:39:49Z message: sent to %[http://localhost:80]
2016-02-03T16:40:49Z http-err: 3a43e80f-a8d3-46b2-b2a0-9d898ad4f2a6 (2) 504 - 60.019

这里有些事情是有道理的,例如每条消息从 504/500 到任务再次重新发送给工作人员需要 5 分钟的延迟(这与“错误可见性”的 300 秒配置相匹配超时”)。

这 500 个代码符合我当前的逻辑:如果仍有东西在运行,则工作人员会通过返回 500 来拒绝任务。

我已经看到很多关于设置负载均衡器连接超时设置的答案,但是,由于这是一个从 SQS 队列中拉取消息的工作人员,因此没有负载均衡器。

知道我应该怎么做才能覆盖 1 分钟的超时设置吗?

【问题讨论】:

【参考方案1】:

由于我有时间对此进行了更好的调查,因此解决方案是添加一个配置代理超时设置的 ebextension:

files:
    "/etc/nginx/sites-available/elasticbeanstalk-nginx-docker-proxy-timeout.conf":
        mode: "000644"
        owner: root
        group: root
        content: |
            proxy_connect_timeout       3600;
            proxy_send_timeout          3600;
            proxy_read_timeout          3600;
            send_timeout                3600;
commands:
    "00nginx-create-proxy-timeout":
        command: "if [[ ! -h /etc/nginx/sites-enabled/elasticbeanstalk-nginx-docker-proxy-timeout.conf ]] ; then ln -s /etc/nginx/sites-available/elasticbeanstalk-nginx-docker-proxy-timeout.conf /etc/nginx/sites-enabled/elasticbeanstalk-nginx-docker-proxy-timeout.conf ; fi"

来源:http://cloudavail.com/2015/10/18/allowing-long-idle-timeouts-when-using-aws-elasticbeanstalk-and-docker/

【讨论】:

以上是关于Elastic Beanstalk Worker 的 SQS 守护程序在 1 分钟后获得 504 网关超时的主要内容,如果未能解决你的问题,请参考以下文章

AWS Elastic Beanstalk Worker 队列行为

让 django celery worker 在 elastic-beanstalk 上启动的问题

在 Elastic-Beanstalk Worker 上运行 Flask 端口 80

AWS Elastic Beanstalk Worker 无法连接到 SQS

Amazon Elastic Beanstalk Worker cronjob (SQS) 多次触发同一消息

AWS Elastic Beanstalk Worker - 根据可用队列消息的数量进行扩展