Amazon AWS 使用心得（摸索篇一）

Posted 2023-03-17

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Amazon AWS 使用心得（摸索篇一）相关的知识，希望对你有一定的参考价值。

参考技术A

本文主要讲述本人使用过程中，Amazon Aws 内常用模块说明。

1. 固定IP怎么配置？
答： EC2默认动态IP，每次实例重启，IP都会发生改变。这么做的好处，个人理解是鼓励大家不要使用免费实例。嘿嘿...
而如果选择收费实例时，可选择绑定IP，达到固定IP效果。具体配置如下图：
1.1. 分配弹性IP

1.2. 将弹性IP关联至EC2 实例

2. 负载均衡的使用？
答：个人感觉使用AWS负载能减轻本人的运维工作，毕竟不是专业运维人员。比较明显的好处就是，不需要在服务器中安装nginx搭建负载了。
具体配置如下图：
2.1. 创建负载均衡器，选择Application Load Balancer。

2.2. 填写负载均衡器信息。

2.3. 选择EC2所在区

2.4. 选择或配置安全组，继续下一步；
2.5. 配置路由，填写完成继续下一步，具体如下图：

2.6. 选择应用所在EC2实例，并提交审核。

2.7. 等待负载均衡器安装完成，即可使用。

1. 访问权限问题
答：如果是公开的S3存储桶，则忽略此项。要开启S3 API访问权限，需配置2步：
1.1. 配置阻止公有访问(存储桶设置)，如下图：

1.2. 配置存储桶策略，内容大概：

2. 静态页面托管问题
答： S3自身除非公开存储桶，否则无法直接访问存储桶数据。如想通过存储桶来托管静态页面，目前知道的需注意以下2点：
2.1. 存储桶名词需与域名保持一致；
2.2. 为避免直连存储桶，可考虑使用CloudFront来实现转发达到目的。

何时通过 AWS Glue ETL 使用 Amazon Redshift 频谱来查询 Amazon S3 数据

【中文标题】何时通过 AWS Glue ETL 使用 Amazon Redshift 频谱来查询 Amazon S3 数据【英文标题】：When to use Amazon Redshift spectrum over AWS Glue ETL to query on Amazon S3 data 【发布时间】：2018-09-13 13:37:01 【问题描述】：

由于 AWS Glue ETL 可以是 Python 脚本，因此它可以用于使用数据库接口执行 SQL 查询，并且可以将数据从 Amazon S3 加载到 DynamicFrame 中。我试图了解何时使用 Amazon Redshift 频谱查询 S3 数据是有利的。

【问题讨论】：

当您想降低存储成本并保持源数据不变而不进行任何转换时。 【参考方案1】：

AWS Glue 用于收集元数据（爬行）和 ETL。它不适用于报告或分析。它可以应用高度复杂的转换（非常适合复杂的 ETL 要求）。

Redshift Spectrum 主要用于针对存储在 S3 中的数据生成报告和分析，通常与存储在 Redshift 中的数据相结合。但是也可以用于简单的 ETL。如果您只需要简单类型的 ETL，那么设置和使用比 Glue 简单得多。

还有一个您没有提到的选项，即 amazon Athena，这是直接针对 S3 数据运行查询的绝佳工具。它类似于 Redshift Spectrum，但通常更快、更便宜，具体取决于您的用例。它无法将 S3 数据与 Redshift 数据相结合。

【讨论】：

以上是关于Amazon AWS 使用心得（摸索篇一）的主要内容，如果未能解决你的问题，请参考以下文章

AWS使用心得：当初我曾错过的那些宝贵经验

word和.txt文件转html 及pdf文件，使用poi jsoup itext心得