Amazon AWS 使用心得(摸索篇一)

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Amazon AWS 使用心得(摸索篇一)相关的知识,希望对你有一定的参考价值。

参考技术A

本文主要讲述本人使用过程中,Amazon Aws 内常用模块说明。

1. 固定IP怎么配置?
答: EC2默认动态IP,每次实例重启,IP都会发生改变。这么做的好处,个人理解是鼓励大家不要使用免费实例。嘿嘿...
而如果选择收费实例时,可选择绑定IP,达到固定IP效果。具体配置如下图:
1.1. 分配弹性IP

1.2. 将弹性IP关联至EC2 实例

2. 负载均衡的使用?
答: 个人感觉使用AWS负载能减轻本人的运维工作,毕竟不是专业运维人员。比较明显的好处就是,不需要在服务器中安装nginx搭建负载了。
具体配置如下图:
2.1. 创建负载均衡器,选择Application Load Balancer。

2.2. 填写负载均衡器信息。

2.3. 选择EC2所在区

2.4. 选择或配置安全组,继续下一步;
2.5. 配置路由,填写完成继续下一步,具体如下图:

2.6. 选择应用所在EC2实例,并提交审核。

2.7. 等待负载均衡器安装完成,即可使用。

1. 访问权限问题
答: 如果是公开的S3存储桶,则忽略此项。要开启S3 API访问权限,需配置2步:
1.1. 配置阻止公有访问(存储桶设置),如下图:

1.2. 配置存储桶策略,内容大概:

2. 静态页面托管问题
答: S3自身除非公开存储桶,否则无法直接访问存储桶数据。如想通过存储桶来托管静态页面,目前知道的需注意以下2点:
2.1. 存储桶名词需与域名保持一致;
2.2. 为避免直连存储桶,可考虑使用CloudFront来实现转发达到目的。

何时通过 AWS Glue ETL 使用 Amazon Redshift 频谱来查询 Amazon S3 数据

【中文标题】何时通过 AWS Glue ETL 使用 Amazon Redshift 频谱来查询 Amazon S3 数据【英文标题】:When to use Amazon Redshift spectrum over AWS Glue ETL to query on Amazon S3 data 【发布时间】:2018-09-13 13:37:01 【问题描述】:

由于 AWS Glue ETL 可以是 Python 脚本,因此它可以用于使用数据库接口执行 SQL 查询,并且可以将数据从 Amazon S3 加载到 DynamicFrame 中。我试图了解何时使用 Amazon Redshift 频谱查询 S3 数据是有利的。

【问题讨论】:

当您想降低存储成本并保持源数据不变而不进行任何转换时。 【参考方案1】:

AWS Glue 用于收集元数据(爬行)和 ETL。它不适用于报告或分析。它可以应用高度复杂的转换(非常适合复杂的 ETL 要求)。

Redshift Spectrum 主要用于针对存储在 S3 中的数据生成报告和分析,通常与存储在 Redshift 中的数据相结合。但是也可以用于简单的 ETL。如果您只需要简单类型的 ETL,那么设置和使用比 Glue 简单得多。

还有一个您没有提到的选项,即 amazon Athena,这是直接针对 S3 数据运行查询的绝佳工具。它类似于 Redshift Spectrum,但通常更快、更便宜,具体取决于您的用例。它无法将 S3 数据与 Redshift 数据相结合。

【讨论】:

以上是关于Amazon AWS 使用心得(摸索篇一)的主要内容,如果未能解决你的问题,请参考以下文章

AWS使用心得:当初我曾错过的那些宝贵经验

AWS 考试认证心得(SAA)(下)

PythonMagick库使用心得

AWS云计算平台工作使用中的心得

spring新心得

word和.txt文件转html 及pdf文件, 使用poi jsoup itext心得