Amazon AWS 使用心得(摸索篇一)
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Amazon AWS 使用心得(摸索篇一)相关的知识,希望对你有一定的参考价值。
参考技术A本文主要讲述本人使用过程中,Amazon Aws 内常用模块说明。
1. 固定IP怎么配置?
答: EC2默认动态IP,每次实例重启,IP都会发生改变。这么做的好处,个人理解是鼓励大家不要使用免费实例。嘿嘿...
而如果选择收费实例时,可选择绑定IP,达到固定IP效果。具体配置如下图:
1.1. 分配弹性IP
1.2. 将弹性IP关联至EC2 实例
2. 负载均衡的使用?
答: 个人感觉使用AWS负载能减轻本人的运维工作,毕竟不是专业运维人员。比较明显的好处就是,不需要在服务器中安装nginx搭建负载了。
具体配置如下图:
2.1. 创建负载均衡器,选择Application Load Balancer。
2.2. 填写负载均衡器信息。
2.3. 选择EC2所在区
2.4. 选择或配置安全组,继续下一步;
2.5. 配置路由,填写完成继续下一步,具体如下图:
2.6. 选择应用所在EC2实例,并提交审核。
2.7. 等待负载均衡器安装完成,即可使用。
1. 访问权限问题
答: 如果是公开的S3存储桶,则忽略此项。要开启S3 API访问权限,需配置2步:
1.1. 配置阻止公有访问(存储桶设置),如下图:
1.2. 配置存储桶策略,内容大概:
2. 静态页面托管问题
答: S3自身除非公开存储桶,否则无法直接访问存储桶数据。如想通过存储桶来托管静态页面,目前知道的需注意以下2点:
2.1. 存储桶名词需与域名保持一致;
2.2. 为避免直连存储桶,可考虑使用CloudFront来实现转发达到目的。
何时通过 AWS Glue ETL 使用 Amazon Redshift 频谱来查询 Amazon S3 数据
【中文标题】何时通过 AWS Glue ETL 使用 Amazon Redshift 频谱来查询 Amazon S3 数据【英文标题】:When to use Amazon Redshift spectrum over AWS Glue ETL to query on Amazon S3 data 【发布时间】:2018-09-13 13:37:01 【问题描述】:由于 AWS Glue ETL 可以是 Python 脚本,因此它可以用于使用数据库接口执行 SQL 查询,并且可以将数据从 Amazon S3 加载到 DynamicFrame 中。我试图了解何时使用 Amazon Redshift 频谱查询 S3 数据是有利的。
【问题讨论】:
当您想降低存储成本并保持源数据不变而不进行任何转换时。 【参考方案1】:AWS Glue 用于收集元数据(爬行)和 ETL。它不适用于报告或分析。它可以应用高度复杂的转换(非常适合复杂的 ETL 要求)。
Redshift Spectrum 主要用于针对存储在 S3 中的数据生成报告和分析,通常与存储在 Redshift 中的数据相结合。但是也可以用于简单的 ETL。如果您只需要简单类型的 ETL,那么设置和使用比 Glue 简单得多。
还有一个您没有提到的选项,即 amazon Athena,这是直接针对 S3 数据运行查询的绝佳工具。它类似于 Redshift Spectrum,但通常更快、更便宜,具体取决于您的用例。它无法将 S3 数据与 Redshift 数据相结合。
【讨论】:
以上是关于Amazon AWS 使用心得(摸索篇一)的主要内容,如果未能解决你的问题,请参考以下文章