将数据从蜂巢中取出并输入 mysql @ AWS?

Posted

技术标签:

【中文标题】将数据从蜂巢中取出并输入 mysql @ AWS?【英文标题】:getting data out of hive and into mysql @ AWS? 【发布时间】:2011-11-23 14:58:54 【问题描述】:

我很想使用 Sqoop,但不认为仅仅为此而在 ElasticMapReduce(我非常喜欢)上运行 Cloudera 堆栈@AWS 是值得的。

我目前的想法只是将我需要的数据写入到@S3的外部表中,然后编写脚本将其导入mysql。亚马逊有一些 SimpleDB (example) 的东西,但我也不确定那条路线?对 S3 中的数据很好,只是想知道是否有人有更好的主意。

谢谢!

【问题讨论】:

【参考方案1】:

我使用的最简单的解决方案,效果很好:

    正如您建议的那样,将数据放入 S3 存储桶。您可以创建一个托管在 S3 上并具有例如的表。制表符分隔的格式。如果您在最后一步中使用一个 reducer,您最终将只得到一个文件。 下载数据到你的 MySQL 服务器,我最喜欢的工具是s3cmd 使用 LOAD DATA INFILE 将数据直接导入 MySQL...

【讨论】:

以上是关于将数据从蜂巢中取出并输入 mysql @ AWS?的主要内容,如果未能解决你的问题,请参考以下文章

markdown 从aws中取出我的ip并复制到剪贴板

将数据从aws s3导入mysql或任何非aws数据库

从 MySQL 读取位数据类型并使用 AWS Glue 转换为 Redshift 的问题

数据蜂巢架构演进之路

蜂巢:如何在不更新的情况下处理 scd 类型 2

我们可以使用 AWS 胶水分析 RDS 数据库并使用 ETL 将分析的数据存储到 rds mysql 表中吗