将数据从我的 spark 代码发送到 redshift

Posted

技术标签:

【中文标题】将数据从我的 spark 代码发送到 redshift【英文标题】:Sending data from my spark code to redshift 【发布时间】:2016-02-25 16:10:12 【问题描述】:

我有一个用 Scala 编写的 Spark 代码。我的代码读取一个 xml 并提取其中的所有信息。目标是将 XML 中的信息存储到 Redshift 表中。

是否可以在不使用 S3 的情况下将数据直接从我的 Scala Spark 代码发送到 Redshift?

干杯!

【问题讨论】:

【参考方案1】:

如果您使用的是 Spark SQL,您可以使用 spark-xml 将 XML 数据读入 DataFrame,然后使用 spark-redshift 将其写入 Redshift 表中。 你也可以看看这个question。

【讨论】:

【参考方案2】:

您可以在 Python/Java 代码中使用预先准备好的 SQL 语句进行行级插入,但如果您要插入的记录过多,效率会非常低。

【讨论】:

以上是关于将数据从我的 spark 代码发送到 redshift的主要内容,如果未能解决你的问题,请参考以下文章

如何将数据从我的数据库 (Firebase Firestore) 发送到我的 React Native 应用程序?

如何将 json 数据从我的 jsp 页面发送到 spring rest 控制器

如何将文档从我的 mongodb 数据库发送到 android 应用程序?

如何将数据从我的 main.js 发送到我的 index.html(电子)

如果没有得到任何想要的数据从我的服务器发送到 zapier,应该向 zapier 发送啥响应

如何从 Spark 数据帧中的 When 子句将多个列发送到 udf?