我们是不是能够使用 Snappy-data 更新 Azure 数据湖中的记录?还是仅附加 Azure 数据湖?

Posted

技术标签:

【中文标题】我们是不是能够使用 Snappy-data 更新 Azure 数据湖中的记录?还是仅附加 Azure 数据湖?【英文标题】:Are we able to use Snappy-data to Update a record in Azure Data lake ? OR is Azure data lake append only?我们是否能够使用 Snappy-data 更新 Azure 数据湖中的记录?还是仅附加 Azure 数据湖? 【发布时间】:2017-03-07 06:51:38 【问题描述】:

我目前正在使用 snappy-data 集成开发 azure 数据湖,我有一个关于 snappy-data 的查询,我们是否能够将 snappy-data 中的数据更新到 azure 数据湖存储,或者我们只能附加到我在论坛中搜索了 Azure Data Lake Storage,但我无法找到合适的解决方案,如果有人知道关于它的查询,请分享,谢谢。

【问题讨论】:

【参考方案1】:

Azure Data Lake Store 与 HDFS 非常相似,是仅追加存储。您可以附加到文件或完全替换它。无法更新现有文件。

【讨论】:

好的,谢谢@Amit。【参考方案2】:

通过使用 Azure Data Lake 表作为输入和输出之间的中间地带,我在 USQL 中实现了 MERGE 样式的行为。查看我的博客文章,其中的代码展示了我是如何通过一系列连接实现的。

https://www.purplefrogsystems.com/paul/2016/12/writing-a-u-sql-merge-statement/

这将使您在输出中附加行为。

【讨论】:

以上是关于我们是不是能够使用 Snappy-data 更新 Azure 数据湖中的记录?还是仅附加 Azure 数据湖?的主要内容,如果未能解决你的问题,请参考以下文章

Linux开发环境搭建与使用——ubuntu更新设置

对于简单的增量表单更新来说,事件溯源是不是过大?

如何检查用户是不是能够在 marklogic 数据库中更新或插入文档?

旧访问更新声明

我们如何使用 CRecordset 批量更新记录

存储traefik让我们加密证书而不是json