我们是不是能够使用 Snappy-data 更新 Azure 数据湖中的记录?还是仅附加 Azure 数据湖?
Posted
技术标签:
【中文标题】我们是不是能够使用 Snappy-data 更新 Azure 数据湖中的记录?还是仅附加 Azure 数据湖?【英文标题】:Are we able to use Snappy-data to Update a record in Azure Data lake ? OR is Azure data lake append only?我们是否能够使用 Snappy-data 更新 Azure 数据湖中的记录?还是仅附加 Azure 数据湖? 【发布时间】:2017-03-07 06:51:38 【问题描述】:我目前正在使用 snappy-data 集成开发 azure 数据湖,我有一个关于 snappy-data 的查询,我们是否能够将 snappy-data 中的数据更新到 azure 数据湖存储,或者我们只能附加到我在论坛中搜索了 Azure Data Lake Storage,但我无法找到合适的解决方案,如果有人知道关于它的查询,请分享,谢谢。
【问题讨论】:
【参考方案1】:Azure Data Lake Store 与 HDFS 非常相似,是仅追加存储。您可以附加到文件或完全替换它。无法更新现有文件。
【讨论】:
好的,谢谢@Amit。【参考方案2】:通过使用 Azure Data Lake 表作为输入和输出之间的中间地带,我在 USQL 中实现了 MERGE 样式的行为。查看我的博客文章,其中的代码展示了我是如何通过一系列连接实现的。
https://www.purplefrogsystems.com/paul/2016/12/writing-a-u-sql-merge-statement/
这将使您在输出中附加行为。
【讨论】:
以上是关于我们是不是能够使用 Snappy-data 更新 Azure 数据湖中的记录?还是仅附加 Azure 数据湖?的主要内容,如果未能解决你的问题,请参考以下文章