从我们仓库中其他 Snowflake DB 派生的数据中使自定义表保持最新的最佳实践

Posted 2023-03-29

技术标签:

【中文标题】从我们仓库中其他 Snowflake DB 派生的数据中使自定义表保持最新的最佳实践【英文标题】：Best practices for keeping a custom table up-to-date from data derived from other Snowflake DB's in our warehouse 【发布时间】：2019-10-15 14:34:16 【问题描述】：

（代表雪花用户提交）

我们有一个数据库，用于存储来自所有本地来源的原始数据。我的团队拥有自己的环境，在其中我们拥有创建可通过 Power BI 使用的标准化提要和/或表/视图等的完全权限。一些额外的细节：

最终的“提要”表是通过 SQL 语句派生的，并且大多数都从我们的多个“原始”数据表中提取。原始表数据每天更新。

我的问题是保持表格完全更新的最佳操作是什么？此操作的标准工作流程是什么？我们目前的理解是以下过程之一是最好的：

COPY INTO <stage>

COPY INTO <table>

STREAMS

PIPES

理想情况下，我们希望避免视图以提高功率双级的消耗速度。

Tasks 被推荐，因为它看起来很合适，因为他们每天只需要更新一次决赛桌。 (https://docs.snowflake.net/manuals/sql-reference/sql/create-task.html)

还有什么推荐？？？谢谢！

【问题讨论】：