在更短的时间内将 50GB CSV 文件 Azure Blob 加载到 Azure SQL DB - 性能

Posted 2023-03-28

技术标签:

【中文标题】在更短的时间内将 50GB CSV 文件 Azure Blob 加载到 Azure SQL DB - 性能【英文标题】：Loading 50GB CSV File Azure Blob to Azure SQL DB in Less time- Performance 【发布时间】：2020-01-30 23:28:15 【问题描述】：

我正在使用 OPENROWSET 将 50GB CSV 文件从 Azure Blob 加载到 Azure SQL DB。加载此文件需要 7 小时。你能帮我想办法减少这个时间吗？

【问题讨论】：

这是一个 CSV 文件。在 Azure SQL 中存储这么多数据会很快增加费用。这是您需要定期做的事情还是一次性的事情？我正在使用 openrowset 定期截断数据并将其加载到表中。就像 Aleberto 所说的，Azure 数据工厂可能是最简单的方法。请密切关注您被收取的费用。 【参考方案1】：

恕我直言，最简单的选择就是使用 BULK INSERT。将 csv 文件移动到 Blob 存储中，然后使用 Azure SQL 中的 BULK INSERT 直接将其导入。确保 Azure Blob 存储和 Azure SQL 在同一个 Azure 区域中。

为了让它尽可能快：

html

【讨论】：

【参考方案2】：

请尝试使用Azure Data Factory。

首先在 Azure SQL 数据库上创建目标表，我们称之为 USDJPY。之后将 CSV 上传到 Azure 存储帐户。现在创建您的 Azure 数据工厂实例并选择复制数据。

接下来，选择“立即运行”以复制 CSV 文件。

选择“Azure Blob 存储”作为“源数据存储”，指定存储 CSV 文件的 Azure 存储。

提供有关 Azure 存储帐户的信息。

从 Azure 存储中选择 CSV 文件。

如果您的 CSV 文件有标题，请选择“逗号”作为 CSV 文件分隔符并输入“跳过行数”编号