从 Azure 表存储中获取 1000 多个数据集

Posted

技术标签:

【中文标题】从 Azure 表存储中获取 1000 多个数据集【英文标题】:Get more than 1000 datasets from an Azure Table Storage 【发布时间】:2020-05-18 01:09:24 【问题描述】:

我有一个 Azure 函数来对 Azure 表存储中的数据集执行一些操作。

由于分组在 Azure 表存储中不起作用,我必须获取表中的所有数据集并在我的 C# 代码中执行我想要的操作(分组、筛选)。

但每个查询只检索前 1000 个数据集。 如何获取所有数据集 - 或以 1000 个批量遍历表以获取所有数据集?

TableQuery<Models.product_item> query = new TableQuery<Models.product_item>()
          .Where(TableQuery.GenerateFilterCondition("PartitionKey", QueryComparisons.Equal, myPartitionKey));

var queryResult = myTable.ExecuteQuery(query);

【问题讨论】:

【参考方案1】:

如果您的查询未在特定限制内完成(最多 5 秒,最多 1000 行,请参阅 here),您将在结果对象中收到 ContinuationToken。将此令牌传递给另一个查询以继续您的第一个查询并获取下一组行。

此扩展方法为您完成这项工作:

public static class QueryExtensions

    public static async Task<IEnumerable<TElement>> ExecuteQueryAllElementsAsync<TElement>(this CloudTable table, TableQuery<TElement> tableQuery)
        where TElement : ITableEntity, new()
    
        TableContinuationToken continuationToken = default(TableContinuationToken);
        var results = new List<TElement>(0);
        tableQuery.TakeCount = 500;

        do
        
            //Execute the next query segment async.
            var queryResult = await table.ExecuteQuerySegmentedAsync(tableQuery, continuationToken);

            //Set exact results list capacity with result count.
            results.Capacity += queryResult.Results.Count;
            results.AddRange(queryResult.Results);

            continuationToken = queryResult.ContinuationToken;

         while (continuationToken != null);

        return results;
    

然后你可以在你的代码中使用它

var queryResult = await myTable.ExecuteQueryAllElementsAsync(query);

【讨论】:

【参考方案2】:

你不能。可能是为了避免长时间运行的查询。

您可以在此处阅读其他限制:https://docs.microsoft.com/en-us/rest/api/storageservices/Query-Timeout-and-Pagination?redirectedfrom=MSDN

【讨论】:

以上是关于从 Azure 表存储中获取 1000 多个数据集的主要内容,如果未能解决你的问题,请参考以下文章

源数据集中的动态工作表名称:Azure 数据工厂上的(Excel(Blob 存储))。 - 错误:请为您的数据集选择一个工作表

无法加载文件或程序集“msshrtmi”或其依赖项之一(Azure 表存储访问)

如何在 Azure ADF Pipelines 中更改 ADF 接收器数据集 Parquet 文件数据类型

如何从 azure blob 存储中获取 json 数据并使用 azure 数据工厂将其发送到 power apps dataverse

在 Analytics Query 中使用多个分区键将数据存储在多个 Azure 存储表中

从 APIM 策略获取 Azure 表存储实体