Azure blob 批量删除西里尔字符

Posted

技术标签:

【中文标题】Azure blob 批量删除西里尔字符【英文标题】:Azure blob batch delete cyrillic characters 【发布时间】:2021-09-24 02:50:27 【问题描述】:

我可以使用 Azure.Storage.Blobs 12.9.1 上传包含西里尔字符的 blob,但无法使用 Azure.Storage.Blobs.Batch 12.6.0 批量删除它们。

考虑以下 blob 名称:здраве-и-красота-от-природатаjpg--xfgqfvhj.axp.webp 和代码:

var blobsToBeDeleted = new List<Uri>();
blobsToBeDeleted.Add(new Uri("azure-storage-address/container/здраве-и-красота-от-природатаjpg--xfgqfvhj.axp.webp"));
blobsToBeDeleted.Add(new Uri("azure-storage-address/container/thumbs/здраве-и-красота-от-природатаjpg--xfgqfvhj.axp.webp"));
await batchClient.DeleteBlobsAsync(blobsToBeDeleted);

在 Azure 上运行后,响应是:

Azure.RequestFailedException
"Invalid response\r\nStatus: 202 (Accepted)\r\n\r\nHeaders:\r\nTransfer-Encoding: chunked\r\nServer: Windows-Azure-Blob/1.0,Microsoft-HTTPAPI/2.0\r\nx-ms-request-id: 9255671d-301e-008e-1a4a-797e59000000\r\nx-ms-version: 2020-08-04\r\nx-ms-client-request-id: ad39b21f-aad7-484e-8121-a707a318088e\r\nDate: Thu, 15 Jul 2021 07:24:29 GMT\r\nContent-Type: multipart/mixed; boundary=batchresponse_7c0d302a-8ee6-4d48-aac1-d973904338c3\r\n"  Azure.RequestFailedException
"Expected 2 responses for the batch request, not 1."
Status 202

其他名称结构同上,代码同上,但只包含拉丁字符的文件删除成功。

new Uri() 似乎可以正确转义字符,并且由于 BlobBatchClient.DeleteBlobsAsync 方法接受 IEnumerable&lt;Uri&gt; 我真的不明白问题出在哪里。

对此有什么想法吗?

编辑

这是一个已知问题,已经修复,将在下一个版本中发布 - https://github.com/Azure/azure-sdk-for-net/issues/22329

【问题讨论】:

好像是个bug,也许值得去github 是的,刚刚在 GitHub 中创建了一个新问题。留在这里供参考 - github.com/Azure/azure-sdk-for-net/issues/22671 【参考方案1】:

请尝试以下方法。这是一个有点复杂的方法,SDK 当然可以改进但它可以工作:

private static string connectionString =
    "DefaultEndpointsProtocol=https;AccountName=account-name;AccountKey=account-key==";
private static string containerName = "container-name";

static async Task Main(string[] args)

    BlobServiceClient blobServiceClient = new BlobServiceClient(connectionString);
    BlobBatchClient batchClient = new BlobBatchClient(blobServiceClient);
    
    List<string> blobNames = new List<string>()
    
        "здраве-и-красота-от-природатаjpg--xfgqfvhj.axp.webp",
        "thumbs/здраве-и-красота-от-природатаjpg--xfgqfvhj.axp.webp"
    ;
    BlobContainerClient containerClient = blobServiceClient.GetBlobContainerClient(containerName);
    List<BlobClient> blobClients = blobNames.Select(b => containerClient.GetBlobClient(b)).ToList();
    List<Uri> blobsToBeDeleted = blobClients.Select(b => new Uri(Uri.EscapeUriString(b.Uri.AbsoluteUri))).ToList();
    await batchClient.DeleteBlobsAsync(blobsToBeDeleted);

更新

所以我需要在我的一个项目中实现这个功能,我找到了另一种实现这个功能的方法,它有点不那么复杂。我想我也会在这里分享。这是我最终实现的代码:

private static string connectionString =
    "DefaultEndpointsProtocol=https;AccountName=account-name;AccountKey=account-key==";
private static string containerName = "container-name";
static async Task Main(string[] args)

    BlobServiceClient blobServiceClient = new BlobServiceClient(connectionString);
    BlobBatchClient batchClient = new BlobBatchClient(blobServiceClient);
    
    List<string> blobNames = new List<string>()
    
        HttpUtility.UrlEncode("здраве-и-красота-от-природатаjpg--xfgqfvhj.axp.pdf"),
        HttpUtility.UrlEncode("здраве-и-красота-от-природатаjpg--xfgqfvhj.pdf")
    ;
    BlobBatch batch = new BlobBatch(batchClient);
    foreach (var blobName in blobNames)
    
        batch.DeleteBlob(containerName, blobName, DeleteSnapshotsOption.IncludeSnapshots);
    

    await batchClient.SubmitBatchAsync(batch);

【讨论】:

刚刚测试并确认这种方法可以正常工作。这确实有点压倒性,但可以完成工作。其他解决方案是使用常规的 DeleteBlobAsync() 方法,该方法接受常规字符串并按预期工作。 It's really a bit overwhelming - 这是轻描淡写的:)。考虑到 REST API 只需要部分路径(容器名称 + blob 名称),SDK 肯定可以改进。 非常感谢您的回答,因为这在我们的应用程序中造成了一段时间的问题。而且我印象深刻,从现在开始没有人为此提出问题:) @IvayloDimitrov - 用更简洁的方法更新了我的答案。 HTH。

以上是关于Azure blob 批量删除西里尔字符的主要内容,如果未能解决你的问题,请参考以下文章

从 Azure 存储 Blob 中批量删除“x”天前的对象

使用服务帐户从 Azure Blob 存储中批量删除文件

跨多个容器批量删除 blob

Azure CosmosDB:批量删除期间出错

Azure DevOps Server:使用Postman批量删除测试用例

Azure DevOps Server:使用Postman批量删除测试用例