Azure blob 批量删除西里尔字符
Posted
技术标签:
【中文标题】Azure blob 批量删除西里尔字符【英文标题】:Azure blob batch delete cyrillic characters 【发布时间】:2021-09-24 02:50:27 【问题描述】:我可以使用 Azure.Storage.Blobs 12.9.1
上传包含西里尔字符的 blob,但无法使用 Azure.Storage.Blobs.Batch 12.6.0
批量删除它们。
考虑以下 blob 名称:здраве-и-красота-от-природатаjpg--xfgqfvhj.axp.webp 和代码:
var blobsToBeDeleted = new List<Uri>();
blobsToBeDeleted.Add(new Uri("azure-storage-address/container/здраве-и-красота-от-природатаjpg--xfgqfvhj.axp.webp"));
blobsToBeDeleted.Add(new Uri("azure-storage-address/container/thumbs/здраве-и-красота-от-природатаjpg--xfgqfvhj.axp.webp"));
await batchClient.DeleteBlobsAsync(blobsToBeDeleted);
在 Azure 上运行后,响应是:
Azure.RequestFailedException
"Invalid response\r\nStatus: 202 (Accepted)\r\n\r\nHeaders:\r\nTransfer-Encoding: chunked\r\nServer: Windows-Azure-Blob/1.0,Microsoft-HTTPAPI/2.0\r\nx-ms-request-id: 9255671d-301e-008e-1a4a-797e59000000\r\nx-ms-version: 2020-08-04\r\nx-ms-client-request-id: ad39b21f-aad7-484e-8121-a707a318088e\r\nDate: Thu, 15 Jul 2021 07:24:29 GMT\r\nContent-Type: multipart/mixed; boundary=batchresponse_7c0d302a-8ee6-4d48-aac1-d973904338c3\r\n" Azure.RequestFailedException
"Expected 2 responses for the batch request, not 1."
Status 202
其他名称结构同上,代码同上,但只包含拉丁字符的文件删除成功。
new Uri()
似乎可以正确转义字符,并且由于 BlobBatchClient.DeleteBlobsAsync
方法接受 IEnumerable<Uri>
我真的不明白问题出在哪里。
对此有什么想法吗?
编辑
这是一个已知问题,已经修复,将在下一个版本中发布 - https://github.com/Azure/azure-sdk-for-net/issues/22329
【问题讨论】:
好像是个bug,也许值得去github 是的,刚刚在 GitHub 中创建了一个新问题。留在这里供参考 - github.com/Azure/azure-sdk-for-net/issues/22671 【参考方案1】:请尝试以下方法。这是一个有点复杂的方法,SDK 当然可以改进但它可以工作:
private static string connectionString =
"DefaultEndpointsProtocol=https;AccountName=account-name;AccountKey=account-key==";
private static string containerName = "container-name";
static async Task Main(string[] args)
BlobServiceClient blobServiceClient = new BlobServiceClient(connectionString);
BlobBatchClient batchClient = new BlobBatchClient(blobServiceClient);
List<string> blobNames = new List<string>()
"здраве-и-красота-от-природатаjpg--xfgqfvhj.axp.webp",
"thumbs/здраве-и-красота-от-природатаjpg--xfgqfvhj.axp.webp"
;
BlobContainerClient containerClient = blobServiceClient.GetBlobContainerClient(containerName);
List<BlobClient> blobClients = blobNames.Select(b => containerClient.GetBlobClient(b)).ToList();
List<Uri> blobsToBeDeleted = blobClients.Select(b => new Uri(Uri.EscapeUriString(b.Uri.AbsoluteUri))).ToList();
await batchClient.DeleteBlobsAsync(blobsToBeDeleted);
更新
所以我需要在我的一个项目中实现这个功能,我找到了另一种实现这个功能的方法,它有点不那么复杂。我想我也会在这里分享。这是我最终实现的代码:
private static string connectionString =
"DefaultEndpointsProtocol=https;AccountName=account-name;AccountKey=account-key==";
private static string containerName = "container-name";
static async Task Main(string[] args)
BlobServiceClient blobServiceClient = new BlobServiceClient(connectionString);
BlobBatchClient batchClient = new BlobBatchClient(blobServiceClient);
List<string> blobNames = new List<string>()
HttpUtility.UrlEncode("здраве-и-красота-от-природатаjpg--xfgqfvhj.axp.pdf"),
HttpUtility.UrlEncode("здраве-и-красота-от-природатаjpg--xfgqfvhj.pdf")
;
BlobBatch batch = new BlobBatch(batchClient);
foreach (var blobName in blobNames)
batch.DeleteBlob(containerName, blobName, DeleteSnapshotsOption.IncludeSnapshots);
await batchClient.SubmitBatchAsync(batch);
【讨论】:
刚刚测试并确认这种方法可以正常工作。这确实有点压倒性,但可以完成工作。其他解决方案是使用常规的 DeleteBlobAsync() 方法,该方法接受常规字符串并按预期工作。It's really a bit overwhelming
- 这是轻描淡写的:)。考虑到 REST API
只需要部分路径(容器名称 + blob 名称),SDK 肯定可以改进。
非常感谢您的回答,因为这在我们的应用程序中造成了一段时间的问题。而且我印象深刻,从现在开始没有人为此提出问题:)
@IvayloDimitrov - 用更简洁的方法更新了我的答案。 HTH。以上是关于Azure blob 批量删除西里尔字符的主要内容,如果未能解决你的问题,请参考以下文章