使用 Azure 存储容器元数据作为搜索筛选器

Posted

技术标签:

【中文标题】使用 Azure 存储容器元数据作为搜索筛选器【英文标题】:Use Azure storage container metadata as search filter 【发布时间】:2020-12-25 11:38:29 【问题描述】:

有没有办法将 Azure 存储容器上的元数据用作 Azure 认知搜索中的筛选器?

我知道 Azure 存储容器中各个 blob 上的元数据可以用作搜索过滤器。

https://docs.microsoft.com/en-us/azure/search/search-howto-indexing-azure-blob-storage#how-azure-cognitive-search-indexes-blobs

blob 上存在的用户指定的元数据属性(如果有)将逐字提取。请注意,这需要在索引中定义一个与 blob 的元数据键同名的字段。例如,如果您的 blob 具有值为 High 的 Sensitivity 元数据键,则应在搜索索引中定义一个名为 Sensitivity 的字段,它将填充为 High 值。

有没有办法在容器级别而不是 blob 级别根据元数据过滤搜索?如果没有,还有其他方法可以按存储容器过滤搜索吗?

【问题讨论】:

【参考方案1】:

很遗憾,我们还不能将 Azure 存储容器上的元数据用作 Azure 认知搜索中的筛选器。

一般这种情况,你可以在feedback上提出你的需求,我看已经有人要加这个功能了,你现在就投票吧。

【讨论】:

【参考方案2】:

是的,有办法。如果您不使用拉取内容的内置索引器,而是使用 SDK 推送内容,则可以添加所需的任何元数据。他们显然可以成为精炼者。

这意味着您必须编写代码才能从 Blob 存储中读取项目。您必须处理更新等的逻辑。您没有获得内置索引器为您提供的好处。但是,您可以控制所包含的元数据。

【讨论】:

以上是关于使用 Azure 存储容器元数据作为搜索筛选器的主要内容,如果未能解决你的问题,请参考以下文章

当搜索包含特殊字符时,Azure 搜索服务筛选器 search.ismatch() 未返回正确结果

如何筛选 Azure 审核

Azure DevOps 用户访问筛选

如何为 Dummies 筛选 Azure 日志或 WCF 数据服务筛选器

pandas读取csv数据index_col参数指定作为行索引的数据列索引列表形成复合(多层)行索引使用loc基于行层索引元组范围筛选dataframe数据(指定起始元组和结束元组)

pandas读取csv数据index_col参数指定作为行索引的数据列索引列表形成复合(多层)行索引使用loc基于行层索引元组范围筛选dataframe数据(指定起始元组和结束元组)