如何获取给定 Google Cloud Storage 文件夹的第一个和最后一个文件?
Posted
技术标签:
【中文标题】如何获取给定 Google Cloud Storage 文件夹的第一个和最后一个文件?【英文标题】:How to grab the first and last file of given Google Cloud Storage folder? 【发布时间】:2019-07-05 14:15:19 【问题描述】:我想从包含大量文件的文件夹gs://bundle_name/folder_name/
中获取第一个和最后一个文件(基于Last modified
时间戳)。 gsutil
或 Cloud API 似乎不支持它。
【问题讨论】:
【参考方案1】:您要求对只想存储文件的产品进行昂贵的操作。它不是一个数据库,它意味着可大规模扩展,因此您不会看到本机支持此操作。考虑改为使用数据库记录所有文件的时间,并查询数据库以查找相关文件而不是存储系统。
【讨论】:
【参考方案2】:+1 到这里的另一个答案。服务本身不支持此功能,但您可以使用客户端库(或 gsutil,如果您想做一些快速-n-dirty 正则表达式解析)来列出所需前缀下的所有文件,然后遍历它们并跟踪最新和最旧的条目(或您想要应用的任何过滤标准)。这个问题非常接近 this gsutil GitHub issue 的重复,我在其中提供了一个示例 Bash 脚本来执行类似的操作。
【讨论】:
以上是关于如何获取给定 Google Cloud Storage 文件夹的第一个和最后一个文件?的主要内容,如果未能解决你的问题,请参考以下文章
如何检查正在运行的 Google Cloud Run 容器的实例数?
如何从 Google Cloud Storage 中获取特定对象元数据信息?
如何从 Google bigquery(google-cloud-ruby gem)的视图表(具有 resource_full)中获取数据
在 google-cloud-dataflow 中使用文件模式匹配时如何获取文件名
如何在 Google Cloud Function 上的 Spring Cloud 函数中获取 Pub/Sub 事件的元数据