如何使用 R 根据顺序父文件夹名称批量重命名许多文件

Posted

技术标签:

【中文标题】如何使用 R 根据顺序父文件夹名称批量重命名许多文件【英文标题】:How to use R to batch rename many files based on sequential parent folder names 【发布时间】:2022-01-15 13:19:53 【问题描述】:

我的理学硕士项目有 1 TB 的视频和相关文件,我正在尝试重命名 R 中的所有文件。每个摄像机的父文件夹-子文件夹布局如下:

相机 ID(例如,C00125) YYYY_MM DD HH(24 小时制) CameraID_HHMMSS_#15(文件名) DD DD DD YYYY_MM

在每个最终的子文件夹中,都有数量不定的文件,每个唯一的文件名都有 3 种不同的文件类型与之关联:AVI 文件、LBC 文件和 Wav 文件。因此,如果最终子文件夹只有 1 个视频(最多可以有 6 个视频),那么仍然会有 3 个文件,例如C00141_192000_#15、C00141_192000_#15.lbc 和 C00141_192000_#15。 LBC 文件在每个文件名的末尾都有一个文件扩展名“.lbc”。

我需要将每个 camera 中的所有文件编译到每个相机的 1 个文件夹中,但令人沮丧的是,我将拥有一堆基于 HHMMSS 的具有相同文件名的文件,而文件名将不指示每个文件实际关联的 YYYYMMDD。因此,我需要重命名每个文件,以便将相应的 YYYYMMDD 添加到已经具有 CameraID 和 HHMMSS 的当前文件名中。我能看到的最好方法是从每个文件的前 三个 父文件夹中获取 YYYYMMDD 信息(除非您可以以某种方式跳过 HH 子文件夹)。我不在乎我是否保留“_#15”。

理想情况下,这将产生文件名 C00141_2021_05_09_192000_#15(对于上述示例中的三种文件类型中的每一种)。 但考虑到子文件夹的性质,我可以使用 2021_05_09_19_C00141_192000_#15 之类的内容。真正重要的是文件名对其对应的 CameraID、YYYYMMDD 和 HHMMSS 是唯一的,并且一旦文件被重命名并合并在一起,文件就可以在文件资源管理器中按时间顺序排序。 p>

我查看了多个其他论坛,但答案对于帖子中的特定文件名过于专业,并且没有涉及多个子文件夹。我还研究了“批量重命名实用程序”Web 应用程序,它大致可以满足我的需要,但一次只有 1 个子文件夹,这对于我拥有的子文件夹数量(15 台相机 x 3 个月 x ~30 天 x 24 小时)

我已经为此苦苦挣扎了整整 2 天,但一直没有取得太大进展。在我弄清楚这一点之前,我的项目无法取得任何进展,所以我非常感谢任何帮助!我对 R 和编程比较陌生。

【问题讨论】:

这似乎不是很困难,但我不明白你想要的具体结果是什么。你能举一个最小的例子,包括原始目录结构和你最终想要的目录结构吗? 【参考方案1】:

我会这样做。这假设您的工作目录是包含所有“相机 ID(例如 C00125)”文件夹的文件夹。另外,我强烈建议您在执行此操作之前备份您的数据。为了安全起见,我在这里使用file.copy()file.rename() 可能更快...

您可以轻松地使用正则表达式根据文件路径将文件重命名为您想要的任何名称。如果您对此很挑剔,请告诉我,但根据您的问题,这没什么大不了的。我建议使用最简单的方法来确保视频名称保留尽可能多的信息。

无法保证这会奏效。首先对数据的一个子集进行试验。在尝试之前备份您的数据!

# Create new folder to move all video files into
new_dir <- "./new_dir"
dir.create(new_dir)

# Get all target files
old_names <- list.files(recursive=TRUE)
old_names
#> [1] C00125/YYYY_MM/DD/HH/CameraID_HHMMSS_#15.avi

# Rename files by reordering elements and replacing slashes
# with underscores
new_names <- gsub(
  pattern = "^(.*)/(.*)/(.*)/(.*)/(.*)$",
  replacement = "\\2_\\3_\\4_\\1_\\5",
  x = old_names)
new_names
#> [1] "YYYY_MM_DD_HH_C00125_CameraID_HHMMSS_#15.avi"

file.copy(from=old_names, to=paste0(new_dir, "/", new_names))
#> [1] TRUE

Created on 2021-12-11 by the reprex package (v2.0.1)

【讨论】:

非常感谢!它适用于我的示例子集。我最终将其更改为 pattern = "^(.*)/(.*)/(.*)/(.*)/(.*)$", replacement = "\\1_\\2_\\3_\ \5",因为我不需要文件名中的独立 'HH'。如果它足够简单,我将不胜感激知道如何从新名称格式“CameraID_YYYY_MM_DD_CameraID_HHMMSS_#15.avi”中删除第二个“CameraID”,以使其更易于阅读。如果您愿意展示给我看,将不胜感激。 当然!您可以对 gsub 使用更多模式匹配。例如,gsub(pattern = "_CameraID_", replacement = "", x = "CameraID_YYYY_MM_DD_CameraID_HHMMSS_#15.avi")。我强烈推荐学习正则表达式……它非常有用,对某些人来说,很有趣! regexcrossword.com 或者,一起:gsub(pattern = "^(.*)/(.*)/(.*)/(.*)/CameraID_(.*)$", replacement = "CameraID_\\1_\\2_\\3_\\5", x = old_names) 太棒了,谢谢!那么,我必须为每个相机文件夹单独执行此操作,因为它们都有唯一的相机 ID?或者有没有办法使用 gsub 来匹配相机名称的模式(因为它们都以 C00 开头,后跟 3 个数字和一个下划线),以便每个文件名都以唯一的相机 ID 开头?例如,是否能够将任何相机 ID 的 C00140/2021_05/19/20/C00140_204000_#15.avi 转换为 C00140_2021_05_19_204000_#15.avi,只需一组代码? 通过查看正则表达式字符,它是否会删除任何看起来像“C00....我试过这样的东西,但我无法让它工作

以上是关于如何使用 R 根据顺序父文件夹名称批量重命名许多文件的主要内容,如果未能解决你的问题,请参考以下文章

如何根据相应文件的父文件夹名称使用 Grunt 重命名文件?

文件夹批量改名?

怎么用bat文件批量修改文件名称

Bat批处理:批量重命名包含指定名称文件夹里的指定文件

批量重命名文件以在 linux 中包含文件夹/目录名称

bat批处理:根据文本文件批量重命名文件