将多个工作表导入到 R 中的多个数据框中

Posted

技术标签:

【中文标题】将多个工作表导入到 R 中的多个数据框中【英文标题】:Import Multiple Sheets into Multiple Data Frames in R 【发布时间】:2017-10-11 09:58:00 【问题描述】:

我有一个包含很多工作表的 Excel 文件,我需要一个代码来将每个工作表导入一个单独的数据框中,该数据框架将按照与 Excel 中工作表名称相同的约定命名。

例如,选项卡 A、B、C 将分别导入为数据框 A、B 和 C。

从其他线程中,我看到了如下代码: length(excel_sheets(filename))获取文件的张数

然后创建一个包含每个选项卡的列表:

read_excel_allsheets <- function(filename) 
  sheets <- readxl::excel_sheets(filename)
  x <-    lapply(sheets, function(X) readxl::read_excel(filename, sheet = X))
  names(x) <- sheets
  x

但我不知道标签是如何从那里导入到 R 中的。

非常感谢您的帮助。 提前致谢!

【问题讨论】:

【参考方案1】:

这是一种方法:

# write test data
tf <- writexl::write_xlsx(
  list("the mtcars" = mtcars, "iris data" = iris), 
  tempfile(fileext = ".xlsx")
)

# read excel sheets
sheets <- readxl::excel_sheets(tf)
lst <- lapply(sheets, function(sheet) 
  readxl::read_excel(tf, sheet = sheet)
)
names(lst) <- sheets

# shove them into global environment
list2env(lst, envir = .GlobalEnv)

【讨论】:

【参考方案2】:

您的函数读取所有选项卡并将它们保存为单个列表的元素(因为lapply())。您可以使用list2env 将元素从列表中取出:

your_excel_list <- read_excel_allsheets("test.xlsx")
list2env(your_excel_list, .GlobalEnv)

您会看到列表中的命名元素现在是全局环境中的数据框(或实际上是 tbl_df

【讨论】:

【参考方案3】:

可以在一行中读取。 应该加载 magrittr 和 dplyr 包。

data <- lapply(list.files(pattern = "*.xlsx"),function(x) x=read_excel(x,sheet = "(sheetname)")) %>%  bind_rows 

【讨论】:

以上是关于将多个工作表导入到 R 中的多个数据框中的主要内容,如果未能解决你的问题,请参考以下文章

将同一工作簿中的多个 Excel 工作表复合到一张工作表中

如何将一张包含多个表格的 Excel 文件拆分为单独的数据框?

将多个工作表中的值复制并粘贴到摘要工作表中

使用 Python 导入 - 将多个 excel 文件导入数据框

将当前工作簿中的所有工作表复制到新工作簿,但第一张工作表除外

将列表框中选定的 Excel 工作表保存为新的工作簿/Excel 文件