R(purrr)展平命名列表列表以列出并保留名称

Posted

技术标签:

【中文标题】R(purrr)展平命名列表列表以列出并保留名称【英文标题】:R (purrr) flatten list of named lists to list and keep names 【发布时间】:2018-08-21 11:40:48 【问题描述】:

也许我遗漏了一些明显的东西,但试图将 R 中命名列表的命名列表(甚至可能更嵌套)扁平化为最终一个扁平列表。 purrrrlist 似乎有这方面的工具。如何实现子列表的名称成为扁平结果列表的名称预加密,例如list1.blist.apurrr 中?我的实际列表更深地嵌套了不同数量的级别和不同级别的重复名称。最后我执行purrr::map_df(final_list, bind_rows),这似乎删除了所有重复的名称(即使它没有,我也不知道原始重复名称来自哪个分支)。我可以用rlist 做到这一点,但我希望有一个tidyverse 解决方案(没有什么反对奇妙的rlist,但很多人已经安装了tidyverse)。

编辑:

还请注意,rlist::list.flatten() 将始终删除除顶部之外的所有级别,而 purrr::flatten() 一次删除一个级别,这有时可能是您需要的。您可以通过根据需要经常嵌套 purrr::map(.x, .f = rlist::list.flatten) 来实现相同的目的,但这很麻烦而且不美观/不可读。

alist <- list(list1 = list(a = 1, b = 2, blist = list(a = 3, b = 4)),
              list2 = list(a = 1, b = 2, blist = list(a = 3, b = 4)))
str(alist)

List of 2
 $ list1:List of 3
  ..$ a    : num 1
  ..$ b    : num 2
  ..$ blist:List of 2
  .. ..$ a: num 3
  .. ..$ b: num 4
 $ list2:List of 3
  ..$ a    : num 1
  ..$ b    : num 2
  ..$ blist:List of 2
  .. ..$ a: num 3
  .. ..$ b: num 4

alist_flat <- purrr::map(alist, purrr::flatten)
str(alist_flat)

List of 2
 $ list1:List of 4
  ..$ a: num 1
  ..$ b: num 2
  ..$ a: num 3
  ..$ b: num 4
 $ list2:List of 4
  ..$ a: num 1
  ..$ b: num 2
  ..$ a: num 3
  ..$ b: num 4

alist_flattest <- purrr::flatten(alist_flat)
str(alist_flattest)

List of 8
 $ a: num 1
 $ b: num 2
 $ a: num 3
 $ b: num 4
 $ a: num 1
 $ b: num 2
 $ a: num 3
 $ b: num 4

# works with rlist
alist_flat_names <- map(alist, rlist::list.flatten, use.names = TRUE)
str(alist_flat_names)

List of 2
 $ list1:List of 4
  ..$ a      : num 1
  ..$ b      : num 2
  ..$ blist.a: num 3
  ..$ blist.b: num 4
 $ list2:List of 4
  ..$ a      : num 1
  ..$ b      : num 2
  ..$ blist.a: num 3
  ..$ blist.b: num 4

alist_flattest_names <- rlist::list.flatten(alist_flat_names, use.names = TRUE)
str(alist_flattest_names)

List of 8
 $ list1.a      : num 1
 $ list1.b      : num 2
 $ list1.blist.a: num 3
 $ list1.blist.b: num 4
 $ list2.a      : num 1
 $ list2.b      : num 2
 $ list2.blist.a: num 3
 $ list2.blist.b: num 4

【问题讨论】:

【参考方案1】:

我查看了 rlist::list.flatten() 的源代码并将源代码复制到一个新函数中以避免这种依赖关系。

my_flatten <- function (x, use.names = TRUE, classes = "ANY") 

  #' Source taken from rlist::list.flatten
  len <- sum(rapply(x, function(x) 1L, classes = classes))
  y <- vector("list", len)
  i <- 0L
  items <- rapply(x, function(x) 
    i <<- i + 1L
    y[[i]] <<- x
    TRUE
  , classes = classes)
  if (use.names && !is.null(nm <- names(items))) 
    names(y) <- nm
  y


alist <- list(list1 = list(a = 1, b = 2, blist = list(a = 3, b = 4)),
              list2 = list(a = 1, b = 2, blist = list(a = 3, b = 4)))


flat_list <- my_flatten(alist)

str(flat_list)

结果:

List of 8
 $ list1.a      : num 1
 $ list1.b      : num 2
 $ list1.blist.a: num 3
 $ list1.blist.b: num 4
 $ list2.a      : num 1
 $ list2.b      : num 2
 $ list2.blist.a: num 3
 $ list2.blist.b: num 4

【讨论】:

这当然是一种方式,但请注意 rlist::list.flatten() 与 purrr::flatten() 的区别。请参阅我的编辑。否则当然是一个非常好的方法。

以上是关于R(purrr)展平命名列表列表以列出并保留名称的主要内容,如果未能解决你的问题,请参考以下文章

更安静的purrr :: map2用于名称乱序的列表

展平R中的命名列表

在 R 中展平或取消列出数据框

Python:展平内部列表时保留外部列表

Java:展平列表或对象的列表,保留类

将嵌套命名元组的列表展平为字典列表