如何在 Ruby 中映射和删除 nil 值

Posted 2023-03-16

技术标签:

【中文标题】如何在 Ruby 中映射和删除 nil 值【英文标题】：How to map and remove nil values in Ruby 【发布时间】：2012-11-09 05:51:35 【问题描述】：

我有一个map，它要么更改一个值，要么将其设置为 nil。然后我想从列表中删除 nil 条目。该列表不需要保留。

这是我目前拥有的：

# A simple example function, which returns a value or nil
def transform(n)
  rand > 0.5 ? n * 10 : nil 
end

items.map!  |x| transform(x)  # [1, 2, 3, 4, 5] => [10, nil, 30, 40, nil]
items.reject!  |x| x.nil?  # [10, nil, 30, 40, nil] => [10, 30, 40]

我知道我可以做一个循环并有条件地收集到另一个数组中，如下所示：

new_items = []
items.each do |x|
    x = transform(x)
    new_items.append(x) unless x.nil?
end
items = new_items

但这似乎不是惯用的。有没有一种很好的方法可以将函数映射到列表上，随时删除/排除 nil？

【问题讨论】：

Ruby 2.7 引入了filter_map，这似乎很适合这个。省去了重新处理数组的需要，而不是第一次就可以根据需要得到它。 More info here. 数组也有紧凑的 【参考方案1】：

你可以使用compact:

[1, nil, 3, nil, nil].compact
=> [1, 3]

我想提醒人们，如果你得到一个包含 nils 的数组作为 map 块的输出，并且该块试图有条件地返回值，那么你就有了代码异味，需要重新考虑你的逻辑。

例如，如果你正在做这样的事情：

[1,2,3].map |i|
  if i % 2 == 0
    i
  end

# => [nil, 2, nil]

那就不要了。相反，在map、reject 之前你不想要的东西或select 你想要的东西：

[1,2,3].select |i| i % 2 == 0 .map |i|
  i

# => [2]

我考虑使用compact 来清理混乱，作为最后的努力，以摆脱我们没有正确处理的事情，通常是因为我们不知道会发生什么。我们应该始终知道在我们的程序中抛出了什么样的数据；意外/未知数据是错误的。每当我在我正在处理的数组中看到 nil 时，我都会深入研究它们存在的原因，看看我是否可以改进生成数组的代码，而不是让 Ruby 浪费时间和内存来生成 nil，然后筛选数组以删除他们以后。

'Just my $%0.2f.' % [2.to_f/100]

【讨论】：

为什么要这样？ OP 需要去除 nil 条目，而不是空字符串。顺便说一句，nil 与空字符串不同。两种解决方案都在集合上迭代两次...为什么不使用reduce 或inject？这听起来不像您阅读了 OP 的问题或答案。问题是，如何从数组中删除 nil。 compact 是最快的，但实际上一开始就正确编写代码无需完全处理 nils。我不同意！问题是“映射和删除零值”。好吧，映射和删除 nil 值就是减少。在他们的示例中，OP 映射然后选择 nil。调用 map 然后 compact 或 select 然后 map 就等于犯了同样的错误：正如您在回答中指出的那样，这是代码异味。 @Ziggy 的回答应该被接受为正确答案【参考方案2】：

尝试使用reduce 或inject。

[1, 2, 3].reduce([])  |memo, i|
  if i % 2 == 0
    memo << i
  end

  memo

我同意我们不应该map 和compact 的公认答案，但原因不同。

我内心深处觉得map 然后compact 等价于select 然后map。考虑：map 是一对一的函数。如果您从一组值映射，并且您map，那么您希望在输出集中为输入集中的每个值提供一个值。如果您必须事先select，那么您可能不希望在现场使用map。如果您之后必须select（或compact），那么您可能不希望在现场使用map。无论哪种情况，您都在整个集合上迭代两次，而 reduce 只需要遍历一次。

另外，在英语中，您正在尝试“将一组整数减少为一组偶数”。

【讨论】：

可怜的 Ziggy，不喜欢你的建议。哈哈。加一，别人有数百个赞成票！我相信有一天，在您的帮助下，这个答案会超过公认的。 ^o^// +1 当前接受的答案不允许您使用您在选择阶段执行的操作的结果迭代可枚举的数据结构两次，如果只需要像在接受的答案中那样通过似乎很浪费。因此，通过使用 reduce! 来减少传递次数！谢谢@Ziggy 这是真的！但是对 n 个元素的集合进行两次传递仍然是 O(n)。除非您的集合太大以至于无法放入缓存中，否则执行两次可能就可以了（我只是认为这更优雅，更具表现力，并且将来在循环下降时不太可能导致错误不同步）。如果您也喜欢一次性完成，您可能有兴趣了解传感器！ github.com/cognitect-labs/transducers-ruby【参考方案3】：

Ruby 2.7+

现在有！

Ruby 2.7 正是为此目的引入了filter_map。它既惯用又高效，我希望它很快就会成为常态。

例如：

numbers = [1, 2, 5, 8, 10, 13]
enum.filter_map  |i| i * 2 if i.even? 
# => [4, 16, 20]

在您的情况下，当块评估为假时，只需：

items.filter_map  |x| process_x url

“Ruby 2.7 adds Enumerable#filter_map”是关于这个主题的好读物，其中一些性能基准与解决这个问题的一些早期方法相比：

N = 100_000
enum = 1.upto(1_000)
Benchmark.bmbm do |x|
  x.report("select + map")   N.times  enum.select  |i| i.even? .map |i| i + 1   
  x.report("map + compact")  N.times  enum.map  |i| i + 1 if i.even? .compact  
  x.report("filter_map")     N.times  enum.filter_map  |i| i + 1 if i.even?   
end

# Rehearsal -------------------------------------------------
# select + map    8.569651   0.051319   8.620970 (  8.632449)
# map + compact   7.392666   0.133964   7.526630 (  7.538013)
# filter_map      6.923772   0.022314   6.946086 (  6.956135)
# --------------------------------------- total: 23.093686sec
# 
#                     user     system      total        real
# select + map    8.550637   0.033190   8.583827 (  8.597627)
# map + compact   7.263667   0.131180   7.394847 (  7.405570)
# filter_map      6.761388   0.018223   6.779611 (  6.790559)

【讨论】：

不错！感谢您的更新 :) 一旦 Ruby 2.7.0 发布，我认为将接受的答案切换到这个可能是有意义的。不过，我不确定这里的礼仪是什么，您是否通常给现有接受的回复一个更新的机会？我认为这是引用 2.7 中新方法的第一个答案，因此应该成为公认的答案。 @the-tin-man 你同意这个观点吗？感谢@PeterHamilton - 感谢您的反馈，并希望它对很多人有用。我很高兴支持你的决定，但显然我喜欢你提出的论点 :) 是的，这是有核心团队倾听的语言的好处。建议更改选定的答案是一个很好的姿态，但这种情况很少发生。 SO 没有提供提醒人们的便利工具，人们通常不会重新审视他们提出的旧问题，除非 SO 表示有活动。作为侧边栏，我建议查看 Fruity 进行基准测试，因为它不那么繁琐，并且更容易进行明智的测试。【参考方案4】：

绝对compact 是解决此任务的最佳方法。但是，我们可以通过简单的减法获得相同的结果：

[1, nil, 3, nil, nil] - [nil]
 => [1, 3]

【讨论】：

是的，集合减法可以工作，但由于开销，它的速度大约是原来的一半。【参考方案5】：

在你的例子中：

items.map!  |x| process_x url  # [1, 2, 3, 4, 5] => [1, nil, 3, nil, nil]

除了被nil 替换之外，这些值看起来并没有改变。如果是这样的话，那么：

items.select|x| process_x url

足够了。

【讨论】：

【参考方案6】：

如果您想要一个更宽松的拒绝标准，例如，拒绝空字符串和 nil，您可以使用：

[1, nil, 3, 0, ''].reject(&:blank?)
 => [1, 3, 0]

如果您想进一步拒绝零值（或对流程应用更复杂的逻辑），您可以传递一个块来拒绝：

[1, nil, 3, 0, ''].reject do |value| value.blank? || value==0 end
 => [1, 3]

[1, nil, 3, 0, '', 1000].reject do |value| value.blank? || value==0 || value>10 end
 => [1, 3]

【讨论】：

.blank?仅在 Rails 中可用。为了将来参考，由于blank? 仅在rails 中可用，我们可以使用items.reject!(&:nil?) # [1, nil, 3, nil, nil] => [1, 3]，它不与rails 耦合。（但不会排除空字符串或 0）【参考方案7】：

您可以在结果数组上使用#compact 方法。

[10, nil, 30, 40, nil].compact => [10, 30, 40]

【讨论】：

这个解决方案已经提供here【参考方案8】：

each_with_object 可能是最干净的方式：

new_items = items.each_with_object([]) do |x, memo|
    ret = process_x(x)
    memo << ret unless ret.nil?
end

在我看来，each_with_object 在条件情况下比inject/reduce 更好，因为您不必担心块的返回值。

【讨论】：

【参考方案9】：

实现它的另一种方法如下所示。在这里，我们使用Enumerable#each_with_object 来收集值，并使用Object#tap 来摆脱nil 检查process_x 方法的结果所需要的临时变量。

items.each_with_object([]) |x, obj| (process x).tap |r| obj << r unless r.nil?

用于说明的完整示例：

items = [1,2,3,4,5]
def process x
    rand(10) > 5 ? nil : x
end

items.each_with_object([]) |x, obj| (process x).tap |r| obj << r unless r.nil?

替代方法：

通过查看您调用process_x url 的方法，不清楚在该方法中输入x 的目的是什么。如果我假设您将通过传递一些url 来处理x 的值，并确定哪些xs 真正被处理为有效的非零结果 - 那么，Enumerabble.group_by 可能是比Enumerable#map 更好的选择。

h = items.group_by |x| (process x).nil? ? "Bad" : "Good"
#=> "Bad"=>[1, 2], "Good"=>[3, 4, 5]

h["Good"]
#=> [3,4,5]

【讨论】：

以上是关于如何在 Ruby 中映射和删除 nil 值的主要内容，如果未能解决你的问题，请参考以下文章