从Ruby中的数组中删除重复元素

Posted

技术标签:

【中文标题】从Ruby中的数组中删除重复元素【英文标题】:Remove duplicate elements from array in Ruby 【发布时间】:2012-01-12 00:53:05 【问题描述】:

我有一个包含重复元素的 Ruby 数组。

array = [1,2,2,1,4,4,5,6,7,8,5,6]

如何在不使用 for 循环和迭代的情况下从该数组中删除所有重复元素,同时保留所有唯一元素?

【问题讨论】:

【参考方案1】:
array = array.uniq

uniq 删除所有重复元素并保留数组中的所有唯一元素。

这是 Ruby 语言的众多优点之一。

【讨论】:

不,uniq!如果数组是唯一的,则方法将返回 nil 例如:a = [1,2,3,4] a.uniq -> [1,2,3,4] but a.uniq! -> 无 我真的不认为这是 ruby​​ 语言的美妙之处……它只是 ruby​​ 标准库的美妙之处?不要误会我的意思,这门语言有很多美好的地方。 用 Objective-C、javascriptphp 编写相同的代码。然后告诉我们 Ruby 不是一门漂亮的语言! 这也适用于复杂类型:[how: "are", u:"doing", how: "are"].uniq => [:how=>"are", :u=>"doing"] 关于@duykhoa 所说的,uniq!方法返回 nil,但您通常不关心 .uniq! 的返回它对对象本身进行工作【参考方案2】:

您可以使用 uniq 方法删除重复的元素:

array.uniq  # => [1, 2, 4, 5, 6, 7, 8]

知道uniq 接受一个块可能也有用,所以如果你有一个键数组:

["bucket1:file1", "bucket2:file1", "bucket3:file2", "bucket4:file2"]

如果您想知道独特的文件是什么,您可以通过以下方式找到它:

a.uniq  |f| f[/\d+$/] .map  |p| p.split(':').last 

【讨论】:

我对此有点困惑。如果您需要自己的比较函数,则使用该块 - 在您的示例中,将 uniq 发送到没有块的该数组将返回与您的块相同的值。【参考方案3】:

如果有人正在寻找删除所有重复值实例的方法,请参阅“How can I efficiently extract repeated elements in a Ruby array?”。

a = [1, 2, 2, 3]
counts = Hash.new(0)
a.each  |v| counts[v] += 1 
p counts.select  |v, count| count == 1 .keys # [1, 3]

【讨论】:

或者干脆做a = [1, 2, 2, 3] a.find_all |x| a.count(x) == 1 # [1, 3] 链接的问题不一样;它询问如何查找重复值并返回它们。 OP 想要删除重复项。【参考方案4】:

你可以返回路口。

a = [1,1,2,3]
a & a

这也会删除重复项。

【讨论】:

从功能上讲,这个答案是正确的,但我认为这明显比仅使用 uniq 可读性差。 我只是把它放在这里,所以访问此页面的人也会看到其他方法,我并不是想说它以任何方式更好。 之所以有效,是因为在使用集合操作时,结果数组被视为集合,这是一种通常没有重复值的数据结构。使用 a | a (union) 可以达到同样的效果。【参考方案5】:

如果有人关心的话,只是另一种选择。

您还可以使用数组的to_set 方法将数组转换为集合,根据定义,集合元素是唯一的。

[1,2,3,4,5,5,5,6].to_set => [1,2,3,4,5,6]

【讨论】:

如果你关心内存,to_set 将分配 4 个对象,而uniq 分配一个。【参考方案6】:

尝试使用 XOR 运算符,而不使用内置函数:

a = [3,2,3,2,3,5,6,7].sort!

result = a.reject.with_index do |ele,index|
  res = (a[index+1] ^ ele)
  res == 0
end

print result

内置函数:

a = [3,2,3,2,3,5,6,7]

a.uniq

【讨论】:

我没有投反对票,我对 Ruby 几乎一无所知,但 .sort! 不也是一个内置函数吗?【参考方案7】:

只是为了提供一些见解:

require 'fruity'
require 'set'

array = [1,2,2,1,4,4,5,6,7,8,5,6] * 1_000

def mithun_sasidharan(ary)
  ary.uniq
end

def jaredsmith(ary)
  ary & ary
end

def lri(ary)
  counts = Hash.new(0)
  ary.each  |v| counts[v] += 1 
  counts.select  |v, count| count == 1 .keys 
end

def finks(ary)
  ary.to_set
end

def santosh_mohanty(ary)
    result = ary.reject.with_index do |ele,index|
      res = (ary[index+1] ^ ele)
      res == 0
    end
end

SHORT_ARRAY = [1,1,2,2,3,1]
mithun_sasidharan(SHORT_ARRAY) # => [1, 2, 3]
jaredsmith(SHORT_ARRAY) # => [1, 2, 3]
lri(SHORT_ARRAY) # => [3]
finks(SHORT_ARRAY) # => #<Set: 1, 2, 3>
santosh_mohanty(SHORT_ARRAY) # => [1, 2, 3, 1]

puts 'Ruby v%s' % RUBY_VERSION

compare do
  _mithun_sasidharan  mithun_sasidharan(array) 
  _jaredsmith  jaredsmith(array) 
  _lri  lri(array) 
  _finks  finks(array) 
  _santosh_mohanty  santosh_mohanty(array) 
end

运行时会导致:

# >> Ruby v2.7.1
# >> Running each test 16 times. Test will take about 2 seconds.
# >> _mithun_sasidharan is faster than _jaredsmith by 2x ± 0.1
# >> _jaredsmith is faster than _santosh_mohanty by 4x ± 0.1 (results differ: [1, 2, 4, 5, 6, 7, 8] vs [1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, ...
# >> _santosh_mohanty is similar to _lri (results differ: [1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, ...
# >> _lri is similar to _finks (results differ: [] vs #<Set: 1, 2, 4, 5, 6, 7, 8>)

注意:这些返回的结果不好:

lri(SHORT_ARRAY) # =&gt; [3] finks(SHORT_ARRAY) # =&gt; #&lt;Set: 1, 2, 3&gt; santosh_mohanty(SHORT_ARRAY) # =&gt; [1, 2, 3, 1]

【讨论】:

【参考方案8】:

对我来说最简单的方法是这些:

array = [1, 2, 2, 3]

Array#to_set

array.to_set.to_a

# [1, 2, 3]

Array#uniq

array.uniq

# [1, 2, 3]

【讨论】:

以上是关于从Ruby中的数组中删除重复元素的主要内容,如果未能解决你的问题,请参考以下文章

从数组中删除重复元素[重复]

如何从js中的数组中删除元素[元素来自mongodb] [重复]

如何从js中的数组中删除元素[元素来自mongodb] [重复]

从数组中删除元素(Java)[重复]

使用支持 IE8 的 JavaScript 中的值从数组中删除一个元素 [重复]

从 mongodb 数组中的所有重复项中拉出一个元素