将一个组组合成多个组而不重复

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了将一个组组合成多个组而不重复相关的知识,希望对你有一定的参考价值。

我们有一个元素列表[A,B,C,D,E]和3个组合这些元素,我想打印一个所有独特组合的列表,而不重复这3个组。只有长度为[2,2,1]的组是有效的(它可以在之后进行过滤,它不是必须的,但是它会很有效,并且,如果需要,可以手动指定组的长度作为参数)。我的意思是独特而不重复:

[[A,B],[C,D],[E]]和[[C,D],[A,B],[E]]和[[B,A],[C,D],[ E]]会是一样的,所以组内部元素的顺序或组的顺序无关紧要,我对这些组合不感兴趣。

在我的特定情况下,我有16个项目和3组,每组5,5和6项。

我想要实现的一个例子:

/**
 * Returns all the unique combinations of a group into multiple groups
 * [data] the group of elements to combine
 * [numberOfGroups] the number of groups
 */
fun combinations(data: List<String>, numberOfGroups: Int): List<List<List<String>>> {
    // The combinations code
}

val data = listOf("A", "B", "C", "D", "E")
print(combinations(data, 3))

输出将是这样的:

[
   [[A,B],[C,D],[E]],
   [[A,D],[B,C],[E]],
   ...
]

先感谢您。

答案

我一般不知道你的问题的答案,但我会尝试解决这个将5个元素列表分成[2,1,1]组的特殊情况,并分享一些可以帮助你设计的原则更通用的解决方案。

首先,我们来谈谈如何表示结果。如果组内元素的顺序不重要,则使用Set<String>表示组是很方便的,因此setOf("A", "B")等于setOf("B", "A")。然后,如果组合中的组自身的顺序无关紧要,则该组合可以是一组组,即Set<Set<String>>

现在关于算法本身。将这种算法结构化为递归搜索很方便:从数据中选择第一组项目,然后在没有选定项目的情况下解决数据问题,并将第一组与除此之外的所有解决方案相结合。所以我们搜索组合的功能可以如下所示:

fun combinationSequence(data: List<String>): Sequence<Set<Set<String>>> = sequence {
    for (group in possibleFirstGroups(data)) {
        val remaining = data - group
        if (remaining.isEmpty()) {
            yield(setOf(group))
        } else {
            yieldAll(combinationSequence(remaining).map { r -> setOf(group) + r })
        }
    }
}

然后,如何以所有可能的方式选择第一组。对于大小为1或2的组,我们可以从所有数据元素中选择组的第一个元素,然后从剩余的元素中选择第二个元素:

fun possibleFirstGroups(data: List<String>): Sequence<Set<String>> =
        when (data.size) {
            0 -> emptySequence()
            1, 2 -> sequenceOf(data.toSet())
            else -> sequence {
                for (e1 in data) {
                    for (e2 in data - e1) {
                        yield(setOf(e1, e2))
                    }
                }
            }
        }

我们的combinationSequence返回结果,但会有很多重复,如[[A, B], [C, D], [E]][[C, D], [A, B], [E]]。为了只留下它们中的不同,我们可以使用函数distinct

combinationSequence(data).distinct().forEach { println(it) }

请注意,此解决方案的复杂性随着项目数量呈指数级增长,因此我不希望16个元素的解决方案及时终止:)

降低复杂性的一种方法是修剪搜索空间。例如,如果我们已经找到了以[A, B]组开头的所有组合,我们就可以避免在中间某处产生包含该组的组合,例如[C, D], [A, B], ...

以上是关于将一个组组合成多个组而不重复的主要内容,如果未能解决你的问题,请参考以下文章

有没有办法将2个非常相似的代码片段组合成一个函数并重复?

将两个 snap svg 组组合成一个组

PowerShell脚本来计算多个组的成员而不重复

播放随机声音而不重复

MongoDB - 在聚合中选择组而不指定字段

Javascript:检查正则表达式是不是包含捕获组而不执行它[关闭]