使用假设生成具有自定义值限制的列表列表

Posted

技术标签:

【中文标题】使用假设生成具有自定义值限制的列表列表【英文标题】:Generating list of lists with custom value limitations with Hypothesis 【发布时间】:2017-01-26 10:38:09 【问题描述】:

故事:

目前,我有一个被测函数,它需要一个具有以下规则的 整数列表列表

    子列表的数量(我们称之为N)可以从1到50 子列表中的值数量对于所有子列表(矩形形式)都是相同的,并且应该 >= 0 和 子列表中的值不能大于或等于子列表的总数。换句话说,子列表中的每个值都是一个整数 >= 0 并且 N

有效输入示例:

[[0]]
[[2, 1], [2, 0], [3, 1], [1, 0]]
[[1], [0]]

无效输入示例:

[[2]]  # 2 is more than N=1 (total number of sublists)
[[0, 1], [2, 0]]  # 2 is equal to N=2 (total number of sublists)

我正在尝试使用 property-based-testing 来处理它,并使用 hypothesis library 生成不同的有效输入,并尝试将我的头绕在 lists()integers() 周围,但无法做出它工作:

使用 lists()min_sizemax_size 参数很容易实现条件 #1 Chaining strategies together 涵盖了条件 #2 条件 #3 是我正在努力解决的问题 - 因为,如果我们使用上面示例中的 rectangle_lists,我们没有引用 integers() 中的“父”列表的长度

问题:

如何将子列表中的整数值限制为小于子列表的总数?


我的一些尝试:

from hypothesis import given
from hypothesis.strategies import lists, integers

@given(lists(lists(integers(min_value=0, max_value=5), min_size=1, max_size=5), min_size=1, max_size=50))
def test(l):
    # ...

这个远远不能满足要求 - 列表不是严格的矩形形式,生成的整数值可以超过列表的生成大小。

from hypothesis import given
from hypothesis.strategies import lists, integers

@given(integers(min_value=0, max_value=5).flatmap(lambda n: lists(lists(integers(min_value=1, max_value=5), min_size=n, max_size=n), min_size=1, max_size=50)))
def test(l):
    # ...

这里,#1 和 #2 是满足要求,但整数值可以大于列表的大小 - 不满足要求 #3。

【问题讨论】:

【参考方案1】:

有一个很好的通用技术,在尝试解决像这样的棘手约束时通常很有用:尝试构建一些看起来有点像你想要的但不满足所有约束的东西,然后用一个修改它的函数组合它它(例如通过丢弃坏位或修补不太工作的位)以使其满足约束。

对于您的情况,您可以执行以下操作:

from hypothesis.strategies import builds, lists, integers

def prune_list(ls):
    n = len(ls)
    return [
       [i for i in sublist if i < n][:5]
       for sublist in ls
    ]

limited_list_strategy = builds(
   prune_list,
   lists(lists(integers(0, 49), average_size=5), max_size=50, min_size=1)
)

在此我们:

    生成一个看起来大致正确的列表(它是一个整数列表,并且整数与所有可能有效的可能索引在同一范围内)。 从子列表中删除所有无效索引 截断其中仍包含 5 个以上元素的所有子列表

结果应满足您需要的所有三个条件。

average_size 参数并不是绝对必要的,但在试验时我发现它有点太容易产生空子列表,否则。

预计到达时间:抱歉。我刚刚意识到我误读了您的一个条件-这实际上并不能完全满足您的要求,因为它不能确保每个列表的长度相同。这是一种修改它的方法来解决这个问题(它变得有点复杂,所以我已经切换到使用复合而不是构建):

from hypothesis.strategies import composite, lists, integers, permutations


@composite
def limisted_lists(draw):
    ls = draw(
        lists(lists(integers(0, 49), average_size=5), max_size=50, min_size=1)
    )
    filler = draw(permutations(range(50)))
    sublist_length = draw(integers(0, 5))

    n = len(ls)
    pruned = [
       [i for i in sublist if i < n][:sublist_length]
       for sublist in ls
    ]

    for sublist in pruned:
        for i in filler:
            if len(sublist) == sublist_length:
               break
            elif i < n:
               sublist.append(i)
    return pruned

我们的想法是我们生成一个“填充”列表,它为子列表的外观提供默认值(因此它们会朝着彼此更相似的方向缩小),然后将子列表的长度绘制为修剪以获得这种一致性。

我承认这很复杂。您可能想使用 RecursivelyIronic 的基于平面图的版本。我更喜欢这个的主要原因是它会更好地缩小,所以你会从中得到更好的例子。

【讨论】:

【参考方案2】:

您也可以使用flatmap 来执行此操作,尽管有点曲解。

from hypothesis import strategies as st
from hypothesis import given, settings

number_of_lists = st.integers(min_value=1, max_value=50)
list_lengths = st.integers(min_value=0, max_value=5)

def build_strategy(number_and_length):
    number, length = number_and_length
    list_elements = st.integers(min_value=0, max_value=number - 1)
    return st.lists(
        st.lists(list_elements, min_size=length, max_size=length),
        min_size=number, max_size=number)

mystrategy = st.tuples(number_of_lists, list_lengths).flatmap(build_strategy)

@settings(max_examples=5000)
@given(mystrategy)
def test_constraints(list_of_lists):
    N = len(list_of_lists)

    # condition 1
    assert 1 <= N <= 50

    # Condition 2
    [length] = set(map(len, list_of_lists))
    assert 0 <= length <= 5

    # Condition 3
    assert all((0 <= element < N) for lst in list_of_lists for element in lst)

正如大卫所说,这确实会产生大量空列表,因此需要进行一些平均大小调整。

>>> mystrategy.example()
[[24, 6, 4, 19], [26, 9, 15, 15], [1, 2, 25, 4], [12, 8, 18, 19], [12, 15, 2, 31], [3, 8, 17, 2], [5, 1, 1, 5], [7, 1, 16, 8], [9, 9, 6, 4], [22, 24, 28, 16], [18, 11, 20, 21], [16, 23, 30, 5], [13, 1, 16, 16], [24, 23, 16, 32], [13, 30, 10, 1], [7, 5, 14, 31], [31, 15, 23, 18], [3, 0, 13, 9], [32, 26, 22, 23], [4, 11, 20, 10], [6, 15, 32, 22], [32, 19, 1, 31], [20, 28, 4, 21], [18, 29, 0, 8], [6, 9, 24, 3], [20, 17, 31, 8], [6, 12, 8, 22], [32, 22, 9, 4], [16, 27, 29, 9], [21, 15, 30, 5], [19, 10, 20, 21], [31, 13, 0, 21], [16, 9, 8, 29]]
>>> mystrategy.example()
[[28, 18], [17, 25], [26, 27], [20, 6], [15, 10], [1, 21], [23, 15], [7, 5], [9, 3], [8, 3], [3, 4], [19, 29], [18, 11], [6, 6], [8, 19], [14, 7], [25, 3], [26, 11], [24, 20], [22, 2], [19, 12], [19, 27], [13, 20], [16, 5], [6, 2], [4, 18], [10, 2], [26, 16], [24, 24], [11, 26]]
>>> mystrategy.example()
[[], [], [], [], [], [], [], [], [], [], [], [], [], [], [], [], [], [], [], [], [], [], [], []]
>>> mystrategy.example()
[[], [], [], [], [], [], [], [], [], [], [], [], [], [], []]
>>> mystrategy.example()
[[6, 8, 22, 21, 22], [3, 0, 24, 5, 18], [16, 17, 25, 16, 11], [2, 12, 0, 3, 15], [0, 12, 12, 12, 14], [11, 20, 6, 6, 23], [5, 19, 2, 0, 12], [16, 0, 1, 24, 10], [2, 13, 21, 19, 15], [2, 14, 27, 6, 7], [22, 25, 18, 24, 9], [26, 21, 15, 18, 17], [7, 11, 22, 17, 21], [3, 11, 3, 20, 16], [22, 13, 18, 21, 11], [4, 27, 21, 20, 25], [4, 1, 13, 5, 13], [16, 19, 6, 6, 25], [19, 10, 14, 12, 14], [18, 13, 13, 16, 3], [12, 7, 26, 26, 12], [25, 21, 12, 23, 22], [11, 4, 24, 5, 27], [25, 10, 10, 26, 27], [8, 25, 20, 6, 23], [8, 0, 12, 26, 14], [7, 11, 6, 27, 26], [6, 24, 22, 23, 19]]

【讨论】:

【参考方案3】:

很晚了,但为了后代:最简单的解决方案是选择维度,然后从元素策略开始构建。

from hypothesis.strategies import composite, integers, lists

@composite
def complicated_rectangles(draw, max_N):
    list_len = draw(integers(1, max_N))
    sublist_len = draw(integers(0, 5))
    element_strat = integers(0, min(list_len, 5))
    sublist_strat = lists(
        element_strat, min_size=sublist_len, max_size=sublist_len)
    return draw(lists(
        sublist_strat, min_size=list_len, max_size=list_len))

【讨论】:

以上是关于使用假设生成具有自定义值限制的列表列表的主要内容,如果未能解决你的问题,请参考以下文章

根据值使用自定义适配器编辑列表视图中的项目

按列表列值创建自定义警报Sharepoint无法正常工作

滚动自定义 ListView 时,复选框值发生变化

导致具有多个参数的过滤列表的自定义操作?

具有多个子项目的项目列表的自定义适配器?

使用自定义策略限制某些使用 Sonata 的用户的操作