检测列表中的连续整数[重复]

Posted

技术标签:

【中文标题】检测列表中的连续整数[重复]【英文标题】:Detecting consecutive integers in a list [duplicate] 【发布时间】:2011-01-22 15:32:07 【问题描述】:

我有一个包含数据的列表:

[1, 2, 3, 4, 7, 8, 10, 11, 12, 13, 14]

我想打印出连续整数的范围:

1-4, 7-8, 10-14

是否有内置/快速/高效的方法来做到这一点?

【问题讨论】:

见***.com/questions/2154249/…,它指向docs.python.org/library/itertools.html#examples 家庭作业?您向我们展示了您的尝试,我们会看看是否可以做得更好。 谢谢,我应该在问之前发现的:/ 没问题,没那么容易找到——我只是碰巧记得看到过它。您的问题不是完全重复的,因为您想要的输出有点不同。 【参考方案1】:

来自the docs:

>>> from itertools import groupby
>>> from operator import itemgetter
>>> data = [ 1, 4,5,6, 10, 15,16,17,18, 22, 25,26,27,28]
>>> for k, g in groupby(enumerate(data), lambda (i, x): i-x):
...     print map(itemgetter(1), g)
...
[1]
[4, 5, 6]
[10]
[15, 16, 17, 18]
[22]
[25, 26, 27, 28]

您可以相当轻松地调整它以获得一组打印的范围。

【讨论】:

实际上,至少在 Python 2.6 中,您需要 from itertools import *from operator import *(或等效项)。 不要使用明星进口! 从不使用明星导入!请改用from itertools import groupbyfrom operator import itemgetter 将 lambda 更改为 lambda ix : ix[0] - ix[1],它可以在 Python 3 和 Python 2 中使用(嗯,不包括 print 语句)。 我正要赞成这个答案,因为它很聪明。不幸的是,我在没有解释代码在做什么/如何工作的情况下投票对我来说是聪明了。 对于所有尝试 Python 3 代码的人,请阅读@Kevin 的评论。此外,打印语句不起作用,因为您实际上需要使用list(),正如您在此处看到的***.com/questions/7731213/… 基本上您应该在Python 3 中使用print(list(map(itemgetter(1), g)))【参考方案2】:

无需额外导入即可工作的简短解决方案。它接受任何可迭代的,对未排序的输入进行排序,并删除重复项:

def ranges(nums):
    nums = sorted(set(nums))
    gaps = [[s, e] for s, e in zip(nums, nums[1:]) if s+1 < e]
    edges = iter(nums[:1] + sum(gaps, []) + nums[-1:])
    return list(zip(edges, edges))

例子:

>>> ranges([2, 3, 4, 7, 8, 9, 15])
[(2, 4), (7, 9), (15, 15)]

>>> ranges([-1, 0, 1, 2, 3, 12, 13, 15, 100])
[(-1, 3), (12, 13), (15, 15), (100, 100)]

>>> ranges(range(100))
[(0, 99)]

>>> ranges([0])
[(0, 0)]

>>> ranges([])
[]

这与 @dansalmo 的 solution 相同,我觉得这很神奇,尽管有点难以阅读和应用(因为它不是作为函数给出的)。

请注意,它可以很容易地修改为吐出“传统”开放范围[start, end),例如修改返回语句:

    return [(s, e+1) for s, e in zip(edges, edges)]

【讨论】:

sehr nett @coldfix 对于每个元组中可以使用的元素数量:[j-i+1 for i,j in range(nums)]【参考方案3】:

这将完全按照您指定的方式打印:

>>> nums = [1, 2, 3, 4, 7, 8, 10, 11, 12, 13, 14]
>>> ranges = sum((list(t) for t in zip(nums, nums[1:]) if t[0]+1 != t[1]), [])
>>> iranges = iter(nums[0:1] + ranges + nums[-1:])
>>> print ', '.join([str(n) + '-' + str(next(iranges)) for n in iranges])
1-4, 7-8, 10-14

如果列表有任何单个数字范围,它们将显示为 n-n:

>>> nums = [1, 2, 3, 4, 5, 7, 8, 9, 12, 15, 16, 17, 18]
>>> ranges = sum((list(t) for t in zip(nums, nums[1:]) if t[0]+1 != t[1]), [])
>>> iranges = iter(nums[0:1] + ranges + nums[-1:])
>>> print ', '.join([str(n) + '-' + str(next(iranges)) for n in iranges])
1-5, 7-9, 12-12, 15-18

【讨论】:

这需要更多的投票。相当优雅!【参考方案4】:

内置:没有,据我所知。

你必须遍历数组。首先将第一个值放入变量并打印它,然后只要您继续点击下一个数字,什么都不做,只记住另一个变量中的最后一个数字。如果下一个数字不在行中,请检查记住的最后一个数字与第一个数字。如果相同,则什么也不做。如果不同,打印“-”和最后一个数字。然后将当前值放入第一个变量并重新开始。 在数组的末尾,您运行相同的例程,就好像您遇到了一个不符合要求的数字。

我当然可以编写代码,但我不想破坏你的作业:-)

【讨论】:

【参考方案5】:

我遇到了类似的问题,正在使用以下排序列表。它输出一个字典,其中包含字典中列出的值范围。键分隔连续数字的每个运行,也是顺序数字之间的非连续项目的运行总和。

你的列表给了我0: [1, 4], 1: [7, 8], 2: [10, 14]的输出

def series_dictf(index_list):
    from collections import defaultdict    
    series_dict = defaultdict(list)
    sequence_dict = dict()

    list_len = len(index_list)
    series_interrupts = 0    

    for i in range(list_len):
        if i == (list_len - 1):
                break

        position_a = index_list[i]
        position_b = index_list[i + 1]

        if position_b == (position_a + 1):
            sequence_dict[position_a] = (series_interrupts)
            sequence_dict[position_b] = (series_interrupts)

        if position_b != (position_a + 1):
            series_interrupts += 1  

    for position, series in sequence_dict.items():
        series_dict[series].append(position)
    for series, position in series_dict.items():
        series_dict[series] = [position[0], position[-1]]

    return series_dict

【讨论】:

【参考方案6】:

使用集合运算,可以执行以下算法

def get_consecutive_integer_series(integer_list):
    integer_list = sorted(integer_list)
    start_item = integer_list[0]
    end_item = integer_list[-1]

    a = set(integer_list)  # Set a
    b = range(start_item, end_item+1)

    # Pick items that are not in range.
    c = set(b) - a  # Set operation b-a

    li = []
    start = 0
    for i in sorted(c):
        end = b.index(i)  # Get end point of the list slicing
        li.append(b[start:end])  # Slice list using values
        start = end + 1  # Increment the start point for next slicing
    li.append(b[start:])  # Add the last series

    for sliced_list in li:
        if not sliced_list:
            # list is empty
            continue
        if len(sliced_list) == 1:
            # If only one item found in list
            yield sliced_list[0]
        else:
            yield "0-1".format(sliced_list[0], sliced_list[-1])


a = [1, 2, 3, 6, 7, 8, 4, 14, 15, 21]
for series in get_consecutive_integer_series(a):
    print series

上述列表“a”的输出 1-4 6-8 14-15 21

【讨论】:

【参考方案7】:

您可以使用具有名为 Counter 的类的集合库。如果尝试轮询任何可迭代元素中不同元素的数量,计数器可以派上用场

from collections import Counter
data = [ 1, 4,5,6, 10, 15,16,17,18, 22, 25,26,27,28]
cnt=Counter(data)
print(cnt)

这个输出看起来像

Counter(1: 1, 4: 1, 5: 1, 6: 1, 10: 1, 15: 1, 16: 1, 17: 1, 18: 1, 22: 1, 25: 1, 26: 1, 27: 1, 28: 1)

就像任何其他字典一样,可以轮询键值

【讨论】:

这根本不是在回答问题,您只是在计算出现次数,而 OP 要求 ranges【参考方案8】:

这里还有一个基本的不使用任何模块的解决方案,这对面试很有好处,一般在面试中他们问的不使用任何模块:

#!/usr/bin/python

def split_list(n):
    """will return the list index"""
    return [(x+1) for x,y in zip(n, n[1:]) if y-x != 1]

def get_sub_list(my_list):
    """will split the list base on the index"""
    my_index = split_list(my_list)
    output = list()
    prev = 0
    for index in my_index:
        new_list = [ x for x in my_list[prev:] if x < index]
        output.append(new_list)
        prev += len(new_list)
    output.append([ x for x in my_list[prev:]])
    return output

my_list = [1, 3, 4, 7, 8, 10, 11, 13, 14]
print get_sub_list(my_list)

输出:

[[1], [3, 4], [7, 8], [10, 11], [13, 14]]

【讨论】:

以上是关于检测列表中的连续整数[重复]的主要内容,如果未能解决你的问题,请参考以下文章

如何对数组中的连续整数进行分组?

从Python中的嵌套列表中删除连续的重复项?

正则表达式从逗号分隔列表中删除连续重复(整数和/或浮点数)

杂题之求1-100连续不重复整数中的缺少的一个数

LINQ 查询以检测对象列表中的重复属性

在与整数配对的所有数字列表中的元组内创建一个列表[重复]