如何正确排序带有数字的字符串? [复制]

Posted

技术标签:

【中文标题】如何正确排序带有数字的字符串? [复制]【英文标题】:How to correctly sort a string with a number inside? [duplicate] 【发布时间】:2011-08-23 11:24:18 【问题描述】:

我有一个包含数字的字符串列表,但我找不到对它们进行排序的好方法。 例如我得到这样的东西:

something1
something12
something17
something2
something25
something29

使用sort() 方法。

我知道我可能需要以某种方式提取数字然后对列表进行排序,但我不知道如何以最简单的方式进行。

【问题讨论】:

sort() 有什么问题? 这有一个名字,自然排序。请参阅 ***.com/questions/2545532/… 和 ***.com/questions/4836710/… 以及可能的其他人。 为什么不只是list_name.sort(key= lambda x: float(x.strip('something'))) 【参考方案1】:

也许您正在寻找human sorting(也称为natural sorting):

import re

def atoi(text):
    return int(text) if text.isdigit() else text

def natural_keys(text):
    '''
    alist.sort(key=natural_keys) sorts in human order
    http://nedbatchelder.com/blog/200712/human_sorting.html
    (See Toothy's implementation in the comments)
    '''
    return [ atoi(c) for c in re.split(r'(\d+)', text) ]

alist=[
    "something1",
    "something12",
    "something17",
    "something2",
    "something25",
    "something29"]

alist.sort(key=natural_keys)
print(alist)

产量

['something1', 'something2', 'something12', 'something17', 'something25', 'something29']

PS。我已将答案更改为使用 Toothy 的自然排序实现(发布在 cmets here),因为它比我原来的答案快得多。


如果您希望使用浮点数对文本进行排序,则需要将正则表达式从匹配整数(即(\d+))的正则表达式更改为a regex that matches floats:

import re

def atof(text):
    try:
        retval = float(text)
    except ValueError:
        retval = text
    return retval

def natural_keys(text):
    '''
    alist.sort(key=natural_keys) sorts in human order
    http://nedbatchelder.com/blog/200712/human_sorting.html
    (See Toothy's implementation in the comments)
    float regex comes from https://***.com/a/12643073/190597
    '''
    return [ atof(c) for c in re.split(r'[+-]?([0-9]+(?:[.][0-9]*)?|[.][0-9]+)', text) ]

alist=[
    "something1",
    "something2",
    "something1.0",
    "something1.25",
    "something1.105"]

alist.sort(key=natural_keys)
print(alist)

产量

['something1', 'something1.0', 'something1.105', 'something1.25', 'something2']

【讨论】:

我也可以使用上述方法对具有子属性(字符串)的对象列表进行排序。只需将“text”替换为“someobject”,然后return [ atoi(c) for c in re.split('(\d+)', someobject.sometextproperty) ] 您知道如何将其扩展到数字为浮点数的情况吗?例如,something1.0、something 1.25、something2.0。 @painfulenglish:我已经修改了上面的帖子,以展示如何使用浮动对文本进行自然排序。 要修复 pylint 警告 W1401:字符串中的异常反斜杠,只需在正则表达式前面加上 'r' 前缀,如下所示:re.split(r'(\d+)', text) 我已经使用 about 代码对列表进行排序,但是知道为什么我不能先删除重复条目,即:attr1 = set(all_names) attr1.sort(key=natural_keys)

以上是关于如何正确排序带有数字的字符串? [复制]的主要内容,如果未能解决你的问题,请参考以下文章

如何检查带有空格的字符串没有数字? [复制]

如何解析带有欧元货币符号的数字字符串? [复制]

如何在 JavaScript 中输出带有前导零的数字? [复制]

Excel:如何像数据透视表一样对一系列带有前导零的数字进行排序?

如何检查字符串是不是为数字? [复制]

在 HTML 属性中调用带有字符串参数的函数的正确语法是啥? [复制]