如何对字符串列表进行排序?

Posted

技术标签:

【中文标题】如何对字符串列表进行排序?【英文标题】:How to sort a list of strings? 【发布时间】:2010-09-07 08:38:37 【问题描述】:

在 Python 中创建按字母顺序排序的列表的最佳方法是什么?

【问题讨论】:

使用locale,它的字符串排序方法可以根据当前语言环境自然排序。 【参考方案1】:

基本答案:

mylist = ["b", "C", "A"]
mylist.sort()

这会修改您的原始列表(即就地排序)。要获取列表的排序副本,而不更改原始列表,请使用 sorted() 函数:

for x in sorted(mylist):
    print x

但是,上面的示例有点幼稚,因为它们没有考虑语言环境,并且执行区分大小写的排序。您可以利用可选参数key 来指定自定义排序顺序(使用cmp 的替代方案是一个已弃用的解决方案,因为它必须被多次评估——key 每个元素只计算一次)。

因此,要根据当前语言环境进行排序,考虑到特定于语言的规则(cmp_to_key 是 functools 的辅助函数):

sorted(mylist, key=cmp_to_key(locale.strcoll))

最后,如果需要,可以指定custom locale 进行排序:

import locale
locale.setlocale(locale.LC_ALL, 'en_US.UTF-8') # vary depending on your lang/locale
assert sorted((u'Ab', u'ad', u'aa'),
  key=cmp_to_key(locale.strcoll)) == [u'aa', u'Ab', u'ad']

最后一点:您将看到使用lower() 方法的不区分大小写排序的示例 - 这些是不正确的,因为它们仅适用于 ASCII 字符子集。这两个对于任何非英语数据都是错误的:

# this is incorrect!
mylist.sort(key=lambda x: x.lower())
# alternative notation, a bit faster, but still wrong
mylist.sort(key=str.lower)

【讨论】:

mylist.sort(key=str.lower) 更快。 好点。我将保留我当前的示例,因为对于初学者来说可能更容易看到正在发生的事情,但我会在未来记住这一点。 如果有人好奇,list.sort() 的性能可以参考here @BornToCode:1-I know。查看我的评论回复的修订版(2008)(我的评论是关于不必要地使用 lambda)。 2- 对非 ASCII 字符进行排序是一个很大的独立主题。 PyICU could be used 而不是基于语言环境的解决方案。 @Dmitry 这是因为您正在打印[1, 2, 3].sort() 中调用的排序函数的返回值。由于sort() 对列表进行了适当的排序(即直接更改列表),它不会返回排序后的列表,实际上也不会返回任何内容,因此您的打印语句将打印None。如果您将列表保存到一个变量中,例如x,称为x.sort(),然后是print(x),您将看到排序后的列表。【参考方案2】:

还有一个值得注意的sorted()函数:

for x in sorted(list):
    print x

这将返回一个新的排序版本的列表,而不更改原始列表。

【讨论】:

【参考方案3】:
list.sort()

真的就是这么简单:)

【讨论】:

【参考方案4】:

对字符串进行排序的正确方法是:

import locale
locale.setlocale(locale.LC_ALL, 'en_US.UTF-8') # vary depending on your lang/locale
assert sorted((u'Ab', u'ad', u'aa'), cmp=locale.strcoll) == [u'aa', u'Ab', u'ad']

# Without using locale.strcoll you get:
assert sorted((u'Ab', u'ad', u'aa')) == [u'Ab', u'aa', u'ad']

mylist.sort(key=lambda x: x.lower()) 的前面示例适用于纯 ASCII 上下文。

【讨论】:

【参考方案5】:

请在 Python3 中使用 sorted() 函数

items = ["love", "like", "play", "cool", "my"]
sorted(items2)

【讨论】:

【参考方案6】:

但这如何处理特定于语言的排序规则?是否考虑了语言环境?

不,list.sort() 是一个通用的排序函数。如果要根据 Unicode 规则进行排序,则必须定义自定义排序键函数。你可以尝试使用pyuca模块,但我不知道它有多完整。

【讨论】:

【参考方案7】:

老问题,但如果您想在不设置locale.LC_ALL 的情况下进行区域感知排序,您可以按照this answer 的建议使用PyICU library:

import icu # PyICU

def sorted_strings(strings, locale=None):
    if locale is None:
       return sorted(strings)
    collator = icu.Collator.createInstance(icu.Locale(locale))
    return sorted(strings, key=collator.getSortKey)

然后调用例如:

new_list = sorted_strings(list_of_strings, "de_DE.utf8")

这对我有用,无需安装任何语言环境或更改其他系统设置。

(这已经被建议in a comment above,但我想更突出它,因为我一开始自己错过了。)

【讨论】:

【参考方案8】:

假设s = "ZWzaAd"

要对上面的字符串进行排序,简单的解决方案将低于一个。

print ''.join(sorted(s))

【讨论】:

这不是您在此处排序的字符串列表【参考方案9】:

或许:

names = ['Jasmine', 'Alberto', 'Ross', 'dig-dog']
print ("The solution for this is about this names being sorted:",sorted(names, key=lambda name:name.lower()))

【讨论】:

【参考方案10】:
l =['abc' , 'cd' , 'xy' , 'ba' , 'dc']
l.sort()
print(l1)

结果

['abc', 'ba', 'cd', 'dc', 'xy']

【讨论】:

【参考方案11】:

很简单: https://trinket.io/library/trinkets/5db81676e4

scores = '54 - Alice,35 - Bob,27 - Carol,27 - Chuck,05 - Craig,30 - Dan,27 - Erin,77 - Eve,14 - Fay,20 - Frank,48 - Grace,61 - Heidi,03 - Judy,28 - Mallory,05 - Olivia,44 - Oscar,34 - Peggy,30 - Sybil,82 - Trent,75 - Trudy,92 - Victor,37 - Walter'

scores = score.split(',') 对于 x 排序(分数): 打印(x)

【讨论】:

以上是关于如何对字符串列表进行排序?的主要内容,如果未能解决你的问题,请参考以下文章

如何对字符串列表进行数字排序?

如何对在python中存储为字符串的整数列表进行排序[重复]

如何在 Dart 中对字符串列表进行排序?

如何使用另一个列表中的项目顺序对字符串列表进行排序?

如何通过比较字符串出现的位置来对字符串列表进行排序?

如何按数字顺序对字符串和数字列表进行排序?