문자열 목록을 정렬하는 방법? 알파벳순으로 정렬 된 목록을 만드는

파이썬에서 알파벳순으로 정렬 된 목록을 만드는 가장 좋은 방법은 무엇입니까?



답변

기본 답변 :

mylist = ["b", "C", "A"]
mylist.sort()

그러면 원래 목록이 수정됩니다 (즉, 내부 정렬). 원본을 변경하지 않고 정렬 된 목록의 사본을 얻으려면 다음 sorted()함수를 사용하십시오 .

for x in sorted(mylist):
    print x

그러나 위의 예제는 로케일을 고려하지 않고 대소 문자 구분 정렬을 수행하기 때문에 순진합니다. 선택적 매개 변수 key를 사용하여 사용자 정의 정렬 순서를 지정할 수 있습니다 (를 사용하는 대안 cmp은 여러 번 평가되어야하므로 사용되지 않는 솔루션 key입니다. 요소 당 한 번만 계산 됨).

따라서 언어 별 규칙을 고려하여 현재 로캘에 따라 정렬하려면 cmp_to_keyfunctools의 도우미 기능입니다.

sorted(mylist, key=cmp_to_key(locale.strcoll))

마지막으로 필요한 경우 정렬을위한 사용자 지정 로캘 을 지정할 수 있습니다 .

import locale
locale.setlocale(locale.LC_ALL, 'en_US.UTF-8') # vary depending on your lang/locale
assert sorted((u'Ab', u'ad', u'aa'),
  key=cmp_to_key(locale.strcoll)) == [u'aa', u'Ab', u'ad']

마지막 참고 :이 lower()방법 을 사용하는 대소 문자를 구분하지 않는 정렬의 예를 볼 수 있습니다 -ASCII 하위 문자에만 작동하기 때문에 잘못되었습니다. 영어가 아닌 데이터에는이 두 가지가 잘못되었습니다.

# this is incorrect!
mylist.sort(key=lambda x: x.lower())
# alternative notation, a bit faster, but still wrong
mylist.sort(key=str.lower)


답변

또한 sorted()기능에 주목할 가치가 있습니다.

for x in sorted(list):
    print x

원래 목록을 변경하지 않고 정렬 된 새 버전의 목록을 반환합니다.


답변

list.sort()

정말 간단합니다 🙂


답변

문자열을 정렬하는 올바른 방법은 다음과 같습니다.

import locale
locale.setlocale(locale.LC_ALL, 'en_US.UTF-8') # vary depending on your lang/locale
assert sorted((u'Ab', u'ad', u'aa'), cmp=locale.strcoll) == [u'aa', u'Ab', u'ad']

# Without using locale.strcoll you get:
assert sorted((u'Ab', u'ad', u'aa')) == [u'Ab', u'aa', u'ad']

의 이전 예제는 mylist.sort(key=lambda x: x.lower())ASCII 전용 컨텍스트에 적합합니다.


답변

Python3에서 sorted () 함수를 사용하십시오

items = ["love", "like", "play", "cool", "my"]
sorted(items2)


답변

그러나 이것은 언어 별 정렬 규칙을 어떻게 처리합니까? 로케일을 고려합니까?

아니요, list.sort()일반적인 정렬 기능입니다. 유니 코드 규칙에 따라 정렬하려면 사용자 정의 정렬 키 기능을 정의해야합니다. pyuca 모듈을 사용해 볼 수는 있지만 얼마나 완전한지 모르겠습니다.


답변

오래된 질문이지만 설정하지 않고 로케일 인식 정렬을 locale.LC_ALL 수행하려면 이 답변에서 제안한대로 PyICU 라이브러리 를 사용하면 됩니다 .

import icu # PyICU

def sorted_strings(strings, locale=None):
    if locale is None:
       return sorted(strings)
    collator = icu.Collator.createInstance(icu.Locale(locale))
    return sorted(strings, key=collator.getSortKey)

그런 다음 예를 들어 전화하십시오.

new_list = sorted_strings(list_of_strings, "de_DE.utf8")

이것은 로케일을 설치하거나 다른 시스템 설정을 변경하지 않고 나를 위해 일했습니다.

(이것은 이미 위의 의견에서 제안 되었지만 처음에는 직접 놓 쳤기 때문에 더 눈에 띄기를 원했습니다.)