Counter.most_common(n) 如何覆盖任意排序

Counter.most_common(n) how to override arbitrary ordering

我可以使用 Counter.most_common() 功能完成 rank/sort,从而避免这一行:d = sorted(d.items(), key=lambda x: (-x[1],x[0]), reverse=False) ??

挑战: 给你一个 string.The 只包含小写英文字母的字符串 characters.Your 任务是找到字符串中最常见的前三个字符。

输出格式: 在单独的一行上打印三个最常见的字符及其出现次数。按出现次数的降序对输出进行排序。如果出现次数相同,则按升序排列。

在完成这个过程中,我使用了 dict、Counter 和 sort 来确保 "the occurrence count is the same, sort the characters in ascending order"。内置的 Python sorted 功能确保按计数排序,然后按字母顺序排序。 我很好奇是否有一种方法可以覆盖 Counter.most_common() 默认的任意 sort/order 逻辑,因为它似乎在选择前 3 个时忽略了结果的字典顺序。

import sys
from collections import Counter

string = sys.stdin.readline().strip()
d = dict(Counter(string).most_common(3))
d = sorted(d.items(), key=lambda x: (-x[1],x[0]), reverse=False)

for letter, count in d[:3]:
    print letter, count

doc explicitly says Counter.most_common()'s (tie-breaker) order for when counts are equal is arbitrary

  • 更新:PM2Ring 告诉我 Counter 继承了 dict 的顺序。插入顺序的事情只发生在 3.6+ 中,并且只在 3.7 中得到保证。文档可能滞后了。
  • 在 cPython 3.6+ 中,它们返回原始插入顺序(见底部),但不依赖于该实现,因为根据规范,它不是定义的行为。如您所说,如果您想要完全确定的行为,最好按照您自己的方式进行排序。
  • 我在底部展示了你如何monkey-patchCounter.most_common使用你自己的排序函数,就像你展示的那样,但这是不受欢迎的。 (您编写的代码可能会不小心依赖它,因此在未修补时会中断。)
  • 您可以将 Counter 子类化为 MyCounter,这样您就可以覆盖它的 most_common。痛苦且不便携。
  • 真正最好的方法就是编写不依赖于 most_common()
  • 的任意决胜顺序的代码和测试
  • 我同意 most_common() 不应该是硬连线的,我们应该能够将比较键或排序函数传递到 __init__()

猴子补丁 Counter.most_common() :

def patched_most_common(self):
    return sorted(self.items(), key=lambda x: (-x[1],x[0]))

collections.Counter.most_common = patched_most_common

collections.Counter('ccbaab')
Counter({'a': 2, 'b': 2, 'c': 2})

证明在cPython 3.7中,任意顺序为插入顺序(每个字符先插入):

Counter('abccba').most_common()
[('a', 2), ('b', 2), ('c', 2)]

Counter('ccbaab').most_common()
[('c', 2), ('b', 2), ('a', 2)]