在 python 中按键访问元组的值

Access value from tuple by key in python

我有概率哈希图,其中键是概率值,值是它们的类型。为了获得最高概率,我对哈希映射进行了排序,但我无法弄清楚如何访问具有最高键值的值。

probability = {classify_email(mailmessage, android_term_df):"android" ,
                           classify_email(mailmessage, spam_term_df):"spam" ,
                           classify_email(mailmessage, c_term_df):"c" ,
                           classify_email(mailmessage, cplus_term_df):"cplus",
                           classify_email(mailmessage, java_term_df):"java",
                           classify_email(mailmessage, php_term_df):"php" ,
                           classify_email(mailmessage, easyham_term_df):"ham" 
                           }
            sorted_probability = sorted(probability.items(), key=operator.itemgetter(0))

你甚至不需要排序:

highest_probabilty_type = probability[max(probability.keys())]

如果您的 类 中的 2 个具有完全相同的概率,则只有其中一个会保留在像这样的代码中的字典中。

你应该做的是使用 类 作为键 概率 作为值

from operator import itemgetter

dfs = {
    "android": android_term_df,
    "spam": spam_term_df,
    "c": c_term_df,
    "cplus": cplus_term_df,
    "java": java_term_df,
    "php": php_term_df,
    "ham": ham_term_df,
}

probabilities = { cls: classify_email(mailmessage, dfs[cls]) for cls in dfs }

# now they are classes -> probability
max_cls, max_prob = max(probabilities.items(), key=itemgetter(1))

或者,如果您需要经过排序的分布列表,请将它们放入 (probability, class) 元组列表中:

probabilities = [ (classify_email(mailmessage, dfs[cls], cls)) for cls in dfs ]
probabilities.sort()

请注意,与您原来的示例不同,在出现重复的情况下您不会丢失任何对。