聚类文档时如何获取model.predict()的概率百分比

How to get the probability percentage of a model.predict() when clustering documents

text = "Some random text string that I want to cluster"
Y = vectorizer.transform([text])
prediction = model.predict(Y)
print(prediction)

上面传递了一个字符串值,然后returns它认为它属于的集群组(三个之一)。

我怎样才能知道它的预测准确率是多少? IE。这个特定的文本与第 1 组有 90% 的一致性,下一个文本可能与第 2 组有 45% 的一致性,但它仍然会进入第 2 组none。我希望能够捕捉到准确率较低的物品。

通常不会。

甚至一些(少数)聚类器在内部以某种概率工作,并且可能有一个 predict_proba 函数来获取这些值,这些值与其说是准确度,不如说是捕捉相对责任。