Scikit:如何选择 multinomailNB 的 alpha

Scikit : How to choose alpha of multinomailNB

我使用 Scikit 编写了垃圾邮件过滤器。为此,我正在使用 MultinomialNB with alpha = 0.1 。 任何人都可以通俗易懂地向我解释什么是 alpha(平滑因子)以及我如何选择它的值?

谢谢

查看维基百科页面 http://en.wikipedia.org/wiki/Additive_smoothing.

基本上,您的想法是要减少稀有词的影响:例如,如果您有一封垃圾邮件中包含单词 'multinomialNB',而没有包含该单词的非垃圾邮件,则无需添加平滑后,您的垃圾邮件过滤器会将每封包含此关键字的电子邮件归类为垃圾邮件。