解释使用一对多选择输出的多类 SVM
explain about the multiclass SVM using one-vs-all to choose the output
这是我在http://nlp.stanford.edu/IR-book/html/htmledition/multiclass-svms-1.html上看到的内容。
这就是说:"In particular, the most common technique in practice has been to build classifier one-versus-rest classifiers (commonly referred to as "one-versus-all" or OVA classification), 并选择 class 哪个 classifies the test datum with large margin".
我真的不明白这是什么意思?这里的测试数据是什么?我只理解一对一:对于每个特定的 class,他们将在 class 和其余的之间创建 1 个超平面。然后,当一个新记录进入模型时,class 确定它应该属于哪个 class。那么在这种情况下如何为新记录选择正确的class?
让我展示一下我对引号的看法:我认为有 N classes ~ N classifiers (hyperplane) ~ N margins。需要 class 化的新记录属于 class 具有最大边距(在 N 个边距中)并且该记录对 class 为正(意味着该记录不是其余的)。
我没看错吧?
请帮我解释好,少用学术词汇,因为我的英语在学术环境下不好,因为解释不好,我随时都可能误解。
提前致谢
SVM 将产生与超平面的距离。
您预测 class,其中此距离最大(但最坏的情况,所有可能都是负数!),因为您假设此 classifier 具有最高的置信度。
这是我在http://nlp.stanford.edu/IR-book/html/htmledition/multiclass-svms-1.html上看到的内容。
这就是说:"In particular, the most common technique in practice has been to build classifier one-versus-rest classifiers (commonly referred to as "one-versus-all" or OVA classification), 并选择 class 哪个 classifies the test datum with large margin".
我真的不明白这是什么意思?这里的测试数据是什么?我只理解一对一:对于每个特定的 class,他们将在 class 和其余的之间创建 1 个超平面。然后,当一个新记录进入模型时,class 确定它应该属于哪个 class。那么在这种情况下如何为新记录选择正确的class?
让我展示一下我对引号的看法:我认为有 N classes ~ N classifiers (hyperplane) ~ N margins。需要 class 化的新记录属于 class 具有最大边距(在 N 个边距中)并且该记录对 class 为正(意味着该记录不是其余的)。
我没看错吧?
请帮我解释好,少用学术词汇,因为我的英语在学术环境下不好,因为解释不好,我随时都可能误解。
提前致谢
SVM 将产生与超平面的距离。
您预测 class,其中此距离最大(但最坏的情况,所有可能都是负数!),因为您假设此 classifier 具有最高的置信度。