具有多个标签的 sklearn 确定性回归

sklearn deterministic regression with multiple tags

我在 python 中遇到回归问题。我的输入数据集如下所示:

x= 均值、偏差、方差、varianceOfVariance

y = 慢走,运行,保持

X 特征由值组成,Y 被二进制标记为 4 个类别之一。所以它可以是 or walk or slow or 运行 or hold。 data.head() 看起来像这样。

我可以使用 train_test_split() 方法在 X_train、X_test、y_train、y_test 中拆分 pd 数据帧。

我想制作一个回归器(例如 SVM,或线性回归器)以如下格式对这些标签进行预测:70% 步行、25% 慢速、0% 运行、5% 保持.

它必须是概率性的,我尝试使用分类器,并将标签组合成一个变量,但现在我正在尝试概率性的机会。

这对 sklearn 库是否可行?如果可行,如何实现?我想不通。

classifier 已经是概率性的 - 您可以获得概率,而不仅仅是最高概率的 class。使用 predict_proba :

clf.fit(X_train, y_train)
score = clf.score(X_test, y_test)
probs = clf.predict_proba(X_test)