Weka IBk参数详解(distanceWeighting、meanSquared)

Weka IBk parameter details (distanceWeighting, meanSquared)

我正在使用 kNN 算法进行分类。在 weka 中,他们为 kNN 提供了各种参数设置。我有兴趣了解 distanceWeighting,meanSquared。

在 distanceWeighting 中,我们有三个值(无距离加权、重量乘以 1/距离和重量乘以 1-距离)。这些价值观是什么?它们的影响是什么?

有人可以解释一下吗? :)

如果使用 "no distance weighting",则数据点的预测值是所有 k 个相邻点的平均值。例如

# if values_of_3_neigbors = 4, 5, 6 
# then predicted_value = (4+5+6)/3 = 5

对于1/距离加权,每个邻居的权重与到它的距离成反比。这个想法是:邻居越近,它对预测值的影响就越大。例如

# distance_to_3_neigbors = 1,3,5
# weights_of_neighbors = 1/1, 1/3, 1/5  # sum = 1 + 0.33 + 0.2 = 1.53
# normalized_weights_of_neighbors = 1/1.53, 0.33/1.53,  0.2/1.53 = 0.654, 0.216, 0.131
# then predicted_values = 4*0.654 + 5*0.216 + 6*0.131 = 4.48

1-distance 类似。这仅适用于所有距离都在 [0,1] 范围内的情况。

希望对您有所帮助