不同维度数据的分类器

Classifier for data with varying dimensionality

我需要使用维数可变的数据来训练分类器。例如(这是为了说明而编造的日期):

class-1,0,1,2,3
class-2,0,3,2,4,5,7
class-3,1,8,8,8,2,8,0,0,0
:
:
and so on...

我正在尝试使用 scikit-learn 训练线性 SVM,这需要固定维度。对较小的暗淡进行简单的零填充以匹配最大的暗淡,结果令人失望。

我应该对此类数据使用不同的分类器吗?我应该如何处理这个问题?

尝试使用特征 mean/median 进行填充,这是处理缺失数据的另一种方法。 这些测量是在同一个 points/features 中进行的吗?

特征哈希 是您需要用来将 variable-length 输入转换为 constant-length 输入的算法。然后,您可以将转换后的向量与任何适当的学习算法一起使用。

Wikipedia: Feature Hashing