什么数据科学编程算法类似于连续变量的朴素贝叶斯?

What data science programming algorithm is like Naive Bayes for continuous variables?

我正在尝试构建和训练机器学习数据科学算法,以正确预测总统在哪个县获胜。我有以下训练数据信息。

总人口年龄中位数 % 学士以上 失业率 人均收入 家庭总数 家庭平均人数 % 自住住房 % 租房者自住住房 % 空置住房 房屋价值中位数 人口增长 房屋持有量增长 人均收入增长优胜者

我是数据科学的新手。我知道朴素贝叶斯是一个很好的分类器,适用于试图用多个属性进行预测的算法。但是,我读到朴素贝叶斯分类器的第一步需要频率 table。我的问题是以上所有属性都是连续的数值属性,不属于 "Yes" 或 "No" 类别。那我不使用朴素贝叶斯分类器吗?

我也考虑过使用 k 最近邻算法,但这看起来不是最准确的,并且对我来说正确地加权了属性...我正在寻找一种监督算法,因为我有训练数据。谁能给我任何关于使用什么算法的建议?另外,刚入行,以后自己想办法用什么算法。

您可以使用 artificial neural networks.

论文

工具/库

要创建、训练、测试和评估神经网络,您可以使用几个库:

对于朴素贝叶斯,您可以离散化连续数值属性。

例如,对于“% Owner occupied housing”,您将所有 100% 比例分成十个分区(0-10%、10-20%、...、90-100%)并获得频率 table.

对于某些属性,您可以使用二进制值:失业率 < 30% - yes/no。

祝学习机器学习好运:)