什么数据科学编程算法类似于连续变量的朴素贝叶斯?
What data science programming algorithm is like Naive Bayes for continuous variables?
我正在尝试构建和训练机器学习数据科学算法,以正确预测总统在哪个县获胜。我有以下训练数据信息。
总人口年龄中位数 % 学士以上 失业率 人均收入 家庭总数 家庭平均人数 % 自住住房 % 租房者自住住房 % 空置住房 房屋价值中位数 人口增长 房屋持有量增长 人均收入增长优胜者
我是数据科学的新手。我知道朴素贝叶斯是一个很好的分类器,适用于试图用多个属性进行预测的算法。但是,我读到朴素贝叶斯分类器的第一步需要频率 table。我的问题是以上所有属性都是连续的数值属性,不属于 "Yes" 或 "No" 类别。那我不使用朴素贝叶斯分类器吗?
我也考虑过使用 k 最近邻算法,但这看起来不是最准确的,并且对我来说正确地加权了属性...我正在寻找一种监督算法,因为我有训练数据。谁能给我任何关于使用什么算法的建议?另外,刚入行,以后自己想办法用什么算法。
您可以使用 artificial neural networks.
论文
- 使用两层预测选举结果
感知器网络 ,作者 G. S. Gill
- "Using Self Organizing Maps to Analyze Demographics and Swing State Voting in the 2008 U.S. Presidential Election" 作者:Paul T. Pearson 和 Cameron I. Cooper
工具/库
要创建、训练、测试和评估神经网络,您可以使用几个库:
- Google TensorFlow(Python 和 C++)
- Lasagne (Python)
对于朴素贝叶斯,您可以离散化连续数值属性。
例如,对于“% Owner occupied housing”,您将所有 100% 比例分成十个分区(0-10%、10-20%、...、90-100%)并获得频率 table.
对于某些属性,您可以使用二进制值:失业率 < 30% - yes/no。
祝学习机器学习好运:)
我正在尝试构建和训练机器学习数据科学算法,以正确预测总统在哪个县获胜。我有以下训练数据信息。
总人口年龄中位数 % 学士以上 失业率 人均收入 家庭总数 家庭平均人数 % 自住住房 % 租房者自住住房 % 空置住房 房屋价值中位数 人口增长 房屋持有量增长 人均收入增长优胜者
我是数据科学的新手。我知道朴素贝叶斯是一个很好的分类器,适用于试图用多个属性进行预测的算法。但是,我读到朴素贝叶斯分类器的第一步需要频率 table。我的问题是以上所有属性都是连续的数值属性,不属于 "Yes" 或 "No" 类别。那我不使用朴素贝叶斯分类器吗?
我也考虑过使用 k 最近邻算法,但这看起来不是最准确的,并且对我来说正确地加权了属性...我正在寻找一种监督算法,因为我有训练数据。谁能给我任何关于使用什么算法的建议?另外,刚入行,以后自己想办法用什么算法。
您可以使用 artificial neural networks.
论文
- 使用两层预测选举结果 感知器网络 ,作者 G. S. Gill
- "Using Self Organizing Maps to Analyze Demographics and Swing State Voting in the 2008 U.S. Presidential Election" 作者:Paul T. Pearson 和 Cameron I. Cooper
工具/库
要创建、训练、测试和评估神经网络,您可以使用几个库:
- Google TensorFlow(Python 和 C++)
- Lasagne (Python)
对于朴素贝叶斯,您可以离散化连续数值属性。
例如,对于“% Owner occupied housing”,您将所有 100% 比例分成十个分区(0-10%、10-20%、...、90-100%)并获得频率 table.
对于某些属性,您可以使用二进制值:失业率 < 30% - yes/no。
祝学习机器学习好运:)