我可以使用哪种机器学习范例/算法从可能的选择池中 select?
What machine learning paradigm / algorithm can I use to select from a pool of possible choices?
我有很多题库和学生。目标是 select 个学生的考试题。
问题具有不同的属性:
- 年级
- 科目(可以是多个:分数、应用题、加法)
- 其他学生在这个问题上的表现如何(正确率、错误率等)
- 学生以前见过这个问题或类似的问题吗?
所以我想根据学生的表现为学生选择问题。我对它是否是 "good" 考试的反馈如下:
- 人工反馈。一个人可以复习考试并出于定性原因拒绝某些问题
- 学生考试成绩如何?如果他们 100% 正确,那就糟糕了。如果他们有 20% 是正确的,那就糟糕了。我们希望达到 75%
- 老师对整个考试的定性反馈
我觉得神经网络是一个可能的解决方案,但我不确定如何。有什么想法吗?
提前致谢。
如果我对问题的理解正确,您将必须了解问题与学生之间的关系是"good"还是"bad"?这会给你一个二元分类问题,其中输入是一个结合了问题特征和学生特征的特征向量?
您可以随时将其放入网络中,看看效果如何,我猜您没有太多的问题和学生,但是当您对对进行分类时,您的数据量确实增加了,这很好.
我建议使用概率建模,因为您的真实数据中有一些由人工评估引入的噪声。两个注释者肯定不会对同一考试给出相同的 "qualitative feedback"。
最好有一个考虑了不确定性的模型;贝叶斯方法!如果您对这方面知之甚少,我会向您指出 Bishop - Pattern recognition book - freely available online and you can use library like mc-stan lib or edward-lib. There's also a course about probabilistic modeling on coursera,在第一章中,他们处理的示例非常接近您的用例。
关于你使用神经网络的建议再评论一下:因为你没有很多特征(如你所提到的 6 个),除非你有数百万个数据点,否则神经网络很容易过度拟合。这是一个稍微简单的问题就模型复杂性而言,您不需要隐藏层即可获得良好结果。
希望对您有所帮助。
也尝试查看排名算法。你可以训练它进行组合(学生,问题)并指出这种组合或生成有序函数。
我对此经验不多,但可能值得一试。
我不确定神经网络是否是最好的方法。他们可能是,但我几乎立刻想到了别的东西。
鉴于您问题中的信息,您可能想在此处检查统计方法,使用一些技术,例如 PCA or more broadly multivariate analysis。
我有很多题库和学生。目标是 select 个学生的考试题。
问题具有不同的属性:
- 年级
- 科目(可以是多个:分数、应用题、加法)
- 其他学生在这个问题上的表现如何(正确率、错误率等)
- 学生以前见过这个问题或类似的问题吗?
所以我想根据学生的表现为学生选择问题。我对它是否是 "good" 考试的反馈如下:
- 人工反馈。一个人可以复习考试并出于定性原因拒绝某些问题
- 学生考试成绩如何?如果他们 100% 正确,那就糟糕了。如果他们有 20% 是正确的,那就糟糕了。我们希望达到 75%
- 老师对整个考试的定性反馈
我觉得神经网络是一个可能的解决方案,但我不确定如何。有什么想法吗?
提前致谢。
如果我对问题的理解正确,您将必须了解问题与学生之间的关系是"good"还是"bad"?这会给你一个二元分类问题,其中输入是一个结合了问题特征和学生特征的特征向量?
您可以随时将其放入网络中,看看效果如何,我猜您没有太多的问题和学生,但是当您对对进行分类时,您的数据量确实增加了,这很好.
我建议使用概率建模,因为您的真实数据中有一些由人工评估引入的噪声。两个注释者肯定不会对同一考试给出相同的 "qualitative feedback"。
最好有一个考虑了不确定性的模型;贝叶斯方法!如果您对这方面知之甚少,我会向您指出 Bishop - Pattern recognition book - freely available online and you can use library like mc-stan lib or edward-lib. There's also a course about probabilistic modeling on coursera,在第一章中,他们处理的示例非常接近您的用例。
关于你使用神经网络的建议再评论一下:因为你没有很多特征(如你所提到的 6 个),除非你有数百万个数据点,否则神经网络很容易过度拟合。这是一个稍微简单的问题就模型复杂性而言,您不需要隐藏层即可获得良好结果。
希望对您有所帮助。
也尝试查看排名算法。你可以训练它进行组合(学生,问题)并指出这种组合或生成有序函数。
我对此经验不多,但可能值得一试。
我不确定神经网络是否是最好的方法。他们可能是,但我几乎立刻想到了别的东西。
鉴于您问题中的信息,您可能想在此处检查统计方法,使用一些技术,例如 PCA or more broadly multivariate analysis。