基于诊断寻找药物的机器学习算法

Machine Learning algorithm for finding drug based on diagnosis

训练数据集:

--------------------   
Patient Age:        25
Patient Weight:     60
Diagnosis one:      Fever
Diagnosis two:      Headache

    > Medicine:           **Crocin**

---------------------------------
Patient Age:        25
Patient Weight:     60
Diagnosis one:      Fever
Diagnosis two:      no headache

    > Medicine:           Paracetamol

----------------------------------

给患者开具 drug/medicne 的样本数据集。

如何根据患者信息(age/weight)和诊断(fever/headeache/etc)找到什么药?

您的目标任务是分类,因为目标值是名义尺度。

正确使用词汇表至关重要,因为所有其他工作都已由其他人完成,例如 Python 的 sklearn 库中包含最相关的算法和大量数据来测试它们并学习算法。

您似乎有四个变量作为输入:

  1. 年龄 - 公制变量
  2. 体重-公制变量
  3. 诊断一——名义变量
  4. 诊断二-名义变量

您必须对标称变量进行编码,我会在其中推荐所有可能诊断的数组,例如:

发烧、头痛、胃痛,x - [0, 0, 0, 0]

现在,如果诊断正确,每个数组元素将被设置为 1,否则为 0。 因此,您总共有 2 + n 个输入变量,而 n 是可能的症状数。

然后你可以直接去sklearn库开始使用最简单的分类算法:Nearest Neighbour Classification

如果这没有产生好的结果(可能结果不会很好),你可以开始使用更复杂的模型(SVM,RandomForest)。然而,首先您应该学习词汇并使用简单的模型来了解方法和处理链。