机器学习中的测试驱动开发
Test Driven Development in Machine Learning
我正在尝试弄清楚如何在机器学习任务中应用测试驱动开发 (TDD)。我所知道的是,在机器学习中你需要:
使用一组训练(如果选择提供验证集则进行验证)特征及其相应的标签(或none如果是无监督学习)和训练参数进行训练制作模型。
使用一组测试功能测试模型,了解它们在未见数据下的表现如何。
使用模型进行预测。
我应该为这些编写测试吗?如何在机器学习中应用 TDD?
我认为 TDD 与代码开发的联系比与使用 ML 算法的联系更多,后者是更多的工程工作。在那里应用 TDD 会很困难。你应该更多地关注方法论。
然而,大部分 ML 工作实际上是数据准备、清理、特征处理和开发等。通常,此类任务与数据相关。那里有很多关于 TDD 的 space。
我正在尝试弄清楚如何在机器学习任务中应用测试驱动开发 (TDD)。我所知道的是,在机器学习中你需要:
使用一组训练(如果选择提供验证集则进行验证)特征及其相应的标签(或none如果是无监督学习)和训练参数进行训练制作模型。
使用一组测试功能测试模型,了解它们在未见数据下的表现如何。
使用模型进行预测。
我应该为这些编写测试吗?如何在机器学习中应用 TDD?
我认为 TDD 与代码开发的联系比与使用 ML 算法的联系更多,后者是更多的工程工作。在那里应用 TDD 会很困难。你应该更多地关注方法论。
然而,大部分 ML 工作实际上是数据准备、清理、特征处理和开发等。通常,此类任务与数据相关。那里有很多关于 TDD 的 space。