如何预测失效前的持续时间?

how to predict the duration until failure?

我有一个包含 350 个奇数条目的服务记录数据集。其中有一些详细信息,如持续时间(以月为单位)和 "kilometers covered" 以及地区信息。

所有记录都是关于车辆某一特定部件的一次故障。

我必须预测新车中的该零件可以使用多长时间(月或公里)。 PS- 我无法共享数据。

我该怎么办?

您必须建立一个回归模型,其中您的预测变量是 region/driver/whatever-the-stuff-maybe,您的响应是所覆盖的公里数或持续时间。

这应该会让您朝着正确的方向开始。

本质上,您需要选择一个可以安全地对数据建模而不受极端异常值影响的回归模型。这将涉及某种正则化或取出部分数据看起来 "odd"(使用某种统计数据)

建立模型后,您只需输入新值即可预测公里数 covered/duration。

希望对您有所帮助。

干杯!