不规则间隔——在哪里划线?

Irregular intervals - where to draw a line?

我有一个折线图(x 代表日期,y 代表该日期的汽车租赁数量)需要始终连接,因为这些值都是有效的 - 每次至少有一辆汽车租赁那个日期。唯一不应连接该行,但应在两个有效 values/points 之间留出间隙的情况是两个连续日期相距太远。我必须找出这个 'two wide apart' 含义的最佳算法,并根据这些日期(或其他日期)设置一个 parameter.I 不知道所有可能的日期组合,但我认为它们可以是任何东西:

有没有标准的方法来处理这类问题?

问题是描述相距太远意味着什么。一种解决方案是构建数据点 x 坐标的日期差异的直方图(即概率密度函数),然后将这些差异视为太宽,这些差异在,说出前 33%(或您希望的任何其他比例)。

例如,假设x坐标是年份:

1990 1995 2001 2002 2003 2010 2011 2012 2013 2017 2019

假设我们以年为单位计算日期差异(我们可以选择任何其他持续时间单位)。我们计算上面的值之间的差异并构建下面的直方图。

Counts: 5 1 0 1 1 1 1
Diff.:  1 2 3 4 5 6 7

现在,如果我们选择保留直方图中前 33% 的断开连接差异,这意味着大于或等于 5 年的差异将断开连接。