不超过覆盖范围限制的最大间隔子集?

Maximum subsets of intervals that does not exceed coverage limit?

这是一个令我感到困惑的编码问题。

给定一个二维数组[[1, 9], [2, 8], [2, 5], [3, 4], [6, 7], [6, 8]],每个内部数组代表一个区间;如果我们叠加这些间隔,我们会看到:

1 2 3 4 5 6 7 8 9
  2 3 4 5 6 7 8
  2 3 4 5 
    3 4   
          6 7
          6 7 8

现在有一个限制,每个位置的覆盖率应该<= 3;显然我们可以看到位置 3、4、6、7 的覆盖率为 4。

那么问题是:最多可以选择多少个区间子集,以便每个区间都能满足 <=3 的限制?很明显,对于这种情况,我们只需删除最长的间隔 [1, 9],因此最大子集数为 6 - 1 = 5.

这样的问题应该用什么算法?我想这是间隔调度的变体问题?

谢谢

希望我没看错问题。这是我可以用 C# 获得的解决方案:

                //test
                int[][] grid =  { new int[]{ 1, 9 }, new int[] { 2, 8 }, new int[] { 2, 5 }, new int[] { 3, 4 }, new int[] { 6, 7 }, new int[] { 6, 8 } };
                SubsetFinder sf = new SubsetFinder(grid);
                int t1 = sf.GetNumberOfIntervals(1);//6
                int t2 = sf.GetNumberOfIntervals(2);//5
                int t3 = sf.GetNumberOfIntervals(3);//5
                int t4 = sf.GetNumberOfIntervals(4);//2
                int t5 = sf.GetNumberOfIntervals(5);//0


        class SubsetFinder
        {
            Dictionary<int, List<int>> dic;
            int intervalCount;
            public SubsetFinder(int[][] grid)
            {
                init(grid);
            }
            private void init(int[][] grid)
            {
                this.dic = new Dictionary<int, List<int>>();
                this.intervalCount = grid.Length;
                for (int r = 0; r < grid.Length; r++)
                {
                    int[] row = grid[r];
                    if (row.Length != 2) throw new Exception("not grid");
                    int start = row[0];
                    int end = row[1];
                    if (end < start) throw new Exception("bad interval");
                    for (int i = start; i <= end; i++)
                        if (!dic.ContainsKey(i))
                            dic.Add(i, new List<int>(new int[] { r }));
                        else
                            dic[i].Add(r);
                }
            }
            public int GetNumberOfIntervals(int coverageLimit)
            {
                HashSet<int> hsExclude = new HashSet<int>();
                foreach (int key in dic.Keys)
                {
                    List<int> lst = dic[key];
                    if (lst.Count < coverageLimit)
                        foreach (int i in lst)
                            hsExclude.Add(i);
                }
                return intervalCount - hsExclude.Count;
            }
        }

我认为你可以使用扫描算法解决这个问题。这是我的方法:

一般的想法是,我们不会找出您可以选择的最大间隔数并且仍然符合限制,我们会找到必须删除的最小间隔数,以使所有数字都符合限制.以下是我们如何做到这一点:

首先创建一个三元组向量,第一部分是整数,第二部分是布尔值,第三部分是整数。第一部分代表输入中的所有数字(间隔的 startend),第二部分告诉我们第一部分是间隔的开始还是结束,而第三部分部分表示区间的id

根据第一部分对创建的向量进行排序,如果出现平局,start 应该在某些间隔的 end 之前。

在您提供的示例中,向量将是:

1,0 , 2,0 , 2,0 , 2,0 , 3,0 , 4,1 , 5,1 , 6.0 , 6.0 , 7,1 , 8,1 , 8,1 , 9,1

现在,迭代向量,同时保留一组整数,表示当前采用的间隔。集合内的数字代表当前采取的间隔的 ends。该集合应按升序排列。

在迭代向量时,我们可能会遇到以下两种可能性之一:

  1. 我们目前正在处理一个间隔的 start。在这种情况下,我们只需将此区间的 end(由第三部分 id 标识)添加到集合中。如果集合的大小超过了限制,我们一定要恰好删除一个区间,但是删除哪个区间最好​​呢?当然是end最大的那个区间,因为删掉这个区间不仅可以帮助你减少取区间的次数以适应限制,而且它持续时间最长,对以后的帮助最大。简单地从集合中删除这个间隔(相应的 end 将在集合中排在最后,因为集合是按 end 的递增顺序排序的)

  2. 我们目前正在处理一个间隔的 end,在这种情况下请检查集合。如果它包含指定的end,就删除它,因为对应的区间已经结束。如果该集合不包含与我们正在处理的那个相匹配的end,只需继续迭代到下一个元素,因为这意味着我们已经决定不采用相应的间隔。

如果您需要计算间隔的次数,甚至打印它们,都可以轻松完成。每当你处理一个区间的 end,而你实际上在集合中找到了这个 end,这意味着相应的区间是一个被采用的区间,你可以将你的答案加一,打印它或将其保存在表示您的答案的向量中。

我的方法的总复杂度是:N Log(N),其中 N 是输入中给出的间隔数.