.Net中的Dictionary在并行读写时是否有可能导致死锁?

Is it possible for a Dictionary in .Net to cause dead lock when reading and writing to it in parallel?

我正在玩 TPL,并试图找出通过并行读取和写入同一个字典可以造成多大的混乱。

所以我有这个代码:

    private static void HowCouldARegularDicionaryDeadLock()
    {
        for (var i = 0; i < 20000; i++)
        {
            TryToReproduceProblem();
        }
    }

    private static void TryToReproduceProblem()
    {
        try
        {
            var dictionary = new Dictionary<int, int>();
            Enumerable.Range(0, 1000000)
                .ToList()
                .AsParallel()
                .ForAll(n =>
                {
                    if (!dictionary.ContainsKey(n))
                    {
                        dictionary[n] = n; //write
                    }
                    var readValue = dictionary[n]; //read
                });
        }
        catch (AggregateException e)
        {
            e.Flatten()
                .InnerExceptions.ToList()
                .ForEach(i => Console.WriteLine(i.Message));
        }
    }

确实很乱,抛出了很多异常,主要是键不存在,少数是索引超出数组范围。

但是应用运行一段时间后挂了,cpu百分比停留在25%,机器8核。 所以我假设这是满负荷的 2 个线程 运行。

然后我 运行 dottrace 在上面,得到了这个:

它符合我的猜测,两个线程 运行 处于 100%。

同时运行Dictionary的FindEntry方法

然后我再次 运行 应用程序,使用 dottrace,这次结果略有不同:

这一次,一个线程是运行 FindEntry,另一个是Insert.

我的第一直觉是死锁了,后来觉得不可能,只有一个共享资源,而且没有锁。

那么这应该怎么解释呢?

ps:我不打算解决这个问题,它可以通过使用 ConcurrentDictionary 或并行聚合来解决。我只是在寻找一个合理的解释。

因此您的代码正在执行 Dictionary.FindEntry。它 不是 死锁 - 当两个线程以一种使它们等待彼此释放资源的方式阻塞时,就会发生死锁,但在您的情况下,您会得到两个看似无限的循环。线程未锁定。

我们来看看reference source中的这个方法:

private int FindEntry(TKey key) {
    if( key == null) {
        ThrowHelper.ThrowArgumentNullException(ExceptionArgument.key);
    }

    if (buckets != null) {
        int hashCode = comparer.GetHashCode(key) & 0x7FFFFFFF;
        for (int i = buckets[hashCode % buckets.Length]; i >= 0; i = entries[i].next) {
            if (entries[i].hashCode == hashCode && comparer.Equals(entries[i].key, key)) return i;
        }
    }
    return -1;
}

看看 for 循环。 increment 部分是 i = entries[i].next,猜猜看:entries 是在 Resize method. next is a field of the inner Entry struct:

中更新的字段
public int next;        // Index of next entry, -1 if last

如果您的代码无法退出 FindEntry 方法,最可能的原因是您设法弄乱了条目,以至于当您遵循next 字段指向的索引。

至于 Insert method,它有一个非常相似的 for 循环:

for (int i = buckets[targetBucket]; i >= 0; i = entries[i].next)

由于 Dictionary class 被记录为非线程安全的,因此您无论如何都处于未定义行为的领域。

使用 ConcurrentDictionary 或诸如 ReaderWriterLockSlim 之类的锁定模式(Dictionary 对于并发读取是线程安全的)或普通的旧 lock 很好地解决了问题。

看起来像是竞争条件(不是死锁)- 正如您评论的那样,这会导致混乱的内部状态。

字典不是线程安全的,因此从单独的线程(即使每个线程只有一个)并发读取和写入同一容器是不安全的。

一旦达到竞争条件,将会发生什么就变得不确定了;在这种情况下,似乎是某种无限循环。

一般来说,一旦需要写入权限,就需要某种形式的同步。

只是为了补充(并关联)前 2 个很好的答案:

Dictionary<T> 是一个 HashMap 实现,与大多数 HashMap 实现一样,它 internally uses LinkedLists(用于存储多个元素,以防不同的键在散列和取散列模后进入相同的桶位置) 并使用一个内部数组,它可以随着字典中元素数量的增长而增长。

由于代码以空字典开头并添加了很多元素,因此字典以 small internal array(可能大小=3)开头并频繁增加。由于有多个线程试图向字典中添加元素,很有可能不同的线程同时尝试对字典进行 Resize()。由于 Dictionary 不是 thread-safe class,如果两个线程试图同时修改同一个 LinkedList,这可能会使 LinkedList 处于不一致状态(即竞争条件 - 两个线程修改相同的数据,导致不可预测的结果。

如其他答案中所述,修改 LinkedList 时的竞争条件可能会使 LinkedList 进入无效状态,这将解释循环遍历 LinkedList 的方法(FindEntryInsert)。高 cpu(每个线程使用 100% cpu)由这个无限循环解释 - 如果它是一个死锁,线程将处于 low-cpu 状态等待一些锁定的资源。

因为我们知道元素的数量,所以我们可以 pre-initialize 字典的大小更大(比如 1000000),以减少出现竞争条件的机会。但这并不能解决问题 - 最好的解决方案仍然是使用 thread-safe class (ConcurrentDictionary<T>).