是 mapreduce 中洗牌的一部分

Is sort part of shuffle in mapreduce

系统在地图端对地图输出进行排序的过程称为排序。这是洗牌的一部分吗？换句话说，shuffle 什么时候开始？ map输出写入磁盘后，或者map输出写入内存缓冲区后

为了回答您的问题，单个地图任务的步骤包括：

执行和溢出阶段并行发生。所以，数据写入循环缓冲内存 -> 在内存中排序 -> 当缓冲区满 80% -> 写入本地磁盘。

在EXECUTION阶段结束时，最后一次触发SPILLING线程。更详细地说，我们：

请注意，每次缓冲区快满时，我们都会得到一个溢出文件（SpillReciord + 输出文件）。每个 Spill 文件包含几个分区（段）。