"parallelStream()" 和 "asSequence().asStream().parallel()" 之间的区别

Difference between "parallelStream()" and "asSequence().asStream().parallel()"

使用 kotlin 1.6.10 似乎 parallelStream()asSequence().asStream().parallel() 的行为不一样。后者似乎没有并行化。这是一个示例代码片段,演示了该问题:

import java.util.stream.Collectors.toList
import kotlin.streams.asStream
import java.util.Calendar

fun main() {
    println("Available processors: ${Runtime.getRuntime().availableProcessors()}")

    val numbers = (10 downTo 0).toList()
    
    println("Using parallelStream:")
    val start1=System.currentTimeMillis()
    numbers.parallelStream().map { println("${it} - ${Thread.currentThread().getId()}"); Thread.sleep(100); it }.collect(toList<Int>())
    println("Execution time: ${System.currentTimeMillis()-start1}")
    
    println("Using asSequence().asStream().parallel():")
    val start2=System.currentTimeMillis()
    numbers.asSequence().asStream().parallel().map { println("${it} - ${Thread.currentThread().getId()}"); Thread.sleep(100); it }.collect(toList<Int>())
    println("Execution time: ${System.currentTimeMillis()-start2}")
}

您可以在 kotlin playground 中执行它:https://pl.kotl.in/z3sxKHKvL

输出为

Available processors: 2
Using parallelStream:
4 - 1
8 - 10
3 - 1
7 - 10
5 - 1
6 - 10
1 - 1
10 - 10
0 - 1
9 - 10
2 - 1
Execution time: 617
Using asSequence().asStream().parallel():
10 - 1
9 - 1
8 - 1
7 - 1
6 - 1
5 - 1
4 - 1
3 - 1
2 - 1
1 - 1
0 - 1
Execution time: 1105

我不明白这种行为差异的原因。

直接在您的 List 上调用 stream()parallelStream() 意味着在后台它可以直接在基础 List 上调用 spliterator() 并获得一个可以分解的功能性 Spliterator并行工作。

如果将列表转换为序列,则在调用 asStream() 时将无法再直接访问列表。在序列上调用 asStream() 会创建一个带有临时拆分器的流,该拆分器无法访问集合的大小(因为序列没有大小 属性),因此它无法分解并行执行的工作。

基本上,asSequence() 去除了大小信息和列表的 built-in Spliterator 实现。