"parallelStream()" 和 "asSequence().asStream().parallel()" 之间的区别
Difference between "parallelStream()" and "asSequence().asStream().parallel()"
使用 kotlin 1.6.10 似乎 parallelStream()
和 asSequence().asStream().parallel()
的行为不一样。后者似乎没有并行化。这是一个示例代码片段,演示了该问题:
import java.util.stream.Collectors.toList
import kotlin.streams.asStream
import java.util.Calendar
fun main() {
println("Available processors: ${Runtime.getRuntime().availableProcessors()}")
val numbers = (10 downTo 0).toList()
println("Using parallelStream:")
val start1=System.currentTimeMillis()
numbers.parallelStream().map { println("${it} - ${Thread.currentThread().getId()}"); Thread.sleep(100); it }.collect(toList<Int>())
println("Execution time: ${System.currentTimeMillis()-start1}")
println("Using asSequence().asStream().parallel():")
val start2=System.currentTimeMillis()
numbers.asSequence().asStream().parallel().map { println("${it} - ${Thread.currentThread().getId()}"); Thread.sleep(100); it }.collect(toList<Int>())
println("Execution time: ${System.currentTimeMillis()-start2}")
}
您可以在 kotlin playground 中执行它:https://pl.kotl.in/z3sxKHKvL
输出为
Available processors: 2
Using parallelStream:
4 - 1
8 - 10
3 - 1
7 - 10
5 - 1
6 - 10
1 - 1
10 - 10
0 - 1
9 - 10
2 - 1
Execution time: 617
Using asSequence().asStream().parallel():
10 - 1
9 - 1
8 - 1
7 - 1
6 - 1
5 - 1
4 - 1
3 - 1
2 - 1
1 - 1
0 - 1
Execution time: 1105
我不明白这种行为差异的原因。
直接在您的 List 上调用 stream()
或 parallelStream()
意味着在后台它可以直接在基础 List 上调用 spliterator()
并获得一个可以分解的功能性 Spliterator并行工作。
如果将列表转换为序列,则在调用 asStream()
时将无法再直接访问列表。在序列上调用 asStream()
会创建一个带有临时拆分器的流,该拆分器无法访问集合的大小(因为序列没有大小 属性),因此它无法分解并行执行的工作。
基本上,asSequence()
去除了大小信息和列表的 built-in Spliterator 实现。
使用 kotlin 1.6.10 似乎 parallelStream()
和 asSequence().asStream().parallel()
的行为不一样。后者似乎没有并行化。这是一个示例代码片段,演示了该问题:
import java.util.stream.Collectors.toList
import kotlin.streams.asStream
import java.util.Calendar
fun main() {
println("Available processors: ${Runtime.getRuntime().availableProcessors()}")
val numbers = (10 downTo 0).toList()
println("Using parallelStream:")
val start1=System.currentTimeMillis()
numbers.parallelStream().map { println("${it} - ${Thread.currentThread().getId()}"); Thread.sleep(100); it }.collect(toList<Int>())
println("Execution time: ${System.currentTimeMillis()-start1}")
println("Using asSequence().asStream().parallel():")
val start2=System.currentTimeMillis()
numbers.asSequence().asStream().parallel().map { println("${it} - ${Thread.currentThread().getId()}"); Thread.sleep(100); it }.collect(toList<Int>())
println("Execution time: ${System.currentTimeMillis()-start2}")
}
您可以在 kotlin playground 中执行它:https://pl.kotl.in/z3sxKHKvL
输出为
Available processors: 2
Using parallelStream:
4 - 1
8 - 10
3 - 1
7 - 10
5 - 1
6 - 10
1 - 1
10 - 10
0 - 1
9 - 10
2 - 1
Execution time: 617
Using asSequence().asStream().parallel():
10 - 1
9 - 1
8 - 1
7 - 1
6 - 1
5 - 1
4 - 1
3 - 1
2 - 1
1 - 1
0 - 1
Execution time: 1105
我不明白这种行为差异的原因。
直接在您的 List 上调用 stream()
或 parallelStream()
意味着在后台它可以直接在基础 List 上调用 spliterator()
并获得一个可以分解的功能性 Spliterator并行工作。
如果将列表转换为序列,则在调用 asStream()
时将无法再直接访问列表。在序列上调用 asStream()
会创建一个带有临时拆分器的流,该拆分器无法访问集合的大小(因为序列没有大小 属性),因此它无法分解并行执行的工作。
基本上,asSequence()
去除了大小信息和列表的 built-in Spliterator 实现。