在 VectorAssembler.transfrom 之后不能 运行 Zeppelin 中的其他段落

can't run an other paragraph in Zeppelin after VectorAssembler.transfrom

我正在使用 Zeppelin 0.7.1 和 spark 2.1.0。

我在数据框中有一些数据 'dataset' :

+-------+-------+-------+-------+
| index |var 1  |var 2  |var 3  |
+-------+-------+-------+-------+
| 0     | 0     | 1     | 0     |
+-------+-------+-------+-------+
| 1     | 0     | 1     | 0     |
+-------+-------+-------+-------+
| 2     | 1     | 0     | 1     |
+-------+-------+-------+-------+

为了进行线性回归,我想将每一列都放在一个向量列中:

from pyspark.ml.linalg import Vectors
from pyspark.ml.feature import VectorAssembler


assembler = VectorAssembler(inputCols=['var 1', 'var 2', 'var 3'], outputCol='features')
output = assembler.transform(dataset)

好吧,在 运行 完成此操作后,在 Zeppelin 中,我无法 运行 其他段落。我必须重新启动我的解释器...... 如果有人知道问题可能出在哪里。

谢谢!

Zeppelin 0.7.2 版应该可以解决您的问题。 我们有同样的问题,我们只是用相同的版本和这次升级测试它,没问题。

问候