在 VectorAssembler.transfrom 之后不能 运行 Zeppelin 中的其他段落
can't run an other paragraph in Zeppelin after VectorAssembler.transfrom
我正在使用 Zeppelin 0.7.1 和 spark 2.1.0。
我在数据框中有一些数据 'dataset' :
+-------+-------+-------+-------+
| index |var 1 |var 2 |var 3 |
+-------+-------+-------+-------+
| 0 | 0 | 1 | 0 |
+-------+-------+-------+-------+
| 1 | 0 | 1 | 0 |
+-------+-------+-------+-------+
| 2 | 1 | 0 | 1 |
+-------+-------+-------+-------+
为了进行线性回归,我想将每一列都放在一个向量列中:
from pyspark.ml.linalg import Vectors
from pyspark.ml.feature import VectorAssembler
assembler = VectorAssembler(inputCols=['var 1', 'var 2', 'var 3'], outputCol='features')
output = assembler.transform(dataset)
好吧,在 运行 完成此操作后,在 Zeppelin 中,我无法 运行 其他段落。我必须重新启动我的解释器......
如果有人知道问题可能出在哪里。
谢谢!
Zeppelin 0.7.2 版应该可以解决您的问题。
我们有同样的问题,我们只是用相同的版本和这次升级测试它,没问题。
问候
我正在使用 Zeppelin 0.7.1 和 spark 2.1.0。
我在数据框中有一些数据 'dataset' :
+-------+-------+-------+-------+
| index |var 1 |var 2 |var 3 |
+-------+-------+-------+-------+
| 0 | 0 | 1 | 0 |
+-------+-------+-------+-------+
| 1 | 0 | 1 | 0 |
+-------+-------+-------+-------+
| 2 | 1 | 0 | 1 |
+-------+-------+-------+-------+
为了进行线性回归,我想将每一列都放在一个向量列中:
from pyspark.ml.linalg import Vectors
from pyspark.ml.feature import VectorAssembler
assembler = VectorAssembler(inputCols=['var 1', 'var 2', 'var 3'], outputCol='features')
output = assembler.transform(dataset)
好吧,在 运行 完成此操作后,在 Zeppelin 中,我无法 运行 其他段落。我必须重新启动我的解释器...... 如果有人知道问题可能出在哪里。
谢谢!
Zeppelin 0.7.2 版应该可以解决您的问题。 我们有同样的问题,我们只是用相同的版本和这次升级测试它,没问题。
问候