如何使用 Spark Scala 将一列数据转换为向量

How can I convert one column data to a vector using Spark Scala

我正在使用 Spark、Scala 来处理数据。我有一个问题想不通。我有一个数据框,它是一列:

data
1
2
3
4
5

我希望它成为一个向量 [1.0,2.0,3.0,4.0,5.0]

我该如何实施?我试过了 df.collect().toVectorrdd.foreach,但每次 returns 对我来说都是向量数组 [1,0]、[2.0]、[3.0]、[4.0]、[5.0],而不是一个单个向量。

发生这种情况是因为当您 collect 一个数据框时,您会得到一个行数组。您需要从行对象中提取值。

df.collect().map(x => x.getDouble(0)).toVector