从 Scala 中的数据框中添加两列

adding two columns from a data frame in scala

我在 DF 中存储了两列年龄和薪水。我只想编写一个 scala 代码来按列添加这些值。我试过了

val age_1 = df.select("age")
val salary_1=df.select("salary")
val add = age_1+salary_1

给我错误。请帮助

下面的sparkSparkSession的一个实例,所以导入必须在 spark的实例化之后进行。

$-notation 可以在这里使用

导入 spark implicits
import spark.implicits._ 

然后使用 $-notation

val add = df.select($"age" + $"salary")

最终 Scala 代码:

import spark.implicits._
val add = df.select($"age" + $"salary")

Apache doc