从 Scala 中的数据框中添加两列
adding two columns from a data frame in scala
我在 DF 中存储了两列年龄和薪水。我只想编写一个 scala 代码来按列添加这些值。我试过了
val age_1 = df.select("age")
val salary_1=df.select("salary")
val add = age_1+salary_1
给我错误。请帮助
下面的spark
是SparkSession
的一个实例,所以导入必须在 spark
的实例化之后进行。
$-notation 可以在这里使用
导入 spark implicits
import spark.implicits._
然后使用 $-notation
val add = df.select($"age" + $"salary")
最终 Scala 代码:
import spark.implicits._
val add = df.select($"age" + $"salary")
我在 DF 中存储了两列年龄和薪水。我只想编写一个 scala 代码来按列添加这些值。我试过了
val age_1 = df.select("age")
val salary_1=df.select("salary")
val add = age_1+salary_1
给我错误。请帮助
下面的spark
是SparkSession
的一个实例,所以导入必须在 spark
的实例化之后进行。
$-notation 可以在这里使用
导入 spark implicitsimport spark.implicits._
然后使用 $-notation
val add = df.select($"age" + $"salary")
最终 Scala 代码:
import spark.implicits._
val add = df.select($"age" + $"salary")